7月第三周AI资讯

·  Anthropic应用程序 为了进一步提高竞争力,Anthropic于本周推出了Claude Android应用程序。安卓用户同样可以免费使用Claude 3.5 Sonnet模型,且支持实时语言翻译和视觉能力。尽管具备和GPT-4相同的能力,在品牌影响力方面,Anthropic还无法和OpenAI相比。Claude iOS端应用程序在两个月的下载总量为15万次,远低于ChatGPT的48万次。 ·  HuggingFace Danube …

继续阅读7月第三周AI资讯
7月第二周AI资讯

1.快手可灵网页版 可灵逐步向外开放测试名额,如果收到可灵内测的短信,就可以使用手机号码登录网页版。和移动端程序一样,高性能模式可以无限生成5秒钟的短视频,可选三种比例。输入中文提示词,点击生成视频即可。 高性能模式则可以一次生成10秒钟的短视频,且不支持运镜功能,每天仅能使用3次。和普通模式相比,高性能模式能够生成更加清晰的视频。可灵同时能够理解复杂的提示词,生成符合描述的视频。 切换到图像转视频手动开启首尾帧功能。选择一张静态和动态图像,分别…

继续阅读7月第二周AI资讯
7月第一周AI资讯

1.MOSHI多模态模型 法国人工智能实验室在其官网发布了具备视觉、听觉能力的多模态开源模型Moshi。Moshi可以读取语音提问,并进行实时推理并回答内容。Moshi能够模拟人类的语音交流方式,进行自然、流畅且富有表现力的语音对话。根据网友的测试,Moshi的文本转语音能力已经可以媲美最先进的GPT-4o模型。Moshi由法国AI团队经过6个月的时间开发,可以在本地安装和运行。Moshi在无网络环境下也能运行,确保其安全性和稳定性。开欧泰将在近…

继续阅读7月第一周AI资讯
6月第四周AI资讯

总结一下近一周的人工智能新闻: 1.Luma dream machine 本周Luma宣布增加关键帧功能,用户可以在视频的开头和结尾添加图像,且能够实现完美的过渡。登录到Luma dream machine,分别上传两张图像,输入提示词,即可完成视频生成。加入keyframe功能后,我们就可以把自己的想象力转换为现实。设置好关键帧后,可以生成类似变身的特效,或使用两张不同的背景作为关键帧,实现完美的画面过渡。该功能的加入将会让视频生成变得更加有趣…

继续阅读6月第四周AI资讯
6月第三周AI资讯

分享一下这一周的AI新闻:1.Runway GEN-3 尽管还没有正式发布,由GEN-3模型生成的内容却可以达到Sora的水准。目前该模型还处于Alpha测试阶段,也没有公布具体上市日期。除了能够生成长达10秒的短视频,Runway还演示了GEN-3强大的文本渲染能力。2.Luma更新 为了进一步增加竞争力,Luma Dream Machine将推出强大的视频编辑和控制功能。用户可以使用编辑器更换视频的背景,或者对视频中的人物和对象进行替换。提前…

继续阅读6月第三周AI资讯
6月第二周AI资讯

本周重要的人工智能新闻:1.dream machine视频模型 dream machine近日发布不但支持文本转视频,还支持图像转视频功能,目前该工具已经面向公众开放。与此同时,美团也推出了一个名为moki的视频生成工具。 MOKEY内置了视频生成模型和工作流,可以一键生成短视频。moki专注于网文短剧故事绘本,动画短片等视频形式,可以直接通过文本驱动脚本角色视频以及音效和配音的同步完成。moki同样采用了类似Sora的dit架构,涵盖图像视频音…

继续阅读6月第二周AI资讯
6月第一周AI资讯

今天总结一下近一周重要的人工智能新闻。 一、可灵开启内测:https://kling.kuaishou.com/ 本周,快手推出了类似Sora的可灵模型,引发了国内外网友的广泛关注。可灵框架采用了类似Sora的data结构,用Transformer代替了传统扩散模型中基于卷积网络的unit。快手还自研了一款3D时空联合注意力模块和3D VaE网络,用于实现更好的时空运动建模和更高效的影空间解码。进入应用市场,搜索并下载快手旗下的快影APP,选择A…

继续阅读6月第一周AI资讯
5月第四周AI资讯

分享一下近期的人工智能新闻: Chat TTS 这是由西湖大学推出的文本转语音模型,由超过10万小时的中英文数据进行训练。它可以实现中英文混合语音播报的效果,或者带有语气词的语音播报。chatTTS生成原理是,从高斯特噪声中采样,得到一个固定长度的声音,最后作为额外的信息输入到网络。此外,chat TTS还支持微调,模拟不同人物的音色。目前该模型的相关细节还没有发布。 2. GPT4o新玩法 GPT4o有了新玩法,也就是根据一份PDF文档,自动生…

继续阅读5月第四周AI资讯