2025年2月第4周AI资讯

今天为大家总结一下本周的AI新闻:

一、英伟达声明

根据 TechCrunch 报道,黄仁勋在采访中表示,股票市场对 Deepseek R1 的发布反应过度。2025 年 1 月,在 Deepseek R1 发布的当天,Nvidia 股价下跌幅度高达 16.9%。这也表明,市场不再认为高性能模型的训练需要更多的算力资源。

黄仁勋肯定了 Deepseek 在模型预训练方面取得的进步,同时表示,在后期的训练过程中,Deepseek 依旧需要大量的算力支持。这也意味着,如果没有新的竞争对手,英伟达在人工智能生态系统中仍有不可替代的地位。

二、OMNIHUMAN 开启内测

本周末,字节新发布的数字人工具 OMNIHUMAN ONE 已经在即梦平台开启内部测试。该工具可以基于一张人物图像和输入音频作为参考,生成开口说话和唱歌类视频。

从演示可以看出,该工具可以根据输入的音频,合成带有完美唇形匹配的视频。此外,OMNIHUMAN 还能生成自然的动作以及更加清晰的画面。即使对侧面人像的支持,也要强于市面上所有的数字人工具。人物的牙齿和面部细节的变化也显得非常真实。

OMNIHUMAN 对音乐识别进行了优化,能直接分辨乐曲中的歌词,并完成对口型。此外,人物的手臂和乐器也会进行自然互动。即使上传包含多个人物的图像,也可以生成合唱效果,人物的口型不会因为被麦克风遮挡而变形,细节处理非常强大。

三、海螺导演模式

本周末,Minimax 海螺宣布向全部用户开放导演模式。用户只需提供连续的画面,即可像导演一样精准控制镜头的移动和缩放。

登录海螺平台,选择图像转视频模式,选择 I2V 01 Director 模型,并从右侧列表中选择一种镜头移动方式,点击生成视频即可。该模式可在图像、文本转视频中使用。

四、LTX Studio 正式版

本周一,一站式视频生成平台 LTX Studio 宣布解除 Beta 7 测试,并优化了操作界面。

LTX Studio 同时上线了 Autosound Effect 功能,可以为生成的视频自动添加音效。LTX Studio 为内容创作者提供了丰富的工具和在线编辑器,大家可以尝试。

五、PicaSwaps 新玩法

近期,PicaSwaps 功能可以替换视频中的任意物体。例如,该功能可以轻松替换人物的服装和视频中的物体,合成广告类短视频。目前,PicaSwaps 已经全面开放。

六、Monica 中文版

本周,Monica 正式开启了中文版内部测试,并加入了 Deepeek R1 模型。之前,Monica 的市场主要在海外,能够帮助各个行业的人员打造私人订制 AI 助手。

在推出中文版域名并加入Deepeek R1 模型后,Monica 将为中文用户带来更多的选择。Monica 为用户提供了智能体定制、思维导图生成,以及翻译和数据分析等功能,大家可以尝试。

七、VEO2 视频模型发布

Google 旗下最强的视频生成模型 VEO2 选择在 Freepik 首发。Freepik 表示,前 1 万名登录的用户均可获得两次免费额度。

尽管 Google 和 Freepik 的合作出乎很多人的意料,VO2 模型依旧非常值得尝试。点击视频下方链接登录 Freepik,就可以使用该模型。

由于服务器负荷过大,只有 Freepik Premium 账号方可流畅使用 VO2 模型。此外,Fal也接入了 VO2 模型,目前仅支持文本转视频模式。不过,Fal 的使用成本非常高,生成一段 5 秒钟的视频需花费 2.5 美元。

发表回复