2025年2月第4周AI资讯

根据 TechCrunch 报道，黄仁勋在采访中表示，股票市场对 Deepseek R1 的发布反应过度。2025 年 1 月，在 Deepseek R1 发布的当天，Nvidia 股价下跌幅度高达 16.9%。这也表明，市场不再认为高性能模型的训练需要更多的算力资源。

黄仁勋肯定了 Deepseek 在模型预训练方面取得的进步，同时表示，在后期的训练过程中，Deepseek 依旧需要大量的算力支持。这也意味着，如果没有新的竞争对手，英伟达在人工智能生态系统中仍有不可替代的地位。

本周末，字节新发布的数字人工具 OMNIHUMAN ONE 已经在即梦平台开启内部测试。该工具可以基于一张人物图像和输入音频作为参考，生成开口说话和唱歌类视频。

从演示可以看出，该工具可以根据输入的音频，合成带有完美唇形匹配的视频。此外，OMNIHUMAN 还能生成自然的动作以及更加清晰的画面。即使对侧面人像的支持，也要强于市面上所有的数字人工具。人物的牙齿和面部细节的变化也显得非常真实。

OMNIHUMAN 对音乐识别进行了优化，能直接分辨乐曲中的歌词，并完成对口型。此外，人物的手臂和乐器也会进行自然互动。即使上传包含多个人物的图像，也可以生成合唱效果，人物的口型不会因为被麦克风遮挡而变形，细节处理非常强大。

本周末，Minimax 海螺宣布向全部用户开放导演模式。用户只需提供连续的画面，即可像导演一样精准控制镜头的移动和缩放。

登录海螺平台，选择图像转视频模式，选择 I2V 01 Director 模型，并从右侧列表中选择一种镜头移动方式，点击生成视频即可。该模式可在图像、文本转视频中使用。

本周一，一站式视频生成平台 LTX Studio 宣布解除 Beta 7 测试，并优化了操作界面。

LTX Studio 同时上线了 Autosound Effect 功能，可以为生成的视频自动添加音效。LTX Studio 为内容创作者提供了丰富的工具和在线编辑器，大家可以尝试。

近期，PicaSwaps 功能可以替换视频中的任意物体。例如，该功能可以轻松替换人物的服装和视频中的物体，合成广告类短视频。目前，PicaSwaps 已经全面开放。

本周，Monica 正式开启了中文版内部测试，并加入了 Deepeek R1 模型。之前，Monica 的市场主要在海外，能够帮助各个行业的人员打造私人订制 AI 助手。

在推出中文版域名并加入Deepeek R1 模型后，Monica 将为中文用户带来更多的选择。Monica 为用户提供了智能体定制、思维导图生成，以及翻译和数据分析等功能，大家可以尝试。

Google 旗下最强的视频生成模型 VEO2 选择在 Freepik 首发。Freepik 表示，前 1 万名登录的用户均可获得两次免费额度。

尽管 Google 和 Freepik 的合作出乎很多人的意料，VO2 模型依旧非常值得尝试。点击视频下方链接登录 Freepik，就可以使用该模型。

由于服务器负荷过大，只有 Freepik Premium 账号方可流畅使用 VO2 模型。此外，Fal也接入了 VO2 模型，目前仅支持文本转视频模式。不过，Fal 的使用成本非常高，生成一段 5 秒钟的视频需花费 2.5 美元。