2025年5月第1周AI资讯

我们一起看看本周AI领域都有哪些值得关注的内容吧~

① 阿里开源千问 3,性能超越国内领先模型!

本周,阿里开源了 千问 Qwen-3 模型,其综合性能超越国内顶级模型,成为全球最强的开源大语言模型之一。

在多项基准测试中,表现远超 DeepSeek-V2、Yi-1.5、MiniCPM、GPT-3.5 等顶级模型。此次开源共包含 8 个不同尺寸的模型,包括 6 个 Dense 模型和 2 个 MoE 模型,可在移动设备和消费级显卡上部署。

千问3支持推理与非推理两种模式,会根据问题复杂度自动选择模式。在“深度思考模式”下,响应速度更快,输出质量也毫不逊色。

该模型已在 通义千问官网 上线,登录即可体验!


② Google NotebookLM 支持中文语音!

Google 旗下的 AI 博客生成工具 NotebookLM 本周完成重大更新,新增对 50 种语言 的支持,包括中文语音!

使用方法:

  1. 点击链接Google NotebookLM | Note Taking & Research Assistant Powered by AI进入 NotebookLM;
  2. 点击右上角「Setting」选项,将语音设置为中文;
  3. 上传 PDF 文档、输入文本或粘贴网站地址,点击生成按钮即可。

例如粘贴一篇新闻链接,系统就会生成经过 Gemini 优化的双人对话博客。


③ Hydra 推出 Character 3,全模态模型登场!

AI 内容平台 Hydra 本周推出了 Studio 和 Character 3,这是一个支持图像、文本、音频的 全模态模型,可用于生成更智能的视频。

Character 3 超越传统多模态模型,是 AI 创作的全新里程碑!

Hydra Studio 集成了音频、视频、角色创建等功能。用户可分别上传音频和图像素材,并在左侧对话框中设置人物动作和表情。


④ DeepSeek 推出数学证明模型 Prover!

DeepSeek AI 本周发布了基于 DeepSeek Math Base 构建的新模型 —— Prover-VR,专为数学定理证明任务设计。

该模型不仅可以解题,还能导出完整的证明过程!

训练过程分为三大阶段,每一阶段都强化了数学认知和推理能力。Prover-VR 被称为目前最强的开源形式化数学证明系统,在多个标准测试中准确率领先。


⑤ Heygen推出语音镜像功能 Voice Mirroring!

数字人平台 Heygen 本周发布了新功能 —— Voice Mirroring(语音镜像)

该功能可以模拟你的语气、语调、节奏,为数字人打造更生动的语音分身。

用户可自由选择不同音色,如 Baritone Bryce,打造个性化虚拟人物。


⑥ Runway 推出 GEN-4 References 功能,AI 视频迎来新纪元!

Runway 本周推出了 GEN-4 References 功能,这是 AI 视频生成领域的一次重大突破。

用户可以使用自己的照片、3D 模型,或是生成图像,创建风格一致的人物和场景。

该功能的推出,意味着我们可以将自定义人物作为演员,放入任何虚拟世界,控制角色动作和表情,就像拍电影一样。

使用方法也非常简单:只需上传一张角色图像和一张场景图像,即可将人物与背景结合。通过提示词,还能控制相机角度、服装、发型、表情等细节。

GEN-4 References 解决了 AI 视频中“角色不一致”的顽疾,保证同一个人物在不同场景下保持风格统一、特征一致。

Runway 表示,后续还将持续优化该功能。此外,它还支持“风格参考”:通过上传风格图,原图就能转化为目标风格,无需额外训练模型或复杂操作。

发表回复