2025年5月第1周AI资讯

我们一起看看本周AI领域都有哪些值得关注的内容吧～

① 阿里开源千问 3，性能超越国内领先模型！

本周，阿里开源了 千问 Qwen-3 模型，其综合性能超越国内顶级模型，成为全球最强的开源大语言模型之一。

在多项基准测试中，表现远超 DeepSeek-V2、Yi-1.5、MiniCPM、GPT-3.5 等顶级模型。此次开源共包含 8 个不同尺寸的模型，包括 6 个 Dense 模型和 2 个 MoE 模型，可在移动设备和消费级显卡上部署。

千问3支持推理与非推理两种模式，会根据问题复杂度自动选择模式。在“深度思考模式”下，响应速度更快，输出质量也毫不逊色。

该模型已在通义千问官网上线，登录即可体验！

Google 旗下的 AI 博客生成工具 NotebookLM 本周完成重大更新，新增对 50 种语言 的支持，包括中文语音！

使用方法：

点击链接Google NotebookLM | Note Taking & Research Assistant Powered by AI进入 NotebookLM；
点击右上角「Setting」选项，将语音设置为中文；
上传 PDF 文档、输入文本或粘贴网站地址，点击生成按钮即可。

例如粘贴一篇新闻链接，系统就会生成经过 Gemini 优化的双人对话博客。

AI 内容平台 Hydra 本周推出了 Studio 和 Character 3，这是一个支持图像、文本、音频的 全模态模型，可用于生成更智能的视频。

Character 3 超越传统多模态模型，是 AI 创作的全新里程碑！

Hydra Studio 集成了音频、视频、角色创建等功能。用户可分别上传音频和图像素材，并在左侧对话框中设置人物动作和表情。

DeepSeek AI 本周发布了基于 DeepSeek Math Base 构建的新模型 —— Prover-VR，专为数学定理证明任务设计。

该模型不仅可以解题，还能导出完整的证明过程！

训练过程分为三大阶段，每一阶段都强化了数学认知和推理能力。Prover-VR 被称为目前最强的开源形式化数学证明系统，在多个标准测试中准确率领先。

数字人平台 Heygen 本周发布了新功能 —— Voice Mirroring（语音镜像）。

该功能可以模拟你的语气、语调、节奏，为数字人打造更生动的语音分身。

用户可自由选择不同音色，如 Baritone Bryce，打造个性化虚拟人物。

Runway 本周推出了 GEN-4 References 功能，这是 AI 视频生成领域的一次重大突破。

用户可以使用自己的照片、3D 模型，或是生成图像，创建风格一致的人物和场景。

该功能的推出，意味着我们可以将自定义人物作为演员，放入任何虚拟世界，控制角色动作和表情，就像拍电影一样。

使用方法也非常简单：只需上传一张角色图像和一张场景图像，即可将人物与背景结合。通过提示词，还能控制相机角度、服装、发型、表情等细节。

GEN-4 References 解决了 AI 视频中“角色不一致”的顽疾，保证同一个人物在不同场景下保持风格统一、特征一致。

Runway 表示，后续还将持续优化该功能。此外，它还支持“风格参考”：通过上传风格图，原图就能转化为目标风格，无需额外训练模型或复杂操作。