2025年9月第4周AI资讯

今天总结一周内值得关注的AI资讯:

1.夸克全新AI图像与视频创作平台「造点AI」正式上线!

拥有AI生图、AI生视频、P图、编辑一体化等功能,搭载通义万相Wan2.5等多个模型,致力于为用户们提供更懂中国元素、更具实用性、更高性价比的图像与视频创作工具。

「AI生图」亚洲人像生成更真实、中文生成更准确、更懂中国风。能驾驭多种艺术风格,适用于多元实用场景,让每个人都能做出好设计。

「AI生视频」更高能的视频创作神器,支持原生音画同步生成、音频驱动视频生成等,普通人也能实现自己的导演梦。

2.英伟达开源 Audio2Face 模型

英伟达(9 月 24 日)发布博文,宣布开源生成式 AI 面部动画模型 Audio2Face,涵盖模型、软件开发工具包(SDK)及完整训练框架,希望能在游戏和 3D 应用中,加速开发 AI 智能虚拟角色。

该技术通过分析音频中的音素、语调等声学特征,实时驱动虚拟角色面部动作,生成精准的口型同步和自然的情感表情,可广泛应用于游戏、影视制作和客户服务等领域。

3.ChatExcel生成PPT功能上线

ChatExcel分析完数据,可以一键生成PPT啦~只需10秒,100M表格秒变数据报告PPT!ChatExcel Max可以自动分析您的表格和聊天上下文,生成逻辑严谨、结论清晰的专业数据报告PPT,直接拿去开会汇报!

生成的 PPT 不再是“AI草稿”,而是排版精美、逻辑完整、随时可以投屏上台的“汇报级别”文档。每一页、每一张图表都直接来源于你的表格数据,支持单元格级溯源,准确率高达 100%

ChatExcel 结合你的对话分析过程,自动整理成“有观点、有结论”的报告结构,内容逻辑清晰。自动生成各种图表,设计样式一致,字体、配色、间距、对齐都自动规范,整体感强

4.Ray3 – Luma AI推出的推理视频生成模型

Ray3是Luma AI推出的新一代视频生成模型,具备强大的推理能力和专业级HDR视频生成技术,为视频创作带来了革命性的变化。

Ray3能理解图像和语言指令,执行复杂任务,自动评估和优化输出质量,确保生成的视频达到高标准。支持的10位、12位甚至16位色深以及EXR格式输出,生成的视频在色彩和细节上更加丰富和逼真,完美适配专业影视制作和高端内容创作的需求。

Ray3引入了草稿模式,可以在短时间内生成视频的初步版本,之后再升级为全4K HDR的高质量视频,大大提高了创作效率。用户可以通过直观的视觉控制工具,直接在图像上绘制草图来引导视频的生成,无需复杂的文字指令。Ray3可以通过Luma AIDream Machine使用,与Adobe Firefly和Creative Cloud Pro集成,为创作者提供了更多的便利和选择。

5.LongCat-Flash-Thinking 正式发布

美团 LongCat 团队正式发布全新高效推理模型 LongCat-Flash-Thinking。在保持了 LongCat-Flash-Chat 极致速度的同时,全新发布的 LongCat-Flash-Thinking 更强大、更专业。综合评估显示,LongCat-Flash-Thinking 在逻辑、数学、代码、智能体等多个领域的推理任务中,达到了全球开源模型的最先进水平(SOTA)

同时,LongCat-Flash-Thinking 不仅增强了智能体自主调用工具的能力,还扩展了形式化定理证明能力,成为国内首个同时具备「深度思考+工具调用」与「非形式化+形式化」推理能力相结合的大语言模型。我们发现,尤其在超高复杂度的任务(如数学、代码、智能体任务)处理上, LongCat-Flash-Thinking 具备更显著的优势。

目前, 该模型已在HuggingFace、Github全面开源:

6.智能编程助手 Neovate Code 正式开源

目前,Neovate Code 以 CLI 工具的形态提供,但其架构设计高度灵活,未来将支持多种客户端形态,适配更多开发场景。

其主要功能包括:

  • 对话式开发 – 用于编程任务的自然对话界面
  • AGENTS.md 规则文件 – 为你的项目定义自定义规则和行为
  • 会话继续和恢复 – 跨会话继续之前的工作
  • 支持流行的模型和提供商 – OpenAI、Anthropic、Google 等
  • 斜杠命令 – 常用操作的快速命令
  • 输出样式 – 自定义代码更改的呈现方式
  • 计划模式 – 在执行前审查实现计划
  • 无头模式 – 在没有交互提示的情况下自动化工作流
  • 插件系统 – 用自定义插件扩展功能
  • MCP – 用于增强集成的模型上下文协议
  • Git 工作流 – 智能提交消息和分支管理

发表回复