2025年12月第3周AI资讯

今天为大家分享几组重要的人工智能新闻：

1. 可灵2.6新功能

本周,可灵升级了Motion Control功能,支持全身捕捉,能够精准捕捉复杂的动作,以及手部动作和面部表情,支持上传最长30秒的参考视频。

登录到后台,选择视频生成下的动作控制功能,即可使用。

该工具可以基于用户上传的动作视频和单张参考图,生成口型,动作同步的效果。

即使是体操、舞蹈、格斗等复杂的动作,也可以轻松合成。

登录到可灵后台,分别上传参考视频和图像,点击生成按钮即可。

借助该工具,我们就可以将任意动作序列,迁移到指定的角色中,生成新的视频,大家可以尝试。在本次的更新中,可灵2.6还新增了音色控制功能。

在内容创作的过程中,我们可以借助该工具,为角色添加指定配音,且能够生成纯形同步的播报效果,大家可以尝试。

本周,Higgsfield推出了专业电影创作套件Cinema Studio,用户可选择多种专业摄像机和镜头,一键生成电影集效果。

Cinema Studio能够基于用户上传的图像,通过专业摄影器材锁定视觉效果,并像导演一样控制镜头的运动方式。

本周,Firecrawl推出了由AI驱动的数据采集代理,能够理解用户输入的数据需求,并自动搜索、浏览、提取网站内容和深层网页,几分钟内即可完成网页内容抓取,是传统爬虫的智能替代方案。

和传统的网页爬虫工具相比,Firecrawl支持深度搜索并从隐藏页面中提取信息,自动输出结构化数据,且内置了反爬虫机制,无需复杂的环境配置。

目前,免费用户每天可获得5次使用机会,大家可以尝试。

近期,Manus推出了升级版的1.6系列代理,不但可以提高单次任务的成功率,还增加了代理的自制能力,在更少监督下完成复杂的工作。其中1.6 Max基于先进的规划和问题求解架构,在多个维度上实现了可量化的性能提升。

1.6 Max在处理电子表格的任务方面表现出色,还显著改进了Web开发能力,提升了UI美观度、页面功能和交互体验。

在本次的更新中,Manus首次支持移动应用开发。

用户只需描述想要构建的应用形态,Manus即可完成从需求理解到端到端开发的完整流程。

新增的Design View则是一个交互式画布,为图像生成和编辑提供了超越文本提示的操作方式。

登陆Manus就可以使用最新的1.6代理。根据实际测试,Manus1.6可以根据一段简单的提示词,在几分钟内生成完整的网站。

经过本次更新后,Manus正在从自动化工具进化为涵盖设计、分析和开放的全站AI平台。大家可以尝试。

本周,阿里开源了基于Q1 Image微调的分解图层模型,能将图像自动拆分为独立的RGB透明图层,实现类似Photoshop的分层编辑功能。

Layered模型通过注意力机制和位置编码动态拆分图层,支持3到10层灵活分解,允许对单层进行缩放、着色操作,且不影响其他部分。

本周,Google发布了Gemini 3 Flash模型,主打高效和低成本,也是Gemini 3系列的第三款模型。

Gemini 3 Flash实现了速度和智能与成本的三重突破,同时具备博士级的逻辑推理能力,在复杂问题、多模太理解、代码生成任务上表现出色。

Gemini 3 Flash的速度是2.5 Pro模型的三倍,Token使用效率也更高。

目前,Gemini 3 Flash已经成为Gemini的默认模型,登录即可使用。

Gemini 3 Flash擅长编码和代理功能,可以实现快速、迭代开发。

性能甚至优于Gemini 3 Pro的编码能力,大家可以自行体验。