2026年1月第4周AI资讯

本周的 7 组重磅新闻深度解析:

1. Google 掀起价格战:高性价比 AI Premium 会员来袭

为了正面硬刚 ChatGPT Plus,Google 近期推出了极具杀伤力的 Google One AI Premium 订阅计划。

  • 价格触底:目前该计划推出限时优惠,前两个月仅需 3.9 美元/月。相比 ChatGPT 每月 20 美元的固定支出,这无疑大幅降低了普通用户使用顶级 AI 的门槛。
  • 模型全家桶:订阅后,用户可以立即解锁 Google 最核心的 AI 资产,包括视频生成模型 Veo、地表最强长文本模型 Gemini 1.5 Pro 以及高保真图像生成模型 Imagen 3 Pro
  • 家庭共享权益:最核心的竞争力在于,该计划支持与家庭成员共享。这意味着一家人可以共同分担成本,这对于工作室或家庭用户来说,性价比简直“爆表”。

2. Chrome 浏览器进化:Gemini 无缝接入与 Auto Browse 自动驾驶

Google Chrome 不再仅仅是一个浏览器,它正在变成一个“自动驾驶机器人”。

  • Gemini 深度集成:通过将 Gemini 引擎植入浏览器底层,用户无需频繁切换网页,在侧边栏即可完成信息总结、邮件撰写等任务。
  • Auto Browse(自动浏览)黑科技:这是本次升级的最大亮点。它能像人类一样驱动浏览器,自主识别网页元素。无论是打开复杂的电商后台、点击深层的确认按钮,还是自动填写繁琐的表单,Auto Browse 都能精准完成任务。
  • Imagen 图像编辑:在浏览网页图片时,点击右上角图标开启对话框,即可调出 Imagen 模型,对当前网页中的图像进行实时修改、重绘或抠图,极大地提升了素材处理效率。

3. xAI 升级:Grok-1.5 开启短视频生成新纪元

马斯克旗下的 Grok 模型本周也迎来了重要里程碑,其视觉生成能力得到了显著增强。

  • 10 秒带音效视频:目前 Grok 已支持生成最长 10 秒的短视频。更令人惊喜的是,视频原生附带音效,不再是“默片”。
  • 速度与尺度的平衡:得益于 xAI 的算力优化,其生成速度极快。同时,Grok 延续了其一贯的风格,内容生成尺度相对宽松,为创作者提供了更大的发挥空间。目前,该功能已向订阅用户开放测试。

4. 月之暗面开源 Kimi k1.5:国产多模态最强音

本周,月之暗面(Moonshot AI)宣布正式开源其最强全能多模态模型 Kimi k1.5

  • 对标 GPT-4o 与 Claude 3.5:在多项全球公认的基准测试中,Kimi k1.5 的综合表现已经追平甚至超越了 GPT-4o 和 Claude 3.5 Sonnet。
  • Agent 集群能力:这是 Kimi 的“杀手锏”。它学会了自主创建“分身”,根据任务需求组建不同角色的 AI 团队。例如,一个分身负责查资料,一个负责写代码,一个负责排版,从而实现流水线式的高效产出。
  • 办公领域深耕:通过视觉理解和代码能力的结合,Kimi k1.5 能直接处理复杂的交互式布局和滚动效果。用户只需拍一张照片或录一段屏幕,AI 就能直接交付准专业水平的办公文档或前端代码界面。

5. 生数科技 Vidu:全球首款“参考生视频”模型面世

生数科技发布的 Vidu Reference to Video 模型,彻底解决了视频生成中的“一致性”难题。

  • 为影视与短剧而生:支持两段视频加四张图片的多模态输入。无论你是想复刻某个角色的表情,还是想保持场景的纹理一致,该模型都能精准还原。
  • 六大参考维度:包括特效、表情、纹理、动作、人物和场景。这意味着你可以上传一段自己录制的动作视频,让 AI 将其中的主角替换为任意动漫角色,且动作完全同步。
  • 降低创作成本:通过简单的提示词,创作者可以随意更换影片中的背景或道具,极大缩短了影视后期的制作周期。

6. 昆仑万维 mureka V8:音乐创作的“人格化”表达

昆仑万维正式发布的 murekaMusic V8,标志着 AI 音乐进入了高保真、情感化的新阶段。

  • 媲美 Suno V4:在旋律感、编曲复杂度以及情绪渲染力上,V2 版本实现了质的飞跃。它生成的歌曲不再有那种生硬的“机器感”,而是更接近人类的创作逻辑。
  • AI Studio 深度定制:即将发布的 AI Studio 将赋予用户更强的编辑权限,支持对歌曲结构进行精细化调整。无论是副歌的升华还是间奏的编排,普通人都能通过简单的交互完成大师级的作品。

7. MiniMax Music-01:华语流行的极致优化

国内大模型独角兽 MiniMax 也不甘示弱,推出了专为华语乐坛优化的 Music-01(原 Music 2.5 升级版)。

  • 情绪曲线设计:支持 14 种音乐结构标签的精准控制。创作者可以像专业编曲师一样,设定歌曲在哪个节点进入高潮,在哪个地方逐渐平息。
  • 华语方言与转音:针对华语流行音乐的咬字、颤音进行了深度建模。它能实现极其自然的转音,并支持 100 多种乐器的模拟,制作水准直达录音室级别。

从本周的新闻可以看出,AI 已经不再是空中楼阁。无论是 Google 降低了订阅价格,还是 Kimi 开源了顶级模型,亦或是视频和音乐模型的爆发,都在向我们传递一个信号:AI 正在成为每个人的“超级助手”和“创意引擎”。 如果你是一名自媒体人、办公族或者开发者,现在正是上手这些工具的最佳时机。

发表回复