2026年2月第1周AI资讯

最近一周AI工具频繁推出,堪称人工智能领域的“神仙打架”,今天给大家介绍近一周值得关注的AI资讯:

1.Anthropic 推出 Claude Opus 4.6

2026年2月5日,Anthropic 正式宣布推出 Claude Opus 4.6——这是继去年11月发布 Opus 4.5 后的又一次重大升级。值得注意的是,Anthropic 的模型发布节奏正在显著加速:从2025年2月的 Claude 3.7 Sonnet,到5月的 Claude 4 系列首发,再到如今的 Opus 4.6,短短一年内完成了多代迭代。

Opus 4.6 的发布标志着 Anthropic 在”智能体时代”(Agentic Era)的进一步深耕。正如 Anthropic 企业产品负责人 Scott White 所说:”我们正从’氛围编程’(vibe coding)过渡到’氛围工作’(vibe working)的时代”。
核心升级亮点

  1. 百万级上下文窗口(Beta)
    Opus 4.6 首次为 Opus 级别模型开放了 100万 token 的上下文窗口(标准版仍为20万 token),这使其能够处理更庞大的代码库和文档集。在”大海捞针”(needle-in-a-haystack)测试中,Opus 4.6 在 100万 token 的文本中检索隐藏信息的准确率达到 76%,而 Sonnet 4.5 仅为 18.5%。
  2. 自适应思考模式(Adaptive Thinking)
    新版本引入了”自适应思考”机制,模型能够根据任务复杂度自动决定思考深度,取代了之前的固定”扩展思考”模式。用户还可通过 effort 参数(高/中/低三档)精细控制推理强度,平衡性能与成本。
  3. 输出容量翻倍
    最大输出长度从 64K token 提升至 128K token,适合生成长篇技术文档、复杂代码或详细分析报告。

2.openClaw发布

openClaw(原名Clawdbot、Moltbot,改了好几次)在短短 2周内突破 150,000+ stars,成为 GitHub 历史上增长最快的开源项目之一(langchain、dify也就130k左右stars)。

这款由 PSPDFKit 创始人 Peter Steinberger (亿万富翁)通过AI编程打造的本地、自托管 AI 个人智能助手,通过将消息平台与 LLM 、智能体深度整合,有界面,有第三方集成能力,实现了从电脑操作,日程提醒,会议摘要生成到网页操作等的全场景自动化。

  • 真简单:一条命令即可本地启动,不需要先搭一整套复杂的向量数据库和调度系统。
  • 真能用:不是演示,而是能真的发消息、跑脚本、读写文件。
  • 真惊喜:它第一次让大量普通用户意识到——“哇,原来 LLM 真的可以替我操作电脑”。

从架构上来看,你可以把 openClaw 想象成一间智能平台,有五个重要功能区:

  • Gateway(大门):管理会话、路由请求、做鉴权。它通常在本地运行,默认将控制面板绑定到 loopback(只允许本机访问),并支持通过 Tailscale 等私有网络扩展远程访问。
  • Agent(大脑):有专门的人设,负责理解上下文意图、制定分步计划、决定要调用哪些工具或技能。
  • Skills(工具箱):一组插件/技能(以 Markdown 与脚本描述),让 Agent 可以“开门、倒咖啡、发邮件、跑脚本”。
  • Channels(通道):连接 各种app,如WhatsApp、Telegram、Discord、Slack、SMS 等,让 AI 与用户的日常通信无缝对接。
  • Nodes(传感器/终端):运行在用户端设备(手机、笔记本、Raspberry Pi,台式机)的小智能体,可以提供摄像头、地理位置或系统通知等本地能力。

3.google推出Genie3

上周五,谷歌DeepMind发布了一段视频,演示了其最新模型Genie 3的能力。没有复杂的代码和漫长的渲染,只需输入一句话或一张草图,一个可以实时探索的3D世界就生成了。
一个像素风格的角色在城市中跑动跳跃。它踏过积水时水面倒影会随之变形,碰到障碍时扬起的尘土也会自然散开。

Genie3的演示视频确实令人印象深刻。通过文本、参考图等输入,它能在短时间内生成类似 《GTA》《塞尔达传说》风格的场景,并允许玩家进行有限度的交互。 这对于不了解技术细节的投资者来说,Genie3似乎预示着游戏开发的未来。但demo终归只是demo,离真正可玩的游戏demo仍有差距。 Genie3本质上是一个自回归式的“帧生成”模型,依赖于对前几帧画面的“猜测”来生成下一帧,缺乏可靠的逻辑计算。例如,游戏中物体下落的速度、光照效果等,Genie3只能通过观察和“猜测”来模拟,而非基于物理引擎的精确计算。 这种“猜”出来的效果,在游戏世界中容易破坏沉浸感。 此外,Genie3还有一个致命短板:缺乏长期一致性,记忆窗口有限,这导致世界结构容易崩溃。 传统游戏则能保存确定性的状态,每一个素材都刻写在游戏文件里,即使游玩上百小时,世界依旧如故。

不过,要注意的是,Genie 3并没有预置牛顿定律或光影方程,而是通过观察海量画面,自己总结出了图像的变化。

目前,只有每月支付250美元订阅费的用户可以使用该功能。它支持720p分辨率、每秒24帧的画面,单次体验限时60秒。即便如此,仍然引发了资本市场剧烈震荡。Roblox重挫13%、Unity跌超20%。大家的理解也很简单,如果一句话就能生成3D世界,那传统游戏开发公司也就危险了。

此外,也有人认为,Genie 3将有助于构建虚拟仿真环境,可能会极大促进自动驾驶和机器人训练,甚至让特斯拉辛辛苦苦积累的真实数据失去优势。

真正的世界模型应该预测“状态”,而不是生成“像素”。他的团队尝试用物理作为先验约束,以提升模型与真实世界的一致性。而李飞飞团队则致力于融合多模态仿真与真实数据,构建更具可信度的虚拟环境。这些路线才更有可能用于机器人和自动驾驶领域的训练。

而Genie 3这种能快速搭建逼真场景的工具,只能用于不带来真实后果的领域,比如生成教学演示场景、游戏画面的预设计以及影视剧的视觉预演。不过随着时间的推移,我们继续关注Genie3的后续表现。

4.重磅更新:可灵AI正式迈入3.0时代!

多模态输入输出一体化,实现原生创作,All in One重新定义AI视频工作流

属于每个人的导演时代,由此开启!

  • 告别单镜头堆砌,让AI深度理解剧本。
  • 自动调度景别与机位,一键生成电影感影像叙事。
  • 在图生视频基础上,支持额外添加多图/视频主体。
  • 二次锚定画主角、道具与场景特征,牢牢锁定视觉核心,让创作不再“跑偏”。
  • 支持中、英、日、韩、西多语种生成,四川话、粤语等地道方言与各地口音。
  • 支持3-15秒灵活时长,能够容纳更复杂的叙事逻辑。
  • 新增原生自定义分镜能力,自由时长控制升级至15s,精准实现像素级修改

感兴趣的同学可以登录官网尝试该工具。

5.GPT-5.3-Codex突然登场

最近,OpenAI也推出了自家的最新编程模型:GPT-5.3-Codex。OpenAI号称,这是世界上最强大的智能体(Agentic)编程模型。

GPT-5.3-Codex在SWE-Bench Pro和Terminal-Bench 2.0这两个编程基准测试中拿到了SOTA,并在OSWorld和GDPval等智能体能力和真实世界任务测评中,较GPT-5.2-Codex实现一定提升。在Terminal-Bench 2.0上,GPT-5.3-Codex的得分比Claude Opus 4.6高了11.9%

GPT-5.3-Codex是OpenAI首个在自我创建过程中发挥关键作用的模型。GPT-5.3-Codex的早期版本,被Codex团队用来调试模型训练、管理部署、诊断测试结果和评估,加速了模型的开发。GPT-5.3-Codex其实就是GPT-5.2-Codex和GPT-5.2的结合体,具备前者的编程能力和后者的推理能力和专业知识储备,且速度也提升了25%。

这意味着GPT-5.3-Codex不仅可以用于编程,也可用于软件工程里的所有其他工作,比如调试、部署、监控、测试、指标分析等。你还可以用GPT-5.3-Codex来做PPT、Excel、Word等等,从OpenAI分享的案例来看效果还不错。

目前,GPT-5.3-Codex已向付费ChatGPT用户开放,可在Codex应用、CLI、IDE插件和Web中使用。API访问仍需等待后续更新。Frontier现阶段仅面向有限客户,未来几个月将有更广泛的可用性。

发表回复