2026年2月第1周AI资讯

最近一周AI工具频繁推出，堪称人工智能领域的“神仙打架”，今天给大家介绍近一周值得关注的AI资讯：

1.Anthropic 推出 Claude Opus 4.6

2026年2月5日，Anthropic 正式宣布推出 Claude Opus 4.6——这是继去年11月发布 Opus 4.5 后的又一次重大升级。值得注意的是，Anthropic 的模型发布节奏正在显著加速：从2025年2月的 Claude 3.7 Sonnet，到5月的 Claude 4 系列首发，再到如今的 Opus 4.6，短短一年内完成了多代迭代。

Opus 4.6 的发布标志着 Anthropic 在”智能体时代”（Agentic Era）的进一步深耕。正如 Anthropic 企业产品负责人 Scott White 所说：”我们正从’氛围编程’（vibe coding）过渡到’氛围工作’（vibe working）的时代”。
核心升级亮点

百万级上下文窗口（Beta）
Opus 4.6 首次为 Opus 级别模型开放了 100万 token 的上下文窗口（标准版仍为20万 token），这使其能够处理更庞大的代码库和文档集。在”大海捞针”（needle-in-a-haystack）测试中，Opus 4.6 在 100万 token 的文本中检索隐藏信息的准确率达到 76%，而 Sonnet 4.5 仅为 18.5%。
自适应思考模式（Adaptive Thinking）
新版本引入了”自适应思考”机制，模型能够根据任务复杂度自动决定思考深度，取代了之前的固定”扩展思考”模式。用户还可通过 effort 参数（高/中/低三档）精细控制推理强度，平衡性能与成本。
输出容量翻倍
最大输出长度从 64K token 提升至 128K token，适合生成长篇技术文档、复杂代码或详细分析报告。

2.openClaw发布

openClaw（原名Clawdbot、Moltbot，改了好几次）在短短 2周内突破 150,000+ stars，成为 GitHub 历史上增长最快的开源项目之一（langchain、dify也就130k左右stars）。

这款由 PSPDFKit 创始人 Peter Steinberger （亿万富翁）通过AI编程打造的本地、自托管 AI 个人智能助手，通过将消息平台与 LLM 、智能体深度整合，有界面，有第三方集成能力，实现了从电脑操作，日程提醒，会议摘要生成到网页操作等的全场景自动化。

真简单：一条命令即可本地启动，不需要先搭一整套复杂的向量数据库和调度系统。
真能用：不是演示，而是能真的发消息、跑脚本、读写文件。
真惊喜：它第一次让大量普通用户意识到——“哇，原来 LLM 真的可以替我操作电脑”。

从架构上来看，你可以把 openClaw 想象成一间智能平台，有五个重要功能区：

Gateway（大门）：管理会话、路由请求、做鉴权。它通常在本地运行，默认将控制面板绑定到 loopback（只允许本机访问），并支持通过 Tailscale 等私有网络扩展远程访问。
Agent（大脑）：有专门的人设，负责理解上下文意图、制定分步计划、决定要调用哪些工具或技能。
Skills（工具箱）：一组插件/技能（以 Markdown 与脚本描述），让 Agent 可以“开门、倒咖啡、发邮件、跑脚本”。
Channels（通道）：连接各种app，如WhatsApp、Telegram、Discord、Slack、SMS 等，让 AI 与用户的日常通信无缝对接。
Nodes（传感器/终端）：运行在用户端设备（手机、笔记本、Raspberry Pi，台式机）的小智能体，可以提供摄像头、地理位置或系统通知等本地能力。

3.google推出Genie3

上周五，谷歌DeepMind发布了一段视频，演示了其最新模型Genie 3的能力。没有复杂的代码和漫长的渲染，只需输入一句话或一张草图，一个可以实时探索的3D世界就生成了。
一个像素风格的角色在城市中跑动跳跃。它踏过积水时水面倒影会随之变形，碰到障碍时扬起的尘土也会自然散开。

Genie3的演示视频确实令人印象深刻。通过文本、参考图等输入，它能在短时间内生成类似 《GTA》、《塞尔达传说》风格的场景，并允许玩家进行有限度的交互。这对于不了解技术细节的投资者来说，Genie3似乎预示着游戏开发的未来。但demo终归只是demo，离真正可玩的游戏demo仍有差距。 Genie3本质上是一个自回归式的“帧生成”模型，依赖于对前几帧画面的“猜测”来生成下一帧，缺乏可靠的逻辑计算。例如，游戏中物体下落的速度、光照效果等，Genie3只能通过观察和“猜测”来模拟，而非基于物理引擎的精确计算。这种“猜”出来的效果，在游戏世界中容易破坏沉浸感。此外，Genie3还有一个致命短板：缺乏长期一致性，记忆窗口有限，这导致世界结构容易崩溃。传统游戏则能保存确定性的状态，每一个素材都刻写在游戏文件里，即使游玩上百小时，世界依旧如故。

不过，要注意的是，Genie 3并没有预置牛顿定律或光影方程，而是通过观察海量画面，自己总结出了图像的变化。

目前，只有每月支付250美元订阅费的用户可以使用该功能。它支持720p分辨率、每秒24帧的画面，单次体验限时60秒。即便如此，仍然引发了资本市场剧烈震荡。Roblox重挫13%、Unity跌超20%。大家的理解也很简单，如果一句话就能生成3D世界，那传统游戏开发公司也就危险了。

此外，也有人认为，Genie 3将有助于构建虚拟仿真环境，可能会极大促进自动驾驶和机器人训练，甚至让特斯拉辛辛苦苦积累的真实数据失去优势。

真正的世界模型应该预测“状态”，而不是生成“像素”。他的团队尝试用物理作为先验约束，以提升模型与真实世界的一致性。而李飞飞团队则致力于融合多模态仿真与真实数据，构建更具可信度的虚拟环境。这些路线才更有可能用于机器人和自动驾驶领域的训练。

而Genie 3这种能快速搭建逼真场景的工具，只能用于不带来真实后果的领域，比如生成教学演示场景、游戏画面的预设计以及影视剧的视觉预演。不过随着时间的推移，我们继续关注Genie3的后续表现。

4.重磅更新:可灵AI正式迈入3.0时代！

多模态输入输出一体化，实现原生创作，All in One重新定义AI视频工作流

属于每个人的导演时代，由此开启！

告别单镜头堆砌，让AI深度理解剧本。
自动调度景别与机位，一键生成电影感影像叙事。
在图生视频基础上，支持额外添加多图/视频主体。
二次锚定画主角、道具与场景特征，牢牢锁定视觉核心，让创作不再“跑偏”。
支持中、英、日、韩、西多语种生成，四川话、粤语等地道方言与各地口音。
支持3-15秒灵活时长，能够容纳更复杂的叙事逻辑。
新增原生自定义分镜能力，自由时长控制升级至15s，精准实现像素级修改

感兴趣的同学可以登录官网尝试该工具。

5.GPT-5.3-Codex突然登场

最近，OpenAI也推出了自家的最新编程模型：GPT-5.3-Codex。OpenAI号称，这是世界上最强大的智能体（Agentic）编程模型。

GPT-5.3-Codex在SWE-Bench Pro和Terminal-Bench 2.0这两个编程基准测试中拿到了SOTA，并在OSWorld和GDPval等智能体能力和真实世界任务测评中，较GPT-5.2-Codex实现一定提升。在Terminal-Bench 2.0上，GPT-5.3-Codex的得分比Claude Opus 4.6高了11.9%。

GPT-5.3-Codex是OpenAI首个在自我创建过程中发挥关键作用的模型。GPT-5.3-Codex的早期版本，被Codex团队用来调试模型训练、管理部署、诊断测试结果和评估，加速了模型的开发。GPT-5.3-Codex其实就是GPT-5.2-Codex和GPT-5.2的结合体，具备前者的编程能力和后者的推理能力和专业知识储备，且速度也提升了25%。

这意味着GPT-5.3-Codex不仅可以用于编程，也可用于软件工程里的所有其他工作，比如调试、部署、监控、测试、指标分析等。你还可以用GPT-5.3-Codex来做PPT、Excel、Word等等，从OpenAI分享的案例来看效果还不错。

目前，GPT-5.3-Codex已向付费ChatGPT用户开放，可在Codex应用、CLI、IDE插件和Web中使用。API访问仍需等待后续更新。Frontier现阶段仅面向有限客户，未来几个月将有更广泛的可用性。

1.Anthropic 推出 Claude Opus 4.6

2.openClaw发布

3.google推出Genie3

4.重磅更新:可灵AI正式迈入3.0时代！

5.GPT-5.3-Codex突然登场

你可能也喜欢

12月第四周AI资讯

2025年4月第4周AI资讯

2025年8月第1周AI资讯

发表回复 取消回复

发表回复取消回复