2026年3月第2周AI资讯

这一周,全球AI工具领域值得关注的重要动态:


1. OpenAI — GPT-5.4 正式登场

OpenAI 于3月5日发布了 GPT-5.4,并在本周完成了向 ChatGPT 全面用户的铺开,以 GPT-5.4 Thinking 的形式向 Plus、Team 和 Pro 用户开放。这是本周最受关注的模型更新之一。

工具介绍 / 功能

GPT-5.4 将 OpenAI 近期在推理、编程和 Agent 工作流方面的最佳进展整合进了一个前沿模型,同时纳入了 GPT-5.3-Codex 的顶级编程能力,并提升了其在电子表格、演示文稿、文档等专业场景的操作能力。

主要使用方式

在 ChatGPT 中,GPT-5.4 Thinking 能够提前展示思考计划,用户可以在模型处理过程中随时介入调整方向,从而在更少的来回交互中得到更准确的最终输出。此外,GPT-5.1 系列模型于3月11日正式退役,所有使用 GPT-5.1 的对话将自动迁移至 GPT-5.3 或 GPT-5.4 对应版本。

潜在影响 / 意义

在 GDPval 评估中,GPT-5.4 在44个职业场景的知识工作任务上达到了新的最优水平,在与行业专业人士的比较中胜出83%,而 GPT-5.2 的这一数字为70.9%。这意味着 AI 模型正在向”数字同事”而非纯粹问答工具的方向迈进,对律师、财务分析师、工程师等知识工作者的冲击将持续加深。


2. OpenAI — ChatGPT 推出互动式学习功能

工具介绍 / 功能

ChatGPT 本周上线了互动式学习功能:当用户询问特定话题时,系统会呈现一个互动可视化模块,用户可以实时调整公式和变量,并即时看到图表和结果的变化,将抽象概念转化为可直接探索的内容。

主要使用方式

互动学习功能以数学和科学领域的70余个核心概念为起点发布,涵盖勾股定理、理想气体定律、圆面积、透镜方程等内容,面向所有已登录的 ChatGPT 用户开放。

潜在影响 / 意义

这一功能的推出标志着 ChatGPT 正在从一个”问答工具”向”互动教育平台”转型。对于学生和家长来说,数学、物理等传统难以理解的科目有望通过可视化方式变得直观易懂。在教育 AI 化的大趋势下,这也将对传统在线教育平台构成明显竞争压力。


3. Anthropic — Claude Sonnet 4.6 成为默认模型并集成 Microsoft 365

本周,微软于3月9日宣布,将把 Anthropic 最新的 Claude Sonnet 系列模型提供给 M365 Copilot 用户使用。这是 Claude 在企业级应用扩张中的重要一步。

工具介绍 / 功能

Claude Sonnet 4.6 是 Anthropic 迄今为止能力最强的 Sonnet 模型,在编程、计算机操作、长文本推理、Agent 规划、知识工作和设计等方面均有全面提升,同时提供测试版 100 万 token 的上下文窗口。对 Free 和 Pro 计划用户而言,Sonnet 4.6 已成为 claude.ai 和 Claude Cowork 的默认模型,定价与 Sonnet 4.5 保持一致。

主要使用方式

Sonnet 4.6 能够处理整个代码库、长篇合同或数十篇研究论文,早期用户已在复杂电子表格操作和多步骤网页表单填写等任务上观察到接近人类水平的表现。此外,Claude 还新增了在 Cowork 中创建和调度定期及按需任务的功能,以及在 Claude Desktop 中新增了将技能、插件和连接器集中管理的”自定义”区域。

潜在影响 / 意义

Microsoft 365 拥有数亿企业用户。Claude Sonnet 4.6 进入这一生态,意味着 Anthropic 的模型将直接与 OpenAI(Copilot 背后的核心供应商)在企业办公场景展开正面竞争。对企业用户来说,AI 助手的选择将更加多元,整体生产力工具的智能化水平将进一步提升。


4. Google Maps — Gemini 全面接管导航体验

本周 AI 领域另一重磅更新来自 Google,其地图产品迎来了十余年来最大规模的功能升级。

工具介绍 / 功能

Google Maps 推出了由 Gemini 模型驱动的对话式新功能”Ask Maps”,允许用户以自然语言提问复杂的地点相关问题,并获得个性化建议,同时配有可视化地图展示。该功能已在美国和印度的 Android 与 iOS 平台开始推出。

同时,全新的 Immersive Navigation(沉浸式导航)也正式上线,提供重新设计的视觉界面和直观的行驶指引,以及实时更新功能,让驾驶体验更加轻松。

主要使用方式

新的”Ask Maps”功能允许用户提出此前地图完全无法回答的复杂现实问题,例如”我手机快没电了,哪里可以充电但不用排长队买咖啡?”或”今晚哪里有带灯光的公共网球场可以打球?”

Immersive Navigation 使用 Google 的 Gemini AI 模型分析 Street View 和航拍图像,提供用户路线沿途的精准真实视角,包括路标和道路中央隔离带等细节,帮助驾驶者做出更自信的判断。

潜在影响 / 意义

这次部署将先进 AI 功能一次性推送给 Maps 超过十亿的用户群,是迄今为止最大规模的面向消费者的生成式模型部署之一。与 OpenAI 通过 ChatGPT 建立独立入口的策略不同,Google 选择将 Gemini 嵌入人们每天都在使用的产品中,这一”润物细无声”的路线可能是推动 AI 普及最有效的方式之一。


5. Perplexity — Computer 功能迎来全面升级

工具介绍 / 功能

本周 Perplexity 为其 Computer 功能推出了一系列重要更新,包括 Skills(技能扩展)、Model Council(多模型协同)、Voice Mode(语音模式),以及 GPT-5.3-Codex 专属编程子 Agent。同时,GPT-5.4 也已向 Pro 和 Max 订阅用户开放。

主要使用方式

Model Council 可同时运行 GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro 三个模型,然后对它们的共识与分歧进行综合分析,并展示各模型的独特贡献。Max 订阅用户可选择协调模型,对结果合并方式拥有完整控制权。

Perplexity Computer 现在还集成了 GPT-5.3-Codex 作为专属编程子 Agent,当 Computer 遭遇复杂编程任务时,可自动将其转交给 Codex 处理,支持编写数千行生产级代码、使用浏览器开发工具调试 Bug,并直接推送至 GitHub。

潜在影响 / 意义

Perplexity 的 Model Council 代表了一种全新的 AI 使用思路:不再让用户选择”用哪个模型”,而是让多个顶级模型并行思考,再由系统综合整理。对于需要做出高风险决策(如投资分析、法律判断、战略规划)的用户来说,这种”AI委员会”模式能显著减少单一模型视角带来的偏差。


6. NVIDIA — NemoClaw 开源 Agent 平台发布

工具介绍 / 功能

NVIDIA 发布了 NemoClaw,这是一个开源平台,允许企业构建和部署用于工作流自动化的 AI Agent,关键突破在于它可以在任意硬件上运行,而不局限于 NVIDIA 自家芯片,大大降低了中小型企业的入门门槛。

主要使用方式

NemoClaw 面向希望在内部构建自动化 Agent 的企业,提供标准化的开发框架。企业可以基于该平台开发文档处理、客户服务、数据分析等各类 Agent 工作流,无需从零搭建底层基础设施。

潜在影响 / 意义

此前,AI Agent 的部署往往需要绑定特定云厂商或硬件供应商,成本和技术门槛较高。NemoClaw 的开源策略和跨硬件兼容性,意味着中型企业也能以较低成本进入 Agent AI 领域。这一举措标志着 Agent AI 正在从研究展示阶段迈向真正的生产部署工具阶段。长远来看,随着更多企业能够自主构建和部署 Agent,AI 自动化将从大型科技公司向各行各业加速渗透。


我没有关于”openclaw”在近期爆火的真实信息,让我先搜索一下确认是否有这个工具的相关资讯。非常好,搜索到了完整的信息。以下是加入第7条后的完整版本:


7. OpenClaw — 史上增长最快的开源 AI Agent,席卷全球

2026年3月,这款 AI 助手成为历史上增长最快的开源项目,GitHub 星标数突破25万,超越了 Linux 操作系统用数年才达到的里程碑。但与此同时,爆炸式普及也随即引发了全球范围内的安全危机。

工具介绍 / 功能

OpenClaw 是一款开源 AI Agent,可连接 WhatsApp、Telegram、Slack、Discord 等主流消息应用,并自主代替用户执行任务:发送邮件、运行终端命令、管理文件、浏览网页、控制已连接的各类服务。它在本地运行,跨会话保存记忆,并可通过”技能(Skills)”这一模块化扩展包进行功能拓展,这些扩展包发布于其社区市场 ClawHub。

OpenClaw 最初由奥地利开发者 Peter Steinberger 于2025年11月以”Clawdbot”为名发布,其灵感来源于 Anthropic 的 Claude。因商标纠纷,该项目先后更名为”Moltbot”和”OpenClaw”。2026年2月14日,Steinberger 宣布加入 OpenAI,项目随即移交至开源基金会进行管理。

主要使用方式

OpenClaw 成功的核心在于三点:第一,”近身性”——它存在于你每天使用的地方。OpenClaw 直接接入 WhatsApp、Slack、Discord、Telegram 和 Signal,让 AI Agent 成为工作流的主动参与者,用户可以通过手机管理销售流程、自动回邮件、发起代码审查。第二,它是主动的——OpenClaw 不等你开口,它使用定时任务在预设时间自动执行任务。第三,它是开放可扩展的——OpenClaw 的”技能”插件系统允许社区自由开发和共享功能模块。

用户可以通过超过100个预配置的 AgentSkills 扩展工具能力,包括执行 Shell 命令、管理文件系统、执行网页自动化等。该项目不绑定特定模型,用户可以自带 API Key 接入 Claude、GPT、DeepSeek 等主流模型,也可以完全在本地运行。

潜在影响 / 意义

OpenClaw 的意义与2022年底 ChatGPT 出现时相当。大量用户第一次亲身体验到了 AI Agent 为他们完成真实工作的感觉,这将永久改变他们对所有产品的期待。如果你在开发 AI 系统,需要关注三个信号:Agent 的杀手级界面就是人们手机上已有的应用;控制权是核心设计挑战,提示注入、凭证暴露和插件市场攻击都是必须在上线前解决的现实问题;监控必须在运行时就位。

OpenClaw 的爆火也标志着 AI 发展的一个关键拐点:它不再是让你”问答”的工具,而是真正替你”行动”的数字员工。这一范式转变,将深刻影响未来所有 AI 产品的设计方向与行业格局。

发表回复