今天总结近一周的AI资讯:
1、OpenAI发布浏览器Atlas的Agent操作模式,直击Chrome霸主地位

OpenAI推出的ChatGPT Atlas浏览器标志着其从聊天助手向全面互联网平台的战略转型。该浏览器将ChatGPT嵌入每个标签页,提供实时内容总结、产品比较和数据分析功能,并引入了实验性Agent模式,允许AI自主执行多步骤任务。但目前只支持macOS。
2、谷歌AI Studio 新推出的 Vibe Coding 功能,简化 AI 应用开发流程

谷歌对 AI Studio 进行全面升级,推出 Vibe Coding 功能,旨在降低 AI 应用开发门槛,提升开发者、初创企业及非技术人员的使用体验。新增功能包括应用库、秘密变量支持、超级能力模块化设计以及一键部署到谷歌云等。
- 新增应用库与秘密变量支持,增强安全性与便捷性。
- 一键部署应用至谷歌云,实现快速上线与分享。
3、百川发布循环证据增强大模型 M2Plus 打造“医生版 ChatGPT”

百川大模型发布了医疗大模型 Baichuan-M2Plus,该模型通过六源循证推理范式,显著降低了医疗幻觉率,并在USMLE考试中取得97分的优异成绩,展现了其在医学知识运用上的卓越能力。
4、Claude客户端更新了,支持截图发给 Claude、快捷键语音交流

Anthropic更新Claude桌面客户端,使其成为桌面级生产力工具,支持实时响应屏幕内容、语音指令和文件操作。新增的截图分享功能允许用户快速捕获屏幕并发送至Claude进行分析,提升交互效率。
5、Anthropic 推出 Claude Code 网页版,可在浏览器运行编码任务

Anthropic 推出的 Claude Code 网页版为开发者提供了一个全新的编码环境,使得他们可以在浏览器中直接运行编码任务,无需繁琐的命令行操作和本地环境配置。该工具支持与 GitHub 仓库的无缝对接,并允许开发者实时监控任务的执行情况,同时还能在移动端使用,实现移动编码的理念。

谷歌 DeepMind 为 AI 视频生成模型 Veo 引入了‘精确编辑’功能,允许用户通过文本提示轻松添加或删除视频中的元素,同时保持场景的物理真实性和视觉连贯性。该功能提升了创作者在 Flow 平台上的效率,并支持音频同步、多提示场景生成和原生 1080p 输出。
7、Fish Audio 推出 S1 语音克隆模型升级:10 秒即可复刻真人语音

Fish Audio 推出的 S1 语音克隆模型在情感表现力和拟真度方面取得重大进展,能够通过 10 秒语音样本还原真人声音,并且在价格和性能上具有显著优势。同时,其 API 提供了低延迟的实时语音生成能力,适用于虚拟人、智能助理等多个领域。
