本周重点AI新闻盘点:
1. VOE3 推出“图声视频”功能

本周,VOE3 正式发布图声视频模式,支持输出语音、音效和背景音乐。登录 Flow 平台,选择 Frames to Video 功能,上传图片和提示词,点击按钮即可生成视频
目前 Flow 的 7 月额度已刷新,大家可以免费尝试;如果点数不够,也可通过 Google 官方充值(起充为 2500 点)。
2. 马斯克发布 Grok 4 模型

本周,马斯克正式发布 Grok 4,号称全球最强 AI 模型,在学术处理能力上已达博士级水平。
该模型包含两个版本,均为推理模型。其中,Grog 4 Heavy 为多代理版本,支持四个代理同时工作,并具备 256K 上下文窗口。
Grog 4 在 Colossus 超级计算机上训练,具备先进的推理和多模态能力,在多项基准测试中表现远超 O3 和 Gemini 2.5 Pro。
价格方面,Grog 4 Heavy 为每月 300 美元。此外,Grog 还将在 8~10 月陆续发布编码模型、多代理模型及视频生成模型。
3. Open Cut:剪映国际版的开源替代品

由于对剪映国际版(CapCut)处处收费不满,一位程序员开发了名为 Open Cut 的开源项目,目标是完全替代 CapCut。
目前该项目已在 GitHub 获得 13K 星标,超 2.5 万人加入等待列表。Open Cut 可通过 Docker 本地部署,界面与 CapCut 极其相似。
项目作者对 CapCut 弹窗收费模式表示反感,并获得大量网友支持。
4.Higgsfield 虚拟形象生成系统 Soul ID

虚拟形象生成系统 Soul ID只需上传 10 张以上的照片,就能训练出高度还原外貌、气质和动态的 AI 角色,且能在不同角度、表情、光线条件下保持一致性。
由 Soul ID 生成的图像,几乎看不出合成痕迹,更像是用 iPhone 或相机拍摄的人像。它还提供了 60 多种审美预设,用户无需配置复杂的风格提示词,只需几张参考图,即可在几分钟内生成一组时尚大片!
相比 Midjourney 的以图生图功能,Soul ID 能生成更真实的效果,还支持 9 种情绪与微表情,基本涵盖了日常社媒的使用场景。这些图像已经能在社交平台上“以假乱真”。
5. Perplexity 推出 Comet 浏览器

Perplexity 本周推出了新产品:智能体浏览器 Comet,主打 AI 自动浏览与总结。
Comet 可帮助用户自动查找资料、总结内容、比价购物,还能根据使用习惯进行个性化搜索,带来全新的互联网体验。
目前仅向 Max 用户开放体验,其他用户需申请等待列表。Comet 同时集成 Perplexity 助手,使用体验十分流畅。
6. Proactor 主动型 AI 助手上线

Proactor 是一种新型主动 AI 助手,能自主感知信息、进行判断并执行操作,适用于在线会议、课程、面试等场景。
例如:在面试中,Proactor 可自动识别面试官提问,并为求职者实时提供答题模板,帮助更顺利通过面试。
点击视频下方链接即可免费体验,推荐尝试!
7. Context:挑战 Office 的 AI 办公套件

Context 是一款 AI 办公套件,目标是挑战微软在办公领域的垄断。
该工具支持自动完成表格、演示文稿生成,免去传统 Office 的繁琐操作。Context 还可利用 AI 智能体完成 Excel 表格编辑与数据分析。
使用 Google 账号登录即可免费体验。它为未来的办公自动化提供了全新思路。
