11月第一周AI资讯 – 心一信息

ChatGPT 本周上线了全新搜索功能，用户可以手动开启“search”选项，通过在对话框中输入问题直接访问互联网并获取实时答案。该功能目前对 Plus 用户开放，支持网页、移动端和桌面端，未来将逐步开放给免费用户。

与 Google 等传统搜索引擎不同，ChatGPT 的搜索功能不仅限于信息提取，还能对问题进行深入分析和探讨，提供经过验证的信息。这项功能与多个新闻数据提供商合作，不仅确保信息的权威性，还提供新的视觉设计，让搜索体验更加直观、便捷。

例如，在查询有关 Mac 系统的操作时，ChatGPT 的搜索结果更加详尽，并引用了 Apple 官方内容；而 Google 仅提供某博客的操作指南，可靠性较低。该功能的发布标志着 AI 搜索的重大进步，有望对传统搜索引擎构成强大冲击。

Google 宣布在其 Gemini 系统内引入 Grounding 搜索功能，允许开发者在 Gemini 中接入最新的 Google 搜索数据。此功能能帮助用户避免获得过时的信息，并确保结果来源可信。

Grounding 功能适用于 Google 的 Gemini、API 和 AI Studio，将进一步增强 Google 在生成式 AI 领域的精确性。由于此功能可以为信息提供来源和链接，大幅提高了查询的可信度。不过，Grounding 的价格不菲，每千次查询需支付35美元。

Runway 的新功能使其在视频生成方面更上一层楼。Alpha 模型新增了高级相机控制功能，用户可手动设置镜头强度和方向，例如水平移动和纵深移动，使生成的视频更具动态效果。

此功能支持用户控制镜头移动速度，视频生成时间最长可达10秒，并且通过结合 Runway 的 Flux 模型生成高清画质的动态视频。这种精准控制镜头移动的能力，使用户可以轻松制作创意视频，这是大多数视频生成模型尚无法实现的。

数字人技术公司 DID 推出两款新工具：Express 和 Premium Plus，以增强数字人创建的灵活性。

Express：仅需1分钟的视频素材即可生成包含头部动作的数字人模型，适合简短演示和互动。

Premium Plus：这是 DID 的旗舰功能，几分钟的视频素材即可生成具有手部和躯干动作的虚拟形象，适合高度互动的品牌营销场景。DID 还提供企业营销套件，包括虚拟品牌代言人和视频广告制作支持，支持30种语言翻译，致力于为企业提供专业、高质量的数字人服务。

AI 平台 Heygen 推出 PhotoAvatar 功能，用户可通过上传3张不同角度的照片来创建逼真的数字人形象。用户可以选择本地上传模特图像或使用 AI 生成的图像进行训练，然后输入提示词来生成具有不同场景和服装的数字人。

此功能支持生成虚拟主播形象，并通过 “APP Motion” 设置动态效果，生成10秒钟的视频。还可结合生成的数字人形象进行视频播报，用户在完成训练后，仅需在左侧对话框输入提示词，即可生成定制的虚拟主播。

Cartesia 本周推出 Voice Changer，帮助用户将音频转换为不同的音色，保留原始语音的语气和情感，非常适合用于动画、故事配音和有声读物。

用户只需上传音频样本，Voice Changer 即可根据原音的表达和旋律生成多种不同的声音。该工具的语气保真度高，允许个性化调整音频的情感，提供了与传统变声器截然不同的用户体验。

Claude 新推出的 Windows 和 Mac 客户端使用户无需通过浏览器即可使用 Claude，进一步提高了使用效率。客户端支持 ARTIFACTS 功能，用户可以手动开启此选项，便于常用用户保存数据，提升生产力和用户体验。

Sono 平台本周推出了一项名为 Personas 的创新功能。用户可将一首歌曲的核心特征（如人声风格、氛围等）保存为 Persona，以便在未来的作品中重用该风格和元素。

高级用户可通过此功能创建歌曲的模板，为新作品添加歌词并保持原始风格。此功能的推出使音乐创作更为高效和个性化，尤其适合想要持续创作一致风格的艺术家和制作人。