11月第一周AI资讯

ChatGPT 本周上线了全新搜索功能,用户可以手动开启“search”选项,通过在对话框中输入问题直接访问互联网并获取实时答案。该功能目前对 Plus 用户开放,支持网页、移动端和桌面端,未来将逐步开放给免费用户。

与 Google 等传统搜索引擎不同,ChatGPT 的搜索功能不仅限于信息提取,还能对问题进行深入分析和探讨,提供经过验证的信息。这项功能与多个新闻数据提供商合作,不仅确保信息的权威性,还提供新的视觉设计,让搜索体验更加直观、便捷。

例如,在查询有关 Mac 系统的操作时,ChatGPT 的搜索结果更加详尽,并引用了 Apple 官方内容;而 Google 仅提供某博客的操作指南,可靠性较低。该功能的发布标志着 AI 搜索的重大进步,有望对传统搜索引擎构成强大冲击。

Google 宣布在其 Gemini 系统内引入 Grounding 搜索功能,允许开发者在 Gemini 中接入最新的 Google 搜索数据。此功能能帮助用户避免获得过时的信息,并确保结果来源可信。

Grounding 功能适用于 Google 的 Gemini、API 和 AI Studio,将进一步增强 Google 在生成式 AI 领域的精确性。由于此功能可以为信息提供来源和链接,大幅提高了查询的可信度。不过,Grounding 的价格不菲,每千次查询需支付35美元。

  • Runway 发布高级相机控制功能 

Runway 的新功能使其在视频生成方面更上一层楼。Alpha 模型新增了高级相机控制功能,用户可手动设置镜头强度和方向,例如水平移动和纵深移动,使生成的视频更具动态效果。

此功能支持用户控制镜头移动速度,视频生成时间最长可达10秒,并且通过结合 Runway 的 Flux 模型生成高清画质的动态视频。这种精准控制镜头移动的能力,使用户可以轻松制作创意视频,这是大多数视频生成模型尚无法实现的。

数字人技术公司 DID 推出两款新工具:Express 和 Premium Plus,以增强数字人创建的灵活性。

Express:仅需1分钟的视频素材即可生成包含头部动作的数字人模型,适合简短演示和互动。

Premium Plus:这是 DID 的旗舰功能,几分钟的视频素材即可生成具有手部和躯干动作的虚拟形象,适合高度互动的品牌营销场景。DID 还提供企业营销套件,包括虚拟品牌代言人和视频广告制作支持,支持30种语言翻译,致力于为企业提供专业、高质量的数字人服务。

  • heygen推出 PhotoAvatar 数字人功能 

AI 平台 Heygen 推出 PhotoAvatar 功能,用户可通过上传3张不同角度的照片来创建逼真的数字人形象。用户可以选择本地上传模特图像或使用 AI 生成的图像进行训练,然后输入提示词来生成具有不同场景和服装的数字人。

此功能支持生成虚拟主播形象,并通过 “APP Motion” 设置动态效果,生成10秒钟的视频。还可结合生成的数字人形象进行视频播报,用户在完成训练后,仅需在左侧对话框输入提示词,即可生成定制的虚拟主播。

  • Cartesia 推出 Voice Changer 音色转换工具 

Cartesia 本周推出 Voice Changer,帮助用户将音频转换为不同的音色,保留原始语音的语气和情感,非常适合用于动画、故事配音和有声读物。

用户只需上传音频样本,Voice Changer 即可根据原音的表达和旋律生成多种不同的声音。该工具的语气保真度高,允许个性化调整音频的情感,提供了与传统变声器截然不同的用户体验。

  • Claude 推出 Windows 和 Mac 客户端 

Claude 新推出的 Windows 和 Mac 客户端使用户无需通过浏览器即可使用 Claude,进一步提高了使用效率。客户端支持 ARTIFACTS 功能,用户可以手动开启此选项,便于常用用户保存数据,提升生产力和用户体验。

  • Suno 音乐平台推出 Personas 功能 

Sono 平台本周推出了一项名为 Personas 的创新功能。用户可将一首歌曲的核心特征(如人声风格、氛围等)保存为 Persona,以便在未来的作品中重用该风格和元素。

高级用户可通过此功能创建歌曲的模板,为新作品添加歌词并保持原始风格。此功能的推出使音乐创作更为高效和个性化,尤其适合想要持续创作一致风格的艺术家和制作人。

发表回复