2025年6月第4周AI资讯

今天为大家分享几组重要的人工智能新闻:

1. Doppl虚拟试穿应用

Google 实验室推出了一个名为 Doppl 的虚拟试穿应用,可通过照片截屏实现虚拟试穿效果,非常真实。该应用基于 Google Shopping 的虚拟试穿功能开发,在其基础上增加了“截图试穿”功能。

目前,该应用已经可以在美国地区下载使用,大家可以尝试体验。

2. Flux 图像编辑模型

本周,黑森林实验室开源了对标 GPT-4o 和 Gemini 的 Flux Context 图像编辑模型。据介绍,该模型具备专业级图像编辑能力,且可在消费级硬件上运行。

Context Dev 专注于图像编辑任务,支持迭代编辑角色,保持局部和全局的精细控制。在多项基准测试中,该模型均取得了优异成绩,并领先于字节 GPT-4o 等先进模型。

黑森林实验室还与英伟达合作,提升了模型的推理速度,并降低了内存使用量,同时保持高质量的图像编辑性能。

3. Heygen新功能:Video Agent

本周,Heygen宣布推出 Video Agent 功能,可以将创意转换为生动的脚本,自动选择素材并分配数字人演员。该功能可用于制作短视频、广告产品、演示动画,自动化完成 UGC 广告制作。

根据 Heygen创始人约书亚介绍,Video Agent 能够自动完成脚本编写、场景选择、配音添加,且支持自动剪辑和视频润色。

如果你对该工具感兴趣,点击链接,加入等待列表。

4. Higgsfield Soul 模型

这是 Higgsfield 推出的首个高审美图像生成模型,包含 50 多种预设,适合生成时尚逼真的人像效果图。目前该模型已经面向高级用户开放,登录即可使用。

Higgsfield Soul 模型对“时尚”的理解更为深刻,效果远超 Midjourney V7 模型。Soul 模型同时提供了许多预设,甚至包含了多种网络潮流亚文化风格。

结合 Higgsfield 的视频生成功能,还可将图像转换为超真实的短视频。点击视频下方链接即可免费尝试。

5. 豆包新功能

近期,豆包升级了应用创作功能,可通过自然语言命令生成和编辑网页与设计。

输入一段简单命令,要求豆包生成一个与“课程销售”相关的着陆页。与同类 AI 编程工具相比,豆包支持对指定区域进行可视化修改,并实时查看效果,无需理解代码。

例如,选中背景区域并输入提示词,系统即可自动生成一组全新的图案,单击即可完成替换,全程无需代码。

若需调整文本部分,也可使用鼠标选中直接修改。

借助字节旗下 Trae 平台的强大能力,AI 编程将变得更加简单和有趣。

6.hailuo

近期,MiniMax 同时推出了海螺02模型以及 Beta 版的视频代理工具。借助预设的模板和先进的 02 视频生成模型,任何人都可以快速复刻热门视频,且无需复杂的剪辑操作。

视频操作非常简单:点击链接,登录到海螺官网,切换到“视频模式”下的 Agent 功能。目前,MiniMax Agent Beta 还处于第一阶段,用户可以使用系统提供的模板,复刻当下热门的视频创意。

启动视代理后,系统就会进行推理,并自动完成视频生成全过程,无需值守。

从任务步骤拆解可以看出,MiniMax Agent 能够分析用户上传的图像,并替代模板中原有的物体,合成一段全新的视频。按照这个方法,我们还可以将视频中的主体替换为任意动物。

除了单一画面,MiniMax Agent 还能够生成包含多个分镜和背景音乐的内容,非常适合批量生成短视频。更多玩法大家可以自行体验。

发表回复