1月第四周AI资讯

今天，为大家总结一下本周重要的人工智能新闻。

首先，LUMIERE模型发布：Lumiere (lumiere-video.github.io)

本周，Google推出了强大的LUMIERE模型，该模型不仅支持文本、图像转视频功能，还可以进行视频编辑，完成风格转换。以下为官方演示视频：

我们可以看到LUMIERE不仅可以生成清晰的视频，还能准确还原提示词的内容，效果远超同级对手。”Images to video”功能可以基于图像生成视频，整体效果也不错。”Stylized Generation”功能则比较有趣，用户只需使用单个参考图像，LUMIERE就可以完成微调模型权重，生成类似风格的视频。”Video Stylization”可以基于视频素材，通过文本命令的形式，生成不同风格的短视频，例如折纸和乐高积木风格。Cinemagraphs可以在遮罩的区域内把图像转换为动画，类似runway的motion brush功能。”Video Inpainting”则可以遮罩视频的部分区域，通过文本命令的方式完成内容替换，该功能类似pikalabs的Modify region，用于编辑视频的局部内容。

Instant ID的介绍：InstantID – a Hugging Face Space by InstantX

近期，一个名为Instant ID的零样本图像生成工具发布，可以记一张参考图，生成多种风格的图像。Instant ID基于扩散模型创建，只需单张面部图像，即可生成高保真风格化人物形象。相比传统的Dreamsbooth和Lora，Instant ID的图像生成效率明显得到了提升。在和LORA微调模型以及face swapper工具的对比中，由Instant ID生成的人物面容，也完全不落下风。此外，Instant ID还支持人物面部融合，通过调整ID强度值就可以控制参考图的还原度。目前，Instant ID已经开源，还可以整合到Stable Diffusion，作为插件使用。点击上方链接就可以在huggingface尝试该工具。比如我上传了如下两张图作为参考：

然后生成了如下风格的图像，自己感觉是非常惊艳，将色彩、构图和人物神情描绘的恰到好处：

Chrome引入AI功能：3 new generative AI features coming to Google Chrome (blog.google)

本周，Google官方宣布将会在Chrome浏览器中新增3种AI功能，该功能会在近期向美国用户开放。安装最新版本的Chrome就可以体验新增的标签页整理功能，会根据用户打开的标签自动推荐和创建分组，完成智能分类。此外，Chrome还引用了图像生成功能，帮助用户生成个性化的主题和风格，如下所示：

Writing help功能则是一个辅助写作插件，用户只需输入几个单词，Chrome就会自动生成内容，提高写作效率。

PhotoMaker的介绍：PhotoMaker (photo-maker.github.io)

本周，腾讯旗下的PhotoMaker工具正式开放了源代码和测试页面。

上传人物图像，输入提示词，选择一种风格点击生成，图像从生成的图像可以看出基本可以还原参考图的面容。PhotoMaker可以生成多种风格的图像，感兴趣的同学可以尝试。

POE推出联盟营销计划：创作者 (poe.com)

POE集成了市面上主流的大语言模型和图像生成模型，任何人都可以在POE创建聊天机器人，并分享给社区的其他用户使用。社区中优秀的机器人已经获得了20万活跃用户。为了激励创作者制作有趣的机器人，POE推出了全新的创作者收益计划。如果免费用户在使用你的机器人后订阅了POE的高级账号，创作者就可以获得50美元的佣金。如果你设计的机器人可以获得10000月流量，按照1%的转化率，每月也可以获得50到100单的销量，收益可达数千美元。点击申请按钮就可以加入该计划，你可以随时查看自己的收益情况，每月的佣金会发送到你的stripe收款账号。有需要的同学可以尝试。

这篇文章有一个评论

发表回复取消回复

你可能也喜欢

2026年3月第1周AI资讯

2025年1月第1周AI资讯

2025年7月第3周AI资讯

这篇文章有一个评论

发表回复 取消回复

发表回复取消回复