1月第四周AI资讯
  • Post author:
  • Post category:AI
  • Post comments:0评论

今天,为大家总结一下本周重要的人工智能新闻。

本周,Google推出了强大的LUMIERE模型,该模型不仅支持文本、图像转视频功能,还可以进行视频编辑,完成风格转换。以下为官方演示视频:

我们可以看到LUMIERE不仅可以生成清晰的视频,还能准确还原提示词的内容,效果远超同级对手。”Images to video”功能可以基于图像生成视频,整体效果也不错。”Stylized Generation”功能则比较有趣,用户只需使用单个参考图像,LUMIERE就可以完成微调模型权重,生成类似风格的视频。”Video Stylization”可以基于视频素材,通过文本命令的形式,生成不同风格的短视频,例如折纸和乐高积木风格。Cinemagraphs可以在遮罩的区域内把图像转换为动画,类似runway的motion brush功能。”Video Inpainting”则可以遮罩视频的部分区域,通过文本命令的方式完成内容替换,该功能类似pikalabs的Modify region,用于编辑视频的局部内容。

近期,一个名为Instant ID的零样本图像生成工具发布,可以记一张参考图,生成多种风格的图像。Instant ID基于扩散模型创建,只需单张面部图像,即可生成高保真风格化人物形象。相比传统的Dreamsbooth和Lora,Instant ID的图像生成效率明显得到了提升。在和LORA微调模型以及face swapper工具的对比中,由Instant ID生成的人物面容,也完全不落下风。此外,Instant ID还支持人物面部融合,通过调整ID强度值就可以控制参考图的还原度。目前,Instant ID已经开源,还可以整合到Stable Diffusion,作为插件使用。点击上方链接就可以在huggingface尝试该工具。比如我上传了如下两张图作为参考:

然后生成了如下风格的图像,自己感觉是非常惊艳,将色彩、构图和人物神情描绘的恰到好处:

本周,Google官方宣布将会在Chrome浏览器中新增3种AI功能,该功能会在近期向美国用户开放。安装最新版本的Chrome就可以体验新增的标签页整理功能,会根据用户打开的标签自动推荐和创建分组,完成智能分类。此外,Chrome还引用了图像生成功能,帮助用户生成个性化的主题和风格,如下所示:

Writing help功能则是一个辅助写作插件,用户只需输入几个单词,Chrome就会自动生成内容,提高写作效率。

本周,腾讯旗下的PhotoMaker工具正式开放了源代码和测试页面。

上传人物图像,输入提示词,选择一种风格点击生成,图像从生成的图像可以看出基本可以还原参考图的面容。PhotoMaker可以生成多种风格的图像,感兴趣的同学可以尝试。

POE集成了市面上主流的大语言模型和图像生成模型,任何人都可以在POE创建聊天机器人,并分享给社区的其他用户使用。社区中优秀的机器人已经获得了20万活跃用户。为了激励创作者制作有趣的机器人,POE推出了全新的创作者收益计划。如果免费用户在使用你的机器人后订阅了POE的高级账号,创作者就可以获得50美元的佣金。如果你设计的机器人可以获得10000月流量,按照1%的转化率,每月也可以获得50到100单的销量,收益可达数千美元。点击申请按钮就可以加入该计划,你可以随时查看自己的收益情况,每月的佣金会发送到你的stripe收款账号。有需要的同学可以尝试。

发表回复