5月第一周AI资讯

本周,Anthropic发布了Claude iOS版应用程序。目前,该应用程序仅支持iOS 17以上的系统。Claude移动端程序可以免费使用Sonnet模型,且支持附件上传和图像分析功能。

与此同时,Anthropic还将在近期推出团队计划。相比个人计划,Team Plan为每个团队用户提供更多的使用量和聊天次数。团队成员可以访问Claude 3、Opus、Sonnet和Haiku模型,且可以使用高达200K的上下文窗口。Team Plan更擅长处理复杂的文档和主题,以及高峰期优先访问权、新功能提前试用等功能。

下面,我再为大家总结近一周的几个AI新闻。

  • OpenAI更新

本周,OpenAI的官网界面完成了更新。除了在主页加入ChatGPT对话框,网站的结构和设计也变得更加简洁。此外,ChatGPT还向Plus用户开通了Memory,也就是记忆功能。在对话的过程中开启Memory功能,可以记录使用者的偏好。用户可以直接使用GPT3.5聊天,而无需登陆等繁琐的操作。

本周,音乐生成平台UDIO完成了更新。音轨扩展功能从30秒增加到了2分钟,最大长度可达15分钟。UDIO还引入了一种树状组织方式,可以查看音轨的来源和扩展轨迹。完成更新后,UDIO就可以直接生成3分钟以上的歌词和音乐。

本周,AW Portrait推出了1.4版本,能够生成更为真实的人像作品。AW Portrait模型可以生成摄影棚风格的人像,且增强了对光线和人物表情的优化。在提示词中添加微笑词条,就可以生成带有自然表情的女性肖像。AW Portrait增加了对旗袍和汉服的支持,更适合生成东方女性的形象。无论是光影效果还是细节刻画,都有不错的表现。用户可以通过调整提示词,生成半身全身照片。1.4版本仍旧非常适合输出室内摄影效果的图像。AW Portrait基于Stable Diffusion 1.5模型进行微调和训练,非常适合生成写实风格的人物肖像。

Mesh在成立一周年之际,发布了全新的文本转3D模型Mesh 3。新版本可以创建更为复杂和精细的3D模型,且具备更强的材质真实感和动态光照效果,让3D模型看起来更真实。和Mesh 2模型相比,Mesh 3明显能够生成更加平滑和清晰的模型。此外,Mesh 3还新增了如纹理修复、提示助手等功能,方便用户进行编辑。登录到Mesh,切换到Text to 3D,在上方对话框中输入提示词,选择PBR模式,选择一个喜欢的模型,点击细化按钮,对纹理进行强化。Mesh 3可以在动态光照下生成模型,生成基于物理的渲染贴图,提升多材质资产的真实感和表面的细节水平。

这是一个很有趣的项目,可以将多个人物形象整合在一起,生成逼真的合影图。Instant Family采用眼码交叉注意力机制和多模态嵌入堆栈,实现零样本多ID图像生成。Instant Family可以解决多个人脸身份不一致以及人脸细节缺失等常见问题。此外,在更换背景和人数后,依然可以堆叠ID,生成多人物一致性的图像。Instant Family同样支持ControlNet插件,设定人物的姿势。

这是字节跳动发布的项目,能够生成细节丰富、内容多样的图像和视频,同时保持角色身份和服饰的一致性。事实上,Story Diffusion可用于生成不同风格的漫画,我们可以看到漫画中角色的形象和服装可以保持高度的一致性。Story Diffusion同时支持图像转视频功能,可以基于一张参考图生成高质量的短视频。Story Diffusion还能够支持动漫风格的连续人物和角色生成,适合创建动漫作品。在真实人像生成方面,Story Diffusion也有不错的表现。

感兴趣的朋友可以尝试上面几个AI工具。

发表回复