9月第三周AI资讯

Post author:zentorno
Post published:2024年9月20日
Post category:AI资讯
Post comments:0评论

本周，我们来看看一些新推出的人工智能工具：

YouTube引入VEO模型

YouTube宣布引入Google Deepmind的VEO模型，用于生成Shorts短视频。VEO将集成到YouTube Shorts的Dream Screen中，用户可以使用Imagen 3模型生成图像，然后转换为6秒的高质量视频。为保证观众知情权，VEO生成的短视频将会添加水印以便于区分。

可灵1.5版本

可灵发布了1.5版本，大幅提升了视频画质、清晰度和运动合理性。新版本支持1080p高清分辨率，新增了运动笔刷功能，允许用户为图像中的6个元素指定运动轨迹。1.5版本目前仅对付费用户开放。

通义万相

阿里巴巴推出的视频生成模型通义万相开放测试。它支持中文提示词输入，可生成9:16、1:1以及4:3比例的视频，还能生成带背景音乐的短视频。笔者尝试后发现生成过程较慢，视频能力尚未达到主流模型水平。

Runway视频生成

Runway推出了video to video功能，并发布了操作指南。用户可以结合参考视频和文本提示词制作创意视频。Runway还加入了首尾帧功能，允许用户在视频开始和结尾处添加连贯图像。同时，Runway推出了API集成服务：Make anything, anywhere. With the Runway API. (runwayml.com)，目前支持Gen-3 Alpha Turbo模型。