本周AI领域迎来了多项重要更新,从视频生成到同声翻译,从图像编辑到视觉记忆,各大厂商纷纷发布新功能和新模型。让我们一起来盘点这些令人瞩目的技术突破。
🎬 Runway推出革命性视频编辑模型Aleph

Runway本周发布了全新的视频编辑、转换和生成模型Aleph,这一突破性技术让视频编辑变得前所未有的简单。用户只需输入简单的文本指令,就能完成复杂的视频编辑任务。
Aleph的核心功能包括:
- 智能对象编辑:可以添加、删除和转换视频中的对象
- 摄像头角度调整:无需重新拍摄就能改变镜头角度
- 风格和灯光转换:一键改变视频风格和灯光效果
- 场景预测生成:根据参考视频智能预测并生成下一个镜头
对于电影导演而言,这意味着可以大幅降低制作成本。只需上传视频素材并输入提示词,就能改变镜头角度,无需重新拍摄。更令人惊喜的是,Aleph还能添加与原视频风格完全一致的新元素,合成效果天衣无缝,完全看不出人工痕迹。
除了添加功能,Aleph还具备强大的移除能力,可以轻松去除视频中多余的物体和元素。更神奇的是,它还能改变人物的面容和年龄,调整不同时段的光照效果,为创作者提供了无限可能。
📹 阿里通义万相2.2:开源视频生成新突破

阿里巴巴宣布即将发布开源视频生成模型通义万相2.2,这是通义万相2.1的重大升级版本。作为阿里开源AI战略的重要组成部分,通义万相2.2预计在性能、效率和功能上实现重大突破,进一步巩固阿里在全球AI视频生成领域的领先地位。
从官方发布的预告片来看,通义万相2.2在多个关键指标上都有显著提升:
- 整体画质大幅提升,视频清晰度更高
- 运镜效果更加流畅自然
- 文本渲染能力得到显著增强
这一开源模型的发布,将为全球开发者和创作者提供更强大的视频生成工具,推动整个行业的技术进步。
🖼️ Midjourney首尾帧功能上线

Midjourney本周推出了备受期待的首尾帧功能,专门用于制作连贯的循环视频。这一功能的加入,让Midjourney的视频创作能力更加完善。
新功能亮点:
- 完美过渡效果:首尾帧功能可以实现完美的视频过渡
- Discord集成:视频生成功能已引入Discord,登录即可使用
- 画质提升:结合Video等功能使用,可进一步提高视频画质
根据实际测试,StartAndFrame功能表现出色,能够轻松制作连续流畅的循环视频,为创作者提供了更多创意表达的可能性。
🎞️ Story Studio:集成式在线视频编辑器

Story Studio正式发布了集成视频模型和语言模型的在线视频编辑器,目前已开启内部测试。这一工具将创意转换和专业编辑完美结合,为内容创作者提供了一站式解决方案。
核心特性:
- 多风格视频转换:支持将创意转换为多种风格的视频
- 专业编辑功能:提供完整的视频编辑工具套件
- 无需导出:可直接在线完成所有编辑工作
Story Studio官方正在Twitter上招募内容创作者参与测试,参与活动即可获得价值60美元的邀请码,这为创作者提供了抢先体验的机会。
🧠 Memories:全球首个大型视觉记忆模型

前Meta员工、剑桥大学博士推出了革命性AI工具Memories,这是全球首个大型视觉记忆模型,能够让人工智能拥有类似人类的视觉记忆能力。
技术突破:
- 视觉记忆:AI具备观察和记忆能力
- 广泛应用:可用于教育、内容创作、市场营销等领域
- 强大融资:已获得SoC Ventures 800万美元融资
Memories可以读取视频内容,并将其转换为包含关键视觉内容和总结文本的结构化信息。官网和API已经上线,为各行业提供了强大的视觉理解工具。
🗣️ 字节跳动Seed LiveInterpret 2.0:同声翻译新标杆

字节跳动发布了端到端同声翻译模型Seed LiveInterpret 2.0,实现了仅2-3秒延迟的中英文双向翻译。从演示效果来看,该模型在处理复杂场景方面表现出色,翻译准确度和质量已接近真人翻译水平。
这一技术突破将在国际会议、商务谈判、教育交流等场景中发挥重要作用。目前该模型已在火山引擎上线,用户可以直接体验这一先进的同声翻译技术。
🎨 可灵Element功能大幅升级

可灵ImageToVideo模型完成重要更新,Element元素功能得到显著强化。在主题一致性、动态性、及时性和视觉渲染质量方面都有很大改进。
升级亮点:
- 精确选择:可从参考图中准确选择角色和元素
- 多元素组合:支持将多种元素组合生成创意视频
- 更好一致性:生成视频与参考图保持高度一致
用户可以选择参考图中的人物全身、面部、服装等作为参考元素,目前Element功能仅在1.6模型中可用。登录可灵即可体验这一强大功能。
本周的AI技术更新展现了人工智能在视频生成、图像编辑、语言翻译、视觉理解等多个领域的快速发展。这些技术突破不仅降低了内容创作的门槛,也为各行各业带来了新的可能性。随着这些工具的普及和完善,我们正在见证一个全新的AI驱动创作时代的到来。
