Sora安卓版正式上线

本周,OpenAI正式发布了Sora的安卓版应用程序。作为目前全球最先进的视频生成模型之一,Sora 2支持图片生成视频和文本生成视频两种模式,为创作者提供了强大的AI视频制作能力。
然而,Sora也存在一些明显的不足。首先,生成的视频带有水印,这对于需要商业用途的创作者来说是一个障碍。其次,整体画质无法达到高清水平,这在一定程度上限制了其应用场景。为了解决这些问题,创作者可以使用HitPaw等第三方工具来完成水印移除和画质修复。
具体操作流程是:首先在工具箱中选择浮水印移除选项,导入由Sora生成的视频,选中水印区域后点击导出按钮即可完成。该工具可以有效移除Sora自带的漂浮水印,且不会影响原视频的整体结构。此外,用户还可以使用视频增强模型提高AI生成影片的画质,选择强化倍数后即可导出。对于显卡性能不足的用户,还提供了云端导出选项,使得视频处理更加便捷。
AI创意视频新突破:游戏化视觉风格引关注

在创意应用方面,本周日本数码艺术家HAL-2400发布了一段引发热议的AI视频作品,将经典动画《千与千寻》的角色置于虚拟游戏世界中展开冒险。从生成的画面来看,这类视频更像是3A级冒险游戏中的场景,视觉效果令人印象深刻。
该创作者分享了自己的工作流程,主要通过Midjourney和可灵AI共同完成。这种将AI图像生成与视频合成相结合的创作方式,为内容创作者提供了新的思路和可能性,展示了AI工具在创意领域的巨大潜力。
HeyGen推出新一代视频翻译引擎

视频翻译技术也迎来了重大升级。本周,HeyGen推出了新一代视频翻译引擎,重点提升了口型同步、音质、上下文理解和多说话人检测等核心技术,让AI翻译视频的效果更加真实自然。
经过升级后,HeyGen已经可以实现超真实的唇型同步和上下文感知翻译能力,几乎很难看出AI合成的痕迹。新系统还可以识别视频中的多个人物,并支持十种常用语言。目前该功能已经在手机端应用程序上线,为全球化内容创作提供了强有力的技术支持。
ComfyUI Cloud开放注册,云端运行成为现实

对于AI图像和视频生成的专业用户来说,ComfyUI一直是重要的工作流工具。本周,ComfyUI Cloud正式开放注册,用户可以在浏览器中直接运行ComfyUI,无需本地安装就能使用全部功能。
ComfyUI Cloud的运行环境由高性能GPU驱动,支持大模型和复杂的工作流。在价格方面,每月仅需20美元即可使用全部功能,这对于没有高端显卡的创作者来说是一个经济实惠的选择。
图像生成模型持续进化:Nano Banana 2

Google方面也传来新消息。根据TestingCatalog的消息,Google发布了Imagen 3 UI更新公告,并准备推出代号为Imagen 2的新图像模型。根据Google的发布习惯,该模型最快将在下周发布。Imagen系列自发布以来广受用户好评,新版本的推出有望为用户带来更多惊喜。
CapCut新增虚拟试穿功能

在实用工具方面,近期CapCut新增了虚拟试穿功能,且支持自定义模特。用户只需运行CapCut,选择AI Fashion模特功能,上传服装和模特图像即可合成对应的虚拟试穿效果。之后还可以使用图片转视频工具,将静态图像转换为动态画面。目前该功能已经面向付费用户开放。
机器人领域的突破:Generalist发布通用机器人模型

在机器人技术领域,Generalist正式发布了具备十亿参数的机器人基础模型Gen0。该模型基于推理方式训练,能够驱动机器人实现无缝思考和行动,并使用了27万小时的灵巧操作数据集进行预训练。
该模型的发布意味着通用机器人技术已经突破数据瓶颈,能够完成更加精细的任务,这对于推动机器人技术的实际应用具有重要意义。
Skyreels整合多模型平台全新上线

最后,昆仑万维旗下AI视频创作平台Skyreels本周正式换新上线,集成了包括Keling 1.5、Sora、Runway、Imagen、GPT、Ideogram、Dream等国内外主流模型。功能方面,平台提供了一站式图片视频生成、数字人、音乐生成等多种创作方式,为创作者提供了更加完整的AI创作工具链。
综合来看,AI视频和图像生成技术正在快速发展和普及,从专业创作到日常应用,AI工具正在改变内容创作的方式和效率。随着技术的不断成熟和工具的持续优化,AI创作将会变得更加便捷和高效。
