2025年11月第1周AI资讯 – 心一信息

2025年11月第1周AI资讯

Post author:zentorno
Post published:2025年11月9日
Post category:AI资讯
Post comments:0评论

Sora安卓版正式上线

本周，OpenAI正式发布了Sora的安卓版应用程序。作为目前全球最先进的视频生成模型之一，Sora 2支持图片生成视频和文本生成视频两种模式，为创作者提供了强大的AI视频制作能力。

然而，Sora也存在一些明显的不足。首先，生成的视频带有水印，这对于需要商业用途的创作者来说是一个障碍。其次，整体画质无法达到高清水平，这在一定程度上限制了其应用场景。为了解决这些问题，创作者可以使用HitPaw等第三方工具来完成水印移除和画质修复。

具体操作流程是：首先在工具箱中选择浮水印移除选项，导入由Sora生成的视频，选中水印区域后点击导出按钮即可完成。该工具可以有效移除Sora自带的漂浮水印，且不会影响原视频的整体结构。此外，用户还可以使用视频增强模型提高AI生成影片的画质，选择强化倍数后即可导出。对于显卡性能不足的用户，还提供了云端导出选项，使得视频处理更加便捷。

AI创意视频新突破：游戏化视觉风格引关注

在创意应用方面，本周日本数码艺术家HAL-2400发布了一段引发热议的AI视频作品，将经典动画《千与千寻》的角色置于虚拟游戏世界中展开冒险。从生成的画面来看，这类视频更像是3A级冒险游戏中的场景，视觉效果令人印象深刻。

该创作者分享了自己的工作流程，主要通过Midjourney和可灵AI共同完成。这种将AI图像生成与视频合成相结合的创作方式，为内容创作者提供了新的思路和可能性，展示了AI工具在创意领域的巨大潜力。

HeyGen推出新一代视频翻译引擎

视频翻译技术也迎来了重大升级。本周，HeyGen推出了新一代视频翻译引擎，重点提升了口型同步、音质、上下文理解和多说话人检测等核心技术，让AI翻译视频的效果更加真实自然。

经过升级后，HeyGen已经可以实现超真实的唇型同步和上下文感知翻译能力，几乎很难看出AI合成的痕迹。新系统还可以识别视频中的多个人物，并支持十种常用语言。目前该功能已经在手机端应用程序上线，为全球化内容创作提供了强有力的技术支持。

ComfyUI Cloud开放注册，云端运行成为现实

对于AI图像和视频生成的专业用户来说，ComfyUI一直是重要的工作流工具。本周，ComfyUI Cloud正式开放注册，用户可以在浏览器中直接运行ComfyUI，无需本地安装就能使用全部功能。

ComfyUI Cloud的运行环境由高性能GPU驱动，支持大模型和复杂的工作流。在价格方面，每月仅需20美元即可使用全部功能，这对于没有高端显卡的创作者来说是一个经济实惠的选择。

图像生成模型持续进化：Nano Banana 2

Google方面也传来新消息。根据TestingCatalog的消息，Google发布了Imagen 3 UI更新公告，并准备推出代号为Imagen 2的新图像模型。根据Google的发布习惯，该模型最快将在下周发布。Imagen系列自发布以来广受用户好评，新版本的推出有望为用户带来更多惊喜。

CapCut新增虚拟试穿功能

在实用工具方面，近期CapCut新增了虚拟试穿功能，且支持自定义模特。用户只需运行CapCut，选择AI Fashion模特功能，上传服装和模特图像即可合成对应的虚拟试穿效果。之后还可以使用图片转视频工具，将静态图像转换为动态画面。目前该功能已经面向付费用户开放。

机器人领域的突破：Generalist发布通用机器人模型

在机器人技术领域，Generalist正式发布了具备十亿参数的机器人基础模型Gen0。该模型基于推理方式训练，能够驱动机器人实现无缝思考和行动，并使用了27万小时的灵巧操作数据集进行预训练。

该模型的发布意味着通用机器人技术已经突破数据瓶颈，能够完成更加精细的任务，这对于推动机器人技术的实际应用具有重要意义。

Skyreels整合多模型平台全新上线

最后，昆仑万维旗下AI视频创作平台Skyreels本周正式换新上线，集成了包括Keling 1.5、Sora、Runway、Imagen、GPT、Ideogram、Dream等国内外主流模型。功能方面，平台提供了一站式图片视频生成、数字人、音乐生成等多种创作方式，为创作者提供了更加完整的AI创作工具链。

综合来看，AI视频和图像生成技术正在快速发展和普及，从专业创作到日常应用，AI工具正在改变内容创作的方式和效率。随着技术的不断成熟和工具的持续优化，AI创作将会变得更加便捷和高效。

标签: comfyui, Google, heygen, openai, sora

发表回复取消回复