2025年4月第2周AI资讯

今天，我再为大家分享几组重要的人工智能新闻：

1. 即梦3.0

消息表示，字节正在加紧推出即梦3.0图像模型，用于对标GPT4-o的文生图像生成功能。从测试效果可以看出，3.0模型能够精准渲染中文，非常适合设计海报和图文广告。无论是包含logo的产品效果图，还是复杂的海报设计，即梦3.0都可以轻松应对，尽管在细节上还会出现瑕疵。

即梦3.0模型的发布，也会大幅降低广告设计的门槛。和上一代模型相比，即梦3.0提高了中文生成和排版能力，且支持自定义字体风格，适用于制作不同行业的LOGO和宣传海报。

即梦3.0支持复杂的中文提示词输入，用户可以指定排版的方式、字体的位置和风格，让设计变得更加简单。此外，在提示词中同时添加中英文，也可以完美渲染，生成带有指定字体的图像。无论是产品包装、电商促销海报，还是小说封面，都可以借助该模型生成。

即梦3.0模型会在近期开启内部测试，感兴趣的同学可以关注。

本周末，GPT4-o模型完成了升级，增强了对中文的支持能力。从实际测试结果可以看出，GPT4-o已经可以生成指定字体的中文海报。在文字渲染精准度方面，GPT4-o甚至更加出色，由即梦生成的海报明显更符合中国的设计风格。

总之，随着AI技术的发展，平面设计师失业的时间节点也可能会提前到来。

近期，字节推出了一个名为Dream Actor M1的人体动画框架，可以模仿从视频中捕捉到的人类行为，制作极具表现力和逼真的视频。合成后的视频具有时间一致性、身份保留性和高保真度。

该功能类似Runway之前发布的Act One，能够基于单张参考图和动作合成新的视频。从演示画面可以看出，Dream Actor M1能够生成表情细腻、动作自然且清晰的视频。此外，使用者还可以通过文本提示词控制人物的面部表情和身体动作。

这是Genspark推出的一款多功能自动化AI代理，具备自主思考、规划、执行、调用工具的能力，使用世界首个多智能体混合系统构建。Superagent能够自主理解用户需求，制定计划并自主执行任务，例如旅行规划、餐厅预定以及视频编辑等复杂任务。

Superagent在高亚基准测试中击败了OpenAI和Manus，显示出其在通用智能任务上的优越性。Superagent整合了9个不同规模的语言模型、80种工具以及10种优质数据集，用于协同处理多样化任务。

用户只需输入具体要求，智能代理就会完成内容生成、研究分析、联网搜索，并输出最终结果。Superagent同时具备强大的编码能力，可作为Manus的替代。

本周末，OpenRouter上线了一个名为Quasar Alpha的神秘模型，且具备100万TOKEN的上下文能力。Quasar Alpha的响应速度非常快，每秒可处理136个TOKEN。该模型在多项基准测试中名列前茅，且具备强大的编码能力。

Quasar Alpha同时具备多模态能力，目前可以在OpenRouter免费使用。

本周，pika对Frames功能进行了升级，最多支持上传5张图像，生成长达25秒的视频。目前，该功能已经可以在网页端、iOS端使用。该功能可用于制作各种趣味视频，操作也非常简单。使用者还可以上传多个连续的帧，合成一段动态视频。大家可以尝试。

本周，昆仑万维推出了Skyreels A2框架，可以融合不同的元素和背景图像，按照提示词合成一致性视频。Skyreels A2是一种可控视频生成框架，能够根据文本提示，将任意视觉元素组合成视频，同时保持每个元素与参考图像的严格一致性。目前该模型已经开源，且可以商业化使用。