2025年4月第2周AI资讯

今天,我再为大家分享几组重要的人工智能新闻:

1. 即梦3.0

消息表示,字节正在加紧推出即梦3.0图像模型,用于对标GPT4-o的文生图像生成功能。从测试效果可以看出,3.0模型能够精准渲染中文,非常适合设计海报和图文广告。无论是包含logo的产品效果图,还是复杂的海报设计,即梦3.0都可以轻松应对,尽管在细节上还会出现瑕疵。

即梦3.0模型的发布,也会大幅降低广告设计的门槛。和上一代模型相比,即梦3.0提高了中文生成和排版能力,且支持自定义字体风格,适用于制作不同行业的LOGO和宣传海报。

即梦3.0支持复杂的中文提示词输入,用户可以指定排版的方式、字体的位置和风格,让设计变得更加简单。此外,在提示词中同时添加中英文,也可以完美渲染,生成带有指定字体的图像。无论是产品包装、电商促销海报,还是小说封面,都可以借助该模型生成。

即梦3.0模型会在近期开启内部测试,感兴趣的同学可以关注。

2. GPT4-o中文生成

本周末,GPT4-o模型完成了升级,增强了对中文的支持能力。从实际测试结果可以看出,GPT4-o已经可以生成指定字体的中文海报。在文字渲染精准度方面,GPT4-o甚至更加出色,由即梦生成的海报明显更符合中国的设计风格。

总之,随着AI技术的发展,平面设计师失业的时间节点也可能会提前到来。

3. Dream Actor M1

近期,字节推出了一个名为Dream Actor M1的人体动画框架,可以模仿从视频中捕捉到的人类行为,制作极具表现力和逼真的视频。合成后的视频具有时间一致性、身份保留性和高保真度。

该功能类似Runway之前发布的Act One,能够基于单张参考图和动作合成新的视频。从演示画面可以看出,Dream Actor M1能够生成表情细腻、动作自然且清晰的视频。此外,使用者还可以通过文本提示词控制人物的面部表情和身体动作。

4. Superagent

这是Genspark推出的一款多功能自动化AI代理,具备自主思考、规划、执行、调用工具的能力,使用世界首个多智能体混合系统构建。Superagent能够自主理解用户需求,制定计划并自主执行任务,例如旅行规划、餐厅预定以及视频编辑等复杂任务。

Superagent在高亚基准测试中击败了OpenAI和Manus,显示出其在通用智能任务上的优越性。Superagent整合了9个不同规模的语言模型、80种工具以及10种优质数据集,用于协同处理多样化任务。

用户只需输入具体要求,智能代理就会完成内容生成、研究分析、联网搜索,并输出最终结果。Superagent同时具备强大的编码能力,可作为Manus的替代。

5. Quasar Alpha

本周末,OpenRouter上线了一个名为Quasar Alpha的神秘模型,且具备100万TOKEN的上下文能力。Quasar Alpha的响应速度非常快,每秒可处理136个TOKEN。该模型在多项基准测试中名列前茅,且具备强大的编码能力。

Quasar Alpha同时具备多模态能力,目前可以在OpenRouter免费使用。

6. Pica Multi-keyframe

本周,pika对Frames功能进行了升级,最多支持上传5张图像,生成长达25秒的视频。目前,该功能已经可以在网页端、iOS端使用。该功能可用于制作各种趣味视频,操作也非常简单。使用者还可以上传多个连续的帧,合成一段动态视频。大家可以尝试。

7. Skyreels A2

本周,昆仑万维推出了Skyreels A2框架,可以融合不同的元素和背景图像,按照提示词合成一致性视频。Skyreels A2是一种可控视频生成框架,能够根据文本提示,将任意视觉元素组合成视频,同时保持每个元素与参考图像的严格一致性。目前该模型已经开源,且可以商业化使用。

发表回复