2025年4月第1周AI资讯

下面是本周AI动态：

1. DeepSeek V30324正式发布

DeepSeek正式发布了新一代模型V30324，在编程能力与复杂推理任务中表现非常出色。这是DeepSeek V3模型的升级版，并采用了专家混合架构，开源且允许自由商用。

目前，DeepSeek V30324已在Hugging Face上开源，并获得了一致好评。根据最新数据，V30324模型排名第七，性能已经超过Claude 3.5，并接近R1和Claude 3.7的编码与数学能力。同时，成本下降到了R1模型的1/5。

最重要的是，V30324模型的容量仅有640G，参数量达6,850亿，并可在M3 Ultra芯片上运行，推理功耗仅为200瓦。根据实际测试，该模型能在几分钟内生成一个内容丰富、布局合理、带有专业腋脚的销售网站，并且可以通过简单提示词生成可执行的3D游戏。

目前，许多平台已上线V30324模型，并能解决很多大语言模型无法回答的难题。无论在响应速度还是代码生成能力方面，该模型均有出色表现。

2. Gemini 2.5 Pro发布

本周，Google发布了Gemini 2.5 Pro experimental模型，并重新夺回LLM第一名的宝座。与之前不同，该模型在LLM竞技场中的排名大幅领先O3 mini，并在多项基准测试中取得SOTA成绩。

Gemini 2.5 Pro在数学和科学基准测试中处于领先地位，并刷新了人类考试得分的新纪录。此外，该模型在代码理解方面表现突出，可分析错误提示、修改源码、调整测试脚本，并根据自然语言描述完成代码编辑任务。大家可以访问Google AI Studio，免费尝试Gemini 2.5 Pro模型。

3. GPT-4o新玩法

GPT-4o的原生图像生成功能发布以来，受到了网友一致好评。GPT-4o还能完成中文渲染，错误率非常低。

根据多组测试，GPT-4o的中文能力尽管仍不完美，但已超越同级别模型，它还能用于制作带有中文的表情包。此外，用户可以将爱情电影中的截图转换为多种卡通风格，借助原生图像模型和Sora的视频生成功能，或许未来可以将真人拍摄的影片转换为唯美的卡通风格。

4. Ideogram 3.0发布

为了应对GPT-4o原生图像生成带来的冲击，Ideogram发布了旗下最先进的3.0模型，并增加了Style Reference和Random Style两种新功能，可轻松创建不同风格的图像。

在专业设计师评估中，Ideogram 3.0的表现优于主流图像模型，尤其在逼真度、文本渲染和语言理解方面取得了重大突破。与上一代模型相比，3.0模型能够生成高保真照片及真实图像，层次感更明显，对细节的处理也更加出色。同时，3.0模型对文本渲染能力进行了加强，支持复杂的文字组合方式和多层排版。此外，风格参考功能允许上传参考图，生成类似风格的作品。

目前，3.0模型已面向所有用户开放，登录Ideogram即可使用。实际测试显示，Ideogram V3模型能够生成专业摄影级别的人像作品，并具备复杂环境建模能力，如带有商品LOGO、光照阴影、反射和景深的图像。尽管功能不及GPT-4o强大，但V3模型仍能保证高质量的图像输出，大家可以尝试。

5. 可灵新功能

本周，可灵对Elements功能进行了升级，不仅能更快生成视频，还增强了对提示词的理解能力，并提升了视频的整体画质和解析度。

新增加的Extend功能，可进一步延伸视频，并补充细节。根据视频模型竞技场的排名，可灵 01.6 Pro已位于榜首，超越了VO2模型。目前，该功能已在可灵免费开放，大家可以尝试。

6. OpenAI智能体更新

本周，OpenAI宣布对Agent SDK进行重大更新，正式支持MCP服务。MCP是一种开放标准协议，可为智能体无限接入各种第三方工具，大幅提升复杂应用的开发效率。

MCP将直接支持OpenAI API，并可在ChatGPT桌面客户端中使用。它允许开发者将自己的模型或上下文信息连接到不同应用，形成更强的自定义工作流，提高开发效率。

7. Qwen 2.5 Omni发布

本周，Qwen（通义千问）发布了Qwen 2.5 Omni模型，这是该系列首个端到端全模态大模型，能够同时处理文本、图像、音频和视频等多种输入，并实时生成文本与自然语音合成输出。

在权威多模态融合任务的测评中，Qwen 2.5 Omni刷新了业界纪录，各项得分远超同类模型。在单一模态测试中，该模型的表现同样出色。目前，该模型已在Qwen Chat上线，大家可以尝试。

此外，阿里还发布了视觉推理模型QVQ Max，能够读取图像和视频并进行推理和分析。

8. Pika新功能

本周，Pika推出了全新功能，可以与小时候的自己合影！

用户只需上传一段自拍视频，并保留空白位置，再上传小时候的照片，即可合成对应的效果。表情和动作均可通过提示词控制。目前，该功能已在pika上线，登录即可使用。

下面是本周AI动态：

1. DeepSeek V30324正式发布

2. Gemini 2.5 Pro发布

3. GPT-4o新玩法

4. Ideogram 3.0发布

5. 可灵新功能

6. OpenAI智能体更新

7. Qwen 2.5 Omni发布

8. Pika新功能

你可能也喜欢

2025年9月第1周AI资讯

2月第三周AI资讯

12月第三周AI资讯

发表回复 取消回复

发表回复取消回复