2025年4月第1周AI资讯

下面是本周AI动态

1. DeepSeek V30324正式发布

DeepSeek正式发布了新一代模型V30324,在编程能力与复杂推理任务中表现非常出色。这是DeepSeek V3模型的升级版,并采用了专家混合架构,开源且允许自由商用。

目前,DeepSeek V30324已在Hugging Face上开源,并获得了一致好评。根据最新数据,V30324模型排名第七,性能已经超过Claude 3.5,并接近R1和Claude 3.7的编码与数学能力。同时,成本下降到了R1模型的1/5。

最重要的是,V30324模型的容量仅有640G,参数量达6,850亿,并可在M3 Ultra芯片上运行,推理功耗仅为200瓦。根据实际测试,该模型能在几分钟内生成一个内容丰富、布局合理、带有专业腋脚的销售网站,并且可以通过简单提示词生成可执行的3D游戏。

目前,许多平台已上线V30324模型,并能解决很多大语言模型无法回答的难题。无论在响应速度还是代码生成能力方面,该模型均有出色表现。

2. Gemini 2.5 Pro发布

本周,Google发布了Gemini 2.5 Pro experimental模型,并重新夺回LLM第一名的宝座。与之前不同,该模型在LLM竞技场中的排名大幅领先O3 mini,并在多项基准测试中取得SOTA成绩。

Gemini 2.5 Pro在数学和科学基准测试中处于领先地位,并刷新了人类考试得分的新纪录。此外,该模型在代码理解方面表现突出,可分析错误提示、修改源码、调整测试脚本,并根据自然语言描述完成代码编辑任务。大家可以访问Google AI Studio,免费尝试Gemini 2.5 Pro模型。

3. GPT-4o新玩法

GPT-4o的原生图像生成功能发布以来,受到了网友一致好评。GPT-4o还能完成中文渲染,错误率非常低。

根据多组测试,GPT-4o的中文能力尽管仍不完美,但已超越同级别模型,它还能用于制作带有中文的表情包。此外,用户可以将爱情电影中的截图转换为多种卡通风格,借助原生图像模型和Sora的视频生成功能,或许未来可以将真人拍摄的影片转换为唯美的卡通风格。

4. Ideogram 3.0发布

为了应对GPT-4o原生图像生成带来的冲击,Ideogram发布了旗下最先进的3.0模型,并增加了Style ReferenceRandom Style两种新功能,可轻松创建不同风格的图像。

在专业设计师评估中,Ideogram 3.0的表现优于主流图像模型,尤其在逼真度、文本渲染和语言理解方面取得了重大突破。与上一代模型相比,3.0模型能够生成高保真照片及真实图像,层次感更明显,对细节的处理也更加出色。同时,3.0模型对文本渲染能力进行了加强,支持复杂的文字组合方式和多层排版。此外,风格参考功能允许上传参考图,生成类似风格的作品。

目前,3.0模型已面向所有用户开放,登录Ideogram即可使用。实际测试显示,Ideogram V3模型能够生成专业摄影级别的人像作品,并具备复杂环境建模能力,如带有商品LOGO、光照阴影、反射和景深的图像。尽管功能不及GPT-4o强大,但V3模型仍能保证高质量的图像输出,大家可以尝试。

5. 可灵新功能

本周,可灵对Elements功能进行了升级,不仅能更快生成视频,还增强了对提示词的理解能力,并提升了视频的整体画质和解析度。

新增加的Extend功能,可进一步延伸视频,并补充细节。根据视频模型竞技场的排名,可灵 01.6 Pro已位于榜首,超越了VO2模型。目前,该功能已在可灵免费开放,大家可以尝试。

6. OpenAI智能体更新

本周,OpenAI宣布对Agent SDK进行重大更新,正式支持MCP服务。MCP是一种开放标准协议,可为智能体无限接入各种第三方工具,大幅提升复杂应用的开发效率。

MCP将直接支持OpenAI API,并可在ChatGPT桌面客户端中使用。它允许开发者将自己的模型或上下文信息连接到不同应用,形成更强的自定义工作流,提高开发效率。

7. Qwen 2.5 Omni发布

本周,Qwen(通义千问)发布了Qwen 2.5 Omni模型,这是该系列首个端到端全模态大模型,能够同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。

在权威多模态融合任务的测评中,Qwen 2.5 Omni刷新了业界纪录,各项得分远超同类模型。在单一模态测试中,该模型的表现同样出色。目前,该模型已在Qwen Chat上线,大家可以尝试。

此外,阿里还发布了视觉推理模型QVQ Max,能够读取图像和视频并进行推理和分析。

8. Pika新功能

本周,Pika推出了全新功能,可以与小时候的自己合影!

用户只需上传一段自拍视频,并保留空白位置,再上传小时候的照片,即可合成对应的效果。表情和动作均可通过提示词控制。目前,该功能已在pika上线,登录即可使用。

发表回复