今天我为大家分享几组重要的人工智能新闻:
1. 可灵新玩法

随着可灵 2.0 模型和多模态视频编辑功能的发布,我们已经可以借助该工具替换视频中的人物,并合成全新的视频。之前我们一般会使用 Viggle 替换人物中的角色,缺点则是画质过低,合成痕迹明显。
而可灵提供的角色替换功能,则能够合成更加真实、堪比电影效果的画面。只需提供一张参考图,并替换视频中指定的人物,即可完成角色转换,非常简单。
此外,结合 Midjourney V7 生成的图像,并使用可灵 2.0 生成视频,则可以获得最佳的动态效果。在文本转视频模式中,可灵 2.0 也可以生成超真实的人像和云朵倒影。
可灵 2.0 对内容的审核较宽松,支持生成大尺度美女舞蹈,非常适合制作 TikTok 短视频。
2. OpenAI 新动态

本周,OpenAI 正式发布了 O3 与 O4 Mini 推理模型,号称具备史上最强多模态能力。其中 O3 作为顶级推理模型,在多项测试中创下了新纪录,并具备更强的图像推理能力。
O4 Mini 则是一种轻量高效模型,适合大规模调用场景。O3 模型还可以将图像融合到思考链中,并读取草图和模糊图像中的文字。O3 模型可以识别远处拍摄的图像,读取白纸上细小的文字。
此外,O3 模型还可以根据用户的提问选择不同的工具解决问题,而不仅仅是读取图像内容。目前,O3 和 O4 Mini 模型已经面向付费用户开放,大家可以尝试。
另外,ChatGPT 还推出了 My Library 功能,方便用户查找之前生成的图像。目前该功能已经在移动端和网页端上线。
据媒体报道,OpenAI 正在构建一个类似推特的社交媒体产品,并会整合到 ChatGPT 中。目前,ChatGPT 的月活跃用户已经接近 4 亿,超过了很多社交媒体网络的用户总量。奥特曼表示,该应用已经在进行内部测试,操作体验类似于 X 平台和 Facebook。
3. Mirage Edit

这是 Captions 新推出的功能,可以将视频脚本转换为会说话的视频。Actions 还会自动编辑视频,并提供数字人演员、转场特效和字幕,让内容创作变得更加简单。
目前,该功能已经可以在 Actions 的 iOS 应用程序中使用。Actions 表示,Mirage Edit 的使命就是弥补想法和表达之间的差距,借助 AI 工具帮助人们快速完成视频制作。
4. HiDream

这是 VivaGo 发布的全新开源图像生成模型,并一度达到了图像模型竞技场的第二名。HiDream分为三个版本,其中 Dev 模型兼顾了生成质量与速度的需求,可在 10 秒内实现高质量图像生成。
HiDream 在图像质量、提示词遵循能力和多风格图像生成方面表现出色,也受到了网友的一致好评。HiDream能够在消费级显卡上运行,大家可以预览一下效果。
首先,HiDream 能够准确完成指定文本渲染;在人像、卡通等多风格图像生成方面也有不错的表现。不过,该模型在构图、光影效果以及画面真实感方面,还和主流模型有着一定的差距。
5. Gamma 2.0

本周,Gamma推出了 2.0 版本,能够一键完成网站生成、演示文稿制作和社交媒体设计。在更新之前,Gamma 仅能够根据提示词生成 PPT 演示文稿,而 2.0 版本不但支持生成网页、社交媒体贴文,还提高了生成速度,且支持通过对话的形式进行编辑。
自上市以来,Gamma的用户已经达到 5000 万。Gamma 的操作界面非常简洁,免费用户最多可生成包含 10 张卡片的演示文稿,且支持中文输出。
从实际测试结果可以看出,Gamma2.0 响应速度非常快,可在几秒钟内完成大纲生成,然后系统会根据大纲内容自动生成内容丰富、结构完整的网站。完成网站生成后,点击右上角的“发布”按钮,系统就会自动分配一个二级域名,可以直接访问。
无需设计基础,任何人都可以在一分钟内生成一个完整的网站。经过本次更新后,Gamma2.0 不但提升了用户体验,还新增了 AI 图像编辑功能,且支持多格式导出,大家可以尝试。
6. Liquid

这是字节新推出的多模态开源模型。与市面上主流多模态大型语言模型不同的是,Liquid 能够使用单个 LLM 处理视觉理解和生成任务。
Liquid 无需外部视觉模型,且能够将图像转换为离散编码,实现与文本的统一处理。在多项测试中,Liquid 的视觉理解能力已经和 MLLM 相当,且并未减弱语言能力。
作为一个多模态模型,Liquid 能够通过文本生成图像,或者根据提示词对图像进行分析。大家可以尝试,这是HuggingFace地址:https://huggingface.co/spaces/Junfeng5/Liquid_demo。
7. Lenny’s Newsletter

近期,知名的 Lenny Newsletter 推出了一项史无前例的促销计划,并引发了网友热议。据介绍,订购 Lenny Newsletter 一年的服务,即可获赠 Boat Cursor、Notion、Perplexity Pro 等 10 种热门 AI 工具的一年使用权,价值达 15,000 美元。
价格方面,支付 200 美元的年付计划方可享受以上优惠政策。根据网友测试,如果使用教育邮箱订购,还可立减 100 美元,价格非常划算。
值得注意的是,Lenny Newsletter 的创始人 Lenny Rachitsky 是一位知名的投资者、作家和博客主持人,并拥有超过千万的订阅量。

AI 创新真是一波接一波!从可灵 2.0 到 Liquid、Gamma 2.0,每一个工具都让内容创作更高效、更有趣,值得关注和尝试!