三月第一周AI资讯

今天为大家分享一下近期重要的人工智能新闻:

1.Mistral large:Au Large | Mistral AI | Frontier AI in your hands

2月26日Mistral推出了Mistral large，这也是该公司旗下最强大的语言模型。Mistral large具备很强的推理、数学和编程能力。在基准测试中完胜cloud 2和Gemini Pro模型。得分已经接近世界最强的GPT4模型。

Mistral作为一个小型人工智能公司，却在近年来发展迅速，证明了欧洲的AI研发能力。

功能方面，Mistrow large具备32K TOKEN的上下文能力，且支持欧洲的主流语言。开发者还可以轻松设置审核策略，在微软Asher和本地部署该模型。

在推理能力测试中，Mistral large已经全面超越GPT 3.5模型。多语言能力，则完胜Meta旗下的Lama 70B模型。目前该模型，已经可以在Mistral的law platform平台，以及微软Asher中调用。

2.Sora新功能

Sora模型发布了一段新视频。在新视频里，Sora现状不但能够把当前的图像动态化，还可以延伸画面，生成新的场景。期待Sora模型带给人们新的更多惊喜。

3.Runway更新:https://app.runwayml.com/

为了应对Sora带来的冲击，Runway也在本周完成了更新。Multi motion brush功能，不再需要手动选择区域。Runway 提供了类似PS的自动区域识别功能，帮助用户快速选定需要动态化的区域。登录到Runway，上传一张参考图，点击下方的motion brush选项，选择一个笔刷，系统就会自动识别区域，非常方便。

例如:我使用不同的笔刷选定这只龙的不同部位，点击生成视频。

该功能，可以进一步简化区域选择的流程，让视频生成变得更加便捷。

此外Pika也在本周宣布，集成Eleven lips提供的口型匹配功能，并向高级用户开放。

另外一个视频生成平台Domo也推出了Fusion style V1模型，支持改变参考视频的风格和人物的形象。

4.melo TTS：GitHub – myshell-ai/MeloTTS: High-quality multi-lingual text-to-speech library by MyShell.ai. Support English, Spanish, French, Chinese, Japanese and Korean.

本周，Myshell发布了一个名为melo TTS的语音合成工具。支持中文在内的多国语言。melo TTS支持CPU直接运行，可以在Linux和Mac系统中使用。点击链接就可以在huggingface上在线尝试该工具：MeloTTS – a Hugging Face Space by mrfakename，选择中文，输入需要播报的文本，即可完成语音合成。

5.贴纸生成器：StickerBaker

stickerbaker是一个免费的贴纸生成平台。输入提示词即可获得对应的贴纸。sticker Baker可以生成具备很强立体感和对比度的贴纸类图像。我在下面尝试生成一张刘震云的帖子，前后对比，大家可以看看效果。

5.Multi Lora Composition：GitHub – maszhongming/Multi-LoRA-Composition: Repository for the Paper “Multi-LoRA Composition for Image Generation”

该项目由微软推出，可以在图像中融合多个Lora，而不改变图像的效果。在使用stable diffusion模型绘图的时候，我们往往会使用融合多个Lora权重的方法改变原图的风格。不过由这种方法生成的图像，往往会和原图有很大的出入。

在使用了Lora switch和Lora composite技术后，则可以完成更加精准和高质量的图像合成。此项技术的发布，可以更出色的完成复杂图像的生成。

三月第一周AI资讯

这篇文章有一个评论

发表回复取消回复

你可能也喜欢

2025年9月第3周AI资讯

7月第三周AI资讯

2026年1月第2周AI资讯

这篇文章有一个评论

发表回复 取消回复

发表回复取消回复