三月第一周AI资讯
  • Post author:
  • Post category:AI
  • Post comments:0评论

今天为大家分享一下近期重要的人工智能新闻:

1.Mistral large:Au Large | Mistral AI | Frontier AI in your hands

2月26日Mistral推出了Mistral large,这也是该公司旗下最强大的语言模型。Mistral large具备很强的推理、数学和编程能力。在基准测试中完胜cloud 2和Gemini Pro模型。得分已经接近世界最强的GPT4模型。

Mistral作为一个小型人工智能公司,却在近年来发展迅速,证明了欧洲的AI研发能力。

功能方面,Mistrow large具备32K TOKEN的上下文能力,且支持欧洲的主流语言。开发者还可以轻松设置审核策略,在微软Asher和本地部署该模型。

在推理能力测试中,Mistral large已经全面超越GPT 3.5模型。多语言能力,则完胜Meta旗下的Lama 70B模型。目前该模型,已经可以在Mistral的law platform平台,以及微软Asher中调用。

2.Sora新功能

Sora模型发布了一段新视频。在新视频里,Sora现状不但能够把当前的图像动态化,还可以延伸画面,生成新的场景。期待Sora模型带给人们新的更多惊喜。

3.Runway更新:https://app.runwayml.com/

为了应对Sora带来的冲击,Runway也在本周完成了更新。Multi motion brush功能,不再需要手动选择区域。Runway 提供了类似PS的自动区域识别功能,帮助用户快速选定需要动态化的区域。登录到Runway,上传一张参考图,点击下方的motion brush选项,选择一个笔刷,系统就会自动识别区域,非常方便。

例如:我使用不同的笔刷选定这只龙的不同部位,点击生成视频。

该功能,可以进一步简化区域选择的流程,让视频生成变得更加便捷。

此外Pika也在本周宣布,集成Eleven lips提供的口型匹配功能,并向高级用户开放。

另外一个视频生成平台Domo也推出了Fusion style V1模型,支持改变参考视频的风格和人物的形象。

4.melo TTS:GitHub – myshell-ai/MeloTTS: High-quality multi-lingual text-to-speech library by MyShell.ai. Support English, Spanish, French, Chinese, Japanese and Korean.

本周,Myshell发布了一个名为melo TTS的语音合成工具。支持中文在内的多国语言。melo TTS支持CPU直接运行,可以在Linux和Mac系统中使用。点击链接就可以在huggingface上在线尝试该工具:MeloTTS – a Hugging Face Space by mrfakename,选择中文,输入需要播报的文本,即可完成语音合成。

5.贴纸生成器:StickerBaker

stickerbaker是一个免费的贴纸生成平台。输入提示词即可获得对应的贴纸。sticker Baker可以生成具备很强立体感和对比度的贴纸类图像。我在下面尝试生成一张刘震云的帖子,前后对比,大家可以看看效果。

5.Multi Lora Composition:GitHub – maszhongming/Multi-LoRA-Composition: Repository for the Paper “Multi-LoRA Composition for Image Generation”

该项目由微软推出,可以在图像中融合多个Lora,而不改变图像的效果。在使用stable diffusion模型绘图的时候,我们往往会使用融合多个Lora权重的方法改变原图的风格。不过由这种方法生成的图像,往往会和原图有很大的出入。

在使用了Lora switch和Lora composite技术后,则可以完成更加精准和高质量的图像合成。此项技术的发布,可以更出色的完成复杂图像的生成。

发表回复