TTS模型和声音克隆工具-Lovo.Ai

随着Ai技术的进步,TTS模型和声音克隆工具的应用也越来越广泛。尽管市场上有很多相关的软件,其中最知名的就是Lovo.Ai。该平台支持文本转语音声音克隆,视频剪辑功能。选择第一个名为chloe woods的女性播音员,试听一下声音。和其他TTS模型相比,LOVO生成的人声更加自然。完全没有人工合成痕迹。目前已经有来自全球的70万用户和知名企业正在使用LOVO的语音生成服务。此外,LOVO还支持视频编辑,以及图像生成和Ai写作功能。作为行业的标杆,LOVO使用了自然真实的人声,为各个行业的内容创作者提供高质量多语种的专业配音。

LOVO旗下的Genny工具还可以完成实时语音克隆,只需10秒钟的音频样本,就可以完成精确的声音克隆。LOVO的音频生成服务可以应用于广告设计、教育培训、视频制作、电子书配音等多个领域。无论你来自哪个国家都可以在这里找到适合的配音员,以及富有感情的播音风格。

点击主页的Signup选项,使用自己的电子邮箱就可以免费注册一个账号。新注册的用户可以享受14天免费试用期,20分钟的额度以及1GB的存储空间。点击new project我们可以选择创建新的音频或者视频文件,新建一个音频点击左上角的speaker slection, 就会出现很多不同的播音员。Pro-Voice仅限英文,并提供了适合电子书、市场营销、教育培训等场景的播音员,点击播放按钮可以试听一下声音的效果。

Rapid voice选项,则可以选择更多类型的播音员,其中包括童声和成熟的语音。Global Voice则适合非英语国家的用户,其中包含了超过100种语言和方言。以中文为例,其中包含了普通话、粤语、河南、陕西、辽宁等区域方言。

Voice Cloning, 则用于克隆本人的声音或者克隆样本语音。例如,选择一个中文女声播音员,在对话框中输入一段文本,点击播放按钮,试听一下效果。如果想要设计一段对话还可以点击下方的add new block,从列表中选择一个新的播音员,输入文本对白后,点击左侧的select all选项,点击旁边的generate按钮,就可以生成一段对话情节。点击对话框上方的语速,还可以加快或者放缓播报的速度。

按照这个方法,我们可以创建适合不同场景的对话。返回操作页,我们还可以选择新建一个video project。和音频项目不同的是,右侧会多出一个选项,用于放置和预览图像视频素材。首先,在左侧添加准备好的文本内容。例如,两个人的对话,然后点击左侧的resource,搜索用于制作视频的图像视频素材。选择一个素材,点击下方的蓝色按钮,就可以把媒体文件应用到设计中。拉伸素材和音频保持一致,完成视频的剪辑点击播放按钮,预览一下效果。如果不满意还可以随时修改,点击右上角的export按钮,还可以把视频输出到本地。然后点击声音克隆选项,目前Lovo支持上传样本音频或者录音的形式,完成声音克隆。

然后点击下方的Create a Voice按钮,开始克隆声音,该过程会持续1分钟左右。完成后,我们可以点击播放按钮试听一下效果。

不满意的话,可以点击重新克隆。确认无误后,就可以点击右侧的use this voice,分别为这个语音模型选择一个头像名称,并选择播音员的性格、年龄、最后点击右侧的同意条款完成创建。

lovo还为内容创作者提供了ai writer工具,用于完成文案、视频脚本、广告词的一键生成。在左侧添加标题关键字,观众视频类型就可以快速获得一段文本内容,此项功能相当于经过定制的Chatgpt。更有趣的是,lovo还提供了文本转图像功能,以及八种预设风格。从生成的图象可以看出,尽管没有达到专业级的水平,整体效果还是不错的。感兴趣的同学可以在网站上尝试它的所有功能。

发表回复