Parler TTS-开源高质量文本转语音 (TTS) 模型

Parler TTS是一个轻量级的开源高质量文本转语音 (TTS) 模型,可以以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然流畅的语音。它是根据Dan Lyth和Simon King在Stability AI和Edinburgh University发表的论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作进行的复现,与其他TTS模型不同,Parler-TTS是一个完全开源的发布版本,所有的数据集、预处理、训练代码和权重都以宽松的许可证公开发布,感兴趣的同学可以在线体验。

图片[1]-Parler TTS-开源高质量文本转语音 (TTS) 模型 - 阿良工具集-阿良工具集

开源高质量文本转语音 (TTS) 模型

演示地址:https://huggingface.co/spaces/parler-tts/parler_tts_mini

下载地址

 

 

温馨提示:本文最后更新于2024-04-14 23:58:02,某些文章具有时效性,若有错误或已失效,请在下方留言或联系阿良工具集
© 版权声明
THE END
喜欢就支持一下吧
点赞267 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

夸夸
夸夸
还有吗!没看够!
取消
昵称表情代码图片

    暂无评论内容