F5-TTS：上海交大开源超逼真声音克隆 TTS

65次阅读

没有评论

一款基于流匹配的全非自回归文本到语音转换系统，零样本，支持声音克隆、速度控制、控制语音情感表现、长文本合成、中英文多语言合成，并支持商用。

不需要复杂的设计如持续时间模型、文本编码器和音素对齐，能够快速训练并实现实时因素（RTF）0.15 的推理速度，显著优于当前基于扩散的 TTS 模型。

F5-TTS 在公共的 100K 小时多语言数据集上进行训练，展现出高自然性和表现力的零样本能力、无缝代码切换能力和速度控制效率。

开源地址：https://github.com/SWivid/F5-TTS

正文完

F5-TTS

发表至：值得一看开源项目

2024-10-16

转载说明：本站提供的一切软件、教程、电子书、视频、图片、音乐、文字以及所有内容信息仅供个人学习、研究或欣赏；不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网友分享及网络收集整理，版权争议与本站无关。您必须在下载后的24个小时之内，从您的电脑或手机中彻底删除上述内容。如果您喜欢相关内容信息，请支持正版，进行购买注册，以得到更好的正版服务。我们非常重视版权问题，如有侵权请邮件与我们联系处理。敬请谅解！侵删请致信E-mail：tntwl@qq.com

实时金价：简洁直观的黄金价格查询网站

Dreamina：抖音推出的AI绘画工具，高效，简单，免费

12306spy：开源12306查票工具，找到一张能上车的票

磁力乐v1.01磁力边下边播

Komodo：开源跨服务器软件构建和部署工具