一个基于 Gradio Web-UI 的多功能语音处理工具,集成了语音转录、翻译和文本转语音 TTS 功能。
它支持超过 100 种语言的实时字幕生成、翻译和语音合成,适用于制作多语言视频。
项目使用 OpenAI Whisper 和开源翻译及 TTS 工具,支持 YouTube 下载、音频去噪、批量处理等功能,适合多种音视频格式。安装简单,一键即可使用。
开源地址:https://github.com/abus-aikorea/voice-pro
知轩藏书备份站:知轩藏书资源 Alist 备份站
oneimg:开源纯前端文字转图片工具