一个基于 OpenAI Whisper Large v3 (https://huggingface.co/openai/whisper-large-v3) 模型的高速音频转文字工具,能够在不到 98 秒的时间内转录 300 分钟(5 小时)音频。
适用于多场景,支持 100 种语言的转录并支持翻译功能,提供按词或片段生成时间戳文本,方便字幕制作。
提供命令列界面(CLI),也可以通过 Whisper API 进行线上语音转文字。
开源地址:https://github.com/Vaibhavs10/insanely-fast-whisper
16Personalities:一个在线人格测试网站
text blind watermark:一个开源文本隐水印嵌入工具