本地语音转文字STT Powered by Faster Whisper

27次阅读
没有评论

软件介绍

最近接到一个需求,需要把录音转换为文字,一看网上几款常用的工具,想不到都是收费的;找了找,发现基本上都需要云端 api,仅有的几个本地的都需要使用 GPU 中的 cuda 计算。因此,开发了这么一款语言转文字的小工具,基于 Faster Whisper 模型,在 cpu 上也能达到不错的效果。

软件截图

本地语音转文字 STT Powered by Faster Whisper

使用方法

双击文件打开,在左上角选择模型,左下角选择推理方式与精度(cpu 推荐 int8,速度更快)。

若没有支持 cuda 的 GPU 请不要选择 GPU,否则会崩溃(原本想导入 pytorch 库判断 cuda_is_available 的,但是这样打出来的包会把一整个 pytorch 一起打包进去,太大了,后来就没这么处理)

首次使用需要下载模型,进度在 console 中可见,请耐心等待。

  文件名称:whisper0.2.exe
  文件大小:252.94MB
  下载声明:本站全部资源来自于网友分享及网络收集整理,若侵犯了您的隐私或版权,请及时联系我们删除有关信息。

正文完
 0
老马
版权声明:本站整理文章,由 老马 于2024-08-19发表,共计531字。
转载说明:本站提供的一切软件、教程、电子书、视频、图片、音乐、文字以及所有内容信息仅供个人学习、研究或欣赏;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网友分享及网络收集整理,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。如果您喜欢相关内容信息,请支持正版,进行购买注册,以得到更好的正版服务。我们非常重视版权问题,如有侵权请邮件与我们联系处理。敬请谅解!侵删请致信E-mail:tntwl@qq.com
评论(没有评论)