Umi-OCR 图片转文字是一款批量对本地图片文件进行离线 OCR 文字识别工具。
软件特点
支持生成内联图片的 Markdown 文件
支持 win10 x64
能批量识别普通图片,支持忽略指定区域功能
输出到软件面板或本地 txt 文件 /md 文件
无需联网
可用于批量识别视频截图时排除右上角水印的干扰,批量识别游戏截图时排除 UI 与按钮的干扰,让识别结果只留下所需的文本
注意事项
软件是本地图片文件处理工具,没有实时屏幕截图识别的功能
不建议使用 win7,核心 c ++ 模块 PaddleOCR-json 基本无法运行
如果想尝试,win7 x64 sp1 打满系统升级补丁 + 安装 vc 运行库后有小概率能跑起来
打开忽略区域设置窗口,拖入任一张截图,会显示出图片,识别到的文字区域会被虚线框起来。右上角的水印也会被识别到,点击选择 + 忽略区域 1,鼠标按住,绘制矩形完全包裹住水印区域,范围可以大一些,点击 完成。返回主窗口,开始任务即可。
软件特点
免费:本项目所有代码开源,完全免费。
方便:解压即用,离线运行,无需网络。
批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线 OCR 服务更快。
精准:默认使用 PPOCR-v3 模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。
更新日志
V2.1.2 主要更新
新增:批量任务(图片、文档)支持 暂停任务。只要不退出软件,在待机 / 休眠后可以恢复任务。
新增:文档任务支持保存为 单层纯文本 PDF。
新增:HTTP OCR 接口 允许设置 忽略区域 参数。
新增:HTTP 二维码接口 允许设置 图像预处理 参数。
新增:命令行 –screenshot 允许 指定屏幕范围,自动进行截图。
修复:文档内容提取和写入时的坐标旋转、比例适配问题。
优化:批量文档标签页,拖入大量文件、提交大批任务时的性能和流畅度。
优化:文档任务保存的文件名规则。
UI:优化一些布局,调整一些文本,美化一些视觉效果。
GitHub:https://github.com/hiroi-sora/Umi-OCR/releases/latest