一个开源 OCR 工具,能够处理超过 90 种语言的文本识别,支持图像和 PDF 格式文档的文字提取、布局分析以及行检测。
支持批量处理,并针对 GPU 优化,能够提高处理效率,还提供了交互式界面让用户更方便地测试功能。
Surya 的主要功能包括识别文档中的文本行、标题、图像、页眉等元素,并通过 JSON 格式输出结果。
开源地址:https://github.com/VikParuchuri/surya
DigVPS:一个专注于 VPS 测评的网站
VirtualWife:支持B站直播的虚拟数字人开源项目