一个文档解析和提取 API,支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式。
它利用了先进的 OCR 技术和 Ollama 支持的语言模型来实现高精度文本转换和去除敏感信息。
支持离线运行、分布式任务处理、Redis 缓存、CLI 操作工具以及对图片中的表格、数学公式的处理。
开源地址:https://github.com/CatchTheTornado/pdf-extract-api
Python:实用Python脚本合集列表开源项目
3D模型在线预览与转换:提供了一个在线预览和转换3D模型的解决方案