MinerU 是一款由上海人工智能实验室 OpenDataLab 团队开发的开源高质量数据提取工具,专注于从复杂 PDF 文档、网页和电子书中高效提取内容。它能够将包含图片、公式和表格的多模态 PDF 转化为 Markdown 格式(如 markdown、json),且具备高精度解析工具链,支持多种输入模型,支持自动识别乱码、转换公式为 LaTex、保留文档结构,支持 176 种语言的准确识别,适用于学术、财务、法律等领域,兼容 Windows/Linux/Mac 平台。
开源地址:https://github.com/opendatalab/MinerU
西游记1986版全集 中文+英文 西游记续集2000版
最新搭讪大法:偷心聊法Plus