超强OCR识别,速度快(支持图片,PDF数学公式以及化学符号)MinerU-0.13.1

张开发
2026/4/18 7:26:46 15 分钟阅读

分享文章

超强OCR识别,速度快(支持图片,PDF数学公式以及化学符号)MinerU-0.13.1
MinerUOCR 领域的扛把子先说说 MinerU 这个项目在 OCR 圈子的地位MinerU 由上海人工智能实验室的 OpenDataLab 团队开发最初诞生于 InternLM 大模型的预训练数据处理过程中做过 RAG 的朋友应该都知道文档解析是 RAG 流水线上最关键的一环——你的知识库质量上限就取决于你的文档解析能力而 MinerU 几乎是开源文档解析工具的事实标准全格式覆盖支持 PDF、图片、DOCX 输入输出 Markdown 和 JSON109 种语言的 OCR 支持全平台兼容Windows、Linux、MacCPU/GPU/NPU/MPS 都能跑功能全面自动去除页眉页脚页码、保留文档结构、提取表格公式、处理复杂多栏布局超强OCR识别速度快支持图片PDF数学公式以及化学符号MinerU-0.13.1.rar下载地址百度网盘https://pan.baidu.com/s/1ML_XfpLoV6OcbNUNR6Mlnw?pwdrc7p夸克网盘https://pan.quark.cn/s/7568da373a0b

更多文章