MinerU:完全免费!59k Star 开源神器,一键解析影印版 PDF、表格等复杂布局

Hi,我是 Chris。
你一定遇到过这种麻烦的情况:把双栏排版的 PDF 论文丢给 AI,结果文字左、右栏混在一起,读起来像一锅乱炖;或者提取研报表格时,数字对不齐、公式全乱码。
问题不在 AI 能力,而是你喂的文档问题。 PDF 本质是排版文件,是给人看的,不是给机器读的。要让 AI 真正读懂,你得先把它转换成结构化、机器可读的格式。
今天要推荐的工具就是专门解决这个痛点的免费工具:MinerU。
一、产品介绍
MinerU 是上海人工智能实验室(Shanghai AI Lab)开源的一款文档解析引擎,专注于把复杂文档变成AI能直接用的干净数据,比如 Markdown。
MinerU 支持 PDF、Word、PPT、图片、甚至网页 URL,输出格式是 Markdown 或 JSON。不仅是提取文字,还能”理解”文档的排版结构,哪个是标题、正文、表格、公式,都分得清清楚楚。

2024年7月开源,到现在 GitHub 上已经有 59.1k+ Star 了,一度冲上 GitHub Trending 第一。
官网地址:https://mineru.net
GitHub:https://github.com/opendatalab/MinerU
二、快速上手
MinerU 的使用门槛很低,普通用户和开发者都能找到适合自己的方式。目前支持:
1.网页版
直接访问 MinerU-免费全能的文档解析神器 使用,直接上传文档即可。

2.桌面客户端(推荐)
这也是 Chris 一直在使用的,支持 Windows、macOS、Linux 三平台的客户端。

3.本地部署
适合开发者本地部署使用,显存 8GB 可以跑轻量版,16GB 以上体验更好。也有 Docker 镜像可以用。
通过 pip 安装:
pip install --upgrade pip -i https://mirrors.aliyun.com/pypi/simple
pip install uv -i https://mirrors.aliyun.com/pypi/simple
uv pip install -U "mineru[all]" -i https://mirrors.aliyun.com/pypi/simple
装好后一行命令搞定:
mineru -p <文件或文件夹路径> -o <输出路径>
4.API 接入
开发者也可以通过 API 方式使用,文档地址是 MinerU API 文档 | PDF 解析接口文档。
MinerU 提供两种文档解析 API,满足不同场景需求:
- 🎯 精准解析 API — 需申请 Token,支持单文件/批量、表格/公式/多格式输出
- ⚡ Agent 轻量解析 API — 免登录,IP 限频防滥用,专为 AI Agent 工作流设计
两种模式可以混用,Agent 实时响应走快速版,后台批处理走精准版。

三、核心功能
1. 智能版面分析
MinerU 能自动识别文档中的标题、正文、列表、表格、脚注、图片等不同元素,还能帮你过滤掉页眉、页脚、页码这些干扰信息。

MinerU 的阅读顺序还原能力也很强。面对双栏排版的学术论文,它能按照人类正常的阅读顺序(先左栏再右栏)输出文本,而不是把两栏内容混在一起。这一点对构建知识库特别关键。
2. 表格智能还原
表格解析一直是PDF提取的老大难。很多工具遇到稍微复杂一点的表格就歇菜了,要么把单元格对错位,要么遇到跨页表格直接截断。


MinerU 能处理旋转表格、跨页表格、合并单元格等各种复杂情况,最终输出 CSV、HTML 或 Markdown 格式的结构化表格。
对做 RAG 的同学来说,跨页表格合并这个功能简直是救星,以前一个大表格被切在两页上,向量化检索时上下文直接断裂,现在可以完整还原了。
3. 公式精准识别
数学公式是另一个让人头疼的问题。普通工具根本识别不了公式,即使识别了也是乱码。
MinerU 能把文档中的数学公式识别并转化为标准的 LaTeX 或 MathML 代码。行内公式、复杂的多行公式、嵌套公式,都能搞定。做科研类AI应用或者构建数理知识库的朋友,这个功能应该会很喜欢。

4. 化学文献解析
MinerU 还有一个专业分支叫 MinerU.Chem,能深度解析化学文献,精确提取分子结构图像和化学反应式,实现原子级别的识别与关联。

虽然这个功能对大多数人来说用不太到,但能看出团队在专业领域下了不少功夫。
5. 多格式输出 + 生态集成
输出格式支持 Markdown、JSON、LaTeX,可以直接用在 RAG 和知识库构建里。

生态集成方面,MinerU 原生支持 MCP 协议,可以和 Cursor、Claude Desktop、Dify、Notion、LangChain 等工具对接。还提供了 Agent Skills,在 OpenClaw 等平台上一句话就能触发文档解析。
四、实际使用
说完了功能,聊聊我自己的用法。在平常 Chris 阅读一些文档的时候,主要有 2 种使用方式:
1.构建 AI 知识库
在之前使用一些 AI 知识库工具学习一些资料的时候,最大的痛点就是文档解析质量不行。PDF 里的表格解析成乱码,公式直接丢失,检索出来的内容驴唇不对马嘴。
现在 Chris 的流程是:PDF → MinerU 解析 → Markdown → 添加到 WiseMindAI 学习。
WiseMindAI 是一款本地优先的 AI 学习与知识工作台,帮你把文档、网页和音视频变成可对话、可复习、可分享的长期知识资产。
官方网址:https://wisemindai.app/
使用 Markdown 格式让 AI 生成的总结和回答精准度提升了一个量级。流程演示如下:
- MinerU 解析并导出 Markdown

- 添加到 WiseMindAI 学习,生成总结、AI 提问、生成知识卡片等

MinerU 输出的 Markdown 保留了完整的文档结构,表格是结构化的,公式是 LaTeX 格式的,检索质量好了一大截。
2.使用API 方式
在 WiseMindAI 里面,也使用内置的 MinerU 服务。
首先你可以到 MinerU – 高质量 PDF 文档解析与转换工具 创建一个免费的 API Token,然后在 WiseMindAI 的“文档设置”中,选择文档解析方式为“MinerU 解析”,然后输入这个 API Token 即可。

接下来使用文档总结等功能,都会自动去调用 MinerU 的解析服务,生成准确的总结内容:

写在最后
MinerU 解决的是一个实实在在的痛点:怎么把非结构化的文档,高效地变成AI能用的结构化数据。
当你用 MinerU 搞定“输入”,再配合 WiseMindAI 进行“内化”,这套学习工具组合拳能让你在海量信息面前,真正做到高效学习、精准输出。
