MinerU：完全免费！59k Star 开源神器，一键解析影印版 PDF、表格等复杂布局

发表于： 2026年4月12日 2026年4月12日
分类：未分类

Hi，我是 Chris。

你一定遇到过这种麻烦的情况：把双栏排版的 PDF 论文丢给 AI，结果文字左、右栏混在一起，读起来像一锅乱炖；或者提取研报表格时，数字对不齐、公式全乱码。

问题不在 AI 能力，而是你喂的文档问题。 PDF 本质是排版文件，是给人看的，不是给机器读的。要让 AI 真正读懂，你得先把它转换成结构化、机器可读的格式。

今天要推荐的工具就是专门解决这个痛点的免费工具：MinerU。

一、产品介绍

MinerU 是上海人工智能实验室（Shanghai AI Lab）开源的一款文档解析引擎，专注于把复杂文档变成AI能直接用的干净数据，比如 Markdown。

MinerU 支持 PDF、Word、PPT、图片、甚至网页 URL，输出格式是 Markdown 或 JSON。不仅是提取文字，还能”理解”文档的排版结构，哪个是标题、正文、表格、公式，都分得清清楚楚。

2024年7月开源，到现在 GitHub 上已经有 59.1k+ Star 了，一度冲上 GitHub Trending 第一。

官网地址：https://mineru.net
GitHub：https://github.com/opendatalab/MinerU

二、快速上手

MinerU 的使用门槛很低，普通用户和开发者都能找到适合自己的方式。目前支持：

1.网页版

直接访问 MinerU-免费全能的文档解析神器使用，直接上传文档即可。

2.桌面客户端（推荐）

这也是 Chris 一直在使用的，支持 Windows、macOS、Linux 三平台的客户端。

3.本地部署

适合开发者本地部署使用，显存 8GB 可以跑轻量版，16GB 以上体验更好。也有 Docker 镜像可以用。

通过 pip 安装：

pip install --upgrade pip -i https://mirrors.aliyun.com/pypi/simple
pip install uv -i https://mirrors.aliyun.com/pypi/simple
uv pip install -U "mineru[all]" -i https://mirrors.aliyun.com/pypi/simple

装好后一行命令搞定：

mineru -p <文件或文件夹路径> -o <输出路径>

4.API 接入

开发者也可以通过 API 方式使用，文档地址是 MinerU API 文档 | PDF 解析接口文档。

MinerU 提供两种文档解析 API，满足不同场景需求：

🎯 精准解析 API — 需申请 Token，支持单文件/批量、表格/公式/多格式输出
⚡ Agent 轻量解析 API — 免登录，IP 限频防滥用，专为 AI Agent 工作流设计

两种模式可以混用，Agent 实时响应走快速版，后台批处理走精准版。

三、核心功能

1. 智能版面分析

MinerU 能自动识别文档中的标题、正文、列表、表格、脚注、图片等不同元素，还能帮你过滤掉页眉、页脚、页码这些干扰信息。

MinerU 的阅读顺序还原能力也很强。面对双栏排版的学术论文，它能按照人类正常的阅读顺序（先左栏再右栏）输出文本，而不是把两栏内容混在一起。这一点对构建知识库特别关键。

2. 表格智能还原

表格解析一直是PDF提取的老大难。很多工具遇到稍微复杂一点的表格就歇菜了，要么把单元格对错位，要么遇到跨页表格直接截断。

MinerU 能处理旋转表格、跨页表格、合并单元格等各种复杂情况，最终输出 CSV、HTML 或 Markdown 格式的结构化表格。

对做 RAG 的同学来说，跨页表格合并这个功能简直是救星，以前一个大表格被切在两页上，向量化检索时上下文直接断裂，现在可以完整还原了。

3. 公式精准识别

数学公式是另一个让人头疼的问题。普通工具根本识别不了公式，即使识别了也是乱码。

MinerU 能把文档中的数学公式识别并转化为标准的 LaTeX 或 MathML 代码。行内公式、复杂的多行公式、嵌套公式，都能搞定。做科研类AI应用或者构建数理知识库的朋友，这个功能应该会很喜欢。

4. 化学文献解析

MinerU 还有一个专业分支叫 MinerU.Chem，能深度解析化学文献，精确提取分子结构图像和化学反应式，实现原子级别的识别与关联。

虽然这个功能对大多数人来说用不太到，但能看出团队在专业领域下了不少功夫。

5. 多格式输出 + 生态集成

输出格式支持 Markdown、JSON、LaTeX，可以直接用在 RAG 和知识库构建里。

生态集成方面，MinerU 原生支持 MCP 协议，可以和 Cursor、Claude Desktop、Dify、Notion、LangChain 等工具对接。还提供了 Agent Skills，在 OpenClaw 等平台上一句话就能触发文档解析。

四、实际使用

说完了功能，聊聊我自己的用法。在平常 Chris 阅读一些文档的时候，主要有 2 种使用方式：

1.构建 AI 知识库

在之前使用一些 AI 知识库工具学习一些资料的时候，最大的痛点就是文档解析质量不行。PDF 里的表格解析成乱码，公式直接丢失，检索出来的内容驴唇不对马嘴。

现在 Chris 的流程是：PDF → MinerU 解析 → Markdown → 添加到 WiseMindAI 学习。

WiseMindAI 是一款本地优先的 AI 学习与知识工作台，帮你把文档、网页和音视频变成可对话、可复习、可分享的长期知识资产。
官方网址：https://wisemindai.app/

使用 Markdown 格式让 AI 生成的总结和回答精准度提升了一个量级。流程演示如下：

MinerU 解析并导出 Markdown

添加到 WiseMindAI 学习，生成总结、AI 提问、生成知识卡片等

MinerU 输出的 Markdown 保留了完整的文档结构，表格是结构化的，公式是 LaTeX 格式的，检索质量好了一大截。

2.使用API 方式

在 WiseMindAI 里面，也使用内置的 MinerU 服务。

首先你可以到 MinerU – 高质量 PDF 文档解析与转换工具创建一个免费的 API Token，然后在 WiseMindAI 的“文档设置”中，选择文档解析方式为“MinerU 解析”，然后输入这个 API Token 即可。

接下来使用文档总结等功能，都会自动去调用 MinerU 的解析服务，生成准确的总结内容：

写在最后

MinerU 解决的是一个实实在在的痛点：怎么把非结构化的文档，高效地变成AI能用的结构化数据。

当你用 MinerU 搞定“输入”，再配合 WiseMindAI 进行“内化”，这套学习工具组合拳能让你在海量信息面前，真正做到高效学习、精准输出。

admin

2665