阅读全文赞同 1 添加评论分享收藏举报跨页表格不用愁！OCRFlux-3B 一键提取干净文本

你有没有试过从 PDF 里复制一张跨页表格？粘出来后表格被撕成两半，排版乱成一团，本来几分钟的工作瞬间变成半小时的「拼图」大战。

针对这种烦恼，OCRFlux-3B 应运而生。它在 2025 年 6 月由 ChatDOC 团队发布，是一个基于多模态大模型的工具包，能把 PDF 和图片转成干净、可读的 Markdown 文本。不仅支持页面级转换，还能自动合并跨页表格和段落，让复杂文档结构瞬间清爽。

这里上传了一个 2025 年各部门季度的虚拟业绩表格，因不知名信号成了跨页表格，上传 PDF 到 OCRFlux-3B，可以看到模型很快给出了整洁的 Markdown 格式。

使用云平台: OpenBayes

首先点击「公共教程」，在公共教程中找到「OCRFlux-3B：智能文本识别工具包」，单击打开。

页面跳转后，点击右上角的「克隆」，将该教程克隆至自己的容器中。

在当前页面中看到的算力资源均可以在平台一键选择使用。平台会默认选配好原教程所使用的算力资源、镜像版本，不需要再进行手动选择。点击「继续执行」，等待分配资源。

数据和代码都已经同步完成了。容器状态显示为「运行中」后，点击「 API 地址」，即可进入模型界面。

若显示「Bad Gateway」，这表示模型正在初始化，由于模型较大，请等待约 2-3 分钟后刷新页面。

点击「Start VLLM Server」启动服务，当出现「VLLM Server is already running!」，这个项目就可以使用了。

项目提供了 PDF Document、Image Document 和 Multiple Files 三种演示示例。

PDF Document

参数说明

Advanced Settings：
- Target Image Dimension：目标图像尺寸，用于控制生成图像的尺寸。
- Max Page Retries：最大重试次数，用于处理 PDF 页面解析错误。
- Skip Cross-Page Merge：跳过跨页合并，用于处理文档中跨页的内容。

Image Document

Multiple Files