阅读全文 赞同 1 添加评论 分享 收藏 举报 跨页表格不用愁!OCRFlux-3B 一键提取干净文本

你有没有试过从 PDF 里复制一张跨页表格?粘出来后表格被撕成两半,排版乱成一团,本来几分钟的工作瞬间变成半小时的「拼图」大战。
针对这种烦恼,OCRFlux-3B 应运而生。它在 2025 年 6 月由 ChatDOC 团队发布,是一个基于多模态大模型的工具包,能把 PDF 和图片转成干净、可读的 Markdown 文本。不仅支持页面级转换,还能自动合并跨页表格和段落,让复杂文档结构瞬间清爽。
这里上传了一个 2025 年各部门季度的虚拟业绩表格,因不知名信号成了跨页表格,上传 PDF 到 OCRFlux-3B,可以看到模型很快给出了整洁的 Markdown 格式。

教程链接:https://go.openbayes.com/VrALD
使用云平台: OpenBayes
首先点击「公共教程」,在公共教程中找到「OCRFlux-3B:智能文本识别工具包」,单击打开。

页面跳转后,点击右上角的「克隆」,将该教程克隆至自己的容器中。

在当前页面中看到的算力资源均可以在平台一键选择使用。平台会默认选配好原教程所使用的算力资源、镜像版本,不需要再进行手动选择。点击「继续执行」,等待分配资源。


数据和代码都已经同步完成了。容器状态显示为「运行中」后,点击「 API 地址」,即可进入模型界面。
若显示「Bad Gateway」,这表示模型正在初始化,由于模型较大,请等待约 2-3 分钟后刷新页面。

点击「Start VLLM Server」启动服务,当出现「VLLM Server is already running!」,这个项目就可以使用了。


项目提供了 PDF Document、Image Document 和 Multiple Files 三种演示示例。
PDF Document

参数说明
- Advanced Settings:
- Target Image Dimension:目标图像尺寸,用于控制生成图像的尺寸。
- Max Page Retries:最大重试次数,用于处理 PDF 页面解析错误。
- Skip Cross-Page Merge:跳过跨页合并,用于处理文档中跨页的内容。
Image Document

Multiple Files
