腾讯开源:文档理解 RAG 框架
腾讯开源:文档理解 RAG 框架 ,可以用来做个人/企业知识库建设 | WeKnora,新项目,已获 711⭐,具备多模态解析、向量化索引、RAG 生成三大核心能力,直接对接本地模型或主流 API。
1. 架构采用模块化流水线:文档解析 → 嵌入生成 → 多策略检索(BM25、Dense、GraphRAG) → 大模型推理,所有组件均可独立配置、热插拔。
2. 功能模块覆盖 PDF/Word/图片(含 OCR)解析、支持本地或 BGE/GTE 等嵌入模型、向量库兼容 pgvector 与 Elasticsearch、可接入 Qwen、DeepSeek 等大模型,并提供 Web UI + RESTful API。
3. 场景聚焦企业知识管理、科研文献、技术支持、合规审查、医疗辅助等,零代码上传即能在微信生态中提供即时问答,支持本地或私有云部署,数据完全自主可控。
上手非常简单:Docker 环境下运行 start_all.sh,即可得到本地 Web 界面和 API,几分钟即可完成文档上传、索引构建和问答测试。若需扩展,只需在 config 中替换嵌入模型或向量库,即可在已有流水线上添加新策略,满足不同业务需求。