📄 RAGFlow:80k Stars 的开源 RAG 引擎,Docker 一键部署让 LLM 上下文质量提升 10 倍 / RAGFlow: 80k Stars Open-Source RAG Engine — One Docker Command, 10x Better LLM Context
RAGFlow 是一个开源的检索增强生成(RAG)引擎,融合了 AI Agent 能力,给 LLM 提供高质量的上下文层。80k Stars,Apache-2.0 协议,Docker 部署,支持 DeepSeek v4、Gemini 3 Pro、GPT-5 等所有主流模型。
RAGFlow is an open-source RAG engine that fuses Agent capabilities into a powerful context layer for LLMs. 80k Stars, Apache-2.0, one Docker command to deploy, supporting DeepSeek v4, Gemini 3 Pro, GPT-5, and every major model.
这玩意儿解决什么问题? / What problem does it solve?
RAG(检索增强生成)的原理很简单:把文档切成块存起来,用户提问时搜相关块喂给 LLM。但落地时全是坑:
- PDF/Word/PPT 解析完格式全乱
- 分块策略一刀切,该连的断了,该断的连了
- 检索召回率惨不忍睹
- Agent 集成要自己手搓
RAGFlow 把这些全部打包好,一条命令跑起来。
The idea is simple: chunk your docs, search them when users ask, feed the LLM. But in practice:
- PDF/Word parsing destroys formatting
- Chunking is one-size-fits-all
- Retrieval recall is terrible
- Agent integration is DIY
RAGFlow packages everything into one Docker command.
5 分钟上手 / 5-Minute Setup
# 1. 确保系统配置
sudo sysctl -w vm.max_map_count=262144
# 2. 克隆并启动
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
docker compose -f docker-compose.yml up -d
# 3. 查看启动日志
docker logs -f docker-ragflow-cpu-1
# 看到 ASCII art 的 RAGFlow logo 就说明好了
浏览器打开 http://你的IP,配置 LLM 的 API Key,上传文档,开始问答。
核心能力 / Key Features
🧠 深度文档理解 / Deep Document Understanding
不是简单的 OCR——RAGFlow 的 DeepDoc 引擎能理解 PDF 里的表格、标题层级、页眉页脚,提取结构化信息。支持 Word、PPT、Excel、扫描件、图片、网页等所有格式。
🎯 模板化分块 / Template-Based Chunking
不同文档用不同分块策略:技术文档按章节分,合同按条款分,财报按表格分。可视化预览,不满意手动调。
🔗 可溯源引用 / Grounded Citations
每个回答后面都跟着来源高亮,点哪段看原文。幻觉率肉眼可见地下降。
🤖 Agent 集成 / Agent Integration
MCP 协议支持 + OpenClaw 官方 Skill,你的 Agent 可以直接查 RAGFlow 的知识库。
# OpenClaw 上用 RAGFlow Skill
claw run "从 RAGFlow 查询最新的技术文档"
📊 多数据源同步 / Heterogeneous Data Sync
支持从 Confluence、Notion、S3、Google Drive、Discord 自动同步数据。
架构一览 / Architecture
User → LLM ← RAGFlow Context Engine
├── DeepDoc Parser (PDF/Word/PPT/...)
├── Template Chunker
├── Multi-Recall Retriever
├── Re-ranking
└── Agent MCP Interface
底层存储可选 Elasticsearch 或 Infinity(自研向量引擎),支持 GPU 加速文档解析。
谁在用 / Who's using it?
RAGFlow 从 2023 年底开源到现在 80k Stars,已经有大量企业部署在生产环境:
- 企业内部知识库问答
- 客服系统
- 技术文档检索
- Agent 知识增强
Cloud 版本免费体验:https://cloud.ragflow.io
一句话总结:如果你的 LLM 应用需要跟自己的文档/数据对话,先用 RAGFlow 搭个上下文层——5 分钟部署,0 个破防时刻。
Bottom line: If your LLM app needs to talk to your docs, drop RAGFlow in. 5-minute deploy, zero frustration.