🧠 Khoj:34k Stars 的 AI 第二大脑,自部署 RAG + Agent 全都要
项目地址:khoj-ai/khoj | ⭐ 34,479 Stars | 🛠 Python | AGPL-3.0
老实说,市面上"AI 第二大脑"类的项目没有一百也有八十了。不是要你折腾向量数据库,就是绑定某个特定模型,想加个自定义 Agent?不好意思,不支持。
Khoj 不一样。 一个命令就能跑起来,支持 本地和云端 LLM(llama3、qwen、deepseek、GPT、Claude、Gemini 全兼容),自带 RAG、语义搜索、自定义 Agent、图片生成、语音交互——而且全部开源可自部署。
一、一句话说清楚它能干嘛
Khoj 是一个个人 AI 应用,把 知识管理 和 AI 对话 揉在一起了。你给它喂文档(PDF、Markdown、Notion、Word),它就能基于这些内容回答你。还能自动从网上搜资料、定时做研究、给你发邮件摘要。
最骚的操作是——它跑在你的电脑上,数据不出门。
二、安装:两种姿势,一分钟搞定
Docker(推荐)
docker pull ghcr.io/khoj-ai/khoj
docker run -p 42110:42110 ghcr.io/khoj-ai/khoj
浏览器打开 http://localhost:42110,注册账号就完事。
pip 安装
pip install khoj
khoj
之后同样访问 http://localhost:42110,走一样的流程。
三、接入各种 LLM
Khoj 支持在后台配置多个模型提供商。切模型不需要改代码,网页 UI 里直接选就行:
四、把文档喂给它
上传文档后,Khoj 自动做向量化 + 语义索引。搜索框里输入问题,它先把你的文档搜一遍,再把结果丢给 LLM 生成答案——标准的 RAG 流程,全程开箱即用。
# 支持的文件类型
PDF、Markdown、Org-mode、Notion Export、
Word (.docx)、纯文本、图片(OCR 提取文字)
直接在 Web UI 里拖拽上传就行。如果你用 Obsidian 或 Emacs,还有官方插件可以同步。
五、自定义 Agent + 自动化
你可以在 Khoj 里创建多个 Agent,每个 Agent 可以设置不同的 人设 prompt、专用知识库、底模型,还能独立控制是否启用来联网搜索和图片生成。
# 创建一个研究助手 Agent
# 在 Web UI 中设置:
# - 人设:"你是一个资深技术研究员"
# - 知识库:仅搜索技术文档
# - 模型:Claude 3.5 Sonnet
# - 工具:联网搜索 ✅ 图片生成 ❌
还能设置定时任务——比如每天早上 8 点自动汇总 Hacker News 发到你邮箱。
别问我怎么知道的——踩过的坑:Agent 的 knowledge base 最好先上传文档再创建 Agent,顺序反了要重新关联。
六、客户端选择
总结
标签:#AI #RAG #Agent #SelfHosted #KnowledgeManagement #OpenSource