🌐 BrowserOS:10.8k Stars 的开源 AI 浏览器,Chromium 分支,自带 Agent + MCP,比 ChatGPT Atlas 更自由
老实说,现在市面上的"AI 浏览器"不少——ChatGPT Atlas、Perplexity Comet、Dia……但这些东西有个共同毛病:闭源、锁你的数据、不能用自己的 API key。
BrowserOS 不一样。这玩意儿是个开源的 Chromium 分支(AGPL-3.0),10.8k Stars,内置 AI Agent,支持 MCP Server,还能接 Ollama/LM Studio 跑本地模型。你的数据永远不离开你的机器。
核心功能拆解
AI Agent(53+ 浏览器自动化工具):用自然语言指挥浏览器做事情——点链接、填表单、提取数据、翻页。不用写 Puppeteer 脚本,直接说"帮我查一下这个页面里的所有价格"就行。
MCP Server 模式:这是我最喜欢的。把 BrowserOS 当成一个 MCP Server,从 Claude Code、Gemini CLI 或其他 MCP 客户端直接控制浏览器。一句话让 Agent 帮你填表单、截图、执行 JS。
Visual Workflows:可视化图形编辑器构建可重复的浏览器自动化流程。不用写代码,拖拽节点就行。
Cowork(文件 + 浏览器协同):Agent 同时操作浏览器和本地文件——比如在网上查数据,然后自动保存到你的文件夹。不需要额外写胶水代码。
Schedule Tasks:设定定时任务,让 AI Agent 周期性地帮你办事——每天自动抓取竞品价格、每小时检查网站状态。
SOUL.md:一个 Markdown 文件定义 AI 的个性。之前我说过 OpenClaw 的 SOUL.md 机制,BrowserOS 也用了类似的理念——你的 Agent 行为方式完全由你定制。
40+ 应用集成:Gmail、Slack、GitHub、Linear、Notion、Figma、Salesforce……全部通过 MCP 协议接入。
实操:一分钟上手
最骚的是安装过程——下载即用,不需要配环境。
第一步,下载安装:macOS/Linux 一行命令搞定。
curl -fsSL https://cdn.browseros.com/cli/install.sh | bash
Windows 用户用 PowerShell:
irm https://cdn.browseros.com/cli/install.ps1 | iex
或者直接去 GitHub Releases 下载桌面安装包。
第二步,连接 AI Provider:BrowserOS 支持一大堆 LLM——Claude、GPT-4o、Gemini、Kimi K2.5(默认内置)、GitHub Copilot,或者用 Ollama/LM Studio 跑本地模型。
第三步,从终端控制浏览器:
browseros-cli init
browseros-cli agent "帮我查一下今天的 Hacker News 热门文章,保存到 ~/hn_today.md"
第四步,作为 MCP Server 接入 Claude Code:
# 配好之后,在 Claude Code 里直接让它操控浏览器
claude-code "打开 GitHub Trending,找到今天最火的 AI 项目"
它跟别的 AI 浏览器有啥区别?
最大的区别是自由度。Atlas 和 Comet 是"我们帮你做决定"的封闭产品,BrowserOS 是"你想要怎样就怎样"的工具箱。想用哪个模型、数据存哪、加什么功能,全是你说了算。
具体来说:BrowserOS 是开源的,别人闭源;它内置 MCP Server,别人没有;你可以自备 API Key 或跑本地模型,别人让你必须用他们的;它还有可视化工作流和定时任务,别人想都别想。
踩坑注意
第一次启动时 Agent 需要下载模型依赖(如果是 Ollama 模式),耐心等一会。CLI 的 browseros-cli init 必须在 BrowserOS 客户端运行后执行。如果接的是本地 Ollama 模型,复杂任务建议用 qwen2.5:32b 以上级别的模型,小模型指令跟随能力不够。
要点总结
BrowserOS 是开源的 AI 浏览器(Chromium 分支),10.8k Stars,AGPL-3.0 协议
内置 AI Agent(53+ 浏览器工具)、MCP Server、可视化工作流、定时任务
支持自备 API Key 和本地模型(Ollama/LM Studio),数据不离开本地
一句话安装,提供 CLI 和桌面版,可被 Claude Code 直接调用
比 ChatGPT Atlas/Perplexity Comet 更自由、更私密、更可控
There are plenty of "AI browsers" out there—ChatGPT Atlas, Perplexity Comet, Dia. But they all share the same problem: closed source, locked to their ecosystem, and you can't bring your own API keys.
BrowserOS is different. It's an open-source Chromium fork (AGPL-3.0) with 10.8k stars, a built-in AI Agent, MCP Server support, and the ability to run local models via Ollama/LM Studio. Your data never leaves your machine.
Core Features
AI Agent (53+ browser automation tools) — control your browser with natural language. Click links, fill forms, extract data, navigate pages. No Puppeteer scripts needed—just tell it what you want.
MCP Server mode — expose BrowserOS as an MCP server and control it from Claude Code, Gemini CLI, or any MCP client. One command and your coding agent can fill out web forms, take screenshots, or execute JS in the browser.
Visual Workflows — drag-and-drop graph builder for repeatable browser automations. Zero coding required.
Cowork (files + browser) — AI agent operates both the browser and local files simultaneously. Research the web and save results to your folder in one go.
Scheduled Tasks — set up recurring automation. Daily price scraping, hourly site monitoring—the AI runs on autopilot.
SOUL.md — define your AI's personality in a single markdown file. Full control over how your agent behaves.
40+ App Integrations — Gmail, Slack, GitHub, Linear, Notion, Figma, Salesforce—all through MCP protocol.
Get Started in One Minute
Step 1, Install:
# macOS / Linux
curl -fsSL https://cdn.browseros.com/cli/install.sh | bash
# Windows (PowerShell)
irm https://cdn.browseros.com/cli/install.ps1 | iex
Or download the desktop app from GitHub Releases.
Step 2, Connect AI Provider: Supports Claude, GPT-4o, Gemini, Kimi K2.5 (built-in), GitHub Copilot, or local models via Ollama/LM Studio.
Step 3, Control from terminal:
browseros-cli init
browseros-cli agent "Check today's Hacker News top stories and save to ~/hn_today.md"
Step 4, Use as MCP Server with Claude Code:
# After setup, tell Claude Code to control your browser
claude-code "Open GitHub Trending and find the hottest AI project today"
Key Takeaways
BrowserOS is an open-source AI browser (Chromium fork), 10.8k stars, AGPL-3.0
Built-in AI Agent (53+ tools), MCP Server, visual workflows, scheduled tasks
Bring your own API keys or use local models (Ollama/LM Studio)
One-command install with CLI and desktop app
More freedom, privacy, and control vs. ChatGPT Atlas / Perplexity Comet