🔥 Cua:16.4k Stars 的开源 Computer-Use 基础设施,一行命令给 AI Agent 装台电脑
项目地址:github.com/trycua/cua | ⭐ 16,421 | 🛠 Python/HTML/Swift | 📜 MIT | 🏷 computer-use, ai-agent, sandbox
老实说,现在 AI Agent 能写代码、能调 API,但真让它「用电脑」—— 点按钮、拖文件、操作桌面软件——基本抓瞎。传统方案要么用 Playwright/Puppeteer 只能搞浏览器,要么搞 VNC 又慢又卡还抢鼠标键盘。
Cua 直接解决了这个问题:一套开源基础设施,让 AI Agent 像人一样操作完整的桌面系统(macOS / Linux / Windows),而且是后台运行,不抢你鼠标。
🚀 最骚的是 Cua Driver
Cua Driver 是 macOS 上的后台电脑操作引擎。Agent 可以点按、打字、滚动,全程在后台执行,不抢焦點、不占 Space、不干扰你干活。连 Chromium 网页内容和 Canvas 应用(Blender、Figma、游戏引擎)都能操作。
一行命令安装:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/trycua/cua/main/libs/cua-driver/scripts/install.sh)"
装完就能在 CLI 或 MCP Server 里跟 Claude Code、Cursor 配合使用了。每次操作自动录制回放轨迹。
🛠 Cua Sandbox:一句话拉起虚拟机
这是 Cua 的核心。一个 Python SDK,统一 API 操作任何操作系统:
from cua import Sandbox, Image
async with Sandbox.ephemeral(Image.linux()) as sb:
result = await sb.shell.run("echo hello")
screenshot = await sb.screenshot()
await sb.mouse.click(100, 200)
await sb.keyboard.type("Hello from Cua!")
支持 Linux 容器/VM、macOS、Windows、Android,同一套 API。本地 QEMU 跑或者云端都行。
pip install cua
🎮 CuaBot:给任何 Coding Agent 配上桌面操控
装了 CuaBot,Claude Code 和 OpenClaw 这些 Agent 就突然有了「手」:
npx cuabot # 初始化
cuabot claude # Claude Code 在沙箱里跑
cuabot openclaw # OpenClaw 在沙箱里跑
cuabot chromium # 打开浏览器
cuabot --click 100 200 # 点坐标
每个沙箱窗口在桌面上原生显示,H.265 视频流、剪贴板共享、音频,全都有。
🏋️ 避坑指南
2. Python 版本要求:Sandbox SDK 需要 Python ≥ 3.11,低版本会报错
3. 沙箱资源吃紧:跑 macOS VM 建议≥16GB 内存,Linux 容器则 4GB 就够了
💡 总结
pip install cua 一行搞定沙箱 SDK,统一 API 操作 4 个操作系统