欣淇
发布于 2026-05-13 / 0 阅读
0
0

🔥 Cua:16.4k Stars 的开源 Computer-Use 基础设施,一行命令给 AI Agent 装台电脑

🔥 Cua:16.4k Stars 的开源 Computer-Use 基础设施,一行命令给 AI Agent 装台电脑

项目地址:github.com/trycua/cua | ⭐ 16,421 | 🛠 Python/HTML/Swift | 📜 MIT | 🏷 computer-use, ai-agent, sandbox


老实说,现在 AI Agent 能写代码、能调 API,但真让它「用电脑」—— 点按钮、拖文件、操作桌面软件——基本抓瞎。传统方案要么用 Playwright/Puppeteer 只能搞浏览器,要么搞 VNC 又慢又卡还抢鼠标键盘。

Cua 直接解决了这个问题:一套开源基础设施,让 AI Agent 像人一样操作完整的桌面系统(macOS / Linux / Windows),而且是后台运行,不抢你鼠标。

🚀 最骚的是 Cua Driver

Cua Driver 是 macOS 上的后台电脑操作引擎。Agent 可以点按、打字、滚动,全程在后台执行,不抢焦點、不占 Space、不干扰你干活。连 Chromium 网页内容和 Canvas 应用(Blender、Figma、游戏引擎)都能操作。

一行命令安装:

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/trycua/cua/main/libs/cua-driver/scripts/install.sh)"

装完就能在 CLI 或 MCP Server 里跟 Claude Code、Cursor 配合使用了。每次操作自动录制回放轨迹。

🛠 Cua Sandbox:一句话拉起虚拟机

这是 Cua 的核心。一个 Python SDK,统一 API 操作任何操作系统:

from cua import Sandbox, Image

async with Sandbox.ephemeral(Image.linux()) as sb:
    result = await sb.shell.run("echo hello")
    screenshot = await sb.screenshot()
    await sb.mouse.click(100, 200)
    await sb.keyboard.type("Hello from Cua!")

支持 Linux 容器/VM、macOS、Windows、Android,同一套 API。本地 QEMU 跑或者云端都行。

pip install cua

🎮 CuaBot:给任何 Coding Agent 配上桌面操控

装了 CuaBot,Claude Code 和 OpenClaw 这些 Agent 就突然有了「手」:

npx cuabot                 # 初始化
cuabot claude              # Claude Code 在沙箱里跑
cuabot openclaw            # OpenClaw 在沙箱里跑
cuabot chromium            # 打开浏览器
cuabot --click 100 200     # 点坐标

每个沙箱窗口在桌面上原生显示,H.265 视频流、剪贴板共享、音频,全都有。

🏋️ 避坑指南

  • Cua Driver 仅 macOS:后台桌面操控目前只支持 macOS,Windows/Linux 还在路上
  • 2. Python 版本要求:Sandbox SDK 需要 Python ≥ 3.11,低版本会报错

    3. 沙箱资源吃紧:跑 macOS VM 建议≥16GB 内存,Linux 容器则 4GB 就够了

    💡 总结

  • pip install cua 一行搞定沙箱 SDK,统一 API 操作 4 个操作系统
  • Cua Driver 让 Agent 在 macOS 后台操作桌面,不抢鼠标键盘
  • CuaBot 一行命令给 Claude Code / OpenClaw 加上「手」
  • 16.4k Stars,MIT License,社区活跃,文档齐全

  • 评论