📱 Mobile MCP:4.9k Stars,让 AI Agent 操控手机和模拟器,一行 npx 搞定 iOS/Android 自动化
📱 Mobile MCP: 4.9k Stars — AI Agents Control Phones & Simulators, One npx Command for iOS/Android Automation
TL;DR — 开源 MCP 服务器,统一 iOS/Android 模拟器和真机控制,AI Agent 通过结构化无障碍树操作手机,取代截图+坐标的"盲操作"方式。
如果你的 AI Agent 只能操作电脑浏览器,那它只发挥了 50% 的能力——手机才是大多数人每天花最多时间的地方。但让 AI 操作手机一直是难题:截图方案不稳定,需要重训练模型,而且 iOS 和 Android 两套体系。
Mobile MCP 用 MCP 协议统一了这一切。4.9k⭐,TypeScript 写的,npx 一条命令接入 Claude Code、Codex、Cursor 等所有支持 MCP 的 Agent。
# 在 Claude Code 中使用
claude mcp add mobile-mcp -- npx -y @mobilenext/mobile-mcp@latest
# 在 Codex 中使用
codex mcp add mobile-mcp npx "@mobilenext/mobile-mcp@latest"
装上之后,Agent 可以直接用 mobile_list_available_devices 列出设备、mobile_take_screenshot 看屏幕、mobile_click_on_screen_at_coordinates 点击、mobile_type_keys 输入文本——所有操作基于原生无障碍树(Accessibility Tree),而不是猜坐标。
核心能力一览:
| 功能 | 说明 |
|---|---|
| 平台 | iOS 模拟器/真机 + Android 模拟器/真机 |
| 交互方式 | 无障碍树(精确)↔ 截图坐标(兜底) |
| 设备管理 | 列出/安装/卸载/启动/关闭应用 |
| 输入控制 | 文本输入、按键(HOME/BACK/音量等) |
| 屏幕操作 | 点击、双击、长按、滑动、截图 |
| 连接方式 | USB、Wi-Fi、adb |
与传统的截图+坐标方案不同,Mobile MCP 优先读取 UI 元素的结构化数据——每台设备上的每个按钮、输入框、列表项都有确定的标签和坐标,AI 不需要"猜"哪里有按钮。
实际场景:
# 让 Agent 在手机上测试注册流程
# Agent 会自动执行:
# 1. 列出可用设备 → 2. 截屏分析 → 3. 点击输入框 → 4. 输入文本 → 5. 点击提交
Mobile MCP 适合:
- 🧪 自动化测试 — 让 AI 替你跑 iOS/Android UI 测试
- 📊 数据采集 — 从手机截取结构化数据
- 🤖 Agent 工作流 — 手机端到电脑端全链路自动化
- 👨💻 开发者调试 — 快速操作模拟器,不用手点
内部架构:npx @mobilenext/mobile-mcp → MCP 协议 → 平台适配层(iOS: WebDriverAgent / Android: ADB + UI Automator)→ 真实设备或模拟器。
一句话总结:如果你的 Agent 还不会操作手机,装上 Mobile MCP 就学会了。
项目地址: github.com/mobile-next/mobile-mcp
安装:npx -y @mobilenext/mobile-mcp@latest(Node 18+,需要本地有 Xcode 或 ADB)
License: MIT