欣淇
发布于 2026-05-18 / 0 阅读
0
0

📱 Mobile MCP:4.9k Stars,让 AI Agent 操控手机和模拟器,一行 npx 搞定 iOS/Android 自动化

📱 Mobile MCP:4.9k Stars,让 AI Agent 操控手机和模拟器,一行 npx 搞定 iOS/Android 自动化

📱 Mobile MCP: 4.9k Stars — AI Agents Control Phones & Simulators, One npx Command for iOS/Android Automation

TL;DR — 开源 MCP 服务器,统一 iOS/Android 模拟器和真机控制,AI Agent 通过结构化无障碍树操作手机,取代截图+坐标的"盲操作"方式。


如果你的 AI Agent 只能操作电脑浏览器,那它只发挥了 50% 的能力——手机才是大多数人每天花最多时间的地方。但让 AI 操作手机一直是难题:截图方案不稳定,需要重训练模型,而且 iOS 和 Android 两套体系。

Mobile MCP 用 MCP 协议统一了这一切。4.9k⭐,TypeScript 写的,npx 一条命令接入 Claude Code、Codex、Cursor 等所有支持 MCP 的 Agent。

# 在 Claude Code 中使用
claude mcp add mobile-mcp -- npx -y @mobilenext/mobile-mcp@latest

# 在 Codex 中使用
codex mcp add mobile-mcp npx "@mobilenext/mobile-mcp@latest"

装上之后,Agent 可以直接用 mobile_list_available_devices 列出设备、mobile_take_screenshot 看屏幕、mobile_click_on_screen_at_coordinates 点击、mobile_type_keys 输入文本——所有操作基于原生无障碍树(Accessibility Tree),而不是猜坐标。


核心能力一览:

功能 说明
平台 iOS 模拟器/真机 + Android 模拟器/真机
交互方式 无障碍树(精确)↔ 截图坐标(兜底)
设备管理 列出/安装/卸载/启动/关闭应用
输入控制 文本输入、按键(HOME/BACK/音量等)
屏幕操作 点击、双击、长按、滑动、截图
连接方式 USB、Wi-Fi、adb

与传统的截图+坐标方案不同,Mobile MCP 优先读取 UI 元素的结构化数据——每台设备上的每个按钮、输入框、列表项都有确定的标签和坐标,AI 不需要"猜"哪里有按钮。


实际场景:

# 让 Agent 在手机上测试注册流程
# Agent 会自动执行:
# 1. 列出可用设备 → 2. 截屏分析 → 3. 点击输入框 → 4. 输入文本 → 5. 点击提交

Mobile MCP 适合:
- 🧪 自动化测试 — 让 AI 替你跑 iOS/Android UI 测试
- 📊 数据采集 — 从手机截取结构化数据
- 🤖 Agent 工作流 — 手机端到电脑端全链路自动化
- 👨‍💻 开发者调试 — 快速操作模拟器,不用手点

内部架构:npx @mobilenext/mobile-mcp → MCP 协议 → 平台适配层(iOS: WebDriverAgent / Android: ADB + UI Automator)→ 真实设备或模拟器。

一句话总结:如果你的 Agent 还不会操作手机,装上 Mobile MCP 就学会了。


项目地址: github.com/mobile-next/mobile-mcp
安装: npx -y @mobilenext/mobile-mcp@latest (Node 18+,需要本地有 Xcode 或 ADB)
License: MIT


评论