超简单配置:Open-AutoGLM + ADB连接手机全流程详解
1. 引言:让AI替你操作手机,真的这么简单?
你有没有想过,有一天只需要说一句“打开小红书搜美食”,手机就会自动执行所有步骤——解锁、打开App、输入关键词、点击搜索?这不再是科幻电影的桥段,而是Open-AutoGLM正在实现的现实。
Open-AutoGLM 是智谱开源的一款基于视觉语言模型的 AI 手机智能助理框架。它通过多模态理解屏幕内容,结合 ADB(Android Debug Bridge)技术,真正实现了“用自然语言操控手机”。无论是点外卖、查航班,还是批量关注博主,AI都能帮你一键完成。
更关键的是——整个流程完全可本地部署,无需依赖厂商系统,普通用户也能快速上手。
本文将带你从零开始,一步步完成 Open-AutoGLM 的控制端配置,并通过 ADB 实现与真实安卓设备的连接和远程操控。全程小白友好,只要你会插USB线,就能让AI接管你的手机。
2. 核心原理:AI是怎么“看懂”并操作手机的?
在动手之前,先搞清楚这个系统到底是怎么工作的。很多人以为这类AI是直接调用App接口,其实不然——它是“拟人化”操作,就像一个人坐在你旁边看着屏幕帮你点手机。
2.1 三大核心技术模块
| 模块 | 功能说明 |
|---|---|
| 视觉理解模型(VLM) | 每次操作前,AI会截取手机屏幕图像,通过视觉语言模型识别界面上的文字、按钮、图标等元素,理解当前所处页面 |
| 意图解析与任务规划 | 接收到你的自然语言指令后,AI自动拆解成一系列原子操作,比如“打开抖音 → 搜索框输入 → 点击搜索结果 → 关注” |
| ADB自动化执行 | 利用 Android 调试桥(ADB),发送点击、滑动、输入等底层指令,模拟真实触控行为 |
这套机制最大的优势在于:不依赖任何App内部API,适配所有应用。哪怕是一个你刚下载的小众软件,AI也能“边看边学”地操作。
2.2 安全设计:不会乱点,更不会越权
担心AI误操作?系统内置了多重安全机制:
- 敏感操作确认:涉及支付、删除、权限申请等动作时,会暂停并提示用户手动确认
- 人工接管模式:遇到验证码、滑块验证等AI无法处理的情况,可临时接管控制权
- 远程调试保护:WiFi连接需先通过USB授权,防止未经授权的远程访问
所以你可以放心,AI不是“黑进”你的手机,而是在你授权下“帮你点手机”。
3. 环境准备:你需要哪些软硬件?
别被“AI Agent”这个词吓到,实际准备的东西非常基础,家里有台旧手机就能玩。
3.1 硬件要求
- 一台电脑:Windows 或 macOS 均可(推荐至少8GB内存)
- 一部安卓手机或模拟器:Android 7.0以上系统
- 一根USB数据线(用于初始连接)
💡 提示:如果你没有实体机,也可以使用 MuMu、BlueStacks 等安卓模拟器替代,效果一样。
3.2 软件环境
- Python 3.10+:用于运行控制脚本
- Git:克隆项目代码
- ADB 工具包:Android SDK Platform Tools(核心组件)
我们接下来会一步步安装这些工具,不需要提前配置。
4. 手机端设置:开启开发者权限
要让电脑控制手机,必须先在手机上开启调试权限。别紧张,这不是刷机,也不会影响保修。
4.1 开启开发者选项
- 进入手机「设置」→「关于手机」
- 找到「版本号」或「内部版本号」
- 连续点击7次,直到提示“您已进入开发者模式”
4.2 启用USB调试
- 返回设置主界面,进入「开发者选项」
- 找到「USB调试」并开启
- 当手机连接电脑时,若弹出“允许USB调试?”对话框,请点击“允许”
⚠️ 注意:不同品牌手机路径略有差异,如华为在“系统和更新”中,小米在“更多设置”里。
4.3 安装 ADB Keyboard(重要!)
这是个神奇的小工具,能让AI在需要输入文字时,通过ADB发送字符,而不是靠模拟点击键盘。
- 下载 ADB Keyboard APK(GitHub开源项目)
- 安装到手机
- 进入「语言与输入法」设置
- 将默认输入法切换为ADB Keyboard
这样,当AI需要搜索“美食”时,可以直接发送文本,避免因虚拟键盘遮挡界面导致操作失败。
5. 配置电脑端:安装控制程序
现在轮到电脑出场了。我们将部署 Open-AutoGLM 的本地控制端,它是连接AI大脑和手机手脚的“神经中枢”。
5.1 安装 ADB 工具
Windows 用户:
- 下载 Platform Tools
- 解压到任意目录,例如
C:\platform-tools - 添加到系统环境变量:
Win + R输入sysdm.cpl- 点击「高级」→「环境变量」
- 在「系统变量」中找到
Path,点击编辑 → 新建 → 添加解压路径
- 打开命令行,输入:
adb version如果显示版本信息,说明安装成功。
macOS 用户:
打开终端,执行以下命令(假设文件解压在 Downloads 目录):
export PATH=${PATH}:~/Downloads/platform-tools建议将这行加入.zshrc或.bash_profile文件,避免每次重启都要重新设置。
5.2 克隆并安装 Open-AutoGLM
打开终端或命令行,依次执行:
# 克隆项目代码 git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM # 创建虚拟环境(推荐) python -m venv venv source venv/bin/activate # Linux/macOS # 或 venv\Scripts\activate # Windows # 安装依赖 pip install -r requirements.txt pip install -e .✅ 成功标志:没有报错,且能正常导入
phone_agent模块。
6. 连接设备:USB or WiFi?两种方式任选
设备连接是关键一步。你可以选择即插即用的 USB 模式,或者更自由的 WiFi 远程模式。
6.1 USB 连接(推荐初学者)
- 用数据线将手机连上电脑
- 手机弹出“允许USB调试?”时,勾选“始终允许”并确认
- 在终端运行:
adb devices输出应类似:
List of devices attached ABCDEF1234567890 device只要有device字样,就表示连接成功。
6.2 WiFi 远程连接(摆脱线缆束缚)
想让AI隔着房间控制手机?WiFi模式可以做到。
第一步:先用USB开启TCP/IP调试
adb tcpip 5555这条命令会让手机监听5555端口的ADB连接。
第二步:断开USB,改用IP连接
确保手机和电脑在同一WiFi下,查看手机IP地址(一般在「设置-网络-WiFi详情」中),然后执行:
adb connect 192.168.x.x:5555替换x.x为你的手机实际IP。
再次运行adb devices,应该能看到设备以 IP 形式列出。
🔍 小技巧:可以用
adb shell ifconfig wlan0查看手机IP(需已连接ADB)。
7. 启动AI代理:一句话让手机动起来
终于到了最激动人心的时刻——让AI接管手机!
7.1 命令行快速体验
在项目根目录下运行:
python main.py \ --device-id ABCDEF1234567890 \ --base-url http://your-server-ip:8800/v1 \ --model "autoglm-phone-9b" \ "打开抖音搜索抖音号为:dycwo11nt61d 的博主并关注他!"参数说明:
| 参数 | 说明 |
|---|---|
--device-id | 从adb devices获取的设备ID |
--base-url | 云端AI服务的地址(需提前部署vLLM服务) |
--model | 指定使用的模型名称 |
| 最后的字符串 | 你的自然语言指令 |
📌 注意:
base-url指向的是运行视觉语言模型的服务端,通常需要在GPU服务器上部署 GLM-4.5V 或 autoglm-phone-9b 模型。
7.2 Python API 方式(适合集成开发)
如果你想把这项能力嵌入自己的应用,可以用API方式调用:
from phone_agent.adb import ADBConnection, list_devices # 初始化连接管理器 conn = ADBConnection() # 连接设备(支持ID或IP) success, msg = conn.connect("ABCDEF1234567890") print(f"连接状态: {msg}") # 获取设备列表 devices = list_devices() for d in devices: print(f"设备: {d.device_id}, 类型: {d.connection_type}") # 获取设备IP(用于后续无线连接) ip = conn.get_device_ip() print(f"当前IP: {ip}") # 断开连接 conn.disconnect("ABCDEF1234567890")这种方式更适合做批量控制或多设备调度。
8. 常见问题与解决方案
即使一切按步骤来,也可能遇到一些小问题。以下是高频故障排查指南。
8.1 设备未识别(adb devices 显示 offline)
- 原因:手机未授权或驱动问题
- 解决:
- 重新插拔USB线
- 检查是否点了“允许USB调试”
- Windows用户尝试安装手机厂商官方驱动(如华为HiSuite、小米助手)
8.2 ADB连接频繁断开
- 原因:WiFi信号不稳定或省电策略干扰
- 解决:
- 将手机设置为“不锁定屏幕”或关闭自动休眠
- 使用USB连接更稳定
- 在开发者选项中关闭“USB调试超时”
8.3 AI无响应或乱码输出
- 原因:模型服务异常或参数不匹配
- 解决:
- 检查
base-url是否可达(可用浏览器访问测试) - 确认vLLM启动时设置了正确的
max-model-len和显存分配 - 查看服务端日志是否有OOM(内存溢出)错误
- 检查
8.4 输入中文失败
- 原因:ADB Keyboard未设为默认输入法
- 解决:
- 进入「语言与输入法」→「默认输入法」→ 选择 ADB Keyboard
- 可尝试重启手机后重试
9. 总结:你的手机,从此有了“数字分身”
通过本文的详细配置,你应该已经成功让 Open-AutoGLM 接管了你的安卓设备。从开启开发者模式,到部署控制端,再到下达第一条自然语言指令——每一步都不复杂,但组合起来却开启了全新的交互范式。
这不是简单的自动化脚本,而是一个能“看”、能“想”、能“做”的AI代理。它打破了传统RPA只能固定流程的局限,真正实现了“像人一样操作手机”。
未来,这种能力可以延伸到:
- 自动填写表单、抢票、签到
- 为老年人提供语音操控助手
- 在客服场景中自动回复消息
- 结合OCR实现跨App信息提取
更重要的是,这一切都建立在开源、可控、可审计的基础上。你不必依赖某个大厂的封闭生态,就能拥有属于自己的AI助理。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。