不会配环境?Open-AutoGLM图文教程一看就会
你是不是也经常被各种AI项目的复杂部署劝退?明明看到别人演示效果惊艳,轮到自己动手就卡在“环境配置”这一步。今天这篇教程就是为你量身打造的——零基础也能10分钟上手Open-AutoGLM,让AI帮你自动操作手机。
我们不讲术语、不堆参数,只用最直白的语言和一步步截图级指引,带你从零开始完成整个部署流程。哪怕你是第一次听说ADB、没碰过命令行,也能照着做成功。
1. 这是什么?一句话说清楚
Open-AutoGLM 是一个能让AI当你的手机助理的开源框架。你只需要说一句:“打开小红书搜美食”,它就能自动识别屏幕、点击按钮、输入文字,全程无需你动手。
它的核心能力:
- 看得懂手机屏幕(多模态视觉理解)
- 听得懂你说的话(自然语言指令解析)
- 做得出手动操作(通过ADB自动点击/滑动/输入)
而且支持远程控制,手机连WiFi就能跑,特别适合想玩AI自动化又不想折腾GPU的朋友。
2. 准备工作:三件套缺一不可
2.1 你需要准备什么
| 项目 | 要求说明 |
|---|---|
| 电脑一台 | Windows 或 Mac 都行,不需要高性能 |
| 安卓手机一部 | Android 7.0以上,建议开启开发者模式 |
| 数据线一根 | 用于首次USB连接,推荐质量好的线 |
注意:iPhone不支持,目前仅限安卓设备。
2.2 先确认这几件事
- 手机能正常连接电脑并弹出“允许调试”提示
- 电脑已安装Python 3.10或更高版本
- 你能访问GitHub(用于克隆代码)
如果你还没装Python,去官网下载安装包就行,安装时记得勾选“Add to PATH”。
3. 第一步:安装ADB工具(手机的遥控器)
ADB(Android Debug Bridge)就像一个“手机遥控器”,我们的AI要靠它来发指令。
3.1 下载ADB工具包
前往官网下载: https://developer.android.com/tools/releases/platform-tools
选择对应系统的压缩包(Windows选zip,Mac选tar.gz),解压到任意文件夹,比如C:\platform-tools。
3.2 配置环境变量(让命令随处可用)
Windows用户:
- 按下
Win + R,输入sysdm.cpl回车 - 点击“高级” → “环境变量”
- 在“系统变量”里找到
Path,双击编辑 - 点击“新建”,把刚才解压的路径粘贴进去(如
C:\platform-tools) - 确定保存
Mac用户:
打开终端,运行以下命令(注意替换实际路径):
export PATH=${PATH}:~/Downloads/platform-tools你可以把这个命令加到.zshrc文件中,避免每次重启都要重新设置。
3.3 验证是否安装成功
打开命令行(cmd或Terminal),输入:
adb version如果出现类似这样的输出,说明OK了:
Android Debug Bridge version 1.0.414. 第二步:手机端设置(授权AI操控)
现在我们要告诉手机:“允许这台电脑控制我”。
4.1 开启开发者选项
进入手机设置 → 关于手机 → 连续点击“版本号”7次
你会看到提示:“您已进入开发者模式”
不同品牌路径略有差异,也可以直接在设置里搜索“开发者选项”。
4.2 开启USB调试
返回设置主界面 → 开发者选项 → 打开“USB调试”开关
小米/Redmi用户额外注意:还要开启“USB调试(安全设置)”和“USB安装”
4.3 安装ADB Keyboard(关键!解决输入问题)
因为AI不能直接调用普通输入法打字,必须用专用键盘。
下载地址:ADBKeyboard.apk
操作步骤:
- 把APK文件传到手机
- 用文件管理器打开安装
- 安装完成后,进入“语言与输入法”设置
- 将默认输入法切换为ADB Keyboard
成功标志:你在电脑用adb shell input text "hello"能在手机输入框打出文字
5. 第三步:拉取并安装Open-AutoGLM代码
接下来我们在本地电脑上部署控制端代码。
5.1 克隆项目仓库
打开命令行,执行:
git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM如果网络慢,可以用国内镜像加速:
git clone https://ghproxy.com/https://github.com/zai-org/Open-AutoGLM5.2 安装依赖库
推荐使用清华源加快下载速度:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -e .提示:如果没有报错,就是安装成功了!
6. 第四步:连接手机(两种方式任选)
6.1 USB连接(推荐初学者)
用数据线把手机连上电脑 → 手机弹出“允许USB调试?”→ 点击“允许”
然后在命令行输入:
adb devices你应该能看到类似这样的输出:
List of devices attached ABCDEF1234567890 device只要有设备ID和device字样,就表示连接成功。
6.2 WiFi无线连接(进阶用)
优点:断开数据线也能控制,适合长期运行。
操作流程:
- 先用USB连接
- 执行命令开启TCP模式:
adb tcpip 5555- 断开USB,获取手机IP地址(可在WiFi设置里查看)
- 连接无线ADB:
adb connect 192.168.1.100:5555再次运行adb devices,应该还能看到设备在线。
7. 第五步:启动AI代理(真正开始自动化)
终于到了最关键的一步!我们现在要让AI接管手机。
7.1 使用第三方API服务(免GPU,强烈推荐)
你不需要自己部署大模型,直接调用云端API即可。目前支持两个平台:
| 平台 | 模型名 | Base URL |
|---|---|---|
| 智谱BigModel | autoglm-phone | https://open.bigmodel.cn/api/paas/v4 |
| 魔搭ModelScope | ZhipuAI/AutoGLM-Phone-9B | https://api-inference.modelscope.cn/v1 |
如何获取API Key?
以魔搭为例:
- 访问 https://modelscope.cn
- 注册登录后,进入“个人中心”
- 创建一个新的API Token,复制保存
7.2 运行命令启动AI
格式如下:
python main.py \ --device-id <你的设备ID> \ --base-url <API平台URL> \ --model "<模型名称>" \ --apikey "<你的API Key>" \ "你的自然语言指令"实际例子(使用魔搭):
python main.py \ --device-id ABCDEF1234567890 \ --base-url https://api-inference.modelscope.cn/v1 \ --model "ZhipuAI/AutoGLM-Phone-9B" \ --apikey "your_api_key_here" \ "打开抖音搜索抖音号为:dycwo11nt61d 的博主并关注他!"替换说明:
device-id:来自adb devices输出的IDapikey:你自己申请的Token- 最后的字符串:你想让AI做的事,可以自由发挥
8. 看见效果了吗?这是成功的标志
当你运行命令后,如果一切顺利,你会看到:
- 手机屏幕自动亮起
- 应用被打开、页面跳转、文字输入依次发生
- 终端不断输出AI的思考过程,例如:
[INFO] 当前界面分析:检测到抖音首页,底部导航栏包含‘首页’‘朋友’‘消息’... [INFO] 规划动作:点击搜索框 → 输入“dycwo11nt61d” → 点击搜索结果 → 关注按钮 [INFO] 执行动作:点击坐标 (540, 120)恭喜!你的AI助理已经开始工作了!
9. 常见问题与解决方案
9.1 ADB连接失败怎么办?
- 检查USB调试是否开启
- 检查是否点了“允许调试”
- 换根数据线试试(劣质线容易导致通信中断)
- 重启ADB服务:
adb kill-server && adb start-server
9.2 屏幕黑屏/提示“敏感屏幕”错误
错误信息示例:
屏幕被标记为敏感屏幕(黑屏),这可能是由于应用正在加载中或设备安全设置导致的。 根据安全规则,我无法在敏感屏幕上执行任何操作。可能原因:
- 某些银行类App或隐私保护功能会屏蔽截屏
- 应用正在启动动画阶段,画面未完全加载
解决方法:
- 手动等待应用加载完成后再试
- 关闭“防录屏”或“隐私保护”类设置
- 换成其他非敏感App测试(如抖音、微博)
9.3 AI乱码或无响应?
- 检查API Key是否正确
- 确认Base URL拼写无误
- 查看云平台是否有调用次数限制(免费额度用完也会失败)
- 尝试更换指令,避免太复杂的任务
10. 进阶玩法:不只是“打开+搜索”
你以为这只是个“自动点击脚本”?其实它能做的远不止这些:
可尝试的实用场景:
- 自动打卡企业微信/钉钉
- 批量关注指定账号
- 定时刷短视频获取积分
- 辅助老人操作复杂App
- 自动填写表单、提交订单
小技巧:指令越具体越好,比如:
“打开淘宝,搜索‘保温杯’,按销量排序,点击第一个商品,加入购物车”
AI会自动拆解成多个步骤执行。
11. 总结:你已经掌握了AI手机助理的核心技能
通过这篇教程,你应该已经成功实现了:
- ADB环境搭建
- 手机调试授权
- Open-AutoGLM代码部署
- 调用云端API驱动AI操作手机
- 处理常见连接问题
整个过程不需要GPU、不涉及模型训练,完全是“轻量化+高实用性”的组合。
未来你可以进一步探索:
- 结合定时任务实现每日自动签到
- 用Python API封装成自己的小工具
- 接入语音助手实现“动口不动手”
AI自动化的大门,现在已经为你打开了。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。