不用写代码!Open-AutoGLM实现自动点赞收藏
你有没有想过,有一天只需要动动嘴说一句话,手机就能自己完成一系列操作?比如:“打开小红书,找到那条关于露营的笔记,点赞并收藏”。听起来像科幻片?其实现在就能做到——用Open-AutoGLM,一个由智谱开源的手机端 AI Agent 框架。
更关键的是:你不需要写一行代码。只要会说话,就能让 AI 替你操作手机,自动完成点击、滑动、输入、关注、点赞、收藏等任务。本文将带你从零开始,一步步部署并使用 Open-AutoGLM,真正实现“动口不动手”的智能体验。
1. 这是什么?为什么值得你试试
1.1 一句话讲清楚它能做什么
想象一下这些场景:
- 想批量给某个话题下的抖音视频点赞?只需说一句:“打开抖音,搜索‘治愈系猫咪’,给前10个视频点赞。”
- 想在小红书收藏所有“北京周末好去处”的笔记?告诉 AI:“搜这个关键词,把每一篇都点开收藏。”
- 想每天自动登录某 App 领积分?设置一次指令,让它每天早上 8 点自动执行。
这些原本需要手动重复的操作,现在都可以交给Open-AutoGLM来完成。
1.2 它是怎么做到的?
Open-AutoGLM 的核心技术是“视觉语言模型 + ADB 自动化控制”:
- 看懂屏幕:通过截图获取当前手机界面,利用多模态大模型理解屏幕上有什么(文字、按钮、图片)。
- 听懂指令:你用自然语言下达任务,比如“点赞并关注”,AI 能解析出你的意图。
- 规划动作:结合当前界面状态和目标,AI 自动规划下一步该点击哪里、滑动到哪一页。
- 执行操作:通过 ADB(Android Debug Bridge)向手机发送模拟点击、滑动、输入等命令。
整个过程就像有个“数字分身”在替你玩手机。
1.3 和普通自动化脚本比,强在哪?
| 对比项 | 传统自动化工具(如 Auto.js) | Open-AutoGLM |
|---|---|---|
| 是否需要编程 | 需要写 JavaScript 脚本 | 完全不用写代码 |
| 灵活性 | 固定流程,换页面就失效 | 动态识别界面,适应变化 |
| 易用性 | 学习成本高 | 只需输入一句话指令 |
| 维护成本 | 页面改版就得重写脚本 | 自主理解新布局 |
所以,如果你不想学编程,又想让手机“自己干活”,Open-AutoGLM 是目前最接近“傻瓜式 AI 助理”的方案。
2. 准备工作:软硬件与环境配置
要让 Open-AutoGLM 正常运行,你需要准备以下几样东西:
2.1 硬件要求
- 一台电脑:Windows 或 macOS 均可(推荐 Windows,兼容性更好)
- 一部安卓手机:Android 7.0 以上系统,支持 USB 调试
- 一根数据线:建议使用高质量的数据线(尤其是小米用户,劣质线容易导致 ADB 断连)
提示:也可以使用安卓模拟器(如 MuMu、BlueStacks),但部分模拟器可能不支持 ADB 输入法,需自行测试。
2.2 软件依赖
- Python 3.10+
- ADB 工具包
- Git
我们接下来会逐一安装。
3. 手机端设置:开启调试权限
为了让电脑能控制手机,必须先开启开发者权限。
3.1 开启开发者模式
进入手机「设置」→「关于手机」→ 连续点击“版本号”7~10 次,直到提示“您已进入开发者模式”。
不同品牌路径略有差异,可在设置中直接搜索“开发者选项”。
3.2 启用 USB 调试
返回设置主界面 →「开发者选项」→ 找到并勾选:
- USB 调试
- USB 安装(部分小米/红米机型还需开启“USB 调试(安全设置)”)
此时用数据线连接电脑,手机可能会弹出“允许 USB 调试?”的提示,务必点击“允许”。
3.3 安装 ADB Keyboard(关键步骤!)
这是实现远程输入的核心组件。
- 下载 APK 文件:ADBKeyboard.apk
- 将文件传到手机并安装(可通过 USB 文件传输或微信发送)
- 安装完成后,进入「设置」→「语言与输入法」→「默认键盘」→ 切换为ADB Keyboard
验证是否成功:断开数据线,在电脑命令行输入
adb shell input text "Hello",如果手机任意输入框出现“Hello”,说明配置成功。
4. 本地控制端部署:安装 Open-AutoGLM
现在回到电脑,开始部署本地控制程序。
4.1 安装 ADB 工具
前往 Android 开发者官网 下载 platform-tools。
解压后,将其路径添加到系统环境变量:
Windows 设置方法:
- Win + R 输入
sysdm.cpl→ 高级 → 环境变量 - 在“系统变量”中找到
Path→ 编辑 → 新建 → 添加 ADB 解压目录(如C:\platform-tools) - 打开新的 CMD 窗口,输入
adb version,若显示版本信息则成功
macOS 设置方法:
在终端执行:
export PATH=${PATH}:~/Downloads/platform-tools(假设你把 ADB 放在 Downloads 文件夹)
4.2 克隆项目并安装依赖
打开命令行工具,执行以下命令:
# 克隆仓库 git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM # 安装依赖(推荐使用清华源加速) pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt # 安装 phone_agent 包 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -e .若无报错,表示安装成功。
5. 连接设备:USB 与 WiFi 两种方式
确保手机已通过 USB 连接电脑,并在手机上确认允许调试。
5.1 检查设备连接状态
在命令行输入:
adb devices正常输出应类似:
List of devices attached ABCDEF1234567890 device如果有unauthorized字样,请检查手机是否点了“允许”。
5.2 使用 WiFi 进行无线控制(推荐)
摆脱数据线束缚,实现远程操控。
第一步:先用 USB 连接,启动 TCP/IP 模式
adb tcpip 5555第二步:拔掉数据线,用 IP 地址连接
adb connect 192.168.x.x:5555(x.x 替换为手机的真实局域网 IP,可在 WLAN 设置中查看)
再次运行adb devices,应能看到设备以 IP 形式连接。
6. 接入 AI 模型:选择你的“大脑”
Open-AutoGLM 本身只是一个框架,真正的“智能”来自背后的 AI 模型。你可以选择两种方式接入:
6.1 方案 A:使用第三方 API(推荐新手)
无需 GPU,注册即可使用,适合绝大多数人。
推荐平台一:ModelScope(魔搭社区)
- 访问地址:https://modelscope.cn
- 注册账号 → 进入个人中心 → 创建 API Token
- 模型名称:
ZhipuAI/AutoGLM-Phone-9B - Base URL:
https://api-inference.modelscope.cn/v1
推荐平台二:智谱 BigModel
- 访问地址:https://open.bigmodel.cn
- 注册后申请 API Key
- 模型名称:
autoglm-phone - Base URL:
https://open.bigmodel.cn/api/paas/v4
优点:免部署、免显卡、响应快
💰 成本:大部分平台提供免费额度,超出后按调用量计费
6.2 方案 B:本地部署模型(高级用户)
适合有高性能 GPU(建议 24GB 显存以上)的开发者。
需要:
- 下载约 20GB 的模型文件
- 安装 vLLM 或 SGLang 推理引擎
- 自行搭建服务并映射端口
具体步骤详见官方文档,本文不展开。
7. 实战演示:一句话实现自动点赞收藏
终于到了最激动人心的环节——让 AI 替你操作手机!
7.1 示例任务:自动点赞并关注抖音博主
假设你想关注一个 ID 为dycwo11nt61d的抖音用户,并点赞其最新视频。
只需在命令行运行:
python main.py \ --device-id 192.168.x.x:5555 \ --base-url https://api-inference.modelscope.cn/v1 \ --model "ZhipuAI/AutoGLM-Phone-9B" \ --apikey "your-modelscope-api-key" \ "打开抖音搜索抖音号为:dycwo11nt61d 的博主并关注他,然后点赞他的最新一条视频!"参数说明:
--device-id:你的手机设备 ID 或 IP:5555--base-url:API 服务商提供的接口地址--model:使用的模型名--apikey:你在平台申请的密钥- 最后的字符串:你的自然语言指令
7.2 观察执行过程
运行后你会看到:
- 程序自动截取手机屏幕
- AI 分析当前界面内容
- 规划操作路径(打开抖音 → 点击搜索框 → 输入账号 → 进入主页 → 点击关注 → 找到最新视频 → 点赞)
- 通过 ADB 发送指令,手机同步执行动作
整个过程无需人工干预,就像有人在替你操作手机。
7.3 更多实用指令示例
你可以尝试这些任务:
“打开小红书,搜索‘减脂餐食谱’,把前五篇笔记全部收藏” “打开微博,找到昨天发布的关于杭州天气的帖子,转发并评论‘太准了’” “打开淘宝,进入我的订单页,把三个月前的待评价订单全部五星好评”只要描述清晰,AI 都能理解并执行。
8. 常见问题与解决方案
尽管整体流程简单,但在实际使用中仍可能出现一些问题。以下是高频问题及应对方法。
8.1 ADB 连接失败或频繁断开
现象:adb devices显示 offline 或无法识别设备
解决办法:
- 更换高质量数据线(特别是小米手机,建议使用 6A 线)
- 重启 ADB 服务:
adb kill-server && adb start-server - 重新授权:断开再连接,手机端重新点击“允许”
8.2 屏幕黑屏 / 敏感界面报错
错误提示:
屏幕被标记为敏感屏幕(黑屏),这可能是由于应用正在加载中或设备安全设置导致的。 根据安全规则,我无法在敏感屏幕上执行任何操作。原因分析: 某些 App(如银行类、支付类)会主动屏蔽屏幕捕获,导致 AI 看不到内容。
解决方案:
- 手动跳过该页面后再启动 AI
- 在非敏感环境下测试(如普通社交 App)
- 检查手机是否开启了“隐私保护模式”或“防录屏”功能
8.3 模型无响应或乱码
可能原因:
- API 密钥错误
- base-url 填写不正确
- 网络不通或防火墙拦截
排查步骤:
- 检查 API Key 是否复制完整
- 测试能否访问 base-url(浏览器打开应返回 JSON)
- 使用
ping和telnet检查网络连通性
9. 总结:未来已来,动手即享
通过本文的详细指导,你应该已经成功部署了 Open-AutoGLM,并体验到了“一句话操控手机”的神奇魅力。
回顾一下我们完成了什么:
- 配置了 ADB 环境
- 开启了手机调试权限
- 安装了 ADB Keyboard 实现远程输入
- 部署了 Open-AutoGLM 控制端
- 接入了云端 AI 模型
- 成功执行了自动点赞、关注等任务
这一切都不需要你写一行代码,只需要按照步骤操作,就能拥有一个“会听话”的 AI 手机助理。
下一步你可以尝试:
- 编写更复杂的多步任务(如定时打卡、自动领券)
- 结合 Python API 实现批量设备管理
- 探索如何将它集成进自己的工作流(如社交媒体运营、数据采集)
AI 正在改变人机交互的方式。过去我们需要学习操作系统、记住菜单路径;而现在,我们只需要说出需求,AI 就能帮我们完成。Open-AutoGLM 正是这一趋势的先锋实践。
别再手动刷视频、点点赞了,让 AI 替你做这些无聊的事吧。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。