南通市网站建设_网站建设公司_MongoDB_seo优化
2026/1/22 6:23:59 网站建设 项目流程

不用写代码!Open-AutoGLM实现自动点赞收藏

你有没有想过,有一天只需要动动嘴说一句话,手机就能自己完成一系列操作?比如:“打开小红书,找到那条关于露营的笔记,点赞并收藏”。听起来像科幻片?其实现在就能做到——用Open-AutoGLM,一个由智谱开源的手机端 AI Agent 框架。

更关键的是:你不需要写一行代码。只要会说话,就能让 AI 替你操作手机,自动完成点击、滑动、输入、关注、点赞、收藏等任务。本文将带你从零开始,一步步部署并使用 Open-AutoGLM,真正实现“动口不动手”的智能体验。


1. 这是什么?为什么值得你试试

1.1 一句话讲清楚它能做什么

想象一下这些场景:

  • 想批量给某个话题下的抖音视频点赞?只需说一句:“打开抖音,搜索‘治愈系猫咪’,给前10个视频点赞。”
  • 想在小红书收藏所有“北京周末好去处”的笔记?告诉 AI:“搜这个关键词,把每一篇都点开收藏。”
  • 想每天自动登录某 App 领积分?设置一次指令,让它每天早上 8 点自动执行。

这些原本需要手动重复的操作,现在都可以交给Open-AutoGLM来完成。

1.2 它是怎么做到的?

Open-AutoGLM 的核心技术是“视觉语言模型 + ADB 自动化控制”:

  • 看懂屏幕:通过截图获取当前手机界面,利用多模态大模型理解屏幕上有什么(文字、按钮、图片)。
  • 听懂指令:你用自然语言下达任务,比如“点赞并关注”,AI 能解析出你的意图。
  • 规划动作:结合当前界面状态和目标,AI 自动规划下一步该点击哪里、滑动到哪一页。
  • 执行操作:通过 ADB(Android Debug Bridge)向手机发送模拟点击、滑动、输入等命令。

整个过程就像有个“数字分身”在替你玩手机。

1.3 和普通自动化脚本比,强在哪?

对比项传统自动化工具(如 Auto.js)Open-AutoGLM
是否需要编程需要写 JavaScript 脚本完全不用写代码
灵活性固定流程,换页面就失效动态识别界面,适应变化
易用性学习成本高只需输入一句话指令
维护成本页面改版就得重写脚本自主理解新布局

所以,如果你不想学编程,又想让手机“自己干活”,Open-AutoGLM 是目前最接近“傻瓜式 AI 助理”的方案。


2. 准备工作:软硬件与环境配置

要让 Open-AutoGLM 正常运行,你需要准备以下几样东西:

2.1 硬件要求

  • 一台电脑:Windows 或 macOS 均可(推荐 Windows,兼容性更好)
  • 一部安卓手机:Android 7.0 以上系统,支持 USB 调试
  • 一根数据线:建议使用高质量的数据线(尤其是小米用户,劣质线容易导致 ADB 断连)

提示:也可以使用安卓模拟器(如 MuMu、BlueStacks),但部分模拟器可能不支持 ADB 输入法,需自行测试。

2.2 软件依赖

  • Python 3.10+
  • ADB 工具包
  • Git

我们接下来会逐一安装。


3. 手机端设置:开启调试权限

为了让电脑能控制手机,必须先开启开发者权限。

3.1 开启开发者模式

进入手机「设置」→「关于手机」→ 连续点击“版本号”7~10 次,直到提示“您已进入开发者模式”。

不同品牌路径略有差异,可在设置中直接搜索“开发者选项”。

3.2 启用 USB 调试

返回设置主界面 →「开发者选项」→ 找到并勾选:

  • USB 调试
  • USB 安装(部分小米/红米机型还需开启“USB 调试(安全设置)”)

此时用数据线连接电脑,手机可能会弹出“允许 USB 调试?”的提示,务必点击“允许”。

3.3 安装 ADB Keyboard(关键步骤!)

这是实现远程输入的核心组件。

  1. 下载 APK 文件:ADBKeyboard.apk
  2. 将文件传到手机并安装(可通过 USB 文件传输或微信发送)
  3. 安装完成后,进入「设置」→「语言与输入法」→「默认键盘」→ 切换为ADB Keyboard

验证是否成功:断开数据线,在电脑命令行输入adb shell input text "Hello",如果手机任意输入框出现“Hello”,说明配置成功。


4. 本地控制端部署:安装 Open-AutoGLM

现在回到电脑,开始部署本地控制程序。

4.1 安装 ADB 工具

前往 Android 开发者官网 下载 platform-tools。

解压后,将其路径添加到系统环境变量:

Windows 设置方法:
  1. Win + R 输入sysdm.cpl→ 高级 → 环境变量
  2. 在“系统变量”中找到Path→ 编辑 → 新建 → 添加 ADB 解压目录(如C:\platform-tools
  3. 打开新的 CMD 窗口,输入adb version,若显示版本信息则成功
macOS 设置方法:

在终端执行:

export PATH=${PATH}:~/Downloads/platform-tools

(假设你把 ADB 放在 Downloads 文件夹)

4.2 克隆项目并安装依赖

打开命令行工具,执行以下命令:

# 克隆仓库 git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM # 安装依赖(推荐使用清华源加速) pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt # 安装 phone_agent 包 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -e .

若无报错,表示安装成功。


5. 连接设备:USB 与 WiFi 两种方式

确保手机已通过 USB 连接电脑,并在手机上确认允许调试。

5.1 检查设备连接状态

在命令行输入:

adb devices

正常输出应类似:

List of devices attached ABCDEF1234567890 device

如果有unauthorized字样,请检查手机是否点了“允许”。

5.2 使用 WiFi 进行无线控制(推荐)

摆脱数据线束缚,实现远程操控。

第一步:先用 USB 连接,启动 TCP/IP 模式
adb tcpip 5555
第二步:拔掉数据线,用 IP 地址连接
adb connect 192.168.x.x:5555

(x.x 替换为手机的真实局域网 IP,可在 WLAN 设置中查看)

再次运行adb devices,应能看到设备以 IP 形式连接。


6. 接入 AI 模型:选择你的“大脑”

Open-AutoGLM 本身只是一个框架,真正的“智能”来自背后的 AI 模型。你可以选择两种方式接入:

6.1 方案 A:使用第三方 API(推荐新手)

无需 GPU,注册即可使用,适合绝大多数人。

推荐平台一:ModelScope(魔搭社区)
  • 访问地址:https://modelscope.cn
  • 注册账号 → 进入个人中心 → 创建 API Token
  • 模型名称:ZhipuAI/AutoGLM-Phone-9B
  • Base URL:https://api-inference.modelscope.cn/v1
推荐平台二:智谱 BigModel
  • 访问地址:https://open.bigmodel.cn
  • 注册后申请 API Key
  • 模型名称:autoglm-phone
  • Base URL:https://open.bigmodel.cn/api/paas/v4

优点:免部署、免显卡、响应快
💰 成本:大部分平台提供免费额度,超出后按调用量计费

6.2 方案 B:本地部署模型(高级用户)

适合有高性能 GPU(建议 24GB 显存以上)的开发者。

需要:

  • 下载约 20GB 的模型文件
  • 安装 vLLM 或 SGLang 推理引擎
  • 自行搭建服务并映射端口

具体步骤详见官方文档,本文不展开。


7. 实战演示:一句话实现自动点赞收藏

终于到了最激动人心的环节——让 AI 替你操作手机!

7.1 示例任务:自动点赞并关注抖音博主

假设你想关注一个 ID 为dycwo11nt61d的抖音用户,并点赞其最新视频。

只需在命令行运行:

python main.py \ --device-id 192.168.x.x:5555 \ --base-url https://api-inference.modelscope.cn/v1 \ --model "ZhipuAI/AutoGLM-Phone-9B" \ --apikey "your-modelscope-api-key" \ "打开抖音搜索抖音号为:dycwo11nt61d 的博主并关注他,然后点赞他的最新一条视频!"

参数说明:

  • --device-id:你的手机设备 ID 或 IP:5555
  • --base-url:API 服务商提供的接口地址
  • --model:使用的模型名
  • --apikey:你在平台申请的密钥
  • 最后的字符串:你的自然语言指令

7.2 观察执行过程

运行后你会看到:

  1. 程序自动截取手机屏幕
  2. AI 分析当前界面内容
  3. 规划操作路径(打开抖音 → 点击搜索框 → 输入账号 → 进入主页 → 点击关注 → 找到最新视频 → 点赞)
  4. 通过 ADB 发送指令,手机同步执行动作

整个过程无需人工干预,就像有人在替你操作手机。

7.3 更多实用指令示例

你可以尝试这些任务:

“打开小红书,搜索‘减脂餐食谱’,把前五篇笔记全部收藏” “打开微博,找到昨天发布的关于杭州天气的帖子,转发并评论‘太准了’” “打开淘宝,进入我的订单页,把三个月前的待评价订单全部五星好评”

只要描述清晰,AI 都能理解并执行。


8. 常见问题与解决方案

尽管整体流程简单,但在实际使用中仍可能出现一些问题。以下是高频问题及应对方法。

8.1 ADB 连接失败或频繁断开

现象adb devices显示 offline 或无法识别设备

解决办法

  • 更换高质量数据线(特别是小米手机,建议使用 6A 线)
  • 重启 ADB 服务:adb kill-server && adb start-server
  • 重新授权:断开再连接,手机端重新点击“允许”

8.2 屏幕黑屏 / 敏感界面报错

错误提示

屏幕被标记为敏感屏幕(黑屏),这可能是由于应用正在加载中或设备安全设置导致的。 根据安全规则,我无法在敏感屏幕上执行任何操作。

原因分析: 某些 App(如银行类、支付类)会主动屏蔽屏幕捕获,导致 AI 看不到内容。

解决方案

  • 手动跳过该页面后再启动 AI
  • 在非敏感环境下测试(如普通社交 App)
  • 检查手机是否开启了“隐私保护模式”或“防录屏”功能

8.3 模型无响应或乱码

可能原因

  • API 密钥错误
  • base-url 填写不正确
  • 网络不通或防火墙拦截

排查步骤

  • 检查 API Key 是否复制完整
  • 测试能否访问 base-url(浏览器打开应返回 JSON)
  • 使用pingtelnet检查网络连通性

9. 总结:未来已来,动手即享

通过本文的详细指导,你应该已经成功部署了 Open-AutoGLM,并体验到了“一句话操控手机”的神奇魅力。

回顾一下我们完成了什么:

  • 配置了 ADB 环境
  • 开启了手机调试权限
  • 安装了 ADB Keyboard 实现远程输入
  • 部署了 Open-AutoGLM 控制端
  • 接入了云端 AI 模型
  • 成功执行了自动点赞、关注等任务

这一切都不需要你写一行代码,只需要按照步骤操作,就能拥有一个“会听话”的 AI 手机助理。

下一步你可以尝试:

  • 编写更复杂的多步任务(如定时打卡、自动领券)
  • 结合 Python API 实现批量设备管理
  • 探索如何将它集成进自己的工作流(如社交媒体运营、数据采集)

AI 正在改变人机交互的方式。过去我们需要学习操作系统、记住菜单路径;而现在,我们只需要说出需求,AI 就能帮我们完成。Open-AutoGLM 正是这一趋势的先锋实践。

别再手动刷视频、点点赞了,让 AI 替你做这些无聊的事吧。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询