首页 注册 登录
V2EX = way to explore V2EX 是一个关于分享和探索的地方
现在注册 已注册用户请 登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
terryso
0.62D
0.71D
V2EX 程序员

解放双手,让智谱手机 Agent 帮你自动化操作小红书

terryso ·
terryso · 2025 年 12 月 11 日 · 3139 次点击

https://youtube.com/shorts/97TV1EfY9lk

Phone Agent 是一个基于 AutoGLM 构建的手机端智能助理框架,它能够以多模态方式理解手机屏幕内容,并通过自动化操作帮助用户完成任务。

项目地址: https://github.com/zai-org/Open-AutoGLM

16 条回复 2025年12月13日 19:19:00 +08:00
ricwangcom
1
ricwangcom 2025 年 12 月 11 日
可以自动刷抖音的广告,赚积分不
coefu
2
coefu 2025 年 12 月 11 日
利好那些 MCN 机构,以及一个隐藏流量操控市场。
coefu
3
coefu 2025 年 12 月 11 日
3. 开发者与用户行为规范





https://github.com/zai-org/Open-AutoGLM/blob/main/resources/privacy_policy.txt

严禁利用 AutoGLM 开源项目或基于其开发的应用/服务从事以下行为:
( 1 )批量自动化与恶意竞争行为
- 进行任何形式的虚假数据操作:刷单、刷票、刷赞、刷评论、刷流量、刷粉丝、刷播放量、刷下载量等。
- 批量操控账号:批量注册、批量登录、批量操作第三方平台账号(群控、多开、云控)。
- 扰乱市场秩序:恶意抢购、囤积居奇、抢占限量资源、批量领取/滥用优惠券/补贴、恶意占用服务资源(薅羊毛)。
- 操纵平台规则:刷榜、刷排名、操纵搜索结果、人为干预推荐算法、虚假提升/降低内容曝光度。
- 制造虚假活跃度:批量发布、转发、点赞、收藏、关注、取关等社交媒体操作。
- 破坏游戏公平:游戏代练、工作室操作、批量刷装备/金币/经验/道具。
- 破坏公正性:批量投票、刷票、操纵网络评选、调查结果。
( 2 )虚假信息与欺诈行为
- 制造误导信息:发布/传播虚假商品/服务评价、虚假用户反馈、虚假证言、虚假体验。
- 伪造商业数据:制造虚假交易记录、虚假销量、虚假用户活跃度、虚假好评率。
- 身份欺诈:冒充他人身份、虚构个人信息、盗用他人账号/头像/昵称、伪造身份证明。
- 虚假营销:发布虚假广告、进行虚假宣传、夸大产品功效、隐瞒产品缺陷/风险。
- 参与诈骗活动:网络诈骗、虚假投资、传销、非法集资、虚假中奖、钓鱼等。
- 传播不实信息:制造或恶意传播虚假新闻、谣言、未经证实的信息。
( 3 )破坏第三方服务与系统安全
- 非授权访问:利用 AutoGLM 进行数据爬取(违反 robots.txt 或平台政策)、信息窃取、API 接口滥用、服务器渗透测试(未授权)。
- 技术破坏:对第三方应用进行逆向工程、破解、修改、注入恶意代码、干扰其正常运行。
- 资源滥用:恶意占用第三方服务器资源、发送垃圾请求、制造异常流量、进行 DDoS 攻击。
- 违反平台规则:故意违反被操作第三方应用的用户协议、服务条款、社区规则。
- 恶意竞争:恶意差评、恶意举报、恶意投诉、商业诋毁。
- 传播有害内容:传播计算机病毒、木马、恶意软件、勒索软件、垃圾邮件、非法内容。
- 侵犯数据权益:未经授权进行大规模商业数据采集、用户信息收集、隐私窥探。
( 4 )侵犯他人合法权益
- 账号盗用:盗用他人账号、密码、身份凭证进行操作。
- 网络骚扰与霸凌:恶意骚扰、威胁、辱骂、诽谤、人肉搜索他人。
- 侵犯隐私与秘密:未经授权收集、使用、传播他人个人信息、隐私数据、商业秘密。
- 恶意抢注:抢注他人商标、域名、用户名、社交媒体账号等。
- 骚扰行为:恶意刷屏、垃圾信息轰炸、强制关注/订阅。
- 损害商业利益:商业间谍活动、不正当竞争、恶意挖角、窃取商业机密。
( 5 )滥用资源与破坏项目生态
- 滥用注册资源:恶意注册大量账号、虚假注册。
- 浪费计算/设备资源:恶意占用本地设备或云设备资源、长时间闲置占用、运行与自动化任务无关的高耗能程序(如挖矿)。
- 破坏稳定性:恶意测试系统性能、进行压力测试(未授权)、频繁重启服务、利用技术漏洞/缺陷牟利或损害项目/平台利益。


堵住了一切不好的念头,😄。
- 违反开源协议:违反 AutoGLM 项目的开源许可证条款。
bleeontheway
4
bleeontheway 2025 年 12 月 11 日
今天深度试用了一下 Open-AutoGLM
使用 AutoGLM-Phone-9B 模型什么情况不知道,本地部署不了,找了一圈也没找到谁提供了 api 的调用方式
使用其它模型 gpt5, gmini, Sonnet 等都没法正常完成任务,调试发现是按钮的位置不准确,非常不准确。

这个也是大模型在图片坐标返回时的通病吧
open-autoglm 在处理坐标是认为模型已经对图片归一化 1000x1000 了,可能其它模型不鸟它吧

我也按照 https://zhuanlan.知乎.炕母/p/676023813 给的方法修改了提示词并调整了最终坐标的计算算法,但也也没什么太大用处,坐标就是不准确

可能 AutoGLM-Phone-9B 在对坐标 detect 这方法做了什么特殊的增强吧。 希望早点看到三方部署的 api 上线
照理来说这么小的模型应该不会太贵的
duuu
5
duuu 2025 年 12 月 11 日
@bleeontheway 用 glm-4.6v 呢?现在官方 api 是免费的
dearmymy
6
dearmymy 2025 年 12 月 11 日
这得多消耗 token ?
terryso
7
terryso
OP
2025 年 12 月 11 日 via iPhone
@bleeontheway 我的视频里面的操作是使用 glm1-4.6v
terryso
8
terryso
OP
2025 年 12 月 11 日 via iPhone
@duuu 4.6v 是可以跑起来
terryso
9
terryso
OP
2025 年 12 月 11 日 via iPhone
@dearmymy 你买 coding plan ,基本用不完,不用担心 token 的问题
yukinotech
10
yukinotech 2025 年 12 月 11 日
应用场景类似于手机矩阵,挂机点赞,刷积分?原来是靠挂脚本,模式比较固定,定制成本高,现在 ai 操作 adb 更加智能了,自然语言操作 adb
terryso
11
terryso
OP
2025 年 12 月 11 日 via iPhone
@yukinotech 也可以给自己点杯咖啡,😄
bleeontheway
12
bleeontheway 2025 年 12 月 12 日
今天试了 GLM-4.6V ,确实可以。
它返回的坐标一定是基于 1000x1000 的,犟得狠,无法纠正成其它坐标系。
terryso
13
terryso
OP
2025 年 12 月 12 日
@bleeontheway 目前的确适配得还不太好, 不过既然开源, 应该有人会帮忙解决
BN5MDKFM
14
BN5MDKFM 2025 年 12 月 13 日
@coefu 规则和实际执行是两码事,有巨大的浮动操作空间,也就是灰 BLACK 产和 MCN 这种
kirieievk
15
kirieievk 2025 年 12 月 13 日
这种可以自动操作推特吗.
terryso
16
terryso
OP
2025 年 12 月 13 日 via iPhone
@kirieievk 可以啊,就是视觉模型识别坐标,然后模拟点击而已
关于 · 帮助文档 · 自助推广系统 · 博客 · API · FAQ · Solana · 2802 人在线 最高记录 6679 · Select Language 创意工作者们的社区 World is powered by solitude VERSION: 3.9.8.5 · 27ms · UTC 13:04 · PVG 21:04 · LAX 05:04 · JFK 08:04
♥ Do have faith in what you're doing.

AltStyle によって変換されたページ (->オリジナル) /