V2EX › 分享发现
我让 GLM 看了 3 分钟录屏,它直接生成了可运行的原型!
terryso ·
2025 年 11 月 8 日 · 2155 次点击
这是一个创建于 63 天前的主题,其中的信息可能已经有所发展或是发生改变。
我在 Clude Code 下面使用 GLM 已经有一段时间了, 但有一个功能一直没用过, 就是视频分析功能。今天有一个群友告诉我说 GLM 模型有视频分析能力。突然来了灵感, 如果我打开一个 App, 然后录屏, 是不是就可以......
说干就干... 就拿 #小红书 练练手吧
这是小红书的录屏:
这是制作出来的原型, 虽说还原度还不算太高, 但布局基本准确:
这是在 Claude Code 下使用 GLM4.6 模型制作的过程:
补充说明: GLM4.6 的这个视频分析能力是需要订阅 GLM 的 PRO 帐号下才能使用, 目前订阅费用比较便宜, 一个季度只需 300 元.
使用我的邀请链接还能再便宜 10%:
https://www.bigmodel.cn/claude-code?ic=TVUZHTWCW9
10 条回复 • 2025年11月08日 21:29:40 +08:00
evan9527
1
evan9527 2025 年 11 月 8 日
大佬,金钻是什么东西?第一次见
duuu
2
duuu 2025 年 11 月 8 日
视频分析能力是 api 还是?
terryso
3
terryso 2025 年 11 月 8 日 ❤️ 1
@
duuu 视频分析 MCP, 但要有订阅号才能用
sillydaddy
5
sillydaddy 2025 年 11 月 8 日
这个用法很有意思,它让我想起之前的一个想法:
我用一个原型工具快速制作一个原型,手动演示一遍,录成视频,然后输入给编程 Agent ,是不是可以用来作为自动验证的条件!这种约束,比文字描述要更准确直观,而且更接近自己想要的东西,而且对 Agent 始终是一个非常准确的约束和反馈,Agent 每次修改代码后,都可以拿它来检查,就像它现在每次修改代码后,就进行语法检查一样。
terryso
6
terryso 2025 年 11 月 8 日
是的, 有时候视频是比较文字和截图描述更精准.
视频的演示能清晰指示页面之间的跳转关系, 甚至能包括一些动画效果.
不过目前它只能分析最大 8M 的视频, 需要做压缩或者提取关键帧做分析.
我试过将 64M 的视频有损压缩到 2M, 它还是能比较准确的识别
VoiceEXONE
7
VoiceEXONE 2025 年 11 月 8 日 via iPhone
算是具像化的 POC 到 MVP 过程,传统常规的套路可变性会高一些,这种 one by one 也就是基本定型的一种范式
terryso
8
terryso 2025 年 11 月 8 日 ❤️ 1
@
VoiceEXONE 可以先抄, 把基本功能交互定下来, 再让 agent 调, 不过这是没有设计师辅助的情况下, 个人可以省很多事.
如果有设计辅助, 可以设计师先出原型, 录视频再快速 demo. 比传一堆截图要快不少.
avenger
9
avenger 2025 年 11 月 8 日
本地用 GLM 配合 cc 试了下,改 Next.js 确实很快,感谢推荐
terryso
10
terryso 2025 年 11 月 8 日 via iPhone