
作者 | 董道力
邮箱 | dongdaoli@pingwest.com
Agent 这个词,AI 行业喊了至少两年。2024 年起,每一场发布会都在谈 Agent,投资机构管它叫下一个万亿市场,创业公司一夜之间改了 slogan。但打开产品一看,还是一个对话框等你打字:你给指令,它给回答;你不提问,它就停在那儿。
概念跑得很快,产品形态没跟上。直到 OpenClaw 出来,这种错位才突然变得可见——不是因为它发明了什么新技术,而是它把那层一直缺失的交互前端拼对了。
OpenClaw 这个小龙虾的火热最终没有昙花一现,从一个周末项目起步,短时间冲到十万级 GitHub stars,单周两百万访问。但更能说明问题的是它迅速从极客玩具升级为 Agent 雏形:用户群从开发者扩散到各行各业,运营、创业者、普通人,讨论焦点也从技术实现转向日常使用。2 月 15 日,Sam Altman 宣布 OpenClaw 创始人 Peter Steinberger 加入 OpenAI,也给这轮“个人 Agent 形态”做了背书。而在各个技术社区、社交媒体、各个线下聚会上,人们还在蜂拥而至给自己部署着各种“龙虾”。
这股龙虾热逐渐演变出了一种行业共识:如果把 AI 这事拉长来看,当作一整个独立的“产品”,那么 ChatGPT 们此前其实只是在构建“后端”,这一次它才真正有了“前端”。
对话框其实困住了所有人
ChatGPT 问世三年多,定义了一个近乎统一的交互范式:一个输入框,你打字,它回复。三年里,绝大多数 AI 产品都在复制这个模式。豆包、Kimi、Perplexity、Claude,换名字换皮肤换模型,底下还是同一套回合制界面。
对话框看起来很自然,但它把 AI 锁在了被动位置:你不打开它,它就不存在;你不提问,它就不行动。AI 的全部价值,依赖用户主动发起、主动拆解、主动盯过程、主动验收。对重度用户来说这只是习惯,但对多数普通人而言,“想到要用 AI”本身就是门槛。
还有一层更隐蔽的问题:对话框把能力限制在了“回答”里。你问一个问题,它给一段文字;你让它写代码,它给一段代码。交互结束,系统即停。它没法替你跑一个持续性任务,没法在你不在的时候盯住什么,没法在发现异常后主动来找你。
对话框是回合制游戏,但真正的助手应该是实时在线的。
Peter Steinberger 在 Lex Fridman 的访谈里把这个点说得更狠:我们现在给 Agent 的界面,本质上是在“复制 Google”——一个 prompt、一个聊天框,就像电视刚出现时人们把广播节目原封不动搬到屏幕上播。

换句话说,GenAI 的后端能力已经到了 2026 年的水平,前端界面还停在 2010 年。Agent 的推理与规划能力在变强,UI 层基本没变,反而拖住了体验。很多任务明明需要表单、预览、控制、分步反馈,产品却仍在用“聊天”硬扛。
当界面没进化,模型再强,用户体感也只是“聪明了一点”。这也是为什么行业会同时出现两种情绪:一边是能力暴涨,一边是“怎么还是用不起来”。
OpenClaw 做对了什么
OpenClaw 接入了聊天软件,就这么简单。
它跑在飞书、iMessage、Telegram 里,能在本地运行、替用户执行动作。消息会弹出来找你,不用切换上下文。对话框是你得专门去打开的东西,聊天软件是你已经待着的地方。跟 AI 说句话,跟回复一条微信一样随意。
分发上的差距更大。ChatGPT 要注册、打开;飞书和 Telegram 早就装在手机上了。OpenClaw 接入这些平台,用户获取 AI 的门槛降到接近零。用户只有一直在用,才会真正体会到价值。
但入口只是一半。OpenClaw 真正的突破是主动性。

Peter 在访谈里提到,他给 Agent 加了定期触发机制,最初的提示词很粗暴:每隔一段时间 surprise me。你睡觉它在跑,开会它也在跑。一个等你来用,一个替你去做。喊了两年 Agent,直到 OpenClaw,大多数人才第一次摸到 Agent 该有的手感。
Claude Code 再强,用户心智被“编程工具”锁死了:打开终端、输入命令、盯输出。OpenClaw 更像一个长期在线的代理人,存在方式本身就不一样。
而 Agent 产品面向用户可能本就该是黑盒。你说“帮我盯着这几个账号”,它去盯着,中间用了什么模型、烧了多少 token,不关用户的事。OpenClaw 的 token 消耗比传统对话式 AI 高一个数量级,但用户不在意——他们看不到过程,只看到结果。
Cowork 本来最有机会站在 OpenClaw 今天的位置,发布时甚至引发了一波软件股恐慌。但它差了两步:没进聊天软件,界面上暴露了太多配置项。Cowork 打开是文件夹选择、权限设置、任务进度面板;OpenClaw 打开是一个聊天窗口。一个像在操作软件,一个像在跟人说话。
很有代表的点是,很多人用 OpenClaw 用到现在,就没拿它像 AI IDE 那样编过程。这个本来跑在终端里的技术产品,用户拿它管邮件、盯热点、整理信息、安排日程、一句话开发。技术栈是程序员的,使用场景完全不是。
ChatGPT 们只是后端,OpenClaw 们定义了前端
过去几年,从 GPT-3 到 GPT-5,从 Claude 到 Gemini,整个行业做的事情其实都是同一件:堆后端。更大的模型、更长的上下文、更好的推理——这些都是基础设施,是水电煤。
ChatGPT 们这些 GenAI 产品和模型,就是后端,负责生成文本、生成代码、调用工具、理解意图。
但后端再强,没有前端也触达不了普通人。互联网的后端是 TCP/IP,真正改变世界的是浏览器;移动互联网的后端是 3G/4G,真正改变世界的是 App Store。后端决定能力上限,前端决定谁能用到这些能力。
OpenClaw 所呈现出来的 agent 就是这一轮 AI 的前端。它接收意图,在真实环境里做决策、调工具,把结果交付给你。GenAI 的能力,不管是生成代码还是逻辑推理,都在后面撑着这个代理。
这也就是为什么 GPT-5 们发布时行业反应相对平淡:模型确实更强了,但体验在对话框里没有质的变化,用户觉得“好像聪明了一点”,然后继续用原来的方式。后端在进步,前端没变,用户感受到的提升就很有限。
反过来,OpenClaw 用的模型并不比别人强——它接的是 Claude、GPT、DeepSeek,跟所有人调用的 API 一样。但它换了前端,体验上像是跳了一代。

Peter 在 Lex 的访谈里用一句话把这个未来推到了极端:every app is just a very slow API now。Twitter/X 对访问设限,并没有真正让 Agent“不可能”读取内容——Agent 只需要打开浏览器去读,只是成本更高、速度更慢。
也就意味着,当 Agent 能替你跨越一堆界面完成工作,App 这层“为人类设计的 UI”就会逐渐退化为“为 Agent 提供的数据与动作接口”。用户不再“使用”你的产品,用户的 Agent 替他们“调用”你的产品。
越标准化的工具——App、邮件、日历、任务管理、文件存储——越可能先被改写。越复杂、越强权限的系统会更慢,但也更依赖“前端入口 + 权限 + 工作流编排”这个组合。
GenAI 和 Agent 不是两个时代,是同一个系统的两层。ChatGPT 的对话框定义了 GenAI 的交互模式,OpenClaw 的聊天软件定义了 Agent 的交互模式。前者最终会隐去,变成后端。OpenClaw 这样的 Agent 成为一切的前端。
难得的自下而上的“革命”
这股热潮没有褪去背后,另一个让人有些意外的地方是,OpenAI“收编”了 OpenClaw 后,人们的热情并没有减弱。
但这也因为,OpenAI 挖走了 OpenClaw 的创始人,但到现在也没推出类似的产品形态。
这可能因为 ChatGPT 的对话框心智太强,三年多积累的用户习惯反而成了负担。而且 OpenAI 的商业模式建立在订阅和 API 调用上,让 Agent 跑在第三方聊天软件里,等于把用户入口拱手让人。
Anthropic 的处境同样特殊。Claude Code 增长很快,但“编程工具”标签一旦贴上就撕不掉。Cowork 是对的棋子,一月份发布即引发一波软件股恐慌,但它生在桌面端、不在聊天软件里,起步慢了半拍。
同一时期,Perplexity 推出了名为 Computer 的 super agent,走云端路线但定位类似——这说明“主动式 Agent 嵌入日常工具”已成行业共识,区别只在谁先拿到用户。
这些巨头面对的其实是同一个困境:现有产品太成功了,反而堵住了解决真正的需求的路。ChatGPT 的对话框、Claude Code 的终端、Office 的生产力套件、微信的社交生态——每一个都是护城河,但也是围墙。OpenClaw 没有这个包袱。巨头们被自己的成功困在原地,不是看不见新范式,而是动不了。
看起来,人们对 OpenClaw 和收了它的 OpenAI 的认知依然是分开的,OpenClaw 代表的新的交互范式,没有对“自有入口”的执念反而把用户体验做好了,而一个好的“前端”从来都是自下而上建设起来的。
这也让 OpenClaw 成了这一轮越来越像是巨头之间的资源游戏的 AI 演进中,一次难得的自下而上的破局。它给了大批开发者和创业者一些新的信心:创新还可以发生,哪怕是从一个小团队、一个周末项目、一个“surprise me”的粗暴提示词开始,游戏还远远没有结束。

