软件的未来真的是智能体吗?
其他一切都只是插件?
最近有一个问题一直在我脑中盘旋:如果几乎任何人都能在几个周末内借助AI辅助编程构建出一个可用的应用,那么未来人们究竟会为什么付费?
我没有一个干净的答案。但我有一个方向。而且我越是沿着这个方向走,就越觉得它几乎改变了软件构建、销售和使用的方方面面。
1、周末应用
想想AI编程工具对工作量曲线已经做了什么。过去需要数月的东西——集成、仪表盘、数据管道和内部工具——现在只需要几天,有时甚至几小时。我有一个一直在折腾的旅行应用。我可以为它构建出色的UI,添加航班搜索、酒店预订、视频通话、推荐等功能。从技术上讲,几乎没有什么是不可能的。
但这些真的重要吗?
因为关键在于:如果我能在周末构建所有这些,一千个其他人也能。任何有一个还算不错的想法和一个空闲下午的人都能做到。好想法仍然会赢,当然。人们仍然会为真正解决问题的东西付费。但构建软件的摩擦已经崩塌了,而在这个崩塌的另一端正在发生一些有趣的事情。
2、粘合剂
如果每个人最终都有自己的AI助手——一个了解他们偏好、管理他们日历、处理他们邮件、一般性地代表他们行事的个人智能体——那么这个智能体就成了人们实际交互的对象。不是应用。而是智能体。
想想你今天如何使用手机。你大部分时间可能直接与Google日历交互。你打开应用以可视化地查看安排。但越来越多地,助手在处理日程安排。你说出你的需求。
现在把这个逻辑延伸几年(几个月?)。如果智能体是主要界面,那么应用,至少是我们所理解的应用,开始看起来像是不同的东西。它变成了给智能体用的工具,而不是直接给你用的。
3、应用是技能,而非目的地
这部分我的思考有点推测性,但请耐心听我说。
如果近期未来软件产品的正确思维模型不是用户访问的应用而是智能体可以调用的能力呢?
有一个叫做MCP(模型上下文协议)的协议,它让AI智能体以标准化的方式连接到外部工具和服务。把它想象成一个通用适配器;你的智能体插入进去,突然它就能像使用原生能力一样使用那个服务。想让你的智能体规划旅行?它连接到一个旅行MCP服务器。需要酒店预订?它连接到Booking.com的MCP。航班价格?又一个连接。
用户不需要在五个应用之间切换。智能体来做切换。从用户的角度来看,一切都感觉像一个连贯的体验。
专注于做一件事并把自己暴露给智能体的小而精的工具?我认为这些会胜出。那个庞大的、试图成为一切的超应用?我不太确定。
4、那界面呢?
这里就变得有趣了。
我的第一直觉是:如果智能体处理一切,我们还需要UI吗?偶尔,当然,你想看到你的日历,看到地图,看到图表。但大多数时候?你只是在和智能体说话,然后事情就发生了。
然后我开始想,界面可能只是……移动了。不是一个你打开的独立应用,如果UI直接出现在聊天窗口中,嵌入的、情境化的、恰好在你需要的时候出现呢?
事实证明这已经在开发中了。MCP协议有一个扩展,有时被称为MCP Apps协议,它基本上做的就是我想象的事情:应用的一部分可以直接在智能体对话中渲染。还有一个竞争者叫做A2UI,用略有不同的方式做本质上相同的事情。
5、灯亮了(字面意思)
让我给你一个具体的例子,说明这已经走向何方,因为抽象的理论推导只能到此为止。
前阵子,我让我的OpenClaw智能体扫描我的家庭网络,找到它可以连接的任何东西。它找到了我的飞利浦Hue灯。几分钟内,它写了一个脚本来控制它们。再过几分钟,我就有了一个可以通过Signal聊天消息开关灯的工作设置。
没有应用更新。没有飞利浦Hue的UI。没有设置向导。只是:"这是你网络上的一个东西,这是如何与它对话的方法,完成。"
从那以后我再也没有打开过Hue应用。
现在,那是一个小的、几乎有点可笑的例子。但它指向了某种非同小可的东西。智能体找到了资源,弄清了接口,并将它缝合进我的工作流,而我不需要构建其中任何东西。应用变得不可见了,但能力保留了下来。
6、智能体也会付款
还有一个我认为人们低估的部分。
想象你的AI智能体有一个预算——一小笔你授权它代表你花费的钱。有了这个,智能体可以做一件听起来很未来但技术上已经可能的事情:它可以自行付费获取服务的API访问。
有一个叫做AP2(智能体支付协议)的协议正是为此设计的。你的智能体与MCP服务器对话,发现它需要付费订阅,协商并支付费用,获取API密钥——所有这些都不需要你访问公司网站、填写支付表单或将凭据复制到配置文件中。
UI、结账流程和入门引导都变得不必要。智能体处理整个交易。
而如果你确实需要一个自定义界面呢?你的智能体可以即时生成一个,完全为你那一刻的需求量身定制,然后丢弃。氛围编码的、临时的、精确符合目的的。
7、那么我们到底在构建什么?
技术有一种习惯,就是比你预期的花更长时间,然后一下子全部到来。但如果这个方向大致正确,有几件事会随之而来。
对开发者来说: 最有价值的东西不是漂亮的UI,而是一个可靠的、文档良好的MCP服务器,它把一件事做得极其出色,而且容易被智能体理解和使用。界面是次要的,几乎是可选的。
对企业来说: 问题从"如何让用户进入我们的应用?"转变为"如何让我们的服务成为智能体首选的东西?"分发方式完全改变。发现发生在智能体层面,而不是应用商店。
对用户来说: 体验在表面上变得极其简单,而在底层变得极其强大。你不再在应用之间切换,而是开始只是……提出需求。智能体弄清其余的。
对软件这个概念本身来说: 产品不再是你去的地方,而变成了来到你身边的能力。
8、结束语
我意识到这一切听起来有点宏大,尤其这始自我对自己正在构建的一个旅行应用的自言自语。但我不断顺着这条线索走,它不断引向同一个地方。
AI智能体就是应用。其他一切——MCP服务器、API、偶尔的可视界面——都是连接组织。智能体才是人们真正与之建立关系的东西。
未来人们会付费的应用不是目的地。它们是能力。而赢家将是那些最容易被智能体拾起并使用的。
这是否意味着我们所知的应用会消失?可能不会完全消失。但我认为它会变得更像是一个插件而不是一个产品。而那个比任何人都更好地做一件事的插件,以一种任何智能体都能调用的方式,以一种可靠、可预测、文档良好的方式?
这是不是新的杀手级应用?
原文链接: The AI Agent Is the App
汇智网翻译整理,转载请标明出处