AI Agent 正在成为新的经济参与者

代理正在作为一种新的经济参与者出现:一种新的委托消费者(或购物者),在身份、支付、记忆和商业方面有原生需求。

AI Agent 正在成为新的经济参与者
AI模型价格对比 | AI工具导航 | ONNX模型库 | Vibe Coding教程 | PLC在线仿真器 | Tripo 3D | Meshy AI | ElevenLabs | KlingAI | ArtSpace | Phot.AI | InVideo

Jesus Rodriguez下面的文章提出了一个令人信服的论点:代理正在作为一种新的经济参与者出现:一种新的委托消费者(或购物者),在身份、支付、记忆和商业方面有原生需求。我们认同他的观点,即互联网是为人类构建的,现在必须部分地为机器重建。

机制。关于这种重建如何发生,我们想补充一点谨慎的说明。Rodriguez描述的,用我们的语言来说,是将"缺失的机制"问题应用于代理。Tim曾论证市场需要机制来支持分布式价值创造和参与。*机制是激励自利参与者产生诚实披露的工程化规则,可以旨在建立一个使所有参与者受益的市场,而不是单一家公司。*机制的规则决定拍卖、投票(无支付)、公共物品空间等的结果和支付。它们可以使市场正常运行,否则由于代理通过隐藏信息和不愿参与而采取策略性行为(例如"为什么要许可数据,你可以直接抓取"),市场将无法运转。

代理经济现在正在面对自己的缺失市场问题(正如Google的搜索和Amazon的市场曾经面临的):但它缺少的是为代理而非为人类的机制。 委托、证明、支付范围、机器可读的来源、代理身份、记忆边界应该首先成为互联网和AI标准,作为代理市场的基础,然后才是创新性的竞争产品特性。这两者可以也应该作为在线构建市场的兼容概念化而存在——作为开放的、对公众有益的空间。

Rodriguez下面描述的代理AI市场各层将会被构建。问题是如何将它们实现为开放的、模块化的基础设施,而不是专有的瓶颈?

默认值仍然柔软,市场结构仍然流动。它们不会长久如此。

— Tim O'Reilly & Ilan Strauss

1、AI市场

在互联网的头几十年里,软件中有一个相当稳定的假设:用户是人类。

人类有眼睛、浏览器、鼠标、密码管理器、信用卡、电子邮件地址、对模态对话框的容忍度,以及有限的耐心。整个SaaS和消费互联网栈围绕这种用户形态成长。搜索引擎为人类排名页面。电商网站为人类优化漏斗。CRM跟踪人类销售代表向人类买家销售。身份系统验证人类。分析系统测量人类点击、人类会话、人类转化。

2、然后我们开始构建AI代理

起初,代理看起来像玩具。一个可以预约日历邀请的聊天机器人。一个可以打开拉取请求的编程助手。一个可以代表你导航网站——缓慢地、有些滑稽地——的浏览器代理。但在笨拙的表面之下,有些重要的东西:软件不再仅仅被人类使用。软件正在被能够推理、计划、交易、记忆、委托和重试的软件所使用。

这是一个比"聊天机器人是新的UI"大得多的转变。它更接近一种新经济参与者的出现。不是法律人,不是人类的替代品,也不是魔法。而是一种新的消费者。

代理消费信息。代理消费API。代理消费存储、计算、工具、工作流、凭证、支付和服务。代理评估选项、发出请求、协商约束并执行任务。它们不仅仅是现有软件的另一个界面。它们是一个新的需求面。

一旦你把代理看作消费者,很多软件格局开始看起来奇异地错位。

代理的Salesforce可能不是Salesforce。代理的Google可能不是Google。代理的Amazon可能不是Amazon。不是因为这些公司很弱,而是因为当消费者改变时,基础要素也改变了。

使用Salesforce的人类想要仪表板、联系人、管道阶段、笔记、提醒和报告。使用CRM的代理想要别的东西:结构化状态、任务目标、关系图、受限记忆、机器可读的销售手册,以及用于更新意图的可靠API。它不需要一个漂亮的仪表板。它需要一个客户真相的标准基底,可以安全地查询、变更和推理。

使用Google的人类想要排名的蓝色链接、摘要、地图、视频,可能还有答案框。使用搜索的代理想要来源、新鲜度、置信区间、引用、实体解析、模式对齐,以及在自动化下稳定的检索接口。它不想要十个链接。它想知道哪个来源对特定声明具有权威性,自上次运行以来发生了什么变化,以及这个答案是否安全可以据此行动。

在线购物的人类想要产品照片、评论、折扣、送货估计和结账页面。代表人类购物的代理想要产品元数据、兼容性约束、退货政策、供应商可靠性评分、支付授权范围、欺诈保证,以及可以被另一台机器解析的收据。它不浏览。它在约束条件下解决优化问题。

这就是为什么"只是给代理浏览器访问"既令人兴奋又显然是暂时的。浏览器访问是向后兼容。它有用,就像API之前的屏幕抓取有用一样。但如果代理成为一类主要的软件用户,我们应该预期会出现代理原生的基础设施。

Web是围绕人类注意力设计的。代理经济将围绕机器行动而设计。

3、考虑身份

今天,互联网上的身份主要是证明人类被允许做某事的一种仪式。我们使用密码、通行密钥、OAuth、SSO、设备指纹、CAPTCHA和风险引擎。这些系统假设循环中某处有一个人类主体。

代理以微妙的方式打破了这个模型。代理不完全是用户。它也不完全是员工、机器人、服务账户或OAuth应用。它可能代表一个人行事,但只在一定范围内。它可能需要买杂货但不能买酒,可以安排会议但不能取消医疗预约,可以给客户发邮件但不能更改定价,可以部署代码但不能轮换生产密钥。

所以代理身份需要将委托作为一等原语。不是"这是我的密码,去办事。"不是"这是一个权限可怕的广泛API令牌。"而是:这是一个代理,代表此主体,为此目标,在此时间窗口内,使用此预算,使用这些工具,在这些审计要求下行事。

这意味着基础设施:代理护照、委托凭证、基于能力的访问控制、撤销系统、策略引擎,以及不仅解释发生了什么、还解释代理为什么认为它被允许行动的审计日志。

"为什么"很重要。一个普通的API日志可能说:POST /refunds 成功。一个代理原生的审计日志应该说:代理发出了退款,因为客户满足策略条件X,订单延迟了Y天,用户之前授权过低于Z美元的退款,且不存在更高的风险标志。这不仅仅是可观察性。这是问责性。

4、现在考虑支付

人类支付围绕卡片、钱包、银行账户、结账页面、欺诈预防和争议解决而优化。该系统设计为人类有意识地批准交易,即使这种批准已经越来越多地压缩成一次点击或一次生物识别扫描。

代理引入了一种不同的支付模式:受限自主性。

一个旅行代理可能被允许花费高达1500美元购买航班,但前提是到达时间在下午6点之前,中转时间不到两小时,航空公司不在黑名单上,且票价可退款。一个采购代理可能被允许在月度部门预算内购买云信用、办公设备或数据增强服务。一个编程代理可能为完成一个任务而支付API调用、基准测试运行或临时计算的费用。

这需要比消费者结账更具可编程性、又比企业采购更轻量的支付轨道。我们需要支出信封、机器可读的发票、预授权预算、可逆交易、代理声誉、商家证明和实时策略检查。

信用卡号码对于自主参与者来说是一个糟糕的界面。它是一个拥有太多权限和太少上下文的持有者令牌。代理支付可能更像是签名意图:"代理A,代表用户B,被授权为商户C支付目的E的金额D,受策略F约束。"商户应该能够验证这一点。用户应该能够撤销它。系统应该能够对其进行争议。代理应该能够在行动之前对其进行推理。

5、电子商务也发生了变化

大多数在线商店是说服机器。它们旨在将人类的不确定性转化为购买行为。推荐模块、稀缺横幅、优惠券转盘、捆绑包、赞助位和暗模式都存在,因为人类容易受影响、是视觉动物且忙碌。

代理也忙碌,但方式不同。它们不会被山上背包的英雄图片所感动。它们可能对其他东西更脆弱:被污染的评论、被操纵的元数据、对抗性的产品描述、虚假的兼容性声明、隐藏费用,或针对代理排名算法优化的供应商。

所以代理商业将需要不同的信任层。产品页面变得不如产品规格重要。评论变得不那么有用,除非它们是结构化的、经过验证的且抗操纵的。退货政策需要是机器可读的。可用性需要可查询。捆绑包需要明确的语义。"最适合我的笔记本电脑"变成约束条件之间的协商:工作负载、预算、便携性、电池、可修复性、交付时间、保修、供应商信任和用户偏好记忆。

相当于代理SEO的东西将令人着迷又可怕。今天,公司优化页面以在人类搜索中排名。明天,它们将优化结构化表示以被买家代理选中。这将产生新的垃圾信息、新的欺诈、新的排名游戏和新的防御基础设施。我们应该假设每个代理可读的市场一旦有足够的资金流过就会变成对抗性的。

6、数据存储也发生了变化

人类软件将数据视为要展示、搜索和报告的东西。代理软件将数据视为工作记忆。代理需要跨任务的持久上下文:用户偏好、先前的决策、组织策略、项目状态、个人约束和学习到的模式。但它们也需要记忆边界。记住一切不是智能。它是责任。

代理原生的存储层需要多种记忆。有情景记忆:上一个任务发生了什么。语义记忆:关于用户或组织的稳定事实。程序性记忆:如何执行重复的工作流。策略记忆:什么是被允许的。来源记忆:某个信念从何而来。以及草稿记忆:可能应该过期的临时推理产物。

这个存储层必须支持检索、来源追溯、删除、摘要、权限划分和冲突解决。它必须知道"用户偏好早班航班"与"用户昨天授权了一笔700美元的购买"不是同一种事实。它必须区分过时的偏好和硬约束。它必须以减少幻觉而非放大幻觉的方式向代理暴露记忆。

在人类互联网中,数据通常被收集是因为它可能以后变得有用。在代理互联网中,数据变得直接可操作。如果代理记错了,它就会行动错误。记忆bug变成行动bug。

7、这引出了软件设计本身

令人惊讶的是,当前有大量软件对代理是不友好的,因为它是为人类构建的。没有语义标签的按钮。PDF而不是结构化文档。需要解读的电子邮件。有图表但没有底层查询API的仪表板。只为律师编写的服务条款。什么都不解释的错误消息。需要人类点击五个屏幕的工作流——因为产品团队想要参与度。

代理暴露了非结构化软件的隐性税收。

对代理友好的软件将有不同的美德。它将是明确的、可检查的、可组合的和事务性的。它将提供API不是事后补充,而是作为主要界面。它将描述能力、成本、副作用和失败模式。它将支持试运行。它将尽可能使状态变更可逆。它将提供好的错误消息,因为错误消息不再是为了沮丧的人类;它是为了另一个决定下一步做什么的系统。

最好的代理软件对人类来说可能看起来很无聊。一个伟大的代理原生CRM可能主要是一个图、一个策略引擎、一个事件日志和一组工具合约。一个伟大的代理原生搜索引擎可能看起来像一个检索和验证API。一个伟大的代理原生银行可能看起来像可编程授权加上风险评分。一个伟大的代理原生电商平台可能看起来像一个带有信任原语的巨型约束求解器。

这不意味着人类界面消失。人类仍然设定目标、批准高风险行动、检查结果并改变主意。但重心移动了。人类变得更像委托人、监督者或异常处理者。代理成为高频用户。

这种区别很重要,因为现有公司经常赢得界面转移但失去基础要素转移。

当移动时代到来时,许多桌面公司成功地制作了移动应用。但最大的移动原生公司不仅仅是缩小屏幕上的桌面产品。它们是围绕新基础要素构建的:GPS、摄像头、推送通知、联系人、传感器、应用商店和始终在线的连接。

代理类似。在旧产品上添加聊天机器人并不等同于围绕代理使用重建产品。赢家可能是那些早期理解新基础要素的公司:委托、记忆、工具使用、验证、策略、代理身份、机器可读商业和自主支付。

"代理是一种新消费者"这个说法听起来是隐喻性的,但它实际上是相当字面的。消费者创造需求。需求重塑市场。市场奖励服务于消费者原生行为的基础设施。

人类点击。代理调用工具。

人类浏览。代理查询。

人类遗忘。代理持久化记忆。

人类批准。代理需要委托授权。

人类视觉比较。代理在结构化约束上优化。

人类容忍模糊性。代理需要可执行的语义。

人类可以被说服。代理可以被攻击。

一旦代理变得普遍,每个软件公司将面临一个基本问题:你的产品是否只是可以被代理使用,还是为它们而构建?

这个区别很重要。一个代理可以痛苦导航的网站不是代理原生的。一个暴露几个端点的API不是代理原生的。一个附加在仪表板上的聊天机器人不是代理原生的。代理原生软件将自主参与者视为具有身份、权限、记忆、预算、目标和问责的一等用户。

我们处于足够早的阶段,以至于其中很多看起来仍然是推测性的。代理不可靠。标准不成熟。演示会崩溃。经济不明确。但这通常就是新消费者在开始时的样子。移动应用曾经是玩具。云工作负载曾经是实验。在线支付曾经令人害怕。开发者API曾经是小众。

然后,慢慢地,玩具变成工作流。工作流变成习惯。习惯变成基础设施。而基础设施变得不可见。

互联网是为人类构建的,然后为机器打了补丁。下一个互联网可能是为机器构建的,而人类处于指挥地位。

这就是机会:不仅仅是构建代理,而是构建它们将消费的世界。


原文链接: The Salesforce of Agents Wont Be Salesforce

汇智网翻译整理,转载请标明出处