上下文聚合:真正的AI战场?
假设你已经结婚30年了,有3个孩子,住在美国。想想你在过去30年里积累的所有关于生活、你的家庭、他们的偏好、愿望、问题等的知识。谁会更好地回答关于你过去30年生活的所有问题?谷歌、亚马逊、元宇宙?还是你的配偶?当然是你的配偶。他们有几十年的生活经验。
问一个LLM:
“我应该如何翻新我的主浴室?”
再次说明,仅凭这个问题,它们没有上下文。它们不知道你现在的浴室是什么样子的,或者它如何与你家的其他部分相匹配。答案不会被看作非常良好或相关。因此,对AI持怀疑态度的人如果尝试这样做,会说AI并不很好。如果你问你的配偶这个问题,你会得到一个更相关的答案。
一个AI模型需要有关于情况、问题或对话的相关背景信息,才能产生准确、快速和有用的答案。上下文可以包括:
- 聊天中的对话历史
- 用户意图。你试图完成什么?
- 领域或任务。这是关于编码、写作、医疗、历史等吗?
- 外部数据:你手机上的数据、Google Drive、纸质材料等的信息
- 世界知识。关于时间、地点、人物和涉及实体的事实
这不仅仅是一个大数据问题。上下文是丰富、连接、基于时间、位置感知且不断进化的关于你世界的知识。回想一下已婚配偶的例子:上下文只是信息,它是知道如何做。它是对你喜好、习惯和历史的亲身理解。从这个意义上说,上下文可以被认为是一种数字配偶……真正了解你的AI。(听起来有点可怕,今天。)
你可以在亚马逊看到上下文的实际应用。它知道你买了什么以及你搜索了什么。因此,当你返回时,你会看到“继续你留下的地方”或建议购买你喜欢的东西。并建议重新购买你过去买过的东西。
例如,Instagram Reels每秒运行一个复杂的算法,以尝试根据你过去的观看历史提供越来越多的你可能喜欢的视频。但它对你的亚马逊历史、Google历史、健康信息、电子邮件、旅行历史、朋友或iPhone上的所有信息一无所知。如果它知道呢?
这家初创公司MemO正在朝着保存上下文的方向发展。它允许你保存与不同LLMs的互动,并在不同的LLMs之间共享这些记忆,以减少token使用和重新学习。但在这种系统中,你掌控自己的记忆上下文。
1、并非所有人都在使用AI
尽管媒体和市场炒作,但并非所有人都采用了AI。对于AI公司来说,挑战不是说服高级用户。而是将怀疑的中间群体转化为用户。 这是大多数市场所在的地方,也是机会所在。
要让怀疑的中间群体采用AI,就是面对任何新技术都会遇到的问题。有什么好处?它比我现在怎么做更好?我的同龄人/朋友在使用它吗?为什么要改变?
怀疑的中间群体不会因为模型质量而采用AI;当AI感觉个性化、有用且无摩擦时,他们会采用;并且,它有足够的上下文来为中间群体想要完成的工作提供独特的用户体验。
你可以在我另一篇文章中了解更多关于技术采用的成熟模式:
2、上下文聚合
上下文聚合意味着持续收集并连接用户生活中每一个片段——他们购买、观看、阅读、写作和说话的内容——形成一个统一的理解。回报是如此个性化的体验,以至于感觉几乎像心灵感应。每一次出色的回答都训练你提供更多的数据,创造出一种复利优势,可能会超过当今的搜索或社交护城河(见下方上下文飞轮)。
这种好处导致你不断向上下文聚合器提供数据,使其看起来比你自己更了解你。这是一个巨大的竞争优势,可能比迄今为止任何其他消费者护城河都要大。
上下文聚合是成为新的AI中心聚合者的方法,正如Ben Thompson在聚合理论中所定义的那样。
通过聚合用户的上下文,一个以AI为中心的公司可以提供一个独特类别的用户体验(超越最佳)。这是用户从未体验过的。它提供了比过去和他们所能想象的更好的答案和帮助他们完成工作的能力。
你已经在今天的平台中看到了部分上下文聚合。问题是每个平台只掌握你生活的一个片段。
你目前的上下文分散在许多不同的科技公司中。谷歌是一个上下文聚合者,Meta也是如此。他们根据你与他们服务的互动了解你很多。但还有很多他们不了解。
你通过谷歌搜索旅行目的地。他们可能会看到航班和酒店预订的电子邮件确认,但他们不会知道你做了什么的所有细节。然而,你的智能手机照片可能知道。
想象一下,你在ChatGPT中搜索旅行目的地,然后你佩戴了一个OpenAI上下文捕捉设备,你戴在脖子上,捕捉你去过的所有地方,你吃了什么,你住在哪里。考虑到他们拥有所有这些上下文,他们是否能更好地建议未来的旅行?也许他们会通知你在他们知道你喜欢的地点的航班和酒店优惠。如果他们提供的建议和细节真的让你感到惊讶,你是否会更有可能继续提供更多上下文?如果这一切都是免费的呢?
3、摩擦问题:为什么多模态AI很重要
当前的LLM是文本预测模型。输入和读取文本是让大众使用AI的摩擦点。
多模态输入到AI是加速器。
每种新的输入模式——语音、照片、相机、传感器——都降低了提供上下文的成本。这就是为什么多模态AI会比网络或移动更快传播。
似乎语音和照片(或你的相机)对于怀疑的中间群体来说摩擦更小。你已经可以上传一张照片并询问关于重新装修房间的建议。但这并不广为人知。而且一张照片并不能提供整个房屋的上下文以及居住在房屋中的人们对室内设计的偏好。照片有所帮助,但它只是上下文的一小部分。它不包含整个房子。它不知道你之前的决定。它不知道你配偶的偏好。
再次说明,如果你佩戴一个设备,在你四处走动时捕捉你家的照片,并允许你在想的时候提供语音评论,那么就可以以更少的摩擦捕捉到更相关的上下文。
降低摩擦不仅加快了上下文的构建,还增强了网络效应。每个新用户都会向系统贡献更多有意义的上下文。
4、优势飞轮
目前的聚合器如谷歌、Netflix、亚马逊、Meta和Airbnb服务于非常广泛、水平的市场。正如Ben Thompson在《聚合理论》中指出的那样,他们的服务随着用户数量的增加而变得更好。
这里有差异。信任和隐私将在用户愿意提供更多上下文的程度上发挥更大的作用。毫无疑问,AI提供的结果必须令人惊叹,至少在某些方面,飞轮才能运转。
上下文聚合会如何运作?是否有可能AI公司聚合足够的上下文,使得他们不需要增量用户提供独特的用户体验?也许他们从增量用户那里获得足够的上下文,能够预测未提供的大部分上下文?这将使AI公司更快地整合他们的聚合。
5、结束语
当然,围绕上下文聚合有许多深刻的伦理和隐私考虑因素。这是一个大型的额外话题,值得单独讨论。
当然,还有监管作为另一个完整的主题需要讨论。
在这场战争中,胜者(或胜者)不会是拥有最大模型或最好的AI浏览器的公司。相反,他们会是拥有最丰富、最可信的上下文,服务最多用户,并将他们的上下文转化为前所未有的独特用户体验的公司。这种用户体验将给用户他们想要的东西,但其丰富程度远超他们的预期。这样的体验将进一步巩固上下文聚合者作为AI中最大的赢家。
但是,为了赢得这场胜利,这种用户体验需要帮助大众,即怀疑的中间群体,比他们以前认为的更快、更容易、更便宜地完成事情。正如我所说,要以一种让用户超出他们想象的方式做到这一点。
如果一个以AI为中心的公司旨在赢得上下文战争,它应该开发哪些服务和设备?当Sam Altman谈到实现超级智能时,这如何影响上下文战争?用户是否需要感觉自己拥有一个上下文丰富的AI伙伴的超级智能?
最后的思想实验:试着想出2到3件超级智能AI会为你做的事情,这些事情会让你考虑把它当作一个更深入了解你的上下文的工具。
对于软件开发者来说,编程是一个很好的微观示例。像Claude Code(以及其他)这样的工具了解你的整个仓库、文档、测试和提交历史。你已经习惯了把这种上下文交给它们,因为它们返回的结果通常非常出色。
同样的信任循环——上下文导致更好的结果,进而导致更多的信任——将定义上下文聚合战争的胜者。
原文链接:Is Context Aggregation The Real AI Battleground?
汇智网翻译整理,转载请标明出处