前沿AI公司终将凋零
我在AI领域交谈过的每一个人都一直假设AI的未来是更少数玩家拥有的更大模型。我理解……他们能看到过去10年非常明显的趋势,并将这种观点带到每一个AI监管、投资者策略、VC融资路演和未来主义预测中。
但他们错得不能再错了,而且现在数据已经证明了这一点。较小AI模型的网络在速度、准确性和成本方面都超越了每一个前沿AI系统(包括Fable/Mythos)。
IBM、美国政府、贝尔电话、贝尔实验室以及其他所有人在1960年代对大型计算机的判断都是错的……而今天所有人对集中式AI的判断也都是错的。未来是一个神经网络的网络。它是AI的PC+互联网。未来不是开源或闭源AI……而是网络源AI。
1、经济博弈已经结束
如果"AI竞赛"是一场最大化AI能力/速度并最小化成本的竞赛……如果AI用户从根本上要么追求最大可能的能力……要么追求最低价格下的最佳交易(能力+速度),那么集中式AI竞赛已经结束,去中心化AI已经明确获胜。要了解原因,让我们逐一来看。
1.1 能力
神经网络的网络现在比任何前沿AI系统都更快、更便宜、更强。博弈已经结束。我亲自测试了这一点,互联网的多个角落也在验证这一点。这是今天刚刚发布的一个:
它不仅展示了如何超越最佳模型的准确率,而且以一半的价格击败了最佳模型。我在6个月前亲自使用了相同的技术。当时,以下是前沿AI模型在人类最后一次考试的选择题部分上的得分。
而且……它们的一个差分隐私组合达到了低50多分!
底线……如果你想要世界上最有能力的AI系统……从今天开始……你只能从**较弱AI模型的路由/加权集成中获得。**由于扩展定律/集成的工作原理,没有任何单一的前沿AI系统将再次达到能力前沿(下面会详细说明)。
1.2 速度
开源模型就是更快,部分原因是托管它们的人只靠交付极快/极便宜的结果来赚钱。不信我?OpenRouter有独立评级(注意:这与这些公司的销售说辞不同……这是实际发生的情况)。
1.3 成本
开源模型以推理成本提供(训练基本免费)。全行业来看,同样的智能水平下它们更便宜……但以前存在一个差距,集中式AI是达到最高智能水平的唯一途径:
但现在这张图正在被改写……因为一种不同种类的去中心化AI正在出现……在撰写本文时,获得Fable/Mythos级别性能最便宜的方式……不再是FABLE/MYTHOS……基本上是GPT和Opus的任何排列组合(包括Opus与自身的组合!)。
而这张图遗漏的是……如果他们添加更多模型……能力会继续上升(我知道这一点,因为我6个月前亲自做了这些实验)。例如……你可能对上面的列表有疑问,因为它主要包含闭源模型……但最新的Kimi模型今天刚刚发布……它毫无疑问将与Opus或GPT-5.5结合,达到Fable水平,同时更便宜。我为什么知道?因为Kimi K2.7比OpenRouter集成的除了Fable之外的任何模型都更好。
标准打法是:取任何前沿AI模型,找到下一个最佳(更便宜的)前沿AI模型,将其与领先的开源模型集成,现在你就得到了一个更便宜版本的前沿模型。这会不断递归。更大的集成、更好的路由器、更好的准确性、更低的成本。
所谓的"前沿AI公司"将永远无法再次达到准确率/成本/速度前沿。前沿现在由领先模型和公司的网络所拥有。
2、为什么集中式AI无法回应:九头蛇效应
当今集中式AI公司面临的问题与20世纪后期大型计算公司面临的问题相同。一旦互联网开始通过电话线将大型计算机连接起来……大型计算机网络 总是比任何单台大型计算机更强。
这意味着……每次他们添加一台更强的大型计算机来对抗互联网……互联网只是将那台大型计算机纳入其网络,变得更加强大。你最喜欢的VC、播客主或前沿营销部门可能不同意……但现在*单一家公司拥有AI前沿已经不可能了。*船已离港。游戏结束。
欢迎来到神经网络的网络。
2.1 基本理论:准确性
为什么这种竞争优势如此稳固?坦率地说,它基于对机器学习如此基本的原理……几乎不算研究。
事情是这样的……在AI研究领域待了足够长时间的人都记得2010-2020年左右在NeurIPS竞争"最先进"准确率是什么感觉。如果你"达到了SOTA",你就能发表论文……你可能还能进入顶级研究生院等。(我作为本科生获得了SOTA,这让我在ICML 2015获得了一作口头报告的机会,因此一个纳什维尔的小本科生得以在DeepMind资助下去牛津,并在2017年加入DeepMind的语言建模研究团队)。竞争SOTA是一件大事。每个人都这样做(许多人现在仍然这样做)。
但有一种达到SOTA的方法太可靠了以至于被*禁止了。如果你将模型加权***集成在一起,你几乎总是获得更好的准确性……即使你集成的是同一模型的多个训练版本(!!)
原因其实很简单……不同的AI模型犯不同的错误。当你结合它们的输出时……它们的错误往往相互抵消……产生更准确的AI预测。做好这件事有一些微妙之处(需要加权集成),但它是有效的。
有趣的部分是……因为它被研究会议禁止了……它也被禁止出现在研究论文中。所以我想……嗯……很多人都忘了。哈哈。总之……这就是为什么一个神经网络的网络总是会击败任何一个神经网络。
但你可能会问……成本呢?
2.2 基本理论:成本
关于一个巨大的神经元束……它目前的形式效率低得令人难以置信。这就是为什么攻克这种低效性正在以每年10-900倍的速度降低AI成本。许多因素在推动这一点,但我想关注算法方面的……特别是缓存和索引。
想象你去了图书馆,问图书管理员"国际象棋的规则是什么?"图书管理员说"请稍等",然后开始阅读整个图书馆里每一本书的每一页……然后回到你面前,给你……🥁……一个token。
这就是GPT-3所做的。它几乎使用每一个神经元来生成每一个token……记住……全世界的知识都在神经元里!
"DeepSeek"时刻是一个简单的想法……"如果图书馆有分区呢!"。那么图书管理员就可以走到"象棋分区"……更快地交付结果。
这指向了AI的理想发展方向……不是专家混合……而是专家混合的混合的混合。是索引!想想图书管理员是怎么做的!当你问图书管理员"国际象棋的规则是什么?"他们会:
- 区域: 走到游戏区域
- 书架: 找到摆放象棋书籍的书架
- 书籍: 扫描书脊寻找"国际象棋入门书"或类似的
- 章节: 扫描目录寻找"规则概述"
- 段落: 找到给出象棋规则高层次概述的段落,走回你面前,把那段话交给你。
这比每次生成token时阅读每个书架上每本书的每一页高效了大约十亿倍(因此也更便宜!)。
AI正在做同样的事情……而且原因相同……最快和最低成本的方案将是一个巨大的世界神经元索引……而不是一个在每次生成token时考虑宇宙中每个可能事实的单一模糊网络。而一个全球神经网络网络是有史以来最史诗规模的缓存+索引。网络上的每个模型都是内部心智模型的"缓存"(存储在神经元中)。你找到它们的方式是路由器……巨大的索引。这就是它将获胜的原因。稍后再详细说明。
2.3 基本理论:速度
成本的基本论证与速度的基本论证相同……但我要解决一个疑问:AI模型的组合不会比任何单一AI模型更慢吗?
它在"首个token时间"(你等待响应开始流式传输的时间)方面会更慢,但在"整体tok/s"方面不会……而后者才是真正重要的。基本上……如果你并行调用50个模型并用另一个模型组合它们……延迟会受到影响(50个模型中最慢的速度+组合模型的速度),但带宽是一样的。它会流式传输给你(再次……看OpenRouter)。
2.4 综合:新的AI经济
总的来说,市场力量和机器学习的基本原理正在接管,虽然非理性、既得利益和炒作可能还会持续一段时间……但最终账单会到期。我们正在实时看到这一切发生。
3、地缘政治博弈已经结束
AI的能力取决于用于创建它的数据、计算和人才的数量。这实际上是我刚才提到的集成/九头蛇效应的另一种描述方式。因为**当你集成AI模型时……你隐式地结合了它们的数据、计算和算法。**扩展定律告诉我们……集成获胜。所以从地缘政治角度来看,这就引出了一个问题:哪个国家将赢得AI竞赛?
2010-2026:公司级AI
直到现在(比如……基本上就是今天),世界一直生活在"公司级AI"中……意味着AI的能力等同于最大公司能聚集的数据、计算和人才的总量。这就是为什么最大、最强、最前沿的AI来自最大的公司(Google、Microsoft、OpenAI、Anthropic等)。他们有将数据、计算和人才聚集在一起所需的资金。
2026-2026:国家级AI
今年,AI似乎即将被国家所拥有。中国显然处于有利位置(从政治制度角度来看),可以在14亿人口的国家中国有化数据、计算和人才。美国正在试探对其AI公司50%的所有权……并且现在正在控制AI模型何时发布以及谁被允许使用它们。
理论上……这是新的前沿。国家可以在扩展定律上碾压任何公司……训练出最大、最强(和最安全?)的AI模型。对吧?
2026-永远:世界级AI
但现在……坦率地说……我们正在跳过这一步。美国政府刚刚禁止了Fable……而*24小时内,AI互联网正在通过OpenRouter提供超越Fable水平的质量。*还认为我们会在国家级AI上花时间吗?再想想吧。
这以前就发生过。
TCP/IP/HTTP/WWW都是变得太受欢迎太快了的协议原型……将全世界的大型计算机(以及后来的个人计算机)连接成一个比任何特定计算机都强大得多的网络。我不开玩笑……ARPANET的提案字面意思是:将大型计算机连接在一个分时网络中。这就是重点。网络大于节点。
但当时……大型计算就是最酷的东西。理论上"世界最终只需要大约5台大型计算机"(更多的是一个梗而非原话……但你懂意思)。
但这并没有发生……因为同样的范式……美国+欧洲也直接从公司级计算跳到了世界级计算……而且美国+欧洲因为最先到达而主导了信息技术50年(WWW来自欧洲,分组交换来自英国,TCP/IP来自美国……组合成一个偏向开放、自由、民主、互操作性的全球网络,并从此产生了巨大的文化影响)。
我们正在跳过国家级AI,直接进入世界级AI。如果你为国家政府工作并且正在读这一行……对抗它不是获胜的方式。当世界级AI摆在桌面上时,试图留在国家级AI是……坦率地说……愚蠢的。相反的策略(WWW/TCP/HTTP等策略才是获胜的方式)。封闭自己会将你从全球网络中隔离,而中间力量将在中央力量之前崛起。
认为这以前没发生过?再想想吧 :)
4、文化博弈已经结束
社会资本已经流向拥有最强能力或最受欢迎AI系统的人……DeepMind凭借AlphaGo登顶。OpenAI凭借ChatGPT领先。Anthropic凭借Claude等等。
这已经不可能维持了。我确信前沿AI的营销部门会很好地管理这一转型(他们拥有……真的……世界上最好的广告/营销头脑),但最终……"真相会水落石出"。
这也将颠覆拟人化。当它明显是一个集体智慧时,很难声称它是单一的思维……而那个集体智慧中的个体参与者可以随时开启/关闭他们对集体的贡献。我们正在获得一个智能的经济。
5、接下来会发生什么?
简而言之:
- 代替开源/闭源AI的……网络源AI
- 代替公司级AI的……世界级AI
- 代替集中化的……联邦化和去中心化AI
- 代替数据殖民主义的……数据主权
- 代替监控的……隐私
- 代替合理使用的……版权(!)
- 代替数据孤岛的……全球互联数据(这里有百万倍更多的数据!)
- 代替AI作为核武器的……AI作为互联网
- 代替AI作为单一思维的……心智模型的开放市场
- 代替失控的……集体控制
- 代替AI偏见的……代表性查询
- 代替围墙花园的……互操作性
- 代替虚假信息的……基于归因的信任链
- 代替AI单边控制的……AI的基于归因的控制
- 代替深度学习的……深度投票
- 代替广播的……广泛聆听
短期:市场与对话之间的不一致
如果股市需要很长时间才会崩盘,既得利益者会坚持一段时间。如果出现市场回调,对低成本方案的需求可能会创造更戏剧性的转变,人们会自行托管开源模型并彼此(或跨企业)点对点连接。庞然大物不会一夜之间转向……即使基本面明显指向不同的方向。
长期:JCR Licklider对互联网的原始愿景得以实现。
JCR Licklider是ARPANET背后的远见者……ARPANET成为了互联网。1968年,他写了(对我来说)20世纪最重要的信息技术论文。题目是"计算机作为通信设备"。
- 前三分之一: 将改变你对通信的思考方式
- 中间三分之一: 描述了他对互联网的愿景,即我们今天所知的互联网
- 最后三分之一: ……关于智能体 (是的……AI智能体……在1968年……我告诉你这家伙是个天才)
这里要写的太多了,但集中权力有巨大的失控、价值对齐、偏见、奖励黑客和其他风险。虽然这个新范式改变了最重要的安全问题,但我相信这对于世界上热爱AI安全、自由和民主的人来说是一个深远的胜利。我会尽快写更多关于这个的内容。
原文链接: BREAKING: Today's Frontier AI companies will never exceed the AI capability frontier again
汇智网翻译整理,转载请标明出处