前沿AI公司终将凋零

我在AI领域交谈过的每一个人都一直假设AI的未来是更少数玩家拥有的更大模型。我理解……他们能看到过去10年非常明显的趋势，并将这种观点带到每一个AI监管、投资者策略、VC融资路演和未来主义预测中。

但他们错得不能再错了，而且现在数据已经证明了这一点。较小AI模型的网络在速度、准确性和成本方面都超越了每一个前沿AI系统（包括Fable/Mythos）。

IBM、美国政府、贝尔电话、贝尔实验室以及其他所有人在1960年代对大型计算机的判断都是错的……而今天所有人对集中式AI的判断也都是错的。未来是一个神经网络的网络。它是AI的PC+互联网。未来不是开源或闭源AI……而是网络源AI。

1、经济博弈已经结束

如果"AI竞赛"是一场最大化AI能力/速度并最小化成本的竞赛……如果AI用户从根本上要么追求最大可能的能力……要么追求最低价格下的最佳交易（能力+速度），那么集中式AI竞赛已经结束，去中心化AI已经明确获胜。要了解原因，让我们逐一来看。

1.1 能力

神经网络的网络现在比任何前沿AI系统都更快、更便宜、更强。博弈已经结束。我亲自测试了这一点，互联网的多个角落也在验证这一点。这是今天刚刚发布的一个：

它不仅展示了如何超越最佳模型的准确率，而且以一半的价格击败了最佳模型。我在6个月前亲自使用了相同的技术。当时，以下是前沿AI模型在人类最后一次考试的选择题部分上的得分。

而且……它们的一个差分隐私组合达到了低50多分！

这是一个斯坦福学生做到这一点并创办了一家公司。

底线……如果你想要世界上最有能力的AI系统……从今天开始……你只能从**较弱AI模型的路由/加权集成中获得。**由于扩展定律/集成的工作原理，没有任何单一的前沿AI系统将再次达到能力前沿（下面会详细说明）。

1.2 速度

开源模型就是更快，部分原因是托管它们的人只靠交付极快/极便宜的结果来赚钱。不信我？OpenRouter有独立评级（注意：这与这些公司的销售说辞不同……这是实际发生的情况）。

1.3 成本

开源模型以推理成本提供（训练基本免费）。全行业来看，同样的智能水平下它们更便宜……但以前存在一个差距，集中式AI是达到最高智能水平的唯一途径：

但现在这张图正在被改写……因为一种不同种类的去中心化AI正在出现……在撰写本文时，获得Fable/Mythos级别性能最便宜的方式……不再是FABLE/MYTHOS……基本上是GPT和Opus的任何排列组合（包括Opus与自身的组合！）。

而这张图遗漏的是……如果他们添加更多模型……能力会继续上升（我知道这一点，因为我6个月前亲自做了这些实验）。例如……你可能对上面的列表有疑问，因为它主要包含闭源模型……但最新的Kimi模型今天刚刚发布……它毫无疑问将与Opus或GPT-5.5结合，达到Fable水平，同时更便宜。我为什么知道？因为Kimi K2.7比OpenRouter集成的除了Fable之外的任何模型都更好。

新Kimi模型基准测试

标准打法是：取任何前沿AI模型，找到下一个最佳（更便宜的）前沿AI模型，将其与领先的开源模型集成，现在你就得到了一个更便宜版本的前沿模型。这会不断递归。更大的集成、更好的路由器、更好的准确性、更低的成本。

所谓的"前沿AI公司"将永远无法再次达到准确率/成本/速度前沿。前沿现在由领先模型和公司的网络所拥有。

2、为什么集中式AI无法回应：九头蛇效应

当今集中式AI公司面临的问题与20世纪后期大型计算公司面临的问题相同。一旦互联网开始通过电话线将大型计算机连接起来……大型计算机网络总是比任何单台大型计算机更强。

这意味着……每次他们添加一台更强的大型计算机来对抗互联网……互联网只是将那台大型计算机纳入其网络，变得更加强大。你最喜欢的VC、播客主或前沿营销部门可能不同意……但现在*单一家公司拥有AI前沿已经不可能了。*船已离港。游戏结束。

欢迎来到神经网络的网络。

2.1 基本理论：准确性

为什么这种竞争优势如此稳固？坦率地说，它基于对机器学习如此基本的原理……几乎不算研究。

Critch……他的推文应该获得更多浏览量

事情是这样的……在AI研究领域待了足够长时间的人都记得2010-2020年左右在NeurIPS竞争"最先进"准确率是什么感觉。如果你"达到了SOTA"，你就能发表论文……你可能还能进入顶级研究生院等。（我作为本科生获得了SOTA，这让我在ICML 2015获得了一作口头报告的机会，因此一个纳什维尔的小本科生得以在DeepMind资助下去牛津，并在2017年加入DeepMind的语言建模研究团队）。竞争SOTA是一件大事。每个人都这样做（许多人现在仍然这样做）。

但有一种达到SOTA的方法太可靠了以至于被*禁止了。如果你将模型加权***集成在一起，你几乎总是获得更好的准确性……即使你集成的是同一模型的多个训练版本（！！）

原因其实很简单……不同的AI模型犯不同的错误。当你结合它们的输出时……它们的错误往往相互抵消……产生更准确的AI预测。做好这件事有一些微妙之处（需要加权集成），但它是有效的。

有趣的部分是……因为它被研究会议禁止了……它也被禁止出现在研究论文中。所以我想……嗯……很多人都忘了。哈哈。总之……这就是为什么一个神经网络的网络总是会击败任何一个神经网络。

但你可能会问……成本呢？

2.2 基本理论：成本

关于一个巨大的神经元束……它目前的形式效率低得令人难以置信。这就是为什么攻克这种低效性正在以每年10-900倍的速度降低AI成本。许多因素在推动这一点，但我想关注算法方面的……特别是缓存和索引。

LLM推理价格

想象你去了图书馆，问图书管理员"国际象棋的规则是什么？"图书管理员说"请稍等"，然后开始阅读整个图书馆里每一本书的每一页……然后回到你面前，给你……🥁……一个token。

这就是GPT-3所做的。它几乎使用每一个神经元来生成每一个token……记住……全世界的知识都在神经元里！

"DeepSeek"时刻是一个简单的想法……"如果图书馆有分区呢！"。那么图书管理员就可以走到"象棋分区"……更快地交付结果。

这指向了AI的理想发展方向……不是专家混合……而是专家混合的混合的混合。是索引！想想图书管理员是怎么做的！当你问图书管理员"国际象棋的规则是什么？"他们会：

区域： 走到游戏区域
书架： 找到摆放象棋书籍的书架
书籍： 扫描书脊寻找"国际象棋入门书"或类似的
章节： 扫描目录寻找"规则概述"
段落： 找到给出象棋规则高层次概述的段落，走回你面前，把那段话交给你。

这比每次生成token时阅读每个书架上每本书的每一页高效了大约十亿倍（因此也更便宜！）。

AI正在做同样的事情……而且原因相同……最快和最低成本的方案将是一个巨大的世界神经元索引……而不是一个在每次生成token时考虑宇宙中每个可能事实的单一模糊网络。而一个全球神经网络网络是有史以来最史诗规模的缓存+索引。网络上的每个模型都是内部心智模型的"缓存"（存储在神经元中）。你找到它们的方式是路由器……巨大的索引。这就是它将获胜的原因。稍后再详细说明。

2.3 基本理论：速度

成本的基本论证与速度的基本论证相同……但我要解决一个疑问：AI模型的组合不会比任何单一AI模型更慢吗？

它在"首个token时间"（你等待响应开始流式传输的时间）方面会更慢，但在"整体tok/s"方面不会……而后者才是真正重要的。基本上……如果你并行调用50个模型并用另一个模型组合它们……延迟会受到影响（50个模型中最慢的速度+组合模型的速度），但带宽是一样的。它会流式传输给你（再次……看OpenRouter）。

2.4 综合：新的AI经济

总的来说，市场力量和机器学习的基本原理正在接管，虽然非理性、既得利益和炒作可能还会持续一段时间……但最终账单会到期。我们正在实时看到这一切发生。

3、地缘政治博弈已经结束

AI的能力取决于用于创建它的数据、计算和人才的数量。这实际上是我刚才提到的集成/九头蛇效应的另一种描述方式。因为**当你集成AI模型时……你隐式地结合了它们的数据、计算和算法。**扩展定律告诉我们……集成获胜。所以从地缘政治角度来看，这就引出了一个问题：哪个国家将赢得AI竞赛？

2010-2026：公司级AI

直到现在（比如……基本上就是今天），世界一直生活在"公司级AI"中……意味着AI的能力等同于最大公司能聚集的数据、计算和人才的总量。这就是为什么最大、最强、最前沿的AI来自最大的公司（Google、Microsoft、OpenAI、Anthropic等）。他们有将数据、计算和人才聚集在一起所需的资金。

2026-2026：国家级AI

今年，AI似乎即将被国家所拥有。中国显然处于有利位置（从政治制度角度来看），可以在14亿人口的国家中国有化数据、计算和人才。美国正在试探对其AI公司50%的所有权……并且现在正在控制AI模型何时发布以及谁被允许使用它们。

理论上……这是新的前沿。国家可以在扩展定律上碾压任何公司……训练出最大、最强（和最安全？）的AI模型。对吧？

2026-永远：世界级AI

但现在……坦率地说……我们正在跳过这一步。美国政府刚刚禁止了Fable……而*24小时内，AI互联网正在通过OpenRouter提供超越Fable水平的质量。*还认为我们会在国家级AI上花时间吗？再想想吧。

这以前就发生过。

TCP/IP/HTTP/WWW都是变得太受欢迎太快了的协议原型……将全世界的大型计算机（以及后来的个人计算机）连接成一个比任何特定计算机都强大得多的网络。我不开玩笑……ARPANET的提案字面意思是：将大型计算机连接在一个分时网络中。这就是重点。网络大于节点。

但当时……大型计算就是最酷的东西。理论上"世界最终只需要大约5台大型计算机"（更多的是一个梗而非原话……但你懂意思）。

但这并没有发生……因为同样的范式……美国+欧洲也直接从公司级计算跳到了世界级计算……而且美国+欧洲因为最先到达而主导了信息技术50年（WWW来自欧洲，分组交换来自英国，TCP/IP来自美国……组合成一个偏向开放、自由、民主、互操作性的全球网络，并从此产生了巨大的文化影响）。

我们正在跳过国家级AI，直接进入世界级AI。如果你为国家政府工作并且正在读这一行……对抗它不是获胜的方式。当世界级AI摆在桌面上时，试图留在国家级AI是……坦率地说……愚蠢的。相反的策略（WWW/TCP/HTTP等策略才是获胜的方式）。封闭自己会将你从全球网络中隔离，而中间力量将在中央力量之前崛起。

认为这以前没发生过？再想想吧 :)

4、文化博弈已经结束

社会资本已经流向拥有最强能力或最受欢迎AI系统的人……DeepMind凭借AlphaGo登顶。OpenAI凭借ChatGPT领先。Anthropic凭借Claude等等。

这已经不可能维持了。我确信前沿AI的营销部门会很好地管理这一转型（他们拥有……真的……世界上最好的广告/营销头脑），但最终……"真相会水落石出"。

这也将颠覆拟人化。当它明显是一个集体智慧时，很难声称它是单一的思维……而那个集体智慧中的个体参与者可以随时开启/关闭他们对集体的贡献。我们正在获得一个智能的经济。

5、接下来会发生什么？

简而言之：

代替开源/闭源AI的……网络源AI
代替公司级AI的……世界级AI
代替集中化的……联邦化和去中心化AI
代替数据殖民主义的……数据主权
代替监控的……隐私
代替合理使用的……版权（！）
代替数据孤岛的……全球互联数据（这里有百万倍更多的数据！）
代替AI作为核武器的……AI作为互联网
代替AI作为单一思维的……心智模型的开放市场
代替失控的……集体控制
代替AI偏见的……代表性查询
代替围墙花园的……互操作性
代替虚假信息的……基于归因的信任链
代替AI单边控制的……AI的基于归因的控制
代替深度学习的……深度投票
代替广播的……广泛聆听

短期：市场与对话之间的不一致

如果股市需要很长时间才会崩盘，既得利益者会坚持一段时间。如果出现市场回调，对低成本方案的需求可能会创造更戏剧性的转变，人们会自行托管开源模型并彼此（或跨企业）点对点连接。庞然大物不会一夜之间转向……即使基本面明显指向不同的方向。

长期：JCR Licklider对互联网的原始愿景得以实现。

JCR Licklider是ARPANET背后的远见者……ARPANET成为了互联网。1968年，他写了（对我来说）20世纪最重要的信息技术论文。题目是"计算机作为通信设备"。

前三分之一： 将改变你对通信的思考方式
中间三分之一： 描述了他对互联网的愿景，即我们今天所知的互联网
最后三分之一： ……关于智能体（是的……AI智能体……在1968年……我告诉你这家伙是个天才）

这里要写的太多了，但集中权力有巨大的失控、价值对齐、偏见、奖励黑客和其他风险。虽然这个新范式改变了最重要的安全问题，但我相信这对于世界上热爱AI安全、自由和民主的人来说是一个深远的胜利。我会尽快写更多关于这个的内容。

原文链接: BREAKING: Today's Frontier AI companies will never exceed the AI capability frontier again

汇智网翻译整理，转载请标明出处