为什么科技巨头互相渗透阵地
OpenAI 在做硬件,Nvidia 在做模型,xAI 在做数据中心,Google 在做所有事情。
人工智能军备竞赛已经从围绕模型智能的单维战斗转变为多层基础设施战争。现在很明显,在 AI 技术栈的单一层级占据一席之地不足以在残酷的竞争或 AI 经济的利润压缩中生存下来。
现代 AI 技术栈由四个关键层级组成。最底层是硬件,即处理数据的物理加速器和 GPU。之上是计算集群,包括容纳硬件的云服务器和千兆瓦级数据中心。接下来是模型层,以 Claude 和 GPT 等基础架构为特色。最后,应用层包含 ChatGPT 和 Cursor 等最终用户界面。
主导单一层级不再是一个可行的长期护城河。该领域最成功的公司正在积极向其起点的上下层级扩散,以保护其利润率并捕获新的价值。
以下是竞争格局的形成方式。
1、模型优先:硬件成本的残酷现实
纯模型优先的公司被迫向下进入硬件和计算层,以保护其利润率并扩展其训练能力。开发前沿模型需要数十亿美元的前期计算,但推理才是真正发生利润压缩的地方。
为了摆脱 Nvidia GPU 的高昂定价,OpenAI 正与博通合作推出 Jalapeño,这是其首款定制 AI 推理芯片。该芯片计划于 2026 年底部署,这一举措证明即使是顶尖的软件实验室也必须构建定制芯片以维持其大规模运营。
Anthropic 面临着类似的基础设施瓶颈。该公司意识到它不能仅依赖传统的超大规模提供商来满足其能源需求。训练下一代模型需要传统云提供商无法快速配置的电网。作为回应,Anthropic 与新云提供商 FluidStack 签署了一项 500 亿美元的基础设施合作伙伴关系。新云是专注于纯 AI 计算的专业提供商,提供不受传统企业服务阻碍的快速部署。他们正在德克萨斯州和纽约州建造定制的多千兆瓦数据中心。
虽然 Anthropic 与外部提供商合作,但 xAI 完全绕过了云。虽然其 Grok 模型尚未成为 ChatGPT 和 Claude 的有力竞争者(尽管 Grok 是我最喜欢的快速研究工具),但它已成为 AI 基础设施巨头。通过建造 Colossus 超级计算机,xAI 将其母公司 SpaceX 变成了真正的超大规模提供商。SpaceX 现在从底层控制其基础设施,并向包括 Anthropic 在内的其他行业参与者出租计算能力,后者每月支付 12.5 亿美元 访问 Colossus。
2、应用优先:在边缘捕获价值
分析师经常将应用层公司视为单纯的"包装器":构建在第三方 API 之上的薄界面,注定会在前沿实验室发布原生功能时被摧毁。AI 编码助手 Cursor 的轨迹证明,UX 数据和深度工作流集成形成了一个巨大的、可防御的护城河。
Cursor 最初是一个集成开发环境(IDE),允许开发人员将提示路由到各种前沿模型。通过处理数百万个编码会话,Cursor 积累了庞大的用户行为数据集和高度特定的交互模式。他们创建了 Composer 2.5,这是开源权重 Kimi K2.5 模型的微调版本。
通过在自己的 UX 数据上训练 Composer 2.5,Cursor 构建了一个更快、更便宜的内部模型,减少了对昂贵前沿 API 的日常任务依赖。开发人员现在使用 Composer 2.5 进行标准实现,同时将昂贵的前沿模型保留用于复杂的架构推理。
这种深度工作流集成使应用层公司对渴望确保用户接触点的底层计算巨头极具吸引力。2026 年 6 月,SpaceX 以 600 亿美元的全股票交易 收购了 Cursor 开发商 Anysphere。这笔收购说明了拥有庞大基础设施的公司如何一路延伸到技术栈顶端,以确保为其计算提供出口。
3、云优先:利用基础设施主导应用
像亚马逊和微软这样的传统超大规模提供商最初利用其庞大的计算能力来吸引 AI 实验室。与 Google 一样(稍后会详细介绍),它们是 AI 计算的主要提供商,每家都在至少一家领先的 AI 实验室中拥有重要股份(微软在 OpenAI,亚马逊在 Anthropic,Google 拥有 DeepMind)。
但仅仅作为计算提供商是不够的。超大规模提供商现在正在积极向上扩展到软件,向下扩展到定制芯片。
亚马逊开发了其定制的 Trainium 和 Inferentia 芯片,以在 AWS 下方构建专有硬件护城河。通过提供自己的芯片,亚马逊减少了对第三方硬件供应商的依赖,并为在其云上构建的开发人员提供更好的利润率。
微软走了一条不同的道路。虽然它未能成为决定性的前沿模型实验室,但其通过 Windows 和 Microsoft 365 的庞大分发网络使其能够在应用层捕获巨大价值。将 AI 直接集成到企业工作流中,使微软无论谁赢得模型竞赛,都能拥有永久的用户管道。
为了弥合其 Azure 计算能力和消费者应用套件之间的差距,微软也在稳步发布新的 AI 模型,包括开源权重 Phi 系列和闭源 MAI 模型。虽然其旗舰 MAI 模型与绝对前沿不相上下,但这可能类似于 Cursor 的策略,使微软能够为其用户提供比 Claude Opus 4.8 和 GPT-5.5 更快、更便宜的替代方案。
4、硬件优先:Nvidia 的特洛伊木马
Nvidia 主导着技术栈的物理基础层。它通过销售为当今 AI 模型提供动力的昂贵铲子,已成为世界上最有价值的公司。然而,该公司正在悄悄向上移动到模型层,以确保长期的硬件利用率,并防御像 Jalapeño 或 Trainium 这样的定制专用集成电路(ASIC)。
在 2025 年底,Nvidia 发布了 Nemotron 3 套件,完全开源,向公众提供权重、训练数据和配方。这在该领域很少见,尤其是在美国。即使是定期发布开源权重模型的中国实验室,也不会提供使 LLM 完全开源的数据和其他工件。
Nvidia 能够这样做,是因为它特别适合成为开源 AI 之王。当软件实验室在开源其花费数十亿美元训练的模型上亏损时,Nvidia 直接从开源模型中获利。
开源 AI 的激增推动了对物理计算的巨大需求。如果任何开发人员都可以下载前沿级别的模型,他们立即需要硬件来运行它。如果公司想为其应用程序创建定制的 AI 模型,他们将优先选择完全透明和开源的 LLM。而且,微调需要大量的计算和 AI 加速器能力。
通过发布高质量的开源模型,Nvidia 确保生态系统继续在其 GPU 上扩展,而不是迁移到运行在定制芯片上的专有封闭系统。此外,同时控制硬件和模型使 Nvidia 能够协同设计它们,优化 Nemotron 模型以在其自己的芯片上以无与伦比的效率运行。
5、无处不在:Google 这个庞然大物
Google 是唯一一个完全原生地同时存在于技术栈所有四个层级的参与者。其张量处理单元(TPU)可以说是 Nvidia 芯片的最强竞争者,使其在硬件层拥有强大立足点。其 Google Cloud Platform(GCP)是 AI 计算的三大提供商之一。Google Gemini 是领先的 AI 模型家族之一。在应用层,它不仅通过 Gemini 应用,还通过其搜索和 Workspace 套件拥有巨大的分发能力。
这种垂直整合创造了一个不可战胜的数据飞轮。Google 数十亿次的日常用户交互将其应用层紧密耦合回其模型训练层。应用层生成的遥测和行为数据直接为下一代模型的训练管道提供信息,然后在 Google 的专有硬件上进行处理。
6、生态系统转型:Meta 在哪里?
如果 Google 代表完全的垂直整合,那么 Meta 最初的策略是定点打击:将你的互补品商品化。Meta 将其 Llama 模型 作为开源权重免费提供,有效地在模型层焦土化,这样像 OpenAI 和 Anthropic 这样的竞争对手就无法对 Meta 跨 Facebook、Instagram 和 WhatsApp 的庞大消费者应用分发征税。
这一策略未能创造永久的护城河。免费提供前沿模型加速了整个领域,但它压缩了 Meta 自己的优势窗口。竞争对手使用 Meta 的开源权重来引导自己的模型。竞争对手迅速匹配并超越了 Meta 的能力,使用了该公司自己的研究。
这种动态在 2025 年 Llama 4 基准测试争议 中达到顶峰,导致 Meta 正式放弃其纯粹的开源教条。2026 年 4 月,该公司发布了 Muse Spark,这是一款专有的、完全闭源的多模态模型,专为货币化而设计。Meta 的轨迹证明,如果你将基础层免费提供给竞争对手,无底洞的资金和庞大的计算并不能保证成功。
7、模糊的界限
AI 竞赛仍然高度不稳定,没有两家成功的公司看起来完全一样。它们要么利用了不同的起点,要么向截然不同的方向扩展。
技术栈层级之间的界限正在永久消解。如果你从模型开始,你必须构建硬件来生存成本。如果你从硬件开始,你必须构建模型来驱动使用并避免被商品化。如果你从应用开始,你必须微调自己的模型来保护利润率。单一层级不足以生存。最终的赢家将是最能垂直整合最多层级的实体。
原文链接:The myth of the AI moat: Why tech giants are bleeding into each other's territory
汇智网翻译整理,转载请标明出处