AI洗白的第一批受害者

今年2月，Block启动了下一个大型精神操纵：AI洗白（AI washing），利用所谓AI的颠覆性影响来为大规模裁员辩护。

这个骗局成功了；这家盈利的公司股价因消息大涨，全球的CEO们都注意到了。

同一周，我公开称整件事是一个骗局，预测这将只是许多类似事件的开始。不出所料，它确实发生了。

然而，我们上一批AI洗白的案例可能恰恰成为它们的第一个受害者，因为这个"把戏"可能不再奏效了。事实上，它可能正在产生相反的效果。

1、它们都有一个共同点

对于不了解的人来说，AI洗白是指一个需要大规模裁员的公司归咎于AI所谓的生产力提升，把它与一段关于世界正在变化和"在幕后看到了令人难以置信的东西"的演讲联系起来，并声称这"迫使"它们做它们最讨厌的事情：解雇数千人。

这些公司有哪些？ 举例来说，我们有：

Block，开启这一切的公司。裁减了约4,000个工作岗位，约占其员工总数的40%，因为Jack Dorsey推动公司走向更小的AI驱动运营模式。公司将裁员围绕AI赋能的生产力来包装，包括工程师更快、更安全地编写和部署代码。
Cloudflare，昨天，5月8日，宣布裁减超过1,100名员工，约占其员工总数的20%，作为面向"智能体AI优先运营模式"的全面重组的一部分。Cloudflare表示裁员与绩效无关，也不是由短期成本压力驱动的，而是为了重组团队和流程以支持AI采用。
Coinbase，同样在昨天，裁减了约14%的员工，约700人，因为Brian Armstrong表示公司需要变得更精简、更快速、更加"AI原生"。公司表示AI工具使工程师能够更快地完成工作，减少了管理层级，并尝试更小的"一人团队"结构。
同样在昨天，Upwork表示将裁减约四分之一的员工。CEO Hayden Brown表示Upwork正在"从底层开始"重新设计公司，整合冗余工作、压缩工作流程、减少交接，并远离更大的"两张披萨团队"，因为AI使更小的产品和工程团队能够产生更大的影响。
Salesforce在部署AI智能体接管大量支持交互后，裁减了约4,000个客户支持岗位；Marc Benioff表示公司"需要更少的人手"，因为AI可以处理超过一百万次客户对话并降低了支持成本。据报道，Salesforce还在2026年初在市场营销、产品管理、数据分析和Agentforce相关团队中裁减了不到1,000个额外岗位。

虽然裁员本身一点也不令人惊讶，但看到其中一些进行AI洗白的公司过去几年的股票表现，委婉地说，一点也不有趣。

而它们忍不住避免承担责任、反而将其归咎于AI的事实，必须被指出来。

但为什么我如此确信将责任归咎于AI值得被指出来？

很简单，这项技术根本还没准备好，不管这些先生女士们多么努力地告诉你它已经准备好了。

2、区分迭代式和自动化式

你可能不断听到AI已经准备好了。答案是，当然，对于某些事情，绝对是，但对于其他事情，绝对不是。

简单来说，它非常适合迭代工作和增强人类能力，但对任何形式的工作自动化都很糟糕。

AI准备好的领域和没准备好的领域之间的关键区别，一个来自原理：可验证性，另一个来自现实：可靠性。

关于前者，AI只能学习可以被衡量的东西。如果你不能客观地衡量某件事，AI就无法学习它。

这就是为什么AI在编码或数学等领域有了如此巨大的进步，这些领域提供可验证的结果（你可以判断答案是对还是错），这让我们可以通过强化导致正确结果的行为来引导AI走向更好的结果。

但这也解释了为什么AI不擅长写作或任何这样的领域：虽然区分好坏是可能的（例如，你可以检查语法来评估写作是否正确），但区分好和优秀，或坏和糟糕透顶，是主观判断的问题。

简单来说，有些人喜欢莎士比亚的诗歌，有些人连一节诗都读不下去。没有人否认他是好的，甚至是优秀的，但他有多优秀在于观者的眼中（这不是在贬低他；这适用于每一个作家）。

AI可以很好地模仿某些作家，这会使它在喜欢这类作家的人眼中成为出色的写作，但这并不能使其写作被普遍认为是出色的。

例如，Block和Salesforce的裁员影响了许多非技术领域，即不可验证的领域，这应该告诉你我对这些特定案例的看法。

这里的教训是，如果你看到任何人声称他们正在使用AI来替代不可验证领域中的人类，你的蜘蛛感应应该像在俄罗斯和乌克兰边境做旅游一样强烈。

另一个主要限制是可靠性。为此，我总是使用今天我最喜欢的AI图表，一张几乎像一个悖论：这张图更好地展示了AI的进步同时也是整个行业中被最根本误解的——或者实际上，是被方便地误解的——图表。

这就是METR长时间基准测试，它跟踪AI智能体可以执行的最长任务，以人类专家小时来衡量。换句话说，如果一个模型的分数是10小时，那这个模型可以做一个人类专家需要10小时才能完成的任务。

METR基准测试覆盖图（可能包含轻微不准确之处）

令人印象深刻。但大家似乎都忘了提到的是"进入"的准确性门槛。要进入基准测试，AI只需要在50%的时间里执行任务（或者每两次尝试中失败一次）就足够了。

如果这样做，Claude Opus 4.6达到了12小时，一个真正令人印象深刻的壮举。但如果我们要求更高的准确性，比如80%，会怎样？

如果这样做，你会得到上图中的绿点；性能崩溃了，最长运行时间只有一个半小时。

用大白话说，如果你要求智能体在10次尝试中成功8次，而不是10次中成功5次，它们能执行的最长任务，按人类小时计算，只有一个半小时。

考虑到AI模型比人类快得多，这是一个出奇小的数值，这意味着当要求一致性地执行时，最高分实际上只有几分钟的实际工作时间。

而最妙的是，80%远未达到我们实际上需要AI作为严肃自动化工具的可靠性阈值。我会将这个值至少设定在"四个九的可靠性"，即99.99%的准确性。

为什么？ 因为一个80%准确性（这在实践中听起来不错）的智能体连续100次成功执行同一任务的概率是0.00000002%。

一个四个九的智能体这样做的概率是99%，这证明了你的智能体需要超级可靠是多么重要。

对于正在阅读本文的统计学家，在你们跳到我脖子上之前，我假设数据是iid（独立同分布）的。

在我看来，仅这张图表就足以揭穿上面CEO们的主张了。

但这些故事的"好"处在于，终于，投资者似乎不再买账了。

3、有些东西已经变了

当Block执行大规模裁员时，像往常一样，股价因消息上涨，投资者欢迎了这次缩减规模。

但最近发生了一些事情：投资者正在讨厌"因为AI而大规模裁员"的故事。

Cloudflare在宣布消息时，截至撰写本文时下跌了23%，这家公司今年到目前为止一直表现非常强劲，在收益发布前上涨了30%。事实上，公司超过了收益预期，但仍然下跌了。
Coinbase的结果相同，在Brian Armstrong（CEO兼联合创始人）发布归咎于AI的推文后，股价暴跌。
Upwork因消息暴跌了20%。

需要明确的是，我无法从统计上确认"AI主导的裁员"与这些股票暴跌之间的因果关系，但相关性非常强。

但这个特定的三人组，或者具体说Coinbase，正在给全球CEO们上也许更深刻的一课：如果你真的开始用AI替代人类，至少在当前形式下，你会后悔的。

因为我越读Coinbase的案例，我越觉得这些人实际上确实在诚实地用AI替代人类。

不是因为我比其他CEO更信任Brian，而是因为他们给了我们强烈的信号表明他们确实在进行替代，因为产品正在变差。是的，变差了。

在他们可能只有自己知道的事情中，在宣布裁员几小时后，整个产品崩溃了，交易停止了整整一个小时。

连状态页面都宕机了（考虑到需要告诉世界你的业务是否宕机的网站自己也宕机了，这很滑稽），尽管这似乎是AWS的问题。

但你猜怎么着，防止这种情况发生不是AWS的工作，而是你的工程团队以云冗余等方式部署系统的工作。

而最有趣的是，在CEO的信中，他明确说了，我引用：

"非技术团队现在正在发布生产代码，我们的许多工作流程正在被自动化。"

仅这句话就应该让每个Coinbase用户脊背发凉。需要明确的是，我一直用AI写代码，但我认为自己相当有技术能力。

即使是我也会三思而后行，在没有仔细审查的情况下将AI代码推送到生产环境，而"非技术团队"做不到这一点。这简直是彻头彻尾的疯狂，这引出了我的一个观点：

有一种比明知AI尚未准备好却将其作为替罪羊的CEO更令人担忧的：一个相信AI已经准备好了但实际上并没有的CEO。

前者是一个聪明的说谎者，但后者是天真的（或者被周围的人搞得看起来很天真，公平地说这些CEO，上面100%的例子可能都是这种情况）。

如果说有什么区别的话，Coinbase成功地给自己的系统施加了更大的不能宕机的压力，因为它们会因让非技术用户推送代码到生产环境而立即遭到嘲笑。

4、如果这是一件坏事呢？

AI洗白可能导致股市历史上最令人困惑的结果之一：投资者因公司使用AI解雇人而惩罚公司。

需要明确的是，我并不是说投资者都一起去参加了一场死藤水之旅，从而一致地相信裁员是坏事、员工应该受到保护。

我要说的是，过度依赖AI会导致更差的产品和整体更差的业务；我们可能已经到了过度依赖AI模型是净负面的地步。

这些工具已经被证明比我们想象的要昂贵得多，即使与人类相比，这也会对利润率造成巨大压力，但天真地使用AI实际上可以摧毁产品。

有趣的是，如果你是第一次读我的文章，你可能觉得我是反AI的。天哪，你错了。我一直在使用AI。

但AI滥用已经到了这样一个程度：我的大部分客户工作都围绕着让别人理解，使用不当的话，AI弊大于利。

AI将改变世界。它只是在某些CEO声称的那些方面还没有准备好进入黄金时段。

AI需要比大多数人已经意识到的更多的复杂性和谨慎，令人惊讶的是这个群体包括那些支付了数十亿咨询费因此应该更明白的CEO们，而投资者似乎终于注意到这些裁员与AI无关，让他们担心高管们正在隐瞒什么。

而这一情况可以实时观察到，就像Coinbase的例子，可能讽刺地作为副作用扼杀整个AI洗白运动，如果这对你有什么意义的话，我是完全支持的。

原文链接: The AI Washing's First Victims

汇智网翻译整理，转载请标明出处