为什么"做决定"是AI无法取代的？

"当任何人都能构建时，决定构建什么的人就成了瓶颈。"

读了那条帖子和回复之后，我有所感触：Chen诊断的是一个技术问题，但他同时也在描述一个L&D问题。

如果你现在在L&D领域工作，你肯定已经知道："构建时间"不再是第一大瓶颈了。AI对课程生产做的事情，就像它对代码生产做的事情一样：过去需要六周才能完成的课程，现在一个下午就能搞定。故事板自动生成，脚本自动撰写，评估题目、微学习、场景分支——所有这些，随时随地，信手拈来。

L&D面临的最大AI风险不是被抛弃，而是我们构建了更多——用没人需要的平庸内容淹没整个组织。

在这篇文章中，我将论证：

→ L&D的工作刚刚一分为二——而我们大多数人还在错误的那一半上努力。

→ 这个角色正在迎来一种新的运营模式，而且它已经在很多你听说过的公司中运行了。

→ 对我接下来要论证的一切，最犀利的批评来自Ethan Mollick——我认为他说对了一半。

我们开始吧！

1、重新框架：AI正在让生产商品化

也许对L&D如何变化最清晰的阐述来自去年LinkedIn首席产品官Tomer Cohen在去年12月Lenny播客上的发言（Cohen, 2025）。

Cohen的表述很直白：AI正在让执行成本（在我们的案例中，即内容和课程生产）急剧下降。他认为，在AI时代，持久属于人类的是判断力——决策——以及围绕我们所做的决定凝聚人心的能力。

如果说Cohen提出了原则，那么领导Anthropic Claude Code团队的Boris Cherny则展示了它在运营层面的样子。最近一次深度访谈中的两个洞见在这里引起了共鸣（Pragmatic Engineer, 2026）：

→ 产品需求文档在他的团队中已经死了。 产品需求文档——即团队在构建之前编写的规格说明——已经被可运行的原型所取代。他们生成东西，审视它，然后决定它是否值得存在。对产物的判断，而不是对规格的判断。

→ 每位Anthropic工程师的代码产出一年内增长了200%——这种激增在代码审查方面造成了新的瓶颈，Anthropic现在每周都能从客户那里听到这方面的反馈（VentureBeat, 2026）。

如果我们戴上L&D的眼镜重新审视这两个发现，这些相似之处既清晰又令人不安：

课程设计文档就是L&D的PRD。 故事板、脚本、学习目标、评估蓝图、设计理由——大多数团队仍然将其视为基础交付物的工件——在功能上与PRD相同：对你即将构建的产物的书面规格说明。技术界正在意识到，规格说明不再是最高杠杆的产物，因为AI现在可以在比编写规格更短的时间内生成可运行的东西。L&D领域现在也是如此。为什么要为一个AI一个下午就能做出原型的东西写四十页的设计文档？判断的单位已经从规格转向了产物——而大多数L&D流程还没有跟上。
200%产出/审查瓶颈是我们的未来，而不是他们的。 Anthropic产出的代码超过了其审查能力的吸收范围，他们的客户每周都能感受到这一点。现在想象一下L&D领域的等价情况。AI让一位设计师生成的内容比一年前多十倍。瓶颈不再是创作工具、主题专家的可用性或审批流程。而是*是否有人以专家的眼光真正评估过正在交付的内容是否能产生行为改变。*大多数L&D部门还没有一个能跟上AI驱动产出的审查层——即便有的，大多也只是在检查合规性，而非工艺质量。
→ 角色沿着同样的断层线分裂。 Cherny的团队并没有让工程师变得多余——而是将他们从编写规格提升到评判产物。这正是L&D现在被要求做的转变。继续做AI能更快完成的生产工作的设计师，将会以AI的速度来衡量，然后输掉比赛。向上游移动到判断层面的设计师——这是否是正确的干预手段，这个草稿在教学法上是否合理，这个评估是否真的能区分学习者，这东西到底应不应该发布——会变得更有价值，而不是更没有价值。

这个模式在两个领域都是一致的：生产能力爆炸式增长，判断层没有跟上，L&D的角色和价值现在越来越取决于我们选择在哪个缺口的那一边运作。

2、新兴的L&D角色，即3D模型

以下是我在实践中看到的L&D新兴模型，我尽量简单地呈现它：三条工作流，其中两条属于AI，一条属于人工。

流1：数据——AI的工作。 学习者研究综合、能力差距分析、内容草稿、故事板、脚本、评估题目、场景、合成用户在设计过程中的交互记录。所有这些，几分钟内完成。

流2：执行——AI的工作。 生产、格式化、构建、部署。多智能体工作流，其中一个智能体汇总信息源，另一个撰写脚本，另一个生成评估题目，另一个分析上一次迭代的学习者数据。

流3：决策——人类的工作。 这是需要解决的正确能力差距吗？这是正确的干预方式吗——还是我们根本不应该构建课程？这个草稿在教学法上是否合理，还是只是看起来合理？这个评估能区分学习者吗？这个场景能产生行为改变吗，还是只是看起来能？在这十五个AI生成的变体中，哪三个值得推广？

新兴的"后AI"L&D专业人员不是去技能化的职能主义者或通才——他们是专业的评判者。工作不再关乎执行和构建，而是做出好的决策。

做出好的决策需要三样AI在结构上不具备的东西：

→ 深厚的学习专业知识。 不是对框架的熟悉。是专业知识——那种来自多年设计、测试、观察失败、以及跨数百个案例进行模式匹配的经验。那种能看着AI生成的草稿并知道它表面上不错但在教学法上错误的专业知识。能发现无法区分学习者的评估题目、不会迁移的场景、动词丰富但不可测量的目标。AI可以整天生成流畅的学习内容。它不能告诉你哪个版本真正会改变人们在工作中的行为——因为这需要理解认知负荷、检索练习、迁移条件、动机以及表现与学习之间的区别。这种知识存在于从业者身上，而非模型中。

→ 特定的业务语境。 通用的最佳实践是AI最擅长的。这个企业、这个团队、这种管理者文化、这些相互竞争的优先事项、这段失败项目的历史——这才是判断力真正存在的地方。同一种培训干预在一家公司有效，在下一家就会失败，因为周围的语境不同。知道哪些能力差距是真实的、哪种干预适合它所落地的系统、哪些设计选择能在与现实接触后存活下来——这是语境相关的工作。AI可以进行一般性推荐。它无法进行具体决策。

→ 人类对结果的责任承担。 这是最容易被忽视的维度，也是结构上最重要的维度。专业判断不仅仅是做出正确的决定。它是*做出决定并为其负责。*当一个学习设计师签批了一个无法迁移的项目，或者否决了一个业务后来后悔被否决的请求，或者拒绝构建CEO想要的东西时——有一个名字与之关联。一个声誉。一段职业生涯。AI可以产生推荐。它不能为此承担任何代价。而随着AI越来越多地承担生产工作，人类的责任承担变得越来越可见——也越来越有价值。

这三样东西组合在一起时会相互放大：没有业务语境的深厚专业知识是学术性的。没有专业知识的业务语境只是意见。两者都没有责任承担则是演戏。同时具备这三样的L&D专业人员，将是2026年及以后组织愿意付费的人。

3、在实践中构建：一个进行中的实验

本周，我开始与一家世界500强公司合作，在实践中测试这个架构——即3D模型。

设置方案：一位学习设计师，与一个由四个AI智能体组成的链式工作流合作，分别对应教学设计生命周期的每个阶段。

→ 问题框架智能体负责分析。它审问项目简报，扫描证据，并——关键的是——评估学习是否是正确的干预方式。它可以推荐*"这不是一个学习问题"*并拒绝向下传递。

→ 行为改变设计智能体负责设计。它以可观察的术语定义目标行为，揭示实际工作流中的线索和强化循环，并产生带有权衡的选项——从不给出单一结论。

→ 质量智能体负责审查。它检查目标与评估的对齐、可访问性和一致性。有界、审慎，而非"审查一切"。

→ KPI跟踪智能体负责评估。它将规划与测量分开，并在证据不足时拒绝编造状态。

智能体负责数据和执行。每个阶段之间都有一个决策关卡。每个智能体收集、起草、提出选项、标记假设和未决问题——然后停下来。只有当人工做出判断决策后，事情才会推进。一旦决策做出，下一个智能体就会执行命令。

这是L&D运营模式及其内部人类角色的新兴未来：回归到工作中始终最重要的那部分——也是我们大多数人过去十年中因为生产工作吞噬了我们的时间而无法充分完成的那部分。

在日常工作中，工作向上游移动。在创作工具中花的时间更少，在利益相关者会议中为或反对某个干预方案做论证的时间更多。在格式化模块上花的时间更少，在阅读智能体产出并对照业务实际需求进行评判上花的时间更多。在管理项目计划上花的时间更少，在编排智能体堆栈和把关其输出上花的时间更多。

重要的技能会不断叠加：将学习科学专业知识应用于特定业务问题的能力，良好运行智能体工作流的编排能力，以及将你的名字署在决策上并为其辩护的职业声望。

有了合适的运营模式，L&D角色在这个未来不会萎缩。它回归到其应有的形态：以判断为驱动、以专业为锚定、并承担责任。

4、但等等，AI不是也在变擅长判断吗？

我最近经常听到的一种说法是，AI正在迅速变得擅长判断。

这个说法在狭义上是对的。现代智能体确实在变得擅长某种判断。比如排序任务、确定子目标的优先级、判断某事是否"足够好"可以推进到下一阶段。Boris Cherny最近描述了Anthropic一个智能体团队，它们一直在做这件事，其中更好的那些确实比人类做得更好。

但这不是L&D——或者医学、法律或战略——真正交易的判断类型。专业判断在三个维度上存在结构性差异：

→ 常规程序性判断。 排序、确定优先级、"这个草稿够不够好可以推进到下一阶段？"AI能做这个，而且越来越多地会做。

→ 领域专家判断。 "这个评估题目在教学法上合理吗？这个场景真的能迁移吗？这个设计与目标对齐吗？"AI可以模拟这一点，而且改进很快——但它仍然是有争议的区域，在那里经验丰富的学习设计师的隐性案例库仍然超越模型。来自医学领域的先例告诉我们，AI的领域专业知识将在未来两到三年内增加，但不会完全消除对人类专家的需求。

→ 真正的专业判断。 "这东西到底应不应该存在？我愿意把名字署在上面吗？五年后当有人问我们为什么要构建它时，我会为这个决定辩护吗？"这是承担责任、拒绝和承担风险的地方。AI在结构上无法做到这一点——不是因为它不够聪明，而是因为它不是这个情境中的当事方。

AI可以推荐，但它不能负责。责任承担是专业判断在组织中具有分量的结构性原因：一个真实的、有名字和履历的人，将其职业信誉押注在这个决定上。当一个学习设计师签批了一个无法迁移的项目、一个让公司被起诉的合规更新、或者一个失败的领导力干预时——有人要为此负责。责任存在于某个地方。监管存在于某个地方。专业知识的隐性社会契约存在于某个地方。

那个某个地方永远不可能是模型。

同样的逻辑也适用于拒绝。一个学习设计师告诉利益相关者*"培训解决不了这个问题——你的激励机制结构是错误的"，是在行使一种AI可以模仿但无法真正承担的判断。拒绝只有在携带职业信誉、组织地位以及如果被忽视将承担专业后果的隐含威胁时才有意义。AI可以标记顾虑。只有人类才能代表一个专业说"不"。*

所以Mollick和其他人是对的，判断的程序层正在流向AI，也确实比人们意识到的更快。但他们忽略了，AI在那个层次上越成熟，人类专属领域就越清晰：不是认知工作，而是可问责性。

智能体越聪明，可问责的人类就越有价值——而不是越没有价值。

5、结束语

过去两年我们一直在问的问题——"我如何更快地构建？"——是错误的问题。

真正的问题是：我能看着十五个AI生成的学习资产，决定哪三个值得推广——并把我的名字署在这个决定上吗？

那就是工作。它以前从未如此清晰地暴露出来。

那个不会改变行为的合规更新。那个应该是清单的入职课程。那个应该是辅导的领导力项目。那个实际上是管理者问题的技能差距。那个培训解决不了的绩效问题。

任何拥有AI的人都可以在一个下午生成一门课程。几乎没有人能看着一个业务问题并决定*"这里培训不是答案"*——而且是对的。几乎没有人能年复一年地在宁愿听到"好的"的利益相关者面前，为这个拒绝赌上自己的职业声誉。

那个决定就是工作。一直都是。生产工作只是挡住了视线。

第一步不是启动一个智能体。而是诚实地审视你自己的工作流程，决定什么属于哪里。

拿出你目前正在做的一个项目——一门课程、一个项目、一个干预——从头到尾走一遍它涉及的所有任务，从最初的接洽对话到最终的上线后评审。对每个任务，问一个问题：

→ 这是数据吗？ 信息收集、综合、起草、生成、分析、格式化。任何涉及产出或转化材料的工作。AI的工作。

→ 这是执行吗？ 构建、部署、更新、分发、运行。任何涉及执行的工作。AI的工作。

→ 这是决策吗？ 需要专业知识、语境、利害关系和责任的判断。这是正确的差距吗？这是正确的干预吗？这个草稿在教学法上合理吗？这真的能迁移吗？我们到底应不应该构建这个？人类的工作。

一旦你映射了一个项目，你就拥有了运营模型的雏形。决定委托什么。决定保护什么。决定关卡设置在哪些阶段之间——AI必须停下来等你做决策的时刻。

那个映射练习是这个月任何L&D专业人员能做的最便宜、最快、最高杠杆的行动。它不花钱，不需要任何工具，而且它具体地告诉你，你的工作正在走向何方。

原文链接: When anyone can build a course, the real job is deciding which ones should not exist

汇智网翻译整理，转载请标明出处