如何将 AI 货币化

管理AI成本不再是一个优化问题，而是一个生存问题。

对于AI原生公司来说，烧钱速度与产品交付的智能程度成正比。对于添加AI功能的SaaS公司来说，每一个新AI功能都在悄然重塑曾经支撑80%毛利率的成本结构。一条路径快速消耗风投资金，另一条路径侵蚀使业务最初具有吸引力的利润率特征。两种情况的失败模式是相同的：在没有设计其经济学模型的情况下发布AI功能。在代理系统中，成本不是悄悄攀升，而是不断叠加。

1、SaaS利润率是结构性的，但AI利润率是行为性的

过去20年来，SaaS定价锚定于两个主要力量：创造的经济价值和市场上的竞争替代方案。

如果一个产品交付了明确的投资回报率并且具有竞争性定价，那么定价决策就集中在如何细分客户和设计套餐以捕获该价值。成本结构很重要，但很少决定货币化架构。边际成本低、可预测，并随着规模改善。

AI代理遵循不同的逻辑：

AI引入了第三种力量：服务成本。

每一次推理、推理步骤、工具调用和重试都消耗计算资源。随着系统变得更加自主，客户行为与成本紧密耦合。因此，在AI时代，定价方程式发生了根本性转变。

2、代理时代的新定价方程

首要问题仍然是"这对客户来说值多少？"但它不能再孤立存在。它还必须包括"在规模化可靠交付智能需要多少成本？"

在代理系统中，大量使用会显著增加成本。一个开放式的工作流、一个无上限的功能或一个设计不当的层级可以快速侵蚀毛利率。价值仍然重要，它仍然是锚点。但它现在必须在竞争替代方案的背景下理解，并与成本现实进行平衡。

现代AI定价应平衡三种力量：

创造的经济价值
竞争替代方案
服务成本

当这些力量对齐时，增长和利润率相互促进。当其中一个被忽视时，模型最终会崩溃。利润率不再由单一职能部门拥有。它是一个跨越产品、工程、定价和商业战略的跨职能设计挑战。为了管理这一变化，领导者应该了解在AI中实际驱动成本的是什么。

4、理解AI的成本结构

在传统SaaS中，服务成本是可预测的并随着规模改善。在AI产品中，成本的行为不同：它随着使用量增长，随着更复杂的工作流增加，并随着系统代表用户采取更多步骤而上升。

AI成本不集中在单一科目上。虽然许多团队关注模型token，但成本实际上在交付栈的多个层级中构建。

4.1 直接AI使用（模型层）

调用模型的成本包括模型推理、token、嵌入以及来自OpenAI、Anthropic和其他领先LLM提供商的其他基于使用的API费用。这些通常是最大且最明显的成本驱动因素。

4.2 知识和检索（知识层）

AI系统在生成响应之前需要上下文。它们必须创建嵌入，将其存储在向量数据库中，并在运行时检索相关信息。随着产品变得更加个性化，检索成为销售成本的经常性部分。本质上，这允许模型在响应之前访问正确的信息。

4.3 工作流和代理（工作流层）

现代AI系统越来越多地作为执行多步骤任务的代理运行。每个步骤可以触发额外的模型调用、工具使用、API请求或重试循环。随着工作流变得更加复杂，成本快速叠加。关键的动态是乘法性的：更多的推理步骤直接增加成本敞口。

4.4 人机协作（人工层）

许多生产系统仍然需要人工监督以确保可靠性。这包括QA审查、内容审核、异常处理和升级。

4.5 AI服务基础设施（基础设施层）

这一层是在规模上运行AI系统所需的基础。它包括GPU和CPU计算、存储、自动扩缩、延迟优化、监控、可观测性和安全系统。随着使用量增长，这些成本变得显著。

5、AI中的五个结构性利润率杠杆

AI利润率不是在一个地方管理的，而是跨职能部门设计的。在传统SaaS中，成本纪律主要由财务部门负责，而AI业务通过产品架构、工程决策、定价设计和商业结构来塑造利润率。

五个关键的结构性杠杆决定了智能规模是盈利的还是昂贵的。

5.1 模型策略和智能路由

工程主导。产品知情。财务感知。

模型选择是服务成本最大的技术驱动因素。将每个工作流默认使用最强大的模型在经济上是不可持续的。

高效的团队将模型成本与任务复杂度匹配：

重复性任务使用轻量级模型
细致推理使用中端模型
仅在质量影响客户价值时使用高端模型

这是关于成本价值对齐，而不是成本削减。它需要跨职能对齐：

产品定义可接受的输出质量
工程实现路由逻辑
财务建模成本敞口

5.2 工作流深度和执行控制

产品和工程主导。财务建模。

在AI系统中，成本随执行深度叠加。一个用户请求可以触发：

多个推理循环
工具调用
重试和回退

自主性是一个重要组成部分，但没有边界的自主性变得不稳定。高效的公司设置了防护措施，如循环限制和重试上限来规避这个问题。这些是具有直接财务影响的产品决策。如果一个高级用户就能扭曲利润率，那么系统是脆弱的。

5.3 包装：分层智能，而不仅仅是功能

产品和定价主导。财务验证成本。

在AI中，包装不仅是功能差异化；它也是一种成本控制机制。第一个决定是AI放在哪里：

嵌入核心计划中
在高级层级中货币化
作为单独的附加项出售

目标是在可访问性和控制之间找到正确的平衡：推动使用量而不侵蚀利润率或失去竞争力。

除了功能放置，智能本身应按以下方式分层：

按计划的模型访问权限
上下文长度限制
自动化深度限制（例如，生成式 vs. 完全自主）
与工作流量挂钩的使用上限

当AI功能被捆绑到固定价格计划中而没有防护措施时，利润率会随时间侵蚀。

5.4 定价：将价格指标与服务成本对齐

定价主导。财务验证。产品支持。

按席位定价在AI中失效。一个用户可以在同一许可证下产生比另一个用户高10到20倍的成本。

因此，许多AI公司正在转向：

基于活动的定价（例如，每个任务、每个工作流、每次API调用）
基于结果的定价（例如，每次解决、每个结果）
混合模式（例如，基础费用加使用量或超量费用）

然而，并非所有基于使用或基于价值的定价都与成本对齐。

定价在以下情况下有效：

价格指标随底层计算驱动因素扩展（例如，token、工作流、代理运行）
使用量和成本具有一致的关系
大量使用通过限制或超量费用来约束

定价在以下情况下失效：

价值指标与成本脱钩（例如，在工作流复杂度不同时按结果定价）
少量用户推动了不成比例的使用量
高成本功能被捆绑而没有明确的限制

例如，按"完成任务"定价在任务相似时有效。当某些任务需要10倍以上的推理、上下文或重试时，它会失效。

5.5 商业条款：有意转移波动性

财务和销售主导。与定价协作。

由于不断变化的模型价格、使用量峰值和日益增加的代理复杂性，AI成本曲线本质上是波动的。

企业合同必须反映这一现实：

定义预期消费范围的使用量区间
用于将实际使用量与合同水平进行对账的调整机制
对超出约定限制的使用收费的超量触发器
用于应对变化的定价条款建模

关键问题是：谁吸收成本波动，公司还是客户？结构良好的协议共享这一风险。这五个杠杆是相互关联的，当它们协调运作时，AI以持久和可预测的方式扩展。

6、AI货币化的真正转变

SaaS利润率随规模改善。在AI中，利润率只有在有意设计时才会改善。因为成本与使用和行为挂钩，仅靠增长不能保证利润率扩张。

这就是为什么关键问题正在改变：

我们是在扩大收入，还是同时扩大成本？
如果模型价格上涨30%，我们的模型仍然有效吗？
我们是否理解功能和细分层面的利润率？

增长可以在一段时间内隐藏这些问题，但经济学总是会追上来的。在下一篇文章中，我们将介绍AI盈利风险矩阵，这是创始人、首席财务官和投资者评估AI业务是建立在可扩展基础上还是在悄悄累积风险的实用方法。

原文链接：Part 1: Monetizing AI without destroying margins

汇智网翻译整理，转载请标明出处