如何将 AI 货币化
管理AI成本不再是一个优化问题,而是一个生存问题。
对于AI原生公司来说,烧钱速度与产品交付的智能程度成正比。对于添加AI功能的SaaS公司来说,每一个新AI功能都在悄然重塑曾经支撑80%毛利率的成本结构。一条路径快速消耗风投资金,另一条路径侵蚀使业务最初具有吸引力的利润率特征。两种情况的失败模式是相同的:在没有设计其经济学模型的情况下发布AI功能。在代理系统中,成本不是悄悄攀升,而是不断叠加。
1、SaaS利润率是结构性的,但AI利润率是行为性的
过去20年来,SaaS定价锚定于两个主要力量:创造的经济价值和市场上的竞争替代方案。
如果一个产品交付了明确的投资回报率并且具有竞争性定价,那么定价决策就集中在如何细分客户和设计套餐以捕获该价值。成本结构很重要,但很少决定货币化架构。边际成本低、可预测,并随着规模改善。
AI代理遵循不同的逻辑:
AI引入了第三种力量:服务成本。
每一次推理、推理步骤、工具调用和重试都消耗计算资源。随着系统变得更加自主,客户行为与成本紧密耦合。因此,在AI时代,定价方程式发生了根本性转变。
2、代理时代的新定价方程
首要问题仍然是"这对客户来说值多少?"但它不能再孤立存在。它还必须包括"在规模化可靠交付智能需要多少成本?"
在代理系统中,大量使用会显著增加成本。一个开放式的工作流、一个无上限的功能或一个设计不当的层级可以快速侵蚀毛利率。价值仍然重要,它仍然是锚点。但它现在必须在竞争替代方案的背景下理解,并与成本现实进行平衡。
现代AI定价应平衡三种力量:
- 创造的经济价值
- 竞争替代方案
- 服务成本
当这些力量对齐时,增长和利润率相互促进。当其中一个被忽视时,模型最终会崩溃。利润率不再由单一职能部门拥有。它是一个跨越产品、工程、定价和商业战略的跨职能设计挑战。为了管理这一变化,领导者应该了解在AI中实际驱动成本的是什么。
4、理解AI的成本结构
在传统SaaS中,服务成本是可预测的并随着规模改善。在AI产品中,成本的行为不同:它随着使用量增长,随着更复杂的工作流增加,并随着系统代表用户采取更多步骤而上升。
AI成本不集中在单一科目上。虽然许多团队关注模型token,但成本实际上在交付栈的多个层级中构建。
4.1 直接AI使用(模型层)
调用模型的成本包括模型推理、token、嵌入以及来自OpenAI、Anthropic和其他领先LLM提供商的其他基于使用的API费用。这些通常是最大且最明显的成本驱动因素。
4.2 知识和检索(知识层)
AI系统在生成响应之前需要上下文。它们必须创建嵌入,将其存储在向量数据库中,并在运行时检索相关信息。随着产品变得更加个性化,检索成为销售成本的经常性部分。本质上,这允许模型在响应之前访问正确的信息。
4.3 工作流和代理(工作流层)
现代AI系统越来越多地作为执行多步骤任务的代理运行。每个步骤可以触发额外的模型调用、工具使用、API请求或重试循环。随着工作流变得更加复杂,成本快速叠加。关键的动态是乘法性的:更多的推理步骤直接增加成本敞口。
4.4 人机协作(人工层)
许多生产系统仍然需要人工监督以确保可靠性。这包括QA审查、内容审核、异常处理和升级。
4.5 AI服务基础设施(基础设施层)
这一层是在规模上运行AI系统所需的基础。它包括GPU和CPU计算、存储、自动扩缩、延迟优化、监控、可观测性和安全系统。随着使用量增长,这些成本变得显著。
5、AI中的五个结构性利润率杠杆
AI利润率不是在一个地方管理的,而是跨职能部门设计的。在传统SaaS中,成本纪律主要由财务部门负责,而AI业务通过产品架构、工程决策、定价设计和商业结构来塑造利润率。
五个关键的结构性杠杆决定了智能规模是盈利的还是昂贵的。
5.1 模型策略和智能路由
工程主导。产品知情。财务感知。
模型选择是服务成本最大的技术驱动因素。将每个工作流默认使用最强大的模型在经济上是不可持续的。
高效的团队将模型成本与任务复杂度匹配:
- 重复性任务使用轻量级模型
- 细致推理使用中端模型
- 仅在质量影响客户价值时使用高端模型
这是关于成本价值对齐,而不是成本削减。它需要跨职能对齐:
- 产品定义可接受的输出质量
- 工程实现路由逻辑
- 财务建模成本敞口
5.2 工作流深度和执行控制
产品和工程主导。财务建模。
在AI系统中,成本随执行深度叠加。一个用户请求可以触发:
- 多个推理循环
- 工具调用
- 重试和回退
自主性是一个重要组成部分,但没有边界的自主性变得不稳定。高效的公司设置了防护措施,如循环限制和重试上限来规避这个问题。这些是具有直接财务影响的产品决策。如果一个高级用户就能扭曲利润率,那么系统是脆弱的。
5.3 包装:分层智能,而不仅仅是功能
产品和定价主导。财务验证成本。
在AI中,包装不仅是功能差异化;它也是一种成本控制机制。第一个决定是AI放在哪里:
- 嵌入核心计划中
- 在高级层级中货币化
- 作为单独的附加项出售
目标是在可访问性和控制之间找到正确的平衡:推动使用量而不侵蚀利润率或失去竞争力。
除了功能放置,智能本身应按以下方式分层:
- 按计划的模型访问权限
- 上下文长度限制
- 自动化深度限制(例如,生成式 vs. 完全自主)
- 与工作流量挂钩的使用上限
当AI功能被捆绑到固定价格计划中而没有防护措施时,利润率会随时间侵蚀。
5.4 定价:将价格指标与服务成本对齐
定价主导。财务验证。产品支持。
按席位定价在AI中失效。一个用户可以在同一许可证下产生比另一个用户高10到20倍的成本。
因此,许多AI公司正在转向:
- 基于活动的定价(例如,每个任务、每个工作流、每次API调用)
- 基于结果的定价(例如,每次解决、每个结果)
- 混合模式(例如,基础费用加使用量或超量费用)
然而,并非所有基于使用或基于价值的定价都与成本对齐。
定价在以下情况下有效:
- 价格指标随底层计算驱动因素扩展(例如,token、工作流、代理运行)
- 使用量和成本具有一致的关系
- 大量使用通过限制或超量费用来约束
定价在以下情况下失效:
- 价值指标与成本脱钩(例如,在工作流复杂度不同时按结果定价)
- 少量用户推动了不成比例的使用量
- 高成本功能被捆绑而没有明确的限制
例如,按"完成任务"定价在任务相似时有效。当某些任务需要10倍以上的推理、上下文或重试时,它会失效。
5.5 商业条款:有意转移波动性
财务和销售主导。与定价协作。
由于不断变化的模型价格、使用量峰值和日益增加的代理复杂性,AI成本曲线本质上是波动的。
企业合同必须反映这一现实:
- 定义预期消费范围的使用量区间
- 用于将实际使用量与合同水平进行对账的调整机制
- 对超出约定限制的使用收费的超量触发器
- 用于应对变化的定价条款建模
关键问题是:谁吸收成本波动,公司还是客户?结构良好的协议共享这一风险。这五个杠杆是相互关联的,当它们协调运作时,AI以持久和可预测的方式扩展。
6、AI货币化的真正转变
SaaS利润率随规模改善。在AI中,利润率只有在有意设计时才会改善。因为成本与使用和行为挂钩,仅靠增长不能保证利润率扩张。
这就是为什么关键问题正在改变:
- 我们是在扩大收入,还是同时扩大成本?
- 如果模型价格上涨30%,我们的模型仍然有效吗?
- 我们是否理解功能和细分层面的利润率?
增长可以在一段时间内隐藏这些问题,但经济学总是会追上来的。在下一篇文章中,我们将介绍AI盈利风险矩阵,这是创始人、首席财务官和投资者评估AI业务是建立在可扩展基础上还是在悄悄累积风险的实用方法。
原文链接:Part 1: Monetizing AI without destroying margins
汇智网翻译整理,转载请标明出处