软件开发:品味的崛起

2026年1月30日,Anthropic为Claude Cowork发布了一套针对特定行业的插件,涵盖法律、金融、营销和销售。公司将其描述为一个小产品更新。三个交易日内,近3000亿美元的软件市值蒸发了。WisdomTree云计算基金经历了自2025年4月以来最糟糕的一天。一位CNBC记者用Claude Cowork在60分钟内构建了一个可用的看板板,发布了视频,Monday.com的市值在收盘前下跌了3亿美元。然后在2月6日,Anthropic发布了Opus 4.6,这是一个可以启动和协调人工智能代理团队的模型,抛售加剧了。六周后,大约1万亿美元的SaaS总市值被抹去。

一位Jefferies的股票交易员创造了"SaaSpocalypse"这个词。Gartner发布了一份研究说明,题为"SaaS和企业应用死亡的预测为时过早"。

所以那件事发生了。

而自然的解读是:软件正在变成商品。人工智能现在可以做这项工作了,所以这项工作没有价值。护城河消失了。

我认为这是错误的。或者说,至少,它遗漏了正在发生的更重要的事情。

SaaSpocalypse不是关于软件失去价值。而是关于无品味软件失去价值。看看哪些公司受打击最严重,模式立刻显现。汤森路透下跌20%,是其有记录以来最严重的单日跌幅。LegalZoom下跌20%。Intuit在2月份之前的季度下跌34%。Atlassian一周内暴跌35%。这些都是其核心产品是包装在UI中的结构化工作流程的公司。合同审查。税务申报。工单跟踪。价值主张是:「我们构建了这个工作流程,所以你不必。」在工作流程昂贵的时代,这是一个完全有效的业务。但这是一个糟糕的业务,当人工智能代理可以在一个下午复制工作流程时,或者当记者可以在直播中重塑你的核心产品时。

现在看看什么没有崩溃。Palo Alto Networks等网络安全公司保持坚挺,因为安全错误的成本是灾难性的,人工智能实际上增加了攻击面。Snowflake轻微下跌然后保持,因为专有数据基础设施不是你能够随意编码的。「系统记录」层,价值存在于数据图本身而不是其上方的界面中,这些是有弹性的。一位分析师将其框架为「系统记录」和「CRUD应用」之间的区别,后者是具有很好前端来创建、读取、更新和删除数据的应用程序。CRUD应用受到了打击。

这告诉你一些关于品味不是什么的重要信息。品味不是给商品工作流程涂上一层漆。那些被重击的产品通常在表面意义上设计得很好。它们有干净的UI、良好的入职流程、精美的营销网站。它们缺乏的是一种更深入的品味:关于其问题领域的观点,是通用代理无法复制的。它们的防御性纯粹是「我们已经构建了这个,切换很烦人。」这不是品味。这是惯性。而惯性是一个很好的护城河,直到切换成本降至接近零的那一刻。但有一类软件没有受到抛售的影响,人们真正喜欢这类软件,每次交互都感觉经过深思熟虑。这类软件即将变得非常有价值。

来源:Bloomberg

这一波背后的数字令人震惊。Cursor从2025年1月的1亿美元ARR增长到2026年2月的20亿美元,在三个月内翻倍。Claude Code在公开推出九个月后达到25亿美元的速率收入。73%的工程团队现在每天使用人工智能编码工具,一年前这个数字是41%。Gartner预测今年60%的新代码将由人工智能生成。前沿模型的API成本已从每百万代币约60美元降至约2.50美元,在十八个月内等价能力。Claude Code现在占所有公开GitHub提交的4%,预计到年底将超过20%。生产一个可用的软件的成本正在自由落体,而且没有下限。

我们已经多次看到这种模式,结果从来不是「一切都变得免费和等价」。

1、每一次丰裕都有一个转折

在印刷机之前,14世纪欧洲的一本书大约相当于一所房子的价格。欧洲大陆最大的大学图书馆,巴黎大学,到1289年约有1017册书,到1328年约有1722卷手稿。生产一本书意味着一位抄写员坐在修道院的书房,一个字符一个字符地手抄文本,需要几个月。供应约束是绝对的。如果你想要获得亚里士多德或西塞罗的著作,你要么非常富有,要么加入神职人员。知识是稀缺的,因为复制是昂贵的。

来源:Rouse & Rouse, The Early Library of the Sorbonne (source)

然后古腾堡在1440年左右建造了他的印刷机,在六十年内,估计有1500万到2000万份来自3万到3.5万种不同出版物的副本在欧洲流通。到15世纪90年代,威尼斯印刷的一本西塞罗的书大约相当于一个学校教师一个月的工资。从房子的价格到工资单上的价格。生产成本在一个人的一生中下降了两个数量级。

约翰内斯·古腾堡

现在重要的是:接下来发生的不是所有书都变得等价。当书稀缺时,内容几乎不重要。物体本身就有价值。一本手抄的圣经和一本手抄的农业手册占据大致相同的经济层,因为瓶颈是复制,而不是思考。但一旦复制变得便宜,思考就成了区分点。有些书是变革性的。

路德的新约翻译在两周内卖出了5000份,他的著作在1518年至1525年间占德国销售书籍的三分之一。其他书籍则被遗忘。印刷机并没有使所有书相等。它使好书和坏书之间的区别更加明显,因为生产成本不再掩盖质量信号。

1522年路德的九月圣经(来源)

而那个时代的赢家不是拥有最好印刷机的人。是威尼斯的阿尔杜斯·马努提乌斯,他发明了斜体字,开创了口袋书格式,并选择了哪些古典文献出版以及如何呈现它们。

他的品味是护城河。不是他的技术。每个人都有技术。

这是一个重复出现的模式,而且以显著的一致性展开。每次当一个突破显著降低了某个领域的生产成本,初始反应是关于商品化的恐慌。然后实际发生的是快速排序,质量——实际上只是持续应用的品味的另一个词——成为竞争的主要轴线。

摄影对绘画就是这样。当1839年出现达盖尔银版摄影术时,直接的恐惧是画家会变得过时。而在狭义上,主要价值是准确视觉再现的肖像画家确实失去了市场。但出现的是印象派、后印象派,最终是现代艺术的整个弧线。生存下来的画家恰恰是那些除了「我能再现眼睛看到的东西」之外有话要说的画家。相机没有杀死绘画。它杀死 了价值只是忠诚度的绘画,并提升了价值是视野的绘画。

路易·达盖尔,法国发明家

你在音乐制作中看到同样的动态。录制和发行一首歌从数十万美元变成基本上零。现在每天大约有12万首新曲目上传到Spotify。制作瓶颈消失了。然而,突破的艺术家不是拥有最便宜制作设备的。他们是有独特声音身份、有编排听觉、有直觉知道该省略什么的。丰裕没有使音乐商品化。它使平庸的音乐商品化。好和伟大之间的差距变得更加重要,而不是更不重要。

应用商店是另一个清晰的例子。苹果在2008年推出时拥有500个应用。它在超过210万个应用的峰值。今天它托管大约200万个应用。苹果实际上开始删除应用以提高质量,仅在2024年就拒绝了193万次提交。有大约94万个出版商。构建移动应用的障碍基本上是零。然而:90%的时间花在少数应用上。前100个订阅应用产生了81%的所有订阅收入。供应增加了四个数量级;价值更加集中,而不是更少。它围绕有品味的应用集中。那些理解要构建什么,以及关键地什么不应该构建的应用。

2、品味是什么?

我一直在用「品味」这个词,我应该准确定义它,因为它在这里做了很多工作。

软件中的品味不是美学,尽管美学可以是它的一种表达。品味是决定包含什么和排除什么的能力。这是一个压缩函数:给定你可以构建的无限空间,品味是选择你应该构建的有限集合的能力。它在每个层面运作:发布哪些功能、支持哪些交互、API如何响应、错误状态是什么样子、数据如何流经系统、默认值是什么。

每个默认值都是一个品味决定。每个省略都是一个品味决定。整个产品的形状是数千个小品味决定的累积残留,其中大多数用户永远不会自觉注意到,但绝对会感受到。

有一个原因 specifically 当生产变得便宜时品味成为稀缺资源,值得仔细梳理逻辑。构建软件一直涉及两种根本不同的工作。第一是执行:将已知规范翻译成工作代码。第二是判断:决定规范应该是什么。在大多数软件历史中,执行是如此昂贵以至于主导了这个过程。你80%的时间和预算花在让东西工作上。判断只占总工作的一小部分,挤压到产品需求文档和设计冲刺中。比例大约是80/20,执行到判断。

人工智能正在逆转那个比例。

当执行趋近于零成本时,判断成为100%的价值。而判断要构建什么、它应该如何行为、应该省略什么,那是品味。

在任何生产过程中,价值累积到稀缺的输入。当原材料稀缺且劳动力充裕时,矿主变得富有。当劳动力组织起来变得稀缺时,工资上升。当资本是瓶颈时,投资者获得回报。几十年来,软件工程能力的瓶颈是工程能力。现在工程能力正在被人工智能商品化。剩余的瓶颈是决定工程什么的能力。那是品味。品味的回报与执行成本的下降成正比。这是简单的供需经济学。

还有另一种方式看待这个问题。把软件视为构建者和用户之间的交流媒介。代码是通道,但消息是构建者做出的一系列选择。解决什么问题。支持什么工作流程。什么容易什么不可能。每个产品都是关于世界某些部分应该如何工作的论证。当通道昂贵时,消息受到你能负担得起的传输内容的约束。你发布你能在时间内构建的功能,产品的形状 工程约束和产品愿景的函数一样多。现在通道几乎是免费的。你可以传输任何东西。所以消息、论证、愿景成为整个产品。具有相同工具和相同代码库的两个团队将构建完全不同的产品,因为他们有不同的品味,关于什么重要有不同的看法。工具正在收敛。观点正在分化。这就是品味是护城河的原因。

迪特·拉姆斯

迪特·拉姆斯比任何人都更理解这一点。他的座右铭是「weniger, aber besser」——少,但更好。他经营博朗的设计部门四十年,生产了超过500个产品,每一个都是问「我能移除什么」的练习。他的SK5收音机、T3口袋收音机、606书架系统。它们看起来像是通过减法设计的。乔尼·艾弗明确将拉姆斯列为苹果设计语言的主要影响,称拉姆斯的表面「毫不道歉,大胆,纯正,完美比例,毫不费力。」艾弗描述的是品味的具体化。不是装饰,不是风格。判断。知道什么属于什么不属于什么的判断。

3、LLM是更多的引擎

LLM在生产更多方面非常出色。它们在架构上,是非常擅长继续模式和生成合理输出的下一个token预测机器。它们不擅长,不能,在结构上不设计决定不生产什么。他们没有固有的「足够」感。它们没有内置压缩功能,说「这个功能不属于」或「这个交互太复杂」或「这个屏幕应该有三个元素,不是十二个」。人工智能编码代理可以在一小时内生成一个完整的仪表板。但它不能告诉你那个仪表板是否应该存在,或者你实际需要的三个指标是否更好地服务 于一个干净屏幕上的单一数字。那个决定?是品味。而品味仍然是人类的功能。

随着代码生成成本趋近于零,我们应该期望软件景观看起来像其他后丰裕景观:总体量大幅扩张,同时价值集中在最具品味的软件中。

中位质量实际上可能会下降,因为很多以前根本无法构建软件的人现在会发布半生不熟的工具。但最好的软件会变得更好,因为已经有品味的构建者将有更大的杠杆来表达它。

4、两个团队,相同的工具,不同的产品

考虑构建笔记应用的两个方法的差异。两个团队都可以访问相同的LLM、相同的基础设施、相同的代码生成工具。

团队A使用人工智能快速生成他们能想到的每个功能:富文本编辑、看板、日历、数据库、API集成、协作、人工智能摘要、模板库。他们快速发布,因为代码很便宜。团队B使用人工智能很好地构建了一件事:快速、可靠的文本捕获,漂亮的排版和零摩擦的组织。他们不把时间花在功能宽度上,而是花在让默认值完全正确上,让空状态受欢迎,确保体验的前十秒感觉毫不费力。

团队B有品味。团队A有产出。

如果历史有任何指导,像团队B这样的产品是赢得忠诚追随者的产品。例如在笔记应用中,Bear或iA Writer等工具通过专注、固执己见的设计,以及对什么应该省略的清晰理解,在高级用户中脱颖而出。

来源:iA Writer 是一位极简写作工具,Marie Kondo会喜欢

这里有更深的逻辑值得明确。

大多数人假设功能是附加的:更多功能等于更多价值。但那是有缺陷的。功能相互作用。每个新产品增加了产品的表面积,这增加了用户的认知负担,这增加了系统可以处于的状态数量,这增加了混淆、错误和放弃的概率。功能对彼此有负外部性。有一个点,你添加的下一个功能实际上会降低产品的总价值,因为复杂性成本超过了效用增益。

找到那个点是一个品味问题。而且当构建便宜时,这是一个变得更难而不是更容易的品味问题。当添加一个功能需要六个月的工程时间时,费用本身就是一个天然过滤器。团队只构建他们真正相信的功能,因为每一个都是重要的投资。当添加一个功能需要一个下午提示人工智能代理时,过滤器消失了。你可以构建一切,所以你必须选择不构建。选择不构建你可以轻松构建的东西是那里最困难的产品纪律,它是将伟大软件与膨胀软件区分开来的原因。

5、希腊人有一个词

哲学根源比大多数技术专家意识到的更深。古希腊人有一个叫做kairos的概念。正确的时刻,合适的行动,对特定情况的恰当回应。它与chronos(只是时间)区别开来。Kairos是关于判断:不仅知道做什么,而且知道什么时候和多少。

拉斐尔1509年壁画中的柏拉图(左)和亚里士多德,雅典学院(来源)

亚里士多德围绕中庸之道构建了他整个伦理框架。正确的勇气在懦弱和鲁莽之间,正确的慷慨在吝啬和挥霍之间。对于亚里士多德来说,美德本质上是关于校准的。这就是品味。找到正确数量的能力。

日本人也有一个词:shibui。一种克制、不招摇的美。表面复杂但呈现简单。shibui物体不会吸引注意力。它不会宣布它的聪明。它只是安静而完全地工作。

伟大的软件就有这种品质。你不会注意到设计,因为设计没有碍事。品味正是执行得如此之好才不可见。

6、为什么模型不会学习品味(暂时)

有人可能会反对:「当然,品味现在很重要,但模型也会发展品味。下一代模型会做出这些判断。」我认为这是合理的但不准确,原因很微妙。品味不是知识。它不是你在数据集中查找或推导的东西。品味是一个价值函数,一套关于什么重要的偏好,由生活经验、文化背景、领域专业知识和对世界应该如何运作的观点塑造。它本质上是固执己见的,而这些意见来自训练分布之外的某个地方。

想想「软件中的好品味」实际需要什么。它需要一个包含用户说不出他们想要什么的用户模型。大多数用户无法告诉你他们在产品中想要什么。他们可以告诉你当前产品中什么让他们恼火,但他们无法描述尚不存在却会让他们高兴的东西。

品味是为说不出需求构建的能力,从观察到的行为推断理想体验会是什么感觉。这需要心智模型、上下文感,以及愿意犯错,而当前模型根本没有。一个LLM可以优化已声明的偏好。它可以通过A/B测试达到局部最大值。但是,当前的LLM无法跳跃到一个根本不同的设计,没有用户要求但一旦体验后每个人都会更喜欢。

2007年1月19日,史蒂夫·乔布斯发布了第一款iPhone

当史蒂夫·乔布斯决定最初的iPhone不会有物理键盘时,这是一个违反每个可用数据点的品味决定。RIM的黑莓是主导。每个焦点小组都说键盘。数据说键盘。乔布斯说不是。他是对的,不是因为他有更好的数据,而是因为他有一个更好的模型,关于人们一旦体验了替代方案会想要什么。「世界应该与现在不同」的推理,恰恰是下一个token预测没有优化的。LLM在深刻意义上是向后看的。它们压缩过去。品味通常是想象一个尚不存在于训练分布中的未来。

7、30000家公司,三个条件

全球有数万家SaaS公司,仅美国就有超过一万家。分析师估计全球SaaS市场年收入约3900亿美元,一项广泛引用的调查发现平均公司使用大约一百种不同的SaaS应用程序。那是大约一百个不同功能包的订阅。

当三个条件成立时,SaaS公司存在:

  • 问题足够常见,可以将开发成本分摊到许多客户身上。
  • 解决方案足够复杂,客户无法自己构建。
  • 切换成本足够高,可以维持经常性收入。

人工智能编码工具正在系统地攻击第二个条件。当任何有能力的团队可以在一天内启动一个定制的内部工具时,「客户无法自己构建」的护城河在大量类别中蒸发。

并非全部。

具有深度集成和合规性的系统记录软件,如核心ERP、电子健康记录、银行基础设施,它们的价值不是在UI或工作流程中,而是在数据图中。

来源:Financial Review

但SaaS的长尾,那些销售相对薄工作流程工具、仪表板、报告层、表单构建器、项目跟踪器、CRM相邻工具的数千家公司?那些暴露了。SaaSpocalypse准确地告诉你哪一层陷入困境。但没有陷入困境的软件,人们真正喜欢和付费并围绕其构建工作流程的软件,是那些在每一层都融入品味的软件。

到年底,公共存储库中五分之一的代码行将由人工智能编写。代码本身,制品,正变得丰裕到 trivial 的程度。而当制品是 trivial 的,剩余的就是意图。代码背后的为什么。构建什么以及它应该如何感觉和什么应该省略的决定。这些决定是品味,我相信它们即将成为软件中最有价值的技能。

8、三点总结

首先,软件中品味的回报即将大幅增加。当一个生产要素(这里是原始实现)变得更便宜时,上游选择(为谁构建,用什么UX)的相对重要性自然增加。如果你有强大的产品直觉,对软件应该如何运作有清晰的观点,你的杠杆刚刚增加了一个数量级。你现在可以更低成本地表达你的品味。瓶颈不再是「我能构建这个。」瓶颈是「我应该构建这个,以及它应该如何精确运作。」

其次,防御性主要是工程复杂性的公司可能有麻烦。如果你的产品主要因为难以构建而有防御性,因为你有一个大团队和很多基础设施,那种防御正在快速侵蚀。生存下来的团队将是那些复杂性服务于有品味的 产品愿景的团队,而不是那些复杂性就是产品的团队。

第三,而且可能最违反直觉:人工智能生成软件的洪水将使人们对品味更敏感,而不是更不敏感。当一切都是丰裕的,稀缺的东西变得珍贵。如果我可以一个下午就 vibe-code 你应用的竞争对手,你的应用最好真的很好,不是 在「很多功能」的意义上,而是在「每次交互都感觉经过深思熟虑」的意义上。「足够好」的门槛正在上升,因为切换成本正在下降。

古腾堡的印刷机并没有使所有书相等。它使伟大的书更有价值,使坏的书更容易被丢弃。摄影没有杀死绘画。它杀死了无话可说的绘画。廉价的音乐制作没有使音乐商品化。它提升了有独特声音的艺术家。而人工智能辅助的代码生成不会使软件商品化。它将使无品味软件商品化,并增加由真正、固执己见、深思熟虑的品味构建的软件回报。

拉姆斯是对的。生产「更多」的工具现在几乎免费。选择「更少」的能力,知道什么属于什么不属于什么,对产品应该如何感觉有观点。

那从来不是稀缺的,永远也不会是。


原文链接: The Case for Tasteful Software

汇智网翻译整理,转载标明出处