数据即产品:数据战略缺失的环节
我职业生涯的大部分时间都在四家初创公司构建软件产品,服务于数百家企业组织,经历了无数次发布,以及比我愿意承认的更多的"让我们在周末前上线"的时刻。在那个世界里,一切都围绕着所有权、迭代和对用户的同理心。你带着目的去设计,无情地测试,衡量结果,并随着时间的推移不断演进产品。
但当我更深入地参与数据战略工作时,我注意到了一些奇怪的事情:数据似乎没有得到同样的尊重。
软件有产品负责人;数据有委员会。 软件有路线图;数据有清理项目。 软件有反馈循环;数据有发布后再也没人看的仪表盘。
我们构建了价值数十亿美元的分析平台,能在几秒钟内传输 TB 级数据——但往往没有人能告诉我数据为什么存在,谁拥有它,或者是否有人真正信任它。
那时我开始怀疑:也许数据的问题不在于技术——而是缺乏一种产品思维。
1、第一个线索:当数据工程开始像软件一样运作
我第一次接触到这个想法是在多年前,当时我领导的公司收购了一家数据技术公司。他们的系统做了一件我从未见过的事情:它使用面向对象的原则来构建数据资产,比如继承、封装,甚至是版本控制。
你可以像扩展一个类一样扩展模式或管道,像 Git 历史一样管理血缘关系,并用意图而非恐慌来处理变更管理。突然间,数据工程看起来不再像管道工程——它看起来像软件工艺。
当时,我没有合适的词汇来描述它。但回过头来看,那是我第一次接触到数据即产品——被版本化、被治理、为进化而非熵增而构建的数据。
尽管如此,在那时,这只是个例外。大多数企业数据战略感觉像是灭火、考古和一厢情愿的混合体。我们把一些东西称为"平台"或"中心",但它实际上只是一堆等待下一次破坏性变更的管道集合。
2、寿司顿悟
然后在四年前的一个下午——在一顿寿司上——这个想法终于清晰了。
我和我的同事 David Piontek 坐在一起,讨论在大型企业中扩展数据战略的挑战。在吃辣味金枪鱼的间隙,David 说了一些让我停住筷子的话:
"我喜欢把数据领域想象成产品——有明确的产品所有权、价值案例和路线图。"
我记得抬起头问:
"这些和我们在软件产品管理中使用的原则是一样的?"
他笑了。"没错。"
那一刻,一切都在我脑海中 crystallized。数据工程和商业价值之间缺失的环节不是另一个平台、管道或治理框架——而是一种思维方式。
我们一直把数据当作基础设施来对待,而实际上我们应该把它当作体验来对待。 基础设施是被维护的;产品是被设计、衡量和改进的。
每一个伟大的软件产品都有:
- 一个明确的受众(它服务的人),
- 一个清晰的目的(它解决的问题),
- 一个反馈循环(它如何变得更好),以及
- 一个唯一的责任人(对其成功负责的人)。
数据几乎从未有过这些。那次寿司对话重新定义了一切:使软件可扩展、可靠和以用户为中心的原则,正是数据战略一直缺失的东西。
3、Netflix 的验证:数据即产品框架
快进到 2025 年。Netflix 发布了一篇标题为 "Data as a Product: Applying a Product Mindset to Data" 的博客文章。
读起来感觉似曾相识——或者说是一种印证。David 和我在寿司桌上根据他的经验讨论的一切,现在被世界上数据驱动程度最高的公司之一正式化了。
Netflix 的框架为我们多年来一直感受到的东西赋予了结构。它定义了七个核心原则,将数据从被动资产转变为被管理的、可衡量的产品:
- 明确目的 — 每个数据集的存在都是为了支持一个决策或回答一个问题。
- 明确用户 — 数据消费者被视为客户,有需求和期望。
- 可衡量的价值和质量 — 数据健康和可信度像 KPI 一样被衡量。
- 精心设计和文档 — 数据有用户体验;可用性很重要。
- 生命周期管理 — 每个数据产品都应该像软件一样演进或退役。
- 明确所有权 — 有人对准确性、可用性和相关性负责。
- 信任和可靠性 — 质量不是技术特性;它是产品承诺。
我喜欢 Netflix 方法的地方在于它以有意性来对待数据。数据不只是被收集——它被策划、版本化,并在整个生命周期中被管理。就像一个伟大的产品一样,它通过可靠性和设计赢得信任,而不是靠单纯的数量。
这个框架终于将数据战略、工程和业务对齐放在了同一个层面上。它也是使 AI 系统——以及我们许多人正在设计的智能体架构——能够负责任和智能地运行的基础。
4、为什么这在 AI 时代很重要
在旧世界中,数据驱动仪表盘。在新世界中,数据驱动决策。
每一个 AI 系统——无论是推荐产品、优化定价,还是引导供应链物流——都依赖于干净的、有上下文的和值得信赖的数据。
这就是为什么"数据即产品"不仅仅是一项治理工作。它是 AI 成熟度的前提。
如果 AI 是引擎,数据就是燃料——但并非所有燃料都燃烧干净。没有所有权、文档和生命周期管理,AI 系统会退化。它们会做出过时的、有偏见的或不连贯的决策。
"数据产品"思维改变了这个等式。它确保了:
- 数据在团队之间是可发现和可组合的,
- 新的数据集和格式根据实际需求被优先排序,
- 指标和模型有明确的血缘关系和版本控制,以及
- 信任和可用性成为产品特性,而非事后考虑。
这就是负责任地行动的 AI 和仅仅做出反应的 AI 之间的区别。
5、数据的产品负责人宣言
如果你曾经构建过软件产品,你就已经知道出色的数据战略应该是什么样的。
它不是启动另一个平台或整合到又一个数据湖中。它是关于将产品纪律应用于我们历史上一直当作副产物的东西。
这意味着要问:
- 这些数据是为谁准备的?
- 它支持什么决策?
- 我们将如何衡量它的成功?
- 谁拥有它的健康和演进?
这些问题的答案不仅定义了良好的数据治理,更定义了良好的商业战略。
6、从寿司到战略
与 David 的那次寿司对话提醒了我,有时候最强大的转变始于最简单的时刻——一顿共享的午餐、一个新的视角、一句重新定义整个学科的话。
Netflix 可能写了最新的手册,但这个原则适用于任何地方:
把数据当作产品来对待,你将获得可靠性、信任和采用。把数据当作基础设施来对待,你将继续为没人重视的维护买单。
在构建软件产品数十年之后,这感觉像是回到了起点。那些帮助我构建可扩展的、以用户为中心的系统的原则,正是最终能让数据战略发挥作用的原则。
所有权。目的。设计。反馈。信任。
这就是数据如何从一个项目变成一个产品的方式——一个真正能为下一代智能企业提供动力的产品。
原文链接: From Software to Sushi: Why "Data as a Product" Finally Fixes What's Been Missing in Data Strategy
汇智网翻译整理,转载请标明出处