数据极客的崛起
AI 的下一阶段需要燃料,以下是如何将自己定位为提炼者的方法
数据就是新石油,如果你知道如何利用它,2026 年的工作机会将属于你。
整个 2025 年,我收到的最受欢迎的求助请求都是关于数据的。事实上,在最近的一次咨询通话中,一家非科技公司的 CEO 直接问我将如何"结构化[他们的]非结构化数据"。在一个轻松的时刻,我给了他一个诚实的回答,也许有点带刺。
"我想说你根本无法结构化它,所以它才叫非结构化数据。你必须在它周围构建东西,就像搭建脚手架一样。"
我不应该写他的回答,但这很搞笑。
"如果我明白你刚才说的话,我就不需要雇你了。"
是的,我经常听到这种话。让我解释一下。
2025 年,数据变成了一种非常丰富的新资源,就像石油。2026 年,那些知道如何处理数据——并将石油提炼成燃料——的人将供不应求。
1、数据极客的崛起
我从来都不是最好的软件开发者、最好的企业家、最好的作家,或者坦白说,最好的运动员。我没有神奇的天赋——无论是身体还是大脑——能让我在这些追求中进入最顶层 1% 的高度。
但不要误解我。虽然我在基因上自豪地属于那 99% 的群体,但我确实愿意在这些领域与任何人一较高下。好吧,运动员那个就算了,我会被碾压,但其他领域肯定没问题,因为我的超能力是:我是一个巨大的数据极客。
我对体育的热爱源于对体育数据的热爱,了解结果让我在身体素质不足的地方获得了优势。你可以嘲笑,但这实际上和 Alex Honnold 的工作方式是一样的。这也适用于科技甚至商业。我知道有大量的收入隐藏在海量的数据集中,而软件和"商业"是我用来开发这些富矿的,就像油井一样。
几十年来我一直说"数据是新石油",但真相是,数据一直是石油,我只是每次 flashy 的新技术让人惊叹几个月或几年时都要这么说,这样他们才能摆脱那些昙花一现的东西,意识到如果没有数据,所有新技术都只是烟雾。
数据是火,一直都是,而在 2026 年,焦点将重新回到它身上。
以下是如何在 2026 年将自己定位为数据挖掘者的方法。
2、AI 的非结构化数据阶段已经结束
赢家已经被选出来了。如果你想挑战像 OpenAI、Anthropic、Google 和 Microsoft 这样的巨头,你需要想出一个如此独特的数据概念,以至于会让人笑掉大牙。
作为一个终身创业者,我可以告诉你,每个新企业的"被笑出房间"阶段比看起来更难生存,尤其是当你兴奋地在餐巾纸背面草草写下想法的时候。
所以如果你在考虑聊天机器人或 LLM,或者抓取内容并训练模型——而且你不是在一个极度被忽视和被低估的市场中追求超级细分领域——你现在最好去巨头公司工作,而不是与他们对抗,至少在 AI 历史的当前阶段是这样。
但问题在于。非结构化数据无处不在。过去几年就像是戴上了一副《他们活着》的眼镜,看着一切,看到的全是数据。
哦,那个 Web 应用,那是数据!那个硬件,那是数据收集设备!那张信用卡,那是金矿!
我是说,OpenAI 正在进军硬件领域。为什么?数据收集设备。
3、美国企业拥有的聊天机器人没什么可说的
我们在 2026 年初遇到的主要 AI 相关问题之一是,世界上每家公司现在都有自己的聊天机器人——或者其他类型的生成式助手 AI。但除了一些 RAG 调整或自定义分块和嵌入之外,他们的宠物聊天机器人没有什么能贡献到对话中的东西,这是隔壁的聊天机器人也做不到的——带着 AI 风格的虚假自信。
废话废话废话,幻觉、欺诈、未兑现的承诺、没有 ROI 的项目,现在每个人都讨厌 AI。
无论如何,在所有聊天机器人资金投入之后,在所有的炒作、恐惧和错失恐惧症(FOMO)之后,在数百亿美元即将被投入数据中心以加速这种沼泽蔓延之际,我们都开始意识到我在 2010 年发现的那一同样坚定不移的真理。
当 Automated Insights 在 2010 年开始生成自动内容时,我们专注于正在说什么,而不是如何说。换句话说,我们获取客户的结构化数据,数百万行分散在数百个表中的数据,然后想办法从这些数据——那些石油口袋——中挖掘关键洞察,并将它们转化为叙述,成为我们引擎的燃料。
我们正在使数据可操作,而不是可对话。
在 2026 年,你真的可以直接将 LLM 扔到非结构化数据之上——就像《异形》中的抱脸虫(我今天不知何故沉迷于科幻恐怖电影),然后 churn 出一个体面的对话。
而这就是结局所在。
直到你有结构化数据来创建洞察之间的连接组织。
4、AI 下一阶段的赢家
正如我的非科技 CEO 客户所说的那样,"非结构化数据的结构化"——将数据石油提炼为有洞察力和可操作的燃料——不仅将驱动聊天机器人,还将驱动下一波 AI 自动化、代理行动和预测分析。
现在,非结构化数据无处不在,就像一种等待被开发的商品,但用不了多久,非结构数据的稀缺法则就会开始生效,最终获得最多经过处理的结构化数据集的人将有机会成为下一波 AI 的先行者。
坏消息是,下一波不会是另一个追逐万亿美元估值的时刻。常识、买家的后悔和空空如也的企业口袋都已经确保这次将会有更理性的头脑占上风。
好消息是,机会多多,跨越多个部门、未被触及的行业、广阔的潜在富数据领域等待着知道如何开发它们的人。每个人都需要这些提炼者。
所以数据极客——那些将 SQL 作为第二语言并计算准点百分比来预测准时上班几率的人——2026 年是你的时刻。是你的发光时刻。
如果你还不是数据极客,那么从 Sheets 到 SQL 到 Snowflake,赶紧学起来,因为现在是个好时机。
原文链接: These Nerds Will Actually Survive the Next AI Job Apocalypse
汇智网翻译整理,转载请标明出处