语言并非思考

你有没有遇到过这种情况?

我正在起草一份战略总结,于是找来我最喜欢的AI工具帮忙。我问它问题,给它分配任务,它就开始生成了。

我开始审阅草稿。起初,看起来还不错。结构还算合理。语言是连贯的。语法是完美的。它似乎接近我预期的样子。但总觉得哪里不对劲……

于是,我又审阅了一遍。然后又是一遍。我花了好一会儿才弄明白缺了什么。不是某个词或某个短语的问题。而是我一直以来在研究的那个核心思想。我苦苦思索了好几天的那种微妙之处,那种让思考变得有价值的东西,它不在那里。我把自己的理解读进了那些文字里,但别人是看不到的。

文字在那里。思考不在。文字是空洞的。

这就是表面上听起来不错的东西和真正表达思考的东西之间的差距。而且,在反复经历这种模式之后,我决定是时候公开面对这个问题了。

1、"信号"始终是人类的

让我们用摩斯电码来做个快速类比。代表字母的点和划并不是信息本身。它们是信息的信号。信息本身存在于线路另一端那个人的头脑中。他们想到了什么,将其编码,然后发送出去。你在你的这一端解码。信号承载了信息,但信息与信号并不是一回事。

在人类历史的大部分时间里,书面语言的产生成本很高。代笔人存在,但你得花钱雇。演讲稿撰写人存在,但政客和高管得花钱请。剽窃存在,但它需要上游有一个真正的作者,并且承担被抓住的巨大风险。即使是那些被反复使用的流行短语,对任何留心的人来说也是显而易见的。成本和风险让信号基本上保持了诚实。

流畅的输出通常来自一个头脑,因为替代方案很难大规模实现。所以我们养成了一种习惯:当你读到文字时,你可以相信在另一端有某种人类的思考存在。

这个习惯延续了数千年。

即使是空洞的文字也需要一些思考。一个咨询顾问在填充演示文稿时,仍然得选择用哪些流行词。一个产品经理在撰写产品需求文档时,仍然得整理出几个要点。一个设计师在搭建布局时,仍然得挑选一些组件。总是存在一个最低的思考底线,无论多么浅薄。"思考底线"是被强加的。产生任何东西,你都得思考……至少一点点。

然后,就在最近,文字变得廉价了。文字现在可以来自一个没有理解、没有信息、没有背后思考的系统。AI并没有发明空洞的输出。它只是通过移除思考底线,将其推向了极致。表面上,"信号"的输出看起来是一样的。但现在,你无法判断思考是否曾经发生过。

你可能会认为这是2020年代的新问题……但其实不是。早在1950年,艾伦·图灵的测试就提供了一种方式来回避"机器是否能思考"这个问题,将其简化为机器能否进行令人信服的对话。这个测试将语言作为思考的证据。不是因为语言就是思考,而是因为我们没有更好的测试方法。在一个语言只来自头脑的时代,它是有效的。但,现在情况不同了。

约瑟夫·维森鲍姆在1966年开发的ELIZA就开始在这个测试上戳窟窿了。那只是一个把人们说的话重新措辞返回去的小脚本。它不是思考。它是对基本语法规则的巧妙运用。人们向它倾注心声。他们相信有什么东西在倾听。今天你最喜欢的GPT也是一样。这种混淆并不新鲜。只是现在,能力被调到了11档。

而且我们早已超越了简单的文本。AI生成的图片和原型通常具有高质量的精致感。表面上,这种精致感让我们假设生成物背后有人类级别的智能。"Vibe coding"出来的应用看起来像能工作的软件。生成的图片看起来像是有人做出了选择的结果。原型具有以用户为中心的思考的表象。我们过去用来作为头脑在工作的证据的每一种输出,现在都可以在没有头脑的情况下出现。我们把高保真度解读为人类认知的信号。而在今天,这是一个巨大的错误。

2、表达不总是思考

在进一步讨论之前,我想对一件事保持谨慎。有些种类的表达是与思考不可分割的。当一个设计师画草图时,他们不仅仅是在记录已有的想法。他们是在实时地把它想出来。铅笔在纸上留下痕迹,预判着一个模糊的概念,眼睛感知,头脑解读,手调整。作品和头脑处于积极的对话之中。媒介会回话。你画了一个布局,然后意识到它行不通,但错误的版本向你展示了完美的版本所不会展示的东西。

写作式思考、原型制作,或任何那种直到东西摆在你面前你才知道自己知道什么的活动,也是如此。思考和表达是同时发生的。Nigel Cross曾撰文阐述伟大设计师实际工作方式中的这种动态。Bill Buxton则用整个职业生涯来论证将素描(和制作)作为思考工具的价值。

但这不是唯一的表达方式。大量的思考在没有语言和任何作品的情况下发生。

一个婴儿在学会杯子和勺子的说法之前很久就搞清楚了怎么用它们。没有人会说因为没有相关的词汇,就没有思考或推理在发生。一只乌鸦把铁丝弯成钩子,从管子里钩出食物。这只鸟想出了办法。没有用一个词。

在我们的现代社会中,我们把语言和思考捆绑在一起,仿佛它们是不可分割的。但它们不是。

另一个角度:想象你在用英语对话时,想要找一个你只用另一种语言知道的词。也许是西班牙语或德语中一个完美的词,却不太好翻译。这个想法在你头脑中已经完全成形。你能感受到它的形态,那种必要的微妙之处。你只是无法把它转换成你正在说的语言。词不是思考。词仅仅是思考的一种表达。词是思考的输出。

Michael Polanyi精准地指出,"我们知道的多于我们能说出来的。"真正的理解存在于语言所指向但从未完全包含的地方。文字是一种部分的导出。

那些背后有理解、塑造着战略框架、产品价值、用户流程、UI布局、或代码行数的表达,就是思考。另一种根本不是表达。它是看起来像表达的生产。实际上没有任何东西在被表达。从外部看,它们可能一模一样。区别在于,思考是否与作品的创造交织在一起——作品在创作过程中实时地与思考者对话。

一个产生语言(英语、HTML等)的系统,内部没有任何东西在回话,就只是纯粹的生产。它是没有发送者的摩斯电码。是没有表达的生产。虽然这些系统足够强大,可以吸收上下文并与我们的思考并行工作,但它们并不是任何思考的真实表达。它们是这些LLM内部所蕴含内容的统计投影,试图完成一个高级的数学挑战。它们可以成为人类表达思考的有用工具,但模型本身并没有在表达任何它们自己的思考。

"但是等等,"你可能会说,"我是在和AI迭代的。我反驳它。我改进它的输出。"当然,但注意这个循环中实际在发生什么。AI没有在思考。它是在创造人类试图表达的东西,基于人类的提示,然后依赖训练数据中的数学概率和统计上最有可能出现的下一个词。它是在从你能塞进其上下文的东西中进行"数学计算"。它不思考。只有你(人类)思考。

像画草图这样的活动会强制产生摩擦,因为错误的标记会一直错下去,直到你修正它。铅笔不会猜测你的意思。纸张不会用一些似是而非的东西来填补空白。AI移除了那种摩擦,除非你自己提供。思考仍然必须在你的头脑中发生,否则就根本不会发生。

3、同一误读的三面镜子

以下是三种具体的表现方式。

3.1 领导者

一位领导者看到了团队中某人的文档。文字看起来很干净。结构在视觉上很明显。论证有逻辑流。他们因此称赞作者思考出色,并给予奖励,很少去审视。这种精致感会出现在绩效评估、招聘决策以及下一个重要任务的分配中。

精致曾经是标准。精致曾经是昂贵的。它需要思考、时间、用心。现在精致变得廉价了。然而,思考仍然是稀缺的。现在,领导者无法仅从精致程度判断他面对的是哪一种。

3.2 设计师

一位设计师正在解释他们正在开发的一个功能,并让AI生成一个原型。结果回来了。看起来不错。看起来像是他们自己大部分会做的工作(甚至可能更好)。他们感受到了完成某件事的宽慰。

但在其被创建的过程中,没有像进行中的草图那样的"回话"。没有任何东西被反复斟酌。没有权衡被考虑。没有替代方案被考虑和否决。在组装过程中没有任何直觉感受发生。完成的保证到来了,却没有思考。

3.3 合作伙伴

你收到了一位合作伙伴的文档。可能是产品经理、技术负责人或高级领导者。他们把它作为自己的立场、自己的思考、自己的方向发送给你。你读了它,并开始对其推理。你提出问题、批评、并在他们所说的基础上进行建设。你把它当作他们思考的表达,因为合作伙伴的文档从来都是如此。

而你并不知道,这个文档是AI的一次性输出。他们给了提示。它生成了。他们扫了一眼。他们发送了。

有些部分表达了他们实际的想法。但是,AI填充的部分代表了对它以前见过的东西的平均。你无法分辨哪些是哪些,但你知道它还没有脱离写作的"恐怖谷"。你在对一个合作伙伴并不实际持有的立场进行推理,并投入真实的时间去完善一个来自虚无的方向。

但这里还有更糟的。更糟得多。他们自己可能也分辨不出区别。

提示是他们的。扫读感觉像是在读自己的作品。他们想"是的,这抓住了我的意思"。所以当你挑战它时,他们为之辩护……作为自己的东西。不是因为他们创作了它,而是因为这份文档感觉像是他们的。他们现在在为一个AI拼凑的立场辩护,而你在与一个并不完全是他们自以为的那个人争论。

AI不仅骗了你。它骗了那个名字写在文档上的人。

在所有三个例子中,精致被误认为是思考。这就是让整个局面变得棘手的原因。它腐化了。它用纯粹的生产换掉了思考。它将某种被产出的东西混同于正确思考的准确表达。思考是缺席的。

而当思考缺席时,工作并不会消失。它只是转移了。如果你幸运,下游的某个人——合作伙伴、同事或评审人——现在必须去做那些没有发生的思考(他们是不幸的人)。HBR最近关于"workslop"的文章指出了这一点:不承载真正思考的输出只是把成本转嫁给下一个人。

不要成为那个人。

4、精致不是证明

那么现在呢?作品可以在没有实质性思考或认知的情况下被大规模创造。那又怎样呢?

你无法仅仅通过观察某样东西来判断思考是否发生过。我们以前从来不需要。如果文字说得通,那背后一定有一个头脑在运作。如果像照片这样先进的东西存在,那一定是人类创造的。如果你有能用的软件,那是人构建的。我们以前是这么认为的。现在不是了。

Donald Schön有一个有用的概念叫"行动中认知"。其核心思想是,真正的专长往往存在于做之中(而非言辞中)。一个熟练的设计师可以驾驭一个棘手的问题,但之后并不总能完全描述出来。一个好的临床医生在五秒钟内做出判断,却需要一个小时来解释原因。专长是真实存在的。它只是抗拒被转化为语言。

如果我们把Schön与Polanyi的"我们知道的多于我们能说出来的"(前面提到的)结合起来,我们就会意识到认知部分存在于语言之外。让一个人擅长自己工作的东西,很难仅仅通过阅读他们写的东西或看到他们做的东西来评估。因为语言永远不够。例如,用户体验行业已经发明了成千上万的术语,仅仅为了捕捉共享的意义,而且这还没完。意义存在于词语之前。词语是后来才出现的,作为我们可以讨论已经存在的意义的快捷方式。

你可能会觉得我在吹毛求疵,但这可不是好洗发水能解决的问题。在被创造的东西上,没有任何测试能证明或证伪思考的存在。词语和作品始终是表达思考的一种尝试。这就是为什么作品集评审对我们如此重要。我们希望"看"+"听"结合起来,以获得对设计师思考的最佳理解。

所以现在,我们不能再依赖被产出的东西作为思考的证据了。在与任何内容或作品互动时,一个新的负担被强加给了我们。确保事情说得通的认知负担增加了。在某些情况下,工作量翻倍了。产出者必须更努力地思考被产出的东西,因为太多东西被快速创造出来了。读者必须质疑和剖析,因为精致不再是思考工作的证据了。在这两种情况下,这些文字和作品的"精致度"很高,但并不是努力的指标。

精致变得廉价了。思考仍然是昂贵的。

5、强化,而非外包

那么我们该怎么做?答案不是放弃使用LLM。不是羞辱或贬低那些使用它的人。甚至不是惩罚那些向你扔"workslop"或"trendslop"的人。

从LLM工具是什么开始。它们是(极其)先进的词语预测机器。它们不思考。它们创造出看起来像人类思考表达的东西。它根据你的提示、它们的训练数据以及统计上最有可能出现的下一个词进行计算。思考必须来自你。AI只是基于它以前见过的东西,对你输入的内容进行阐述。这种尝试可能是有用的。它产生的输出带有思考的幻觉,而这种思考从未存在过,因为它被训练成模仿人类思考所产生的输出。

从机制上讲,它们是旨在重现常见模式的统计程序。这不是攻击,这是功能性描述。它们被喂入了巨量人类写作和创造的东西。所以它们根据所见过的内容,一个接一个地生成最有可能的下一个比特。其输出,按设计,倾向于源材料的平均水平

这也不仅仅是我的观点。HBR的Beware the Agentic Convergence Trap认为,在相同数据上训练并指向相似目标的AI系统会趋同于相同的决策,侵蚀了公司实际赖以竞争的差异化。HBR的研究人员还标记了一种叫做"trendslop"的东西:LLM系统性地生成充满流行语、符合社会期望的战略"建议",因为这就是互联网在训练时的平均样貌。这些观察导致了对正在发生的事情的命名:Slop(sloppy的简写,意为缺乏批判性思考)。

一旦你接受了这些工具产生的是统计常态,你就可以更好地使用它们。有时常态正是你所需要的。有时它是你能使用的最糟糕的东西。知道(思考)哪种情况是哪种,是我们今天迫切需要的更多的人类技能。

  • 在常态即是目标的场合使用它。 基线总结。典型结构。一个你要去反驳的起点。用"最通用的版本"来检验你是否真的在说一些不同的东西。这些是真实有用的工作。
  • 在超越常态是目标的场合避免它。 独特战略。艰难的权衡。棘手的问题。那些正确答案尚未被写出来的地方,因此所有已写内容的平均值不可能包含它。如果你向平均值询问不寻常的东西,你会得到一个已经解决的问题的答案。(而这正是设计最常发挥作用的地方。)
  • 让AI展示它的"推理"。 不是要验证它思考了(它没有),而是强迫你评估其逐比特计算的输出链条。让它解释它做了什么。留意它遗漏了什么。这有助于确保思考已经发生,在它需要发生的地方……在你的头脑中。
  • 把草稿视为需要审问的材料,而非需要接受的可交付物。 精致不是思考或质量的证明。阅读每一个段落并问自己:如果有人反驳,我愿意为这个主张辩护吗?我能解释为什么这是正确的选择吗?如果不能,那它还不是你的。

所有这些的核心只有一件事:强化你的思考。不要跳过它。

6、结束语

这些工具不会消失 (除非我们看到前所未有的崩溃)。它们会变得更好、更自信、更精致、细节更丰富。(看看Fable就知道了) 输出信号会继续模仿背后有思考的发送者。不要被愚弄。那只是模仿。

摆在我们面前的工作有两半。对于产出者:你必须思考。不要让精致为你没有做过的事情制造幻觉。对于读者:去审问。不要让精致愚弄你懒于接受。两者都源于同一个事实。没有人能再从一个作品中读出思考了。

信号曾经是相对诚实的。现在不是了。所以下次你听到摩斯电码的嗒嗒声时,戴上你的思考帽。判断实质。而不是生产的信号。


原文链接:Language Isn't Thinking

汇智网翻译整理,转载请标明出处