LLM 已经不重要了

我交谈过的每个创始人仍然在一场错误的战争中选边站。GPT 对 Claude 对 Gemini。谁这周发布了最聪明的模型。

我认为这场战争已经结束了。不是因为模型不再重要,而是因为它们之间的差距不再重要。在 2026 年,选择任何一个前沿 LLM,如果你围绕它构建正确的基础设施,它都会表现得非常好。选择地球上最聪明的模型,但如果不给它任何关于你的业务或市场的信息,它仍然会产生垃圾。

真正的竞争在模型下面两层:你为智能体构建的上下文引擎,以及你在该上下文周围搭建的记忆系统。技能层在两者之上。这个顺序比你选择了哪个 LLM 更重要。

1、架构

我在 Trigify 为自己的智能体运行这套系统的方式分为三层。内部上下文。外部上下文。记忆。技能层在所有三层之上。

上图就是整个技术栈。大多数人先构建技能部分,然后疑惑为什么他们的智能体感觉很通用。我认为你应该以相反的方向构建。技能是最后的 10%。另外 90% 是智能体在产生任何输出之前阅读的内容。

2、外部上下文

这是来自外部世界的信号。智能体阅读这些东西以了解市场中正在发生什么,你的领域中的对话和讨论正在发生什么。

我把它分成两层。第一层是高速度的,趋势移动最快的地方:

→ X / Twitter
→ LinkedIn
→ TikTok、Threads、Instagram

当第一层的某个内容引起共鸣时,我希望智能体更深入。那就是第二层,长篇学习层:

→ Reddit 帖子
→ Substack 文章
→ YouTube 和播客转录稿

一个好例子。上周"Claude Code for AEO"开始在 X 上流行。每天三四条帖子,真正的互动,我网络中的多个运营者在谈论它。那就是第一层信号。我不希望我的智能体猜测 AEO 是什么意思或工作流程是什么。所以第二层自动启动,拉取过去 30 天内它能找到的关于 AEO + Claude Code 的所有长篇内容。当坐下来写关于它的时候,智能体已经加载了完整的论点。我不是在喂它链接。我是在向它提问。

我通过 Trigify 来做所有这些,因为它是社交媒体和新闻信号的统一 API。一个连接,所有平台。但无论你用什么,这个原则都适用。

3、内部上下文

这是你拥有的数据。你的业务内部发生的所有事情——你的销售管道、会议、产品。

→ HubSpot 用于 CRM、交易、管道、转化率
→ Notion 用于文档、项目、内部 Wiki
→ Slack 用于频道讨论(只监控我告诉它监控的频道)
→ Gmail 用于我明确转发的邮件线程
→ Granola 用于会议记录
→ Fireflies 用于通话转录稿
→ Featurebase 用于产品反馈和更新日志

大多数智能体完全跳过了这一点。它们写一封冷邮件或一篇内容,对潜在客户刚刚和我的团队开过会,或者我们周二发布了一个版本,或者本月流失率上升了 0.4% 一无所知。所以输出始终处于同一水平:技术上没问题,完全没有人情味,和地球上任何其他智能体无法区分。

接入内部上下文是让智能体感觉它真正在你的公司内部运作的关键。这就是解锁点。

4、记忆层

内部和外部都流入记忆系统。这是大多数人搞错的部分。他们把所有东西倒进向量数据库,称之为"上下文",然后疑惑为什么智能体仍然会产生幻觉或通用的输出。

我运行的系统更接近 Obsidian 风格的 Wiki 而不是向量存储。原始数据带着完整的源元数据落在 /raw 中。每天两次,一个 cron 任务在原始层上运行,在对任何内容升级为真正的记忆之前应用信念检查。

规则很简单。一个信号只有在原始数据中出现三次或更多次时,或者它是黑白分明的我明确告诉智能体的事实时,才成为记忆。比如"我们达到了 140 万美元 ARR"或"本季度流失率为 2.1%"这样的东西会立即进入。其他所有东西都必须通过重复来赢得它的位置。

一条病毒式推文不是信念。一个令人印象深刻的演示不是信念。播客中的一个逆势观点不是信念。智能体等待。cron 再次运行。如果信号持续出现,它就会被提升到 Wiki 层,带上标签、来源、置信度分数和指向相关记忆的反向链接。

结果是智能体有了真正的观点。它知道我实际上相信什么,市场实际上相信什么,什么仍然只是噪音。没有那个过滤器,你最终会得到一个对所有只火了半个下午的东西都自信地出错的智能体。

4、技能层在顶部

一旦上下文和记忆层活跃起来,技能就登场了。AISDR。内容写手。内部自动化。冷邮件。任何你想给智能体的工作流。

技能本身是一个流程。它告诉智能体如何做某事。没有底下的层,技能会产生比裸聊稍微好一点的输出,但它仍然会感觉很通用、没有灵魂,而且明显是 AI 生成的。

上图是实际的差异。同样的提示词、同样的模型、同样的技能。左边版本底下什么都没有。右边版本有记忆、内部上下文和外部信号接好了。一个读起来像是发给一千个人的模板。另一个读起来像是我在花了一个小时研究潜在客户后亲自写的。

我这不是在说一个小事。这是被忽视的智能体和能成交的智能体之间的区别。技能是最容易复制的层。上下文引擎和记忆系统才是真正的护城河所在。

5、如何复制这套系统

如果你想在你的环境中做这件事,两个提示词就能让你走完大半的路。一个用于构建记忆系统。一个用于接通供给它的上下文基础设施。两者都在 Claude Code、Hermes、OpenClaw、Codex 以及任何有文件系统访问权限的工具中工作。

我把完整的提示词放在了一个 Notion 文档里 → Prompts

按顺序把它们放进你的智能体。记忆系统优先。上下文基础设施其次。告诉智能体在构建任何东西之前给你做一个差距分析,这样你可以确切看到你需要什么凭据和连接器。然后逐个来源地完成它。


原文链接:The LLM Doesn't Matter Anymore

汇智网翻译整理,转载请标明出处