智能体记忆架构的收敛现象

1858年,查尔斯·达尔文收到一封信,一定让他心头一震。阿尔弗雷德·拉塞尔·华莱士寄给他一篇论文,精确地勾勒出了达尔文无法忽视的同一套自然选择理论——而达尔文在私下已经研究了二十年。两人没有合作。也没有互相抄袭。他们都遵循着相同的证据得出了相同的结论——因为证据只指向一个方向。

这种模式在科学史上有一个名字:多重独立发现。牛顿和莱布尼茨各自发明了微积分。贝尔和格雷在同一天为电话申请了专利。这种情况发生在一个问题成熟的时候——当底层数据、共享工具和正确的思维模型同时出现在互不交流的人们手中时。

我们现在正在AI工程领域见证这一幕的发生。问题是智能体记忆。而这个发现正在被全球范围内的前沿实验室、开源维护者、获得融资的初创公司、学术团队和独立工程师——同时且独立地——做出。

1、成熟的问题

过去一年里,每个认真构建自主智能体的团队都撞上了同一堵墙。智能体是有能力的。它们能写代码、规划多步任务、调用工具、相互协调。但它们做不到的是记忆。

不是那种有意义的记忆。

每次会话,智能体都以你交给它的任何内容开始。它上次学到的东西——什么出了问题、什么成功了、团队决定了什么、代码库实际上在做什么——除非有人设计了一个系统来捕获和恢复这些信息,否则就会蒸发。当多个智能体并行运行、互不共享时,它们会重新发现彼此的工作,矛盾彼此的决策,覆盖彼此的进展。能力在那里,连续性却不在。

这就是那个成熟的问题。而值得注意的是:在十二个月的窗口期内,几十个团队——没有协调、没有标准组织、没有共同资金来源——构建了本质上相同的答案。

2、趋同的架构

让我们给每个人都在构建的东西命名,因为即使结构相同,名称各异。

每个实现都包含某种形式的持久化、多层级记忆存储——一个超越上下文窗口而存在的地方,按类型组织:发生了什么(情景记忆)、学到了什么(语义记忆)、如何做事(程序记忆)。每个实现都包含主动整合——不仅仅是追加到日志,而是一个定期审查已存储内容、修剪过时信息、合并冗余内容、更新变化内容的过程。而且越来越多的实现包含一个后台智能体——一个在空闲时间运行的进程,负责记忆维护,使主智能体不必操心。

术语各不相同。Anthropic称之为Dreaming和AutoDream。Letta称之为睡眠时间计算。Google构建了一个Always-On Memory Agent。LangChain推出了ReflectionExecutor。底层机制是相同的:一个分叉的进程,异步运行,维护记忆基底以便工作智能体可以从干净、当前、精选的上下文中操作。

这不是模仿。这是趋同

3、并行发现的一年

在2025年初到2026年5月之间趋同的内容之广泛,值得深思。

Letta(加州大学伯克利分校的衍生公司,前身为MemGPT)于2025年4月发表了"睡眠时间计算:超越测试时的推理扩展"——一篇论文报告称通过让后台智能体在空闲时间预处理上下文,实现了约五倍推理成本的降低。他们的Letta 0.7.0版本将enable_sleeptime: true作为一等特性标志发布。这是该模式最早被公开命名的版本。

Anthropic的AutoDream——通过2026年3月的Claude Code源代码泄露曝光——实现了一个四阶段整合周期:信号收集、合并、修剪、重新索引。它作为分叉的只读子智能体运行。它明确借鉴了REM睡眠期间海马体记忆回放。Anthropic的工程团队求助于神经科学。Letta的团队求助于操作系统设计(RAM与磁盘)。他们殊途同归。

Google开源了一个Always-On Memory Agent——一个7×24小时运行的服务,配合Gemini Flash-Lite,每三十分钟执行一次定时整合,将结构化记忆存储在SQLite中。不同的团队、不同的实验室、不同的实现语言、相同的架构。

Mem0——获得Y Combinator和Kindred Ventures支持,到2025年底筹集了2400万美元——构建了一个三层记忆范围(用户、会话、智能体)、一个双LLM提取管道,以及一个自我编辑存储,更新而非追加。他们成为AWS Agent SDK的独家记忆提供商,并与CrewAI、Flowise和LangFlow建立了原生集成。

LangChain的LangMem于2025年2月推出,具有明确的情景、语义和程序记忆层级,以及后台ReflectionExecutor。Zep、Mastra和其他十几家初创公司从不同角度各自得出了结构相似的答案——知识图谱、TypeScript运行时、观察管道——全部趋同于相同的操作原语。

学术界的记录也在平行地讲述着同样的故事。2025年12月的综述"AI智能体时代的记忆"(Hu等人)需要编目超过十五篇独立研究论文——全部发表于2025年,全部独立推导出了具有主动整合的多层架构。另一项关于自我演化智能体的综述仅仅是为了追踪提示词和代码演化方面的并行工作。两个综述才容纳了一年的趋同成果。

然后是那些独立工程师。一位名为KeepALifeUS的开发者在CrewAI上实现了他们称之为"载体信息素模式"的东西——智能体读写共享状态而非直接相互通信,灵感来自蚂蚁信息素轨迹——并报告了80%的token成本降低。他们在CrewAI GitHub讨论中发布了结果。Roland Rodriguez发表了"为什么多智能体系统不需要管理者",从第一性原理推导出了相同的协调模型。一位维护会计自动化软件的开发者记录了他们对Voyager风格技能库的独立重新发现。独立工程师在自己的博客上发布,得出相同的结论,彼此互不知晓。

这不是一个趋势。这是一个趋同事件。

4、想法早已存在,时机未到

智能体记忆的底层原语并不新鲜。层级记忆模型——工作记忆、情景记忆、语义记忆、程序记忆——来自认知科学。睡眠整合理论有数十年的神经科学研究支持。黑板架构——智能体写入共享基底而非相互通信——在1980年代被形式化。载体信息素——通过环境信号而非直接通信进行协调——在1950年代的蚂蚁群落研究中有描述。

值得注意的并非这些想法的存在。而是在2025年和2026年间,几十个团队同时得出结论,认为现在是将它们付诸实践的时机。这个智力工具箱已经有一个世纪的历史了。而决定使用它的行动却在同一时刻发生了。

NousResearch的Hermes Agent框架强调了连续性感知的智能体设计——一个随其上下文增长并在任务间承继知识的智能体。Steve Yegge的分层架构——一个将智能体系统从个人助手映射到协调蜂群再到完全自主殖民地的模型——将共享知识基底确定为基本工具使用以上每个层级的关键缺失层。Dolt在版本控制数据库方面的工作提供了另一个角度:如果智能体在生产知识,那么这些知识需要与代码同等的关注——版本控制、差异比较、回滚。

OpenAI Codex为代码生成带来了持久上下文。Claude Code构建了AutoDream和KAIROS。CrewAI推出了原生Mem0集成。LangGraph添加了作为共享协调基底运行的BaseStore。AWS Strands、Google ADK、Microsoft Semantic Kernel、LlamaIndex、AutoGen——每个主要框架,在同一个十二个月的窗口期内,都添加了结构化记忆作为一等关注点。

达尔文时刻在于:他们都在没有相互交流的情况下做到了这一点。问题驱动了解决方案。

5、为什么这种趋同很重要

多重独立发现告诉你一个重要信息:解决方案空间是受限的。当十几个团队独立工作,产生结构相似的答案时,这证明底层的解决方案具有少量稳定解——而这个领域正在找到它们。

智能体的记忆问题,事实证明,确实有少量稳定解。你需要一个持久化存储。你需要主动策展。你需要生命周期操作——不仅仅是写入,还有更新、合并、修剪、淘汰。你需要策展异步发生,这样就不会阻塞工作智能体。你需要存储是共享的,这样多个智能体可以在没有消息传递开销的情况下进行协调。

这就是这个架构。实现细节各不相同——向量数据库与知识图谱与SQLite、Python与TypeScript与Rust、智能体控制与定时守护进程。但结构是相同的。

这在实践中的意义是:记忆工程正在成为一种学科,而不是差异化优势。 正如日志曾经是竞争优势而变成了基本配置,正如CI/CD从创新变成了默认假设,记忆架构也走在同一条道路上。2026年,任何构建自主智能体的团队面临的问题不再是是否投资记忆工程,而是在该架构的哪个位置构建自己的特定优势。

6、正在成型的技术栈

从这种趋同中涌现的参考架构有六个反复出现的组件:

一个具有有限上下文窗口的主智能体。一个持久化多层级记忆存储——向量加图谱加键值,或多策略混合——具有明确的生命周期操作。一个或多个后台子智能体——睡眠时间智能体、梦想子智能体、Always-On记忆智能体、反思执行器——在空闲时间异步运行并维护共享记忆。一个技能库——代码、提示词或结构化能力文件——通过嵌入索引并按需检索。一个共享基底,多个智能体读写而非直接相互通信。一个自我改进循环,将提示词和代码视为可演化参数,从执行轨迹中更新。

每个主要框架都在趋同于这个蓝图。规范的记忆工程技术栈还没有一个名字。但会的。

7、时机信号

关于多重独立发现还有一点值得注意:它通常标志着一个领域从探索转向工程化的时刻。

当牛顿和莱布尼茨都拥有了微积分,问题就从"这可能吗?"变成了"我们如何系统地应用它?"当达尔文和华莱士都拥有了自然选择,问题就从"什么驱动物种变化?"变成了"机制是什么?"

当Anthropic、Letta、Google、Mem0和一个GitHub讨论中的独立工程师都独立地构建了相同的记忆架构——那就是信号。问题已经有了答案。智能体记忆不再是一个开放的研究问题。它是一门工程学科。

那些这样对待它的团队——将记忆作为基础设施而非功能来构建、投资于整合层、为跨会话和跨智能体的连续性而设计的团队——将能够在跳过这一步的团队根本无法达到的水平上运行自主系统。

趋同已经完成。剩下的问题是执行


原文链接:Convergent Engineering: How Everyone Built the Same Thing

汇智网翻译整理,转载请标明出处