AI智能体格局 (2026-01)
智能体技能?Clawdbot?Mac mini 上的 Claude Code?如果你是一名 AI 工程师,你会想阅读本文。
AI编程/Vibe Coding 遇到问题需要帮助的,联系微信 ezpoda,免费咨询。
当前 AI 智能体空间的状态非常有趣。我预期某种类型的离线学习(增强学习 RL 或知识蒸馏 KD)将成为下一个大趋势(我确实相信这个特定想法仍会发生,因此我正在构建一些东西来实现它)。
但当前 AI 智能体的状态相当有趣。我必须说,anthropic 实际上在大力推动它。不是 openai,也不是中国初创公司,是 anthropic 实际上在这个领域做了有用的事情。他们从第一性原理思考,并且目前正在塑造这个领域。
本文应该帮助你理解当前 AI 智能体市场 的形状。我将以结构化的方式倾倒我过去几周的所思所想。
1、提示词时代
ChatGPT 在 2022 年进入世界。改变了一切。很快,人们开始构建聊天机器人。一些有"卖铲子"心态的人开始意识到与 AI 进行提示词工程将是一种他们可以出售的技能。提示词工程开始了。课程、群组、什么都有。
在这里,大多数人在构建聊天应用程序。他们称之为"包装器"。向 AI 编写指令是热门内容。对于任何展示他们是更好的提示词工程师的人来说,都有疯狂的钱。
这是 2022-2023 年。
2、函数调用
我认为是 openai 在 2023 年推出了一个非常早期的工具调用版本。这将真正改变这些大语言模型被感知的方式。想象一个大语言模型可以查看你的自定义数据库(RAG 工具)或搜索互联网(互联网工具)或发送电子邮件(gmail 工具)。
初创公司仅基于此功能构建。我还在 composio 实习过,它是用于 AI 智能体和身份验证的工具包。
后来,在 2024 年底,Anthropic 推出了 MCP。这改变了一切。我们将进一步讨论它。
3、推理
在 2023 年,研究人员意识到你可以通过在提示中简单地给出,让大语言模型在给出答案之前思考。"逐步思考"。这个简单的提示允许相同的大语言模型在任务上比以前执行得更好。
在 2024 年底,大型实验室开始尝试大语言模型的行为,我们看到了可以开箱即用推理的模型。我们称之为推理模型。Openai O1 就是其中之一。我将进一步讨论这个问题。
4、AI 智能体的诞生
这是在 2023 年底,当我们在方程中有推理(通过提示词)和工具调用时。框架在这两者周围包装了一个大语言模型 API,因此,AI 智能体诞生了。
我不知何故很早就被拉入这个空间,我很高兴。
Crewai、langchain、langgraph 和其他一些。一些使用原始大语言模型 API + 工具调用 + 提示词工程
这个阶段我们能够将大语言模型变成可以进行多步推理、工具调用和基本交流的东西。
2024 年是这些的黄金时期。人们可以构建将节省大量时间和成本的工作流程。
5、MCP
MCP 很重要,因为它向我们(和 Anthropic)展示了一些东西。MCP 于 2024 年 11 月推出。
我们自 2023 年以来就有工具调用,但你仍然必须编写代码,并且你必须使用大语言模型 API 来使你的大语言模型具有工具调用功能。MCP 所做的是,它使整个过程变得容易。你可以将外部工具连接到 claude 桌面或其他兼容的 MCP 客户端。这个工具必须被一些规则包裹。
但这爆炸了。有数百个 MCPs,一个日常 AI 爱好者可以将他的 claude 与 MCPs 连接起来。人们构建了疯狂的工作流程。但前面有更美好的事情。
6、Claude Code
由于 AI 辅助编码正在爆炸,cursor 在这里领先。他们向 VS Code 添加了 AI 功能。这是他们的早期产品,在一年内,他们进化了很多。现在,cursor 基本上是 VS Code,里面住着一个 AI 智能体。
Anthropic 很快追上了他们自己的答案:Claude Code。2025 年 5 月推出。
Code 是一个 AI 智能体,你可以在终端中与之交互,它会为你读写代码。这非常巨大。Claude Code 目前是最好的编码智能体之一,与 cursor 并列。你可以添加 MCPs,你可以编写所谓的 rules.md(这将进化成某种东西,我们将进一步讨论)。你可以让这些智能体运行并为你构建东西。当然这些会花费很多。但看到市场兴趣仍然很有趣。
这是 2025 年。在 code 的推出和大规模采用之间到现在,Anthropic 注意到了一些有趣的东西。
7、智能体技能
(2025 年底)Anthropic 意识到了一些东西。Claude Code,这是一个为编码构建的 AI 智能体,实际上比他们想象的更通用。他们可以将其用于研究、金融事项和非技术事项。
这证明了什么:你不再需要构建 AI 智能体。代码就是你所需要的一切。
让我们理解 claude code 如何工作。它基本上是一个与接口交互的大语言模型 API,让我们称之为执行器。这为大语言模型提供了很多能力。上下文管理、读写文件、MCP 集成等。
现在,让我们连接所有点。我们有像 O1 和 Sonnet 4.5 这样的大语言模型,可以开箱即用进行扩展思考。我们有数千个可用的 MCPs。
Anthropic 意识到 claude code 可以用作智能体,他们为 claude code 构建了一个生态系统。他们可以指示 claude,给出 MCPs,并看到它的行动。
缺失了一块。你的 claude code 通常很强。比原始大语言模型 API 调用强得多,因为执行器逻辑写得很好。但 claude 没有方法拥有领域专业知识。通常当你构建 AI 智能体时,你会给出指令。提示中的重指令。这在 claude 中是不可能的,因为你无法向 code 添加提示词。Rules 是一个临时解决方案,但 Anthropic 提出了更好的解决方案:技能(Skills)
我建议你观看这个演讲,因为它涵盖了你需要知道的关于技能的所有内容。
技能遵循类似于 MCP 的模式。MCP 于 2024 年 11 月推出,但在 2025 年 2 月变得超级受欢迎。我认为我们已经知道技能的普及度在增加。
技能完成了堆栈(截至目前)。你可以给 claude 特定领域的指令、MCP 并观看它执行。
想象,clade code 拥有数千个 MCPs 和数千个技能。想象一个大语言模型,忘记积分(或使用强大的本地大语言模型)配置 claude code 使用这个大语言模型,给出世界上所有的 MCPs,给出所有的技能。给这个智能体自己的 gmail、浏览器、github。事实上,给这个智能体一个永久的"房子"(基本上是一个设备如 mac mini 或 raspberry pi)。看看会发生什么。

8、Clawdbot
这在我的时间线到处都是。它是 claude code 的开源替代品,它提供了更好的灵活性。 人们在这样做。Clawdbot 生活在 mac mini 上,配置了一切(各种账户和东西),它有做任何事情的自由。使用本地大语言模型,甚至更好(也更安全)。
9、结束语
这是当前 AI 智能体空间中重要的一切。还有很多其他东西如 manus、claude cowork。但我认为 claude code 是长期唯一重要的东西。
原文链接:Current AI Agent Landscape: Jan 2026
汇智网翻译整理,转载请标明出处