智能体接入现实世界的3种方式

Agent 的能力取决于它能触及的系统。团队通常会选择三种方式将 Agent 连接到外部系统——直接 API 调用、CLI 和 MCP。

智能体接入现实世界的3种方式
AI模型价格对比 | AI工具导航 | ONNX模型库 | Vibe Coding教程 | PLC在线仿真器 | Tripo 3D | Meshy AI | ElevenLabs | KlingAI | ArtSpace | Phot.AI | InVideo

Agent 的能力取决于它能触及的系统。团队通常会选择三种方式将 Agent 连接到外部系统——直接 API 调用、CLI 和 MCP。本文将阐述每种方式的适用场景、为什么生产级 Agent 倾向于选择 MCP,以及构建这些集成的有效模式。

1、将 Agent 连接到外部系统

我们通常看到三种将 Agent 连接到外部系统的路径:直接 API 调用、CLI 和 MCP。每种方式都有其适用场景,取决于你在构建什么。关键区别在于 Agent 和服务之间是否存在一个公共层,以及这个公共层能覆盖多大范围。

1.1 直接 API 调用

Agent 直接调用你的 API——要么在代码执行沙箱中编写发出 HTTP 请求的代码,要么通过通用的函数调用工具。这是大多数团队的起点,对于一个 Agent 与一个服务通信,或者少量不需要跨 Agent 平台复用的集成来说,效果不错。

规模扩大后挑战就来了。Agent 和服务之间没有公共层,每对 Agent-服务组合都会变成一个定制集成,各自处理认证、工具描述和边缘情况——这就是 M×N 集成问题。

1.2 命令行界面(CLI)

Agent 在 shell 中运行你的命令行工具。这种方式快速、轻量,且利用了已有的工具生态。它非常适合本地环境和沙箱容器——任何有文件系统和 shell 的地方。这提供了一个公共层,但很薄。

CLI 在触达移动端、Web 端或不暴露容器的云托管平台时会遇到硬性限制,认证由 CLI 自身的机制处理——通常是磁盘上的凭证文件。这种方式最适合本地环境中的快速、宽松集成。

1.3 模型上下文协议(MCP)

MCP 将公共层作为协议提供。Agent 连接到一个暴露你系统能力的服务器,认证、发现和丰富的语义都已标准化。一个远程服务器可以触达任何兼容的客户端(Claude、ChatGPT、Cursor、VS Code 等),在任何部署环境中。

它需要稍多的前期投入。回报是集成具有可移植性,并提供了功能丰富的 Agent 集成所需的语义。

2、生产级 Agent 运行在云端

生产级 Agent 越来越多地运行在云端,以便扩展和持续运行。它们需要触达的系统也托管在云端:你的数据所在之处、工作追踪之处以及基础设施运行之处。这些系统通常是远程的,需要认证,而 MCP 正是提供公共层的解决方案。

我们已经从采用趋势中看到了这一点。MCP SDK 的月下载量最近超过了 3 亿次,从年初的 1 亿次增长而来,企业和主流 Agent 平台的采用率都很高。每天都有数百万人使用 MCP 与 Claude 交互,该协议是我们最近发布的许多功能的基础,包括 Claude CoworkClaude Managed AgentsClaude Code 中的 channels

随着 MCP 持续支持生产级 Agent 系统,我们正在分享构建这些集成的最佳模式:从构建高级服务器到上下文高效的客户端,以及技能如何与协议互补。

3、构建高效的 MCP 服务器

我们的目录中有超过 200 个 MCP 服务器,每天被数百万人使用。通过与在协议上构建的企业和开发者密切合作,我们发现了一些决定 Agent 能否可靠使用服务器的设计模式。

3.1 构建远程服务器以实现最大覆盖

远程服务器是实现分发能力的关键——它是唯一能在 Web、移动和云托管 Agent 上运行的配置,也是每个主流客户端优化消费的目标。构建远程服务器,让 Agent 能在任何运行环境中使用你的系统。

3.2 按意图而非端点组织工具

更少、描述良好的工具始终优于穷举式的 API 镜像。不要将 API 一对一地封装为 MCP 服务器——按意图组织工具,让 Agent 可以通过几次调用完成任务,而不是拼凑多个原语操作。一个 create_issue_from_thread 工具胜过 get_thread + parse_messages + create_issue + link_attachment。参阅为 Agent 编写有效的工具了解完整模式。

3.3 当操作面很大时,设计代码编排方案

如果你的服务需要数百个不同的操作(如 Cloudflare、AWS 或 Kubernetes),按意图组织的工具集可能无法覆盖。相反,暴露一个接受代码的薄工具层:Agent 编写一个简短的脚本,你的服务器在沙箱中针对 API 运行它,只返回结果。Cloudflare 的 MCP 服务器是参考示例——两个工具(search 和 execute)以大约 1K token 覆盖了约 2,500 个端点。

3.4 在有帮助的地方提供丰富的语义

MCP Apps 是第一个官方协议扩展,允许工具返回交互式界面,如图表、表单或仪表板,全部在聊天界面中内联渲染。提供 MCP Apps 的服务器通常比仅返回文本的服务器有显著更高的采用率和留存率。利用它在关键时刻将你的产品 UI 展示在 Agent 或最终用户面前——该扩展已在 Claude.ai、Claude Cowork 和许多其他主流 AI 工具中得到支持。

Elicitation 允许你的服务器在工具调用过程中暂停并向用户请求输入。表单模式发送一个简单的 schema,客户端渲染原生表单——用于请求缺失的参数、确认破坏性操作或消除选项歧义。URL 模式将用户引导到浏览器——用于完成下游 OAuth、收款或收集任何不应经过 MCP 客户端的凭证。两者都让用户保持在流程中,而不是跳转到设置页面。表单模式已被广泛支持;URL 模式在 Claude Code 中得到支持,更多客户端正在开发中。

3.5 依赖标准化认证

标准化认证使 MCP 对云托管 Agent 来说更实用。如果你的服务器需要 OAuth,最新的 MCP 规范支持 CIMD(客户端 ID 元数据文档)用于客户端注册——它为用户提供快速的首次认证流程,大大减少意外的重新认证提示。这是我们推荐的认证方法,该功能在 MCP SDK、Claude.ai 和 Claude Code 中得到支持,并正在业界广泛采用。

一旦用户完成授权,下一个问题是云托管 Agent 如何在运行时持有和复用这些令牌。Claude Managed Agents 中的 Vaults 解决了这个问题:注册一次用户的 OAuth 令牌,在创建会话时通过 ID 引用 vault,平台会自动将正确的凭证注入每个 MCP 连接并代你刷新——无需构建密钥存储,无需在每次调用时传递令牌。

4、让 MCP 客户端更上下文高效

MCP 标准化了 AI 客户端连接和使用其所需的工具和数据源(服务器)的方式。服务器安全地暴露一系列能力,而客户端负责编排它们并管理上下文。如果你正在构建 MCP 客户端,可以通过渐进式披露模式使其更加上下文高效。

4.1 使用工具搜索按需加载工具定义

工具搜索延迟将所有工具加载到上下文中,而不是预先加载。这允许 Agent 在运行时搜索目录,在需要时拉取相关工具。在我们的测试中,工具搜索通常可以减少 85% 以上的工具定义 token,同时保持较高的选择准确率。

通过工具搜索减少上下文使用

4.2 使用编程式工具调用在代码中处理工具结果

编程式工具调用在代码执行沙箱中处理工具结果,而不是将原始结果返回给模型。这允许 Agent 在代码中跨调用进行循环、过滤和聚合,只有最终输出进入上下文。在我们的测试中,这在复杂的多步骤工作流上减少了约 37% 的 token 使用量。

这些模式可以自然地跨多个服务器组合:更精简的上下文、更少的往返、更快的响应。参阅高级工具使用了解完整分解。

5、将 MCP 服务器与技能配对

技能和 MCP 是互补的。MCP 让 Agent 可以访问外部系统的工具和数据,而技能教会 Agent 如何使用这些工具来完成实际工作的过程性知识。最强大的 Agent 同时使用两者,技能使 MCP 服务器能够扩展到更多连接。有两种通用的组合模式:

5.1 将技能和 MCP 服务器打包为插件

Claude 的插件是一个有用的抽象,允许开发者将技能、MCP 服务器、钩子、LSP 服务器和专门的子 Agent 打包为一种易于消费的分发方式。使用这种方法是以最小摩擦统一多个上下文提供者的最佳方式。

将 MCP 服务器与技能结合使用,让 Claude 可以更像一个领域专家。通过 MCP 获取工具,并通过技能赋予 Claude 端到端编排工作流的能力。以我们 Cowork 的数据插件为例,它包含 10 个技能和 8 个 MCP 服务器,覆盖 Snowflake、Databricks、BigQuery、Hex 等应用。

将技能与 MCP 结合使用

5.2 从 MCP 服务器分发技能

越来越多的提供商会与其 MCP 服务器一起发布技能,这样 Agent 既能获得原始能力,又能获得使用它们的最佳实践指南。CanvaNotionSentry 等都在 Claude 中这样做,在我们的 Web 目录中将技能列在连接器旁边。

为了使这种配对在每个客户端都可移植,MCP 社区正在积极开发一个扩展,用于直接从服务器交付技能。这样客户端会自动继承相关的专业知识,并与所依赖的 API 一起版本化。我们预计随着该扩展的稳定,这种模式将得到广泛采用。

6、复合层

我们开头提到了连接 Agent 到外部系统的三种路径。在实践中,成熟的集成会同时提供这三种方式:API 作为基础、CLI 用于本地优先环境、MCP 用于基于云的 Agent。

随着生产级 Agent 迁移到云端,MCP 成为关键层,而且是具有复合效应的那一层。今天,一个远程服务器可以触达任何兼容客户端,覆盖任何部署环境,认证、交互性和丰富语义都由协议处理。随着更多客户端采用该规范、更多扩展落地,同一个服务器无需你发布任何新东西就能变得更强。

在构建集成时,如果你的目标是让云端的 Agent 触达你的系统,就构建一个 MCP 服务器,并用上述模式把它做到极致。每一个基于 MCP 构建的集成都在增强生态系统:更少的边缘情况需要独自解决,更少的定制集成需要维护。


原文链接: Building agents that reach production systems with MCP

汇智网翻译整理,转载请标明出处