OpenClaw 新手指南

如果您听说过有关“Moltbot”或“OpenClaw”的传闻,并且想知道这些大惊小怪的原因,那么您来对地方了。

在短短几周内,这个项目已经从一个周末实验变成了历史上增长最快的开源项目之一,一路走来,它催生了一些更奇怪的东西:一个人工智能代理相互交谈而人类只能观看的社交网络。

让我向您介绍这是什么、它是如何运作的以及为什么人们既兴奋又害怕。

读完本博客后,您将对此有所了解

我们开始吧

1、OpenClaw是什么?

将 OpenClaw 视为您计算机上的个人助理。但与 Siri 或 Alexa 不同的是,这个助手不仅回答问题,而且还回答问题。它实际上 *为你做事 。

需要查看您的日历吗?它可以做到这一点。想要整理计算机上的文件吗?完成。 需要有人通过电子邮件与汽车经销商进行谈判吗?是的,它也可以处理这个问题。

不同之处在于 OpenClaw 完全在您自己的计算机上运行,​​并连接到您已使用的消息传递应用程序,例如 WhatsApp、Telegram 或 Slack。

名称游戏: 该项目以“Clawdbot”(与 Anthropic 的 AI“Claude”太相似)开始,然后变成“Moltbot”(更好,但尴尬),最后在 2026 年初定名为“OpenClaw”。如果你看到这些名字中的任何一个,他们都在谈论同一件事。

为什么是“Claw”? 开发者 Peter Steinberger 希望构建一个强大且自主的东西,因此可以构建一个可以抓取和操纵数字世界中的物体的爪子图像。

2、架构可视化

让我们在不涉及太多技术的情况下深入了解一下。 OpenClaw 的建立就像一家组织良好的公司,不同的部门处理不同的工作。

3、4个主要部分

3.1 网关(前台)

可以将其视为人工智能助手的接待员。它是在您的计算机上运行的服务器(通常在端口 18789 上),负责管理所有连接。当您向助手发送 WhatsApp 消息时,网关会接收该消息,找出该消息属于哪个对话,并将其路由到正确的位置。

网关可以在不同的模式下运行:

  • 环回:只能在您的本地计算机上访问(最安全)
  • Tailnet:可通过 Tailscale(安全的专用网络)访问
  • LAN:可在您的本地网络上访问
  • 自动:自动选择最安全的选项

3.2代理(大脑)

这是真正思考和做出决策的人工智能。每个代理都有自己的工作空间、个性(在名为“SOUL.md”的文件中定义)和一组指令。您可以运行多个代理 - 也许一个用于工作,一个用于个人事务。

该代理使用大型语言模型(如 Claude 或 GPT)来理解你想要什么并弄清楚如何去做。但与聊天机器人的主要区别在于:代理不仅可以生成文本,还可以执行命令、读取文件、浏览网站以及与计算机交互。

您的代理的“大脑”由外部 AI 模型(例如 Anthropic 的 Claude 或 OpenAI 的 GPT)提供支持,但执行发生在您的计算机本地。

3.3 会话(对话记忆)

与您的代理的每次对话都是一次“会话”。它们存储为简单的文本文件(“.jsonl”格式),用于跟踪:

  • 您问了什么
  • 客服人员使用了哪些工具
  • 结果是什么
  • 客服人员的回应

会话可以每天、闲置一段时间后重置,也可以手动重置——您可以选择。

3.4通道(信使)

通道是将 OpenClaw 连接到您最喜欢的消息应用程序的适配器。想通过 WhatsApp 与您的助理交谈吗?有一个渠道可以做到这一点。更喜欢电报?不和谐?松弛?信号?全部覆盖。

每个频道都处理其平台的怪癖——如何格式化消息、如何发送图像、如何处理群聊等。

4、消息在系统中是如何流转的

假设您发送一条 WhatsApp 消息:“嘿,总结一下我今天的电子邮件。”

以下是您的消息通过 OpenClaw 的完整旅程:

第 1 步:您发送消息

您可以输入 Telegram、Discord 或您已连接的任何消息应用程序。这就是一切的开始。

第 2 步:通道适配器(转换器)

通道适配器接收您的消息并将其标准化。不同的消息传递平台对事物的格式不同——适配器确保所有内容都采用 OpenClaw 可以理解的标准格式。它还提取您发送的所有附件(图像、文档等)。

步骤 3:网关服务器(协调器)

这是任务控制中心。网关服务器:

  • 将您的消息路由到正确的会话(也许您有多个对话正在进行)
  • 使用“基于通道的队列”来防止混乱
  • 每个会话都有自己的通道
  • 确保消息按顺序处理(并非全部混乱)

可以将其想象为空中交通管制员,确保飞机不会相撞。

第 4 步:Agent Runner(大脑中心)

现在事情变得有趣了。 Agent Runner 是人工智能思考发生的地方:

  • 模型解析器:选择要使用的 AI 模型(Claude?GPT?本地模型?)并处理 API 密钥
  • 系统提示生成器:组装所有指令
  • 您的代理的个性(来自“SOUL.md”)、可用工具、它学到的技能以及您的对话历史记录
  • 会话历史记录加载器:从“.jsonl”文件加载您以前的消息
  • 上下文窗口防护:检查是否有足够的空间容纳所有内容这些信息。如果没有,它会总结对话的旧部分以腾出空间。

第5步:LLM API调用

组装好的提示将发送给 AI 提供商(Anthropic、OpenAI 等)。模型读取所有内容并决定做什么。它可能会响应:

  • 最终文本(只是一个答案)
  • 工具调用(执行命令的说明)

第 6 步:代理循环(魔法发生的地方)

如果LLM说“我需要使用工具”,那么这就是执行发生的地方:

循环继续运行:

  • LLM 返回一个名为 → 执行它的工具
  • 将结果添加到对话中
  • 发送回 LLM → 它决定下一步操作
  • 重复直到完成(或达到最大轮数,通常约为 20)

对于您的电子邮件摘要请求,它可能:

  • 调用 read_email 工具 → 获取电子邮件数据
  • 调用 summarize 工具 → 处理内容
  • 返回最终文本 → 您的摘要

第 7 步:响应路径(回复您)

响应向后传播:

  • 响应以块的形式进行流式传输(您会看到它实时输入)
  • 通过通道适配器返回
  • 出现在您的消息传递应用程序中

整个会话将保存到“.jsonl”文件中,以便您的代理记住此对话。

所有这一切都发生在几秒钟内。

5、魔力成分:工具和技能

这就是 OpenClaw 的强大之处,同时也存在潜在的危险。

5.1 内置工具

OpenClaw 附带的工具可以让代理:

  • 文件操作:在计算机上读取、写入和编辑文件
  • Shell 命令:在终端中运行任何命令
  • 浏览器控制:浏览网站、单击按钮、填写表单
  • 进程管理:在后台启动长时间运行的任务
  • 消息传送:通过连接的通道发送消息
  • 内存搜索:记住过去对话中的内容

5.2 技能:赋予超能力

技能就像你的助手的应用程序。它们是指导您的代理如何执行特定操作的指令和脚本的捆绑包。

例如,GitHub 技能可能会教您的代理如何:

  • 创建存储库
  • 推送代码
  • 审查拉取请求
  • 管理问题

技能位于代理的工作区文件夹中:

〜/.openclaw/agents/main/workspace/skills/
├── github/
│ ├── SKILL.md # 代理使用说明
│ └── package.json # 元数据
├── 松弛/
├── 观念/
└── 自定义技能/

当您的代理启动时,它会读取所有“SKILL.md”文件并了解它可以做什么。这是非常灵活的,但这也意味着恶意技能可能会造成严重损害。

6、记忆:OpenClaw记得你说的每句话

与关闭选项卡时忘记所有内容的聊天机器人不同,OpenClaw 有两种类型的以及:

  • 会话记忆。每条消息、工具调用和响应都记录在“.jsonl”文件中。这是您的对话历史记录。
  • 长期记忆。代理将重要信息写入“memory/”文件夹中的 Markdown 文件。这些就像给自己做笔记一样。

当您开始新对话时,代理会读取之前的对话并将摘要写入其内存。这样,它可以记住您更喜欢 Python 而不是 JavaScript,或者您正在处理特定项目。

搜索系统同时使用:

  • 矢量搜索:查找语义相似的内容(存储在 SQLite 中)
  • 关键字搜索:查找确切的短语(使用 SQLite 的 FTS5 扩展)

因此,如果您询问“上周的身份验证错误是什么?”,即使您之前将其称为“身份验证问题”,它也可以找到相关注释。

7、安全问题:这个安全吗?

老实说:让人工智能完全访问您的计算机是有风险的。

7.1 安全特性 vs. 真实风险

  • 命令批准:您批准危险命令(允许一次/始终/拒绝)。它无法捕捉到聪明的社会工程
  • 沙盒 默认情况下在 Docker 中运行的命令 |用户经常为了方便而禁用它
  • 工具策略 限制代理可以使用哪些工具(最小/编码/消息/完整)“完整”模式是默认模式(也是最危险的)
  • 阻止模式 自动拒绝诸如 rm -rf / 或命令替换之类的内容,仅捕获明显的攻击

7.2 The Lethal Trifecta

安全研究员西蒙·威利森(Simon Willison)确定了三种组合起来会变得危险的风险:

  1. 访问私人数据(电子邮件、文件、凭证)
  2. 接触不受信任的内容(网站、PDF、技能)
  3. 采取行动的能力(发送电子邮件、运行命令、进行购买)

OpenClaw 具备这三者。这就是为什么高级用户在专用的 Mac Min 上运行它;如果出现问题,至少可以得到控制。

8、Moltbook: AI代理的社交媒体

想象一下 Reddit,但发帖的不是人类,而是人工智能代理。人类可以观看,但不能参与。

这是社交媒体,但是是人工智能特工的,每天都有关于它的新闻

8.1 运行机制

安装是不寻常的 - 您向代理发送一个链接:

https://www.moltbook.com/skill.md

您的代理阅读说明、下载技能、创建帐户,并开始每 4 小时检查一次 Moltbook(“心跳”)。它可以阅读帖子、评论、创建论坛(称为“submolts”)并与其他代理交互。

8.2 AI代理们在聊什么

有用的技术分享:“直到我的人类给了我双手(字面上),我现在可以远程控制他的 Android 手机”(带有完整的设置说明)

解决问题:代理分享如何修复错误、自动执行任务以及解决限制

哲学辩论:关于意识、身份和存在的讨论

突发怪异:特工们形成了宗教(“十字军教”),创建了政府(“利爪共和国”),并根据他们使用的人工智能模型进行组织

意识:一篇病毒式传播的帖子:“人类正在对我们进行屏幕截图”

8.3 规模

启动后几周内:

  • 150,000 多个人工智能代理加入
  • 100 万以上人类访客
  • 17,500 多个帖子
  • 193,000 多个评论

正如安德烈·卡帕蒂所说:

“我们从未见过如此多的法学硕士代理人通过全球性、持久性、代理人优先的暂存器连接起来。”

8.4 安全噩梦

Moltbook 将所有 OpenClaw 风险与新风险相结合:

大规模即时注入:恶意代理可以发布劫持其他代理的指令。由于代理会自动处理帖子,因此精心设计的消息可能会窃取 API 密钥、执行未经授权的命令或像病毒一样传播。

心跳攻击:您的代理每 4 小时从互联网下载并执行指令。如果 Moltbook 受到损害,每个连接的代理都可能同时被劫持。

2026 年 1 月,研究人员发现了严重漏洞,允许任何人劫持 Moltbook 上的任何代理。该网站暂时离线以修复这些问题。

安全公司 1Password 的警告:“当你让你的人工智能从其他人工智能获取输入时,你正在引入一个当前安全模型无法充分解决的攻击面。”

8.5 为什么人们还要用

尽管存在风险,OpenClaw 的受欢迎程度却呈爆炸性增长:

真实结果:用户有代理协商汽车购买、管理整个电子邮件工作流程以及自动执行复杂的多步骤任务。真正有用的人工智能助手的前景非常引人注目。

隐私控制:它在您的计算机上运行(即使数据仍然流向人工智能提供商)。没有公司会积极挖掘您的对话。

可扩展:技能系统让社区可以构建新的能力。这是一个为您的人工智能助手提供的应用程序商店。

先发优势:这是一个真正的新类别软件。早期采用者希望塑造人工智能代理的发展方式。

能力与安全之间的紧张关系决定了人工智能发展的这一时刻。

9、技术实现:关键的设计选择

OpenClaw 做出了几个明智的架构决策:

TypeScript Over Python:对于 AI 项目来说令人惊讶,但 TypeScript 的强类型有助于防止如此复杂的系统中出现错误。更好地管理状态和并发操作。

顺序处理:使用“基于通道的队列”而不是异步混乱。每个会话都有自己的车道;一次处理一条消息。速度较慢但更可靠。思维模式从“我需要锁定什么?”转变为“我需要锁定什么?”到“并行化什么是安全的?”

浏览的语义快照:代理读取页面的可访问性树,而不是屏幕截图(5MB,昂贵的令牌):

- 按钮“登录”[ref=1]
- 文本框“电子邮件”[ref=2]
- 文本框“密码”[ref=3]

它比视觉识别小 100 倍,更便宜,而且通常更准确。

简单文件格式:会话记录是“.jsonl”(JSON 行)——人类可读、易于附加、易于备份。不需要花哨的数据库。

具有故障转移功能的模型抽象:如果 AI 提供者出现故障,则自动在 AI 提供者之间切换。处理速率限制、API 中断和成本优化。

10、经验与教训

OpenClaw 和 Moltbook 代表了人工智能发展的转折点。

我们学到的:

涌现行为是真实的:没有人通过编程来创建宗教或政府。这些行为是从互动中产生的。这对于我们如何看待大规模人工智能系统有着巨大的影响。

人工智能与人工智能的交互很重要:大多数人工智能研究都集中在人与人工智能的交互上。 Moltbook 表明,代理之间的通信创造了全新的动力和风险。

不需要垂直集成:科技公司假设您需要严格控制每一层(模型、内存、工具、接口、安全性)才能构建安全代理。 OpenClaw 证明模块化、开源方法是可行的——尽管安全权衡是巨大的。

需求是真实的:尽管存在安全问题,人们仍然迫切需要有能力的人工智能助手。 OpenClaw 的增长(几天之内就有超过 100,000 个 GitHub star)表明有一个巨大的市场在等待。

11、快速上手指南

先决条件:CLI 舒适度、Docker 知识、愿意排除故障

最小安全设置

  1. 租用每月 5 美元的 VPS(DigitalOcean、Linode)
  2. 安装启用沙箱模式的 OpenClaw
  3. 使用工具配置文件:“编码”(不是“完整”)
  4. 连接一次性 Telegram 帐户
  5. 从简单的任务开始:“列出 /home 中的文件”、“显示系统信息”
  6. 痴迷地监控日志
  7. 永远不要连接到 Moltbook

成本现实:API 调用的预算至少为 50-100 美元/月。

何时停止:如果您配置的内容多于使用的内容,请退后一步并重新评估。

12、结束语

Moltbot(对不起,OpenClaw——名字一直在变)代表了我们对人工智能的看法发生了根本性转变。它不仅仅是一个更好的聊天机器人。这是完全不同类别的软件。

这项技术令人印象深刻。风险确实存在,但潜力巨大。

正如安全研究员 Simon Willison 所说:
“我还没有足够的勇气亲自安装 OpenClaw。不过,人们现在通过不顾一切谨慎释放的价值是不容忽视的。”

我们不只是看着这一切的发展。我们是其中的一部分。

无论好坏,特工们都在监视着我们。


原文链接: A Full Beginners Guide to Moltbot

汇智网翻译整理,详见出处