GWS CLI+ Claude Code = 超能力
我过去几个月一直在构建我称之为代理工作空间的东西——如果你一直在关注,你会看到它层层叠加地增长。
首先,我从零散的 ChatGPT 对话转向了一个单一的 Claude Code 环境,我的整个通讯都在这里生活。写作指南、绩效数据、内容档案、社交媒体创作——全部在一个地方对一个 AI 代理开放。
然后我通过 MCP 连接了 NotebookLM,让 Claude 能够跨 50 个来源进行研究,而无需我切换标签页。接着是 Nano Banana,这样 Claude 就可以在同一对话中直接生成图像。为了快速研究会话,我向 Claude 注入了 Perplexity 和 Firecrawl MCP 来为我执行研究。
然后——如果你读了我上一篇文章——我将整个项目管理系统移到了 Obsidian,并将其连接到 Claude Code。目标、路线图、冲刺、周计划、日志——所有这些都是纯 Markdown 文件,Claude 直接读写。五个斜杠命令计划我的一周、准备我的早晨、处理我的收件箱、结束我的晚上并审查我的进度。一个副驾驶,不仅存储我的计划——它对我的计划有意见。
每一层都消除了一个差距。每一个集成都意味着我必须作为中间人的地方又少了一个。
但仍然存在一个差距。一个很大的差距。
我的项目、我的目标、我的写作、我的研究、我的图像生成——都在 Claude Code 内部。但我的电子邮件、我的日历、我的 Google 文档、我的 Google 幻灯片和表格——我实际与外界交流的地方——仍然被困在浏览器标签页中,迫使我手动在它们之间切换。
我是 Claude 和 Google Workspace 之间的人类桥梁。
然后 Google 静静发布了一些东西,填补了这一空白。
Google Workspace (GWS) CLI — 一个命令行工具,让您的终端直接访问 Gmail、日历、文档、云端硬盘、表格等。让我注意的是:Google 专门针对 AI 代理构建了它。
这不是聊天机器人插件。也不是 MCP (Model Context Protocol)。甚至不是浏览器扩展。它是一个终端工具。Claude Code 已经操作的精确表面。在您被术语 CLI(命令行界面)吓倒之前,请坚持下去,这就是 AI 代理将如何与我们每天使用的数百万软件工具交互(很快)。
时间再好不过了。因为大约在同一时间,Anthropic 发布了 Claude Code 的 /loop 命令——一种在活动会话内设置任何工作流以在重复间隔运行的方法。每 10 分钟。每 30 分钟。每小时。只要您的会话正在运行,Claude 就会继续执行。
两件事在同一时刻联系在一起:Google 让 Claude 访问了我的工作数据。Anthropic 让 Claude 能够在没有我触发每一步的情况下重复地对数据采取行动。
我花了几天时间连接所有内容,构建工作流,破坏它们,然后重建它们。以下是现在正常一天的样子。
上周二,我大约上午 9 点打开笔记本电脑并启动 Claude Code。到 9:15,我的晨间简报已经运行——一个在我的会话启动时触发的定时任务。34 封电子邮件分类为五个部分。两份通讯总结了我真正想读的关键要点。三封电子邮件标记为回复。我的日历已调出以显示当天的所有通话。
我在 10 点有一个客户电话。一个命令——Claude 拉取了与会者的电子邮件历史,找到了两个未解决的线程,在我的云端硬盘中搜索了他们上个月共享的文档,并编译了一份一页的会议准备材料,其中包含有关他们正在做什么以及我如何提供帮助的背景信息。在我喝完咖啡之前就准备好了。
通话结束后,我分享了录音。Claude 生成了摘要,提取了四个行动项目,并将它们直接路由到我的 Obsidian 保险库——链接到正确的冲刺,标记了截止日期。然后它起草了一封给所有与会者的后续电子邮件。我调整了一行并发送了。
那天下午,一位客户需要为其团队做演示。我将 Claude 指向我的战略文档并触发了 Google 幻灯片技能。结构、内容、格式——在不到 15 分钟内完成并保存到云端硬盘。没有幻灯片编辑器。没有拖动文本框。
下午 5 点,我处理了收件箱归零。47 封电子邮件分类,6 封草稿回复待审核,行动项目路由到 Obsidian,其余归档。十分钟而不是四十五分钟。
这是一天。从那以后的每一天看起来都差不多。
Obsidian 处理我正在努力实现的目标。Google Workspace 处理我关于它的沟通方式。Claude Code 位于中间:阅读两者,连接两者,运行两者。
什么是 CLI 以及为什么它对 AI 很重要
如果您一直在关注此通讯,您一直在使用 Claude Code,它本身就是一个 CLI。但让我为每个人清楚地解释这一点,因为这是理解为什么这次 Google 集成与其他一切都不同的关键。
CLI 代表命令行界面。您不是在浏览器中单击按钮,而是键入命令并获得结果。
这样想:Gmail 的网络界面是为您设计的。您点击进入一封电子邮件,阅读它,向下滚动,点击回复,键入您的回复,点击发送。每个动作都需要您的眼睛和鼠标。
CLI 是为软件设计的。它让您说“显示本周所有未读电子邮件”,并立即获得答案——无需点击、无需加载、无需滚动。一个命令,结构化数据返回。
AI 代理无法点击按钮。它们无法浏览浏览器。但它们可以运行命令。CLI 让您的代理直接访问您的数据,而无需尝试在浏览器窗口中模拟人类行为。
Andrej Karpathy 发推文 最近谈到了这一点。他使用 Polymarket CLI 构建了自己的仪表板,并指出每个公司都需要问:我们的产品是否让代理易于访问它?因为代理越来越多地为我们做工作。
Google 回答了这个问题。他们构建了一个 Workspace CLI——一个直接与其 API 对话的终端工具——并大声说出来:“为代理构建”。Claude 运行一个命令,Google 返回数据,Claude 对其采取行动。循环中没有浏览器。
原文链接: How Google Workspace CLI Made My Claude Code Setup 10x More Powerful
汇智网翻译整理,转载请标明出处