编码代理的未来

我已经预测 IDE,以其当前形式,是注定失败的。

编码代理的未来

发布文章必须覆盖大量内容。幸运的是我们现在可以放松了。Gas Town 活着,如果仅仅是的话。我创建了一些刚刚足够聪明的东西。Gas Town 今天工作得相当不错。超快,非常有趣,非常强大,绝对粗糙。但随着今年四种展开情况的出现,它将通过工具化和模型智能变得能力更强。

在这篇文章中,我将分享一些 Gas Town 的背景故事,这些我在 1 月 1 日的文章中不得不省略的。然后我将分享一些关于我认为将会发生在 IDE、大公司和编码代理本身的预测。我还计划做一系列关于我如何使用 Gas Town 做真实工作的文章和视频。

Gas Town 看起来令人印象深刻。而且它才刚刚开始。

None

图:Gas Town 教室外有抗议者

1、Gas Town 的免费升级

首先,让我们谈谈 Gas Town 如何仅仅通过启动它就会变得更聪明。Gas Town 现在有点像沼泽怪物;它嗡嗡作响而不是呼呼作响。它确实行得通,并且快得惊人。没有什么比向巨大的 epic 或错误积压投掷 Claude Code Opus 4.5 实例蜂群更壮观的了吧,吧嗷!但是,它也需要大量的手动引导和更正,你有时不得不推动它来完成。

但那个初始不稳定将随着 2026 年的进程而消退。Gas Town 将从一个自推进的粘液怪物转变为一个闪亮的、运行良好的代理工厂。所有这些都不用我再做一件该死的事情来改善它了(尽管我仍然会!)

首先,模型会变得更聪明。我知道你们许多人认为它们已经达到了平台。我知道你们许多人正在围绕"如果模型从未变得任何更聪明会怎样"这个想法构建工具。但是模型确实在变聪明,并且在编码(以及其他所有事情)方面变得更好。我用 Gas Town 设定很高。今天是很多,但它应该在年中自然地扮演它们的角色,如果不是更早的话。

其次,Gas Town 和 Beads 终于将使其进入训练语料库Beads的惊人特征之一是代理自然且流畅地使用它而无需训练。Gas Town 也 —— 仍然有点颠簸,因为 Beads 成熟两个月。但 Gas Town 也会达到。快。

我一直使用期望路径方法来策划 Gas Town,就像我策划 Beads 那样。你告诉代理你想要什么,仔细观察它们尝试什么,然后使事情成真。一遍又一遍。直到你的工具以代理认为应该工作的方式工作。所以 Gas Town 正在逐渐变得对代理友好,即使没有在训练语料库中。

但是现在人们正在使用它?嘘。代理将在夏天之前知道所有关于 Gas Town。

第三,编码代理商店将会醒来,意识到他们在我构建了一个工厂(并且世界很快将构建更多工厂)时,我已经构建了工人,2026 年代理将竞争于它们支持工厂工人的程度。Gas Town 目前在代理之上有一个糟糕的、用胶带粘接的 API,提供的平台钩子几乎不存在。开始支持所有必要自动化钩子以开始将它们心爱的宠物转化为牛群的编码代理商店,将是将在 2026 年获胜的代理。

第四,也是至少的,Gas Town 社区已经变得疯狂了。我已经有超过 50 个 PR,以及问题报告和功能请求的双倍。而且只是周末;大多数人甚至还没有从假期回来并且看到 Gas Town。尽管我有不使用它的可怕警告,但 Gas Town 正在快速增长,比 Beads 快 10 倍。即使模型没有变得更聪明,但 Gas Town 仍然会在社区的推动下到达。

你们中的那些理解愿景并立即采取行动的人 —— 我感激你。对于所有发送 PR、GHIs 并尝试帮助的贡献者,我如此感激你的帮助。

Gas Town 的贡献者将帮助使这成为现实。我刚刚描绘了一个足够完整和连贯的愿景,具有可靠的初始实现,人们已经加入并帮助我填补细节。

好的,关于我们如何到达这里的一点故事,然后我们将进行预测。如果你不感兴趣,可以随意跳过或略读背景故事。

2、Gas Town 是编排器 #4

8 月,我开始开发一个名为 vibecoder 的编排器。它是用 TypeScript 编写的,所有都是氛围编码。这是一个使用(在那个时候)Amp 自动化我自己工作流的严肃尝试,Amp 一直是一个豪华劳斯莱斯的编码代理。Amp 有很棒的人体工程学。但重要的是,它还有广告 —— 这意味着,Amp 可能只是今天使用 Gas Town 的最实惠的方式。我发现自己运行 5-10 个 Amp 实例,并试图弄清楚如何让它们帮助我完成工作。

我的 v1 尝试,Vibecoder,构建在 Temporal 之上,Temporal 是工作流编排的黄金标准。它证明对我的需求来说很麻烦。我正在编排的工作流变成了微工作流,因为你必须为 LLM 严重分解任务才能可靠地遵循它们。

不幸的是,那让我失去了一些可扩展性:Gas Town 在其 K8s 形状上并不是超级可垂直扩展。一个城镇是关于机器大小的。Gas Town 通过拥有很多城镇来扩展,就像 Git 通过拥有很多仓库来扩展一样,这实际上将可扩展性问题推给用户。因为这个原因,我仍然相信 Temporal 将是将 AI 工作流扩展到企业规模的关键拼图。模型喜欢将认知卸载到强大的工具,而 Temporal 就像工作流编排器一样强大:Bagger 288。但这种力量正是我为我的开发工具远离它的原因:我觉得它需要一个"精简"版本。

我的 vibecoder 的 v2 版本被称为 vc。你可以看到旧的仓库;它应该是私有的,但在某个时候我认为 vc 本身让仓库公开了。它是用 Go 编写的。结果变得过度单一,不是 Go 的原因,而是因为我在试图解决错误的问题。有了 vibecodervc,我试图让代理变得更好。有了 Gas Town,我只是试图让更多的代理。Gas Town 拥有其他两个的所有功能,且代码只有一小部分,这告诉我我终于搞对了。

我的 v3 编排器于 11 月 23 日开始。到那时我已经离开了 Sourcegraph(难忘的三年,很棒的公司,很多乐趣),我现在正在开发一套旨在帮助我处理蜂群工作的 Python 脚本。我已经放弃了质量并切换了我的关注点到数量。我开始把我所有即兴命名的代理(只是随机目录和仓库克隆)放在单个树下,并试图用 git worktree. 组织它们。我称之为 Gas Town,以 Mad Max 命名,因为起初它是一个荒谬的混乱环境,感觉就像每个人都在努力完成自己的工作。我现在称第一个版本为 PGT,或 Python Gas Town。

Gas Town 热切地采用了 Jeffrey Emanuel 的 MCP Agent Mail 作者的发现。他发现将邮件与 Beads 结合导致了一个即兴的"代理村",代理将自然地协作分割工作并批量完成它。编码代理是类似邮件接口的专业人士,你可以使用邮件作为"代理村"消息传递系统而无需训练或提示它们。它们只是得到它。Gas Town 是我试图将即兴代理村转变为协调的代理镇的尝试。

Python Gas Town 迅速增长,在一周内变得可操作,并带我几周。它演化了除执事和狗之外的大多数角色。精炼厂是全新的且未测试。Python Gas Town 所做的主要是提供生成命名和临时工人的方法。所有这些都使用原始的 Beads 和 epics。但关于它的某些感觉是对的

12 月的最后两周,在我去悉尼/墨尔本访问 CBA 之后,是一个充满创新时期,我其中产生了 90% 的 Gas Town 设计。我在研讨会上向所有人承诺,我将在圣诞节日或最晚 1 月 1 日启动它(Python Gas Town!)。没有意识到,一旦我回到家,我将立即开始用 Go 重新设计和重写整个东西。这实际上是我重写整个东西之前放弃的鼓励。

转场到 Go 实际上鼓励我尝试不同的东西。我会告诉 Claude,"就是了,这是我们最后一次机会解决这个或那个恼人的问题",而我全力以赴于 Gas Town 的修订架构。我不得不将所有东西重新做 3 或 4 次 (再次,在 PGT 中经过 3-4 次重新设计后),因为代理仍然在猜测错误的目录结构和角色。但最终我实现了起飞。到 12 月 29 日,我的交出循环正在工作,seance 工作正常,臭鼬和蜂群和车队正在工作,船员和 tmux 绑定正在工作,我可以简单地通过向它甩工作来改进 Gas Town。是时候启动了!

3、为什么是 Golang?

我的四个编排器是用 TypeScript、Go、Python,然后 Go 编写的。为了记录,我主要是 Java/Kotlin 背景的人,我最好的脚本语言可能是 Ruby。而且我通常很高兴用任何 Lisp 方言手工编码。

但我真的很喜欢用于氛围编码项目的 Go。我去年可能写了接近一百万行代码,与我迄今为止 40 年职业生涯的整个作品量相媲美。我从 17 岁开始编写代码,我估计在过去 40 年中,我手写了大约 110 万行已发布的生产代码。但尽管我努力保持 Beads 和 Gas Town 小,它们加在一起已经推送了接近五十万行代码。包括贡献者的贡献

在我氛围编码那些百万行代码的过程中,我学到了很多关于 AI 处理得好和不好的东西。我发现的是,模型在 TypeScript 上浪费了大量令牌。这就像……对它们来说语言太多了。它们在 TS 中创建的每一份差异中,很容易就有三分之一要么是复杂的类型操作,要么是复杂的变通方法以避免必须在事物上放置适当的类型。每一个"编写代码"步骤都必须跟着 2-3"让我们让它不那么糟糕"的步骤,这些步骤在其他语言中不存在,以强制它干净地解决其糟糕的类型建模。我发现这是令牌的巨大浪费,并且最终结果仍然总是巨大的代码堆。对于一个超级表达语言来说,这当然很冗长!

Python 是"好的"。它并不糟糕。当我工作时,它会热重载我的更改,这很好。而对于 Go,每次你进行更改时,每个代理都必须在本地重新安装和重新设计二进制文件,并且它们倾向于忘记。PGT 的代码差异易于扫描和理解。代理不浪费时间在类型建模上。我认为对于服务器端的东西,Python 可能会很棒。但对于客户端部署,它仍然总是感觉像一堆脚本。我喜欢 Beads 构建和分发原生 Go 二进制文件的能力,所以我选择 Go Gas Town 的方案。

当然,我发现我的第二个主要 Go 项目是 Go 只是……很好。多语言者一直对 Go 有点鼻塞,因为它"无聊",但我现在认为这是 AI 编码空间的一个进化优势。当差异用 TypeScript 通过时,很多时候你会想,我的计算机现在在做什么?该死的东西。但有了 Go,它只是无聊。它只是编写日志文件,做简单的循环,做简单的条件,从映射和数组中读取,只是超级平淡的香草东西。这意味着你总是可以理解它!作为一位学习和使用过 50 多种编程语言的人,总是寻找优雅和紧凑性 —— 令我惊讶的是,Go 是氛围编码系统程序员的真正福音。

TypeScript 对于 Web 应用仍然是最好的吗?是的,可能是。我只是很高兴我不必构建一个。

4、编码代理的未来

我已经预测 IDE,以其当前形式,是注定失败的。如果你还在使用一个,你需要让你的装备准备好并在你在公开市场上获得等效的严重体味之前开始使用编码代理。

每个人似乎都认为编码代理的未来是……编码代理。我将重述我的朋友 Brendan Hopper 关于它们的说法,即当需要完成工作时,自然更喜欢殖民地。自然界构建蚂蚁殖民地,Brendan 说,而 Claude Code 是"世界上最大的该死蚂蚁"。它会一半咬你并拿走你所有的资源。每个人都专注于让它们的蚂蚁运行更长时间、表现更好、做更大的事情。让它们成为超级工作者。超级蚂蚁。这就像我在 1970 年代作为孩子观看的所有黑白 1950 年代恐怖电影一样。

而蚂蚁殖民地将会真正踢屁股。大蚂蚁,没错?我一点也不介意编码代理变得更好。我欣赏它,并且事实上,我指望它。Gas Town 真的需要另外一次或两次模型升级才能全速运转。我看到当 Opus 4.5 出来时它明显地改善了。我已经有了 Python Gas Town,它是一个挣扎,但 Opus 4.5 让它在一夜之间变得超级顺畅。所以我知道它只是会随着蚂蚁变大而变得越来越顺畅。

但殖民地将会获胜。工厂将会获胜。自动化将会获胜。当然它们该死的将会赢。任何认为否则的人,嗯,不是历史的忠实粉丝,我猜。

所以我这里的预测是,编码代理很快将把重心转移到成为更好的殖民地工人。它们需要对新兴的"编排器 API Surface"有直接、内置支持,这是一个或多个交互点,我不得不在那里创建一些该死的黑客攻击,因为代理几乎没有平台 API。为什么?因为 30 多个编码代理供应商中没有一个考虑他们心爱的婴儿编码代理作为殖民地工人。他们将其视为人类配对程序员。Gas Town 将在 2026 年的过程中改变这一点。重心将转移到协调代理。

我不是说我们放弃人类/代理循环 —— 我们需要继续改进它。但真正的进步来自殖民地。获得它并拥抱它的代理将会获胜。

5、大公司的未来

我认为大公司将会被搞砸。真的搞砸了。形式因素开始变得错误。人太多了,完成的工作太少。你有没有注意到 LinkedIn 上每个该死的人都是 CEO 或联合创始人吗?整个世界将会爆炸成小公司,这些公司将聚合并重新形成更大的公司……但直到我们经历至少一年的动荡,小店 dramatically 超越大,以至于我们在整个历史上从未见过的程度。

None

图:小店铺直接与较大的店铺竞争

这是一个给你的案例研究。有一天我和几位前 Amazon 好友午餐,其中我 20 年没见过 —— Ryan Snodgrass 和 Ajit Banerjee,他们正在一起在 devops/自动化领域做一家初创公司。他们是 Beads 的大粉丝,想一起吃午餐并聊聊它。我们在 Kirkland 的 Cactus 吃饭,食物总是很棒。而且我们聊得该死痛快!谢谢你们的午餐,家伙!

这些人处于我在 Gas Town 发布文章中展示的开发者进化图表的第 8 级。他们正在尽可能努力地推动编码代理,就像地球上的任何人一样。他们正在观察一些我没有看到的现象。这是因为他们正在做我没有做的事情:他们作为一个团队工作,而我所有的编排氛围编码都是独自完成的。

他们告诉我……所有这些都还在我脑海中嗡嗡作响。他们都在使用代理进行氛围编码(Claude Code 可能还有其他几个),而且他们都严重依赖 Beads,Beads 是一个工作流加速器。实际上你的代理编码工作流是什么并不重要:Beads 都会加速它。他们都拥有无限的令牌;Ryan 每年大约烧 6 万美元或左右,但正快速地将其推进到开发薪资领域。所以他们一直能够获得你可以用编码代理获得的最大速度。

他们的故事飞过,但主题是一样的:他们进展太快,其他队友跟不上。他们在慕尼黑有一个贡献者,他在 PST(我们的时区)工作,他会说,"我做了 X!"他们会生气并说,"你为什么做 X,你从哪里得到那个信息的?"他会说,"2 小时前!?这太古老了!"可能已经 2 周了。

Ajit 和 Ryan 速度快,以至于这些新规则正在涌现,比如,你必须 100% 透明并宣布你做的一切,否则你同样可能在一英里外的密封混凝土室中工作。东西移动得太快了。

你如何将其扩展到大公司?天哪,当 Ajit & Ryan 用 Gas Town 完全启动时,他们将会是今天生产力的许多倍。他们不需要将其扩展到大公司。该死,他们不能将其扩展到大公司。至少,目前没有人知道如何做。

Gene Kim 和我到处都看到这一点;我们与一家大公司交谈过,这家大公司因为合并问题而变得如此严重,以至于他们决定解决方案是"每个仓库一个工程师"(!)。他们基本上放弃了,并将地板拱手让给原始的单开发者速度。

这很疯狂,对吧?而像 Gas Town 这样的编码农场只会加速和加剧这个问题。独角兽?他们将会全都是独角兽,很快。以这个速度,如果一家 100 人的初创公司能够在 2027 年赚取十亿美元,我会印象深刻。真的印象深刻。随着这么多人同时做 AI 工作,他们将如何沟通?我迫不及待地想找出。

我相信我们最终会解决所有这些问题,但就目前而言,我们正处于一场将像龙卷风一样穿过行业的巨大转变的开端,像翻房子一样翻转公司。

好的,我们完成了背景故事,我们完成了预测。让我们着陆飞机。

6、喜欢并订阅

哈!只是开玩笑,我在启动文章中已经告诉过你们好几次都滚蛋了,所以如果你还在这里,你绝对是疯狂者之一,欢迎登船!

此外,我甚至不认为 Medium 有那种喜欢/订阅的东西。他们有吗?

我有大量的 Gas Town 内容即将到来。Gas Town 是大品牌。我将制作向你展示我如何使用 Gas Town 做真实工作的视频。我将发布技巧和窍门。我将分享其他人对 Gas Town 做的事情。我将展示正在努力成为兼容 Gas Town 殖民地工人的代理。而 Gene Kim 和我将在整个 2026 年继续举办实践研讨会,对于那些想要优质教育体验以在这个勇敢的新世界中快速启动企业开发人员的人来说。

记住,你可能还只是不太适合 Gas Town。我将从发布文章重申"程序员进化,2024-2026",因为它已经在巡回并引发了大量讨论。

None

图2:程序员进化,2024-2026

文章展示了从 0 级到 7 级的开发人员光谱,对代理的信任逐渐从零增加,直到它接管你的 IDE,溢出到 CLI,然后从那里成倍增长。

你需要处于至少第 6 级,并拥有大约达到第 7 级所需的一半 XP,然后你才会欣赏 Gas Town。如果你已经非常熟练地进行了多代理代理编码,在 IDE 之外,那么我认为你会立即发现 Gas Town 是一股新鲜空气。你将比你以前更快,具有你已经学会要求和期望的完全相同质量输出,无论你是使用"裸"的 Claude Code 还是临兴编排器。

第 7 级以上的用户已经报告 Gas Town 很有趣。确实如此!一旦它为你开始运转,并且开始一天又一天地犁过巨大的经过重度审查、经过重度测试的工作堆,你会意识到,哇。就是这样。没有回头。我们已经到达了工厂化编码。而且它该死的有趣。

我准备好写我接下来两篇关于 Gas Town 的文章了,让我们结束这一篇!我会在其中抛出一些原始内容来让你订阅。AI 没有写这个。试图让 AI 写这样的东西就像让老人对着音乐拍手。

你的原始内容:关于 Gas Town 的歌曲开头。

(为了调整一下,嗯……你知道。)

LeFou天哪,Gas Town,看起来如此努力地做你的工作这里的每个人都想使用你,Gas Town,你正在让我们的编码者之心跳动 今天没有可用的编排 我们整晚都在与 Claude Code 搏斗 Gas Town 你向我们展示了游戏的代价 没有人在月底时像 Gas Town 那样的云端账单! 因为没有系统一半是自主的 它有 Beads,所以它继续进行 你可以询问任何尝试过我们的编码器 他们都会告诉你他们的积蓄没了!* 没有人像 Gas Town 那样编码 上下文加载像 Gas Town 没有人像 Gas Town 那样让人类置身于寒冷之中! (口语)"我特别擅长编排!"我的,真是个装备啊,Gas Town!*

None

7、常见问题

人们已经问了一些关于 Gas Town 的有趣问题。

问: 我们是否进入了付费游玩时代,车库黑客变得无关紧要?

答: 这是一个可以理解的问题。Gas Town 是代码工业化工厂化耕作的开始,这感觉像是付费游玩。今天它很昂贵,随着模型的改进,它将变得更加昂贵,以便在前沿推动它。然而,我认为车库氛围编码将在 2026 年夏季左右开始活跃并良好。开源模型在前沿模型之后大约落后 7 个月,所以到夏天,开源模型将与 10 月份的农作物一样好,"足以应付大多数初创类型的工程工作。如果你有 GPU 或两个,你可以整夜免费地运行它们。

问: Gas Town 是否使氛围编码过时?

答: 哈!它不会。Gas Town 以另一种方式运行,并且完全拥抱氛围编码。人们仍然不明白我们石器时代以来一直在氛围编码。编程一直是一个尽力而为、我们稍后会修复屎烂事情的尝试。我们总是带着错误发布。重要的是你的测试有多好?你的验证套件有多好?它是否满足客户的需求?这就是一切重要的。今天并没有任何不同于工程曾经是如何的地方。从公司的角度来看,历史上,工程一直是一个黑盒。你要求他们做东西;它最终会到达,损坏,然后你逐渐一起工作来修复它。现在 AI 是那个黑盒。


原文链接: The Future of Coding Agents

汇智网翻译整理,转载请标明出处