Vibe编程傻瓜指南
如果一个普通人(而不是LinkedIn上那些烦人的家伙)用上了Claude Code会怎样?
微信 ezpoda免费咨询:AI编程 | AI模型微调| AI私有化部署
AI模型价格对比 | AI工具导航 | ONNX模型库 | Tripo 3D | Meshy AI | ElevenLabs | KlingAI | ArtSpace | Phot.AI | InVideo
编者注:我不是什么超级开发者,我就是一个有工作有家庭的普通人。如果你想找多智能体系统的秘诀,或者怎么做编排之类的——这不是那篇博客。去看别的吧。还有,更重要的是,也许你应该去找个生活???
我的LinkedIn信息流里有很多人对AI构建*喋喋不休*。他们把它说成是"软件的终结"、"不再需要工人"、"一个人的十亿美元公司"。看看这条LinkedIn帖子:

三个网站???多花时间陪陪你的孩子好吗????
问题仍然存在——你真的能用vibe编程创造出有意义的东西吗?我(一个普通人)上周试了一下,构建了两个复杂度不同的东西:
- 低复杂度——一个我评价内容的个人版烂番茄(4年来超过500篇内容!)——一个我可以发给朋友的小型个人网站,当他们问我最近在看什么、推荐看什么的时候。
- 高复杂度——一个数字个人助手,可以A)在我有保险纠纷时联系我的保险提供商,B)帮我女儿报名参加她空手道的筹款活动。
这不是我要重建Salesforce,也不是要创造什么疯狂的"[你拥有的东西]的Uber"——只是普通人面对的普通使用场景。
事实证明,如果你愿意交出王国的钥匙,AI确实相当不错。
0、首先,让我们谈谈架构
当我们谈论用AI"构建东西"时,我们是什么意思?具体来说,我们讨论的是三个关键层级,以及它们在AI前后世界中的变化(至少我认为是这样的):

AI真正的优势在于它让执行和部署变得非常非常容易——但除非你在数据之下有一个"优秀的大脑",否则所有这些都无关紧要。这就是我们对LLM感到如此沮丧的原因——它们太通用了,在某些事情上没有出色的大脑(这没关系)——但它们奇怪的谄媚行为和语调会让你相信它比你实际认为的更正确。
1、实验1:构建内容评论站点
正如你可能之前在这个网站上读到的,我妻子和我每年看大约125-150篇内容,然后一丝不苟地打分。这些信息主要存在我手机的备忘录应用中。这是一个有趣的练习,但总有一堆人问我们"你们最近在看什么?"——此外,我们不得不翻几个应用来告诉别人我们认为什么好看。如果我们做一个能为我们解决这个问题的应用呢?
为了构建这个项目,我使用了Claude Code,并从以下提示词开始:

当我收到Claude的回复时,我立刻就知道情况不太妙:

Claude不知道Ari Aster和The Gay Hockey Show™,显然这些AI科学家什么都不懂!但我们还是把网站建出来了——你可以在这里看看。
以下是有效的部分:
- 当我说"我不知道自己在说什么,问我问题来澄清这个请求"时,效果最好
- 当它需要构建网站的前80%时效果很好——第一个版本6小时就完成了!
- 它在工具选择方面非常出色,帮我设置了一整套执行技术(所有我以前从未真正用过的工具):
- 执行:Vercel用于网站托管
- 部署:GitHub用于代码仓库,Supabase用于数据库
- 大脑:我们的内容评论,The Movie Database(TMDB API)用于电影海报和标签
以下是无效的部分:
- 我必须创建一个管理员面板,用自己的能力来更新元数据,因为它非常不擅长理解你是说Working Moms(Netflix上的一部热门加拿大喜剧)还是Quiet! Mom's Working!(一部被宣传为"来自Cobra Kai音效师的古怪杀手功夫家庭喜剧"的短片)。
- 它会直接忘记一些功能,如果你现在去那个网站,我有上下箭头但不能用——它们只是装饰性的,但在我的要求中,我确实要求了可用的按钮,只是没有明确告诉Claude它们需要报告到哪里。
- 它仍然极其谄媚,看看这些:








这些都是在六小时内对我说的——我的天,给自己留点自尊吧!
总的来说,我花了6个小时构建了网站的第一个版本,但到最后,我投入了大量时间让这个项目运转起来——最终需要手动更新许多条目,并在管理后台折腾了几个小时来理解未来的工作流程。
这是我对vibe编程的两个要点:
- 它实际上是给有一些编码和开发专业知识的人用的——它并不像LinkedIn帖子让它看起来那样即插即用。你可能需要了解生产环境、推送代码和部署——如果你只是大概知道这些,我觉得这比看起来要难。
- 它奇怪地上瘾?——现在我明白为什么这些人对这些工具喋喋不休了——当你从零开始构建的东西能工作时,真的是很有趣的!这样的网站本质上是无尽的项目(如果我建一个LLM来帮我选择新节目看呢?如果我在网站上开个博客呢?)——如果你有时间,为什么不呢?(编者注:在未来几个月留意更多文章,不仅ChatGPT在毁掉关系,Claude Code也是)
2、实验2:我能构建一个个人助手吗?
这是我提示词的一部分(在描述了工作和个人两个"大脑"之后):

这是我最终确定的架构:
- 执行:Claude Bot Chrome扩展程序 + Chrome浏览器(这个还在Beta阶段,所以甚至还没有真正构建完成?)
- 部署:Claude
- 大脑:Google文档,包括但不限于:
- 一个理解我写作方式的语音大脑
- 一个个人信息库,可以提取关于我和我家庭的基本信息
- 一个商业信息库,可以提取关于我工作的基本信息
- 我的笔记工具——Obsidian
这个项目比第一个复杂得多!因为大脑需要更复杂的数据——我的声音是什么样的?什么是相关信息?我应该如何组织我的笔记?
一个真正的(读作:人类)个人助理会随着时间推移搞清楚这些——他们知道你是谁,什么对你重要,然后去执行。而现在,我基本上需要构建一份代表我生活的完整文档作为Claude的仓库,然后它需要查看所有这些信息并创建一个提示词,然后我才能把那个提示词写入Claude Bot扩展——然后它可以控制我的浏览器并采取行动。这绝对不优雅,但它是复杂AI系统如何工作的一个愿景——工具协同工作来完成一个行动。
如果这一切看起来很复杂——确实!事实证明Claude有一些关键的短板:
- 缺乏本地记忆——Claude Cowork、Claude Bot for Chrome、Claude Web、Claude Code彼此之间都不通信??这对我来说简直疯狂??所以我一直在寻找我之前在哪里聊过天
- 没有自己控制浏览器的能力,所以它可以很聪明但实际上什么也做不了(后面会详细说)
- 没有能力将多个Google账号绑定在一起——除非你想开一个Google Workspace然后通过第三方工具访问它——如果你生活中做两件或更多事情的话,这很烦人(如果你22岁、在斯坦福上学、进了YC,估计就没这个问题)。
3、两个使用案例的故事
第一个使用案例是我的一个处方药涨价了900%(!!),我想弄清楚我的保险怎么回事。我尝试用他们的聊天机器人(没用!我的保费去哪了?)。我不想打一个没完没了的电话。我给Claude提供了以下信息:我的医疗保健提供商、我的计划信息、我的团体号、我的个人号、索赔日期、之前的价格和新价格。它写了邮件,但在弄清楚如何提交信息时卡住了。失败 2/10
第二个任务是我需要为女儿空手道中心的KICKATHON设置一个筹款页面。像每个好爸爸一样,我很确定我妻子给我发了关于这个的邮件,但我太累了不想找。我想——这对AI来说应该够简单了吧,找到邮件然后执行任务。我只需要提供:我女儿的名字、她的出生日期和空手道馆的名字。
这就是魔法发生的地方——Claude Bot搜索了邮件,什么也没找到——然后偶然发现了我妻子发给我的一封关于注册空手道课程的邮件,里面有用户名和密码(抱歉,我们在密码方面可能不太安全!)。Claude用密码和信息登录了空手道网站,阅读了网站,找到了KICKATHON的页面。成功 8/10!
这才是真正的问题解决!这才是我们对人类的要求!只是它偷了几个小小的密码才做到的……
4、接下来会发生什么
如果你最近几周在网上花了一些时间,我确信你一定看到了关于AI及其能力的"终结的开始"之类的末日预言,如果你错过了,这里是一些摘录:



我和Claude相处的这一周告诉我,配备这些工具的优秀开发者可能在AI方面看到了远超地平线的东西。但我们所有人心中最大的问题是:我们如何安全地构建上下文?AI真正的解锁(以及软件的终结)不是前端更多的工具——而是更安全地访问密码、社会安全号码、出生日期之类的东西。当我们创建了支持AI大脑的系统时,我们才能真正看到这些工具能做什么。
归根结底,那些正在构建复杂工具并自动化自己生活的人——可能正在向这些工具交出太多数据。
最后,你在寻找自己的项目或不知道从哪里开始?构建一些只有你自己知道的傻东西。如果你拥有大脑,引导代码就容易得多。这里有几个我这周看到的我最喜欢的例子:
这个印度自助餐优化器:

这个NFL总经理模拟器(你没法让猎鹰变好,所以你知道它是真的有效的!):

世界上有一些只有你最了解的东西——去构建它,只是暂时不要给它你的密码。
原文链接: The Idiot's Guide to Vibe Coding
汇智网翻译整理,转载请标明出处