AI token 税:穷人 vs. 富人

为什么开源权重模型可能是没人谈论的逃生通道。

AI token 税:穷人 vs. 富人
AI模型价格对比 | AI工具导航 | ONNX模型库 | Vibe Coding教程 | Tripo 3D | Meshy AI | ElevenLabs | KlingAI | ArtSpace | Phot.AI | InVideo

读到 AI 如何取代开发者、配备高级工具的高级开发者如何完成整个团队的工作、公司如何大规模裁员。然后我自己作为一个学生,使用基础套餐开始使用这些工具。让我告诉你,体验与营销页面承诺的完全不同。

这整个体系比任何人承认的都要糟糕得多。

1、20 美元的谎言

None

让我们从最令人沮丧的部分开始。你注册了 Claude Pro。每月 20 美元。不错,还算负担得起。你开始编码,一切顺利,Claude 确实很有帮助,你进入了状态,正在调试一个复杂的问题,然后……"你已达到使用限制。"

就这样。你完了。不是暂停一小时。不是休息一会儿。你被锁定了大约 5 小时,直到会话窗口重置。好吧,你等了。你回来,重新开始工作,一两个小时后又撞墙了。而真正要命的部分在这里:即使你小心翼翼地管理你的 5 小时窗口,上面还有一个每周限制。所以到了一周的第三或第四天,你已经耗尽了整个每周配额。这一周的剩余时间呢?你就坐在那里。无法使用你付了钱的工具。重置要等到周末或你的周期到期时,然后整个痛苦的循环又开始了。

想象一下你正在做一些真正重要的事情。一个有截止日期的项目。一份求职用的作品集。如果你是自由职业者,一份客户交付物。你一周才过了三天,Claude 就说不行,你晚点再来。你到底该怎么办?盯着屏幕看?切换到更差的工具?回到 2022 年那样手写一切?

这也不是假设。早在 2026 年 3 月,情况就变得真正疯狂了。Claude Code 每月 200 美元的 Max 计划的用户——那是最高级别——眼睁睁看着他们的 5 小时会话在 19 分钟内耗尽。不是打字错误。十九分钟。Reddit 上一个关于这个问题的帖子在一天内收到了 330 多条评论。一位 Pro 订阅用户说,一个月 30 天里,他们实际上只能使用 Claude 大约 12 天。其余时间都被锁定了。

社区成员实际上逆向工程了 Claude Code 的二进制文件,发现了缓存 bug,这些 bug 在幕后将 token 成本膨胀了 10 到 20 倍。所以人们在看不见的开销上耗尽了配额,而不是在实际工作上。Anthropic 承认了这个问题并称之为他们的首要任务。但如果你是一个因为每月 200 美元的工具在周二停止工作而错过截止日期的开发者,那个承认并不能真正帮到你。

更深层的问题是什么?Anthropic 确实存在算力短缺。需求的增长速度远远超过他们建设 GPU 基础设施的速度。新数据中心需要 18 到 24 个月才能上线。所以即使他们筹集了数十亿资金,产能也要一年多才能出现。他们选择用更严格的速率限制来应对这个缺口,而不是提供更慢或更笨的响应。可以说这是最不坏的选项。但从用户的角度看,你在为一个会在任务中途随机罢工的工具付费。这就是现实。

2、当这和就业市场联系起来时,情况变得很糟糕

这就是一切都以一种非常令人不安的方式开始吻合的地方。

公司在过去两年里一直在裁员。用 AI 工具取代初级开发者。一项调查中引用的一位招聘经理说,他们将每个工程团队的初级开发者招聘人数从 15 到 20 人减少到两到三人。斯坦福大学的一项研究发现,22 到 25 岁开发者的就业率从 2022 年的峰值下降了近 20%。Salesforce 的 CEO 明确表示他们不会招聘新工程师。Anthropic 自己的 CEO 预测 AI 可能消除 50% 的入门级工作。

逻辑很简单。一个配备了 Claude Code Max 或 Cursor Ultra 的高级开发者可以产出过去需要一个高级加两个初级开发者才能完成的工作。为什么付三份薪水,而你可以付一份薪水加上每月 200 美元的 AI 工具费用?这数学看起来很明显。

但现在同样的公司开始意识到他们有一个问题。他们解雇了所有初级开发者。他们停止了实习输送管道。现在他们环顾四周在想,等等,我们未来的高级开发者应该从哪里来?你不能凭空制造一个高级工程师。他们需要在真实的代码库上工作数年、犯错误、向有经验的人学习。如果你从不招聘初级开发者,你就永远不会有高级开发者。那条管道现在已经断了,修复它需要数年时间。

所以公司处在一个奇怪的循环中:因为 AI 使其成为可能而裁员,然后发现 AI 工具不可靠且昂贵,现在其中一些公司开始悄悄重新招聘。但是那些被裁掉或从一开始就没被雇佣的初级开发者已经转向了其他职业。或者他们失去了信心。或者他们无法竞争,因为他们没有获得那些能让他们足够高效以证明自己薪水合理的高级 AI 工具。

这就是两级劳动力问题。不仅仅是高级与初级之分。而是谁能获得每月 100 到 200 美元的 AI 工具,谁被困在到午饭时间就耗尽的免费套餐中。

3、成本螺旋是真实的

让我们谈谈实际数字,因为定价情况确实很疯狂。

大多数 AI 编程工具的营销价格是每月 10 到 20 美元。实际价格——当你真正使用这些工具做正经工作时花的钱——根据 2026 年 5 月的企业数据,是每月 200 到 600 美元。

Cursor 的最高级别是每月 200 美元的 Ultra。Claude 最高到每月 200 美元的 Max 20x。如果你使用带自己 API 密钥的开源终端代理如 Aider 或 Cline 呢?一次使用 Claude Opus 的密集编码会话每次运行可能消耗 2 到 5 美元。每天五次会话,二十个工作日,仅 API 成本就是每月 200 到 500 美元。比最贵的订阅还贵。

大多数开发者甚至不只用一个工具。他们堆叠三四个。Cursor 用于 IDE,Claude 用于代理终端工作,Copilot 用于自动补全,ChatGPT 用于快速提问。每一个单独来看都"只是"10 到 20 美元,但堆叠起来在没有任何超额费用之前就是每月 70 美元。一位开发者写了一篇 Medium 文章,讲述他取消了 ChatGPT、Claude Pro 和 Copilot,用一个每月 8 美元的方案替代了所有,因为大部分使用场景本来就有重叠。

而更关键的是:一项研究分析发现,AI 编程代理会话中消耗的 70% 的 token 是浪费。不是开销。不是必要的处理。是浪费。代理读取了太多文件,探索了不相关的代码路径,重复了已经做过的搜索。代码生成本身反而是便宜的部分。围绕它的一切——导航、搜索、上下文构建——才是你的钱花去的地方。

所以你在为一个浪费你购买算力 70% 的工具付高级价格,它会撞上任意的速率限制,有时甚至连续几天完全停止工作。如果你负担不起高级版本,你得到的体验更糟。

4、中国刚刚改变了游戏规则

好的,这是我研究这个话题时真正兴奋的地方,因为可能真的有一条出路。

2026 年 4 月下旬,四家中国 AI 实验室在 12 天内发布了开源权重的编码模型。DeepSeek 发布了 V4。Moonshot 推出了 Kimi K2.6。Z.ai 发布了 GLM-5.1。MiniMax 推出了 M2.7。它们全部针对代理工程——也就是在西方平台上如此昂贵的多步骤自主编码。而且它们全部确实与前沿模型具有竞争力。

DeepSeek V4 Pro 是最引人注目的。1.6 万亿参数。在大多数基准测试中与 GPT-5.4 匹敌。而且它每百万输出 token 的成本是 3.48 美元。相比之下,OpenAI 是 30 美元,Anthropic 是 25 美元。这就是 7 到 8 倍的成本降低。

但还有更疯狂的。在一轮降价之后,DeepSeek 将其缓存输入成本削减到每百万 token 0.14 美元。这使得 V4 Pro 比 GPT-5.5 便宜 97%。百分之九十七。Flash 版本更便宜,每百万输出 token 只需 0.28 美元。

而且因为这些是以 MIT 许可证发布的开源权重模型,你可以下载权重,在你自己的基础设施上运行,并提供推理服务,没有任何速率限制、每周上限或"你已达到限制"的无稽之谈。没有 5 小时窗口。没有每周重置。不用祈祷缓存 bug 不会在 19 分钟内吃掉你的配额。

讽刺的是真的令人难以置信。DeepSeek 是在美国出口管制下构建 V4 的。他们无法获得最好的 Nvidia GPU。他们被迫开发更高效的计算训练方法。而这些效率限制使得该模型在推理时在结构上更便宜运行。旨在减缓中国 AI 发展的制裁意外地产生了一个在价格上比美国低一个数量级的模型。

对于像我这样的学生,或者一个初级开发者,或者任何一个月 200 美元是一大笔钱的国家的人来说,这改变了一切。你可以用 DeepSeek V4 的 API 设置 Aider 或 Cline,每月只需 2 到 5 美元就能获得接近前沿的编码辅助。不是 200 美元。不是 100 美元。两到五美元。

5、坦诚面对权衡

我不会假装中国模型是完美的。它们不是。

DeepSeek 自己在技术报告中说 V4 落后最先进的前沿模型大约三到六个月。在最困难的任务上——复杂的多约束提示、长时间运行的代理工作流、真正棘手的边界情况——Claude Opus 和 GPT-5.5 仍然胜出。差距很小并且在缩小,但它是真实的。

关于通过中国 API 端点路由代码,确实存在合理的数据隐私问题。如果你在做一些敏感的工作,或者你在一家有合规要求的公司,这很重要。用于构建作品集项目或学习?可能不是问题。

而且设置不如西方工具那样即插即用。你需要配置 API 密钥、选择客户端、设置账单警报。不难,但不是无摩擦的。

但在我看来是这样的:如果你需要在周一就把 Claude 免费套餐用完而没有 AI 辅助,和每月花几美元通过 DeepSeek 获得接近前沿的 AI 辅助之间做选择,答案很明显。

6、我认为这一切意味着什么

2026 年的 AI 编程工具市场正在创造一个分层劳动力。顶层:获得资金支持的公司中拥有无限高级访问权限的高级开发者。中层:负担得起每月 20 到 60 美元但要应对持续速率限制和中断的开发者。底层:学生、初级开发者和低收入地区被困在几乎无法运作的免费计划中的开发者。

但中国的开源权重推进正在以超出任何人预期的速度压缩这种分层。当前沿质量的 AI 编码以每百万 token 3 美元而不是 25 到 30 美元的价格可用时,每月 200 美元的高级版本看起来不再像永久优势,而更像是对那些还没发现替代方案的人征收的临时税。

那些以为 AI 会处理一切而裁掉初级开发者的公司现在正在学到:AI 工具昂贵、不可靠,在高峰时段会被速率限制到毫无用处。被裁掉的初级开发者正在用廉价的开源权重模型构建技能,最终可能比那些依赖高级工具而无法离开它们的资深开发者更有适应力。

我不是说一切都好。新开发者的就业市场现在确实很艰难。西方 AI 工具的定价情况在高级层级近乎剥削,在免费层级几乎不可用。公司正在做出矛盾的决定——解雇人然后又急忙重新招聘——这伤害了真实的人的职业生涯。

但技术本身正在变得更加可获取,而不是更少。那些弄清楚如何有效使用开源权重模型、学会与 AI 协作而不是仅仅向高级订阅扔钱的人,才是最终会胜出的人。

每月花 200 美元的开发者今天有优势。但那个优势有一个到期日。而且它来得比大多数人想的要快。

None

原文链接: Companies Are Spending Crazy Money on AI Coding Tools While Developers Burn Out

汇智网翻译整理,转载请标明出处