Composer 2.5:一次意外的进化
Cursor发布了一个名为Composer 2.5的新模型,事实证明你确实可以获得快速、便宜且编码质量高的东西。我们真的太幸运了。
这紧随SpaceX有权以600亿美元收购Cursor的消息之后。
马斯克暗示收购Cursor是让Grok变得更好这一更大布局的一部分。
在Cursor的基准测试中,有趣的是他们每个任务的平均成本极低,仅为0.55美元。
0.55美元对比Opus 4.7的11.02美元——成本降低了20倍,对比ChatGPT 5.5 High的3.59美元——成本降低了7倍。
在ChatGPT自己报告的基准测试中,他们声称自己是最好的。所以我们需要对此持保留态度,因为现在似乎每个人都说自己有最好的模型。
所以我已经在测试这个模型,看看作为一个普通用户它是如何比较的。
首先,我在过去4天中使用了2.09亿个token。
我一直在大量使用这些工具,但它只消耗了我Composer额度的4%和API额度的13%(用于使用ChatGPT 5.5和Opus 4.6/7等模型)。
这回答了第一个问题:在单位任务成本基础上,它确实极其有价值,Cursor引用的0.55美元这个指标对我来说是公平的。
我最近写过$20和$60的套餐简直是个笑话。
Claude Code和Cursor——$20和$60的套餐是个笑话我很快就担心$200/月的套餐也会是个笑话。我们正在被割韭菜。
现在有了Composer 2.5,我认为至少$60的套餐是可用的。我在朋友的账户上测试了$20的套餐,仍然飞速用完了使用额度,所以我仍然认为$20的套餐是个笑话。也许我不再了解业余编程了,因为我习惯了做大型项目,也许$20套餐的市场只是那些随便试试的人。
1、让我们谈谈速度
我要说清楚,Cursor 2.5是目前为止最快的模型。它就像一艘火箭。
它快到真的值得为此切换到Cursor。
这个速度快得令人疯狂,而且它的表现水平也很高。只要你写下一个提示,它就开始并行运行多个任务,而且很多都能直接成功,这太不可思议了。
我希望每个AI产品都能这么快。
这种速度让你编写更多的东西,因为它给你更多的想法,帮助你保持心流状态。
2、这个模型与前一个Composer 2模型的区别
我大量使用了之前的Composer 2模型,把它当作任务执行模型。我基本上会用Opus 4.6来做规划,然后用Composer 2来执行计划。
现在我只用Composer 2.5来规划和构建。它真的那么好。这带来了巨大的差异——现在你的编码费用大幅降低,同时你能完成更多的工作。
区别在于你可以用它来规划和思考。我之前从来无法让Composer 2做到这一点,它总是做出奇怪的事情,设计出非常奇怪的UI,完全不在状态。
说实话,我没有注意到用它和用Opus 4.6做规划有什么区别。
对我来说主要的测试是功能是否正常工作。
3、那么这意味着什么?
让我们从几个角度来看
如果你喜欢Claude Code但不喜欢用终端
那么你完全可以切换到Cursor,这个新套餐解决了一个大问题:拥有一个你可以长时间运行的、价格合理的模型,而且它真的很快。
如果你深度使用Claude Code并且喜欢终端
这取决于——你喜欢速度吗?如果是,添加$60的套餐并测试一个月。如果你不追求速度,那么你可以继续使用Claude Code。
如果你使用Codex呢?
我认为Codex加Cursor是目前最好的组合,这也是我在用的。我喜欢Codex生成的网站UI和外观,感觉很轻松就能编写代码并沉浸其中。
但Cursor的速度是会上瘾的。
所以我现在在Cursor上有每月$200的套餐,在Codex上有每月$100的套餐。
我想知道Anthropic是否会跟进
Anthropic会密切关注这一点,如果他们发布一个快速模型,我们不得不重新评估一切,我确信他们迟早会的。
Anthropic可能正在努力让4.8比4.7更好,因为每个人都讨厌4.7,有一个人们讨厌的模型对他们的品牌不利。也许他们会直接跳到Opus 5,一切从零开始。
OpenAI在ChatGPT方面处于不错的位置,在Codex上你有快速模式。唯一的问题是它消耗token的速度比Composer 2.5快得多,而且我发现ChatGPT 5.5在普通模式下对大多数任务来说完全够用了。
原文链接: Cursor new Composer 2.5 model is fast cheap and amazing
汇智网翻译整理,转载请标明出处