10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI工具集合

Cursor Composer 2.5 发布:基于 Kimi K2.5,成本降 10 倍,马斯克亲自站台

3小时前 AI工具集合 27 0

最近Cursor 发布了 Composer 2.5,官方定性为"迄今为止最强大的模型"。

发布推文 1182 万次浏览,马斯克本人转发点赞。这次除了模型更新本身,Cursor 还顺带宣布了一件更大的事。

先看数据

三项主要基准测试里,Composer 2.5 的成绩是:

  • Terminal-Bench 2.0:69.3%,与 Opus 4.7 的 69.4% 几乎打平
  • SWE-Bench Multilingual:79.8%,超过 GPT-5.5 的 77.8%,略低于 Opus 4.7 的 80.5%
  • CursorBench v3.1(高难度任务):63.2%,Opus 4.7 默认配置是 61.6%,GPT-5.5 默认是 59.2%

CursorBench 是 Cursor 自己设计的测试集,更贴近真实编程场景,这个维度上 Composer 2.5 超过了同等默认配置的 Opus 4.7 和 GPT-5.5。

这几项成绩本身放在前沿模型里不算最顶,但下面这张图才是重点。

成本对比散点图里,Opus 4.7 达到类似 CursorBench 得分需要每任务约 7-10 美元,GPT-5.5 需要 1-2 美元,Composer 2.5 站在右上角,得分相近,成本接近于零。官方说法是"比同等能力的模型高效 10 倍"。

定价是每百万输入 token 0.50 美元,输出 2.50 美元。发布首周还直接把模型的包含用量翻倍。

这次 Cursor 把底座写进了公告

上次 Composer 2 发布时,社区因为抓包发现底层用的是 Kimi K2.5 而引发了一场透明度争议。Cursor 产品负责人 Lee Robinson 后来公开道歉,表示"下一个模型会把基座写清楚"。

这次他们做到了。

Cursor 在发布推文里直接写道:Composer 2.5 基于与 Composer 2 相同的开源基础构建,即 Moonshot 的 Kimi K2.5。

但这句话只说了一半,另一半更关键。

官方随即附上了一张计算资源分布图,图里写着:Composer 2.5 有 85% 的计算资源来自 Cursor 自己的额外训练和强化学习,Kimi K2 和 Kimi K2.5 各只贡献了 7.5%。

换句话说,Kimi K2.5 只是起点,Cursor 在这个基础上砸进去的才是主体。这和"拿开源模型做微调"是两种不同量级的工作。

他们到底做了什么

Cursor 在技术细节上没有藏着掖着,公布了三个核心方向:

  • 扩大训练规模,生成了比上一代复杂得多的强化学习环境
  • 引入文本反馈机制,在强化学习过程中,通过在跨越数十万个 token 的 rollout 中精确分配积分,让模型学得更快
  • 合成数据量是上一代的 25 倍,并且发现模型能自己找到解析缓存、反编译字节码等复杂变通方案

优化器层面,他们用了分片 Muon 结合双网格 HSDP,在万亿参数规模上每个优化器步骤只需 0.2 秒。这些是模型公司才会搞的工程细节,不是普通应用层面的事情。

官方引用了一句评价:"Composer 2.5 exceptionally intelligent and up to 10x more efficient than similarly capable models."

然后是那个更大的消息

Cursor 宣布,正在与 SpaceXAI 合作,从头训练一个规模大得多的全新模型,总算力是现在的 10 倍。他们会用 Colossus 2 的百万 H100 等效算力,结合双方的数据积累和训练技术。

四月份 SpaceXAI 与 Cursor 宣布算力合作的时候,许多人认为这只是租用算力的商业协议。现在来看,那只是开始,双方已经在联合从零训练一个新模型。

马斯克本人在推文下评论了一句:"试用一下!(部分训练于 Colossus 2)"。简短,但背书效应不小。

Cursor CEO Michael Truell 在自己账号上写:Composer 2.5 相较于 Composer 2 是一个显著的进步,而这只是他们与 SpaceXAI 合作的开端,希望很快能推出更多改进。

值得注意的几个信号

Cursor 这条路越走越清晰:用自有数据和强化学习训练专属编程模型,而不是永远依赖第三方 API。从 Composer 1 到 1.5 再到 2,再到现在的 2.5,每一代都在把自研能力往前推一步。

现在他们有了 SpaceXAI 的算力支持,下一代模型的规模和能力上限会直接被拉高。Colossus 2 的百万张 H100 不是一个可以忽视的数字。

Kimi K2.5 这次被作为公开起点写进发布公告,本身也是一个变化。开源生态和商业产品的协作关系越来越像一种标准路线,谁借助谁做了什么,最终能不能形成自己的差异化,才是真正的竞争维度。

成本效率这件事也值得单独说一句。在性能相近的情况下,成本差距 10 倍不是小事。对于自动化编程、Agent 任务这类需要高频调用的场景,成本直接决定了什么东西能规模化,什么不能。

苏米注:Cursor 的这条路——基于开源底座 + 大量自有数据 RL 训练 + 专属算力合作——正在成为 AI 编程工具的标准路线。对于开发者来说,Composer 2.5 的成本优势(10 倍效率提升)意味着 Agent 编程可以真正规模化了。值得关注的是他们与 SpaceXAI 的合作,百万级 H100 算力训练出来的下一代模型,可能会重新定义 AI 编程的上限。

当然,Cursor 的下一代模型还在训练中,承诺和落地之间有多大距离,等上线了再说。但今天这个起点,看起来比预期的要结实一些。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Cursor Composer 2.5 发布:基于 Kimi K2.5,成本降 10 倍,马斯克亲自站台
#Cursor # Composer 2.5 # Kimi K2.5 # AI 编程 #SpaceXAI 
收藏 1
Qwen3.7 Preview 曝光:Arena Text 排名 13,Vision 排名 16
OpenHuman:开源AI助手接入118个服务,自带记忆树和Obsidian同步
推荐阅读
  • 2025年普通人必须要知道的15个AI工具,可以让日常工作效率大幅度提升
  • 8款最新AI工具合集,从绘图到Agent,年末AI圈的热门产品盘点
  • Hermes Agent 四大 Web UI面板深度横评:EKKO/nesquena/OpenClaw-Admin/Open WebUI 全面对比
  • Cursor Composer 2.5 发布:基于 Kimi K2.5,成本降 10 倍,马斯克亲自站台
  • 6个AI流程图、信息图、演示文稿生成合集(AI配图邪修版)
评论 (0)
请登录后发表评论
分类精选
12款国内外最全AI绘画工具推荐,AI文生图工具深度测评与场景化对比
38708 1年前
2025开源AI数字人工具指南:8大免费开源神器带你免费解锁可商用的AI数字人
32784 1年前
15款国内免费好用的AI写作神器合集,2025超干货! Ai写作工具推荐,支持论文长文
29273 1年前
2025年普通人必须要知道的15个AI工具,可以让日常工作效率大幅度提升
22939 1年前
8 款 AI 翻译浏览器插件,沉浸式翻译助你轻松阅读网页
18562 1年前
8 款热门 AI 图片+视频生成工具:文生图、文生视频、图生视频
13484 1年前
谁会成为下一个Cursor的平替,盘点 8 款可用 Claude 4 的AI编程工具
13481 10月前
5款开源TTS,零样本声音克隆,克隆你想要的声音,快速本地部署(含一键包下载)
12973 1年前
2025年热门好用的 AI换脸工具大全,适合内容创作者、视频剪辑师、特效制作、AI 爱好者使用
12476 11月前
n8n进阶指南:精选10个n8n AI 工作流模板,效率翻了100%!附模板包下载
12208 11月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 4款国产通用智能体深度横评:百度DuMate、WorkBuddy、QoderWork、QClaw六大维度实测对比
2 7款AI生成PPT工具横评:Gamma、NotebookLM、Codex、frontend-slides实测,出稿vs磨稿场景选择指南
3 Cursor Composer 2.5 发布:基于 Kimi K2.5,成本降 10 倍,马斯克亲自站台
4 一人公司注册全攻略:用WorkBuddy 5步搞定核名到税务登记
5 10个前端开发必备的AI Skills:从设计还原到自动化部署的全套方案
6 Claude Code Token 消耗太高?10 款开源工具帮你省 80%
7 TRAE vs Workbuddy vs Qoderwork:国内三大桌面AI助手横评与选型建议
8 微信读书官方 Skill 实测:把阅读数据变成可查询、可分析的个人知识库
9 5 个精选金融研报 Skill:从 A 股到美股的自动化投研框架
10 4个常用的Claude Code Skills推荐
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联