Anthropic “ 世界上最好的编码模型 ” 标语终于来到了 —— 4.5 版本。

不仅如此,Claude Code 也有升级,终端界面焕然一新,新的 VS Code 扩展将 Claude 带入你的 IDE。

核心亮点
一个模型好不好,需要用数据说话。Anthropic 公司公布了一系列测试结果。
其中有一个非常重要的测试,叫做 SWE-bench。这个测试专门模拟解决真实世界里的软件工程问题。在 SWE-bench 测试中,Claude Sonnet 4.5 的标准版得分是 77.2%。它的高算力版得分达到了 82.0%。

作为对比,GPT-5 在同样测试中的得分分别是 72.8% 和 74.5%。Gemini 2.5 Pro 的得分是 67.2%。这些数字说明,Claude Sonnet 4.5 的代码生成和修复能力确实非常出色。
除编程能力外,该模型在推理和数学相关的多项评估中也显示出改进。来自金融、法律、医学和STEM领域的专家评估显示,Sonnet 4.5在特定领域的知识深度和推理能力上相比早期模型(包括Opus 4.1)有显著提升。

注:STEM 是四个学科领域英文首字母的缩写:
- Science(科学)
- Technology(技术)
- Engineering(工程)
- Mathematics(数学)
不只是模型,还有
Anthropic 这次不只是发布了一个新模型。他们还升级了一整套工具,让 AI 变得更好用。
对于开发者:
-
Claude Code 增加了“Checkpoints”功能。 用户可以随时保存工作进度,如果出错了,也能立刻回到之前的某个状态。
-
发布了原生的 VS Code 插件。 开发者可以在自己熟悉的编辑器里,更方便地使用 Claude。
-
推出了 Claude Agent SDK。 Anthropic 把他们自己用来构建 AI Agent 的工具开放了出来。开发者可以用它来打造自己的复杂 AI 应用。
对于普通用户:
-
Claude 应用功能更强大。 现在用户可以直接在对话中,让 Claude 创建和编辑文件,比如电子表格、幻灯片和文档。
-
Chrome 浏览器插件开放。 更多用户可以使用 Claude 插件,让 AI 在浏览器里帮你处理任务。
Imagine with Claude
Anthropic 还发布了一个叫做“Imagine with Claude”的短期研究预览。这是一个很有趣的实验。

在这个实验里,Claude 会实时为你生成软件。所有的功能都不是预先写好的代码。你看到的就是 AI 实时创造的过程。这
注意需要Max会员才能用:https://claude.ai/imagine/
如何用上新模型?
Claude Sonnet 4.5 今天已经全面上线了。
如果你是开发者,你只需要在调用 API 的时候,把模型名字改成 claude-sonnet-4-5
就可以了。
Cursor 也已经宣布支持 Claude Sonnet 4.5,使用 cursor 的朋友们也可以直接用 4.5 模型了。
Anthropic建议在所有场景中升级至 Claude Sonnet 4.5。无论你是通过的应用、API,还是 Claude Code 使用 Claude,Sonnet 4.5 都可以作为无缝替代,提供显著提升的性能,且价格不变。Claude Code 的更新对所有用户开放。Claude 开发者平台的更新(包括 Claude Agent SDK)对所有开发者开放。代码执行和文件创建功能则在所有付费计划的 Claude 应用中均可使用。