看到一张图分享一下:OpenAI 说自己最强,Grok 也说最强,DeepSeek 刚刚也来了句最强……轮到 Google 出牌了,这次的 Gemini 2.5 Pro 更新,又狠狠卷了一把性能和体验。

Google 又更新了 Gemini 2.5 Pro 版本
性能继续跃升
语言理解与对话能力(LMArena 第一)
网页编程与前端开发能力(WebDevArena 第一)
复杂、多语言代码生成能力(Aider Polyglot 第一)
学术/推理类问题解决能力(GPQA + HLE 第一)

Google 在 6 月 5 日凌晨悄悄上线了 Gemini 2.5 Pro 的新预览版本,代号 gemini-2.5-pro-preview-06-05
。

虽然还是 preview 阶段,但从各种性能表现来看,这基本就是谷歌接下来押注的长期主力模型,免费开放体验,谁用谁知道。
核心版本信息:
项目 | 数据 |
---|---|
版本代号 | gemini-2.5-pro-preview-06-05 |
上线时间 | 2025 年 6 月 5 日 |
上下文窗口 | 输入 1,048,576 tokens,输出 65,536 tokens |
支持平台 | AI Studio、Vertex AI、Gemini App |
新功能 | 支持 “thinking budget” —— 控制推理深度 |
全面进化
Gemini 2.5 Pro 这次的进化不只是“更新一下版本号”,而是硬生生在多个高难度评测中登顶,性能炸裂。
推理能力 → 回归巅峰,吊打竞品
这次的 Gemini 模型在下面这三大高阶 benchmark 上表现亮眼:
-
HLE(人类最后考试)
-
AIDER(推理+编码)
-
GPQA(研究生难度问答)
不仅跑赢了前代 o3、Grok 3,连 DeepSeek R1 和 Claude Opus 也被甩开。Google 直言:回归 SOTA(State of the Art)。
编码能力 → Web 开发最强助手
如果你是做前端、写 Web App、自动化工具的开发者,这一代 Gemini 简直为你量身打造。
-
WebDevArena 榜首!Elo 分数提升至 1443
-
多语言代码基准测试中表现同样稳定领先
-
超长代码上下文处理(百万 tokens),整个项目一起扔进去都行
响应风格 → 更整洁、更人性化
Google 针对用户反馈,优化了 Gemini 的回答结构和表达能力:
-
回复更有条理,适合生成结构化内容(比如报告、笔记、教程)
-
更有创意,适合广告文案、内容改写、文学创作等场景
-
格式更整洁:代码块、引用、列表等自动生成,不再混乱
而且新增的 thinking budget(推理预算) 功能也很有意思: 可以控制模型“思考”时使用多少资源,平衡速度和深度,就像给 AI 加了个「思维调节钮」。
在哪体验?
这个版本已经可以通过以下平台免费体验:
-
Google AI Studio(网页版)
-
Vertex AI(开发者集成)
-
Gemini App(移动端)
苏米建议直接上手 AI Studio,免费用、体验完整,还能测试各种复杂问题或构建个小项目玩玩。

总结
Gemini 的整体策略,已经不只是模型层面了,而是更像在构建一个多模态的 AI 平台。
-
从语言到图片、视频解析,全模态打通
-
从对话助手到代码生成、内容创作,多场景覆盖
-
再到支持上下文百万级输入、创意/结构表达的自由切换,这种“生产工具化”的趋势越来越明显
虽然当前文本模型的“个性化理解”和“深层逻辑”上,GPT-4o 还是更胜一筹,但 Gemini 的开发速度 + 免费策略,真的是让所有人都能参与到 AI 创作中了。
如果你是开发者、内容创作者、产品人,或者正在找一个稳定又免费的 AI 工具玩转推理、编码、创作,Gemini 2.5 Pro 现在就是最佳窗口。