今天,我们正式扩充 Gemini 3 模型家族,推出了全新的 Gemini 3 Flash。

这款模型专为追求极致速度而生,以极低的成本提供了前沿的智能体验。此次发布标志着我们将 Gemini 3 的下一代智能技术全面引入 Google 的各项产品中,让每一位用户都能触手可及。
上个月,随着 Gemini 3 Pro 和 Gemini 3 Deep Think 模式的亮相,我们正式揭开了 Gemini 3 系列的序幕,市场反响极其热烈。自发布以来,我们的 API 每日处理的 Token 数量已突破 1 万亿大关。我们见证了大家利用 Gemini 3 进行各种创新:从通过 “氛围编程 (vibe code)”模拟 来探索复杂课题,到构建和设计 互动游戏,再到深度理解各类 多模态内容,应有尽有。
Gemini 3 的问世,为复杂推理、多模态与视觉理解,以及 AI 智能体 (AI Agent) 和氛围编程任务带来了前沿的性能表现。Gemini 3 Flash 完美继承了这一基石,它将 Gemini 3 Pro 级别的推理能力与 Flash 系列标志性的低延迟、高效率及低成本优势完美融合。它不仅凭借更强的推理能力赋能日常任务,更是我们目前在处理 AI 智能体工作流方面最为出色的模型。
即日起,Gemini 3 Flash 将面向全球数百万用户陆续推出:
- 开发者:可通过 Google AI Studio 中的 Gemini API、Gemini CLI 以及我们要全新推出的智能体开发平台 Google Antigravity 获取服务
- 大众用户:可通过 Gemini app 和 搜索中的 AI 模式 (AI Mode in Search) 体验
- 企业用户:可通过 Vertex AI 和 Gemini Enterprise 访问
Gemini 3 Flash
Gemini 3 Flash 向我们证明,速度与规模的提升,无需以牺牲智能为代价。
它在 GPQA Diamond (90.4%) 和 Humanity’s Last Exam (无工具辅助下 33.7%) 等博士级难度的推理与知识基准测试中,展现了前沿的性能。
其表现不仅足以媲美体量更大的前沿模型,更在多项基准测试中显著超越了我们最强的 2.5 代模型——Gemini 2.5 Pro。
此外,它在 MMMU Pro 测试中取得了 81.2% 的惊人成绩,达到了业界领先水平,与 Gemini 3 Pro 不相上下。

除了具备前沿的推理和多模态能力外,Gemini 3 Flash 还专为高效率而设计,刷新了质量与成本、速度之间的“帕累托前沿” (即最佳平衡点)。当进行深度思考处理时,Gemini 3 Flash 能够自主调节“思考”的投入程度。面对复杂场景,它会进行更长时间的思考;而在处理日常任务时,根据典型流量统计,它在保持更高性能和准确性的同时,平均 Token 消耗量比 2.5 Pro 降低了 30%。

Gemini 3 Flash 拓展了性能与成本、速度的帕累托前沿。
Gemini 3 Flash 的核心优势在于其极致的速度,它延续了深受开发者和消费者喜爱的 Flash 系列的基因。据 Artificial Analysis 基准测试显示,它的性能超越了 2.5 Pro,速度却是其 3 倍,而成本却大幅降低。Gemini 3 Flash 的定价为每百万输入 Token 0.50 美元,每百万输出 Token 3 美元(音频输入保持在每百万输入 Token 1 美元)。
Gemini 3 Flash 在 [速度和质量]上均超越了 2.5 Pro。
致开发者:紧跟节奏的智能体验
Gemini 3 Flash 专为迭代开发打造,它结合了 Gemini 3 Pro 级别的编程能力与极低的延迟——这意味着它能够在高频工作流中快速进行推理并解决问题。在评估编程智能体能力的权威基准 SWE-bench Verified 中,Gemini 3 Flash 获得了 78% 的高分,不仅超越了 2.5 系列,甚至击败了 Gemini 3 Pro。它为智能体编程、生产级系统以及高响应速度的交互式应用提供了完美的平衡方案。
Google Antigravity 中的 Gemini 3 Flash 能够快速更新生产级应用程序。
Gemini 3 Flash 在推理、工具使用及多模态能力上的强劲表现,使其成为开发者的理想选择,特别是在进行复杂的视频分析、数据提取和视觉问答 (Visual Q&A) 时。这意味着它能够赋能更智能的应用场景——例如游戏内置助手或 A/B 测试实验——这些场景往往同时需要极速的响应和深度的推理能力。
Gemini 3 Flash 一经推出,便收到了各大企业的热烈反响。JetBrains、Bridgewater Associates 和 Figma 等知名企业已率先利用它来推动业务革新,他们一致认可:Gemini 3 Flash 在推理速度、效率及能力上,完全可以媲美更大规模的模型。Gemini 3 Flash 现已通过 Vertex AI 和 Gemini Enterprise 向企业用户开放。
致每一位用户:Gemini 3 Flash 全球上线
Gemini 3 Flash 现已成为 Gemini app 的默认模型,正式接棒 2.5 Flash。这意味着全球的 Gemini 用户都能免费体验到 Gemini 3 的强大能力,让处理日常任务的效率迎来质的飞跃。
得益于 Gemini 3 Flash 卓越的多模态推理能力,它能助你以更快的速度“看”清、“听”懂并深度理解各类信息。例如,你可以让 Gemini 分析你的视频和图片,并在短短几秒内将其转化为切实可行的行动计划。
Gemini app 中的 Gemini 3 Flash 可以 分析短视频内容并为你制定计划],比如如何改善你的高尔夫挥杆动作。
由于 Gemini 3 Flash 专为速度优化,它可以在你作画的同时 “看”懂并猜测你的绘画内容
你可以上传一段录音,Gemini 3 Flash 将识别你的知识盲区,生成定制测验并对答案提供详细的解释。
此外,即使你完全不懂代码,也能仅凭语音指令,从零开始快速构建有趣且实用的应用程序。随时随地向 Gemini 描述你的想法,它就能在几分钟内将你零散的思绪转化为一个功能完备的 App。
Food prototype using Gemini 3 Flash
使用 Gemini 3 Flash 描述你的创意,并在几分钟内将其转化为一个可运行的原型。
Gemini 3 Flash 也开始作为“搜索中的 AI 模式 (AI Mode in Search)”的默认模型,陆续面向全球用户开放。
基于 Gemini 3 Pro 的推理架构,搭载 Gemini 3 Flash 的 AI 模式能更精准地解析你问题中的细微需求。它会全方位考量你的查询,整合全网的实时本地信息和实用链接,为你提供经过深思熟虑、内容详尽且视觉呈现清晰易读的回答。这种体验高效地将“信息检索”与“即时行动”结合在了一起:你不仅能获得智能梳理的信息架构,还能得到具体的行动建议——而这一切都拥有搜索般的极速响应。
当你需要应对包含多重考量的复杂任务时——比如策划一次说走就走的旅行,或快速学习深奥的学术概念——它的优势尤为明显。
Gemini 3 Flash 将 Gemini 3 惊人的推理能力带到了搜索中,在不牺牲速度的前提下,助你解决最复杂的问题。
即刻体验 Gemini 3 Flash
Gemini 3 Flash 现已通过 Google AI Studio、Google Antigravity、Vertex AI 和 Gemini Enterprise 中的 Gemini API 开启预览。

你也可以通过 Gemini CLI 和 Android Studio 等其他开发者工具进行访问。同时,它正陆续在 Gemini app 和搜索中的 AI 模式 中上线,让每一位用户都能免费、快速地享受到下一代智能技术。
随着 Gemini 3 Pro、Gemini 3 Deep Think 以及如今 Gemini 3 Flash 的加入,模型家族日益壮大。我们迫不及待地想看到大家利用这些工具创造出怎样的精彩。