当前位置：首页 » AI最新动态

Gemini 3 Flash 正式发布，比国产 AI 更便宜，免费、极速、吊打前代

3月前 AI最新动态 558 0

今天，我们正式扩充 Gemini 3 模型家族，推出了全新的 Gemini 3 Flash。

这款模型专为追求极致速度而生，以极低的成本提供了前沿的智能体验。此次发布标志着我们将 Gemini 3 的下一代智能技术全面引入 Google 的各项产品中，让每一位用户都能触手可及。

上个月，随着 Gemini 3 Pro 和 Gemini 3 Deep Think 模式的亮相，我们正式揭开了 Gemini 3 系列的序幕，市场反响极其热烈。自发布以来，我们的 API 每日处理的 Token 数量已突破 1 万亿大关。我们见证了大家利用 Gemini 3 进行各种创新：从通过 “氛围编程 (vibe code)”模拟来探索复杂课题，到构建和设计互动游戏，再到深度理解各类多模态内容，应有尽有。

Gemini 3 的问世，为复杂推理、多模态与视觉理解，以及 AI 智能体 (AI Agent) 和氛围编程任务带来了前沿的性能表现。Gemini 3 Flash 完美继承了这一基石，它将 Gemini 3 Pro 级别的推理能力与 Flash 系列标志性的低延迟、高效率及低成本优势完美融合。它不仅凭借更强的推理能力赋能日常任务，更是我们目前在处理 AI 智能体工作流方面最为出色的模型。

即日起，Gemini 3 Flash 将面向全球数百万用户陆续推出：

开发者：可通过 Google AI Studio 中的 Gemini API、Gemini CLI 以及我们要全新推出的智能体开发平台 Google Antigravity 获取服务
大众用户：可通过 Gemini app 和搜索中的 AI 模式 (AI Mode in Search) 体验
企业用户：可通过 Vertex AI 和 Gemini Enterprise 访问

Gemini 3 Flash

Gemini 3 Flash 向我们证明，速度与规模的提升，无需以牺牲智能为代价。

它在 GPQA Diamond (90.4%) 和 Humanity’s Last Exam (无工具辅助下 33.7%) 等博士级难度的推理与知识基准测试中，展现了前沿的性能。

其表现不仅足以媲美体量更大的前沿模型，更在多项基准测试中显著超越了我们最强的 2.5 代模型——Gemini 2.5 Pro。

此外，它在 MMMU Pro 测试中取得了 81.2% 的惊人成绩，达到了业界领先水平，与 Gemini 3 Pro 不相上下。

包含 Gemini 3 Flash 等多个语言模型在各类任务上的性能评分与价格对比表，涵盖学术推理、科学知识、数学、多模态理解、编程和长文本性能等领域。

除了具备前沿的推理和多模态能力外，Gemini 3 Flash 还专为高效率而设计，刷新了质量与成本、速度之间的“帕累托前沿” (即最佳平衡点)。当进行深度思考处理时，Gemini 3 Flash 能够自主调节“思考”的投入程度。面对复杂场景，它会进行更长时间的思考；而在处理日常任务时，根据典型流量统计，它在保持更高性能和准确性的同时，平均 Token 消耗量比 2.5 Pro 降低了 30%。

散点图显示了各类语言模型的 LMArena Elo 分数与每百万 Token 价格的关系，并在 'gemini-3-pro'、'gemini-3-flash' 和 'gemini-3-flash-lite' 之间突出显示了帕累托前沿曲线。

Gemini 3 Flash 拓展了性能与成本、速度的帕累托前沿。

Gemini 3 Flash 的核心优势在于其极致的速度，它延续了深受开发者和消费者喜爱的 Flash 系列的基因。据 Artificial Analysis 基准测试显示，它的性能超越了 2.5 Pro，速度却是其 3 倍，而成本却大幅降低。Gemini 3 Flash 的定价为每百万输入 Token 0.50 美元，每百万输出 Token 3 美元（音频输入保持在每百万输入 Token 1 美元）。

Gemini 3 Flash 在 [速度和质量]上均超越了 2.5 Pro。

致开发者：紧跟节奏的智能体验

Gemini 3 Flash 专为迭代开发打造，它结合了 Gemini 3 Pro 级别的编程能力与极低的延迟——这意味着它能够在高频工作流中快速进行推理并解决问题。在评估编程智能体能力的权威基准 SWE-bench Verified 中，Gemini 3 Flash 获得了 78% 的高分，不仅超越了 2.5 系列，甚至击败了 Gemini 3 Pro。它为智能体编程、生产级系统以及高响应速度的交互式应用提供了完美的平衡方案。

Google Antigravity 中的 Gemini 3 Flash 能够快速更新生产级应用程序。

Gemini 3 Flash 在推理、工具使用及多模态能力上的强劲表现，使其成为开发者的理想选择，特别是在进行复杂的视频分析、数据提取和视觉问答 (Visual Q&A) 时。这意味着它能够赋能更智能的应用场景——例如游戏内置助手或 A/B 测试实验——这些场景往往同时需要极速的响应和深度的推理能力。

Gemini 3 Flash 一经推出，便收到了各大企业的热烈反响。JetBrains、Bridgewater Associates 和 Figma 等知名企业已率先利用它来推动业务革新，他们一致认可：Gemini 3 Flash 在推理速度、效率及能力上，完全可以媲美更大规模的模型。Gemini 3 Flash 现已通过 Vertex AI 和 Gemini Enterprise 向企业用户开放。

致每一位用户：Gemini 3 Flash 全球上线

Gemini 3 Flash 现已成为 Gemini app 的默认模型，正式接棒 2.5 Flash。这意味着全球的 Gemini 用户都能免费体验到 Gemini 3 的强大能力，让处理日常任务的效率迎来质的飞跃。

得益于 Gemini 3 Flash 卓越的多模态推理能力，它能助你以更快的速度“看”清、“听”懂并深度理解各类信息。例如，你可以让 Gemini 分析你的视频和图片，并在短短几秒内将其转化为切实可行的行动计划。

Gemini app 中的 Gemini 3 Flash 可以分析短视频内容并为你制定计划],比如如何改善你的高尔夫挥杆动作。

由于 Gemini 3 Flash 专为速度优化，它可以在你作画的同时 “看”懂并猜测你的绘画内容

你可以上传一段录音，Gemini 3 Flash 将识别你的知识盲区，生成定制测验并对答案提供详细的解释。

此外，即使你完全不懂代码，也能仅凭语音指令，从零开始快速构建有趣且实用的应用程序。随时随地向 Gemini 描述你的想法，它就能在几分钟内将你零散的思绪转化为一个功能完备的 App。

Food prototype using Gemini 3 Flash

使用 Gemini 3 Flash 描述你的创意，并在几分钟内将其转化为一个可运行的原型。

Gemini 3 Flash 也开始作为“搜索中的 AI 模式 (AI Mode in Search)”的默认模型，陆续面向全球用户开放。

基于 Gemini 3 Pro 的推理架构，搭载 Gemini 3 Flash 的 AI 模式能更精准地解析你问题中的细微需求。它会全方位考量你的查询，整合全网的实时本地信息和实用链接，为你提供经过深思熟虑、内容详尽且视觉呈现清晰易读的回答。这种体验高效地将“信息检索”与“即时行动”结合在了一起：你不仅能获得智能梳理的信息架构，还能得到具体的行动建议——而这一切都拥有搜索般的极速响应。

当你需要应对包含多重考量的复杂任务时——比如策划一次说走就走的旅行，或快速学习深奥的学术概念——它的优势尤为明显。

Gemini 3 Flash 将 Gemini 3 惊人的推理能力带到了搜索中，在不牺牲速度的前提下，助你解决最复杂的问题。

即刻体验 Gemini 3 Flash

Gemini 3 Flash 现已通过 Google AI Studio、Google Antigravity、Vertex AI 和 Gemini Enterprise 中的 Gemini API 开启预览。

你也可以通过 Gemini CLI 和 Android Studio 等其他开发者工具进行访问。同时，它正陆续在 Gemini app 和搜索中的 AI 模式中上线，让每一位用户都能免费、快速地享受到下一代智能技术。

随着 Gemini 3 Pro、Gemini 3 Deep Think 以及如今 Gemini 3 Flash 的加入，模型家族日益壮大。我们迫不及待地想看到大家利用这些工具创造出怎样的精彩。

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

未经允许不得转载：Gemini 3 Flash 正式发布，比国产 AI 更便宜，免费、极速、吊打前代

请登录后发表评论

Gemini 3 Flash 正式发布，比国产 AI 更便宜，免费、极速、吊打前代

Gemini 3 Flash

致开发者：紧跟节奏的智能体验

致每一位用户：Gemini 3 Flash 全球上线

即刻体验 Gemini 3 Flash

文章目录

关注「苏米客」公众号