当前位置：首页 » AI最新动态

Gemini 3.5 Flash发布：速度碾压GPT但价格翻3倍开发者炸锅

1月前 AI最新动态 373 0

Google 于 5 月 19 日正式发布 Gemini 3.5 Flash，Hacker News 热度瞬间冲上 936 分。评论区炸了——不是因为模型不够好，而是因为价格涨得太离谱。

速度：目前最快的旗舰级模型

这可能是目前响应最快的旗舰级模型。根据 aibenchy 的实测数据，Gemini 3.5 Flash 平均响应时间2.84 秒，而 GPT-5.5 需要 33 秒。最快响应 7 秒内搞定，GPT-5.4 甚至需要 5 分钟以上才能完成最难的测试题。

对于需要实时交互的场景（语音助手、代码补全、多轮对话），这个速度差距是致命的。

核心参数：

上下文窗口：100 万 tokens
支持 Thinking 模式（Low / Medium / High）
支持 2000 token 时钟测试
首次标记为Stable（非 Preview），可直接用于生产环境

性能：Flash 的名，Pro 的命

Google 的基准测试显示，3.5 Flash 在多项测试中超越了 Claude Sonnet 4.6，甚至接近自家上一代 Pro 模型。

社区独立评测 artificialanalysis.ai 的数据也佐证了这一点：3.5 Flash 的综合得分（55 分）明显高于 3.0 Flash（46 分）和 2.5 Pro（35 分）。

但问题来了——它真的值这个价吗？

价格暴涨：社区骂声一片

这才是本次发布最大的争议点：

模型	输入价格	输出价格
Gemini 2.5 Flash	$0.30	$2.50
Gemini 3.0 Flash	$0.50	$3.00
Gemini 3.5 Flash	$1.50	$9.00
DeepSeek v4 Flash	$0.14	$0.28
Claude Sonnet 4.6	~$3.00	~$15.00

相比上一代 Flash，价格直接翻了 3 倍。有开发者计算了 artificialanalysis.ai 的完整测试成本：

Gemini 2.5 Flash：$172
Gemini 3.5 Flash：$1,552

贵了 9 倍，得分只提升了不到一倍。

HN 评论区高赞吐槽：

「Flash 系列本来是便宜又快的代名词，现在价格都快赶上 Pro 了。」

「AI 不是说会越来越便宜吗？这价格方向完全反了。」

「我们需要再来一次 DeepSeek 时刻，不然普通人根本用不起 AI。」

值得注意的是，由于 3.5 Flash 的 Thinking 模式会消耗大量 tokens，实际单任务成本往往比标价更高。有开发者在 SQL Agent 测试中发现，回答同一个问题，3.5 Flash 的查询次数是 3 Flash Preview 的 10 倍。

代码能力：聪明但固执

Gemini 在原始编码能力上一直表现不错，尤其是 HTML/CSS/JS 等前端场景。社区有人用它生成了精美的 SVG 动画（青蛙划船、鹈鹕骑车），细节丰富度令人惊叹。

但在实际工程开发中，问题依然存在：

指令遵循能力差：经常无视 AGENTS.md 中的规则，擅自决定跳过 lint 检查、禁用 pre-commit hook
工具调用过度：喜欢频繁调用工具，Thinking 级别越高越严重
架构设计薄弱：大型项目中的代码质量不如 Opus 4.5+ 和 GPT 5.3+
过度自信：经常在没读文档的情况下自信地给出错误答案，被追问后才承认

有开发者的总结很精准：

「它的问题是太固执。给定一个任务，它会用自己的方式完成，但中间会走无数捷径。」

Antigravity CLI 取代 Gemini CLI

Google 同时宣布了 Antigravity CLI 2.0，将取代现有的 Gemini CLI（6 月 18 日 EOL）。

Antigravity 定位从「代码编辑器」转向「AI Agent 对话」，支持多模态输入和视觉分析。但目前用户的反馈比较两极分化——有人喜欢新的对话式交互，也有人怀念旧的 IDE 风格界面。

模型规模揭秘

虽然 Google 没有官方公布参数量，但社区通过 TPU 8i 的内存规格和模型加载模式推算：

总参数量约 400B
活跃参数约 30B（MoE 架构）

这意味着理论上可以在一台高配 Mac Studio 上本地运行，考虑到 M4 Ultra 的统一内存架构。

到底值不值得用？

适合的场景：

需要极速响应的实时应用
成本敏感度低的企业级部署
HTML/CSS/JS 前端项目
需要 100 万上下文窗口的长文档处理

不适合的场景：

预算有限的开发者和小团队
需要严格遵循指令的 Agent 工作流
大型项目的架构设计
对工具调用精度要求高的自动化流程

对于预算有限的开发者，Gemini 3.1 Flash Lite（$0.25/$1.50）仍然是性价比之王。而追求智能上限的，Claude Code 和 GPT-5.5 依然是更可靠的选择。

总结

Gemini 3.5 Flash 的技术实力毋庸置疑——速度碾压、基准测试亮眼、首次稳定版发布。但3 倍的价格涨幅让「Flash」这个定位变得名不副实。

AI 行业正在经历一个尴尬的阶段：模型越来越强，但价格也在飞速上涨。Google、OpenAI、Anthropic 都在提高定价，补贴时代似乎正在终结。

苏米注：也许我们真的需要「下一个 DeepSeek 时刻」，来重新定义什么是普通人用得起的 AI。Gemini 3.5 Flash 的技术进步值得肯定，但定价策略确实让 Flash 系列失去了原有的性价比优势。对于开发者来说，选择哪个模型还是要看具体场景和预算。

数据来源

Hacker News
artificialanalysis.ai
aibenchy.com
Google AI 开发者文档

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

未经允许不得转载：Gemini 3.5 Flash发布：速度碾压GPT但价格翻3倍开发者炸锅

请登录后发表评论