Google 于 5 月 19 日正式发布 Gemini 3.5 Flash,Hacker News 热度瞬间冲上 936 分。评论区炸了——不是因为模型不够好,而是因为价格涨得太离谱。
速度:目前最快的旗舰级模型
这可能是目前响应最快的旗舰级模型。根据 aibenchy 的实测数据,Gemini 3.5 Flash 平均响应时间2.84 秒,而 GPT-5.5 需要 33 秒。最快响应 7 秒内搞定,GPT-5.4 甚至需要 5 分钟以上才能完成最难的测试题。
对于需要实时交互的场景(语音助手、代码补全、多轮对话),这个速度差距是致命的。
核心参数:
- 上下文窗口:100 万 tokens
- 支持 Thinking 模式(Low / Medium / High)
- 支持 2000 token 时钟测试
- 首次标记为Stable(非 Preview),可直接用于生产环境
性能:Flash 的名,Pro 的命
Google 的基准测试显示,3.5 Flash 在多项测试中超越了 Claude Sonnet 4.6,甚至接近自家上一代 Pro 模型。
社区独立评测 artificialanalysis.ai 的数据也佐证了这一点:3.5 Flash 的综合得分(55 分)明显高于 3.0 Flash(46 分)和 2.5 Pro(35 分)。
但问题来了——它真的值这个价吗?
价格暴涨:社区骂声一片
这才是本次发布最大的争议点:
| 模型 | 输入价格 | 输出价格 |
|---|---|---|
| Gemini 2.5 Flash | $0.30 | $2.50 |
| Gemini 3.0 Flash | $0.50 | $3.00 |
| Gemini 3.5 Flash | $1.50 | $9.00 |
| DeepSeek v4 Flash | $0.14 | $0.28 |
| Claude Sonnet 4.6 | ~$3.00 | ~$15.00 |
相比上一代 Flash,价格直接翻了 3 倍。有开发者计算了 artificialanalysis.ai 的完整测试成本:
- Gemini 2.5 Flash:$172
- Gemini 3.5 Flash:$1,552
贵了 9 倍,得分只提升了不到一倍。
HN 评论区高赞吐槽:
「Flash 系列本来是便宜又快的代名词,现在价格都快赶上 Pro 了。」
「AI 不是说会越来越便宜吗?这价格方向完全反了。」
「我们需要再来一次 DeepSeek 时刻,不然普通人根本用不起 AI。」
值得注意的是,由于 3.5 Flash 的 Thinking 模式会消耗大量 tokens,实际单任务成本往往比标价更高。有开发者在 SQL Agent 测试中发现,回答同一个问题,3.5 Flash 的查询次数是 3 Flash Preview 的 10 倍。
代码能力:聪明但固执
Gemini 在原始编码能力上一直表现不错,尤其是 HTML/CSS/JS 等前端场景。社区有人用它生成了精美的 SVG 动画(青蛙划船、鹈鹕骑车),细节丰富度令人惊叹。
但在实际工程开发中,问题依然存在:
- 指令遵循能力差:经常无视 AGENTS.md 中的规则,擅自决定跳过 lint 检查、禁用 pre-commit hook
- 工具调用过度:喜欢频繁调用工具,Thinking 级别越高越严重
- 架构设计薄弱:大型项目中的代码质量不如 Opus 4.5+ 和 GPT 5.3+
- 过度自信:经常在没读文档的情况下自信地给出错误答案,被追问后才承认
有开发者的总结很精准:
「它的问题是太固执。给定一个任务,它会用自己的方式完成,但中间会走无数捷径。」
Antigravity CLI 取代 Gemini CLI
Google 同时宣布了 Antigravity CLI 2.0,将取代现有的 Gemini CLI(6 月 18 日 EOL)。
Antigravity 定位从「代码编辑器」转向「AI Agent 对话」,支持多模态输入和视觉分析。但目前用户的反馈比较两极分化——有人喜欢新的对话式交互,也有人怀念旧的 IDE 风格界面。
模型规模揭秘
虽然 Google 没有官方公布参数量,但社区通过 TPU 8i 的内存规格和模型加载模式推算:
- 总参数量约 400B
- 活跃参数约 30B(MoE 架构)
这意味着理论上可以在一台高配 Mac Studio 上本地运行,考虑到 M4 Ultra 的统一内存架构。
到底值不值得用?
适合的场景:
- 需要极速响应的实时应用
- 成本敏感度低的企业级部署
- HTML/CSS/JS 前端项目
- 需要 100 万上下文窗口的长文档处理
不适合的场景:
- 预算有限的开发者和小团队
- 需要严格遵循指令的 Agent 工作流
- 大型项目的架构设计
- 对工具调用精度要求高的自动化流程
对于预算有限的开发者,Gemini 3.1 Flash Lite($0.25/$1.50)仍然是性价比之王。而追求智能上限的,Claude Code 和 GPT-5.5 依然是更可靠的选择。
总结
Gemini 3.5 Flash 的技术实力毋庸置疑——速度碾压、基准测试亮眼、首次稳定版发布。但3 倍的价格涨幅让「Flash」这个定位变得名不副实。
AI 行业正在经历一个尴尬的阶段:模型越来越强,但价格也在飞速上涨。Google、OpenAI、Anthropic 都在提高定价,补贴时代似乎正在终结。
苏米注:也许我们真的需要「下一个 DeepSeek 时刻」,来重新定义什么是普通人用得起的 AI。Gemini 3.5 Flash 的技术进步值得肯定,但定价策略确实让 Flash 系列失去了原有的性价比优势。对于开发者来说,选择哪个模型还是要看具体场景和预算。
数据来源
- Hacker News
- artificialanalysis.ai
- aibenchy.com
- Google AI 开发者文档