
作为一名AI产品经理,我一直在追踪各类AI工具的动态,而这次大会让我深刻感受到:AI已经不再是一个工具,而是逐渐成为我们生活和工作中不可或缺的一部分。
这场发布会我只能用四个字来形容:信息炸裂(长文警告!!)
Gemini 2.5 Pro Deep Think
谷歌大模型的核心升级是 Gemini 2.5 Pro Deep Think,名字很直白,“深度思考”模式就是真能“动脑子”的AI。
我看到最震撼的测试数据是它在美国数学奥林匹克(USAMO)上拿到了40.4%的分数,编程测试也达到了80.4%!这已经不仅是“会答题”,更像是会从多个角度推演和判断。作为产品经理的我瞬间想到一个用途:需求拆解 + 多路径方案推演 + 风险预估,太贴合实际了。

与此同时,轻量版的 Gemini 2.5 Flash(0520 Preview) 也上线了,在速度和成本之间做了非常好的平衡,甚至还加了个“思考预算”(有点像Qwen的那个 feature)。简直是为“跑量又要快”的日常工作场景而生。

Gemini AI Agents
过去一年,我一直在等一个“能为我行动”的AI,这次谷歌真的把它做出来了!
Project Astra(Gemini Live):
你可以直接和Gemini视频对话,它能看摄像头、听你说话、识别屏幕上的内容,还能主动提醒你哪里出错了。比如你解数学题写错了,它会说:“你是不是少写了一个平方?”——真实演示让我鸡皮疙瘩都起来了。

Project Mariner:
网页任务代理+“教与复现”功能。你手把手教它一次,后面它就会自己做了。租房对比、表格数据处理、批量查价这种琐碎复杂的事,以后完全能交给Gemini。

Jules:
这像是后台的“代码管家”,能修复bug、开发功能原型,还能自动同步到GitHub。我试着想象:以后写PRD后就能“扔给AI”去生成代码了,简直梦中情活。
AI搜索
谷歌搜索终于不只是搜索了,而是变成了一个“AI研究助手”:
-
AI模式:能总结搜索结果,支持更长、更复杂的问题。
-
Deep Search:通过多线程搜索整合全网信息,自动生成“专家报告”。
-
可视化分析:比如查询某支球队的过往表现,能自动生成图表。
-
Search Live + Agentic Checkout:可以用摄像头进行互动、帮你比价购物、虚拟试衣,未来还要支持订餐、预定行程……

作为一个懒人+效率控,我看到这里已经想给Chrome装一套“Gemini增强插件包”了。
多模态
Veo 3:
这是我最惊艳的一个更新!AI能生成4K视频还原度高就算了,现在还能带上原生音频和对白!直接把AI视频拉到了“有声电影”的新高度。
Imagen 4:
图像生成速度更快、支持多种图片比例导出,还能更精确地生成含文字的图像。感觉设计师们得快点研究下这个工具,不然PPT都没人做了。

Flow:
这是新出的AI影视创作App,可以把Imagen生成的图、Veo生成的视频、Gemini的脚本结合起来,制作短片,还能直接剪辑、调色,真的一条龙全包!
XR眼镜
-
Chrome浏览器、Gmail、NotebookLM……Gemini现在无处不在,甚至还能个性化你的邮件语气。
-
Gmail还能从Drive、邮箱历史中抓取上下文来辅助回复,简直就是“有逻辑的自动草稿箱”。
最让我兴奋的,是这个——Android XR平台+AI智能眼镜:

谷歌宣布与三星、XREAL等合作,发布了几款XR头显和智能眼镜原型,内置Gemini,具备翻译、导航、识物、视频直播等功能。演示中,眼镜能实时翻译对话并显示字幕,配合语音助手简直像是科幻片走进了现实。
AI Ultra
谷歌这次还放了个“氪金终极包”——Google AI Ultra,月费249.99美元,直接对标ChatGPT Pro和Claude Max。

这个套餐包含:
-
Gemini 2.5 Pro Deep Think
-
Veo 3、Project Mariner试用
-
YouTube、NotebookLM、30TB网盘
未来
这次大会让我们看到了AI的无限可能。从深度思考到多模态协同,从编程到代理模式,Gemini 2.5 Pro正在重新定义AI的能力边界。从搜索到代理、从多模态创作到XR设备,谷歌已经不满足于“回答问题”,而是要打造一个“主动型AI生态”。对我这种一边做产品一边沉迷AI探索的人来说,谷歌的路线图太诱人了。
作为一名产品经理,我对Gemini的未来充满期待。它不仅是一个AI工具,更是一个全新的生态系统,它将AI的能力融入到我们生活的方方面面,让我们能够更高效、更智能地工作和生活。