本次更新带来了一系列关键性改进,让 Gemini CLI 变得更加强大、易用和美观
音视频处理预告
这次更新最让我期待的功能,是 CLI 对音频和视频输入的支持。虽然目前还没完全上线,仍处于“预告阶段”,但能看到官方正在为多模态交互铺路,已经是个很明确的信号。
我试着拖了几个文件进去测试,音视频部分暂时还是“敬请期待”,不过文本、PDF、图片的解析处理非常流畅。尤其是 PDF 支持,配合 CLI 使用,效率提升还挺明显的。
Markdown增强
这一块更新对我这种经常写文档、笔记、提纲的用户来说非常实用。
-
表格渲染: 之前 Markdown 表格在终端里总是显示乱七八糟,新版已经能完整、规整地渲染出来了。终端看着舒服,信息一目了然。
-
@ 导入功能: 可以在一个 Markdown 文件中用
@文件名
引入其他.md
文件了,像组件一样复用内容,非常适合搭知识库、整理项目笔记的场景。
开发工具兼容
新版本对开发者也非常友好,更新内容包括:
-
集成 VSCodium 和 Neovim: 可以直接从 CLI 里调用这些编辑器修改内容。对我来说,有时候临时想改点 Prompt 或脚本,切换窗口实在太麻烦,现在一条命令就能跳进熟悉的编辑器环境,舒服多了。
-
底层框架升级: 升级到了 Ink 6 和 React 19,性能更好,响应速度比旧版本快了不少。
更多功能
全新主题: 引入了由 Ahmad Awais 打造的 “Shades of Purple” 主题。CLI 的颜值直接上了一个台阶,看着顺眼,提升工作幸福感。
隐私命令: 新增 /privacy
命令,可以直接查看和修改自己的隐私设置。对数据比较敏感的用户来说,终于有了更多的控制权。
历史记录压缩重构: 减少空间占用,提升加载效率。
无限循环保护: 加入机制防止程序卡死。
支持带 Header 的 Http MCP: 网络配置的灵活度提升,适配更多高级用户的需求。
如何升级
打开终端运行以下命令即可升级:
npm i -g @google/gemini-cli
总结
这次更新虽然部分功能(比如音视频)还没完全开放,但从趋势上能看出 Gemini CLI 正在努力变成一个真正多模态、可拓展、兼顾开发和内容创作的 AI 工具平台。
期待音视频功能的正式上线,也期待Gemini CLI在多模态交互方面能给我们带来更多惊喜。毕竟,好的工具应该像好朋友一样,不仅能帮你解决问题,还能让你在使用过程中感到愉悦。