10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI编程开发

Codex 接入本地 Gemma 4 实战:离线写代码,成本降到几乎为零

1小时前 AI编程开发 9 0

今天我把 OpenAI Codex 的本地模型切换到了 Gemma 4。体验下来的结论是:它不适合完全替代云端最强模型,但非常适合做一件事——把日常、低风险、高频的代码工作放到本地跑。

比如解释代码、修复小 bug、生成脚手架、写测试、做简单重构。这些任务以前都会消耗云端额度,现在可以交给本地模型慢慢处理,成本几乎为零。

Codex CLI 本身就是一个可以在终端里运行的编码代理,能读取项目、修改文件、执行命令;Gemma 4 是 Google DeepMind 的开放模型系列,官方定位包含本地运行、编码、推理和 agentic workflows 等场景。

图片 1

为什么选 Gemma 4 27B 而不是 12B?

Gemma 4 27B 采用 MoE(混合专家)架构,总参数 27B,但每次推理只激活约 4B 参数。这意味着:

  • 推理速度接近小模型——活跃参数少
  • 能力接近大模型——总知识量大
  • Q4_K_M 量化后约 17GB——Apple Silicon 统一内存 36GB 的设备完全够用

如果你的设备内存只有 16GB,可以选择 Gemma 4 12B 版本。

为什么要这样搭配?

这不是为了"完全离线替代 GPT-5 / Codex 默认模型",真正的价值是分层使用:

  • 复杂架构设计、跨文件大改、线上事故排查:继续用云端强模型
  • 代码解释、小范围修改、生成测试、批量清理:交给本地 Gemma 4
  • 敏感仓库初步阅读:先本地跑,确认需要再切云端

图片 2

这样做的好处很直接:便宜、私密、可控,而且没有每次提问都在心里计算额度的压力。

准备环境

最简单的链路是:Codex CLI → Ollama → Gemma 4

安装 Ollama

brew install ollama

安装完成后启动服务:

brew services start ollama

拉取 Gemma 4

如果你有 36GB 以上内存,推荐 27B 的 Q4 量化版本:

ollama pull gemma4:26b-a4b-it-q4_K_M

如果内存 16GB,选 12B 版本:

ollama pull gemma4:12b

拉取完成后可以验证:

ollama list | grep gemma4

安装或升级 Codex

图片 3

如果还没有 Codex CLI:

curl -fsSL https://chatgpt.com/codex/install.sh | sh

然后在项目目录里启动:

codex

Codex CLI 支持通过 --oss 使用本地开源模型,内置了对 Ollama 的支持。

临时使用 Gemma 4

直接一行命令:

codex --oss --local-provider ollama -m gemma4:26b-a4b-it-q4_K_M

注意:ollama 是 Codex 的内置 provider,不需要在 ~/.codex/config.toml 里手动定义。如果你在配置文件的 model_providers 中添加了 ollama,反而会报错:model_providers contains reserved built-in provider IDs: ollama。

进入之后可以让它做一个低风险任务:

阅读这个项目,告诉我启动入口、核心模块和测试命令。

或者:

给这个函数补一组单元测试,不要改业务逻辑。

设置为本地默认模型

如果希望每次都默认走本地模型,编辑 ~/.codex/config.toml:

model = "gemma4:26b-a4b-it-q4_K_M"
model_provider = "ollama"

之后直接运行 codex 就会默认走本地 Ollama 里的 Gemma 4。

踩坑记录

实际配置过程中遇到的几个问题:

  • wire_api = "chat" 已废弃——新版 Codex 要求所有 provider 使用 wire_api = "responses"。如果你在配置自定义 provider 时用了 "chat",会直接报错
  • 不能覆盖内置 provider——ollama 和 lmstudio 是 Codex 内置的 provider ID。如果你在 [model_providers.ollama] 下写了自定义配置,会报 Built-in providers cannot be overridden 错误。解决方法:删掉自定义配置,直接用 --local-provider ollama 即可
  • codex resume 会话与 provider 绑定——如果你用 --oss 创建了一个本地模型会话,之后在同一目录不带 --oss 直接 codex resume,Codex 会尝试用默认云端 provider 去处理本地模型生成的历史上下文,导致报错。解决方法:用 codex resume --oss 重新加载本地会话

总结

Codex + Ollama + Gemma 4 的组合不是要取代云端模型,而是帮你把日常编码任务分流到本地。对于高频、低风险的代码工作,本地跑既省钱又保护隐私,额度焦虑也不存在了。

如果你也在用 Codex CLI,不妨试试把本地模型接上去,日常体验会很不一样。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Codex 接入本地 Gemma 4 实战:离线写代码,成本降到几乎为零
#Codex #Gemma 4 #Ollama #本地模型 #AI编程 
收藏 1
Orca:7.3K Star 的 AI 编程总控台,让 Claude Code 和 Codex 并行工作
OpenAI 内部数据:ChatGPT 只剩 0.2%,Agent 已成 AI 默认工具
推荐阅读
  • Hermes Agent VS OpenClaw,2026 年,个人 AI Agent 双雄时代,会自我进化的个人 AI 助手
  • OpenCode深度实测:Claude Code最强开源平替!真正工程友好的AI编程智能体
  • 超强 Claude Code 从入门到精通:26 个核心功能与技巧
  • ACE:最强上下文引擎 Augment Context Engine,已支持主流的 AI 工具进行集成
  • Claude Code Hooks 配置指南:让 AI 主动推送飞书/如流通知
评论 (0)
请登录后发表评论
分类精选
手把手教你用支付宝订阅 Cursor Pro:国内用户最全开通教程(附取消自动扣费)
29418 1年前
Claude Code Rules:claude.md文件配置完全指南
22021 11月前
Claude Code + MCP 实战教程:手把手教你如何在Claude Code里面使用MCP
15973 11月前
手把手教你在VS Code & Cline/RooCode 中使用Kimi K2 模型,配置实录+开发实战体验
15628 11月前
学生党0元白嫖!手把手教你解锁Cursor Pro年VIP,超详细申请教程(附避坑指南)
15591 1年前
Cursor进阶指南:如何解决Cursor上下文长度的限制超出后”降智“问题
14215 1年前
Claude Code 官方已支持Windows系统!手把手教你免费安装使用Claude Code
14077 11月前
Cursor 0.46更新,新增支持Claude 3.7 + GPT 4.5,Cursor Pro 无限续杯攻略,全自动化工具使用说明
14044 1年前
Cursor代码生成器中文使用教程,Cursor新手入门完全指南,全网最全面详细的Cursor使用教程
13649 1年前
手把手教你在Claude Code 中使用Kimi K2 模型,超简单配置教程分享
11512 11月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Codex 接入本地 Gemma 4 实战:离线写代码,成本降到几乎为零
2 Spec-Kit 规格驱动开发:用结构化契约消除 AI 开发返工
3 OpenAI Codex 本地日志 Bug 预警:一年消耗 640TB 写入,教你三招紧急自救
4 Codex 上线了 Handoff(接力)功能,关机也能继续跑任务,跨设备无缝接力开发
5 CodeX 自动化实战:3 个定时任务搞定竞品追踪、SEO 分析和宣传灵感收集
6 Claude Code 接入 Google 搜索 MCP:终端内直接搜索的完整教程
7 Electron vs Tauri vs NW.js 对比:2026 桌面跨平台框架选型指南
8 Codex 设计新玩法:用 Design.md 解决 AI 生成的样式不一致问题
9 SmsForwarder:微信收款自动通知服务器:不懂 Android 开发也能定制自己的 App
10 Claude Code 编程 10大踩坑经验:用好这些 Skill 效率翻倍
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联