10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI编程开发

Codex CLI 接本地模型实战:填平三个坑,本地推理省钱又安全

1小时前 AI编程开发 17 0

Codex CLI 出来之后我一直想拿它接本地模型。原因很简单——不用每次跑都走 API,省钱,数据也不用往外送。

理想很丰满,现实很骨感。折腾了一下午,踩了三个坑才跑通。记录一下,给有同样需求的朋友省点时间。

环境配置

  • Windows,Codex CLI 通过 npm 安装
  • 本地推理跑在 http://127.0.0.1:8080,走 OpenAI 兼容接口
  • 模型上下文只有 8K(这是后面的大坑)

安装 Codex 一行搞定:

npm install -g @openai/codex

坑一:配置写错了地方

Codex 的配置在 ~/.codex/config.toml。初始状态大概这样:

sandbox_mode = "workspace-write"
model = "gpt-5.5"
model_reasoning_effort = "low"

要接本地模型,加个自定义 provider 就行:

model = "local"
model_provider = "local"

[model_providers.local]
name = "Local Model"
base_url = "http://127.0.0.1:8080/v1"
wire_api = "responses"      # 这个下面会说

苏米注:想切回 OpenAI 的时候不用改配置文件,命令行直接传就行:

codex -m gpt-5.5
# 或者
codex -c model_provider=openai

坑二:wire_api 已经废了

一开始我写的是 wire_api = "chat"。理由很充分——llama.cpp、vLLM 这些本地推理框架走的都是 Chat Completions 接口。

结果 Codex 直接报错:

wire_api = "chat" is no longer supported.
How to fix: set wire_api = "responses" in your provider config.

翻了官方讨论才发现,Codex 从 2026 年 2 月起已经彻底砍掉了 Chat Completions,现在只认 Responses API。

也就是说你的本地推理服务必须支持 /v1/responses。但这东西目前支持情况很尴尬:

引擎 支持情况
llama.cpp 部分支持,有转换层
LM Studio 说支持,但实测有兼容问题
vLLM 不支持
Ollama 计划中
LocalAI 不支持

如果用的引擎不支持,有这几条路:

  • 换 LM Studio,设 oss_provider = "lmstudio"
  • 用新版 llama.cpp,内部做了转换
  • 桥接代理,比如 VibeAround,把 Chat 转成 Responses
  • 降级 Codex 到 2026 年 2 月之前的版本

坑三:8K 上下文根本不够用

前两个坑填完之后信心满满启动 Codex,结果又挂了:

Request (11842 tokens) exceeds the available context size (8192 tokens)

说实话这个早有预感。Codex 这种 agent 工具,读文件、跑命令、看输出,几轮下来上万 token 是常态。8K 窗口撑不过第一轮。

这个只能在推理服务那边解决:

llama.cpp:

./llama-server --ctx-size 32768 --model your-model.gguf

vLLM:

python -m vllm.entrypoints.openai.api_server \
    --model your-model \
    --max-model-len 32768

LM Studio:打开 UI,在模型加载设置里把上下文调到 32K 以上。

总之至少 32K 起步,低于这个数别想了。

最终配置

把坑都填完之后,~/.codex/config.toml 长这样:

sandbox_mode = "workspace-write"
model = "local"
model_provider = "local"
model_reasoning_effort = "low"

[model_providers.local]
name = "Local Model"
base_url = "http://127.0.0.1:8080/v1"
wire_api = "responses"

图片 2

总结

三个坑,每个都不致命,但连在一起挺折腾的:

  • 配置写在 ~/.codex/config.toml,加 [model_providers] 段
  • 协议必须写 responses,chat 已经被砍了
  • 上下文至少 32K,太小了跑不动

说实话 Codex 对本地模型的支持还不够成熟。OpenAI 砍掉 Chat Completions 之后,接入门槛确实高了。如果引擎不支持 Responses API,最省事的方案是换 LM Studio,或者加个桥接。

苏米观察:本地显卡最少 12G 显存,模型推荐 Qwen 8B。Codex CLI 接本地模型虽然折腾,但一旦跑通,省下的 API 费用和隐私保护都是实打实的。对于注重数据安全的开发者来说,这个投入是值得的。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Codex CLI 接本地模型实战:填平三个坑,本地推理省钱又安全
#Codex CLI #本地模型 #AI编程 #Responses API #llama.cpp 
收藏 1
CopilotKit 开源:33.6K Star 的 Agentic App 基础设施,AG-UI 协议全解析
5 个 AI 联网工具合集:从社媒监控到浏览器自动化,给 Agent 装上爬网工具箱
推荐阅读
  • Anthropic开源Claude Code插件市场:200+插件覆盖全开发链,2.7万Star
  • 新手入门:深入浅出 Agent Skills 底层原理全解析(附实战案例)
  • Cursor 0.49大更新!这些超实用的功能,效率提升超快!(附新版下载地址)
  • 我的最强开发组合:Claude Code 2.0 + GLM-4.6
  • MCP实战:MCP Server + MCP Client 实现一个功能强大的 AI Agent
评论 (0)
请登录后发表评论
分类精选
手把手教你用支付宝订阅 Cursor Pro:国内用户最全开通教程(附取消自动扣费)
28457 11月前
Claude Code Rules:claude.md文件配置完全指南
21686 10月前
Claude Code + MCP 实战教程:手把手教你如何在Claude Code里面使用MCP
15719 10月前
手把手教你在VS Code & Cline/RooCode 中使用Kimi K2 模型,配置实录+开发实战体验
14991 10月前
学生党0元白嫖!手把手教你解锁Cursor Pro年VIP,超详细申请教程(附避坑指南)
14956 1年前
Cursor 0.46更新,新增支持Claude 3.7 + GPT 4.5,Cursor Pro 无限续杯攻略,全自动化工具使用说明
13800 1年前
Claude Code 官方已支持Windows系统!手把手教你免费安装使用Claude Code
13798 10月前
Cursor进阶指南:如何解决Cursor上下文长度的限制超出后”降智“问题
13544 1年前
Cursor代码生成器中文使用教程,Cursor新手入门完全指南,全网最全面详细的Cursor使用教程
13326 1年前
手把手教你在Claude Code 中使用Kimi K2 模型,超简单配置教程分享
11247 10月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Codex CLI 接本地模型实战:填平三个坑,本地推理省钱又安全
2 MumuSpec CLI 发布 npm:14 份 Spec 模板 + 五轮工作流,规范 AI 编程
3 Codex 深度使用指南:烧了 20 亿 Token 总结的 10 条实战经验
4 Claude Code Dynamic Workflows:从 Prompt 到 Loop 的 AI 编程范式转变
5 Codex Claude Code /goal 长时间运行指南:解决自动停止问题
6 Claude Code Dynamic Workflows 详解:编排复杂任务的工作流引擎
7 Superpowers 深度拆解:用语言级纪律系统解决 AI 假完成问题
8 WeSight 正式开源:统一调度 Claude Code、Codex 等 Agent 的桌面控制台
9 Claude Code vs Codex 深度对比:20% 精准编辑 + 80% 日常编码的最佳实践
10 gpt-image-2 生成大屏设计稿到代码还原:完整实现指南
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联