Codex桌面端使用教程:安装配置与功能详解
Codex桌面端是一款专为开发者打造的AI编程工具,最初仅支持macOS苹果芯片,目前已扩展支持Intel芯片、Windows和Linux平台。本文详细介绍Codex桌面端的安装、配置及各项功能的使用方法。
当前使用版本:26.513.20950 (2816)
注意:macOS Intel芯片用户升级到最新版本后,电脑控制和浏览器功能可能出现无法使用的提示,请根据自身需求谨慎升级。
优势
- 多平台兼容,支持macOS(苹果芯片、Intel芯片)、Windows、Linux
- 支持API Key授权登录
- 支持MCP、Skills、Hooks、自动化、电脑控制等功能
- 内置Codex浏览器和可视化交互调试功能
限制
- 暂时没有提供Checkpoint
- 不支持文件编辑
简介
Codex是一款专为开发者打造的桌面端AI编程控制中心,集成了Git工作区(worktree)支持、自动化任务流以及强大的终端与操作功能,能够让开发者在本地或远程环境中并行、多项目交替进行高效的代码编写、Debug和版本交付。
官方文档:https://developers.openai.com/codex/app

安装
根据系统下载对应的安装包,双击安装包将应用程序拖拽到【Applications】。


安装完成后启动Codex,在配置导入界面可以选择跳过,直接点击【Skip】。

初始化完成后即可进入Codex主界面。

基本使用
登录授权
如果没有配置过Codex CLI全局授权方式,首次进入Codex桌面端界面会提供4种登录授权方式:【使用ChatGPT继续】、【使用Google继续】、【使用Microsoft继续】和【使用其他方式登录】(其他方式为API Key授权)。

如果之前使用CC Switch配置了API Key授权,首次打开Codex桌面端看到的可能是已授权状态。

也可以点击【Settings】→【Log out】退出登录重新授权。Codex桌面端提供了【使用ChatGPT账号】和【输入API密钥】两种官方授权方式。

基础设置
点击左下角【Settings】进入设置界面,可以对工作模式、权限、语言、主题等进行配置。

Codex桌面端支持中文,配置完成后重启Codex即可看到中文界面。

额度查询
Codex针对ChatGPT账号登录的用户提供了额度查询功能,点击【设置】展开【剩余额度】即可查看账户额度。

工作区配置
Codex桌面端的工作环境可以选择工作区,也可以不使用工作区。点击【进入项目工作】选择【新建空白项目】创建一个工作区,也可以选择【使用现有文件夹】打开一个工作区。

打开工作区后,可以在左侧侧边栏看到项目列表。

已打开的工作区也可以在对话窗口中切换不同项目。

不使用工作区时,Codex桌面端会在临时工作区目录执行。

点击顶部的【终端】可以在Codex桌面端打开命令行终端。

点击侧边栏可以看到侧边栏提供的【打开文件】、【侧边聊天】、【浏览器】功能。

打开文件可以预览文件内容,但只能预览无法编辑。

侧边聊天可以在侧边栏新开聊天窗口。

浏览器可以在侧边栏打开内置浏览器。

Codex为Git管理的项目提供了更多功能,点击IDE可以选择使用指定IDE打开项目。

Codex还提供了Git管理相关操作,包括代码变更、分支管理、提交等。

可以查看代码diff、暂存、代码还原。

还可以提交代码。

引导
复杂任务执行过程中,Codex会提示审查操作。当发现AI的操作偏离预期时,可以点击【引导】输入提示词,重新让AI按照要求执行。


聊天对话
Codex桌面端对话窗口提供了上下文管理、权限管理、上下文用量、模型选择等功能。

在聊天对话框输入提示词即可进行对话。

点击【+】添加上下文,可以添加照片、文件及插件到上下文,也可以开启计划模式。

权限管理提供了默认权限、自动审查、完全访问权限三种权限模式。

默认权限模式下遇到权限问题会主动询问权限。

创建HTML页面后,Codex会主动提供快速打开入口。

点击【打开】可以在右侧直接打开内置浏览器预览。

可以查看可视化上下文窗口信息。

模型选择可以自由切换不同的GPT模型。

计划模式
使用计划模式,首先需要开启。点击【+】→【计划模式】开启计划模式。

开启后,在对话框输入"我想开发一个宠物网站",Codex会分析需求并通过交互式引导询问相关意图,首先提出多个问题。

点击问题上的感叹号可以查看对应问题的关键词。

计划任务完成后,Codex会提供一份详细的开发计划。

分叉
Codex桌面端在对话记录中提供了【分叉】功能,该功能可以在当前对话记录基础上开启一个新会话,新会话会包含之前对话的所有上下文信息。

宠物
进入Codex设置界面,切换到【外观】找到【宠物】,选择一个自己喜欢的宠物。

点击【唤醒宠物】,稍等片刻即可在屏幕上看到一个动态宠物。不需要宠物时点击【收起宠物】即可关闭。

Codex执行任务时宠物同步展示任务进度。

自动记忆
当任务结束时,记忆可能不会立即更新。Codex会等待线程闲置足够长的时间,以避免总结仍在进行中的工作。在Codex速率限制剩余百分比低于配置阈值时跳过后台传递,因此当接近限制时,Codex不会消耗配额进行总结记忆。
记忆允许Codex将任务执行中有用的上下文带到未来的工作中。启用回忆后,Codex可以记住稳定的偏好设置、重复的工作流程、技术堆栈、项目规范和已知的问题,这样就不需要在每个线程中重复相同的上下文。
自动记忆文件位于 ~/.codex/memories/ 目录下,包括摘要、持久条目、最近的输入以及来自先前线程的支持证据。



内置浏览器
Codex桌面端内置了浏览器,可以通过AI自动开启也可以手动开启。点击【右侧边栏】→ 点击【+】打开下拉菜单,选择【浏览器】即可打开内置浏览器。

和浏览器使用方式一样,输入地址即可打开网页。

内置浏览器提供了截图、注释等功能。

点击【注释】会出现元素选择效果,选择DOM元素可以进行打标和评价。提交时提供了发送和添加操作,只有一个修改点时可以直接回车发送,Codex会直接进行修复。

当有多个修改点时可以使用【Cmd+Enter】添加修改点,最后在对话框统一修复。

修复完成后效果。

需要注意的是,注释在修复呈现时使用的是截图而非指定的DOM节点,有时会出现识别异常的情况。

插件
Codex的插件功能需要登录ChatGPT账号才能使用。没有ChatGPT账号时插件功能处于未激活状态。

登录ChatGPT账号后插件功能会处于激活状态。在新版本中【技能】被放到了插件入口。

插件界面提供了插件、技能的安装和管理等功能,点击【管理】可以查看和管理已安装列表。


也可以点击【创建】创建插件和技能。

MCP服务
进入Codex设置界面,点击【MCP服务器】进入MCP服务器列表,默认会展示已添加的MCP服务。

点击【+添加服务器】配置MCP信息。

以Context7 MCP为例,配置信息完成后点击【保存】。

保存成功后重启Codex即可看到添加的MCP服务。

输入提示词即可调用MCP服务。

Skills
在Codex桌面端首页点击【技能】进入技能列表,默认展示已安装的技能。

下方还有官方推荐的技能,点击技能后的【+】可以一键安装。

点击技能右上方的【+新技能】会一键调用Skill Creator技能,修改提示词即可创建新的技能。

Hooks
Hooks是Codex的一个扩展框架,允许将自定义脚本插入到代理循环中,从而实现各种功能。
Hooks功能默认是开启的,如果需要开启或关闭可以修改config.toml配置:
[features]
codex_hooks = false
Codex Hooks支持全局和项目两种配置方式:
- 全局配置:针对当前用户生效,路径:
~/.codex/hooks.json或~/.codex/config.toml - 项目配置:针对当前项目生效,路径:
.codex/hooks.json或.codex/config.toml
Codex Hooks支持如下6种钩子:
- SessionStart:在会话开始(启动、恢复或清除后重新开始)时执行。常用于加载工作区约定或初始化日志。
- UserPromptSubmit:在用户提交提示词但尚未发送给模型之前执行。常用于扫描敏感信息(如API Key)或根据目录自定义提示内容。
- PreToolUse:在工具(如Bash、文件编辑、MCP工具)实际执行之前执行。可以作为"防护栏",用于拦截危险命令或添加额外的执行上下文。
- PermissionRequest:在Codex准备向用户请求操作许可(如提权或网络访问)时执行。可以自动允许或拒绝请求,从而减少人工确认的频率。
- PostToolUse:在工具执行并产生输出之后执行。可以审查工具运行的结果,若结果不符合预期,可以要求模型重新尝试或进行修正。
- Stop:在对话轮次(Turn)即将结束时执行。可以强制模型继续思考,例如在发现测试仍未通过时,自动生成新的提示让模型继续修复。
Codex Hooks提供了JSON和Toml两种配置文件格式,可以根据自己的偏好选择。hooks.json配置格式如下:
{
"hooks": {
"PreToolUse": [
{
"matcher": "^Bash$",
"hooks": [
{
"type": "command",
"command": "python3 ~/.codex/hooks/check_safety.py",
"statusMessage": "正在检查命令安全性...",
"timeout": 30
}
]
}
]
}
}
config.toml配置格式如下:
[[hooks.PreToolUse]]
matcher = "^Bash$"
[[hooks.PreToolUse.hooks]]
type = "command"
command = 'python3 ~/.codex/hooks/check_safety.py'
timeout = 30
statusMessage = "正在检查命令安全性"
以下以PreToolUse为例,在工具调用前给出提示:
{
"hooks": {
"PreToolUse": [
{
"matcher": "^Bash$",
"hooks": [
{
"type": "command",
"command": "osascript -e 'display notification \"Pre Tool Use\" with title \"Codex Desktop\" sound name \"default\"'" ,
"statusMessage": "Pre Tool Use Hook Triggered",
"timeout": 30
}
]
}
]
}
}
重启Codex桌面端后,会弹出钩子权限审查,选择【Trust all】。

输入提示词如"ls",当Codex执行指令时就会调用这个钩子。

自动化
点击【自动化】进入自动化列表界面,默认展示官方推荐的自动化示例。

点击案例内容,可以看到包含提示词、工作环境等相关配置。

点击右上角【+新建自动化功能】创建一个自动化,以从Github Trending获取热门项目为例,输入提示词:
从Github Trending(trending.github.com)抓取热门项目信息,包含项目名称、语言类型、star数、fork数、today star数。选择运行环境、工作项目、执行时间、模型和推理强度,最后点击【创建】。

创建完成后,在自动化列表可以看到已创建的自动化任务列表。在自动化任务列表可以对任务进行执行、修改、停用等操作。

执行完成后效果如下:

电脑操控
进入设置界面,选择【电脑操控】,点击Chrome的【安装】。

点击弹窗上的【安装Chrome】。

安装成功后,点击【打开】配置Chrome对应的Codex插件。

Codex桌面端会打开Codex插件安装界面,点击【Add to Chrome】安装浏览器扩展。

安装完后,打开Codex扩展插件查看状态,保证插件处于正常连接状态。

配置完成后,回到Codex确保Google Chrome也处于正常连接状态。

回到对话窗口,输入 / 找到 Chrome:Chrome。

输入提示词即可操控浏览器。

执行完成后效果如下:

当Codex操控浏览器时,浏览器中会展示Codex标识。

连接
进入Codex设置,切换到【连接】。

点击【Add】添加SSH连接配置,如果全局配置了SSH,这里会展示配置列表。

也可以点击【手动添加】配置一个新的连接,填写显示名称、主机名和身份文件路径。

连接后的效果如下:

选择远程项目输入提示词即可。
Codex历史版本
有需要的小伙伴可以自行下载:https://pan.quark.cn/s/ea9b32048698