10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

Codex 6连更:AI 看屏、锁屏控制、自主干一整天

1小时前 AI最新动态 12 0

OpenAI 在周四的「Codex Thursday」更新中,一口气发布了 6 个重要功能。这次最引人注目的不是新模型,而是一个快捷键——双击 Command,让 Codex 直接「看」到你在干什么。加上 Goal 模式正式毕业、锁屏状态远程操控 Mac、团队插件共享等一系列改动,Codex 正在从「写代码的工具」变成「住在电脑里的搭档」。

图片 1

Appshots:双击 Command,让 AI 看到你的屏幕

这次更新最亮眼的功能。以前跟 AI 编程助手协作,最烦的是给它上下文——你得把报错截图、复制代码、描述问题,光「喂信息」就花掉一半时间。

Appshots 的解决方式粗暴但管用:在 Mac 上,同时按一下左右 Command 键,Codex 会自动截取当前最前面那个应用窗口的截图 + 提取其中的文字内容,直接塞进对话里。

图片 2

关键细节:

  • 不只截你看得见的部分,窗口里滚动区域之外的文字内容也会被提取,Codex 能拿到的上下文远比你手动复制粘贴多。
  • 所有 Mac 计划(Free/Pro/Team)都能用,企业版后续上线。
  • 操作路径极短:双击 Command → 选窗口 → 自动附带截图+文字到对话。

苏米注:这个功能解决的是人机协作里最大的摩擦——上下文传递。与其你费劲描述「我的 Figma 里这个按钮的颜色不对」,不如让 AI 直接看一眼。

图片 3

Goal 模式正式毕业:让 AI 干几个小时甚至几天

之前是实验性功能,现在正式上线了,覆盖 Codex 桌面应用、IDE 插件和 CLI 三端。

Goal 模式解决的问题也很明确:有些任务不是一个回合能搞定的。比如「重构这个模块的认证逻辑」,可能需要跨好几个文件,涉及数据库 migration、API 变更、前端适配……传统模式下你得一步步指挥。Goal 模式下,你给 Codex 定一个目标,它会自己规划、自己执行、自己检查,中间你随时可以介入调整方向。

几个实用技巧:

  • Side chat:开一个侧边对话查看当前任务进展,不打断主任务。
  • Pause & Steer:中途暂停、调整方向,不用从头来。
  • 跨时间持久:目标可以跨小时甚至跨天,Codex 会记住进度。

从 Codex CLI 0.133.0 的 changelog 来看,Goal 模式这次是实打实地做了底层重构——有了专门的 Goal 存储数据库,进度跨会话追踪,不再是之前靠上下文窗口「硬记」的土办法。

图片 4

图片 5

锁屏远程操控:人走了,AI 还在干活

这个功能有点科幻感——你的 Mac 锁屏了,Codex 还能继续操作桌面应用。甚至可以从手机上的 Codex Mobile 远程操控。

Codex 的 Computer Use 不是简单的远程桌面,而是一套完整的 GUI 操作系统:它能看到屏幕、截图、操作窗口菜单、模拟键盘输入、读取剪贴板。前提是你授予了 macOS 的屏幕录制和辅助功能两项权限。

锁屏模式(Locked Computer Use)的核心原理:Codex 安装了一个 Apple authorization plug-in,参与 macOS 的解锁流程。但设计上非常克制——它不是一个通用的远程解锁通道,别人(或其他应用)没法通过这个机制解锁你的 Mac。只有 Codex 在活跃的、受信任的 Computer Use turn 内,才能触发临时解锁。

安全机制做了几层:

  • 短时授权窗口:解锁窗口只在当前尝试期间生效,不是一直开着。
  • 仅限 Codex:自动解锁只对 Codex 的 Computer Use turn 开放,其他应用/进程无法利用。
  • 覆盖所有显示器:临时解锁期间,所有屏幕都会被覆盖显示,防止信息泄露。
  • 本地输入立即中断:一旦检测到本地键盘或鼠标输入,立刻重新锁定并暂停自动解锁。
  • 手动解锁兜底:遇到任何异常,手动解锁即可完全接管。

典型场景:你在公司跑着 Codex 做前端调试,下班锁屏走人。回家路上掏出手机,打开 Codex Mobile 看看进展,甚至远程点两下让它改个配色。人不在电脑前,活照样干。

浏览器标注升级:设计师终于能精准反馈了

Codex 内置浏览器做了一波体验优化,重点在「标注」功能:

  • 直接调整页面元素:不用口头描述「这个字太小了」,直接在页面上改字号、颜色、间距,Codex 能看到你的修改。
  • 即时预览:改完马上看到效果,不用等一个完整的 turn。
  • 批量标注:一次性标记多处需要修改的地方,不用来来回回说。

配合 Chrome 扩展的改进——不再创建标签组(之前很多人吐槽这个),改用标签图标显示状态,Windows 可靠性也修了一波。

苏米注:对设计师和前端开发者来说,这个更新大幅降低了「说清楚我要什么」的成本。

图片 6

团队插件共享

Business 用户现在可以把自建插件分发给整个团队了。Plugin 里可以包含技能、应用集成和 MCP 服务器。

Enterprise 版本还在路上,但方向很明确:把 Codex 从个人工具变成团队基础设施。团队内部的工具链、代码规范、部署流程,都可以打包成插件统一分发。

Analytics 升级:老板终于知道钱花哪了

这次还给 Business 和 Enterprise 加了更详细的分析面板:

维度 说明
活跃用户 谁在用、用了多少
Credits 消耗 Token 用量一目了然
代码行数 AI 生成了多少代码
插件使用率 哪些插件最受欢迎
用户排行榜 团队里的 AI 使用达人

配合 Analytics API,企业可以把 Codex 用量集成到自己的内部看板。

苏米观点

把这 6 个更新串起来看,一条暗线很清楚:Codex 正在从「代码生成器」变成「开发操作系统」。

Appshots 让 AI 获得了视觉上下文 → Goal 模式让 AI 能长期自主执行 → 锁屏控制让 AI 不受物理位置限制 → 浏览器标注让 AI 理解设计意图 → 插件共享让团队标准化 → Analytics 让管理层看得见 ROI。每一环都在降低「人指挥 AI」的成本,提高「AI 自主干活」的上限。

当然也有槽点——Appshots 和锁屏远程控制目前都是 Mac Only,Chrome 扩展在 Windows 上的稳定性还刚修完。OpenAI 的产品节奏明显跟着苹果生态走,这事儿短期内改不了。

AI 编程赛道的竞争已经从「谁的模型写代码更准」升级到「谁的开发体验更丝滑」——而体验的关键,是减少你描述需求的时间,增加 AI 执行的时间。

参考链接:

  • Codex 官方 Changelog
  • OpenAI Developers 官方推文
  • Codex CLI 0.133.0 Release
  • Codex Appshots 文档
  • Codex Computer Use 文档(含锁屏模式)
声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Codex 6连更:AI 看屏、锁屏控制、自主干一整天
#Codex #OpenAI #AI编程 #Computer Use #Goal模式 
收藏 1
DataBuddy:腾讯云大数据智能体工作台,对话即交付
OpenCode Go:10 美元/月的统一模型订阅,值得重度开发者入手吗?
推荐阅读
  • OpenAI Codex:云端 AI 编程助手的“返祖”
  • SuperCLUE团队:中文大模型基准测评2024年度报告(报告下载)
  • Cursor一发三连:免费 GPT-5、Cursor CLI、Cursor 1.4王炸发布!
  • 字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
  • LangChain Deep Agents v0.5 + Deploy 详解:异步子 Agent 与一条命令部署生产环境
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
30035 10月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
27077 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
18623 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
18474 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15707 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
15124 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
14684 10月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
14346 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
13980 1年前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
12115 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Anthropic 3 亿美元收购 Stainless:MCP 生态的接口革命
2 OpenCode Go:10 美元/月的统一模型订阅,值得重度开发者入手吗?
3 Codex 6连更:AI 看屏、锁屏控制、自主干一整天
4 Gemini 3.5 Flash发布:速度碾压GPT但价格翻3倍开发者炸锅
5 智谱 GLM-5.1 高速版上线,全球最快旗舰API,7倍提速开始喷代码
6 Karpathy 加入 Anthropic:AI 领域关键人物重回研发一线
7 Qwen3.7 Preview 曝光:Arena Text 排名 13,Vision 排名 16
8 谷歌发布 Gemini 3.5 Flash:速度快4倍,定价仅为竞品一半
9 中国电信推出AI Token套餐:39.9元1500万Token,网友吐槽太贵
10 Anthropic发布 AI 原生创业公司手册:一人公司的完整方法论
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联