如果说 2024 年是 AI 写代码的“大力出奇迹”时代,那 2026 年的 Coding Agent 赛道已经进入了一个更成熟、也更务实的阶段——拼到最后,拼的是“工作纪律”。
很多人第一次用 Claude Code、Codex CLI、OpenCode 这类 Coding Agent 时,都会有一个兴奋时刻:丢给它一个任务,它真的会读文件、改代码、跑测试、看报错,再继续修。但兴奋之后,很快会遇到另一面:它可能没问清需求就开写,可能没有设计直接改一大片,可能测试没红过代码先写完了,也可能说“完成了”但其实没有跑验证。
这就是 Coding Agent 的经典失败模式:just start coding。不是模型不聪明,而是工作方式太野。
所以在 2026 年的 Agentic Coding 赛道里,除了底层 Coding Agent,还长出了一个很重要的中间层:Coding Harness(编码增强框架)。它不造模型,也不替代 Claude Code 或 Codex,它做的是把软件工程里的隐性纪律,变成 agent 会自动遵守的 skills、hooks、rules、subagents、workflow 和质量门。
一句话:Coding Agent 负责干活,Coding Harness 负责让它像个靠谱工程师一样干活。
越能干,越需要纪律
你可以把 Coding Harness 想成 AI 编程工具上方的一层“工程操作系统”。它关心的不是“能不能写代码”,而是:写之前要不要澄清需求?要不要先做 plan?要不要开独立 worktree?要不要强制 TDD?谁来 review?怎么防止 agent 偷懒?失败了怎么继续循环?多个 agent 怎么分工?长任务怎么保持状态?
真正的工程团队不会让一个新人拿到需求就直接改主分支,也不会让他写完一句"done"就合并。AI Agent 也一样。越能干,越需要纪律。
两条路线:方法论 vs 重型编排
这一层的工具大致分成两派。
第一派:方法论/技能叠加层。代表是 Superpowers。它的核心不是“多几个命令”,而是一套强约束开发流程:brainstorm、plan、worktree、TDD、subagent 执行、review、finish。它像是在 agent 旁边放了一个严格的 tech lead:“先别写,想清楚。”“测试先红。”“计划拆小。”“让另一个 agent 做审查。”Superpowers 的特点是克制但硬,它不追求把所有功能都塞进去,而是反复强调一件事:把 agent 从“马上写代码”拉回“先做工程判断”。
第二派:重型编排运行时。代表包括 Everything ClaudeCode、Oh My OpenAgent、oh-my-claudecode、oh-my-codex。这一派更像“把单个 agent 扩成一个团队”。它们会加大量 skills、agents、hooks、rules,支持多 agent 分工、tmux 或 worktree 并行、memory 持久化、自动验证循环、安全扫描、模型路由等。如果 Superpowers 像一套开发纪律,那这些项目更像一台复杂的工程机器。你给它一个大任务,它尝试自动规划、拆分、并行、验证、修复,甚至跨模型协作。
苏米注:这两种路线其实反映了 AI 工具发展的两种哲学。一种是“做减法”,通过约束流程来保证质量;另一种是“做加法”,通过增加能力来覆盖更多场景。对于大多数团队来说,可能更需要前者——因为 AI 现在最不缺的就是“能力”,最缺的是“克制”。
选型指南:不要问“哪个最强”
更好的问题是:你现在的 agent 失败在哪里?
- 如果失败在“不思考直接写”,选 Superpowers。
- 如果失败在“缺少统一配置、记不住上下文、质量门不够”,看 ECC。
- 如果失败在“大任务推进慢、想跨模型并行”,看 Oh My OpenAgent。
- 如果你已经是 Claude Code 重度用户,想要团队模式,看 oh-my-claudecode。
- 如果你已经是 Codex CLI 重度用户,想要工作流增强,看 oh-my-codex。
个人开发者不要一上来就全装。先用原生 Coding Agent 跑几天,观察自己最常见的失败模式。如果你发现 agent 经常没想清楚就动手,装 Superpowers。如果你已经有大量配置想系统化,试 ECC 的轻量安装。如果你真的需要一夜跑大任务,再考虑 OMO/OMC/OMX 这种重型编排。
结语:让 AI 不只是会写代码,而是会好好工作
2026 年的 Agentic Coding 已经进入第二阶段。第一阶段我们问:“哪个 AI 会写代码?”第二阶段我们开始问:“哪个 AI 会按工程纪律交付?”Coding Harness 这一层,正是这个转折点。
模型越强,越不能只靠模型。因为真实交付从来不只是聪明。真实交付靠的是:想清楚、拆得开、测得过、审得住、出了问题还能继续修。
接下来一年,Agentic Coding 的竞争重点不会只在模型榜单上。它会越来越多地落到这些看起来“不性感”的东西上:skills、hooks、workflows、reviews、memory、verification loops。也就是一句话:让 AI 不只是会写代码,而是会好好工作。