Harness Engineering(驾驭工程)
定义
Harness Engineering 是 OpenAI 于 2026 年 2 月提出的概念:工程团队的首要工作不再是编写代码,而是让 Agent 能够有效工作。当出现问题时,解决方案从不是"再努力一把",而是:缺少什么能力?如何让 Agent 能够理解并执行?
核心原则
从代码产出到系统构建
| 传统工程 | Harness Engineering |
|---|---|
| 工程师编写代码 | 工程师构建让 Agent 写代码的系统 |
| "AI 如何帮助工程师?" | "如何重构一切,让 AI 负责构建?" |
| 人工审查每行代码 | 系统化审查门控 + 人工审查战略风险 |
| 问题 → "再努力一把" | 问题 → "缺少什么能力?如何让 Agent 理解并执行?" |
与 Vibe Coding 的根本区别
Vibe Coding(打开 Cursor,提示直到跑通,提交)只能产出原型。生产系统需要稳定、可靠、安全——你需要一套能在 AI 写代码时保证这些属性的系统。你构建的是系统,提示词只是消耗品。
两个关键区分
- AI-Assisted(AI 辅助):把 AI 嫁接到现有流程上,效率提升 10-20%,结构不变
- AI-First(AI 优先):围绕"AI 是主要构建者"重新设计流程、架构和组织,差距是量级上的
实践框架(CREAO 案例)
架构决策:Monorepo 统一
碎片化代码库对 Agent 不可见——Agent 看不到全貌,无法推理跨服务影响,无法运行集成测试。统一代码库使 Agent 可检查、可验证、可修改。
碎片化的代码库对 Agent 来说是不可见的,统一的代码库才是可读的。
自愈反馈循环
检测(CloudWatch/Sentry)→ 分诊(AI 聚类+评分)→ 工单(Linear 自动创建)
→ 修复(工程师验证+推送)→ 审查(3轮 Claude AI 审查)
→ CI/CD(6 阶段流水线)→ 验证(分诊引擎重检)→ 自动关闭工单
每个工具处理一个阶段,没有工具试图包揽一切。
工程组织:两种角色
| 角色 | 人数 | 职责 | 核心能力 |
|---|---|---|---|
| 架构师 | 1-2 人 | 设计 SOP、构建测试/集成/分诊系统、定义"优秀"标准 | 批判性思维:批评 AI 而非跟随它 |
| 执行者 | 其他人 | Bug 调查、UI 优化、PR 审查、验证确认 | 技能和专注力,不需要架构推理 |
关键洞察:谁适应最快
初级工程师比高级工程师适应更快——工具放大了他们的影响力,且没有十年积累的习惯需要抛弃。适应能力比积累的技能更重要。
超越工程:全职能 AI 原生
如果工程以 Agent 速度运行,但其他职能以人类速度运行,那个人类速度的职能就会制约整体。AI-First 必须推进到每个职能:产品发布说明、功能视频、社交内容、健康报告——全部 AI 生成。
关键数据点
- OpenAI 于 2026 年 2 月提出 Harness Engineering 概念
- CREAO:25 人公司,10 名工程师,99% 生产代码由 AI 编写
- 14 天内平均每天 3-8 次生产部署(旧模式两周可能零发布)
- 功能从构想到上线可在当天完成,A/B 测试实时验证
- 用户参与度上升、付费转化率上升(非以质量换速度)
- 每个自动化工单包含:样本日志、受影响用户、受影响端点、调查路径
- CTO 管理时间从 60% 降到 10% 以下
前提与局限性
- 前提:Agent 具备 Code Execution 能力(无此能力则 Harness 无意义)
- 前提:模型能力是驱动一切的时钟——Opus 4.5 做不到 Opus 4.6 能做的事
- 局限:单人案例(CREAO 25 人),未经验证在大型组织中的可扩展性
- 局限:转型代价真实——员工不确定感、CTO 每天 18 小时、高级工程师质疑自身价值
- 局限:文章作者利益相关——CREAO 是 Agent 平台,用自家 Agent 重建自家平台
- 风险:6 阶段部署流水线的确定性依赖 CI 覆盖率——未覆盖的边界仍是盲区
关联概念
- Agentic-Engineering - Harness Engineering 是 Agentic Engineering 的进一步发展:从"使用 Agent 辅助开发"到"围绕 Agent 重建整个工程系统"
- Vibe-Coding - Harness Engineering 的反面:未经审查的原型 vs 系统化保障的生产代码
- Context-Engineering - Harness 的信息架构层:设计 Agent 每次推理看到的完整信息结构
- Machine-Readable-Processes - Harness Engineering 的流程层:让流程可被 Agent 理解和执行
- Decision-Quality - 架构师角色的核心能力:从代码产出转向决策质量
- Taste - 架构师需要的产品感知:在用户开口前知道 UI 不对
来源
- Why Your "AI-First" Strategy Is Probably Wrong - Peter Pang (CREAO CTO), 2026-04-13
- 原始推文: https://x.com/intuitiveml/status/2043545596699750791