Harness Engineering（驾驭工程）

定义

Harness Engineering 是 OpenAI 于 2026 年 2 月提出的概念：工程团队的首要工作不再是编写代码，而是让 Agent 能够有效工作。当出现问题时，解决方案从不是"再努力一把"，而是：缺少什么能力？如何让 Agent 能够理解并执行？

核心原则

从代码产出到系统构建

传统工程	Harness Engineering
工程师编写代码	工程师构建让 Agent 写代码的系统
"AI 如何帮助工程师？"	"如何重构一切，让 AI 负责构建？"
人工审查每行代码	系统化审查门控 + 人工审查战略风险
问题 → "再努力一把"	问题 → "缺少什么能力？如何让 Agent 理解并执行？"

与 Vibe Coding 的根本区别

Vibe Coding（打开 Cursor，提示直到跑通，提交）只能产出原型。生产系统需要稳定、可靠、安全——你需要一套能在 AI 写代码时保证这些属性的系统。你构建的是系统，提示词只是消耗品。

两个关键区分

AI-Assisted（AI 辅助）：把 AI 嫁接到现有流程上，效率提升 10-20%，结构不变
AI-First（AI 优先）：围绕"AI 是主要构建者"重新设计流程、架构和组织，差距是量级上的

实践框架（CREAO 案例）

架构决策：Monorepo 统一

碎片化代码库对 Agent 不可见——Agent 看不到全貌，无法推理跨服务影响，无法运行集成测试。统一代码库使 Agent 可检查、可验证、可修改。

碎片化的代码库对 Agent 来说是不可见的，统一的代码库才是可读的。

自愈反馈循环

检测（CloudWatch/Sentry）→ 分诊（AI 聚类+评分）→ 工单（Linear 自动创建）
    → 修复（工程师验证+推送）→ 审查（3轮 Claude AI 审查）
    → CI/CD（6 阶段流水线）→ 验证（分诊引擎重检）→ 自动关闭工单

每个工具处理一个阶段，没有工具试图包揽一切。

工程组织：两种角色

角色	人数	职责	核心能力
架构师	1-2 人	设计 SOP、构建测试/集成/分诊系统、定义"优秀"标准	批判性思维：批评 AI 而非跟随它
执行者	其他人	Bug 调查、UI 优化、PR 审查、验证确认	技能和专注力，不需要架构推理

关键洞察：谁适应最快

初级工程师比高级工程师适应更快——工具放大了他们的影响力，且没有十年积累的习惯需要抛弃。适应能力比积累的技能更重要。

超越工程：全职能 AI 原生

如果工程以 Agent 速度运行，但其他职能以人类速度运行，那个人类速度的职能就会制约整体。AI-First 必须推进到每个职能：产品发布说明、功能视频、社交内容、健康报告——全部 AI 生成。

关键数据点

OpenAI 于 2026 年 2 月提出 Harness Engineering 概念
CREAO：25 人公司，10 名工程师，99% 生产代码由 AI 编写
14 天内平均每天 3-8 次生产部署（旧模式两周可能零发布）
功能从构想到上线可在当天完成，A/B 测试实时验证
用户参与度上升、付费转化率上升（非以质量换速度）
每个自动化工单包含：样本日志、受影响用户、受影响端点、调查路径
CTO 管理时间从 60% 降到 10% 以下

前提与局限性

前提：Agent 具备 Code Execution 能力（无此能力则 Harness 无意义）
前提：模型能力是驱动一切的时钟——Opus 4.5 做不到 Opus 4.6 能做的事
局限：单人案例（CREAO 25 人），未经验证在大型组织中的可扩展性
局限：转型代价真实——员工不确定感、CTO 每天 18 小时、高级工程师质疑自身价值
局限：文章作者利益相关——CREAO 是 Agent 平台，用自家 Agent 重建自家平台
风险：6 阶段部署流水线的确定性依赖 CI 覆盖率——未覆盖的边界仍是盲区

关联概念

Agentic-Engineering - Harness Engineering 是 Agentic Engineering 的进一步发展：从"使用 Agent 辅助开发"到"围绕 Agent 重建整个工程系统"
Vibe-Coding - Harness Engineering 的反面：未经审查的原型 vs 系统化保障的生产代码
Context-Engineering - Harness 的信息架构层：设计 Agent 每次推理看到的完整信息结构
Machine-Readable-Processes - Harness Engineering 的流程层：让流程可被 Agent 理解和执行
Decision-Quality - 架构师角色的核心能力：从代码产出转向决策质量
Taste - 架构师需要的产品感知：在用户开口前知道 UI 不对

来源

Why Your "AI-First" Strategy Is Probably Wrong - Peter Pang (CREAO CTO), 2026-04-13
原始推文: https://x.com/intuitiveml/status/2043545596699750791

Clips Wiki

Explorer

Harness Engineering

Harness Engineering（驾驭工程）

核心原则

从代码产出到系统构建

与 Vibe Coding 的根本区别

两个关键区分

实践框架（CREAO 案例）

架构决策：Monorepo 统一

自愈反馈循环

工程组织：两种角色

关键洞察：谁适应最快

超越工程：全职能 AI 原生

关键数据点

前提与局限性

关联概念

来源

关系图谱

目录

反向链接