Code Execution(代码执行)
核心洞察:代码执行是使 Agentic Engineering 成为可能的决定性能力。
定义
Code Execution 是 Coding Agents 的核心能力:能够直接运行生成的代码,而非仅仅输出代码文本。
关键区分
没有 Code Execution,LLM 输出的内容价值有限。 有了 Code Execution,Agent 可以迭代出可验证工作的软件。
为什么重要
传统 LLM 编程的局限
User → LLM → 代码文本 → 人类复制粘贴 → 人类运行测试 → 人类反馈
Coding Agent 的闭环
User → Agent → 代码 → 自动执行 → 测试结果 → 自动迭代
↑ ↓
←←←← 反馈循环 ←←←←←←←←←←←←←←←←
能力层级
| 层级 | 描述 | 例子 |
|---|---|---|
| Read | 读取代码库 | 理解项目结构 |
| Write | 生成代码 | 创建新文件 |
| Execute | 运行代码 | 执行脚本、测试 |
| Iterate | 基于结果改进 | 测试失败 → 修复 → 再测试 |
与 Vibe Coding 的区别
| 维度 | Vibe Coding | Agentic Engineering |
|---|---|---|
| 代码质量 | 原型级、未审查 | 生产级、已验证 |
| 验证方式 | 无 | 自动测试 + 运行验证 |
| 人类角色 | "忘记代码存在" | 验证者、迭代者 |
关键数据点
- Code Execution 是 Agent 迭代出可验证工作软件的关键能力
- Coding agents 工具包括 Claude Code、OpenAI Codex、Gemini CLI
- Agent 的核心定义:循环调用工具达成目标
- LLM 不会从过去的错误中学习,但 coding agents 可以通过更新指令和工具配置来学习
前提与局限性
- 依赖前提:代码库可访问且可执行环境可用
- 适用边界:适用于软件开发、脚本编写、测试验证等场景
- 局限性:无法执行需要外部硬件或特殊环境的代码
- 安全风险:自动执行代码可能引入安全漏洞,需要沙箱环境
- 验证成本:人类仍需验证 Agent 产出的正确性和鲁棒性
关联概念
- Agentic-Engineering - 以此能力为基础的工程范式
- Coding-Agents - 具备此能力的 Agent 类型
- Vibe-Coding - 不强调验证的对比模式
来源:Simon Willison, "What is agentic engineering?" (Agentic Engineering Patterns, 2026)