当 90% 代码由 AI 生成，经验还剩什么？

美团技术博客前两天发了篇文章，讲他们怎么用 Agent 评测的思路管理 AI Coding——31 万行代码，90% 以上 AI 生成，团队规模一年翻三倍。读完之后我脑子里有个声音响了好几天。

不是因为这文章写了什么新技术。恰恰相反，它写的是一个老问题在新场景下的变形。

AI 不修混乱，AI 放大混乱

这句话是美团文章开篇的第一刀，也是整篇最值得盯着看的一句话。

都说 AI 提效。GitHub Copilot 能省 50% 编码时间，Cursor 帮你理解整个代码库，Claude Code 把复杂需求拆成可执行步骤。听起来像童话——代码写得快了，bug 修得快了，一切都变好了。

但美团撞上了一堵墙：代码量从 5 万膨胀到 31 万行只用了不到一年，AI 生成率从 52% 涨到接近 60%，而系统腐化的速度比之前更快了。

为什么？因为 AI 没有审美。它看到什么模式就复制什么模式。如果你的代码库本身就是面条式的——Controller 里揉着业务逻辑、数据对象在全链路裸奔、不同模块之间依赖关系像意大利面——AI 不会跟你说”老板，这结构有问题”。它会照着继续写，而且写得更快、更多、更一致地烂。

这就好比给一百个厨子同样的食材，但不给他们菜谱。每个人做的菜都不一样，有的咸有的淡，有的压根不是一道菜。AI 就是那个加速出菜的传送带——它不判断味道，只管速度。

“人人对齐”才是硬骨头

整篇文章我最服气的一点，是美团团队把这个问题的解法锚定在了一个看起来完全不相关的地方——Agent 评测。

他们团队本来就做 Agent 评测。做评测的人有一个基本功：标准对齐。评测一个 AI Agent 到底好不好用，第一步不是调模型，是让产品、运营、算法、QA 所有人先在一张纸上说清楚——什么叫”好”。这个过程他们叫”人人对齐”。人跟人先对上了，再去谈”人机对齐”——让机器的评分跟人的判断一致。

然后他们发现，管 AI Coding 跟管 Agent 评测，底层逻辑一模一样。

这步想通非常关键。因为我见过太多团队——包括我自己——一上来就写 AI Rule、调 prompt、配 Skill。觉得只要规则写得够细，AI 就能写出好代码。但问题是，如果你团队五个人对”什么叫好代码”有五种理解，你写的 Rule 给谁看？AI 读到的是一份可以被五种方式解读的文档，它不会替你统一，它只会诚实地放大每一种解读。

美团的做法是：先让团队吵架。把分层原则、建模方式、依赖边界这些容易有分歧的东西摆在桌面上，吵清楚了，一个人拍板——“一个独裁者好过十个民主者”——然后把共识写成 always 级别的 AI Rule。人的共识是 AI 约束的前提。这个顺序错了，后面全是白做。

经验的护城河在变窄

文章里还有一个数据让我心里震了一下：工程师用 AI 辅助，短时间内定位了 10 个隐藏极深的性能隐患——这些隐患藏在复杂调用链深处，按传统方式，即使资深工程师逐行阅读也很难穷举到。

这意味着什么？过去一个工程师在系统里泡三年建立起来的”代码全局感”，AI 十分钟就能给你。

这不只是提效。这是护城河在蒸发。

我作为一个非科班程序员，对这种变化感受尤其强烈。我能用 AI 工具做开发、做知识管理，很大程度上就是因为 AI 抹平了我和科班程序员之间的一部分信息差。那些曾经需要多年积累才能建立的”见过世面”的能力，门槛在快速降低。

但美团的文章让我意识到一个更重要的问题：如果”能看全”不再是壁垒了，那什么才是？

他们的答案是”能判断什么重要”。AI 帮你看全 31 万行代码，但哪 3 个 P0 问题值得先修、哪 5 个技术债能借着下个需求顺手消化——这个判断，AI 做不了。

这让我想到一个画面：AI 像一台超级显微镜，把整个代码库的每个细胞都给你照清楚了。但显微镜不会告诉你哪个细胞是癌变的。那个判断，是你盯着屏幕看了半天之后，皱一下眉头说”这个地方不对”的那一刻。

工程师的新身份

文章最后一段有句话：“工程师的角色从’写代码’转向’设计并维护一个能让 AI 可靠产出代码的工程环境’。”

翻译成人话：你的产品不是代码，是那个生产代码的系统。

这个转变比听起来更深。它不只是工作内容的切换，是身份认同的重构。过去你说”我是程序员”，别人大概知道你每天在干什么——写代码、调试、改 bug。现在你说”我是程序员”，你可能一天里有 60% 的时间在跟人聊架构、写 Rule、设计规范、审查 AI 产出的代码是否还走在正确的轨道上。

你变成了一个环境工程师。只不过这个环境不是空气质量和水质，是代码的质量和 AI 的行为边界。

美团的 Pre-PR 机制就是这个思路的落地——提交代码前，AI 先自查一轮，过滤掉规范类、bug 类、一致性问题，然后人再介入。人的时间从”找拼写错误”释放到”判断架构是否合理”。

这才是 AI 提效的真正路径：不是让你写得更快，是让你把时间花在只有你能做的事情上。

美团这篇文章，我可能三个月后重读会有不一样的理解。但现在有一个问题我想丢出来——

如果 AI 已经把”看全”的门槛打到几乎为零，你觉得你剩下的那点判断力，够不够撑起你的价值？

原文参考

美团技术团队。用 Agent 评测思路管理 AI Coding —— 31 万行代码 AI 重构的实践. 美团技术博客。 https://tech.meituan.com/2026/05/07/agent-ai-coding.html