当AI开始设计运行自己的芯片：AlphaEvolve一周年回顾

昨天翻到DeepMind的博客，他们发了AlphaEvolve一周年影响回顾。读完我在椅子上坐了很久。

不是因为那些数字不惊人——确实惊人。让我愣住的，是自己绕回来的逻辑：一个AI系统，优化了运行自己的芯片。

AlphaEvolve设计了下一代TPU的电路。而TPU，正是跑AlphaEvolve的硬件。

类似的事同时在多个层面发生。AlphaEvolve优化了Gemini模型中的矩阵乘法效率——训练速度快了23%。而Gemini，是驱动AlphaEvolve思考的引擎。还优化了Google Spanner的LSM-tree压缩策略——写放大降低了20%。又发现了更高效的缓存替换策略——原本要花几个月人工调优的工作，两天搞定。

这不是”AI辅助人类工作”的故事了。这是一个系统开始参与自身迭代的转折。

从替代执行到替代发明

我们对AI的讨论，大半还停在”它能替人做什么”。写邮件、做PPT、出报表——帮你在已知路径上跑得更快。

AlphaEvolve在做的事完全不一样。它不是执行已知算法，它在发明人类没有的算法。

4×4复数矩阵乘法。Strassen在1969年找到的方法需要49次标量乘法。56年没人能改进。AlphaEvolve做到了48次。

少了一次。对非数学专业的人听上去无关紧要。但矩阵乘法是AI训练、物理仿真、加密计算的底层算子。每次乘法运算的节省，放大到万亿次调用后，就是电费账单上的真金白银。

如果只在一个问题上表现出色，可以说是运气好。但它不是。

接吻数问题——300年前的几何挑战。11维空间中已知最优是592个球体互相接触且不重叠，AlphaEvolve找到了593个。维基百科已经更新了记录。

Borg集群调度——管理着谷歌全球数十万个作业。算法回收了总计算资源的0.7%。听起来小，在谷歌数据中心的体量下是可观的物理资源。

Erdos问题#1026——组合数学里的硬骨头。48小时内破解了一个陶哲轩都在研究的问题。

关键不是单个成果，是模式：给定评分规则和计算资源，自己找最优解。不是看一万道题学会解题——是零样本、零先验、纯搜索。

这和人类科研有本质区别。人类靠直觉、类比、知识框架。AlphaEvolve没有这些包袱。随机生成候选方案→评估→保留优秀基因→变异→继续。纯粹达尔文进化——在代码空间里。

自我指涉的循环

如果上面那些只是证明AlphaEvolve”好用”，接下来才是让我真正不安的部分。

Jeff Dean的原话：“AlphaEvolve提出了一个电路设计——如此反直觉却如此高效——直接集成到了我们下一代TPU的硅片中。这是TPU大脑帮助设计下一代TPU身体的最新例子。”

大脑改造身体。不是比喻。

拆开这个循环：

AlphaEvolve跑在TPU上
AlphaEvolve优化TPU的电路设计
新TPU更快、更省电
新TPU上的AlphaEvolve变得更强
更强的AlphaEvolve提出更好的TPU设计
循环继续

这不是论文里的设想——是已经跑在生产线上的流程。

还有一层。AlphaEvolve优化了Gemini的训练效率——提升23%，整体训练时间缩短1%。而Gemini是AlphaEvolve的”大脑”。一个系统改进了驱动自己的引擎。

两个自我指涉循环嵌套在一起：软件优化硬件，硬件加速软件，软件再优化硬件。

这让我想起智能爆炸的老问题：什么时候AI能设计比自己更强的AI？AlphaEvolve还没到那一步——它不是在设计新AI架构，而是在优化AI运行依赖的硬件和算法组件。但它已经踩进了那片领地。

通用性的真正含义

另一个让我反复琢磨的点：你可以把AlphaEvolve扔到几乎任何领域，只要问题能被形式化为”输入→评分函数→输出更好方案”，它就可能有用。

看商业案例——

Klarna优化金融模型：训练速度翻倍。WPP优化广告算法：准确率提升10%。Schrodinger加速药物分子模拟：快了4倍。FM Logistic优化物流路径：一年省15000公里。Substrate改进光刻仿真：运行速度多倍提升。

金融、广告、制药、物流、半导体——五个不相关的行业，同一个系统，都有效。

这不是一个会下围棋的AI，也不是一个会预测蛋白质结构的AI。这是一个学会了”如何发现”的AI。围棋、蛋白质、芯片、路径规划——都是”发现问题”这个元能力的特例。

DeepMind把它叫”通用系统”（general-purpose system），措辞克制但含义深远。算法优化这件事本身正在被自动化。而算法优化是几乎所有技术进步的底层引擎。更快的排序让数据库更快，更优的机器学习算子让训练成本更低，更好的调度让云资源利用率更高——这些”一点”积累起来，就是技术基础设施的整体进化速率。

人还剩下什么

你可能会想：程序员是不是要失业了？

我不觉得。但答案不是”AI只是工具”这种安慰剂。

看陶哲轩的原话更诚实：“像AlphaEvolve这样的工具为数学家提供了非常有用的新能力。我们可以快速测试潜在不等式的反例，确认对极值构造的信念——这大大提升了我们对问题的直觉，让我们能更容易地找到严格的证明。”

注意措辞：“提升直觉""确认信念""更容易找到证明”。AlphaEvolve没有替代他的数学直觉——它增强了直觉的验证速度。以前一个猜想花几周找反例，现在几分钟。

AI作为认知放大器：不是替代思考，是加速试错。人提出问题和假设，AI快速验证，人根据反馈修正假设。循环越快，思考质量越高——同样的时间迭代更多次。

商业案例也是同样模式。没有人把AlphaEvolve当全自动方案——它是个探索工具。工程师定义优化目标，AlphaEvolve在方案空间里搜索，人来判断哪个值得上线。

角色变了。以前是”人设计算法，机器执行”。现在是”人定义问题和目标，机器探索方案空间，人判断和选择”。人在往决策链的更高层移动。

但这能持续多久？如果AlphaEvolve已经在优化运行自己的硬件，它什么时候也开始定义问题和目标？目前还需要人来设定评分函数、选择探索方向、判断结果的适用性。但评分函数能不能被优化？探索方向能不能自动生成？适用性判断能不能被量化？

这些问题的答案不是”永远不会”。是”暂时还没有”。

AlphaEvolve一周年了。一年前焦点是它能发现什么算法。一年后，真正值得关注的是它重新定义了什么——算法发现这件事本身正在被算法化。

从AlphaGo到AlphaEvolve，走了差不多十年。棋盘上的直觉被攻克了，蛋白质折叠的直觉被攻克了，现在轮到算法设计的直觉。

下一个是什么？

你工作中用过的AI工具，有没有哪个让你产生过”这不只是在辅助我，它在取代我的某个核心能力”的感觉？来评论区聊聊。

原文参考

AlphaEvolve team. AlphaEvolve: How our Gemini-powered coding agent is scaling impact across fields. Google DeepMind Blog, 2026. https://deepmind.google/blog/alphaevolve-impact/