跳转到内容

当AI开始设计运行自己的芯片:AlphaEvolve一周年回顾

昨天翻到DeepMind的博客,他们发了AlphaEvolve一周年影响回顾。读完我在椅子上坐了很久。

不是因为那些数字不惊人——确实惊人。让我愣住的,是自己绕回来的逻辑:一个AI系统,优化了运行自己的芯片。

AlphaEvolve设计了下一代TPU的电路。而TPU,正是跑AlphaEvolve的硬件。

类似的事同时在多个层面发生。AlphaEvolve优化了Gemini模型中的矩阵乘法效率——训练速度快了23%。而Gemini,是驱动AlphaEvolve思考的引擎。还优化了Google Spanner的LSM-tree压缩策略——写放大降低了20%。又发现了更高效的缓存替换策略——原本要花几个月人工调优的工作,两天搞定。

这不是”AI辅助人类工作”的故事了。这是一个系统开始参与自身迭代的转折。

我们对AI的讨论,大半还停在”它能替人做什么”。写邮件、做PPT、出报表——帮你在已知路径上跑得更快。

AlphaEvolve在做的事完全不一样。它不是执行已知算法,它在发明人类没有的算法。

4×4复数矩阵乘法。Strassen在1969年找到的方法需要49次标量乘法。56年没人能改进。AlphaEvolve做到了48次。

少了一次。对非数学专业的人听上去无关紧要。但矩阵乘法是AI训练、物理仿真、加密计算的底层算子。每次乘法运算的节省,放大到万亿次调用后,就是电费账单上的真金白银。

如果只在一个问题上表现出色,可以说是运气好。但它不是。

接吻数问题——300年前的几何挑战。11维空间中已知最优是592个球体互相接触且不重叠,AlphaEvolve找到了593个。维基百科已经更新了记录。

Borg集群调度——管理着谷歌全球数十万个作业。算法回收了总计算资源的0.7%。听起来小,在谷歌数据中心的体量下是可观的物理资源。

Erdos问题#1026——组合数学里的硬骨头。48小时内破解了一个陶哲轩都在研究的问题。

关键不是单个成果,是模式:给定评分规则和计算资源,自己找最优解。不是看一万道题学会解题——是零样本、零先验、纯搜索。

这和人类科研有本质区别。人类靠直觉、类比、知识框架。AlphaEvolve没有这些包袱。随机生成候选方案→评估→保留优秀基因→变异→继续。纯粹达尔文进化——在代码空间里。

如果上面那些只是证明AlphaEvolve”好用”,接下来才是让我真正不安的部分。

Jeff Dean的原话:“AlphaEvolve提出了一个电路设计——如此反直觉却如此高效——直接集成到了我们下一代TPU的硅片中。这是TPU大脑帮助设计下一代TPU身体的最新例子。”

大脑改造身体。不是比喻。

拆开这个循环:

  1. AlphaEvolve跑在TPU上
  2. AlphaEvolve优化TPU的电路设计
  3. 新TPU更快、更省电
  4. 新TPU上的AlphaEvolve变得更强
  5. 更强的AlphaEvolve提出更好的TPU设计
  6. 循环继续

这不是论文里的设想——是已经跑在生产线上的流程。

还有一层。AlphaEvolve优化了Gemini的训练效率——提升23%,整体训练时间缩短1%。而Gemini是AlphaEvolve的”大脑”。一个系统改进了驱动自己的引擎。

两个自我指涉循环嵌套在一起:软件优化硬件,硬件加速软件,软件再优化硬件。

这让我想起智能爆炸的老问题:什么时候AI能设计比自己更强的AI?AlphaEvolve还没到那一步——它不是在设计新AI架构,而是在优化AI运行依赖的硬件和算法组件。但它已经踩进了那片领地。

另一个让我反复琢磨的点:你可以把AlphaEvolve扔到几乎任何领域,只要问题能被形式化为”输入→评分函数→输出更好方案”,它就可能有用。

看商业案例——

Klarna优化金融模型:训练速度翻倍。WPP优化广告算法:准确率提升10%。Schrodinger加速药物分子模拟:快了4倍。FM Logistic优化物流路径:一年省15000公里。Substrate改进光刻仿真:运行速度多倍提升。

金融、广告、制药、物流、半导体——五个不相关的行业,同一个系统,都有效。

这不是一个会下围棋的AI,也不是一个会预测蛋白质结构的AI。这是一个学会了”如何发现”的AI。围棋、蛋白质、芯片、路径规划——都是”发现问题”这个元能力的特例。

DeepMind把它叫”通用系统”(general-purpose system),措辞克制但含义深远。算法优化这件事本身正在被自动化。而算法优化是几乎所有技术进步的底层引擎。更快的排序让数据库更快,更优的机器学习算子让训练成本更低,更好的调度让云资源利用率更高——这些”一点”积累起来,就是技术基础设施的整体进化速率。

你可能会想:程序员是不是要失业了?

我不觉得。但答案不是”AI只是工具”这种安慰剂。

看陶哲轩的原话更诚实:“像AlphaEvolve这样的工具为数学家提供了非常有用的新能力。我们可以快速测试潜在不等式的反例,确认对极值构造的信念——这大大提升了我们对问题的直觉,让我们能更容易地找到严格的证明。”

注意措辞:“提升直觉""确认信念""更容易找到证明”。AlphaEvolve没有替代他的数学直觉——它增强了直觉的验证速度。以前一个猜想花几周找反例,现在几分钟。

AI作为认知放大器:不是替代思考,是加速试错。人提出问题和假设,AI快速验证,人根据反馈修正假设。循环越快,思考质量越高——同样的时间迭代更多次。

商业案例也是同样模式。没有人把AlphaEvolve当全自动方案——它是个探索工具。工程师定义优化目标,AlphaEvolve在方案空间里搜索,人来判断哪个值得上线。

角色变了。以前是”人设计算法,机器执行”。现在是”人定义问题和目标,机器探索方案空间,人判断和选择”。人在往决策链的更高层移动。

但这能持续多久?如果AlphaEvolve已经在优化运行自己的硬件,它什么时候也开始定义问题和目标?目前还需要人来设定评分函数、选择探索方向、判断结果的适用性。但评分函数能不能被优化?探索方向能不能自动生成?适用性判断能不能被量化?

这些问题的答案不是”永远不会”。是”暂时还没有”。

AlphaEvolve一周年了。一年前焦点是它能发现什么算法。一年后,真正值得关注的是它重新定义了什么——算法发现这件事本身正在被算法化。

从AlphaGo到AlphaEvolve,走了差不多十年。棋盘上的直觉被攻克了,蛋白质折叠的直觉被攻克了,现在轮到算法设计的直觉。

下一个是什么?


你工作中用过的AI工具,有没有哪个让你产生过”这不只是在辅助我,它在取代我的某个核心能力”的感觉?来评论区聊聊。

AlphaEvolve team. AlphaEvolve: How our Gemini-powered coding agent is scaling impact across fields. Google DeepMind Blog, 2026. https://deepmind.google/blog/alphaevolve-impact/