1. 从物理学视角重新审视人工智能:Physics of AI的探索之路
在人工智能领域,当大多数研究者还在为"更大模型、更多数据"的Scaling路线欢呼时,MIT出身的物理学家刘子鸣博士却开辟了一条与众不同的研究路径——将神经网络视为物理系统进行研究。这种被称为Physics of AI的研究方法,正为理解人工智能的底层机制提供全新的科学视角。
刘子鸣的研究轨迹颇具启发性:从北大物理系本科,到MIT物理系博士,再到即将加入清华人工智能学院担任教职,他始终保持着物理学家的思维方式。这种背景赋予他独特的优势——能够跳出计算机科学家的思维定式,用物理学的实验观察和理论建模方法来剖析AI系统。
物理学教会我最重要的不是具体知识,而是如何抽象和简化复杂问题。面对AI这样的复杂系统,物理学的还原论思维特别有用——我们可以把系统拆解成可理解的部分,再逐步构建整体认知。
2. Physics of AI的核心研究成果
2.1 KAN网络:用数学定理重构神经网络基础
传统神经网络(MLP)基于万能逼近定理,而刘子鸣团队提出的KAN(Kolmogorov-Arnold Networks)则采用了完全不同的数学基础——Kolmogorov-Arnold表示定理。这一创新带来了两个显著优势:
- 科学计算场景的可解释性:KAN能够更自然地表示和提取符号公式,在科学计算任务中展现出比MLP更强的解释能力
- 动态精度调整:KAN可以灵活调整精度,而MLP通常需要从头训练更大模型才能提高精度
在解决偏微分方程、符号回归等问题时,KAN不仅性能优于MLP,还能提供人类可理解的中间表示。例如,在拟合简单数学函数时,KAN会自动学习到与人类数学家相似的函数分解方式。
2.2 破解"顿悟现象"的物理机制
神经网络训练中常出现的"顿悟现象"(突然的性能提升)一直是个谜。刘子鸣团队从物理视角给出了两个解释:
- 表征几何演化:通过观察模型嵌入空间的几何变化,发现顿悟时刻对应着表征从无序状态演化成特定环状结构
- 表达能力压缩:正则化导致模型表达能力下降,迫使其找到数据背后更简单的算法,从而产生顿悟
这项研究不仅解释了现象本质,还为优化训练过程提供了新思路——通过监控表征几何变化,可以预测和引导顿悟时刻的到来。
2.3 超越扩散:物理现象启发的生成模型
当前主流的扩散模型本质上是将热力学扩散过程应用于生成建模。刘子鸣团队探索了更多物理现象作为生成模型基础的可能性:
- 电场启发生成模型:将数据视为正电荷,采样过程视为负电荷被吸引的过程
- 波动方程应用:研究亥姆霍兹方程等物理方程在生成建模中的潜力
虽然这些探索尚未产生颠覆性影响,但拓宽了生成模型的思路边界,展示了物理视角的独特价值。
3. Physics of AI的方法论特色
3.1 物理思维与AI研究的融合
与计算机科学和数学背景的研究者相比,物理学训练赋予刘子鸣独特的研究方法:
- 实验驱动:重视对现象的观察和玩具模型的构建,不盲目追求理论完美
- 适度抽象:在保持直观理解的前提下进行合理简化,平衡严谨性与实用性
- 系统拆解:将复杂系统分解为可研究的子系统,逐步构建整体认知
这种方法论使得Physics of AI既不同于纯理论推导,也区别于纯工程试错,而是在两者间找到平衡点。
3.2 结构主义与Scaling的辩证关系
刘子鸣提出了通往AGI的三条可能路径:
- Scaling路线:持续扩大模型规模和数据量
- Agent路线:在现有模型基础上构建外部模块
- Physics of AI路线:通过科学理解改进模型设计
他认为结构主义(通过理解模型内部结构来改进设计)是Scaling之外的另一种选择。Physics of AI则为实现结构主义提供了具体路径——先建立AI的科学理论,再基于理论指导设计更高效的模型。
4. 学术生态与文化反思
4.1 当前发表文化的局限性
刘子鸣尖锐指出,现有学术发表体系不利于Physics of AI这类研究的发展:
- 偏好完整故事:期刊会议倾向于接收能讲完整故事的工作,忽视零散但可能重要的观察
- 抑制小发现:许多细微现象因难以包装成论文而被丢弃,造成知识浪费
- 门槛过高:现有Physics of AI工作往往篇幅长、难度大,吓退潜在研究者
4.2 开放科学的新尝试
为改变这一状况,刘子鸣采取了两种策略:
- 每日博客:从2026年1月1日起坚持每天发布研究笔记,分享实验中的小发现
- 倡导开放:呼吁建立更开放的分享平台,鼓励零散但真实的观察积累
这种"小洞察"积累策略看似效率不高,但长期可能带来质的飞跃——当足够多的观察点积累后,它们之间的连接可能揭示出更深层规律。
5. Physics of AI的未来展望
5.1 短期与长期的平衡
在短期策略上,刘子鸣建议:
- 不否定Scaling价值:承认其在短期内可能继续带来进展
- 并行探索:在推进Scaling的同时,投入资源研究Physics of AI
- 文化转变:改变评价体系,鼓励零散但真实的观察分享
5.2 清华人工智能学院的新起点
即将在清华开展的工作包括:
- 课程建设:开设Physics of AI课程,培养跨学科人才
- 研究推进:系统观察神经网络中的各类现象,构建知识体系
- 社区建设:吸引更多研究者加入Physics of AI探索
刘子鸣特别强调杨振宁的教育理念:年轻人应投身有发展潜力的领域,同时保持"眼高手低"的态度——胸怀大志,但脚踏实地从具体问题做起。
6. 给AI研究者的实践建议
对于有意探索Physics of AI的研究者,刘子鸣的经验建议包括:
- 培养物理思维:学习如何抽象复杂系统,构建简化模型
- 重视日常观察:养成记录实验现象的习惯,不轻视小发现
- 平衡理论与实验:在理论指导下设计实验,用实验结果修正理论
- 参与开放科:加入博客、论坛等开放平台,分享零散观察
Physics of AI代表了一种全新的研究范式——不是将AI作为工具应用于物理问题,而是将AI系统本身作为物理对象来研究。这条路径虽然充满挑战,但可能为理解智能本质和实现AGI提供不可替代的科学基础。