Physics of AI：物理学视角下的神经网络研究新范式-AI智能范式网

Physics of AI：物理学视角下的神经网络研究新范式

雨少主

1. 从物理学视角重新审视人工智能：Physics of AI的探索之路

在人工智能领域，当大多数研究者还在为"更大模型、更多数据"的Scaling路线欢呼时，MIT出身的物理学家刘子鸣博士却开辟了一条与众不同的研究路径——将神经网络视为物理系统进行研究。这种被称为Physics of AI的研究方法，正为理解人工智能的底层机制提供全新的科学视角。

刘子鸣的研究轨迹颇具启发性：从北大物理系本科，到MIT物理系博士，再到即将加入清华人工智能学院担任教职，他始终保持着物理学家的思维方式。这种背景赋予他独特的优势——能够跳出计算机科学家的思维定式，用物理学的实验观察和理论建模方法来剖析AI系统。

物理学教会我最重要的不是具体知识，而是如何抽象和简化复杂问题。面对AI这样的复杂系统，物理学的还原论思维特别有用——我们可以把系统拆解成可理解的部分，再逐步构建整体认知。

2. Physics of AI的核心研究成果

2.1 KAN网络：用数学定理重构神经网络基础

传统神经网络(MLP)基于万能逼近定理，而刘子鸣团队提出的KAN(Kolmogorov-Arnold Networks)则采用了完全不同的数学基础——Kolmogorov-Arnold表示定理。这一创新带来了两个显著优势：

科学计算场景的可解释性：KAN能够更自然地表示和提取符号公式，在科学计算任务中展现出比MLP更强的解释能力
动态精度调整：KAN可以灵活调整精度，而MLP通常需要从头训练更大模型才能提高精度

在解决偏微分方程、符号回归等问题时，KAN不仅性能优于MLP，还能提供人类可理解的中间表示。例如，在拟合简单数学函数时，KAN会自动学习到与人类数学家相似的函数分解方式。

2.2 破解"顿悟现象"的物理机制

神经网络训练中常出现的"顿悟现象"(突然的性能提升)一直是个谜。刘子鸣团队从物理视角给出了两个解释：

表征几何演化：通过观察模型嵌入空间的几何变化，发现顿悟时刻对应着表征从无序状态演化成特定环状结构
表达能力压缩：正则化导致模型表达能力下降，迫使其找到数据背后更简单的算法，从而产生顿悟

这项研究不仅解释了现象本质，还为优化训练过程提供了新思路——通过监控表征几何变化，可以预测和引导顿悟时刻的到来。

2.3 超越扩散：物理现象启发的生成模型

当前主流的扩散模型本质上是将热力学扩散过程应用于生成建模。刘子鸣团队探索了更多物理现象作为生成模型基础的可能性：

电场启发生成模型：将数据视为正电荷，采样过程视为负电荷被吸引的过程
波动方程应用：研究亥姆霍兹方程等物理方程在生成建模中的潜力

虽然这些探索尚未产生颠覆性影响，但拓宽了生成模型的思路边界，展示了物理视角的独特价值。

3. Physics of AI的方法论特色

3.1 物理思维与AI研究的融合

与计算机科学和数学背景的研究者相比，物理学训练赋予刘子鸣独特的研究方法：

实验驱动：重视对现象的观察和玩具模型的构建，不盲目追求理论完美
适度抽象：在保持直观理解的前提下进行合理简化，平衡严谨性与实用性
系统拆解：将复杂系统分解为可研究的子系统，逐步构建整体认知

这种方法论使得Physics of AI既不同于纯理论推导，也区别于纯工程试错，而是在两者间找到平衡点。

3.2 结构主义与Scaling的辩证关系

刘子鸣提出了通往AGI的三条可能路径：

Scaling路线：持续扩大模型规模和数据量
Agent路线：在现有模型基础上构建外部模块
Physics of AI路线：通过科学理解改进模型设计

他认为结构主义(通过理解模型内部结构来改进设计)是Scaling之外的另一种选择。Physics of AI则为实现结构主义提供了具体路径——先建立AI的科学理论，再基于理论指导设计更高效的模型。

4. 学术生态与文化反思

4.1 当前发表文化的局限性

刘子鸣尖锐指出，现有学术发表体系不利于Physics of AI这类研究的发展：

偏好完整故事：期刊会议倾向于接收能讲完整故事的工作，忽视零散但可能重要的观察
抑制小发现：许多细微现象因难以包装成论文而被丢弃，造成知识浪费
门槛过高：现有Physics of AI工作往往篇幅长、难度大，吓退潜在研究者

4.2 开放科学的新尝试

为改变这一状况，刘子鸣采取了两种策略：

每日博客：从2026年1月1日起坚持每天发布研究笔记，分享实验中的小发现
倡导开放：呼吁建立更开放的分享平台，鼓励零散但真实的观察积累

这种"小洞察"积累策略看似效率不高，但长期可能带来质的飞跃——当足够多的观察点积累后，它们之间的连接可能揭示出更深层规律。

5. Physics of AI的未来展望

5.1 短期与长期的平衡

在短期策略上，刘子鸣建议：

不否定Scaling价值：承认其在短期内可能继续带来进展
并行探索：在推进Scaling的同时，投入资源研究Physics of AI
文化转变：改变评价体系，鼓励零散但真实的观察分享

5.2 清华人工智能学院的新起点

即将在清华开展的工作包括：

课程建设：开设Physics of AI课程，培养跨学科人才
研究推进：系统观察神经网络中的各类现象，构建知识体系
社区建设：吸引更多研究者加入Physics of AI探索

刘子鸣特别强调杨振宁的教育理念：年轻人应投身有发展潜力的领域，同时保持"眼高手低"的态度——胸怀大志，但脚踏实地从具体问题做起。

6. 给AI研究者的实践建议

对于有意探索Physics of AI的研究者，刘子鸣的经验建议包括：

培养物理思维：学习如何抽象复杂系统，构建简化模型
重视日常观察：养成记录实验现象的习惯，不轻视小发现
平衡理论与实验：在理论指导下设计实验，用实验结果修正理论
参与开放科：加入博客、论坛等开放平台，分享零散观察

Physics of AI代表了一种全新的研究范式——不是将AI作为工具应用于物理问题，而是将AI系统本身作为物理对象来研究。这条路径虽然充满挑战，但可能为理解智能本质和实现AGI提供不可替代的科学基础。