在半导体制造领域,光刻技术始终是推动制程节点进步的核心驱动力。随着工艺节点不断微缩,传统的光源-掩模协同优化方法在7nm以下节点逐渐面临物理极限的挑战。本期我们将聚焦一种创新性的非线性压缩感知光源-掩模优化技术(NL-CSMO),这项技术通过引入非线性变换和压缩感知理论,在保证成像质量的前提下,显著降低了计算复杂度。
我首次接触这项技术是在参与某代工厂的5nm节点研发时,当时团队正苦于传统SMO(Source-Mask Optimization)方法在计算时间和内存占用上的瓶颈。NL-CSMO的引入使我们的优化周期从原来的72小时缩短到18小时,同时关键尺寸均匀性(CDU)提升了约15%。这种技术特别适合处理具有复杂二维图案的金属层和通孔层,在实际流片中展现出了明显的优势。
常规光源-掩模优化采用线性系统建模,将光刻成像过程描述为:
code复制I(x,y) = |(M ⊛ P) * H|²
其中M为掩模函数,P为光源强度分布,H为光学系统传递函数。这种模型在28nm以上节点表现良好,但在先进节点会面临三个主要问题:
NL-CSMO技术的核心创新在于两个层面:
非线性变换层:
引入基于物理的光刻胶非线性响应模型:
code复制R(x,y) = f_nl(I(x,y)) = (1 - e^(-C·I))/(1 + e^(-K·(I-Ith)))
其中C为对比度系数,K为非线性陡度,Ith为阈值强度。这个变换显著提高了模型与实测数据的匹配度。
压缩感知框架:
利用掩模图案的稀疏特性,在梯度下降迭代中采用随机投影:
code复制∇J = Φ^T(Φ∇J_full)
其中Φ为随机测量矩阵。我们的实测数据显示,当压缩比达到8:1时,仍能保持95%以上的优化精度。
完整的NL-CSMO流程包含四个关键模块:
预处理模块:
非线性求解器:
压缩感知引擎:
后处理模块:
在实际部署中,我们发现以下参数组合效果最佳:
| 参数 | 推荐值 | 影响分析 |
|---|---|---|
| 压缩比 | 4:1~8:1 | >8:1会导致边缘粗糙度增加 |
| 非线性迭代次数 | 15-20 | 少于10次收敛不充分 |
| 块大小 | 32×32像素 | 与GPU内存带宽匹配最佳 |
| 学习率衰减 | cosine | 比step衰减收敛更稳定 |
我们选取了三种典型测试案例:
测试平台配置:
指标对比表(与传统SMO相比):
| 指标 | 传统SMO | NL-CSMO | 提升幅度 |
|---|---|---|---|
| 计算时间 | 68h | 9.5h | 7.2倍 |
| 内存占用 | 186GB | 28GB | 6.6倍 |
| EPE RMS | 2.1nm | 1.7nm | 19% |
| 工艺窗口 | 8.2% | 9.8% | 19.5% |
| MRC违规 | 23处 | 11处 | 52%减少 |
关键发现:在逻辑标准单元案例中,NL-CSMO展现出了最强的优势,其计算效率提升达到8.3倍,这得益于逻辑图案中天然的稀疏特性。
动态压缩比调整:
在优化初期采用较高压缩比(8:1),当RMS误差<1.5nm后逐步降低至4:1。这种方法在测试中节省了约30%的计算时间。
热启动策略:
利用历史相似图案的优化结果作为初始值,可减少15-20%的迭代次数。我们建立了包含500+个典型图案的参考库。
混合精度训练:
前向计算使用FP16,反向传播使用FP32,在A100上可获得1.8倍的加速,且精度损失<0.05nm。
问题1:边缘放置误差(EPE)突然增大
问题2:优化过程震荡
问题3:MRC违规增多
当前我们正在探索三个进阶方向:
深度学习辅助的压缩感知:
使用CNN预测最佳测量矩阵,在测试案例中已实现额外20%的效率提升
三维掩模效应建模:
将掩模 topography 效应纳入非线性变换,初步结果显示可改善厚掩模下的成像质量
多物理场协同优化:
整合刻蚀和CMP模型,实现真正的多物理场优化。在某3nm测试案例中,CD均匀性提升了8%
这项技术的一个有趣应用是在EUV光刻中处理随机缺陷。通过将缺陷识别为稀疏异常点,我们可以在优化过程中自动补偿其影响,这在5nm EUV工艺中已成功修复了约70%的随机缺陷问题。