通用非即插即用监视器:适用于各种设备及场景

2024-05-0504:10:46综合资讯0

文 | 宇杰

编辑 | 宇杰

半导体制造代表了世界上最高水平的微细加工,晶圆生产是半导体制造中的关键步骤,包括光刻、刻蚀、沉积、化学机械平坦化(CMP)、氧化、离子注入、扩散等许多复杂工艺,刻蚀、沉积、氧化等工艺导致在具有不平坦表面的晶圆中产生较大的台阶和沟槽,CMP 技术对于构建晶圆结构至关重要。

材料去除率 (MRR) 是 CMP 工艺中的一个关键变量,每片晶圆都必须抛光到目标厚度,需要准确的 MRR 估计来正确设置抛光时间。

MRR测量困难,成本高,且可能对晶圆造成损坏,在当前的工作中,MRR依靠工程经验以及不频繁的实际测量作为设置和调整的参考。(例如,一批次仅选择一个晶圆进行测量,或按固定时间间隔测量一个晶圆)

在工业生产中,为了准确估计重要而难以测量的变量,通常的做法是建立一个模型来描述该变量与容易获得的环境变量、设备参数、中间变量等之间的关系,并使用物理规律或方法进行预测,该过程称为虚拟计量 (VM)。

VM 主要有两种形式:基于物理的模型和基于数据的模型,基于物理的模型通过研究过程的物理和化学反应建立数学表达式。

一些现有的基于物理的模型通过研究 CMP 工艺的物理和化学反应来建立基于全局的数学表达式,其他模型则关注于 CMP 工艺中特定变量的作用及其对 MRR 的影响,CMP 过程涉及的变量太多,难以用明确的数学表达式和基于物理的模型来覆盖所有这些变量。

CMP 过程的时间非常长,在一个运行周期中,CMP 过程经历多个运行点,将过程分为多个阶段,不同阶段中变量之间的不同关系也会导致物理模型不断变化。

<img alt="通用非即插即用监视器" image_type="1" img_height="454" img_width="752" mime_type="image/jpeg" src="https://p26-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/258a94d0

CMP 过程是连续运行的,因而需要动态预测 MRR。一种动态预测模型融合了来自 历史数据的参考样本 和当前数据样本的信息,其中参考样本通过支持向量回归(SVR)与数据样本合并。粒子滤波器(PF)估计和更新预测结果,确保模型能够跟踪变化中的 CMP 过程。

基于物理模型和数据模型相结合的预测方法,推导了 MRR 的公式,该公式考虑了抛光垫、磨料和晶片之间的接触,公式中的抛光垫表面拓扑项使用随机森林(RF)估算。

一种基于先验知识和晶圆分类的物理模型,利用晶圆和抛光设备之间的动力学和接触。还提出了分类和回归方法,其中通过下采样和扩展获得特征提取的剂量和压力变量。这些方法将 CMP 过程的物理分析添加到数据模型中。与基于物理的 VM 模型类似,物理分析侧重于一些重要变量,但不能涵盖所有变量对 MRR 的影响。

神经网络和深度学习的研究提供了新的思路。一种方法使用自动编码器和 k 均值聚类确定训练样本的特征空间,并将编码器-解码器的重建损失和聚类误差结合起来形成损失函数。

另一种方法将超图卷积网络应用于 MRR 预测。在数据预处理阶段,采用分段聚合近似(PAA)方法进行时间序列对齐和降维。在预测阶段,使用超图模型表示设备和变量之间的复杂关系。

还有一种方法使用深度学习方法对具有空间和时间演化的光发射光谱(OES)图像进行建模,以构建视觉 2D 数据的 VM 模型。为此,设计了结合卷积神经网络(CNN)和高斯过程回归(GPR)的 VM 模型,以解决 VM 模型和特征之间的不匹配问题,使用 CNN 进行特征提取,使用 GPR 进行质量变量的预测。深度学习方法可以充分挖掘过程特征和变量之间的关系,但需要大量数据,否则存在过度拟合的风险。由于测量 MRR 比较困难,因此 CMP 工艺的数据较少。

关于已建立的 MRR 预测方法,有一些改进点。CMP 过程是一个批处理过程,其过程数据具有三个维度:批次、变量和时间。CMP 过程涉及多个阶段,工作点随着时间的推移而变化,不同批次和阶段的持续时间并不相同。大多数现有的预测方法提取过程的整体特征,而忽略阶段特征。

机器学习的特征提取仅涉及统计特征以及持续时间和最近邻等其他特征,对 CMP 工艺数据中的深层特征和深层信息的挖掘不够充分。值得注意的是,由于 MRR 不易测量,大量晶圆缺少 MRR 而成为未标记样品。

一种用于 MRR 预测的半监督深度核主动学习方法,具有以下主要贡献:

半监督主动学习框架可以充分开发和利用有关未标记样本的信息。在此框架下,半监督回归将未标记样本的不确定性纳入损失函数,而主动学习(AL)可以弥补 SSR 中样本代表性和多样性不足的弱点。

基于聚类的相位划分和相位匹配算法用于提取相位特征,神经网络通过复杂的网络连接对复杂的多相过程进行更深入的识别和拟合,基于 CMP 过程数据的实验表明,所提出的方法在 MRR 的预测精度方面取得了良好的效果。

在实际生产中,许多大批量且多阶段的过程拥有大量的未标记样本,所提出的方法可以兼容此类过程的监控。在特征提取阶段,使用相位划分和相位匹配来提取特征数据。在预测阶段,将DKL、SSR和AL结合用于预测。

由于对MRR进行抽样检测,大量样本并未进行MRR检测,因此需注意使用标记和未标记样本的半监督回归 (SSR) 方法。SSR被分为四类:半监督核回归、多视图回归、图正则化回归和半监督 GPR。

其中,半监督GPR模型有两个分量:自变量和因变量与标记样本基于请求参数的联合分布,以及与未标记样本基于请求参数的联合分布。通过推导得到最大化对数似然函数的参数值。

结合深度学习和高斯过程的半监督深度核学习(SSDKL)方法以深度神经网络(DNN)为核函数,优化目标函数同时包括对数似然函数和未标记的预测方差样本,后者用作正则化项以抑制模型的过度拟合。

在 SSR 中,将预测方差作为损失函数的正则化项来捕获未标记样本的信息。与基于协同训练的 SSR 相比,SSDKL 中的未标记样本和伪标签不会直接添加到标记样本集中,而是通过改变损失函数对模型参数产生影响。

未标记的样本提供信息基础,但未考虑代表性和多样性,同时SSR中的少量标记样本分布不均,主动学习 (AL) 可弥补这一弱点。AL允许模型自己选择重要样本,从而以更少的训练样本获得更高的性能。

许多文章都解决了在 PLC 中实施模块化监控方案的问题,已经使用符合国际标准 IEC 61131–3 (2013) 的梯形图介绍了实时工业控制器(例如 PLC)的各种模块化监控方案的实现。

每个本地控制单元实现预定义数量和复杂度的监管器。监控器可以通过经典梯形图或使用梯形图或基于结构化文本的语言的功能块来实现。

它们可以在 IEC 61499 功能块的事件驱动架构中实现,带有参数输入/输出信号。此处提出的监督控制体系结构有助于监管者的实施,因为它们可以通过为每个监管者开发一个库而轻松地在功能块中进行编程。显然,对于制造过程的任何扩展修改后的内容:

半监督深度核主动学习(SSDKAL)方法。在每一轮迭代中,结合使用 QBC 和 GS 样本选择策略。

QBC侧重于模型对查询样本的性能提升,即信息量,而GS则注重不确定性,训练过程首先使用少量标记样本训练一组 SSDKL 回归器。

所有回归器都根据未标记样本进行预测,选择不确定性最大的样本作为查询样本,然后从该集合中选择离现有标记样本最远的样本标签被查询并添加到标记样本集中。