基准缺陷降低有诀窍 汽车IC良率/可靠性再提升
2018-07-16
14:30:29
来源: 老杳吧
点击
半导体IC的良率与可靠性之间的紧密联系已经得到充分的研究和记录。 图1中的数据展示了这种关系。 类似的结果在批次、晶圆和芯片级别上都可以看得到。 简而言之,良率高,可靠性随之也好。 这种良率与可靠性的相关性完全在意料之中,因为导致芯片故障的缺陷类型与造成早期可靠性问题的缺陷类型是相同的。 影响良率和可靠性的缺陷之间的区别主要在于它们的尺寸和它们在芯片图案上的位置。
半导体IC的良率与可靠性之间的紧密联系已经得到充分的研究和记录。 图1中的数据展示了这种关系。 类似的结果在批次、晶圆和芯片级别上都可以看得到。 简而言之,良率高,可靠性随之也好。 这种良率与可靠性的相关性完全在意料之中,因为导致芯片故障的缺陷类型与造成早期可靠性问题的缺陷类型是相同的。 影响良率和可靠性的缺陷之间的区别主要在于它们的尺寸和它们在芯片图案上的位置。
图1 IC组件的可靠性与良率之间紧密相关性。
因此,减少IC生产制程中影响良率的缺陷数量将会提高基准良率,同时可以提高实际使用中的组件可靠性。 认识到这一事实,服务于汽车市场的代工厂就面对两个关键的问题。 首先是经济问题:为了提高可靠性,需要投入时间、金钱和资源以提高良率,投入的适当程度为何? 第二个问题是技术问题:为了将基准良率提高到必要水平,什么是减少缺陷的最佳方法?
对于制造消费者电子设备的代工厂(移动电话、平板计算机等IC),「成熟良率」被定义为进一步投入时间和资源却并不一定会提高良率的转折点。 随着产品成熟,良率趋于稳定,通常会达到一个高位数值但仍远低于100%。 消费类产品代工厂会将资源重新分配到开发下一个设计节点的制程和设备,或降低成本以提高其成熟节点的获利能力,而不是追求更高的良率,因为这样做更有经济效益。
对于汽车代工厂而言,是否为了提高良率而增加投资的经济决策已经超出了典型的边际收益的决定。 当可靠性问题出现的时候,汽车IC制造商可能须要承担昂贵且耗时的故障分析,并且在产品的保固期内承担故障和产品回收的经济责任,以及潜在的法律责任。 考虑到对汽车IC可靠性的要求比消费性IC要高两至三个数量级,汽车代工厂必须达到更高的基准良率水平。 这就须要重新思考「成熟良率」的含义。
图2着重展示了消费性产品与汽车代工厂商的成熟良率之间的差异。 任何类型的晶圆厂都会提高良率曲线,因而几乎所有系统性影响良率的根源都已经被解决。 剩余的良率损失主要是来自于制程设备或环境的随机缺陷所造成的。 这时,消费产品代工厂可能认为良率和可靠性「足够好」并采取相应的方法。 然而,在汽车行业,代工厂采用持续改进的策略来推高良率曲线。 透过降低影响良率的缺陷发生率,汽车代工厂还可以降低潜在的可靠性缺陷,从而优化其利润并降低风险。
汽车供应链(从OEMs到一级供货商,再到IC制造商)都正在形成一种「每个缺陷都很重要」的思维模式和追求零缺陷的战略。 他们认识到,当潜在缺陷离开代工厂之后,它在供应链中每向前一级,发现和解决的成本都会增加10倍。 因此,目前过度依赖电性测试的方法需要被成本最低的策略所取代,即将潜在故障在代工厂拦下。 只有有条不紊的实施减少缺陷的计划,代工厂才能实现零缺陷目标,并能够通过汽车制造商严格的审核。
除了稳健的在线缺陷控制能力之外,汽车采购经理希望看到的一些减少缺陷的方法还包括:
. 持续改进计划(CIP),用于减少基准缺陷
. 最佳设备工作流程
. 不良设备改善计划
持续减少基准缺陷
产线缺陷策略是任何严格降低基准缺陷计划的基础。 为了成功检测出影响其设计规则和组件类型的良率和可靠性缺陷,代工厂的产线缺陷策略必须包括合适的制程控制设备和合适的检测取样计划。 所采用的缺陷检测系统必须具备所需的缺陷灵敏度,维护良好并且达到规格,以及使用精心调整的检测程序。 检测取样必须针对制程步骤达到足够的频率,以快速检测到制程或设备的偏移。 此外,应有足够的检测产能用以支持加速异常侦测,根本原因区分和风险WIP追踪之控制计划。 有了这些要素,汽车代工厂应该可以实现成功的基准缺陷降低计划,该计划能够证明随着时间的推移良率趋势的提升,提供进一步改进的目标以及等同于业界最佳做法。
在一个基准缺陷减少计划中,最大的挑战之一就是回答:这个缺陷来自哪里? 答案往往不那么简单。 有时,缺陷产生之后经过多个制程步骤才被检测到。 有时,只有在晶圆经过其他制程并「装饰」缺陷之后,它才会变得明显,也就是说让缺陷在检测系统中更为显而易见。 设备监控策略有助于解决缺陷起源的问题。
在设备监控/设备认证(TMTQ)的应用中,先检测一片控片晶圆,使其在指定的制程设备(或反应室)中运行,然后再次检测(图3)。 第二次检测发现的任何新的缺陷必定是由于该指定的制程设备而产生的。 结果很明确;对缺陷的根源没有任何疑问。 追求零缺陷标准的汽车代工厂认识到设备监控策略的好处:透过灵敏的检测程序、适当的控制限值和失控行动计划(OCAP),可以揭示源自每个制程设备的随机良率损失并将其解决。
图3 在「预检」检测取得控片晶圆的基准数据之后,可以采用该晶圆循环运行部分或全部制程设备步骤。 「后」检测揭示了制程设备所添加的缺陷。
此外,如图4所示,将制程设备新增加的缺陷按照时间的推移进行绘制,这提供了可持续改进的记录,可以对其进行审计并用于设定未来的缺陷减少目标。 代工厂可以将每个设备上出现的缺陷分类,并生成数据库,并可作为现场故障的失效分析时的参考。 这种方法需要非常频繁的设备认证(至少每天一次)通常与下面讨论的最佳设备工作流程或不良设备改善计划一起使用。
图4 随着时间的推移持续改进设备的清洁度。 问题的根源是明确的,可以客观地按季或按月设定缺陷减少目标。 另外,比较两种制程设备的缺陷可以显示哪种机台更清洁。 这有助于指导设备维护活动,并锁定设备之间产生差异的原因。
AWF/不良设备改善计划各有优势
最佳设备工作流程是代工厂用于达到汽车行业要求的零缺陷标准的另一种策略。 借助最佳设备工作流程或汽车工作流程(AWF),用于汽车IC的晶圆只在晶圆厂的最佳制程设备中运行。 这要求晶圆厂了解任何既定制程步骤的最佳机台。 为了可靠地确定哪种机台最好,代工厂利用在线和设备监控检测的数据,然后仅将这些机台用于汽车工作流程。 将汽车晶圆在每个制程步骤限制在单一的设备上可能会导致更长的周期时间。 然而,与可能导致可靠性问题的缺陷率较高的制程流程相比,这种做法对于汽车晶圆还是更受青睐。 加上有条不紊的持续改进计划,大多数代工厂通常可以通过设定季度缺陷减低的目标,在每一步制程中获得多个符合AWF要求的设备。
由于这种方法难以扩展,因此最佳设备工作流程最适合只有小部分WIP为汽车的代工厂。 对于大批量生产汽车产品的代工厂,应优先考虑采用更有条理的持续改进计划,如下文所述的不良设备改善的方法。
不良设备改善计划与最佳设备的工作流程相反,因为它可以在任何给定的制程步骤中主动解决最差的制程设备。 在降低基准缺陷方面取得最大成功的代工厂往往通过采用不良设备改善计划。 他们首先在每个制程步骤中将最差设备下线,并调整该设备,直到它超过同组中其余设备的平均值。 他们一遍又一遍地重复这个过程,直到同组的所有设备都符合最低标准。 一个有效的不良设备改善计划要求工厂有一个井然有序的设备监控策略,以在每一个步骤对每台制程设备进行认证。 至少每台设备上每天完成都需要完成一次认证程序,以确保采集足够的数据,让ANOVA或Kruskal-Wallis分析确定每组中最好和最差的设备。 一个不良设备改善计划会安排制程设备的停机时间,并且是众所周知的将整个晶圆厂提升至汽车标准的最快的方法之一。 通过提高良率和可靠性,该策略最终提高了汽车代工厂的有效产能和盈利能力。
(本文作者为KLA资深总监与首席科学家)
半导体IC的良率与可靠性之间的紧密联系已经得到充分的研究和记录。 图1中的数据展示了这种关系。 类似的结果在批次、晶圆和芯片级别上都可以看得到。 简而言之,良率高,可靠性随之也好。 这种良率与可靠性的相关性完全在意料之中,因为导致芯片故障的缺陷类型与造成早期可靠性问题的缺陷类型是相同的。 影响良率和可靠性的缺陷之间的区别主要在于它们的尺寸和它们在芯片图案上的位置。
图1 IC组件的可靠性与良率之间紧密相关性。
因此,减少IC生产制程中影响良率的缺陷数量将会提高基准良率,同时可以提高实际使用中的组件可靠性。 认识到这一事实,服务于汽车市场的代工厂就面对两个关键的问题。 首先是经济问题:为了提高可靠性,需要投入时间、金钱和资源以提高良率,投入的适当程度为何? 第二个问题是技术问题:为了将基准良率提高到必要水平,什么是减少缺陷的最佳方法?
对于制造消费者电子设备的代工厂(移动电话、平板计算机等IC),「成熟良率」被定义为进一步投入时间和资源却并不一定会提高良率的转折点。 随着产品成熟,良率趋于稳定,通常会达到一个高位数值但仍远低于100%。 消费类产品代工厂会将资源重新分配到开发下一个设计节点的制程和设备,或降低成本以提高其成熟节点的获利能力,而不是追求更高的良率,因为这样做更有经济效益。
对于汽车代工厂而言,是否为了提高良率而增加投资的经济决策已经超出了典型的边际收益的决定。 当可靠性问题出现的时候,汽车IC制造商可能须要承担昂贵且耗时的故障分析,并且在产品的保固期内承担故障和产品回收的经济责任,以及潜在的法律责任。 考虑到对汽车IC可靠性的要求比消费性IC要高两至三个数量级,汽车代工厂必须达到更高的基准良率水平。 这就须要重新思考「成熟良率」的含义。
图2着重展示了消费性产品与汽车代工厂商的成熟良率之间的差异。 任何类型的晶圆厂都会提高良率曲线,因而几乎所有系统性影响良率的根源都已经被解决。 剩余的良率损失主要是来自于制程设备或环境的随机缺陷所造成的。 这时,消费产品代工厂可能认为良率和可靠性「足够好」并采取相应的方法。 然而,在汽车行业,代工厂采用持续改进的策略来推高良率曲线。 透过降低影响良率的缺陷发生率,汽车代工厂还可以降低潜在的可靠性缺陷,从而优化其利润并降低风险。
汽车供应链(从OEMs到一级供货商,再到IC制造商)都正在形成一种「每个缺陷都很重要」的思维模式和追求零缺陷的战略。 他们认识到,当潜在缺陷离开代工厂之后,它在供应链中每向前一级,发现和解决的成本都会增加10倍。 因此,目前过度依赖电性测试的方法需要被成本最低的策略所取代,即将潜在故障在代工厂拦下。 只有有条不紊的实施减少缺陷的计划,代工厂才能实现零缺陷目标,并能够通过汽车制造商严格的审核。
除了稳健的在线缺陷控制能力之外,汽车采购经理希望看到的一些减少缺陷的方法还包括:
. 持续改进计划(CIP),用于减少基准缺陷
. 最佳设备工作流程
. 不良设备改善计划
持续减少基准缺陷
产线缺陷策略是任何严格降低基准缺陷计划的基础。 为了成功检测出影响其设计规则和组件类型的良率和可靠性缺陷,代工厂的产线缺陷策略必须包括合适的制程控制设备和合适的检测取样计划。 所采用的缺陷检测系统必须具备所需的缺陷灵敏度,维护良好并且达到规格,以及使用精心调整的检测程序。 检测取样必须针对制程步骤达到足够的频率,以快速检测到制程或设备的偏移。 此外,应有足够的检测产能用以支持加速异常侦测,根本原因区分和风险WIP追踪之控制计划。 有了这些要素,汽车代工厂应该可以实现成功的基准缺陷降低计划,该计划能够证明随着时间的推移良率趋势的提升,提供进一步改进的目标以及等同于业界最佳做法。
在一个基准缺陷减少计划中,最大的挑战之一就是回答:这个缺陷来自哪里? 答案往往不那么简单。 有时,缺陷产生之后经过多个制程步骤才被检测到。 有时,只有在晶圆经过其他制程并「装饰」缺陷之后,它才会变得明显,也就是说让缺陷在检测系统中更为显而易见。 设备监控策略有助于解决缺陷起源的问题。
在设备监控/设备认证(TMTQ)的应用中,先检测一片控片晶圆,使其在指定的制程设备(或反应室)中运行,然后再次检测(图3)。 第二次检测发现的任何新的缺陷必定是由于该指定的制程设备而产生的。 结果很明确;对缺陷的根源没有任何疑问。 追求零缺陷标准的汽车代工厂认识到设备监控策略的好处:透过灵敏的检测程序、适当的控制限值和失控行动计划(OCAP),可以揭示源自每个制程设备的随机良率损失并将其解决。
图3 在「预检」检测取得控片晶圆的基准数据之后,可以采用该晶圆循环运行部分或全部制程设备步骤。 「后」检测揭示了制程设备所添加的缺陷。
此外,如图4所示,将制程设备新增加的缺陷按照时间的推移进行绘制,这提供了可持续改进的记录,可以对其进行审计并用于设定未来的缺陷减少目标。 代工厂可以将每个设备上出现的缺陷分类,并生成数据库,并可作为现场故障的失效分析时的参考。 这种方法需要非常频繁的设备认证(至少每天一次)通常与下面讨论的最佳设备工作流程或不良设备改善计划一起使用。
图4 随着时间的推移持续改进设备的清洁度。 问题的根源是明确的,可以客观地按季或按月设定缺陷减少目标。 另外,比较两种制程设备的缺陷可以显示哪种机台更清洁。 这有助于指导设备维护活动,并锁定设备之间产生差异的原因。
AWF/不良设备改善计划各有优势
最佳设备工作流程是代工厂用于达到汽车行业要求的零缺陷标准的另一种策略。 借助最佳设备工作流程或汽车工作流程(AWF),用于汽车IC的晶圆只在晶圆厂的最佳制程设备中运行。 这要求晶圆厂了解任何既定制程步骤的最佳机台。 为了可靠地确定哪种机台最好,代工厂利用在线和设备监控检测的数据,然后仅将这些机台用于汽车工作流程。 将汽车晶圆在每个制程步骤限制在单一的设备上可能会导致更长的周期时间。 然而,与可能导致可靠性问题的缺陷率较高的制程流程相比,这种做法对于汽车晶圆还是更受青睐。 加上有条不紊的持续改进计划,大多数代工厂通常可以通过设定季度缺陷减低的目标,在每一步制程中获得多个符合AWF要求的设备。
由于这种方法难以扩展,因此最佳设备工作流程最适合只有小部分WIP为汽车的代工厂。 对于大批量生产汽车产品的代工厂,应优先考虑采用更有条理的持续改进计划,如下文所述的不良设备改善的方法。
不良设备改善计划与最佳设备的工作流程相反,因为它可以在任何给定的制程步骤中主动解决最差的制程设备。 在降低基准缺陷方面取得最大成功的代工厂往往通过采用不良设备改善计划。 他们首先在每个制程步骤中将最差设备下线,并调整该设备,直到它超过同组中其余设备的平均值。 他们一遍又一遍地重复这个过程,直到同组的所有设备都符合最低标准。 一个有效的不良设备改善计划要求工厂有一个井然有序的设备监控策略,以在每一个步骤对每台制程设备进行认证。 至少每台设备上每天完成都需要完成一次认证程序,以确保采集足够的数据,让ANOVA或Kruskal-Wallis分析确定每组中最好和最差的设备。 一个不良设备改善计划会安排制程设备的停机时间,并且是众所周知的将整个晶圆厂提升至汽车标准的最快的方法之一。 通过提高良率和可靠性,该策略最终提高了汽车代工厂的有效产能和盈利能力。
(本文作者为KLA资深总监与首席科学家)
责任编辑:Sophie