半導體在汽車供應鏈中的重要性不斷地增加,這就要求IC製造商必須調整其製程並生產符合汽車品質標準的晶片。同一類IC製造缺陷不僅會導致良率降低,同時也會導致晶片可靠性降低以及可能在使用中過早出現故障。為了實現汽車IC所需的高度可靠性,必須在製造製程中更加努力並確保消除缺陷源。在本文中將探討如何提升設備監控功能,以協助汽車IC製造商實現低於十億分之一的晶片故障率。
需要提醒的是,設備監控是用以分辨晶圓廠製程機台所產生的隨機缺陷源的最佳實際手段。在設備監控期間,首先檢測控片晶圓並確定其基線缺陷率,隨後將其在特定的製程機台(或反應室)中運行,此後再次檢查。該晶圓上新添的任何缺陷都必定來自於該特定的製程機台。採用這種方法可以揭示晶圓廠中最乾淨的最佳機台,以及造成最多缺陷並需要採取改進措施的不良機台。根據製程機台的缺陷歷史資料,就可以設定持續改進的目標和日程。
半導體廠在設計製程監控策略時,必須確定他們想要檢測和監控的缺陷最小尺寸。如果歷史測試結果表明較小的缺陷並不影響良率,那麼晶圓廠會在檢測設備上採用較低的靈敏度,以便不再檢測這些較小的缺陷。這樣,他們只須關注較大的良率殺手缺陷,並避免被較小的「干擾」缺陷分散注意力。這種方法適用於那些只需優化良率的消費產品晶圓廠,但是對於汽車晶片廠呢?回想一下,良率和可靠性問題是由同一類缺陷引起的,良率和可靠性缺陷的區別僅在於它們的尺寸大小,以及/或者它們在元件圖案上的位置。因此,採用忽視較小的缺陷的設備監控策略會讓晶圓廠漏掉那些未來可能造成可靠性問題的缺陷。
此外,在一個製程層中看起來很小且無關緊要的缺陷可能在製程流程的後期產生巨大的影響,後續的製程步驟會加劇它們的影響,理解這一點非常重要。圖1中的兩個SEM圖片是在同一個晶圓上的完全相同的位置拍攝的,區別僅在於製造製程的步驟不同。左邊的圖片顯示了沉積層之後所發現的晶片上的單個小缺陷。這個缺陷以前被認為是一種干擾點缺陷,對晶片圖案或晶片性能並沒有負面影響。右圖顯示同一個沉積缺陷在金屬1圖案成型之後的情形。曾被認為是干擾點缺陷在幾個製程步驟之後改變了金屬線的成像品質。該晶片可能會通過晶圓電性測試,但這類金屬變形在汽車環境壓力下被加速形成造成實地可靠度的問題。
那麼,汽車IC廠應該如何確定可能帶來可靠性風險的最小缺陷尺寸呢?首先,了解不同缺陷尺寸對可靠性的影響非常重要。例如,考慮圖2中所示的線路斷開缺陷的不同大小。晶片上有完全斷開的圖案結構可能在晶片電性測試時就會被查出,因此不會有任何可靠性的風險。晶片的線路斷開50%時,線路變窄或者其橫截面積大約不超過50%的線路,將可能通過晶片電性測試但會造成顯著的實地可靠性風險。如果該晶片在汽車上使用,實際環境條件,諸如熱、濕度和振動等,會導致該缺陷的狀況惡化並造成全線斷開,而形成晶片故障。
下一步,非常重要的是了解不同尺寸缺陷會如何影響晶片圖案的完整性。更具體地說,導致線路斷開的最小缺陷尺寸是多少? 導致線路50%斷開的最小缺陷尺寸是多少?
圖3顯示了蒙地卡羅模擬的結果,這是對BEOL薄膜沉積步驟中產生的不同尺寸的缺陷所帶來影響的模擬。在垂直軸上繪製的是最小缺陷尺寸,對應橫軸上不同的金屬層間距尺寸。該資料顯示的金屬1層設計節點分別是7nm、10nm、14nm和28nm。
圖3中深色資料點對應於可能導致線路完全斷開的缺陷最小尺寸,淺色資料點對應的是造成線路50%斷開的最小缺陷(即潛在的可靠性故障)。在每一個節點,導致潛在可靠性故障的最小缺陷尺寸是導致線路完全斷開的最小缺陷的50~75%。
這些模擬的結果意味著為了控制和減少製程中所產生的可靠性缺陷的數量,晶圓廠需要捕獲較小的缺陷。因此與優化良率相比,這需要更高靈敏度的檢測。通常,如果針對當前節點的檢測僅僅滿足優化良率的需求,那麼針對可靠性缺陷的檢測則需要採用下一個節點更高的靈敏度。簡而言之,晶圓廠先前用於降低缺陷率以優化良率的標準將不足以用於優化可靠性。
提高設備監測所用的檢測程式的靈敏度,或者在某些情況下採用性能更好的檢測系統,將會捕獲較小的缺陷並可能揭示先前被掩蓋的缺陷率特徵分布,如下面的圖4所示。雖然對於消費品晶圓廠來說這些特徵分布對良率所產生的影響是可以承受的,但對於追求持續改進和零缺陷標準的汽車晶圓廠來說,它們對可靠性所構成的風險則不可接受。
在製定提高設備監控檢測靈敏度的策略時,晶圓廠需要考慮幾個重要的控片晶圓缺陷檢測的因素,以找出由製程設備造成的微小的與可靠性相關的缺陷。首先,在良率已經很高的成熟晶圓廠中,很少有單一的製程層或模組會是一個直接解決方案,即能夠充分降低缺陷率並滿足可靠性改進目標,認識這一點非常重要。相反,它是多個製程層上小改進的累積,積少成多便可以達到所需的可靠性提升。由於良率和相關的可靠性改進是各個製程層的累積,因此,採用控片晶圓檢測的製程設備監控實現的可靠性提升可用多層回歸模型來最佳顯示:
Yield=f(Ys)+f(SFS1)+f(SFS2)+ f(SFS3)+⋯..f(SFSN)+error
Ys=系統良率損失(與顆粒不相關)
SFSx=Surfscan控片晶圓檢測在不同製程層上所捕獲的顆粒累積
Error=Surfscan未能發現的良率損失機制
這意味著提升可靠性需要晶圓廠致力於持續降低所有製程和製程模組的缺陷率。其次,晶圓廠需要考慮用於製程設備監測的裸晶圓的質量。回收的裸晶圓的表面粗糙度隨著每次循環使用而增加,這個屬性被稱為霧度。霧度的程度從根本上說是雜訊,會影響檢測系統區別較小的缺陷訊號的能力。多個測試晶圓上霧度程度的不同,這會限制整體檢測程式的效果,需要進行歸一、校準和並設置霧度上限以減少該雜訊源對缺陷敏感性的影響。
接下來,晶圓廠應該確保監控步驟與實際生產中產品晶圓所採用的製程盡可能相同。為了縮短監測晶圓的流程時間而偏離實際製程可能會在無意間錯過缺陷產生的步驟。此外,過度依賴針對機械操作的檢查會完全省略製程,並且會錯過製程對顆粒生成的關鍵性影響。
在提高檢測程式靈敏度時,晶圓廠必須共同優化「前值」和「後值」檢測。通常,裸晶圓循環通過製程步驟可以「突顯」晶圓上事先存在但是低於檢測臨界值的缺陷。這些缺陷一旦被突顯則看起來更大並且更容易被檢測到。在未經優化的「後值」檢測中,這些被裝飾的缺陷看起來像「新增缺陷」,這會導致誤報和無意的製程設備停機時間。將檢測程式一起進行優化可以最大限度地提高靈敏度並增加偏移警報的可信度,同時避免耗時的誤報。
最後,重要的是對控片晶圓檢測中發現的缺陷進行檢查和分類,以確定它們與所對應的產品晶圓製程步驟中所發現缺陷之間的相關性。只有這樣,晶圓廠才能確信缺陷的來源已經被隔離並且已經採取了適當的糾正措施。
為了滿足車用電子行業對於高度可靠性的要求,IC製造商不僅僅需要監控和控制晶圓上的影響良率的缺陷數量。他們還需要將設備監控檢測的靈敏度提升至相關歷史經驗的後面的一個節點。只有具備更高的靈敏度,才能檢測並消除可能導致可靠性故障的缺陷,而不讓它們漏出到晶圓廠之外。此外,在實施設備監控策略時,晶圓廠需要仔細考慮多種因素,例如監控晶圓回收、檢測前後靈敏度以及整個晶圓廠持續改進計畫的重要性。由於對汽車半導體可靠性的高要求,提升對於較小缺陷的敏感度是最佳零缺陷持續改進計畫的重要組成部分。