- Advertisement -
首頁 標籤 缺陷檢測

缺陷檢測

- Advertisment -

I-PAT一眼看穿 汽車晶圓缺陷篩選率上層樓

在對可靠性影響幾個最大的關鍵製程步驟中,採用這種被稱為「篩選」的技術對100%的晶片和100%的晶圓進行檢測。在檢測中未通過預設缺陷率標準的晶片被「篩出」或「標記」,並將其從汽車供應鏈中濾除。濾除的標準通常是根據反覆出現的客戶退貨,並且對這些產品進行故障分析以揭示容易引起問題的製程層、晶片區域和缺陷類型。在採用8D研究對可靠性問題的來源進行辨識和表徵之後,許多領先的汽車半導體客戶將堅持讓他們的IC供應商採用有針對性的篩選作為預防措施,以確保完成零缺陷的品質目標。 缺陷檢測為汽車晶片製造挑戰 篩選所用的缺陷檢測的晶圓圖上通常有太多缺陷,這是汽車晶片製造商所面臨的挑戰。當然,並非晶片上的每個缺陷都有同等機率造成晶片致命故障。但如果不對缺陷的可靠性風險做出仔細評估,就可能造成讓人無法接受的「矯枉過正」,本來可以在整個使用壽命期間正常運行的晶片也被標記濾除。 為了實現提高品質且又不會矯枉過正的雙重目標,篩選必須成功識別在ppb級品質檢驗環境中最可能出現故障的晶片,同時允許合格晶片通過品質檢驗。一種稱為線上缺陷零件平均測試(I-PAT)的新型晶片級篩選方法由此而創建。I-PAT是一種統計方法,用於識別可靠性故障發生風險較高的晶片。 零件平均測試(PAT)由汽車電子委員會(AEC)於1997年首次認可,目前已被廣泛使用。其理念是採用電性測試,並將每個零件的性能參數與大量產品的資料分布進行比較和評估。那些符合規格但在產品正態分布之外的晶片被視為異常零件;實際結果表明,這些異常零件更容易產生可靠性故障,因此可以將其從供應鏈中濾除。參數化零件平均測試(P-PAT)的概念現已進一步發展並包括了其他幾種不同的辨識異常晶片的方法。 圖1顯示了該測試的基本概念。晶片A來自主要數值分布的中間,晶片B則遠低於零件平均測試的下限。因此,晶片B多半會被濾除以免其造成可靠性風險。 圖1 大部分零件(晶片)的資料都在狹窄的淺灰色分布範圍內,零件平均測試限度之外的任何零件儘管完全合乎規格也都將因其可靠性風險而報廢。 線上缺陷零件平均測試是將這個異常零件分析原則擴展用於線上缺陷資料。目前已經確定,給定晶片中可靠性缺陷的發生率與缺陷總數呈線性正比;如果晶片A缺陷數目是晶片B的十倍,那麼即使兩個零件在最終測試中都完全正常運行,晶片A也有著十倍可能性會發生可靠性故障。 這種簡單的關係可以用數學公式1來表示,其中P(LRD)是第i個晶片包含潛在可靠性缺陷(LRD)的概率,Ni是晶片I上的缺陷總數,m是比例常數(0<m<<1)。   公式1 在最基本的I-PAT使用中,可以將一個或多個關鍵篩選層的缺陷數目加總,以獲得晶圓上每個晶片的累積缺陷數目,並對該資料採用異常零件確定方法。由此篩選出的異常晶片中包含可靠性缺陷的統計概率是最高的。有了這些資訊,汽車製造廠可以有意識權衡並劃分異常零件的離群距離與最終良率損失,並以此確定針對該元件可以接受的品質風險。圖2顯示了晶圓上四個不同製程層的晶片累計缺陷數目。 圖2 晶圓上所有晶片的缺陷率可以用帕累托圖顯示。大多數晶片只有0~1個缺陷,但是一小部分將會是高缺陷率的異常零件。I-PAT方法允許工廠選定異常零件的限度,對於給定的元件或客戶在合適的風險和良率損失之間做出權衡。 I-PAT降低晶圓篩選難度 I-PAT是一種相對簡單的方法,可以很容易地加進大多數晶圓廠的篩選方法中。一旦到位,可以透過將特定的線上缺陷類型與工廠的可靠性經驗、探針資料、老化和最終測試資料以及客戶退貨等訊息相關聯並加以改進。這將指明那些與良率和可靠性最為相關的製程層和缺陷及其界定屬性。而這些屬性,可以讓已知的可靠性風險缺陷的識別更加便捷。 一旦確定了缺陷屬性和可靠性風險之間的相關性,就可以通過為每個缺陷類型分配權重並創建每個晶片的潛在缺陷概率指數(LDPI)以提升性能。使用LDPI時,採用了相同的I-PAT統計異常晶片的原則,但現在每個缺陷都根據其可靠性風險的相關性進行了加權。 使用加權I-PAT而不是總缺陷數有助於濾除與可靠性的相關性較弱的缺陷,並提升相關性強的缺陷訊號。雖然僅僅憑藉總缺陷數篩選異常晶片就可以顯著提高晶片可靠性,但採用加權方法可以更為有效。加權I-PAT透過減少矯枉過正和要求不嚴來提供更有效的篩選。I-PAT的線上異常晶片檢測也可以與探針和測試資料相結合,在測試決策過程中加入缺陷資訊以決定邊緣晶片的去留(圖3)。該技術顯示出那些通過探針和測試的風險晶片,並且還被更有效地用於指引區域零件平均測試,發現可能通過其他方式漏網的風險晶片(圖4)。 圖3 I-PAT異常晶片缺陷識別結合探測和最終測試資料可以完善合格/濾除的決策。 圖4 區域零件平均測試(G-PAT)能夠將那些在電性測試失敗的壞晶片附近的晶片篩選出來,儘管這些晶片本身會通過電性測試。缺陷引導的G-PAT使用I-PAT來識別具有相同缺陷源的其他缺陷異常晶片,在使用先前的方法時這些晶片可能會漏網。在這個刮痕的示例中,3表示的高風險晶片可能會進入汽車供應鏈並造成可靠性故障。 透過製程控制降低整體缺陷率仍然是在汽車零缺陷環境中提升可靠性的主要方法。偏移監控和持續改進計劃是製程控制的基礎,需要時間和紀律,但對於降低製程設備缺陷率是至關重要的。新興技術,例如I-PAT篩選,正在逐漸被推廣使用。作為傳統製程控制的補充方法,篩選是IC汽車製造廠向客戶提供優質產品的最快捷和最便宜的方式。篩選技術提供了識別和阻止個別高風險晶片進入供應鏈所需的安全網,是實現自動駕駛所需的亞ppb品質目標的下一步。 (本文作者David W. Price、Jay Rathert為KLA資深總監;Douglas Sutherland為KLA首席科學家)  
0

提升設備監控功能 實現高可靠車用IC設計

半導體在汽車供應鏈中的重要性不斷地增加,這就要求IC製造商必須調整其製程並生產符合汽車品質標準的晶片。同一類IC製造缺陷不僅會導致良率降低,同時也會導致晶片可靠性降低以及可能在使用中過早出現故障。為了實現汽車IC所需的高度可靠性,必須在製造製程中更加努力並確保消除缺陷源。在本文中將探討如何提升設備監控功能,以協助汽車IC製造商實現低於十億分之一的晶片故障率。 需要提醒的是,設備監控是用以分辨晶圓廠製程機台所產生的隨機缺陷源的最佳實際手段。在設備監控期間,首先檢測控片晶圓並確定其基線缺陷率,隨後將其在特定的製程機台(或反應室)中運行,此後再次檢查。該晶圓上新添的任何缺陷都必定來自於該特定的製程機台。採用這種方法可以揭示晶圓廠中最乾淨的最佳機台,以及造成最多缺陷並需要採取改進措施的不良機台。根據製程機台的缺陷歷史資料,就可以設定持續改進的目標和日程。 半導體廠在設計製程監控策略時,必須確定他們想要檢測和監控的缺陷最小尺寸。如果歷史測試結果表明較小的缺陷並不影響良率,那麼晶圓廠會在檢測設備上採用較低的靈敏度,以便不再檢測這些較小的缺陷。這樣,他們只須關注較大的良率殺手缺陷,並避免被較小的「干擾」缺陷分散注意力。這種方法適用於那些只需優化良率的消費產品晶圓廠,但是對於汽車晶片廠呢?回想一下,良率和可靠性問題是由同一類缺陷引起的,良率和可靠性缺陷的區別僅在於它們的尺寸大小,以及/或者它們在元件圖案上的位置。因此,採用忽視較小的缺陷的設備監控策略會讓晶圓廠漏掉那些未來可能造成可靠性問題的缺陷。 此外,在一個製程層中看起來很小且無關緊要的缺陷可能在製程流程的後期產生巨大的影響,後續的製程步驟會加劇它們的影響,理解這一點非常重要。圖1中的兩個SEM圖片是在同一個晶圓上的完全相同的位置拍攝的,區別僅在於製造製程的步驟不同。左邊的圖片顯示了沉積層之後所發現的晶片上的單個小缺陷。這個缺陷以前被認為是一種干擾點缺陷,對晶片圖案或晶片性能並沒有負面影響。右圖顯示同一個沉積缺陷在金屬1圖案成型之後的情形。曾被認為是干擾點缺陷在幾個製程步驟之後改變了金屬線的成像品質。該晶片可能會通過晶圓電性測試,但這類金屬變形在汽車環境壓力下被加速形成造成實地可靠度的問題。 圖1 左圖顯示了產生於沉積層上的小顆粒。右圖顯示了金屬1圖案成型之後晶圓上完全相同的位置。金屬線缺陷由先前沉積層上的小顆粒所引起。這類金屬線變形很容易造成實地可靠度的問題。 那麼,汽車IC廠應該如何確定可能帶來可靠性風險的最小缺陷尺寸呢?首先,了解不同缺陷尺寸對可靠性的影響非常重要。例如,考慮圖2中所示的線路斷開缺陷的不同大小。晶片上有完全斷開的圖案結構可能在晶片電性測試時就會被查出,因此不會有任何可靠性的風險。晶片的線路斷開50%時,線路變窄或者其橫截面積大約不超過50%的線路,將可能通過晶片電性測試但會造成顯著的實地可靠性風險。如果該晶片在汽車上使用,實際環境條件,諸如熱、濕度和振動等,會導致該缺陷的狀況惡化並造成全線斷開,而形成晶片故障。 圖2 左側圖像顯示線路完全斷開,右側圖像顯示線路~50%斷開。左側的晶片將在電性測試時被測出問題(假設沒有冗餘線路)。右側的晶片則可以通過晶圓電性測試,但在實地造成可靠性風險。 下一步,非常重要的是了解不同尺寸缺陷會如何影響晶片圖案的完整性。更具體地說,導致線路斷開的最小缺陷尺寸是多少? 導致線路50%斷開的最小缺陷尺寸是多少? 圖3顯示了蒙地卡羅模擬的結果,這是對BEOL薄膜沉積步驟中產生的不同尺寸的缺陷所帶來影響的模擬。在垂直軸上繪製的是最小缺陷尺寸,對應橫軸上不同的金屬層間距尺寸。該資料顯示的金屬1層設計節點分別是7nm、10nm、14nm和28nm。 圖3 深色資料點顯示了對於最小金屬間距可以造成線路完全斷開的最小缺陷尺寸。淺色資料點顯示導致線路50%斷開的最小缺陷尺寸。x軸是金屬1層的設計節點,分別為7nm(最左側數據點)、10nm、14nm和28nm(最右側數據點)。 圖3中深色資料點對應於可能導致線路完全斷開的缺陷最小尺寸,淺色資料點對應的是造成線路50%斷開的最小缺陷(即潛在的可靠性故障)。在每一個節點,導致潛在可靠性故障的最小缺陷尺寸是導致線路完全斷開的最小缺陷的50~75%。 這些模擬的結果意味著為了控制和減少製程中所產生的可靠性缺陷的數量,晶圓廠需要捕獲較小的缺陷。因此與優化良率相比,這需要更高靈敏度的檢測。通常,如果針對當前節點的檢測僅僅滿足優化良率的需求,那麼針對可靠性缺陷的檢測則需要採用下一個節點更高的靈敏度。簡而言之,晶圓廠先前用於降低缺陷率以優化良率的標準將不足以用於優化可靠性。 提高設備監測所用的檢測程式的靈敏度,或者在某些情況下採用性能更好的檢測系統,將會捕獲較小的缺陷並可能揭示先前被掩蓋的缺陷率特徵分布,如下面的圖4所示。雖然對於消費品晶圓廠來說這些特徵分布對良率所產生的影響是可以承受的,但對於追求持續改進和零缺陷標準的汽車晶圓廠來說,它們對可靠性所構成的風險則不可接受。 圖4 採用適合的設備監測靈敏度時,先前被掩蓋的缺陷特徵分布通常會被揭示出來。零缺陷標準會要求對導致這些缺陷的製程設備採取糾正措施。 在製定提高設備監控檢測靈敏度的策略時,晶圓廠需要考慮幾個重要的控片晶圓缺陷檢測的因素,以找出由製程設備造成的微小的與可靠性相關的缺陷。首先,在良率已經很高的成熟晶圓廠中,很少有單一的製程層或模組會是一個直接解決方案,即能夠充分降低缺陷率並滿足可靠性改進目標,認識這一點非常重要。相反,它是多個製程層上小改進的累積,積少成多便可以達到所需的可靠性提升。由於良率和相關的可靠性改進是各個製程層的累積,因此,採用控片晶圓檢測的製程設備監控實現的可靠性提升可用多層回歸模型來最佳顯示: Yield=f(Ys)+f(SFS1)+f(SFS2)+ f(SFS3)+⋯..f(SFSN)+error Ys=系統良率損失(與顆粒不相關) SFSx=Surfscan控片晶圓檢測在不同製程層上所捕獲的顆粒累積 Error=Surfscan未能發現的良率損失機制 這意味著提升可靠性需要晶圓廠致力於持續降低所有製程和製程模組的缺陷率。其次,晶圓廠需要考慮用於製程設備監測的裸晶圓的質量。回收的裸晶圓的表面粗糙度隨著每次循環使用而增加,這個屬性被稱為霧度。霧度的程度從根本上說是雜訊,會影響檢測系統區別較小的缺陷訊號的能力。多個測試晶圓上霧度程度的不同,這會限制整體檢測程式的效果,需要進行歸一、校準和並設置霧度上限以減少該雜訊源對缺陷敏感性的影響。 接下來,晶圓廠應該確保監控步驟與實際生產中產品晶圓所採用的製程盡可能相同。為了縮短監測晶圓的流程時間而偏離實際製程可能會在無意間錯過缺陷產生的步驟。此外,過度依賴針對機械操作的檢查會完全省略製程,並且會錯過製程對顆粒生成的關鍵性影響。 在提高檢測程式靈敏度時,晶圓廠必須共同優化「前值」和「後值」檢測。通常,裸晶圓循環通過製程步驟可以「突顯」晶圓上事先存在但是低於檢測臨界值的缺陷。這些缺陷一旦被突顯則看起來更大並且更容易被檢測到。在未經優化的「後值」檢測中,這些被裝飾的缺陷看起來像「新增缺陷」,這會導致誤報和無意的製程設備停機時間。將檢測程式一起進行優化可以最大限度地提高靈敏度並增加偏移警報的可信度,同時避免耗時的誤報。 最後,重要的是對控片晶圓檢測中發現的缺陷進行檢查和分類,以確定它們與所對應的產品晶圓製程步驟中所發現缺陷之間的相關性。只有這樣,晶圓廠才能確信缺陷的來源已經被隔離並且已經採取了適當的糾正措施。 為了滿足車用電子行業對於高度可靠性的要求,IC製造商不僅僅需要監控和控制晶圓上的影響良率的缺陷數量。他們還需要將設備監控檢測的靈敏度提升至相關歷史經驗的後面的一個節點。只有具備更高的靈敏度,才能檢測並消除可能導致可靠性故障的缺陷,而不讓它們漏出到晶圓廠之外。此外,在實施設備監控策略時,晶圓廠需要仔細考慮多種因素,例如監控晶圓回收、檢測前後靈敏度以及整個晶圓廠持續改進計畫的重要性。由於對汽車半導體可靠性的高要求,提升對於較小缺陷的敏感度是最佳零缺陷持續改進計畫的重要組成部分。 (本文作者皆任職於KLA-Tencor)(本文最初發表於2018年8月的Solid State Technology Process Watch系列)
0
- Advertisement -
- Advertisement -

最新文章

- Advertisement -

熱門文章

- Advertisement -

編輯推薦

- Advertisement -