技術探勘
- Advertisement -
即時/安全/可靠 邊緣運算執行高效機器學習
舉例來說,如ILSVRC影像分類競賽(圖1),在這場競賽中即是使用一種稱為機器學習(ML)的人工智慧─AlexNet早在2012年就贏得這場競賽,成為第一個使用深度神經網路和GPU來進行訓練的模型;而ResNet-152在2015年的影像分類競賽中亦擊敗人類。
圖1 影像分類中機器與人類的比較
電腦優於人類的其他範例還包含遊戲,表1中的範例是機器擊敗人類冠軍以及人類仍較優秀的非競賽情境。
機器學習無疑為智慧家庭、智慧零售、智慧工廠和智慧城市之類的應用情境帶來全新美好的必要功能,且現今各種企業都能利用這項技術。運用此技術的相關機器學習雲端服務供應商有亞馬遜(Amazon) AWS、SageMaker、微軟(Microsoft) Azure ML和Google Cloud ML,而這類機器學習雲端服務的成長都極為驚人。
邊緣執行ML流程簡化
直到最近,因為推出各種運算和儲存資源,機器學習的重心都集中在執行大量集中式電腦中心的雲端,其快速移轉至邊緣有以下幾個原因:
.雲端處理、儲存空間與頻寬的成本無法將資料傳送到雲端,以執行人工智慧功能的決策。
.較完善的使用者體驗需要在邊緣進行快速的人工智慧功能決策。
.隱私權和安全性考量會限制在雲端中儲存的資料類型。
.提升可靠性。
以上這些因素讓邊緣無庸置疑成為機器學習處理許多應用的顯著位置。這也是半導體廠商推出運用專屬高效能機器學習加速器之應用處理器的原因之一,像恩智浦(NXP)的i.MX 8M Plus使用14nm FinFET製程技術,提供高效能與低功耗,並具備雙鏡頭ISP在內的各種新功能,可支援兩個低成本的HD相機感測器或一個4K相機感測器,以執行臉部、物件和手勢辨識的機器學習任務。其中也整合獨立800MHz Cortex-M7來支援即時任務與低功率、H.265和H.264的影片編碼和解碼、800MHz HiFi4 DSP,以及用於語音辨識的8PDM麥克風接口。工業物聯網功能包含Gigabit乙太網路與時效性網路(TSN)、兩個CAN-FD介面和ECC。
另一方面,資料科學家正為在邊緣上部署的資源限制裝置最佳化特定演算法,進而協助加速移轉到邊緣。MobileNet是由Google開發的影像分類演算法,著重在高準確度,同時又能大幅減少所需的運算資源數量。圖2中顯示處理過程中大幅減少的趨勢。從VGG-16模型到MobileNet v2模型的轉變讓在邊緣所需的運算數量減少50倍,協助在邊緣的資源限制硬體解決方案,執行複雜的機器學習處理。
圖2 針對邊緣最佳化的NN演算法
同樣地,使用行動電話在邊緣執行MobileNet v1比起在雲端中執行MobileNet v1的速度明顯更快,此差異的成因是將雲端網路延遲降到最低,而網路往返延遲的新增範圍可以輕易橫跨200毫秒到超過1.4秒(大幅延遲回應時間)。該演算法的目標是達低於100毫秒的回應,以即時向使用者顯示(圖3)。
圖3 在邊緣更快速的使用者體驗
以下是i.MX 8M Plus支援的應用程式,這些應用程式會在邊緣執行機器學習。如圖4所示,這些使用案例都需要特定層級的效能來判斷需要哪種層級的執行硬體。這就是應用處理器須具備專屬機器學習加速器的主因。
圖4 機器學習使用案例
因為上述原因,便可較易理解為何要在邊緣執行機器學習應用。然而,必須符合幾個額外需求才能順利完成部署:
・機器學習開發人員的生態系統─讓實作變得簡單。
・硬體安全性─保證隱私權與安全性。
・全新、創新的混合SoC架構─提供符合成本效益的解決方案。
・可擴充和安全的邊緣部署─讓部署變得容易。
打造適用於機器學習部署的全面性生態系統
機器學習應用的重大突破需要結合設計與部署的生態系統來負責處理任務,這也是半導體業者打造創新邊緣智慧工具環境的原因,以恩智浦eIQ為例,該工具支援各種機器學習處理元件,包含Arm Cortex-A和Cortex-M處理器、圖形處理器(GPU)、DSP和機器學習加速器。eIQ機器學習軟體環境包含推論引擎和程式庫,兩者皆利用開放原始碼機器學習技術中的改善技術,像是TensorFlow Lite、OpenCV、CMSIS-NN和Arm NN;而針對較熱門的i.MX RT應用處理器,則透過適用於MCUXpresso和Yocto(Linux)的開發環境進行評估,為應用開發過程提供順暢的支援;在物件偵測和語音辨識中的範例應用程式中會隨附eIQ軟體,作為邊緣機器學習的起點(圖5)。
圖5 eIQ機器學習開發環境
確保邊緣安全性
邊緣的安全性至關重要,其所需的功能包含安全啟動信賴起點、晶片內建加密、安全布建、相互裝置驗證、安全裝置管理、OTA或無線安全更新與生命週期管理。為了支援這樣的安全性,半導體業者打造了可擴充的EdgeLock組合,其中包含安全元件、安全驗證器和應用處理器的嵌入式安全以及MCU。像是i.MX 8M Plus具備進階EdgeLock嵌入式安全系統(含資源網域控制器、信任區、HAB、加密啟動、使用RSA的公開金鑰加密與橢圓曲線演算法),其可為邊緣節點提供完整性、驗證確實性和隱私,並提供從邊緣到閘道和雲端的安全性。
AI/ML領域更迭不斷 加速人們生活便利性
人工智慧領域的變化步調正逐漸加快。如圖6來自「2018年人工智慧指數」和Monster.com所示的圖表呈現深度學習職缺方面的趨勢。
圖6 2015~2017年所需人工智慧技能的職缺成長
至於圖7則顯示在公司盈餘會議中提到人工智慧和機器學習的次數。
圖7 2007~2017年公司盈餘會議提到次數-IT公司
人工智慧與機器學習為電腦產業中帶來劇烈的改變,這樣的改變可使人們的生活更便利完善。新應用處理器如i.MX 8M...
落實汽車天線罩測試 車用雷達干擾影響大減
可為駕駛提供幫助,並能夠提高道路安全性的高級駕駛輔助系統現在已整合到入門款車輛,成為汽車世界中的常見技術。全自動駕駛汽車(包括測試汽車)經常會成為新聞頭條,尤其是在自動駕駛車輛發生事故後。這些複雜系統在準備批量生產前還有很長的路要走,但可肯定其會於不久的將來成為現實。
汽車雷達感測易受干擾
能夠偵測附近物體的感測器是自動駕駛汽車的關鍵元件,這些包括攝影機和雷射雷達感測器,尤其是雷達感測器更為重要。現今每年生產數以百萬計的汽車雷達,為高階車輛中的標準裝置。汽車雷達感測器主要用於提高駕駛舒適性和預防事故,大多支援主動車距控制巡航的雷達感測器均在76GHz至77GHz頻率範圍(1GHz頻寬)內運作,用以感測遠處其他車輛和物體。汽車雷達要實現一些先進功能,特別是能夠感測附近物體的功能,如變道輔助和盲點偵測等,需要其於77GHz至81GHz頻率範圍內運作,以更大頻寬才能實現所需高解析度;且高達81GHz的擴展汽車頻段有助於減少無線電干擾。
由於汽車外觀比功能更重要,汽車雷達通常被雷達罩覆蓋,該雷達罩由對RF訊號透明的材料製成。汽車散熱器格柵上的標誌通常用於雷達罩用途,塑膠保險桿也是雷達良好藏身之處。過去標誌主要用於推廣品牌,而無其他重要作用,但現可作為雷達天線罩,因而更像RF零組件。若於設計中不考量此點,則可能對標誌後的雷達探測性能及準確性產生不利影響。
尤其是具有局部材料厚度變化的三維形狀品牌標誌可能會導致在毫米波段運作時導致出現RF性能問題。保險桿通常塗有金屬漆,可減弱高頻訊號。因此為確保雷達可靠性,必須驗證天線罩的材料屬性並檢查其對雷達訊號的影響。對自動駕駛而言,汽車感測器的不確定性和風險皆無法接受,基於以上產生的錯誤皆無法透過後續處理而充分糾正。因此車輛製造商及其供應商需要全新量測功能,以便評估天線罩雷達一致性。
雷達偵測精準度受多方影響
汽車雷達感測器主要使用頻率調變連續波(FMCW)訊號。由於傳播延遲和都卜勒(Doppler)頻移,這些感測器可量測並解析多個目標的距離及徑向速度。根據天線陣列特性,還可量測和解析方位角甚至至仰角。在偵測及追蹤後,感測器電子裝置處理訊號以生成目標參數清單,其中包含物件量測位置、速度以及類型訊息(行人及汽車等)。此清單將被發送至車輛電子控制單元,用於即時決策車輛操控。因此該資料的準確性和可靠性對車輛及乘客安全極為重要。
雷達精度取決於多因素,如硬體零元件、軟體處理和雷達回波本身。具有低訊噪比(SNR)的訊號回波參數無法像高SNR訊號一樣精確量測。此外,諸如多路徑傳播和天線罩等引起的失真也大幅影響量測精度;方位角量測誤差會導致目標看起來與實際位置有偏差,如圖1所示。雷達感測器角度量測誤差僅為1O,將導致100m外的目標看上去橫向偏移1.75m,以致被誤認處於不同車道。為確保可靠運作,在此距離下角度量測誤差須遠小於1O。
圖1 由於方位角量測錯誤,未正確檢測到目標位置,自動駕駛車輛控制器可能會做出致命動作。
天線罩選用決定雷達偵測精度
圖2顯示基於實際汽車零組件量測結果得出的方位角偏差影響,其中商用汽車雷達與靜止目標距離為12.4m,角度為11.5O,該圖顯示不同天線罩如何影響雷達的橫截面和入射角。以A區顯示值(無天線罩)也在此提供用於比較;可以看出當使用合適天線罩(B區)時,對入射角的估算無影響,但雷達橫截面會以兩種方式減小(在此狀況下約為2dB);若使用不合適的天線罩(C區),相對於比較量測值,平均雷達橫截面下降約4dB,使其難以偵測弱反射目標。不合適天線罩對偵測入射角的影響亦明顯。在恆定11.5O時無法看見,但在11.5O和11.7O間交替變化時則可顯示,因此訊號處理電子裝置不會獲得明確值。使用該天線罩,汽車雷達無法達到0.1O的目標精度。
圖2 不同天線罩對雷達橫截面(RCS)和入射角影響,不相容天線罩會導致角度誤差。
多因素考量輔助雷達校正
現代雷達感測器在接收器前端通常具有天線陣列,透過量測由相控陣天線波束成形獲得的相位和振幅比確定方位角(有時還可確定仰角)。為獲得最佳方位角精度,必須單獨校正每個雷達感測器。以下是雷達校正的典型程式:首先將感測器安裝在消聲室內轉盤上,遠場中已知距離的角反射器通常作為參考目標;量測雷達方向圖並將其儲存於感測器記憶體(Memory)中,再由偵測演算法使用,於訊號處理過程中校正演算,並於運作期間完成。
車輛製造商通常在標誌或保險桿後方將校準的雷達感測器整合至車輛。由於訊號必須在到達目標和從目標返回過程中兩次穿過天線罩材料,因此天線罩材料對於RF傳輸訊號的減弱出現兩次。從以下分析可看出其減小雷達偵測範圍。
根據訊號傳播定律,訊號傳輸後功率與距離r的平方成反比,代表在訊號往返過程中,其功率將減小因數1/r4。對於具有3W輸出功率、25dBi天線增益、雷達目標橫截面為10m,而訊號偵測臨界值為-90dBm的77GHz雷達使用此等式,配置最大範圍為109.4m。若天線罩雙向減弱為3dB,則同一雷達最大距離將減少16%,僅為92.1m。
但材料減弱並非減低雷達性能的唯一因素,天線罩材料的反射率和均勻性也很重要。例如塗漆中金屬顆粒的反射以及基礎材料的射頻失配會在天線罩內(即靠近感測器位置)產生干擾訊號,後者於接收器鏈路中被接收和下變頻,進而降低雷達偵測靈敏度。許多汽車製造商試圖透過傾斜天線罩減輕此影響,使發射的雷達訊號反射至其他處,而非直接回到接收器前端。但此種解決方案會受設計限制,且無法消除導致RF能量損失的寄生反射。
另一個問題則是,天線罩中夾雜物和密度變化等導致材料不均勻,會干擾出射和入射波前,因而可能失真,並降低角度量測準確度。雷達感測器校準無法補償此種影響,因為即便雷達校準後也可能安裝在不同製造商的天線罩後面。
傳統黃金裝置偵測死角易現
天線罩製造商通常使用參考雷達(黃金裝置)測試其產品。對於這種測試,將角反射器以事先預定距離和方位角安裝在雷達前面(圖3),分別在有和無天線罩的情形進行差動量測再加以比較。若雷達測定距離和方位角以及回波訊號在指定範圍內,天線罩測試始合格。但此方法僅檢查特定方位角,易錯過天線罩中有問題的區域。另一種量測方法以類似方式操作,但僅需一個反射器—將雷達感測器和天線罩安裝至轉盤,以不同角度重複量測,可從轉盤讀取實際角度(地面真實狀況)並與雷達測得角度比較。該方法與轉盤定位精度一樣精確,但因測試需長時間故不適用於生產線測試。
圖3 使用黃金裝置的典型測試設置。
天線罩測試儀克服傳統限制
有方案能克服傳統方法的局限,像是羅德史瓦茲(R&S)QAR汽車天線罩測試儀(圖4)使用具數百個發射及接收天線的大型面板代替具微小天線陣列的黃金裝置,這些天線在75GHz至82GHz的擴展汽車雷達頻率範圍運作,使汽車雷達綜合數百個天線資料;由於具大孔徑,可憑藉更高解析度(mm範圍內)量測距離、方位角和仰角,使量測結果(即反射率)顯示為X射線影像,即便測試及量測經驗受限者也可立即進行品質評估。與使用真實雷達量測不同,此方法毋需費時量測順序以確定天線罩特性,只需一次時程即可獲得結果,類似使用攝影機拍照。
圖4 R&S QAR汽車天線罩測試儀。DUT安裝在操作台前邊緣,桌台上的藍色裝置包含用於傳輸量測的可選mm波發射器。
被測天線罩放置於面板前的指定區域,可進行兩種量測,一種用於確定被測裝置(DUT)反射率,另一種用於確定透射率。
首先進行反射率量測以確定天線罩材料反射多少能量,此能量無法透過天線罩。如上所述,反射訊號會降低性能,甚至損害正確運作。由於各種原因,某些區域可能具有較高反射率,如材料缺陷、空氣夾雜物、不同材料層間的有害相互作用或某些材料組分過多等。透過根據幅度和相位連貫使所有反射訊號連接,該量測方法提供空間分辨量測結果,而視覺化結果能直觀、定量評估DUT反射特性。
圖5 反射率(左)和單向衰減(右)的高解析度mm波影像。標誌中的白色輪廓表示測試發射器或雷達輻射橫截面,該區域用於評估。
圖5中高解析度雷達影像顯示演示用天線罩(圖6)覆蓋下雷達感測器看到的影像,亮度水準代表反射率、區域越亮、反射雷達訊號越多;金屬物體(四角螺釘)顯示為白色,標誌清晰可見的輪廓顯示局部高反射率和非常不均勻的整體影像;標誌區域中較大的0.5mm厚度足以大幅降低雷達性能。
圖6 演示天線罩,僅在天線罩主體表面上方突出0.5mm,即便厚度微小增加也會導致在77GHz時失配。
此示例中天線罩中間部分平均反射率為-11.0dB,標準差為-18.2dB,在許多使用場景中此值過高,無法確保雷達可靠操作。實際上預期反射率取決於雷達單元靈敏度和欲覆蓋的最大偵測範圍。
接下來量測天線罩材料的頻率匹配及衰減。位於DUT後的發射器在選定頻率跨度掃描,可精確評估天線罩的發射頻率回應,回應可提供有關DUT用於雷達操作確切頻段上RF匹配的詳盡訊息,其與雷達使用的實際訊號波形無關,因此對可安裝在天線罩後的雷達均有效。圖6右側圖則顯示演示天線罩的量測結果,由於76GHz至79GHz之間的高波紋度,該天線罩不適用於在該頻段操作的雷達。
若使用汽車行業真實3D天線罩的傳輸量,可測得圖7中類似鋸齒狀的曲線,該天線罩會遇到各種性能問題:
頻率匹配位於不太有利的71GHz左右而非於76GHz,是因某些天線罩層厚度增加所致;79GHz頻帶中不穩定的減弱變化表明駐波比顯著增加,表示天線罩邊界處反射及強烈干擾效應;總體單向(One-way)衰減相對較高,將導致偵測範圍顯著減小。
圖7 在一個複雜3D設計商用多層天線罩上進行的透射率量測。
準確感測實現安全自駕
自動駕駛需可靠雷達正確無誤偵測周圍區域物體,可行性取決於雷達品質及其安裝狀況。雷達安裝在品牌標誌或保險桿後,車身部件(天線罩)會減弱訊號,以致無法偵測物體或於錯誤位置偵測到。當下此類部件不僅需滿足其原始目的,且須具備特定RF特性,並以準確實用的量測方法驗證。相較黃金裝置,此測試儀能更快、更易評估汽車天線罩品質,不僅量測DUT的RF透射率,進而帶出天線罩設計的基本適用性,並量測反射率而視覺化為X射線影像,亦可讓非專業人員進行可靠合格/失效評估,對於生產線終端測試尤為重要。
(本文作者皆任職於羅德史瓦茲)
排除邊緣案例缺陷 影像辨識精準度再上層樓
感知系統工程師以人工方式標示影片中的物件,再為自駕感知系統編程,做出正確回應的過程耗時又昂貴,因此以人工方式辨識和標示每個邊緣案例,並非合理做法。此時ANSYS SCADE Vision便能派上用場(圖1),其為一種以全像(HologrSam)為基礎的軟體工具,能迅速且有經濟效益辨別數百種潛在邊緣案例,以解決AI支援感知系統中既有的弱點,感知工程團隊可進而取得時間、成本及安全優勢。根據最早採用此創新科技的業者表示,該軟體工具偵測邊緣案例速度可達人工的30倍。
圖1 感知工程師透過SCADE Vision偵測案例,進行安全分析
感知系統扮演AI核心
以近期科技發展而言,很少有比自動駕駛車、飛機、無人機和機器人更能激發媒體與大眾想像的事物,因為這些自駕系統運用極端複雜又涉及高度工程專業的AI和機器學習,為生活帶來革命性的變化。
雖然自動駕駛車或機器人的每個零件都有重要功能,但其中感知系統最關鍵,系統必須正確看到、辨識及回應周遭環境的數百種元素,藉此複製人類視覺和認知。
當感知系統出錯時,便可能威脅生命,因此工程師在設計系統時,會將其編列成車道標示、紅綠燈和行人等常見物件,工程團隊再針對如何回應這些物件進行定義和編程,像是啟動剎車系統或將車輛轉向至道路中間。不過無論工程師再如何細心徹底研究真實世界路況,並定義常見物件,但必定會出現失誤,導致產生感知系統潛在弱點,例如乘坐嬰兒車的小嬰兒或使用輪椅的成人,感知系統可能難以辨識不尋常的大小及生理輪廓,霧氣或眩光等天氣和照明效應也可能混淆感知系統,將其詮釋為實體物件而非光學現象。此類事件因難以分類及解決,因此被稱為「邊緣案例」。
此類問題需增強以AI為基礎的感知系統能力,以便在遭遇邊緣案例時正確辨認和回應物件,對自動駕駛車和機器人的安全可靠作業而言至關重要。在人們未能成功解決邊緣案例前,皆無法確保自駕系統在關鍵狀況下的效能(圖2)。
圖2 SCADE Vision透過記錄駕駛經驗關鍵區域及確認邊緣案例,以便替AI感知系統編程,以辨識這些非典型物件和形狀
人工篩選成本所費不貲
以往感知系統開發者的作法是,讓軟體工程師觀看數百小時實際駕駛拍攝的影片,辨別及處理邊緣案例。
這些開發者會標示每個不尋常物件或邊緣案例,再替AI感知系統編程,確認實體物件並做出適當回應。人工除錯流程需大量投資,實際上要徹底觀看560小時的影片,可能需2,100小時,非常昂貴且耗時;不僅拉長自動駕駛車開發時間以致競爭劣勢,亦會大幅增加高額的自動駕駛車認證作業成本而侵蝕利潤,如有家大型車廠曾公開表示聘用1,500人觀看和標示實際駕駛影片,每月人工標示影片超過百萬個畫面。
考量自動駕駛車有如此龐大商機,如此時間和人工成本不符合商業效益,但只有當感知系統能通過大範圍操作設計領域(Operating Design Domains, ODDs)的測試和驗證,例如在多元化用路人、各種天候和照明狀況,及多種路況情境下,才可能推出全方位自駕產品。基於此因,可以印證自駕車市場的未來與成本效益及感知問題息息相關。
感知系統分析使效率最大化
為考量感知系統開發者實際需求,ANSYS回應上述挑戰並設計SCADE Vision解決方案。此方案能自動偵測系統弱點,將邊緣案例和認證感知系統成本最小化;透過檢視感測器影片資料,同時執行AI感測系統演算法,進一步擴大關鍵區域分析,其目的為複製部署系統時將碰到的多種狀況,在不需人工的情況下自動辨別及標示任何異常。
該方案引擎一旦分析視聽(Audio-visual, AV)資料庫,使用介面便會協助分析師,建議將感知軟體的可能缺失部分分類為觸發事件或根本原因,以此辨別系統弱點。
該解決方案會自動針對感知演算法開發和安全團隊生成報告,內容包括處理主要觸發事件的修正行動建議,以及缺失範例及相關影像,有助於組織分析結果,有利於與AV感知軟體開發團隊和虛擬回饋循環(Virtual Feedback Loop)內的其他相關人士溝通。至於使用該解決方案的效率,若以10輛車的車隊一天收集資料八小時、一周七天為例,合計560小時的影片,開發團隊利用自動化分析將人工分析所需的2100小時縮減至60小時,不僅將篩選時間加快30倍,也將人工成本減少約24.5萬美元。長久下來,這些優勢對開發和確認自駕汽車或飛機的速度可能產生關鍵性影響。
SCADE Vision會區隔駕駛數百小時捕捉到數百張畫面中的邊緣案例,再將影像編程納入以AI感知軟體,過程快速,緊接著自駕系統開始學習在遭遇邊緣案例時的回應方式(圖3)。
圖3 ANSYS SCADE Vision可以自動偵測和標示數百小時影片中值得關注的地方,不需人工介入
多效益克服辨識難題
現今軟體任務很少針對AI支援感知系統而開發,如自動駕駛車、飛機和機器人等複雜或具關鍵重要性的問題。
此外,過程消耗許多時間和資源,諸多企業皆在爭取率先推出前瞻性自駕產品上市。
此方案可提供以下附加效益,力助開發團隊克服重大障礙:
.更安全/更精確感知:
軟體工具針對感知系統固有問題設計,使效能更一致可靠,若配合傳統影片捕捉和道路測試,可最大化系統安全信心。
.更快實現產品價值:
軟體工具除了改善感知系統效能品質,還能加速開發週期,相較於人工分析需數千小時,自動辨認邊緣案例的相關影片畫面只需數十小時。
.放大工程資源:
對稀有的工程資源而言,以人工檢視數十小時影片為低價值的操作方式。軟體工程師可將該程序自動化,將時間和注意力放在更有策略性的加值任務上。
.提升產品開發流程:
自駕載具系統認證是自動駕駛車、飛機商業化及上市主要挑戰之一。該軟體工具可排除多個小時的單調人工作業,替認證程序再充能,創造有意義的競爭優勢。
.大幅節省成本/改善利潤:
媒體多聚焦於自動駕駛車、飛機和機器人開發、測試和辨識的高額成本上。市場領導業者在爭取率先推出產品上市之際,已成為承擔高風險的賭徒。該方案可加速並自動化解決真實邊緣案例問題,排除數千小時的人工作業時間並大幅降低成本。
現今全球的注意力都聚焦於自駕產品的挑戰。全世界每家汽車、飛機和機器人產業的企業莫不急切盼望率先推出經過認證、失效安全(Fail-safe)的自駕產品系統上市。若要保障自動駕駛車、飛機和機器人在各種潛在運作環境下皆能提供安全可靠的效能,必須克服許多工程挑戰。
好消息是,眼下此解決方案能助企業減輕AI感知系統的基本工程問題。SCADE Vision可將辨別邊緣案例過程自動化並大幅加速,排除整體開發週期重大時間和金錢成本。
最早採用此類創新科技的業者指出,偵測邊緣案例的速度可達人工方式的30倍,帶給其先馳得點的重大優勢。
(本文由ANSYS提供)
遵循設計訣竅 汽車RF設計挑戰迎刃解
無線汽車設計複雜度與日俱增
過去單純的交通運輸模式,已經轉變為具有複雜電腦系統的車輛,能夠讓車輛本身及我們與周遭世界連結在一起。現在車輛不但能夠自動駕駛、透過網路通訊,還可提供娛樂功能,而分析師預測,上述趨勢只會繼續成長。
根據McKinsey & Company的資料顯示,未來幾年內聯網車輛的數量每年將增加30%;於2020年前,有1/5的車輛能連上網際網路。
Strategy Analytics預測車輛處理及先進駕駛輔助系統(ADAS)RF前端(RFFE)市場,將以17%的年複合成長率(2017~2022)成為最大市場。所以汽車RF工程師要如何設計聯網車輛?首先探討的是如何克服一些汽車設計中最大的RF挑戰。
現今車輛配備許多電子裝置與世界連線。對RF系統而言,代表出現大量RFFE鏈,因車輛製造商在汽車設置更多的電信設備。圖1為一般系統範例。
圖1 汽車RF系統示意圖
汽車RF生態系統的變化,對RF系統設計人員造成以下幾項挑戰:
.整合眾多標準至車輛之中,有時需要整合為單一模組。
.因應共存疑慮,因為上述許多標準彼此之間非常接近。
.盡可能減少電子元件散發的熱能。
.因應更高的耗電量疑慮,因為所有車輛設備都使用相同的電瓶電源。
.確保產品元件具備長期可靠度。
以上挑戰不僅只存在於汽車業,而克服挑戰的策略則與其他應用類似,例如 Wi-Fi連線及行動裝置。
以下提出部分基本設計訣竅,以選擇適合汽車的RF元件:
.使用高度線性的主動或前端裝置。
.使用的元件要能在RFFE盡量降低插入損耗,並降低整體RF鏈路預算。
.留意RFFE效率、電流消耗及功率消耗等問題。
.使用高效能RF濾波器盡量減少插入損耗、溫度漂移及干擾。
.考慮使用能在單一封裝整合發射、接收及濾波功能的元件。
.使用符合汽車規範且遵循IATF及IEC業界標準的產品。
接下來將更深入探討各項設計考量因素,範圍涵蓋RF共存、整合、天線設計、熱管理、電瓶續航力及車輛可靠度。
設計無線汽車 RF共存問題待解決
串流影片使用者期望在車內享有快速可靠的服務,由網路及車內串流正迅速成為標準需求。因此重要的是盡可能減少共存問題,並在維持串流服務時降低線路損耗。不過在無線頻段及標準之間達到最大程度的共存非常困難。如果沒有使用適當的濾波功能,就會增加以下頻率發生共存問題的機率。
2.4GHz:Wi-Fi及行動通訊,例如LTE頻段41;Wi-Fi及藍牙;SDARS(衛星數位音訊無線電服務)及LTE。5GHz:Wi-Fi及V2X(802.11p及C-V2X);V2X及U-NII(非正式國家資訊基礎建設)頻段,尤其是U-NII-3。在2.4GHz(圖2)及5GHz(圖3)頻譜圖之中,顯示聯網汽車使用的無線技術頻寬有多麼擁擠。所以減輕以上共存問題的最佳方式為何?部分最佳實務包括在設計中使用高效能RF濾波器,以及高度線性的主動裝置。
圖2 2.4GHz頻譜圖
圖3 5GHz頻譜圖
.濾波器可減少無線電訊號之間的頻外干擾。
.共存濾波器可針對發射訊號減輕可能的減敏作用。
現今車輛通訊可在天線與收發器之間支援許多發射及接收路徑,而隔離這些路徑需要使用濾波器。這類濾波器必須由共存頻帶提供隔離、具備低插入損耗,盡可能降低發射耗電量;以及最佳化接收器靈敏度。
整合為RF設計要素
行動電話產業已由獨立元件轉為高度整合的系統模組。由於汽車在相同的整體車輛體積之中納入更多連線功能,汽車製造商也必須進行相同的轉移程序。
將更多功能整合至前端模組(FEM)或濾波器模組,有助於簡化RF設計(圖4)。
圖4 更多功能整合至前端模組或濾波器模組,有利降低RF設計複雜度。
這有什麼好處?整合適當的濾波器技術,可在本質上協助處置前述的共存問題,以及熱能挑戰。
車輛工程師過去只需要擔心GPS及藍牙,但現在設計時必須遵循C-V2X等新的無線標準,未來則需要因應5G新無線電(NR)規範。設計人員必須瞭解圖5顯示的所有技術,同時將其納入汽車設計之中。其中最可能的方式,就是將行動電話技術當作跳板。為此,Qorvo工程師打造RF Fusion協助客戶利用整合式解決方案,可有效降低設計複雜度,加速上市時間。許多這類複雜模組都包括嵌入式濾波器,可進一步降低RF複雜度及整體鏈路預算。
圖5 車輛工程師現必須了解更多新的無線技術並納入汽車設計中。
RFFE靠近天線有助提升訊號
請想像一具鯊魚鰭天線連接至纜線,而纜線則連往汽車其他位置的低雜訊放大器(LNA,通常位於儀表板)。使用纜線連接是傳統車輛製造普遍的實務作法,不過長距離的纜線連接,可能在天線與RFFE之間造成插入損耗(增加鏈路預算)。這種作法也會在LNA輸入增加雜訊指數(NF),尤其是行動通訊及Wi-Fi環境,並會降低訊號及接收器靈敏度。如果天線能夠接收更低的功率位準,就代表靈敏度提升。
對抗這項問題的方式之一,就是讓車頂鯊魚鰭內部的天線及RFFE元件盡可能靠近訊號輸入,並位在任何纜線之前。將RFFE整合靠近天線,就可以盡量減少 NF及提升訊號效能,而降低NF也有助於接收器靈敏度(圖6)。
圖6 降低NF有助提升接收器靈敏度。
同樣方法也可用於加強天線的發射功能。減少纜線連接,並將功率放大器(PA) 設置在最靠近天線的位置,將有助於降低插入損耗及耗電量。如果發射側在傳送訊號之前需要更多功率,也可以在鯊魚鰭使用補償器放大訊號,補償纜線長度造成的損耗及鏈路預算。
克服熱能挑戰需留意三大關鍵參數
溫度是車輛主要關鍵設計挑戰之一,包含車內及外部環境,當車輛溫度升高,將會影響系統層級的RF調校及效能。所有無線連線及電子裝置在同樣狹小的車輛體積中持續運作,因此會在受限區域內增加輻射熱。
熱能也會影響可靠度,可能危害汽車的各項安全功能。嘗試減輕熱能問題時,需要留意以下關鍵參數,分別為RFFE效率、電流消耗與功率消耗。
設計人員可使用的部分散熱方法為傳導及對流冷卻,不過僅限於車內使用。產品的精巧外型則讓熱能挑戰更加複雜。以下技巧可協助處置與熱有關的RF問題:
1.使用元件製造商提供的PC板布局檔案及評估板。最理想的作法就是要求及使用製造商設計,因為其布局在散熱及熱效率方面經過最佳化處理。
2.使用最低或沒有溫度偏移的RF濾波器。對汽車系統而言,必須使用具備出色溫度穩定度、低插入損耗及高品質因數的溫度補償濾波器(例如Qorvo的BAW技術),協助對抗各項熱(及共存)相關問題。BAW技術的溫度穩定度平均比SAW高出50%。
3.使用高度線性的前端產品。使用高度線性的前端產品可維持PA效率,有助於最佳化系統效率並減少產生熱能。請務必讓RFFE的插入損耗維持在最低程度,尤其是在高溫運作時。RFFE效能不彰會影響整個汽車系統的電流消耗,加重系統處理器的工作負擔,進而產生熱能、系統退化及消耗車輛電瓶等問題。
三大方法延長電瓶續航力
2017年的J.D. Power車輛可靠度研究(J.D. Power Vehicle Dependability Study)指出,電瓶故障首次名列車主面對的前十大問題。其中的調查結果顯示,在無關一般磨耗的部分,電瓶是最常更換的元件,三年車齡的車輛中有6.1%更換電瓶,比2016年增加了1.3%。這項研究認為,眾多新型複雜的車載電子系統(例如車用資訊娛樂系統、智慧型手機連線、語音辨識及免鑰匙系統)所增加的電流消耗,拖累了電瓶續航力。解鎖及啟動車輛的遙控鑰匙(Key Fob)就是其中一個例子。車主為了便利使用這項技術,卻可能耗盡汽車電瓶。如果遙控鑰匙放在車輛附近或內部,發射器及接收器就會持續通訊,對車輛進行回音檢查。測試顯示如果將遙控鑰匙放在車輛附近,電瓶電量耗盡的速度會比放在車外更快。隨著各種新型的無線及有線技術進軍汽車領域,請務必採取下列作法延長電瓶續航力:
.使用低耗電量的目標裝置解決方案。
.瞭解閒置及運作期間的RFFE耗電量。
.使用最低或沒有溫度偏移的濾波器。
通過認證確保RF可靠度及長期效能
對RF半導體供應商而言,汽車電子裝置部門提供穩固的營收成長前景。像是ADAS、電動車、人機介面(HMI)及連網車用資訊娛樂系統等應用的創新成果,正帶動半導體領域提供更豐富的產品,而汽車工程師必須讓RF及其他子系統緊密地配合運作。這類半導體產品也用於因應汽車業嚴格的可靠度要求。使用商用零件取代符合汽車規範的專屬產品,或許是很吸引人的作法。不過選擇專為汽車應用設計,並且通過IATF及IEC認證測試的產品,可協助確保RF系統能夠長期運作。
總而言之,汽車製造商以破紀錄的飛快速度演進發展,因應消費者在外行動的無線連線需求,並打造更能自主操作的汽車。在這項演進發展過程中,車輛內外的RF技術將更為重要。汽車製造商使用高度整合的RF元件,並以創新的智慧型手機技術為跳板,就可享有優勢開發未來的連網自駕車。
(本文由Qorvo提供)
智慧光學感測器拳拳到肉 筆電顯色/測距更趨精準
ALS為當今全球筆電標配
環境光感測器(ALS)現在幾乎成為新NB市場的標準功能。如圖1所示,通常將ALS放置於筆記型電腦顯示螢幕的頂部邊框上,以連續檢測和監視使用者環境的光線狀況。藉由採用ALS,筆電會根據環境光的狀況將螢幕亮度向上調亮或向下調暗。這樣做的主要好處是減少螢幕背光功耗並增強使用者的視覺體驗。
圖1 環境光感測器在筆記型電腦上的配置。
在筆電中設計ALS時需考慮諸多因素。數位ALS解決方案有幾點優於類比方案:
.使用數位接口,可以連接多個元件在同一路I2C線路上。
.可從極暗到明亮的日照流明情況下提供靈活性功能。
.可藉由可編輯式功能降低雜散光源與50/60Hz閃爍光抑制。
.中斷功能可節省電池電量,不需像類比方案持續性的輪詢。
.透過專利雙二極管技術阻擋不需要的IR能量。
XYZ感測器精準掌握真實顏色
與單純使用ALS感測器相較,色彩XYZ感測器是種優良的升級體驗(圖2)。不僅提供環境流明Lux訊息,亦提供筆記型電腦使用者詳細環境光色溫。
圖2 CIE色彩圖中的普朗克軌跡。
對人眼來說XYZ感測器為最自然的光譜,因為RGB感測器無法計算色度坐標(xy)。某些光源不在普朗克軌跡(虛線處),僅使用RGB測量顏色會導致測量光源顏色時出現重大誤差。
而XYZ顏色測量精度是RGB的5倍,人眼可以輕易檢測XYZ感測器測量精度範圍內的顏色變化。藉由接收XYZ訊息,NB可以獲得準確環境光CCT訊息及數據。
因此LCD顯示器可以動態調整面板色溫以適合使用者環境的色溫,稱之為白平衡,而不只是基於當前LCD顯示器製造的固定CCT校準點(通常LCD顯示器在6500k CCT下校準)。
而艾邁斯半導體(ams)的TCS3430為XYZ三色彩感測器之一,色域與人們對光的感知相匹配。除準確的XYZ訊息外,其還具備以下技術:
.最小化紅外光和紫外光譜成分影響
.降低功耗。
.藉由啟動量測IR光的斜率以偵測IR光源。
.在變化光源照明條件下可實現準確的色彩和ALS。
.最小化移動與暫態誤差。
藉由校準技術,其於各種光源條件均可達≤0.01Δxy色度精度≤3%CCT誤差(CCTe)(表1)。
表1 TCS3430在各種光源下的Lux/CCT
飛時測距實現使用者存在偵測
飛行時間(ToF)感測器是用於手機和3D應用的創新技術,如圖3所示,用於喚醒接近目的,其測量紅外光傳播到物體並反射到ToF感測器以偵測物體距離的時間。由於光速非常快,因此ToF SoC需要使用超短(ps)及精確的時間數位轉換器(TDC)以精確測量距離。
圖3 飛時測距(ToF)技術。
當在NB平台中使用ToF技術,可偵測使用者是否坐在顯示器前。如果是,則筆記型電腦的顯示螢幕將立即喚醒以供使用者登錄,毋須觸摸鍵盤、滑鼠和指紋等;若使用者不坐在筆記型顯示器前,將立即關閉螢幕或登出PC,以保護個人隱私;此外,更延長NB或筆記型電腦電池使用量,尤其於現代商用NB中,當使用者不使用NB且顯示螢幕打開或處於活動模式時,在待機模式將浪費大量電池能量—此技術為使用者存在偵測,如下圖4所示。
圖4 用戶使用檢測。
除了使用者偵測外,ToF還可用於偵測使用者行為,如接近或遠離NB。NB還可動態連續偵測使用者距離以優化NB配置,如於短距離時調低麥克風/揚聲器的音量;於電影模式偵測長距離時調高音量。
以ams的TMF8801一維ToF感測器為例,其可支援達2.5m的距離,幾乎覆蓋使用者的工作距離;採直接ToF技術,具高靈敏度單光子雪崩二極管SPAD偵測和快速時間數位轉換器(TDC)架構,且垂直共振腔面射型雷射(VCSEL)輸出光脈衝小於500psec。透過晶片上Cortex SoC和統計直方圖處理,感測器可在高可信度下偵測2cm至2.5m(圖5)。
圖5 TMF8801方塊圖。
筆記型電腦不再是純粹被動式個人電腦,NB中增加更多感測器,將如頭腦清晰的人類般變得更加活躍及聰明。光學感測器在此凝聚非常重要的作用,因為在人們的生活環境中,光最直接存在於人們周遭;環境光感測器提供準確流明照度,而XYZ顏色感測器提供色溫訊息;飛行時間感測器可偵測使用者距離或判斷其是否為一個人。未來期待看到更多光學感測器獲筆電採用。
(本文作者為艾邁斯半導體資深技術應用工程師)
廣覆蓋範圍/低延遲 低功耗藍牙滿足車用通訊
如今幾乎所有事物皆與智慧手機息息相關,而延伸至汽車及其吸睛的功能—電話正迅速成為汽車系統的一員,表示汽車必須採用標準的無線方案,例如低功耗藍牙(圖1)。
圖1 低功耗藍牙和智慧手機聯接在汽車中正日益普及。
儘管使用無線技術的選擇產生轉變,但針對應用如胎壓監測系統(TPMS)及金鑰卡(Key Fobs)或手機即鑰匙(Phone-as-a-Key)等技術要求仍然存在:
.可靠溝通
.低延遲
.運作期間超低功耗
.持續運作但不耗盡電池電量
低功耗藍牙滿足上述技術要求,以金鑰卡應用為例,可證明其於汽車領域的優勢。金鑰卡體積小、便於攜帶,且需較長的電池使用壽命—通常為數年;金鑰卡看似大部分的時間都沒有在運作,但其實是處於睡眠模式,隨時可在需要時和於範圍內與車輛通訊,因此低功率無線工作至關重要。當按下按鈕解鎖車門時,金鑰卡必須立即回應,不讓使用者察覺任何延遲。因此,低延遲和可靠的通訊也是先決條件。同時,藍牙的普及也為使用手機代替傳統鑰匙扣提供更強的吸引力。
低功耗藍牙覆蓋範圍廣/即時回應實現可靠通訊
當今金鑰卡不僅用於鎖定、解鎖車輛,還可用於大型停車場中定位車輛,甚至可遠端啟動車輛,以便在冬季進行預熱。駕駛員並不總是離車輛很近,因此,鑰匙扣和車輛之間的通訊須在一定範圍內—包括當傳輸線被人、車輛或其他障礙物部分阻擋時。低功耗藍牙的視線範圍無障礙,可達幾十公尺,如對於典型停車場提供綽綽有餘的覆蓋範圍。
可靠性另一方面則透過回應性衡量。現在的消費者大多期望即時回應,低功耗藍牙通訊必須以非常低的延遲運作。按下解鎖按鈕和車門解鎖之間的時間差必須使駕駛察覺不到。低功耗藍牙以低延遲運作,可歸因於在低功耗藍牙系統中,聯接的設備始終處於主動開啟。當未使用時可能會進入低功耗狀態(睡眠模式),與從關閉狀態通電相比,其可更快喚醒並開始工作。但是,持續開啟的好處必不能以功耗作為代價(圖2)。
圖2 低功耗藍牙聯接提供可靠的通訊。
低功耗延長金鑰卡電池壽命
藍牙低功耗為極低功耗模式的無線通訊,由於其於電源受限的電池供電消費設備中成功應用,自然朝汽車領域拓展。金鑰卡平均每天可能會經歷20次按鍵,每次持續約6.2毫秒(ms),因此每日總執行時間僅為124毫秒,其餘時間則處於被動低功耗模式。在這段時間內,金鑰卡必須最小化功耗,以免將電池耗盡,並於運作時延長其3V紐扣電池的使用壽命。儘管汽車電池更大、功能更強,但於汽車未啟動時仍可使用金鑰卡來鎖定和解鎖汽車。由於發動機未運作,因此該操作會於電池無法充電時消耗空轉電流。其他系統如時鐘、發動機電腦的內部記憶體及無線電預設等於汽車不發動時亦會消耗電池電流,車內金鑰卡收發器也須節省功率需求。
元件尺寸輕小卻兼顧安全
低功耗藍牙無線電系統單晶片(SoC)元件已於市面流通,由眾多全球供應商製造。多個供應商供貨以及隨之而來的價格競爭,代表低功耗藍牙無線電如今是比短距離無線通訊專有元件成本更低的標準產品方案。此外,低功耗藍牙元件尺寸小、重量輕,不會增加體積或重量,皆為汽車中重要的考量因素。
促使汽車產業採用低功耗藍牙的另一個重要因素為安全性。從配對及生成金鑰至交換資料,低功耗藍牙自起初便被設計為提供安全的無線通訊方式,畢竟人們不希望他人的金鑰卡或手機解鎖自己的汽車。綜合以上優勢,使低功耗藍牙成為汽車應用中短距離無線通訊的理想選擇。
符合汽車應用要求的例子,像是安森美半導體(ON Semiconductor)的NCV-RSL10,為藍牙5認證的無線電SoC。其於峰值接收及深度睡眠模式下可提供較低功耗;於使用3V電源時,深度睡眠(I/O喚醒)僅消耗25奈安培(nA)。該產品具低功耗,由於電池較小(於Fob中)且可採集能源用於汽車TPMS,使主車輛電池耗電量少、延長電池使用壽命(用於車輛或Fob),同時使產品尺寸更小。
(本文作者為安森美半導體產品行銷專員)
落實行進安全 自駕通訊/定位技術缺一不可
目前科技業者與車廠都已投入自駕車系統的發展,特別是專注於通訊、光學雷達(LiDAR)感測、定位與操控技術的研發,在自身的產業特色下,兩方發展出現速度和方向不大相同的現象。
科技產業在產品研發、量產、上市等要求向來快速,以速度獲取市場商機,而車廠業者則多是百年工業,其產品使用年限長,對安全性的注重度高,從設計到製造,都需要經過較長的時間驗證,這也是車商在自駕車進展較慢的原因。
至於發展方向,以美國汽車工程師學會(Society of Automotive Engineers, SAE)制定的自駕車6個等級為例,車廠是由第0層逐步往上推,科技廠商則是先從第5層的完全無人自駕等級,回推思考技術有哪些欠缺,這兩種不同發展方向在時間的推演下,將在一定的技術環節交會。
觀察目前各大廠的自駕車發展,大多以自小客車為主,在此類應用中,不但車體中的感測器、運算單元、定位單元與操控單元須具備精準而快速的訊號擷取與反應能力,還須經長時間實地測試,以掌握所面對的複雜環境。本文將以自駕車系統中所須採用的通訊與定位技術為探討主題。
感測器穩定性為自駕技術關鍵
台灣目前由法人(如工研院)制定自動駕駛感知次系統,其中V2X通訊技術與應用於自駕車軟體架構中、行車安全性及聯網接收號誌狀態資訊的提升,扮演不可或缺的角色。自駕車系統軟體的運作流程概述如下:
首先,感測分析硬體(Camera、3D LiDAR、Radar與V2X路側通訊設備)收集車輛周圍資訊後(如道路是否有障礙物、道路路形等)先進行前置處理與資料對齊,接著透過深度學習影像辨識軟體針對偵測到的物件與資料進行訓練(Training Data);之後融合多重感測資料(Data Fusion),再進行即時事件推理(Event Sensing)—即區分Event Sensing Type:行人穿越道路(Pedestrian Crossing Road)與橫向來車 (Intersection Movement Assist);最後再儲存資料(Data Logging)。
自駕車系統架構中最關鍵的元件為前端感測器,其為發展自動駕駛技術領域中最重要的回授單元。近年來隨著先進駕駛輔助系統(ADAS)普遍應用於高階車輛,且安全、舒適、方便與節能方面亦有改善,使安裝多個感測器逐漸成為趨勢,同時成為發展自動駕駛等級SAE Level 5的基礎。透過這些先進感測器與機器學習軟體演算法處理,可讓車輛電控單元完整模擬,甚至超越人類在駕駛車輛時所使用的各種感官能力(Perception),實現同步即時的全方位環境感測能力,並針對感測結果判斷控制決策,因此感測器的穩定性研究成為目前自動駕駛技術的關鍵要素之一,其中運算速度、抗環境干擾能力與辨識精準度為目前發展的三個重要指標。圖1以NVIDIA為例,運算平台採用GPU架構可加速運算,每年以1.5倍的速度成長,預計於2025年將可達到1000倍的運算速度,可融合運算多種感測器。
圖1 自駕車運算平台以GPU架構為主流。
圖2以Google新創的自駕車公司Waymo為例,車上配掛光達與攝影機等感測設備,融合多重感測器抵抗環境干擾。
圖2 自駕車將融合多種感測器克服環境干擾。
圖3則是顯示目前自駕車採用3D光達技術,目的為提高物件辨識精準度。
圖3 自駕車採用3D光達技術,以提高辨識精準度。
兩大自駕車通訊技術
自駕車通訊技術,即採用車聯網V2X通訊,使自駕車具有對外連網能力,該技術可區分為兩大類,分別為短距無線通訊Dedicated Short Range...
寬頻電漿光學測量結合機器學習 磊晶圓圖案缺陷檢測更有效率
晶體缺陷易因表面汙染引起
磊晶層內的晶體缺陷可能因為表面污染(例如氧)而引起,這會導致磊晶層/底基層質界面處形成SiOx區域。在含SiOx的區域內成核的晶體缺陷可以導致缺陷處局部的原子級別的表面粗糙度增高,因而形成更高的Haze,這與磊晶品質相關聯。
本研究目的是開發一種用於測量圖案晶圓上磊晶層品質的光學技術。本文首先介紹為無圖案底基層開發的光學檢測技術,該技術可以預測每個磊晶層的品質並且具可重複性。這是一種利用寬頻電漿檢測系統上所收集的背景雜訊的機器學習方法,接下來會描述如何將該技術擴展用於圖案晶圓的磊晶層。
圖1顯示了針對不同的預烤和清洗條件的無圖案層並採用Surfscan Haze、SIMS、Secco蝕刻和AFM所獲得的缺陷密度的結果。不同測量技術的結果相互關聯性良好。隨後,在無預烤、750℃預烤以及850℃預烤的dHF清洗的底基板上沉積了一系列厚度不同的磊晶層,達到不同差排密度條件。這些在之後所沉積磊晶層的Secco蝕刻資料顯示,850℃、750℃和無預烤的條件下,可重複測量的缺陷密度分別為<102、4×104和4×105/cm2。本文針對這些之後所沉積的磊晶層來開發具有機器學習功能的光學技術。
圖1 採用各種技術所測量不同磊晶層清洗度和預烤溫度的標準化缺陷密度。
寬頻電漿光學檢測效率更高
本研究最初專注於開發使用寬頻電漿(KLA 29xx)光學缺陷檢測系統的技術,可以擴展用於圖案化晶圓,因為與傳統的Haze量測技術不同,首先採用無圖案晶圓並將其檢測結果與其他標準量測方法的結果比較(如SIMS、Secco蝕刻、AFM和Haze量測),以證實新技術的可行性。
在無預烤、650℃和850℃預烤後沉積的一組磊晶層上隨機的位子選取背景訊號,這些磊晶層上的差排密度範圍很大(從小於100到4×105缺陷/cm2的範圍)。機器學習算法(iDO 2.0)被用來確定模型中最重要的缺陷特性(圖2)。在第一組隨機位置上對模型進行訓練後,另取第一組晶圓上的其他隨機位置來驗證模型的可行性。圖3~5顯示出在不同的預烤溫度下生長的磊晶層品質是非常容易區分的。在無圖案晶圓上採用同一個模型也得到了相同的結果。
圖2 iDO2.0分類的例子
圖2顯示了iDO2.0的分類。在該圖中,背景訊號被分類為「1」,而重要缺陷(DOI)則被分到各自的預烤溫度的分組中,其中「100」分類是指無預烤的條件。iDO2.0演算法可以根據缺陷特性自動分類組合。
圖3顯示對高密度缺陷(無預烤)無圖案磊晶層iDO2.0分析的示例,其中機器學習演算法預計超過85%的缺陷總數是屬於無預烤組的。圖4顯示了650℃預烤的樣本,就晶體品質而言它們更接近於無預烤的樣品而不是850℃的樣本。圖5顯示了在850℃的溫度預烤樣品的分類準確度為99%。這項技術與機器學習演算法(iDO2.0)結合,可在各種缺陷密度範圍內準確預測磊晶無圖案層的晶體品質。
圖3 無預烤磊晶層的iDO2.0分析
圖4 650℃預烤磊晶層的iDO2.0分析
圖5 850℃預烤磊晶層的iDO2.0分析
接下來,將三種類型的磊晶層--未摻雜矽(與無圖案晶圓研究的條件相同)、Si:P和Si0.8Ge0.2沉積在圖案化晶圓上。每種類型的薄層仍然採用同樣的三種預烤條件。然後如圖6所示,使用與無圖案晶圓相同的測量方法,在劃片槽上的100微米大小的接點上對每組晶圓進行測量。另外,圖6也顯示了一個晶圓圖的示例,其中兩個晶片用作iDO2.0訓練組,其餘的晶片用作驗證組。
圖6 iDO2.0訓練和驗證集的晶圓圖
正如預期,每個薄層類型都需要一個獨特的機器學習iDO2.0。同樣,對於圖案晶圓,要求具有90nm像素大小的超深頻ECP模式(基於灰階直方圖),並使用光感器測量光強度,保持照明強度進而在不同預烤溫度的薄層之間獲得足夠的分辨率。該技術也能可重複地發現這些結構中的不同缺陷數量,也可以進行缺陷密度的測量,並在製造環境中實現磊晶品質的即時監控。
總結來說,本研究已經開發出一種快速的光學技術,可以在無圖案和圖案晶圓上針對廣泛的晶體品質可重複地發現磊晶摻雜和未摻雜矽和SiGe層的缺陷密度。接下來,將研究該技術在圖案化晶圓的SRAM區域中獲得相似結果的能力,該技術可以使產線上光學測量自動化,以在製造環境中實現磊晶品質的即時監控。
(本文作者Shravan Matham, Curtis Durfee, Brock Mendoza, Devendra K Sadana, Stephen W Bedell, John Gaudiello, Sean Teehan皆任職於IBM Research;HeungSoo Choi, Ankit Jain, Martin...
緩解資料移動/存取瓶頸 HBM大幅加速AI應用
本文將以賽靈思(Xilinx)旗下解決方案為例,透過深度學習和資料庫加速的案例,闡述一個均衡且支援三星HBM2的賽靈思運算加速器系統,如何提供具備最佳靈活性、效率和效能的高效運算加速解決方案。
近年異質運算逐漸興起,拓寬了後摩爾定律時代在加速運算密集型作業負載的創新。在當前資料中心產業中,普遍採用異質運算進行加速的作業負載種類繁多,包含人工智慧、即時視訊轉碼和基因組分析,而這些僅僅是其中的一小部分。
然而,長期以來,DDR記憶體架構的演進並不足以跟上運算加速領域的創新步伐。在過去十年裡,並行記憶體介面的頻寬效能雖有改善但進展緩慢;現今FPGA所支援的最大DDR4資料速率仍然只有2008年DDR3的2倍左右。相比之下,自2008年以來,FPGA的運算能力已提高了近8倍,且隨著配有AI核心的Versal元件推出後,預計未來兩年內還有更大的成長空間。因此,在資料中心領域,記憶體頻寬與容量將成為眾多運算和記憶體頻寬密集型作業負載發展的主要限制因素(圖1)。
圖1 運算容量的提升與DDR頻寬的改善比較
HBM效能/傳輸更高更快
HBM是一種高速的系統級封裝(SiP)記憶體技術,與採用傳統打線接合封裝(Wire Bonding-based Package)的記憶體產品相比,它使用垂直互聯的DRAM晶片堆疊和一個寬(1024位元)介面,來達到更大的儲存容量與更高的資料頻寬。聯合電子裝置技術協會(JEDEC)在2013年開始採用初代HBM標準,並在2016年1月批准第二代HBM2版本為業界標準。
HBM2標準支援4個或8個8Gb的DRAM晶粒逐個堆疊在一起,由一個2.5D矽「中介層」提供支援,該「中介層」可將記憶體堆疊與底層電路板連接起來。堆疊一些晶粒(通常是記憶體)而不是其他晶粒(通常是處理器)的多晶片封裝被稱為2.5D元件(圖2)。
圖2 HBM和2.5D架構
由於多個堆疊能被添加在同一個封裝中,因此與傳統的多晶片DRAM產品相比,當堆疊多個晶粒在一個電路板上並將其堆疊得更緊密時,可以大幅減少HBM記憶體封裝的水平占板面積。此外,HBM技術還縮短了訊號在元件之間的傳輸距離,因此可以提高系統效能,且較短的傳輸距離可以減少傳輸定量資料所需的能量(圖3)。
圖3 HBM晶粒堆疊技術
HBM具備先進的TSV技術、微尺度互連和突破極限的I/O數量,可以增加記憶體頻寬,與其最強勁的競爭對手,也就是用於繪圖卡的繪圖用雙倍資料傳輸率(GDDR)記憶體相比,HBM明顯能提供更高的效能。在元件級別,單個三星HBM立方體可以提供高達307GB/s的資料頻寬,比GDDR5晶片高出近10倍的資料傳輸率。而在系統級別,與採用GDDR的解決方案相比,HBM能提供近3倍的輸送量,並使用少於80%的功耗,同時還可以節省寶貴的電路空間(圖4)。
圖4 HBM與GDDR頻寬比較
FPGA元件助力 記憶體頻寬再上層樓
以下將以賽靈思旗下FPGA產品為例,該公司支援HBM的Virtex UltraScale+ FPGA大幅改善了記憶體頻寬,例如2個三星HBM2記憶體堆疊就可提供高達460GB/s的速率。當將1或2個HBM2堆疊與各種尺寸的FPGA邏輯(多達285萬個邏輯單元)和DSP(高達9,024個DSP48E2分割,可提供28.1峰值INT8 TOP)進行配對時,使用者就可以選擇搭配全新支援HBM的UltraScale+元件系列,為其應用選擇最佳的運算能力與記憶體頻寬/容量組合。
另一方面,除了支援HBM的Virtex UltraScale+FPGA,賽靈思還推出Alveo U280資料中心加速器卡,由16奈米UltraScale+架構所打造,採用8GB三星HBM2,可為資料庫搜尋與分析、機器學習推論及其他記憶體限制應用提供更高等級的加速功能;並涵蓋了CCIX支援,可以利用現有的伺服器互聯基礎設施和即將推出的CCIX處理器,提供高頻寬、低延遲的快取一致性共用記憶體存取。許多受限於記憶體的應用都能受益於支援HBM的UltraScale+元件,本文將以深度神經網路與資料庫加速方面的案例為例,展示支援HBM的UltraScale+元件之優勢。
強化記憶體頻寬提升AI語言翻譯效能
如今,各種雲端應用都有提供自動即時語言翻譯服務,其可透過採用神經網路的機器學習方法在兩種語言之間翻譯語句(稱為機器翻譯),編碼器-解碼器架構強化當今的商業自動化翻譯服務。
在使用機器執行翻譯任務時,兩種語言的單詞經由一個稱為單詞嵌入的過程,以高維向量的形式呈現;因此,單詞之間的關係可以透過向量進行量化建模和反映。遞迴神經網路、卷積神經網路和基於注意力的模型等架構通常用於執行編碼和解碼功能。
近期研究表示,在語言翻譯中,只有採用注意力的網路能達到最高的準確性。研究論文中所描述的注意力機制,即縮放點積注意力,是由兩個矩陣乘法和其他函數(Scale、Mask和Softmax)所構成的。多頭注意力結構通常由多個並行的縮放點積注意力與不同的輸入投影構成,該結構與前饋網路被共同用於建構整個語言翻譯模型的解碼器和編碼器(圖5)。
圖5 轉換器--基於注意力神經網路的語言翻譯模型
如圖5所示,基於注意力的語言翻譯模型的主要運算強度來自於對縮放點積注意力和前饋網路的點積運算。這些點積通常被組合到矩陣乘法運算,以達到更高效的運算。然而,與在整個空間中大量重複使用權重參數以減少資料移動痕跡的傳統卷積神經網路不同,這類基於注意力的模型幾乎不重複使用輸入空間參數,導致對矩陣乘法運算的記憶體頻寬要求要高出許多。
我們建置了一個用於語言翻譯且基於注意力的先進神經網路的轉換器分析模型,並將其映射在UltraScale+元件上運行。FPGA建置方案的架構採用DSP脈動陣列來執行矩陣乘法,中間的啟動資料儲存在晶載URAM中,可以消除啟動時所造成在處理器和外接記憶體之間頻繁進行的資料移動。HBM或DDR則用於儲存所有嵌入字典的單詞嵌入與權重參數。
針對具有不同句子長度(L)和句子數量的英德翻譯任務,也稱為批量大小(B),對其進行分析就可以瞭解附加DDR的UltraScale+元件和支援HBM的UltraScale+元件對於延遲和傳輸量之間的權衡。這一研究對於DDR與HBM的建置,假設使用具有256個16位元輸入和32個16位元輸出的脈動陣列,並將其運行在710MHZ的UltraScale+元件上。詳細的傳輸量與延遲關係圖請見圖6。
圖6 採用具有HBM和DDR4的UltraScale+元件進行語言翻譯效能分析。
長度為8的句子在4條通道上運行的最低延遲約為15.7ms,傳輸量為508符號/秒。一條DDR通道用於存取單詞嵌入資料,其餘三條DDR通道用於載入權重。對於支援HBM的元件而言,一個長度為8的句子之最小延遲為2.2ms,比DDR介面低7倍以上。DDR介面在兩種句子長度上都不能達到7ms以下的延遲,但是支援HBM的元件在傳輸量為10,419符號/秒,且句子長度為8的情況下可達到6.1ms的延遲,在輸送量為4,682符號/秒,且句子長度為16的情況下可達到6.8ms的延遲。
借助通用矩陣運算資料庫加速AI應用
與前面討論的機器翻譯案例一樣,幾乎所有現代深層神經網路(深度學習)的主要運算都是以矩陣乘法的形式來完成。除了機器翻譯以外,在資料中心廣泛部署的其他典型深度學習應用有影像/視訊分析、網路搜尋的搜尋排名系統、廣告投放的推薦系統、內容/來源推薦、語音辨識以及自然語言處理。
為了更佳地支援更多的深度學習應用,賽靈思開發了通用矩陣運算(GEMX)資料庫,用於加速元件上的矩陣運算,該元件由SDAccel開發環境提供支援。該資料庫包括三個組件:引擎庫、主機代碼編譯器與以應用或系統建構的環境,引擎庫則由一組具有BLAS函數介面的C++範本組成,可以在FPGA上進行矩陣運算。
主機代碼編譯器將主機代碼矩陣函式呼叫編譯成一系列指令,用於觸發FPGA上的矩陣運算,建構環境採用GNU make流將FPGA和主機代碼影像生成過程自動化。此外,該產品還支援使用者對系統的各個方面進行配置,例如,FPGA平台、FPGA影像中建置的引擎數量等。
雖然GEMX引擎的兩個輸入矩陣都來自DDR記憶體,但GEMX的傳輸量取決於DDR介面的頻寬。圖7的分析比較了使用DDR4連接UltraScale+元件的GEMX與使用支援HBM的UltraScale+元件的GEMX之效能。該分析模型充分利用了記憶體頻寬,並假設使用32×32×128的矩陣作為GEMX的輸入。結果如圖7所示,與使用4條DDR通道相比,支援HBM的元件可以將GEMX的效能提升約3.6倍。
圖7 GEMX效能
HBM讓記憶體存取/使用更有效
受益於HBM記憶體控制器中的靈活定址方式,支援HBM的UltraScale+元件具備的獨特優勢之一就是HBM通道的靈活並行使用。HBM通道的存取與使用,是能夠完全地被可重配置和重新編程,還可以通過FPGA邏輯輕鬆存取。
如圖8所示,使用者可以將原始資料庫檔案剝離到多個HBM通道中,並讓並行處理運算單元執行不同的資料庫操作,以獨立並行存取資料庫的不同部分而無需進行同步。這一特性有助於改善即時案例中的操作延遲並有效地使用HBM,因為所有運算單元都可以即時回應資料庫查詢,毋須批次處理或同步。在上述機器翻譯案例中,該特性還用於分離兩個通道進行單詞嵌入存取,而其餘通道則用於高頻寬權重參數傳輸。
圖8 靈活的並行記憶體通道存取
雖然三星HBM在AI和資料庫加速等案例中的重要性已得到證實,但還有很多其他的資料中心作業負載也可從HBM中顯著獲益。總而言之,在資料中心領域,隨著異質運算加速的發展趨勢以及運算設備技術的創新,迫切需要在運算單元附近附加像HBM這樣的高效能記憶體系統;而支援HBM的UltraScale+元件具有獨特的價值,以深度學習和資料庫加速為例,賽靈思支援HBM的UltraScale+元件就發揮出運算加速的新潛力,並將其引領至更高的水準。
(本文由賽靈思提供)
結合GTC安全方案 聯網汽車TCU/ECU防護增
為此,SecureRF和意法半導體(ST)合作開發出一種符合未來需求的低功耗安全解決方案,即使在最小的汽車處理器上也能極快運行。SecureRF的WalnutDSA和Ironwood KAP兩種安全演算法最近已移植到意法半導體的SPC58ECxx 32位元車規處理器平台上;兩家公司合作開發了一個模組,演示資訊服務控制單元(TCU)與多個ECU的相互認證過程,並在2018年TU-Automotive Detroit 展會上展出了該模組。
Walnut數位簽章演算法(DSA)和Ironwood金鑰協商協議(KAP)基於SecureRF群理密碼學(GTC)。這一密碼學分支雖然不是什麼新事物,但目前有助於解決一個相對較新的網路安全問題:如何保護物聯網、汽車系統和其它網路應用中越來越多的資源受限的設備。
GTC具有三重優勢,運算速度即使在最小的設備上也非常快;RAM/ROM占用極低;能夠抵抗所有已知的量子攻擊。GTC計算效率高,比其它加密方法更省電。SecureRF可以通過硬體或軟體來實現GTC解決方案。
MCU上運行GTC 性能優勢顯著
SPC58ECxx是32位元微控制器,針對車身、網路、安全系統和通訊連接應用設計的通用微控制器系列產品,基於兩顆180MHz e200z4d PowerPC處理器內核,整合高達4MB的快閃記憶體和512KB的RAM、硬體安全模組以及許多通訊周邊,包括LIN、SPI、UART、乙太網AVB、Flexray和CAN FD控制器;SPC58ECxx是按照ISO 26262標準設計,並支援ASIL-B安全關鍵型應用安全等級標準。
演示程式運行在SPC58ECxx探索板上,與基於ECC的驗證方法相比,GTC方案性能優勢非常明顯,最終執行時間顯著縮短。表1是GTC與橢圓曲線密碼(ECDSA+ECDH)方案的執行時間和ROM/RAM占用情況比較表,其中,橢圓曲線密碼(ECDSA+ECDH)方案的執行時間是GTC方法的12.6倍。基於GTC的解決方案方便設計人員為車載微控制器增加重要的安全功能,例如,安全啟動和安全硬體更新,並使基於SPC58ECxx的TCU能夠與車上資源有限的ECU相互認證,該演示解決方案如圖1所示。
圖1 GTC解決方案示意圖
用於互聯ECU上優勢更加突顯
保護非常小的ECU處理器的安全是設計人員首要考慮的問題,也是該解決方案最重要的優勢之一。快速認證是必備的,對於許多汽車應用,其它資料安全方法可能並不實用。基於GTC的方法可安裝在最小的處理器上,還能實現較好的性能,圖2比較了GTC和ECC在8位元處理器上的運行性能。
圖2 GTC和ECC在8位處理器上性能比較
在圖2中,每個垂直尖峰表示一次驗證過程結束。完成一次認證過程,ECDSA/ECDH用時7.69秒,而SecureRF的WalnutDSA和Ironwood KAP僅需68毫秒,是前者的1/90。這一速度優勢,再加上超低功耗和更低的RAM/ROM占用,使SecureRF方法非常適合於資源受限的處理器。
SecureRF加密演算法是SPC58ECxx內建硬體安全模組(HSM)的新選擇。該硬體安全模組將安全子系統和SPC58ECxx主處理器內核完全隔離,且還適用於沒有HSM模組的產品,例如SPC582Bxx。SPC582Bxx是SPC58ECxx的精簡版,搭載一個主頻120MHz的e200z4d PowerPC處理器內核、高達1MB的快閃記憶體和192KB的RAM。但是,硬體安全功能的缺乏使得軟體安全功能非常必要。軟體安全方案必須能夠保持良好的性能,同時不占用過多的資源,以免對系統造成任何過多負荷。考慮到汽車系統設計壽命多達數年,汽車系統需要放眼未來資料安全發展趨勢,應對即將到來的量子計算安全威脅。SecureRF方法採用後量子加密技術,能夠應對當前已知的所有攻擊。
(本文作者皆任職於意法半導體)












