封面故事
- Advertisement -
滿足消費應用需求 GaN快充市場潛力不容小覷
手機/平板/筆電的螢幕尺寸、應用程式等功能快速成長,每人擁有的電子設備與穿戴裝置增加,導致電源需求同步提升,多接孔且充電快速的充電器順勢成為市場熱門的應用之一。同時面對矽材料在能量密度等方面的理論極限,為提升電源的轉換效率與功率密度,氮化鎵(GaN)逐漸成為受到製造商關注的功率半導體應用。投入GaN產品研發的廠商中,部分製造商專攻200V以下的消費電子市場,而GaN快充便是消費電子產品中商品化最為快速的應用。本文將整理GaN在消費性電子市場的應用分析與發展挑戰,探究GaN在消費電子市場的潛能,以及未來應用方向。
GaN快充應用看漲
今年GaN快充應用的熱潮,從1月CES 2020的參展狀況可略知一二。GaN System台灣區業務總經理林志彥(圖1)描述,CES 2020中,約有50-60家的台灣及中國的消費電子配件品牌參展,並推出超過100件採用GaN的產品。納微半導體(Navitas)銷售和市場副總裁Stephen Oliver(圖2)認為,2020年即是GaN在智慧型手機/平板/筆電快充產品的應用快速發展的一年。過去幾年間,從統計數據中可以發現,螢幕與電池的尺寸持續增加(圖3),同時Oppo、Vivo、聯想(Lenovo)、小米已推出手機搭載65W以上的充電器,代表使用者需要快充滿足逐漸增加的電源需求。除了先前主攻售後市場的AUKEY、Anker、RAVpower及Belkin,其他製造商如聯想、三星(Samsung)、Oppo與小米採用GaN快充作為售後的手機配件,甚至可能將其提升為原廠標配(圖4)。
圖1 GaN Systems台灣區業務總經理林志彥
圖2 納微半導體銷售和市場副總裁Stephen Oliver
圖3 2017-2020年智慧型手機及電池尺寸變化 資料來源:Navitas
圖4 2020年Q2 OEM廠商充電器分布 資料來源:Navitas
除了GaN快充產品在消費端需求顯著,製造商同時看好GaN高效率、低導通損耗、外型小巧且適用於高頻率的材料特性。Yole化合物半導體/新興材料技術與市場分析師Ezgi Dogmus解釋(圖5),技術上,GaN在系統整合方面有兩大主要趨勢:系統單晶片(SoC)、系統級封裝(SiP)。針對技術平台,有兩種為了GaN部署的半導體基板:採用藍寶石基板的GaN-on-sapphire、使用矽基板的GaN-on-Silicon。兩種技術都發展良好,可望在明年成為熱門應用。整體而言,GaN快充系統的成本、尺寸及效能,將會創造比其他充電產品更大的市占率。
圖5 Yole développement化合物半導體技術與市場分析師Ahmed Ben Slimane(左)、Yole développement化合物半導體/新興材料技術與市場分析師Ezgi Dogmus(右)
廠商競爭刺激產量
面對新應用如GaN快充,產品成功最重要的關鍵在於開創市場,讓技術被市場接受並且獲利。Stephen Oliver提到,相較於使用矽,採用納微GaNFast功率晶片的充電器,在整合GaNFET/驅動器/邏輯與數位電路的前提下,可以達到充電速度加快三倍,同時體積減少一半,兼顧性能與價格的優勢。例如廠商AUKEY使用GaNFast晶片製造61W的快充,其體積比蘋果充電器小65%。
如果著重觀察消費市場對新技術/產品的接受度,價格便是驅動需求的主因。林志彥舉例,小米已推出的GaN快充電源售價約台幣700元,成為市場高度接受的產品之一。此外,長期而言,小體積的GaN所需材料少於矽充電器,因此若產量提高甚至進入自動化生產階段,價格將更有明顯的競爭優勢。
生產方面,消費電子產品通常由製造商設定價格、效能與外型規格標準,快充也是如此。Yole分析師說明,GaN作為一項新技術,主要的挑戰在於價格與採用率,而這些又都受限於OEM廠商的嚴格要求與市場布局。截至2020年第二季的GaN市場持續波動(圖6),GaN仍具突破與成長動能。Yole分析師預估,接下來的18個月內,市場會維持相似的浮動狀態,因此國際大廠如三星、華為在產品標配中採用GaN快充的規畫中激烈競爭,蘋果(Apple)可能也會加入戰局,廠商間的競爭將會大力刺激市場銷量,同時導致GaN快充產量上升且價格快速下降。
圖6 功率GaN裝置市場營收趨勢 資料來源:Yole
現階段的GaN快充功率以65W為主流,Stephen Oliver表示,接下來三至五年間,GaN快充的研發必然朝著功率密度更高、充電更快的方向前進,例如聯想預計在今年九至十月左右推出搭載90W電池的手機。新型態的消費者更依賴電子設備提供的工作與娛樂功能,但生活節奏加快、設備的電池容量增加,無法等待漫長時間的來完成充電,因此不斷增長的充電速度即是因應市場需求,Stephen Oliver認為未來功率GaN晶片的市場規模可達10億美元。此外,多接孔的USB-C充電器也會在產業中掀起風潮,滿足現在常見同時持有多個電子設備的消費者的充電需求。
2025年GaN市場上看七億
隨著三星、華為、小米等手機製造商規畫將GaN快充放入標配,Yole分析師觀察到GaN快充高度的市場潛力。GaN已經開始部署在超過45W的快充中,仰賴其小尺寸且高度整合的電源系統,形成高功率密度的應用。接下來三年內趨勢將指向系統單晶片及系統級封裝技術,驅動GaN在消費市場的進展,且GaN充電器的尺寸會持續縮小並伴隨成本下降。
整體而言,Yole分析師預測GaN市場在2025年會超過七億美元,2019~2025年的年均複合成長率(CAGR)則為76%,代表2025年在GaN的整體市場中,將有超過80%的占比來自消費市場(圖7)。林志彥進一步說明,GaN System在市場布局上關注的消費電子、儲能系統、資料中心、工業控制與電動車五大領域中,其中進展最快的即是消費電子市場,能在成本降低次激需求提升的前提下,快速達到量產。2021年下半年,各家廠商高階的手機/筆電型號,極有可能會將GaN充電器/變壓器納入標配規格。
圖7 功率GaN裝置市場規模分析(按應用區分) 資料來源:Yole
除了手機配件,GaN還有其他具有商機的應用場景。Yole分析師表示,GaN的性能表現與外型尺寸帶來優勢可應用在以下幾個領域:
‧ LED驅動器:GaN架構的成本才是受到採用的主因,其裝置GaN有機會用在大於50W的高階、高功率LED驅動器中。
‧ D類音效功率放大器:國際廠商如EPC、英飛凌、GaN...
功率密度優勢顯著 GaN HEMT挺進大功率市場
相較於矽材料,以GaN材料實作功率元件,可以明顯拉高切換速度,從而讓電源設計者在電源設備中採用更小的電容、磁性元件,獲得提高功率密度,降低損耗的效益。然而,天底下很少有毫無缺點的選擇,作為功率應用領域的新興材料,GaN的可靠度與安全性,終究還是未經時間考驗,對於許多產品生命週期很長的大功率設備供應商,如生產伺服器電源、馬達驅動單元、電動車充電器的業者而言,要在產品中導入GaN元件,必須從長計議。
相較之下,消費性產品的生命週期短,市場對產品的可靠度要求不會像工業、汽車產業那麼嚴謹。只要成本結構對了,終端產品上市跟普及的速度很快。舉例來說,目前消費者已經可以在3C通路跟電商平台上購買到各種基於GaN HEMT的USB快速充電器,雖然價格仍比基於矽元件的同類產品略高,但其外觀小巧易於攜帶,輸出功率又有過之而無不及,對消費者來說仍是有吸引力的選擇。
這個現象也顯示,GaN功率元件的成本結構是相當有競爭力的。只要讓客戶建立信心,GaN功率元件在汽車、工業、資料中心等大功率應用領域,也有不小的發展空間。
熬過醞釀期 大功率應用逐漸浮現
GaN Systems台灣區業務總經理林志彥指出,雖然目前GaN HEMT元件最廣為人知,出貨量也最大的應用,是各種針對零售市場推出的快速充電器配件,或是筆記型電腦的電源供應器,但該公司過去幾年除了耕耘消費性電源應用市場外,其實也花了很多心力在非消費性產品上。舉例來說,資料中心所使用的各種高功率電源設備、電動車上的車載充電單元、工業類的馬達驅動設備、機器手臂等,也都有許多客戶正在設計導入,或是已經有產品量產上市。
事實上,非消費性產品導入GaN HEMT元件的時間點,並不晚於消費性產品。例如西門子(Siemens)的馬達驅控設備,就已經採用GaN Systems提供的方案,還有許多其他不方便透漏的設備客戶,也已經推出基於GaN HEMT元件的伺服器電源、逆變器(Inverter)等產品。還有些車廠客戶,也看上GaN在功率密度上的優勢,而決定與GaN Systems合作,共同發展22kW的車載充電器。
但工業或汽車領域的客戶,對元件的可靠度、安全性,要求都比消費性產品的製造商來得更嚴謹,因此其評估、測試與研發的週期,往往得花上兩到三年。以西門子的馬達驅控設備(圖1)為例,從元件性能/可靠性評估到產品設計、測試與量產,就花了近四年時間。但也因為前期作業紮實,因此從產品量產至今,業界對GaN元件最有疑慮的可靠度問題,至今完全沒有出現過。對GaN功率元件來說,這是一個相當重要的成功案例,有助於建立客戶對GaN元件的信心。
圖1 西門子已經在馬達驅動設備中導入GaN HEMT元件
另一方面,由於前期評估跟設計導入要花極大的心力,因此工業或汽車客戶只要導入某款元件,在終端產品漫長的生命週期中,都必須確保該款元件供應無虞,這使得客戶額外重視元件是否有第二供應來源。也因為這個緣故,GaN Systems與羅姆(ROHM)在2018年中結盟合作,讓兩家業者可以共同滿足客戶需求。
工業、汽車等非消費性產品需要較長的醞釀期。成本、供應鏈是否健全,乃至元件本身的技術特性,都是客戶在設計導入時需要考量的面向。但經過過去幾年的努力,已經有越來越多工業與資通訊電源設備開始採用GaN HEMT元件,電動車應用也已經有了初步成果。GaN功率元件應用開枝散葉,將是指日可待。
成本將是GaN最大優勢
包爾英特(Power Integrations, PI)行銷副總裁Doug Bailey(圖2)則表示,對於同時需要高效率跟小尺寸的電源設備來說,GaN元件所能創造的效益最為明顯。除了消費性的NB電源跟USB快充之外,伺服器跟電動車的電源系統,也是PI非常看好的應用市場。
圖2 包爾英特行銷副總裁Doug Bailey
事實上,GaN作為電源開關,其特性幾乎是全面性地勝過基於矽的傳統元件,只是目前跟矽開關相比,GaN開關的成本還略為高出一截。如果GaN跟矽的價差能持續縮小,可能絕大多數的電源應用都會考慮採用GaN開關。
那麼,GaN開關的成本,有沒有可能直逼矽開關呢?林志彥認為,這個可能性是存在的。事實上,目前GaN HEMT的市場行情,已經很貼近基於矽的MOSFET。如果是小量採購,GaN HEMT的報價約比MOSFET高出一成多,但若是百萬顆等級的大規模採購,跟MOSFET的報價應該是相去無幾。
至於跟另一種寬能隙材料--碳化矽(SiC)相比,GaN的成本優勢會更為明顯。SiC在散熱跟耐高壓方面,表現確實是優於GaN,但SiC的材料成本相當高昂,而且因為結構的關係,不容易微縮,這使得SiC元件不僅起始價格就比GaN高出一大截,降價的速度也不如GaN。
Bailey認為,由於GaN與SiC的成本落差相當明顯,許多高功率應用的開發者都對GaN展現出濃厚興趣。只要針對高功率應用研發的GaN HEMT開發成功,相信許多高功率應用的設計者,都會很快轉向GaN。事實上,高功率GaN HEMT的進展相當快,絕大多數電動車廠都已經拿到高功率GaN HEMT的工程樣本並展開評估,因此,GaN元件在電動車市場上,應該會有十分可觀的成長。
大功率應用更需高整合方案
在GaN元件積極搶攻高功率應用市場的同時,元件的設計將跟著出現哪些變化?林志彥認為,驅動器(Driver)與HEMT的整合,將是必然發生的趨勢。事實上,對消費性電源而言,GaN HEMT與驅動器是否一定要整合,還有討論空間,因為消費性電源的功率低,GaN HEMT的開關速度不須推到極限,以便在開關損失跟開關雜訊之間取得最好的平衡。此外,由於消費性電源的GaN HEMT開關頻率不必拉得很高,因此驅動器到開關之間的距離較長,仍是可以接受的。
舉例來說,對消費性電源來說,GaN...
寬能隙半導體普及在望 電源轉換損耗再創新低
據國際能源署(IEA)估計,2020年全球電能需求的峰值將達到30拍瓦(Petawatts),未來還會持續增加。電能來源可能是化石燃料或可再生能源,但無論如何,功率轉換裝置效率對於最大程度降低成本和電能損耗至關重要。
工業馬達消耗了50%以上全球能源,但是資料中心也非常耗電,而電動車(EV)充電亦對電網造成更大的負荷。電氣化的發展趨勢,已促使「更智慧」且耗電更少的創新技術蓬勃發展,但是電源轉換相關元件也須跟上步伐,其損耗必須再創新低。寬能隙半導體(WBG)將是實現此一目標的關鍵。
功率轉換器設計者的目標,是以最高效率將來自配電系統的電力轉換為不同的直流(DC)或交流(AC)電平。出於安全或功能層面考量,可能需要電氣隔離,並且輸出電壓可能要求更高或更低。目前業界最通用的功率轉換器,大多是採用開關模式來進行電源轉換。
最原始的雙極開關技術,目前已經被矽MOSFET所取代,IGBT則仍是高電壓/高功率應用的首選。但寬能隙半導體,如碳化矽(SiC)和氮化鎵(GaN),已成為轉換器拓撲架構中強有力競爭者。設計者通常會使用「諧振」型拓撲以獲得最佳效率,三相電橋則廣泛用於馬達控制。
無論採用何種拓撲架構,導通電阻和可能具有高瞬時值的開關轉換,都會造成損耗累積(圖1)。
圖1 在開關轉換期間,MOSFET峰值功耗可能在kW範圍內
半導體中開關損耗與每秒轉換次數成比例,因此低頻率下損耗更小。但是,開關頻率越高,電源設計者便可以使用體積更小、重量更輕且成本更低的電感器和電容器等被動元件,因此在實際中,開關頻率選擇是一個折衷方案,其開關頻率的範圍可以從馬達驅動器的數kHz,到資料中心的DC-DC轉換器的數MHz。
開關轉換期間的大量損耗,是由對元件電容(COSS)進行充電和放電所需能量(EOSS)引起。因此,EOSS、COSS以及導通電阻(RDS(ON)),都是開關元件性的關鍵參數。導通電阻與管芯面積乘積,即RDS(ON).A是總損耗的品質因數(FOM),電容及其相關開關損耗隨管芯面積減小而降低。
寬能隙材料特性擁有先天優勢
SiC和GaN等寬能隙半導體,需要相對較高能量才能將電子從其「價帶」移動到「導帶」。高能隙值會導致更高臨界鑿穿電壓和更低漏電流,尤其是在高溫下。WBG元件還具備更好電子飽和速度,從而導致更快轉換,而SiC擁有特別好導熱性。在圖2中將寬能隙特性與矽進行了比較,在所有狀況下,值都是越高越好。
圖2 寬能隙材料與矽材料的特性比較
對於給定厚度,寬能隙材料臨界擊穿電壓值比Si高10倍左右,因此SiC漂移層可以薄10倍,摻雜濃度可以是10倍。寬能隙材料與Si相較,能夠提供比Si低很多的導通電阻,並且相應降低同樣管芯面積的損耗。由於SiC具有高導熱性,所以管芯可以非常小,因而具備出眾RDS(ON).A(FOM)。圖3是在650V下SiC MOSFET、GaN HEMT單元、Si MOSFET和IGBT的RDS(ON).A比較。
圖3 在相同電壓下,WBG和矽材料之間的RDS(ON).A比較
SiC和GaN大大降低了對閘極驅動功率要求。Si MOSFET和IGBT特別需要大量閘極電荷才能有效開關。對於較大IGBT,這可能需要數瓦驅動功率,從而導致系統損耗。對於WBG元件,即便在高頻下,損耗僅是毫瓦級。
WBG元件還有其它優勢:相較矽元件,可以在更高溫度下運作,最高可超過500℃。儘管封裝限制了實際操作值,但高峰值容量顯示了可用餘量。相較矽元件,WBG閘極洩漏和導通電阻隨溫度變化也要小很多。
成本降低提高WBG元件吸引力
WBG元件成本一直高於矽,但卻在逐步降低,而連鎖式系統優勢在很大程度上抵消了這一點。例如,隨著效率提高,其他部件(例如散熱器)以及濾波器中的電感器和電容器尺寸、重量和成本也相應減小。更快的開關速度,使電源系統對負載變化的回應變得更快,馬達控制也更平滑,也讓基於WBG元件的電源系統變得更有吸引力。
總體而言,使用WBG元件帶來的優勢意味著可以將它們用於電源轉換的任何新應用,設備製造商也在不斷完善技術,從而使元件易於使用且堅固耐用,尤其是在短路和過電壓等故障條件下。英飛凌(Infineon)選擇了一種溝槽架構(圖4左),可在低閘極電場強度下實現低溝道電阻,從而提高了閘極氧化物介面之可靠性。該公司的增強型GaN高電子移動率電晶體(HEMT)元件則採用平面架構(圖4右),並且與SiC FET不同,它們沒有本體二極體(Body Diodes),使其特別適合於「硬開關」應用。GaN元件額定電壓為600V,而SiC額定電壓則為1,200V或更高,但在特定電壓額定值下,GaN RDS(ON)理論極限約比SiC好10倍。
圖4 英飛凌的SiC(左)與GaN(右) FET結構對照
意法半導體(ST)則宣稱其1,200V SiC MOSFET具有業界最高額定溫度200℃,並且在溫度範圍內具有同類領先極低導通電阻。非常快速且堅固的本體二極體避免了外部二極體需求,從而節省了馬達驅動器等應用中換向電路空間和成本。
羅姆(ROHM)在SiC MOSFET市場中也有產品供貨,其最新元件具備高成本效益和突破性能。ROHM據稱開發了業界首款具有共封裝(Co-packaged)的反平行SiC肖特基屏障(Schottky Barrier)二極體SiC MOSFET,可滿足要求苛刻的換向開關應用要求。
WBG市場上的另一家供應商GaN Systems,則專注於其獲得專利的封裝技術,從而可最大限度地利用GaN速度和低導通電阻。其「島嶼技術(Island Technology)」將HEMT單元矩陣與橫向佈置金屬條垂直連接,以降低電感、電阻、尺寸和成本。此外,該公司GaNPX封裝技術沒有引線鍵合,可提供最佳熱性能,高電流密度和低外形。
GaN市場的一家先驅公司Panasonic推出了擁有專利技術的X-GaN元件,以實現「常關」運作而不會出現GaN中的「電流崩塌(Current Collapse)」現象,這種效應源於汲極和源極之間捕獲電子在施加高壓期間可以暫態增大導通電阻,可能導致設備故障(圖5)。Panasonic閘極注入電晶體(GIT)技術能夠產生真正的「常關」 GaN元件,可用與Si MOSFET電平相容的閘極電壓來驅動。
圖5 Panasonic GaN單元不會有「電流崩塌」現象出現
WBG元件普及可期
WBG在功能層面勝過矽,當下的應用障礙只是成本、易用性和所展示的可靠性。WBG元件製造商已經在解決這些問題,並且大規模生產已成為現實,預期在所有市場領域中都有積極應用。
(本文作者任職於貿澤電子)
突破尺寸/功耗/效能天險 智慧推論晶片迎接新典範
未來消費性裝置創新,須仰賴創建更智慧的新型聯網裝置。此一未來,會由更多具有近端機器學習推論能力的知覺型感測器(Perceptive Sensor)所推動。運用這些感測器並同時擴大推論網路,將能推動智慧型裝置在幾乎所有方面的功能與使用者體驗的提升。隱私權亦可透過終端裝置本地推論的運行而獲得改善,因為只有最少量的使用者資料及感測器資訊會上傳至雲端。
機器學習被鎖在雲端
機器學習與智慧型裝置的交會解放了消費性電子產品新一波的創新。然而最佳的機器學習網路處理需求以及低功率處理器效能之間還有極大的差距。目前的解決方案是運用裝置收集並廣播感測器的資料至雲端,而高功率、專用的機器學習處理器則在雲端負責推論,並在完成後將結果透過網際網路回傳至使用者裝置。這個方法雖能提供機器學習的功能,但亦有極明顯的弱點。裝置有限的能量必須消耗一部分以保持持續的網路連線;雲端運算的延遲亦會限制了裝置對推論的應用,並且會破壞使用者體驗。而傳送原始資料的需求則讓裝置難以維護資料安全,並造成隱私權的顧慮。整體而言,這些限制了智慧裝置對機器學習的實際運用。
第一代的低功率機器學習處理器的整體容量與運算能力不足,只能專注在基本網路應用,如語音指令辨識,以及用於攝影機控制及客製化過濾的特徵偵測等。機器學習的核心邏輯絕大部分被減慢的摩爾定律所限制,因此若沒有效能上快速的改善,機器學習就必須維持在雲端。僅有在運算架構出現突破,方能創造出高效能、高正確度的近端推論。
本文意在展望複雜的推論網路可在幾乎任何消費型裝置上執行的未來─現在已極度接近。全新的「智慧型推論裝置」浪潮將會提供近端高效能的機器學習,讓敏感性的使用者資料不必上傳網路及雲端。其能自動化運用機器學習以改善低階裝置的功能以及使用者體驗。其將由快速創新、機器學習的同步處理、處理器設計、裝置設計所驅動,以創造全新的未來使用者體驗。
機器學習推論的突破
近期機器學習所克服的進階挑戰,揭露了新興智慧型推論裝置的絕佳前景。眾多團隊投身機器學習研究與學習/推論的程式碼庫,讓機器學習進入指數型的學習曲線。大部分的進展多與裝置的雲端連線能力或近端處理有關,針對處理較小資料集的研究則是純粹近端處理的最佳候選。裝置近期可以直接運用的創新包含:
・觀察手勢並處置實體世界物體
這項創新在兩個相關領域中已取得進展,可追蹤人類與機器人手臂,及教導機器人執行觸覺操縱。2019年,OpenAI透過在3D模擬中訓練的機器人展現出手指的靈活性,將其知識轉移至現實,並適應現實世界的物理現象。這創造出可以執行複雜任務的彈性,像是解開真實世界的魔術方塊,卻不需要真實世界的訓練。此外,2019年Oculus Quest亦發表了視覺感測器的手部追蹤技術,需要同時使用4具攝影機以進行6個自由度的頭部追蹤。該解決方案在Snapdragon 835處理器及3MB的神經網路架構,以500mW的耗能提供骨骼及數個手勢追蹤。此前非機器學習的解決方案必須使用景深攝影機及專用邏輯,並消耗超過15W的功率,卻僅能提供明顯較差的正確性。
・以現在的行動衡量未來結果
在Google的DeepMind中,強化學習經過修改而能了解賽局中決策的長期結果。Temporal Value Transport演算法則是用以將未來所得的結果通知現在,結合未來利益的機率於當前的行動中。這種結合未來結果於目前決策的能力能大幅改善機器學習系統在現實世界的決策制定,除可協助裝置進行更複雜決策的制定,還能大幅改善可執行任務的數量以及可應用狀況的複雜度。
智慧型推論裝置 開創全新體驗
運用推論協調裝置功能是未來裝置設計的強大典範。推論驅動的設計可以創造全新等級的使用者體驗,同時改善低階裝置的功能。具有多重網路推論的裝置將用以進行使用者與環境輸入訊號的複雜翻譯而不需要運用到雲端。使用多重同步網路能讓裝置對於使用者與環境輸入訊號有更高層的理解及反應。這些裝置受到影響的邏輯包含:
・智慧型推論裝置啟動
機器學習極適合翻譯聲音、手勢以及視覺輸入,以啟動裝置、節省電池電力並減少雲端資料傳送。
・雲端運用與資料隱私經衡量
裝置可以運用推論在雲端相關任務上,包含進一步推論,或是非推論的雲端計算。裝置可以在近端進行推論,而不需要提供原始資料至雲端。聲音、影像及感測器資料及其所產生的推論均不需要上傳。裝置可以決定哪些資料需要傳送至雲端,而該邏輯可以透過設計以強化隱私與資料安全性,而不需要因為必須在雲端處理而公開地揭露。
・推論驅動使用者體驗
在裝置靈活性、真實聲音翻譯及重製、導航、視覺、偵測、辨識等裝置功能的提供上,推論已證明具最佳的表現。推論可以直接用以創造全新使用者等級的功能與體驗,這些都是不具推論能力的裝置所無法提供的。可同時使用一組以上神經網路的處理器,具有能在裝置及使用者層級同時運用視覺、聲音及創新感測器輸入以制定複雜決策的能力。
啟動智慧型推論裝置
啟動感測器或連接至雲端都需要運算、耗電以及成本。若裝置能快速推論,一旦感測器的輸入需要後續對應動作時,處理器便能聰明地啟動、建立無線網路連線,而雲端的任務亦能明確地被指派。以此方式,低功率的推論便能透過把有趣的動作偵測、聲音啟動以及使用者意圖等留在裝置近端處理,節省整體裝置的耗電(圖1)。
圖1 推論驅動設計的智慧裝置運作
智慧型啟動的重要性不應該被低估─裝置可以進入可接受的耗電範圍,而在許多應用中雲端服務可以避免雙位數的誤判。
・只有當任務短語和語調提出時,更聰明的啟動文字才會觸發裝置和雲端活動。
・在各種基於攝影鏡頭的應用中,智慧動作感測可預測動作的意向,以避免下游處理。
・智慧感測處理能減少一般功能處理器的負載,並運用機器學習來聰明地啟動裝置。
雲端運用與資料隱私經衡量
行動與社群應用帶來前所未有規模的運算與隱私挑戰。為雲端所設計的應用,可以把推論移轉至裝置,減少延遲並節省雲端資源。此外,如穿戴式裝置或智慧音箱等產品亦能決定近端、多因子排程以執行不同甚至是多重供應商的雲端服務。雲端雖然有極大的運算能力與資料量,不依賴網路連線的近端裝置則免於網路延遲與不可靠性。能正確在近端執行推論的裝置,因為能在近端分析聲音、影片、空間及其他感測器資料,僅需傳送較少的資料至雲端,能大幅改善機會來保護使用者隱私。
・機器學習從雲端轉移至近端裝置可以達成低延遲的使用者反應,能大幅改善聲音、攝影機、手勢等輸入的使用者體驗。
・近端的影片與聲音分析可以在近端執行,僅有在需要進行雲端分析時才將影片或聲音上傳,因而能保護敏感的使用者原始資料流。
・智慧型應用程式介面亦能讓單一智慧裝置對來自多個供應商的應用程式進行任務分派並進行雲端互動。
推論驅動使用者體驗優化
推論是讓裝置開啟尖端且全新使用者等級功能的核心性能。結合機器學習推論的聲音與視覺處理讓裝置能辨別複雜的指令與語境,而後產生絕佳的成果。可在新興智慧型推論裝置上擴展的功能,包含使用者回應功能像是生物辨識存取、環境回應、有意義的輸入以及衍伸的人類意圖。此外,還包含替身模擬、機器人控制、智慧型感測器控制及導航等功能(圖2)。
圖2 機器學習推論可讓裝置開啟全新使用體驗的尖端功能
智慧型推論裝置機器處理器的期待屬性
能協調智慧型裝置功能的處理器,將運用機器學習技術,同時包含與裝置感測器、核心處理以及功率控制的關鍵介面。其將成為裝置的大腦,以啟動裝置的功能並調配關鍵的處理。理論上,其能提供實用的功能讓裝置因為減少耗能、必要時智慧化啟動裝置功能、確保其能依安排的需求而啟動,而成為更好的產品。在此同時,其能高效率正確地處理複雜的網路,體積又能更小─讓其可以置入體積精巧的平價裝置。
未來智慧型裝置的關鍵考量是其在感測器與耗能之間的關係。許多裝置需要延長電池使用時間。現今,複雜的視覺感測器資料分析會以最大Thermal Design Power(TDP)的狀況下消耗所有的運算資源。智慧型感測器僅有在必要時會啟動處理、無線網路、雲端互動及實體功能。智慧型感測器與裝置功率的減少是加速智慧家庭採用的必要項目。智慧化啟動網路運作及雲端互動可以減少裝置耗能、延長運作時間、增加尖端功能所能保留的電力預算。家用配線是長期的限制,需要許多裝置以電池運作,以增加消費者的採用。現今電池運作的智慧型家用裝置通常使用4個以內的AA電池或是3500mAh的充電電池,而目標運作時間則在3個月以上。運用智慧型感測器,僅在必要時才啟動裝置,在近端處理輸入而不需要無線網路的連線,可以顯著增加其功能,並減少對於電力的需求。
最佳化的效能、架構、軟體、功率以及研發平台的匯集,對於推論成為未來智慧型裝置設計的驅動因素是全部必要的條件。最佳化的推論處理器將在這些屬性上同時擁有優異的表現。
效能
・高機器學習網路效能/瓦特:能執行高正確性、現代的影片/影像/聲音處理類型網路。
・一致的加速度:即便在網路程式碼改變,並擴大多重網路類型,仍能提供相對一致的加速度。
架構
・整合式設計:小尺寸及高度整合,以簡化設計。
・標準匯流排:使用標準介面與匯流排設計,易於整合至裝置。
・多重感測器輸入/輸出介面:支援影片、聲音、常見及新興的感測器。
・可擴充性:在相同的程式碼下,設計架構能擴展至多重ASIC或是更大、更高性能的ASIC。
・低延遲:整合記憶體架構及快取,以快速處理所擷取的資料,包含聲音及高解析度/多重攝影機影像等。
軟體
・快速載入:快速並動態載入,同時執行多重機器學習網路。
・不特定機器學習網路:執行任何神經網路型式或是分層類型。
・執行及相關多重機器學習處理:運作多重網路並執行橫跨多重推論的分析。
・一般目的運作:執行程式碼以產生完整形成與裝置運作相關的成果。
電力
・低TDP:支援電池電力以延長穿戴式裝置及離線操作的使用時間。
・低熱度限制:低熱度適合支援穿戴式裝置及全被動式運作。
・快速啟動:由使用者或感測器呼叫可快速、低延遲的啟動加速器,適合底層以低於使用者感知等級的運用。
・選擇性啟動:命令和控制感測器啟動,支援額外處理,協助裝置平均耗能最小化。
平台
・強力的SDK及說明文件:軟體工具集,搭配第三方工具的支援,使其易於運用於目標的加速器中。
・最佳化的預製:針對主要應用的功能區塊,如偵測、分類、除噪等,提供直接替代(Drop-in)的支援。
・部署工具集:來自主要機器學習平台如MXNet、PyTorch、Caffe及TensorFlow的移植工具等強力支援。
兼顧尺寸/功耗/效能 全新推論處理器登場
新創公司Perceive發表全新的Ergo,是款高度整合的推論處理器,能將所有推論處理卸載至低功率應用及小尺寸裝置。Ergo能以相當於55 TOPS/W的性能執行推論,而在全功率運轉時可以達到4 TOPS,而不會犧牲正確性,或限制可支援網路的類型。Ergo ASIC採用7×7mm FBGA封裝並能以約20mW耗能處理許多網路,最大功率約為120mW,且完全採用被動式散熱。在現場展示中,Ergo在全速運轉之下溫度仍低得可以直接碰觸。
Ergo是設計來執行傳統上僅能在資料中心等級推論處理器上方能運作的網路。現今Ergo可以完整執行YOLOv3,在批量尺寸為1時以246fps處理6400萬組參數。Ergo可以執行傳統上需要超過400MB儲存空間且有超過1億組參數的網路。
與之前設定為低耗電應用的推論處理器相比,Ergo計畫並達成所有之前的處理器及專用加速器擁有相當的每瓦特效能的20倍至100倍的功率效能。現今的推論處理器一般低於5 TOPS/W,而Ergo則可以達到55 TOPS/W以上。
要達成這樣的效能,Perceive發展出全新的運算架構,能維持高正確性,但大幅減少記憶體與耗電量的要求。Ergo新穎的網路表示法(Representation)避開推論對於MAC陣列的需求,並因而精巧至足以在晶片內記憶體執行大型網路。Ergo晶片亦採用積極性功率與時脈閘以增加電源效率。因此,Ergo能在7mm×7mm的封裝內提供極高的正確性。結合了源自數學原理的方法至機器學習、不是依據MAC而設計的架構、沒有外部記憶體、傳統的節電技術,是讓Ergo可以在資料中心等級網路上提供高正確性、效能與效率的原因。
廣泛的移植網路和一致的效能提升,代表該公司已成功創造一種能提供相對於今日推論負載明顯效能改善的架構。此外,該公司亦已展示許多多重網路應用,均與其宣稱的網路容量及性能相符。
Perceive Ergo能直接串接高解析度、高影格率影片感測器,讓多重感測器與即時元資料(Metadata)有機會作為推論處理的額外輸入。此能提供先進的問題解決與多重網路推論,讓其能運用於核心裝置控制與先進的終端使用者功能。有了高效能與網路容量,亦可能推出全新的功能。在此機會之下,軟體設計與訓練出現新的挑戰,對裝置生產廠商成為全新的技術挑戰。Perceive已試著透過工具套件(其中含有針對一般機器學習應用的已可用於部署Ready-to-deploy網路),讓研發更為容易。
Perceive Ergo機器學習網路範例
Perceive Ergo可同時執行多個網路,讓智慧型裝置能採用推論驅動設計。其已使用現今多層次網路如CNN(包含殘差邊緣)、LSTM、RNN及其他網路進行測試。示範的網路包含:
以M2Det進行多重物件偵測
多重層次多重尺度偵測器(M2Det)是新發表的類神經網路(2019年1月),用以進行物件偵測及在地化,設計以偵測尺度差異極大的物件。M2Det是款端到端、單一拍攝物件偵測器,其在現實世界應用極為實用,因為物件可以是在漸進場景中且尺寸及比例差異極大。
以YOLOv3進行多重物件偵測
YOLO是由Joseph Redmon及Ali Farhadi所創造的CNN式類神經網路,可以在影像及影片中辨識並定位高達80個物件類型。現今YOLOv3是資料中心最受歡迎的多重物件偵測器之一。
以專用網路進行聲音事件偵測
最佳化的類神經網路可以以小尺寸的類神經網路辨別多重聲音事件類別,讓其極適合運用搭配較大的視覺處理類神經網路使用。
以ResNet進行臉部辨識
深度殘差學習因較易訓練與絕佳的正確性而受到關注,其為微軟研究院(Microsoft Research)在2015年所發表。多重層次配置的ResNet已運用於大型樣本地區臉部與影像辨識。
Perceive Ergo同步推論類神經網路範例
Perceive Ergo已示範結合這些類神經網路運作,並且以其自身的記憶體/網路權重能力在技術上是足以同時執行多重類神經網路。此處理器能執行全新類神經網路的組合,處理使用內建輸入/輸出埠自多重偵測器所取得的資料。
Perceive...
關鍵應用含金量高 手機/汽車AI吸引大廠競折腰
AI新興應用持續推進
自2018年起,在演算法層面,AI已經相對成熟,賽靈思(Xilinx)人工智慧業務高級總監姚頌(圖1)提到,目前應用層面還在不斷進展的是神經結構搜索(Neural Architecture Search, NAS)相關的領域,希望透過電腦自動找到最佳演算法結構、減輕演算法工程師的負擔。MIT的韓松教授推出One-For-All神經網路,可以訓練一個複雜的網路,針對不同場景的需求(高精準度、低延遲等),自動選擇部分子網路來滿足要求。2020年,對於邊緣運算解決方案需求最大的還是手機與汽車,二者共同的特點都是無論網路與通訊狀況如何,都需要AI做出迅速的反應。
圖1 賽靈思人工智慧業務資深總監姚頌
姚頌進一步指出,手機、平板電腦已經從通訊工具,升級為娛樂工具,再升級為邊緣的核心設備。除iPhone全系列產品已經搭配了用於FaceID的結構光相機,需要即時、私密的AI識別之外,最新推出的iPad Pro,還新增了dToF的微型雷射雷達,可以進行高精度測距、實現良好的AR效果,而AR也是AI的一個重要應用場景。另外,2020年在自動/輔助駕駛、智慧車艙已全面採用AI,特別是隨著電動車的推廣,汽車被視為下一個智慧終端裝置。
過去影像辨識與語音辨識通常是各自發展的應用,主要原因是影像採用卷積神經網路(Convolutional Neural Network, CNN),語音使用遞歸神經網路(Recurrent Neural Networks, RNN),然而近期Google公開演示了使用CNN網路進行語音辨識,也開啟了影像與語音辨識複用的可能,NVIDIA技術行銷經理蘇家興(圖2)認為,目前已有應用同時導入兩種辨識技術,讓人機溝通更自然,雖然目前還不是使用同一套網路,但或許不久的將來就會相互整合。
圖2 NVIDIA技術行銷經理蘇家興
手機/汽車AI競爭如神仙打架
手機與汽車是兼具雲端與終端的裝置,一方面需要強大的運算效能,一方面對耗電非常在意,這類產品也被看好具有高度潛力,於是大廠的邊緣應用都投注心力在這兩類產品。姚頌表示,AI晶片除了性能需求足夠出色,更重要的是需要有簡單易用的開發環境、豐富的生態以及滿足使用場景的產品功能。賽靈思2019年推出了全新的軟體發展環境Vitis與Vitis AI,就是旨在協助不同開發者輕鬆地開發AI應用。而針對AI產業的Vitis AI以及Vitis AI Library,可以允許演算法工程師直接在提供的大量案例上二次開發,也可以透過簡單的命令與腳本編寫完成AI演算法的編譯與執行。
在晶片層面,賽靈思推出了新的車規級運算平台XAZU7與XAZU11,可以廣泛用於L2到L3的輔助駕駛與自動駕駛場景,也可以用於智慧車艙的各類應用。到目前為止,Vitis AI已經發布了最新的1.1版本。而賽靈思的自動/輔助駕駛方案也得到戴姆勒、百度等汽車產業認可。
另外,NVIDIA在GTC也公布新一代自駕車平台Orin,將整合具新一代TensorCore之Ampere架構GPU,針對L2的標準可在45W耗電水準下,提供200TOPS性能的版本;針對先進輔助駕駛的Orin ADAS SoC,可在5W功耗提供10TOPS的性能,能夠滿足當前先進輔助駕駛的需求。標準的Orin採用12核Arm Herculus CPU搭配Ampere GPU,記憶體頻寬達200GB/s,與支援四路10Gbps乙太網路,具備170億個電晶體。在L5自動駕駛平台部分,NVIDIA藉由雙Orin搭配兩組Ampere架構GPU組成,功耗800W,但算力可達2,000TOPS。
而在CES 2020,高通發表Snapdragon Ride平台,正式進軍自駕車領域。該平台共有三種不同的配置,其中,單處理器版已經足夠應付ADAS系統;雙ADAS處理器版本,算力則更進一步強化,同時也為系統準備了安全備援,可以支援L2和L3半自動駕駛。第三種配置則在上面的基礎上多了加速晶片,三晶片版本的配置包括兩塊ADAS處理器外加自動駕駛加速器,算力可達400TOPS。
關鍵應用投入大量資源/時間
除了汽車與手機之外,蘇家興表示,智慧醫療、5G等應用也需要高運算力,而由於AI模型發展越來越複雜,在業界希望賦予AI更多能力的前提下,導致資料庫越加龐大,所以在訓練過程中希望可以優化網路,以提升整體系統的效率。
AI晶片在重要裝置如手機、汽車等平台的發展目前由大廠主導,除了含金量高之外,這類平台的應用需要整合許多相關資源,與雲端的網路訓練關係也很密切,如自駕車就需要非常龐大的網路資料庫輔助,目前相關廠商已累積不下數百萬英哩的測試里程,但實際上離自駕車可以安全上路還有很長一段距離;另外,智慧醫療除了資料數量之外,更要求資料品質,而且醫療行為攸關人命,發展過程會更加謹慎。相信未來幾年,人工智慧還會發生更多有趣的事,開創更多可能性,值得市場持續關注。
AI異構運算工作負載有解 HBM/運算加速相得益彰
近年來,異構運算(Heterogeneous Computing)逐漸興起,進而拓展了後摩爾定律時代在加速運算密集型工作負載方面的創新。當前資料中心產業中,普遍採用異構運算進行加速的工作負載種類繁多,包括人工智慧、即時視訊轉碼和基因組分析,而這些僅僅是其中的一部分。FPGA元件則為現代資料中心工作負載提供了靈活應變能力和運算加速能力。
然而,在很長的一段時間內,DDR記憶體架構的演進並不足以跟上運算加速領域的創新步伐。在過去十年中,雖然平行記憶體介面的頻寬性能得到改善,但進展依然緩慢;現在的FPGA支援的最大DDR4資料速率仍然只有2008年DDR3的兩倍左右。相比之下,自2008年以來,FPGA的運算能力卻提高了近八倍,而且隨著配備AI運算單元的元件推出,預計未來兩年內還會有更大的成長空間(圖1)。因此,在資料中心領域,記憶體頻寬與容量將成為眾多運算和記憶體頻寬密集型工作負載發展的主要限制因素。
圖1 FPGA運算性能成長與DDR頻寬提升比較
HBM2提升AI運算效能
HBM(High Bandwidth Memory)是一種高速的系統級封裝(SiP)記憶體技術,它使用垂直互聯的DRAM晶片堆疊和一個寬(1024位元)介面,與採用傳統打線接合封裝的記憶體產品相比,可實現更大的儲存容量和更高的資料頻寬。聯合電子裝置工程委員會(Joint Electron Device Engineering Council, JEDEC)在2013年開始啟用初代HBM標準,2016年1月,第二代HBM2版本成為業界標準(圖2)。
圖2 HBM和2.5D結構
HBM2標準支援4個或8個8Gb DRAM裸晶逐個堆疊在一起,由一個2.5D矽中介層(Interposer)提供支援,該中介層可將記憶體堆疊與底層電路板連接起來。堆疊一些裸晶(通常是記憶體)而不是其他裸晶(通常是處理器)的多晶片封裝被稱為2.5D元件。
可以將多個堆疊整合在同一個封裝中。與傳統的多晶片DRAM產品相比,透過在一個電路板上堆疊多個裸晶並將其堆疊得更緊密,可以大大減少HBM記憶體封裝的占板面積。由於縮短了訊號在設備之間的傳輸距離,HBM技術還可以提高系統性能。此外,較短的傳輸距離可以減少傳輸定量資料所需的能量(圖3)。
圖3 HBM裸晶堆疊技術
HBM具備先進的矽穿孔(Through Silicon Via, TSV)技術、微尺度互聯和突破極限的I/O數量,可以增加記憶體頻寬,與競爭對手相比,在用於繪圖卡的圖形雙數據速率(GDDR)記憶體方面,HBM無疑能提供更高性能。在元件級別,單個三星HBM堆疊可以提供高達307GB/s的資料頻寬,實現比GDDR5晶片快近10倍的資料傳輸速度。而在系統級別,與使用於GDDR的解決方案相比,HBM則能提供近3倍的輸送量,並且能將功耗降低80%,同時還可以節省寶貴的電路空間(圖4)。
圖4 HBM與GDDR頻寬比較
支援HBM的Virtex UltraScale+ FPGA提高了記憶體頻寬,例如,兩個三星HBM2記憶體堆疊可提供高達460GB/s的速度。將一個或兩個HBM2堆疊與各種尺寸的FPGA邏輯和DSP進行配對,為使用者應用選擇較佳的運算能力與記憶體頻寬/容量組合。如賽靈思(Xilinx) Alveo U280網路加速卡基於16nm UltraScale+架構,採用8GB三星HBM2,可為資料庫搜索與分析、機器學習推論及其他記憶體限制應用提供較高等級的加速功能。本文以深度神經網路與資料庫加速方面的研究為例,展示了支援HBM的元件優勢。
加速語言翻譯準確性
各種雲端應用正在提供自動即時語言翻譯服務,這種服務可以使用基於神經網路的機器學習方法在兩種語言之間翻譯語句。編碼器-解碼器架構推動了當今的商業自動化翻譯服務。在使用機器執行翻譯任務時,兩種語言的單詞經由一個稱為單詞嵌入的過程,以高維向量的形式呈現;因此,單詞之間的關係可以通過向量進行量化建模和反映。遞迴神經網路(Recurrent Neural Networks, RNN)、卷積神經網路(Convolution Neural Network, CNN)和基於注意力的模型等結構通常用於執行編碼和解碼功能。
近期研究表明,在語言翻譯中,只有採用基於注意力的網路才能達到業界一流的準確性。研究論文中所描述的注意力機制,即縮放點積注意力,是由兩個矩陣乘法和其他函數(Scale、Mask和Softmax)構成的。多頭注意力結構通常由多個並行的縮放點積注意力與不同的輸入投影構成。該結構與前饋網路共同用於構建整個語言翻譯模型的解碼器和編碼器(圖5)。
圖5 基於注意力的神經網路語言翻譯模型
如圖5所示,基於注意力的語言翻譯模型的主要運算強度來自於對縮放點積注意力和前饋網路的點積計算。這些點積通常被組合到矩陣乘法計算,以實現更高效的運算。然而,與傳統在整個空間中大量重複使用權重參數以減少資料移動痕跡的卷積神經網路不同,這種基於注意力的模型幾乎不重複使用輸入空間參數,導致對矩陣乘法計算的記憶體頻寬要求要高得多。
透過建立一個轉換器分析模型,其是用於語言翻譯的注意力神經網路,並且已經完成了構建與映射以便在UltraScale+元件上實現。FPGA實現方案的架構採用DSP脈動陣列來執行矩陣乘法。中間的啟動資料儲存在晶片的URAM中,可以消除啟動造成處理器和晶片外記憶體之間的資料移動。HBM或DDR用於儲存所有嵌入字典的單詞嵌入與權重參數。
針對具有不同句子長度(L)和句子數量的英德翻譯任務,也稱為批次處理大小(B),對其進行分析就可以瞭解附加DDR的元件和支援HBM的元件的時間延遲(Time...
AIoT應用含苞待放 邊緣推論晶片迎來戰國時代
相較於AI雲端訓練領域的蓬勃發展,邊緣推論則像是一片含苞待放的花園,各式各樣爭奇鬥艷的花朵準備盛開,智慧物聯網AIoT應用破碎化,很少有一個應用可以像過去主流應用一樣每年創造數億或10幾億出貨量的產業規模,每個應用的需求又各自不同;不過,業界估算整體AIoT產業的規模至少數十億甚至上百億,邊緣推論晶片未來幾年產業發展潛力十足。
目前人們生活中的絕大部分應用都需要機器學習(Machine Learning, ML)及邊緣運算解決方案,如語音辨識、人臉識別、符號偵測與定位、車牌辨識等。大多數應用場景需要即時的用戶互動與反應,強調能在地處理解決問題,而毋需將數據傳遞到雲端並進行運算,透過邊緣運算可以降低雲端運算的負擔,也可以解決延遲性、安全性和可靠性的問題。
AI聲音/影像應用推陳出新
由於AI演算法與處理器能力持續提升,超高影像解析度(Super Resolution)、準確的物件偵測(Object Detection)、影像分類功能(Images Classification)、快速的語音翻譯功能(Speech Translation)在過去一年獲得大幅進展。Arm首席應用工程師沈綸銘(圖1)提到,AI為使用者帶來更好的使用體驗。例如超高影像解析度能讓使用者掌握影像細節,大幅提升觀賞影片的體驗;Avatars效果能讓使用者在自拍時使用有趣的即時動畫效果;相機的智慧夜拍模式,則讓光源控制更輕鬆,在低光源下拍攝也能媲美日拍一般清晰;此外運用生物辨識技術的臉部辨識與解鎖功能,能讓消費者使用手機付款時更安全更便利。
圖1 Arm首席應用工程師沈綸銘
沈綸銘進一步提到,除了超高影像畫質能提升觀影體驗,AI也能強化整體的聲光環境,例如偵測影視內容所需,調整或放大聲量,或者對應室內光線環境,調校顏色對比與鮮明度;還能為家中有小朋友的家長把關,當偵測到電視前方有小朋友,電視會自動停止播放不適合的影視內容,以上這些功能或多或少都有AI的協助。
觀察AI專用晶片進程,沈綸銘認為,未來產品將朝向分眾市場發展,根據各式需求,像是算力、功耗、軟體大小、軟體開發框架等而有不同的發展趨勢。以嵌入式系統為例,市場上需要在少量功耗增加下提供有效率的運算處理。相對的,以自駕車系統為例,市場上則需要可延展的AI運算加速器,以及通用性的軟體開發。
邊緣推論講算力拼省電
卷積神經網路(Convolutional Neural Network, CNN)是這波人工智慧技術發展的起點之一,也是目前發展成熟度最高的技術,其對影像辨識效果最佳,應用也非常廣泛;過去幾年在指紋辨識領域取得領先地位的神盾(Egis Technology),也將原先的核心技術與AI結合,神盾新技術研發處副總經理林郁軒(圖2)表示,以智慧型手機指紋辨識功能為例,透過邊緣AI的協助,在辨識時毋須喚醒應用處理器也無須聯網,對整個系統的耗電與反應速度大有幫助。
圖2 神盾新技術研發處副總經理林郁軒
神盾從指紋辨識起家,為了優化指紋辨識的效能而導入AI,再從指紋的影像辨識往人臉、行為、動作等各式影像辨識技術發展,林郁軒解釋,邊緣運算尤其是行動終端或AIoT類的產品,除了算力還會比較每瓦的TOPS,導入AI也不能犧牲電源效率,這應該也是未來邊緣推論晶片競爭的重點。以神盾現在的解決方案來看,每瓦約可提供1~2TOPS算力,預計年底將提升到3TOPS,2021年則將推出20TOPS的解決方案。
未來幾年,對於ASIC廠商而言,與客戶深入溝通,將需求明確定義,是非常重要的關鍵,林郁軒認為,這樣才可以透過專用演算法與電路的設計,提高晶片的每瓦TOPS。而在推論的精度上,一般而言精度越低效率越好,所以也有滿多設計會導入可調式精度架構,讓精度與效率可以依應用調整。
AI系統效能為更可靠指標
針對AI算力已經成為效能指標的代名詞,在台灣可以被稱得上是人工智慧「獨角獸」的耐能智慧(Kneron),該公司董事長劉峻誠(圖3)指出,算力就跟CPU的處理速度一樣,只是AI晶片的運算能力,並不能代表整個系統效能,一味追求TOPS或是每瓦TOPS的數字表現,容易陷入迷思。耐能於2019年推出KL520晶片,具備「可重組式人工智慧神經網路技術」,會根據不同任務進行重組,減少運算複雜度,保證在不同的卷積神經網路模型上的使用,無論是模型內核(Kernel)大小的變化、模型規模的變化,還是影像輸入大小的變化,都能保持高效率使用運算(MAC)單元。
圖3 耐能智慧董事長劉峻誠
劉峻誠並提出「Edge AI Net」的概念,透過AI晶片,能夠將生命賦予終端設備,實現去中心化、離線本地處理、主動智慧等目標。一般而言,目前的AI網路如CNN、遞歸神經網路(Recurrent Neural Network, RNN)或長短期記憶(Long Short-term Memory, LSTM)網路,都是由卷積、剪枝(Pruning)與矩陣乘法器組成,耐能的晶片可以因應不同應用需求進行網路重組,所以一款晶片可支援多個不同網路架構,並組成Edge AI Net,讓算力共享,而能達成1TOPS算力,創造3TOPS效率的效果。
2020年下半年耐能計畫推出新款的AI晶片KL720,具備可堆疊式設計,可因應網路效能需求大幅提高算力,也不放棄個別晶片的每瓦TOPS,同時進一步將Edge AI Net概念具體實現,以「Kneo」的名稱推廣其智慧物聯網AIoT概念。從2019年發表KL520開始,已經有數百萬顆晶片的出貨量,未來這些產品都將是一個網路節點,有機會成為AI時代最具影響力的架構。
邊緣推論晶片大發生
在PC與行動通訊時代,最後都只剩少數晶片大廠主導市場,如英特爾(Intel)、AMD與高通(Qualcomm)、聯發科(MTK)。AI目前是百花齊放的時期,會不會延續之前的發展模式還很難研判,但競爭的激烈程度可以想見;恩智浦(NXP)AI晶片專注於邊緣運算晶片和終端產品晶片。恩智浦半導體大中華區業務行銷資深經理黃健洲表示,於邊緣運算和閘道,提供如i.MX處理器和Layerscape處理器並加強NN/ML加速器運作為目標,提供更快的反應時間,而毋需連接到網際網路執行機器學習推論並提高隱私和安全。
除了開發人工智慧晶片外,恩智浦還打算為使用者提供完整的生態系統,建立開發環境,推出邊緣智慧(eIQ)SDK工具,用於收集資料庫和開發工具,建構MCU/MPU的機器學習應用程式,如i.MXRT10xx與i.MX8M Plus應用處理器。
而在行動通訊時代取得重大成功的Arm,同樣積極發展AI解決方案,沈綸銘說,Arm...
製程升級/專用化/改架構 AI訓練/推論晶片算力攀升
人工智慧(AI)在經過幾年熱潮後逐步落地,過去強調AI準確性的做法,轉變為追求效率,而「算力」似乎成為AI晶片效能最容易理解的指標,TOPS(Tera Operations Per Second)或TOPS/w慢慢成為產業共識,儘管構成算力的條件很多,AI執行效能也非僅從算力就能完全判定。進入所謂AI 3.0的時代,資料運算複雜性持續提升,但希望在有限的資源下達成最佳化管理的目標,算力就是系統效能最初步/簡易的判別指標。
另外,AI針對不同場景與任務,可以分為雲端(Cloud)與邊緣(Edge)、訓練(Training)與推論(Inference),為了提升效能表現,這四類工作走向專用與分流,處理雲端訓練的晶片依然強調運算能力,希望能以資料處理量為重點,然而在另一端的邊緣推論則可犧牲部分精度,以求在最低的功耗下獲得可接受的結果,在強調運算與講求耗電的兩種需求就像是光譜的兩端,加上雲端推論與邊緣訓練,為AI晶片畫出四個明確的專用分流路線。
AI晶片分流專用成趨勢
1TOPS代表處理器每秒鐘可進行一萬億次(1012)運算。每秒浮點運算次數(Floating-point Operations Per Second, FLOPS)是每秒所執行的浮點運算次數,代表AI網路資料處理能力。整數運算則是使用在推論上,8位元整數(INT8)逐漸成為邊緣推論的主流,工研院產科國際所產業分析師范哲豪(圖1)認為,準確度更高的INT16與INT32,只出現在某些特殊應用,部分單純的應用更僅要求四位元或二位元精度。
圖1 工研院產科國際所產業分析師范哲豪
根據2018年中國清華大學的「2018人工智慧晶片技術白皮書」,將AI晶片分為三類,第一類是經過軟硬體優化可高效支援AI應用的通用晶片,如GPU、FPGA;第二類是專門為特定的AI產品或應用而設計的ASIC晶片,主要側重加速機器學習,尤其是神經網路、深度學習,目前智慧物聯網AIoT的終端應用出現越來越多這類晶片;第三類受生物腦啟發設計的神經形態運算晶片,這類晶片不採用經典的馮紐曼架構(Von Neumann Architecture),模擬人類神經元的運算模式,可以大幅提升算力。
大致說來,第一類通用型AI晶片是以雲端訓練為主,代表性廠商就是NVIDIA、Intel、Xilinx、Qualcomm這類大廠。第二類專用型的晶片以邊緣推論為主,廠商則是百花齊放,老將與新星並陳,許多原來發展ASIC的廠商與乘著AI浪潮興起的「獨角獸」都發展這類晶片。范哲豪提到,第三類神經網路晶片則是未來趨勢,像IBM或美國國防高等研究計畫署(DARPA),還有一些學校、知名技術實驗室已積極研發相關技術。
科技產業投入AI晶片前仆後繼
AI晶片是2019年半導體的投資熱點,工研院資通所嵌入式系統與晶片技術組長盧俊銘(圖2)指出,雲端以訓練為主,邊緣推理應用廣泛,因此出現雲端有訓練,邊緣有推理的說法,許多新創業者嶄露頭角;而處理器龍頭Intel繼2016年4.08億美元併購Nervana之後,2019年底再度以20億美元併購以色列AI晶片廠商Habana,同時擁有CPU、GPU、FPGA、AI專用推論與訓練晶片,具備最完整的AI產品線,展現進軍此領域強大的決心。
圖2 工研院資通所嵌入式系統與晶片技術組長盧俊銘
范哲豪強調,AI演算法、運算力、資料是AI三大要素,所以Google、Amazon、Microsoft、Facebook、阿里巴巴、百度等網路服務大廠也積極投入開發資料中心伺服器專屬的AI晶片或邊緣處理器。另外,恩智浦半導體大中華區業務行銷資深經理黃健洲(圖3)說,AI雲端晶片特點在於運算和圖形處理能力,並提供安全的客戶解決方案、應用和設備管理環境;邊緣端的優點則是保障隱私、改善用戶體驗、高可靠性的應用需求。
圖3 恩智浦半導體大中華區業務行銷資深經理黃健洲
而訓練則是透過量化等為更精確的訓練模型生成提供動力,訓練模型經過非常縝密的計算而且時間密集。黃健洲認為,需要更多資料遷移和AI引擎被創造出來為RTOS或低功耗電池平台提供輕量與靈活的訓練模型,以導入邊緣運算。推論(如Arm推出的Arm NN、Arm CMSIS-NN、OpenCV等)的趨勢則以提高卷積、匯集、動作等功能。
AI新架構成長期發展重點
為了提高AI晶片效能,算力成為關鍵指標之一,范哲豪解釋,傳統的CPU採用序列式運算,AI處理器則著重平行式運算,AI的運算與資料關係密切,資料介面頻寬成為運算的瓶頸之一,於是近來有更多解決AI運算時資料存取瓶頸的技術被提出,包括升級記憶體頻寬、讓處理器與記憶體靠的更近的近記憶體運算(Near Memory Computing)、運算單元與記憶體整合的記憶體內運算(In Memory Computing)等。
多年來資訊運算與處理都是依循傳統的馮紐曼架構,運算與儲存單元分開,范哲豪進一步說明,無論是CPU、DSP或GPU都是單獨處理運算,需要資料再從記憶單元呼叫,而在AI發展的過程中,運算單元不斷提升處理能力,資料匯流排頻寬沒有隨之擴充或追不上運算提升的程度,AI運算需要在運算同時取用資料,為了使AI運算最佳化,重新發展晶片的架構或材料,讓運算與記憶體的取用更即時,成為技術研發的方向。
目前常見的作法是Near Memory Computing,像NVIDIA的NVLink高速GPU互連技術,可以提升GPU的互聯頻寬與記憶體的取用速度,提供50~200GB/s的頻寬。或者是減低記憶體與處理器連線距離的設計如晶圓堆疊(Wafer on Wafer,...
ToF設計導入仍有關卡 生態系建置腳步要跟上
ToF技術在智慧型手機上,已經衍生出兩大類應用,其一是用來實現人臉辨識,另一個則是取得所在場域的深度資訊,進而強化手機拍照功能。
智慧型手機是一個年出貨量超過十億支的超大規模應用市場,照理說,能應用在這個市場的技術,都已經有一定的成熟度,但截至目前為止,環繞在ToF感測周邊的生態系統,還有許多改進的空間。
除了手機之外,ToF在其他應用領域還有很大的潛力,但不同應用對ToF的需求不盡相同,配套方案的成熟度跟資源也未必如手機般完整。因此,ToF若要在其他消費性電子或工業領域複製手機上的成功經驗,最大的關鍵,仍在於如何盡速搭建出完善的生態系統。除了感應晶片供應商之外,鏡頭模組廠、軟體開發商等業者也必須共同努力,才能完成光、機、電、軟的跨界整合。
ToF雜訊抑制仍需特別注意
英飛凌(Infineon)大中華區電源與感測系統事業部主任工程師林慶宗(圖1)指出,ToF技術問世至今已經有十多年歷史,感測器本身的性能在過去十多年來,有很明顯的進步。但在實際應用上,ToF感測的精準度除了取決於感測器本身的設計之外,環繞在感測器周邊的元件,也扮演著非常重要的角色。
圖1 英飛凌大中華區電源與感測系統事業部主任工程師林慶宗
ToF技術是以紅外線作為感測介質,因此,跟紅外線有關的因素,對ToF感測的表現具有決定性的影響力。以感測器本體來說,如何因應環境中本來就存在的紅外線,抑制其對感測器的干擾,是首要的技術課題。事實上,太陽本身就是一個強大的紅外線來源,因此在設計感測器的時候,選擇正確的頻譜,避開太陽所造成的紅外線干擾,是最關鍵的。
另一方面,因為ToF必須搭配主動光源,因此在選擇感測器頻段時,還得考慮市場上是否有對應的光源元件可供選用。目前比較主流的紅外線光源有兩種,一是IR LED,另一個則是IR VCSEL,其所發射的紅外線波長,大多都屬於近紅外線(NIR),即750奈米~1,400奈米之間。而其中又以760奈米、850奈米與940奈米最為主流。
因此,目前業界所推出的ToF感測器,多半工作在上述三個波長。以英飛凌為例,其Real3感測器就是工作在850奈米與940奈米這兩個波長。但太陽光中所含有的紅外線,在這兩個波長的能量還是相當強的,所以在設計感測器時,必須設法降低感測器過飽和的風險。
其實,ToF感測器跟一般相機所使用的CIS很類似,只是ToF感測器接收的是紅外線,一般相機接收的是可見光。相信很多人在拍照的時候,都曾經拍出過度曝光、畫面死白的照片。這個就是CIS過飽和所造成的結果。ToF感測器接收到太強的紅外線能量時,也會有一樣的狀況,只是ToF過飽和所造成的結果不是死白的畫素,而是沒有深度資訊的畫素。
因此,英飛凌在與PMD合作開發Real3 ToF感測器時,特別開發出背景照明抑制技術(Supression of Background Illumination, SBI),以避免感測器在背景環境的紅外線能量太強時,產生過飽和現象。圖2是在照度50kLux,對距離50公分的兩張人臉進行感測所取得的ToF點雲,這個照度大約跟晴天上午10點的陽光類似。在沒開啟SBI功能時,可以看到ToF感測器出現嚴重過飽和,原本該有深度資訊的點,都變成一片死白;但開啟SBI功能時,ToF感測器就能正常取得目標物的點雲。值得一提的是,關閉SBI功能時,快門的曝光時間為0.15毫秒,開啟SBI功能時,快門時間則長達0.3毫秒,換算下來,SBI功能大概可以讓感測器的動態範圍增加20倍之多。
圖2 背景照明抑制(SBI)功能對ToF感測器的抗干擾能力有很明顯的影響,左為SBI關閉的感測結果,右為SBI開啟的感測結果。
除了自然界中本來就存在的紅外線干擾外,搭配ToF感測器的主動光源,也會對3D感測的效果造成很大的影響。目前業界所使用的主動光源,不外IR LED與IR VCSEL兩種,IR LED的成本非常有優勢,但除此之外,在體積、可調變範圍方面,都遠不如VCSEL。其中,可調變範圍這項參數會直接影響ToF的感測解析度。
由於IR LED的調變頻率最快只能做到30MHz,VCSEL則可高達150MHz,若要應用對感測精細度的要求較高,例如人臉辨識,就必須使用VCSEL光源。
完善生態系統不可或缺
亞德諾(ADI)大中華應用工程總監李財旺則認為,不同應用情境對ToF的需求也不一樣,因此ToF解決方案必須在各種指標之間取得平衡。例如汽車、工業自動化、醫療電子、新零售、智慧監控等專業級場景來說,ToF感測系統不僅需要在精度、範圍、響應時間、解析度、成本、功耗、封裝之間取得平衡,還需要針對不同情況中出現的各種不可控因素、感測系統的靈活性與抗干擾性等方面進行客製化的冗餘設計。
這些冗餘設計有時是硬體,例如加入高可靠性的濾波和抗干擾元件/模組,有時則是軟體演算法,以保證系統有足夠的能力因應不同類型的突發狀況。
ToF或者3D技術從前端到後端都需要上下游產業鏈一起配合。它需要光學、電、晶片級、電路級,以及模組廠,還有一些應用專業產業來共同開發、適配整個方案。作為一種新型的視覺感測技術,無論是針對消費性還是專業級應用領域,目前需解決的基礎性問題還很多,未來如何透過技術去真正實現成本、功耗、體積、速度、壽命、穩定性以及抗干擾能力等多方面的平衡,以達到一個相對目前來說更為優化的水準,進而實現ToF視覺感測技術實際應用中可靠性的提升。
ToF是一種複雜的技術,必須擁有深厚的光學專業技術才能讓VGA感測器發揮最高效能。光學校正、高速脈衝時序模式、溫度漂移、以及補償等因素都會影響到深度的準確度。有可能要歷經冗長的設計週期才能達到想要的效能。同時,與感測器搭配的處理器也扮演非常重要的角色,因為3D ToF需要更高的運算能力。
ADI已支援許多精簡晶片數量的設計來因應客戶拓展商機的需求。針對許多客戶仍尋求更容易、更快速、更有效率的商品化途徑,希望能擁有簡單的展示模組,讓他們能先評測技術的效能,滿意之後再展開實際專案。ADI除了已經透過與許多領域的硬體夥伴合作,聯手提供不同層級的硬體方案之外,也透過與外部軟體夥伴合作,聯手將深度處理演算法方面的專才發揮至軟體層面。
事實上,即便是智慧型手機,目前的ToF配套方案也還沒有發展到十分成熟的地步。舉例來說,因為ToF感測器其實是一種特殊的相機,照手機的系統架構來說,應該要在影像處理器(ISP)便完成ToF資料的解算,但目前市面上並沒有手機的ISP晶片內建ToF運算加速硬體,導致ToF感測器取得的資料必須耗用ISP,甚至手機應用處理器的運算資源來處理。就功耗最佳化的角度來看,最理想的方法還是要在ISP添加專用的硬體電路來解算,這是手機相關晶片業者在制定產品發展藍圖時,可以思考的發展方向。
但如果是手機以外的應用產品,因為在系統的硬體架構中,不一定有ISP的存在,這時就得考慮外掛數位訊號處理器(DSP),或是採用整合DSP功能的感測解決方案。例如亞德諾的ToF解決方案,因為其鎖定的目標市場是各種專業級應用,因此有一部分方案已經包含處理器功能,應用開發者不需要擔心ToF會額外占用系統主處理器的資源。
圖3 目前手機ToF的典型訊號鏈,可見大多數的運算任務都還是要靠應用處理器來執行。
開拓多元應用 模組廠配合是關鍵
由於ToF是一種特殊功能的相機模組,終端產品製造商要靠自己的力量完成光學、電子的整合設計,是非常困難的任務,因此終端產品製造商通常不會直接跟感測元件供應商採購元件,而是向模組製造商購買已經整合好的模組,據此進行系統開發。
這意味著模組供應商對於ToF能不能開拓出更多應用,有非常大的影響力。如果模組廠商投入ToF的意願不高,即便ToF能為終端產品帶來很多附加價值,產品製造商恐怕也找不到可用的模組。因此,不管是英飛凌或亞德諾,除了開發感測晶片之外,在模組廠的業務經營上,也投入不少資源。
舉例來說,如果要將ToF技術推向筆記型電腦(NB)/平板電腦這類應用產品,原本供應NB相機模組的台系模組廠,如光寶、富士康是否願意投入,就會是關鍵。至於車用相機或工業相機,也有自己的供應鏈生態,如果要將ToF推入汽車跟工業市場,也得獲得這些模組廠商的支持。
由於生態系的建立跟經營需要一段時間,因此ToF技術雖然可以在許多應用場合找到發揮的空間,但個別產業導入的時間,仍會有快慢之別。按照生態系統發展的成熟度來看,在智慧型手機之後,掃地機器人會是最快將ToF感測功能列為標準配備的消費性電子產品。
至於NB跟平板電腦,因為供應鏈業者跟手機有若干重疊,導入的速度應該也不會太慢,特別是蘋果(Apple)在iPad Pro上內建光達功能後,許多品牌商為了跟蘋果抗衡,應該會加快導入的進程。
人臉辨識打響知名度 ToF應用踏上驚奇之旅
自從蘋果(Apple)在iPhone X中首度整合3D感測技術,實現人臉辨識功能後,3D感測技術很快就成為高階智慧型手機的標準配備。但3D感測其實是許多種技術總稱,除了蘋果用來實作臉部辨識的結構光感測之外,還有基於飛時測距(Time of Flight, ToF)原理的3D感測技術。
其中,ToF還可以分成更細的技術流派,一派是真實計算雷射光打出去到反射回感測器所需時間,藉以反推目標距離的ToF,另一派則是光源打出經過調變的光束,反射回感測器後會出現相位差,藉此來估算目標距離的相位式ToF。前者最典型的應用就是自駕車所使用的光達(Lidar),後者則因為成本跟功耗低,可以整合在智慧型手機上,而成為目前最主流的ToF技術。
事實上,由於蘋果已為自家的結構光3D感測技術申請了超過200項專利,滴水不漏地阻斷了其他手機製造商使用類似技術的可能性,因此目前絕大多數的手機製造商,都是採用相位式ToF來實現3D感測。而手機應用所創造出的龐大市場規模,正在為相位式ToF進軍其他應用創造出更多競爭籌碼。
另一方面,蘋果在最新推出的iPad Pro上,採用了類似車用光達的技術,以便讓iPad Pro能用來掃描物件或所處的空間環境,建立對應的數位模型。這也顯示ToF技術在中長距離(公尺等級)的感測上,具有結構光感測所沒有的技術優勢。由於蘋果的產品設計向來具有引導產業趨勢的能力,未來ToF將很有機會進駐平板,甚至NB等大宗市場。
走出智慧型手機 ToF應用全面擴散
光電科技工業協進會分析師林政賢(圖1)表示,在蘋果推出iPhone X,為消費性應用使用3D感測技術立下標竿之前,聯想便已經利用ToF鏡頭作為智慧手機中的近接感測器(Proximity Sensor)和自動對焦功能,但並未引發其他手機業者跟進。直到iPhone X推出一年多後,Android陣營的手機製造商如Oppo、華為、樂金(LG)才推出搭載ToF鏡頭智慧型手機。
圖1 光電科技工業協進會分析師林政賢
但ToF鏡頭在智慧型手機市場攻下灘頭堡後,其他終端產品的開發者跟元件供應商很快地就看見這個技術的應用潛力。包含自動駕駛、機器手臂、家電產品、安全監控和虛擬實境/擴增實境(VR/AR),都已經有搭載ToF鏡頭的應用產品。
在2020年的國際消費性電子展(CES),香港的Hubble Connected便展示了健康護理產品的概念驗證設計。該產品採用亞德諾(Analog Devices, ADI)的3D ToF技術,為初生嬰兒須父母緊密看護照顧,提供嬰兒監控鏡頭。而在車載應用上,在2月ADI與Jungo共同開發ToF和2D IR技術的攝影機解決方案,以實現觀察頭部、身體位置以及眼睛注視情況來監測車內人員的睡意和注意力分散程度,進而提高行車安全性。業界目前正開發新的「Phase TOF」與SPAD晶片用於AR與車載Lidar應用。
整體來看,目前ToF解決方案的領導廠商是意法半導體(ST),ADI的布局則比較偏向醫療、工業跟車載應用。英飛凌(Infineon)、德州儀器(TI)與博通(Broadcom)等知名晶片大廠,也都是ToF感測器的主要供應商。比較值得關注的是全球最大的影像感測器供應商索尼(Sony),近期也在加快ToF感測器與VCSEL元件的研發,業界普遍認為,該公司進軍ToF感測器市場只是時間早晚的問題。
果不其然,在iPad Pro發表後,TechInsights對其Lidar模組進行拆解研究,便發現內含由索尼提供的ToF感測器,顯示索尼的ToF感測技術已悄悄走出實驗室,進入量產階段。
ToF產業應用五花八門
亞德諾大中華應用工程總監李財旺則指出,3D ToF其實沒有一個特定的應用領域局限,從工業類、消費類、汽車類看到,在各個領域裡面,只要對3D感測器有一些特定應用需求的領域,包括物流、品質檢測、導向、機器人、人臉辨識、門禁、監視、保全維安、醫療、以及駕駛監視等使用情境都會運用3D深度感測ToF技術,以解決傳統2D技術目前無法克服的許多問題。
另外,結合高解析深度資料、強效的分類演算法、以及人工智慧等技術,都使各界未來能發掘出許多嶄新應用。以汽車應用為例,目前市場上的倒車雷達只能感應是否有障礙物,但一些矮小的障礙物就達不到感應範圍的要求,如果採用ToF技術,倒車系統就可以同時偵測多個不同距離的行人或障礙物,當有行人或者障礙物靠近時,就算是視線死角車頂的樹枝,透過軟體處理後,也能以影像或聲音警示距離,以幫助駕駛人員了解車後路況。
駕駛管理系統(DMS)也是ToF可以發揮的應用。透過AI Vision結合3D ToF感測器,透過軟體演算法準確判斷駕駛者狀態,當發現眼睛閉上、頭部沒有保持正面向前或與方向盤距離過近、過遠等精神不濟時,系統會立即發出警報提醒專注行車。
在智慧建築領域,以具備人臉識別的ToF 3D立體影像自動門解決方案為例,基於ToF的方案則可識別空間中的人類特徵以及人與物體相對位置距離,避免動物等非人類進入商場。
ToF技術在工業領域也能為機器人帶來視覺效應,使之能像人類一樣具有方向感。尤其是當機器人身處較為擁擠的工作環境中,它們必須能辨認人與機械的動作,並做出迅速的反應以避免受傷。
對於ToF而言,還有一個非常重要的應用領域就是體積測量,因為在體積測量的時候,我們除了2D的資訊之外,還需要多知道一個深度的資料,這樣的3D ToF技術能快速採集三維資訊並快速計算,包括應用於電梯承載容量管理,透過軟體演算法360度同步掌控電梯空間使用狀況,無論空間或重量,只要其中一項達到承載限制便立刻停止額外載客、載物服務,避免能源浪費。另外,在物流業裡面,體積對於物流產業來計算包裹費用是一個非常關鍵的因素,因此如何快速的採集包裹的體積資訊,對於物流業來講,特別是快遞人員的工作效率是非常重要的。
最後,在超商或者無人商店裡面,除了二維碼之外,還有一種支付方式叫人臉支付。3D技術在比對人臉二維資料的同時,需要一個3D技術進行活體採集,說明這是生物識別,不是一張簡單的照片,因此在支付這樣比較敏感、安全性要求比較高的應用級別裡面,3D技術是一種類似於強制性的引入技術。同樣,在機場以及大廈的安檢中,我們都可以看到人臉辨識系統的導入。
此外, 對於工業AGV應用來說,ToF也在onboard處理器執行SLAM演算法,以協助客戶擁有更安全及更乾淨的環境上扮演重要的角色。
AR/VR將成消費性ToF應用推手
雖然ToF有廣大的應用潛力,但由於每家企業採取的經營策略不同,因此在業務布局上,出現明顯的區別。從李財旺的觀察與分享,不難看出亞德諾將ToF產品的發展重心放在各種工業及汽車應用,但也有將業務重心放在消費性市場的業者,如英飛凌就是其中之一。
英飛凌大中華區電源與感測系統事業部總監麥正奇(圖2)表示,該公司從2013年開始,就與另一家德國ToF技術開發商PMD合作,共同研發ToF技術。到目前為止,除了產品已經演進到第五代,且過去幾年在智慧型手機、掃地機器人等消費性產品上,有不錯的斬獲。接下來,英飛凌會開始跟平板電腦、筆記型電腦的製造商合作,讓這些大宗消費性產品也開始搭載ToF。
圖2 英飛凌大中華區電源與感測系統事業部總監麥正奇
事實上,如果仔細觀察ToF在智慧型手機中所扮演的角色,不難看出ToF將成為AR/VR應用不可或缺的基礎。ToF最早是用來強化手機照相功能,讓手機能像單眼相機一樣,拍出漂亮的淺景深照片。換言之,手機搭載ToF最原始的目的,是為了獲得照相場景的3D資訊,而不是為了用來實現人臉識別功能。
在臉部辨識成為高階智慧型手機必備功能,結構光感測又被蘋果超過200項專利所組成的嚴密保護網包圍,Android手機廠難以導入後,ToF才開始被用在手機正面,作為Android手機實現臉部辨識功能的底層技術。這對ToF來說,算是有點意外的發展,因為ToF本來是用來偵測環境的技術,不是為人臉辨識而開發。
因此,在人臉辨識普及之後,ToF技術在行動裝置跟消費性電子的下一個主要應用,反而是回歸到它最熟悉的領域--3D場景偵測。因為這些終端產品的開發商,都開始將AR/VR功能,以及其所能帶來的全新使用者體驗,視為未來產品的主要賣點。而AR/VR要做得好,一定要有準確的3D場景資料,否則無法將虛擬的資料或圖形很自然地疊加在真實場景中。
可以預見的是,未來智慧型手機跟平板電腦除了正面會安裝ToF感測器之外,背面也得配備ToF感測器,這樣才能讓行動裝置具有感測周圍場景深度的能力。至於AR專用設備,如智慧眼鏡等頭戴式裝置,也會是ToF一個很重要的應用市場。在這類應用產品中,ToF不只讓設備得以感知其所處的3D環境,正確而自然地將圖像資訊疊加在真實場景中,同時也是手勢控制等人機介面所倚賴的底層技術(圖3)。
圖3 ToF在消費性領域的應用潛力
ToF能走多遠?生態系建置是關鍵
有心栽花花不開,無心插柳柳成蔭。ToF技術的發展過程,正好印證了這句俗諺。其實,ToF技術一開始是為了解決超音波倒車雷達死角,避免駕駛人不小心撞到障礙物或刮傷底盤而開發出來的中短距離感測技術。
麥正奇透露,ToF能成功走向消費性應用,最大的關鍵在於和CMOS製程技術結合,發展成類似CMOS影像感測器的解決方案。因為採用類似CMOS影像感測器的設計架構,ToF感測器變得很省電,體積跟成本也大幅縮小,才得以開拓出消費性電子的應用市場。
而隨著ToF感測元件的成本跟耗電量已壓低到行動裝置也能搭載的水準,未來ToF要回過頭去反攻車用、工業市場,技術上已不成問題,關鍵在於個別企業要不要投入資源,去開發不同垂直產業所需要的相關配套。
手機、平板跟筆記型電腦等行動裝置是很大的應用市場,大廠眾多,因此生態系統可以快速建構起來。但如果是工業等比較碎片化的市場,生態系統的建構就會是繁複的工程。這或許也是從汽車應用需求中誕生的ToF技術,反而在消費市場上發展得更快的原因。












