市場話題
- Advertisement -
AI讓機器視覺更靈活 電極鋁箔生產大幅進化
突破傳統機器視覺限制 罕見瑕疵不漏接
開必拓創辦人暨執行長孫逢佑(圖1左)表示,該公司是一家成立於2017年的AI新創公司,專長是AI演算法開發跟大數據分析。目前開必拓已經商品化的產品名為fastable.ai,這是一個可以客製化的AI解決方案,也是立敦AI品檢系統的核心軟體。
圖1 開必拓執行長孫逢佑(圖左)表示,要將AI導入產業應用,客製化是不可免的。右為立敦科技發言人陳昌源
透過fastable.ai,加上台灣的自動光學檢測(AOI)設備合作夥伴所提供的硬體,以及立敦團隊提供的資料跟產線實務經驗,我們共同開發出可對電極鋁箔實現100%全檢,並可檢測十多種外觀瑕疵的品檢系統。
這是傳統機器視覺或AOI系統很難達成的目標,因為這類自動化檢測方法採用固定的演算法,只能抓出特定幾種瑕疵類型,如果某種瑕疵類型沒有被寫進演算法,或是這種瑕疵無法用演算法精確描述,自動化檢測系統就無法抓出這類瑕疵。
電極鋁箔剛好就是這種產品。立敦科技發言人陳昌源(圖1右)解釋,電極鋁箔採用捲對捲連續製程生產,機器捲動的速度很快,又會有輕微的飄動,加上鋁箔表面帶有些微反光性,因此當鋁箔表面出現凹凸痕,甚至是蚊蠅等昆蟲被捲入後,在鋁箔表面留下痕跡,都會造成蠻複雜的光影變化,讓傳統機器視覺系統非常難以判定。根據該公司的測試結果,傳統機器視覺或AOI系統,大概只適合用來檢測針孔破洞這類有固定特徵的瑕疵,遇到其他瑕疵,就很難派上用場。
自動化全檢帶來多重效益
電極鋁箔是鋁電解電容的關鍵材料,鋁箔的良率高低,會對電容的良率造成直接影響。以出貨量來看,目前鋁電解電容最主要的應用還是在消費性產品,對良率的要求較為寬鬆,傳統的檢測方法還可以滿足客戶需求。但如果要進軍車用市場,客戶對鋁箔的品質要求就會相當嚴格,不僅瑕疵的漏判率要達到0%,誤判率也必須低於0.5%。這是傳統檢測方法很難做到的目標,因此立敦才會決定與開必拓合作,專門為電極鋁箔品檢開發客製化的AI系統。
圖2 開必拓與立敦共同開發的電極鋁箔自動檢測系統外觀
藉由這套客製化系統,立敦不僅跨過進軍車用市場的品質門檻,同時還享受到其他好處。立敦在台灣的產線部署fastable.ai後,也連帶解決了人力瓶頸的問題。鋁箔是連續製程,產線開動後的生產是24小時不間斷的,如果要靠人力做到100%檢測,一定要三班制輪班,但現在已經很難找到這麼多人手。因此,導入AI品檢,不僅讓產品的品質提升,生產規模也得以擴大。
陳昌源透露,在導入fastable.ai之後,因為AI可以辨別十多種外觀瑕疵,而許多瑕疵的產生,往往跟製程中的某些步驟有直接關係,因此立敦已經開始引進製程控制的觀念,不只把AI用在產品的最終品管,當檢測系統偵測到瑕疵時,還可以反過來推論是製程中的哪一個機台有問題,等同於監測產線上各種機台的運作狀況,進而預測設備的維運週期,提高產線稼動率。
智慧風潮帶動車輛人機介面革新 語音/手勢/駕駛監控進駐
手勢控制則是以BMW為領頭羊,在2018年量產X5、X7系列皆已開始導入手勢控制技術,而BENZ預期在2020年Q2所發售新車亦會搭載此技術,其他領導車廠也在陸續發表和研發階段。
駕駛監控系統各家廠商皆有相關技術,目前在各家車廠高階車款或商用車隊較為常見。駕駛偵測技術各家車廠技術發展方向不盡相同,過往多透過偵測駕駛與車輛間互動或操作的間接偵測模式為主,現在則逐漸轉向以照相機或生物感測器,對駕駛動作觀察或生理狀況記錄以對駕駛行為進行判斷。但不論如何,皆以偵測駕駛疲勞以及提供警示為主要目的;自動座艙調整各家廠商仍在研發階段,依序有相關發布和概念車出爐。
各大車廠皆有所搭配Tier1車電系統整合商發展人機介面相關技術,而語音助理、手勢控制、駕駛監測系統軟硬體技術需求不同,各自有不同上游業者共同投入。目前各大車廠在車載人機介面新技術的發展狀況概略整理如圖1。
圖1 新興車輛人機介面應用產業布局
語音助理大舉進軍汽車市場
語音助理在各類的3C產品中已有相當高的普及度,以各類科技大廠主導相關技術發展,包含亞馬遜(Amazon)、蘋果(Apple)和Google等,都是其中的佼佼者。為了延伸應用範疇,各廠都將汽車應用列為重點市場,並以既有的語音平台為基礎,重新調整為車用語音平台。
同時,為因應技術發展需求,許多大廠也與軟體技術廠商合作甚至併購,例如Google買下多倫多大學資工系所創辦的DNNresearch,加強其語音搜尋引擎能力;亞馬遜則為增強語意辨識於2012年併購Evi等。
車用語音助理之關鍵礙於如何清楚地接收駕駛者或乘客之語音指令,關鍵零組件為聲學元件,在車用市場上包括樓氏電子(Knowles)、ACC、GoerTek等皆有發展車內專用聲學元件,為目前市場主要領導者。
各家車廠多將手勢控制以及駕駛監測系統等技術整合至自家車內輔助系統,例如Toyota 的TSS2.0、VW 的Safety Features Lane Active等,皆有搭配駕駛監測系統的開發;而BMW的HoloActive Touch、BENZ的MBUX皆同時包含手勢控制以及駕駛監測系統技術。因應感測與辨識技術所需要的感測元件以及搭配的軟硬體、晶片技術而有不同廠商,例如BMW與Melexis合作開發車用ToF晶片並與SoftKinetic合作開發軟體技術。
語音助理在車用環境中從聲音輸入以麥克風硬體設備收音,採用MEMS陣列式麥克風為主要趨勢,其收聲元件中振膜採用硅、矽等材質,相較早期電容式麥克風採用的聚合纖維更耐熱、抗震,收音品質較不受溫度及電壓變化等影響,且金屬外殼具有良好射線屏障,避免收取不必要雜訊。
軟體處理中主要為自然語言處理,其中包含到語音識別、語意理解,後續在回饋語音則有語言生成、語音合成亦或是Text To Speech(TTS)等程序。
動作執行層面則分為屬於車輛控制的座艙調整、空調、啟動引擎和車門,以及娛樂、導航、通訊等項目。除車輛控制外,剩餘項目皆可在無需嵌入車電系統環境下進行,例如透過個人行動裝置、後裝設備等,對於語音平台或相關技術業者而言更多以此類服務滲入市場。
三類業者主導車用語音市場
車用語音助理相關業者可分為三類,包含車廠、語音平台以及語音技術/設備商,三方業者各有不同目標,彼此呈現相互競爭又合作的態勢。整體而言,可歸類為三種合作模式。
第一種模式為車廠直接採用語音平台服務,車廠以增加銷售賣點為動機,將各大語音平台引入車內,藉以增加服務體驗;各語音平台為提升其服務可及性以及取得更多使用者數據,多投入開發車用語音平台,例如Google的Android Auto、Amazon的Echo Auto以及Apple的Carplay,同時開放開發者環境,強化與車上電子系統的整合。雖欲增加車內服務項目和體驗,車廠對此合作方式亦有所顧慮,擔心消費者體驗導向平台大廠,因此各大車廠也積極在相關平台上發展自有的服務平台,以維持消費者的認同感與滿意度。
第二種模式為車廠自行開發語音服務,部分車廠希望掌握車上相關聯網服務廣大商機,同時由於語音平台亦將連結車輛控制系統,因此部分車廠投入自有語音系統相關技術研發,此方式需投入大量成本和人力。以Benz為例,與各大語音平台皆有合作,但在2018年仍自行開發MBUX系統,可結合車機上座艙控制以及影音娛樂、導航等功能,亦可銜接各語音平台影音娛樂功能。
第三種合作模式為語音技術商結合平台導入車廠的車輛產品,語音技術軟體/設備廠商,例如Nuance、SoundHound皆有開發語音技術以及相關應用軟體,ROAV和Chris則發展相關設備可介接至車內。此類業者可藉自行開發軟體或硬體,將語音系統服務導入車載機系統,同時以API方式銜接各大語音平台相關服務。以此方式銷售自家語音產品,同時亦可取得使用者數據提升技術。
因車內收音並非直接對麥克風說話,屬於遠場收音形式,其效果不如對手機、話筒設備等近場收音,個人主聲特徵更不明顯,因此噪音處理技術對於車內語音應用情境至為關鍵。背景噪音和發聲回音更容易影響收音品質,且在車內有多人談話情形須作考量和反應速度的要求,技術上需克服如何在多人談話中辨識駕駛聲音以及運算效能的提升。
手勢控制以ToF/結構光為主流
車用手勢控制在2013年時已經有以揮動方式控制天窗或開啟後車廂等產品出現,至2015年後已發展出在中央控制台前以細微的手勢動作控制如點選、左右滑動、音量放大等控制。
目前車用環境手勢辨識技術上主要分為三類,分別為ToF飛行時間法、立體攝影和結構光等技術。ToF是以一發射器發出射線,透過接收器接收反射回來的射線時間差,計算和物體之間距離;立體攝影則是透過兩個以上相機模組,從不同角度對同一物體拍攝,以三角定位方式判斷物體遠近、相對運動等;結構光與ToF相似,皆透過主動光源將光紋打在物體上,此方式透過對空間編碼後將原光紋與物體移動光紋之間的差異達到辨識效果。
ToF和結構光都以主動光源的變化達到辨識效果,於其他領域皆已廣泛應用。立體攝影在無光或弱光環境下卻難以辨識物體,且物體判斷運算複雜、容易造成延遲。因此現今在車用環境上皆以ToF和結構光為主。
歐洲新車安全評鑑會EuroNCAP在2025 RoadMap提到在2020年將駕駛監控系統列為安全評鑑項目之一,若沒有相關系統無法達到5星評價,為相當重要的指標,此舉將帶動駕駛監控系統加速普及至各級車款。駕駛監控系統主要可分為兩類,分別為直接偵測和間接偵測。
間接偵測透過檢測駕駛與車輛間互動或操作,如透過駕駛習慣偵測及車內配備之感測器,進而判斷駕駛行為是否正常。駕駛習慣主要偵測駕駛在操控方向盤、油門或煞車等機械操作,判斷路徑、轉向角度是否偏移或太大;車內配備感測,則是判斷駕駛的物理位置,例如手是否有握在方向盤、安全帶鬆緊程度等方式。
直接偵測以照相機或生物感測器對動作觀察或生理狀況作駕駛行為判斷。透過注意力偵測或生理狀況偵測方式。注意力偵測主要是以照相機對駕駛拍攝,判斷其動作、情緒等方式;生理狀況則是透過感測器判斷駕駛心跳、脈搏、體溫等方式。
以SAE評定自駕車等級Level 1~5,在Level 2以上駕駛無須操控方向盤、油門和煞車等行駛控制,無法採用間接偵測方式,但在Level 2~3之間仍須讓駕駛保持警覺,在緊急或無法判斷的情況下,須隨時切換為手動駕駛,故必須以直接偵測方式進行。
最早從2007年Volvo發表車道偏移偵測系統,可透過駕駛行駛路徑判斷駕駛是否有危險行為,後續各大車廠在2014~2017年皆發表此類產品,例如 VW的Fatigue Detection System、 Nissan的Driver Attention Alert、Honda的Driver Attention Monitor等。
在2018年開始各車廠、Tier1的車電系統以及製作車用晶片的廠商開始發表直接偵測之車輛監測產品。例如,2018年Valeo發表的Facing Monitor...
專訪是德科技示波器業務推廣經理劉鐙鴻 八合一示波器整合錯誤搜尋/RTSA
全新的Infiniium MXR系列混合訊號示波器整合八項功能,結合即時頻譜分析儀(RTSA)、示波器、數位電表(DVM)、波形產生器、波特圖繪圖器、計數器、協定分析儀和邏輯分析儀於一機,並具備ASIC硬體驅動處理能力。是德科技示波器業務推廣經理劉鐙鴻表示,如搭配使用該公司的軟體解決方案,可進一步提供電源完整性、高速數位測試和驗證功能。內建的軟體提供錯誤搜尋(Fault Hunter)功能,可加速找出錯誤根源,並解決罕見或隨機發生的錯誤。
是德科技示波器業務推廣經理劉鐙鴻表示,Infiniium MXR最大的亮點就是Fault Hunter與RTSA這兩個功能。
劉鐙鴻強調,Infiniium MXR最大的亮點就是Fault Hunter與RTSA這兩個功能,即時頻譜分析功能在眼圖的堆疊上,速度是過去產品的50倍快;此款示波器定位在中階產品,同時該公司也發展高階與入門的完整產品線,提供完整的工具/套件,協助廠商方便量測、迅速找到問題。
一般而言,數位訊號的除錯,劉鐙鴻提到,有90%的問題來自電源,Keysight Infiniium MXR系列示波器提供數位與類比通道,可以在同一個設備上完成訊號與電源完整性測試,而高頻訊號雜訊不明顯,因此需要性能或解析度更好的測試設備協助。MXR優點包括:八合一儀器,可減少所占用的工作台空間、縮短配置和測試時間,並將串擾問題降到最低。內建即時頻譜分析儀,可百分之百地檢測頻域中的錯誤,甚至是非同步錯誤。內建錯誤搜尋功能,可辨識正常訊號,並觀測其隨時間的變化,以便找出異常訊號,並擷取伴隨異常訊號發生的事件。使用者可快速解決問題,以便排除不規則、隨機或雜波訊號。
橫向整合/技術改善齊發 Micro LED構建產業鏈拚量產
微發光二極體(Micro LED)具備多項技術優勢,如高亮度、省電及可做出光機微型化模組,且其自發光特性架構簡單,在大型化的顯示上更優於OLED與LCD,待Micro LED技術成熟後,將有機會成為顯示技術的新主流。因此近年來吸引大批廠商投入發展,在逐步邁入量產的階段,各家廠商除了透過結盟打群架,也持續強化Mini LED厚植技術與市場實力,產業動態好不熱鬧。
而台灣在LCD與LED產業同具雄厚實力,被看好最有條件成功發展Micro LED產業鏈,國內近年也掀起Micro LED發展熱潮;本文將從產業發展現況與巨量轉移技術發展動態,以及生產設備進展等面向,觀察國內廠商投入與發展樣貌,一窺Micro LED產業的「超前部署」。
產業結盟打群架 Mini LED試水溫讓子彈飛
近來許多廠商如三星(Samsung)、LG等皆在展會中發表Micro LED螢幕,也紛紛發布量產計畫,集邦科技研究副總儲于超(圖1)對此表示,現階段市場的大型顯示螢幕價格仍居高不下,因此尚未獲主流消費市場回響,2020年許多廠商傾向於以技術難度較低的Mini LED作為商業化重點,如高階電競螢幕。
圖1 集邦科技研究副總儲于超表示,Mini LED產品的打頭陣,將會是各方決定是否投入Micro LED量產的關鍵指標
另外,許多廠商透過結盟強化技術開發進度,儲于超認為像三星及蘋果(Apple)等品牌大廠,較傾向於獨立發展關鍵技術,建立自身的供應鏈,決定產品規格後再串連上下游供應鏈。至於近期許多廠商結盟的動態,他認為總體而言是好事,但結盟較常見於主力於代工的台廠及中國廠商,因其無法獨立掌握整條供應鏈,如三安與京東方、晶電與利亞德便為實例。
環視各國產業區位,從本質上來看,Mini LED及Micro LED皆屬於競爭替代的技術,因此韓國雖長期傾力發展OLED面板技術,相對壓縮台面板廠生存空間,但也因此在Micro LED技術發展態度上呈現搖擺,難以全力主攻Micro LED技術的研發;日本以索尼(Sony)為主要大廠,但其傾向廠內自行研發,外界較難一窺發展動態;而中國除了以政策扶植搭配大量資金挹注的策略,地方政府及相關廠商雖進一步投入技術研發,並持續進行人力挖角,同時近年內技術專利數量快速上升,但技術層面現階段與台廠仍有落差。至於台廠實力則是結合LED、面板及半導體廠,可組成堅實完整的供應鏈,加上Micro LED技術實力相對領先,很有機會搶占有利位置。
至於外界傳2022及2023年將可能實現Micro LED產品的量產,光電工業協進會(PIDA)分析師林政賢(圖2)則認為,Micro LED技術的決勝關鍵在於消費市場的導入,台廠需盡快掌握市場先機,將技術導向量產。進一步回顧近期消費性市場,由於近幾個月以來武漢肺炎疫情重創全球,除了波及供應鏈零組件供貨進度外,面板消費需求隨著疫情攀升,2020年第一季已重挫15%。因此,消費需求的轉變勢必打擊現階段各國主流面板大廠的士氣。
圖2 光電工業協進會分析師林政賢表示,由於面板需求因疫情消退,台廠應把握機會搶占先機
進一步審視台廠的產業定位,林政賢說,台灣具有紮實的LED技術及跨產業供應鏈,因此看好台廠研發前景。但他指出欲穩健發展的Micro LED技術,必要條件為品牌大廠的拋磚引玉,因其具一定程度的資金與資源,能夠承受技術前期的盈虧浮動,因此台廠的劣勢同時亦體現於代工起家的先天條件,沒有諸如索尼、三星這類大廠可以作為領頭羊。因此,為克服先天劣勢,跨領域產業的整合勢在必行,如工研院於2016年便協同多領域跨國廠商,共組巨量微組裝產業推動聯盟(CIMS),從設備、晶粒、IC、半導體製程著手,期望串聯系統與品牌廠,盼能建置完整產業鏈,為台廠帶來新契機。
轉移流派各有優勢 產品特性/價格為導向
除了需橫向、平台式整合產業鏈外,Micro LED技術障礙尚包含背板材質、PCB基板的高度/平整度、接合(Bonding)、驅動IC設計等問題,其中又以巨量轉移技術為最關鍵的環節。工研院電光系統所副組長方彥翔(圖3)說明,Micro LED的應用可依產品特性及價格需求導向作為分野,因此製程中各巨量轉移技術各具優勢。
圖3 工研院電光系統所副組長方彥翔表示,Micro LED技術所需的良率取決於產品特性及價格需求
但由於各技術流派所能達到的良率及產品所需條件不同,意即高/低解析度產品各有不同良率,如車載螢幕必須能面對潮濕環境條件以及氣候因素,將對其可靠度產生影響。以低解析度產品為例,其良率標準為99.9%,高解析度則須達99.99%,若搭配修補技術,良率將可達到100%。以下則針對巨量轉移相關技術流派延伸探討。
雷射轉移
此技術由於過程中能量較強,因此溫度亦會較高;在升溫的同時其能量亦可能造成原先排列已相當密集的LED晶粒損傷,產品應用解析度為中等。
電磁吸取
採用磁力,利用電磁效應以電力產生磁場,但若要產生磁場的電流需要以高電流通電,對於模組能否承受則是一個關鍵的問題,適合應用於高解析度產品。
流體裝配
以流體作為轉移媒介,但是由於藉由浮力控制,操作存在高難度,因此亦較適合用於低解析度產品。
靜電轉移
為蘋果使用的專利技術,使用靜電力,為巨量轉移技術中能吸取LED晶粒中大小最小的方式,良率也最高,因此適用於高解析度的產品。但若欲產生靜電力的前提,必須要以電壓差產生靜電,因此在晶粒間距非常小的前提下容易被電壓噴飛,因此需克服高電壓的問題。
滾軸轉移
採取類似滾輪的方式滾平,由於需多次反覆執行,除非精密機械加工技術良好,否則其中存在的壓力將較易使晶粒之間的間距不一,而LED需要精密排列,存在較難對準的問題,因此該轉移方式較適合用於低解析度、容忍度較高的產品。以優顯科技為例,執行長陳顯德(圖4)表示,該公司採用的技術是以選擇性雷射剝離技術搭配滾軸轉移技術,適用於大多數的製程,並可彈性決定轉移數量(如1顆或是1,000顆皆可),較不同於現行供應端大廠紛紛致力於開發特殊技術,拉開彼此競爭差距的狀況。
圖4 優顯科技執行長陳顯德表示,台灣需要整合LED廠及TFT廠的「橋樑」
微轉印
其以藍寶石為基板,在目前的巨量轉移技術中,較普遍使用凡德瓦力或是具有黏性且有凹凸結構的聚二甲基硅氧烷(Polydimethylsiloxane,...
二代摺疊面板再突圍 軟性手機蓋板拼柔軟又耐刮
市場對於手機產品要求之嚴苛,恐怕超出了實驗室所有的應用模擬。從2018年底柔宇(Royole)推出外折的手機「柔派」起,到三星(Samsung)推出Galaxy Fold,折疊手機面板的可靠度一直都受到市場質疑(圖1),導致各大手機廠要不重新設計,要不縮小上市規模,藉以爭取更多的研發時間來改善已經浮現的問題。一年過去了,手機廠在2020年初發表捲土重來的折疊手機,期待以新的概念與新的解決方案,重新為手機市場打開一條血路。
圖1 第一代折疊手機面板可靠度受到市場質疑
軟性OLED顯示技術在2013年三星推出Galaxy Round,以聚醯亞胺(Polyimide, PI)取代玻璃基板以後逐漸成熟,後續推出的Galaxy Edge系列都採用軟性OLED面板。不過,光有軟性顯示面板還不足以建構一個折疊手機顯示螢幕;折疊顯示模組除了面板外,尚包括觸控、圓偏光片(Circular Polarizer)、蓋板(Cover Window)等元件,這些元件都必須要滿足可折疊的功能需求。其中,最大的挑戰還是來自蓋板,蓋板承載著防刮、耐磨、防眩光、抗反射、抗汙等功能。
過去使用玻璃蓋板,這些功能都可以輕易達成,只是玻璃無法達到小曲率半徑折疊要求,因此只能從軟性高分子材料中尋找能達到20萬次以上小半徑撓曲的材料,其中無色聚醯亞胺材料(Colorless Polyimide, CPI)玻璃轉化溫度高,具有動態撓曲(Dynamic Bending)、靜態撓曲(Static Bending)的安定性,符合蓋板材料折疊需求。
然而,CPI材質表面不耐刮,需要再經過表面可撓硬膜塗層來達到防刮的目的。筆者去年即提到,從材料應用的角度來看,符合軟性可折疊、高透光、耐磨刮特性的高分子材料應用,折疊手機面板應用恐怕是第一個,其可靠性有待實際應用的考驗。果不其然,2019年的許多失效案例與模組的蓋板有關,因此,手機廠持續針對蓋板可靠度問題,提出解決方案,期待新產品能有所改善。
2020年,市面上銷售的折疊手機廠商中柔宇沒有推出新機,新加入的摩托羅拉(Motorola)推出貝殼機Razr,巧的是,三星也推出背蓋式的Galaxy Z Flip,有志一同主打輕巧訴求;華為則推出Mate Xs,算是Mate X的小改版,其面板規格整理如表1。
第二代折疊手機在行銷上都特別強調折疊蓋板的先進性,以扭轉市場對手機可靠度不佳的印象。三星宣稱採用先進的超薄玻璃(Ultra Thin Glass, UTG)材質,而華為則強調用了雙層比黃金還貴的CPI,撇開廣告詞句,其實兩者都試圖強調產品在折疊蓋板上有極大的改善,至於改善得如何,則仍然有待市場考驗。
蓋板兼顧柔軟/可折疊/耐刮 技術挑戰大
手機蓋板是手機與外部接觸的部位,承擔影像呈現、觸控訊號輸入與保護面板模組的功能,這些功能所代表的技術需求,包含高光穿透率、低霧度、抗反光、抗眩光、抗汙等光學特性,以及防刮、耐磨、抗衝擊等機械特性;對折疊手機的蓋板來說,必須再加上動態折疊與靜態折疊的可撓特性,也就是說軟性蓋板材料既要硬得可以耐磨刮,又要軟得可以耐折曲,這些互相扞格的特性需求在材料學上是極大的挑戰(圖2)。
圖2 折疊蓋板是手機與外部接觸的部位承擔諸多互相扞格之特性需求
因此玻璃機械強度雖強,但是可撓性(Flexibility)不佳(圖3)。降低玻璃的厚度有助於增加玻璃的可撓性,以康寧(Corning)Willow玻璃為例,厚度50μm就比500μm更能承受彎曲半徑較小的折疊(圖4)。
圖3 施以微小的應變在玻璃上即產生極大的應力
圖4 薄玻璃可以承受較小的彎曲半徑
同樣的道理,在相同的彎曲半徑下,當玻璃變薄時,薄玻璃彎曲破裂的機率比厚玻璃低很多(圖5)。然而,令人沮喪的是,即使玻璃厚度小於100μm,在彎曲到10毫米時,該玻璃材料破裂的機率仍高於50%,這對於折疊手機來說,面臨設計上的挑戰,因為當折疊手機以輕薄為設計訴求時,其折疊半徑要求到5毫米以下,內折時更要求到3毫米以下的工程規格,故折疊蓋板對玻璃材質來說是一個非常大的挑戰。
圖5 不同彎曲半徑,玻璃材料破裂之機率
當全世界玻璃大廠都在努力解決可折疊玻璃之際,面板廠將目光移到了可撓性較佳的高分子材料,長鏈狀高分子結構的彈性變形能力可滿足可撓性的需求。具有高光穿透度、低霧度等良好光學特性的高分子材料很多,如聚對苯二甲酸乙二酯(Polyethylene Terephthalate, PET)、環烯烴聚合物(Cyclo Olefin Polymer, COP)等,只是這些材料的玻璃轉化溫度(Glass...
突破尺寸/功耗/效能天險 智慧推論晶片迎接新典範
未來消費性裝置創新,須仰賴創建更智慧的新型聯網裝置。此一未來,會由更多具有近端機器學習推論能力的知覺型感測器(Perceptive Sensor)所推動。運用這些感測器並同時擴大推論網路,將能推動智慧型裝置在幾乎所有方面的功能與使用者體驗的提升。隱私權亦可透過終端裝置本地推論的運行而獲得改善,因為只有最少量的使用者資料及感測器資訊會上傳至雲端。
機器學習被鎖在雲端
機器學習與智慧型裝置的交會解放了消費性電子產品新一波的創新。然而最佳的機器學習網路處理需求以及低功率處理器效能之間還有極大的差距。目前的解決方案是運用裝置收集並廣播感測器的資料至雲端,而高功率、專用的機器學習處理器則在雲端負責推論,並在完成後將結果透過網際網路回傳至使用者裝置。這個方法雖能提供機器學習的功能,但亦有極明顯的弱點。裝置有限的能量必須消耗一部分以保持持續的網路連線;雲端運算的延遲亦會限制了裝置對推論的應用,並且會破壞使用者體驗。而傳送原始資料的需求則讓裝置難以維護資料安全,並造成隱私權的顧慮。整體而言,這些限制了智慧裝置對機器學習的實際運用。
第一代的低功率機器學習處理器的整體容量與運算能力不足,只能專注在基本網路應用,如語音指令辨識,以及用於攝影機控制及客製化過濾的特徵偵測等。機器學習的核心邏輯絕大部分被減慢的摩爾定律所限制,因此若沒有效能上快速的改善,機器學習就必須維持在雲端。僅有在運算架構出現突破,方能創造出高效能、高正確度的近端推論。
本文意在展望複雜的推論網路可在幾乎任何消費型裝置上執行的未來─現在已極度接近。全新的「智慧型推論裝置」浪潮將會提供近端高效能的機器學習,讓敏感性的使用者資料不必上傳網路及雲端。其能自動化運用機器學習以改善低階裝置的功能以及使用者體驗。其將由快速創新、機器學習的同步處理、處理器設計、裝置設計所驅動,以創造全新的未來使用者體驗。
機器學習推論的突破
近期機器學習所克服的進階挑戰,揭露了新興智慧型推論裝置的絕佳前景。眾多團隊投身機器學習研究與學習/推論的程式碼庫,讓機器學習進入指數型的學習曲線。大部分的進展多與裝置的雲端連線能力或近端處理有關,針對處理較小資料集的研究則是純粹近端處理的最佳候選。裝置近期可以直接運用的創新包含:
・觀察手勢並處置實體世界物體
這項創新在兩個相關領域中已取得進展,可追蹤人類與機器人手臂,及教導機器人執行觸覺操縱。2019年,OpenAI透過在3D模擬中訓練的機器人展現出手指的靈活性,將其知識轉移至現實,並適應現實世界的物理現象。這創造出可以執行複雜任務的彈性,像是解開真實世界的魔術方塊,卻不需要真實世界的訓練。此外,2019年Oculus Quest亦發表了視覺感測器的手部追蹤技術,需要同時使用4具攝影機以進行6個自由度的頭部追蹤。該解決方案在Snapdragon 835處理器及3MB的神經網路架構,以500mW的耗能提供骨骼及數個手勢追蹤。此前非機器學習的解決方案必須使用景深攝影機及專用邏輯,並消耗超過15W的功率,卻僅能提供明顯較差的正確性。
・以現在的行動衡量未來結果
在Google的DeepMind中,強化學習經過修改而能了解賽局中決策的長期結果。Temporal Value Transport演算法則是用以將未來所得的結果通知現在,結合未來利益的機率於當前的行動中。這種結合未來結果於目前決策的能力能大幅改善機器學習系統在現實世界的決策制定,除可協助裝置進行更複雜決策的制定,還能大幅改善可執行任務的數量以及可應用狀況的複雜度。
智慧型推論裝置 開創全新體驗
運用推論協調裝置功能是未來裝置設計的強大典範。推論驅動的設計可以創造全新等級的使用者體驗,同時改善低階裝置的功能。具有多重網路推論的裝置將用以進行使用者與環境輸入訊號的複雜翻譯而不需要運用到雲端。使用多重同步網路能讓裝置對於使用者與環境輸入訊號有更高層的理解及反應。這些裝置受到影響的邏輯包含:
・智慧型推論裝置啟動
機器學習極適合翻譯聲音、手勢以及視覺輸入,以啟動裝置、節省電池電力並減少雲端資料傳送。
・雲端運用與資料隱私經衡量
裝置可以運用推論在雲端相關任務上,包含進一步推論,或是非推論的雲端計算。裝置可以在近端進行推論,而不需要提供原始資料至雲端。聲音、影像及感測器資料及其所產生的推論均不需要上傳。裝置可以決定哪些資料需要傳送至雲端,而該邏輯可以透過設計以強化隱私與資料安全性,而不需要因為必須在雲端處理而公開地揭露。
・推論驅動使用者體驗
在裝置靈活性、真實聲音翻譯及重製、導航、視覺、偵測、辨識等裝置功能的提供上,推論已證明具最佳的表現。推論可以直接用以創造全新使用者等級的功能與體驗,這些都是不具推論能力的裝置所無法提供的。可同時使用一組以上神經網路的處理器,具有能在裝置及使用者層級同時運用視覺、聲音及創新感測器輸入以制定複雜決策的能力。
啟動智慧型推論裝置
啟動感測器或連接至雲端都需要運算、耗電以及成本。若裝置能快速推論,一旦感測器的輸入需要後續對應動作時,處理器便能聰明地啟動、建立無線網路連線,而雲端的任務亦能明確地被指派。以此方式,低功率的推論便能透過把有趣的動作偵測、聲音啟動以及使用者意圖等留在裝置近端處理,節省整體裝置的耗電(圖1)。
圖1 推論驅動設計的智慧裝置運作
智慧型啟動的重要性不應該被低估─裝置可以進入可接受的耗電範圍,而在許多應用中雲端服務可以避免雙位數的誤判。
・只有當任務短語和語調提出時,更聰明的啟動文字才會觸發裝置和雲端活動。
・在各種基於攝影鏡頭的應用中,智慧動作感測可預測動作的意向,以避免下游處理。
・智慧感測處理能減少一般功能處理器的負載,並運用機器學習來聰明地啟動裝置。
雲端運用與資料隱私經衡量
行動與社群應用帶來前所未有規模的運算與隱私挑戰。為雲端所設計的應用,可以把推論移轉至裝置,減少延遲並節省雲端資源。此外,如穿戴式裝置或智慧音箱等產品亦能決定近端、多因子排程以執行不同甚至是多重供應商的雲端服務。雲端雖然有極大的運算能力與資料量,不依賴網路連線的近端裝置則免於網路延遲與不可靠性。能正確在近端執行推論的裝置,因為能在近端分析聲音、影片、空間及其他感測器資料,僅需傳送較少的資料至雲端,能大幅改善機會來保護使用者隱私。
・機器學習從雲端轉移至近端裝置可以達成低延遲的使用者反應,能大幅改善聲音、攝影機、手勢等輸入的使用者體驗。
・近端的影片與聲音分析可以在近端執行,僅有在需要進行雲端分析時才將影片或聲音上傳,因而能保護敏感的使用者原始資料流。
・智慧型應用程式介面亦能讓單一智慧裝置對來自多個供應商的應用程式進行任務分派並進行雲端互動。
推論驅動使用者體驗優化
推論是讓裝置開啟尖端且全新使用者等級功能的核心性能。結合機器學習推論的聲音與視覺處理讓裝置能辨別複雜的指令與語境,而後產生絕佳的成果。可在新興智慧型推論裝置上擴展的功能,包含使用者回應功能像是生物辨識存取、環境回應、有意義的輸入以及衍伸的人類意圖。此外,還包含替身模擬、機器人控制、智慧型感測器控制及導航等功能(圖2)。
圖2 機器學習推論可讓裝置開啟全新使用體驗的尖端功能
智慧型推論裝置機器處理器的期待屬性
能協調智慧型裝置功能的處理器,將運用機器學習技術,同時包含與裝置感測器、核心處理以及功率控制的關鍵介面。其將成為裝置的大腦,以啟動裝置的功能並調配關鍵的處理。理論上,其能提供實用的功能讓裝置因為減少耗能、必要時智慧化啟動裝置功能、確保其能依安排的需求而啟動,而成為更好的產品。在此同時,其能高效率正確地處理複雜的網路,體積又能更小─讓其可以置入體積精巧的平價裝置。
未來智慧型裝置的關鍵考量是其在感測器與耗能之間的關係。許多裝置需要延長電池使用時間。現今,複雜的視覺感測器資料分析會以最大Thermal Design Power(TDP)的狀況下消耗所有的運算資源。智慧型感測器僅有在必要時會啟動處理、無線網路、雲端互動及實體功能。智慧型感測器與裝置功率的減少是加速智慧家庭採用的必要項目。智慧化啟動網路運作及雲端互動可以減少裝置耗能、延長運作時間、增加尖端功能所能保留的電力預算。家用配線是長期的限制,需要許多裝置以電池運作,以增加消費者的採用。現今電池運作的智慧型家用裝置通常使用4個以內的AA電池或是3500mAh的充電電池,而目標運作時間則在3個月以上。運用智慧型感測器,僅在必要時才啟動裝置,在近端處理輸入而不需要無線網路的連線,可以顯著增加其功能,並減少對於電力的需求。
最佳化的效能、架構、軟體、功率以及研發平台的匯集,對於推論成為未來智慧型裝置設計的驅動因素是全部必要的條件。最佳化的推論處理器將在這些屬性上同時擁有優異的表現。
效能
・高機器學習網路效能/瓦特:能執行高正確性、現代的影片/影像/聲音處理類型網路。
・一致的加速度:即便在網路程式碼改變,並擴大多重網路類型,仍能提供相對一致的加速度。
架構
・整合式設計:小尺寸及高度整合,以簡化設計。
・標準匯流排:使用標準介面與匯流排設計,易於整合至裝置。
・多重感測器輸入/輸出介面:支援影片、聲音、常見及新興的感測器。
・可擴充性:在相同的程式碼下,設計架構能擴展至多重ASIC或是更大、更高性能的ASIC。
・低延遲:整合記憶體架構及快取,以快速處理所擷取的資料,包含聲音及高解析度/多重攝影機影像等。
軟體
・快速載入:快速並動態載入,同時執行多重機器學習網路。
・不特定機器學習網路:執行任何神經網路型式或是分層類型。
・執行及相關多重機器學習處理:運作多重網路並執行橫跨多重推論的分析。
・一般目的運作:執行程式碼以產生完整形成與裝置運作相關的成果。
電力
・低TDP:支援電池電力以延長穿戴式裝置及離線操作的使用時間。
・低熱度限制:低熱度適合支援穿戴式裝置及全被動式運作。
・快速啟動:由使用者或感測器呼叫可快速、低延遲的啟動加速器,適合底層以低於使用者感知等級的運用。
・選擇性啟動:命令和控制感測器啟動,支援額外處理,協助裝置平均耗能最小化。
平台
・強力的SDK及說明文件:軟體工具集,搭配第三方工具的支援,使其易於運用於目標的加速器中。
・最佳化的預製:針對主要應用的功能區塊,如偵測、分類、除噪等,提供直接替代(Drop-in)的支援。
・部署工具集:來自主要機器學習平台如MXNet、PyTorch、Caffe及TensorFlow的移植工具等強力支援。
兼顧尺寸/功耗/效能 全新推論處理器登場
新創公司Perceive發表全新的Ergo,是款高度整合的推論處理器,能將所有推論處理卸載至低功率應用及小尺寸裝置。Ergo能以相當於55 TOPS/W的性能執行推論,而在全功率運轉時可以達到4 TOPS,而不會犧牲正確性,或限制可支援網路的類型。Ergo ASIC採用7×7mm FBGA封裝並能以約20mW耗能處理許多網路,最大功率約為120mW,且完全採用被動式散熱。在現場展示中,Ergo在全速運轉之下溫度仍低得可以直接碰觸。
Ergo是設計來執行傳統上僅能在資料中心等級推論處理器上方能運作的網路。現今Ergo可以完整執行YOLOv3,在批量尺寸為1時以246fps處理6400萬組參數。Ergo可以執行傳統上需要超過400MB儲存空間且有超過1億組參數的網路。
與之前設定為低耗電應用的推論處理器相比,Ergo計畫並達成所有之前的處理器及專用加速器擁有相當的每瓦特效能的20倍至100倍的功率效能。現今的推論處理器一般低於5 TOPS/W,而Ergo則可以達到55 TOPS/W以上。
要達成這樣的效能,Perceive發展出全新的運算架構,能維持高正確性,但大幅減少記憶體與耗電量的要求。Ergo新穎的網路表示法(Representation)避開推論對於MAC陣列的需求,並因而精巧至足以在晶片內記憶體執行大型網路。Ergo晶片亦採用積極性功率與時脈閘以增加電源效率。因此,Ergo能在7mm×7mm的封裝內提供極高的正確性。結合了源自數學原理的方法至機器學習、不是依據MAC而設計的架構、沒有外部記憶體、傳統的節電技術,是讓Ergo可以在資料中心等級網路上提供高正確性、效能與效率的原因。
廣泛的移植網路和一致的效能提升,代表該公司已成功創造一種能提供相對於今日推論負載明顯效能改善的架構。此外,該公司亦已展示許多多重網路應用,均與其宣稱的網路容量及性能相符。
Perceive Ergo能直接串接高解析度、高影格率影片感測器,讓多重感測器與即時元資料(Metadata)有機會作為推論處理的額外輸入。此能提供先進的問題解決與多重網路推論,讓其能運用於核心裝置控制與先進的終端使用者功能。有了高效能與網路容量,亦可能推出全新的功能。在此機會之下,軟體設計與訓練出現新的挑戰,對裝置生產廠商成為全新的技術挑戰。Perceive已試著透過工具套件(其中含有針對一般機器學習應用的已可用於部署Ready-to-deploy網路),讓研發更為容易。
Perceive Ergo機器學習網路範例
Perceive Ergo可同時執行多個網路,讓智慧型裝置能採用推論驅動設計。其已使用現今多層次網路如CNN(包含殘差邊緣)、LSTM、RNN及其他網路進行測試。示範的網路包含:
以M2Det進行多重物件偵測
多重層次多重尺度偵測器(M2Det)是新發表的類神經網路(2019年1月),用以進行物件偵測及在地化,設計以偵測尺度差異極大的物件。M2Det是款端到端、單一拍攝物件偵測器,其在現實世界應用極為實用,因為物件可以是在漸進場景中且尺寸及比例差異極大。
以YOLOv3進行多重物件偵測
YOLO是由Joseph Redmon及Ali Farhadi所創造的CNN式類神經網路,可以在影像及影片中辨識並定位高達80個物件類型。現今YOLOv3是資料中心最受歡迎的多重物件偵測器之一。
以專用網路進行聲音事件偵測
最佳化的類神經網路可以以小尺寸的類神經網路辨別多重聲音事件類別,讓其極適合運用搭配較大的視覺處理類神經網路使用。
以ResNet進行臉部辨識
深度殘差學習因較易訓練與絕佳的正確性而受到關注,其為微軟研究院(Microsoft Research)在2015年所發表。多重層次配置的ResNet已運用於大型樣本地區臉部與影像辨識。
Perceive Ergo同步推論類神經網路範例
Perceive Ergo已示範結合這些類神經網路運作,並且以其自身的記憶體/網路權重能力在技術上是足以同時執行多重類神經網路。此處理器能執行全新類神經網路的組合,處理使用內建輸入/輸出埠自多重偵測器所取得的資料。
Perceive...
數位化、數位優化、數位轉型
文 | 萬岳憲
資策會MIC產業躍升事業群總監
數位轉型(Digital Transformation)的英文縮寫,習慣被寫為DX,萌芽於2011年的企業數位化(Digitization)倡議。因為當時出現許多新技術應用,破壞原有商業模式的案例,甚至發生實體企業被數位企業打敗,或實體企業轉型為數位企業後的突出表現而受到矚目。例如美國的跨國零售企業沃爾瑪(Walmart)公司,被跨國電子商務企業亞馬遜(Amazon)公司侵蝕市場,不得不加速積極擁抱數位轉型科技;美國奇異(GE)公司將原有的工業設備附加軟體與網路科技,積極發展物聯網服務平台,從硬體銷售轉型為服務獲利。2016年世界經濟論壇(WEF)發表《產業的數位轉型》(Digital Transformation of Industries)報告,強調數位轉型對全球產業競爭力、產業經濟發展的重要影響,因此引起世界各國政府開始重視「數位轉型」。
同時,全球研究機構也紛紛提出對「數位轉型」一詞的解釋定義。如經濟合作發展組織(OECD)認為,企業必須先將類比資訊轉換為數位型態,才可以跟雲端運算、機器人或人工智慧等新興數位科技,搭配組合應用,產生新的應用模式或商業價值;世界經濟論壇(WEF)則認為,透過新興數位科技的疊加運用,企業價值將會呈現指數型成長,不僅僅能改變目前的經營模式,甚至會協助企業產生全新的商業模式、應用、機遇或競爭態勢。
多元的定義與專業術語,導致國內許多中小企業主的無所適從,雖然知道公司應該要善用數位科技來突破目前的困境,但不知道應該要從那個方向或角度切入。今年五月,商周出版社彙整資策會MIC數位轉型研究團隊的研究成果,出版發行《數位轉型力》一書,就是期望能協助企業釐清專業術語名詞,瞭解數位科技應用的本質與內涵,提升與數位轉型相關的知識和素養。
從產業實務觀察企業運用數位科技,可區分為「數位化、數位優化、數位轉型」三個階段,企業可以從這三個階段切入檢視目前的經營狀態,沒有完善的數位化,當然就談不上數位優化;沒有提升數位化的水準,運用數位科技改善組織的營運效能、強化顧客體驗、掌握顧客喜好、提高顧客滿意度和忠誠度,就是沒有建立完善的數位優化基礎。數位優化能力不足的企業,就很難跨入數位轉型的階段,因為必須藉由高水準的數位優化能力,運用數位科技創造全新的商業模式。
企業運用數位科技的三個階段
資策會MIC將「數位轉型」定義為「以數位科技大幅改變企業價值的創造與傳遞方式」。也就是說,企業藉由完善的數位優化能力,在致力於數位轉型的過程中,成果會展現在顧客體驗、營運流程、創新商業模式、創新產品及累積數位資產等面向。而為了衡量數位轉型的成果,資策會MIC建構了數位轉型指標(DTI),從營運卓越(Operation Excellence, OE)、顧客體驗(Customer Experience, CX)、商模再造(Business Model, BM)等構面來衡量,同時再以這三個構面為核心,分別開展10個評估方向和16個測量指標。
營運卓越(OE)和顧客體驗(CX)是兩大礎石,企業必須在這兩個構面,都擁有高水準的數位優化成果,並且累積數位資產,才有可能形成商模再造(BM)構面,產生創新的產品或服務,為企業創造新的利潤空間,為顧客傳遞新的價值。而驅動營運卓越(OE)、顧客體驗(CX)的核心力量,就是企業在進行數位轉型時的數位能力(Digital Skill, DS)。
企業數位轉型指標
數位能力(DS)包含「運用數位工具」和「累積數位資產」兩個指標。前項指標著重於觀察企業,是否能夠應用適當的資訊工具,促進或提升企業的經營活動成效,後項指標則是著重於觀察企業在運營過程中,數據蒐集、分析與應用的能力。而衡量企業的數位能力程度則區分為「初始化(L0)、數位化(L1)、整合化(L2)、自動化(L3)與智慧化(L4)」五個階段。
英國管理思想大師韓第(Charles Handy)提倡「第二曲線」的概念,提醒企業必須在即將到達頂峰之前,就開展第二條上揚的曲線,但是初始的第二曲線必定會有一段滑落期,這段期間的獲利遠低於第一曲線,因為是資源投入的初始階段,這是企業必須熬過去的投資期,然後第二曲線初始上揚的階段點,會與第一曲線的初始滑落點,產生黃金交叉,上揚的第二曲線,將帶動企業開創新的商業模式。
開展第二曲線的最困難之處,在於該如何知道第一曲線就快要到達頂峰?尤其是成功的第一曲線,往往會蒙蔽我們的視野,導致忽視新科技帶來的新市場機會。所以韓第認為,企業應該在景氣佳,營運還沒有走下坡的時候,就開始規劃第二曲線。
這樣的概念與數位轉型相仿,企業應該在成長階段就開始規劃實施小規模的數位轉型實驗,從每一個小實驗,累積足夠的學習經驗,從應用新科技的過程中,對數位轉型產生正確的認知,選擇適合自己公司的數位工具,從最可行之處切入並逐步導入。
日本經濟產業省曾經針對製造業進行數位科技運用調查指出,企業想要成功的運用數位科技,必須建立具體的目標與共識,並且與內外部的夥伴密切合作,但最重要的因素,卻是經營者必須有強烈的主導推動意願,才有可能提升數位優化水準,朝向數位轉型的方向前進。
關鍵應用含金量高 手機/汽車AI吸引大廠競折腰
AI新興應用持續推進
自2018年起,在演算法層面,AI已經相對成熟,賽靈思(Xilinx)人工智慧業務高級總監姚頌(圖1)提到,目前應用層面還在不斷進展的是神經結構搜索(Neural Architecture Search, NAS)相關的領域,希望透過電腦自動找到最佳演算法結構、減輕演算法工程師的負擔。MIT的韓松教授推出One-For-All神經網路,可以訓練一個複雜的網路,針對不同場景的需求(高精準度、低延遲等),自動選擇部分子網路來滿足要求。2020年,對於邊緣運算解決方案需求最大的還是手機與汽車,二者共同的特點都是無論網路與通訊狀況如何,都需要AI做出迅速的反應。
圖1 賽靈思人工智慧業務資深總監姚頌
姚頌進一步指出,手機、平板電腦已經從通訊工具,升級為娛樂工具,再升級為邊緣的核心設備。除iPhone全系列產品已經搭配了用於FaceID的結構光相機,需要即時、私密的AI識別之外,最新推出的iPad Pro,還新增了dToF的微型雷射雷達,可以進行高精度測距、實現良好的AR效果,而AR也是AI的一個重要應用場景。另外,2020年在自動/輔助駕駛、智慧車艙已全面採用AI,特別是隨著電動車的推廣,汽車被視為下一個智慧終端裝置。
過去影像辨識與語音辨識通常是各自發展的應用,主要原因是影像採用卷積神經網路(Convolutional Neural Network, CNN),語音使用遞歸神經網路(Recurrent Neural Networks, RNN),然而近期Google公開演示了使用CNN網路進行語音辨識,也開啟了影像與語音辨識複用的可能,NVIDIA技術行銷經理蘇家興(圖2)認為,目前已有應用同時導入兩種辨識技術,讓人機溝通更自然,雖然目前還不是使用同一套網路,但或許不久的將來就會相互整合。
圖2 NVIDIA技術行銷經理蘇家興
手機/汽車AI競爭如神仙打架
手機與汽車是兼具雲端與終端的裝置,一方面需要強大的運算效能,一方面對耗電非常在意,這類產品也被看好具有高度潛力,於是大廠的邊緣應用都投注心力在這兩類產品。姚頌表示,AI晶片除了性能需求足夠出色,更重要的是需要有簡單易用的開發環境、豐富的生態以及滿足使用場景的產品功能。賽靈思2019年推出了全新的軟體發展環境Vitis與Vitis AI,就是旨在協助不同開發者輕鬆地開發AI應用。而針對AI產業的Vitis AI以及Vitis AI Library,可以允許演算法工程師直接在提供的大量案例上二次開發,也可以透過簡單的命令與腳本編寫完成AI演算法的編譯與執行。
在晶片層面,賽靈思推出了新的車規級運算平台XAZU7與XAZU11,可以廣泛用於L2到L3的輔助駕駛與自動駕駛場景,也可以用於智慧車艙的各類應用。到目前為止,Vitis AI已經發布了最新的1.1版本。而賽靈思的自動/輔助駕駛方案也得到戴姆勒、百度等汽車產業認可。
另外,NVIDIA在GTC也公布新一代自駕車平台Orin,將整合具新一代TensorCore之Ampere架構GPU,針對L2的標準可在45W耗電水準下,提供200TOPS性能的版本;針對先進輔助駕駛的Orin ADAS SoC,可在5W功耗提供10TOPS的性能,能夠滿足當前先進輔助駕駛的需求。標準的Orin採用12核Arm Herculus CPU搭配Ampere GPU,記憶體頻寬達200GB/s,與支援四路10Gbps乙太網路,具備170億個電晶體。在L5自動駕駛平台部分,NVIDIA藉由雙Orin搭配兩組Ampere架構GPU組成,功耗800W,但算力可達2,000TOPS。
而在CES 2020,高通發表Snapdragon Ride平台,正式進軍自駕車領域。該平台共有三種不同的配置,其中,單處理器版已經足夠應付ADAS系統;雙ADAS處理器版本,算力則更進一步強化,同時也為系統準備了安全備援,可以支援L2和L3半自動駕駛。第三種配置則在上面的基礎上多了加速晶片,三晶片版本的配置包括兩塊ADAS處理器外加自動駕駛加速器,算力可達400TOPS。
關鍵應用投入大量資源/時間
除了汽車與手機之外,蘇家興表示,智慧醫療、5G等應用也需要高運算力,而由於AI模型發展越來越複雜,在業界希望賦予AI更多能力的前提下,導致資料庫越加龐大,所以在訓練過程中希望可以優化網路,以提升整體系統的效率。
AI晶片在重要裝置如手機、汽車等平台的發展目前由大廠主導,除了含金量高之外,這類平台的應用需要整合許多相關資源,與雲端的網路訓練關係也很密切,如自駕車就需要非常龐大的網路資料庫輔助,目前相關廠商已累積不下數百萬英哩的測試里程,但實際上離自駕車可以安全上路還有很長一段距離;另外,智慧醫療除了資料數量之外,更要求資料品質,而且醫療行為攸關人命,發展過程會更加謹慎。相信未來幾年,人工智慧還會發生更多有趣的事,開創更多可能性,值得市場持續關注。
資料科學/電子工程攜手 AI智慧醫療影像判讀加速診斷
新冠疫情爆發促使智慧醫療成為熱門議題,人們期望新科技有助於強化醫療效率及資源分配。醫療科技現正進入整合大數據與人工智慧的階段,許多醫師或醫療單位意識到醫療智慧化的需求,認為人工智慧(AI)的影像辨識技術可以協助醫療人員做決策,並提升診療的精確性及效率,因而紛紛投入AI相關的研究,或者與研發團隊合作,期望達成診斷的品質/效率/醫療資源分配最佳化的目標。而AI進入醫療體系的同時,智慧醫療的研發則面臨資料搜集、臨床的落地應用與法規限制等重大挑戰。
醫師主動學習AI 望診斷品質提升
處於醫療現場,許多醫師與醫療團隊感受到科技需求,主動進修並學習AI,走向智慧醫療。成大醫學資訊所特聘教授蔣榮先原是主攻人工智慧的資料科學家,因曾在成大醫學院兼課,開啟醫療領域的大門,以資工及AI的角度分析醫療資料。現在蔣榮先的醫學資訊研究室裡有16位醫生前來進修博士,希望透過AI提升醫療診斷品質。
圖1 成大醫學資訊所特聘教授蔣榮先說明,AI可以幫助診斷品質不受人為因素影響,而能隨時保持穩定與精準
目前全國只有五間大學設立醫學資訊研究所,蔣榮先分享,但是台灣很需要資訊及醫療的跨領域人才,藉由AI技術量化醫生經驗,才能形成一套醫療決策系統,幫助診斷品質不受人為因素影響,而能隨時保持穩定與精準,全面提升醫療品質。在醫療影像方面,導入AI可大幅提升影像的判讀速度,協助醫師救治更多病患以外,還能在特定情況下確保傷患在短暫的黃金時間內得到應有的治療。
針對醫師診斷的應用,蔣榮先描述急診室的模擬情境。如果一個可能腦出血的車禍傷患被送進急診室,需要先拍攝X光及斷層掃瞄,由放射科醫師透過影像診斷病患是否出現主動脈剝離的病徵,若是確定主動脈剝離,則需要通知急診醫師,並在幾分鐘的黃金時間內注射藥物使動脈收縮,以免發生中風。腦出血的黃金治療時間非常短暫,但是急診與放射科醫生需要同時診斷多位病患,若是未能即時發現車禍傷患需要注射藥物,則會造成嚴重的治療延誤。因此醫院導入AI的影像辨識程式,當傷患進入急診室並拍攝X光及斷層掃瞄後,AI可以1秒辨識主動脈狀況,若有剝離的危險可立即傳送預警簡訊給急診醫師,達到黃金時間內注射並治療的成效。
導入AI需醫療專業/資料科學/電子工程合作
面對智慧醫療的需求,科技大廠與新創團隊都針對醫療提出科技解決方案,其中國際晶片廠商NVIDIA回應醫療科技開發人員的需求開發Clara平台,在確保個資安全的前提下,向醫療單位搜集醫療影像資料,作為訓練AI的素材,同時善用其GPU快速運算的優勢,提供醫師標註影像的工具。NVIDIA亞太區健康照護解決方案架構總監黃宗祺用三角型形容AI醫療領域的三個重要角色。專業的醫療數據與資料來自醫療機構;資料科學家則熟知各種分析工具並不斷開發適用不同場景的演算法;電子工程廠商則負責提供最基礎的平台與演算法架構。黃宗祺認為,理想上三個領域的發展需要呈現均衡的正三角形,但台灣目前沒有機構的發展三者兼顧,因此跨領域合作便是發展智慧醫療的重要課題。
圖2 NVIDIA亞太區健康照護解決方案架構總監黃宗祺認為,跨領域合作便是發展智慧醫療的重要課題
NVIDIA作為三角型中的資訊平台/工具供應商,便透過醫療平台加速資料科學家的演算法開發,並協助醫師更有效率地標註醫療影像,同時在確保資安的前提下,搜集散落不同醫療機構的資料。目前台北榮總、中國醫學大學附設醫院等大型醫院已使用NVIDIA開發的工具,中醫大附設醫院也透過平台將智慧醫療的骨齡判讀服務分享給北港醫院使用。
新創/醫院合作推解方
新創團隊長佳智能與沐恩生醫團隊則都與大學的醫學研究單位合作,創業研發智慧醫療服務。長佳智能與中醫大產學合作,以全方位的醫療解決方案為核心進行多產品的研發。長佳智能研發長王帝皓分析,AI在醫療領域有三個發展方向,一是影像辨識,只要眼睛可見的診斷途徑都有AI發揮的空間。二為文字產出的醫院資料,如病歷、檢驗報告,可以透過AI協助整理與記錄,三則是基因相關的研發與檢測。三項之中以影像辨識技術最成熟,長佳智能的骨齡輔助判定系統便是應用AI快速判讀兒童的骨骼X光片,進行身高預測。
圖3 沐恩生醫技術長王淳恆表示,公司的醫師輔助平台將朝「資料不多也能做得好」的方向研發
沐恩生醫則與陽明大學臨床醫學所合作,分析醫生在導入AI過程中的幾項臨床痛點,並透過建置自動化訓練AI的工具平台,協助醫生快速開發客製化的AI模型。沐恩生醫技術長王淳恆在AI產業已有15年以上的經驗,他觀察到醫療導入AI時,常見三項痛點:
1.標記認定落差:根據不同醫生的經驗與診斷方式,使用臨床資料的目的和標註不同,不同醫生之間難有共識
2.資料受個資保護:醫院內的資料受到個資法規保護,不能帶出醫院進行AI模型訓練
3.模型不具通用性:不同機器、顯影劑、醫院等條件下,都會造成模型準確度下降
為符合醫療場域的特性,沐恩生醫開發AI輔助軟體MAIA(Medical AI Assistant),醫生只需要具備基礎AI知識,即可透過在軟體中上傳影像並標記,訓練出所需的AI模型,並運用在醫療工作中。作為醫師的個人化工具,單一醫生所能取得的資料不多,因此MAIA的研發朝著「資料不多也能做得好」的方向進行,目前只要幾千張的照片就能做出高精準度的模型,下一代的軟體預計只需要幾十張的照片即可訓練AI。
AI進入醫療領域的發揮,除了協助醫師診斷本科的病患,還能成為不同科別之間的互補角色。王帝皓在醫院是放射腫瘤科醫師,他說明臨床試驗的實際案例,當AI模型與本科醫生比賽診斷資料的準確度時,本科專業的醫生的精準度較高,但是當非本科專業的醫生與AI模型相比,AI模型的表現更出色。因此例如內科或急診醫師遇到病患出現心臟方面的問題,心臟診斷的AI模型就能協助基本的心電圖判定等工作。
圖4 長佳智能研發長王帝皓分析,AI在醫療領域的三個發展方向分別為影像/文字/基因
台灣具醫療/製造業優勢
綜觀AI在智慧醫療領域的發展歷程,王帝皓表示,影像是AI領域發展得最早也最成熟的技術,因此現在許多的智慧醫療產品/服務皆從影像辨識出發,進一步走向其他方面的醫療應用。聚焦台灣智慧醫療發展的優勢與挑戰,黃宗祺認為,在優勢方面,台灣雖然人口基數較小,醫療資料搜集的總量雖不如人口大國,但是醫療人員專業度在全球名列前茅,因此能夠擁有高品質的資料標籤,有利於AI模型訓練。另一方面,軟、硬體技術也是台灣在智慧醫療領域的優勢之一,然而好的產品仍需健全商業模式的支持,台灣市場小且缺乏共享服務的相關經驗,若能在智慧醫療方面與東南亞或鄰近國家合作,將開拓更多的可能性。
此外,觀察影響智慧醫療研發的外部因素,王帝皓提到台灣法規對於AI與智慧醫療的限制。AI醫療的技術需要法規迅速更新才能擁有發展彈性,但是目前AI模型經過訓練可持續優化,無法解釋AI的判斷邏輯或演化過程,未知的演算過程如同無法解釋的黑盒子,造成監管單位的疑慮,加上國際對AI醫療相關的認定尚未統一,因此若台灣的智慧醫療團隊想出海,便必須逐一通過各國規範。所幸具代表的醫療認證FDA/TFDA已逐步受理AI醫療產品的申請,盼台灣政府與業界持續溝通,尋找創新與嚴謹之間的平衡,以法規支持AI醫療發展。
AIoT應用含苞待放 邊緣推論晶片迎來戰國時代
相較於AI雲端訓練領域的蓬勃發展,邊緣推論則像是一片含苞待放的花園,各式各樣爭奇鬥艷的花朵準備盛開,智慧物聯網AIoT應用破碎化,很少有一個應用可以像過去主流應用一樣每年創造數億或10幾億出貨量的產業規模,每個應用的需求又各自不同;不過,業界估算整體AIoT產業的規模至少數十億甚至上百億,邊緣推論晶片未來幾年產業發展潛力十足。
目前人們生活中的絕大部分應用都需要機器學習(Machine Learning, ML)及邊緣運算解決方案,如語音辨識、人臉識別、符號偵測與定位、車牌辨識等。大多數應用場景需要即時的用戶互動與反應,強調能在地處理解決問題,而毋需將數據傳遞到雲端並進行運算,透過邊緣運算可以降低雲端運算的負擔,也可以解決延遲性、安全性和可靠性的問題。
AI聲音/影像應用推陳出新
由於AI演算法與處理器能力持續提升,超高影像解析度(Super Resolution)、準確的物件偵測(Object Detection)、影像分類功能(Images Classification)、快速的語音翻譯功能(Speech Translation)在過去一年獲得大幅進展。Arm首席應用工程師沈綸銘(圖1)提到,AI為使用者帶來更好的使用體驗。例如超高影像解析度能讓使用者掌握影像細節,大幅提升觀賞影片的體驗;Avatars效果能讓使用者在自拍時使用有趣的即時動畫效果;相機的智慧夜拍模式,則讓光源控制更輕鬆,在低光源下拍攝也能媲美日拍一般清晰;此外運用生物辨識技術的臉部辨識與解鎖功能,能讓消費者使用手機付款時更安全更便利。
圖1 Arm首席應用工程師沈綸銘
沈綸銘進一步提到,除了超高影像畫質能提升觀影體驗,AI也能強化整體的聲光環境,例如偵測影視內容所需,調整或放大聲量,或者對應室內光線環境,調校顏色對比與鮮明度;還能為家中有小朋友的家長把關,當偵測到電視前方有小朋友,電視會自動停止播放不適合的影視內容,以上這些功能或多或少都有AI的協助。
觀察AI專用晶片進程,沈綸銘認為,未來產品將朝向分眾市場發展,根據各式需求,像是算力、功耗、軟體大小、軟體開發框架等而有不同的發展趨勢。以嵌入式系統為例,市場上需要在少量功耗增加下提供有效率的運算處理。相對的,以自駕車系統為例,市場上則需要可延展的AI運算加速器,以及通用性的軟體開發。
邊緣推論講算力拼省電
卷積神經網路(Convolutional Neural Network, CNN)是這波人工智慧技術發展的起點之一,也是目前發展成熟度最高的技術,其對影像辨識效果最佳,應用也非常廣泛;過去幾年在指紋辨識領域取得領先地位的神盾(Egis Technology),也將原先的核心技術與AI結合,神盾新技術研發處副總經理林郁軒(圖2)表示,以智慧型手機指紋辨識功能為例,透過邊緣AI的協助,在辨識時毋須喚醒應用處理器也無須聯網,對整個系統的耗電與反應速度大有幫助。
圖2 神盾新技術研發處副總經理林郁軒
神盾從指紋辨識起家,為了優化指紋辨識的效能而導入AI,再從指紋的影像辨識往人臉、行為、動作等各式影像辨識技術發展,林郁軒解釋,邊緣運算尤其是行動終端或AIoT類的產品,除了算力還會比較每瓦的TOPS,導入AI也不能犧牲電源效率,這應該也是未來邊緣推論晶片競爭的重點。以神盾現在的解決方案來看,每瓦約可提供1~2TOPS算力,預計年底將提升到3TOPS,2021年則將推出20TOPS的解決方案。
未來幾年,對於ASIC廠商而言,與客戶深入溝通,將需求明確定義,是非常重要的關鍵,林郁軒認為,這樣才可以透過專用演算法與電路的設計,提高晶片的每瓦TOPS。而在推論的精度上,一般而言精度越低效率越好,所以也有滿多設計會導入可調式精度架構,讓精度與效率可以依應用調整。
AI系統效能為更可靠指標
針對AI算力已經成為效能指標的代名詞,在台灣可以被稱得上是人工智慧「獨角獸」的耐能智慧(Kneron),該公司董事長劉峻誠(圖3)指出,算力就跟CPU的處理速度一樣,只是AI晶片的運算能力,並不能代表整個系統效能,一味追求TOPS或是每瓦TOPS的數字表現,容易陷入迷思。耐能於2019年推出KL520晶片,具備「可重組式人工智慧神經網路技術」,會根據不同任務進行重組,減少運算複雜度,保證在不同的卷積神經網路模型上的使用,無論是模型內核(Kernel)大小的變化、模型規模的變化,還是影像輸入大小的變化,都能保持高效率使用運算(MAC)單元。
圖3 耐能智慧董事長劉峻誠
劉峻誠並提出「Edge AI Net」的概念,透過AI晶片,能夠將生命賦予終端設備,實現去中心化、離線本地處理、主動智慧等目標。一般而言,目前的AI網路如CNN、遞歸神經網路(Recurrent Neural Network, RNN)或長短期記憶(Long Short-term Memory, LSTM)網路,都是由卷積、剪枝(Pruning)與矩陣乘法器組成,耐能的晶片可以因應不同應用需求進行網路重組,所以一款晶片可支援多個不同網路架構,並組成Edge AI Net,讓算力共享,而能達成1TOPS算力,創造3TOPS效率的效果。
2020年下半年耐能計畫推出新款的AI晶片KL720,具備可堆疊式設計,可因應網路效能需求大幅提高算力,也不放棄個別晶片的每瓦TOPS,同時進一步將Edge AI Net概念具體實現,以「Kneo」的名稱推廣其智慧物聯網AIoT概念。從2019年發表KL520開始,已經有數百萬顆晶片的出貨量,未來這些產品都將是一個網路節點,有機會成為AI時代最具影響力的架構。
邊緣推論晶片大發生
在PC與行動通訊時代,最後都只剩少數晶片大廠主導市場,如英特爾(Intel)、AMD與高通(Qualcomm)、聯發科(MTK)。AI目前是百花齊放的時期,會不會延續之前的發展模式還很難研判,但競爭的激烈程度可以想見;恩智浦(NXP)AI晶片專注於邊緣運算晶片和終端產品晶片。恩智浦半導體大中華區業務行銷資深經理黃健洲表示,於邊緣運算和閘道,提供如i.MX處理器和Layerscape處理器並加強NN/ML加速器運作為目標,提供更快的反應時間,而毋需連接到網際網路執行機器學習推論並提高隱私和安全。
除了開發人工智慧晶片外,恩智浦還打算為使用者提供完整的生態系統,建立開發環境,推出邊緣智慧(eIQ)SDK工具,用於收集資料庫和開發工具,建構MCU/MPU的機器學習應用程式,如i.MXRT10xx與i.MX8M Plus應用處理器。
而在行動通訊時代取得重大成功的Arm,同樣積極發展AI解決方案,沈綸銘說,Arm...