首頁Top區塊
- Advertisement -
AI發展歷久彌新 推論晶片商機展露
圖1 人工智慧的第三波熱潮。
資料來源:http://www.technologystories.org/ai-evolution/
人工智慧的運用分成兩個階段,一是學習訓練階段,二是推論(或稱推算、推理)階段,此與應用程式相類似,程式開發階段即為學習訓練階段,程式正式上線執行運作則為推論階段。開發即是船艦在船塢內打造或維修,執行則為船艦出海航行作業執勤(圖2)。
圖2 人工智慧訓練與推論的差別。
資料來源:https://blogs.nvidia.com/blog/2016/08/22/difference-deep-learning-training-inference-ai/
訓練與推論階段對運算的要求有所不同,訓練階段需要大量繁複的運算,且為了讓人工智慧模型獲得更佳的參數調整數據,運算的精準細膩度較高,而推論階段則相反,模型已經訓練完成,不再需要龐大運算量,且為了儘快獲得推論結果,允許以較低的精度運算。
例如一個貓臉辨識應用,訓練階段要先提供成千上萬張各種帶有貓臉的照片來訓練,並從中抓出各種細膩辨識特點,但真正設置在前端負責辨識來者是否為貓的推論運算,只是辨識單張臉,運算量小,且可能已簡化特徵,只要簡單快速運算即可得到結果(是貓或不是)。
推論專用晶片需求顯現
對於人工智慧的訓練、推論運算,近年來已普遍使用CPU之外的晶片來加速,例如GPGPU、FPGA、ASIC等,特別是GPGPU為多,原因在於GPGPU的高階軟體生態較為完備、可支援多種人工智慧框架(Framework),相對的FPGA需要熟悉低階硬體電路者方能開發,而ASIC通常只針對限定的軟體或框架最佳化(表1)。雖然FPGA與ASIC較有難度與限制,但仍有科技大廠願意投入,如Microsoft即主張用FPGA執行人工智慧運算,Google則針對TensorFlow人工智慧框架開發ASIC,即Cloud TPU晶片。
人工智慧模型的開發(訓練)與執行(推論)過往多使用同一晶片,用該晶片執行訓練運算後也用該晶片執行推論運算。但近1、2年來隨著訓練成果逐漸增多,成熟的人工智慧模型逐漸普及,以相同晶片負責推論運算的缺點逐漸浮現。以GPGPU而言,晶片內具備大量的平行運算單元是針對遊戲繪圖、專業繪圖或高效能運算而設計,可運算32、64位元浮點數,這在人工智慧模型訓練階段亦適用,但到推論階段,可能只需16位元浮點、16位元整數、8位元整數等運算即可求出推論結果,甚至是4位元整數便足夠。如此過往的高精度大量平行運算單元便大材小用,電路與功耗均有所浪費,所以需要人工智慧的推論專用處理晶片。
半導體廠紛發展推論晶片
推論晶片的需求在人工智慧重新倡議後的2年開始浮現,但在此之前已有若干產品,如2014年Google對外揭露的探戈專案(Project Tango)即使用Movidius公司的Myriad晶片(圖3)。
圖3 Intel Movidius Myriad X晶片
資料來源:Intel
Movidius之後於2016年推出Myriad 2晶片,同樣也在2016年,Intel購併Movidius取得Myriad 1/2系列晶片,並接續推出Myriad X晶片。Google除探戈專案外其他硬體也採用Intel/Movidius晶片,如2017年的Google Clips人工智慧攝影機、2018年Google AIY Vision人工智慧視覺應用開發套件等。
不過真正受業界矚目的仍在2018年,包含NVIDIA推出T4晶片(嚴格而論是已帶晶片的加速介面卡)(圖4)、Google推出Edge TPU晶片(圖5),以及Amazon Web Services在2018年11月宣告將在2019年推出Inferentia晶片,均為推論型晶片。
圖4 NVIDIA展示T4介面卡
資料來源:NVIDIA
圖5 Google Edge TPU小於一美分銅板。
圖片來源:Google
另外,臉書(Facebook)也已經意識到各形各色的推論型晶片將會在未來幾年內紛紛出籠,為了避免硬體的多元分歧使軟體支援困難,因此提出Glow編譯器構想,期望各人工智慧晶片商能一致支援該編譯標準,目前Intel、Cadence、Marvell、Qualcomm、Esperanto Technologies(人工智慧晶片新創業者)均表態支持。
與此同時,臉書也坦承開發自有人工智慧晶片中,並且將與Intel技術合作;目前臉書技術高層已經表示其晶片與Google TPU不相同,但是無法透露更多相關的技術細節。而Intel除了在2016年購併Movidius之外,在同一年也購併了另一家人工智慧技術業者Nervana System,Intel也將以Nervana的技術發展推論晶片。
推論晶片不單大廠受吸引投入新創業者也一樣積極,Habana Labs在2018年9月對特定客戶提供其推論晶片HL-1000的工程樣品,後續將以該晶片為基礎產製PCIe介面的推論加速卡,代號Goya。Habana Labs宣稱HL-1000是目前業界最快速的推論晶片(圖6)。
圖6 Habana Labs除推出HL-1000推論晶片Goya外也推出訓練晶片Gaudi。
資料來源:https://www.convergedigest.com/2018/09/interview-habana-labs-targets-ai.html
雲端機房/快速反應 推論晶片可分兩種取向
透過前述可了解諸多業者均已投入發展推論晶片,然嚴格而論推論晶片可分成兩種取向,一是追求更佳的雲端機房效率,另一是更快速即時反應。前者是將推論晶片安置於雲端機房,以全職專精方式執行推論運算,與訓練、推論雙用型的晶片相比,更省機房空間、電能與成本,如NVIDIA T4。
後者則是將推論晶片設置於現場,例如配置於物聯網閘道器、門禁攝影機內、車用電腦上,進行即時的影像物件辨識,如Intel...
應用案例成功消息紛傳 LPWAN商用後勢看漲
低功耗廣域網路(Low Power Wide Area Network, LPWAN)建構在Machine-to-machine應用上,其主要特徵要符合廣覆蓋、低成本、低功耗、大連接等特點,主要的技術則包含Sigfox、LoRa、NB-IoT、CAT-M等;若以技術發展角度,也有近10年以上的開發時程。
首先,考慮技術發展最早的Sigfox以及LoRa,皆於2009年由Sigfox與Cycleo兩家公司開始發展,鎖定Unlicensed Band Network的應用場域。
Sigfox訴求在自建Sigfox基地台,目前涵蓋約60個國家,適用於資料傳輸量較小、且有耗電考量的情境,其技術應用的四大特性就是:低功耗的連線裝置、全球的聯網服務、簡易的使用模式及低營運成本。
至於LoRa技術,訴求是透過系統整合商在場域內架設LoRa閘道器(Gateway),並且透過WiFi路由器或是乙太網路連線至後端系統。
其中,LoRa與Sigfox不同的地方在於LoRa開放較多的彈性讓系統整合商做自行開發,這對於創客而言是一項利多,創客在執行各自的場域驗証時,可以在不需要認證前提下快速地導入自創LoRa應用產品,有助於LoRa技術的推廣。然而,此一特性雖有助於LoRa得推廣,但另方面則是衍生出創客對LoRa各自表述,即LoRa產品容易在市場上產生不相容問題。
換言之,在整體LoRa應用上,受惠於較多人投入產品應用開發,使得LoRa在一開始的市占稍具規模。
在2016年6月3GPP R13定義NB-IoT的標準,2017年6月確定R14標準,NB-IoT/CAT-M的解決方案也陸續由Intel、Qualcomm、海思等晶片商在2017提出基於R13的晶片方案。
至於後續的進程,原本規畫在R16,5G NR時會將NB-IoT與CAT-M整併到5G mMTC之中,但是目前的整併時程,將會延至3GPP R17時。
應用場景陸續浮現 LPWAN爆發成長可期
參照TSR 2019年出具的市場分析報告「Cellular Modem Market Update」內容,LPWAN的市場出貨量由2016年的1,580萬,到2023年預估的量能4億2,980萬,其平均年複合成長率達到160%。此部分已包含對LoRa、Sigfox、NB-IoT及CAT-M所有LPWAN產品預估值。市場分析指出,2018年LPWAN產品將由8,300萬,跳升到2019年的1億4,660萬,市場需求將再成長176.7%。
有別於智慧型手機,將由總人口數直接限制手機數量。訴求在萬物聯網的IoT產品,其數量完全由應用場景所決定,不會有產品總數的天花板。雖然在初期的LPWAN的應用場景,不乏晶片模組的價格過高、水表應用的通訊掉包、生態系(Ecosystem)尚待建立、缺乏殺手級的產品應用等負面的聲音出現。
然而,在各概念驗證(Proof Of Concept, POC)產品應用在市場上接收到的回饋、更多的成功應用、模組價格大幅下降、政府的公共資源投入,2019年已開始在市場上締造許多成功的案例,如水表、電表與瓦斯表等三表布建、中國大陸鄭州的電動車專案、資產物流老人小孩的追蹤需求、消防感知的需求法制化。智慧建築、智慧農業、智慧商店、智慧醫療、智慧交通等,環繞在智慧城市下環環相扣的應用場景,已成為目前科技發展的顯學,在2019年下半年,需求有機會大爆發。
NB-IoT實現資料傳輸最後一哩路
物聯網的應用面,包含端、管、雲,才能成就其完整的智慧應用場景。負責資料收集的感測器、負責傳輸的通訊技術、提供管理平台的PaaS(Platform As A Service)、提供資訊分析的Cloud環境。
在物聯網的應用中,端點的關鍵在於如何正確的萃取環境或生物等訊息,這些訊息的組成除了巨觀的參數以外,更包含微觀的數值,再利用相互間的特殊關係,產生一個具有意義且可被量化的演算法,種種問題需要多元的產業達人和技術人員共同開發討論,並且在場域環境下可以穩定的、低功耗、高效率、價格合理的無線技術下傳輸。
可以相信的是,讓所有的資料能送至後台是最為關鍵的一環,唯有訊息開始回傳至後台,才是開啟物聯網的重要里程碑。目前各路英雄好漢,均已就定位,提出各自的服務方案,試圖占據市場有利位置。
市場上,也不斷有加速物聯網應用的好消息,著實振奮市場信心。中國鐵塔公司與阿里巴巴簽署戰略合作協議,雙方將在雲計算、邊緣運算、大數據等展開深度合作。
2019年,搭配各家NB-IoT的R14版本的開發完備,運營商也計畫在2019年Q2、Q3完成NB-IoT R14基地台的升級,此3GPP R14的部署,將加速Tracker在移動性、低耗能、軔體更新的應用需求。截至2018年底,中國已陸續布置超過百萬座NB-IoT的基地台,NB-IoT的訊號涵蓋率,已被大幅提昇至全面商用化階段。
迎接IoT應用商機 通訊模組業者蓄勢以待
展望未來科技應用的場景,無論是訴求智慧生產的工業4.0、AI與大數據分析,或是5G的巨量連結,都是建立在物聯網的架構下擴大其應用面。目前工業4.0則成為通訊模組廠商重點推行的技術,例如光寶科技不但讓旗下各規模的工廠逐漸升級成為智慧工廠,更利用大數據分析和AI技術提升製程能力,藉由高端技術的引進,在零組件製造業創造更高價值,產生高毛利的產品,進而成為物聯網時代的重要推手之一。
另外,物聯網的應用,重點在各項技術的整合,在相關技術蓬勃發展下,說明各個技術已開始產生化學反應,代表物聯網的商用年代逐漸來臨。通訊模組供應商也積極布局智慧製造、物聯網網通與智慧應用三大市場。像是光寶便積極投入LPWAN的通訊模組開發,成為具Sigfox、LoRa、NB-IoT量產能力的模組開發商,以完整的通訊產品線布局,營運範圍涵蓋網路通訊模組、網通設備、智慧監控攝影、戶外照明路燈與工業自動化等,迎接需求即將爆發的LPWAN市場。
同時,未來在面對少量多樣化的模組生產需求,光寶也早已導入高度自動化的生產線,利用機械手臂協助模組產品測試,並投入研發人員在製程設備開發,持續展現高彈性的生產優勢,為LPWAN進入大規模商用時代做好準備。
(本文作者為光寶科技通訊模組事業部研發二處處長)
專訪耐能科技創始人兼執行長劉峻誠 耐能新款晶片開啟更多AI應用
耐能創始人兼執行長劉峻誠於發布會上提出「Edge AI Net」的概念,他表示,透過新推出的KL520晶片,期能夠將生命賦予終端設備,實現去中心化、離線本地處理、主動智慧等目標;而耐能也因此成功實現AI在雲端及離線終端上的互補,完成從提供IP到AI晶片的新里程碑,開啟AI應用於不同層面的更多可能性。
據悉,新推出的KL520晶片,具備「可重組式人工智慧神經網路技術」,會根據不同任務進行重組,減少運算複雜度,保證在不同的卷積神經網路(CNN)模型上的使用,無論是模型內核(Kernel)大小的變化、模型規模的變化,還是影像輸入大小的變化,都能保持高效率使用運算(MAC)單元。
此外,該產品也可滿足高效運算需求,其數據格式按運算需求靈活調整,致使在計算過程中實現更高的「數據計算vs.數據讀寫」比例,減少記憶體數據搬運的能量耗損。同時,透過耐能模型壓縮技術可有效減小模型大小,大幅降低在終端部署時的儲存成本,也大幅降低了記憶體頻寬的需求,並可提供較為通用,可同時支持語音及2D、3D影像的AI需求。
KL520晶片其餘特色還包括:低功耗(平均功耗僅300~500mW)、體積小;算力最高可達350GOPS,可作為協處理器使用,增加系統端的AI運算能力,毋須更換主晶片,即可快速於系統端導入智慧應用;適用於結構光、雙目視覺、ToF及耐能自主開發的輕量級3D感測技術等。
目前該晶片甫推出便獲得多家合作夥伴採用,包含鈺創科技、鈺立微電子、奇景光電、研揚科技、全科科技、和碩科技等。劉峻誠透露,未來將持續與戰略伙伴合作,落實產業應用,而2019年第四季還會推出用於智慧安防市場的第二款AI晶片。
耐能創始人兼執行長劉峻誠提出「Edge AI Net」的概念,期能藉此開啟AI應用於不同層面的更多可能性。
以物聯網為基礎 預測性維護效率再提升
採用智慧方式部署的聯網感測器可以在影響流程或生產之前檢測到故障,藉此節省維護成本並避免發生停機的情況。為了避免低效率的維護流程和伴隨而來的成本,製造商和網路營運商可以使用智慧感測器和資料科學原理來最佳化維護的流程。
根據麥肯錫所發表的報告,建基於物聯網的預測性維護可協助降低多達40%的工廠設備維護成本。它還可以延長機器的使用壽命,減少50%的設備停機時間及減少3~5%的設備資本投資。
善用IoT/資料科學 避免無效流程/高成本
多年來,製造商所採用的設備維護方法一直都是以時間作為根據。規劃任何維護流程時所考慮的主要因素僅僅是機器的使用年限。設備越老舊,維護程序就越頻繁。
ARC集團的一項全球性研究指出,只有18%的設備是因老化而失效的,其餘82%的失效是隨機發生的。這些研究結果顯示,以年限為根據的維護方法並不具成本效益。為了避免無效的維護流程和伴隨而來的高成本,製造商可以充分利用工業物聯網和資料科學。
電網故障可能導致配電中斷,對受影響地區中幾乎所有的人員、企業和服務機構的日常運作帶來很大的麻煩。這種情形使得預測性維護對這一類關鍵基礎設施尤為重要。芬蘭的輸電系統營運商Fingrid舉辦過多次的創新競賽,希望能找到最佳的合作夥伴來將其營運設施的維護和監控運作數位化。
Haltian的Thingsee無線感測器產品被應用在芬蘭的變電站中,用以測量其中的連接元件的溫度。這一點很重要,因為溫度升高是電阻增加的徵兆,而這可能是由污垢或腐蝕所引起的。
此外,該感測器還可用來測量濕度、氣壓、環境光、存在(Presence)和距離等方面的資料。雖然這樣的感測器並不能完全消除對手動檢查的需要,但它們確實使得監控操作更加有效率並降低了出現問題的風險。
聯網工具減半維護工作
除了顯而易見的電網使用案例以外,建基於感測器的監控也可用於各種工業應用中。位於南京的愛立信熊貓製造工廠使用蜂巢式IoT連接數千台設備,包括高精度螺絲刀。這些模組每八小時傳送大約100位元組資料以顯示最近的使用情況。
這些資料會被一款雲端解決方案收集起來,再進行分析。操作經理可以監控使用資料來準確地掌握工具何時需要重新校準,而不是依據效率差的預定時間表工作。
根據這個案例研究,愛立信預估該解決方案的每單位成本僅為20美元,但可減少一半的維護工作,每年節省10,000美元,並在短短兩年內達到損益兩平。
工具和機械也須預測性維護
工業環境中常會用到安全和遙測系統,它們通常需要自己特定的網路。除此之外,可以使用新的無線技術收集許多不太重要的參數,以形成預測性維護的基礎。
主要的兩類資料是:
用法:使用工具的頻率和時間長度?最常用的功能是什麼?是那位員工從事這項工作?
狀態:隨著時間推移,機器的溫度和變異數(Variance)是多少?系統中是否有任何不規則的振動?
使用資料執行完整的根本原因分析(Root Cause Analysis),有助於預防將來出現故障的情形。
連接技術提升可靠性
物聯網已經為全球供應鏈的運作提供了有價值的幫助,包括使用蜂巢式物聯網進行資產追蹤。不過,透過預測關鍵資產的失效,連接技術可以進一步強化經銷鏈的可靠性。
冷鏈(Cold Chain)就是一個典型的例子,多年來,人們一直致力於尋找一種可測量運輸貨物溫度的低成本解決方案。這有助於瞭解貨物是否保持在適當的溫度以及哪些貨物可能需要銷毀。
雖然這是物聯網運行的好例子,但其實可以再進一步,在一開始時就可以預測和避免失效。將預測性維護應用到製冷系統,以便對何時即將發生故障有更好的掌握,這將可節省寶貴的時間和金錢,並避免浪費食品和藥品等寶貴資源。
預測性維護確保設施壽命
道路、橋樑和鐵路是社會的重要基礎設施,它們的維護工作對於確保其在整個使用壽命週期中的安全性而言,是非常重要的。在這種情況下,物聯網就可派上用場。
可以持續監控振動等機械參數,在已記錄模式中的任何異常都指出須要維護,或者可以通知存在緊急情況。例如,杜塞道夫機場安裝了50個路內(In-road)NB-IoT感測器,以監控唯一可以進入機場油箱儲存地點的橋樑的狀態。
擴大規模是最大挑戰
預測性維護並不是一個新概念,例如我們都很熟悉可以透過不規則的聲音或振動來預測汽車何時將會發生故障。
物聯網所帶來的新功能是收集來自數千或數百萬台設備的資料的能力。我們可以從經驗中學習,建立和更新模型及建議所要採取的行動,所有這些都能夠以自動化的方式實現,並且將會規模空前。
很明顯,如要成功,企業須要利用大數據分析和人工智慧方面的所有最新技術來提升效能。然而,即使在此之前,所有的「物品」也要先連接起來。
(本文作者為Nordic Semiconductor事業開發經理)
專訪東瑞電子行銷業務事業部副理陳則名 東瑞/Ricoh攜手深耕車電市場
東瑞電子協助供應商推廣產品,是深耕車用市場的專業代理商,而理光微電子憑藉自身的工藝技術和電路技術,實現了高耐壓、低消耗、高精度,可開發適應市場需求的產品。東瑞電子行銷業務事業部副理陳則名表示,汽車電子系統越來越多,車用電源通常來自電池加發電機,發電機供電不穩定,平常電壓雖然只有12~14伏(V)左右,啟動瞬間可能產生高電壓,透過電壓檢測IC可以保護元件與系統的穩定,避免車用IC裝置被高電壓擊穿。
未來車用電子電力傳輸將從12V往48V發展,理光微電子台北代表人辦事處總經理小川貴裕說明,該公司的電壓檢測IC不僅能即時偵測,針對輕油電的48V系統發展趨勢,相關產品也可以支援到60V的電壓範圍。隨著汽車導入越來越多電子系統,這類電壓檢測元件的需求也會越來越高。
另外,抬頭顯示器(Head Up Display, HUD)應用越見普遍,利用光學反射原理將重要的行車資訊投射在擋風玻璃,早期反射式的HUD駕駛閱讀須將視線移開,容易造成分心;新式的HUD將訊息投射到與駕駛視線一致的位置,不用像舊式的解決方案須要變換視覺焦距,降低駕駛分心的情況,而且從單色到全彩顯示,訊息更加一目了然。
理光的RGB雷射二極體(Laser Diode, LD)驅動晶片解決方案,針對大畫面和高畫質的HUD產品開發需求提出,小川貴裕指出,此舉可以減輕駕駛員負擔,降低危險駕駛情況。晶片透過各保護特性,實現高安全性,達到Full-HD(1080P)高解析度,大驅動電流實現六公尺外呈現虛像,並自動檢測LD溫度特性並補償保持高對比度和高精度調光,2019年第三季前完成量產,並由客戶設計、導入,預計2021年後正式上市。
東瑞電子行銷業務事業部副理陳則名(右);理光微電子台北代表人辦事處總經理小川貴裕(左二)。
MCU添運算加速器 數位電源控制效率更上層樓
數位電源應用與日俱增,而為實現更好的電源控制效率,微控制器(MCU)也開始朝更高運算邁進。為此,意法半導體(ST)近期所發布的全新STM32G4 MCU,便添加了新數學加速器,使其具備更快的運算速度、更佳的精確度,進而提升電源使用效率。
意法半導體資深行銷經理楊正廉表示,要實現更高的電源使用效率,在進行電源轉換(AC-DC)時,電源供應端和負載端就必須進行相位補償或動態調整,而這往往須透過數位化的方式,才得以獲得比傳統類比電源更好的精確度和轉換效率。也就是說,數位電源應用中需要更多的數學運算,透過更多的演算提升電源控制、轉換效率,因此,新一代的MCU產品便導入兩個新的硬體數學運算加速器來提升應用處理速度。
據悉,數學運算加速器專門用於加快運算速度,例如,家電或空調所採用的節能馬達控制演算法中之三角函數計算,以及訊號調節或數位電源控制演算法中的濾波演算法,運算速度相較通用主處理器更快,且效率更高。此外,這種減負方式還可讓內核心釋放更多資源,用於接收更多感測器資料和控制其他功能。
而新推出的STM32G4,便是導入濾波演算法加速度器(Filter-Math Accelerator, FMAC)和CORDIC專用引擎,以滿足數位電源應用需求。楊正廉指出,硬體加速器對於數位電源、馬達控制等應用而言十分有幫助,因可以加快演算法的運算速度,例如,馬達控制應用中的旋轉和向量三角函數,以及一般的對數、雙曲線和指數函數、訊號偵錯IIR/FIR濾波演算法或數位電源3p/3z控制器,以及卷積和相關函數等向量函數。過往這些數值都是倚靠工程師自身的經驗進行調整,但人為調整過程中多少會有缺失,如此一來會影響MCU效能,因此,ST便開發演算法加速度器,讓MCU在數位電源、馬達控制等應用中能有更精準的控制效率。
意法半導體微控制器事業部STM32微控制器產品線行銷經理Jean Marc MATHIEU指出,STM32G4可擴充應用範圍並簡化設計,同時降低功耗還能提升性能,透過這些創新技術,消費性電子或工業設備可以花費較少力氣,實現更高的電源效率。
靈活/高效方案紛出 AI晶片百花齊放
人工智慧(AI)已逐漸走入大眾生活。AI應用正逐漸滲透到各種領域,例如農漁業、金融、工業還有各式消費性電子產品中。
AI結合物聯網(IoT)時代已然到來,然而AI應用種類各異,各有千秋,不同的應用領域要求的AI技術也不盡相同。為了搶攻龐大的AIoT商機,並實現各種AI創新應用,各大AI晶片供應商不僅持續提供可實現高效運算的解決方案,同時也朝更靈活、彈性的架構發展。
滿足多元應用 AI晶片朝靈活架構發展
AI快速成長,生活智慧化的變遷顯而易見,而要如何在變化多端AI市場中搶占商機。面對AI的迅速發展,未來已不能倚靠單一架構滿足所有應用需求;在傳統的硬體設計方式及設計週期漸漸趕不上AI演算法的推陳出新之時,靈活、彈性的平台架構便應運而生,以滿足AI應用需求。
AI應用推陳出新 賽靈思力轉靈活彈性平台
賽靈思(Xilinx)大中華區業務副總裁唐曉蕾表示,AI應用相當多樣化,且屬性多不相同。也因此,在資料、記憶體結構、效能和精度上等方面都會出現客製化需求。以精度為例,有些應用需要99%甚至是99.9999%的精度,但有些應用則需97%的精度便已足夠。然而,97%和99%的精度雖然只差2%,但在運算資源需求上卻有著相當大的差異,因為要提升精度,須花費相當大的人力、物力和時間。也因此,在AI應用朝多元發展的態勢之下,為使運算時間、資源更有效率,應用業者不再只朝「最好」、「最強」發展,而是朝「最適合」,客製化需求由此而來,也因此,需要更彈性、靈活的設計平台。
賽靈思全球人工智慧市場資深技術專家張帆也指出,AI商業應用迅速增加,資料量以指數型成長,現有的運算架構已不敷使用。另外,由於各式AI創新應用不斷展露,也因此AI相關的訓練與推論呈現百花齊放的狀況,可說平均兩個星期到一個月就有一個全新的演算法提出,因此,更需要新一代具高效能、且彈性靈活的架構來因應此一狀況,滿足AI演算法和應用。
為此,賽靈思便積極轉型,將自身定位成靈活、彈性的系統平台供應及服務業者,而不再只是單純的可編程技術/硬體供應商,例如之前所發布的Versal ACAP平台便是其中一個例子。
賽靈思工業、視覺、醫療與科學市場總監Chetan Khona(圖1)說明,Versal ACAP結合許多創新成果,讓軟體開發者、資料科學家及硬體開發者都能自行加以編程與最佳化,以跟上AI的快速演進;且能讓開發者創建專用領域架構(DSA),在不使用新晶片的狀況下就能自行著手開發客製化演算法。
圖1 賽靈思工業、視覺、醫療與科學市場總監Chetan Khona說明,AI晶片開發商未來面臨的挑戰為適應AI創新速度。
Khona認為,網路邊緣的AI需要在效能、功耗及售價等因素之間取得理想的平衡點;而該公司的Edge AI解決方案能透過先進的量化以及剪枝(Pruning)技術克服此一挑戰。將網路量化為INT8與更低的單元,再搭靈活應變的架構,能讓系統層級效能提高約2倍,或發展出更具競爭力的技術;而剪枝技術則能將網路最佳化,在不犧牲精準度下達到更理想的效能、延遲、能源效率以及成本。
CEVA確保硬體/軟體編程彈性
CEVA客戶行銷及AI策略資深總監Yair Siegel(圖2)則表示,當今的AI應用市場相當分散,沒有一種設備可以滿足所有需求。不過,雖然說各種產品和應用對處理器性能要求都不盡相同,但相似之處皆在於希望能夠利用演算法上的簡單更新,來因應市場變化。所以AI解決方案要保持一定的靈活性,且還須要關注軟體的可編程性,才能使AI產品從研究、設計時期就能平穩地進入量產階段。
圖2 CEVA客戶行銷及AI策略資深總監Yair Siegel表示,2019年將開始看到更多帶有AI功能的攝影機出現。
因此,AI處理器的研究重點在於,演算法精確度與侷限於電池及成本因素的硬體最佳化。換言之,便是能否僅利用設備電池的小量電量,在有限的硬體區塊上執行最新技術。
Siegel指出,為此,CEVA備有用於邊緣深度學習的專用低功耗AI處理器「NeuPro」,可實現高效的硬體加速性能,同時仍保持可編程解決方案的靈活性,且憑藉軟體即可輕鬆升級,以滿足廣泛的終端市場需求,包括物聯網、智慧手機、監控、汽車、機器人、醫療和工業等。除此之外,CEVA還與演算法開發人員合作,讓後者專注於針對網路最佳化,利用設備本身來進行處理。期能讓設備製造商獲得性能更佳的硬體,且還可以快速、多次進行軟體更新。
Siegel透露,簡而言之,該公司的AI解決方案可實現相應的調整,採用全面性的解決方法,不僅能為不同的案例提供可擴展性,並能提供工具和函數庫的自動化以縮短開發時程,同時也兼顧靈活性和效率。
高效晶片仍占一席之地
上述提到,AI應用多元,驅使邊緣運算需求與日俱增,應用開發商與半導體業者皆積極將深度學習或機器學習導入前端設備,希望使前端裝置也有人工智慧的能力;而要滿足多樣化的AI產品,除了靈活多變的架構外,高效的運算也是不可或缺。
英特爾齊備邊緣運算方案
英特爾(Intel)業務暨行銷事業群商用業務總監Alex Cheng(圖3)表示,AI+AIoT是目前相當熱門的話題。在AI興起之後,前幾年產業多是發展「AI Training」;然而,當模型Training好之後,下一步便是導入實際應用,而IoT裝置即是個很好的應用目標,像是監控攝影機、視覺檢測裝置等,都已陸續引進AI。也因此,AI+IoT必將是日後的發展方向,同時也具備很大的潛在商機,成為兵家必爭之地,為此,英特爾也積極布局,備有各式解決方案。
圖3 英特爾業務暨行銷事業群商用業務總監Alex Cheng認為,AIoT已成為各大晶片商兵家必爭之地。
例如不久前所發布的全新視覺加速器設計產品(Intel Vision Accelerator Design Products),強化邊緣裝置AI推論與分析能力。此一解決方案包含Intel Movidius視覺處理器與Intel Arria 10 FPGA,皆以OpenVINO軟體工具套件為基礎,提供開發者在多種Intel產品中使用進階的神經網路效能,在物聯網裝置中運行更具成本效益的即時影像分析和智慧化功能。
英特爾指出,用此一視覺解決方案的企業,不論是在資料中心、現場部署伺服器或於邊緣裝置內採用深度學習人工智慧應用,深度學習推論加速器皆可擴充至其需求程度。
除此之外,為更進一步擴展AI終端市場,英特爾近期也再度推出用於智慧邊緣的高密度系統單晶片處理器「Intel Xeon D-1600」。此一處理器是高度整合的系統單晶片(SoC)處理器,專為功耗和空間有限的密集環境而設計,其結合內建的Intel QuickAssist技術和Intel虛擬化技術,可為虛擬化網路功能(VNF),控制平面和中階儲存解決方案提供更上一層樓的工作負載優化效能和硬體增強安全優勢。Intel Xeon D-1600處理器最多可支援8個核心。
添加DSP指令集 RISC-V處理器效能大增
搶攻AIoT市場,晶心科技則是推出其32位元A25MP和64位元AX25MP...
中間電壓提升至48V LED更明亮/壽命更長
造成LED面板發熱的一個因素是:在視訊牆中進行功率轉換和配電時會出現熱損耗;這種損耗來自功率轉換以及布線與印刷電路板的電阻性銅損。那應該怎樣解決呢?對不同分區選項進行優點評估,將有助於在設計高功率LED應用時,確定最好的選項。
LED電源/供應器影響效率高低
直觀式LED顯示器可以用更少的能量產生更多的光輸出(即有用功率),因此除了比LED背景光液晶顯示器更亮以外,功率效率也高很多。雖然如此,它們仍然以熱量形式產生大量的「耗散功率」。LED摸起來一般會很涼,這種現象似乎令人感到訝異。這是因為它們通常並不會以紅外線輻射形式產生熱量,一接觸就能感覺到。事實上有85%的能耗都是以熱量形式耗散的,因此,大型LED陣列需要的功率遠遠超過了光轉換功率。
大型LED面板的LED功耗會很高。例如,弗蒙街體驗顯示器(圖1)全亮時功耗為2.2MW,白天甚至需要更多的能量才能抵消陽光的作用;即使是小型顯示器,同樣也有大量的LED,功耗也很高。
圖1 弗蒙街體驗LED顯示器的解析度為7,552×552 個像素,像素間隔為2吋,全亮時功耗為2.2 MW。採用1,250萬LED,尺寸為 1,500×90。
圖片來源:印第安納波利斯藝術博物館
例如一家領導製造商產製的顯示模組有一個80×80的陣列,總共有6,400個LED,需要300W(5V、60A)的電源。因此,要實現效率最大化,關鍵須看LED電源供應器的設計。
大型LED陣列 無縫影像伸縮自如
由多個面板組成的大型LED陣列可以提供任意大小或形狀的無縫影像,從任何角度都能獲得優異的觀賞效果。就尺寸而言,從簡單的捲動訊息顯示器到與圖1所示的弗蒙街體驗(使用的LED有1,250萬個)類似的顯示器舉不勝舉。圖2是LED技術具有獨特優點的兩種顯示器實例:安裝在計程車上的LED廣告顯示器和環繞建築物側邊的高彎曲曲面顯示器。
圖2 LED顯示器可以變幻,以對即時車輛位置資訊作出回應(A),或者符合三維形狀(B)。
圖片來源:Vicor與commercialledscreens.com
級數最小化須優先設計
電源供應系統必須採用最有效率的方式,將傳入的AC電壓轉換成隔離的低電壓、高電流DC電。每一級功率轉換都會增加成本,浪費能量,因此,級數最小化須要優先設計。
大型視訊牆由許多連結在一起的模組組成,因此,有效率的設計還必須調整適當大小,使重複的功率轉換級最小化。
前兩大優先設計選項:
1.最小化配電損耗—電力透過電阻線路從電源供應器傳輸給LED陣列,會以熱量方式產生功率損耗,俗稱配電損耗。電流(I)的配電損耗與該電流的平方成正比,即:P=I2R,其中R為電線、母線或印刷電路板跡線的電阻。降低配電損耗,需要降低電流或降低電線的電阻。
降低電流的同時為負載輸出相同的總功率,則需要增大電壓(P=VI)。舉例說明,電壓從24V加倍到48V,會將電流降低50%,進而會使配電損耗下降75%。
嘗試藉由降低電線電阻來得到相同的結果時,導線截面積需要變為四倍,這樣會使重量和成本同時增加,這不太實際。
2.降低LED的發熱效應—如前文所述,熱量是LED的死對頭,而無效率的電源設計只會使事情變得更糟。溫度過高會縮短LED的有效壽命,並會造成變色(圖3)。更糟糕的是,光輸出會隨接面溫度的升高而下降;為LED應用提供有效的電源供應系統,必須注意每個獨立元件,避免局部熱點,這些局部熱點不僅會使LED更早損壞,而且在整個使用過程中也會更暗、不明亮。這對於光品質和均勻度同樣重要的視訊牆而言至關重要。
圖3 不同顏色LED的相對光輸出與接面溫度的關係
資料來源:RPI/LumiLeds
改善電源系統效率的簡易方法是最大限度減少轉換級數。例如,去掉一個轉換級可將系統效率改善5%~10%,並且以功率位準為準,可減少系統內所產生的熱量。要取消轉換級,設計人員需要選擇可在不影響效率的情況提供高降壓轉換比的元件。
電源系統元件實現差異化
有許多方法都可分區電源供應系統,將AC市電轉換成用於LED驅動器及控制電路的低電壓DC電。無論選擇哪種特定分區,一般的設計都包含以下組塊:
.由熱保護金屬氧化物變阻器(TMOV)或類似裝置提供的輸入保護。
.AC濾波整流組塊。
.含功率因子校正(PFC)的整體式AC-DC轉換組塊,用於最大化AC市電提供的電源並遵守嚴謹的設備功率因子要求。
.負載點(PoL)DC-DC降壓穩壓器,用來產生負載端高穩壓率電壓輸出。
如圖4所示,簡化大型視訊牆的電源供應器設計。這會帶來可最大幅度減少轉換級並且只需極少外部元件的簡易設計。
圖4 混合電壓AC-DC電源系統分區。PFM將中間母線電壓輸出至各面板的負載點轉換器。
資料來源:Vicor
AC輸入級
AC輸入前端模組(AIM)可執行線路整流、EMI/RFI濾波、暫態保護及湧流限制,為後級提供非隔離式整流AC線路電壓。
AC-DC轉換
PFM系列可為AC-DC系統提供具有PFC的隔離、穩壓型AC-DC轉換器。這款AIM/PFM組合能夠以高達92%的效率,將通用AC轉換成隔離式48V或24V電壓,以供高達400W的系統使用;其外形比普通智慧型手機還小。本系列採用雙面散熱外殼,提供底盤安裝和電路板安裝兩個選項。
DC-DC降壓轉換
Cool-Power是高輸入電壓、寬輸入範圍DC-DC零電壓切換(ZVS)降壓穩壓器系列,採用單個封裝高度整合了控制器、電力開關以及各種支撐元件。ZVS拓撲可實現百萬赫茲切換頻率,其可降低閘極驅動損耗與本體二極體傳導損耗;Cool-Power ZVS穩壓器的運作輸入電壓可以是12V、24V,也可以是48V,可達到超過97.5%的效率,並且只需一個外部電感器和極少的電容器,便可構成完整的DC-DC降壓穩壓器解決方案。
使用上述建置組塊,LED視訊牆可能有幾種系統分區。由多個較小面板組成的大型面板顯示器必須能夠關斷公用母線電壓。將AC電源直接配送給各面板,然後在各面板上進行AC-DC轉換,這樣做不僅成本高,而且體積大,通常不是基於安全考慮的選項。相反,單個整體式AC-DC轉換器級常用於供應隔離式低電壓母線電壓,為各個獨立面板提供電力。就大型面板而言,從整體式AC-DC供應器到LED驅動器的距離可達數公尺長,隨著功率位準提升,挑戰也會跟著出現。
採用48V配電 既安全又省電
24V和12V配電一直是LED面板最常用的母線電壓。與AC配電相比,可從面板消除潛在致命的電壓,而且符合低電壓電源供應器的安全特低電壓(SELV)「安全」電壓位準要求。
然而,比12V或24V更好的選項是,將中間電壓加倍到48V。48V低於60V,因此仍然符合SELV準則,甚至還包含20%的過壓保護容差。與24V系統相比,這不僅可在給定功率位準下將電流減半,而且還可減少纜線成本和重量,達到更加節省的效果。
此外,它還可將配電損耗減少75%,熱產生降低。更低的運作溫度可提高系統可靠性,而更低的電流則可縮減LED面板的厚度。母線以更低的配電損耗傳輸更高的電壓還會使視訊牆更有效率,讓終端使用者的生命週期運轉成本降低。
生成隔離式48V配電母線可能會非常簡單,除了AC輸入PFM以外,高功率3相位AC-DC轉換器後面可能還連接有母線轉換器模組(BCM),用來以高達98%的尖峰效率將380V轉換成隔離式48V。單個高電壓BCM能在63×22毫米封裝內進行1.75kW的功率輸出,功率密度為2,735W/in3。48V解決方案後面隨後既可連接48V輸入Cool-Power降壓穩壓器,也可連接48V輸入Cool-Power升降壓穩壓器,以直接供電給LED或LED驅動器。
48V讓LED更亮/壽命更長
先深入了解幾種方法的優點。在大型視訊顯示器中驅動成千上萬個LED,需要有效率的電源系統,才能產生所需要的低電壓、高電流電源。將電壓提升到48V,也可獲得許多24V無法提供的效益:
1.熱產生減少/熱管理更容易。
2.更少的電纜敷設/降低了成本,縮小了尺寸及重量。
3.LED效能提升/顯示品質改善。
4.面板壽命更長/可靠性更高。
5.功率效率更高/用電量更少。
以Vicor的模組化電源系統元件為例,可以輕鬆組合可組配、高密度、高效率的LED電源供應系統。性該組件系統具備高靈活只需極少的操作,就能適應幾乎任何功率位準、尺寸或封裝。高靈活、高效率的建置組塊與直觀式線上設計工具及易於使用的開發套件相結合。
為了確保下一代大型LED顯示器部署,讓LED更亮、使用壽命更長,請從48V開始。
(本文作者為Vicor資深產品行銷經理)
感測器/致動器不畏逆風 2019年營收再創高達154億美元
2018年,智慧手機出貨量減少以及採購訂單減少限制了半導體感測器和致動器的銷售成長,導致2018年和2016年兩位數成長後,2018年成長6%至創紀錄的147億美元,根據產業研究機構IC Insights的2019年光電/感測器/致動器和離散元件(OSD)的市場分析和預測。
感測器/致動器成長的下降趨勢延續到今年第一季,全球銷售額與2018年同期相比僅成長2%,但預計未來六個月該半導體市場將恢復強勁成長,該報告指出,2019年將成長5%,達到創紀錄的154億美元新高。由於全球經濟疲軟,2020年成長放緩至3%後,感測器/致動器銷售預計將在2021年至2023年間逐漸恢復成長趨勢,未來四年將達到211億美元。
2019年OSD報告顯示,2018年感測器總銷量成長8%,達到創紀錄的91億美元,而2017年成長15%,2016年成長14%。致動器收入去年成長4%,創歷史新高55億美元,繼2016年強勁成長18%,2016年成長19%。根據OSD報告的預測,感測器和致動器的全球銷售額預計將在2019年成長約5%,分別達到96億美元和58億美元。
2018年(122億美元)的感測器和致動器銷售額中約有83%來自採用微機電系統(MEMS)技術製造的半導體。MEMS用於壓力感測器(包括麥克風)、加速度計、陀螺儀和幾乎所有致動器。2019年的OSD報告表示,基於MEMS的感測器和致動器銷售額在2018年成長了6%,2017年成長18%,2016年成長15%。根據IC Insights的報告,預計基於MEMS的感測器/致動器銷售額將在2019年成長約5%,達到創紀錄的128億美元,其次是2020年經濟疲軟成長3%。
歷時僅18個月 PCIe Gen5標準正式釋出
負責主導PCI Express(PCIe)標準制定的產業標準組織PCI-SIG,在台北國際電腦展期間正式宣布,PCIe Gen5標準已經制定完成,相關文件已開放所有成員下載。據了解,多家台灣IC設計業者均已取得PCIe Gen5的完整規格書,許多晶片大廠也已經宣布,日後將推出支援PCIe Gen5的運算平台。
PCI-SIG主席暨總裁Al Yanes表示,許多新興應用,例如機器學習、超級電腦等,對資料傳輸介面的性能需求十分迫切,促使PCI-SIG以破紀錄的速度完成PCIe Gen5的標準制定作業。整個PCIe Gen5的標準制定只花了18個月。Yanes相信,PCIe架構在可預見的未來,將維持其高性能I/O的事實標準(Defacto Standard)地位,廣獲產業支持。
事實上,在標準正式釋出隔天,就有多家台灣IC設計業者已經拿到完整規格書,但由於PCIe Gen5在短期內的應用料將局限在高階伺服器、資料中心交換器等市場,因此台系IC設計業者目前對PCIe Gen5的產品時程規畫,多半仍不明朗。但即便如此,矽智財(IP)供應商如新思(Synopsys)、益華(Cadence)的業務開發團隊,仍與許多台系IC設計業者保持密切接觸。
相較之下,國際晶片大廠對PCIe Gen5的支持態度就明確很多。除了超微(AMD)、英特爾(Intel)之外,安謀(ARM)架構陣營的Marvell也已表態,未來將會推出支援PCIe Gen5的處理器。此外,Diodes、愛普生(Epson)、芯科實驗室(SiliconLabs)等晶片業者,以及太克(Tektronix)、Lecroy等儀器商,也都將推出PCIe Gen5的對應解決方案。
與PCIe Gen4相比,Gen5最大的突破在於將傳輸速度從16GT/s拉高到32GT/s,最大頻寬為64GB/s(在16通道配置下),並在連接器的機構跟電氣特性上做了些許改進,以確保傳輸效能可達到Gen5要求的標準。此外,PCIe Gen5也支援更多的標籤類型。但PCIe Gen5仍將維持一貫的向前相容特性,可和現有的PCIe Gen4、Gen3甚至更早之前的標準版本相容,以保護使用者在既有週邊上的投資。
PCI-SIG預計在台北時間6月19日清晨於加州Santa Clara舉辦PCI-SIG美國開發者大會,屆時將會詳細介紹最新的PCIe Gen5標準以及PCI-SIG未來的技術發展路線圖。












