AI
上帝視角多元應用夯 無人機開拓產業智慧化新機
網路上有一個很夯的Youtube影片,是日本新婚夫妻去環遊蜜月400天時,用空拍機拍下6大洲48個國家的影片,獨特的上帝視角讓人驚艷不已;但看過電影《全面攻佔3:天使救援》的人,一定也會被一群無人機對美國總統發動攻擊的畫面驚嚇不已。
近幾年掀起熱潮的無人機,跟許多科技工具的演進一樣,一直受到不同的正負面評價,不過,隨著交通部民航局制訂的「遙控無人機管理規則」於3月底正式上路,包括空域、註冊、考照、投保等都有明確規範,讓無人機產業有了可遵守的遊戲規則,不僅玩家躍躍欲試,產業應用也是蓄勢待發。
圖1 2014~2025年美國商用無人機各應用類別的市場規模
資料來源:www.grandviewresearch.com
無人機積極扮演科技救災關鍵角色
進入後疫情時代,屬於非接觸應用的無人機被視為關鍵的數位新科技,在工研院擘畫的「2030技術策略與藍圖」中,無人機結合人工智慧(AI),已被列為三大應用領域之中「智慧生活」的重要一環,不管是空拍、競速、表演等消費性應用,或者農藥噴灑、建築工程、急難救災、智慧農業、安防巡檢等產業應用,都有令人期待的發展潛力。
在許多無人機的活動中,都會聽到「上帝視角」這個字眼,過去如果要從上空俯瞰地面進行國土測繪或災害管理,必須耗費相當的費用與人力出動直升機,但現在有了便捷的無人機,只要靠著專業飛手遙控無人機,就能透過上帝視角掌握空拍景象,以低成本、低風險的方式,創造出多元的應用場景。
舉例來說,近幾年在台灣發生的重大災害事件,包括2018年花蓮大地震、普悠瑪事故、2019年南方澳大橋斷裂等,翔隆航太就與科技部國家實驗研究院緊密合作,第一時間親上火線,運用無人機協助進行災難現場航空測量勘災、三維建模保存,在短短2~3個小時就能完成資料蒐集與分析,協助現場指揮官進行救援決策,有效提升第一線救災人員的生命安全。
在面對山崩、地震、水患、山區迷途受困、岸際釣客落海等狀況需要科技救災時,無人機不僅可以空拍,還能搭配不同酬載系統提供不同功能,例如夜間時可以搭配緊急照明、水域中可採用紅外線顯像儀、另可搭配語音擴音、救生吊掛、繩索牽引、醫療物資投放等功能。此外,無人機具備精準定位系統,也能協助蒐集各種災害狀況資料數據,用以分析災害程度與環境變化,作為未來災害防範與監控的重要依據。
助力智慧農業/智慧巡檢有一套
近幾年台灣有不少商用無人機新創公司成立,分別切入不同應用領域,其中農用無人機已為智慧農業帶來新面貌。台灣農村長期以來面臨人力短缺的問題,但現在有了無人機,透過精準定位與數據管理,可協助農民噴灑農藥或訓練農友自行操控。以擎壤科技為例,其統計可降低一半的農藥用量,且增加作業速度達30倍,過去傳統人力噴藥一分田需要一小時,利用無人機只要三分鐘即可完成。
圖2 小型無人機功能與應用產業 資料來源:MIC
此外,農用無人機也可進行AI農損即時辨識。中興大學AIPal團隊就開發出一套系統,透過空拍影像的標籤化與訓練大量水稻倒伏影像,建立AI影像辨識模型及深度學習架構,無人機在空拍時即可透過機上的微型電腦進行邊緣運算,辨識出稻田倒伏區並計算農損範圍,其辨識率超過9成,原本需要數十天的作業時間,可大幅縮短到幾個小時就能完成。
在安防巡檢方面,無人機可以成為保全業的重要幫手,與原有警勤作業相互搭配,達到全天候無間斷的安全巡檢及防護,彌補傳統人力不足或傳統監控有死角的問題。以中光電智能機器人公司為例,其研發之全自主巡警無人機系統,已經導入銅鑼科學園區進行場域驗證,可依據管理需求及預先設定的飛行任務,進行自動起飛、巡檢、降落及充電等作業,除了展開例行巡檢外,還可進行異常車輛辨識、施工進度確認、熱感應偵測、遠端即時監控及異常事件機動派遣等任務。
在去年的貢寮海洋音樂祭,新北市政府警察局也與中光電智能機器人合作,推出全台第一輛車載式無人機系統,以自動排程飛行,全程毋須飛手操作,每小時可巡查龍門吊橋至東興宮之3公里區域範圍,並將即時影像回傳到現場指揮中心,用來掌握現場活動狀況,瞭解是否有民眾擅闖管制區,並進行安全監控、蒐證及車流管理等工作。
無人機共享經濟方興未艾
看完上述的無人機產業案例,讀者覺得無人機像什麼?許多飛手都說,無人機像是老鷹一樣,擁有犀利眼睛、快狠準的行動能力,平常在高空盤旋、俯瞰地面,必要時才採取行動、精準達成目標。
整體來說,當前無人機的主要應用,多半是在解決特定產業或使用情境的痛點,讓無人機搭配AI、數據管理進行自動化、高效能且精準的作業流程;不過,無人機的使用門檻終究偏高,如果要讓更多消費者願意接觸無人機,帶動無人機的快速普及,業界恐怕要發展更多以用戶視角為出發的生活應用,不能只是一味採取上帝視角、由上而下的提供開發者覺得消費者需要的產品或服務。
舉例來說,現在許多零售業與物流業,正在積極開發無人機送貨的服務,可以想像的是,只要可以解決精準定位、續航力、隱私權等問題,在不久的將來,無人機有機會取代現在滿街跑的美食外送、宅配物流車,直接將披薩、咖啡熱騰騰的空運到消費者手中。
另外一個很有趣的例子是,羽渡科技開發出應用於觀光旅遊產業的GoDrone共享無人機營運方案,可由旅遊景點業者、旅行社與旅遊通路業者進行建置,讓任何來訪的遊客使用手機免費App即時取得授權使用「隨叫即用」的無人機召喚空拍服務,讓旅客不用自行購置無人機,即可租借平台上開放的空拍機取得空拍視訊畫面影像、留下特殊回憶。
羽渡科技採用的是「純軟體定義無人機召用服務」(Software-Defined Drone-as-a-Service, SD-DaaS),結合了雲端運算、人工智慧、資安授權、場域管理、即時自動技術,協助中小企業或社區團體輕鬆合法取得最新的無人機科技,除了用於旅遊景點空拍,也可擴展到運動賽事、戶外休閒、農產觀光等應用場域。如果市場上出現愈來愈多類似這樣的B2B2C解決方案,便有機會拉近消費者與無人機的距離,成為智慧生活的日常。
台積電7nm生產超過10億個裸晶 6nm已進入量產
台積電於2018年4月投入7nm製程量產,目前已經生產10億個品質良好的裸晶,提供數十個客戶應用在超過百種產品中。這些矽的數量足以覆蓋超過13個曼哈頓市區,且每個晶片都具有10億個電晶體,代表總共有超過500億的7nm電晶體。
台積電7nm生產超過10億個裸晶,應用在多元場景 (圖片來源:台積電)
做為首家實現7nm製程的晶圓廠,台積電為了提升良率,在生產設備上廣泛布署感測器,蒐集有價值的數據,並以人工智慧(AI)及機器學習(ML)分析數據,將數據轉化為可以改善製程的資料。基於部分客戶對駕駛輔助系統(ADAS)與自動駕駛的需求,台積電進一步把關晶圓的品質,以符合車用電子的安全規範,並在2019年將車規系統布署到7nm製程中。
此外,台積電在7nm製程時期推出極紫外光刻(EUV)技術,短波長的EUV光線可以協助打印先進製程所需的奈米極細節,成為率先將EUV投入7nm技術的廠商。同時,7nm技術拓展到6nm製程,並已採用EUV進行量產。6nm技術拉高20%的邏輯閘密度(Logic Density),並且與7nm版本完全相容,有助於提高成本效益。
過去只有少數的應用,如PC處理器、影像處理器、FPGA需要使用最新科技,但是智慧型手機的問世,創造更多的晶片應用,再加上雲端運算與AI的發展快速,相關的晶片需求便隨之增加。目前台積電的7nm技術除了用在PC、平板、手機中,同時應用在資料中心、自駕車與複雜的AI訓練/推論。加上5G基礎建設的布建穩定後,藉由網路傳輸大量數據的需求將會提升,帶動數據處理晶片的市場發展。
支援AI推論/視訊轉換 OCP多節點伺服器擴大功效
由於亞馬遜(Amazon)、微軟(Microsoft)乃至Google、臉書(Facebook)等業者的雲端資料中心營運規模不斷成長,因而出現了超規模資料中心(Hyperscale Datacenter)一詞,同時在機房設備達更大的裝配量時,傳統19吋寬的機架機櫃與伺服器,在容積密度、散熱用電等營運面的經濟性表現,已逐漸難滿足業者之需。
為了滿足「超規模」的更經濟需求,Facebook於2011年發起開放運算專案(Open Compute Project, OCP)並鼓勵各方加入,期透過解構與再建構的方式,訂立出更具經濟性的機房技術規格與標準,並要求設備商依循新標準實現與交付設備。
OCP提出後相繼有重量級業者加入,如Microsoft、Google;我國的主要伺服器代工業者如廣達、緯穎、神通亦有提案貢獻;對岸則有浪潮集團等。OCP已有的規格提案及發展包含伺服器(Open Rack)、夾層卡(Mezzanine Card)、高效能運算(HPC)等,而OCP的會員組織茁壯後也開始舉辦OCP Global Summit年會。
多節點伺服器來由
OCP制訂的規格標準中以Open Rack為首要重點,Open Rack主張改行21吋寬的機架,以提升機櫃氣流度;並在設備的供電上改行12V/48V直流電,以減少電能耗損;Open Rack在機架高度上改行OpenU/OU(4.8公分),有別於傳統機架的U(1.75吋/4.45公分)。
OCP在伺服器的構型(Form Factor)尺寸上也無意遵循傳統機架伺服器的扁平1U、2U作法,而是在2OU高度的空間內縱向切出三等分,以放置3部伺服器(圖1)。雖然OCP機架空間略增,但卻能比傳統19吋機架多放置一部伺服器,傳統機架伺服器在2U空間內只能放置2部1U高度的扁平伺服器。
圖1 OCP Yosemite在21吋、2OU高度空間內切分出三等分托座
在完成OCP標準的伺服器規格後,傳統機架伺服器陣營開始從刀鋒伺服器(Blade Server)衍生出多節點(Multi-Node)伺服器,Multi-Node伺服器在2U空間內縱向切出四等分,以放置4部伺服器,俗稱2U4N,4N即4個節點之意,一部伺服器視同一個節點。
Multi-Node伺服器與刀鋒伺服器均具有較傳統1U、2U標準機架伺服器更高的放置密度,但卻省去刀鋒伺服器的底座(Chassis,或稱Enclosure)倚賴或降低倚賴,密度表現上則介於標準機架伺服器與刀鋒伺服器間,因而逐漸受歡迎。
Multi-Node的出現也影響了OCP陣營,2015年3月OCP Global Summit上也宣布發展自己的Multi-Node伺服器標準,代號優勝美地(Yosemite,為美國加州一處國家公園)。
Yosemite在每一個三等分的空間(每一等分稱為一個Sled,橫置的3個Sled稱為一個Cubby)內可放置4片伺服器卡,或稱為系統單晶片卡(SoC Card),或微型伺服器卡(Micro-Server Card),如此相同空間內從3部伺服器提升成12部(圖2)。
圖2 OCP Yosemite每一托座可水平前後放置4張伺服器卡,每張卡接1顆(1-Socket, 1S)伺服器處理器
Yosemite第二版
Yosemite伺服器發表後的2年,OCP在2017年OCP Global Summit上宣布Yosemite標準改版,即Yosemite v2,隨Yosemite...
訊連/威強電/世平/英特爾攜手舉辦AI防疫應用研討會
訊連科技宣布與威強電工業電腦、大聯大世平集團及英特爾攜手合作進軍智慧辨識領域,將於2020年8月27日共同舉辦「後疫情時代、讓AI罩顧你」線上研討會,於會中分享採用IntelOpenVINO及Movidius技術打造的多樣化AI智慧辨識應用,以及後疫情時代口罩偵測、身分辨識及體溫量測等多種解決方案。
今年隨著COVID-19疫情肆虐全球,人們防疫及健康意識抬頭,配戴口罩、量測體溫已是進出公共場所不可或缺的防疫SOP。借助先進的AI影像辨識技術,可讓口罩偵測、身份辨識及體溫偵測等健康量測之流程自動化,大幅減少接觸的風險。訊連、威強電及世平集團均為英特爾物聯網解決方案聯盟(Intel IoT Solution Alliance)的會員,將於本活動中,介紹針對Intel物聯網平台設計之軟、硬整合解決方案,提供用戶一站式的防疫健康偵測建置。
於本研討會中,訊連將介紹全新之FaceMe Health及FaceMe Security解決方案,可於後防疫時代提供口罩辨識、戴口罩時的臉部辨識以及整合熱感應攝影機進行進出人員體溫量測。搭配威強電之AI嵌入式系統系列產品,如採用Intel Core處理器,支援OpenVINO邏輯推理引擎之工業電腦,及採用Intel Movidius Vision Processing Unit、擁有多樣規格、小尺寸、低功耗優勢之Mustang系列加速卡,於輕量化之邊緣運算裝置上,建置身分認證、口罩偵測等智慧辨識應用。世平集團是英特爾物聯網解決方案聚合商,可提供最多樣化的英特爾物聯網解決方案,為系統整合商及各式終端用戶架起端到端應用的橋樑。
戴樂格宣布EcoXiP NVM與瑞薩RZ/A2M MPU相容
英商戴樂格半導體(Dialog Semiconductor)日前宣布經由最近收購Adesto Technologies而納入Dialog產品組合的EcoXiP Octal xSPI非揮發性儲存器(NVM),已最佳化可與瑞薩電子(Renesas)基於Arm的RZ/A2M微處理器(MPU)一起使用。RZ/A2M專為智慧型電器、服務機器人和工業機械中的嵌入式AI影像高速處理而設計。
針對內建瑞薩MPU的系統,EcoXiP可以實現即時啟動功能(Instant-On)快速開機,以及即時系統回應能力。它還為低功耗AI推論提供了有效率的AI權重儲存。此外,EcoXiP使RZ/A2M等MPU可以在就地執行(XiP)模式下運行,以直接從外部快閃記憶體執行程式碼。
瑞薩基礎設施業務部副總裁Shigeki Kato表示,借助瑞薩動態可重配置處理器(DRP)技術的RZ/A2M MPU,我們將即時、低功耗影像處理帶到了IoT終端。我們很高興迎接Dialog的EcoXiP設備加入圍繞我們MPU的生態系統。
Dialog工業事業部門技術長Gideon Intrater表示,瑞薩透過RZ/A2M滿足對更強大的處理和即時操作的需求,以在IoT端點中實現嵌入式AI影像。作為外部快閃記憶體夥伴,EcoXiP為結合AI影像的各種新興物聯網應用提供了效能和功耗優勢之間的平衡。
EcoXiP是首批支援擴展串列周邊設備介面(xSPI)通訊協議的NOR Flash設備之一,並具有同步讀寫(RWW)功能,實現更高的傳輸速率和更低的快閃記憶體遲延,提供在無線韌體更新和數據記錄明顯的優勢。EcoXiP免除了在各種新興應用中對昂貴的內建嵌入式快閃記憶體的需求,並在功耗,系統成本和效能方面達到了最佳平衡點。
愛德萬結盟PDF Solutions 打造Advantest Cloud
愛德萬測試(Advantest Corporation)與PDF Solutions宣布建立夥伴關係,合作內容如下:雙方簽訂開發協議,以PDF Exensio軟體分析平台為基礎,建立由Exensio驅動的愛德萬測試雲(Advantest Cloud),供愛德萬公司內部和外部客戶使用;雙方簽訂商業協議,為愛德萬測試平台和PDF Exensio平台提供技術授權;愛德萬向PDF Exensio分析平台簽訂五年期雲端訂閱合約;愛德萬以6,520萬美元左右金額,收購PDF增發普通股3,306,924股。
PDF的雲端大數據分析平台Exensio,橫跨整個半導體價值鏈光譜,從IC設計到晶圓製造、分類、封裝、最終測試和系統級測試皆涵蓋其中,管控上萬組工具以加速產品上市、擴大產能,並提升利潤、產品可靠度與品質。隨著半導體產業朝向更先進的元件持續精進,PDF軟體平台提供的大數據分析服務,包括善用AI與機器學習(Machine Learning, ML),已成為先進製程節點達成產能目標的關鍵,藉此確保元件品質並節省測試與量測成本。
重點是,當半導體業者採用分散式供應鏈來製造、測試與封裝晶片,PDF Exensio平台與資料交換網路(Data Exchange Network, DEX)能為半導體工程師連接起橫跨半導體價值鏈的自動化測試設備(Automated Test Equipment, ATE),推動重要設計並產生製造分析,藉此降低測試成本、提升效能/產能。
愛德萬透過自家先進測試設備將PDF Exensio平台與DEX結合起來,如此一來,無論客戶處於半導體價值鏈的哪一段,都能為他們提供連線、測試、量測與分析能力,幫助他們提升產能、降低測試成本。此次合作也進一步凸顯愛德萬期盼將測試與量測解決方案推往整體半導體價值鏈的決心,並在愛德萬「宏觀設計」願景中寫下重要的里程碑。
所羅門參加台北自動化展 展出智慧物流分揀與包裝方案
2020臺北國際自動化工業大展將於8月19日至22日在南港展覽館舉行!看好人工智慧(AI)發展與自動化需求,所羅門集團將聚焦智慧物流、智慧製造兩大主題,與其他合作夥伴聯合展出16個視覺應用項目,包括智慧物流、焊道檢測、智能化打磨與檢測等。
所羅門指出,許多倉儲、發貨中心已全面啟動自動化,唯獨在分揀流程仍高度依賴人力運作。所羅門自主研發的智慧物流解決方案,透過AI 3D視覺與深度學習,賦予機器人感知能力,如同裝上眼睛與大腦,讓機器人突破使用限制,即便商品隨機推放,機器人依舊不需事先學習即能成功辨識上千萬種商品包裝、物流箱等物件,因此相當適用物流業的分揀作業。
此外,這套系統還能教會機器人根據訂單內容,即時量測所有商品品項的材積,因此無論是為客戶訂單找尋最合適大小的包裝紙箱,或是將物流箱內排列空間使用到極致,都能幫客戶找到空間利用的最佳化解決方案,為業者省下包材與運費成本。
所羅門的AI-3D視覺系統是目前市面上品牌相容度最高的系統,可支援20家以上國際機械手臂品牌及主要PLC廠牌,客戶涵蓋全球500大企業。卓越的研發能力,讓所羅門連續獲得三屆台灣精品獎、連續兩年世界性工業視覺獎(Vision Systems Design),最近剛結束的中國視覺展Vision China,也拿下視覺領域創新金獎。今年首度報名德國紅點設計大獎,簡潔直觀的圖形化介面獲得評審團激賞,榮獲其中的頂級獎項最佳設計獎(Best Of The Best)。
安提國際發表NVIDIA Turing系列 加速精確繪圖運算
GPGPU和邊緣運算解決方案供應商安提國際發布NVIDIA Quadro嵌入式解決方案,未來將發售一系列Quadro Turing架構的MXM圖形模組,以GPU解決方案協助客戶完成良好的產品應用。Quadro為NVIDIA顯示卡中適用於工作站、電腦輔助設計、電腦成像、數位內容打造、科學運算和機器學習的方案,在各式工業用繪圖、成像及人工智慧領域的應用方面,Quadro系列產品能夠符合應用場域的需求與期待。
Quadro Turing架構的MXM圖形模組,以GPU解決方案協助客戶完成良好的產品應用 (來源:安提國際)
Quadro MXM產品中,安提將會提供三種Quadro Turing架構GPU的MXM,包括以Quadro T1000打造的M3T1000-PN、Quadro RTX3000打造的M3T3000-QN,以及Quadro RTX5000打造的M3T5000-WN。這次的MXM系列將提供3,072個CUDA運算核心與9.4TFLOPS的運算效能,能夠達成多數工業用與專業繪圖設計的需求。同時,顯示卡提供四個顯示閘口,支援高動態範圍成像(HDR)影片、解析度8K 60Hz的高品質成像。提供使用者在工作上的視覺體驗,其繪圖運算能力更能夠提供符合需求且精確的資料分析。
安提的顯示卡以精小、緊湊的設計為主,以利在各種應用情境中,能夠彈性部署在尺寸、重量與功耗(SWaP)皆有所要求的嵌入式系統,尤其適合應用在極需精確影像呈現與高度運算工作量的醫療與遊戲產業。Quadro MXM系列皆以Turing架構為主,為高效能的視覺運算的資料中心所打造。其中配備有NVIDIA Turing架構的Quadro RTX系列,支援即時光線追蹤,展現真實的光線移動、影子變化、光線倒影成像等,也可以及時提供電影品質的渲染效果。RTX Turing GPU的特色在於著色技術上的進展,相較於過去的架構,帶來更強大、彈性的效能。
Quadro RTX Turing系列也支援深度學習超高取樣技術(DLSS),通用於各式人工智慧技術的深度學習訓練。Tensor核心則可讓使用Tensor Float 32的AI訓練獲得10倍加速效能、使用FP64的高效能運算提升2.5倍,帶來更良好的人工智慧訓練、推論以及繪圖運算能量。
專訪耐能智慧創辦人暨執行長劉峻誠 KNEO共享平台劍指Edge AI Net
AI發展持續落地,尤其是Edge AI呈現百花齊放的狀況,各式各樣的物聯網終端應用持續導入AI,Kneron創辦人暨執行長劉峻誠表示,該公司從2015年成立以來秉持普及AI的信念,並以構建終端AI網路為目標。推出KNEO平台,將以App Store的形式對產業開放,使用者可自行開發AI應用並上傳至該平台,或下載其他人的AI應用後再進行改良,實踐AI everywhere的願景。
Kneron創辦人暨執行長劉峻誠表示,KNEO平台將以App Store的形式對產業開放,使用者可自行開發AI應用並上傳,實踐AI everywhere的願景
以KNEO平台中的Kneo Stem AI USB加速棒為例,該產品內建耐能KL520 AI晶片,僅靠KNEO Stem驅動AI軟體,即可具備AI功能,只要把KNEO Stem插入單板計算機Raspberry Pi的USB埠,即可執行如執行物件偵測、人數統計、辦別年齡、性別,和透過攝影機輸入的數據進行人臉識別。
此外,KNEO Stem可促進不同感測器之間的通訊,把Raspberry Pi連接兩個KNEO Stem,一個連接到門鎖,另一個連接到安全攝影機,當兩個人先後接近門鎖時,與門鎖相連的KNEO Stem會辨別出第一人的臉是該鎖的授權使用者;與此同時,與安全攝影機連接的KNEO Stem同時偵測到門前有兩個人,而第二人並沒有授權進入。透過KNEO Stem的聯合智慧,安全攝影機和門鎖進行通訊,以識別門前出現異常並發出警告。
劉峻誠強調,Kneron的晶片設計架構就像是樂高積木,具備「可重組式人工智慧神經網路技術」,會根據不同任務進行重組,減少運算複雜度,在不同的卷積神經網路模型的使用上,無論是模型內核(Kernel)大小、模型規模,還是影像輸入大小的變化,都能保持高效率使用運算(MAC)單元。
開放不等於免費 CPU客製化必須穩紮穩打
為滿足人工智慧(AI)、物聯網(IoT)、邊緣運算等應用對運算效能的需求,許多晶片供應商都開始探索使用客製化CPU的可能性,盼藉由專為執行某些特定運算任務所設計的指令集跟執行邏輯,來提高運算效能。但魚與熊掌往往難以兼得,這些專為某類運算任務設計的特殊CPU,必然會犧牲其泛用性,與現有應用軟體的相容性問題,也必須審慎應對。
大廠導入RISC-V 小心翼翼試水溫
因此,即便RISC-V這類開放架構CPU廣受業界矚目,採用RISC-V核心的SoC或處理器設計案例數量也快速成長,但若更深入研究RISC-V在這些SoC或處理器中所扮演的角色,就會發現目前RISC-V的應用領域,還是高度集中在不太需要顧慮第三方軟體相容性的範疇。
舉例來說,繪圖晶片(GPU)大廠NVIDIA的GPU晶片內,除了負責執行圖形運算的各種著色器(Shader)之外,還有許多晶片內部的控制跟協調作業需求,必須靠嵌入式CPU來執行。為此,NVIDIA早在十多年前就開始自行發展RISC指令集,並以此設計出自家專用的嵌入式CPU,負責GPU內部的管理跟控制任務。
但經過十多年後,NVIDIA內部的研發團隊認為,已經很難再靠改良現有指令集架構的方法來滿足新的需求,因此,該公司決定發展全新架構,以提供更高的性能。具體來說,新一代嵌入式CPU至少要提供比現有CPU高一倍的效能、支援64位元記憶體定址、快取與高速記憶體等。
經過評估之後,NVIDIA發現,目前市場上的主流CPU核心,還是沒辦法滿足其需求,所以又走回了自行開發的老路。不過,與十多年前NVIDIA必須自己從指令集架構開始發展的情況不同,這次NVIDIA可以用RISC-V指令集架構作為設計起點,來開發新一代CPU,取代已經使用十多年的老CPU。
2016年時,NVIDIA先採用柏克萊大學發展出來的RISC-V處理器Rocket,開發出第一代基於RISC-V的Falcon控制器,在9項客製CPU設計要求中,已能符合7項功能規格。到了2017年,NVIDIA改用自己設計的RISC-V處理器版本,發展出第二代Falcon控制器。
第二代Falcon控制器使用了64位元RISC-V指令集來設計,並根據自身需求,決定需要使用哪些指令,也加入自己的專用指令集,來對CPU設計進行最佳化。第二代Falcon不只滿足所有技術需求,而且效能更好,也幫助他們降低成本,就是因為採用開源設計。
三星電子(Samsung)採用RISC-V的情況也類似。三星早在2017年就已經開發出第一款內建RISC-V核心的晶片,經過三年多的設計迭代,該公司在2019年的RISC-V高峰會上,正式發表了第一款內建SiFive RISC-V核心的5G毫米波前端模組,接下來三星還有意在AI影像感測器、安全管理晶片與AI運算控制器等晶片中導入RISC-V。在5G毫米波前端這款解決方案中,RISC-V核心負責的任務是訊號處理,而非標準CPU所擅長的控制任務。這顯示RISC-V在某種程度上,可以靠著DSP延伸指令集這項擴充能力,取代某些原本要靠數位訊號處理器(DSP)實現的應用。雖然三星並未揭露未來RISC-V在影像感測器中所扮演的角色,但考量到影像感測器就跟5G射頻前端一樣,會有大量的訊號處理任務需求,可以合理推論,RISC-V應該會扮演某種接近DSP的角色。
除了在處理器、SoC內部扮演微控制器或訊號處理器的角色外,儲存相關應用採用RISC-V的速度也相當快。除了威騰(Western Digital, WD)對RISC-V全力相挺,發展出三款基於RISC-V指令集的核心(表1),主要應用在NAND Flash控制器上之外,晶心科技技術長蘇泓萌透露,台灣某SSD控制器大廠的控制器晶片,也已經內建晶心提供的RISC-V核心。
從NVIDIA、三星,以及威騰等NAND Flash控制器的實際應用案例,不難看出這兩家大廠導入RISC-V的過程,是經過深思熟慮的。不管是GPU內部的控制任務,或是5G毫米波前端,其運作所涉及的軟體都是韌體,晶片開發者對此有完全的掌控能力。也因為晶片開發商可以一手掌控,不太需要考慮第三方軟體、應用在客製化CPU上執行的相容問題,所以晶片開發商可以大膽採用自己客製化發展的CPU硬體架構,以功率、效能與晶片面積(Power, Performance, Area)的極致最佳化為設計目標。
在通用處理器或主處理器方面,目前真的採用RISC-V的知名案例並不多見,僅阿里巴巴旗下平頭哥半導體所發表的玄鐵910,是基於RISC-V指令集架構所開發出來的通用處理器。對RISC-V陣營來說,玄鐵910的問世,固然有其里程碑的意義,但從玄鐵910的規格跟性能測試結果來看,跟Arm及x86陣營相比,還是有一段明顯的差距,在軟體、開發工具支援方面,要跟Arm、x86相比,也還有一段不小的距離。
指令集客製不難 難在維繫生態系完整
面對AI、IoT應用開枝散葉,相關應用開發快速且項目多元,標榜使用者可以自行客製化設計的RISC-V乘著這波風潮,在市場上來勢洶洶,作為嵌入式處理器IP龍頭的Arm,又如何看待?
Arm應用工程總監徐達勇(圖1)表示,AI、IoT應用無所不在,確實導致市場上出現許多標準CPU指令集不容易照顧到的新應用、新需求。這些新應用很符合商學教科書上所提到的「長尾理論」--個別應用的市場規模或許不大,但累積起來也是一個相當可觀的市場。對Arm來說,如何滿足這類應用的需求,自然是一個必須思考的問題,而Arm所提出的回應,就是在標準指令集之外,開放晶片開發者在共通的框架、格式規定下,進行客製化的指令集定義。
圖1 Arm應用工程總監徐達勇
事實上,客製化指令集在技術層面並不困難,但Arm直到2019年10月才推出Arm Custom Instruction(ACI),是因為有許多技術以外的考量。例如CPU硬體加上客製化指令之後,編譯器(Compiler)、除錯工具(Debugger)等開發工具,以及處理器上執行的軟體等生態系統的配套,能不能支援開發者自己定義的客製化指令,就是一個大問題。客製化指令立意雖好,但實際上使用者/客戶並不多,而且大多是有雄厚研發資源的大廠,因為客戶必須要有定義指令的能力,並自行克服軟體破碎的問題。
經過審慎思考後,Arm決定在其現有架構中,開放部分客製化指令集,滿足客戶彈性修改CPU指令集設計的需求,但客製化必須符合Arm預先定義好的規範,以避免編譯器、除錯工具無法理解這些開發者自訂義的指令。Arm認為,這是兼顧設計者需求與生態系完整的兩全對策。
SSD控制器便是一個對客製化指令需求很高的應用,因為SSD控制器所做的工作重複性很高,但這些工作卻往往得用到許多條標準指令才能完成,導致CPU經常耗費大量資源在抓取指令(Fetch)上。若能將常用的多條指令整合成一條客製化指令,如圖2,便能加快記憶體存取、編譯與寫入的速度,不只能減少指令執行時所占用的記憶體,也能進一步縮小晶片的尺寸、降低功耗。這是客製化指令對某些客戶非常有吸引力的主要原因之一。
圖2 客製化指令集的基本概念與優劣勢
但客製化之後的指令,必須確保編譯器或除錯工具的夠解譯,否則後面的應用產品開發將無法繼續進行下去。為了避免這種情況發生,相關工具配套必須先到位,或是晶片設計者必須自行備妥這些工具。
天底下沒有白吃的午餐,雖然開源常被跟免費畫上等號,但開源絕不等於免費。光是一套完善、成熟的開發工具,就需要投入大量人力進行研發跟維護,這很難是完全免費的。此外,即便是使用RISC-V這類開源架構設計晶片,仍會有工程開發成本,並且承擔市場風險。如果進行成本精算,開發者的總成本不一定會比取得現成的IP授權來得低。
大廠競相投入RISC-V 背後有其戰略用意
SiFive總裁暨執行長Naveed Sherwani對最近幾年RISC-V廣獲業界矚目,聲勢一路看漲的現象,也有一番值得思考見解。他認為,就技術層面來說,RISC-V的自由與彈性,確實是讓不少大廠對RISC-V產生興趣的原因。但RISC-V能有今天一片欣欣向榮的景象,連帶讓SiFive在短短幾年內就累積超過350個設計定案(Tape Out)的實績,且委託客戶不乏一線科技大廠,關鍵還是在每家廠商想要有與眾不同的產品。
標準CPU還是有其存在的價值,不會所有人都需要客製化的CPU,但如果是對自家產品有長遠發展規畫的大廠,最後一定會考慮在CPU裡面添加自訂義的元素,因為這會讓終端產品出現明顯差異化,進而凸顯自己的品牌色彩。蘋果(Apple)、Google、Facebook、Tesla等大廠都自行為特定應用設計專用的SoC,原因也就在此。
其次,既有的CPU架構在應對AI、IoT所帶來的多樣化需求時,確實有些力有未逮之處。不是現有CPU架構無法實現這些應用,而是在效率面、成本面還有很多改善空間。RISC-V填補了這些缺口,進而讓很多本來採用標準CPU架構,甚至是像英特爾(Intel)、Microchip這些本身就擁有自定義CPU架構的供應商,願意在RISC-V上投入資源。
最後,沒有任何一家廠商或是國家,會樂於見到單一技術供應商擁有市場壟斷地位,因為這會帶來許多風險。先不提新興國家的政府或科技企業對此會有疑慮,即便是美國的科技公司,也會想在既有的主流技術之外,扶植新的供應商與其抗衡。在這個時間點上,RISC-V成為一個頗具潛力的替代方案,且因為RISC-V是開源硬體,沒有權利金、授權費的問題,對大廠來說,只要投入少許資源,就能探索新的機會跟可能性,何樂而不為?
總結來說,RISC-V社群能在短時間內如此蓬勃發展,背後不只有單一原因。有發展潛力的技術、AI及IoT等應用趨勢凸顯出標準CPU架構的問題,加上各家廠商與各國政府分散風險的戰略考量,都促成RISC-V爆紅。