- Advertisement -
首頁 市場話題 ACAP平台彈性/智慧高 Xilinx轉型全面擁抱AI

ACAP平台彈性/智慧高 Xilinx轉型全面擁抱AI

- Advertisement -

2012年的ImageNet機器學習影像辨識學術競賽,被喻為是正式掀起這一波人工智慧(Artificial Intelligence, AI)浪潮的關鍵活動之一,GPU平行運算架構在圖形辨識上的高效能,讓深度學習網路可以大幅增加層數,以提升影像辨識準確率;也旋即於2015年以3.57%的錯誤率超越人眼,揭開AI產業化與產業AI化的大門,運算平台除了近期超熱門的GPU之外,CPU、FPGA與新興的神經網路處理器(NPU),更亟欲搶占AI深度學習網路運算與推論市場大餅。

人工智慧發展全面展開,可編程邏輯廠商美商賽靈思(Xilinx)認為,未來已經沒有一個架構可以滿足所有的應用需求,因此該公司正式踏上轉型之路,2018年3月啟動策略轉型工作,宣示從元件廠商轉型為平台廠商,提出自行調適運算加速平台(Adaptive Compute Acceleration Platform, ACAP),並舉辦賽靈思開發者大會(XDF),發表未來幾年的技術與產品重點,全面擁抱人工智慧的發展趨勢,以資料中心(Data Center)為發展策略的起點,目標為打造靈活應變、萬物智慧的世界。

自行調適/運算加速/平台化策略

多年來以可編程邏輯元件技術立足產業的Xilinx,為了在AI的創新浪潮中注入下一波成長動能,啟動成立以來最大規模的轉型工程,Xilinx總裁暨執行長Victor Peng(圖1)表示,在AI無所不在的時代,相關應用日新月異,晶片設計週期已經落後創新的速度,FPGA彈性的特點則可以應用在AI的創新上。目前一般新晶片設計週期高達24個月,透過ACAP平台的協助,可將AI模型加以拆解,變成數個不同的發展(Develop)、優化(Optimize)、部署(Deploy)流程,該平台動態範圍廣泛彈性,可針對不同的應用調整需要的加速範圍。

圖1 Xilinx總裁暨執行長Victor Peng表示,該公司自行調適運算加速平台ACAP目標為打造靈活應變、萬物智慧的世界。

因此Xilinx未來不再是元件供應商,而是平台化解決方案開發與供應商。而資料爆炸、AI興起、摩爾定律放緩,顛覆了原有的市場和業務,Peng認為,平台策略在這樣的大環境下中也就顯得更加重要,系統和基礎設施在全球迅速擴張,對於運算能力和頻寬也有了前所未有的要求。同時,也要更加迅速地滿足不斷變化的要求和標準。就像自然界「物競天擇,適者生存」的自然法則一樣,在數位世界,靈活應變的系統也是最具彈性和可持續性的。

Xilinx於10月推出第一款ACAP平台產品Versal,Peng指出,Versal字面上是由Variety與Universal組合而成,希望在技術與應用上可以兼顧多樣性與通用性。Peng強調,ACAP平台是整體軟體的堆疊,不僅僅是晶片,還包括高整合度工具、最佳化函式庫、作業系統等,還有AI框架標準,只須利用符合業界標準設計的流程就能針對其硬體與軟體進行編程與最佳化,針對整體應用的加速,而不僅止於深度學習網路。

Versal架構專為AI應用開發

Versal的架構將發展兩個系列、六個應用區隔,兩個系列以有無AI核心為主要差異,未搭載AI引擎的系列,運算能力由低至高為Prime、Premium以及HBM三個產品線;而搭載AI引擎的系列,主要以應用區隔為AI核心、AI邊緣以及AI RF系列。未搭載AI引擎系列,針對市場上廣泛適用性進行設計,並就作業負載的連結與線上加速進行最佳化。搭載AI核心的系列,針對雲端、網路以及自駕車應用進行最佳化,該系列配有5個元件,並提供128至400個AI引擎。

在架構上,Xilinx FPGA與SoC產品管理暨行銷資深總監Kirk Saban(圖2)解釋,Versal架構中有幾個主要的核心,包括:純量處理引擎(Scalar Processing Engine),搭載Arm Cortex-A72與Arm Cortex R5應用處理器,還有可完全軟體編程的平台管理控制器;自行調適硬體引擎(Adaptable Hardware Engine),可動態重新配置,即時加速能力最高達八倍;DSP引擎可提供高準確性浮點運算與低延遲,針對客製化資料路徑的細微性控制;AI引擎具有高傳輸率、低延遲與高效率,可協助AI推論與高階訊號處理,搭配先進記憶體和介面技術,可提供強大的異質加速能力。

圖2 Xilinx FPGA與SoC產品管理暨行銷資深總監Kirk Saban解釋,自行調適硬體引擎,可動態重新配置,即時加速能力最高達八倍。

而在軟體支援與開發環境部分,Xilinx軟體業務執行副總裁Salil Raje說,AI人工智慧有兩個階段,訓練和推論。在訓練階段,資料科學家將海量的資料放到模型中,然後微調模型、改善模型以減少誤差,之後將訓練模型部署到應用當中。在推論過程當中,資料量相對較少,在推論階段,回應速度與功耗就顯得更加重要,如果部署在搭載電池的邊緣設備當中,要盡量降低功耗。未來幾年,推論需求的成長性將明顯高於訓練(圖3)。

圖3 AI推論需求將持續攀升
資料來源:Barclays Research(05/2018)

AI創新與應用日新月異

而推論帶來的挑戰包括:AI創新的速度,低延遲、高通量和高效能與整體的應用加速。Raje指出,幾年前AI關注圖像的分類以及推薦的引擎,但是AI應用和AI模型的使用數量成長的速度非常快,包括目標識別、分割、語音辨識、異常檢測等,在每個應用當中都有很多的創新發生在AI的模式上。2012年的AlexNet促成AI模型的大爆炸,在過去六年,絕大多數的創新都是為了改善精確度。最近則是想提高AI模型的效率,以應用於行動裝置和IoT終端。

現在AI的應用、AI模型和精度方面有很多的創新,Raje舉例,有一個最先進的深度學習網路,等專為其設計的晶片生產時,技術已經產生了變化,此固定功能晶片,只為了支援一個舊的網路架構。所以固定晶片架構不是好選項,要靈活應變的硬體如賽靈思FPGA和ACAP元件,使得使用者能夠客製資料流程以針對最先進的網路,同時可彈性調整,而不需更換晶片。靈活應變的硬體也能夠客製記憶體的層次結構,可以用更多的On Chip記憶體而不是用DDR,以改善功耗和延遲。而且可以自訂精度,選擇最合適的精度。

Xilinx不久前併購大陸AI獨角獸公司深鑒科技,該公司可以客製資料流程以適用所需要的網路。並透過量化技術客製精度,也可以重新訓練,重新獲得精度。Raje表示,推論引擎並不是獨立工作的,它有幾個具體的功能,想要縮短時間延遲,須要將各個功能的速度都進行加速,以智慧城市應用為例,預計2020年在政府和商業大樓當中,全球將擁有超過10億部攝影機,並產生大量資料。CPU和GPU分別發揮作用的話,延遲82毫秒,功耗75瓦。採用FPGA,延遲減少26毫秒,功耗降低到50瓦。通量增加三倍,從每秒12幀到每秒38幀。

建構AI Ecosystem為當務之急

Versal採用台積電最先進的7奈米FinFET製程,正式量產時間2019年第二季,在此之前Xilinx也以現有16奈米UltraScale+ FPGA為基礎,發表Alveo U200與Alveo U250加速卡,就機器學習而言,Alveo U250的即時推論傳輸率比高階CPU高出20倍,甚至在低於2毫秒的低延遲應用方面,也比高階GPU這類固定功能加速器高出4倍。此外,Alveo加速卡的延遲較GPU減少3倍,在資料庫搜尋等應用方面加速、並提供較CPU高出90倍的效能。

AI應用領域之廣泛,也需要串聯上下游為數眾多的產業鏈,自然非單一廠商可以通吃,這也是Xilinx宣示未來技術與產品將以平台化發展的最重要原因,現階段該公司以資料中心為策略核心,此次開發者大會也積極與大陸雲端服務業者華為、阿里巴巴、浪潮等公司合作,搶占AI運算/推論市場,與布局較早的GPU、CPU競逐雲端AI應用大餅。

以投入較早的NVIDIA為例,目前在AI競爭當中取得暫時的領先,該公司已經發展一系列的硬體晶片與板卡,搭配完善的開發環境、AI深度學習框架、軟體函式庫等,產業鏈初具型態;而昔日資訊運算霸主Intel,近年則是透過許多投資與併購,希望能扭轉CPU不適合深度學習運算的劣勢。相較之下起步較晚的Xilinx今年大動作投入,積極合縱連橫布局產業生態系(Ecosystem)。

華為智能計算業務副總裁張小華說明,採用華為雲技術、硬體以及Xilinx FPGA,建構一套統一的線上線下協同平台,採用相同的生態系統、環境資料、共同的安全協議以及管理協議。也就是華為的伺服器與共有雲HPV加速,並整合Xilinx技術加速元件,由此軟硬體構成一個完整的加速平台,所有合作夥伴和開發者採用這個統一的平台去部署自己的業務。

而阿里巴巴FPGA異構計算研發總監張振祥則說,阿里雲FPGA已經發展到第三代產品與架構服務,隨著未來新架構上市,當能提供更迅速、確實並安全的運算服務。阿里雲FPGA異質運算團隊特別強化網路安全,即使FPGA遭受到惡意攻擊,也可將傷害做有效的控管,不會影響到其他晶片,也可以自行軟體恢復。

浪潮集團副總裁李金指出,該公司致力於打造AI全面性的產品布局,從運算平台高效的管理系統套件到深度學習框架的最佳化、終端解決方案四個層次為客戶提供迅速、高效、最佳化的AI運算基礎設施。並觀察到AI的三大趨勢,第一,AI運算能力需求快速成長,現有AI平台的運算能力難以滿足AI應用研發創新的需求,需要更強的效能支援;第二,大量的資料和終端使用者的體驗,推動更高速、更高頻寬的資料儲存和傳輸通道需求;第三,深度學習網路模型的快速反覆運算需要更加靈活的可客製化AI運算架構。FPGA可以提供強大的運算效能,更高的資料傳輸率以及靈活的軟硬體演算法支援。

圖4 XDF合作夥伴合影:阿里巴巴異質運算總監項午(左),阿里雲FPGA研發總監張振祥(左二),浪潮集團副總裁李金(中),賽靈思CEO Victor Peng(右二),華為智能計算業務副總裁張小華(右)

 

相關文章

- Advertisement -
- Advertisement -

最新文章

- Advertisement -

熱門文章

- Advertisement -

編輯推薦

- Advertisement -