大數據,快數據,機器學習,ISA
強化數據移動時間/方式 RISC-V躋身運算新利器
大數據與快數據
大數據(Big Data)應用是使用特殊的GP-GPU、FPGA與ASIC處理器,搭配深度學習技術作分析,從中找出趨勢、固定模式及關聯性,藉此提供影像辨識、語音辨識或其他功能。大數據的應用多建立於「過去的數據」或「儲存於雲端的數據」,因此經常能形成「訓練有素」的神經網路,尤其適合執行特定作業,例如辨識並標註影像或視訊中所有的臉孔,甚至是語音辨識也是代表性案例。
此類作業亦非常適合讓配有專用引擎(或推論引擎)及快數據應用的邊緣裝置來執行(圖1)。透過處理、分析終端所擷取的數據,快數據可引用大數據的演算法提供即時決策及結果。畢竟大數據所提供的洞察價值之一,是從「已發生的事」來推斷「未來可能會發生的事」(預測性分析);而快數據則是提供即時行動,藉此改善商業決策、營運,並減少效率不彰情況。這些方法亦可適用於各種邊緣及儲存裝置,像是攝影機、智慧型手機與固態硬碟(SSD)。
圖1 大數據、快數據與RISC-V商機
RISC-V為數據運算新利器
新型工作負載量可分為兩種情境:
1.以特定工作負載「訓練」大型神經網路,例如影像或語音辨識。
2.將已「訓練」或「量身打造」的神經網路應用在邊緣裝置上。
兩者的工作負載量都需要大量包含大矩陣乘法與卷積(Convolution)層的平行數據處理與運算,為使這些運算功能達到最佳配置,須有能運作大規模向量或數據陣列的向量指令。RISC-V正是適合此類應用的架構與生態系統,而其以開放原始碼軟體所設定的標準化運算處理,可讓開發人員自由採用、修改,甚至增加專用的向量指令。圖1概述RISC-V運算架構可應用的情境及範例。
優化數據移動方式/時間為運算處理首要任務
快數據與終端運算的崛起,亦代表將所有數據來回傳輸至雲端進行分析已不是最有效率的方案。首先,相對大量的數據在行動網路及乙太網路之間長距離傳送所造成的延遲,對於必須即時作業處理的影像或語音辨識應用而言並非最佳作法。
其次,終端運算才是真正能擴充架構價值之所在,尤其在執行影像及語音處理,或利用固態硬碟進行運算時。如此一來,在每次新增邊緣裝置時,即可增加整體架構的運算性能。因此,如何優化數據移動的方式和時間,才是新架構可擴充性的關鍵因素與考量。
圖1a中,雲端數據中心伺服器利用大數據資料來進行深度學習神經網路的「訓練」與「學習」。圖1b中,位於終端的監控攝影機,配備了能引用大數據演算法的推理引擎,可即時辨識影像(快數據)。圖1c中,智慧型固態硬碟裝置使用推理引擎進行數據辨識及分類,有效利用裝置的頻寬。正如圖1所列出RISC-V核心的潛在應用,使用者可以自由新增專用及未來標準化的向量指令,對於往後處理深度學習與推論技術都極為重要。
另一個類似且重要的趨勢,是數據如何在大數據與雲端內部進行移動與存取。傳統的運算架構皆利用附加在多種裝置的匯流排(Bus)搭載資料傳輸(例如專用機器學習加速器、顯示卡、快速SSD,以及智慧聯網控制器等)。此類型匯流排,特別是CPU及主要持久型記憶體(Persistent Memory)之間皆因頻寬速度限制,導致設備本身的效能並未能被完善使用。此外,此類型運算裝置的記憶體不但不能互相分享,也無法與CPU共用,同時造成了設備資源的浪費。
目前產業已有幾大重要新興趨勢,針對如何改善不同運算裝置之間的數據移動(例如CPU、運算及網路加速器),以及如何存取在記憶體或快速儲存裝置裡面的數據。這些新的趨勢都著重在開放式標準,以提供更快、更低延遲的串行連接架構,以及更聰明的邏輯協定,讓共享記憶體具有連貫的存取路徑。
RISC-V為優化數據移動關鍵技術
未來的架構必須針對持久型記憶體以及具備連貫性快取的快速匯流排(例如TileLink、RapidIO、OpenCAPI和Gen-Z),透過連結運算加速器,提升效能持續性,同時使所有裝置共享記憶體,減少不必要的數據移動。
傳統的運算架構因在高速記憶體與運算系統應用頻寬受限的匯流排,導致效能隨之受限。未來的運算架構則採用開放式介面,能為平台所有運算資源提供統一且具有連貫性快取的存取途徑(稱為以數據為中心的架構),且部署的裝置能利用同一個共享記憶體,減少不必要的數據複製。
非核心(Uncore)CPU與網路介面控制器將會逐漸成為移動數據的關鍵推動元件。未來非核心CPU元件不但必須能夠支援關鍵記憶體及持久型記憶體介面(例如NVDIMM-P),也須覆蓋內建於CPU的記憶體。除此之外,適用於運算加速器、智慧聯網及遠端持久型記憶體的智慧高速型式匯流排也都是不可或缺。此外,匯流排上所有的裝置(例如CPU、通用或專用型運算加速器、網路配接器、儲存裝置或記憶體)都可以加入自己的運算資源,但前提是必須能存取分享記憶體。
RISC-V技術可視為優化數據移動的關鍵推動因素,因其可於所有運算加速器裝置上建置新機器學習工作負載量的向量指令,並提供開放原始碼CPU技術;不但支援開放式記憶體與智慧匯流排介面,也能建置以數據為中心、內含連貫式分享記憶體的新型架構。
以RISC-V解決各項挑戰
大數據與快數據在未來將會面對各種移動數據相關的挑戰,而這卻能為RISC-V指令集架構(ISA)及其所採用的開放式模組開拓新市場,它將會是以數據為中心的運算架構情境的首選,功能包括:
.擴充邊緣運算裝置所需的運算資源。
.新增專用指令,例如客製化機器學習工作的向量指令。
.於儲存與記憶體媒介裝置小型運算核心。
.促成新的運算概念與模組化晶片設計。
.促進以數據為中心的新架構,所有處理元件都能連貫存取分享持久型記憶體,進而優化數據移動的應用與環境。
RISC-V是由超過100個組織的會員所開發,其中包含一個由軟硬體創新人士所組成的協作社團,能針對特定目的或專案改編指令集架構。所有加入此組織的會員,皆能使用Berkeley Software Distribution(BSD)授權條款來設計、製造或/與販售RISC-V晶片與軟體。為實現數據的價值與可能性,須擷取、保存、存取及轉換數據,將其潛力發揮到極致。大數據和快數據應用的環境,已超越通用型運算架構的處理能力範圍。未來,極度以數據為中心的應用須具備專用處理功能,而裝置間也需要能以開放形式支援獨立數據資源的擴充。
新型態的機器學習運算工作負載量,將帶動這類可擴充型架構的崛起,而其中的關鍵因素必須依靠所有裝置都具備的共通運算架構,並以持久型記憶體作為主要數據儲存;換言之,所有裝置都能扮演運算的角色,藉以提高運算能力。所有新一代雲端及終端應用,都需要這種新型態的低能耗處理功能,因為此類運算加速處理器能專注於運算處理手邊的作業、避免移動數據所浪費的時間或執行與數據無關的多餘運算。透過數據的力量、潛力和可能性,個人、社群及整個世界都將得以更加蓬勃發展。
(本文作者為Western Digital研發工程部新一代平台技術資深總監)