- Advertisement -
首頁 技術頻道 新興應用前仆後繼 GDDR/HBM高效能記憶體潛力大

新興應用前仆後繼 GDDR/HBM高效能記憶體潛力大

- Advertisement -

在今日的資料經濟中,每天有極大量的資訊產生、被儲存和處理。資料產出的深入洞察可創造驚人的價值,並更進一步提升效率。記憶體科技的創新正是讓資料洞察從無到有的關鍵。本文旨在探討今日與未來市場對於高效能記憶體的需求,使讀者了解現階段的市場挑戰,以及高效能記憶體對於各種資料密集與頻寬密集型的應用均不可或缺的原因。

高效能記憶體市場趨勢/流變

AI、機器學習、深度學習、無人自駕車、高效能運算、虛擬實境、擴增實境等應用,使下一代遊戲不只是熱門詞彙。

這些應用的使用量大幅成長,皆需用到非常大量的資料—這些資料不僅量大,還必須被快速和重複分析,而占用極大的系統頻寬(圖1)。筆者相信,2020年是決定下一代高效能記憶體技術發展的關鍵年。

圖1 各領域針對資料使用量不斷上升

打造高效能記憶體系統

雖然專用於繪圖卡快速渲染之同步動態(Synchronous Dynamic)繪圖用雙倍資料傳輸率(Graphics Double Data Rate, GDDR)記憶體技術已發展多年,但本文僅探討2008年GDDR5出現後的進展。當年,市場需要以已知的設計方法和原料,以及可負擔的封裝方式,來提高記憶體的資料傳輸速率。GDDR5從512Mb開始、成長到8Gb的密度,最後達到每引腳8Gbps的最高資料傳輸效能。若要計算系統頻寬的話,以典型的繪圖卡配置(8顆元件、32位元介面)而言,每引腳傳輸速率8Gbps的GDDR5可提供8GB的訊框緩衝(Frame Buffer)與256GBps的系統頻寬。市場雖一度可以接受這樣的效能,但不久後便追求進一步提高頻寬。

2015年美光(Micron)與NVIDIA合作,在GDDR5X中導入JEDEC的創新標準,將每引腳最高的資料傳輸率增至12Gbps。之後的兩年期間,GDDR5X稱霸高階繪圖卡市場。例如NVIDIA Titan X(32位元介面、12顆元件、每引腳資料傳輸率11.4Gbps)的系統頻寬便達到547GBps。

或許,GDDR5X最重要的成果是,它奠定了GDDR6的框架。GDDR6於2018年秋季問世後,效能立刻在市場上顯現。當NVIDIA於2018年、AMD於2019年推出8Gb GDDR6時,美光為兩家公司的產品發布夥伴,滿足市場對高效能的需求。GDDR6現仍在產品預期生命週期的相對早期階段,目前,每引腳最大資料傳輸率為16Gbps。使用GDDR6的系統最高頻寬預計可達768GBps(32位元介面、12個元件、16Gbps的每引腳資料傳輸速率)。GDDR6不只是高效能的解決方案,也是適用於多種不同應用的成本優化方案(表1)。

講到高效能記憶體,就不免提到高頻寬記憶體(HBM)。HBM不但與運算元件緊密整合,還能同時降低功耗和拉高頻寬,填補記憶體方案的缺口。HBM透過堆疊記憶體元件提高密度,並以較低時脈達成較高的I/O數,進而提供高頻寬,並具備較低功耗。HBM是一種強大的高效能記憶體,但由於產品本身的複雜性,也是成本相對較高的方案,因此HBM鎖定需較高頻寬,且成本敏感度較低的應用(圖2)。

圖2 高頻寬記憶體運用堆疊的記憶體元件,達成高密度與高I/O數

GDDR與HBM是高效能記憶體市場中的關鍵產品,接著探討主要的市場趨勢。

新市場趨勢與應用層出不窮

在列舉高效能記憶體的應用時,遊戲(Gaming)通常是最先浮現腦海的應用。雖然遊戲的重要性不容小覷,但有些新興的市場趨勢與應用也讓繪圖產業的需求水漲船高(圖3)。

圖3 新興的市場趨勢與應用也讓繪圖產業的需求水漲船高

人工智慧/機器學習與GPU

繪圖處理器(GPU)過去多半僅用於遊戲領域。但是,隨著AI在各產業區塊的爆炸性發展,GPU已是創造價值和效率的利器。GPU普遍都需要高效能的記憶體。機器學習與深度學習訓練所用的演算法需執行複雜的數學及統計運算,而GPU已被證明可較CPU更快解決這些繁雜的計算。在討論AI時,必須區別推論(Inference)和訓練(Training)兩種不同的需求。AI訓練是運算非常密集的工作,系統頻寬越高越好。AI推論則較常見,對頻寬的要求低於AI訓練。訓練與推論都是未來不可或缺的一部分。兩者合併運用下,可創造出高品質的神經網路。GPU及其尖端記憶體正被應用於AI、機器學習和深度學習上,讓這些應用以人類所不及的準確度,解決更多真實世界的難題。

高解析度影片

下一個驅動高效能記憶體成長的是4K/8K內容。高階遊戲不斷推動繪圖技術在高解析度與回應速度上的創新突破(零延遲/零緩衝)。今日許多頂級的遊戲設備均搭載4K解析度,未來更將達到8K或更高解析度。專業的遊戲玩家常同時使用多台顯示器,其中不乏4K+的螢幕(因為工作負載高,對於繪圖卡與大訊框緩衝區的需求也會增加)。

由於影像解析度增加,視訊渲染未來仍需大訊框緩衝區與高頻寬。隨著媒體內容與遊戲的串流應用在全球日益普及,資料中心的資料處理能力也需日漸提升。

遊戲創新

雲端遊戲的運作仰仗資料中心。那些資料中心內的伺服器多搭載GPU,以優化效率。Google Stadia、NVIDIA GeForceNow、PlayStation Now與Microsoft Project xCloud都是近期出爐的一些新型雲端遊戲平台。雲端遊戲預計將快速成長,並持續推動創新。光線追蹤(Ray Tracing)是視覺繪圖領域中夢寐以求的技術。從光源追蹤光線及設計出逼真照明環境的能力,一直是繪圖產業在過去20多年間努力的目標。在NVIDIA和AMD最新的繪圖卡產品,以及即將上市的PlayStation 5與Xbox Series X遊戲機上,這種渲染技術終於落地。

PC遊戲正驅策遊戲市場中頂級規格的發展。由於PC可每年或更頻繁地更新硬體,專業玩家普遍偏愛PC遊戲。PC遊戲持續帶動繪圖功能強化(4K/8K、光線追蹤與可變速率著色),以及對於最高回應時間(最低緩衝/延遲時間)的需求。如上面關於高解析度影像的討論,專業遊戲玩家有時會同時使用多台最高規格的顯示器;在這樣的配置下,玩家需不斷更新系統,才能保持競爭力。

為了達到最佳效能,玩家傾向選用內建不只一張繪圖卡、而是搭載多張平行運作繪圖卡的遊戲設備。

AR/VR

無論在PC遊戲或主機遊戲的世界裡,虛擬實境(VR)都已是許多不同遊戲的熱門選項。從早期較簡單的型態開始,VR繪圖技術和功能現正突飛猛進,並滲透至諸多新領域中。隨著品質精進,遊戲將繼續以健康的速度成長,但更亮眼的成長將來自一些令人振奮的新領域。

在醫療產業中,VR和擴增實境(AR)都可望成為教育訓練的利器。目前,已經有些有趣的應用(運用AR)將虛擬物件融入真實環境,以輔助醫療教學。如美光繪圖卡解決方案不局限於遊戲領域,將觸角延伸到垂直產業,包括專業繪圖、高效能運算、車載應用與網路等。

建築、工程與建造是VR與AR顯而易見的下一波灘頭堡。對許多領域來說,能夠在實地參訪或建構實體建物前,先虛擬地「看到」或甚至遊覽某地或建築、並了解物件將如何與所在環境互動,前景都令人倍感期待;教育領域的VR與AR的應用可望大幅成長。與醫療訓練一樣,講師和專家在教學中也可運用虛擬物件、提供虛擬的範例和與虛擬元素互動。

高階AR與VR頭戴裝置需搭配強大的PC和繪圖卡,才能達到最高設備規格。HTC Vive Pro最低規格的顯卡是NVIDIA GeForce GTX 1060或AMD Radeon RX480。隨著繪圖要求升高,最低規格的繪圖卡也需更新,而可能更新為搭載最新高效能記憶體的繪圖卡。

工作站及超級電腦

專業級繪圖與工作站主要客群為專業工作者(影像/照片影像設計師、CAD、工程機構等)。高頻寬的工作負載需有強大繪圖卡和穩定更新的支援,才能常保競爭力。為了解決世上最複雜的問題,高效能運算(HPC)促使超級電腦推陳出新,而後者必須不斷強化記憶體效能,高效能記憶體則是HPC的絕配。

車輛與網路

高效能記憶體也已深入汽車與網路市場。自駕車運用大量資料來分析周遭環境,並以較快的速度處理資料。搭載高效能記憶體的GPU是這種作業環境的方案之一。無人駕駛技術日新月異,可望推動記憶體產業大幅成長。在網路的部分,高階路由器與交換器都需要高效能記憶體的效能及頻寬優勢。對於車輛與網路應用來說,產品可靠性及壽命都是重點關注領域。

市面高效能解決方案

高效能解決方案已從遊戲領域拓展至垂直產業,包括:專業繪圖、高效能運算、車載應用與網路等。不同的應用往往有不同記憶體與儲存需求。舉例來說,遊戲機平台的使用壽命長(5~7年),故最新機種常搭載頂級規格,將頻寬與效能拉到最高,進而讓主機盡可能滿足未來需求、多使用幾年。遊戲主機支援VR的趨勢看漲。比起PC遊戲,主機VR遊戲的價格更親民。

遊戲主機的現有客群可輕鬆導入VR頭戴設備,而且,由於遊戲主機現有資源已可滿足VR運算所需,所以個別頭戴設備的價格更容易負擔。

專業工作領域,如CAD、視訊繪圖及高效能運算,已能採用可更新的繪圖功能模式(Updateable Graphics Model)。此外,PC遊戲也是繪圖卡需持續更新的另一潛在應用領域。不過,對於不需時時使用最高規格的業餘玩家來說,還有其他許多優異的方案可供選擇。一張新繪圖卡可用上好幾年,和遊戲主機差不多。

而HPC和資料中心的應用應該要能定期更新以提升效能。網路和汽車的平台壽命還會更長,有時長達十年。高效能記憶體可妥善支援這些不同的需求(圖4)。

圖4 高效能記憶體的應用領域

記憶體系統特性

在評估哪款記憶體方案最適合哪套系統、相關參數及應考慮事項時,分析和權衡不可或缺。組織必須在主流記憶體和高效能記憶體之間做出選擇;甚至必須判斷哪一種高效能記憶體最能滿足個別系統的要求。此外,對於訊框緩衝大小的要求也應納入考量。GDDR類產品的彈性很高,而能妥善配置系統的訊框緩衝區大小(從4顆到24顆記憶體,可放置任意數量),以迎合系統要求。

效能

市場趨勢和發展歷史顯示,效能必須能持續提升。繪圖卡一年更新數次,這代表頻寬的需求也會不斷增加。因應這種情況,高效能記憶體必須隨每次升級加大資料傳輸的速率。若要取得最高效能,使用者就得採用最新的高效能記憶體。

功耗

在效能要求持續攀升之際,電源效率更顯重要。使用者應檢視整體解決方案的功率需求,並選擇適配的頻寬(圖5)。

圖5 高效能記憶體每位元功耗

價格親民度

許多高效能記憶體應用都是預算有限的消費級終端應用。記憶體一方面必須兼顧頻寬與訊框緩衝的要求,另一方面還要維持合理的成本。根據應用和頻寬的需求,像GDDR這樣的分離式(Discrete)低成本選項可能是最適當的方案。倘若頻寬的重要性高於成本考量,HBM則可能較適合。

在評估負擔能力時,除了設備費用以外,使用者也應考量系統建置的成本。分離式元件可支援標準電路板材料與主流的組裝流程,TCO較具吸引力。

一窺GDDR後的未來

HBM2E預計將於2020年邁入市場。如美光計畫在2020下半年推出HBM2E產品,其裝置將符合JEDEC標準,並提供4H/8GB和8H/16GB兩種密度,資料傳輸速率為3.2Gbps或更高;至於HBMnext預期將於2022年年底推出。美光同時也參與JEDEC的標準制定過程。隨著市場對資料量的需求與日俱增,類似HBM的產品將水漲船高,並帶動資料量繼續攀升。

市場會一直需要採分離式封裝、價格經濟實惠的高頻寬解決方案。和GDDR5相比,GDDR6尚在生命週期的早期,但市場上已經開始討論GDDR的未來發展。

(本文作者為美光科技運算及網路事業群繪圖技術行銷經理)

相關文章

- Advertisement -
- Advertisement -

最新文章

- Advertisement -

熱門文章

- Advertisement -

編輯推薦

- Advertisement -