SiFive
天時/地利/人和俱足 開放處理器來勢洶洶
在摩爾定律逐漸走向尾聲,處理器效能提升速度趨緩的情況下,為了榨出更多效能,以滿足人工智慧(AI)等應用對運算能力的需求,晶片設計者開始在主流的處理器IP之外,探索其他的可能性,例如異質運算、異質整合封裝概念的興起,都與CPU效能成長趨緩,有著密不可分的關係。
領域專用運算架構(Domain Specific Architecture)的觀念,為許多IC設計團隊帶來新的靈感。在標準處理器之外,利用客製化的指令集跟邏輯電路,提高特定某幾類運算任務的執行效率,以便讓處理器在功耗、晶片面積沒有大幅增加的前提下,執行特定任務時能有更高的效能,是領域專用運算架構的核心概念。而開放式CPU架構具有自由、可擴充等特性,正好與領域專用運算架構的想法一拍即合,也促成RISC-V在短時間內爆紅。
開放架構處理器的概念並非RISC-V首創,自2005年起,產業內便曾陸續提出OpenSPARC、OpenRISC、OpenCores等開源指令集架構,但始終面臨相關生態系不易建立,難以受到市場廣泛採用的難題。直到2010年加州柏克萊分校的Krste Asanović教授在其實驗室中開始一系列的開放原始碼研究,RISC-V即是他的RISC CPU研究計畫中的一項。隨後2015年,RISC-V基金會在瑞士成立,以非營利組織的形式推動RISC-V生態系進展,才奠定了RISC-V的基礎。
柏克萊掛保證 RISC-V成功引起產業興趣
晶心科技(Andes)技術長暨執行副總經理蘇泓萌(圖1)提及,柏克萊大學原先為了教學目的而開發出RISC-V,而柏克萊大學作為電腦科學人才培育的重鎮之一,其響亮的名聲,是初步吸引廠商對RISC-V產生興趣的原因。
圖1 晶心科技技術長暨執行副總經理蘇泓萌
與其他的開源硬體相比,RISC-V具有兩方面的優勢,一是簡單易學,二則是良好的商業模式。原本就是為了教學而發展出來的RISC-V,跟其他主流CPU或開源CPU相比,很容易學習上手,有些比較年輕的工程師,很可能在學生時代就已經接觸過RISC-V,因此開發團隊的培養、建構,跟採用主流CPU架構開發晶片相比,難度比較低。而商業模式方面,RISC-V是開源硬體,開發者不用支付授權費、權利金,免於承擔龐大的資金壓力,也讓許多廠商更願意嘗試在晶片中採用RISC-V架構。
SiFive總裁暨執行長Naveed Sherwani(圖2)則從天時、地利、人和的角度,來分析RISC-V快速竄起的原因。在人和方面,Sherwani的觀點與蘇泓萌類似,認為從學術教育需求中誕生的RISC-V,其單純易學、容易客製化的特性,讓RISC-V在推廣時占了很大優勢,這也讓半導體大廠與EDA工具業者看到RISC-V的發展潛力,進而提供支持。這是其他開源或可組態(Configurable)CPU所不曾享有的待遇,也是RISC-V聲勢快速上漲的原因。
圖2 SiFive總裁暨執行長Naveed Sherwani
各國追求半導體自主 RISC-V來得正好
至於在地利方面,由於國際政治的對立加劇,許多國家都需要在談判桌上累積更多籌碼,而半導體作為重要的戰略物資,自然是各國爭相投入扶植的產業。事實上,SiFive在2019年曾經在埃及、巴基斯坦等根本沒有半導體產業的國家舉辦RISC-V論壇,結果動輒吸引數百人、上千人出席,原因也在於各國都想要在半導體領域掌握一定的自主權。對於沒有半導體或資訊科學基礎的國家來說,RISC-V是一個很好的起點。
中國為了追求半導體產業自主,在RISC-V上所投入的資源,更是不在話下。近期中國開放指令生態聯盟才剛舉行CRVS 2020研討會,會中探討了中國RISC-V生態系的未來發展方向,以及中國本土業者在RISC-V處理器設計、驗證、矽智財(IP)與軟體工具等的發展成果,顯示中國有很強烈的企圖心,欲利用RISC-V創造出屬於自己的處理器生態系統。
摩爾定律走向尾聲 運算效能提升要靠客製化
而在天時部分,摩爾定律的進展趨緩,導致處理器效能提升速度大不如前,加上AI應用蓬勃發展,都使得晶片業者必須設法在既有的CPU架構外另闢蹊徑,以滿足客戶對運算效能的需求。
Sherwani就指出,如果處理器的效能提升速度,還能保持十多年前的水準,業界恐怕不會對RISC-V產生這麼大的興趣,因為標準CPU就能滿足應用需求,就算有些電晶體閒置不用或工作效率不彰,對晶片公司跟使用者來說也無所謂。但在摩爾定律走向尾聲,客戶對運算效能的需求卻因為AI暴增之際,晶片業者必然要想辦法讓處理器上每個電晶體都能發揮到極致。針對特定應用進行客製化設計,則是實現這個目標必然要走的路。
蘇泓萌也認為,RISC-V的發展,跟AI有很密切的關係,當AI應用不斷更新,以聲音、人臉辨識與資料中心為主的應用發展比通用的處理器開發更快,須要彈性靈活的解決方案,允許客戶自行修改指令集,才能透過硬體加速滿足AI的效能需求。
應用廣泛的RISC-V便是AI加速的解決方案之一,藉其彈性修改的特性,可依照不同客戶的需求客製化處理器,縮短產品從開發到上市所需的時間。目前RISC-V架構以中低階產品為主,並以美國及中國發展最快。未來RISC-V將走向高階產品,同時持續與學界合作拓展整體生態系。
生態系建立仍為RISC-V最大考驗
基於精簡、可擴充、易於客製等優勢,讓許多廠商對RISC-V躍躍欲試。具代表性的科技公司如英特爾(Intel)、三星(Samsung)及高通(Qualcomm)三大廠商皆對RISC-V處理器IP/解決方案商SiFive投入資金;而聯發科除了是RISC-V基金會的成員之一,也是晶心最大的股東,令市場更加看好RISC-V的發展前景。面對處理器開放架構應用的討論,處理器大廠Arm則選擇部分開放自家處理器架構,因應日益增加的客製化需求。
主流的處理器IP與開放式架構兩陣營各有支持者,而RISC-V架構的出現,提供處理器設計人員在現有IP之外,另一個更具彈性的選擇。基於開源的核心宗旨,RISC-V的開放性可加速創新。然而硬體架構仍須搭配編譯器與軟體工具支援,才能發揮其作用。因此RISC-V的挑戰便在於建立一套完整的支援系統,藉由建立生態系來穩固市場定位,期望未來與主流處理器並駕齊驅。
為了建立RISC-V生態系,學界與業界人士成立基金會共同推動,RISC-V社群中的處理器廠商之間除了各自的策略布局,同時反映了半導體產業的競合關係。蘇泓萌表示,RISC-V社群的廠商間呈現合作性競爭(Co-opetition)關係,競爭對手與合作對象間並沒有明顯的界線。生態圈中存在競爭,但是上下游廠商,甚至競爭對象還是可以合作把餅做大,透過互相支援拓展RISC-V生態系。
SiFive攜手CEVA開發邊緣AI矽晶片
CEVA與商用RISC-V處理器IP和矽晶片解决方案供應商SiFive日前宣布合作,將為終端市場設計和創建低功耗特定領域Edge AI處理器。兩家公司此次合作是SiFive DesignShare計畫的一部分,將以RISC-V CPU、CEVA的DSP核心、人工智慧處理器和軟體為中心,這些組件將被設計成一系列以終端市場為目標的SoC,而這些目標市場中的設備需具備可支援成像、筆電視覺、語音識別和感測器融合應用的終端設備神經網路推論能力。初期應對的終端市場包括智慧家庭、汽車、機器人、安全和監控、擴增實境、工業和物聯網。
CEVA全球銷售執行副總裁Issachar Ohana表示,CEVA與SiFive的合作使Edge AI SoC的創建可快速且專業依據工作負載而量身打造,同時還保留支援機器學習創新的靈活性。該公司DSP和人工智慧處理器,再加上CDNN機器學習軟體編譯器,使這些AI SoC能夠簡化在智慧設備中部署經過雲端訓練的人工智慧模型的工作,並為使用Edge AI功能者提供產品。
SiFive和CEVA開發一系列領域特定的可擴展Edge AI 處理器設計,在處理、功率效率和成本之間取得最佳的平衡,直接克服這些挑戰。
Edge AI SoC已獲得CEVA的CDNN深度神經網路機器學習軟體編譯器的支援,此一編譯器可為CEVA-XM視覺處理器、CEVA-BX音訊DSP和NeuPro 人工智慧處理器創建完全最佳化的運作時軟體(Runtime Software)。以大眾市場中嵌入式設備為目標的CDNN,將網路最佳化的量化演算法、資料流程管理以及經過全面最佳化的計算CNN和RNN庫納入整體解決方案中,進而可將經過雲端訓練的人工智慧模型部署在邊緣設備,以進行推論處理。CEVA還將為建基於CEVA-XM和NeuPro架構的合作夥伴和開發人員提供完整開發平台,以支援使用CDNN且以任何高級網路為目標的深度學習應用之開發,同時也針對音訊和語音預處理和後處理的工作量提供DSP工具和庫。
CEVA/SiFive攜手搶攻Edge AI市場
為拓展邊緣運算市場版圖,SiFive/CEVA宣布攜手合作,將以RISC-V CPU、CEVA的DSP核心、人工智慧處理器和軟體為中心,結合雙方的IP和設計優勢,可為智慧家庭、汽車、機器人、安全、擴增實境、工業和物聯網等大量的終端市場開發Edge AI SoC;而本次雙方的合作同時也是SiFive DesignShare計畫的一部分。
CEVA全球銷售執行副總裁Issachar Ohana表示,CEVA與SiFive的合作使Edge AI SoC的創建可快速且專業地依據工作負載而量身打造,同時還保留了支援機器學習創新靈活性。透過該公司的DSP和人工智慧處理器,再加上CDNN機器學習軟體編譯器,使這些人工智慧SoC能夠簡化雲端訓練模型的工作,並為任何希望使用Edge AI功能的消費者提供引人注目的產品。
SiFive/CEVA攜手布局邊緣AI市場。
如今終端設備的處理工作量愈來愈大,這些設備需具備可支援影像、視覺運算、語音識別和感測器融合等神經網路推論能力,因此,在終端設備上添加可進行機器學習處理的SoC已成為主流,以實現智慧家庭、安全監控、汽車、物聯網等應用。
然而,由於安全、隱私和延遲方面的考量,建基於雲端的人工智慧推論不適用於許多這一類的設備,為此,SiFive和CEVA攜手開發一系列領域特定的可擴展Edge AI處理器,在處理、功率效率和成本之間取得更佳的平衡。Edge AI SoC已獲得CEVA旗下CDNN深度神經網路機器學習軟體編譯器的支援,此一編譯器可為CEVA-XM視覺處理器、CEVA-BX音訊DSP和NeuPro 人工智慧處理器創建最佳化的運行時軟體(Runtime Software)。
值得一提的是,CEVA和SiFive的合作也是基於SiFive DesignShare計畫。SiFive DesignShare IP計畫可提供簡化的流程,且其靈活性和選擇性可通過更簡單的原型製作,並且降低談判契約和許可協議的複雜性,沒有法律上的繁文縟節,也不需要預付款,讓產品能更快上市。
SiFive總裁兼執行長Naveed Sherwani指出,要滿足人工智慧模型的快速發展以及對低功耗、低延遲和高性能的要求,就需要一種靈活和可擴展的IP和SoC設計方法,而這正是CEVA / SiFive聯合的產品組合所能提供的。如此一來可縮短產品的上市時間,同時降低設備製造商生產功能強大且具有差異性產品的進入障礙。
AIoT熱潮有增無減 邊緣運算方案競出籠
人工智慧(AI)蓬勃發展,而AI結合AIoT更是現今半導體產業熱門議題。IoT產品除了要能聯網,同時也須更智慧化,才得以實現更多創新應用;而要讓終端設備變得更智慧,無疑是為其增添AI,這也意味著終端裝置須具備更高的運算效能,才得以在終端先行處理龐大的資料量。為此,邊緣運算(Edge Computing)形成時下主流,各大AI方案供應商也加強布局力道,邊緣運算的軍備競賽可說如火如荼的進行中。
Arm新NPU/GPU系列提升智慧沉浸體驗
從遊戲裝置到數位電視(DTV),人工智慧現在已經無所不在;但考量到要促成這些回應式的體驗,端點必需具備更強的運算能力。例如,數位電視的智慧型體驗,包括智慧助理語音指令、節目即時翻譯至另一種語言及人臉辨識以強化家長監護。
為了達成這些功能,Arm宣布推出兩個全新的主流機器學習(ML)處理器,分別為Ethos-N57與Ethos-N37 NPUs;以及最新的Mali繪圖與顯示處理器Mali-G57 GPU。新推出的兩款ML處理器,可實現AI應用並在ML的效能與成本、面積、頻寬與電池壽命限制之間達成平衡,而Mali-G57 GPU則是第一個以Valhall架構為基礎的主流GPU,可透過效能提升帶來沉浸式體驗。
Arm資深副總裁暨車用與物聯網事業部總經理Dipti Vachani(圖1)表示,該公司致力於投注領先全球的前瞻技術,全面賦能運算效能,實現更多創新體驗。除了上述新推出的ML處理器與GPU外,該公司也針對全球一兆台聯網裝置打造支援bfloat16功能以強化終端裝置機器學習的Neoverse平台,將AI導入邊緣運算,在終端及雲端發揮數據價值。
圖1 Arm資深副總裁暨車用與物聯網事業部總經理Dipti Vachani表示,Arm希望透過完善的產品線與解決方案,滿足日漸增加的沉浸式體驗需求。
Vachani補充,除此之外,因應運算從雲端移至邊緣,該公司也推出能確保雲端原生體驗的Project Cassini解決方案,實現從雲端到終端皆具備完善的智慧運算決策能力,以應付更多元且多變的應用場景。這些方案加總起來,代表Arm有能力依需求調整規模,並把優質的體驗帶入消費者的日常生活裝置中。
據悉,在Arm ML處理器(現在稱為Ethos-N77)發表後,Ethos-N57與Ethos-N37是Ethos NPU系列最新的成員。Ethos為解決複雜AI與ML運算挑戰的產品組合,以便為日常生活裝置創造更為個人化與沉浸式的體驗。
由於消費裝置愈來愈智慧化,因此,透過專屬的ML處理器提供額外的AI效能與效率,有其必要性。為此,全新的Ethos NPU不僅針對成本和電池壽命進行優化,像是先進的資料管理技術,以減少資料的移動與相關的耗電,還進一步強化Int8與Int16資料類型的支援性,並透過創新技術Winograd,讓效能更上一層樓。
至於Mali-G57,主要目的是將優質的智慧與沉浸使用者體驗帶到主流市場,包括高傳真遊戲、媲美電玩主機的行動裝置圖型效果、DTV的4K/8K使用者介面,以及更為複雜的虛擬實境與擴增實境工作負荷。該產品和前一代Mali-G52相比,各種內容都能達到1.3倍的效能密度,且能源效率提升30%使電池壽命更長,以及針對虛擬實境(VR)提供注視點渲染支援且裝置上ML效能提升60%,以進行更複雜實境應用。
Vachani說明,遊戲體驗是行動裝置市場一項重要應用,除了推出效能更高的Mali GPU之外,該公司近期也宣布與Unity擴大合作,藉由將Arm的解決方案放置在Unity平台,讓遊戲開發者可以輕鬆的運用,創建更佳的沉浸式體驗。
布局高效運算市場 SiFive再發新IP組合
不讓Arm專美於前,SiFive近日也於Linley Fall處理器大會上推出全新高性能IP產品組合,其分別為SiFive U8系列核心IP和經過優化的HBM2E+解決方案,滿足各應用領域(如汽車、人工智慧、物聯網等)等終端運算需求。
SiFive首席執行長Naveed Sherwani表示,全新SiFive U8系列微架構的推出是一個重要的里程碑,可擴展的亂序RISC-V處理器可滿足汽車、資料中心和邊緣AI等需求。新推出的IP基於RISC-V指令集架構,是一種超純量(Superscalar)設計,具有可擴展的亂序執行通道(Out-of-order Pipeline)以及可配置的選項,供即時或應用處理器使用,滿足用戶對高效能運算產品的訂製需求。
另外,SiFive U8系列提供每瓦特超過1.5倍的面積效率和性能,而且擁有可運行Linux作業系統的記憶體管理單元,以支援通用應用處理器設計,以及用於關鍵任務操作的即時模式。同時,該產品具有可選的浮點單元、訂製的指令擴展功能和RISC-V向量擴展支援,使其無論是在汽車、AI邊緣或終端應用程式,都可以針對應用案例進行相應的配置和訂製。
至於SiFive HBM2E+ IP,則用於支援運算密集類型的工作負載,包括高性能運算、資料中心和邊緣AI設備中的深度學習處理,不僅易於整合至各式新設備中,並能使用可擴展的介面支援Chiplet設計和性能,進一步優化CPU到記憶體的路徑。
此外,SiFive HMB2E+解決方案已通過先進的7nm技術驗證,可提供高達400Gbps的記憶體頻寬,也就是每個引腳高達3.2Gbps的傳輸速率。與類似容量的DDR類型記憶體相比,HBM的堆疊特性不但占據較小的空間(可實現更小體積),且能達到更低功耗,且擁有更高頻寬,十分有利於處理密集的深度學習運算。
簡而言之,隨著人工智慧開始往邊緣發展,本地資料處理的效率和速度也須大幅提升,而SiFive新推出的處理器核心與記憶體介面相結合,可滿足各式高運算應用,例如資料中心、汽車系統、工業物聯網(IIoT)、消費性產品等。
NVIDIA新處理器體積/功耗/效能三者兼具
另一方面,NVIDIA則是推出Jetson Xavier NX(圖2)。該產品不僅具備高效運算能力,同時也具備超小體積,其模組尺寸比一張信用卡還小,在運行現代AI作業時可提供高達21TOPS的伺服器等級運算效能,而耗電量僅10瓦,可用於機器人和邊緣嵌入式運算裝置。
圖2 Jetson Xavier...
中國IC設計競相投入免費架構 IP授權業者紛紛調整授權規則
中興事件結束之後不到兩年,中美貿易戰白熱化,這次有更多中國科技廠商遭到禁運處置。然而中國在這兩年間並沒有發展出真正意義上完全自有的產品,舉例來說,現時所謂自有處理器架構,基本上都還是來自於Arm、MIPS或者是X86的授權。
AI方案火熱,雖然中國業者紛紛設計自己的加速晶片,但上面執行的依然是來自Google、Facebook的框架,而自產AI加速晶片依然是以老舊的脈動陣列(Systolic Array)架構為主,只是在周邊或者是記憶體的使用進行調整,沒有獨有的專利或其他特殊之處,因此在中國市場,即便針對雲端AI運算的ASIC加速方案此起彼落,但NVIDIA的GPU方案依然占據高達九成的市場。
中國前兩年的自有潮流雖不能說完全沒有發揮作用,但效果相當不明顯。
也因此,當出現了RISC-V這個彈性高、免授權費,且商用機會大的架構之後,整個市場也紛紛投入研究與開發,推動相關生態的發展。
RISC-V衝擊既有處理器IP授權生態
前面也提到,在核心的處理器架構方面,Arm、MIPS以及X86仍是中國處理器方案的主流,2017年之前總和占據接近百分之百的市場。
不過在2018年,情況開始有了改變,RISC-V正式進入中國市場,雖然在此之前就有部份中國晶片業者使用RISC-V指令集設計產品,但因為市場不熟悉該架構,應用並不廣。而隨著中國RISC-V聯盟的成立,以及SiFive攜手晶心進入中國市場,SiFive也在中國成立SiFive China獨立子公司,主導在中國的業務發展,一時之間掀起了廣大的開源架構風潮。
SiFive或晶心賣的是已經設計好的IP,採用他們設計好的架構需要支付授權費,但是SiFive以及其他RISC-V的IP供應者,都只收取一次性的授權費用,往後晶片生產就不需要根據銷售量額外支付一定比重權利金。而若廠商技術能力足夠,也可以直接拿RISC-V指令集來發展自己的架構,而RISC-V指令集還定義了擴展指令集,只要符合規定,廠商可以自行定義相關指令集的內容和形式,形成高度客製化的方案。
重要的是,採用此法設計出來的處理器產品完全不需要支付任何授權費或者是支付權利金,相較之下,如果使用同樣的授權方式,採用Arm的指令集來客製化自己的處理器,以最高階的方案為例,入門費用和授權費用可能就需要高達數千萬美元,更不用說後續權利金的收取。
然而,指令集雖免費,還是需要有其他外部成本的配合才能形成產品,且多數中國晶片設計業者都沒有自行使用指令集來設計處理器架構的能力,因此最終還是只能買現成的IP,但不論如何,較低的授權費,以及不需要權利金的先天優勢之下,開源架構的概念在中國瞬間火紅了起來,包含華為海思、阿里巴巴等超過300家科技業者都加入相關的聯盟或者是投入架構發展。
Arm首當其衝 因應策略效果仍待觀察
既然看到「免費」商機,既有的處理器IP業者也緊張了起來,Arm在處理器IP供應市場中獨占鼇頭已久,當免費指令集當道,自然受傷也最重。
對客戶而言,一來隨著晶片銷售額的成長,如影隨形的權利金會成為獲利殺手,另一方面,客戶其實也不願意讓Arm藉由收取權利金的理由對自己的銷售成績瞭若指掌。採用免授權金的架構,那麼一來節省成本,二來又可以確保市場成績不被Arm知悉。
為了因應挑戰,Arm在授權策略也進行了一定的調整和改變,比如說過去客戶選擇一種特定的晶片設計方案時,必須預先支付一定數量的許可費,價格可能從幾萬美元到數百萬美元,之後在晶片投產後按晶片數量再收取授權費以及權利金。
但對於晶片公司來說,準備好送到晶片代工工廠的最終設計方案可能需要半年至一年的時間才能完善,客戶在晶片實際開始交付之前很久就支付了大筆預付款,對營運成本造成壓力,中大型企業可能還有其他業務收入支撐,小型企業可能根本無法負擔。
為此,Arm宣佈了一項新收費模式,晶片製造商可以較低的一次性費用獲得約該公司四分之三的技術和晶片設計方案組合。後續,只有當晶片準備好生產並開始發貨時,才需要向Arm支付許可證費用和專利費。
作為IP授權業界的老大哥,Arm在生態、開發工具以及製造方面的支援不是免費架構所能相提並論,但如果坐看競爭者蠶食市場,那最終生態優勢可能會被翻轉過來,為此而進行的策略轉變看來只是收費順序的轉換,多數IC設計業者可能不會有太多感覺,但是在中小型業者身上應該可以發揮一定作用,只是效果仍待觀察。
MIPS與IBM跟進免費授權
也由於免費指令集掀起廣泛的討論,業界也認為其可創造的商業價值不下於傳統的Arm授權方式,就連過去也走Arm授權模式的MIPS和Power Architecture也加入了免費指令集的行列。
MIPS是個具有非常悠久歷史的架構,過去在高性能運算、網通設備以及各類嵌入式架構產品中非常普遍,而在特定的技術領域方面,比如說單一核心多執行緒的設計也要優於Arm。然而在Arm架構的侵略之下,市場不斷喪失,加上商業策略失敗,導致目前僅能退守少數應用領域,且仍不斷被Arm架構所侵蝕。
而在遭遇市場挫折之後,一度被Imagination所收購,但Imagination在MIPS生態上並沒有很好的開發出更廣泛的應用,加上和蘋果的合作將在不久候終止,可能會喪失大筆收入來源的Imagination也只好斷尾求生,將MIPS買給美國新創公司Wave Computing,隨後也將自己賣給了中資公司。
MIPS在今年稍早提出了指令集免費授權方案,同時也免除了權利金的收取,同時也將中國市場的經營權授權給芯聯芯,這個作法其實和SiFive在中國創立獨立公司,以及Arm在中國創立Arm mini China有著異曲同工之妙。
而IBM也在8月宣布透過OpenPower基金會開放Power Architecture,同樣採用類似RISC-V的授權模式。二者除了指令集免費授權以外,也提供了既有的IP授權模式,但同時免除了權利金的收取,希望能仿照RISC-V掀起的熱潮,藉此取得更大的市場空間。
Power架構過去在高性能計算領域一直擁有重要地位,只是市場參與者太少,基本上就是IBM自己在玩,雖然在不少技術特性方面可和英特爾一較高下,但巧婦難為無米之炊,截至目前為止,其在相關市場的占有率也不過在1%左右。
過去Power架構一直是由OpenPower基金會在推動,提供類似Arm架構的授權方式,在收費方面一直也都比Arm架構低,但因為應用冷門,且缺乏廣泛的軟體支援,市場應用者少之又少,而其近年在中國市場的耕耘也被其他如RISC-V等聲量更大的開放架構所掩蓋,為了避免進一步被邊緣化,IBM也決定跟隨RISC-V以及MIPS的腳步,開放其指令集。
而這次所謂的開放,就是要效法RISC-V,在指令集層級的使用方面完全免除版稅。另一方面,為了強調Power架構在周邊IP的完整性,同時讓指令集授權可以更快速轉換成可商用產品,除了開放原始碼的Power架構指令集之外,IBM 還將提供多種其它技術,包括 Power架構的軟核實現(Softcore Implementation)、與架構無關的開放式相干加速處理器介面(OpenCAPI)、以開放式記憶體介面(OMI)的參考設計。
國際IP授權商在中國展開切割布局
目前貿易戰打得火熱,這些IP業者,除了Arm以外,其原始指令集架構的發明都是來自美國,而即便是Arm,也有多個IP研發團隊在美國,因此,不論是指令集,或者是IP架構,都可能會踩到美國的貿易限制,如果貿易戰全面開打,那麼以上這些IP授權業者恐怕必須馬上退出中國市場。
為了避免這種最壞的狀況發生,這些公司採用了在中國設立獨立運作的公司,或者將經營權授權給當地公司,若母公司受到禁運限制,那麼理論上在中國的子公司還能持續以現有的指令集基礎開發IP,並提供授權服務。
RISC-V基金會曾表示,即便在最壞的情況下,指令集不會遭受禁運限制。而在此前提下,若自行以開源指令集開發IP,不論未來貿易戰發展到什麼程度,基本上都不會受到影響。
目前SiFive就在中國開設了一家獨立營運的公司,而MIPS則是將IP的授權及營運授權給中國本地的公司,就如Arm在中國和當地政府合資創立Arm mini China子公司一樣,都是為了規避貿易戰風險。
然而是否真能完全避免貿易戰的影響,恐怕還是要取決於美國對技術輸出的態度,若連上游製造都涵蓋進去,即便有獨立的經營體系,恐怕還是難逃制裁。
RISC-V發展最快 MIPS/IBM仍待觀察
目前RISC-V架構在中國已經建立起聯盟,進入中國市場的相關IP供應者也有不少,台灣晶心、芯原,以及最近最受關注的SiFive,都已經積極布局相關市場,提出不少方案。前不久阿里巴巴旗下的平頭哥發表基於RISC-V的高性能IP玄鐵910,可以達到16核配置,並可在2.5GHz的時脈下運作,而其IP和自訂的擴充指令集都將完全開放,這也代表中國隊RISC-V,除了既有IP供應業者之外,也積極布局完全自有的IP,這對SiFive之類的業者而言也都是挑戰。
雖然平頭哥的架構與IBM或者Arm的高性能架構比較起來還是明顯不足,但也已經是RISC-V中少見的高性能架構了。不過目前該架構仍然還在驗證與測試階段,短時間之內沒有商用的可能,但這也已經代表中國廠商希望以RISC-V布局更廣應用的決心。
若以整體局勢觀察,RISC-V目前氣勢的確強大,但實際商用腳步仍僅限小規模低功耗產品,整體市場表現以及相關產值仍遠遠落後於Arm,而MIPS及IBM之所以推出開放指令集授權方式,截擊的意味極重。
但考慮到目前RISC-V已經聚集了Google、高通、NVIDIA、三星、WD等一線半導體大廠,背後潛藏的研發能量極為龐大,若再慢一步,恐怕不久之後就連高性能計算也可能被RISC-V所取代,而這也是IBM決定在MIPS之後,跳進開放指令集架構處理器授權市場中的最大原因。
Arm壓力大 業務模式被迫調整
至於背腹受敵的Arm,雖然憑藉著成熟生態積極展開行銷戰,但既有授權模式以及指令客製化彈性的缺乏,使其面對這些開源架構,也逐漸落於下風,其主要客戶都已經逐漸轉向RISC-V。
雖然主要的運算核心,如高階Cortex-A系列仍然統治著行動運算領域,但低階的M系列,甚至針對即時運算的R系列,都面臨極嚴苛的挑戰,在RISC-V的壓力下,當初軟銀收購Arm時所誇下的海口,恐怕會複製當初伺服器市占宣言的窘況:Arm在幾年前曾宣稱要在2021年占據伺服器市場25%的比重,但至今仍未超過1%。
為了保住IoT市場的優勢,或許Arm會在未來提出更激進的授權計畫,不僅要打入更大的市場,也同時要阻擋免費架構繼續攻城掠地,影響Arm的市場布局。
在中國市場,Arm mini China主要針對的就是IoT市場,除了有自己的架構研發團隊,在授權條件上也要優於Arm全球的其他市場,然而中國市場雖大,如果因為其對中國市場的授權優惠而影響了其他國家的客戶,對Arm而言恐怕也是得不償失,也因此,或許Arm應該考慮改變授權形式,將預期營收來源轉移至其他服務部份。
事實上,Arm已經宣布有限度地支援客製化的指令集,與RISC-V頗有異曲同工之妙。通過Arm強大的設計能力來對抗RISC-V的其他IP競爭者,當然,這對於保守的Arm,肯定會是一大挑戰。
布局高效運算市場 SiFive再發新IP組合
SiFive近日於Linley Fall處理器大會上推出全新高性能IP產品組合,其分別為SiFive U8系列核心IP和經過優化的HBM2E+解決方案,滿足各應用領域(如汽車、人工智慧、物聯網等)等終端運算需求。
SiFive首席執行長Naveed Sherwani表示,全新SiFive U8系列微架構的推出是一個重要的里程碑,可擴展的亂序RISC-V處理器可用於特定領域的應用,滿足汽車、資料中心和邊緣AI等需求。
據悉,新推出的SiFive U8系列核心IP基於RISC-V指令集架構,是一種超純量(Superscalar)設計,具有可擴展的亂序執行通道(Out-of-order Pipeline)以及可配置的選項,供即時或應用處理器使用,滿足用戶對高效能運算產品的訂製需求。
另外,SiFive U8系列提供每瓦特超過1.5倍的面積效率和性能,且擁有可運行Linux作業系統的記憶體管理單元,以支援通用應用處理器設計,以及用於關鍵任務操作的即時模式;並且具有可選的浮點單元、訂製的指令擴展功能和RISC-V向量擴展支援,使其無論是在汽車、AI邊緣或終端應用程式,都可以針對應用案例進行相應的配置和訂製。
至於SiFive HBM2E+ IP,則用於支援運算密集類型的工作負載,包括高性能運算、資料中心和邊緣AI設備中的深度學習處理,不僅易於整合至各式新設備中,並能使用可擴展的介面支援Chiplet設計和性能,進一步優化CPU到記憶體的路徑。
此外,SiFive HMB2E+解決方案已通過先進的7nm技術驗證,可提供高達400Gbps的記憶體頻寬,也就是每個引腳高達3.2Gbps的傳輸速率。與類似容量的DDR類型記憶體相比,HBM的堆疊特性不但占據較小的空間(可實現更小體積)且能達到更低功耗,並且擁有更高拼寬,十分有利於處理密集的深度學習運算。
簡而言之,隨著人工智慧開始往邊緣發展,本地資料處理的效率和速度也須大幅提升,而SiFive新推出的處理器核心與記憶體介面相結合,可滿足各式高運算應用,例如資料中心、汽車系統、工業物聯網(IIoT)、消費性產品等。
SiFive發布全新U8系列IP。
SiFive攜手QuickLogic針對快速晶片設計發表 SoC 樣版
SiFive日前宣布推出Freedom Aware(FA)系列之SoC樣板,以及與低功耗語音智能SoC、嵌入式FPGA IP和端點AI軟體工具和解決方案創新業者QuickLogic Corporation的策略開發合作。Freedom Aware系列SoC樣板(SoC Template)擴展了SiFive的晶片設計能力,從根本上縮減了從事新SoC設計之成本和開發時間。
Freedom Aware SoC樣板透過使用經測試的構建模塊和一整套先進的開發工具,徹底改變了SoC開發流程並降低風險,確保完成的SoC反映預製軟體模擬的結果。藉由SoC樣板的優勢,用戶可使設計週期大幅縮短至幾個月,將首個矽晶總成本降低一個量級,最重要的是,在提供客製矽解決方案的同時,可消除對大型半導體設計團隊的依賴。
QuickLogic總裁暨執行長Brian Faith 表示,QuickLogic針對與SiFive的策略合作,及在開發業界第一個SoC樣板系列所扮演的角色感到非常自豪。SoC樣板是業界加速開發和導入廣泛稱為物聯網之高度多樣化產品所殷切需要的。SoC樣板進一步實現了對技術取得民主化的共同願景,並大幅擴展了IP商業模式的潛力和範疇。
Freedom Aware SoC樣板利用SiFive的異質多核心架構和QuickLogic的AI子系統,該子系統具有可編程加速和精密的電源管理技術,可為電池供電型消費和工業物聯網應用提供優化的超低功耗解決方案。
SiFive總裁兼執行長Naveed Sherwani表示,SiFive的Core IP系列正驅動邊緣更高智能。現在,憑藉全新的Freedom Aware系列SoC樣板,SiFive正因應對完整、經濟、快速上市之SoC解決方案的需求。Freedom Aware將QuickLogic的IP和超低功耗SoC設計專業知識、與SiFive在RISC-V處理和設計平台的領導地位相結合,為目標應用提供強大而靈活的SoC樣板。借助這些資源及對其提供支援的先進開發工具,SiFive正透過民主化的SoC設計開闢了創新的巨大市場。
拓展RISC-V市場/滿足邊緣運算 SiFive再推64-bit核心
現在具有人工智慧(AI)、機器學習(ML)、物聯網(IoT)和即時(Real-time)工作負載的連接設備已經越來越多,邊緣嵌入式智慧運算的需求也因此大幅提升。為滿足此需求,SiFive推出新款商用64位嵌入式核心「S2 Core IP」。新產品推出後也進一步增加SiFive旗下嵌入式核心IP產品組合,其中包括E(32位元)和S(64位元)中的核心IP系列。
SiFive執行長兼聯合創始人Yunsup Lee表示,為了滿足對完整的64位元嵌入式運算的市場需求,SiFive必須加快其相關產品的開發。SiFive利用獨特的方法快速創新和建構64位元的完全異構和連貫的即時核心功能。SiFive的S2核心IP系列經過矽驗證,可帶來更高的效率、性能和安全性,在邊緣應用實現更多創新。
邊緣SoC會面臨即時延遲(Real-time Latency)、確定性能力和嚴格的功率限制等要求。S2可以使SoC能具有不間斷的低功耗CPU效能,且可以僅在需要時才開啟與高效能CPU的結合,例如在聲控的智慧型設備中。另外,S2系列可以只配置13,500個閘極(RV32E格式)。同時S2僅有S5核心的一半大小,並能透過分離安全域和非安全域來增強安全性。藉由這些靈活的做法,來滿足現代邊緣負載和應用所要求的效能、功率,以及面積和即時需求方面的限制。
Microchip公司的子公司Microsemi產品架構與規劃負責人Ted Speers表示,SiFive將其64位元S核心的標誌性效率、可配置性和經過矽驗證的核心IP專業技術帶到了64位元的嵌入式架構中,將能為下一代嵌入式運算提供創新。