- Advertisement -
首頁 標籤 MIPS

MIPS

- Advertisment -

旋轉運算扮演關鍵角色 感測融合促環境感知超展開

加速度計、陀螺儀和磁力計通常以消費者價格點提供有效的動作資訊。消費者級的慣性測量單元(IMU)是大多數電子裝置觸發動作的關鍵,然而最能說明問題的,並非是其產生的原始數據,而是透過分析和理解感測器的各項數值,帶來更多的啟發,這就是為什麼會有感測融合(Sensor Fusion)的概念出現。 感測融合的重點在於如何合併多個感測器數據,以及對不同感測器數據的取捨,只要將增益、偏置或雜訊等感測器異常納入考慮,便能較容易了解到那些需要偵測手勢及電源管理的產品為什麼會如此複雜。 想要了解如何在IMU中整合感測器數據,就需要了解旋轉以及控制的方法,本文將說明不同類型旋轉的表示法及所需的操縱方式,還會介紹Arm Helium技術(M-Profile Vector Extension, MVE)是如何幫助客戶在Arm Cortex-M處理器上產生更快的結果,僅以一個四元數(Quaternion)就能提升指令速度約2.5倍,使用八或更多個四元數速度將提升4倍。 多種旋轉表示法 從基礎開始絕非壞事,所以本文將從定義旋轉開始。旋轉是維持方向不變的正交變換,即點與點間的距離和向量間的角度不變,且無任何形式的延伸或傾斜。 旋轉可用兩種方式來思考:旋轉向量或旋轉座標系,這兩種的方式相同但主體相反。前者是以面對自己的方向轉動骰子(物體旋轉),後者是將骰子置於桌上並自己繞桌旋轉(座標系旋轉)。 旋轉可用多種數學函數表示,各種方式都有其優缺點,對座標系、符號、框-向量旋轉及非可交換旋轉,各有潛在的困難點,每種方法利弊如下列所示。 歐拉角 歐拉角的基礎原理是用三個角度來表示空間中發生的旋轉,共可以生成十二個獨特的旋轉順序,其順序可為外旋(旋轉軸全域固定)或內旋(旋轉軸隨裝置移動),其中外旋很少用於運算。 在俯仰(Pitch)、偏航(Yaw)、橫滾(Roll)順序中最常見的也許是航空歐拉順序,如圖1所示,圖中採用NED座標系(北-東-下),分別代表X、Y、Z軸。 圖1 航空歐拉順序 參閱上圖能深入地了解內旋順序。以Z-Y'-X"順序而言,先繞飛機/重心(Z)的中心旋轉,然後從新位置繞機翼(Y')旋轉,最後繞機身圓柱中線(X")旋轉。這一俯仰、偏航、橫滾序列的角稱為Tait-Bryan角,但一般稱為歐拉角。 歐拉角易於閱讀和理解,因此有助於概念化和使用者輸入,但不利於運算或插值,比如將偏航和俯仰視為地球的緯度和經度,則在赤道的一度運動會比在極地冰蓋處的一度運動大很多。 主要缺點之一是發生在接近π/2或90度之第二次旋轉的環架鎖定(Gimbal Lock),此現象能用圖1解釋。繞重心旋轉任意角度,然後俯仰飛機至90度,此時飛機就會垂直向上,在這一點上,飛機繞中線和重心旋轉效果相同,此會導致系統進入二維自由度(DoF)狀態,而失去第三維自由度,因而產生多餘的等效旋轉,並使運算複雜化。 方向餘弦矩陣 旋轉矩陣亦稱DCM,是一個3×3矩陣:w=Rv,其中R是旋轉,v是向量。DCM將一個參考座標系轉換為另一個參考座標系,等於用矩陣表示各個歐拉角旋轉的乘積。 使用時必須有一個正交矩陣,其中R-1=RT and Det(R)=1,來代表純旋轉(無延伸或傾斜)。 此方法可避免環架鎖定,但這種方法的缺點,是確保矩陣在操作後保持正交性,將可能不易運算。 軸-角 與需要三個旋轉的歐拉角相反,軸-角表示法只需要一個旋轉。此一方式下,任何旋轉都可以用圍繞任意軸n的單一旋轉角θ表示(圖2)。 圖2 軸-角 本方法的優點在於運算過程只須操作兩個數值,而不是如歐拉角的三個數值和DCM的九個數值,這改善了歐拉角所缺乏的數值穩定性,也毋需如DCM進行重新規範化,及歐拉角的環架鎖定,但是它的缺點是不太適用於額外的運算。 四元數 四元數可與其他旋轉方法結合或作為替代方法使用,是定義旋轉的首選。此表示法使用的複數具有一個實項和三個虛項:q=w+xi+yj+z,其中w是實項,x/y/z是虛項;若用向量表示,q==,其中w是實項,a是向量。 四元數沒有環架鎖定的風險,在數值上也比DCM更穩定,沒有冗餘因素、不需要昂貴的操作正交化、易於保持正規化,而正規化的四元數類似軸角法,可以表示旋轉角度的任意向量,因此更容易解釋—w是角度w=cos(θ/2)的變形版本,a=是軸的比例版本: 在四元數中,四元數數學的加法是向量加法,即所有元素的和;乘法略微複雜而且不可交換。如定義P為(p0,p)且Q為(q0,q): 在規範化(單位)的四元數中,逆矩陣等價於共軛(Conjugate):P-1=P*,而旋轉向量(v)四元數q的量:w=q*vq;v=qwq*;w=Rv(R是DCM3×3矩陣)且存在於四元數。 合併旋轉是四元數乘法: 且可由四元數Q旋轉向量v後再返回: 四元數因支援插值和導數,因此有利於感測融合,軸-角法和歐拉角法均難以插值,雖然可以使用DCM進行插值,但因要對九個元素(3×3)進行操作而難以執行,且相較於DCM,四元數只需要四個元素(w/x/y/z),因此也可提高儲存效率。 如上所述,四種數學方法各有其優點和影響運算便利性的潛在缺點。其中四元數在感測器整合的旋轉運算上更受青睞,因為四元數可以避免環架鎖定、確保數值穩定性、對訊號進行插值且提高處理效率。 但是如果要執行大量旋轉,對於四元數運算是很大的挑戰,由於四元數乘法需要大量獨立運算,以致於實際運算效率可能比DCM低,尤其連續進行大量旋轉時,四元數乘法的操作程序將比矩陣乘法複雜。 四元數乘法 Arm Helium的指令集可以快速進行四元數乘法,而在說明其加速方法前,需要對四元數和四元數數學進一步說明,如前文所述,四元數的旋轉需要進行多個乘法運算,亦即四元數乘法是旋轉的關鍵,例如定義四元數A、B及R如下: 其中a=,b=,r=,擴展為16個乘積累加/累減: 或可將四元數視為一對複數,例如a和b是實數,則複數a+bi可表示為一對(a,b),四元數A=,因此可表示為(a1+a2i)+(a3+a4i)j,其中ij=k,亦即將四元數A表示為負數對(a1+a2i,a3+a4i)。 將複數相乘的結果如下: 亦即兩個四元數可用兩對複數表示如下: 全部乘法運算合在一起等於16個實數或4個複數的乘積累加/減運算。 採用新指令集 Arm Helium技術包括一個向量複數乘法累加VCMLA指令,此指令可以執行一半的複數乘法,而使用兩個不同「旋轉」值的調用,可以運算出一個完整的複數乘法。 調用VCMLA兩次: 1.r=vcmla(r,,,0) 2.r=vcmla(r,,,90),產生r=,亦即每次調用僅需要兩個純量乘法累加。而VCMLA指令能夠一次運算多個f32和f16複數(定點運算有專用運算子)。而由於四元數可以用兩個複數表示,因此特別有用。 總而言之,四元數乘法的複雜運算如下所示。 此乘法可調用VCMLA指令四次來完成: 前述的16個實數乘法累加/減運算可改為對VCMLA指令的四個不同調用,每個調用執行四次乘法累加。在前兩次運算後,產生八個等效置換結果,如圖3所示。其中最好使用粗體的四個置換,因為它們對於第三次和第四次VCMLA調用有相同的輸入,這一點很重要,因為就指令獲得的速度而言,不可輕忽更改輸入所耗的時間。 圖3 旋轉置換 Helium應用範例 進行四元數乘法前,需先調用其他指令來置換和求逆輸入數據,再調用VCMLA指令。這些存取模式可用常量陣列或手動生成,以下實例會演示此版本的執行: 本四元數乘法的優化代碼如圖4所示,在VCMLA運算代碼中,灰底標示的部分代表四元數乘法。本實例使用多種方法:如{0,1,0,1}用增量/迴繞(viwdup)生成;{2,3,2,3}是人工構建的演算法;{3,2,1,0}用增量(vddup)生成;符號修改碼從表中載入,但也可用vdup/vmov生成。 圖4 四元數乘法代碼 加速指令處理 CEVA-Hillcrest Labs利用Arm作為其DSP核心。本文將Arm Cortex-M0和Cortex-M0+處理器具有的1-cycle或32-cycle的乘法選項,用於感測融合。雖然Cortex-M3也有相同的功能,但對於較小的代碼大小和MIPS而言,其具有更高效的代碼,因此更能節能。配備FPU的Cortex-M4,則提供了更小的代碼和更少的MIPS。 然而,借助Arm Helium的技術,可以同時執行多個四元數乘法,來快速地產生結果,如表1所示,其中NoQ為同時進行的四元數乘法運算;He為Helium擴展所採取的循環數;Cortex-M4為Cortex-M4執行採用的循環數;Cortex-M7為Cortex-M7執行採用的循環數;CPQ為給定運算的每個四元數運算循環數。 而表2則列出使用Arm Helium替代其他Cortex-M應用方案,所得到的速度提升,其中Ratio為給定運算與MVE運算相比處理時間的百分比;Speedup為MVE相對於給定運算的速度提升之比(比率的倒數)。 由此可知,Helium的效果顯著,僅用一個四元數就能提升指令速度約2.5倍,若使用八或更多個四元數,速度將至少提升4倍。 感測融合至關重要 隨著人們的生活越來越緊密,感測器在日常生活中變得越來越普遍。為了滿足這種便利性,感測器須以低功耗、快速、準確地認知周遭環境,因此,複雜四元數旋轉的感測器整合,便是建立此一認知的關鍵。 (本文作者Fabien Klein任職於Arm;Bryan Cook及Charles Pao皆任職於CEVA)
0

TI:擴展電源轉換應用即時控制資源並維持平台開發解方

在需要連續的高性能與高效率的即時電源轉換領域,投資可擴展與不間斷的工業與汽車電源轉換解決方案對設計工程師而言至關重要。這種需求更提升了對即時控制系統的需求,例如在伺服驅動系統、電力傳輸、電網基礎設施和車載充電應用中對MCU每秒百萬條指令(MIPS)的計算能力,脈寬調變器(PWM)和類比數位轉換器(ADC)的數量。這也導致開發人員需要以簡單且低風險的方式建立與維護其產品線。性能可擴展性(Performance Scalability)和產品組合相容性(Portfolio Compatibility)為開發人員提供了一種省力又符合經濟效益的方式來擴展即時控制資源並長期維護電源轉換解決方案的平台。 可再生能源的興起帶動了在諸如太陽能逆變器等應用中使用更高功率水平的趨勢。隨著功率水平的提高,需要更多即時控制資源。例如MIPS、PWM 和 ADC,這些都是功率轉換過程中至關重要的零組件。解決此需求的典型方法是藉由單一中央控制器控制太陽能逆變器系統中的多個功率級。若該控制器的資源不足以解決更高的功率水平與越來越多的功率級時,該如何處理呢?分散式架構就是這個問題最好的解決方案。 分散式架構的理念如下:連接多個即時控制MCU,以擴展系統可用的資源和周邊裝置的數量。此方案能使設計人員在不影響產品性能的前提下實現其產品要求的性能與效率。多晶片解決方案的成本、藉由隔離和接口速度連接多裝置的複雜性、以及主機/主處理器上缺少具有外部記憶體接口的周邊裝置 德州儀器(TI)的C2000即時控制MCU產品組合藉由分散式架構實現電源轉換的價值,同時解決了上述的三個問題:C2000即時控制MCU產品組合的最新版本 TMS320F28002x 系列價格實惠,可幫助設計人員透過分散式架構最佳化BOM 成本。C2000 即時控制MCU產品組合中的其餘功能可以進一步最佳化系統成本。 而快速串行接口(FSI)以高達200MBPS的速度實現可靠且強大的高速傳輸晶片(Chip-to-chip)或板對板(Board-to-board)通訊。與其他接口(如 CAN 或 SCI)相比,FSI 更具優勢。CAN 與 SCI 的速度慢且不提供偏移補償(Skew compensation),並不適合作為連接多個MCU跨隔離通訊的解決方案。由於FSI固有的偏移補償功能和速度,連接多個MCU以獲得資源可擴展性成為一種省力且穩健的接口選項。 F28002x中引入的主機接口控制器(HIC)使MCU可以充當橋接器,使主處理器最終能間接獲得控制器上的 FSI 和其他周邊裝置。無論讀者的主機處理器上是否提供FSI,F28002x 都允許設計人員透過分散式架構實現可擴展性。 除了資源可擴展性,設計人員還面臨構建和維護產品平台的挑戰。為了有效實現這一點,需要一種省力且低風險的方法來構建從高階到中階再到低階的產品線。 C2000 即時控制MCU產品組合提供了跨系列裝置的周邊和代碼相容性,減輕開發人員使用多種產品的工作量。這簡化了基於類似MCU技術的產品遷移和構建過程,從而實現了可持續的平台解決方案。圖 2 所示為C2000即時控制 MCU從高階到中階再到低階的第三代產品中接腳到接腳、周邊裝置和代碼相容的系列裝置。 在不斷發展的汽車和工業電源轉換市場中,設計人員正在尋找能夠幫助他們應對2個關鍵設計挑戰的創新解決方案:如何輕鬆擴展即時控制資源,以及如何建立與長期維護平台解決方案。透過FSI連接多個C2000即時控制MCU,以在太陽能逆變器和分散式多軸伺服驅動器(Distributed...
0

傳人工智慧新創Wave將倒閉

據semiwiki報導,人工智慧(AI)晶片新創公司Wave Computing即將倒閉。Wave成立於2008年,主要透過即時的AI解決方案,來擴展邊緣運算到數據中心的深度學習。2018年12月,Wave曾宣布MIPS開放原始碼的計畫,然而此計畫一年後即關閉。 圖 Wave Computing即將倒閉。來源:Wave Computing Wave的產品線多元,因而被稱為可擴充的整合性AI平台,並利用MIPS處理器提供邊緣到數據中心的數據流處理。Wave在2018年6月收購高瞻創投旗下的MIPS Technologies,一舉攻入DPU(Dataflow Processing Unit)的生產,強化其在深度學習(ML)市場的地位。2018年Wave曾開放MIPS原始碼,希望藉此提升MIPS的應用範圍,但是一年後隨即停止。 Wave由Dado Banatao及Pete Foley創立,Banatao擔任Wave的董事長,同時也是高瞻創投(Tallwood Venture Capital)的合夥人。2019年在Art Swift擔任Wave的CEO 四個月後,轉由Sanjai Kohli接任CEO職位至今。
0

中國IC設計競相投入免費架構 IP授權業者紛紛調整授權規則

中興事件結束之後不到兩年,中美貿易戰白熱化,這次有更多中國科技廠商遭到禁運處置。然而中國在這兩年間並沒有發展出真正意義上完全自有的產品,舉例來說,現時所謂自有處理器架構,基本上都還是來自於Arm、MIPS或者是X86的授權。 AI方案火熱,雖然中國業者紛紛設計自己的加速晶片,但上面執行的依然是來自Google、Facebook的框架,而自產AI加速晶片依然是以老舊的脈動陣列(Systolic Array)架構為主,只是在周邊或者是記憶體的使用進行調整,沒有獨有的專利或其他特殊之處,因此在中國市場,即便針對雲端AI運算的ASIC加速方案此起彼落,但NVIDIA的GPU方案依然占據高達九成的市場。 中國前兩年的自有潮流雖不能說完全沒有發揮作用,但效果相當不明顯。 也因此,當出現了RISC-V這個彈性高、免授權費,且商用機會大的架構之後,整個市場也紛紛投入研究與開發,推動相關生態的發展。 RISC-V衝擊既有處理器IP授權生態 前面也提到,在核心的處理器架構方面,Arm、MIPS以及X86仍是中國處理器方案的主流,2017年之前總和占據接近百分之百的市場。 不過在2018年,情況開始有了改變,RISC-V正式進入中國市場,雖然在此之前就有部份中國晶片業者使用RISC-V指令集設計產品,但因為市場不熟悉該架構,應用並不廣。而隨著中國RISC-V聯盟的成立,以及SiFive攜手晶心進入中國市場,SiFive也在中國成立SiFive China獨立子公司,主導在中國的業務發展,一時之間掀起了廣大的開源架構風潮。 SiFive或晶心賣的是已經設計好的IP,採用他們設計好的架構需要支付授權費,但是SiFive以及其他RISC-V的IP供應者,都只收取一次性的授權費用,往後晶片生產就不需要根據銷售量額外支付一定比重權利金。而若廠商技術能力足夠,也可以直接拿RISC-V指令集來發展自己的架構,而RISC-V指令集還定義了擴展指令集,只要符合規定,廠商可以自行定義相關指令集的內容和形式,形成高度客製化的方案。 重要的是,採用此法設計出來的處理器產品完全不需要支付任何授權費或者是支付權利金,相較之下,如果使用同樣的授權方式,採用Arm的指令集來客製化自己的處理器,以最高階的方案為例,入門費用和授權費用可能就需要高達數千萬美元,更不用說後續權利金的收取。 然而,指令集雖免費,還是需要有其他外部成本的配合才能形成產品,且多數中國晶片設計業者都沒有自行使用指令集來設計處理器架構的能力,因此最終還是只能買現成的IP,但不論如何,較低的授權費,以及不需要權利金的先天優勢之下,開源架構的概念在中國瞬間火紅了起來,包含華為海思、阿里巴巴等超過300家科技業者都加入相關的聯盟或者是投入架構發展。 Arm首當其衝 因應策略效果仍待觀察 既然看到「免費」商機,既有的處理器IP業者也緊張了起來,Arm在處理器IP供應市場中獨占鼇頭已久,當免費指令集當道,自然受傷也最重。 對客戶而言,一來隨著晶片銷售額的成長,如影隨形的權利金會成為獲利殺手,另一方面,客戶其實也不願意讓Arm藉由收取權利金的理由對自己的銷售成績瞭若指掌。採用免授權金的架構,那麼一來節省成本,二來又可以確保市場成績不被Arm知悉。 為了因應挑戰,Arm在授權策略也進行了一定的調整和改變,比如說過去客戶選擇一種特定的晶片設計方案時,必須預先支付一定數量的許可費,價格可能從幾萬美元到數百萬美元,之後在晶片投產後按晶片數量再收取授權費以及權利金。 但對於晶片公司來說,準備好送到晶片代工工廠的最終設計方案可能需要半年至一年的時間才能完善,客戶在晶片實際開始交付之前很久就支付了大筆預付款,對營運成本造成壓力,中大型企業可能還有其他業務收入支撐,小型企業可能根本無法負擔。 為此,Arm宣佈了一項新收費模式,晶片製造商可以較低的一次性費用獲得約該公司四分之三的技術和晶片設計方案組合。後續,只有當晶片準備好生產並開始發貨時,才需要向Arm支付許可證費用和專利費。 作為IP授權業界的老大哥,Arm在生態、開發工具以及製造方面的支援不是免費架構所能相提並論,但如果坐看競爭者蠶食市場,那最終生態優勢可能會被翻轉過來,為此而進行的策略轉變看來只是收費順序的轉換,多數IC設計業者可能不會有太多感覺,但是在中小型業者身上應該可以發揮一定作用,只是效果仍待觀察。 MIPS與IBM跟進免費授權 也由於免費指令集掀起廣泛的討論,業界也認為其可創造的商業價值不下於傳統的Arm授權方式,就連過去也走Arm授權模式的MIPS和Power Architecture也加入了免費指令集的行列。 MIPS是個具有非常悠久歷史的架構,過去在高性能運算、網通設備以及各類嵌入式架構產品中非常普遍,而在特定的技術領域方面,比如說單一核心多執行緒的設計也要優於Arm。然而在Arm架構的侵略之下,市場不斷喪失,加上商業策略失敗,導致目前僅能退守少數應用領域,且仍不斷被Arm架構所侵蝕。 而在遭遇市場挫折之後,一度被Imagination所收購,但Imagination在MIPS生態上並沒有很好的開發出更廣泛的應用,加上和蘋果的合作將在不久候終止,可能會喪失大筆收入來源的Imagination也只好斷尾求生,將MIPS買給美國新創公司Wave Computing,隨後也將自己賣給了中資公司。 MIPS在今年稍早提出了指令集免費授權方案,同時也免除了權利金的收取,同時也將中國市場的經營權授權給芯聯芯,這個作法其實和SiFive在中國創立獨立公司,以及Arm在中國創立Arm mini China有著異曲同工之妙。 而IBM也在8月宣布透過OpenPower基金會開放Power Architecture,同樣採用類似RISC-V的授權模式。二者除了指令集免費授權以外,也提供了既有的IP授權模式,但同時免除了權利金的收取,希望能仿照RISC-V掀起的熱潮,藉此取得更大的市場空間。 Power架構過去在高性能計算領域一直擁有重要地位,只是市場參與者太少,基本上就是IBM自己在玩,雖然在不少技術特性方面可和英特爾一較高下,但巧婦難為無米之炊,截至目前為止,其在相關市場的占有率也不過在1%左右。 過去Power架構一直是由OpenPower基金會在推動,提供類似Arm架構的授權方式,在收費方面一直也都比Arm架構低,但因為應用冷門,且缺乏廣泛的軟體支援,市場應用者少之又少,而其近年在中國市場的耕耘也被其他如RISC-V等聲量更大的開放架構所掩蓋,為了避免進一步被邊緣化,IBM也決定跟隨RISC-V以及MIPS的腳步,開放其指令集。 而這次所謂的開放,就是要效法RISC-V,在指令集層級的使用方面完全免除版稅。另一方面,為了強調Power架構在周邊IP的完整性,同時讓指令集授權可以更快速轉換成可商用產品,除了開放原始碼的Power架構指令集之外,IBM 還將提供多種其它技術,包括 Power架構的軟核實現(Softcore Implementation)、與架構無關的開放式相干加速處理器介面(OpenCAPI)、以開放式記憶體介面(OMI)的參考設計。 國際IP授權商在中國展開切割布局 目前貿易戰打得火熱,這些IP業者,除了Arm以外,其原始指令集架構的發明都是來自美國,而即便是Arm,也有多個IP研發團隊在美國,因此,不論是指令集,或者是IP架構,都可能會踩到美國的貿易限制,如果貿易戰全面開打,那麼以上這些IP授權業者恐怕必須馬上退出中國市場。 為了避免這種最壞的狀況發生,這些公司採用了在中國設立獨立運作的公司,或者將經營權授權給當地公司,若母公司受到禁運限制,那麼理論上在中國的子公司還能持續以現有的指令集基礎開發IP,並提供授權服務。 RISC-V基金會曾表示,即便在最壞的情況下,指令集不會遭受禁運限制。而在此前提下,若自行以開源指令集開發IP,不論未來貿易戰發展到什麼程度,基本上都不會受到影響。 目前SiFive就在中國開設了一家獨立營運的公司,而MIPS則是將IP的授權及營運授權給中國本地的公司,就如Arm在中國和當地政府合資創立Arm mini China子公司一樣,都是為了規避貿易戰風險。 然而是否真能完全避免貿易戰的影響,恐怕還是要取決於美國對技術輸出的態度,若連上游製造都涵蓋進去,即便有獨立的經營體系,恐怕還是難逃制裁。 RISC-V發展最快 MIPS/IBM仍待觀察 目前RISC-V架構在中國已經建立起聯盟,進入中國市場的相關IP供應者也有不少,台灣晶心、芯原,以及最近最受關注的SiFive,都已經積極布局相關市場,提出不少方案。前不久阿里巴巴旗下的平頭哥發表基於RISC-V的高性能IP玄鐵910,可以達到16核配置,並可在2.5GHz的時脈下運作,而其IP和自訂的擴充指令集都將完全開放,這也代表中國隊RISC-V,除了既有IP供應業者之外,也積極布局完全自有的IP,這對SiFive之類的業者而言也都是挑戰。 雖然平頭哥的架構與IBM或者Arm的高性能架構比較起來還是明顯不足,但也已經是RISC-V中少見的高性能架構了。不過目前該架構仍然還在驗證與測試階段,短時間之內沒有商用的可能,但這也已經代表中國廠商希望以RISC-V布局更廣應用的決心。 若以整體局勢觀察,RISC-V目前氣勢的確強大,但實際商用腳步仍僅限小規模低功耗產品,整體市場表現以及相關產值仍遠遠落後於Arm,而MIPS及IBM之所以推出開放指令集授權方式,截擊的意味極重。 但考慮到目前RISC-V已經聚集了Google、高通、NVIDIA、三星、WD等一線半導體大廠,背後潛藏的研發能量極為龐大,若再慢一步,恐怕不久之後就連高性能計算也可能被RISC-V所取代,而這也是IBM決定在MIPS之後,跳進開放指令集架構處理器授權市場中的最大原因。 Arm壓力大 業務模式被迫調整 至於背腹受敵的Arm,雖然憑藉著成熟生態積極展開行銷戰,但既有授權模式以及指令客製化彈性的缺乏,使其面對這些開源架構,也逐漸落於下風,其主要客戶都已經逐漸轉向RISC-V。 雖然主要的運算核心,如高階Cortex-A系列仍然統治著行動運算領域,但低階的M系列,甚至針對即時運算的R系列,都面臨極嚴苛的挑戰,在RISC-V的壓力下,當初軟銀收購Arm時所誇下的海口,恐怕會複製當初伺服器市占宣言的窘況:Arm在幾年前曾宣稱要在2021年占據伺服器市場25%的比重,但至今仍未超過1%。 為了保住IoT市場的優勢,或許Arm會在未來提出更激進的授權計畫,不僅要打入更大的市場,也同時要阻擋免費架構繼續攻城掠地,影響Arm的市場布局。 在中國市場,Arm mini China主要針對的就是IoT市場,除了有自己的架構研發團隊,在授權條件上也要優於Arm全球的其他市場,然而中國市場雖大,如果因為其對中國市場的授權優惠而影響了其他國家的客戶,對Arm而言恐怕也是得不償失,也因此,或許Arm應該考慮改變授權形式,將預期營收來源轉移至其他服務部份。 事實上,Arm已經宣布有限度地支援客製化的指令集,與RISC-V頗有異曲同工之妙。通過Arm強大的設計能力來對抗RISC-V的其他IP競爭者,當然,這對於保守的Arm,肯定會是一大挑戰。
0

Wave Computing再推TritonAI 64平台 布局邊緣AI應用市場

Wave Computing積極布局人工智慧(AI)和邊緣運算(Edge Computing)。繼之前日前宣布即將開放MIPS架構(ISA),供全球半導體企業、開發人員及大學開發新一代的系統單晶片(SoC)外,該公司於近期宣布推出全新TritonAI 64平台,讓使用者可透過單一平台就能用因應各種AI應用案例;同時,該平台提供高效的邊緣推理和訓練效能,以支持當今的AI演算法,同時為使用者提供未來所需的靈活性,確保其對AI演算法的投資。 Wave Computing首席執行長Derek Meyer表示,AI邊緣應用案例正迅速的成長,因而加劇系統單晶片(SoC)設計人員的挑戰。然而,傳統的IP產品並非專為AI設計,為此,該公司推出全新的AI平台TritonAI 64,實現AI邊緣應用的所需的推理和訓練,以支援現今和未來的AI應用;同時,TritonAI 64的推出是繼2018年收購MIPS的另一個里程碑,因其增強了該公司從數據中心到邊緣裝置的AI產品線。 根據技術分析公司Tractica研究指出,到了2025年,人工智慧產品全球市場規模將超過170億美元;而AI邊緣應用的潛在市場範圍(Total Addressable Market)則超過1億美元,成長的因素來自於對於更高效能的推理運算、訓練及AI工作負載日益增加。 而Wave Computing所發布的TritonAI 64,將讓使用者可透過單一平台因應各種AI使用案例。此一平台的特性包括具備MIPS 64位元SIMD引擎,此一引擎可與Wave獨有資料流程圖(Dataflow)和以張量為基礎(Tensor-based)的可配置技術(Configurable Technology)相結合,以及MIPS整合開發環境(IDE)和基於Linux的TensorFlow編程環境。
0
- Advertisement -
- Advertisement -

最新文章

- Advertisement -

熱門文章

- Advertisement -

編輯推薦

- Advertisement -