GPU
Arm新GPU虛擬化功能驅動次世代車用體驗
根據主要車廠的意見,消費者希望在車內享受類似智慧手機體驗的需求越來越高。事實上,儘管當下經濟大環境不佳,但從照後鏡的替代科技、到抬頭顯示器,為消費者帶來不同創新、並驅動更多車內顯示螢幕的需求仍然沒變。
這些對於更沉浸、更類似智慧手機的車載體驗的需求,讓 Arm 處於獨特的位置。Arm作為數位駕駛艙解決方案(85%)的車載資訊娛樂(IVI)解決方案)與智慧手機的廠商(99% 的全球智慧手機都是建構在 Arm 的技術上)、上述兩種應用領域的專業能力,都一起應用在 Arm Mali 影像處理器(GPU)。Mali GPU 是業界出貨量第一的影像 IP,也是全球無所不在的影像處理器。
隨著車載顯示器需求的提升,在這些顯示器上運行更先進的應用的機會也同步增加。Arm為了協助龐大生態系中為數眾多的開發人員可以應對這些需求,發表全新版本的 Arm Mali 驅動程式開發套件(DDK),以便與 Mali GPU 一起支援數位駕駛艙使用場景的關鍵需求。Arm 為各個顯示螢幕帶來無縫的、順暢的影像處理的經驗,代表 Mali GPU 與 Mali DDK...
安提國際推新高效智慧邊緣運算系統
AI解決方案已經廣泛的應用在各產業之中,且AI的運算核心也逐漸從雲端轉移至邊緣端,邊緣運算在企業智慧化服務中佔有一席之地。為了發展更多的應用方案,GPGPU和智慧邊緣運算解決方案供應商安提國際發表了全新的AN110-XNX邊緣運算平台。結合NVIDIA Jetson Xavier NX 運算模組和AN110載板,外型大小精巧,但擁有高達21 TOPS的運算效能,不僅可以驅動邊緣端的智慧應用,如智慧交通、工廠、零售、醫療等,也可以打造全自動的機器人設備。
AN110-XNX的小型化設計,包含風扇的尺寸僅87.4x68.2x52 mm,但卻蘊藏更強大的AI運算能力。全新Jetson Xavier NX擁有384個 CUDA核心、48個 Tensor核心、6個Carmel ARM CPU處理器,以及2個NVDIA深度學習加速器,讓NX模組能夠提供高達 21 兆次的運算能力。這大幅度地擴展開發人員和客戶當前的可用選擇—需要高性能的嵌入式邊緣運算系統卻受限於大小、重量、功耗、預算或成本的AI應用。
AN110-XNX支援MIPI CSI-II介面的相機,可搭載1個4K或2個FHD相機,在廣泛的智慧視覺應用中,安提的平台能夠驅動多功能的AI解決方案,同時處理高解析度相機與影像分析所要求的高密集人工智慧運算量。同時,安提國際AN110-XNX平台另有提供帶機殼版本AN110-XNX-EN70,提供顧客多元選擇並快速落地使用。在安提國際智慧邊緣系統加值服務的內容中,提供安提標準品及客製品項的BSP及DTB架構更新。而針對NX模組,安提國際規畫更進一步的計畫,5G通訊與邊緣裝置的遠端管理功能,皆會實踐在這樣的智慧邊緣解決方案上,以應付持續擴大的人工智慧市場需求。
安提國際產品經理朱鴻欽表示,NVIDIA為當前邊緣運算解決方案的領頭羊,安提今年與其鏈結合作夥伴網絡,能夠更深入透過他們的運算模組,來打造更多適切的應用。安提長期專注於長期供貨的嵌入式產品與工業領域適用的解決方案,NVIDIA Jetson系列具有雲端的原生功能,模組緊湊的設計提供良好的AI運算能力,搭配安提設計周詳的載板,讓系統能夠輕易部署和快速整合生成邊緣AI應用。
宸曜GPU人工智慧電腦再獲百度指定為自駕開發硬體平台
宸曜科技 (Neousys)最新推出的GPU人工智慧平台-Nuvo-8108GC成為百度阿波羅自動駕駛最新開發套件3.0版本(Baidu Autonomous Driving Development Kit, Apollo D-kit)中的獨家合作硬體平台,自百度Apollo 1.0以來,持續擔任自動駕駛技術平台的運算與控制中心,提供強大運算能力及高穩定度。
百度Apollo自動駕駛平台擁有177家生態合作夥伴(截至2019年年底),包含全球各大汽車製造商、晶片公司、感測器公司、交通系統整合商等,囊括從硬體到軟體的完整供應鏈。在這次Apollo D-kit 3.0中,最大亮點之一即是作為自動駕駛核心的運算與控制中心- Nuvo-8108GC,其所搭載的CPU和GPU皆獲得大幅度升級。配置於百度Apollo所提供的軟硬體及雲端服務結合的方案中,能滿足開發者的各種自動駕駛應用需求。
宸曜科技的Nuvo-8108GC是一台兼具工業等級設計及車載應用功能的強固型 GPU運算人工智慧平台,支援 250W NVIDIA GPU高階影像顯示卡和Intel Xeon E系列或第九代/第八代 Intel Core處理器,配備宸曜科技獨特的散熱設計、可靠的電源輸入與抗震設計,其高算力與穩固性非常適合運用在自動駕駛、視覺檢測和智慧監控等新興人工智慧產業。
宸曜科技產品經理鄧博元表示,宸曜科技的GPU人工智慧平台提供寬溫、寬電壓以及抗震結構等強固設計,讓擁有強大運算處理能力的GPU電腦可被部署於環境嚴苛的垂直應用場域。自百度Apollo 1.0開始,此次的Nuvo-8108GC是宸曜科技與Apollo自動駕駛開發平台合作的第三款機型,是對GPU運算平台在自動駕駛應用的一大肯定。
宸曜科技致力於將AI推理應用從實驗室推動到對可靠性要求更高的現場應用,於此也將持續開發運算能力與強固性並進的GPU運算人工智慧平台。
英特爾著手研究通用API 無痛跨平台移植加速軟體發展
異質運算蓬勃發展,但軟體要跨不同的硬體平台執行,卻是相當困難的工程挑戰。近期英特爾(Intel)委託高德顧問公司(J.Gold Associate)研究軟體轉移到不同硬體運作的可能性,並提出oneAPI跨架構模型的概念。
圖 英特爾委託高德顧問公司研發oneAPI。來源:英特爾
高德顧問公司Jack Gold表示:「各式各樣的加速處理器進入市場,並且更多的應用程式工作負載可以應用這些處理器的功能,但前提是應用程式必須具備最高的兼容與彈性。像是oneAPI跨架構模型的技術進展,將有助於確保應用程式移植到新興的加速平台,開發人員不需要重寫。」
針對oneAPI的研究報告中透過一個典型的軟體開發流程,以及隨後移植軟體來使用新的加速器硬體,為企業和開發人員提供參考案例。報告同時詳細說明為何現在需要使用加速器,因而為統一軟體開發流程創造適合的時機,並分析道,如果編寫可以針對多種運算設備使用的軟體,將能避免架構受限於特定的供應商,而難以控制時間與成本。
oneAPI的研究包含三大重點:
1. 以數據為中心的工作負載,以及以最佳流程處理它們的架構將持續多樣化。
2. 當需要跨架構移植進行模型開發,若是每次都能將軟體轉移到新的運算平台,便能省下大量的金錢與時間。報告中的範例花費了五個月的時間,總共節省了30萬美元。
3. oneAPI計畫是開源且跨產業的方法,用於下一代的軟體研發,幫助開發人員的工作效率提高,同時不需要在軟體性能上妥協。
隨著英特爾著手進行統一API的研究,未來可望產生互通於CPU/GPU/FPGA/AI加速器之間,不同硬體皆通用的軟體開發體驗,不只協助軟體無痛移植加速平台,在節省時間與金錢成本的同時,活絡生態系中的協作發展。
宸曜新推支援NVIDIA T4 GPU AI強固嵌入式電腦
宸曜科技(Neousys)日前宣布推出新一代邊緣運算Edge AI人工智慧推理平台Nuvo-7166GC、支援NVIDIA T4 GPU圖形加速運算卡,能在邊緣運算中執行高效率的 AI智慧推理以及資料處理,進而大幅度節省上傳到雲端主機的資料量。
NVIDIA的邊緣運算平台含括了低功耗的NVIDIA Jetson Nano以至於可處理大量工作負載的NVIDIA T4機架式伺服器,Nuvo-7166GC強固嵌入式智慧平台使用宸曜科技專利的擴充式卡槽設計,替高階的NVIDIA T4 GPU提供了優質的散熱導流技術,能確保在惡劣環境下維持穩定的系統運行;除此之外,Nuvo-7166GC的擴充式卡槽還提供了一個額外的 16倍速 PCIe插槽,可用於安裝第二張附加卡,以提高系統應用的靈活性。
NVIDIA T4能在即時推理中提供65 FP16 TFLOPS以及130 INT8 TOPS的高精度運算效能,憑藉NVIDIA T4 GPU加速運算的優勢,宸曜的Nuvo-7166GC嵌入式平台專為高階的人工智慧推理應用而設計。
Nuvo-7166GC強固嵌入式智慧平台整合GbE/PoE、USB 3.1 Gen2/Gen1等連接埠口,以及可選配的CameraLink/CoaXPress影像擷取卡,可用於圖形採集和基於深度學習的視覺應用。
而Nuvo-7166GC的緊湊尺寸適合智慧醫療應用,它能利用NVIDIA T4 GPU的性能進行基於深度學習的醫學成像,提供更精確的診斷見解。此外,Nuvo-7166GC更具有豐富的I/O連接埠口,專為高階智慧推理以及邊緣運算而設計,能為醫療系統提供多種周邊連結以及靈活的擴充性能。
意法提升STM32微處理器性能 強化產品生態系統
意法半導體(ST)日前為STM32MP1系統微處理器(MPU)產品增加了新的授權合作夥伴和軟體功能,並顯著提升處理性能,將時脈速度增加至800MHz,軟體和650MHz產品相容。
Qt資深副總裁Petteri Holländer表示,Qt HMI工具包及其QML的GUI應用軟體可部署在STM32 MCU和STM32MP1平台上,在大幅降低開發成本的同時,加快客戶產品出貨週期。ST和Qt的可擴充工具套件可以輕鬆利用STM32MP1的硬體資源,尤其是3D硬體GPU加速器,為工業/物聯網應用帶來一個流暢的人機介面解決方案。
新STM32MP1 MPU搭載800MHz Arm Cortex-A7雙核心應用處理器和209MHz Cortex-M4處理器,具有優異的語音和音訊處理功能,解碼品質達到高解析度視訊級別,在神經網路和機器學習應用中,能夠帶來更強大的AI(人工智慧)功能,還能為Android系統提供更佳的使用者體驗。新產品整合運算及3D圖形加速器,兼具高效能即時控制和高整合度。
透過STM32MP1的靈活架構,新產品強化了程式碼安全保護功能,例如身分驗證安全啟動、客戶可使用一次性可程式熔絲,以及安全作業系統,意即可信賴執行環境(Open Portable Operating System Trusted Execution Environment, OP-TEE)。密鑰產生成器、數位簽章工具、STM32CubeProgrammer和硬體安全模組(STM32HSM)等整套安全工具,可將客戶的加密數據安全載入使用裝置。
OpenSTLinux Distribution為一個主線開源Linux作業系統,具備在應用處理器內核心上執行軟體所需的全部基本構件,幫助客戶加快開發週期,而現在又新增Android開發者軟體包和雲端運算的支援。意法半導體將繼續積極參與Linux社群研發,跟隨主線的策略。
電晶體密度提升速度減緩 摩爾定律越走越艱辛
引領半導體產業向前邁進的摩爾定律(Moore’s Law),近年來明顯遇到瓶頸。記憶體、處理器等使用先進邏輯製程生產的晶片,均已很難按照摩爾定律預期的速度,實現每兩年電晶體數量翻倍。
研究機構IC Insights整理英特爾(Intel)、美國半導體產業協會(SIA)等半導體公司、產業組織的資料,發現不管是DRAM、NAND Flash、CPU或GPU,這些使用最先進邏輯製程的晶片,都已經先後遇上電晶體數量成長速度放緩的問題。
以NAND Flash為例,雖然目前業界已普遍轉向3D結構,但NAND Flash的密度在2012年以後,每年成長速度就只有30~35%。英特爾CPU的電晶體數量,在2010年以前的平均成長速度還有40%,但此後的成長速度則只剩下一半。
蘋果的A系列應用處理器算是比較特別的例外,自2013年以來,A系列應用處理器的電晶體數量成長速度,還能維持在每年40%以上。
即時/安全/可靠 邊緣運算執行高效機器學習
舉例來說,如ILSVRC影像分類競賽(圖1),在這場競賽中即是使用一種稱為機器學習(ML)的人工智慧─AlexNet早在2012年就贏得這場競賽,成為第一個使用深度神經網路和GPU來進行訓練的模型;而ResNet-152在2015年的影像分類競賽中亦擊敗人類。
圖1 影像分類中機器與人類的比較
電腦優於人類的其他範例還包含遊戲,表1中的範例是機器擊敗人類冠軍以及人類仍較優秀的非競賽情境。
機器學習無疑為智慧家庭、智慧零售、智慧工廠和智慧城市之類的應用情境帶來全新美好的必要功能,且現今各種企業都能利用這項技術。運用此技術的相關機器學習雲端服務供應商有亞馬遜(Amazon) AWS、SageMaker、微軟(Microsoft) Azure ML和Google Cloud ML,而這類機器學習雲端服務的成長都極為驚人。
邊緣執行ML流程簡化
直到最近,因為推出各種運算和儲存資源,機器學習的重心都集中在執行大量集中式電腦中心的雲端,其快速移轉至邊緣有以下幾個原因:
.雲端處理、儲存空間與頻寬的成本無法將資料傳送到雲端,以執行人工智慧功能的決策。
.較完善的使用者體驗需要在邊緣進行快速的人工智慧功能決策。
.隱私權和安全性考量會限制在雲端中儲存的資料類型。
.提升可靠性。
以上這些因素讓邊緣無庸置疑成為機器學習處理許多應用的顯著位置。這也是半導體廠商推出運用專屬高效能機器學習加速器之應用處理器的原因之一,像恩智浦(NXP)的i.MX 8M Plus使用14nm FinFET製程技術,提供高效能與低功耗,並具備雙鏡頭ISP在內的各種新功能,可支援兩個低成本的HD相機感測器或一個4K相機感測器,以執行臉部、物件和手勢辨識的機器學習任務。其中也整合獨立800MHz Cortex-M7來支援即時任務與低功率、H.265和H.264的影片編碼和解碼、800MHz HiFi4 DSP,以及用於語音辨識的8PDM麥克風接口。工業物聯網功能包含Gigabit乙太網路與時效性網路(TSN)、兩個CAN-FD介面和ECC。
另一方面,資料科學家正為在邊緣上部署的資源限制裝置最佳化特定演算法,進而協助加速移轉到邊緣。MobileNet是由Google開發的影像分類演算法,著重在高準確度,同時又能大幅減少所需的運算資源數量。圖2中顯示處理過程中大幅減少的趨勢。從VGG-16模型到MobileNet v2模型的轉變讓在邊緣所需的運算數量減少50倍,協助在邊緣的資源限制硬體解決方案,執行複雜的機器學習處理。
圖2 針對邊緣最佳化的NN演算法
同樣地,使用行動電話在邊緣執行MobileNet v1比起在雲端中執行MobileNet v1的速度明顯更快,此差異的成因是將雲端網路延遲降到最低,而網路往返延遲的新增範圍可以輕易橫跨200毫秒到超過1.4秒(大幅延遲回應時間)。該演算法的目標是達低於100毫秒的回應,以即時向使用者顯示(圖3)。
圖3 在邊緣更快速的使用者體驗
以下是i.MX 8M Plus支援的應用程式,這些應用程式會在邊緣執行機器學習。如圖4所示,這些使用案例都需要特定層級的效能來判斷需要哪種層級的執行硬體。這就是應用處理器須具備專屬機器學習加速器的主因。
圖4 機器學習使用案例
因為上述原因,便可較易理解為何要在邊緣執行機器學習應用。然而,必須符合幾個額外需求才能順利完成部署:
・機器學習開發人員的生態系統─讓實作變得簡單。
・硬體安全性─保證隱私權與安全性。
・全新、創新的混合SoC架構─提供符合成本效益的解決方案。
・可擴充和安全的邊緣部署─讓部署變得容易。
打造適用於機器學習部署的全面性生態系統
機器學習應用的重大突破需要結合設計與部署的生態系統來負責處理任務,這也是半導體業者打造創新邊緣智慧工具環境的原因,以恩智浦eIQ為例,該工具支援各種機器學習處理元件,包含Arm Cortex-A和Cortex-M處理器、圖形處理器(GPU)、DSP和機器學習加速器。eIQ機器學習軟體環境包含推論引擎和程式庫,兩者皆利用開放原始碼機器學習技術中的改善技術,像是TensorFlow Lite、OpenCV、CMSIS-NN和Arm NN;而針對較熱門的i.MX RT應用處理器,則透過適用於MCUXpresso和Yocto(Linux)的開發環境進行評估,為應用開發過程提供順暢的支援;在物件偵測和語音辨識中的範例應用程式中會隨附eIQ軟體,作為邊緣機器學習的起點(圖5)。
圖5 eIQ機器學習開發環境
確保邊緣安全性
邊緣的安全性至關重要,其所需的功能包含安全啟動信賴起點、晶片內建加密、安全布建、相互裝置驗證、安全裝置管理、OTA或無線安全更新與生命週期管理。為了支援這樣的安全性,半導體業者打造了可擴充的EdgeLock組合,其中包含安全元件、安全驗證器和應用處理器的嵌入式安全以及MCU。像是i.MX 8M Plus具備進階EdgeLock嵌入式安全系統(含資源網域控制器、信任區、HAB、加密啟動、使用RSA的公開金鑰加密與橢圓曲線演算法),其可為邊緣節點提供完整性、驗證確實性和隱私,並提供從邊緣到閘道和雲端的安全性。
AI/ML領域更迭不斷 加速人們生活便利性
人工智慧領域的變化步調正逐漸加快。如圖6來自「2018年人工智慧指數」和Monster.com所示的圖表呈現深度學習職缺方面的趨勢。
圖6 2015~2017年所需人工智慧技能的職缺成長
至於圖7則顯示在公司盈餘會議中提到人工智慧和機器學習的次數。
圖7 2007~2017年公司盈餘會議提到次數-IT公司
人工智慧與機器學習為電腦產業中帶來劇烈的改變,這樣的改變可使人們的生活更便利完善。新應用處理器如i.MX 8M...
Arm GPU獲2019 Linley分析師首選獎優勝
Arm日前宣布Arm Mali-G77 GPU獲得Linley集團2019年分析師首選獎(Analysts’Choice Awards 2019),評選為「最佳處理器矽智財」類別的優勝者。
Arm終端產品事業部副總裁暨總經理Paul Williamson表示,隨著5G與AI興起,行動裝置運算需求與日俱增,消費者運用行動裝置進行更多活動,從高效能的行動遊戲到包含具有複雜機器作業負載的任務。此獎項對該公司Mali工程團隊的努力是一大肯定,不但大幅提升效能,也解決日趨多樣、需密集運算任務的需求,並讓開發人員得以針對最複雜的使用案例進行設計。
這項年度大獎旨在表彰七個不同類別的頂尖半導體產品,含AI加速器、嵌入式處理器、行動處理器、伺服器/個人電腦處理器、處理器-矽智財、網路晶片及最佳科技。
Linley集團資深分析師Mike Demler指出,在2019年分析師首選獎評選過程中考量許多矽智財,Mali-G77以其具備多項架構上的精進得以脫穎而出。除了繪圖效能與能耗效率顯著提升,行動裝置使用者在AI應用方面,也可獲得顯著效益。
Mali-G77是Arm在2019年5月發表的最新高階行動矽智財產品之一,同時也是Arm第一個基於其全新Vahall架構的高階GPU,與前一代的Mali-G76相比,行動裝置效能提升近40%。其他領域的效能也有所強化,包括機器學習效能提升60%、能源效率提升30%,以及效能密度提升30%。基於Mali-G77的高階智慧型手機,本季將開始出貨。
購併Barefoot 英特爾攻雲端市場更有底氣
Intel對外聲明,強化數據中心互聯方案,提供客戶更充沛的資源,利用高速成長的龐大數據來提升競爭力,是其認定的六項重要技術基礎之一(Process and packaging, Architecture, Memory, Interconnect, Software and Security)。而Barefoot Networks在雲端網路架構、P4可編程軟體與編譯器、交換機晶片、驅動程式軟體,網路遙測等面向具備互聯技術的專業知識,因此促成本次的併購案。
全球雲端運算應用趨勢剖析
在Amazon、Google與Microsoft等雲端大廠帶頭下,全球資料中心市場持續成長,帶動x86架構伺服器的需求,也為當中具近壟斷地位、以Xeon處理器為主力產品的Intel挹注豐厚營收。Intel資料中心事業部營收在2018年以前呈現持續成長態勢,營業利潤表現與占公司總營收比重也同步爬升,其重要性已十分明顯。
網通大廠Cisco在2018年發表之Global Cloud Index報告中指出,在雲端應用的高速發展下,2021年全球雲端資料中心流量將達19.5Zettabytes的水準(2016年為6Zettabytes),並占據各型資料中心整體95%的流量。
在上述預測下,裝載上千台伺服器、占地達萬平方英尺的超大型雲端資料中心在2021年可達628座,較2016年的水準(338座)大幅增加。上述地點屆時將占有全球資料中心53%伺服器數量、65%資料儲存量,以及55%的數據流量。
另一方面,為支援低延遲與IoT應用(多人雲端遊戲、AR/VR、智慧製造與V2X等)、分散運算與儲存等需求,相對一般資料中心規模(設備數量、場域大小、用電等面向)較小的邊緣運算市場也受到矚目。
資料中心三項主要IT設備:伺服器(Server)、儲存裝置(Storage)、交換器(Switch),在各型資料中心持續擴展下,市場穩定成長,也吸引許多業者投入開發產品。其中,從網路通訊的觀點,包括資料中心聯外的骨幹網路、機架間的連結,以及上述三大設備的通訊介面,主要有乙太網路、光纖通道與InfiniBand三大類,分別常見於伺服器/交換器、儲存裝置、高性能的超級電腦領域。
高速運算急速成長成為併購幕後推手
隨雲端資料量大幅成長,使得高速傳輸具有迫切需求,上述3大陣營持續朝100G發展。其中,由電機電子工程師學會主導的Ethernet陣營,在Cisco、Juniper、Arista、HPE、DELL等交換器與伺服器大廠主導下已朝400G、800G方向邁進,同期間另外兩個陣營則發展至200G規格。Ethernet在大廠支持、高速傳輸標準發展領先下,持續擴展在伺服器/交換器與儲存裝置的市占;InfiniBand則守住在超級電腦領域的主要地位。
Intel對於發展自有高速傳輸介面一直十分積極,最主要的布局即為2012年併購InfiniBand業者QLogic,並於2015年正式量產的「Omni-Path」規格。然而,無論在交換器(未獲多數OEM業者主力產品採用)、儲存裝置(多家大廠支持另一個開放標準)與超級電腦領域(InfiniBand主導業者Mellanox技術與市占領先),Omni-Path未能取得預期成績。因此Intel併購Barefoot後,2019年7月也宣布不再繼續發展Omni-Path藍圖,集中資源投入Ethernet後續標準與產品發展。
2019年在伺服器之核心處理器市場,Intel目前仍維持9成以上市占率,主要對手為半導體大廠AMD,持續開發高性能效率、高兼容性的第二代EPYC處理器,爭取DELL、IBM與Nokia等大廠青睞。GPU大廠NVIDIA如前文所提,更提出高於Intel之收購價,與資料中心聯網晶片Tier1業者Mellanox完成整併協議。
NVIDIA執行長黃仁勳針對此項併購,明白說明背後動機。網路資料量高速增加下,促使資料中心內部伺服器間,東西向水平資料傳輸呈現指數型成長態勢。後續,資料中心將轉變成數萬運算節點的巨型運算引擎,對於特別是雲端大廠,在建置下一代資料中心時,將採用新架構。NVIDIA已看出可能的市場變化,在硬體加速與聯網加速進行雙邊布局,來滿足客戶的潛在需求。
Broadcom/Marvell進逼交換器市場競爭更猛烈
在交換器領域,Broadcom擁有完整交換器處理器、乙太網路與Fiber Channel方案;在伺服器、儲存裝置領域也有對應的搭配產品。有別於多數對手的策略,Broadcom近兩年的併購主題鎖定軟體,包括CA Technologies與Symantec兩家業者,深化企業、資料中心市場的產品組合,為客戶提供更具成本效益與彈性的授權合作模式,成為橫跨硬軟體整體解決方案大廠。
另一家交換器晶片大廠Marvell,從2018年起也進行多個併購案。首先是2018年收購伺服器處理器知名廠商Cavium,取得其以ARM處理器架構開發的ThunderX系列產品;2019年分別買下ASIC業者Avera與乙太網路IC設計業者Aquantia。Marvell原本在伺服器、交換器、儲存裝置都有對應產品,透過上述併購增加產品完整性與技術實力,展現深耕資料中心市場的決心。
在主要對手近兩年積極布局下,Intel透過補強通訊處理器提高資料中心方案完整度,鞏固伺服器晶片市場領導地位。
放眼未來 英特爾朝擴大生態系邁進
Intel收購Barefoot的新聞,從其本身競爭力提升的角度,獲得主流媒體、市場分析機構與產業的正面評價。首先,在既有的伺服器處理器市場上,RISC與Unix搭配的ARM陣營(如Cavium)、共同屬於x86架構下的對手AMD,以及IBM等大廠之自研平台,至少目前都未對Intel在數據中心的霸主地位帶來威脅。但在NVIDIA、AMD等對手加強資料中心產品布局下,Intel做出此項回應。
Barefoot的Tofino系列主要特色在於導入開源P4程式語言而具備可編程能力,藉以執行多元數據封包功能,例如防火牆或負載平衡、效能監控和遙測。上述的重要性在於雲端大廠甚至大型企業,其資料中心未來將可能需要更多客製化的軟硬體,Intel的網路工程師未來可與客戶合作(或客戶自行開發),從晶片端就能開發專屬功能,為伺服器等設備帶入更多AI與機器學習元素,提升資料中心的自動化與運作效率。
整體而言,Intel回應主要對手NVIDIA收購Mellanox、AMD積極推出新伺服器平台的動作,併購目前在資料中心互聯產品中,具備競爭力的新創業者Barefoot。這家公司在400G乙太網路技術位於領先群,可協助Intel掌握最新通訊規格動向與產品發展能力。而環顧Intel在資料中心的方案,在Xeon和Atom伺服器晶片外,並包括Altera(Arria和Stratix FPGA方案)、Nervana(Spring Crest神經網路處理器)、Barefoot(Tofino交換器ASIC),可提出更完整的產品包裝。
Intel在併購Barefoot之前,曾在2011年以未公開的價格,收購了專門為數據中心網路設備商設計乙太網交換器晶片的Fulcrum Microsystems,這家公司當時發展了10G/40G產品,並與交換器主要業者Arista展開合作。
回顧過去8年,Intel並未充分利用Fulcrum的技術,在交換器領域發展出獲得主流業者採用之乙太網路產品。
另一方面,Intel在2012年以1.25億美元代價收購QLogic的InfiniBand資產,後續推出自有的Omni-Path規格,經過3年推廣,決定在2019年停止後續投資。上述案例大致說明,Intel發動許多併購活動,包括在網路通訊領域布局,常見後來兩種發展變化,一為Intel藉機發展自有標準並對外推廣,一為該公司技術後續未充分發揮預期能量,消失在後續相關產品藍圖中。
然而,資料中心市場在雲端大廠主導,並採用開源標準、軟體定義網路(Software-Defined Networking, SDN)、網路功能虛擬(Network Functions Virtualization, NFV)等技術下,整個生態系更加開放。後續,資料中心無論朝向超大型架構或者微型化的邊緣運算架構,天秤兩端的品牌大廠與新創小廠都擁有成長機會,為雲端服務業者與企業客戶提供基於開放軟硬體平台下的客製化產品。
上述的產業樣貌與過去PC領域不同,Intel已掌握上述趨勢,併購Barefoot後藉由其乙太網路領先且創新的技術,不再創造自有標準而於相同基礎上提出更具競爭力的產品,帶領整個生態系做大市場規模。