FPGA
Xilinx/華為攜手發布FPGA雲端視訊串流解決方案
賽靈思(Xilinx)、華為(Huawei)和NGCodec近日宣布開發出中國第一款雲端高效率視訊編碼(HVEC)解決方案,其獨家採用賽靈思Virtex UltraScale+ FPGA和NGCodec H.265視訊編碼器。該技術將進駐華為雲FPGA加速雲端伺服器(HUAWEI CLOUD FACS),並在2018年底前開始上線,率先在中國的可擴展雲端基礎架構中,落實廣電級品質的即時串流解決方案。
賽靈思雲端視訊部門資深行銷經理Sean Gardner表示,賽靈思FPGA技術與NGCodec HEVC編碼器的獨特組合,能落實一系列以往無法達成的解決方案。華為透過率先在自己的雲端基礎設施上運行FPGA,來提供高解析度且即時的視訊串流,並將其導入中國即時視訊串流市場,進而引領產業發展。
視訊串流是中國一項重要的作業負載,企業紛紛盡力推出基礎設施,以滿足視訊串流快速增長衍生的強勁需求。在過去,企業採用GPU來運行HVEC解碼器,但若使用賽靈思FPGA來運行,能提供相同的視覺品質、並將位元速率降低 35~45%,進而大幅節省頻寬及儲存成本。
華為雲HEVC解決方案能以每秒60幀的速度提供1080p的畫質,且未來能達到每秒120幀的速率,除此之外,它能迅速整合至現有的視訊工作流程(Workflow),為核心視訊功能加速。
Xilinx推新資料中心/AI加速器卡
自行調適與智慧運算廠商賽靈思近日推出強大加速器卡Alveo,用來大幅提高業界標準伺服器的效能,應用版圖涵蓋雲端與就地部屬(On-Premise)的資料中心。透過Alveo,客戶在執行即時機器學習推論、影片處理、基因研究、及資料分析等這類重要資料中心應用時,就能在低延遲的情況下,展現突破性的效能改善。搭載賽靈思UltraScale+FPGA的Alveo U200與Alveo U250現已開放大量訂購,客戶可重新配置硬體,藉以針對持續變化的作業負載、新標準、及更新後的演算法進行最佳化,省下替換產品衍生的成本。
Alveo加速器卡為各種類型應用帶來顯著的效能優勢。在機器學習方面,Alveo U250的即時推論傳輸率比高階CPU高出20倍,甚至在低於2毫秒的低延遲應用方面,也比像高階GPU這類固定功能加速器高出4倍。此外,Alveo加速器卡的延遲比GPU減少了3倍,在執行即時推論應用方面帶來顯著的優勢而在像是資料庫搜尋等應用方面,能大幅加速、並提供比CPU高出90倍的效能。
Alveo背後有整個產業體系夥伴與OEM廠商的全力支持,他們開發與驗證各種重要應用,包含人工智慧/機器學習、影片轉碼、資料分析、金融風險模型、安全、以及基因研究等領域。此外,多家頂尖OEM廠商正與賽靈思合作,聯手驗證多種伺服器產品與Alveo加速器卡的相容性。
Xilinx AI轉型拉攏資料中心 劍指Intel、NVIDIA
自行調適與智慧運算廠商賽靈思(Xilinx),多年來以可編程邏輯元件技術立足產業,為了在人工智慧(AI)的創新浪潮中注入下一波成長動能,啟動成立以來最大規模的轉型工程,並在日前的北京賽靈思開發者大會(XDF)中,積極與大陸雲端服務業者華為、阿里巴巴、浪潮等公司合作,搶占AI運算/推論市場,與布局較早的GPU、CPU競逐雲端AI應用大餅。
FPGA最大的特點就是靈活的可程式化與高運算能力,過去常被用在需要高運算效能或創新應用尚未發展出適合的ASIC時,面對AI浪潮席捲,AI無所不在的時代即將來臨,為搶占廣大的深度學習網路運算市場,各類運算平台積極布局AI運算,包括Intel為首的CPU、NVIDIA為主的GPU,FPGA龍頭Xilinx也投入,雲端AI運算市場競爭激烈,各家廠商積極合縱連橫布局產業生態系(ecosystem)。
以投入較早的NVIDIA為例,目前在AI競爭當中取得暫時的領先,該公司目前已經發展一系列的硬體晶片與板卡,搭配完善的開發環境、AI深度學習框架、軟體函式庫等,產業鏈初具型態;而昔日資訊運算霸主Intel,近年則是透過許多投資與併購,希望能扭轉CPU不適合深度學習運算的劣勢。相較之下起步較晚的Xilinx今年大動作投入,走向平台化並創建自行調適運算加速平台(Adaptive Compute Acceleration Platform, ACAP),Xilinx總裁暨執行長Victor Peng表示,首款產品Versal就採用最先進的台積電7奈米FinFET製程。
在北京XDF Peng強調,ACAP可以透過彈性化的調整,協助整體應用的加速,縮短執行時間,而不是只最佳化機器學習流程。Versal將發展成一系列的產品解決方案,包括應用廣泛的Prime、強化推論功能的AI Core、低功耗的AI Edge、高速傳輸的Premium、整合RF功能的AI RF、整合記憶體堆疊,應用在高階資料中心的HBM。
而在這個階段,Xilinx也以資料中心為其發展的優先戰略,XDF中並與中國大型雲端服務業者華為、阿里巴巴、浪潮結盟。華為智能計算業務副總裁張小華說明,採用華為雲技術,華為硬體以及Xilinx FPGA,建構一套統一的線上線下協同平台,採用相同的生態系統、環境資料、共同的安全協議以及管理協議。
阿里巴巴FPGA異構計算研發總監張振祥則說,阿里雲FPGA已經發展到第三代產品與架構服務,隨著未來新架構上市,當能提供更迅速更確實並安全的運算服務。浪潮集團副總裁李金指出,該公司致力於打造AI全面性的產品布局,從運算平台高效的管理系統套件到深度學習框架的最佳化、終端解決方案四個層次為客戶提供迅速、高效、最佳化的AI運算基礎設施。
瑞薩電子推單一封裝簡化型數位電源模組
瑞薩電子宣布推出新型的單一封裝數位DC/DC PMBus電源模組系列產品。這五顆RAA210xxx簡化型數位電源模組,提供先進的數位遙測與優越性能,而且與瑞薩的類比電源模組同樣易於使用。
該模組都是完整的降壓且穩壓的電源,分別可提供25A、33A、雙25A、50A和70A的輸出電流,而且採用工業標準的12V或5V輸入電壓軌。在伺服器、儲存裝置、光纖網路和電信設備內,RAA210xxx系列為其中使用的先進FPGA、DSP、ASIC和記憶體,提供負載端(Point-of-Load,POL)的電壓轉換。每顆模組都在熱最佳化的高密度陣列(High Density Array,HDA)封裝模組內,整合了PWM控制器、MOSFET、電感器和被動元件。完成電源電路只需要外加大容量的輸入電容器和輸出電容器。
RAA210xxx是成本更低的簡化型數位電源模組系列產品,與瑞薩的全功能數位ISL827xM系列產品接腳相容。RAA210xxx簡化型數位電源模組提供運行時的數位可程式性,可透過PMBus命令子集來支援配置更改,並且具備完整的遙測與系統監控。如果以後需要更高級的數位控制,就升級到接腳相容的ISL827xM模組,升級後可以實現與多顆模組並聯來共享電流,也可以使用PowerNavigator工具存取完整版PMBus命令,還可以用非揮發性記憶體來做為配置的儲存裝置。
首款AI加速平台出鞘 Xilinx全面擁抱人工智慧
人工智慧AI發展全面展開,可編程邏輯廠商美商賽靈思(Xilinx)認為,未來已經沒有一個架構可以滿足所有的應用需求,因此該公司正式踏上轉型之路,舉辦賽靈思開發者大會(XDF),並發表未來幾年的技術與產品重點,全面擁抱人工智慧的發展趨勢,以資料中心(Data Center)為發展策略的起點,目標為打造靈活應變、萬物智慧的世界。
一直以可編程技術為發展重點的Xilinx,2018年3月正式啟動策略轉型工作,宣示該公司從元件廠商轉型為平台廠商,提出自行調適運算加速平台(Adaptive Compute Acceleration Platform, ACAP)發展核心,旋即於10月推出第一款產品Versal。Xilinx總裁暨執行長Victor Peng表示,Versal字面上是由Variety與Universal組合而成,希望在技術與應用上可以兼顧多樣性與通用性。
在AI無所不在的時代,AI應用日新月異,晶片設計週期已經落後創新的速度,因此Peng認為,FPGA彈性的特點可以應用在AI的創新上,一般新晶片設計週期高達24個月,透過ACAP平台的協助,可將AI模型加以拆解,變成數個不同的發展(Develop)、優化(Optimize)、部署(Deploy)流程,該平台動態範圍廣泛彈性,可針對不同的應用調整需要的加速範圍。
Versal ACAP結合純量處理引擎(Scalar Processing Engine)、Arm Cortex-A72與Arm Cortex-R5,以及自行調適硬體引擎(Adaptable Hardware Engine),可動態重新配置,即時加速能力最高達八倍;DSP引擎可提供高準確性浮點運算與低延遲;AI引擎具有高傳輸率、低延遲與高效率,可協助AI推論與高階訊號處理,搭配先進記憶體和介面技術,可提供強大的異質加速能力。不管是軟體開發者、資料科學家或是硬體開發者,只須利用符合業界標準設計流程的工具、軟體、函式庫、IP、中介軟體以及框架,就能針對其硬體與軟體進行編程與最佳化。據了解,Versal採用台積電7奈米FinFET製程,正式量產時間為2019年第二季。
Xilinx也以現有UltraScale+ FPGA為基礎,發表Alveo U200與Alveo U250加速卡,就機器學習而言,Alveo U250的即時推論傳輸率比高階CPU高出20倍,甚至在低於2毫秒的低延遲應用方面,也比高階GPU這類固定功能加速器高出4倍。此外,Alveo加速器卡的延遲較GPU減少3倍,在資料庫搜尋等應用方面大幅加速、並提供較CPU高出90倍的效能。
Xilinx總裁暨執行長Victor Peng表示,FPGA靈活彈性將有助AI創新應用發展。
Arm攜手Xilinx推出免授權費處理器
全球IP矽智財授權廠商Arm近日宣布與Xilinx公司攜手合作,透過強化版Arm DesignStart計畫,將Cortex-M的優勢帶至FPGA,挹注開發者全新動能,以迅速、免費、簡單的途徑取得Arm IP。
隨著科技持續快速發展並突破疆界,各界對於產品設計彈性的需求也隨之提高,預期在2016到2022年之間,現場可編程邏輯閘陣列(Field Programmable Gate Array, FPGA)與可編程邏輯元件(Programmable Logic Devices, PLD)的出貨量將成長74%。然而這也使OEM廠商面臨更大的壓力,必須在更少的投資下以更快的速度開發出具彈性且應用最佳化的設計。
為因應這些需求,開發者務必得輕易取得各界最廣為採用的處理器,以及陣容最廣泛的軟體、工具與專業知識,包括FPGA、SoC、或單板電腦(Single Board Computers, SBC)等領域。
Arm與FPGA市場領導者Xilinx公司合作,雙方聯手透過Arm DesignStart計畫,將Arm Cortex-M處理器的各項優勢導入FPGA,為Xilinx旗下各產品系列提供可擴充與標準化的處理器架構。業界如今不僅完全不必投入成本就能快速取得成熟的處理器IP,還能運用Xilinx的各項工具以及完備的軟體開發解決方案,輕易進行設計的整合工作,以FPGA加快成功的腳步。Cortex-M處理器除了讓嵌入式開發者有機會設計出有充分把握的創新方案,還能受益於簡化的軟體開發流程以及卓越的程式碼密度。
大聯大推用於智慧城市/IoT邊緣計算的智慧相機
致力於亞太區市場的領先零組件通路商大聯大控股近日宣布,旗下友尚集團將推出英特爾(Intel)應用於智慧城市與物聯網邊緣計算的智慧相機。
邊緣計算搭配人工智慧可以一起解決物聯網所帶來的大量數據。物聯網時代來臨,隨著設備的不斷增加,數據的數量也將巨幅增加。以攝影機為例,隨著市場趨勢變化,攝影機的解析度從720P、1080P轉到4K,其一天所產生的資料量將達到200GB,不僅如此,自駕車、智慧醫療及智慧工廠一天所產生的數據資料將超過1PB。若不斷將這些巨量資料上傳到雲端,雲端服務器將面臨巨大的儲存壓力,同時也產生相當可觀的成本。因此Intel提出可應用於智慧攝影機邊緣計算及AI的解決方案,讓最靠近端點的設備具有運算與分析能力,將收集到的資料在端點做處理與分析,將具有價值的資料再打包傳送到雲端,此可有效降低對網路頻寬的需求,提供即時的數據處理能力。
物聯網中不同的網路資源所需的計算資源需求不同,加上人工智慧部署,其需要不同特性的硬體平台,以及軟硬體合作改善。在智慧相機平台上,涵蓋英特爾的處理器、Movidius神經網路處理器和FPGA、網路以及儲存技術等領先而完整的硬體平台,以及OpenVINO Toolkit與函數庫,改善開放原始碼框架。
瑞薩IP解決方案支援AI/自駕子系統
瑞薩電子近日宣布擴大其廣泛的智財權(IP)授權陣容,使設計人員能夠在產業瞬息萬變的情況下滿足廣泛的客製化需求。瑞薩在其微控制器(MCU)和系統單晶片(SoC)產品範圍內整合了廣泛的IP,包括中央處理器(CPU)IP,通訊介面IP,計時器IP,記憶體IP和類比IP等。瑞薩將提供客戶其IP產品組合中最受歡迎的資產。第一批產品將包括超過40個IP授權,包括CPU核心(如RX、SH等)、馬達應用的計時器IP、USB核心和SRAM等。未來將根據客戶需求提供更多授權。
瑞薩開發了大量的IP解決方案。包括了獨立的CPU和周邊IP模組,以及連接到IP模組的子系統,如匯流排控制器或中斷控制器。這所有的IP資產所具有的高可靠性和高品質,業界期望能由一家涵蓋設計到製造等所有階段的垂直整合半導體元件供應商來提供。而身為半導體製造商,瑞薩以他人難以望其項背的專業知識為基礎,也提供技術支援。
對於有興趣為人工智慧(AI)、自動駕駛汽車和機器人等應用開發客製化晶片的製造商可以在其子系統設計中利用瑞薩IP,使他們能夠專注於開發自己的競爭性IP資產,從而加速先進的半導體開發流程。此外,使用現場可編程閘陣列(FPGA)元件進行早期開發的製造商,則可以利用瑞薩的IP資產來加速軟體開發,從而實現早期評估並加快產品上市時間,以立即導入量產。
ADI推出±0.5%精度監控器
Analog Devices(ADI)宣布推出Power by Linear LTC2962-LTC2964系列,該高精準度4通道電壓監控器系列可提高系統電壓裕量和可靠性。低至1V電源操作的ASIC、FPGA、DSP、MCU和MPU架構不能使用精度為1%~2%的傳統電壓監控器,否則會縮減寶貴的系統電壓裕量和縮減剩餘的負載操作電壓範圍。LTC2962系列具有領先的±0.5%重置門檻精度,可放寬對電源的要求,增加系統對瞬變的容限,並支援較低的標準電源,而能大幅降低功耗。LTC2962系列憑藉其高準確度、靈活的1V至5V(或可調)復位門檻和寬廣的操作溫度範圍滿足了網路、電信和汽車應用等多種需求。
獨特的特性組合使LTC2962系列在低功耗電壓監控器市場上別具一格,成為許多多電源軌應用的絕佳選擇。每通道可在精度為±0.5%的16個預設的或可調的電壓閾值中,輕鬆地進行選擇用以監控欠壓、過壓或負壓狀況。監控電路負責監控輸入,並根據設計門檻驅動輸出。或者,也可使用手動重置輸入,用一個按鈕開關強制執行系統重置。另外一個選項則具備可調計時器的看門狗(LTC2963-1)和每個通道的單獨比較器Open-Drain輸出(LTC2964)。該系列的所有元件均提供可調逾時週期。
LTC2962系列現可提供多種溫度等級,包括:0°C至70°C(C等級)、–40°C至85°C(I等級)、和–40°C至125°C(H等級)。LTC2962採用16接腳3mm×3mm QFN封裝,而LTC2963-1和LTC2964則採用20接腳3mm×4mm QFN 封裝。
AI帶動數據分析需求 Intel推FPGA加速卡迎戰
由於人工智慧(AI)、物聯網(IoT)等等技術的出現,全球的數據資料量正在快速增加。可程式化邏輯閘陣列(FPGA)具備低功耗、低延遲等特性,適合導入於邊緣運算應用之中。在未來,CPU、FPGA、ASIC等各種處理架構更將隨著不同應用出現而有更多整合的需求。針對以上趨勢英特爾(Intel)已推出對應解決方案,以迎接挑戰。
英特爾可程式化解決方案事業群亞太區總經理暨業務總監Ro Chawla指出,目前全球所累積的數據資料中,90%是在過去兩年內創造出來,可以想見全球數據資料量的成長速度相當驚人,該趨勢也為數據處理帶來挑戰。而FPGA的出現正是為了要解決巨量數據資料處理目前所面臨的瓶頸。
Chawla進一步指出,展望未來FPGA市場發展,整體FPGA市場預計將在2020年達到75億美元,加速器市場更有望在2021年達到200億美元。加速器市場不僅是包含FPGA,也包含了GPU與ASIC處理架構。
由於資料量的爆炸性成長,資料中心營運商需要保持大規模效能需求和營運效率之間的平衡。如富士通、戴爾 EMC等OEM廠商,亦在其伺服器系列中採用了英特爾可程式加速卡 (Programmable Acceleration Cards, PAC)。這是可程式化晶片的重要發展,旨在加速今日新型態資料中心的主流應用,憑藉出色的多功能性和速度,可支援處理從資料分析到金融服務的各項工作負載。
英特爾可程式化解決方案事業部業務經理林士元指出,目前FPGA的應用領域以數據中心為大宗,也由於大數據的重要性持續存在,因此數據中心也一直都是FPGA的重要應用領域。
除了數據中心應用之外,由於FPGA具備低功耗、低延遲等優點,也能符合邊緣運算的處理需求。以影像辨識為例,GPU雖在影像處理、訓練模形方面有極佳的表現,然而GPU的功耗較高,約可達到150W以上;相比之下,FPGA 50~60W的低功耗更適合做為邊緣運算使用。
Chawla提及,沒有任何一種處理器架構可以獨立解決所有的應用問題,因此技術趨勢將轉向異構計算架構。英特爾所推出的Open VINO架構能做到異構運算,適用於各種處理架構,未來也將會看到更多異構應用可能出現。
林士元更指出,目前英特爾已開始關注投資安防監控市場,該市場未來更有望成為FPGA成長最快的應用領域。也已經有廠商與Intel合作,開始將FPGA與加速器架構導入至人臉辨識、車牌辨識的邊緣運算應用之中。