- Advertisement -
首頁 標籤 FPGA

FPGA

- Advertisment -

MINIEYE/Xilinx攜手推一站式ADAS感測解決方案

專注於研發自動駕駛感測系統的MINIEYE,在2019年美國消費電子大展(CES)上宣布與賽靈思攜手,在開發一站式ADAS感測解決方案(Turnkey Sensing Solution)上達成技術合作。雙方透過將MINIEYE的IP運行於賽靈思Zynq-7000 SoC和Zynq UltraScale+車規級MPSoC平台上,來共同滿足全球L0至L3等級的自動駕駛需求。 MINIEYE創始人暨CEO劉國清博士指出,透過將MINIEYE自主研發的感測IP運行在賽靈思的車規級晶片上,能夠同時支援20多類交通物體(Traffic Object)的精確辨識與分析、對車外和車內進行環境感知,並且支援多路視訊或雷達等其他感測器的訊號輸入,這些功能主要用於應對不同自動駕駛功能對環境感知的複雜需求。藉由結合MINIEYE演算法與賽靈思晶片的技術優勢,這些解決方案能夠幫助OEM和Tier 1車廠在獲得需求功能的前提下,降低成本,提高效率。 MINIEYE充分運用賽靈思車規級晶片在保持低能耗的同時,達到高精度之深度神經網路(DNN)的優勢,其前裝產品已經應用於許多主流OEM的車型當中。 兩者合作的解決方案能支援客戶落實差異化的視覺演算法,在同一顆賽靈思FPGA晶片上,既能部署MINIEYE的感測演算法,也能部署OEM、Tier 1車廠的自有演算法。此外,賽靈思SoC的硬體和軟體都可以進行編程,因此在方案部署中或者之後,均可添加新特性或者新功能,以滿足NACP在不同國家與地區的更新要求。
0

ML提升機器視覺應用彈性 SI業務發展路更寬

機器視覺在製造業應用存在已久,但過去的機器視覺本質上是以規則為基礎的專家系統(Rule-based Expert System),不具備自主學習的能力,能處理的問題範疇也較為專一。這也使得機器視覺的系統整合商(SI)規模普遍不大,但在特定領域有非常深厚的技術累積。以機器學習(ML)為基礎的機器視覺系統,則可能改變這個產業風貌,讓SI更容易跨入不同領域。 研華網路暨通訊事業群資深協理林俊杰指出,機器視覺在製造業應用已經有相當長的一段歷史,且隨著檢測對象不同,分化出許多次領域,例如針對電子元件、電路板的自動化光學檢測(AOI)、針對產品組裝的視覺校準/對位,乃至成品/半成品的外觀瑕疵檢測等,都可以歸類於機器視覺的範疇。但現有機器視覺系統的核心,多半是以規則為基礎的軟體程式,當工業相機拍攝到過去從未見過的影像,取得的特徵值無法對應回既有的軟體系統時,就會很容易出現誤判或無法識別。 這使得機器視覺系統的設計規畫跟布署,變成一項非常仰賴專家的工作。唯有針對某一類應用有深入研究,並且累積了大量經驗的SI,才能寫出符合生產線需求機器視覺軟體。而且,某個特定領域的專家,要跨到其他機器視覺的領域,也不是那麼容易的事情。 基於機器學習(ML)的機器視覺,則是完全不同的典範。一套辨識模型或演算法,經過不同的資料集訓練,就可以辨識出不同型態的圖樣,而且隨著工業相機取得的影像資料越多,累積的訓練資料增加,系統辨識的準確度還有機會進一步改善。 另一方面,對機器視覺SI業者而言,基於ML的視覺系統還有更容易跨領域應用的優勢。例如一個經過訓練的免洗杯辨識演算法,只要稍加調整跟再訓練,就可以用來辨識不同種類的杯子,例如玻璃杯、馬克杯,因為這些杯子都有一些共通的特徵值。如果是傳統的機器視覺軟體,開發過程就得從頭來過。 不過,對大多數基於機器學習的系統來說,訓練資料的數量跟品質,還是許多開發者所面臨的最大難題,基於機器學習的機器視覺也不例外。現在許多網路大廠都已經提供雲端訓練工具,因此,開發者要訓練自己的模型,門檻已經比以往大為降低,但要取得足夠且高品質的訓練資料集,還是要投入很多資源。 近幾年中國掀起人工智慧熱潮,也促成一個新的行業--資料標籤公司誕生,但這些專門提供資料標籤建置的服務業者,通常沒有足夠的能力處理工業製程中所拍攝的影像。舉例來說,金屬加工件的邊緣出現毛邊,但程度要多嚴重才應該被判定不良品,就只有那個行業的老師傅能準確判斷,不在該行業的標籤建置人員很難做好這項工作。因此,即便是採用機器學習技術,SI想要跨到新的領域,還是有一定門檻要跨過。 此外,目前機器學習最理想的開發平台是GPU,因為GPU有最好的軟體適應性,設計迭代最方便,但如果是要布署到生產現場,GPU可能就不是那麼理想,因為GPU的功耗較高,有時還是需要搭配主動式散熱。但很多生產現場是不允許散熱風扇存在的,例如烤漆作業區,因為環境裡有粉塵,不只容易導致風扇故障,萬一有火花產生,還有可能引發爆炸。 相較之下,FPGA是比較適合布署在現場的運算硬體平台,但FPGA的設計迭代過程比GPU耗時,軟體修改後,硬體描述語言(HDL)也要跟著調整,才能實現最佳化。因此,機器視覺系統要改以機器學習為基礎,並大量普及到工業現場,還需要一些時間來醞釀。但整體來說,因為以機器學習為基礎的機器視覺,對各種應用情境的適應能力較佳,因此長期來看,SI或軟體開發者應該還是會逐漸轉向機器學習。  
0

東芝推高效能/低功耗/低成本結構陣列開發平台

東芝電子元件及儲存裝置株式會社推出全新130nm製程、以節點為基礎的FFSA(Fit Fast Structured Array),其為客製化系統級晶片(SoC)開發平台,具備高效能、低成本和低功耗的特點。 東芝提供適合客戶企業環境客製化需求的專用積體電路(ASIC)和FFSA平台,同時也為客製化SoC開發提供高效率解決方案。FFSA元件採用矽基母片,晶圓母片上部金屬層可提供客戶用於客製化設計的整合。FFSA只需客製幾層光罩板,即可實現近ASIC的功能且比單獨ASIC開發所需的NRE成本低。低開發成本的優勢,並能夠比傳統ASIC於短時間內提供樣品並實現量產。此外,FFSA使用ASIC設計方法及其資料庫,可超越現行可程式邏輯閘陣列(FPGA)達到更高的效能和更低的功耗。 130nm製程系列與東芝現有的28nm、40nm和65nm製程產品組合一起,使得FFSA™成為目前工業設備市場更適合的解決方案。 透過該平台設計的130nm FFSA元件將由東芝電子元件及儲存裝置株式會社旗下子公司Japan Semiconductor製造,其在ASIC、ASSP和MCU微控制器製造方面歷史悠久、擁有實力及技術,可確保長期供貨並滿足業務客戶連續性的計畫需求。工業設備、通訊設施、辦公設備和消費產品市場可望實現穩步擴張,而該新系列可以提供所需的效能和整合。
0

Xilinx全球總裁暨執行長榮獲年度創新者獎

自行調適與智慧運算的全球領導廠商賽靈思(Xilinx)近日宣布其總裁暨執行長Victor Peng獲頒2018年ASPENCORE全球電子成就獎(WEAA)之年度創新者獎項(Innovator of the Year)。 此外,賽靈思旗下Zynq UltraScale+ RFSoC亦榮獲處理器/DSP/FPGA類別的年度最佳產品獎殊榮。Zynq UltraScale+ RFSoC系列將多頻帶且多模的蜂巢式無線電與有線基礎設施等主要子系統整合至一個SoC平台中,此平台包含採用多功能64位元四核Arm Cortex A53及雙核Arm Cortex-R5的處理系統。 Peng表示,感到非常榮幸能獲得WEAA評審的青睞選為年度創新者,並與賽靈思RFSoC解決方案同時獲得肯定。往後將致力讓賽靈思在現今靈活應變的智慧運算世界中持續轉型與演進。對於賽靈思來說,現在是個令人振奮的時刻,期盼帶領賽靈思邁入下一個創新階段。 自今年一月上任賽靈思執行長後,Peng即推出多項企業轉型計畫,透過新科技來因應新市場的需求,其中重大進展包含ACAP(自行調適運算加速平台)的發布。在10月舉辦的賽靈思開發者論壇(XDF)中已發表業界第一款ACAP元件「Versal」,及全新系列的高效能資料中心加速器卡「Alveo」。
0

ADI降壓型穩壓器縮減高功率密度應用布局面積

Analog Devices(ADI)宣布推出Power by Linear LTC3310S,其為一款5V、10A低EMI單晶式同步降壓型轉換器。該元件的固定頻率峰值電流模式架構非常適合要求快速瞬變響應的高降壓比應用。LTC3310S整合熱點迴圈旁路電容的Silent Switcher2架構,得以實現高效率、小布局面積解決方案(在高達5MHz頻率時)及卓越的EMI性能。多相操作可實現多個元件的直接並聯,以提供較高的輸出電流。 LTC3310S的2.25V至5.5V輸入範圍可支援包括大多數中間匯流排電壓等多種應用。內建低阻抗的MOSFET可提供高達10A的連續負載電流,熱效影響極少。0.5V至VIN的輸出電壓範圍非常適合負載點應用,如高電流/低電壓DSP/FPGA/GPU/ASIC參考設計。其他主要應用包括光網路、電信/資料通訊和汽車系統、分散式電源架構和一般中高功率密度系統。 LTC3310S的35ns低最短導通時間可在高頻下實現高降壓比電源。100%工作週期操作提供低電壓差性能,操作頻率可同步至外部時脈。在–40°C至125°C的接面溫度操作範圍內,LTC3310S擁有±1%總體參考電壓精度。其他特點包括指示輸出處於穩壓狀態的電源良好訊號、精準致能門檻、輸出過壓保護、熱保護關機、晶片溫度監視器、時脈同步、模式選擇和輸出短路保護。
0

微銳超算的FPGA超級電腦新產品Smart-VSC5問世

國內高效能運算領域知名企業江蘇微銳超算科技有限公司在賽靈思開發者論壇(XDF)上發布針對基因組資料處理的FPGA超算新產品--Smart-VSC5超級電腦系統。該產品具有低功耗、高效能、高密度、高可靠性特點,是基因組資料高效能處理劃時代產品,引起了業內各界人士強烈關注。XDF是一個連接軟硬體及系統開發者與賽靈思及合作夥伴和業界領袖並進行深度交流的產業盛會。 精準醫療時代,健康和醫療行為需要根據每個人的基因資訊來客製,這催生了基因定序市場的繁榮。隨著定序價格的下降,幾千塊錢就能測定整個人基因組,但分析這龐大資料的成本很高,也限制了基因組定序在醫療領域的廣泛應用。微銳超算專家通過深度分析,認為基因資料量巨大固然是分析成本高的重要原因之一,但更重要的是基因組資料處理具有運算密集、記憶離散、I/O密集等特點,這對傳統運算平台提出了新挑戰,造成分析運算成本居高不下。 此次發布的Smart-VSC5超級電腦系統充分考慮其運算的特殊要求,具有低功耗、高效能、高密度、高可靠性特點,預計會平均降低基因資料處理運算成本一個數量級。據瞭解,江蘇微銳超算科技有限公司是針對產業應用FPGA超級電腦解決方案知名供應商。公司聚焦超級電腦系統面臨的高能耗挑戰,根據各專業領域不同運算特點,自主研發了Smart-VSC系列FPGA超級電腦,目前已在指紋辨識、人臉辨識、金融運算等領域成功開展應用。
0

ADI高功率µModule穩壓器降低資料中心冷卻需求

Analog Devices(ADI)日前發表LTM470 降壓型DC-DC電源穩壓器,進一步擴充其Power by Linear µModule穩壓器系列。該元件兼具同類產品最高功率和用以降低資料中心基礎設施冷卻需求的高能效。新型電源µModule可提供雙路50A或單路100A配置,創新封裝技術使其在伺服器密度增加及資料中心輸送量和運算能力提升時所對系統尺寸和冷卻成本的影響微乎其微。 LTM4700 µModule的高整合性,及內建元件級封裝(Component-on-Package)設計納入了晶片上記憶體、資料轉換電路和數位介面,尺寸僅約競爭元件的一半。元件應用包括雲端運算、高速運算和光纖網路系統、通訊基礎設施、PCIe板,以及醫療、工業和測試與量測設備。 高效冷卻是影響全球資料中心的一個關鍵問題。更高輸送量、雲端運算服務等不斷成長的需求為目前的資料中心基礎設施造成了壓力,而衍生出對於新散熱方法的需求。LTM4700解決了這個問題,使資料中心營運業者能提高伺服器的密度和性能。 透過創新散熱封裝技術,LTM4700的操作溫度為73°C,而競爭對手提供的模組化解決方案之操作溫度則通常為90°C。在高達70°C的環境溫度和具有200 LFM氣流的情況下,LTM4700可在12VIN至0.8VOUT的轉換中提供100A的全負載電流。在12VIN至0.8VOUT轉換操作時峰值轉換效率為90%。而µModule架構使系統設計人員能組合最多8個元件,提供高達800A的負載電流以因應資料中心處理器的較高功率需求,包括FPGA、ASIC、GPU和微控制器。
0

整合SD-FEC模組 FPGA傳輸率/功耗更優化

所有實例中的資料通道都不是理想通道,它們受到不斷變動的品質等級影響,導致接收到的數據產生錯誤。4G/5G無線、DOCSIS有線,以及微波回程等這類典型通道皆不是理想通道,因此系統工程師在設計這些系統時,必須達到位元錯誤率(BER)等多種指標評估的預先定義效能標準。 運用可靠的前向錯誤修正(FEC)演算法,如低密度奇偶檢查(LDPC)和渦輪SD-FEC,有助於系統設計師設計出接近通道向農容量(Shannon Capacity)的高階通訊系統。但執行這類SD-FEC編碼演算法並不容易,常常需要具備專業的領域知識。FPGA常用於執行SD-FEC演算法,因為FPGA的高效能可編程邏輯、記憶體、DSP、I/O和SerDes非常適用於滿足大量可變精度算數運算和高記憶體頻寬的需求。然而,為了支援數十億位元資料速率而進一步提高系統要求時,效能、功耗與成本,便成為重要的設計因素,而且軟建置(Soft Implementation)與整合解決方案相比,可能效能欠佳。 若要在FPGA可編程邏輯上建置SD-FEC演算法,不僅會擁有強大的運算力,還需要大量的資源。也因此,有晶片商在FPGA之中導入整合型SD-FEC IP,保持FPGA的靈活性與可編程性,使其能達成以下效能: .緩解效能與傳輸率瓶頸,約3Gbps峰值LDPC解碼傳輸率。 .大量減少資源占用,每個SD-FEC實例節省約10萬LUT。 .顯著降低功耗,採用整合解決方案降低80%的耗電。 圖1 典型資料通訊系統原理圖 FPGA朝軟決策FEC和反覆解碼演進 FEC的需求能劃分為多個不同類別,包含語音、視訊會議、重播視訊和非即時資料(表1)。以LTE為例,針對資料與語音服務部署4G/LTE固定無線寬頻時,服務品質(QoS)是網路規畫與設計的重點。 長期以來,雖已成功使用串接里德-所羅門(RS)編碼和卷積編碼搭配Viterbi解碼,但採用軟決策解碼能使該方案進一步提升效率,因為它提高約3dB的編碼增益。3dB編碼增益代表在同樣效能下,訊號在通道內的傳輸距離倍增。 然而,隨著朝多級QAM(能支援DOCSIS3.1高達4096-QAM)等這類更複雜調變方案演進,該類系統提供的位元能量雜訊比(Eb/No)內之有效BER也在增加。因此,已解調的位元更容易受到通道劣化的影響。採用功能更強的SD-FEC方案,才能讓這些系統滿足它們需要的效能需求。 為了滿足表1中各種QoS要求(語音、資料、視訊等)的原生BER需求,反覆解碼方案的使用越來越廣泛。與卷積代碼使用的Viterbi解碼相比,Turbo和LDPC代碼屬於反覆運算代碼,且通常需要每位元進行更多運算以獲得最佳效能,他們能讓系統接近理論上的向農極限(Shannon Limit)。這兩種編碼方案已接近成熟並被眾多應用採用,且在4G/5G無線和DOCSIS 3.1中被認為是確實可行的。 導入SD-FEC模組 FPGA處理效能再升級 為覆蓋多種類型的應用,半導體商在FPGA中導入整合型SD-FEC模組,例如賽靈思旗下的Zynq UltraScale+ RFSoC元件。在整合到包含Arm®Cortex-A53處理器的SoC架構中時,SD-FEC模組可配備或不配備數十億次採樣的RF資料轉換器。這些元件提供了一個功能豐富的平台,包括DSP、通用處理器(GPP)、可編程邏輯和已最佳化的RF訊號處理塊(如DUC和DDC)。 5G新無線電無線基頻系統等這類需要較高資料傳輸率、較低延遲及提高編碼效能的系統,在採用可編程邏輯的解決方案中,需要使用更多的一般可編程邏輯資源來執行所需的SD-FEC需求。LUT、記憶體和布線等資源的占用增加,加上設計速度加快,將導致功耗增加,最終導致解決方案成本的增加。若在單個元件內提供八個SD-FEC整合模組,就能在單個Zynq UltraScale+ RFSoC內達到整個系統的傳輸率。 此外,SD-FEC支援的Zynq UltraScale+RFSoC在結合高速RF資料轉換器後,能為有線/DOCSIS 3.1遠端PHY等應用提供高度靈活的解決方案,提供在單個元件中創建全雙工解決方案的機會;且以SD-FEC為例,整合該IP模組能帶來下列優勢: .減少可編程邏輯資源占用。 .節省功耗。 .縮短開發時程,包含預先驗證IP功能與時序、由軟體和工具提供支援的流程。 .與軟建置相比預計能達到更高的效能,實現低延遲、高傳輸率。 .可配置性帶來高靈活性。 以上這些優勢綜合起來能獲得較低成本的解決方案,同時還能支援更多其它應用,例如4G/5G無線(基頻和回程),在Wi-Fi和5G新無線電的LTE和LDPC中使用的渦輪代碼;有線存取,在DOCSIS 3.1遠端PHY中使用的LDPC代碼;以及微波鏈路等。 SD-FEC IP具有三種工作模式 整合型SD-FEC IP的高階視角圖請參閱圖2。SD-FEC模組有三種工作模式,但每次只能啟用其中一種: 圖2 SD-FEC原理圖 .LDPC編碼 .LDPC碼 .渦輪解碼(LTE) 選擇此三種模式是因為底層演算法已發展成熟,設計人員在權衡屬性和設計執行取捨方面都能得心應手。 多種客戶規格的類循環(QC)代碼都支援LDPC編解碼。雖然SD-FEC是一種整合型IP,但SD-FEC模組具備高度可配置性,其參數記憶體內能儲存高達128個代碼,而且可逐塊選擇代碼,而且添加客製代碼的能力也使得模組具備高度靈活性。SD-FEC是一種具備反覆解碼能力的軟決策解碼器,能夠提前終止並節省功耗。至於渦輪解碼支援4G LTE-Advanced和LTE-Pro的應用,與LDPC解碼器類似,能提前終止支援反覆解碼。傳輸率隨不同代碼和應用而變化,如5G新無線電使用DOCSIS 3.1。 SD-FEC傳輸率符合5G需求 SD-FEC的峰值傳輸率為: .6次反覆運算約1.8Gbps渦輪解碼速度 .8次反覆運算約3.0Gbps LDPC解碼速度 .約20.0Gbps LDPC編碼速度 使用SD-FEC能達到的最大傳輸率取決於運行在667MHz FMAX下時所選擇的代碼、代碼速率和解碼器反覆數量。表2展示了支援的峰值系統組態,同時也支援這些配置的子集合,如四個LDPC解碼器配四個LDPC編碼器。因此,Zynq UltraScale+ RFSoC適用於5G無線應用,且能提供完整的平台解決方案,請參閱圖3。 圖3 Zynq UltraScale+ RFSoC支援5G無線平台解決方案 該系列為無線回程提供了同時整合RF-ADC/DAC和SD-FEC模組的元件。此外,對於遠端無線電頭端(RRH)設備來說,配備RF-ADC/DAC但無SD-FEC功能的元件就能滿足客戶需求。最後,基頻單元(BBU)內沒有類比需求,但是在第一層(Layer...
0

ACAP平台彈性/智慧高 Xilinx轉型全面擁抱AI

2012年的ImageNet機器學習影像辨識學術競賽,被喻為是正式掀起這一波人工智慧(Artificial Intelligence, AI)浪潮的關鍵活動之一,GPU平行運算架構在圖形辨識上的高效能,讓深度學習網路可以大幅增加層數,以提升影像辨識準確率;也旋即於2015年以3.57%的錯誤率超越人眼,揭開AI產業化與產業AI化的大門,運算平台除了近期超熱門的GPU之外,CPU、FPGA與新興的神經網路處理器(NPU),更亟欲搶占AI深度學習網路運算與推論市場大餅。 人工智慧發展全面展開,可編程邏輯廠商美商賽靈思(Xilinx)認為,未來已經沒有一個架構可以滿足所有的應用需求,因此該公司正式踏上轉型之路,2018年3月啟動策略轉型工作,宣示從元件廠商轉型為平台廠商,提出自行調適運算加速平台(Adaptive Compute Acceleration Platform, ACAP),並舉辦賽靈思開發者大會(XDF),發表未來幾年的技術與產品重點,全面擁抱人工智慧的發展趨勢,以資料中心(Data Center)為發展策略的起點,目標為打造靈活應變、萬物智慧的世界。 自行調適/運算加速/平台化策略 多年來以可編程邏輯元件技術立足產業的Xilinx,為了在AI的創新浪潮中注入下一波成長動能,啟動成立以來最大規模的轉型工程,Xilinx總裁暨執行長Victor Peng(圖1)表示,在AI無所不在的時代,相關應用日新月異,晶片設計週期已經落後創新的速度,FPGA彈性的特點則可以應用在AI的創新上。目前一般新晶片設計週期高達24個月,透過ACAP平台的協助,可將AI模型加以拆解,變成數個不同的發展(Develop)、優化(Optimize)、部署(Deploy)流程,該平台動態範圍廣泛彈性,可針對不同的應用調整需要的加速範圍。 圖1 Xilinx總裁暨執行長Victor Peng表示,該公司自行調適運算加速平台ACAP目標為打造靈活應變、萬物智慧的世界。 因此Xilinx未來不再是元件供應商,而是平台化解決方案開發與供應商。而資料爆炸、AI興起、摩爾定律放緩,顛覆了原有的市場和業務,Peng認為,平台策略在這樣的大環境下中也就顯得更加重要,系統和基礎設施在全球迅速擴張,對於運算能力和頻寬也有了前所未有的要求。同時,也要更加迅速地滿足不斷變化的要求和標準。就像自然界「物競天擇,適者生存」的自然法則一樣,在數位世界,靈活應變的系統也是最具彈性和可持續性的。 Xilinx於10月推出第一款ACAP平台產品Versal,Peng指出,Versal字面上是由Variety與Universal組合而成,希望在技術與應用上可以兼顧多樣性與通用性。Peng強調,ACAP平台是整體軟體的堆疊,不僅僅是晶片,還包括高整合度工具、最佳化函式庫、作業系統等,還有AI框架標準,只須利用符合業界標準設計的流程就能針對其硬體與軟體進行編程與最佳化,針對整體應用的加速,而不僅止於深度學習網路。 Versal架構專為AI應用開發 Versal的架構將發展兩個系列、六個應用區隔,兩個系列以有無AI核心為主要差異,未搭載AI引擎的系列,運算能力由低至高為Prime、Premium以及HBM三個產品線;而搭載AI引擎的系列,主要以應用區隔為AI核心、AI邊緣以及AI RF系列。未搭載AI引擎系列,針對市場上廣泛適用性進行設計,並就作業負載的連結與線上加速進行最佳化。搭載AI核心的系列,針對雲端、網路以及自駕車應用進行最佳化,該系列配有5個元件,並提供128至400個AI引擎。 在架構上,Xilinx FPGA與SoC產品管理暨行銷資深總監Kirk Saban(圖2)解釋,Versal架構中有幾個主要的核心,包括:純量處理引擎(Scalar Processing Engine),搭載Arm Cortex-A72與Arm Cortex R5應用處理器,還有可完全軟體編程的平台管理控制器;自行調適硬體引擎(Adaptable Hardware Engine),可動態重新配置,即時加速能力最高達八倍;DSP引擎可提供高準確性浮點運算與低延遲,針對客製化資料路徑的細微性控制;AI引擎具有高傳輸率、低延遲與高效率,可協助AI推論與高階訊號處理,搭配先進記憶體和介面技術,可提供強大的異質加速能力。 圖2 Xilinx FPGA與SoC產品管理暨行銷資深總監Kirk Saban解釋,自行調適硬體引擎,可動態重新配置,即時加速能力最高達八倍。 而在軟體支援與開發環境部分,Xilinx軟體業務執行副總裁Salil Raje說,AI人工智慧有兩個階段,訓練和推論。在訓練階段,資料科學家將海量的資料放到模型中,然後微調模型、改善模型以減少誤差,之後將訓練模型部署到應用當中。在推論過程當中,資料量相對較少,在推論階段,回應速度與功耗就顯得更加重要,如果部署在搭載電池的邊緣設備當中,要盡量降低功耗。未來幾年,推論需求的成長性將明顯高於訓練(圖3)。 圖3 AI推論需求將持續攀升 資料來源:Barclays Research(05/2018) AI創新與應用日新月異 而推論帶來的挑戰包括:AI創新的速度,低延遲、高通量和高效能與整體的應用加速。Raje指出,幾年前AI關注圖像的分類以及推薦的引擎,但是AI應用和AI模型的使用數量成長的速度非常快,包括目標識別、分割、語音辨識、異常檢測等,在每個應用當中都有很多的創新發生在AI的模式上。2012年的AlexNet促成AI模型的大爆炸,在過去六年,絕大多數的創新都是為了改善精確度。最近則是想提高AI模型的效率,以應用於行動裝置和IoT終端。 現在AI的應用、AI模型和精度方面有很多的創新,Raje舉例,有一個最先進的深度學習網路,等專為其設計的晶片生產時,技術已經產生了變化,此固定功能晶片,只為了支援一個舊的網路架構。所以固定晶片架構不是好選項,要靈活應變的硬體如賽靈思FPGA和ACAP元件,使得使用者能夠客製資料流程以針對最先進的網路,同時可彈性調整,而不需更換晶片。靈活應變的硬體也能夠客製記憶體的層次結構,可以用更多的On...
0

三星電子採用賽靈思SmartSSD解決方案

自行調適與智慧運算廠商賽靈思近日於矽谷(Silicon Valley)與北京舉辦了賽靈思開發者大會(XDF),並宣布加速人工智慧和資料中心應用的Versal與Alveo兩大產品系列。另外,三星電子於近日舉行的Samsung Tech Day,也宣布推出採用賽靈思FPGA技術的SSD--SmartSSD,透過使資料更接近運算單元來達到更高效能,並超越了CPU的局限。 採用賽靈思FPGA的三星SmartSSD,有助於推動如高效能運算、人工智慧與新興應用等新一代資料中心的未來創新,它將智慧推進至資料儲存位置,進而提高速度和效率,並降低營運成本。 舉例來說,一般尋找一隻貓的圖片,系統必須透過伺服器CPU傳輸資料,接著傳至記憶體,再傳回CPU,最後才能傳給使用者。若讓記憶體本身直接搜尋「貓」,不僅能夠大幅提升效能,還能降低功耗,這就是SmartSSD的優勢所在。 目前採用賽靈思FPGA的加速解決方案主要針對語音辨識、視訊轉換程式和基因組學等運算應用,並且部署在靠近伺服器CPU的位置。相較之下,SmartSSD專注於壓縮、冗餘消除和加密等加速儲存服務,以及像機器學習推論和大數據分析等運算功能,這些功能可以從更接近實際儲存元件的加速中顯著受益。SmartSSD為應用開發者生態系統提供了一個平台方案,與部署在伺服器CPU附近的賽靈思加速器類似,支援他們透過熟悉的SDAccel環境來開發和部署加速解決方案。
0
- Advertisement -
- Advertisement -

最新文章

- Advertisement -

熱門文章

- Advertisement -

編輯推薦

- Advertisement -