- Advertisement -
首頁 標籤 加速器

加速器

- Advertisment -

英特爾著手研究通用API 無痛跨平台移植加速軟體發展

異質運算蓬勃發展,但軟體要跨不同的硬體平台執行,卻是相當困難的工程挑戰。近期英特爾(Intel)委託高德顧問公司(J.Gold Associate)研究軟體轉移到不同硬體運作的可能性,並提出oneAPI跨架構模型的概念。 圖 英特爾委託高德顧問公司研發oneAPI。來源:英特爾 高德顧問公司Jack Gold表示:「各式各樣的加速處理器進入市場,並且更多的應用程式工作負載可以應用這些處理器的功能,但前提是應用程式必須具備最高的兼容與彈性。像是oneAPI跨架構模型的技術進展,將有助於確保應用程式移植到新興的加速平台,開發人員不需要重寫。」 針對oneAPI的研究報告中透過一個典型的軟體開發流程,以及隨後移植軟體來使用新的加速器硬體,為企業和開發人員提供參考案例。報告同時詳細說明為何現在需要使用加速器,因而為統一軟體開發流程創造適合的時機,並分析道,如果編寫可以針對多種運算設備使用的軟體,將能避免架構受限於特定的供應商,而難以控制時間與成本。 oneAPI的研究包含三大重點: 1. 以數據為中心的工作負載,以及以最佳流程處理它們的架構將持續多樣化。 2. 當需要跨架構移植進行模型開發,若是每次都能將軟體轉移到新的運算平台,便能省下大量的金錢與時間。報告中的範例花費了五個月的時間,總共節省了30萬美元。 3. oneAPI計畫是開源且跨產業的方法,用於下一代的軟體研發,幫助開發人員的工作效率提高,同時不需要在軟體性能上妥協。 隨著英特爾著手進行統一API的研究,未來可望產生互通於CPU/GPU/FPGA/AI加速器之間,不同硬體皆通用的軟體開發體驗,不只協助軟體無痛移植加速平台,在節省時間與金錢成本的同時,活絡生態系中的協作發展。
0

簡化ADAS閘道設計 TI推低功耗處理器

德州儀器(TI)日前推出新Jacinto 7處理器平台,該平台提供強化深度學習的能力與進階網路,有利於解決先進駕駛輔助系統(ADAS)及車用閘道器應用面臨的設計挑戰,促使環境感知能力提升,並加速整合車輛數據資料運算能力。 德州儀器推出兩款車用裝置提升車輛性能。 本次推出的兩款車用裝置,具備用於區隔與促進如電腦視覺和深度學習這類數據密集型任務的專用晶片加速器。新品分別為用於ADAS的TDA4VM處理器,以及用於閘道系統的DRA829V處理器平台,兩者各包含一個功能安全微控制器,並共享同一軟體平台,除使OEM廠商和一級供應商能利用單晶片支援ASIL-D安全性關鍵任務(Safety-critical Tasks)並保有便利性外,更使開發者能在多個車輛領域中重覆使用現有已建置的軟體,降低系統複雜性與成本。 為了使車輛接收大量訊息,處理器或系統單晶片必須快速及高效即時管理多階層處理,並在系統功率預算內運作。TDA4VM處理器為此提供晶片分析,結合感測器預先處理功能,實現更高系統效能,使OEM廠商和一級供應商能以高解析度8-MP攝影機支援前置攝影機應用,讓視野更廣,同時增加駕駛輔助等先進功能。 此外,該處理器使用5到20W的低功率執行高性能ADAS運作,且無需主動冷卻;能夠同時操作4到6個3MP攝影機的特性,使該處理器將雷達、光達與超聲波等其他感應模組融合在單一晶片上,因此可作為ADAS的中央處理器,並支援自動停車中關鍵功能,如環繞景象與圖像顯示處理,提升車輛360度的環境感知系統。 隨著車用技術進步,車用閘道器亦需靈活的處理器管理大量數據,並支援不斷變化的自主需求與強化的連接性能。DRA829V處理器則加速軟體定義車輛的數據資料庫,整合現代車輛所需的計算功能及晶片上的PCIe交換器。同時亦整合支援TSN的8埠gigabit乙太網路交換器,使車輛享有更快的高性能計算和通訊功能。 兩款新裝置除了使OEM廠商與一級供應商能在單一裝置支援混合關鍵性(Mixed-criticality)應用外,其高頻寬晶片亦使開發者易管理車輛中軟體的開發與驗證,使系統得以不斷升級。
0

首款AI加速平台出鞘 Xilinx全面擁抱人工智慧

人工智慧AI發展全面展開,可編程邏輯廠商美商賽靈思(Xilinx)認為,未來已經沒有一個架構可以滿足所有的應用需求,因此該公司正式踏上轉型之路,舉辦賽靈思開發者大會(XDF),並發表未來幾年的技術與產品重點,全面擁抱人工智慧的發展趨勢,以資料中心(Data Center)為發展策略的起點,目標為打造靈活應變、萬物智慧的世界。 一直以可編程技術為發展重點的Xilinx,2018年3月正式啟動策略轉型工作,宣示該公司從元件廠商轉型為平台廠商,提出自行調適運算加速平台(Adaptive Compute Acceleration Platform, ACAP)發展核心,旋即於10月推出第一款產品Versal。Xilinx總裁暨執行長Victor Peng表示,Versal字面上是由Variety與Universal組合而成,希望在技術與應用上可以兼顧多樣性與通用性。 在AI無所不在的時代,AI應用日新月異,晶片設計週期已經落後創新的速度,因此Peng認為,FPGA彈性的特點可以應用在AI的創新上,一般新晶片設計週期高達24個月,透過ACAP平台的協助,可將AI模型加以拆解,變成數個不同的發展(Develop)、優化(Optimize)、部署(Deploy)流程,該平台動態範圍廣泛彈性,可針對不同的應用調整需要的加速範圍。 Versal ACAP結合純量處理引擎(Scalar Processing Engine)、Arm Cortex-A72與Arm Cortex-R5,以及自行調適硬體引擎(Adaptable Hardware Engine),可動態重新配置,即時加速能力最高達八倍;DSP引擎可提供高準確性浮點運算與低延遲;AI引擎具有高傳輸率、低延遲與高效率,可協助AI推論與高階訊號處理,搭配先進記憶體和介面技術,可提供強大的異質加速能力。不管是軟體開發者、資料科學家或是硬體開發者,只須利用符合業界標準設計流程的工具、軟體、函式庫、IP、中介軟體以及框架,就能針對其硬體與軟體進行編程與最佳化。據了解,Versal採用台積電7奈米FinFET製程,正式量產時間為2019年第二季。 Xilinx也以現有UltraScale+ FPGA為基礎,發表Alveo U200與Alveo U250加速卡,就機器學習而言,Alveo U250的即時推論傳輸率比高階CPU高出20倍,甚至在低於2毫秒的低延遲應用方面,也比高階GPU這類固定功能加速器高出4倍。此外,Alveo加速器卡的延遲較GPU減少3倍,在資料庫搜尋等應用方面大幅加速、並提供較CPU高出90倍的效能。 Xilinx總裁暨執行長Victor Peng表示,FPGA靈活彈性將有助AI創新應用發展。  
0
- Advertisement -
- Advertisement -

最新文章

- Advertisement -

熱門文章

- Advertisement -

編輯推薦

- Advertisement -