Intel
專訪英特爾資料中心事業群副總裁Lisa Spelman 用完善生態系優化資料中心負載
英特爾資料中心事業群副總裁暨行銷總經理Lisa Spelman表示,目前有著三大技術趨勢不斷推動資料中心的發展,分別為雲端運算、5G/Edge擴展,以及人工智慧(AI)。首先是雲端運算,雖說此一技術是三種裡面最為成熟的,但由於新興應用愈來愈多,驅使雲架構的規模和效率須不停提升,並從本地擴展到邊緣。
而在5G/Edge部分,5G的革命性在於可謂每個使用這、行業帶來新的體驗,企業能透過5G創造新的商機。而與5G相結合,愈來愈多的運算、數據產生和服務應用的位置出現的轉移,也就是從雲端轉向邊緣,且發展力道十分強勁。最後,人工智慧則是在以數據為中心的應用中迅速傳播,並將塑造整個產業、人類生活的未來。AI的顛覆性創新已從數據中心轉移至邊緣,可說已遍及各式雲端、邊緣架構,衍生各式創新應用,預計在未來的兩年中,將會有近75%的應用程序整合AI。
簡而言之,這三大趨勢的出現,驅使資料中心的工作負載出現了全新的變化,有了新的應用意味著數據的產生、收集、運算需求也愈來愈高;也因此,優化工作負載成了關鍵任務,如此一來才能實現更高的性能、新功能和更高的服務品質。
Spelman指出,為此,多年來英特爾的硬體一直在追求更高效的分析和機器學習演算法。借助第一代Xeon可擴展處理器,可透其整合的Intel AVX 512引擎賦予CPU更大的AI實力,進一步為深度學習訓練和推論工作帶來顯著的性能提升。至於新發布的第二代Xeon可擴展處理器,內建可使推論加速的DL Boost技術,以進一步促進深度學習效率。
據悉,英特爾新推出的Xeon可擴展處理器代號為「Cooper Lake」,將在每個插槽支援高達56個處理器核心,並且在標準插槽式處理器內建AI訓練加速器,該處理器預計在2020上半年問市。
Cooper Lake高核心數處理器將會沿用原先內建於Intel Xeon Platinum 9200處理器系列的功能,帶來突破性的平台效能,這些功能已經被許多要求嚴格的高效能運算系統(High Performance Computing, HPC)客戶,包括HLRN、Advania以及4Paradigm等所採用。
值得一提的是,新款Intel Xeon可擴充處理器,與標準的Intel Xeon Platinum 8200處理器相比,提供兩倍的處理器核心數(最高56核心)、更高的記憶體頻寬、以及更高的人工智慧推論(Inference)與訓練效能。透過在Intel Deep Learning Boost(Intel DL Boost)中最新加入支援的bfloat16技術,Cooper Lake將提供內建高效能人工智慧訓練加速功能的x86處理器,該產品亦與即將推出的10奈米Ice Lake處理器擁有平台相容性。
除了提供高效能的晶片之外,Spelman也說明,要妥善的利用這些數據,降低工作負載,所需的不僅僅是高效的運算方法,也須從數據的移動、儲存著手強化。為此,該公司近期收購了Barefoot...
Mobileye看好自駕潛力 強攻中韓市場
英特爾子公司Mobileye進一步擴大先進駕駛輔助系統(Advanced Driver-Assistance System, ADAS)及自動駕駛移動即服務(Mobility-as-a-Service, MaaS)的全球版圖,於CES 2020期間宣布分別與上海汽車集團(上汽集團)及韓國大邱廣域市合作,拓展該公司於全球布建自駕技術版圖,進一步提升駕駛體驗。
Mobileye持續擴展ADAS、MaaS及AV等領域版圖。
Mobileye執行長暨英特爾資深副總裁Amnon Shashua表示,該兩項新協議拓展Mobileye在MaaS和ADAS領域的全球版圖,同時進一步接近完全自動駕駛。
Mobileye首度攻入中國市場,偕上海上汽於中國布建L2+系統,使用Mobileye道路體驗管理(Road Experience Management, REM)技術及全球雲端地圖資料庫RoadBook,匯集中國道路資訊,製作高清晰度地圖以供L2+和更高自動駕駛層級車輛使用,推動中國L2+級ADAS系統布建,並提供其他OEM合作車廠進入中國地圖測繪市場的機會。
另一方面,該公司則聯手韓國大邱廣域市推動自駕MaaS布建,結合自動駕駛計程車(Robotaxis)移動服務協定,預計連同大邱廣域市(直轄市)測試、部署自動駕駛計程車移動解決方案,將自駕系統整合至車輛中,實現無人駕駛MaaS操作。
該公司於全球亦有多方合作案例,如與巴黎大眾運輸公司(RATP)聯合巴黎市政府將自動駕駛計程車(Robotaxis)導入法國市場;與中國蔚來汽車(NIO)合作生產該公司自駕系統,並銷售搭載該系統的消費者層級自駕車;聯手福斯汽車(Volkswagen)及Champion Motors的合資事業在以色列經營自動駕駛計程車隊等。
本次的兩項合作反映Mobileye針對車用市場的投入策略,包括地圖道路體驗管理、先進駕駛輔助系統(ADAS)、自動駕駛移動即服務(MaaS)和消費者自動駕駛車輛(Autonomous Vehicle, AV)等領域,據悉該公司於2019年的銷售額接近10億美元,有望於2020年達到雙位數成長;至2030年MaaS總體潛在市場規模(Total Addressable Market, TAM)將達1,600億美元,拓展其於ADAS領域的地位。
購併Barefoot 英特爾攻雲端市場更有底氣
Intel對外聲明,強化數據中心互聯方案,提供客戶更充沛的資源,利用高速成長的龐大數據來提升競爭力,是其認定的六項重要技術基礎之一(Process and packaging, Architecture, Memory, Interconnect, Software and Security)。而Barefoot Networks在雲端網路架構、P4可編程軟體與編譯器、交換機晶片、驅動程式軟體,網路遙測等面向具備互聯技術的專業知識,因此促成本次的併購案。
全球雲端運算應用趨勢剖析
在Amazon、Google與Microsoft等雲端大廠帶頭下,全球資料中心市場持續成長,帶動x86架構伺服器的需求,也為當中具近壟斷地位、以Xeon處理器為主力產品的Intel挹注豐厚營收。Intel資料中心事業部營收在2018年以前呈現持續成長態勢,營業利潤表現與占公司總營收比重也同步爬升,其重要性已十分明顯。
網通大廠Cisco在2018年發表之Global Cloud Index報告中指出,在雲端應用的高速發展下,2021年全球雲端資料中心流量將達19.5Zettabytes的水準(2016年為6Zettabytes),並占據各型資料中心整體95%的流量。
在上述預測下,裝載上千台伺服器、占地達萬平方英尺的超大型雲端資料中心在2021年可達628座,較2016年的水準(338座)大幅增加。上述地點屆時將占有全球資料中心53%伺服器數量、65%資料儲存量,以及55%的數據流量。
另一方面,為支援低延遲與IoT應用(多人雲端遊戲、AR/VR、智慧製造與V2X等)、分散運算與儲存等需求,相對一般資料中心規模(設備數量、場域大小、用電等面向)較小的邊緣運算市場也受到矚目。
資料中心三項主要IT設備:伺服器(Server)、儲存裝置(Storage)、交換器(Switch),在各型資料中心持續擴展下,市場穩定成長,也吸引許多業者投入開發產品。其中,從網路通訊的觀點,包括資料中心聯外的骨幹網路、機架間的連結,以及上述三大設備的通訊介面,主要有乙太網路、光纖通道與InfiniBand三大類,分別常見於伺服器/交換器、儲存裝置、高性能的超級電腦領域。
高速運算急速成長成為併購幕後推手
隨雲端資料量大幅成長,使得高速傳輸具有迫切需求,上述3大陣營持續朝100G發展。其中,由電機電子工程師學會主導的Ethernet陣營,在Cisco、Juniper、Arista、HPE、DELL等交換器與伺服器大廠主導下已朝400G、800G方向邁進,同期間另外兩個陣營則發展至200G規格。Ethernet在大廠支持、高速傳輸標準發展領先下,持續擴展在伺服器/交換器與儲存裝置的市占;InfiniBand則守住在超級電腦領域的主要地位。
Intel對於發展自有高速傳輸介面一直十分積極,最主要的布局即為2012年併購InfiniBand業者QLogic,並於2015年正式量產的「Omni-Path」規格。然而,無論在交換器(未獲多數OEM業者主力產品採用)、儲存裝置(多家大廠支持另一個開放標準)與超級電腦領域(InfiniBand主導業者Mellanox技術與市占領先),Omni-Path未能取得預期成績。因此Intel併購Barefoot後,2019年7月也宣布不再繼續發展Omni-Path藍圖,集中資源投入Ethernet後續標準與產品發展。
2019年在伺服器之核心處理器市場,Intel目前仍維持9成以上市占率,主要對手為半導體大廠AMD,持續開發高性能效率、高兼容性的第二代EPYC處理器,爭取DELL、IBM與Nokia等大廠青睞。GPU大廠NVIDIA如前文所提,更提出高於Intel之收購價,與資料中心聯網晶片Tier1業者Mellanox完成整併協議。
NVIDIA執行長黃仁勳針對此項併購,明白說明背後動機。網路資料量高速增加下,促使資料中心內部伺服器間,東西向水平資料傳輸呈現指數型成長態勢。後續,資料中心將轉變成數萬運算節點的巨型運算引擎,對於特別是雲端大廠,在建置下一代資料中心時,將採用新架構。NVIDIA已看出可能的市場變化,在硬體加速與聯網加速進行雙邊布局,來滿足客戶的潛在需求。
Broadcom/Marvell進逼交換器市場競爭更猛烈
在交換器領域,Broadcom擁有完整交換器處理器、乙太網路與Fiber Channel方案;在伺服器、儲存裝置領域也有對應的搭配產品。有別於多數對手的策略,Broadcom近兩年的併購主題鎖定軟體,包括CA Technologies與Symantec兩家業者,深化企業、資料中心市場的產品組合,為客戶提供更具成本效益與彈性的授權合作模式,成為橫跨硬軟體整體解決方案大廠。
另一家交換器晶片大廠Marvell,從2018年起也進行多個併購案。首先是2018年收購伺服器處理器知名廠商Cavium,取得其以ARM處理器架構開發的ThunderX系列產品;2019年分別買下ASIC業者Avera與乙太網路IC設計業者Aquantia。Marvell原本在伺服器、交換器、儲存裝置都有對應產品,透過上述併購增加產品完整性與技術實力,展現深耕資料中心市場的決心。
在主要對手近兩年積極布局下,Intel透過補強通訊處理器提高資料中心方案完整度,鞏固伺服器晶片市場領導地位。
放眼未來 英特爾朝擴大生態系邁進
Intel收購Barefoot的新聞,從其本身競爭力提升的角度,獲得主流媒體、市場分析機構與產業的正面評價。首先,在既有的伺服器處理器市場上,RISC與Unix搭配的ARM陣營(如Cavium)、共同屬於x86架構下的對手AMD,以及IBM等大廠之自研平台,至少目前都未對Intel在數據中心的霸主地位帶來威脅。但在NVIDIA、AMD等對手加強資料中心產品布局下,Intel做出此項回應。
Barefoot的Tofino系列主要特色在於導入開源P4程式語言而具備可編程能力,藉以執行多元數據封包功能,例如防火牆或負載平衡、效能監控和遙測。上述的重要性在於雲端大廠甚至大型企業,其資料中心未來將可能需要更多客製化的軟硬體,Intel的網路工程師未來可與客戶合作(或客戶自行開發),從晶片端就能開發專屬功能,為伺服器等設備帶入更多AI與機器學習元素,提升資料中心的自動化與運作效率。
整體而言,Intel回應主要對手NVIDIA收購Mellanox、AMD積極推出新伺服器平台的動作,併購目前在資料中心互聯產品中,具備競爭力的新創業者Barefoot。這家公司在400G乙太網路技術位於領先群,可協助Intel掌握最新通訊規格動向與產品發展能力。而環顧Intel在資料中心的方案,在Xeon和Atom伺服器晶片外,並包括Altera(Arria和Stratix FPGA方案)、Nervana(Spring Crest神經網路處理器)、Barefoot(Tofino交換器ASIC),可提出更完整的產品包裝。
Intel在併購Barefoot之前,曾在2011年以未公開的價格,收購了專門為數據中心網路設備商設計乙太網交換器晶片的Fulcrum Microsystems,這家公司當時發展了10G/40G產品,並與交換器主要業者Arista展開合作。
回顧過去8年,Intel並未充分利用Fulcrum的技術,在交換器領域發展出獲得主流業者採用之乙太網路產品。
另一方面,Intel在2012年以1.25億美元代價收購QLogic的InfiniBand資產,後續推出自有的Omni-Path規格,經過3年推廣,決定在2019年停止後續投資。上述案例大致說明,Intel發動許多併購活動,包括在網路通訊領域布局,常見後來兩種發展變化,一為Intel藉機發展自有標準並對外推廣,一為該公司技術後續未充分發揮預期能量,消失在後續相關產品藍圖中。
然而,資料中心市場在雲端大廠主導,並採用開源標準、軟體定義網路(Software-Defined Networking, SDN)、網路功能虛擬(Network Functions Virtualization, NFV)等技術下,整個生態系更加開放。後續,資料中心無論朝向超大型架構或者微型化的邊緣運算架構,天秤兩端的品牌大廠與新創小廠都擁有成長機會,為雲端服務業者與企業客戶提供基於開放軟硬體平台下的客製化產品。
上述的產業樣貌與過去PC領域不同,Intel已掌握上述趨勢,併購Barefoot後藉由其乙太網路領先且創新的技術,不再創造自有標準而於相同基礎上提出更具競爭力的產品,帶領整個生態系做大市場規模。
卡位MRAM/FRAM/PCRAM 半導體業者布局各有盤算
物聯網(IoT)、人工智慧(AI)、5G、工業4.0等應用推升資訊量暴漲,使得DRAM、SRAM、NAND Flash等傳統記憶體的儲存效能逐漸遇到瓶頸,同時在高速運算方面也受到了阻礙。為克服此一挑戰,產官學各界紛紛加大新興記憶體的研發以及投資力道,相關解決方案陸續問世,期能在未來取代傳統DRAM、Flash和SRAM三大記憶體產品。
MRAM成主要發展方向
新興記憶體如雨後春筍般浮現,其中MRAM備受期待的原因,除了其具備更好的儲存效能之外,另一個原因在於MRAM的特性可以滿足製程微縮需求,因此被視為極具吸引力的記憶體方案。所以,不論是學界或是半導體產業,多以MRAM為主要的發展目標,希望能早日拓展MRAM市場普及率。
三星宣布開始量產28nm FD-SOI製程eMRAM
布局MRAM市場,三星電子(Samsung)宣布已開始量產28nm FD-SOI製程的商業化嵌入式MRAM(eMRAM)解決方案。三星指出,該公司克服了eMRAM可擴展性挑戰的技術障礙,並將製程節點發展到28nm,除了實現更低成本、更佳功率、速度之外,還能讓產品依舊保有非揮發性、隨機存取和高耐久性等特徵。
據悉,基於此一製程的eMRAM解決方案可提供更好的功率、讀寫速度和更低成本等優勢。由於eMRAM不需要在寫入數據前進行抹寫循環(Erase Cycle),因此eMRAM的寫入速度和傳統快閃記憶體相比快了1,000倍。另外,eMRAM的使用電壓低於傳統快閃記憶體,具有低功耗特性,且在待機狀態下不會耗電,因此能提高能源效率。
三星晶圓代工行銷副總裁Ryan Lee表示,在克服新材料的複雜挑戰後,該公司開發了eMRAM技術,並將eMRAM與現有成熟的邏輯製程結合,以提供獨特的競爭優勢和量產可能,滿足客戶和市場需求。
透過與28nm FD-SOI製程結合,以實現更好的電晶體控制(Transistor Control)和降低洩漏電流,此一方案將可滿足MCU、IoT和AI等各式應用需求。另外,在宣布可量產28nm FD-SOI製程的eMRAM解決方案後,三星也計劃擴展其eMRAM解決方案,除了在2019開始生產1Gb eMRAM測試晶片之外,也預計2020年積極推廣18nm FD-SOI eMRAM。
結合MRAM 群聯讓SSD效能再攀升
另一方面,隨著企業伺服器應用近年來逐漸大量採用SSD已是主流趨勢,而如何透過整合各種新興記憶體技術來提升現行主流SSD的效能及可靠度也逐漸成為研發企業級SSD時不斷探討的議題。因此,群聯電子便嘗試將企業級SSD方案整合MRAM,以拓展高階儲存應用市場。
群聯電子技術長馬中迅(圖1)表示,5G將會對儲存產業帶來明顯的轉變,5G的特點包括頻寬高、速率快、延遲性低,因而可以傳輸、擷取大量的聯網裝置資料;因此,對於儲存產品而言(例如SSD),也必須要呼應到5G的特點。同時,由於AI應用的興起,高速運算的需求增加,這也會對儲存產品有更高的性能和容量要求,基於5G和AI的變化,記憶體業者開始強化儲存架構,朝更快、容量更大邁進。
圖1 群聯電子技術長馬中迅指出,5G將全面改變各種應用體驗,記憶體效能也須跟著提升。
為此,群聯宣布與Everspin策略聯盟,正式整合Everspin的1Gb STT-MRAM至群聯次世代的企業級SSD儲存解決方案設計,持續引領快閃記憶體控制晶片設計方向。
馬中迅指出,MRAM是一種非揮發性記憶體技術,其特色除了具有低功耗及讀寫速度高於NAND等之外,還包括斷電時資料不會遺失。雖說目前的記憶體技術或SSD等儲存技術也有斷電資料保存方案,但這需要一些成本、時間和技術代價,但若改用MRAM,可以進一步優化無預警斷電的資料防護機制(也就是恢復時間更快)。而SSD搭配MRAM後,更能提升SSD的效能,對於群聯持續布局企業伺服器SSD高階儲存應用市場為一大助力。
據悉,整合Everspin的1Gb STT-MRAM至群聯的快閃記憶體控制晶片設計及SSD儲存方案,將能協助該公司超大型數據中心客戶及企業OEM夥伴提升整體SSD效能、降低資料延遲,以及提升服務質量(Quality of Service, QoS)。
讓儲存更穩/更好 工研院積極研究SOT-MRAM
AI、5G等應用推升資訊量呈現爆炸性的成長,因應如此龐大的資料儲存、傳輸需求,新興記憶體備受關注。為此,工研院也致力研發新一代MRAM技術,除了引領業者創新研發方向外,也希望能藉此加快新興記憶體發展腳步。
工研院電光系統所所長吳志毅表示,5G與AI時代來臨,摩爾定律一再向下的微縮,半導體走向異質整合,不同的技術整合性越來越強,能突破既有運算限制的下世代記憶體將在未來扮演更重要角色。MRAM速度快、可靠性好,適合需要高性能的場域,像是自駕車,雲端資料中心應用等,未來應用發展潛力可期。
據悉,在MRAM技術的開發上,工研院於IEEE國際電子元件會議(International Electron Devices Meeting, IEDM)中發表自旋軌道轉矩(Spin Orbit Torque, SOT)MRAM相關的最新研究成果。
吳志毅指出,相較於台積電、三星等公司即將導入量產的第二代MRAM技術(STT-MRAM),SOT-MRAM為全球積極研究中的最新第三代技術,以寫入電流不流經元件磁性穿隧層結構的方式運作,避免現有MRAM操作時,讀、寫電流均直接通過元件對元件造成損害的狀況,同時也具備更穩定、更快速存取資料的優勢。
吳志毅補充,更重要的是,SOT-MRAM的讀寫次數更優於STT-MRAM。假設目前STT-MRAM的讀寫次數為10的10次方左右,那麼新一代SOT-MRAM的讀寫次數則可達到10的14次方左右。換言之,SOT-MRAM不僅能夠更穩定、更快速存取資料,且讀寫次數大幅增加,因而有望滿足更多高速運算應用。
FRAM方案持續問世 材料為普及挑戰
相較於其他以MRAM為主的業者,日本記憶體大廠富士通(Fujitsu)則是致力推動FRAM,並持續推出相關解決方案。例如日前富士通便發布可在攝氏高達125度的高溫下運作的新款2Mbit...
巧扮連通橋梁 AIB實現晶片/小晶片高速互連
然而,涉及晶片橋、中介層、侵蝕性幾何形狀(Aggressive Geometries)和微米級微凸點連接的新整合技術已經改變了演算法。戈登‧摩爾曾在1965年指出:「使用獨立封裝並彼此互聯的更小功能來構建的大型系統可能更為經濟。」
如今許多SoC在內核處理方面彼此相似,而特定的週邊功能卻有所不同。有的應用可能需要視覺處理;有的應用需要直接從天線獲取訊號;而有的應用需要SoC提供更多的記憶體。將這些功能分離可獲得一定的價值,比如混合搭配不同的功能,但另一個重要價值是每個功能,像是處理、類比、記憶體、數位訊號處理(DSP)等,可以在另一個不同於內核運算所用的流程上得到更好的優化。
鑒於這些功能是相互分離的(在小晶片或Tile上實施),因此我們面臨的挑戰是在保持與單晶片接近的性能和功耗的同時,將這些功能全部整合到單個封裝。透過將高級介面匯流排(AIB)與支援將多個晶片異構整合到單個封裝的封裝技術相結合,可以輕易解決這個問題(圖1)。最近發布的AIB互連方案為晶片和小晶片互連提供了一種快速、靈活且有助於輕鬆布局的方法。本白皮書介紹了AIB的高級特性和用途,並將展示各種AIB功能如何支援大規模設計和實現可靠的高速連接。
圖1 AIB應用的一個示例,其中類比前端、訊號預處理和SERDES全部通過AIB連接到FPGA實現分類和物件追蹤。
AIB目標
在過去25年中,設備到設備介面使用複雜電路透過幾根電纜實現高速傳輸;PCI Express就是其中一個例子。AIB使用全新高密度封裝技術所支援的超寬平行介面,並一舉扭轉了這一趨勢。透過以相對較低的速度運行介面的每條電纜,可以簡化每個發送器和接收器的電路,並占用很少的晶片區域。
AIB將資料從一個小晶片上的微凸塊移動到另一台相鄰設備上的微凸塊。全新高密度封裝微凸塊的間距很小,進而減少了介面所需的空間。與使用間距130或150微米的凸塊的標準倒裝晶片封裝相比,高密度封裝技術通常支援間距為55微米的微凸塊。
與只能合理使用幾百根線路的傳統介面(如採用標準技術的DDR記憶體)相比,這種小間距允許單個AIB介面支援數千個訊號。單個AIB資料線的時鐘頻率為GHz,並具有多個配置和速度選項,以確保AIB可以支援各種應用。
儘管AIB沒有指定最大時脈速率,並且最小速率非常低(50MHz),但AIB卻能夠在高頻寬下運行,每條資料線的典型資料速率為每秒2Gb。每個小晶片都記錄了其預期的時脈速率範圍,以便選擇不同設備的設計人員可以確保它們以相容的速度運行。通常,時鐘的工作頻率常在1GHz或以下,但只要介面的兩端都支援更高的速度,系統便可以支援。
AIB是一種實體層(PHY)規範(圖2);它占據了OSI參考模型中的最低級別。它的一側連接到單獨晶片或小晶片上的相應AIB介面;另一側連接到媒體存取控制器(MAC)。它僅用於從MAC中獲取資料並將其發送到連接的晶片,或者從連接的晶片接收訊號並將訊號傳遞給MAC。
圖2 AIB是一種實體層規範。
焊墊(Footprint)被設計為在微凸塊間距的範圍內盡可能小。訊號被聚集在一起,以便更有效地利用晶片的邊緣(稱為海岸線),並提供快速且較短的低偏差訊號線。對於AIB Gen1,由於AIB介面中每條資料線的資料速率為2Gbps,因此避免了訓練和訊號調節(例如均衡和預加重),以保持較小的電路尺寸。業界常見的微凸塊間距為55微米,隨著技術的發展,未來的AIB支援低至10微米的微凸塊間距。
AIB配置
AIB有兩種基本配置。AIB Base適用於需要最少電路的羽量級實施。AIB Plus可以處理更高速度,並支援高速狀態下的可靠運行。
由於支援DDR功能,所以AIB Plus介面可以在2Gbps範圍內移動資料。但是,在此範圍內保持訊號偏差和收緊時序變得更加困難。延遲鎖相迴路(DLL)可幫助調整相位關係,而工作周期(Duty Cycle)校正(DCC)電路則有助於確保盡可能接近50%的時鐘工作週期。提供這些電路的初始化和校準以確保順利啟動和運行。
這兩種配置之間的最大差異與資料傳輸速率有關。AIB Base使用單倍數據速率(SDR)方案發出訊號;而除SDR外,AIB Plus還支援雙倍數據速率(DDR)訊令。借助DDR,資料可以在時鐘的上下邊緣傳輸,資料速率比SDR提高一倍(圖3)。
圖3 SDR 訊號每隔一個時鐘緣(在本例中為下降緣)進行傳輸。相比之下,DDR在下降緣和上升緣都進行傳輸,從而獲得兩倍的資料速率。
AIB架構
AIB介面包括I/O,這些I/O分組為本身可以堆疊成一列的通道。一列包含1、2、4、8、12、16或24個相同通道。55微米的微凸塊最多支持一個通道160個I/O;這個數字會隨著凸塊間距的減小而增加(圖4)。I/O塊如下所示,顯示了SDR和DDR(僅限AIB Plus)版本中的傳輸(TX)和接收(RX)塊(圖5)。
圖4 一列最多可包含24個通道;每個通道最多包含160個I/O。
圖5 SDR和DDR(僅限AIB Plus)TX和RX塊對比。
I/O方案旨在實現簡化,同時允許兩個主要安排。特定I/O將是TX或RX訊號;沒有雙向訊號。配置通道時,一個通道可以具有所有TX、所有RX或一半TX/一半RX(圖6)。
圖6 通道可以包含全TX、全RX或半TX/半RX訊號。
一方面,這種方案為處理可能正在接受輸入並將其傳遞給另一個晶片的小晶片提供了靈活性。另一方面,如果小晶片通過其接收輸入(例如記憶體)的同一介面返回結果,則可以使用平衡的TX/RX介面。
AIB有兩個介面:一個通過微凸塊連接到附近小晶片中的相應AIB介面,另一個連接到其自身小晶片中的MAC代碼。第一個介面由I/O、轉發時鐘以及初始化和校準過程中使用的控制訊號組成(圖7)。
圖7 連接到另一個AIB介面的AIB介面包含TX、RX、時鐘和控制訊號。
MAC介面則由執行與外部介面相同功能的訊號組成,但這些訊號的詳細資訊和特定電子格式有所不同。舉例來說,從MAC接收一個時鐘訊號作為單端內部訊號,而相應的時鐘訊號將作為兩個SDR訊號,並通過外部介面發送到相鄰的小晶片(即雙端時鐘)(圖8)。
圖8 儘管格式不同,但AIB到MAC介面包含與AIB到AIB介面相似的訊號。
高資料速率功能
在GHz速率傳輸下,時序很緊湊。訊號到訊號的偏移很重要,同樣地,時鐘到訊號的偏移和抖動也很重要。當時鐘的兩個邊緣都用於資料傳輸(DDR)時,工作周期也很關鍵。因此,AIB塊中已包含一些功能,尤其是支援雙倍數據傳輸速率的AIB Plus配置。
轉發時鐘
為確保在接收AIB塊中成功接收資料,用於傳輸資料的時鐘被轉發到接收端,後者可用於捕捉資料。該時鐘將進入到MAC中,因此AIB中不一定有時鐘域變更,但MAC中可能有變更。AIB Base和AIB Plus配置均提供此功能(圖9)。
圖9 兩種AIB配置都提供時鐘轉發,其中TX時鐘以雙端形式發送,以便針對正在傳輸的資料保持低偏移。
時鐘訊號以雙端時鐘的形式轉發,同時發送真實版本和反相版本,以將其重新轉換回接收端的單端時鐘。這樣可以保持時鐘訊號的品質,因為在重新組合雙端時鐘時,時鐘上的共模雜訊會消失。由於使用I/O單元發送時鐘的兩個版本以及資料,因此可確保邊緣對齊。
接收域時鐘
某些小晶片可能沒有自己的獨立時鐘源,而是傾向于利用與其相連的晶片或小晶片的時鐘。例如,記憶體可能只是在訪問該記憶體的CPU晶片的時鐘上運行。
還是以記憶體/CPU為例,當記憶體接收資料時,例如要獲取資料的位址,轉發時鐘將使記憶體與CPU晶片保持同步。但是,當記憶體發送回提取的資料時,它需要一個時鐘,並且轉發時鐘僅影響接收捕捉,而不影響傳輸。因此,可以將CPU晶片時鐘(在本例中為從記憶體中接收資料的時鐘)作為記憶體的傳輸時鐘。該時鐘被稱為接收域時鐘,僅在AIB Plus介面中可用。
在圖10中,可以看到使用接收域時鐘的TX單元。在本例中,該時鐘被發送到MAC。在MAC中,該時鐘將被返回並用於傳輸時鐘,然後將其轉發回接收端。在這種情況下,轉發時鐘實際上與原始接收時鐘相同,因此看上去效率很低。但該圖會讓人產生一些誤解,因為各種時鐘訊號都不完全相同,它們的相位不同。透過獲取接收域時鐘並將其轉發回接收端,可以確保該時鐘與正在傳輸的資料之間的邊緣對齊。請注意,儘管MAC接收了接收域時鐘,但並不需要使用它傳輸資料;它可能有一個單獨的時鐘域用來傳輸資料。以下僅是一種可能的配置。
圖10 AIB Plus介面可以使用接收域時鐘進行傳輸(然後將其轉發回接收域)。
工作周期校正
對於DDR資料交換,根據規範,用於時鐘的工作周期變化幅度不能超過3%,因為兩個邊緣均用於資料計時。在沒有說明的情況下,1Ghz(意味著2Gbps資料)是一個極為嚴格的規範。因此,AIB Plus指定工作周期校正(DCC)模組。從技術上來說,校正塊不是必須的,但是實際使用中極有可能需要它(圖11)。
圖11 工作周期校正電路說明滿足AIB Plus介面上DDR資料交換的嚴格工作周期規範。
前向時鐘相位調整
同樣,在DDR連接的接收端,前向時鐘可能在發送和接收小晶片之間增加額外的偏差。在這樣的速率下,微小的相移可能引發問題,因此需要為AIB Plus指定延遲鎖相迴路。這也是可選的,但是極有可能需要它來確保在系統在所有情況下都能平穩運行(圖12)。
圖12 延遲鎖相迴路可幫助糾正任何鎖相失真,後者會限制AIB Plus介面上的運行速度。
重定時
在雙倍數據速率下,透過AIB介面輸出資料的ASIC或FPGA難以滿足資料路徑時序的要求。AIB Plus實施具有對I/O模組之前的模組進行重定時的選項。使用者可以靈活定義重定時的工作方式。可以簡單地使用一個或兩個寄存器分解資料路徑,以便更輕鬆在完整的電路上實現時序收斂;也可透過增加FIFO添加時鐘相位補償(圖13)。
圖13 可選的AIB Plus重定時塊可幫助簡化ASIC或FPGA時序收斂
例如英特爾的FPGA應用通常使用相位補償FIFO,即使晶片將相同的參考時鐘用於內核和I/O,這些時鐘的相位差也可能差異巨大或未知。相位補償FIFO確保正確的跨時鐘-相位域,一般來說,AIB並不指定重定時的具體方式,但很可能需要至少一個重定時觸發器。
AIB物理布局
AIB的設計簡化了與小晶片的連接,通道內的訊號在凸塊行中消除。凸塊行的數量保持最低,此外,必須滿足線路長度和路由的要求(圖14)。將AIB訊號分配給微凸塊影響了該平衡,凸塊分配也進行了調整,使凸塊之間的線路在長度上大致相等,最大限度減少中介層引發的訊號偏移。
圖14 55微米微凸塊被交錯安排在每一行中。凸塊被分配以確保線路長度較短且相同。
所有訊號均並列,最大限度降低了介面對凸塊布局的影響。例如,其他任何非AIB訊號都不會將凸塊放置於AIB使用的任何區域內。這也規定了如何使用晶片或小晶片端AIB介面的最小海岸線。當然,產生的總海岸線將取決於每通道的訊號數量和一列中的通道數量(圖15)。
圖15 AIB連接可以通過中介層上的線路實現,也可以使用英特爾EMIB橋接等橋接技術實現。
在正常AIB操作期間,介面兩端沒有差別。但是在啟動期間,兩端中的一端需要控制並跟蹤初始化和校準序列。只有在啟動階段,介面的一端做為主控埠,另一端做為從埠。無論介面是主控埠還是從埠,都將記錄在晶片或小晶片資料表中。主控埠必須連接從埠,從埠必須連接主控埠(圖16)。
圖16 AIB主控埠必須連接AIB從埠;AIB從埠必須連接AIB主控埠。
在某些實例中,可能需要一定的靈活性,以便將介面的一端做為主控埠或從埠。這種介面被稱作雙模介面,如果連接主控埠,可以將其配置為從埠;如果連接從埠,可以將其配置為主控埠。
雖然每列的所有通道都是相同的,但為了方便起見,通道都進行了編號。這些編號對AIB來說沒有任何意義,而且所有通道都可以用於任何用途。不過在某些情況下,如果通道在OSI堆疊中以較高的級別連接,那麼對於特定應用來說,不同的通道之間有著順序和重要性之分。根據小晶片的排列方向,通道可以反向連接。
換句話說,如果有12條通道,那麼在某些情況下,一側的通道0可以連接另一側的通道0,而在另一些情況下,通道0可能連接通道11。大多數情況下,通道0和通道11是相同的,因此這種反向連接沒有任何問題。如果這有關係,那麼在通道順序非常重要的情況下,MAC中可能需要反向連接通道。
冗餘
AIB連接可能涉及多達3,840個I/O,在中介層中以軌跡的形式實現。相對於生產線故障的數量來說,中介層成品率可能很高,但線路眾多,也存在單個故障毀掉整個組裝的風險。99.9%的線路成品率仍然可能是0%的模組成品率。為提高模組成品率,AIB支援兩種類型的冗餘。
I/O參與的主動冗餘。如果發現連接錯誤,所有前往介面中心的訊號將轉移至相鄰微凸塊,利用中間的兩個空閒訊號。這種單線路故障可以按通道逐一排除,以提高成品率。
測試時可以啟動這種冗餘,在模組中保存轉移位置,系統上電時,正確的連接將出現在轉移後的位置。兩個訊號會在最早的上電階段—使用主動冗餘之前被使用。對於這兩個訊號,使用的是被動冗餘。這相當於每個訊號會使用兩個凸塊,如果其中一個連接失敗,另一個連接可保持完整。
AIB與SerDes延遲對比則如表1所示。AIB的延遲相比典型串列器/解串器(SerDes)大幅降低。JESD204C實施要求進行傳輸層映射、64B/66B編碼/解碼,以及串列/解串,因此數位延遲較長。SerDes模擬延遲較長,主要因為需要在單端和差分間轉換,以及進行時鐘資料恢復。
AIB未來發展趨勢
直接射頻類比數位轉換器(ADC)/數位轉換器等超高頻寬應用將繼續推動AIB提高頻寬、減少占用空間和降低能耗。借助精心的I/O設計,資料速率將實現翻倍,達到4Gbps。
隨著高密度封裝技術的不斷改進,產業標準的微間距將大幅縮小,目前是55微米,未來可能縮小至1微米。為了將每位能耗降低至0.5皮焦耳以下,I/O電壓擺幅可降低至0.4V。後代AIB與前代AIB元件之間的相容性至關重要,將成為未來實現AIB改進的重要因素。
總而言之,AIB介面可實現晶片和小晶片之間的新型短程高速連接,可將資料傳輸速率提升高達2Gbps(甚至更高);支援超過3,000個收發訊號;採用緊湊型晶片布局,以最大限度地降低晶片占用空間;並運用微凸塊技術,最大限度地縮小凸塊間距;精心設計的訊號布局和時序電路有助於保持高速訊號的微小偏移,而冗餘可幫助確保高成品率。
(本文作者為英特爾可程式設計解決方案事業部研究科學家)
鴻海攜英特爾力攻Local 5G商機
5G商用將在2020年正式登場,其高頻寬、低延遲和大連結特性預計將帶動更多科技應用與差異化服務,而要實現靈活的創新服務,合理的部署和降低營運成本變得更加重要,為此,鴻海積極推動「Local 5G」方案,並攜手英特爾(Intel),透過其完善的邊緣運算工具,優化5G和人工智慧(AI)技術,加快產品開發時程。
鴻海科技集團執行副總裁特助王惠民表示,隨著5G時代到來,虛擬化基礎架構需要與邊緣智慧結合,以提供更靈活的創新應用/服務,而要如何降低營運成本以實現合理的部署便成為關鍵。以企業專網為例,企業專網若成功實施,代表將來布建網路的不一定就是電信運營商,而會是企業本身,因此,設備商須提供在價格/成本上都相當具有競爭力的方案,同時這方案還須整合各種5G Networking技術及運行AI應用,以實現各種應用服務。
鴻海科技集團執行副總裁特助王惠民(圖右3)表示,英特爾是鴻海重要的戰略合作夥伴。
要實現這樣高度整合、優化的產品,需要產業共同合作,為此,鴻海攜手英特爾,透過英特爾旗下關鍵技術和平台如OpenNESS、FlexRAN、OpenVINO、DPDK、QAT和FPGA等,共同開發5G、邊緣運算和AI產品技術。
據悉,在英特爾的大力支持下,鴻海第一代基於MEC的專用網路解決方案已有商業化布建和推廣,與英特爾在O-RAN的前傳介面標準的整合亦已完成,預期將可以加速Local 5G的商品化推廣。
另外,鴻海目前也正在開發第二代Local 5G邊緣解決方案,融合了接入系統與邊緣運算,同時也將AI和邊緣工作負載整合到一個平台中,可在以4G/5G無線基礎設施加速促進物聯網推廣的同時,保持合理的部署和營運成本。目前Local 5G邊緣解決方案將先在鴻海集團內部部署並在未來推廣到全球的外部客戶。
英特爾物聯網事業群副總裁Johnathan Ballon指出,5G、AI應用和運算能力的興起,以及物聯網的爆炸式成長正推動著零售、工業、智慧城市、醫療保健等產業的轉型。邊緣數據和應用程序的快速成長推動了分布式計算架構的需求,在這種新的架構中,運算將貼近於數據源或服務點。為了使企業能有效運用5G和AI邊緣運算,業界需要設計出可滿足邊緣運算獨特需求的產品和工具,具開放性且易於使用的軟體工具,更需致力於相關解決方案的開發和布建。
英特爾物聯網事業群副總裁Johnathan Ballon。
將自駕車安全「量化」 IEEE著手制訂IEEE 2846規範
為加強自動駕駛車輛的安全性,國際電氣電子工程師協會(IEEE)近期通過一項提案,以推動自動駕駛車輛決策系統相關標準制定;預計制定的新標準為「IEEE 2846」,此標準將為自動駕駛車輛決策系統建一套數學模型,以明確指出自動駕駛車輛的安全定義。IEEE也委派英特爾(Intel)資深首席工程師Jack Weast標準制定工作組的負責人,該工作組預計在2020年第一季召開首輪會議。
英特爾資深首席工程師Jack Weast。
IEEE計算機協會標準項目副總裁Riccardo Mariani表示,此一標準化項目將為自動駕駛車輛決策模型提供重要的依據;系統中的冗餘(Redundancy)和多樣性(Diversity)在制定可擴展的框架,實現自動駕駛安全方面扮演重要角色。
目前汽車、半導體產業和監管機關都積極尋找一個統一的標準以規範、保證自動駕駛車輛的安全性;不過,即使大多數的人都支持建立自動駕駛車輛相關安全標準,並依此標準發放自動駕駛車輛的駕照,但由於缺乏業界共識,因此多項標準和監管方案仍在醞釀中。
另外,技術的不斷變化與高速發展為IEEE相關標準制定者帶來了壓力,同時也促使其加快全球自動駕駛汽車相關規定的制定工作。為此,IEEE將會推動自動駕駛行業標準制定工作。而「IEEE 2846」則將為自動駕駛汽車建立一套數學模型,將安全駕駛概念具體化為一個可驗證的模型,並包含一套可針對自動駕駛車輛進行驗證的測試方法和工具,且技術保持中立(也就是任何人都可以使用或相容各種方案);值得一提的是,該標準還保留彈性以因應各地方政府不同的法規政策。
該提案由IEEE兩個委員會發展(分別為IEEE計算機協會和車輛技術協會),英特爾資深首席工程師Jack Weast將主持此一工作組。英特爾將以Responsibility Sensitive Safety(RSS)模式為標準制定出發點,希望透過RSS定義出一套邏輯上可驗證的規則以及應對危險情景的規定,確立自動駕駛汽車具備什麼條件才算真正安全。英特爾指出,RSS顛覆了人們的認知,將人們對安全駕駛的固有認識轉化為透明、可驗證的數學公式,並將重新定義未來的自動駕駛汽車安全標準。
凌華偕英特爾攜手AWS拓展AI邊緣運算
邊緣運算解決方案商凌華科技(Adlink)與英特爾(Intel)和亞馬遜(Amazon)雲端運算服務(AWS)聯手簡化機器視覺的人工智慧(AI)邊緣運算服務。凌華科技提供的人工智慧邊緣運算解決方案其中包含Amazon Sagemaker建構的機器學習模型,採用英特爾發布的OpenVINO工具套件和ADLINK Edge軟體套件,以最佳化方式完成機器視覺應用的部署並通過AWS Greengrass認證。
凌華科技物聯網創新與技術副總裁Toby McClean表示,該公司已經導入多個受惠於人工智慧邊緣運算的工業相關應用案例,包括智慧棧板的解決方案,將一般的棧板賦予智慧,讓包裹可被智慧棧板即時偵測,可立即知道包裹應該所在的位置,包括時間、地點,使倉儲業者提高物流效率和生產力,並降低包裹運輸的錯誤和失竊。同時,還可以複製到其他垂直應用市場,提高營運效率和生產力。
凌華科技針對機器視覺推出的人工智慧邊緣運算服務串接了建構機器學習模型的整個過程,將設計、部署再到優化的流程串聯起來,讓客戶專注於開發應用程式,無需具備數據科學和機器學習模型的高深知識。
其他案例包括用於物件偵測,例如在製造環境中辨識輸送系統上的產品缺陷,以及預知預防診斷,減少機器停機時間,提高生產力。
貿澤攜手格蘭今原發表系列募資影片
貿澤電子(Mouser)日前與知名工程師格蘭今原一同發表讓創意化為現實系列影片的第三集,該系列為獲獎的Empowering Innovation Together計畫活動之一。
貿澤電子總裁暨執行長Glenn Smith表示,在原型建立階段,創作者經常為資金問題所苦,設計上也常遇到瓶頸。Crowd Supply這樣的平台讓設計人員能取得充足的資金和情報資源,通往以前不可企及的創新康莊大道。
在影片中,今原訪問Crowd Supply總裁Josh Lifton。Crowd Supply是總部位於美國奧勒岡州波特蘭市,經營成功的群眾募資平台。Crowd Supply與創作者和創業家合作,透過服務公開募集小額資金來資助創意。該公司亦由內部擁有豐富經驗的產品開發人員提供指導服務,擔任類似企業育成中心的角色。
今原表示,Crowd Supply協助設計人員解決募資和推出產品等重大問題,並透過分享這些關鍵資源,幫助創作者建立一個公平的環境。
今原和Lifton在對話中談到了創新者可取得的資源及相關流程,這些能幫助創新者有效判斷創意化為實際產品的可行性。兩人透過討論,探討從創意的概念發想到原型設計,最終製造出讓人想買或投資的商品的整個過程。
讓創意化為現實系列是貿澤攜手供應商伙伴亞德諾半導體(ADI)、英特爾(Intel)、Microchip和莫仕(Molex)共同推出,連續五年與格蘭今原合作。此次讓創意化為現實系列,內容探索將創意變成產品的過程,以及從探索到設計,最終完成開發的商業化流程。
實現創新應用 英特爾積極優化資料中心工作負載
物聯網、機器學習、人工智慧等新應用的興起,驅動了許多運算與資料處理需求,為資料中心產業鏈帶來龐大新商機;資料中心對於靈活、高效運算方案需求日益增加。也因此,如何優化工作負載,遂成為資料中心解決方案供應商主要任務。
英特爾(Intel)資料中心事業群副總裁暨行銷總經理Lisa Spelman表示,目前有著三大技術趨勢不斷推動資料中心的發展,分別為雲端運算、5G/Edge擴展,以及人工智慧(AI)。首先是雲端運算,雖說此一技術是三種裡面最為成熟的,但由於新興應用愈來愈多,驅使雲架構的規模和效率須不停提升,並從本地擴展到邊緣。
英特爾資料中心事業群副總裁暨行銷總經理Lisa Spelman。
而在5G/Edge部分,5G的革命性在於可謂每個使用這、行業帶來新的體驗,企業能透過5G創造新的商機。而與5G相結合,愈來愈多的運算、數據產生和服務應用的位置出現的轉移,也就是從雲端轉向邊緣,且發展力道十分強勁。最後,人工智慧則是在以數據為中心的應用中迅速傳播,並將塑造整個產業、人類生活的未來。AI的顛覆性創新已從數據中心轉移至邊緣,可說已遍及各式雲端、邊緣架構,衍生各式創新應用,預計在未來的兩年中,將會有近75%的應用程序整合AI。
簡而言之,這三大趨勢的出現,驅使資料中心的工作負載出現了全新的變化,有了新的應用意味著數據的產生、收集、運算需求也愈來愈高;也因此,優化工作負載成了關鍵任務,如此一來才能實現更高的性能、新功能和更高的服務品質。
Spelman指出,為此,多年來英特爾的硬體一直在追求更高效的分析和機器學習演算法。借助第一代Xeon可擴展處理器,可透其整合的Intel AVX 512引擎賦予CPU更大的AI實力,進一步為深度學習訓練和推論工作帶來顯著的性能提升。至於新發布的第二代Xeon可擴展處理器,內建可使推論加速的DL Boost技術,以進一步促進深度學習效率。
據悉,英特爾新推出的Xeon可擴展處理器代號為「Cooper Lake」,將在每個插槽支援高達56個處理器核心,並在標準插槽式處理器內建AI訓練加速器,該處理器預計在2020上半年問市。Cooper Lake高核心數處理器將會沿用原先內建於Intel Xeon Platinum 9200處理器系列的功能,帶來突破性的平台效能,這些功能已經被許多要求嚴格的高效能運算系統(High Performance Computing, HPC)客戶,包括HLRN、Advania以及4Paradigm等所採用。
值得一提的是,新款Intel Xeon可擴充處理器,與標準的Intel Xeon Platinum 8200處理器相比,提供兩倍的處理器核心數(最高56核心)、更高的記憶體頻寬、以及更高的人工智慧推論(Inference)與訓練效能。透過在Intel Deep Learning Boost(Intel DL Boost)中最新加入支援的bfloat16技術,Cooper Lake將提供內建高效能人工智慧訓練加速功能的x86處理器,該產品亦與即將推出的10奈米Ice...