PIM
瑞薩擴大尖端智財權授權陣容使用權
瑞薩宣布針對高詢問度的矽智產權(Intellectual Property, IP),擴大其授權陣容,這些授權讓設計人員能夠在瞬息萬變的產業中,滿足客戶各式各樣的要求。自今日起,客戶就可以使用下列IP,諸如先進的7nm SRAM和TCAM,以及尖端的標準乙太網路時間敏感網路(TSN)IP。
此外,瑞薩電子正在致力提供一種包含了記憶體中處理(PIM)的系統IP,該技術在2019年6月的會議論文中提出,由於是一種AI加速器,引起人們高度的興趣。利用這些IP,客戶可以迅速啟動其先進的半導體元件開發專案,例如為尖端的5G網路開發下一代人工智慧(AI)晶片或ASIC。
瑞薩電子核心IP研發部副總裁松本哲也表示,自從該公司2018年9月首次開放IP授權陣容以來,無晶圓廠半導體公司和製造商的反應一直非常熱烈,我們很榮幸可以繼續將新的IP產品推向市場,並協助加快下一代技術的發展。我們也感到非常榮幸,採用瑞薩所擁有科技的IP,擴展了半導體元件的供應範圍,並推動其他市場,例如以FPGA量產的客製化半導體,以及無元件先進科技開發。
為了支援客戶的半導體開發工作,瑞薩還建立了合作夥伴網路,隨時準備滿足使用者的獨特需求。該網路包括接單半導體設計的設計公司,以及提供一系列軟體和中介軟體工具的技術合作夥伴。該網路將藉由降低進入半導體元件和FPGA開發的進入門檻,來加速使用者的技術創新和產品開發工作。瑞薩還可以為經驗豐富的使用者,介紹模型式的設計開發環境,以充分利用這些尖端的IP。
瑞薩於2018年9月開放了其廣大的IP授權陣容,可使用40多個授權,包括CPU核心,用於馬達應用產品的計時器IP,USB核心和SRAM。在2019年,瑞薩電子收到了100多項查詢,並已開始向許多使用者提供IP。瑞薩的目標是使IP銷售的年成長率能高於目前的10%市場成長率,並將在建立新的和擴展現有的IP市場的同時擴大提供IP和支援系統。
具高效/低功耗優勢 PIM技術重返深度學習熱潮
而所謂的記憶體內處理器(Processor In Memory, PIM)(圖1),或稱記憶體鄰近處理器(Processor Near Memory, PNM)、記憶體內運算(In-Memory Compute, IMC)等,則是在晶片電路設計時即以記憶體的矩陣記憶電路為基礎,再行加搭起運算電路,使記憶與運算電路幾乎融為一體。
圖1 左圖為現行處理單元與記憶體間有讀寫(Fetch提取、Store存入)的瓶頸,右圖為PIM作法可消除運算與儲存間的傳輸瓶頸。
資料來源:IBM
PIM作法過去曾在上世紀90年代倡議過但未能成為潮流,但隨著人工智慧(AI)、機器學習(ML)、深度學習(DL)的興起,產業界重新評估與發展PIM技術及晶片,原因主要在於現行主流技術在運算效能提升上漸遭遇多項瓶頸,難以因應日益增高的深度學習運算量。
首先是晶片設計團隊逐漸難從處理單元的邏輯設計上獲得更高效能,因此IBM POWER(Performance Optimization With Enhanced RISC)架構處理器於1999年首次運用持續推進的半導體製程縮密技術,於單一晶片實現雙核心,以增加核心數獲取顯著效能提升,2005年AMD於x86架構上實現雙核,自此處理器紛改以增加核數為主要效能提升手段。
多核作法之後亦遭遇瓶頸,即處理單元(核)間的資料交換不夠快速,溝通協調成為運作瓶頸,因此改進晶片內外的連接傳遞方式成為重點,此時經常出現晶片商強調結構織法(Fabric)一詞。
改善連接結構後仍有其他問題需解決,因漏電流因素晶片運作電壓難以再下降,即便晶片放入更多的核,也無法讓所有的核均全速運作,因供電散熱之限只允許部份的核全速運作,部份之外的核須以降速、輕負荷方式運作,或暫時關閉停止運作,此稱為暗矽(Dark Silicon)限制,當製程技術持續提升,晶片內的核數愈多,暗矽限制也會更嚴重(圖2)。
圖2 電路運用率撞牆,暗矽效應阻礙使多核處理器無法全速運作。
資料來源:Michael Bedford Taylor
另外記憶體與處理器間的傳輸通道也難以更快,記憶體電路區塊與處理單元區塊有別的結果,傳遞過程必然有一段電路距離,因電路上的寄生電容因素而難以更快速傳遞,形成馮紐曼瓶頸(Von Neumann Bottleneck),半導體製程縮密技術讓記憶體容量愈來愈大,但進出處理單元的資料通量卻沒有相應的提升。
深度學習運算量大增 PIM技術動向受矚目
而如前述,深度學習需要的運算量不斷提高,特別是在支援自駕車應用上,2017年NVIDIA提出自駕車運算平台DRIVE PX PEGASUS,宣稱合併兩張DRIVE PX PEGASUS可獲得320TOPS(8位元整數)的人工智慧推論運算力,目標在於支援ADAS標準最高的Level 5自駕層級,即各種路況與情境下均能全程自動化駕駛不需人為介入,然代價是500瓦功耗,對汽車電瓶亦是不小負荷。
由於傳統方式提升運算(特別是深度學習運算)效能日益困難,因此產業開始嘗試回望PIM技術。PIM技術因記憶電路與處理電路兩者緊鄰,傳輸距離短,可快速傳遞運算,而深度學習所需要的「網狀層次連接、節點加權運算」亦容易以PIM方式實現,記憶體內儲存的資訊即是節點的權重(Weight,或稱特徵權重),運算後的結果再向更深層的節點傳遞,進行相同的乘積累加運算(簡稱乘加運算Multiply...