- Advertisement -
首頁 首頁Top區塊

首頁Top區塊

- Advertisement -

三合一電源架構實現高效充電 太陽能電動車前景可期

在印度標準局(BIS)、印度汽車研究協會(ARAI)、能源效率服務有限公司(EESL)等組織的協助下;印度政府已公布充電站的技術規格,此外AC-001、DC-001等原始標準也已經完成開發,並在特定地點部署充電站;除了低功耗AC和DC-001之外,最新規範也要求充電站必須配備多種規格的充電器,也就是AC Type 2、CCS和CHADEMO。不過這些系統完全仰賴電網供電,會因主要都會和半都會地區建物的供給而受限,而且電網是否準備充分足以應付這些額外負擔,也都還是問題。 而這就是太陽能與儲存裝置可以切入的領域,不但可補足電網不足,還能在全國各處可行地點獨立作業。所幸印度已成功部署太陽能,且因地理條件,太陽能資源十分充足。一次性的安裝與資本支出可順利運轉至少20到25年,投入的資金只需短短幾年即可回收,之後的能源輸入便都形同免費。 接下來將介紹一套可行的實作方法,來運用、儲存太陽能並將其應用於電動車的充電;本文還會略為提到能源的運用和儲存方法、分散式電池管理、能源轉換與連結,都是模組化、可擴充之太陽能驅動電動車充電站的基本要素。 圖1為常見由太陽能驅動之電動車充電站實作的配置圖,主要元素均可一目了然。 圖1 太陽能電動車充電站的功能方塊 至於使用者的部分,基本上為終端使用者會用到的功能。資訊的交換和使用者互動都是在這裡進行,通常包含一個具備觸控感測功能的TFT螢幕、供驗證或支付用的NFC讀卡機,有時或許還有藍牙介面以提供更先進的功能;車輛可實體連接任何一種輸出埠─供小型車和電動三輪車使用的AC慢充、特定等級車輛的AC快充,以及DC快充。使用者必須驗證自己的身分、設定偏好的充電方式,並且等到充電完畢。不過越深入其後的功能越複雜,因為都由中央控制器所控制和監控,所以會牽涉到許多不同的模組。 三供電來源共構能源管理系統 這套系統有三種供電來源。首先最重要的就是太陽能板,規模分析並不在本文討論範疇內,但一般來說每小時最少要有數千瓦(Kilowatt)。太陽能板的額定輻照度通常在每平方公尺150W。太陽能板饋給的對象為最大功率點追蹤(MPPT)模組,這是一種直流對直流(DC-DC)的功率轉換器,內部可執行最大功率點追蹤運算法。一般來說這些裝置效率都非常高,電效率超過98%,其通常是多相的交錯式降壓或降升壓轉換器,輸入和輸出端都只要幾百瓦就能運轉。裝置可以隔離也可以不要,但因為法規或安全因素,大部分系統都會進行電氣隔離。它的輸出對象則是一個通用的直流匯流排,可從這裡將下游能源提供給負載,而系統可採類比、完全數位化,或混合類比與數位控制。 第二種來源是電網,其並非必要供電來源,因為目的是使太陽能的利用最大化。不過在供電斷斷續續,或日照不足以提供全年或特定季節運轉的地區,電網就有助於滿足需求,因為系統基本上是一種太陽能儲存裝置,因此也可以利用系統本身在尖峰時刻補足電網之不足,或利用雙向的併網逆變器,擔任太陽能發電場的角色。若有適當政策將太陽能發電場或自用電廠所產生的電力輸出給電網,並採用淨計量電價的模式,就同時可以達到兩用效果。 第三種來源,同時也是接收/儲存點,則是電池。最近的趨勢是利用電池續航力高的鋰電池來快速充電,放電深度與容積效率都非常高,也可以將電池放在地底下以節省建物空間。這些鋰電池組件會以適當的串並聯組合放置,並分為好幾個組列。 電池的末端有一個接線盒,以及同時扮演監督者角色的終止裝置。每個電池都有一個資料埠,通常為CAN或RS485,都以菊環鏈模式輸出到終止裝置,終止裝置就能從最頂層了解每一個電池、組列或整個蓄電池組的健康狀態─這基本上是一種資料集中器和交換裝置,讓電池組件連接或中斷電路。此外,其還能和中央控制進行通訊,決定電池要充電還是放電。 圖2很清楚描繪出電源系統的架構,這是一種模組化的系統,可擴充到適當規模,模組通常都可擴充,每個3~5kW且搭配通訊匯排流,多半是CAN或MODBUS/RS485。中央控制器隨時都可以根據功能需求來配置模組—無論是充電管理、負載管理或診斷檢查。中央控制器內部經過布建可偵測能源使用狀況,基本上就是每小時消耗、儲存和產生/輸出多少kW的電力;同時還能與工業標準的電度表通訊,達到計費、費率設定等目的。 圖2 後段的能源系統架構 SiC提升電源轉換功率密度/效率 DC-DC轉換器模組接收DC匯流排的輸出。依照連結的車輛種類,還有與車輛電池管理系統規定電壓和電流相關需求,中央控制器會將DC-DC轉換器配置到通訊匯流排,這種選項通常用在DC快速充電,還可同時搭配多個DC-DC轉換器模組以達到負載。 DC-AC逆變器也是接收DC匯流排的輸出,但專門用於只能接受AC充電或一般慢充應用的車輛。這種雙向的逆變器可達到兩種功用:一是對DC匯流排輸出以滿足需求,二則是當充電站處於空轉狀態,抑或尖峰時段必須利用充電站來補強電網不足,便可反向對電網輸出電力。目前任何一種電源轉換模組的關鍵效率指數包括下列兩項指標: .高效率 端對端>95%,為現今已經可以實現的數字。 .高功率密度 有助於縮小系統體積,因為建物空間是主要部署成本之一。 以上兩點都可以藉由先進的晶片技術達成。寬能隙(Wide Band Gap)半導體,尤其是碳化矽(SiC)元件,能在高切換頻率、更高的接面溫度下運作,而且效率更高。除此之外,還可自動縮小磁性元件和電容器等被動元件的尺寸。因為有更好的磁性元件材料,在設計上得以縮小體積並降低耗損,因此可以處理更高的功率。 中央控制器四功能確保穩定充電 中央控制器為充電站的大腦,功能包含最基本的使用者/訂戶的辨識及互動,甚至是確保車輛以最適方式充電,結合高效能運算、聯網與感測功能,功能強大。主要功能如下: .使用者身份與支付 就使用者而言這是最常見的功能,透過智慧卡、一次性密碼(OTP)、支援NFC功能之手機,甚至藍牙執行。所有次要系統都由面板的微處理器/微控制器(MPU/MCU)控制。 .電源管理 這是充電站最重要但也最不顯眼的部分。系統控制器會持續監測電源情境:也就是供與需,接著決定如何從供應端滿足需求。無論光靠太陽能是否足以供應負載,或必須結合太陽能和儲存的電力,又或是同時需要從電網提供部分輸入。有些情境下可能會出現供給過剩或需求過高的狀況,其有足夠的智慧功能,可透過更改上述各種電源模組的設定,根據實際狀況傳送電力。 .聯網功能 最新的充電站和相關部署,都必須連上雲端以進行遠端監測及控制;且必須定期與中央管理系統(CMS)對話、回報轉移狀況、參數、診斷結果和運轉數據;同時需要接收來自中央管理系統的運轉指令及設定。因此目前已有多種聯網選項,包括有線及無線。3G/4G、Wi-Fi、乙太網路,甚至是LoRa,都已經用來進行遠端監測。 .保護、診斷和回報錯誤 為了防止故障,系統具有動作迅速的保護機制,會因為大浪或雷擊等外部事件、運轉方面的問題、意外或刻意的誤用/濫用,或者是短路、超溫或過電壓/過電流狀況而驅動。為持續降低運轉成本並將故障時間減至最低,系統會自動回報可能經常發生的問題。模組化的建構方式讓系統可以準確指出現場有哪個故障部分必須更換,這樣技術人員就能在抵達現場前做好準備。 以上簡單介紹太陽能電動車充電系統部署方式。讀者可以到位於印度諾伊達(Noida)的意法半導體印度開發中心,體驗可行的解決方案和各種子模組,也可以根據OEM代工業者的個別需求提供客製化的設計。電子行動和電動車的充電基礎架構是關鍵的焦點領域之一,相關研究也正如火如荼進行,希望解決上述所有功能模組的高效率問題。目前已有端對端晶片可讓電動車充電站得以成真,還有許多設計參考架構加速產品上市時間。 (本文作者任職於意法半導體)
0

5G頻譜標金突破天際 企業專網發展更添變數

雖然目前的總標金已是天價,但這個數字仍非最終結果。按照國家通訊傳播委員會(NCC)的規畫,2月21日將進入第二階段的位置競標,待第二階段競標完成後,5G頻譜競標才會正式結束。換言之,台灣5G頻譜的總標金還有可能繼續向上攀升。但不論第二階段競標結果如何,高昂的總標金已墊高了企業利用5G技術建立企業專網,發展智慧製造應用的投資門檻。特別是有意走專頻專網路線的業者,會受到最直接的衝擊。 NCC力求公平 專頻專網成本不低 根據NCC目前對外公告的申請規則,有意申請4.8GHz~4.9GHz企業專用頻段的業者,其取得成本將以商用頻段的競標金額做為計算基準,並以10MHz為最小單位提出申請。不過,由於企業專網的訊號涵蓋範圍只限於廠區內,跟商用頻段的授權範圍涵蓋全台不同,因此NCC提出的申請費用計算方式是以商用頻段的標金,乘上廠區面積占全台土地面積的百分比來計算。 舉例來說,如果有某家製造業者在全台灣各地的廠區總面積達100公頃,若要採用專頻專網的方式來建構自己專用的5G網路,光是申請10MHz頻段的執照費用,就需要支付新台幣14.2萬元作為申請費用。 但除了申請頻段的費用外,取得執照的業者還必須每年付給政府一定金額的頻段使用費。因此對製造業者而言,要「養」一個屬於自己的專用頻段,會是一筆不小的開銷。據了解,目前中華電信每年支付給政府的4G頻段使用費,約在新台幣12億元左右。 NCC目前的政策態度很明確,希望製造業者以跟電信業者一致的頻段成本來取得自己的專屬頻段,以免製造業者占了電信業者的便宜。但這個政策方向將使得製造業者的5G專網總體持有成本(TCO)遠高於電信業者,因為電信業者在設備採購時享有規模效益,其設備採購單價會遠比製造業者零星採購來得便宜。 多位半導體業界人士都指出,其所服務的公司已經跟易利信(Ericsson)、諾基亞(Nokia)等5G設備大廠接觸過,探詢專頻專網相關設備的報價。雖不方便透露具體數字,但這些設備大廠提出的報價單,著實讓他們倒抽一口氣。若連口袋相對深的半導體業者都感到猶豫,一般規模較小的製造業者或傳統產業,只怕更負擔不起。 虛擬化/彈性組網有助降成本 由於製造業者採取專頻專網來布建企業目前目前5G網路的整體成本十分高昂,因此許多製造業者均退而求其次,與電信業者合作,採用商頻專網的方式來組建自己的企業5G網路,例如賓士汽車(Mercedes Benz)與瑪莎拉蒂(Maserati),博世集團(Bosch)的5G實驗性生產線建置專案,也有電信業者參與其中(圖1)。 圖1 目前已經導入5G的實驗性生產線,都是由製造業者跟電信業者合力建設而成。圖為博世位於英國的實驗性5G智慧製造產線。 商頻專網跟專頻專網最大的差別在於製造業者不必負擔因專用頻譜所衍生的成本,基地台跟網路布建也可以交給電信業者,藉由電信業者大量採購的優勢來降低硬體成本。網路建置完成後,如果製造業者沒有網路維運的能力,也可以直接委由電信業者代為維運。 不過,由於企業網路內勢必會傳輸大量敏感的機密資料,因此企業即便不使用專頻,也必然會傾向於使用專屬網路。所幸5G標準在制定時已考慮到智慧製造等企業物聯網的需求,因此在組網機制上設計了許多彈性作法,資料傳輸不一定非得經過電信業者的核心網路。例如企業可以在自家廠區內布建獨立的多接取邊緣運算(MEC)單元,確保機密資料不在公共網路上傳輸。如果廠商能接受資料在公共網路上傳輸,也可以利用網路切片(Network Slicing)等虛擬化技術,利用電信業者的硬體打造企業自己的虛擬專網。 若說專頻專網有何優勢是商頻專網所不具備的,就屬頻段的排他性。由於商用頻段除了服務企業客戶外,同時也要服務為數眾多的使用者,若廠房所在地附近正好有大型場館,當這些場館在舉行活動,吸引大量群眾聚集的時候,商頻專網可能也會無法正常運作。因此,若企業廠房所在地附近有球場、體育館這類大型場館,在思考5G專網布建方式時,需要特別注意這點。表1為專頻專網與商頻專網的優劣勢比較。 URLLC/mMTC規格未定 性能表現待評估 事實上,雖然許多通訊業者在談到5G時,都會以5G擁有更高頻寬、更低網路延遲並支援更多用戶端設備接入,但這三個特性其實5G標準底下三個不同的應用場景,分別是增強行動寬頻(eMBB)、超可靠低延遲通訊(URLLC)與大量機器類通訊(mMTC)。目前僅eMBB已經在3GPP R16中有完整的定義,URLLC跟mMTC則要等到R17之後,因此對有意在5G通訊基礎上發展智慧製造應用的業者而言,URLLC跟mMTC到底能不能滿足實際應用的需求,還有很高的不確定性。 有業者表示,在工業應用場域,每項技術都要實測才能見真章,畢竟工業應用的環境變化多端,適合某個場合使用的技術,到了另一個場合不見得管用。當下已商品化的5G,都是以eMBB作為應用場景,針對URLLC跟mMTC場景開發的5G解決方案,目前在市場上還不存在,也無法實測。因此,5G在智慧製造的應用,都還在很早期的概念發想或概念驗證(Prove of Concept, PoC)階段,距離大規模布署還有很長的一段路要走。 另一方面,目前生產現場所使用的機台設備都還不具備5G聯網能力,若企業要導入5G專網,隨之而來的機台改造也是一項大工程,而且許多機台設備都是嵌入式系統,不太可能像PC這類開放架構設備,只要插個5G USB Dongle、安裝驅動程式就完工了。機台改造的問題,也會構成企業導入5G專網的一大門檻。 總結來說,5G與智慧製造的結合,是通訊產業非常期待的新商機,但從製造業的角度來看,5G能否在智慧製造應用中扮演通訊骨幹的角色,還是一個不小的問號。畢竟不是每一種工業應用都需要使用無線通訊;就算要使用無線通訊技術,也要經過長時間的實地測試,經過千錘百鍊,確定其可靠度之後,業者才敢放心採用。目前5G提出了很多美麗的願景,許多具有一定規模的製造業者也已經開始研究該如何在生產流程中使用5G技術,但5G在製造業的普遍應用,絕非一蹴可幾。
0

三星eUFS 3.1進入量產 寫入速度大增三倍

日前三星開始量產用於旗艦手機的512GB 嵌入式快閃儲存(embedded Universal Flash Storage, eUFS)3.1,提高比前一代512GB eUFS 3.0快三倍的寫入速度,突破現階段1GB/s網速的智慧型手機之性能限制。 圖 512GB eUFS 3.1。圖片來源:三星 512GB eUFS 3.1的寫入速度達1,200MB/s,相當於個人電腦SATA硬碟(540MB/s)兩倍、HS-I microSD記憶卡(90MB/s)的10倍,代表使用者在手機上讀取巨大的檔案,如8K影片或數百張大尺寸的照片時不需要緩衝,速度接近筆記型電腦。從舊手機轉移檔案也能節省大量時間,例如100GB的資料在UFS 3.0的手機中需要耗時4分鐘,但eUFS 3.1只要1.5分鐘即可完成資料傳輸。 新款旗艦機除了推出512GB的容量,也有256GB及128GB的規格。三星本月已開始在中國西安啟動量產第五代V-NAND的新產線,已滿足市場上對於旗艦機與高階智慧型手機的記憶體需求。另一方面,三星也計畫將南韓平澤廠的產線從第五代V-NAND轉為量產第六代V-NAND晶片。
0

神經型態晶片成功辨識氣味 機器嗅覺取得重要突破

英特爾(Intel)實驗室和康乃爾大學的研究人員在《自然機器智慧》(Nature Machine Intelligence)期刊上共同發表的一篇論文中,展示英特爾神經形態研究晶片「Loihi」,該晶片具有在明顯的干擾和阻絕情況下,學習和辨識有害化學物質的能力。Loihi僅透過單一樣本就學會各種氣味,同時不會破壞先前所習得的氣味記憶。與包括深度學習解決方案在內的傳統先進辨識方法相比,Loihi展現出更高的識別準確率,傳統先進辨識方法的解決方案需要增加3,000倍的訓練樣本才能達到相同的分類精準度等級。 英特爾神經形態運算實驗室資深研究科學家Nabil Imam表示,英特爾正在Loihi上開發神經演算法,模仿人們在聞到氣味後的大腦運作模式。這項工作是神經科學和人工智慧交會的當代研究典範,並證明Loihi具備提供重要感測功能的潛力,可望使各個產業受惠。 圖 英特爾神經形態運算實驗室資深研究科學家Nabil Imam與他手上搭載Loihi晶片的電路模組。 英特爾和康乃爾大學的研究人員使用一種從大腦嗅覺迴路的架構和動力學所得出的神經演算法,對英特爾Loihi神經形態研究晶片進行訓練,以學習和辨識10種有害化學物質的氣味。 Imam和研究團隊採用了由72個化學感測器的活動所組成的資料集,以對應風洞(wind tunnel)中循環的10種氣態物質(氣味)。感測器對每種氣味的反應會被傳送到Loihi,讓晶片電路模仿以嗅覺為基礎的大腦電路。Loihi晶片可以快速學習10種氣味(包括丙酮、氨和甲烷)中每種氣味的神經表徵,即使在背景受到強烈干擾的情況下也能順利辨識。 目前許多人家中的煙霧和一氧化碳探測器,也使用感測器來檢測氣味,但是它們無法區分不同的氣味;當它們檢測到空氣中的有害分子時會發出蜂鳴聲,但無法以智慧的方式對這些氣味分子進行分類。 Imam表示,化學感測領域多年來一直在尋找聰明、可靠和快速回應的化學感測處理系統,也就是所謂的「電子鼻系統(Electronic Nose Systems)」。他認為配備神經形態晶片的機器人在環境監測和有害物質檢測或工廠品質控制方面極具潛力。它們可用於會散發出特殊氣味之疾病的醫學診斷。另一個例子是配備神經形態晶片的機器人可以更清楚地辨別機場安全線中的有害物質。 研究團隊下一步打算將這種方法應用在更廣泛的問題上,從感官場景分析(了解觀察到的物體之間的關係)到像是計劃和決策等抽象問題。了解大腦的神經迴路如何解決這些複雜的運算問題,將為設計高效而強大的機器智慧提供重要線索。 但Imam也指出,目前在機器嗅覺感測方面,仍存在挑戰。舉例來說,當人們走進雜貨店時,可能會聞到草莓的味道,但其氣味可能類似於藍莓或香蕉的氣味,因為它們在大腦中誘發非常相似的神經活動模式。有時人類甚至很難分辨出一種水果還是多種水果混合的香味。當系統聞到來自義大利的草莓和來自加州的草莓時,有可能會出錯,因為兩者可能具有不同的香氣,但卻需要歸為同一類。 這些是研究團隊正在努力解決的嗅覺信號辨識問題,希望在未來幾年內解決這類挑戰,打造能夠解決實際問題的產品,而不僅是解決在實驗室中演示的實驗性問題。
0

武漢肺炎衝擊穿戴裝置市場 上半年出貨量恐陷衰退

研究機構IDC預估,2020年全球穿戴式裝置出貨量將比2019年成長9.4%,達3.68億台,成長速度遠不如2019年的89%。IDC解釋,2020年穿戴式裝置出貨量成長速度明顯放緩,跟武漢肺炎全球爆發,對供應鏈正常運作造成衝擊有關。但即便如此,穿戴式裝置未來幾年仍有非常強的成長動能,預估到2024年時,全球出貨量將接近5.27億台,未來5年的複合年增率(CAGR)為9.4%。 短期來看,智慧手錶跟智慧手環是受到這波疫情衝擊最明顯的產品,因為這類產品的主要生產基地都在中國。IDC預估,手錶和手環在第一季的出貨量將衰退13%,第二季則會衰退7.1%。但到了下半年,生產情況將會有所改善,並使出貨量重新回到溫和成長的格局。 但整體來看,手環的出貨量在未來幾年的成長將會十分有限,帶動穿戴式裝置市場發展的引擎,將會是耳機跟手錶。  
0

英特爾持續採用3D XPoint 與美光重簽協議

英特爾(Intel)與美光(Micron)日前簽署新的3D XPoint記憶體晶圓供應協議。分析師推測,由於現在美光是3D XPoint記憶體唯一的製造商,英特爾須支出更多預算給美光。此決策顯示英特爾規劃繼續生產採用3D XPoint記憶體的產品,但產品的細節仍有待消息公布。 圖 英特爾搭載3D XPoint記憶體的Optane產品。圖片來源:英特爾 2018年英特爾終止與美光在NAND與3D XPoint的合作關係之後,出售前合夥人位於美國猶他州的晶圓廠。由於英特爾當時尚未將Optane產品所需的 3D XPoint生產移往中國大連的工廠,為確保美光將記憶體賣給英特爾,必須與美光簽訂供給協議。 於2018年十月協議生效時,美光取得工廠的所有權。但是日前兩公司終止該筆交易,並基於價格與預估條款變化而重簽協議。雙方雖未透露協議的細節,但是美光表示,這筆協議不會改變美光先前的立場。 與此同時,市場分析師表示,儘管產品訂價高昂,英特爾仍在3D XPoint上損失大筆金錢。而美光少以3D XPoint為基礎生產產品,可間接推斷3D XPoint的成本不低。截至目前,美光唯一使用3D XPoint記憶體的產品只有X100 SSD。 英特爾與美光的新簽協議,則揭露英特爾打算繼續生產搭載3D XPoint記憶體的Optane系列產品,因其在英特爾的資料中心業務中扮演要角,但英特爾對3D XPoint系列產品的規劃仍有待公告。
0

微軟/蘋果開發者大會相繼線上化 避免新冠疫情加劇

新冠狀肺炎的疫情向中國境外擴散,連帶影響科技產業大型活動。繼上月MWC宣布取消之後,日前微軟(Microsoft)表示原訂五月的Build開發者大會,改為線上進行。隨後蘋果(Apple)發出新聞稿,說明蘋果六月的全球開發者大會(WWDC)也將改為線上會議。 圖 微軟Build 2020已確定改為線上舉行。圖片來源:Microsoft Build 2020 微軟Build網頁開宗明義寫道:「基於安全第一的原則,加上新冠肺炎及政府的防疫措施,例行的Build開發者大會將在今年改為數位體驗。」Build 2020原先預計今年 5月19~21日在西雅圖舉辦,然而碰上需要避免大型集會的新冠疫情,只能為了健康安全取消。 微軟的消息發布之後不久,蘋果執行長提姆‧庫克在官網發出聲明,逐一說明蘋果針對疫情的一連串相關措施。除了承諾針對疫情捐款,並決定關閉大中華地區以外的蘋果實體店兩週之外,WWDC 2020將以線上會議形式進行。面對疫情變化,產業內的展會與公司大型活動,無不走向取消或改成線上活動,盡可能降低群聚感染風險
0

可編程架構靈活第一  FPGA DNN部署高速直進

本文概述演算法和架構方面的最新發展,並探討FPGA如何適應不斷變化的環境。 DNN加速部署因應環境變化 當今工業革命的核心是推出許多機器學習(ML)的演算法,尤其是深度神經網路(DNNs)(圖1)。其在電腦視覺與語音辨識領域取得令人印象深刻的成果,且越來越廣泛地應用在其他任務中。DNN首先會透過已標記的資料集進行訓練,後續應用的其中之一是將其他資料進行推論,這個推論的過程通常被稱為部署,即是本文的重點。 圖1 卷積神經網路的基本拓撲結構 與DNN部署相關的大量運算和儲存需求需要加速。此外,根據不同的應用實例,可能會對準確度、成本、功耗、模型大小、傳輸量和延遲有不同的限制。擁有即時性且以安全為重點考量的應用,如AR、無人機控制、自動駕駛等,由於低延遲與資料傳輸量的需求,因此不適合使用雲端。 在雲端運算和ML即服務的環境下,資料中心為成功處理大量的資料,面臨不斷成長的傳輸需求,為能源效率與營運成本帶來更多像是如何降低最多營運費用等挑戰。與嵌入式場景相比,雖然雲端服務延遲不那麼重要,但其仍然會直接影響到互動式應用的使用者體驗,例如Jouppi等學者在雲端服務中,將互動式使用者體驗的回應時間限制為7毫秒。 由於上述這些挑戰,過去數年間不同DNN模型與加速器呈現極速的發展。考慮到應用需求的差異,目前DNN推論作業負載與硬體加速器架構領域的一大關鍵趨勢,為多樣性及快速演進發展。本文將概述演算法和架構的最新發展,並探討FPGA如何適應這種不斷變化的環境。 DNN趨向追求高效推論 DNN通常是由一個或多層建構的前饋運算圖,其中大型網路能夠包含數百到數千層;每一層皆由突觸互聯的神經元組成且都與權重相關。每個神經元運算其接受域的加權和,並且使用非線性激勵函數。電腦視覺通常使用卷積層,其接受域擴展到多個典型的二維特徵圖,這些特徵圖與多個典型的二維過濾器進行卷積,產生如圖2所示的運算虛擬碼結果。 圖2 典型DNN運算的虛擬碼 機器學習框架(如PyTorch、TensorFlow和Caffe)都是基於這些運算圖展示,針對訓練與推論將硬體的運算進行排程與配置。 傳統意義上,機器學習研究的重點是如何提高模型精確度,並沒有特別考量推論的成本。這一點在像AlexNet與VGG這類較為陳舊的ImageNet獲獎網路中表現相當明顯,即便這些網路現在看來規模較大且過度參數化。然而,隨著機器學習和DNN進入實際應用,運算和記憶體需求成為其中一個主要的問題。上述問題激發最近一系列有關如何使DNN推論更有效的研究,同時精準度和運算的複雜度也會成為考量。 以下簡述為提高DNN效率而提出的幾種方法。在大多數情況下,這些方法可被認為是相互獨立且可以組合的,儘管部分DNN可能不太適合某些技術。 高效能拓撲結構 DNN的拓撲結構定義了其包含多少層、每層的類型和大小,以及各層之間的連接方式。一些拓撲結構由構造規則進行定義,該構造規則根據拓撲參數定義大小和層數。近期大量研究都提出DNN可透過緊湊的拓撲結構實現高精準度,例如透過少量的參數、少量的乘積累加(MAC)運算或兩者並用。 最近的範例包括MobileNets、 ShiftNet、ShuffleNet,和Deep Expander Networks,其通常具有可控制精準度與運算量之間權衡的拓撲參數。而FPGA在這方面可以提供獨特的優勢,因為新型運算單元(例如移位和隨機排列)幾乎不需要運算資源,可透過重新配置元件中的可編程設計互連來實現。 量化 DNN通常使用浮點運算進行訓練,但可以使用有限的數值,其通常可以直接量化到8位元(參考圖3),或者重新接受訓練以使用更少位元(訓練量化),進而得到量化神經網路(QNN)。量化方案可以是均勻或非均勻的,而根據網路的不同部分可以使用不同的量化方案。使用更少位元數需要更少的運算和記憶體,但可能會導致準確度降低。最近大量資料都提出更好的量化訓練技術。近期的方法如LQ-Nets,已經將浮點和4位元QNN之間的精準度差距縮小到1%以下。 圖3 正弦波3位元量化函數 FPGA內部的可編程邏輯可提供獨特的功能,能夠以非常精細的位元度對運算單元的資源進行客製化,進而提供精確的位數來滿足應用需求。因此,此應用能夠發揮潛力來降低運算與記憶體的硬體成本。 剪枝(Pruning) 神經網路的一部分可以被修剪掉而不會對準確度產生任何重大影響,對於某些層來說,準確度最高可達90%(圖4)。剪枝技術在如何選擇修剪部分(例如透過權值幅度或二階導數),以及在選擇以何種精度執行修剪(例如單個突觸、相鄰突觸群或用於卷積的整體特徵圖)有所不同。修剪單個突觸會導致不規則的結構,而這些結構只能透過專用硬體來進行有效處理。雖然人們通常選擇較粗精度的修剪方法,但是精細度的修剪方法更進一步提供可與FPGA搭配使用的效能擴展性,進而縮減記憶體子系統,在提供運算引擎所需支援的同時,有效儲存稀疏表示(Sparse Representations)。 圖4 突觸剪枝 層間融合與分解 數學等價或近似可以用來減少DNN層的運算和記憶體需求。例如,批次的標準化操作可以融合到前面的線性轉換層(卷積或全連接層)中。卷積可以用深度可分離濾波器(Filter)來近似表示基於奇異值分解的全連接層。 其他技術則可以使用知識蒸餾(Knowledge Distillation)使高效能模型的訓練變得更加容易。Hoffer 等學者提出將DNN的最終分類層固定到Hadamard矩陣上的方法,該矩陣具有+1/-1的固定模式值,並證明此方法對幾個ImageNet網路的分類精準度沒有影響。 精度/運算之間損益比較實測 神經網路是函數近似器,高品質的近似器(Approximators)比低品質的成本更高。其中,在確定將多少記憶體和運算資源用於執行推論(使用神經網路),以及所得推論的品質(例如網路對未見輸入影像的類別進行預測時的準確性)之間,需要作出權衡。雖然難以確定資源與精度之間的確切關係,但是透過對具有不同運算要求的神經網路進行訓練並觀察所得準確度,能夠以過往經驗探究其設計空間。 圖5呈現的是設計空間探索的一種結果。(圖中兩軸上的數值越低結果則越理想。)使用不同的量化方案來生成具有不同運算成本(x軸表示為在整體運算中將使用多少FPGA LUT和DSP片的大略數值)和準確度(y軸)的網路。紅線是柏拉圖邊界(Pareto Frontier)與設計點,這些設計點在運算成本和準確度方面都是同類中最好的。在這種情況下,較低準確度的深度網路(ResNet-50,具有2位元權重和8位元激勵)的運算成本與誤率較低,優於較高精度的淺層網路(ResNet-18,具有8位權重和8位激勵)。 圖5 運算成本與使用各種量化網路在ImageNet上排名前5的分類錯誤率 深入推論加速器架構研析發展趨勢 如前所述,神經網路對運算與記憶體的要求可能非常高。例如使用像ResNet-50這類熱門的DNN對每個單獨的輸入影像進行分類需要77億次運算。然而,從優勢來看,本質上DNN的高度平行化,可以加以利用。因此,各種形式的客製硬體架構正在演進發展,以實現這些演算法的部署。 DNN的推論運算包含多個平行級別,如圖6所示。這些平行級別可歸納如下: ・連續層之間的粗精度拓撲平行與平行分支,例如在GoogLeNet或DNN整合中所發現的。 ・層內的神經元和突觸平行,例如多個輸入/輸出特徵圖(IFM/OFM)通道及卷積層中的畫素。 ・當分別查看權重和激勵的各個位元時,運算內部的位元層級平行級別。 圖6 適用於運算DNN推論的平行級別 推論加速器架構前景可期 在為這些運算和記憶體高度密集型演算法優化硬體架構時,會出現以下問題: ・如何進行最佳迴圈轉換和展開,以實現資料重複使用和運算效率最大化與記憶體瓶頸最小化? ・如何在技術節點縮小導致收益有限的情況下提供效能可擴展性? ・如何實現即時回應、功耗限制,以便在耗能較高的嵌入式應用場景中進行部署? 除了標準的CPU以外,特殊應用硬體架構正試圖針對特定的應用限制進行優化,包括GPU、FPGA和AI ASIC。微軟創造了「DNN處理單元」這一術語,也可簡稱為DPU,作為這些客製架構的總稱。圖7描述了通DPU架構,其中典型的「痛點」以黑點標示。 圖7 通用DPU架構中的典型「痛點」 架構可以大致按照運算操作的基本類型、記憶體頻寬、平行級別、專業化程度和既有的準確度支援進行分類。雖然GPU最初是專注於遊戲和繪圖處理,並逐漸應用於高效能運算,但之後也越來越關注AI領域,並且將訓練加速作為其業界標準。 GPU被認為是向量SIMD處理器,如透過NVIDIA Volta系列中引入張量核(Tensor Core)和定點整數運算,為深度學習進行越來越大幅的客製化,尤其是採用NVIDIA最新Turing架構的INT4和INT8。DPU的ASIC解決方案旨在實現硬體成本最小化,並盡可能提升效能,例如Google的張量處理單元(TPU)。如前所述,TPU專門針對張量而不僅只是向量進行運算,並且為了充分發揮量化的優勢,還擁有客製記憶體架構與算數運算。除了TPU以外,越來越多公司正在打造客製硬體,包括Arm、Intel收購的Nervana、MobilEye和Movidius,以及GraphCore、Cerebras、Groq和Wave Computing等眾多新創企業。綜上所述,業界環境正在迅速發生變化。 FPGA在高效DNN的優勢 DNN的多樣性還展現在前面提到的各個平行級別上。因此,對於固定的硬體架構,如果以固定方式傳輸固定數量的平行運算元素,執行DNN的效率就會受到限制。例如,如果為了利用輸入特徵圖和輸出特徵圖(IFM-OFM)平行而建構固定的架構,那麼對於深度可分離卷積來說,可能會降低其利用率。特別是考慮到用來創建高效DNN的技術在快速發展,靈活應變能力是在不斷變化的DNN推斷環境中保持高效率的關鍵。 在這種情況下,業界廠商如賽靈思(Xillinx)FPGA的主要特色在於提供的運算和記憶體資源具有靈活應變能力,並能實現大規模細精度平行。該元件支援多種DPU架構,這些架構能夠充分發揮多個平行級別的優勢,並根據特定DNN拓撲結構的要求和應用根據設計限制進行客製。 在FPGA上運作的Soft DPU可以支援上述配置,並且能為每個特定的神經網路客製顯式記憶體管理及算數運算。 圖8、圖9和圖10提供Soft DPU範例呈現出其架構的多樣性。每種架構的主要特色如下: 對於特定的QNN,FINN可生成客製DPU,其中每一層都有專屬硬體,並採用晶片上通道連接到下一層,但會受到元件尺寸的限制。這樣可以為每一層客製精確度與運算資源,進而實現高效能的設計。層間資料流平行有助於實現低延遲與高傳輸量。FINN是可利用的開源程式碼。 圖8 FINN是一種專用於每層運算資源與層間晶片上資料流Soft DPU 圖9 xDNN是一種具有高度可編程設計與效能優化功能的Soft DPU xDNN是一種具有固定精度的脈動陣列可編程設計堆疊架構。該陣列的規則結構支援高度的效能優化。其提供的工具流能夠將任何DNN應用到該架構,無需生成新的位元流或具備FPGA專業技術,即可將xDNN用於評估。 圖10 BISMO為可支援不同算數運算精度且無需重新配置的Soft DPU BISMO是位元串列矩陣乘法的可編程設計堆疊,其透過序列化位精度維度但平行化其他維度,提供一個固定的架構,不但可以利用運作時的可變精度,同時仍然能夠提供高效能。精度更高的層需要更多的時脈週期(Clock Cycle)來執行,而BISMO為一款開源程式碼。 在摩爾定律終結的驅動下,賽靈思使用的AI架構由具有客製指令集的軟體可編程設計AI引擎組成。此外,基於NoC的互連,在布建資源方面更進一步提升靈活性,這對於提高元件利用率來說至關重要。再者,除了神經網路本身,FPGA還可以提供感測器融合和靈活的I/O;FPGA不僅能夠增加電腦視覺的預處理和後處理,還可以為線上智慧提供整合所需的其他功能,使元件適用於使用者的應用環境。 FPGA架構更迭因應各種挑戰 越來越多的應用採用機器學習演算法,為傳統運算架構帶來巨大的運算負擔。半導體產業透過許多代號為DPU的創新架構來因應挑戰。 其中,FPGA可以發揮關鍵作用,在調整運算架構方面提供高度的靈活性,因此不僅適用於一般的機器學習任務,還適用於特定的神經網路拓撲結構。可編程設計元件可以提供客製演算法,實現儲存和運算資源最小化,進而提供進一步的效能擴展性或針對嚴格的延遲要求進行最佳化。最後,FPGA可以在I/O和感測器融合與電腦視覺的預處理和後方面提供高度的靈活性,有利於滿足客戶需求 (本文由賽靈思提供)
0

穿戴式裝置商機竄起 感測/電源/眼球追蹤有前景

在蘋果(Apple)、小米等電子品牌業者透過手環、手錶與耳機等產品,為消費性穿戴式裝置成功打開市場後,社會大眾對於利用穿戴式裝置收集生理訊號,結合手機App來追蹤自己的健康狀況或運動數據,已經有了很高的接受度。而這類消費性產品所創造的龐大市場需求,也反過來吸引晶片供應商投入更多資源,研發感測精度更高、更省電與更低成本的解決方案,使得穿戴式裝置這個應用市場踏上正向循環的發展道路。 消費性穿戴式裝置的成功,同時也為生醫、長照或其他專業型穿戴式應用的發展打下更穩固的基礎,並使得相關產品的開發者得以挑戰技術難度更高的穿戴式產品,例如智慧衣物、醫療設備等。另一方面,眼球追蹤等新一代人機介面技術的進展,讓使用者可以直接用視線來與穿戴式裝置互動,也為穿戴式裝置未來創造出更多可能性。 半導體技術持續進步 穿戴裝置進軍生醫 成功大學電機系李順裕教授(圖1)指出,收集各種生理訊號,再結合手機App等資訊軟體來追蹤使用者的生理狀況,是目前絕大多數消費性穿戴式裝置的主要應用情境。生醫或長照所需要的穿戴式裝置,核心功能大多也都跟這些消費性產品雷同,只是為了取得更精準的數據,或貼近某些應用場景的特殊需求,而必須在外觀上做一些改變。 圖1 成功大學電機系李順裕教授表示,穿戴式裝置在生醫跟長照領域,有極大的發展前景。 智慧衣就是一個很典型的例子。藉由將感測電極與紡織品結合,加上低功耗放大器、濾波器、微控制器以及藍牙等穿戴式裝置所使用典型元件,以及手機App,就能構成一套完整的穿戴式裝置。不過,也因為感測電極必須跟布料整合,所以智慧衣的開發者必須找到有相關技術的紡織業者合作,這反而是比較大的挑戰。 李順裕教授所帶領的團隊,在開發智慧衣的專案中,配合的紡織業者是台南當地的廠商。他表示,台灣有很強的紡織業基礎,因此台灣要發展智慧衣這類專業型的穿戴式裝置,具備不錯的先天優勢。 相較之下,專業型穿戴式裝置所需的電子元件,基本上已經相當成熟。以李教授所帶領的團隊為例,該團隊所研發的各種穿戴式裝置,如智慧運動衣、智慧寵物衣,甚至具有醫療功能的癲癇腦波監測與刺激治療裝置,絕大多數元件都是由亞德諾(ADI)供應。 安馳科技應用工程師范育彰(圖2)表示,誠如成大李教授所言,穿戴式裝置的核心元件不外感測、電源、控制與通訊四大類,其中又以感測最為特殊,因為穿戴式裝置需要感測的物理量大多是生物訊號,其他像電源、控制與通訊,都屬於通用元件。但由於穿戴式裝置的外觀通常非常緊湊,沒有空間安裝大電池,因此不管是感測、電源、控制或通訊元件,都必須做到非常省電。 圖2 安馳科技應用工程師范育彰指出,亞德諾在穿戴式裝置應用有很完整的布局,特別是在感測與電源方面。 亞德諾目前的產品布局著重在感測跟電源兩大領域。針對穿戴式裝置所需的感測技術,目前已推出超低功耗加速度計、測量心跳用的光學模組及支援單端量測的心律感測前端等,都具備小封裝、低功耗的特性。至於在電源方面,亞德諾也已透過購併凌力爾特(Linear),獲得完整的電源管理跟充電IC產品線。 因此,對穿戴式裝置的開發者而言,亞德諾確實有足夠的產品線涵蓋範圍,能實現一站式採購,省去四處尋找適合元件的麻煩。此外,針對某些穿戴式應用,亞德諾還能提供完整的電子系統參考設計,進一步協助開發者縮短產品設計時間。 超低功耗 帶來電路量測挑戰 為了滿足使用者對穿戴式裝置電池續航力的期待,元件供應商在針對這類應用開發產品時,都將超低功耗列為主要的設計目標,並導入各種休眠模式,盡可能壓低靜態電流消耗。但對穿戴式裝置的設計者而言,這些功能雖然有助於壓低系統功耗,卻也使得穿戴式裝置的電源量測變得更具挑戰性。 克達科技資深應用工程師馮育隆(圖3)指出,提到電源量測,工程師最常使用的量測工具,不外數位電表跟示波器兩種工具,但對穿戴式裝置的電源量測來說,這兩種工具其實並不理想。 圖3 克達科技資深應用工程師馮育隆認為,數位電表跟示波器這兩種常用的測試儀器,不適合用來量測穿戴式裝置這類電流非常小的應用。 數位電表有足夠的動態範圍,可量測到奈安(nA)等級的電流,對於有深度休眠模式的穿戴式裝置來說是足夠的,但數位電表的取樣率通常只有10KHz,當快速暫態事件發生時,很容易錯失訊號;示波器則正好相反,其取樣率足以捕捉到各種暫態訊號,但其動態範圍不足,通常只能量測到微安(mA)等級的電流,當待測物處於深度休眠模式時,會量不到訊號,因此,不論是數位電表或示波器,在開發穿戴式裝置時,都不是理想的功率量測儀器。 有鑑於此,是德(Keysight)特別開發出在動態範圍跟取樣率間取得更佳平衡的元件電流波形分析儀CX3300,搭配N6700系列電源供應器跟對應的測試軟體,可以讓穿戴式產品的開發者精準取得各種微小的電流波形,並對產品的整體功耗進行更全面的評估。 眼球追蹤 突破人機互動難題 目前絕大多數的穿戴式裝置,本質上都是將感測器設計成適合穿戴在身上的形式,以便隨時擷取各種生理數據。目前穿戴式裝置的發展狀況如此,跟科技的局限有關,因為穿戴式裝置非常小巧,沒有足夠的空間來實作太複雜的人機互動功能,因此只適合用來當作被動的資料擷取設備。但如果有人機介面技術能有所突破,穿戴式裝置的發展道路肯定更加寬闊。 見臻科技創辦人暨執行長簡韶逸(圖4)認為,眼球追蹤技術就是穿戴式裝置目前還欠缺的人機互動關鍵技術。有了眼球追蹤技術,使用者就能用視線來與穿戴式裝置互動,這會為穿戴式裝置的設計帶來許多突破性的發展,例如智慧眼鏡、虛擬實境(VR)跟擴增實境(AR)等會占用人類視覺感官的穿戴式裝置,都將因眼球追蹤技術的突破,在使用體驗方面更上一層樓。 圖4 見臻科技創辦人暨執行長簡韶逸認為,眼球追蹤將是穿戴式裝置不可或缺的關鍵技術。 但目前市面上存在的眼球追蹤技術,大多使用多顆發射不可見光的LED來進行眼球定位,這種架構過於複雜,不僅墊高了原物料成本,產品在量產時的校正也非常花時間,更嚴重影響系統的電池續航力,並使得產品外觀更加笨重,因而阻礙了眼球追蹤技術的普及。 這些問題讓見臻看到突破的機會,並發展出只需要雙眼各一顆LED的硬體方案,再搭配見臻自行研發的軟體演算法跟ASIC,搭載眼球追蹤技術的頭戴式產品將可有一整天的電池續航力,而且成本跟體積都比現有的解決方案更理想。
0

IDM/晶圓代工同步起跑 新興記憶體市場起飛

在整合元件製造商(IDM)與晶圓代工業者陸續攻克種種技術門檻後,次世代非揮發記憶體已進入大量生產階段,並使得相關市場規模迅速成長。據研究機構Yole Developpement預估,從2019年到2025年,獨立型新興記憶體的市場規模將從5億美元成長到41億美元,複合年增率(CAGR)可達42%;嵌入式記憶體的市場規模則成長更快,可望從2,000萬美元成長到21億美元,CAGR為118%。 Yole所定義的新興非揮發記憶體包含PCM、MRAM與RRAM三種,獨立型新興非揮發記憶體將以PCM為主,MRAM則在嵌入式市場上囊括絕大多數市場。  
0
- Advertisement -
- Advertisement -

最新文章

- Advertisement -

熱門文章

- Advertisement -

編輯推薦

- Advertisement -