AI
TOP500超級電腦採用NVIDIA技術以加速節能
最新的TOP500超級電腦排行榜描繪出現代科學運算領域的發展前景,利用人工智慧 (AI) 與資料分析技術來擴大這個領域,並透過 NVIDIA 的技術來加快其運算速度。
目前全球運算速度前十名的超級電腦中,有八套包括分布在美國、歐洲及中國最強大的超級電腦系統,都採用了 NVIDIA GPU 或 InfiniBand 網路技術,或是兩者兼備。
在最新的 TOP500 超級電腦排行榜中,有三分之二 (333套) 的超級電腦均採用 NVIDIA 的技術(現已完全收購 Mellanox);而在 2017 年 6 月的排行榜上,合計只有 203 套的超級電腦採用當時還是獨立兩間公司的技術,只占總數不到一半的數量,相較起來目前的數量可謂大幅增加。
榜單中有近四分之三 (73%)...
和成偕工業局攜手工研院 打造AI人工智慧研磨拋光機器人
新冠肺炎疫情來襲,在後疫情時代,滿足智動化、降低人力依賴、快速更改與客製化等需求,已成製造業發展新趨。在經濟部工業局AI加值智慧製造產業推廣計畫支持下,工研院與衛浴大廠和成欣業公司(HCG)合作,日前發表首條AI人工智慧虛實整合系統(Cyber Physical System, CPS)研磨拋光機器人技術與產線,透過導入AI人工智慧及感測器等技術,讓機器人如同人類擁有三覺:視覺、聽覺、觸覺,不僅能看能聽,還能感受研磨力量,有助水龍頭研磨、拋光、瑕疵檢測一次到位,幫助和成數位轉型升級,讓和成在疫情期間不但產線生產產能未受影響,反而提升產能,訂單不降反升。今天國內的水五金與機械廠商更慕名前來觀摩台灣首條的AI人工智慧 CPS研磨拋光機器人產線,期許未來導入高科技,以利公司轉型高階產品市場。
台灣水五金廠商約三百家,以出口為主供應全球50%以上水龍頭,每年產值約六百億新臺幣,但複雜外型的水五金較難導入自動化設備,高達9成仍使用人力研磨、1成由機器研磨,加上其工作環境高溫多粉塵、噪音大,以及社會少子化與高齡化的趨勢,傳統產業不易招募新血。因此,工研院從2016年與和成合作開發CPS研磨拋光機器人來解決水五金產業遭遇的瓶頸,並持續導入AI人工智慧和聽覺/力量感測器等科技來優化機器人功能,以助打造品質更佳的水五金。
工研院機械與機電系統研究所所長胡竹生表示,新一代的AI人工智慧CPS 研磨拋光技術生產線,讓機器人具備視覺、聽覺、力覺,使機器人在輔助產線製作水龍頭時,除了能研磨拋光,還可以進行線上瑕疵檢測,並使水龍頭研磨從6分鐘縮短至3分半鐘,效率提升41%;每日檢測時間從200分鐘縮短至80分鐘,檢測時間節省60%、檢測量提升2.75倍,AI人工智慧辨識研磨品質的正確率高達93.3%,藉由AI人工智慧應用協助水五金產業迎向智慧製造,達到快速換線/混線、少樣多量、提高產能的目標。當前,工研院已擘畫2030技術策略與藍圖,對焦六大戰略產業,為產業前行打造美好未來,透過AI人工智慧加值智慧製造,助攻製造業在後疫情時代掌握復甦商機。
和成欣業公司董事長邱立堅表示,導入AI應用於製造產業中勢必為未來的趨勢,非常感謝經濟部工業局在此件事上扮演重要的推手,讓和成在政府與工研院的幫忙由精密機械創新升級。和成舊型產線的水龍頭研磨覆蓋率僅80%,於2016年與工研院合作導入第一代CPS研磨拋光機器人技術後,使水龍頭研磨的產能增加了20%,覆蓋率已高達90%。本次與工研院再度合作「第二代CPS研磨拋光機器人」,水龍頭的研磨覆蓋率能達到100%且成本可降低20%,品質再提升與國際水準接軌,成為消費者之選擇。
觀摩會現場也展示最新一代AI人工智慧CPS 研磨拋光技術生產線,不僅可研磨拋光,更解決了水龍頭在成品瑕疵檢測方面,仍需仰賴有經驗的老師傅目視判斷品質,過程耗時費工且不客觀的問題。此技術整合AI人工智慧演算法、聽覺/力量感測器,讓機器人能自動分類成品的好壞,建立瑕疵檢測的客觀標準,使製程不良率控制在10%內,大幅增進產線檢測品質,有助減輕老師傅的工作負擔和實現彈性製造。
此產線透過架設資料蒐集感測器,可蒐集水龍頭加工資訊、研磨速度和工件尺寸誤差等,並建置製程資料庫,將製程中的各項數據、參數量化與可視化,藉由大數據分析,不僅能強化智慧生產,也有助年輕工作者傳承老師傅的研磨工藝。目前此技術可應用於水五金、金屬工件加工、手工具、鋁壓鑄、航太等產業,輔助研磨、拋光與去毛邊等,未來雙方也將持續合作優化CPS研磨拋光機器人技術,期許強化水五金產業的競爭力。
根據國際機器人聯盟(International Federation of Robotics, IFR)資料顯示,世界各國企業均增加對工業機器人的使用,現今全球工廠有超過240萬台工業機器人正在運行、工業機器人的全球銷售總額逾165億美元。當前,全球企業在新冠肺炎疫情影響下,正重新評估供應鏈管理風險,此將加速企業引進機器人,以利工業生產復甦,疫情危機有助推動機器人和自動化技術,並預估2020年~2022年,全球工廠將安裝近200萬台新的工業機器人,協助企業因應不斷變化的生產需求與市場發展。
從大數據到智慧資料 AI演算偕感測器邁向工業4.0
既有資料處理/解讀不易
蒐集所有可能資料並儲存在雲端,待日後再進行評估、分析以及結構化,是目前各界廣泛採納的做法,但運用在從資料中擷取價值的目標上卻不特別有效。資料產生附加價值的潛力迄今仍有待開發,導致之後的階段尋找解決方案變得更加複雜。較理想的替代作法,是儘早判斷什麼資訊和應用有關聯,以及要在資料流中擷取什麼資訊。換個方式來說,提煉資料就是從整個處理鏈的大數據萃取出智慧資料,同時判斷哪些AI演算法在個別處理步驟中有較高的成功機率,這樣的決策可以在應用層面執行,而且取決於多種邊界條件,像是可用的資料、應用類型、可用的感測器模態、以及較低階實體流程的背景資訊。
在個別處理步驟中,正確處理與解讀資料非常重要,攸關是否能從感測器訊號中擷取出真正的附加價值。依據應用的種類,可能不容易正確解讀個別感測器資料,以及擷取出所要的資訊。這方面的其中一個重點,就是暫時性行為會直接影響人們想得到的資訊。此外,必須經常考量到各感測器之間的相關性。在一些複雜任務中,光是用簡單的門檻數值以及人工判斷邏輯或規則,已不足以應付當前的需求。
AI模型凸顯資料價值
相較之下,藉由AI演算法處理資料,系統即能自動分析複雜的感測器資料。透過這樣的分析程序,可獲得希望得到的資訊,而附加價值也會在資料處理鏈中和資料一起自動浮現。
作為AI演算法一部分的模型建構,基本上分成兩種不同方法。其中一種建模法是運用公式陳述資料與所要資訊之間的關係。這類方法需要有數學式形態的物理背景資訊。這些所謂的模型方法,在結合感測器資料以及背景資訊後,就能對想獲得的資訊產生更精準的結果。最常見的例子就是卡爾曼濾波法(Kalman Filter)。
倘若以數學公式型態描述資料,但無法描述背景資訊,那麼就必須選用資料驅動(Data-driven)法。這類演算法會直接從資料擷取出所要的資訊。過程中包含所有種類的機器學習方法,例如線性回歸、類神經網路、隨機森林、以及隱藏式馬可夫(Hidden Markov)模型等。
挑選AI方法通常根據目前對應用掌握的知識。倘若已經有完備的專業知識,AI就能扮演更具支持力的角色,而演算法的功用則比較初階。但若是尚未積累專業知識,那麼AI演算法的應用就複雜許多。多數情況中,這樣的應用除了會定義硬體的內涵,還會對AI演算法形成許多限制。
演算法建置近感測器降通訊/儲存成本
在每個步驟中需要的整體資料處理鏈,建置方式必須能產生最高的附加價值。建置一般都屬於整體層面,從內含有限運算資源的小型感測器,經過閘道器與邊緣電腦,一直到大型雲端電腦,顯然演算法不應只建置在單一層面。通常較有利的作法,是將演算法盡量建置在靠近感測器的位置,如此一來即可在早期階段對資料進行壓縮與整理,進而降低通訊與儲存的成本。
此外,早期從資料擷取出關鍵的資訊中,用到的較高層面全域演算法所涉及到的研發工作也比較簡單。在大多數情況中,串流分析(Streaming Analytic)採用的演算法也能避免不必要的資料儲存,進而省下資料傳輸和儲存的成本。這些演算法對每個資料點(Data Point)只會用到一次,因此會直接擷取出完整資訊,不需要儲存資料。
嵌入式AI結合感測器資料提升準確度/效率
例如亞德諾半導體(ADI)旗下以ARM Cortex-M4F處理器為基礎的微控制器ADuCM4050是一款省電的整合式微控制器系統,內建電源管理功能,以及類比與數位周邊裝置,支援資料擷取、處理、控制以及連結功能。這些特色讓它適合執行本地端處理,以及運用尖端智慧型AI演算法對資料進行早期的精確化處理。
EV-COG-AD4050LZ是一款低功耗開發與評估平台,可支援ADI旗下的感測器、微控制器以及HF收發器系列元件。EV-GEAR-MEMS1Z屏蔽元件則主要設計用來評估ADI的各種MEMS技術;舉例來說,如ADXL35x系列包括了ADXL355在內,運用於這種屏蔽元件中能提供震動校正功能、長期重複性、低雜訊性能、以及微型尺寸等特性。而EV-COG-AD4050LZ與EV-GEAR-MEMS1Z的組合,則能用在涉及震動/雜訊/溫度分析的結構健康與機器狀態監控。若有需要,其他感測器也能連到COG平台,藉由多種AI方法,並且運用多重感測器資料的融合,對當前情況提供更好的推測。藉由這種方法,即可在更好的細分度與更高的準確率下針對各種運作與失效狀況加以分類。藉由在COG平台上進行智慧訊號處理,大數據會就地變成智慧資料,而且只須把和應用有關聯的資料傳送到邊緣或雲端。
COG平台針對無線通訊納入額外的屏蔽機制。舉例來說,EV-COG-SMARTMESH1Z除了結合高可靠度與強固性,還藉由支援6LoWPAN與802.15.4e通訊協定帶來的低功耗,而支援種類眾多的工業應用。SmartMesh IP網路由高擴充性、自組網(Self-forming)的多跳點(Multihop)網狀拓撲無線節點構成,這些節點負責蒐集與轉傳資料。網路管理員負責監視與管理網路效能、安全、以及Host端應用的資料交換。在以電池供電的無線狀態監視系統中,嵌入式AI特別能實現完整的附加價值。嵌入在ADuCM4050的AI演算法能在元件內將感測器資料轉換成智慧資料,因此相較於感測器資料直接傳送到邊緣或雲端的模式,傳送的資料流以及耗電都會減少。
COG開始平台內含為此平台開發的各種演算法,已涵蓋許多種類的應用,包括監視機器、系統、結構以及流程,從簡單的偵測異常狀況到複雜的故障診斷皆能應付,同時整合包括加速計、麥克風以及溫度感測器等元件,這樣的組合還能用來監視各種工業機器和系統的震動以及噪音。流程狀態、軸承或定子損壞、電子控制元件失效、甚至電子元件損毀導致系統行為出現未知的變化,都可透過嵌入式AI偵測出來。若業界已針對特定損壞發展出預測模型,那麼這些損壞甚至能靠本地端的元件就能預測出來。藉由這種方法,便能在早期階段執行各種維護措施,防範因出現不必要的元件損壞導致系統失效。倘若尚未建立預測模型,COG平台也能協助領域專家學習機器的行為,長期下來即可推演出機器的模型,作為預測維護的參考依據。
AI演算法尚須判斷資料品質能力
理想的狀況下,透過相對應的本地端資料分析,嵌入式AI演算法應能判斷哪些感測器和特定應用有關聯,以及最適合採用的演算法,以展現平台的智慧擴充性。然而即使人類現已廣泛運用各種AI演算法,僅須簡單的建置流程就能用在不同的應用中,並執行機器狀態監控,不過目前仍須由相關領域技術專家為目標應用找出最佳演算法。
此外,嵌入式AI還具備判斷資料品質的能力,或是針對感測器以及整個訊號處理程序找出與執行最佳化的設定。若是融合多種不同型態的感測器,還可運用AI演算法來彌補某些感測器與方法的優點。如此一來,資料品質以及系統的可靠度都能獲得提升。倘若AI演算法判定感測器的分類和應用完全無關或沒有太多關聯性,系統就會截斷資料流。
例如ADI的COG開放平台內含免費軟體開發套件以及範例專案檔,協助加快硬體與軟體的原型製作、促成開發以及實現原創設計理念。透過多重感測器資料融合(以及嵌入式AI(EV-COG-AD4050LZ),可進而建構出連結智慧型感測器的強固且良好之無線網狀拓撲(SMARTMESH1Z)網路。
(本文作者Dzianis Lukashevich為ADI平台及方案總監;Felix Sawo為Knowtion執行長)
智慧醫療方興未艾 AI抗疫喜迎順時鐘效應
2020年1月底以來,新型冠狀病毒肺炎(COVID-19)疫情蔓延全球,抗疫儼然成為所有人齊心面對的共同目標,其中科技防疫更是扮演關鍵角色。正因人工智慧(AI)在防疫、診斷、醫療、藥物開發及協作等方面的成效受到肯定,等於幫政府、業界及民眾做了大量的市場教育,可望加速AI在醫療產業的落地應用,對於AI的其他行業應用也勢必將帶來「順時鐘」效應。
AI賦能 防疫科技工具無所不在
從新冠疫情爆發之後,經常在生活周遭或媒體報導中發現各種防疫科技工具,例如機場及車站必備的紅外線熱影像偵測儀、旅遊景點發布警示的無人機、協助消毒的機器人、具備居家照護功能的智慧監視器等,這些裝置有一個最大的共同點—都是AI應用裝置。
事實上,AI早已深入人們生活的不同領域,但如果不是疫情的爆發,可能沒有那麼深刻注意到AI對生活產生的深遠影響。
舉例來說,大家都很習慣公共場所設有非接觸式紅外線熱影像體溫偵測儀,但很多人並未注意到,這類偵測儀過去可能會偵測到動物、手上的熱飲料而發出警訊,甚至可能有動物或車輛亂入,如今加入AI人臉識別或人體移動辨識功能後,就能更精準鎖定人臉進行額溫測量,不會誤判而造成民眾困擾。
另一方面,如果要偵測民眾是否有戴口罩,毋須指派更多人力,只要採用「視訊監控口罩人臉偵測系統」,透過AI、機器學習及電腦視覺技術,就可精準感應人臉的關鍵部位,進而判斷口罩配戴的狀況,即使人臉過小、角度偏移或有遮蔽物,也不會發生誤判,民眾不需特地停下腳步、或刻意走到鏡頭前,可大幅提高檢測效率,這就是AI厲害的地方。
防疫期間每個公眾場所都勤於消毒,但這項工作不僅辛苦、有害人體,也有一定的感染風險,如果派上防疫機器人,就可大量減少人力。這類智慧機器人不僅有殺菌、消毒、清潔的功用,還有智慧導引及運送的功能,在院內走動時會自動轉彎、避開障礙物、抵達目的地,運送醫療器材或文件檔案也不是問題。
圖1 醫療健康AI主要應用與產值
非接觸式當道 遠距照護/智慧測溫受青睞
為了避免人與人之間的實體接觸,許多非接觸式的醫療應用大行其道,包括遠距醫療、智慧照護的使用量大爆發,也讓AI工具在醫療領域的重要性與日俱增,不僅提供醫護人員相關數據與決策判斷,也可協助醫療資源更有效地配置。
舉例來說,有廠商像是愛微科(iWEECARE)就研發出全球最小的智慧體溫貼片產品添寶(Temp Pal),改變傳統量測體溫的方式,以小型體溫貼片搭配雲端監測系統(圖2),其具備自動、遠距、連續監測體溫與預警的功能,透過藍牙傳輸體溫資料到手機App,可在第一時間發現發燒症狀,同時支援一對多,可監測多人的體溫,減少護理人員定期巡床量測體溫的時間,可明顯提升隔離檢疫工作的照護品質。
圖2 智慧體溫偵測平台
醫療機構或健康照護的室內場所,幾乎都設有監視器,但監視器如果升級成AI功能後,就可透過電腦視覺及機器學習技術,偵測出醫護人員或患者是否有按規定消毒或洗手,藉此降低院內感染的機率,同時還可進行室內場域的個體移動足跡分析,用來監測獨居長者的活動狀態,達到遠端照護的目的。
防疫期間所有藥局為了發放口罩,藥師幾乎都是疲於奔命,但如果藉助AI藥物辨識系統,未來藥師將可更輕鬆,也更可保障民眾的用藥安全。目前愈來愈多大型醫療院所已經導入智慧調劑台,藥師可藉由視覺、聽覺、感知等AI提示,透過不同發光模式、位置指示燈、語音指示、抽屜自動裝置、手勢感應等裝置,以便正確取藥,藥師或護理人員不用擔心拿錯劑量或藥物失竊等問題。
針對老年人或慢性病患,業者也推出了具備AI藥物辨識功能的智慧藥盒,拿到藥袋後,可透過App掃描QR code,將用藥資訊及藥品圖片同步上傳雲端及智慧藥盒,再透過AI影像辨識功能藉以辨識藥物,藥盒會透過語音告知這次吃了什麼藥,同時在App記錄用藥資訊,避免錯漏服藥、服錯藥量或減少用藥等情況。
健康社群應運而生 全民攜手對抗病毒
在疫情蔓延期間,民眾對於各種防疫資訊及健康知識的需求高漲,也讓許多健康社群平台大受歡迎(圖3)。例如「WaCare我的健康社群」就邀請許多醫療專家入駐,提供許多與新冠疫情相關的影片,例如如何戴口罩最有效,同時設立疫情專屬即時論壇討論區,協助在線上幫民眾解答疑惑,未來則以打造遠距健康生態系為目標,可透過AI推論引擎與機器學習技術,建構主動式的個人健康風險評估,讓民眾在風險發生前提早獲知預警。
圖3 醫療數據平台的來源
另外,專注在遠距醫療服務的「醫生馬上看」App,為偏鄉、海外人士、留學生、出國旅遊的會員提供遠距醫療服務,不管何時何處都能透過手機App使用專業醫療諮詢,其內建病歷系統可減少緊急醫療時的溝通時間。目前該平台瞄準企業、保險公司、信用卡等客戶,讓企業員工、旅遊平安險客戶、信用卡用戶在出差或出國旅遊時可以安心出遊。
事實上,由於防疫期間居家檢疫或隔離的民眾有遠端醫療的需求,衛生福利部近期還特別放寬通訊診療法的適用範圍,讓醫生在醫院可透過電腦、行動裝置的視訊進行遠端診療及開藥,不再僅限於偏鄉地區或緊急醫療所需,儘管法規的鬆綁只是短暫性,但包括主管機關、醫療院所、醫生、民眾都對通訊診療有更多的認識及實戰演練的機會,對於未來的遠距醫療、線上看診的建置推動,應有一定的正面效果。
英特爾新一代處理器瞄準AI加速應用
英特爾(Intel)日前推出第三代Xeon Scalable處理器,以及人工智慧(AI)相關軟硬體產品的新增功能,加速數據中心、網路、智慧環境中的分析運算及AI的開發與應用。作為產業中內建支援Bfloat16格式的主流伺服器處理器,此處理器能夠將AI推論與模型訓練廣泛的部署到通用的CPU,適合圖像分類、推薦引擎、語音辨識及建立語言模型的應用。
圖 第三代Xeon Scalable處理器。來源:英特爾
AI與數據分析為金融、保健、工業、電信與運輸等產業開啟新商機,IDC預估在2021年,75%的企業會使用AI。而到2025年,隨著物聯網(IoT)設備創造95%的數據成長,將有四分之一的數據來自即時搜集。
英特爾的數據平台加上使用英特爾AI技術的合作夥伴生態系,共同透過導入AI與數據分析服務,協助優化企業。一系列的產品組合除了第三代內建AI加速器的Xeon Scalable處理器,還有新型Optane 200持續性記憶體,做為第三代可拓展平台的一部分,能夠提供最高每個插槽4.5TB的儲存量來管理密集的數據工作量。3D NAND SSDs、針對AI加速的FPGA、跨架構的OpenAPI以及符合IT需求的Select解決方案,在在強化AI導入企業並落地應用的速度。
工研院AIdea攜手荒野保護協會護海岸線
四散在海灘上的人造廢棄物,是台灣人最不願見到的生態悲歌。據荒野保護協會與綠色和平在2019年發布的海廢快篩調查數據推估,全台海岸線上約有1227萬公升、重量高達646噸的海洋廢棄物,相當於15萬袋大垃圾袋。工研院AIdea人工智慧共創平台與荒野保護協會合作,提出「台灣海洋廢棄物預測」議題,運用AI人工智慧分析全台海岸121個測站的海洋廢棄物快篩調查數據,精準掌握海洋廢棄物分布,為未來淨灘選址提供參考地點;並能透過單一測站的快篩調查數據,預測鄰近測站的海洋廢棄物分布狀況,有助於各測站的人力調配,甚至能減少測站數量,達到人力資源分配最佳化。
海洋廢棄物是全球關注的重大污染議題,尤其海洋廢棄物污染場域廣大,相較於一般空氣污染、水質污染或廢棄物污染等,更不容易找出污染源與污染區域之間的直接關聯。此外,海岸邊的人造固體廢棄物因外觀、尺寸、重量、材質之間具有高度差異,相對於重金屬或農藥等化學污染,目前無法用單一檢測儀器或程序測量。雖然源頭減量才是海洋廢棄物最根本的治理方式,但是改變源頭不易,且需耗費較長的時間,因此做為末端補救的海洋廢棄物快篩與淨灘相當重要。現行的海洋廢棄物快篩調查抽樣,多以人工目測回報,過程十分耗時費力,若能借助AI人工智慧技術掌握海洋廢棄物分布,則能把快篩調查、淨灘的人力分配到污染較嚴重的海岸,增進淨灘效率。
工研院AI人工智慧應用策略辦公室副主任暨巨量資訊科技中心執行長馮文生表示,AI人工智慧在台灣多應用於工業製造、健康醫療、交通運輸、電子商務等領域。對此,工研院擘劃2030技術策略與藍圖,長期投入共通基礎技術AI人工智慧的研發,打造AIdea人工智慧共創平台,協助各行各業找出AI人工智慧的應用發展。此次,工研院AIdea與荒野保護協會合作,共同討論「台灣海洋廢棄物預測」議題,運用AI人工智慧精準掌握海洋廢棄物分布,協助淨灘與測站的人力調配,為永續環境盡一份心力。
荒野保護協會理事長劉月梅表示,現行海洋廢棄物快篩調查抽樣方式,自全台121個測站以人工目測方式回報海洋廢棄物的體積與分布。而且海洋廢棄物分布極為不均,大半的海洋廢棄物都集中在10%的海岸,例如新北市瑞芳的懸崖地形;若淨灘活動都辦在交通方便之處,沒有針對情況嚴重的海灘加強清理,那麼台灣的海洋廢棄物怎麼清也清不完。希望此次透過與工研院AIdea的合作,能靠AI人工智慧減少測站數量,政府或民間團體也可以針對污染嚴重的海岸加強淨灘,將人力資源調配更有效率,就能還給台灣大半的乾淨海岸。
「台灣海洋廢棄物預測」議題利用荒野保護協會及綠色和平基金會2019全年份全台121個測站資訊及海岸廢棄物的快篩調查資料,工研院AIdea團隊從原始數據中進行資料整備、釐清議題,將「台灣海洋廢棄物預測」放上平台。自去年11月上架以來吸引211組來自國內外產學各界的AI人工智慧團隊共襄盛舉,AIdea將預測準確度達75%以上的7位AI好手,推薦給荒野保護協會進行後續AI人工智慧的解題關鍵合作。
工研院「人工智慧共創平台AIdea」匯集了國內AI的產業議題庫、資料庫、人才庫,協助產業跨入AI人工智慧應用,引導台灣企業釐清自身的AI人工智慧需求、整備資料、訂定議題,並協助企業找出AI人工智慧的應用發展。該平台透過逾6,600位的AI解題會員能量,協助醫療、製造、交通、地質、石化、生醫、防疫、酪農業、環保等產業議題找到最佳AI人工智慧應用。未來也歡迎各界多加利用此平台,舉凡舉辦AI人工智慧競賽、參與AI人工智慧議題解題等,讓AI人工智慧成為產業的最佳幫手!AIdea平台網址可參考:https://aidea-web.tw/。
安提國際推新高效智慧邊緣運算系統
AI解決方案已經廣泛的應用在各產業之中,且AI的運算核心也逐漸從雲端轉移至邊緣端,邊緣運算在企業智慧化服務中佔有一席之地。為了發展更多的應用方案,GPGPU和智慧邊緣運算解決方案供應商安提國際發表了全新的AN110-XNX邊緣運算平台。結合NVIDIA Jetson Xavier NX 運算模組和AN110載板,外型大小精巧,但擁有高達21 TOPS的運算效能,不僅可以驅動邊緣端的智慧應用,如智慧交通、工廠、零售、醫療等,也可以打造全自動的機器人設備。
AN110-XNX的小型化設計,包含風扇的尺寸僅87.4x68.2x52 mm,但卻蘊藏更強大的AI運算能力。全新Jetson Xavier NX擁有384個 CUDA核心、48個 Tensor核心、6個Carmel ARM CPU處理器,以及2個NVDIA深度學習加速器,讓NX模組能夠提供高達 21 兆次的運算能力。這大幅度地擴展開發人員和客戶當前的可用選擇—需要高性能的嵌入式邊緣運算系統卻受限於大小、重量、功耗、預算或成本的AI應用。
AN110-XNX支援MIPI CSI-II介面的相機,可搭載1個4K或2個FHD相機,在廣泛的智慧視覺應用中,安提的平台能夠驅動多功能的AI解決方案,同時處理高解析度相機與影像分析所要求的高密集人工智慧運算量。同時,安提國際AN110-XNX平台另有提供帶機殼版本AN110-XNX-EN70,提供顧客多元選擇並快速落地使用。在安提國際智慧邊緣系統加值服務的內容中,提供安提標準品及客製品項的BSP及DTB架構更新。而針對NX模組,安提國際規畫更進一步的計畫,5G通訊與邊緣裝置的遠端管理功能,皆會實踐在這樣的智慧邊緣解決方案上,以應付持續擴大的人工智慧市場需求。
安提國際產品經理朱鴻欽表示,NVIDIA為當前邊緣運算解決方案的領頭羊,安提今年與其鏈結合作夥伴網絡,能夠更深入透過他們的運算模組,來打造更多適切的應用。安提長期專注於長期供貨的嵌入式產品與工業領域適用的解決方案,NVIDIA Jetson系列具有雲端的原生功能,模組緊湊的設計提供良好的AI運算能力,搭配安提設計周詳的載板,讓系統能夠輕易部署和快速整合生成邊緣AI應用。
高通推機器人RB5平台為5G/AI應用鋪路
高通(Qualcomm)日前基於過去成功的RB3平台,發布專為機器人設計的RB5平台。RB5平台由一系列機器人/無人機通用的軟硬體產品組合而成,將能整合高通的5G及人工智慧(AI)技術,有助於開發人員與製造商創造出下一世代所需的高算力、低功耗機器人/無人機設備,並預計2020年上市。
圖 RB5開發套件。來源:高通
RB5平台採用高通QRB5165處理器,客製化機器人所需的應用程式,提供強大的異構計算結構(Heterogeneous Computing Architecture),加上第五代高通的AI 引擎,效能可達到每秒15兆次 (Tera Operations Per Second, TOPS),用以運算複雜的AI與執行深度學習。此處理器同時使用新的高通Hexagon張量加速單元(Hexagon Tensor Accelerator, HTA)、可支援七顆鏡頭的影像處理器與強化影像分析能力的電腦視覺引擎。
整合RB5平台與QRB5165處理器,高通可以設計多元的產品,包括現成的系統模組,以及晶片上靈活的設計。該解決方案有多種組合,可依照商業或工業及的溫度範圍選擇。同時透過配套模組支援4G及5G連接,RB5機器人平台可為未來的5G機器人及智慧系統鋪路
RB5平台的主要技術包括:
1. 強力的異構計算功能:為了達到高功率的計算效能,平台所用的處理器整合Octa Core Qualcomm Kryo 585 CPU、powerful Qualcomm Adreno 650 GPU、多個數位訊號處理器(DSP)以及ISP,並且使用包含Hexagon張量加速單元的專用AI引擎、電腦視覺引擎。
2. AI引擎:新型的Hexagon張量加速單元基於第五代的高通人工智慧引擎,可以提供每秒15...
新思攜手台積電實現HPC/行動/5G/AI等SoC設計
新思科技(Synopsys)近日宣布,運用於台積公司N6 及N5製程技術的數位與客製化設計平台已取得認證。新思科技與台積公司的長期合作加快了高效能運算(high-performance computing ,HPC)、行動、5G 和 AI 晶片設計等關鍵垂直市場的新一代產品設計。
這項成就是雙方多年來廣泛合作的成果,以提供最佳的設計解決方案,並透過創新來提升節能效率和設計效能,從而加速新一代設計的發展。新思科技與台積公司的合作也擴展到 3DIC 製程技術,其中包括 CoWoS 、InFO 和 TSMC-SoIC ,這些技術能實現可擴展的整合,以達到更好的功能與更強大的系統效能。
台積公司設計建構管理處資深處長Suk Lee表示,台積公司與其生態系統夥伴密切合作,確保半導體設計人員能使用台積公司最新的製程技術,以符合高成長市場中新一代設計對效能和低功耗的要求。我們期待與新思科技繼續合作,以協助雙方客戶為高效能運算、行動、5G 和 AI 應用釋放矽晶開發之創新能量。
通過認證、運用於HPC和行動設計流程的新思科技設計工具的創新功能,能讓設計人員充分利用台積公司 N6 和 N5 製程技術,提高密度、操作頻率(operating frequency)和功耗表現。另外,新思科技的工具功能也已經過提升,可支援低功耗行動和 5G...
突破尺寸/功耗/效能天險 智慧推論晶片迎接新典範
未來消費性裝置創新,須仰賴創建更智慧的新型聯網裝置。此一未來,會由更多具有近端機器學習推論能力的知覺型感測器(Perceptive Sensor)所推動。運用這些感測器並同時擴大推論網路,將能推動智慧型裝置在幾乎所有方面的功能與使用者體驗的提升。隱私權亦可透過終端裝置本地推論的運行而獲得改善,因為只有最少量的使用者資料及感測器資訊會上傳至雲端。
機器學習被鎖在雲端
機器學習與智慧型裝置的交會解放了消費性電子產品新一波的創新。然而最佳的機器學習網路處理需求以及低功率處理器效能之間還有極大的差距。目前的解決方案是運用裝置收集並廣播感測器的資料至雲端,而高功率、專用的機器學習處理器則在雲端負責推論,並在完成後將結果透過網際網路回傳至使用者裝置。這個方法雖能提供機器學習的功能,但亦有極明顯的弱點。裝置有限的能量必須消耗一部分以保持持續的網路連線;雲端運算的延遲亦會限制了裝置對推論的應用,並且會破壞使用者體驗。而傳送原始資料的需求則讓裝置難以維護資料安全,並造成隱私權的顧慮。整體而言,這些限制了智慧裝置對機器學習的實際運用。
第一代的低功率機器學習處理器的整體容量與運算能力不足,只能專注在基本網路應用,如語音指令辨識,以及用於攝影機控制及客製化過濾的特徵偵測等。機器學習的核心邏輯絕大部分被減慢的摩爾定律所限制,因此若沒有效能上快速的改善,機器學習就必須維持在雲端。僅有在運算架構出現突破,方能創造出高效能、高正確度的近端推論。
本文意在展望複雜的推論網路可在幾乎任何消費型裝置上執行的未來─現在已極度接近。全新的「智慧型推論裝置」浪潮將會提供近端高效能的機器學習,讓敏感性的使用者資料不必上傳網路及雲端。其能自動化運用機器學習以改善低階裝置的功能以及使用者體驗。其將由快速創新、機器學習的同步處理、處理器設計、裝置設計所驅動,以創造全新的未來使用者體驗。
機器學習推論的突破
近期機器學習所克服的進階挑戰,揭露了新興智慧型推論裝置的絕佳前景。眾多團隊投身機器學習研究與學習/推論的程式碼庫,讓機器學習進入指數型的學習曲線。大部分的進展多與裝置的雲端連線能力或近端處理有關,針對處理較小資料集的研究則是純粹近端處理的最佳候選。裝置近期可以直接運用的創新包含:
・觀察手勢並處置實體世界物體
這項創新在兩個相關領域中已取得進展,可追蹤人類與機器人手臂,及教導機器人執行觸覺操縱。2019年,OpenAI透過在3D模擬中訓練的機器人展現出手指的靈活性,將其知識轉移至現實,並適應現實世界的物理現象。這創造出可以執行複雜任務的彈性,像是解開真實世界的魔術方塊,卻不需要真實世界的訓練。此外,2019年Oculus Quest亦發表了視覺感測器的手部追蹤技術,需要同時使用4具攝影機以進行6個自由度的頭部追蹤。該解決方案在Snapdragon 835處理器及3MB的神經網路架構,以500mW的耗能提供骨骼及數個手勢追蹤。此前非機器學習的解決方案必須使用景深攝影機及專用邏輯,並消耗超過15W的功率,卻僅能提供明顯較差的正確性。
・以現在的行動衡量未來結果
在Google的DeepMind中,強化學習經過修改而能了解賽局中決策的長期結果。Temporal Value Transport演算法則是用以將未來所得的結果通知現在,結合未來利益的機率於當前的行動中。這種結合未來結果於目前決策的能力能大幅改善機器學習系統在現實世界的決策制定,除可協助裝置進行更複雜決策的制定,還能大幅改善可執行任務的數量以及可應用狀況的複雜度。
智慧型推論裝置 開創全新體驗
運用推論協調裝置功能是未來裝置設計的強大典範。推論驅動的設計可以創造全新等級的使用者體驗,同時改善低階裝置的功能。具有多重網路推論的裝置將用以進行使用者與環境輸入訊號的複雜翻譯而不需要運用到雲端。使用多重同步網路能讓裝置對於使用者與環境輸入訊號有更高層的理解及反應。這些裝置受到影響的邏輯包含:
・智慧型推論裝置啟動
機器學習極適合翻譯聲音、手勢以及視覺輸入,以啟動裝置、節省電池電力並減少雲端資料傳送。
・雲端運用與資料隱私經衡量
裝置可以運用推論在雲端相關任務上,包含進一步推論,或是非推論的雲端計算。裝置可以在近端進行推論,而不需要提供原始資料至雲端。聲音、影像及感測器資料及其所產生的推論均不需要上傳。裝置可以決定哪些資料需要傳送至雲端,而該邏輯可以透過設計以強化隱私與資料安全性,而不需要因為必須在雲端處理而公開地揭露。
・推論驅動使用者體驗
在裝置靈活性、真實聲音翻譯及重製、導航、視覺、偵測、辨識等裝置功能的提供上,推論已證明具最佳的表現。推論可以直接用以創造全新使用者等級的功能與體驗,這些都是不具推論能力的裝置所無法提供的。可同時使用一組以上神經網路的處理器,具有能在裝置及使用者層級同時運用視覺、聲音及創新感測器輸入以制定複雜決策的能力。
啟動智慧型推論裝置
啟動感測器或連接至雲端都需要運算、耗電以及成本。若裝置能快速推論,一旦感測器的輸入需要後續對應動作時,處理器便能聰明地啟動、建立無線網路連線,而雲端的任務亦能明確地被指派。以此方式,低功率的推論便能透過把有趣的動作偵測、聲音啟動以及使用者意圖等留在裝置近端處理,節省整體裝置的耗電(圖1)。
圖1 推論驅動設計的智慧裝置運作
智慧型啟動的重要性不應該被低估─裝置可以進入可接受的耗電範圍,而在許多應用中雲端服務可以避免雙位數的誤判。
・只有當任務短語和語調提出時,更聰明的啟動文字才會觸發裝置和雲端活動。
・在各種基於攝影鏡頭的應用中,智慧動作感測可預測動作的意向,以避免下游處理。
・智慧感測處理能減少一般功能處理器的負載,並運用機器學習來聰明地啟動裝置。
雲端運用與資料隱私經衡量
行動與社群應用帶來前所未有規模的運算與隱私挑戰。為雲端所設計的應用,可以把推論移轉至裝置,減少延遲並節省雲端資源。此外,如穿戴式裝置或智慧音箱等產品亦能決定近端、多因子排程以執行不同甚至是多重供應商的雲端服務。雲端雖然有極大的運算能力與資料量,不依賴網路連線的近端裝置則免於網路延遲與不可靠性。能正確在近端執行推論的裝置,因為能在近端分析聲音、影片、空間及其他感測器資料,僅需傳送較少的資料至雲端,能大幅改善機會來保護使用者隱私。
・機器學習從雲端轉移至近端裝置可以達成低延遲的使用者反應,能大幅改善聲音、攝影機、手勢等輸入的使用者體驗。
・近端的影片與聲音分析可以在近端執行,僅有在需要進行雲端分析時才將影片或聲音上傳,因而能保護敏感的使用者原始資料流。
・智慧型應用程式介面亦能讓單一智慧裝置對來自多個供應商的應用程式進行任務分派並進行雲端互動。
推論驅動使用者體驗優化
推論是讓裝置開啟尖端且全新使用者等級功能的核心性能。結合機器學習推論的聲音與視覺處理讓裝置能辨別複雜的指令與語境,而後產生絕佳的成果。可在新興智慧型推論裝置上擴展的功能,包含使用者回應功能像是生物辨識存取、環境回應、有意義的輸入以及衍伸的人類意圖。此外,還包含替身模擬、機器人控制、智慧型感測器控制及導航等功能(圖2)。
圖2 機器學習推論可讓裝置開啟全新使用體驗的尖端功能
智慧型推論裝置機器處理器的期待屬性
能協調智慧型裝置功能的處理器,將運用機器學習技術,同時包含與裝置感測器、核心處理以及功率控制的關鍵介面。其將成為裝置的大腦,以啟動裝置的功能並調配關鍵的處理。理論上,其能提供實用的功能讓裝置因為減少耗能、必要時智慧化啟動裝置功能、確保其能依安排的需求而啟動,而成為更好的產品。在此同時,其能高效率正確地處理複雜的網路,體積又能更小─讓其可以置入體積精巧的平價裝置。
未來智慧型裝置的關鍵考量是其在感測器與耗能之間的關係。許多裝置需要延長電池使用時間。現今,複雜的視覺感測器資料分析會以最大Thermal Design Power(TDP)的狀況下消耗所有的運算資源。智慧型感測器僅有在必要時會啟動處理、無線網路、雲端互動及實體功能。智慧型感測器與裝置功率的減少是加速智慧家庭採用的必要項目。智慧化啟動網路運作及雲端互動可以減少裝置耗能、延長運作時間、增加尖端功能所能保留的電力預算。家用配線是長期的限制,需要許多裝置以電池運作,以增加消費者的採用。現今電池運作的智慧型家用裝置通常使用4個以內的AA電池或是3500mAh的充電電池,而目標運作時間則在3個月以上。運用智慧型感測器,僅在必要時才啟動裝置,在近端處理輸入而不需要無線網路的連線,可以顯著增加其功能,並減少對於電力的需求。
最佳化的效能、架構、軟體、功率以及研發平台的匯集,對於推論成為未來智慧型裝置設計的驅動因素是全部必要的條件。最佳化的推論處理器將在這些屬性上同時擁有優異的表現。
效能
・高機器學習網路效能/瓦特:能執行高正確性、現代的影片/影像/聲音處理類型網路。
・一致的加速度:即便在網路程式碼改變,並擴大多重網路類型,仍能提供相對一致的加速度。
架構
・整合式設計:小尺寸及高度整合,以簡化設計。
・標準匯流排:使用標準介面與匯流排設計,易於整合至裝置。
・多重感測器輸入/輸出介面:支援影片、聲音、常見及新興的感測器。
・可擴充性:在相同的程式碼下,設計架構能擴展至多重ASIC或是更大、更高性能的ASIC。
・低延遲:整合記憶體架構及快取,以快速處理所擷取的資料,包含聲音及高解析度/多重攝影機影像等。
軟體
・快速載入:快速並動態載入,同時執行多重機器學習網路。
・不特定機器學習網路:執行任何神經網路型式或是分層類型。
・執行及相關多重機器學習處理:運作多重網路並執行橫跨多重推論的分析。
・一般目的運作:執行程式碼以產生完整形成與裝置運作相關的成果。
電力
・低TDP:支援電池電力以延長穿戴式裝置及離線操作的使用時間。
・低熱度限制:低熱度適合支援穿戴式裝置及全被動式運作。
・快速啟動:由使用者或感測器呼叫可快速、低延遲的啟動加速器,適合底層以低於使用者感知等級的運用。
・選擇性啟動:命令和控制感測器啟動,支援額外處理,協助裝置平均耗能最小化。
平台
・強力的SDK及說明文件:軟體工具集,搭配第三方工具的支援,使其易於運用於目標的加速器中。
・最佳化的預製:針對主要應用的功能區塊,如偵測、分類、除噪等,提供直接替代(Drop-in)的支援。
・部署工具集:來自主要機器學習平台如MXNet、PyTorch、Caffe及TensorFlow的移植工具等強力支援。
兼顧尺寸/功耗/效能 全新推論處理器登場
新創公司Perceive發表全新的Ergo,是款高度整合的推論處理器,能將所有推論處理卸載至低功率應用及小尺寸裝置。Ergo能以相當於55 TOPS/W的性能執行推論,而在全功率運轉時可以達到4 TOPS,而不會犧牲正確性,或限制可支援網路的類型。Ergo ASIC採用7×7mm FBGA封裝並能以約20mW耗能處理許多網路,最大功率約為120mW,且完全採用被動式散熱。在現場展示中,Ergo在全速運轉之下溫度仍低得可以直接碰觸。
Ergo是設計來執行傳統上僅能在資料中心等級推論處理器上方能運作的網路。現今Ergo可以完整執行YOLOv3,在批量尺寸為1時以246fps處理6400萬組參數。Ergo可以執行傳統上需要超過400MB儲存空間且有超過1億組參數的網路。
與之前設定為低耗電應用的推論處理器相比,Ergo計畫並達成所有之前的處理器及專用加速器擁有相當的每瓦特效能的20倍至100倍的功率效能。現今的推論處理器一般低於5 TOPS/W,而Ergo則可以達到55 TOPS/W以上。
要達成這樣的效能,Perceive發展出全新的運算架構,能維持高正確性,但大幅減少記憶體與耗電量的要求。Ergo新穎的網路表示法(Representation)避開推論對於MAC陣列的需求,並因而精巧至足以在晶片內記憶體執行大型網路。Ergo晶片亦採用積極性功率與時脈閘以增加電源效率。因此,Ergo能在7mm×7mm的封裝內提供極高的正確性。結合了源自數學原理的方法至機器學習、不是依據MAC而設計的架構、沒有外部記憶體、傳統的節電技術,是讓Ergo可以在資料中心等級網路上提供高正確性、效能與效率的原因。
廣泛的移植網路和一致的效能提升,代表該公司已成功創造一種能提供相對於今日推論負載明顯效能改善的架構。此外,該公司亦已展示許多多重網路應用,均與其宣稱的網路容量及性能相符。
Perceive Ergo能直接串接高解析度、高影格率影片感測器,讓多重感測器與即時元資料(Metadata)有機會作為推論處理的額外輸入。此能提供先進的問題解決與多重網路推論,讓其能運用於核心裝置控制與先進的終端使用者功能。有了高效能與網路容量,亦可能推出全新的功能。在此機會之下,軟體設計與訓練出現新的挑戰,對裝置生產廠商成為全新的技術挑戰。Perceive已試著透過工具套件(其中含有針對一般機器學習應用的已可用於部署Ready-to-deploy網路),讓研發更為容易。
Perceive Ergo機器學習網路範例
Perceive Ergo可同時執行多個網路,讓智慧型裝置能採用推論驅動設計。其已使用現今多層次網路如CNN(包含殘差邊緣)、LSTM、RNN及其他網路進行測試。示範的網路包含:
以M2Det進行多重物件偵測
多重層次多重尺度偵測器(M2Det)是新發表的類神經網路(2019年1月),用以進行物件偵測及在地化,設計以偵測尺度差異極大的物件。M2Det是款端到端、單一拍攝物件偵測器,其在現實世界應用極為實用,因為物件可以是在漸進場景中且尺寸及比例差異極大。
以YOLOv3進行多重物件偵測
YOLO是由Joseph Redmon及Ali Farhadi所創造的CNN式類神經網路,可以在影像及影片中辨識並定位高達80個物件類型。現今YOLOv3是資料中心最受歡迎的多重物件偵測器之一。
以專用網路進行聲音事件偵測
最佳化的類神經網路可以以小尺寸的類神經網路辨別多重聲音事件類別,讓其極適合運用搭配較大的視覺處理類神經網路使用。
以ResNet進行臉部辨識
深度殘差學習因較易訓練與絕佳的正確性而受到關注,其為微軟研究院(Microsoft Research)在2015年所發表。多重層次配置的ResNet已運用於大型樣本地區臉部與影像辨識。
Perceive Ergo同步推論類神經網路範例
Perceive Ergo已示範結合這些類神經網路運作,並且以其自身的記憶體/網路權重能力在技術上是足以同時執行多重類神經網路。此處理器能執行全新類神經網路的組合,處理使用內建輸入/輸出埠自多重偵測器所取得的資料。
Perceive...