- Advertisement -
首頁 標籤 AI

AI

- Advertisment -

凌華推一站式邊緣方案 簡化工業AI機器視覺部署

邊緣運算解決方案商凌華科技(Adlink)推出全新的 NEON-1000-MDXAI智慧相機系列以及智慧棧板解決方案,搭載 Intel Movidius Myriad X VPU(支援經過 OpenVINOTM 最佳化的推論模型)與凌華科技的 Edge 視覺軟體,以快速、簡單的方式將以AI為基礎的機器視覺導入現有環境。此all-in-one解決方案讓機器視覺專家和開發人員更快地建構、測試和部署機器學習(ML)模型,同時為IoT解決方案團隊和系統整合商提供連接、串流及自動化機器視覺工作所需的工具。 凌華科技IoT策略解決方案與技術事業處資深產品經理許凱翔表示,在這個生產高度智慧自動化的時期,人們都感受到提高產量的壓力。若要在不影響目前工作流程的前提下引進自動化,AI機器視覺是最快速、最簡單且最具成本效益的方式之一。例如,該公司的智慧棧板解決方案經證實可將傳統條碼掃描時間縮短90%,同時提供客製化服務,除了安裝智慧相機之外,完全不必動到生產線。採用高度整合的NEON-1000可有效減少佔用空間、可靠性和相容性問題,並且為客戶減輕維護負擔。 Intel Movidius Myriad X VPU將ML模型最佳化並提供良好的AI運算能力。NEON-1000-MDX 智慧相機能排除感測器模組、接線與VPU模組間的複雜整合問題,簡化機器視覺部署流程。透過預先安裝的Edge Vision Analytics(EVA)SDK,使用者可以根據環境和系統需求使用各種現成外掛程式,同時使用OpenVINO優化過的神經網路進行推論,不需要額外的編碼或整合工作。 全新一站式NEON-1000-MDXAI智慧相機支援產品分類和瑕疵偵測,能將智慧製造的生產效率最大化,如同獲獎肯定的凌華科技 Edge 智慧棧板解決方案。智慧棧板將智能化和自動化導入手動倉儲作業,例如收貨、揀貨、包裝、運輸和工作人員安全。智慧棧板提供端對端整合式系統,以連接新設備與現有設備、擷取多個影像資料流,並利用 NEON-1000-MDX VPU 的高效能處理能力實現邊緣機器學習與推論。 透過凌華科技 Edge軟體平台,開發人員可以與任何現有的雲端、機器學習平台、神經網路、工業相機、機器視覺系統、機械等連線並整合,不限供應商。凌華科技的機器視覺AI軟體能依據所見物體分類、隨時間推移變得更聰明,以及建立自動化工作流程。 凌華科技IoT解決方案與技術部副總Steve...
0

OrCam邀梅西任品牌大使 致力關懷視障/推廣輔助科技

個人穿戴式AI創新品牌OrCam日前宣布全球足球傳奇巨星—梅西(Leo Messi)將成為OrCam新任品牌大使,一同致力於推廣OrCam為改善視障朋友生活而推出的創新AI科技。OrCam Technologies希望透過這次與巨星梅西的合作夥伴關係,提升人們對於全球各地視障朋友及團體所面臨挑戰的認識。 作為本次合作的環節之一,OrCam將安排足球巨星梅西與數十位來自世界各地視障朋友的見面會,參加者能夠從梅西手上獲得OrCam MyEye,這是一款能夠有效提升他們日常生活中獨立的裝置,而這次活動也將一圓他們與自己心目中足球偶像見面的夢想。除此之外,梅西未來每年也將會贈送OrCam MyEye給提供啟發性故事的視障朋友們,並且將與這些視障朋友在西班牙巴塞隆納碰面,這些人也將加入由梅西所帶領的<OrCam Dream Team>。 首場見面會於全球疫情爆發前舉行,而那次經驗也讓梅西留下深刻印象,梅西表示,當時的情緒至今仍令他印象深刻,與這些來自世界各地令人敬佩的視障朋友們會面,對其而言是非常特別且震撼的經驗。在見證他們試用OrCam MyEye後,發現OrCam MyEye對每個人而言都稱得上是能改變其一生的裝置。因此很榮幸擔任OrCam大使,為更多人帶來真正的改變。 全球大約有3億人飽受失明或不同程度的視覺障礙之苦,OrCam MyEye能夠有效且大幅度地改善他們的生活品質,而<OrCam Dream Team>的成員也都是來自世界各地的視障朋友們。 OrCam的CEO暨創始人Amnon Shashua教授表示,OrCam Dream Team的成立,對其及OrCam而言都振奮人心。OrCam一直以來所重視的,同時也是OrCam創立時的初衷,就是關於視障朋友們在生活中真正面臨到的問題與挑戰。該公司的目標是透過AI技術,在現實中實際且即時提供協助。OrCam的裝置能夠在日常生活中提供許多關鍵協助,減少生活的不便,有助於視障朋友們融入社會,特別是在教育與就業方面。OrCam的技術能夠激發使用者本身所具備的潛力,而正因為梅西象徵著個人潛力的極致展現,同時也是舉世聞名的名人典範,因此相信這次合作一定能夠觸及更多有需要的朋友。 藉由人工智慧驅動的創新人工視覺裝置OrCam MyEye,具備無線、重量輕且體積小巧等特性,能夠準確判讀印刷品資訊或電子文件,並且即時清楚地朗誦給使用者。無論報紙、書籍、電腦或智慧型手機螢幕的訊息、餐廳菜單、超市的產品標籤,以及路牌資訊都可以即時判讀。此外,OrCam MyEye還能提供即時的人臉辨識、產品資訊辨識、顏色辨別,以及鈔票辨別等功能。 OrCam MyEye可以藉由磁性吸附在眼鏡鏡框,重量僅22.5公克,易於使用且操作簡單,相當適合視障朋友使用。其搭載的人工視覺技術,讓裝置無需透過任何網路連線,只需要穿戴者透過指向手勢,或是藉由穿戴者的視線範圍來觸發,能夠做到即時回應,且又能確保隱私。 OrCam MyEye目前可支援25種語言,並在全球50個地區上市,而OrCam MyEye 2也被美國時代雜誌(TIME)評選為2019年最佳發明。
0

NVIDIA以400億美元收購Arm

日前軟銀(Softbank)同意以400億美元將Arm出售給Nvidia。Nvidia在官方聲明中指出,Nvidia透過整合其人工智慧(AI)平台與Arm的生態系,能夠加速市場拓展與創新速度。 軟銀同意以400億美元將Arm出售給Nvidia (圖片來源:Nvidia) Nvidia創辦人暨CEO黃仁勳表示,AI是近代極具影響力的技術,帶動了一波新的運算浪潮。未來幾年中,執行AI的數萬億台電腦將會創造新興的物聯網技術,帶來幾千倍的運算量,因此Nvidia與Arm的結合,將能創造AI時代具代表性的公司。 Arm被Nvidia收購後,會持續運作原先的開放授權模式,同時維持面對全球客戶的中立性,目前被授權的合作方已出貨1800億個晶片。Arm原先的合作夥伴也將受惠於Nvidia的產品技術。 收購完成後,Nvidia計畫保留Arm的品牌,並在英國劍橋擴大其規模,除了於英國註冊Arm的智慧財產權,也會在劍橋校園中建立新的全球AI研究中心,設置Arm-powered AI超級電腦,成立開發人員訓練設備及新創孵化器,為醫療保健、機器人、自駕車等技術領域創造創新平台與合作管道。 在Nvidia、軟銀集團、Arm共同簽署的交易協議中,Nvidia會付出215億美元的股票以及120億美元的現金給軟銀,其中包含協議簽署時支付的20億美元。另外,Nvidia會向Arm的員工發售15億美元的股本,同時此筆交易規畫在18個月內完成,且此次收購案不包含Arm的物聯網部門。
0

新冠疫情加速製造業數位轉型腳步 AI視覺/手臂整合更強大

就在新冠疫情起起伏伏,製造業者對智慧製造的需求更加迫切的背景下,2020年台灣科技相關產業的第一個大型實體展覽—台北國際自動化展揭開了序幕。雖然參觀人士必須戴著口罩才能入場,但場內觀展的人潮仍不在少數,且許多參展廠商都端出了人工智慧(AI)相關的展示內容,更讓今年的自動化展飄著濃濃的AI味。 安全皮膚技術助陣 工業機器人走向協作化 新冠疫情使得許多工廠面臨現場勞動力不足的考驗,進而使工廠人機協作的升級轉型需求大增。但工業機器手臂為追求生產效率的極大化,作業時往往必須與人類作業員保持安全距離,使得人機協作的理想很難落實。如何讓工業機器手臂與人類作業員安全地協同工作,成為機器手臂產業的重大議題。 為實現工業協作手臂的理想,專注研發機器手臂安全皮膚的原見精機,與日本川崎重工(KAWASAKI)攜手合作,共同發表了搭載安全皮膚的工業機器手臂(圖1),藉由高達95%且無死角的包覆度,讓工業機器手臂的安全度大為提升,並朝工業協作的目標跨出一大步。 圖1 原見精機與川崎重工合作,讓原本專為工業應用設計的KHI RS007L機器手臂,在加裝專為其設計的安全皮膚後,升級為工業協作手臂 原見精機董事長蘇瑞堯表示,該公司自2017年創立以來,靠著全球唯一的表面式力感測器解決方案,獲國內外諸多機器人龍頭廠商青睞,攜手提升智慧製造人機協作的安全性。很榮幸本次與川崎重工進一步深化夥伴關係,推出搭載於其機械手臂、市面上包覆最完善的機器人觸覺技術解決方案,現正於日本進行最後檢測實驗,預計不久後即可問世量產。該公司將持續以MIT的堅強技術實力,與更多夥伴攜手打世界盃,以安全的工業協作自動化為核心,擘畫下世代工廠未來。 川崎重工新事業開發部部長野田真指出,產業環境日新月異,川崎重工於工業自動化與機器人產業發展的五十多年間,不斷開發並尋找能符合市場需求的技術。原見精機獨有的觸覺感測解決方案,有效促進大型工業機器人與人類的協作,為新時代自動化產業的發展注入活水。搭載於KHI RS007L的T-Skin安全皮膚新產品,提供機器手臂在協作同時又保有完整的工業精準特性,升級為堅實、精準、耐用的下世代機器人。 原見精機的T-Skin安全皮膚,具有高感度特性,只要一公斤力碰觸就可命令機器人停止。該產品是全球第一個通過歐盟CE驗證最高規格的觸覺感測安全產品,且符合人機協作技術規範ISO/TS 15066的人體安全撞擊測試,產品安全與功能安全均獲認可,達到完整機械系統的安全要求。 原見精機總經理盧元立則進一步說明,KAWASAKI的輕量型機器手臂KHI RS007L是目前同一負重等級中,全球運作速度最快的機械手臂。該手臂原本是專為工業應用設計的產品,但由於人機協作是機器手臂很重要的發展趨勢,如何讓工業機器手臂在快速、精準的既有優勢上,提高其安全性,是許多機器手臂業者都在追求的目標。 在既有的工業手臂上加裝安全皮膚,可讓工業手臂快速升級為工業協作手臂,且成本也遠低於購置新的協作型手臂(Cobot)。但安全皮膚必須針對手臂進行深度客製化,才能避免安全皮膚拖累或干擾機器手臂的運作。原見與川崎重工合作,為KHI RS007L開發專用安全皮膚T-Skin的目的,就是為了讓該手臂能一方面保有其輕巧快速的優勢,另一方面又更加安全。 除了與川崎重工直接合作外,原見也已經針對其他機器手臂品牌的多款產品開發出外掛式的安全皮膚,可讓製造業者用最實惠的投資額,將既有的工業手臂升級為工業協作手臂。 驅控整合式機器關節讓手臂設計更彈性 在本次自動化展中,除了安全皮膚外,與機器手臂有關的重要技術,還有工研院所發表的第三代驅控整合式機器關節。 工研院機械所智慧機器人技術組長黃甦表示,目前市場上絕大多數機器手臂的臂長與構型,都是由機器手臂原廠定義,使用者跟系統整合商(SI)無法依照自家產線的需求或場域狀況進行調整,也使得某些很特別的應用場域找不到適合的機器手臂。因此,工研院發想出新的設計理念,把整隻手臂拆分成一個個關節單元,讓使用者或SI可以依照應用場域的狀況,在一定的容許範圍內,針對每一節手臂的臂長、手臂的整體構型進行客製化,打造出量身訂做的機器手臂。 目前這項技術已經發展到第三代,與前兩代關節模組相比,第三代關節模組單位重量的扭力輸出較第一代關節模組增加約30%,臂長則比第二代更長,又取消了L型關節設計,只保留N型與I型關節,因此整支手臂的外觀更纖長,但又比第二代關節模組多出一個自由度,可實現七軸手臂設計(圖2)。整體來說,利用第三代關節模組組成的機器手臂,比以往的手臂更不占空間,卻又因為多出一個自由度,能負擔更多元化的作業任務。 圖2 工研院機械所展示利用其第三代機器關節模組實現的高度客製化機器手臂 黃甦透露,目前新竹清華大學已經採購了兩支由第三代關節組成的機器手臂,將以此進行雙臂機器人的開發,另也有醫療產業的SI業者利用第三代關節更不占空間的特性,設計出手術用的輔助機器人,可以在開刀房內執行夾持內視鏡這類原本由護士執行的助理工作,讓護士可以去做其他工作。 此外,還有多家台灣的馬達、齒輪等手臂零組件業者,也已經向工研院取得技轉,利用這項技術發展出內建自家馬達、齒輪等關鍵零組件的關節模組。跟提供零組件相比,提供關節模組不僅更貼近SI客戶的需求,單價跟利潤空間也比只銷售零組件更好。 機器視覺/AI緊密結合 手臂應用場景更多元 除了手臂本身的進步外,本次自動化展上,結合人工智慧的機器視覺也比往年更有看頭。所羅門以「AI 3D視覺賦予機器人感知能力」為主題參展,與合作夥伴共同展出多達16項智慧製造與智慧物流的相關應用,包含台灣首次發表的智慧物流分撿與包裝解決方案、智慧焊道辨識方案、智慧打磨系統。 所羅門董事長陳政隆指出,轉型智慧工廠,只有機器手臂是不夠的,因為無法成功辨識物件的機器手臂,在實際的產業應用上會受到很多限制,而這也是所羅門發展AI 3D視覺的主要原因。有AI 3D視覺的機器人,才能讓機器人的應用更多樣化,真正符合產業彈性製造的需求。 事實上,所羅門近年來在AI、機器視覺與機器手臂的整合應用上,投入了相當多資源,每年自動化展上的現場展示,也隨著機器視覺的辨識能力越來越高,而變得更多樣化、更複雜,更貼近實際應用需求。 圖3 所羅門展示的AI智慧焊道辨識方案 據所羅門評估,現在AI、機器視覺與機器手臂的整合應用,已經脫離技術驗證階段,開始走向大量部署。但有許多客戶反應,受到網路頻寬、延遲等因素的影響,現階段要在產線上部署這種高度智慧化的系統,必然要在產線旁配置搭載了高階繪圖卡的工業電腦,由此衍生的成本也是不小的導入障礙。因此,所羅門正著手將其AI機器視覺系統雲端化,以便在網路性能進一步提升,例如5G、TSN網路普及後,能立刻提供用戶雲端部署的選項,降低硬體建置的費用。 AI結合領域知識 自動化長智慧 在本屆自動化展中,幾乎所有跟影像有關的應用,不管是以機器視覺引導機器手臂運作,或是用機器視覺對大小工業產品進行檢測,都能看到AI技術的身影。對工業自動化產業而言,這是頗不尋常的現象。 由於工業自動化對系統的穩定度、可靠度要求遠高於一般資通訊產業或消費性電子產業,因此自動化相關業者對於新技術導入,向來採取比較審慎、保守的態度,除非技術已經相當成熟,否則不會輕易將其導入到自家的產品或解決方案中。 但AI在自動化應用中普及的速度,打破了自動化產業穩紮穩打的習慣,從今年自動化展的展示內容,可以發現相關業者並不是把AI當作展現研發實力的題目,而是真的已經在生產線上累積了一定的部署實績。 俗話說,禍福相倚。新冠疫情對製造業的正常運作造成十分巨大的干擾,但同時也促使製造業者加快數位轉型的腳步,並使得新技術的導入速度明顯加快。對自動化業者,乃至更上游的電子設備、半導體元件供應商來說,或許也算是失之東隅,收之桑榆吧。
0

安提邊緣智慧系統滿足5G聯網需求

AI解決方案已經廣泛的應用在各產業之中,且AI的運算核心也逐漸從雲端轉移至邊緣端,邊緣運算在企業智慧化服務中占有一席之地。為了發展更多的應用方案,GPGPU和智慧邊緣運算解決方案供應商安提國際發表AN810-XNX邊緣運算平台,結合NVIDIA Jetson Xavier NX 運算模組和AN810載板,提升AI運算效能。此邊緣運算平台擁有多元的I/O插槽選擇,可擴展各產業邊緣端的人工智慧應用,如全自動機器人設備、無人機、工業檢測、醫療影像與深度學習。 AN810-XNX邊緣運算平台結合NVIDIA Jetson Xavier NX 運算模組和AN810載板 安提國際總經理羅智榮表示,AIoT的應用環境十分多元且複雜,綜觀各類型邊緣系統,以GPU為基礎的平台擁有極高的相容性,可彈性應用於各領域。此外,羅智榮也提到,微軟的Azure服務也能進一步強化系統功能。AN810-XNX不論在載板設計、本身運算條件下,皆有高度的相容性,同時,從邊緣到雲端、乃至裝置管理的加值服務,都讓其十分適合應用在各類型AI領域,尤其在如機器人、無人機、工業IoT、醫療與深度學習等嵌入式的邊緣裝置。 AN810-XNX結合NVIDIA Jetson Xavier NX運算模組與安提載板AN810,Nano-ITX尺寸載板同時支援M.2 M-key、E-key和B-key等插槽,提供多樣訊號源如PCIe、SATA、USB 3.2 Gen2和USB 2.0等,並搭配高度47.3mm的專用風扇。此平台擁有良好的通訊功能特色,加上物聯網產業對5G應用的需求,可與4G/5G模組整合,提供高速無線通訊連接與資料傳輸。針對大量的邊緣裝置管理,AN810-XNX可透過M.2插槽支援Innodisk InnoAGE SSD頻外管理模組,透過客製化的雲端管理平台,統一管理與遠端監控邊緣裝置,在系統關閉或損壞時即時修復,縮短設備當機的時間,增強遠端管理的穩固性,完善邊緣裝置整體的管理模式。而平台也通過微軟Azure IoT認證,讓應用藉由安提平台,透過Azure雲端服務,縮短研發期程、迅速落地。 此外,面對大量的視覺AI應用,此平台支援一組120-pin MIPI CSI-II介面的接口,在廣泛的智慧視覺應用中,平台能夠驅動多功能的AI解決方案,同時處理高解析度相機與影像分析所要求的高密集人工智慧運算量。後援部分,安提國際提供系統加值服務,針對標準品及客製品項皆有定期的BSP及DTB架構更新。
0

耐能採用Cadence IP 提升終端裝置邊緣AI運算效能

全球電子設計創新廠商益華電腦(Cadence)宣布,終端人工智慧解決方案廠商耐能智慧(Kneron)已將Cadence Tensilica Vision P6數位訊號處理器(DSP)整合到其專門針對人工智慧物聯網(AIoT)、智慧家庭、智慧監控、安全、機器人及工業控制應用的新一代晶片KL720中,此為運算力達1.4TOPS的AI系統單晶片。Tensilica P6 DSP展示了其在低功耗、高效能視覺DSP市場上的地位,在電腦視覺及類神經網路方面為耐能智慧提供了比上一代SoC快兩倍的效能,同時提供對終端AI至關重要的功耗效率。欲知有關Tensilica P6 DSP的詳情,請參考www.cadence.com/go/kneronp6。 耐能智慧在設計KL720時,為其客戶優先考慮了設計靈活性及可配置性,以利使用新平台時可完美的搭配AI開發及部署。Tensilica P6 DSP藉由其可擴展性的Xtensa架構和Xtensa類神經網路編譯器(XNNC),為耐能提供了可輕鬆適應最新終端演算法需求的靈活性及運算效率。 耐能智慧創辦人暨執行長劉峻誠表示,由於該公司的使命係實現AI無處不在的企業願景,因此,消除平台上的障礙並簡化其AI演算法部署,對該公司及客戶的成功均至關重要。Tensilica P6具有可應對最新AI挑戰的諸多運算能力。此外,Cadence的電子設計自動化全流程及支援服務,加快了IP整合並縮短了上市時間。 Tensilica P6 DSP作爲Cadence Tensilica AI IP產品線之一,支援Cadence的「智慧系統設計」策略以實現普及智慧,已在行動、擴增實境/虛擬實境(AR/VR)、AIoT、監控及汽車市場上,獲得諸多公司的採用。
0

異質整合大行其道 Chiplet再造半導體產業鏈

半導體技術發展越來越成熟,但追求效能提升的腳步卻從來沒有稍停,半導體晶片整合技術進入異質整合(Heterogeneous Integration)世代,各種晶片電路設計與封裝層級的整合技術希望能延續摩爾定律的規律,加上人工智慧(AI)、5G與高效能運算(HPC)等應用對於半導體效能提升的需求,也持續推動晶片技術的改善,近期在小晶片(Chiplet)設計架構的發展之下,也帶動新一波的晶片整合技術發展。 Chiplet並不是全新的IC設計概念,過去系統單晶片(System on Chip, SoC)與系統級封裝(System in Package, SiP)都與小晶片概念有關,隨著半導體製程的發展,電路微縮的代價越來越高,如果要將一個SoC裡面的所有電路都用相同製程或相同材料進行整合,「卡關」的可能性也會提高,可能在良率或成本上付出重大代價。Chiplet的彈性架構,整合不同製程或不同材料的裸晶(Die)電路,再透過更有效率的封裝技術,不僅避開製程瓶頸,也可以在效能與成本上取得最佳解,帶動IC設計、製造、封測廠商的全面投入。 新興應用推動半導體異質整合發展 儘管異質整合技術已經問世多年,但是該技術的應用在過去兩年中急速成長,以滿足功能更加複雜和功耗不斷降低的需求,KLA資深行銷總監Stephen Hiebert表示,異質整合允許IC製造商在單個封裝中堆疊更多的裸晶,以提高電晶體的密度,將各種不同技術和功能的晶片組合在一起,可以實現強大的功能,這些變化影響了封裝的最終設計和封裝內部的晶片組裝,其中包括2.5D和3D晶片堆疊以及扇出型封裝等技術。 另外,幾種異質整合平台例如高密度扇出型封裝、矽中介層(Interposer)和直接接合解決方案,在消費性和入門級應用中都越來越受歡迎。科林研發(Lam Research)Managing Director Manish Ranjan(圖1)表示,隨著功能要求和外形因素的增加,高階封裝解決方案在支援下一代消費性裝置方面發揮重要作用,對諸如AI和ML這類新興應用程式的性能要求,亦推動對提高記憶體頻寬和增加使用高頻寬記憶體的需求,預計在未來幾年內,晶片的發展將更強調低功耗、增加製造靈活性以及加速上市時間。 圖1 Lam Research Managing Director Manish Ranjan Chiplet的影響不僅在晶片設計方面,工研院資通所所長闕志克(圖2)坦言,小晶片的發展將影響半導體的產業生態,過去IC設計業者發展一個完整的產品,除了自身專長的IP之外,要透過IP授權導入其他功能性的電路,所以在晶片設計階段需要支付一次性工程費用(Non-recurring Engineering, NRE),投片量產後又需要依出貨量支付授權金(Royalty)等兩筆費用。Chiplet則是直接買製造好的裸晶,所以少了NRE或授權費(License Fee)這種早期開發成本,有助於小型IC設計公司的生存。 圖2 工研院資通所所長闕志克 Chiplet解構並重組半導體產業鏈 ISSCC一直以來都是積體電路新技術的指標,2020年有多篇論文都以Chiplet為討論主題,其話題性可見一斑。Chiplet有兩項關鍵問題需要解決,一是如何將各個小晶片連接起來,透過封裝技術將不同製程甚至不同材料的裸晶連接;另一個則是如何去劃分、定義這些小晶片的功能、介面、互聯協定等。Chiplet需要解決的挑戰包括:生態系統成熟度、技術和架構劃分、晶片介面、可測試性、3D CAD流程等。 Chiplet為什麼重要?透過將曾經整合的晶片分成獨立的功能區塊,讓廠商解構並重新思考如何從晶片架構的重組提升效能,以AMD的設計為例,I/O模組和DRAM通道使用格羅方德(GLOBALFOUNDRIES)的14nm製程,而包含CPU核心邏輯電路和L3高速暫存,則採用台積電的7nm或更先進的製程。在7nm之前,Chiplet的價值不高,因為保持整個晶片的統一性比將其拆分更有價值,進入先進製程之後,邏輯電路可以持續微縮,除了提高電晶體集積度之外,也可以降低功耗,但I/O模組使用14nm則可能最具成本與效能優勢。 ISSCC 2020的Chiplet研究從單純的封裝技術、介面電路逐漸開始從製程到架構優化設計研究發展,代表Chiplet技術已經逐漸成熟。闕志克認為,Chiplet對半導體產業更廣泛的意義在於,半導體現有產業鏈將因此產生解構與重組,更多小型IC設計公司有能力投入產業,晶圓廠或可以屯貨、交易的中間商將創造新價值。對於IC設計公司而言,Chiplet提供更多在製程微縮之外,嘗試新材料和製程的組合,以提升晶片效能或電源效率。 台灣半導體產業投入Chiplet有勝算 台灣有許多中小型IC設計公司,闕志克說,先進半導體製程帶來的高成本,對於規模不大的IC設計廠商造成強大的成本負擔,因此TSMC的先進製程產能長期已來都以服務大型晶片公司為主;透過Chiplet IC設計公司可以更專注在自己專長的IP,將這部分電路設計到最好,並交易需要的功能裸晶,有實際出貨再支付相關費用,投片成本大幅降低,更有機會使用先進製程,有助於中小型或新創IC設計公司的發展。 台灣半導體產業鏈本來就很完整,垂直分工的模式也很適合Chiplet的發展,闕志克表示,目前的產業結構還需要做些調整,但相對各國的半導體產業現況,台灣發展Chiplet最有條件,也更容易成功。SoC與Chiplet的重點一樣都是整合,不一樣的是SoC是在電路層面進行整合,Chiplet則將整合工作移到封裝階段,所以封測廠的角色將越來越重要。 隨著封裝內的晶片數量不斷增加,封裝的整體價值也隨之提高,Know...
0

運算型儲存超前部署 Arm Cortex-R82即時處理器就位

物聯網(IoT)、人工智慧(AI)與5G等應用持續發展,帶動網路資料量大幅增加,其中物聯網數據量預計在2025年將超過79ZB。針對海量資料的產生,應用趨勢希望能在越接近數據生成的位置處越好,原因是安全性、延遲性與能源效率都能提升。運算型儲存(Computational Storage)已經崛起,成為數據儲存拼圖關鍵的一部份,Arm宣布推出Cortex-R82,為第一個64位元、具備Linux作業系統能力的Cortex-R處理器,可加速次世代企業與運算型儲存解決方案的發展與部署。 運算型儲存(Computational Storage)較傳統運算模式簡化,且更有效益 根據統計85%的硬碟控制器與固態硬碟控制器都是以Arm為基礎架構,讓處理更靠近數據,需要更高的效能。Arm儲存方案資深經理黃晏祥表示,依據作業負載的不同,Arm Cortex-R82與之前世代的Cortex-R8相比,最高可以提供兩倍的效能提升,能讓儲存應用以較低的延遲,運行如機器學習等作業負載,並可選用Arm Neon技術提供額外的加速。Cortex-R82本身為64位元架構,最高可以存取1TB的DRAM,供儲存應用進行數據處理。 儲存控制器傳統上運行裸機/RTOS作業負載以儲存及存取數據;不過,Cortex-R82選用的記憶體管理單元(MMU),可讓頻繁的作業系統在儲存控制器上直接運行。黃晏祥指出,在儲存數據的位置直接進行處理,可為物聯網、機器學習與終端運算等應用,創造更多機會。以數據庫加速加速為例,因為減少大型檔案的移動,安全性與隱私得以提升,數據可以有效率地轉檔或編碼以利串流進行影像處理,並且在必要情況下採用不同的位元率與解析度。 Arm Cortex-R82處理器支援最多八核的彈性架構 隨著儲存市場演化,合作夥伴最大的需求之一就是彈性。黃晏祥說明,Cortex-R82處理器支援最多八核的彈性架構,並可依據外部軟體需求,調整在儲存控制器上運行的作業負載類型。例如,停車場會固定使用視訊監控來辨識車牌資訊,以供後續收費使用。停車場白天會搜集車輛的車牌數據,用多核來進行密集儲存。到了晚上,這些核心會用來處理收費的數據,並依需求進行調整以執行數據分析與機器學習。由於儲存控制器為了應對不同的市場,且功能變得越來越多元,Cortex-R82的彈性架構,同時降低成本並縮短上市時間。 Arm Cortex-R82可依據外部軟體需求,調整在儲存控制器上運行的作業負載類型 為了開發這些未來使用場景所需的系統單晶片,Arm的合作夥伴要能取用簡便且合乎成本效應的技術。Arm為合作夥伴研究可以降低複雜性與成本的方法,Cortex-R82利用Arm Linux與伺服器生態系,為開發人員帶來全新的軟體工具與技術,例如Docker與Kubernetes,以在儲存應用上提供加速的實作方法。同時,Cortex-R82也利用Arm在安全方面的基礎,並相容Arm TrustZone,確保儲存控制器韌體可以與Linux或其它的即時工作量間隔開來。
0

ACAP助攻醫療超音波 合成孔徑/平面波成像效率增

本文介紹了如何運用先進成像方法,實現更優異的成像畫質、速度和準確性。平面波(PW)和合成孔徑(SA)成像是本文主要介紹的兩種方法,它們為心壁運動、血流和心臟外科手術等難以管理的特定診斷和外科手術帶來可觀的訊框率和準確性提升。 醫療需求推升技術更迭 不斷攀升的醫療成本正在成為醫院、診所和服務供應商的沉重負擔,因為他們需要確保為患者提供高品質的服務,同時更有力地控制成本。提高臨床治療中的患者流量是一種有望借助運算技術發展控制成本的途徑。與此同時,放射科醫生也強烈要求大幅提高醫療超音波、CT掃描器和其他類似設備等醫療成像設備的影像輸出畫質。 發揮人工智慧(AI)及其分支機器學習(ML)的作用,並將使用深度神經網路的ML方案用於輔助診斷和效率的提升,也是頗有前景的方法。這樣就能依靠新型晶片元件大幅增強的運算功能與演算法進步來改善畫質、組織識別、分類以及器官分割準確率,進而簡化臨床工作流程。 在各種臨床處理過程中,醫療診斷成像是發揮這種先進的運算技術的主要過程之一,因為聲波技術侵入較輕微且不涉及輻射。此外,與CT和MRI等其他方式相比,它的使用更普遍、成本更低、速度更快且尺寸更小。儘管過去數年裡已取得重大進步,但雖透過使用更快速的平行運算和AI演算法,診斷品質、準確度和速度仍有較大的提升空間。 本文針對醫療超音波設備製造商(OEM)介紹如何提高成像畫質、速度和準確性;與此同時,本文還介紹如何與深度學習演算法結合使用,並借助產品改善。對於本文的目標受眾(如開發醫療超音波成像系統的架構師和科學家),本文也介紹開發生產力的工作流程。 在過去二十年裡,兩種用於獲取和處理醫療超音波影像的新銳方法被研發出來—合成孔徑成像方法和平面波成像方法。這兩種方法與當前的順序慢速超音波成像方法截然不同,因為後者每次只能採集一行影像。新方法則可使用超音波穿透整個成像區域,因此一次發射就能重建完整的影像。成像速度達到每秒數千訊框。與這樣的訊框率同時實現的,還有全新的成像可能性,如更強的聚焦和穿透、向量流成像、功能超音波、超高解析度成像、高速心臟成像與量化等,同時可提升十倍的定量測量精度。 快速成像方案產生了比傳統成像高出幾百倍的處理需求,因此到目前為止阻礙了這些先進成像方法的實現。本文介紹了處理元件和新開發環境如何即時輕鬆實現這些先進的成像方法。如賽靈思(Xilinx)Versal自我調整運算加速平台(ACAP)元件與Alveo資料中心加速卡可部署在工作站或伺服器上,是實現SA和PW方法的硬體選擇。 與傳統的順序超音波成像相比,SA和PW成像方法具備一系列的優勢。主要在於採集的資料集完整,而且聚焦可在處理中合成,而非在採集過程中完成。因此,在發送和接收過程中都可以動態聚焦資料,獲得成像區域上的理想解析度,而傳統成像只能在發送焦點上實現最佳聚焦。這種功能被證明能提高體內成像畫質並增強穿透深度。 由於採集的資料集完整,這些成像方法也開啟追溯處理的廣泛應用。持續完整的資料獲取對成像也有很大幫助,其有利於不間斷地全向追蹤運動中的結構和血液。這樣能將速度估算精度提高十倍,還能估算速度向量;而長時間的觀察也有助於在腦功能成像中檢測較低流速。此外,資料流敏感度也提高,因此能檢測較低流速;而高訊框率則有助於檢測組織彈性和進行剪切波成像。 這些成像方法已與超音波造影劑結合使用,透過追蹤氣泡穿過最小血管的運動執行,以獲較高的超音波解析度,進而能夠區分尺寸小至10微米的結構。 因此,使用SA和PW超音波成像方法有助於開發全新的超音波應用,為提高運動估算的解析度、對比度和準確性鋪路。然而,成功實現即時應用依然被需進行的大量運算限制,但現在透過使用本文介紹的可編程設計元件及開發平台,該問題已迎刃而解。 一窺超音波成像採集流水線 採用壓電式轉換器的超音波系統將電傳輸脈衝轉換成超音波脈衝,並從電子訊號中接收超音波回波脈衝。這種轉換器採用大量壓電元件(32個到192個),可以根據所需的不同研究提供不同的形式和功能。最常用的B模式規格掃描線配置包括:(a)線性、(b)曲線、(c)梯形、(d)扇形和(e)放射狀。參見圖1。 圖1 常用B模式格式的掃描線安排 轉換器有以下選擇:線性陣列,能在更深層面實現身體和器官的表面區域成像;曲線和梯形形狀,用於腹部器官和產科掃描;扇形形狀,用於心臟成像(通常透過肋骨之間的狹窄聲學視窗進入);放射狀,用於血管內成像。 在繪製二維(2D)影像時,接收到的回波幅度與亮度(B模式)和回波穿過組織深度的時間有關。B模式使用多行成像,影像中每行用一個脈衝-回波序列產生,最終為被診斷的器官生成最終的解剖截面圖。有鑑於具體超音波轉換器的多個參數,可將超音波處理描述為一個多步驟序列,根據選定模態的功能,構成資料處理的單或多個並行流水線。 流水線示例如下所述:生成調製超音波脈衝,頻率取決於探頭類型、治療方法和成像模態類型。或是可激發轉換器的電以傳輸調製波,激發可包括發送器上的波束成形,進而選擇性發射聲波(Selective-in-sonification)、生成虛擬源,以及生成特定波前(球面波、平面波等)。 而轉換器亦可接收超音波觸及器官返回的回波,並轉換成電子訊號(RF資料),同時用時間增益補償均一化遠近回波,以便進行統一處理。同時,可針對接收訊號進行數位化處理,以透過波束成形,將接收到的訊號聚焦在特定深度,並使用來自多個單元的資料重建掃描線。 至於非線性(對數)壓縮級將回波動態範圍與人感知動態範圍進行匹配,也可透過插值創建表示物理尺寸的影像。此外,用於完成下列功能的其他數位訊號處理層級包括: ·減輕雜訊 ·消除像差 ·降低干擾 ·消除掃描線偏移 ·降低散斑 ·提高解析度 ·增大測量距離 ·銳化邊緣 ·減少偽影 SA/PW成像原理解析 在傳統的超音波成像中,首先將發射聚焦的超音波場域,然後用探頭的全部單元接收來自組織的散射訊號;接著使用影像中點到接收單元的幾何距離確定接收聚焦。將其表達成深度的函數即可實現動態化,進而確定最佳接收聚焦。然而,發送焦點被限制成單獨的發送焦點,影像只能在該深度上實現最佳聚焦。 這種局限性在SA成像和PW成像中得以緩解,此時成像透過發射一系列球面波或平面波來完成,如圖2所示。 圖2 SA成像(左)與PW成像(右)圖解 在圖2中,第一列所示是發射的球面波或平面波;第二列所示為每次發射產生的波束成形低解析度影像;最後一列是將所有低解析度影像按相位求和得到的高解析度影像。 接收聚焦方法與常規的成像方法相同,但發送聚焦是透過結合多次發射得到的資料進行合成。這就使發送聚焦具有動態性,能夠獲得穿過影像深度的最佳聚焦,進而強化整個影像的對比度和解析度。聚焦的具體做法是運算從發送來源出發,穿過成像點再返回接收單元的幾何距離。接著,再從接收到的轉換器訊號選取資料,針對樣本數值進行插值後求和。這個求和操作也稱為相複合,尤其是在PW成像中。除了發送來源到成像點間的距離略有差別以外,SA成像和PW成像的距離計算相同。因此,兩種成像方法可使用相同的處理架構。 次要優勢在於發射次數與成像行數無關。傳統方法必須完成200次發射才能採集完整的高解析度影像,而SA成像和PW成像需要完成的發射次數要少得多。一般情況下,1到8次發射即可完成成像流、執行10到30次就能完成較佳的B模式成像,因此可提供較高的訊框率,進而產生前述提到的諸多優勢。具體如圖3所示,該圖表示一定發射次數下,成像對比度與以波長為單位的成像深度之間的關係。若數量越小越好,因為這說明圍繞主峰的旁瓣數量少;而增加發射次數能夠增大對比度,但12次發射後不再進一步提升。在本示例中,這決定了對比度和訊框率之間的最佳權衡取捨。此外,4到8次發射也能提供良好的對比度,足供要求較低的成像流使用,因而有助於提高訊框率。 圖3 使用以λ/2為間距的192元線性陣列探頭,一定發射次數下成像對比度與以波長為單位的成像深度之間的關係 兩種成像方法只需要少量發射就能在整個興趣區域內持續成像,是成像流的選擇之一。此外,上述成像方法還能在各方向上持續追蹤移動物件,專為估算主動脈中的血流、檢測組織的運動與彈性,以及實現較低速流檢測而開發。這是因為有連續資料可用,同時透過使用更先進的濾波器來分離流和組織,得到的影像不僅具有更高的動態範圍,且對低速流的靈敏度也有所提高。 影像實現獨立運算 在SA/PW系統中持續完成的波束成形操作次數由下列公式決定: 其中Nl是影像行數,Ne是接收元數,f0是轉換器中心頻率。採樣以探頭中心頻率的四倍頻率進行,透過強化奈奎斯特採樣,實現線性成像。因數k是用於成像的時間分數。為大幅提高訊框率,k值大約在0.8到0.9之間;但如果為降低處理需求而使用較低訊框率,也可以選取非常小的值。 典型取值如Nl=200、Ne=192、k=0.8和f0=5kHz,每秒完成614千兆次運算。一般情況下,完成一次波束成形運算包括運算聚焦延遲、變跡值,最後對樣本值進行插值,並將其與來自轉換器其他單元的數值相加。總體上,每次波束成形運算需要完成30到100次運算,全即時SA成像和PW成像每秒可完成太次運算。與常規系統相比的不同之處在於,完整影像是一次性重建,而不是每次脈衝發射繪製一行,而且出於這個原因,此類系統中的運算量也提高Nl倍。主要優勢在於影像中的各點都能獨立運算,因此,處理在本質上擁有並行性,適用於FPGA實現方案。 受處理資源的限制,PW成像和SA成像直到最近才得到採用。現在由於Versal ACAP等新興嵌入式處理平台的推出,即時實現此類技術才變得切實可行。 插值為影響成像產生關鍵 獨立單元往往以λ/4的速率進行採樣,這符合奈奎斯特(Nyquist)定律,但不足以實現極低延遲。插值是一種補償缺失點的簡便方法。插值器的品質是減輕「虛擬」樣本產生負面影響的關鍵因素。此外,插值器也是對運算能力要求極高的一項功能。在圖4中,部分插值器使用它們的PSF等等值線圖進行比較,等值線間距離為6dB,直至-60dB。合成孔徑使用FieldII模擬器對3.5MHz線性陣列128元探頭進行模擬,採用λ/4採樣,每128單元作為一個發射器。 圖4 用於128元線性陣列探頭插值方案的點擴散函數 圖4所示為插值效果。左上圖所示為在樣本之間使用線性插值時的點擴散函數。右上角所示的是採樣頻率提高10倍與線性插值相結合時的interp函數。左下角是採用樣條插值的情況,右下角則是使用了分段三次Hermite樣條插值多項式pchip。只為樣條函數和interp函數獲取合適的旁瓣,這體現插值對高品質成像的重要性。 合成孔徑/平面波成像使用軟體面臨挑戰 SA成像和PW成像面臨的根本挑戰在於,如何就每秒產生的資料量與特定處理成像流水線中的可用算力進行平衡。超音波成像系統可劃分為前端(FE)、影像成像器(IF)和後端(BE)。FE負責管理轉換器、發送脈衝生成(TX)、接收類比訊號(RX)和TX/RX相位開關矩陣(SM)的硬體方面。影像成像器負責波束成形,有時該功能也被分配到FE。BE負責增強影像,將其從聲學掃描網格轉換為顯示網格,然後進行渲染和顯示。近期,IF和BE通常直接使用原始資料在軟體中進行結合。這種方法需要多條一般使用PCIe的高速傳輸通道,用來將原始資料傳輸到搭載高性能CPU和GPU的工作站。由於多條傳輸通道、緩衝存放區原始資料、向CPU快取和GPU板載記憶體傳輸資料等原因,從FE向BE傳輸大量資料會造成額外的時間延遲。對於擁有128條通道的高階系統來說,在40MHz RF取樣速率下運行,且每樣本以12位元進行編碼,並以1540m/s聲速,在7.7cm深進行軸向成像,每個TX脈衝事件產生的原始資料大小是2,212MB。 如果要實現更高解析度,使用快速成像以每秒15,400次的頻次重複脈衝,產生的資料傳輸量為18.8GB/s。就算是PCIe Gen3x16這樣可提供約12GB/s傳輸速率的整合模組,也無法滿足BE所需的傳輸速率。BE必須將原始資料的儲存速度和傳送速率提高數倍,才能將資料提供給CPU進行控制,同時提供給GPU進行演算法處理。由此引發的時間延遲程度也會限制即時性能。這就需要高速傳輸巨量資料,並在可能的情況下儘早處理資料,以減輕資料負擔。 ACAP促SA/PW成像性能提升 超音波系統本身較適合採用異構運算架構。FE是高度模擬的,如圖5所示。Versal ACAP則用於模擬前端(AFE)控制和資料(RF資料)儲存。 圖5 FE簡化原理圖 Versal ACAP可提供LVDS,負責接收來自AFE的輸入資料,為資料泵和資料獲取提供正確的時鐘與設置,管理發送器的啟動與TX和RX之間的開關。所有這些階段都需要在主類比硬體與Versal ACAP中的可編程設計邏輯之間進行高強度交互作用。這並非易事,但ACAP是解決它的良好選擇。超音波流水線的剩餘部分則用於處理採集的RF資料,而圖6則專注於波束成形流水線。 圖6 用於SA成像和PW成像的波束形成流水線 波束成形是高度並行的演算法。在波束成形器內形成影像的每一步都可以描述成一個資料流程操作,其中分階段處理RF資料,每個階段隨後流入到下一階段。在運算架構中,資料流程由節點構成,形成按佇列連接的圖形。資料流程模型提供流水線並行性,圖形表示的是應用流或程式流,節點表示對資料應用的函數。 圖6所示的是波束成形,方框表示處理階段(操作),線條表示連接器,其中兩個灰色塊表示迴圈("for_loop")。 資料流程能將資料細分,進而將運算流程劃分為並行流,如圖7所示,進而大幅提升性能。 圖7 資料流程圖的橫向劃分(迴圈展開) ACAP架構實現SA/PW成像資料流程 在傳統微處理器上實現超音波模態資料流程會產生與並行性和資料輸送量有關的問題。350fps下「B-模式」需要大約6.08 Gmult/s的延遲和變跡值運算量。樣本插值需要的運算量在12.17Gmults/s,波束成形器需要的運算量大約在3,028Gmult/s。它類似於僅有30fps的「流模式」,所有運算都透過單精確度浮點運算完成。 一般來說,這樣的運算量難以在嵌入式平台上實現,至少需要高性能桌上型電腦或是電腦叢集。在表1中,便將CPU的理論峰值性能與上述要求進行比較。 此外,在從DDR記憶體(DRAM)向處理器傳輸大型資料叢集(如本應用所示)時,大量資料超過快取極限,導致與其他核心干擾相關的額外限制因素,理論上來說,性能下降幅度最高可達10倍。參見圖8。 圖8 使用快取的傳統多核心架構 如果驗證過諸如SA和PW等運算密集型問題的基本演算法本質,則有一個更好的選擇。SA和PW波束成形適合用線性代數運算來表示。掃描線可以由一個向量、一組帶矩陣的掃描線、一組帶矩陣或立方體的轉換器掃描線,或一組帶立方體向量的發射集表示,具體參見圖9。這類表示屬於張量,如同深度神經網路使用的類型。 圖9 SA與PW波束形成的張量表示 若使用具備下列重要特性的架構,能夠高效運算張量、內積、外積、向量-矩陣相乘、矩陣-矩陣相乘、濾波器、卷積和離散傅里葉變換: ·以棋盤格(拼圖模組)結構組織的同構處理器單元集合 ·一套用於連接處理器單元的開關網格;該開關網格是用資料路徑連接及可編程設計開關構成的規則結構 ·用於編排資料流程的控制器 ·演算法的局部開發,即資料移動通常限制在相鄰處理單元範圍內 ·使用流水線技術實現處理器單元的高利用率 如Versal ACAP採用使用拼圖模組的AI引擎架構,能夠滿足上述要求。拼圖模組中的處理單元採用單指令多資料(SIMD)和超長指令字(VLIW)架構。參見圖10。 圖10 AI引擎陣列 AI引擎整合一個標量單元、一個向量單元、兩個負載單元、一個儲存單元和一個記憶體介面。標量單元則整合一個32位標量RISC、一個32×32位標量乘法器,同時可支援正弦/餘弦、平方根、平方根倒數等非線性函數。向量單位整合:512位元向量定點/整數單元和單精確度浮點向量單元,均支援多個向量通道上的併發運算。每個AI引擎內建專用的單埠16KB程式記憶體。 每個AI引擎方塊圖內建32KB資料記憶體,其劃分為八個單埠組,允許每個時鐘週期最多八個並行記憶體訪問事務。 此外,資料記憶體還內建DMA邏輯,可支援輸入到本機存放區器的傳入流,從本機存放器向外輸出的傳出流,以及本機存放區器中的緩衝流。透過支援二維跨越式存取,任何AI引擎都能存取各方向上相鄰AI引擎方塊圖中的資料記憶體,進而允許單個AI引擎存取高達128KB的資料記憶體,每週期存取四個記憶體模組,頻寬超過1太位元組/秒。參見圖11。 圖11 AI引擎方塊圖 從運算角度,每個AI引擎方塊圖都具備乘法-累加處理能力,如圖12所示。 圖12 以週期計的乘法-累加性能 「B-模式」的性能要求估計在3,200 Gmult/s左右;因此根據圖12,在1GHz下,每個方塊圖能夠每週期執行8MAC,因此需要3,200/8=400個方塊圖。 從宏觀上看,AI引擎能夠實現SA和PW中資料流程演算法所需的所有不同結構。作為參考,在圖13中,除了AI引擎以外,Versal ACAP整合的特性還包括一個標量引擎、自我調整引擎(可編程設計邏輯)、智慧引擎(由AI引擎和DSP引擎共同構成)以及一個可編程網路單晶片(NoC)。 圖13 Versal ACAP原理圖 雙核心Cortex-A72 64位元處理器用於託管作業系統(如Linux)以及執行與控制超音波處理有關的任務。該處理器為連接、編排和更新提供所需的一切功能,還為超音波採集所需的數位訊號處理提供豐富的基礎設施。 自我調整部分(可編程設計邏輯)負責一切與採集有關的功能,其中包括控制AFE、發送器,解調來自轉換器的I/Q訊號。此外,它還能為特定任務加速並對已採集資料從記憶體到AI引擎的傳輸進行管理。 如Versal ACAP的可編程設計NoC是一種完全整合的高速全獨占式縱橫開關,用於管理SA成像和PW成像所需的高頻寬。NoC的作用在於實現對全高全寬PL的無縫記憶體映射存取,以便連接元件上需要使用大量資料的區域。它能夠: ·針對DRAM實現共用設備存取 ·在PL之間建立連接 ·對AI引擎陣列進行記憶體映射存取,以便進行追溯和調試 ·在PS、PL和AI引擎陣列之間建立連接 ·在PS和DDR記憶體之間建立連接 程式設計用於SA/PW成像AI引擎 AI引擎程式由使用C++編寫的資料流程圖規格構成。該規格可以使用專用編譯器編譯並執行。資料流程圖由節點和邊緣構成,其中節點表示運算核心函數,邊緣表示資料連接。 資料流程圖的核心在資料流程(無限長的類型值序列)上運行。這些資料流程可以被分解為單獨的方塊圖,而這些方塊圖由核心進行處理。核心消耗輸入資料方塊圖並產出輸出資料方塊圖。此外,核心還可以逐樣本地存取資料流程。 AI引擎核心是一個指向VLIW向量和標量處理器的C/C++程式。 包括記憶體通訊和串流通訊在內,存在多種可能的通訊配置,它們都是SA成像和PW成像的必要構建方塊圖。參見圖14。 圖14 AI引擎通訊結構 消耗輸入資料方塊圖的核心被稱為輸入視窗,產出輸出資料方塊圖的核心被稱為輸出視窗。二者由AIE編譯器根據資料流程圖連接自動完成推斷。 核心接收類型資料的輸入流或輸出流作為參考。PS可用於動態載入、監測和控制在AI引擎陣列上執行的資料流程圖。AI引擎架構和編譯器彼此配合,提供程式設計模型。兩個流連接能夠以透明方式共用同一物理通道,前提是它們的總通道占用率未達到100%。除了在AI引擎的處理器單元上運行以外,核心也能指定核心在PL上運行。圖15所示的是SA成像和PW成像的概念圖。A區方塊圖將PL連接到B區的PL核心方塊圖,後者又流到C區的核心,進行延遲運算。一套核心隨後並行啟動並交替執行,交替的核心數決定並行程度和加速程度。隨後,波束成形核心產生實體其他內部核心,用於D區方塊圖所示的內部運算。E區核心將波束成形資料流程到DDR記憶體。 圖15 SA和PW波束形成器的完整資料流程圖結構 合成孔徑成像與平面波成像技術可以使用Versal ACAP與AI引擎以及相關的軟體框架實現,為此類先進的超音波模態提供單晶片實現方案。對於先進的超音波系統,則可以使用單片以上的Versal ACAP,借助128個轉換器實現高達2,000訊框/秒的良好性能。 (本文由賽靈思Xilinx提供)
0

強化感測/思考/連結/行動力 NXP迎接全面智慧化時代

進入智慧化時代,各項科技應用都在這個前提下持續強化技術能力,元件感測、思考、連結、行動等能力的強化成為未來發展的重點,NXP近年特別專注於汽車、工業、行動裝置、通訊基礎設施等領域,希望能發展安全可靠的交通行動解決方案;整合多項技術與產品組合,推進工業與物聯網深度應用;發展行動裝置的安全支付;並強化5G通訊基礎設施技術與產品開發。 NXP近年專注於汽車、工業、行動裝置、通訊基礎設施等領域,希望能發展安全可靠的交通行動、物聯網解決方案 在智慧物聯網AIoT部分,即時智慧是近年市場發展的重點,NXP大中華區資深行銷經理黃健洲指出,過去AI的運算多透過雲端,但在某些隱私性與時間延遲敏感的應用上,希望能減少雲端運算的依賴,該公司發展邊緣閘道器(Edge Gateway),將原先的MCU產品強化控制、分析、機器學習的功能,可以進行資料即時的智慧化反應,協助AI、IoT的發展。 從產品線的發展來看,黃健洲說明,NXP以MCU產品線為AIoT應用的基礎,但是加強智慧化的功能,也可以在終端進行人臉/影像辨識與語音辨識,應用領域上可以橫跨網路邊緣與物聯網邊緣的需求。另外,在其部門與產品命名上都加入EP(Edge Processing),展現其在AIoT發展的決心。 邊緣閘道器(Edge Gateway),強化MCU控制、分析、機器學習的功能,可以進行資料即時的智慧化反應 而在5G部分,NXP則專注於發展基礎建設與設備應用解決方案,NXP Edge Processing資深產品經理張嘉恆表示,該公司的5G產品應用分成四個,包括一般基地台的無線接入網(Radio Access Network, RAN)中,射頻單元的RU(Radio Unit)與分離式單元DU(Distributed Unit),5G FWA(Fixed Wireless Access, FWA)的CPE,與小型基地台(Integrated Small Cell),主要產品為協議棧處理與基頻處理器(Baseband Processor)。 5G的商業化從2019年4月開始啟動,2020年雖然有新冠疫情衝擊,但全球各地的5G開台還是持續加溫,NXP的5G技術發展也沒有因此停下腳步,張嘉恆說,2018年6月,該公司在4G的基礎上,發表支援5G網路的功率放大器(Power Amplifier, PA)、低雜訊放大器(Low Noise Amplifier, LNA)與數位接收前端(Digital Front...
0
- Advertisement -
- Advertisement -

最新文章

- Advertisement -

熱門文章

- Advertisement -

編輯推薦

- Advertisement -