- Advertisement -
首頁 標籤 監控

監控

- Advertisment -

競爭多/同質性高 中國AI發展瓶頸陸續浮現

中國自2010年開始投入AI技術的發展,在機器視覺與自然語言相關的應用領域方面有著相當亮眼的成績。 只是這些技術並不是完全來自紮實的技術發展,畢竟中國過去在基礎教育方面的貧乏,使其缺乏研發AI相關技術的人才,這與美國在基礎科學發展努力了百年之久,累積龐大人才和技術庫的情況不同。因此,為了達到快速發展的目的,不擇手段就成了最被普遍使用,成效也最好的手段。 鼓勵留學/千人計畫 中國打下AI發展基礎 中國以三種方式來取得相關技術,並建立自己的AI技術基礎。首先,就是鼓勵資助大量留學生前往美國留學,學習技術之後可能會進入中國學界或業界主持各種研發項目。這個還算是比較正規的方法,而有一部份留學生在畢業後沒有馬上回國,而是留在當地就業,並促成第二種技術「轉移」方式。 第二種方法就是以大量金錢作為誘因,吸收在外國相關高科技企業工作的中國人,為政府取得技術,並回中國創立類似性質公司,中國另外還會高額補助該企業發展。知名的千人計畫其實就是在做這件事,不過千人計畫已經被國際關切,目前中國也轉向低調,不在檯面上提到千人計畫的執行內容和牽扯的相關人士,但實際上該計畫還是持續執行中。 而最後一個方法,則是利用政策壓力,以中國龐大的市場規模,強制要在中國做生意的外商進行技術轉移,這個手段因為太過明目張膽,反而科技大廠在技術轉移的選擇或策略上都有設下防火牆,所以受害並沒有那麼直接,但這也已經足夠讓中國包括AI技術在內的高科技公司得到快速成長的養分,這些外商原本認為他們只是到中國做生意,但其實是幫助了中國產業發展,而當中國自有技術到位,就會打入供應鏈,利用價格優勢把這些外商擠出中國市場。 監控成中國AI技術最大驅動力 另一方面,從應用面來看,中國發展AI的動機並不是那麼單純,雖然中國是全球最快實現AI商業化的地區之一,目前也已經有相當大的經濟規模,但如果把目前中國的AI經濟進行分解的話,就可以發現大部份的AI產值都是來自同一個地方,也就是安防監控應用上。 目前的中國安防監控產業,其實結合了晶片、AI演算法供應商、攝影機模組供應商、影像感測元件、儲存、伺服器方案等。同時,中國檯面上的AI方案公司主要是以前二者為主,也有自行設計前後端方案後推出整合型的AI攝影機模組的公司,例如海康威視。 作為監控產業龍頭,海康威視的最新財報中顯示,其監控相關業務的營收占了93%,而在中國四大AI金剛,商湯、曠視、依圖、雲從,以及更多以CV技術為基礎的AI新創公司,幾乎都是以接政府的監控、安防業務為主要營收來源,而根據各家的財務資料或公司負責人的受訪內容,這些公司的安防營收比重各約從3成到6成左右。 而多數AI晶片新創公司也幾乎都以安防為第一目標市場,比如說原本做挖礦晶片,後來轉型推出AI晶片的比特大陸,以及自動駕駛方案廠商地平線等,都不敢忽視安防監控這塊市場肥肉。 安防監控是每個國家都需要的重要基礎建設,但中國對這方面的需求遠超過全球其他國家,光是過去幾年,全中國的監視攝影機以每年接近一億部數量增加,而這些逐年新增的攝影機背後幾乎都與龐大的AI基礎建設進行連結,為發展相關技術生態,中國在過去數年投入上兆台幣資金規模發展和建置相關的技術平台。 在國家有意扶持發展之下,機器視覺(Computer Vision)是中國產業目前最強大的AI技術應用之一,基於該技術的人臉識別能力已達業界一流,其實務應用準確度已經可以達到98.5%以上,實驗室中甚至可以達到99.99%。除了人臉識別技術外,包括人體移動姿態、服飾追蹤的外觀型態模型建立,也更幫助整個監控系統更充分掌握要追蹤的目標動向。 除了政府的推動以外,中國對於個人隱私保護認知的不足,也成為推動AI發展的關鍵元素,畢竟AI都是基於機器學習所建立的模型,如果樣本不夠大,那麼建立出來的模型可靠度就不足。歐美由於對個人臉孔等可以和個人身份高度連結的隱私資料非常重視,可用來進行機器學習的公開資料比較有限,而蘋果過去Siri被詬病的不夠聰明,也是由於這個緣故。 中國人口基數大,而從手機應用、銀行業務、安防設備等日常生活中各種需要擷取臉孔的應用極多,相關後台收集了龐大的臉孔資料,這些資料也成為推動具備中國特色AI發展的重要養分。 然而隨著安防監控的市場競爭者越來越多,技術發展上也開始遭遇瓶頸,在核心的模型建立方面,各家落差已經不大,資本投入也從模型和演算法的研發逐漸轉為應用面的擴大,希望把這些以龐大人臉資料庫訓練出來的AI技術轉移到其他領域,創造更多的商業機會。 無人商店功敗垂成 這方面最成功的該屬金融機構的人臉識別技術。由於金融機構對臉部識別的精確度要求更高,這方面多數直接沿用政府的臉部資料庫和模型,並輔以更精準的演算法;當然,這方面的應用也是多數專注機器視覺的AI公司的共通發展方向。不過金融機構的市場胃納量有限,很快的,這些AI公司又把腦筋動到了無人商店之類的AI應用。 但與安防監控和金融機構的人臉識別不同,無人商店並沒有獲得成功。這是因為無人商店最主要的訴求,也就是降低管理成本,沒有辦法達到宣稱的效果。 這主要還是因為中國人力成本低,Amazon的無人商店之所以能成功,在於美國的人力成本高,另一方面,Amazon的使用體驗經過高度最佳化。因為是Amazon集團經營,所有銷售資料都會在雲端統整分析,整理出各地商店的消費偏好模式,讓商品的類型可以更符合當地的消費習慣。 相較之下,中國的無人商店概念仍僅止於交易過程的無人化,為了取代店員,使用了更昂貴的機器設備,反而造成經營成本壓力。另一方面,中國網購盛行,到店消費早已不是主流,在這個情況之下,實體店面的營收只會持續下滑,根本無力支撐龐大的無人化硬體套件。 也因此,雖然前幾年相關概念極為火熱,但商用之後才發現實際問題很大,諸多無人商店業者紛紛退出市場。光是2018年,幾個主要的無人商店業者,包含鄰家便利、猩便利、7隻考拉和小閃科技都先後倒閉。 像蘇寧、騰訊的無人快閃店等,雖然仍持續經營,也都只有小規模部份設點。最早的無人商店概念之一,F5未來商店則是走販賣機形式的無人販售方式,雖然稱為無人商店,但其實更像台灣近來風行的夾娃娃機產業,差別只在於收款和販賣方式不同。 無人商店這個議題也曾掀起一波融資潮,大把金錢湧入這個新興概念產業,但跟OFO之類的共享經濟概念相似,多數都撐不了多久,錢燒光了就宣告倒閉。 AI醫療/AIoT挑戰仍多 當然,也不能說中國就沒有正經八百發展AI的產業,比如說醫療、包含智慧城市、智慧家居、智慧零售和智慧製造等四項應用場景的AIoT概念。 醫療方面AI發展同樣集中在機器視覺領域。比如說X光片、超音波等醫學專業圖像的判讀交給AI來處理,效率更高,準確度也更好;而AI也用來進行病歷管理工作,這對於中國這種醫療環境相對落後,且醫護人員缺乏的國家,其實可以帶來相當大的幫助。 然而技術雖有突破,但中國政府在監管方面卻轉趨收緊,新規要求針對醫療圖像進行診斷的公司必須申請醫療器械許可證,而申請耗時需要一年以上,目前還沒有公司拿到許可證。而因為市場風險增加,融資難度也明顯提升,也讓中國業者面臨發展陰影。 而AIoT牽扯到的AI技術層次更多,機器視覺雖然仍占很大的比重,但自然語言、自動駕駛、無人倉儲管理等AI演算法在這些領域也同樣扮演重要角色。然而這方面的發展還處於早期階段,相關產值短期內也很難看到拉升。 爭取融資 中國晶片設計同質性偏高 隨著AI浪潮興起的,還有針對雲端和終端等不同AI應用中的訓練和推理場景進行加速的相關晶片方案。而其實AI晶片最主要還是在演算法的差別,晶片本身的設計難度並不高,除了針對不同運算場景的需求配置不同的記憶體或功能區塊以外,AI本身的計算工作基本上都是通過類似的大規模乘加法運算器(MACs)來達成。 AI晶片方案的發展其實是最近幾年的事,從最早使用FPGA搭配自有演算法的方案,到後來有不少廠商發展自己的晶片,配合演算法與開發環境主打AI通用運算工作。而像寒武紀這類的中國業者則是推出AI運算晶片IP,授權給客戶作為AI運算方案。 隨著這些方案的發展,彼此的同質性越來越高,架構設計上也沒有太多差異。而因為AI晶片設計的門檻低,不少原本專注於AI演算的公司也開始推出自己的AI晶片,主打根據特定場景的最佳化更到位,可以提供更高效能,更低功耗,以及更少的維持成本。 只不過,業界想的基本上都差不多,不是針對雲端的高性能AI晶片,不然就是針對邊緣和終端的低功耗AI晶片,性能差異的來源主要還是在晶片上的運算單元和記憶體規模,以及配合的演算法實現方式。 至於為什麼晶片公司先後發表自己的AI方案,主要還是融資市場對這方面的議題非常關注,由於中國產業高喊自有的聲音很大,能推出方案的晶片設計公司通常都能夠拿到很多的投資。而這些方案能成功實現商業化的數量有限,多數成功商業化的AI晶片走進安防監控領域,或者是部份AIoT市場。 舉例來說,號稱自動駕駛最強的地平線公司在2018年貢獻營收的主要還是安防方案,自動駕駛方案基本上只有少量出貨給合作廠商進行測試,還沒有大規模商用。而為了維繫投資人的熱情,這些AI晶片廠商即便沒有客戶,仍然不斷的開出新方案,計算性能與規模也越喊越誇張。 回過頭來看,中國市場的AI運算市場,雲端機器學習加速架構仍有超過9成被NVIDIA掌握,CPU方案則幾乎由英特爾獨占,推理方面英特爾的FPGA和NVIDIA的GPU各有一部份。至於AIoT領域中,真正的終端AI還沒有大規模實現,手機晶片上雖然有華為和寒武紀的合作,但先行者的優勢至今也已經逐漸被抹滅,蘋果和高通,甚至聯發科的手機AI性能基本上都能和華為的方案平起平坐。也因此,就連業者也認為這些AI晶片公司可能需要一波清洗,好去蕪存菁。 煉蠱式成長壓力大 國家隊仍可能彼此殘殺 最著名的兩個國家隊領袖,分別是華為與寒武紀,二者的合作的確製造了不少話題,並為華為當時的旗艦手機創造了銷售熱度。但有趣的是,寒武紀在新聞資料上對華為低聲下氣,也曾讚賞二者的合作。然而華為卻自始至終都否認相關的訊息,對外永遠只說華為用在手機上的NPU神經網路加速單元是自行研發的產品。即便業界都知道這個NPU的來龍去脈。 作為寒武紀少數的IP授權客戶之一,且出貨量極大,他自然不敢得罪華為,但華為卻明顯另有盤算。到了麒麟810,華為用自有的昇騰AI架構取代了寒武紀。而華為繼續對外宣稱,他們研發相關的AI架構已經超過10年之久。耐能的CEO就曾指出,當初華為和寒武紀的合作,其實等同於華為逼迫寒武紀賣身,也就是把寒武紀NPU的IP的原始碼全部交給華為,華為才願意合作。 而從2017年的麒麟970推算,華為拿到寒武紀的NPU原始碼最早可能在2016年左右,而到2018年推出「自有」昇騰AI架構,也不過才兩三年。華為的狼性著實讓寒武紀吃足苦頭,原因在於華為的昇騰架構要打的市場和寒武紀高度重疊。寒武紀是中國少數提供晶片IP授權業務的公司,而發生華為這個事件,相關的業者未來在選擇合作對像以及合作方式時,應該會更謹慎。 中國應用優勢漸失成未來隱憂 成也應用,敗也應用,AI最後的商業化關鍵還是在於應用是否與有足夠的市場吸引力,由中國政府創造的安防監控應用雖然規模龐大,相關內需產值驚人,但市場競爭也大,而其他如自動駕駛或AIoT也還遠遠談不上成熟,而最主要的關鍵是,多數AI方案公司基本上都只能守在中國,打不進國際市場,而目前中美貿易情勢緊張,製造業等內需減弱,短期內也不見和解的可能,這都讓中國的AI產業烏雲罩頂。
0

產業需求紛湧現 AI鋒頭銳不可擋

從網路上可看到一則小故事,晉朝時有一位叫王質的樵夫,有一天他到信安郡的石室山(今浙江衢縣)去打柴。看到一童一叟在溪邊大石上下圍棋,於是把砍柴用的斧子放在溪邊地上,駐足觀看。看了多時,童子說:「你該回家了。」王質起身去拿斧子時,一看斧柄已經腐朽了,磨得鋒利的斧頭也鏽得凹凸不平了。王質感到非常奇怪,回到家裡後,發現家鄉已經大變樣。無人認得他。提起的事,有幾位老者都說是幾百年前的事了。原來,王質誤入仙境,遇到了神仙,仙界一日,人間已百年。 這個故事本來是說凡人的壽命短暫,需要多做好事修煉成仙,才能達到世人渴望長生不死的願望。不過換個角度想,圍棋這種遊戲讓連神仙來下也要思考這麼久,可見得圍棋是多麼難的一種遊戲。網路上還說到北宋科學家沈括在「夢溪筆談」中曾粗略估算過棋局的變數,稱「盡三百六十一路,大約連書萬字四十三,即是局之大數」,也就是指3的361次方,這實在是一個天文數字。 這是什麼一個概念,天上的星星總數大約是10的23次方,而3的361次方相當於10的170次方再乘上2,這可是比天上星星的總數後面還要乘上好幾百個零的倍數。所以說圍棋要下得好,不僅僅要會算,還要有策略,更需要有大局觀的視野。就是因為圍棋這麼難,所以電腦棋藝遊戲裡,圍棋這種遊戲很難達到高手的境界,不是棋藝太差,就是速度太慢,但AlphaGo的橫空出世,改變了電腦在整個圍棋遊戲的地位。 AlphaGo展露深度學習效能震驚圍棋界 在圍棋上AlphaGo用三個步驟贏遍人類,第一步驟是規則學習(Policy Network),學習人類所有頂尖的棋譜,用以模仿高手的招式。第二步驟是招數學習(Value Network),評估所有招數優劣,用以判斷不同招數在這個棋局的獲勝機率,第三步驟是布局學習(Tree Search),用來分析棋局的各種可能變化,並推演棋局未來的可能演變,用以決定落子的位置。 AlphaGo這個做法可說是第一次讓電腦模擬人類神經網路(Neural Network),並用深度學習(Deep Learning)的方法來學習下棋的頂尖招數,這個做法就好像武俠小說中的東方不敗,學會了葵花寶典的武功,成為了天下第一的武林高手。不過進一步的想,東方不敗只是一時的高手,卻不能列為頂尖的武林宗師,原因就是他的武功是學來的而不是自己創的。 AlphaGo的強大也是看人類棋譜深度學習的結果,如果棋譜有錯,它也會出錯,如果人類故意輸入錯誤的棋譜,它就會錯得離譜。而且AlphaGo雖然下棋厲害,但除了下棋,其他都不會,只能算初級的人工智慧不會威脅到一般人的生活。但是,開發AlphaGo的DeepMind團隊,緊接著推出AlphaGo Zero,那可不是同一個技術水平的創作。 原本的AlphaGo事先需要人工輸入大量的資料來學習,就像有些模擬人類神經網路的電腦如果要來判斷圖片中那些是貓那些是狗,需要匯入大量的圖片,並且需要人工事先定義圖片內容再輸入關鍵字,萬一將獅子Key成貓,電腦就埋下Bug種子,而且這種工作量實在太大了,變成了勞力密集工作,讓人感覺這種人工智慧(Artificial Intelligence, AI)有點Low。 AlphaGo Zero採用機器自我學習(Machine Learning)的方式來開發下棋應對方式與布局招數,只要講好遊戲的規則,它可以自我模擬對弈,以電子的速度短時間內自我對戰5,000萬次並學習出最佳的策略,進而開創出人類無法想像的對應招數與布局方式。DeepMind團隊在網路上化名試著與人類60位圍棋高手下棋,AI完勝人類。 到了後來,再拿新的AlphaGo Zero與原本的AlphaGo對奕,結果100:0,打得曾經戰勝人類棋王李世乭的AlphaGo毫無招架之力,到這個時候,AlphaGo Zero的棋奕能力與人類的差距,就好像猴子看不懂人下什麼棋一樣,AlphaGo Zero棋力已經自我演化到人類無法想像的境界了。 AI應用紛問世 監控領域為大宗 以模擬人類神經網路來深度學習(Deep Learning),再加上機器自我學習,這就是進階的AI人工智慧。目前一般市場上所說的AI,大都是指這種有自我學習能力的人工智能,而這樣的技術已經不只是用在下圍棋這件事上。 在2018年Google I/O的盛會上,Google就發表了幾個AI運用的例子,一個有意思的技術是關於如何利用AI在影片中將雜亂的「吵架聲」區分開來。這個技術如果用在通話,那麼不論講話的人在吵雜的工廠內還是喧鬧的演唱會上,雙方都可以聽到對方乾淨的聲音。 如果用在監控領域裡,那麼可以隨意點選錄影檔中講話的人物,不論當時錄影的背環境多麼喧譁嘈雜,都可進一步還原並聽清楚講話的內容,這對警方辦案將會是一個偉大的助力。 另外,Google I/O還展現了利用AI人工智慧技術發展而來的語音助理,在Google所公布的影片中可以看到Google I/O利用新的連續對話(Continue Conversation)與多工回應(Multiple Action)技術,不但能記住你以前講話的內容,還能分析談話的邏輯與可能想表達的意思,就算要理解人類說話中不容易瞭解的複合句也不是問題,甚至Google I/O還能模擬人類說話的語調與心機策略,幫忙使用者與理髮店服務人員談判預約最佳的理髮時間,這個技術對於需要有大量客服人員服務的公司來說,無疑是未來服務模式的最佳選擇。 美國輝達公司(NVIDA)近期也發表了如何利用AI人工智慧,在錄影影片中補上新圖像的技術。只要給它一組24個連貫畫面,就可以在每個畫面間隔之間補上10個新的畫面,原本的24FPS影像,就變成了240FPS影像,在慢動作播放的時候看起來依然流暢。 同樣的AI人工智慧技術也用在低畫質影片的補強上,美國聯邦調查局(FBI)就經常使用AI人工智慧的影像補強技術來分析監視錄影系統所收錄到的影像,從中找到犯罪的線索,進一步協助辦案人員偵破犯罪的罪行。 在日本,東京都的警察機關(東京警視廳)2002年開始導入自動車牌辨識系統(ALPR),這個做法大幅度下降了原本居高不下的竊車問題,而現在最新的AI人工智慧技術,讓原本的ALPR系統除了辨識度更加準確以外,還增加了大數據分析功能,針對偵查鎖定的車輛不但能繪製出過去的行動軌跡,還能預測未來可能行經的路線,對於犯罪的偵防擁有莫大的幫助。 最近火紅的人臉辨識技術(Face Recognition)也是炙手可熱的話題,在很多影片中都可看到中國大陸的公安部門,例用人臉辨識技術抓到隱藏群眾之中的通緝要犯,甚至還可以在群眾之中找出以往帶頭鬧場的問題人員,事先壓制囂張的氣焰。在商業上,利用人臉辨識技術來做門禁管理,甚至是購物記帳、寄物領貨、提錢轉帳等,更是如過江之鯽不勝枚舉。 CPU效能大增驅動AI發展 其實模擬人類神經網路來深度學習的技術並不是新的發明,早在上個世紀,1960年代美國麻省理工學院電子工程與計算機科學教授Marvin Minsky就創立了人工智慧研究室,後來還因為在人工智慧領域的卓越貢獻,獲得電腦界最負盛名的獎項,有「電腦界諾貝爾獎」之稱的圖靈獎(ACM A.M....
0
- Advertisement -
- Advertisement -

最新文章

- Advertisement -

熱門文章

- Advertisement -

編輯推薦

- Advertisement -