一九九○年代,網路世界是一個封閉的地方。許多使用者都用像是美國線上這類入口網站來管理自己的網路瀏覽需求,把資訊都集中在同一個入口網站上,並且列出有用的外部網站,藉此瀏覽體育資訊、金融資訊等。使用者大多是在封閉的環境裡上網,這種生態也因此稱為「圍牆花園(Walledgarden)」。後來,Google用鐵鎚擊破圍牆,推出搜尋引擎,讓大家可以自行在網路世界裡輕易找到想要的網頁。從此以後,我們便能在整個網路世界裡自由翱翔。
但是過去幾年來,有一件奇怪的事發生了。Google和亞馬遜竟然在重建花園的圍牆。Google推出即時回答,讓使用者有時不需要跳出搜尋結果頁面,就可以得到想要的資訊。Google和亞馬遜也都設計出自家的語音助理。語音助理就是一種入口網站,像是數位行銷商Huge創意總監Sophie Kleber說道:「Alexa就是語音世界的美國線上。」
Google助理與Alexa平台上許多熱門的應用程式,也都是Google或亞馬遜自行設計的。要用第三方應用程式,使用者必須先經過Google助理或Alexa。例如,使用者通常會用所謂的「呼喚語(Invocation Phrase)」呼叫Alexa技能。使用者可能會說:「Alexa,我要聽《華盛頓郵報》的頭條」,或是「Alexa,玩《危險邊緣》。」同樣地,Google助理的使用者也會說:「打開Yelp」或「ESPN上有什麼新聞?」
如果使用者知道自己要用哪一個語音應用程式,這樣的模式就沒有什麼問題;但是如果使用者不知道自己要用的是什麼,會如同矇上眼睛在飛行,就像在沒有搜尋引擎協助的情況下,要找到新的網站。如果使用者詢問的問題或是說出的指令沒有指明要用哪一個應用程式,Alexa或Google助理就會自行決定該如何回答問題或執行指令。如此一來,Google和亞馬遜就握有強大的權力,能夠主導語音流量的去向。
這樣的模式看起來就很像以前的圍牆花園,會形成這樣的模式,其實也不一定是因為亞馬遜或Google 本身渴望握有控制權,但是這些企業肯定很享受這樣的權力所帶來的利益。在語音的世界裡,本來就適合以單一數位實體掌控一切,Siri的原始研發團隊肯定支持這樣的想法。如果沒有一個主宰的語音助手,所有的語音應用程式都會是獨立開發,這樣一來,每個應用程式都有自己的名字、自己的獨特功能、自己的一套指令。「我覺得大家不可能記住數萬個不同的名字和數萬套不同的指令。」切爾說道:「這種模式先天就無法規模化。」
切爾與吉特勞斯離開蘋果後,創辦Viv。Viv追求的是另外一個目標:創造獨立運作、全知全能的助理。Google和亞馬遜雖然很明顯地漸漸在扮演資訊守門人的角色,但是它們本身不想要被大眾當成資訊守門人。但是Viv不一樣,該公司開宗明義就明白宣告,目標就是要做出全能的助理–終極的電腦,有了它,就不需要其他的電腦。
的確,Viv的科技其實已和第三方應用程式配合,畢竟切爾一直以來的運作模式都是如此,但是第三方應用程式都是在背後暗中進行,使用者不會看到,使用者只會和一個助理互動。Viv在2018年下半年推出,裝載在全世界數百萬台三星裝置上。「這是一場競賽。」吉特勞斯說道:「各大企業爭相成為使用者的單一介面。」
各大科技公司表現大盤點
Viv擁有強大的科技,因為它使用的科技是語音助理這個領域最初先鋒所研發的,但是因為進入市場時間較晚,算是競賽中的一匹黑馬,和其他競爭者競逐成為主導介面。這場競賽在幾年前似乎比較開放,大家都可以來競爭,但是現在競賽已經比到某種程度,占有優勢的參賽者已經出線了。
現在,我們來盤點每家公司的表現。首先是蘋果,Siri是全世界普及的數位助理,平均每個月接獲的指令數高達一百億則,而且支援20多種語言。
這是好消息,但壞消息是蘋果並未遵照原始創辦團隊的構想行事,所以Siri並沒有發揮應有的實力。許多科技評論家都開始批評Siri,Siri儼然成為語音人工智慧界的眾矢之的。評論寫道:Siri「很糊塗」又「很難堪」(《華盛頓郵報》);「蘋果錯失的最大契機」〔《休士頓紀事報》(Houston Chronicle)〕「有重大缺陷」(《紐約時報》)。科技分析家Jeremiah Owyang在接受《今日美國》(USA Today)訪談時表示:「感覺蘋果好像完全放棄了Siri。」
這麼說是有點過頭了,但是蘋果的確該受到批評。蘋果原本是語音人工智慧的領頭羊,但是現在卻落後了。蘋果直到2018年2月才推出自家的智慧音響HomePod,比Google Home慢了將近1年半,比亞馬遜Echo慢了整整3年半。HomePod推出後,評論家對其音質表示讚賞,但也提到HomePod價格高昂的問題。一台HomePod要價349美元,亞馬遜Echo只要99美元;而且許多評論家也對Siri提出批評,表示HomePod上的Siri性能很差勁。到了2018年6月,HomePod在美國智慧居家音響市場的市占率只有4%。
針對語音科技,蘋果採取的策略其實和公司的本質定位有關。蘋果的本質是電子裝置製造商,因此把Siri當成自家裝置上的優秀功能,而不是當作獨立出售的產品。然而,Google與亞馬遜都預測在未來環繞運算會成為主流。如此一來,語音科技確實會為蘋果帶來風險。在未來,聰明的人工智慧住在雲端上,透過價格低廉的商品和使用者講話,而蘋果專門販賣高價裝置,在這種情境下,蘋果的地位會受到極大的衝擊。
接下來是微軟。微軟有一個世界級的人工智慧部門,部門裡有8,000名員工。微軟有搜尋強大的引擎Bing,提升語音助理的問答能力,而且微軟的虛擬助理Cortana 已經確立自己的地位。
但是, 微軟提升Cortana在消費者市場的市占率方面遇上了困難。Bing或Skype都支援Cortana,但是這兩個平台的用戶量卻遠遠不及Google或Messenger。Windows Phone上也能使用Cortana,但是它的市占率一直無法脫離個位數,甚至只有個位數出頭,所以在2017年停產了。在智慧音響的戰場上,Cortana 裝載在哈曼卡頓的智慧音響Invoke 裡,但是這款音響的市占率小到幾乎無法計算。開發人員不想花時間為一個很少人用的平台設計語音應用程式,所以大多數都選擇避開Cortana。
儘管面臨這些挑戰,但是微軟並沒有放棄。Cortana裝載在Windows作業系統上,而且每個月有1億4,500萬名活躍用戶。微軟並不是把Cortana定位成全能、全民型的人工智慧,而是定位為職場助理,這很符合微軟近期的總體經營策略:專門為企業提供軟體與雲端服務,而人工智慧語音科技就是其中之一。所以,微軟即便在語音科技的戰場上並沒有總體優勢,但是在企業領域裡,有條件成為一支精實勁旅。
再來是臉書,臉書在語音世界的未來很難預測。如果說全世界都和中國一樣,有十億人都在用微信,並把微信當成整個網路世界的入口,臉書的條件就很好,因為Messenger上已經有許多強大的機器人。不過,未來的趨勢會不會如此,現在仍然難以預料。
除了Messenger以外,臉書也做了不少對話式人工智慧的研究,但並不是很積極把成果轉換為產品。根據傳聞,臉書已經研發出自己的智慧居家音響,但是後來因為爆發劍橋分析醜聞,引爆隱私爭議,於是便暫緩發表。所以,目前臉書的得分是「不完整」。
剩下Google和亞馬遜。無論用什麼指標衡量,這兩家公司目前是競賽中最具優勢的。2018年,支援Cortana 的裝置只有區區39個,支援蘋果和Siri 的裝置有194個,支援Google助理的裝置超過5,000多個,而支援Alexa 的裝置則達到20,000個。Google 助理有超過1,700個應用程式,而Aelxa 在全球則有五萬個應用程式。在美國,亞馬遜的智慧居家音響市占率為65%,Google 則為20%。
既然Google 和亞馬遜是前兩大競逐企業,最好的評估方法就是檢驗兩家公司分別有什麼方法可以透過語音賺取利潤。如果你把獲利的問題拿來詢問這兩家公司的高層,他們會緊張地說出一連串的陳腔濫調,表示現在這項科技還處於早期階段,公司目前正在想辦法提升使用者體驗,等使用者體驗做到最好之後,自然就會有獲利。這種回答雖然是在迴避問題,但是其實不假,目前這些公司都在搶地盤,擴大用戶量,因為它們知道擁有主導地位的平台,自然會有各種方法大發利市。
但是就連在現階段,公司高層也已經在思考各種商業模式。最直接的獲利方法,就是藉由販賣裝置賺取營收,亞馬遜賣Echo,Google賣Home。但是有別於蘋果,這兩家公司對這個選項似乎不是特別感興趣,因為現在它們都刻意壓低裝置的價格,用以提升市占率。
有一家獨立研究公司把Echo Dot 拆開檢查,評估所有組件加總的成本是35美元,加上間接成本與運送費用,總成本還要更高。不過,亞馬遜Echo Dot 的定價最低,為29.95美元。「公司是靠著消費者使用我們的服務賺錢,而不是靠著消費者購買裝置賺錢。」Alexa 設計與發表過程負責人哈特說道。
下一個獲利選項就是廣告,公司可以付錢給平台,在語音助理回應前後播放廣告。目前Google和亞馬遜尚未開放這種模式,但是在未來,這種模式幾乎是遲早的事,而問題在於,哪家公司會率先開放呢?「誰都不想成為第一個,因為這樣一來,另外一家公司就會說:『大家快看,他們有廣告,我們沒有。』」對話式人工智慧創業家亞當.馬奇克(Adam Marchick)說道。「本文摘錄自《聲控未來:引爆購物、搜尋、導航、語音助理的下一波兆元商機》一書」