- Advertisement -
首頁 標籤 語音控制

語音控制

- Advertisment -

精進SNR/相位一致性/AOP MEMS麥克風聽聲辨位更有感

語音助理已然躍居智慧家庭關鍵應用。根據IDC研究指出,包括亞馬遜Echo和Google Home等智慧喇叭,在所有智慧家庭裝置當中,將會是成長速度最快的類別;預估,2022年智慧喇叭市場值將可達174.31億美元,從2017年至2022年的年平均複合成長率達32%。而隨著智慧型裝置持續進化,語音控制的發展將可使智慧生活更貼近人性,MEMS麥克風的重要性也與日俱增,MEMS麥克風供應商因而加速提升其性能。 SNR/相位一致性為麥克風關鍵參數 鑫創科技市場行銷二處技術經理曾建統(圖1)表示,要提升麥克風性能,主要目標便是提高訊號雜訊比(SNR),以及提高單體間相位一致性。 圖1 鑫創科技市場行銷二處技術經理曾建統表示,提升麥克風效能,SNR和相位一致性是兩大關鍵參數。 由於麥克風為聲波轉電訊號的感測器,於轉換過程中會有時間上的延遲;若每個麥克風的時間延遲一致性越高,而非有些麥克風延遲大,有些麥克風延遲小,對於聲音來源的判斷準確度就會更高,這也就是所謂的相位一致性。 換言之,相位一致性是能保證遠距收音的指標特性,可讓指向性收音的波束成形演算法計算誤差降低,若要使搭載多麥克風的裝置能準確判斷聲音來源,便須設法將裝置內麥克風的訊號轉換延遲性趨於一致。 除了相位一致性外,提高SNR也是強化麥克風性能的關鍵指標之一。曾建統指出,麥克風本身存在著所謂的「底噪」,而當收進來的聲音小於這個底噪時,就會隱藏在底噪中無法聽到;而提高SNR,便是為了降低底噪的干擾。 曾建統說明,底噪來源分為兩種,一種是電訊號(電路訊號干擾),這須靠半導體製程和電路設計加以克服;另一種則是熱擾動。由於麥克風的震膜相當敏感,接收到很輕的聲壓就會產生震動(確保收音靈敏性),卻也因此容易受到空氣中的粒子隨意碰撞而產生震動,因而產生雜訊,這也就是所謂的熱擾動。而要克服熱擾動,便須改善麥克風震膜的結構設計,使其仍可符合聲音系數,收到很輕的聲壓,卻又不會因熱擾動的影響而過度震動產生雜訊。 綜上所述,提高SNR與提高單體間相位一致性目的均是為了提高語音辨識正確率,而相位一致性仍是能保證遠距收音的指標特性,再來是SNR。兩者功用不同,相位一致性可讓指向性收音的波束成形演算法計算誤差降低,提高系統SNR;至於提升單體SNR也會有效,但麥克風仍會收到周圍環境的噪音,所以相較之下,相位一致性對於麥克風收音的實際影響較高。 雙背板設計展妙用 AOP參數更上層樓 英飛凌(Infineon)大中華區行銷經理鍾至仁表示(圖2),毫無疑問的,MEMS麥克風的設計重點在於追求更高的SNR。聲壓位準隨著距離而下降,以智慧音箱為例,當在近距離下指令給智慧裝置時,聲壓約有55dB,當距離拉長至2~5m時,聲壓約降至45dB, 距離大於5m時,僅剩下25~30dB,而25dB已是定義中的Whispered Voice。換句話說,隨著距離變遠,音量亦呈現衰減,因此如何避免距離和音量衰減因素影響收音成效和準確度的問題,提升麥克風靈敏度遂成為主要設計架構重點,也是未來麥克風的發展趨勢。 圖2 英飛凌(Infineon)大中華區行銷經理鍾至仁指出,聲學過載點也是麥克風重要的設計參數之一,為此,該公司採用雙背板設計,可最大幅度減少失真。 不過,為提高SNR,從物理特性上來說麥克風的體積也需要跟著變大(薄膜振盪空間需求變大),然而現今有越來越多的小型化設備也需求高SNR品質,因此如何在追求高SNR時,同時滿足這些小型化裝置體積的需求,將是未來的主要挑戰。 然而,除了SNR外,聲學過載點(AOP)也是麥克風重要的設計參數之一。對此,鐘至仁指出,此參數決定麥克風能夠偵測出的最高訊號位準。舉例來說,在演唱會現場的聲壓可達128dB,如果以目前市面上通用型(未達128dB)的手機麥克風在現場錄音,就會因為超過其AOP而產生失真,無法擷取完整音訊,產生破音;但若是採用高動態範圍的麥克風,甚至在搖滾演唱會的第一排,都能夠錄下高音質的聲音。 也因此,繼SNR之外,提高AOP也是MEMS麥克風供應商致力發展的方向之一;不過,要提升AOP,還須克服當處理較大聲壓位準時,薄膜產生大程度震動,在薄膜移動至極限時造成失真的挑戰。為此,該公司便採用雙背板(Dual back-plate)MEMS結構,將薄膜嵌入在兩個背板之間,成為對稱式結構,可最大幅度減少失真。雙背板裝置也更為強固,可對抗風聲問題。 鐘至仁說明,由於AOP較高的單背板(Single back-plate)裝置製造商一般使用濾波器消除低頻風聲,會對音訊品質造成影響;同時濾波器也會移除低音,這在錄製音樂時會產生影響,畢竟低音是一切重點所在。而雙背板設計能獲得更佳的高頻抗擾性,實現更出色的音訊訊號處理,並將10%總諧波失真(THD)的聲學過載點提升到130dB聲壓,產生更佳的訊號品質。如此一來可讓使用者從兩倍遠的距離說出語音指令,但麥克風仍截取到同質的音訊。 邊緣運算興起 智慧麥克風蓄勢待發 另一方面,麥克風於設計上除須考量SNR、相位一致性及AOP之外,隨著各式語音創新應用服務興起,加上日漸增加的資料處理需求,MEMS麥克風的設計,也開始導入邊緣運算。 為此,樓式電子(Knowles)不久前所推出的新一代智慧麥克風「IA-610」便是結合邊緣運算設計。該產品將高性能SiSonic MEMS技術與先進DSP整合到單顆微型封裝中,使得原始設備製造商(OEM)和第三方軟體開發人員可以創建和制訂更先進的功能,並簡化了音頻設計,大幅降低系統整體成本;且該產品還可實現語音命令喚醒、空間錄音及聲學事件探測等功能,如玻璃破碎或嬰兒啼哭等。 另外,該產品還是首款使用MIPI SoundWire介面的嵌入式元件,因而簡化整合設計過程,降低設計複雜性,並降低成本、pin腳數和功耗;並支援主要的音頻和數據介面,如PDM、I2S、SDW、UART以及I2C等,且包含一款低功率聲音探測器(LPSD),以及一款包含聲學活動探測技術的音頻處理演算法。 樓式電子高級產品管理總監王宇飛表示,語音應用將越來越廣泛,未來將不僅限於智慧音箱,諸如電視機、遙控器等電子產品都有可能添加語音功能。SNR和AOP依舊是提升單顆麥克風性能的要素,但在應用逐漸擴展和資料持續增加的情況下,麥克風也進入了「邊緣運算」的世代,資料處理從雲端慢慢轉至裝置端;再加上某些裝置是屬於近場應用(如電視遙控器、手機),須具備常時開啟功能(Always-on),因此也須有低功耗、高可靠度等特性,為此該公司便將MEMS麥克風結合DSP,提升整體效能。 另一方面,除了IA-610外,樓式也備有新一代音訊處理器平台「IA8508」,以提升多麥克風遠場應用裝置(如數位語音助理、智慧喇叭或是電視等家電)語音辨識率和處理效能。 樓式電子中國區董事總經理陸文杰指出,音頻處理(如SNR、AOP)是MEMS麥克風一直以來的發展重點,然而,隨著語音助理需求增加,服務也越來越多元化,使得多麥克風的遠場應用,也成了未來值得關注的事情之一。且如上所述,現今的資料運算慢慢從雲端轉至裝置端,也因此,需要一個更高效能的平台因應資料處理需求。 新款音訊處理器平台特色包括:支援多達八個麥克風的陣列,並配有四個異構核心,利用其5.7MB的記憶體可同時執行高效能演算法;具優化的單樣本處理器(SSP)核心,以確保低延遲;具有低功耗核心,可以同時監聽各種關鍵短語;以及經優化的指令集,可使複雜的音訊處理和機器學習執行更有效率等。 麥克風市場競爭烈 找出差異化是關鍵 綜上所述,各大MEMS麥克風供應商皆致力提升MEMS麥克風效能,而隨著麥克風需求增加,市場競爭也越來越激烈,如何為MEMS麥克風找出更佳的「賣點」,是供應商的一大挑戰。意法半導體(ST)便採用SiP封裝的方式,將麥克風與其他感測器相整合,除了因應更多創新應用之外,還可降低終端產品業者的開發時間和複雜度。 意法半導體亞太區產品行銷經理陳建成(圖3)指出,提高SNR、AOP和相位一致性等參數是MEMS麥克風不變的發展趨勢,而在各家業者技術和產品規格相差無幾的情況下,如何找出新的「賣點」,是供應商須不停思考的事情。 圖3 意法半導體亞太區產品行銷經理陳建成指出,與其他感測器相整合,可讓MEMS麥克風更有賣點,並簡化終端產品設計複雜度。 陳建成進一步說明,以遙控器為例,為了提升消費者使用體驗,遙控器上面可能不僅有語音功能,可能還增添了體感功能,讓消費者揮動雙手也能操控(例如換頻道、遊戲互動等)。而要達到上述功能,遙控器上不只需有MEMS麥克風,還需要有加速度計;而ST的優勢便在於有完整的MEMS感測器產品線,如麥克風、加速度計,或是溫度/環境感測器等皆涵蓋其中,因此可採用SiP封裝的方式,整合麥克風與加速度計,進而減低終端產品業者的商品開發時間與複雜度。 陳建成表示,原本用SiP封裝整合MEMS麥克風與其他感測器多是用於工業市場(測機台震動頻率和噪音等),但隨著語音控制在大眾消費市場快速興起,從原本的手機、電腦慢慢擴散到其他裝置,如電視、喇叭等,且隨著各種消費裝置上的感測器愈來愈多的情況下,便逐漸將此一作法移至消費性產品,不僅簡化終端產品的設計難度,也藉此在競爭激烈的MEMS麥克風市場中找出差異化的優勢。
0

麥克風市場競爭烈 找出差異化是關鍵

語音應用快速攀升,MEMS麥克風的重要性也日愈俱增,各大MEMS麥克風供應商也加緊提升麥克風效能;而在市場競爭日趨激烈之下,如何為MEMS麥克風找出更佳的「賣點」,成為供應商的一大挑戰。對此,意法半導體(ST)便採用SiP封裝的方式,將麥克風與其他感測器相整合,除了因應更多創新應用之外,還可降低終端產品業者的開發時間和複雜度。 意法半導體亞太區產品行銷經理陳建成指出,提高SNR、AOP和相位一致性等參數是MEMS麥克風不變的發展趨勢,而在各家業者技術和產品規格相差無幾的情況下,如何找出新的「賣點」,是供應商須不停思考的事情。 陳建成進一步說明,以遙控器為例,為了提升消費者使用體驗,遙控器上面可能不僅有語音功能,可能還增添了體感功能,讓消費者揮動雙手也能操控(例如換頻道、遊戲互動等)。而要達到上述功能,遙控器上不只需有MEMS麥克風,還需要有加速度計;而ST的優勢便在於有完整的MEMS感測器產品線,不論是麥克風、加速度計、溫度/環境感測器等皆有生產,因此可採用SiP封裝的方式,整合麥克風與加速度計,進而減低終端產品業者的商品開發時間與複雜度。 陳建成表示,原本用SiP封裝整合MEMS麥克風與其他感測器多是用於工業市場(測機台震動頻率和噪音等),但隨著語音控制在大眾消費市場快速興起,從原本的手機、電腦慢慢擴散到其他裝置,如電視、喇叭等,且各種消費裝置上的感測器愈來愈多的情況下,便逐漸將此一作法移至消費性產品,不僅簡化終端產品的設計難度,也藉此在競爭激烈的MEMS麥克風市場中找出差異化的優勢。
0
- Advertisement -
- Advertisement -

最新文章

- Advertisement -

熱門文章

- Advertisement -

編輯推薦

- Advertisement -