回音消除
智慧語音應用超展開 MEMS麥克風AOP不漏接
上述AOP是評估MEMS麥克風在高聲壓下的訊號仿真程度指標,AOP越高代表在麥克風訊號可以延伸到更大的聲壓才會產生失真。我們以一AOP 132dBSPL的麥克風為例,當麥克風收到的聲壓較大時,雖未達到麥克風振膜機械應力的極限,電路設計會限制輸出訊號振幅,將某個數值以上的部分箝制住而產生失真,如圖1、圖2所示,此時在頻譜上數倍頻的位置會出現諧波,如圖3、圖4所示。
圖1 麥克風對1KHz 94dBSPL的時域輸出
圖2 麥克風對1KHz 132dBSPL的時域輸出
圖3 麥克風對1KHz 94dBSPL的頻域輸出
圖4 麥克風對1KHz 132dBSPL的頻域輸出
當時域上波形尖端被截掉的占比越大,則頻域上的諧波能量會增強,總諧波失真(Total Harmonic Distortion, THD)也隨之上升,一般MEMS麥克風規格定義THD到達10%此時的聲壓值為AOP。
以下從幾個AOP上必須特別注重的應用角度來說明。
反饋式主動降噪耳機
反饋式主動降噪耳機(Feedback ANC)的麥克風位於揚聲器與耳膜之間的位置,能處理耳邊的實際噪音,且會對麥克風周圍設計出靜域(Quiet Zone)的區塊,因此麥克風要離耳膜越近,降噪效果越佳;理論上,如果能接收到耳膜的訊號,才有機會做出完美的反饋結構。
麥克風距離揚聲器近最大的好處是,系統增益比較高,相對而言比較容易提高麥克風的降噪率,但壞處則是麥克風飽和的風險也比較高。為了避免麥克風飽和,建議選用AOP超過130dB的麥克風,若AOP不足會在高頻產生諧振,觸碰到原本設計放置在高頻的極點或零點,就可能會造成系統響應發散。
一般耳機揚聲器到耳朵振膜的長度約2.54cm,此耳機含音腔響應的共振點在4KHz的位置,同時考慮使用者在配戴耳機的過程中腔體持續變化,共振點會產生頻率飄移的現象,控制器設計上必須將3KHz以上的響應要全部壓掉,因此在濾波器的設計會刻意的安排一個零點在此位置,同時因為濾波器階數的限制,高頻可能也有極點的存在,必須避免諧振產生在此造成系統不穩定,會造成使用者會明顯的不適。
電視與智慧音箱
電視或是智慧音箱都屬於近年快速發展的聲控產品,同時具備播放聲音與語音控制的多麥克風裝置,並對麥克風陣列的收音進行「回音消除(Echo Cancellation)」與「指向性收音」兩項功能。
首先,在多麥克風陣列上,需針對麥克風訊號個別進行回音消除的運算,將擴音器播出後再被麥克風回收的部分音訊進行抑制,以解析出剩餘的環境聲音。由於擴音器所播放的音樂音量有可能被使用者調大,同時麥克風與擴音器的距離較使用者近,麥克風所收到的擴音器音量遠大於使用者聽到的實際音量。若麥克風因訊號強度過大而飽和,進而產生諧振,則回音消除演算法接收到的頻譜除了播出的聲音頻譜外同時包含了諧波,這種情形會造成系統干擾使回音消除功能無法正常發揮功用,甚至會造成反效果。
隨後,DSP再依據不同麥克風收到的訊號時間與音量差異,判斷聲音來源方向再進行增益修正,將目標範圍以外的聲音進行調降,以達到指向性收音的目的。由於大音壓產生諧波是因電路限制產生,並非因聲音方向差異產生,因此諧波的存在會造成指向性收音演算法的誤判,因此降低系統SNR,進而影響辨識率。
車載裝置
語音控制車載裝置,在開車的時候駕駛者雙手必須操控車輛,能以語音操作車載裝置的各項功能具有強勁的市場需求。由於麥克風的收音區域與車載擴音器的放音區域是同一個空間無法隔離,當麥克風與車載擴音器相對位置隨不同車型而改變,車載擴音器發出的聲音通過不同途徑返回到麥克風,造成不同波形與不同相位的聲音疊加後形成結構複雜的聲音波形,當這種反饋滿足震盪時將產生嘯叫,並且可能發生在多個頻率點。
系統需要嘯叫消除(Howling Cancellation)功能,來消除擴音器發出過大音量到麥克風形成正回授而造成嘯叫聲。麥克風必須避免在車用的吵雜環境上先發生飽和,進而提高嘯叫發生機會。
手機
往年有手機廠標榜在搖滾演唱會的前排觀眾可利用手機錄製高還原度的音質,或是戶外使用場合,要避免低頻風切的壓力造成麥克風飽和,麥克風單體AOP需要由傳統的120dBSPL提高為130dBSPL。
近年全螢幕手機興起,在機構設計上麥克風被迫放置在與揚聲器接近的位置,其次,有些機能手機標榜機構防水,會為了防水機構的設計盡量縮減外殼機構的開孔數量,在此要求下,會需要將麥克風與揚聲器放置在距離相當近的位置,為了避免收音失真影響語音辨識等功能,需要高AOP麥克風。
(本文作者為鑫創科技技術經理)