在亞馬遜Echo取得成功,谷歌宣布推出語(yǔ)音家居設備Google Home,最早引爆消費領(lǐng)域語(yǔ)音識別應用的蘋(píng)果公司也傳出將開(kāi)源Siri給第三方應用程序等這一系列事件之后,市場(chǎng)對智能語(yǔ)音技術(shù)的關(guān)注也達到一個(gè)新的熱度。
據CIRP上月發(fā)布的一份報告顯示,亞馬遜語(yǔ)音智能音響Echo的銷(xiāo)售量已經(jīng)突破300萬(wàn)臺。這款被認為是亞馬遜試水之作的產(chǎn)品,獲得了比預期要好的成績(jì)。Echo的成功很大程度上是源于其出眾的語(yǔ)音識別率,遠場(chǎng)識音以及語(yǔ)音喚醒功能。亞馬遜在Echo頂部配置了7個(gè)微機電系統(MEMS)麥克風(fēng)構成陣列,采用波束成型(Beam-forming)等技術(shù)進(jìn)行降噪語(yǔ)音處理。從而實(shí)現遠距離識音,整個(gè)過(guò)程不需要雙手操作;且在有風(fēng)噪、車(chē)聲、小孩哭鬧等較為嘈雜的環(huán)境下,也不影響正常使用。MEMS麥克風(fēng)技術(shù)方案的提升與智能化創(chuàng )新,為新一代的智能設備提供了可靠的語(yǔ)音交互體驗。本文將闡述,智能語(yǔ)音應用興起大背景下,MEMS麥克風(fēng)的發(fā)展趨勢,以及MEMS麥克風(fēng)元祖樓氏電子在最近的一次研討會(huì )活動(dòng)上展示的最新智能語(yǔ)音解決方案。
設備都在智能化,麥克風(fēng)也一樣
前面提到了亞馬遜Echo的一大殺手锏,即語(yǔ)音喚醒。這就需要設備在語(yǔ)音交互上是一個(gè)一直在線(xiàn)的狀態(tài),能夠隨時(shí)傾聽(tīng)用戶(hù)聲音,等待關(guān)鍵詞口令的出現來(lái)喚醒設備。
于是問(wèn)題來(lái)了。倘若設備一直在收音,無(wú)疑會(huì )非常耗電,這對于移動(dòng)設備來(lái)說(shuō)是非常不適合的。因此,我們需要把麥克風(fēng)變得更加智能。樓氏電子智能語(yǔ)音硬件負責人介紹:“我們將聲學(xué)活動(dòng)檢測(Acoustic Activity Detector, AAD)單元放到了麥克風(fēng)里面,實(shí)現一個(gè)自適應的實(shí)時(shí)監聽(tīng)模式。這種方式能夠使整個(gè)系統節能70%。”例如,在一款CSR平臺的藍牙耳機上,使用普通數字麥克風(fēng)時(shí)整個(gè)系統的待機電流至少為5 mA,而用智能麥克風(fēng)時(shí)的待機電流約為0.6 mA左右,待機時(shí)間從42個(gè)小時(shí)提升到125個(gè)小時(shí)。我們熟知的蘋(píng)果iPhone的Siri,之前只支持充電狀態(tài)下的鎖屏語(yǔ)音喚醒,直到推出iPhone 6s,Siri才支持低功耗的鎖屏語(yǔ)音喚醒。(還記得,去年蘋(píng)果發(fā)布會(huì )邀請函上那句 “Hey Siri”嗎?)
VQ3.0:讓設備聽(tīng)懂“hey Siri.”or“百度一下”...
智能麥克風(fēng)實(shí)現了讓設備一直處于低能耗的監聽(tīng)狀態(tài)。然而我們生活在充滿(mǎn)各種嘈雜聲音的環(huán)境下,汽車(chē)的噪音、地鐵施工的噪音、街坊鄰居的嬉笑聲。所以設備需要了解哪些是噪音,哪些是有用的聲音。去年樓氏并購了語(yǔ)音解決方案供應商Audience后,為樓氏帶來(lái)幾項重要的技術(shù),其中就包括通過(guò)深度神經(jīng)網(wǎng)絡(luò )(DNN)的基于機器學(xué)習的語(yǔ)音識別。
機器學(xué)習是指提供大量不同的聲音樣本給人工智能DNN系統訓練,并能夠將這些資料做一些處理,加上噪音、調整頻率和速度,產(chǎn)生更多的訓練資料,從而可以將識別率提高到非常準確的程度。由于A(yíng)udience的這種識別只是口令式的觸發(fā)啟動(dòng),并不涉及到復雜的信息交流,所以也就不存在語(yǔ)種差異等方面的障礙,只需要將口令的音認準,即完成任務(wù)。據樓氏智能語(yǔ)音軟件產(chǎn)品管理副總裁姜正耀透露,目前Voice Wake VQ 3.0語(yǔ)音喚醒方案已經(jīng)放在聯(lián)發(fā)科X20里面,并且和海思、高通等均有合作。
樓氏日前推出了基于A(yíng)SIC的第二代智能麥克風(fēng)Griffin IA210,內置聲學(xué)檢測單元AAD,采用Burst模式解決延時(shí)問(wèn)題,從而能夠及時(shí)響應。所搭配的低功耗語(yǔ)音DSP處理器eS814,放入了樓氏最新的語(yǔ)音喚醒軟件方案VQ3.0。以軟硬結合的完整方案實(shí)現高性能的語(yǔ)音處理。
實(shí)現遠場(chǎng)識音、更好的壓噪,多麥克風(fēng)方案是必須
實(shí)際上,無(wú)論是前面說(shuō)的機器學(xué)習,還是波束成型等壓噪技術(shù),都需要多麥克風(fēng)方案來(lái)解決。我們看到,目前的智能手機一般都采用了3 ~ 4顆的MEMS麥克風(fēng)。例如,iPhone 5s采用了3顆MEMS麥克風(fēng),iPhone 6s 系列則用到了4顆。而包括Echo智能音響在內的智能家居設備,要配備6 ~ 7顆才能夠滿(mǎn)足日常家居需求。樓氏MEMS麥克風(fēng)業(yè)務(wù)副總裁Greg Doll表示,通過(guò)嵌入更多數量的MEMS麥克風(fēng),設備可以獲得更好音質(zhì)與用戶(hù)體驗。樓氏在研討會(huì )活動(dòng)上還演示了5米遠距離識音IoT方案,包括集成了語(yǔ)音算法的DSP以及3顆高性能麥克風(fēng)陣列,從現場(chǎng)效果來(lái)看,識別率非常高。遠場(chǎng)識音效果的好壞實(shí)際上是由麥克風(fēng)壓噪能力決定的。
Greg Doll對比展示了,在吵鬧環(huán)境下,使用同樣芯片和同樣算法的兩臺智能手機,采用3顆MEMS麥克風(fēng)的音質(zhì)要明顯優(yōu)于采用2顆MEMS麥克風(fēng)的。對于麥克風(fēng)的性能,除了眾所周知的SNR(信噪比)外,AOP(聲學(xué)過(guò)載點(diǎn))也是麥克風(fēng)重要的質(zhì)量指標。高SNR能夠讓設備更好的遠距離收音;而AOP是評估麥克風(fēng)在高聲壓水平下的性能指標,比如,一些公司慶典上的錄音往往有很多破音,就是由于MEMS麥克風(fēng)AOP不夠高的緣故。
這對于使用場(chǎng)景的越來(lái)越多樣化的智能語(yǔ)音設備來(lái)說(shuō)非常重要。有報告顯示,64dB以上的高信噪比MEMS麥克風(fēng)的市場(chǎng)占有率已經(jīng)達到50%以上;而對AOP的要求,很多廠(chǎng)商也從之前的120dB上升到130dB以上的基礎水平。
語(yǔ)音助手功能推動(dòng),MEMS麥克風(fēng)市場(chǎng)持續成長(cháng)
IHS最新報告指出,蘋(píng)果 iPhone將麥克風(fēng)數量增加至4顆,預期會(huì )帶動(dòng)其他廠(chǎng)商跟進(jìn);預計2015 ~ 2019年全球MEMS麥克風(fēng)市場(chǎng)將出現13%幅度成長(cháng),銷(xiāo)售量將達到60億顆。分析師指出,開(kāi)始增加麥克風(fēng)數量,主要是受到免持通話(huà)與Siri、Cortana等語(yǔ)音助手功能所帶動(dòng)。
目前,智能手機市場(chǎng)仍舊是MEMS麥克風(fēng)廠(chǎng)商主攻的重地,當然,一些當下大熱的概念也值得注意。比如,文章前面提到的內置7顆麥克風(fēng)的亞馬遜智能音響Echo,按透露出來(lái)的300萬(wàn)銷(xiāo)量算,其MEMS麥克風(fēng)的采購量也能達到2100萬(wàn)顆。另外還有可穿戴、IoT設備以及MEMS麥克風(fēng)還未涉及的VR領(lǐng)域。
MEMS麥克風(fēng)龍頭的挑戰與應對
樓氏依舊是目前全球MEMS麥克風(fēng)市場(chǎng)的最大市占者。據樓氏透露,其2015年全年的出貨量接近16億顆。但IHS分析指出,由于Goertek、意法半導體與瑞聲科技都在奮起直追,成為蘋(píng)果與其他公司供應商,樓氏的領(lǐng)先幅度正在縮小。
近幾年,樓氏不斷加大在DSP及算法等智能語(yǔ)音方面的投入,包括去年并購了Audience,開(kāi)始從一家的聲學(xué)元器件供應商向音頻解決方案供應商轉型。
日前,樓氏電子傳出將移動(dòng)消費電子揚聲器、受話(huà)器產(chǎn)品線(xiàn)出售給正心谷創(chuàng )新資本的消息。筆者就此事聯(lián)系樓氏方面了解到,樓氏此舉是為了專(zhuān)注于MEMs麥克風(fēng)、智能音頻等核心優(yōu)勢業(yè)務(wù)領(lǐng)域,加強在高級音頻解決方案領(lǐng)域的市場(chǎng)領(lǐng)導地位。另外,平衡電樞驅動(dòng)單元揚聲器(俗稱(chēng)動(dòng)鐵)是隸屬于特種聲學(xué)產(chǎn)品部門(mén)的另一條產(chǎn)品線(xiàn),樓氏將繼續這些產(chǎn)品的生產(chǎn)。