人工智能，可以說(shuō)是今年最熱的一個(gè)關(guān)鍵詞，并推動(dòng)著(zhù)很多產(chǎn)品和產(chǎn)業(yè)的創(chuàng )新。而提到人工智能，目前主要的還是語(yǔ)音識別和圖像識別，這兩點(diǎn)也一直是上游芯片原廠(chǎng)和方案商想要突破和創(chuàng )新的技術(shù)關(guān)卡。電子設計模塊

作為國內知名的音頻芯片廠(chǎng)商炬芯科技，不但于去年在音頻領(lǐng)域進(jìn)入了小米、魅族等幾家大公司的供應鏈，現在也開(kāi)始聚焦音頻AI領(lǐng)域，推出了一系列的智能語(yǔ)音產(chǎn)品和解決方案。12月15日，炬芯科技在深圳舉行了針對智能語(yǔ)音技術(shù)的專(zhuān)屬品牌活動(dòng)：炬芯科技2017 TcehLife開(kāi)發(fā)者交流大會(huì )。

單麥克風(fēng)or麥克風(fēng)陣列，語(yǔ)音交互該選用怎樣的方案？

本次的TechLife活動(dòng)交流分享環(huán)節，炬芯特邀地平線(xiàn)語(yǔ)音前端處理技術(shù)負責人，南京大學(xué)聲科學(xué)與工程系教授，噪聲控制與通信聲學(xué)研究室主任盧晶盧教授，為大家針對智能語(yǔ)音交互的“金耳朵”語(yǔ)音前端處理技術(shù)進(jìn)行了深度分享。

據WER統計，目前最頂尖的語(yǔ)音識別技術(shù)的誤識率是3%，已經(jīng)與人類(lèi)聽(tīng)力的誤識率持平，但是WER統計大多數針對安靜場(chǎng)景的語(yǔ)音數據，在復雜環(huán)境中語(yǔ)音性能顯著(zhù)惡化。人耳能夠自動(dòng)屏蔽掉周?chē)脑胍?，只關(guān)注你想聽(tīng)到的聲音；但是機器做不到，在語(yǔ)音識別系統看來(lái)所接收到的所有聲音重要性都是一樣的，無(wú)法區分噪音和聲音，在復雜環(huán)境下語(yǔ)音識別率自然會(huì )下降。

因此，智能語(yǔ)音技術(shù)的發(fā)展讓語(yǔ)音前端處理的重要性日益凸顯。不僅要像手機、藍牙耳機、助聽(tīng)器的語(yǔ)音前端處理系統一樣實(shí)現降噪，還要進(jìn)一步還原語(yǔ)音，讓要讓機器聽(tīng)得懂，進(jìn)而提升語(yǔ)音識別和說(shuō)話(huà)人識別系統的實(shí)用性和識別率。

盧晶盧教授表示，目前對干擾噪音的抑制有單麥克風(fēng)和麥克風(fēng)陣列兩種方案。其中單通道方案的關(guān)鍵點(diǎn)是噪聲功率譜的有效追蹤和語(yǔ)音邊界檢測，也可以基于深度學(xué)習的方案提升抑制干擾噪聲的能力。單通道方案優(yōu)點(diǎn)是結構簡(jiǎn)單，硬件成本低，對平穩噪聲效果明顯，但弱點(diǎn)是對非平穩噪聲處理效果不佳。

麥克風(fēng)陣列由一組按一定幾何結構（常用線(xiàn)形、環(huán)形）擺放的麥克風(fēng)組成，對采集的不同空間方向的聲音信號進(jìn)行空時(shí)處理，實(shí)現噪聲抑制、混響去除、人聲干擾抑制、聲源測向、聲源跟蹤、陣列增益等功能，進(jìn)而提高語(yǔ)音信號處理質(zhì)量，以提高真實(shí)環(huán)境下的語(yǔ)音識別率。

理論上來(lái)說(shuō)，麥克風(fēng)數量多多益善，但系統的實(shí)現必須考慮性?xún)r(jià)比。那么，對于開(kāi)發(fā)者來(lái)說(shuō)，該如何平衡語(yǔ)音前端硬件系統的性能和價(jià)格呢？盧晶盧教授認為，在一般應用場(chǎng)景，說(shuō)話(huà)人距離3m以?xún)瓤梢圆捎脝嘻溈孙L(fēng)；復雜場(chǎng)景使用2顆；需要DOA估計的復雜場(chǎng)景則需要3-4顆甚至8顆的麥克風(fēng)。

聚焦音頻AI，炬芯推出智能語(yǔ)音全系列產(chǎn)品線(xiàn)

炬芯科技技術(shù)專(zhuān)家陶永耀在現場(chǎng)也為大家詳細的講解了炬芯目前的幾大核心平臺，同時(shí)也對智能語(yǔ)音的未來(lái)發(fā)表了獨到的觀(guān)點(diǎn)。

熟悉炬芯的人都知道，炬芯是做音頻起家的，最早做MP3，老人機、小音箱等產(chǎn)品。陶永耀表示，炬芯未來(lái)三到五年仍將重點(diǎn)聚焦以音頻為主線(xiàn)的三大領(lǐng)域，并引入人工智能元素。一是無(wú)線(xiàn)音頻和智能穿戴運動(dòng)耳機；二是智能多媒體，將原來(lái)的老人機、游戲機、學(xué)習機，與人工智能結合形成跨界的產(chǎn)品。三是智慧計算與物聯(lián)網(wǎng)，包括無(wú)人機、VR/AR、OTT盒子等產(chǎn)品。

作為一家芯片廠(chǎng)商，炬芯聚焦解決智能語(yǔ)音平臺的共性需求，致力于智能語(yǔ)音交互技術(shù)中的前臺技術(shù)的發(fā)展。主要包括以下四點(diǎn)：1.mic陣列語(yǔ)音采集芯片；2整合語(yǔ)音前處理相關(guān)算法；3.整合本地語(yǔ)音識別引擎；4.雙mic語(yǔ)音前處理模塊。

目前炬芯已經(jīng)擁有非常豐富的智能語(yǔ)音產(chǎn)品線(xiàn)，尤其是目前熱門(mén)且已經(jīng)成功落地的智能早教機器人產(chǎn)品。其實(shí)在早教機器人方面炬芯已經(jīng)推出了比較全面的解決方案，完整布局了低、中、高端市場(chǎng)，主要包括ATS3503、ATS3603、ATS3703。

針對火爆的智能音箱市場(chǎng)，炬芯在本次開(kāi)發(fā)者交流大會(huì )上正式推出了全新的智能語(yǔ)音多媒體平臺。包括面向無(wú)屏Linux系統的智能語(yǔ)音平臺ATS3605D，面向有屏的Android智能語(yǔ)音平臺有S500、S700、S900，以及一顆支持4-8麥的語(yǔ)音采集套片ATT300X。

此外，炬芯還推出了雙模藍牙平臺AT3282X和ATB12XX，以及針對BLE藍牙智能語(yǔ)音平臺ATB110X。

此前，炬芯科技CEO周正宇博士被采訪(fǎng)表示，人工智能和物聯(lián)網(wǎng)概念一樣的龐大，如果人工智能像物聯(lián)網(wǎng)一樣不追求產(chǎn)品的落地，它將依然得不到人工智能需要追求實(shí)際的產(chǎn)品落地和智能化的用戶(hù)體驗，堅持小步快走的微智能化發(fā)展方針才是長(cháng)久之計。炬芯在此次開(kāi)發(fā)者大會(huì )上充分展示了智能語(yǔ)音全面的產(chǎn)品線(xiàn)，正是基于其小步快走的微智能化發(fā)展方針的最好實(shí)踐。

動(dòng)態(tài)信息

從音頻到智能語(yǔ)音，看炬芯AI創(chuàng )新之路

單麥克風(fēng)or麥克風(fēng)陣列，語(yǔ)音交互該選用怎樣的方案？

聚焦音頻AI，炬芯推出智能語(yǔ)音全系列產(chǎn)品線(xiàn)

動(dòng)態(tài)信息

從音頻到智能語(yǔ)音，看炬芯AI創(chuàng )新之路

單麥克風(fēng)or麥克風(fēng)陣列，語(yǔ)音交互該選用怎樣的方案？

聚焦音頻AI，炬芯推出智能語(yǔ)音全系列產(chǎn)品線(xiàn)

從音頻到智能語(yǔ)音，看炬芯AI創(chuàng )新之路

單麥克風(fēng)or麥克風(fēng)陣列，語(yǔ)音交互該選用怎樣的方案？

聚焦音頻AI，炬芯推出智能語(yǔ)音全系列產(chǎn)品線(xiàn)