無(wú)論你稱(chēng)它為智能麥克風(fēng)、虛擬數字助理、家用機器人、語(yǔ)音控制或R2-D2,相較于Echo,最新的第二代Echo Dot的價(jià)格從89.99美元調整為49.99美元,并將于本月在美國上市銷(xiāo)售。
Amazon Echo(及其隨后推出的Dot)開(kāi)辟了一個(gè)新的市場(chǎng),讓裝置供貨商能夠在語(yǔ)音擷取、提高麥克風(fēng)音頻分辨率、更先進(jìn)的背景噪聲過(guò)濾、更好的音場(chǎng)偵測與穩定聯(lián)機能力等方面展開(kāi)競爭,以提供更佳音頻質(zhì)量。Amazon Echo (左)及其第二代產(chǎn)品Dot
而像XMOS等公司雖然自家芯片并未用于Echo中,但也瞄準了這個(gè)新的語(yǔ)音接口市場(chǎng)。XMOS營(yíng)銷(xiāo)與業(yè)務(wù)發(fā)展副總裁Paul Neil表示,“物聯(lián)網(wǎng)目前正是一場(chǎng)快速移動(dòng)的盛宴。為了控制IoT裝置,語(yǔ)音是最自然的用戶(hù)接口。”
Neil說(shuō),由于融合了“傳統的微控制器(MCU)性能、嵌入式DSP以及靈活的I/O組合,使得我們的技術(shù)成為語(yǔ)音接口的理想選擇。”
然而,硬件裝置之間的戰爭只是構成整個(gè)智能麥克風(fēng)/揚聲器市場(chǎng)的一部份。IHS Markit連網(wǎng)家庭資深分析師Paul Erickson強調,“真正的競爭變量來(lái)自云端。”
為了追求更聰明的智能麥克風(fēng)(能夠處理復雜的查詢(xún)和隨機問(wèn)題),云端服務(wù)領(lǐng)域的競爭越來(lái)越激烈。 Google預計將于今年年底推出Google Home與Google Assistant (Google Now的新版本),并藉此進(jìn)入這個(gè)市場(chǎng)。Erickson表示,“而且市場(chǎng)上盛傳蘋(píng)果(Apple)很可能將在2017年挾其Siri進(jìn)入這個(gè)領(lǐng)域。”
Amazon Echo——這款I(lǐng)oT裝置如此熱門(mén)的另一個(gè)原因在于它極具潛力,可實(shí)現IoT的重要優(yōu)點(diǎn):經(jīng)得起時(shí)間考驗(Future-proofing)。
芯科科技(Silicon Labs)軟件副總裁Skip Ashton解釋?zhuān)現uture-proofing的意思是確保裝置可隨時(shí)間進(jìn)展持續添加更多功能特性。例如,Alexa為Echo提供的語(yǔ)音服務(wù)功能一開(kāi)始有70種,如今已經(jīng)增加到超過(guò)1,700種了。
Echo可以回答問(wèn)題、閱讀新聞、為運動(dòng)評分、控制燈光、從Amazon網(wǎng)站訂購產(chǎn)品以及設定鬧鈴等。用戶(hù)還可以利用該裝置向Uber叫車(chē)或訂購披薩外送等。
“目前Echo大約每?jì)芍芡高^(guò)云端更新一次,”Ashton說(shuō),“Amazon會(huì )在星期五時(shí)發(fā)送電子郵件給Echo用戶(hù)發(fā)布新功能, 」而Echo用戶(hù)「也對于產(chǎn)品的功能持續增加懷抱著(zhù)期待。”
IHS Markit嵌入式處理器首席分析師Tom Hackenberg剖析Amazon Echo對于電子產(chǎn)業(yè)帶來(lái)重大影響的原因:智能麥克風(fēng)/智能揚聲器應用對于處理器供貨商來(lái)說(shuō)極具價(jià)值。
因為這種裝置關(guān)鍵之處并不只是提供了本地智能。語(yǔ)音接口正普遍應用在廣大的市場(chǎng)領(lǐng)域。不只是數字助理市場(chǎng)出現,成為智能手機App的消費電子裝置版本,還有揚聲器,也不是它唯一的外形應用。
例如,他解釋說(shuō),“家庭自動(dòng)化中心和數字助理可以?xún)冉ㄓ陔娨?、機頂盒(STB)、HVAC/環(huán)境控制中樞等等。此外,在車(chē)載信息娛樂(lè )方面也存在大量的應用,特別是著(zhù)眼于其免手持的優(yōu)點(diǎn)。”
拆解Echo與Echo Dot
透過(guò)拆解Echo與Echo Dot并進(jìn)一步比較后,Hackenberg說(shuō),“除了內存供貨商,我發(fā)現Echo和Echo Dot的處理組件并沒(méi)有明顯的不同。”拆解Echo與Echo Dot (來(lái)源:iFixit)
根據iFixit所進(jìn)行的拆解,Amazon Echo采用: •三星(Samsung) K4X2G323PD-8GD8 256MB LPDDR1 RAM (揮發(fā)性?xún)却? •SanDisk SDIN7DP2-4G 4GB iNAND Ultra Flash (非揮發(fā)性?xún)Υ? 而到了新版的Dot則改用: •美光(Micron) MT46H64M32LFBQ 256MB (16Meg x 32 x 4Banks) LPDDR SDRAM (揮發(fā)性?xún)却? •三星KLM4G1FEPD 4GB高性能eMMC NAND Flash (非揮發(fā)性?xún)Υ?
兩款產(chǎn)品使用的處理器則是相同的。在Echo與Dot的核心采用的是德州儀器(Texas Instruments;TI)的媒體處理器DM3725,此外,高通(Qualcomm) Atheros QCA6234應用專(zhuān)用標準處理器則用于提供連接性。
Hackenberg解釋說(shuō),雖然內存可能稍微影響性能,但內存定價(jià)是波動(dòng)的。因此,對于Echo系列的所有產(chǎn)品而言,在其整個(gè)生命周期中改變所使用的組件也很平常。
相形之下,“聯(lián)機模塊,尤其是媒體處理器更加復雜,如果不是重大的產(chǎn)品更新,一般并不會(huì )改變,”他說(shuō)。
Hackenberg指出,Atheros處理器專(zhuān)用于作為連接應用標準產(chǎn)品。其設計是以Tensilica客制化XTensa核心為基礎,而且它只做一件事——協(xié)調與網(wǎng)絡(luò )的通訊,以利作業(yè)進(jìn)行。
Erickson補充說(shuō),“連接能力至關(guān)重要,因為它涉及哪些數據可被擷取、傳送與接收云端數據的速度與可靠度等。由于速度/響應的可用性因素,它直接影響到與揚聲器之間的互動(dòng)有多么實(shí)時(shí)。因此,Wi-Fi的吞吐量、服務(wù)質(zhì)量(QoS)與范圍的改善,都將有所幫助。”
所有的本地(local)智能功能是由TI DM3725進(jìn)行處理。Hackenberg指出,“這是一款專(zhuān)為STB、TV、顯示器、視訊游戲系統等各種多媒體應用而設計的系統單芯片(SoC)。”
DM3725是一款以ARM Cortex A8為基礎打造的組件,并整合TI的C64x+DSP與3D繪圖加速引擎。“Cortex A8是一款成熟且經(jīng)濟型的應用處理器,但又完全足夠用于本地執行簡(jiǎn)單的任務(wù),”Hackenberg表示。
然而,“如果應用變得復雜,而不只是一款揚聲器這么單純,可能就會(huì )有所變化。”Amazon Echo Dot主板 (來(lái)源:iFixit)
整合DSP
根據Hackenberg,這顆SoC的關(guān)鍵就在于整合了DSP,甚至可能是GPU。
“在一個(gè)典型的設計中,存在多個(gè)輸入傳感器(主要是麥克風(fēng))。整個(gè)音訊輸入首先經(jīng)DSP高度濾波,使系統快速地理解用戶(hù)的語(yǔ)音和環(huán)境噪聲之間的差異,”他說(shuō)。
“它甚至能夠解讀相對于該裝置的位置或甚至發(fā)話(huà)者是誰(shuí);它還建立了一種模式,能夠經(jīng)過(guò)處理以匹配該模式(通常發(fā)送至云端),”他補充說(shuō)。
但是,GPU做什么呢?
Hackenberg認為,對于本地智慧,GPU可以用于更簡(jiǎn)單、但快速且高效的本地模式匹配。 這可以讓裝置仍然響應所儲存的控制模式,例如降低音量、切換頻道或其他簡(jiǎn)單的控制,而無(wú)需網(wǎng)絡(luò )連接,他解釋說(shuō)。接著(zhù),應用核心根據所需提供的響應、啟動(dòng)/關(guān)閉所需的輸入或控制以及必須顯示的內容等條件來(lái)執行應用程序。
麥克風(fēng)數組
Amazon Echo和Dot之所以吸引人之處在于它使用了7麥克風(fēng)數組。Amazon聲稱(chēng),Echo和Dot由于使用了多支麥克風(fēng)和波束成型技術(shù),因而能在整個(gè)室內都聽(tīng)到你的聲音——即使是正在播放音樂(lè )的環(huán)境下。該公司還表示,Echo是一款專(zhuān)業(yè)級的調音揚聲器,能以360°沉浸式音效充滿(mǎn)在整個(gè)房間中。
根據IHS Markit負責MEMS和傳感器的資深分析師Marwan Boustany表示,Echo采用了樓氏電子(Knowles)的MEMS麥克風(fēng)。Dot采用7支麥克風(fēng)數組
Boustany指出,為聲音頻率提升其訊號噪聲比(SNR)、匹配和性能,將有助于遠場(chǎng)音訊擷取,同時(shí)改善語(yǔ)音識別。
但最終,算法才是實(shí)現更優(yōu)質(zhì)語(yǔ)音識別的真正關(guān)鍵,他說(shuō),所謂的『智慧』就在于云端可能持續作為關(guān)鍵應用,而本地處理則可以提高對于簡(jiǎn)單/預定義詞組(如Hey Siri等)的辨識能力。
他以Cypheras為例表示,這一類(lèi)的軟件供貨商將有利于智能家庭系統(如Alexa)中的語(yǔ)音識別功能。Amazon Echo Dot (來(lái)源:iFixit)
競爭日益加劇
以供貨商來(lái)看,目前有幾家提供微控制器(MCU)和連接用ASSP的供貨商可能在此領(lǐng)域展開(kāi)競爭,包括Apple、博通(Broadcom)、賽普拉斯(Cypress)、微芯科技(Microchip)、恩智浦(NXP)、瑞薩(Renesas)、意法半導體(STMicroelectronics)以及芯科科技(Silicon Labs)等。Boustany表示,」802.11n與BT 4.0的組合并不常見(jiàn),但有些設計針對較低成本的解決方案或許將會(huì )只用藍牙。
媒體處理器較為棘手。雖然多家行動(dòng)裝置應用處理器供貨商都可提供,但對于簡(jiǎn)單的應用來(lái)說(shuō)成本太高。根據Hackenberg的觀(guān)察,供貨商們可能會(huì )選擇不提供性能相當的DSP或模式匹配功能。
“我可能會(huì )考慮采用Apple Ax、Broadcom BCM7xxxx、海思(Hisilicon) Hi3xxx、NXP i.MX、聯(lián)發(fā)科MT8xxx、意法STiHxxx、高通(Qualcomm)Snapdragon等。當然,TI或許在成本方面具有最佳DSP支持(對于語(yǔ)音識別至關(guān)重要)的優(yōu)勢,但其他的這幾家供貨商也在不斷地縮小差距中。”
XMOS相信該公司將在這個(gè)市場(chǎng)上獲得動(dòng)能。對于諸如Echo這一類(lèi)的語(yǔ)音助理產(chǎn)品,提高性能的關(guān)鍵在于遠場(chǎng)語(yǔ)音擷取能力、波束成型與處理速度等。Neil認為,“憑借著(zhù)大量的處理能力和嵌入式DSP,我們的XMOS單芯片組件提供了可擴展和差異化的解決方案。”XMOS xCore語(yǔ)音接口案例 (來(lái)源:XMOS)