智能音響是眾多勝任智能家庭管家設備中最具有潛力的,即作為未來(lái)家庭人工智能(AI)的入口,作用至關(guān)重要。目前,美國的亞馬遜、中國的京東等科技公司,已經(jīng)朝著(zhù)這個(gè)方向不斷努力,并且初步顯露成效。亞馬遜在2015年推出智能音箱Echo,京東在2016年推出智能音箱叮咚(DingDong),谷歌的Google Home也正在后來(lái)者居上。這些產(chǎn)品,主要在三個(gè)方面將聲音的人機交互的作用加以發(fā)揮:智能家居中心;家庭購物入口;大數據獲取。
未來(lái),預計會(huì )有更多形式的智能聲音獲取終端進(jìn)入家庭,作為利用人機聲音交互的軟、硬件通道。
無(wú)論在何種方案中,用戶(hù)非?粗氐囊豁椆δ,就是語(yǔ)音識別。如果這項功能缺失,那么人機通過(guò)聲音交互的方式就不能完全自主,必須依賴(lài)其它途徑開(kāi)始、結束交互過(guò)程,用戶(hù)體驗必會(huì )大打折扣。因此,目前各個(gè)主流產(chǎn)品中,都具有語(yǔ)音識別功能。
然而,我們知道如果要想識別用戶(hù)說(shuō)出的命令,麥克風(fēng)必須一直在錄音狀態(tài),并且語(yǔ)音識別算法也要一直在工作,這就是連續語(yǔ)音識別的基本前提。因此,設法降低這部分系統設計的功耗和復雜度,是整個(gè)智能音箱軟、硬件設計的核心之一。
2. 目前的麥克風(fēng)信號處理的主流方案
智能音箱采用N個(gè)(目前多見(jiàn)7個(gè)或8個(gè))麥克風(fēng)芯片構成麥克風(fēng)陣列拾取周邊的聲音信號。市面上見(jiàn)到的智能音箱通常采用“模擬輸出MEMS麥克風(fēng) + 音頻ADC + 處理器”的音頻信號通路形式,如下圖所示:
Amazon Echo的音頻處理板實(shí)物拆解圖
橙色:德州儀器TLV320ADC310192分貝SNR低功耗立體聲ADC(X4)
綠色:S10530090 V6麥克風(fēng)(X7)
以亞馬遜的Echo為例,典型的信號通路形式如下圖,其中兩路模擬麥克風(fēng)輸出共用一顆雙通道音頻ADC,ADC將信號轉換為I2S/PCM音頻格式傳送給應用處理器,應用處理器需要具有足夠多通道的串行數據接口來(lái)接收I2S/PCM信號。
例如圖中7顆麥克風(fēng),后續即需要4顆獨立的音頻ADC同時(shí)輸出4路I2S/PCM信號, DM3725CUS100處理器具有多達5路的串行數據接口(MCBSP)兼容I2S/PCM 格式的音頻信號。當然亦可采用通道數更多的音頻ADC 。
3. 用I2S輸出的數字麥克風(fēng)形成的代替優(yōu)化方案
相對于現在智能音箱“模擬麥克風(fēng) + 音頻ADC + 處理器”的方案,敏芯可提供直接I2S數字輸出的硅麥克風(fēng)芯片,集成了上述“模擬麥克風(fēng) + 音頻ADC”的功能。I2S麥克風(fēng)芯片在芯片內部先將模擬信號數字化后再轉化為標準的I2S信號,由于省去了音頻ADC,可以實(shí)現可應用處理器的直連,節省BOM,節省PCB空間,使設計更簡(jiǎn)單化。 優(yōu)化過(guò)的信號通路如下圖所示:
4. 未來(lái)智能音箱的發(fā)展趨勢 — 低功耗語(yǔ)音喚醒
目前的智能音箱解決方案為了保持聲音識別功能,麥克風(fēng)陣列、ADC以及后續處理算法始終保持在工作狀態(tài),因此功耗較大,這就造成了例如亞馬遜的Echo必須插電工作。然而智能音箱是一類(lèi)移動(dòng)互聯(lián)網(wǎng)時(shí)代的智能硬件,方便攜帶是其作為智能硬件的重要因素,插電工作必將嚴重影響產(chǎn)品的用戶(hù)體驗。
將來(lái)的新一代智能音箱,預期會(huì )借鑒智能手機中(例如中興天機手機)的語(yǔ)音喚醒功能,即在低功耗模式下,只有麥克風(fēng)以及專(zhuān)用語(yǔ)音芯片處于工作狀態(tài),而其他電路部分則處于休眠狀態(tài)。只有麥克風(fēng)偵測到用戶(hù)設定的“特定語(yǔ)音信號”時(shí),整個(gè)系統才被激活。通過(guò)語(yǔ)音喚醒功能,極大的降低了整個(gè)系統的整體功耗,才使用電池供電的智能音箱系統成為可能。
5. 敏芯推出之高一致性(靈敏度+-1dB)多模式數字I2S輸出MEMS麥克風(fēng)
蘇州敏芯微電子技術(shù)有限公司研發(fā)的低功耗的多模式(Multi-Mode)數字I2S輸出MEMS麥克風(fēng)芯片,內置完整的24位I2S音頻接口,無(wú)須額外添加Codec,可直接與DSP或MCU實(shí)現全數字化信號連接?蓭椭纛l系統設計師顯著(zhù)降低信號鏈設計復雜度并降低系統整體成本。在系統體積、成本、功耗和抗干擾性方面都具有極大的優(yōu)勢。
敏芯帶I2S接口的麥克風(fēng)具有極低的工作功耗,并特別集成了低功耗模式,兩種模式之間可實(shí)現無(wú)縫切換。在普通模式下,產(chǎn)品以最優(yōu)的性能指標工作,且具備業(yè)界同類(lèi)產(chǎn)品之最低功耗(750uA);在低功耗模式下,功耗進(jìn)一步降低,麥克風(fēng)可以在保證一定性能的情況下以極低的功耗持續運行,該特性使敏芯I2S麥克風(fēng)尤其適用于需要語(yǔ)音喚醒的智能音箱類(lèi)遠場(chǎng)人機聲音交互產(chǎn)品中。
此外,針對多麥克風(fēng)降噪、波束成形等應用進(jìn)行了優(yōu)化,具有+/-1dB的超窄靈敏度公差控制,確保了產(chǎn)品之間的靈敏度匹配。
總而言之,敏芯發(fā)布之新產(chǎn)品在技術(shù)上的領(lǐng)先性體現為如下幾方面:
* 在普通模式下,敏芯I2S麥克風(fēng)已經(jīng)具備業(yè)界同類(lèi)產(chǎn)品之最低功耗(750uA)
* 業(yè)界首款多模式I2S輸出MEMS麥克風(fēng)
* 業(yè)界首款具有+/-1dB的超窄靈敏度公差控制的I2S輸出MEMS麥克風(fēng)
主要技術(shù)參數見(jiàn)下表。敏芯微電子未來(lái)還將繼續持續開(kāi)發(fā)新產(chǎn)品,例如將自動(dòng)喚醒功能內嵌在麥克風(fēng)芯片中。
6. 敏芯微電子的高一致性(靈敏度 +/-1dB 范圍以?xún)龋┒嗄J綌底諭2S輸出MEMS麥克風(fēng)與現有“麥克風(fēng) + 音頻ADC”方案優(yōu)缺點(diǎn)詳細/對比
1) 現有“麥克風(fēng)+音頻ADC”方案成本高,需要配置單獨的音頻ADC,即使采用多通道,例如4通道輸入的音頻ADC。由于比雙通道ADC具有更高的單價(jià),不能很好起到降低成本的作用 。由于I2S麥克風(fēng)采用了一體化的設計,綜合使用成本低于采用音頻ADC的方案。
2) 現有“麥克風(fēng)+音頻ADC”方案,由于音頻ADC引入的信噪比惡化。以德州儀器TLV320ADC3101為例,其等效輸入模擬噪聲為-95dbV,對應一個(gè)標稱(chēng)-38dbv靈敏度的麥克風(fēng),最多只能達到57的信噪比,使得具有本征高信噪比的麥克風(fēng)新能得不到體現。例如采用標稱(chēng)為 60dB信噪比的麥克風(fēng),最后由于采用音頻ADC的緣故,整體只能達到 55.3dB左右的 整體信噪比,而采用 I2S麥克風(fēng)則不會(huì )損失任何信噪比 。
3) 敏芯I2S麥克風(fēng)方案可以達到更低的整體功耗。仍然以TLV320ADC3101為例,ADC雙通道同時(shí)開(kāi)通時(shí)功耗為6mA ,加上模擬麥克風(fēng)固有的 0.2mA×2=0.4mA 電流,而采用敏芯的低功耗I2S麥克風(fēng)整體電流<2mA,雖然目前的主流的智能音箱都可采用外接電源的方案,但低功耗的需求已成趨勢。
4) 極大程度的減小BOM和PCB空間,數字信號的互聯(lián)不僅抗干擾強于模擬信號,BOM也能大為減小。
5) 相對于采用音頻ADC的方案,I2S麥克風(fēng)更適合語(yǔ)音喚醒,例如為了在待機模式下實(shí)現低功耗的運行,敏芯的麥克風(fēng)支持低功耗模式,配合語(yǔ)音喚醒算法,使得使用電池供電獲得更長(cháng)的待機時(shí)間變得可行。
6) 相對于音頻ADC多少會(huì )引入一些通道間的不一致,敏芯的麥克風(fēng)出廠(chǎng)時(shí)具有很好的一致性(靈敏度+/-1dB變化范圍以?xún)龋,因此使用敏芯的I2S麥克風(fēng)會(huì )使不同通道間匹配的更好。 尤其適合與對產(chǎn)品一致性要求較高的麥克風(fēng)陣列應用。
|