【硅麥應用】敏芯I2S MEMS麥克風芯片在智能音箱中的應用
作者:betway必威發布時間:2025-02-21
1.引言
智能音響是眾多勝任智能家庭管家設備中最具有潛力的,即作為未來家庭人工智能(AI)的入口,作用至關重要。目前,美國的亞馬遜、中國的京東等科技公司,已經朝著這個方向不斷努力,并且初步顯露成效。亞馬遜在2015年推出智能音箱Echo,京東在2016年推出智能音箱叮咚(DingDong),谷歌的Google Home也正在后來者居上。這些產品,主要在三個方面將聲音的人機交互的作用加以發揮:智能家居中心;家庭購物入口;大數據獲取。betway必威
Amazon Echo GoogleHome 京東的DingDong
未來,預計會有更多形式的智能聲音獲取終端進入家庭,作為利用人機聲音交互的軟、硬件通道。
無論在何種方案中,用戶非常看重的一項功能,就是語音識別。如果這項功能缺失,那么人機通過聲音交互的方式就不能完全自主,必須依賴其它途徑開始、結束交互過程,用戶體驗必會大打折扣。因此,目前各個主流產品中,都具有語音識別功能。
然而,我們知道如果要想識別用戶說出的命令,麥克風必須一直在錄音狀態,并且語音識別算法也要一直在工作,這就是連續語音識別的基本前提。因此,設法降低這部分系統設計的功耗和復雜度,是整個智能音箱軟、硬件設計的核心之一。
2.目前的麥克風信號處理的主流方案
智能音箱采用N個(目前多見7個或8個)麥克風芯片構成麥克風陣列拾取周邊的聲音信號。市面上見到的智能音箱通常采用“模擬輸出MEMS麥克風+ 音頻ADC + 處理器”的音頻信號通路形式,如下圖所示:
Amazon Echo的音頻處理板實物拆解圖

*橙色:德州儀器TLV320ADC310192分貝SNR低功耗立體聲ADC(X4)
*綠色:S10530090 V6麥克風(X7)
以亞馬遜的Echo為例,典型的信號通路形式如下圖,其中兩路模擬麥克風輸出共用一顆雙通道音頻ADC,ADC將信號轉換為I2S/PCM音頻格式傳送給應用處理器,應用處理器需要具有足夠多通道的串行數據接口來接收I2S/PCM信號。
例如圖中7顆麥克風,后續即需要4顆獨立的音頻ADC同時輸出4路I2S/PCM信號,DM3725CUS100處理器具有多達5路的串行數據接口(MCBSP)兼容I2S/PCM 格式的音頻信號。當然亦可采用通道數更多的音頻ADC。
3.用I2S輸出的數字麥克風形成的代替優化方案
相對于現在智能音箱“模擬麥克風+ 音頻ADC + 處理器”的方案,敏芯可提供直接I2S數字輸出的硅麥克風芯片,集成了上述“模擬麥克風+ 音頻ADC”的功能。I2S麥克風芯片在芯片內部先將模擬信號數字化后再轉化為標準的I2S信號,由于省去了音頻ADC,節省BOM,節省PCB空間,使設計更簡單化。優化過的信號通路如下圖所示,采用多路I2S信號轉1路TDM格式的IC(Lattice Semiconductor 公司的iCE40 Ultra 的iCE5LP4K),將不必要求主控IC具有同樣數量的I2S音頻接口,節省IO端口數量。或者可以采用Rockchip新推出的RK3229芯片,其本身具有4ch I2S接口,如果需要更多I2S接口,將多個RK3229進行級聯即可實現。
4.未來智能音箱的發展趨勢— 低功耗語音喚醒
目前的智能音箱解決方案為了保持聲音識別功能,麥克風陣列、ADC以及后續處理算法始終保持在工作狀態,因此功耗較大,這就造成了例如亞馬遜的Echo必須插電工作。然而智能音箱是一類移動互聯網時代的智能硬件,方便攜帶是其作為智能硬件的重要因素,插電工作必將嚴重影響產品的用戶體驗。betway必威
將來的新一代智能音箱,預期會借鑒智能手機中(例如中興天機手機)的語音喚醒功能,即在低功耗模式下,只有麥克風以及專用語音芯片處于工作狀態,而其他電路部分則處于休眠狀態。只有麥克風偵測到用戶設定的“特定語音信號”時,整個系統才被激活。通過語音喚醒功能,極大的降低了整個系統的整體功耗,才使用電池供電的智能音箱系統成為可能。
Lattice半導體公司的FPGA芯片iCE5LP4K支持語音喚醒功能的應用,并且可支持連續發出喚醒和指令,使語音交互更加自然。