適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)方法及系統(tǒng)的制作方法

文檔序號：2829298閱讀：334來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及小型移動通信設(shè)備(如手機(jī)、PDA等)，尤其涉及小型移動通信設(shè)備的語音增強(qiáng)技術(shù)。
背景技術(shù)：
近年來，移動通信技術(shù)得到飛速的發(fā)展和普及，“隨時隨地傳信息”即將成為現(xiàn)實(shí)。同時隨著工業(yè)社會的發(fā)展和人口的增長，環(huán)境噪聲對移動通信質(zhì)量的影響也日益突出在諸如車站、商業(yè)中心、機(jī)場、工地、餐館和舞廳等地點(diǎn)使用手機(jī)時，環(huán)境噪聲會和語音一起傳到遠(yuǎn)端，因此為了使對方能較為清楚地聽到自己的聲音，說話者需要盡可能地提高音量，這樣雙方都容易覺得煩躁和疲勞。
目前，為了減少環(huán)境噪聲對語音的影響，主要采取的方法是使用指向性麥克，或采用單麥克語音增強(qiáng)技術(shù)。其中指向性好的指向性麥克比無指向麥克價格昂貴，增加了產(chǎn)品的成本。而且當(dāng)噪聲源和信號源相距較近或者噪聲幅度很大時，即使使用指向性麥克，采集到的語音信號中噪聲幅度仍然很高。單MIC語音增強(qiáng)技術(shù)主要利用語音信號和噪聲信號在時頻域特性上的差異去噪一般認(rèn)為與語音信號相比，噪聲的幅度、周期的變化速度較慢。單MIC語音增強(qiáng)技術(shù)使用一個MIC，實(shí)現(xiàn)簡單。但其存在的主要缺點(diǎn)是在降低噪聲成分強(qiáng)度的同時也損害了語音的清晰度和自然度，當(dāng)輸入信號的信噪比較低時表現(xiàn)得尤為突出；如果噪聲具有和語音相似的特性(如背景人聲和背景音樂聲)，則基本沒有去噪效果；當(dāng)信噪比特別低時(如低于0dB)，也沒有去噪效果。
另一方面，為了獲得更加安全和舒適的通信，移動通信設(shè)備的免提功能也日益受到人們的重視，不少國家已立法規(guī)定開車時只能使用免提移動電話。此外，帶有視頻聊天功能的移動通信設(shè)備最好也要具有免提功能。但由于免提移動通信設(shè)備通常距離使用者有一定的距離，因此其內(nèi)置麥克具有較高的靈敏性，揚(yáng)聲器也有看較大的輸出功率。所以，在免提移動通信設(shè)備中，噪聲、回聲問題同樣突出。為了消除免提功能引入的回聲，目前多是采用配置車載免提電話配件等方法。但獨(dú)立的車載免提電話配件一般價格較貴，應(yīng)用場景單一。
現(xiàn)有的多麥克語音增強(qiáng)技術(shù)中，有一種方案是采用兩個相距較近的麥克采集信號。然后采用結(jié)合VAD(voice activity detector)的自適應(yīng)濾波(adaptivefiltering)技術(shù)進(jìn)行信號分離，得到以語音成分為主的信號s(k)和主要是噪聲成分的信號n(k)，達(dá)到語音增強(qiáng)的目的。如圖1A和1B所示，圖1A給出了利用此方案分離出s(k)的示意圖；圖1B給出了利用此方案分離出n(k)的示意圖。圖1B中的控制信號Adapt_B直接取為圖1A中控制信號Adapt_M的反相信號，因此圖1B中無VAD模塊。由于兩者的基本思路是一致的，這里僅以圖1A為例進(jìn)行說明。
如圖1A所示，麥克MIC A采集到的信號x1(k)延時一段時間后作為自適應(yīng)濾波器的一路參考信號，麥克MIC B采集到的信號x2(k)作為自適應(yīng)濾波器的另一路輸入信號。自適應(yīng)濾波器的輸出x2′(k)與x1(k)的延時信號x1′(k)之和作為輸出s(k)(為了平衡幅度有時需加上增益控制模塊)。受控自適應(yīng)濾波器模塊是該方案中的核心模塊當(dāng)VAD模塊檢測到MIC采集到的信號中含有語音成分的概率較大時，Adapt_M使能自適應(yīng)濾波器進(jìn)行系數(shù)更新，否則停止系數(shù)更新。對含噪語音進(jìn)行VAD的一種實(shí)施方法參見“R.Martin，An EfficientAlgorithm to Estimate the Instantaneous SNR of Speech Signals，Proc.EUROSPEECH‘93，pp.1093-1096，Berlin，September21-23，1993”。既可以只對x1(k)和x2(k)中的一路信號進(jìn)行VAD檢測以獲得Adapt_M使能信息，也可以同時對兩路信號進(jìn)行VAD檢測后綜合兩個檢測結(jié)果得到使能信息Adapt_M。自適應(yīng)濾波器系數(shù)的更新可以采用NLMS和BNLMS等算法，詳見“Simon Haykin，Adaptive Filter Theory，F(xiàn)ourth Edition，Prentice Hall 2003”。由于自適應(yīng)濾波器是在語音成分較強(qiáng)時進(jìn)行系數(shù)更新，因此x2′(k)中主要含語音信號，因此與輸入信號x1(k)(或x2(k)相比)，s(k)的信噪比得到提高。
上述方法的主要缺點(diǎn)是當(dāng)信號的信噪比較低時，VAD模塊的準(zhǔn)確性一般較差，無法保證自適應(yīng)濾波器的輸出x2′(k)主要為語音信號。當(dāng)噪聲信號中含有背景人聲或背景音樂時，該方法完全失效。而且由于延時信號x1′(k)的信噪比沒有得到提高，因此與自適應(yīng)濾波器輸出x2′(k)相比，輸出信號s(k)的信噪比更低。此外，該方法過于簡單，難以取得好的去噪效果，而且基本沒有回聲抑制效果。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)方法，其能夠有效地消除環(huán)境噪聲和回聲。
為實(shí)現(xiàn)本發(fā)明的上述目的，根據(jù)本發(fā)明的一個方面，提供一種適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)方法，其用于對小型移動通信設(shè)備的雙麥克所采集的輸入信號x1(k)和x2(k)進(jìn)行處理，其包括1)采用波束形成技術(shù)，利用目標(biāo)語音信號源和噪聲信號源在空間域上的差異進(jìn)行信號分離，得到語音信號為主的信號s(k)和噪音信號為主的信號n(k)；2)利用兩路信號中同類信號間存在的相關(guān)性，去除s(k)中的噪聲成分和n(k)中的語音成分，分別得到s′(k)和n′(k)，或只對s(k)進(jìn)行去除噪聲成分處理，得到s′(k)。
根據(jù)本發(fā)明的另一方面，提供一種適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)裝置，其用于對小型移動通信設(shè)備的兩個麥克采集的輸入信號x1(k)和x2(k)進(jìn)行處理，其包括信號分離模塊，其接收信號x1(k)和x2(k)，采用波束形成技術(shù)，利用語音信號源和噪聲信號源在空間域上的差異進(jìn)行信號分離，得到語音信號為主的信號s(k)和噪音信號為主的信號n(k)；線性后濾波模塊，其利用兩路信號中同類信號間存在的相關(guān)性，去除s(k)中的噪聲成分和n(k)中的語音成分，分別得到s′(k)和n′(k)，或只對s(k)進(jìn)行去除噪聲成分處理，得到s′(k)。
本發(fā)明能有效地消除環(huán)境噪聲和回聲，符合移動設(shè)備小型化的要求，并具有低成本，低功耗等優(yōu)點(diǎn)。

圖1A給出了利用結(jié)合VAD的自適應(yīng)濾波方案分離出含噪語音s(k)的示意圖；
圖1B給出了利用結(jié)合VAD的自適應(yīng)濾波方案分離出主要是噪聲成分n(k)的示意圖；圖2A給出了本發(fā)明的雙麥克語音增強(qiáng)裝置的一個實(shí)施例的示意圖；圖2B給出了圖2A中所示的實(shí)施例改進(jìn)的示意圖；圖3A和3B給出了本發(fā)明一種實(shí)現(xiàn)麥克校正的方法示意圖；圖3C給出了本發(fā)明另一種實(shí)現(xiàn)麥克校正的方法示意圖；圖4給出了雙麥克信號分離模塊的信號流圖；圖5給出了本發(fā)明實(shí)現(xiàn)雙麥克信號分離模塊的一種方法示意圖；圖6給出了本發(fā)明分?jǐn)?shù)延時模塊的示意圖；圖7給出了本發(fā)明的一種線性后濾波模塊對應(yīng)單通道非線性語音增強(qiáng)模塊的示意圖；圖8給出了本發(fā)明的一種線性后濾波模塊對應(yīng)雙通道非線性語音增強(qiáng)模塊的示意圖；圖9A給出了本發(fā)明的雙麥克語音增強(qiáng)方法的一個實(shí)施例的示意圖；圖9B給出了圖9A中所示的實(shí)施例的改進(jìn)的示意圖；圖10給出了本發(fā)明實(shí)現(xiàn)分?jǐn)?shù)延時的方法示意圖。
具體實(shí)施例方式
下面結(jié)合附圖詳細(xì)描述本發(fā)明的具體實(shí)施方式
，但這些具體實(shí)施方式
并不是對本發(fā)明的限制。
在使用兩個相距很近的普通無指向性MIC組成的麥克對采集信號時，每個麥克采集到的信號中，既包含目標(biāo)說話人的語音信號，也包含需要消除的背景噪聲信號。如果設(shè)備處于免提狀態(tài)，則還包含遠(yuǎn)端說話人的回聲信號。而各種信號成分的幅度與聲源到麥克對的距離和發(fā)聲能量有關(guān)。本發(fā)明利用數(shù)字信號處理技術(shù)增強(qiáng)接收到的信號，輸出的信號中主要成分為目標(biāo)語音信號，去除了大部分的噪聲和回聲信號。該技術(shù)適用于手持(handset)和免提(hands-free)兩種應(yīng)用場合，可以應(yīng)用到諸如手機(jī)等無線移動通信設(shè)備中。
圖2A給出了本發(fā)明雙麥克語音增強(qiáng)的系統(tǒng)的一個實(shí)施例的示意圖。如圖2A所示，適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)裝置包括麥克校正模塊、信號分離模塊、線性后濾波模塊、非線性語音增強(qiáng)模塊。所述小型移動通信設(shè)備采用兩個相距很近的以背靠背模式(endfire-type)擺放的普通無指向性麥克采集信號，當(dāng)然也可以一個是指向性麥克，一個是無指向性麥克(不過，這時可以不用麥克校正模塊)，麥克的組合方式也可以是肩并肩模式的。采集到的輸入信號x1(k)和x2(k)首先經(jīng)過麥克校正模塊，該模塊根據(jù)兩個麥克接收到的信號之間的差異對兩路信號進(jìn)行增益調(diào)整，保證即使在兩個麥克的特性由于價格因素而不是十分匹配的情況下，后端的信號分離模塊仍能取得較好的效果。信號分離模塊采用波束形成技術(shù)，利用目標(biāo)語音信號源和噪聲信號源在空間域上的差異(相對于MIC陣列，噪聲信號源和目標(biāo)語音信號源處于不同的方向，且目標(biāo)語音信號源距MIC陣列距離較近)進(jìn)行信號分離。其中s(k)主要由來自麥克正前方的聲源發(fā)出，因此以有效語音信號為主要成分；n(k)主要由來自麥克正后方的聲源發(fā)出，因此以噪聲信號為主要成分，這里假設(shè)目標(biāo)說話人位于麥克正前方，這在一般情況下都是成立的。而后，s(k)和n(k)送入線性后濾波模塊，該模塊利用兩路信號中同類信號間存在一定的相關(guān)性，進(jìn)一步去除s(k)中的噪聲成分和n(k)中的語音成分，提高信號的分離度，同時起到消除回聲信號的作用。線性后濾波模塊的輸出s′(k)和n′(k)送入非線性語音增強(qiáng)模塊，該模塊利用語音信號和噪聲信號在時頻域上的區(qū)別進(jìn)一步去除s′(k)中的噪聲成分，得到與輸入信號相比，信噪比有極大提高的輸出信號y(k)。
利用本發(fā)明的上述雙麥克語音增強(qiáng)系統(tǒng)，可以去除背景人聲和背景音樂等用單通道語音增強(qiáng)算法難以去除的噪聲信號，在信噪比極低的通話條件下仍能取得很好的去噪效果。而且使用兩個靠得很近的普通無指向性MIC可以節(jié)約實(shí)現(xiàn)成本，符合移動設(shè)備小型化的要求。圖2A中的各個信號處理模塊都可以根據(jù)質(zhì)量和功耗等方面的要求采取多種實(shí)現(xiàn)方式，以實(shí)現(xiàn)最佳的性價比組合。而且根據(jù)需要還可增加殘余回波抑制(Residual echo suppression)模塊和自動增益控制(Automatic gain control)模塊，如圖2B所示。由于語音輸出設(shè)備(如揚(yáng)聲器)的非線性失真等原因，線性后濾波模塊不可能將回聲完全消除。殘余回波抑制模塊用來抑制線性后濾波模塊輸出信號中的殘余回波。一般需要由短時能量包絡(luò)估計回波能量基底(energy floor)，如當(dāng)前信號的短時能量在該基底以下，則削弱當(dāng)前信號，否則不改變地通過該模塊。為了進(jìn)一步提高輸出的語音質(zhì)量，非線性語音增強(qiáng)模塊的輸出信號z(k)在輸出給輸出放大器的同時，也送入自動增益控制模塊，自動增益控制模塊分析信號z(k)，輸出控制信息，根據(jù)信號z(k)的幅度值自適應(yīng)地調(diào)整輸出放大器的增益，保證即使信號z(k)的能量忽強(qiáng)忽弱，輸出放大器的輸出信號z′(k)的能量總是比較平穩(wěn)。
下面分別具體說明圖2A中的各個模塊。
(一)麥克校正模塊理論上，信號分離模塊采用的波束形成技術(shù)要求MIC A和MIC B有著完全一致的幅頻響應(yīng)特性。但在現(xiàn)實(shí)中，高度匹配、特性穩(wěn)定的麥克對價格昂貴，不適合手機(jī)這種大眾化消費(fèi)品。為了保證在使用普通麥克時信號分離模塊的效果，麥克校正模塊自動地校正兩個麥克的特性差異。下面給出麥克校正模塊的兩種實(shí)現(xiàn)方式(1)采用固定自適應(yīng)濾波器的方式如圖3A所示，自適應(yīng)濾波器h的兩路輸入信號分別為兩個麥克MIC A和MIC B接收到的信號x1(k)和x2(k)。如果自適應(yīng)濾波器的輸出e(k)的能量低于一個設(shè)定的閾值，則將此時自適應(yīng)濾波器h(k)的系數(shù)作為補(bǔ)償濾波器的系數(shù)。
校正過程如圖3B所示，經(jīng)補(bǔ)償濾波器H1(k)校正后的信號x1′(k)送入信號分離模塊。
其中，圖3A中的自適應(yīng)濾波器的系數(shù)更新算法可以采用NLMS(Normalized Least Mean Squares)和BNLMS(Block NLMS)等算法。
這種方法實(shí)現(xiàn)簡單，可以根據(jù)需要隨時修正補(bǔ)償濾波器系數(shù)。
(2)基于能量的自適應(yīng)增益均衡方式如圖3C所示，兩個麥克MIC A和MIC B接收到的信號x1(k)和x2(k)分別送入平均能量比較器。平均能量比較器計算兩路信號的短時平均能量E1(k)和E2(k)，根據(jù)兩者之間的差異得到增益調(diào)整因子G1(k)。信號x1(k)乘上增益因子G1(k)后得到的修正信號x1′(k)，x1′(k)和x2(k)送入信號分離模塊。
計算短時平均能量和增益調(diào)整因子可以采取以下計算公式Ei(k)=1LΣn=k-L+1kx2i(n),(i=1,2)---(1.1)]]>
G1(k)=sqrt(E2(k)E1(k))---(1.2)]]>x1′(k)=G1(k)x1(k)---(1.3)]]>其中L表示計算短時平均能量時使用的塊長。
自適應(yīng)增益調(diào)整既可以只對一路信號進(jìn)行，也可以對兩路信號都進(jìn)行，這時增益因子的計算方法為Esum(k)＝E1(k)+E2(k)(1.4)G1(k)=sqrt(Esum(k)E1(k))---(1.5)]]>G2(k)=sqrt(Esum(k)E2(k))---(1.6)]]>x1′(k)=G1(k)x1(k)---(1.7)]]>x2′(k)=G2(k)x2(k)---(1.8)]]>上式中，sqrt表示求平方根運(yùn)算。
(二)信號分離模塊如圖4所示，該模塊的輸入信號為麥克對MIC A和MIC B采集到的含噪語音信號經(jīng)麥克校正模塊進(jìn)行麥克校正后得到的含噪語音信號x1′(k)和x2′(k)。該信號分離模塊的輸出為s(k)和n(k)，其中，s(k)主要包含來自麥克正前方的有效語音信號，n(k)主要包含來自麥克后方和側(cè)面的噪聲信號。
信號分離模塊的核心是波束形成(beamforming)技術(shù)。該技術(shù)是麥克陣列信號處理(Microphone array signal processing)理論的重要一環(huán)。它是一種空間濾波方法，是利用信號源的不同位置來區(qū)分不同類型的信號，這種技術(shù)在“B.Michael，W.Darren，Microphone Arrays-signal processing techniques andapplications，Springer-Verlag publishing group，2001”中公開。
下面以使用兩個背靠背模式(back-to-back mode)的無指向性麥克實(shí)現(xiàn)一階差分麥克陣列技術(shù)為例說明該信號分離模塊。
如圖5所示，f(k)為前置麥克采集的信號，b(k)為后置麥克采集的信號。以下重點(diǎn)說明一階差分麥克陣列技術(shù)，這里假設(shè)麥克具有足夠好的匹配性，或者已做過麥克校正。f(k)減去b(k)的延時信號得到s(k)，b(k)減去f(k)的延時信號得到n(k)。即s(k)＝f(k)-b(k-t0) (2.1)n(k)＝b(k)-f(k-t1) (2.2)
設(shè)麥克之間的距離為d，聲速為c。
則聲音到達(dá)兩個麥克之間的最大時差(聲音從正前或正后方入射時產(chǎn)生的)為τ=dc---(2.3)]]>取t0和t1為0～τ之間的數(shù)值，可以實(shí)現(xiàn)不同的麥克指向性(polar-type)這在“Brian Csermak，A Primer on a Dual Microphone Directional System”，TheHearing Review，January 2000，Vol.7，No.1，pages 56，58 & 60公開。如t0和t1均取為τ，則構(gòu)成了兩個背靠背的心形指向性麥克。即s(k)主要包含來自MIC正前方的信號，n(k)主要包含來自MIC正后方的信號。以下均以此為例說明，但t0和t1也可取其它值，實(shí)現(xiàn)諸如超心形等不同指向性。
如前所述，手機(jī)等移動通信設(shè)備的工業(yè)設(shè)計方案要求兩個麥克之間的距離應(yīng)非常近，以符合設(shè)備小型化的要求。而在d很小時，d/c會小于采樣周期，引入分?jǐn)?shù)延時的問題。如采樣率為8k時，與一個樣本點(diǎn)的采樣時間對應(yīng)的聲音傳輸距離為d′=cT=340m/s·18000s=42.5mm---(3)]]>因此當(dāng)d為1cm左右時，如果信號的采樣率為語音通信中通常使用的采樣率8k、16k，則將信號延時意味著需要將信號延時分?jǐn)?shù)個(＜1，如0.3個)樣本點(diǎn)。
分?jǐn)?shù)延時的基本概念和常見的實(shí)現(xiàn)方法在V.Valimaki and T.I.Laakso，Principles o fractional delay filters.ICASSP 2000中有記載。
本發(fā)明利用”P.P.Vaidyanathan，Multirate systems and filter banks，PrenticHall”中公開的多抽樣率信號處理技術(shù)實(shí)現(xiàn)分?jǐn)?shù)延時，其不同于普通的插值濾波器方法，信號采樣率較低時該方法仍具有實(shí)用性，且運(yùn)算量也較小。下面具體說明分?jǐn)?shù)延時方法設(shè)信號的采樣率為f0Hz，則采樣周期為T=1f0(s)---(4.1)]]>圖6給出了采用將信號f(k)延時的分?jǐn)?shù)延時模塊的框圖，其中N、M均為自然數(shù)，且M＜N。首先通過N倍上采樣器對信號f(k)的任意兩點(diǎn)之間插入N-1個零，得到N倍上采樣后的信號f1(k)；而后經(jīng)過低通濾波器H2(k)，濾去因上采樣引入的鏡像頻率成分，將信號的帶寬限制在輸入信號帶寬f0/2之內(nèi)；而后經(jīng)延時器將低通濾波器的輸出信號w1(k)延時M點(diǎn)得到信號w2(k)；最后經(jīng)N倍下采樣器對信號w2(k)進(jìn)行N倍抽取，得到輸出信號f′(k)。在低通濾波器H2(k)是理想的情況下，忽略其引入的延遲，可得f′(k)=f(k-MN)---(4.2)]]>即f′(k)為信號f(k)延時點(diǎn)后得到的信號。利用圖6所示的分?jǐn)?shù)延時模塊可以由f(k)得到經(jīng)延長分?jǐn)?shù)時間t1后的f(k-t1)，以及由b(k)得到經(jīng)延長分?jǐn)?shù)時間t0后的b(k-t0)，從而經(jīng)圖5所示的信號分離模塊可以得到s(k)和n(k)。
(三)線性后濾波模塊圖4中，信號分離模塊的輸出s(k)的主要成分為來自正前方的語音信號，但同時也含有來自側(cè)面和后面的噪音信號，只是它們的幅度有所衰減。另一路輸出n(k)也同樣含有語音信號。
該線性后濾波模塊利用s(k)中含有的噪音信號與n(k)中含有的噪音信號的相關(guān)性進(jìn)一步去除s(k)中的噪聲成分，顯然兩個麥克中采集到的回聲信號也具有相關(guān)性，因此該模塊同時能起到消除回聲的作用。(此技術(shù)和現(xiàn)有技術(shù)是否相同呢？如果相同為什么本發(fā)明可以將回聲去掉而現(xiàn)有技術(shù)中則無法使用呢？)傳統(tǒng)方案中，線性后濾波模塊多采用一階自適應(yīng)濾波，目的并不是為了利用噪聲信號間的相關(guān)性去噪，而是為了實(shí)現(xiàn)不同的等效延時，取得自適應(yīng)指向性麥克的效果，參見Luo，J.Yang，C.Pavlovic and A.Nehorai，Adaptivenull-forming scheme in digital hearing aids，IEEE Trans.on Signal Processing，Vol.SP-50，pp.1583-1590，July 2002。傳統(tǒng)方案也可應(yīng)用于本發(fā)明。但是本發(fā)明的線性后濾波模塊不僅同樣可以達(dá)到傳統(tǒng)方案的效果，另外，還能有效提高輸出信號的信噪比，且采用受控多階自適應(yīng)濾波器，避免錯誤的濾除語音信號。
圖7給出了與單通道非線性語音增強(qiáng)模塊對應(yīng)的線性后濾波模塊的示意圖。信號分離模塊的輸出s(k)和n(k)送入能量比較器。該能量比較器比較二者的能量值，生成自適應(yīng)濾波器H3(k)的使能控制信號Adapt_en。該控制信號Adapt_en用來控制該自適應(yīng)濾波器是否進(jìn)行系數(shù)更新。自適應(yīng)濾波器的兩路輸入信號分別為n(k)，s(k)的延時信號s′(k)。使用Adapt_en信號的目的是為了保證自適應(yīng)濾波器系數(shù)的調(diào)整是針對噪聲信號而非語音信號，即只有當(dāng)麥克接收到的信號中噪聲成分為主時才更新自適應(yīng)濾波器系數(shù)。一種簡單的產(chǎn)生Adapt_en控制信號的方法描述如下利用一階遞推系統(tǒng)計算得到x1(k)和x2(k)的能量包絡(luò)之比X1_env(k)＝α·X1_env(k-1)+(1-α)·x12(k)(5.1)X2_env(k)＝α·X2_env(k-1)+(1-α)·x22(k)(5.2)ratio=X1_env(k)X2_env(k)---(5.3)]]>上式中，X1_env(k)和X2_env(k)分別為k時刻信號x1和信號x2的能量包絡(luò)，α是小于1的平滑因子。
Adapt_en通過比較ratio(k)與閾值R0得到。
由于信號s(k)主要包含前方的目標(biāo)語音信號，n(k)主要包含來自后方的噪聲信號，因此上述方法能保證自適應(yīng)濾波器的更新主要針對噪聲信號進(jìn)行。
圖7中，將信號s(k)延時T是為了保證自適應(yīng)濾波器的因果性。為了準(zhǔn)確地控制延時T的取值，達(dá)到既保證自適應(yīng)濾波系統(tǒng)的因果性，又不引入不必要的系統(tǒng)延時的目的，本發(fā)明中自適應(yīng)濾波器采用L(L＞1)階線性相位自適應(yīng)濾波器，對應(yīng)的延時T取為L/2點(diǎn)(參考C.F.N.Cowan and P.M.Grant，Adaptive filters，Prentice Hall，1985)。
圖7中，自適應(yīng)濾波器的輸出只有一路信號以目標(biāo)語音信號為主要成分的信號e_s(k)，e_s(k)經(jīng)過非線性語音增強(qiáng)模塊后得到最終的輸出。而雙通道非線性語音增強(qiáng)模塊需要兩路輸入信號(參考I.Cohen，Two-channel signaldetection and speech enhancement based on the transient beam-to-reference ratio，ICASSP 2003)，與此對應(yīng)，線性后濾波模塊采用圖8所示的雙通道輸出模式。兩路輸出中，e_s(k)中主要含目標(biāo)語音信號，e_n(k)中主要含噪聲信號。其中兩個通路的自適應(yīng)濾波器結(jié)構(gòu)一致，只是輸入信號和參考信號互換，控制信號互為反相信號，即某一時刻只有一個自適應(yīng)濾波器進(jìn)行系數(shù)更新。
(四)非線性語音增強(qiáng)模塊非線性語音增強(qiáng)模塊利用語音信號與普通噪聲信號在時頻域上的區(qū)別進(jìn)行語音增強(qiáng)。它的基本理論基礎(chǔ)是譜減法，該方法在I.Cohen and B.Berdugo，Speech enhancement for non-stationary noise environments，signal processing，vol.81，No.11，pp 2403-2418，2001中有記載。
一般的非線性語音增強(qiáng)模塊中都含有語音出現(xiàn)概率判決模塊，用于判定當(dāng)前含噪語音信號中語音信號出現(xiàn)的概率。非線性語音增強(qiáng)模塊包括單通道非線性語音增強(qiáng)模塊和雙通道非線性語音增強(qiáng)模塊。單通道非線性語音增強(qiáng)模塊采用單通道非線性語音增強(qiáng)算法，其根據(jù)一路輸入信號e_s(k)作出概率判決。雙通道非線性語音增強(qiáng)模塊采用雙通道非線性語音增強(qiáng)算法，其需要兩路輸入信號，一路以目標(biāo)目標(biāo)語音信號成分為主，一路以噪聲成分為主。由于該模塊位于線性后濾波器模塊之后，所以要求線性后濾波模塊采用圖8的雙通道模式。
當(dāng)非線性語音增強(qiáng)模塊采用單通道非線性語音增強(qiáng)模塊時，當(dāng)該通道中信號信噪比較低或噪聲信號為非平穩(wěn)信號且能量與語音信號能量近似時，語音出現(xiàn)概率判決模塊很難做出正確的判決，從而在減少噪聲幅度的同時損害了語音的自然度。而使用雙通道非線性語音增強(qiáng)模塊時，由于一個通道以目標(biāo)語音信號為主，另一個通道以噪聲信號為主，則直接比較兩個通道的能量強(qiáng)弱，可以更為準(zhǔn)確的判斷語音出現(xiàn)概率，從而能夠克服單通道非線性語音增強(qiáng)模塊的缺點(diǎn)，但系統(tǒng)的復(fù)雜度有所增加。
圖9A給出了本發(fā)明實(shí)現(xiàn)語音增強(qiáng)的方法的一個具體實(shí)施例的流程圖。如圖9A所示，該方法用于對小型移動通信設(shè)備的麥克A和麥克B分別采集的輸入信號x1(k)和x2(k)進(jìn)行處理，包括如下步驟1)信號分離采用波束形成技術(shù)，利用目標(biāo)語音信號源和噪聲信號源在空間域上的差異進(jìn)行信號分離，得到語音信號為主的信號s(k)和噪音信號為主的信號n(k)；2)線性后濾波利用兩路信號中同類信號間存在的相關(guān)性，去除s(k)中的噪聲成分和n(k)中的語音成分，分別得到s′(k)和n′(k)。
上述步驟2)中的線性后濾波處理可以由線性相位或非線性相位自適應(yīng)濾波器來進(jìn)行，當(dāng)然，優(yōu)選是受控的線性相位或非線性相位自適應(yīng)濾波器。
為了使得到質(zhì)量更好的語音信號，在對信號x1(k)和x2(k)進(jìn)行信號分離前先進(jìn)行麥克校正，即根據(jù)兩個麥克接收到的信號x1(k)和x2(k)之間的差異對兩路信號進(jìn)行增益調(diào)整。下面給出兩種麥克校正方法(1)采用固定自適應(yīng)濾波器的方法如圖3A所示，自適應(yīng)濾波器h(k)的兩路輸入信號分別為兩個麥克MICA和MIC B接收到的信號x1(k)和x2(k)。如果自適應(yīng)濾波器的輸出e(k)的能量低于一個設(shè)定的閾值，則將此時自適應(yīng)濾波器h(k)的系數(shù)作為補(bǔ)償濾波器的系數(shù)。
校正過程如圖3B所示，經(jīng)補(bǔ)償濾波器H1(k)校正后，得到信號x1′(k)。
其中，圖3A中的自適應(yīng)濾波器的系數(shù)更新算法可以采用NLMS和BNLMS等算法。
這種方法實(shí)現(xiàn)簡單，可以根據(jù)需要隨時修正補(bǔ)償濾波器系數(shù)。
(2)基于能量的自適應(yīng)增益均衡方法如圖3C所示，計算兩個麥克MIC A和MIC B接收到的信號x1(k)和x2(k)的短時平均能量E1(k)和E2(k)，根據(jù)兩者之間的差異得到增益調(diào)整因子G1(k)。信號x1(k)乘上增益調(diào)整因子G1(k)后得到的校正信號x1′(k)。
計算短時平均能量和增益調(diào)整因子可以采取以下計算公式Ei(k)=1LΣn=k-L+1kx2i(n),(i=1,2)---(1.1)]]>G1(k)=sqrt(E2(k)E1(k))---(1.2)]]>x1′(k)=G1(k)x1(k)---(1.3)]]>其中L表示計算短時平均能量時使用的塊長。
自適應(yīng)增益調(diào)整既可以只對一路信號進(jìn)行，也可以對兩路信號都進(jìn)行，這時增益因子的計算方法為Esum(k)＝E1(k)+E2(k) (1.4)G1(k)=sqrt(Esum(k)E1(k))---(1.5)]]>G2(k)=sqrt(Esum(k)E2(k))---(1.6)]]>x1′(k)=G1(k)x1(k)---(1.7)]]>
x2′(k)=G2(k)x2(k)---(1.8)]]>上式中，sqrt表示求平方根運(yùn)算。
為了進(jìn)一步使輸出語音信號的質(zhì)量得到提高，對上述經(jīng)線性后濾波后所輸出的信號s′(k)和n′(k)進(jìn)行非線性語音增強(qiáng)處理，即利用語音信號和噪聲信號在時頻域上的區(qū)別去除帶噪語音信號中的噪聲成分。其中，當(dāng)采用雙通道非線性語音增強(qiáng)處理時，則相應(yīng)地在線性后濾波步驟中采用兩個自適應(yīng)濾波器進(jìn)行濾波輸出s′(k)和n′(k)；當(dāng)采用單通道非線性語音增強(qiáng)處理時，則相應(yīng)地在線性后濾波步驟中采用單個自適應(yīng)濾波器進(jìn)行濾波輸出s′(k)。
在上述信號分離步驟中，可以采用帶分?jǐn)?shù)延時的一階差分麥克在空間域進(jìn)行信號分離，所述分?jǐn)?shù)延時采用多抽樣率信號處理技術(shù)來實(shí)現(xiàn)。具體地，如圖10所示，首先對信號f(k)的任意兩點(diǎn)之間插入N-1個零，得到N倍上采樣后的信號f1(k)；而后經(jīng)過低通濾波，濾去因上采樣引入的鏡像頻率成分，將信號的帶寬限制在輸入信號的有效帶寬之內(nèi)；而后將經(jīng)低通濾波后的輸出信號w1(k)延時M點(diǎn)得到信號w2(k)；最后對信號w2(k)進(jìn)行N倍抽取，得到輸出信號f′(k)。在低通濾波為理想的情況下，忽略其引入的延遲，可得f′(k)=f(k-MN)---(4.2)]]>即f′(k)為信號f(k)延時點(diǎn)后得到的信號，其中N、M均為自然數(shù)，且M＜N。
另外，為了進(jìn)一步提高輸出的語音質(zhì)量，對經(jīng)線性后濾波處理后的輸出信號s′(k)和n′(k)進(jìn)行抑制殘余回波的處理，輸出信號y(k)，如圖9B所示。
還有，為了進(jìn)一步提高輸出的語音質(zhì)量，對經(jīng)非線性語音增強(qiáng)處理后的輸出信號z(k)，根據(jù)其幅度值自動調(diào)整輸出放大器的增益，保證即使輸出信號z(k)的能量忽強(qiáng)忽弱，經(jīng)自動增益調(diào)整后的輸出信號z′(k)的能量保持比較平穩(wěn)，如圖9B所示。其中，利用本發(fā)明的上述方法，可以去除背景人聲和背景音樂等用單通道語音增強(qiáng)算法難以去除的噪聲信號，在信噪比極低的通話條件下仍能取得很好的去噪效果。而且使用兩個靠得很近的普通無指向性MIC可以節(jié)約實(shí)現(xiàn)成本，符合移動設(shè)備小型化的要求。
工業(yè)應(yīng)用性本發(fā)明可以應(yīng)用于手機(jī)等小型移動通信設(shè)備上，能有效地消除環(huán)境噪聲和回聲，降低成本，減少功耗。
上述內(nèi)容并非用來限制本發(fā)明，凡根據(jù)本發(fā)明的主要構(gòu)思而進(jìn)行的修改和變動或組合，均應(yīng)屬于本發(fā)明所要求的保護(hù)范圍。
權(quán)利要求
1.一種適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)方法，其用于對小型移動通信設(shè)備的雙麥克所采集的輸入信號x1(k)和x2(k)進(jìn)行處理，其特征在于，1)采用波束形成技術(shù)，利用目標(biāo)語音信號源和噪聲信號源在空間域上的差異進(jìn)行信號分離，得到語音信號為主的信號s(k)和噪音信號為主的信號n(k)；2)利用兩路信號中同類信號間存在的相關(guān)性，去除s(k)中的噪聲成分和n(k)中的語音成分，分別得到s′(k)和n′(k)，或只對s(k)進(jìn)行去除噪聲成分處理，得到s′(k)。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，在所述步驟1)之前還有一步驟1A)，根據(jù)兩個麥克接收到的信號x1(k)和x2(k)之間的差異對兩路信號進(jìn)行增益調(diào)整。
3.根據(jù)權(quán)利要求2所述的方法，其特征在于，在所述步驟1A)，將信號x1(k)和x2(k)輸入自適應(yīng)濾波器，當(dāng)自適應(yīng)濾波器輸出的能量低于一設(shè)定的閾值時，將這時的自適應(yīng)濾波器的系數(shù)作為補(bǔ)償濾波器的系數(shù)，信號x1(k)經(jīng)補(bǔ)償濾波器處理后得到x1′(k)。
4.根據(jù)權(quán)利要求3所述的方法，其特征在于，在所述步驟1A)，所述自適應(yīng)濾波器的系數(shù)更新采用NLMS或BNLMS等算法。
5.根據(jù)權(quán)利要求2所述的方法，其特征在于，在所述步驟1A)，計算兩路信號x1(k)和x2(k)的短時平均能量E1(k)和E2(k)，根據(jù)兩者之間的差異得到增益調(diào)整因子，來對信號x1(k)和x2(k)或二者中之一進(jìn)行修正。
6.根據(jù)權(quán)利要求1所述的方法，其特征在于，在所述步驟2)，利用自適應(yīng)濾波器消除s(k)中的噪聲，噪聲n(k)中的語音。
7.根據(jù)權(quán)利要求6所述的方法，其特征在于，在所述步驟2)，所述自適應(yīng)濾波器是線性相位或非線性相位自適應(yīng)濾波器。
8.根據(jù)權(quán)利要求6或7所述的方法，其特征在于，在所述步驟2)，所述自適應(yīng)濾波器是受控自適應(yīng)濾波器。
9.根據(jù)權(quán)利要求1-8中之一所述的方法，其特征在于，還包括如下步驟3)利用語音信號和噪聲信號在時頻域上的區(qū)別去除帶噪語音信號中的噪聲成分，并輸出給輸出放大器。
10.根據(jù)根據(jù)權(quán)利要求9所述的方法，其特征在于，當(dāng)在步驟3)中采用雙通道輸出時，相應(yīng)地，在步驟2)中采用兩個自適應(yīng)濾波器分別對s(k)和n(k)進(jìn)行濾波。
11.根據(jù)根據(jù)權(quán)利要求9所述的方法，其特征在于，當(dāng)在步驟3)中采用單通道輸出時，相應(yīng)地，在步驟2)中采用單個自適應(yīng)濾波器對s(k)進(jìn)行濾波。
12.根據(jù)權(quán)利要求1-11中之一所述的方法，其特征在于，所用的麥克為普通無指向性麥克。
13.根據(jù)權(quán)利要求1-12中之一所述的方法，其特征在于，在所述步驟1)，利用帶分?jǐn)?shù)延時的一階差分麥克在空間域進(jìn)行信號分離，所述分?jǐn)?shù)延時采用多抽樣率信號處理技術(shù)來實(shí)現(xiàn)。
14.根據(jù)權(quán)利要求13所述的方法，其特征在于，在所述步驟1)，對信號f(k)的任意兩點(diǎn)之間插入N-1個零，得到N倍上采樣后的信號f1(k)；經(jīng)低通濾波濾去因上采樣引入的鏡像頻率成分；將低通濾波的輸出信號w1(k)延時M點(diǎn)得到信號w2(k)；對信號w2(k)進(jìn)行N倍抽取，得到信號f(k)延時點(diǎn)后得到的信號f′(k)，其中N，M為正整數(shù)，且M＜N。
15.根據(jù)權(quán)利要求14所述的方法，其特征在于，在低通濾波為理想的情況下，忽略其引入的延遲，得到f′(k)=f(k-MN)]]>
16.根據(jù)權(quán)利要求1-15中之一所述的方法，其特征在于，在步驟2)之后還有一步驟2A)對在步驟2)中的輸出信號進(jìn)行抑制殘余回波的處理。
17.根據(jù)權(quán)利要求9-11中之一所述的方法，其特征在于，還包括如下步驟4)根據(jù)步驟3)中的輸出信號的幅度值自動調(diào)整輸出放大器的增益，保證即使步驟3)中的輸出信號的能量忽強(qiáng)忽弱，經(jīng)輸出放大器的輸出信號的能量也能保持比較平穩(wěn)。
18.一種適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)裝置，其用于對小型移動通信設(shè)備的兩個麥克采集的輸入信號x1(k)和x2(k)進(jìn)行處理，其特征在于，包括信號分離模塊，其接收信號x1(k)和x2(k)，采用波束形成技術(shù)，利用語音信號源和噪聲信號源在空間域上的差異進(jìn)行信號分離，得到語音信號為主的信號s(k)和噪音信號為主的信號n(k)；線性后濾波模塊，其利用兩路信號中同類信號間存在的相關(guān)性，去除s(k)中的噪聲成分和n(k)中的語音成分，分別得到s′(k)和n′(k)，或只對s(k)進(jìn)行去除噪聲成分處理，得到s′(k)。
19.根據(jù)權(quán)利要求18所述的裝置，其特征在于，所述線性后濾波模塊為線性相位或非線性相位自適應(yīng)濾波器。
20.根據(jù)權(quán)利要求19所述的裝置，其特征在于，所述線性后濾波模塊為受控自適應(yīng)濾波器。
21.根據(jù)權(quán)利要求18所述的裝置，其特征在于，還包括麥克校正模塊，用于根據(jù)兩個麥克接收到的信號x1(k)和x2(k)之間的差異對兩路信號進(jìn)行增益調(diào)整。
22.根據(jù)權(quán)利要求21所述的裝置，其特征在于，所述麥克校正模塊包括自適應(yīng)濾波器，其對兩個麥克接收到的信號x1(k)和x2(k)進(jìn)行自適應(yīng)處理，自適應(yīng)濾波器的輸出e(k)的能量低于一個設(shè)定的閾值；補(bǔ)償濾波器，其對麥克所接收到的信號進(jìn)行校正，然后將信號輸出給信號分離模塊，其中補(bǔ)償濾波器的系數(shù)為自適應(yīng)濾波器的輸出e(k)的能量低于一個設(shè)定的閾值時該自適應(yīng)濾波器的系數(shù)。
23.根據(jù)權(quán)利要求21所述的裝置，其特征在于，所述麥克校正模塊包括平均能量計算器，其接收來自兩個麥克的信號x1(k)和x2(k)，計算兩路信號的短時平均能量E1(k)和E2(k)，根據(jù)兩者之間的差異得到增益調(diào)整因子；第一乘法器，其將兩麥克中一麥克的信號乘上增益因子后得到修正信號。
24.根據(jù)權(quán)利要求21所述的裝置，其特征在于，所述麥克校正模塊包括平均能量計算器，其接收來自兩個麥克的信號x1(k)和x2(k)，計算兩路信號的短時平均能量E1(k)和E2(k)，根據(jù)兩者之間的差異得到增益調(diào)整因子；第一乘法器，其將一麥克的信號乘上增益調(diào)整因子后得到修正信號；第二乘法器，其將另一麥克的信號乘上增益調(diào)整因子后得到修正信號。
25.根據(jù)權(quán)利要求18-24中之一所述的裝置，其特征在于，還包括非線性語音增強(qiáng)模塊，其接收線性后濾波模塊的輸出信號，利用語音信號和噪聲信號在時頻域上的區(qū)別去除s′(k)中的噪聲成分，并輸出給輸出放大器。
26.根據(jù)權(quán)利要求25所述的裝置，其特征在于，當(dāng)所述非線性語音增強(qiáng)模塊為單通道語音增強(qiáng)模塊時，所述線性后濾波模塊采用單個自適應(yīng)濾波器，對s(k)進(jìn)行去除噪聲成分處理，得到s′(k)。
27.根據(jù)權(quán)利要求25所述的裝置，其特征在于，當(dāng)所述非線性語音增強(qiáng)模塊為雙通道語音增強(qiáng)模塊時，所述線性后濾波模塊采用兩個自適應(yīng)濾波器，分別用來去除s(k)中的噪聲成分和n(k)中的語音成分，分別得到s′(k)和n′(k)。
28.根據(jù)權(quán)利要求18-27中之一所述的裝置，其特征在于，還包括殘余回波抑制模塊，用于抑制所述線性后濾波模塊輸出信號中的殘余回波，然后將信號輸出給非線性語音增強(qiáng)模塊。
29.根據(jù)權(quán)利要求25-28中之一所述的裝置，其特征在于，還包括自動增益控制模塊，其接收非線性語音增強(qiáng)模塊輸出的信號，根據(jù)所接收到的信號的幅度值自動調(diào)整輸出放大器的增益，保證即使非線性語音增強(qiáng)模塊輸出信號的能量忽強(qiáng)忽弱，輸出放大器的輸出信號的能量也能保持比較平穩(wěn)。
30.根據(jù)權(quán)利要求18所述的裝置，其特征在于，所述信號分離模塊利用帶分?jǐn)?shù)延時的一階差分麥克在空間域進(jìn)行信號分離。
31.根據(jù)權(quán)利要求30所述裝置，其特征在于，所述信號分離模塊包括分?jǐn)?shù)延時模塊，該分?jǐn)?shù)延時模塊對信號f(k)延時其中N、M均為自然數(shù)，且M＜N，該分?jǐn)?shù)延時模塊包括N倍上采樣器，其對信號f(k)的任意兩點(diǎn)之間插入N-1個零，得到N倍上采樣后的信號f1(k)；低通濾波器，其濾去因上采樣引入的鏡像頻率成分；延時器，其將低通濾波器的輸出信號w1(k)延時M點(diǎn)得到信號w2(k)；N倍下采樣器，其對信號w2(k)進(jìn)行N倍抽取，得到輸出信號f′(k)。
32.根據(jù)權(quán)利要求31所述裝置，其特征在于，在低通濾波器是理想的情況下，忽略其引入的延遲，得到f′(k)=f(k-MN).]]>
全文摘要
本發(fā)明提供一種適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)方法及裝置，其用于對小型移動通信設(shè)備的雙麥克所采集的輸入信號x
文檔編號G10L21/02GK1809105SQ200610001158
公開日2006年7月26日申請日期2006年1月13日優(yōu)先權(quán)日2006年1月13日
發(fā)明者鄧昊, 馮宇紅, 林中松申請人:北京中星微電子有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：鄧昊;馮宇紅;林中松
技術(shù)所有人：北京中星微電子有限公司
我是此專利的發(fā)明人

上一篇：噪聲電平推定方法及其裝置的制作方法
上一篇：弦樂器琴橋以及弦樂器的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

語音增強(qiáng)相關(guān)技術(shù)

語音增強(qiáng)算法相關(guān)技術(shù)

麥克風(fēng)陣列語音增強(qiáng)相關(guān)技術(shù)

qq語音麥克風(fēng)自動增強(qiáng)相關(guān)技術(shù)

語音震顫增強(qiáng)相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)方法及系統(tǒng)的制作方法