專利名稱:適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及小型移動通信設(shè)備(如手機(jī)、PDA等),尤其涉及小型移動通信設(shè)備的語音增強(qiáng)技術(shù)。
背景技術(shù):
近年來,移動通信技術(shù)得到飛速的發(fā)展和普及,“隨時隨地傳信息”即將成為現(xiàn)實(shí)。同時隨著工業(yè)社會的發(fā)展和人口的增長,環(huán)境噪聲對移動通信質(zhì)量的影響也日益突出在諸如車站、商業(yè)中心、機(jī)場、工地、餐館和舞廳等地點(diǎn)使用手機(jī)時,環(huán)境噪聲會和語音一起傳到遠(yuǎn)端,因此為了使對方能較為清楚地聽到自己的聲音,說話者需要盡可能地提高音量,這樣雙方都容易覺得煩躁和疲勞。
目前,為了減少環(huán)境噪聲對語音的影響,主要采取的方法是使用指向性麥克,或采用單麥克語音增強(qiáng)技術(shù)。其中指向性好的指向性麥克比無指向麥克價格昂貴,增加了產(chǎn)品的成本。而且當(dāng)噪聲源和信號源相距較近或者噪聲幅度很大時,即使使用指向性麥克,采集到的語音信號中噪聲幅度仍然很高。單MIC語音增強(qiáng)技術(shù)主要利用語音信號和噪聲信號在時頻域特性上的差異去噪一般認(rèn)為與語音信號相比,噪聲的幅度、周期的變化速度較慢。單MIC語音增強(qiáng)技術(shù)使用一個MIC,實(shí)現(xiàn)簡單。但其存在的主要缺點(diǎn)是在降低噪聲成分強(qiáng)度的同時也損害了語音的清晰度和自然度,當(dāng)輸入信號的信噪比較低時表現(xiàn)得尤為突出;如果噪聲具有和語音相似的特性(如背景人聲和背景音樂聲),則基本沒有去噪效果;當(dāng)信噪比特別低時(如低于0dB),也沒有去噪效果。
另一方面,為了獲得更加安全和舒適的通信,移動通信設(shè)備的免提功能也日益受到人們的重視,不少國家已立法規(guī)定開車時只能使用免提移動電話。此外,帶有視頻聊天功能的移動通信設(shè)備最好也要具有免提功能。但由于免提移動通信設(shè)備通常距離使用者有一定的距離,因此其內(nèi)置麥克具有較高的靈敏性,揚(yáng)聲器也有看較大的輸出功率。所以,在免提移動通信設(shè)備中,噪聲、回聲問題同樣突出。為了消除免提功能引入的回聲,目前多是采用配置車載免提電話配件等方法。但獨(dú)立的車載免提電話配件一般價格較貴,應(yīng)用場景單一。
現(xiàn)有的多麥克語音增強(qiáng)技術(shù)中,有一種方案是采用兩個相距較近的麥克采集信號。然后采用結(jié)合VAD(voice activity detector)的自適應(yīng)濾波(adaptivefiltering)技術(shù)進(jìn)行信號分離,得到以語音成分為主的信號s(k)和主要是噪聲成分的信號n(k),達(dá)到語音增強(qiáng)的目的。如圖1A和1B所示,圖1A給出了利用此方案分離出s(k)的示意圖;圖1B給出了利用此方案分離出n(k)的示意圖。圖1B中的控制信號Adapt_B直接取為圖1A中控制信號Adapt_M的反相信號,因此圖1B中無VAD模塊。由于兩者的基本思路是一致的,這里僅以圖1A為例進(jìn)行說明。
如圖1A所示,麥克MIC A采集到的信號x1(k)延時一段時間后作為自適應(yīng)濾波器的一路參考信號,麥克MIC B采集到的信號x2(k)作為自適應(yīng)濾波器的另一路輸入信號。自適應(yīng)濾波器的輸出x2′(k)與x1(k)的延時信號x1′(k)之和作為輸出s(k)(為了平衡幅度有時需加上增益控制模塊)。受控自適應(yīng)濾波器模塊是該方案中的核心模塊當(dāng)VAD模塊檢測到MIC采集到的信號中含有語音成分的概率較大時,Adapt_M使能自適應(yīng)濾波器進(jìn)行系數(shù)更新,否則停止系數(shù)更新。對含噪語音進(jìn)行VAD的一種實(shí)施方法參見“R.Martin,An EfficientAlgorithm to Estimate the Instantaneous SNR of Speech Signals,Proc.EUROSPEECH‘93,pp.1093-1096,Berlin,September21-23,1993”。既可以只對x1(k)和x2(k)中的一路信號進(jìn)行VAD檢測以獲得Adapt_M使能信息,也可以同時對兩路信號進(jìn)行VAD檢測后綜合兩個檢測結(jié)果得到使能信息Adapt_M。自適應(yīng)濾波器系數(shù)的更新可以采用NLMS和BNLMS等算法,詳見“Simon Haykin,Adaptive Filter Theory,F(xiàn)ourth Edition,Prentice Hall 2003”。由于自適應(yīng)濾波器是在語音成分較強(qiáng)時進(jìn)行系數(shù)更新,因此x2′(k)中主要含語音信號,因此與輸入信號x1(k)(或x2(k)相比),s(k)的信噪比得到提高。
上述方法的主要缺點(diǎn)是當(dāng)信號的信噪比較低時,VAD模塊的準(zhǔn)確性一般較差,無法保證自適應(yīng)濾波器的輸出x2′(k)主要為語音信號。當(dāng)噪聲信號中含有背景人聲或背景音樂時,該方法完全失效。而且由于延時信號x1′(k)的信噪比沒有得到提高,因此與自適應(yīng)濾波器輸出x2′(k)相比,輸出信號s(k)的信噪比更低。此外,該方法過于簡單,難以取得好的去噪效果,而且基本沒有回聲抑制效果。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)方法,其能夠有效地消除環(huán)境噪聲和回聲。
為實(shí)現(xiàn)本發(fā)明的上述目的,根據(jù)本發(fā)明的一個方面,提供一種適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)方法,其用于對小型移動通信設(shè)備的雙麥克所采集的輸入信號x1(k)和x2(k)進(jìn)行處理,其包括1)采用波束形成技術(shù),利用目標(biāo)語音信號源和噪聲信號源在空間域上的差異進(jìn)行信號分離,得到語音信號為主的信號s(k)和噪音信號為主的信號n(k);2)利用兩路信號中同類信號間存在的相關(guān)性,去除s(k)中的噪聲成分和n(k)中的語音成分,分別得到s′(k)和n′(k),或只對s(k)進(jìn)行去除噪聲成分處理,得到s′(k)。
根據(jù)本發(fā)明的另一方面,提供一種適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)裝置,其用于對小型移動通信設(shè)備的兩個麥克采集的輸入信號x1(k)和x2(k)進(jìn)行處理,其包括信號分離模塊,其接收信號x1(k)和x2(k),采用波束形成技術(shù),利用語音信號源和噪聲信號源在空間域上的差異進(jìn)行信號分離,得到語音信號為主的信號s(k)和噪音信號為主的信號n(k);線性后濾波模塊,其利用兩路信號中同類信號間存在的相關(guān)性,去除s(k)中的噪聲成分和n(k)中的語音成分,分別得到s′(k)和n′(k),或只對s(k)進(jìn)行去除噪聲成分處理,得到s′(k)。
本發(fā)明能有效地消除環(huán)境噪聲和回聲,符合移動設(shè)備小型化的要求,并具有低成本,低功耗等優(yōu)點(diǎn)。
圖1A給出了利用結(jié)合VAD的自適應(yīng)濾波方案分離出含噪語音s(k)的示意圖;
圖1B給出了利用結(jié)合VAD的自適應(yīng)濾波方案分離出主要是噪聲成分n(k)的示意圖;圖2A給出了本發(fā)明的雙麥克語音增強(qiáng)裝置的一個實(shí)施例的示意圖;圖2B給出了圖2A中所示的實(shí)施例改進(jìn)的示意圖;圖3A和3B給出了本發(fā)明一種實(shí)現(xiàn)麥克校正的方法示意圖;圖3C給出了本發(fā)明另一種實(shí)現(xiàn)麥克校正的方法示意圖;圖4給出了雙麥克信號分離模塊的信號流圖;圖5給出了本發(fā)明實(shí)現(xiàn)雙麥克信號分離模塊的一種方法示意圖;圖6給出了本發(fā)明分?jǐn)?shù)延時模塊的示意圖;圖7給出了本發(fā)明的一種線性后濾波模塊對應(yīng)單通道非線性語音增強(qiáng)模塊的示意圖;圖8給出了本發(fā)明的一種線性后濾波模塊對應(yīng)雙通道非線性語音增強(qiáng)模塊的示意圖;圖9A給出了本發(fā)明的雙麥克語音增強(qiáng)方法的一個實(shí)施例的示意圖;圖9B給出了圖9A中所示的實(shí)施例的改進(jìn)的示意圖;圖10給出了本發(fā)明實(shí)現(xiàn)分?jǐn)?shù)延時的方法示意圖。
具體實(shí)施例方式
下面結(jié)合附圖詳細(xì)描述本發(fā)明的具體實(shí)施方式
,但這些具體實(shí)施方式
并不是對本發(fā)明的限制。
在使用兩個相距很近的普通無指向性MIC組成的麥克對采集信號時,每個麥克采集到的信號中,既包含目標(biāo)說話人的語音信號,也包含需要消除的背景噪聲信號。如果設(shè)備處于免提狀態(tài),則還包含遠(yuǎn)端說話人的回聲信號。而各種信號成分的幅度與聲源到麥克對的距離和發(fā)聲能量有關(guān)。本發(fā)明利用數(shù)字信號處理技術(shù)增強(qiáng)接收到的信號,輸出的信號中主要成分為目標(biāo)語音信號,去除了大部分的噪聲和回聲信號。該技術(shù)適用于手持(handset)和免提(hands-free)兩種應(yīng)用場合,可以應(yīng)用到諸如手機(jī)等無線移動通信設(shè)備中。
圖2A給出了本發(fā)明雙麥克語音增強(qiáng)的系統(tǒng)的一個實(shí)施例的示意圖。如圖2A所示,適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)裝置包括麥克校正模塊、信號分離模塊、線性后濾波模塊、非線性語音增強(qiáng)模塊。所述小型移動通信設(shè)備采用兩個相距很近的以背靠背模式(endfire-type)擺放的普通無指向性麥克采集信號,當(dāng)然也可以一個是指向性麥克,一個是無指向性麥克(不過,這時可以不用麥克校正模塊),麥克的組合方式也可以是肩并肩模式的。采集到的輸入信號x1(k)和x2(k)首先經(jīng)過麥克校正模塊,該模塊根據(jù)兩個麥克接收到的信號之間的差異對兩路信號進(jìn)行增益調(diào)整,保證即使在兩個麥克的特性由于價格因素而不是十分匹配的情況下,后端的信號分離模塊仍能取得較好的效果。信號分離模塊采用波束形成技術(shù),利用目標(biāo)語音信號源和噪聲信號源在空間域上的差異(相對于MIC陣列,噪聲信號源和目標(biāo)語音信號源處于不同的方向,且目標(biāo)語音信號源距MIC陣列距離較近)進(jìn)行信號分離。其中s(k)主要由來自麥克正前方的聲源發(fā)出,因此以有效語音信號為主要成分;n(k)主要由來自麥克正后方的聲源發(fā)出,因此以噪聲信號為主要成分,這里假設(shè)目標(biāo)說話人位于麥克正前方,這在一般情況下都是成立的。而后,s(k)和n(k)送入線性后濾波模塊,該模塊利用兩路信號中同類信號間存在一定的相關(guān)性,進(jìn)一步去除s(k)中的噪聲成分和n(k)中的語音成分,提高信號的分離度,同時起到消除回聲信號的作用。線性后濾波模塊的輸出s′(k)和n′(k)送入非線性語音增強(qiáng)模塊,該模塊利用語音信號和噪聲信號在時頻域上的區(qū)別進(jìn)一步去除s′(k)中的噪聲成分,得到與輸入信號相比,信噪比有極大提高的輸出信號y(k)。
利用本發(fā)明的上述雙麥克語音增強(qiáng)系統(tǒng),可以去除背景人聲和背景音樂等用單通道語音增強(qiáng)算法難以去除的噪聲信號,在信噪比極低的通話條件下仍能取得很好的去噪效果。而且使用兩個靠得很近的普通無指向性MIC可以節(jié)約實(shí)現(xiàn)成本,符合移動設(shè)備小型化的要求。圖2A中的各個信號處理模塊都可以根據(jù)質(zhì)量和功耗等方面的要求采取多種實(shí)現(xiàn)方式,以實(shí)現(xiàn)最佳的性價比組合。而且根據(jù)需要還可增加殘余回波抑制(Residual echo suppression)模塊和自動增益控制(Automatic gain control)模塊,如圖2B所示。由于語音輸出設(shè)備(如揚(yáng)聲器)的非線性失真等原因,線性后濾波模塊不可能將回聲完全消除。殘余回波抑制模塊用來抑制線性后濾波模塊輸出信號中的殘余回波。一般需要由短時能量包絡(luò)估計回波能量基底(energy floor),如當(dāng)前信號的短時能量在該基底以下,則削弱當(dāng)前信號,否則不改變地通過該模塊。為了進(jìn)一步提高輸出的語音質(zhì)量,非線性語音增強(qiáng)模塊的輸出信號z(k)在輸出給輸出放大器的同時,也送入自動增益控制模塊,自動增益控制模塊分析信號z(k),輸出控制信息,根據(jù)信號z(k)的幅度值自適應(yīng)地調(diào)整輸出放大器的增益,保證即使信號z(k)的能量忽強(qiáng)忽弱,輸出放大器的輸出信號z′(k)的能量總是比較平穩(wěn)。
下面分別具體說明圖2A中的各個模塊。
(一)麥克校正模塊理論上,信號分離模塊采用的波束形成技術(shù)要求MIC A和MIC B有著完全一致的幅頻響應(yīng)特性。但在現(xiàn)實(shí)中,高度匹配、特性穩(wěn)定的麥克對價格昂貴,不適合手機(jī)這種大眾化消費(fèi)品。為了保證在使用普通麥克時信號分離模塊的效果,麥克校正模塊自動地校正兩個麥克的特性差異。下面給出麥克校正模塊的兩種實(shí)現(xiàn)方式(1)采用固定自適應(yīng)濾波器的方式如圖3A所示,自適應(yīng)濾波器h的兩路輸入信號分別為兩個麥克MIC A和MIC B接收到的信號x1(k)和x2(k)。如果自適應(yīng)濾波器的輸出e(k)的能量低于一個設(shè)定的閾值,則將此時自適應(yīng)濾波器h(k)的系數(shù)作為補(bǔ)償濾波器的系數(shù)。
校正過程如圖3B所示,經(jīng)補(bǔ)償濾波器H1(k)校正后的信號x1′(k)送入信號分離模塊。
其中,圖3A中的自適應(yīng)濾波器的系數(shù)更新算法可以采用NLMS(Normalized Least Mean Squares)和BNLMS(Block NLMS)等算法。
這種方法實(shí)現(xiàn)簡單,可以根據(jù)需要隨時修正補(bǔ)償濾波器系數(shù)。
(2)基于能量的自適應(yīng)增益均衡方式如圖3C所示,兩個麥克MIC A和MIC B接收到的信號x1(k)和x2(k)分別送入平均能量比較器。平均能量比較器計算兩路信號的短時平均能量E1(k)和E2(k),根據(jù)兩者之間的差異得到增益調(diào)整因子G1(k)。信號x1(k)乘上增益因子G1(k)后得到的修正信號x1′(k),x1′(k)和x2(k)送入信號分離模塊。
計算短時平均能量和增益調(diào)整因子可以采取以下計算公式Ei(k)=1LΣn=k-L+1kx2i(n),(i=1,2)---(1.1)]]>
G1(k)=sqrt(E2(k)E1(k))---(1.2)]]>x1′(k)=G1(k)x1(k)---(1.3)]]>其中L表示計算短時平均能量時使用的塊長。
自適應(yīng)增益調(diào)整既可以只對一路信號進(jìn)行,也可以對兩路信號都進(jìn)行,這時增益因子的計算方法為Esum(k)=E1(k)+E2(k)(1.4)G1(k)=sqrt(Esum(k)E1(k))---(1.5)]]>G2(k)=sqrt(Esum(k)E2(k))---(1.6)]]>x1′(k)=G1(k)x1(k)---(1.7)]]>x2′(k)=G2(k)x2(k)---(1.8)]]>上式中,sqrt表示求平方根運(yùn)算。
(二)信號分離模塊如圖4所示,該模塊的輸入信號為麥克對MIC A和MIC B采集到的含噪語音信號經(jīng)麥克校正模塊進(jìn)行麥克校正后得到的含噪語音信號x1′(k)和x2′(k)。該信號分離模塊的輸出為s(k)和n(k),其中,s(k)主要包含來自麥克正前方的有效語音信號,n(k)主要包含來自麥克后方和側(cè)面的噪聲信號。
信號分離模塊的核心是波束形成(beamforming)技術(shù)。該技術(shù)是麥克陣列信號處理(Microphone array signal processing)理論的重要一環(huán)。它是一種空間濾波方法,是利用信號源的不同位置來區(qū)分不同類型的信號,這種技術(shù)在“B.Michael,W.Darren,Microphone Arrays-signal processing techniques andapplications,Springer-Verlag publishing group,2001”中公開。
下面以使用兩個背靠背模式(back-to-back mode)的無指向性麥克實(shí)現(xiàn)一階差分麥克陣列技術(shù)為例說明該信號分離模塊。
如圖5所示,f(k)為前置麥克采集的信號,b(k)為后置麥克采集的信號。以下重點(diǎn)說明一階差分麥克陣列技術(shù),這里假設(shè)麥克具有足夠好的匹配性,或者已做過麥克校正。f(k)減去b(k)的延時信號得到s(k),b(k)減去f(k)的延時信號得到n(k)。即s(k)=f(k)-b(k-t0) (2.1)n(k)=b(k)-f(k-t1) (2.2)
設(shè)麥克之間的距離為d,聲速為c。
則聲音到達(dá)兩個麥克之間的最大時差(聲音從正前或正后方入射時產(chǎn)生的)為τ=dc---(2.3)]]>取t0和t1為0~τ之間的數(shù)值,可以實(shí)現(xiàn)不同的麥克指向性(polar-type)這在“Brian Csermak,A Primer on a Dual Microphone Directional System”,TheHearing Review,January 2000,Vol.7,No.1,pages 56,58 & 60公開。如t0和t1均取為τ,則構(gòu)成了兩個背靠背的心形指向性麥克。即s(k)主要包含來自MIC正前方的信號,n(k)主要包含來自MIC正后方的信號。以下均以此為例說明,但t0和t1也可取其它值,實(shí)現(xiàn)諸如超心形等不同指向性。
如前所述,手機(jī)等移動通信設(shè)備的工業(yè)設(shè)計方案要求兩個麥克之間的距離應(yīng)非常近,以符合設(shè)備小型化的要求。而在d很小時,d/c會小于采樣周期,引入分?jǐn)?shù)延時的問題。如采樣率為8k時,與一個樣本點(diǎn)的采樣時間對應(yīng)的聲音傳輸距離為d′=cT=340m/s·18000s=42.5mm---(3)]]>因此當(dāng)d為1cm左右時,如果信號的采樣率為語音通信中通常使用的采樣率8k、16k,則將信號延時 意味著需要將信號延時分?jǐn)?shù)個(<1,如0.3個)樣本點(diǎn)。
分?jǐn)?shù)延時的基本概念和常見的實(shí)現(xiàn)方法在V.Valimaki and T.I.Laakso,Principles o fractional delay filters.ICASSP 2000中有記載。
本發(fā)明利用”P.P.Vaidyanathan,Multirate systems and filter banks,PrenticHall”中公開的多抽樣率信號處理技術(shù)實(shí)現(xiàn)分?jǐn)?shù)延時,其不同于普通的插值濾波器方法,信號采樣率較低時該方法仍具有實(shí)用性,且運(yùn)算量也較小。下面具體說明分?jǐn)?shù)延時方法設(shè)信號的采樣率為f0Hz,則采樣周期為T=1f0(s)---(4.1)]]>圖6給出了采用將信號f(k)延時 的分?jǐn)?shù)延時模塊的框圖,其中N、M均為自然數(shù),且M<N。首先通過N倍上采樣器對信號f(k)的任意兩點(diǎn)之間插入N-1個零,得到N倍上采樣后的信號f1(k);而后經(jīng)過低通濾波器H2(k),濾去因上采樣引入的鏡像頻率成分,將信號的帶寬限制在輸入信號帶寬f0/2之內(nèi);而后經(jīng)延時器將低通濾波器的輸出信號w1(k)延時M點(diǎn)得到信號w2(k);最后經(jīng)N倍下采樣器對信號w2(k)進(jìn)行N倍抽取,得到輸出信號f′(k)。在低通濾波器H2(k)是理想的情況下,忽略其引入的延遲,可得f′(k)=f(k-MN)---(4.2)]]>即f′(k)為信號f(k)延時 點(diǎn)后得到的信號。利用圖6所示的分?jǐn)?shù)延時模塊可以由f(k)得到經(jīng)延長分?jǐn)?shù)時間t1后的f(k-t1),以及由b(k)得到經(jīng)延長分?jǐn)?shù)時間t0后的b(k-t0),從而經(jīng)圖5所示的信號分離模塊可以得到s(k)和n(k)。
(三)線性后濾波模塊圖4中,信號分離模塊的輸出s(k)的主要成分為來自正前方的語音信號,但同時也含有來自側(cè)面和后面的噪音信號,只是它們的幅度有所衰減。另一路輸出n(k)也同樣含有語音信號。
該線性后濾波模塊利用s(k)中含有的噪音信號與n(k)中含有的噪音信號的相關(guān)性進(jìn)一步去除s(k)中的噪聲成分,顯然兩個麥克中采集到的回聲信號也具有相關(guān)性,因此該模塊同時能起到消除回聲的作用。(此技術(shù)和現(xiàn)有技術(shù)是否相同呢?如果相同為什么本發(fā)明可以將回聲去掉而現(xiàn)有技術(shù)中則無法使用呢?)傳統(tǒng)方案中,線性后濾波模塊多采用一階自適應(yīng)濾波,目的并不是為了利用噪聲信號間的相關(guān)性去噪,而是為了實(shí)現(xiàn)不同的等效延時,取得自適應(yīng)指向性麥克的效果,參見Luo,J.Yang,C.Pavlovic and A.Nehorai,Adaptivenull-forming scheme in digital hearing aids,IEEE Trans.on Signal Processing,Vol.SP-50,pp.1583-1590,July 2002。傳統(tǒng)方案也可應(yīng)用于本發(fā)明。但是本發(fā)明的線性后濾波模塊不僅同樣可以達(dá)到傳統(tǒng)方案的效果,另外,還能有效提高輸出信號的信噪比,且采用受控多階自適應(yīng)濾波器,避免錯誤的濾除語音信號。
圖7給出了與單通道非線性語音增強(qiáng)模塊對應(yīng)的線性后濾波模塊的示意圖。信號分離模塊的輸出s(k)和n(k)送入能量比較器。該能量比較器比較二者的能量值,生成自適應(yīng)濾波器H3(k)的使能控制信號Adapt_en。該控制信號Adapt_en用來控制該自適應(yīng)濾波器是否進(jìn)行系數(shù)更新。自適應(yīng)濾波器的兩路輸入信號分別為n(k),s(k)的延時信號s′(k)。使用Adapt_en信號的目的是為了保證自適應(yīng)濾波器系數(shù)的調(diào)整是針對噪聲信號而非語音信號,即只有當(dāng)麥克接收到的信號中噪聲成分為主時才更新自適應(yīng)濾波器系數(shù)。一種簡單的產(chǎn)生Adapt_en控制信號的方法描述如下利用一階遞推系統(tǒng)計算得到x1(k)和x2(k)的能量包絡(luò)之比X1_env(k)=α·X1_env(k-1)+(1-α)·x12(k)(5.1)X2_env(k)=α·X2_env(k-1)+(1-α)·x22(k)(5.2)ratio=X1_env(k)X2_env(k)---(5.3)]]>上式中,X1_env(k)和X2_env(k)分別為k時刻信號x1和信號x2的能量包絡(luò),α是小于1的平滑因子。
Adapt_en通過比較ratio(k)與閾值R0得到。
由于信號s(k)主要包含前方的目標(biāo)語音信號,n(k)主要包含來自后方的噪聲信號,因此上述方法能保證自適應(yīng)濾波器的更新主要針對噪聲信號進(jìn)行。
圖7中,將信號s(k)延時T是為了保證自適應(yīng)濾波器的因果性。為了準(zhǔn)確地控制延時T的取值,達(dá)到既保證自適應(yīng)濾波系統(tǒng)的因果性,又不引入不必要的系統(tǒng)延時的目的,本發(fā)明中自適應(yīng)濾波器采用L(L>1)階線性相位自適應(yīng)濾波器,對應(yīng)的延時T取為L/2點(diǎn)(參考C.F.N.Cowan and P.M.Grant,Adaptive filters,Prentice Hall,1985)。
圖7中,自適應(yīng)濾波器的輸出只有一路信號以目標(biāo)語音信號為主要成分的信號e_s(k),e_s(k)經(jīng)過非線性語音增強(qiáng)模塊后得到最終的輸出。而雙通道非線性語音增強(qiáng)模塊需要兩路輸入信號(參考I.Cohen,Two-channel signaldetection and speech enhancement based on the transient beam-to-reference ratio,ICASSP 2003),與此對應(yīng),線性后濾波模塊采用圖8所示的雙通道輸出模式。兩路輸出中,e_s(k)中主要含目標(biāo)語音信號,e_n(k)中主要含噪聲信號。其中兩個通路的自適應(yīng)濾波器結(jié)構(gòu)一致,只是輸入信號和參考信號互換,控制信號互為反相信號,即某一時刻只有一個自適應(yīng)濾波器進(jìn)行系數(shù)更新。
(四)非線性語音增強(qiáng)模塊非線性語音增強(qiáng)模塊利用語音信號與普通噪聲信號在時頻域上的區(qū)別進(jìn)行語音增強(qiáng)。它的基本理論基礎(chǔ)是譜減法,該方法在I.Cohen and B.Berdugo,Speech enhancement for non-stationary noise environments,signal processing,vol.81,No.11,pp 2403-2418,2001中有記載。
一般的非線性語音增強(qiáng)模塊中都含有語音出現(xiàn)概率判決模塊,用于判定當(dāng)前含噪語音信號中語音信號出現(xiàn)的概率。非線性語音增強(qiáng)模塊包括單通道非線性語音增強(qiáng)模塊和雙通道非線性語音增強(qiáng)模塊。單通道非線性語音增強(qiáng)模塊采用單通道非線性語音增強(qiáng)算法,其根據(jù)一路輸入信號e_s(k)作出概率判決。雙通道非線性語音增強(qiáng)模塊采用雙通道非線性語音增強(qiáng)算法,其需要兩路輸入信號,一路以目標(biāo)目標(biāo)語音信號成分為主,一路以噪聲成分為主。由于該模塊位于線性后濾波器模塊之后,所以要求線性后濾波模塊采用圖8的雙通道模式。
當(dāng)非線性語音增強(qiáng)模塊采用單通道非線性語音增強(qiáng)模塊時,當(dāng)該通道中信號信噪比較低或噪聲信號為非平穩(wěn)信號且能量與語音信號能量近似時,語音出現(xiàn)概率判決模塊很難做出正確的判決,從而在減少噪聲幅度的同時損害了語音的自然度。而使用雙通道非線性語音增強(qiáng)模塊時,由于一個通道以目標(biāo)語音信號為主,另一個通道以噪聲信號為主,則直接比較兩個通道的能量強(qiáng)弱,可以更為準(zhǔn)確的判斷語音出現(xiàn)概率,從而能夠克服單通道非線性語音增強(qiáng)模塊的缺點(diǎn),但系統(tǒng)的復(fù)雜度有所增加。
圖9A給出了本發(fā)明實(shí)現(xiàn)語音增強(qiáng)的方法的一個具體實(shí)施例的流程圖。如圖9A所示,該方法用于對小型移動通信設(shè)備的麥克A和麥克B分別采集的輸入信號x1(k)和x2(k)進(jìn)行處理,包括如下步驟1)信號分離采用波束形成技術(shù),利用目標(biāo)語音信號源和噪聲信號源在空間域上的差異進(jìn)行信號分離,得到語音信號為主的信號s(k)和噪音信號為主的信號n(k);2)線性后濾波利用兩路信號中同類信號間存在的相關(guān)性,去除s(k)中的噪聲成分和n(k)中的語音成分,分別得到s′(k)和n′(k)。
上述步驟2)中的線性后濾波處理可以由線性相位或非線性相位自適應(yīng)濾波器來進(jìn)行,當(dāng)然,優(yōu)選是受控的線性相位或非線性相位自適應(yīng)濾波器。
為了使得到質(zhì)量更好的語音信號,在對信號x1(k)和x2(k)進(jìn)行信號分離前先進(jìn)行麥克校正,即根據(jù)兩個麥克接收到的信號x1(k)和x2(k)之間的差異對兩路信號進(jìn)行增益調(diào)整。下面給出兩種麥克校正方法(1)采用固定自適應(yīng)濾波器的方法如圖3A所示,自適應(yīng)濾波器h(k)的兩路輸入信號分別為兩個麥克MICA和MIC B接收到的信號x1(k)和x2(k)。如果自適應(yīng)濾波器的輸出e(k)的能量低于一個設(shè)定的閾值,則將此時自適應(yīng)濾波器h(k)的系數(shù)作為補(bǔ)償濾波器的系數(shù)。
校正過程如圖3B所示,經(jīng)補(bǔ)償濾波器H1(k)校正后,得到信號x1′(k)。
其中,圖3A中的自適應(yīng)濾波器的系數(shù)更新算法可以采用NLMS和BNLMS等算法。
這種方法實(shí)現(xiàn)簡單,可以根據(jù)需要隨時修正補(bǔ)償濾波器系數(shù)。
(2)基于能量的自適應(yīng)增益均衡方法如圖3C所示,計算兩個麥克MIC A和MIC B接收到的信號x1(k)和x2(k)的短時平均能量E1(k)和E2(k),根據(jù)兩者之間的差異得到增益調(diào)整因子G1(k)。信號x1(k)乘上增益調(diào)整因子G1(k)后得到的校正信號x1′(k)。
計算短時平均能量和增益調(diào)整因子可以采取以下計算公式Ei(k)=1LΣn=k-L+1kx2i(n),(i=1,2)---(1.1)]]>G1(k)=sqrt(E2(k)E1(k))---(1.2)]]>x1′(k)=G1(k)x1(k)---(1.3)]]>其中L表示計算短時平均能量時使用的塊長。
自適應(yīng)增益調(diào)整既可以只對一路信號進(jìn)行,也可以對兩路信號都進(jìn)行,這時增益因子的計算方法為Esum(k)=E1(k)+E2(k) (1.4)G1(k)=sqrt(Esum(k)E1(k))---(1.5)]]>G2(k)=sqrt(Esum(k)E2(k))---(1.6)]]>x1′(k)=G1(k)x1(k)---(1.7)]]>
x2′(k)=G2(k)x2(k)---(1.8)]]>上式中,sqrt表示求平方根運(yùn)算。
為了進(jìn)一步使輸出語音信號的質(zhì)量得到提高,對上述經(jīng)線性后濾波后所輸出的信號s′(k)和n′(k)進(jìn)行非線性語音增強(qiáng)處理,即利用語音信號和噪聲信號在時頻域上的區(qū)別去除帶噪語音信號中的噪聲成分。其中,當(dāng)采用雙通道非線性語音增強(qiáng)處理時,則相應(yīng)地在線性后濾波步驟中采用兩個自適應(yīng)濾波器進(jìn)行濾波輸出s′(k)和n′(k);當(dāng)采用單通道非線性語音增強(qiáng)處理時,則相應(yīng)地在線性后濾波步驟中采用單個自適應(yīng)濾波器進(jìn)行濾波輸出s′(k)。
在上述信號分離步驟中,可以采用帶分?jǐn)?shù)延時的一階差分麥克在空間域進(jìn)行信號分離,所述分?jǐn)?shù)延時采用多抽樣率信號處理技術(shù)來實(shí)現(xiàn)。具體地,如圖10所示,首先對信號f(k)的任意兩點(diǎn)之間插入N-1個零,得到N倍上采樣后的信號f1(k);而后經(jīng)過低通濾波,濾去因上采樣引入的鏡像頻率成分,將信號的帶寬限制在輸入信號的有效帶寬之內(nèi);而后將經(jīng)低通濾波后的輸出信號w1(k)延時M點(diǎn)得到信號w2(k);最后對信號w2(k)進(jìn)行N倍抽取,得到輸出信號f′(k)。在低通濾波為理想的情況下,忽略其引入的延遲,可得f′(k)=f(k-MN)---(4.2)]]>即f′(k)為信號f(k)延時 點(diǎn)后得到的信號,其中N、M均為自然數(shù),且M<N。
另外,為了進(jìn)一步提高輸出的語音質(zhì)量,對經(jīng)線性后濾波處理后的輸出信號s′(k)和n′(k)進(jìn)行抑制殘余回波的處理,輸出信號y(k),如圖9B所示。
還有,為了進(jìn)一步提高輸出的語音質(zhì)量,對經(jīng)非線性語音增強(qiáng)處理后的輸出信號z(k),根據(jù)其幅度值自動調(diào)整輸出放大器的增益,保證即使輸出信號z(k)的能量忽強(qiáng)忽弱,經(jīng)自動增益調(diào)整后的輸出信號z′(k)的能量保持比較平穩(wěn),如圖9B所示。其中,利用本發(fā)明的上述方法,可以去除背景人聲和背景音樂等用單通道語音增強(qiáng)算法難以去除的噪聲信號,在信噪比極低的通話條件下仍能取得很好的去噪效果。而且使用兩個靠得很近的普通無指向性MIC可以節(jié)約實(shí)現(xiàn)成本,符合移動設(shè)備小型化的要求。
工業(yè)應(yīng)用性本發(fā)明可以應(yīng)用于手機(jī)等小型移動通信設(shè)備上,能有效地消除環(huán)境噪聲和回聲,降低成本,減少功耗。
上述內(nèi)容并非用來限制本發(fā)明,凡根據(jù)本發(fā)明的主要構(gòu)思而進(jìn)行的修改和變動或組合,均應(yīng)屬于本發(fā)明所要求的保護(hù)范圍。
權(quán)利要求
1.一種適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)方法,其用于對小型移動通信設(shè)備的雙麥克所采集的輸入信號x1(k)和x2(k)進(jìn)行處理,其特征在于,1)采用波束形成技術(shù),利用目標(biāo)語音信號源和噪聲信號源在空間域上的差異進(jìn)行信號分離,得到語音信號為主的信號s(k)和噪音信號為主的信號n(k);2)利用兩路信號中同類信號間存在的相關(guān)性,去除s(k)中的噪聲成分和n(k)中的語音成分,分別得到s′(k)和n′(k),或只對s(k)進(jìn)行去除噪聲成分處理,得到s′(k)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述步驟1)之前還有一步驟1A),根據(jù)兩個麥克接收到的信號x1(k)和x2(k)之間的差異對兩路信號進(jìn)行增益調(diào)整。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述步驟1A),將信號x1(k)和x2(k)輸入自適應(yīng)濾波器,當(dāng)自適應(yīng)濾波器輸出的能量低于一設(shè)定的閾值時,將這時的自適應(yīng)濾波器的系數(shù)作為補(bǔ)償濾波器的系數(shù),信號x1(k)經(jīng)補(bǔ)償濾波器處理后得到x1′(k)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,在所述步驟1A),所述自適應(yīng)濾波器的系數(shù)更新采用NLMS或BNLMS等算法。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述步驟1A),計算兩路信號x1(k)和x2(k)的短時平均能量E1(k)和E2(k),根據(jù)兩者之間的差異得到增益調(diào)整因子,來對信號x1(k)和x2(k)或二者中之一進(jìn)行修正。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述步驟2),利用自適應(yīng)濾波器消除s(k)中的噪聲,噪聲n(k)中的語音。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,在所述步驟2),所述自適應(yīng)濾波器是線性相位或非線性相位自適應(yīng)濾波器。
8.根據(jù)權(quán)利要求6或7所述的方法,其特征在于,在所述步驟2),所述自適應(yīng)濾波器是受控自適應(yīng)濾波器。
9.根據(jù)權(quán)利要求1-8中之一所述的方法,其特征在于,還包括如下步驟3)利用語音信號和噪聲信號在時頻域上的區(qū)別去除帶噪語音信號中的噪聲成分,并輸出給輸出放大器。
10.根據(jù)根據(jù)權(quán)利要求9所述的方法,其特征在于,當(dāng)在步驟3)中采用雙通道輸出時,相應(yīng)地,在步驟2)中采用兩個自適應(yīng)濾波器分別對s(k)和n(k)進(jìn)行濾波。
11.根據(jù)根據(jù)權(quán)利要求9所述的方法,其特征在于,當(dāng)在步驟3)中采用單通道輸出時,相應(yīng)地,在步驟2)中采用單個自適應(yīng)濾波器對s(k)進(jìn)行濾波。
12.根據(jù)權(quán)利要求1-11中之一所述的方法,其特征在于,所用的麥克為普通無指向性麥克。
13.根據(jù)權(quán)利要求1-12中之一所述的方法,其特征在于,在所述步驟1),利用帶分?jǐn)?shù)延時的一階差分麥克在空間域進(jìn)行信號分離,所述分?jǐn)?shù)延時采用多抽樣率信號處理技術(shù)來實(shí)現(xiàn)。
14.根據(jù)權(quán)利要求13所述的方法,其特征在于,在所述步驟1),對信號f(k)的任意兩點(diǎn)之間插入N-1個零,得到N倍上采樣后的信號f1(k);經(jīng)低通濾波濾去因上采樣引入的鏡像頻率成分;將低通濾波的輸出信號w1(k)延時M點(diǎn)得到信號w2(k);對信號w2(k)進(jìn)行N倍抽取,得到信號f(k)延時 點(diǎn)后得到的信號f′(k),其中N,M為正整數(shù),且M<N。
15.根據(jù)權(quán)利要求14所述的方法,其特征在于,在低通濾波為理想的情況下,忽略其引入的延遲,得到f′(k)=f(k-MN)]]>
16.根據(jù)權(quán)利要求1-15中之一所述的方法,其特征在于,在步驟2)之后還有一步驟2A)對在步驟2)中的輸出信號進(jìn)行抑制殘余回波的處理。
17.根據(jù)權(quán)利要求9-11中之一所述的方法,其特征在于,還包括如下步驟4)根據(jù)步驟3)中的輸出信號的幅度值自動調(diào)整輸出放大器的增益,保證即使步驟3)中的輸出信號的能量忽強(qiáng)忽弱,經(jīng)輸出放大器的輸出信號的能量也能保持比較平穩(wěn)。
18.一種適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)裝置,其用于對小型移動通信設(shè)備的兩個麥克采集的輸入信號x1(k)和x2(k)進(jìn)行處理,其特征在于,包括信號分離模塊,其接收信號x1(k)和x2(k),采用波束形成技術(shù),利用語音信號源和噪聲信號源在空間域上的差異進(jìn)行信號分離,得到語音信號為主的信號s(k)和噪音信號為主的信號n(k);線性后濾波模塊,其利用兩路信號中同類信號間存在的相關(guān)性,去除s(k)中的噪聲成分和n(k)中的語音成分,分別得到s′(k)和n′(k),或只對s(k)進(jìn)行去除噪聲成分處理,得到s′(k)。
19.根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述線性后濾波模塊為線性相位或非線性相位自適應(yīng)濾波器。
20.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述線性后濾波模塊為受控自適應(yīng)濾波器。
21.根據(jù)權(quán)利要求18所述的裝置,其特征在于,還包括麥克校正模塊,用于根據(jù)兩個麥克接收到的信號x1(k)和x2(k)之間的差異對兩路信號進(jìn)行增益調(diào)整。
22.根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述麥克校正模塊包括自適應(yīng)濾波器,其對兩個麥克接收到的信號x1(k)和x2(k)進(jìn)行自適應(yīng)處理,自適應(yīng)濾波器的輸出e(k)的能量低于一個設(shè)定的閾值;補(bǔ)償濾波器,其對麥克所接收到的信號進(jìn)行校正,然后將信號輸出給信號分離模塊,其中補(bǔ)償濾波器的系數(shù)為自適應(yīng)濾波器的輸出e(k)的能量低于一個設(shè)定的閾值時該自適應(yīng)濾波器的系數(shù)。
23.根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述麥克校正模塊包括平均能量計算器,其接收來自兩個麥克的信號x1(k)和x2(k),計算兩路信號的短時平均能量E1(k)和E2(k),根據(jù)兩者之間的差異得到增益調(diào)整因子;第一乘法器,其將兩麥克中一麥克的信號乘上增益因子后得到修正信號。
24.根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述麥克校正模塊包括平均能量計算器,其接收來自兩個麥克的信號x1(k)和x2(k),計算兩路信號的短時平均能量E1(k)和E2(k),根據(jù)兩者之間的差異得到增益調(diào)整因子;第一乘法器,其將一麥克的信號乘上增益調(diào)整因子后得到修正信號;第二乘法器,其將另一麥克的信號乘上增益調(diào)整因子后得到修正信號。
25.根據(jù)權(quán)利要求18-24中之一所述的裝置,其特征在于,還包括非線性語音增強(qiáng)模塊,其接收線性后濾波模塊的輸出信號,利用語音信號和噪聲信號在時頻域上的區(qū)別去除s′(k)中的噪聲成分,并輸出給輸出放大器。
26.根據(jù)權(quán)利要求25所述的裝置,其特征在于,當(dāng)所述非線性語音增強(qiáng)模塊為單通道語音增強(qiáng)模塊時,所述線性后濾波模塊采用單個自適應(yīng)濾波器,對s(k)進(jìn)行去除噪聲成分處理,得到s′(k)。
27.根據(jù)權(quán)利要求25所述的裝置,其特征在于,當(dāng)所述非線性語音增強(qiáng)模塊為雙通道語音增強(qiáng)模塊時,所述線性后濾波模塊采用兩個自適應(yīng)濾波器,分別用來去除s(k)中的噪聲成分和n(k)中的語音成分,分別得到s′(k)和n′(k)。
28.根據(jù)權(quán)利要求18-27中之一所述的裝置,其特征在于,還包括殘余回波抑制模塊,用于抑制所述線性后濾波模塊輸出信號中的殘余回波,然后將信號輸出給非線性語音增強(qiáng)模塊。
29.根據(jù)權(quán)利要求25-28中之一所述的裝置,其特征在于,還包括自動增益控制模塊,其接收非線性語音增強(qiáng)模塊輸出的信號,根據(jù)所接收到的信號的幅度值自動調(diào)整輸出放大器的增益,保證即使非線性語音增強(qiáng)模塊輸出信號的能量忽強(qiáng)忽弱,輸出放大器的輸出信號的能量也能保持比較平穩(wěn)。
30.根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述信號分離模塊利用帶分?jǐn)?shù)延時的一階差分麥克在空間域進(jìn)行信號分離。
31.根據(jù)權(quán)利要求30所述裝置,其特征在于,所述信號分離模塊包括分?jǐn)?shù)延時模塊,該分?jǐn)?shù)延時模塊對信號f(k)延時 其中N、M均為自然數(shù),且M<N,該分?jǐn)?shù)延時模塊包括N倍上采樣器,其對信號f(k)的任意兩點(diǎn)之間插入N-1個零,得到N倍上采樣后的信號f1(k);低通濾波器,其濾去因上采樣引入的鏡像頻率成分;延時器,其將低通濾波器的輸出信號w1(k)延時M點(diǎn)得到信號w2(k);N倍下采樣器,其對信號w2(k)進(jìn)行N倍抽取,得到輸出信號f′(k)。
32.根據(jù)權(quán)利要求31所述裝置,其特征在于,在低通濾波器是理想的情況下,忽略其引入的延遲,得到f′(k)=f(k-MN).]]>
全文摘要
本發(fā)明提供一種適用于小型移動通信設(shè)備的雙麥克語音增強(qiáng)方法及裝置,其用于對小型移動通信設(shè)備的雙麥克所采集的輸入信號x
文檔編號G10L21/02GK1809105SQ200610001158
公開日2006年7月26日 申請日期2006年1月13日 優(yōu)先權(quán)日2006年1月13日
發(fā)明者鄧昊, 馮宇紅, 林中松 申請人:北京中星微電子有限公司