專利名稱:用于減少麥克風(fēng)信號中的干擾噪聲信號部分的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種減少麥克風(fēng)信號中的干擾噪聲信號部分的方法。本發(fā)明還涉及一種用于減少麥克風(fēng)信號中的干擾噪聲信號部分的裝置。
背景技術(shù):
這樣的方法對于提高饋送到語音識別裝置或電信裝置的語音信號的質(zhì)量是特別重要的。來自電信部門的一個(gè)重要的應(yīng)用例子是免提裝置,現(xiàn)今法規(guī)規(guī)定其必須用于機(jī)動(dòng)車中的電話呼叫。借助于這樣的免提裝置,對于駕駛者來說,不必讓手離開方向盤,從而沒有讓眼睛離開公路就與遠(yuǎn)程會(huì)話方進(jìn)行通信是可能的。
免提裝置的例子可以用于清楚地說明主要區(qū)分的兩種干擾噪聲,以及構(gòu)成研究中的方法的目的是從發(fā)送到遠(yuǎn)程會(huì)話方的語音信號中消除這兩種噪聲。
首先存在來自一個(gè)或多個(gè)已知的聲源的干擾噪聲。在汽車中的免提裝置的情況中,例如噪聲是由免提裝置的揚(yáng)聲器產(chǎn)生的或者由音頻系統(tǒng)的揚(yáng)聲器產(chǎn)生的。如果例如由免提裝置的揚(yáng)聲器產(chǎn)生的遠(yuǎn)程會(huì)話方的語音信號到達(dá)麥克風(fēng)并且沒有從麥克風(fēng)信號中去除,那么遠(yuǎn)程會(huì)話方將聽到他自己聲音的回聲,并且這是讓人很不愉快的感覺。用于從麥克風(fēng)信號中去除這樣的干擾噪聲部分的方法麥克風(fēng)需要知道產(chǎn)生干擾噪聲的信號。在上述的例子中,產(chǎn)生干擾噪聲的信號是被饋送到免提裝置的揚(yáng)聲器的遠(yuǎn)程會(huì)話方的語音信號。例如在EP0948237A2和DE4106405A1中描述了這樣的方法。
第二種干擾噪聲包括其產(chǎn)生不被精確地意識到的并且其通常由不精確限定的大量噪聲源產(chǎn)生的噪聲。典型的環(huán)境噪聲屬于這種類型的干擾噪聲。如果再次考慮機(jī)動(dòng)車中的免提裝置的例子,汽車被驅(qū)動(dòng)的噪聲屬于這種類型的干擾噪聲。很多組用于減少這種類型的干擾噪聲的方法是基于根據(jù)麥克風(fēng)信號來估計(jì)干擾噪聲部分。例如使用譜減法,麥克風(fēng)信號中的干擾噪聲信號部分借助于該估計(jì)被減少。例如在US6363345B1中描述了該組方法中的一個(gè)方法。但是,從麥克風(fēng)信號中估計(jì)干擾噪聲部分提出了在麥克風(fēng)信號內(nèi)那些噪聲部分中僅存在一個(gè)干擾噪聲信號部分并且無用的信號部分必須被檢測的問題。在機(jī)動(dòng)車中的免提裝置的情況中,諸如包含非語音信號部分的信號部分將在麥克風(fēng)信號中。只要這樣的信號部分存在,一個(gè)額外的信號處理步驟,所謂的話音活動(dòng)檢測(VAD)必須檢測這些信號部分。然而,VAD通常僅提供不可靠的結(jié)果,特別是在麥克風(fēng)信號中的很差的信噪比(SNR)的情況下。此外,必須假定在沒有語音信號的部分中估計(jì)的干擾噪聲信號在隨后的時(shí)間點(diǎn)上也是有效的。然而,該假定僅表現(xiàn)出一個(gè)不充分的近似值,特別是在與長語音信號部分結(jié)合隨時(shí)間快速改變的干擾噪聲的情況下。
發(fā)明內(nèi)容
因此本發(fā)明的目的是規(guī)定一種用于減少麥克風(fēng)信號中的干擾噪聲信號部分的方法,該方法以較低的信號處理費(fèi)用允許良好地估計(jì)干擾噪聲信號部分,從而較好地減少在麥克風(fēng)信號中的干擾噪聲信號部分。
上述目的是根據(jù)本發(fā)明通過包括權(quán)利要求1中要求的步驟的方法來實(shí)現(xiàn)的。從屬權(quán)利要求包含了權(quán)利要求1中要求的方法的有利的改進(jìn)和發(fā)展。
根據(jù)本發(fā)明的方法,用作估計(jì)感興趣的麥克風(fēng)信號中的干擾噪聲信號部分的干擾噪聲參照信號或多個(gè)干擾噪聲參照信號借助于每種情況中的一個(gè)逆向操作的揚(yáng)聲器來確定,也就是說借助于用作麥克風(fēng)的揚(yáng)聲器來確定。
該揚(yáng)聲器被適當(dāng)放置,以便在相關(guān)的干擾噪聲參照信號中的來自干擾噪聲源的信號部分至少與來自語音信號源的信號部分一樣高。如果信號處理中通常的單位SNR被使用,并且如果來自語音信號源的信號部分在該范圍內(nèi)被識別為信號,并且來自干擾噪聲源的信號部分被識別為噪聲,那么這相當(dāng)于SNR小于或等于零。關(guān)聯(lián)的干擾噪聲參照信號中的來自干擾噪聲源的信號部分最好正好兩倍于來自語音信號源的信號部分,并且這相當(dāng)于大約-6的SNR。通過以這種方式放置揚(yáng)聲器,關(guān)于可以從揚(yáng)聲器信號獲得的干擾噪聲信號部分的信息只被語音信號部分竄改了少量的范圍。在根據(jù)本發(fā)明的方法中,不需要安裝另外的麥克風(fēng),在已經(jīng)有一個(gè)或多個(gè)揚(yáng)聲器用作音頻系統(tǒng)的部件的情況下更是如此。
來自揚(yáng)聲器信號的干擾噪聲信號部分的估計(jì)也被稱為干擾噪聲參照信號,其在一個(gè)或兩個(gè)步驟中作為是只有一個(gè)還是多個(gè)這樣的信號的函數(shù)被確定。如果只有一個(gè)可用的干擾噪聲參照信號,例如循環(huán)噪聲估計(jì)的信號估計(jì)理論的方法被應(yīng)用于該信號,從而干擾噪聲信號部分的估計(jì)被直接確定。在多于一個(gè)干擾噪聲參照信號的情況下,在第一步驟中,例如循環(huán)噪聲估計(jì)的信號估計(jì)理論方法被應(yīng)用于這些信號中的每一個(gè),從而在每個(gè)情況中干擾噪聲信號部分的臨時(shí)估計(jì)被確定。在第二步驟中,這些干擾噪聲信號部分的臨時(shí)估計(jì)接著通過線性疊加被組合,因此最終獲得需要的干擾噪聲信號部分的估計(jì)。線性疊加最好這樣執(zhí)行使得首先干擾噪聲信號部分的臨時(shí)估計(jì)與在每種情況中的一個(gè)加權(quán)因數(shù)相乘,然后將從而獲得的干擾噪聲信號部分的加權(quán)臨時(shí)估計(jì)求和。加權(quán)因數(shù)反映了相應(yīng)的揚(yáng)聲器信號的傳輸信道特性。在定性的條件下可以說,揚(yáng)聲器距離語音信號源放置地越遠(yuǎn),揚(yáng)聲器中的語音信號的衰減越大,從而關(guān)聯(lián)的加權(quán)因數(shù)越大。
一旦干擾噪聲信號部分的估計(jì)被確定,其例如通過使用最佳濾波而從麥克風(fēng)信號中減除,因此凈化了麥克風(fēng)信號,也就是說最終獲得減去了干擾噪聲信號部分的麥克風(fēng)信號。在最佳濾波的方法中,通常所說的最佳濾波器或維納濾波器的濾波器頻率響應(yīng),根據(jù)干擾噪聲信號部分的估計(jì)和麥克風(fēng)信號被計(jì)算,并且通過應(yīng)用該濾波器到麥克風(fēng)信號來將干擾噪聲信號部分從麥克風(fēng)信號中減除。這可以發(fā)生在時(shí)域和頻域兩者中。用于從麥克風(fēng)信號中減除干擾噪聲信號部分的更多的方法例如是譜減法和非線性譜減法。
在根據(jù)本發(fā)明方法的另一改進(jìn)中,除揚(yáng)聲器接收的干擾噪聲參照信號和從其中得到的在下文中稱為第一估計(jì)的干擾噪聲信號部分的估計(jì)之外,麥克風(fēng)信號本身也用于確定干擾噪聲信號部分的第二估計(jì)。在進(jìn)一步的步驟中,第一和第二估計(jì)接著通過線性疊加被組合,正如存在多個(gè)干擾噪聲參照信號時(shí)的臨時(shí)估計(jì)一樣,并且從而確定需要的干擾噪聲信號部分的估計(jì)。
對于使用本發(fā)明的方法獲得的干凈的麥克風(fēng)信號的各種各樣的用途是可以想象的。例如,它可以被饋送到電信裝置并且從而傳送到遠(yuǎn)程會(huì)話方,因此對于所述的會(huì)話方來說接收的語音信號的質(zhì)量增加了。在進(jìn)一步的用途中,干凈的麥克風(fēng)信號可以被饋送到語音識別裝置,因此該系統(tǒng)的識別能力增加了。
在根據(jù)本發(fā)明方法的另一改進(jìn)中,麥克風(fēng)信號和至少一個(gè)干擾噪聲參照信號在例如機(jī)動(dòng)車的運(yùn)輸工具中被接收,并且使用的揚(yáng)聲器構(gòu)成已經(jīng)存在的揚(yáng)聲器系統(tǒng)的一部分。這尤其在機(jī)動(dòng)車中特別有利,因?yàn)樵谶@種情況中的揚(yáng)聲器被通常這樣放置使得由它接收的信號中的干擾噪聲信號部分至少與來自坐在駕駛者位置的說話者的語音信號部分一樣高。
本發(fā)明還涉及一種用于執(zhí)行權(quán)利要求1中要求的方法的裝置。該裝置包括信號處理器,在該信號處理器上執(zhí)行確定干擾噪聲信號部分的估計(jì)以及從麥克風(fēng)信號中減除該估計(jì)。該裝置還包括至少一個(gè)耦合到信號處理器的麥克風(fēng)。該耦合例如可以通過有線或無線方式實(shí)現(xiàn),并且用于麥克風(fēng)信號模/數(shù)轉(zhuǎn)換麥克風(fēng)的所謂的編解碼器通常連接在中間。該裝置同樣包括至少一個(gè)揚(yáng)聲器,其用作一個(gè)麥克風(fēng)并且同樣耦合到信號處理器。在該情況中,該耦合也可以例如通過有線或無線方式實(shí)現(xiàn),并且用于揚(yáng)聲器信號模/數(shù)轉(zhuǎn)換的編解碼器可以連接在中間。除屬于本發(fā)明方法的處理步驟之外,更多的數(shù)據(jù)處理步驟也可以在信號處理器上執(zhí)行。信號處理器也可以特別構(gòu)成現(xiàn)存的數(shù)據(jù)處理裝置的一部分并且另外地用于本發(fā)明的方法。
附圖簡述將參照附圖中示出的實(shí)施例的具體例子進(jìn)一步描述本發(fā)明,然而,本發(fā)明不限制于此。
圖1示出說明根據(jù)本發(fā)明方法的方框圖。
圖2示出說明確定干擾噪聲信號部分的臨時(shí)估計(jì)的流程圖。
圖3示出說明將干擾噪聲信號部分的臨時(shí)估計(jì)組合用于確定干擾噪聲信號部分的估計(jì)的流程圖。
圖4示出說明從麥克風(fēng)信號中減除干擾噪聲信號部分的估計(jì)的流程圖。
具體實(shí)施例方式
圖1示出用于執(zhí)行本發(fā)明方法的裝置的方框圖。一個(gè)麥克風(fēng)信號x,其將使用本發(fā)明的方法被除去干擾噪聲信號部分,其使用麥克風(fēng)101被記錄并且被饋送到減除單元501,減除單元501從該麥克風(fēng)信號中減除干擾噪聲信號部分的估計(jì)。揚(yáng)聲器201、202和203以已知方式用作麥克風(fēng)并且被用于記錄干擾噪聲參照信號x1、x2和x3。通過舉例的方式選擇三個(gè)揚(yáng)聲器,從而三個(gè)干擾噪聲參照信號決不是必須的。而是,基于至少一個(gè)揚(yáng)聲器以及一個(gè)干擾噪聲參照信號,該數(shù)目可以是隨意的并且至多由得到的信號處理費(fèi)用來限制。然后三個(gè)干擾噪聲參照信號x1、x2和x3分別被提供到估計(jì)單元301、302和303。在這些估計(jì)單元中,在每一情況中確定干擾噪聲信號部分的臨時(shí)估計(jì)。這些干擾噪聲信號部分的臨時(shí)估計(jì)在圖1中被標(biāo)識為N1、N2和N3,隨后被饋送到組合單元401。這個(gè)組合單元401組合干擾噪聲信號部分的臨時(shí)估計(jì)并且從而確定干擾噪聲信號部分的估計(jì),其在圖1中被標(biāo)識為N。干擾噪聲信號部分的這個(gè)估計(jì)接著作為第二輸入信號與麥克風(fēng)信號一起被饋送到減除單元501。在減除單元501中,從麥克風(fēng)信號中減除干擾噪聲信號部分的估計(jì)麥克風(fēng)并從而確定一個(gè)干凈的信號x’。
圖2示出說明估計(jì)單元301的操作模式的流程圖。在估計(jì)單元301中,從借助于揚(yáng)聲器201所接收的信號x1計(jì)算干擾噪聲信號部分N1的臨時(shí)估計(jì)。估計(jì)單元302和303的操作模式因此是相等的。首先,信號x1借助于模/數(shù)轉(zhuǎn)換310以采樣率8kHz被數(shù)字化。此后,借助于所謂的成幀311形成信號x1的M個(gè)數(shù)字采樣值的塊。該塊由先前塊的最后M-B個(gè)采樣值和信號x1的最后B個(gè)當(dāng)前采樣值組成。信號處理從而發(fā)生在包括重疊了M-B個(gè)采樣值的M個(gè)采樣值的連續(xù)塊中,其中在每個(gè)情況中B個(gè)當(dāng)前采樣值被處理。如果M=256并且B=128被選擇,那么以采樣率8kHz,一個(gè)塊相應(yīng)于32毫秒的時(shí)間期間并且連續(xù)塊重疊16毫秒,也就是說50%。在隨后的窗口化312中,M個(gè)采樣值的塊乘以窗口函數(shù)的函數(shù)值,例如漢明函數(shù),以便到頻域的在下一個(gè)轉(zhuǎn)變減少由于成幀的破壞影響。然后借助于離散傅立葉變換313將以這種方式確定的該“窗口化的”采樣值變換到頻域。在下一處理步驟314中,形成M個(gè)復(fù)傅立葉系數(shù)的絕對平方,給出功率譜P1(f,i)。這里,f是頻率并且i是當(dāng)前塊的索引,其通過塊長度和采樣率與時(shí)間有關(guān)。接著借助于根據(jù)公式N1(f,i)=α·N1(f,i-1)+(1-α)·P1(f,i)的遞歸平滑315平滑功率譜,該公式給出頻域中的干擾噪聲信號部分的臨時(shí)估計(jì)N1(f,i)。該平滑濾波系數(shù)α是該方法的必須被最佳化的參數(shù)。典型的α值例如是0.99。在這點(diǎn)上應(yīng)該注意,干擾噪聲信號部分的臨時(shí)估計(jì)的確定不是必須發(fā)生在頻域。相反地,在時(shí)域中實(shí)現(xiàn)也是可能的。
圖3示出說明組合單元401的操作模式的流程圖。已經(jīng)以上述方式在估計(jì)單元301、302和303中確定的干擾噪聲信號部分的臨時(shí)估計(jì)N1、N2和N3首先在每種情況中乘以加權(quán)因數(shù)β1、β2和β3。這些加權(quán)因數(shù)也是根據(jù)本發(fā)明的方法的需要最佳化的參數(shù),并且它們反映了相應(yīng)的揚(yáng)聲器信號的傳輸信道特性。在定性的條件中可以說,揚(yáng)聲器放置得距離語音信號源越遠(yuǎn),該揚(yáng)聲器中的語音信號的衰減越大,從而關(guān)聯(lián)的加權(quán)因數(shù)β越大。一旦所有的干擾噪聲信號部分的臨時(shí)估計(jì)都已經(jīng)與他們各自的加權(quán)因數(shù)相乘,干擾噪聲信號部分的估計(jì)N作為這些乘積的總和被給出N(f,i)=Σkβk·Nk(f,i).]]>應(yīng)該注意,在只有一個(gè)揚(yáng)聲器并且從而只有一個(gè)干擾噪聲參照信號的情況中,估計(jì)單元401內(nèi)的處理步驟被省略并且干擾噪聲信號部分的臨時(shí)估計(jì)N1(f,i)等于干擾噪聲信號部分的估計(jì)N(f,i)。
圖4使用流程圖來說明減除單元501的操作模式,其中執(zhí)行根據(jù)本發(fā)明方法的最后步驟,即從麥克風(fēng)信號中減除干擾噪聲信號部分的估計(jì)。首先,麥克風(fēng)信號x,類似于圖2中的揚(yáng)聲器信號x1,經(jīng)模/數(shù)轉(zhuǎn)換510、成幀511、窗口化512、變換到頻域513以及計(jì)算作為復(fù)傅立葉系數(shù)的絕對平方的功率譜P(f,i)514。除功率譜之外,在處理步驟515中,復(fù)傅立葉系數(shù)X的相位(f,i)也被計(jì)算。接著借助于根據(jù)公式P′(f,i)=max{P(f,i)-a(f,i)·N(f,i),b·N(f,i)}的非線性譜減法516,從在組合單元401中確定的干擾噪聲信號部分的估計(jì)N(f,i)和麥克風(fēng)信號的功率譜P(f,i)計(jì)算一個(gè)干凈的功率譜P′(f,i)。這里,所謂的過估計(jì)因數(shù)a(f,i)和所謂的地面因數(shù)b是根據(jù)本發(fā)明方法的必須最佳化的參數(shù)。關(guān)于本方法的非線性譜減法,應(yīng)該參照Bouquin,R.L.的“有噪聲的語音信號的增強(qiáng)應(yīng)用于移動(dòng)無線通信”,語音通信,Vol.18,1996。在處理步驟517中,接著根據(jù)等式 從干凈的功率譜和以前計(jì)算的未改變的相位(f,i)計(jì)算一個(gè)干凈的復(fù)傅立葉系數(shù)的頻譜X′(f,i)。最后,麥克風(fēng)根據(jù)所謂的重疊相加方法,按照逆傅立葉變換518和與成幀相逆的過程519,從干凈的頻譜獲得干凈的麥克風(fēng)信號x’。在這點(diǎn)上,同樣應(yīng)注意,不是必須選擇頻域中的減法方法,而時(shí)域中的方法也是可能的。
權(quán)利要求
1.一種減少麥克風(fēng)信號中的干擾噪聲信號部分的方法,其中該麥克風(fēng)信號包含來自至少一個(gè)干擾噪聲源的干擾噪聲信號部分以及來自一個(gè)語音信號源的語音信號部分,所述方法包括下列步驟-接收含有該干擾噪聲信號部分和該語音信號部分的麥克風(fēng)信號,-借助于每種情況中的一個(gè)逆向操作的揚(yáng)聲器來接收至少一個(gè)干擾噪聲參照信號,其中該揚(yáng)聲器或多個(gè)揚(yáng)聲器被放置成使得各個(gè)干擾噪聲參照信號中來自干擾噪聲源的信號部分至少與該干擾噪聲參照信號中來自語音信號源的信號部分一樣高,-在只有一個(gè)干擾噪聲參照信號的情況下,使用信號估計(jì)理論的方法從干擾噪聲參照信號中確定干擾噪聲信號部分的估計(jì),-在多于一個(gè)干擾噪聲參照信號的情況下,使用信號估計(jì)理論的方法從每個(gè)干擾噪聲參照信號確定每種情況中的干擾噪聲信號部分的一個(gè)臨時(shí)估計(jì),并且隨后通過組合干擾噪聲信號部分的這些臨時(shí)估計(jì)來確定麥克風(fēng)信號中的干擾噪聲信號部分的估計(jì),-通過從該麥克風(fēng)信號中減除干擾噪聲信號部分的估計(jì)來減少該麥克風(fēng)信號中的干擾噪聲信號部分。
2.根據(jù)權(quán)利要求1中要求的方法,其特征在于一個(gè)另外的方法步驟,除借助于至少一個(gè)干擾噪聲參照信號來確定干擾噪聲信號部分的第一估計(jì)之外,借助于該麥克風(fēng)信號本身來執(zhí)行干擾噪聲信號部分的第二估計(jì)的確定,并且從干擾噪聲信號部分的第一和第二估計(jì)的線性組合確定一個(gè)第三估計(jì),并且其特征在于通過從該麥克風(fēng)信號中減除這個(gè)估計(jì)來實(shí)現(xiàn)麥克風(fēng)信號中干擾噪聲信號部分的減少。
3.根據(jù)權(quán)利要求1中要求的方法,其特征在于在多于一個(gè)干擾噪聲參照信號的情況中,干擾噪聲信號部分的臨時(shí)估計(jì)的組合包括任一干擾噪聲信號部分的臨時(shí)估計(jì)與每種情況中的一個(gè)加權(quán)因數(shù)相乘,并且隨后將因此獲得的干擾噪聲信號部分的加權(quán)臨時(shí)估計(jì)求和。
4.根據(jù)權(quán)利要求1到3中任一個(gè)所要求的方法,其特征在于通過使用最佳濾波來執(zhí)行從該麥克風(fēng)信號中減除干擾噪聲信號部分的估計(jì)。
5.根據(jù)權(quán)利要求1到3中任一個(gè)所要求的方法,其特征在于通過使用譜減法的方法來執(zhí)行從該麥克風(fēng)信號中減除干擾噪聲信號部分的估計(jì)。
6.根據(jù)權(quán)利要求1到5中任一個(gè)所要求的方法,其特征在于減少了干擾噪聲信號部分的麥克風(fēng)信號被饋送到語音識別裝置。
7.根據(jù)權(quán)利要求1到5中任一個(gè)所要求的方法,其特征在于減少了干擾噪聲信號部分的麥克風(fēng)信號被饋送到一個(gè)電信裝置。
8.根據(jù)權(quán)利要求1到7中任一個(gè)所要求的方法,其特征在于該麥克風(fēng)信號和至少一個(gè)干擾噪聲參照信號在運(yùn)輸工具中被接收,并且所使用的揚(yáng)聲器或多個(gè)揚(yáng)聲器形成存在于該運(yùn)輸工具中的揚(yáng)聲器系統(tǒng)。
9.一種用于執(zhí)行權(quán)利要求1中要求的方法的裝置,其包括至少下列部件-一個(gè)信號處理器,用于確定該干擾噪聲信號部分的估計(jì)并且用于從該麥克風(fēng)信號中減除該估計(jì),-至少一個(gè)麥克風(fēng),其耦合到該信號處理器并且作為用于該麥克風(fēng)信號的接收器被提供,-至少一個(gè)揚(yáng)聲器,其耦合到該信號處理器并且作為用于該干擾噪聲參照信號的接收器被提供。
全文摘要
本發(fā)明涉及一種用于減少麥克風(fēng)信號中的干擾噪聲信號部分的方法,該方法基于從實(shí)際上純粹的干擾噪聲信號中估計(jì)干擾噪聲信號部分并且不需要任何另外的麥克風(fēng)。根據(jù)本發(fā)明方法的本質(zhì)特點(diǎn)在于,用作估計(jì)感興趣的麥克風(fēng)信號中的干擾噪聲信號部分的基礎(chǔ)的信號是借助于一個(gè)或多個(gè)逆向操作的揚(yáng)聲器來接收的。不需要安裝另外的麥克風(fēng),尤其在已經(jīng)有一個(gè)或多個(gè)揚(yáng)聲器作為音頻系統(tǒng)的部件的情況下。這樣的情況例如出現(xiàn)在裝配有音頻系統(tǒng)的任何機(jī)動(dòng)車中。
文檔編號H04R3/02GK1768555SQ200480009172
公開日2006年5月3日 申請日期2004年3月26日 優(yōu)先權(quán)日2003年4月8日
發(fā)明者M·利布 申請人:皇家飛利浦電子股份有限公司