用于抑制語音信號噪聲的方法和裝置的制作方法

文檔序號：2819409閱讀：419來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：用于抑制語音信號噪聲的方法和裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及用于尤其是受干擾語音信號的語音處理的一種方法和一種裝置。
近年來移動通信領(lǐng)域中的迅速的技術(shù)發(fā)展已導(dǎo)至對語音處理，尤其對語音編碼和抑制干擾噪聲的持續(xù)增高的要求，這尤其歸因于帶寬的越來越短缺和對語音質(zhì)量的持續(xù)增長的要求。
所述語音處理的主要組成部分在于，估算和必要時在輸入信號中抑制干擾信號或干擾噪聲，以便盡可能僅僅傳輸語音信號，例如由拾音器所拾取的語音信號通常伴有該干擾信號或干擾噪聲。不過在用于抑制干擾噪聲的通常的方法中，常常在背景信號中產(chǎn)生不受歡迎的人工因素(Artefakt)，也稱為音樂聲。
本發(fā)明的任務(wù)是說明一種用于語音處理的技術(shù)原理，該原理使以低的數(shù)據(jù)速率和高的質(zhì)量來傳輸語音成為可能。
通過獨立權(quán)利要求的所述特征來解決該任務(wù)。由從屬權(quán)利要求中產(chǎn)生有利的和合理的改進方案。
因此本發(fā)明首先基于以下思路，在通過低速率的語音編解碼器編碼之前，將伴有干擾信號的語音信號的頻率分量與時間上變化的與頻率有關(guān)的加權(quán)系數(shù)相乘，其中，將一個頻率分量與一個當(dāng)前的加權(quán)系數(shù)相乘，如果該當(dāng)前加權(quán)系數(shù)小于所述最后針對該頻率分量所計算出的加權(quán)系數(shù)，并且其中，將一個頻率分量與所述最后針對該頻率分量所計算出的加權(quán)系數(shù)相乘，如果該加權(quán)系數(shù)小于所述當(dāng)前的加權(quán)系數(shù)。人們在此將低速率的語音編解碼器尤其理解為一種提供數(shù)據(jù)速率小于每秒5kBit的語音編解碼器。
因此達到了如此來衰減加在語音信號上的干擾信號，使得在微小的計算工作量或存儲工作量的情況下可以用良好的質(zhì)量來傳輸語音。
本發(fā)明在此首先基于以下的認(rèn)識，只有當(dāng)盡可能避免或減少了-上面已闡述的-人工因素時，才可能在采用低速率的語音編解碼器時達到良好的語音質(zhì)量。這曾可以通過采用費事的本來為該目的所制定的模擬工具來識別。
此外本發(fā)明還基于以下的認(rèn)識，-正如也是費事的模擬所表明的那樣-通過專門采用當(dāng)前或最后計算的加權(quán)系數(shù)來減少背景信號中的，尤其是在語音間歇期間的人工因素。
最后也通過范圍廣泛的模擬已證實本發(fā)明的這種有利的作用，即用于抑制干擾噪聲的特殊方法與低速率的語音編解碼器相組合，該語音編解碼器尤其提供在每秒3kBit和每秒5kBit之間的數(shù)據(jù)速率。
在其它或從屬權(quán)利要求中，所闡述的改進方案、擴展方案和實施變型既包含在與所述方法的組合中，也包含在與本發(fā)明裝置的組合中。
以下借助優(yōu)選的實施例來詳述本發(fā)明，其中，包含在其中的特征也可以包含在基于本發(fā)明的其它的組合中。下列的附圖應(yīng)該用來闡述這些實施例

圖1為用于語音處理方法的簡化的方框電路圖；圖2為用于抑制干擾噪聲方法的流程圖；圖3為用于語音處理裝置的簡化的方框電路圖。
圖1展示了用于語音處理方法的方框電路圖。該方法可以粗略地劃分為共同起作用的方框抑制干擾噪聲和連接在其后的低速率語音編解碼器NSC。作為這種語音編解碼器的一種例如提供每秒4kBit數(shù)據(jù)速率的低速率語音編解碼器是公知的，因此在此不進一步敘述。
所述用于抑制干擾噪聲的方法可以細分為多個以下要闡述的功能塊。
方框分析AN和方框合成SY形成了所述用于抑制干擾噪聲的方法的框架。輸入信號在分析AN之前所進行的(圖中未示出的)分段，以及所采用的塊大小是如此來與所述的低速率語音編解碼器協(xié)調(diào)的，使得信號由于抑制干擾噪聲所引起的算法滯后保持盡可能小。輸入信號x(k)的分段，在8kHz的掃描速率時例如在20ms時的塊中進行。用規(guī)定的塊長度也可以逐段地來實現(xiàn)將所處理的數(shù)據(jù)轉(zhuǎn)交給語音編解碼器。
所述的分析AN在此可以包括窗口(Fensterung)、零填充(Zero-Padding)、和通過傅里葉變換來變換成頻率范圍，而所述的合成SY可以包括通過反傅里葉變換來反變換成時間范圍，以及按重疊相加(Overlap Add)法的信號重組。
來自分析AN的頻率分量具有一個實數(shù)部分和一個虛數(shù)部分，或具有一個幅度和一個相位。為了減小工作量，例如借助Bark表(Barktabelle)首先將相鄰的不同頻率分量的幅度匯總成頻率組FGZU1。
針對每個頻率組借助先驗和后驗的信噪比來執(zhí)行增益計算VB，該增益計算所得出的結(jié)果為各個頻率組的幅度的加權(quán)系數(shù)。從受干擾輸入信號的功率密度譜和先驗噪聲估算GS中可以導(dǎo)出所述的先驗信噪比。從受干擾輸入信號的功率密度譜和緩沖存儲器(Pufferung)P的輸出信號中可以計算出所述的后驗信噪比，又通過頻率組匯總FGZU2給該緩沖存儲器輸送匯總的已修正的頻率分量。
在分解FGZE事先匯總成頻率組的頻率分量之前，并在所述的頻率組與各自的用于抑制干擾噪聲的針對相應(yīng)頻率組所計算的加權(quán)系數(shù)相乘之前，所述的加權(quán)系數(shù)經(jīng)受所謂的最小濾波(Minimum-Filterung)MF，稍后將借助附圖2詳述該最小濾波。
因此為了估算干擾噪聲，主要進行對來自所述輸入信號的背景噪聲的功率密度的估算。為了降低所需要的計算功能以及存儲器占用，僅在少數(shù)的部分頻帶(Teilband)中執(zhí)行先驗噪聲估算、增益計算、暫存為了干擾信號抑制而修改的信號幅度、和最小濾波器(Minium-Filter)。為此，使用用于頻率組匯總的兩個方框，將被變換成頻率范圍的輸入信號的幅度和為了干擾信號抑制而修改的信號的幅度匯總成部分頻帶。所述部分頻帶的寬度在此以Bark刻度為依據(jù)，并因此隨頻率而變化。通過所述的方框頻率組分解，將最小濾波器的每個頻率組的輸出信號分布到相應(yīng)的頻率分量或傅里葉系數(shù)上。為了計算出緩沖存儲器方框的輸入信號，在另一個實施變型中，也可以替代為了抑制干擾信號而修改的信號的頻率組匯總，而將輸入信號的匯總成頻率組的幅度逐單元地與最小濾波器的輸出信號相乘。
在干擾噪聲估算之外還進行語音信號分量的后驗估算。為此在方框緩沖存儲器中，存儲了為了降低噪聲而修改的幅度值的匯總成頻率組的信號。除了匯總成頻率組的輸入信號的幅度值之外，先驗噪聲估算的輸出信號和緩沖存儲器的輸出信號用來計算增益計算。從所述的增益計算中得出加權(quán)系數(shù)，將這些加權(quán)系數(shù)輸送給一個-下面將詳述的-最小濾波器。所述的最小濾波器最終求出所述的加權(quán)系數(shù)，這些加權(quán)系數(shù)安排用于與頻率組的頻率分量相乘。
借助附圖2中所示出的流程圖，現(xiàn)在來詳述一個用于語音信號的抑制干擾噪聲的簡化的實施變型。在此不采用附圖1中所示出的方框頻率組匯總FGZU1，F(xiàn)GZU2和方框頻率組分解。
通過掃描裝置和連接在其后的模數(shù)轉(zhuǎn)換器，將由拾音器所拾取的受干擾的語音信號轉(zhuǎn)換成伴有干擾n(k)的輸入的數(shù)字式語音信號s(k)。將該輸入信號在時間上分段(segmentieren)成塊(塊，m)(101)，并將所述的塊(塊，m)按時間順序通過變換成頻率范圍而分別映射到I頻率分量f(i，m)上(102)，其中，m代表時間，而i代表頻率。這例如可以通過傅里葉變換來實現(xiàn)。如果用X(i，m)來表示輸入信號的傅里葉系數(shù)，則值|X(i，m)|^2可以稱為頻率分量。
在上述的分段101和變換成頻率范圍102之后，將語音信號的頻率分量f(i，m)與加權(quán)系數(shù)H(i，m)相乘，其中，該加權(quán)系數(shù)例如可以從上面已經(jīng)闡述的所估算的先驗和后驗信噪比中導(dǎo)出。從受干擾輸入信號的功率密度譜和先驗噪聲估算中可以導(dǎo)出所述的先驗信噪比。從受干擾輸入信號的功率密度譜和緩沖存儲器的輸出信號中可以計算出所述的后驗信噪比。
與頻率或與頻率分量有關(guān)的加權(quán)系數(shù)在此是隨時間變化的，并按照隨時間變化的頻率分量來不斷更新地求出。為了避免背景信號中的不受歡迎的人工因素，不過為了實現(xiàn)最小濾波器，不總是將所述當(dāng)前針對該頻率分量計算出的加權(quán)系數(shù)H(i，m)用于與一個頻率分量f(i，m)的相乘，而是如果所述最后，即在上一個步驟中，針對該頻率分量所計算出的加權(quán)系數(shù)H(i，m-1)小于所述當(dāng)前的加權(quán)系數(shù)，才采用所述最后，即在上一個步驟中，針對該頻率分量所計算出的加權(quán)系數(shù)H(i，m-1)。
本發(fā)明的一個實施變型規(guī)定，將一個頻率分量與當(dāng)前的加權(quán)系數(shù)相乘，如果與頻率有關(guān)的加權(quán)系數(shù)位于一個閾值之上，甚至于如果最后針對該頻率分量所計算出的加權(quán)系數(shù)小于當(dāng)前的加權(quán)系數(shù)。
這可以通過一個濾波器來實現(xiàn)，該濾波器將當(dāng)前的加權(quán)系數(shù)分別與在同樣頻率時的時間上位于前面的加權(quán)系數(shù)相比較，并選出兩個值中的較小者用于所述的頻率分量。如果由當(dāng)前加權(quán)系數(shù)超過固定的閾值0.76，則不進行頻率分量修改。
附圖4展示了一個譬如微控制器那樣的程控處理器裝置PE，該處理器裝置也可以包括一個處理器CPU和一個存儲器裝置SPE。
按實施變型不同，在此在處理器裝置PE之內(nèi)或之外，可以布置其它的-分配給處理器裝置的、屬于處理器裝置的、由處理器裝置控制的或控制處理器裝置的-組件，這些組件的功能與處理器裝置相結(jié)合對于專業(yè)人員是足夠已知的，并因此在此對這些組件不再詳述。所述不同的組件可以通過總線系統(tǒng)BUS、或輸入/輸出接口IOS、和必要時(未示出的)合適的控制器來與所述處理器裝置PE交換數(shù)據(jù)。所述處理器裝置PE在此可以是譬如通信終端設(shè)備或移動電話那樣的電子設(shè)備的組成部分，并也可以控制其它的專門用于所述電子設(shè)備的方法和應(yīng)用程序(Anwendungen)。
按實施變型不同，也可以將可能涉及一個或多個易失或非易失RAM或ROM存儲器模塊的存儲器裝置SPE，或存儲器裝置SPE的部分來實現(xiàn)為(附圖中示出的)處理器裝置的部分，或可以實現(xiàn)為(附圖中未示出的)外部的存儲器裝置，該存儲器裝置定位在處理器裝置PE之外，或甚至定位在含有所述處理器裝置PE的設(shè)備之外，并通過導(dǎo)線或總線系統(tǒng)與所述的處理器裝置PE相連接。
在存儲器裝置SPE中存放了程序數(shù)據(jù)，將這些程序數(shù)據(jù)用于控制設(shè)備，以及控制用于語音處理的和用于干擾信號抑制的方法。通過程控的處理器或本來為該目的而安排的微電路來實現(xiàn)上述的功能組件，這屬于專業(yè)人員的工作范圍。
通過輸入/輸出接口IOS可將伴有干擾的數(shù)字式語音信號輸送給所述的處理器裝置PE。除處理器CPU外還可以安排一個數(shù)字式信號處理器DSP，以便完全或部分地實施上述方法的步驟。
權(quán)利要求
1.用于語音處理的方法，-其中，將一個輸入的數(shù)字式語音信號s(k)按時間分段成塊(塊，m)(101)，-其中，將所述的塊(塊，m)按時間順序通過變換成所述的頻率范圍來分別映射到頻率分量(f，i)上(102)，-將所述的頻率分量與隨時間變化的與頻率有關(guān)的加權(quán)系數(shù)相乘，-其中，將一個頻率分量與所述當(dāng)前的加權(quán)系數(shù)相乘，如果該加權(quán)系數(shù)小于所述最后針對該頻率分量所計算出的加權(quán)系數(shù)，-其中，將一個頻率分量與所述最后針對該頻率分量所計算出的加權(quán)系數(shù)相乘，如果該加權(quán)系數(shù)小于所述當(dāng)前的加權(quán)系數(shù)，和-其中，在反變換成所述的時間范圍之后將所述如此加權(quán)的頻率分量輸送給低速率的語音編解碼器。
2.按權(quán)利要求1的方法，其中將一個頻率分量與所述當(dāng)前的加權(quán)系數(shù)相乘，如果所述與頻率有關(guān)的加權(quán)系數(shù)位于一個閾值之上，甚至于如果所述最后針對該頻率分量所計算出的加權(quán)系數(shù)小于所述當(dāng)前的加權(quán)系數(shù)。
3.用于抑制干擾噪聲的裝置-具有數(shù)字式語音信號用的一個輸入端(IOS)，和-具有一個如此設(shè)置的處理器裝置(PE)，使得-將一個輸入的數(shù)字式語音信號s(k)按時間分段成塊(塊，m)(101)，-將所述的塊(塊，m)按時間順序通過變換成所述的頻率范圍來分別映射到頻率分量(f，i)上(102)，-將所述的頻率分量與隨時間變化的與頻率有關(guān)的加權(quán)系數(shù)相乘，-其中，將一個頻率分量與所述當(dāng)前的加權(quán)系數(shù)相乘，如果該加權(quán)系數(shù)小于所述最后針對該頻率分量所計算出的加權(quán)系數(shù)，和-其中，將一個頻率分量與所述最后針對該頻率分量所計算出的加權(quán)系數(shù)相乘，如果該加權(quán)系數(shù)小于所述當(dāng)前的加權(quán)系數(shù)，以及使得-在反變換成所述的時間范圍之后，所述如此加權(quán)的頻率分量經(jīng)受低速率的語音編碼。
4.按權(quán)利要求3的裝置，其中-將一個頻率分量與所述當(dāng)前的加權(quán)系數(shù)相乘，如果所述的與頻率有關(guān)的加權(quán)系數(shù)位于一個閾值之上，甚至于如果所述最后針對該頻率分量所計算出的加權(quán)系數(shù)小于所述當(dāng)前的加權(quán)系數(shù)。
全文摘要
在低速率語音編碼之前，將輸入的數(shù)字式語音信號s(k)按時間分段成塊(塊，m)(101)，將所述的塊(塊，m)按時間順序通過變換成所述的頻率范圍來分別映射到頻率分量f(i，m)上(102)，并將所述的頻率分量與隨時間變化的與頻率有關(guān)的加權(quán)系數(shù)相乘，其中，如果該加權(quán)系數(shù)小于所述當(dāng)前的加權(quán)系數(shù)，則將一個頻率分量與所述最后針對該頻率分量所計算出的加權(quán)系數(shù)相乘。
文檔編號G10L21/0208GK1568503SQ02820101
公開日2005年1月19日申請日期2002年10月2日優(yōu)先權(quán)日2001年10月12日
發(fā)明者M·伊勒, F·瓦爾特申請人:西門子公司

完整全部詳細技術(shù)資料下載