專利名稱:一種動態(tài)噪音消除方法及數(shù)字濾波器的制作方法
技術領域:
本發(fā)明涉及通信領域,尤其涉及一種基于IP協(xié)議的語音信號動態(tài)噪音消除方法以及相應的數(shù)字濾波器。
背景技術:
語音是氣流從肺部通過聲門的激勵而產生的,頻率主要在300Hz到3400Hz之間,且700Hz到2000Hz間尤為集中。噪音產生的機理復雜,形式多樣,主要分為背景噪音、設備器件產生的噪音以及音頻信號的模擬信號/數(shù)字信號(A/D)轉換時引入的噪音。背景噪音由周圍環(huán)境產生,如機房的機器轟鳴聲,室外公路的汽車鳴笛聲,雨天的雨滴聲等等。設備器件產生的噪音是由于器件自身的原因,通常是不可避免的,如50Hz(或60Hz)電源就是很大的噪音源,另外,聲卡器件、麥克風都可能產生噪音。A/D轉換引入噪音是在將連續(xù)的聲波模擬信號通過采樣變成離散的數(shù)字信號,對數(shù)字信號進行量化時會由于精度的損失而產生噪音。常見的語音采樣率有8KHz和16KHz兩種,前一種把4KHz以下的噪音一起采集下來,而后一種則把8KHz以下的噪音一起采集。從頻譜特性看,噪音的頻率可以貫穿人的聽覺范圍(20Hz--20000Hz),而從能量的角度看,主要分布在低頻部分。
用PC機進行語音采集時往往出現(xiàn)參雜各種各樣的噪音,使得語音不清晰,甚至被覆蓋的情況。為了降低噪音的影響,提高語音質量,可以通過采取一定的措施如選用更好的錄音設備,提供更好的隔音環(huán)境。然而,改用好的錄音設備意味更高的成本投入,日常生活很難找到好的隔音環(huán)境。
通過數(shù)字信號處理的手段來降低噪音的影響顯出很大的優(yōu)勢。目前,VOIP(Voice over IP,基于IP的語音呼叫)領域中常采用自動控制麥克風音量的技術減少噪音的影響。其基本原理是動態(tài)分析音頻流中噪音的短時平均能量,如果能量較高,則自動降低麥克風采集音量。這種技術確實能減少噪音對聽覺的影響,然而,它同時降低了話音的音量,導致有些情況下話音無法聽清。
發(fā)明內容
本發(fā)明提供一種動態(tài)噪音消除方法及其應用數(shù)字濾波器,用以解決現(xiàn)有技術中在消除動態(tài)噪音時受環(huán)境條件限制或不能保證語音音量不受影響的問題。
本發(fā)明提供的動態(tài)噪音消除方法,包括A、對時域抽樣聲音信號加窗,并采用傅立葉變換將窗內離散時域信號轉換為頻域數(shù)字信號;B、對轉換后的頻域數(shù)字信號進行能量衰減處理;C、將進行能量衰減處理后的頻域數(shù)字信號采用傅立葉逆變換轉換為時域離散信號后,再還原出聲音信號。
根據(jù)本發(fā)明的上述方法,所述傅立葉變換為快速傅立葉變換;所述傅立葉逆變換為快速傅立葉逆變換。
根據(jù)本發(fā)明的上述方法,所述步驟C之前還包括對能量衰減處理后的頻域數(shù)字信號進行窗函數(shù)運算處理的步驟。
根據(jù)本發(fā)明的上述方法,所述窗函數(shù)為漢明窗函數(shù)。
根據(jù)本發(fā)明的上述方法,所述步驟B包括對語音信號頻段的信號能量衰減0dB;對接近語音信號頻率的低頻信號和高頻信號能量按線性關系進行衰減;對其余頻率的信號能量衰減一設定的大于0的能量值。
根據(jù)本發(fā)明的上述方法,按信號頻率從低到高設置第一頻率、第二頻率、第三頻率和第四頻率;所述第二頻率為語音信號低頻頻率,所述第三頻率為語音信號高頻頻率;將信號頻率大于所述第二頻率且小于所述第三頻率的信號能量衰減0dB;
將信號頻率大于等于所述第一頻率且小于等于所述第二頻率,以及信號頻率大于等于所述第三頻率且小于等于所述第四頻率的信號能量按線性關系衰減;將信號頻率小于所述第一頻率和大于所述第四頻率的信號能量衰減一設定的大于0的能量值。
根據(jù)本發(fā)明的上述方法,所述第一頻率為300Hz,第二頻率為700Hz,第三頻率為2000Hz,第四頻率為3400Hz。
根據(jù)本發(fā)明的上述方法,所述步驟A中,窗的大小為256或512。
本發(fā)明另提供一種數(shù)字濾波器,包括模/數(shù)轉換單元將時域模擬聲音信號轉換為時域離散數(shù)字信號;加窗處理單元將模/數(shù)轉換單元轉換后的時域離散數(shù)字信號進行加窗處理;時域頻域轉換單元將窗內離散時域數(shù)字信號采用傅立葉變換轉換為頻域數(shù)字信號;信號噪音處理單元在頻域對數(shù)字信號進行能量衰減處理;頻域時域轉換單元將進行能量衰減處理后的頻域數(shù)字信號采用傅立葉逆變換還原為時域數(shù)字信號;數(shù)/模轉換單元將時域數(shù)字信號轉換為時域模擬信號并輸出。
根據(jù)本發(fā)明的上述裝置,還包括有窗函數(shù)運算單元,連接于所述信號噪音處理單元和頻域時域轉換單元之間,將進行能量衰減處理后的頻域數(shù)字信號進行窗函數(shù)運算后,再輸出給所述頻域時域轉換單元。
根據(jù)本發(fā)明的上述裝置,按信號頻率從低到高設置有第一頻率、第二頻率、第三頻率和第四頻率;所述第二頻率為語音信號低頻頻率,所述第三頻率為語音信號高頻頻率;所述信號噪音處理單元包括第一單元和第二單元;所述第一單元對信號頻率小于第一頻率和大于第四頻率的信號能量衰減一設定的大于0的能量值;
所述第二單元對信號頻率大于等于所述第一頻率且小于等于所述第二頻率,以及信號頻率大于等于所述第三頻率且小于等于所述第四頻率的信號能量按線性衰減。
根據(jù)本發(fā)明的上述裝置,所述第一頻率為300Hz,第二頻率為700Hz,第三頻率為2000Hz,第四頻率為3400Hz。
根據(jù)本發(fā)明的上述裝置,所述窗函數(shù)為漢明窗函數(shù)。
本發(fā)明的有益效果如下(1)本發(fā)明在對動態(tài)噪音信號進行處理時,只衰減低頻信號的能量和高頻信號的能量,盡可能保留語音信號頻率范圍內的信號能量,從而實現(xiàn)在進行噪音處理的同時,保證語音的音量不受影響。
(2)本發(fā)明將語音信號按頻率從低到高進行分段處理,對于頻率較低的信號和頻率較高的信號直接衰減一定量的信號能量或按線性關系衰減,實現(xiàn)簡單。
(3)本發(fā)明對語音頻率最集中的中間頻段不作信號能量衰減處理,保證語音音量不被降低,提高語音信號處理質量。
圖1為本發(fā)明動態(tài)噪音消除方法的流程圖;圖2為本發(fā)明實施例中信號頻率范圍的示意圖;圖3為本發(fā)明數(shù)字濾波器的結構示意圖。
具體實施例方式
參見圖1,為本發(fā)明的動態(tài)噪音消除方法的流程圖,具體包括1、對聲音模擬信號采樣后的時域離散信號進行加窗處理,即將時域上的連續(xù)若干個信號劃分成組,以便實現(xiàn)語音信號從時域離散信號到頻域數(shù)字信號的轉換。窗中包含的數(shù)據(jù)越多,頻譜分析就越精確,同時復雜度、延時也會越大。通常,應用于VOIP領域時,窗大小(包含的數(shù)據(jù)量)為256或者512。
2、采用快速傅立葉算法,將加窗后的時域離散信號sn時域轉換為頻域數(shù)字信號sn頻域。頻域數(shù)字信號的數(shù)量跟窗大小相同。例如,若窗的大小為256,則每窗時域離散信號被轉換為256個頻域數(shù)字信號;若窗的大小為512,則每窗時域離散信號被轉換為512個頻域數(shù)字信號。
頻域數(shù)字信號的頻寬Hw跟窗大小與采樣率有關,頻寬的計算公式為Hw=Hsr/2N]]>其中,Hsr是采樣率,N是窗大小。
常見的語音采樣率有8KHz和16KHz兩種。例如,當采樣率為8KHz,窗的大小為256時,頻寬Hw為15.625Hz;同樣的采樣率,而窗的大小為512時,頻寬Hw為7.8125Hz。當采樣率為16KHz,窗的大小為256時,頻寬Hw為31.25Hz;同樣的采樣率,而窗的大小為512時,頻寬Hw為15.625Hz。
3、衰減低頻和高頻信號的能量。
如圖2所示,頻率值f1、f2、f3、f4將信號頻率劃分為5個區(qū)域,頻率低于f2(含f2)的信號為低頻信號,頻率高于f3(含f3)的信號為高頻信號。f1將低頻信號區(qū)域劃分為2個區(qū)域,f4將高頻信號區(qū)域劃分為2個區(qū)域。上述劃分的區(qū)域中,頻率低于f1的區(qū)域和頻率高于f4的區(qū)域為明顯的噪音信號頻率范圍,對該區(qū)域的頻域數(shù)字信號衰減某一設定的能量;對f1到f2(包含f1和f2)區(qū)域和f3到f4(包含f3和f4)區(qū)域的頻域數(shù)字信號按線性關系衰減其能量。f2到f3區(qū)域為語音信號頻率范圍,因此對該頻率范圍的頻域數(shù)字信號衰減0dB(即不對信號能量進行衰減),以保證語音信號的音量不受影響。
由于語音信號的頻率主要集中在300Hz到3400Hz之間,且700Hz到2000Hz間尤為集中,因此f1、f2、f3、f4的較佳取值依次為300Hz、700Hz、2000Hz、3400Hz。
例如,對于低于300Hz和高于3400Hz的頻域數(shù)字信號衰減30dB,計算公式為Sn頻域′=dSn頻域(其中, nHw<=300且nHw>=3400)例如當采樣頻率為8KHz,加窗大小為256時,頻寬Hw為15.625Hz,頻率為nHw的頻域數(shù)字信號按上述公式衰減能量,得到當n=12,即nHw為187.5Hz時, 當n=256,即nHw為4000Hz時, 對于頻率在300Hz到700Hz之間(包含300Hz和700Hz)的頻域數(shù)字信號按線性衰減能量,計算公式為 (其中, nHw>=300且nHw<=700)例如當采樣頻率為8KHz,加窗大小為256時,頻寬Hw為15.625Hz,頻率為nHw的頻域數(shù)字信號按上述公式衰減能量,得到當n=20,即nHw=312.5Hz時, 當n=32,即nHw=500Hz時, 當n=44,即nHw=687.5Hz時, 對于頻率在2000Hz到3400Hz之間(包含2000Hz和3400Hz)的頻域數(shù)字信號按線性衰減能量,計算公式為
(其中, nHw>=2000且nHw<=3400)例如當采樣頻率為8KHz,加窗大小為256時,頻寬Hw為15.625Hz,頻率為nHw的頻域數(shù)字信號按上述公式衰減能量,得到當n=128,即nHw=2000Hz時, 當n=172,即nHw=2687.5Hz時, 當n=217,即nHw=3390.625Hz時, 4、對能量衰減處理后的頻域數(shù)字信號進行窗函數(shù)運算處理。為了使窗與窗之間的數(shù)據(jù)處理不會產生過大的變化,選用抑制好的漢明窗函數(shù),漢明窗函數(shù)的公式為W(n)=0.54-0.46cos(2nπN-1)]]>(其中,N是窗大小,n是窗內數(shù)字信號的位置)漢明窗函數(shù)的處理公式為 5、將經過窗函數(shù)運算處理后的頻域數(shù)字信號采用快速傅立葉逆變換轉換為時域離散信號,再將時域離散信號轉換為時域模擬信號,還原出聲音信號。即將頻域數(shù)字信號Sn頻域″轉換為時域模擬信號sn時域′。此時處理后的時域模擬信號則是消除了噪音影響的信號。
根據(jù)上述方法,本發(fā)明提供的數(shù)字濾波器,如圖3所示,包括模/數(shù)轉換單元將動態(tài)的時域模擬聲音信號轉換為時域離散數(shù)字信號;加窗處理單元將模/數(shù)轉換單元轉換后的時域離散數(shù)字信號進行加窗處理;通常,應用于VOIP領域時,所加的窗大小為256或者512;時域頻域轉換單元將窗內離散時域數(shù)字信號采用快速傅立葉變換轉換為頻域數(shù)字信號;信號噪音處理單元在頻域對數(shù)字信號進行能量衰減處理;窗函數(shù)運算單元對進行能量衰減處理后的頻域數(shù)字信號進行窗函數(shù)運算;為了使窗與窗之間的數(shù)據(jù)處理不會產生過大的變化,選用抑制好的漢明窗函數(shù);頻域時域轉換單元將進行窗函數(shù)運算處理后的頻域數(shù)字信號采用快速傅立葉逆變換轉換為時域數(shù)字信號;數(shù)/模轉換單元將經過快速傅立葉逆變換后的時域數(shù)字信號轉換為時域模擬信號并輸出。
所述數(shù)字濾波器按信號頻率從低到高設置有第一頻率、第二頻率、第三頻率和第四頻率,所述信號噪音處理單元包括第一單元和第二單元;所述第一單元對信號頻率小于第一頻率和大于第四頻率的信號能量衰減一設定的能量值;所述第二單元對信號頻率大于等于所述第一頻率且小于等于所述第二頻率,以及信號頻率大于等于所述第三頻率且小于等于所述第四頻率的信號能量按線性衰減。
考慮語音信號的頻率主要集中在300Hz到3400Hz之間,且700Hz到2000Hz間尤為集中,因此所述第一頻率為300Hz,第二頻率為700Hz,第三頻率為2000Hz,第四頻率為3400Hz。
所述噪音處理單元的第一單元對頻率小于300Hz和頻率大于3400Hz的信號衰減30dB,采用如下算法Sn頻域′=dSn頻域(其中, nHw<=300且nHw>=3400)所述噪音處理單元的第二單元對信號頻率大于等于300Hz且小于等于700Hz的信號按線性衰減能量,采用如下算法 (其中, nHw>=300且nHw<=700)所述噪音處理單元的第二單元對信號頻率大于等于2000Hz且小于等于3400Hz的信號按線性衰減能量,采用如下算法 (其中, nHw>=2000且nHw<=3400)上述公式中Hw為頻寬,計算公式如下Hw=Hsr/2N]]>(其中,Hsr是采樣率,N是窗大小)。
通過以上方法和裝置的描述可知,對于小于300Hz或大于3400Hz的噪音信號一律衰減30dB;對300Hz和700Hz之間的信號按線性衰減,并且愈接近700Hz,衰減程度愈小;對2000Hz和3400Hz的信號按線性衰減,并且愈接近2000Hz,衰減程度愈小。由此可以看出,在對噪音信號進行處理時,只衰減頻率在700Hz以下或2000Hz以上的信號的能量,并盡可能保留語音信號頻率比較集中的300Hz到3400Hz之間信號的能量,從而實現(xiàn)在進行噪音處理的同時,保證語音的音量,提高了用戶感受。
另外,對噪音信號處理采用線性衰減,算法簡單,易于實現(xiàn)。
顯然,本領域的技術人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權利要求及其等同技術的范圍之內,則本發(fā)明也意圖包含這些改動和變型在內。
權利要求
1.一種動態(tài)噪音消除方法,其特征在于包括A、對時域抽樣聲音信號加窗,并采用傅立葉變換將窗內離散時域信號轉換為頻域數(shù)字信號;B、對轉換后的頻域數(shù)字信號進行能量衰減處理;C、將進行能量衰減處理后的頻域數(shù)字信號采用傅立葉逆變換轉換為時域離散信號后,再還原出聲音信號。
2.如權利要求1所述的方法,其特征在于,所述傅立葉變換為快速傅立葉變換;所述傅立葉逆變換為快速傅立葉逆變換。
3.如權利要求1所述的方法,其特征在于,所述步驟C之前還包括對能量衰減處理后的頻域數(shù)字信號進行窗函數(shù)運算處理的步驟。
4.如權利要求3所述的方法,其特征在于,所述窗函數(shù)為漢明窗函數(shù)。
5.如權利要求1所述的方法,其特征在于,所述步驟B包括對語音信號頻段的信號能量衰減0dB;對接近語音信號頻率的低頻信號和高頻信號能量按線性關系進行衰減;對其余頻率的信號能量衰減一設定的大于0的能量值。
6.如權利要求5所述的方法,其特征在于,按信號頻率從低到高設置第一頻率、第二頻率、第三頻率和第四頻率;所述第二頻率為語音信號低頻頻率,所述第三頻率為語音信號高頻頻率;將信號頻率大于所述第二頻率且小于所述第三頻率的信號能量衰減0dB;將信號頻率大于等于所述第一頻率且小于等于所述第二頻率,以及信號頻率大于等于所述第三頻率且小于等于所述第四頻率的信號能量按線性關系衰減;將信號頻率小于所述第一頻率和大于所述第四頻率的信號能量衰減一設定的大于0的能量值。
7.如權利要求6所述的方法,其特征在于,所述第一頻率為300Hz,第二頻率為700Hz,第三頻率為2000Hz,第四頻率為3400Hz。
8.如權利要求1所述的方法,其特征在于,所述步驟A中,窗的大小為256或512。
9.一種數(shù)字濾波器,其特征在于包括模/數(shù)轉換單元將時域模擬聲音信號轉換為時域離散數(shù)字信號;加窗處理單元將模/數(shù)轉換單元轉換后的時域離散數(shù)字信號進行加窗處理;時域頻域轉換單元將窗內離散時域數(shù)字信號采用傅立葉變換轉換為頻域數(shù)字信號;信號噪音處理單元在頻域對數(shù)字信號進行能量衰減處理;頻域時域轉換單元將進行能量衰減處理后的頻域數(shù)字信號采用傅立葉逆變換還原為時域數(shù)字信號;數(shù)/模轉換單元將時域數(shù)字信號轉換為時域模擬信號并輸出。
10.如權利要求9所述的數(shù)字濾波器,其特征在于,還包括有窗函數(shù)運算單元,連接于所述信號噪音處理單元和頻域時域轉換單元之間,將進行能量衰減處理后的頻域數(shù)字信號進行窗函數(shù)運算后,再輸出給所述頻域時域轉換單元。
11.如權利要求9或10所述的數(shù)字濾波器,其特征在于,按信號頻率從低到高設置有第一頻率、第二頻率、第三頻率和第四頻率;所述第二頻率為語音信號低頻頻率,所述第三頻率為語音信號高頻頻率;所述信號噪音處理單元包括第一單元和第二單元;所述第一單元對信號頻率小于第一頻率和大于第四頻率的信號能量衰減一設定的大于0的能量值;所述第二單元對信號頻率大于等于所述第一頻率且小于等于所述第二頻率,以及信號頻率大于等于所述第三頻率且小于等于所述第四頻率的信號能量按線性衰減。
12.如權利要求11所述的數(shù)字濾波器,其特征在于,所述第一頻率為300Hz,第二頻率為700Hz,第三頻率為2000Hz,第四頻率為3400Hz。
13.如權利要求10所述的數(shù)字濾波器,其特征在于,所述窗函數(shù)為漢明窗函數(shù)。
全文摘要
本發(fā)明公開了一種動態(tài)噪音消除方法和一種數(shù)字濾波器。本發(fā)明方法包括A、對時域抽樣聲音信號加窗,并采用傅立葉變換將窗內離散時域信號轉換為頻域數(shù)字信號;B、對轉換后的頻域數(shù)字信號進行能量衰減處理;C、將進行能量衰減處理后的頻域數(shù)字信號采用傅立葉逆變換轉換為時域離散信號后,再還原出聲音信號。本發(fā)明提供的數(shù)字濾波器包括模/數(shù)轉換單元、加窗處理單元、時域頻域轉換單元、信號噪音處理單元、頻域時域轉換單元、數(shù)/模轉換單元。本發(fā)明可以實現(xiàn)在進行噪音處理的同時,保證語音的音量,提高用戶感受。
文檔編號H03H17/02GK1719517SQ200510089148
公開日2006年1月11日 申請日期2005年8月4日 優(yōu)先權日2005年8月4日
發(fā)明者施健標, 楊勁松, 傅群, 焉勇 申請人:北京中星微電子有限公司