本發(fā)明涉及一種音頻頻點(diǎn)的處理技術(shù),具體涉及一種通過增益平滑處理而避免音頻頻點(diǎn)增益過于強(qiáng)烈而失真的技術(shù)。
背景技術(shù):
1、音頻信號(hào)中通常包含噪聲,在以對講通話、錄音為代表的音頻處理方案中,自適應(yīng)降噪(ans)技術(shù)是最廣泛應(yīng)用的技術(shù)之一。有不同種類基于不同模型的降噪技術(shù),其遇到的一個(gè)關(guān)鍵問題是語音的保真度:即,很多算法在降噪的同時(shí)會(huì)損傷語音。作為學(xué)術(shù)研究的方案,可以獲取很高的信噪比而認(rèn)為是可行方案,但實(shí)際運(yùn)用中因?yàn)閷φZ音的聽感損傷,甚至在信噪比很低時(shí)會(huì)出現(xiàn)“音樂噪聲”,這在實(shí)際運(yùn)用中難以接受。
2、為解決此問題,有一些現(xiàn)有的技術(shù)方案,其中二元掩碼方法被廣泛運(yùn)用:該方法對每個(gè)頻點(diǎn)只設(shè)0或1兩種增益,即判定其屬于語音還是屬于噪聲,如屬于噪聲,則完全去掉,屬于語音則全部放出。這種方式得到的語音在一些情況下能改善上述情況,不過在聽感上不夠自然。
3、為更好的解決此問題,可以根據(jù)頻點(diǎn)之間的相鄰相關(guān)性,即:相近的頻點(diǎn)之間的增益變化不應(yīng)非常劇烈;即可以在已有降噪算法的增益基礎(chǔ)上提升語音質(zhì)量,同時(shí)避免二元掩碼方式那樣的增益突變。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的主要目的是提供一種對語音頻點(diǎn)的增益通過算法平滑處理而避免數(shù)據(jù)出現(xiàn)突變失真的問題。
2、為了完成上述目的,本發(fā)明提供了一種基于頻點(diǎn)增益平滑的自適應(yīng)降噪方法,把語音信號(hào)轉(zhuǎn)換為頻譜信號(hào),然后進(jìn)行增益,其對增益過程進(jìn)行平滑處理,平滑處理包括前向平滑和/或后向平滑;
3、其中,前向平滑:
4、取;
5、對;
6、其中,為增益衰減系數(shù);
7、以新的增益取代原增益,;
8、其中,為最高頻之外頻點(diǎn)的虛擬增益,作為計(jì)算的初始點(diǎn)運(yùn)用;
9、對每個(gè)實(shí)際頻點(diǎn),為其原始增益,這個(gè)增益由降噪算法得到;
10、為上一個(gè)較高頻點(diǎn)聲的調(diào)整過的增益;
11、另外,后向平滑:
12、?。?/p>
13、對;
14、以新的增益取代原增益,;
15、為最低頻之外頻點(diǎn)的虛擬增益,作為計(jì)算的初始點(diǎn)運(yùn)用;
16、對每個(gè)實(shí)際頻點(diǎn),為其原始增益,這個(gè)增益由降噪算法得到,或者從前面的額調(diào)整中得到;
17、為上一個(gè)較低頻點(diǎn)聲的調(diào)整過的增益。
18、優(yōu)選地,還包括時(shí)間平滑;
19、取?;
20、有;
21、以新的增益取代原增益,;
22、這里的是當(dāng)前頻點(diǎn)上第的增益。
23、優(yōu)選地,通過下面的步驟完成:
24、預(yù)處理:實(shí)時(shí)語音信號(hào)分幀,通過fft變換將信號(hào)轉(zhuǎn)換到頻譜,為步驟1和步驟2;
25、ans降噪,使用某個(gè)降噪算法獲得增益,為步驟3;
26、后置濾波:對以上增益進(jìn)行調(diào)整,即步驟4,5和6;
27、回到時(shí)域信號(hào):通過逆fft變換將頻譜轉(zhuǎn)換到時(shí)域,并合成為音頻信號(hào),步驟7和8。
28、優(yōu)選地,通過下面的步驟完成:
29、步驟1,實(shí)時(shí)語音信號(hào)分幀:
30、語音信號(hào)為設(shè)備采樣或前期算法處理之后的信號(hào)流;
31、每個(gè)采樣點(diǎn)具有一定位數(shù),按照一定位數(shù)采樣,需進(jìn)行歸一化,使得;
32、在實(shí)時(shí)處理中,取每個(gè)采樣點(diǎn)為一幀,即,第幀信號(hào)為,其中;
33、步驟2,語音信號(hào)經(jīng)fft變換為頻譜;其中,
34、為分析窗;
35、為離散傅里葉變換;
36、為復(fù)頻譜,其中,為頻點(diǎn)標(biāo)號(hào);
37、步驟3,采用某種信號(hào)處理降噪算法,獲取每個(gè)頻點(diǎn)上的增益,一般的,,即該增益為實(shí)數(shù),該增益意味著,為降噪后的頻譜;即;
38、步驟4,即采用所述的前向平滑的步驟;
39、步驟5,即采用所述的后向平滑的步驟;
40、步驟6,即采用所述的時(shí)間平滑。
41、優(yōu)選地,還包括下面的步驟:
42、步驟7:更新頻譜信號(hào):;
43、步驟8:經(jīng)逆傅里葉變換回到時(shí)域信號(hào):;
44、根據(jù)加窗方式,決定合成信號(hào)所用的分析窗。
45、優(yōu)選地,當(dāng)且使用hanning窗時(shí),合成窗為單位窗;
46、用overlap-add方式將按幀合成為語音信號(hào)。
47、優(yōu)選地,對16khz采樣率的音頻文件,取32ms為一幀,16ms幀移,即。
48、優(yōu)選地,前向平滑和后向平滑中衰減系數(shù)數(shù)值相同或者不同;
49、衰減系數(shù)根據(jù)信噪比進(jìn)行調(diào)節(jié),即當(dāng)信噪比高時(shí)降低,信噪比低時(shí)提高;
50、替換為。
51、本發(fā)明還提供一種基于頻點(diǎn)增益平滑的自適應(yīng)降噪后置濾波器,所述后置濾波器采用如上所述的降噪方法進(jìn)行處理。
52、優(yōu)選地,在前向平滑、后向平滑和時(shí)間平滑的時(shí)候分別采用獨(dú)立設(shè)置的后置濾波器進(jìn)行處理。
53、本發(fā)明的有益效果為:通過本發(fā)明前向平滑和后向平滑的處理方式,語音轉(zhuǎn)換的頻點(diǎn)增益按照算法處理實(shí)現(xiàn)平滑處理,以新的增益替代原先增益,從而得到平滑自然的頻點(diǎn)數(shù)據(jù)。相應(yīng)地,本方法可以改善降噪后的語音自然度,尤其在信噪比較低場景下;本方法明顯的降低過度降噪、頻譜突變帶來的“音樂噪聲”;本方法為通用方法,可以基于不同的參數(shù)或變種應(yīng)用于不同的降噪算法(模型)中;本方法實(shí)現(xiàn)簡單、計(jì)算復(fù)雜度低,同時(shí)可以與其他后置濾波相結(jié)合以達(dá)到更好的降噪和語音保存效果。
1.一種基于頻點(diǎn)增益平滑的自適應(yīng)降噪方法,把語音信號(hào)轉(zhuǎn)換為頻譜信號(hào),然后進(jìn)行增益,其特征在于:對增益過程進(jìn)行平滑處理,平滑處理包括前向平滑和/或后向平滑;
2.根據(jù)權(quán)利要求1所述的基于頻點(diǎn)增益平滑的自適應(yīng)降噪方法,其特征在于,還包括時(shí)間平滑;
3.根據(jù)權(quán)利要求2所述的基于頻點(diǎn)增益平滑的自適應(yīng)降噪方法,其特征在于,通過下面的步驟完成:
4.根據(jù)權(quán)利要求3所述的基于頻點(diǎn)增益平滑的自適應(yīng)降噪方法,其特征在于,通過下面的步驟完成:
5.根據(jù)權(quán)利要求4所述的基于頻點(diǎn)增益平滑的自適應(yīng)降噪方法,其特征在于,還包括下面的步驟:
6.根據(jù)權(quán)利要求5所述的基于頻點(diǎn)增益平滑的自適應(yīng)降噪方法,其特征在于,當(dāng)且使用hanning窗時(shí),合成窗為單位窗;
7.根據(jù)權(quán)利要求1所述的基于頻點(diǎn)增益平滑的自適應(yīng)降噪方法,其特征在于,對16khz采樣率的音頻文件,取32ms為一幀,16ms幀移,即。
8.根據(jù)權(quán)利要求1所述的基于頻點(diǎn)增益平滑的自適應(yīng)降噪方法,其特征在于,前向平滑和后向平滑中衰減系數(shù)數(shù)值相同或者不同;
9.一種基于頻點(diǎn)增益平滑的自適應(yīng)降噪后置濾波器,其特征在于,所述后置濾波器采用如權(quán)利要求1-8中任一項(xiàng)所述的降噪方法進(jìn)行處理。
10.一種基于頻點(diǎn)增益平滑的自適應(yīng)降噪后置濾波器,其特征在于,在前向平滑、后向平滑和時(shí)間平滑的時(shí)候分別采用獨(dú)立設(shè)置的后置濾波器進(jìn)行處理。