本發(fā)明涉及基音頻率檢測方法,特別是一種極低信噪比環(huán)境下的基音頻率檢測方法。
背景技術(shù):
基音頻率檢測作為語音的基本參數(shù),在語音分析合成以及語音分離等語音處理領(lǐng)域有著廣泛的用途。準(zhǔn)確可靠地估計并提取基音頻率對語音信號處理至關(guān)重要。高信噪比的基音頻率檢測已經(jīng)十分成熟,但這些方法在低信噪比環(huán)境下難以較好效果,特別是極低信噪比環(huán)境下的檢測效果很差。鑒于此,本發(fā)明提供一種極低信噪比環(huán)境下的基音頻率檢測方法。
技術(shù)實現(xiàn)要素:
針對現(xiàn)有技術(shù)在極低信噪比環(huán)境下的進(jìn)行基音頻率檢測有著明顯不足,本發(fā)明提供了一種極低信噪比環(huán)境下的基音頻率檢測方法。
該方法包括以下步驟:
1.訓(xùn)練過程:
(1)對語音數(shù)據(jù)庫按時間順序作語音分幀{frm(1),frm(2),…,frm(n)},并利用標(biāo)準(zhǔn)算法提取語音幀的基音頻率f0作為基音頻率真實值,并構(gòu)成序列{f0(1),f0(2),…,f0(n)},其中n為語音幀的總數(shù);
(2)在純凈語音幀基礎(chǔ)上疊加噪聲制作新的語音分幀序列{frmnoise(1),frmnoise(2),…,frmnoise(n)},并利用pefac算法將語音幀信號轉(zhuǎn)化為相對應(yīng)的特征波形序列
(3)利用優(yōu)化因子與特征波形一起構(gòu)造ga適應(yīng)度函數(shù),并進(jìn)行全局搜索,直至得到最佳優(yōu)化因子。其中優(yōu)化因子為未知的m維向量α=[α1,α2,…,αm],優(yōu)化因子優(yōu)化之后的特征波形
2.測試過程:
(1)對測試語音信號進(jìn)行分幀處理,并提取其基音特征波形
(2)利用最佳優(yōu)化因子αoptimal優(yōu)化,即構(gòu)造優(yōu)化后的基音特征波形
(3)識別并找出
本發(fā)明的上述技術(shù)方案與現(xiàn)有技術(shù)方案相比較,具有以下優(yōu)點:
a、采用pefac算法提取特征波形,繼承了其低信噪比環(huán)境下抑制噪聲的優(yōu)點;
b、采用ga進(jìn)化算法搜索最佳優(yōu)化因子,使得優(yōu)化之后的所得到的基音頻率估計值在低信噪比環(huán)境下更接近于真實基音頻率值。
附圖說明
圖1是根據(jù)本發(fā)明的一個實施例構(gòu)成的方法流程圖;
具體實施方式
本發(fā)明提出的極低信噪比環(huán)境下的基音頻率檢測方法結(jié)合附圖及實施例進(jìn)一步說明如下:
本發(fā)明的方法流程如圖1所示,包括以下步驟:
1.訓(xùn)練過程:
(1)對語音數(shù)據(jù)庫按時間順序分幀;
(2)并利用標(biāo)準(zhǔn)算法提取語音幀的基音頻率作為基音頻率真實值;
(3)對疊加有噪聲的語音庫信號按時間順序分幀并利用pefac算法將語音幀信號轉(zhuǎn)化為相對應(yīng)的基音特征波形;
(4)利用優(yōu)化因子作為未知參數(shù)與基音特征波形一起構(gòu)造ga適應(yīng)度函數(shù),并進(jìn)行全局搜索,直至得到最佳優(yōu)化因子。
2.測試過程:
(1)對特測試的語音信號分幀;
(2)將語音幀信號轉(zhuǎn)化為其相對應(yīng)的基音特征波形;
(3)利用已訓(xùn)練好的最佳優(yōu)化因子對基音特征波形進(jìn)行優(yōu)化,從而生成優(yōu)化后的基音特征波形,并計算出優(yōu)化后的基音特征波形的最大峰值所對應(yīng)的頻率作為基音頻率的估計值。
本發(fā)明上述方法各步驟的具體實施例詳細(xì)說明如下:
上述訓(xùn)練過程步驟(1)中的語音庫實施例為timit國際標(biāo)準(zhǔn)數(shù)據(jù)庫,30名男性和30名女性的語音,每人語音時長20分鐘,總時長為20 小時。按時間分幀的采樣率為16khz,每幀數(shù)據(jù)的為160個采樣點;上述訓(xùn)練過程步驟(2)提取語音庫基音頻率的標(biāo)準(zhǔn)方法為praat算法工具;
上述訓(xùn)練過程步驟(3)疊加的噪聲信號類型為高斯白噪聲,且語音分幀方法與步驟(1)一致,將幀格式語音信號轉(zhuǎn)化為基音特征波形的算法為pefac算法,其算法流程如下:
(a)將語音幀信號通過短時傅里葉變換映射到頻域,并作標(biāo)準(zhǔn)化處理成為xt′(q),其中q為對數(shù)化頻率,即q=log(f);
(b)對xt′(q)卷積運算生成基音特征波形
上述訓(xùn)練過程步驟(4)中的優(yōu)化因子的實施例為10維向量,且每一維的取值范圍為0.5~1.5?;籼卣鞑ㄐ螢榫S度為250維的頻域向量信號,頻域跨度為60~400hz的基音頻域最大范圍;
優(yōu)化因子α與基音特征波形
其中g(shù)a適應(yīng)度函數(shù)的實施例為
1)令優(yōu)化因子α=[α1,α2,…,α10],首先根據(jù)求解精度的要求,確定使用 二進(jìn)制的長度。設(shè)優(yōu)化因子每一維即值域的取值范圍為[0.5,1.5],要求精確到小數(shù)點后3位,則由10n<2m-1,求得m的最小長度,進(jìn)而可求出位于區(qū)間的任一數(shù),最大迭代次數(shù)為30,優(yōu)化因子任一維度
2)利用二進(jìn)制隨機數(shù)發(fā)生器產(chǎn)生種群popu=rand2(popsize,10,m),即popsize×10×m的隨機二進(jìn)制數(shù)陣列,種群中染色體個數(shù)popsize為100,即每個染色體用10×m的二進(jìn)制矩陣表達(dá);
3)對種群中每一染色體(即優(yōu)化因子)α(i),計算其對應(yīng)的適應(yīng)度函數(shù)值eval(α(i)),i=1,2,…,popsize為染色體(即優(yōu)化因子)編號;
4)計算種群適應(yīng)度之和f:
5)計算每個α(i)的選擇概率pi:
6)計算每個α(i)的累加概率qi:
7)產(chǎn)生一個位于[0,1]區(qū)間的隨機數(shù)序列,如果其中任意一數(shù)r<qi,則選擇第一個染色體,若qi-1<r<qi,則選擇第i個染色體,i=1,2,…,popsize,這樣可以獲得新一代種群;
8)對新一代種群進(jìn)行交叉運算:設(shè)交叉概率pc為0.8,首先產(chǎn)生一個位于區(qū)間[0,1]內(nèi)的隨機數(shù)序列,如果其中任意一數(shù)r<pc,則對應(yīng)染色體被選中(如果選中奇數(shù)個,則可以去掉一個),然后在[1,m-1]區(qū) 間中產(chǎn)生隨機數(shù),個數(shù)為選中的染色體數(shù)的一半,然后根據(jù)隨機數(shù)在對應(yīng)位置進(jìn)行交換操作,從而構(gòu)成新的染色體;
9)變異操作:設(shè)變異概率pm為0.1,產(chǎn)生m×n個位于區(qū)間[0,1]上的隨機數(shù),如果某一隨機數(shù)r<pm則選中對應(yīng)位變異,構(gòu)成新的種群;
10)第一代計算完畢,返回繼續(xù)計算(3),直到達(dá)到最大迭代次數(shù)為止。此時的最佳染色體值即為αoptimal;
上述測試過程步驟(1)中的分幀方法與訓(xùn)練過程步驟(1)中保持一致;上述測試過程步驟(2)中的基音特征波形轉(zhuǎn)化方法與訓(xùn)練過程步驟(3)保持一致。
上述測試過程步驟(3)中的基音特征波形優(yōu)化運算與上述訓(xùn)練過程步驟(4)保持一致,且優(yōu)化因子采用訓(xùn)練產(chǎn)生的最佳優(yōu)化因子αoptimal。