一種強(qiáng)背景噪聲下的語音提取方法
【專利摘要】本發(fā)明公開了一種強(qiáng)背景噪聲下的語音提取方法,首先對(duì)含有強(qiáng)背景噪聲的原始語音信號(hào)進(jìn)行預(yù)離散采樣和量化得到數(shù)據(jù)幀,對(duì)數(shù)據(jù)幀構(gòu)建基于Morlet小波函數(shù)的小波神經(jīng)網(wǎng)絡(luò),對(duì)于小波神經(jīng)網(wǎng)絡(luò)參數(shù)構(gòu)建粒子群適應(yīng)度函數(shù),再通過粒子群算法得到最優(yōu)參數(shù),將數(shù)據(jù)幀輸入小波神經(jīng)網(wǎng)絡(luò)進(jìn)行濾波,從而去除噪聲,提取得到語音信號(hào)。本發(fā)明中采用的小波神經(jīng)網(wǎng)絡(luò)的參數(shù)是由粒子群算法得到的,因此本發(fā)明提供的方法可以提高對(duì)不同環(huán)境噪聲特征的適應(yīng)度。
【專利說明】一種強(qiáng)背景噪聲下的語音提取方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于語音提取【技術(shù)領(lǐng)域】,更為具體地講,涉及一種強(qiáng)背景噪聲下的語音提取方法。
【背景技術(shù)】
[0002]在某些具有強(qiáng)背景噪聲環(huán)境的場(chǎng)合,如高速公路旁、轟鳴的車輛內(nèi)、喧鬧的人群中等等,如何消除強(qiáng)背景噪聲并有效提取用戶語音,是這些特殊場(chǎng)合中的語音識(shí)別裝置需要解決的主要問題之一。
[0003]目前,各種語音通信裝置主要采用的降噪技術(shù)包括:
[0004]I)基于模型的降噪方法,典型的如“谷歌公司.用于語音識(shí)別的語音模型和噪聲模型.中國發(fā)明專利,CN103069480A, 2013-04-24”中公開的用于語音識(shí)別的語音模型和噪聲模型,通過設(shè)定適配規(guī)則來對(duì)接收到的音頻信號(hào)進(jìn)行濾波和噪聲補(bǔ)償。該方法在適配度較高的情況下具有良好的去噪效果,但需要較多的先驗(yàn)知識(shí)來預(yù)先構(gòu)建用戶語音和噪聲模型。
[0005]2)主動(dòng)噪聲消除方法,典型的如“無錫中星微電子有限公司.一種語音降噪裝置.中國發(fā)明專利,CN101853667A,2010.10.06”中公開的語音降噪裝置,采用揚(yáng)聲器、麥克風(fēng)、輸出和輸入增益構(gòu)建負(fù)反饋閉環(huán)系統(tǒng),通過麥克風(fēng)采集背景噪聲后主動(dòng)生成反噪聲信號(hào)與揚(yáng)聲器的輸入信號(hào)進(jìn)行疊加達(dá)到噪聲消除的效果。該方法適用于在強(qiáng)噪聲背景下進(jìn)行語音播放的場(chǎng)合,不適用于需要在背景噪聲中有效提取用戶語音的場(chǎng)合。
[0006]3)基于多麥克風(fēng)的濾波降噪方法,典型的如“通用汽車環(huán)球科技運(yùn)作有限責(zé)任公司.統(tǒng)一標(biāo)準(zhǔn)的麥克風(fēng)預(yù)處理系統(tǒng)和方法.中國發(fā)明專利,CN102595281A, 2012.07.18”中公開的信號(hào)預(yù)處理系統(tǒng),通過在語音采集現(xiàn)場(chǎng)部署麥克風(fēng)陣列來支持通話處理、自動(dòng)語音識(shí)別處理和噪聲消除處理等應(yīng)用。麥克風(fēng)陣列的廣泛部署能夠通過多源信號(hào)采集獲取目標(biāo)聲源和噪聲源在空間域上的區(qū)別,較好的實(shí)現(xiàn)噪聲消除,但缺點(diǎn)在于難以在移動(dòng)和小范圍場(chǎng)景(如運(yùn)動(dòng)人體上)部署。
[0007]4)基于信號(hào)分析和處理的降噪方法,該類方法的主要思想是針對(duì)目標(biāo)語音和噪聲成分在時(shí)-頻域上的特征差異來進(jìn)行信號(hào)分離。典型的如“西北工業(yè)大學(xué).一種基于小波變換和變步長(zhǎng)最小均方算法的語音降噪方法.中國發(fā)明專利,CN101894561A,2010.11.24”公開的語音降噪方法,該方法充分利用了小波變換在時(shí)-頻局部分析方面的優(yōu)勢(shì),并引入步長(zhǎng)動(dòng)態(tài)算法來控制收斂速度,具有較快的響應(yīng)時(shí)間和失調(diào)度,但步長(zhǎng)因子的確定仍缺乏有效方法,限制了其對(duì)不同噪聲環(huán)境的適應(yīng)能力。
【發(fā)明內(nèi)容】
[0008]本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種強(qiáng)背景噪聲下的語音提取方法,采用小波神經(jīng)網(wǎng)絡(luò)作為濾波器,其中小波神經(jīng)網(wǎng)絡(luò)的參數(shù)由粒子群算法得到,可適應(yīng)各種典型白噪聲環(huán)境。[0009]為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明強(qiáng)背景噪聲下的語音提取方法,包括以下步驟:
[0010]S1:對(duì)含有強(qiáng)背景噪聲的原始語音信號(hào)進(jìn)行預(yù)處理,包括離散采樣和量化,提取P個(gè)由M個(gè)采樣點(diǎn)構(gòu)成的數(shù)據(jù)幀,其中,p = 0,1,…,P表示數(shù)據(jù)所處的幀號(hào),m =0,I,…,M表不為樣本號(hào);
[0011]S2:構(gòu)建小波神經(jīng)網(wǎng)絡(luò)模型,其模型公式為:
【權(quán)利要求】
1.一種強(qiáng)背景噪聲下的語音提取方法,其特征在于,包括以下步驟: 51:對(duì)含有強(qiáng)背景噪聲的原始語音信號(hào)進(jìn)行預(yù)處理,包括離散采樣和量化,提取P個(gè)由M個(gè)采樣點(diǎn)構(gòu)成的數(shù)據(jù)幀F(xiàn)Uni),其中,p = 0, I, "'P表示數(shù)據(jù)所處的幀號(hào); 52:構(gòu)建小波神經(jīng)網(wǎng)絡(luò)模型,其模型公式為:
2.根據(jù)權(quán)利要求1所述的語音提取方法,其特征在于,所述粒子群算法中,粒子群中第t個(gè)粒子速度和位置的迭代方程為:
【文檔編號(hào)】G10L21/0208GK103617798SQ201310646708
【公開日】2014年3月5日 申請(qǐng)日期:2013年12月4日 優(yōu)先權(quán)日:2013年12月4日
【發(fā)明者】周龍甫, 呼永河, 張超群, 李正, 郝大鵬, 趙明 申請(qǐng)人:中國人民解放軍成都軍區(qū)總醫(yī)院