一種強(qiáng)背景噪聲下的語音提取方法

文檔序號(hào)：2826487閱讀：1225來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種強(qiáng)背景噪聲下的語音提取方法
【專利摘要】本發(fā)明公開了一種強(qiáng)背景噪聲下的語音提取方法，首先對(duì)含有強(qiáng)背景噪聲的原始語音信號(hào)進(jìn)行預(yù)離散采樣和量化得到數(shù)據(jù)幀，對(duì)數(shù)據(jù)幀構(gòu)建基于Morlet小波函數(shù)的小波神經(jīng)網(wǎng)絡(luò)，對(duì)于小波神經(jīng)網(wǎng)絡(luò)參數(shù)構(gòu)建粒子群適應(yīng)度函數(shù)，再通過粒子群算法得到最優(yōu)參數(shù)，將數(shù)據(jù)幀輸入小波神經(jīng)網(wǎng)絡(luò)進(jìn)行濾波，從而去除噪聲，提取得到語音信號(hào)。本發(fā)明中采用的小波神經(jīng)網(wǎng)絡(luò)的參數(shù)是由粒子群算法得到的，因此本發(fā)明提供的方法可以提高對(duì)不同環(huán)境噪聲特征的適應(yīng)度。
【專利說明】一種強(qiáng)背景噪聲下的語音提取方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于語音提取【技術(shù)領(lǐng)域】，更為具體地講，涉及一種強(qiáng)背景噪聲下的語音提取方法。
【背景技術(shù)】
[0002]在某些具有強(qiáng)背景噪聲環(huán)境的場(chǎng)合，如高速公路旁、轟鳴的車輛內(nèi)、喧鬧的人群中等等，如何消除強(qiáng)背景噪聲并有效提取用戶語音，是這些特殊場(chǎng)合中的語音識(shí)別裝置需要解決的主要問題之一。
[0003]目前，各種語音通信裝置主要采用的降噪技術(shù)包括:
[0004]I)基于模型的降噪方法，典型的如“谷歌公司.用于語音識(shí)別的語音模型和噪聲模型.中國發(fā)明專利，CN103069480A, 2013-04-24”中公開的用于語音識(shí)別的語音模型和噪聲模型，通過設(shè)定適配規(guī)則來對(duì)接收到的音頻信號(hào)進(jìn)行濾波和噪聲補(bǔ)償。該方法在適配度較高的情況下具有良好的去噪效果，但需要較多的先驗(yàn)知識(shí)來預(yù)先構(gòu)建用戶語音和噪聲模型。
[0005]2)主動(dòng)噪聲消除方法，典型的如“無錫中星微電子有限公司.一種語音降噪裝置.中國發(fā)明專利，CN101853667A，2010.10.06”中公開的語音降噪裝置，采用揚(yáng)聲器、麥克風(fēng)、輸出和輸入增益構(gòu)建負(fù)反饋閉環(huán)系統(tǒng)，通過麥克風(fēng)采集背景噪聲后主動(dòng)生成反噪聲信號(hào)與揚(yáng)聲器的輸入信號(hào)進(jìn)行疊加達(dá)到噪聲消除的效果。該方法適用于在強(qiáng)噪聲背景下進(jìn)行語音播放的場(chǎng)合，不適用于需要在背景噪聲中有效提取用戶語音的場(chǎng)合。
[0006]3)基于多麥克風(fēng)的濾波降噪方法，典型的如“通用汽車環(huán)球科技運(yùn)作有限責(zé)任公司.統(tǒng)一標(biāo)準(zhǔn)的麥克風(fēng)預(yù)處理系統(tǒng)和方法.中國發(fā)明專利，CN102595281A, 2012.07.18”中公開的信號(hào)預(yù)處理系統(tǒng)，通過在語音采集現(xiàn)場(chǎng)部署麥克風(fēng)陣列來支持通話處理、自動(dòng)語音識(shí)別處理和噪聲消除處理等應(yīng)用。麥克風(fēng)陣列的廣泛部署能夠通過多源信號(hào)采集獲取目標(biāo)聲源和噪聲源在空間域上的區(qū)別，較好的實(shí)現(xiàn)噪聲消除，但缺點(diǎn)在于難以在移動(dòng)和小范圍場(chǎng)景(如運(yùn)動(dòng)人體上)部署。
[0007]4)基于信號(hào)分析和處理的降噪方法，該類方法的主要思想是針對(duì)目標(biāo)語音和噪聲成分在時(shí)-頻域上的特征差異來進(jìn)行信號(hào)分離。典型的如“西北工業(yè)大學(xué).一種基于小波變換和變步長(zhǎng)最小均方算法的語音降噪方法.中國發(fā)明專利，CN101894561A,2010.11.24”公開的語音降噪方法，該方法充分利用了小波變換在時(shí)-頻局部分析方面的優(yōu)勢(shì)，并引入步長(zhǎng)動(dòng)態(tài)算法來控制收斂速度，具有較快的響應(yīng)時(shí)間和失調(diào)度，但步長(zhǎng)因子的確定仍缺乏有效方法，限制了其對(duì)不同噪聲環(huán)境的適應(yīng)能力。

【發(fā)明內(nèi)容】

[0008]本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足，提供一種強(qiáng)背景噪聲下的語音提取方法，采用小波神經(jīng)網(wǎng)絡(luò)作為濾波器，其中小波神經(jīng)網(wǎng)絡(luò)的參數(shù)由粒子群算法得到，可適應(yīng)各種典型白噪聲環(huán)境。[0009]為實(shí)現(xiàn)上述發(fā)明目的，本發(fā)明強(qiáng)背景噪聲下的語音提取方法，包括以下步驟:
[0010]S1:對(duì)含有強(qiáng)背景噪聲的原始語音信號(hào)進(jìn)行預(yù)處理，包括離散采樣和量化，提取P個(gè)由M個(gè)采樣點(diǎn)構(gòu)成的數(shù)據(jù)幀，其中，p = 0，1，…，P表示數(shù)據(jù)所處的幀號(hào)，m =0，I,…，M表不為樣本號(hào)；
[0011]S2:構(gòu)建小波神經(jīng)網(wǎng)絡(luò)模型，其模型公式為:
【權(quán)利要求】
1.一種強(qiáng)背景噪聲下的語音提取方法，其特征在于，包括以下步驟: 51:對(duì)含有強(qiáng)背景噪聲的原始語音信號(hào)進(jìn)行預(yù)處理，包括離散采樣和量化，提取P個(gè)由M個(gè)采樣點(diǎn)構(gòu)成的數(shù)據(jù)幀F(xiàn)Uni),其中，p = 0, I, "'P表示數(shù)據(jù)所處的幀號(hào)； 52:構(gòu)建小波神經(jīng)網(wǎng)絡(luò)模型，其模型公式為:
2.根據(jù)權(quán)利要求1所述的語音提取方法，其特征在于，所述粒子群算法中，粒子群中第t個(gè)粒子速度和位置的迭代方程為:
【文檔編號(hào)】G10L21/0208GK103617798SQ201310646708
【公開日】2014年3月5日申請(qǐng)日期:2013年12月4日優(yōu)先權(quán)日:2013年12月4日
【發(fā)明者】周龍甫, 呼永河, 張超群, 李正, 郝大鵬, 趙明申請(qǐng)人:中國人民解放軍成都軍區(qū)總醫(yī)院

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：周龍甫;呼永河;張超群;李正;郝大鵬;趙明
技術(shù)所有人：中國人民解放軍成都軍區(qū)總醫(yī)院
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種強(qiáng)背景噪聲下的語音提取方法