專利名稱:一種利用改進(jìn)的譜相減法提高語音識(shí)別精度的方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于提高語音識(shí)別精度的方法,具體的說,是關(guān)于在語音識(shí)別算法特征提取之前,通過對語音進(jìn)行增強(qiáng)處理,提高語音輸入信噪比,進(jìn)而提高語音識(shí)別精度的方法。
背景技術(shù):
語音識(shí)別是機(jī)器通過識(shí)別和理解過程把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本文件或命令的高技術(shù)。作為專門的研究領(lǐng)域,語音識(shí)別又是一門交叉學(xué)科,它與聲學(xué)、語音學(xué)、語言學(xué)、數(shù)字信號(hào)處理理論、信息論、計(jì)算機(jī)科學(xué)等眾多學(xué)科緊密相連。語音識(shí)別經(jīng)過四十多年的發(fā)展到今天,已經(jīng)顯示出巨大的應(yīng)用前景。促使語音識(shí)別技術(shù)可以得到廣泛應(yīng)用的關(guān)鍵是識(shí)別精度。
本發(fā)明提供了一種通過對語音進(jìn)行增強(qiáng)處理,提高語音輸入信噪比,進(jìn)而提高語音識(shí)別精度的方法。
發(fā)明內(nèi)容
為了以上目的,本發(fā)明提供了一種有效的通過對語音進(jìn)行增強(qiáng)處理,提高語音輸入信噪比,進(jìn)而提高語音識(shí)別精度的方法。該方法包括在進(jìn)行語音識(shí)別處理之前對帶噪聲語音輸入進(jìn)行語音增強(qiáng)處理語音增強(qiáng)處理的方法采用改進(jìn)的譜相減法改傳統(tǒng)的譜相減法α=2,β=1為α=2,β=5得到改進(jìn)的譜相減法改進(jìn)的譜相減法信噪比增益獲得提高通過語音識(shí)別驗(yàn)證平臺(tái)測試發(fā)現(xiàn)經(jīng)過改進(jìn)的譜相減法的語音識(shí)別精度被顯著提高
在本專利申請的權(quán)利要求書中,具體地指出了本發(fā)明的主題,并清楚地對其提出了專利保護(hù)。然而參照下面的詳細(xì)說明和附圖,可以更好的理解本發(fā)明的有關(guān)結(jié)構(gòu)和實(shí)現(xiàn)方法以及其目的、特征和優(yōu)勢。
圖1表示通過語音增強(qiáng)提高語音識(shí)別精度的語音識(shí)別系統(tǒng)框圖,y(n)為帶噪語音,S(n)+為增強(qiáng)后的語音,W為識(shí)別器的輸出;圖2表示改進(jìn)譜減法框圖,y(n)為帶噪語音,s(n)為純凈語音輸入、d(n)為加性噪聲,噪聲功率譜系數(shù)λn(k),θk為相位,α、β為參數(shù),F(xiàn)FT為快速傅利葉轉(zhuǎn)換,IFFT為反快速傅利葉轉(zhuǎn)換,S(n)+為增強(qiáng)后的語音;雖然此處說明描述了本發(fā)明的某此特征及一種實(shí)現(xiàn)方法,但是對于本專業(yè)的技術(shù)人員來說,將會(huì)出現(xiàn)許多修改、替換、變化和等效代換。因此,本發(fā)明的保護(hù)范圍由所附的權(quán)利要求的范圍為準(zhǔn)。
權(quán)利要求
1.一種利用改進(jìn)的譜相減法提高語音識(shí)別精度的方法,該方法包括以下步驟——帶噪聲語音輸入y(n),包含兩項(xiàng)純凈語音輸入s(n)、加性噪聲d(n)——在語音中的無聲段估計(jì)得到的噪聲功率譜系數(shù)λn(k)——帶噪聲語音和純凈語音的頻譜系數(shù)分別為Yk、Sk,k=0,1,…——傳統(tǒng)譜相減法α=2,β=1得到語音s(n)譜幅度系數(shù)|Sk|=[|Yk|α-βλn(k)α]1/α——改進(jìn)譜相減法,設(shè)定α=2,β=5,得到增強(qiáng)后的語音S(n)+的譜幅度系數(shù)|Sk+|——通過語音識(shí)別驗(yàn)證平臺(tái)測試發(fā)現(xiàn)經(jīng)過上述處理的語音識(shí)別精度被顯著提高。
2.一種利用改進(jìn)的譜相減法提高語音識(shí)別精度的方法,其特征在于譜相減法主要用在語音識(shí)別算法特征提取之前,對語音進(jìn)行增強(qiáng)處理,從而提高語音輸入信噪比。
3.如權(quán)利要求1所述一種利用改進(jìn)的譜相減法提高語音識(shí)別精度的方法,其特征在于通過改進(jìn)傳統(tǒng)譜相減法的α=2和β=1的參數(shù)值為α=2和β=5,來提高語音譜幅度系數(shù)。
全文摘要
本發(fā)明是關(guān)于提高語音識(shí)別精度的方法,具體的說,是關(guān)于在語音識(shí)別算法特征提取之前,通過對語音進(jìn)行增強(qiáng)處理,提高語音輸入信噪比,進(jìn)而提高語音識(shí)別精度的方法。本發(fā)明在進(jìn)行語音識(shí)別處理之前對帶噪聲語音輸入進(jìn)行語音增強(qiáng)處理,語音增強(qiáng)處理的方法采用改進(jìn)的譜相減法,改傳統(tǒng)的譜相減法α=2,β=1為α=2,β=5得到改進(jìn)的譜相減法,改進(jìn)的譜相減法使信噪比增益獲得提高。本發(fā)明利用改進(jìn)的譜相減法使語音識(shí)別精度被顯著提高。
文檔編號(hào)G10L15/20GK1697018SQ200510040400
公開日2005年11月16日 申請日期2005年6月7日 優(yōu)先權(quán)日2005年6月7日
發(fā)明者吳俊輝, 朱小茅 申請人:蘇州海瑞電子科技有限公司