語音信號處理方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種語音信號處理方法及裝置,其中,該方法包括:獲取語音信號幀的能量分布特性;根據(jù)該能量分布特性判斷該語音信號幀是否為噪聲幀。通過本發(fā)明,解決了相關(guān)技術(shù)中對變化較快的非平穩(wěn)噪聲的判別效果較差的問題,提高了對語音信號中噪聲幀的判斷準確性。
【專利說明】語音信號處理方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信領(lǐng)域,具體而言,涉及一種語音信號處理方法及裝置。
【背景技術(shù)】
[0002]目前在生活中,人們對移動終端的語音通話功能及通話質(zhì)量的要求越來越高,然而現(xiàn)實生活中的通話過程往往會受到背景噪聲的干擾,尤其是一些公共場合如車站、廣場、街道等。這些非平穩(wěn)的強噪聲對通話質(zhì)量和語音清晰度有很大的影響,而傳統(tǒng)的語音增強算法通常只針對平穩(wěn)的或者變化很慢的噪聲具有較好的效果,但是對變化較快的非平穩(wěn)噪聲的抑制效果很不理想,而且還會在抑制噪聲的同時損失語音的清晰度。為了加強對背景噪聲的跟蹤和估計,相關(guān)技術(shù)中存在如下幾種方法:
[0003]第一種,Donoho提出了典型閾值法,Donoho通過分析高斯白噪聲在小波域的特征,根據(jù)經(jīng)驗和統(tǒng)計特性在小波域人為的設(shè)定一個閾值來區(qū)分噪聲和實際信號。但是實際中噪聲和語音并沒有一個明顯的閾值界限。
[0004]第二種,基于語音活動檢測的方法,研究人員發(fā)現(xiàn)一段語音的最開始階段是完全由背景噪聲組成的,可以用這一段信號作為噪聲的估計樣本,并且通過語音活動檢測,提取出語音間隔處的信號進行噪聲樣本更新。但是這同樣是一種粗略的提取,只能跟蹤變化緩慢的噪聲信號。
[0005]這些方法都會造成語音幀和噪聲幀的誤判,從而產(chǎn)生一定的語音失真。
[0006]此外,為了提高帶噪語音的清晰度,現(xiàn)有的技術(shù)如下:
[0007]第一種,基于清濁音判定的語音增強算法,在去噪前首先進行清濁音判定,清音集中了大部分語音的高頻信號,是影響語音清晰度的主要成分,所以設(shè)置一個較低的閾值,對濁音設(shè)置一個稍大的閾值去除大部分噪聲成分。但是在背景噪聲較大的時候,清音往往被噪聲淹沒。
[0008]第二種,基于人耳掩蔽效應(yīng)的去噪算法,通過計算估計掩蔽模型的閾值,對語音進行閾值去噪。但是在計算掩蔽閾值時就存在偏差,并且計算量會增加很多,增加了手機的運算負擔(dān)。
[0009]這些算法雖然都起到了一定的效果,但是都很難針對每一幀語音內(nèi)的噪聲進行精確處理。
[0010]針對相關(guān)技術(shù)中對變化較快的非平穩(wěn)噪聲的判別效果較差的問題,目前尚未提出有效的解決方案。
【發(fā)明內(nèi)容】
[0011]針對相關(guān)技術(shù)中對變化較快的非平穩(wěn)噪聲的判別效果較差的問題,目前尚未提出有效的解決方案,本發(fā)明提供了一種語音信號處理方法及裝置,以至少解決上述問題。
[0012]根據(jù)本發(fā)明的一個方面,提供了一種語音信號處理方法,包括:獲取語音信號幀的能量分布特性;根據(jù)所述能量分布特性判斷所述語音信號幀是否為噪聲幀。[0013]優(yōu)選地,根據(jù)所述能量分布特性判斷所述語音信號幀是否為噪聲幀包括:判斷所述語音信號幀的能量分布是否集中;在判斷結(jié)果為否的情況下,確定所述語音信號幀為噪聲幀。
[0014]優(yōu)選地,判斷所述語音信號幀的能量分布是否集中包括:計算所述語音信號幀的頻域語音峰的個數(shù);在所述個數(shù)大于第一預(yù)定閾值的情況下,確定所述語音信號幀的能量分布不集中。
[0015]優(yōu)選地,判斷所述語音信號幀的能量分布是否集中包括:計算所述語音信號幀的VPER ;在所述VPER小于第二預(yù)定閾值的情況下,確定所述語音信號幀的能量分布不集中;
V/V,
其中
【權(quán)利要求】
1.一種語音信號處理方法,其特征在于,包括: 獲取語音信號幀的能量分布特性; 根據(jù)所述能量分布特性判斷所述語音信號幀是否為噪聲幀。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述能量分布特性判斷所述語音信號中貞是否為噪聲幀包括: 判斷所述語音信號幀的能量分布是否集中; 在判斷結(jié)果為否的情況下,確定所述語音信號幀為噪聲幀。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,判斷所述語音信號幀的能量分布是否集中包括: 計算所述語音信號幀的頻域語音峰的個數(shù); 在所述個數(shù)大于第一預(yù)定閾值的情況下,確定所述語音信號幀的能量分布不集中。
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,判斷所述語音信號幀的能量分布是否集中包括: 計算所述語音信號幀的語音峰能量比VPER ; 在所述VPER小于第二預(yù)定閾值的情況下,確定所述語音信號幀的能量分布不集中;其
SPF中,mR = ,SPEl為第一語音峰能量,spE2為第二語音峰能量。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述語音峰能量通過以下公式計算:S嘆=,其中ENGi為第i子帶能量,a和b分別為所述語音峰所占頻帶兩端的子帶。
i=a
6.根據(jù)權(quán)利要求1至5中任一項所述的方法,其特征在于,在根據(jù)所述能量分布特性判斷所述語音信號幀是否為噪聲幀之后,還包括: 根據(jù)所述語音信號幀的子帶能量獲取所述語音信號幀的子帶信噪比; 根據(jù)所述子帶信噪比對所述語音信號幀進行自動增益。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,根據(jù)所述子帶信噪比對所述語音信號幀進行自動增益包括: 調(diào)整所述語音信號幀的自動增益系數(shù)隨著所述子帶信噪比的減小而減小,以及隨著所述子帶信噪比的增大而增大。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,調(diào)整所述語音信號幀的自動增益系數(shù)隨著所述子帶信噪比的減小而減小,以及隨著所述子帶信噪比的增大而增大包括: RcUio = Omxe且
? ,,.Raiio (jctn1--S.中,
Ration] ,、1, Gain為信號幅度增益;Ratio為信號增益相關(guān)系數(shù);ES (m, i)為第m幀信號第i個子帶的能量;SNRs(i,j)為第i幀第j個子帶的子帶信噪比。
9.一種語音信號處理裝置,其特征在于,包括: 第一獲取模塊,用于獲取語音信號幀的能量分布特性; 判斷模塊,用于根據(jù)所述能量分布特性判斷所述語音信號幀是否為噪聲幀。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述判斷模塊包括: 判斷單元,用于判斷所述語音信號幀的能量分布是否集中; 第一確定單元,用于在所述判斷單元的判斷結(jié)果為否的情況下,確定所述語音信號幀為噪聲中貞。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述判斷單元包括: 第一計算單元,用于計算所述語音信號幀的頻域語音峰的個數(shù); 第二確定單元,用于在所述第一計算單元計算出的所述個數(shù)大于第一預(yù)定閾值的情況下,確定所述語音信號幀的能量分布不集中。
12.根據(jù)權(quán)利要求10或11所述的裝置,其特征在于,所述判斷單元包括: 第二計算單元,用于計算所述語音信號幀的語音峰能量比VPER ; 第三確定單元,用于在所述第二計算單元計算出的所述VPER小于第二預(yù)定閾值的情況下,確定所述語音信號幀的能量分布不集中。
13.根據(jù)權(quán)利要求9至12中任一項所述的裝置,其特征在于,所述裝置還包括: 第二獲取模塊,用于根據(jù)所述語音信號幀的子帶能量獲取所述語音信號幀的子帶信噪比; 自動增益模塊,用于根據(jù)所述第二獲取模塊獲取的所述子帶信噪比對所述語音信號幀進行自動增益。
14.一種語音信號處理方法,其特征在于,包括: 根據(jù)語音信號幀的子帶能量獲取所述語音信號幀的子帶信噪比; 根據(jù)所述子帶信噪比對所述語音信號幀進行自動增益。
15.根據(jù)權(quán)利要求14所述的方法,其特征在于,根據(jù)所述子帶信噪比對所述語音信號幀進行自動增益包括: 調(diào)整所述語音信號幀的自動增益系數(shù)隨著所述子帶信噪比的減小而減小,以及隨著所述子帶信噪比的增大而增大。
16.根據(jù)權(quán)利要求15所述的方法,其特征在于,調(diào)整所述語音信號幀的自動增益系數(shù)隨著所 述子帶信噪比的減小而減小,以及隨著所述子帶信噪比的增大而增大包括: Ratio = 0mxeSNmKi}^}\ 且
9 P.Kaiio Gam =-苴中,
Rado + ] /、丫’ Gain為信號幅度增益;Ratio為信號增益相關(guān)系數(shù);ES (m, i)為第m幀信號第i個子帶的能量;SNRs(i,j)為第i幀第j個子帶的子帶信噪比。
17.一種語音信號處理裝置,其特征在于,包括: 第三獲取模塊,用于根據(jù)語音信號幀的子帶能量獲取所述語音信號幀的子帶信噪比; 第二自動增益模塊,用于根據(jù)所述子帶信噪比對所述語音信號幀進行自動增益。
【文檔編號】G10L25/51GK103544961SQ201210236881
【公開日】2014年1月29日 申請日期:2012年7月10日 優(yōu)先權(quán)日:2012年7月10日
【發(fā)明者】王進軍, 孫燾, 劉冬梅, 薛濤, 王霞, 姚遠 申請人:中興通訊股份有限公司