專利名稱:用于寬帶語音解碼中基音增強后處理的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音編解碼技術(shù),更具體地說,涉及一種用于寬帶語音解碼中基音增強后處理的方法及裝置。
背景技術(shù):
語音編/解碼器廣泛地應(yīng)用于數(shù)字通信系統(tǒng),有效的發(fā)送/存儲語音信號。在數(shù)字系統(tǒng)中,輸入的模擬語音信號經(jīng)過采樣轉(zhuǎn)化到數(shù)字域,在數(shù)字域中,對連續(xù)的語音采樣做進一步處理。即語音編碼器的輸入為語音采樣,輸出則為壓縮的比特流。壓縮的比特流通過信道傳入解碼端,語音解碼器接收該比特流,并產(chǎn)生重構(gòu)的語音信號。
在CELP (Code Excited Linear Prediction,碼激勵線性預(yù)測)編碼中,數(shù)字語音信號以幀為單位進行編碼傳輸。對于每幀數(shù)字語音信號,編碼器從中抽取多個編碼參數(shù),并將這些編碼參數(shù)發(fā)送/存儲。而CELP解碼器則是處理所接收的編碼參數(shù)重構(gòu)合成語音信號的指定幀。在CELP編解碼模式下,信道中傳輸?shù)木幋a參數(shù)有
LSF (Linear Spectrum Frequencies,線譜頻率)或 ISF (Immitance Spectrum Frequencies,導(dǎo)譜頻率);
基音參數(shù),包括基音延遲和基音增益;
革新激勵參數(shù),包括固定碼本索引和增益;
LSF或ISF系數(shù)按幀為單位進行編碼傳輸,基音參數(shù)和革新激勵參數(shù)一般按子幀為單位進行編碼傳輸。其中,基音參數(shù)和革新激勵參數(shù)描述了激勵信號。LSF/ISF是LP (Linear Prediction,線性預(yù)測)濾波器的系數(shù)的頻域表現(xiàn)形式。激勵信號可以看作聲門的輸出,LP濾波器可以看作聲道模型。所以當(dāng)激勵信號通過LP濾波器后,就得到輸出的合成語音信號。
當(dāng)前的各種語音編解碼器,解碼得到的重建語音信號不會和原始語音信號相同。 壓縮比越高,編碼失真就越大。為了提升解碼重建信號的質(zhì)量,在解碼端可以進行各種增強后處理。
在CELP編碼模式中,其激勵產(chǎn)生的二元模型中包括了模擬濁音特性的自適應(yīng)碼本激勵和模擬清音特性的固定碼本激勵,其總的激勵為自適應(yīng)碼本激勵和固定碼本激勵的和,最后總的激勵通過一個合成濾波器得到合成語音。由于人耳對低頻信號比較敏感,在寬帶語音編碼中,可以通過增強激勵碼矢的低頻部分的分量,即增強了激勵信號中低頻部分的貢獻,從而增強了低頻部分的周期性,最終提高合成語音信號的質(zhì)量。
AMR-WB+是 3GPP (The 3rd Generation Partnership Project,第三代合作伙伴計劃)主持制定的一個寬帶音頻編解碼標準,主要應(yīng)用于移動多媒體壓縮。AMR-WB+編解碼標準中,便使用了基音增強后處理,具體實現(xiàn)方法如下
將激勵碼矢通過一個濾波器,降低激勵碼矢中固定碼矢的低頻分量,即提升自適應(yīng)碼矢激勵低頻部分的貢獻,從而增強了激勵信號中低頻部分的周期性,其中使用的濾波器的轉(zhuǎn)移函數(shù)為
F (Z) =_ a z+1-a Z'
其中α是周期因子,計算如下
α =0. 125(l+rv),
其中,rv=(Ev-Ec) / (Ev+Ec),
其中,Ev為被縮放的自適應(yīng)碼矢的能量,盡=h2V1tVt ;
Ec為被縮放的固定碼矢的能量,盡=S2CtkCk ;
b為自適應(yīng)碼本增益,V為自適應(yīng)碼本激勵,g為固定碼本增益,c為固定碼本激勵。
其中,-I≤rv≤l。當(dāng)& =-I時為純清音;當(dāng)&= I時為純濁音。相應(yīng)的,對于純清音,α=0 ;對于純濁音,α = O. 25。α = O. 25時濾波器F (ζ) = - α z+1-α ζ—1的頻譜圖如圖I所示。α = O. . I時濾波器F(Z) =-αζ+Ι-αζ-1的頻譜圖如圖2所示。
AMR-WB+編解碼標準中采用的基音增強后處理方法在對革新碼矢濾波后,改變了革新碼矢的能量,但在最后沒有做能量平滑,使得基音增強后的激勵信號的能量普遍偏小。發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題在于,針對現(xiàn)有技術(shù)的上述缺陷,提供一種用于寬帶語音解碼中基音增強后處理的方法和裝置,能夠在不增加額外傳輸比特率的條件下以較低的運算復(fù)雜度實現(xiàn)基音增強處理和能量平滑,以達到寬帶解碼語音信號主觀音質(zhì)的提高。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是提出一種用于寬帶語音解碼中基音增強后處理的方法,包括如下步驟
SI、處理語音信號中每一子幀的解碼參數(shù),分別計算出固定碼矢和自適應(yīng)碼矢;
S2、將固定碼矢和自適應(yīng)碼矢相加,合成第一激勵信號;
S3、將自適應(yīng)碼矢進行基音增強濾波,得到基音增強后的自適應(yīng)碼矢;
S4、將固定碼矢和基音增強后的自適應(yīng)碼矢相加,合成第二激勵信號;
S5、利用第一激勵信號對第二激勵信號執(zhí)行能量平滑,輸出第三激勵信號。
本發(fā)明上述用于寬帶語音解碼中基音增強后處理的方法中,所述步驟SI進一步包括
S11、將碼本索引解碼,得到固定碼矢;
S12、將基音索引解碼并經(jīng)長時預(yù)測濾波,得到自適應(yīng)碼矢。
本發(fā)明上述用于寬帶語音解碼中基音增強后處理的方法中,所述步驟S3中基音增強濾波所采用的轉(zhuǎn)移函數(shù)為
權(quán)利要求
1.一種用于寬帶語音解碼中基音增強后處理的方法,其特征在于,包括如下步驟 51、處理語音信號中每一子幀的解碼參數(shù),分別計算出固定碼矢和自適應(yīng)碼矢; 52、將固定碼矢和自適應(yīng)碼矢相加,合成第一激勵信號; 53、將自適應(yīng)碼矢進行基音增強濾波,得到基音增強后的自適應(yīng)碼矢; 54、將固定碼矢和基音增強后的自適應(yīng)碼矢相加,合成第二激勵信號; 55、利用第一激勵信號對第二激勵信號執(zhí)行能量平滑,輸出第三激勵信號。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述步驟SI進一步包括 511、將碼本索引解碼,得到固定碼矢; 512、將基音索引解碼并經(jīng)長時預(yù)測濾波,得到自適應(yīng)碼矢。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述步驟S3中基音增強濾波所采用的轉(zhuǎn)移函數(shù)為
4.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述步驟S5進一步包括 551、計算第一激勵信號和第二激勵信號的能量以得到能量縮放因子
5.一種用于寬帶語音解碼中基音增強后處理的裝置,其特征在于,包括 碼矢計算模塊,用于處理語音信號中每一子幀的解碼參數(shù),分別計算出固定碼矢和自適應(yīng)碼矢; 第一合成模塊,用于將固定碼矢和自適應(yīng)碼矢相加,合成第一激勵信號; 基音增強濾波模塊,用于將自適應(yīng)碼矢進行基音增強濾波,得到基音增強后的自適應(yīng)碼矢;第二合成模塊,用于將固定碼矢和基音增強后的自適應(yīng)碼矢相加,合成第二激勵信號; 能量平滑模塊,用于利用第一激勵信號對第二激勵信號執(zhí)行能量平滑,輸出第三激勵信號。
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述碼矢計算模塊進一步包括 固定碼矢計算模塊,用于將碼本索引解碼,得到固定碼矢; 自適應(yīng)碼矢計算模塊,用于將基音索引解碼并經(jīng)長時預(yù)測濾波,得到自適應(yīng)碼矢。
7.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述基音增強濾波模塊所采用的轉(zhuǎn)移函數(shù)為
8.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述能量平滑模塊進一步包括 能量縮放因子計算模塊,用于計算第一激勵信號和第二激勵信號的能量以得到能量縮放因子
9.一種用于寬帶語音解碼的方法,其特征在于,包括如下步驟 a、對語音信號的解碼參數(shù)中的導(dǎo)譜頻率索引進行解碼處理,得到合成濾波器的轉(zhuǎn)移函數(shù); b、通過根據(jù)權(quán)利要求1-4中任一項所述的方法得到激勵信號; C、使用步驟a得到的轉(zhuǎn)移函數(shù)對步驟b得到的激勵信號進行合成濾波,輸出語音信號。
10.一種用于寬帶語音解碼的解碼器,其特征在于,包括 參數(shù)處理模塊,用于對語音信號的解碼參數(shù)中的導(dǎo)譜頻率索引進行解碼處理,得到合成濾波器的轉(zhuǎn)移函數(shù); 根據(jù)權(quán)利要求5-8中任一項所述的基音增強后處理的裝置,用于得到激勵信號; 合成濾波器,用于使用參數(shù)解碼模塊得到的轉(zhuǎn)移函數(shù)對基音增強后處理裝置得到的激勵信號進行合成濾波,輸出語音信號。
全文摘要
本發(fā)明涉及一種用于寬帶語音解碼中基音增強后處理的方法和裝置。所述方法包括如下步驟S1、處理語音信號中每一子幀的解碼參數(shù),分別計算出固定碼矢和自適應(yīng)碼矢;S2、將固定碼矢和自適應(yīng)碼矢相加,合成第一激勵信號;S3、將自適應(yīng)碼矢進行基音增強濾波,得到基音增強后的自適應(yīng)碼矢;S4、將固定碼矢和基音增強后的自適應(yīng)碼矢相加,合成第二激勵信號;S5、利用第一激勵信號對第二激勵信號執(zhí)行能量平滑,輸出第三激勵信號。本發(fā)明還涉及一種用于寬帶語音解碼的方法和解碼器。本發(fā)明在不增加額外傳輸比特率的條件下以較低的運算復(fù)雜度實現(xiàn)了基音增強處理和能量平滑,從而實現(xiàn)了寬帶解碼語音信號主觀音質(zhì)的提高。
文檔編號G10L19/12GK102930872SQ20121043609
公開日2013年2月13日 申請日期2012年11月5日 優(yōu)先權(quán)日2012年11月5日
發(fā)明者張勇, 閆建新 申請人:深圳廣晟信源技術(shù)有限公司