用于寬帶語音解碼中基音增強后處理的方法及裝置的制作方法

文檔序號：2829089閱讀：392來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：用于寬帶語音解碼中基音增強后處理的方法及裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及語音編解碼技術(shù)，更具體地說，涉及一種用于寬帶語音解碼中基音增強后處理的方法及裝置。
背景技術(shù)：
語音編/解碼器廣泛地應(yīng)用于數(shù)字通信系統(tǒng)，有效的發(fā)送/存儲語音信號。在數(shù)字系統(tǒng)中，輸入的模擬語音信號經(jīng)過采樣轉(zhuǎn)化到數(shù)字域，在數(shù)字域中，對連續(xù)的語音采樣做進一步處理。即語音編碼器的輸入為語音采樣，輸出則為壓縮的比特流。壓縮的比特流通過信道傳入解碼端，語音解碼器接收該比特流，并產(chǎn)生重構(gòu)的語音信號。
在CELP (Code Excited Linear Prediction,碼激勵線性預(yù)測)編碼中，數(shù)字語音信號以幀為單位進行編碼傳輸。對于每幀數(shù)字語音信號，編碼器從中抽取多個編碼參數(shù)，并將這些編碼參數(shù)發(fā)送/存儲。而CELP解碼器則是處理所接收的編碼參數(shù)重構(gòu)合成語音信號的指定幀。在CELP編解碼模式下，信道中傳輸?shù)木幋a參數(shù)有
LSF (Linear Spectrum Frequencies,線譜頻率)或 ISF (Immitance Spectrum Frequencies,導(dǎo)譜頻率)；
基音參數(shù)，包括基音延遲和基音增益；
革新激勵參數(shù)，包括固定碼本索引和增益；
LSF或ISF系數(shù)按幀為單位進行編碼傳輸，基音參數(shù)和革新激勵參數(shù)一般按子幀為單位進行編碼傳輸。其中，基音參數(shù)和革新激勵參數(shù)描述了激勵信號。LSF/ISF是LP (Linear Prediction,線性預(yù)測)濾波器的系數(shù)的頻域表現(xiàn)形式。激勵信號可以看作聲門的輸出，LP濾波器可以看作聲道模型。所以當(dāng)激勵信號通過LP濾波器后，就得到輸出的合成語音信號。
當(dāng)前的各種語音編解碼器，解碼得到的重建語音信號不會和原始語音信號相同。壓縮比越高，編碼失真就越大。為了提升解碼重建信號的質(zhì)量，在解碼端可以進行各種增強后處理。
在CELP編碼模式中，其激勵產(chǎn)生的二元模型中包括了模擬濁音特性的自適應(yīng)碼本激勵和模擬清音特性的固定碼本激勵，其總的激勵為自適應(yīng)碼本激勵和固定碼本激勵的和，最后總的激勵通過一個合成濾波器得到合成語音。由于人耳對低頻信號比較敏感，在寬帶語音編碼中，可以通過增強激勵碼矢的低頻部分的分量，即增強了激勵信號中低頻部分的貢獻，從而增強了低頻部分的周期性，最終提高合成語音信號的質(zhì)量。
AMR-WB+是 3GPP (The 3rd Generation Partnership Project,第三代合作伙伴計劃)主持制定的一個寬帶音頻編解碼標準，主要應(yīng)用于移動多媒體壓縮。AMR-WB+編解碼標準中，便使用了基音增強后處理，具體實現(xiàn)方法如下
將激勵碼矢通過一個濾波器，降低激勵碼矢中固定碼矢的低頻分量，即提升自適應(yīng)碼矢激勵低頻部分的貢獻，從而增強了激勵信號中低頻部分的周期性，其中使用的濾波器的轉(zhuǎn)移函數(shù)為
F (Z) =_ a z+1-a Z'
其中α是周期因子，計算如下
α =0. 125(l+rv),
其中，rv=(Ev-Ec) / (Ev+Ec),
其中，Ev為被縮放的自適應(yīng)碼矢的能量,盡=h2V1tVt ;
Ec為被縮放的固定碼矢的能量，盡=S2CtkCk ;
b為自適應(yīng)碼本增益，V為自適應(yīng)碼本激勵，g為固定碼本增益，c為固定碼本激勵。
其中，-I≤rv≤l。當(dāng)& =-I時為純清音；當(dāng)&= I時為純濁音。相應(yīng)的，對于純清音，α=0 ;對于純濁音，α = O. 25。α = O. 25時濾波器F (ζ) = - α z+1-α ζ—1的頻譜圖如圖I所示。α = O. . I時濾波器F(Z) =-αζ+Ι-αζ-1的頻譜圖如圖2所示。
AMR-WB+編解碼標準中采用的基音增強后處理方法在對革新碼矢濾波后，改變了革新碼矢的能量，但在最后沒有做能量平滑，使得基音增強后的激勵信號的能量普遍偏小。發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題在于，針對現(xiàn)有技術(shù)的上述缺陷，提供一種用于寬帶語音解碼中基音增強后處理的方法和裝置，能夠在不增加額外傳輸比特率的條件下以較低的運算復(fù)雜度實現(xiàn)基音增強處理和能量平滑，以達到寬帶解碼語音信號主觀音質(zhì)的提高。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是提出一種用于寬帶語音解碼中基音增強后處理的方法，包括如下步驟
SI、處理語音信號中每一子幀的解碼參數(shù)，分別計算出固定碼矢和自適應(yīng)碼矢；
S2、將固定碼矢和自適應(yīng)碼矢相加,合成第一激勵信號；
S3、將自適應(yīng)碼矢進行基音增強濾波，得到基音增強后的自適應(yīng)碼矢；
S4、將固定碼矢和基音增強后的自適應(yīng)碼矢相加，合成第二激勵信號；
S5、利用第一激勵信號對第二激勵信號執(zhí)行能量平滑，輸出第三激勵信號。
本發(fā)明上述用于寬帶語音解碼中基音增強后處理的方法中，所述步驟SI進一步包括
S11、將碼本索引解碼，得到固定碼矢；
S12、將基音索引解碼并經(jīng)長時預(yù)測濾波，得到自適應(yīng)碼矢。
本發(fā)明上述用于寬帶語音解碼中基音增強后處理的方法中，所述步驟S3中基音增強濾波所采用的轉(zhuǎn)移函數(shù)為
權(quán)利要求
1.一種用于寬帶語音解碼中基音增強后處理的方法，其特征在于，包括如下步驟 51、處理語音信號中每一子幀的解碼參數(shù)，分別計算出固定碼矢和自適應(yīng)碼矢； 52、將固定碼矢和自適應(yīng)碼矢相加，合成第一激勵信號； 53、將自適應(yīng)碼矢進行基音增強濾波，得到基音增強后的自適應(yīng)碼矢； 54、將固定碼矢和基音增強后的自適應(yīng)碼矢相加，合成第二激勵信號； 55、利用第一激勵信號對第二激勵信號執(zhí)行能量平滑，輸出第三激勵信號。
2.根據(jù)權(quán)利要求I所述的方法，其特征在于，所述步驟SI進一步包括 511、將碼本索引解碼，得到固定碼矢； 512、將基音索引解碼并經(jīng)長時預(yù)測濾波，得到自適應(yīng)碼矢。
3.根據(jù)權(quán)利要求I所述的方法，其特征在于，所述步驟S3中基音增強濾波所采用的轉(zhuǎn)移函數(shù)為
4.根據(jù)權(quán)利要求I所述的方法，其特征在于，所述步驟S5進一步包括 551、計算第一激勵信號和第二激勵信號的能量以得到能量縮放因子
5.一種用于寬帶語音解碼中基音增強后處理的裝置，其特征在于，包括碼矢計算模塊，用于處理語音信號中每一子幀的解碼參數(shù)，分別計算出固定碼矢和自適應(yīng)碼矢；第一合成模塊，用于將固定碼矢和自適應(yīng)碼矢相加，合成第一激勵信號；基音增強濾波模塊，用于將自適應(yīng)碼矢進行基音增強濾波，得到基音增強后的自適應(yīng)碼矢;第二合成模塊，用于將固定碼矢和基音增強后的自適應(yīng)碼矢相加，合成第二激勵信號; 能量平滑模塊，用于利用第一激勵信號對第二激勵信號執(zhí)行能量平滑，輸出第三激勵信號。
6.根據(jù)權(quán)利要求5所述的裝置，其特征在于，所述碼矢計算模塊進一步包括固定碼矢計算模塊，用于將碼本索引解碼，得到固定碼矢；自適應(yīng)碼矢計算模塊，用于將基音索引解碼并經(jīng)長時預(yù)測濾波，得到自適應(yīng)碼矢。
7.根據(jù)權(quán)利要求5所述的裝置，其特征在于，所述基音增強濾波模塊所采用的轉(zhuǎn)移函數(shù)為
8.根據(jù)權(quán)利要求5所述的裝置，其特征在于，所述能量平滑模塊進一步包括能量縮放因子計算模塊，用于計算第一激勵信號和第二激勵信號的能量以得到能量縮放因子
9.一種用于寬帶語音解碼的方法，其特征在于，包括如下步驟 a、對語音信號的解碼參數(shù)中的導(dǎo)譜頻率索引進行解碼處理，得到合成濾波器的轉(zhuǎn)移函數(shù)； b、通過根據(jù)權(quán)利要求1-4中任一項所述的方法得到激勵信號； C、使用步驟a得到的轉(zhuǎn)移函數(shù)對步驟b得到的激勵信號進行合成濾波，輸出語音信號。
10.一種用于寬帶語音解碼的解碼器，其特征在于，包括參數(shù)處理模塊，用于對語音信號的解碼參數(shù)中的導(dǎo)譜頻率索引進行解碼處理，得到合成濾波器的轉(zhuǎn)移函數(shù)；根據(jù)權(quán)利要求5-8中任一項所述的基音增強后處理的裝置，用于得到激勵信號；合成濾波器，用于使用參數(shù)解碼模塊得到的轉(zhuǎn)移函數(shù)對基音增強后處理裝置得到的激勵信號進行合成濾波，輸出語音信號。
全文摘要
本發(fā)明涉及一種用于寬帶語音解碼中基音增強后處理的方法和裝置。所述方法包括如下步驟S1、處理語音信號中每一子幀的解碼參數(shù)，分別計算出固定碼矢和自適應(yīng)碼矢；S2、將固定碼矢和自適應(yīng)碼矢相加，合成第一激勵信號；S3、將自適應(yīng)碼矢進行基音增強濾波，得到基音增強后的自適應(yīng)碼矢；S4、將固定碼矢和基音增強后的自適應(yīng)碼矢相加，合成第二激勵信號；S5、利用第一激勵信號對第二激勵信號執(zhí)行能量平滑，輸出第三激勵信號。本發(fā)明還涉及一種用于寬帶語音解碼的方法和解碼器。本發(fā)明在不增加額外傳輸比特率的條件下以較低的運算復(fù)雜度實現(xiàn)了基音增強處理和能量平滑，從而實現(xiàn)了寬帶解碼語音信號主觀音質(zhì)的提高。
文檔編號G10L19/12GK102930872SQ20121043609
公開日2013年2月13日申請日期2012年11月5日優(yōu)先權(quán)日2012年11月5日
發(fā)明者張勇, 閆建新申請人:深圳廣晟信源技術(shù)有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張勇;閆建新
技術(shù)所有人：深圳廣晟信源技術(shù)有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

氰基硼氫化鈉后處理相關(guān)技術(shù)

三溴化硼脫甲基后處理相關(guān)技術(shù)

四丁基氟化銨后處理相關(guān)技術(shù)

二異丁基氫化鋁后處理相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

用于寬帶語音解碼中基音增強后處理的方法及裝置的制作方法