專利名稱:解碼的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,特別是涉及解碼的方法及裝置。
技術(shù)背景在語(yǔ)音通信中,對(duì)于背景噪聲的編解碼是按ITU(International Telecom Union,國(guó)際電信聯(lián)盟)制定的G.729B中規(guī)定的噪聲處理方案進(jìn)行的。在語(yǔ)音編碼器中引入了靜音壓縮技術(shù),其信號(hào)處理原理框圖如圖l所示。 靜音壓縮技術(shù)主要包括三大才莫塊VAD(Voice Activity Detection,語(yǔ)音激 活檢測(cè))、DTX (Discontinuous Transmission,非連續(xù)傳!lr)和CNG (Comfort Noise Generator,舒適噪聲生成),其中VAD、 DTX是編碼器中的模塊,CNG 是解碼端中的模塊。圖1為一個(gè)簡(jiǎn)單的靜音壓縮系統(tǒng)原理框圖,其基本流程 為首先在發(fā)送端(編碼端),對(duì)每一輸入信號(hào)幀,VAD模塊對(duì)當(dāng)前的輸入 信號(hào)進(jìn)行分析和檢測(cè),檢測(cè)當(dāng)前信號(hào)中是否包含語(yǔ)音信號(hào),如果包含,則將 當(dāng)前幀設(shè)為語(yǔ)音幀,否則設(shè)為非語(yǔ)音幀。其次,編碼器根據(jù)VAD檢測(cè)結(jié)果對(duì)當(dāng)前信號(hào)進(jìn)行編碼,如果VAD檢測(cè) 結(jié)果為語(yǔ)音幀,則信號(hào)進(jìn)入語(yǔ)音編碼器進(jìn)行語(yǔ)音編碼,輸出為語(yǔ)音幀;如果 VAD檢測(cè)結(jié)果為非語(yǔ)音幀,則信號(hào)進(jìn)入DTX模塊用非語(yǔ)音編碼器進(jìn)行背景噪 聲處理,并輸出非語(yǔ)音幀。最后,在接收端(解碼端)對(duì)接收到的信號(hào)幀(包括語(yǔ)音幀和非語(yǔ)音幀) 進(jìn)行解碼。如果接收到的信號(hào)幀為語(yǔ)音幀,則用語(yǔ)音解碼器對(duì)其解碼,否則 進(jìn)入CNG模塊,在CNG模塊根據(jù)非語(yǔ)音幀傳過(guò)來(lái)的參數(shù)對(duì)背景噪聲進(jìn)行解 碼,產(chǎn)生舒適背景噪聲或靜音,使解碼后的信號(hào)聽(tīng)起來(lái)更為自然和連續(xù)。在編碼器中引入這種變速率的編碼方式,通過(guò)對(duì)靜音階段的信號(hào)進(jìn)行適 當(dāng)?shù)木幋a,靜音壓縮技術(shù)有效的解決了背景噪聲不連續(xù)的問(wèn)題,提高了信號(hào) 合成質(zhì)量,因此,解碼端的背景噪聲也可稱為舒適噪聲。另外,由于背景噪 聲的編碼速率要遠(yuǎn)遠(yuǎn)小于語(yǔ)音編碼速率,因此系統(tǒng)的平均編碼速率也大大降低,從而有效的節(jié)省了帶寬。G729B處理信號(hào)時(shí)對(duì)信號(hào)采用分幀處理,幀長(zhǎng)為10ms。為了節(jié)省帶寬, G.729.1還定義了靜音壓縮系統(tǒng)的需求,要求其在背景噪聲的情況下在不降低 信號(hào)整體編碼質(zhì)量的前提下采用低速率的編碼方式對(duì)背景噪聲進(jìn)行編碼傳 輸,即定義了 DTX和CNG的需求,更重要的一點(diǎn)是要求其DTX/CNG系統(tǒng) 要能夠兼容G.729B。雖然可以將G.729B的DTX/CNG系統(tǒng)筒單移植到G.729.1 中,但有兩個(gè)問(wèn)題需要解決 一是這兩個(gè)編碼器的處理幀長(zhǎng)不同,直接移植 會(huì)帶來(lái)一些問(wèn)題,而且729B的DTX/CNG系統(tǒng)有些簡(jiǎn)單,尤其是參數(shù)提取部 分,為了滿足G.729.1DTX/CNG系統(tǒng)的需求需要對(duì)729B的DTX/CNG系統(tǒng)進(jìn) 行擴(kuò)展。二是G.729.1處理的信號(hào)帶寬為寬帶,而G.729B處理的帶寬為窄帶, 在G.729.1的DTX/CNG系統(tǒng)還要加入背景噪聲信號(hào)高頻帶部分(4000Hz~ 7000Hz)的處理方式,^使其成為一個(gè)完整的系統(tǒng)?,F(xiàn)有技術(shù)中至少存在如下問(wèn)題現(xiàn)有的G.729B系統(tǒng)由于處理的帶寬為窄 帶背景噪聲,在移植到G.729.1系統(tǒng)中時(shí),不能保證編碼信號(hào)的質(zhì)量。 發(fā)明內(nèi)容有鑒于此,本發(fā)明一個(gè)或多個(gè)實(shí)施例的目的在于提供一種解碼的方法及 裝置,以實(shí)現(xiàn)在將G/729B進(jìn)行擴(kuò)展后,能夠符合G.729.1技術(shù)標(biāo)準(zhǔn)的要求, 實(shí)現(xiàn)了在保證編碼質(zhì)量的情況下,顯著降低信號(hào)的通信帶寬。 為解決上述問(wèn)題,本發(fā)明實(shí)施例提供了一種解碼的方法,包括從第 一個(gè)超幀的第 一幀之前的語(yǔ)音編碼幀,獲得第 一個(gè)超幀的第 一幀的 CNG參數(shù);根據(jù)所述CNG參數(shù),對(duì)第一個(gè)超幀的第一幀進(jìn)行背景噪聲解碼,所述 CNG參數(shù)包括目標(biāo)激勵(lì)增益,所述目標(biāo)激勵(lì)增益由長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀量化的固定 碼本增益確定;LPC濾波器系數(shù),所述LPC濾波器系數(shù)由長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀量化的 LPC濾波器系數(shù)定義。還提供了一種解碼裝置,包括CNG參數(shù)獲得單元,用于從第一個(gè)超幀的第一幀之前的語(yǔ)音編碼幀,5獲得第 一個(gè)超幀的第 一幀的CNG參數(shù);
第一解碼單元,用于根據(jù)所述CNG參數(shù),對(duì)第一個(gè)超幀的第一幀進(jìn)行 背景噪聲解碼,所述CNG參數(shù)包括
目標(biāo)激勵(lì)增益,所述目標(biāo)激勵(lì)增益由長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀量化的固定 碼本增益確定;
LPC濾波器系數(shù),所述LPC濾波器系數(shù)由長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀量化的 LPC濾波器系數(shù)定義。
與現(xiàn)有4支術(shù)相比,本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn)
本發(fā)明實(shí)施例通過(guò)提取拖尾時(shí)間內(nèi)的背景噪聲特征參數(shù);對(duì)所述拖尾時(shí) 間后的第 一個(gè)超幀,根據(jù)提取的所述背景噪聲特征參數(shù)和所述第 一個(gè)超幀的 背景噪聲特征參數(shù),進(jìn)行背景噪聲編碼;對(duì)第一個(gè)超幀后的超幀,對(duì)每一幀 都進(jìn)行背景噪聲特征參數(shù)提取和DTX判決;對(duì)第一個(gè)超幀后的超幀,根據(jù)提 取的當(dāng)前超幀的背景噪聲特征參數(shù)和所述當(dāng)前超幀之前若干超幀的背景噪聲 特征參數(shù),以及最終DTX判決結(jié)果,進(jìn)4亍背景噪聲編碼。實(shí)現(xiàn)了 首先,在保證編碼質(zhì)量的情況下,顯著降4氐信號(hào)的通信帶寬。 其次,通過(guò)對(duì)于G,729B系統(tǒng)的擴(kuò)展,符合了 G.729.1系統(tǒng)指標(biāo)的要求。 再次,通過(guò)靈活準(zhǔn)確的背景噪聲特征參數(shù)的提取,使得背景噪聲的編碼 更加4青確。
圖1所示,為一個(gè)簡(jiǎn)單的靜音壓縮系統(tǒng)原理框圖2所示,是G729.1編碼器功能框圖3所示,是G.729.1解碼器系統(tǒng)框圖4所示,是本發(fā)明的編碼的方法的實(shí)施例一的流程圖5所示,是對(duì)第一個(gè)超幀編碼的流程示意圖6所示,是窄帶部分參數(shù)提取及DTX判決的流程圖7所示,是當(dāng)前超幀中的窄帶部分背景噪聲參數(shù)提取及DTX判決流程
圖8所示,是本發(fā)明的解碼方法的實(shí)施例一的流程圖; 圖9所示,是本發(fā)明的編碼裝置的實(shí)施例一的框圖;圖10所示,是本發(fā)明的解碼裝置的實(shí)施例一的框圖。
具體實(shí)施例方式
下面結(jié)合附圖對(duì)本發(fā)明具體實(shí)施方式
做進(jìn)一步的詳細(xì)闡述。
首先,介紹G,729B系統(tǒng)的有關(guān)原理。 1.1.2.語(yǔ)音編碼碼流和背景噪聲編碼碼流中編碼參數(shù)的異同 在當(dāng)前的語(yǔ)音編碼器中,背景噪聲的合成原理與語(yǔ)音的合成原理相同, 采用的模型均是CELP ( Code Excited Linear Prediction,碼激勵(lì)線性預(yù)測(cè))模 型。語(yǔ)音的合成原理是語(yǔ)音s(")可以看成是一個(gè)激勵(lì)信號(hào)e(w)激勵(lì)一個(gè)合成 濾波器v(")所產(chǎn)生的輸出,即s(")-e(")"(w),這就是語(yǔ)音產(chǎn)生的數(shù)學(xué)模型。在 合成背景噪聲時(shí)用的也是這個(gè)模型,所以背景噪聲編碼碼流中所傳輸?shù)拿枋?背景噪聲和靜音特性的特征參數(shù)內(nèi)容與語(yǔ)音編碼碼流中的特征參數(shù)基本相 同,為信號(hào)合成時(shí)的合成濾波器參數(shù)和激勵(lì)參數(shù)。
在語(yǔ)音編碼碼流中,合成濾波器參數(shù)主要為線譜頻率LSF量化參數(shù),而 激勵(lì)信號(hào)參數(shù)包括基音延遲參數(shù)、基音增益參數(shù)、固定碼本參數(shù)和固定碼 本增益參數(shù)=不同的語(yǔ)音編碼器,這些參數(shù)、的量化比特l史和量化形式有所不 同;相同的編碼器,如果其包含多個(gè)速率,在不同速率下,由于描述信號(hào)特 性的側(cè)重點(diǎn)不同,編碼參數(shù)的量化比特?cái)?shù)和量化形式也有所不同。
與語(yǔ)音編碼參數(shù)不同,背景噪聲編碼參數(shù)描述的是背景噪聲特性,由于 背景噪聲的激勵(lì)信號(hào)可以認(rèn)為是簡(jiǎn)單的噪聲隨機(jī)序列,而這些序列在編解碼 端均可以簡(jiǎn)單的用隨機(jī)噪聲產(chǎn)生模塊產(chǎn)生,然后用能量參數(shù)控制這些序列的 幅度,就可產(chǎn)生最終的激勵(lì)信號(hào),因此激勵(lì)信號(hào)特征參數(shù)可以簡(jiǎn)單的用能量 參數(shù)來(lái)表示,而不需要用其它的一些特征參數(shù)來(lái)進(jìn)一步描述,所以在背景噪 聲編碼碼流中,其激勵(lì)參數(shù)為當(dāng)前背景噪聲幀的能量參數(shù),這與語(yǔ)音幀不同; 與語(yǔ)音幀相同的是,背景噪聲編碼碼流中的合成濾波器參數(shù)也為線語(yǔ)頻率LSF 量化參數(shù),只是具體的量化方法有所差別。通過(guò)以上分析,可以認(rèn)為對(duì)背景 噪聲的編碼方式本質(zhì)上就是一種簡(jiǎn)單的"語(yǔ)音"編碼方式。
G.729B的噪聲處理方案(引用729B協(xié)議)1.2.1 DTX/CNG總體技術(shù)介紹
G.729B的靜音壓縮方案是較早的一種靜音壓縮技術(shù),其背景噪聲編解碼 技術(shù)基于的算法模型是CELP,因此其所傳輸?shù)谋尘霸肼晠?shù)也是基于CELP 模型來(lái)提取的,是描述背景噪聲的合成濾波器參數(shù)與激勵(lì)參數(shù),其中激勵(lì)參 數(shù)是描述背景噪聲能量的能量參數(shù),沒(méi)有描述語(yǔ)音激勵(lì)的自適應(yīng)和固定碼本 參數(shù),濾波器參數(shù)與語(yǔ)音編碼參數(shù)基本一致,是LSF參數(shù)。在編碼端,對(duì)每 幀輸入的語(yǔ)音信號(hào),若VAD的判決結(jié)果為"0",表示當(dāng)前的信號(hào)為背景噪聲, 那么編碼器將信號(hào)送入DTX模塊,在DTX模塊對(duì)背景噪聲參數(shù)進(jìn)行提取, 然后根據(jù)每幀參數(shù)變化情況來(lái)對(duì)背景噪聲編碼若當(dāng)前幀提取的的濾波器參 數(shù)和能量參數(shù)與前幾幀的變化較大,那么表示當(dāng)前的背景噪聲特性與之前的 背景噪聲特性相比有較大的差別,則在噪聲編碼;漠塊將當(dāng)前幀提取的背景噪 聲參數(shù)進(jìn)行編碼,組裝成SID幀(Silence Insertion Descriptor,靜音描述幀) 發(fā)送到解碼端,否則發(fā)送NODATA幀(無(wú)數(shù)據(jù))到解碼端。SID幀和NODATA 幀稱為非語(yǔ)音幀。在解碼端,若進(jìn)入背景噪聲階段,則在CNG模塊中根據(jù)接 收的非語(yǔ)音幀合成出描述編碼端背景噪聲特性的舒適噪聲。
G,729B處理信號(hào)時(shí)對(duì)信號(hào)采用分幀處理,幀長(zhǎng)為10ms。下面分三節(jié)分別 描述729B的DTX、噪聲編碼和CNG模塊。
1.2.2 DTX模塊
DTX模塊主要用來(lái)做背景噪聲參數(shù)的估計(jì)與量化以及SID幀的發(fā)送。在 非話音階段,DTX模塊需要將背景噪聲信息發(fā)送到解碼端,背景噪聲信息被 封裝在SID幀中發(fā)送,若當(dāng)前的背景噪聲不平穩(wěn)那么發(fā)送SID幀,否則不發(fā) 送SID幀,而發(fā)送沒(méi)有任何數(shù)據(jù)的NODATA幀。另外兩個(gè)相鄰SID幀間的間 隔是有限制的,限制為兩幀,若背景噪聲不平穩(wěn),需要連續(xù)的發(fā)送SID幀, 那么后一個(gè)SID幀的發(fā)送會(huì)延遲。
在編碼端,DTX模塊會(huì)從編碼器中接收VAD模塊的輸出,自相關(guān)系數(shù) 以及過(guò)去的激勵(lì)樣點(diǎn),在每一幀,DTX模塊會(huì)用三個(gè)值O、 1、 2來(lái)分別描述非發(fā)送幀,語(yǔ)音幀和SID幀,它們的幀類型分別為F妙-O、尸妙=1和^妙=2。
背景噪聲估計(jì)的內(nèi)容是背景噪聲的能量電平和頻譜包絡(luò),這個(gè)和語(yǔ)音編 碼參數(shù)在本質(zhì)上是一致的,因此頻鐠包絡(luò)的計(jì)算和語(yǔ)音編碼參數(shù)的計(jì)算基本
一致,用到的參數(shù)包括了前兩幀的參數(shù);而能量參數(shù)也是前幾幀能量的一個(gè) 平均值。
DTX模塊的主要操作
a、 每幀自相關(guān)系數(shù)的存儲(chǔ)
對(duì)每一輸入的信號(hào)幀,包括語(yǔ)音幀的和非語(yǔ)音幀,將當(dāng)前幀^的自相關(guān)系 數(shù)保留在緩存中,這些自相關(guān)系數(shù)表示為r;(力,y = 0...10。其中y為每幀自 相關(guān)函數(shù)的序號(hào)。
b、 估計(jì)當(dāng)前的幀類型
如果當(dāng)前是一個(gè)語(yǔ)音幀,即VAD-l,那么將當(dāng)前的幀類型設(shè)為1,若為 非語(yǔ)音幀,則依據(jù)前一幀和本幀的自相關(guān)系數(shù)計(jì)算一個(gè)當(dāng)前的LPC濾波器 4(z),在計(jì)算4(z)之前會(huì)首先計(jì)算相鄰兩幀自相關(guān)系數(shù)的平均值
^>'(y),_/ = 0 ,10
其中A^-2,計(jì)算出及'(力后依據(jù)Levinson-Durbin算法計(jì)算出4(z)。另外 Levinson-Durbin算法也會(huì)計(jì)算出殘差能量五,,并以此做幀激勵(lì)能量的簡(jiǎn)單估計(jì)。
當(dāng)前幀的幀類型會(huì)用以下的方式進(jìn)行估計(jì)
9(1) 、如果當(dāng)前的幀是第一個(gè)非活動(dòng)幀,那么將此幀設(shè)為SID幀,并令表
征信號(hào)能量的變量f等于五,,表征幀數(shù)目的參數(shù)&會(huì)設(shè)成1:<formula>formula see original document page 10</formula>
(2) 、對(duì)于其它的非語(yǔ)音幀,算法將之前的SID幀參數(shù)與當(dāng)前相應(yīng)的參數(shù) 進(jìn)行對(duì)比,如果當(dāng)前的濾波器與之前的濾波器差別較大或者當(dāng)前的激勵(lì)能量 與之前的激勵(lì)能量較大,那么令標(biāo)志/^g—c/umge等于1,否則標(biāo)志的值不變。
(3) 、當(dāng)前的計(jì)數(shù)器o^w—#表示了當(dāng)前幀與上一個(gè)SID之間的幀的數(shù)目。 如果其值大于iV^,那么發(fā)送SID幀;另外如果y7ag—c/umge等于1, SID幀也 會(huì)發(fā)送,其它情況下,不發(fā)送當(dāng)前幀
<formula>formula see original document page 10</formula>
在SID幀的情況下,計(jì)lt器com"O和標(biāo)志c/iawge重新初始化成0。 c、 LPC濾波器系數(shù)
設(shè)上一個(gè)SID的LPC濾波器4,》)的系數(shù)為 力'),_/ = 0...10,如果當(dāng)前幀 和上一幀的SID-LPC濾波器的Itakura距離超過(guò)了一定的門限,就認(rèn)為二者有 很大的不同<formula>formula see original document page 11</formula>
其中,及。C/)J = o...io是SID濾波器系數(shù)的自相關(guān)系數(shù)
<formula>formula see original document page 11</formula>
d、幀能量 計(jì)算幀能量的和
然后對(duì)f用5比特的對(duì)數(shù)量化器量化。解碼之后的對(duì)數(shù)能量^會(huì)與上一個(gè)解 碼后的SID對(duì)數(shù)能量《"進(jìn)行比較,如果二者的差超過(guò)了 2dB,那么認(rèn)為二者
的能量差別較大。
1.2.3 噪聲編碼及SID幀
SID幀中的參數(shù)就是LPC濾波器系數(shù)(頻鐠包絡(luò))和能量的量化參數(shù)。
在對(duì)SID-LPC濾波器計(jì)算時(shí)考慮了相鄰噪聲幀之間的穩(wěn)定情況
首先,計(jì)算當(dāng)前SID幀之前乂幀的平均LPC濾波器2p(z),這要用到自相
關(guān)函數(shù)和&(力,然后將&(力送入Levinson-Durbin算法中得到Z/z),而&(力
表示為
<formula>formula see original document page 11</formula>其中~的值定為6。幀數(shù)目r的范圍是[卜l,卜ivj。這樣,SID-LPC濾波器表 示為
_
即算法會(huì)計(jì)算前幾幀的平均LPC濾波器系數(shù)4(z),然后用其與當(dāng)前的LPC 濾波器系數(shù)4(z)進(jìn)行比較,若二者差值較小,那么當(dāng)前幀在量化LPC系數(shù)時(shí) 選擇的就是前幾幀的平均值4(力,否則就是當(dāng)前幀的4(z)。選^^LPC濾波 器系數(shù)之后,算法將這些LPC濾波器系數(shù)轉(zhuǎn)化到LSF域,然后進(jìn)行量化編碼, 而量化編碼選擇的方式與語(yǔ)音編碼的量化編碼方式是一樣的。
能量參數(shù)的量化在對(duì)數(shù)域完成,釆用的是線性的量化,然后用5bit進(jìn)行 編碼。這樣對(duì)背景噪聲的編碼就已完成,然后將這些編碼比特封裝在SID幀 中。如表A所示
表A
TABLE B.2/G.729
P^ameter description
Switched predictor index of LSF quauti^r1
Fiist stage vector of LSF quantizer
^cond stage of LSF quantiz歐4
C^in (Energy)5
SID幀中的參數(shù)由四個(gè)碼本索引構(gòu)成,其中一個(gè)用來(lái)指示能量量化索引 (5比特),另三個(gè)指示頻譜量化的索引(IO比特)。
121.2.4 CNG模塊
在解碼端,算法用一個(gè)電平可控的偽白噪聲激勵(lì)一個(gè)經(jīng)內(nèi)插得到的LPC 合成濾波器得到舒適的背景噪聲,這在本質(zhì)上與語(yǔ)音的合成方式一樣。其中 激勵(lì)電平和LPC濾波器系數(shù)分別從上一個(gè)SID幀中得到。子幀的LPC濾波器 系數(shù)通過(guò)SID幀中的LSP參數(shù)的內(nèi)插來(lái)得到,而內(nèi)插方法與語(yǔ)音編碼器中的 內(nèi)插方式是一致的。
偽白噪聲激勵(lì)ex(n)是語(yǔ)音激勵(lì)exl(n)和高斯白噪聲激勵(lì)ex2(n)的一個(gè)混 合。exl(n)的增益較小,而采用exl(n)的目的是為了讓語(yǔ)音和非語(yǔ)音間的過(guò)渡 更為自然。
這樣得到激勵(lì)信號(hào)后用其激勵(lì)合成濾波器即可得到舒適的背景噪聲。 由于編解碼雙方的非語(yǔ)音編解碼要保持同步,所以在雙方都要為SID幀
和不發(fā)送幀產(chǎn)生激勵(lì)信號(hào)。
首先,定義目標(biāo)激勵(lì)增益5,,令其作為當(dāng)前幀激勵(lì)平均能量的平方根,g,
由下面的平滑算法得到,其中5^是解碼后的SID幀的增益
7 ~ 1 ~
—+—eternise 、8 8
80個(gè)采樣點(diǎn)被分成兩個(gè)子幀,對(duì)每個(gè)子幀,CNG模塊的激勵(lì)信號(hào)會(huì)用如下的 方式來(lái)合成
13(1) 、在[40,103]范圍內(nèi)隨機(jī)選擇基音延遲;
(2) 、子幀的固定碼本矢量中非零脈沖的位置和符號(hào)隨機(jī)選擇(這些非零脈沖的位置和符號(hào)的結(jié)構(gòu)與G.729是一致的);
(3) 、選擇一個(gè)帶增益的自適應(yīng)碼本激勵(lì)信號(hào),將其標(biāo)記為^(")," = 0...39,而選擇的固定碼本激勵(lì)信號(hào)標(biāo)記為e,("),w = 0...39 。然后以子幀能量為依據(jù)計(jì)算自適應(yīng)增益g。和固定碼本增益gf:
1 / 、^汰x^(") + G,xe,("))2^2
需要注意的是g,可以選擇負(fù)值
/
/ 39 、 廣119 、
定義五。=2>。(")2 , 7= ,《=40x《2,而由ACELP的、激厲力
結(jié)構(gòu)可知2>,(")2=4。
如果將自適應(yīng)碼本增益g。固定,那么表現(xiàn)《的方程就變成了 一個(gè)關(guān)于g,的二階方程
g/+^g/+^g:—、o
, 2 7 4G。的值會(huì)被限定以確保上面的方程有解,更近一步,可以對(duì)一些大的自
適應(yīng)碼本增益值的應(yīng)用進(jìn)行限制,這樣,自適應(yīng)碼本增益G??梢栽谌缦碌姆秶鷥?nèi)隨才/L的選捧<formula>formula see original document page 15</formula>
將方程丄I;(G。 xe。( ) + G/ xe,("))2 =《的根中絕對(duì)值最小的作為G,的值。
40 fl=0
最后,用下式構(gòu)建G.729的激勵(lì)信號(hào)
ex"") = Ga xe。(w) + G, xe^[w],w = 0...39
合成激勵(lì)e;c(w)可由如下方法合成
設(shè)A是e;c,(")的能量,A是ex2(")的能量,£3是^(")和^2(")的點(diǎn)積
<formula>formula see original document page 15</formula>
而計(jì)算的點(diǎn)數(shù)超過(guò)自身的大小。
令a和"分別是混合激勵(lì)中ex^)和ex2(")的比例系數(shù),其中a設(shè)為0.6,而-依照下面的二次方程確定-.<formula>formula see original document page 15</formula>如果〃沒(méi)有解,那么/ 將被設(shè)成0,而a設(shè)成l。最終的CNG模塊的激勵(lì)變?yōu)?br>
以上即為729.B編碼器的DTX/CNG模塊的基本原理。1.3 G.729.1 編解碼器的基本流程
G.729.1是ITU最新發(fā)布的新一代語(yǔ)音編解碼標(biāo)準(zhǔn)(見(jiàn)參考文獻(xiàn)[1]),其是ITU-TG.729在8-32kbit/s可分級(jí)寬帶(50-7000Hz)上的擴(kuò)展。默認(rèn)情況下,編碼器輸入和解碼器輸出端采樣頻率為16000Hz。編碼器產(chǎn)生的碼流具有可分級(jí)性,包含12個(gè)嵌入式層,分別被稱作第1 12層。第l層為核心層,對(duì)應(yīng)比特率為8kbit/s。該層與G.729碼流一致,從而使得G.729EV與G.729具有互操作性。第2層為窄帶增強(qiáng)層,增加了4kbit/s,而第3 12層是寬帶增強(qiáng)層,以每層2kbit/s速度共增加20 kbit/s。
G.729.1編解碼器基于三階段結(jié)構(gòu)嵌入式碼激勵(lì)線性估計(jì)(CELP)編解碼,時(shí)域帶寬擴(kuò)展(TDBWE)以及被稱為時(shí)域混疊消除(TDAC)的估計(jì)轉(zhuǎn)換編解碼。嵌入式CELP階段產(chǎn)生第1和第2層,生成8kbit/s和12kbit/s窄帶合成信號(hào)(50-4000 Hz)。 TDBWE階段產(chǎn)生第3層,生成14kbit/s寬帶輸出信號(hào)(50-7000Hz)。 TDAC階段工作在改進(jìn)離散余弦變換(MDCT)域,生成第4~12層,將信號(hào)質(zhì)量從14kbit/s提高到32kbit/s。 TDAC編解碼同時(shí)代表50-4000 Hz頻帶加權(quán)CELP編解碼誤碼信號(hào)和4000-7000Hz頻帶輸入信號(hào)。
參考圖2所示,給出了G.729.1編碼器功能框圖。編碼器工作于20ms輸入超幀。默認(rèn)情況下,輸入信號(hào)^(w)在16000Hz進(jìn)行采樣。因此,輸入超幀具有320個(gè)采樣點(diǎn)長(zhǎng)度。首先,輸入信號(hào) ^(w)經(jīng)過(guò)QMF濾波(/^0),//2(2))分成兩個(gè)子帶,低子帶 信號(hào)^T(")經(jīng)過(guò)50Hz截止頻率的高通濾波器進(jìn)行預(yù)處理,輸出信號(hào)使用 8kb/s~12kb/s的窄帶嵌入式CELP編碼器進(jìn)行編碼,^(w)和12Kb/s碼率下
CELP編碼器的本地合成信號(hào)u(w)之間的差值信號(hào)為,將其經(jīng)過(guò)知覺(jué)加 權(quán)濾波(『^(z))后得到信號(hào)J^("),將c^(")通過(guò)MDCT變換到頻域。加權(quán)濾波
器包含了增益補(bǔ)償,用來(lái)保持濾波器輸出與高子帶輸入信號(hào)^(w)
之間的語(yǔ)連續(xù)性。
高子帶分量乘上(-l)"進(jìn)行語(yǔ)折疊之后獲得信號(hào)O),將《,(w)通過(guò)截止 頻率為3000HZ的低通濾波器進(jìn)行預(yù)處理,濾波后的信號(hào)^(w)使用TDBWE 編碼器進(jìn)行編碼。信號(hào)^(w)也通過(guò)MDCT變換為頻域信號(hào)。
兩組MDCT系數(shù)Z^W和S^(A:)最后使用TDAC編碼器進(jìn)行編碼。
另夕卜,還有一些參數(shù)用FEC(丟幀錯(cuò)誤隱蔽)編碼器進(jìn)行傳輸,用以改進(jìn)在 傳輸中出現(xiàn)丟幀時(shí)造成的錯(cuò)誤。
解碼器系統(tǒng)框圖如圖3所示,解碼器的實(shí)際工作模式由接收到的碼流層數(shù) 決定,也等價(jià)于由接收到的碼率決定。
(1) 、如果接收到的碼率為8kb/s或12kb/s(即僅接收到第一層或者前兩層) 第一層或者前兩層的碼流由嵌入式CELP解碼器進(jìn)行解碼,得到解碼后的信號(hào)
再進(jìn)行后濾波得到;r("),并經(jīng)高通濾波獲得^,(")"^(")。輸出信
號(hào)由QMF合成濾波器組產(chǎn)生,其中高頻合成信號(hào)&fW被置零。
(2) 、如果接收到的碼率為14kb/s (即接收到前三層)除了CELP解碼器
解碼出窄帶分量以外,TDBWE解碼器也解碼出高帶信號(hào)分量;^(w)。對(duì);=( )進(jìn)行MDCT變換,把高子帶分量譜中3000Hz以上(對(duì)應(yīng)于16kHz釆樣率中 7000Hz以上)頻率分量置0,然后進(jìn)行逆MDCT變換,迭加之后并進(jìn)行譜翻轉(zhuǎn),
然后在QMF濾波器組中將重建的高頻帶信號(hào)塔^(")與CELP解碼器解出的低
帶分量sf(")-^S^")—起合成i6kHz的寬帶信號(hào)(不進(jìn)行高通濾波)。
(3)、如果接收到14kb/s以上速率的碼流(對(duì)應(yīng)于前四層或者更多層) 除了 CELP解碼器解碼出低子帶分量^r(w) 、 TDBWE解碼器解碼出高子帶分 量;^(")以夕卜,TDAC解碼器還負(fù)責(zé)重建MDCT系數(shù)力^("和S:(", 二者分 別對(duì)應(yīng)于低頻帶(0-4000 Hz)重建加權(quán)差值和高頻帶(4000-7000 Hz)重建 信號(hào)(注意到在高頻帶中,非接收子帶和TDAC零碼分配子帶被替換為電平 調(diào)整子帶信號(hào)然^"))。力^W及^aW通過(guò)反向MDCT和重疊相加變換為時(shí) 域信號(hào)。然后,低頻帶信號(hào)"s(")經(jīng)由感知加權(quán)濾波器進(jìn)行處理。為減少變化 編碼帶來(lái)的影響,對(duì)低頻帶和高頻帶信號(hào)乜W和^W進(jìn)行前向/后向回聲監(jiān) 測(cè)和壓縮。低頻帶合成信號(hào)^W經(jīng)由后濾波處理,而高頻帶合成信號(hào);^W經(jīng) 由(-l)n頻語(yǔ)折疊處理。然后,QMF合成濾波器組對(duì)信號(hào)《f(") = "r(")和a7(") 進(jìn)行組合和上采樣,得到最終的16kHz的寬帶信號(hào)。
1.4 G.729.1 DTX/CNG系統(tǒng)的需求
為了節(jié)省帶寬,G.729.1還定義了靜音壓縮系統(tǒng)的需求,要求其在背景噪 聲的情況下在不降低信號(hào)整體編碼質(zhì)量的前提下采用低速率的編碼方式對(duì)背 景噪聲進(jìn)行編碼傳輸,即定義了 DTX和CNG的需求,更重要的一點(diǎn)是要求 其DTX/CNG系統(tǒng)要能夠兼容G.729B。雖然可以將G.729B的DTX/CNG系 統(tǒng)簡(jiǎn)單移植到G.729.1中,但有兩個(gè)問(wèn)題需要解決 一是這兩個(gè)編碼器的處理 幀長(zhǎng)不同,直接移植會(huì)帶來(lái)一些問(wèn)題,而且729B的DTX/CNG系統(tǒng)有些簡(jiǎn)單, 尤其是參數(shù)提取部分,為了滿足G.729.1DTX/CNG系統(tǒng)的需求需要對(duì)729B的 DTX/CNG系統(tǒng)進(jìn)行擴(kuò)展。二是G.729.1處理的信號(hào)帶寬為寬帶,而G.729B
18處理的帶寬為窄帶,在G.729.1的DTX/CNG系統(tǒng)還要加入背景噪聲信號(hào)高頻 帶部分(4000Hz~ 7000Hz )的處理方式,使其成為一個(gè)完整的系統(tǒng)。
在G.729.1中,可以將背景噪聲的高頻帶和低頻帶分別進(jìn)行處理。其中高 頻帶的處理方式比較簡(jiǎn)單,其背景噪聲特征參數(shù)的編碼方式可參考語(yǔ)音編碼 器的TDBWE編碼方式,判決部分簡(jiǎn)單比較頻域包絡(luò)和時(shí)域包絡(luò)的穩(wěn)定性即 可。本發(fā)明的技術(shù)方案及要解決的問(wèn)題是在低頻帶,也即窄帶。以下所指的 G.729.1DTX/CNG系統(tǒng),是指應(yīng)用于對(duì)窄帶DTX/CNG部分的有關(guān)處理過(guò)程。
參考圖4所示,是本發(fā)明的編碼的方法的實(shí)施例一,包括步驟
步驟401、提取拖尾時(shí)間內(nèi)的背景噪聲特征參數(shù);
步驟402、對(duì)所述拖尾時(shí)間后的第一個(gè)超幀,根據(jù)提取的所述拖尾時(shí)間內(nèi) 的背景噪聲特征參數(shù)和所述第一個(gè)超幀的背景噪聲特征參數(shù),進(jìn)行背景噪聲 編碼,得到第一個(gè)SID幀;
步驟403、對(duì)第一個(gè)超幀后的超幀,對(duì)每一幀都進(jìn)行背景噪聲特征參數(shù)提 取和DTX判決;
步驟404、對(duì)第一個(gè)超幀后的超幀,根據(jù)提取的當(dāng)前超幀的背景噪聲特征 參數(shù)和所述當(dāng)前超幀之前若干超幀的背景噪聲特征參數(shù),以及最終DTX判決 結(jié)果,進(jìn)行背景噪聲編碼。
利用本發(fā)明實(shí)施例,通過(guò)提取拖尾時(shí)間內(nèi)的背景噪聲特征參數(shù);對(duì)所述 拖尾時(shí)間后的第一個(gè)超幀,根據(jù)提取的所述拖尾時(shí)間內(nèi)的背景噪聲特征參數(shù) 和所述第一個(gè)超幀的背景噪聲特征參數(shù),進(jìn)行背景噪聲編碼;
對(duì)第一個(gè)超幀后的超幀,對(duì)每一幀都進(jìn)行背景噪聲特征參數(shù)提取和DTX 判決;
對(duì)第一個(gè)超幀后的超幀,根據(jù)提取的當(dāng)前超幀的背景噪聲特征參數(shù)和所 述當(dāng)前超幀之前若干超幀的背景噪聲特征參數(shù),以及最終DTX判決結(jié)果,進(jìn) 行背景噪聲編碼。實(shí)現(xiàn)了
首先,在保證編碼質(zhì)量的情況下,顯著降低信號(hào)的通信帶寬。 其次,通過(guò)對(duì)于G/729B系統(tǒng)的擴(kuò)展,符合了 G729.1系統(tǒng)指標(biāo)的要求。 再次,通過(guò)靈活準(zhǔn)確的背景噪聲特征參數(shù)的提取,使得背景噪聲的編碼 更加精確。
19在本發(fā)明的各個(gè)實(shí)施例中,如果為了適應(yīng)G.729.1相關(guān)技術(shù)標(biāo)準(zhǔn)的要求, 可以通過(guò)將每個(gè)超幀設(shè)置為20毫秒,將每個(gè)超幀所包含的幀設(shè)置為10毫秒。 利用本發(fā)明的各個(gè)實(shí)施例,均可以實(shí)現(xiàn)對(duì)于G.729B的擴(kuò)展,滿足G.729.1的 技術(shù)指標(biāo)。同時(shí),對(duì)于所屬領(lǐng)域的技術(shù)人員而言,可以明白,對(duì)于非G.729.1 系統(tǒng),應(yīng)用本發(fā)明的各個(gè)實(shí)施例所提供的技術(shù)方案,同樣可以達(dá)到對(duì)背景噪 聲以較低的頻帶占用,帶來(lái)較高的通信質(zhì)量。即本發(fā)明的應(yīng)用范圍不僅僅局 限于G729.1系統(tǒng)之內(nèi)。
下面結(jié)合附圖,詳細(xì)介紹本發(fā)明的編碼的方法的實(shí)施例二 由于G729.1和G729B的編碼幀長(zhǎng)不同,其中,前者是20ms—幀,后者 是10ms—幀。也就是說(shuō),G729.1的一幀與G729B的兩幀的長(zhǎng)度相對(duì)應(yīng)。為 描述方便,這里將G729.1的一幀為超幀(superframe), G729B的一幀為幀 (frame),本發(fā)明主要針對(duì)這種差別來(lái)描述G729.1的DTX/CNG系統(tǒng),即通 過(guò)對(duì)G729B DTX/CNG系統(tǒng)進(jìn)行升級(jí)和擴(kuò)展,以適應(yīng)ITU729.1的系統(tǒng)特點(diǎn)。
一、 噪聲的學(xué)習(xí)
首先,用語(yǔ)音編碼速率對(duì)背景噪聲的前120ms進(jìn)行編碼; 為了準(zhǔn)確的對(duì)背景噪聲的特征參數(shù)進(jìn)行提取,在語(yǔ)音幀結(jié)束(根據(jù)VAD 結(jié)果的指示,表明當(dāng)前幀已經(jīng)從活動(dòng)的語(yǔ)音變?yōu)榉腔顒?dòng)的背景噪聲)之后一 段時(shí)間內(nèi),并不馬上進(jìn)入背景噪聲處理階段,而是繼續(xù)用語(yǔ)音編碼速率對(duì)背 景噪聲進(jìn)行編碼。這一拖尾的時(shí)間一般為6個(gè)超幀,即120ms (可參考AMR 及AMRWB )。
其次,在這一拖尾時(shí)間內(nèi),對(duì)每一個(gè)超幀的每一 10ms幀,均對(duì)背景噪聲 的自相關(guān)系數(shù)么C/),y-0…10進(jìn)行緩存,其中t為超幀序號(hào),1^1,2為每個(gè)超幀 中第1個(gè)和第2個(gè)10ms幀的序號(hào)。由于這些自相關(guān)系數(shù)表征了拖尾階段背景 噪聲的特性,因此在對(duì)背景噪聲進(jìn)行編碼時(shí)就可以依據(jù)這些自相關(guān)系數(shù),準(zhǔn) 確的提取出背景噪聲的特征參數(shù),從而使得對(duì)背景噪聲的編碼更加精確。在 實(shí)際運(yùn)用中,噪聲學(xué)習(xí)所持續(xù)的時(shí)間長(zhǎng)度,可以根據(jù)實(shí)際需要進(jìn)行設(shè)定,不 限于120ms;可以根據(jù)需要將拖尾時(shí)間設(shè)置為其他的數(shù)值。
二、 對(duì)拖尾階段后第一個(gè)超幀進(jìn)行編碼
在拖尾階段結(jié)束之后,采用背景噪聲的處理方式對(duì)背景噪聲進(jìn)行處理。參考圖5所示,是對(duì)第一個(gè)超幀編碼的流程示意圖,包括步驟
在拖尾階段結(jié)束后的第一個(gè)超幀,對(duì)噪聲學(xué)習(xí)階段以及當(dāng)前超幀提取出 來(lái)的背景噪聲特征參數(shù)進(jìn)行編碼,得到第一個(gè)SID超幀,由于在拖尾階段之后 的第一個(gè)超幀要進(jìn)行背景噪聲參數(shù)的編碼傳輸,因此這一超幀一般稱為第一 個(gè)SID超幀;編碼后生成的第一個(gè)SID超幀在發(fā)送到解碼端后進(jìn)行解碼。由于 一個(gè)超幀對(duì)應(yīng)兩個(gè)10ms幀,為了準(zhǔn)確獲得編碼參數(shù),會(huì)在第2個(gè)10ms幀提取出 背景噪聲的特征參數(shù)4(z)和五,
LPC濾波器4(z)和殘差能量五,的計(jì)算方式如下 步驟501、計(jì)算緩存中所有自相關(guān)系數(shù)的平均值
Z乂V, ,.=/—w,+l A=l
其中7\^=5,也就是緩存的大小為10個(gè)10ms幀。
步驟502、由自相關(guān)系數(shù)的平均值i '(力,根據(jù)Levinson-Durbin算法計(jì)算出 LPC濾波器4(z),其系數(shù)為a力〕,y-0,…,10,同時(shí)Levinson-Durbin算法也會(huì)計(jì)算 出殘差能量^ ,并以此作為當(dāng)前超幀能量參數(shù)的簡(jiǎn)單估計(jì)。
其中,在實(shí)際運(yùn)用中,為了獲得更加穩(wěn)定的超幀能量參數(shù)估計(jì),還可以 對(duì)估計(jì)出的殘差能量《進(jìn)行了長(zhǎng)時(shí)的平滑,并將平滑后的能量估計(jì)£—ZT作為 當(dāng)前超幀能量參數(shù)的最終估計(jì)重新賦給《,平滑操作如下
五—丄r = cK£_i:r + (i—ck^e;£;=五—丄r
其中,"取值范圍為0<"<1,作為優(yōu)選實(shí)施例中,"取 (i可以為0.9。也可
以根據(jù)需要設(shè)置為其他值。
步驟503、算法將LPC濾波器系數(shù)4(z)轉(zhuǎn)化到LSF域,然后進(jìn)行量化編
碼;
步驟504、殘差能量參數(shù)《的量化在對(duì)數(shù)域完成,采用的是線性的量化。
在背景噪聲窄帶部分的編碼完成之后,將這些編碼比特封閉在SID幀中 傳送到解碼端,這樣就完成了第一個(gè)SID幀窄帶部分的編碼。
在本發(fā)明的實(shí)施例中,對(duì)于第一個(gè)SID幀窄帶部分的編碼充分考慮了拖 尾階段背景噪聲的特性,將背景噪聲在拖尾階段的特性反映在了編碼參數(shù)中, 從而使得這些編碼參數(shù)最大限度地表征了當(dāng)前背景噪聲的特性。因此,本發(fā) 明的實(shí)施例中的參數(shù)提取相對(duì)于G.729B更加準(zhǔn)確合理。
三、DTX的判決
為了清楚描述的需要,設(shè)提取的參數(shù)的表現(xiàn)形式是A4M"其中t為超幀 序號(hào),"k=l,2,,為每個(gè)超幀中第1個(gè)和第2個(gè)10ms幀的序號(hào)。那么對(duì)于除了 第一個(gè)超幀之外的其他非語(yǔ)音超幀,需要對(duì)每一 10ms幀的參數(shù)進(jìn)行提取和 DTX判決。
參考圖6所示,是窄帶部分參數(shù)提取及DTX判決的流程圖,包括步驟 首先,進(jìn)行第一個(gè)超幀后的第一個(gè)10毫秒幀的背景噪聲參數(shù)提取及DTX 判決;
對(duì)于所述第一個(gè)10毫秒幀,背景噪聲的語(yǔ)參數(shù)4,(z)和激勵(lì)能量參數(shù)五,,,的 計(jì)算方式如下
步驟601、根據(jù)最近四個(gè)相鄰10ms幀自相關(guān)系數(shù)《,(力、r(',_1)2C/)、 和r(',_2X2C/)的值,計(jì)算當(dāng)前自相關(guān)系數(shù)的穩(wěn)態(tài)平均值7 "(力
22= 0.5 * "') + 0.5 * ^2C/), / = 0…10
其中,^"y)和^2(力表示^(力、"(_/)、吆,c/)和^2),2(力中具有次最小和 次次最小自相關(guān)系數(shù)范數(shù)值的自相關(guān)系數(shù),也就是除去具有最大和最小自相 關(guān)系數(shù)范數(shù)值所剩下的具有中間自相關(guān)系數(shù)范數(shù)值的兩個(gè)10ms幀的自相關(guān) 系數(shù)
么(力、""力、d)力')和^2),2(力的自相關(guān)系數(shù)范數(shù)分別為:
10, 2
"畫"=》"( /)
)=0
io 2
乂=0
10, 2
離"Vi),i=》(:一1),1 (力
10, 2
wo/7n(,_2)2 2)2 (y)
_/ =。
將這四個(gè)自相關(guān)系數(shù)范數(shù)值進(jìn)行排序,則和^2(力對(duì)應(yīng)于具有中間 自相關(guān)系數(shù)范數(shù)值大小的兩個(gè)10ms幀的自相關(guān)系數(shù)。
步驟602、由當(dāng)前自相關(guān)系數(shù)的穩(wěn)態(tài)平均值i "(力,根據(jù)Levinson-Durbin 算法計(jì)算出背景噪聲的LPC濾波器4,々),其系數(shù)為",(力,7 = 0,...,10,同時(shí) Levinson-Durbin算法也會(huì)計(jì)算出殘差能量^ ;
其中,在實(shí)際運(yùn)用中,算法為了獲得更加穩(wěn)定的幀能量估計(jì),對(duì)估計(jì)出 的五,,,,還可以進(jìn)行長(zhǎng)時(shí)的平滑,并將平滑后的能量估計(jì)E—iT作為當(dāng)前幀激
23勵(lì)能量估計(jì)重新賦值給g,,操作如下 五—丄n = a£—+(1—,
"取值為0.9。
步驟603、參數(shù)提取之后,進(jìn)行當(dāng)前10ms幀的DTX判決;DTX判決的具體 內(nèi)容是
算法將之前的SID超幀(SID超幀就是經(jīng)DTX判決后最終要編碼發(fā)送的背 景噪聲超幀,如果DTX判決結(jié)果,該超幀不發(fā)送,則不稱之為SID超幀)中窄 帶部分編碼參數(shù)與當(dāng)前10毫秒幀相應(yīng)的編碼參數(shù)進(jìn)行對(duì)比,如果當(dāng)前的LPC 濾波器系數(shù)與之前SID超幀中的LPC濾波器系數(shù)差別較大,或者當(dāng)前的能量參 數(shù)與之前SID超幀中的能量參數(shù)差別較大(見(jiàn)下面的公式),則將當(dāng)前10ms幀 的參數(shù)變化標(biāo)志y ag—c/w"ge—,w置l,否則清零。本步驟中的具體的確定方法 與G,729B類似
首先,設(shè)上一個(gè)SID超幀中的LPC濾波器4w(z)的系數(shù)為&(力,y-0...10, 如果當(dāng)前10ms幀和上一 SID超幀的LPC濾波器的Itakura距離超過(guò)了一定的 門限,就令y/"g—c/wwge—,w置1,否則置零10
乂=0
_/7ag—c/iflwge _ ,W = 1
y ag—c/iawge — ,W = 0 其中,^是具體的門限值,一般在l.O到1.5之間,本實(shí)施例中為1.342676475, ; 。(_/),_/ = O...IO是上一 SID超幀LPC濾波器系數(shù)的自相關(guān)系數(shù)
10
^(o)=|X.#)2
其次,計(jì)算當(dāng)前10ms幀和最近三個(gè)10ms幀共四個(gè)10ms幀殘差能量的 平均值
十U^+U/4
需要注意的是,如果當(dāng)前超幀是噪聲編碼階段的第二個(gè)超幀(即前一個(gè)超幀
是第一個(gè)超幀),那么《—2,2的值為0。對(duì)^用對(duì)數(shù)量化器量化。將解碼之后的
對(duì)數(shù)能量五w與上一 SID超幀解碼后的對(duì)數(shù)能量《"進(jìn)行比較,如果二者的差
超過(guò)3dB,就令y ag—c/w"ge—y w置一,否則置零
3
一 一 = 1
對(duì)于所屬領(lǐng)域的技術(shù)人員而言,可以根據(jù)實(shí)際需要將兩個(gè)激勵(lì)能量的差 設(shè)置為其他的值,這沒(méi)有超出本發(fā)明的保護(hù)范圍。在進(jìn)行了第一個(gè)10ms幀的背景噪聲參數(shù)提取及DTX判決之后,就進(jìn)行第 二個(gè)10ms幀的背景噪聲參數(shù)提取及DTX判決。
第二個(gè)10ms幀的背景噪聲參數(shù)提取及DTX判決流程與第 一 個(gè)10ms幀一 致,其中第二個(gè)10ms幀的相關(guān)參數(shù)為相鄰四個(gè)10ms幀自相關(guān)系數(shù)的穩(wěn)態(tài)平 均值i "(力,相鄰四個(gè)10ms幀幀能量的平均值^2以及第二個(gè)10ms幀的DTX標(biāo) 志y ag—c/ 朋ge—seco"c 。
四、當(dāng)前超幀中的窄帶部分背景噪聲參數(shù)提取及DTX判決。
參考圖7所示,是當(dāng)前超幀中的窄帶部分背景噪聲參數(shù)提取及DTX判決流
程圖,包括步驟
步驟701、確定當(dāng)前超幀窄帶部分的最終DTX標(biāo)志y ag—c/za"ge,其確定方
式如下
—c/ OMge =/7ag—cAcr"ge—,W 11 _/7ag——sec owe 即只要有一個(gè)10ms幀的DTX判決結(jié)果為l,則當(dāng)前超幀窄帶部分的最終判 決結(jié)果為l。
步驟702、確定當(dāng)前超幀的最終DTX判決結(jié)果;包括當(dāng)前超幀高頻帶部分 在內(nèi)的當(dāng)前超幀的最終DTX判決結(jié)果,則還要考慮高頻帶部分的特性,由窄 帶部分和高頻帶部分綜合決定當(dāng)前超幀的最終DTX判決結(jié)果。如果當(dāng)前超幀的最終DTX判決結(jié)果為l,則進(jìn)入步驟703;如果當(dāng)前超幀的DTX判決結(jié)果為O, 則不進(jìn)行編碼,只向解碼端發(fā)送沒(méi)有任何數(shù)據(jù)的NODATA幀。
步驟703、如果當(dāng)前超幀的最終DTX判決結(jié)果為l,則對(duì)當(dāng)前超幀的背景 噪聲特征參數(shù)進(jìn)行提?。惶崛‘?dāng)前超幀的背景噪聲特征參數(shù)的來(lái)源是當(dāng)前兩 個(gè)10ms幀的參數(shù),即將當(dāng)前兩個(gè)10ms幀的參數(shù)進(jìn)行平滑得到當(dāng)前超幀的背景 噪聲編碼參數(shù)。提取背景噪聲特征參數(shù)并進(jìn)行背景噪聲特征參數(shù)平滑的過(guò)程 如下
首先,確定平滑因子s附oo,/ —:
(y ag—c/za"ge—= 0 & &—c/ia"ge—sec owd = 1) s附oo A — = 0.1
5woo^i_rate = 0.5
即如果第一個(gè)10ms幀的DTX判決結(jié)果為0,而第二個(gè)10ms幀的DTX判 決結(jié)果為l,則在平滑時(shí),第一個(gè)10ms幀背景噪聲特征參數(shù)的平滑權(quán)重為0.1, 第二個(gè)10ms幀背景噪聲特征參數(shù)的平均權(quán)重為0.9,否則兩個(gè)10ms幀背景噪聲 特征參數(shù)的平滑權(quán)重都為0.5。
然后,對(duì)兩個(gè)10ms幀的背景噪聲特征參數(shù)進(jìn)4亍平滑,得到當(dāng)前超幀的LPC 濾波器系數(shù)和計(jì)算兩個(gè)10ms幀幀能量的平均值,其過(guò)程包括
首先,計(jì)算兩個(gè)10ms幀自相關(guān)系數(shù)穩(wěn)態(tài)平均值的滑動(dòng)平均值W(力
27得到自相關(guān)系數(shù)的滑動(dòng)平均值i '(力之后,根據(jù)Levinson-Durbin算法,得到LPC 濾波器4 (z),其系數(shù)為C/'), 乂 = 0,…,l 0;
其次,計(jì)算兩個(gè)10ms幀幀能量的平均值g:
這樣就得到當(dāng)前超幀的窄帶部分的編碼參數(shù)LPC濾波器系數(shù)和幀能量 平均值。背景噪聲特征參數(shù)提取以及DTX控制充分靠了 了當(dāng)前超幀每一 10ms 幀的特性,因此算法較為嚴(yán)謹(jǐn)。
五、SID幀的編碼
與G729B—樣,在對(duì)SID幀的語(yǔ)參數(shù)最終編碼時(shí),考慮了相鄰噪聲幀之間 的穩(wěn)定情況,具體的操作與G,729B—致
首先,計(jì)算當(dāng)前超幀之前iVp個(gè)超幀的平均LPC濾波器2p(z),這要用到自 相關(guān)函數(shù)平均值&(力,然后將&(力送入Levinson-Durbin算法中得到, 而&(y)表示為
其中A^的值定為5。這樣,SID-LPC濾波器表示為
4 (z) & tan ce(4 (z),爿(z)) > Ar3
《w (z) = j 一
即算法會(huì)計(jì)算前幾個(gè)超幀的平均LPC濾波器系數(shù)Zp(z)然后,用其與當(dāng)前的 LPC濾波器系數(shù)4(z)進(jìn)行比較,若二者差別較小,那么當(dāng)前超幀在量化LPC系數(shù)時(shí)選擇的就是前幾個(gè)超幀的平均值:ip(z),否則就是當(dāng)前超幀的4(z),具
體的比較方法與步驟602中10ms幀DTX判決的方法一樣,其中,/^3是具體 的門限值, 一般在1.0到1.5之間,本實(shí)施例中為1.0966466。所述領(lǐng)域的技 術(shù)人員可以根據(jù)實(shí)際需要,取其他的值,這沒(méi)有超出本發(fā)明的保護(hù)范圍。
選擇好LPC濾波器系數(shù)之后,算法將這些LPC濾波器系數(shù)轉(zhuǎn)化到LSF 域,然后進(jìn)行量化編碼,而量化編碼選擇的方式與G.729B的量化編碼方式類 似。
能量參數(shù)的量化在對(duì)數(shù)域完成,采用的是線性的量化,然后進(jìn)行編碼。 這樣對(duì)背景噪聲的編碼就已完成,然后將這些編碼比特封裝在SID幀中。
六、CNG的方式
在基于CELP模型的編碼中,為了獲得最佳的編碼參數(shù),在編碼端也包含 了解碼的過(guò)程,對(duì)于CNG系統(tǒng)也不例外,即在G,729.1中編碼端也要包含CNG 模塊。對(duì)于G,729.1中的CNG來(lái)說(shuō),其處理的流程基于G/729B,雖然其幀長(zhǎng)為 20ms,但還是以10ms為基本的數(shù)據(jù)處理長(zhǎng)度來(lái)處理背景噪聲。但是,從上一 節(jié)可知,第一個(gè)SID超幀的編碼參數(shù)在第2個(gè)10ms幀才會(huì)對(duì)進(jìn)行編碼,但這時(shí) 系統(tǒng)需要在第一個(gè)SID超幀的第一個(gè)10ms幀就產(chǎn)生CNG的參數(shù)。顯然,第一個(gè) SID超幀的第 一個(gè)1 Oms幀的CNG參數(shù)不能從SID超幀的編碼參數(shù)中得到,而只
29能從之前語(yǔ)音編碼超幀中得到。由于存在這種特殊情況,因此G,729.1的第一 個(gè)SID超幀的第 一個(gè)10ms幀的CNG方式與G,729B有所不同,相對(duì)前述有關(guān)內(nèi) 容介紹的G,729B的CNG方式,這種不同表現(xiàn)在
(1) 目標(biāo)激勵(lì)增益d,由長(zhǎng)時(shí)平滑的語(yǔ)音編碼超幀量化的固定碼本增益 丄,_5,定義
其中,0<y<l,本實(shí)施例中可以選擇,=0.4。
(2) LPC濾波器系數(shù)K力由長(zhǎng)時(shí)平滑的語(yǔ)音編碼超幀量化的LPC濾波器
4(z)-d(z)
其他的操作與729B—致。
設(shè)語(yǔ)音編碼幀量化的固定碼本增益和LPC濾波器系數(shù)分別為co^和 ^0),則這些長(zhǎng)時(shí)平滑的參數(shù)分別計(jì)算如下
丄r 一 g =一 5, + (i _ p)g。/w _ cocfe
丄r—="丄r—+(i - ")4(z) 以上操作在語(yǔ)音超幀的每一子幀都進(jìn)行平滑,其中平滑因子的取值范圍為
0<々<1,本實(shí)施例中為0.5。
另外,除了第一個(gè)SID超幀的第一個(gè)10ms幀與72犯略有不同外,其他所
30有10ms幀的CNG方式均與G729B—致。
其中,在上述實(shí)施例中,所述拖尾時(shí)間為120毫秒或140毫秒。
其中,在上述實(shí)施例中,所述提取拖尾時(shí)間內(nèi)的背景噪聲特征參數(shù)具體
為
在所述拖尾時(shí)間內(nèi),對(duì)每一個(gè)超幀的每一幀,保存每幀背景噪聲的自相 關(guān)系數(shù)。
其中,在上述實(shí)施例中,對(duì)所述拖尾時(shí)間后的第一個(gè)超幀,所述根據(jù)提 取的所述拖尾時(shí)間內(nèi)的背景噪聲特征參數(shù)和所述第一個(gè)超幀的背景噪聲特征 參數(shù),進(jìn)行背景噪聲編碼包括
在第一幀和第二幀保存每個(gè)幀背景噪聲的自相關(guān)系數(shù);
在第二幀,根據(jù)所述提取出的所述兩幀的自相關(guān)系數(shù)和所述拖尾時(shí)間內(nèi)
的背景噪聲特征參數(shù),提取出所述第一個(gè)超幀的LPC濾波器系數(shù)和殘差能量, 進(jìn)行背景噪聲編碼。
其中,在上述實(shí)施例中,所述提取所述LPC濾波器系數(shù)具體為
計(jì)算所述第一個(gè)超幀和所述第一個(gè)超幀之前的所述拖尾時(shí)間內(nèi)的四個(gè)超 幀的自相關(guān)系數(shù)的平均值;
由所述自相關(guān)系數(shù)的平均值,根據(jù)Levinson-Durbin算法計(jì)算出LPC濾波 器系數(shù);
所述提取所述殘差能量A具體為
根據(jù)Levinson-Durbin算法計(jì)算出殘差能量;
所述在第二幀進(jìn)行背景噪聲編碼具體為
將所述LPC濾波器系數(shù)轉(zhuǎn)化到LSF域,進(jìn)行量化編碼;
將所述殘差能量在對(duì)^t域進(jìn)行線性量化編碼。
其中,在上述實(shí)施例中,在計(jì)算出所述殘差能量后,進(jìn)行量化編碼之前, 還包括
對(duì)所述殘差能量進(jìn)^f于長(zhǎng)時(shí)的平滑;
平滑7>式為丄r = + (l — a)《,a取值范圍為0<a<l;
將平滑后的能量估計(jì)£—丄r的值作為殘差能量的值。其中,在上述實(shí)施例中,所述對(duì)第一個(gè)超幀后的超幀,對(duì)每一幀都進(jìn)行
背景噪聲特征參數(shù)提取具體為
根據(jù)最近四個(gè)相鄰幀自相關(guān)系數(shù)的值,計(jì)算當(dāng)前自相關(guān)系數(shù)的穩(wěn)態(tài)平均 值,所述自相關(guān)系數(shù)的穩(wěn)態(tài)平均值是所述最近四個(gè)相鄰幀中具有中間自相關(guān) 系數(shù)范數(shù)值的兩幀的自相關(guān)系數(shù)的平均值;
對(duì)所述穩(wěn)態(tài)平均值,根據(jù)Levinson-durbin算法計(jì)算背景噪聲LPC濾波器系 數(shù)和殘差能量。
其中,在上述實(shí)施例中,在計(jì)算所述殘差能量后,還包括 對(duì)所述殘差能量進(jìn)^f亍長(zhǎng)時(shí)平滑,得到當(dāng)前幀能量估計(jì);平滑方式為
"取值為0< a < 1;
將平滑后的當(dāng)前幀能量估計(jì)U武值給所述殘差能量;賦J直方式為 五a《W。
其中k-l,2,分別表示第一幀和第二幀。 其中,各個(gè)實(shí)施例中a =0.9。
其中,在上述實(shí)施例中,所述對(duì)第一個(gè)超幀后的超幀,對(duì)每一幀都進(jìn)行 DTX判決具體為
如果當(dāng)前幀LPC濾波器系數(shù)和上一SID超幀LPC濾波器系數(shù)的值超過(guò)預(yù)設(shè) 的門限值,或者當(dāng)前幀的能量估計(jì)與上一SID超幀中的能量估計(jì)相比差別較 大,則將當(dāng)前幀的參數(shù)變化標(biāo)志設(shè)為l;
如果當(dāng)前10毫秒幀LPC濾波器系數(shù)和上一SID超幀LPC濾波器系數(shù)的值沒(méi) 有超過(guò)預(yù)設(shè)的門限值,或者當(dāng)前10毫秒幀的能量估計(jì)與上一SID超幀中的能量 估計(jì)相比差別不大,則將當(dāng)前10毫秒幀的參數(shù)變化標(biāo)志設(shè)為0。
其中,在上述實(shí)施例中,所述當(dāng)前幀的能量估計(jì)與前一SID超幀中的能量 估計(jì)相比差別較大具體為
計(jì)算當(dāng)前10毫秒幀和之前最近3個(gè)幀共4個(gè)幀的殘差能量的平均值作為當(dāng) 前幀的能量估計(jì);
將所述殘差能量的平均值使用對(duì)數(shù)量化器量化;
如果解碼后的對(duì)數(shù)能量與上一SID超幀解碼后的對(duì)數(shù)能量的差超過(guò)預(yù)設(shè)值,則確定所述當(dāng)前幀的能量估計(jì)與前一SID超幀中的能量估計(jì)相比差別較 大。
其中,在上述實(shí)施例中,所述對(duì)每一個(gè)幀都進(jìn)行DTX判決具體為 如果當(dāng)前超幀中有一個(gè)幀的DTX判決結(jié)果為1 ,則當(dāng)前超幀窄帶部分的 DTX判決結(jié)果為1。
其中,在上述實(shí)施例中,述當(dāng)前超幀的所述最終DTX判決結(jié)果為1,則所 述"對(duì)第一個(gè)超幀后的超幀,根據(jù)提取的當(dāng)前超幀的背景噪聲特征參數(shù)和所 述當(dāng)前超幀之前若干超幀的背景噪聲特征參數(shù),以及最終DTX判決結(jié)果,進(jìn) 行背景噪聲編碼"過(guò)程包括
對(duì)于所述當(dāng)前超幀,確定平滑因子,包括
如果當(dāng)前超幀第一幀的DTX為零,第二幀的DTX為l,則所述平滑因子為 0.1,否則所述平滑因子為0.5;
對(duì)所述當(dāng)前超幀的兩個(gè)幀進(jìn)行參數(shù)平滑,將參數(shù)平滑后的參數(shù)作為對(duì)所 述當(dāng)前超幀的進(jìn)行背景噪聲編碼的特征參數(shù),所述參數(shù)平滑包括
計(jì)算所述兩個(gè)幀自相關(guān)系數(shù)穩(wěn)態(tài)平均值的滑動(dòng)平均值/ '(力<formula>formula see original document page 33</formula>戶斤述smooZA — rate為戶斤述平 滑因子,i "(力為第一幀的自相關(guān)系數(shù)穩(wěn)態(tài)平均值,及"2(力為第二幀的自相關(guān) 系數(shù)穩(wěn)態(tài)平均值;
對(duì)所述兩個(gè)幀自相關(guān)系數(shù)穩(wěn)態(tài)平均值的滑動(dòng)平均值i 'C/),根據(jù) Levinson-Durbin算法,得到LPC濾波器系數(shù),
計(jì)算所述兩個(gè)幀幀能量估計(jì)的滑動(dòng)平均值《
<formula>formula see original document page 33</formula>所述g,,為第 一幀的能量估計(jì), 為第二幀的能量估計(jì)。
其中,在上述實(shí)施例中,所述"根據(jù)提取的當(dāng)前超幀的背景噪聲特征參 數(shù)和所述當(dāng)前超幀之前若干超幀的背景噪聲特征參數(shù),以及最終DTX判決結(jié) 果,進(jìn)行背景噪聲編碼"具體為
計(jì)算當(dāng)前超幀之前若干超幀的自相關(guān)系數(shù)的平均值;
根據(jù)所述自相關(guān)系數(shù)的平均值,計(jì)算當(dāng)前超幀之前若干個(gè)超幀的平均
LPC濾波器系數(shù);如果所述平均LPC濾波器系數(shù)與當(dāng)前超幀的LPC濾波器系數(shù)差值小于或 等于預(yù)設(shè)值,則將所述平均LPC濾波器系數(shù)轉(zhuǎn)化到LSF域,進(jìn)行量化編碼;
如果所述平均LPC濾波器系數(shù)與當(dāng)前超幀的LPC濾波器系數(shù)差值大于預(yù) 設(shè)值,則將所述當(dāng)前超幀的LPC濾波器系數(shù)轉(zhuǎn)化到LSF域,進(jìn)行量化編碼;
對(duì)能量參數(shù),在對(duì)數(shù)域進(jìn)行線性量化編碼。
其中,在上述實(shí)施例中,所述若干幀的數(shù)量為5。所屬領(lǐng)域的技術(shù)人員也
可以根據(jù)需要選擇其他數(shù)量的幀數(shù)。
其中,在上述實(shí)施例中,在所述提取拖尾時(shí)間內(nèi)的背景噪聲特征參數(shù)步
驟之前,還包括
用語(yǔ)音編碼速率對(duì)所述拖尾時(shí)間內(nèi)的背景噪聲進(jìn)行編碼。
參考圖8所示,是本發(fā)明的解碼方法的實(shí)施例一,包括步驟
步驟801、從第一個(gè)超幀的第一幀之前的語(yǔ)音編碼幀,獲得第一個(gè)超幀的
第一幀的CNG參數(shù);
步驟802、根據(jù)所述CNG參數(shù),對(duì)第一個(gè)超幀的第一幀進(jìn)行背景噪聲解
碼,所述CNG參數(shù)包括
目標(biāo)激勵(lì)增益,所述目標(biāo)激勵(lì)增益由長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀參數(shù)量化的
固定碼本增益確定;
其中,在實(shí)際運(yùn)用中,所述確定目標(biāo)增益可以具體為目標(biāo)激勵(lì)增益=^* 固定碼本增益,0<^<1;
濾波器系數(shù),所述濾波器系數(shù)由長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀參數(shù)量化的濾波 器系數(shù)定義;
其中,在實(shí)際運(yùn)用中,所述定義所述濾波器系數(shù)可以具體為
濾波器系數(shù)-長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀量化的濾波器系數(shù)。
其中,上述實(shí)施例中,所述長(zhǎng)時(shí)平滑因子取值范圍為:大于O且小于1。
其中,上述實(shí)施例中,所述長(zhǎng)時(shí)平滑因子可以為0.5。
其中,上述實(shí)施例中,所述^=0.4。
其中,上述實(shí)施例中,所述對(duì)第一個(gè)超幀的第一幀進(jìn)行背景噪聲解碼過(guò) 程之后,還可以包括
34對(duì)除所述第一個(gè)超幀的第一幀之外的所有幀,從上一個(gè)SID超幀獲取
CNG參數(shù)后,根據(jù)獲取的所述CNG參數(shù)進(jìn)行背景噪聲解碼。 參考圖9所示,是本發(fā)明的編碼裝置的實(shí)施例一,包括 第一提取單元901,用于提取拖尾時(shí)間內(nèi)的背景噪聲特征參數(shù); 第二編碼單元902,用于對(duì)所述拖尾時(shí)間后的第一個(gè)超幀,根據(jù)提取的
所述拖尾時(shí)間內(nèi)的背景噪聲特征參數(shù)和所述第 一個(gè)超幀的背景噪聲特征參
數(shù),進(jìn)行背景噪聲編碼;
第二提取單元903,用于對(duì)第一個(gè)超幀后的超幀,對(duì)每一幀都進(jìn)行背景
噪聲特征參數(shù)提??;
DTX判決單元904,用于對(duì)第一個(gè)超幀后的超幀,對(duì)每一幀都進(jìn)行DTX
判決;
第三編碼單元905,用于對(duì)第一個(gè)超幀后的超幀,根據(jù)提取的當(dāng)前超幀 的背景噪聲特征參數(shù)和所述當(dāng)前超幀之前若干超幀的背景噪聲特征參數(shù),以 及最終DTX判決結(jié)果,進(jìn)行背景噪聲編碼。
其中,上述實(shí)施例中,所述拖尾時(shí)間為120毫秒或140毫秒。
其中,上述實(shí)施例中,所述第一提取單元具體為
緩存模塊,用于在所述拖尾時(shí)間內(nèi),對(duì)每一個(gè)超幀的每一幀,保存每
幀背景噪聲的自相關(guān)系數(shù)。
其中,上述實(shí)施例中,所述第二編碼單元具體為
提^t塊,用于在第一幀和第二幀保存每幀背景噪聲的自相關(guān)系數(shù);
編碼模塊,用于在第二幀,根據(jù)所述提取出的所述兩個(gè)幀的自相關(guān)系
數(shù)和所述拖尾時(shí)間內(nèi)的背景噪聲特征參數(shù),提取出所述第一個(gè)超幀的LPC濾
波器系數(shù)和殘差能量,進(jìn)行背景噪聲編碼。
其中,上述實(shí)施例中,所述第二編碼單元還可以包括 殘差能量平滑才莫塊,用于對(duì)所述殘差能量進(jìn)^f于長(zhǎng)時(shí)的平滑; 平滑7>式為ZT = o£:—£r + (l —, a取l直范圍為0<"<1;
將平滑后的能量估計(jì)五—丄r的值作為所述殘差能量的值。 其中,上述實(shí)施例中,所述第二提取單元具體為
第一計(jì)算模塊,用于根據(jù)最近四個(gè)相鄰幀自相關(guān)系數(shù)的值,計(jì)算當(dāng)前自相關(guān)系數(shù)的穩(wěn)態(tài)平均值,所述自相關(guān)系數(shù)的穩(wěn)態(tài)平均值是所述最近四個(gè)相
鄰幀中具有中間自相關(guān)系數(shù)范數(shù)值的兩個(gè)幀的自相關(guān)系數(shù)的平均值;
第二計(jì)算模塊,用于對(duì)所述穩(wěn)態(tài)平均值,才艮據(jù)Levinson-durbin算法計(jì)算
背景噪聲LPC濾波器系數(shù)和殘差能量。
其中,上述實(shí)施例中,所述第二提取單元還可以包括 第二殘差能量平滑模塊,用于對(duì)所述殘差能量進(jìn)行長(zhǎng)時(shí)平滑,得到當(dāng)
前幀能量估計(jì);平滑方式為
五—zj7 ="五—丄ri + (i —cO£"a;
"取值為0< a < 1;
將平滑后的當(dāng)前幀能量估計(jì)賦值給所述殘差能量;賦值方式為 "。
其中k4,2,分別表示第一幀和第二幀。
其中,上述實(shí)施例中,所述DTX判決單元具體為
門限比較模塊,用于如果當(dāng)前幀LPC濾波器系數(shù)和上一SID超幀LPC濾 波器系數(shù)的值超過(guò)預(yù)設(shè)的門P艮值,則生成判決指令;
能量比較^^塊,用于計(jì)算當(dāng)前幀和之前最近3個(gè)幀共4個(gè)幀的殘差能 量的平均值作為當(dāng)前幀的能量估計(jì),將所述殘差能量的平均值使用對(duì)數(shù)量化 器量化,如果解碼后的對(duì)數(shù)能量與上一 SID超幀解碼后的對(duì)數(shù)能量的差超過(guò) 預(yù)設(shè)值,則生成判決指令;
第一判決模塊,用于根據(jù)所述判決指令,將當(dāng)前幀的參數(shù)變化標(biāo)志設(shè)為1。
其中,上述實(shí)施例中,還可以包括
第二判決單元,用于如果當(dāng)前超幀中有一個(gè)幀的DTX判決結(jié)果為1,則 當(dāng)前超幀窄帶部分的DTX判決結(jié)果為1; 所述第三編碼單元具體為
平滑指示模塊,用于如果當(dāng)前超幀的所述最終DTX判決結(jié)果為1,則生 成平滑指令;;
平滑因子確定模塊,用于收到所述平滑指令后,確定所述當(dāng)前超幀的 平滑因子如果當(dāng)前超幀第一幀的DTX為零,第二幀的DTX為1,則所述平滑因子為 0. 1,否則所述平滑因子為0. 5;
參數(shù)平滑模塊,用于對(duì)所述當(dāng)前超幀的兩個(gè)幀進(jìn)行參數(shù)平滑,將平滑 后的參數(shù)作為對(duì)所述當(dāng)前超幀的進(jìn)行背景噪聲編碼的特征參數(shù),包括
計(jì)算所述兩個(gè)幀自相關(guān)系數(shù)穩(wěn)態(tài)平均值的滑動(dòng)平均值及'(力
C/)-s附ooA—rafe/ "C/)+(1—swoo,/ —mte)i ',2(/),,斤述swooA ■— rafe為戶斤述平;骨 因子,7 "C/)為第一幀的自相關(guān)系數(shù)穩(wěn)態(tài)平均值,及"C/)為第二幀的自相關(guān)系
數(shù)穩(wěn)態(tài)平均值;
對(duì)所述兩個(gè)幀自相關(guān)系數(shù)穩(wěn)態(tài)平均值的滑動(dòng)平均值i '(y),根據(jù) Levinson-Durbin算法,得到LPC濾波器系數(shù),
計(jì)算所述兩個(gè)幀幀能量估計(jì)的滑動(dòng)平均值S:
蜀-柳ooA — ratel^+(1 —柳ooA —2,所述I^為第 一幀的能量估計(jì),巧,2為 第二幀的能量估計(jì)。
其中,上述實(shí)施例中,所述第三編碼單元具體為
第三計(jì)算模塊,用于根據(jù)計(jì)算得到的當(dāng)前超幀之前若干超幀的自相關(guān) 系數(shù)的平均值,計(jì)算當(dāng)前超幀之前若干個(gè)超幀的平均LPC濾波器系數(shù);
第一編碼模塊,用于如果所述平均LPC濾波器系數(shù)與當(dāng)前超幀的LPC 濾波器系數(shù)差值小于或等于預(yù)設(shè)值,則將所述平均LPC濾波器系數(shù)轉(zhuǎn)化到 LSF域,進(jìn)行量化編碼;
第二編碼才莫塊,用于如果所述平均LPC濾波器系數(shù)與當(dāng)前超幀的LPC 濾波器系數(shù)差值大于預(yù)設(shè)值,則將所述當(dāng)前超幀的LPC濾波器系數(shù)轉(zhuǎn)化到 LSF域,進(jìn)行量化編碼;
第三編碼4莫塊,用于對(duì)能量參數(shù),在對(duì)^i:域進(jìn)^f亍線性量化編碼。
其中,上述實(shí)施例中,《 =0.9。
其中,上述實(shí)施例中,還可以包括
第一編碼單元,用于用語(yǔ)音編碼速率對(duì)拖尾時(shí)間內(nèi)的背景噪聲進(jìn)行編
碼;
本發(fā)明的編碼裝置具體與本發(fā)明的編碼方法相適應(yīng)的工作過(guò)程,相應(yīng)地, 也具有與相應(yīng)的方法實(shí)施例同樣的技術(shù)效果。
37參考圖10所示,是本發(fā)明的解碼裝置的實(shí)施例一,包括
CNG參數(shù)獲得單元1001,用于從第一個(gè)超幀的第一幀之前的語(yǔ)音編碼 幀,獲得第 一個(gè)超幀的第 一幀的CNG參數(shù);
第一解碼單元1002,用于根據(jù)所述CNG參數(shù),對(duì)第一個(gè)超幀的第一幀 進(jìn)行背景噪聲解碼,所述CNG參數(shù)包括
目標(biāo)激勵(lì)增益,所述目標(biāo)激勵(lì)增益由長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀量化的固定 碼本增益確定,其中,在實(shí)際運(yùn)用中,所述目標(biāo)激勵(lì)增益確定具體為
目標(biāo)激勵(lì)增益=^*固定碼本增益,所述^的取值范圍是0<y<l;
LPC濾波器系數(shù),所述LPC濾波器系數(shù)由長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀量化的 LPC濾波器系數(shù)定義,其中,在實(shí)際運(yùn)用中,所述定義LPC濾波器系數(shù)可以 具體為
LPC濾波器系數(shù)-長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀量化的LPC濾波器系數(shù)。 其中,在上述實(shí)施例中,所述長(zhǎng)時(shí)平滑因子取值范圍為:大于O且小于1。 在優(yōu)選的情況下,所述長(zhǎng)時(shí)平滑因子可以為0.5。 其中,在上述實(shí)施例中,還可以包括
第二解碼單元,用于對(duì)除所述第一個(gè)超幀之外的所有幀,從上一個(gè)SID 超幀獲取CNG參數(shù)后,根據(jù)獲取的所述CNG進(jìn)行背景噪聲編碼。 其中,在上述實(shí)施例中,所述^=0.4。
本發(fā)明的解碼裝置具體與本發(fā)明的解碼方法相適應(yīng)的工作過(guò)程,相應(yīng)地, 也具有與相應(yīng)的解碼方法實(shí)施例同樣的技術(shù)效果。
以上所述的本發(fā)明實(shí)施方式,并不構(gòu)成對(duì)本發(fā)明保護(hù)范圍的限定。任何 在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進(jìn)等,均應(yīng)包含在本 發(fā)明的保護(hù)范圍之內(nèi)。
38
權(quán)利要求
1、一種解碼方法,其特征在于,包括從第一個(gè)超幀的第一幀之前的語(yǔ)音編碼幀,獲得第一個(gè)超幀的第一幀的CNG參數(shù);根據(jù)所述CNG參數(shù),對(duì)第一個(gè)超幀的第一幀進(jìn)行背景噪聲解碼,所述CNG參數(shù)包括目標(biāo)激勵(lì)增益,所述目標(biāo)激勵(lì)增益由長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀量化的固定碼本增益確定;LPC濾波器系數(shù),所述LPC濾波器系數(shù)由長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀量化的LPC濾波器系數(shù)定義。
2、 如權(quán)利要求l所述的方法,其特征在于,所述長(zhǎng)時(shí)平滑因子取值范圍 為:大于0且小于1。
3、 如權(quán)利要求l所述的方法,其特征在于,所述對(duì)第一個(gè)超幀的第一幀 進(jìn)行背景噪聲解碼過(guò)程之后,還包括對(duì)除所述第一個(gè)超幀的第一幀之外的所有幀,從上一個(gè)SID超幀獲取 CNG參數(shù)后,根據(jù)獲取的所述CNG參數(shù)進(jìn)行背景噪聲解碼。
4、 如權(quán)利要求2所述的方法,其特征在于,所述長(zhǎng)時(shí)平滑因子為0.5。
5、 如權(quán)利要求l所述的方法,其特征在于,所述確定所述目標(biāo)激勵(lì)增益 具體為所述目標(biāo)激勵(lì)增益=7*固定碼本增益,0<y<l。
6、 如權(quán)利要求5所述的方法,其特征在于,所述^-0, 4。
7、 如權(quán)利要求l所述的方法,其特征在于,所述定義所述LPC濾波器系 數(shù)具體為所述LPC濾波器系數(shù)=長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀量化的LPC濾波器 系數(shù)。
8、 一種解碼裝置,其特征在于,包括CNG參數(shù)獲得單元,用于從第一個(gè)超幀的第一幀之前的語(yǔ)音編碼幀, 獲得第 一個(gè)超幀的第 一幀的CNG參數(shù);第一解碼單元,用于根據(jù)所述CNG參數(shù),對(duì)第一個(gè)超幀的第一幀進(jìn)行 背景噪聲解碼,所述CNG參數(shù)包括目標(biāo)激勵(lì)增益,所述目標(biāo)激勵(lì)增益由長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀量化的固定 碼本增益確定;LPC濾波器系數(shù),所述LPC濾波器系數(shù)由長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀量化的 LPC濾波器系數(shù)定義。
9、 如權(quán)利要求8所述的裝置,其特征在于,所述長(zhǎng)時(shí)平滑因子取值范圍 為:大于0且小于1。
10、 如權(quán)利要求8所述的裝置,其特征在于,還包括 第二解碼單元,用于對(duì)除所述第一個(gè)超幀之外的所有幀,從上一個(gè)SID超幀獲取CNG參數(shù)后,才艮據(jù)獲取的所述CNG進(jìn)行背景噪聲編碼。
11、 如權(quán)利要求8所述的裝置,其特征在于,所述確定所述目標(biāo)激勵(lì)增 益具體為所述目標(biāo)激勵(lì)增益=;^固定碼本增益,所述y的取值范圍是0<^<1。
12、 如權(quán)利要求8所述的裝置,其特征在于,所述定義所述LPC濾波器 系數(shù)具體為所述LPC濾波器系數(shù)=長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀量化的LPC濾波器系數(shù)。
全文摘要
本發(fā)明實(shí)施例公開(kāi)了一種解碼方法,包括從第一個(gè)超幀的第一幀之前的語(yǔ)音編碼幀,獲得第一個(gè)超幀的第一幀的CNG參數(shù);根據(jù)所述CNG參數(shù),對(duì)第一個(gè)超幀的第一幀進(jìn)行背景噪聲解碼,所述CNG參數(shù)包括目標(biāo)激勵(lì)增益,所述目標(biāo)激勵(lì)增益由長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀量化的固定碼本增益確定;LPC濾波器系數(shù),所述LPC濾波器系數(shù)由長(zhǎng)時(shí)平滑的語(yǔ)音編碼幀量化的LPC濾波器系數(shù)定義。還公開(kāi)了一種解碼的裝置。利用本發(fā)明實(shí)施例,能夠在保證信號(hào)質(zhì)量的情況下,明顯降低占用的帶寬。
文檔編號(hào)H04M1/74GK101651752SQ200910166740
公開(kāi)日2010年2月17日 申請(qǐng)日期2008年3月26日 優(yōu)先權(quán)日2008年3月26日
發(fā)明者代金良, 張立斌, 艾雅·舒默特 申請(qǐng)人:華為技術(shù)有限公司