專利名稱:在語音編碼系統(tǒng)中對增益信息進行編碼的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及信號壓縮系統(tǒng),更具體涉及碼本激勵線性預(yù)測(CELP)型的語音編碼系統(tǒng)。
背景技術(shù):
低速率編碼應(yīng)用,諸如數(shù)字語音,通常使用諸如線性預(yù)測編碼(LPC)的技術(shù)來對短時語音信號進行建模。采用LPC技術(shù)的編碼系統(tǒng)提供預(yù)測殘差信號,用于校正短時模型的特性。一種這樣的編碼系統(tǒng)是稱為碼本激勵線性預(yù)測(CELP)的語音編碼系統(tǒng),其以低比特率、即4.8到9.6千比特每秒(kbps)的比特率,產(chǎn)生高質(zhì)量合成語音。這類語音編碼,也稱為矢量激勵線性預(yù)測或隨機編碼,用于各種語音通信和語音合成應(yīng)用中。CELP還特別適用于數(shù)字語音加密和數(shù)字無線電話通信系統(tǒng),在這樣的系統(tǒng)中,特別關(guān)注語音質(zhì)量、數(shù)據(jù)速率、大小和成本。
實現(xiàn)LPC編碼技術(shù)的CELP語音編碼器通常采用長時(“基音”)和短時(“共振峰”)預(yù)測器,它們對輸入語音信號的特性進行建模并且合并到一組時變線性濾波器中。用于濾波器的激勵信號,或者說碼矢量,選自儲存的碼矢量的碼本。對于每個語音幀,語音編碼器將碼矢量用于濾波器以生成重建的語音信號,并且將原始輸入語音信號與重建信號進行比較以產(chǎn)生差信號。然后通過讓差信號通過具有基于人類聽覺的響應(yīng)的加權(quán)濾波器而對差信號進行加權(quán)。然后通過選擇一個或多個產(chǎn)生具有當(dāng)前幀的最小能量的加權(quán)差信號的碼矢量來確定最優(yōu)化的激勵信號。
例如,圖1是現(xiàn)有技術(shù)的CELP編碼器100的框圖。在CELP編碼器100中,將輸入信號s(n)施加到線性預(yù)測(LP)分析器101,其中使用線性預(yù)測編碼來估計短時頻譜包絡(luò)。得到的頻譜系數(shù)(或線性預(yù)測(LP)系數(shù))是由傳輸函數(shù)A(z)表示的。將頻譜系數(shù)施加到LP量化器102,LP量化器102對頻譜系數(shù)進行量化以產(chǎn)生適合用于多路復(fù)用器109的量化后的頻譜系數(shù)Aq。量化后的頻譜系數(shù)Aq隨后被傳送到多路復(fù)用器109,多路復(fù)用器基于量化后的頻譜系數(shù)以及由平方差最小化/參數(shù)量化模塊108確定的一組與激勵矢量相關(guān)的參數(shù)L,β,I和γ來產(chǎn)生編碼比特流。結(jié)果,對于每個語音塊,產(chǎn)生的對應(yīng)的一組與激勵矢量相關(guān)的參數(shù)包括長時預(yù)測器(LTP)參數(shù)L和β,以及固定碼本索引I和縮放因子γ。
量化后的頻譜參數(shù)還被本地傳送到LP合成濾波器105,LP合成濾波器105具有對應(yīng)的傳輸函數(shù)1/Aq(z)。LP合成濾波器105還接收組合的激勵信號ex(n)并基于量化頻譜系數(shù)Aq和組合的激勵信號ex(n)來產(chǎn)生對輸入信號的估計(n)。如下產(chǎn)生組合的激勵信號ex(n)。固定碼本(FCB)碼矢量,或激勵矢量, 選自固定碼本(FCB)103,其基于固定碼本索引參數(shù)I。FCB碼矢量 隨后基于增益參數(shù)γ進行加權(quán),加權(quán)后的固定碼本碼矢量被傳送到長時預(yù)測器(LTP)濾波器104。LTP濾波器104具有對應(yīng)的傳輸函數(shù)“1/(1-βz-L)”,其中β和L是由平方差最小化/參數(shù)量化模塊108傳送到濾波器的與激勵矢量相關(guān)的參數(shù)。LTP濾波器104對從FCB 103接收的加權(quán)固定碼本碼矢量進行濾波,以產(chǎn)生組合激勵信號ex(n)并將激勵信號傳送到LP合成濾波器105。
LP合成濾波器105將輸入信號估計(n)傳送到組合器106。組合器106還接收輸入信號s(n)并且用輸入信號s(n)減去輸入信號的估計(n)。輸入信號s(n)和輸入信號估計(n)之差施加到感覺差加權(quán)濾波器107,該濾波器基于(n)和s(n)之差和加權(quán)函數(shù)W(z)產(chǎn)生感覺加權(quán)差信號e(n)。感覺加權(quán)差信號e(n)然后被傳送到平方差最小化/參數(shù)量化塊108。平方差最小化/參數(shù)量化108使用差信號e(n)來確定一組與激勵矢量相關(guān)的最優(yōu)化參數(shù)L,β,I和γ,這些參數(shù)產(chǎn)生了輸入信號s(n)的最佳估計(n)。量化的LP系數(shù)和最優(yōu)化的一組參數(shù)L,β,I和γ隨后通過通信信道被傳送到接收通信設(shè)備,在接收通信設(shè)備,語音合成器使用LP系數(shù)和與激勵矢量相關(guān)的參數(shù)來重構(gòu)輸入語音信號s(n)。
在CELP編碼器中,諸如編碼器100中,用于生成CELP編碼器組合激勵信號的合成函數(shù)是由下面的廣義差分方程給出的ex(n)=γc~I(n)+βex(n-L),n=0,N-1---(1)]]>其中,ex(n)是一子幀的合成組合激勵信號, 是碼矢量或激勵矢量,選擇諸如FCB 103的碼本,I是索引參數(shù)或碼字,指定選擇的碼矢量,γ是用于縮放碼矢量的增益,ex(n-L)是相對當(dāng)前子幀的第n個采樣延遲L個采樣的合成組合激勵信號(對于濁語音來說,L通常與基音周期相關(guān)),β是長時預(yù)測器(LTP)增益因子,N是子幀中的采樣數(shù)。當(dāng)n-L<0時,ex(n-L)包含過去合成激勵的歷史,如公式(1)所示構(gòu)建。也即,對于n-L<0,表達式“ex(n-L)”對應(yīng)于在當(dāng)前子幀之前構(gòu)建的激勵采樣,該激勵采樣已經(jīng)依照LTP濾波器傳輸函數(shù)“1/(1-βz-L)”延遲且縮放。
典型CELP語音編碼器(諸如編碼器100)的目標(biāo)是選擇規(guī)定合成激勵的參數(shù),即,編碼器100中的參數(shù)L,β,I,γ,n<0的給定ex(n)以及短時線性預(yù)測器(LP)濾波器105的確定系數(shù),由此,當(dāng)n=0,N-1的合成激勵序列ex(n)通過LP濾波器105進行濾波以生成合成語音信號(n)時,根據(jù)所采用的失真標(biāo)準(zhǔn),合成語音信號最接近地近似于在子幀被編碼的輸入語音信號s(n)。
對于大于或等于N的L值,即LN,公式(1)準(zhǔn)確實現(xiàn)。在這樣的情況下,對于該子幀的合成激勵,可等價地定義為ex(n)=βc0(n)+γc1(n),n=0,N-1,(2)其中c0(n)=ex(n-L),n=0,N-1,(3)c1(n)=c~I(n),n=0,N-1,---(4)]]>而且,其中,c0(n)是為該子幀所選擇的LTP矢量,c1(n)是為該子幀選擇的碼矢量。由于L≥N,c0(n)和c1(n)一旦選定,在公式(2)的方程里顯然獨立于β和γ。而且,c0(n)僅僅是n<0的ex(n)的函數(shù),其保持β的解為線性問題。類似地,因為L≥N,在當(dāng)前子幀,c1(n)不受長時預(yù)測器(LTP)濾波器104的影響。這些因子通過語音編碼器100的平方差最小化/參數(shù)量化模塊108簡化了參數(shù)(L,β,I,γ)的選擇。選擇L的范圍,使其覆蓋較廣大的講話者的基音的期望范圍,在8kHz采樣頻率,該范圍的低限通常設(shè)置為20個采樣左右,對應(yīng)于400Hz的基音頻率。為了獲得好的編碼效率,最好使用N>Lmin,其中是Lmin是延遲范圍上的低限。典型地,編碼器的激勵參數(shù)以子幀速率傳輸,該子幀速率與子幀長度N成反比。也就是說,子幀長度N越長,就越不需要頻繁地量化和傳輸編碼器的子幀參數(shù)。
對于小于N的L值,即L<N,公式(2)不再等價于公式(1)。為了在L<N時保留使用公式(2)的形式的優(yōu)點,題為“Code ExcitedLinear Predictive Vocoder Using Virtual Searching”的美國專利4,910,781中提出了一種想法,即如下修改c0(n)的定義ex(n)=βc0(n)+γc1(n),n=0,N-1,(5)其中c0(n)=ex(n-L),n=0,Min(L,N)-1,c0(n-L),n=L,N-1---(6)]]>c1(n)=c~I(n),n=0,N-1---(7)]]>在公式(6)中,c0(n)包含取自“虛擬碼本”(通常為自適應(yīng)碼本(ACB))的矢量,其中允許L<N。公式(4)中給出的c1(n)的定義在公式(6)中保留,這意味著,當(dāng)L<N時, 由LTP濾波器濾波而免除。這是公式(1)的直接實現(xiàn)的另一偏差。因此,公式(5)具有提供由公式(2)提供的簡化實現(xiàn)、同時還允許L<N的優(yōu)點。通過在L<N時偏離公式(1)的精確實現(xiàn)而達到此優(yōu)點。
例如,圖2是現(xiàn)有技術(shù)中實現(xiàn)公式(5)-(7)的另一CELP編碼器200的框圖。類似于CELP編碼器100,在CELP編碼器200中,由LP分析器101和LP量化器102來產(chǎn)生量化頻譜系數(shù)Aq,該量化頻譜系數(shù)被傳送到多路復(fù)用器109,多路復(fù)用器109基于量化頻譜系數(shù)和一組與激勵矢量相關(guān)的參數(shù)L,β,I和γ產(chǎn)生編碼比特流,上述一組參數(shù)是由平方差最小化/參數(shù)量化模塊108確定的。量化頻譜系數(shù)Aq還被本地傳送到LP合成濾波器105,LP合成濾波器105具有對應(yīng)的傳輸函數(shù)1/Aq(z)。LP合成濾波器105還接收組合激勵信號ex(n),并且基于量化頻譜系數(shù)Aq和組合激勵信號ex(n)產(chǎn)生輸入信號的估計(n)。
CELP編碼器200不同于CELP編碼器100的地方在于用于產(chǎn)生組合激勵信號ex(n)的技術(shù)。在CELP編碼器200中,第一激勵矢量c0(n)基于與激勵矢量相關(guān)的參數(shù)L,選自虛擬碼本201。虛擬碼本201典型為自適應(yīng)碼本(ACB),此時,第一激勵矢量是自適應(yīng)(ACB)碼矢量。虛擬碼本碼矢量c0(n)隨后基于增益參數(shù)β被加權(quán),加權(quán)虛擬碼本碼矢量被傳送到第一組合器203。固定碼本(FCB)碼矢量,或激勵矢量, 基于與激勵矢量相關(guān)的參數(shù)I而選自固定碼本(FCB)202。FCB碼矢量 (或者等價地,c1(n),根據(jù)公式(7))隨后基于增益參數(shù)γ被加權(quán),也被傳送到第一組合器203。第一組合器203隨后通過將加權(quán)的虛擬碼本碼矢量c0(n)同加權(quán)的FCB碼矢量c1(n)相組合而產(chǎn)生組合激勵信號ex(n)。
LP合成濾波器105將輸入信號估計(n)傳送到第二組合器106。第二組合器106還接收輸入信號s(n),用輸入信號s(n)減去輸入信號估計(n)。輸入信號s(n)與輸入信號估計(n)之差施加到感覺差加權(quán)濾波器107,該濾波器基于(n)與s(n)之差和加權(quán)函數(shù)W(z)而產(chǎn)生感覺加權(quán)的差信號e(n)。然后,將感覺加權(quán)差信號e(n)傳送到平方差最小化/參數(shù)量化模塊108。平方差最小化/參數(shù)量化模塊108使用差信號e(n)來確定一組與激勵矢量相關(guān)的最優(yōu)參數(shù)L,β,I和γ,這組參數(shù)產(chǎn)生輸入信號s(n)的最佳估計(n)。類似于編碼器100,編碼器200將量化頻譜系數(shù)和所選的一組參數(shù)L,β,I和γ通過通信信道傳送到接收通信設(shè)備,在接收通信設(shè)備,語音合成器使用LP系數(shù)和與激勵矢量相關(guān)的參數(shù)來重構(gòu)編碼的輸入語音信號s(n)。
在論文Mano,K;Moriya,T;Miki,S;and Ohmuro,H.,“Design of apsi-celp coder for mobile communications”,Proceedings of the IEEEWorkshop on Speech Coding for Telecommunications,pp.21-22,October13-15,1993中,美國專利4,910,781中提出的“虛擬碼本”的概念被擴展到在L<N時還修改固定碼本碼矢量的定義,也就是說,ex(n)=βc0(n)+γc1(n),n=0,N-1,(8)其中c0(n)=ex(n-L),n=0,Min(L,N)-1,c0(n-L),n=L,N-1---(9)]]>c1(n)=c~I(n),n=0,Min(L,N)-1,c1(n-L),n=L,N-1---(10)]]>很顯然,在公式(8)、(9)和(10)中,當(dāng)L<N時,c1(n)在N采樣的L中是周期性的。
另一用于在L<N時近似公式(1)的技術(shù)在論文Salami,R.,Laflamme,C.,Adoul,J.-P.,Massaloux,D.,“A toll quality 8 kb/s speechcodec for the personal communications system(PCS)”,IEEE Transactionson Vehicular Technology,Volume 43,Issue 3,Parts 1-2,August 1994,pages 808-816中(下文稱之為“Salami et al.”)提出。Salami et al.所提出的想法是施加零狀態(tài)長時濾波器(“基音銳化濾波器”)以產(chǎn)生激勵碼矢量c1(n),其中
ex(n)=βc0(n)+γc1(n),n=0,N-1(11)c0(n)=ex(n-L),n=0,Min(L,N)-1,c0(n-L),n=L,N-1---(12)]]>c1(n)=c~I(n),n=0,Min(L^,N)-1,c~I(n)+β^c1(n-L^),n=L^,N-1---(13)]]>注意到,公式(12)中,使用了“虛擬碼本”或ACB,而長時延遲 (用于“基因銳化濾波器”)和L(與ACB相關(guān)的延遲)允許不同。例如,L可以表示為采樣分?jǐn)?shù)解(此時,將使用內(nèi)插濾波器來計算分?jǐn)?shù)延遲采樣),而 可以是L的函數(shù),其中, 的值設(shè)置為等于L四舍五入或舍位為最接近L的整數(shù)值??商鎿Q地, 可以設(shè)置為等于L。此外,在Salami et al.中, 是設(shè)置為0.8的常數(shù)。
將 預(yù)設(shè)為常數(shù)值是Salami et al.的限制特征。為了提供改進的公式(1)在L<N時的近似,題為“CS-ACELP Speech CompressionSystem with Adaptive Pitch Prediction Filter Gain Based on a Measure ofPeriodicity”的美國專利5,664,055(下文稱之為“’055專利”)提出,使 為基于周期性的時變函數(shù),例如,其中 可以以子幀速率得到更新。當(dāng)連續(xù)選擇和量化了β和γ時,’055專利提出將 定義為β^=Max(0.2,Min(0.8,β)).---(14)]]>也就是說, 最初設(shè)置為等于β,但是限制為不小于0.2、不大于0.8?!?55專利提出的方法是用于語音編碼器標(biāo)準(zhǔn)電信工業(yè)協(xié)會/電子工業(yè)聯(lián)盟過渡標(biāo)準(zhǔn)127(TIA/EIA/IS-127)和全球移動通信系統(tǒng)(GSM)標(biāo)準(zhǔn)06.60的方法,這些標(biāo)準(zhǔn)在此通過引用整體結(jié)合進來參考。
典型地,以連續(xù)的方式進行對最優(yōu)化增益參數(shù)β和γ的確定。但是,對最優(yōu)化增益參數(shù)β和γ的連續(xù)確定實際上是次優(yōu)化(sub-optimal)的,因為一旦選擇了β,其值在進行γ優(yōu)化時保持固定。如果沒有連續(xù)選擇和量化β和γ,而是聯(lián)合選擇和量化的話,也就是說,矢量量化為(β,γ)對,就會出現(xiàn)一個問題,因為增益矢量量化在選擇c0(n)和c1(n)之后進行,而c1(n)(公式(13))是 的函數(shù)。如公式(14)所定義的, 取決于β的量化值,其不可用,直到完成增益β和γ的矢量量化,并由此確定量化(β,γ)增益矢量。為了解決該問題,’055專利提出,在采用增益的矢量量化時,使用 的修改定義,即β^=Max(0.2,Min(0.8,βprevious)).---(15)]]>公式(15)中的βprevious表示用于定義在前面子幀的激勵序列ex(n)的β的值。國際電信聯(lián)盟(ITU)建議G.729,“Coding of Speech at 8 kbit/susing Conjugate-Structure Algebraic-Code-Excited Linear Prediction(CS-ACELP),”Geneva,1996 and TIA/EIA/IS-641中描述的語音編碼器采用了這種方法。盡管該方法解決了略述的非因果問題,其還是不如優(yōu)化,因為βprevious總是不能在當(dāng)前子幀正確地對β建模,尤其是在當(dāng)前子幀的濁音程度基本上不同于前一子幀的濁音程度的時候,諸如在濁音到清音或清音到濁音轉(zhuǎn)換的區(qū)域。
因此,需要一種改進的方法來在CELP型語音編碼器中量化增益參數(shù),其中基于當(dāng)前子幀聯(lián)合優(yōu)化增益參數(shù)。
圖1是現(xiàn)有技術(shù)的碼本激勵線性預(yù)測(CELP)編碼器的框圖。
圖2是另一現(xiàn)有技術(shù)的碼本激勵線性預(yù)測(CELP)編碼器的框圖。
圖3是根據(jù)本發(fā)明實施例的碼本激勵線性預(yù)測(CELP)編碼器的框圖。
圖4是根據(jù)本發(fā)明實施例由圖3的CELP編碼器對信號進行編碼的執(zhí)行步驟的邏輯流程圖。
圖5是根據(jù)本發(fā)明另一實施例的碼本激勵線性預(yù)測(CELP)編碼器的框圖。
圖6是根據(jù)本發(fā)明另一實施例的碼本激勵線性預(yù)測(CELP)編碼器的框圖。
具體實施例方式
為了解決對于一種改進的在CELP型語音編碼器中對增益參數(shù)進行量化的方法的需要,其中基于當(dāng)前子幀聯(lián)合優(yōu)化增益參數(shù),一種執(zhí)行信號的綜合分析(analysis-by-synthesis)編碼的語音編碼器為合成激勵信號的多個構(gòu)成成分的每一構(gòu)成成分確定增益參數(shù)。語音編碼器基于輸入信號生成目標(biāo)矢量。語音編碼器進一步生成與合成激勵信號相關(guān)的多個構(gòu)成成分,其中多個構(gòu)成成分中的一個構(gòu)成成分基于多個構(gòu)成成分中另一構(gòu)成成分的偏移。該語音編碼器進一步基于目標(biāo)矢量和多個構(gòu)成成分評估誤差標(biāo)準(zhǔn),以確定與多個構(gòu)成成分的每個構(gòu)成成分相關(guān)的增益。
通常,本發(fā)明的一個實施例包括一種用于信號的綜合分析編碼的方法。該方法包括步驟基于輸入信號生成目標(biāo)矢量,以及生成與合成激勵信號相關(guān)聯(lián)的多個構(gòu)成成分,其中多個構(gòu)成成分中的一個構(gòu)成成分基于多個構(gòu)成成分中另一構(gòu)成成分的偏移。該方法還包括步驟基于目標(biāo)矢量和多個構(gòu)成成分評估誤差標(biāo)準(zhǔn),以確定與多個構(gòu)成成分的每個構(gòu)成成分相關(guān)的增益。
本發(fā)明的另一個實施例包括一種用于信號的綜合分析編碼的裝置。該裝置包括用于基于輸入信號生成目標(biāo)矢量的裝置和生成與合成激勵信號相關(guān)聯(lián)的多個構(gòu)成成分的成分生成器,其中多個構(gòu)成成分中的一個構(gòu)成成分基于多個構(gòu)成成分中另一構(gòu)成成分的偏移。該裝置還包括誤差最小化單元,用于基于目標(biāo)矢量和多個構(gòu)成成分評估誤差標(biāo)準(zhǔn),以確定與多個構(gòu)成成分的每個構(gòu)成成分相關(guān)的增益。
本發(fā)明的又一種實施例包括一種用于子幀的綜合分析編碼的方法。該方法包括步驟基于輸入信號生成目標(biāo)矢量,生成與合成激勵信號相關(guān)聯(lián)的多個構(gòu)成成分,以及基于目標(biāo)矢量和多個構(gòu)成成分確定差信號。該方法還包括步驟基于差信號,為子幀聯(lián)合確定多個增益參數(shù),其中多個增益參數(shù)的每個增益參數(shù)與多個碼本的不同碼本相關(guān)聯(lián),其中聯(lián)合確定的多個增益參數(shù)不是基于較早的子幀的增益參數(shù)而確定的。
本發(fā)明的另一種實施例包括一種編碼器,執(zhí)行信號的綜合分析編碼。該編碼器包括處理器,用于基于輸入信號生成目標(biāo)矢量,生成與合成激勵信號相關(guān)聯(lián)的多個構(gòu)成成分,其中多個構(gòu)成成分中的一個構(gòu)成成分基于多個構(gòu)成成分中另一構(gòu)成成分的偏移,以及基于目標(biāo)矢量和多個構(gòu)成成分評估誤差標(biāo)準(zhǔn),以確定與多個構(gòu)成成分的每個構(gòu)成成分相關(guān)的增益。
本發(fā)明的又一個實施例包括一種編碼器,其執(zhí)行子幀的綜合分析編碼。該編碼器包括處理器和用于維持多個碼本的存儲器,其中處理器基于輸入信號生成目標(biāo)矢量,生成與合成激勵信號相關(guān)聯(lián)的多個構(gòu)成成分,基于目標(biāo)矢量和多個構(gòu)成成分確定差信號,以及基于差信號,為子幀聯(lián)合確定多個增益參數(shù),其中多個增益參數(shù)的每個增益參數(shù)與多個碼本的不同碼本相關(guān)聯(lián),其中聯(lián)合確定的多個增益參數(shù)不是基于較早的子幀的增益參數(shù)而確定的。
結(jié)合圖3-6可更加全面地描述本發(fā)明。圖3是根據(jù)本發(fā)明實施例的CELP型語音編碼器300的框圖。編碼器300實現(xiàn)在處理器中,諸如一個或多個微處理器、微控制器、數(shù)字信號處理器(DSP)、其組合或者本領(lǐng)域普通技術(shù)人員所知的其他這樣的設(shè)備,其與一個或多個相關(guān)的存儲設(shè)備相通信,相關(guān)存儲設(shè)備諸如隨機存取存儲器(RAM)、動態(tài)隨機存取存儲器(DRAM)、和/或只讀存儲器(ROM)或者其等價物,其儲存數(shù)據(jù)、碼本、和可由處理器執(zhí)行的程序。
圖4是根據(jù)本發(fā)明實施例的編碼器300在編碼信號時所執(zhí)行的步驟的邏輯流程圖400。邏輯流程400開始(402)于輸入信號s(n)施加到感覺差加權(quán)濾波器304。加權(quán)濾波器304通過加權(quán)函數(shù)W(z)對輸入信號進行加權(quán)(404),以產(chǎn)生加權(quán)輸入信號s’(n)。此外,過去組合激勵信號ex(n-N),其中N是子幀中的采樣數(shù),對于加權(quán)合成濾波器302可用,其具有對應(yīng)的零輸入響應(yīng)Hzir(z),用來為子幀計算加權(quán)合成濾波器的零輸入響應(yīng)d(n)。Hzir或H是NxN零狀態(tài)加權(quán)合成卷積矩陣,是由加權(quán)合成濾波器的沖激響應(yīng)hzir(n)或h(n)形成的,對應(yīng)于傳輸函數(shù)H(z),該矩陣可表示為 加權(quán)輸入信號s’(n)和濾波后的過去激勵信號ex(n-N),即由加權(quán)合成濾波器302產(chǎn)生的d(n)都被傳送到第一組合器320。第一組合器320用加權(quán)輸入信號s’(n)減去(406)濾波后的過去激勵信號ex(n-N)即d(n),以產(chǎn)生目標(biāo)輸入信號p(n),其中p(n)=s’(n)-d(n)。本領(lǐng)域普通技術(shù)人員意識到目標(biāo)信號p(n)、與加權(quán)輸入信號s’(n)、濾波后的過去激勵信號d(n)、以及下面結(jié)合編碼器300、500和600所描述的所有其他信號,諸如組合激勵信號ex(n)、濾波后的組合激勵信號ex’(n)、以及差信號e(n),每個都可以在編碼器操作的矢量表示中表示為矢量。第一組合器320隨后將目標(biāo)輸入信號p(n)傳送到第三組合器322。
矢量生成器306基于與激勵矢量相關(guān)的初始第一參數(shù)L(其由誤差最小化單元324提供給矢量生成器)生成(408)初始第一激勵矢量c0(n)。在本發(fā)明一個實施例中,矢量生成器306是虛擬碼本,諸如自適應(yīng)碼本(ACB),激勵矢量c0(n)是自適應(yīng)碼本(ACB)碼矢量,基于索引參數(shù)L選自ACB。在本發(fā)明另一實施例中,矢量生成器306和縮放模塊308可以基于延時參數(shù)L、過去組合激勵信號ex(n-N)和β,使用形為“1/(1-βz-L)”的傳輸函數(shù),由基音濾波器的輸出替換。在參看圖3和4,初始第一激勵矢量c0(n)隨后被第一加權(quán)器308基于初始第一增益參數(shù)(由誤差最小化單元324提供給加權(quán)器)加權(quán)(410),以產(chǎn)生加權(quán)初始第一激勵矢量yL(n),這里yL(n)=βc0(n)。第一加權(quán)器308隨后將加權(quán)第一激勵矢量yL(n)傳送到第二組合器316。
第二組合器316還接收如下產(chǎn)生的加權(quán)初始第二激勵矢量yI(n)。初始第二激勵矢量 是由固定碼本310基于與激勵矢量相關(guān)的初始第二激勵索引參數(shù)I(由誤差最小化單元324提供給矢量生成器310)而生成的(412)。固定碼本310將初始第二激勵矢量 傳送到具有對應(yīng)傳輸函數(shù)“1/(1-βz-L)”的基音預(yù)濾波器312?;纛A(yù)濾波器312將初始第二激勵矢量 與矢量 用第一增益參數(shù)β加權(quán)后的偏移版本(諸如時間延遲或相位偏移版本)即 相組合,以產(chǎn)生激勵矢量c1(n)。延時因子L和初始第一增益參數(shù)β都是由誤差最小化單元324提供給基音預(yù)濾波器312的?;纛A(yù)濾波器312將激勵矢量c1(n)傳送到第二加權(quán)器314,第二加權(quán)器314基于初始第二增益參數(shù)γ(由誤差最小化單元324提供給加權(quán)器)來加權(quán)(414)激勵矢量c1(n),以產(chǎn)生加權(quán)濾波后的初始第二激勵矢量yI(n),這里y‾I(n)=γc1(n)=γc~I(n)+βγc~I(n-L).]]>第二加權(quán)器314隨后將加權(quán)濾波后的初始第二激勵矢量yI(n)傳送到第二組合器316。
第二組合器316將加權(quán)的第一初始激勵矢量yL(n)與加權(quán)濾波的初始第二激勵矢量yI(n)相結(jié)合,以產(chǎn)生組合激勵信號ex(n),其中ex(n)=y‾L(n)+y‾I(n)=βc0(n)+γc~I(n)+βγc~I(n-L).---(16)]]>第二組合器316將組合激勵信號ex(n)傳送到零狀態(tài)加權(quán)合成濾波器318,用于對組合激勵信號ex(n)進行濾波(418),以產(chǎn)生濾波后的組合激勵信號ex’(n)。加權(quán)合成濾波器318將濾波后的組合激勵信號ex’(n)傳送到第三組合器322,這里,用目標(biāo)信號p(n)減去(420)濾波后的組合激勵信號ex’(n)以產(chǎn)生感覺加權(quán)差信號e(n)。感覺加權(quán)差信號e(n)隨后被傳送到誤差最小化單元324,優(yōu)選是平方差最小化/參數(shù)量化模塊。誤差最小化單元324使用差信號e(n)來確定(422)與激勵矢量相關(guān)的一組優(yōu)化參數(shù)L,β,I和γ,其通過最小化差信號e(n)最優(yōu)化了編碼器300的性能,其中,該確定包括聯(lián)合確定與激勵矢量相關(guān)的一組增益參數(shù)β和γ,這組參數(shù)與組合激勵信號ex(n)的構(gòu)成成分即c0(n), 和 相關(guān)聯(lián)。
基于與激勵矢量相關(guān)的優(yōu)化參數(shù)L和I,編碼器300分別由矢量生成器306和碼本310生成(424)優(yōu)化的(相對于所采用的選擇標(biāo)準(zhǔn))一組第一和第二激勵矢量,或碼矢量,c0(n)和 與激勵矢量相關(guān)的增益參數(shù)β和γ的優(yōu)化導(dǎo)致加權(quán)器308和314對組合激勵信號ex(n)的構(gòu)成成分即c0(n), 和 的優(yōu)化加權(quán)(426),由此產(chǎn)生(428)對輸入信號s(n)的最佳估計。編碼器300隨后將與激勵矢量相關(guān)的優(yōu)化的一組參數(shù)L,β,I和γ傳送(430)到接收通信設(shè)備,這里,語音合成器使用接收的與激勵矢量相關(guān)的參數(shù)來重構(gòu)輸入語音信號s(n)的編碼版本。邏輯流程隨后結(jié)束(432)。在上述圖3和4的討論中需要注意的一點是,為了舉例描述,假定L≥N2]]>的數(shù)值。
在現(xiàn)有技術(shù)編碼器中,與激勵矢量相關(guān)的優(yōu)化的一組用于當(dāng)前子幀的增益參數(shù)β和γ是通過進行順序優(yōu)化過程而確定的,或者由聯(lián)合優(yōu)化過程使用與前一子幀相關(guān)的增益參數(shù)βpevious確定的,或者是在優(yōu)化過程之前就已知的值,而與現(xiàn)有技術(shù)編碼器不同,編碼器300的誤差最小化單元324通過在步驟(422)基于當(dāng)前子幀的處理而進行聯(lián)合優(yōu)化過程來確定與激勵矢量相關(guān)的優(yōu)化的一組增益參數(shù)β和γ,即,增益矢量(β,γ)或(β,γ)對。通過基于當(dāng)前子幀的處理進行聯(lián)合優(yōu)化過程,優(yōu)化了對于激勵矢量相關(guān)的一組增益參數(shù)β和γ的確定,因為考慮到了在優(yōu)化每個參數(shù)時選擇一個與激勵矢量相關(guān)的增益參數(shù)對選擇另一個與激勵矢量相關(guān)的增益參數(shù)的影響,以及消除了由于使用βprevious來在當(dāng)前子幀建模β或者使用常數(shù) 帶來的次優(yōu)化。
由誤差最小化單元324對于激勵矢量相關(guān)的增益參數(shù)β和γ進行聯(lián)合優(yōu)化的步驟(422)可以如下導(dǎo)出。為了開始,公式(1)提供了廣義差分方程,其定義了用于生成現(xiàn)有技術(shù)的典型CELP編碼器的組合激勵信號ex(n)的合成函數(shù),如下重述ex(n)=γc~I(n)+βex(n-L),n=0,N-1.---(1)]]>現(xiàn)在參看圖5,考慮N2≤L<N]]>的情況。圖5是根據(jù)本發(fā)明另一實施例的CELP編碼器500的框圖。類似于編碼器300,編碼器500實現(xiàn)在處理器中,諸如一個或多個微處理器、微控制器、數(shù)字信號處理器(DSP)、其組合或者本領(lǐng)域普通技術(shù)人員所知的其他這樣的設(shè)備,其與一個或多個相關(guān)的存儲設(shè)備相通信,相關(guān)存儲設(shè)備諸如隨機存取存儲器(RAM)、動態(tài)隨機存取存儲器(DRAM)、和/或只讀存儲器(ROM)或者其等價物,其儲存數(shù)據(jù)、碼本、和可由處理器執(zhí)行的程序。
編碼器500所采用的用來聯(lián)合優(yōu)化與激勵矢量相關(guān)的增益參數(shù)β和γ的基本原理也可以由編碼器300來實現(xiàn)。使用編碼器500僅僅是為了說明本發(fā)明的原理,而非以任何方式限制本發(fā)明。此外,為了說明本發(fā)明的原理,假設(shè)L具有整數(shù)解;但是,本領(lǐng)域普通技術(shù)人員意識到,L可以具有子采樣解。在L具有子采樣解的情況下,可以使用內(nèi)插濾波器來計算分?jǐn)?shù)延遲的采樣,總和的范圍也可以進行調(diào)整以解決對這樣的內(nèi)插濾波器的使用。當(dāng)N2≤L<N]]>時,β和β2都將出現(xiàn)在對子幀的合成激勵ex(n)的定義中。此時,ex(n)可以分解成四個構(gòu)成矢量c0(n)到c3(n)的線性疊加,這些矢量可以通過下面的公式(17)-(20)表示c‾0(n)=ex(n-L),n=0,L-10,n=L,N-1---(17)]]>c‾1(n)=0,n=0,L-1c‾0(n-L),n=L,N-1---(18)]]>c‾2(n)=c~I(n),n=0,N-1,---(19)]]>c‾3(n)=0,n=0,L-1c‾I(n-L),n=L,N-1,---(20)]]>
并且該合成組合激勵信號ex(n)可以通過下面的公式(21)表示為ex(n)=βc0(n)+β2c1(n)+γc2(n)+βγc3(n),n=0,N-1.(21)c0(n)是子幀要由增益β縮放的ex(n)的成分。c1(n)是子幀要由增益β2縮放的ex(n)的成分。c2(n)是要由增益γ縮放的對ex(n)的碼矢量貢獻。最后,c3(n)是要由增益βγ縮放的對ex(n)的碼矢量貢獻。公式(1)分解成四個增益縮放構(gòu)成矢量c0(n)到c3(n)的疊加,如公式(21)所示,明確地將構(gòu)成矢量與增益縮放因子β和γ相分離。
也就是,類似于編碼器300,編碼器500將輸入信號s(n)施加到感覺差加權(quán)濾波器304。加權(quán)濾波器304通過加權(quán)函數(shù)W(z)對輸入信號進行加權(quán)(404),以產(chǎn)生加權(quán)輸入信號s’(n)。此外,過去組合激勵信號ex(n-N)對于加權(quán)合成濾波器302可用,其具有對應(yīng)的零輸入響應(yīng)Hzir(z),用來為子幀計算加權(quán)合成濾波器的零輸入響應(yīng)d(n)。第一組合器320用加權(quán)輸入信號s’(n)減去濾波后的過去激勵信號d(n),以產(chǎn)生目標(biāo)輸入信號p(n)。此外,類似于編碼器300,初始第一激勵矢量c0(n)或ex(n-L)是由矢量生成器502(諸如虛擬碼本或LTP濾波器)基于與激勵矢量相關(guān)的初始第一參數(shù)L產(chǎn)生的,初始第二激勵矢量 是固定碼本(FCB)310基于與激勵矢量相關(guān)的初始第二參數(shù)I產(chǎn)生的。
與編碼器300不同,編碼器500中包括且連接到矢量生成器502的第一構(gòu)成矢量生成器504將初始第一激勵矢量c0(n)或ex(n-L)分解成構(gòu)成矢量c0(n)和c1(n)。矢量c0(n)如公式(17)所定義的,包括第一L項的矢量c0(n),矢量c1(n)如公式(18)所定義的,包括剩余項的c0(n)。此外,不像編碼器300,編碼器500中包括且連接到FCB 310的第二構(gòu)成矢量生成初始第二激勵矢量 的一個或多個構(gòu)成成分,以產(chǎn)生c2(n)和c3(n)。矢量c2(n)如公式(19)所定義的,等價于矢量 矢量c3(n)如公式(20)所定義的,包括矢量第一L項的零(0)和剩余N-L項的 項。編碼器500隨后通過與激勵矢量相關(guān)的各自增益參數(shù)β,β2,γ和βγ、經(jīng)各自的加權(quán)器508-511來分別加權(quán)每個矢量c0(n),c1(n),c2(n)和c3(n)。加權(quán)的矢量βc0(n),β2c1(n),γc2(n),以及βγc3(n)每個都被路由到組合器516,在這里,將它們加起來以產(chǎn)生組合激勵信號ex(n)=βc0(n)+β2c1(n)+γc2(n)+βγc3(n),n=0,N-1。
類似于編碼器300,組合激勵信號ex(n)隨后被零狀態(tài)加權(quán)合成濾波器318濾波以產(chǎn)生濾波組合后的激勵信號ex’(n)。加權(quán)合成濾波器318將濾波組合的激勵信號ex’(n)傳送到組合器322,在這里,用目標(biāo)信號p(n)減去濾波組合激勵信號ex’(n)以產(chǎn)生感覺加權(quán)差信號e(n)。感覺加權(quán)差信號e(n)隨后被傳送到誤差最小化單元524,優(yōu)選是平方差最小化/參數(shù)量化模塊。誤差最小化單元524使用差信號e(n)來確定與激勵矢量相關(guān)的一組優(yōu)化參數(shù)L,β,I和γ,其通過最小化差信號e(n)最優(yōu)化了編碼器500的性能,其中,該確定包括聯(lián)合確定與激勵矢量相關(guān)的一組增益參數(shù)β和γ,由此確定與組合激勵信號ex(n)的構(gòu)成成分即c0(n),c1(n),c2(n)和c3(n)相關(guān)聯(lián)的優(yōu)化增益β,β2,γ和βγ。
與激勵矢量相關(guān)的一組優(yōu)化增益參數(shù)β和γ可如下聯(lián)合確定。如上面所說的,s′(n)對應(yīng)于感覺加權(quán)語音,d(n)對應(yīng)于感覺加權(quán)合成濾波器對子幀的零輸入響應(yīng)。編碼器300和500在編碼器執(zhí)行來定義ex(n)所使用的感覺加權(quán)目標(biāo)矢量p(n)隨后可以用下面的公式表示p(n)=s′(n)-d(n),n=0,N-1.(22)子幀的合成激勵ex(n)隨后被施加到感覺加權(quán)合成濾波器,以產(chǎn)生濾波后的合成激勵ex’(n)。用于濾波后的合成激勵ex’(n)的公式可以如下導(dǎo)出。讓矢量c'0(n)到c'3(n)分別表示濾波后的矢量c0(n)到c3(n)。也就是,矢量c0(n)到c3(n)由加權(quán)合成濾波器318進行濾波以產(chǎn)生矢量c'0(n)到c'3(n)。可替換地,對矢量c0(n)到c3(n)的每個的濾波可以包括將每個矢量與加權(quán)合成濾波器318的沖激響應(yīng)進行卷積的步驟。濾波后的合成激勵矢量ex’(n)隨后可以由下面的公式(23)表示ex′(n)=βc'0(n)+β2c′1(n)+γc′1(n)+βγc′3(n),n=0,N-1(23)而子幀的感覺加權(quán)差能量E可以由下面的公式(24)和(25)中的一個來表示,即E=Σn=0N-1(p(n)-ex′(n))2---(24)]]>或E=Σn=0N-1[p(n)-βc‾0′(n)-β2c‾1′(n)-γc‾2′(n)-βγc‾3′(n)]2.---(25)]]>通過擴展公式(25),很明顯,公式(25)可以用下面這幾個方面來等價地表示(i)β和γ,(ii)濾波后構(gòu)成矢量c′0(n)到c′3(n)的交叉相關(guān),即(Rcc(i,j)),(iii)感覺加權(quán)目標(biāo)矢量p(n)與每個濾波后構(gòu)成矢量之間的交叉相關(guān),即(Rpc(i)),以及(iv)子幀的加權(quán)目標(biāo)矢量p(n)的能量,即(Rpp)。上面列出的相關(guān)可以用下面的公式表示Rpp=Σn=0N-1p2(n)---(26)]]>Rpc(i)=Σn=0N-1p(n)c‾i′(n),i=0,3---(27)]]>Rcc(i,j)=Σn=0N-1c‾i′(n)c‾j′(n),i=0,3;j=i,3---(28)]]>Rcc(i,j)=Rcc(j,i),i=0,3;j=i+1,3(29)根據(jù)公式(26)-(29)以及增益項β和γ重寫公式(25)則生成了下面的用于子幀的感覺加權(quán)差能量E的公式E=Rpp-2βRpc(0)-2β2Rpc(1)-2γRpc(2)-2βγRpc(3)+2β3Rcc(0,1)+2βγRcc(0,2)+2β2γRcc(0,3)+2β2γRcc(1,2)+2β3γRcc(1,3)+2βγ2Rcc(2,3) (30)+β2Rcc(0,0)+β4Rcc(1,1)+γ2Rcc(2,2)+γ2β2Rcc(2,3)解與激勵矢量相關(guān)的聯(lián)合優(yōu)化的一組增益項(β,γ)包括取E關(guān)于β的第一偏導(dǎo)數(shù),將該第一偏導(dǎo)數(shù)設(shè)置為等于零(0),取E關(guān)于γ的第二偏導(dǎo)數(shù),將該第二偏導(dǎo)數(shù)設(shè)置為等于零(0),然后解這兩個聯(lián)立非線性方程的得到的系統(tǒng),即,解下面的聯(lián)立非線性方程組
∂E∂β=0,∂E∂γ=0---(31)]]>本領(lǐng)域普通技術(shù)人認(rèn)識到,方程(31)的解不需要編碼器300或者編碼器500實時執(zhí)行。編碼器300和500每個都可以單獨地解方程(31),作為步驟一部分來訓(xùn)練和獲得增益矢量(β,γ),其儲存在各自的增益信息表326、526中。每個增益信息表326、526可以包括一個或多個用于儲存增益信息的表,包括在,或者可以引用自,各自的誤差最小化單元324、524,并且可以用于量化和聯(lián)合優(yōu)化與激勵矢量相關(guān)的增益項對(β,γ)。
假定每個增益信息表326、526這樣獲得,編碼器300和500的任務(wù),特別是各自誤差最小化單元324、524的任務(wù),是選擇增益矢量,即(β,γ)對,使用各自的增益信息表326、526,使得子幀的感覺加權(quán)差能量E,如公式(30)所示,在增益信息表中評估的矢量上進行最小化。為了幫助選擇(β,γ)對,以生成用于感覺加權(quán)差矢量的最小化能量,在公式(30)所表示的E的每項β和γ的解可以由每個編碼器300、500為每個(β,γ)對進行預(yù)先計算并儲存在各自增益信息表326、526中,其中每個增益信息表326、526包括一個查找表。
一旦基于增益信息表326、526確定增益矢量,可以通過用公式(30)的14個預(yù)先計算項(對應(yīng)于選擇的增益矢量)的第一項乘以值“-0.5”以獲得β的值。類似地,可以通過用公式(30)的14個預(yù)先計算項的第三項乘以值“-0.5”以獲得γ的值。由于相關(guān)Rpp,Rpc和Rcc明顯與增益項β和γ相分離,分解操作如上所述,相關(guān)Rpp,Rpc和Rcc只能為每個子幀計算一次。此外,Rpp的計算可以完全忽略,因為對于給定子幀,相關(guān)Rpp是常數(shù),其值將選擇相同增益矢量即(β,γ)對在公式(30)中具有或不具有相關(guān)Rpp。
當(dāng)公式(30)的項如上所述預(yù)先計算了時,公式(30)的評估可以通過每評估的增益矢量14個乘累加(MAC)運算來有效地完成。本領(lǐng)域普通技術(shù)人員認(rèn)識到,盡管特殊增益矢量量化器,即誤差最小化單元324、524和624的特殊格式的增益信息表326、526和626在這里的描述是用于說明性目的,列出的方法同樣適用于其他量化增益信息的方法,諸如標(biāo)量量化或矢量量化技術(shù),包括無后效性的或預(yù)測技術(shù)。如本領(lǐng)域所公知,使用標(biāo)量量化或矢量量化技術(shù)將包括儲存增益信息到增益信息表326和526,然后可用于確定增益矢量。本領(lǐng)域普通技術(shù)人員進一步認(rèn)識到,盡管上面的例子說明了在N2≤L<N]]>時將ex(n)分解為其構(gòu)成矢量的方法,該方法也可輕易的擴展到N3≤L<N2,]]>N4≤L<N3]]>等的情況。
上面所示的分解過程有效地在L<N時,特別是給定N2≤L<N]]>的例子,將構(gòu)成矢量與增益參數(shù)或縮放因子β和γ相分離。該分解使得,一旦構(gòu)成矢量c0(n)到c3(n)由公式(17)-(20)所定義,作為互相獨立的矢量,可能處理構(gòu)成矢量c0(n)到c3(n)。這使得有可能對于給定子幀,預(yù)先計算相關(guān)項Rpc和Rcc,并且因此有效評估公式(30)。將公式(21)重寫為公式(32),合成組合激勵信號ex(n)可再次如下表示ex(n)=βc0(n)+β2c1(n)+γc2(n)+βγc3(n),n=0,N-1,(32)而且,很明顯,確定聯(lián)合優(yōu)化增益β和γ,使得公式(30)中的加權(quán)差能量E最小化,包括解兩個聯(lián)立非線性方程的系統(tǒng),即,解方程(31)。但是,作為解優(yōu)化增益矢量即優(yōu)化(β,γ)對的聯(lián)立方程的系統(tǒng)的另一方案,增益矢量的量化和優(yōu)化對的確定可以替換地包括在增益信息表326、526中檢索每個增益矢量并選擇增益矢量即(β,γ)對,用來產(chǎn)生該子幀最小的E值??商鎿Q地,只有增益矢量量化器即增益信息表326、526中的矢量子集,可以預(yù)先選擇用以評估,從而進一步限制與選擇(β,γ)對有關(guān)的計算量。
但是,可能希望使解聯(lián)合優(yōu)化增益β和γ成為線性(因此在計算量上解起來更簡單)問題。這可能非常有用,例如如果搜索激勵碼字或索引參數(shù)I,假定對于給定L評估每個激勵碼矢量 使用聯(lián)合優(yōu)化的一組增益縮放因子。因此,在本發(fā)明另一“線性化”實施例中,CELP編碼器可以例如在聯(lián)合優(yōu)化增益β和γ中解聯(lián)立線性方程的系統(tǒng)。
圖6是根據(jù)本發(fā)明線性化實施例的示例CELP編碼器600的框圖。類似于編碼器300和500,編碼器600實現(xiàn)在處理器中,該處理器與一個或多個存儲設(shè)備相通信,存儲設(shè)備儲存數(shù)據(jù)、碼本、和可由處理器執(zhí)行的程序。編碼器600類似于編碼器500,除了在編碼器600中,與構(gòu)成矢量c0(n)到c3(n)中的每個相關(guān)縮放因子或增益參數(shù)是獨立的。通過使縮放因子獨立,可以獲得與激勵矢量相關(guān)的聯(lián)合優(yōu)化增益參數(shù)的線性解。例如,公式(32)可以重寫如下ex(n)=λ0c0(n)+λ1c1(n)+λ2c2(n)+λ3c3(n),n=0,N-1.(33)其中,λ0,λ1,λ2,λ3是增益或縮放因子,分別與構(gòu)成矢量c0(n)到c3(n)相關(guān),并通過加權(quán)器608-611分別施加給構(gòu)成矢量。本領(lǐng)域普通技術(shù)人員認(rèn)識到,公式(33)所表示的合成激勵函數(shù)是公式(32)中提供的合成激勵函數(shù)的更一般的方程。當(dāng)λ0=β,λ1=β2,λ2=γ,λ3=βγ,(34)則公式(32)和公式(33)是等價的。因此,公式(33)所提供的ex(n)的方程,在如公式(34)所示選擇縮放因子時,能夠準(zhǔn)確地實現(xiàn)CELP激勵合成公式(1)。這樣,編碼器600可以視為說明編碼器300和500的特殊的、線性實施例。但是,由于縮放因子λ0,λ1,λ2,λ3允許互相獨立,且獨立變量的個數(shù)從2個(在組合激勵信號ex(n)的公式基于β和γ采用縮放因子的時候)增加到4個,因為需要乘c1(n)的縮放因子是β2(β的函數(shù))且乘c3(n)的縮放因子是βγ(β和γ的函數(shù)),對構(gòu)成信號ex(n)影響的限制提升了。這個額外靈活性的代價在于現(xiàn)在有4個、而不是2個增益縮放因子(λ0到λ3)需要量化。
線性化實施例中的子幀加權(quán)差能量E可以用下面的公式表示
E=Σn=0N-1[p(n)-λ0c‾0′(n)-λ1c‾1′(n)-λ2c‾2′(n)-λ3c‾3′(n)]2---(35)]]>擴展公式(35)且將其按照相關(guān)項進行表示,得到下面的公式E=Rpp-2Σk=03λkRpc(k)+2Σk=02Σl=k+13λkλlRcc(k,l)+Σk=03λk2Rcc(k,k)---(36)]]>為了解聯(lián)合優(yōu)化增益,或縮放因子,矢量(λ0,λ1,λ2,λ3),公式(36)可以進行偏微分,相對于四個增益或縮放因子中的每個,四個得到的公式中的每個可以設(shè)置為等于零(0)∂E∂λ0=0,∂E∂λ1=0,∂E∂λ2=0,∂E∂λ3=0.---(37)]]>評估公式(37)中的這四個公式,得到了四個聯(lián)立線性方程的系統(tǒng)。聯(lián)合優(yōu)化增益的矢量或縮放因子(λ0,λ1,λ2,λ3)的解可以通過解下面的方程來獲得Rcc(0,0)Rcc(0,1)Rcc(0,2)Rcc(0,3)Rcc(1,0)Rcc(1,1)Rcc(1,2)Rcc(1,3)Rcc(2,0)Rcc(2,1)Rcc(2,2)Rcc(2,3)Rcc(3,0)Rcc(3,1)Rcc(3,2)Rcc(3,3)λ0λ1λ2λ3=Rpc(0)Rpc(1)Rpc(2)Rpc(3)---(38)]]>現(xiàn)有技術(shù)的組合激勵信號ex(n)的公式,即公式(11)、(12)和(13)現(xiàn)在可以基于分解組合激勵信號或矢量為構(gòu)成矢量的概念來再訪和修訂,在L<N時構(gòu)成矢量每個都獨立于增益。而且,使解聯(lián)合優(yōu)化組的增益成為線性問題的技術(shù)也在該例子的環(huán)境中進行了說明。公式(11)、(12)和(13)現(xiàn)在重寫為下面的公式(39)、(40)和(41)ex(n)=βc0(n)+γc1(n),n=0,N-1(39)c0(n)=ex(n-L),n=0,Min(L,N)-1,c0(n-L),n=L,N-1---(40)]]>c1(n)=c~1(n),n=0,Min(L^,N)-1,c~1(n)+β^c1(n-L^),n=L^,N-1---(41)]]>該例子的限制為N2≤L<N]]>和N2≤L^<N.]]>以公式(11)-(13)或者(39)-(41)開始,可以得出一個方案,由此,誤差最小化單元324、524和624可以確定聯(lián)合優(yōu)化的增益矢量(β,γ)。虛擬碼本,本領(lǐng)域中也稱為自適應(yīng)碼本(ACB),用于構(gòu)造本例中的c0(n)。使用虛擬碼本構(gòu)造c0(n)意味著c0(n)的生成基于ex(n),n<0且c0(n)在公式(39)中與β線性組合。矢量c1(n)是通過將基音銳化濾波器施加到所選碼矢量 而構(gòu)造,該濾波器是參數(shù) 和 定義的零狀態(tài)LTP濾波器。將分解技術(shù)施加到公式(39)產(chǎn)生了下面的用于組合激勵信號或矢量ex(n)的公式ex(n)=βc‾0(n)+γc‾1(n)+β^γc‾2(n),n=0,N-1---(42)]]>其中,c‾0(n)=ex(n-L),n-0,Min(L,N)-1,c‾0(n-L),n=L,N-1,---(43)]]>c‾1(n)=c~1(n),n=1,N-1,---(44)]]>且c‾2(n)=0,n=0,Min(L^,N)-1,c‾1(n-L^),n=L^,N-1.---(45)]]>其中,矢量c0(n),c1(n)和c2(n)是組合激勵矢量的構(gòu)成矢量。加權(quán)差的能量,即E,對應(yīng)于公式(42)所表示的組合激勵信號ex(n),隨后可以由下面的公式表示E=Σn=0N-1[p(n)-βc‾0′(n)-γc‾1′(n)-β^γc‾2′(n)]2.---(46)]]>加權(quán)差的能量E還可以用信號相關(guān)各項表示如下E=Rpp-2βRpc(0)-2γRpc(1)-2β^γRpc(2)]]>+2βγRcc(0,1)+2ββ^γRcc(0,2)+β^γ2Rcc(1,2)---(47)]]>+β2Rcc(0,0)+γ2Rcc(1,1)+β^2γ2Rcc(2,2)]]>公式(14)給出的 的定義是這樣假設(shè)的,即β^=Max(0.2,Min(0.8,β))---(48)]]>
注意到, 是用在當(dāng)前子幀的增益參數(shù)β而不是前一子幀的增益參數(shù)的函數(shù)。因此公式(47)具有兩個獨立的變量,即β和γ。解聯(lián)合優(yōu)化增益矢量,即增益項(β,γ)對,包括取E即公式(47)對于β的第一偏導(dǎo)數(shù),設(shè)置該第一偏導(dǎo)數(shù)為等于零(0),取E對于γ的第二偏導(dǎo)數(shù),設(shè)置該第二偏導(dǎo)數(shù)為等于零(0),然后解兩個聯(lián)立非線性方程的系統(tǒng),也就是解下面兩個聯(lián)立非線性方程的結(jié)果∂E∂β=0,∂E∂γ=0.---(48a)]]>如前所討論的,盡管(β,γ)的聯(lián)合優(yōu)化包括解聯(lián)立非線性方程的系統(tǒng),從實現(xiàn)增益量化的有利點來看,不需要解聯(lián)合優(yōu)化組的增益,因為可用于每個編碼器300、500、600的可能增益組限制于這樣的一組優(yōu)化增益值,其可以由正在使用的誤差最小化單元為給定子幀生成。因此,選擇聯(lián)合優(yōu)化(β,γ)對包括在可由正在使用的誤差最小化單元產(chǎn)生的一組增益上評估公式(47)。
當(dāng)希望線性化一組聯(lián)合優(yōu)化增益的解時,使用所提出的線性化技術(shù)。在此時,公式(42)的合成組合激勵信號ex(n)可以使用線性縮放因子重寫如下ex(n)=λ0c0(n)+λ1c1(n)+λ2c2(n),n=0,N-1(49)對應(yīng)的子幀加權(quán)差E可以表示為E=Σn=0N-1[p(n)-λ0c‾0′(n)-λ1c‾1′(n)-λ2c‾2′(n)]2---(50)]]>擴展公式(50)且將公式(50)按照得到的相關(guān)項表示,產(chǎn)生了下面的對于子幀加權(quán)差E的表示E=Rpp-2Σk=02λkRpc(k)+2Σk=01Σl=k+12λkλlRcc(k,l)+Σk=02λk2Rcc(k,k)---(51)]]>為了解聯(lián)合優(yōu)化的縮放因子,或增益,矢量(λ0,λ1,λ2),公式(51)對三個增益λ0,λ1,λ2中的每個求偏導(dǎo)數(shù),這三個得到的微分方程的每個都被設(shè)置為等于零(0),即
∂E∂λ0=0,∂E∂λ1=0,∂E∂λ2=0.---(52)]]>聯(lián)合優(yōu)化縮放因子,或增益,矢量(λ0,λ1,λ2)然后可以通過解由公式(52)提供的三個微分方程所表示的三個聯(lián)立線性方程的系統(tǒng)而得到,如下所示Rcc(0,0)Rcc(0,1)Rcc(0,2)Rcc(1,0)Rcc(1,1)Rcc(1,2)Rcc(2,0)Rcc(2,1)Rcc(2,2)λ0λ1λ2=Rpc(0)Rpc(1)Rpc(2).---(53)]]>應(yīng)該注意到,在用于確定一組聯(lián)合優(yōu)化增益的非線性和線性實施例中,其中使用虛擬或自適應(yīng)碼本來定義c0(n),施加基音銳化技術(shù)來形成碼本激勵矢量c1(n),用于基音銳化濾波器的增益參與了加權(quán)差E在公式(47)或公式(51)中的最小化。此外,加權(quán)差E是通過正用于評估公式(47)或公式(51)的增益值而聯(lián)合優(yōu)化的。這與現(xiàn)有技術(shù)實現(xiàn)增益信息的矢量量化形成對比,當(dāng)激活基音銳化時,現(xiàn)有技術(shù)使用來自前一子幀的β值來定義用在當(dāng)前子幀的基音銳化濾波器系數(shù) 而且,在現(xiàn)有技術(shù)中, 的值對于子幀是固定的,因此不允許對于每個正在評估的增益矢量而改變。編碼器300、500和600通過許可增益,包括用于定義基音銳化系數(shù) 的信息,對于增益信息表中的每個矢量進行優(yōu)化,來允許有效地最小化加權(quán)子幀差能量E。
權(quán)利要求
1.一種用于對信號進行綜合分析編碼的方法,包括步驟基于輸入信號,生成目標(biāo)矢量;生成與合成激勵信號相關(guān)的多個構(gòu)成成分,其中多個構(gòu)成成分中的第一構(gòu)成成分基于偏移后的多個構(gòu)成成分中的第二構(gòu)成成分;和基于目標(biāo)矢量和多個構(gòu)成成分來評估差標(biāo)準(zhǔn),以確定與多個構(gòu)成成分中每個構(gòu)成成分相關(guān)聯(lián)的增益。
2.如權(quán)利要求1所述的方法,其中,評估差標(biāo)準(zhǔn)的步驟包括步驟基于目標(biāo)矢量和多個構(gòu)成成分來評估差標(biāo)準(zhǔn),以確定增益,其中使用所述增益來產(chǎn)生多個增益,并且多個增益中的每個增益與多個構(gòu)成成分中的每個構(gòu)成成分相關(guān)聯(lián)。
3.如權(quán)利要求1所述的方法,其中,評估差標(biāo)準(zhǔn)的步驟包括步驟基于多個構(gòu)成成分生成非線性方程的系統(tǒng);和解所述非線性方程的系統(tǒng),從而確定與多個構(gòu)成成分中每個構(gòu)成成分相關(guān)聯(lián)的增益。
4.如權(quán)利要求1所述的方法,其中,評估差標(biāo)準(zhǔn)的步驟包括步驟基于多個構(gòu)成成分生成線性方程的系統(tǒng);和解所述線性方程的系統(tǒng),從而確定與多個構(gòu)成成分中每個構(gòu)成成分相關(guān)聯(lián)的增益。
5.如權(quán)利要求1所述的方法,其中,評估差標(biāo)準(zhǔn)的步驟包括步驟基于目標(biāo)矢量和多個構(gòu)成成分,評估差標(biāo)準(zhǔn);和基于對差標(biāo)準(zhǔn)的評估,生成多個增益參數(shù)。
6.如權(quán)利要求5所述的方法,其中,生成多個增益參數(shù)的步驟包括步驟預(yù)先計算第一多個增益參數(shù),以產(chǎn)生多個預(yù)先計算的增益參數(shù);和基于預(yù)先計算的多個增益參數(shù),選擇第二多個增益參數(shù)。
7.一種用于對信號進行綜合分析編碼的裝置,包括目標(biāo)矢量生成器裝置,用于基于輸入信號,生成目標(biāo)矢量;成分生成器,用于生成與合成激勵信號相關(guān)的多個構(gòu)成成分,其中多個構(gòu)成成分中的第一構(gòu)成成分基于偏移后的多個構(gòu)成成分中的第二構(gòu)成成分;和誤差最小化單元,用于基于目標(biāo)矢量和多個構(gòu)成成分來評估差標(biāo)準(zhǔn),以確定與多個構(gòu)成成分中每個構(gòu)成成分相關(guān)聯(lián)的增益。
8.如權(quán)利要求7所述的裝置,其中,所述成分生成器包括基音預(yù)濾波器。
9.如權(quán)利要求7所述的裝置,其中,由所述誤差最小化單元對誤差標(biāo)準(zhǔn)的評估包括基于目標(biāo)矢量和多個構(gòu)成成分來評估差標(biāo)準(zhǔn),以確定增益,其中使用所述增益來產(chǎn)生多個增益,并且多個增益中的每個增益與多個構(gòu)成成分中每個構(gòu)成成分相關(guān)聯(lián)。
10.如權(quán)利要求7所述的裝置,其中,由所述誤差最小化單元對誤差標(biāo)準(zhǔn)的評估包括基于目標(biāo)矢量和多個構(gòu)成成分來評估差標(biāo)準(zhǔn)以及基于對差標(biāo)準(zhǔn)的評估來生成多個增益參數(shù),其中,所述裝置進一步包括加權(quán)器,用于基于多個增益參數(shù)中的增益參數(shù)來對多個構(gòu)成成分中的構(gòu)成成分進行加權(quán)。
11.如權(quán)利要求10所述的裝置,其中,由所述誤差最小化單元對誤差標(biāo)準(zhǔn)的評估包括確定差能量,并且其中由所述誤差最小化單元對多個增益參數(shù)的生成包括生成用于最小化所述差能量的多個增益參數(shù)。
12.一種對信號進行綜合分析編碼的語音編碼器,所述編碼器包括處理器,用于基于輸入信號生成目標(biāo)矢量;生成與合成激勵信號相關(guān)聯(lián)的多個構(gòu)成成分,其中多個構(gòu)成成分中的一個構(gòu)成成分基于偏移后的多個構(gòu)成成分中的另一個構(gòu)成成分;和基于目標(biāo)矢量和多個構(gòu)成成分來評估差標(biāo)準(zhǔn),以確定與多個構(gòu)成成分中每個構(gòu)成成分相關(guān)聯(lián)的增益。
全文摘要
一種用于對信號進行綜合分析編碼的語音編碼器(300),確定合成激勵信號(ex(n))的多個構(gòu)成成分中每個構(gòu)成成分的增益參數(shù)。該語音編碼器基于輸入信號(s(n))生成目標(biāo)矢量(p(n))。該語音編碼器還生成與合成激勵信號相關(guān)聯(lián)的多個構(gòu)成成分,其中多個構(gòu)成成分中的一個構(gòu)成成分基于偏移后的多個構(gòu)成成分中的另一個構(gòu)成成分。該語音編碼器還基于目標(biāo)矢量和多個構(gòu)成成分來評估差標(biāo)準(zhǔn),以確定與多個構(gòu)成成分中每個構(gòu)成成分相關(guān)聯(lián)的增益。
文檔編號G10L19/08GK1711589SQ200380102803
公開日2005年12月21日 申請日期2003年11月6日 優(yōu)先權(quán)日2002年11月8日
發(fā)明者馬克·A·亞修克, 詹姆士·P·阿什利, 烏達爾·米塔爾 申請人:摩托羅拉公司