話音信號編碼器和話音信號解碼器的制作方法

文檔序號：6822844閱讀：210來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電氣元件制品的制造及其應(yīng)用技術(shù)

專利名稱：話音信號編碼器和話音信號解碼器的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及高效編碼和解碼話音信息用的話音信號編碼器和話音信號解碼器。
背景技術(shù)：
當(dāng)今，正在開發(fā)高效編碼和解碼話音信息用的話音編碼技術(shù)。《碼激勵線性預(yù)測低比特率高質(zhì)量話音》(Code Excited Linear PredictionHigh Quality Speechat Low Bit Rate)(M.R.Schroeder著；發(fā)表于ICASSP’85，pp.937～940)中記載著基于這種話音編碼技術(shù)的CELP型話音信號編碼器。此話音信號編碼器對用固定時間劃分輸入話音所得的每一幀進行線性預(yù)測，由每幀的線性預(yù)測求預(yù)測殘差(激勵信號)，并用存放過去驅(qū)動音源的自適應(yīng)碼本和存放多個噪聲碼矢量的噪聲碼本將該預(yù)測殘差編碼。
圖1中示出以往的CELP型話音信號編碼器(下文簡稱為“話音編碼器”)的功能框圖。
線性預(yù)測分析單元12對此CELP型話音信號編碼器中輸入的話音信號11進行線性預(yù)測分析。利用該線性預(yù)測分析，可取得線性預(yù)測系數(shù)。線性預(yù)測系數(shù)為表示話音信號11的頻譜包絡(luò)特性的參數(shù)。線性預(yù)測分析單元12所得的線性預(yù)測系數(shù)在線性預(yù)測系數(shù)編碼單元13進行量化，并將量化后的線性預(yù)測系數(shù)送到線性預(yù)測系數(shù)解碼單元14。又將量化所得量化號作為線性預(yù)測碼輸入到編碼輸出單元14。線性預(yù)測系數(shù)解碼單元14將線性預(yù)測系數(shù)編碼單元13所得量化線性預(yù)測系數(shù)解碼后，取得合成濾波器的系數(shù)，線性預(yù)測系數(shù)解碼單元14將合成濾波器的系數(shù)輸出到合成濾波器15。
自適應(yīng)碼本17為輸出多種候補自適應(yīng)碼矢量的碼本，由存放過去的多幀驅(qū)動音源的緩存器構(gòu)成。自適應(yīng)碼矢量為表現(xiàn)輸入話音中周期分量的時間序列矢量。
噪聲碼本18為存放多種候補噪聲碼矢量的碼本，其種類對應(yīng)于所分配的比特數(shù)。噪聲碼矢量為表現(xiàn)輸入話音中非周期分量的時間序列矢量。
噪聲碼本18為存放多種候補噪聲碼矢量的碼本，其種類對應(yīng)于所分配的比特數(shù)。噪聲碼矢量為表現(xiàn)輸入知音中非周期分量的時間序列矢量。
自適應(yīng)碼增益加權(quán)單元19和噪聲碼增益加權(quán)單元20分別對自適應(yīng)碼本17和噪聲碼本18輸出的候補矢量乘以從加權(quán)碼本21讀出的自適應(yīng)增益和噪聲碼增益后，輸出到加法器22。
加權(quán)碼本是一種存儲器，分別存放多種與候補自適應(yīng)碼矢量相乘的加權(quán)數(shù)和與候補噪聲碼矢量相乘的加權(quán)數(shù)，其種類對應(yīng)于所分配的比特數(shù)。
加法器22將分別在自適應(yīng)碼增益加權(quán)單元19、噪聲碼增益加權(quán)單元20加權(quán)后的候補自適應(yīng)碼矢量和候補噪聲碼矢量相加，產(chǎn)生候補驅(qū)動音源矢量，并輸出到合成濾波器15。
合成濾波器15為由線性預(yù)測系數(shù)解碼單元14所得的合成濾波器系數(shù)構(gòu)成的全極型濾波器。合成濾波器15具有一種功能，輸入來自加法器22的候補驅(qū)動音源矢量時，輸出候補合成話音矢量。
失真計算單元16計算合成濾波器15的輸出(即候補合成話音矢量)與輸入話音11之間的失真，所得失真值輸出到碼號規(guī)定單元23。碼號規(guī)定單元23分別對三種碼本(自適應(yīng)碼本、噪聲碼本和加權(quán)碼本)規(guī)定使失真計算單元16中算出的失真最小的三種碼號(自適應(yīng)碼號、噪聲碼號和加權(quán)碼號)。然后，將碼號規(guī)定單元23所規(guī)定的三種碼號輸出到編碼輸出單元24。編碼輸出單元24匯合線性預(yù)測系數(shù)編碼單元13所得的線性預(yù)測碼號以及碼號規(guī)定單元23所規(guī)定的自適應(yīng)碼號、噪聲碼號和加權(quán)碼號，并輸出到傳輸線路。
圖2中示出對上述編碼器編碼的信號進行解碼的CELP型話音信號解碼器(下文簡稱為“話音解碼器”)的功能框圖。此話音信號解碼器中，編碼輸入單元31接收話音信號編碼器(圖1)送來的編碼，將接收到的編碼分解為線性預(yù)測碼號、自適應(yīng)碼號、噪聲碼號和加權(quán)碼號，并將分解所得編碼分別輸出到線性預(yù)測系數(shù)解碼單元32、自適應(yīng)碼本33、噪聲碼本34和加權(quán)碼本35。
接著，線性預(yù)測系數(shù)解碼單元32將編碼輸入單元31所得線性預(yù)測碼號解碼后，取得合成濾波器系數(shù)，并輸出到合成濾波器39。然后，從自適應(yīng)碼本中與自適應(yīng)碼號對應(yīng)的位置讀出自適應(yīng)碼矢量，從噪聲碼本讀出與噪聲碼號對應(yīng)的噪聲碼矢量，進而從加權(quán)碼本讀出加權(quán)碼號對應(yīng)的自適應(yīng)碼增益和噪聲碼增益。而且，在自適應(yīng)碼加權(quán)單元36將自適應(yīng)碼矢量乘以自適應(yīng)碼增益后，送到加法器38。同樣，在噪聲碼矢量加權(quán)單元37將噪聲碼矢量乘以噪聲碼增益后，送到加法器38。
加法器38將上述兩個編碼矢量相加后，產(chǎn)生驅(qū)動音源矢量，并將產(chǎn)生的驅(qū)動音源送到自適應(yīng)碼本33，以更新緩存器，該驅(qū)動音源也送到合成濾波器39，以驅(qū)動濾波器。合成濾波器39由加法器38所得驅(qū)動音源矢量驅(qū)動，并用線性預(yù)測系數(shù)解碼單元32的輸出再現(xiàn)合成話音。
在CELP型話音信號編碼器的失真計算單元16一般利用下式(式1)計算所求失真EE＝‖V-(gaHP+gcHC)‖2(1)V輸入話音信號(矢量)H合成濾波器脈沖響應(yīng)卷積矩陣

其中，h為合成濾波器的脈沖響應(yīng)(矢量)，L為幀長度，p自適應(yīng)碼矢量c噪聲碼矢量ga自適應(yīng)碼增益gc噪聲碼增益這里，為了使式(1)的失真E最小，需要對自適應(yīng)碼號、噪聲碼號和加權(quán)碼號的全部組合用閉環(huán)計算失真，規(guī)定各碼號。
然而，對式(1)進行閉環(huán)檢索，則運算處理量過大，因而一般首先用自適應(yīng)碼本由矢量量化規(guī)定自適應(yīng)碼號，其次由采用噪聲碼本的矢量量化規(guī)定噪聲碼號，最后由采用加權(quán)碼本的矢量量化規(guī)定加權(quán)碼號?，F(xiàn)就這種情況下，對采用噪聲碼本的矢量量化處理作進一步詳細說明。
自適應(yīng)碼號和自適應(yīng)碼增益預(yù)先確定或暫時確定時，式(1)的失真估算式變?yōu)橄旅娴氖?2)。
Ec＝‖X-gcHC‖(2)其中，式(2)內(nèi)的矢量X為采用預(yù)先規(guī)定或暫時規(guī)定的自適應(yīng)碼號和自適應(yīng)碼增益，并由下列式(3)求得的噪聲源信息(規(guī)定噪聲碼號用的目標(biāo)矢量)。
X＝V-gaHP (3)ga自適應(yīng)碼增益V話音信號(矢量)H合成濾波器脈沖響應(yīng)卷積矩陣P自適應(yīng)碼矢量在規(guī)定噪聲碼號后規(guī)定噪聲碼增益gc的情況下，一般知道可假設(shè)式(2)中的gc能取任意值，使式(2)最小的規(guī)定噪聲碼矢量號的處理(噪聲源信息的矢量量化處理)可置換為規(guī)定使下式(4)的分數(shù)式最大的噪聲碼矢量號。(X1Hc)2||Hc||2.........(4)]]>即，在自適應(yīng)碼號和自適應(yīng)碼增益先前已有或暫時規(guī)定的情況下，噪聲源信息矢量量化處理成為規(guī)定使失真計算單元16算出的式(4)分數(shù)式最大的候補噪聲碼矢量號的處理。
初期的CELP型編碼器/解碼器中，將存儲器中存儲種類與所分配比特數(shù)對應(yīng)的隨機數(shù)序列所得的數(shù)據(jù)用作噪聲碼本。然而，存在以下課題需要非常大的存儲容量，同時對各候補噪聲碼矢量計算式(4)的失真用的運算處理量龐大。
作為解決此課題的一種方法，可舉出《采用10毫秒話音幀的8kb/s ACELP話音編碼候選CCITT標(biāo)準(zhǔn)》(“8KBIT/S ACELP CODING OF SPEECH WITH 10MS SPEECH-FRAMEA CANDIDATE FOR CCITT STANDARDIZATION”)(R.Salami.C.Laflamme和J-P.Adoul著，刊登于ICASSP’94，pp.II-97～II-100，1994)等中所記載那樣，采用以代數(shù)方式產(chǎn)生音源矢量的代數(shù)音源矢量生成單元的CELP型話音信號編碼器/解碼器。
然而，噪聲碼本采用上述代數(shù)音源生成單元的CELP型話音信號編碼器/解碼器中，常以少量脈沖近似表現(xiàn)由式(3)求得的噪聲源信息(規(guī)定噪聲碼號的目標(biāo)矢量)，因而在謀求改善話音質(zhì)量方面存在局限。實際察看式(3)中噪聲源信息X的要素，則幾乎沒有僅用少量脈沖構(gòu)成該要素的情況。由此可說明存在局限。本發(fā)明揭示本發(fā)明的目的在于提供一種新的音源矢量生成裝置，該裝置能產(chǎn)生與實際分析話音信號時所得音源矢量的形狀和統(tǒng)計相似性高的音源矢量。
本發(fā)明的又一目的在于提供一種CELP話音信號編碼器/解碼器、話音信號通信系統(tǒng)和話音信號記錄系統(tǒng)，它們通過將上述音源矢量生成裝置用作噪聲碼本，可獲得比代數(shù)音源生成單元用作噪聲碼本時品質(zhì)高的合成話音。
本發(fā)明第1形態(tài)是一種音源矢量生成裝置，其特征在于，包括具有N個(N≥1)生成在矢量軸上某一要素建立帶極性單元脈沖的脈沖矢量的通道的脈沖矢量生成單元；具有存儲所述N中每一個通道M(M≥1)種擴散模式的功能，同時具有從所存M種擴散模式選擇一種擴散模式的功能的擴散模式存儲選擇單元；具有每一通道進行所述脈沖矢量生成單元所輸出脈沖矢量與所述擴散模式存儲選擇單元所選擇擴散模式的疊加運算，并產(chǎn)生N個擴散矢量的功能的脈沖矢量擴散單元；具有將所述脈沖矢量擴散單元產(chǎn)生的N個擴散矢量相加后，產(chǎn)生音源矢量的功能的擴散矢量加法器。使所述脈沖矢量生成單元具有以代數(shù)方式產(chǎn)生N個脈沖矢量(N≥1)的功能，再加上所述擴散模式存儲選擇單元預(yù)先存儲通過預(yù)先學(xué)習(xí)實際話音矢量的形狀(特性)獲得的擴散模式，因而可產(chǎn)生形狀比以往的代數(shù)音源生成單元更好地接近實際音源矢量形狀的音源矢量。
本發(fā)明第2形態(tài)是一種CELP話音信號編碼器/解碼器，其特征在于，噪聲碼本中采用所述音源矢量生成裝置。與以往噪聲碼本中采用代數(shù)音源生成單元的話音信號編碼器/解碼器相比，能產(chǎn)生更接近實際形狀的音源矢量，因此，能取得可輸出質(zhì)量更高的合成話音的話音信號編碼器/解碼器、話音信號通信系統(tǒng)和話音信號記錄系統(tǒng)。
附圖概述圖1為以往的CELP型話音信號編碼器的功能框圖。
圖2為以往的CELP型話音信號解碼器的功能框圖。
圖3為本發(fā)明第1實施形態(tài)有關(guān)音源矢量生成裝置的功能框圖。
圖4為本發(fā)明第2實施形態(tài)有關(guān)CELP型話音信號編碼器的功能框圖。
圖5為本發(fā)明第2實施形態(tài)有關(guān)CELP型話音信號解碼器的功能框圖。
圖6為本發(fā)明第3實施形態(tài)有關(guān)CELP型話音信號編碼器的功能框圖。
圖7為本發(fā)明第4實施形態(tài)有關(guān)CELP型話音信號編碼器的功能框圖。
圖8為本發(fā)明第5實施形態(tài)有關(guān)CELP型話音信號編碼器的功能框圖。
圖9為第5實施形態(tài)中矢量量化功能的框圖。
圖10為第5實施形態(tài)中提取目標(biāo)的算法的說明圖。
圖11為第5實施形態(tài)中預(yù)測量化的功能框圖。
圖12為第6實施形態(tài)中預(yù)測量化的功能框圖。
圖13為第7實施形態(tài)中CELP型話音信號編碼器的功能框圖。
圖14為第7實施形態(tài)中失真計算單元的功能框圖。
實施本發(fā)明的最佳形態(tài)下面利用

本發(fā)明的實施形態(tài)。
(第1實施形態(tài))圖3中示出本發(fā)明實施形態(tài)有關(guān)音源矢量生成裝置的功能框圖。此音源矢量生成裝置包括具有多個通道的脈沖矢量生成單元101；具有擴散模式存儲單元和開關(guān)的擴散模式存儲選擇單元102；擴散脈沖矢量的脈沖矢量擴散單元103；將擴散的多個通道脈沖矢量相加的擴散矢量加法器104。
脈沖矢量生成單元101具有N個通道(本實施形態(tài)中對N＝3的情況進行說明)，這些通道生成在矢量軸上某一要素配置帶極性單元脈沖的矢量(下文稱為脈沖矢量)。
擴散模式存儲選擇單元102具有存儲單元M1～M3和開關(guān)SW1～SW3，前者對每一通道存儲M種擴散模式(本實施形態(tài)中對M＝2的情況進行說明)，后者從各存儲單元M1～M3分別選擇M種擴散模式中的一種擴散模式。
脈沖矢量擴散單元103對每一通道進行脈沖矢量生成單元101所輸出脈沖矢量與擴散模式存儲選擇單元102所輸出擴散模式的疊加運算，并產(chǎn)生N個擴散矢量。
擴散矢量加法器104將脈沖矢量擴散單元103生成的N個擴散矢量相加后，生成音源矢量105。
本實施形態(tài)中，對脈沖矢量生成單元101按照下列表1所記載規(guī)則以代數(shù)方式產(chǎn)生N個脈沖矢量(N＝3)的情況進行說明。
表1

說明上文所述那樣構(gòu)成的音源矢量生成裝置的運作。擴散模式存儲選擇單元102從每通道分別存儲2種的擴散模式中選擇1種，并輸出到脈沖矢量擴散單元103。但，對應(yīng)于選擇的擴散模式組合(組合總數(shù)MN＝8種)，專門分配號碼。
接著，脈沖矢量生成單元101按照表1記載的規(guī)則，以代數(shù)方式生成通道數(shù)量份額的脈沖矢量(本實施形態(tài)中為3)。
脈沖矢量擴散單元103將擴散模式存儲選擇單元102選擇的擴散模式和脈沖矢量生成單元101生成的脈沖用式(5)作疊加運算，對每一通道生成擴散矢量。ci(n)=Σk=0L-1wij(n-k)di(k).......(5)]]>其中，n0～L-1L擴散矢量長度i通道號j擴散模式號(j＝1～M)ci通道i的擴散矢量wij通道i的第j種擴散模式Wij(m)的矢量長度為2L-1(m-(L-1)～L-1)，但，2L-1個要素中能規(guī)定值的是Lij要素，其它要素為零di通道i的脈沖矢量di＝±δ(n-pi)，n＝0～L-1pi通道i的候補脈沖矢量擴散矢量加法器104利用公式(6)將脈沖矢量擴散單元103生成的3個擴散矢量相加后，產(chǎn)生音源矢量105。c(n)=Σi=1Nci(n).......(6)]]>c音源矢量ci擴散矢量i通道號(i＝1～N)n矢量要素號(n＝0～L-1，其中L為音源矢量長度)這樣構(gòu)成的音源矢量生成裝置，通過使擴散模式存儲選擇單元102所選擇擴散模式的組合方法以及脈沖矢量生成單元101所生成脈沖矢量中的脈沖位置和極性帶有變化，可產(chǎn)生多樣的音源矢量。
于是，以上那樣構(gòu)成的音源矢量生成裝置，對擴散模式存儲選擇單元102所選擇擴散模式的組合方法和脈沖矢量生成單元101所生成脈沖矢量形狀(脈沖位置和脈沖極性)的組合方法等2種信息，可預(yù)先分配分別一一對應(yīng)的號碼。擴散模式存儲選擇單元102中，還可根據(jù)實際音源信息進行預(yù)先學(xué)習(xí)，并預(yù)先存儲該學(xué)習(xí)結(jié)果所得的擴散模式。
若話音信號編碼器/解碼器的音源信息生成單元中采用上述音源矢量生成裝置，則通過傳送擴散模式存儲選擇單元所選擇擴散模式的組合號和脈沖矢量生成單元所生成脈沖矢量的組合號(能規(guī)定脈沖位置和脈沖極性)等2種號碼。能實現(xiàn)噪聲源信息的傳送。
又，采用以上那樣構(gòu)成的音源矢量生成單元時，與采用以代數(shù)方式生成的脈沖音源時相比，可產(chǎn)生形狀(特性)和實際音源信息相似的音源矢量。
本實施形態(tài)中，對擴散模式存儲選擇單元102存儲每一通道2種擴散模式的情況進行說明，但在對各通道分配2種以外的擴散模式時，也能取得同樣的作用和效果。
本實施形態(tài)中對脈沖矢量生成單元101由3通道組成而且以表1所記載脈沖生成規(guī)則為基礎(chǔ)的情況進行說明，但在信道數(shù)不同時，以及脈沖生成規(guī)則采用表1所記載以外的規(guī)則時，也能取得同樣的作用和效果。
此外，組成具有上述音源矢量生成裝置或話音信號編碼器/解碼器的話音信號通信系統(tǒng)或話音信號記錄系統(tǒng)，可取得上述音源矢量生成裝置所具有的作用和效果。
(第2實施形態(tài))圖4中示出本實施形態(tài)有關(guān)CELP型話音信號編碼器的功能框圖，圖5中示出本實施形態(tài)有關(guān)CELP型話音信號解碼器的功能框圖。
有關(guān)本實施形態(tài)的CELP型話音信號編碼器，在上述圖1 CELP型話音信號編碼器的噪聲碼本中應(yīng)用第1實施形態(tài)所說明的音源矢量生成裝置。與本實施形態(tài)有關(guān)的CELP型話音信號解碼器，在上述圖2 CELP話音信號解碼器的噪聲碼本中，應(yīng)用上述第1實施形態(tài)的音源矢量生成裝置。因此，除噪聲源信息矢量量化處理以外的處理，均與上述圖1、圖2的裝置相同。本實施形態(tài)中，以噪聲源信息矢量量化處理為中心說明話音信號編碼器和話音信號解碼器。而且，與第1實施形態(tài)相同，也設(shè)通道數(shù)N＝3，一個通道的擴散模式數(shù)M＝2，脈沖矢量的生成依據(jù)圖1。
圖4話音信號編碼器中的噪聲源矢量量化處理是規(guī)定使式(4)基準(zhǔn)值最大的2種號碼(擴散模式組合號、脈沖位置和脈沖極性組合號)的處理。
將圖3音源矢量生成裝置用作噪聲碼本時，用閉環(huán)規(guī)定擴散模式組合號(8種)和脈沖矢量組合號(考慮極性時為16384種)。
因此，擴散模式存儲選擇單元215首先從本身存儲的2種擴散模式中選擇一種擴散模式，并輸出到脈沖矢量擴散單元217。然后，脈沖矢量生成單元216按照圖1的規(guī)則，以代數(shù)方法產(chǎn)生通道數(shù)份額的脈沖矢量(本實施形態(tài)中為3個)，并輸出到脈沖矢量擴散單元217。
脈沖矢量擴散單元217將擴散模式存儲選擇單元215選擇的擴散模式和脈沖矢量生成單元216產(chǎn)生的脈沖矢量用式(5)的疊加運算對每一通道產(chǎn)生擴散矢量。
擴散矢量加法器218將脈沖矢量擴散單元217獲得的擴散矢量相加后，生成音源矢量(成為候補噪聲碼矢量)。
然后，失真計算單元206算出采用擴散矢量加法器218所得候補噪聲碼矢量的式(4)的值。對按表1的規(guī)則產(chǎn)生的脈沖矢量的全部組合，進行上述式(4)的值的運算，并將其中式(4)的值最大時的擴散模式組合號、脈沖矢量組合號(脈沖位置及其極性的組合)，以及當(dāng)時的最大值輸出到碼號規(guī)定單元213。
接著，擴散模式存儲選擇單元215從所得存儲擴散模式選擇與先前剛選擇的組合不同的擴散模式。然后，就新選擇并更改的擴散模式的組合，與上文所述相同，對按表1的規(guī)則在脈沖矢量生成單元216產(chǎn)生的全部脈沖矢量組合算出式(4)的值。再次將其中式(4)最大時的擴散模式組合號、脈沖矢量組合號和最大值再次輸出到碼號規(guī)定單元213。
對能從擴散模式存儲選擇單元215所存擴散模式選擇的全部組合(本實施形態(tài)說明中組合總數(shù)為8)反復(fù)進行上述處理。
碼號規(guī)定單元213比較失真計算單元206算出的全部8個矢量最大值，選擇其中最大的，規(guī)定產(chǎn)生該最大值時的2種組合號(擴散模式組合號、脈沖矢量組合號)，并作為噪聲碼號輸出到編碼輸出單元214。
另一方面，圖5的話音信號解碼器中，編碼輸入單元301接收話音信號編碼器(圖4)送來的編碼，將接收到的編碼分解成對應(yīng)的線性預(yù)測號碼、自適應(yīng)碼號、噪聲碼號(由擴散模式組合號、脈沖矢量組合號等2種組成)和加權(quán)碼號，并將分解所得的編碼分別輸出到線性預(yù)測系數(shù)解碼單元302、自適應(yīng)碼本303、噪聲碼本304和加權(quán)碼本305。
噪聲碼號中，擴散模式組合號輸出到擴散模式存儲選擇單元311、脈沖矢量組合號輸出到脈沖矢量生成單元312。
然后，線性預(yù)測系數(shù)解碼單元302將線性預(yù)測碼號解碼，取得合成濾波器系數(shù)，并輸出到合成濾波器309。在自適應(yīng)碼本303，從與自適應(yīng)碼號對應(yīng)的位置讀出自適應(yīng)碼矢量。
噪聲碼本304中，擴散模式存儲選擇單元311對每一通道讀出與擴散脈沖組合號對應(yīng)的擴散模式并輸出到脈沖矢量擴散單元313；脈沖矢量生成單元312產(chǎn)生通道數(shù)份額的與脈沖矢量組合號對應(yīng)的脈沖矢量并輸出到脈沖矢量擴散單元313；脈沖矢量擴散單元313將從擴散模式存儲選擇單元311接收到的擴散模式和從脈沖矢量生成單元312接收到的脈沖矢量用式(5)的疊加運算產(chǎn)生擴散矢量，并輸出到擴散矢量加法器314。擴散矢量加法器314將脈沖矢量擴散單元313產(chǎn)生的各通道的擴散矢量相加后，產(chǎn)生噪聲碼矢量。
從加權(quán)碼本305讀出與加權(quán)碼號對應(yīng)的自適應(yīng)碼增益和噪聲碼增益，并在自適應(yīng)碼矢量加權(quán)單元306將自適應(yīng)碼矢量乘以自適應(yīng)碼增益，同樣，在噪聲碼加權(quán)單元307將噪聲碼矢量乘以噪聲碼增益后，送到加法器308。
加法器308將已乘上增益的上述2個碼矢量相加，生成驅(qū)動音源矢量，并將生成的驅(qū)動音源矢量輸出到自適應(yīng)碼本303，以便更新緩存器，還輸出到合成濾波器309，以便驅(qū)動合成濾波器。
合成濾波器309用加法器308所得的驅(qū)動音源矢量驅(qū)動后，再生合成話音310。又，自適應(yīng)碼本303用從加法器308接收的驅(qū)動音源矢量更新緩存器。
但，圖4和圖5中的擴散模式存儲選擇單元取為將式(2)內(nèi)的C中代入式(6)記載的音源矢量所得式(7)的失真計算基準(zhǔn)式當(dāng)作代價函數(shù)，并預(yù)先學(xué)習(xí)，使該代價函數(shù)的值較小后，將學(xué)習(xí)所得的擴散模式按每一通道加以存儲。
通過上述操作，可生成形狀與實際噪聲源信息(式(4)中矢量X)的形狀相似的音源矢量，因而與噪聲碼本中采用代數(shù)音源矢量生成單元的CELP話音信號編碼器/解碼器相比，能取得質(zhì)量高的合成話音。Ec=||X-gcHΣi=1NCi||2]]>=Σn=0L-1(X(n)-gcHΣi=1NCi(n))2]]>=Σn=0L-1(X(n)-gcHΣi=1NΣk=0L-1Wij(n-k)di(k))2.....(7)]]>X規(guī)定噪聲碼號用的目標(biāo)矢量gc噪聲碼增益H合成濾波器脈沖響應(yīng)卷積矩陣C噪聲碼矢量i通道號(i＝1～N)j擴散模式號(i＝1～M)ci通道i的擴散矢量Wij通道i的第j種擴散模式di通道i的脈沖矢量L音源矢量長度(n＝0～L-1)本實施形態(tài)中對每一通道預(yù)先存儲M個進行預(yù)先學(xué)習(xí)，使式(7)的代價函數(shù)值較小后獲得的擴散模式的情況進行說明，但實際上M個擴散模式不必全部通過學(xué)習(xí)取得，如果做成每一通道至少預(yù)先存儲一種通過學(xué)習(xí)取得的擴散模式，這種情況下也能取得提高合成話音質(zhì)量的作用和效果。
本實施形態(tài)中說明的情況是，根據(jù)擴散模式存儲選擇單元所存儲擴散模式的全部組合和脈沖矢量生成單元6所生成候補脈沖矢量位置的全部組合，用閉環(huán)規(guī)定使式(4)中基準(zhǔn)值最大的組合號。然而，做成根據(jù)規(guī)定噪聲碼本號前求得的參數(shù)(自適應(yīng)碼矢量的理想增益等)，進行預(yù)選，或用開環(huán)進行檢索等，也能取得同樣的作用和效果。
此外，通過構(gòu)成具有上述話音信號編碼器/解碼器的話音信號通信系統(tǒng)或話音信號記錄系統(tǒng)，能取得第1實施形態(tài)中記載的音源矢量生成裝置所具有的作用和效果。
(第3實施形態(tài))圖6中示出本實施形態(tài)有關(guān)CELP型話音信號編碼器的功能框圖。本實施形態(tài)在噪聲碼本內(nèi)采用上述第1實施形態(tài)音源矢量生成裝置的CELP話音編碼器中，用檢索噪聲碼本前求得的理想自適應(yīng)碼增益值，進行擴散模式存儲選擇單元所存擴散模式的預(yù)選。除噪聲碼本外圍部分以外，都與圖4的CELP型話音信號編碼器相同。因此，本實施形態(tài)說明圖6 CELP型話音信號編碼器中的噪聲源信息矢量量化處理。
此CELP型話音信號編碼器具有自適應(yīng)碼本407、自適應(yīng)碼增益加權(quán)單元409、由實施形態(tài)1所說明音源矢量生成裝置構(gòu)成的噪聲碼本408、噪聲碼增益加權(quán)單元410、合成濾波器405、失真計算單元406、碼號規(guī)定單元413、擴散模式存儲選擇單元415、脈沖矢量生成單元416、脈沖矢量擴散單元417、擴散矢量加法器418和自適應(yīng)增益判定單元419。
但，本實施形態(tài)中，上述擴散模式存儲選擇單元415存儲的M種擴散模式(M≥2)中至少一種是預(yù)先學(xué)習(xí)，使噪聲源信息矢量量化時產(chǎn)生的量化失真較小，并由該學(xué)習(xí)結(jié)果得到的擴散模式。
為了說明簡便，本實施形態(tài)中設(shè)脈沖矢量生成單元的通道數(shù)N為3，擴散模式存儲選擇單元所存儲每一通道的擴散脈沖種類數(shù)M為2，而且取下列情況進行說明M種擴散模式(M＝2)的一種是由上述學(xué)習(xí)獲得的擴散模式，另一種是由隨機數(shù)矢量生成裝置生成的隨機矢量串(下文稱為隨機模式)。附帶說一下，上述由學(xué)習(xí)獲得的擴散模式，如圖3中的W11那樣，顯然為長度比較短的脈沖狀擴散模式。
圖6的CELP型話音信號編碼器中，在噪聲源信息矢量量化前進行規(guī)定自適應(yīng)碼本號的處理。因此，在進行噪聲源信息矢量量化處理的時刻，可參照自適應(yīng)碼本的矢量號(自適應(yīng)碼號)和理想自適應(yīng)碼增益(暫時確定)。本實施形態(tài)中，使用其中的理想自適應(yīng)碼增益值進行擴散脈沖的預(yù)選。
具體而言，首先，自適應(yīng)碼本檢索完畢后，立即將碼號規(guī)定單元413所保持的自適應(yīng)碼增益理想值輸出到失真計算單元406。失真計算單元406將從碼號規(guī)定單元413接收到的自適應(yīng)碼增益輸出到自適應(yīng)增益判定單元419。
自適應(yīng)增益判定單元419對從失真計算單元409接收到的理想自適應(yīng)增益值和預(yù)先設(shè)定的門限值的大小進行比較。接著，自適應(yīng)增益判定單元419根據(jù)上述大小比較的結(jié)果，將預(yù)先用的控制信號送到擴散模式存儲選擇單元415?？刂菩盘柕膬?nèi)容在上述大小比較中自適應(yīng)碼增益大時，指示選擇進行預(yù)先學(xué)習(xí)、使噪聲源信息矢量量化時所產(chǎn)生量化失真較小后得到的擴散模式，并在上述大小比較中自適應(yīng)碼增益不大時，指示預(yù)選與學(xué)習(xí)結(jié)果所得擴散模式不同的擴散模式。
結(jié)果，在擴散模式存儲選擇單元415中，可適應(yīng)自適應(yīng)增益的大小，預(yù)選各通道存儲的M種擴散模式(M＝2)，從而能大量減少擴散模式組合數(shù)。結(jié)果，不需要對擴散模式的全部組合號計算失真，能以少量的運算高效進行噪聲源信息的矢量量化處理。
再者，噪聲碼矢量的形狀在自適應(yīng)增益值大時(有聲性強時)為脈沖狀，自適應(yīng)增益值小時(有聲性弱時)為隨機狀。因此，對話音信號的有聲區(qū)域和無聲區(qū)域，可分別利用形狀適合的噪聲碼矢量，所以能提高合成話音的質(zhì)量。
為了說明簡便，本實施形態(tài)限定于脈沖矢量生成單元的通道數(shù)N為3，擴散模式存儲選擇單元所存每一通道擴散脈沖的種類數(shù)M為2的情況下進行說明。然而，脈沖矢量生成單元的通道數(shù)、擴散模式存儲選擇單元中每一通道的擴散模式數(shù)與上述說明不同時，也能取得同樣的效果和作用。
為了說明簡便，本實施形態(tài)對每一通道所存M種擴散模式中(M＝2)，一種為由上述學(xué)習(xí)獲得的擴散模式，另一種為隨機模式的情況進行說明。然而，如果每一通道至少預(yù)先存儲一種由學(xué)習(xí)取得的擴散模式，即便不是上述那樣的情況，也能期望取得同樣的效果和作用。
本實施形態(tài)對具有將自適應(yīng)碼增益大小信息作為預(yù)選擴散模式用的手段的情況進行說明，但如果兼用自適應(yīng)增益大小信息以外的表示話音信號短時間特征的參數(shù)，可期望獲得更進一步的效果和作用。
此外，通過構(gòu)成具有上述話音信號編碼器的話音信號通信系統(tǒng)或話音信號記錄系統(tǒng)，可獲得實施形態(tài)1中記載的音源矢量生成裝置所具有的作用和效果。
再者，本實施形態(tài)說明了利用在噪聲源信息量化的時刻可參照的當(dāng)前處理幀理想自適應(yīng)音源增益，預(yù)選擴散模式的方法，但不用當(dāng)前幀理想自適應(yīng)音源增益，而代之以利用在緊接前一幀求出的解碼自適應(yīng)音源增益時，可取同樣的結(jié)構(gòu)，這時也能取得相同的效果。
(第4實施形態(tài))圖7為本實施形態(tài)有關(guān)CELP型話音信號編碼器的功能框圖。本實施形態(tài)在噪聲碼本內(nèi)采用第1實施形態(tài)音源矢量生成裝置的CELP型話音信號編碼器中，使用在噪聲源信息矢量量化的時刻可利用的信息，預(yù)選擴散模式存儲選擇單元所存儲的多個擴散模式。作為此預(yù)選的基準(zhǔn)，其特征在于，使用規(guī)定自適應(yīng)碼本號時所產(chǎn)生編碼失真(用S/N比表示)的大小。
除噪聲碼本外圍部分以外，均與圖4 CELP型話音信號編碼器相同。因此，本實施形態(tài)詳細說明噪聲源信息的矢量量化處理。
如圖7所示，本實施形態(tài)的CELP型話音信號編碼器具有自適應(yīng)碼本507、自適應(yīng)碼增益加權(quán)單元509、由第1實施形態(tài)中說明的音源矢量生成裝置構(gòu)成的噪聲碼本508、噪聲碼增益加權(quán)單元510、合成濾波器505、失真計算單元506、碼號規(guī)定單元513、擴散模式存儲選擇單元515、脈沖矢量生成單元516、脈沖矢量擴散單元517、擴散矢量加法器518和失真功率判定單元519。
但，本實施形態(tài)中，取上述擴散模式存儲選擇單元515所存M種擴散模式中(M≥2)，至少一種為隨機模式。
為了說明簡便，本實施形態(tài)中，取脈沖矢量生成單元的通道數(shù)N為3，擴散模式存儲選擇單元所存每一通道擴散模式的種類數(shù)M為2，而且假設(shè)M種擴散模式中(M＝2)一種為隨機模式，另一種為預(yù)先學(xué)習(xí)，使噪聲源信息矢量量化所產(chǎn)生的量化失真較小后，由該學(xué)習(xí)結(jié)果所得的擴散模式。
圖7的CELP型話音信號編碼器中，在噪聲源信息矢量量化處理前進行規(guī)定自適應(yīng)碼本號的處理。因此，在進行噪聲源號矢量量化處理的時刻，可參照自適應(yīng)碼本的矢量號(自適應(yīng)碼號)、理想自適應(yīng)碼增益(暫時確定)和自適應(yīng)碼本檢索用的目標(biāo)矢量。本實施形態(tài)中使用可根據(jù)上述三種信息算出的自適應(yīng)碼本編碼失真(用S/N比表示)，進行擴散模式的預(yù)選。
具體而言，自適應(yīng)碼本檢索完畢后，立即將碼號規(guī)定單元513所保持的自適應(yīng)碼號和自適應(yīng)碼增益(理想增益)的值輸出到失真計算單元506。失真計算單元506利用從碼號規(guī)定單元513接收到的自適應(yīng)碼號和自適應(yīng)碼增益，以及自適應(yīng)碼本檢索用的目標(biāo)矢量，算出由規(guī)定自適應(yīng)碼本號而產(chǎn)生的編碼失真(S/N比)。將算出的S/N比輸出到失真功率判定單元519。
失真功率判定單元519首先進行從失真計算單元506接收到的S/N比與預(yù)先設(shè)定的門限值的大小比較。接著，失真功率判定單元519根據(jù)上述大小比較的結(jié)果，將預(yù)選用的控制信號送到擴散模式存儲選擇單元515?？刂菩盘柕膬?nèi)容在上述大小比較中S/N比大時，指示選擇預(yù)先學(xué)習(xí)，使噪聲碼本檢索用目標(biāo)矢量進行編碼所產(chǎn)生的編碼失真較小后，其結(jié)果所得的擴散模式，并在上述大小比較中S/N比小時，指示選擇隨機模式的擴散模式。
結(jié)果，擴散模式存儲選擇單元515中，從各通道存儲的M種擴散模式(M＝2)僅預(yù)選一種，可大量減少擴散模式的組合。因此，不需要對擴散模式的全部組合號計算失真，能用少量的運算高效規(guī)定噪聲碼號。再者，噪聲碼矢量的形狀在S/N比大時為脈沖狀，S/N比小時為隨機狀。因此，能根據(jù)話音信號的短時間特征，使噪聲碼矢量的形狀變化，從而可提高合成話音的質(zhì)量。
為了說明簡便，本實施形態(tài)限定于脈沖矢量生成單元的通道數(shù)N為3，擴散模式存儲選擇單元所存每一通道擴散脈沖的種類數(shù)M為2的情況下進行說明。然而，脈沖矢量生成單元的通道數(shù)、每一通道擴散模式的種類與上述說明不同時，也能取得同樣的效果和作用。
為了說明簡便，本實施形態(tài)又對每一通道存儲的M種擴散模式中(M＝2)，一種為由上述學(xué)習(xí)取得的擴散模式，另一種為隨機模式的情況進行說明。然而，如果做成每一通道至少預(yù)先存儲一種隨機模式的擴散模式，即便不是上述那樣的情況也可期望取得同樣的效果和作用。
本實施形態(tài)中雖然僅用由規(guī)定自適應(yīng)碼號而產(chǎn)生的編碼失真(用S/N比表示)的大小信息作為預(yù)選擴散模式用的手段，但如果兼用進一步正確表示話音信號短時間特征的信息，可期望具有更進一步的效果和作用。
此外，通過構(gòu)成具有上述話音信號編碼器的話音信號通信系統(tǒng)或話音信號記錄系統(tǒng)，或獲得第1實施形態(tài)中記載的音源矢量生成裝置所具有的作用和效果。
第5實施形態(tài)圖8中示出本發(fā)明第5實施形態(tài)有關(guān)CELP型話音信號編碼器的功能框圖。此CELP型話音信號編碼器中，在LPC分析單元600通過對輸入話音數(shù)據(jù)601進行自相關(guān)分析和LPC分析，獲得LPC系數(shù)。又在對所得LPC系數(shù)進行編碼而取得LPC碼的同時，將所得LPC碼解碼，取得解碼LPC系數(shù)。
接著，在音源生成單元602，取出自適應(yīng)碼本603和噪聲碼本604所存的音源取樣(分別稱為自適應(yīng)碼矢量(或自適應(yīng)音源)和噪聲碼矢量(或噪聲源))，并分別送到LPC合成單元605。
在LPC合成單元605中，對音源生成單元602所獲得的2個音源，利用LPC分析單元600所獲得的解碼LPC系數(shù)進行濾波，從而獲得2個合成話音。
在比較單元606中，分析LPC合成單元605所得2個合成話音和輸入話音601的關(guān)系，求2個合成話音的最佳值(最佳增益)，并將用該最佳增益調(diào)整功率后的各合成話音相加，取得總合成話音后，計算該總合成話音與輸入話音的距離。
又，對自適應(yīng)碼本603和噪聲碼本604的全部音源的取樣，計算由驅(qū)動音源生成單元602和LPC合成單元605所得的多個合成話音與輸入話音601的距離，求該結(jié)果所得距離中最小時的音源取樣索引號。
將所得最佳增益、音源取樣索引號以及該索引號對應(yīng)的2個音源送到參數(shù)編碼單元607。在參數(shù)編碼單元607通過進行最佳增益編碼取得增益碼后，將LPC碼、音源取樣索引號匯合在一起送到傳輸線路608。
根據(jù)與增益碼和索引號對應(yīng)的2個音源，生成實際音源信號，將該信號存入自適應(yīng)碼本603，同時廢棄舊的音源取樣。
再者，LPC合成單元605中，通常兼用聽覺加權(quán)濾波器，該濾波器采用線性預(yù)測系數(shù)、高頻強化濾波器和長期預(yù)測系數(shù)(通過對輸入話音進行長期預(yù)測分析取得)。一般用將分析區(qū)間進一步細分的區(qū)間(稱為子幀)進行對自適應(yīng)碼本和噪聲碼本的音源檢索。
下面，本實施形態(tài)對LPC分析單元600中的LPC系數(shù)矢量量化進行詳細說明。
圖9示出實現(xiàn)在LPC分析單元600執(zhí)行的矢量量化算法用的功能框圖。圖9中所示矢量量化框包括目標(biāo)提取單元702、量化單元703、失真計算單元704、比較單元705、解碼矢量存儲單元707和矢量平滑單元708。
在目標(biāo)提取單元702中，根據(jù)輸入矢量701，算出量化目標(biāo)?，F(xiàn)詳細說明提取目標(biāo)的方法。
本實施形態(tài)中的輸入矢量由2種矢量構(gòu)成分析編碼對象幀所得的參數(shù)矢量；從一個未來幀進行同樣分析取得的參數(shù)矢量。目標(biāo)提取單元702利用上述輸入矢量和解碼矢量存儲單元707所存先前幀解碼矢量，算出量化目標(biāo)。式(8)示出運算方法的例子。
X(i)＝{St(i)+p(d(i)+St+1(i)/2}/(1+p)(8)X(i)目標(biāo)矢量i矢量要素號St(i)、St+1(i)輸入矢量t時間(幀號)p加權(quán)系數(shù)(固定)d(i)先前幀解碼矢量下面示出上述目標(biāo)提取方法的思路。典型的矢量量化中將當(dāng)前幀的參數(shù)矢量St(i)作為目標(biāo)X(i)，并用式(9)進行擬合。En=Σi=0I(X(i)-Cn(i))2......(9)]]>En與n號碼矢量的距離X(i)量化目標(biāo)Cn(i)碼矢量n碼矢量號i矢量維數(shù)I矢量長度于是，至此為止的矢量量化中，編碼失真仍然與音質(zhì)的劣化相聯(lián)系。在即使采取預(yù)測矢量量化等對策也不能避免某種程度的編碼失真的超低比特率編碼中，這成為大問題。
因此，本實施形態(tài)中，作為聽覺上難以發(fā)現(xiàn)差錯的方向，著眼于前后解碼矢量的中點，在該處導(dǎo)出解碼矢量，由此實現(xiàn)聽覺方面的改善。這是利用參數(shù)矢量內(nèi)插特性良好時，難以聽到時間連續(xù)特性在聽覺上的劣化這種特性。下面參照示出矢量空間的圖10說明這種情況。
首先，該前一幀的解碼矢量為d(i)，未來參數(shù)矢量為St+1(i)(實際上最好為未來解碼矢量，但當(dāng)前幀中不能編碼，所以代用參數(shù)矢量)，則碼矢量Cn(i)(1)為碼矢量Cn(i)(2)更接近參數(shù)矢量St(i)，但實際上Cn(i)(2)接近在d(i)與St+1(i)的連線上，因而比Cn(i)(1)不易聽到劣化。于是，利用這種特性，如果將目標(biāo)X(i)取為從St(i)以某種程度接近d(i)與St+1(i)的中點位置上的矢量，則將解碼矢量引導(dǎo)到聽覺上失真小的方向。
本實施形態(tài)中，通過導(dǎo)入下面式(10)的估算能實現(xiàn)這種目標(biāo)的移動。
X(i)＝{St(i)+p(d(i)+St+1(i)/2}/(1+p) (10)X(i)量化目標(biāo)矢量i矢量要素號St(i)、St+1(i)輸入矢量t時間(幀號)p加權(quán)系數(shù)(固定)d(i)先前幀解碼矢量式(10)的前半部分為一般矢量量化估算式，后半部分為聽覺加權(quán)分量。為了用上述估算式進行量化，在各X(i)將估算式進行微分，并設(shè)微分所得結(jié)果為0，則可得式(8)。
加權(quán)系數(shù)P為正的常數(shù)，其值為0時和一般矢量量化相同，無限大時目標(biāo)完全位于中點。P非常大，則目標(biāo)大為偏離當(dāng)前幀的參數(shù)矢量St(i)，聽覺清晰度下降。根據(jù)解碼話音信號試聽實驗，證實0.5＜p＜1.0時取得良好的性能。
在量化單元703對目標(biāo)提取單元702所得的量化目標(biāo)進行量化，求矢量碼，同時求解碼矢量，并和矢量碼一起送到失真計算單元704。
本實施形態(tài)中，采用預(yù)測矢量量化作為量化的方法。下面說明預(yù)測矢量量化。
圖11中示出預(yù)測矢量量化的功能框圖。預(yù)測矢量量化是一種利用過去編碼和解碼所得矢量(合成矢量)進行預(yù)測，并對該預(yù)測誤差進行矢量量化的算法。
預(yù)先生成存儲多個預(yù)測誤差矢量的中心取樣(碼矢量)的矢量碼本800。通常根據(jù)分析多個話音數(shù)據(jù)所得的多個矢量，利用LBG算法(IEEE TRANSACTIONSON COMMUNICATIONS，VOL.COM-28，NO.1，pp84-95，JANUARY 1980)，生成該碼本。
在預(yù)測單元802對量化目標(biāo)的矢量801進行預(yù)測。預(yù)測利用狀態(tài)存儲單元803所存的過去合成矢量進行，并將所得預(yù)測誤差矢量送到距離計算單元804。這里，作為預(yù)測的形態(tài)，舉出預(yù)測次數(shù)為1次時利用固定系數(shù)進行的預(yù)測。下面的式(11)中示出上此預(yù)測時的預(yù)測誤差矢量計算式。
Y(i)＝X(i)-βD(i) (11)Y(i)預(yù)測誤差矢量X(i)量化目標(biāo)β預(yù)測系數(shù)(非向量)D(i)前1幀的合成矢量i矢量維數(shù)上式中預(yù)測系數(shù)β的值一般為0＜β＜1。
在距離計算單元804中，計算預(yù)測單元802所得預(yù)測誤差矢量與矢量碼本800所存碼矢量的距離。下面的式(12)示出該距離計算公式。En=Σi=0I(T(i)-Cn(i))2.....(12)]]>En與n號碼矢量的距離T(i)預(yù)測誤差矢量Cn(i)碼矢量n碼矢量號i矢量維數(shù)I矢量長度在檢索單元805中比較與各碼矢量的距離，將距離最小的碼矢量的號碼作為矢量碼806加以輸出。即，控制矢量碼本800和距離計算單元804，求矢量碼本800所存全部碼矢量中距離最小的碼矢量的號碼，并將該矢量號作為矢量碼806。
進而，根據(jù)最終矢量碼，利用從矢量碼本800所得的碼矢量和狀態(tài)存儲單元803所存的過去解碼矢量，進行矢量解碼，并用所得的合成矢量更新狀態(tài)存儲單元803的內(nèi)容。因此，進行下一次解碼時可將此處解碼的矢量用于預(yù)測。
利用下面的式(13)進行上述預(yù)測形態(tài)例(預(yù)測次數(shù)為1次、固定系數(shù))的解碼。
Z(i)＝CN(i)+βD(i) (13)Z(i)解碼矢量(下一次編碼時作為D(i)使用)N矢量編碼CN(i)碼矢量
β預(yù)測系數(shù)(非向量)D(i)前1幀的合成矢量I矢量維數(shù)另一方面，在解碼器中，通過根據(jù)傳送來的矢量碼求碼矢量，進行解碼。解碼器中預(yù)先備有與編碼器相同的矢量碼本和狀態(tài)存儲單元，利用與上述編碼算法中的檢索單元解碼器功能相同的算法，進行解碼。以上是在量化單元703執(zhí)行的矢量量化。
在失真計算單元704中根據(jù)量化單元703所得的解碼矢量、輸入矢量701和解碼矢量存儲單元707所存的先前幀解碼矢量，計算聽覺加權(quán)編碼失真。下面的式(14)示出計算式。
Ew＝∑(V(i)-St(i))2+p{V(i)-(d(i)+St+1(i)/2}2(14)Ew加權(quán)編碼失真St(i)，St+1(i)輸入矢量t時間(幀號)i矢量要素號V(i)解碼矢量p加權(quán)系數(shù)(固定)d(i)先前幀解碼矢量在式(14)中，加權(quán)系數(shù)p與目標(biāo)提取單元702所用目標(biāo)計算式的系數(shù)相同。將上述加權(quán)編碼失真值、解碼矢量和矢量碼送到比較單元705。
比較單元705將失真計算單元704送來的矢量碼送到傳輸線路608，而且用失真計算單元704送來的解碼矢量，更新解碼矢量存儲單元707的內(nèi)容。
根據(jù)上述實施形態(tài)，在目標(biāo)提取單元702將目標(biāo)矢量修正為從St(i)以某種程度接近d(i)和St+1(i)的中點的位置的矢量，因而可進行加權(quán)檢索而不覺得聽覺上劣化。
至此，說明了本發(fā)明適應(yīng)于便攜電話等所用低比特率話音信號編碼技術(shù)的情況，但本發(fā)明不但是話音信號編碼，而且還能用于音樂編碼器。圖像編碼器中內(nèi)插性較好的參量矢量量化。
上述算法中LPC分析單元的LPC編碼通常是變換為一般的LSP(線譜對)等便于編碼的參數(shù)矢量，利用歐幾里德距離和加權(quán)歐幾里德距離進行矢量量化(VQ)。
本實施形態(tài)中，目標(biāo)提取單元702接受比較單元705的控制，將輸入矢量701送到矢量平滑單元708，目標(biāo)提取單元703接收矢量平滑單元708中修改過的輸入矢量，再進行目標(biāo)的提取。
這時，在比較單元705比較失真計算單元704送來的加權(quán)編碼失真值和比較單元內(nèi)部準(zhǔn)備的基準(zhǔn)值。根據(jù)此比較結(jié)果，處理分為二種。
未達到基準(zhǔn)值時，將失真計算單元704送來的矢量碼送到傳輸線路606，而且用失真計算單元704送來的解碼矢量，更新解碼矢量存儲單元707的內(nèi)容。通過用得到的解碼矢量改寫解碼矢量存儲單元707的內(nèi)容，進行此更新。然后，過渡到下一幀參數(shù)編碼處理。
反之，在基準(zhǔn)值以上時，控制矢量平滑單元708，對輸入矢量加以修改，使目標(biāo)提取單元702、量化單元703和矢量計算單元704再次起作用，進行重新編碼。
在比較單元705中未達到基準(zhǔn)值前，反復(fù)進行編碼處理。然而，有時會反復(fù)進行幾次也不能變成未達到基準(zhǔn)值，因而比較單元705內(nèi)部具有計數(shù)器，計算判定為基準(zhǔn)值以上的次數(shù)，達到一定次數(shù)以上時，中止反復(fù)編碼，并進行未達到基準(zhǔn)值時的處理和計算器清零。
矢量平滑單元708中，接收比較單元705的控制，根據(jù)由目標(biāo)提取單元702得到的輸入矢量和從解碼矢量存儲單元707得到的先前幀解碼矢量，利用下面的式(15)修改作為輸入矢量之一的當(dāng)前幀參數(shù)矢量St(i)，并將修改后的輸入矢量送到目標(biāo)提取單元702。
St(i)←(1-q)·St(i)+q(d(i)+St+1(i))/2 (15)上述q為平滑系數(shù)，表示當(dāng)前幀參數(shù)矢量接近先前幀解碼矢量與未來幀參數(shù)矢量的中點的程度。根據(jù)編碼實施，證實0.2＜q＜0.4且比較單元705的內(nèi)部反復(fù)次數(shù)上限值為5-8次時，可獲得良好的性能。
本實施形態(tài)雖然在量化單元703采用預(yù)測矢量量化，但借助上述平滑處理，失真計算單元704所得加權(quán)編碼失真變小的可能性大。其原因在于利用平滑處理使量化目標(biāo)更接近先前幀解碼矢量。因此，利用反復(fù)進行比較單元705控制的編碼，比較單元705的失真比較中未達到基準(zhǔn)值的可能性提高。
解碼器中，預(yù)先備有與編碼器量化單元對應(yīng)的解碼單元，根據(jù)從傳輸線路送來的矢量碼進行解碼。
本實施形態(tài)也用于CELP型編碼中出現(xiàn)的LSP參數(shù)量化(量化單元進行預(yù)測VQ)進行話音信號的編碼和解碼實驗。其結(jié)果，證實聽覺上的音質(zhì)當(dāng)然能提高，而且也能使客觀值(S/N比)提高。這是因為利用具有矢量平滑的反復(fù)編碼處理，達到即使頻譜急劇變化時也能抑制預(yù)測VQ編碼失真的效果。以往的預(yù)測VQ具有的缺點是由于根據(jù)過去合成矢量進行預(yù)測，講話開始的部分等頻譜急劇變化部分的頻譜失真反而變大。然而，應(yīng)用本實施形態(tài)，則失真大時進行平滑處理，直到失真變小，因而目標(biāo)雖然有些偏離實際的參數(shù)矢量，但編碼失真變小，可取得話音信號解碼時總體劣化變小的效果。因此，根據(jù)本實施形態(tài)，不僅聽覺上改善音質(zhì)，而且也能使客觀值提高。
本實施形態(tài)中，可利用比較單元和矢量平滑單元的特征，在矢量量化失真大時，將其劣化的方向控制在聽覺上比較不會覺察的方向上，而且在量化單元采用預(yù)測矢量量化時通過反復(fù)進行平滑處理+編碼，直到編碼失真變小也能使客觀值提高。
至此，說明了本發(fā)明適應(yīng)于便攜電話等所用低比特率話音編碼技術(shù)的情況，但本發(fā)明不僅是話音信號編碼，而且也可用于音樂編碼器和圖像編碼器中內(nèi)插性較好的參數(shù)矢量量化。
(第6實施形態(tài))下面說明本發(fā)明第6實施形態(tài)有關(guān)的CELP型話音信號編碼器。本實施形態(tài)除量化方法采用多級預(yù)測矢量量化的量化單元的量化算法外，其他的結(jié)構(gòu)與上述第5實施形態(tài)相同。即，噪聲碼本采用上述第1實施形態(tài)的音源矢量生成裝置。現(xiàn)詳細說明量化單元的量化算法。
圖12中示出量化單元的功能框圖。多級矢量量化中，進行目標(biāo)矢量量化后，以量化所得目標(biāo)碼字利用其碼本進行解碼，求編碼后的矢量與源目標(biāo)之差(稱為編碼失真矢量)，進而將求得的編碼失真矢量加以量化。
預(yù)先生成存放多個預(yù)測誤差矢量中心取樣(碼矢量)的矢量碼本899、矢量碼本900。借助對多個學(xué)習(xí)用的預(yù)測誤差矢量，應(yīng)用與典型“多級矢量量化”碼本生成方法相同的算法，生成這些碼本。即，通常根據(jù)分析許多話音數(shù)據(jù)所得的多個矢量，利用LBG算法(I EEE TRANSACTIONS ON COMMUNICATIONS，VOL.COM-28，NO.1，pp84-95，JANUARY 1980)生成上述碼本。但，矢量碼本899的學(xué)習(xí)組為許多量化目標(biāo)的集合，矢量碼本900的學(xué)習(xí)組為對上述許多量化目標(biāo)用量化碼本899進行編碼時的編碼失真矢量的集合。
首先，在預(yù)測單元902對量化目標(biāo)矢量901進行預(yù)測。預(yù)測用狀態(tài)存儲單元903所存過去合成矢量進行，并將得到的預(yù)測誤差矢量送到距離計算單元904和距離計算單元905。
本實施形態(tài)中，作為預(yù)測形態(tài)，舉出預(yù)測次數(shù)為1次時利用固定系數(shù)進行的預(yù)測。下面的式(16)示出用這種預(yù)測時的預(yù)測誤差矢量運算式。
Y(i)＝X(i)-βD(i) (16)Y(i)預(yù)測誤差矢量X(i)量化目標(biāo)β預(yù)測系數(shù)(非向量)D(i)前1幀的合成矢量i矢量維數(shù)上式中，預(yù)測系數(shù)β的值通常為0＜β＜1。
在距離計算單元904中，計算預(yù)測單元902所得預(yù)測誤差矢量與矢量碼本899所存碼矢量A的距離。下面的式(17)示出距離計算式。En=Σi=0I(X(i)-Cln(i))2.....(17)]]>En與n號碼矢量A的距離X(i)預(yù)測誤差矢量Cln(i)碼矢量An碼矢量A的號碼i矢量維數(shù)I矢量長度在檢索單元906中，比較與各碼矢量A的距離，將距離最小的碼矢量A的號碼作為碼矢量A的編碼。即，控制矢量碼本899和距離計算單元904求矢量碼本899所存全部碼矢量中距離最小的碼矢量A的號碼，并將該號碼作為碼矢量A的編碼。然后，將碼矢量A的編碼和參照該編碼從矢量碼本899取得的解碼矢量A送到距離計算單元905。又將碼矢量A的編碼送到傳輸線路、檢索單元907。
距離計算單元905根據(jù)預(yù)測誤差矢量和從檢索單元906取得的解碼矢量A，取得編碼失真矢量，或者參照從檢索單元906取得的碼矢量A的編碼，從幅度存儲單元908取得幅度，然后計算上述編碼失真矢量與矢量碼本900中存儲的碼矢量B乘以上述幅度所得結(jié)果的距離，并將該距離送到檢索單元907。下面的式(18)示出距離計算式。
Z(i)＝Y(jié)(i)-C1N(i)Em=Σi=0I(Z(i)-aNC2m(i))2......(18)]]>Z(i)解碼失真矢量Y(i)預(yù)測誤差矢量C1N(i)解碼矢量AN碼矢量A的編碼Em與m號碼矢量B的距離aN與碼矢量A的編碼對應(yīng)的幅度C2m(i)碼矢量Bm碼矢量B的號碼i矢量維數(shù)I矢量長度在檢索單元907中，比較與各碼矢量B的距離，將距離最小的碼矢量B的號碼作為碼矢量B的編碼。即，控制矢量碼本900和距離計算單元905，求矢量碼本900所存全部碼矢量B中距離最小的碼矢量B的號碼，并將該號碼作為碼矢量B的編碼。然后，將碼矢量A和碼矢量B的編碼合在一起，作為矢量909。
檢索單元907還根據(jù)碼矢量A、B的編碼，用從矢量碼本899和矢量碼本900獲得的解碼矢量A和B、從幅度存儲單元908獲得的幅度，以及狀態(tài)存儲903存儲的過去解碼矢量進行矢量的解碼，并利用得到的合成矢量更新狀態(tài)存儲單元903的內(nèi)容。(因此，進行下一次編碼時，將此處解碼的矢量用于預(yù)測。)利用下面的式(19)進行本實施形態(tài)預(yù)測(預(yù)測次數(shù)為1次。固定系數(shù))中的解碼。
Z(i)＝C1N(i)+aN·C2M(i)+βD(i) (19)Z(i)解碼矢量(下一次編碼時作為D(i)使用)N碼矢量A的編碼M碼矢量B的編碼C1M解碼矢量AC2M解碼矢量BaN與碼矢量A的編碼對應(yīng)的幅度β預(yù)測系數(shù)(非向量)D(i)前一幀的合成矢量i矢量維數(shù)預(yù)先設(shè)定幅度存儲單元908存儲的幅度，下面示出此設(shè)定方法。對許多話音數(shù)據(jù)進行編碼，并對第1級碼矢量的各編碼求下面式(20)的總編碼失真后，進行學(xué)習(xí)，使該失真最小，從而設(shè)定幅度。EN=ΣΣi=0I(Yt(i)-C1N(i)-aNC2mt(i))2.....(20)]]>EN碼矢量A的編碼為N時的編碼失真N碼矢量A的編碼t碼矢量A的編碼為N的時間Yt(i)時間t的預(yù)測誤差矢量C1N(i)解碼矢量AaN與碼矢量A的編碼對應(yīng)的幅度C2mt(i)碼矢量Bmt碼矢量B的號碼i矢量維數(shù)I矢量長度即，編碼后，設(shè)定并修改上述式(20)的失真，使在各幅度微分的值為0，由此，進行幅度學(xué)習(xí)。然后，反復(fù)進行上述編碼+學(xué)習(xí)，從而求出最佳幅度。
另一方面，解碼器中，通過根據(jù)傳遞來的矢量碼，求碼矢量，進行解碼。解碼器具有和編碼器相同的矢量碼本(對應(yīng)于碼矢量A、B)、幅度存儲單元和狀態(tài)存儲單元，用與上述編碼算法中檢索單元(對應(yīng)于碼矢量B)的解碼功能相同的算法進行解碼。
因此，本實施形狀中，利用幅度存儲單元和距離計算單元的特征以較少的計算量使第2級的碼矢量適應(yīng)第1級，從而能使幅度失真較小。
至此，說明了本發(fā)明適應(yīng)于便攜電話等所用低比特率話音信號編碼技術(shù)的情況，但本發(fā)明不僅是話音信號編碼，而且還可用于音樂編碼器和圖像編碼器等中內(nèi)插性較好的參數(shù)矢量量化。
(第7實施形態(tài))下面說明本發(fā)明第7實施形態(tài)有關(guān)的CELP型話音信號編碼器。本發(fā)明形態(tài)是一種編碼器的例子，該編碼器可減少采用ACELP型噪聲碼本時碼檢索的運算量。
圖13中示出本實施形態(tài)有關(guān)CELP型話音編碼器的功能框圖。此CELP型話音信號編碼器中，濾波器系數(shù)分析單元1002對輸入話音信號1001進行線性預(yù)測分析，取得合成濾波器系數(shù)，并將所得合成濾波器系數(shù)輸出到濾波器系數(shù)量化單元1003。濾波器系數(shù)量化單元1003將輸入的合成濾波器系數(shù)量化后，輸出到合成濾波器1004。
合成濾波器1004是根據(jù)濾波器系數(shù)量化單元1003所供給的濾波器系數(shù)建立的，由激勵信號1011驅(qū)動。該激勵信號1011通過將自適應(yīng)碼本1005輸出的自適應(yīng)矢量1006乘以自適應(yīng)增益1007所得結(jié)果與噪聲碼本1008輸出的噪聲矢量1009乘以噪聲增益1010所得結(jié)果相加而取得。
這里，自適應(yīng)碼本1005是存儲每一音調(diào)周期取出過去對合成濾波器的激勵信號的多個自適應(yīng)矢量的碼本，噪聲碼本1007是存儲多個噪聲矢量的碼本。噪聲碼本1007可采用上述第1實施形態(tài)的音源矢量生成裝置。
失真計算單元1013算出作為激勵信號1011所驅(qū)動合成濾波器1004的輸出的合成話音信號1012與輸入話音信號1001之間的失真，并進行碼檢索處理。碼檢索處理是一種規(guī)定使失真計算單元1013所計算失真最小用的自適應(yīng)矢量1006的號碼和噪聲矢量1009的號碼，同時算出各輸出矢量所乘自適應(yīng)增益1007和噪聲增益1010的最佳值的處理。
編碼輸出單元1014輸出的是將分別與從濾波器系數(shù)量化單元1003得到的濾波器系數(shù)量化值，以及失真計算單元1013中選擇的自適應(yīng)矢量1006的號碼和噪聲矢量1009的號碼相乘的自適應(yīng)增益1007和噪聲增益1009編碼后所得的結(jié)果。將從編碼輸出單元1014輸出的信息加以傳輸或存儲。
失真計算單元1013中的碼檢索處理，通常首先對激勵信號中的自適應(yīng)碼本分量進行檢索，然后對激勵信號中的噪聲碼本分量進行檢索。
上述噪聲分量的檢索使用下面說明的正交檢索。
正交檢索中，規(guī)定使式(21)的檢索基準(zhǔn)值Eort(＝Nort/Dort)最大的噪聲矢量c。Eort(=NortDort)=[{(PtHtHc)x-(xtHp)Hp}Hc]2(ctHtHc)(ptHtHp)-(ptHtHc)2.....(21)]]>NortEort的分子項DortEort的分母項p已規(guī)定的自適應(yīng)矢量H合成濾波器系數(shù)矩陣HtH的轉(zhuǎn)置矩陣X目標(biāo)信號(輸入話音信號與合成濾波器零輸入響應(yīng)差分所得的結(jié)果)c噪聲矢量正交檢索是對事先規(guī)定自適應(yīng)矢量為候補的噪聲矢量分別正交，并從正交的多個噪聲矢量規(guī)定1個失真最小的檢索方法。這種檢索方法與非正交檢索相比，其特征在于可提高規(guī)定噪聲矢量的精度，從而能提高合成話音信號的質(zhì)量。
ACELP方式中，只用少數(shù)帶極性的脈沖構(gòu)成噪聲矢量。利用這點，將式(21)所示檢索基準(zhǔn)值的分子項(Nort)變換為下面的式(22)，由此，可刪除分子項的運算。
Nort＝{a0ψ(l0)+a1ψ(l1)+…+an-1ψ(ln-1)}2(22)
ai第i個脈沖的極性(+1/-1)li第i個脈沖的位置N脈沖個數(shù)ψ{(ptHtHp)x-(xtHp)Hp}H將式(22)中ψ的值作為前處理預(yù)先計算，并在陣列中展開，則可將陣列ψ中的(N-1)個要素添加符號進行相加，并對其結(jié)果取平方，從而計算式(21)的分子項。
下面具體說明可對分母項減少運算量的失真計算單元1013。
圖14中示出失真計算單元1013的功能框圖。本實施形態(tài)中的話音信號編碼器，其結(jié)構(gòu)為在圖13的結(jié)構(gòu)中，將自適應(yīng)矢量1006和噪聲矢量1009輸入失真計算單元1013。
在圖14中，作為對所輸入噪聲矢量計算失真時的前處理，進行以下3種處理。
(1)算出第1矩陣(N)計算在合成濾波器合成自適應(yīng)矢量后所得矢量的功率(ptHtHp)和合成濾波器中濾波器系數(shù)的自相關(guān)矩陣(HtH)，并將上述功率與上述自相關(guān)矩陣各要素相乘，從而算出矩陣N(＝(ptHtHp)HtH)。
(2)算出第2矩陣(M)將在合成濾波器合成自適應(yīng)矢量后所得的矢量按反時針順序合成，并對其結(jié)果所得的信號(ptHtH)取矢積后，算出矩陣M。
(3)生成第3矩陣(L)對(1)中算出的矩陣N和(2)中算出的矩陣M進行差分，生成矩陣L。
又，式(21)的分母項(Dort)可展開為式(23)。
Dort＝(ctHtHc)(ptHtHp)-(ptHtHc)2(23)＝ctNc-(rtc)2＝ctNc-(rtc)t(rtc)＝ctNc-(ctrrtc)＝ctNc-(ctMc)＝ct(N-M)c＝ctLcN(ptHtHp)HtH←上述前處理(1)
rptHtH ←上述前處理(2)Mrrt←上述前處理(2)LN-M ←上述前處理(3)c噪聲矢量由此，將計算式(21)檢索基準(zhǔn)值(Eort)時的分母項(Dort)的計算方法置換為式(23)，可用較少的運算量規(guī)定噪聲碼本分量。
用上述前處理獲得的矩陣L和噪聲矢量1009，進行分母項的計算。
這里，為了簡便，對輸入話音信號取樣頻率為8000Hz，代數(shù)結(jié)構(gòu)噪聲碼本檢索的單位時間寬度(幀時間)為10ms，噪聲矢量用每10ms 5個單元脈沖(+1/-1)的規(guī)則組合生成的情況，說明基于式(23)的分母項計算方法。
又設(shè)構(gòu)成噪聲矢量的5個單位脈沖由處于從表2所示第0組到第4組所規(guī)定位置分別選擇1個位置的脈沖組成，候補噪聲矢量可用下面式(24)記述。
C＝a0δ(k-l0)+a1δ(k-l1)+…+a4δ(k-l4) (24)(k＝0，1，…79)ai第i組所屬脈沖的極性(+1/-1)li第i組所屬脈沖的位置表2<

這時，可用下面的式(25)求式(23)所示的分母項(Dort)。Dort=Σi=04Σj=04aiajL(li,lj)......(25)]]>ai第i組所屬脈沖的極性li第i組所屬脈沖的位置
L(li，lj)矩陣L中l(wèi)i行、lj列的要素根據(jù)以上說明，證明采用ACELP型噪聲碼本時，可用式(22)計算式(21)的碼檢索基準(zhǔn)值的分子項(Nort)，可用式(25)計算其分母項(Dort)。因此，采用ACELP型噪聲碼本時，不是原樣計算式(21)的基準(zhǔn)值，而是用(22)和式(25)分別計算其分子項和分母項，從而可大幅度削減碼檢索運算量。
以上說明的本實施形態(tài)，說明了不帶有預(yù)選的噪聲碼本檢索。然而，預(yù)選使式(22)的值大的噪聲矢量，并對利用預(yù)選收斂為多個候補的噪聲矢量計算式(21)，選擇使該值最大的噪聲矢量，這種情況下應(yīng)用本發(fā)明，也能取得相同的效果。
權(quán)利要求
1.一種音源矢量生成裝置，生成音源矢量，其特征在于，該裝置包括具有N個生成脈沖的通道(N≥1)的脈沖矢量生成手段；對應(yīng)于N個通道，每一通道存儲M種(M≥1)擴散模式的存儲手段；從所述存儲手段，每一通道選擇性地取出擴散模式的模式的選擇手段；每通道進行所取出的擴散模式與所生成的脈沖矢量的疊加運算，從而生成N個擴散矢量的擴散手段；根據(jù)所生成的N個擴散矢量，生成音源矢量的音源矢量生成手段。
2.如權(quán)利要求1所述的音源矢量生成裝置，其特征在于，所述脈沖矢量生成手段以代數(shù)方式生成N個脈沖矢量。
3.如權(quán)利要求1所述的音源矢量生成裝置，其特征在于，所述擴散手段用基于下式的疊加運算，對每一通道生成擴散矢量。ci(n)=Σk=0L-1wij(n-k)di(k)]]>其中，n0～L-1L擴散矢量長度i通道號j擴散模式號(j＝1～M)ci通道i的擴散矢量wij通道i的第j種擴散模式di通道i的脈沖矢量di＝±δ(n-pi)，n＝0～L-1pi通道i的候補脈沖位置
4.如權(quán)利要求1所述的音源矢量生成裝置，其特征在于，所述音源矢量手段根據(jù)下式，從N個擴散矢量生成1個音源矢量。c(n)=Σi=1Nci(n)]]>c音源矢量ci擴散矢量i通道號(i＝1～N)n矢量要素號(n＝0～L-1，其中L為音源矢量長度)
5.一種CELP型話音信號編碼器，用于對話音信息進行編碼，其特征在于，包括噪聲碼本，該碼本具有權(quán)利要求1所述的音源矢量生成裝置，用于將噪聲源信息加以矢量量化；合成濾波器，該濾波器將所述音源矢量生成裝置輸出的音源矢量用作噪聲碼矢量生成合成話音；計算所生成合成話音和輸入話音的量化失真的失真計算器；切換構(gòu)成脈沖矢量的脈沖的脈沖位置和脈沖極性以及擴散模式的組合的手段；規(guī)定所述失真計算器算出的量化失真變成最小的脈沖位置、脈沖極性、擴散模式的組合，并產(chǎn)生噪聲碼號的手段。
6.如權(quán)利要求5所述的CELP型話音信號編碼器，其特征在于，將進行預(yù)先學(xué)習(xí)，使噪聲源信息矢量量化時產(chǎn)生的量化失真更小后所得的擴散模式存儲到所述音源矢量生成裝置內(nèi)的存儲手段中。
7.如權(quán)利要求6所述的CELP型話音信號編碼器，其特征在于，所述音源矢量生成裝置內(nèi)的存儲手段每一通道至少存儲一種由學(xué)習(xí)取得的擴散模式。
8.如權(quán)利要求7所述的CELP型話音信號編碼器，其特征在于，在自適應(yīng)音源信息矢量量化時算出的理想自適應(yīng)碼增益值大于預(yù)先設(shè)定的門限值的情況下，選擇由學(xué)習(xí)取得的擴散模式。
9.如權(quán)利要求7所述的CELP話音信號編碼器，其特征在于，先前幀解碼自適應(yīng)音源增益值大于預(yù)先設(shè)定的門限值的情況下，選擇由學(xué)習(xí)取得的擴散模式。
10.如權(quán)利要求5所述的CELP型話音信號編碼器，其特征在于，所述音源矢量生成裝置內(nèi)的存儲手段，其各通道中至少一種擴散模式為由隨機數(shù)矢量序列形成的隨機模式。
11.如權(quán)利要求5所述的CELP型話音信號編碼器，其特征在于，所述音源矢量生成裝置內(nèi)的存儲手段，其各通道中至少一種擴散模式為進行預(yù)先學(xué)習(xí)，使噪聲源信息矢量量化時產(chǎn)生的量化失真更小后獲得的擴散模式，而且至少一種為隨機模式。
12.如權(quán)利要求11所述的CELP型話音信號編碼器，其特征在于，在規(guī)定自適應(yīng)碼號時產(chǎn)生的編碼失真功率大于預(yù)先設(shè)定的門限值的情況下，選擇隨機模式的擴散矢量。
13.如權(quán)利要求5所述的CELP型話音信號編碼器，其特征在于，從可取擴散模式的MN種全組合中規(guī)定表示各通道所選擇擴散模式的組合的組合號，使噪聲源信息矢量量化時產(chǎn)生的量化失真最小。
14.如權(quán)利要求13所述的CELP型話音信號編碼器，其特征在于，用預(yù)先求得的話音參數(shù)預(yù)選擴散模式的組合，并從預(yù)選所得擴散模式組合中規(guī)定表示各通道所選擴散模式的組合的組合號，使噪聲源信息矢量量化時產(chǎn)生的量化失真最小。
15.如權(quán)利要求14所述的CELP型話音信號編碼器，其特征在于，按照話音區(qū)間分析結(jié)果，切換預(yù)選的擴散模式的組合。
16.如權(quán)利要求5所述的CELP型話音信號編碼器，其特征在于，包括目標(biāo)提取手段，該手段利用分析編碼對象幀所得話音參數(shù)的參數(shù)矢量、分析與編碼對象幀相比為未來的幀所得的參數(shù)矢量，以及與編碼對象幀相比為先前的幀的解碼矢量，算出量化目標(biāo)矢量；矢量量化手段，該手段將所算出的量化目標(biāo)矢量進行編碼，取得編碼對象幀的編碼。
17.如權(quán)利要求16所述的CELP型話音信號編碼器，其特征在于，所述目標(biāo)提取手段根據(jù)下式算出量化目標(biāo)矢量。X(i)＝{St(i)+p(d(i)+St+1(i)/2}/(1+p)X(i)量化目標(biāo)矢量i矢量要素號St(i)、St+1(i)參數(shù)矢量t時間(幀號)p加權(quán)系數(shù)(固定)d(i)先前幀解碼矢量
18.如權(quán)利要求16所述的CELP型話音信號編碼器，其特征在于，包括將編碼對象幀的編碼進行解碼，以生成解碼矢量的手段；第二失真計算器，該計算器根據(jù)所述解碼矢量和所述編碼對象幀的參數(shù)，計算編碼失真；矢量平滑手段，該手段在所述編碼失真為基準(zhǔn)值以上的情況下，對提供給所述目標(biāo)提取手段的編碼對象幀的參數(shù)矢量進行平滑處理。
19.如權(quán)利要求18所述的CELP型話音信號編碼器，其特征在于，所述第二失真計算器根據(jù)下式計算聽覺加權(quán)編碼失真。Ew＝∑(V(i)-St(i))2+p{V(i)-(d(i)+St+1(i)/2}2Ew聽覺加權(quán)編碼失真St(i)，St+1(i)參數(shù)矢量t時間(幀號)i矢量要素號V(i)解碼矢量p加權(quán)系數(shù)d(i)先前幀解碼矢量
20.如權(quán)利要求16所述的CELP型話音信號編碼器，其特征在于，所述矢量量化手段包括與多極矢量量化的各級對應(yīng)設(shè)置，并存儲多個碼矢量的多個碼本；計算量化目標(biāo)矢量或其預(yù)測誤差矢量與第1級碼本所存碼矢量的距離，以取得第1級編碼的手段；幅度存儲單元，該存儲單元存儲與第1級碼本所存碼矢量對應(yīng)的、用非向量表示的幅度；乘法手段，該手段在進行第2級編碼之前，從所述幅度存儲單元取出從屬于第1級編碼的幅度，乘以第2級碼本所存的碼矢量；計算對第1級編碼進行解碼所得的解碼矢量與存儲于第2碼本并對幅度進行乘法運算后所得的碼矢量的距離，以取得第2級編碼的手段。
21.如權(quán)利要求5所述的CELP型話音信號編碼器，其特征在于，所述CELP型話音信號編碼器還具有存儲表現(xiàn)輸入話音音調(diào)分量的自適應(yīng)矢量的自適應(yīng)碼本，所述失真計算器包括計算所述合成濾波器中將所述自適應(yīng)矢量合成后所得信號的功率和所述合成濾波器的濾波器系數(shù)自相關(guān)矩陣，并算出將所述功率與所述自相關(guān)矩陣中各要素相乘所得的第1矩陣的手段，將所述合成濾波器中對所述自適應(yīng)矢量進行合成后所得的信號以反時針順序加以合成，并取反時針順序合成信號的矢積后，算出第2矩陣的手段，以及進行所述第1矩陣與所述第2矩陣的差分，以生成第3矩陣的手段；所述失真計算器利用所述第3矩陣計算失真。
22.一種CELP型話音信號解碼器，用于將話音信息解碼，其特征在于，包括噪聲碼本，該碼本具有權(quán)利要求1所述的音源矢量生成裝置，并按照規(guī)定擴散模式組合號和脈沖矢量組合號的噪聲碼號，選擇擴散模式，而且產(chǎn)生脈沖矢量；合成濾波器，該濾波器將所述音源矢量生成裝置輸出的音源矢量用作噪聲碼矢量生成合成話音。
23.如權(quán)利要求22所述的CELP型話音信號解碼器，其特征在于，將進行預(yù)先學(xué)習(xí)，使噪聲源信息矢量量化時產(chǎn)生的量化失真更小后所得的擴散模式存儲到所述音源矢量生成裝置內(nèi)的存儲手段中。
24.如權(quán)利要求23所述的CELP型話音信號解碼器，其特征在于，所述音源矢量生成裝置內(nèi)的存儲手段每一通道至少存儲一種由學(xué)習(xí)取得的擴散模式。
25.如權(quán)利要求22所述的CELP型話音信號解碼器，其特征在于，所述音源矢量生成裝置內(nèi)的存儲手段，其各通道中至少一種擴散模式為由隨機數(shù)矢量序列形成的隨機模式。
26.如權(quán)利要求22所述的CELP型話音信號解碼器，其特征在于，所述音源矢量生成裝置內(nèi)的存儲手段，其各通道中至少一種擴散模式為進行預(yù)先學(xué)習(xí)，使噪聲源信息矢量量化時產(chǎn)生的量化失真更小后獲得的擴散模式，而且至少一種為隨機模式。
27.一種音源矢量生成方法，生成音源矢量，其特征在于，包括生成N通道脈沖的矢量(N≥1)的步驟；從對應(yīng)于N個通道，每一通道存儲M種(M≥1)擴散模式的存儲手段，每一通道選擇性地取出擴散模式的步驟；每一通道進行所取出的擴散模式與所生成的脈沖矢量的疊加運算，以生成N個擴散矢量的步驟；從所生成的N個擴散矢量生成音源矢量的步驟。
28.一種話音信號解碼方法，用于以CELP方式將話音信息編碼，其特征在于，包括利用權(quán)利要求1所述的音源矢量生成裝置，生成用于將噪聲源信息矢量量化的噪聲碼矢量的步驟；將所述音源矢量生成裝置輸出的音源矢量用作噪聲碼矢量生成合成話音的步驟；計算所生成合成話音和輸入話音的量化失真步驟；切換構(gòu)成脈沖矢量的脈沖的脈沖位置和脈沖極性以及擴散模式的組合的步驟；規(guī)定量化失真變成最小的脈沖位置、脈沖極性、擴散模式的組合的步驟。
29.一種話音信號解碼方法，用于將以CELP的方式編碼的話音信息解碼，其特征在于，包括利用權(quán)利要求1所述的音源矢量生成裝置，生成噪聲碼矢量的步驟；將所述音源矢量生成裝置輸出的音源矢量用作噪聲碼矢量生成合成話音的步驟。
30.一種矢量量化方法，對輸入矢量進行量化，其特征在于，包括根據(jù)時間上連續(xù)的多個矢量組成的輸入矢量和過去的解碼矢量，算出量化目標(biāo)矢量的步驟；將所述量化目標(biāo)矢量進行編碼，取得其編碼，同時將所述編碼進行解碼，并取得解碼矢量的步驟；根據(jù)所取得的解碼矢量和所述輸入矢量，計算失真的步驟；規(guī)定使所述失真最小的編碼的步驟；存儲解碼矢量的步驟；利用與最終編碼對應(yīng)的解碼矢量，更新解碼矢量的步驟。
31.一種通信裝置，其特征在于具有權(quán)利要求5所述的CELP型話音編碼器。
32.一種通信裝置，其特征在于具有權(quán)利要求22所述的CELP型話音解碼器。
全文摘要
一種音源矢量生成裝置,其中包括:具有N個生成脈沖矢量的通道(N≥1)的脈沖矢量生成單元;對應(yīng)于N個通道,每一通道存儲M種(M≥1)擴散模式的存儲單元;從存儲單元,每一通道選擇性地取出擴散模式的選擇單元;每一通道進行所取出的擴散模式和所生成的脈沖矢量的疊加運算,并生成N個擴散矢量的擴散單元;根據(jù)所生成的N個擴散矢量,生成音源矢量的音源矢量生成單元。
文檔編號H01L21/70GK1242860SQ9880155
公開日2000年1月26日申請日期1998年10月22日優(yōu)先權(quán)日1997年2月13日
發(fā)明者安永和敏, 森井利幸申請人:松下電器產(chǎn)業(yè)株式會社

完整全部詳細技術(shù)資料下載