專利名稱::頻譜幅度的雙子幀量化的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及語(yǔ)音編碼與解碼。語(yǔ)音的編碼和解碼有大量的應(yīng)用并有了廣泛的研究。通常,一種語(yǔ)音編碼,比如語(yǔ)音壓縮,尋求在沒(méi)有實(shí)際地降低語(yǔ)音質(zhì)量和可懂性的前提下,能降低表達(dá)語(yǔ)音信號(hào)所需的數(shù)據(jù)率。語(yǔ)音壓縮技術(shù)可以用語(yǔ)音編碼器實(shí)現(xiàn)。語(yǔ)音編碼器一般包括編碼器和解碼器。編碼器由數(shù)字化的語(yǔ)音信號(hào)生成壓縮的位流,例如一個(gè)麥克風(fēng)產(chǎn)生的模擬信號(hào)通過(guò)一個(gè)模/數(shù)變換器所生成的信號(hào)。解碼器將壓縮的位流轉(zhuǎn)換成語(yǔ)音的數(shù)字表達(dá)方式以適于通過(guò)數(shù)/模變換器和揚(yáng)聲器將語(yǔ)音信號(hào)重現(xiàn)。在許多應(yīng)用中,編碼器和解碼器是分開(kāi)的,位流在二者之間的信道上傳輸。語(yǔ)音編碼器的一個(gè)關(guān)鍵參數(shù)是編碼器所達(dá)到的壓縮量,它可以用編碼器產(chǎn)生位流的位速率來(lái)衡量。編碼器的位速率一般是所需逼真度(即語(yǔ)音質(zhì)量)和所用語(yǔ)音編碼器類型的函數(shù)。不同類型的編碼器被設(shè)計(jì)為在高速率(8kbs以上),中速率(3~8kbs)和低速率(低于3kbs)下工作。近來(lái),中速率和低速率的語(yǔ)音編碼器在大范圍的移動(dòng)通信應(yīng)用(例如蜂窩電話,衛(wèi)星電話,地面移動(dòng)無(wú)線電話,和飛行中的電話)中受到注意。這些應(yīng)用典型地需要高質(zhì)量語(yǔ)音和容忍由聲學(xué)噪聲和通道噪聲(如位錯(cuò)誤)造成的影響。聲碼器是一種明顯極適合用于移動(dòng)通信的語(yǔ)音編碼器。聲碼器將語(yǔ)音模擬成一個(gè)系統(tǒng)在短時(shí)間間隔內(nèi)對(duì)一激勵(lì)的響應(yīng)。聲碼器的實(shí)例包括線性預(yù)測(cè)聲碼器,同態(tài)聲碼器,通道聲碼器,正弦變換編碼器(“STC”),多帶激勵(lì)(“MBE”)聲碼器,和改進(jìn)多帶激勵(lì)(“IMBE”)聲碼器。在這些聲碼器中,語(yǔ)音被分為許多短段(典型值為10~40ms),每段由一組模型參數(shù)來(lái)表征。這些參數(shù)一般表達(dá)每個(gè)語(yǔ)音段的幾個(gè)基本單元,如段音調(diào)、聲音狀態(tài)和譜包絡(luò)。聲碼器可以用大量的已知方法之一來(lái)表達(dá)這些參數(shù)中的每一個(gè)。例如音調(diào)可以表達(dá)為音調(diào)周期、基音頻率、或長(zhǎng)期預(yù)測(cè)延遲。類似地,聲音狀態(tài)可以表達(dá)為一個(gè)或多個(gè)濁音/清音判決,聲音概率度量、或周期性能量對(duì)隨機(jī)性能量的比值。頻譜包絡(luò)經(jīng)常表達(dá)為全極點(diǎn)濾波器響應(yīng),也可以表達(dá)為一組頻譜幅度或其它頻譜度量值。既然允許用少量參數(shù)來(lái)表達(dá)一個(gè)語(yǔ)音段,那么基于模型的語(yǔ)音編碼器,比如聲碼器,一般能夠在中到低的數(shù)據(jù)率下運(yùn)行。然而,基于模型的系統(tǒng)的質(zhì)量依賴于底層模型的精度。所以,如果要求這些語(yǔ)音編碼器得到高的語(yǔ)音質(zhì)量的話就必須使用高逼真度的模型。由Griffin和Lim開(kāi)發(fā)的多帶激勵(lì)語(yǔ)音模型展示給人們的性能是可提供高質(zhì)量的語(yǔ)音并可在中到低的位速率上良好地工作。這一模型采用一個(gè)靈活的聲音結(jié)構(gòu),這一結(jié)構(gòu)允許它產(chǎn)生聽(tīng)起來(lái)更自然的語(yǔ)音,而且更能容忍聲學(xué)背景噪聲的出現(xiàn)。這些特性使得MBE語(yǔ)音模型被大量的商用移動(dòng)通信所采用。MBE語(yǔ)音模型用一個(gè)基音頻率,一組二進(jìn)制濁音/清音(V/UV)的度規(guī)(metric)和一組譜幅度來(lái)表達(dá)語(yǔ)音段。MBE模型對(duì)于較傳統(tǒng)模型的一個(gè)基本優(yōu)勢(shì)是在語(yǔ)音表達(dá)上。MBE模型將傳統(tǒng)的每段單V/UV判決推廣為一組判決,每一判決代表一特定頻帶上的聲音狀態(tài)。語(yǔ)音模型中這種增加的靈活性使得MBE模型可以更好地適應(yīng)混合聲音,比如一些摩擦音。另外,這種增加的靈活性使得被聲學(xué)背景噪聲所污染的語(yǔ)音可以更精確地表達(dá)出來(lái)。廣泛的測(cè)試顯示了這種推廣提高了語(yǔ)音的質(zhì)量和可懂性?;贛BE語(yǔ)音編碼器中的編碼器為每個(gè)語(yǔ)音段估計(jì)一組模型參數(shù)。MBE模型參數(shù)包括一個(gè)基音頻率(音調(diào)周期的倒數(shù))、一組表征聲音狀態(tài)的V/UV度規(guī)或判決、和一組表征譜包絡(luò)的譜幅度。為每段估計(jì)了MBE模型參數(shù)后,編碼器對(duì)參數(shù)進(jìn)行數(shù)字化以產(chǎn)生一數(shù)據(jù)位幀。在交錯(cuò)處理并傳輸所生成位流到相應(yīng)解碼器之前,編碼器可以用糾錯(cuò)碼/檢錯(cuò)碼選擇性地保護(hù)一些位。解碼器將收到的位流轉(zhuǎn)換回各個(gè)幀。作為此變換的一部分,解碼器可以進(jìn)行解交錯(cuò)處理和差錯(cuò)控制解碼以檢錯(cuò)和糾錯(cuò)。然后,解碼器用位幀重構(gòu)MBE模型參數(shù),解碼器利用這些參數(shù)合成一語(yǔ)音信號(hào),這一信號(hào)感覺(jué)上極象原語(yǔ)音信號(hào)。解碼器可以合成各個(gè)濁音和清音份,然后可以增加濁音和清音成份來(lái)產(chǎn)生最終的語(yǔ)音信號(hào)。在基于MBE的系統(tǒng)中,編碼器用譜幅度表征所估計(jì)的基音頻率的每一諧波的譜包絡(luò)。典型地,根據(jù)包含相應(yīng)諧波的頻帶是否已被定為濁音或清音,將每一諧波標(biāo)識(shí)為濁音或清音。然后編碼器為每一諧波頻率估計(jì)一個(gè)譜幅度。當(dāng)一諧波頻率已被定為濁音,編碼器可以使用幅度估計(jì)器,此估計(jì)器有別于一個(gè)諧波頻率已被定為清音時(shí)所用的幅度估計(jì)器。在解碼器一方,要識(shí)別濁音和清音的諧波,并且各個(gè)濁音和清音成份用不同的程序合成。清音成份可用加權(quán)重疊相加方法來(lái)合成,以濾除白噪聲信號(hào)。此濾波器設(shè)置為將定為濁音部分的頻率區(qū)域歸零,而將其它區(qū)域與被定為清音部分的譜幅度進(jìn)行匹配。濁音成份用一個(gè)可調(diào)諧振蕩器組來(lái)合成,其中給每一個(gè)被標(biāo)識(shí)為濁音的諧波分配一個(gè)振蕩器。對(duì)瞬時(shí)幅度、頻率和相位進(jìn)行內(nèi)插以與相鄰段的相應(yīng)參數(shù)匹配。基于MBE的語(yǔ)音編碼器包括IMBETM語(yǔ)音編碼器和AMBE_語(yǔ)音編碼器。AMBE_語(yǔ)音編碼器是作為早期基于MBE技術(shù)的改進(jìn)型而開(kāi)發(fā)的。它包含一個(gè)估計(jì)激勵(lì)參數(shù)(基音頻率和V/UV判決)的更強(qiáng)方法,此方法可更好地跟蹤實(shí)際語(yǔ)音中出現(xiàn)的變化與噪聲。AMBE_語(yǔ)音編碼器采用了一個(gè)濾波器組和一個(gè)非線性方法來(lái)產(chǎn)生一組通道輸出,此濾波器組一般包括十六個(gè)通道。由通道輸出可以可靠地估計(jì)出激勵(lì)參數(shù)。結(jié)合并處理通道輸出來(lái)估計(jì)基音頻率,然后處理在幾個(gè)(如八個(gè))聲音頻帶中每一頻帶的這些輸出,來(lái)估計(jì)每一濁音段的一個(gè)V/UV判決(或其它聲音度規(guī))。AMBE_語(yǔ)音編碼器也可以不依賴于聲音判決來(lái)估計(jì)譜幅度。做這一步,語(yǔ)音編碼器要為每一加窗的語(yǔ)音子幀做快速付利葉變換(FFT),然后在頻率值為估計(jì)的基音頻率的倍數(shù)的頻率范圍內(nèi)平均能量。此方法可以進(jìn)一步包括補(bǔ)償處理,以在估計(jì)的譜幅度中去掉由FFT采樣間隔所引入的人為因數(shù)。AMBE_語(yǔ)音編碼器也可包含一個(gè)相位合成成份,在沒(méi)有從編碼器到解碼器清晰地傳輸相位信息的情況下,再生成用于濁音語(yǔ)音合成中的相位信息。與1MBETM語(yǔ)音編碼器的情況相似,可以應(yīng)用基于V/UV判決的隨機(jī)相位合成。另一方面,解碼器可以對(duì)重構(gòu)的譜幅度進(jìn)行一平滑核心操作(smoothingkernel)以產(chǎn)生相位信息,這樣產(chǎn)生的信號(hào)在感覺(jué)上比用隨機(jī)產(chǎn)生相位信息的方法產(chǎn)生的信號(hào)更接近于原語(yǔ)音。以上所提到的這些技術(shù)在以下的文獻(xiàn)中有所描述Flanagan,《語(yǔ)音分析,合成和識(shí)別》,Springer-Verlag,1972,378頁(yè)~386頁(yè)(描述一個(gè)基于頻率的語(yǔ)音分析-合成系統(tǒng));Jayant等,《波形的數(shù)字編碼》,Prentice-Hall,1984,(描述通常的語(yǔ)音編碼);美國(guó)專利4,885,790號(hào)(描述一個(gè)正弦處理方法);美國(guó)專利5,054,072號(hào)(描述一個(gè)正弦編碼方法);Almeida等,“濁音語(yǔ)音的非定點(diǎn)模型”,IEEETASSP,Vol.ASSP-31,No.3,June1983,664-667頁(yè),(描述諧波模型和相關(guān)的編碼器);Almeida等,“可變-頻率合成一個(gè)改進(jìn)的諧波編碼方案”,IEEEProc.ICASSP84,27.5.1-27.5.4頁(yè)(描述一個(gè)多項(xiàng)式的濁音合成方法);Quatieri等,“基于正弦表示的語(yǔ)音變換”,IEEETASSP,Vol,ASSP34,No.6,Dec.1986,1449-1986頁(yè)(描述一個(gè)基于正弦表示的分析-合成技術(shù));McAulay等,“基于語(yǔ)音正弦表示的中速率編碼”,Proc.ICASSP85,945-948頁(yè),Tampa,F(xiàn)L,March26-29,1985(描述一個(gè)正弦變換的語(yǔ)音編碼器);Griffin,“多帶激勵(lì)聲碼器”,博士論文,M.I.T.,1987(描述多帶激勵(lì)(MBE)語(yǔ)音模型和一個(gè)8000bps的MBE語(yǔ)音編碼器);Hardwick,“一個(gè)4.8kbps的多帶激勵(lì)語(yǔ)音編碼器”,碩士論文,M.I.T.,May1988(描述一個(gè)4800bps的多帶激勵(lì)語(yǔ)音編碼器);電信工業(yè)聯(lián)合會(huì)(TIA),“APCO方案25聲碼器描述”,Version1.3,July15,1993,IS102BABA(描述一個(gè)在APCO方案25標(biāo)準(zhǔn)下的7.2kbps的IMBETM語(yǔ)音編碼器);美國(guó)專利5,081,681號(hào)(描述IMBETM隨機(jī)相位分析);美國(guó)專利5,247,579號(hào)(描述一種減輕通道錯(cuò)誤的方法和基于MBE語(yǔ)音編碼器的共振峰強(qiáng)化方法);美國(guó)專利5,226,084號(hào)(描述基于MBE語(yǔ)音編碼器的量化和錯(cuò)誤減輕方法);美國(guó)專利5,517,511號(hào)(描述基于MBE語(yǔ)音編碼器的位優(yōu)先級(jí)處理和FEC差錯(cuò)控制方法)本發(fā)明的目的是提供一種用于衛(wèi)星通信系統(tǒng)的新AMBE_語(yǔ)音編碼器,它可從經(jīng)移動(dòng)衛(wèi)星信道傳輸?shù)囊粋€(gè)低數(shù)據(jù)率位流生成高質(zhì)量的語(yǔ)音。這一語(yǔ)音編碼器同時(shí)具有低數(shù)據(jù)率,高聲音質(zhì)量,和對(duì)背景噪聲和信道位錯(cuò)誤的容忍力。本發(fā)明有希望提高在移動(dòng)衛(wèi)星通信的語(yǔ)音編碼方面的技術(shù)水平。新語(yǔ)音編碼器利用新的雙子幀譜幅度量化器實(shí)現(xiàn)高性能,其中的量化器統(tǒng)一地量化估計(jì)出的連續(xù)兩個(gè)子幀的譜幅度。此量化器達(dá)到的逼真度可與前面的現(xiàn)有技術(shù)系統(tǒng)相比擬,而它用于量化譜幅度參數(shù)的位數(shù)卻較少。AMBE_語(yǔ)音編碼器在以下文獻(xiàn)中有一般性描述美國(guó)專利申請(qǐng)No08/222,119,申請(qǐng)日為April4,1994,標(biāo)題為“激勵(lì)參數(shù)的估計(jì)”;美國(guó)專利申請(qǐng)No.08/392,188,申請(qǐng)日為February22,1995,標(biāo)題為“多帶激勵(lì)語(yǔ)音編碼器的譜表示”;和美國(guó)專利申請(qǐng)No.08/392,099,申請(qǐng)日為February22,1995,標(biāo)題為“利用再生成相位信息的語(yǔ)音合成”,列出的這些文獻(xiàn)供參考。本發(fā)明的一個(gè)一般特征是,一種將語(yǔ)音編碼為在衛(wèi)星信道中傳輸?shù)?0毫秒位幀的方法。語(yǔ)音信號(hào)被數(shù)字化為一列數(shù)字語(yǔ)音樣本,數(shù)字語(yǔ)音樣本被分到標(biāo)稱時(shí)間間隔為22.5毫秒的一列子幀中,同時(shí)為每一子幀估計(jì)出一組模型參數(shù)。一個(gè)子幀的模型參數(shù)包括一組表示子幀譜信息的譜幅度參數(shù)。在此子幀序列中的兩個(gè)連續(xù)子幀結(jié)合為一塊,一塊中兩子幀的譜幅度參數(shù)被統(tǒng)一地量化。統(tǒng)一量化包括用前一塊中的量化的譜幅度參數(shù)生成預(yù)測(cè)的譜幅度參數(shù),計(jì)算作為該塊的譜幅度參數(shù)和預(yù)測(cè)譜幅度參數(shù)之差的余量參數(shù),將一塊中的兩子幀的余量參數(shù)結(jié)合,并用矢量量化器將余量參數(shù)量化為一組編碼的譜位。然后,將冗余差錯(cuò)控制位加到每一塊的編碼譜位上以防止該塊中的編碼譜位出現(xiàn)位錯(cuò)誤。然后,兩個(gè)連續(xù)塊中的附加冗余差錯(cuò)控制位和編碼譜位被結(jié)合到一個(gè)用于在衛(wèi)星信道中傳輸?shù)?0毫秒的位幀上。本發(fā)明的實(shí)施例可以包括如下的一個(gè)或多個(gè)特點(diǎn)。一塊中兩子幀的余量參數(shù)的結(jié)合可包括將每一子幀的余量參數(shù)分到各頻率塊中,對(duì)一個(gè)頻率塊中的余量參數(shù)實(shí)施線性變換,以生成每一子幀的一組變換余量系數(shù),將全部頻率塊中的少數(shù)變換余量系數(shù)集合成一個(gè)PRBA矢量,并且將每一頻率塊中剩下的變換余量系數(shù)集合成本頻率塊的一個(gè)HOC矢量。對(duì)每個(gè)子幀的PRBA矢量實(shí)施變換可以產(chǎn)生PRBA變換矢量,并且可計(jì)算一塊的子幀中PRBA變換矢量的矢量和差,來(lái)結(jié)合變換PRBA矢量。相似地,也可計(jì)算每一頻率塊的矢量和差,來(lái)結(jié)合本頻率塊的兩子幀的兩個(gè)HOC矢量。譜幅度參數(shù)可以表示多帶激勵(lì)(“MBE”)語(yǔ)音模型中估計(jì)的對(duì)數(shù)譜幅度。譜幅度可從一個(gè)不依賴于聲音狀態(tài)計(jì)算的譜中估計(jì)出。預(yù)測(cè)的譜幅度參數(shù)可通過(guò)對(duì)前一塊最后一幀的量化譜幅度的線性內(nèi)插施加小于一的增益來(lái)形成。每塊的差錯(cuò)控制位可用包含Golay(格雷)碼和Hamming(漢明)碼的塊碼生成。例如這些碼可包含一個(gè)[24,12]擴(kuò)展Golay碼,三個(gè)[23,12]Golay碼,和兩個(gè)[15,11]Hamming碼。對(duì)每個(gè)頻率塊,采用離散余弦變換(DCT)后在兩個(gè)最低階的DCT系數(shù)上執(zhí)行一線性2×2變換,可算出變換余量系數(shù)。四個(gè)頻率塊可用于此計(jì)算,每一頻率塊的長(zhǎng)度近似與子幀中的譜幅度參數(shù)的數(shù)目成正比。矢量量化器可包括一個(gè)對(duì)于PRBA矢量和采用8位加6位加7位的三分路矢量量化器,還包括一個(gè)對(duì)于PRBA矢量差采用8位加6位的兩分路相位量化器。位幀可包括表示由矢量量化器引入的變換余量系數(shù)中錯(cuò)誤的附加位。本發(fā)明的另一個(gè)一般特征是,一種將語(yǔ)音編碼為一個(gè)在衛(wèi)星信道中傳輸?shù)?0毫秒位幀的系統(tǒng)。該系統(tǒng)包括一個(gè)數(shù)字化器,將語(yǔ)音信號(hào)轉(zhuǎn)換成數(shù)字語(yǔ)音樣本序列;一個(gè)子幀發(fā)生器,將數(shù)字語(yǔ)音樣本分到子幀序列中,每個(gè)子幀包括許多數(shù)字語(yǔ)音樣本;一個(gè)模型參數(shù)估計(jì)器,估計(jì)每一子幀的包括一組譜幅度參數(shù)的一組模型參數(shù);一個(gè)結(jié)合器,將子幀序列中的兩個(gè)連續(xù)子幀結(jié)合成一個(gè)塊;一個(gè)雙幀譜幅度量化器,統(tǒng)一地量化此塊中的兩個(gè)子幀的參數(shù)。統(tǒng)一量化包括如下過(guò)程由前一塊的量化譜幅度參數(shù)生成預(yù)測(cè)譜幅度參數(shù),計(jì)算作為譜幅度參數(shù)和預(yù)測(cè)譜幅度參數(shù)之差的余量參數(shù),結(jié)合一塊中兩子幀的余量參數(shù),用矢量量化器將結(jié)合的余量參數(shù)量化為一組編碼譜位。此系統(tǒng)也包括一個(gè)差錯(cuò)碼編碼器,它將冗余差錯(cuò)控制位加到每一塊的編碼譜位,以保證一塊中至少一部分編碼譜位沒(méi)有位錯(cuò)誤;還有一個(gè)結(jié)合器,它將兩個(gè)連續(xù)塊的附加冗余差錯(cuò)控制位和編碼譜位結(jié)合成一個(gè)用于在衛(wèi)星信道中傳輸?shù)?0毫秒位幀。本發(fā)明的再一般特征是,如上文所述,一種從編碼的90毫秒幀中解碼語(yǔ)音的方法。解碼過(guò)程包括將一個(gè)位幀分成兩個(gè)位塊,其中每一位塊代表兩個(gè)語(yǔ)音子幀。差錯(cuò)控制解碼應(yīng)用于每一位塊,采用本塊中的冗余差錯(cuò)控制位來(lái)生成至少部分地防止出現(xiàn)位錯(cuò)誤的差錯(cuò)解碼位,此位。差錯(cuò)解碼位用來(lái)為一塊的兩子幀統(tǒng)一地重構(gòu)譜幅度參數(shù)。統(tǒng)一重構(gòu)包括用矢量量化器碼本重構(gòu)一組結(jié)合余量參數(shù),由此可為兩子幀計(jì)算出各個(gè)余量參數(shù);從前一塊的重構(gòu)譜幅度參數(shù)中生成預(yù)測(cè)譜幅度參數(shù);并且將各個(gè)余量參數(shù)加到預(yù)測(cè)譜幅度參數(shù),來(lái)生成此塊中的每一子幀的重構(gòu)譜幅度參數(shù)。然后用子幀的重構(gòu)譜幅度參數(shù)為每一子幀合成數(shù)字語(yǔ)音樣本。本發(fā)明的又一般特征是,一種從經(jīng)衛(wèi)星信道接收的90毫秒位幀中解碼語(yǔ)音的解碼器。解碼器包括一個(gè)分割器,把位幀分成兩個(gè)位塊。每一位塊代表兩個(gè)語(yǔ)音子幀。差錯(cuò)控制解碼器用包含于位塊中的冗余差錯(cuò)控制位對(duì)每個(gè)位塊進(jìn)行差錯(cuò)解碼,以生成至少部分地防止出現(xiàn)位錯(cuò)誤的差錯(cuò)解碼位。雙幀譜幅度重構(gòu)器為一塊中兩子幀統(tǒng)一地重構(gòu)譜幅度參數(shù),其中統(tǒng)一重構(gòu)包括用矢量量化器碼本重構(gòu)一組結(jié)合余量參數(shù),由此可為兩子幀計(jì)算出各個(gè)余量參數(shù);從前一塊的重構(gòu)譜幅度參數(shù)中生成預(yù)測(cè)譜幅度參數(shù);并且將各個(gè)余量參數(shù)加到預(yù)測(cè)譜幅度參數(shù),以生成此塊中每一幀的重構(gòu)譜幅度參數(shù)。合成器用子幀的重構(gòu)譜幅度參數(shù)為每一子幀合成數(shù)字語(yǔ)音樣本。本發(fā)明的其它特點(diǎn)及優(yōu)勢(shì)可在下面的參考附圖的描述以及后附權(quán)利要求書(shū)中明顯地看出來(lái)。圖1是衛(wèi)星系統(tǒng)簡(jiǎn)化框圖。圖2是圖1所示系統(tǒng)的一個(gè)通信鏈路的框圖。圖3和圖4是圖1所示系統(tǒng)的編碼器和解碼器的框圖。圖5是圖3所示編碼器組件的總框圖。圖6是編碼器的聲音和單音檢測(cè)功能的流程圖。圖7是圖5所示編碼器的雙子幀幅度量化器的框圖。圖8是圖7所示的幅度量化器的平均矢量量化器的框圖。本發(fā)明的實(shí)施例在上下文中描述為一個(gè)新的AMBE語(yǔ)音編碼器,或聲碼器,用在IRIDIUM_移動(dòng)衛(wèi)星通信系統(tǒng)30上,如圖1所示。IRIDIUM_是一個(gè)全球移動(dòng)衛(wèi)星通信系統(tǒng),它由66顆低地球軌道衛(wèi)星40組成。IRIDIUM_通過(guò)手持或機(jī)載用戶終端(比如移動(dòng)電話)45提供語(yǔ)音通信。參考圖2,信息傳輸頂點(diǎn)的用戶終端通過(guò)麥克風(fēng)60和模數(shù)(A/D)變換器70以8kHz的頻率采樣語(yǔ)音50,完成語(yǔ)音50數(shù)字化工作,實(shí)現(xiàn)聲音通信。數(shù)字化的語(yǔ)音信號(hào)通過(guò)下文述及的語(yǔ)音編碼器80而得到處理。然后發(fā)送器90將信號(hào)送到通信鏈路上。在通信鏈路的另一端,接收器100把信號(hào)接收下來(lái)并送到解碼器110。解碼器把信號(hào)轉(zhuǎn)換為合成數(shù)字語(yǔ)音信號(hào)。然后,數(shù)模(D/A)變換器120將合成數(shù)字語(yǔ)音信號(hào)轉(zhuǎn)換為模擬語(yǔ)音信號(hào),此信號(hào)由揚(yáng)聲器130轉(zhuǎn)換為可聽(tīng)的語(yǔ)音140。通信鏈路用脈沖傳輸時(shí)分復(fù)用(TDMA)傳送一個(gè)90ms的幀。支持兩種不同的聲音數(shù)據(jù)率3467bps的半速率模式(每90ms的幀312位)和6933bps的全速率模式(每90ms的幀624位)。每幀的位被分成語(yǔ)音編碼和前向糾錯(cuò)(“FEC”)編碼以降低通過(guò)衛(wèi)星信道時(shí)經(jīng)常出現(xiàn)的位錯(cuò)誤的概率。參考圖3,每個(gè)終端的語(yǔ)音編碼器包括一個(gè)編碼器80和一個(gè)解碼器110。編碼器包括三個(gè)主功能塊語(yǔ)音分析200、參數(shù)量化210、和錯(cuò)誤糾正編碼220。相似地,如圖4所示,解碼器分成錯(cuò)誤糾正解碼器230,參數(shù)重構(gòu)240(比如逆量化)和語(yǔ)音合成250等功能塊。語(yǔ)音編碼器可在兩個(gè)不同的數(shù)據(jù)率下工作4933bps的全速率和2289bps的半速率。這些數(shù)據(jù)率代表聲音或源位而不計(jì)FEC位。FEC位使得全速率和半速率的聲碼器的數(shù)據(jù)率分別提高到6933bps和3467bps,如上所述。系統(tǒng)使用一個(gè)90ms的聲音幀的大小,此幀被分成四個(gè)22.5ms的子幀。語(yǔ)音分析與合成是基于子幀執(zhí)行的,而量化和FEC編碼是基于包含兩個(gè)子幀的45ms的量化塊執(zhí)行的。使用量化和FEC編碼的45ms塊導(dǎo)致半速率系統(tǒng)中每塊有103聲音位加53個(gè)FEC位,而全速率系統(tǒng)中每塊有222個(gè)聲音位加90個(gè)FEC位。另一方面,聲音位和FEC位的數(shù)目?jī)H可在一個(gè)性能影響效果平緩的范圍內(nèi)進(jìn)行調(diào)整。半速率系統(tǒng)中,F(xiàn)EC位在76位到36位的范圍內(nèi)作相應(yīng)的調(diào)整時(shí),就可實(shí)現(xiàn)聲音位80位到120位范圍內(nèi)的調(diào)整。相似地,在全速率系統(tǒng)中,F(xiàn)EC位在132位到52位變化時(shí),聲音位就可在180位到260位的范圍內(nèi)調(diào)整。量化塊中的聲音位和FEC位結(jié)合而形成一個(gè)90ms的幀。編碼器80首先進(jìn)行語(yǔ)音分析200。語(yǔ)音分析的第一步是每幀的濾波器組處理,緊接著是每幀的MBE模型參數(shù)的估計(jì)。此步包括用分析窗將輸入信號(hào)分成重疊的22.5ms的子幀。對(duì)于每一個(gè)22.5ms子幀,一個(gè)MBE子幀參數(shù)估計(jì)器估計(jì)出一組包括一個(gè)基音頻率(音調(diào)周期的倒數(shù))、一組濁音/清音判斷(V/UV)和一組譜幅度的模型參數(shù)。這些參數(shù)用AMBE技術(shù)產(chǎn)生。AMBE_語(yǔ)音編碼器在以下文獻(xiàn)中有一般性描述美國(guó)專利申請(qǐng)No.08/222,119,申請(qǐng)日為April4,1994,標(biāo)題為“激勵(lì)參數(shù)的估計(jì)”;美國(guó)專利申請(qǐng)No.08/392,188,申請(qǐng)日為February22,1995,標(biāo)題為“多帶激勵(lì)語(yǔ)音編碼器的譜表示”;和美國(guó)專利申請(qǐng)No.08/392,099,申請(qǐng)日為February22,1995,標(biāo)題為“用再生成相位信息合成語(yǔ)音”,列出的所有文獻(xiàn)供參考。另外,全速率聲碼器包括一個(gè)時(shí)間片ID,以幫助識(shí)別在接收器端無(wú)序到達(dá)的TDMA包,接收器可用這一信息在解碼之前將信息調(diào)整到正確的順序。全面描述了語(yǔ)音信號(hào)的語(yǔ)音參數(shù)被送到編碼器的量化器210塊,以作進(jìn)一步的處理。參考圖5,只要為一幀中的兩個(gè)連續(xù)22.5ms子幀估計(jì)出子幀模型參數(shù)300和305,基音頻率和濁音量化器310就把為兩子幀估計(jì)出的基音頻率編碼為一個(gè)基音頻率位的序列,而且把濁音/清音(V/UV)判決(或其它聲音度規(guī))編碼為聲音位序列。在所描述的實(shí)施例中,用十位來(lái)量化和編碼兩個(gè)基音頻率。典型地,基音頻率被基本估計(jì)限制在大約的范圍內(nèi),此處1.0為奈奎斯特頻率(8kHz),并且基本量化器被限制在一個(gè)相似的范圍。既然一給定子幀的量化基音頻率的倒數(shù)一般與L成正比,L為此子幀的譜幅度數(shù)(L=帶寬/基音頻率),基音頻率的最高有效位(MSB)一般對(duì)位錯(cuò)誤有敏感性,所以在FEC編碼中賦予高級(jí)優(yōu)先級(jí)。上述實(shí)施例在半速率時(shí)用八位且在全速率時(shí)用十六位來(lái)對(duì)兩子幀的聲音信息編碼。聲音量化器利用分配的位在選定的八個(gè)聲音頻帶的各頻帶上編碼二進(jìn)制聲音狀態(tài)(如1=濁音,0=清音),此處聲音狀態(tài)由語(yǔ)音分析時(shí)估計(jì)的聲音度規(guī)確定。這些聲音位對(duì)位錯(cuò)誤有中度的敏感性,所以在FEC編碼時(shí)就分配了中級(jí)優(yōu)先級(jí)。在結(jié)合器330中,結(jié)合基音頻率位和聲音位與由雙子幀幅度量化器320來(lái)的量化譜幅度位,并且為45ms的塊執(zhí)行前向糾錯(cuò)(FEC)。然后,在結(jié)合器340中形成90ms的幀,它將兩個(gè)連續(xù)的45ms的量化塊結(jié)合成一個(gè)單獨(dú)幀350。編碼器含有一個(gè)自適應(yīng)聲音活動(dòng)檢測(cè)器(VAD),它用程序600將每個(gè)22.5ms的子幀分類為聲音類、背景噪聲類、或單音類。如圖6所示,VAD算法用本地信息區(qū)別聲音子幀和背景噪聲(步驟605)。如果每一45ms塊的兩子幀被分為噪聲類(步驟610),那么編碼器將當(dāng)前的背景噪聲量化成特定的噪聲塊(步驟615)。當(dāng)組成一個(gè)90ms幀的兩個(gè)45ms塊同時(shí)被分成噪聲類時(shí),系統(tǒng)可選擇不傳輸此幀到解碼器而且解碼器將用以前接收到的噪聲數(shù)據(jù)填補(bǔ)丟失的幀。這種語(yǔ)音活性傳輸技術(shù)用僅傳輸必要的聲音幀和個(gè)別的噪聲幀的方法,提高了系統(tǒng)的性能。本編碼器的特點(diǎn)也在于支持DTMF、呼叫進(jìn)程(如撥號(hào),占線和回鈴)和單個(gè)單音的單音檢測(cè)和傳輸。編碼器檢查每個(gè)22.5ms子幀以確定當(dāng)前子幀是否包括一個(gè)有效的單音信號(hào)。如果在45ms塊中的兩個(gè)子幀中的一個(gè)中檢測(cè)到單音(步驟620),編碼器就量化在一個(gè)如表1所示的特定單音塊中檢測(cè)到的單音參數(shù)(幅度和指數(shù))(步驟625),并在將此塊傳輸?shù)浇獯a器作后續(xù)分析之前進(jìn)行FEC編碼。如果沒(méi)有檢測(cè)到單音,就對(duì)一個(gè)標(biāo)準(zhǔn)的聲音塊進(jìn)行量化,如下所述(步驟630)。表1單音塊中位表示<</tables>聲碼器包含VAD和單音檢測(cè)以將每個(gè)45ms的塊分成以下幾類標(biāo)準(zhǔn)聲音塊,特定單音塊,或特定噪聲塊。當(dāng)一個(gè)45ms塊沒(méi)有分類為特定單音塊,那么組成該塊的子幀對(duì)的(由VAD確定的)聲音和噪聲信息被量化。將可用位(半速率為156,全速率為312)分配給模型參數(shù)和FEC編碼,如表2所示,此處時(shí)間片ID是一個(gè)特定的用于全速率接收機(jī)的參數(shù),用它可以確定接收時(shí)次序混亂的幀的正確次序?;謴?fù)用于激勵(lì)參數(shù)(基音頻率和聲音度規(guī))、FEC編碼和時(shí)間片ID的位后,在半速率系統(tǒng)中有85位提供給譜幅度,而在全速率系統(tǒng)中則有183位提供給譜幅度。為支持具有最小附加復(fù)雜度的全速率系統(tǒng),全速率幅度量化器使用與半速率系統(tǒng)相同的量化器,再加上一個(gè)用標(biāo)量量化來(lái)編碼未量化譜幅度和半速率量化器量化輸出之差的差錯(cuò)量化器。表245ms聲音或噪聲塊的位分配</tables>雙子幀量化器用來(lái)量化譜幅度。此量化器結(jié)合了對(duì)數(shù)壓縮擴(kuò)展、譜估計(jì)、離散余弦變換(DCT)及矢量和標(biāo)量量化方法。以每位的逼真度來(lái)衡量,它效率高且復(fù)雜度適當(dāng)。此量化器可以看作一個(gè)兩維的預(yù)測(cè)變換編碼器。圖7示例了雙子幀幅度量化器,它接收自兩連續(xù)22.5ms子幀的MBE參數(shù)估計(jì)器來(lái)的輸入1a和1b。輸入1a代表奇數(shù)22.5ms子幀的譜幅度并給定一個(gè)標(biāo)號(hào)1。子幀號(hào)1的幅度數(shù)標(biāo)為L(zhǎng)1。輸入1b代表偶數(shù)22.5ms子幀的譜幅度并給定一個(gè)標(biāo)號(hào)0。子幀號(hào)0的幅度數(shù)標(biāo)為L(zhǎng)0。輸入1a通過(guò)一個(gè)對(duì)數(shù)壓縮擴(kuò)展器2a,對(duì)包含在輸入1a的L1個(gè)幅度中每一個(gè)作以2為底的對(duì)數(shù)運(yùn)算,同時(shí)以下列方式產(chǎn)生有L1單元的另一個(gè)矢量y[i]=log2(x[i])(i=1,2,…,L1)此處,y[i]表示信號(hào)3a。擴(kuò)展器2b對(duì)包含在輸入1b的L0個(gè)幅度中的每一個(gè)作以2為底的對(duì)數(shù)運(yùn)算,并以相似的方式產(chǎn)生有L1單元的另一個(gè)矢量y[i]=log2(x[i])(i=1,2,…,L0)此處y[i]表示輸入信號(hào)3b。在壓縮擴(kuò)展器2a和2b之后,均值計(jì)算器4a和4b計(jì)算每一子幀的均值5a與5b。均值,或增益值,代表子幀的平均語(yǔ)音電平。在每幀中,通過(guò)計(jì)算兩個(gè)子幀每一個(gè)的對(duì)數(shù)譜幅度的均值并在這一子幀中加上依賴于諧波數(shù)目的偏移量來(lái)確定二增益值5a,5b。對(duì)數(shù)譜幅度3a的均值計(jì)算方法為y=1L1Σi=1L1x[i]+0.5log2(L1)]]>此處的輸出y代表均值信號(hào)5a。對(duì)數(shù)譜幅度3b的均值4b計(jì)算方法相似,為y=1L0Σi=1L0x[i]+0.5log2(L0)]]>此處的輸出y代表均值信號(hào)5b。均值信號(hào)5a和5b由一個(gè)量化器6來(lái)量化,圖8示例了此量化器,圖中均值信號(hào)5a和5b被分別稱作均值1和均值2。首先,平均器810平均這兩個(gè)均值信號(hào)。平均器的輸出為0.5×(均值1+均值2)。然后,平均值由一個(gè)五位的均勻標(biāo)量量化器820量化。量化器820的輸出形成量化器6的輸出的首先五位。然后,量化器的輸出位被五位逆均勻標(biāo)量量化器830作逆量化。減法器835在輸入值均值1和均值2中減去逆量化器830的輸出,以產(chǎn)生給五位矢量量化器840的輸入。這兩個(gè)輸入就構(gòu)成了一個(gè)要量化的二維矢量(z1和z2)。此矢量與附錄A(增益VQ碼本(5位))的表中每一個(gè)二維矢量(由x1(n)和x2(n)組成)相比較。可用平方距離e對(duì)二者進(jìn)行比較,如下式e(n)=[x1(n)-z1]2+[x2(n)-z2]2,(n=0,1,…,31)附錄A中使平方距離e最小的矢量選出來(lái)產(chǎn)生塊6輸出的最后五位。矢量量化器840的輸出的五位與五位均勻標(biāo)量量化器的五位輸出通過(guò)結(jié)合器850結(jié)合起來(lái)。結(jié)合器850輸出為10位,它構(gòu)成塊6的輸出,此輸出用作圖7中結(jié)合器22的一個(gè)輸入,其標(biāo)號(hào)為21c。進(jìn)一步參考量化器的主信號(hào)通路,對(duì)數(shù)壓縮擴(kuò)展的輸入信號(hào)3a和3b通過(guò)結(jié)合器7a和7b減去由量化器的反饋部分而來(lái)的預(yù)測(cè)器的值33a和33b,生成一個(gè)D1(1)信號(hào)8a和一個(gè)D1(0)信號(hào)8b。下一步,利用附錄O的查找表,將信號(hào)8a和8b分到四個(gè)頻率塊中。根據(jù)被分子幀的幅度總數(shù),此表提供分配給四個(gè)頻率塊中每一個(gè)的幅度數(shù)。因?yàn)槿我蛔訋姆瓤倲?shù)在最小值9和最大值56之間變化,所以此表包含了相同范圍的值。將每個(gè)頻率塊的長(zhǎng)度調(diào)節(jié)到互相的比例為0.2∶0.225∶0.275∶0.3,同時(shí)使長(zhǎng)度和等于當(dāng)前子幀的譜幅度數(shù)。然后,每一頻率塊經(jīng)過(guò)一個(gè)離散余弦變換器(DCT)9a或9b以高效地對(duì)每一頻率塊中的數(shù)據(jù)解相關(guān)。每一頻率塊中的頭兩個(gè)DCT系數(shù)10a或10b被分出,并通過(guò)一個(gè)2×2的旋轉(zhuǎn)運(yùn)算12a或12b以生成變換系數(shù)13a或13b。然后,對(duì)變換系數(shù)13a和13b執(zhí)行一個(gè)八點(diǎn)DCT14a或14b,以產(chǎn)生一個(gè)PRBA矢量15a或15b。每一頻率塊的剩余DCT系數(shù)11a和11b形成一組四個(gè)變長(zhǎng)度高階系數(shù)(HOC)矢量。如上所述,頻率分割后,每塊經(jīng)離散余弦變換器9a和9b處理。DCT塊使用的輸入項(xiàng)數(shù)量W、和每一項(xiàng)的值x(0),x(1),…,x(W-1),如下式y(tǒng)(k)=1WΣi=0W-1x(i)cos(2i+1)kπ2W-----0≤k≤(W-1)]]>y(0)和y(1)的值(由10a確定)與其它的輸出y(2)到y(tǒng)(W-1)(由11a確定)是分開(kāi)的。然后,利用一個(gè)旋轉(zhuǎn)算法作一個(gè)2×2的旋轉(zhuǎn)運(yùn)算12a和12b以將二單元的輸入矢量10a和10b(x(0),x(1))轉(zhuǎn)換成二單元的輸出矢量13a和13b(y(0),y(1)),如下式y(tǒng)(0)=x(0)+sqrt(2)×x(1),與y(1)=x(0)-sqrt(2)×x(1)然后,根據(jù)下式對(duì)由13a和13b來(lái)的四個(gè)二單元矢量,作一個(gè)八點(diǎn)(x(0),x(1),…,x(7))的DCTy(k)=18Σi=07x(i)cos(2i+1)kπ16---0≤k≤7]]>輸出y(k)是一個(gè)八單元的PRBA矢量15a和15b。只要單個(gè)子幀幅度的預(yù)測(cè)和DCT變換完成了,兩個(gè)PRBA矢量就被量化。首先用和差轉(zhuǎn)換16把兩個(gè)八單元矢量結(jié)合成一個(gè)和矢量和一個(gè)差矢量。具體是,和/差操作16是在兩個(gè)八單元PRBA矢量15a和15b上執(zhí)行,產(chǎn)生一個(gè)16單元矢量17,其中,15a和15b分別由x和y來(lái)代表,17由z來(lái)代表,如下式z(i)=x(i)+y(i),和z(8+i)=x(i)-y(i),i=0,1,…,7。然后,這些矢量用一個(gè)分散矢量量化器20a進(jìn)行量化,這里,和矢量的單元1-2、3-4,5-7分別用8位,6位和7位,而差矢量中的單元1-3和4-7分別用8位和6位。因?yàn)槊恳皇噶康膯卧?在功能上等效于分別量化所得的增益值,所以它被忽略掉。PRBA分散矢量量化器20a量化PRBA和差矢量17,產(chǎn)生一個(gè)量化矢量21a。二單元z(1)和z(2)構(gòu)成一個(gè)待量化的二維矢量。此矢量與(由附錄B的表(“PRBA和[1,2]VQ碼本(8位)”)中x1(n)和x2(n)組成的)每個(gè)二維矢量比較??捎闷椒骄嚯xe進(jìn)行比較,如下式e(n)=[x1(n)-z(1)]2+[x2(n)-z(2)]2,n=0,1,…,255。在附錄B中選出使平方距離e最小的矢量,以產(chǎn)生輸出矢量21a的首先8位。下一步,二單元z(3)和z(4)構(gòu)成一個(gè)二維矢量進(jìn)行量化。此矢量與(由附錄C的表(“PRBA和[3,4]VQ碼本(6位)”)中x1(n)和x2(n)組成的)每一個(gè)二維矢量比較。用平方距離e進(jìn)行比較,如下式e(n)=[x1(n)-z(3)]2+[x2(n)-z(4)]2,n=0,1,…,63。在附錄C中選出使平方距離e最小的矢量,以產(chǎn)生輸出矢量21a的跟著的6位。下一步,三單元z(5),z(6)和z(7)構(gòu)成一個(gè)三維矢量作量化。此矢量與(由附錄D的表(“PRBA和[5,7]VQ碼本(7位)”)中x1(n),x2(n)和x3(n)組成的)每個(gè)三維矢量比較。可用平方距離e進(jìn)行比較,如下式e(n)=[x1(n)-z(5)]2+[x2(n)-z(6)]2+[x3(n)-z(7)]2,n=0,1,…,127。在附錄D中選出使平方距離e最小的矢量,以產(chǎn)生輸出矢量21a的跟著的7位。下一步,三單元z(9),z(10)和z(11)構(gòu)成一個(gè)三維矢量作量化。此矢量與(由附錄E的表(“PRBA差[1,3]VQ碼本(8位)”)中x1(n),x2(n)和x3(n)組成的)每個(gè)三維矢量比較??捎闷椒骄嚯xe進(jìn)行比較,如下式e(n)=[x1(n)-z(9)]2+[x2(n)-z(10)]2+[x3(n)-z(11)]2,n=0,1,…,255。在附錄E中選出使平方距離e最小的矢量,以產(chǎn)生輸出矢量21a的跟著的8位。最后,四單元z(12),z(13),z(14)和z(15)構(gòu)成一個(gè)四維矢量作量化。此矢量與(由附錄F的表(“PRBA差[4,7]VQ碼本(6位)”)中x1(n),x2(n),x3(n)和x4(n)組成的)每個(gè)四維矢量比較。可用平方距離e進(jìn)行比較,如下式e(n)=[x1(n)-z(12)]2+[x2(n)-z(13)]2+[x3(n)-z(14)]2+[x4(n)-z(15)]2,n=0,1,…,63。在附錄F中選出使平方距離e最小的矢量,以產(chǎn)生輸出矢量21a的最后6位。HOC矢量的量化與PRBA矢量相似。首先,對(duì)應(yīng)于四個(gè)頻率塊中的每一個(gè),相應(yīng)兩子幀中的HOC矢量對(duì)用一個(gè)和-差變換18結(jié)合起來(lái),其中,和-差變換18為每個(gè)頻率塊產(chǎn)生一個(gè)和-差矢量19。分別對(duì)每一個(gè)頻率塊在兩個(gè)HOC矢量11a和11b上執(zhí)行和/差操作,產(chǎn)生一個(gè)矢量zmJ=max(Bm0,Bm1)-2K=min(Bm0,Bm1)-2zm(i)=0.5[x(i)+y(i)]1≤i≤K如果L0>L1,zm(i)=y(tǒng)(i)否則zm(i)=x(i),K<i≤Jzm(J+i)=0.5[x(i)-y(i)]0≤i≤K此處,Bm0和Bm1分別是子幀零和子幀一的第m個(gè)頻率塊的長(zhǎng)度,如附錄O所列出,為每個(gè)頻率塊確定z(即m等于0到3)。為所有的四個(gè)頻率塊(m等于0到3)結(jié)合J+K個(gè)單元的和差矢量zm,以形成HOC的和/差矢量19。由于每個(gè)HOC矢量的大小不同,所以和差矢量也具有變化的而且可能是不同的長(zhǎng)度。在矢量量化步驟中通過(guò)忽略每個(gè)矢量的前四個(gè)單元之外的單元來(lái)處理這一問(wèn)題。剩余的單元作矢量量化,和矢量用七位,差矢量用三位。矢量量化執(zhí)行后,對(duì)量化后的和差矢量進(jìn)行原始和-差變換的逆變換。由于對(duì)全部四個(gè)頻率塊應(yīng)用了此過(guò)程,所以總共四十位(4×(7+3))用來(lái)對(duì)兩子幀對(duì)應(yīng)的HOC矢量作矢量量化。HOC分散矢量量化器20b分別在全部四個(gè)頻率塊上量化HOC和差矢量19。首先,代表第m個(gè)頻率塊的矢量zm分別與附錄中相應(yīng)和差碼本的每個(gè)備選矢量相比較。一個(gè)碼本按它所對(duì)應(yīng)的頻率塊標(biāo)識(shí),并標(biāo)識(shí)出它是一個(gè)和碼還是一個(gè)差碼。那么,附錄G的“HOC和0VQ碼本(7位)”代表頻率塊0的和碼本。其它的碼本是附錄H(“HOC差0VQ碼本(3位)”),附錄I(“HOC和1VQ碼本(7位)”),附錄J(“HOC差1VQ碼本(3位)”),附錄K(“HOC和2VQ碼本(7位)”),附錄L(“HOC差2VQ碼本(3位)”),附錄M(“HOC和2VQ碼本(7位)”),附錄N(“HOC差3VQ碼本(3位)”)。每個(gè)頻率塊的矢量zm與相應(yīng)和碼本的每個(gè)備選矢量的比較用平方距離表示,其中,對(duì)每個(gè)備選和矢量(由x1(n),x2(n),x3(n)和x4(n)組成)用e1n計(jì)算,如下式e1n=Σi=1min(J,4)[z(i)-xi(n)]2----0≤n<128,]]>對(duì)每個(gè)備選差矢量(由x1(n),x2(n),x3(n)和x4(n)組成)用e2m計(jì)算,如下式e2m=Σi=1min(K,4)[z(J+i)-xi(m)]2---0≤m<8,]]>此處,按前文所述計(jì)算J和K。相應(yīng)和記錄碼本中能使平方距離e1n最小的一個(gè)備選和矢量的指數(shù)n用七位表示。而能使平方距離e2m最小的一個(gè)備選差矢量的指數(shù)m用三位表示。在全部四個(gè)頻率塊中結(jié)合這十位,形成40個(gè)HOC的輸出位21b。塊22多路復(fù)合量化的PRBA矢量21a、量化均值21b、和量化均值21c,以生成輸出位23。這些位23是雙子幀幅度量化器的最終輸出位,同時(shí)提供給量化器的反饋部份。雙子幀量化器的反饋部份塊24代表圖中標(biāo)為Q的大框中執(zhí)行功能的逆功能。塊24根據(jù)量化位23產(chǎn)生D1(1)和D1(0)(8a和8b)的估計(jì)值25a和25b。在標(biāo)為Q的大框中沒(méi)有量化錯(cuò)誤的前提下,這些估計(jì)將等于D1(1)和D1(0)。塊26將一個(gè)等于0.8×P1(1)的標(biāo)量預(yù)測(cè)值33a加到D1(1)25a的估計(jì)值,以產(chǎn)生一個(gè)估計(jì)值M1(1)27。塊28將估計(jì)值M1(1)27延時(shí)一幀(40ms),以產(chǎn)生估計(jì)值M1(-1)29。然后,預(yù)測(cè)器塊30內(nèi)插并再采樣估計(jì)的幅度,生成L1個(gè)估計(jì)幅度,之后從L1個(gè)估計(jì)幅度中的每個(gè)減去估計(jì)幅度的均值以生成P1(1)輸出31a。接著,對(duì)輸入的估計(jì)幅度內(nèi)插和再采樣來(lái)產(chǎn)生L0個(gè)估計(jì)幅度,從L0個(gè)估計(jì)幅度中的每個(gè)減去估計(jì)幅度的均值以生成P1(0)輸出31b。塊32a對(duì)每一個(gè)P1(1)31a中的幅度乘以0.8,以生成輸出矢量33a,此矢量用于反饋單元結(jié)合器塊7a中。同樣地,塊32b對(duì)每一個(gè)P1(0)31b中的幅度乘以0.8以生成輸出矢量33b,此矢量用于反饋單元結(jié)合器塊7b中。這一處理過(guò)程的輸出是量化幅度輸出矢量23,然后,此輸出與如上文所述的其它兩個(gè)子幀的輸出矢量結(jié)合起來(lái)。只要編碼器為每個(gè)45ms塊量化了模型參數(shù),量化的位就要在傳輸之前被賦予優(yōu)先級(jí),作FEC編碼,并作交錯(cuò)處理。首先,根據(jù)量化位對(duì)位錯(cuò)誤的估計(jì)敏感度的次序賦予其優(yōu)先級(jí)。實(shí)驗(yàn)顯示PRBA和HOC的和矢量一般要比相應(yīng)的差矢量對(duì)位錯(cuò)誤更敏感。而且,PRBA和矢量一般比HOC和矢量更敏感。在一個(gè)優(yōu)先級(jí)方案中利用了這些相關(guān)的敏感度。通常地,給平均基音頻率和平均增益位分配最高的優(yōu)先級(jí),其次為PRBA和位和HOC和位,再次為PRBA差位和HOC差位,最后為剩下的一些位。然后,利用[24,12]擴(kuò)展Golay碼、[23,12]Golay碼和[15,11]Hamming碼的混合碼,給較敏感的位加上較高冗余度,而給較不敏感的位加上較低冗余度或不加冗余度。半速率系統(tǒng)采用一個(gè)[24,12]Golay碼,后有三個(gè)[23,12]Golay碼,再后是兩個(gè)[15,11]Hamming碼,剩下的33位不受保護(hù)。全速率系統(tǒng)采用兩個(gè)[24,12]Golay碼,后有六個(gè)[23,12]Golay碼,剩下的126位不支持。這種分配的設(shè)計(jì)是為了高效地使用對(duì)FEC可用的有限的位數(shù)。最后一步是在每個(gè)45ms塊中交錯(cuò)處理FEC編碼位,以分散短突發(fā)錯(cuò)誤的影響。然后,兩個(gè)連續(xù)45ms塊的交錯(cuò)位被結(jié)合到一個(gè)形成編碼器輸出位流的90ms幀中。編碼位流信號(hào)在信道中傳送并接收后,設(shè)計(jì)相應(yīng)的解碼器來(lái)從編碼的位流中再現(xiàn)高質(zhì)量的語(yǔ)音。解碼器首先將每個(gè)90ms的幀分為兩個(gè)45ms的量化塊。之后,解碼器對(duì)每一塊進(jìn)行解交錯(cuò),并進(jìn)行糾錯(cuò)解碼,以糾正和/或檢測(cè)某些可能的位錯(cuò)誤模式。為得到通過(guò)移動(dòng)衛(wèi)星信道的足夠的性能,所有糾錯(cuò)碼一般被解碼到其最高的糾錯(cuò)能力。下一步,解碼器用FEC解碼位為此塊再組合量化位,從這些位中重構(gòu)代表此塊的兩子幀的模型參數(shù)。AMBE_解碼器用重構(gòu)對(duì)數(shù)譜幅度合成一組相位,聲音合成器用這些相位生成感覺(jué)自然的語(yǔ)音。使用合成相位信息大大地降低了與在編碼器與解碼器之間直接傳送此信息或等效物的系統(tǒng)有關(guān)的數(shù)據(jù)傳輸速率。然后,解碼器對(duì)重構(gòu)的譜幅度采用譜加強(qiáng)措施,以提高語(yǔ)音信號(hào)的感覺(jué)質(zhì)量。如果本地估計(jì)的通道參數(shù)指示可能有不可糾正的位錯(cuò)誤存在,則解碼器進(jìn)一步檢測(cè)位錯(cuò)誤并平滑重構(gòu)參數(shù)。加強(qiáng)及平滑的模型參數(shù)(基音頻率,V/UV判決,譜幅度和合成相位)用于語(yǔ)音合成。重構(gòu)參數(shù)形成解碼器的語(yǔ)音合成器算法的輸入,此算法將順序的模型參數(shù)幀內(nèi)插成平滑的22.5ms的語(yǔ)音段。合成算法用一組諧波振蕩器(或一個(gè)高頻率的FFT等效器)合成濁音語(yǔ)音。它被加到一個(gè)加權(quán)的疊加算法的輸出以合成清音語(yǔ)音。這些總和形成合成語(yǔ)音信號(hào),輸出到一個(gè)D/A變換器,再到揚(yáng)聲器上重放。然而,此合成語(yǔ)音信號(hào)可能在逐個(gè)采樣點(diǎn)的意義上與原始信號(hào)并不接近,但是一個(gè)人聽(tīng)上去感覺(jué)是相同的。其它的實(shí)施例也包含在權(quán)利要求書(shū)的范圍之內(nèi)。附錄A增益VQ碼本(5位)值表</tables>附錄BPRBA和[1,2]VQ碼本(8位)值表附錄CPRBA和[3,4]VQ碼本(6位)值表</tables>附錄DPRBA和[5,7]VQ碼本(7位)值表</tables>附錄EPRBA差[1,3]VQ碼本(8位)值表</tables>附錄FPRBA差[4,7]VQ碼本(6位)值表<>附錄GHOC和OVQ碼本(7位)值表>附錄HHOC差0VQ碼本(3位)值表<>附錄IHOC和IVQ碼本(7位)值表>附錄JHOC差1VQ碼本(3位)值表<>附錄KHOC和2VQ碼本(7位)值表<>附錄LHOC差2VQ碼本(3位)值表<>附錄LHOC差2VQ碼本(3位)值表<>附錄NHOC差3VQ碼本(3位)值表<>附錄NHOC差3VQ碼本(3位)值表<>權(quán)利要求1.一種將語(yǔ)音編碼為經(jīng)衛(wèi)星信道傳輸?shù)?0毫秒位幀的方法,此方法包括如下步驟將一個(gè)語(yǔ)音信號(hào)數(shù)字化為一列數(shù)字語(yǔ)音樣本;將數(shù)字語(yǔ)音樣本分到一列子幀中,每一子幀包含許多個(gè)數(shù)字語(yǔ)音樣本;為每一子幀估計(jì)一組模型參數(shù),其中模型參數(shù)包含一組代表此子幀譜信息的譜幅度參數(shù);將該子幀序列中的兩個(gè)連續(xù)子幀結(jié)合為一個(gè)塊;統(tǒng)一地量化一塊中的兩子幀的譜幅度參數(shù),其中統(tǒng)一量化包括從前一塊的量化譜幅度參數(shù)中形成預(yù)測(cè)譜幅度參數(shù),計(jì)算作為譜幅度參數(shù)和預(yù)測(cè)譜幅度參數(shù)之差的余量參數(shù),結(jié)合一塊兩子幀中的余量參數(shù),并用許多矢量量化器將結(jié)合的余量參數(shù)量化為一組編碼的譜位;給每塊的編碼譜位增加冗余差錯(cuò)控制位,以防止該塊中的至少部分編碼譜位出現(xiàn)位錯(cuò)誤;和將兩個(gè)連續(xù)塊中的增加的冗余差錯(cuò)控制位和編碼譜位結(jié)合為一個(gè)經(jīng)衛(wèi)星信道傳輸?shù)?0毫秒位幀。2.如權(quán)利要求1所述的方法,其中一塊中兩子幀的余量參數(shù)的結(jié)合進(jìn)一步包括將每個(gè)子幀中的余量參數(shù)分到許多頻率塊中對(duì)每個(gè)頻率塊中的余量參數(shù)執(zhí)行一個(gè)線性變換,以生成每一子幀的一組變換余量系數(shù);將所有頻率塊中的少數(shù)變換余量系數(shù)組合成一個(gè)PRBA矢量,并將每一頻率塊中的剩下的變換余量系數(shù)組合成一個(gè)該頻率塊的HOC矢量;變換PRBA矢量以生成一個(gè)變換PRBA矢量,并計(jì)算矢量的和差以結(jié)合兩子幀中的兩個(gè)變換PRBA矢量;和計(jì)算每一頻率塊的矢量和差,以結(jié)合此頻率塊的兩子幀的兩個(gè)HOC矢量。3.如權(quán)利要求1或2所述的方法,其中譜幅度參數(shù)代表一個(gè)多帶激勵(lì)(MBE)語(yǔ)音模型估計(jì)的對(duì)數(shù)譜幅度。4.如權(quán)利要求3所述的方法,其中譜幅度參數(shù)是從不依賴于聲音狀態(tài)所計(jì)算的譜中估計(jì)出來(lái)的。5.如權(quán)利要求1或2所述的方法,其中預(yù)測(cè)譜幅度參數(shù)是將小于一的增益施加到對(duì)前一塊的最后子幀的量化譜幅度進(jìn)行的線性插值而形成的。6.如權(quán)利要求1或2所述的方法,其中每塊的冗余差錯(cuò)控制位由包括Golay碼和Hamming碼的許多塊碼形成。7.如權(quán)利要求6所述的方法,其中那些塊碼包括一個(gè)[24,12]擴(kuò)展Golay碼,三個(gè)[23,12]Golay碼,和兩個(gè)[15,11]Hamming碼。8.如權(quán)利要求2所述的方法,其中每個(gè)頻率塊的變換余量系數(shù)是用離散余弦變換(DCT)之后跟一個(gè)在兩個(gè)最低階DCT系數(shù)上進(jìn)行線性2乘2變換而計(jì)算出的。9.如權(quán)利要求8所述的方法,其中使用四個(gè)頻率塊,并且每個(gè)頻率塊的長(zhǎng)度近似與該子幀中譜幅度參數(shù)的數(shù)目成正比。10.如權(quán)利要求2所述的方法,其中那些矢量量化器包括一個(gè)三分路矢量量化器,它對(duì)于PRBA矢量和使用8位加6位加7位;和一個(gè)兩分路矢量量化器,它對(duì)于PRBA矢量差使用8位加6位。11.如權(quán)利要求10所述的方法,其中位幀包括附加位,它代表由矢量量化器引入的變換余量系數(shù)中的錯(cuò)誤。12.如權(quán)利要求1或2所述的方法,其中子幀序列標(biāo)稱發(fā)生間隔為每個(gè)子幀22.5毫秒。13.如權(quán)利要求12所述的方法,其中位幀在半速率模式中由312位組成,在全速率模式中由624位組成。14.一種從經(jīng)衛(wèi)星信道接收到的90毫秒位幀中解碼出語(yǔ)音的方法,此方法包括以下步驟將位幀分成兩個(gè)位塊,其中每一位塊代表兩個(gè)語(yǔ)音子幀;使用每塊中的冗余差錯(cuò)控制位對(duì)每一位塊實(shí)施差錯(cuò)控制解碼,以生成至少部分地防止出現(xiàn)位錯(cuò)誤的差錯(cuò)解碼位;利用差錯(cuò)解碼位統(tǒng)一地重構(gòu)一塊中兩子幀的譜幅度參數(shù),其中的統(tǒng)一重構(gòu)包括使用許多矢量量化器碼本重構(gòu)一組結(jié)合余量參數(shù)并由此計(jì)算兩子幀的各個(gè)余量參數(shù),從前一塊的重構(gòu)的譜幅度參數(shù)中形成預(yù)測(cè)譜幅度參數(shù),并在預(yù)測(cè)譜幅度參數(shù)中加上各個(gè)余量參數(shù),以形成此塊中每個(gè)子幀的重構(gòu)譜幅度參數(shù);和用每個(gè)子幀的重構(gòu)譜幅度參數(shù)合成此子幀的許多數(shù)字語(yǔ)音樣本。15.如權(quán)利要求14所述的方法,其中從一塊的結(jié)合余量參數(shù)計(jì)算兩子幀的各個(gè)余量參數(shù)還包含步驟將此塊的結(jié)合余量參數(shù)分到一些頻率塊中;形成該塊的變換PRBA和差矢量;從結(jié)合余量參數(shù)形成每個(gè)頻率塊的HOC和差矢量;對(duì)變換PRBA和差矢量進(jìn)行逆和差運(yùn)算及逆變換,以形成兩子幀的PRBA矢量;和對(duì)HOC和差矢量進(jìn)行逆和差運(yùn)算,以形成每個(gè)頻率塊的兩子幀的HOC矢量;和結(jié)合每一子幀的每一頻率塊的PRBA矢量和HOC矢量以形成此塊中的兩子幀的各個(gè)余量參數(shù)。16.如權(quán)利要求14或15所述的方法,其中重構(gòu)譜幅度參數(shù)代表一個(gè)多帶激勵(lì)(MBE)語(yǔ)音模型的對(duì)數(shù)譜幅度。17.如權(quán)利要求14或15所述的方法,還包含一個(gè)解碼器,它利用重構(gòu)的譜幅度參數(shù)合成一組相位參數(shù)。18.如權(quán)利要求14或15所述的方法,其中預(yù)測(cè)譜幅度參數(shù)是將小于一的增益施加到對(duì)前一塊的最后子幀的量化譜幅度進(jìn)行的線性插值而形成的。19.如權(quán)利要求14或15所述的方法,其中每塊的差錯(cuò)控制位是由包括Golay碼和Hamming碼的一些塊碼形成的。20.如權(quán)利要求19所述的方法,其中那些塊碼包括一個(gè)[24,12]擴(kuò)展Golay碼,三個(gè)[23,12]Golay碼,和兩個(gè)[15,11]Hamming碼。21.如權(quán)利要求15所述的方法,其中每個(gè)頻率塊的變換余量系數(shù)是用離散余弦變換(DCT)之后跟一個(gè)在兩個(gè)最低階DCT系數(shù)上的線性2乘2變換而計(jì)算出的。22.如權(quán)利要求21所述的方法,其中使用四個(gè)頻率塊,并且每個(gè)頻率塊的長(zhǎng)度近似與該子幀中譜幅度參數(shù)的數(shù)目成正比。23.如權(quán)利要求15所述的方法,其中那些矢量量化器碼本包括一個(gè)三分路矢量量化器碼本,它對(duì)于PRBA和矢量使用8位加6位加7位;和一個(gè)兩分路矢量量化器碼本,它對(duì)于PRBA差矢量使用8位加6位。24.如權(quán)利要求23所述的方法,其中位幀包括附加的位,它代表由矢量量化器碼本引入的變換余量系數(shù)中的錯(cuò)誤。25.如權(quán)利要求14或15所述的方法,其中子幀的標(biāo)稱持續(xù)時(shí)間為22.5毫秒。26.如權(quán)利要求25所述的方法,其中位幀在半速率模式中由312位組成,在全速率模式中由624位組成。27.一個(gè)將語(yǔ)音編碼為在衛(wèi)星信道中傳輸?shù)?0毫秒位幀的編碼器,包括一個(gè)數(shù)字化器,設(shè)置為將一個(gè)語(yǔ)音信號(hào)轉(zhuǎn)換成一列數(shù)字語(yǔ)音樣本;一個(gè)子幀發(fā)生器,設(shè)置為將數(shù)字語(yǔ)音樣本分到一列子幀中,每個(gè)子幀包括多個(gè)數(shù)字語(yǔ)音樣本;一個(gè)模型參數(shù)估計(jì)器,設(shè)置為估計(jì)每個(gè)子幀的一組模型參數(shù),其中,模型參數(shù)包含一組代表本子幀的譜信息的譜幅度參數(shù);一個(gè)結(jié)合器,設(shè)置為將該子幀序列中的兩個(gè)連續(xù)子幀結(jié)合成一塊;一個(gè)雙幀譜幅度量化器,設(shè)置為統(tǒng)一量化此塊的兩子幀的參數(shù),其中,統(tǒng)一量化包括從前一塊的量化譜幅度參數(shù)中形成預(yù)測(cè)譜幅度參數(shù),計(jì)算作為譜幅度參數(shù)和預(yù)測(cè)譜幅度參數(shù)之差的余量參數(shù),結(jié)合一塊的兩子幀的余量參數(shù),并用許多矢量量化器將結(jié)合的余量參數(shù)量化為一組編碼的譜位;一個(gè)差錯(cuò)碼編碼器,設(shè)置為在每一塊的編碼譜位中增加差錯(cuò)控制位以防止此塊中的至少部分編碼譜位出現(xiàn)位錯(cuò)誤;和一個(gè)結(jié)合器,設(shè)置為將兩個(gè)連續(xù)塊中的增加的冗余差錯(cuò)控制位和編碼譜位結(jié)合成一個(gè)經(jīng)衛(wèi)星信道傳輸?shù)?0毫秒位幀。28.如權(quán)利要求27所述的編碼器,其中雙幀譜幅度量化器設(shè)置為用如下方法結(jié)合此塊中兩子幀的余量參數(shù)將每一子幀的余量參數(shù)分到一些頻率塊中;對(duì)每個(gè)頻率塊中的余量參數(shù)實(shí)施一個(gè)線性變換,以生成每個(gè)子幀的一組變換余量系數(shù);將所有頻率塊中的少數(shù)變換余量系數(shù)組合成一個(gè)PRBA矢量,并將每一頻率塊中的剩下的變換余量系數(shù)組合成一個(gè)該頻率塊的HOC矢量;變換PRBA矢量以生成一個(gè)變換PRBA矢量,并計(jì)算矢量的和差以結(jié)合兩子幀中的兩個(gè)變換PRBA矢量;和計(jì)算每一頻率塊的矢量和差以結(jié)合此頻率塊的兩子幀的兩個(gè)HOC矢量。29.一個(gè)從經(jīng)衛(wèi)星信道接收到的90毫秒位幀中解碼語(yǔ)音的解碼器,包括一個(gè)分割器,設(shè)置為將位幀分成兩個(gè)位塊,其中每一位塊代表兩個(gè)語(yǔ)音子幀;一個(gè)差錯(cuò)控制解碼器,設(shè)置為使用包含于此塊中的冗余差錯(cuò)控制位對(duì)每一位塊實(shí)施差錯(cuò)控制解碼,以生成至少部分地防止出現(xiàn)位錯(cuò)誤的差錯(cuò)解碼位;一個(gè)雙幀譜幅度重構(gòu)器,設(shè)置為統(tǒng)一重構(gòu)一塊中兩子幀的譜幅度參數(shù),其中統(tǒng)一重構(gòu)包括使用許多矢量量化器碼本重構(gòu)一組結(jié)合余量參數(shù),并由此計(jì)算兩子幀的各個(gè)余量參數(shù),從前一塊的重構(gòu)的譜幅度參數(shù)中形成預(yù)測(cè)譜幅度參數(shù),并在預(yù)測(cè)譜幅度參數(shù)中加上各個(gè)余量參數(shù),以形成此塊中每個(gè)子幀的重構(gòu)譜幅度參數(shù);和一個(gè)合成器,設(shè)置為利用每個(gè)子幀的重構(gòu)譜幅度參數(shù)合成此子幀的多個(gè)數(shù)字語(yǔ)音樣本。30.如權(quán)利要求29所述的解碼器,其中雙幀譜幅度量化器設(shè)置為通過(guò)如下步驟來(lái)從一塊的結(jié)合余量參數(shù)中計(jì)算兩子幀的各個(gè)余量參數(shù)將此塊的結(jié)合余量參數(shù)分到一些頻率塊中;形成此塊的變換PRBA和差矢量;從結(jié)合余量參數(shù)中形成每個(gè)頻率塊的一個(gè)HOC和差矢量;對(duì)變換PRBA和差矢量進(jìn)行逆和差運(yùn)算及逆變換,以生成兩子幀的PRBA矢量;和對(duì)HOC和差矢量進(jìn)行逆和差運(yùn)算,以生成每個(gè)頻率塊的兩子幀的HOC矢量;和結(jié)合每個(gè)子幀的每個(gè)頻率塊的PRBA矢量和HOC矢量,以生成此塊的兩子幀的各個(gè)余量參數(shù)。全文摘要一種將語(yǔ)音編碼成經(jīng)衛(wèi)星信道傳輸?shù)?0毫秒位幀的方法及聲碼器。將語(yǔ)音信號(hào)量化后的數(shù)字樣本分到各子幀中并估計(jì)每一子幀的譜幅度參數(shù)。將子幀序列中兩個(gè)連續(xù)子幀結(jié)合成一塊并統(tǒng)一量化它們的譜幅度參數(shù)。統(tǒng)一量化結(jié)合一塊兩子幀中作為譜幅度參數(shù)和預(yù)測(cè)譜幅度參數(shù)之差的余量參數(shù),矢量量化器將其量化為一組編碼譜位。將冗余差錯(cuò)控制位加到每塊的編碼譜位上以防止其出現(xiàn)位錯(cuò)誤,并將兩連續(xù)塊中這些數(shù)據(jù)位結(jié)合到90毫秒位幀中。文檔編號(hào)H03M7/30GK1193786SQ9810555公開(kāi)日1998年9月23日申請(qǐng)日期1998年3月13日優(yōu)先權(quán)日1997年3月14日發(fā)明者約翰·C·哈德維克申請(qǐng)人:數(shù)字語(yǔ)音系統(tǒng)公司