專利名稱:語音編碼器的制作方法
該發(fā)明涉及一種用于壓縮的數(shù)字編碼音頻或語音信號的音頻或語音合成器,尤其涉及到一種用于處理得自LPC類型語音解碼器的激勵(lì)碼書和自適應(yīng)碼書的信號的后處理器。
在數(shù)字無線電話系統(tǒng)中,信息,即語音在通過空氣傳送之前被數(shù)字化編碼。編碼的語音在接收器處被解碼。首先,模擬語音信號被例如利用脈沖碼調(diào)制(PCM)來數(shù)字化編碼。然后,PCM語音(或原始語音)的語音編碼和解碼由語音編碼器和解碼器完成。由于無線電話系統(tǒng)使用的增加,用于這種系統(tǒng)的射頻譜變得擁擠。為了盡可能地利用可得的射頻譜,無線電話系統(tǒng)使用語音編碼技術(shù)。這種技術(shù)需要用少量的比特來編碼語音以降低傳輸所需的帶寬。(人們)持續(xù)不斷地努力降低語音編碼所需的比特?cái)?shù)以進(jìn)一步降低語音傳輸所需的帶寬。
一種已知的語音編碼/解碼方法是基于線性預(yù)測編碼(LPC)技術(shù)并利用合成分析的激勵(lì)編碼。在利用該方法的編碼器中,語音樣本首先被分析以獲得表示語音樣本特征如波形信息(LPC)的參數(shù)。這些參數(shù)被用做短時(shí)合成濾波器的輸入短時(shí)合成濾波器由得自信號碼書的信號來激勵(lì)。這些激勵(lì)信號可能是隨機(jī)的,例如隨機(jī)碼書,或者是為了用于語音編碼而自適應(yīng)的或特別優(yōu)化的,典型地,碼書包括兩部分,固定碼書和自適應(yīng)碼書。各自碼書的激勵(lì)輸出被組合,總的激勵(lì)輸入到短時(shí)合成濾波器。每一個(gè)總激勵(lì)信號被濾波,其結(jié)果被用來與原始語音樣本(PCM編碼的)比較以獲得“誤差”或合成語音樣本與原始語音樣本之間的差值。導(dǎo)致最小誤差的總激勵(lì)被選取用做表示語音樣本的激勵(lì)。在固定碼書和自適應(yīng)碼書中的各自部分最優(yōu)激勵(lì)信號的位置的碼書索引或地址以及LPC參數(shù)或系數(shù)被傳送給接收器。一個(gè)相同于發(fā)送器處的組合碼書也被置于接收器處。傳送來的碼書索引和參數(shù)被用于從接收器的碼書中產(chǎn)生適當(dāng)?shù)目偧?lì)信號。該總激勵(lì)信號然后被輸入到一個(gè)相同于發(fā)送器中的短時(shí)合成濾波器,并把傳送來的LPC系數(shù)做為各自的輸入。短時(shí)合成濾波器的輸出是合成的語音幀,它與合成分析方法在發(fā)送器中產(chǎn)生的語音幀相同。
由于數(shù)字編碼的本質(zhì),盡管合成語音客觀上清晰,聽起來卻不自然。而且,由于量化效果和其它源于電子處理過程的異常,衰減、失真和不自然也被引入到合成語音中。這種不自然尤其發(fā)生在低比特率編碼時(shí),因?yàn)?此時(shí))沒有足夠的信息來精確地再生原始語音信號。因此有人嘗試來提高合成語音的感知質(zhì)量。這一點(diǎn)通過使用后濾波器而嘗試,該濾波器處理合成的語音樣本以增強(qiáng)它的感知質(zhì)量。已知的后濾波器被放置在解碼器的輸出處并處理合成語音以強(qiáng)調(diào)或削弱語音中通常被認(rèn)為是最重要的頻率域。語音頻率不同區(qū)域的重要性主要利用所產(chǎn)生語音信號對人耳的(聽覺)質(zhì)量的主觀測量來分析。語音可以被分為兩個(gè)基本部分,譜包絡(luò)(共振峰結(jié)構(gòu))或譜諧波結(jié)構(gòu)(譜線結(jié)構(gòu))。典型地,后濾波器加重語音信號的其中的一個(gè)或兩個(gè)部分。后濾波器的系數(shù)根據(jù)語音信號的特征等自適應(yīng)地匹配語音聲音。加重或削弱諧波結(jié)構(gòu)的濾波器一般地被稱為長時(shí)或音調(diào)或長延遲后濾波器,加重譜包絡(luò)結(jié)構(gòu)的濾波器被一般地稱為短延時(shí)后濾波器或短時(shí)后濾波器。
另一種用于提高合成語音感知質(zhì)量的濾波器技術(shù)在國際專利申請WO91/06091中被揭示。一種音調(diào)預(yù)濾波器在WO91/06091中被揭示,該濾波器包括一個(gè)音調(diào)增強(qiáng)濾波器,它通常被安排在語音合成或LPC濾波器之后的位置,但在該專利中它被移到語音合成或LPC濾波器之前的位置,在該處濾除包含在輸入到語音合成或LPC濾波器的激勵(lì)信號中的音調(diào)信息。
然而,仍然需要產(chǎn)生具有更好感知質(zhì)量的合成語音。
根據(jù)該發(fā)明的第一個(gè)方面,有一個(gè)用于語音合成的合成器,它包括一個(gè)用于處理包括語音周期信息并得自于激勵(lì)源的第一信號的后處理裝置,其中,后處理裝置被調(diào)整根據(jù)可從激勵(lì)源得出的第二信號來修正第一信號的語音周期信息值。
根據(jù)該發(fā)明的第二個(gè)方面,它提供了一種用來增強(qiáng)合成語音的方法,包括從激勵(lì)源得出包括語音周期信息的第一信號從激勵(lì)源得出第二信號,及根據(jù)第二信號修正第一信號的語音周期信息值。
該發(fā)明的優(yōu)越之處是第一信號被一個(gè)與第一信號有相同來源的第二信號修正,因此沒有引入另外的失真或不自然的來源,例如額外濾波器。僅有產(chǎn)生于激勵(lì)源的信號被利用。語音合成器中的激勵(lì)產(chǎn)生器所固有的信號的相對作用被修正,沒有人工加入的信號,以重新縮放合成的信號。
如果激勵(lì)的后處理是基于修正從語音合成器自身的激勵(lì)產(chǎn)生器中得到的激勵(lì)成分的相對作用,就會獲得好的語音增強(qiáng)。
處理激勵(lì)時(shí)通過濾波總激勵(lì)ex(n)而不考慮或修正激勵(lì)產(chǎn)生器固有信號即r(n),(n)的相對作用一般不會給出最佳可能的增強(qiáng)。根據(jù)來自同一激勵(lì)源的第二信號修正第一信號可提高激勵(lì)和產(chǎn)生的合成語音信號中的波形連續(xù)性,因此可提高它的感知質(zhì)量。
在一個(gè)優(yōu)選實(shí)施方案中,激勵(lì)源包括一個(gè)固定碼書和一個(gè)自適應(yīng)碼書,第一信號可從第一和第二部分激勵(lì)信號組合中得出,而第一和第二部分激勵(lì)信號可以分別從固定和自適應(yīng)碼書中選出,這對語音合成器來說是一個(gè)尤其方便的激勵(lì)源。
最佳地,應(yīng)有一個(gè)增益元素用于根據(jù)從涉及來自激勵(lì)源的第一信號的音調(diào)信息中得出的縮放因子(p)來縮放第二信號,它的優(yōu)越之處是第一信號語音周期信息內(nèi)容被修正,這比其它修正對感知語音質(zhì)量具有更大的影響。
適當(dāng)?shù)?,縮放因子(P)可從自適應(yīng)碼書縮放因子(b)中導(dǎo)出,縮放因子(P)根據(jù)下面公式導(dǎo)出b<THlowthen p=0.0THlow≤b<TH2then p=aenh1f1(b)TH2≤b<TH3then p=aenh2f2(b)if . .
. .
. .
THN-1≤b≤THupperthen p=aenhN-1fN-1(b)b>THupperthen p=aenhNfN(b)其中TH表示閾值,b是自適應(yīng)碼書增益因子,P是后處理器裝置縮放因子,aenh是線性標(biāo)量,f(b)是增益b的函數(shù)。
在一個(gè)特定的實(shí)施方案中,縮放因子(P)根據(jù)下式導(dǎo)出。
b<THlowthen p=0.0if THlow≤b≤THupperthen p=aenhb2b>THupperthen p=aenhb其中aenh是控制增強(qiáng)作用強(qiáng)度的常數(shù),b是自適應(yīng)碼書增益,TH是閾值,P是后處理縮放因子,該因子利用了這樣的知識,即語音增強(qiáng)對其中b一般具有高值的濁音語音最有效,而對于其中b具有低值的清音,需要不太強(qiáng)的增強(qiáng)作用。
第二信號可能起源于自適應(yīng)碼書,而且也可能基本上與第二部分激勵(lì)信號相同。另一方面,第二信號可能起源于固定碼書,而且也可能基本上與第一部分激勵(lì)信號相同。
對于起源于固定碼書的第二信號,根據(jù)第二縮放因子(P′),增益控制裝置被調(diào)整以縮放第二信號,其中p′=gp(p+b)]]>g是固定碼書縮放因子,b是自適應(yīng)碼書縮放因子,P是第一縮放因子。
第一信號可能是適合于輸入到語音合成濾波器的第一激勵(lì)信號,第二信號可能是適合于輸入到語音合成濾波器的第二激勵(lì)信號。第二激勵(lì)信號可能基本上與第二部分激勵(lì)信號相同。
作為可選方案,第一信號可以是從第一語音合成濾波器輸出的第一合成語音信號并可從第一激勵(lì)信號導(dǎo)出,第二信號可能是從第二語音合成濾波器輸出的并可從第二激勵(lì)信號導(dǎo)出。這樣的優(yōu)點(diǎn)是語音增強(qiáng)只針對實(shí)際合成的語音,這樣在信號變得可聽之前,有更少的電子成分給信號引入失真。
比較有利地,這里提供一種自適應(yīng)能量控制裝置被調(diào)整來根據(jù)下面的關(guān)系來縮放修正后的第一信號。
k=Σn=0N-1ex2(n)Σn=0N-1ew′2(n)]]>其中N是適當(dāng)選取的調(diào)整周期,ex(n)是第一信號,ew′(n)是修正后的第一信號,K是能量縮放因子,它將產(chǎn)生的增強(qiáng)信號歸一化為語音合成器的功率輸入。
根據(jù)該發(fā)明的第三方面,這里提供一種無線電設(shè)備,包括一個(gè)用于接收無線電信號并恢復(fù)包括在無線電信號中的編碼信息的射頻裝置,及與射頻裝置耦合的用于根據(jù)編碼信息產(chǎn)生包括語音周期信息的第一信號的激勵(lì)源,其中該無線電設(shè)備還包括一個(gè)在操作上耦合于激勵(lì)源以接收第一信號并被調(diào)整來根據(jù)得自激勵(lì)源的第二信號來修正第一信號的語音周期信息內(nèi)容的后處理裝置,及被耦合來接收來自后處理裝置的修正的第一信號并用來相應(yīng)于此產(chǎn)生合成語音的語音合成濾波器。
該發(fā)明的第4個(gè)方面中,提供了一種用于語音合成的合成器,包括用于分別產(chǎn)生第一和第二激勵(lì)信號的第一和第二激勵(lì)源,及用于根據(jù)可從與第一激勵(lì)信號相關(guān)的音調(diào)信息中得出的縮放因子來修正第一激勵(lì)信號的修正裝置。
該發(fā)明的第五個(gè)方面中提供了一種用于語音合成的合成器。包括用于分別產(chǎn)生第一和第二激勵(lì)信號的第一和第二激勵(lì)源,及用于根據(jù)可從與第一激勵(lì)信號相關(guān)的音調(diào)信息中得出的縮放因子來修正第二激勵(lì)信號的修正裝置。
該發(fā)明的第四和第五方面比較有利地將激勵(lì)信號的縮放結(jié)合在激勵(lì)產(chǎn)生器自身之中。
現(xiàn)僅通過例子并參考附圖,下面將描述根據(jù)該發(fā)明的實(shí)施方案。在附圖中
圖1是一種已知的碼激勵(lì)線性預(yù)測(CELP)編碼器的簡圖。
圖2是一種已知的CELP解碼器的簡圖。
圖3是根據(jù)該發(fā)明的第一實(shí)施方案的一種CELP解碼器的簡圖。
圖4表示了根據(jù)該發(fā)明的第二實(shí)施方案。
圖5表示了根據(jù)該發(fā)明的第三實(shí)施方案。
圖6表示了根據(jù)該發(fā)明的第四實(shí)施方案。
圖7表示了根據(jù)該發(fā)明的第五實(shí)施方案。
圖1表示了一種已知的CELP編碼器100。原始的語音信號在102處輸入到編碼器,長時(shí)預(yù)測(LTP)系數(shù)T,b利用自適應(yīng)碼書104被判定。針對一般包括40個(gè)樣本,長5ms的一個(gè)語音段判定LTP預(yù)測系數(shù),LTP系數(shù)涉及到原始語音的周期性特性,這包括原始語音中的任何周期性,并不僅僅是對應(yīng)于由于發(fā)出原始語音的人的聲帶的振動(dòng)而引起的原始語音音調(diào)的周期性。
長時(shí)預(yù)測通過使用自適應(yīng)碼書104和增益單元114而進(jìn)行,它包括一部分圖1中由點(diǎn)線表示出的激勵(lì)信號(ex(n))產(chǎn)生器126。以前的激勵(lì)信號ex(n)通過反饋回路122被存貯在自適應(yīng)碼書104中。在LTP處理中,通過改變已知為延遲或滯后且指向以前激勵(lì)信號ex(n)的地址的T值來搜索自適應(yīng)碼書。這些信號順序輸出,并在與得自固定碼書112且在增益單元116處被因子g縮放的激勵(lì)信號c1(n)在118處相加之前,在增益單元114處以縮放因子b放大來形成信號v(n)。語音樣本的線性預(yù)測系數(shù)(LPC)在106處被計(jì)算。這些LPC系數(shù)之后在108處被量化,這些量化后的LPC系數(shù)于是可被用于通過空氣傳輸并被輸入到短時(shí)濾波器110。對于包括在20ms長度上有160個(gè)樣本的語音段計(jì)算LPC系數(shù)(r(i),i=1…其中m是預(yù)測階數(shù))。所有進(jìn)一步的處理一般都在40個(gè)樣本的語音段也就是說長5m的激勵(lì)幀上進(jìn)行,LPC系數(shù)涉及原始語音信號的譜包絡(luò)。
激勵(lì)產(chǎn)生器126實(shí)際上包括一個(gè)組成碼書104、112。該碼書包括一系列用于激勵(lì)短時(shí)合成濾波器110的碼字,這些碼字包括具有一定電壓幅度的若干序列,每一個(gè)電壓幅度對應(yīng)于語音幀中的一個(gè)語音樣本。
每一個(gè)總激勵(lì)信號ex(n)被輸入到短時(shí)或LPC合成濾波器110以形成合成的語音樣本s(n),合成的語音樣本s(n)被輸入到加法器120的負(fù)輸入端,原始語音樣本作為正輸入。加法器120輸出原始語音樣本和合成語音樣本之間的差值,該差值被稱為客觀誤差。該客觀誤差被輸入到最佳激勵(lì)選擇單元124,該單元挑選出產(chǎn)生具有最小客觀誤差的合成語音幀s(n)的總激勵(lì)ex(n)。在選擇過程中客觀誤差一般被進(jìn)一步進(jìn)行譜加權(quán)以加強(qiáng)那些對于人類感知重要的語音信號的譜區(qū)域。給出最佳激勵(lì)信號ex(n)的自適應(yīng)和固定碼書的各自參數(shù)(增益b和延遲T,增益g和索引i),連同LPC濾波器系數(shù)r(i)一起被傳送到用來合成語音幀以重構(gòu)原始語音信號的接收器中。
一種適合于解碼由參考圖1描述的編碼器產(chǎn)生的語音參數(shù)的解碼器在圖2中被表示出。射頻單元201通過天線212接收編碼的語音信號。在RF單元201中,接收到的射頻信號被降頻變換為基帶頻率并被解調(diào)以恢復(fù)語音信號。通常,在被傳送之前,編碼語音被進(jìn)一步編碼以包括信道編碼和誤差校正編碼。在語音編碼可以被存取或恢復(fù)之前,這些信道編碼和誤差校正編碼必須在接收器中被解碼。語音編碼參數(shù)被參數(shù)解碼器202恢復(fù)。
LPC語音編碼中的語音編碼參數(shù)是一系列的LPC合成濾波器系數(shù)r(i),i=……m(其中m是預(yù)測階數(shù))、固定碼書索引i和增益g,自適應(yīng)碼書語音編碼參數(shù)延遲T和增益b也被恢復(fù)。
語音解碼器200使用了上面提到的語音編碼參數(shù),從激勵(lì)產(chǎn)生器211構(gòu)造一個(gè)激勵(lì)信號ex(n),用來輸入到LPC合成濾波器208,該濾波器在其輸出處提供一個(gè)合成的語音幀信號s(n)做為對激勵(lì)信號ex(n)的響應(yīng)。合成的語音幀信號s(n)在音頻處理單元209被進(jìn)一步處理并且通過一個(gè)適當(dāng)?shù)囊纛l換能器210而被變得可聽。
在一般的線性預(yù)測語音解碼器中,用于LPC合成濾波器208的激勵(lì)信號ex(n)在包括產(chǎn)生激勵(lì)序列C1(n)的固定碼書203和自適應(yīng)碼書204的激勵(lì)產(chǎn)生器211中形成。碼書激勵(lì)序列ex(n)分別在碼書203,204中的位置由語音編碼參數(shù)i和延遲T來指示。部分用來形成激勵(lì)信號ex(n)的固定碼書激勵(lì)序列C1(n)被從固定激勵(lì)碼書203中由索引i指定的位置得出,之后在縮放單元205中被傳送來的增益因子g適當(dāng)?shù)乜s放。類似的,也是部分用于形成激勵(lì)信號ex(n)的自適應(yīng)碼書激勵(lì)序列v(n)通過使用自適應(yīng)碼書固有的選擇邏輯被從自適應(yīng)碼書204中由延遲T指示的位置得出,之后在縮放單元206中被傳送來的增益因子b適當(dāng)?shù)乜s放。
通過將第二個(gè)部分激勵(lì)分量v(n)加到碼書激勵(lì)序列g(shù)c1(n)上,自適應(yīng)碼書204對固定碼書激勵(lì)序列c1(n)進(jìn)行處理。第二分量以參考圖1已經(jīng)描述過的方式從過去的激勵(lì)信號中得出,并且利用適當(dāng)?shù)匕ㄔ谧赃m應(yīng)碼書中的選擇邏輯從自適應(yīng)碼書204中選出。分量v(n)在縮放單元206中被傳送來的自適應(yīng)碼書增益b適當(dāng)?shù)乜s放,然后在加法器207中被加到gc1(n)上以形成總激勵(lì)信號ex(n)ex(n)=gc1(n)+bv(n) (1)于是,通過利用總激勵(lì)信號ex(n)自適應(yīng)碼書204被更改。
在自適應(yīng)碼書204中的第二個(gè)部分激勵(lì)分量v(n)的位置由語音編碼參數(shù)T來指示。通過使用語音編碼參數(shù)T和包括在自適應(yīng)碼書中的選擇邏輯,該自適應(yīng)激勵(lì)分量被從自適應(yīng)碼書中挑選出。
根據(jù)該發(fā)明的LPC語音合成解碼器300在圖3中被表示出,按照圖3的語音合成處理與圖2中的是相同的,除了總激勵(lì)信號ex(n)在被用做LPC合成濾波器208的激勵(lì)之前在激勵(lì)后處理單元317中被處理以外。圖3中電路單元201到212的處理與那些在圖2中有相同數(shù)字的單元的處理相同。
根據(jù)該發(fā)明的一個(gè)方面,用于總激勵(lì)ex(n)的后處理單元317被應(yīng)用到語音解碼器300中。后處理單元317包括一個(gè)加法器313用于將第三分量加在總激勵(lì)ex(n)上。增益單元315適當(dāng)?shù)乜s放所產(chǎn)生的信號ew′(n)以形成信號ew(n),該信號被用來激勵(lì)LPC合成濾波器208以產(chǎn)生合成的語音信號Sew(n)。與由圖2中表示的應(yīng)用以前技術(shù)的語音合成解碼器合成的語音信號s(n)相比,根據(jù)該發(fā)明合成的語音已經(jīng)提高了感知質(zhì)量。
后處理單元317有總激勵(lì)ex(n)做為它的輸入,并輸出感知增強(qiáng)的激勵(lì)ew(n),后處理單元317還有自適應(yīng)碼書增益b,以及從自適應(yīng)碼書204中由語音編碼參數(shù)指示的位置得出的未縮放的部分激勵(lì)分量v(n)做為另外的輸入。部分激勵(lì)分量v(n)在適當(dāng)情況下可以是應(yīng)用在激勵(lì)產(chǎn)生器211內(nèi)部來形成第二激勵(lì)分量bv(n)的相同分量,其中bv(n)被加在縮放后的碼書激勵(lì)gci(n)上來形成總激勵(lì)ex(n)。通過使用從自適應(yīng)碼書204中得到的激勵(lì)序列,沒有其他的不自然的源被加進(jìn)語音處理的電子設(shè)備中,象已知的使用附加濾波器的后或前濾波器技術(shù)情形中一樣。激勵(lì)后處理單元317也包括通過縮放因子P來縮放部分激勵(lì)成分v(n)的縮放單元314,縮放后的分量pv(n)被加法器313加在總激勵(lì)分量ex(n)上。加法器313的輸出是中間總激勵(lì)信號ew′(n),它的形式為ew′(n)=gc1(n)+bv(n)+pv(n) (2)=gc1(n)+(b+p)v(n)縮放單元314的縮放因子P在使用自適應(yīng)碼書增益b的感知增強(qiáng)增益控制單元312中被判定??s放因子P重縮放分別來自固定和自適應(yīng)碼書的兩個(gè)激勵(lì)分量c1(n)和v(n)的作用。縮放因子P被調(diào)整使得在具有高的自適應(yīng)碼書增益值b的合成語音幀樣本期間,縮放因子P被加大,在具有低的自適應(yīng)碼書增益值b的語音期間,縮放因子P被減小。此外,當(dāng)b小于一個(gè)閾值(b<THlovo)時(shí),縮放因子P被置為0,感知增強(qiáng)增益控制單元314根據(jù)下面給出的等式(3)操作。
b<THlowthen p=0.0if THlow≤b≤THupperthen p=aenhb2b>THupperthen p=aenhb(3)其中aenh是控制增強(qiáng)處理強(qiáng)度的常數(shù)。該專利的申請者發(fā)現(xiàn)aenh的較佳值是0.25,THlow和THupper的較佳值分別為0.5和1.0。
等式3可以是一個(gè)更通用的形式,增強(qiáng)函數(shù)的一個(gè)通用公式在下面等式(4)中表示出。在通常情況下,增強(qiáng)增益b可以有多于2個(gè)的閾值。而且,該增益可以被定義為b的一個(gè)更通用的函數(shù)b<THlowthen p=0.0THlow≤b<TH2then p=aenh1f1(b)TH2≤b<TH3then p=aenh2f2(b)if . .
. . (4). .
THN-1≤b≤THupperthen p=aenhN-1fN-1(b)b>THupperthen p=aenhNfN(b)在前面描述的優(yōu)選實(shí)施方案中,N=2,THlow=0.5,TH2=1.0,TH3=X,aenh1=0.25,aenh2=0.25f1(b)=b2,f2(b)=b閾值(TH),增強(qiáng)值(aenh)及增益函數(shù)(f(b))根據(jù)經(jīng)驗(yàn)得到。由于感知語音質(zhì)量的唯一現(xiàn)實(shí)測量只能通過人聽到該語音并給出他們對語音質(zhì)量的主觀意見來獲得,等式(3)和(4)中所用的值是實(shí)驗(yàn)判定的。各種用于增強(qiáng)閾值和增益函數(shù)的不同值被試用過,那些導(dǎo)致最佳發(fā)音語音的值被選出。該專利的申請者應(yīng)用了這樣的知識使用這種方法對語音質(zhì)量的增強(qiáng),對其中b一般具有高值的濁音語音尤其有效,而對于具有一個(gè)低的b值的清音,并不需要如此強(qiáng)的增強(qiáng)。因此,增益值P被控制使得它對于其中失真最易被聽到的濁音的作用加強(qiáng),對于清音的作用減弱或者根據(jù)不起作用。因此,做為通用規(guī)則,增益函數(shù)(fn)應(yīng)被選取的使得對于高b值比對于低b值有更強(qiáng)的作用。這加大了語音的音調(diào)分量和其它分量之間的差值。
在按照等式(3)運(yùn)行的優(yōu)選實(shí)施方案中,對增益值b處理的函數(shù)對中間范圍b值是一種平方依賴關(guān)系;對于較高范圍的b值是一種線性依賴關(guān)系。該專利的申請者現(xiàn)在認(rèn)為這給出好的語音質(zhì)量,因?yàn)閷τ诟叩腷值,即高度濁音化的,語音有更強(qiáng)的作用,而對于較低的b值有較弱的作用,這是因?yàn)閎一般位于范圍-1<b<1中,因此b2<b。
為了保證輸入信號ex(n)和激勵(lì)后處理單元317的輸出信號ew(n)之間的單位功率增益,一個(gè)縮放因子被計(jì)算出并被用來縮放縮放單元315中的中間激勵(lì)信號ew′(n)以形成后處理的激勵(lì)信號ew(n)??s放因子k被給出為
k=Σn=0N-1ex2(n)Σn=0N-1ew′2(n)---(5)]]>其中N是一個(gè)被適當(dāng)選取的調(diào)整周期,一般地N被置成與LPC語音碼的激勵(lì)幀長度相等。
在編碼器的自適應(yīng)碼書中,對于小于幀長度或激勵(lì)長度的T值,一部分激勵(lì)序列是未知的。對于這些未知部分,通過采用適當(dāng)?shù)倪x擇邏輯,在自適應(yīng)碼書中本地產(chǎn)生一個(gè)代替序列。根據(jù)當(dāng)前技術(shù),已知幾種產(chǎn)生這種代替序列的自適應(yīng)碼書技術(shù)。一般地,一部分已知激勵(lì)的復(fù)本被復(fù)制到未知部分所在的位置,因而產(chǎn)生一個(gè)完全的激勵(lì)序列。復(fù)制的部分可以被按照某種方式修正以提高所產(chǎn)生的語音信號的質(zhì)量。當(dāng)進(jìn)行這種拷貝時(shí),延遲值T沒有被使用,因?yàn)樗鼤赶蛭粗糠?。相反的,一種導(dǎo)致修正的T值的特殊選擇邏輯被使用(例如,使用乘以一個(gè)整數(shù)因子的T值使得,它總是指向已知信號部分)。因此解碼器與編碼器同步,同樣的修正在解碼器的自適應(yīng)碼書中被應(yīng)用。通過使用這樣一種選擇邏輯來在自適應(yīng)碼書中產(chǎn)生一個(gè)替代序列,自適應(yīng)碼書能夠?yàn)楦咭粽{(diào)聲音例如女性和小孩聲音做調(diào)整,從而導(dǎo)致有效的激勵(lì)并提高這些聲音的語音質(zhì)量。
為了獲得好的感知增強(qiáng),自適應(yīng)碼書固有的所有的修正,例如對于小于幀長的T值的修正都在增強(qiáng)后處理中被考慮。根據(jù)該發(fā)明,這一點(diǎn)通過使用來自自適應(yīng)碼書v(n)的部分激勵(lì)序列和語音合成器的激勵(lì)產(chǎn)生器的固有激勵(lì)分量的重縮放來實(shí)現(xiàn)。
總之,根據(jù)等式(2)、(3)、(4)和(5),通過自適應(yīng)地縮放從碼書203和自適應(yīng)碼書204中得出的部分激勵(lì)分量的作用,該方法增強(qiáng)了合成語音的感知質(zhì)量并降低了聽覺的不自然。
圖4表示了根據(jù)該發(fā)明的第二實(shí)施方案,其中,象圖解說明的一樣,激勵(lì)后處理單元417被放置在LPC合成濾波器208之后。在該實(shí)施方案中,從自適應(yīng)碼書204得到的第三激勵(lì)分量需要一個(gè)附加的LPC合成濾波器408。在圖4中與圖2和3中單元具有相同功能的單元也具有相同的數(shù)字。
在圖4中表示的第二實(shí)施方案中,LPC合成的語音被后處理器417在感知上增強(qiáng),從碼書203和自適應(yīng)碼書204得到的總激勵(lì)信號ex(n)被輸入到LPC合成濾波器208并根據(jù)LPC系數(shù)r(i)以傳統(tǒng)的方式處理。從自適應(yīng)碼書204中以參照圖3描述的方式得到的附加的或第三部分激勵(lì)分量v(n)被不加縮放地輸入到第二LPC合成濾波器408中并且根據(jù)LPC系數(shù)r(i)來處理,LPC濾波器208,408的輸出s(n)和sv(n)被輸入到后處理器417,并在加法器413處被加在一起。在輸入到加法器413之前,信號sv(n)被縮放因子P縮放,如參照圖3描述的,用來處理縮放因子或增益P的值可以按經(jīng)驗(yàn)得到。此外,第三部分激勵(lì)分量可以從固定碼書203和從語音信號s(n)中得到的縮放后的語音信號p′sv(n)中得出。
產(chǎn)生的感知增強(qiáng)輸出sw(n)然后被輸入到音頻處理單元209。
可選地,通過將圖4中的縮放單元414移到LPC合成濾波器408之前,增強(qiáng)系統(tǒng)的進(jìn)一步修正可以被形成。將后處理器417放置在LPC或短時(shí)合成濾波器208、408之后,可以對語音信號的增強(qiáng)給出更好的控制,因?yàn)樗苯俞槍φZ音信號而不是激勵(lì)信號。因此,可能產(chǎn)生更少的失真。
任選地,可以通過修正分別參照圖3和圖4描述的實(shí)施方案來實(shí)現(xiàn)增強(qiáng),這樣使得附加(第三)激勵(lì)分量由固定碼書2093中獲取而不是從自適應(yīng)碼書204中獲取。于是,需要使用一個(gè)負(fù)的縮放因子來替代原來的正增益因子P以減小來自固定碼書的激勵(lì)序列c1(n)的增益。這導(dǎo)致了與圖3、4中實(shí)施方案所實(shí)現(xiàn)的語音合成類似的對部分激勵(lì)信號c1(n)和v(n)的相對作用的修正。
圖5表示了根據(jù)該發(fā)明的一個(gè)實(shí)施方案,它通過使用縮放因子P和來自自適應(yīng)碼書的附加激勵(lì)分量可能達(dá)到的同樣結(jié)果。在該實(shí)施方案中,固定碼書激勵(lì)序列c1(n)被輸入到縮放單元314,該單元根據(jù)從感知增強(qiáng)增益控制2,512輸出的縮放因子P′來操作??s放后的固定碼書激勵(lì)P′c1(n),從縮放單元314輸出,并被輸入到加法器313,在該處被加進(jìn)包括分別來自固定碼書203和自適應(yīng)碼書204的分量c1(n)和v(n)的總激勵(lì)序列ex(n)中。
當(dāng)增加來自自適應(yīng)碼書204的激勵(lì)序列信號v(n)的增益時(shí),總激勵(lì)(在自適應(yīng)能量控制316之前)由等式(2)給出ew′(n)=g ci(n)+(b+p)v(n) (2)
當(dāng)降低來自固定碼書203的激勵(lì)序列c1(n)的增益時(shí)總激勵(lì)(在自適應(yīng)能量控制316之前)被給出為ew′(n)=(g+p′)ci(n)+bv(n)(6)其中P′是由圖5中表示的感知增強(qiáng)增益控制2,512得到的縮放因子,選取等式(2)并將之重新公式化為類似于等式(6)的形式,給出ew′(n)=gci(n)+(b+p)v(n)]]>=p+bb[(gbp+b)ci(n)+bv(n)]]]>=p+bb[(g-gpp+b)ci(n)+bv(n)]]]>因此,選擇p′=-gp(p+b)]]>在圖5的實(shí)施方案中,一種類似于圖3中實(shí)施方案獲得的增強(qiáng)會被實(shí)現(xiàn)。當(dāng)中間總激勵(lì)信號ew′(n)被自適應(yīng)能量控制316縮放到與ex(n)相同的能量值時(shí),圖3和圖5中的實(shí)施方案兩者會導(dǎo)致相同的總激勵(lì)信號ew(n)。
感知增強(qiáng)增益控制2512因此可以利用參照圖3和4中實(shí)施方案所應(yīng)用的同樣的處理來產(chǎn)生“P”,并且利用等式(8)來得到P′。
按照上面參照第一和第二實(shí)施方案描述的類似方式,在自適應(yīng)能量控制316的控制下,從加法器313輸出的中間總激勵(lì)信號ew(n)在縮放單元315中被縮放。
現(xiàn)在參照圖4,LPC合成的語音可能被后處理器417通過得自固定碼書的附加激勵(lì)信號的合成語音在感知上增強(qiáng)。
圖4中的點(diǎn)線420表示了一個(gè)其中固定碼書激勵(lì)信號ci(n)被耦合到LPC合成濾波器408的實(shí)施方案。LPC合成濾波器408的輸出SCi(n)被根據(jù)得自感知增強(qiáng)增益控制512的縮放因子P′在單元414中縮放并在加法器413中被加入到合成的信號s(n)中以產(chǎn)生中間合成信號s′w(n)。經(jīng)過在縮放單元415中的歸一化后,產(chǎn)生的合成信號sw(n)被送到音頻處理單元209。
前面的實(shí)施方案包括將得自自適應(yīng)碼書204或固定碼書的203的分量加進(jìn)激勵(lì)ex(n)或合成的s(n)中,來形成中間激勵(lì)ew(n)或合成信號s′w(n)。
任選地,后處理可以被省去,并且自適應(yīng)碼書v(n)或固定碼書ci(n)激勵(lì)信號可以被縮放并直接合并在一起。因此,可以省去將分量添加到未縮放的組合的固定和自適應(yīng)碼書信號的操作。
圖6表示了一個(gè)根據(jù)該發(fā)明一個(gè)方面的實(shí)施方案,在其中自適應(yīng)碼書激勵(lì)信號v(n)被縮放,然后與固定碼書激勵(lì)信號c1(n)合并以直接形成中間信號ew′(n)。
感知增強(qiáng)增益控制612輸出參數(shù)“a”來控制縮放單元614??s放單元614對自適應(yīng)碼書激勵(lì)信號v(n)處理以在用于獲得標(biāo)準(zhǔn)激勵(lì)的增益因子b上增大或放大激勵(lì)信號v(n),標(biāo)準(zhǔn)激勵(lì)ex(n)也被形成并耦合到自適應(yīng)碼書204和自適應(yīng)能量控制316。加法器613合并增大后的激勵(lì)信號av(n)和固定碼書激勵(lì)ci(n)來形成中間信號。
ew′(n)=g ci(n)+av(n) (9)如果a=b+p,那么如同等式(2)給出的同樣處理可以被實(shí)現(xiàn)。
圖7表示了一個(gè)以類似于圖6中方式運(yùn)行的實(shí)施方案,但是它縮小或削弱固定碼書激勵(lì)信號c1(n)。對于該實(shí)施方案,中間激勵(lì)信號ew′(n)由下式給出。
ew′(n)=(g+p′)ci(n)+bv(n)=a′ci(n)+bv(n) (10).
其中a′=g-gpp+b=gbp+b---(11)]]>根據(jù)等式(11),感知增強(qiáng)增益控制712輸出一個(gè)控制信號a′來根據(jù)等式(8)獲得類似于等式(6)的結(jié)果。縮小的固定碼書激勵(lì)信號a′ci(n)在加法器713中與自適應(yīng)碼書激勵(lì)信號v(n)相加以形成中間激勵(lì)信號ew′(n),剩下的過程按前面描述的那樣完成,以歸一化激勵(lì)信號和所形成合成信號saw(n)。
參照圖6和7描述的實(shí)施方案執(zhí)行激勵(lì)產(chǎn)生器中的,并且直接來自于碼書的激勵(lì)信號的縮放。
參照圖5、6和7描述的實(shí)施方案的縮放因子“P”可以根據(jù)上面描述的等式(3)或(4)來判定。
多種控制增強(qiáng)力度(aenh)的方法可以被應(yīng)用。除了自適應(yīng)碼書增益b,增強(qiáng)的量可以是自適應(yīng)碼書204的滯后或延遲值T的函數(shù),例如,當(dāng)在高音調(diào)范圍內(nèi)運(yùn)行或當(dāng)自適應(yīng)碼書參數(shù)T比激勵(lì)塊長度(虛擬滯后范圍小時(shí),后處理可以被打開或加強(qiáng)。結(jié)果是,該發(fā)明對其來說是最有益的女人和小孩的聲音將是必被后處理的。
后處理控制也可以基于濁音/清音的語音判定。例如,對于濁音,增強(qiáng)可以更強(qiáng),當(dāng)語音被劃分為清音時(shí),增強(qiáng)作用可以被完全關(guān)掉。這一點(diǎn)可以從自適應(yīng)碼書增益值b得出,該值本身就是濁/清語音的一個(gè)簡單測量,也就是說,值b越高,原始語音信號里的濁音語音越多。
根據(jù)該發(fā)明的實(shí)施方案可以被修正,使得第三部分激勵(lì)序列不與根據(jù)傳統(tǒng)語音合成法從自適應(yīng)碼書或固定碼書中得出的部分激勵(lì)序列一樣,但是卻是通過一般包括在各自碼書中用來選取另外的第3部分激勵(lì)序列的選擇邏輯可選的。第三部分激勵(lì)序列可以被選為剛剛用過的激勵(lì)序列或者是存貯在固定碼書中的總是相同的激勵(lì)序列。這將會減小語音幀之間的差異并且因而增強(qiáng)語音的連續(xù)性。任選地,b和/或T可以在解碼器中從合成語音中重新計(jì)算出并用來得出一個(gè)第三部分激勵(lì)序列。另外,固定增益P和/或固定激勵(lì)序列可以依據(jù)后處理器的位置而適當(dāng)?shù)丶舆M(jìn)總激勵(lì)序列ex(n)或語音信號s(n)中,或者從中減去。
從前面的描述看來,對于本領(lǐng)域內(nèi)的技術(shù)人員明顯的是,可以在本發(fā)明的范圍內(nèi)進(jìn)行各種修正。例如,可變幀率編碼,快速碼書搜索,顛倒音調(diào)預(yù)測和LPC預(yù)測的順序都可以被應(yīng)用在解碼中。此外,根據(jù)該發(fā)明的后處理也可以被包括在編碼器中而不僅僅是解碼器中。另外,參照附圖描述的各個(gè)實(shí)施方案的(所有)方面可以被合并以提供根據(jù)該發(fā)明的另一個(gè)實(shí)施方案。
該發(fā)明的范圍包括任何新特征或在其中明確或隱含說明的特征的組合,或是其任何實(shí)現(xiàn)方案,而不管它是否涉及到所聲明的發(fā)明,或者是否解決該發(fā)明提出的任何或所有問題。本申請者因此在這里提請注意在該申請或從中得出的任何這樣的進(jìn)一步申請的執(zhí)行期間,新的權(quán)利要求可以表述為這些特征。
權(quán)利要求
1.一種用于語音合成的合成器,包括一個(gè)用于處理包括語音周期信息并且從激勵(lì)源得到的第一信號的后處理裝置,其中,后處理裝置適合根據(jù)可從激勵(lì)源得到的第二信號來修正第一信號的語音周期信息內(nèi)容。
2.根據(jù)權(quán)利要求1的合成器,其中后處理裝置包括用于根據(jù)可從與第一信號相關(guān)的音調(diào)信息中得出的第一縮放因子(P)來縮放第二信號的增益控制裝置。
3.根據(jù)權(quán)利要求2的合成器,其中激勵(lì)源包括一個(gè)固定碼書和一個(gè)自適應(yīng)碼書,第一信號包括分別來源于固定碼書和自適應(yīng)碼書的第一和第二部分激勵(lì)信號的組合。
4.根據(jù)權(quán)利要求3的合成器,其中第一縮放因子(P)可從自適應(yīng)碼書縮放因子(b)中得出。
5.根據(jù)權(quán)利要求4的合成器,其中第一縮放因子(P)可以根據(jù)下述關(guān)系得出b<THlow則p=0.0THlow≤b<TH2則p=aenh1f1(b)TH2≤b<TH3則p=aenh2f2(b)如果THN-1≤b≤THupper則p=aenhN-1fN-1(b)b>THupper則p=aenhNfN(b)其中,TH表示閾值,b是自適應(yīng)碼書增益因子,P是第一后處理器裝置縮放因子,aenh是一個(gè)線性標(biāo)量,f(b)是增益b的函數(shù)。
6.根據(jù)權(quán)利要求4或權(quán)利要求5的合成器,其中縮放因子(P)可以根據(jù)下式得出b<THlow則p=0.0如果THlow≤b≤THupper則p=aenhb2b>THupper則p=aenhb其中aenh是一個(gè)控制增強(qiáng)處理強(qiáng)度的常數(shù),b是自適應(yīng)碼書增益,TH是閾值,P是第一后處理縮放因子。
7.根據(jù)權(quán)利要求3到6中任何一個(gè)的合成器,其中第二信號來源于自適應(yīng)碼書。
8.根據(jù)權(quán)利要求7的合成器,其中第二信號基本上與第二部分激勵(lì)信號相同。
9.根據(jù)權(quán)利要求3到6中的任何一個(gè)的合成器,其中第二信號來源于固定碼書。
10.根據(jù)權(quán)利要求9的合成器,其中第二信號基本上與第一部分激勵(lì)信號相同。
11.根據(jù)權(quán)利要求9或權(quán)利要求10的合成器,其中增益控制裝置適合根據(jù)第二縮放因子(P′)來縮放第二信號,其中p′=-gp(p+b)]]>g是固定碼書縮放因子,b是自適應(yīng)碼書縮放因子,P是第一縮放因子。
12.根據(jù)前面任何一個(gè)權(quán)利要求的合成器,其中第一信號是適合于輸入到語音合成濾波器的第一激勵(lì)信號,第二信號是適合于輸入到語音合成濾波器的第二激勵(lì)信號。
13.根據(jù)權(quán)利要求1到11中任何一個(gè)的合成器,其中第一信號是從第一語音合成濾波器輸出的第一合成語音信號,第二信號是第二語音合成濾波器的輸出。
14.根據(jù)權(quán)利要求13的合成器,其中增益控制裝置可處理輸入到第二語音合成濾波器的信號。
15.根據(jù)前面任何一個(gè)權(quán)利要求用于通過組合第一和第二信號來修正第一信號的合成器。
16.根據(jù)權(quán)利要求15的信號,其中后處理裝置還包括一個(gè)適合根據(jù)下面的關(guān)系縮放已修正的第一信號的自適應(yīng)能量控制裝置k=Σn=0N-1ex2(n)Σn=0N-1ew′2(n)]]>其中N是一個(gè)適當(dāng)選取的調(diào)整周期值,ex(n)是第一信號,ew′(n)是一個(gè)已修正的第一信號,k是能量縮放因子。
17.一種基本上如前面描述的并分別參照圖3和圖4的合成器。
18.一種用于增強(qiáng)合成語音的方法,包括從激勵(lì)源得到一個(gè)包括語音周期信息的第一信號;從激勵(lì)源得到一個(gè)第二信號,并且根據(jù)第二信號修正第一信號的語音周期信息內(nèi)容。
19.根據(jù)權(quán)利要求18的方法,它還包括根據(jù)從與第一信號相關(guān)的音調(diào)信息中得到的第一縮放因子(P)來縮放第二信號。
20.根據(jù)權(quán)利要求19的方法,其中激勵(lì)源包括一個(gè)固定碼書和一個(gè)自適應(yīng)碼書,第一信號包括分別來源于固定碼書和自適應(yīng)碼書的第一和第二部分激勵(lì)信號的組合。
21.根據(jù)權(quán)利要求20的方法,其中第一縮放因子(P)可從用于第一信號音調(diào)信息的增益因子(b)中得出。
22.根據(jù)權(quán)利要求21的方法,其中第一縮放因子可以根據(jù)下面公式得出b<THlow則p=0.0THlow≤b<TH2則p=aenh1f1(b)TH2≤b<TH3則p=aenh2f2(b)如果THN-1≤b≤THupper則p=aenhN-1fN-1(b)b>THupper則p=aenhNfN(b)其中TH表示閾值,b是用于第一信號音調(diào)信息的增益因子,P是第一信號縮放因子,aenh是一個(gè)線性標(biāo)量,f(b)是b的函數(shù)。
23.根據(jù)權(quán)利要求21或22的方法,其中縮放因子(P)可以根據(jù)(下式)得出,b<THlow則p=0.0如果THlow≤b≤THupper則p=aenhb2b>THupper則p=aenhb其中aenh是一個(gè)控制增強(qiáng)處理強(qiáng)度的常數(shù),b是用于第一信號的音調(diào)信息的增益因子,TH是閾值,P是第二信號縮放因子。
24.根據(jù)權(quán)利要求20到23中任何一個(gè)的方法,其中第二信號來源于自適應(yīng)碼書。
25.根據(jù)權(quán)利要求24的方法,其中第二信號基本上與第二部分激勵(lì)信號相同。
26.根據(jù)權(quán)利要求20到23中任何一個(gè)的方法,其中第二信號來源于固定碼書。
27.根據(jù)權(quán)利要求26的方法,其中第二信號基本上與第一部分激勵(lì)信號相同。
28.根據(jù)權(quán)利要求26或27的方法,其中第二信號根據(jù)第二縮放因子(P′)來縮放,其中p′=-gp(p+b)]]>g是固定碼書縮放因子,b是自適應(yīng)碼書縮放因子,P是第一縮放因子。
29.根據(jù)權(quán)利要求18到28中任何一個(gè)的方法,其中第一信號是適合于輸入到第一語音合成濾波器的第一激勵(lì)信號,第二信號是適合于輸入到第二語音合成濾波器的第二激勵(lì)信號。
30.根據(jù)權(quán)利要求18到28中任何一個(gè)的方法,其中第一信號是從第一語音合成濾波器輸出的第一合成語音信號,第二信號是第二語音合成濾波器的輸出。
31.根據(jù)權(quán)利要求18到30中任何一個(gè)的方法,用于通過組合第二信號和第一信號來修正第一信號。
32.根據(jù)權(quán)利要求31的方法,其中已修正的第一信號根據(jù)下面的關(guān)系式被歸一化k=Σn=0N-1ex2(n)Σn=0N-1ew′2(n)]]>其中N是一個(gè)適當(dāng)選取的調(diào)整周期,ex(n)是第一信號,ew′(n)是一個(gè)已修正的第一信號,k是能量縮放因子。
33.一種基本上如同前面根據(jù)各個(gè)實(shí)施方案描述的方法。
34.一種無線電設(shè)備,包括一種用于接收無線電信號并恢復(fù)包括在該無線電信號中的編碼信息的射頻裝置,及一種包括一個(gè)耦合到射頻裝置的激勵(lì)源的合成器,該射頻裝置用于根據(jù)編碼信息來產(chǎn)生包括音調(diào)信息的第一信號,其中合成器還包括一個(gè)耦合到激勵(lì)源來接收第一信號并被調(diào)整來根據(jù)得自激勵(lì)源的第二信號修正第一信號的音調(diào)信息的后處理裝置,以及一個(gè)被耦合來從后處理裝置接收已修正的第一信號的語音合成濾波器,以便響應(yīng)于此產(chǎn)生合成語音。
35.包括根據(jù)權(quán)利要求2到17中任何一個(gè)合成器的無線電設(shè)備。
36.根據(jù)相應(yīng)于權(quán)利要求18到33中任何一個(gè)的方法的可操作來增強(qiáng)合成的語音的無線電設(shè)備。
37.用于語音合成的合成器,它包括用于分別產(chǎn)生第一和第二激勵(lì)信號的第一和第二激勵(lì)源,及用于根據(jù)從與第一激勵(lì)信號相關(guān)的音調(diào)信息中得出的縮放因子來修正第一信號的修正裝置。
38.一種用于語音合成的合成器,它包括用于分別產(chǎn)生第一和第二激勵(lì)信號的第一和第二激勵(lì)源,以及用于根據(jù)從與第一激勵(lì)信號相關(guān)的音調(diào)信息中得出的縮放因子來修正第二激勵(lì)信號的修正裝置。
39.根據(jù)權(quán)利要求37的合成器,其中修正裝置適合根據(jù)從與第一信號相關(guān)的音調(diào)信息中得出的第一縮放因子(a)來縮放第一激勵(lì)信號。
40.根據(jù)權(quán)利要求39的合成器,其中第一激勵(lì)源是一個(gè)自適應(yīng)碼書,第二激勵(lì)源是一個(gè)固定碼書。
41.根據(jù)權(quán)利要求40的合成器,其中第一縮放因子(a)的形式為a=b+p,其中b是自適應(yīng)碼書增益,P是根據(jù)下面的關(guān)系式得出的感知增強(qiáng)增益因子b<THlow則p=0.0THlow≤b<TH2則p=aenh1f1(b)TH2≤b<TH3則p=aenh2f2(b)如果THN-1≤b≤THupper則p=aenhN-1fN-1(b)b>THupper則p=aenhNfN(b)其中TH表示閾值,b是自適應(yīng)碼書增益因子,P是感知增強(qiáng)增益因子,aenh是線性標(biāo)量,f(b)是增益b的函數(shù)。
42.根據(jù)權(quán)利要求41的合成器,其中感知增強(qiáng)增益因子P可以根據(jù)以下定義得出b<THlow則p=0.0如果THlow≤b≤THupper則p=aenhb2b>THupper則p=aenhb其中P是感知增強(qiáng)增益因子。
43.根據(jù)權(quán)利要求38到43且基于權(quán)利要求38的合成器,其中修正裝置適合根據(jù)從與第一信號相關(guān)的音調(diào)信息中得出的第二縮放因子(a′)來縮放第二激勵(lì)信號。
44.根據(jù)權(quán)利要求43的合成器,其中第一激勵(lì)源是自適應(yīng)碼書,第二激勵(lì)源是固定碼書。
45.根據(jù)權(quán)利要求44的合成器,其中第二縮放因子(a′)滿足下面關(guān)系a′=-gpp+b]]>其中g(shù)是固定碼書增益因子,b是自適應(yīng)碼書增益因子,P是可以根據(jù)下式得出的感知增強(qiáng)增益因子b<THlow則p=0.0THlow≤b<TH2則p=aenh1f1(b)TH2≤b<TH3則p=aenh2f2(b)如果THN-1≤b≤THupper則p=aenhN-1fN-1(b)b>THupper則p=aenhNfN(b)其中TH表示閾值,b是自適應(yīng)碼書增益因子,P是感知增強(qiáng)增益因子,aenh是線性標(biāo)量,f(b)是增益b的函數(shù)。
46.根據(jù)權(quán)利要求45的合成器,其中感知增強(qiáng)增益因子可根據(jù)下式及P為感知增強(qiáng)增益因子時(shí)的定義得出b<THlow則p=0.0如果THlow≤b≤THupper則p=aenhb2b>THupper則p=aenhb。
47.根據(jù)權(quán)利要求37到46中任何一個(gè)的合成器,其中第一和第二激勵(lì)信號在修正后被組合。
48根據(jù)權(quán)利要求47的合成器,還包括一個(gè)用于根據(jù)下面關(guān)系式來修正組合的已縮放的第一和第二信號的自適應(yīng)能量控制裝置k=Σn=0N-1ex2(n)Σn=0N-1ew′2(n)]]>其中N是適當(dāng)選取的調(diào)整周期,ex(n)是組合的第一和第二信號,ew′(n)是組合的已縮放的第一和第二信號,K是能量縮放因子。
49.一種用于語音合成的方法,它包括產(chǎn)生第一和第二激勵(lì)信號,根據(jù)其中相關(guān)聯(lián)的增益因子來修正第一激勵(lì)信號,并且根據(jù)可從與第一激勵(lì)信號相關(guān)的音調(diào)信息得出的縮放因子來修正第一激勵(lì)信號。
50.一種用于語音合成的方法,它包括產(chǎn)生第一和第二激勵(lì)信號,根據(jù)其中相關(guān)聯(lián)的增益因子來修正第一激勵(lì)信號,并根據(jù)可從與第一激勵(lì)信號相關(guān)的音調(diào)信息得出的縮放因子來修正第二激勵(lì)信號。
全文摘要
一種主要用于增強(qiáng)合成語音的后處理器(317)和方法被描述。后處理器(317)處理從一般包括一個(gè)固定碼書(203)和一個(gè)自適應(yīng)碼書(204)的激勵(lì)產(chǎn)生器(211)中得出的信號ex(n),其中信號ex(n)由已被縮放的來自于固定碼書(203)和自適應(yīng)碼書(204)的輸出相加構(gòu)成。后處理器通過將一個(gè)得自適應(yīng)碼書(204)的已縮放信號pv(n)加入到ex(n)中來處理ex(n)。增益或縮放因子P通過輸入到激勵(lì)產(chǎn)生器(211)的語音系數(shù)決定。在被輸入到音頻處理單元(219)中之前,組合的信號ex(n)+pr(n)通過單元(316)被歸一化并被輸入到LPC或語音合成濾波器(208)。
文檔編號G10L19/26GK1652207SQ20051005290
公開日2005年8月10日 申請日期1996年6月13日 優(yōu)先權(quán)日1995年6月16日
發(fā)明者K·雅維仁, T·霍卡仁 申請人:諾基亞流動(dòng)電話有限公司