專利名稱:一種在語音解碼器中進行增益平滑的方法及裝置的制作方法
一種在語音解碼器中進行增益平滑的方法及裝置技術領城本發(fā)明涉及語音解碼技術領域,更具體地說,涉及一種在語音解碼器中進 行增益平滑的方法及裝置。
背景技術:
參見圖1所示,在語音通信系統(tǒng)中,編碼器將輸入的語音信號進行編碼,然后通過通信信道將編碼后的比特流發(fā)送;解碼器對從通信信道中接收到比特 流進行解碼后,合成為語音信號。以下將對語音信號進^f亍編碼的編碼器稱為語音編碼器。語音編碼器常用的 編碼原理是代數(shù)碼本激勵線性預測(ACELP, Algebraic Code Excited Linear Prediction),這類編碼器包括G729、 EVRC、 AMR、 AMR-WB、 AMR-WB+ 等。其中G.729是國際電信聯(lián)盟(ITU-T)的語音編碼標準;EVRC是第三代 移動通信合作伙伴計劃2 ( 3GPP-2, 3rd Generation Partnership Project 2 )的語 音編碼標準;AMR、 AMR-WB、 AMR-WB+是第三代移動通信合作伙伴計劃 (3GPP, 3rd Generation Partnership Project)的i吾音編石馬標準?;贏CELP的語音編碼器生成的碼流都是以語音幀為單位的,有些將幀 分為若干子幀,如AMR,以子幀為單位。對于每一幀的輸入數(shù)據(jù),通常為幾 十毫秒PCM格式數(shù)據(jù),發(fā)送端的語音編碼器要將其編碼為一組參數(shù)。這些參 數(shù)一般要經(jīng)過量化并且傳輸。接收端的解碼器則要將這些參數(shù)重新合成為語音 信號,常見為PCM格式數(shù)據(jù)?;贏CELP的語音編碼器生成的語音幀的參數(shù)一般包括譜參數(shù)、自適應 碼本參數(shù)、代數(shù)碼本參數(shù)、自適應碼本增益和代數(shù)碼本增益等。由于編碼過程中會產(chǎn)生量化噪聲,降低了語音質(zhì)量,因此在解碼器端重新合成語音信號時, 一般會進行一些后處理,如固定碼本增益平滑和增強周期性, 以改善的合成語音質(zhì)量。其中固定碼本增益平滑的目的是為了避免穩(wěn)態(tài)語音的 能量不自然波動。目前語音解碼器有兩種方法對固定碼進行增益平滑。 一種是基于短期LSP (線譜對,Linear Spectral Pair)的穩(wěn)定性對固定碼本進行增益平滑,另 一種是 基于語音的穩(wěn)定性和濁音特性對固定碼本進行增益平滑?;诙唐贚SP的穩(wěn)定性對固定碼本進行增益平滑處理步驟如下(1) 對于每個幀,計算平均LSP。 <formula>formula see original document page 6</formula>其中W")是當前幀的第4子幀的LSp, J("-D是上一幀的平均LSP, ^")是 當前幀的LSP。(2) 對于子幀m,計算平均LSP向量和子幀m的LSP的差分;<formula>formula see original document page 6</formula>(3) 計算平滑因子、。<formula>formula see original document page 6</formula>(4) 利用計算最近5個子幀的固定碼本平均增益;<formula>formula see original document page 6</formula>(5) 對當前子幀的固定碼本增益進行平滑;上述進行增益平滑的的缺點是需要記錄過去多個子幀的固定碼本平均增 益,因此,存儲復雜度較大?;谡Z音的穩(wěn)定性和濁音特性對固定碼本進行增益平滑是處理步驟如下 (1)計算濁音因子 i-0.5(l-rv), rv=(Ev-Ec)/(Ev+Ec) 其中,Ev是自適應碼本的能量,Ec是固定碼本的能量。(2) 計算穩(wěn)定性因子e,并且將范圍限制在o幼si,計算公式為<formula>formula see original document page 7</formula>其中W一"ew是當前幀的ISF (導傳頻率,Immitance Spectral Frequency ), oW是上一幀的jsF。(3) 計算增益平滑因子Sm, Sm-入e;(4) 對固定碼本增益^進行初始化修正; 當gc〉g—i時,g0 =max(g-pgc/1.19)其中,g。表示當前幀經(jīng)過初始化修正后的固定碼本增益。(5) 最后對固定碼本增益進行平滑。第二種進行增益平滑方法的缺點是需要計算穩(wěn)定性因子和濁音因子,算 法復雜度較大。綜上所述,現(xiàn)有技術中,語音編碼器對固定碼進行增益平滑時,由于需要 記錄過去多個子幀的固定碼本平均增益,或者需要計算穩(wěn)定性因子和濁音因 子,因此,語音編碼過程非常復雜。發(fā)明內(nèi)容本發(fā)明的主要目的時提供一種在語音解碼器中進行增益平滑的方法及裝 置,用以簡化語音編碼中增益的平滑處理。本發(fā)明實施例提供的一種在語音解碼中進行增益平滑的方法是這樣實現(xiàn)的A. 計算當前語音楨的語音參數(shù)變化因子,并對所述當前語音幀的固定碼 本增益進行初始化/f務正;B. 按照所述語音參數(shù)變化因子確定當前語音幀的狀態(tài);c.利用所述初始化修正后的固定碼本增益以及該狀態(tài)的語音幀對應的平滑因子,對所述當前語音幀的固定碼本增益進行平滑。本發(fā)明實施例提供的一種在語音解碼中進行增益平滑的裝置包括 語音參數(shù)變化因子獲取單元,用于獲取當前幀的語音參數(shù)變化因子; 固定碼本增益初始化修正單元,用于對所述當前語音幀的固定碼本增益進 4亍初始^/f'務正;語音幀狀態(tài)確定單元,用于根據(jù)獲得的所述當前幀的語音參數(shù)變化因子確 定當前語音幀的狀態(tài);所述固定碼本增益平滑單元,用于根據(jù)所述進行初始化修正后的固定碼本 增益以及該狀態(tài)的語音幀對應的平滑因子,對所述當前語音幀的固定碼本增益 進行平滑。通過上述本發(fā)明實施例的技術方案可知,本發(fā)明實施例只需要記錄上一幀 的經(jīng)過^^正的固定碼本增益,而不需記錄連續(xù)多幀的固定碼本平均增益,因此 存儲簡單。而且,本發(fā)明實施例只需要利用一個當前語音幀的語音參數(shù)變化因 子即可實現(xiàn)增益的平滑,而不需要同時計算穩(wěn)定性因子和濁音因子,因此算法 復雜度也降低。
圖1為語音通信系統(tǒng)示意圖;圖2為本發(fā)明實施例的對固定碼本增益進行平滑的流程示意圖; 圖3為本發(fā)明實施例的基于諳參數(shù)變化因子對固定碼本增益進行平滑的流 程示意圖;圖4為另 一本發(fā)明實施例的基于傳參數(shù)變化因子對固定碼本增益進行平滑 的流程示意圖;圖5為本發(fā)明實施倒的基于基音延遲參數(shù)變化因子對固定碼本增益進行平 滑的流程示意圖;圖6為本發(fā)明實施例在語音解碼器中進行增益平滑的裝置的結構示意圖; 圖7為本發(fā)明裝置的一真體實施例結構示意圖。
具體實施方式
本發(fā)明實施例是在語音通信系統(tǒng)中,需要計算所述當前語音幀的語音參數(shù) 變化因子,對所述當前語音幀的固定碼本增益進行初始化修正;按照所述語音 參數(shù)變化因子確定當前語音幀的狀態(tài);利用所述初始化修正后的固定碼本增益 以及為該狀態(tài)的語音幀設置的平滑因子,對該當前語音幀的固定碼本增益進行 平滑。這里,當前語音幀的語音參數(shù)變化因子可以利用所述當前幀的語音參數(shù)以 及上一幀的語音參數(shù)計算出。語音參數(shù)可以為諳參數(shù)、基音延遲參數(shù)或濁音因子。平滑因子可以利用一定的公式計算得到,也可以根據(jù)仿真結果得到。 參見圖2所示,本發(fā)明實施例對固定碼本增益進行平滑的具體流程如下 步驟201:利用當前幀的語音參數(shù)以及上一幀的語音參數(shù)計算所述當前語音幀的語音參數(shù)變化因子,并對所述當前語音幀的固定碼本增益進行初始化修正;如果語音參數(shù)變化因子為i普參數(shù)變化因子,則步驟201中可以利用當前幀 的譜參數(shù)以及上一幀的譜參數(shù)計算出當前幀的語音參數(shù)變化因子。如果語音參 數(shù)變化因子為基音延遲參數(shù)變化因子,則步驟201中可以利用當前幀的基音延 遲參數(shù)以及上一幀的基音延遲參數(shù)計算得出。比如如果當前幀的固定碼本增益大于上一語音幀經(jīng)過初始化修正后的固定碼本增益,則在進行初始化修正時,需要將當前幀的固定碼本增益設置為上一語音幀經(jīng)過初始化修正后的固定碼本增益,以及固定碼本增益與增益縮放 因子的比值中的最大值;如果當前幀的固定碼本增益小于等于上一語音幀經(jīng)過初始化修正后的固定碼本增益,則進行初始化修正時,需要將當前幀的固定碼本增益設置為上 一語音幀經(jīng)過初始化《務正后的固定碼本增益,以及固定碼本增益與增益縮放因 子的乘積中的最小值。步驟202:根據(jù)語音參數(shù)變化因子確定當前語音幀的狀態(tài)。這里,可以預先4艮據(jù)語音參數(shù)變化因子將語音幀分為若干種狀態(tài),并設置 每種語音幀的狀態(tài)與語音參數(shù)變化范圍的對應關系,則步驟202中確定當前語 音幀的狀態(tài)可以這樣實現(xiàn)確定所述語音幀M變化因子所處于的語音參數(shù)變化范圍;根據(jù)所述語音 幀的狀態(tài)與語音參數(shù)變化范圍的對應關系,獲得所述語音參數(shù)變化范圍所對應 的當前語音幀的狀態(tài)。步驟203:利用所述初始化修正后的固定碼本增益以及該狀態(tài)的語音幀對 應的平滑因子,對該當前語音幀的固定碼本增益進行平滑。例如進行平滑處理的公式為^^^.g。+(l-^)i,其中,^為該狀態(tài)的語音幀設置的平滑因子,^為當前語音幀的固定碼本增益。參見圖3所示,本發(fā)明實施例基于語參數(shù)變化因子對固定碼本增益進行平 滑的具體流程如下步驟301:利用當前幀的譜參數(shù)和上一幀的譜參數(shù),計算當前幀的譜參數(shù) 變化因子^_"#。計算公式如下其中,s一"nv是當前幀的鐠參數(shù),L。W是上一幀的譜參數(shù),y為匸",和 s —gW的函數(shù)。譜參數(shù)可以是ISF或ISP或LSP或LSF或LPC,不同的語音編解碼器可 能采用ISF、 ISP、 LSP、 LSF、 LPC的一種或多種來表示語音信號的短時相關 性。步驟302:對當前語音幀的固定碼本增益&進行初始化修正。這里,可以剎用上一語魯幀經(jīng)過如始化修正居的固史雞本增益,4當*諶吾幀的固之碼本 增益^進行初始化修正,當L >g-,時,通過^^式g。 = /。(g屮^)進4亍^^臺4M'步正 當S,g—時,通過公式g。-y;(g—,,l)進行初始化修正,其中,^表示當前語音幀經(jīng)過初始化修正后的固定碼本增益,g-'表示上一語音幀經(jīng)過初始化修正后的固定碼本增益,/。(g-',&)和A(g-'《)為關于g-,和^ 的函數(shù),^為當前語音幀的固定碼本增益。步驟303:根據(jù)語音參數(shù)變化因子確定當前語音幀的狀態(tài)。比如預先根據(jù)語音參數(shù)變化因子將語音幀分為n+l種狀態(tài),n為自然數(shù) t,.....、為語音幀狀態(tài)閾值,因此,可以將語音參數(shù)變化范圍設置為小于一 大于 ,,小于6.....以及大于C n+l個語音參數(shù)變化范圍,每個語音參數(shù)變化范圍對 應一種語音幀的狀態(tài);因此,這里可以根據(jù)語音變化因子,確該定當前語音幀所處的語音參數(shù)變 化范圍內(nèi),進而再確定的語音參數(shù)變化范圍所對應的當前語音幀的狀態(tài)。步驟304:利用所述初始化修正后的固定碼本增益以及該狀態(tài)對應的平滑 因子,對該當前語音幀的固定碼本增益進行平滑。這里,平滑因子的值可以是根據(jù)仿真結果確定。還需要預先設置語音參數(shù) 變化范圍與平滑因子的對應關系。例如^為當前語音幀的固定碼本增益,s—^T為i普參數(shù)變化因子,當語音參^t變化因子小于^時,為第一種狀態(tài),該狀態(tài)下的平滑因子為S,;當語音參數(shù)變化因子大于等于,,且小于/2時,為第二種狀態(tài),該狀態(tài)下的 平滑因子為&;當語音Wt變ft因子大于等于^且小于^時,為第二種狀態(tài),該狀態(tài)下的 平滑因子為&;當語音參數(shù)變化因子大于等于"時,為第二種狀態(tài),該狀態(tài)下的平滑因子 為& ,如果進行平滑處理的公式為^-^.g。+(l-^);,其中,^為該狀態(tài)的語音幀設置的平滑因子,^為當前語音幀的固定碼本增益。因此,當s — 4^",時,可以根據(jù)公式i-S,.g。+(l-S).^對該類語音幀的固定碼本增益進行平滑當f2 < s—d# 時,才艮據(jù)公式A = S2 - g。 + (1 -S2) -對該類語音幀的固定碼本 增益進行平滑;當s 一 s f _,時,根據(jù)公式^ = S . g。 + (1 - S ). A對該類語音幀的固定碼本增 益進行平滑;參見圖4所示,另一本發(fā)明實施例的基于諳參數(shù)變化因子對固定碼本增益 進行平滑的方法包括以下步驟步驟401:利用當前幀的鐠參數(shù)和上一幀的鐠參數(shù),計算i普參數(shù)變化因子 L"#,譜參數(shù)變化因子可以是LSF、 ISF、 LPC、 ISP、 LSP等的變化因子, 計算公式可以為S —敬=^-^-其中L"ew是當前幀的謙參數(shù),s —。W是上一幀的謙參數(shù)。s—scale是歸一化因子,可以是一個常數(shù),例如可以取值為40000。步驟402:利用上一語音幀經(jīng)過初始化修正后的固定碼本增益,或固定碼 本增益與增益縮放因子的比值,或固定碼本增益l與增益縮放因子的乘積,作 為修正后的當前幀的固定碼本增益。如果當前幀的圃定碼本增益&大于上一語音幀經(jīng)過初始化修正后的固定碼本增益g-',則當前語音幀經(jīng)過初始化修正后的固定碼本增益為上一語音幀經(jīng)過初始化修正后的固定碼本增益g-',以及固定碼本增益么與增益縮放因子的比值中的最大值;如果當前幀的固定碼本增益^小于等于上一語音幀經(jīng)過初始化修正后的 固定碼本增益g",則當前語音幀經(jīng)過初始化修正后的固定碼本增益為上一語音幀經(jīng)過初始化修正后的固定碼本增益g-1 ,以及固定碼本增益&與增益縮放因 子的乘積中的最小值。具體y/^式可以包括當gc > g_,時,g。 = max(g-,, gc / g _ sca/e)當gc ^ g_,時,g0 = min(g-,, gc. g — We)其中,g。表示當前語音幀經(jīng)過初始化修正后的固定碼本增益,g-'表示上一 語音幀經(jīng)過初始化修正后的固定碼本增益。g —^^是增益縮放因子,可以是一 個常數(shù),如1.06。步驟403:根據(jù)語音參數(shù)變化因子確定當前語音幀的狀態(tài)。這里,可以根椐仿真結果預先設置一個語音幀狀態(tài)閾值,根據(jù)L"#將語 音幀分為兩類穩(wěn)態(tài)和非穩(wěn)態(tài)。當L^^大于語音幀狀態(tài)閾值時,表示譜參數(shù) 處于非穩(wěn)態(tài),當S-^^小于等于語音幀狀態(tài)閾值時,表示語參數(shù)處于穩(wěn)態(tài),因 此,可以針對才艮據(jù)仿真結果為穩(wěn)態(tài)和非穩(wěn)態(tài)分別設置固定碼本平滑因子,穩(wěn)態(tài) 時的平滑因子小于非穩(wěn)態(tài)的平滑因子,.步驟404:利用所述初始化修正后的固定碼本增益以及為該狀態(tài)的語音幀 設置的平滑因子,對該當前語音幀的固定碼本增益進行平滑。當^T>,&時,則可以當前語音幀處于非穩(wěn)態(tài),才艮據(jù)公式 ^ = S. g。 + (l - S). ^對該類語音幀的固定碼本增益進行平滑當s一d#《決/"時,可以當前語音幀處于穩(wěn)態(tài),根據(jù)公式^ = & g。 + (卜S2). l. 對該類語音幀的固定碼本增益進行平滑;其中,^為當前語音幀的固定碼本增益,^是語音幀狀態(tài)閾值,可以是一個常數(shù),如0.58。 s —4^大于Ar表示譜參數(shù)處于非穩(wěn)態(tài),S —4^小于f/ r表示譜 參數(shù)處于穩(wěn)態(tài)。S和&是對應兩種不同類型的固定碼本增益平滑因子,都是常數(shù),例如分別取值為0.17和0.83。參見圖5所示,本發(fā)明實施例基于基音延遲參數(shù)變化因子的對固定碼本增 益進行平滑的具體流程如下步驟501:根據(jù)當前幀的基音延遲參數(shù)和上一幀的基音延遲參數(shù)計算基音延遲參數(shù)變化因子&一-"#。公式可以如下 cfe/砂—= / 一 , — o/《)其中A—一"ew是當前幀的基音延遲參數(shù),s^W是上一幀的基音延遲參數(shù),f是可以根據(jù)需要設定的函數(shù)。步驟502:對固定碼本增益&進行初始化修正。具體如下當ic >g-,時,可以通過公式g。 = /。(g—pi》進行初始化修正所述當前語音幀的固定碼本增益,當i《g—i時,可以通過公式g。^厶(g—,,^)進行初始化修正所述當前語音幀 的固定碼本增益,其中,g。表示當前語音幀經(jīng)過初始化修正后的固定碼本增益,g-'表示上一語音幀經(jīng)過初始化修正后的固定碼本增益,"^》和/"g一i》為關于和^ 的函數(shù),^為當前語音幀的固定碼本增益。步驟503:根據(jù)基音延遲參數(shù)變化因子& -"^確定當前語音幀的狀態(tài)。 確定方式可以參見步驟303。步驟504:根據(jù)該狀態(tài)對應的平滑因子,對該當前語音幀的固定碼本增益 進行增益平滑。當cfe/fl[y — d# > ^時,根據(jù)公式^ = S. g。 + (1 - S,). ^對該類語音幀的固定碼本 增益進行平滑;當^ <cfe/矽sr,時,根據(jù)>^式L = S2.g。 + (1 L對該類語音幀的固定碼本增益進秄平滑;當— S^時,根據(jù)公式<formula>formula see original document page 15</formula>對該類語音幀的固定碼 本增益進行平滑;其中,&一—^T為當前語音幀的基音延遲參數(shù)變化因子,S,…'&是對應不 同類型的平滑因子,t> t"為n個語音幀狀態(tài)閾值,n為自然數(shù),么為當前語音 幀的固定碼本增益。參見圖6所示,本發(fā)明實施例在語音解碼器中進行增益平滑的裝置包括語音參數(shù)變化因子獲取單元61、固定碼本增益初始化-修正單元62、語音 幀狀態(tài)確定單元63以及固定碼本增益平滑單元64。其中,語音參數(shù)變化因子獲取單元61,用于獲取當前幀的語音參數(shù)變化因 子;固定碼本增益初始化修正單元62,用于對所述當前語音幀的固定碼本增益 進行初始化修正;語音幀狀態(tài)確定單元63,用于根據(jù)獲得的所述當前幀的語音 參數(shù)變化因子確定當前語音幀的狀態(tài);所述固定碼本增益平滑單元64,用于根 據(jù)所述進行初始化修正后的固定碼本增益以及該狀態(tài)的語音幀對應的平滑因 子,對該當前語音幀的固定碼本增益進行平滑。參見圖7所示,所述語音參數(shù)變化因子獲取單元61可以包括第一語音 參數(shù)獲取單元71、第二語音參數(shù)獲取單元72以及語音參數(shù)變化因子計算單元 73。其中,第一語音參數(shù)獲取單元71,用于獲取當前幀的語音參數(shù);第二語音 參數(shù)獲取單元72,用于獲取上一幀的語音參數(shù);語音參數(shù)變化因子計算單元 73,用于根據(jù)所述當前幀的語音參數(shù)和上一幀的語音參數(shù)計算所述當前幀的語 音參數(shù)變化因子。所述語音幀狀態(tài)確定單元63可以包括存儲單元74和語音幀狀態(tài)解析單 元75。其中,存儲單元74,用于保存語音幀的狀態(tài)與語音參數(shù)變化范圍的對應關 系;語音幀狀態(tài)解析單元75,用于確定獲得的所述語音幀參數(shù)變化因子所處于的語音參數(shù)變化范圍;根據(jù)所述對應關系,獲得所迷語音參數(shù)變化范圍所對應 的當前語音幀的狀態(tài)。所述固定碼本增益平滑單元64可以包括平滑因子存儲單元76、平滑因 子獲取單元77以及平滑處理單元78。其中,平滑因子存儲單元76,用于存儲語音幀的狀態(tài)與平滑因子的對應關 系;平滑因子獲取單元77,用于根據(jù)當前語音幀的狀態(tài),從所述語音幀的狀態(tài) 與平滑因子的對應關系中,獲得該狀態(tài)的語音幀對應的平滑因子;平滑處理單 元78,用于根據(jù)^-^.g。 + (l-^).^對該當前語音幀的固定碼本增益進行平滑,其中,^為該狀態(tài)的語音幀設置的平滑因子,l為當前語音幀的固定碼本 增益。所述固定碼本增益初始化修正單元62包括比傘支單元79以及修正處理單 元70。其中,比較單元79,用于判斷當前幀的固定碼本增益是否大于上一語音幀 經(jīng)過初始化修正后的固定碼本增益;修正處理單元70,用于當前幀的固定碼本 增益大于上一語音幀經(jīng)過初始化修正后的固定碼本增益,將當前幀的固定碼本 增益設置為上一語音幀經(jīng)過初始化修正后的固定碼本增益,以及固定碼本增 益與增益縮放因子的比值中的最大值;當前幀的固定碼本增益小于等于上一語 音幀經(jīng)過初始化修正后的固定碼本增益,則將當前幀的固定碼本增益設置為 上一語音幀經(jīng)過初始化修正后的固定碼本增益,以及固定碼本增益與增益縮放 因子的乘積中的最小值。本發(fā)明實施例是計算所述當前語音幀的語音參數(shù)變化因子,對所述當前 語音幀的固定碼本增益進行初始化修正;按照所述語音參數(shù)變化因子確定當前 語音幀的狀態(tài);利用所述初始化修正后的固定碼本增益以及為該狀態(tài)的語音幀 設置的平滑因子,對該當前語音幀的固定碼本增益進行平滑。由于在本發(fā)明實 施例中,平滑因子可以利用一定的公式計算得到,也可以根據(jù)仿真結果得到。 在進行平滑處理時,只需要記錄上一幀的經(jīng)過修正的固定碼本增益,并用靜態(tài)配置好的平滑因子進行平滑處理,不需記錄連續(xù)多幀的固定碼本增益;而且還需要利用一個當前語音幀的語音參數(shù)變化因子即可實現(xiàn)增益的平滑,不需要同 時計算穩(wěn)定性因子和濁音因子,因此,相比現(xiàn)有技術來說,存儲復雜度以及算 法的復雜度都比較低。明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權利要求及 其等同技術的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
權利要求
1. 一種在語音解碼器中進行增益平滑的方法,其特征在于,該方法包括以下步驟A.計算當前語音幀的語音參數(shù)變化因子,并對所述當前語音幀的固定碼本增益進行初始化修正;B.按照所述語音參數(shù)變化因子確定當前語音幀的狀態(tài);C.利用所述初始化修正后的固定碼本增益以及該狀態(tài)的語音幀對應的平滑因子,對所述當前語音幀的固定碼本增益進行平滑。
2、 根據(jù)權利要求1所述的方法,其特征在于,所述當前語音幀的語音參 數(shù)變化因子是利用所述當前幀的語音參數(shù)以及上一幀的語音參數(shù)計算出。
3、 根據(jù)權利要求2所述的方法,其特征在于,所述語音參數(shù)包括鐠參數(shù)、 基音延遲參數(shù)或濁音因子。
4、 根據(jù)權利要求1所述的方法,其特征在于,預先將語音幀分為至少兩 個狀態(tài),并設置語音幀的狀態(tài)與語音參數(shù)變化范圍的對應關系,則步驟B包括確定所述語音幀參凄t變化因子所處于的語音參數(shù)變化范圍; 根據(jù)所述語音幀的狀態(tài)與語音參數(shù)變化范圍的對應關系,獲得所述語音參 數(shù)變化范圍所對應的當前語音幀的狀態(tài)。
5、 根據(jù)權利要求4所述的方法,其特征在于,步驟C中根據(jù)公式 1. = Sm . g。 + (1 -Sm). i對該當前語音幀的固定碼本增益進行平滑;其中,^為該狀態(tài)的語音幀對應的平滑因子,^為當前語音幀的固定碼本 增益。
6、 根據(jù)權利要求1所述的方法,其特征在于,如果當前幀的固定碼本增 益大于上一語音幀經(jīng)過初始化修正后的固定碼本增益,則步驟A中對所述當前 語音幀的固定碼本增益進行初始化修正的步驟包括將當前幀的固定碼本增益設置為上一語音幀經(jīng)過初始化修正后的固定碼本增益,以及固定碼本增益與增益縮放因子的比值中的最大值;如果當前幀的固定碼本增益小于等于上一語音幀經(jīng)過初始化修正后的固定碼本增益,則步驟A中對所述當前語音幀的固定碼本增益進行初始化修正的 步驟包括將當前幀的固定碼本增益設置為上一語音幀經(jīng)過初始化修正后的固定碼 本增益,以及固定碼本增益與增益縮放因子的乘積中的最小值。
7、 一種在語音解碼中進行增益平滑的裝置,其特征在于,該裝置包括 語音參數(shù)變化因子獲取單元,用于獲取當前幀的語音參數(shù)變化因子; 固定碼本增益初始化修正單元,用于對所述當前語音幀的固定碼本增益進4亍初始^^奮正;語音幀狀態(tài)確定單元,用于4艮據(jù)獲得的所述當前幀的語音參數(shù)變化因子確 定當前語音幀的狀態(tài);所述固定碼本增益平滑單元,用于根據(jù)所述進行初始化修正后的固定碼本 增益以及該狀態(tài)的語音幀對應的平滑因子,對所述當前語音幀的固定碼本增益 進行平滑。
8、 根據(jù)權利要求7所述的裝置,其特征在于,所述語音參數(shù)變化因子獲 取單元包括第一語音參數(shù)獲取單元,用于獲取當前幀的語音參數(shù); 第二語音參數(shù)獲取單元,用于獲取上一幀的語音參數(shù);語音參數(shù)變化因子計算單元,用于根據(jù)所述當前幀的語音參數(shù)和上一幀的 語音參數(shù)計算所述當前幀的語音參數(shù)變化因子。
9、 根據(jù)權利要求7所述的裝置,其特征在于,所述語音幀狀態(tài)確定單元 包括存儲單元,用于保存語音幀的狀態(tài)與語音參數(shù)變化范圍的對應關系; 語音幀狀態(tài)解析單元,用于確定獲得的所述語音幀參數(shù)變化因子所處于的 語音參數(shù)變化范圍;才艮據(jù)所述對應關系,獲得所述語音參數(shù)變化范圍所對應的當箭;善備幀的狀惠。
10、 根據(jù)權利要求7所述的裝置,其特征在于,所述固定碼本增益平滑單 元包括平滑因子存儲單元,用于存儲語音幀的狀態(tài)與平滑因子的對應關系;平滑因子獲取單元,用于根據(jù)當前語音幀的狀態(tài),從所述語音幀的狀態(tài)與平滑因子的對應關系中,獲得該狀態(tài)的語音幀對應的平滑因子;平滑處理單元,用于才艮據(jù)l = sm. g。 + (l -sm). l對該當前語音幀的固定碼本增益進行平滑,其中,^為該狀態(tài)的語音幀對應的平滑因子,^為當前語音幀 的固定碼本增益。
11、 根據(jù)權利要求7所述的裝置,其特征在于,所述固定碼本增益初始化 修正單元包括比較單元,用于判斷當前幀的固定碼本增益是否大于上一語音幀經(jīng)過初始 化修正后的固定碼本增益;修正處理單元,用于當前幀的固定碼本增益大于上一語音幀經(jīng)過初始化修 正后的固定碼本增益,將當前幀的固定碼本增益設置為上一語音幀經(jīng)過初始 化修正后的固定碼本增益,以及固定碼本增益與增益縮放因子的比值中的最大 值;當前幀的固定碼本增益小于等于上一語音幀經(jīng)過初始化修正后的固定碼本 增益,則將當前幀的固定碼本增益設置為上一語音幀經(jīng)過初始化修正后的固 定碼本增益,以及固定碼本增益與增益縮放因子的乘積中的最小值。
全文摘要
本發(fā)明公開了一種在語音解碼器中進行增益平滑的方法,該方法包括計算當前語音幀的語音參數(shù)變化因子,并對所述當前語音幀的固定碼本增益進行初始化修正;按照所述語音參數(shù)變化因子確定當前語音幀的狀態(tài);利用所述初始化修正后的固定碼本增益以及為該狀態(tài)的語音幀設置的平滑因子,對該當前語音幀的固定碼本增益進行平滑。同時,本發(fā)明還公開了一種在語音解碼中進行增益平滑的裝置。本發(fā)明實施例不需記錄連續(xù)多幀的固定碼本增益,因此存儲復雜度較小,而且,也不需要同時計算穩(wěn)定性因子和濁音因子,只需要計算語音變化因子,因此算法復雜度也降低。
文檔編號G10L19/08GK101266798SQ200710088039
公開日2008年9月17日 申請日期2007年3月12日 優(yōu)先權日2007年3月12日
發(fā)明者清 張, 偉 李, 杜正中, 桑盛虎, 晨 胡, 許麗凈, 許劍峰 申請人:華為技術有限公司