一種基于混合激勵(lì)線性預(yù)測(cè)的600bps甚低速率語(yǔ)音編解碼方法
【專利摘要】本發(fā)明請(qǐng)求保護(hù)一種基于混合激勵(lì)線性預(yù)測(cè)的600bps甚低速率語(yǔ)音編解碼方法,包括:編碼端對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行加窗截?cái)?,得到一個(gè)子幀,提取子幀的語(yǔ)音特征參數(shù),包括:線譜對(duì)頻率、基音周期、增益和帶通清/濁音強(qiáng)度;以相鄰五個(gè)子幀組成一個(gè)超幀,判斷出超幀的類(lèi)型;對(duì)語(yǔ)音特征參數(shù)進(jìn)行多幀聯(lián)合量化編碼;利用多幀聯(lián)合量化編碼后的剩余比特對(duì)重要的語(yǔ)音特征參數(shù)進(jìn)行差錯(cuò)控制;最后組成二進(jìn)制比特流進(jìn)行傳送。解碼端解析出超幀類(lèi)型和語(yǔ)音特征參數(shù)后,進(jìn)行語(yǔ)音特征參數(shù)完整性重構(gòu),生成激勵(lì)信號(hào),再經(jīng)過(guò)自適應(yīng)譜增強(qiáng)、合成濾波器、增益控制和脈沖散布濾波后得到合成語(yǔ)音信號(hào)。本發(fā)明能有效地降低語(yǔ)音編碼速率,接收端合成的語(yǔ)音具有較高的清晰度和可懂度,且算法復(fù)雜度較低。
【專利說(shuō)明】
一種基于混合激勵(lì)線性預(yù)測(cè)的600bps甚低速率語(yǔ)音編解碼 方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于語(yǔ)音通信領(lǐng)域,特別是涉及到一種基于混合激勵(lì)線性預(yù)測(cè)的甚低速率 語(yǔ)音編解碼器,可應(yīng)用在保密通信、衛(wèi)星移動(dòng)通信以及深海通信中。
【背景技術(shù)】
[0002] 語(yǔ)音是人類(lèi)相互傳遞信息的主要載體,是現(xiàn)代通信中最直接、最方便、最有效的交 流方式,也是未來(lái)人機(jī)交互的主要手段。隨著通信技術(shù)的發(fā)展,圖像、數(shù)據(jù)等非語(yǔ)音信息在 信息傳遞中所占比重越來(lái)越大,但有效的語(yǔ)音信息傳遞仍然是眾多通信系統(tǒng)必備的功能之 〇
[0003] 雖然光纖傳輸技術(shù)的引入為通信網(wǎng)絡(luò)提供了巨大的傳輸容量,信道帶寬問(wèn)題似乎 得到解決。但人們對(duì)頻帶資源有限的陸地蜂窩移動(dòng)通信和衛(wèi)星通信的需求也在不斷增加。 語(yǔ)音信號(hào)經(jīng)過(guò)模/數(shù)轉(zhuǎn)換后,數(shù)據(jù)量大增,數(shù)字語(yǔ)音信號(hào)在通信網(wǎng)中進(jìn)行傳輸時(shí)需要更大的 帶寬,這對(duì)頻帶資源有限的無(wú)線通信系統(tǒng)來(lái)說(shuō),傳輸成本增大,因此,必須對(duì)數(shù)字化后的語(yǔ) 音信號(hào)進(jìn)行壓縮編碼。一般將速率低于1.2kbp S的語(yǔ)音編碼稱為甚低速率語(yǔ)音編碼,甚低速 率語(yǔ)音編碼技術(shù)在現(xiàn)代通信系統(tǒng)中有著特殊的應(yīng)用。(1)保密通信。由于數(shù)字加密技術(shù)可增 加通信的安全性,語(yǔ)音信號(hào)通過(guò)甚低速率編碼器編碼后,對(duì)編碼的語(yǔ)音數(shù)據(jù)進(jìn)行加密處理, 然后在窄帶信道上進(jìn)行傳輸。(2)增大系統(tǒng)容量。衛(wèi)星移動(dòng)通信系統(tǒng)主要用于解決線路鋪設(shè) 艱難的邊遠(yuǎn)山區(qū)、浩瀚的沙漠和廣闊海洋區(qū)域的通信,通過(guò)降低語(yǔ)音的編碼速率,在有限的 頻帶的信道上提供更多的話音通道,提高通信效率。(3)通信條件惡劣的軍事通信和水下通 信中也是甚低速率語(yǔ)音編碼技術(shù)的應(yīng)用領(lǐng)域??梢哉f(shuō)甚低速率語(yǔ)音通信的這些特殊應(yīng)用, 促進(jìn)了甚低速率語(yǔ)音編碼技術(shù)的發(fā)展。
[0004]經(jīng)過(guò)幾十年的研究和發(fā)展,高質(zhì)量語(yǔ)音編碼技術(shù)已大規(guī)模地走向?qū)嵱没?,產(chǎn)生了 許多語(yǔ)音編碼國(guó)際標(biāo)準(zhǔn)。國(guó)際標(biāo)準(zhǔn)化組織ITU-T相繼制定了 16kb/s的G. 728(LD-CELP)、8kb/ s的G.729(CS-ACELP)、5.3/6.3kb/s的G. 723.1 (ACELP)等國(guó)際語(yǔ)音編碼標(biāo)準(zhǔn);國(guó)際海事衛(wèi)星 組織(I匪ARSAT)于1990年制定的語(yǔ)音壓縮編碼標(biāo)準(zhǔn)采用了 4.15kb/s改進(jìn)型多帶激勵(lì) (MBE)算法;美國(guó)Qualcom公司為CDMA移動(dòng)通信系統(tǒng)采用了 4kb/s~8kb/s的變速率語(yǔ)音壓 縮編碼的標(biāo)準(zhǔn)QCELP,并納入了IS-95標(biāo)準(zhǔn)中。二十世紀(jì)九十年代,McCree博士和Barnwell教 授提出了混合激勵(lì)線性預(yù)測(cè)(MELP)編碼算法,采用MELP算法可產(chǎn)生具有較高合成質(zhì)量的 1.2~2.4kbps聲碼器。通過(guò)分析1.2~2.4kbps低速率聲碼器算法原理,提出一種600bps甚 低速率聲碼器的實(shí)現(xiàn)方法,可擴(kuò)大MELP算法在低碼率語(yǔ)音編碼領(lǐng)域的應(yīng)用范圍。
【發(fā)明內(nèi)容】
[0005] 針對(duì)現(xiàn)有技術(shù)的不足,提出了一種算法復(fù)雜度較低,所需存儲(chǔ)空間較小,合成語(yǔ)音 清晰度較高的600bps甚低速率語(yǔ)音編解碼方法。本發(fā)明的技術(shù)方案如下:
[0006] 一種基于混合激勵(lì)線性預(yù)測(cè)的600bps甚低速率語(yǔ)音編解碼方法,其包括以下步 驟:
[0007] 101、在編碼端,對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行分段,以N毫秒(N取值為20)為一個(gè)子幀,相 鄰五個(gè)子幀組成一個(gè)超幀,將超幀的語(yǔ)音數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)緩存器結(jié)構(gòu)中。
[0008] 102、提取每一子幀的語(yǔ)音特征參數(shù),包括:線譜對(duì)頻率、基音周期、增益和帶通清/ 濁音強(qiáng)度;
[0009] 103、根據(jù)每子幀的清/濁音狀態(tài)判斷出超幀的類(lèi)型,對(duì)五個(gè)子幀的語(yǔ)音特征參數(shù) 進(jìn)行多幀聯(lián)合量化編碼;
[0010] 104、利用多幀聯(lián)合量化編碼后的剩余比特對(duì)重要的語(yǔ)音特征參數(shù)進(jìn)行差錯(cuò)控制, 最后組成二進(jìn)制比特流傳送給解碼端;
[0011] 105、在解碼端,從接收到的比特流中解析出超幀類(lèi)型和語(yǔ)音特征參數(shù),然后進(jìn)行 語(yǔ)音特征參數(shù)完整性重構(gòu),利用重構(gòu)的語(yǔ)音特征參數(shù)生成激勵(lì)信號(hào),再經(jīng)過(guò)自適應(yīng)譜增強(qiáng)、 合成濾波器、增益控制和脈沖散布濾波后得到合成語(yǔ)音信號(hào)。
[0012] 進(jìn)一步的,所述步驟101對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行分段前還包括濾除工頻干擾在內(nèi) 的預(yù)處理步驟,及對(duì)語(yǔ)音信號(hào)加窗截?cái)嗟牟襟E。
[0013] 進(jìn)一步的,所述步驟101數(shù)據(jù)緩存器結(jié)構(gòu):1到350是前一超幀后350個(gè)語(yǔ)音樣點(diǎn)的 存儲(chǔ)區(qū)域,351到1150是當(dāng)前超幀的五個(gè)子幀共800個(gè)語(yǔ)音樣點(diǎn)的存儲(chǔ)區(qū)域。
[0014] 進(jìn)一步的,所述步驟102中提取帶通清/濁音強(qiáng)度。每個(gè)子幀的語(yǔ)音信號(hào)通過(guò)濾波 器組分解為5個(gè)子頻帶,計(jì)算出每個(gè)子頻帶的清/濁音強(qiáng)度值,當(dāng)判斷出某子頻帶為清音狀 態(tài),用"0"表示,如果為濁音狀態(tài),則用"Γ表示。其中第一子頻帶的清/濁音狀態(tài)決定該子幀 的清/濁音狀態(tài)。
[0015] 進(jìn)一步的,所述步驟103中超幀類(lèi)型有16種。判斷出超幀的連續(xù)五個(gè)子幀的清/濁 音狀態(tài)后,五個(gè)子幀的清/濁音狀態(tài)值視為一種超幀結(jié)構(gòu);統(tǒng)計(jì)出每種超幀結(jié)構(gòu)出現(xiàn)的概 率;取概率最大的16種結(jié)構(gòu)做為超幀類(lèi)型,剩余16種超幀結(jié)構(gòu)歸類(lèi)到與之相近的超幀類(lèi)型 中。
[0016] 進(jìn)一步的,所述步驟103對(duì)五個(gè)子幀的語(yǔ)音特征參數(shù)進(jìn)行多幀聯(lián)合量化包括;將傳 輸?shù)膮?shù)按其在幀結(jié)構(gòu)中分配的比特?cái)?shù)進(jìn)行標(biāo)量量化或矢量量化,具體參數(shù)的量化包括: [00? 7] A1、超幀類(lèi)型的量化:對(duì)超幀類(lèi)型進(jìn)行4b it標(biāo)量量化;
[0018] A2、基音周期的量化:對(duì)于沒(méi)有濁音子幀的超幀,不傳輸基音周期參數(shù);對(duì)只有一 個(gè)池音子幀的超幀,只對(duì)池音子幀的基音周期進(jìn)行對(duì)數(shù)化,再進(jìn)行7b i t標(biāo)量量化;對(duì)有兩個(gè) 濁音子幀的超幀,將5個(gè)子幀的基音周期進(jìn)行對(duì)數(shù)化后,再組成一個(gè)矢量,進(jìn)行9bit的矢量 量化;對(duì)于有兩個(gè)以上濁音子幀的超幀,將5個(gè)子幀的基音周期進(jìn)行對(duì)數(shù)化后,再組成一個(gè) 矢量,進(jìn)行l(wèi)ibit矢量量化;
[0019] A3、帶通清/濁音強(qiáng)度的量化:除了最低子頻帶外,將五個(gè)子幀的其余4個(gè)子頻帶的 清/濁音狀態(tài)值組成一個(gè)20維矢量。如果超幀沒(méi)有濁音子幀,不傳輸帶通清/濁音強(qiáng)度值;如 果超幀只有一個(gè)池音子幀,對(duì)超幀的20維清/池音狀態(tài)矢量進(jìn)行4bit的矢量量化;對(duì)于有兩 個(gè)或兩個(gè)以上濁音子幀的超幀,對(duì)超幀的20維清/濁音狀態(tài)進(jìn)行5bit矢量量化;
[0020] A4、增益的量化:每子幀提取2個(gè)增益值,五個(gè)子幀的增益組成一個(gè)10維矢量,進(jìn)行 8b it矢量量化;
[0021] A5、線譜對(duì)頻率的量化:只對(duì)超幀中的2或3個(gè)子幀的LSF參數(shù)進(jìn)行量化。若子幀為 清音幀,進(jìn)行9bit的矢量量化;若子幀為濁音幀,進(jìn)行16bit的矢量量化。
[0022]進(jìn)一步的,所述步驟104對(duì)重要的語(yǔ)音特征參數(shù)進(jìn)行差錯(cuò)控制,具體包括:
[0023] A1、如果超幀是UUUUU模式
[0024] 步驟一:將增益值(Gain)量化后的8bit平均分成兩個(gè)部分,每部分進(jìn)行漢明(8,4) 編碼保護(hù);
[0025]步驟二:對(duì)超幀類(lèi)型值(Type)進(jìn)行漢明(8,4)編碼保護(hù);
[0026]步驟三:對(duì)多級(jí)矢量量化后的線譜對(duì)頻率(LSF)進(jìn)行保護(hù)。對(duì)第一子幀的第一級(jí) 5bit的高4位進(jìn)行漢明(7,4)編碼保護(hù),對(duì)剩余的lbit聯(lián)合第二級(jí)的高3bit進(jìn)行漢明(7,4) 編碼保護(hù),對(duì)第一子幀第二級(jí)剩余的lbit聯(lián)合第三子幀第一級(jí)的高3bit進(jìn)行漢明(7,4)編 碼保護(hù);
[0027] A2、如果超幀是VUUUU模式
[0028]對(duì)量化后增益值(Gain)的高4位進(jìn)行漢明(7,4)編碼保護(hù);
[0029] A3、如果超幀是UUUUV模式
[0030] 對(duì)量化后增益值(Gain)的高4位進(jìn)行漢明(7,4)編碼保護(hù)。
[0031] 進(jìn)一步的,所述步驟105利用重構(gòu)的語(yǔ)音特征參數(shù)生成激勵(lì)信號(hào),包括步驟:將殘 差諧波幅度和抖動(dòng)值設(shè)置為默認(rèn)值;
[0032] 根據(jù)步驟105解析出的超幀類(lèi)型,判斷出每個(gè)子幀的清/濁狀態(tài)。若為濁音子幀,利 用殘差諧波幅度和帶通清/濁音強(qiáng)度生成周期性脈沖激勵(lì)信號(hào);若為清音子幀,激勵(lì)為白噪 聲信號(hào)。激勵(lì)信號(hào)經(jīng)合成濾波器后,得到重構(gòu)的語(yǔ)音信號(hào)。
[0033] 進(jìn)一步的,步驟105中的合成濾波器的系統(tǒng)函數(shù)為 '其中,<^是 通過(guò)解碼重構(gòu)出的線譜對(duì)頻率經(jīng)轉(zhuǎn)換后得到的線性預(yù)測(cè)系數(shù)值。
[0034] 所述N取值為20。
[0035]本發(fā)明的優(yōu)點(diǎn)及有益效果如下:
[0036] 本發(fā)明能實(shí)現(xiàn)一種基于混合激勵(lì)線性預(yù)測(cè)的600bps聲碼器。通過(guò)采取多子幀的語(yǔ) 音特征參數(shù)聯(lián)合量化的方式,為各種語(yǔ)音特征參數(shù)分配合理的量化比特?cái)?shù),采取標(biāo)量量化 和矢量量化的方式,既降低了編碼器的輸出比特率,又保證合成語(yǔ)音具有較高清晰度和可 懂度,且編解碼算法復(fù)雜度相對(duì)較小,實(shí)現(xiàn)成本較低。采用本發(fā)明實(shí)現(xiàn)的甚低碼率聲碼器可 應(yīng)用在軍事保密和衛(wèi)星移動(dòng)通信等頻帶資源有限的無(wú)線通信系統(tǒng)中。因此本發(fā)明具有良好 的應(yīng)用前景和實(shí)用價(jià)值。
【附圖說(shuō)明】
[0037]圖1本發(fā)明提供的實(shí)施例語(yǔ)音編解碼流程圖 [0038]圖2本發(fā)明編碼端語(yǔ)音信號(hào)處理流程圖
[0039] 圖3本發(fā)明解碼端語(yǔ)音特征參數(shù)恢復(fù)及語(yǔ)音信號(hào)合成流程圖
[0040] 圖4編碼數(shù)據(jù)緩存結(jié)構(gòu)示意圖
【具體實(shí)施方式】
[0041] 以下結(jié)合附圖,對(duì)本發(fā)明作進(jìn)一步說(shuō)明:
[0042] 在編碼端,對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行去噪等預(yù)處理后,加窗截?cái)嘈纬?0ms的子幀,五 個(gè)子幀組成一個(gè)超幀;對(duì)五個(gè)子幀的語(yǔ)音特征參數(shù)進(jìn)行聯(lián)合量化,并利用幀結(jié)構(gòu)中的剩余 比特對(duì)一些重要的語(yǔ)音特征參數(shù)進(jìn)行差錯(cuò)控制編碼,最后組成二進(jìn)制比特流進(jìn)行傳送。在 解碼端,從接收到的比特流中解析出各語(yǔ)音特征參數(shù),利用解析出的語(yǔ)音特征參數(shù)生成激 勵(lì)信號(hào),經(jīng)過(guò)合成濾波器后得到重構(gòu)的語(yǔ)音。再經(jīng)過(guò)增益調(diào)整和脈沖整形濾波,得到最終的 合成語(yǔ)音。
[0043] 提取子幀的語(yǔ)音參數(shù)有:線譜對(duì)頻率(LSF)、基音周期(Pitch)、帶通清/濁音強(qiáng)度 (BPVC)和增益(Gain)。
[0044] (1)編碼端的基本步驟
[0045]步驟一:將輸入的語(yǔ)音信號(hào)經(jīng)過(guò)一個(gè)截止頻率為100Hz的高通濾波器,濾除50Hz的 工頻干擾;
[0046]步驟二:把五個(gè)連續(xù)的20ms子幀組成一個(gè)超幀,按編碼數(shù)據(jù)緩存器結(jié)構(gòu)進(jìn)行存儲(chǔ); [0047]步驟三:分別提取五個(gè)子幀的語(yǔ)音特征參數(shù);
[0048] 步驟四:根據(jù)五個(gè)子幀的清/濁音狀態(tài)值通過(guò)查表確定超幀類(lèi)型;
[0049] 步驟五:根據(jù)超幀類(lèi)型,確定各語(yǔ)音特征參數(shù)量化所用的比特?cái)?shù);
[0050] 步驟六:對(duì)超幀類(lèi)型進(jìn)行量化,對(duì)子幀的語(yǔ)音特征參數(shù)進(jìn)行聯(lián)合量化;
[0051] 步驟七:利用編碼后超幀結(jié)構(gòu)中的剩余比特對(duì)步驟六所得的重要參數(shù)進(jìn)行差錯(cuò)控 制編碼;
[0052] 步驟八:對(duì)聯(lián)合量化后的參數(shù)和差錯(cuò)控制編碼參數(shù)一起組成二進(jìn)制比特流,傳送 給解碼端;
[0053]其中,編碼端步驟二中的"編碼數(shù)據(jù)緩存器結(jié)構(gòu)"如圖4所示,1到350是前一超幀后 350個(gè)樣點(diǎn)的存儲(chǔ)區(qū)域,351到1150是當(dāng)前超幀五個(gè)子幀共800個(gè)樣點(diǎn)的存儲(chǔ)區(qū)域。
[0054]其中,編碼端步驟六中"對(duì)超幀類(lèi)型進(jìn)行量化,對(duì)子幀的語(yǔ)音特征參數(shù)進(jìn)行聯(lián)合量 化",超幀類(lèi)型和子幀的語(yǔ)音特征參數(shù)比特分配和量化方式如下:
[0055] 步驟一:超幀類(lèi)型(Type)進(jìn)行4b it標(biāo)量量化;
[0056]步驟二:基音周期(Pitch)的量化。對(duì)于沒(méi)有濁音子幀的超幀,不傳輸基音周期參 數(shù);對(duì)于只有一個(gè)池音子幀的超幀,先對(duì)池音子幀的基音周期進(jìn)行對(duì)數(shù)化,再進(jìn)行7bit標(biāo)量 量化;對(duì)于有兩個(gè)濁音子幀的超幀,將5個(gè)子幀的基音周期進(jìn)行對(duì)數(shù)化后組成一個(gè)矢量,再 進(jìn)行9bit的矢量量化;對(duì)于有兩個(gè)以上濁音子幀的超幀,將5個(gè)子幀的基音周期進(jìn)行對(duì)數(shù)化 后組成一個(gè)矢量,再進(jìn)行1 lbit矢量量化;
[0057]步驟三:帶通清/濁音強(qiáng)度(BPVC)的量化。除了最低子頻帶外,將五個(gè)子幀的其余4 個(gè)子頻帶的清/濁音狀態(tài)值組成一個(gè)20維矢量。如果超幀沒(méi)有濁音子幀,不傳輸帶通清/濁 音強(qiáng)度值;如果超幀只有一個(gè)濁音子幀,對(duì)超幀的20維清/濁音狀態(tài)矢量進(jìn)行4bit的矢量量 化;對(duì)于有兩個(gè)或兩個(gè)以上濁音子幀的超幀,對(duì)超幀的20維清/濁音狀態(tài)進(jìn)行5bit矢量量 化;
[0058]步驟四:增益的量化。每子幀提取2個(gè)增益值,五個(gè)子幀的增益組成一個(gè)10維矢量, 進(jìn)行8b it矢量量化;
[0059]步驟五:線譜對(duì)頻率的量化。只對(duì)超幀中的2或3個(gè)子幀的LSF參數(shù)進(jìn)行量化。若子 幀為清音幀,進(jìn)行9bit的矢量量化;若子幀為濁音幀,進(jìn)行16bit的矢量量化。
[0060]其中,編碼端步驟七中"差錯(cuò)控制編碼",差錯(cuò)控制編碼方式如下:
[0061 ] A1、如果超幀是UUUUU模式
[0062] 步驟一:將增益值(Gain)量化后的8bit平均分成兩個(gè)部分,每部分進(jìn)行漢明(8,4) 編碼保護(hù);
[0063]步驟二:對(duì)超幀類(lèi)型(Type)進(jìn)行漢明(8,4)編碼保護(hù);
[0064]步驟三:對(duì)多級(jí)矢量量化后的線譜對(duì)頻率(LSF)進(jìn)行保護(hù)。對(duì)第一子幀的第一級(jí) 5bit的高4位進(jìn)行漢明(7,4)編碼保護(hù),對(duì)剩余的lbit聯(lián)合第二級(jí)的高3bit進(jìn)行漢明(7,4) 編碼保護(hù),對(duì)第一子幀第二級(jí)剩余的lbit聯(lián)合第三子幀第一級(jí)的高3bit進(jìn)行漢明(7,4)編 碼保護(hù);
[0065] A2、如果超幀是VUUUU模式
[0066]對(duì)量化后增益值(Gain)的高4位進(jìn)行漢明(7,4)編碼保護(hù);
[0067] A2、如果超幀是UUUUV模式
[0068]對(duì)量化后增益值(Gain)的高4位進(jìn)行漢明(7,4)編碼保護(hù)。
[0069]本發(fā)明設(shè)計(jì)的600bps聲碼器,超幀類(lèi)型和超幀結(jié)構(gòu)如表1所示,LSF參數(shù)量化方案 如表2所示,編碼端幀結(jié)構(gòu)比特分配方案如表3所示。
[0070]表 1
[0077] (2)解碼端的基本步驟
[0078] 圖3給出的是解碼端語(yǔ)音特征參數(shù)的解碼和語(yǔ)音信號(hào)的合成過(guò)程。
[0079] 步驟一:解碼端從接收到的比特流中解析出超幀類(lèi)型(Type)和語(yǔ)音特征參數(shù)的量 化索引值,通過(guò)量化索引得到語(yǔ)音特征參數(shù)的初值后,進(jìn)行語(yǔ)音特征參數(shù)完整性重構(gòu)。殘差 諧波幅度(Fsmag)設(shè)置為默認(rèn)值1.0,抖動(dòng)(Jitter)設(shè)置為默認(rèn)值0.25;
[0080] 步驟二:采用上述語(yǔ)音特征參數(shù)生成的激勵(lì)信號(hào)經(jīng)過(guò)合成濾波器后得到重構(gòu)的語(yǔ) 音信號(hào);
[0081] 步驟三:對(duì)重構(gòu)的語(yǔ)音信號(hào)進(jìn)行增益調(diào)整和脈沖整形濾波,得到最終合成的語(yǔ)音 信號(hào);
[0082] 其中,解碼端步驟二中"采用上述語(yǔ)音特征參數(shù)生成的激勵(lì)信號(hào)"。根據(jù)步驟一解 析出的超幀類(lèi)型,可判斷出五個(gè)子幀的清/濁狀態(tài)。若為濁音子幀,利用殘差諧波幅度 (Fsmag)和帶通清/濁音強(qiáng)度(BPVC)生成周期性脈沖激勵(lì)信號(hào);若為清音子幀,激勵(lì)信號(hào)為 白噪聲信號(hào);
[0083]其中,解碼端步驟二中"經(jīng)過(guò)合成濾波器后得到重構(gòu)的語(yǔ)音信號(hào)",合成濾波器的 系數(shù)CU是解析重構(gòu)后的線譜對(duì)頻率LSF經(jīng)轉(zhuǎn)換后得到的。合成濾波器的系統(tǒng)函數(shù)
[0084]以上這些實(shí)施例應(yīng)理解為僅用于說(shuō)明本發(fā)明而不用于限制本發(fā)明的保護(hù)范圍。在 閱讀了本發(fā)明的記載的內(nèi)容之后,技術(shù)人員可以對(duì)本發(fā)明作各種改動(dòng)或修改,這些等效變 化和修飾同樣落入本發(fā)明權(quán)利要求所限定的范圍。
【主權(quán)項(xiàng)】
1. 一種基于混合激勵(lì)線性預(yù)測(cè)的600bps甚低速率語(yǔ)音編解碼方法,其特征在于,包括 W下步驟: 101、 在編碼端,對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行分段,WN毫秒為一個(gè)子帖,相鄰五個(gè)子帖組成 一個(gè)超帖,將超帖的語(yǔ)音數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)緩存器結(jié)構(gòu)中。 102、 提取每一子帖的語(yǔ)音特征參數(shù),包括:線譜對(duì)頻率、基音周期、增益和帶通清/濁音 強(qiáng)度; 103、 根據(jù)每子帖的清/濁音狀態(tài)判斷出超帖的類(lèi)型,對(duì)五個(gè)子帖的語(yǔ)音特征參數(shù)進(jìn)行 多帖聯(lián)合量化編碼; 104、 利用多帖聯(lián)合量化編碼后的剩余比特對(duì)重要的語(yǔ)音特征參數(shù)進(jìn)行差錯(cuò)控制,最后 組成二進(jìn)制比特流傳送給解碼端; 105、 在解碼端,從接收到的比特流中解析出超帖類(lèi)型和語(yǔ)音特征參數(shù),然后進(jìn)行語(yǔ)音 特征參數(shù)完整性重構(gòu),利用重構(gòu)的語(yǔ)音特征參數(shù)生成激勵(lì)信號(hào),再經(jīng)過(guò)自適應(yīng)譜增強(qiáng)、合成 濾波器、增益控制和脈沖散布濾波后得到合成語(yǔ)音信號(hào)。2. 根據(jù)權(quán)利要求1所述的基于混合激勵(lì)線性預(yù)測(cè)的600bps甚低速率語(yǔ)音編解碼方法, 其特征在于,所述步驟101對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行分段前還包括濾除工頻干擾在內(nèi)的預(yù)處 理步驟,及對(duì)語(yǔ)音信號(hào)加窗截?cái)嗟牟襟E。3. 根據(jù)權(quán)利要求1所述的基于混合激勵(lì)線性預(yù)測(cè)的600bps甚低速率語(yǔ)音編解碼方法, 其特征在于,所述步驟101數(shù)據(jù)緩存器結(jié)構(gòu):1到350是前一超帖后350個(gè)語(yǔ)音樣點(diǎn)的存儲(chǔ)區(qū) 域,351到1150是當(dāng)前超帖的五個(gè)子帖共800個(gè)語(yǔ)音樣點(diǎn)的存儲(chǔ)區(qū)域。4. 根據(jù)權(quán)利要求1所述的基于混合激勵(lì)線性預(yù)測(cè)的600bps甚低速率語(yǔ)音編解碼方法, 其特征在于,所述步驟102中提取帶通清/濁音強(qiáng)度。每個(gè)子帖的語(yǔ)音信號(hào)通過(guò)濾波器組分 解為5個(gè)子頻帶,計(jì)算出每個(gè)子頻帶的清/濁音強(qiáng)度值,當(dāng)判斷出某子頻帶為清音狀態(tài),用 "0"表示,如果為濁音狀態(tài),則用"Γ表示,其中第一子頻帶的清/濁音狀態(tài)決定該子帖的清/ 濁音狀態(tài)。5. 根據(jù)權(quán)利要求1所述的基于混合激勵(lì)線性預(yù)測(cè)的600bps甚低速率語(yǔ)音編解碼方法, 其特征在于,所述步驟103中超帖類(lèi)型有16種。判斷出超帖的連續(xù)五個(gè)子帖的清/濁音狀態(tài) 后,五個(gè)子帖的清/濁音狀態(tài)值視為一種超帖結(jié)構(gòu);統(tǒng)計(jì)出每種超帖結(jié)構(gòu)出現(xiàn)的概率;取概 率最大的16種結(jié)構(gòu)做為超帖類(lèi)型,剩余16種超帖結(jié)構(gòu)歸類(lèi)到與之相近的超帖類(lèi)型中。6. 根據(jù)權(quán)利要求1所述的基于混合激勵(lì)線性預(yù)測(cè)的600bps甚低速率語(yǔ)音編解碼方法, 其特征在于,所述步驟103對(duì)五個(gè)子帖的語(yǔ)音特征參數(shù)進(jìn)行多帖聯(lián)合量化包括;將傳輸?shù)膮?數(shù)按其在帖結(jié)構(gòu)中分配的比特?cái)?shù)進(jìn)行標(biāo)量量化或矢量量化,具體參數(shù)的量化包括: A1、超帖類(lèi)型的量化:對(duì)超帖類(lèi)型進(jìn)行4bit標(biāo)量量化; A2、基音周期的量化:對(duì)于沒(méi)有濁音子帖的超帖,不傳輸基音周期參數(shù);對(duì)只有一個(gè)濁 音子帖的超帖,只對(duì)濁音子帖的基音周期進(jìn)行對(duì)數(shù)化,再進(jìn)行7bit標(biāo)量量化;對(duì)有兩個(gè)濁音 子帖的超帖,將5個(gè)子帖的基音周期進(jìn)行對(duì)數(shù)化后,再組成一個(gè)矢量,進(jìn)行9bit的矢量量化; 對(duì)于有兩個(gè)W上濁音子帖的超帖,將5個(gè)子帖的基音周期進(jìn)行對(duì)數(shù)化后,再組成一個(gè)矢量, 進(jìn)行l(wèi)ibit矢量量化; A3、帶通清/濁音強(qiáng)度的量化:除了最低子頻帶外,將五個(gè)子帖的其余4個(gè)子頻帶的清/ 濁音狀態(tài)值組成一個(gè)20維矢量。如果超帖沒(méi)有濁音子帖,不傳輸帶通清/濁音強(qiáng)度值;如果 超帖只有一個(gè)濁音子帖,對(duì)超帖的20維清/濁音狀態(tài)矢量進(jìn)行4bit的矢量量化;對(duì)于有兩個(gè) 或兩個(gè)W上濁音子帖的超帖,對(duì)超帖的20維清/濁音狀態(tài)進(jìn)行化it矢量量化; A4、增益的量化:每子帖提取2個(gè)增益值,五個(gè)子帖的增益組成一個(gè)10維矢量,進(jìn)行8bit 矢量量化; A5、線譜對(duì)頻率的量化:只對(duì)超帖中的2或3個(gè)子帖的LSF參數(shù)進(jìn)行量化。若子帖為清音 帖,進(jìn)行9bit的矢量量化;若子帖為濁音帖,進(jìn)行16bit的矢量量化。7. 根據(jù)權(quán)利要求1所述的基于混合激勵(lì)線性預(yù)測(cè)的600bps甚低速率語(yǔ)音編解碼方法, 其特征在于,所述步驟104對(duì)重要的語(yǔ)音特征參數(shù)進(jìn)行差錯(cuò)控制,具體包括: A1、如果超帖是UUUUU模式 步驟一:將增益值Gain量化后的8bit平均分成兩個(gè)部分,每部分進(jìn)行漢明(8,4)編碼保 護(hù); 步驟二:對(duì)超帖類(lèi)型值Type進(jìn)行漢明(8,4)編碼保護(hù); 步驟Ξ:對(duì)多級(jí)矢量量化后的線譜對(duì)頻率LSF進(jìn)行保護(hù)。對(duì)第一子帖的第一級(jí)化it的高 4位進(jìn)行漢明(7,4)編碼保護(hù),對(duì)剩余的Ibit聯(lián)合第二級(jí)的高3bit進(jìn)行漢明(7,4)編碼保護(hù), 對(duì)第一子帖第二級(jí)剩余的化it聯(lián)合第Ξ子帖第一級(jí)的高3bit進(jìn)行漢明(7,4)編碼保護(hù); A2、如果超帖是VUUUU模式 對(duì)量化后增益值Gain的高4位進(jìn)行漢明(7,4)編碼保護(hù); A3、如果超帖是UUUUV模式 對(duì)量化后增益值Gain的高4位進(jìn)行漢明(7,4)編碼保護(hù)。8. 根據(jù)權(quán)利要求1所述的基于混合激勵(lì)線性預(yù)測(cè)的600bps甚低速率語(yǔ)音編解碼方法, 其特征在于,所述步驟105利用重構(gòu)的語(yǔ)音特征參數(shù)生成激勵(lì)信號(hào),包括步驟:將殘差諧波 幅度和抖動(dòng)值設(shè)置為默認(rèn)值; 根據(jù)步驟105解析出的超帖類(lèi)型,判斷出每個(gè)子帖的清/濁狀態(tài)。若為濁音子帖,利用殘 差諧波幅度和帶通清/濁音強(qiáng)度生成周期性脈沖激勵(lì)信號(hào);若為清音子帖,激勵(lì)為白噪聲信 號(hào),激勵(lì)信號(hào)經(jīng)合成濾波器后,得到重構(gòu)的語(yǔ)音信號(hào)。9. 根據(jù)權(quán)利要求1所述的基于混合激勵(lì)線性預(yù)測(cè)的600bps甚低速率語(yǔ)音編解碼方法, 其特征在于,步驟105中的合成濾波器的系統(tǒng)函數(shù)式廷中,曰1是通過(guò)解 碼重構(gòu)出的線譜對(duì)頻率經(jīng)轉(zhuǎn)換后得到的線性預(yù)測(cè)系數(shù)值。10. 根據(jù)權(quán)利要求1所述的基于混合激勵(lì)線性預(yù)測(cè)的60化PS甚低速率語(yǔ)音編解碼方法, 其特征在于,所述N取值為20。
【文檔編號(hào)】G10L19/087GK106098072SQ201610395422
【公開(kāi)日】2016年11月9日
【申請(qǐng)日】2016年6月2日 公開(kāi)號(hào)201610395422.2, CN 106098072 A, CN 106098072A, CN 201610395422, CN-A-106098072, CN106098072 A, CN106098072A, CN201610395422, CN201610395422.2
【發(fā)明人】李強(qiáng), 朱蘭, 陳浩, 張玲, 明艷
【申請(qǐng)人】重慶郵電大學(xué)