用于增強語音編解碼器的質(zhì)量的設(shè)備和方法

文檔序號：2831747閱讀：378來源：國知局

專利名稱：用于增強語音編解碼器的質(zhì)量的設(shè)備和方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種語音編解碼器(speech codec),且更具體地，涉及一種用于減少由語音編碼時靜默片段(silence segment)的量化中的誤差導致的質(zhì) 量劣化的設(shè)備和方法。
背景技術(shù)：
用于壓縮語音信號的模塊稱為編碼器，而用于解壓縮壓縮后的語音信號的模塊稱為解碼器。最基本的語音編解碼器是ITU-T G.711編解碼器，該編解碼器以8 kHz來采樣輸入信號，并且將采樣后的輸入信號量化到8比特。其中，為了增加量化效率，使用了如等式1所示的A-規(guī)則(law)對數(shù)量化器或如等式2所示的u-規(guī)則對數(shù)量化器。
<formula>formula see original document page 4</formula>
如上所述的傳統(tǒng)對數(shù)量化器根據(jù)輸入信號的量值(magnitude)來應(yīng)用不同的量化間隔。例如，對于具有小量值的信號來設(shè)置相對寬的量化間隔，而對于具有大量值的信號(也就是說，很可能要生成的信號)來設(shè)置相對窄的量化間隔。相應(yīng)地，增加了量化的效率。
公知的是，在整個帶寬上均勻地分布量化噪聲。然而，沖艮據(jù)人類聽力的特性，由于在具有大量值的信號片段中存在的量化誤差被隱藏在該信號中，所以無法清楚地聽到該量化誤差；并且容易將在具有小量值的信號片段中存在的量化誤差聽作噪聲。相應(yīng)地，因為靜默片段的編碼影響編解碼器的整體性能，所以不但需要有效地編碼語音片段、而且需要有效地編碼靜默片段。換言之，由靜默片段中的量化誤差導致的噪聲可能影響整體的聲音質(zhì)量。
編解碼器可能根據(jù)輸入信號的量值而具有不同的性能。為了評估語音編
解碼器的性能，通常評估具有不同量值的信號，例如，-16、 -26、和-36dBoV 的信號。換言之，編解碼器評估其性能如何根據(jù)輸入信號幅度的改變而變化。在諸如G.711或G.722的編解碼器中，由于針對-36 dBoV的輸入信號的量化誤差而生成噪聲。具體地，在輸入信號的靜默片段中生成的量化誤差用作減少編解碼器的整體質(zhì)量中的因素。主觀聽力測試的結(jié)果示出了針對-26 dBoV的輸入信號的平均意見得分(MOS )高于-36 dBoV
發(fā)明內(nèi)容
技術(shù)問題
本發(fā)明提供了一種用于增強語音編解碼器的質(zhì)量的設(shè)備和方法，通過所述設(shè)備和方法，可以通過減少由語音編碼期間靜默片段中的量化誤差導致的噪聲來增強聲音質(zhì)量，使得收聽者聽不到噪聲。
技術(shù)方案
根據(jù)本發(fā)明的一方面，提供了一種語音編解碼器質(zhì)量改善設(shè)備，包括第一能量計算單元，用于計算由核心編解碼器解碼的信號的第一能量；以及縮放(scaling)單元，用于當?shù)谝荒芰啃∮诘谝婚撝禃r、縮放解碼信號的大小。
根據(jù)本發(fā)明的另一方面，提供了一種語音編解碼器質(zhì)量改善方法，包才舌計算由核心編解碼器解碼的信號的第一能量；以及當?shù)谝荒芰啃∮诘谝婚撝?時，縮放解碼信號的大小。
有益效果
根據(jù)本發(fā)明，可以通過減少由于針對靜音部分的量化誤差而生成的(1喿聲，來改善語音編解碼器的質(zhì)量。具體地，可以通過減少具有小尺寸的、在靜音部分(也就是說，編解碼器的輸入信號)中生成的量化誤差來增強聲音質(zhì)量。

通過參考附圖來詳細描述本發(fā)明的示范實施例，本發(fā)明的上面以及其他特征和優(yōu)點將變得更加明顯，其中
圖1圖示了根據(jù)本發(fā)明實施例的使用窄帶核心編解碼器的寬帶擴展 (extension)編解碼器；
圖2A和2B分別圖示了使用G.711編解碼器的編碼器和解碼器的輸入信號和輸出信號的頻語；
圖3圖示了根據(jù)本發(fā)明實施例的語音編解碼器質(zhì)量改善設(shè)備的結(jié)構(gòu)；
圖4圖示了根據(jù)本發(fā)明實施例的語音編解碼器質(zhì)量改善方法的流程以及
圖5A和5B圖示了當應(yīng)用了根據(jù)本發(fā)明的語音編解碼器質(zhì)量改善方法時使用G.711編解碼器的解碼器的輸出信號的頻語、以及當沒有應(yīng)用根據(jù)本發(fā) 明的語音編解碼器質(zhì)量改善方法時使用G.711編解碼器的解碼器的輸出信號的頻譜。
具體實施方式
最優(yōu)模式
根據(jù)本發(fā)明的一方面，提供了一種語音編解碼器質(zhì)量改善設(shè)備，包括第一能量計算單元，用于計算由核心編解碼器解碼的信號的第一能量；以及縮放單元，用于當?shù)谝荒芰啃∮诘谝婚撝禃r、縮放解碼信號的大小。
根據(jù)本發(fā)明的另一方面，提供了一種語音編解碼器質(zhì)量改善方法，包括計算由核心編解碼器解碼的信號的第一能量；以及當?shù)谝荒芰啃∮诘谝婚撝?時，縮放解碼信號的大小。
發(fā)明模式
現(xiàn)在，將參考附圖來更全面地描述根據(jù)本發(fā)明的用于改善語音編解碼器的質(zhì)量的設(shè)備和方法，其中示出了本發(fā)明的示范實施例。
圖1圖示了根據(jù)本發(fā)明實施例的使用窄帶編解碼器的寬帶擴展編解碼器。
參考圖1,將寬帶擴展編解碼器劃分為傳送側(cè)100和接收側(cè)150。傳送側(cè) 100包括低通濾波器105、高通濾波器110、窄帶核心編解碼器115、孑氐頻帶增強模式120、寬帶擴展模式125、和MUX 130。接收側(cè)150包括DEMUX 155、窄帶核心編解碼器160、低頻帶增強模式165、寬帶擴展沖莫式170、低通濾波器175和高通濾波器180。在通過低通濾波器105和高通濾波器110時，將輸入到傳送側(cè)100的寬帶輸入信號分別劃分為低頻帶信號和高頻帶信號。通過窄帶核心編解碼器115 和低頻帶增強模式120來編碼低頻帶信號。通過寬帶擴展模式125來編碼高頻帶信號。經(jīng)由MUX 130來將通過窄帶核心編解碼器115和低頻帶增強模式 120編碼的低頻帶信號、和通過寬帶擴展^f莫式125編碼的高通信號輸出為比特流。
低頻帶增強模式120編碼尚未通過窄帶核心編解碼器115來表達的一部分低頻帶信號，由此改善窄帶信號的質(zhì)量。一般地，低頻帶增強模式120根據(jù)窄帶核心編解碼器115來確定操作的算法。然而，低頻帶增強模式120主要使用在時域中操作的算法，而寬帶擴展模式125使用在頻域中操作的算法。
接收側(cè)150的DEMUX 155從傳送側(cè)100接收比特流，并且向窄帶4亥心編解碼器160、低頻帶增強模式165、和寬帶擴展模式170輸出比特流。根據(jù) 所接收的比特流來做出關(guān)于低頻帶增強模式165和寬帶擴展模式170是否操作的確定。
接收側(cè)150可以根據(jù)寬帶擴展模式170的操作或不操作來輸出寬帶4言號。不管接收側(cè)150的輸出信號的帶寬，窄帶核心編解碼器160總是操作。只要窄帶核心編解碼器160操作，接收側(cè)150就可以再生(reproduce)基本的窄帶信號。為了再生更好質(zhì)量的窄帶信號，低頻帶增強模式165以及窄帶核心編解碼器160需要操作。另外，為了輸出寬帶信號，窄帶核心編解碼器160 和寬帶擴展模式170兩者都需要操作。換言之，為了使得接收側(cè)150再生寬帶輸出信號，將窄帶核心編解碼器160和寬帶擴展模式170的輸出信號加到一起。當然，為了再生更好質(zhì)量的寬帶信號，接收側(cè)150將窄帶核心編解碼器160和低頻帶增強模式165的輸出信號加到寬帶擴展模式170的輸出信號。
在國際電信聯(lián)盟電信標準化部門(ITU-T)中，正在進行使用G.711編解碼器作為核心編解碼器并且具有與圖1的寬帶擴展編解碼器的結(jié)構(gòu)類似的結(jié) 構(gòu)的寬帶擴展編解碼器的標準化。換言之，基于由ITU-T推薦的G.711編解碼器的寬帶擴展編解碼器將G.711編解碼器用作窄帶核心編解碼器115和 160，并且可以具有諸如圖l所圖示的結(jié)構(gòu)。然而，在-36 dBoV信號的情況下，G.711編解碼器由于量化誤差而生成噪聲。
圖2A和2B分別圖示了使用G.711編解碼器的編碼器和解碼器的l命入信號和輸出信號的頻譜。圖2A圖示了語音信號的頻譜，而圖2B圖示了靜默信號的頻譜。
參考圖2A,在語音信號方面，編碼器的輸入信號200的頻譜與解碼器的輸出信號210的頻譜幾乎相同。然而，參考圖2B,在靜默信號方面，.編碼器的輸入信號230的頻譜與解碼器的輸出信號220的頻譜不同。換言之，語音片段具有小量化誤差，而靜默片段具有大量化誤差。收聽者將該大量化誤差聽作噪聲。
圖3圖示了根據(jù)本發(fā)明實施例的語音編解碼器質(zhì)量改善設(shè)備的結(jié)構(gòu)。參考圖3,語音編解碼器質(zhì)量改善設(shè)備包括第一能量計算單元300、第二能量計算單元310、和縮放單元320。
第一能量計算單元300計算由核心編解碼器解碼的信號的能量(以下，稱為核心編解碼器的能量)。第一能量計算單元300.以幀為單位來計算核心編解碼器的能量。在其中將G.711編解碼器用作核心編解碼器的情況下，幀的大小可以根據(jù)其中使用G.711編解碼器的環(huán)境而變化。換言之，第一能量計算單元300通過對采樣的能量進行求和來計算一幀的能量。
當?shù)皖l帶增強模式正在操作時，第二能量計算單元310計算通過低頻帶增強模式編解碼器解碼的信號的能量(以下，稱為增強模式的能量)。
當核心編解碼器的能量小于預定閾值Thrl時，縮放單元320縮放由核心編解碼器解碼的信號的大小。當核心編解碼器的能量小于增強模式的能量與預定閾值Thr2的乘積時，縮放單元320縮放由核心編解碼器解碼的信號的大小。縮放單元320可以通過小于1的常數(shù)"a，，來縮放解碼信號的大小?？商?換地，縮放單元320可以通過將解碼信號乘以小于1、并且與當前幀的能量 (即，核心編解碼器或增強模式的能量)與前一幀的能量(即，核心編解碼器或增強模式的能量)之和成比例的增益來執(zhí)行縮放，由此防止了由縮;故導致的突然改變。在此情況下，縮放單元320可以在考慮前一縮放的大小的情況下來計算當前縮放的大小。換言之，縮放單元320可以通過將基于當前幀和先前幀的能量獲得的增益的某一比率(rate)添加到先前縮放的大小的某一比率，來計算當前縮放的大小。當然，可以以采樣為單位來執(zhí)行縮放。
當解碼信號的大多數(shù)能量存在于高頻帶中時，縮放單元320可以不4丸行
縮放。例如，當通過寬帶擴展模式解碼的信號的能量比核心編解碼器或增強模式的能量大至少一預定值時，縮放單元320不執(zhí)行縮放。
可以通過實驗法來計算閾值Thrl和Thr2、用于縮放的縮放大小"a，，等。當然，這些值可以根據(jù)本發(fā)明的實施例而變化。
圖4圖示了根據(jù)本發(fā)明實施例的語音編解碼器質(zhì)量改善方法的流程圖。參考圖4,在操作S400中，根據(jù)本發(fā)明的語音編解碼器質(zhì)量改善設(shè)備(以下，稱為設(shè)備)計算由核心編解碼器解碼的信號的能量(以下，稱為核心編解碼器的能量)。幀的大小可以取決于編解碼器的類型和其中應(yīng)用編解碼器的環(huán) 境。如圖1所圖示，當將本發(fā)明應(yīng)用到使用窄帶語音編解碼器的寬帶擴展編解碼器時，低頻帶增強模式可以存在。相應(yīng)地，在搡作S410中，該設(shè)備確定低頻帶增強模式是否正在操作。
如果在操作S410中確定了低頻帶增強模式正在操作，則該設(shè)備在才喿作 S430中計算通過低頻帶增強模式解碼的信號的能量(以下，稱為增強沖莫式的能量)。當在操作S440中核心編解碼器的能量小于增強模式的能量與預定閾值Thrl的乘積、或小于預定閾值Thr2時，該設(shè)備在揭:作S450中通過小于1 的常數(shù)"a，，來縮放由核心編解碼器解碼的信號的大小。
另一方面，如果在操作S410中確定了低頻帶增強模式不處于操作，則在操作S420中確定核心編解碼器的能量是否小于預定閾值Thr2。如果在操作 S420中確定了核心編解碼器的能量小于預定閾值Thr2,則該設(shè)備在操作S450 中縮放解碼信號。通過將解碼信號乘以小于1、并且與當前幀的能量(即，核心編解碼器或增強模式的能量)與前一幀的能量(即，核心編解碼器或增強模式的能量)之和成比例的增益來執(zhí)行縮放，由此防止了由縮放導致的突然改變。在此情況下，可以通過將基于當前幀和先前幀的能量而獲得的增益的某一比率添加到先前縮放的大小來計算當前縮放的大小。
如上所述，先前通過實驗法來計算閾值Thrl和Thr2、縮放大小等。
圖5A和5B圖示了當應(yīng)用了才艮據(jù)本發(fā)明的語音編解碼器質(zhì)量改善方法時使用G711編解碼器的解碼器的輸出信號的頻譜、和當沒有應(yīng)用根據(jù)本發(fā)明的語音編解碼器質(zhì)量改善方法時使用G.711編解碼器的解碼器的輸出信號的頻譜。圖5A圖示了語音信號的頻譜，而圖5B圖示了靜音信號的頻語。
參考圖5A，在語音信號的情況下，在應(yīng)用根據(jù)本發(fā)明的語音編解碼器質(zhì) 量改善方法之前的解碼器的輸出信號500的頻謙與在應(yīng)用根據(jù)本發(fā)明的語音編解碼器質(zhì)量改善方法之后的解碼器的輸出信號510的頻譜一致。
參考圖5B，在靜音信號的情況下，在應(yīng)用根據(jù)本發(fā)明的語音編解碼器質(zhì) 量改善方法之前的解碼器的輸出信號520的大小小于在應(yīng)用根據(jù)本發(fā)明的語音編解碼器質(zhì)量改善方法之后的解碼器的輸出信號530的大小。換言之，降低了靜音部分中解碼器的輸出信號的電平(level)，導致了量化誤差的減少。
根據(jù)本發(fā)明，可以通過減少由于針對靜音部分的量化誤差而生成的噪聲，來改善語音編解碼器的質(zhì)量。具體地，可以通過減少具有小尺寸的、在靜音部分(也就是說，編解碼器的輸入信號)中生成的量化誤差來增強聲音質(zhì)量。
還可以在計算機可讀記錄介質(zhì)上將本發(fā)明實現(xiàn)為計算機可讀代碼。計算機可讀記錄介質(zhì)是可存儲其后可以由計算機系統(tǒng)讀取的數(shù)據(jù)的任何數(shù)據(jù)存儲裝置。計算機可讀記錄介質(zhì)的示例包括只讀存儲器(ROM)、隨機存取存儲器(RAM)、 CD-ROM、磁帶、軟盤、光數(shù)據(jù)存儲裝置、和載波(諸如，經(jīng)過因特網(wǎng)的數(shù)據(jù)傳送)。也可以在網(wǎng)絡(luò)耦接的計算機系統(tǒng)上分布計算才幾可讀記錄介質(zhì)，使得以分布式方式來存儲和執(zhí)行計算機可讀代碼。
盡管已經(jīng)參考本發(fā)明的示范實施例而具體示出并描述了本發(fā)明，但是本領(lǐng)域的普通技術(shù)人員將理解，可以在其中做出形式和細節(jié)上的各種改變，而不脫離由以下權(quán)利要求限定的本發(fā)明的精神和范圍。
權(quán)利要求
1.一種語音編解碼器質(zhì)量改善設(shè)備，包括第一能量計算單元，用于計算由核心編解碼器解碼的信號的第一能量；以及縮放單元，用于當?shù)谝荒芰啃∮诘谝婚撝禃r、縮放解碼信號的大小。
2. 根據(jù)權(quán)利要求1所述的語音編解碼器質(zhì)量改善設(shè)備，還包括第二能量計算單元，用于計算通過低頻帶增強模式解碼的信號的第二能量，其中，當?shù)谝荒芰啃∮诘诙芰颗c第二閾值的乘積時，縮放單元縮放由核心編解碼器解碼的信號的大小。
3. 根據(jù)權(quán)利要求1所述的語音編解碼器質(zhì)量改善設(shè)備，其中第一能量計算單元以幀為單位來計算第一能量。
4. 根據(jù)權(quán)利要求1所述的語音編解碼器質(zhì)量改善設(shè)備，其中縮放單元通過小于1的常數(shù)來縮放解碼信號。
5. 根據(jù)權(quán)利要求1所述的語音編解碼器質(zhì)量改善設(shè)備，其中縮放單元將小于1的增益乘以當前幀的信號，其中，該增益與由核心編解碼器解碼的信號的當前幀與先前幀的能量之和成比例。
6. —種語音編解碼器質(zhì)量改善方法，包括計算由核心編解碼器解碼的信號的第一能量；以及當?shù)谝荒芰啃∮诘谝婚撝禃r，縮放解碼信號的大小。
7. 根據(jù)權(quán)利要求6所述的語音編解碼器質(zhì)量改善方法，還包括計算通過低頻帶增強模式解碼的信號的第二能量；以及當?shù)谝荒芰啃∮诘诙芰颗c第二閾值的乘積時，縮放由核心編解碼器解碼的信號的大小。
8. 根據(jù)權(quán)利要求6所述的語音編解碼器質(zhì)量改善方法，其中以幀為單位來計算第一能量。
9. 根據(jù)權(quán)利要求6所述的語音編解碼器質(zhì)量改善方法，其中所述縮放解碼信號的大小的步驟包括通過小于1的常數(shù)來縮放解碼信號。
10. 根據(jù)權(quán)利要求6所述的語音編解碼器質(zhì)量改善方法，其中所述縮放解碼信號的大小的步驟包括將小于1的增益乘以當前幀的信號，其中，該增益與由核心編解碼器解碼的信號的當前幀與先前幀的能量之和成比例。
11. 一種計算機可讀記錄介質(zhì)，其上記錄有用于執(zhí)行語音編解碼器質(zhì)量改善方法的程序，該方法包括計算由核心編解碼器解碼的信號的第一能量；以及當?shù)谝荒芰啃∮诘谝婚撝禃r，縮放解碼信號的大小。
12. —種計算機可讀記錄介質(zhì)，其上記錄有用于執(zhí)行語音編解碼器質(zhì)量改善方法的程序，該方法包括計算通過低頻帶增強模式解碼的信號的第二能量；以及當?shù)谝荒芰啃∮诘诙芰颗c第二閾值的乘積時，縮放由核心編解碼器解碼的信號的大小。
全文摘要
提供了一種用于改善語音編解碼器的質(zhì)量的設(shè)備和方法。在該方法中，計算由核心編解碼器解碼的信號的第一能量；以及計算通過低頻帶增強模式解碼的信號的第二能量。然后，當?shù)谝荒芰啃∮诘谝婚撝祷蛐∮诘诙芰颗c第二閾值的乘積時，縮放解碼信號的大小。相應(yīng)地，減少了針對靜默片段的量化誤差的生成。
文檔編號G10L19/00GK101636785SQ200880008984
公開日2010年1月27日申請日期2008年11月28日優(yōu)先權(quán)日2007年12月6日
發(fā)明者李炳墡, 李美淑, 金度泳申請人:韓國電子通信研究院

完整全部詳細技術(shù)資料下載