填充變換編碼音頻信號(hào)中的非編碼子向量的制作方法
【專利摘要】一種用于填充變換編碼音頻信號(hào)的非編碼殘差子向量的頻譜濾波器,包括子向量壓縮器(42),被配置為壓縮實(shí)際編碼的殘差子向量。子向量拒絕器(44)被配置為拒絕不滿足預(yù)定的稀疏標(biāo)準(zhǔn)的壓縮殘差子向量。子向量收集器(46)被配置為級(jí)聯(lián)剩余的壓縮殘差子向量以形成第一虛擬碼本(VC1)。系數(shù)組合器(48)被配置為組合第一虛擬碼本(VC1)的系數(shù)對(duì)以形成第二虛擬碼本(VC2)。子向量填充器(50)被配置為使用來自第一虛擬碼本(VC1)的系數(shù)填充在預(yù)定頻率以下的非編碼殘差子向量,并且使用來自第二虛擬碼本(VC2)的系數(shù)填充在預(yù)定頻率以上的非編碼殘差子向量。
【專利說明】填充變換編碼音頻信號(hào)中的非編碼子向量
【技術(shù)領(lǐng)域】
[0001]本技術(shù)涉及音頻信號(hào)編碼,具體地涉及填充變換編碼音頻信號(hào)中的非編碼子向量。
【背景技術(shù)】
[0002]圖1示出了典型的基于變換編碼的編碼器/解碼器系統(tǒng)。
[0003]變換編碼中的主要步驟是:
[0004]A、例如通過修正的離散余弦變換(MDCT)將短音頻幀(20-40ms)變換到頻域。
[0005]B、將MDCT向量X(k)劃分到多個(gè)頻帶中(子向量SV1、SV2、……),如圖2所示。通常,頻帶的寬度隨著頻率的增高而增加[I]。
[0006]C、計(jì)算每一個(gè)頻帶中的能量。這提供了頻譜包絡(luò)的近似,如圖3所示。
[0007]D、量化頻譜包絡(luò),并且將量化索引發(fā)送到解碼器。
[0008]E、通過使用包絡(luò)增益縮放MDCT向量來獲得殘差向量,例如,通過將MDCT子向量(SV1、SV2、……)縮放至單位均方根(RMS)能量來形成殘差向量。
[0009]F、基于包絡(luò)能量來指派用于量化不同殘差子向量的比特。由于有限的比特預(yù)算,未向子向量中的一些指派任何比 特。在圖4中示出了這一點(diǎn),在圖4中,未向與在閾值TH以下的包絡(luò)增益相對(duì)應(yīng)的子向量指派任何比特。
[0010]G、根據(jù)指派的比特來量化殘差子向量,并且將量化索引發(fā)送到解碼器。例如,可以使用階乘脈沖編碼(FPC)方案[2]來執(zhí)行殘差量化。
[0011]H、不對(duì)被指派零個(gè)比特的殘差子向量進(jìn)行編碼,而是取而代之地在解碼器處對(duì)被指派零個(gè)比特的殘差子向量進(jìn)行噪聲填充。這一點(diǎn)是通過以級(jí)聯(lián)解碼頻譜的感知相關(guān)系數(shù)的方式從編碼子向量創(chuàng)建虛擬碼本(VC)來實(shí)現(xiàn)的。VC創(chuàng)建非編碼殘差子向量中的內(nèi)容。
[0012]1、在解碼器處,通過使用相應(yīng)的包絡(luò)增益對(duì)殘差子向量進(jìn)行放大來重構(gòu)MDCT向量,并且逆MDCT用于重構(gòu)時(shí)域音頻幀。
[0013]例如,如[I]中的傳統(tǒng)的噪聲填充方案的缺點(diǎn)是在于,當(dāng)與FPC方案一起使用時(shí),它在步驟H中在重構(gòu)的音頻信號(hào)中造成了可聽的失真。
【發(fā)明內(nèi)容】
[0014]總的目的是對(duì)變換編碼音頻信號(hào)的非編碼殘差子向量的改善的填充。
[0015]另一個(gè)目的是生成用于填充非編碼殘差子向量的虛擬碼本。
[0016]根據(jù)所附權(quán)利要求實(shí)現(xiàn)這些目的。
[0017]本技術(shù)的第一方面涉及一種填充變換編碼音頻信號(hào)的非編碼殘差子向量的方法。該方法包括以下步驟:
[0018].壓縮實(shí)際編碼的殘差子向量。
[0019].拒絕不滿足預(yù)定的稀疏標(biāo)準(zhǔn)的壓縮殘差子向量。
[0020].級(jí)聯(lián)剩余的壓縮殘差子向量以形成第一虛擬碼本。[0021].組合所述第一虛擬碼本的系數(shù)對(duì)以形成第二虛擬碼本。
[0022].使用來自所述第一虛擬碼本的系數(shù)來填充在預(yù)定頻率以下的非編碼殘差子向量。
[0023].使用來自所述第二虛擬碼本的系數(shù)來填充在預(yù)定頻率以上的非編碼殘差子向量。
[0024]本技術(shù)的第二方面涉及一種生成用于填充變換編碼音頻信號(hào)中在預(yù)定頻率以下的非編碼殘差子向量的虛擬碼本的方法。所述方法包括以下步驟:
[0025].壓縮實(shí)際編碼的殘差子向量。
[0026].拒絕不滿足預(yù)定的稀疏標(biāo)準(zhǔn)的壓縮殘差子向量。
[0027].級(jí)聯(lián)剩余的壓縮殘差子向量以形成所述虛擬碼本。
[0028]本技術(shù)的第三方面涉及一種生成用于填充變換編碼音頻信號(hào)中在預(yù)定頻率以上的非編碼殘差子向量的虛擬碼本的方法。所述方法包括以下步驟:
[0029].根據(jù)第二方面所述生成第一虛擬碼本。
[0030].組合所述第一虛擬碼本的系數(shù)對(duì)。
[0031]本技術(shù)的第四方面涉及一種用于填充變換編碼音頻信號(hào)的非編碼殘差子向量的頻譜填充器。所述頻譜填充器包括:`
[0032].子向量壓縮器,被配置為壓縮實(shí)際編碼的殘差子向量。
[0033].子向量拒絕器,被配置為拒絕不滿足預(yù)定的稀疏標(biāo)準(zhǔn)的壓縮殘差子向量。
[0034].子向量收集器,被配置為級(jí)聯(lián)剩余的壓縮殘差子向量以形成第一虛擬碼本。
[0035].系數(shù)組合器,被配置為組合所述第一虛擬碼本的系數(shù)對(duì)以形成第二虛擬碼本。
[0036].子向量填充器,被配置為使用來自所述第一虛擬碼本的系數(shù)來填充在預(yù)定頻率以下的非編碼殘差子向量,以及使用來自所述第二虛擬碼本的系數(shù)來填充在預(yù)定頻率以上的非編碼殘差子向量。
[0037]本技術(shù)的第五方面涉及一種解碼器,包括根據(jù)第四方面所述的頻譜填充器。
[0038]本技術(shù)的第六方面涉及一種用戶設(shè)備,包括根據(jù)第五方面所述的解碼器。
[0039]本技術(shù)的第七方面涉及一種用于生成用于填充變換編碼音頻信號(hào)中在預(yù)定頻率以下的非編碼殘差子向量的低頻虛擬碼本的低頻虛擬碼本生成器。所述低頻虛擬碼本生成器包括:
[0040].子向量壓縮器,被配置為壓縮實(shí)際編碼的殘差子向量。
[0041].子向量拒絕器,被配置為拒絕不滿足預(yù)定的稀疏標(biāo)準(zhǔn)的壓縮殘差子向量。
[0042].子向量收集器,被配置為級(jí)聯(lián)剩余的壓縮殘差子向量以形成所述低頻虛擬碼本。
[0043]本技術(shù)的第八方面涉及一種用于生成用于填充變換編碼音頻信號(hào)中在預(yù)定頻率以上的非編碼殘差子向量的高頻虛擬碼本的高頻虛擬碼本生成器。所述高頻虛擬碼本生成器包括:
[0044]?根據(jù)第七方面所述的被配置為生成低頻虛擬碼本的低頻虛擬碼本生成器。
[0045].系數(shù)組合器,被配置為組合所述低頻虛擬碼本的系數(shù)對(duì)以形成所述高頻虛擬碼本。
[0046]與傳統(tǒng)的噪聲填充相比,本頻譜填充技術(shù)的優(yōu)點(diǎn)是解碼的音頻信號(hào)的感知改進(jìn)?!緦@綀D】
【附圖說明】
[0047]通過參照結(jié)合附圖給出的以下描述,可以最佳地理解本技術(shù)以及本技術(shù)的其它目的和優(yōu)點(diǎn),在附圖中:
[0048]圖1是示出了典型的基于變換的音頻編碼/解碼系統(tǒng)的框圖;
[0049]圖2是示出了 MDCT向量的結(jié)構(gòu)的示意圖;
[0050]圖3是示出了 MDCT向量的子向量的能量分布的示意圖;
[0051]圖4是示出了使用頻譜包絡(luò)來進(jìn)行比特分配的示意圖;
[0052]圖5是示出了編碼殘差的示意圖;
[0053]圖6是示出了壓縮編碼殘差的示意圖;
[0054]圖7是示出了拒絕編碼殘差子向量的示意圖;
[0055]圖8是示出了級(jí)聯(lián)依然存在的殘差子向量以形成第一虛擬碼本的示意圖;
[0056]圖9A至圖9B是示出了組合來自第一虛擬碼本的系數(shù)以形成第二虛擬碼本的示意圖;
[0057]圖10是示出了低頻虛擬碼本生成器的示例性實(shí)施例的框圖;
[0058]圖11是示出了高頻虛 擬碼本生成器的示例性實(shí)施例的框圖;
[0059]圖12是示出了頻譜填充器的示例性實(shí)施例的框圖;
[0060]圖13是示出了包括頻譜填充器的解碼器的示例性實(shí)施例的框圖;
[0061]圖14是示出了低頻虛擬碼本生成的流程圖;
[0062]圖15是示出了高頻虛擬碼本生成的流程圖;
[0063]圖16是不出了頻譜填充的流程圖;
[0064]圖17是示出了低頻虛擬碼本生成器的示例性實(shí)施例的框圖;
[0065]圖18是示出了高頻虛擬碼本生成器的示例性實(shí)施例的框圖;
[0066]圖19是示出了頻譜填充器的示例性實(shí)施例的框圖;以及
[0067]圖20是示出了用戶設(shè)備的示例性實(shí)施例的框圖。
【具體實(shí)施方式】
[0068]在更詳細(xì)地描述本技術(shù)之前,將參照?qǐng)D1至圖7簡短地描述基于變換的編碼/解碼。
[0069]圖1是示出了典型的基于變換的音頻編碼/解碼系統(tǒng)的框圖。輸入信號(hào)x(n)被轉(zhuǎn)發(fā)給頻率變換器,例如,MDCT變換器10,在該頻率變換器處,短音頻幀(20-40ms)被轉(zhuǎn)換到頻域。由此產(chǎn)生的頻域信號(hào)X(k)被劃分到多個(gè)頻帶中(子向量SV1、SV2、……),如圖2所示。通常,頻帶的寬度隨著頻率的增高而增加[I]。在包絡(luò)計(jì)算器和量化器12中確定每一個(gè)頻帶的能量。這提供了頻譜包絡(luò)的近似,如圖3所示。在子向量歸一化器14中,通過使用相應(yīng)的量化包絡(luò)值(增益)的倒數(shù)進(jìn)行縮放來將每一個(gè)子向量歸一化為殘差子向量。
[0070]比特分配器16基于包絡(luò)能量指派用于量化不同殘差子向量的比特。由于有限的比特預(yù)算,因此未向子向量中的一些指派任何比特。在圖4中示出了這一點(diǎn),在圖4中,未向與在閾值TH以下的包絡(luò)增益相對(duì)應(yīng)的子向量指派任何比特。在子向量量化器18中根據(jù)指派的比特來量化殘差子向量。例如,可以使用階乘脈沖編碼(FPC)方案[2]來執(zhí)行殘差量化。然后,通過復(fù)用器(MUX) 20將殘差子向量量化索引和包絡(luò)量化索引發(fā)送到解碼器。[0071]在解碼器處,在解復(fù)用器(DEMUX)22中將接收的比特流解復(fù)用為殘差子向量量化索引和包絡(luò)量化索引。在子向量解量化器24中將殘差子向量量化索引解量化為殘差子向量,并且在包絡(luò)解量化器26中將包絡(luò)量化索引解量化為包絡(luò)增益。比特分配器28使用包絡(luò)增益來控制殘差子向量解量化。
[0072]在編碼器處不對(duì)被指派零個(gè)比特的殘差子向量進(jìn)行編碼,而是取而代之地在解碼器處由噪聲填充器30對(duì)被指派零個(gè)比特的殘差子向量進(jìn)行噪聲填充。這一點(diǎn)是通過以級(jí)聯(lián)解碼頻譜的感知相關(guān)的系數(shù)的方式根據(jù)編碼子向量創(chuàng)建虛擬碼本(VC)來實(shí)現(xiàn)的([I]的部分8.4.1)。因此,VC創(chuàng)建非編碼殘差子向量中的內(nèi)容。
[0073]在解碼器處,然后通過在包絡(luò)成形器32中使用相應(yīng)的包絡(luò)增益放大殘差子向量并且在逆MDCT變換器34中對(duì)由此產(chǎn)生的頻域向量進(jìn)行變換,以重構(gòu)MDCT向量
[0074]上文所描述的傳統(tǒng)的噪聲填充方案的缺點(diǎn)在于,當(dāng)與FPC方案一起使用時(shí),它在重構(gòu)的音頻信號(hào)中造成了可聽的失真。主要原因是編碼向量中的一些可能過于稀疏,這在噪聲填充的頻帶中造成了能量失配的問題。此外,編碼向量中的一些可能包含過多結(jié)構(gòu)(顏色),當(dāng)在高頻執(zhí)行噪聲填充時(shí),這導(dǎo)致感知下降。
[0075]下面的描述將集中于上面的步驟H中的虛擬碼本生成的改進(jìn)過程的實(shí)施例。
[0076]如圖6所示,根據(jù)下式來壓縮或量化圖5中所示的編碼殘差夕:
[0077]
【權(quán)利要求】
1.一種填充變換編碼音頻信號(hào)的非編碼殘差子向量的方法,所述方法包括以下步驟: 壓縮(Si)實(shí)際編碼的殘差子向量; 拒絕(S2)不滿足預(yù)定的稀疏標(biāo)準(zhǔn)的壓縮殘差子向量; 級(jí)聯(lián)(S3)剩余的壓縮殘差子向量以形成第一虛擬碼本VCl ; 組合(S4)所述第一虛擬碼本VCl的系數(shù)對(duì)以形成第二虛擬碼本VC2 ; 使用來自所述第一虛擬碼本VCl的系數(shù)來填充(S5)在預(yù)定頻率以下的非編碼殘差子向量;以及 使用來自所述第二虛擬碼本的系數(shù)來填充(S6)在所述預(yù)定頻率以上的非編碼殘差子向量。
2.根據(jù)權(quán)利要求1所述的方法,其中,根據(jù)下式來壓縮(SI)實(shí)際編碼的殘差子向量的分量
3.根據(jù)權(quán)利要求1或2所述的方法,其中,拒絕(S2)具有少于預(yù)定百分比的非零分量的壓縮殘差子向量。
4.根據(jù)權(quán)利要求1、2或3所述的方法,其中,根據(jù)下式組合(S3)所述第一虛擬碼本VCl的系數(shù)對(duì)Y (k):
5.根據(jù)權(quán)利要求1、2、3或4所述的方法,包括以下步驟:調(diào)整(S7)填充的非編碼殘差子向量的能量,以獲得感知衰減。
6.一種生成虛擬碼本VCl的方法,所述虛擬碼本VCl用于填充變換編碼音頻信號(hào)中在預(yù)定頻率以下的非編碼殘差子向量,所述方法包括以下步驟: 壓縮(Si)實(shí)際編碼的殘差子向量; 拒絕(S2)不滿足預(yù)定的稀疏標(biāo)準(zhǔn)的壓縮殘差子向量; 級(jí)聯(lián)(S3)剩余的壓縮殘差子向量以形成所述虛擬碼本VC1。
7.—種生成虛擬碼本VC2的方法,所述虛擬碼本VC2用于填充變換編碼音頻信號(hào)中在預(yù)定頻率以上的非編碼殘差子向量,所述方法包括以下步驟: 根據(jù)權(quán)利要求6生成(S1-S3)第一虛擬碼本VCl ; 組合(S4)所述第一虛擬碼本VCl的系數(shù)對(duì)。
8.一種用于填充變換編碼音頻信號(hào)的非編碼殘差子向量的頻譜填充器(40),所述頻譜填充器包括: 子向量壓縮器(42),被配置為壓縮實(shí)際編碼的殘差子向量;子向量拒絕器(44),被配置為拒絕不滿足預(yù)定的稀疏標(biāo)準(zhǔn)的壓縮殘差子向量; 子向量收集器(46),被配置為級(jí)聯(lián)剩余的壓縮殘差子向量以形成第一虛擬碼本VCl ; 系數(shù)組合器(48),被配置為組合所述第一虛擬碼本VCl的系數(shù)對(duì)以形成第二虛擬碼本VC2 ; 子向量填充器(50),被配置為使用來自所述第一虛擬碼本VCl的系數(shù)來填充在預(yù)定頻率以下的非編碼殘差子向量,以及使用來自所述第二虛擬碼本VC2的系數(shù)來填充在預(yù)定頻率以上的非編碼殘差子向量。
9.根據(jù)權(quán)利要求8所述的頻譜填充器,其中,所述子向量壓縮器(42)被配置為根據(jù)下式來壓縮實(shí)際編碼的殘差子向量的分量文:
10.根據(jù)權(quán)利要求8或9所述的頻譜填充器,其中,所述子向量拒絕器(44)被配置為拒絕具有少于預(yù)定百分比的非零分量的壓縮殘差子向量。
11.根據(jù)權(quán)利要求8、9或10所述的頻譜填充器,其中,所述系數(shù)組合器(48)被配置為根據(jù)下式組合所述第一虛擬碼本VCl的系數(shù)對(duì)Y (k):
12.根據(jù)權(quán)利要求8、9、10或11所述的頻譜填充器,包括能量調(diào)整器(52),所述能量調(diào)整器(52)被配置為調(diào)整填充的非編碼殘差子向量的能量以獲得感知衰減。
13.—種解碼器(300),包括根據(jù)前述權(quán)利要求8至12中任意一項(xiàng)所述的頻譜填充器(40)。
14.一種用戶設(shè)備UE,包括根據(jù)權(quán)利要求13所述的解碼器。
15.一種低頻虛擬碼本生成器(60),用于生成用于填充變換編碼音頻信號(hào)中在預(yù)定頻率以下的非編碼殘差子向量的低頻虛擬碼本,所述生成器包括: 子向量壓縮器(42),被配置為壓縮實(shí)際編碼的殘差子向量; 子向量拒絕器(44),被配置為拒絕不滿足預(yù)定的稀疏標(biāo)準(zhǔn)的壓縮殘差子向量; 子向量收集器(46),被配置為級(jí)聯(lián)剩余的壓縮殘差子向量以形成所述低頻虛擬碼本VCl。
16.一種高頻虛擬碼本生成器(70),用于生成用于填充變換編碼音頻信號(hào)中在預(yù)定頻率以上的非編碼殘差子向量的高頻虛擬碼本,所述生成器包括: 根據(jù)權(quán)利要求15所述的被配置為生成低頻虛擬碼本VCl的低頻虛擬碼本生成器(60); 系數(shù)組合器(48),被配置為組合所述低頻虛擬碼本VCl的系數(shù)對(duì)以形成所述高頻虛擬碼本VC2。
【文檔編號(hào)】G10L19/028GK103503063SQ201180070735
【公開日】2014年1月8日 申請(qǐng)日期:2011年9月14日 優(yōu)先權(quán)日:2011年3月10日
【發(fā)明者】沃洛佳·格蘭恰諾夫, 塞巴斯蒂安·內(nèi)斯隆德, 西德格爾·思維里森 申請(qǐng)人:瑞典愛立信有限公司