在一頻譜域中用以處理已解碼音頻信號(hào)的裝置及方法
【專(zhuān)利摘要】用以處理已解碼音頻信號(hào)(100)的設(shè)備包含用以濾波該已解碼音頻信號(hào)來(lái)獲得已濾波音頻信號(hào)(104)的濾波器(102),用以將該已解碼音頻信號(hào)及該已濾波音頻信號(hào)轉(zhuǎn)換成相對(duì)應(yīng)的頻譜表示型態(tài)的時(shí)間頻譜轉(zhuǎn)換器級(jí)(106),各個(gè)頻譜表示型態(tài)具有多個(gè)子帶信號(hào),用以通過(guò)將子帶信號(hào)乘以各個(gè)加權(quán)系數(shù)執(zhí)行該已濾波音頻信號(hào)的頻率選擇性加權(quán)來(lái)獲得已加權(quán)已濾波音頻信號(hào)的加權(quán)器(108),用以執(zhí)行該已加權(quán)已濾波音頻信號(hào)與該已解碼音頻信號(hào)的該頻譜表示型態(tài)之間的逐一子帶減法的減法器(112),及用以將結(jié)果音頻信號(hào)或從該結(jié)果音頻信號(hào)獲得的一信號(hào)轉(zhuǎn)換成時(shí)域表示型態(tài)來(lái)獲得已處理已解碼音頻信號(hào)(116)的頻譜時(shí)間轉(zhuǎn)換器(114)。
【專(zhuān)利說(shuō)明】在一頻譜域中用以處理已解碼音頻信號(hào)的裝置及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及音頻處理,更明確言之,涉及用于質(zhì)量提升的已解碼音頻信號(hào)的處理?!颈尘凹夹g(shù)】
[0002]近年來(lái),已經(jīng)達(dá)成有關(guān)切換式音頻編解碼器的進(jìn)一步發(fā)展。高質(zhì)量及低位率的切換式音頻編解碼器乃統(tǒng)一語(yǔ)音與音頻編碼構(gòu)思(USAC構(gòu)思)。常見(jiàn)的前處理/后處理包含:MPEG環(huán)繞(MPEG)功能單元,其處置立體聲或多聲道處理,及加強(qiáng)SBR(eSBR)單元,其處理于輸入信號(hào)中較高音頻的參數(shù)表示型態(tài)。接著存在二分支,一個(gè)分支包含高階音頻編碼(AAC)工具路徑,并且另一個(gè)分支包含以線性預(yù)測(cè)編碼(LP或LPC定義域)為基礎(chǔ)的路徑,其又轉(zhuǎn)而成為L(zhǎng)PC殘差的頻域表示型態(tài)或時(shí)域表示型態(tài)。在量化及算術(shù)編碼后,AAC及LPC 二者的全部傳輸頻譜表示在MDCT定義域。時(shí)域表示型態(tài)使用ACELP激勵(lì)編碼方案。編碼器及解碼器的框圖在IS0/IEC CD23003-3的圖1.1和圖1.2給出。
[0003]切換式音頻編解碼器的一額外實(shí)例為如3GPP TS26.290V10.0.0 (2011-3)描述的擴(kuò)充式適應(yīng)多速率寬帶(AMR-WB+)編解碼器。AMR-WB+音頻編解碼器處理輸入幀等于以?xún)?nèi)部取樣頻率Fs為2048樣本。內(nèi)部取樣頻率系限于12800至38400Hz的范圍。2048樣本幀分成兩個(gè)臨界取樣的相等頻率頻帶。如此導(dǎo)致相對(duì)應(yīng)于低頻(LF)頻帶及高頻(HF)頻帶的兩個(gè)1024樣本的超幀。各個(gè)超幀被劃分為四個(gè)256樣本幀。于內(nèi)部取樣率取樣系經(jīng)由使用可變?nèi)愚D(zhuǎn)換方案獲得,該方案重新取樣輸入信號(hào)。然后,低頻信號(hào)及高頻信號(hào)使用兩個(gè)不同辦法編碼:低頻信號(hào)使用「核心」編碼器/解碼器基于切換式ACELP及轉(zhuǎn)換編碼激勵(lì)(TCX)編碼與解碼。在ACELP模式中,使用標(biāo)準(zhǔn)AMR-WB編解碼器。高頻信號(hào)系利用頻寬延長(zhǎng)(BWE)方法以相當(dāng)少的位(每個(gè)幀16位)編碼。AMR-WB編碼器包括前處理功能、LPC分析、開(kāi)放回路搜尋功能、適應(yīng)性碼簿搜尋功能、創(chuàng)新性碼簿搜尋功能、及內(nèi)存更新。ACELP解碼器包含數(shù)項(xiàng)功能,諸如解碼適應(yīng)性碼簿、解碼增益、解碼創(chuàng)新性碼簿、解碼ISP、長(zhǎng)期預(yù)測(cè)濾波器(LTP濾波器)、組成性激勵(lì)功能、四個(gè)子幀的ISP的內(nèi)插、后處理、合成濾波器、解除強(qiáng)調(diào)及升頻取樣框來(lái)最終獲得語(yǔ)音輸出的低頻帶部分。語(yǔ)音輸出的高頻帶部分通過(guò)使用HB增益指數(shù)、VAD旗標(biāo)、及16kHz隨機(jī)激勵(lì)而產(chǎn)生。此外,HB合成濾波器的使用系接著帶通濾波器。進(jìn)一步細(xì)節(jié)請(qǐng)參考G.722.2的圖3。
[0004]此一方案在AMR-WB+已通過(guò)執(zhí)行單聲道低帶信號(hào)的后處理而提高。參考示出了AMR-WB+中的功能的圖7、圖8及圖9。圖7示出了音準(zhǔn)加強(qiáng)器700、低通濾波器702、高通濾波器704、音準(zhǔn)追蹤階段706及加法器708。這些框連接如圖7所示及由解碼信號(hào)饋送。
[0005]在低頻音準(zhǔn)加強(qiáng)中,使用二頻帶分解,及適應(yīng)性濾波只應(yīng)用至低頻帶。如此導(dǎo)致整個(gè)后處理,大部分鎖定目標(biāo)在接近該合成語(yǔ)音信號(hào)的第一諧波之頻率。圖7示出了二頻帶音準(zhǔn)加強(qiáng)器的框圖。在較高分支中,解碼信號(hào)通過(guò)高通濾波器704濾波來(lái)產(chǎn)生較高頻帶信號(hào)%。在較低分支中,解碼信號(hào)首先通過(guò)音準(zhǔn)加強(qiáng)器700處理,及然后經(jīng)由低通濾波器702濾波來(lái)獲得較低頻帶后處理信號(hào)(s_)。后處理解碼信號(hào)經(jīng)由該較低頻帶后處理信號(hào)與該較高頻帶信號(hào)相加獲得。音準(zhǔn)加強(qiáng)器的目的是減低在該解碼信號(hào)中的諧波間噪聲,該目的通過(guò)圖9第一行指示的具有轉(zhuǎn)移函式He的時(shí)變線性濾波器達(dá)成,及由圖9第二行的方程式描述。α是控制諧波間衰減的系數(shù)。T為輸入信號(hào)分/7)的音準(zhǔn)周期,及(η)為音準(zhǔn)加強(qiáng)器的輸出信號(hào)。參數(shù)T及α隨著時(shí)間改變,且通過(guò)音準(zhǔn)追蹤級(jí)706以數(shù)值α=1給定,由圖9第二行的方程式描述的濾波器增益在頻率I/ (2Τ)、3/ (2Τ)、5/ (2Τ)等也即在DC (OHz)與諧波頻率1/T、3/T、5/T等的中點(diǎn)恰為零。當(dāng)α趨近于零時(shí),如圖9第二行定義的由濾波器所產(chǎn)生的諧波間的衰減減少。當(dāng)α為零時(shí),濾波器無(wú)效用,且為全通。為了將后處理限于低頻區(qū),加強(qiáng)信號(hào)經(jīng)低通濾波來(lái)產(chǎn)生信號(hào)^ef,該信號(hào)加至高通濾波信號(hào)sH來(lái)獲得后處理合成信號(hào)Se。
[0006]相當(dāng)于圖7的例示說(shuō)明的另一配置在圖8例示說(shuō)明,圖8的配置免除高通濾波的需要。此點(diǎn)就圖9針對(duì)sE的第三方程式解說(shuō)。ΚΡ(η)為低通濾波器的脈沖響應(yīng),及hHP(n)為互補(bǔ)高通濾波器的脈沖響應(yīng)。然后,后處理信號(hào)sE(n)系由圖9的第三方程式給定。如此,后處理系相當(dāng)于從合成信號(hào)匆扣除已定標(biāo)低通濾波長(zhǎng)期誤差信號(hào)a.eu(n)。長(zhǎng)期預(yù)測(cè)濾波器的轉(zhuǎn)移函式系給定如圖9的末行指示。此種交替后處理配置在圖8中圖解。數(shù)值T通過(guò)在各個(gè)子幀所接收的閉路音準(zhǔn)滯后給定(分量音準(zhǔn)滯后系舍入至最近的整數(shù))。執(zhí)行檢查音準(zhǔn)加倍的簡(jiǎn)單追蹤。若于延遲T/2的標(biāo)準(zhǔn)化音準(zhǔn)相關(guān)性大于0.95,則值T/2用作為用于后處理的新音準(zhǔn)滯后。因子α通過(guò)a=0.5gp給定,限于α大于或等于零及小于或等于
0.5。gp為以O(shè)及I為界限的解碼音準(zhǔn)增益。于TCX模式中,α值被設(shè)定為零。具有25系數(shù)的線性相位有限脈沖響應(yīng)(FIR)低通濾波器以約500赫茲的截止頻率使用。濾波器延遲為12樣本。上分支須導(dǎo)入相對(duì)應(yīng)于在下分支處理延遲的延遲,來(lái)維持在執(zhí)行減法前兩個(gè)分支的信號(hào)的時(shí)間排齊。在AMR-WB+中的Fs=2x核心的取樣率。核心取樣率等于12800赫茲。故截止頻率等于500赫茲。已發(fā)現(xiàn)特別針對(duì)低延遲應(yīng)用,由線性相位FIR低通濾波器所導(dǎo)入的12樣本濾波器延遲促成編碼/解碼方案的總延遲。在編碼/解碼鏈中其它位置有其它系統(tǒng)性延遲來(lái)源,F(xiàn)IR濾波器延遲與其它來(lái)源累積。
【發(fā)明內(nèi)容】
[0007]本發(fā)明的一目的是提供改良`的音頻信號(hào)處理構(gòu)思,該構(gòu)思更適用于實(shí)時(shí)應(yīng)用或多向通訊景況,諸如行動(dòng)電話景況。
[0008]此目的通過(guò)根據(jù)權(quán)利要求1項(xiàng)的處理已解碼音頻信號(hào)的設(shè)備、或根據(jù)權(quán)利要求15項(xiàng)的處理已解碼音頻信號(hào)的方法、或根據(jù)權(quán)利要求16項(xiàng)的計(jì)算機(jī)程序而予達(dá)成。
[0009]本發(fā)明基于發(fā)現(xiàn)在已解碼信號(hào)的低音后濾波中的低通濾波器對(duì)總延遲的貢獻(xiàn)成問(wèn)題而須減少。為了達(dá)成此項(xiàng)目的,已濾波音頻信號(hào)在時(shí)域系未經(jīng)低通濾波,但在頻譜域經(jīng)低通濾波,諸如QMF定義域或任何其它頻譜域,例如MDCT定義域、快速傅利葉轉(zhuǎn)換(FFT)定義域等。已發(fā)現(xiàn)從頻譜域轉(zhuǎn)換至頻域,并且例如轉(zhuǎn)換至低分辨率頻域,諸如QMF定義域可以低延遲執(zhí)行,欲于頻譜域體現(xiàn)的濾波器的頻率選擇性,只可通過(guò)加權(quán)來(lái)自已濾波音頻信號(hào)的頻域表示型態(tài)的各個(gè)子帶信號(hào)而體現(xiàn)。因此頻率選擇特性的此種“影響”經(jīng)執(zhí)行而無(wú)任何系統(tǒng)性延遲,原因在于子帶信號(hào)的乘法或加權(quán)運(yùn)算不會(huì)遭致任何延遲。已濾波音頻信號(hào)及原先音頻信號(hào)的減法也系在頻譜域執(zhí)行。再者,較佳地執(zhí)行例如無(wú)論如何皆需要的額外操作,諸如頻譜帶復(fù)制解碼或立體聲或多聲道解碼在一個(gè)且同一 QMF域額外地執(zhí)行。頻時(shí)轉(zhuǎn)換只在解碼鏈的末端執(zhí)行來(lái)將最終產(chǎn)生的音頻信號(hào)帶回時(shí)域。如此,取決于應(yīng)用用途,當(dāng)不再要求在QMF域的額外處理操作時(shí),通過(guò)減法器產(chǎn)生的結(jié)果音頻信號(hào)可就此轉(zhuǎn)換回時(shí)域。但當(dāng)解碼算法在QMF域有額外處理操作時(shí),則頻譜時(shí)間轉(zhuǎn)換器并非連接至減法器輸出,反而連接至最末頻域處理裝置的輸出。
[0010]較佳地,用以濾波已解碼音頻信號(hào)的濾波器為長(zhǎng)期預(yù)測(cè)濾波器。再者,較佳頻譜表示型態(tài)為QMF表示型態(tài),額外地較佳頻率選擇性為低通特性。
[0011]但與長(zhǎng)期預(yù)測(cè)濾波器相異的任何其它濾波器、與QMF表示型態(tài)相異的任何其它頻譜表示型態(tài)、或與低通特性相異的任何其它頻率選擇性可用來(lái)獲得已解碼音頻信號(hào)的低延遲后處理。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0012]圖1A為依據(jù)一實(shí)施例用以處理已解碼音頻信號(hào)的設(shè)備的框圖;
[0013]圖1B為用以處理已解碼音頻信號(hào)的設(shè)備的一較佳實(shí)施例的框圖;
[0014]圖2A示出了頻率選擇特性作為低通特性;
[0015]圖2B示出了加權(quán)系數(shù)及相聯(lián)結(jié)的子帶;
[0016]圖2C示出了時(shí)/頻轉(zhuǎn)換器及隨后連接的用以施加加權(quán)系數(shù)至各個(gè)單獨(dú)子帶信號(hào)的加權(quán)器的串級(jí);
[0017]圖3示出了在圖8例示說(shuō)明的AMR-WB+中低通濾波器的頻率響應(yīng)中的脈沖響應(yīng);
[0018]圖4示出了脈沖響應(yīng)及頻率響應(yīng)轉(zhuǎn)換成QMF域;
[0019]圖5示出了用于32QMF子帶實(shí)例的加權(quán)器的加權(quán)因子;
[0020]圖6示出了針對(duì)16QMF頻帶的頻率響應(yīng)及相聯(lián)結(jié)的16加權(quán)因子;
[0021]圖7示出了 AMR-WB+的低頻音準(zhǔn)加強(qiáng)器的框圖;
[0022]圖8示出了 AMR-WB+的體現(xiàn)后處理配置;
[0023]圖9示出了圖8的實(shí)施方式的衍生 '及
[0024]圖10示出了依據(jù)一實(shí)施例的長(zhǎng)期預(yù)測(cè)濾波器的低延遲體現(xiàn)。
【具體實(shí)施方式】
[0025]圖1A例示說(shuō)明用以處理在線已解碼音頻信號(hào)100的設(shè)備。在線已解碼音頻信號(hào)100被輸入至濾波器102用以濾波該已解碼音頻信號(hào)來(lái)獲得的在線已濾波音頻信號(hào)104。濾波器102連接至?xí)r間頻譜轉(zhuǎn)換器級(jí)106,例示說(shuō)明為用于已濾波音頻信號(hào)的106a及用于在線已解碼音頻信號(hào)100的106b兩個(gè)各個(gè)時(shí)間頻譜轉(zhuǎn)換器。時(shí)間頻譜轉(zhuǎn)換器級(jí)106被配置為將該音頻信號(hào)及該已濾波音頻信號(hào)轉(zhuǎn)換成各自有多個(gè)子密碼有效期的相對(duì)應(yīng)頻譜表示型態(tài)。在圖1A中這以雙線表示,指示框106a、106b的輸出包含多個(gè)各個(gè)子帶信號(hào)而非單一信號(hào),如針對(duì)框106a、106b的輸入例不說(shuō)明。
[0026]處理設(shè)備額外包含加權(quán)器108,用以對(duì)框106a輸出的已濾波音頻信號(hào)執(zhí)行頻率選擇性加權(quán),執(zhí)行方式將各個(gè)子帶信號(hào)乘以各個(gè)加權(quán)系數(shù)來(lái)獲得在線已加權(quán)已濾波音頻信號(hào)110。
[0027]此外,設(shè)置減法器112。減法器被配置為執(zhí)行已加權(quán)已濾波音頻信號(hào)與由框106b所產(chǎn)生的該音頻信號(hào)的頻譜表示型態(tài)間的逐一子帶減法。[0028]此外,設(shè)置頻譜時(shí)間轉(zhuǎn)換器114。由框114所執(zhí)行的頻時(shí)轉(zhuǎn)換使得由減法器112所產(chǎn)生的結(jié)果音頻信號(hào)或從該結(jié)果音頻信號(hào)獲得的信號(hào)轉(zhuǎn)換成時(shí)域表示型態(tài)而獲得在線已處理已解碼音頻信號(hào)116。
[0029]雖然圖1A指示因時(shí)頻轉(zhuǎn)換及加權(quán)的延遲顯著低于因FIR濾波的延遲,但此點(diǎn)并非于全部情況下皆屬必要,原因在于其中QMF是絕對(duì)地必要的情況下,可避免FIR濾波的延遲及QMF的延遲累加。因此當(dāng)針對(duì)低音后濾波因時(shí)頻轉(zhuǎn)換加權(quán)的延遲甚至高于FIR濾波的延遲時(shí),本發(fā)明也有用。
[0030]圖1B示出看USAC解碼器或AMR-WB+解碼器的脈絡(luò)的本發(fā)明的較佳實(shí)施例。圖1B示出的設(shè)備包含ACELP解碼器級(jí)120、TCX解碼器級(jí)122及連接點(diǎn)124,在該處連接解碼器120、122的輸出。連接點(diǎn)124始于兩個(gè)各個(gè)分支。第一分支包含濾波器102,濾波器102較佳地被配置為由音準(zhǔn)滯后T設(shè)定的長(zhǎng)期預(yù)測(cè)濾波器,接著為適應(yīng)性增益α的放大器129。此外,第一分支包含時(shí)間頻譜轉(zhuǎn)換器106a,其較佳系體現(xiàn)為QMF分析濾波器組。再者,第一分支包含加權(quán)器108,其被配置為加權(quán)由QMF分析濾波器組106a所產(chǎn)生的子帶信號(hào)。
[0031]在第二分支中,已解碼音頻信號(hào)通過(guò)QMF分析濾波器組106b而轉(zhuǎn)換成頻譜域。
[0032]雖然各個(gè)QMF框106a、106b是例示說(shuō)明為兩個(gè)分開(kāi)組件,但須注意用于分析已濾波音頻信號(hào)及音頻信號(hào),并非必要要求有兩個(gè)各個(gè)的QMF分析濾波器組。取而代之,當(dāng)信號(hào)逐一地轉(zhuǎn)換時(shí),單一 QMF分析濾波器組及內(nèi)存即足。但用于極低延遲體現(xiàn),較佳系針對(duì)各個(gè)信號(hào)使用各個(gè)QMF分析濾波器組,讓單一 QMF框不會(huì)形成算法的瓶頸。
[0033]較佳地,轉(zhuǎn)換成頻譜域及轉(zhuǎn)換回時(shí)域通過(guò)算法執(zhí)行,具有針對(duì)正向及反向轉(zhuǎn)換的延遲小于具有頻率選擇性特性的時(shí)域中濾波的延遲。因此,轉(zhuǎn)換須具有總延遲小于關(guān)注的濾波器的延遲。特別有用者為低分辨率轉(zhuǎn)換,諸如以QMF為基礎(chǔ)的轉(zhuǎn)換,原因在于低頻率分辨率結(jié)果導(dǎo)致需要小型轉(zhuǎn)換窗,也即導(dǎo)致縮小的系統(tǒng)性延遲。較佳應(yīng)用用途只要求低分辨率轉(zhuǎn)換分解該信號(hào)成少于40個(gè)子帶,諸如32或只有16個(gè)子帶。但即便在時(shí)頻轉(zhuǎn)換及加權(quán)導(dǎo)入比低通濾波器更高的延遲的應(yīng)用中,由于下述事實(shí)而獲得優(yōu)點(diǎn),免除了其它處理程序所必然需要的低通濾波器與時(shí)間頻譜轉(zhuǎn)換的延遲累加。
[0034]但針對(duì)由于其它處理操作諸如重新取樣、SBR或MPS而無(wú)論如何皆要求時(shí)頻轉(zhuǎn)換的應(yīng)用,與由時(shí)頻轉(zhuǎn)換或頻時(shí)轉(zhuǎn)換所遭致的延遲無(wú)關(guān)地,獲得延遲減少,原因在于將濾波器體現(xiàn)“含括”入頻譜域,可完全節(jié)省時(shí)域?yàn)V波器延遲,由于下述事實(shí):執(zhí)行逐一子帶加權(quán)而無(wú)任何系統(tǒng)性延遲。
[0035]自適應(yīng)放大器129通過(guò)控制器130控制??刂破?30被配置為當(dāng)輸入信號(hào)為T(mén)CX解碼信號(hào)時(shí),設(shè)定放大器129的增益α為零。典型地,在切換音頻編解碼器諸如USAC或AMR-WB+中,在連接點(diǎn)124的已解碼信號(hào)典型地來(lái)自TCX解碼器122或來(lái)自ACELP解碼器120。因此有兩個(gè)解碼器120、122的已解碼輸出信號(hào)的時(shí)間多任務(wù)??刂破?30被配置為針對(duì)目前時(shí)間瞬間,決定該輸出信號(hào)來(lái)自TCX解碼信號(hào)或ACELP解碼信號(hào)。當(dāng)決定有TCX信號(hào)時(shí),適應(yīng)性增益α被設(shè)定為零,使得由組件102、109、106a、108所組成的第一分支不具任何意義。此點(diǎn)由于下述事實(shí),用在AMR-WB+或USAC的特定種類(lèi)的濾波只要求用在ACELP解碼信號(hào)。但當(dāng)執(zhí)行諧波濾波或音準(zhǔn)加強(qiáng)以外的其它后濾波體現(xiàn)時(shí),則取決于需求,可差異地設(shè)定可變?cè)鲆姒痢?br>
[0036]但當(dāng)控制器130決定目前可用信號(hào)乃ACELP解碼信號(hào)時(shí),放大器129的值被設(shè)定為α的正確值,典型地為O至0.5。于此種情況下,第一分支為有意義,減法器112的輸出信號(hào)實(shí)質(zhì)上與在連接點(diǎn)124的原先已解碼音頻信號(hào)有別。[0037]用在解碼器120及放大器128的音準(zhǔn)信息(音準(zhǔn)滯后及增益α )可來(lái)自該解碼器及/或?qū)S靡魷?zhǔn)追蹤器。較佳地,信息來(lái)自該解碼器,并且然后通過(guò)專(zhuān)用音準(zhǔn)追蹤器/該已解碼信號(hào)的長(zhǎng)期預(yù)測(cè)分析而重新處理(提煉)。
[0038]由減法器112執(zhí)行每帶或每子帶減法所產(chǎn)生的結(jié)果音頻信號(hào)并不立刻執(zhí)行回到時(shí)域。取而代之,該信號(hào)前傳至SBR解碼器模塊128。模塊128連接至單聲-立體聲或單聲道-多聲道解碼器,諸如MPS解碼器131,在該處MPS表示MPEG環(huán)繞。
[0039]典型地,頻帶數(shù)目通過(guò)頻譜帶寬復(fù)制解碼器提升,通過(guò)在框128輸出的額外三個(gè)行132指示。
[0040]再者,輸出數(shù)目通過(guò)框131額外提升???31從在框129輸出的單聲道信號(hào)產(chǎn)生例如五聲道信號(hào)或任何其它有二或更多聲道的信號(hào)。例示說(shuō)明具有左聲道L、右聲道R、中聲道C、左環(huán)繞聲道Ls及右環(huán)繞聲道Rs的五聲道景況。因此針對(duì)各個(gè)單獨(dú)聲道存在有頻譜時(shí)間轉(zhuǎn)換器114,換言的,于圖1B中存在有五倍,來(lái)將各個(gè)單獨(dú)聲道信號(hào)從頻譜域,在圖1B實(shí)例中為QMF域,轉(zhuǎn)換回于框114輸出的時(shí)域。再度,并非必要為多個(gè)各個(gè)頻譜時(shí)間轉(zhuǎn)換器。也可有單一頻譜時(shí)間轉(zhuǎn)換器,其逐一地處理轉(zhuǎn)換。但當(dāng)要求極低延遲體現(xiàn)時(shí),較佳系針對(duì)各個(gè)頻道使用各個(gè)頻譜時(shí)間轉(zhuǎn)換器。
[0041]本發(fā)明的優(yōu)點(diǎn)在于由低音后濾波器所導(dǎo)入的延遲,及更明確言之,由低通濾波器FIR濾波器所導(dǎo)入的延遲減少。因此任一種頻率選擇性濾波就QMF所要求的延遲,或概略言的,就時(shí)/頻轉(zhuǎn)換而言不會(huì)導(dǎo)入額外延遲。
[0042]當(dāng)無(wú)論如何要求QMF或一般而言要求時(shí)-頻轉(zhuǎn)換時(shí),本發(fā)明特別優(yōu)良例如在圖1B的情況,在該處無(wú)論如何SBR功能及MPS功能系在頻譜域執(zhí)行。在該處要求QMF的替代體現(xiàn)為當(dāng)以已解碼信號(hào)執(zhí)行重新取樣時(shí)的景況,并且當(dāng)為了重新取樣目的而要求具有不同濾波器組聲道數(shù)目的QMF分析濾波器組及QMF合成濾波器組時(shí)的景況。
[0043]此外,由于二信號(hào)也即TCX及ACELP信號(hào)現(xiàn)在具有相同延遲,故ACELP與TCX間維持恒定幀。
[0044]帶寬延展解碼器129的功能以細(xì)節(jié)描述于IS0/IEC⑶23003-3章節(jié)6.5。多聲道解碼器131的功能以細(xì)節(jié)描述于IS0/IEC⑶23003-3章節(jié)6.11。TCX解碼器及ACELP解碼器背后的功能系以細(xì)節(jié)描述于IS0/IEC CD23003-3區(qū)塊6.12至6.17。
[0045]隨后,討論圖2Α至圖2C來(lái)例示說(shuō)明示意實(shí)例。圖2Α例示說(shuō)明示意低通濾波器的經(jīng)頻率選擇的頻率響應(yīng)。
[0046]圖2Β例示說(shuō)明針對(duì)圖2Α所指的子帶數(shù)目或子帶的加權(quán)指數(shù)。在圖2Α的示意情況下,子帶I至6具有等于I的加權(quán)系數(shù),也即無(wú)加權(quán),而子帶7至10具有遞減的加權(quán)系數(shù),及子帶11至11具有零的加權(quán)系數(shù)。
[0047]時(shí)間頻譜轉(zhuǎn)換器諸如106a及隨后連接器加權(quán)器108的串級(jí)的相對(duì)應(yīng)體現(xiàn)例示說(shuō)明于圖2C。各個(gè)子帶1、2、…、14輸入以%、W2、…W14指示的各個(gè)加權(quán)框內(nèi)。加權(quán)器108由該子帶信號(hào)的各次取樣乘以加權(quán)系數(shù)而施加圖2B的該表的加權(quán)因子至各個(gè)單獨(dú)子帶信號(hào)。然后,于加權(quán)器的輸出端,存在有已加權(quán)子帶信號(hào),然后輸入圖1A的減法器112,減法器112額外地執(zhí)行于頻譜域的減法。[0048]圖3例示說(shuō)明該AMR-WB+編碼器于圖8的低通濾波器的脈沖響應(yīng)及頻率響應(yīng)。于時(shí)域的低通濾波器1? (η)在AMR-WB+由下列系數(shù)定義。
[0049]a[13] = [0.088250,0.086410,0.081074,0.072768,0.062294,0.050623,0.038774,0.027692,0.018130, 0.010578, 0.005221,0.001946,0.000385];
[0050]hLP (n) =a (13_n)針對(duì) n 為 I 至 12
[0051]hLP (n) =a (n_12)針對(duì) n 為 13 至 25
[0052]圖3例示說(shuō)明的脈沖響應(yīng)及頻率響應(yīng)針對(duì)一種情況,當(dāng)濾波器施加至12.8kHz的時(shí)域信號(hào)樣本時(shí)。則所產(chǎn)生的延遲為12樣本延遲,也即0.9375毫秒。
[0053]圖3例示說(shuō)明的濾波器具有于QMF域的頻率響應(yīng),于該處各個(gè)QMF具有400赫茲分辨率。32QMF頻帶涵蓋于12.8kHz的信號(hào)樣本的帶寬。頻率響應(yīng)及QMF域例示說(shuō)明于圖4。
[0054]具有400赫茲分辨率的幅值頻率響應(yīng)形成當(dāng)施加低通濾波器于QMF域時(shí)的權(quán)值。加權(quán)器108的權(quán)值系用于圖5摘述的前述參數(shù)實(shí)例。
[0055]這些權(quán)值可計(jì)算如下:
[0056]ff=abs (DFT (hLP (n),64)),在該處DFT (x,N)代表信號(hào)x的長(zhǎng)度N的離散富利葉變換。若X比N更短,則信號(hào)以N減X個(gè)零的大小填塞。DFT的長(zhǎng)度N系相對(duì)應(yīng)于兩倍QMF子帶數(shù)目。因1^ (η)乃實(shí)際系數(shù)信號(hào),W示出了頻率O與尼奎斯特(Nysquist)頻率間的厄爾米辛(Hermitian)對(duì)稱(chēng)及Ν/2頻率系數(shù)。
[0057]通過(guò)由分析濾波器 系數(shù)的頻率響應(yīng),其相對(duì)應(yīng)于約2*pi*10/256的截止頻率。此點(diǎn)用來(lái)設(shè)計(jì)濾波器。為了節(jié)省若干ROM的耗用及有鑒于定點(diǎn)體現(xiàn),然后這些系數(shù)經(jīng)量化以14位寫(xiě)成。
[0058]然后在QMF域的濾波執(zhí)行如下:
[0059]Y=于QMF域的后處理信號(hào)
[0060]X=于來(lái)自核心編碼器的QMF信號(hào)中的已解碼信號(hào)
[0061]E=于TD產(chǎn)生的欲從X移除的諧波間噪聲
[0062]Y (k)=X (k) -V (k).E (k),針對(duì) k 為 I 至 32
[0063]圖6例示說(shuō)明又一實(shí)例,在該處QMF具有800赫茲分辨率,故16頻帶涵蓋于
12.SkHz取樣的信號(hào)的全帶寬。然后系數(shù)W如圖6指示在線圖的下方。濾波以就圖6討論的相同方式進(jìn)行,但k只有I至16。
[0064]在16頻帶QMF中的該濾波器的頻率響應(yīng)作圖為如圖6的例示說(shuō)明。
[0065]圖10例示說(shuō)明于圖1B示出了于102的長(zhǎng)期預(yù)測(cè)濾波器的更進(jìn)一步加強(qiáng)。
[0066]更明確言之,針對(duì)低延遲體現(xiàn),圖9中第三行至末行的該項(xiàng)兔/? + 1)有問(wèn)題。原因
在于相對(duì)于真實(shí)時(shí)間n,T樣本系在未來(lái)。因此為了解決此種情況,在該處因低延遲體現(xiàn),尚
未能獲得未來(lái)數(shù)值,故與《 + 1)以^置換,如圖10指示。然后,長(zhǎng)期預(yù)測(cè)濾波器估算先前技
術(shù)的長(zhǎng)期預(yù)測(cè),但使用較少延遲或零延遲。業(yè)已發(fā)現(xiàn)估算為夠好,相對(duì)于減少延遲的增益系比音準(zhǔn)加強(qiáng)的些微損耗更優(yōu)異。
[0067]雖然已經(jīng)以設(shè)備脈絡(luò)描述若干方面,但顯然這些方面也表示相對(duì)應(yīng)方法的描述,在該處一框或一裝置相對(duì)應(yīng)于一方法步驟或一方法步驟的特征。同理,以方法步驟的脈絡(luò)描述的構(gòu)面也表示相對(duì)應(yīng)設(shè)備的相對(duì)應(yīng)框或項(xiàng)或特征結(jié)構(gòu)的描述。
[0068]取決于某些體現(xiàn)要求,本發(fā)明的實(shí)施例可在硬件或在軟件中體現(xiàn)。體現(xiàn)可使用數(shù)字儲(chǔ)存媒體執(zhí)行,例如軟盤(pán)、DVD、CD、ROM、PROM、EPROM、EEPROM或閃存,可電子讀取控制信號(hào)儲(chǔ)存在其上,這些信號(hào)與(或可與)可編程計(jì)算機(jī)系統(tǒng)協(xié)作,因而執(zhí)行各個(gè)方法。
[0069]依據(jù)本發(fā)明的若干實(shí)施例包含具有可電子式讀取控制信號(hào)的非過(guò)渡數(shù)據(jù)載體,這些控制信號(hào)可與可編程計(jì)算機(jī)系統(tǒng)協(xié)作,因而執(zhí)行本文所述方法中的一者。
[0070]大致言之,本發(fā)明的實(shí)施例可體現(xiàn)為具有程序代碼的計(jì)算機(jī)程序產(chǎn)品,該程序代碼當(dāng)計(jì)算機(jī)程序產(chǎn)品在計(jì)算機(jī)上運(yùn)行時(shí)可執(zhí)行該等方法中的一者。該程序代碼例如可儲(chǔ)存在機(jī)器可讀取載體上。
[0071]其它實(shí)施例包含儲(chǔ)存在機(jī)器可讀取載體上的用以執(zhí)行本文所述方法中的一者的計(jì)算機(jī)程序。
[0072]換言的,因此,本發(fā)明方法的實(shí)施例為一種具有一程序代碼的計(jì)算機(jī)程序,該程序代碼系當(dāng)該計(jì)算機(jī)程序于一計(jì)算機(jī)上運(yùn)行時(shí)用以執(zhí)行本文所述方法中的一者。
[0073]因此,本發(fā)明方法的又一實(shí)施例為數(shù)據(jù)載體(或數(shù)字儲(chǔ)存媒體或計(jì)算機(jī)可讀取媒體)包含用以執(zhí)行本文所述方法中的一者的計(jì)算機(jī)程序記錄于其上。
[0074]因此,本發(fā)明方法的又一實(shí)施例為表示用以執(zhí)行本文所述方法中的一者的計(jì)算機(jī)程序的數(shù)據(jù)串流或信號(hào)序列。數(shù)據(jù)串流或信號(hào)序列例如可經(jīng)組配來(lái)通過(guò)數(shù)據(jù)通訊連接,例如通過(guò)因特網(wǎng)轉(zhuǎn)移。
[0075]又一實(shí)施例包含處理構(gòu)件例如計(jì)算機(jī)或可編程邏輯裝置,其被配置為或適用于執(zhí)行本文所述方法中的一者。
[0076]又一實(shí)施例包含一計(jì)算機(jī),其上安裝有用以執(zhí)行本文所述方法中的一者的計(jì)算機(jī)程序。
[0077]在若干實(shí)施例中,可編程邏輯裝置(例如可現(xiàn)場(chǎng)編程門(mén)陣列)可用來(lái)執(zhí)行本文描述的方法的部分或全部功能。于若干實(shí)施例中,可現(xiàn)場(chǎng)編程門(mén)陣列可與微處理器協(xié)作來(lái)執(zhí)行本文所述方法中的一者。大致上該等方法較佳通過(guò)任何硬件裝置執(zhí)行。
[0078]前述實(shí)施例僅供舉例說(shuō)明本發(fā)明的原理。須了解,本文所述配置及細(xì)節(jié)的修改及變化將為本領(lǐng)域技術(shù)人員顯而易見(jiàn)。因此,旨在僅受審查中的權(quán)利要求所限而非受由以描述及解說(shuō)本文實(shí)施例所呈示的特定細(xì)節(jié)所限。
【權(quán)利要求】
1.一種用以處理一已解碼音頻信號(hào)(100)的設(shè)備,所述設(shè)備包含: 用以濾波所述已解碼音頻信號(hào)來(lái)獲得一已濾波音頻信號(hào)(104)的一濾波器(102); 用以將所述已解碼音頻信號(hào)和所述已濾波音頻信號(hào)轉(zhuǎn)換成相對(duì)應(yīng)的頻譜表示型態(tài)的一時(shí)間頻譜轉(zhuǎn)換器級(jí)(106),其中,各個(gè)頻譜表示型態(tài)均具有多個(gè)子帶信號(hào); 用以通過(guò)將子帶信號(hào)乘以各個(gè)加權(quán)系數(shù)執(zhí)行所述已濾波音頻信號(hào)的所述頻譜表示型態(tài)的頻率選擇性加權(quán)來(lái)獲得一已加權(quán)已濾波音頻信號(hào)的一加權(quán)器(108); 用以執(zhí)行所述已加權(quán)已濾波音頻信號(hào)與所述已解碼音頻信號(hào)的所述頻譜表示型態(tài)之間的一逐一子帶減法以獲得一結(jié)果音頻信號(hào)的一減法器(112);以及 用以將所述結(jié)果音頻信號(hào)或從所述結(jié)果音頻信號(hào)獲得的一信號(hào)轉(zhuǎn)換成一時(shí)域表示型態(tài)來(lái)獲得一已處理已解碼音頻信號(hào)(116)的一頻譜時(shí)間轉(zhuǎn)換器(114)。
2.根據(jù)權(quán)利要求1所述的設(shè)備,進(jìn)一步包含一帶寬增強(qiáng)解碼器(129)或者一單聲-立體聲或一單聲道-多聲道解碼器(131)來(lái)計(jì)算從所述結(jié)果音頻信號(hào)獲得的所述信號(hào), 其中,所述頻譜時(shí)間轉(zhuǎn)換器(114)被配置為不轉(zhuǎn)換所述結(jié)果音頻信號(hào),而是將從所述結(jié)果音頻信號(hào)獲得的所述信號(hào)轉(zhuǎn)換成所述時(shí)域,使得在由所述時(shí)間頻譜轉(zhuǎn)換器級(jí)(106)定義的相同頻譜域中執(zhí)行由所述帶寬增強(qiáng)解碼器(129)或者所述單聲-立體聲或單聲道-多聲道解碼器(131)進(jìn)行的全部處理。
3.根據(jù)權(quán)利要求1或2所述的設(shè)備, 其中,所述已解碼音頻信號(hào)為一代數(shù)碼激勵(lì)線性預(yù)測(cè)(ACELP)已解碼輸出信號(hào),以及 其中,所述濾波器(102)為由音準(zhǔn)信息控制的一長(zhǎng)期預(yù)測(cè)濾波器。
4.根據(jù)以上任一權(quán)利要求所述的設(shè)備, 其中,所述加權(quán)器(108)被配置為加權(quán)所述已濾波音頻信號(hào),使得較低的頻率子帶與較高的頻率子帶相比被衰減得較少或不被衰減,由此所述頻率選擇性加權(quán)將一低通特性施加給所述已濾波音頻信號(hào)。
5.根據(jù)以上任一權(quán)利要求所述的設(shè)備, 其中,所述時(shí)間頻譜轉(zhuǎn)換器級(jí)(106)和所述頻譜時(shí)間轉(zhuǎn)換器(114)被配置為分別實(shí)現(xiàn)一正交鏡像濾波器(QMF)分析濾波器組和一正交鏡像濾波器合成濾波器組。
6.根據(jù)以上任一權(quán)利要求所述的設(shè)備, 其中,所述減法器(112)被配置為從所述音頻信號(hào)的相對(duì)應(yīng)的子帶信號(hào)中扣除所述已加權(quán)已濾波音頻信號(hào)的一子帶信號(hào)來(lái)獲得所述結(jié)果音頻信號(hào)的一子帶,所述這些子帶屬于相同濾波器組聲道。
7.根據(jù)以上任一權(quán)利要求所述的設(shè)備, 其中,所述濾波器(102)被配置為執(zhí)行所述音頻信號(hào)與至少在時(shí)間上位移一音準(zhǔn)周期的音頻信號(hào)的一加權(quán)組合。
8.根據(jù)權(quán)利要求7所述的設(shè)備, 其中,所述濾波器(102)被配置為通過(guò)只組合所述音頻信號(hào)與存在于較早時(shí)間瞬間的所述音頻信號(hào)來(lái)執(zhí)行所述加權(quán)組合。
9.根據(jù)以上任一權(quán)利要求所述的設(shè)備, 其中,所述頻譜時(shí)間轉(zhuǎn)換器(114)具有相對(duì)于所述時(shí)間頻譜轉(zhuǎn)換器級(jí)(106)的一不同數(shù)目的輸入聲道,以獲得一樣本率轉(zhuǎn)換,其中,當(dāng)?shù)剿鲱l譜時(shí)間轉(zhuǎn)換器的所述輸入聲道的數(shù)目高于所述時(shí)間頻譜轉(zhuǎn)換器級(jí)的輸出聲道的數(shù)目時(shí)獲得一升頻取樣;并且其中,當(dāng)?shù)剿鲱l譜時(shí)間轉(zhuǎn)換器的所述輸入聲道的數(shù)目小于所述時(shí)間頻譜轉(zhuǎn)換器級(jí)的輸出聲道的數(shù)目時(shí)獲得一降頻取樣。
10.根據(jù)以上任一權(quán)利要求所述的設(shè)備, 用以在一第一時(shí)間部分提供所述已解碼音頻信號(hào)的一第一解碼器(120); 用以在一不同的第二時(shí)間部分提供另一已解碼音頻信號(hào)的一第二解碼器(122); 連接至所述第一解碼器(120)及所述第二解碼器(122)的一第一處理分支; 連接至所述第一解碼器(120)及所述第二解碼器(122)的一第二處理分支; 其中,所述第二處理分支包含所述濾波器(102)及所述加權(quán)器(108),并且另外地,包含一可控制式增益級(jí)(129)和一控制器(130),其中,所述控制器(130)被配置為將所述增益級(jí)(129)的一增益設(shè)定至針對(duì)所述第一時(shí)間部分的一第一值以及設(shè)定至針對(duì)所述第二時(shí)間部分的一第二值或設(shè)定至零,所述第二值低于所述第一值。
11.根據(jù)以上任一權(quán)利要求所述的設(shè)備,進(jìn)一步包含用以提供一音準(zhǔn)滯后并用以基于所述音準(zhǔn)滯后作為所述音準(zhǔn)信息來(lái)設(shè)定所述濾波器(102)的一音準(zhǔn)追蹤器。
12.根據(jù)權(quán)利要求10或11所述的設(shè)備,其中,所述第一解碼器(120)被配置為用以提供所述音準(zhǔn)信息或用以設(shè)定所述濾波器(102)的所述音準(zhǔn)信息的一部分。
13.根據(jù)權(quán)利要求10、11或12中任一項(xiàng)所述的設(shè)備,其中,所述第一處理分支中的一輸出端和所述第二處理分支中的一輸出端連接至所述減法器(112)的輸入端。
14.根據(jù)以上任一權(quán)利要求所述的設(shè)備,其中,所述已解碼音頻信號(hào)由包括在所述設(shè)備的一 ACELP解碼器(120)提供,以及 其中,所述設(shè)備進(jìn)一步包含被實(shí)現(xiàn)為一轉(zhuǎn)換編碼激勵(lì)(TCX)解碼器的另一解碼器(122)。
15.一種處理一已解碼音頻信號(hào)(100)的方法,所述方法包含: 濾波(102)所述已解碼音頻信號(hào)來(lái)獲得一已濾波音頻信號(hào); 將所述已解碼音頻信號(hào)和所述已濾波音頻信號(hào)轉(zhuǎn)換成(106)相對(duì)應(yīng)的頻譜表示型態(tài),其中,各個(gè)頻譜表示型態(tài)均具有多個(gè)子帶信號(hào); 通過(guò)將子帶信號(hào)乘以各個(gè)加權(quán)系數(shù)來(lái)執(zhí)行(108)所述已濾波音頻信號(hào)的所述頻率選擇性加權(quán)以獲得一已加權(quán)已濾波音頻信號(hào); 執(zhí)行(112)所述已加權(quán)已濾波音頻信號(hào)與所述已解碼音頻信號(hào)的所述頻譜表示型態(tài)之間的一逐一子帶減法以獲得一結(jié)果音頻信號(hào);以及 將所述結(jié)果音頻信號(hào)或從所述結(jié)果音頻信號(hào)獲得的一信號(hào)轉(zhuǎn)換成(114)一時(shí)域表示型態(tài)來(lái)獲得一已處理已解碼音頻信號(hào)(116)。
16.一種具有一程序代碼的計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在一計(jì)算機(jī)上運(yùn)行時(shí),所述程序代碼用以執(zhí)行根據(jù)權(quán)利要求15的處理一已解碼音頻信號(hào)的方法。
【文檔編號(hào)】G10L19/012GK103503061SQ201280015997
【公開(kāi)日】2014年1月8日 申請(qǐng)日期:2012年2月10日 優(yōu)先權(quán)日:2011年2月14日
【發(fā)明者】紀(jì)堯姆·福奇斯, 拉爾夫·蓋爾, 馬庫(kù)斯·施內(nèi)爾, 埃曼努埃爾·拉維利, 斯特凡·多赫拉 申請(qǐng)人:弗蘭霍菲爾運(yùn)輸應(yīng)用研究公司