專利名稱:基于復(fù)指數(shù)調(diào)制的濾波器組的高級(jí)處理和自適應(yīng)時(shí)間信號(hào)傳送方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻源編碼系統(tǒng),但是同樣的方法也可應(yīng)用于許多其他技術(shù)領(lǐng)域中。介紹了可用于利用立體聲屬性的參數(shù)表示的音頻編碼系統(tǒng)的不同技術(shù)。
背景技術(shù):
本發(fā)明涉及音頻信號(hào)的立體聲聲像的參數(shù)編碼。用于描述立體聲聲像屬性的典型參數(shù)是聲道間強(qiáng)度差異(IID)、聲道間時(shí)間差異(ITD)和聲道間相干(IC)。為了基于這些參數(shù)重建立體聲聲像,要求一種能夠根據(jù)IC參數(shù)重建兩個(gè)聲道間的正確相關(guān)級(jí)別的方法。這是通過去相關(guān)方法來實(shí)現(xiàn)的。
有幾種創(chuàng)建去相關(guān)后的信號(hào)的方法可用。理想情況下,要求具有全通頻率響應(yīng)的線性時(shí)不變(LTI)函數(shù)。用于實(shí)現(xiàn)這一點(diǎn)的一種明顯方法是通過使用恒定延遲。但是,使用延遲或任何其他LTI全通函數(shù),將會(huì)導(dǎo)致加上未經(jīng)處理的信號(hào)后的非全通響應(yīng)。在延遲的情況下,結(jié)果將會(huì)是典型梳狀濾波器。梳狀濾波器通常給出不合需要的“金屬”聲音,即使立體聲加寬效果有效,該聲音也會(huì)大大降低原始聲音的自然度。
現(xiàn)有技術(shù)還已知通過沿頻率軸向IID值添加隨機(jī)序列來生成去相關(guān)后的信號(hào)的頻域方法,其中不同序列用于不同音頻聲道。通過隨機(jī)序列修改進(jìn)行的頻域去相關(guān)的一個(gè)問題是引入了前回聲。主觀測(cè)試表明對(duì)于非靜止信號(hào),前回聲比起后回聲來惱人得多,已確立的心理聲學(xué)原理也支持這一點(diǎn)。此問題可通過就瞬態(tài)內(nèi)容而言針對(duì)信號(hào)特性而動(dòng)態(tài)自適應(yīng)變換尺寸來減小。但是,切換變換尺寸始終是硬(即二元)判決,它影響整個(gè)信號(hào)帶寬并且難以用魯棒的方式來實(shí)現(xiàn)。
美國專利申請(qǐng)公布US2003/0219130A1公開了基于相干的音頻編碼和合成。具體而言,通過為每個(gè)臨界頻帶修改聽覺情景參數(shù),從單聲道(mono)音頻信號(hào)合成聽覺情景,所述參數(shù)例如是臨界頻帶內(nèi)的每個(gè)子頻帶的耳間級(jí)別差異(ILD)和/或耳間時(shí)間差異(ITD),其中修改是基于臨界頻帶的平均估計(jì)相干的?;谙喔傻男薷漠a(chǎn)生了具有對(duì)象寬度的聽覺情景,這精確地匹配了原始輸入聽覺情景中的對(duì)象的寬度。立體聲參數(shù)是公知的BCC參數(shù),其中BCC代表技術(shù)心理聲學(xué)編碼(binaural cue coding)。當(dāng)生成兩個(gè)不同的去相關(guān)后的輸出聲道時(shí),由離散付立葉變換所獲得的頻率系數(shù)被一起聚集在單個(gè)臨界頻帶中?;诼暤篱g相干測(cè)量,加權(quán)因子被乘以偽隨機(jī)序列,該序列優(yōu)選地被選擇為使得對(duì)于所有臨界頻帶方差大致恒定,并且在每個(gè)臨界頻帶內(nèi)平均值為0。相同的序列適用于每個(gè)不同幀的頻譜系數(shù)。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用于參數(shù)性編碼的多聲道信號(hào)的解碼概念或用于生成這種信號(hào)的編碼概念,這種信號(hào)產(chǎn)生良好的音頻質(zhì)量和良好的編碼效率。
此目的是通過用于根據(jù)權(quán)利要求1的用于生成去相關(guān)信號(hào)的裝置、根據(jù)權(quán)利要求13的多聲道解碼器、根據(jù)權(quán)利要求20的生成去相關(guān)信號(hào)的方法、根據(jù)權(quán)利要求21的多聲道解碼方法、根據(jù)權(quán)利要求22的對(duì)立體聲信號(hào)編碼的裝置或根據(jù)權(quán)利要求26的對(duì)立體聲信號(hào)編碼的方法或者根據(jù)權(quán)利要求27的計(jì)算機(jī)程序來實(shí)現(xiàn)的。
本發(fā)明基于在使用混響濾波器(reverberation filter)時(shí)在解碼側(cè)發(fā)現(xiàn)獲得一個(gè)用于基于輸入單聲道信號(hào)生成多聲道信號(hào)的第一和第二聲道的良好的去相關(guān)信號(hào),該混響濾波器向輸入信號(hào)引入了整數(shù)延遲或者優(yōu)選地引入了分?jǐn)?shù)延遲。重要的是,此混響濾波器不被應(yīng)用到整個(gè)輸入信號(hào)。相反,幾個(gè)混響濾波器被應(yīng)用到原始輸入信號(hào)即單聲道信號(hào)的幾個(gè)子帶,以便當(dāng)應(yīng)用付立葉變換時(shí),利用混響濾波器進(jìn)行的混響濾波不被應(yīng)用于時(shí)域或頻域中,即所到達(dá)的域中。發(fā)明性地,利用混響濾波器為子帶進(jìn)行的混響濾波是在子帶域中單獨(dú)執(zhí)行的。
子帶信號(hào)包括至少兩個(gè)子帶采樣的序列,子帶采樣的序列代表子帶信號(hào)的帶寬,該帶寬小于輸入信號(hào)的帶寬。顯然,子帶信號(hào)的頻率帶寬高于歸因于由付立葉變換獲得的頻率系數(shù)的頻率帶寬。子帶信號(hào)優(yōu)選地由濾波器組生成,該濾波器組例如具有32或64個(gè)濾波器組信道,而對(duì)于同一示例,F(xiàn)FT將會(huì)具有1.024或2.048個(gè)頻率系數(shù),即頻率信道。
子帶信號(hào)可以是通過對(duì)一批輸入信號(hào)采樣進(jìn)行濾波而獲得的子帶信號(hào)?;蛘?,子帶濾波器組也可被連續(xù)應(yīng)用,而沒有按批進(jìn)行的處理。但是對(duì)于本發(fā)明按批進(jìn)行的處理是優(yōu)選的。
由于混響濾波不被應(yīng)用到整個(gè)信號(hào),而是按照子帶應(yīng)用的,所以避免了由梳狀濾波導(dǎo)致的“金屬”聲。
當(dāng)子帶的兩個(gè)連續(xù)子帶采樣之間的采樣周期對(duì)于解碼器端的良好聲音印象來說太大時(shí),在混響濾波器中最好使用分?jǐn)?shù)延遲,例如子帶信號(hào)的采樣周期的0.1至0.9之間的延遲,并且最好是子帶信號(hào)的采樣周期的0.2至0.8之間的延遲。注意,在臨界采樣情況下,當(dāng)利用具有64個(gè)濾波器組信道的濾波器組生成64個(gè)子帶信號(hào)時(shí),子帶信號(hào)中的采樣周期比原始輸入信號(hào)的采樣周期大64倍。
這里要注意延遲是混響設(shè)備中使用的濾波過程的不可缺少的部分。輸出信號(hào)由輸入信號(hào)的多個(gè)延遲后的版本構(gòu)成。最好將信號(hào)延遲子帶采樣周期的若干分之幾,以便在子帶域中實(shí)現(xiàn)良好的混響設(shè)備。
在本發(fā)明的優(yōu)選實(shí)施例中,由每個(gè)子帶中的每個(gè)混響濾波器引入的延遲以及優(yōu)選地分?jǐn)?shù)延遲對(duì)于所有子帶是相等的。然而,對(duì)于每個(gè)子帶,濾波器系數(shù)是不同的。優(yōu)選使用IIR濾波器。根據(jù)實(shí)際情形,可利用收聽測(cè)試來經(jīng)驗(yàn)地確定不同濾波器的分?jǐn)?shù)延遲和濾波器系數(shù)。
由混響濾波器組進(jìn)行濾波的子帶構(gòu)成去相關(guān)信號(hào),該去相關(guān)信號(hào)將被與原始輸入信號(hào)即單聲道信號(hào)相混合,以獲得解碼后的左聲道和解碼后的右聲道。去相關(guān)信號(hào)與原始信號(hào)的這一混合是基于與參數(shù)性編碼的信號(hào)一起傳輸?shù)穆暤篱g相干參數(shù)來執(zhí)行的。為了獲得不同的左聲道和右聲道,即不同的第一和第二聲道,將去相關(guān)信號(hào)與單聲道信號(hào)混合以獲得第一輸出聲道與將去相關(guān)信號(hào)與單聲道信號(hào)混合以獲得第二輸出聲道是不同的。
為了在編碼側(cè)獲得高效效率,利用立體聲參數(shù)集合的自適應(yīng)式確定,而執(zhí)行多聲道編碼。為此,編碼器除了包括用于計(jì)算單聲道信號(hào)的裝置以及用于生成立體聲參數(shù)集合的裝置外,還包括用于確定左聲道和右聲道的后續(xù)部分的立體聲參數(shù)集合的有效性的裝置。優(yōu)選地,該用于確定的裝置可操作以在確定立體聲參數(shù)集合不再有效時(shí)激活所述用于生成的裝置,以便為開始于第二時(shí)間邊界處的左聲道和右聲道的部分計(jì)算第二立體聲參數(shù)集合。此第二時(shí)間邊界也是通過所述確定有效性的裝置來確定的。
于是編碼后的輸出信號(hào)包括單聲道信號(hào),第一立體聲參數(shù)集合和與第一參數(shù)集合相關(guān)聯(lián)的第一時(shí)間邊界以及第二立體聲參數(shù)集合和與第二立體聲參數(shù)集合相關(guān)聯(lián)的第二時(shí)間邊界。在解碼側(cè),解碼器將會(huì)使用有效立體聲參數(shù)集合,直到達(dá)到新的時(shí)間邊界。當(dāng)達(dá)到此新的時(shí)間邊界時(shí),利用新的立體聲參數(shù)集合執(zhí)行解碼操作。
與現(xiàn)有技術(shù)方法(即執(zhí)行按批進(jìn)行的處理,因而執(zhí)行立體聲參數(shù)集合的按批確定)相比,所發(fā)明的自適應(yīng)地確定編碼側(cè)所確定的不同時(shí)間邊界的立體聲參數(shù)集合的方式一方面提供了高編碼效率,另一方面提供了高編碼質(zhì)量。這是因?yàn)閷?duì)于相對(duì)靜止的信號(hào),相同的立體聲參數(shù)集合可用于許多批的單聲道信號(hào)采樣,而不會(huì)引入可聽誤差。另一方面,當(dāng)考慮非靜止信號(hào)時(shí),所發(fā)明的自適應(yīng)立體聲參數(shù)確定提供了增大的時(shí)間分辨率,以便每個(gè)信號(hào)部分具有其最優(yōu)立體聲參數(shù)集合。
本發(fā)明通過用混響單元作為去相關(guān)器,其用濾波器組中的分?jǐn)?shù)延遲線實(shí)現(xiàn),并且利用去相關(guān)后的混響信號(hào)的自適應(yīng)級(jí)別調(diào)整,從而提供了對(duì)現(xiàn)有技術(shù)問題的解決方案。
以下將概述本發(fā)明的幾個(gè)方面。
本發(fā)明的一個(gè)方面是用于通過以下步驟延遲信號(hào)的方法通過復(fù)數(shù)濾波器組的一解析部分對(duì)實(shí)數(shù)值時(shí)域信號(hào)進(jìn)行濾波;修改從濾波獲得的復(fù)值子帶信號(hào);通過濾波器組的合成部分對(duì)修改后的復(fù)值子帶信號(hào)進(jìn)行濾波;并取復(fù)值時(shí)域輸出信號(hào)的實(shí)部,其中輸出信號(hào)是從合成濾波獲得的信號(hào)之和。
本發(fā)明的另一方面是一種用于通過利用復(fù)值有限沖擊響應(yīng)濾波器對(duì)每個(gè)復(fù)值子帶信號(hào)進(jìn)行濾波來修改復(fù)值子帶信號(hào)的方法,其中用于第n號(hào)子帶的有限沖擊響應(yīng)濾波器是離散時(shí)間付立葉變換,其具有以下形式 ,其中參數(shù)τ=T/L,并且其中合成濾波器組具有L個(gè)子帶,并且在以輸出信號(hào)采樣為單位測(cè)量的情況下所需延遲為T。
本發(fā)明的另一個(gè)方面是用于通過濾波而修改復(fù)值子帶信號(hào)的方法,其中濾波器Gτ(ω)大致滿足Vτ(ω)Gτ(ω)+Vτ(ω+π)Gτ(ω+π)=1,其中Vτ(ω)是序列vr(k)=AikΣlp(l)p(l-T-Lk),]]>的離散時(shí)間付立葉變換,p(l)是所述復(fù)濾波器組的原型濾波器,A是適當(dāng)?shù)膶?shí)數(shù)規(guī)一化因子。
本發(fā)明的另一方面是用于通過濾波而修改復(fù)值子帶信號(hào)的方法,其中濾波器Gτ(ω)滿足Gτ(-ω)=Gτ(ω+π)*,以便偶數(shù)索引的沖擊響應(yīng)采樣是實(shí)值的,而奇數(shù)索引的沖擊響應(yīng)采樣是純虛值的。
本發(fā)明的另一方面是一種用于通過以下步驟對(duì)輸入信號(hào)的立體聲屬性進(jìn)行編碼的方法在編碼器處計(jì)算描述每個(gè)立體聲參數(shù)集合在時(shí)間中的位置的時(shí)間柵格參數(shù),并且在解碼器數(shù)根據(jù)該時(shí)間柵格應(yīng)用參數(shù)性立體聲合成,其中立體聲參數(shù)集合的數(shù)目是任意的。
本發(fā)明的另一方面是一種用于對(duì)輸入信號(hào)的立體聲屬性進(jìn)行編碼的方法,其中在立體聲參數(shù)集合的時(shí)間暗示(time cue)與幀開始一致的情況下,第一立體聲參數(shù)集合的時(shí)間本地化之處被明確用信令通知,而不是發(fā)送時(shí)間指針。
本發(fā)明的另一方面是一種用于通過以下步驟生成用于參數(shù)性立體聲重建的立體聲相關(guān)的方法在解碼器處,應(yīng)用人工混響過程以合成側(cè)邊信號(hào)。
本發(fā)明的另一方面是一種通過以下步驟生成用于參數(shù)性立體聲重建的立體聲去相關(guān)的方法在解碼器處,在復(fù)調(diào)制的濾波器組內(nèi)利用每個(gè)濾波器組信道中的相位延遲調(diào)整而進(jìn)行混響過程。
本發(fā)明的另一方面是一種用于通過以上步驟生成用于參數(shù)性立體聲重建的立體聲去相關(guān)的方法在解碼器處,混響過程利用一個(gè)檢測(cè)器,其被設(shè)計(jì)用于查找其中混響尾部可能不必要的信號(hào)而使得混響尾部被衰減或去除。
現(xiàn)將通過參考附圖以不限制本發(fā)明的范圍或精神的示例性示例的方式來描述本發(fā)明,附圖中圖1示出所發(fā)明的裝置的框圖;圖2示出用于生成去相關(guān)后的信號(hào)的裝置的框圖;圖3示出根據(jù)本發(fā)明基于重建后的立體聲子帶信號(hào)分析單個(gè)聲道和合成立體聲聲道;圖4示出基于信號(hào)特性將參數(shù)性立體聲參數(shù)集合分成時(shí)間片段的框圖;圖5示出基于信號(hào)特性將參數(shù)性立體聲參數(shù)集合分成時(shí)間片段的示例。
具體實(shí)施例方式
下述實(shí)施例僅用于例示本發(fā)明用于參數(shù)性立體聲編碼的原理。要理解對(duì)這里所描述的配置和細(xì)節(jié)的修改和變化對(duì)于本領(lǐng)域的技術(shù)人員來說是顯而易見的。因此,希望僅由緊隨之后的專利權(quán)利要求書的范圍所限,而不由通過描述和說明這里的實(shí)施例而提供的特定細(xì)節(jié)所限。
將信號(hào)延遲一個(gè)采樣的若干分之幾可通過幾種現(xiàn)有技術(shù)插值方法來實(shí)現(xiàn)。但是,當(dāng)原始信號(hào)是作為過采樣的復(fù)數(shù)值采樣而獲得的時(shí),會(huì)出現(xiàn)特殊情況。通過僅為對(duì)應(yīng)于恒定時(shí)間延遲的每個(gè)qmf施加某個(gè)因數(shù)的相位延遲,從而來在qmf組中執(zhí)行分?jǐn)?shù)延遲,會(huì)導(dǎo)致嚴(yán)重的假象。
通過根據(jù)一種允許對(duì)任何復(fù)指數(shù)調(diào)制的濾波器組中的任意延遲的高質(zhì)量逼近的新穎方法來使用補(bǔ)償濾波器,可有效避免這一點(diǎn)。詳細(xì)描述如下。
連續(xù)時(shí)間模型為了易于計(jì)算,這里將通過利用合成波形的連續(xù)時(shí)間加窗變換來模擬復(fù)指數(shù)調(diào)制的L頻帶濾波器組un.k(t)=v(t-k)exp[iπ(n+1/2)(t-k+θ)],(1)其中n,k是整數(shù),n≥0,θ是固定相位項(xiàng)。離散時(shí)間信號(hào)的結(jié)果是通過利用間隔1/L對(duì)t-變量進(jìn)行適當(dāng)?shù)牟蓸佣@得的。假設(shè)實(shí)值窗口v(t)被選擇為使得對(duì)于實(shí)值信號(hào)x(t),它保持非常高的精度x(t)=2Re{Σn=0∞Σk=-∞∞cn(k)un,k(t)}---(2)]]>如果cn(k)=∫-∞∞x(t)un,k*(t)dt,---(3)]]>其中*表示復(fù)共軛。還假設(shè)v(t)本質(zhì)上頻帶受限于頻率區(qū)間[-π,π]??紤]通過利用具有沖擊響應(yīng)hn(k)的濾波器對(duì)離散時(shí)間分析采樣cn(k)濾波,來對(duì)每個(gè)頻帶n進(jìn)行的修改,dn(k)=Σlhn(l)cn(k-l).---(4)]]>則修改后的合成y(t)=2Re{Σn=0∞Σk=-∞∞dn(k)un,k(t)}---(5)]]>在頻域中可被計(jì)算為y^(ω)=H(ω)x^(ω),]]>(6)
其中 表示f(t)的付立葉變換,并且H(ω)=Σn=-∞∞Hn(ω)|v^(ω-π(n+1/2))|2.]]>這里,Hn(ω)=∑khn(k)exp(-ikω)是在n≥0情況下頻帶n中應(yīng)用的濾波器的離散時(shí)間付立葉變換,并且對(duì)于n<0,Hn(ω)=H-1-n(-ω)*(8)這里觀察到由于窗口v(t)的特殊設(shè)計(jì),特殊情況Hn(ω)=1導(dǎo)致(7)中H(ω)=1。另一個(gè)感興趣的情況是Hn(ω)=exp(-iω),其給出H(ω)=exp(-iω),以使得y(t)=x(t-1)。
所提議的解決方案為了實(shí)現(xiàn)大小為τ的延遲,以便y(t)=x(t-τ),問題在于對(duì)于n≥0設(shè)計(jì)濾波器Hn(ω),以使得H(ω)=exp(-iτω),(9)其中H(ω)由(7)和(8)給出。這里提議的特定解決方法是應(yīng)用濾波器 (10)這里Gτ(-ω)=Gτ(ω+π)*意味著對(duì)于所有n與(8)的一致性。將(10)插入到(7)的右手側(cè)導(dǎo)致H(ω)=exp(-iωτ)[Vτ(ω)Gτ(ω)+Vτ(ω+π)Gτ(ω+π)](11)其中在b(ω)=exp(iτω)|v^(ω)|2]]>的情況下Vτ(ω)=∑nb(ω-π(2n+1/2))。基本計(jì)算顯示Vτ(ω)是以下變量的離散時(shí)間付立葉變換vτ(k)=ik∫-∞∞v(t)v(t-τ-k)dt.---(12)]]>通過在最小二乘意義上解以下線性系統(tǒng)可獲得對(duì)理想延遲的非常良好的逼近Vτ(ω)Gτ(ω)+Vτ(ω+π)Gτ(ω+π)=1(13)其中FIR濾波器Gτ(ω)=Σk=-NMgτ(k)exp(-ikω)]]>。就濾波器系數(shù)而言,方程(13)可寫為2Σlvr(2k-l)gr(l)=δ[k],---(14)]]>其中對(duì)于k=0,δ[k]=1,對(duì)于k≠0,δ[k]=0。
在具有原型濾波器p(k)的離散時(shí)間L頻帶濾波器組的情況下,所獲得以采樣為單位的延遲為Lτ,計(jì)算(12)被替換為vr(k)=ikΣlp(l)p(l-T-Lk),---(15)]]>其中T是最接近Lτ的整數(shù)。這里p(k)被其支持以外的零所擴(kuò)展。對(duì)于有限長度原型濾波器,只有有限多個(gè)vτ(k)不等于零,并且(14)是線性方程組。未知gτ(k)的數(shù)目通常被選擇為較小的數(shù)字。對(duì)于良好的QMF濾波器組設(shè)計(jì),3-4個(gè)抽頭就已經(jīng)給出非常好的延遲性能。此外,濾波器抽頭gτ(k)對(duì)延遲參數(shù)τ的依賴性通??捎傻碗A多項(xiàng)式來成功模擬。
用信號(hào)通知立體聲參數(shù)的自適應(yīng)時(shí)間柵格參數(shù)性立體聲系統(tǒng)通常導(dǎo)致就有限時(shí)間或頻率分辨率而言的折衷,以便使所輸送的數(shù)據(jù)最小化。但是,從心理聲學(xué)中所公知的是,某些空間暗示可能比其他的更重要,這導(dǎo)致了丟棄不太重要的暗示的可能性。因此,時(shí)間分辨率不必是恒定的。通過使時(shí)間柵格與空間暗示同步,可實(shí)現(xiàn)比特率上的巨大增益。通過為對(duì)應(yīng)于固定大小的時(shí)間片段的每個(gè)數(shù)據(jù)幀發(fā)送可變數(shù)目的參數(shù)集合,可以很容易地實(shí)現(xiàn)這一點(diǎn)。為了使參數(shù)集合與相應(yīng)的空間暗示同步,必須發(fā)送描述每個(gè)參數(shù)集的時(shí)間位置的額外的時(shí)間柵格數(shù)據(jù)。這些時(shí)間指針的分辨率可被選擇為相當(dāng)?shù)停员3謹(jǐn)?shù)據(jù)總量最小。參數(shù)集合的時(shí)間暗示與幀的開頭一致的特殊情況可被明確地用信號(hào)通知,以避免發(fā)送該時(shí)間指針。
圖4示出用于對(duì)具有可變的和信號(hào)相關(guān)的時(shí)間邊界的時(shí)間片段執(zhí)行參數(shù)分析的所發(fā)明的裝置。所發(fā)明的裝置包括裝置401,用于將輸入信號(hào)劃分成一個(gè)或幾個(gè)時(shí)間片段。分隔時(shí)間片段的時(shí)間邊界由裝置402提供。裝置402使用檢測(cè)器,其特別設(shè)計(jì)來用于抽取與確定在何處設(shè)置時(shí)間邊界有關(guān)的空間暗示。裝置401輸出劃分成一個(gè)或多個(gè)時(shí)間片段的所有輸入信號(hào)。此輸出被輸入到裝置403,以便為每個(gè)時(shí)間片段進(jìn)行單獨(dú)的參數(shù)分析。裝置403為每個(gè)被分析的時(shí)間片段輸出一個(gè)參數(shù)集合。
圖5示出時(shí)間柵格生成器能夠如何對(duì)假設(shè)的輸入信號(hào)執(zhí)行操作的示例。在此示例中,如果不存在其他時(shí)間邊界信息,則對(duì)于每個(gè)數(shù)據(jù)幀使用一個(gè)參數(shù)集合。因此,當(dāng)不存在其他時(shí)間邊界信息時(shí),使用數(shù)據(jù)幀的固有時(shí)間邊界。圖5中所示的時(shí)間邊界是來自圖4中的裝置402的輸出。圖5中所示的時(shí)間片段是由圖4中的裝置401提供的。
用于對(duì)立體聲信號(hào)編碼以獲得一個(gè)單聲道輸出信號(hào)和該立體聲的參數(shù)集合的裝置,包括用于通過由加權(quán)加法組合立體聲信號(hào)的左聲道和右聲道來計(jì)算所述單聲道信號(hào)的裝置。此外,裝置403利用左聲道的一部分和右聲道的一部分來生成第一立體聲參數(shù)集合,開始于第一時(shí)間邊界處的所述部分被連接到一個(gè)裝置,該裝置用于確定左聲道和右聲道的后續(xù)部分的第一立體聲參數(shù)集合的有效性。
用于確定的裝置是由圖1中的裝置402和401共同形成的。
具體而言,所述用于確定的裝置可操作以便在確定此第一立體聲參數(shù)集合不再有效時(shí)生成第二時(shí)間邊界并且激活用于生成的裝置,以便生成開始于第二時(shí)間邊界處的左聲道和右聲道的部分的第二立體聲參數(shù)集合。
圖4中未示出的是用于輸出單聲道信號(hào)、第一立體聲參數(shù)集合和與第一立體聲參數(shù)集合相關(guān)聯(lián)的第一時(shí)間邊界以及第二立體聲參數(shù)集合和與第二立體聲參數(shù)集合相關(guān)聯(lián)的第二時(shí)間邊界,作為參數(shù)編碼后的立體聲信號(hào)的裝置。用于確定立體聲參數(shù)集合的有效性的裝置可包括瞬態(tài)檢測(cè)器,因?yàn)楹芸赡茉谝粋€(gè)瞬態(tài)之后,必須生成新的立體聲參數(shù),這是因?yàn)樾盘?hào)已大大改變其形狀。或者,用于確定有效性的裝置可包括綜合分析設(shè)備,其適用于對(duì)單聲道信號(hào)和立體聲參數(shù)集合解碼,以獲得解碼后的左聲道和解碼后的右聲道,以便將解碼后的左聲道和解碼后的右聲道與左聲道和右聲道相比較,從而在解碼后的左聲道和解碼后的右聲道與左聲道和右聲道的差異大于預(yù)定閾值時(shí),激活所述用于生成的裝置。
數(shù)據(jù)幀1對(duì)應(yīng)于參數(shù)集合1的時(shí)間片段開始于數(shù)據(jù)幀1的開頭處,這是因?yàn)樵诖藬?shù)據(jù)幀中不存在其他時(shí)間邊界信息。
數(shù)據(jù)幀2此數(shù)據(jù)幀中存在兩個(gè)時(shí)間邊界。對(duì)應(yīng)于參數(shù)集合2的時(shí)間片段開始于此數(shù)據(jù)幀中的第一時(shí)間邊界處。對(duì)應(yīng)于參數(shù)集合3的時(shí)間片段開始于此數(shù)據(jù)幀中的第二時(shí)間邊界處。
數(shù)據(jù)幀3此數(shù)據(jù)幀中存在一個(gè)時(shí)間邊界。對(duì)應(yīng)于參數(shù)集合4的時(shí)間片段開始于此數(shù)據(jù)幀中的時(shí)間邊界處。
數(shù)據(jù)幀4此數(shù)據(jù)幀中存在一個(gè)時(shí)間邊界。此時(shí)間邊界與數(shù)據(jù)幀4的開始邊界一致,并且不必被用信號(hào)通知,這是因?yàn)檫@是由缺省情況所處理的。因此,可去除此時(shí)間邊界信號(hào)。對(duì)應(yīng)于參數(shù)集合5的時(shí)間片段開始于數(shù)據(jù)幀4的開頭處,即使在沒有用信號(hào)通知此時(shí)間邊界的情況下也是如此。
利用人工混響作為用于參數(shù)性立體聲重建的去相關(guān)方法在參數(shù)性立體聲系統(tǒng)中進(jìn)行立體聲合成的一個(gè)至關(guān)重要的部分是減小左聲道和右聲道之間的相干,以便產(chǎn)生立體聲聲像的寬度。這可通過將原始單聲道信號(hào)的濾波后版本添加到側(cè)邊信號(hào)來完成的,其中側(cè)邊信號(hào)和單聲道信號(hào)分別由以下式子定義單聲道信號(hào)=(左+右)/2,側(cè)邊信號(hào)=(左-右)/2。
為了不太多改變音色,所考慮的濾波器優(yōu)選地應(yīng)該具有全通特性。一個(gè)成功的方法是使用與用于人工混響過程類似的全通濾波器。人工混響算法通常要求高時(shí)間分辨率,以給出在時(shí)間上符合要求地散布的沖擊響應(yīng)。使人工混響算法基于諸如復(fù)qmf組這樣的復(fù)濾波器組具有重大優(yōu)點(diǎn)。濾波器組使得很有可能令混響屬性就例如混響均衡、衰減時(shí)間、密度和音色而言具有頻率選擇性。但是,濾波器組實(shí)現(xiàn)方式通常用時(shí)間分辨率來交換較高的頻率分辨率,這通常使得難以實(shí)現(xiàn)在時(shí)間上足夠平滑的混響過程。為了處理此問題,一種新穎的方法是使用分?jǐn)?shù)延遲逼近,該分?jǐn)?shù)延遲逼近是通過僅為每個(gè)對(duì)應(yīng)于恒定時(shí)間延遲的qmf聲道施加某個(gè)因數(shù)的相位延遲來進(jìn)行的。此原始分?jǐn)?shù)延遲方法引入了嚴(yán)重的時(shí)間拖尾效應(yīng),幸運(yùn)的是,在這種情況下是非常需要這種拖尾效應(yīng)的。時(shí)間拖尾效應(yīng)對(duì)混響算法非常需要的時(shí)間散布作出貢獻(xiàn),并且隨著相位延遲接近pi/2或-pi/2而變得更大。
由于自然原因,人工混響過程是具有無限沖突響應(yīng)的過程,并且提供自然的指數(shù)衰減。在[PCT/SE02/01372]中指出,如果混響單元被用于生成立體聲信道,則在聲音真正結(jié)束之后,混響衰減有時(shí)是不必要的。但是,只要通過更改混響信號(hào)的增益,就可容易地衰減或完全去除這種不必要的混響尾部。被設(shè)計(jì)用于查找聲音結(jié)尾的檢測(cè)器可用于該用途。如果混響單元在某個(gè)特定信號(hào)處生成假象,例如在瞬態(tài)信號(hào),則用于這些信號(hào)的檢測(cè)器也可用于衰減這些信號(hào)。
圖1示出在參數(shù)性立體聲系統(tǒng)中使用的信號(hào)的去相關(guān)方法的發(fā)明裝置。發(fā)明裝置包括用于提供多個(gè)子帶信號(hào)的裝置101。提供裝置可以是復(fù)QMF濾波器組,其中每個(gè)信號(hào)與子帶索引相關(guān)聯(lián)。
由圖1中的裝置101輸出的子帶信號(hào)被輸入到用于提供去相關(guān)后的信號(hào)102的裝置102中,以及用于修改子帶信號(hào)的裝置103和106中。來自102的輸出被輸入到用于修改信號(hào)的裝置104和105中,并且103、104、105和106的輸出被輸入到用于將子帶信號(hào)相加的裝置107和108中。
在目前描述的本發(fā)明的實(shí)施例中,用于修改子帶信號(hào)的裝置103、104、105和106通過將子帶信號(hào)乘以增益因子,來調(diào)整去相關(guān)后的信號(hào)和作為101的輸出的未經(jīng)處理的信號(hào)的水平,以便每對(duì)之和產(chǎn)生一個(gè)信號(hào),該信號(hào)的去相關(guān)后的信號(hào)量由控制參數(shù)給定。應(yīng)該注意,用于修改的裝置103-106中使用的增益因子不限于正值。它也可為負(fù)值。
來自用于使子帶信號(hào)相加的裝置107和108的輸出被輸入到用于提供時(shí)域信號(hào)的裝置109和110。來自109的輸出對(duì)應(yīng)于重建后的立體聲信號(hào)的左聲道,來自110的輸出對(duì)應(yīng)于重建后的立體聲信號(hào)的右聲道。在這里所描述的實(shí)施例中,相同的去相關(guān)器被用于兩個(gè)輸出聲道,而用于將去相關(guān)后的信號(hào)與未經(jīng)處理的信號(hào)相加的裝置對(duì)于兩個(gè)輸出聲道是不同的。從而目前描述的實(shí)施例確保了兩個(gè)輸出信號(hào)可以相同并且完全被去相關(guān),這取決于提供到用于調(diào)整信號(hào)水平的裝置的控制數(shù)據(jù)以及提供到用于使信號(hào)相加的裝置的控制數(shù)據(jù)。
在圖2中,顯示了用于提供去相關(guān)后的信號(hào)的裝置的框圖。輸入子帶信號(hào)被輸入到用于對(duì)子帶信號(hào)濾波的裝置201。在目前描述的本發(fā)明的實(shí)施例中,濾波步驟是包含了全通濾波的混響單元。所使用的濾波器系數(shù)是由用于提供濾波器系數(shù)的裝置202提供的。當(dāng)前被處理的子帶信號(hào)的子帶索引被輸入到202。在本發(fā)明的一個(gè)實(shí)施例中,基于提供到202的子帶索引計(jì)算不同的濾波器系數(shù)。201中的濾波步驟依賴于輸入子帶信號(hào)的延遲后的采樣以及濾波過程中的中間信號(hào)的延遲后的采樣。
本發(fā)明的必要特征是用于提供整數(shù)子帶采樣延遲和分?jǐn)?shù)子帶采樣延遲的裝置由203提供。201的輸出被提供到用于調(diào)整子帶信號(hào)的水平的裝置204,并且還輸入到用于估計(jì)子帶信號(hào)的信號(hào)特性的裝置205。在本發(fā)明的優(yōu)選實(shí)施例中,被估計(jì)的特性是子帶信號(hào)的瞬態(tài)行為。在此實(shí)施例中,檢測(cè)的瞬態(tài)被以信號(hào)方式通知給用于調(diào)整子帶信號(hào)的水平的裝置204,以便在瞬態(tài)通過期間信號(hào)的水平被降低。來自204的輸出是輸入到圖1的104和105的去相關(guān)后的信號(hào)。
在圖3中,示出了單個(gè)解析濾波器組和兩個(gè)合成濾波器組。解析濾波器組301在單聲道輸入信號(hào)上進(jìn)行操作,而合成濾波器組302和303在重建后的立體聲信號(hào)上進(jìn)行操作。
因此,圖1示出用于生成去相關(guān)信號(hào)的所發(fā)明的裝置,它由標(biāo)號(hào)102表示。如圖1或3所示,此裝置包括用于提供多個(gè)子帶信號(hào)的裝置,其中一個(gè)子帶信號(hào)包括至少兩個(gè)子帶采樣的序列,所述子帶采樣的序列代表子帶信號(hào)的帶寬,其小于輸入信號(hào)的帶寬。每個(gè)子帶信號(hào)被輸入到用于濾波的裝置201。每個(gè)用于濾波的裝置201包括混響濾波器,以便獲得多個(gè)混響后的子帶信號(hào),其中多個(gè)混響后的子帶信號(hào)一起表示所述去相關(guān)信號(hào)。優(yōu)選地,如圖2所示,可以對(duì)混響后的子帶信號(hào)進(jìn)行按照子帶的后處理,該后處理是由受塊205控制的塊204所執(zhí)行的。
每個(gè)混響濾波器被設(shè)置到某個(gè)延遲,優(yōu)選地被設(shè)置到分?jǐn)?shù)延遲,并且每個(gè)混響濾波器具有幾個(gè)濾波器系數(shù),這些濾波器系數(shù)取決于子帶索引,如圖2所示。此意味著最好對(duì)每個(gè)子帶使用相同延遲,但對(duì)不同子帶使用不同的濾波器系數(shù)集合。這由圖2中的裝置203和202表示,雖然這里要提到,最好在運(yùn)送去相關(guān)設(shè)備時(shí)固定地確定延遲和濾波器系數(shù),其中延遲和濾波器系數(shù)可利用收聽測(cè)試等來經(jīng)驗(yàn)地確定。
多聲道解碼器由圖1示出,并包括用于生成相關(guān)信號(hào)的發(fā)明裝置,該裝置在圖1中表示為102。圖1中所示的多聲道解碼器是用于對(duì)單聲道信號(hào)和相關(guān)聯(lián)的聲道間相干測(cè)量結(jié)果進(jìn)行解碼的,該聲道間相干測(cè)量結(jié)果代表多個(gè)原始聲道間的相干,其中單聲道信號(hào)是從多個(gè)原始聲道導(dǎo)出的。圖1中的塊102構(gòu)成用于為單聲道信號(hào)生成去相關(guān)信號(hào)的生成器。塊103、104、105、106和107以及108構(gòu)成混合器,該混合器用于根據(jù)第一混合模式將單聲道信號(hào)與去相關(guān)信號(hào)混合以獲得第一解碼后輸出信號(hào),以及根據(jù)第二混合模式將單聲道信號(hào)與去相關(guān)信號(hào)混合以獲得第二解碼后輸出信號(hào),其中混合器可操作以基于作為單聲道信號(hào)的側(cè)帶信息而傳輸?shù)穆暤篱g相干測(cè)量結(jié)果來確定第一混合模式和第二混合模式。
混合器優(yōu)選地可操作以基于不同子帶的分離的聲道間相干測(cè)量結(jié)果而在子帶域中混合。在這種情況下,多聲道解碼器還包括裝置109和110,用于在時(shí)域中轉(zhuǎn)換來自子帶域的第一和第二解碼輸出信號(hào),以獲得時(shí)域中第一解碼輸出信號(hào)和第二解碼輸出信號(hào)。因此用于生成去相關(guān)信號(hào)的發(fā)明裝置102和圖1所示的所發(fā)明的多聲道解碼器在子帶域中進(jìn)行操作,并且執(zhí)行子帶域到時(shí)域轉(zhuǎn)換,作為最后的步驟。
根據(jù)實(shí)際情況,所發(fā)明的設(shè)備可在硬件或硬件中或包括硬件組成部分和軟件組成部分的固件中實(shí)現(xiàn)。當(dāng)部分或全部在軟件中實(shí)現(xiàn)時(shí),本發(fā)明還是計(jì)算機(jī)程序,該計(jì)算機(jī)程序具有當(dāng)在計(jì)算機(jī)上運(yùn)行時(shí)執(zhí)行所發(fā)明的方法的計(jì)算機(jī)可讀代碼。
權(quán)利要求
1.用于對(duì)立體聲信號(hào)編碼以獲得單聲道輸出信號(hào)和立體聲參數(shù)集合的裝置,包括用于通過組合所述立體聲信號(hào)的左聲道和右聲道來計(jì)算所述單聲道信號(hào)的裝置;用于利用所述左聲道的一部分和所述右聲道的一部分來生成第一立體聲參數(shù)集合的裝置(403),所述部分開始于第一時(shí)間邊界處;用于確定第一立體聲參數(shù)集合對(duì)所述左聲道和所述右聲道的后續(xù)部分的有效性的裝置(401、402),其中所述用于確定的裝置可操作以便生成第二時(shí)間邊界,并且在確定所述第一立體聲參數(shù)集合不再有效時(shí)激活所述用于生成的裝置,以便生成開始于所述第二時(shí)間邊界處的、用于左信號(hào)和右信號(hào)的部分的第二立體聲參數(shù)集合;以及用于輸出所述單聲道信號(hào)、所述第一立體聲參數(shù)集合和與所述第一參數(shù)集合相關(guān)聯(lián)的所述第一時(shí)間邊界、以及所述第二立體聲參數(shù)集合和與所述第二立體聲參數(shù)集合相關(guān)聯(lián)的所述第二時(shí)間邊界的裝置。
2.權(quán)利要求1所述的裝置,其中所述用于生成的裝置可操作以計(jì)算聲道間時(shí)間差異參數(shù)、聲道間水平差異參數(shù)和/或聲道間相干參數(shù),來作為所述立體聲參數(shù)集合。
3.權(quán)利要求1或2所述的裝置,其中所述用于確定的裝置包括瞬態(tài)檢測(cè)器,其被配置為在檢測(cè)到一個(gè)瞬態(tài)時(shí)激活所述用于生成的裝置,并且生成所述瞬態(tài)的時(shí)刻作為所述第二時(shí)間邊界。
4.權(quán)利要求1至3中任何一項(xiàng)所述的裝置,其中所述用于確定的裝置是綜合分析設(shè)備,其適用于解碼所述單聲道信號(hào)和所述立體聲參數(shù)集合,以獲得解碼后的左聲道和解碼后的右聲道;將所述解碼后的左聲道和所述解碼后的右聲道與所述左聲道和所述右聲道相比較;并且在所述解碼后的左聲道和所述解碼后的右聲道與所述左聲道和所述右聲道的差異大于預(yù)定閾值時(shí),激活所述用于生成的裝置。
5.用于對(duì)立體聲信號(hào)編碼以獲得單聲道輸出信號(hào)和立體聲參數(shù)集合的方法,包括通過組合所述立體聲信號(hào)的左聲道和右聲道來計(jì)算所述單聲道信號(hào);利用所述左聲道的一部分和所述右聲道的一部分來生成(403)第一立體聲參數(shù)集合,所述部分開始于第一時(shí)間邊界處;通過以下步驟確定(401、402)第一立體聲參數(shù)集合對(duì)所述左聲道和所述右聲道的后續(xù)部分的有效性生成第二時(shí)間邊界,并且在確定所述第一立體聲參數(shù)集合不再有效時(shí)進(jìn)行所述生成步驟,以便生成開始于所述第二時(shí)間邊界處的、用于左信號(hào)和右信號(hào)的部分的第二立體聲參數(shù)集合;以及輸出所述單聲道信號(hào)、所述第一立體聲參數(shù)集合和與所述第一參數(shù)集合相關(guān)聯(lián)的所述第一時(shí)間邊界、以及所述第二立體聲參數(shù)集合和與所述第二立體聲參數(shù)集合相關(guān)聯(lián)的所述第二時(shí)間邊界。
6.一種解碼器,用于解碼單聲道信號(hào)、與第一時(shí)間邊界相關(guān)聯(lián)的第一立體聲參數(shù)集合、以及與第二時(shí)間邊界相關(guān)聯(lián)的第二立體聲參數(shù)集合,所述解碼器可被操作為,在解碼操作中使用一個(gè)有效的參數(shù)集合直到到達(dá)一個(gè)新的時(shí)間邊界,以及當(dāng)?shù)竭_(dá)所述新的時(shí)間邊界時(shí)使用新的立體聲參數(shù)集合來進(jìn)行所述解碼操作。
7.一種解碼方法,用于解碼單聲道信號(hào)、與第一時(shí)間邊界相關(guān)聯(lián)的第一立體聲參數(shù)集合、以及與第二時(shí)間邊界相關(guān)聯(lián)的第二立體聲參數(shù)集合,在解碼操作中使用一個(gè)有效的參數(shù)集合直到到達(dá)一個(gè)新的時(shí)間邊界,以及當(dāng)?shù)竭_(dá)所述新的時(shí)間邊界時(shí)使用新的立體聲參數(shù)集合來進(jìn)行所述解碼操作。
8.計(jì)算機(jī)程序,其具有用于執(zhí)行如權(quán)利要求5或7所述的方法的計(jì)算機(jī)可讀代碼。
全文摘要
用于利用輸入信號(hào)生成去相關(guān)信號(hào)的合成器可在多個(gè)子帶信號(hào)上進(jìn)行操作,其中一個(gè)子帶信號(hào)包括至少兩個(gè)子帶采樣的序列,該子帶采樣的序列代表子帶信號(hào)的帶寬,該帶寬小于輸入信號(hào)的帶寬。合成器包括第一級(jí)(201),用于利用混響濾波器對(duì)每個(gè)子帶信號(hào)濾波以獲得多個(gè)混響后的子帶信號(hào),其中多個(gè)混響后的子帶信號(hào)一起表示去相關(guān)信號(hào)。此去相關(guān)信號(hào)被用于基于參數(shù)編碼后的立體聲信號(hào)重建信號(hào),該立體聲信號(hào)由單聲道信號(hào)和相干測(cè)量結(jié)果組成。
文檔編號(hào)G10L19/008GK101071569SQ20071008909
公開日2007年11月14日 申請(qǐng)日期2004年4月30日 優(yōu)先權(quán)日2003年4月30日
發(fā)明者約納斯·恩德加德, 拉斯·維爾莫斯 申請(qǐng)人:編碼技術(shù)股份公司