專利名稱:對表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行編碼和解碼的編碼器、解碼器以及方法
技術(shù)領(lǐng)域:
本發(fā)明屬于編碼領(lǐng)域,其中,例如在視頻以及音頻編碼中,針對編碼速率來使用將被編碼的數(shù)據(jù)的不同特性。
背景技術(shù):
當(dāng)前技術(shù)的編碼策略可以利用將被編碼的數(shù)據(jù)流的特性。例如,在音頻編碼中, 使用感知模型對原始數(shù)據(jù)進(jìn)行壓縮,而在重新播放時(shí)幾乎不會有顯著的質(zhì)量降低和降級。 現(xiàn)代的感知音頻編碼方案,例如 MPEG2/4AAC(MPEG = Moving Pictures Expert Group, 運(yùn)動(dòng)圖像專家組;AAC = Advanced Audio Coding,高級音頻編碼),參見Generic Coding of Moving Pictures and Associated Audio :Advanced Audio Coding, International Standard 13818-7,IS0/IEC JTC1/SC29/WG11 Moving Pictures Expert Group,1997,可以使用濾波器組,例如修正離散余弦變換(Modified Discrete Cosine Transform,MDCT),以便在頻域中表示音頻信號。在頻域中,可以依據(jù)感知模型來進(jìn)行頻率系數(shù)的量化。對于一般類型的音頻信號 (例如音樂),這樣的編碼器可以提供優(yōu)越的感知音頻質(zhì)量。另一方面,現(xiàn)代的語音編碼器, 例如 ACELP (ACELP = Algebraic Code Excited Linear Prediction,代數(shù)碼激發(fā)線性預(yù)測),使用一種預(yù)測的方式,并且利用此種方式可以在時(shí)域中表示音頻/語音信號。這樣的語音編碼器可以對人類語音產(chǎn)生過程(即,人類聲道)的特征進(jìn)行建模,從而以較低的比特率即可達(dá)到優(yōu)越的語音信號性能。反之,對于以低比特率編碼的語音,感知音頻編碼器無法達(dá)到語音編碼器所提供的性能水平,并且使用語音編碼器來表示一般的音頻信號/音樂會造成顯著的質(zhì)量減損。傳統(tǒng)的構(gòu)思提供一種分層組合,在所述分層組合中所有的局部編碼器始終是活動(dòng)的(即,時(shí)域和頻域編碼器),通過將這些局部編碼器對于一個(gè)給定的處理過的時(shí)間幀所作的貢獻(xiàn)相組合,計(jì)算出最終的輸出信號。分層編碼的一般示例是MPEG-4可縮放語音/音頻編碼,具有作為基本層的語音編碼器以及基于濾波器組的增強(qiáng)層,參見Bernhard Grill, Karlheinz Brandenburg, "A Two-or Three Stage Bit-Rate Scalable Audio Coding System, Preprint Number 4132,99th Convention of the AES (1995 ^9^ )。傳統(tǒng)的頻域編碼器可以利用MDCT濾波器組。因?yàn)镸DCT優(yōu)秀的性質(zhì),其已經(jīng)成為用于傳統(tǒng)感知音頻編碼器的最具優(yōu)勢的濾波器組。舉例而言,MDCT可以在處理塊之間提供平滑的交叉衰落(cross fade)。例如,即使由于譜系數(shù)的量化使得在每一個(gè)處理塊中的信號皆以不同的方式改變,然而因?yàn)榧哟暗闹丿B/加法(windowed overlap/add)操作,所以不會產(chǎn)生因?yàn)閺囊粋€(gè)塊到另一個(gè)塊的突然轉(zhuǎn)變而造成的分塊偽跡(blocking artifact) 0 MDCT 使用時(shí)域混迭消除(time-domain aliasing cancellation, TDAC)的構(gòu)思。MDCT是一種以IV型離散余弦變換為基礎(chǔ)的傅立葉相關(guān)變換,具有重迭的附加性質(zhì)。MDCT被設(shè)計(jì)為用于在較大數(shù)據(jù)集合的連續(xù)塊中執(zhí)行,其中隨后的塊互相重疊,使得一個(gè)塊的后半部與下一個(gè)塊的前半部重合。除了 DCT的能量壓縮(energy-compaction)質(zhì)量之外,這種重疊使得MDCT對于信號壓縮應(yīng)用是特別有吸引力的,因?yàn)檫@種重疊有助于避免源于塊邊界的所述偽跡。作為重迭變換(lapped transform),MDCT與其它傅立葉相關(guān)的變換相比的些許不同之處在于,MDCT的輸出的數(shù)目僅有輸入的數(shù)目的一半,而非與輸入的數(shù)目相同。具體地,將2N個(gè)實(shí)數(shù)轉(zhuǎn)換成N個(gè)實(shí)數(shù),其中N是正整數(shù)。逆MDCT也稱為IMDCT。因?yàn)檩斎肱c輸出的數(shù)目不相同,在乍看之下MDCT似乎是不可逆的。然而,通過將隨后重疊塊的重疊IMDCT相加,實(shí)現(xiàn)了完美的可逆性,這使得消除誤差并恢復(fù)原始數(shù)據(jù)(即,實(shí)現(xiàn)TDAC)。于是,濾波器組輸出處譜值的數(shù)目等于該濾波器組輸入處時(shí)域輸入值的數(shù)目,這也稱作臨界采樣(critical sampling)。MDCT濾波器組提供了高頻率選擇性,并且能夠得到高編碼增益。通過使用時(shí)域混迭消除技術(shù),可以實(shí)現(xiàn)塊和臨界采樣的重疊性質(zhì),參見J. I^rincen,A. Bradley, "Analysis/ Synthesis Filter Band Design Based on Time Domain Aliasing Cancellation,,,,IEEE Trans. ASSP,ASSP-34(5) :1153-1161,1986。圖 4 說明了 MDCT 的這些效應(yīng)。圖 4 示出了 MDCT輸入信號,以沿著上面的時(shí)間軸400的脈沖來表示。然后利用兩個(gè)連續(xù)的加窗和MDCT 塊對輸入信號400進(jìn)行轉(zhuǎn)換,其中在圖4中輸入信號400的下方示出了窗410。在圖4中以時(shí)間線420和425顯示了經(jīng)過后向變換之后獨(dú)立的、加窗的信號。在逆MDCT之后,第一塊產(chǎn)生具有正號的混迭分量420,第二塊產(chǎn)生具有相同大小并且具有負(fù)號的混迭分量425。如在圖4的底部的最終輸出430處所顯示的,在兩個(gè)輸出信號420與425相加之后這兩個(gè)混迭分量互相抵消。在“擴(kuò)展適應(yīng)性多速率寬帶(AMR-WB+)編解碼器”,3GPP TS26. 290V6. 3. 0,2005-06 技術(shù)規(guī)范中,詳細(xì)說明了 AMR-WB+(AMR-WB = Adaptive Multi-Rate Wideband,適應(yīng)性多速率寬帶)編解碼器。依據(jù)第5. 2節(jié),AMR-WB+編解碼器核心的編碼算法基于混合ACELP/ TCX(TCX = Transform Coded Excitation,變換編碼激發(fā))模型。對于輸入信號的每一個(gè)塊,編碼器可以在開回路或者閉回路模式下決定哪一種編碼模式,即,ACELP或者TCX,是最佳的。ACELP是時(shí)域預(yù)測編碼器,最適于語音和瞬態(tài)信號。AMR-WB編碼器用于ACELP模式中。備選地,TCX模型是基于變換的編碼器,并且更適于典型的音樂采樣。具體地,AMR-WB+針對變換編碼模式TCX使用離散傅立葉變換(DFT)。為了允許相鄰塊之間的平滑轉(zhuǎn)變,使用加窗和重疊。這種加窗和重疊對于不同的編碼模式(TCX/ACELP) 之間的轉(zhuǎn)變以及對于連續(xù)的TCX幀之間的轉(zhuǎn)變而言都是必要的。因此,DFT與加窗和重疊一起表示并未經(jīng)過臨界采樣的濾波器組。濾波器組產(chǎn)生比新的輸入采樣的數(shù)目更多的頻率值,參見在 3GPP TS 26. 290V6. 3. 0 (3GPP = Third Generation Partnership Project,第三代伙伴計(jì)劃,TS = Technical Specification,技術(shù)規(guī)范)中的圖4。每一個(gè)TCX幀使用 1/8幀長度的重疊,所述幀長度系等于新的輸入采樣的數(shù)目。因此,該DFT的對應(yīng)長度是9/8 幀長度。考慮在TCX中非臨界采樣的DFT濾波器組,即,在濾波器組輸出處譜值的數(shù)目大于在該濾波器組輸入處時(shí)域輸入值的數(shù)目,這種頻域編碼模式與諸如AAC (AAC = Advanced Audio Coding,高級音頻編碼)等使用MDCT (臨界采樣的重迭變換)的音頻編解碼器不同。在 Fielder, Louis D. ;Todd, Craig C. ,"The Design of a Video FriendlyAudio Coding System for Distributing Applications,,,,Paper Number 17-008, The AES 17th International Conference =High-Qqality Audio Coding (1999 ^ 8 ^ ), \)JsR Fielder,Louis D. ;Davidson,Grant A. , "Audio Coding Tools for Digital Television Distribution,",Preprint Number 5104,108thConvention of the AES(2000^ 1 ^)巾, 描述了杜比E(Dolby Ε)編解碼器。杜比E編解碼器使用MDCT濾波器組。在這種編碼的設(shè)計(jì)中,特別關(guān)注在編碼域中直接執(zhí)行編輯的可能性。為了達(dá)成這個(gè)目標(biāo),使用特殊的無混迭窗。在這些窗的邊界,不同信號部分的平滑交叉衰落或接合是可能的。在前文中所參考的文件中概括出,例如參見"iThe Design of a Video Friendly Audio Coding System for Distribution Applications, ”第三節(jié),僅簡單地使用會引入時(shí)域混迭的一般MDCT窗是不可能實(shí)現(xiàn)這一點(diǎn)的。然而,其中也指出,為了消除混迭,所需要的代價(jià)是變換系數(shù)的數(shù)目增加,這個(gè)結(jié)果指出所得到的濾波器組將不再具有臨界采樣的性質(zhì)。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種更高效的編碼和解碼數(shù)據(jù)段的構(gòu)思。利用根據(jù)權(quán)利要求1所述的用于解碼的設(shè)備、根據(jù)權(quán)利要求22所述的用于解碼的方法、根據(jù)權(quán)利要求M所述的用于產(chǎn)生已編碼數(shù)據(jù)流的設(shè)備、以及根據(jù)權(quán)利要求35所述的用于產(chǎn)生已編碼數(shù)據(jù)流的方法,實(shí)現(xiàn)了這一目的。本發(fā)明基于以下成果通過使用時(shí)域和頻域編碼器的組合,以及相應(yīng)地時(shí)域和頻域解碼器的組合,可以實(shí)現(xiàn)更高效的編碼和解碼。通過在解碼器中將時(shí)域數(shù)據(jù)轉(zhuǎn)換至頻域, 以及通過將得到的轉(zhuǎn)換后的頻域數(shù)據(jù)與接收到的已經(jīng)解碼頻域數(shù)據(jù)相組合,可以以有效地對抗時(shí)間混迭問題。通過使施加到數(shù)據(jù)段的重疊窗的重疊區(qū)域適于編碼領(lǐng)域的變化,可以減少開銷。當(dāng)使用時(shí)域編碼時(shí),以及相應(yīng)地從時(shí)域編碼切換或者切換至?xí)r域編碼時(shí),采用具有較小重疊區(qū)域的窗可以是有利的。本發(fā)明的實(shí)施例可以提供一種通用的音頻編碼和解碼構(gòu)思,對于例如語音信號和音樂信號這兩種類型的輸入信號可以實(shí)現(xiàn)更高的性能。實(shí)施例可以很好地利用將多種編碼方式(如,時(shí)域和頻域編碼構(gòu)思)相組合的優(yōu)點(diǎn)。實(shí)施例可以有效地將基于濾波器組的和基于時(shí)域?yàn)榈木幋a構(gòu)思組合成單個(gè)方案。實(shí)施例可以得到一種組合的編解碼器,可以例如在用于音樂類音頻內(nèi)容的音頻編解碼器與用于語音類內(nèi)容的語音編解碼器之間進(jìn)行切換, 實(shí)施例可以頻繁地使用這種切換機(jī)制,特別是對于混合的內(nèi)容。本發(fā)明的實(shí)施例可以提供不出現(xiàn)切換偽跡的優(yōu)點(diǎn)。在實(shí)施例中,對于切換過程,可以使附加傳輸數(shù)據(jù)或者附加編碼采樣的量最小化,以避免在該操作階段降低效率。由此,局部編碼器的切換式組合的構(gòu)思與所有局部編碼器始終是活動(dòng)的分層組合是不同的。
圖Ia示出了用于解碼的設(shè)備的實(shí)施例;圖Ib示出了用于解碼的設(shè)備的另一實(shí)施例;圖Ic示出了用于解碼的設(shè)備的另一實(shí)施例;圖Id示出了用于解碼的設(shè)備的另一實(shí)施例;圖Ie示出了用于解碼的設(shè)備的另一實(shí)施例;
6
圖If示出了用于解碼的設(shè)備的另一實(shí)施例;圖加示出了用于編碼的設(shè)備的實(shí)施例;圖2b示出了用于編碼的設(shè)備的另一實(shí)施例;圖2c示出了用于編碼的設(shè)備的另一實(shí)施例;圖3a說明了在一個(gè)窗的持續(xù)時(shí)間內(nèi)在頻域和時(shí)域編碼之間進(jìn)行切換時(shí)的重疊區(qū)域;圖北說明了在兩個(gè)窗的持續(xù)時(shí)間內(nèi)在頻域編碼和時(shí)域編碼之間進(jìn)行切換時(shí)的重疊區(qū)域;圖3c說明了具有不同的重疊區(qū)域的多個(gè)窗;圖3d說明了在實(shí)施例中對具有不同重疊區(qū)域的窗的使用;以及圖4示出了使用MDCT時(shí)的時(shí)域混迭消除。
具體實(shí)施例方式在下文中將參考附圖來詳細(xì)描述本發(fā)明的實(shí)施例。圖Ia示出了用于對表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行解碼的設(shè)備100,數(shù)據(jù)段是在時(shí)域中或者在頻域中編碼的,在頻域中編碼的數(shù)據(jù)段具有表示連續(xù)且重疊的時(shí)域數(shù)據(jù)采樣塊的連續(xù)數(shù)據(jù)塊。例如,所述數(shù)據(jù)流可以與音頻流相對應(yīng),其中這些數(shù)據(jù)塊當(dāng)中的一些數(shù)據(jù)塊在時(shí)域中編碼,而其他數(shù)據(jù)塊在頻域中編碼。在頻域中編碼的數(shù)據(jù)塊或者數(shù)據(jù)段可以表示重疊數(shù)據(jù)塊的時(shí)域數(shù)據(jù)采樣。設(shè)備100包括時(shí)域解碼器110,用于對在時(shí)域中編碼的數(shù)據(jù)段進(jìn)行解碼。此外,設(shè)備100包括處理器120,用于處理在頻域中編碼的數(shù)據(jù)段以及時(shí)域解碼器110的輸出數(shù)據(jù), 以獲得重疊的時(shí)域數(shù)據(jù)塊。此外,設(shè)備100包括重疊/加法組合器130,用于將重疊的時(shí)域數(shù)據(jù)塊相組合,以獲者時(shí)域數(shù)據(jù)流的已解碼數(shù)據(jù)段。圖Ib示出了設(shè)備100的另一個(gè)實(shí)施例。在實(shí)施例中,處理器120可以包括頻域解碼器122,用于對在頻域中編碼的數(shù)據(jù)段進(jìn)行解碼,以獲得頻域數(shù)據(jù)段。此外,在實(shí)施例中, 處理器120可以包括時(shí)域至頻域轉(zhuǎn)換器124,用于對時(shí)域解碼器110的輸出數(shù)據(jù)進(jìn)行轉(zhuǎn)換, 以獲得轉(zhuǎn)換后的頻域數(shù)據(jù)段。此外,在實(shí)施例中,處理器120可以包括頻域組合器126,用于將頻域段以及轉(zhuǎn)換后的頻域數(shù)據(jù)段相組合,以獲得頻域數(shù)據(jù)流。處理器120還可以包括頻域至?xí)r域轉(zhuǎn)換器 128,用于將頻域數(shù)據(jù)流轉(zhuǎn)換成重疊的時(shí)域數(shù)據(jù)塊,然后可以由重疊/加法組合器130來組合這些重疊的時(shí)域數(shù)據(jù)塊。實(shí)施例可以在不作任何修改的情況下,尤其是在不放棄任何臨界采樣性質(zhì)的情況下,使用MDCT濾波器組,如同例如在MPEG-4AAC中所使用的。實(shí)施例可以提供最佳的編碼效率。實(shí)施例可以實(shí)現(xiàn)平滑的轉(zhuǎn)變,轉(zhuǎn)變至與已建立的MDCT窗兼容的時(shí)域編解碼器,同時(shí)并不引入額外的切換偽跡并且僅帶來最小的開銷。實(shí)施例可以在濾波器組中保持時(shí)域混迭,并且刻意地將對應(yīng)的時(shí)域混迭引入由時(shí)域編解碼器編碼的信號部分中。因此,所得到的時(shí)域混迭分量可以互相抵消,所采用的方式與它們針對MDCT譜的兩個(gè)連續(xù)幀所采用的方式相同。圖Ic說明了設(shè)備100的另一實(shí)施例,依據(jù)圖lc,頻域解碼器122可以包括重新量化級12加。此外,時(shí)域至頻域轉(zhuǎn)換器IM可以包括余弦調(diào)制濾波器組(cosine modulated filterbank)、擴(kuò)展重迭變換(extended lapped transform)、低延遲濾波器組或者多相濾波器組。圖Ic所示的實(shí)施例說明時(shí)域至頻域轉(zhuǎn)換器124可以包括MDCT 124a0此外,圖Ic描述了頻域組合器1 可以包括加法器126a。如圖Ic所示,頻域至?xí)r域轉(zhuǎn)換器1 可以分別包括余弦調(diào)制濾波器組以及逆MDCTUSa。可以利用編碼器來產(chǎn)生包括時(shí)域編碼和頻域編碼的數(shù)據(jù)段在內(nèi)的數(shù)據(jù)流,該編碼器將在下文中更詳細(xì)地描述。通過利用頻域編碼器對輸入信號的一些部分進(jìn)行編碼,以及利用時(shí)域編碼器對一些輸入信號的部分進(jìn)行編碼,可以實(shí)現(xiàn)在頻域編碼與時(shí)域編碼之間的切換。圖Ic所示的設(shè)備100的實(shí)施例說明了對應(yīng)的用于解碼的設(shè)備100的原理結(jié)構(gòu)。在其它的實(shí)施例中,重新量化12 以及逆修正離散余弦變換128a可以代表頻域解碼器。如圖Ic所示,對于由時(shí)域解碼器110所接管的信號部分,可以利用前向MDCT 124a 對時(shí)域解碼器110的時(shí)域輸出進(jìn)行變換。時(shí)域解碼器可以利用預(yù)測濾波器對時(shí)域編碼的數(shù)據(jù)進(jìn)行解碼。此處,在MDCT 12 的輸入會引入一些重疊,且從而會引入一些開銷。在下文中,將描述可以減小或者最小化這種開銷的一些實(shí)施例。理論上,圖Ic中所示的實(shí)施例還包括操作模式,在所述操作模式下兩個(gè)編解碼器可以并行地操作。在實(shí)施例中,處理器120可以適于處理在時(shí)域以及在頻域中并行編碼的數(shù)據(jù)段。以此方式,信號可以部分在頻域中編碼,部分在時(shí)域中編碼,類似于分層編碼方式。 所得到的信號之后在頻域中加在一起,比較頻域組合器U6a。然而,實(shí)施例可以執(zhí)行專門在兩個(gè)編解碼器之間進(jìn)行切換的操作模式,并且優(yōu)選地僅具有最小數(shù)目的采樣,其中這兩個(gè)編解碼器都是活動(dòng)的,以獲得最佳的可能效率。在圖Ic中,時(shí)域解碼器110的輸出由MDCT 12 來轉(zhuǎn)換,接著再由IMDCT 128a來轉(zhuǎn)換。在另一個(gè)實(shí)施例中,這兩個(gè)步驟可以有利地組合成單個(gè)步驟,以降低復(fù)雜度。圖Id 說明了設(shè)備100的一個(gè)實(shí)施例,以說明此種方法。圖Id所示的設(shè)備100說明處理器120可以包括計(jì)算器129,用于依據(jù)時(shí)域解碼器110的輸出數(shù)據(jù)計(jì)算重疊的時(shí)域數(shù)據(jù)塊。處理器 120或者計(jì)算器1 可以適于依據(jù)時(shí)域解碼器110的輸出數(shù)據(jù),再現(xiàn)頻域至?xí)r域轉(zhuǎn)換器1 的性質(zhì)以及相應(yīng)地重疊性質(zhì),即,處理器120或者計(jì)算器1 可以再現(xiàn)時(shí)域數(shù)據(jù)塊的重疊特性,該重疊特性類似于由頻域至?xí)r域轉(zhuǎn)換器1 所產(chǎn)生的的重疊特性。此外,處理器120或者計(jì)算器1 可以適于依據(jù)時(shí)域解碼器110的輸出數(shù)據(jù)再現(xiàn)時(shí)域混迭,該時(shí)域混迭類似于由頻域至?xí)r域轉(zhuǎn)換器1 所引入的時(shí)域混迭。之后,頻域至?xí)r域轉(zhuǎn)換器1 可以適于將頻域解碼器122所提供的頻域數(shù)據(jù)段轉(zhuǎn)換成重疊的時(shí)域數(shù)據(jù)塊。重疊/加法組合器130可以適于組合由頻域至?xí)r域轉(zhuǎn)換器128以及計(jì)算器1 所提供的數(shù)據(jù)塊,以獲得時(shí)域數(shù)據(jù)流的已解碼數(shù)據(jù)段。如在圖Ie的實(shí)施例中所說明的,計(jì)算器1 可以包括時(shí)域混迭級129a。時(shí)域混迭級129a可以適于對時(shí)域解碼器的輸出數(shù)據(jù)進(jìn)行時(shí)間混迭,以獲得重疊的時(shí)域數(shù)據(jù)塊。對于時(shí)域編碼數(shù)據(jù),MDCT和IMDCT的組合可以使實(shí)施例中的過程在結(jié)構(gòu)以及計(jì)算復(fù)雜度方面都更為簡化,因?yàn)樵谶@些實(shí)施例中僅剩下時(shí)域混迭(time-domain aliasing, TDA)過程。這個(gè)高效的過程可以基于許多觀察。對2N個(gè)采樣的輸入段進(jìn)行加窗的 (windowed) MDCT可以分成三個(gè)步驟。第一,將輸入信號乘以分析窗。
第二,然后將得到的結(jié)果從2N個(gè)采樣折迭(fold down)成N個(gè)采樣。對于MDCT,該過程意味著將采樣的時(shí)間反轉(zhuǎn)順序的第一個(gè)四分之一與采樣的第二個(gè)四分之一組合(即, 后者減去前者),以及將采樣的第四個(gè)四分之一與采樣的時(shí)間反轉(zhuǎn)順序的第三個(gè)四分之一組合(即,相加)。在信號的修改過的第二和第三個(gè)四分之一中,所得到的結(jié)果是經(jīng)過時(shí)間混迭的、下采樣后的信號,包括N個(gè)采樣。 第三,然后使用正交DCT式變換對下采樣后的信號進(jìn)行轉(zhuǎn)換,其中所述正交DCT式變換將N個(gè)輸入映射到N個(gè)輸出采樣,以形成最終的MDCT輸出。對N個(gè)譜采樣的輸入序列進(jìn)行加窗的IMDCT重建同樣也可以分成三個(gè)步驟。第一,使用正交逆DCT式變換對N個(gè)譜采樣的輸入序列進(jìn)行轉(zhuǎn)換,所述正交逆DCT 式變換將N個(gè)輸入映射到N個(gè)輸出采樣。第二,將得到的結(jié)果從N個(gè)采樣展開成2N個(gè)采樣,這是通過以下方式來實(shí)現(xiàn)的將逆DCT變換后的值寫入2N個(gè)采樣輸出緩沖區(qū)的第二和第三個(gè)四分之一,并且分別以第二個(gè)四分之一的時(shí)間反轉(zhuǎn)且反相后的版本填充第一個(gè)四分之一,以及以第三個(gè)四分之一的時(shí)間反轉(zhuǎn)的版本填充第四個(gè)四分之一。第三,將得到的2N個(gè)采樣乘以合成窗,以形成加窗的IMDCT輸出。因此,在實(shí)施例中,利用由加窗的MDCT的第一和第二步驟,以及加窗的IMDCT 的第二和第三步驟所構(gòu)成的序列,可以高效地執(zhí)行加窗的MDCT與加窗的IMDCT的級聯(lián) (concatenation)。在實(shí)施例中可以完全省略的MDCT的第三步驟以及IMDCT的第一步驟, 因?yàn)樗鼈兪窍鄬τ诒舜四孢\(yùn)算且從而互相抵銷。其余的步驟可以僅在時(shí)域中執(zhí)行,因此使用此種方式的實(shí)施例在計(jì)算復(fù)雜度上可以實(shí)質(zhì)上很低。對于由MDCT以及相繼的IMDCT組成的一個(gè)塊,MDCT的第二和第三步驟以及IMDCT 的第二和第三步驟可以寫成與下列的稀疏2NX2N矩陣相乘。
權(quán)利要求
1.一種用于依據(jù)時(shí)域數(shù)據(jù)流來產(chǎn)生已編碼數(shù)據(jù)流的設(shè)備,所述時(shí)域數(shù)據(jù)流具有信號的采樣,該設(shè)備包括區(qū)段處理器,用于從數(shù)據(jù)流提供數(shù)據(jù)段;時(shí)域編碼器,用于在時(shí)域中對加窗數(shù)據(jù)段進(jìn)行編碼;頻域編碼器,用于依據(jù)第一加窗函數(shù)或者第二加窗函數(shù)對時(shí)域數(shù)據(jù)流的采樣施加權(quán)重,以獲得加窗數(shù)據(jù)段,所述第一加窗函數(shù)和第二加窗函數(shù)適于不同長度的重疊區(qū)域,所述頻域編碼器適于在頻域中對加窗數(shù)據(jù)段進(jìn)行編碼;時(shí)域數(shù)據(jù)分析器,用于確定與數(shù)據(jù)段有關(guān)的轉(zhuǎn)變指示;以及控制器,用于控制該設(shè)備,使得對于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段,將時(shí)域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中,以及對于具有第二轉(zhuǎn)變指示的數(shù)據(jù)段,將頻域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中,其中,控制器適于針對頻域編碼器設(shè)置加窗函數(shù),使得當(dāng)在頻域和時(shí)域之間切換時(shí)使用重疊大小減小的窗。
2.根據(jù)權(quán)利要求1所述的設(shè)備,其中,控制器適于針對頻域編碼器設(shè)置加窗函數(shù),使得在頻域中編碼的兩個(gè)連續(xù)加窗數(shù)據(jù)段的重疊區(qū)域大小大于由在頻域中編碼的一個(gè)加窗數(shù)據(jù)段和在時(shí)域中編碼的一個(gè)加窗數(shù)據(jù)段組成的兩個(gè)連續(xù)加窗數(shù)據(jù)段的重疊區(qū)域的大小。
3.根據(jù)權(quán)利要求1所述的設(shè)備,其中,所述時(shí)域數(shù)據(jù)分析器適于從時(shí)域數(shù)據(jù)流、數(shù)據(jù)段中或者從區(qū)段處理器直接提供的數(shù)據(jù)中,確定轉(zhuǎn)變指示。
4.根據(jù)權(quán)利要求1所述的設(shè)備,其中,所述時(shí)域數(shù)據(jù)分析器適于確定轉(zhuǎn)變度量,所述轉(zhuǎn)變度量基于在時(shí)域數(shù)據(jù)流或者數(shù)據(jù)段中的瞬時(shí)性的水平,以及,其中轉(zhuǎn)變指示器指示瞬時(shí)性的水平是否超過預(yù)定的閾值。
5.根據(jù)權(quán)利要求1所述的設(shè)備,其中,所述區(qū)段處理器適于提供具有不同長度的重疊區(qū)域的數(shù)據(jù)段,時(shí)域編碼器適于對數(shù)據(jù)段進(jìn)行編碼,頻域編碼器適于對加窗數(shù)據(jù)段進(jìn)行編碼,以及控制器適于控制時(shí)域編碼器和頻域編碼器,使得對于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段,將時(shí)域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中,以及對于具有第二轉(zhuǎn)變指示的加窗數(shù)據(jù)段,將頻域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中。
6.根據(jù)權(quán)利要求1所述的設(shè)備,其中,所述控制器適于控制區(qū)段處理器將數(shù)據(jù)段提供給時(shí)域編碼器或者頻域編碼器。
7.根據(jù)權(quán)利要求1所述的設(shè)備,其中,所述頻域編碼器適于依據(jù)AAC規(guī)范來施加窗函數(shù)的權(quán)重。
8.根據(jù)權(quán)利要求1所述的設(shè)備,其中,所述頻域編碼器適于將加窗數(shù)據(jù)段轉(zhuǎn)換至頻域, 以獲得頻域數(shù)據(jù)段。
9.根據(jù)權(quán)利要求8所述的設(shè)備,其中,所述頻域編碼器適于對頻域數(shù)據(jù)段進(jìn)行量化。
10.根據(jù)權(quán)利要求9所述的設(shè)備,其中,所述頻域編碼器適于依據(jù)感知模型來評估頻域數(shù)據(jù)段。
11.根據(jù)權(quán)利要求10所述的設(shè)備,其中,所述頻域編碼器適于使用余弦調(diào)制濾波器組、 擴(kuò)展重迭變換、低延遲濾波器組或者多相濾波器組來獲得頻域數(shù)據(jù)段。
12.根據(jù)權(quán)利要求8所述的設(shè)備,其中,所述頻域編碼器適于使用修正離散余弦變換來獲得頻域數(shù)據(jù)段。
13.根據(jù)權(quán)利要求1所述的設(shè)備,其中,所述時(shí)域編碼器適于使用預(yù)測濾波器,以對數(shù)據(jù)段進(jìn)行編碼。
14.一種依據(jù)時(shí)域數(shù)據(jù)流來產(chǎn)生已編碼數(shù)據(jù)流的方法,所述時(shí)域數(shù)據(jù)流具有信號的采樣,該方法包括步驟從數(shù)據(jù)流提供數(shù)據(jù)段;確定與數(shù)據(jù)段相關(guān)聯(lián)的轉(zhuǎn)變指示;在時(shí)域中對數(shù)據(jù)段進(jìn)行編碼,和依據(jù)第一加窗函數(shù)或者第二加窗函數(shù)對時(shí)域數(shù)據(jù)流的采樣施加權(quán)重以獲得加窗數(shù)據(jù)段,以及在頻域中對加窗數(shù)據(jù)段進(jìn)行編碼,所述第一加窗函數(shù)和第二加窗函數(shù)適于不同長度的重疊區(qū)域;以及執(zhí)行控制,使得對于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段,將在時(shí)域中編碼的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中,以及對于具有第二轉(zhuǎn)變指示的數(shù)據(jù)段,將在頻域中編碼的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中;其中,針對頻域編碼的加窗函數(shù)被設(shè)置為使得當(dāng)在從頻域向時(shí)域或者從時(shí)域向頻域切換時(shí)使用重疊大小減小的窗。
全文摘要
一種用于對表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行解碼的設(shè)備,數(shù)據(jù)段是在時(shí)域中或者在頻域中編碼的,在頻域中編碼的數(shù)據(jù)段具有表示連續(xù)且重疊的時(shí)域數(shù)據(jù)采樣塊連續(xù)數(shù)據(jù)塊。設(shè)備包括時(shí)域解碼器,用于對在時(shí)域中編碼的數(shù)據(jù)段進(jìn)行解碼;以及處理器,用于對在頻域中編碼的數(shù)據(jù)段以及時(shí)域解碼器的輸出數(shù)據(jù)進(jìn)行處理,以獲得重疊的時(shí)域數(shù)據(jù)塊。該設(shè)備還包括重疊/加法組合器,用于將重疊的時(shí)域數(shù)據(jù)塊相組合,以獲得時(shí)域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
文檔編號H04N7/26GK102395033SQ201110421510
公開日2012年3月28日 申請日期2007年12月7日 優(yōu)先權(quán)日2006年12月12日
發(fā)明者于爾根·赫勒, 尼古拉斯·里特爾博謝, 拉爾夫·蓋格爾, 斯特凡·蓋爾斯貝格, 橫谷義一, 馬克斯·諾伊恩多夫 申請人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會