對表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行編碼和解碼的編碼器、解碼器以及方法

文檔序號：7780351閱讀：294來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：對表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行編碼和解碼的編碼器、解碼器以及方法
技術(shù)領(lǐng)域：
本發(fā)明屬于編碼領(lǐng)域，其中，例如在視頻以及音頻編碼中，針對編碼速率來使用將被編碼的數(shù)據(jù)的不同特性。
背景技術(shù)：
當(dāng)前技術(shù)的編碼策略可以利用將被編碼的數(shù)據(jù)流的特性。例如，在音頻編碼中，使用感知模型對原始數(shù)據(jù)進(jìn)行壓縮，而在重新播放時(shí)幾乎不會有顯著的質(zhì)量降低和降級。現(xiàn)代的感知音頻編碼方案，例如 MPEG2/4AAC(MPEG = Moving Pictures Expert Group, 運(yùn)動(dòng)圖像專家組；AAC = Advanced Audio Coding,高級音頻編碼)，參見Generic Coding of Moving Pictures and Associated Audio :Advanced Audio Coding, International Standard 13818-7，IS0/IEC JTC1/SC29/WG11 Moving Pictures Expert Group，1997，可以使用濾波器組，例如修正離散余弦變換(Modified Discrete Cosine Transform，MDCT)，以便在頻域中表示音頻信號。在頻域中，可以依據(jù)感知模型來進(jìn)行頻率系數(shù)的量化。對于一般類型的音頻信號 (例如音樂)，這樣的編碼器可以提供優(yōu)越的感知音頻質(zhì)量。另一方面，現(xiàn)代的語音編碼器，例如 ACELP (ACELP = Algebraic Code Excited Linear Prediction，代數(shù)碼激發(fā)線性預(yù)測)，使用一種預(yù)測的方式，并且利用此種方式可以在時(shí)域中表示音頻/語音信號。這樣的語音編碼器可以對人類語音產(chǎn)生過程(即，人類聲道)的特征進(jìn)行建模，從而以較低的比特率即可達(dá)到優(yōu)越的語音信號性能。反之，對于以低比特率編碼的語音，感知音頻編碼器無法達(dá)到語音編碼器所提供的性能水平，并且使用語音編碼器來表示一般的音頻信號/音樂會造成顯著的質(zhì)量減損。傳統(tǒng)的構(gòu)思提供一種分層組合，在所述分層組合中所有的局部編碼器始終是活動(dòng)的(即，時(shí)域和頻域編碼器)，通過將這些局部編碼器對于一個(gè)給定的處理過的時(shí)間幀所作的貢獻(xiàn)相組合，計(jì)算出最終的輸出信號。分層編碼的一般示例是MPEG-4可縮放語音/音頻編碼，具有作為基本層的語音編碼器以及基于濾波器組的增強(qiáng)層，參見Bernhard Grill, Karlheinz Brandenburg, "A Two-or Three Stage Bit-Rate Scalable Audio Coding System, Preprint Number 4132,99th Convention of the AES (1995 ^9^ )。傳統(tǒng)的頻域編碼器可以利用MDCT濾波器組。因?yàn)镸DCT優(yōu)秀的性質(zhì)，其已經(jīng)成為用于傳統(tǒng)感知音頻編碼器的最具優(yōu)勢的濾波器組。舉例而言，MDCT可以在處理塊之間提供平滑的交叉衰落(cross fade)。例如，即使由于譜系數(shù)的量化使得在每一個(gè)處理塊中的信號皆以不同的方式改變，然而因?yàn)榧哟暗闹丿B/加法(windowed overlap/add)操作，所以不會產(chǎn)生因?yàn)閺囊粋€(gè)塊到另一個(gè)塊的突然轉(zhuǎn)變而造成的分塊偽跡(blocking artifact) 0 MDCT 使用時(shí)域混迭消除(time-domain aliasing cancellation, TDAC)的構(gòu)思。MDCT是一種以IV型離散余弦變換為基礎(chǔ)的傅立葉相關(guān)變換，具有重迭的附加性質(zhì)。MDCT被設(shè)計(jì)為用于在較大數(shù)據(jù)集合的連續(xù)塊中執(zhí)行，其中隨后的塊互相重疊，使得一個(gè)塊的后半部與下一個(gè)塊的前半部重合。除了 DCT的能量壓縮(energy-compaction)質(zhì)量之外，這種重疊使得MDCT對于信號壓縮應(yīng)用是特別有吸引力的，因?yàn)檫@種重疊有助于避免源于塊邊界的所述偽跡。作為重迭變換(lapped transform)，MDCT與其它傅立葉相關(guān)的變換相比的些許不同之處在于，MDCT的輸出的數(shù)目僅有輸入的數(shù)目的一半，而非與輸入的數(shù)目相同。具體地，將2N個(gè)實(shí)數(shù)轉(zhuǎn)換成N個(gè)實(shí)數(shù)，其中N是正整數(shù)。逆MDCT也稱為IMDCT。因?yàn)檩斎肱c輸出的數(shù)目不相同，在乍看之下MDCT似乎是不可逆的。然而，通過將隨后重疊塊的重疊IMDCT相加，實(shí)現(xiàn)了完美的可逆性，這使得消除誤差并恢復(fù)原始數(shù)據(jù)(即，實(shí)現(xiàn)TDAC)。于是，濾波器組輸出處譜值的數(shù)目等于該濾波器組輸入處時(shí)域輸入值的數(shù)目，這也稱作臨界采樣(critical sampling)。MDCT濾波器組提供了高頻率選擇性，并且能夠得到高編碼增益。通過使用時(shí)域混迭消除技術(shù)，可以實(shí)現(xiàn)塊和臨界采樣的重疊性質(zhì)，參見J. I^rincen，A. Bradley, "Analysis/ Synthesis Filter Band Design Based on Time Domain Aliasing Cancellation,，，，IEEE Trans. ASSP，ASSP-34(5) :1153-1161,1986。圖 4 說明了 MDCT 的這些效應(yīng)。圖 4 示出了 MDCT輸入信號，以沿著上面的時(shí)間軸400的脈沖來表示。然后利用兩個(gè)連續(xù)的加窗和MDCT 塊對輸入信號400進(jìn)行轉(zhuǎn)換，其中在圖4中輸入信號400的下方示出了窗410。在圖4中以時(shí)間線420和425顯示了經(jīng)過后向變換之后獨(dú)立的、加窗的信號。在逆MDCT之后，第一塊產(chǎn)生具有正號的混迭分量420，第二塊產(chǎn)生具有相同大小并且具有負(fù)號的混迭分量425。如在圖4的底部的最終輸出430處所顯示的，在兩個(gè)輸出信號420與425相加之后這兩個(gè)混迭分量互相抵消。在“擴(kuò)展適應(yīng)性多速率寬帶(AMR-WB+)編解碼器”，3GPP TS26. 290V6. 3. 0，2005-06 技術(shù)規(guī)范中，詳細(xì)說明了 AMR-WB+(AMR-WB = Adaptive Multi-Rate Wideband，適應(yīng)性多速率寬帶)編解碼器。依據(jù)第5. 2節(jié)，AMR-WB+編解碼器核心的編碼算法基于混合ACELP/ TCX(TCX = Transform Coded Excitation，變換編碼激發(fā))模型。對于輸入信號的每一個(gè)塊，編碼器可以在開回路或者閉回路模式下決定哪一種編碼模式，即，ACELP或者TCX，是最佳的。ACELP是時(shí)域預(yù)測編碼器，最適于語音和瞬態(tài)信號。AMR-WB編碼器用于ACELP模式中。備選地，TCX模型是基于變換的編碼器，并且更適于典型的音樂采樣。具體地，AMR-WB+針對變換編碼模式TCX使用離散傅立葉變換(DFT)。為了允許相鄰塊之間的平滑轉(zhuǎn)變，使用加窗和重疊。這種加窗和重疊對于不同的編碼模式(TCX/ACELP) 之間的轉(zhuǎn)變以及對于連續(xù)的TCX幀之間的轉(zhuǎn)變而言都是必要的。因此，DFT與加窗和重疊一起表示并未經(jīng)過臨界采樣的濾波器組。濾波器組產(chǎn)生比新的輸入采樣的數(shù)目更多的頻率值，參見在 3GPP TS 26. 290V6. 3. 0 (3GPP = Third Generation Partnership Project，第三代伙伴計(jì)劃，TS = Technical Specification，技術(shù)規(guī)范)中的圖4。每一個(gè)TCX幀使用 1/8幀長度的重疊，所述幀長度系等于新的輸入采樣的數(shù)目。因此，該DFT的對應(yīng)長度是9/8 幀長度。考慮在TCX中非臨界采樣的DFT濾波器組，即，在濾波器組輸出處譜值的數(shù)目大于在該濾波器組輸入處時(shí)域輸入值的數(shù)目，這種頻域編碼模式與諸如AAC (AAC = Advanced Audio Coding，高級音頻編碼)等使用MDCT (臨界采樣的重迭變換)的音頻編解碼器不同。在 Fielder, Louis D. ；Todd, Craig C. ,"The Design of a Video FriendlyAudio Coding System for Distributing Applications,，，，Paper Number 17-008, The AES 17th International Conference =High-Qqality Audio Coding (1999 ^ 8 ^ ), \)JsR Fielder,Louis D. ；Davidson,Grant A. , "Audio Coding Tools for Digital Television Distribution,",Preprint Number 5104,108thConvention of the AES(2000^ 1 ^)巾，描述了杜比E(Dolby Ε)編解碼器。杜比E編解碼器使用MDCT濾波器組。在這種編碼的設(shè)計(jì)中，特別關(guān)注在編碼域中直接執(zhí)行編輯的可能性。為了達(dá)成這個(gè)目標(biāo)，使用特殊的無混迭窗。在這些窗的邊界，不同信號部分的平滑交叉衰落或接合是可能的。在前文中所參考的文件中概括出，例如參見"iThe Design of a Video Friendly Audio Coding System for Distribution Applications, ”第三節(jié)，僅簡單地使用會引入時(shí)域混迭的一般MDCT窗是不可能實(shí)現(xiàn)這一點(diǎn)的。然而，其中也指出，為了消除混迭，所需要的代價(jià)是變換系數(shù)的數(shù)目增加，這個(gè)結(jié)果指出所得到的濾波器組將不再具有臨界采樣的性質(zhì)。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種更高效的編碼和解碼數(shù)據(jù)段的構(gòu)思。利用根據(jù)權(quán)利要求1所述的用于解碼的設(shè)備、根據(jù)權(quán)利要求22所述的用于解碼的方法、根據(jù)權(quán)利要求M所述的用于產(chǎn)生已編碼數(shù)據(jù)流的設(shè)備、以及根據(jù)權(quán)利要求35所述的用于產(chǎn)生已編碼數(shù)據(jù)流的方法，實(shí)現(xiàn)了這一目的。本發(fā)明基于以下成果通過使用時(shí)域和頻域編碼器的組合，以及相應(yīng)地時(shí)域和頻域解碼器的組合，可以實(shí)現(xiàn)更高效的編碼和解碼。通過在解碼器中將時(shí)域數(shù)據(jù)轉(zhuǎn)換至頻域，以及通過將得到的轉(zhuǎn)換后的頻域數(shù)據(jù)與接收到的已經(jīng)解碼頻域數(shù)據(jù)相組合，可以以有效地對抗時(shí)間混迭問題。通過使施加到數(shù)據(jù)段的重疊窗的重疊區(qū)域適于編碼領(lǐng)域的變化，可以減少開銷。當(dāng)使用時(shí)域編碼時(shí)，以及相應(yīng)地從時(shí)域編碼切換或者切換至?xí)r域編碼時(shí)，采用具有較小重疊區(qū)域的窗可以是有利的。本發(fā)明的實(shí)施例可以提供一種通用的音頻編碼和解碼構(gòu)思，對于例如語音信號和音樂信號這兩種類型的輸入信號可以實(shí)現(xiàn)更高的性能。實(shí)施例可以很好地利用將多種編碼方式(如，時(shí)域和頻域編碼構(gòu)思)相組合的優(yōu)點(diǎn)。實(shí)施例可以有效地將基于濾波器組的和基于時(shí)域?yàn)榈木幋a構(gòu)思組合成單個(gè)方案。實(shí)施例可以得到一種組合的編解碼器，可以例如在用于音樂類音頻內(nèi)容的音頻編解碼器與用于語音類內(nèi)容的語音編解碼器之間進(jìn)行切換，實(shí)施例可以頻繁地使用這種切換機(jī)制，特別是對于混合的內(nèi)容。本發(fā)明的實(shí)施例可以提供不出現(xiàn)切換偽跡的優(yōu)點(diǎn)。在實(shí)施例中，對于切換過程，可以使附加傳輸數(shù)據(jù)或者附加編碼采樣的量最小化，以避免在該操作階段降低效率。由此，局部編碼器的切換式組合的構(gòu)思與所有局部編碼器始終是活動(dòng)的分層組合是不同的。

圖Ia示出了用于解碼的設(shè)備的實(shí)施例；圖Ib示出了用于解碼的設(shè)備的另一實(shí)施例；圖Ic示出了用于解碼的設(shè)備的另一實(shí)施例；圖Id示出了用于解碼的設(shè)備的另一實(shí)施例；圖Ie示出了用于解碼的設(shè)備的另一實(shí)施例；
6
圖If示出了用于解碼的設(shè)備的另一實(shí)施例；圖加示出了用于編碼的設(shè)備的實(shí)施例；圖2b示出了用于編碼的設(shè)備的另一實(shí)施例；圖2c示出了用于編碼的設(shè)備的另一實(shí)施例；圖3a說明了在一個(gè)窗的持續(xù)時(shí)間內(nèi)在頻域和時(shí)域編碼之間進(jìn)行切換時(shí)的重疊區(qū)域；圖北說明了在兩個(gè)窗的持續(xù)時(shí)間內(nèi)在頻域編碼和時(shí)域編碼之間進(jìn)行切換時(shí)的重疊區(qū)域；圖3c說明了具有不同的重疊區(qū)域的多個(gè)窗；圖3d說明了在實(shí)施例中對具有不同重疊區(qū)域的窗的使用；以及圖4示出了使用MDCT時(shí)的時(shí)域混迭消除。
具體實(shí)施例方式在下文中將參考附圖來詳細(xì)描述本發(fā)明的實(shí)施例。圖Ia示出了用于對表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行解碼的設(shè)備100，數(shù)據(jù)段是在時(shí)域中或者在頻域中編碼的，在頻域中編碼的數(shù)據(jù)段具有表示連續(xù)且重疊的時(shí)域數(shù)據(jù)采樣塊的連續(xù)數(shù)據(jù)塊。例如，所述數(shù)據(jù)流可以與音頻流相對應(yīng)，其中這些數(shù)據(jù)塊當(dāng)中的一些數(shù)據(jù)塊在時(shí)域中編碼，而其他數(shù)據(jù)塊在頻域中編碼。在頻域中編碼的數(shù)據(jù)塊或者數(shù)據(jù)段可以表示重疊數(shù)據(jù)塊的時(shí)域數(shù)據(jù)采樣。設(shè)備100包括時(shí)域解碼器110，用于對在時(shí)域中編碼的數(shù)據(jù)段進(jìn)行解碼。此外，設(shè)備100包括處理器120，用于處理在頻域中編碼的數(shù)據(jù)段以及時(shí)域解碼器110的輸出數(shù)據(jù)，以獲得重疊的時(shí)域數(shù)據(jù)塊。此外，設(shè)備100包括重疊/加法組合器130，用于將重疊的時(shí)域數(shù)據(jù)塊相組合，以獲者時(shí)域數(shù)據(jù)流的已解碼數(shù)據(jù)段。圖Ib示出了設(shè)備100的另一個(gè)實(shí)施例。在實(shí)施例中，處理器120可以包括頻域解碼器122，用于對在頻域中編碼的數(shù)據(jù)段進(jìn)行解碼，以獲得頻域數(shù)據(jù)段。此外，在實(shí)施例中，處理器120可以包括時(shí)域至頻域轉(zhuǎn)換器124，用于對時(shí)域解碼器110的輸出數(shù)據(jù)進(jìn)行轉(zhuǎn)換，以獲得轉(zhuǎn)換后的頻域數(shù)據(jù)段。此外，在實(shí)施例中，處理器120可以包括頻域組合器126，用于將頻域段以及轉(zhuǎn)換后的頻域數(shù)據(jù)段相組合，以獲得頻域數(shù)據(jù)流。處理器120還可以包括頻域至?xí)r域轉(zhuǎn)換器 128，用于將頻域數(shù)據(jù)流轉(zhuǎn)換成重疊的時(shí)域數(shù)據(jù)塊，然后可以由重疊/加法組合器130來組合這些重疊的時(shí)域數(shù)據(jù)塊。實(shí)施例可以在不作任何修改的情況下，尤其是在不放棄任何臨界采樣性質(zhì)的情況下，使用MDCT濾波器組，如同例如在MPEG-4AAC中所使用的。實(shí)施例可以提供最佳的編碼效率。實(shí)施例可以實(shí)現(xiàn)平滑的轉(zhuǎn)變，轉(zhuǎn)變至與已建立的MDCT窗兼容的時(shí)域編解碼器，同時(shí)并不引入額外的切換偽跡并且僅帶來最小的開銷。實(shí)施例可以在濾波器組中保持時(shí)域混迭，并且刻意地將對應(yīng)的時(shí)域混迭引入由時(shí)域編解碼器編碼的信號部分中。因此，所得到的時(shí)域混迭分量可以互相抵消，所采用的方式與它們針對MDCT譜的兩個(gè)連續(xù)幀所采用的方式相同。圖Ic說明了設(shè)備100的另一實(shí)施例，依據(jù)圖lc，頻域解碼器122可以包括重新量化級12加。此外，時(shí)域至頻域轉(zhuǎn)換器IM可以包括余弦調(diào)制濾波器組(cosine modulated filterbank)、擴(kuò)展重迭變換(extended lapped transform)、低延遲濾波器組或者多相濾波器組。圖Ic所示的實(shí)施例說明時(shí)域至頻域轉(zhuǎn)換器124可以包括MDCT 124a0此外，圖Ic描述了頻域組合器1 可以包括加法器126a。如圖Ic所示，頻域至?xí)r域轉(zhuǎn)換器1 可以分別包括余弦調(diào)制濾波器組以及逆MDCTUSa。可以利用編碼器來產(chǎn)生包括時(shí)域編碼和頻域編碼的數(shù)據(jù)段在內(nèi)的數(shù)據(jù)流，該編碼器將在下文中更詳細(xì)地描述。通過利用頻域編碼器對輸入信號的一些部分進(jìn)行編碼，以及利用時(shí)域編碼器對一些輸入信號的部分進(jìn)行編碼，可以實(shí)現(xiàn)在頻域編碼與時(shí)域編碼之間的切換。圖Ic所示的設(shè)備100的實(shí)施例說明了對應(yīng)的用于解碼的設(shè)備100的原理結(jié)構(gòu)。在其它的實(shí)施例中，重新量化12 以及逆修正離散余弦變換128a可以代表頻域解碼器。如圖Ic所示，對于由時(shí)域解碼器110所接管的信號部分，可以利用前向MDCT 124a 對時(shí)域解碼器110的時(shí)域輸出進(jìn)行變換。時(shí)域解碼器可以利用預(yù)測濾波器對時(shí)域編碼的數(shù)據(jù)進(jìn)行解碼。此處，在MDCT 12 的輸入會引入一些重疊，且從而會引入一些開銷。在下文中，將描述可以減小或者最小化這種開銷的一些實(shí)施例。理論上，圖Ic中所示的實(shí)施例還包括操作模式，在所述操作模式下兩個(gè)編解碼器可以并行地操作。在實(shí)施例中，處理器120可以適于處理在時(shí)域以及在頻域中并行編碼的數(shù)據(jù)段。以此方式，信號可以部分在頻域中編碼，部分在時(shí)域中編碼，類似于分層編碼方式。所得到的信號之后在頻域中加在一起，比較頻域組合器U6a。然而，實(shí)施例可以執(zhí)行專門在兩個(gè)編解碼器之間進(jìn)行切換的操作模式，并且優(yōu)選地僅具有最小數(shù)目的采樣，其中這兩個(gè)編解碼器都是活動(dòng)的，以獲得最佳的可能效率。在圖Ic中，時(shí)域解碼器110的輸出由MDCT 12 來轉(zhuǎn)換，接著再由IMDCT 128a來轉(zhuǎn)換。在另一個(gè)實(shí)施例中，這兩個(gè)步驟可以有利地組合成單個(gè)步驟，以降低復(fù)雜度。圖Id 說明了設(shè)備100的一個(gè)實(shí)施例，以說明此種方法。圖Id所示的設(shè)備100說明處理器120可以包括計(jì)算器129，用于依據(jù)時(shí)域解碼器110的輸出數(shù)據(jù)計(jì)算重疊的時(shí)域數(shù)據(jù)塊。處理器 120或者計(jì)算器1 可以適于依據(jù)時(shí)域解碼器110的輸出數(shù)據(jù)，再現(xiàn)頻域至?xí)r域轉(zhuǎn)換器1 的性質(zhì)以及相應(yīng)地重疊性質(zhì)，即，處理器120或者計(jì)算器1 可以再現(xiàn)時(shí)域數(shù)據(jù)塊的重疊特性，該重疊特性類似于由頻域至?xí)r域轉(zhuǎn)換器1 所產(chǎn)生的的重疊特性。此外，處理器120或者計(jì)算器1 可以適于依據(jù)時(shí)域解碼器110的輸出數(shù)據(jù)再現(xiàn)時(shí)域混迭，該時(shí)域混迭類似于由頻域至?xí)r域轉(zhuǎn)換器1 所引入的時(shí)域混迭。之后，頻域至?xí)r域轉(zhuǎn)換器1 可以適于將頻域解碼器122所提供的頻域數(shù)據(jù)段轉(zhuǎn)換成重疊的時(shí)域數(shù)據(jù)塊。重疊/加法組合器130可以適于組合由頻域至?xí)r域轉(zhuǎn)換器128以及計(jì)算器1 所提供的數(shù)據(jù)塊，以獲得時(shí)域數(shù)據(jù)流的已解碼數(shù)據(jù)段。如在圖Ie的實(shí)施例中所說明的，計(jì)算器1 可以包括時(shí)域混迭級129a。時(shí)域混迭級129a可以適于對時(shí)域解碼器的輸出數(shù)據(jù)進(jìn)行時(shí)間混迭，以獲得重疊的時(shí)域數(shù)據(jù)塊。對于時(shí)域編碼數(shù)據(jù)，MDCT和IMDCT的組合可以使實(shí)施例中的過程在結(jié)構(gòu)以及計(jì)算復(fù)雜度方面都更為簡化，因?yàn)樵谶@些實(shí)施例中僅剩下時(shí)域混迭(time-domain aliasing, TDA)過程。這個(gè)高效的過程可以基于許多觀察。對2N個(gè)采樣的輸入段進(jìn)行加窗的 (windowed) MDCT可以分成三個(gè)步驟。第一，將輸入信號乘以分析窗。
第二，然后將得到的結(jié)果從2N個(gè)采樣折迭(fold down)成N個(gè)采樣。對于MDCT，該過程意味著將采樣的時(shí)間反轉(zhuǎn)順序的第一個(gè)四分之一與采樣的第二個(gè)四分之一組合(即，后者減去前者)，以及將采樣的第四個(gè)四分之一與采樣的時(shí)間反轉(zhuǎn)順序的第三個(gè)四分之一組合(即，相加)。在信號的修改過的第二和第三個(gè)四分之一中，所得到的結(jié)果是經(jīng)過時(shí)間混迭的、下采樣后的信號，包括N個(gè)采樣。第三，然后使用正交DCT式變換對下采樣后的信號進(jìn)行轉(zhuǎn)換，其中所述正交DCT式變換將N個(gè)輸入映射到N個(gè)輸出采樣，以形成最終的MDCT輸出。對N個(gè)譜采樣的輸入序列進(jìn)行加窗的IMDCT重建同樣也可以分成三個(gè)步驟。第一，使用正交逆DCT式變換對N個(gè)譜采樣的輸入序列進(jìn)行轉(zhuǎn)換，所述正交逆DCT 式變換將N個(gè)輸入映射到N個(gè)輸出采樣。第二，將得到的結(jié)果從N個(gè)采樣展開成2N個(gè)采樣，這是通過以下方式來實(shí)現(xiàn)的將逆DCT變換后的值寫入2N個(gè)采樣輸出緩沖區(qū)的第二和第三個(gè)四分之一，并且分別以第二個(gè)四分之一的時(shí)間反轉(zhuǎn)且反相后的版本填充第一個(gè)四分之一，以及以第三個(gè)四分之一的時(shí)間反轉(zhuǎn)的版本填充第四個(gè)四分之一。第三，將得到的2N個(gè)采樣乘以合成窗，以形成加窗的IMDCT輸出。因此，在實(shí)施例中，利用由加窗的MDCT的第一和第二步驟，以及加窗的IMDCT 的第二和第三步驟所構(gòu)成的序列，可以高效地執(zhí)行加窗的MDCT與加窗的IMDCT的級聯(lián) (concatenation)。在實(shí)施例中可以完全省略的MDCT的第三步驟以及IMDCT的第一步驟，因?yàn)樗鼈兪窍鄬τ诒舜四孢\(yùn)算且從而互相抵銷。其余的步驟可以僅在時(shí)域中執(zhí)行，因此使用此種方式的實(shí)施例在計(jì)算復(fù)雜度上可以實(shí)質(zhì)上很低。對于由MDCT以及相繼的IMDCT組成的一個(gè)塊，MDCT的第二和第三步驟以及IMDCT 的第二和第三步驟可以寫成與下列的稀疏2NX2N矩陣相乘。
權(quán)利要求
1.一種用于依據(jù)時(shí)域數(shù)據(jù)流來產(chǎn)生已編碼數(shù)據(jù)流的設(shè)備，所述時(shí)域數(shù)據(jù)流具有信號的采樣，該設(shè)備包括區(qū)段處理器，用于從數(shù)據(jù)流提供數(shù)據(jù)段；時(shí)域編碼器，用于在時(shí)域中對加窗數(shù)據(jù)段進(jìn)行編碼；頻域編碼器，用于依據(jù)第一加窗函數(shù)或者第二加窗函數(shù)對時(shí)域數(shù)據(jù)流的采樣施加權(quán)重，以獲得加窗數(shù)據(jù)段，所述第一加窗函數(shù)和第二加窗函數(shù)適于不同長度的重疊區(qū)域，所述頻域編碼器適于在頻域中對加窗數(shù)據(jù)段進(jìn)行編碼；時(shí)域數(shù)據(jù)分析器，用于確定與數(shù)據(jù)段有關(guān)的轉(zhuǎn)變指示；以及控制器，用于控制該設(shè)備，使得對于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段，將時(shí)域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中，以及對于具有第二轉(zhuǎn)變指示的數(shù)據(jù)段，將頻域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中，其中，控制器適于針對頻域編碼器設(shè)置加窗函數(shù)，使得當(dāng)在頻域和時(shí)域之間切換時(shí)使用重疊大小減小的窗。
2.根據(jù)權(quán)利要求1所述的設(shè)備，其中，控制器適于針對頻域編碼器設(shè)置加窗函數(shù)，使得在頻域中編碼的兩個(gè)連續(xù)加窗數(shù)據(jù)段的重疊區(qū)域大小大于由在頻域中編碼的一個(gè)加窗數(shù)據(jù)段和在時(shí)域中編碼的一個(gè)加窗數(shù)據(jù)段組成的兩個(gè)連續(xù)加窗數(shù)據(jù)段的重疊區(qū)域的大小。
3.根據(jù)權(quán)利要求1所述的設(shè)備，其中，所述時(shí)域數(shù)據(jù)分析器適于從時(shí)域數(shù)據(jù)流、數(shù)據(jù)段中或者從區(qū)段處理器直接提供的數(shù)據(jù)中，確定轉(zhuǎn)變指示。
4.根據(jù)權(quán)利要求1所述的設(shè)備，其中，所述時(shí)域數(shù)據(jù)分析器適于確定轉(zhuǎn)變度量，所述轉(zhuǎn)變度量基于在時(shí)域數(shù)據(jù)流或者數(shù)據(jù)段中的瞬時(shí)性的水平，以及，其中轉(zhuǎn)變指示器指示瞬時(shí)性的水平是否超過預(yù)定的閾值。
5.根據(jù)權(quán)利要求1所述的設(shè)備，其中，所述區(qū)段處理器適于提供具有不同長度的重疊區(qū)域的數(shù)據(jù)段，時(shí)域編碼器適于對數(shù)據(jù)段進(jìn)行編碼，頻域編碼器適于對加窗數(shù)據(jù)段進(jìn)行編碼，以及控制器適于控制時(shí)域編碼器和頻域編碼器，使得對于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段，將時(shí)域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中，以及對于具有第二轉(zhuǎn)變指示的加窗數(shù)據(jù)段，將頻域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中。
6.根據(jù)權(quán)利要求1所述的設(shè)備，其中，所述控制器適于控制區(qū)段處理器將數(shù)據(jù)段提供給時(shí)域編碼器或者頻域編碼器。
7.根據(jù)權(quán)利要求1所述的設(shè)備，其中，所述頻域編碼器適于依據(jù)AAC規(guī)范來施加窗函數(shù)的權(quán)重。
8.根據(jù)權(quán)利要求1所述的設(shè)備，其中，所述頻域編碼器適于將加窗數(shù)據(jù)段轉(zhuǎn)換至頻域，以獲得頻域數(shù)據(jù)段。
9.根據(jù)權(quán)利要求8所述的設(shè)備，其中，所述頻域編碼器適于對頻域數(shù)據(jù)段進(jìn)行量化。
10.根據(jù)權(quán)利要求9所述的設(shè)備，其中，所述頻域編碼器適于依據(jù)感知模型來評估頻域數(shù)據(jù)段。
11.根據(jù)權(quán)利要求10所述的設(shè)備，其中，所述頻域編碼器適于使用余弦調(diào)制濾波器組、擴(kuò)展重迭變換、低延遲濾波器組或者多相濾波器組來獲得頻域數(shù)據(jù)段。
12.根據(jù)權(quán)利要求8所述的設(shè)備，其中，所述頻域編碼器適于使用修正離散余弦變換來獲得頻域數(shù)據(jù)段。
13.根據(jù)權(quán)利要求1所述的設(shè)備，其中，所述時(shí)域編碼器適于使用預(yù)測濾波器，以對數(shù)據(jù)段進(jìn)行編碼。
14.一種依據(jù)時(shí)域數(shù)據(jù)流來產(chǎn)生已編碼數(shù)據(jù)流的方法，所述時(shí)域數(shù)據(jù)流具有信號的采樣，該方法包括步驟從數(shù)據(jù)流提供數(shù)據(jù)段；確定與數(shù)據(jù)段相關(guān)聯(lián)的轉(zhuǎn)變指示；在時(shí)域中對數(shù)據(jù)段進(jìn)行編碼，和依據(jù)第一加窗函數(shù)或者第二加窗函數(shù)對時(shí)域數(shù)據(jù)流的采樣施加權(quán)重以獲得加窗數(shù)據(jù)段，以及在頻域中對加窗數(shù)據(jù)段進(jìn)行編碼，所述第一加窗函數(shù)和第二加窗函數(shù)適于不同長度的重疊區(qū)域；以及執(zhí)行控制，使得對于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段，將在時(shí)域中編碼的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中，以及對于具有第二轉(zhuǎn)變指示的數(shù)據(jù)段，將在頻域中編碼的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中；其中，針對頻域編碼的加窗函數(shù)被設(shè)置為使得當(dāng)在從頻域向時(shí)域或者從時(shí)域向頻域切換時(shí)使用重疊大小減小的窗。
全文摘要
一種用于對表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行解碼的設(shè)備，數(shù)據(jù)段是在時(shí)域中或者在頻域中編碼的，在頻域中編碼的數(shù)據(jù)段具有表示連續(xù)且重疊的時(shí)域數(shù)據(jù)采樣塊連續(xù)數(shù)據(jù)塊。設(shè)備包括時(shí)域解碼器，用于對在時(shí)域中編碼的數(shù)據(jù)段進(jìn)行解碼；以及處理器，用于對在頻域中編碼的數(shù)據(jù)段以及時(shí)域解碼器的輸出數(shù)據(jù)進(jìn)行處理，以獲得重疊的時(shí)域數(shù)據(jù)塊。該設(shè)備還包括重疊/加法組合器，用于將重疊的時(shí)域數(shù)據(jù)塊相組合，以獲得時(shí)域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
文檔編號H04N7/26GK102395033SQ201110421510
公開日2012年3月28日申請日期2007年12月7日優(yōu)先權(quán)日2006年12月12日
發(fā)明者于爾根·赫勒, 尼古拉斯·里特爾博謝, 拉爾夫·蓋格爾, 斯特凡·蓋爾斯貝格, 橫谷義一, 馬克斯·諾伊恩多夫申請人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：拉爾夫·蓋格爾;馬克斯·諾伊恩多夫;橫谷義一;尼古拉斯·里特爾博謝;于爾根·赫勒;斯特凡·蓋爾斯貝格
技術(shù)所有人：弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會
我是此專利的發(fā)明人

上一篇：一種實(shí)現(xiàn)非通話切換的方法
上一篇：圖像處理設(shè)備、圖像處理方法和程序的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號時(shí)頻分析理論與測試系統(tǒng)設(shè)計(jì) 2.汽車檢測系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

數(shù)據(jù)流圖中的箭頭表示相關(guān)技術(shù)

時(shí)域編碼相關(guān)技術(shù)

數(shù)據(jù)流圖相關(guān)技術(shù)

數(shù)據(jù)流相關(guān)技術(shù)

數(shù)據(jù)流小說相關(guān)技術(shù)

數(shù)據(jù)流圖實(shí)例相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

對表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行編碼和解碼的編碼器、解碼器以及方法

對表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行編碼和解碼的編碼器、解碼器以及方法