減少數(shù)位音訊解碼器的暫存需求量的方法

文檔序號：2836363閱讀：233來源：國知局

專利名稱：減少數(shù)位音訊解碼器的暫存需求量的方法
技術領域：
本發(fā)明關于一種數(shù)位音訊解碼，特別是有關于一種用以減少數(shù)位音訊解碼器的暫存需求量的方法。
先進電視系統(tǒng)委員會(Advanced Television System Committee，ATSC)提出一個稱作AC-3的對答(competing)的標準，作為高解析度電視(HighDefinition Television，HDTV)的音訊服務標準。AC-3標準也已經(jīng)應用在消費性媒體(consumer media)中，例如數(shù)位音訊光碟(DVD)以及衛(wèi)星直播(direct satellite broadcast)。一個AC-3位元流(bitstream)是由資料框(frames)所組成，資料框(frames)代表著跨在所有聲道的1536個固定日間周期的PCM樣本。其中，每個資料框(frame)有六個音言區(qū)段(audio block)，各表示著每一編碼的聲道的256個PCM樣本。AC-3音訊解碼技術需要某些步驟，例如位元分配(bit allocation)、反量化(dequantization)、去耦合(decoupling)、再矩陣化(rematrixing)、動態(tài)范圍壓縮(dynamic range compression)，以及反修正式離散余弦轉換(Inverse Modified Discrete Cosine Transform，IMDCT)。另一方面，含有兩團(granules)的每一個MP3音訊資料框表示著1152個輸入PCM音訊樣本。MP3中的一團可以視為各含有18個樣本的32個次頻帶，共具有576個樣本。MP3位元流的解碼亦需要一些步驟，例如音訊樣本的可變長度解碼(variable length decoding of audio samples)、縮放因子與位元分配的解碼(decoding of scale factors and bitallocation)、樣本的反量化(dequantization of samples)、反修正式離散余弦轉換的計算(computation of IMDCT)，以及次頻帶樣本合成(synthesis of subband sample)。
為了重組(reconstruct)數(shù)位信號，已知解決方法是提供一個很大的記憶體暫存器，足以同時儲存一資料框中所有聲道的資料，使得一個解碼器可以將音訊信號由頻域轉換至時域。舉上述AC-3位元流的解碼為例，使用需求512×6＝3072個樣本(Samples)的一輸入暫存器，用以實施一50％重疊的反修正式離散余弦轉換(IMDCT)，以及需求256×6＝1536個樣本的一輸出暫存器，用以實施IMDCT。同樣地，已知MP3解碼器使用一個需求576×2＝1152個樣本的一輸入暫存器用以實施一50％重疊的IMDCT、需求576×2＝1152樣本之一合成輸入暫存器(synthesis InPut buffer)用以實施次頻帶合成(subband synthesis)，以及需求576×2＝1152個PCM樣本之一輸出暫存器。雖然原則上是易于實施的，但是就設計于一單晶片上的數(shù)位音訊解碼器的尺寸、成本以及復雜度而言是過多了。因此，需要一個與已知相較而言可以大大地減少暫存需求量的數(shù)位音訊解碼器。
本發(fā)明的目的是這樣實現(xiàn)的一種減少數(shù)位音訊解碼器的暫存需求量的方法，包括(a)由一位元流之一資料框中，取出此時須將被解碼至一聲道的N個樣本，其中N為一第一既定數(shù)目，且為一正整數(shù)；(b)儲存上述取出的N個樣本，至可容納上述取出的N個樣本之一第一暫存器；(c)對上述取出的N個樣本，實施一反轉換，以便一次產(chǎn)生含有K個PCM樣本的一次資料區(qū)段，其中上述次資料區(qū)段是為一PCM輸出資料框的一部份，在此K為一第二既定數(shù)目，且K為一小于N的正整數(shù)；(d)儲存上述次資料區(qū)段，至可容納上述K個PCM樣本之一第二暫存器；(e)丟棄上述取出的N個樣本；以及(f)重覆上述步驟(a)至步驟(e)，直到完全取得上述音訊聲道的上述PCM輸出資料框。
上述位元流符合AC-3規(guī)格。
上述反轉換為一反修正式離散余弦轉換(IMDCT)。
上述第一既定數(shù)目N為256。
上述第一既定數(shù)目與第二既定數(shù)目間的關系為K=N2n]]>此處n≥0，且n為一正整數(shù)。
上述位元流符合MPEG-2進階編碼技術標準(Advanced Audio Codingstandrad)。
上述反轉換為一反修正式離散余弦轉換(IMDCT)。
一種減少數(shù)位音訊解碼器的暫存需求量的方法包括(a)由一位元流中含有M個樣本之一資料框內，取出此時須被解譯至一聲道的N個樣本，其中N為一第一既定數(shù)目，M為一第二既定數(shù)目，N、M為正整數(shù)且M≥N；(b)儲存上述取出的N個樣本，至可容納上述取出的N個樣本之一第一暫存器；(c)對存于上述第一暫存器中的上述取出的N個樣本，實施一反轉換以便一次產(chǎn)生至少一個次頻帶樣本；(d)儲存上述次頻帶樣本，至可容納上述K個次頻帶樣本之一第二暫存器，其中K為一第三既定數(shù)目，且為一正整數(shù)；(e)丟棄上述取出的N個樣本；以及(f)重復上述步驟(a)至步驟(e)，直到完全取得上述聲道的K個次頻帶樣本。
更包括(g)將存于上述第二暫存器之上述K個次頻帶樣本，供應至一合成濾波器組；(h)由上述合成濾波器組，將上述K個次頻帶樣本重組成PCM輸出樣本之一資料區(qū)段。
上述位元流符合MPEG layer-3(MP3)格式。
此外，本發(fā)明是針對減少一個以平面轉換為基底的解碼系統(tǒng)中，一數(shù)位音訊解碼器的暫存需求量的方法。根據(jù)本發(fā)明的一實施例，首先是由一位元流之一資料框中，取出此時須將被解碼至一聲道的N個樣本，其中N為一第一既定數(shù)目，且為一正整數(shù)。被取出的N個樣本，接著被儲存至可容納取出的N個樣本之一第一暫存器。然后，對第一暫存器中上述取出的N個樣本，實施一反轉換，以便一次產(chǎn)生含有K個PCM樣本的一次資料區(qū)段。要注意的是，上述次資料區(qū)段是為一PCM輸出資料框的一部份，在此K為一第二既定數(shù)目，且K為一小于N的正整數(shù)。之后，丟棄上述取出的N個樣本。接著，重復前述步驟，直到完全取得上述聲道的PCM輸出資料框為止。
根據(jù)本發(fā)明的另一實施例，是揭露減少一個使用濾波器組混合之一數(shù)位音訊解碼器的暫存需求量的方法。本發(fā)明首先是由一位元流中含有M個樣本之一資料框內，取出此時須被解譯至一聲道的N個樣本。接著，將被取出的N個樣本，儲存至可容納取出的N個樣本之一第一暫存器。注意，N為一第一既定數(shù)目，M為一第二既定數(shù)目，N、M為正整數(shù)且M≥N。然后，對存于第一暫存器中的上述取出的N個樣本，實施一反轉換以便一次產(chǎn)生至少一個次頻帶樣本接下來，將上述次頻帶樣本，儲存至可容納K個次頻帶樣本之一第二暫存器，其中K為一第三既定數(shù)目，且為一正整數(shù)。之后，丟棄上述取出的N個樣本。重覆前述步驟，直到完全取得上述聲道的K個次頻帶樣本為止。一旦K個次頻帶樣本全部存于第二暫存器中時，K個次頻帶樣本將被應用至一含有K個次頻帶的合成濾波器組，同時，上述合成濾波器組將K個次頻帶樣本，重組成PCM輸出樣本的一資料區(qū)段。

圖1B是為用于已知MPEG Layer-3解碼系統(tǒng)之一合成濾波器組的方塊圖。
圖2A是顯示本發(fā)明對于MPEG Layer-3解碼之一實施例。
圖2B是為圖2A中的動作的流程圖。
圖3A是顯示本發(fā)明對于AC-3解碼的另一實施例。
圖3B是為圖3A中的動作的流程圖。圖號說明102、112MDCT 114多相濾波器組202、302IMDCT暫存器204、304IMDCT邏輯206次頻帶暫存器208合成濾波器組306PCM暫存器
AC-3是純粹使用修正式離散余弦轉換(Modified Discrete CosineTransform，MDCT)來編碼。如圖1A中所示，AC-3解碼器使用一個50％重疊的512點(512-Point)離散余弦轉換，PCM輸入樣本會被供應至一濾波器組(filer bank)102，以便每個音訊資料區(qū)段(audio block)產(chǎn)生256個頻譜分量(frequency components)C(k)k＝0...255。于瞬態(tài)信號(transient signal)的情況中，用兩個256點轉換(256-pointtransform)取代上述512點轉換，由使用一區(qū)塊交換(block-switching)技術達到效能的提升。根據(jù)理想的時域混疊消除(time domain aliascancellation，TDAC)下，修正式離散余弦轉換(MDCT)是為一種線性正交重疊轉換(linear orthogonal lapped transform)。
參考圖1B，于MPEG Layer-3中使用的濾波器組為含有一多相濾波器組114及一MDCT112之一合成濾波器組(hybrid filterbank)，此合成格式會選擇相容于先前的格式，如Layer-1及Layer-2。首先，使用多相濾波器組114，數(shù)位音訊信號(PCM input)會被分成32個次頻帶信號SB(j)j＝0...31。上述復數(shù)次頻帶會被等間距地設置于由0至半個被取樣頻的頻域上。為了達到更接近人類聲覺的臨界頻帶(critical band)的較高頻率解析度，上述32個次頻帶信號SB(j)j＝0...31會由一具有動態(tài)窗切換(dynamic window switching)的6點或8點的MDCT轉換，更進步再細分成頻譜分量。每個次頻帶會再分成18個更細微的頻譜分量，總計為576個頻譜分量SB(k)k＝0...575，增加了去除冗于部分的可能性，對聲調信號來說使得編碼的效率更好。上述MDCT可以切換成將每個次頻帶產(chǎn)生6個頻譜分量(short-window MDCTs)或是18個頻譜分量(long-windowMDCTs)。注意，上述MDCT是為一50％重疊轉換，因此，實際上，它分別是一12點或一36點轉換。與MPEG Layer-3的合成濾波器組相比，MPEG-2 AAC使用類似于AC-3的一種平面MDCT區(qū)塊轉換(plain MDCT blocktransform)。舉例來說，于AAC編碼器中的濾波器組，為具有50％重疊(2048個樣本的window length)之一1024線的MDCT。上述濾波器組可以切換8組128線的MDCTs(256個樣本的window length)。因此，與Layer-3中576條頻譜線相比，AAC中頻譜線的數(shù)目增加至1024條。
解碼的步驟非常容易，恰好跟上述編碼的步驟相反，所要做的只是由c編碼的頻譜分量(spectral component)合成為一音訊信號。事實上，本發(fā)明是運用含有已編碼資料集(Integrally encoded data)的次資料框(sub-frames)或音訊資料區(qū)段(audio blocks)的一個已編碼的音訊資料框(audio frame)。不像已知為了反轉換，而將整個資料框存于記憶體中，本發(fā)明將MPEG或AC-3位元流(bitstream)解碼，透過暫存記憶體儲存所需的樣本。本發(fā)明試圖只當反轉換需要資料時，由位元流中取出有用的資料，為了減少暫存量，一次只處理一個已編碼的聲道。
本發(fā)明適用于MPEG layer-3的方法，將以圖2A中的實施例，配合圖2B中相關流程圖用以說明。于步驟S210中，由一MP3位元流之一資料框(sub-frame)中，取出此時須將被解碼至一聲道的N個樣本，其中上資料框(granule)含有M個樣本。注意，N為一第一既定數(shù)目，M為一第二既定數(shù)目，且M與N皆為正整數(shù)。于關于MP3的此一實施例中，M會等于576，且N會等于18。接著，于步驟S212中，上述被取出的N(N＝18)個樣本，被儲存至可容納取出的N個樣本之一IMDCT暫存器202。隨著步驟S214中的IMDCT邏輯204，對IMDCT暫存器202中的上述N(N＝18)個樣本，實施一反轉換，以便一次產(chǎn)生至少一個次頻帶樣本(subbandsample)。之后，于步驟216中，上述次頻帶樣本會被儲存至一個次頻帶暫存器(subband buffer)206。其中K為一第三既定數(shù)目，且K為32。接下來，于步驟S218中，丟棄上述取出的N個樣本，以儲存新的樣本。接著，于步驟S220中，重覆前述步驟S210-S218，直到完全取得上述聲道(audio channel)的32個次頻帶樣本(subband sample)為止。一旦32個次頻帶樣本皆被儲存至次頻帶暫存器206中時，于步驟S222中，32個次頻帶樣本會被供應至含有K個(K＝32)次頻帶之一合成濾波器組(synthesis fliterbank)208。同時，于步驟S224中，由合成濾波器組208將32個次頻帶樣本，重組(reconstruct)成一PCM輸出樣本的資料區(qū)段(block)。在此方法中，32個次頻帶的次頻帶樣本會每一次都被反轉換(inverse-transformerd)，再供應至合成濾波器組208，因此可以產(chǎn)生出連續(xù)不斷的PCM輸出樣本。
關于AC-3解碼的程序，將以圖3A中的另一實施例，配合圖3B中相關流程圖用以說明。本發(fā)明適用于AC-3的解碼步驟，與用于MEPG Layer-3的解碼步驟相似，但不使用一合成濾波器組。于步驟S310中，由一AC-3位元流之一資料框(sub-frame)中，取出此時須將被解碼至一聲道之N個樣本，其中N為一第一既定數(shù)目，且為一正整數(shù)。接著，于步驟S312中，上述被取出的N個樣本，被儲存至可容納取出的N個樣本之一IMDCT暫存器302。隨著步驟S314中的IMDCT邏輯304，對IMDCT暫存器302中的上述N個樣本，實施一反轉換，以便一次產(chǎn)生含有K個次頻帶樣本(subband sample)的一資料區(qū)段(sub-block)。之后，于步驟316中，剛剛產(chǎn)生的上述資料區(qū)段會被儲存至一個PCM暫存器306。注意，上述資料區(qū)段(sub-block)是為一PCM輸出資料框(audio block)的一部分，其中K為一第二既定數(shù)目，且K為一個小于N的正整數(shù)。接下來，于步驟S318中，丟棄存于IMDCT暫存器302中的上述N個樣本，以儲存新的樣本。接著，于步驟S320中，重覆前述步驟S310-S318，直到完全取得上述聲道(audio channel)之一PCM出輸資料框為止。隨著下一個次資料框被取樣以及反轉換，前述步驟會繼續(xù)執(zhí)行，而得以進行重組(reconstruction)。既然對AC-3而言，N為二的次方，第一既定數(shù)目N與第二既定數(shù)目M之間的關系，因此被定義為K=N2n]]>此處n≥0，且n為一正整數(shù)。對于實施例中，上述第一既定數(shù)目N為256，上述第一既定數(shù)目M為16(所以n＝4)。
雖然本發(fā)明是參照MPEG Layer-3標準及AC-3標準來說明，但不用以限定本發(fā)明，同樣也可以應該于MPEG-2標準、AAC標準，以及除了MPEG及AC-3之外的編碼架構。因此，本發(fā)明由提供一個可以比已知大大地減少了暫存需求量的方法，而填補了現(xiàn)存于已知技術中的需求。
權利要求
1.一種減少數(shù)位音訊解碼器的暫存需求量的方法，包括(a)由一位元流之一資料框中，取出此時須將被解碼至一聲道的N個樣本，其中N為一第一既定數(shù)目，且為一正整數(shù)；(b)儲存上述取出的N個樣本，至可容納上述取出的N個樣本之一第一暫存器；(c)對上述取出的N個樣本，實施一反轉換，以便一次產(chǎn)生含有K個PCM樣本的一次資料區(qū)段，其中上述次資料區(qū)段是為一PCM輸出資料框的一部份，在此K為一第二既定數(shù)目，且K為一小于N的正整數(shù)；(d)儲存上述次資料區(qū)段，至可容納上述K個PCM樣本之一第二暫存器；(e)丟棄上述取出的N個樣本；以及(f)重覆上述步驟(a)至步驟(e)，直到完全取得上述音訊聲道的上述PCM輸出資料框。
2.如權利要求1所述的減少數(shù)位音訊解碼器的暫存需求量的方法，其特征在于，上述位元流符合AC-3規(guī)格。
3.如權利要求2所述的減少數(shù)位音訊解碼器的暫存需求量的方法，其特征在于，上述反轉換為一反修正式離散余弦轉換(IMDCT)。
4.如權利要求2所述的減少數(shù)位音訊解碼器的暫存需求量的方法，其特征在于，上述第一既定數(shù)目N為256。
5.如權利要求1所述的減少數(shù)位音訊解碼器的暫存需求量的方法，其特征在于，上述第一既定數(shù)目與第二既定數(shù)目間的關系為K=N2n]]>此處n≥0，且n為一正整數(shù)。
6.如權利要求1所述的減少數(shù)位音訊解碼器的暫存需求量的方法，其特征在于，上述位元流符合MPEG-2進階編碼技術標準(Advanced AudioCoding standrad)。
7.如權利要求6所述的減少數(shù)位音訊解碼器的暫存需求量的方法，其特征在于，上述反轉換為一反修正式離散余弦轉換(IMDCT)。
8.一種減少數(shù)位音訊解碼器的暫存需求量的方法包括(a)由一位元流中含有M個樣本之一資料框內，取出此時須被解譯至一聲道的N個樣本，其中N為一第一既定數(shù)目，M為一第二既定數(shù)目，N、M為正整數(shù)且M≥N；(b)儲存上述取出的N個樣本，至可容納上述取出的N個樣本之一第一暫存器；(c)對存于上述第一暫存器中的上述取出的N個樣本，實施一反轉換以便一次產(chǎn)生至少一個次頻帶樣本；(d)儲存上述次頻帶樣本，至可容納上述K個次頻帶樣本之一第二暫存器，其中K為一第三既定數(shù)目，且為一正整數(shù)；(e)丟棄上述取出的N個樣本；以及(f)重復上述步驟(a)至步驟(e)，直到完全取得上述聲道的K個次頻帶樣本。
9.如權利要求1所述的減少數(shù)位音訊解碼器的暫存需求量的方法，其特征在于，更包括(g)將存于上述第二暫存器之上述K個次頻帶樣本，供應至一合成濾波器組；(h)由上述合成濾波器組，將上述K個次頻帶樣本重組成PCM輸出樣本之一資料區(qū)段。
10.如權利要求9所述的減少數(shù)位音訊解碼器的暫存需求量的方法，其特征在于，上述位元流符合MPEG layer-3(MP3)格式。
全文摘要
本發(fā)明提供一種減少數(shù)位音訊解碼器的暫存需求量的方法。首先，由一位元流之一資料框中，取出此時須將被解碼至一聲道的N個樣本。由一反轉換，以便一次估算出含有K個PCM樣本之一大資料區(qū)段。然后，丟棄上述取出的N個樣本。注意，取出的樣本數(shù)目會大于或等于產(chǎn)生的資料區(qū)段的PCM樣本數(shù)目，即N≥K。接著，重復前述步驟，直到完全取得上述聲道的大資料框為止。
文檔編號G10L19/00GK1468003SQ0214891
公開日2004年1月14日申請日期2002年11月8日優(yōu)先權日2002年7月9日
發(fā)明者李忠憲, 黃心怡申請人:矽統(tǒng)科技股份有限公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：李忠憲;黃心怡
技術所有人：矽統(tǒng)科技股份有限公司
我是此專利的發(fā)明人

上一篇：采用校正信號抑制壓力波的系統(tǒng)和方法
上一篇：手拍鼓的制作方法

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

減少香煙需求量的方法相關技術

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

減少數(shù)位音訊解碼器的暫存需求量的方法