專利名稱:減少數(shù)位音訊解碼器的暫存需求量的方法
技術領域:
本發(fā)明關于一種數(shù)位音訊解碼,特別是有關于一種用以減少數(shù)位音訊解碼器的暫存需求量的方法。
先進電視系統(tǒng)委員會(Advanced Television System Committee,ATSC)提出一個稱作AC-3的對答(competing)的標準,作為高解析度電視(HighDefinition Television,HDTV)的音訊服務標準。AC-3標準也已經(jīng)應用在消費性媒體(consumer media)中,例如數(shù)位音訊光碟(DVD)以及衛(wèi)星直播(direct satellite broadcast)。一個AC-3位元流(bitstream)是由資料框(frames)所組成,資料框(frames)代表著跨在所有聲道的1536個固定日間周期的PCM樣本。其中,每個資料框(frame)有六個音言區(qū)段(audio block),各表示著每一編碼的聲道的256個PCM樣本。AC-3音訊解碼技術需要某些步驟,例如位元分配(bit allocation)、反量化(dequantization)、去耦合(decoupling)、再矩陣化(rematrixing)、動態(tài)范圍壓縮(dynamic range compression),以及反修正式離散余弦轉換(Inverse Modified Discrete Cosine Transform,IMDCT)。另一方面,含有兩團(granules)的每一個MP3音訊資料框表示著1152個輸入PCM音訊樣本。MP3中的一團可以視為各含有18個樣本的32個次頻帶,共具有576個樣本。MP3位元流的解碼亦需要一些步驟,例如音訊樣本的可變長度解碼(variable length decoding of audio samples)、縮放因子與位元分配的解碼(decoding of scale factors and bitallocation)、樣本的反量化(dequantization of samples)、反修正式離散余弦轉換的計算(computation of IMDCT),以及次頻帶樣本合成(synthesis of subband sample)。
為了重組(reconstruct)數(shù)位信號,已知解決方法是提供一個很大的記憶體暫存器,足以同時儲存一資料框中所有聲道的資料,使得一個解碼器可以將音訊信號由頻域轉換至時域。舉上述AC-3位元流的解碼為例,使用需求512×6=3072個樣本(Samples)的一輸入暫存器,用以實施一50%重疊的反修正式離散余弦轉換(IMDCT),以及需求256×6=1536個樣本的一輸出暫存器,用以實施IMDCT。同樣地,已知MP3解碼器使用一個需求576×2=1152個樣本的一輸入暫存器用以實施一50%重疊的IMDCT、需求576×2=1152樣本之一合成輸入暫存器(synthesis InPut buffer)用以實施次頻帶合成(subband synthesis),以及需求576×2=1152個PCM樣本之一輸出暫存器。雖然原則上是易于實施的,但是就設計于一單晶片上的數(shù)位音訊解碼器的尺寸、成本以及復雜度而言是過多了。因此,需要一個與已知相較而言可以大大地減少暫存需求量的數(shù)位音訊解碼器。
本發(fā)明的目的是這樣實現(xiàn)的一種減少數(shù)位音訊解碼器的暫存需求量的方法,包括(a)由一位元流之一資料框中,取出此時須將被解碼至一聲道的N個樣本,其中N為一第一既定數(shù)目,且為一正整數(shù);(b)儲存上述取出的N個樣本,至可容納上述取出的N個樣本之一第一暫存器;(c)對上述取出的N個樣本,實施一反轉換,以便一次產(chǎn)生含有K個PCM樣本的一次資料區(qū)段,其中上述次資料區(qū)段是為一PCM輸出資料框的一部份,在此K為一第二既定數(shù)目,且K為一小于N的正整數(shù);(d)儲存上述次資料區(qū)段,至可容納上述K個PCM樣本之一第二暫存器;(e)丟棄上述取出的N個樣本;以及(f)重覆上述步驟(a)至步驟(e),直到完全取得上述音訊聲道的上述PCM輸出資料框。
上述位元流符合AC-3規(guī)格。
上述反轉換為一反修正式離散余弦轉換(IMDCT)。
上述第一既定數(shù)目N為256。
上述第一既定數(shù)目與第二既定數(shù)目間的關系為K=N2n]]>此處n≥0,且n為一正整數(shù)。
上述位元流符合MPEG-2進階編碼技術標準(Advanced Audio Codingstandrad)。
上述反轉換為一反修正式離散余弦轉換(IMDCT)。
一種減少數(shù)位音訊解碼器的暫存需求量的方法包括(a)由一位元流中含有M個樣本之一資料框內,取出此時須被解譯至一聲道的N個樣本,其中N為一第一既定數(shù)目,M為一第二既定數(shù)目,N、M為正整數(shù)且M≥N;(b)儲存上述取出的N個樣本,至可容納上述取出的N個樣本之一第一暫存器;(c)對存于上述第一暫存器中的上述取出的N個樣本,實施一反轉換以便一次產(chǎn)生至少一個次頻帶樣本;(d)儲存上述次頻帶樣本,至可容納上述K個次頻帶樣本之一第二暫存器,其中K為一第三既定數(shù)目,且為一正整數(shù);(e)丟棄上述取出的N個樣本;以及(f)重復上述步驟(a)至步驟(e),直到完全取得上述聲道的K個次頻帶樣本。
更包括(g)將存于上述第二暫存器之上述K個次頻帶樣本,供應至一合成濾波器組;(h)由上述合成濾波器組,將上述K個次頻帶樣本重組成PCM輸出樣本之一資料區(qū)段。
上述位元流符合MPEG layer-3(MP3)格式。
此外,本發(fā)明是針對減少一個以平面轉換為基底的解碼系統(tǒng)中,一數(shù)位音訊解碼器的暫存需求量的方法。根據(jù)本發(fā)明的一實施例,首先是由一位元流之一資料框中,取出此時須將被解碼至一聲道的N個樣本,其中N為一第一既定數(shù)目,且為一正整數(shù)。被取出的N個樣本,接著被儲存至可容納取出的N個樣本之一第一暫存器。然后,對第一暫存器中上述取出的N個樣本,實施一反轉換,以便一次產(chǎn)生含有K個PCM樣本的一次資料區(qū)段。要注意的是,上述次資料區(qū)段是為一PCM輸出資料框的一部份,在此K為一第二既定數(shù)目,且K為一小于N的正整數(shù)。之后,丟棄上述取出的N個樣本。接著,重復前述步驟,直到完全取得上述聲道的PCM輸出資料框為止。
根據(jù)本發(fā)明的另一實施例,是揭露減少一個使用濾波器組混合之一數(shù)位音訊解碼器的暫存需求量的方法。本發(fā)明首先是由一位元流中含有M個樣本之一資料框內,取出此時須被解譯至一聲道的N個樣本。接著,將被取出的N個樣本,儲存至可容納取出的N個樣本之一第一暫存器。注意,N為一第一既定數(shù)目,M為一第二既定數(shù)目,N、M為正整數(shù)且M≥N。然后,對存于第一暫存器中的上述取出的N個樣本,實施一反轉換以便一次產(chǎn)生至少一個次頻帶樣本接下來,將上述次頻帶樣本,儲存至可容納K個次頻帶樣本之一第二暫存器,其中K為一第三既定數(shù)目,且為一正整數(shù)。之后,丟棄上述取出的N個樣本。重覆前述步驟,直到完全取得上述聲道的K個次頻帶樣本為止。一旦K個次頻帶樣本全部存于第二暫存器中時,K個次頻帶樣本將被應用至一含有K個次頻帶的合成濾波器組,同時,上述合成濾波器組將K個次頻帶樣本,重組成PCM輸出樣本的一資料區(qū)段。
圖1B是為用于已知MPEG Layer-3解碼系統(tǒng)之一合成濾波器組的方塊圖。
圖2A是顯示本發(fā)明對于MPEG Layer-3解碼之一實施例。
圖2B是為圖2A中的動作的流程圖。
圖3A是顯示本發(fā)明對于AC-3解碼的另一實施例。
圖3B是為圖3A中的動作的流程圖。圖號說明102、112MDCT 114多相濾波器組202、302IMDCT暫存器204、304IMDCT邏輯206次頻帶暫存器208合成濾波器組306PCM暫存器
AC-3是純粹使用修正式離散余弦轉換(Modified Discrete CosineTransform,MDCT)來編碼。如圖1A中所示,AC-3解碼器使用一個50%重疊的512點(512-Point)離散余弦轉換,PCM輸入樣本會被供應至一濾波器組(filer bank)102,以便每個音訊資料區(qū)段(audio block)產(chǎn)生256個頻譜分量(frequency components)C(k)k=0...255。于瞬態(tài)信號(transient signal)的情況中,用兩個256點轉換(256-pointtransform)取代上述512點轉換,由使用一區(qū)塊交換(block-switching)技術達到效能的提升。根據(jù)理想的時域混疊消除(time domain aliascancellation,TDAC)下,修正式離散余弦轉換(MDCT)是為一種線性正交重疊轉換(linear orthogonal lapped transform)。
參考圖1B,于MPEG Layer-3中使用的濾波器組為含有一多相濾波器組114及一MDCT112之一合成濾波器組(hybrid filterbank),此合成格式會選擇相容于先前的格式,如Layer-1及Layer-2。首先,使用多相濾波器組114,數(shù)位音訊信號(PCM input)會被分成32個次頻帶信號SB(j)j=0...31。上述復數(shù)次頻帶會被等間距地設置于由0至半個被取樣頻的頻域上。為了達到更接近人類聲覺的臨界頻帶(critical band)的較高頻率解析度,上述32個次頻帶信號SB(j)j=0...31會由一具有動態(tài)窗切換(dynamic window switching)的6點或8點的MDCT轉換,更進步再細分成頻譜分量。每個次頻帶會再分成18個更細微的頻譜分量,總計為576個頻譜分量SB(k)k=0...575,增加了去除冗于部分的可能性,對聲調信號來說使得編碼的效率更好。上述MDCT可以切換成將每個次頻帶產(chǎn)生6個頻譜分量(short-window MDCTs)或是18個頻譜分量(long-windowMDCTs)。注意,上述MDCT是為一50%重疊轉換,因此,實際上,它分別是一12點或一36點轉換。與MPEG Layer-3的合成濾波器組相比,MPEG-2 AAC使用類似于AC-3的一種平面MDCT區(qū)塊轉換(plain MDCT blocktransform)。舉例來說,于AAC編碼器中的濾波器組,為具有50%重疊(2048個樣本的window length)之一1024線的MDCT。上述濾波器組可以切換8組128線的MDCTs(256個樣本的window length)。因此,與Layer-3中576條頻譜線相比,AAC中頻譜線的數(shù)目增加至1024條。
解碼的步驟非常容易,恰好跟上述編碼的步驟相反,所要做的只是由c編碼的頻譜分量(spectral component)合成為一音訊信號。事實上,本發(fā)明是運用含有已編碼資料集(Integrally encoded data)的次資料框(sub-frames)或音訊資料區(qū)段(audio blocks)的一個已編碼的音訊資料框(audio frame)。不像已知為了反轉換,而將整個資料框存于記憶體中,本發(fā)明將MPEG或AC-3位元流(bitstream)解碼,透過暫存記憶體儲存所需的樣本。本發(fā)明試圖只當反轉換需要資料時,由位元流中取出有用的資料,為了減少暫存量,一次只處理一個已編碼的聲道。
本發(fā)明適用于MPEG layer-3的方法,將以圖2A中的實施例,配合圖2B中相關流程圖用以說明。于步驟S210中,由一MP3位元流之一資料框(sub-frame)中,取出此時須將被解碼至一聲道的N個樣本,其中上資料框(granule)含有M個樣本。注意,N為一第一既定數(shù)目,M為一第二既定數(shù)目,且M與N皆為正整數(shù)。于關于MP3的此一實施例中,M會等于576,且N會等于18。接著,于步驟S212中,上述被取出的N(N=18)個樣本,被儲存至可容納取出的N個樣本之一IMDCT暫存器202。隨著步驟S214中的IMDCT邏輯204,對IMDCT暫存器202中的上述N(N=18)個樣本,實施一反轉換,以便一次產(chǎn)生至少一個次頻帶樣本(subbandsample)。之后,于步驟216中,上述次頻帶樣本會被儲存至一個次頻帶暫存器(subband buffer)206。其中K為一第三既定數(shù)目,且K為32。接下來,于步驟S218中,丟棄上述取出的N個樣本,以儲存新的樣本。接著,于步驟S220中,重覆前述步驟S210-S218,直到完全取得上述聲道(audio channel)的32個次頻帶樣本(subband sample)為止。一旦32個次頻帶樣本皆被儲存至次頻帶暫存器206中時,于步驟S222中,32個次頻帶樣本會被供應至含有K個(K=32)次頻帶之一合成濾波器組(synthesis fliterbank)208。同時,于步驟S224中,由合成濾波器組208將32個次頻帶樣本,重組(reconstruct)成一PCM輸出樣本的資料區(qū)段(block)。在此方法中,32個次頻帶的次頻帶樣本會每一次都被反轉換(inverse-transformerd),再供應至合成濾波器組208,因此可以產(chǎn)生出連續(xù)不斷的PCM輸出樣本。
關于AC-3解碼的程序,將以圖3A中的另一實施例,配合圖3B中相關流程圖用以說明。本發(fā)明適用于AC-3的解碼步驟,與用于MEPG Layer-3的解碼步驟相似,但不使用一合成濾波器組。于步驟S310中,由一AC-3位元流之一資料框(sub-frame)中,取出此時須將被解碼至一聲道之N個樣本,其中N為一第一既定數(shù)目,且為一正整數(shù)。接著,于步驟S312中,上述被取出的N個樣本,被儲存至可容納取出的N個樣本之一IMDCT暫存器302。隨著步驟S314中的IMDCT邏輯304,對IMDCT暫存器302中的上述N個樣本,實施一反轉換,以便一次產(chǎn)生含有K個次頻帶樣本(subband sample)的一資料區(qū)段(sub-block)。之后,于步驟316中,剛剛產(chǎn)生的上述資料區(qū)段會被儲存至一個PCM暫存器306。注意,上述資料區(qū)段(sub-block)是為一PCM輸出資料框(audio block)的一部分,其中K為一第二既定數(shù)目,且K為一個小于N的正整數(shù)。接下來,于步驟S318中,丟棄存于IMDCT暫存器302中的上述N個樣本,以儲存新的樣本。接著,于步驟S320中,重覆前述步驟S310-S318,直到完全取得上述聲道(audio channel)之一PCM出輸資料框為止。隨著下一個次資料框被取樣以及反轉換,前述步驟會繼續(xù)執(zhí)行,而得以進行重組(reconstruction)。既然對AC-3而言,N為二的次方,第一既定數(shù)目N與第二既定數(shù)目M之間的關系,因此被定義為K=N2n]]>此處n≥0,且n為一正整數(shù)。對于實施例中,上述第一既定數(shù)目N為256,上述第一既定數(shù)目M為16(所以n=4)。
雖然本發(fā)明是參照MPEG Layer-3標準及AC-3標準來說明,但不用以限定本發(fā)明,同樣也可以應該于MPEG-2標準、AAC標準,以及除了MPEG及AC-3之外的編碼架構。因此,本發(fā)明由提供一個可以比已知大大地減少了暫存需求量的方法,而填補了現(xiàn)存于已知技術中的需求。
權利要求
1.一種減少數(shù)位音訊解碼器的暫存需求量的方法,包括(a)由一位元流之一資料框中,取出此時須將被解碼至一聲道的N個樣本,其中N為一第一既定數(shù)目,且為一正整數(shù);(b)儲存上述取出的N個樣本,至可容納上述取出的N個樣本之一第一暫存器;(c)對上述取出的N個樣本,實施一反轉換,以便一次產(chǎn)生含有K個PCM樣本的一次資料區(qū)段,其中上述次資料區(qū)段是為一PCM輸出資料框的一部份,在此K為一第二既定數(shù)目,且K為一小于N的正整數(shù);(d)儲存上述次資料區(qū)段,至可容納上述K個PCM樣本之一第二暫存器;(e)丟棄上述取出的N個樣本;以及(f)重覆上述步驟(a)至步驟(e),直到完全取得上述音訊聲道的上述PCM輸出資料框。
2.如權利要求1所述的減少數(shù)位音訊解碼器的暫存需求量的方法,其特征在于,上述位元流符合AC-3規(guī)格。
3.如權利要求2所述的減少數(shù)位音訊解碼器的暫存需求量的方法,其特征在于,上述反轉換為一反修正式離散余弦轉換(IMDCT)。
4.如權利要求2所述的減少數(shù)位音訊解碼器的暫存需求量的方法,其特征在于,上述第一既定數(shù)目N為256。
5.如權利要求1所述的減少數(shù)位音訊解碼器的暫存需求量的方法,其特征在于,上述第一既定數(shù)目與第二既定數(shù)目間的關系為K=N2n]]>此處n≥0,且n為一正整數(shù)。
6.如權利要求1所述的減少數(shù)位音訊解碼器的暫存需求量的方法,其特征在于,上述位元流符合MPEG-2進階編碼技術標準(Advanced AudioCoding standrad)。
7.如權利要求6所述的減少數(shù)位音訊解碼器的暫存需求量的方法,其特征在于,上述反轉換為一反修正式離散余弦轉換(IMDCT)。
8.一種減少數(shù)位音訊解碼器的暫存需求量的方法包括(a)由一位元流中含有M個樣本之一資料框內,取出此時須被解譯至一聲道的N個樣本,其中N為一第一既定數(shù)目,M為一第二既定數(shù)目,N、M為正整數(shù)且M≥N;(b)儲存上述取出的N個樣本,至可容納上述取出的N個樣本之一第一暫存器;(c)對存于上述第一暫存器中的上述取出的N個樣本,實施一反轉換以便一次產(chǎn)生至少一個次頻帶樣本;(d)儲存上述次頻帶樣本,至可容納上述K個次頻帶樣本之一第二暫存器,其中K為一第三既定數(shù)目,且為一正整數(shù);(e)丟棄上述取出的N個樣本;以及(f)重復上述步驟(a)至步驟(e),直到完全取得上述聲道的K個次頻帶樣本。
9.如權利要求1所述的減少數(shù)位音訊解碼器的暫存需求量的方法,其特征在于,更包括(g)將存于上述第二暫存器之上述K個次頻帶樣本,供應至一合成濾波器組;(h)由上述合成濾波器組,將上述K個次頻帶樣本重組成PCM輸出樣本之一資料區(qū)段。
10.如權利要求9所述的減少數(shù)位音訊解碼器的暫存需求量的方法,其特征在于,上述位元流符合MPEG layer-3(MP3)格式。
全文摘要
本發(fā)明提供一種減少數(shù)位音訊解碼器的暫存需求量的方法。首先,由一位元流之一資料框中,取出此時須將被解碼至一聲道的N個樣本。由一反轉換,以便一次估算出含有K個PCM樣本之一大資料區(qū)段。然后,丟棄上述取出的N個樣本。注意,取出的樣本數(shù)目會大于或等于產(chǎn)生的資料區(qū)段的PCM樣本數(shù)目,即N≥K。接著,重復前述步驟,直到完全取得上述聲道的大資料框為止。
文檔編號G10L19/00GK1468003SQ0214891
公開日2004年1月14日 申請日期2002年11月8日 優(yōu)先權日2002年7月9日
發(fā)明者李忠憲, 黃心怡 申請人:矽統(tǒng)科技股份有限公司