專利名稱:對被高度壓縮的增強層數據進行同步的方法和裝置的制作方法
技術領域:
本發(fā)明涉及一種對與基本層數據有關的增強層數據進行高度壓縮編碼的方法和裝置、以及一種對被高度壓縮的增強層數據進行對應解碼的方法和裝置,其中確定增強層數據和對應的基本層數據之間的同步。
背景技術:
一些多媒體應用數據格式使用具有基本層(BL)以及一個或多個增強層(EL)的分層級的多層。經常對一層內的數據進行分組化,即,以分組或者幀來組織該數據。盡管BL 信號單獨可以被解碼以獲得可再現的多媒體數據并且其包括用于基本解碼的所有信息,但是EL信號包括不能夠被單獨解碼以獲得有用的多媒體數據的附加信息。替代地,EL數據緊密地與BL數據耦合,并且僅僅在與其一起使用時是有用的。通常,BL數據和EL數據要么用于共同解碼(common decoding)要么在它們各自解碼之后,被彼此相加或者疊加。在任一種情況下,必須將EL數據與BL數據進行同步,這是因為如果不這樣做則EL數據包含無用的信息。例如,常見的是通過單獨的CRC校驗和或者前向糾錯(FEC)機制來單獨地校驗每個子比特流的完整性。通常,向子比特流的單獨的、分離的塊或者信號幀應用這樣的CRC或者FEC方案。如果在子比特流中的同步位置處開始解碼,并且此外如果對于任一子比特流均未檢測到傳送錯誤,則解碼器將認為分層級的比特流處于同步中。然而,因為該技術僅僅給出了與比特流的被單獨保護的塊的接收有關的確定性(certainty),所以例如如果一個子比特流的一個受保護的塊被完全丟失,則仍然可能存在未檢測到的錯誤。此外,期望將數據率保持得盡可能低,這導致了復雜的數據壓縮方法。CRC或者 FEC方法的缺點典型地在于必須對比特流的每個塊傳送相當量的附加數據。因此,通常將變長編碼用于未均等分布的數據字。在變長編碼(VLC)中,將較頻繁(即,較高概率)出現的數據字編碼為較短的碼字,而將以較低概率出現的數據字編碼為較長的碼字。由此,編碼后的消息中的平均比特量比使用恒定碼字長度的情況要短。然而,諸如VLC之類的高度壓縮方法對比特錯誤更敏感,這可能導致完全的數據丟失。例如,對于VLC,當同步已經丟失時,可能不能夠確定哪些比特屬于一個碼字。因此,限制可能的數據丟失的常見的解決方案是插入能夠以非常高的概率被辨識的唯一的同步字。然而,同步字增加了數據率,并且使用的同步字越多,則數據率越高。另外,在子比特流的塊上應用CRC或者FEC方法的另一缺點在于非常難應付像VBR編碼中具有可變長度并且沒有塊首標的塊。為了使得能夠檢測數據傳送或者存儲中的比特錯誤,常見的方法是計算關于編碼數據的校驗和,并且還傳送或者存儲該校驗和。對于檢測或者對于校正某些比特錯誤,已知不同類型的校驗和。然而,校驗和中的信息量越高,則其需要的比特越多。從而,校驗和越有用,則其增加的數據率越多。
發(fā)明內容
鑒于上述內容,本發(fā)明要解決的問題是提供一種用于與分組化的基本層數據流有關的高度壓縮的增強層數據流的編碼方法和格式,使得在解碼期間內至少可以檢測增強層數據和基本層數據之間的同步丟失,同時保持增強層數據流中的同步(sync)信息和校驗和信息量為低。此外,本發(fā)明要解決的另一問題是提供一種對應的解碼方法和裝置。具體地,該解碼方法和裝置應當在解碼期間內至少能夠檢測增強層數據和基本層數據之間的同步丟失。 進行這樣的檢測,應當至少能夠輔助減少干擾(disturbance)。對于上述問題,本發(fā)明提供了以下解決方案。在原理上,本發(fā)明是基于對以下事實的認識,S卩,包括變長編碼數據的分組典型地在它們的填充比特(padding bit)中提供了空閑空間,該空閑空間可以用于添加校驗和信息,并且校驗和信息還可以用于檢測同步丟失或者其它同步目的。出于此原因,校驗和信息參考解碼的基本層和解碼的增強層分組數據這兩者。盡管不是所有的分組都提供空閑的填充比特,但至少大部分分組都提供空閑的填充比特,并且平均每個分組提供(n_l)/2個填充比特,假定η比特形成一個字節(jié)。盡管每個分組的該可變的比特量可能對于高度復雜的糾錯是不夠的,但已經發(fā)現對于上述的與同步有關的目的,其是足夠的。有利地,即使增強層編碼提供了非常有限的開銷(overhead)信息(例如,沒有分組首標以及沒有分組同步字),這也允許例如在幾個分組之后進行失去同步(out-of-sync)檢測。一方面,本發(fā)明提供了一種編碼基本層數據流和有關的增強層數據流的方法,該方法包括以下步驟計算關于基本層數據流和增強層數據流的共同的校驗和;編碼具有獨立長度(individual length)的基本層分組中的基本層數據,其中分組內的數據字具有恒定長度(例如,面向字節(jié)(byte-oriented)的結構)并且每個分組具有至少包括同步字和獨立分組長度的指示的首標部分;編碼具有獨立長度的增強層分組中的增強層數據,其中每個增強層分組對應于特定的基本層分組,并且其中增強層分組內的數據字具有可變長度 (即,不是面向字節(jié)的結構)并且該分組不包括首標、開頭的分組同步字和分組長度的指示,并且其中被編碼為分組的增強層數據字的數目依賴于被編碼為對應的基本層分組的基本層數據字的數目;將編碼的增強層分組映射到面向字節(jié)的結構,其中一個字節(jié)具有η比特并且其中分組的最后字節(jié)中的多個填充比特保留為未使用,填充比特的數目在零和η-1 之間;確定用于增強層分組的填充比特的數目;從與所述增強層分組及其對應的基本層分組有關的校驗和中提取一定量的最低有效比特(LSB),所述量與所述所確定的填充比特的數目相等;以及將所提取的校驗和LSB插入到所述填充比特中。根據所采用的多媒體應用格式,獨立基本層分組的長度可以由它們的內容定義。 例如,音頻編碼格式MP3(MPEG-1層III)或者視頻編碼格式AVC提供了可變的、依賴于內容的分組長度。此外,應注意,分組中的值的數目(即,信息)在熵編碼之前和熵編碼之后是相同的,然而比特或者字節(jié)的數目通常是不同的。在一個實施例中,基本層(BL)數據流的每個BL分組具有增強層(EL)比特流中的一個對應EL分組,并且BL分組中的每個數據值在EL分組中具有對應的數據增強值。例如, 如果BL分組具有特定數目&個值,則對應的EL分組具有相同數目的增強值,對于各BL值
6中的每一個具有一個增強值。在另一實施例中,其中BL數據流的每個BL分組具有EL比特流的一個對應EL分組,BL分組中的(僅僅一個/多個)特定類型的每個數據值在EL分組中具有對應的數據增強值。例如,如果BL分組具有第一類型的)(B1個值和第二類型的Xb2個值,則對應的EL分組可能具有僅僅與第一類型的BL值有關的相同數目)(B1個增強值。在一個實施例中,依序排列(例如,在單個文件內存儲)BL數據和EL數據,并且EL 數據包括不多于一個同步字。根據本發(fā)明的另一方面,編碼的多媒體信號包括第一部分和第二部分,第一部分包括基本層音頻比特流的字節(jié)對齊(byte-aligned)的熵編碼的分組,而第二部分包括包含變長編碼的增強層數據的字節(jié)對齊的熵編碼的增強層分組,其中基本層分組包括同步信息而增強層分組不包括同步信息(至少沒有分組首標),并且其中增強層分組包括適合于對它們的對應基本層分組進行增強解碼的編碼參數,并且其中增強層分組的最后字節(jié)包括獨立的可變數目N個填充比特(即,不同的增強層分組可能具有不同的獨立數目的填充比特)。填充比特包括關于兩個分組(即,來自音頻信號的第二部分的增強層分組和來自音頻信號的第一部分的對應的基本層分組)的校驗和的N個LSB。在熵編碼之前計算該校驗和,即,校驗和不參考所接收的數據,而是參考熵解碼的數據。根據本發(fā)明的又一方面,一種解碼基本層比特流和對應的增強層比特流的方法, 其中增強層比特流包括用于對基本層比特流進行增強解碼的變長編碼的增強數據,所述方法包括以下步驟熵解碼基本層比特流的一部分,其中獲得熵解碼的第一基本層分組;熵解碼增強層比特流的一部分,其中獲得用于對基本層比特流的一部分進行增強解碼的增強數據;確定增強層比特流的最后字節(jié)中N個數目的填充比特,以及提取和/或存儲填充比特;計算關于解碼的第一基本層分組和來自增強層比特流的熵解碼部分的所述增強數據的校驗和;提取所計算的校驗和的N個最低有效比特(LSB),N等于所確定的填充比特的數目; 將所提取的所計算的校驗和的N個最低有效比特與所提取的N個填充比特進行比較;以及如果兩者相等,則使用所述增強數據和基本層比特流數據來解碼基本層比特流,否則,利用其中不使用或忽略來自增強層比特流的數據的簡化解碼來解碼基本層比特流?;緦臃纸M的長度(在解碼之前或者解碼之后)可以在其首標中預定義或者指示,而增強層分組的長度(在比特方面)不進行指示而必須在解碼處理期間例如使用來自對應的基本層分組的信息而導出。在一個實施例中,增強層分組中編碼值的數目等于對應的基本層分組中預定義類型的值的數目,并且解碼包括以下步驟從基本層分組確定要從增強層分組解碼的值的數目,并且從增強層數據中解碼所確定的數目的值。在另一實施例中,每個增強層分組的值的數目是預定義的。在從屬權利要求、以下描述和附圖中公開了本發(fā)明的有利實施例。
參照附圖來描述本發(fā)明的示例實施例,在附圖中圖1示出具有基本層和增強層的流格式的結構;圖2示出分組化的基本層的結構;圖3示出包括填充比特的分組化的增強層的結構;
圖4示出示例性的用于失去同步檢測的所接收的同步字與所計算的同步字的比較;圖5示出生成MP3基本層數據和音頻增強層數據的音頻編碼器的框圖;圖6示出MP3基本層數據和音頻增強層數據的音頻解碼器的框圖;以及圖7示出音頻編碼器中填充比特替換的詳細框圖。
具體實施例方式圖1示出包括基本層10和增強層11的數據流。該增強層在此也被稱作擴展層。 由于數據流是有限的,所以其也被稱為數據組塊(data chunk)。在所描述并描繪的實施例中,擴展層在基本層之后,使得兩者可以依序使用相同信道進行傳送或存儲。在另一實施例中,這兩個層可以使用分離的信道,使得它們可以同時被傳送、接收、存儲或者從存儲裝置中讀取。在該示例中,基本層10包含MP3音頻數據(如圖2中所示),而增強層11包含用于對音頻數據進行增強解碼的數據?;緦訑祿M塊被分離為幀12、21、22。由唯一的同步字23指示基本層幀(例如,MP3幀)的起始。對應的解碼器(例如MP3解碼器)針對該同步字23分解數據流直至它發(fā)現MP3幀的起始為止,并且解碼所發(fā)現的MP3幀的頻譜值 (spectral value) 0如果在幀數據內存在比特錯誤,則解碼的數據是錯誤的并且?guī)?1被丟棄(drop)。然而,通過下一同步字可以發(fā)現下一幀22并且解碼可以繼續(xù),使得沒有丟失其它的幀?;谟糜谠鰪姷腗P3音頻數據的格式和解碼處理來解釋本發(fā)明。解碼器被稱為 “hd3”解碼器,對應的編碼器被稱為“hd3”編碼器??商鎿Q地,其可以被稱作“MP3HD”。所謂的“hd3”比特流格式包括作為基本層10的MP3格式化層和至少一個附加增強層或擴展層11。(多個)MP3幀12形成hd3文件的一個相干(coherent)數據組塊10,擴展層11形成之后的相干增強數據組塊。在一個實施例中,基本層10和擴展層11形成完全的音頻軌道(等等)。在另一實施例中,對于超長軌道,相干的基本層數據組塊和之后的相干的增強層數據組塊可能僅僅形成軌道的一部分,而完全的音頻軌道由兩對或者更多對數據組塊組成。如圖3所示,也以幀來構成擴展層數據組塊11。然而,為了減少帶寬,將其進行高度壓縮。因此使用變長編碼來編碼增強層值,并且擴展層幀不以sync字(同步字)為起始。 替代地,只是依序添加(append)各幀。此外,不管字節(jié)結構如何,只是依序添加增強層幀內的碼字。從而,擴展層的幀邊界是不可直接檢測的,而是必須根據所定義的解碼算法(其包括每幀解碼所定義數目的值)來發(fā)現。由于變長編碼,所以比特錯誤將不僅僅干擾當前值,而是還將致使當前值的長度不可知,使得該幀中所有之后的值的開始不確定。此外,由于缺失幀同步字,常規(guī)地識別增強層數據組塊內的其它幀將是不可能的。示例性地,Golomb碼可以用作變長碼。Golomb碼可以用于表示有限范圍的非負整數值,這對于例如MP3數據和MP3增強數據是足夠的。原理上,Golomb碼還可以用于其它多媒體數據。通過商和除法余數來構建碼字,并且商處于一元表示而余數處于二元表示,且兩者參考同一除數。例如,在除數為8的情況下,值21被表示為“110101”:開頭的“11”表示處于一元表示的商O),之后的零是分隔符,而最后的比特“101”表示余數5。由于余數
8的比特數目依賴于預定義的除數,所以其是固定的。然而,如果開頭的一元碼或者分隔符由于比特錯誤而失真,則不可能確定碼字長度。從而,也沒有發(fā)現之后的碼字。這種問題類似地適用于所有變長碼,使得本發(fā)明對于其它變長碼也是有用的。如上所述,編碼所導致的一個問題是在比特錯誤之后,利用現有技術的方法不能使用增強層數據流的隨后部分。另外,更糟糕的問題在于利用現有技術的方法不能檢測到該錯誤,使得解碼將使用錯誤的增強層數據。例如,在音頻數據的情況下,這將干擾音頻再現,使得與被正確解碼的單純的基本層數據相比,由基本層數據和非同步的增強層數據產生的解碼音頻信號將更糟糕。在通常情況下,被錯誤同步的增強層數據的使用干擾了與此不同的正確基本層數據的使用。根據本發(fā)明,提供了對于該問題的一種如下解決方案由于一幀內的增強層數據的變長編碼,并且由于變長編碼的數據被映射到用于隨后處理的字節(jié)結構的事實,所以增強層幀的最后字節(jié)可能包含填充比特。這些填充比特經常被設置為零并且被忽略。此外, 由于各個幀可能由于變長碼而具有不同的比特長度,因此填充比特的量逐幀變化。本發(fā)明包括在熵編碼之前計算關于基本層幀及其對應的增強層幀的共同的校驗和,并且將校驗和的盡可能多的比特(優(yōu)選地是LSB)寫入在熵編碼之后剩余的填充比特中。盡管常規(guī)的解碼器將不能夠使用該信息并且因此忽略它,但根據本發(fā)明的解碼方面的解碼器使用該信息來至少檢測基本層幀和增強層幀是否同步。根據本發(fā)明的一方面,解碼器從所定義的起始位置開始,對每個分組解碼來自增強層數據的所定義數目的值。然后,解碼器從當前增強層幀的最后字節(jié)中讀取剩余的備用比特(spare bit),該剩余的備用比特通常被設置為零。然而,在根據本發(fā)明的增強層幀中, 這些比特包含校驗和的LSB。因此,解碼器提取/存儲這些比特,計算關于解碼的基本層幀和當前解碼的增強層幀的校驗和,并且將所提取的/存儲的校驗和與所計算的校驗和的適當量的LSB進行比較。如果兩個校驗和值相等,則假定基本層幀和增強層幀已經被正確解碼并且屬于彼此,即,各流是同步的。在改進的實施例中,在已經檢測到同步錯誤之后重新進行同步也是可能的。例如通過以下步驟,這將是可能的,即,在同步丟失之后解碼隨后的BL幀,解碼來自EL幀的所定義量的值,從EL幀的最后字節(jié)中提取剩余的比特,計算關于解碼的BL和EL幀的校驗和,并且將該校驗和與所提取的填充比特進行比較。在不匹配的情況下,逐比特地對EL中的起始位置進行移位,并且重復與EL有關的過程。如果在對應的BL和EL幀中不存在比特錯誤, 則可以利用該方法來發(fā)現流中的這些幀并且從而進行重新同步。在一個實施例中,使用所描述的處理在后處理步驟中修補損壞的增強層流。為此目的,如前所述地檢測EL分組中的比特錯誤,如上所述地確定下一正確的EL分組,并且修改錯誤的EL分組以便滿足格式要求。在另一實施例中,在增強層幀比基本層幀更可靠的情況下(例如,由于更高質量的接收條件而導致沒有錯誤),則可以確定或者修補用于給定EL分組的對應BL分組。如上所述,增強層幀數據的正確解碼確??梢酝交緦雍驮鰪妼?。在下述的與 MP3有關的實施例中,解碼器是局部(partial)擴展層解碼器。在數據組塊或文件中的所定義的位置處(即,在基本層數據的最后幀之后)開始增強層的解碼。增強層數據的起始對于發(fā)現例如其是否處于單獨的文件或者流中是無關緊要的。在單個文件或者信道用于基本層和增強層的情況下,可以在文件首標中提供指向該位置的指針。另一可能性在于,增強層組塊11以特殊的指示(例如,特定的同步字)起始。然而,增強層沒有用于同步目的的另外的附加字節(jié)。在表示例如hd3編解碼器的實施例中,使用比特精度的(bit exact)熵編碼算法。 該算法使用可變的碼字長度,將碼字的長度適配于統(tǒng)計的碼元出現頻率。因此,每個幀的幀長度(在比特方面)變化并且不是直接在字節(jié)邊界處結束。為了允許逐字節(jié)地剪切擴展層或者跳轉到特定的擴展幀的起始(其例如根據在文件首標中存儲的表格可能是已知的), 通過使用填充比特總是將幀長度舍入(round up)到下一字節(jié)邊界。從而,根據本發(fā)明,每個幀出現并且可以使用平均量3. 5個填充比特(假定每個字節(jié)具有8個比特)。通常,如果一個字節(jié)具有k個比特,則填充比特將是(k-l)/2個比特。如上面所提到的,對于這種類型的比特流的問題在于該比特流內的錯誤將不僅導致當前幀中的錯誤,而且還將干擾同步。此外,在上述的分層級的MP3比特流格式中,因為擴展層幀需要其特定的MP3幀的被局部解碼的值以重構編碼信號,所以擴展層不得不與基本層進行同步。因此,為保持擴展層同步,必須保證MP3幀和擴展層幀同步,并且保證擴展層的局部解碼是正確的。本發(fā)明的一個優(yōu)點在于其實現了兩種同步問題而不使用任何額外的比特或者字節(jié),即,不增加數據量。示例性地,以下描述hd3解碼器中失去同步檢測的實施方案。首先,為確保解碼的 MP3數據(頻譜MP3值)是有效的,計算被局部解碼的MP3值的整數和。其次,為了驗證擴展層數據的正確解碼,計算被局部解碼的擴展層數據的整數和,并且將其加到被局部解碼的MP3值的整數和上。原理上,該結果是兩個對應的hd3幀的散列值。由于在熵編碼之前計算散列值,所以該散列值在每個編碼設備和解碼設備上具有相同的比特精度,而與實際設備無關并且與實際的熵編碼方法無關。通過接收比特流內的散列值,解碼器能夠檢測同步錯誤并且對其進行反應。盡管不同的熵編碼方法可能導致不同的增強層幀長度,并且由此導致不同量的填充比特,但校驗和是相同的。此外,由于在解碼器內確定要比較的比特量, 所以解碼器仍能夠檢測同步丟失。本發(fā)明的一方面是僅僅使用散列值的LSB并且將這些比特存儲在每個擴展層幀的填充比特中。然后,解碼器可以在局部(即,熵)解碼兩個層之后,提取填充比特并且從局部解碼的值來計算散列值。如果散列值的LSB不等于填充比特,則在局部解碼處理中存在錯誤,并且擴展層可能通過進一步解碼而脫離同步。結果,在一個實施例中,解碼器可以停止整個解碼處理。然而,在另一實施例中,因為基本層組塊的解碼仍然是可行的,所以解碼器切換到單獨解碼基本層幀。然后,如上所述,可以繼續(xù)單純的基本層解碼,并且可以抑制增強層解碼或者嘗試重新進行增強層的同步。該例程的具體優(yōu)點在于可以檢測并且切掉被錯誤同步的增強層數據,并且由此不干擾基本層數據的再現。在下文中,如圖4中所示,描述了示例性的所接收的同步字和所計算的同步字的比較。使用以下各項Xmp3 (k)去被局部解碼的mp3值,Xext (k) s被局部解碼的擴展值Hpadding ^所讀取的填充比特Npadding各所使用的填充比特的數目
權利要求
1.一種用于編碼具有基本層比特流(21 和與基本層比特流有關的增強層比特流 (255)的音頻或視頻信號的方法,其中以分組構成基本層數據和增強層數據,并且其中基本層比特流的分組具有對應的增強層比特流的分組,所述方法包括以下步驟-計算(沈0)關于基本層比特流的分組和對應的增強層比特流的分組的校驗和;-熵編碼(220)基本層比特流的分組,其中獲得以同步字開始的熵編碼的字節(jié)對齊的基本層分組;-使用變長編碼方法來熵編碼(270)增強層比特流的分組,其中獲得不具有首標并且不以同步字開始的熵編碼的增強層分組073);-將編碼的增強層分組映射071)到字節(jié),每個字節(jié)具有固定數目的比特,其中在編碼的增強層分組的最后字節(jié)中N個數目的比特是填充比特;-確定(27 編碼的增強層分組的最后字節(jié)內的填充比特量N;-提取(沈1)所述所計算的校驗和的N個最低有效比特,N等于所確定的填充比特量;-將所提取的所計算的校驗和的N個最低有效比特插入(觀0)到編碼分組的結尾處的填充比特中;以及-提供或輸出包括所插入的校驗和比特的編碼的增強層分組、以及編碼的基本層分組。
2.如權利要求1所述的方法,其中在沒有像分組或者幀首標那樣的附加結構數據的情況下,由單一的開頭同步字和多個所述編碼的增強層分組來形成(四0)編碼的增強層比特流(295)。
3.如權利要求1或2所述的方法,其中,在所述熵編碼之前,基本層比特流(21 和增強層比特流(25 包括整數值,并且計算校驗和的步驟包括在熵編碼之前對所述整數值求和(260)。
4.如權利要求1-3中的任一項所述的方法,其中使用Golomb碼來編碼增強層比特流的分組。
5.如權利要求1-4中的任一項所述的方法,其中每個編碼的增強層分組的填充比特的數目N是可變的,小于字節(jié)的比特數目,并且在舍入或者舍去的情況下平均為字節(jié)的比特數目的一半。
6.如權利要求1-5中的任一項所述的方法,其中基本層比特流(215)包括MP3格式化的音頻數據,而增強層比特流(25 包括適合于對基本層比特流的MP3格式化的音頻數據進行增強解碼的MDCT殘差。
7.如權利要求1-6中的任一項所述的方法,還包括在文件中存儲編碼的基本層比特流 (225)和編碼的增強層比特流095)的步驟,其中在該文件的第一部分(10)中彼此相鄰地存儲基本層分組,而在該文件的隨后的第二部分(11)中彼此相鄰地存儲增強層分組。
8.一種用于解碼具有基本層比特流(101)和對應的增強層比特流(102)的音頻或視頻信號的方法,其中增強層比特流包括用于對基本層比特流進行增強解碼的變長編碼的參數,所述方法包括以下步驟-局部解碼(110)基本層比特流的一部分,其中獲得解碼的第一基本層分組(115);-局部解碼(120)增強層比特流的一部分,其中獲得用于對基本層比特流進行增強解碼的解碼參數(1 );-確定(150)增強層比特流的所述部分中N個數目的填充比特,以及提取和/或存儲填充比特;-計算(140)關于解碼的第一基本層分組(11 和來自增強層比特流的局部解碼部分的所述解碼參數(125)的校驗和;-將所提取的所計算的校驗和的N個最低有效比特與所提取的N個填充比特進行比較 (160),其中N等于所確定的填充比特量;-如果兩者相等,則使用用于對基本層比特流進行增強解碼的所述解碼參數(125)來解碼(130)被局部解碼的基本層比特流(115),否則,利用其中不使用來自增強層比特流的數據的簡化解碼來解碼(130)被局部解碼的基本層比特流(115)。
9.如權利要求8所述的方法,其中所述確定(150)N個數目的填充比特的步驟包括以下步驟確定基本層比特流(11 的被局部解碼部分中碼字的數目,從變長編碼的增強層比特流的部分中解碼對應數目的碼字(125),以及將增強層比特流的該部分的最后字節(jié)的剩余比特確定(150)為所述N個填充比特。
10.如權利要求8或9所述的方法,其中對于每個基本層分組,增強層比特流包括預定義數目的解碼參數。
11.一種包括第一部分(10)和第二部分(11)的編碼的音頻/視頻信號,所述第一部分包括基本層音頻/視頻比特流的字節(jié)對齊的熵編碼的分組(1 ,而第二部分包括包含變長編碼的增強層數據的字節(jié)對齊的熵編碼的增強層分組(13),其中,基本層分組包括具有同步信息的首標,而增強層分組不包括具有同步信息的首標,以及其中,每個增強層分組包括適合于對對應的基本層分組進行增強解碼的編碼參數,以及其中,增強層分組的最后字節(jié)包括N個數目的填充比特,該填充比特包括關于熵編碼之前的增強層分組和對應的基本層分組的校驗和的N個LSB。
12.如權利要求11所述的信號,其中基本層音頻/視頻比特流和增強層比特流包括整數值,并且校驗和是所述整數值之和。
13.一種用于編碼具有基本層比特流(21 和與基本層比特流有關的增強層比特流 (255)的音頻或視頻信號的裝置,其中以分組構成基本層數據和增強層數據,并且其中基本層比特流的分組具有對應的增強層比特流的分組,所述裝置包括-計算部件,計算(260)關于基本層比特流的分組和對應的增強層比特流的分組的校驗和;-基本層熵編碼器020),熵編碼基本層比特流的分組,其中生成以同步字起始的熵編碼的字節(jié)對齊的基本層分組;-增強層熵編碼器(270),使用變長編碼方法來熵編碼增強層比特流的分組,其中生成不具有首標并且不以同步字起始的熵編碼的增強層分組073);-映射部件071),將編碼的增強層分組映射到字節(jié),每個字節(jié)具有固定數目的比特, 其中在編碼的增強層分組的最后字節(jié)中N個數目的比特是填充比特;-確定部件072),確定編碼的增強層分組的最后字節(jié)內的填充比特量N;-提取部件061),提取所述所計算的校驗和的N個最低有效比特,N等于所確定的填充比特量;-插入部件O80),將所提取的所計算的校驗和的N個最低有效比特插入到編碼分組的結尾處的填充比特中;以及-用于提供或輸出包括所插入的校驗和比特的編碼的增強層分組、以及編碼的基本層分組的部件。
14.如權利要求13所述的裝置,還包括用于在文件中存儲編碼的基本層比特流(225) 和編碼的增強層比特流095)的部件,其中,在該文件的第一部分(10)中彼此相鄰地存儲基本層分組,而在該文件的隨后的第二部分(11)中彼此相鄰地存儲增強層分組。
15.一種用于解碼具有基本層比特流(101)和對應的增強層比特流(10 的音頻或視頻信號的裝置,其中增強層比特流包括用于對該基本層比特流進行增強解碼的變長編碼的參數,所述裝置包括-基本層局部解碼器(110),局部解碼基本層比特流的一部分,其中生成解碼的第一基本層分組(115);-增強層局部解碼器(120),局部解碼增強層比特流的一部分,其中生成用于對基本層比特流進行增強解碼的解碼參數(125);-用于確定(150)增強層比特流的所述部分中N個數目的填充比特的部件,以及用于提取和/或存儲填充比特的部件;-計算部件(140),計算關于解碼的第一基本層分組(11 和來自增強層比特流的被局部解碼部分的所述解碼參數(125)的校驗和的部件;-比較部件(160),將所提取的所計算的校驗和的N個最低有效比特與所提取的N個填充比特進行比較,并且如果兩者不相等則提供錯誤指示(165),其中N等于所確定的填充比特量;以及-解碼部件(130),如果根據所述錯誤指示(16 所提取的所計算的校驗和的N個最低有效比特與所提取的N個填充比特相等,則使用用于對基本層比特流進行增強解碼的所述解碼參數(125)來解碼被局部解碼的基本層比特流(115),否則,利用其中不使用來自增強層比特流的數據的簡化解碼來解碼(130)被局部解碼的基本層比特流(115)。
全文摘要
多媒體應用數據格式經常使用數據分組并且可能包含分組化的具有基本層(BL)以及一個或多個增強層(EL)的分層級的層。包括變長編碼的數據的分組典型地提供填充比特,所述填充比特可以用于添加校驗和信息。該校驗和信息參考解碼的基本層和解碼的增強層分組數據這兩者,并且用于檢測各層之間的同步丟失。盡管各分組提供不同的單獨的填充比特量,但每個分組的該可變比特量對于添加用于與同步有關的目的的校驗和信息是足夠的。即使增強層編碼沒有提供用于同步的開銷信息,具體地,沒有分組首標和分組同步字,這也允許例如進行失去同步檢測。
文檔編號H04N7/26GK102160378SQ200980136191
公開日2011年8月17日 申請日期2009年7月14日 優(yōu)先權日2008年7月16日
發(fā)明者彼得.賈克斯, 斯文.科唐 申請人:湯姆森特許公司