專利名稱:嵌入式數(shù)據(jù)的信號(hào)傳輸?shù)闹谱鞣椒?br>
技術(shù)領(lǐng)域:
本發(fā)明涉及嵌入式數(shù)據(jù)的信號(hào)傳輸,并且還涉及格式化并處理具有嵌入式數(shù)據(jù)的數(shù)據(jù)流。
背景技術(shù):
幾個(gè)音頻編碼方案/標(biāo)準(zhǔn)的語法定義(例如mp3和MPEG-AAC,分別參見例如ISO/IEC 13818-3和13818-7)提供了向編碼音頻流增加輔助/嵌入式數(shù)據(jù)的可能性。只要求適應(yīng)的解碼器分析所述嵌入式數(shù)據(jù),而不要求解釋它。實(shí)際上,所述嵌入式數(shù)據(jù)常常用于存儲(chǔ)與增強(qiáng)編碼器/工具(例如mp3PRO,MPEG-4AAC+SBR,其中“SBR”代表光譜帶復(fù)制)相關(guān)的編碼數(shù)據(jù)流??梢栽诤诵木幋a器的頂部使用這種增強(qiáng)的編碼器/工具,以便改善核心音頻流的質(zhì)量。因?yàn)橐蠓窃鰪?qiáng)編碼器分析所述嵌入式數(shù)據(jù),所以依照反向兼容方式完成數(shù)據(jù)嵌入。
在MPEG-4中(參見用于MPEG-4系統(tǒng)的ISO/IEC 14496-1和用于MPEG-4音頻的ISO/IEC 14496-3),借助于描述符來完成流內(nèi)容的信號(hào)傳輸。每個(gè)載流線(即諸如音頻或視頻之類的單介質(zhì)數(shù)據(jù)的連續(xù)流,其可以被包化)具有相應(yīng)的描述符。當(dāng)前描述符定義不規(guī)定嵌入式數(shù)據(jù)的信號(hào)傳輸。當(dāng)然嵌入式數(shù)據(jù)的信號(hào)傳輸當(dāng)然可以借助于所述描述符的勘誤表來實(shí)現(xiàn)。然而,當(dāng)所述標(biāo)準(zhǔn)保持與當(dāng)前定義反向兼容時(shí),不能實(shí)現(xiàn)這種勘誤表。做為選擇,人們可以使用在嵌入式數(shù)據(jù)本身中的描述符。這有下列缺點(diǎn),在載流線級(jí)無法用信號(hào)傳輸所述嵌入式數(shù)據(jù),并且因此需要訪問所述嵌入式數(shù)據(jù)來看看其所包含的內(nèi)容。
發(fā)明內(nèi)容
本發(fā)明的目的是提供嵌入式數(shù)據(jù)的有益信號(hào)傳輸。為此,本發(fā)明提供了如在獨(dú)立權(quán)利要求中所定義的一種方法、一種編碼器、一種信號(hào)、一種存儲(chǔ)介質(zhì),一種解碼的方法、一種解碼器、一種發(fā)送器或記錄器和一種接收器。在所述從屬權(quán)利要求中定義了有益的實(shí)施例。
依照本發(fā)明的第一方面,提供了表示主數(shù)據(jù)的信號(hào),所述主數(shù)據(jù)包括嵌入式數(shù)據(jù),所述主數(shù)據(jù)具有用于用信號(hào)通知包括在所述主數(shù)據(jù)內(nèi)的內(nèi)容的主數(shù)據(jù)描述符,其中形成嵌入式數(shù)據(jù)描述符以便用信號(hào)通知包括在所述嵌入式數(shù)據(jù)內(nèi)的內(nèi)容,并且其中在所述主數(shù)據(jù)和主數(shù)據(jù)描述符外提供所述嵌入式數(shù)據(jù)描述符(或?qū)⑵渑c所述主數(shù)據(jù)和主數(shù)據(jù)描述符分開)。通過在所述主數(shù)據(jù)描述符外提供嵌入式數(shù)據(jù)描述符,當(dāng)前定義的一組主數(shù)據(jù)描述符的勘誤表不必考慮包括在所述嵌入式數(shù)據(jù)內(nèi)的未定義內(nèi)容;具有新的嵌入式數(shù)據(jù)描述符的信號(hào)關(guān)于所述主數(shù)據(jù)和主數(shù)據(jù)描述符保持反向兼容。通過在所述主數(shù)據(jù)外并且進(jìn)而在所述嵌入式數(shù)據(jù)外提供所述嵌入式數(shù)據(jù)描述符,所述主數(shù)據(jù)保持可兼容的,并且還不必為獲取其描述而訪問該嵌入式數(shù)據(jù)本身。
結(jié)果,具有嵌入式數(shù)據(jù)的載流線可以具有兩個(gè)對(duì)應(yīng)的描述符,一個(gè)用于主數(shù)據(jù)并且另一個(gè)用于嵌入式數(shù)據(jù)。
所述主數(shù)據(jù)、嵌入式數(shù)據(jù)、主數(shù)據(jù)描述符和嵌入式數(shù)據(jù)描述符可以都存在于同一傳輸信號(hào)中。
有益的是,所述信號(hào)是基本的音頻數(shù)據(jù)流,其中所述嵌入式數(shù)據(jù)是用于增強(qiáng)在其余的基本數(shù)據(jù)流中可用音頻的增強(qiáng)數(shù)據(jù)。優(yōu)選的是,所述增強(qiáng)數(shù)據(jù)是適于執(zhí)行光譜帶復(fù)制的信息。做為選擇,所述增強(qiáng)數(shù)據(jù)適于擴(kuò)展信道的數(shù)目,例如從1到2信道或從2到5信道,參見例如Faller和Baumgarte的論文“Binaural cue coding applied tostereo and multi-channel audio compression”,AES112th論文5574頁,2002年5月10-13日,德國,以及例如于2002年4月22日提交的申請(qǐng)?zhí)枮?2076588.9的歐洲專利申請(qǐng)。
本發(fā)明的實(shí)施例對(duì)于下列標(biāo)準(zhǔn)尤為有用,其中可以實(shí)現(xiàn)獨(dú)立的嵌入式數(shù)據(jù)描述符以致常規(guī)的編碼器不會(huì)錯(cuò)誤地使用其內(nèi)容,例如通過忽略所述嵌入式數(shù)據(jù)描述符,例如簡(jiǎn)單地因?yàn)樗褂貌豢烧J(rèn)知的代碼,所以所述代碼命令解碼器忽略該信息。其中比較合適的標(biāo)準(zhǔn)的例子是MPEG-4系統(tǒng)和RFC 3016。
參考附圖將要闡明本發(fā)明的這些及其它方面。
在附圖中圖1示出了常規(guī)的載流線的例子;圖2依照本發(fā)明實(shí)施例示出了裝備有嵌入式數(shù)據(jù)描述符的載流線的例子;圖3示出了依照本發(fā)明實(shí)施例的系統(tǒng)。
所述附圖只示出了那些為理解本發(fā)明實(shí)施例所必需的元素。
具體實(shí)施例方式
圖1示出了常規(guī)載流線ES的例子。所述載流線ES可以是包化的載流線。載流線ES包括主數(shù)據(jù)MD和主數(shù)據(jù)描述符MDD。編碼音頻流的示例性描述符MDD可以如下MDD{音頻對(duì)象類型(“AOT”)采樣頻率信道配置AOT具體配置信息}舉例來說,具體到有關(guān)AOT的AAC的配置信息包括幀長(zhǎng),即與一個(gè)AAC音頻幀相關(guān)的每個(gè)信道的PCM采樣的數(shù)目。
此外,所述主數(shù)據(jù)MD包括嵌入式數(shù)據(jù)ED。優(yōu)選的是,所述主數(shù)據(jù)MD包括編碼音頻數(shù)據(jù),例如AAC或mp3編碼數(shù)據(jù)。所述主數(shù)據(jù)MD還可以包括視頻數(shù)據(jù)。優(yōu)選的是,所述嵌入式數(shù)據(jù)包括用于增強(qiáng)所述主數(shù)據(jù)MD的增強(qiáng)數(shù)據(jù),例如在音頻情況下通過光譜帶復(fù)制或在視頻情況下通過空間、SNR或其它方法來增強(qiáng)。做為選擇,所述增強(qiáng)數(shù)據(jù)適于擴(kuò)展信道的數(shù)目,例如如上所指出的從1到2信道或從2到5信道。
在某些系統(tǒng)中,例如在MPEG-4中,所述數(shù)據(jù)描述符MDD與在所述載流線中的主數(shù)據(jù)MD沒有相連接,但是分別地提供該數(shù)據(jù)描述符。為了確定哪個(gè)描述符與哪個(gè)載流線有關(guān),在描述符以及載流線ES中使用某種標(biāo)識(shí)。
在解碼器中分析所述嵌入式數(shù)據(jù)ED并且由增強(qiáng)解碼器來辨別,所述增強(qiáng)解碼器能夠使用存在于ED中的增強(qiáng)數(shù)據(jù)。通常,所述嵌入式數(shù)據(jù)ED包括某種標(biāo)識(shí)/描述以便使標(biāo)識(shí)增強(qiáng)數(shù)據(jù)ED成為可能,不過在專有系統(tǒng)中還可以允許在編碼器和解碼器之間、所述嵌入式數(shù)據(jù)ED始終包括依照預(yù)定格式的增強(qiáng)數(shù)據(jù)。
圖2示出了根據(jù)本發(fā)明的實(shí)施例的具有嵌入式數(shù)據(jù)描述符EDD的進(jìn)一步的載流線EES的例子。所述嵌入式數(shù)據(jù)描述符EDD包括標(biāo)識(shí)信息以便使標(biāo)識(shí)嵌入式數(shù)據(jù)ED的類型成為可能。所述描述符EDD還可以包括其它有用信息。嵌入到編碼音頻流中的數(shù)據(jù)的示例性描述符EDD可以如下EDD{音頻(增強(qiáng))對(duì)象類型(“AOT”)AOT具體配置信息}EDD的定義強(qiáng)烈取決于所述音頻(增強(qiáng))對(duì)象類型。在SBR的情況下,其包含采樣頻率模式,所述采樣頻率模式可以是單或多速率。在信道擴(kuò)展的情況下,所述嵌入式數(shù)據(jù)描述符可以包含關(guān)于所述擴(kuò)展信道配置的信息。
在所述主數(shù)據(jù)MD和主數(shù)據(jù)描述符MDD外提供了所述嵌入式數(shù)據(jù)描述符EDD,并且因此其可以被容易地訪問。根據(jù)所使用的編碼方案,可以依照與所述主數(shù)據(jù)MD連接的方式提供所述數(shù)據(jù)描述符MDD和EDD。還可以在所述信號(hào)的另一部分中獨(dú)立提供所述描述符,例如所有描述符集合在一起。然后,需要一些鏈接信息來使所述描述符與有關(guān)的載流線相關(guān)。
MPEG-4實(shí)現(xiàn)有益的是,在MPEG-4或類似MPEG-4的編碼方案中應(yīng)用本發(fā)明的上述實(shí)施例。在MPEG-4中,相對(duì)于所述載流線EES獨(dú)立提供主數(shù)據(jù)描述符MDD和嵌入式數(shù)據(jù)描述符EDD。MPEG-4系統(tǒng)提供了用于使所述描述符與有關(guān)的載流線相關(guān)的工具。
RFC3016實(shí)現(xiàn)在RFC 3016中(IETF RFC 3016Kikuchi等人的“RTP Payload Formatfor MPEG-4 Audio/Visual Streams”,2000年11月),提供了把描述符信息作為對(duì)話描述協(xié)議(SDP)參數(shù)。例如在音頻情況下,由所述參數(shù)“config(配置)”把所述音頻解碼配置描述為表示音頻描述符的十六進(jìn)制字符串,如MPEG-4所定義的那樣。給出的例子如下config=000001B001000001B5090000010000000120008440FA282C2090A21F。
通過定義新的參數(shù)可以增加另一描述符,所述新的參數(shù)諸如嵌入式數(shù)據(jù)配置。要求接收器忽略新的或未知參數(shù)。
依照本發(fā)明實(shí)施例的系統(tǒng)圖3示出了依照本發(fā)明實(shí)施例的系統(tǒng)。所述系統(tǒng)包括用于發(fā)送或記錄已編碼信號(hào)[S]的設(shè)備1。所述設(shè)備1包括用于獲得例如音頻和/或視頻信號(hào)之類的輸入信號(hào)S的輸入單元10。所述輸入單元10可以是天線、麥克風(fēng)、網(wǎng)絡(luò)連接等。所述設(shè)備1還包括用于依照本發(fā)明上述實(shí)施例編碼所述信號(hào)S的編碼器11(特別參見圖2),以便獲得包括主數(shù)據(jù)MD和描述符MDD和EDD的編碼信號(hào),所述主數(shù)據(jù)MD包括嵌入式數(shù)據(jù)ED。把所述已編碼信號(hào)供給輸出單元12,所述輸出單元12把包括嵌入式數(shù)據(jù)ED的主數(shù)據(jù)MD和描述符MDD和EDD格式化為具有適當(dāng)格式的已編碼信號(hào)[S],以便經(jīng)由傳輸介質(zhì)或存儲(chǔ)介質(zhì)2傳輸或存儲(chǔ)(例如在RFC 3016中所定義的那樣)。所述系統(tǒng)還包括接收器或再現(xiàn)設(shè)備3,其在輸入單元30中接收所述已編碼信號(hào)[S]。所述輸入單元30向解碼器31提供主數(shù)據(jù)MD、嵌入式數(shù)據(jù)ED和數(shù)據(jù)描述符MDD和EDD。所述解碼器31通過執(zhí)行解碼過程來解碼所述已編碼信號(hào),所述解碼過程基本上是在所述編碼器11中所述編碼的逆運(yùn)算,其中獲得解碼信號(hào)S’,所述解碼信號(hào)除在所述編碼過程期間丟失的那些部分外均對(duì)應(yīng)于所述原始信號(hào)S。所述解碼器31向諸如用于再現(xiàn)所述解碼信號(hào)S’的揚(yáng)聲器之類的再現(xiàn)單元32提供所述解碼信號(hào)S’。所述再現(xiàn)單元32還可以是發(fā)送器,用于例如經(jīng)由家庭網(wǎng)絡(luò)等進(jìn)一步發(fā)送所述解碼信號(hào)S’。
如上所述,對(duì)于RFC 3016的情況,現(xiàn)有的接收器能夠忽略所述EDD。未來的接收器實(shí)現(xiàn)方案也許可以解釋所述EDD。在這種情況下,向單元31傳遞EDD可以取決于單元31的能力。例如,在那些所述解碼器31不支持與嵌入式數(shù)據(jù)相關(guān)的特征的實(shí)現(xiàn)方案中,所述輸入單元30可以決定不向單元31提供EDD以便保存頻帶寬度。
本發(fā)明的實(shí)施例可以應(yīng)用于音頻和/或視頻廣播、因特網(wǎng)無線電、3GPP、因特網(wǎng)分送、固態(tài)音頻、3G終端,、GPRS和其商業(yè)后繼。
人們注意到,上述實(shí)施例僅僅是為了舉例說明,而不是用來限制本發(fā)明,本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求書的范圍的情況下,可以設(shè)計(jì)出很多替換的實(shí)施例。在權(quán)利要求書中,不應(yīng)當(dāng)將括號(hào)內(nèi)的任何參考符號(hào)看作是對(duì)權(quán)利要求的限制。所述詞“包括”并不排除那些沒有記載在權(quán)利要求中的元件或步驟。本發(fā)明可以借助于包括一些明顯元件的硬件來實(shí)現(xiàn),也可以借助于適當(dāng)?shù)目删幊逃?jì)算機(jī)來實(shí)現(xiàn)。在設(shè)備權(quán)利要求所列舉的一些裝置中,部分這些裝置可以具體化為一個(gè)或相同的硬件項(xiàng)。在彼此不同的權(quán)利要求中所提到的某些方法,實(shí)際上并不意味著把這些方法結(jié)合是無益的。
權(quán)利要求
1.一種提供表示主數(shù)據(jù)的信號(hào)的方法,所述主數(shù)據(jù)包括嵌入式數(shù)據(jù),所述主數(shù)據(jù)具有用于用信號(hào)通知包括在所述主數(shù)據(jù)內(nèi)的內(nèi)容的主數(shù)據(jù)描述符,所述方法包括形成用于用信號(hào)通知包括在所述嵌入式數(shù)據(jù)內(nèi)的內(nèi)容的嵌入式數(shù)據(jù)描述符,和在所述主數(shù)據(jù)和所述主數(shù)據(jù)描述符外提供所述嵌入式數(shù)據(jù)描述符。
2.如權(quán)利要求1所述的方法,其中所述主數(shù)據(jù)包括音頻和/或視頻數(shù)據(jù),并且其中所述嵌入式數(shù)據(jù)包括用于增強(qiáng)所述音頻和/或視頻數(shù)據(jù)的增強(qiáng)數(shù)據(jù)。
3.一種提供表示主數(shù)據(jù)的信號(hào)的編碼器,所述主數(shù)據(jù)包括嵌入式數(shù)據(jù),所述主數(shù)據(jù)具有用于用信號(hào)通知包括在所述主數(shù)據(jù)內(nèi)的內(nèi)容的主數(shù)據(jù)描述符,所述編碼器包括用于形成用于用信號(hào)通知包括在所述嵌入式數(shù)據(jù)內(nèi)的內(nèi)容的嵌入式數(shù)據(jù)描述符的裝置,和用于在所述主數(shù)據(jù)和所述主數(shù)據(jù)描述符外提供所述嵌入式數(shù)據(jù)描述符的裝置。
4.一種表示主數(shù)據(jù)的信號(hào),所述主數(shù)據(jù)包括嵌入式數(shù)據(jù),所述主數(shù)據(jù)具有用于用信號(hào)通知包括在所述主數(shù)據(jù)內(nèi)的內(nèi)容的主數(shù)據(jù)描述符,所述嵌入式數(shù)據(jù)具有用于用信號(hào)通知包括在所述嵌入式數(shù)據(jù)內(nèi)的內(nèi)容的嵌入式數(shù)據(jù)描述符,其中在所述主數(shù)據(jù)和所述主數(shù)據(jù)描述符外提供所述嵌入式數(shù)據(jù)描述符。
5.一種其上存儲(chǔ)有如權(quán)利要求4所述的信號(hào)的存儲(chǔ)介質(zhì)。
6.一種解碼信號(hào)的方法,所述信號(hào)表示主數(shù)據(jù),所述主數(shù)據(jù)包括嵌入式數(shù)據(jù),所述主數(shù)據(jù)具有用于用信號(hào)通知包括在所述主數(shù)據(jù)內(nèi)的內(nèi)容的主數(shù)據(jù)描述符,所述嵌入式數(shù)據(jù)具有用于用信號(hào)通知包括在所述嵌入式數(shù)據(jù)內(nèi)的內(nèi)容的嵌入式數(shù)據(jù)描述符,其中在所述主數(shù)據(jù)和所述主數(shù)據(jù)描述符外提供所述嵌入式數(shù)據(jù)描述符,所述解碼方法包括步驟讀取所述嵌入式數(shù)據(jù)描述符;并且根據(jù)所述嵌入式數(shù)據(jù)描述符的讀取來使用所述嵌入式數(shù)據(jù)。
7.一種用于解碼信號(hào)的解碼器,所述信號(hào)表示主數(shù)據(jù),所述主數(shù)據(jù)包括嵌入式數(shù)據(jù),所述主數(shù)據(jù)具有用于用信號(hào)通知包括在所述主數(shù)據(jù)內(nèi)的內(nèi)容的主數(shù)據(jù)描述符,所述嵌入式數(shù)據(jù)具有用于用信號(hào)通知包括在所述嵌入式數(shù)據(jù)內(nèi)的內(nèi)容的嵌入式數(shù)據(jù)描述符,其中在所述主數(shù)據(jù)和所述主數(shù)據(jù)描述符外提供所述嵌入式數(shù)據(jù)描述符,所述解碼器包括用于讀取所述嵌入式數(shù)據(jù)描述符的裝置;和用于根據(jù)所述嵌入式數(shù)據(jù)描述符的讀取來使用所述嵌入式數(shù)據(jù)的裝置。
8.一種發(fā)送器或記錄器,包括用于獲得輸入信號(hào)的輸入單元,如權(quán)利要求3所述的編碼器,用于編碼所述輸入信號(hào)以便獲得主數(shù)據(jù),所述主數(shù)據(jù)包括嵌入式數(shù)據(jù),所述主數(shù)據(jù)具有用于用信號(hào)通知包括在所述主數(shù)據(jù)內(nèi)的內(nèi)容的主數(shù)據(jù)描述符,所述嵌入式數(shù)據(jù)具有用于用信號(hào)通知包括在所述嵌入式數(shù)據(jù)內(nèi)的內(nèi)容的嵌入式數(shù)據(jù)描述符,其中在所述主數(shù)據(jù)和所述主數(shù)據(jù)描述符外提供所述嵌入式數(shù)據(jù)描述符,和輸出單元,用于把包括所述嵌入式數(shù)據(jù)的主數(shù)據(jù)、主數(shù)據(jù)描述符和嵌入式數(shù)據(jù)描述符格式化為已編碼信號(hào)并且用于發(fā)送或記錄所述已編碼信號(hào)。
9.一種接收器,包括輸入單元,用于獲得表示主數(shù)據(jù)的信號(hào),所述主數(shù)據(jù)包括嵌入式數(shù)據(jù),所述主數(shù)據(jù)具有用于用信號(hào)通知包括在所述主數(shù)據(jù)內(nèi)的內(nèi)容的主數(shù)據(jù)描述符,所述嵌入式數(shù)據(jù)具有用于用信號(hào)通知包括在所述嵌入式數(shù)據(jù)內(nèi)的內(nèi)容的嵌入式數(shù)據(jù)描述符,其中在所述主數(shù)據(jù)和所述主數(shù)據(jù)描述符外提供了所述嵌入式數(shù)據(jù)描述符,如權(quán)利要求7所述的解碼器,用于解碼所述信號(hào)以便獲得解碼信號(hào),和輸出單元,用于再現(xiàn)所述解碼信號(hào)。
全文摘要
本發(fā)明提供了包括嵌入式數(shù)據(jù)(ED)的主數(shù)據(jù)(MD),所述數(shù)據(jù)具有用于用信號(hào)通知包括在所述主數(shù)據(jù)內(nèi)的內(nèi)容的主數(shù)據(jù)描述符(MDD),其中形成嵌入式數(shù)據(jù)描述詞(EDD)以便用信號(hào)通知包括在所述嵌入式數(shù)據(jù)內(nèi)的內(nèi)容,并且其中在所述主數(shù)據(jù)和所述主數(shù)據(jù)描述符外提供所述嵌入式數(shù)據(jù)描述符。
文檔編號(hào)H04S3/00GK1706222SQ200380101813
公開日2005年12月7日 申請(qǐng)日期2003年10月20日 優(yōu)先權(quán)日2002年10月22日
發(fā)明者M·W·T·克萊恩米德林克, J·范德米爾 申請(qǐng)人:皇家飛利浦電子股份有限公司