用于生成和渲染具有條件渲染元數(shù)據(jù)的基于對(duì)象的音頻的方法和系統(tǒng)對(duì)相關(guān)申請(qǐng)的交叉引用本申請(qǐng)要求2013年4月3日提交的美國臨時(shí)專利申請(qǐng)No.61/807922和2013年6月7日提交的美國臨時(shí)專利申請(qǐng)No.61/832397的申請(qǐng)日權(quán)益。技術(shù)領(lǐng)域本發(fā)明涉及音頻信號(hào)處理,并且更特別地,涉及包括音頻內(nèi)容(指示至少一個(gè)揚(yáng)聲器聲道和至少一個(gè)音頻對(duì)象聲道)和支持以依賴于回放有事情配置的方式對(duì)音頻內(nèi)容的條件渲染(conditionalrendering)的元數(shù)據(jù)的音頻數(shù)據(jù)比特流的編碼、解碼和交互式渲染。本發(fā)明的一些實(shí)施例以被稱為杜比數(shù)字(DolbyDigital,AC-3)、杜比數(shù)字加(DolbyDigitalPlus,增強(qiáng)版AC-3或E-AC-3)或者杜比E(DolbyE)的格式之一來生成、解碼和/或渲染音頻數(shù)據(jù)。
背景技術(shù):杜比、杜比數(shù)字、杜比數(shù)字加以及杜比E是杜比實(shí)驗(yàn)室授權(quán)許可公司(DolbyLaboratoriesLicensingCorporation)的商標(biāo)。杜比實(shí)驗(yàn)室提供分別被稱為杜比數(shù)字和杜比數(shù)字加的AC-3和E-AC-3的專有實(shí)現(xiàn)。盡管本發(fā)明不限于在根據(jù)E-AC-3(或者AC-3或杜比E)格式對(duì)音頻數(shù)據(jù)進(jìn)行編碼時(shí)或者在傳送、解碼或渲染E-AC-3、AC-3或杜比E編碼數(shù)據(jù)時(shí)使用,但是為了方便,在實(shí)施例中將描述本發(fā)明根據(jù)E-AC-3、AC-3或杜比E格式對(duì)音頻比特流進(jìn)行編碼并且傳送、解碼和渲染這種比特流典型的音頻數(shù)據(jù)流包括音頻內(nèi)容(例如,音頻內(nèi)容的一個(gè)或更多個(gè)聲道)和指示音頻內(nèi)容的至少一個(gè)特性的元數(shù)據(jù)。例如,在AC-3比特流中,存在若干個(gè)專用于改變被傳送給收聽環(huán)境的節(jié)目的聲音的音頻元數(shù)據(jù)參數(shù)。AC-3或E-AC-3編碼比特流包括元數(shù)據(jù),并且可以包括1至6個(gè)聲道的音頻內(nèi)容。音頻內(nèi)容是已經(jīng)利用感知音頻編碼壓縮的音頻數(shù)據(jù)。AC-3(也稱為杜比數(shù)字)編碼的細(xì)節(jié)是眾所周知的,并且在許多公開文獻(xiàn)中得到闡述,公開文獻(xiàn)包括:ATSC標(biāo)準(zhǔn)A52/A:DigitalAudioCompressionStandard(AC-3),修訂版A,先進(jìn)電視系統(tǒng)委員會(huì),2001年8月20日;及美國專利5583962、5632005、5633981、5727119以及6021386杜比數(shù)字加(E-AC-3)編碼的細(xì)節(jié)例如在下文中得到闡述:“IntroductiontoDolbyDigitalPlus,anEnhancementtotheDolbyDigitalCodingSystem”,AES會(huì)議論文6196,第117屆AES會(huì)議,2004年10月28日。杜比E編碼的細(xì)節(jié)在下文中得到闡述:“EfficientBitAllocation,Quantization,andCodinginanAudioDistributionSystem”,AES預(yù)印本5068,第107次AES會(huì)議,1999年8月;和“ProfessionalAudioCoderOptimizedforUsewithVideo”,AES預(yù)印本5033,第107次AES會(huì)議,1999年8月。AC-3編碼音頻比特流的每幀包含針對(duì)數(shù)字音頻的1536個(gè)樣本的音頻內(nèi)容和元數(shù)據(jù)。對(duì)于48kHz的采樣速率,這代表32毫秒的數(shù)字音頻或者音頻的31.25幀/秒的速率。取決于幀分別包含1、2、3或6個(gè)音頻數(shù)據(jù)塊,E-AC-3編碼音頻比特流的每幀包含針對(duì)數(shù)字音頻的256、512、768或1536個(gè)樣本的音頻內(nèi)容和元數(shù)據(jù)。對(duì)于48kHz的采樣速率,這分別代表5.333、10.667、16或32毫秒的數(shù)字音頻或者音頻的189.9、93.75、62.5或31.25幀/秒的速率。如在圖1中所示,每個(gè)AC-3幀被分成部分(片段),包括:同步信息(SI)部分,該部分包含(如圖2中所示)同步字(SW)和兩個(gè)糾錯(cuò)字中的第一個(gè)(CRC1);比特流信息(BSI)部分,該部分包含大部分元數(shù)據(jù);6個(gè)音頻塊(AB0至AB5),其包含經(jīng)數(shù)據(jù)壓縮的音頻內(nèi)容(并且也可以包括元數(shù)據(jù));浪費(fèi)比特(W),其包含在壓縮音頻內(nèi)容之后剩余的任何未使用的比特;輔助(AUX)信息部分,該部分可以包含更多元數(shù)據(jù);以及兩個(gè)糾錯(cuò)字中的第二個(gè)(CRC2)。如圖4中所示,每個(gè)E-AC-3幀被分成部分(片段),包括:同步信息(SI)部分,該部分包含(如圖2中所示)同步字(SW);比特流信息(BSI)部分,該部分包含大部分元數(shù)據(jù);1至6個(gè)之間的音頻塊(AB0至AB5),其包含經(jīng)數(shù)據(jù)壓縮的音頻內(nèi)容(并且也可以包括元數(shù)據(jù));浪費(fèi)比特(W),其包含在壓縮音頻內(nèi)容之后剩余的任何未使用的比特;輔助(AUX)信息部分,該部分可以包含更多元數(shù)據(jù);以及糾錯(cuò)字(CRC)。在AC-3(或E-AC-3)比特流中,存在若干個(gè)專用于改變被傳送到收聽環(huán)境的節(jié)目的聲音的音頻元數(shù)據(jù)參數(shù)。其中一個(gè)元數(shù)據(jù)參數(shù)是包括在BSI片段中的DIALNORM參數(shù)。如圖3中所示,AC-3幀(或E-AC-3幀)的BSI片段包括指示該節(jié)目的DIALNORM值的5比特參數(shù)(“DIALNORM”)。如果AC-3幀的音頻編碼模式(“acmod”)是“0”,則包括指示在同一AC-3幀中攜帶的第二音頻節(jié)目的DIALNORM值的5比特參數(shù)(“DIALNORM2”),以指示正在使用雙單聲道或“1+1”聲道配置。BSI片段還包括指示緊跟在“addbsie”比特之后的附加比特流信息的存在(或不存在)的標(biāo)志(“addbsie”)、指示緊跟在“addbsil”值之后的任何附加比特流信息的長度的參數(shù)(“addbsil”)、以及緊跟在“addbsil”值之后的至多64比特的附加比特流信息(“addbsi”)。BSI片段包括未在圖3中具體示出的其它元數(shù)據(jù)值。已經(jīng)提出在音頻比特流中包括其它類型的元數(shù)據(jù)。例如,在國際申請(qǐng)日為2011年12月1日且被轉(zhuǎn)讓給本申請(qǐng)的受讓人的PCT國際申請(qǐng)公開號(hào)WO2012/075246A2中,描述了用于生成、解碼和處理包括指示音頻內(nèi)容的特性(例如,響度)和處理狀態(tài)(例如,響度處理狀態(tài))的元數(shù)據(jù)的音頻比特流的方法和系統(tǒng)。該參考文獻(xiàn)還描述了利用元數(shù)據(jù)對(duì)比特流的音頻內(nèi)容的自適應(yīng)處理,以及利用元數(shù)據(jù)對(duì)比特流的音頻內(nèi)容的響度處理狀態(tài)和響度的有效性驗(yàn)證。還已知用于生成和渲染基于對(duì)象的音頻節(jié)目的方法。在這種節(jié)目的生成過程中,可以假設(shè)要用于渲染的揚(yáng)聲器位于回放環(huán)境中的任意位置(或者揚(yáng)聲器在單位圓的對(duì)稱配置中);不需要假設(shè)揚(yáng)聲器在(標(biāo)稱)水平面內(nèi)或者在節(jié)目生成時(shí)已知的任何其它預(yù)定布置中。典型地,節(jié)目中所包括的元數(shù)據(jù)指示用于例如使用揚(yáng)聲器的三維陣列來在明顯空間位置或者沿著軌跡(三維空間中)渲染節(jié)目的至少一個(gè)對(duì)象的渲染參數(shù)。例如,節(jié)目的對(duì)象聲道可以具有相應(yīng)的元數(shù)據(jù),指示要渲染(由對(duì)象聲道指示的)對(duì)象的明顯空間位置的三維軌跡。軌跡可以包括一系列“地板”位置(在被假設(shè)位于回放環(huán)境的地板上或在另一水平面內(nèi)的揚(yáng)聲器子集的平面內(nèi))、以及一系列“地板上方”位置(各自通過驅(qū)動(dòng)被假設(shè)位于回放環(huán)境的至少一個(gè)其它水平面內(nèi)的揚(yáng)聲器子集來確定)。例如,在2011年9月29日以國際公開No.WO2011/119401A2公開且被轉(zhuǎn)讓給本申請(qǐng)的受讓人的PCT國際申請(qǐng)No.PCT/US2001/028783中,描述了對(duì)基于對(duì)象的音頻節(jié)目的渲染的示例。上述美國臨時(shí)專利申請(qǐng)No.61/807922和上述美國臨時(shí)專利申請(qǐng)No.61/832397描述了基于對(duì)象的音頻節(jié)目,該基于對(duì)象的音頻節(jié)目被渲染為提供對(duì)節(jié)目的音頻內(nèi)容的沉浸式、可個(gè)性化感知。內(nèi)容可以指示在觀賞型賽事(例如,足球或橄欖球賽、或另一體育賽事)上的氣氛(即,其中出現(xiàn)的聲音)和/或現(xiàn)場(chǎng)解說。節(jié)目的音頻內(nèi)容可以指示多個(gè)音頻對(duì)象聲道(例如,指示用戶可選的對(duì)象或?qū)ο蠼M,并且典型地還有在不存在用戶對(duì)對(duì)象的選擇時(shí)要渲染的一組默認(rèn)對(duì)象)和至少一床(abedof)揚(yáng)聲器聲道。所述一床揚(yáng)聲器聲道可以是可能被包括在不包括對(duì)象聲道的常規(guī)廣播節(jié)目中的類型的揚(yáng)聲器聲道的常規(guī)混合(例如,5.1聲道混合)。上述美國臨時(shí)專利申請(qǐng)No.61/807922和No.61/832397描述了作為基于對(duì)象的音頻節(jié)目的一部分被傳送的對(duì)象相關(guān)元數(shù)據(jù),該對(duì)象相關(guān)元數(shù)據(jù)提供了回放側(cè)的混合交互性,包括通過允許終端用戶選擇節(jié)目的音頻內(nèi)容的混合以進(jìn)行渲染,而不是僅僅允許回放預(yù)先混合的聲場(chǎng)。例如,用戶可以在由本發(fā)明的節(jié)目的典型實(shí)施例的元數(shù)據(jù)提供的渲染選項(xiàng)之間進(jìn)行選擇,以選擇可用對(duì)象聲道的子集來進(jìn)行渲染,并且可選地還選擇由要渲染的對(duì)象聲道指示的至少一個(gè)音頻對(duì)象(聲音源)的回放水平。每個(gè)所選聲音源被渲染的空間位置可以由包括在節(jié)目中的元數(shù)據(jù)預(yù)先確定,但是在一些實(shí)施例中,可以由用戶選擇(例如,經(jīng)受預(yù)定的規(guī)則或約束)。在一些實(shí)施例中,節(jié)目中所包括的元數(shù)據(jù)允許用戶從渲染選項(xiàng)菜單(例如,少量的渲染選項(xiàng),例如,“主隊(duì)人群噪聲”對(duì)象、“主隊(duì)人群噪聲”和“主隊(duì)現(xiàn)場(chǎng)解說”對(duì)象組、“客隊(duì)人群噪聲”對(duì)象、以及“客隊(duì)人群噪聲”和“客隊(duì)現(xiàn)場(chǎng)解說”對(duì)象組)之間選擇。菜單可以由控制器的用戶界面呈現(xiàn)給用戶,并且控制器可以(例如,通過無線鏈路)耦接到被配置為(至少部分地)解碼和渲染基于對(duì)象的節(jié)目的機(jī)頂設(shè)備(或其它設(shè)備)。節(jié)目中所包括的元數(shù)據(jù)可以以其它方式允許用戶從關(guān)于由對(duì)象聲道指示的哪些對(duì)象應(yīng)該被渲染以及關(guān)于要渲染的對(duì)象應(yīng)該如何配置的一組選項(xiàng)之間進(jìn)行選擇。美國臨時(shí)專利申請(qǐng)No.61/807922和No.1/832397描述了這樣的基于對(duì)象的音頻節(jié)目,該基于對(duì)象的音頻節(jié)目是指示節(jié)目的至少一些(即,至少一部分)音頻內(nèi)容(例如,一床揚(yáng)聲器聲道和至少一些節(jié)目對(duì)象聲道)和對(duì)象相關(guān)元數(shù)據(jù)的編碼音頻比特流。至少一個(gè)附加的比特流或文件可以指示節(jié)目的一些音頻內(nèi)容(例如,至少一些對(duì)象聲道)和/或?qū)ο笙嚓P(guān)元數(shù)據(jù)。在一些實(shí)施例中,對(duì)象相關(guān)元數(shù)據(jù)利用默認(rèn)的渲染參數(shù)(例如,渲染對(duì)象的默認(rèn)空間位置)來提供對(duì)象內(nèi)容和床(揚(yáng)聲器聲道)內(nèi)容的默認(rèn)混合。在一些實(shí)施例中,對(duì)象相關(guān)元數(shù)據(jù)提供對(duì)象聲道和揚(yáng)聲器聲道內(nèi)容的一組可選“預(yù)設(shè)”混合,每個(gè)預(yù)設(shè)混合具有一組預(yù)定的渲染參數(shù)(例如,渲染對(duì)象的空間位置)。在一些實(shí)施例中,節(jié)目的對(duì)象相關(guān)元數(shù)據(jù)(或者未被與節(jié)目一起傳送的元數(shù)據(jù)指示的回放或渲染系統(tǒng)的預(yù)配置)提供了關(guān)于對(duì)象聲道和揚(yáng)聲器聲道內(nèi)容的可選混合的約束或條件。美國臨時(shí)專利申請(qǐng)No.61/807922和No.61/832397還描述了包括一組并行生成和傳輸?shù)谋忍亓?有時(shí)被稱為“子流”)的基于對(duì)象的音頻節(jié)目??梢岳枚鄠€(gè)解碼器來對(duì)它們進(jìn)行解碼(例如,如果該節(jié)目包括多個(gè)E-AC-3子流,則回放系統(tǒng)可以利用多個(gè)E-AC-3解碼器來對(duì)子流進(jìn)行解碼)。每個(gè)子流可以包括同步字(例如,時(shí)間碼),以允許子流彼此同步或時(shí)間對(duì)齊。美國臨時(shí)專利申請(qǐng)No.61/807922和No.61/832397還描述了這樣的基于對(duì)象的音頻節(jié)目:該基于對(duì)象的音頻節(jié)目是或包括至少一個(gè)AC-3(或E-AC-3)比特流,并且包括一個(gè)或更多個(gè)被稱為容器的數(shù)據(jù)結(jié)構(gòu)。包括對(duì)象聲道內(nèi)容(和/或?qū)ο笙嚓P(guān)元數(shù)據(jù))的每個(gè)容器被包括在比特流的幀尾的auxdata字段(例如,圖1或圖4中所示的AUX片段)中、或者在比特流的“跳過字段”片段中。還描述了包括杜比E比特流的基于對(duì)象的音頻節(jié)目,其中對(duì)象聲道內(nèi)容和對(duì)象相關(guān)元數(shù)據(jù)(例如,包括對(duì)象聲道內(nèi)容和/或?qū)ο笙嚓P(guān)元數(shù)據(jù)的節(jié)目的每個(gè)容器)被包括在杜比E比特流的一般不攜帶有用信息的比特位置中。美國臨時(shí)申請(qǐng)No.61/832397還描述這樣的基于對(duì)象的音頻節(jié)目,該基于對(duì)象的音頻節(jié)目包括至少一組揚(yáng)聲器聲道、至少一個(gè)對(duì)象聲道和指示分層圖(分層“混合圖”)的元數(shù)據(jù),其中所述分層圖指示揚(yáng)聲器聲道和對(duì)象聲道的可選混合(例如,所有可選的混合)。混合圖可以指示適用于選擇揚(yáng)聲器和對(duì)象聲道的子集的每個(gè)規(guī)則,指示節(jié)點(diǎn)(每個(gè)節(jié)點(diǎn)可以指示可選的聲道或聲道組,或一類可選的聲道或聲道組)以及節(jié)點(diǎn)之間的連接(例如,到用于選擇聲道的規(guī)則和/或節(jié)點(diǎn)的控制接口)?;旌蠄D可以指示必要數(shù)據(jù)(“基本”層)和可選數(shù)據(jù)(至少一個(gè)“擴(kuò)展”層),并且當(dāng)混合圖能夠被表示為樹圖時(shí),基本層可以是該樹圖的樹枝(或者兩個(gè)或更多個(gè)樹枝),而每個(gè)擴(kuò)展層可以是該樹圖的另一個(gè)樹枝(或者樹枝組)。正如所述,已經(jīng)提出了在基于對(duì)象的音頻節(jié)目中包括這樣的對(duì)象相關(guān)元數(shù)據(jù):該對(duì)象相關(guān)元數(shù)據(jù)指示用于使用揚(yáng)聲器陣列在明顯的空間位置或沿著明顯的軌跡(在三維空間中)渲染(由節(jié)目的對(duì)象聲道指示的)至少一個(gè)對(duì)象的渲染參數(shù)。例如,節(jié)目的對(duì)象聲道可以具有指示要渲染相應(yīng)對(duì)象的明顯空間位置的三維軌跡的相應(yīng)元數(shù)據(jù)。該軌跡可以包括回放環(huán)境的“地板”平面(其中“地板”平面是標(biāo)稱地包括聽者耳朵的預(yù)期位置的水平面)中的一系列“地板”位置以及地板平面上方的一系列“地板上方”位置。已經(jīng)提出了在地板上方位置對(duì)基于對(duì)象的節(jié)目的對(duì)象進(jìn)行渲染,包括通過生成用于驅(qū)動(dòng)(回放揚(yáng)聲器陣列的)至少一個(gè)“地板上方”揚(yáng)聲器的至少一個(gè)揚(yáng)聲器饋送,所述至少一個(gè)“地板上方”揚(yáng)聲器假設(shè)位于回放環(huán)境的地板平面上方。這種地板上方的揚(yáng)聲器有時(shí)被稱為“高度”揚(yáng)聲器。傳統(tǒng)地,根據(jù)預(yù)定公式來執(zhí)行多聲道音頻節(jié)目的音頻下混(downmixing),以將該節(jié)目的第一組聲道(指示第一聲場(chǎng)的N個(gè)聲道,其中N為整數(shù))向下坍塌(下混)為第二組聲道(指示下混聲場(chǎng)的M個(gè)聲道,其中M是小于N的整數(shù)),以便由包括M個(gè)揚(yáng)聲器的可用揚(yáng)聲器陣列(例如,包含兩個(gè)揚(yáng)聲器的立體聲電視揚(yáng)聲器陣列)回放。在下混后的回放期間,可用揚(yáng)聲器陣列發(fā)出指示下混聲場(chǎng)的聲音。典型地,這種類型的傳統(tǒng)下混在第二組聲道(即,下混)中包括第一組中所有聲道的音頻內(nèi)容。如果在回放系統(tǒng)揚(yáng)聲器陣列中不存在地板上方(“高度”)揚(yáng)聲器,則可以利用(上述類型的)傳統(tǒng)下混技術(shù)來下混該節(jié)目的揚(yáng)聲器聲道的內(nèi)容和對(duì)象聲道的內(nèi)容(其中揚(yáng)聲器聲道內(nèi)容打算由回放揚(yáng)聲器陣列的地板揚(yáng)聲器播放),使得所得到的下混聲音僅從回放揚(yáng)聲器陣列的地板揚(yáng)聲器發(fā)出。但是,發(fā)明人已經(jīng)認(rèn)識(shí)到:因?yàn)榈匕迳戏降膶?duì)象聲道的內(nèi)容會(huì)被下混到原始揚(yáng)聲器聲道的內(nèi)容中,所以傳統(tǒng)的下混會(huì)不合需要地在回放所得到的下混時(shí)導(dǎo)致嘈雜的聲音(例如,地板上方的內(nèi)容會(huì)被感知成受到原始揚(yáng)聲器聲道內(nèi)容干擾)。發(fā)明人還已經(jīng)認(rèn)識(shí)到:(上述類型的)傳統(tǒng)下混技術(shù)具有不一定與在回放揚(yáng)聲器陣列中是否存在高度揚(yáng)聲器有關(guān)的其他限制和缺點(diǎn)。例如,發(fā)明人已經(jīng)認(rèn)識(shí)到:即使在傳統(tǒng)的5.1聲道音頻制作中,也經(jīng)常作出妥協(xié),以針對(duì)立體聲下混保持合理的聲場(chǎng)。例如,廣播公司可能想要在5.1聲道節(jié)目的環(huán)繞聲道中放入現(xiàn)場(chǎng)解說(或其他對(duì)話元素),但是卻選擇不這么做,因?yàn)閭鹘y(tǒng)實(shí)現(xiàn)的期望表示的立體聲下混不向立體聲電視觀看者提供滿意的或有代表性的體驗(yàn)。在本發(fā)明之前,尚不知道如何基于回放揚(yáng)聲器陣列配置來以確保下混符合預(yù)定下混約束(例如,由生成和廣播該節(jié)目的實(shí)體或者由節(jié)目內(nèi)容創(chuàng)建者指定的一個(gè)或更多個(gè)下混約束)的方式對(duì)基于對(duì)象的音頻節(jié)目的選定聲道(例如對(duì)象聲道和揚(yáng)聲器聲道)的下混進(jìn)行渲染(例如,以避免在回放時(shí)有嘈雜的或其他不希望的下混聲音)。本發(fā)明的不同實(shí)施例適用于其中節(jié)目指示有比最終再現(xiàn)環(huán)境中可用的音頻聲道多的音頻聲道的任何和所有情況(即,節(jié)目包括的聲道(對(duì)象聲道和/或揚(yáng)聲器聲道)比要驅(qū)動(dòng)的回放揚(yáng)聲器陣列的揚(yáng)聲器數(shù)量多的所有情況)。
技術(shù)實(shí)現(xiàn)要素:本發(fā)明的一類實(shí)施例包括用于基于回放揚(yáng)聲器陣列配置來生成和條件渲染交互式的基于對(duì)象的音頻的方法(其中,在本上下文中,回放揚(yáng)聲器陣列“配置”表示至少一個(gè)配置屬性,例如,陣列中揚(yáng)聲器的數(shù)量和回放環(huán)境中每個(gè)揚(yáng)聲器的實(shí)際布置或假設(shè)布置)。(根據(jù)本發(fā)明的一些實(shí)施例生成的)基于對(duì)象的音頻節(jié)目中的對(duì)象相關(guān)元數(shù)據(jù)指示用于使用回放系統(tǒng)揚(yáng)聲器陣列在明顯空間位置或沿著明顯軌跡(在三維空間中)渲染(由節(jié)目的對(duì)象聲道指示的)至少一個(gè)對(duì)象的渲染參數(shù)。例如,該節(jié)目的對(duì)象聲道可以具有指示要渲染相應(yīng)對(duì)象的明顯空間位置的三維軌跡的相應(yīng)元數(shù)據(jù)。該軌跡可以包括一系列“地板”位置(標(biāo)稱地在回放環(huán)境的地板平面內(nèi),該地板平面假設(shè)至少近似地與聽者耳朵的水平面重合)以及地板平面上方的一系列“地板上方”位置。為了渲染在地板上方位置的對(duì)象,生成至少一個(gè)揚(yáng)聲器饋送來驅(qū)動(dòng)回放揚(yáng)聲器陣列中的假設(shè)位于回放環(huán)境的地板平面上方的至少一個(gè)揚(yáng)聲器。一類實(shí)施例包括用于生成和/或渲染如下基于對(duì)象的音頻節(jié)目的方法:所述基于對(duì)象的音頻節(jié)目包括與節(jié)目的至少一個(gè)對(duì)象聲道(例如,地板上方的對(duì)象聲道)對(duì)應(yīng)的條件渲染元數(shù)據(jù)。因此,由每個(gè)這種對(duì)象聲道指示的每個(gè)音頻對(duì)象具有相應(yīng)的條件渲染元數(shù)據(jù)。例如,在一些實(shí)施例中,具有相應(yīng)條件渲染元數(shù)據(jù)的每個(gè)音頻對(duì)象可以是地板上方對(duì)象。在一類實(shí)施例中,條件渲染元數(shù)據(jù)是指示適用于每個(gè)相應(yīng)對(duì)象聲道(即,與條件渲染元數(shù)據(jù)對(duì)應(yīng)的每個(gè)對(duì)象聲道)的、基于回放揚(yáng)聲器陣列配置的至少一個(gè)渲染約束的對(duì)象相關(guān)元數(shù)據(jù)。這種渲染約束的示例是:當(dāng)回放揚(yáng)聲器陣列配置為特定類型時(shí),禁止渲染相應(yīng)的對(duì)象聲道。(已知曉其回放揚(yáng)聲器陣列為此特定類型的)回放系統(tǒng)可以被配置(例如,被預(yù)配置,或者響應(yīng)于節(jié)目的元數(shù)據(jù)而被配置)為通過防止實(shí)現(xiàn)將對(duì)象聲道的內(nèi)容渲染成揚(yáng)聲器饋送(用于驅(qū)動(dòng)回放揚(yáng)聲器)來響應(yīng)于指示這種渲染約束的條件渲染元數(shù)據(jù)進(jìn)行操作。由(通過這類實(shí)施例中的方法)生成的條件渲染元數(shù)據(jù)指示的渲染約束的另一個(gè)示例是:當(dāng)回放揚(yáng)聲器陣列配置為特定類型時(shí),對(duì)渲染相應(yīng)對(duì)象聲道的內(nèi)容的至少一個(gè)允許類型的指示。由條件渲染元數(shù)據(jù)指示的渲染約束的其他示例是:在(或關(guān)于)相應(yīng)對(duì)象聲道的內(nèi)容被包括在渲染該內(nèi)容期間生成的每個(gè)揚(yáng)聲器饋送中的情況下,對(duì)布置、水平、尺寸和其他屬性(例如,要執(zhí)行的特效處理)的指示,使得當(dāng)回放揚(yáng)聲器陣列播放該渲染內(nèi)容時(shí),渲染內(nèi)容將被感知為從具有由元數(shù)據(jù)指示的空間位置、水平、尺寸和/或其他屬性的明顯源(對(duì)象)發(fā)出。在一些實(shí)施例中,條件渲染元數(shù)據(jù)是這樣的對(duì)象相關(guān)元數(shù)據(jù):其指示適用于每個(gè)相應(yīng)對(duì)象聲道(即,與條件渲染元數(shù)據(jù)對(duì)應(yīng)的每個(gè)對(duì)象聲道)的作為基于回放揚(yáng)聲器陣列配置的下混約束的至少一個(gè)渲染約束。這種下混約束的示例是當(dāng)回放揚(yáng)聲器陣列配置為特定類型時(shí),禁止下混相應(yīng)對(duì)象聲道。(已知曉其回放揚(yáng)聲器陣列為該特定類型的)回放系統(tǒng)可以被配置為(例如,被預(yù)配置,或者響應(yīng)于節(jié)目的元數(shù)據(jù)而被配置)為通過防止實(shí)現(xiàn)將對(duì)象聲道的內(nèi)容渲染成該節(jié)目的揚(yáng)聲器聲道來響應(yīng)于指示這種渲染約束的條件渲染元數(shù)據(jù)進(jìn)行操作。由(通過這類實(shí)施例中的方法)所生成的條件渲染元數(shù)據(jù)指示的下混約束的另一個(gè)示例是當(dāng)回放揚(yáng)聲器陣列配置為特定類型時(shí)對(duì)包括相應(yīng)對(duì)象聲道的至少一個(gè)允許下混(或下混類型)的指示。由條件渲染元數(shù)據(jù)指示的渲染約束的其他示例是:基于回放揚(yáng)聲器配置,(在相應(yīng)對(duì)象聲道到一個(gè)或更多個(gè)揚(yáng)聲器聲道的下混中)對(duì)音頻對(duì)象的布置、水平、尺寸和其他屬性(例如,要執(zhí)行的特效處理)的指示。要領(lǐng)會(huì)的是,對(duì)基于對(duì)象的音頻節(jié)目的N個(gè)聲道“執(zhí)行下混”(或“下混”,或“渲染下混”)的表述在此是以寬泛的意義使用的,以表示確定或生成用于驅(qū)動(dòng)回放揚(yáng)聲器陣列的M個(gè)揚(yáng)聲器的M個(gè)揚(yáng)聲器饋送(指示節(jié)目的N個(gè)聲道中的至少一些聲道以及典型地全部聲道的內(nèi)容)。在一個(gè)示例中,屬于(包括N個(gè)聲道的節(jié)目的)對(duì)象聲道的條件渲染元數(shù)據(jù)以如下意義指示至少一個(gè)下混約束(基于回放揚(yáng)聲器陣列配置):條件渲染元數(shù)據(jù)的第一子集指示用于驅(qū)動(dòng)M1個(gè)回放揚(yáng)聲器的第一陣列的M1個(gè)揚(yáng)聲器饋送的生成的某個(gè)屬性(或者與之相關(guān)的規(guī)則),使得該M1個(gè)揚(yáng)聲器饋送指示包括對(duì)象聲道內(nèi)容的節(jié)目內(nèi)容的下混,而條件渲染元數(shù)據(jù)的第二子集指示用于驅(qū)動(dòng)M2個(gè)回放揚(yáng)聲器的不同陣列的M2個(gè)揚(yáng)聲器饋送的生成的某個(gè)屬性(或者與之相關(guān)的規(guī)則),使得該M2個(gè)揚(yáng)聲器饋送指示包括對(duì)象聲道內(nèi)容的節(jié)目內(nèi)容的另一下混,其中M1不等于M2。在該示例中,對(duì)節(jié)目的N個(gè)聲道上的下混進(jìn)行渲染以便由M1個(gè)揚(yáng)聲器的第一陣列回放將典型地包括以下步驟:選擇條件渲染元數(shù)據(jù)的第一子集(而不是條件渲染元數(shù)據(jù)的第二子集),以及使用所選擇的條件渲染元數(shù)據(jù)的第一子集來確定或生成適當(dāng)?shù)腗1個(gè)揚(yáng)聲器饋送。在一類實(shí)施例中,本發(fā)明是用于生成基于對(duì)象的音頻節(jié)目的方法,該方法包括以下步驟:生成與至少一個(gè)對(duì)象聲道對(duì)應(yīng)的條件渲染元數(shù)據(jù),使得該條件渲染數(shù)據(jù)指示適用于所述至少一個(gè)對(duì)象聲道的基于回放揚(yáng)聲器陣列配置的至少一個(gè)渲染約束(例如,下混約束);確定包括所述至少一個(gè)對(duì)象聲道(以及可選地還有至少一個(gè)揚(yáng)聲器聲道)的一組音頻聲道;以及生成基于對(duì)象的音頻節(jié)目,使得所述基于對(duì)象的音頻節(jié)目指示所述一組音頻聲道以及條件渲染元數(shù)據(jù),并且使得所述一組音頻聲道中的至少一個(gè)音頻聲道的內(nèi)容能夠響應(yīng)于至少一些條件渲染元數(shù)據(jù)來由回放系統(tǒng)以符合至少一個(gè)渲染約束的方式渲染??蛇x地,條件渲染元數(shù)據(jù)還指示用于對(duì)節(jié)目的音頻聲道進(jìn)行渲染(例如,實(shí)現(xiàn)其下混)的基于回放揚(yáng)聲器陣列配置的至少一個(gè)渲染規(guī)則(例如,至少一個(gè)下混規(guī)則)。例如,條件渲染元數(shù)據(jù)可以指示以下規(guī)則:如果回放揚(yáng)聲器陣列包括至少一個(gè)地板上方揚(yáng)聲器,則(例如,如節(jié)目的至少一些條件渲染元數(shù)據(jù)所指示的)節(jié)目的第一類型的每個(gè)對(duì)象聲道應(yīng)該被下混成由用戶選定的(或默認(rèn)的)的任何節(jié)目內(nèi)容混合指定的任何揚(yáng)聲器聲道,如果回放揚(yáng)聲器陣列不包括至少一個(gè)地板上方揚(yáng)聲器,則節(jié)目的第一類型的每個(gè)對(duì)象聲道應(yīng)該被回放系統(tǒng)忽略(即,不應(yīng)該被包括在下混中),并且不管回放揚(yáng)聲器陣列的配置如何,(例如,如節(jié)目的至少一些條件渲染元數(shù)據(jù)所指示的)節(jié)目的第二類型的每個(gè)對(duì)象聲道都應(yīng)該被下混成由用戶選擇的(或默認(rèn)的)該節(jié)目的任何聲道內(nèi)容混合指定的任何揚(yáng)聲器聲道。所考慮的是,根據(jù)本發(fā)明的一些實(shí)施例,生成基于對(duì)象的音頻節(jié)目包括如下步驟:選擇可用的(即,之前已生成的)條件渲染元數(shù)據(jù)的第一子集,并將所選擇的條件渲染元數(shù)據(jù)(而非未選擇的條件渲染元數(shù)據(jù))包括在節(jié)目中。在其他實(shí)施例中,本發(fā)明是由基于對(duì)象的音頻節(jié)目確定的音頻內(nèi)容的渲染方法,其中所述節(jié)目指示與至少一個(gè)對(duì)象聲道對(duì)應(yīng)的條件渲染元數(shù)據(jù)、以及包括至少一個(gè)對(duì)象聲道(和可選地還有至少一個(gè)揚(yáng)聲器聲道)的一組音頻聲道,并且其中條件渲染元數(shù)據(jù)指示適用于所述至少一個(gè)對(duì)象聲道的基于回放揚(yáng)聲器陣列配置的至少一個(gè)渲染約束(例如,至少一個(gè)下混約束),所述方法包括以下步驟:(a)將基于對(duì)象的音頻節(jié)目提供給音頻處理單元;以及(b)在音頻處理單元中,解析條件渲染元數(shù)據(jù)和所述一組音頻聲道,并且響應(yīng)于條件渲染元數(shù)據(jù)中的至少一些來以符合至少一個(gè)渲染約束的方式對(duì)所述一組音頻聲道中的至少一個(gè)音頻聲道的內(nèi)容進(jìn)行渲染。在一些這種實(shí)施例中,所述一組音頻聲道包括至少一個(gè)揚(yáng)聲器聲道,并且步驟(b)包括如下步驟:選擇所述一組音頻聲道中的至少一個(gè)對(duì)象聲道,并且使該組中的每個(gè)選定對(duì)象聲道與該組中的至少一個(gè)揚(yáng)聲器聲道混合,以生成所述每個(gè)選定對(duì)象聲道與至少一個(gè)揚(yáng)聲器聲道的內(nèi)容的下混。典型地,該下混包含一組N個(gè)下混揚(yáng)聲器聲道,其中N為正整數(shù),并且步驟(b)包括通過用根據(jù)下混揚(yáng)聲器聲道生成的揚(yáng)聲器饋送驅(qū)動(dòng)揚(yáng)聲器來使回放揚(yáng)聲器陣列的N個(gè)揚(yáng)聲器發(fā)出聲音??蛇x地,條件渲染元數(shù)據(jù)還指示基于回放揚(yáng)聲器陣列配置的至少一個(gè)渲染規(guī)則(例如,至少一個(gè)下混規(guī)則),并且在步驟(b)中執(zhí)行的渲染符合該渲染規(guī)則。根據(jù)本發(fā)明的典型實(shí)施例生成的基于對(duì)象的音頻節(jié)目可以被渲染為使得由回放揚(yáng)聲器陣列播放的指示節(jié)目的(例如,對(duì)象聲道和/或揚(yáng)聲器聲道的)下混內(nèi)容的聲音被感知為從聲音再現(xiàn)(回放)環(huán)境內(nèi)的不同明顯源位置發(fā)出。對(duì)于互動(dòng)式呈現(xiàn),由可選對(duì)象聲道中的選定對(duì)象聲道確定的對(duì)象在渲染聲場(chǎng)內(nèi)的位置(例如,與一組選定對(duì)象中的不同對(duì)象對(duì)應(yīng)的一組不同的靜態(tài)位置)被渲染,使得每個(gè)選定對(duì)象聲道被渲染成被感知為從由與選定對(duì)象聲道對(duì)應(yīng)的對(duì)象相關(guān)元數(shù)據(jù)確定的明顯源位置(或位置的軌跡)發(fā)出。例如,根據(jù)基于對(duì)象的音頻節(jié)目確定的沉浸式聲音混合可以指示這樣的聲音:該聲音又指示(由節(jié)目的選定對(duì)象聲道確定的)“公共廣播(publicaddress)”音頻對(duì)象的,從而被感知為從再現(xiàn)環(huán)境內(nèi)的假設(shè)聽者位置上方的明顯源位置發(fā)出,以便在從安裝在聽者上方的公共廣播揚(yáng)聲器發(fā)出通告時(shí)給予聽者(消費(fèi)者)正身處體育場(chǎng)的體驗(yàn)??梢赃x擇這種公共廣播音頻對(duì)象由包括物理地位于“地板”平面上方的水平面(有時(shí)候被稱為“地板上方”或“高度”平面)中的至少一個(gè)地板上方揚(yáng)聲器的揚(yáng)聲器陣列渲染和回放,其中“地板”平面是標(biāo)稱地包括聽者耳朵的預(yù)期位置的水平面。典型地,回放揚(yáng)聲器陣列的其他揚(yáng)聲器標(biāo)稱地位于地板平面內(nèi)。當(dāng)音頻對(duì)象(例如,之前示例的公共廣播音頻對(duì)象)由基于對(duì)象的音頻節(jié)目的獨(dú)立對(duì)象聲道確定,并且在該對(duì)象聲道被選擇(并且被渲染和播放)時(shí)節(jié)目的相應(yīng)元數(shù)據(jù)指示相應(yīng)的聲音應(yīng)該被感知為從其發(fā)出的地板上方的源位置(或者地板上方的源位置的軌跡)時(shí),我們將該音頻對(duì)象稱為“地板上方”(或“高度”)對(duì)象,并且將指示該地板上方對(duì)象的對(duì)象聲道稱為“地板上方”(或“高度”)對(duì)象聲道。地板上方音頻對(duì)象被典型地渲染和播放,使得所得到的聲音從回放系統(tǒng)揚(yáng)聲器陣列的至少一個(gè)地板上方(或“高度”)揚(yáng)聲器發(fā)出。如果在回放系統(tǒng)揚(yáng)聲器陣列中不存在地板上方(或“高度”)揚(yáng)聲器,則可以利用(上述類型的)傳統(tǒng)下混技術(shù)來使選定的“地板上方”對(duì)象聲道的內(nèi)容與節(jié)目的揚(yáng)聲器聲道的內(nèi)容下混(其中揚(yáng)聲器聲道內(nèi)容打算由回放揚(yáng)聲器陣列的地板揚(yáng)聲器播放),使得所得到的下混聲音僅僅從回放揚(yáng)聲器陣列的地板揚(yáng)聲器發(fā)出。但是,因?yàn)榈匕迳戏綄?duì)象聲道的內(nèi)容會(huì)被下混到揚(yáng)聲器聲道的內(nèi)容中,所以下混會(huì)不合需要地導(dǎo)致發(fā)聲嘈雜的混合(例如,地板上方的內(nèi)容會(huì)被感知為受原始揚(yáng)聲器聲道內(nèi)容干擾)。使用根據(jù)本發(fā)明一些實(shí)施例的基于對(duì)象的音頻節(jié)目中所包括的條件渲染元數(shù)據(jù),關(guān)于由節(jié)目指示的哪些音頻對(duì)象可以或者應(yīng)該被放置在該節(jié)目的聲道的下混的哪些揚(yáng)聲器聲道中(和/或哪些音頻對(duì)象應(yīng)該從下混的揚(yáng)聲器聲道中省略)、以及每個(gè)對(duì)象應(yīng)該以多少音量與該節(jié)目的其他音頻內(nèi)容下混、該節(jié)目的聲道的下混要在何時(shí)生成以供回放系統(tǒng)的可用揚(yáng)聲器回放,渲染系統(tǒng)可以做出明智的決定。本發(fā)明的典型實(shí)施例給予混音師藝術(shù)靈活性以在不做出常規(guī)下混會(huì)造成的妥協(xié)的情況下針對(duì)所考慮的每個(gè)回放揚(yáng)聲器陣列配置來確定(基于對(duì)象的音頻節(jié)目的內(nèi)容的)良好的發(fā)聲混合,并且包括相應(yīng)的條件渲染元數(shù)據(jù)以使得能夠?qū)γ總€(gè)這種混合進(jìn)行渲染。根據(jù)本發(fā)明的典型實(shí)施例,響應(yīng)于(假設(shè)已知曉可用的揚(yáng)聲器陣列配置的)節(jié)目中所包括的條件渲染元數(shù)據(jù)來對(duì)基于對(duì)象的音頻節(jié)目的對(duì)象聲道內(nèi)容進(jìn)行條件渲染允許以下中的一個(gè)或兩個(gè):基于特定的回放揚(yáng)聲器陣列配置來自動(dòng)選擇下混渲染選項(xiàng)(例如,具有專用立體聲輸出的機(jī)頂盒可以被預(yù)配置為使得其基于對(duì)象的音頻渲染引擎總是選擇所輸入的基于對(duì)象的節(jié)目的“立體聲”條件渲染元數(shù)據(jù),并且使用所選擇的“立體聲”條件渲染元數(shù)據(jù)來生成響應(yīng)于該節(jié)目的立體聲揚(yáng)聲器饋送);和/或在給定特定的回放揚(yáng)聲器陣列配置時(shí),由用戶從可用的渲染選項(xiàng)(例如,下混渲染選項(xiàng))的菜單中選擇。例如,假定回放揚(yáng)聲器陣列僅包含5.1聲道配置的地板揚(yáng)聲器,則所述菜單可以包括少量的可選下混渲染選項(xiàng),包括以下選項(xiàng):包含一床下混有“主隊(duì)現(xiàn)場(chǎng)解說”對(duì)象的揚(yáng)聲器聲道的內(nèi)容的“主隊(duì)現(xiàn)場(chǎng)解說”下混、包含一床下混有“客隊(duì)現(xiàn)場(chǎng)解說”對(duì)象的揚(yáng)聲器聲道的內(nèi)容的“客隊(duì)現(xiàn)場(chǎng)解說”下混、以及包含一床下混有“主隊(duì)現(xiàn)場(chǎng)解說”對(duì)象和“主隊(duì)人群噪聲”對(duì)象的揚(yáng)聲器聲道的內(nèi)容的“主隊(duì)現(xiàn)場(chǎng)解說加主隊(duì)人群噪聲”下混。對(duì)于另一個(gè)示例,假定回放揚(yáng)聲器陣列包括(例如,5.1聲道配置中的)地板揚(yáng)聲器和一組高度(地板上方)揚(yáng)聲器,所述菜單可以包括更多的可選下混渲染選項(xiàng),包括以下選項(xiàng):包含一床下混有“主隊(duì)現(xiàn)場(chǎng)解說”對(duì)象的揚(yáng)聲器聲道的內(nèi)容的“主隊(duì)現(xiàn)場(chǎng)解說”地板下混(用于僅驅(qū)動(dòng)陣列的地板揚(yáng)聲器)、包含一床下混有“客隊(duì)現(xiàn)場(chǎng)解說”對(duì)象的揚(yáng)聲器聲道的內(nèi)容的“客隊(duì)現(xiàn)場(chǎng)解說”地板下混(用于僅驅(qū)動(dòng)陣列的地板揚(yáng)聲器)、包含一床下混有“主隊(duì)現(xiàn)場(chǎng)解說”對(duì)象和“主隊(duì)人群噪聲”對(duì)象的揚(yáng)聲器聲道的內(nèi)容的“主隊(duì)現(xiàn)場(chǎng)解說加主隊(duì)人群噪聲”地板下混(用于僅驅(qū)動(dòng)陣列的地板揚(yáng)聲器)、以及包含一床下混有“主隊(duì)現(xiàn)場(chǎng)解說”對(duì)象、“主隊(duì)人群噪聲”對(duì)象和公告對(duì)象的揚(yáng)聲器聲道的內(nèi)容的“主隊(duì)現(xiàn)場(chǎng)解說加主隊(duì)人群噪聲加公告”下混(用于驅(qū)動(dòng)陣列的所有揚(yáng)聲器,但是公告對(duì)象聲道的內(nèi)容僅被包括在驅(qū)動(dòng)陣列的地板上方揚(yáng)聲器的下混揚(yáng)聲器饋送中,而所有其他下混內(nèi)容僅被包括在驅(qū)動(dòng)陣列的地板揚(yáng)聲器的下混揚(yáng)聲器饋送中)??梢酝ㄟ^控制器的用戶界面將渲染選項(xiàng)(例如,下混渲染選項(xiàng))的菜單呈現(xiàn)給用戶,并且該控制器可耦接到被配置為(至少部分地)解碼和渲染基于對(duì)象的節(jié)目的機(jī)頂設(shè)備(或其他設(shè)備)。該節(jié)目中所包括的元數(shù)據(jù)(包括上述條件渲染元數(shù)據(jù))可以允許用戶從關(guān)于由節(jié)目指示的哪些對(duì)象應(yīng)該被渲染以及關(guān)于要渲染的對(duì)象應(yīng)該如何配置的一組選項(xiàng)中進(jìn)行選擇。在一些實(shí)施例中,假定(一組可能的回放揚(yáng)聲器陣列配置中)具有特定相應(yīng)配置的回放揚(yáng)聲器可用,條件渲染元數(shù)據(jù)至少指定能被用戶選擇的(節(jié)目的音頻內(nèi)容的)每個(gè)可選下混(例如,由下混渲染選項(xiàng)菜單指示的每個(gè)可選下混)的以下屬性:存在(即,對(duì)于每個(gè)對(duì)象聲道,關(guān)于該對(duì)象聲道是否應(yīng)該存在于下混中以便由具有相應(yīng)配置的回放揚(yáng)聲器陣列渲染的指示);聲場(chǎng)內(nèi)的位置(即,對(duì)于將被包括在下混中以便由具有相應(yīng)配置的回放揚(yáng)聲器陣列渲染的每個(gè)對(duì)象聲道,當(dāng)由下混確定的揚(yáng)聲器饋送驅(qū)動(dòng)可用揚(yáng)聲器時(shí),對(duì)應(yīng)該被感知為發(fā)出相應(yīng)的明顯空間位置的指示);增益(即,對(duì)于將被包括在下混中以便由具有相應(yīng)配置的回放揚(yáng)聲器陣列渲染的每個(gè)對(duì)象聲道,當(dāng)生成該下混時(shí)要施加到相應(yīng)音頻樣本的增益的指示);效果(即,對(duì)于將被包括在下混中以便由具有相應(yīng)配置的回放揚(yáng)聲器陣列渲染的每個(gè)對(duì)象聲道,當(dāng)生成下混時(shí)要應(yīng)用于相應(yīng)音頻樣本的特殊效果處理(如果有的話)的每個(gè)種類的指示。這種處理的示例包括但不限于發(fā)散處理(divergenceprocessing)和混響應(yīng)用)。本發(fā)明的另一個(gè)方面是被配置為執(zhí)行本本發(fā)明的方法的任何實(shí)施例的音頻處理單元(APU)。在另一類實(shí)施例中,本發(fā)明是APU,包括(例如,以非暫態(tài)方式)存儲(chǔ)已經(jīng)由本發(fā)明的方法的任何實(shí)施例生成的基于對(duì)象的音頻節(jié)目的至少一個(gè)幀或其它片段(包括揚(yáng)聲器聲道和至少一個(gè)對(duì)象聲道的音頻內(nèi)容、以及包括條件渲染元數(shù)據(jù)的對(duì)象相關(guān)元數(shù)據(jù))的緩沖存儲(chǔ)器(緩沖區(qū))。APU的示例包括但不限于編碼器(例如,轉(zhuǎn)碼器)、解碼器、編解碼器、預(yù)處理系統(tǒng)(預(yù)處理器)、后處理系統(tǒng)(后處理器)、音頻比特流處理系統(tǒng)、以及這些元素的組合。本發(fā)明的各方面包括被配置為(例如,被編程為)執(zhí)行本發(fā)明的方法的任何實(shí)施例的系統(tǒng)或設(shè)備,以及(例如,以非暫態(tài)方式)存儲(chǔ)有用于實(shí)現(xiàn)本發(fā)明的方法或其步驟的任何實(shí)施例的代碼的計(jì)算機(jī)可讀介質(zhì)(例如,盤)。例如,本發(fā)明的系統(tǒng)可以是或者包括可編程的通用處理器、數(shù)字信號(hào)處理器或微處理器,被用軟件或固件編程和/或以其它方式被配置為對(duì)數(shù)據(jù)執(zhí)行各種操作中的任何操作,包括本發(fā)明的方法或步驟的實(shí)施例。這種通用處理器可以是或者包括含有以下的計(jì)算機(jī)系統(tǒng):輸入設(shè)備、存儲(chǔ)器和被編程為(和/或以其它方式被配置為)響應(yīng)于對(duì)其斷言的數(shù)據(jù)來執(zhí)行本發(fā)明的方法(或其步驟)的實(shí)施例的處理電路。附圖說明圖1是AC-3幀的圖,包括被分成的片段。圖2是AC-3幀的同步信息(SI)片段的圖,包括被分成的片段。圖3是AC-3幀的比特流信息(BSI)片段的圖,包括被分成的片段。圖4是E-AC-3幀的圖,包括被分成的片段。圖5是一種系統(tǒng)的實(shí)施例的圖,其中該系統(tǒng)的一個(gè)或更多個(gè)元件可以根據(jù)本發(fā)明的實(shí)施例來配置。圖6是可被實(shí)現(xiàn)為執(zhí)行本發(fā)明的方法實(shí)施例的回放系統(tǒng)的框圖。圖7是可被配置為執(zhí)行本發(fā)明的方法實(shí)施例的回放系統(tǒng)的框圖。圖8是被配置為根據(jù)本發(fā)明的實(shí)施例來生成基于對(duì)象的音頻節(jié)目(和相應(yīng)的視頻節(jié)目)的廣播系統(tǒng)的框圖。圖9是本發(fā)明的節(jié)目的實(shí)施例的對(duì)象聲道之間的關(guān)系圖,指示對(duì)象聲道的哪些子集可被用戶選擇。圖10是可被實(shí)現(xiàn)為執(zhí)行本發(fā)明的方法實(shí)施例的系統(tǒng)的框圖。圖11是根據(jù)本發(fā)明的實(shí)施例而生成的基于對(duì)象的音頻節(jié)目的內(nèi)容的圖。符號(hào)和命名貫穿本公開內(nèi)容,包括在權(quán)利要求中,“對(duì)”信號(hào)或數(shù)據(jù)執(zhí)行操作(例如,對(duì)信號(hào)或數(shù)據(jù)進(jìn)行過濾、縮放、變換或施加增益)的表述廣義地用來表示直接對(duì)信號(hào)或數(shù)據(jù)或者對(duì)信號(hào)或數(shù)據(jù)的處理版本(例如,對(duì)在執(zhí)行操作之前經(jīng)歷了初步過濾或預(yù)處理的信號(hào)版本)執(zhí)行操作。貫穿本公開內(nèi)容,包括在權(quán)利要求中,表述“系統(tǒng)”廣義地用來表示設(shè)備、系統(tǒng)或子系統(tǒng)。例如,實(shí)現(xiàn)解碼器的子系統(tǒng)可以被稱為解碼器系統(tǒng),而包括這種子系統(tǒng)的系統(tǒng)(例如,響應(yīng)于多個(gè)輸入來生成X個(gè)輸出信號(hào)的系統(tǒng),其中子系統(tǒng)生成其中M個(gè)輸入而其它X-M個(gè)輸入從外部源中接收)也可以被稱為解碼器系統(tǒng)。貫穿本公開內(nèi)容,包括在權(quán)利要求中,術(shù)語“處理器”廣義地用來表示可編程為或者(例如,用軟件或固件)以其它方式被配置為對(duì)數(shù)據(jù)(例如,音頻或視頻或其它圖像數(shù)據(jù))執(zhí)行操作的系統(tǒng)或設(shè)備。處理器的示例包括現(xiàn)場(chǎng)可編程門陣列(或者其它可配置的集成電路或芯片集)、被編程為或者以其它方式被配置為對(duì)音頻或其它聲音數(shù)據(jù)執(zhí)行流水線處理的數(shù)字信號(hào)處理器、可編程的通用處理器或計(jì)算機(jī)、以及可編程的微處理器芯片或芯片集。貫穿本公開內(nèi)容,包括在權(quán)利要求中,表述“音頻視頻接收器”(或者“AVR”)表示用來控制音頻和視頻內(nèi)容的回放的一類消費(fèi)者電子器材中的接收器,例如在家庭影院中。貫穿本公開內(nèi)容,包括在權(quán)利要求中,表述“條形音箱”表示如下設(shè)備:該設(shè)備是一種類型的消費(fèi)者電子器材(典型地安裝在家庭影院系統(tǒng)中),并且包括至少一個(gè)揚(yáng)聲器(典型地,至少兩個(gè)揚(yáng)聲器)和用于渲染音頻以便由每個(gè)內(nèi)含揚(yáng)聲器回放(或者以便由每個(gè)內(nèi)含揚(yáng)聲器和該條形音箱外部的至少一個(gè)附加揚(yáng)聲器回放)的子系統(tǒng)。貫穿本公開內(nèi)容,包括在權(quán)利要求中,表述“音頻處理器”和“音頻處理單元”可交換使用,并且廣義地用來表示被配置為對(duì)音頻數(shù)據(jù)進(jìn)行處理的系統(tǒng)。音頻處理單元的示例包括但不限于編碼器(例如,轉(zhuǎn)碼器)、解碼器、編解碼器、預(yù)處理系統(tǒng)、后處理系統(tǒng)、以及比特流處理系統(tǒng)(有時(shí)被稱為比特流處理工具)。貫穿本公開內(nèi)容,包括在權(quán)利要求中,表述“元數(shù)據(jù)”(例如,就像在表述“處理狀態(tài)元數(shù)據(jù)”中)指的是與相應(yīng)音頻數(shù)據(jù)(也包括元數(shù)據(jù)的比特流的音頻內(nèi)容)分離且不同的數(shù)據(jù)。元數(shù)據(jù)與音頻數(shù)據(jù)關(guān)聯(lián),并且指示音頻數(shù)據(jù)的至少一個(gè)特征或特性(例如,對(duì)音頻數(shù)據(jù)已經(jīng)執(zhí)行或應(yīng)該執(zhí)行什么類型的處理,或者由音頻數(shù)據(jù)指示的對(duì)象的軌跡)。元數(shù)據(jù)與音頻數(shù)據(jù)的關(guān)聯(lián)是時(shí)間同步的。因此,當(dāng)前的(最近接收或更新的)元數(shù)據(jù)可以指示:相應(yīng)的音頻數(shù)據(jù)同時(shí)具有所指示的特征和/或包括所指示類型的音頻數(shù)據(jù)處理的結(jié)果。貫穿本公開內(nèi)容,包括在權(quán)利要求中,術(shù)語“耦接”或“被耦接”用來指直接或間接連接。因此,如果第一設(shè)備耦接到第二設(shè)備,則連接可以是通過直接連接,或者通過經(jīng)由其它設(shè)備和連接的間接連接。貫穿本公開內(nèi)容,包括在權(quán)利要求中,以下表述具有以下定義:揚(yáng)聲器和揚(yáng)聲器同義地用來表示任何發(fā)聲換能器。這個(gè)定義包括被實(shí)現(xiàn)為多個(gè)換能器的揚(yáng)聲器(例如,低音喇叭和高音喇叭);揚(yáng)聲器饋送:要直接施加給揚(yáng)聲器的音頻信號(hào),或者要施加給串聯(lián)的放大器和揚(yáng)聲器的音頻信號(hào);聲道(或“音頻聲道”):單聲道音頻信號(hào)。這種信號(hào)可以典型地以這種方式渲染:使得相當(dāng)于直接對(duì)期望的或標(biāo)稱的位置處的揚(yáng)聲器施加信號(hào)。期望的位置可以是靜止的,就像典型地具有物理揚(yáng)聲器的情況,或者可以是動(dòng)態(tài)的;音頻節(jié)目:一個(gè)或更多個(gè)音頻聲道的集合(至少一個(gè)揚(yáng)聲器聲道和/或至少一個(gè)對(duì)象聲道)并且可選地還有關(guān)聯(lián)的元數(shù)據(jù)(例如,描述期望的空間音頻呈現(xiàn)的元數(shù)據(jù));揚(yáng)聲器聲道(或者“揚(yáng)聲器饋送聲道”):與(在期望或標(biāo)稱位置的)指定揚(yáng)聲器或者與既定揚(yáng)聲器配置內(nèi)的指定揚(yáng)聲器區(qū)關(guān)聯(lián)的音頻聲道。揚(yáng)聲器聲道以這種方式渲染:使得相當(dāng)于直接對(duì)(在期望或標(biāo)稱位置的)指定揚(yáng)聲器或揚(yáng)聲器區(qū)中的揚(yáng)聲器施加音頻信號(hào)。對(duì)象聲道:指示由音頻源(有時(shí)被稱為音頻“對(duì)象”)發(fā)出的聲音的音頻聲道。典型地,對(duì)象聲道確定參數(shù)化音頻源描述(例如,指示參數(shù)化音頻源描述的元數(shù)據(jù)被包括在對(duì)象聲道中或者與對(duì)象聲道一起提供)。源描述可以確定由源發(fā)出的聲音(作為時(shí)間的函數(shù))、作為時(shí)間的函數(shù)的明顯源位置(例如,3D空間坐標(biāo))、可選地還有表征源的至少一個(gè)附加參數(shù)(例如,明顯源尺寸或?qū)挾?;基于對(duì)象的音頻節(jié)目:包括一個(gè)或更多個(gè)對(duì)象聲道的集合(并且可選地還包括至少一個(gè)揚(yáng)聲器聲道)以及可選地還有關(guān)聯(lián)的元數(shù)據(jù)(例如,指示發(fā)出由對(duì)象聲道指示的聲音的音頻對(duì)象的軌跡的元數(shù)據(jù),或者以其它方式指示由對(duì)象聲道指示的聲音的期望空間音頻呈現(xiàn)的元數(shù)據(jù),或者指示作為由對(duì)象聲道指示的聲音的源的至少一個(gè)音頻對(duì)象的標(biāo)識(shí)的元數(shù)據(jù))的音頻節(jié)目;及渲染:將音頻節(jié)目轉(zhuǎn)換成一個(gè)或更多個(gè)揚(yáng)聲器饋送的過程,或者將音頻節(jié)目轉(zhuǎn)換成一個(gè)或更多個(gè)揚(yáng)聲器饋送并且使用一個(gè)或更多個(gè)揚(yáng)聲器來將揚(yáng)聲器饋送轉(zhuǎn)換成聲音的過程(在后一種情況下,渲染有時(shí)候在本文被稱為“由”揚(yáng)聲器渲染)??梢酝ㄟ^直接向期望位置處的物理揚(yáng)聲器施加信號(hào)來(在期望的位置“處”)平常地渲染音頻聲道,或者可以使用被設(shè)計(jì)為基本上等效于(對(duì)聽眾而言)這種平常渲染的各種虛擬化技術(shù)之一來渲染一個(gè)或更多個(gè)音頻聲道。在后一種情況下,每個(gè)音頻聲道可以被轉(zhuǎn)換為要施加給位于已知位置的揚(yáng)聲器的一個(gè)或更多個(gè)揚(yáng)聲器饋送,所述已知位置一般與期望的位置不同,使得由揚(yáng)聲器響應(yīng)于饋送而發(fā)出的聲音將被感知為是從期望位置發(fā)出的。這種虛擬化技術(shù)的示例包括經(jīng)由頭戴式耳機(jī)的雙耳渲染(例如,使用杜比頭戴式耳機(jī)的處理,這種處理為頭戴式耳機(jī)佩戴者模擬高達(dá)7.1聲道的環(huán)繞聲)和波場(chǎng)合成。具體實(shí)施方式圖5是音頻處理鏈(音頻數(shù)據(jù)處理系統(tǒng))的示例的框圖,其中該系統(tǒng)的一個(gè)或更多個(gè)元件可以根據(jù)本發(fā)明的實(shí)施例來配置。該系統(tǒng)包括如圖所示耦接到一起的以下元件:捕捉單元1、制作單元3(包括編碼子系統(tǒng))、傳送子系統(tǒng)5、解碼器7、對(duì)象處理子系統(tǒng)9、控制器10、以及渲染子系統(tǒng)11。在所示系統(tǒng)的變型中,省略其中的一個(gè)或更多個(gè)元件,或者包括額外的音頻數(shù)據(jù)處理單元。典型地,元件7、9、10和11是回放系統(tǒng)(例如,終端用戶的家庭影院系統(tǒng))或者被包括在回放系統(tǒng)中。捕捉單元1典型地被配置為生成包括音頻內(nèi)容的PCM(時(shí)域)樣本,并且輸出PCM樣本。樣本可以指示由麥克風(fēng)(例如,在體育賽事或者其它觀賞型賽事)捕捉的多個(gè)音頻流。典型地由廣播公司操作的制作單元3被配置為接受PCM樣本作為輸入并且輸出指示音頻內(nèi)容的基于對(duì)象的音頻節(jié)目。節(jié)目通常是或者包括指示至少一些音頻內(nèi)容的經(jīng)編碼的(例如,經(jīng)壓縮的)音頻比特流(有時(shí)在本文中被稱為“主混合”),并且可選地還包括指示一些音頻內(nèi)容的至少一個(gè)附加比特流或文件(有時(shí)在本文中被稱為“次混合”)。指示音頻內(nèi)容的編碼比特流(以及,如果生成了的話,則還有每個(gè)生成的次混合)的數(shù)據(jù)在本文中有時(shí)被稱為“音頻數(shù)據(jù)”。如果制作單元3的編碼子系統(tǒng)是根據(jù)本發(fā)明的典型實(shí)施例配置的,則從單元3輸出的基于對(duì)象的音頻節(jié)目指示(即,包括)音頻數(shù)據(jù)的多個(gè)揚(yáng)聲器聲道(一“床”揚(yáng)聲器聲道,以及可選地還有替換揚(yáng)聲器聲道)、音頻數(shù)據(jù)的多個(gè)對(duì)象聲道、以及對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))。節(jié)目可以包括主混合,主混合又包括指示一床揚(yáng)聲器聲道和替換揚(yáng)聲器聲道的音頻內(nèi)容、指示至少一個(gè)用戶可選的對(duì)象聲道(以及可選地還有至少一個(gè)其它對(duì)象聲道)的音頻內(nèi)容、以及元數(shù)據(jù)(包括與每個(gè)對(duì)象聲道關(guān)聯(lián)的對(duì)象相關(guān)元數(shù)據(jù),對(duì)象相關(guān)元數(shù)據(jù)又包括用于至少一個(gè)對(duì)象聲道的條件渲染元數(shù)據(jù))。節(jié)目還可以包括至少一個(gè)次混合,次混合包括指示至少一個(gè)其它對(duì)象聲道(例如,至少一個(gè)用戶可選的對(duì)象聲道)的音頻內(nèi)容和/或?qū)ο笙嚓P(guān)元數(shù)據(jù)。節(jié)目的對(duì)象相關(guān)元數(shù)據(jù)可以包括持久性元數(shù)據(jù)(下面將描述)。節(jié)目(例如,其主混合)可以指示一組或更多組揚(yáng)聲器聲道。例如,主混合可以指示兩組或更多組揚(yáng)聲器聲道(例如,5.1聲道的中立人群噪聲床、指示主隊(duì)人群噪聲的一組2.0聲道的替換揚(yáng)聲器聲道、以及指示客隊(duì)人群噪聲的一組2.0聲道的替換揚(yáng)聲器聲道),包括至少一組用戶可選的替換揚(yáng)聲器聲道(其可以使用用于對(duì)對(duì)象聲道內(nèi)容或配置進(jìn)行用戶選擇的同一用戶界面來選擇)和一床揚(yáng)聲器聲道(這將在不存在對(duì)節(jié)目的其他內(nèi)容的用戶選擇時(shí)被渲染)。所述床(可被稱為默認(rèn)床)可以由指示回放系統(tǒng)的揚(yáng)聲器組的配置(例如,初始配置)的數(shù)據(jù)確定,并且可選地,用戶可以選擇節(jié)目的其他音頻內(nèi)容代替默認(rèn)床來渲染。節(jié)目的元數(shù)據(jù)可以指示節(jié)目的對(duì)象聲道中的至少一個(gè)對(duì)象聲道的內(nèi)容和所述床中的預(yù)定揚(yáng)聲器聲道和/或替代揚(yáng)聲器聲道的內(nèi)容的至少一個(gè)(并且典型地多于一個(gè))可選預(yù)定混合,并且可以包括用于每個(gè)所述混合的渲染參數(shù)。圖5的傳送子系統(tǒng)5被配置為存儲(chǔ)和/或發(fā)送(例如,廣播)由單元3生成的節(jié)目(例如,主混合及其每個(gè)次混合,如果有任何次混合生成的話)。在一些實(shí)施例中,子系統(tǒng)5實(shí)現(xiàn)基于對(duì)象的音頻節(jié)目的傳送,其中節(jié)目的揚(yáng)聲器聲道和音頻對(duì)象(以及至少一些相應(yīng)的對(duì)象相關(guān)元數(shù)據(jù))通過廣播系統(tǒng)發(fā)送(在節(jié)目的主混合中,由所廣播的音頻比特流指示),而節(jié)目的至少一些元數(shù)據(jù)(例如,指示對(duì)節(jié)目的對(duì)象聲道的渲染或混合的約束的對(duì)象相關(guān)元數(shù)據(jù))和/或節(jié)目的至少一個(gè)對(duì)象聲道以另一種方式(例如,次混合通過因特網(wǎng)協(xié)議或“IP”網(wǎng)絡(luò)被發(fā)送到特定的終端用戶)被傳送(作為主混合的“次混合”)。作為替代,終端用戶的解碼和/或渲染系統(tǒng)被用至少一些對(duì)象相關(guān)元數(shù)據(jù)(例如,指示對(duì)本發(fā)明的基于對(duì)象的音頻節(jié)目的實(shí)施例的音頻對(duì)象的渲染或混合的約束的元數(shù)據(jù))來預(yù)配置,并且這種對(duì)象相關(guān)元數(shù)據(jù)不(由子系統(tǒng)5)利用相應(yīng)的對(duì)象聲道(在基于對(duì)象的音頻節(jié)目的主混合中或者在次混合中)來廣播或以其它方式傳送。在一些實(shí)施例中,通過單獨(dú)路徑傳送的基于對(duì)象的音頻節(jié)目的部分或元素(例如,通過廣播系統(tǒng)廣播的主混合,以及作為次混合通過IP網(wǎng)絡(luò)發(fā)送的相關(guān)元數(shù)據(jù))的定時(shí)和同步由通過所有傳送路徑(例如,在主混合和每個(gè)相應(yīng)的次混合中)發(fā)送的同步字(例如,時(shí)間碼)提供。再次參照?qǐng)D5,解碼器7接受(接收或讀取)由傳送子系統(tǒng)5傳送的節(jié)目(或者節(jié)目的至少一個(gè)比特流或其它元素),并且解碼該節(jié)目(或者該節(jié)目的每個(gè)被接受的元素)。在本發(fā)明的一些實(shí)施例中,節(jié)目包括主混合(編碼比特流,例如,AC-3或E-AC-3編碼比特流)和主混合的至少一個(gè)次混合,并且解碼器7接收并解碼主混合(以及可選地還有至少一個(gè)次混合)??蛇x地,該節(jié)目中的不需要被解碼的至少一個(gè)次混合(例如,對(duì)象聲道)由子系統(tǒng)5直接傳送到對(duì)象處理子系統(tǒng)9。如果解碼器7是根據(jù)本發(fā)明的典型實(shí)施例配置的,則在典型的操作中解碼器7的輸出包括以下:指示節(jié)目的揚(yáng)聲器聲道床(以及典型地還有節(jié)目的替換揚(yáng)聲器聲道)的音頻樣本流;及指示節(jié)目的對(duì)象聲道(例如,用戶可選的音頻對(duì)象聲道)的音頻樣本流和對(duì)應(yīng)的對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))流。對(duì)象處理子系統(tǒng)9被耦接為(從解碼器7)接收所傳送節(jié)目的經(jīng)解碼的揚(yáng)聲器聲道、對(duì)象聲道和對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù)),并且可選地還有節(jié)目的至少一個(gè)次混合(指示至少一個(gè)其它對(duì)象聲道)。例如,子系統(tǒng)9可以(從解碼器7)接收節(jié)目的揚(yáng)聲器聲道的音頻樣本和節(jié)目的至少一個(gè)對(duì)象聲道的音頻樣本以及節(jié)目的對(duì)象相關(guān)元數(shù)據(jù),并且還可以(從傳送子系統(tǒng)5)接收節(jié)目的至少一個(gè)其它對(duì)象聲道的音頻樣本(尚未在解碼器7中經(jīng)歷解碼)。子系統(tǒng)9被耦接和配置為向渲染子系統(tǒng)11輸出由節(jié)目指示的整組對(duì)象聲道的選定子集、以及對(duì)應(yīng)的對(duì)象相關(guān)元數(shù)據(jù)。對(duì)象聲道的選定子集可以至少部分地由節(jié)目的條件渲染元數(shù)據(jù)確定。子系統(tǒng)9典型地還被配置為不作改變地(向子系統(tǒng)11)傳遞來自解碼器7的經(jīng)解碼的揚(yáng)聲器聲道,并且可以被配置為處理對(duì)其斷言的對(duì)象聲道(和/或元數(shù)據(jù))中的至少一些,以生成它向子系統(tǒng)11斷言的對(duì)象聲道和元數(shù)據(jù)。由子系統(tǒng)9執(zhí)行的對(duì)象聲道選擇典型地是通過(如由從控制器10向子系統(tǒng)9斷言的控制數(shù)據(jù)指示的)用戶選擇和/或子系統(tǒng)9已經(jīng)被編程或以其它方式被配置(例如,響應(yīng)于條件渲染元數(shù)據(jù))而實(shí)現(xiàn)的規(guī)則(例如,指示由節(jié)目的條件渲染元數(shù)據(jù)確定的條件和/或下混約束或其他渲染約束)確定的。這種規(guī)則可以由節(jié)目的條件渲染元數(shù)據(jù)和/或其他對(duì)象相關(guān)元數(shù)據(jù)和/或由(例如,從控制器10或另一外部源)向子系統(tǒng)9斷言的其它數(shù)據(jù)(例如,指示回放系統(tǒng)的揚(yáng)聲器陣列的能力和配置的數(shù)據(jù))和/或通過預(yù)配置(例如,編程)子系統(tǒng)9來確定。在一些實(shí)施例中,控制器10(經(jīng)由控制器10實(shí)現(xiàn)的用戶界面)向用戶提供(例如,在觸摸屏上顯示)揚(yáng)聲器聲道內(nèi)容(即,床揚(yáng)聲器聲道和/或替換揚(yáng)聲器聲道的內(nèi)容)與對(duì)象聲道內(nèi)容(對(duì)象)的可選“預(yù)設(shè)”混合的菜單或選項(xiàng)板。所述可選預(yù)設(shè)混合可以由節(jié)目的對(duì)象相關(guān)元數(shù)據(jù)并且通常還由子系統(tǒng)9實(shí)現(xiàn)的規(guī)則(例如,由節(jié)目的條件渲染元數(shù)據(jù)確定的規(guī)則和/或子系統(tǒng)9已被預(yù)配置而實(shí)現(xiàn)的規(guī)則)確定。用戶通過向控制器10輸入命令(例如,通過致動(dòng)其觸摸屏)來從可選的混合中進(jìn)行選擇,并且作為響應(yīng),控制器10向子系統(tǒng)9斷言對(duì)應(yīng)的控制數(shù)據(jù),以使得根據(jù)本發(fā)明對(duì)相應(yīng)內(nèi)容進(jìn)行渲染。圖5的渲染子系統(tǒng)11被配置為渲染由子系統(tǒng)9的輸出確定的音頻內(nèi)容,以便由回放系統(tǒng)的回放揚(yáng)聲器陣列13回放。子系統(tǒng)11已知曉(例如,被提供指示陣列13的回放揚(yáng)聲器陣列配置的數(shù)據(jù))陣列13的回放揚(yáng)聲器陣列配置(例如,在回放環(huán)境中,陣列13的揚(yáng)聲器數(shù)量、陣列13中的每個(gè)揚(yáng)聲器的類型(例如,全范圍或者重低音)、以及陣列13中的每個(gè)揚(yáng)聲器的標(biāo)稱或假設(shè)位置(例如,在地板平面或者聽者耳朵的假設(shè)位置的平面內(nèi)或上方))。子系統(tǒng)11被配置為:利用從子系統(tǒng)9輸出的、與每個(gè)選定對(duì)象關(guān)聯(lián)的渲染參數(shù)(例如,用戶選擇的和/或默認(rèn)的空間位置值和水平值),把由對(duì)象處理子系統(tǒng)9選擇的對(duì)象聲道確定的音頻對(duì)象(例如,默認(rèn)對(duì)象,和/或作為用戶使用控制器10進(jìn)行交互的結(jié)果而被選擇的用戶選定對(duì)象)映射到可用的揚(yáng)聲器聲道。至少一些渲染參數(shù)是由從子系統(tǒng)9輸出的對(duì)象相關(guān)元數(shù)據(jù)確定的。渲染子系統(tǒng)11還接收通過子系統(tǒng)9傳遞的揚(yáng)聲器聲道。典型地,子系統(tǒng)11是智能混合器,并且被配置為確定用于陣列13中的可用揚(yáng)聲器的揚(yáng)聲器饋送,包括通過把一個(gè)或更多個(gè)選定的(例如,默認(rèn)選擇的)對(duì)象映射到多個(gè)單獨(dú)的揚(yáng)聲器聲道中的每一個(gè),并且使對(duì)象與由節(jié)目的每個(gè)相應(yīng)揚(yáng)聲器聲道(例如,節(jié)目的揚(yáng)聲器聲道床中的每個(gè)揚(yáng)聲器聲道)指示的揚(yáng)聲器聲道內(nèi)容混合。典型地,子系統(tǒng)11被配置為對(duì)從子系統(tǒng)9斷言的音頻聲道(例如,揚(yáng)聲器聲道和至少一個(gè)對(duì)象聲道)的下混(包括一組N個(gè)下混揚(yáng)聲器聲道,其中N為正整數(shù))進(jìn)行渲染,根據(jù)下混揚(yáng)聲器聲道生成N個(gè)揚(yáng)聲器饋送,并通過用揚(yáng)聲器饋送驅(qū)動(dòng)揚(yáng)聲器來使回放揚(yáng)聲器陣列13的N個(gè)揚(yáng)聲器發(fā)出聲音,其中所述下混符合由其內(nèi)容被渲染的節(jié)目的條件渲染元數(shù)據(jù)指示的至少一個(gè)(例如,每個(gè))下混約束。根據(jù)本發(fā)明的典型實(shí)施例(例如,通過圖5中的單元3)生成的基于對(duì)象的音頻節(jié)目可以(例如,通過圖5中的回放子系統(tǒng),或圖6的系統(tǒng))被渲染為使得指示由回放揚(yáng)聲器陣列播放的節(jié)目的(例如,對(duì)象聲道和/或揚(yáng)聲器聲道的)下混內(nèi)容的聲音被感知為從聲音再現(xiàn)(回放)環(huán)境內(nèi)的不同明顯源位置發(fā)出。對(duì)于互動(dòng)式呈現(xiàn),由可選對(duì)象聲道中的選定對(duì)象聲道確定的對(duì)象在渲染聲場(chǎng)內(nèi)的位置(例如,與一組選定對(duì)象中的不同選定對(duì)象對(duì)應(yīng)的一組不同的靜態(tài)位置)被渲染,使得每個(gè)選定對(duì)象聲道的音頻內(nèi)容被渲染成被感知為從由與選定對(duì)象聲道對(duì)應(yīng)的對(duì)象相關(guān)元數(shù)據(jù)確定的明顯源位置(或位置的軌跡)發(fā)出。例如,根據(jù)基于對(duì)象的音頻節(jié)目確定的沉浸式聲音混合可以指示這樣的聲音:該聲音又指示(由節(jié)目的選定對(duì)象聲道確定的)“公共廣播”音頻對(duì)象,從而被感知為從再現(xiàn)環(huán)境內(nèi)的假設(shè)聽者位置上方的明顯源位置發(fā)出,以便在從安裝在聽者上方的公共廣播揚(yáng)聲器發(fā)出通告時(shí)給予聽者(消費(fèi)者)正身處體育場(chǎng)的體驗(yàn)??梢赃x擇這種公共廣播音頻對(duì)象,以便由揚(yáng)聲器陣列渲染和回放,所述揚(yáng)聲器陣列包括物理地位于“地板”平面上方的水平面(有時(shí)候被稱為“地板上方”或“高度”平面)內(nèi)的至少一個(gè)地板上方揚(yáng)聲器,其中“地板”平面是標(biāo)稱地包括聽者耳朵的預(yù)期位置的水平面。典型地,回放揚(yáng)聲器陣列的其他揚(yáng)聲器標(biāo)稱地位于地板平面內(nèi)。當(dāng)音頻對(duì)象(例如,之前示例中的公共廣播音頻對(duì)象)由基于對(duì)象的音頻節(jié)目的分離的對(duì)象聲道確定,并且在該對(duì)象聲道被選擇(并且被渲染和播放)時(shí)節(jié)目的相應(yīng)元數(shù)據(jù)指示相應(yīng)聲音應(yīng)該被感知為從其發(fā)出的地板上方源位置(或地板上方源位置的軌跡)時(shí),我們將該音頻對(duì)象稱為“地板上方”(或“高度”)對(duì)象,并且將指示該地板上方對(duì)象的對(duì)象聲道稱為“地板上方”(或“高度”)對(duì)象聲道。地板上方音頻對(duì)象被典型地渲染和播放為使得所得到的聲音從回放系統(tǒng)揚(yáng)聲器陣列的至少一個(gè)地板上方(或“高度”)揚(yáng)聲器發(fā)出。如果在回放系統(tǒng)揚(yáng)聲器陣列中不存在地板上方(或“高度”)揚(yáng)聲器,則可以利用(上述類型的)傳統(tǒng)下混技術(shù)來下混節(jié)目的選定的“地板上方”對(duì)象聲道的內(nèi)容與揚(yáng)聲器聲道的內(nèi)容(其中揚(yáng)聲器聲道內(nèi)容打算由回放揚(yáng)聲器陣列的地板揚(yáng)聲器播放),使得所得到的下混聲音僅從回放揚(yáng)聲器陣列的地板揚(yáng)聲器發(fā)出。但是,因?yàn)榈匕迳戏綄?duì)象聲道內(nèi)容會(huì)被下混到揚(yáng)聲器聲道的內(nèi)容中,所以所述下混會(huì)不合需要地導(dǎo)致發(fā)聲嘈雜的混合(例如,其中地板上方的內(nèi)容會(huì)被感知為受到原始揚(yáng)聲器聲道內(nèi)容的干擾)。在一類實(shí)施例中,基于對(duì)象的音頻節(jié)目(例如,由圖3中的單元3生成的基于對(duì)象的節(jié)目)包括與該節(jié)目的至少一個(gè)對(duì)象聲道(例如,地板上方對(duì)象聲道)對(duì)應(yīng)的條件渲染元數(shù)據(jù)。因此,由每個(gè)這種對(duì)象聲道指示的每個(gè)音頻對(duì)象具有相應(yīng)的條件渲染元數(shù)據(jù)。例如,在一些實(shí)施例中,具有相應(yīng)條件渲染元數(shù)據(jù)的音頻對(duì)象可以是地板上方對(duì)象。條件渲染元數(shù)據(jù)是指示適用于每個(gè)相應(yīng)對(duì)象聲道(即,與條件渲染元數(shù)據(jù)對(duì)應(yīng)的每個(gè)對(duì)象聲道)的基于回放揚(yáng)聲器陣列配置的至少一個(gè)渲染約束(例如,至少一個(gè)下混約束)的對(duì)象相關(guān)元數(shù)據(jù)。這種下混約束的示例是:當(dāng)回放揚(yáng)聲器陣列配置為特定類型時(shí),禁止下混相應(yīng)的對(duì)象聲道。(已知曉其回放揚(yáng)聲器陣列為此特定類型的)回放系統(tǒng)可以被配置(例如,被預(yù)配置,或者響應(yīng)于節(jié)目的元數(shù)據(jù)而被配置)為通過防止實(shí)現(xiàn)節(jié)目的對(duì)象聲道到揚(yáng)聲器聲道的任何下混來響應(yīng)于條件渲染元數(shù)據(jù)進(jìn)行操作。這種下混約束的另一個(gè)示例是當(dāng)回放揚(yáng)聲器陣列配置為特定類型時(shí)對(duì)包括相應(yīng)對(duì)象聲道的至少一個(gè)允許下混(或下混類型)的指示。在第三示例中,條件渲染元數(shù)據(jù)可以指示:相應(yīng)對(duì)象聲道為第一類型(例如,對(duì)象聲道指示地板上方對(duì)象),并且當(dāng)回放揚(yáng)聲器陣列配置為第二類型(例如,當(dāng)該陣列不包括地板上方揚(yáng)聲器)時(shí),該節(jié)目的第一類型的對(duì)象聲道不被下混成打算用于驅(qū)動(dòng)回放揚(yáng)聲器陣列的任何揚(yáng)聲器的揚(yáng)聲器聲道。假設(shè)該節(jié)目包括此類型的條件元數(shù)據(jù),則已知曉其回放揚(yáng)聲器陣列為第二類型的回放系統(tǒng)(例如,圖6的系統(tǒng)或圖5的回放系統(tǒng))可以被配置(例如,被預(yù)配置,或者響應(yīng)于該節(jié)目的元數(shù)據(jù)而被配置)為通過認(rèn)識(shí)到對(duì)象聲道為第一類型并且防止實(shí)現(xiàn)對(duì)象聲道到(由用戶選擇的節(jié)目內(nèi)容混合指定的)打算用于驅(qū)動(dòng)回放揚(yáng)聲器陣列的任何揚(yáng)聲器的揚(yáng)聲器聲道的任何下混來響應(yīng)于條件渲染元數(shù)據(jù)進(jìn)行操作。在這種情況中,回放系統(tǒng)可以被配置為還通知(例如,通過在圖5的控制器10或圖6的控制器23的顯示屏上顯示通知)用戶所選擇的混合不可用。另外假設(shè)節(jié)目包括此類型的條件渲染元數(shù)據(jù),(已知曉其回放揚(yáng)聲器陣列不是第二類型的)回放系統(tǒng)可以被配置為通過認(rèn)識(shí)到對(duì)象聲道為第一類型并且實(shí)現(xiàn)對(duì)象聲道到(由對(duì)節(jié)目內(nèi)容的用戶選擇的混合或默認(rèn)混合指定的)打算用于驅(qū)動(dòng)回放揚(yáng)聲器陣列的揚(yáng)聲器的揚(yáng)聲器聲道的下混來響應(yīng)于條件渲染元數(shù)據(jù)進(jìn)行操作??蛇x地,基于對(duì)象的音頻節(jié)目中所包括的條件渲染元數(shù)據(jù)還指示用于對(duì)該節(jié)目的音頻聲道進(jìn)行渲染(例如,實(shí)現(xiàn)其下混)的基于回放揚(yáng)聲器陣列配置的至少一個(gè)渲染規(guī)則(例如,至少一個(gè)下混規(guī)則)。例如,條件渲染元數(shù)據(jù)可以指示下面的下混規(guī)則:如果回放揚(yáng)聲器陣列至少包括一個(gè)地板上方揚(yáng)聲器,則節(jié)目的第一類型(例如,由節(jié)目的至少一些條件渲染元數(shù)據(jù)指示)的每個(gè)對(duì)象聲道應(yīng)該被下混到由用戶選擇的(或默認(rèn)的)任何節(jié)目內(nèi)容混合所指定的任何揚(yáng)聲器聲道中,如果回放揚(yáng)聲器陣列不包括至少一個(gè)地板上方揚(yáng)聲器,則節(jié)目的第一類型的每個(gè)對(duì)象聲道應(yīng)該被回放系統(tǒng)忽略(即,不應(yīng)該被包括任何下混中),以及不管回放揚(yáng)聲器陣列的配置如何,節(jié)目的第二類型(例如,由節(jié)目的至少一些條件渲染元數(shù)據(jù)指示)的每個(gè)對(duì)象聲道應(yīng)該被下混到由用戶選擇的(或默認(rèn)的)任何節(jié)目聲道內(nèi)容混合所指定的任何揚(yáng)聲器聲道中。在一類實(shí)施例中,本發(fā)明是用于生成由揚(yáng)聲器陣列(例如,圖5的回放揚(yáng)聲器陣列13)回放的基于對(duì)象的音頻節(jié)目的方法,該方法包括以下步驟:(例如,在圖5的單元3中)生成與至少一個(gè)對(duì)象聲道對(duì)應(yīng)的條件渲染元數(shù)據(jù),使得條件渲染元數(shù)據(jù)指示適用于所述至少一個(gè)對(duì)象聲道的基于回放揚(yáng)聲器陣列配置(例如,回放揚(yáng)聲器陣列13的配置)的至少一個(gè)渲染約束(例如,至少一個(gè)下混約束);(例如,在圖5的單元3中)確定包括所述至少一個(gè)對(duì)象聲道(以及可選地還有至少一個(gè)揚(yáng)聲器聲道)的一組音頻聲道;以及(例如,在圖5的單元3中)生成基于對(duì)象的音頻節(jié)目,使得所述基于對(duì)象的音頻節(jié)目指示所述一組音頻聲道和條件渲染元數(shù)據(jù),并且使得所述一組音頻聲道中的至少一個(gè)音頻聲道的內(nèi)容能夠響應(yīng)于條件渲染元數(shù)據(jù)中的至少一些來由回放系統(tǒng)以符合所述至少一個(gè)渲染約束的方式渲染。由條件渲染元數(shù)據(jù)指示的下混約束的示例是當(dāng)回放揚(yáng)聲器陣列配置為特定類型時(shí)禁止下混相應(yīng)對(duì)象聲道。由條件渲染元數(shù)據(jù)指示的渲染約束(其為下混約束)的另一個(gè)示例是當(dāng)回放揚(yáng)聲器陣列配置為特定類型時(shí)對(duì)包括相應(yīng)對(duì)象聲道的至少一個(gè)允許下混(或下混類型)的指示??蛇x地,條件渲染元數(shù)據(jù)還指示用于實(shí)現(xiàn)對(duì)節(jié)目的音頻聲道的下混的、基于回放揚(yáng)聲器陣列配置的至少一個(gè)下混規(guī)則。在其他實(shí)施例中,本發(fā)明是渲染由基于對(duì)象的音頻節(jié)目確定的音頻內(nèi)容的方法,其中所述節(jié)目指示與至少一個(gè)對(duì)象聲道對(duì)應(yīng)的條件渲染元數(shù)據(jù)以及包括所述至少一個(gè)對(duì)象聲道(以及可選地還有至少一個(gè)揚(yáng)聲器聲道)的一組音頻聲道,并且其中條件渲染元數(shù)據(jù)指示適用于所述至少一個(gè)對(duì)象聲道的基于回放揚(yáng)聲器陣列配置的至少一個(gè)渲染約束(例如,至少一個(gè)下混約束),該方法包括以下步驟:(a)將基于對(duì)象的音頻節(jié)目提供給音頻處理單元(例如,實(shí)現(xiàn)圖5的回放子系統(tǒng)的音頻處理單元,其包括解碼器7、對(duì)象處理子系統(tǒng)9、控制器10和渲染子系統(tǒng)11;或者實(shí)現(xiàn)圖6的回放系統(tǒng)的音頻處理單元);以及(b)在音頻處理單元中(例如,在圖5的解碼器7或圖6的解碼器20中),解析條件渲染元數(shù)據(jù)和所述一組音頻聲道,并且響應(yīng)于條件渲染元數(shù)據(jù)中的至少一些來以符合所述至少一個(gè)渲染約束的方式(例如,在圖5的子系統(tǒng)9和11或者圖6的子系統(tǒng)24中)渲染所述一組音頻聲道中的至少一個(gè)音頻聲道的內(nèi)容。在一些這種實(shí)施例中,步驟(b)包括如下步驟:(例如,在圖6的子系統(tǒng)22中)選擇所述一組音頻聲道中的至少一個(gè)對(duì)象聲道,并且(例如,在圖6的子系統(tǒng)24中)使組中的每個(gè)選定對(duì)象聲道與組中的至少一個(gè)揚(yáng)聲器聲道混合,以生成下混。典型地,所述下混包含一組N個(gè)下混揚(yáng)聲器聲道,其中N為正整數(shù),并且步驟(b)包括如下步驟:通過用根據(jù)下混揚(yáng)聲器聲道生成的揚(yáng)聲器饋送驅(qū)動(dòng)揚(yáng)聲器來使回放揚(yáng)聲器陣列的N個(gè)揚(yáng)聲器發(fā)出聲音。由條件渲染元數(shù)據(jù)指示的下混約束的示例是當(dāng)回放揚(yáng)聲器陣列配置為特定類型時(shí)禁止下混相應(yīng)對(duì)象聲道。由條件渲染元數(shù)據(jù)指示的下混約束的另一個(gè)示例是當(dāng)回放揚(yáng)聲器陣列配置為特定類型時(shí)對(duì)包括相應(yīng)對(duì)象聲道的至少一個(gè)允許下混(或下混類型)的指示。可選地,條件渲染元數(shù)據(jù)還指示基于回放揚(yáng)聲器陣列配置的至少一個(gè)渲染規(guī)則(例如,至少一個(gè)下混規(guī)則),并且在步驟(b)中執(zhí)行的渲染符合所述渲染規(guī)則。下面的表1闡釋了可以由基于對(duì)象的音頻節(jié)目中的條件渲染元數(shù)據(jù)指示的基于回放揚(yáng)聲器陣列配置的下混中的音頻對(duì)象布置以及基于回放揚(yáng)聲器陣列配置的下混啟用類型的示例。在表1中,列代表節(jié)目的不同音頻對(duì)象聲道(因此由節(jié)目指示的音頻對(duì)象),行表示執(zhí)行下混的回放系統(tǒng)的不同回放揚(yáng)聲器陣列配置:表1環(huán)境主現(xiàn)場(chǎng)解說主隊(duì)現(xiàn)場(chǎng)解說客隊(duì)現(xiàn)場(chǎng)解說公告立體聲L/RL/R5.15.1Ls/Rs5.1+4個(gè)高度5.1+高度Ls/Rs高度在表1的示例中,節(jié)目指示在兩隊(duì)競技的體育賽事中捕捉的音頻,并且至少包括以下對(duì)象聲道(如表1中所示):環(huán)境聲道(指示在賽事中捕捉的環(huán)境內(nèi)容);主現(xiàn)場(chǎng)解說聲道(“主現(xiàn)場(chǎng)解說”),指示不偏向于支持任何一隊(duì)的現(xiàn)場(chǎng)解說;第二現(xiàn)場(chǎng)解說聲道(“主隊(duì)現(xiàn)場(chǎng)解說”),指示偏向于支持主隊(duì)的現(xiàn)場(chǎng)解說;第三現(xiàn)場(chǎng)解說聲道(“客隊(duì)現(xiàn)場(chǎng)解說”),指示偏向于支持客隊(duì)的現(xiàn)場(chǎng)解說;以及公告聲道(“公告”),指示公共廣播音頻。公告聲道的公共廣播內(nèi)容打算由回放揚(yáng)聲器陣列的地板上方揚(yáng)聲器渲染(使得所得到的聲音被感知為從假設(shè)聽者位置上方的明顯源位置發(fā)出)。主現(xiàn)場(chǎng)解說、第二現(xiàn)場(chǎng)解說和第三現(xiàn)場(chǎng)解說聲道中的每一個(gè)打算由回放揚(yáng)聲器陣列的左環(huán)繞和右環(huán)繞地板揚(yáng)聲器渲染(使得所發(fā)出的聲音被感知為從其發(fā)出的每個(gè)明顯源位置標(biāo)稱地在聽者耳朵的平面內(nèi))。環(huán)境聲道打算由回放揚(yáng)聲器陣列的所有揚(yáng)聲器渲染(即,所有可用的地板揚(yáng)聲器和地板上方揚(yáng)聲器)。在示例中,條件渲染元數(shù)據(jù)指示出:當(dāng)回放揚(yáng)聲器為立體聲揚(yáng)聲器陣列(僅包含左(“L”)地板揚(yáng)聲器和右(“R”)地板揚(yáng)聲器)時(shí),環(huán)境對(duì)象聲道和/或主現(xiàn)場(chǎng)解說對(duì)象聲道可以與節(jié)目的其他音頻內(nèi)容(除了公告聲道的內(nèi)容)下混,以生成用于驅(qū)動(dòng)立體聲揚(yáng)聲器的左和右下混聲道。條件渲染元數(shù)據(jù)還指示出:當(dāng)回放揚(yáng)聲器陣列為立體聲揚(yáng)聲器陣列時(shí),公告對(duì)象聲道不應(yīng)該與節(jié)目的其他音頻內(nèi)容下混(即,條件渲染元數(shù)據(jù)建立防止下混公告對(duì)象聲道內(nèi)容的規(guī)則)。在示例中,條件渲染元數(shù)據(jù)還指示出:當(dāng)回放揚(yáng)聲器陣列為5.1揚(yáng)聲器陣列(其全頻率范圍揚(yáng)聲器為左(“L”)、中央(“C”)、右(“R”)、左環(huán)繞(“Ls”)和右環(huán)繞(“Rs”)地板揚(yáng)聲器)時(shí),主現(xiàn)場(chǎng)解說對(duì)象聲道可以與節(jié)目的其他音頻內(nèi)容(除了公告聲道內(nèi)容)下混,以生成用于驅(qū)動(dòng)陣列的Ls和Rs地板揚(yáng)聲器的左環(huán)繞和右環(huán)繞下混聲道。條件渲染元數(shù)據(jù)還指示出:當(dāng)回放揚(yáng)聲器陣列為5.1揚(yáng)聲器陣列時(shí),環(huán)境對(duì)象聲道可以與節(jié)目的其他音頻內(nèi)容(除了公告聲道內(nèi)容)下混,以生成用于驅(qū)動(dòng)陣列的L、R、C、Ls和Rs地板揚(yáng)聲器的左、右、中央、左環(huán)繞和右環(huán)繞下混聲道。條件渲染元數(shù)據(jù)還指示出:當(dāng)回放揚(yáng)聲器陣列為5.1揚(yáng)聲器陣列時(shí),公告對(duì)象聲道不應(yīng)該與節(jié)目的其他音頻內(nèi)容下混(即,條件渲染元數(shù)據(jù)建立防止下混公告對(duì)象聲道內(nèi)容的規(guī)則)。在示例中,條件渲染元數(shù)據(jù)還指示出:當(dāng)回放揚(yáng)聲器陣列為5.1.4揚(yáng)聲器陣列(其全頻率范圍揚(yáng)聲器為左(“L”)、中央(“C”)、右(“R”)、左環(huán)繞(“Ls”)和右環(huán)繞(“Rs”)地板揚(yáng)聲器,以及四個(gè)“高度”揚(yáng)聲器)時(shí),主現(xiàn)場(chǎng)解說對(duì)象聲道可以與節(jié)目的其他音頻內(nèi)容(除了公告聲道內(nèi)容)下混,以生成用于驅(qū)動(dòng)左環(huán)繞和右環(huán)繞地板揚(yáng)聲器的左環(huán)繞和右環(huán)繞下混聲道。條件渲染元數(shù)據(jù)還指示出:當(dāng)回放揚(yáng)聲器陣列為5.1.4揚(yáng)聲器陣列時(shí),環(huán)境對(duì)象聲道可以與節(jié)目的其他音頻內(nèi)容(除了公告聲道內(nèi)容)下混,以生成用于驅(qū)動(dòng)陣列的L、R、C、Ls和Rs地板揚(yáng)聲器以及4個(gè)高度揚(yáng)聲器的左、右、中央、左環(huán)繞、右環(huán)繞和4個(gè)高度下混聲道。條件渲染元數(shù)據(jù)還指示出:當(dāng)回放揚(yáng)聲器陣列為5.1.4揚(yáng)聲器陣列時(shí),公告對(duì)象聲道不應(yīng)該與節(jié)目的其他音頻內(nèi)容下混到地板揚(yáng)聲器下混聲道中(即,條件渲染元數(shù)據(jù)建立防止將公告對(duì)象聲道的內(nèi)容下混到下混的地板聲道中的規(guī)則)。條件渲染元數(shù)據(jù)不建立防止將公告對(duì)象聲道與節(jié)目的其他音頻內(nèi)容(例如,另一個(gè)高度對(duì)象聲道的內(nèi)容)下混以生成用于驅(qū)動(dòng)回放揚(yáng)聲器陣列的高度揚(yáng)聲器的高度下混聲道的任何規(guī)則。根據(jù)本發(fā)明的典型實(shí)施例,假定一個(gè)特定的回放揚(yáng)聲器陣列配置,響應(yīng)于(假設(shè)已知曉可用回放揚(yáng)聲器陣列配置的)節(jié)目中所包括的條件渲染元數(shù)據(jù)而對(duì)基于對(duì)象的音頻節(jié)目的對(duì)象聲道內(nèi)容的條件渲染允許用戶從可用的渲染選項(xiàng)(例如,下混渲染選項(xiàng))的菜單中進(jìn)行選擇。例如,假定回放揚(yáng)聲器陣列僅包含5.1聲道配置中的地板揚(yáng)聲器,則菜單可以包括少量的可選下混渲染選項(xiàng),包括以下選項(xiàng):“主隊(duì)現(xiàn)場(chǎng)解說”下混,包括一床下混有“主隊(duì)現(xiàn)場(chǎng)解說”對(duì)象的揚(yáng)聲器聲道的內(nèi)容;“客隊(duì)現(xiàn)場(chǎng)解說”下混,包括一床下混有“客隊(duì)現(xiàn)場(chǎng)解說”對(duì)象的揚(yáng)聲器聲道的內(nèi)容;以及“主隊(duì)現(xiàn)場(chǎng)解說加主隊(duì)人群噪聲”下混,包括一床下混有“主隊(duì)現(xiàn)場(chǎng)解說”對(duì)象和“主隊(duì)人群噪聲”對(duì)象的揚(yáng)聲器聲道的內(nèi)容。對(duì)于另一個(gè)示例,假定回放揚(yáng)聲器陣列包括(例如,5.1聲道配置中的)地板揚(yáng)聲器和一組高度(地板上方)揚(yáng)聲器,菜單可以包括更多的可選下混渲染選項(xiàng),包括以下選項(xiàng):“主隊(duì)現(xiàn)場(chǎng)解說”地板下混,包含一床下混有“主隊(duì)現(xiàn)場(chǎng)解說”對(duì)象的揚(yáng)聲器聲道的內(nèi)容(用于僅驅(qū)動(dòng)陣列的地板揚(yáng)聲器);“客隊(duì)現(xiàn)場(chǎng)解說”地板下混,包含一床下混有“客隊(duì)現(xiàn)場(chǎng)解說”對(duì)象的揚(yáng)聲器聲道的內(nèi)容(用于僅驅(qū)動(dòng)陣列的地板揚(yáng)聲器);“主隊(duì)現(xiàn)場(chǎng)解說加主隊(duì)人群噪聲”地板下混,包含一床下混有“主隊(duì)現(xiàn)場(chǎng)解說”對(duì)象和“主隊(duì)人群噪聲”對(duì)象的揚(yáng)聲器聲道的內(nèi)容(用于僅驅(qū)動(dòng)陣列的地板揚(yáng)聲器);以及“主隊(duì)現(xiàn)場(chǎng)解說加主隊(duì)人群噪聲加公告”下混,包含一床下混有“主隊(duì)現(xiàn)場(chǎng)解說”對(duì)象、“主隊(duì)人群噪聲”對(duì)象和公告對(duì)象的揚(yáng)聲器聲道的內(nèi)容(用于驅(qū)動(dòng)陣列的所有揚(yáng)聲器,但是公告對(duì)象聲道的內(nèi)容僅包括在驅(qū)動(dòng)陣列的地板上方揚(yáng)聲器的下混揚(yáng)聲器饋送中,而所有其他下混內(nèi)容僅包括在驅(qū)動(dòng)陣列的地板揚(yáng)聲器的下混揚(yáng)聲器饋送中)。可以通過控制器的用戶界面(例如,由圖5的控制器10或圖6的控制器23實(shí)現(xiàn)的用戶界面)將渲染選項(xiàng)的菜單呈現(xiàn)給用戶,并且該控制器可耦接到被配置為(至少部分地)解碼和渲染基于對(duì)象的節(jié)目的機(jī)頂設(shè)備(或其他設(shè)備)。該節(jié)目中所包括的元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))可以允許用戶從關(guān)于由節(jié)目指示的哪些對(duì)象應(yīng)該被渲染以及關(guān)于要渲染的對(duì)象應(yīng)該如何與節(jié)目的其他內(nèi)容下混的一組選項(xiàng)中進(jìn)行選擇,使得所得到的下混內(nèi)容的聲道可被渲染。在一些實(shí)施例中,假定具有(一組可能的回放揚(yáng)聲器陣列配置中的)特定相應(yīng)配置的回放揚(yáng)聲器可用,條件渲染元數(shù)據(jù)至少指定能被用戶選擇的(節(jié)目的音頻內(nèi)容的)每個(gè)可選下混(例如,由下混渲染選項(xiàng)菜單指示的每個(gè)可選下混)的以下屬性:存在(即,對(duì)于每個(gè)對(duì)象聲道,關(guān)于該對(duì)象聲道是否應(yīng)該存在于下混中以便由具有相應(yīng)配置的回放揚(yáng)聲器陣列渲染的指示);聲場(chǎng)內(nèi)的位置(即,對(duì)于將被包括在下混中以便由具有相應(yīng)配置的回放揚(yáng)聲器陣列渲染的每個(gè)對(duì)象聲道,當(dāng)由下混確定的揚(yáng)聲器饋送對(duì)可用揚(yáng)聲器進(jìn)行驅(qū)動(dòng)時(shí),相應(yīng)聲音應(yīng)該被感知為從其發(fā)出的明顯空間位置的指示);增益(即,對(duì)于將被包括在下混中以便由具有相應(yīng)配置的回放揚(yáng)聲器陣列渲染的每個(gè)對(duì)象聲道,當(dāng)生成該下混時(shí)要施加到相應(yīng)聲道樣本的增益的指示);效果(即,對(duì)于將被包括在下混中以便由具有相應(yīng)配置的回放揚(yáng)聲器陣列渲染的每個(gè)對(duì)象聲道,當(dāng)生成下混時(shí)要應(yīng)用于相應(yīng)音頻樣本的特殊效果處理(如果有的話)的每個(gè)種類的指示。這種處理的示例包括但不限于發(fā)散處理和混響應(yīng)用)。本發(fā)明的實(shí)施例的各方面包括以下:用于(例如,在創(chuàng)作系統(tǒng)或內(nèi)容創(chuàng)建設(shè)備中)生成條件渲染元數(shù)據(jù)并且將元數(shù)據(jù)包括在基于對(duì)象的音頻節(jié)目中的方法和系統(tǒng)(例如,本發(fā)明的節(jié)目生成系統(tǒng)(例如,圖5的單元3)的一些實(shí)施例被編程或以其他方式被配置為執(zhí)行創(chuàng)作軟件或者以其他方式使用創(chuàng)作工具來定義和生成條件渲染元數(shù)據(jù),以便包括在基于對(duì)象的音頻節(jié)目中);以及用于解碼基于對(duì)象的音頻節(jié)目(包括通過解析節(jié)目的條件渲染元數(shù)據(jù))和/或渲染基于對(duì)象的音頻節(jié)目的內(nèi)容(包括通過解析條件渲染元數(shù)據(jù)和根據(jù)條件渲染元數(shù)據(jù)執(zhí)行對(duì)節(jié)目內(nèi)容的下混)的方法和系統(tǒng)(例如,解碼器和回放系統(tǒng))。在一些實(shí)施例中,基于對(duì)象的音頻節(jié)目的對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))包括(或包含)指示一組可選體驗(yàn)定義的可選內(nèi)容元數(shù)據(jù)。每個(gè)體驗(yàn)定義都是節(jié)目的音頻內(nèi)容的可選的、預(yù)定的(“預(yù)設(shè)的”)混合(例如,至少一個(gè)對(duì)象聲道和至少一個(gè)揚(yáng)聲器聲道的內(nèi)容的混合)。每個(gè)預(yù)設(shè)混合具有一組預(yù)定的渲染參數(shù)(例如,渲染對(duì)象的空間位置)。預(yù)設(shè)混合可以由回放系統(tǒng)的用戶界面(例如,由圖5的控制器10或圖6的控制器23實(shí)現(xiàn)的用戶界面)呈現(xiàn)為可用混合的有限菜單或選項(xiàng)板。可選地,節(jié)目的對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))包括指示分層混合圖的元數(shù)據(jù),所述分層混合圖指示節(jié)目的揚(yáng)聲器聲道和對(duì)象聲道的可選混合(例如,所有可選混合)。圖6是可被實(shí)現(xiàn)為執(zhí)行本發(fā)明的方法實(shí)施例的回放系統(tǒng)的實(shí)施例的框圖,該回放系統(tǒng)包括如圖所示那樣耦接的解碼器20、對(duì)象處理系統(tǒng)22、空間渲染子系統(tǒng)25、(實(shí)現(xiàn)用戶界面的)控制器23、以及可選地還有數(shù)字音頻處理子系統(tǒng)25、26和27。在一些實(shí)現(xiàn)方式中,圖6系統(tǒng)的元件20、22、24、25、26、27、29、31和33被實(shí)現(xiàn)為機(jī)頂設(shè)備。在圖6的系統(tǒng)中,解碼器20被配置為接收和解碼指示基于對(duì)象的音頻節(jié)目(或者基于對(duì)象的音頻節(jié)目的主混合)的編碼信號(hào)。根據(jù)本發(fā)明的實(shí)施例,典型地,節(jié)目(例如,節(jié)目的主混合)指示包括一床至少兩個(gè)揚(yáng)聲器聲道、至少一個(gè)用戶可選的對(duì)象聲道、以及與每個(gè)對(duì)象聲道對(duì)應(yīng)的對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))的音頻內(nèi)容。每個(gè)對(duì)象聲道指示音頻對(duì)象,因此為了方便,對(duì)象聲道有時(shí)在本文中被稱為“對(duì)象”。在實(shí)施例中,節(jié)目是AC-3或E-AC-3比特流(或者包括作為AC-3或E-AC-3比特流的主混合),指示音頻對(duì)象、對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))、一床揚(yáng)聲器聲道以及選擇性地還有可選的替換揚(yáng)聲器聲道。典型地,單獨(dú)的音頻對(duì)象被單聲道編碼或者立體聲編碼(即,每個(gè)對(duì)象聲道指示對(duì)象的左或右聲道,或者是指示對(duì)象的單聲道),所述床是傳統(tǒng)的5.1混合,并且解碼器20可以被配置為同時(shí)解碼多達(dá)16個(gè)聲道的音頻內(nèi)容(包括所述床的6個(gè)揚(yáng)聲器聲道、替換揚(yáng)聲器聲道和對(duì)象聲道)。在本發(fā)明的回放系統(tǒng)的一些實(shí)施例中,進(jìn)入的E-AC-3(或AC-3)編碼比特流的每幀包括一個(gè)或兩個(gè)元數(shù)據(jù)“容器”。進(jìn)入的比特流指示基于對(duì)象的音頻節(jié)目或者這種節(jié)目的主混合,并且節(jié)目的揚(yáng)聲器聲道被組織作為常規(guī)的E-AC-3(或AC-3)比特流的音頻內(nèi)容。一個(gè)容器可以被包括在所述幀的Aux字段中,而另一個(gè)容器可以被包括在所述幀的addbsi字段中。每個(gè)容器具有核心頭部并且包括(或關(guān)聯(lián))一個(gè)或更多個(gè)有效載荷。(Aux字段中所包括的容器的或者與其關(guān)聯(lián)的)一個(gè)這種有效載荷可以是(與同樣由節(jié)目指示的一床揚(yáng)聲器聲道有關(guān)的)一個(gè)或更多個(gè)對(duì)象聲道中的每一個(gè)對(duì)象聲道的一組音頻樣本和與每個(gè)對(duì)象聲道關(guān)聯(lián)的對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))。在這種有效載荷中,一些或全部對(duì)象聲道的樣本(和關(guān)聯(lián)的元數(shù)據(jù))可以被組織為標(biāo)準(zhǔn)的E-AC-3(或AC-3)幀,或者可以以其它方式組織(例如,它們可以被包括在與E-AC-3或AC-3比特流不同的次混合中)。(addbsi字段或Aux字段中所包括的容器的或者與其關(guān)聯(lián)的)另一個(gè)這種有效載荷的示例是一組與幀的音頻內(nèi)容關(guān)聯(lián)的響度處理狀態(tài)元數(shù)據(jù)。在一些這種實(shí)施例中,解碼器(例如,圖6的解碼器20)將解析Aux字段中的容器的核心頭部,并且從容器(例如,從AC-3或E-AC-3幀的Aux字段)和/或從由核心頭部指示的位置(例如,次混合)提取本發(fā)明的對(duì)象聲道和關(guān)聯(lián)的元數(shù)據(jù)。在提取有效載荷(對(duì)象聲道和關(guān)聯(lián)的元數(shù)據(jù))之后,解碼器將對(duì)所提取的有效載荷執(zhí)行任何必要的解碼。每個(gè)容器的核心頭部典型地包括:至少一個(gè)ID值,指示容器所包括或者關(guān)聯(lián)的有效載荷的類型;子流關(guān)聯(lián)指示(指示核心頭部與哪些子流關(guān)聯(lián));以及保護(hù)比特。這種保護(hù)比特(可以包含或者包括基于散列(hash-based)的消息認(rèn)證碼或“HMAC”)典型地有益于對(duì)被包括在容器中或者與其關(guān)聯(lián)的至少一個(gè)有效載荷中的對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))和/或響度處理狀態(tài)元數(shù)據(jù)(以及可選地還有其它元數(shù)據(jù))和/或被包括在幀中的對(duì)應(yīng)音頻數(shù)據(jù)的解密、認(rèn)證或確認(rèn)之一。子流可以位于“帶內(nèi)”(在E-AC-3或AC-3比特流中)或者“帶外”(例如,在與E-AC-3或AC-3比特流分開的次混合比特流中)。一種類型的這種有效載荷是(與同樣由節(jié)目指示的所述一床揚(yáng)聲器聲道有關(guān)的)一個(gè)或更多個(gè)對(duì)象聲道的中的每一個(gè)對(duì)象聲道的一組音頻樣本和與每個(gè)對(duì)象聲道關(guān)聯(lián)的對(duì)象相關(guān)元數(shù)據(jù)。每個(gè)對(duì)象聲道是單獨(dú)的子流,并且典型地將在核心頭部中被標(biāo)識(shí)。另一種類型的有效載荷是響度處理狀態(tài)元數(shù)據(jù)。典型地,每個(gè)有效載荷具有它自己的頭部(或者“有效載荷標(biāo)識(shí)符”)。對(duì)象級(jí)的元數(shù)據(jù)可以攜帶在作為對(duì)象聲道的每個(gè)子流中。節(jié)目級(jí)的元數(shù)據(jù)可以被包括在容器的核心頭部中和/或在用于有效載荷的頭部中,其中有效載荷是一個(gè)或更多個(gè)對(duì)象聲道的一組音頻樣本(以及與每個(gè)對(duì)象聲道關(guān)聯(lián)的元數(shù)據(jù))。在一些實(shí)施例中,所述幀的auxdata(或addbsi)字段中的每個(gè)容器具有三級(jí)結(jié)構(gòu):高級(jí)結(jié)構(gòu),包括指示auxdata(或addbsi)字段是否包括元數(shù)據(jù)的標(biāo)志(其中在這種語境下的“元數(shù)據(jù)”表示對(duì)象聲道、對(duì)象相關(guān)元數(shù)據(jù)、以及由比特流攜帶但是一般不攜帶在缺乏所述類型的任何容器的常規(guī)E-AC-3或AC-3比特流中的任何其它音頻內(nèi)容或元數(shù)據(jù))、指示存在什么類型的元數(shù)據(jù)的至少一個(gè)ID值,并且通常還包括(如果元數(shù)據(jù)存在的話)指示存在多少比特的(例如,每種類型的)元數(shù)據(jù)的值。在這種語境下,一個(gè)這種“類型”的元數(shù)據(jù)的示例是對(duì)象聲道數(shù)據(jù)和關(guān)聯(lián)的對(duì)象相關(guān)元數(shù)據(jù)(即,(與同樣由節(jié)目指示的所述一床揚(yáng)聲器聲道有關(guān)的)一個(gè)或更多個(gè)對(duì)象聲道中的每一個(gè)對(duì)象聲道的一組音頻樣本以及與每個(gè)對(duì)象聲道關(guān)聯(lián)的元數(shù)據(jù));中間級(jí)結(jié)構(gòu),包括用于每種識(shí)別類型的元數(shù)據(jù)的核心元素(例如,對(duì)于每種識(shí)別類型的元數(shù)據(jù),例如上述類型的核心頭部、保護(hù)值、以及有效載荷ID和有效載荷尺寸值);及低級(jí)結(jié)構(gòu),如果核心元素識(shí)別出存在至少一個(gè)這種有效載荷,則包括用于一個(gè)核心元素的每個(gè)有效載荷。這種有效載荷的示例是(與同樣由節(jié)目指示的所述一床揚(yáng)聲器聲道有關(guān)的)一個(gè)或更多個(gè)對(duì)象聲道中的每一個(gè)對(duì)象聲道的一組音頻樣本以及與每個(gè)對(duì)象聲道關(guān)聯(lián)的元數(shù)據(jù)。這種有效載荷的另一個(gè)示例是包括響度處理狀態(tài)元數(shù)據(jù)(“LPSM”)的有效載荷,有時(shí)被稱為LPSM有效載荷。這種三級(jí)結(jié)構(gòu)中的數(shù)據(jù)值可以嵌套。例如,在核心元素識(shí)別出的每個(gè)有效載荷之后(因此在核心元素的核心頭部之后),可以包括由核心元素識(shí)別出的有效載荷(例如,LPSM有效載荷)的保護(hù)值。在一個(gè)示例中,核心頭部可以識(shí)別第一有效載荷(例如,LPSM有效載荷)和另一有效載荷,第一有效載荷的有效載荷ID和有效載荷尺寸值可以跟在核心頭部之后,第一有效載荷自身可以跟在所述ID和尺寸值之后,第二有效載荷的有效載荷ID和有效載荷尺寸值可以跟在第一有效載荷之后,第二有效載荷自身可以跟在這些ID和尺寸值之后,并且任何一個(gè)或兩個(gè)有效載荷(或者核心元素和任何一個(gè)或兩個(gè)有效載荷)的保護(hù)值可以跟在最后一個(gè)有效載荷之后。再次參照?qǐng)D6,用戶利用控制器23來選擇要渲染的對(duì)象(由基于對(duì)象的音頻節(jié)目指示)??刂破?3可以是被編程為實(shí)現(xiàn)與圖6系統(tǒng)的其它元素兼容的用戶界面(例如,iPad應(yīng)用)的手持式處理設(shè)備(例如,iPad)。用戶界面可以向用戶提供(例如,在觸摸屏上顯示)對(duì)象、“床”揚(yáng)聲器聲道內(nèi)容和替換揚(yáng)聲器聲道內(nèi)容的可選“預(yù)設(shè)”混合的菜單或選項(xiàng)板。所述可選預(yù)設(shè)混合可以由節(jié)目的對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))確定,并且通常還由子系統(tǒng)22實(shí)現(xiàn)的規(guī)則(例如,子系統(tǒng)22已被預(yù)配置為實(shí)現(xiàn)的規(guī)則)確定,假設(shè)子系統(tǒng)22已知曉可用回放揚(yáng)聲器陣列的配置。用戶通過向控制器23輸入命令(例如,通過致動(dòng)其觸摸屏)來選擇可選的混合,并且作為響應(yīng),控制器23將向子系統(tǒng)22斷言相應(yīng)的控制數(shù)據(jù)。在操作中,解碼器20解碼節(jié)目的揚(yáng)聲器聲道床中的揚(yáng)聲器聲道(以及節(jié)目中所包括的任何替換揚(yáng)聲器聲道),并且向子系統(tǒng)22輸出經(jīng)解碼的揚(yáng)聲器聲道。響應(yīng)于基于對(duì)象的音頻節(jié)目,并且響應(yīng)于來自控制器23的、指示要渲染(包括通過經(jīng)歷下混)的節(jié)目的整組對(duì)象聲道的選定子集的控制數(shù)據(jù),解碼器20解碼(如果必要的話)所選定的對(duì)象聲道,并且向子系統(tǒng)22輸出所選定的(例如,經(jīng)解碼的)對(duì)象聲道(其中每個(gè)都可以是脈沖編碼調(diào)制的或“PCM”比特流)、以及對(duì)應(yīng)于選定對(duì)象聲道的對(duì)象相關(guān)元數(shù)據(jù)。除了來自解碼器20的經(jīng)解碼的揚(yáng)聲器聲道、經(jīng)解碼的對(duì)象聲道和經(jīng)解碼的對(duì)象相關(guān)元數(shù)據(jù)之外,對(duì)象處理子系統(tǒng)22的輸入還可選地包括向系統(tǒng)斷言(例如,作為其主混合向解碼器20斷言的節(jié)目的一個(gè)或更多個(gè)次混合)的外部音頻對(duì)象聲道。由這種外部音頻對(duì)象聲道指示的對(duì)象示例包括本地解說(例如,由無線電頻道傳送的單聲道音頻內(nèi)容)、進(jìn)入的Skype呼叫、進(jìn)入的twitter連接(經(jīng)由文本到語音系統(tǒng)轉(zhuǎn)換,在圖6中未示出)、以及系統(tǒng)聲音。子系統(tǒng)22被配置為輸出由節(jié)目指示的整組對(duì)象聲道的選定子集(或整組對(duì)象聲道的選定子集的處理版本)和節(jié)目的相應(yīng)對(duì)象相關(guān)元數(shù)據(jù)、以及替換揚(yáng)聲器聲道和/或床揚(yáng)聲器聲道中的一組選定揚(yáng)聲器聲道。對(duì)象聲道選擇和揚(yáng)聲器聲道選擇可以通過(如由從控制器23向子系統(tǒng)22斷言的控制數(shù)據(jù)所指示的)用戶選擇和/或子系統(tǒng)22已被編程為或以其它方式被配置而實(shí)現(xiàn)的規(guī)則(例如,指示條件和/或約束)來確定。這種規(guī)則可以由節(jié)目的對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))和/或由(例如,從控制器23或另一外部源)向子系統(tǒng)22斷言的其它數(shù)據(jù)(包括指示回放系統(tǒng)的揚(yáng)聲器陣列的配置(例如,能力和組織)的數(shù)據(jù))確定和/或通過預(yù)配置(例如,編程)子系統(tǒng)22來確定。在一些實(shí)施例中,節(jié)目的對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))確定(一床揚(yáng)聲器聲道和/或替換揚(yáng)聲器聲道的)揚(yáng)聲器聲道內(nèi)容和對(duì)象的一組可選“預(yù)設(shè)”混合。子系統(tǒng)22通常不作改變地(向子系統(tǒng)24)傳遞來自解碼器20的經(jīng)解碼的揚(yáng)聲器聲道(床揚(yáng)聲器聲道以及典型地還有替換揚(yáng)聲器聲道)的選定子集(例如,床中的至少一個(gè)揚(yáng)聲器聲道和至少一個(gè)替換揚(yáng)聲器聲道),并且處理向其斷言的對(duì)象聲道中的選定對(duì)象聲道。由子系統(tǒng)22執(zhí)行的對(duì)象處理(包括對(duì)象選擇)通常由來自控制器23的控制數(shù)據(jù)和來自解碼器20的對(duì)象相關(guān)元數(shù)據(jù)(以及可選地還有向子系統(tǒng)22斷言的除來自解碼器20之外的次混合的對(duì)象相關(guān)元數(shù)據(jù))控制,并且典型地包括對(duì)于每個(gè)選定對(duì)象的空間位置和水平的確定(而不管對(duì)象選擇是由于用戶選擇還是由于通過規(guī)則施加而進(jìn)行的選擇)。典型地,用于渲染對(duì)象的默認(rèn)空間位置和默認(rèn)水平、以及關(guān)于對(duì)象及其(將在子系統(tǒng)24中生成的下混聲道中的)水平和(由這種下混聲道指示的)空間位置的用戶選擇的約束都被包括在(例如,從解碼器20)向子系統(tǒng)22斷言的對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))中或者由該對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))指示。這種約束可以指示(下混中的)對(duì)象的禁止組合或者(由下混聲道指示的)選定對(duì)象可以渲染的禁止空間位置(例如,以防止選定對(duì)象彼此太靠近地渲染,或者為了防止特定對(duì)象被包括在用于生成驅(qū)動(dòng)可用回放揚(yáng)聲器陣列的揚(yáng)聲器饋送的下混聲道中)。此外,個(gè)別選定對(duì)象的響度通常由對(duì)象處理子系統(tǒng)22響應(yīng)于利用控制器23輸入的控制數(shù)據(jù)、和/或由(例如,來自解碼器20的)對(duì)象相關(guān)元數(shù)據(jù)指示的默認(rèn)水平和/或通過子系統(tǒng)22的預(yù)配置來控制。典型地,由解碼器20執(zhí)行的解碼包括(從輸入節(jié)目)提取元數(shù)據(jù),其中元數(shù)據(jù)指示由節(jié)目指示的每個(gè)對(duì)象的音頻內(nèi)容的類型(例如,由節(jié)目的音頻內(nèi)容指示的體育賽事的類型,以及由節(jié)目指示的可選和默認(rèn)對(duì)象的名稱或其它識(shí)別記號(hào)(例如,隊(duì)標(biāo)))??刂破?3和對(duì)象處理子系統(tǒng)22接收這種元數(shù)據(jù)或者由該元數(shù)據(jù)指示的相關(guān)信息??刂破?3還接收(例如,用后述信息編程)關(guān)于用戶的回放揚(yáng)聲器陣列的配置的信息(例如,揚(yáng)聲器的數(shù)目、以及揚(yáng)聲器的假設(shè)布置和其它假設(shè)組織)。圖6的空間渲染子系統(tǒng)24(或者具有至少一個(gè)下游設(shè)備或系統(tǒng)的子系統(tǒng)24)被配置為渲染從子系統(tǒng)22輸出的音頻內(nèi)容輸出,以便由用戶的回放揚(yáng)聲器陣列的揚(yáng)聲器回放。一個(gè)或更多個(gè)可選地包括的數(shù)字音頻處理子系統(tǒng)25、26和27可以對(duì)子系統(tǒng)24的輸出實(shí)現(xiàn)后期處理??臻g渲染子系統(tǒng)24被配置為把揚(yáng)聲器聲道內(nèi)容(例如,由子系統(tǒng)22確定并且被從子系統(tǒng)22傳遞到子系統(tǒng)24的一組選定的床揚(yáng)聲器聲道和替換揚(yáng)聲器聲道)和由對(duì)象處理子系統(tǒng)22選擇(或者選擇并處理)并向子系統(tǒng)24斷言的每個(gè)音頻對(duì)象聲道的內(nèi)容(例如,默認(rèn)選擇的對(duì)象、和/或已經(jīng)作為用戶利用控制器23進(jìn)行交互的結(jié)果而選擇的用戶選擇的對(duì)象)下混為可用的揚(yáng)聲器聲道。所述下混是使用從子系統(tǒng)22輸出的與每個(gè)選定對(duì)象關(guān)聯(lián)的渲染參數(shù)(例如,空間位置和水平的用戶選擇的和/或默認(rèn)的值)實(shí)現(xiàn)的。典型地,子系統(tǒng)24是智能混合器,并且被配置為確定用于可用揚(yáng)聲器的揚(yáng)聲器饋送,包括通過將一個(gè)、兩個(gè)或多于兩個(gè)選定對(duì)象聲道的內(nèi)容映射到多個(gè)單獨(dú)的揚(yáng)聲器聲道中的每一個(gè),并且執(zhí)行使選定對(duì)象聲道與由每個(gè)相應(yīng)揚(yáng)聲器聲道指示的音頻內(nèi)容混合的下混。在一些實(shí)現(xiàn)方式中,所輸出得(下混的)揚(yáng)聲器聲道的數(shù)目可以在2.0和7.1之間變化,并且被驅(qū)動(dòng)渲染(與選定揚(yáng)聲器聲道內(nèi)容的下混中的)選定音頻對(duì)象聲道的揚(yáng)聲器可以假設(shè)位于回放環(huán)境中的(標(biāo)稱)水平面內(nèi)。在這種情況下,執(zhí)行渲染,使得揚(yáng)聲器可以被驅(qū)動(dòng)發(fā)出這樣的聲音:該聲音將被感知為從揚(yáng)聲器平面內(nèi)的不同對(duì)象位置(即,對(duì)于每個(gè)選定的或默認(rèn)的對(duì)象,一個(gè)對(duì)象位置,或者沿軌跡的一系列對(duì)象位置)發(fā)出,并與由揚(yáng)聲器聲道內(nèi)容確定的聲音混合。在各種實(shí)施例中,被驅(qū)動(dòng)渲染下混音頻的全范圍揚(yáng)聲器的數(shù)目可以是寬范圍內(nèi)的任何數(shù)目(不一定局限于從2至7的范圍),因此輸出揚(yáng)聲器聲道的數(shù)目不限于在從2.0至7.1的范圍內(nèi)。在一些實(shí)施例中,被驅(qū)動(dòng)渲染下混音頻的揚(yáng)聲器假設(shè)位于回放系統(tǒng)中的任意位置,而不僅僅是在(標(biāo)稱)水平面內(nèi)。在一些此類情況下,節(jié)目中所包括的元數(shù)據(jù)指示用于使用揚(yáng)聲器的三維陣列在任何明顯空間位置(在三維空間內(nèi))對(duì)節(jié)目的至少一個(gè)對(duì)象進(jìn)行渲染的渲染參數(shù)。例如,對(duì)象聲道可以具有指示要渲染(由對(duì)象聲道指示的)對(duì)象處的明顯空間位置的三維軌跡的相應(yīng)元數(shù)據(jù)。軌跡可以包括一系列“地板”位置(在假設(shè)位于回放環(huán)境的地板平面內(nèi))、以及一系列“地板上方”位置(各自通過驅(qū)動(dòng)假設(shè)位于回放環(huán)境的至少一個(gè)其他水平面內(nèi)的揚(yáng)聲器子集來確定)。在這種情況下,可以根據(jù)本發(fā)明來執(zhí)行渲染,使得揚(yáng)聲器可以被驅(qū)動(dòng)發(fā)出(由相關(guān)對(duì)象聲道確定的)這樣的聲音:該聲音將被感知為從三維空間中包括該軌跡的一系列對(duì)象位置發(fā)出,并且與由揚(yáng)聲器聲道內(nèi)容確定的聲音混合。子系統(tǒng)24可以被配置為實(shí)現(xiàn)這種渲染、或其步驟,而渲染的剩余步驟由下游系統(tǒng)或設(shè)備(例如,圖6的渲染子系統(tǒng)35)執(zhí)行。可選地,數(shù)字音頻處理(DAP)級(jí)(例如,多個(gè)預(yù)定輸出(下混)揚(yáng)聲器聲道配置中的每一個(gè)有一個(gè))耦接到空間渲染子系統(tǒng)24的輸出,以便對(duì)空間渲染子系統(tǒng)的輸出執(zhí)行后期處理。這種處理的示例包括智能均衡(intelligentequalization)或者(在立體聲輸出的情況下)揚(yáng)聲器虛擬化處理。圖6系統(tǒng)的輸出(例如,空間渲染子系統(tǒng)的輸出,或者空間渲染階段之后的DAP級(jí))可以是PCM比特流(其確定用于可用揚(yáng)聲器的揚(yáng)聲器饋送)。例如,在用戶的回放系統(tǒng)包括7.1揚(yáng)聲器陣列的情況下,系統(tǒng)可以輸出(在子系統(tǒng)24中生成的)確定用于這種陣列的揚(yáng)聲器的揚(yáng)聲器饋送的PCM比特流、或者(在DAP25中生成的)這種比特流的后期處理版本。對(duì)于另一個(gè)示例,在用戶的回放系統(tǒng)包括5.1揚(yáng)聲器陣列的情況下,系統(tǒng)可以輸出(在子系統(tǒng)24中生成的)確定用于這種陣列的揚(yáng)聲器的揚(yáng)聲器饋送的PCM比特流、或者(在DAP26中生成的)這種比特流的后期處理版本。對(duì)于另一個(gè)示例,在用戶的回放系統(tǒng)只包括左和右揚(yáng)聲器的情況下,系統(tǒng)可以輸出(在子系統(tǒng)24中生成的)確定用于左和右揚(yáng)聲器的揚(yáng)聲器饋送的PCM比特流、或者(在DAP27中生成的)這種比特流的后期處理版本。圖6的系統(tǒng)可選地還包括重新編碼子系統(tǒng)31和33中的一個(gè)或兩個(gè)。重新編碼子系統(tǒng)31被配置為把從DAP25輸出的PCM比特流(指示用于7.1揚(yáng)聲器陣列的饋送)重新編碼為E-AC-3編碼比特流,并且所得到的經(jīng)編碼的(經(jīng)壓縮的)E-AC-3比特流可以從系統(tǒng)輸出。重新編碼子系統(tǒng)33被配置為把從DAP27輸出的PCM比特流(指示用于5.1揚(yáng)聲器陣列的饋送)重新編碼為AC-3或E-AC-3編碼比特流,并且所得到的經(jīng)編碼的(經(jīng)壓縮的)E-AC-3比特流可以從系統(tǒng)輸出。圖6的系統(tǒng)可選地還包括重新編碼(或格式化)子系統(tǒng)29和被耦接為接收子系統(tǒng)29的輸出的下游渲染子系統(tǒng)35。子系統(tǒng)29被耦接為接收(從子系統(tǒng)22輸出的)指示選定音頻對(duì)象(或音頻對(duì)象的默認(rèn)混合)的數(shù)據(jù)、對(duì)應(yīng)的對(duì)象相關(guān)元數(shù)據(jù)和經(jīng)解碼的揚(yáng)聲器聲道(例如,床揚(yáng)聲器聲道和替換揚(yáng)聲器聲道),并且被配置為重新編碼(和/或格式化)這種數(shù)據(jù),以便由子系統(tǒng)35渲染??梢栽贏VR或條形音箱(或者在子系統(tǒng)29下游的其它系統(tǒng)或設(shè)備)中實(shí)現(xiàn)的子系統(tǒng)35被配置為響應(yīng)于子系統(tǒng)29的輸出來生成用于可用回放揚(yáng)聲器(揚(yáng)聲器陣列36)的揚(yáng)聲器饋送(或者確定揚(yáng)聲器饋送的比特流)。例如,通過把指示選定的(或默認(rèn)的)音頻對(duì)象、對(duì)應(yīng)的元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))和揚(yáng)聲器聲道的數(shù)據(jù)重新編碼成適合于在子系統(tǒng)35中渲染的格式,子系統(tǒng)29可被配置為生成編碼音頻,并且(例如,經(jīng)由HDMI鏈接)把編碼音頻發(fā)送到子系統(tǒng)35。響應(yīng)于由子系統(tǒng)35生成(或者由子系統(tǒng)35的輸出確定的)揚(yáng)聲器饋送,可用揚(yáng)聲器36將發(fā)出指示揚(yáng)聲器聲道內(nèi)容與選定(或默認(rèn))對(duì)象的混合的聲音,其中所述對(duì)象具有由子系統(tǒng)29輸出的對(duì)象相關(guān)元數(shù)據(jù)確定的明顯源位置。當(dāng)包括了子系統(tǒng)29和35時(shí),可選地從系統(tǒng)中省略渲染子系統(tǒng)24。在一些實(shí)施例中,本發(fā)明是用于渲染基于對(duì)象的音頻的分布式系統(tǒng),其中渲染的一部分(即,至少一個(gè)步驟)(例如,如由圖6系統(tǒng)的子系統(tǒng)22和控制器23執(zhí)行的對(duì)要渲染的音頻對(duì)象的選擇和對(duì)每個(gè)選定對(duì)象的渲染特性的選擇)在第一子系統(tǒng)(例如,在機(jī)頂設(shè)備中實(shí)現(xiàn)的圖6的元件20、22和23,或者機(jī)頂設(shè)備和手持式控制器)中實(shí)現(xiàn),而渲染的另一部分(例如,其中響應(yīng)于第一子系統(tǒng)的輸出來生成揚(yáng)聲器饋送或者確定揚(yáng)聲器饋送的信號(hào)的沉浸式渲染)在第二子系統(tǒng)(例如,在AVR或條形音箱中實(shí)現(xiàn)的子系統(tǒng)35)中實(shí)現(xiàn)。提供分布式渲染的一些實(shí)施例還實(shí)現(xiàn)延遲管理,以便考慮執(zhí)行音頻渲染(以及與正在渲染的音頻對(duì)應(yīng)的任何視頻處理)的各個(gè)部分的不同時(shí)刻和不同子系統(tǒng)。在本發(fā)明的回放系統(tǒng)的一些實(shí)施例中,每個(gè)解碼器和對(duì)象處理子系統(tǒng)(有時(shí)被稱為個(gè)性化引擎)在機(jī)頂設(shè)備(STB)中實(shí)現(xiàn)。例如,圖6的元件20和22和/或圖7系統(tǒng)的所有元件可以在STB中實(shí)現(xiàn)。在本發(fā)明的回放系統(tǒng)的一些實(shí)施例中,對(duì)個(gè)性化引擎的輸出執(zhí)行多種渲染,以確保所有STB輸出(例如,HDMI、S/PDID和STB的立體聲模擬輸出)都被啟用??蛇x地,選定對(duì)象聲道(和對(duì)應(yīng)的基于對(duì)象的元數(shù)據(jù))與揚(yáng)聲器聲道(和解碼的揚(yáng)聲器聲道床一起)從STB傳遞到被配置為渲染對(duì)象聲道與揚(yáng)聲器聲道的混合的下游設(shè)備(例如,AVR或條形音箱)。在一類實(shí)施例中,本發(fā)明的基于對(duì)象的音頻節(jié)目包括被并行地生成和發(fā)送的一組比特流(多個(gè)比特流,可以被稱為“子流”)。在一些實(shí)施例中,在這種情況下,采用多個(gè)解碼器來解碼子流的內(nèi)容(例如,節(jié)目包括多個(gè)E-AC-3子流并且回放系統(tǒng)采用多個(gè)E-AC-3解碼器來解碼子流的內(nèi)容)。圖7是被配置為解碼和渲染本發(fā)明的基于對(duì)象的音頻節(jié)目的實(shí)施例的回放系統(tǒng)的框圖,其中所述基于對(duì)象的音頻節(jié)目包括多個(gè)并行傳送的串行比特流。圖7的回放系統(tǒng)是圖6系統(tǒng)的變型,其中基于對(duì)象的音頻節(jié)目包括被并行傳送到回放系統(tǒng)并被回放系統(tǒng)接收的多個(gè)比特流(B1、B2...BN,其中N是某個(gè)正整數(shù))。每個(gè)比特流(“子流”)B1、B2...和BN是包括時(shí)間碼或其它同步字(參照?qǐng)D7,為了方便,被稱為“同步字”)的串行比特流,以允許子流彼此同步或時(shí)間對(duì)齊。每個(gè)子流還包括整組對(duì)象聲道的不同子集以及對(duì)應(yīng)的對(duì)象相關(guān)元數(shù)據(jù),并且至少一個(gè)子流包括揚(yáng)聲器聲道(例如,床揚(yáng)聲器聲道和替換揚(yáng)聲器聲道)。例如,在每個(gè)子流B1、B2...BN中,包括對(duì)象聲道內(nèi)容和對(duì)象相關(guān)元數(shù)據(jù)的每個(gè)容器包括唯一的ID或時(shí)間戳。圖7的系統(tǒng)包括N個(gè)去格式化器50、51...53,每個(gè)去格式化器被耦接和配置為解析一個(gè)不同的輸入子流,并且向比特流同步級(jí)59斷言元數(shù)據(jù)(包括其同步字)及其音頻內(nèi)容。去格式化器50被配置為解析子流B1,以及向比特流同步級(jí)59斷言其同步字(T1)、其它元數(shù)據(jù)及其對(duì)象聲道內(nèi)容(M1)(包括節(jié)目的至少一個(gè)對(duì)象聲道、條件渲染元數(shù)據(jù)和其他對(duì)象相關(guān)元數(shù)據(jù))以及其揚(yáng)聲器聲道音頻內(nèi)容(A1)(包括節(jié)目的至少一個(gè)揚(yáng)聲器聲道)。類似地,去格式化器51被配置為解析子流B2,以及向比特流同步級(jí)59斷言其同步字(T2)、其它元數(shù)據(jù)及其對(duì)象聲道內(nèi)容(M2)(包括節(jié)目的至少一個(gè)對(duì)象聲道、條件渲染元數(shù)據(jù)和其他對(duì)象相關(guān)元數(shù)據(jù))以及其揚(yáng)聲器聲道音頻內(nèi)容(A2)(包括節(jié)目的至少一個(gè)揚(yáng)聲器聲道)。類似地,去格式化器53被配置為解析子流BN,并且向比特流同步級(jí)59斷言其同步字(TN)、其它元數(shù)據(jù)及其對(duì)象聲道內(nèi)容(MN)(包括節(jié)目的至少一個(gè)對(duì)象聲道、條件渲染元數(shù)據(jù)和其他對(duì)象相關(guān)元數(shù)據(jù))以及其揚(yáng)聲器聲道音頻內(nèi)容(AN)(包括節(jié)目的至少一個(gè)揚(yáng)聲器聲道)。圖7系統(tǒng)的比特流同步級(jí)59典型地包括用于子流B1、B2...BN的音頻內(nèi)容和元數(shù)據(jù)的緩沖區(qū)、以及被耦接和配置為使用每個(gè)子流的同步字來確定輸入子流中任何數(shù)據(jù)失準(zhǔn)的流偏移量補(bǔ)償元件(例如,因?yàn)槊總€(gè)比特流通常被攜帶在獨(dú)立的接口和/或媒體文件內(nèi)的軌道上,由于它們之間的緊密同步在分發(fā)/貢獻(xiàn)中可能丟失,因此可能發(fā)生失準(zhǔn))。級(jí)59的流偏移量補(bǔ)償元件通常還被配置為通過向包含比特流的音頻數(shù)據(jù)和元數(shù)據(jù)的緩沖區(qū)斷言適當(dāng)?shù)目刂浦祦硇U魏未_定的失準(zhǔn),以便使揚(yáng)聲器聲道音頻數(shù)據(jù)的時(shí)間對(duì)齊的比特被從緩沖區(qū)讀到分別與相應(yīng)緩沖區(qū)耦接的解碼器(包括解碼器60、61和63),并且使對(duì)象聲道音頻數(shù)據(jù)和元數(shù)據(jù)的時(shí)間對(duì)齊的比特被從緩沖區(qū)讀到對(duì)象數(shù)據(jù)組合級(jí)66。來自子流B1的揚(yáng)聲器聲道音頻內(nèi)容A1’的時(shí)間對(duì)齊的比特被從級(jí)59讀到解碼器60,并且來自子流B1的對(duì)象聲道內(nèi)容和元數(shù)據(jù)M1’的時(shí)間對(duì)齊的比特被從級(jí)59讀到元數(shù)據(jù)組合器66。解碼器60被配置為對(duì)向其斷言的揚(yáng)聲器聲道音頻數(shù)據(jù)執(zhí)行解碼,并且向?qū)ο筇幚砗弯秩咀酉到y(tǒng)67斷言所得到的經(jīng)解碼的揚(yáng)聲器聲道音頻。類似地,來自子流B2的揚(yáng)聲器聲道音頻內(nèi)容A2’的時(shí)間對(duì)齊的比特被從級(jí)59讀到解碼器61,并且來自子流B2的對(duì)象聲道內(nèi)容和元數(shù)據(jù)M2’的時(shí)間對(duì)齊的比特被從級(jí)59讀到元數(shù)據(jù)組合器66。解碼器61被配置為對(duì)向其斷言的揚(yáng)聲器聲道音頻數(shù)據(jù)執(zhí)行解碼,并且向?qū)ο筇幚砗弯秩咀酉到y(tǒng)67斷言所得到的經(jīng)解碼的揚(yáng)聲器聲道音頻。類似地,來自子流BN的揚(yáng)聲器聲道音頻內(nèi)容AN’的時(shí)間對(duì)齊的比特被從級(jí)59讀到解碼器63,并且來自子流BN的對(duì)象聲道內(nèi)容和元數(shù)據(jù)MN’的時(shí)間對(duì)齊的比特被從級(jí)59讀到元數(shù)據(jù)組合器66。解碼器63被配置為對(duì)向其斷言的揚(yáng)聲器聲道音頻數(shù)據(jù)執(zhí)行解碼,并且向?qū)ο筇幚砗弯秩咀酉到y(tǒng)67斷言所得到的經(jīng)解碼的揚(yáng)聲器聲道音頻。例如,子流B1、B2...BN中的每一個(gè)可以是E-AC-3子流,并且解碼器60、61、63以及與解碼器60、61和63并行地耦接到子系統(tǒng)59的任何其它解碼器中的每一個(gè)可以是E-AC-3解碼器,該E-AC-3解碼器被配置為對(duì)輸入E-AC-3子流之一的揚(yáng)聲器聲道內(nèi)容進(jìn)行解碼。對(duì)象數(shù)據(jù)組合器66被配置為以適當(dāng)?shù)母袷较驅(qū)ο筇幚砗弯秩咀酉到y(tǒng)67斷言用于節(jié)目的所有對(duì)象聲道的時(shí)間對(duì)齊的對(duì)象聲道數(shù)據(jù)和元數(shù)據(jù)。子系統(tǒng)67被耦接到組合器66的輸出并被耦接到解碼器60、61和63(以及與解碼器60、61和63并行地耦接在子系統(tǒng)59和67之間的任何其它解碼器)的輸出,而控制器68被耦接到子系統(tǒng)67。子系統(tǒng)67典型地被配置為響應(yīng)于來自控制器68的控制數(shù)據(jù),根據(jù)本發(fā)明的實(shí)施例以交互的方式對(duì)組合器66和解碼器的輸出執(zhí)行對(duì)象處理(例如,包括由圖6系統(tǒng)的子系統(tǒng)22執(zhí)行的步驟,或者這種步驟的變型)??刂破?8可以被配置為響應(yīng)于來自用戶的輸入而執(zhí)行圖6系統(tǒng)的控制器23被配置執(zhí)行的操作(或者這種操作的變型)。(例如,為了渲染床揚(yáng)聲器聲道內(nèi)容、替換揚(yáng)聲器聲道內(nèi)容和對(duì)象聲道內(nèi)容的混合)子系統(tǒng)67還典型地被配置為根據(jù)本發(fā)明的實(shí)施例對(duì)向其斷言的揚(yáng)聲器聲道音頻和對(duì)象聲道音頻數(shù)據(jù)執(zhí)行渲染(例如,由渲染子系統(tǒng)24、或者圖6系統(tǒng)的子系統(tǒng)24、25、26、31和33或者圖6系統(tǒng)的子系統(tǒng)24、25、26、31、33、29和35執(zhí)行的操作,或者這種操作的變型)。在圖7系統(tǒng)的一種實(shí)現(xiàn)方式中,子流B1、B2...BN中的每一個(gè)是杜比E比特流。每個(gè)這種杜比E比特流包括一系列突發(fā)。每個(gè)突發(fā)可以攜帶揚(yáng)聲器聲道音頻內(nèi)容(床揚(yáng)聲器聲道和/或替換揚(yáng)聲器聲道的內(nèi)容)和本發(fā)明的對(duì)象聲道的整組對(duì)象聲道(其可以是大集合)的子集以及對(duì)象相關(guān)元數(shù)據(jù)(即,每個(gè)突發(fā)可以指示整組對(duì)象聲道中的一些對(duì)象聲道以及對(duì)應(yīng)的包括條件渲染元數(shù)據(jù)的對(duì)象相關(guān)元數(shù)據(jù))。杜比E比特流的每個(gè)突發(fā)通常占用與對(duì)應(yīng)視頻幀的時(shí)間段相當(dāng)?shù)臅r(shí)間段。組中的每個(gè)杜比E比特流包括同步字(例如,時(shí)間碼),以允許組中的比特流彼此同步或時(shí)間對(duì)齊。例如,在每個(gè)比特流中,包括對(duì)象聲道內(nèi)容和對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))的每個(gè)容器可以包括唯一的ID和時(shí)間戳,以允許組中的比特流彼此同步或時(shí)間對(duì)齊。在提到的圖7系統(tǒng)的實(shí)現(xiàn)方式中,去格式化器50、51和53(以及與去格式化器50、51和53并行耦接的任何其它去格式化器)中的每一個(gè)是SMPTE337去格式化器,并且解碼器60、61、63以及與解碼器60、61和63并行耦接到子系統(tǒng)59的任何其它解碼器中的每一個(gè)可以是杜比E解碼器。在本發(fā)明的一些實(shí)施例中,基于對(duì)象的音頻節(jié)目的對(duì)象相關(guān)元數(shù)據(jù)包括持久性元數(shù)據(jù)。例如,被輸入到圖6系統(tǒng)的子系統(tǒng)20的節(jié)目中所包括的對(duì)象相關(guān)元數(shù)據(jù)可以包括非持久性元數(shù)據(jù)和持久性元元數(shù)據(jù),其中非持久性元數(shù)據(jù)(例如,對(duì)于用戶可選的對(duì)象,默認(rèn)水平和/或渲染位置或軌跡)可以在廣播鏈(從生成節(jié)目的內(nèi)容創(chuàng)建設(shè)備到由控制器23實(shí)現(xiàn)的用戶界面)中的至少一個(gè)點(diǎn)改變,而持久性元數(shù)據(jù)在節(jié)目最初生成(典型地,在內(nèi)容創(chuàng)建設(shè)備中)之后再不可變(或者不能改變)。持久性元數(shù)據(jù)的示例包括:用于節(jié)目的每個(gè)用戶可選對(duì)象或者其他對(duì)象或?qū)ο蠼M的條件渲染元數(shù)據(jù);用于每個(gè)用戶可選的節(jié)目的對(duì)象或其它對(duì)象或?qū)ο蠼M;以及指示每個(gè)用戶可選的對(duì)象或其它對(duì)象相對(duì)于節(jié)目的揚(yáng)聲器聲道內(nèi)容或其它元素的定時(shí)的時(shí)間碼或其它同步字。持久性元數(shù)據(jù)通常在從內(nèi)容創(chuàng)建設(shè)備到用戶界面的整個(gè)廣播鏈中、在節(jié)目廣播的整個(gè)持續(xù)時(shí)間內(nèi)或者甚至還在節(jié)目的再次廣播期間都被保持。在一些實(shí)施例中,至少一個(gè)用戶可選的對(duì)象的音頻內(nèi)容(及關(guān)聯(lián)的元數(shù)據(jù))在基于對(duì)象的音頻節(jié)目的主混合中發(fā)送,并且至少一些持久性元數(shù)據(jù)(例如,時(shí)間碼)以及可選地還有至少一個(gè)其它對(duì)象的音頻內(nèi)容(及關(guān)聯(lián)的元數(shù)據(jù))在節(jié)目的次混合中發(fā)送。在本發(fā)明的基于對(duì)象的音頻節(jié)目的一些實(shí)施例中,持久性對(duì)象相關(guān)元數(shù)據(jù)被用來(例如,甚至在節(jié)目廣播之后)保持用戶選擇的對(duì)象內(nèi)容和揚(yáng)聲器聲道內(nèi)容的混合。例如,每當(dāng)用戶觀看特定類型的節(jié)目(例如,任何足球比賽)或者每當(dāng)用戶觀看(任何類型的)任何節(jié)目時(shí),這可以將選定混合提供作為默認(rèn)混合,直到用戶改變他/她的選擇。例如,在第一節(jié)目的廣播期間,用戶可以采用(圖6系統(tǒng)中的)控制器23來選擇包括具有持久性ID的對(duì)象(例如,被控制器23的用戶界面識(shí)別為“主隊(duì)人群噪聲”對(duì)象的對(duì)象,其中持久性ID指示“主隊(duì)人群噪聲”)的混合。然后,每當(dāng)用戶觀看(和收聽)另一個(gè)節(jié)目(該另一個(gè)節(jié)目包括具有同一持久性ID的對(duì)象)時(shí),回放系統(tǒng)將自動(dòng)地渲染具有相同混合的節(jié)目(即,節(jié)目中的與節(jié)目的“主隊(duì)人群噪聲”對(duì)象聲道混合的床揚(yáng)聲器聲道和/或替換揚(yáng)聲器聲道),直到用戶改變混合選擇。在本發(fā)明的基于對(duì)象的音頻節(jié)目的一些實(shí)施例中,持久性對(duì)象相關(guān)數(shù)據(jù)可以使得對(duì)某些對(duì)象的渲染在整個(gè)節(jié)目期間都是強(qiáng)制性的(例如,盡管用戶期望廢棄這種渲染)。在一些實(shí)施例中,對(duì)象相關(guān)元數(shù)據(jù)利用默認(rèn)的渲染參數(shù)(例如,渲染對(duì)象的默認(rèn)空間位置)來提供對(duì)象內(nèi)容與揚(yáng)聲器聲道內(nèi)容的默認(rèn)混合。例如,在默認(rèn)的渲染參數(shù)的情況下,被輸入到圖6系統(tǒng)的子系統(tǒng)20的節(jié)目的對(duì)象相關(guān)元數(shù)據(jù)可以是對(duì)象內(nèi)容與揚(yáng)聲器聲道內(nèi)容的默認(rèn)混合,并且子系統(tǒng)22和24將使得以默認(rèn)混合和默認(rèn)的渲染參數(shù)來渲染節(jié)目,除非用戶采用控制器23來選擇對(duì)象內(nèi)容與揚(yáng)聲器聲道內(nèi)容的另一種混合和/或另一組渲染參數(shù)。在一些實(shí)施例中,對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))提供對(duì)象與揚(yáng)聲器聲道內(nèi)容的一組可選“預(yù)設(shè)”混合,每個(gè)預(yù)設(shè)混合具有一組預(yù)定的渲染參數(shù)(例如,渲染對(duì)象的空間位置)。這些預(yù)設(shè)混合可以由回放系統(tǒng)的用戶界面呈現(xiàn)為可用混合的有限菜單或選項(xiàng)板(例如,由圖6系統(tǒng)的控制器23顯示的有限菜單或選項(xiàng)板)。每個(gè)預(yù)設(shè)混合(和/或每個(gè)可選的對(duì)象)可以具有持久性ID(例如,名稱、標(biāo)簽或徽標(biāo))??刂破?3(或本發(fā)明的回放系統(tǒng)的另一實(shí)施例的控制器)可以被配置為顯示這種ID的指示(例如,在控制器23的iPad實(shí)現(xiàn)的觸摸屏上)。例如,可以存在具有持久性ID(例如,隊(duì)標(biāo))的可選“主隊(duì)”混合,而不管(例如,由廣播公司所作的)對(duì)預(yù)設(shè)混合的每個(gè)對(duì)象的音頻內(nèi)容或非持久性元數(shù)據(jù)的細(xì)節(jié)的變化。在一些實(shí)施例中,節(jié)目的對(duì)象相關(guān)元數(shù)據(jù)(或者不是由與節(jié)目一起傳送的元數(shù)據(jù)指示的回放或渲染系統(tǒng)的預(yù)配置)提供關(guān)于對(duì)象與床(揚(yáng)聲器聲道)的可選混合的約束或條件。例如,圖6系統(tǒng)的實(shí)現(xiàn)方式可以實(shí)現(xiàn)數(shù)字權(quán)限管理(DRM),并且更具體而言可以實(shí)現(xiàn)DRM層次結(jié)構(gòu),以允許圖6系統(tǒng)的用戶能夠“分層”訪問基于對(duì)象的音頻節(jié)目中所包括的一組音頻對(duì)象。如果用戶(例如,與回放系統(tǒng)關(guān)聯(lián)的消費(fèi)者)(例如,向廣播公司)支付更多的錢,則用戶可以有權(quán)解碼和選擇(并聽到)節(jié)目的更多音頻對(duì)象。對(duì)于另一個(gè)示例,對(duì)象相關(guān)元數(shù)據(jù)可以提供關(guān)于對(duì)象的用戶選擇的約束。這種約束的示例是:如果用戶采用控制器23選擇渲染節(jié)目的“主隊(duì)人群噪聲”對(duì)象和“主隊(duì)播音員”對(duì)象(即,用于包括在由圖6子系統(tǒng)24確定的混合中),則節(jié)目中所包括的元數(shù)據(jù)可以確保子系統(tǒng)24使這兩個(gè)選定對(duì)象以預(yù)定的相對(duì)空間位置渲染。約束可以(至少部分地)由關(guān)于回放系統(tǒng)的數(shù)據(jù)(例如,用戶輸入的數(shù)據(jù))確定。例如,如果回放系統(tǒng)是立體聲系統(tǒng)(只包括兩個(gè)揚(yáng)聲器),則圖6系統(tǒng)的對(duì)象處理子系統(tǒng)24(和/或控制器23)可以被配置為防止用戶選擇僅通過兩個(gè)揚(yáng)聲器不能以足夠空間分辨率渲染的混合(由對(duì)象相關(guān)元數(shù)據(jù)識(shí)別)。對(duì)于另一個(gè)示例,出于法律(例如,DRM)原因或者由對(duì)象相關(guān)元數(shù)據(jù)(和/或被輸入到回放系統(tǒng)的其它數(shù)據(jù))指示的其它原因(例如,基于傳送信道的帶寬),圖6系統(tǒng)的對(duì)象處理子系統(tǒng)24(和/或控制器23)可以從可選對(duì)象的類別中除去一些被傳送的對(duì)象。用戶可以為了更多的帶寬而向內(nèi)容創(chuàng)建者或廣播公司付費(fèi),并且作為結(jié)果,系統(tǒng)(例如,圖6系統(tǒng)的對(duì)象處理子系統(tǒng)24和/或控制器23)可以允許用戶從可選對(duì)象和/或?qū)ο?床混合的更大菜單中進(jìn)行選擇。本發(fā)明的一些實(shí)施例(例如,圖6中包括上述元件29和35的回放系統(tǒng)的實(shí)現(xiàn)方式)實(shí)現(xiàn)分布式渲染。例如,節(jié)目的默認(rèn)或選定對(duì)象聲道(以及對(duì)應(yīng)的對(duì)象相關(guān)元數(shù)據(jù))(與經(jīng)解碼的揚(yáng)聲器聲道,例如,一組選定的床揚(yáng)聲器聲道和替換揚(yáng)聲器聲道,一起)從機(jī)頂設(shè)備(例如,從圖6系統(tǒng)的實(shí)現(xiàn)的子系統(tǒng)22和29)傳遞到下游設(shè)備(例如,圖6的子系統(tǒng)35,在實(shí)現(xiàn)了子系統(tǒng)22和29的機(jī)頂設(shè)備(STB)下游的AVR或條形音箱中實(shí)現(xiàn))。下游設(shè)備被配置為渲染對(duì)象聲道與揚(yáng)聲器聲道的混合。STB可以部分地渲染音頻,并且下游設(shè)備可以完成渲染(例如,通過生成用于驅(qū)動(dòng)特定頂層的揚(yáng)聲器(例如,天花板揚(yáng)聲器)的揚(yáng)聲器饋送,以便把音頻對(duì)象布置在特定的明顯源位置,其中STB的輸出僅僅指示對(duì)象可以在某些未指定的頂層揚(yáng)聲器中以某種未指定的方式渲染)。例如,STB可以不知道回放系統(tǒng)的揚(yáng)聲器的具體組織,但是下游設(shè)備(例如,AVR或條形音箱)可以知道這些。在一些實(shí)施例中,基于對(duì)象的音頻節(jié)目(例如,被輸入到圖6系統(tǒng)的子系統(tǒng)20或者圖7系統(tǒng)的元件50、51和53的節(jié)目)是或者包括至少一個(gè)AC-3(E-AC-3)比特流,并且包括對(duì)象聲道內(nèi)容(和/或包括條件渲染元數(shù)據(jù)的對(duì)象相關(guān)元數(shù)據(jù))的節(jié)目的每個(gè)容器被包括在比特流的幀尾處的auxdata字段(例如,圖1或圖4中所示的AUX片段)中。在一些這種實(shí)施例中,AC-3或E-AC-3比特流的每一幀包括一個(gè)或兩個(gè)元數(shù)據(jù)容器。一個(gè)容器可以被包括在幀的Aux字段中,而另一個(gè)容器可以被包括在幀的addbsi字段中。每個(gè)容器具有核心頭部并且包括(或關(guān)聯(lián))一個(gè)或更多個(gè)有效載荷。(Aux字段中所包括的容器的或者與其關(guān)聯(lián)的)一個(gè)這種有效載荷可以是本發(fā)明的(與同樣由節(jié)目指示的一床揚(yáng)聲器聲道有關(guān)的)一個(gè)或更多個(gè)對(duì)象聲道中的每一個(gè)對(duì)象聲道的一組音頻樣本和與每個(gè)對(duì)象聲道關(guān)聯(lián)的對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))。每個(gè)容器的核心頭部通常包括:至少一個(gè)ID值,該ID值指示該容器所包括或關(guān)聯(lián)的有效載荷的類型;子流關(guān)聯(lián)指示(指示核心頭部與哪些子流關(guān)聯(lián));以及保護(hù)比特。典型地,每個(gè)有效載荷有其自己的頭部(或者“有效載荷標(biāo)識(shí)符”)。對(duì)象級(jí)的元數(shù)據(jù)可以在作為對(duì)象聲道的每個(gè)子流中攜帶。在其它實(shí)施例中,基于對(duì)象的音頻節(jié)目(例如,被輸入到圖6系統(tǒng)的子系統(tǒng)20或者圖7系統(tǒng)的元件50、51和53的節(jié)目)是或者包括非AC-3比特流或非E-AC-3比特流的比特流。在一些實(shí)施例中,基于對(duì)象的音頻節(jié)目是或者包括至少一個(gè)杜比E比特流,并且節(jié)目的對(duì)象聲道內(nèi)容和對(duì)象相關(guān)元數(shù)據(jù)(例如,節(jié)目的包括對(duì)象聲道內(nèi)容和包括條件渲染元數(shù)據(jù)的對(duì)象相關(guān)元數(shù)據(jù)的每個(gè)容器)被包括在杜比E比特流的一般不攜帶有用信息的的比特位置中。杜比E比特流的每個(gè)突發(fā)占用相當(dāng)于對(duì)應(yīng)視頻幀的時(shí)間段。對(duì)象聲道(和對(duì)象相關(guān)元數(shù)據(jù))可以被包括在杜比E突發(fā)之間的保護(hù)帶中和/或每個(gè)杜比E突發(fā)內(nèi)的每個(gè)數(shù)據(jù)結(jié)構(gòu)(各具有AES3幀的格式)中的未用比特位置中。例如,每個(gè)保護(hù)帶包含一系列片段(例如,100個(gè)片段),每個(gè)保護(hù)帶的前X個(gè)片段(例如,X=20)中的每個(gè)片段包括對(duì)象聲道和對(duì)象相關(guān)元數(shù)據(jù),并且所述每個(gè)保護(hù)帶的剩余片段中的每一個(gè)可以包括保護(hù)帶符號(hào)。在一些實(shí)施例中,本發(fā)明的節(jié)目的至少一些對(duì)象聲道(和/或包括條件渲染元數(shù)據(jù)的對(duì)象相關(guān)元數(shù)據(jù))被包括在杜比E比特流的至少一些AES3幀中的每一個(gè)的兩個(gè)AES3子幀中的每一個(gè)的四個(gè)最低有效位(LSB)中,并且指示節(jié)目的揚(yáng)聲器聲道的數(shù)據(jù)被包括在比特流的每個(gè)AES3幀的兩個(gè)AES3子幀中的每一個(gè)的20個(gè)最高有效位(MSB)中。在一些實(shí)施例中,本發(fā)明的節(jié)目的對(duì)象聲道和對(duì)象相關(guān)元數(shù)據(jù)被包括在杜比E比特流中的元數(shù)據(jù)容器中。每個(gè)容器具有核心頭部并且包括一個(gè)或更多個(gè)有效載荷(或者與其關(guān)聯(lián))。(Aux字段中所包括的容器的或者與其關(guān)聯(lián)的)一個(gè)這種有效載荷可以是本發(fā)明的(例如,與同樣由節(jié)目指示的一床揚(yáng)聲器聲道有關(guān)的)一個(gè)或更多個(gè)對(duì)象聲道中的每一個(gè)的一組音頻樣本和與每個(gè)對(duì)象聲道關(guān)聯(lián)的對(duì)象相關(guān)元數(shù)據(jù)。每個(gè)容器的核心頭部通常包括:至少一個(gè)ID值,該ID值指示該容器中所包括或關(guān)聯(lián)的有效載荷的類型;子流關(guān)聯(lián)指示(指示核心頭部與哪些子流關(guān)聯(lián));以及保護(hù)比特。典型地,每個(gè)有效載荷有其自己的頭部(或者“有效載荷標(biāo)識(shí)符”)。對(duì)象級(jí)的元數(shù)據(jù)可以在作為對(duì)象聲道的每個(gè)子流中攜帶。在一些實(shí)施例中,基于對(duì)象的音頻節(jié)目(例如,被輸入到圖6系統(tǒng)的子系統(tǒng)20或者圖7系統(tǒng)的元件50、51和53的節(jié)目)能夠由(未被配置為解析本發(fā)明的對(duì)象聲道和對(duì)象相關(guān)元數(shù)據(jù)的)傳統(tǒng)解碼器和傳統(tǒng)渲染系統(tǒng)解碼,并且其揚(yáng)聲器聲道內(nèi)容可由傳統(tǒng)解碼器和傳統(tǒng)渲染系統(tǒng)渲染。相同的節(jié)目可以根據(jù)本發(fā)明的一些實(shí)施例由(根據(jù)本發(fā)明的實(shí)施例)被配置為解析本發(fā)明的對(duì)象聲道和對(duì)象相關(guān)元數(shù)據(jù)并且渲染由節(jié)目指示的對(duì)象聲道內(nèi)容與揚(yáng)聲器聲道的混合的機(jī)頂設(shè)備(或者其它解碼和渲染系統(tǒng))渲染。本發(fā)明的一些實(shí)施例意圖響應(yīng)于廣播節(jié)目來為終端消費(fèi)者提供個(gè)性化的(并且優(yōu)選地是沉浸式的)音頻體驗(yàn),和/或提供用于在廣播流水線中使用元數(shù)據(jù)的新方法。一些實(shí)施例改善了麥克風(fēng)捕捉(例如,體育場(chǎng)麥克風(fēng)捕捉),以生成為最終消費(fèi)者提供更加個(gè)性化和沉浸式體驗(yàn)的音頻節(jié)目,修改現(xiàn)有的制作、捐資和分發(fā)工作流,以允許本發(fā)明的基于對(duì)象的音頻節(jié)目的對(duì)象聲道和元數(shù)據(jù)流過專業(yè)鏈,并且創(chuàng)建支持對(duì)象聲道、替換揚(yáng)聲器聲道和相關(guān)元數(shù)據(jù)以及常規(guī)廣播音頻(例如,本發(fā)明的廣播音頻節(jié)目的實(shí)施例中所包括的揚(yáng)聲器聲道床)的新回放流水線(例如,在機(jī)頂設(shè)備中實(shí)現(xiàn)的回放流水線)。圖8是根據(jù)本發(fā)明實(shí)施例的基于對(duì)象的被配置為生成音頻節(jié)目(和對(duì)應(yīng)的視頻節(jié)目)的用于廣播的廣播系統(tǒng)的框圖。圖8系統(tǒng)的包括麥克風(fēng)100、101、102和103的一組X個(gè)麥克風(fēng)(其中X是整數(shù))被定位成捕捉要包括在節(jié)目中的音頻內(nèi)容,并且它們的輸出耦接到音頻控制臺(tái)104的輸入。在一類實(shí)施例中,節(jié)目包括指示觀賞型賽事(例如,足球或橄欖球賽、汽車或摩托車比賽、或其它體育賽事)的氣氛和/或?qū)τ^賞型賽事的現(xiàn)場(chǎng)解說的交互式音頻內(nèi)容。在一些實(shí)施例中,節(jié)目的音頻內(nèi)容指示多個(gè)音頻對(duì)象(包括用戶可選的對(duì)象或?qū)ο蠼M,并且通常還有要在不存在用戶對(duì)對(duì)象的選擇的情況下渲染的默認(rèn)對(duì)象組)、一床揚(yáng)聲器聲道(指示所捕捉的內(nèi)容的默認(rèn)混合)和替換揚(yáng)聲器聲道。揚(yáng)聲器聲道床可以是可能被包括在不包括對(duì)象聲道的常規(guī)廣播節(jié)目中的一類揚(yáng)聲器聲道的常規(guī)混合(例如,5.1聲道混合)。在其它實(shí)施例中,根據(jù)本發(fā)明而生成或渲染的基于對(duì)象的音頻節(jié)目指示“人造的”(例如,數(shù)字化創(chuàng)建的)內(nèi)容,而非所捕捉的音頻內(nèi)容或者加上所捕捉的音頻內(nèi)容。例如,該內(nèi)容可以由非現(xiàn)場(chǎng)的(后期制作的)內(nèi)容(例如,合成音頻)組成或者可以包括非現(xiàn)場(chǎng)的內(nèi)容。麥克風(fēng)的子集(例如,麥克風(fēng)100和101并且可選地還有其輸出耦接到音頻控制臺(tái)104的其它麥克風(fēng))是在操作中捕捉(要作為一床揚(yáng)聲器聲道和一組替換揚(yáng)聲器聲道被編碼和傳送的)音頻的常規(guī)麥克風(fēng)陣列。在操作中,麥克風(fēng)的另一子集(例如,麥克風(fēng)102和103以及可選地還有輸出被耦接到音頻控制臺(tái)104的其它麥克風(fēng))捕捉要作為節(jié)目的對(duì)象聲道被編碼和傳送的音頻(例如,人群噪聲和/或其它“對(duì)象”)。例如,圖8系統(tǒng)的麥克風(fēng)陣列可以包括:被實(shí)現(xiàn)為聲場(chǎng)麥克風(fēng)并且永久性地安裝在體育場(chǎng)中的至少一個(gè)麥克風(fēng)(例如,麥克風(fēng)100)(例如,具有隨其安裝的加熱器的聲場(chǎng)麥克風(fēng));指向支持一個(gè)隊(duì)(例如,主隊(duì))的觀眾的至少一個(gè)立體聲麥克風(fēng)(例如,麥克風(fēng)102,被實(shí)現(xiàn)為SennheiserMKH416麥克風(fēng)或者另一種立體聲麥克風(fēng)),以及指向支持另一個(gè)隊(duì)(例如,客隊(duì))的觀眾的至少一個(gè)其它立體聲麥克風(fēng)(例如,麥克風(fēng)103,被實(shí)現(xiàn)為SennheiserMKH416麥克風(fēng)或者另一種立體聲麥克風(fēng))。本發(fā)明的廣播系統(tǒng)可以包括位于體育場(chǎng)(或其它賽事位置)外面的移動(dòng)單元(可以是卡車,有時(shí)被稱為“比賽卡車”),該移動(dòng)單元是來自體育場(chǎng)(或其它賽事位置)中的麥克風(fēng)的音頻饋送的第一個(gè)接收者。比賽卡車生成(要廣播的)基于對(duì)象的音頻節(jié)目,包括通過編碼來自麥克風(fēng)的音頻內(nèi)容以便傳送作為節(jié)目的對(duì)象聲道、生成相應(yīng)的條件渲染元數(shù)據(jù)和其他對(duì)象相關(guān)元數(shù)據(jù)(例如,指示在每個(gè)允許的下混中每個(gè)對(duì)象應(yīng)當(dāng)被渲染的空間位置的元數(shù)據(jù))并將這種元數(shù)據(jù)包括在節(jié)目中、以及編碼來自一些麥克風(fēng)的音頻內(nèi)容以便傳送作為節(jié)目的一床揚(yáng)聲器聲道(和一組替換揚(yáng)聲器聲道)。例如,在圖8的系統(tǒng)中,(耦接到控制臺(tái)104的輸出的)對(duì)象處理子系統(tǒng)106、嵌入子系統(tǒng)108以及貢獻(xiàn)編碼器(contributionencoder)111可以安裝在比賽卡車中。在子系統(tǒng)106中生成的基于對(duì)象的音頻節(jié)目可以(例如,在子系統(tǒng)108中)與(例如,來自位于體育場(chǎng)中的攝像機(jī)的)視頻內(nèi)容組合,以生成隨后(例如,被編碼器110)編碼的組合音視頻信號(hào),由此生成用于(例如,通過圖5的傳送子系統(tǒng)5)廣播的編碼音頻/視頻信號(hào)。應(yīng)當(dāng)理解,解碼和渲染這種編碼音頻/視頻信號(hào)的回放系統(tǒng)將包括用于解析所傳送的音頻/視頻信號(hào)中的音頻內(nèi)容和視頻內(nèi)容的子系統(tǒng)(圖中未具體示出)、用于根據(jù)本發(fā)明的實(shí)施例來解碼并渲染音頻內(nèi)容的子系統(tǒng)(例如,與圖6系統(tǒng)類似或完全相同的子系統(tǒng))、以及用于解碼和渲染視頻內(nèi)容的另一子系統(tǒng)(圖中未具體示出)??刂婆_(tái)104的音頻輸出可以包括:5.1揚(yáng)聲器聲道床(在圖8中標(biāo)記為“5.1中立”),指示在體育賽事上捕捉到的環(huán)境聲音和被混合到其中央聲道中的播音員的現(xiàn)場(chǎng)解說(非環(huán)境內(nèi)容)的默認(rèn)混合;替換揚(yáng)聲器聲道(在圖8中標(biāo)記為“1.0替換”),指示沒有現(xiàn)場(chǎng)解說的床中的中央聲道的環(huán)境內(nèi)容(即,在與現(xiàn)場(chǎng)解說混合以生成床中央聲道之前,所捕捉的床中央聲道的環(huán)境聲音內(nèi)容);指示來自在該賽事現(xiàn)場(chǎng)的主隊(duì)粉絲的人群噪聲的立體聲對(duì)象聲道的音頻內(nèi)容(標(biāo)記為“2.0主隊(duì)”);指示來自在該賽事現(xiàn)場(chǎng)的客隊(duì)粉絲的人群噪聲的立體聲對(duì)象聲道的音頻內(nèi)容(標(biāo)記為“2.0客隊(duì)”);指示來自主隊(duì)城市的播音員的現(xiàn)場(chǎng)解說的對(duì)象聲道音頻內(nèi)容(標(biāo)記為“1.0現(xiàn)場(chǎng)解說1”);指示來自客隊(duì)城市的播音員的現(xiàn)場(chǎng)解說的對(duì)象聲道音頻內(nèi)容(標(biāo)記為“1.0現(xiàn)場(chǎng)解說2”)、以及指示比賽用球在被體育賽事參與者撞擊時(shí)產(chǎn)生的聲音的對(duì)象聲道音頻內(nèi)容(標(biāo)記為“1.0擊球”)。對(duì)象處理子系統(tǒng)106被配置為把來自控制臺(tái)104的音頻流組織(例如,分組)為對(duì)象聲道(例如,把標(biāo)記為“2.0客隊(duì)”的左和右音頻流分組為客隊(duì)人群噪聲聲道)和/或?qū)ο舐暤澜M,以生成指示對(duì)象聲道(和/或?qū)ο舐暤澜M)的對(duì)象相關(guān)元數(shù)據(jù),并且把對(duì)象聲道(和/或?qū)ο舐暤澜M)、對(duì)象相關(guān)元數(shù)據(jù)、(根據(jù)來自控制臺(tái)104的音頻流確定的)揚(yáng)聲器聲道床和每個(gè)替換揚(yáng)聲器聲道編碼為基于對(duì)象的音頻節(jié)目(例如,被編碼為杜比E比特流的基于對(duì)象的音頻節(jié)目)。同樣典型地,子系統(tǒng)106被配置為至少渲染(并在工作室監(jiān)控?fù)P聲器上播放)對(duì)象聲道(和/或?qū)ο舐暤澜M)的選定子集和揚(yáng)聲器聲道床和/或替換揚(yáng)聲器聲道(包括通過使用對(duì)象相關(guān)元數(shù)據(jù)來生成指示所選擇的對(duì)象聲道與揚(yáng)聲器聲道的混合),使得回放的聲音可以由子系統(tǒng)106和控制臺(tái)104的操作員監(jiān)控(如由圖8的“監(jiān)控路徑”指示的)。子系統(tǒng)104的輸出與子系統(tǒng)106的輸出之間的接口可以是多聲道音頻數(shù)字接口(“MADI”)。在操作中,圖8系統(tǒng)的子系統(tǒng)108使在子系統(tǒng)106中生成的基于對(duì)象的音頻節(jié)目與(例如,來自位于體育場(chǎng)中的攝像機(jī)的)視頻內(nèi)容組合,以生成向編碼器110斷言的組合音視頻信號(hào)。子系統(tǒng)108的輸出與子系統(tǒng)110的輸入之間的接口可以是高清晰度串行數(shù)字接口(“HD-SDI”)。在操作中,編碼器110對(duì)子系統(tǒng)108的輸出進(jìn)行編碼,由此生成用于(例如,通過圖5的傳送子系統(tǒng)5)廣播的編碼音頻/視頻信號(hào)。在一些實(shí)施例中,廣播設(shè)備(例如,圖8系統(tǒng)的子系統(tǒng)106、108和110)被配置為生成指示所捕捉的聲音的多個(gè)基于對(duì)象的音頻節(jié)目(例如,由從圖8的子系統(tǒng)110輸出的多個(gè)編碼音頻/視頻信號(hào)指示的基于對(duì)象的音頻節(jié)目)。這種基于對(duì)象的音頻節(jié)目的示例包括5.1扁平混合、國際混合和國內(nèi)混合。例如,所有節(jié)目可以包括一床公共揚(yáng)聲器聲道(和一組公共的替換揚(yáng)聲器聲道),但是節(jié)目的對(duì)象聲道(和/或由節(jié)目確定的可選對(duì)象聲道的菜單、和/或用于渲染并混合對(duì)象的可選或不可選的渲染參數(shù))可以因節(jié)目而有所不同。在一些實(shí)施例中,廣播公司或其它內(nèi)容創(chuàng)建者的設(shè)備(例如,圖8系統(tǒng)的子系統(tǒng)106、108和110)被配置為生成可以在各種不同回放環(huán)境(例如,5.1聲道國內(nèi)回放系統(tǒng)、5.1聲道國際回放系統(tǒng)以及立體聲回放系統(tǒng))中的任何一種中渲染的單個(gè)基于對(duì)象的音頻節(jié)目(即,原版(master))。原版不需要被混合(例如,下混)以便向任何特定環(huán)境中的消費(fèi)者廣播。如上所述,在本發(fā)明的一些實(shí)施例中,節(jié)目的對(duì)象相關(guān)元數(shù)據(jù)(或者不是由與節(jié)目一起傳送的元數(shù)據(jù)指示的回放或渲染系統(tǒng)的預(yù)配置)提供了關(guān)于對(duì)象與揚(yáng)聲器聲道內(nèi)容的可選混合的約束或條件。例如,圖6系統(tǒng)的實(shí)現(xiàn)方式可以實(shí)現(xiàn)DRM層次,以允許用戶能夠分層訪問基于對(duì)象的音頻節(jié)目中所包括的一組對(duì)象聲道。如果用戶(例如,向廣播公司)支付更多的錢,則用戶可以有權(quán)解碼、選擇并渲染節(jié)目的更多對(duì)象聲道。將參照?qǐng)D9來描述關(guān)于對(duì)象(或?qū)ο蠼M)的用戶選擇的約束和條件的示例。在圖9中,節(jié)目“P0”包括七個(gè)對(duì)象聲道:指示中立人群噪聲的對(duì)象聲道“N0”、指示主隊(duì)人群噪聲的對(duì)象聲道“N1”、指示客隊(duì)噪聲的對(duì)象聲道“N2”、指示賽事官方現(xiàn)場(chǎng)解說(例如,由商業(yè)廣播播音員進(jìn)行的廣播現(xiàn)場(chǎng)解說)的對(duì)象聲道“N3”、指示賽事粉絲現(xiàn)場(chǎng)解說的對(duì)象聲道“N4”、指示賽事上的公告的對(duì)象聲道“NS”以及指示(經(jīng)由文本至語音系統(tǒng)轉(zhuǎn)換的)關(guān)于賽事的進(jìn)入twitter連接的對(duì)象聲道“N6”。指示節(jié)目P0中所包括的元數(shù)據(jù)的默認(rèn)值指示(默認(rèn)地)要包括在由節(jié)目指示的對(duì)象聲道內(nèi)容與“床”揚(yáng)聲器聲道內(nèi)容的渲染混合中的默認(rèn)對(duì)象組(一個(gè)或更多個(gè)“默認(rèn)”對(duì)象)和默認(rèn)渲染參數(shù)組(例如,默認(rèn)對(duì)象組中的每個(gè)默認(rèn)對(duì)象的空間位置)。例如,默認(rèn)對(duì)象組可以是以發(fā)散方式渲染(例如,使得不被感知為從任何特定的源位置發(fā)出)的對(duì)象聲道“N0”(指示中立人群噪聲)與被渲染為使得被感知為從位于聽者正前方的源位置(即,關(guān)于聽者為0度方位角)發(fā)出的對(duì)象聲道“N3”(指示官方現(xiàn)場(chǎng)解說)的混合。(圖9的)節(jié)目P0還包括指示多組用戶可選的預(yù)設(shè)混合的元數(shù)據(jù),其中每個(gè)預(yù)設(shè)混合由節(jié)目的對(duì)象聲道的子集和對(duì)應(yīng)的渲染參數(shù)組確定。所述用戶可選的預(yù)設(shè)混合可以被呈現(xiàn)為回放系統(tǒng)的控制器的用戶界面上的菜單(例如,由圖6系統(tǒng)的控制器23顯示的菜單)。例如,一個(gè)這種預(yù)設(shè)混合是圖9的對(duì)象聲道“N0”(指示中立人群噪聲)、對(duì)象聲道“N1”(指示主隊(duì)噪聲)和對(duì)象聲道“N4”(指示粉絲現(xiàn)場(chǎng)解說)的混合,這些對(duì)象聲道被渲染為使得混合中的聲道N0和N1內(nèi)容被感知為從聽者正后方的源位置發(fā)出(即,關(guān)于聽者為180度的方位角),其中混合中的聲道N1內(nèi)容的水平比混合中的聲道N0的水平小3dB,并且混合中的聲道N4內(nèi)容是以發(fā)散的方式渲染的(例如,以便不被感知為從任何特定的源位置發(fā)出)。回放系統(tǒng)可以實(shí)現(xiàn)這樣的規(guī)則(例如,在圖9中指示的分組規(guī)則“G”,其由節(jié)目的元數(shù)據(jù)確定):包括對(duì)象聲道N0、N1和N2中的至少一個(gè)的每個(gè)用戶可選的預(yù)設(shè)混合必須單獨(dú)包括對(duì)象聲道N0內(nèi)容,或者包括與對(duì)象聲道N1和N2中的至少一個(gè)的內(nèi)容混合的對(duì)象聲道N0內(nèi)容。回放系統(tǒng)還可以實(shí)現(xiàn)這樣的規(guī)則(例如,在圖9中指示的條件規(guī)則“C1”,其由節(jié)目的元數(shù)據(jù)確定):包括與對(duì)象聲道N1和N2中的至少一個(gè)的內(nèi)容混合的對(duì)象聲道N0內(nèi)容的每個(gè)用戶可選的預(yù)設(shè)混合必須包括與對(duì)象聲道N1內(nèi)容混合的對(duì)象聲道N0內(nèi)容,或者必須包括與對(duì)象聲道N2內(nèi)容混合的對(duì)象聲道N0內(nèi)容?;胤畔到y(tǒng)還可以實(shí)現(xiàn)這樣的規(guī)則(例如,在圖9中指示的條件規(guī)則“C2”,其由節(jié)目的元數(shù)據(jù)確定):包括對(duì)象聲道N3和N4中的至少一個(gè)的內(nèi)容的每個(gè)用戶可選的預(yù)設(shè)混合必須單獨(dú)包括對(duì)象聲道N3的內(nèi)容,或者必須單獨(dú)包括對(duì)象聲道N4的內(nèi)容。本發(fā)明的一些實(shí)施例實(shí)現(xiàn)了基于對(duì)象的音頻節(jié)目的對(duì)象聲道的條件解碼(conditionaldecoding)(和/或渲染)。例如,回放系統(tǒng)可以被配置為允許基于隨節(jié)目一起提供的條件渲染元數(shù)據(jù)和指示回放揚(yáng)聲器陣列配置的數(shù)據(jù)以及可選地還有用戶的權(quán)限來?xiàng)l件解碼對(duì)象聲道。例如,如果實(shí)現(xiàn)了DRM層次以允許消費(fèi)者“分層”訪問基于對(duì)象的音頻節(jié)目中所包括的一組音頻對(duì)象聲道,則回放系統(tǒng)可以(通過節(jié)目的元數(shù)據(jù)中所包括的控制位)被自動(dòng)配置為阻止對(duì)于渲染一些對(duì)象的解碼和選擇,除非回放系統(tǒng)被通知用戶已經(jīng)滿足至少一個(gè)條件(例如,向內(nèi)容提供者支付了特定數(shù)量的錢)。例如,用戶可能需要購買權(quán)限來收聽圖9中的節(jié)目P0的“官方現(xiàn)場(chǎng)解說”對(duì)象聲道N3,并且回放系統(tǒng)可以實(shí)現(xiàn)圖9中指示的條件規(guī)則“C2”,使得除非回放系統(tǒng)被通知回放系統(tǒng)的用戶已購買必要的權(quán)限,否則對(duì)象聲道N3不能被選擇。對(duì)于另一個(gè)示例,回放系統(tǒng)可以(通過節(jié)目的元數(shù)據(jù)中所包括的、指示可用回放揚(yáng)聲器陣列的特定配置的控制位)被自動(dòng)配置為如果回放揚(yáng)聲器陣列配置不滿足條件,則阻止解碼和選擇(以便將其包括在要渲染的節(jié)目內(nèi)容的下混中)一些對(duì)象(例如,回放系統(tǒng)可以實(shí)現(xiàn)圖9中所指示的條件規(guī)則“C1”,使得對(duì)象聲道N0和N1的預(yù)設(shè)混合不能被選擇,除非回放系統(tǒng)被通知5.1揚(yáng)聲器陣列可用于渲染所選定的內(nèi)容,但是如果唯一可用的揚(yáng)聲器陣列是2.0揚(yáng)聲器陣列則不然)。在一些實(shí)施例中,本發(fā)明實(shí)現(xiàn)基于規(guī)則的對(duì)象聲道選擇,其中至少一個(gè)預(yù)定規(guī)則確定要渲染基于對(duì)象的音頻節(jié)目的哪些對(duì)象聲道(例如,與揚(yáng)聲器聲道床一起)。用戶還可以指定用于對(duì)象聲道選擇的至少一個(gè)規(guī)則(例如,通過從由回放系統(tǒng)控制器的用戶界面呈現(xiàn)的可用規(guī)則的菜單中進(jìn)行選擇),并且回放系統(tǒng)(例如,圖6系統(tǒng)的對(duì)象處理子系統(tǒng)22)可以被配置為應(yīng)用每個(gè)這種規(guī)則來確定要渲染的基于對(duì)象的音頻節(jié)目的哪些對(duì)象聲道應(yīng)當(dāng)被包括在要(例如,由圖6系統(tǒng)的子系統(tǒng)24、或者子系統(tǒng)24和35)渲染的混合中。(例如,給定回放揚(yáng)聲器陣列的配置),回放系統(tǒng)可以根據(jù)節(jié)目中的對(duì)象相關(guān)元數(shù)據(jù)(例如,條件渲染元數(shù)據(jù))來確定節(jié)目的哪些對(duì)象聲道滿足預(yù)定的規(guī)則。對(duì)于簡單的示例,考慮基于對(duì)象的音頻節(jié)目指示體育賽事的情況。代替操縱控制器(例如,圖6的控制器23)來執(zhí)行對(duì)節(jié)目中所包括的特定對(duì)象組的靜態(tài)選擇(例如,來自特定球隊(duì)、汽車或自行車的電臺(tái)解說),用戶操縱控制器來設(shè)置規(guī)則(例如,為了渲染而自動(dòng)選擇指示什么球隊(duì)、或汽車或自行車獲勝或處于第一位置的對(duì)象聲道)?;胤畔到y(tǒng)應(yīng)用該規(guī)則來(在單個(gè)節(jié)目或者一系列不同節(jié)目的渲染期間)實(shí)現(xiàn)對(duì)節(jié)目中包括的對(duì)象(對(duì)象聲道)的一系列不同子集的動(dòng)態(tài)選擇(例如,指示一個(gè)隊(duì)的第一對(duì)象子集,當(dāng)發(fā)生第二個(gè)隊(duì)得分并因此變成當(dāng)前獲勝隊(duì)時(shí),后面自動(dòng)變?yōu)橹甘镜诙€(gè)隊(duì)的第二對(duì)象子集)。因此,在一些此類實(shí)施例中,實(shí)時(shí)事件支配或影響哪些對(duì)象聲道被包括在所渲染的混合中。回放系統(tǒng)(例如,圖6系統(tǒng)的對(duì)象處理子系統(tǒng)22)可以對(duì)節(jié)目中所包括的元數(shù)據(jù)(例如,指示出至少一個(gè)對(duì)應(yīng)對(duì)象指示當(dāng)前獲勝隊(duì)的元數(shù)據(jù),例如,指示該隊(duì)粉絲的人群噪聲或者與獲勝隊(duì)關(guān)聯(lián)的電臺(tái)播音員的現(xiàn)場(chǎng)解說)作出響應(yīng),以選擇哪些對(duì)象聲道應(yīng)當(dāng)被包括在要渲染的揚(yáng)聲器與對(duì)象聲道的混合中。例如,內(nèi)容創(chuàng)建者可以(在基于對(duì)象的音頻節(jié)目中)包括指示節(jié)目的至少一些音頻對(duì)象聲道中的每一個(gè)的位置次序(或其它層次)(例如,指示哪些對(duì)象聲道對(duì)應(yīng)于當(dāng)前處于第一位置的隊(duì)或汽車,哪些對(duì)象聲道對(duì)應(yīng)于當(dāng)前處于第二位置的隊(duì)或汽車,等等)的元數(shù)據(jù)?;胤畔到y(tǒng)可被配置為通過僅選擇和渲染滿足用戶指定的規(guī)則的對(duì)象聲道(例如,由節(jié)目的對(duì)象相關(guān)元數(shù)據(jù)指示的與處于第“n”位的隊(duì)有關(guān)的對(duì)象聲道)來對(duì)這種元數(shù)據(jù)作出響應(yīng)。關(guān)于本發(fā)明的基于對(duì)象的音頻節(jié)目的對(duì)象聲道的對(duì)象相關(guān)元數(shù)據(jù)的示例包括(但不限于):指示關(guān)于如何渲染對(duì)象聲道的詳細(xì)信息的條件渲染元數(shù)據(jù)或其他元數(shù)據(jù);動(dòng)態(tài)時(shí)間元數(shù)據(jù)(例如,指示用于搖攝對(duì)象的軌跡、對(duì)象尺寸、增益等等);以及被AVR(或者在本發(fā)明的系統(tǒng)的一些實(shí)現(xiàn)方式的解碼和對(duì)象處理子系統(tǒng)下游的其它設(shè)備或系統(tǒng))用來渲染對(duì)象聲道(例如,在知曉可用回放揚(yáng)聲器陣列的配置的情況下)的元數(shù)據(jù)。這種元數(shù)據(jù)可以指定對(duì)于對(duì)象位置、增益、靜音或其它渲染參數(shù)的約束、和/或?qū)τ趯?duì)象如何與其它對(duì)象交互的約束(例如,假定選擇了特定的對(duì)象,關(guān)于可以選擇哪些附加對(duì)象的約束),并且/或者可以指定默認(rèn)對(duì)象和/或默認(rèn)渲染參數(shù)(在不存在對(duì)其它對(duì)象和/或渲染參數(shù)的用戶選擇的情況下使用)。在一些實(shí)施例中,本發(fā)明的基于對(duì)象的音頻節(jié)目的至少一些對(duì)象相關(guān)元數(shù)據(jù)(以及可選地還有至少一些對(duì)象聲道)在單獨(dú)的比特流或其它容器(例如,作為用戶可能需要額外付費(fèi)來接收和/或使用的次混合)中從節(jié)目的揚(yáng)聲器聲道床和常規(guī)元數(shù)據(jù)發(fā)送。在不訪問這種對(duì)象相關(guān)元數(shù)據(jù)(或者對(duì)象相關(guān)元數(shù)據(jù)和對(duì)象聲道)的情況下,用戶可以解碼和渲染揚(yáng)聲器聲道床,但是不能選擇節(jié)目的音頻對(duì)象并且不能渲染該節(jié)目的與揚(yáng)聲器聲道床指示的音頻的混合中的音頻對(duì)象。本發(fā)明的基于對(duì)象的音頻節(jié)目的每一幀可以包括多個(gè)對(duì)象聲道的音頻內(nèi)容和對(duì)應(yīng)的對(duì)象相關(guān)元數(shù)據(jù)。根據(jù)本發(fā)明一些實(shí)施例生成的(或者發(fā)送、存儲(chǔ)、緩沖、解碼、渲染或以其它方式處理的)基于對(duì)象的音頻節(jié)目包括揚(yáng)聲器聲道、至少一個(gè)對(duì)象聲道、以及指示分層圖(有時(shí)被稱為分層的“混合圖”)的元數(shù)據(jù)(包括條件渲染元數(shù)據(jù)),所述分層圖指示揚(yáng)聲器聲道與對(duì)象聲道的可選混合(例如,所有可選下混)。例如,混合圖指示可適用于選擇揚(yáng)聲器和對(duì)象聲道的子集的每個(gè)規(guī)則。典型地,編碼音頻比特流指示節(jié)目的至少一些(即,至少一部分)音頻內(nèi)容(例如,一床揚(yáng)聲器聲道和節(jié)目的至少一些對(duì)象聲道)和對(duì)象相關(guān)元數(shù)據(jù)(包括指示混合圖的元數(shù)據(jù)),以及可選地至少一個(gè)附加的編碼音頻比特流或文件指示節(jié)目的一些音頻內(nèi)容和/或?qū)ο笙嚓P(guān)元數(shù)據(jù)。所述分層的混合圖指示節(jié)點(diǎn)(每個(gè)節(jié)點(diǎn)可以指示可選的聲道或聲道組,或一類可選的聲道或聲道組)和節(jié)點(diǎn)之間的連接(例如,到節(jié)點(diǎn)的控制接口和/或用于選擇聲道的規(guī)則),并且包括基本數(shù)據(jù)(“基本”層)和可選的(即,可選地被省略的)數(shù)據(jù)(至少一個(gè)“擴(kuò)展”層)。典型地,分層的混合圖被包括在指示節(jié)目的編碼音頻比特流之一中,并且可以通過(由回放系統(tǒng)實(shí)現(xiàn)的,例如,終端用戶的回放系統(tǒng))圖遍歷進(jìn)行評(píng)估,以確定聲道的默認(rèn)混合和用于修改默認(rèn)混合的選項(xiàng)。當(dāng)混合圖可被表示為樹圖時(shí),基本層可以是該樹圖的樹枝(或者兩個(gè)或更多個(gè)樹枝),并且每個(gè)擴(kuò)展層可以是該樹圖的另一個(gè)樹枝(或者另一組兩個(gè)或更多個(gè)樹枝)。例如,樹圖的(由基本層指示的)一個(gè)樹枝可以指示可供所有終端用戶使用的可選聲道和聲道組,并且樹圖的(由擴(kuò)展層指示的)另一樹枝可以指示只能由某些終端用戶使用的附加的可選聲道和/或聲道組(例如,這樣的擴(kuò)展層可以僅提供給有權(quán)使用它的終端用戶)。圖9是樹圖的示例,它包括混合圖的對(duì)象聲道節(jié)點(diǎn)(例如,指示對(duì)象聲道N0、N1、N2、N3、N4、N5和N6的節(jié)點(diǎn))和其它元素。通常,基本層包含(指示)圖結(jié)構(gòu)和到圖中節(jié)點(diǎn)的控制接口(例如,搖攝,以及增益控制接口)?;緦訉?duì)于把任何用戶交互映射到解碼/渲染過程是必要的。每個(gè)擴(kuò)展層包含(指示)對(duì)基本層的擴(kuò)展。對(duì)于把用戶交互映射到解碼過程,所述擴(kuò)展不是立即需要的,因此可以以較慢的速率發(fā)送和/或延遲或略去。在一些實(shí)施例中,基本層被包括作為節(jié)目的獨(dú)立子流的元數(shù)據(jù)(例如,被發(fā)送作為獨(dú)立子流的元數(shù)據(jù))。根據(jù)本發(fā)明的一些實(shí)施例生成的(或者發(fā)送、存儲(chǔ)、緩沖、解碼、渲染或以其它方式處理的)基于對(duì)象的音頻節(jié)目包括揚(yáng)聲器聲道、至少一個(gè)對(duì)象聲道、以及指示混合圖(其可以是或者可以不是分層的混合圖)的元數(shù)據(jù)(包括條件渲染元數(shù)據(jù)),其中所述混合圖指示揚(yáng)聲器聲道與對(duì)象聲道的可選混合(例如,所有可選下混)。經(jīng)編碼的音頻比特流(例如,杜比E或E-AC-3比特流)指示節(jié)目的至少一部分,并且指示混合圖的元數(shù)據(jù)(并且通常還有可選的對(duì)象和/或揚(yáng)聲器聲道)被包括在比特流的每一幀中(或者比特流的幀子集的每一幀中)。例如,每一幀可以包括至少一個(gè)元數(shù)據(jù)片段和至少一個(gè)音頻數(shù)據(jù)片段,并且混合圖可以被包括在每一幀的至少一個(gè)元數(shù)據(jù)片段中。(可以被稱為“容器”的)每個(gè)元數(shù)據(jù)片段可以具有包括元數(shù)據(jù)片段頭部(以及可選地還有其它元素)和跟在元數(shù)據(jù)片段頭部之后的一個(gè)或更多個(gè)元數(shù)據(jù)有效載荷的格式。每個(gè)元數(shù)據(jù)有效負(fù)載本身由有效載荷頭部識(shí)別。如果存在于元數(shù)據(jù)片段中,則混合圖被包括在元數(shù)據(jù)片段的一個(gè)元數(shù)據(jù)有效載荷中。在另一類實(shí)施例中,根據(jù)本發(fā)明生成的(或者發(fā)送、存儲(chǔ)、緩沖、解碼、渲染或以其它方式處理的)基于對(duì)象的音頻節(jié)目包括子流,并且子流指示至少一床揚(yáng)聲器聲道、至少一個(gè)對(duì)象聲道、以及對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))。對(duì)象相關(guān)元數(shù)據(jù)包括“子流”元數(shù)據(jù)(指示節(jié)目的子流結(jié)構(gòu)和/或解碼子流應(yīng)當(dāng)采用的方式),并且通常還有指示揚(yáng)聲器聲道與對(duì)象聲道的可選混合(例如,所有可選下混)的混合圖。子流元數(shù)據(jù)可以指示節(jié)目的哪個(gè)子流應(yīng)當(dāng)獨(dú)立于節(jié)目的其它子流被解碼,以及節(jié)目的哪些子流應(yīng)當(dāng)與節(jié)目的至少一個(gè)其它子流相關(guān)聯(lián)地被解碼。例如,在一些實(shí)施例中,編碼音頻比特流指示節(jié)目的至少一些(即,至少一部分)音頻內(nèi)容(例如,至少一床揚(yáng)聲器聲道、至少一個(gè)替換揚(yáng)聲器聲道和節(jié)目的至少一些對(duì)象聲道)以及元數(shù)據(jù)(例如,混合圖和子流元數(shù)據(jù),并且可選地還有其它元數(shù)據(jù)),并且至少一個(gè)附加的編碼音頻比特流(或文件)指示節(jié)目的一些音頻內(nèi)容和/或元數(shù)據(jù)。在每個(gè)比特流是杜比E比特流(或者為了在AES3串行數(shù)字音頻比特流中攜帶非PCM數(shù)據(jù)而以符合SMPTE337格式的方式編碼)的情況下,比特流可以共同指示多達(dá)8個(gè)聲道的音頻內(nèi)容,其中每個(gè)比特流攜帶多達(dá)8個(gè)聲道的音頻數(shù)據(jù)并且通常還包括元數(shù)據(jù)。每個(gè)比特流可以被認(rèn)為是組合比特流的子流,其中組合比特流指示由所有比特流攜帶的所有音頻數(shù)據(jù)和元數(shù)據(jù)。對(duì)于另一個(gè)示例,在一些實(shí)施例中,編碼音頻比特流指示至少一個(gè)音頻節(jié)目的音頻內(nèi)容和元數(shù)據(jù)(例如,混合圖和子流元數(shù)據(jù),并且可選地還有其它對(duì)象相關(guān)元數(shù)據(jù))的多個(gè)子流。通常,每個(gè)子流指示節(jié)目的一個(gè)或更多個(gè)聲道(并且通常還有元數(shù)據(jù))。在一些情況下,編碼音頻比特流的多個(gè)子流指示若干個(gè)音頻節(jié)目的音頻內(nèi)容,例如,(可以是多聲道節(jié)目的)“主”音頻節(jié)目和至少一個(gè)其它音頻節(jié)目(例如,作為對(duì)主音頻節(jié)目的現(xiàn)場(chǎng)解說的節(jié)目)。指示至少一個(gè)音頻節(jié)目的編碼音頻比特流必定包括音頻內(nèi)容的至少一個(gè)“獨(dú)立”子流。該獨(dú)立子流指示音頻節(jié)目的至少一個(gè)聲道(例如,該獨(dú)立子流可以指示常規(guī)5.1聲道音頻節(jié)目的五個(gè)全范圍聲道)。在本文中,這種音頻節(jié)目被稱為“主”節(jié)目。在一些情況下,編碼音頻比特流指示兩個(gè)或更多個(gè)音頻節(jié)目(“主”節(jié)目和至少一個(gè)其它音頻節(jié)目)。在這種情況下,比特流包括兩個(gè)或更多個(gè)獨(dú)立子流:第一個(gè)獨(dú)立子流指示主節(jié)目的至少一個(gè)聲道;并且至少一個(gè)其它獨(dú)立子流指示另一個(gè)音頻節(jié)目(與主節(jié)目不同的節(jié)目)的至少一個(gè)聲道。每個(gè)獨(dú)立子流可以被獨(dú)立解碼,并且解碼器可以操作為只解碼編碼比特流的獨(dú)立子流的子集(而不是全部)??蛇x地,指示主節(jié)目(并且可選地還有至少一個(gè)其它音頻節(jié)目)的編碼音頻比特流包括音頻內(nèi)容的至少一個(gè)“從屬”子流。每個(gè)從屬子流與比特流的一個(gè)獨(dú)立子流關(guān)聯(lián),并且指示其內(nèi)容由關(guān)聯(lián)的獨(dú)立子流指示的節(jié)目(例如,主節(jié)目)的至少一個(gè)附加聲道(即,從屬子流指示不由關(guān)聯(lián)的獨(dú)立子流指示的節(jié)目的至少一個(gè)聲道,并且關(guān)聯(lián)的獨(dú)立子流指示節(jié)目的至少一個(gè)聲道)。在包括(指示主節(jié)目的至少一個(gè)聲道的)獨(dú)立子流的編碼比特流的示例中,比特流還包括(與獨(dú)立比特流關(guān)聯(lián)的)指示主節(jié)目的一個(gè)或更多個(gè)附加揚(yáng)聲器聲道的從屬子流。這種附加揚(yáng)聲器聲道是對(duì)由獨(dú)立子流指示的主節(jié)目聲道的補(bǔ)充。例如,如果獨(dú)立子流指示7.1聲道主節(jié)目的標(biāo)準(zhǔn)格式左、右、中央、左環(huán)繞、右環(huán)繞全范圍揚(yáng)聲器聲道,則從屬子流可以指示主節(jié)目的兩個(gè)其它全范圍揚(yáng)聲器聲道。根據(jù)E-AC-3標(biāo)準(zhǔn),常規(guī)的E-AC-3比特流必須指示至少一個(gè)獨(dú)立子流(例如,單個(gè)AC-3比特流),并且可以指示多達(dá)八個(gè)獨(dú)立子流。E-AC-3比特流的每個(gè)獨(dú)立子流可以與多達(dá)八個(gè)從屬子流關(guān)聯(lián)。在(參照?qǐng)D11描述的)示例性實(shí)施例中,基于對(duì)象的音頻節(jié)目包括至少一床揚(yáng)聲器聲道、至少一個(gè)對(duì)象聲道以及元數(shù)據(jù)。元數(shù)據(jù)包括“子流”元數(shù)據(jù)(指示節(jié)目的音頻內(nèi)容的子流結(jié)構(gòu)和/或?qū)?jié)目的音頻內(nèi)容的子流進(jìn)行解碼應(yīng)采用的方式)并且通常還有指示揚(yáng)聲器聲道與對(duì)象聲道的可選混合的混合圖。音頻節(jié)目與足球比賽關(guān)聯(lián)。編碼音頻比特流(例如,E-AC-3比特流)指示節(jié)目的音頻內(nèi)容和元數(shù)據(jù)。節(jié)目的音頻內(nèi)容(因此也即比特流的音頻內(nèi)容)包括四個(gè)獨(dú)立子流,如在圖11中所示。一個(gè)獨(dú)立子流(在圖11中標(biāo)記為子流“I0”)指示5.1揚(yáng)聲器聲道床,指示在足球比賽時(shí)的中立人群噪聲。另一個(gè)獨(dú)立子流(在圖11中標(biāo)記為子流“I1”)指示2.0聲道“A隊(duì)”床(“M人群”)、2.0聲道“B隊(duì)”床(“LivP人群”)和單聲道對(duì)象聲道(“Sky現(xiàn)場(chǎng)解說1”),其中2.0聲道“A隊(duì)”床指示來自偏向一個(gè)隊(duì)(“A隊(duì)”)的比賽人群部分的聲音,2.0聲道“B隊(duì)”床指示來自偏向另一個(gè)隊(duì)(“B隊(duì)”)的比賽人群部分的聲音,所述單聲道對(duì)象聲道指示對(duì)比賽的現(xiàn)場(chǎng)解說。第三個(gè)獨(dú)立子流(在圖11中標(biāo)記為子流“I2”)指示對(duì)象聲道音頻內(nèi)容(標(biāo)記為“2/0擊球”)和三個(gè)對(duì)象聲道(“Sky現(xiàn)場(chǎng)解說2”、“Man現(xiàn)場(chǎng)解說”和“Liv現(xiàn)場(chǎng)解說”),其中對(duì)象聲道音頻內(nèi)容指示比賽用球在被足球比賽參與者撞擊時(shí)產(chǎn)生的聲音,而所述三個(gè)對(duì)象聲道各自指示對(duì)足球比賽的不同現(xiàn)場(chǎng)解說。第四個(gè)獨(dú)立子流(在圖11中標(biāo)記為子流“I3”)指示:對(duì)象聲道(標(biāo)記為“PA”),指示在足球比賽時(shí)由體育場(chǎng)廣播系統(tǒng)產(chǎn)生的聲音;對(duì)象聲道(標(biāo)記為“電臺(tái)”),指示足球比賽的電臺(tái)廣播;以及對(duì)象聲道(標(biāo)記為“進(jìn)球瞬間”),指示足球比賽過程中的進(jìn)球得分。在圖11的示例中,子流I0包括用于節(jié)目和元數(shù)據(jù)(“objmd”)的混合圖,包括至少一些子流元數(shù)據(jù)和至少一些對(duì)象聲道相關(guān)元數(shù)據(jù)。每個(gè)子流I1、I2和I3包括元數(shù)據(jù)(“objmd”)、至少一些對(duì)象聲道相關(guān)元數(shù)據(jù)以及可選地至少一些子流元數(shù)據(jù)。在圖11的示例中,比特流的子流元數(shù)據(jù)指示:在解碼期間,在每對(duì)獨(dú)立子流之間耦合應(yīng)當(dāng)為“關(guān)閉”(使得每個(gè)獨(dú)立子流獨(dú)立于其它獨(dú)立子流被解碼),并且比特流的子流元數(shù)據(jù)指示耦合應(yīng)當(dāng)“打開”(使得這些聲道不彼此獨(dú)立地被解碼)或者“關(guān)閉”(使得這些聲道彼此獨(dú)立地被解碼)的每個(gè)子流內(nèi)的節(jié)目聲道。例如,子流元數(shù)據(jù)指示:在子流I1的兩個(gè)立體聲揚(yáng)聲器聲道床(2.0聲道“A隊(duì)”床和2.0聲道“B隊(duì)”床)內(nèi)部,耦合應(yīng)當(dāng)為“打開”,但是橫跨子流I1的揚(yáng)聲器聲道床以及在單聲道對(duì)象聲道與子流I1的每個(gè)揚(yáng)聲器聲道床之間被禁用(以便使單聲道對(duì)象聲道與一床揚(yáng)聲器聲道彼此獨(dú)立地被解碼)。類似地,子流元數(shù)據(jù)指示:在子流I0的5.1揚(yáng)聲器聲道床內(nèi)部,耦合應(yīng)當(dāng)為“打開”(以便使這個(gè)床的揚(yáng)聲器聲道彼此關(guān)聯(lián)地被解碼)。在一些實(shí)施例中,揚(yáng)聲器聲道和對(duì)象聲道以適合于節(jié)目的混合圖的方式被包括(“打包”)在音頻節(jié)目的子流內(nèi)。例如,如果混合圖是樹圖,則圖的一個(gè)樹枝的所有聲道都可以被包括在一個(gè)子流中,而圖的另一個(gè)樹枝的所有聲道都可以被包括在另一個(gè)子流中。圖10是實(shí)現(xiàn)本發(fā)明實(shí)施例的系統(tǒng)的框圖。圖10系統(tǒng)的對(duì)象處理系統(tǒng)(對(duì)象處理器)200包括如圖所示那樣耦接的元數(shù)據(jù)生成子系統(tǒng)210、夾層編碼器(mezzanineencoder)212和模擬子系統(tǒng)211。元數(shù)據(jù)生成子系統(tǒng)210被耦接為接收所捕捉到的音頻流(例如,指示由位于觀賞型賽事的麥克風(fēng)捕捉的聲音的流,并且可選地還有其它音頻流),并且被配置為把來自控制臺(tái)104的音頻流組織(例如,分組)到一床揚(yáng)聲器聲道、一組替換揚(yáng)聲器聲道和多個(gè)對(duì)象聲道和/或?qū)ο舐暤澜M中。子系統(tǒng)210還被配置為生成指示對(duì)象聲道(和/或?qū)ο舐暤澜M)的對(duì)象相關(guān)元數(shù)據(jù)(包括條件渲染元數(shù)據(jù))。編碼器212被配置為把對(duì)象聲道(和/或?qū)ο舐暤澜M)、對(duì)象相關(guān)元數(shù)據(jù)以及揚(yáng)聲器聲道編碼為夾層類型的基于對(duì)象的音頻節(jié)目(例如,被編碼為杜比E比特流的基于對(duì)象的音頻節(jié)目)。對(duì)象處理器200的模擬子系統(tǒng)211被配置為渲染(并且在一組工作室監(jiān)視器揚(yáng)聲器上播放)對(duì)象聲道(和/或?qū)ο舐暤澜M)的至少選定子集以及揚(yáng)聲器聲道(包括通過使用對(duì)象相關(guān)元數(shù)據(jù)來生成指示選定對(duì)象聲道與揚(yáng)聲器聲道的混合),使得所回放的聲音可以被子系統(tǒng)200的操作者監(jiān)控。圖10系統(tǒng)的轉(zhuǎn)碼器202包括如圖所示那樣耦接的夾層解碼器子系統(tǒng)(夾層解碼器)213和編碼器214。夾層解碼器213被耦接和配置為接收并解碼從對(duì)象處理器200輸出的夾層類型的基于對(duì)象的音頻節(jié)目。解碼器213的解碼輸出被編碼器214重新編碼為適于廣播的格式。在一種實(shí)施例中,從編碼器214輸出的經(jīng)編碼的基于對(duì)象的音頻節(jié)目是E-AC-3比特流(因此編碼器214在圖10中被標(biāo)記為“DD+編碼器”)。在其它實(shí)施例中,從編碼器214輸出的經(jīng)編碼的基于對(duì)象的音頻節(jié)目是AC-3比特流或者具有某種其它格式。轉(zhuǎn)碼器202的基于對(duì)象的音頻節(jié)目輸出被廣播(或以其它方式傳送)到多個(gè)終端用戶。解碼器204被包括在一個(gè)這種終端用戶的回放系統(tǒng)中。解碼器204包括如圖所示那樣耦接的解碼器215和渲染子系統(tǒng)(渲染器)216。解碼器215接受(接收或讀取)并解碼從轉(zhuǎn)碼器202傳送的基于對(duì)象的音頻節(jié)目。如果解碼器215是根據(jù)本發(fā)明的典型實(shí)施例配置的,則在典型操作中解碼器215的輸出包括:指示節(jié)目的一床揚(yáng)聲器聲道的音頻樣本流、以及指示節(jié)目的對(duì)象聲道(例如,用戶可選的音頻對(duì)象聲道)的音頻樣本流和對(duì)應(yīng)的對(duì)象相關(guān)元數(shù)據(jù)流。在一種實(shí)施例中,輸入到解碼器215的經(jīng)編碼的基于對(duì)象的音頻節(jié)目是E-AC-3比特流,因此解碼器215在圖10中被標(biāo)記為“DD+解碼器”。解碼器204的渲染器216包括被耦接為(從解碼器215)接收所傳送節(jié)目的經(jīng)解碼的揚(yáng)聲器聲道、對(duì)象聲道和對(duì)象相關(guān)元數(shù)據(jù)的對(duì)象處理子系統(tǒng)。渲染器216還包括被配置為渲染由對(duì)象處理子系統(tǒng)確定的音頻內(nèi)容的渲染子系統(tǒng),以便由回放系統(tǒng)的揚(yáng)聲器(未示出)回放。典型地,渲染器216的對(duì)象處理子系統(tǒng)被配置為向渲染器216的渲染子系統(tǒng)輸出由節(jié)目指示的整組對(duì)象聲道的選定子集、以及對(duì)應(yīng)的對(duì)象相關(guān)元數(shù)據(jù)。渲染器216的對(duì)象處理子系統(tǒng)通常還被配置為不作改變地(向渲染子系統(tǒng))傳遞來自解碼器215的經(jīng)解碼的揚(yáng)聲器聲道。由對(duì)象處理子系統(tǒng)執(zhí)行的對(duì)象聲道選擇是根據(jù)本發(fā)明的實(shí)施例確定的,例如,通過用戶選擇和/或渲染器216被編程為或以其它方式被配置實(shí)現(xiàn)的規(guī)則(例如,指示條件和/或約束)。圖10的元件200、202和204中的每一個(gè)(以及圖8的元件104、106、108和110中的每一個(gè))可以被實(shí)現(xiàn)為硬件系統(tǒng)。處理器200(或處理器106)的這種硬件實(shí)現(xiàn)方式的輸入典型地是多聲道音頻數(shù)字接口(“MADI”)輸入。典型地,圖8的處理器106以及圖10的編碼器212和214中的每一個(gè)都包括幀緩沖區(qū)。典型地,幀緩沖區(qū)是被耦接為接收經(jīng)編碼的輸入音頻比特流的緩沖存儲(chǔ)器,并且在操作中,緩沖存儲(chǔ)器(例如,以非暫態(tài)方式)存儲(chǔ)編碼音頻比特流的至少一幀,并且編碼音頻比特流的一系列幀被從緩沖存儲(chǔ)器向下游設(shè)備或系統(tǒng)斷言。同樣,典型地,圖10的解碼器213和215中的每一個(gè)包括幀緩沖區(qū)。典型地,該幀緩沖區(qū)是被耦接為接收經(jīng)編碼的輸入音頻比特流的緩沖存儲(chǔ)器,并且在操作中緩沖存儲(chǔ)器(例如,以非暫態(tài)方式)存儲(chǔ)要被解碼器213或215解碼的經(jīng)編碼的音頻比特流的至少一幀。圖8的處理器106的任何部件或元件(或者圖10的子系統(tǒng)200、202和/或204)可以在硬件、軟件或者硬件和軟件的組合中被實(shí)現(xiàn)為一個(gè)或更多個(gè)過程和/或一個(gè)或更多個(gè)電路(例如,ASIC、FPGA或其它集成電路)。應(yīng)該領(lǐng)會(huì)的是,在一些實(shí)施例中,本發(fā)明的基于對(duì)象的音頻節(jié)目被生成和/或傳送為指示節(jié)目內(nèi)容(包括元數(shù)據(jù))的未編碼的(例如,基帶)表示。例如,這種表示可以包括PCM音頻樣本和相關(guān)聯(lián)的元數(shù)據(jù)。未編碼的(未壓縮的)表示可以以各種方式中的任何一種傳送,包括:作為至少一個(gè)數(shù)據(jù)文件(例如,以非暫態(tài)的方式存儲(chǔ)在存儲(chǔ)器中,例如,存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上),或者作為AES-3格式或串行數(shù)字接口(SDI)格式(或以另一種格式)的比特流。本發(fā)明的一方面是被配置為執(zhí)行本發(fā)明的方法的實(shí)施例的音頻處理單元(APU)。APU的示例包括但不限于:編碼器(例如,轉(zhuǎn)碼器)、解碼器、編解碼器、預(yù)處理系統(tǒng)(預(yù)處理器)、后處理系統(tǒng)(后處理器)、音頻比特流處理系統(tǒng),以及這些的組合。在一類實(shí)施例中,本發(fā)明是APU,該APU包括(例如,以非暫態(tài)方式)存儲(chǔ)由本發(fā)明的方法的任何實(shí)施例生成的基于對(duì)象的音頻節(jié)目的至少一幀或其它片段(包括揚(yáng)聲器聲道和至少一個(gè)對(duì)象聲道的音頻內(nèi)容、以及包括條件渲染元數(shù)據(jù)的對(duì)象相關(guān)元數(shù)據(jù))的緩沖存儲(chǔ)器(緩沖區(qū))。例如,圖5的制作單元3可以包括緩沖區(qū)3A,該緩沖區(qū)3A(例如,以非暫態(tài)方式)存儲(chǔ)由單元3生成的基于對(duì)象的音頻節(jié)目的至少一幀或其它片段(包括揚(yáng)聲器聲道和至少一個(gè)對(duì)象聲道的音頻內(nèi)容、以及包括條件渲染元數(shù)據(jù)的對(duì)象相關(guān)元數(shù)據(jù))。對(duì)于另一個(gè)示例,圖5的解碼器7可以包括緩沖區(qū)7A,該緩沖區(qū)7A(例如,以非暫態(tài)方式)存儲(chǔ)從子系統(tǒng)5向解碼器7傳送的基于對(duì)象的音頻節(jié)目的至少一幀或其它片段(包括揚(yáng)聲器聲道和至少一個(gè)對(duì)象聲道的音頻內(nèi)容、以及包括條件渲染元數(shù)據(jù)的對(duì)象相關(guān)元數(shù)據(jù))。本發(fā)明的實(shí)施例可以被實(shí)現(xiàn)在硬件、固件、或軟件或者其組合中(例如,作為可編程的邏輯陣列)。例如,圖8的子系統(tǒng)106或圖7系統(tǒng)、或者圖6系統(tǒng)的元件20、22、24、25、26、29、35、31和35中的全部或一些、或者圖10的元件200、202和204中的全部或一些,可以在被適當(dāng)?shù)鼐幊?或以其它方式配置)的硬件或固件中實(shí)現(xiàn),例如,作為編程的通用處理器、數(shù)字信號(hào)處理器或者微處理器。除非另外指出,否則作為本發(fā)明的一部分而被包括的算法或過程不固有地關(guān)聯(lián)任何特定的計(jì)算機(jī)或其它裝置。特別地,各種通用機(jī)器可以與根據(jù)本文示教所編寫的程序一起使用,或者可以更方便地構(gòu)造更專用的裝置(例如,集成電路)來執(zhí)行所需的方法步驟。因此,本發(fā)明可以在一個(gè)或更多個(gè)可編程計(jì)算機(jī)系統(tǒng)上執(zhí)行的一個(gè)或更多個(gè)計(jì)算機(jī)程序中實(shí)現(xiàn)(例如,圖6的元件20、22、24、25、26、29、35、31和35中的全部或一些的實(shí)現(xiàn)),其中每個(gè)可編程計(jì)算機(jī)系統(tǒng)包括至少一個(gè)處理器、至少一個(gè)數(shù)據(jù)存儲(chǔ)系統(tǒng)(包括易失性和非易失性存儲(chǔ)器和/或存儲(chǔ)元件)、至少一個(gè)輸入設(shè)備或端口和至少一個(gè)輸出設(shè)備或端口。程序代碼被應(yīng)用到輸入數(shù)據(jù),以執(zhí)行本文所述的功能并且生成輸出信息。輸出信息以已知的方式被應(yīng)用到一個(gè)或更多個(gè)輸出設(shè)備。每個(gè)這種程序可以用任何期望的計(jì)算機(jī)語言(包括機(jī)器、匯編或高級(jí)過程、邏輯或面向?qū)ο缶幊陶Z言)實(shí)現(xiàn),以便與計(jì)算機(jī)系統(tǒng)通信。在任何情況下,語言都可以是被編譯或解釋的語言。例如,當(dāng)被計(jì)算機(jī)軟件指令序列實(shí)現(xiàn)時(shí),本發(fā)明實(shí)施例的各種功能和步驟可以由在合適的數(shù)字信號(hào)處理硬件中運(yùn)行的多線程軟件指令序列實(shí)現(xiàn),在這種情況下,實(shí)施例的各種設(shè)備、步驟和功能可以對(duì)應(yīng)于軟件指令的部分。每個(gè)這種計(jì)算機(jī)程序優(yōu)選地存儲(chǔ)在或下載到可由通用或?qū)S每删幊逃?jì)算機(jī)讀取的存儲(chǔ)介質(zhì)或設(shè)備(例如,固態(tài)存儲(chǔ)器或介質(zhì),或者磁性或光學(xué)介質(zhì))上,以便在存儲(chǔ)介質(zhì)或設(shè)備被計(jì)算機(jī)系統(tǒng)讀取時(shí)配置和操作計(jì)算機(jī),以執(zhí)行本文所述的過程。本發(fā)明的系統(tǒng)還可以被實(shí)現(xiàn)為計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),被配置有(即,存儲(chǔ))計(jì)算機(jī)程序,其中這樣配置的存儲(chǔ)介質(zhì)使計(jì)算機(jī)系統(tǒng)以特定和預(yù)定義的方式操作,以執(zhí)行本文所述的功能。已經(jīng)描述了本發(fā)明的多種實(shí)施例。應(yīng)當(dāng)理解,在不背離本發(fā)明精神和范圍的情況下,可以進(jìn)行各種修改。鑒于以上示教,本發(fā)明的許多修改和變化都是可能的。應(yīng)當(dāng)理解,在所附權(quán)利要求的范圍內(nèi),本發(fā)明可以按與本文具體描述的方式不同的方式來實(shí)踐。