專利名稱:供合成輸出信號(hào)的裝置和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及合出顯現(xiàn)輸出信號(hào),如以可用多通道降混(downmix)及附加控制數(shù)據(jù)為基礎(chǔ)的立體音輸出信號(hào)或具有更多音頻信號(hào)的輸出信號(hào)。明確地說(shuō),該多通道降混為多個(gè)音頻對(duì)象信號(hào)降混。
背景技術(shù):
音頻最近發(fā)展促進(jìn)立體音(或單音)信號(hào)及對(duì)應(yīng)控制數(shù)據(jù)為基礎(chǔ)的音頻信號(hào)多信道表示重建。這些參數(shù)環(huán)繞編碼方法通常包含一參數(shù)化法。參數(shù)多通道音頻譯碼器(如ISO/IEC 23003-1[1]、[2]中定義的MPEG環(huán)繞譯碼器),通過(guò)使用附加控制數(shù)據(jù)以K傳輸數(shù)據(jù)為基礎(chǔ)重建M通道。該控制數(shù)據(jù)包含IID(信道間強(qiáng)度差)及ICC(通道間同調(diào)性)為基礎(chǔ)的多信道信號(hào)參數(shù)化。這些參數(shù)通常在編碼階段被擷取,及描述功率比率及上混處理中所使用的通道配對(duì)間的共相關(guān)。使用該編碼方案可以明顯較傳送所有M信道為低的數(shù)據(jù)速率使該編碼非常有效率,同時(shí)確保與K信道裝置及M信道裝置兩者兼容。
緊密相關(guān)編碼系統(tǒng)為對(duì)應(yīng)音頻對(duì)象編碼器[3]、[4],其中若干音頻對(duì)象被控制數(shù)據(jù)引導(dǎo)于編碼器處被降混且稍后被上混。上混處理也可被視為該降混中混合的對(duì)象分離。最終上混信號(hào)可被顯現(xiàn)入一個(gè)或更多回放通道。更明確地,[3,4]呈現(xiàn)從一降混(被稱為加總信號(hào)),有關(guān)來(lái)源對(duì)象的統(tǒng)計(jì)信息,敘明預(yù)期輸出格式的數(shù)據(jù)綜效音頻的方法。使用若干降混信號(hào)例中,這些降混信號(hào)包含不同子組對(duì)象,并針對(duì)各降混通道個(gè)別執(zhí)行上混。
立體音對(duì)象降混及對(duì)象顯現(xiàn)立體音,或通過(guò)如MPEG環(huán)繞譯碼器產(chǎn)生適用于進(jìn)一步處理的立體音信號(hào)例中,先前技術(shù)已知可通過(guò)結(jié)合處理該兩信道及時(shí)間及頻率相依矩陣變換方案來(lái)達(dá)成顯著效能優(yōu)點(diǎn)。音頻對(duì)象編碼之外,也針對(duì)部份轉(zhuǎn)置一立體音頻信號(hào)應(yīng)用相關(guān)技術(shù)于WO2006/103584中的另一立體音頻信號(hào)。也熟知針對(duì)一般音頻對(duì)象編碼系統(tǒng),必須引進(jìn)增添解相關(guān)處理至該顯現(xiàn),以感知重制預(yù)期參考情景。然而,先前技術(shù)并無(wú)敘明矩陣變換及解相關(guān)的聯(lián)合最佳組合。先前技術(shù)方法簡(jiǎn)單組合導(dǎo)致多信道對(duì)象降混提供的功能無(wú)效率及無(wú)彈性使用,或最終對(duì)象譯碼器顯現(xiàn)中的不良立體音影像質(zhì)量。
參考文獻(xiàn) 2006年6月30日至7月2日于瑞典
,第28屆國(guó)際AES會(huì)議,音頻環(huán)繞及更大范圍的未來(lái)中,L.Villemoes,J.Herre,J.Breebaart,G.Hotho,S.Disch,H.Purnhagen及K.
MPEG環(huán)繞空間音頻編碼之即將來(lái)臨ISO標(biāo)準(zhǔn)”。
2006年9月2日至4日于首爾,第29屆國(guó)際AES會(huì)議,行動(dòng)及手持裝置的音頻中,J.Breebaart,J.Herre,L.Villemoes,C.Jin,K.
J.Plogsties及J.Koppens“多通道走向行動(dòng)MPEG環(huán)繞雙耳顯現(xiàn)”。
2006年5月20日至23日于法國(guó)巴黎,第120屆國(guó)際AES會(huì)議發(fā)表會(huì)議文件6752,C.Faller“音頻源的參數(shù)聯(lián)合編碼”。
2006年專利申請(qǐng)案PCT/EP2006/050904,C.Faller“音頻源的參數(shù)聯(lián)合編碼”。
發(fā)明內(nèi)容
本發(fā)明目的是提供一種合成顯現(xiàn)輸出信號(hào)的改良概念。
該目的通過(guò)如權(quán)利要求1所述的一種顯現(xiàn)輸出信號(hào)的合成裝置,如權(quán)利要求27所述的一種顯現(xiàn)輸出信號(hào)合成方法,或如權(quán)利要求28所述的一種計(jì)算機(jī)程序來(lái)實(shí)現(xiàn)。
本發(fā)明提供一種合成具有兩(立體音)音頻信號(hào)或兩個(gè)以上音頻信號(hào)的顯現(xiàn)輸出信號(hào)。然而,許多音頻對(duì)象例中,合成音頻信號(hào)數(shù)量小于原始音頻對(duì)象數(shù)量。然而,當(dāng)音頻對(duì)象數(shù)量小于(如2),或輸出通道數(shù)量為2、3或甚至更大時(shí),音頻輸出通道數(shù)量可大于該對(duì)象數(shù)量。合成顯現(xiàn)輸出信號(hào)不需完整音頻對(duì)象譯碼操作為譯碼音頻對(duì)象及該被合成音頻對(duì)象接續(xù)目標(biāo)顯現(xiàn)即可實(shí)現(xiàn)。此外,以降混信息、目標(biāo)顯現(xiàn)信息,及如能量信息及相關(guān)信息說(shuō)明音頻對(duì)象的音頻目標(biāo)信息為基礎(chǔ)的參數(shù)域中是可計(jì)算顯現(xiàn)輸出信號(hào)。因此,可降低對(duì)合成裝置復(fù)雜性實(shí)施有重大貢獻(xiàn)的解相關(guān)器數(shù)量小于輸出通道數(shù)量,甚至實(shí)質(zhì)小于音頻對(duì)象數(shù)量。明確地說(shuō),可將僅具一單解相關(guān)器或兩解相關(guān)器的合成器用于高質(zhì)量音頻合成器。再者,因?yàn)椴恢笇?dǎo)完整音頻對(duì)象譯碼及接續(xù)目標(biāo)顯現(xiàn),所以可節(jié)省內(nèi)存及計(jì)算資源。再者,各操作可引進(jìn)潛在人為因素。因此,依據(jù)本發(fā)明的計(jì)算是較佳盡于參數(shù)域中達(dá)成,使參數(shù)中未給予而在例如時(shí)間域或次頻帶域中給予的、僅有音頻信號(hào)為最少兩對(duì)象降混信號(hào)。音頻合成期間,當(dāng)使用一單解相關(guān)器時(shí),其以降混型式引進(jìn)該解相關(guān)器中,而當(dāng)使用各通道解相關(guān)器時(shí),其以混合型式引進(jìn)該解相關(guān)器中。時(shí)間域或?yàn)V波器組域或混合信道信號(hào)上的操作,僅為如加權(quán)加法或加權(quán)減法的加權(quán)組合,也就是線性操作。因此,可避免因完整音頻對(duì)象譯碼操作引進(jìn)的人為因素及接續(xù)目標(biāo)顯現(xiàn)操作。
較好的方案是,音頻對(duì)象信息被視為如對(duì)象協(xié)方差型式的能量信息及相關(guān)信息。再者,該矩陣可用于各次頻帶及各時(shí)間區(qū)塊使頻率-時(shí)間映像存在,其中各映射分項(xiàng)包含一音頻對(duì)象協(xié)方差矩陣,其可說(shuō)明此次頻帶中的個(gè)別音頻對(duì)象能量及對(duì)應(yīng)次頻帶中的各對(duì)音頻對(duì)象。自然地,該信息與次頻帶信號(hào)或音頻信號(hào)的特定時(shí)間區(qū)塊或時(shí)間幀或時(shí)間部分相關(guān)。
較好的方案是,將該音頻合成至具有第一或左音頻信道信號(hào),或第二或右音頻信道信號(hào)的顯現(xiàn)立體音輸出信號(hào)。因此,我們可近似應(yīng)用音頻對(duì)象編碼,其中該對(duì)象顯現(xiàn)為立體音盡可能接近參考立體音顯現(xiàn)。
許多音頻對(duì)象編碼應(yīng)用中,將該對(duì)象顯現(xiàn)為立體音盡可能接近參考立體音顯現(xiàn)是很重要的。達(dá)成立體音顯現(xiàn)高質(zhì)量(如近似參考立體音顯現(xiàn))對(duì)該立體音顯現(xiàn)為該對(duì)象譯碼器最終輸出例子,及立體音信號(hào)將被饋送至接續(xù)裝置例子,如以立體音降混模式操作的MPEG環(huán)繞譯碼器的音頻質(zhì)量均很重要。
本發(fā)明提供一種矩陣變換及解相關(guān)聯(lián)合最佳組合方法,其可促使音頻對(duì)象譯碼器使用一個(gè)以上信道的對(duì)象降混開(kāi)拓音頻對(duì)象編碼完整潛能。
本發(fā)明實(shí)施例包含以下特征 一種音頻對(duì)象譯碼器,可使用多通道降混,描述了該對(duì)象的控制數(shù)據(jù)、該降混的控制數(shù)據(jù),及顯現(xiàn)信息來(lái)顯現(xiàn)多個(gè)個(gè)別音頻對(duì)象,其包含 一立體音處理器,包含一增強(qiáng)矩陣變換單元,可操作線性組合多信道降混信道為一干式混合信號(hào)及一解相關(guān)器輸入信號(hào),并隨后將該解相關(guān)器輸入信號(hào)饋送進(jìn)入一解相關(guān)器單元,其輸出信號(hào)線性組合為信道狀的信號(hào)加上該干式混合信號(hào),構(gòu)成所述增強(qiáng)矩陣變換單元的立體音輸出;或 一矩陣計(jì)算器,可以說(shuō)明該對(duì)象的控制數(shù)據(jù)、該降混的控制數(shù)據(jù)及立體音顯現(xiàn)信息,來(lái)計(jì)算該增強(qiáng)矩陣變換單元所使用的線性組合權(quán)重。
現(xiàn)在將通過(guò)具體實(shí)施例,不限制本發(fā)明范圍或精神,參考附圖來(lái)說(shuō)明本發(fā)明,其中 圖1說(shuō)明包含編碼及譯碼的音頻對(duì)象譯碼操作; 圖2a說(shuō)明音頻對(duì)象譯碼為立體音操作; 圖2b說(shuō)明音頻對(duì)象譯碼操作; 圖3a說(shuō)明立體音處理器結(jié)構(gòu); 圖3b說(shuō)明顯現(xiàn)輸出合成信號(hào)裝置; 圖4a說(shuō)明本發(fā)明第一特征,包含一干式信號(hào)混合矩陣C0,一解相關(guān)器混合矩陣Q及一解相關(guān)器上混矩陣P; 圖4b說(shuō)明無(wú)事先解相關(guān)器混合矩陣實(shí)施的本發(fā)明另一特征; 圖4c說(shuō)明無(wú)解相關(guān)器上混矩陣實(shí)施的本發(fā)明另一特征; 圖4d說(shuō)明具有附加增一補(bǔ)償矩陣G實(shí)施的本發(fā)明另一特征; 圖4e說(shuō)明當(dāng)使用一單解相關(guān)器時(shí),該解相關(guān)器降混矩陣Q及該解相關(guān)器上混矩陣P實(shí)施; 圖4f說(shuō)明該干式混合矩陣C0實(shí)施; 圖4g說(shuō)明該干式信號(hào)混合結(jié)果及該解相關(guān)器或該解相關(guān)器上混操作結(jié)果實(shí)際組合詳細(xì)圖標(biāo); 圖5說(shuō)明具有許多解相關(guān)器的一多通道解相關(guān)器操作; 圖6說(shuō)明標(biāo)示一特定識(shí)別辨識(shí)的若干音頻對(duì)象,具有一對(duì)象音頻文件,及一聯(lián)合音頻對(duì)象信息矩陣E的映像; 圖7說(shuō)明解釋圖6的對(duì)象共變異矩陣E; 圖8說(shuō)明降混矩陣D所控制的一降混矩陣及一音頻對(duì)象編碼器; 圖9說(shuō)明通常由使用者提供的一目標(biāo)顯現(xiàn)矩陣A及一特定目標(biāo)顯現(xiàn)方案; 圖10說(shuō)明可依據(jù)四個(gè)不同實(shí)施例執(zhí)行決定第四a至d中的矩陣元素的事先計(jì)算步驟集合; 圖11說(shuō)明依據(jù)第一實(shí)施例的計(jì)算步驟集合; 圖12說(shuō)明依據(jù)第二實(shí)施例的計(jì)算步驟集合; 圖13說(shuō)明依據(jù)第三實(shí)施例的計(jì)算步驟集合; 圖14說(shuō)明依據(jù)第四實(shí)施例的計(jì)算步驟集合。
具體實(shí)施例方式 下述實(shí)施例僅為本發(fā)明合成輸出信號(hào)裝置及方法原理的實(shí)施例。熟練技術(shù)人員應(yīng)了解在此說(shuō)明的安置及細(xì)節(jié)修改及變異。因此,預(yù)期僅受到公開(kāi)的專利申請(qǐng)范圍的限制,而不受在說(shuō)明及解釋的實(shí)施例所公開(kāi)的特定細(xì)節(jié)的限制。
圖1說(shuō)明了包含一對(duì)象編碼器101及一對(duì)象譯碼器102的音頻對(duì)象譯碼操作??臻g音頻對(duì)象編碼器101可依據(jù)編碼器參數(shù)將N對(duì)象編碼為包含K>1音頻的一對(duì)象降混。應(yīng)用降混權(quán)重矩陣D相關(guān)信息,通過(guò)該對(duì)象編碼器及該降混功率及相關(guān)的操作數(shù)據(jù)做輸出。矩陣D通常但不是一直必要隨時(shí)間及頻率而固定,因此呈現(xiàn)相當(dāng)少量的信息。最后,該對(duì)象編碼器可針對(duì)各對(duì)象擷取對(duì)象參數(shù),當(dāng)作知覺(jué)考慮定義的解下的時(shí)間及頻率函數(shù)。空間對(duì)象譯碼器102是將該對(duì)象降混信道,降混信息及對(duì)象參數(shù)(該編碼器所產(chǎn)生)視為輸入,并產(chǎn)生具M(jìn)音頻通道的一輸出呈現(xiàn)給使用者。N對(duì)象顯現(xiàn)為M音頻通道,是利用提供當(dāng)作使用者輸入該對(duì)象編碼器的顯現(xiàn)矩陣。
圖2a說(shuō)明預(yù)期輸出為立體音音頻實(shí)施例中的音頻對(duì)象譯碼器102組成。該音頻對(duì)象降混被饋送至立體音處理器201,其可執(zhí)行通到立體音音頻輸出的信號(hào)處理。此處理視矩陣計(jì)算器202提供的矩陣信息而定。該矩陣信息由該對(duì)象參數(shù)、降混信息,及所提供可說(shuō)明由顯現(xiàn)矩陣將該N對(duì)象預(yù)期目標(biāo)顯現(xiàn)為立體音的對(duì)象顯現(xiàn)信息導(dǎo)出。
圖2b說(shuō)明預(yù)期輸出為一般多信道音頻信號(hào)例中的音頻對(duì)象譯碼器102組成。該音頻對(duì)象降混被饋送入立體音處理器201,其可執(zhí)行通到立體音音頻輸出的信號(hào)處理。此處理視矩陣計(jì)算器202提供的矩陣信息而定。該矩陣信息由該對(duì)象參數(shù)、降混信息,及顯現(xiàn)縮減器204輸出的縮減對(duì)象顯現(xiàn)信息導(dǎo)出。該縮減對(duì)象顯現(xiàn)信息是說(shuō)明由顯現(xiàn)矩陣將該N對(duì)象預(yù)期顯現(xiàn)為立體音,且其是從說(shuō)明N對(duì)象顯現(xiàn)為被提供至音頻對(duì)象譯碼器102的M音頻信道的顯現(xiàn)信息,對(duì)象參數(shù)及對(duì)象降混信息導(dǎo)出。附加處理器203可以該顯現(xiàn)信息、降混信息及對(duì)象參數(shù)為基礎(chǔ),將立體音處理器201提供的立體音信號(hào)轉(zhuǎn)置為最終多通道音頻輸出。以立體音降混模式操作的MPEG環(huán)繞譯碼器,通常為附加處理器203的主要組成。
圖3a說(shuō)明立體音處理器201的結(jié)構(gòu)。給定輸出自K通道音頻譯碼器的比特流格式的被傳輸對(duì)象降混,此比特流首先被音頻譯碼器301解碼為K時(shí)間域音頻信號(hào)。這些信號(hào)接著全部被T/F單元302轉(zhuǎn)置為頻率域。改變被提供至立體音處理器201的矩陣信息所定義的發(fā)明性增強(qiáng)矩陣變換的時(shí)間及頻率,通過(guò)增強(qiáng)矩陣變換單元303執(zhí)行于最終頻率域信號(hào)X上。此單元輸出該頻率域中的立體音信號(hào)Y’,其通過(guò)F/T單元304轉(zhuǎn)置為時(shí)間域。
圖3b說(shuō)明了合成于立體音顯現(xiàn)操作實(shí)施例中具有一第一音頻信道信號(hào)及一第二音頻信道信號(hào),或于較高通道顯現(xiàn)例中具有兩個(gè)以上輸出信道信號(hào)的顯現(xiàn)輸出信號(hào)裝置350。然而,針對(duì)如三個(gè)或更多的較高數(shù)量音頻對(duì)象,輸出信道數(shù)量較佳小于原始音頻對(duì)象數(shù)量,其對(duì)降混信號(hào)352有貢獻(xiàn)。明確地說(shuō),降混信號(hào)352具有至少一第一對(duì)象降混信號(hào)及一第二對(duì)象降混信號(hào),其中該降混信號(hào)依據(jù)降混信息354表示多個(gè)音頻對(duì)象信號(hào)降混。明確地說(shuō),當(dāng)在兩個(gè)解相關(guān)器或具有兩個(gè)以上解相關(guān)器的例子中,產(chǎn)生具有一解相關(guān)單信道信號(hào)或一第一解相關(guān)信道信號(hào)及一第二解相關(guān)信道信號(hào),在具有三個(gè)或更多解相關(guān)器的實(shí)施例中,具有兩個(gè)以上解相關(guān)信道信號(hào)的一解相關(guān)信號(hào)時(shí),如圖3b說(shuō)明的發(fā)明性音頻合成器包含一解相關(guān)器級(jí)356。然而,因解相關(guān)器帶來(lái)的實(shí)施復(fù)雜性,較小數(shù)量解相關(guān)器,因而較小數(shù)量解相關(guān)信道信號(hào)是較較高數(shù)量為佳。較好的是,解相關(guān)器數(shù)量小于包含于降混信號(hào)352中的音頻對(duì)象數(shù)量,且較佳等于輸出信號(hào)352中的信道信號(hào)數(shù)量,或小于顯現(xiàn)輸出信號(hào)350中的音頻信道信號(hào)數(shù)量。然而,針對(duì)小數(shù)量音頻對(duì)象(方程式2或3),解相關(guān)器數(shù)量等于或甚至大于音頻對(duì)象數(shù)量。
如圖3b顯示,該解相關(guān)器級(jí)可接收降混信號(hào)352當(dāng)作輸入,并產(chǎn)生解相關(guān)信號(hào)358當(dāng)做輸出信號(hào)。除了降混信息354之外,還提供目標(biāo)顯現(xiàn)信息360及音頻對(duì)象參數(shù)信息362。明確地說(shuō),該音頻對(duì)象參數(shù)信息至少用于組合器364中,且可選擇性用于稍后說(shuō)明的解相關(guān)器級(jí)356中。音頻對(duì)象參數(shù)信息362優(yōu)選包含以如0及1之間數(shù)字,或以特定值范圍定義的一特定數(shù)字的參數(shù)化型式說(shuō)明該音頻對(duì)象的能量及相關(guān)信息,其可標(biāo)示稍后說(shuō)明的兩音頻對(duì)象之間的能量,功率或相關(guān)測(cè)量。
組合器364配置執(zhí)行降混信號(hào)352及解相關(guān)信號(hào)358的權(quán)重組合。再者,組合器364可從降混信息354及目標(biāo)顯現(xiàn)信息360操作計(jì)算加權(quán)組合的加權(quán)因子。該目標(biāo)顯現(xiàn)信息可標(biāo)示虛擬重放設(shè)立中的音頻對(duì)象虛擬位置,且可標(biāo)示該音頻對(duì)象特定放置,以決定特定對(duì)象是否被顯現(xiàn)于第一輸出信道或第二輸出信道中,也就是立體音顯現(xiàn)中的左輸出信道或右輸出信道。然而,當(dāng)執(zhí)行多信道顯現(xiàn)時(shí),目標(biāo)顯現(xiàn)信息可附加標(biāo)示特定對(duì)象是否被放置更多或更少于左環(huán)繞或右環(huán)繞或中央通道等等中。任何顯現(xiàn)方案均可實(shí)施,但因該目標(biāo)顯現(xiàn)信息優(yōu)選為稍后討論通常由使用者提供的目標(biāo)顯現(xiàn)矩陣型式而會(huì)彼此不同。
最后,組合器364使用標(biāo)示較佳能量信息及說(shuō)明音頻對(duì)象的相關(guān)信息的音頻對(duì)象參數(shù)信息362。一實(shí)施例中,該音頻對(duì)象參數(shù)信息給定為時(shí)間/頻率面中各“傾斜””的音頻對(duì)象協(xié)方差矩陣。也就是說(shuō),針對(duì)各次頻帶及定義此次頻代的各時(shí)間區(qū)塊,完整對(duì)象協(xié)方差矩陣,也就是具有功率/能量信息及相關(guān)信息的矩陣被提供為音頻對(duì)象參數(shù)信息362。
當(dāng)比較圖3b及圖2a或2b時(shí),可得知圖1中的音頻對(duì)象譯碼器102對(duì)應(yīng)合成顯現(xiàn)輸出信號(hào)裝置。
再者,立體音處理器201包含圖3b的解相關(guān)器級(jí)356。另一方面,組合器364包含圖2a中的矩陣計(jì)算器202。再者,當(dāng)解相關(guān)器級(jí)356包含解相關(guān)器降混操作時(shí),此矩陣計(jì)算器202部份被包含于解相關(guān)器級(jí)356而非組合器364中。
然而,因?yàn)檐浖谢驅(qū)S脭?shù)字信號(hào)處理器內(nèi),或甚至一般用途個(gè)人計(jì)算機(jī)內(nèi)的本發(fā)明實(shí)施在本發(fā)明的范圍中,所以在此任何特定功能的特定位置均非決定。因此,將特定功能歸因于特定區(qū)塊,為在硬件中實(shí)施本發(fā)明的一方式。然而,當(dāng)所有區(qū)塊電路圖均被視為說(shuō)明操作步驟特定流程的流程圖時(shí),可了解特定功能對(duì)特定區(qū)塊的貢獻(xiàn)大為可能,且可視實(shí)施或程序設(shè)計(jì)要求實(shí)現(xiàn)。
再者,當(dāng)比較圖3b及圖3a時(shí),可了解計(jì)算該加權(quán)組合的加權(quán)因子的組合器364功能性包含于矩陣計(jì)算器202中。也就是說(shuō),該矩陣信息構(gòu)成應(yīng)用至實(shí)施于組合器364中的增強(qiáng)矩陣單元303的加權(quán)因子集合,但其也可包含解相關(guān)器級(jí)356部份(關(guān)于稍后將討論的矩陣Q)。因此,增強(qiáng)矩陣單元303可執(zhí)行至少兩對(duì)象降混信號(hào)的較佳次頻帶的組合操作,其中該矩陣信息包含在執(zhí)行該組合操作之前,加權(quán)這至少兩個(gè)降混信號(hào)或解相關(guān)信號(hào)的加權(quán)因子。
因此,討論組合器364及解相關(guān)器級(jí)356優(yōu)選實(shí)施例的詳細(xì)結(jié)構(gòu)。明確地說(shuō),圖4a至圖4d討論解相關(guān)器級(jí)356及組合器364功能性的若干不同實(shí)施。圖4e至圖4g說(shuō)明圖4a至圖4d中的項(xiàng)目特定實(shí)施。詳細(xì)討論圖4a至圖4d之前,討論這些圖標(biāo)一般結(jié)構(gòu)。各圖標(biāo)包含該解相關(guān)信號(hào)相關(guān)的一上分支,及該干式信號(hào)相關(guān)的一下分支。再者,各分支輸出信號(hào),也就是組合器454中組合線450處的信號(hào)及線452處的信號(hào),最終獲得顯現(xiàn)輸出信號(hào)350。通常,圖4a系統(tǒng)說(shuō)明三個(gè)矩陣處理單元401、402、404。401為干式信號(hào)混合單元。該至少兩對(duì)象降混信號(hào)352被加權(quán)和/或彼此混合,從被輸入加法器454的該干式信號(hào)分支獲得對(duì)應(yīng)該信號(hào)的兩干式混合對(duì)象信號(hào)。然而,該干式信號(hào)分支可具有另一矩陣處理單元,也就是圖4d下游連接干式信號(hào)混合單元401的增益補(bǔ)償單元409。
再者,組合器單元364可或不可包含具有解相關(guān)器矩陣P的解相關(guān)器上混單元404。
自然地,雖然當(dāng)然可對(duì)應(yīng)實(shí)施,但矩陣變換單元404,401及409(圖4d)及組合器單元454僅人工真實(shí)。然而,可替代是,可通過(guò)接收解相關(guān)信號(hào)358及降混信號(hào)352做為輸入,及輸出兩個(gè)或三個(gè)或更多顯現(xiàn)輸出通道350的單“大”矩陣實(shí)施這些矩陣功能性。該“大矩陣”實(shí)施中,線450及452處的信號(hào)未必發(fā)生,雖然永遠(yuǎn)不會(huì)清楚產(chǎn)生中間結(jié)果450及452,但可以矩陣變換單元404、401及409及組合器單元454執(zhí)行的不同次操作代表此矩陣應(yīng)用結(jié)果觀念說(shuō)明該“大矩陣”的功能性。
再者,解相關(guān)器級(jí)356可包含或不包含事先解相關(guān)器混合單元402。圖4b說(shuō)明不提供此單元的情況。此于提供兩降混信道信號(hào)的兩解相關(guān)器而特定降混非必要時(shí)特別有用。自然地,我們可應(yīng)用特定增益因子至兩降混通道,或我們可于其視特定實(shí)施要求被輸入解相關(guān)器級(jí)之前混合該兩降混通道。然而,另一方面,特定矩陣P也可包含矩陣Q功能性。此意指雖然獲得相同結(jié)果,但圖4b中的矩陣P與圖4a中的矩陣P不同。鑒于此,解相關(guān)器級(jí)356可不包含任何矩陣,而該組合器中可執(zhí)行完整矩陣信息計(jì)算,該組合器中也可執(zhí)行完整應(yīng)用矩陣。然而,為了較佳說(shuō)明這些算術(shù)背后的技術(shù)功能性,將針對(duì)圖4a至圖4d說(shuō)明的特定及技術(shù)透明矩陣處理方案來(lái)繼續(xù)說(shuō)明本發(fā)明。
圖4a說(shuō)明發(fā)明性增強(qiáng)矩陣變換單元303的結(jié)構(gòu)。包含至少兩通道的輸入X饋送入可依據(jù)干式混合矩陣C執(zhí)行矩陣操作及輸出立體音干式上混信號(hào)
的干式信號(hào)混合單元401。該輸入X也被饋送入可依據(jù)事先解相關(guān)器混合矩陣Q執(zhí)行矩陣操作及輸出將被饋送入解相關(guān)器單元403的Nd信道信號(hào)的事先解相關(guān)器單元402。最終Nd信道解相關(guān)信號(hào)Z隨后被饋送入可依據(jù)解相關(guān)器上混矩陣P執(zhí)行矩陣操作及輸出解相關(guān)立體音信號(hào)的解相關(guān)器上混單元404。最后,通過(guò)簡(jiǎn)單通道狀添加立體音干式上混信號(hào)
與該解相關(guān)立體音信號(hào)混合,形成該增強(qiáng)矩陣變換單元的輸出信號(hào)Y’。矩陣計(jì)算器202提供給立體音處理器201的矩陣信息說(shuō)明所有三個(gè)混合矩陣(C,Q,P)。一先前技術(shù)系統(tǒng)僅包含較低干式信號(hào)分支。一對(duì)象降混信道中包含一立體音樂(lè)對(duì)象及其它對(duì)象降混信道中包含一單音對(duì)象的簡(jiǎn)單例中無(wú)法充分執(zhí)行該系統(tǒng)。這是因?yàn)殡m然已知包含解相關(guān)的參數(shù)立體音方法可達(dá)成較高許多感官音頻質(zhì)量,但是音樂(lè)顯現(xiàn)為立體音完全視頻率選擇方案而定。包含解相關(guān)但以兩獨(dú)立單對(duì)象降混的完全不同先前技術(shù)系統(tǒng)用于此特定例較佳,但另一方面可達(dá)成與最初提及用于音樂(lè)被保存于真實(shí)立體音中,而聲音以等權(quán)重混入兩對(duì)象降混信道的向后兼容降混例的干式立體音系統(tǒng)相同質(zhì)量。另一例考慮單獨(dú)包含立體音樂(lè)對(duì)象的卡拉OK型目標(biāo)顯現(xiàn)。各降混信道單獨(dú)處理接著最佳壓縮聲音對(duì)象,考慮如中間通道相關(guān)的被傳輸立體音音頻對(duì)象信息為少。本發(fā)明關(guān)鍵特征促成不僅這些簡(jiǎn)單情況,也為對(duì)象降混及顯現(xiàn)遠(yuǎn)為復(fù)雜組合的最高音頻質(zhì)量。
如上述,相對(duì)于圖4a,圖4b說(shuō)明解相關(guān)器上混矩陣P中不需或“吸收”事先解相關(guān)器混合矩陣Q的情況。
圖4c說(shuō)明解相關(guān)器級(jí)356中提供及實(shí)施事先解相關(guān)器矩陣Q,及矩陣Q中不需或“吸收”解相關(guān)器上混矩陣P的情況。
再者,圖4d說(shuō)明呈現(xiàn)相同于圖4a的矩陣,但提供將于圖13討論的第三實(shí)施例及圖14討論的第四實(shí)施例中特別有用的附加增益補(bǔ)償矩陣G的情況。
解相關(guān)器級(jí)356包含單解相關(guān)器或兩解相關(guān)器。圖4e說(shuō)明提供單解相關(guān)器403,且降混信號(hào)為兩信道對(duì)象降混信號(hào),輸出信號(hào)為兩信道音頻輸出信號(hào)的情況。此例中,解相關(guān)器降混矩陣Q具有一列及兩欄,而解相關(guān)器上混矩陣具有一欄及兩列。然而,當(dāng)降混信號(hào)具有兩個(gè)以上的通道時(shí),Q的欄數(shù)等于該降混信號(hào)的信道數(shù),而當(dāng)合成顯現(xiàn)輸出信號(hào)具有兩個(gè)以上的通道時(shí),解相關(guān)器上混矩陣P具有等于顯現(xiàn)輸出信號(hào)的信道數(shù)的列數(shù)。
圖4f說(shuō)明標(biāo)示為C0且具有兩欄中的兩列,二乘二(2×2)實(shí)施例中的干式信號(hào)混合單元401電路狀實(shí)施。如加權(quán)因子的該電路狀結(jié)構(gòu)說(shuō)明該矩陣元素。再者,圖4f可見(jiàn)使用加法器組合加權(quán)信道。然而,當(dāng)降混信道數(shù)量與顯現(xiàn)輸出信號(hào)信道數(shù)量不同時(shí),干式混合矩陣C0不會(huì)是二次方程式矩陣,而會(huì)具有不同于欄數(shù)的列數(shù)。
圖4g詳細(xì)說(shuō)明圖4a中的加法級(jí)功能。明確地說(shuō),針對(duì)如左立體音信道信號(hào)及右立體音信道信號(hào)的兩輸出信道例,提供兩不同加法器級(jí)454,其可組合圖4g說(shuō)明來(lái)自該解相關(guān)器信號(hào)相關(guān)的上分支及干式信號(hào)的下分支的輸出信號(hào)。
有關(guān)增益補(bǔ)償矩陣G409,該增益補(bǔ)償矩陣的元素僅位于矩陣G對(duì)角上。圖4f說(shuō)明干式信號(hào)混合矩陣C0的二乘二例中,增益補(bǔ)償左干式信號(hào)的一增益因子位于c11位置處,增益補(bǔ)償右干式信號(hào)的一增益因子位于圖4f的矩陣C0中的c22位置處。圖4d中409說(shuō)明的二乘二增益矩陣G中,c12及c21會(huì)等于0。
圖5說(shuō)明多通道解相關(guān)器403的先前技術(shù)操作。該工具是用于MPEG環(huán)繞例。Nd信號(hào)、信號(hào)1、信號(hào)2、...信號(hào)Nd分別被饋送入解相關(guān)器1、解相關(guān)器2、...、解相關(guān)器Nd。各解相關(guān)器通常包含目的為制造盡量不與輸入相關(guān)的一輸出,而維持該輸入信號(hào)功率的一濾波器。再者,選擇不同解相關(guān)器濾波器,使輸出解相關(guān)器信號(hào)1、解相關(guān)器信號(hào)2、...解相關(guān)器信號(hào)Nd也盡量配對(duì)不相關(guān)。因?yàn)榕c音頻對(duì)象譯碼器其它部件相較下,解相關(guān)器通常為高計(jì)算復(fù)雜性,有利地使該數(shù)量Nd保持盡量小。
本發(fā)明提供Nd等于1、2或更多,但優(yōu)選小于音頻對(duì)象數(shù)量的解。明確地說(shuō),解相關(guān)器數(shù)量等于顯現(xiàn)輸出信號(hào)的音頻信道信號(hào)數(shù)量,或甚至小于顯現(xiàn)輸出信號(hào)350的音頻信道信號(hào)數(shù)量。
下文中,將描述本發(fā)明數(shù)學(xué)說(shuō)明。在此考慮的所有信號(hào)為來(lái)自離散時(shí)間信號(hào)的調(diào)變?yōu)V波組或窗口FFT(快速傅里葉轉(zhuǎn)置)分析的次頻帶樣本。應(yīng)了解這些次頻帶必須通過(guò)對(duì)應(yīng)合成濾波器組操作轉(zhuǎn)置回到離散時(shí)間域。L樣本信號(hào)區(qū)塊是表示時(shí)間及頻率區(qū)間中的信號(hào),其為應(yīng)用用于說(shuō)明信號(hào)特質(zhì)的時(shí)間-頻率面部分。此設(shè)定中,給定音頻對(duì)象可被表示為一矩陣中長(zhǎng)度L的N列, 圖6說(shuō)明描述若干N對(duì)象的音頻對(duì)象映像實(shí)施例。圖6解釋例中,各對(duì)象具有一對(duì)象識(shí)別號(hào)、一對(duì)應(yīng)對(duì)象音頻文件,及重要地音頻對(duì)象參數(shù),其優(yōu)選為音頻對(duì)象能量及該音頻對(duì)象的對(duì)象間相關(guān)有關(guān)信息。明確地說(shuō),該音頻對(duì)象參數(shù)信息包含各次頻帶及各時(shí)間區(qū)塊的對(duì)象協(xié)方差矩陣E。
圖7說(shuō)明該音頻對(duì)象參數(shù)信息矩陣E。對(duì)角元素eii包含對(duì)應(yīng)次頻帶及對(duì)應(yīng)時(shí)間區(qū)塊中的音頻對(duì)象i的功率及能量信息。最后,表示特定音頻對(duì)象i的次頻帶信號(hào),被輸入如可執(zhí)行自我相關(guān)功能(acf)獲得有或無(wú)若干正規(guī)化之值eii的功率或能量計(jì)算器??商娲牵撃芰靠杀挥?jì)算為特定長(zhǎng)度以上的信號(hào)平方和(也就是向量乘積ss*)。自我相關(guān)函數(shù)在某種涵義上可說(shuō)明能量的頻譜分布,但因?yàn)闊o(wú)論如何均優(yōu)選使用頻率選擇的T/F轉(zhuǎn)置的事實(shí),所以可單獨(dú)針對(duì)各次頻帶在沒(méi)有自我相關(guān)函數(shù)下計(jì)算能量。因此,對(duì)象音頻參數(shù)矩陣E標(biāo)示特定時(shí)間區(qū)塊中的特定次頻帶中的音頻對(duì)象能量功率。
另一方面,非對(duì)角eij標(biāo)示對(duì)應(yīng)次頻帶及時(shí)間區(qū)塊中的音頻i,j之間的個(gè)別相關(guān)測(cè)量。從圖7可明了,針對(duì)實(shí)值分項(xiàng),矩陣E與主對(duì)角對(duì)稱。通常,此矩陣為赫密特(hermitian)矩陣。例如,可通過(guò)個(gè)別音頻對(duì)象的兩次頻帶信號(hào)交叉相關(guān)來(lái)計(jì)算該相關(guān)測(cè)量元素eij,獲得可或不可被正規(guī)化的交叉相關(guān)測(cè)量??墒褂貌皇褂媒徊嫦嚓P(guān)操作而借由決定兩信號(hào)之間相關(guān)的其它方法計(jì)算的其它相關(guān)方式。針對(duì)實(shí)用原因,正規(guī)化所有矩陣E元素,使其具有0及1之間的值,其中1標(biāo)示最大功率或最大相關(guān),0標(biāo)示最小功率(零功率),而-1標(biāo)示最小相關(guān)(項(xiàng)為顛倒)。
大小K×N,其中K>1經(jīng)由矩陣乘法決定具K列的矩陣型式的K信道降混信號(hào)。
X=DS.(2) 圖8說(shuō)明具有降混矩陣元素dij的降混矩陣D例。該元素dij標(biāo)示對(duì)象降混信號(hào)i是否包含一部分或全部對(duì)象j。例如,當(dāng)d12等于零時(shí),此意指對(duì)象降混信號(hào)1不包含對(duì)象2。另一方面,d23值等于1標(biāo)示對(duì)象降混信號(hào)2完全包含對(duì)象3。
0及1之間的降混矩陣元素值可行。明確地說(shuō),0.5值標(biāo)示降混信號(hào)包含一特定對(duì)象,但僅具有其能量一半。因此,當(dāng)均等分配如對(duì)象數(shù)4的音頻對(duì)象至兩降混信號(hào)頻道時(shí),d24及d14值將等于0.5。此降混方式為較佳用于若干情況的能量保存降混操作。然而,可替代是,也可使用非能量保存降混,其中全部音頻對(duì)象均被引進(jìn)左降混頻道及右降混頻道,使此音頻對(duì)象能量為該降混信號(hào)內(nèi)的其它音頻對(duì)象兩倍。
給定圖1的對(duì)象編碼器101簡(jiǎn)圖于圖8下部分處。明確地說(shuō),對(duì)象編碼器101包含兩不同部件101a及101b。部件101a為較佳執(zhí)行音頻對(duì)象1、2、...、N的加權(quán)線性組合,而對(duì)象編碼器101第二部件為一音頻對(duì)象參數(shù)計(jì)算器101b,其可計(jì)算如各時(shí)間區(qū)塊或次頻帶的矩陣E的音頻對(duì)象參數(shù)信息,以提供音頻能量及參數(shù)信息的相關(guān)信息,且可以低位速率傳送,或可被儲(chǔ)存消耗少量?jī)?nèi)存資源。
大小M×N的使用者控制對(duì)象顯現(xiàn)矩陣A可通過(guò) Y=AS.(3) 決定具M(jìn)列的矩陣型式的音頻對(duì)象M信道目標(biāo)顯現(xiàn)。
因?yàn)橹赜诹Ⅲw音顯現(xiàn),所以假設(shè)遍及以下導(dǎo)出M=2。給予初始顯現(xiàn)矩陣給兩個(gè)以上通道,及給予來(lái)自這些若干通道的降混準(zhǔn)則進(jìn)入兩通道,則熟練技術(shù)人員明了可導(dǎo)出立體音顯現(xiàn)的大小2×N的對(duì)應(yīng)顯現(xiàn)矩陣A。顯現(xiàn)縮減器204可執(zhí)行此縮減。為了簡(jiǎn)化,也假設(shè)K=2使對(duì)象降混也為一立體音信號(hào)。再者,立體音對(duì)象降混例為應(yīng)用方案中最重要的特殊例。
圖9詳細(xì)解釋目標(biāo)顯現(xiàn)矩陣A。使用者可視應(yīng)用而定提供目標(biāo)顯現(xiàn)矩陣A。使用者可完全自由標(biāo)示應(yīng)針對(duì)重放設(shè)立以虛擬方式放置音頻對(duì)象。音頻對(duì)象概念強(qiáng)度,為降混信息及音頻對(duì)象參數(shù)信息完全視該音頻對(duì)象特定局部化而定。使用者可以目標(biāo)顯現(xiàn)信息型式提供此音頻對(duì)象局部化。可將該目標(biāo)顯現(xiàn)信息實(shí)施為圖9中的矩陣型式的目標(biāo)顯現(xiàn)矩陣A。明確地說(shuō),顯現(xiàn)矩陣A具有M列及N欄,其中M等于顯現(xiàn)輸出信號(hào)中的信道數(shù),而N等于音頻對(duì)象數(shù)。M等于兩較佳立體音顯現(xiàn)方案,但若執(zhí)行M通道顯現(xiàn),則矩陣A具有M列。
明確地說(shuō),矩陣元素aij標(biāo)示一部分或全部目標(biāo)j將于特定輸出通道i中顯現(xiàn)。圖9下部分為一目標(biāo)顯現(xiàn)矩陣方案簡(jiǎn)單例,其中具有六音頻對(duì)象AO1至AO6,其中僅頭五個(gè)音頻對(duì)象應(yīng)于特定位置處顯現(xiàn),而第六個(gè)音頻對(duì)象不應(yīng)被顯現(xiàn)。
至于音頻對(duì)象AO1,使用者欲讓此音頻對(duì)象于重放方案左側(cè)處顯現(xiàn)。因此,此對(duì)象被放置于(虛擬)重放空間中的左揚(yáng)聲器位置處,其使顯現(xiàn)矩陣A第一欄為(10)。至于第二音頻對(duì)象,a22為1,而a12為0,意指該第二音頻對(duì)象將于右側(cè)顯現(xiàn)。
音頻對(duì)象3將于左揚(yáng)聲器及右揚(yáng)聲器之間中間處顯現(xiàn),使此音頻對(duì)象50%位準(zhǔn)或信號(hào)進(jìn)入右信道,使目標(biāo)顯現(xiàn)矩陣A的對(duì)應(yīng)第三欄為(0.5長(zhǎng)度0.5)。
同樣地,該目標(biāo)顯現(xiàn)矩陣可標(biāo)示左揚(yáng)聲器及右揚(yáng)聲器之間放置。至于音頻對(duì)象4,因?yàn)閍24大于a14,所以該放置于右側(cè)較多。同樣地,如目標(biāo)顯現(xiàn)矩陣元素a15及a25標(biāo)示,第五音頻對(duì)象AO5于左揚(yáng)聲器處顯現(xiàn)較多。另外,目標(biāo)顯現(xiàn)矩陣A一點(diǎn)都不顯現(xiàn)特定音頻對(duì)象。此通過(guò)具零元素的目標(biāo)顯現(xiàn)矩陣A第六欄舉例說(shuō)明。
因?yàn)橹赜诹Ⅲw音顯現(xiàn),所以假設(shè)遍及以下導(dǎo)出M=2。給予初始顯現(xiàn)矩陣給兩個(gè)以上通道,及給予來(lái)自這些若干通道的降混準(zhǔn)則進(jìn)入兩通道,則熟練技術(shù)人員明了可導(dǎo)出立體音顯現(xiàn)的大小2×N的對(duì)應(yīng)顯現(xiàn)矩陣A。顯現(xiàn)縮減器204可執(zhí)行此縮減。為了簡(jiǎn)化,也假設(shè)K=2使對(duì)象降混也為一立體音信號(hào)。再者,立體音對(duì)象降混例為應(yīng)用方案中最重要的特殊例。
給定顯現(xiàn)矩陣A,矩陣X,降混矩陣D,不論對(duì)象降混音頻信號(hào)損失編碼效應(yīng)的時(shí)機(jī)為何,音頻對(duì)象譯碼器的任務(wù)產(chǎn)生原始音頻對(duì)象的目標(biāo)顯現(xiàn)Y感官近似。圖4為發(fā)明性增強(qiáng)矩陣變換單元303結(jié)構(gòu)。403給定相互正交解相關(guān)器數(shù)量Nd,具有三個(gè)混合矩陣。
·大小2×2的C執(zhí)行干式信號(hào)混合 ·大小Nd×2的Q執(zhí)行事先解相關(guān)器混合 ·大小2×Nd的P執(zhí)行解相關(guān)器上混 假設(shè)解相關(guān)器可保存功率,則解相關(guān)信號(hào)矩陣Z具有一對(duì)角Nd×Nd協(xié)方差矩陣Rz=ZZ*,其對(duì)角質(zhì)等于該事先解相關(guān)器混合對(duì)象降混的協(xié)方差矩陣值 QXX*Q*(4) 在此及下文,星號(hào)標(biāo)記復(fù)合共軛轉(zhuǎn)置矩陣操作。也應(yīng)了解可以期望值E{UV*}取代普遍用于計(jì)算方便的型式UV*決定性協(xié)方差矩陣。再者,可假設(shè)所有解相關(guān)信號(hào)與對(duì)象降混信號(hào)無(wú)關(guān)。因此,發(fā)明性增強(qiáng)矩陣變換單元303組合輸出的協(xié)方差R’ 可被重寫(xiě)為干式信號(hào)混合的協(xié)方差及最終解相關(guān)器輸出協(xié)方差的加總。
對(duì)象參數(shù)通常包含對(duì)象功率及選擇對(duì)象間相關(guān)信息??蓮倪@些參數(shù)達(dá)成N×N對(duì)象協(xié)方差SS*的模型E。
SS*=E(7) 此例中,三個(gè)一組矩陣(D,E,A)說(shuō)明音頻對(duì)象譯碼器可用的數(shù)據(jù),本發(fā)明傳授的方法包含使用此數(shù)據(jù)聯(lián)合最佳化組合輸出(5)及其協(xié)方差(6)波形匹配至目標(biāo)顯現(xiàn)信號(hào)(4)。針對(duì)給定干式信號(hào)混合矩陣,手邊問(wèn)題為正確目標(biāo)協(xié)方差R’=R,其可由以下估計(jì) R=Y(jié)Y*=ASS*A*=AEA*(8) 誤差矩陣定義 與(6)比較通往設(shè)計(jì)要求 PRZP*=ΔR.(10) 因?yàn)?10)左手側(cè)為解相關(guān)器混合矩陣P任何選擇的正準(zhǔn)定義矩陣,所以(9)的誤差矩陣必須也為正準(zhǔn)定義矩陣。為了簡(jiǎn)化隨后公式細(xì)節(jié),讓該干式信號(hào)混合及目標(biāo)顯現(xiàn)協(xié)方差被參數(shù)化為 針對(duì)誤差矩陣 需要求正準(zhǔn)定義可以三個(gè)條件表示 ΔL≥0,ΔR≥0,ΔLΔR-(Δp)2≥0(13) 接著討論圖10。圖10說(shuō)明較佳可執(zhí)行圖11至圖14討論的所有四個(gè)實(shí)施例的若干事先計(jì)算步驟集合。如圖10中1000標(biāo)示,一該事先計(jì)算步驟為計(jì)算目標(biāo)顯現(xiàn)信號(hào)協(xié)方差矩陣R。區(qū)塊1000對(duì)應(yīng)方程式(8)。
如區(qū)塊1002標(biāo)示,可使用方程式(15)計(jì)算干式混合矩陣。特別是,假設(shè)不加總解相關(guān)信號(hào),則計(jì)算干式混合矩陣C0可通過(guò)使用降混信號(hào)獲得目標(biāo)顯現(xiàn)信號(hào)最佳匹配。因此,干式混合矩陣確保混和矩陣輸出信號(hào)波型在無(wú)任何附加解相關(guān)信號(hào)下能盡量匹配目標(biāo)顯現(xiàn)信號(hào)。此事先必備干式混合矩陣對(duì)于盡量保持輸出通道中的一部分解相關(guān)信號(hào)很低特別有用。通常,解相關(guān)信號(hào)為已被解相關(guān)器大范圍修改的信號(hào)。因此,此信號(hào)通常具有如色彩化,時(shí)間散開(kāi)及不良瞬時(shí)響應(yīng)的人為因素。因此,此實(shí)施例提供來(lái)自解相關(guān)處理較少信號(hào)通常產(chǎn)生較佳音頻輸出質(zhì)量的優(yōu)點(diǎn)。通過(guò)執(zhí)行波型匹配,也就是加權(quán)及組合降混信號(hào)中的兩信道或更多信道,使這些通道于干式混和操作盡量接近目標(biāo)顯現(xiàn)信號(hào)之后,僅需最少量的解相關(guān)信號(hào)。
假設(shè)參數(shù)音頻對(duì)象信息362為音頻對(duì)象損失較少表示,當(dāng)使用目標(biāo)顯現(xiàn)信息360顯現(xiàn)原始音頻對(duì)象時(shí),組合器364可操作計(jì)算加權(quán)因子使第一對(duì)象降混信號(hào)及第二對(duì)象降混信號(hào)的混合操作結(jié)果452被波型匹配為盡量對(duì)應(yīng)可獲得情況的目標(biāo)顯現(xiàn)結(jié)果。因此,甚至非量化E矩陣均不再確保信號(hào)精確重建。我們可以均方觀念最小化該誤差。因此,我們目標(biāo)獲得波型匹配,而重建功率及交互相關(guān)。
一旦以如上述方式計(jì)算出干式混合矩陣C0,則可計(jì)算干式混合信號(hào)的協(xié)方差矩陣
。明確地說(shuō),較佳使用圖10右側(cè)的方程式,也就是C0DED*C0*。此計(jì)算公式確保,為了計(jì)算干式信號(hào)混合結(jié)果的協(xié)方差矩陣
,僅需參數(shù)而不需次頻帶樣本。然而,作為可替代方案,我們也可使用干式混合矩陣C0及降混信號(hào)來(lái)計(jì)算干式信號(hào)混合結(jié)果的協(xié)方差矩陣,但僅發(fā)生于參數(shù)域中的第一計(jì)算較簡(jiǎn)單。
計(jì)算步驟1000、1002及1004之后,可獲得干式混合矩陣C0,目標(biāo)顯現(xiàn)信號(hào)的協(xié)方差矩陣R,及干式混合信號(hào)的協(xié)方差矩陣
為了特定決定矩陣Q、P,接著說(shuō)明四個(gè)不同實(shí)施例。另外,說(shuō)明也決定增益補(bǔ)償矩陣G值的圖4d情況(如第三實(shí)施例及第四實(shí)施例)。熟練技術(shù)人員將了解,因?yàn)榇嬖谌舾沙潭茸杂蓻Q定所需矩陣加權(quán)因子,所以存在計(jì)算這些矩陣值的其它實(shí)施例。
本發(fā)明第一實(shí)施例中,矩陣計(jì)算器202操作被設(shè)計(jì)如下。干式上混矩陣首先被導(dǎo)出以達(dá)成信號(hào)波型匹配的最小平方解 此脈絡(luò)中,應(yīng)注意有效。再者,以下方程序?yàn)檎? 此問(wèn)題的解為 C≈C0=AED*(DED*)-1 (15) 其具有最小平方解附加熟知特性,其也可輕易從誤差與近似正交的(13)得到驗(yàn)證。因此,交叉項(xiàng)消失于以下計(jì)算中, 其遵循 ΔR=(ΔY)(ΔY)*(17) 其為平凡地正準(zhǔn)定義,使(10)得到解決。以符號(hào)表示該解為 在此,第二因子RZ-1/2僅通過(guò)操作于對(duì)角上的元素狀定義,而矩陣T解出矩陣方程式TT*=ΔR。有很大的自由選擇此矩陣方程式解。本發(fā)明傳授的方法是從ΔR的單數(shù)值分解開(kāi)始。針對(duì)此對(duì)稱矩陣,其縮減至一般特征向量分解 其中特征向量U為單一、而其欄包含對(duì)應(yīng)以遞減大小分類λmax≥λmin≥0的特征向量的特征向量。通過(guò)設(shè)定(19)中λmin=0,及插入對(duì)應(yīng)自然近似于(18),可獲得本發(fā)明傳授具一解相關(guān)器(Nd=1) 從ΔR最小特征向量λmin添加遺失最小顯著貢獻(xiàn),及添加第二欄至對(duì)應(yīng)(19)的第一因子U及對(duì)角特征向量矩陣元素狀平方根乘積(20),可獲得Nd=2的完整解。詳細(xì)寫(xiě)出此量至 接著,圖11總結(jié)依據(jù)第一實(shí)施例的矩陣P計(jì)算。步驟1101中,當(dāng)考慮圖4a時(shí),使用圖10的步驟1000及步驟1004的結(jié)果來(lái)計(jì)算該誤差信號(hào)或上分支處的相關(guān)信號(hào)的協(xié)方差矩陣ΔR。接著,方程式(19)討論執(zhí)行此矩陣的特征向量分解。接著,稍后將討論依據(jù)多個(gè)可用策略的一選擇矩陣Q。以被選擇矩陣Q為基礎(chǔ),使用被寫(xiě)至圖11中的框1103右側(cè)的方程式計(jì)算矩陣變換解相關(guān)信號(hào)的協(xié)方差矩陣Rz,也就是QDED*Q*的矩陣乘法。接著,以步驟1103獲得的Rz為基礎(chǔ)計(jì)算解相關(guān)器上混矩陣P。可明白此矩陣不必執(zhí)行實(shí)際上混,圖4a中的區(qū)塊P 404輸出處是較輸入處更多信道信號(hào)。此可于單解相關(guān)器例中達(dá)成,但于兩解相關(guān)器例中,解相關(guān)器上混矩陣P接收兩輸入信道及輸出兩輸出信道,且可當(dāng)作圖4f中說(shuō)明的干式上混(upmixer)矩陣。
因此,該第一實(shí)施例獨(dú)特處為計(jì)算C0及P。為了確保該輸出的正確最終相關(guān)結(jié)構(gòu),我們需兩解相關(guān)器。另一方面,優(yōu)點(diǎn)是可僅使用一解相關(guān)器。方程式(20)標(biāo)示此解。明確地說(shuō),實(shí)施具有較小特征值的解相關(guān)器。
本發(fā)明第二實(shí)施例中,矩陣計(jì)算器202操作設(shè)計(jì)如下。該解相關(guān)器混合矩陣被限制為以下型式 由于此限制,單相關(guān)信號(hào)共變異矩陣為純量Rz=rz,而組合輸出(6)的協(xié)方差(covariance)變成 其中α=c2 rz。通常不可能目標(biāo)協(xié)方差R’=R,但可調(diào)整該輸出通道間的感官重要正規(guī)化相關(guān)為大范圍情況中的目標(biāo)者。在此,該目標(biāo)相關(guān)由以下定義 而組合輸出(23)所達(dá)成的相關(guān)由以下給予 方程式(24)及(25)產(chǎn)生以α表示的二次方程式 針對(duì)(26)具有正解α=α0>0的例子,本發(fā)明第二實(shí)施例傳授使用混合矩陣(mix matrix)定義(22)中的常數(shù)(26)為正的兩例中,將使用一產(chǎn)生較小范數(shù)c。無(wú)任何該解存在的例子中,因?yàn)閏的復(fù)合解(complexsolutions)產(chǎn)生解相關(guān)信號(hào)中的可感官相位失真,所以解相關(guān)器貢獻(xiàn)通過(guò)選擇c=0而被設(shè)定為零??梢灾苯訌男盘?hào)
或并入對(duì)象共變異矩陣結(jié)合降混及顯現(xiàn)信息的兩不同方法,計(jì)算
為在此,第一方法將產(chǎn)生復(fù)合值
因此,(26)右側(cè)處,必須分別對(duì)
實(shí)部(real)或量值。然而,可替代是,甚至可使用復(fù)合值
該復(fù)合值標(biāo)示也有用于特定實(shí)施例,具有特定相位項(xiàng)的一相關(guān)。
從(25)可看見(jiàn)的此實(shí)施例特征,與干式混合相較下,其僅降低該相關(guān)。也就是 總之,圖12說(shuō)明該第二實(shí)施例。其開(kāi)始于步驟1101中的協(xié)方差矩陣ΔR計(jì)算,其與圖11中的步驟1101相同。接著,實(shí)施方程式(22)。明確地說(shuō),矩陣P容貌事先設(shè)定,而僅開(kāi)放計(jì)算對(duì)P的兩元素均相同的加權(quán)因子c。明確地說(shuō),具有單欄的矩陣P標(biāo)示此第二實(shí)施例中僅使用一單解相關(guān)器。再者,p元素符號(hào)可澄清該解相關(guān)信號(hào)被添加至如干式混合信號(hào)左信道的一信道,且從該干式混合信號(hào)右信道被扣除。因此,通過(guò)添加該解相關(guān)信號(hào)至一信道,且從另一信道扣除該解相關(guān)信號(hào),可獲得最大解相關(guān)。為了決定c值,執(zhí)行步驟1203、1206、1103及1208。明確地說(shuō),步驟1203中計(jì)算方程式(24)中標(biāo)示的目標(biāo)相關(guān)列。當(dāng)執(zhí)行立體音顯現(xiàn)時(shí),此值為兩音頻信道信號(hào)之間的頻道間交叉相關(guān)值。以步驟1203結(jié)果為基礎(chǔ),方程式(26)為基礎(chǔ)的步驟1206中標(biāo)示者可決定加權(quán)因子α。再者,選擇矩陣Q的矩陣元素值,其于此例中僅計(jì)算如步驟1103中及圖12中框1103右側(cè)方程式標(biāo)示的純量值Rz。最后,如步驟1208標(biāo)示計(jì)算因子c。方程式(26)為可提供兩正解至α的二次方程式。此例中,如上述,該解產(chǎn)出為將使用的c較小范數(shù)。然而,當(dāng)獲得無(wú)該正解時(shí),c被設(shè)定為0。
因此,第二實(shí)施例中,我們使用框1201中的矩陣P標(biāo)示分配用于兩通道的一解相關(guān)器特殊例來(lái)計(jì)算P。針對(duì)某些例,該解不存在,而我們僅關(guān)閉該解相關(guān)器。此實(shí)施例優(yōu)點(diǎn)在于其絕不添加具正相關(guān)的合成信號(hào)。因?yàn)樵撔盘?hào)可理解為局部化幻覺(jué)源,其為降低該顯現(xiàn)輸出信號(hào)音頻質(zhì)量的人為因素。
由于該導(dǎo)出不考慮功率問(wèn)題,我們可能獲得輸出信號(hào)誤匹配,其意指該輸出信號(hào)或多或少具有該降混信號(hào)功率。此例中,我們可于較佳實(shí)施例中實(shí)施附加增益補(bǔ)償以進(jìn)一步增強(qiáng)音頻質(zhì)量。
本發(fā)明第三實(shí)施例中,矩陣計(jì)算器202操作被設(shè)計(jì)如下。起始點(diǎn)為增益補(bǔ)償干式混合 例如,未補(bǔ)償干式混合
為具有(15)給予混合矩陣的最小平方近似結(jié)果。再者,C=GC0,其中G為具有分項(xiàng)g1及g2的一對(duì)角矩陣。此例中 而誤差矩陣為 接著,本發(fā)明第三實(shí)施例傳授選擇補(bǔ)償增益(g1,g2),在(13)給予限制下最小化該誤差功率的加權(quán)總和 (30)中的加權(quán)選擇例是(w1,w2)=(1,1)或(w1,w2)=(R,L)。接著,最終誤差矩陣ΔR依據(jù)方程式(18)-(21)步驟當(dāng)作對(duì)計(jì)算解相關(guān)器混合矩陣P的輸入。此實(shí)施例具吸引力特征是誤差信號(hào)
類似干式上混,添加至最終輸出的解相關(guān)信號(hào)量小于本發(fā)明第一實(shí)施例添加至該最終輸出的量。
圖13摘錄的第三實(shí)施例中,假設(shè)一附加增益矩陣G如圖4d標(biāo)示。依據(jù)方程式(29)及(30)中所寫(xiě)的,使用以下方程式(30)正文中所標(biāo)示的選擇w1、w2,及方程式(13)中所標(biāo)示誤差矩陣限制為基礎(chǔ)來(lái)計(jì)算增益因子g1及g2。執(zhí)行這兩步驟1301、1302之后,我們可使用步驟1303中所標(biāo)示的g1、g2來(lái)計(jì)算誤差信號(hào)協(xié)方差矩陣ΔR。應(yīng)注意,步驟1303中所計(jì)算的此誤差信號(hào)協(xié)方差矩陣,與圖11及圖12中所計(jì)算的協(xié)方差矩陣R不同。接著,相同步驟1102、1103、1104已如圖11的第一實(shí)施例討論般被執(zhí)行。
第三實(shí)施例優(yōu)點(diǎn)是該干式混合不僅波型匹配,另外也增益補(bǔ)償。此有助于進(jìn)一步降低解相關(guān)信號(hào)量,也降低添加該解相關(guān)信號(hào)產(chǎn)生的任何人為因素。因此,第三實(shí)施例嘗試從增益補(bǔ)償及解相關(guān)器加法最可能組合。再次,目的是完全重制包含信道功率的協(xié)方差結(jié)構(gòu),及如通過(guò)最小化方程式(30)使用盡量少合成信號(hào)。
接著討論第四實(shí)施例。步驟1401中,實(shí)施單解相關(guān)器。因此,因?yàn)閷?shí)際實(shí)施時(shí),單解相關(guān)器最具有優(yōu)點(diǎn),所以創(chuàng)造不復(fù)雜的實(shí)施例。接續(xù)步驟1101中,如第一實(shí)施例的步驟1101敘述及討論地計(jì)算協(xié)方差矩陣數(shù)據(jù)R。然而,可替代是,也可如波型匹配之外也具有增益補(bǔ)償?shù)膱D13步驟1303標(biāo)示地計(jì)算該協(xié)方差矩陣數(shù)據(jù)R。接著,檢查協(xié)方差矩陣ΔR非對(duì)角元素的Δp符號(hào)。當(dāng)步驟1402決定此符號(hào)為負(fù)時(shí),因?yàn)閮H有一單解相關(guān)器,所以接著處理步驟1102、1103、1104,其中因rz為純量值,所以步驟1103特別不復(fù)雜。
然而,當(dāng)決定Δp符號(hào)為正時(shí),如設(shè)定矩陣P元素為0而完全刪除該解相關(guān)信號(hào)加號(hào)??商娲?,可縮減解相關(guān)信號(hào)添加為零以上的一值,但縮減至較該符號(hào)應(yīng)為負(fù)的一值微小的一值。然而,優(yōu)選地,矩陣P的矩陣元素不僅被設(shè)定為較小值,且如圖14的區(qū)塊1404中所標(biāo)示被設(shè)定為零。然而,依據(jù)圖4d,決定增益因子g1、g2以執(zhí)行區(qū)塊1406中標(biāo)示的增益補(bǔ)償。明確地說(shuō),計(jì)算該增益因子使方程式(29)右側(cè)處的矩陣主對(duì)角元素變成零。此意指誤差信號(hào)協(xié)方差矩陣于其主對(duì)角處具有零元素。因此,當(dāng)因避免添加具有特定相關(guān)特性的解相關(guān)信號(hào)時(shí)可能產(chǎn)生幻覺(jué)源人為因素(phantom source artefacts)策略而縮減或完全關(guān)閉解相關(guān)信號(hào)時(shí),該例達(dá)成增益補(bǔ)償。
因此,第四實(shí)施例結(jié)合第一實(shí)施例若干特征并視單解相關(guān)器解而定,但包含可決定解相關(guān)信號(hào)質(zhì)量,當(dāng)如該誤差信號(hào)(添加信號(hào))的協(xié)方差矩陣ΔR中的值Δp的質(zhì)量指針為正時(shí),可縮減或完全消除該解相關(guān)信號(hào)。
因?yàn)橐陨系诙?jí)理論對(duì)所使用特定矩陣不敏感,所以應(yīng)以感官考慮為基礎(chǔ)選擇該事先解相關(guān)器矩陣Q。此也指選擇Q考慮與上述各實(shí)施例之間選擇無(wú)關(guān)。
本發(fā)明傳授第一較佳解,包含使用干式立體音混合的單音混合當(dāng)作對(duì)所有解相關(guān)器的輸入。以矩陣元素而言,此意指 qn,k=c1,k+c2,k,k=1,2;n=1,2,...,Nd (31) 其中{qn,k}為Q的矩陣元素,而{cn,k}為C0的矩陣元素。
本發(fā)明傳授的第二解,產(chǎn)生單獨(dú)從降混矩陣D導(dǎo)出的事先解相關(guān)器矩陣Q。該導(dǎo)出以假設(shè)具有單位功率的所有對(duì)象均不相關(guān)為基礎(chǔ)。形成從對(duì)象至其個(gè)別預(yù)測(cè)誤差的上混矩陣給予該假設(shè)。接著,選擇該事先解相關(guān)器權(quán)重平方,與跨越降混信道的總預(yù)測(cè)對(duì)象誤差能量等比例。最后針對(duì)所有解相關(guān)器使用相同權(quán)重。詳細(xì)說(shuō),首先通過(guò)形成N×N矩陣獲得這些權(quán)重, W=I-D*(DD*)-1D(32) 接著導(dǎo)出通過(guò)設(shè)定(32)所有非對(duì)角值為零所定義的估計(jì)對(duì)象預(yù)測(cè)誤差能量矩陣W0。通過(guò)t1,t2標(biāo)示DW0D*的對(duì)角值,其表示對(duì)各降混信道貢獻(xiàn)的總對(duì)象誤差能量,事先解相關(guān)器矩陣元素最后選擇由以下給定 關(guān)于解相關(guān)器特定實(shí)施,可使用如反射器或任何其它解相關(guān)器的所有解相關(guān)器。然而,較佳實(shí)施例中,該解相關(guān)器應(yīng)可保存功率。此意指解相關(guān)器輸出信號(hào)功率應(yīng)與解相關(guān)器輸入信號(hào)功率相同。然而,如當(dāng)計(jì)算矩陣P時(shí),也可吸收非保存功率解相關(guān)器產(chǎn)生的偏移。
如上述,因?yàn)橐恍盘?hào)可被視為局部化合成幻覺(jué)源,所以較佳實(shí)施例嘗試避免以正相關(guān)添加合成信號(hào)。第二實(shí)施例中,這是因區(qū)塊1201標(biāo)示的矩陣P特定結(jié)構(gòu)而明確被避免。再者,第四實(shí)施例中,因步驟1402中的檢查步驟而避免此問(wèn)題。決定解相關(guān)信號(hào)及明確地相關(guān)特性避免該幻覺(jué)源的其它方法可供熟練技術(shù)人員使用,且可用來(lái)關(guān)閉添加如若干實(shí)施例中的型式的該解相關(guān)信號(hào),或可用來(lái)降低該解相關(guān)信號(hào)功率及增加干式信號(hào)功率,以具有一增益補(bǔ)償輸出信號(hào)。
雖然將所有矩陣E,D,A說(shuō)明為復(fù)合矩陣,這些矩陣也可為實(shí)質(zhì)。然而,本發(fā)明也有用于實(shí)際具有非零虛部的復(fù)合系數(shù)的復(fù)合矩陣D,A,E。
再者,其通常為與具有所有矩陣最高時(shí)間及頻率解的矩陣E相較,具有遠(yuǎn)較低頻譜及時(shí)間解的矩陣D及矩陣A的例子。明確地說(shuō),目標(biāo)顯現(xiàn)矩陣及降混矩陣不依靠頻率而依靠時(shí)間而定。關(guān)于降混矩陣,此發(fā)生于明確最佳化降混操作。關(guān)于目標(biāo)顯現(xiàn)矩陣,此可為偶而改變其左及右之間位置的移動(dòng)音頻對(duì)象例。
下述實(shí)施例僅為本發(fā)明原理的例證。熟練技術(shù)人員應(yīng)了解在此說(shuō)明的裝置及細(xì)節(jié)修改及變異。因此,預(yù)期僅受到迫切申請(qǐng)專利范圍限制,而不受到在此實(shí)施例說(shuō)明及解釋呈現(xiàn)特定細(xì)節(jié)的限制。
視發(fā)明性方法特定實(shí)施要求而定,可以硬件或軟件實(shí)施該發(fā)明性方法??墒褂门c可程序計(jì)算機(jī)系統(tǒng)合作執(zhí)行該發(fā)明性方法的數(shù)字儲(chǔ)存媒體,特別是具有儲(chǔ)存其上的電子可讀控制信號(hào)的磁盤(pán),DVD或CD來(lái)執(zhí)行該實(shí)施。通常,本發(fā)明為一種具有儲(chǔ)存于機(jī)器可讀載體的一程序代碼的計(jì)算機(jī)程序產(chǎn)品,當(dāng)該計(jì)算機(jī)程序產(chǎn)品運(yùn)作于一計(jì)算機(jī)上時(shí),可操作該程序代碼執(zhí)行該發(fā)明性方法。也就是說(shuō),該發(fā)明性方法為當(dāng)該計(jì)算機(jī)程序運(yùn)作于一計(jì)算機(jī)上時(shí),具有可執(zhí)行該發(fā)明性方法至少其中之一的一程序代碼的計(jì)算機(jī)程序。
權(quán)利要求
1.一種用于合成具有一第一音頻信道信號(hào)及一第二音頻信道信號(hào)的輸出信號(hào)(350)的裝置,該裝置包含;
一解相關(guān)器級(jí)(356),用于從一降混信號(hào)產(chǎn)生一解相關(guān)信號(hào)(358),該解相關(guān)信號(hào)(358)具有一解相關(guān)單信道信號(hào)或一解相關(guān)第一信道信號(hào)及一解相關(guān)第二信道信號(hào),該降混信號(hào)具有一第一對(duì)象降混信號(hào)及一第二對(duì)象降混信號(hào),該降混信號(hào)表示依一降混信息(354)的多個(gè)音頻對(duì)象信號(hào)的降混;及
一組合器(364),用于執(zhí)行該降混信號(hào)(352)及該解相關(guān)信號(hào)(358)的一加權(quán)組合,其中該組合器(364)是操作以從該降混信息(354)、從標(biāo)示一虛擬重放設(shè)立中的該音頻對(duì)象的虛擬位置的目標(biāo)顯現(xiàn)信息(360)、及說(shuō)明該音頻對(duì)象的參數(shù)音頻對(duì)象信息(362)來(lái)計(jì)算該加權(quán)組合的加權(quán)因子(P,Q,C0,G)。
2.如權(quán)利要求1所述的裝置,其中該組合器(364)是操作以計(jì)算該加權(quán)因子,使該第一對(duì)象降混信號(hào)及該第二對(duì)象降混信號(hào)的一混合操作結(jié)果(452)得以與一目標(biāo)顯現(xiàn)結(jié)果波型匹配。
3.如權(quán)利要求1所述的裝置,其中該組合器(364)是操作以基于下列方程式計(jì)算用于混合該第一對(duì)象降混信號(hào)及該第二對(duì)象降混信號(hào)的一混合矩陣C0
C0=A E D*(D E D*)-1,
其中C0為混合矩陣,其中A為表示該目標(biāo)顯現(xiàn)信息(360)的一目標(biāo)顯現(xiàn)矩陣,其中D為表示該降混信息(354)的一降混矩陣,其中*表示一復(fù)合共軛轉(zhuǎn)置操作,而其中E為表示該參數(shù)音頻對(duì)象信息(362)的一對(duì)象協(xié)方差矩陣。
4.如權(quán)利要求1所述的裝置,其中該組合器(364)是操作以基于下列方程式計(jì)算該加權(quán)因子
R=A E A*,
其中R為將該目標(biāo)顯現(xiàn)信息應(yīng)用在該音頻對(duì)象所獲得的該顯現(xiàn)輸出信號(hào)(350)的一協(xié)方差矩陣,其中A為表示該目標(biāo)顯現(xiàn)信息(360)的一目標(biāo)顯現(xiàn)矩陣,而其中E為表示該參數(shù)音頻對(duì)象信息(362)的一對(duì)象協(xié)方差矩陣。
5.如權(quán)利要求3所述的裝置,其中該組合器(364)是操作以基于下列方程式計(jì)算該加權(quán)因子
R0=C0 D E D* C0*,
其中R0為該降混信號(hào)(350)的降混操作(401)的結(jié)果的一協(xié)方差矩陣。
6.如權(quán)利要求1所述的裝置,其中該組合器(364)是操作以下列方式計(jì)算該加權(quán)因子而使該加權(quán)組合為可表示
通過(guò)計(jì)算干式信號(hào)混合矩陣C0,及將該干式信號(hào)混合矩陣C2應(yīng)用(401)在該降混信號(hào)(352),
計(jì)算一解相關(guān)器后處理矩陣P,及將該解相關(guān)器后處理矩陣P應(yīng)用在該解相關(guān)信號(hào)(358),及
組合(454)該應(yīng)用操作(404,401)的結(jié)果以獲得該顯現(xiàn)輸出信號(hào)(550)。
7.如權(quán)利要求1所述的裝置,其中該解相關(guān)器級(jí)(356)是操作以在饋送一解相關(guān)器(403)之前執(zhí)行一事先解相關(guān)器操作(402)以操縱該降混信號(hào)(352)。
8.如權(quán)利要求7所述的裝置,其中該事先解相關(guān)器操作包含一混合操作,共享以基于標(biāo)示該音頻對(duì)象進(jìn)入該降混信號(hào)的一分配的降混信息(354)來(lái)混合該第一對(duì)象降混信號(hào)及該第二對(duì)象降混信號(hào)。
9.如權(quán)利要求7所述的裝置,其中該組合器(364)是操作以執(zhí)行該第一及第二對(duì)象降混信號(hào)的干式混合操作(401),其中該事先解相關(guān)器操作(402)類似該干式混合操作(401)。
10.如權(quán)利要求9所述的裝置,其中該組合器(364)是操作以使用該干式混合矩陣C0,
其中使用與該干式混合矩陣C0相同的一事先解相關(guān)器矩陣Q來(lái)實(shí)施該事先解相關(guān)器操縱(402)。
11.如權(quán)利要求6所述的裝置,其中該解相關(guān)器后處理矩陣P以執(zhí)行被添加至一干式信號(hào)混合結(jié)果(452)的該解相關(guān)信號(hào)的一協(xié)方差矩陣特征值分解(1102)為基礎(chǔ)。
12.如權(quán)利要求11所述的裝置,其中該組合器(364)是操作以基于從該特征值分解(1102)特征值所獲得的特征值所導(dǎo)出的一矩陣(T)與該解相關(guān)信號(hào)(358)的一協(xié)方差矩陣相乘(1104)來(lái)計(jì)算該加權(quán)因子。
13.如權(quán)利要求11所述的裝置,其中該組合器(364)是操作以計(jì)算該加權(quán)因子,使得一單解相關(guān)器(403)被使用,該解相關(guān)器后處理矩陣P為具有一單欄及等于該顯現(xiàn)輸出信號(hào)中的該信道信號(hào)的數(shù)量的若干行,或其中兩解相關(guān)器(403)被使用,而該解相關(guān)器后處理矩陣P具有兩欄及等于該顯現(xiàn)輸出信號(hào)中的該信道信號(hào)的數(shù)量的若干行。
14.如權(quán)利要求11所述的裝置,其中該組合器是操作以基于以下列方程式為基礎(chǔ)所計(jì)算的該解相關(guān)信號(hào)的一協(xié)方差矩陣來(lái)計(jì)算該加權(quán)因子
RZ=Q D E D* Q*,
其中RZ為該解相關(guān)信號(hào)(358)的協(xié)方差矩陣,Q為一事先解相關(guān)器混合矩陣,D為表示該降混信息(354)的一降混矩陣,E為表示該參數(shù)音頻對(duì)象信息(362)的一音頻對(duì)象協(xié)方差矩陣。
15.如權(quán)利要求6所述的裝置,其中該組合器(364)可操作計(jì)算該加權(quán)因子,計(jì)算該解相關(guān)器后處理矩陣P,添加該解相關(guān)信號(hào)至具相對(duì)符號(hào)的干式混合操作的兩最終通道(452)。
16.如權(quán)利要求15所述的裝置,其中該組合器(364)是操作以計(jì)算該加權(quán)因子,使該顯現(xiàn)輸出信號(hào)的兩信道間的一相關(guān)線索所決定的一加權(quán)因子(c)得以加權(quán)該解相關(guān)信號(hào)(358),該相關(guān)線索類似于基于一目標(biāo)顯現(xiàn)矩陣(A)的一虛擬目標(biāo)顯現(xiàn)操作所決定的一相關(guān)值(1203)。
17.如權(quán)利要求16所述的裝置,其中解出二次方程式(26)以決定該加權(quán)因子(c),且其中,若此二次方程式不存在實(shí)數(shù)解,則減少或停止添加一解相關(guān)信號(hào)(1208)。
18.如權(quán)利要求6所述的裝置,其中該組合器(364)是操作以計(jì)算該加權(quán)因子,使得通過(guò)加權(quán)一干式信號(hào)混合結(jié)果執(zhí)行一增益補(bǔ)償(409)而可呈現(xiàn)該加權(quán)組合,因而與該降混信號(hào)的能量相較之下,該干式信號(hào)混合結(jié)果內(nèi)的能量誤差得以縮減。
19.如權(quán)利要求1所述的裝置,其中該組合器(364)是操作以決定添加一解相關(guān)信號(hào)是否會(huì)產(chǎn)生一人為因素(1402),以及
其中當(dāng)決定一人為因素創(chuàng)造的情況時(shí),該組合器(364)操作以停止或縮減添加該解相關(guān)信號(hào),以及
降低(1406)因縮減或停止(1404)該解相關(guān)信號(hào)所產(chǎn)生的一功率誤差。
20.如權(quán)利要求19所述的裝置,其中該組合器(364)是操作以計(jì)算該加權(quán)因子,使得該干式混合操作(401)的一結(jié)果的功率(401)增加。
21.如權(quán)利要求19所述的裝置,其中該組合器(364)是操作以計(jì)算一誤差協(xié)方差矩陣日期R(1104),其表示該干式上混信號(hào)及由一虛擬目標(biāo)顯現(xiàn)方案使用該目標(biāo)顯現(xiàn)信息(360)所決定的一輸出信號(hào)之間的該誤差信號(hào)的一相關(guān)結(jié)構(gòu),及
其中該組合器(364)操作以決定該誤差協(xié)方差矩陣日期R的一非對(duì)角元素的一符號(hào)(1402),而若該符號(hào)為正,則停止(1104)或縮減該添加。
22.如權(quán)利要求1所述的裝置,進(jìn)一步包含
一時(shí)間/頻率轉(zhuǎn)置器(302),用于以包含多個(gè)次頻帶降混信號(hào)的一頻譜表示轉(zhuǎn)換該降混信號(hào)
其中,針對(duì)每個(gè)次頻帶信號(hào),使用一解相關(guān)器操作(403)及一組合器操作(364)產(chǎn)生多個(gè)顯現(xiàn)輸出次頻帶信號(hào),及
一頻率/時(shí)間轉(zhuǎn)置器(304),用于將該顯現(xiàn)輸出信號(hào)的多個(gè)次頻帶信號(hào)轉(zhuǎn)置為一時(shí)間域表示。
23.如權(quán)利要求1所述的裝置,進(jìn)一步包含一區(qū)塊處理控制器,用于產(chǎn)生該降混信號(hào)的樣本值區(qū)塊,及用于控制該解相關(guān)器(356)及該組合器(364)以處理樣本值區(qū)塊。
24.如權(quán)利要求22所述的裝置,其中為各區(qū)塊及每個(gè)次頻帶信號(hào)提供該音頻對(duì)象信息,且其中對(duì)于一時(shí)間區(qū)塊,該目標(biāo)顯現(xiàn)信息及該對(duì)象降混信息在頻率上是固定的。
25.如權(quán)利要求1所述的裝置,其中該組合器(364)包含一增強(qiáng)矩陣單元(303),其線性操作的組合該第一對(duì)象降混信號(hào)及該第二對(duì)象降混信號(hào)為一干式降混信號(hào)(452),且其中該組合器(364)操作以將該解相關(guān)信號(hào)(358)線性組合為一信號(hào),其在頻道上添加該干式降混信號(hào)構(gòu)成該增強(qiáng)矩陣單元(303)的一立體音輸出,及
其中該組合器(364)包含一矩陣計(jì)算器(202),用于該降混信息(354)及該目標(biāo)顯現(xiàn)信息(360)的該參數(shù)音頻對(duì)象信息(362)為基礎(chǔ),計(jì)算該增強(qiáng)矩陣單元(303)所使用的該線性組合的加權(quán)因子。
26.如權(quán)利要求1所述的裝置,其中操作該組合器(364)計(jì)算該加權(quán)因子,使該顯現(xiàn)輸出信號(hào)中的該解相關(guān)信號(hào)(358)的一能量部分盡量小,以及通過(guò)線性組合該第一對(duì)象降混信號(hào)及該第二對(duì)象降混信號(hào)所獲得的一干式混合信號(hào)(452)能量部分盡量大,使一干式混合信號(hào)單獨(dú)以該目標(biāo)顯現(xiàn)信息(354)為基礎(chǔ)重建一目標(biāo)顯現(xiàn)結(jié)果。
27.一種用于合成具有一第一音頻信道信號(hào)及一第二音頻信道信號(hào)的輸出信號(hào)的方法,包含
從一降混信號(hào)產(chǎn)生(356)一解相關(guān)信號(hào)(358),該具有一解相關(guān)單信道信號(hào)或一解相關(guān)第一信道信號(hào)及一解相關(guān)第二信道信號(hào),該降混信號(hào)具有一第一對(duì)象降混信號(hào)及一第二對(duì)象降混信號(hào),該降混信號(hào)表示依據(jù)一降混信息(354)多個(gè)音頻對(duì)象信號(hào)的降混;及
基于從該降混信息(354)、從標(biāo)示一虛擬重放設(shè)立中的該音頻對(duì)象的虛擬位置的目標(biāo)顯現(xiàn)信息(360)、及說(shuō)明該音頻對(duì)象的參數(shù)音頻對(duì)象信息(362)計(jì)算該加權(quán)組合的加權(quán)因子(P,Q,C0,G)來(lái)執(zhí)行該降混信號(hào)(352)及該解相關(guān)信號(hào)(358)的一加權(quán)組合。
28.一種具有一程序代碼的計(jì)算機(jī)程序,當(dāng)于一處理器運(yùn)作時(shí),適于執(zhí)行權(quán)利要求27所述的方法。
全文摘要
一種用于合成具有一第一音頻通道及一第二音頻信道的顯現(xiàn)輸出信號(hào)的裝置包含一解相關(guān)器級(jí)(356)及一組合器(364),該解相關(guān)器級(jí)(356)基于降混信號(hào)產(chǎn)生一解相關(guān)信號(hào),該組合器(364)基于參數(shù)音頻對(duì)象信息(362)、降混信息(354)及目標(biāo)顯現(xiàn)信息(360)執(zhí)行降混信號(hào)及解相關(guān)信號(hào)的加權(quán)組合。該組合器使用多信道降混解決針對(duì)若干個(gè)別音頻對(duì)象的高質(zhì)量立體音場(chǎng)景重制的矩陣及解相關(guān)最佳組合的問(wèn)題。
文檔編號(hào)H04S3/02GK101809654SQ200880013541
公開(kāi)日2010年8月18日 申請(qǐng)日期2008年4月23日 優(yōu)先權(quán)日2007年4月26日
發(fā)明者J·安德加爾德, L·維萊摩爾斯, H·普恩哈根, B·瑞許, C·法爾克, J·赫爾, J·席爾佩爾特, A·阿爾雷爾, L·泰倫特夫 申請(qǐng)人:杜比瑞典公司, 弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)