專利名稱:用于生成對(duì)低位速率應(yīng)用的參數(shù)表示的方案的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及使用空間參數(shù)對(duì)音頻信號(hào)的多聲道表示進(jìn)行編碼。本發(fā)明教導(dǎo)了用于對(duì)用于根據(jù)比輸出聲道的數(shù)量少的聲道數(shù)量重新創(chuàng)建多聲道信號(hào)的參數(shù)進(jìn)行定義和估計(jì)的新方法。具體地,本發(fā)明旨在使得多聲道表示的位速率最小化,并提供了多聲道信號(hào)的編碼表示,其使得能夠容易地針對(duì)所有可能的聲道配置對(duì)數(shù)據(jù)進(jìn)行編碼和解碼。
背景技術(shù):
隨著對(duì)例如廣播系統(tǒng)中的多聲道音頻的興趣的增長(zhǎng),對(duì)數(shù)字低位速率音頻編碼技術(shù)的需求是明顯的。在PCT/SE02/01372“Efficient andscalable Parametric Stereo Coding for Low Bitrate Audio CodingApplications”中表明,可以根據(jù)立體聲聲像的單聲道縮混(down mix)信號(hào)和附加的非常簡(jiǎn)潔的參數(shù)表示,重新創(chuàng)建出與原始立體聲聲像非常接近地類似的立體聲聲像?;驹硎菍⑤斎胄盘?hào)分成多個(gè)頻帶和時(shí)間段,對(duì)于這些頻帶和時(shí)間段,估計(jì)聲道間強(qiáng)度差(IID)和聲道間相參性(ICC),第一個(gè)參數(shù)是對(duì)特定頻帶中的兩個(gè)聲道之間的功率分布的測(cè)度,第二個(gè)參數(shù)是對(duì)特定頻帶的兩個(gè)聲道之間的相關(guān)性的估計(jì)。在解碼器側(cè),通過(guò)根據(jù)所發(fā)送的IID數(shù)據(jù)將單聲道信號(hào)分布在兩個(gè)輸出聲道之間,并通過(guò)添加去相關(guān)環(huán)境信號(hào)以保持原始立體聲聲道的聲道相關(guān)性質(zhì),來(lái)根據(jù)單聲道信號(hào)重新創(chuàng)建立體聲聲像。
存在根據(jù)立體聲信號(hào)創(chuàng)建多聲道輸出的幾種矩陣化技術(shù)。這些技術(shù)通常依靠相位差來(lái)創(chuàng)建后置聲道(back channel)。通常,與前置聲道(front channel)相比,后置聲道稍微延遲。為了使得性能最大化,在編碼器側(cè)使用從多聲道信號(hào)到兩個(gè)立體聲基本聲道的特殊的縮混規(guī)則來(lái)創(chuàng)建立體聲文件。這些系統(tǒng)通常具有穩(wěn)定的前置聲像而在后置聲道中具有一些環(huán)境聲音,并且將復(fù)雜聲音材質(zhì)分離到不同揚(yáng)聲器中的能力有限。
存在幾種多聲道配置。最公知的配置是5.1配置(中聲道、左前/右前、左環(huán)繞/右環(huán)繞以及LFE聲道)。ITU-R BS.775定義了用于獲得包括比給定聲道配置少的聲道的聲道配置的幾種縮混方案。不是始終必須對(duì)所有聲道進(jìn)行解碼并依賴于縮混,而是在對(duì)聲道進(jìn)行解碼之前,可能期望如下多聲道表示,其使得接收器能夠方便地提取針對(duì)播放聲道配置的相關(guān)參數(shù)。另一另選縮混方案是具有可以映射到解碼器側(cè)的任何揚(yáng)聲器組合的多個(gè)參數(shù)。此外,從可調(diào)節(jié)(scalable)或嵌入式編碼的觀點(diǎn)出發(fā),期望固有地可調(diào)節(jié)的參數(shù)集合,其中例如可以將與環(huán)繞聲道相對(duì)應(yīng)的數(shù)據(jù)以位流形式存儲(chǔ)在增強(qiáng)層中。
在現(xiàn)有技術(shù)中,使用總和信號(hào)或縮混信號(hào)和附加的參數(shù)化側(cè)信息的另一多聲道信號(hào)表示被公知為雙耳暗示編碼(BCC)。在以下文獻(xiàn)中描述了該技術(shù)“Binaural Cue Coding-Part 1Psycho-AcousticFundamentals and Design Principles”,IEEE Transactions on Speechand Audio Processing,vol.11,No.6,November 2003,F(xiàn).Baumgarte,C.Faller和“Binaural Cue Coding.Part IISchemes and Applications”,IEEE Transactions on Speech and Audio Processing,vol.11,No.6,November 2003,C.Faller and F.Baumgarte。
通常,雙耳暗示編碼是用于基于一個(gè)縮混的音頻聲道和側(cè)信息進(jìn)行多聲道空間渲染的方法。要由BCC編碼器計(jì)算并由BCC編碼器使用以進(jìn)行音頻重構(gòu)或音頻渲染的幾個(gè)參數(shù)包括聲道間水平差、聲道間時(shí)間差、以及聲道間相參性參數(shù)。這些聲道間暗示是用于感知空間圖像的決定性因素。對(duì)原始多聲道信號(hào)的時(shí)間采樣的塊賦予這些參數(shù),并且這些參數(shù)是頻率選擇性的,以使得多聲道信號(hào)采樣的每個(gè)塊都具有針對(duì)若干頻帶的若干暗示。在C播放聲道的通常情況下,在多個(gè)聲道對(duì)之間的每個(gè)子帶中(即,針對(duì)相對(duì)于參考聲道的每個(gè)聲道)考慮聲道間水平差和聲道間時(shí)間差。將一個(gè)聲道定義為對(duì)于每個(gè)聲道間水平差的參考聲道。根據(jù)聲道間水平差和聲道間時(shí)間差,可以將源渲染到所使用的播放裝置的多個(gè)揚(yáng)聲器對(duì)中的一對(duì)之間的任何方向。為了確定所渲染的源的寬度或漫射性,針對(duì)所有音頻聲道,每子帶考慮一個(gè)參數(shù)就足夠了。該參數(shù)是聲道間相參性參數(shù)。通過(guò)修改子帶信號(hào)使得所有可能的聲道對(duì)具有同一聲道間相參性參數(shù)來(lái)控制所渲染的源的寬度。
在BCC編碼中,所有聲道間水平差都是在參考聲道1與任何其他聲道之間確定的。例如,當(dāng)將中聲道確定為參考聲道時(shí),計(jì)算左聲道與中聲道之間的第一聲道間水平差、右聲道與中聲道之間的第二聲道間水平差、左環(huán)繞聲道與中聲道之間的第三聲道間水平差、以及右環(huán)繞聲道與中聲道之間的第四聲道間水平差。此情況描述了5聲道方案。當(dāng)5聲道方案附加地包括低頻增強(qiáng)聲道(其也被稱為“重低音(sub-woofer)”聲道)時(shí),計(jì)算該低頻增強(qiáng)聲道與中聲道(其為唯一的參考聲道)之間的第五聲道間水平差。
當(dāng)使用單個(gè)縮混聲道(其也被稱為“單”聲道)和所發(fā)送的諸如ICLD(聲道間水平差)、ICTD(聲道間時(shí)間差)以及ICC(聲道間相參性)的暗示來(lái)重構(gòu)原始多聲道時(shí),使用這些暗示來(lái)修改單聲道信號(hào)的譜系數(shù)。使用確定了各譜系數(shù)的水平修改的正實(shí)數(shù)來(lái)執(zhí)行水平修改。使用確定了各譜系數(shù)的相位修改的量值的復(fù)數(shù)來(lái)生成聲道間時(shí)間差。另一個(gè)函數(shù)確定了相參性影響。通過(guò)首先計(jì)算參考聲道的因子來(lái)計(jì)算各聲道的水平修改的因子。將參考聲道的因子計(jì)算成使得針對(duì)各頻率劃分,所有聲道的功率之和等于總和信號(hào)的功率。然后,基于參考聲道的水平修改因子,使用相應(yīng)的ICLD參數(shù)來(lái)計(jì)算其他聲道的水平修改因子。
由此,為了執(zhí)行BCC合成,要計(jì)算參考聲道的水平修改因子。為了進(jìn)行該計(jì)算,需要針對(duì)頻帶的所有ICLD參數(shù)。然后,基于單個(gè)聲道的該水平修改,可以計(jì)算出其他聲道(即,不是參考聲道的聲道)的水平修改因子。
該方法的缺點(diǎn)在于,為了完全重構(gòu),需要每一個(gè)聲道間水平差。當(dāng)存在易出錯(cuò)的發(fā)送聲道時(shí),該要求更加成問(wèn)題。所發(fā)送的聲道間水平差中的每個(gè)錯(cuò)誤都會(huì)導(dǎo)致所重構(gòu)的多聲道信號(hào)的錯(cuò)誤,因?yàn)樾枰恳粋€(gè)聲道間水平差來(lái)計(jì)算每一個(gè)多聲道輸出信號(hào)。此外,當(dāng)在發(fā)送過(guò)程中丟失了聲道間水平差時(shí),不可能進(jìn)行重構(gòu),盡管只有例如左環(huán)繞聲道或右環(huán)繞聲道需要該聲道間水平差,而這些聲道對(duì)于多聲道重構(gòu)來(lái)說(shuō)不是那么重要,因?yàn)樵谧笄奥暤?隨后被稱為左聲道)、右前聲道(隨后被稱為右聲道)或中聲道中包括了大部分信息。當(dāng)在發(fā)送過(guò)程中丟失了低頻增強(qiáng)聲道的聲道間水平差時(shí),該情況變得更差。在此情況下,不可以進(jìn)行多聲道重構(gòu)或者只可以進(jìn)行錯(cuò)誤的多聲道重構(gòu),盡管低頻增強(qiáng)聲道對(duì)于聽眾的聽覺舒適來(lái)說(shuō)不是那么決定性的。由此,單個(gè)聲道間水平差的錯(cuò)誤被蔓延為所重構(gòu)的多個(gè)輸出聲道中的每一個(gè)內(nèi)的錯(cuò)誤。
雖然這些多聲道參數(shù)化方案基于對(duì)能量分布進(jìn)行充分重構(gòu)的意圖,但是為了對(duì)能量分布進(jìn)行這種正確的重構(gòu)而必須付出的代價(jià)是增大的位速率,因?yàn)楸仨毎l(fā)送用于進(jìn)行空間能量分布的大量聲道間水平差或平衡參數(shù)。盡管這些能量分布方案自然不會(huì)執(zhí)行對(duì)原始聲道的時(shí)間波形的精確重構(gòu),然而由于精確的能量分布特性,它們無(wú)論如何也會(huì)得到足夠的輸出聲道質(zhì)量。
然而,對(duì)于低位速率應(yīng)用,這些方案仍然需要太多的位,這導(dǎo)致如下后果對(duì)于這些低位速率應(yīng)用,人們不會(huì)關(guān)心多聲道重構(gòu),而是只滿足于單聲道或立體聲重構(gòu)。
發(fā)明內(nèi)容
本發(fā)明的目的是提供多聲道處理方案,該多聲道處理方案使得即使在低位速率限制的情況下也可以進(jìn)行多聲道重構(gòu)。
該目的是通過(guò)以下設(shè)備、方法、計(jì)算機(jī)程序以及參數(shù)表示來(lái)實(shí)現(xiàn)的根據(jù)權(quán)利要求1的用于生成參數(shù)表示的設(shè)備、根據(jù)權(quán)利要求19的用于對(duì)多聲道信號(hào)進(jìn)行重構(gòu)的設(shè)備、根據(jù)權(quán)利要求28的生成參數(shù)表示的方法、根據(jù)權(quán)利要求29的對(duì)多聲道信號(hào)進(jìn)行重構(gòu)的方法、根據(jù)權(quán)利要求30的計(jì)算機(jī)程序或根據(jù)權(quán)利要求31的參數(shù)表示。
本發(fā)明基于如下發(fā)現(xiàn)多聲道表示的聽者的主要的主觀聽覺感受是通過(guò)她或他對(duì)播放裝置中聲能所集中的特定區(qū)域/方向的辨識(shí)而產(chǎn)生的。聽者可以在某個(gè)精確度內(nèi)對(duì)該區(qū)域/方向進(jìn)行定位。然而,對(duì)于主觀收聽印象來(lái)說(shuō)不是那么重要的是各個(gè)揚(yáng)聲器之間的聲能的分布。當(dāng)例如所有聲道的聲能集中在播放裝置的一扇形(其在參考點(diǎn)(優(yōu)選地,其為播放裝置的中心點(diǎn))與兩個(gè)揚(yáng)聲器之間延伸)之內(nèi)時(shí),對(duì)于聽者的主觀質(zhì)量印象來(lái)說(shuō),能量在其他揚(yáng)聲器之間如何分布不是那么重要。當(dāng)對(duì)重構(gòu)出的多聲道信號(hào)與原始多聲道信號(hào)進(jìn)行比較時(shí),已經(jīng)發(fā)現(xiàn),當(dāng)聲能在所重構(gòu)出的聲場(chǎng)中的某個(gè)區(qū)域內(nèi)的集中性類似于原始多聲道信號(hào)的對(duì)應(yīng)情況時(shí),在很高程度上是令用戶滿意的。
鑒于此,變得清楚的是現(xiàn)有技術(shù)的參數(shù)化多聲道方案對(duì)大量冗余信息進(jìn)行處理和發(fā)送,因?yàn)檫@種方案關(guān)注于對(duì)播放裝置中的所有聲道之間的完全分布進(jìn)行編碼和發(fā)送。
根據(jù)本發(fā)明,只對(duì)包括最大局部聲能的區(qū)域進(jìn)行編碼,而忽略掉其他聲道之間的能量分布(其對(duì)該最大局部聲能沒有主要貢獻(xiàn)),因此,并非涵蓋用于發(fā)送該信息的任何位。由此,與現(xiàn)有技術(shù)完全能量分布系統(tǒng)相比,本發(fā)明對(duì)來(lái)自聲場(chǎng)的更少的信息進(jìn)行編碼和發(fā)送,因此,使得即使在非常有限的位速率條件下也可以進(jìn)行多聲道重構(gòu)。
換句話說(shuō),本發(fā)明確定最大局部聲音區(qū)相對(duì)于參考位置的方向,并基于該信息,在解碼器側(cè)選擇揚(yáng)聲器的子組,如限定了最大聲音所位于的扇形的揚(yáng)聲器或圍繞該最大聲音的兩個(gè)揚(yáng)聲器。該選擇過(guò)程只使用了所發(fā)送的針對(duì)最大能量區(qū)的方向信息。在解碼器側(cè),將所選擇的聲道中的信號(hào)的能量設(shè)定成使得重構(gòu)出最大局部聲音區(qū)。所選擇的聲道中的能量可以-并且必然-不同于原始多聲道信號(hào)中的對(duì)應(yīng)聲道的能量。然而,最大局部聲音的方向與原始信號(hào)中的最大局部聲音的方向相同或者至少相當(dāng)類似。將合成地創(chuàng)建針對(duì)剩余聲道的信號(hào)作為環(huán)境信號(hào)。還根據(jù)所發(fā)送的(多個(gè))基本聲道(其典型地將是單聲道)來(lái)推導(dǎo)出環(huán)境信號(hào)。然而,為了生成環(huán)境聲道,本發(fā)明并不一定需要任何發(fā)送的信息。取而代之,例如通過(guò)使用用于生成解相關(guān)信號(hào)的混響器或任何其他公知設(shè)備,從單聲道信號(hào)推導(dǎo)出針對(duì)環(huán)境聲道的解相關(guān)信號(hào)。
為了確保所選擇的聲道和剩余聲道的組合能量類似于單聲道信號(hào)或原始信號(hào),執(zhí)行水平控制,該水平控制對(duì)所選擇的聲道和剩余聲道中的所有信號(hào)進(jìn)行調(diào)節(jié),使得滿足能量條件。然而,對(duì)所有聲道的該調(diào)節(jié)并不會(huì)導(dǎo)致最大能量區(qū)的移動(dòng),因?yàn)樵撟畲竽芰繀^(qū)是由所發(fā)送的方向信息確定的,該方向信息用于選擇聲道并用于對(duì)所選擇的聲道中的能量之間的能量比進(jìn)行調(diào)整。
隨后,對(duì)兩個(gè)優(yōu)選實(shí)施例進(jìn)行總結(jié)。本發(fā)明涉及音頻信號(hào)的參數(shù)化多聲道表示的問(wèn)題。一個(gè)優(yōu)選實(shí)施例包括用于對(duì)位于多聲道音頻信號(hào)內(nèi)的聲音定位進(jìn)行編碼和解碼的方法,該方法包括以下步驟在給定了所述多聲道信號(hào)的情況下,在所述編碼器側(cè)對(duì)所述多聲道信號(hào)進(jìn)行縮混;選擇所述多聲道信號(hào)內(nèi)的聲道對(duì);在所述編碼器處,計(jì)算用于對(duì)在所述選擇的聲道之間的聲音進(jìn)行定位的參數(shù);對(duì)所述定位參數(shù)和所述聲道對(duì)選擇進(jìn)行編碼;以及在所述解碼器側(cè),根據(jù)從位流數(shù)據(jù)解碼出的所述選擇和定位參數(shù)來(lái)重新創(chuàng)建多聲道音頻。
另一實(shí)施例包括用于對(duì)多聲道音頻信號(hào)內(nèi)的聲音定位進(jìn)行編碼和解碼的方法,該方法包括以下步驟在給定了所述多聲道信號(hào)的情況下,在所述編碼器側(cè)對(duì)所述多聲道信號(hào)進(jìn)行縮混;計(jì)算表示所述多聲道信號(hào)的角度和半徑;對(duì)所述角度和所述半徑進(jìn)行編碼;以及在所述解碼器側(cè),根據(jù)從位流數(shù)據(jù)解碼出的所述角度和所述半徑來(lái)重新創(chuàng)建多聲道音頻。
下面參照附圖僅以不限制本發(fā)明的范圍或精神的例示性示例的方式對(duì)本發(fā)明進(jìn)行描述,在附圖中圖1a例示了用于選路和聲像調(diào)節(jié)(pan)參數(shù)系統(tǒng)的可能的信號(hào)表示;圖1b例示了用于選路和聲像調(diào)節(jié)參數(shù)系統(tǒng)的可能的信號(hào)表示;
圖1c例示了用于選路和聲像調(diào)節(jié)參數(shù)系統(tǒng)的可能的信號(hào)表示;圖1d例示了用于選路和聲像調(diào)節(jié)參數(shù)系統(tǒng)的可能的框圖;圖2例示了用于選路和聲像調(diào)節(jié)參數(shù)系統(tǒng)的可能的信號(hào)表示表;圖3a例示了可能的兩聲道聲像調(diào)節(jié);圖3b例示了可能的三聲道聲像調(diào)節(jié);圖4a例示了用于角度和半徑參數(shù)系統(tǒng)的可能的信號(hào)表示;圖4b例示了用于角度和半徑參數(shù)系統(tǒng)的可能的信號(hào)表示;圖5a例示了用于生成原始多聲道信號(hào)的參數(shù)表示的創(chuàng)造性設(shè)備的框圖;圖5b示出了用于對(duì)多聲道信號(hào)進(jìn)行重構(gòu)的創(chuàng)造性設(shè)備的示意性框圖;圖5c例示了圖5b的輸出聲道生成器的優(yōu)選實(shí)施例;圖6a示出了選路和聲像調(diào)節(jié)實(shí)施例的通用流程圖;以及圖6b示出了優(yōu)選角度和半徑實(shí)施例的流程圖。
具體實(shí)施例方式
下述實(shí)施例僅僅是對(duì)本發(fā)明的與音頻信號(hào)的多聲道表示有關(guān)的原理的例示。應(yīng)當(dāng)明白,對(duì)于本領(lǐng)域的技術(shù)人員而言,對(duì)這里描述的布置和詳情的修改和變化是顯而易見的。因此,本發(fā)明僅受所附專利權(quán)利要求的范圍的限制,而不受這里通過(guò)對(duì)實(shí)施例的說(shuō)明和闡述的方式而給出的具體詳情的限制。
本發(fā)明第一實(shí)施例(以下稱為‘選路和聲像調(diào)節(jié)’)使用以下參數(shù)來(lái)在揚(yáng)聲器陣列上對(duì)音頻源進(jìn)行定位用于連續(xù)定位兩個(gè)(或三個(gè))喇叭之間的聲音的聲像調(diào)節(jié)(panorama)參數(shù);和定義了向聲像調(diào)節(jié)參數(shù)所應(yīng)用于的揚(yáng)聲器對(duì)(或三個(gè)揚(yáng)聲器)的選路信息。
圖1a到1c例示了該方案,該方案使用包括以下聲道揚(yáng)聲器的典型的5喇叭裝置左前聲道揚(yáng)聲器(L)102、111以及122,中聲道揚(yáng)聲器(C)103、112以及123,右前聲道揚(yáng)聲器(R)104、113以及124,左環(huán)繞聲道揚(yáng)聲器(Ls)101、110以及121,以及右環(huán)繞聲道揚(yáng)聲器(Rs)105、114以及125。在編碼器處將原始5聲道輸入信號(hào)縮混成被編碼、發(fā)送或存儲(chǔ)的單聲道信號(hào)。
在圖1a的示例中,編碼器已確定聲能基本上集中于104(R)和105(Rs)。由此,選擇聲道104和105作為向其應(yīng)用聲像調(diào)節(jié)參數(shù)的揚(yáng)聲器對(duì)。根據(jù)現(xiàn)有技術(shù)的方法對(duì)該聲像調(diào)節(jié)參數(shù)進(jìn)行估計(jì)、編碼以及發(fā)送。箭頭107例示了該情況,箭頭107定義了用于將虛擬聲音源定位于該特定揚(yáng)聲器對(duì)選擇處的限制。類似地,可以根據(jù)現(xiàn)有技術(shù)的方法針對(duì)所述聲道對(duì)來(lái)對(duì)可選立體聲寬度參數(shù)進(jìn)行推導(dǎo)和信號(hào)表示。如圖2的表定義的,可以通過(guò)3位‘選路’信號(hào)來(lái)對(duì)聲道選擇進(jìn)行信號(hào)表示。PSP表示參數(shù)化立體聲對(duì),該表的第二列列出了哪些揚(yáng)聲器按選路信號(hào)的給定值來(lái)應(yīng)用聲像調(diào)節(jié)和可選立體聲寬度信息。DAP表示導(dǎo)出環(huán)境對(duì),即,通過(guò)使用用于生成環(huán)境信號(hào)的任意現(xiàn)有技術(shù)的方法對(duì)PSP進(jìn)行處理而獲得的立體聲信號(hào)。該表的第三列定義哪個(gè)揚(yáng)聲器對(duì)要饋送DAP信號(hào),要么預(yù)定義該揚(yáng)聲器對(duì)的相對(duì)水平,要么可選地通過(guò)環(huán)境水平信號(hào)從編碼器用信號(hào)表示該揚(yáng)聲器對(duì)的相對(duì)水平。0到3的選路值對(duì)應(yīng)于繞4聲道系統(tǒng)(此時(shí)不考慮中聲道揚(yáng)聲器(C))旋轉(zhuǎn),這些值包括按90度步長(zhǎng)(近似的,取決于揚(yáng)聲器陣列幾何形狀)的“前”聲道的PSP和“后”聲道的DAP。由此圖1a對(duì)應(yīng)于選路值1,并且106限定了DAP信號(hào)的空間覆蓋范圍。顯然,該方法使得可以通過(guò)選擇與選路值0到3相對(duì)應(yīng)的揚(yáng)聲器對(duì)來(lái)使聲音對(duì)象繞著房間移動(dòng)360度。
圖1d是包括根據(jù)現(xiàn)有技術(shù)的參數(shù)化立體聲解碼器130、環(huán)境信號(hào)生成器131以及聲道選擇器132的選路和聲像調(diào)節(jié)解碼器的一個(gè)可能的實(shí)施例的框圖。參數(shù)化立體聲解碼器獲取基本聲道(縮混)信號(hào)133、聲像調(diào)節(jié)信號(hào)134以及立體聲寬度信號(hào)135(對(duì)應(yīng)于根據(jù)現(xiàn)有技術(shù)方法的參數(shù)化立體聲位流136)作為輸入,并生成被饋送給聲道選擇器的PSP信號(hào)137。此外,該P(yáng)SP被饋送給環(huán)境生成器,該環(huán)境生成器根據(jù)現(xiàn)有技術(shù)的方法(例如,通過(guò)延遲和混響器)生成也被饋送給聲道選擇器的DAP信號(hào)138。聲道選擇器采用選路信號(hào)139(其與聲像調(diào)節(jié)信號(hào)一起形成方向參數(shù)信息140),并根據(jù)圖2中的表將PSP和DAP信號(hào)連接到對(duì)應(yīng)的輸出聲道141。聲道選擇器內(nèi)的直線對(duì)應(yīng)于由圖1a和圖2例示的情況,選路=1??蛇x地,環(huán)境生成器采用環(huán)境水平信號(hào)142作為輸入,以對(duì)環(huán)境生成器輸出的水平進(jìn)行控制。在另選實(shí)施例中,環(huán)境生成器131還利用信號(hào)134和135來(lái)進(jìn)行DAP生成。
圖1b例示了該方案的另一種可能性這里選擇非相鄰111(L)和114(Rs)作為揚(yáng)聲器對(duì)。因此,可以通過(guò)聲像調(diào)節(jié)參數(shù)來(lái)對(duì)角地移動(dòng)虛擬聲源,如由箭頭116例示的。115描繪了對(duì)應(yīng)的DAP信號(hào)的放置。圖2中的選路值4和5對(duì)應(yīng)于該對(duì)角聲像調(diào)節(jié)。
在以上實(shí)施例的變型例中,當(dāng)選擇兩個(gè)非相鄰揚(yáng)聲器時(shí),如圖3b例示的,根據(jù)三向(three-way)聲像調(diào)節(jié)方案對(duì)所選擇的揚(yáng)聲器對(duì)之間的(多個(gè))揚(yáng)聲器進(jìn)行饋送。作為參照,圖3a示出了常規(guī)立體聲聲像調(diào)節(jié)方案,圖3b示出了三向聲像調(diào)節(jié)方案,這兩個(gè)方案都是根據(jù)現(xiàn)有技術(shù)的方法。圖1c給出了三向聲像調(diào)節(jié)方案的應(yīng)用示例例如,如果102(L)與104(R)形成該揚(yáng)聲器對(duì),則將信號(hào)選路到用于中間位置聲像調(diào)節(jié)值的103(C)。圖1d的聲道選擇器132中的虛線進(jìn)一步例示了該情況,其中廣義的參數(shù)化立體聲解碼器的中聲道輸出143由于所采用的3向聲像調(diào)節(jié)方法而起作用。為了使聲音級(jí)穩(wěn)定化,可以使用帶有大重疊的聲像調(diào)節(jié)曲線。那么,外揚(yáng)聲器也對(duì)中間位置聲像調(diào)節(jié)中的再現(xiàn)有貢獻(xiàn),其中來(lái)自中間揚(yáng)聲器的信號(hào)相對(duì)應(yīng)地衰減,使得在整個(gè)聲像調(diào)節(jié)范圍上實(shí)現(xiàn)恒定功率??梢允褂萌蚵曄裾{(diào)節(jié)的選路方法的其他示例是C-R-Rs和L-[Ls和R]-Rs(即,中間位置聲像調(diào)節(jié)產(chǎn)生來(lái)自Ls和R的信號(hào))。當(dāng)然,可以由選路信號(hào)來(lái)用信號(hào)表示是否應(yīng)用三向聲像調(diào)節(jié)方法。另選地,一種預(yù)定義行為可以是這樣的如果由選路信號(hào)指出了其間具有至少一個(gè)揚(yáng)聲器的兩個(gè)非相鄰揚(yáng)聲器,則應(yīng)當(dāng)應(yīng)用三向聲像調(diào)節(jié)方法。
以上方案可以很好地處理單聲源,并且對(duì)于特殊的聲音效果(例如直升機(jī)在周圍飛)來(lái)說(shuō)是有用的。如果采用針對(duì)不同頻帶的單獨(dú)的選路和聲像調(diào)節(jié),那么也會(huì)涵蓋位于不同位置但是在頻率上分離的多個(gè)源。
本發(fā)明第二實(shí)施例(以下稱為‘角度和半徑’)是以上方案的通用化,其中使用以下參數(shù)來(lái)進(jìn)行定位角度參數(shù),用于在整個(gè)揚(yáng)聲器陣列上對(duì)聲音進(jìn)行連續(xù)定位(360度范圍);和半徑參數(shù),用于在揚(yáng)聲器陣列上對(duì)聲音的擴(kuò)展進(jìn)行控制(0到1范圍)。
換句話說(shuō),可以由極坐標(biāo),角度α和半徑r來(lái)表示多個(gè)揚(yáng)聲器音樂材質(zhì),其中α可以覆蓋整個(gè)360度,因此可以將聲音映射到任何方向。半徑r使得可以將聲音映射到幾個(gè)揚(yáng)聲器而不僅僅映射到兩個(gè)相鄰揚(yáng)聲器。這可以被視為對(duì)以上三向聲像調(diào)節(jié)的通用化,其中由半徑參數(shù)來(lái)確定重疊量(例如,較大值的r對(duì)應(yīng)于小重疊)。
為了對(duì)以上實(shí)施例進(jìn)行例示,假設(shè)在[r]的范圍(被定義為從0到1)內(nèi)的半徑。0是指所有揚(yáng)聲器具有同樣的能量,可以將1解釋成應(yīng)當(dāng)在最靠近于由[α]定義的方向的兩個(gè)相鄰揚(yáng)聲器之間應(yīng)用二聲道聲像調(diào)節(jié)。在編碼器處,可以使用例如輸入揚(yáng)聲器配置和各揚(yáng)聲器中的能量來(lái)提取[α,r],以計(jì)算類似于質(zhì)心的聲音中心點(diǎn)。通常,聲音中心點(diǎn)將更靠近于比播放裝置中的其他揚(yáng)聲器發(fā)出更大聲能的揚(yáng)聲器。為了計(jì)算聲音中心點(diǎn),可以使用播放裝置中的揚(yáng)聲器的空間位置、可選地這些揚(yáng)聲器的方向特性,以及由各揚(yáng)聲器發(fā)出的聲能,該聲能直接取決于相應(yīng)聲道的電信號(hào)的能量。
然后使用角度和半徑[α,r]對(duì)位于多聲道揚(yáng)聲器裝置內(nèi)的聲音中心點(diǎn)進(jìn)行參數(shù)化。
在解碼器側(cè),針對(duì)當(dāng)前使用的揚(yáng)聲器配置使用所述多個(gè)揚(yáng)聲器聲像調(diào)節(jié)規(guī)則,以對(duì)所有[α,r]組合給出各揚(yáng)聲器中的已定義聲音量。由此,在解碼器側(cè)生成了相同聲源方向,就好像存在于解碼器側(cè)一樣。
本發(fā)明的另一優(yōu)點(diǎn)在于解碼器和編碼器聲道配置不必相同,因?yàn)榭梢詫?shù)化映射到在解碼器處當(dāng)前可用的揚(yáng)聲器配置,以仍然實(shí)現(xiàn)正確的聲音定位。
圖4a例示了聲音408位于靠近右前揚(yáng)聲器(R)404處的情況,其中401到405對(duì)應(yīng)于圖1a中的101到105。由于r407是1并且α406指向右前揚(yáng)聲器(R)404與右環(huán)繞揚(yáng)聲器(RS)405之間。解碼器將在右前揚(yáng)聲器(R)404與右環(huán)繞揚(yáng)聲器(RS)之間應(yīng)用雙聲道聲像調(diào)節(jié)。
圖4b例示了聲像417的總體方向靠近于左前揚(yáng)聲器411的情況,其中410到414對(duì)應(yīng)于圖1a中的101到105。所提取的α415將指向該聲像的中間,并且所提取的r416確保了解碼器可以使用多揚(yáng)聲器聲像調(diào)節(jié)來(lái)重新創(chuàng)建聲像寬度,以對(duì)所發(fā)送的屬于所提取的α415和r416的音頻信號(hào)進(jìn)行分布。
可以將角度和半徑參數(shù)化與生成環(huán)境信號(hào)并將其添加給(α的)相反方向的預(yù)定義規(guī)則組合起來(lái)。另選地,可以采用對(duì)環(huán)境信號(hào)的角度和半徑的單獨(dú)信號(hào)表示。
在優(yōu)選實(shí)施例中,使用某些附加的信號(hào)表示來(lái)使本發(fā)明的方案適應(yīng)于某些情況。以上兩個(gè)基本方向參數(shù)方案并未很好地涵蓋所有情況。通常,在L-C-R上需要“全聲級(jí)(soundstage)”,此外期望來(lái)自一個(gè)后置聲道的直達(dá)聲。存在用于對(duì)功能進(jìn)行擴(kuò)展以處理該情況的幾種可能性1.根據(jù)需要發(fā)送附加參數(shù)集合。例如,系統(tǒng)默認(rèn)為縮混信號(hào)與參數(shù)之間的1∶1關(guān)系,但是有時(shí)發(fā)送第二參數(shù)集合,該第二參數(shù)集合也對(duì)與1∶2配置對(duì)應(yīng)的縮混信號(hào)進(jìn)行操作。顯然,通過(guò)疊加所解碼出的參數(shù),可以按此方式獲得任意附加源。
2.使用解碼器側(cè)規(guī)則(取決于選路和聲像調(diào)節(jié)或角度和半徑值)來(lái)取代默認(rèn)聲像調(diào)節(jié)行為。假設(shè)各個(gè)頻帶具有單獨(dú)的參數(shù),一個(gè)可能的規(guī)則是“當(dāng)只對(duì)與其他頻帶顯著不同的少數(shù)幾個(gè)頻帶進(jìn)行選路和聲像調(diào)節(jié)時(shí),除了實(shí)現(xiàn)與示例1的效果相同的效果以外,插入對(duì)于‘少數(shù)幾個(gè)頻帶’的‘其他頻帶’的聲像調(diào)節(jié),并應(yīng)用對(duì)于‘少數(shù)幾個(gè)頻帶’的信號(hào)表示的聲像調(diào)節(jié)。可以使用標(biāo)記來(lái)打開/關(guān)閉該行為。
換句話說(shuō),本示例使用針對(duì)各頻帶的單獨(dú)的參數(shù),并根據(jù)以下規(guī)則在頻率方向上采用插入如果只對(duì)與其他頻帶(主組)顯著不同的少數(shù)幾個(gè)頻帶(外層)進(jìn)行選路和聲像調(diào)節(jié),則根據(jù)以上規(guī)則將外層的參數(shù)解釋成附加參數(shù)集合(盡管未發(fā)送)。對(duì)于所述少數(shù)幾個(gè)頻帶,在頻率方向上插入主組的參數(shù)。最后對(duì)所述少數(shù)幾個(gè)頻帶的當(dāng)前可用的兩個(gè)參數(shù)集合進(jìn)行疊加。這使得可以在與主組的方向顯著不同的方向上放置附加源,而不必發(fā)送附加的參數(shù),同時(shí)避免了針對(duì)所述少數(shù)幾個(gè)頻帶在主方向上的譜洞(spectral hole)。可以使用標(biāo)記來(lái)打開/關(guān)閉該行為。
3.用信號(hào)表示某些特殊的預(yù)設(shè)映射,例如a)將信號(hào)選路到所有揚(yáng)聲器;b)將信號(hào)選路到任意單個(gè)揚(yáng)聲器;以及c)將信號(hào)選路到選定的揚(yáng)聲器(>2)的子集。
以上3個(gè)擴(kuò)展情況適用于選路和聲像調(diào)節(jié)方案,也適用于角度和半徑方案。從以下示例(其中也對(duì)環(huán)境信號(hào)進(jìn)行討論)顯見,對(duì)于選路和聲像調(diào)節(jié)情況來(lái)說(shuō)預(yù)設(shè)映射是尤其有用的。
圖2最后給出了可能的特殊預(yù)設(shè)映射的示例。最后兩個(gè)選路值6和7對(duì)應(yīng)于特殊情況,在該特殊情況中,未發(fā)送聲像調(diào)節(jié)信息,并根據(jù)第4列對(duì)縮混信號(hào)進(jìn)行映射,并根據(jù)最后一列來(lái)生成和映射環(huán)境信號(hào)。最后一行定義的情況創(chuàng)建了“在漫射聲音場(chǎng)的中間”的印象。根據(jù)本示例的系統(tǒng)的位流附加地可以包括用于只要PSP列中的揚(yáng)聲器對(duì)在揚(yáng)聲器陣列中不相鄰就使能三向聲像調(diào)節(jié)的標(biāo)記。
本發(fā)明的另一示例是使用針對(duì)直達(dá)聲的一個(gè)角度和半徑參數(shù)集合和針對(duì)環(huán)境聲的第二角度和半徑參數(shù)集合。在本示例中,發(fā)送單聲道信號(hào),既使用該單聲道信號(hào)來(lái)對(duì)直達(dá)聲進(jìn)行角度和半徑參數(shù)集合聲像調(diào)節(jié),又使用該單聲道信號(hào)來(lái)創(chuàng)建解相關(guān)環(huán)境信號(hào),然后使用針對(duì)環(huán)境的角度和半徑參數(shù)集合來(lái)應(yīng)用該解相關(guān)環(huán)境信號(hào)。示意性地,位流示例可能如下
<angle_direct,radius_direct>
<angle_ambience,radius_ambience>
<M>
本發(fā)明的另一示例既使用選路和聲像調(diào)節(jié)以及角度和半徑參數(shù)化又使用兩個(gè)單聲道信號(hào)。在本示例中,角度和半徑參數(shù)描述了對(duì)來(lái)自單聲道信號(hào)M1的直達(dá)聲的聲像調(diào)節(jié)。此外使用選路和聲像調(diào)節(jié)來(lái)描述如何應(yīng)用從M2產(chǎn)生的環(huán)境信號(hào)。因此所發(fā)送的選路值描述了應(yīng)當(dāng)在哪些聲道中應(yīng)用環(huán)境信號(hào),并且作為示例可以使用圖2的環(huán)境表示。對(duì)應(yīng)的位流示例可能如下<angle_direct,radius_direct>
<route,ambience_level>
<M1_direct>
<M2_ambience>
根據(jù)本發(fā)明的多聲道揚(yáng)聲器裝置中的用于對(duì)聲音進(jìn)行空間定位的參數(shù)化方案是可以按許多方式來(lái)應(yīng)用的構(gòu)件塊i)頻率范圍全局(針對(duì)所有頻帶)選路;或逐頻帶選路。
ii)參數(shù)集合的數(shù)量靜態(tài)(隨時(shí)間固定);或動(dòng)態(tài)(根據(jù)需要發(fā)送附加的集合)。
iii)信號(hào)應(yīng)用,即,對(duì)以下聲音的編碼直達(dá)(干)聲;或環(huán)境(濕)聲。
iv)縮混信號(hào)的數(shù)量與參數(shù)集合的數(shù)量之間的關(guān)系,例如1∶1(單聲道縮混和單個(gè)參數(shù)集合);2∶1(立體聲縮混和單個(gè)參數(shù)集合);或1∶2(單聲道縮混和兩個(gè)參數(shù)集合)。假設(shè)縮混信號(hào)M是所有原始輸入聲道之和。其可以是對(duì)所有輸入的自適應(yīng)加權(quán)和自適應(yīng)相位調(diào)節(jié)的(多個(gè))和。
v)縮混信號(hào)和參數(shù)集合的超位置,例如1∶1+1∶1(兩個(gè)不同的單聲道縮混和對(duì)應(yīng)的單個(gè)參數(shù)集合)后者對(duì)于自適應(yīng)縮混和編碼(例如,陣列(束形成)算法、信號(hào)分離(對(duì)第一最大、次最大...的編碼))來(lái)說(shuō)是有用的。
為了清楚起見,在以下說(shuō)明中,描述了根據(jù)現(xiàn)有技術(shù)的使用在兩個(gè)聲道(圖3a)或三個(gè)聲道(圖3b)之間的平衡參數(shù)來(lái)進(jìn)行聲像調(diào)節(jié)。通常,平衡參數(shù)表示在例如播放裝置中的兩個(gè)揚(yáng)聲器的兩個(gè)不同空間位置之間對(duì)聲源的定位。圖3a和圖3b表示在左聲道與右聲道之間的情況。
圖3a例示了聲像調(diào)節(jié)參數(shù)如何與在揚(yáng)聲器對(duì)上的能量分布相關(guān)聯(lián)的示例。x軸是聲像調(diào)節(jié)參數(shù),范圍是區(qū)間[-1,1],這對(duì)應(yīng)于[極左,極右]。y軸的范圍是
,其中0對(duì)應(yīng)于0輸出,1對(duì)應(yīng)于完全相對(duì)輸出水平。曲線301例示了取決于聲像調(diào)節(jié)參數(shù)有多少輸出分布于左聲道,302例示了右聲道的對(duì)應(yīng)輸出。因此參數(shù)值-1使得應(yīng)將所有輸入聲像調(diào)節(jié)到左揚(yáng)聲器,參數(shù)值0使得應(yīng)將所有輸入聲像調(diào)節(jié)到右揚(yáng)聲器,從而,對(duì)于1的聲像調(diào)節(jié)值反之亦然。
圖3b表示三向平衡情況,其示出了3條可能的曲線311、312以及313。與圖3a類似,x軸覆蓋[-1,1],y軸的范圍是
。與前面一樣,曲線311和312例示了有多少信號(hào)分布到左聲道和右聲道。曲線312例示了有多少信號(hào)分布到中聲道。
隨后,結(jié)合圖5a到6b對(duì)本創(chuàng)造性概念進(jìn)行討論。圖5a例示了用于生成對(duì)具有至少3個(gè)原始聲道的原始多聲道信號(hào)的參數(shù)表示的創(chuàng)造性設(shè)備,該參數(shù)表示包括方向參數(shù)信息,該方向參數(shù)信息待用于與從所述至少3個(gè)原始聲道導(dǎo)出的基本聲道一起對(duì)具有至少2個(gè)聲道的輸出信號(hào)進(jìn)行重構(gòu)。此外,如已結(jié)合圖1a、1b、1c、4a、4b討論的,原始聲道與位于播放裝置中的不同空間位置處的聲源相關(guān)聯(lián)。每個(gè)播放裝置都具有參考位置10(圖1a),優(yōu)選地,該參考位置10是圓的圓心,揚(yáng)聲器101到105沿著該圓布置。
本創(chuàng)造性設(shè)備包括用于確定方向參數(shù)信息的方向信息計(jì)算器50。根據(jù)本發(fā)明,方向參數(shù)信息表示從參考位置10到播放裝置中的如下區(qū)域的方向所述至少3個(gè)原始聲道的組合聲能集中于該區(qū)域。在圖1a中將該區(qū)域表示為扇形12,該扇形12由從參考位置10延伸到右聲道104和從參考位置10延伸到右環(huán)繞聲道105的線來(lái)限定。假設(shè)在當(dāng)前音頻情景下,例如主導(dǎo)聲源位于區(qū)域12中。此外,假設(shè)在所有5個(gè)聲道之間或者在至少右聲道與右環(huán)繞聲道之間的最大局部聲能位于位置14處。此外,由方向箭頭16表示從參考位置到所述區(qū)域尤其是到最大局部聲能14的方向。該方向箭頭由參考位置10和最大局部聲能位置14來(lái)限定。
根據(jù)第一實(shí)施例(其具有表示聲道對(duì)的選路信息和表示所選擇的兩個(gè)聲道之間的能量分布的平衡或聲像調(diào)節(jié)參數(shù),作為方向參數(shù)信息),所重構(gòu)出的最大能量只能沿雙頭箭頭18移動(dòng)。由聲像調(diào)節(jié)或平衡參數(shù)來(lái)確定可以沿箭頭18將多聲道重構(gòu)中最大局部能量布置到的度數(shù)或位置。當(dāng)例如最大局部聲音位于圖1a中的14處時(shí),在本實(shí)施例中不能對(duì)該點(diǎn)進(jìn)行精確編碼。然而,為了對(duì)最大局部能量方向進(jìn)行編碼,表示該方向的平衡參數(shù)可以作為參數(shù),這使得重構(gòu)的最大局部能量落在箭頭18與箭頭16的交叉點(diǎn)上,這在圖1a中被表示為“平衡(聲像調(diào)節(jié))”。
選路和聲像調(diào)節(jié)方案編碼器的一個(gè)可能的實(shí)施例是首先計(jì)算圖1a中的最大局部能量14以及對(duì)應(yīng)的角度和半徑。利用該角度選擇聲道對(duì)(或三個(gè)聲道),這產(chǎn)生了選路參數(shù)值。最后將該角度轉(zhuǎn)換成針對(duì)所選擇的聲道對(duì)的聲像調(diào)節(jié)值,然后,可選地,利用所述半徑來(lái)計(jì)算環(huán)境水平參數(shù)。
然而,圖1a的實(shí)施例的優(yōu)勢(shì)在于其不必精確地計(jì)算局部最大聲能14以確定聲道對(duì)和平衡。取而代之,通過(guò)檢查原始聲道中的能量并通過(guò)選擇具有最大能量的兩個(gè)聲道(或例如L-C-R的三個(gè)聲道),根據(jù)聲道來(lái)簡(jiǎn)單地推導(dǎo)出必要的方向信息。該識(shí)別出的聲道對(duì)(三個(gè)聲道)在播放裝置中限定了扇形12,最大局部聲能14將位于該扇形12中。由此,該聲道對(duì)選擇確定了粗略的方向。將通過(guò)平衡參數(shù)來(lái)執(zhí)行對(duì)該方向的“細(xì)調(diào)”。為了進(jìn)行大致的近似,本發(fā)明簡(jiǎn)單地通過(guò)計(jì)算所選擇的聲道的能量之間的商來(lái)確定平衡參數(shù)。由此,由于尚未選擇的其他聲道C、L、Ls,通過(guò)聲道對(duì)選擇和平衡參數(shù)編碼的方向16可能由于其他揚(yáng)聲器的貢獻(xiàn)而與實(shí)際最大局部能量方向有一點(diǎn)點(diǎn)偏離。然而,為了便于減小位速率,在圖1a的選路和聲像調(diào)節(jié)實(shí)施例中接受這些偏離。
圖5a的設(shè)備附加地包括用于生成參數(shù)表示以使得該參數(shù)表示包括方向參數(shù)信息的數(shù)據(jù)輸出生成器52。注意,在優(yōu)選實(shí)施例中,表示從參考位置到最大局部能量的(至少)大致方向的該方向參數(shù)信息是從編碼器發(fā)送到解碼器的唯一聲道間水平差信息。因此,與現(xiàn)有技術(shù)的BCC方案相比,本發(fā)明只須發(fā)送單個(gè)平衡參數(shù),而不是發(fā)送針對(duì)5聲道系統(tǒng)的4個(gè)或5個(gè)平衡參數(shù)。
優(yōu)選地,方向信息計(jì)算器50可操作地確定這樣的方向信息,即,使得組合能量所集中的區(qū)域包括播放裝置中的總聲能的至少50%。
此外或者另選地,優(yōu)選地,方向信息計(jì)算器50可操作地確定這樣的方向信息,即,使得所述區(qū)域只包括播放裝置中的具有比同樣位于所述區(qū)域內(nèi)的最大局部能量值的75%更大的局部能量值的位置。
圖5b示出了創(chuàng)造性的解碼器裝置。具體地,圖5b示出了用于使用至少一個(gè)基本聲道和參數(shù)表示對(duì)多聲道信號(hào)進(jìn)行重構(gòu)的設(shè)備,該參數(shù)表示包括表示從播放裝置中的一位置到播放裝置中的至少3個(gè)原始聲道的組合聲能所集中的區(qū)域的方向,根據(jù)該參數(shù)表示推導(dǎo)出了所述至少一個(gè)基本聲道。具體地,本創(chuàng)造性裝置包括用于接收可以進(jìn)入單個(gè)數(shù)據(jù)流或者可以進(jìn)入不同數(shù)據(jù)流的所述至少一個(gè)基本聲道和參數(shù)表示的輸入接口53。該輸入接口將基本聲道和方向參數(shù)信息輸出到輸出聲道生成器54中。
輸出聲道生成器可操作地生成待相對(duì)于參考位置在播放裝置中定位的輸出聲道的數(shù)量,該輸出聲道數(shù)量比基本聲道的數(shù)量大。具有創(chuàng)造性的是,輸出聲道生成器可操作地響應(yīng)于方向參數(shù)信息而生成輸出聲道,使得從參考點(diǎn)到所重構(gòu)出的輸出聲道的組合能量所集中的區(qū)域的方向類似于由方向參數(shù)信息表示的方向。為此,輸出聲道生成器54需要與參考位置有關(guān)的信息,可以發(fā)送或者優(yōu)選地預(yù)先確定該信息。此外,輸出聲道生成器54需要與在播放裝置中的揚(yáng)聲器的不同空間位置有關(guān)的信息,這些揚(yáng)聲器要在所重構(gòu)出的輸出聲道輸出55處連接到輸出聲道生成器。同樣優(yōu)選地,預(yù)先確定該信息,并且該信息可以容易地通過(guò)表示普通5加1裝置或修改的裝置或具有7個(gè)或更多個(gè)或更少個(gè)聲道的聲道配置的某些信息位來(lái)用信號(hào)表示。
圖5c示出了圖5b中的創(chuàng)造性輸出聲道生成器54的優(yōu)選實(shí)施例。將方向信息輸入到聲道選擇器中。聲道選擇器56選擇待由方向信息確定其能量的輸出聲道。在圖1的實(shí)施例中,所選擇的聲道是在方向信息選路位(圖2的第一列)中或多或少地顯式地用信號(hào)表示的聲道對(duì)中的聲道。
在圖4的實(shí)施例中,待由聲道選擇器56選擇的聲道是隱式地用信號(hào)來(lái)表示的,并且無(wú)需與連接到重構(gòu)器的播放裝置相關(guān)聯(lián)。取而代之,角度α指向播放裝置中的某個(gè)方向。不管播放揚(yáng)聲器裝置是否與原始聲道裝置相同,聲道選擇器56都可以確定限定了角度α所位于的扇形的多個(gè)揚(yáng)聲器。這可以通過(guò)幾何計(jì)算或優(yōu)選地通過(guò)查找表來(lái)執(zhí)行。
此外,該角度還表示在限定了所述扇形的聲道之間的能量分布。特定角度α還限定了對(duì)聲道的聲像調(diào)節(jié)或平衡。當(dāng)考慮圖4a時(shí),角度α在某個(gè)點(diǎn)與圓相交,該點(diǎn)被表示成“聲能中心”,與右環(huán)繞揚(yáng)聲器405相比,該點(diǎn)更靠近于右揚(yáng)聲器404。由此,解碼器基于該聲能中心點(diǎn)和該點(diǎn)到右揚(yáng)聲器404和右環(huán)繞揚(yáng)聲器405的距離,計(jì)算揚(yáng)聲器404與揚(yáng)聲器405之間的平衡參數(shù)。然后,聲道選擇器56將其聲道選擇用信號(hào)傳送給擴(kuò)混器(up-mixer)。聲道選擇器將從所有輸出聲道中選擇至少兩個(gè)聲道,并且,在圖4b的實(shí)施例中,甚至選擇兩個(gè)以上揚(yáng)聲器。然而,除了如下情況以外,聲道選擇器永遠(yuǎn)不會(huì)選擇所有揚(yáng)聲器用信號(hào)發(fā)送了特殊的所有揚(yáng)聲器信息。然后,擴(kuò)混器57基于顯式地發(fā)送到方向信息中的平衡參數(shù)或基于從所發(fā)送的角度推導(dǎo)出的平衡值,對(duì)通過(guò)基本聲道線58接收到的單聲道信號(hào)執(zhí)行擴(kuò)混。在優(yōu)選實(shí)施例中,還發(fā)送聲道間相參性參數(shù),并且擴(kuò)混器57使用該聲道間相參性參數(shù)來(lái)計(jì)算選擇的聲道。所選擇的聲道將輸出直達(dá)聲或“干聲”,其負(fù)責(zé)對(duì)最大局部聲音進(jìn)行重構(gòu),其中通過(guò)所發(fā)送的方向信息對(duì)該最大局部聲音的位置進(jìn)行編碼。
優(yōu)選地,還對(duì)其他聲道(即,剩余的或非選定聲道)提供輸出信號(hào)。使用環(huán)境信號(hào)生成器來(lái)生成針對(duì)其他聲道的輸出信號(hào),該環(huán)境信號(hào)生成器例如包括用于生成解相關(guān)“濕”聲的混響器。優(yōu)選地,該解相關(guān)聲音也是從(多個(gè))基本聲道推導(dǎo)出來(lái)的,并被輸入到剩余的聲道中。優(yōu)選地,圖5b中的創(chuàng)造性輸出聲道生成器54還包括水平控制器60,該水平控制器60對(duì)擴(kuò)混后的選定聲道以及剩余聲道進(jìn)行調(diào)節(jié),使得輸出聲道中的總能量等于所發(fā)送的(多個(gè))基本聲道中的能量或與所發(fā)送的(多個(gè))基本聲道中的能量成某個(gè)關(guān)系。當(dāng)然,該水平控制可以針對(duì)所有聲道執(zhí)行全局能量調(diào)節(jié),但是基本上不會(huì)改變由方向參數(shù)信息所編碼并發(fā)送的聲能集中性。
在低位速率實(shí)施例中,如上所討論的,本發(fā)明不需要任何發(fā)送的信息來(lái)生成剩余的環(huán)境聲道。取而代之,根據(jù)預(yù)先定義的解相關(guān)規(guī)則從所發(fā)送的單聲道信號(hào)推導(dǎo)出針對(duì)環(huán)境聲道的信號(hào),并將該信號(hào)轉(zhuǎn)發(fā)給剩余的聲道。在該低位速率實(shí)施例中預(yù)先定義了環(huán)境聲道的水平與所選擇的聲道的水平之間的水平差。
對(duì)于提供了更好的輸出質(zhì)量但是也要求增大的位速率的更先進(jìn)的設(shè)備,也可以在編碼器側(cè)計(jì)算并發(fā)送環(huán)境聲能方向。此外,可以生成第二縮混聲道,其為環(huán)境聲音的“主聲道”。優(yōu)選地,通過(guò)將原始多聲道信號(hào)中的環(huán)境聲音與非環(huán)境聲音分離開來(lái),在編碼器側(cè)生成該環(huán)境主聲道。
圖6a示出了選路和聲像調(diào)節(jié)實(shí)施例的流程圖。在步驟61中,選擇具有最高能量的聲道對(duì)。然后,計(jì)算該對(duì)之間的平衡參數(shù)(62)。然后,將該聲道對(duì)和平衡參數(shù)作為方向參數(shù)信息發(fā)送給解碼器(36)。在解碼器側(cè),使用所發(fā)送的方向參數(shù)信息來(lái)確定聲道對(duì)和聲道之間的平衡(64)?;谠撀暤缹?duì)和平衡值,使用例如普通單聲道/立體聲擴(kuò)混器(PSP)來(lái)生成直接聲道的信號(hào)(65)。此外,使用一個(gè)或更多個(gè)解相關(guān)環(huán)境信號(hào)(DAP)來(lái)創(chuàng)建針對(duì)剩余聲道的解相關(guān)環(huán)境信號(hào)(66)。
圖6b中作為流程圖例示了角度和半徑實(shí)施例。在步驟71中,計(jì)算(虛擬)播放裝置中的聲能的中心。基于該聲音中心和參考位置,確定從該參考位置到能量中心的向量的角度和距離(72)。
然后,如步驟73所示,將該角度和距離作為方向參數(shù)信息(角度)和擴(kuò)展測(cè)度(距離)來(lái)發(fā)送。該擴(kuò)展測(cè)度表示有多少揚(yáng)聲器對(duì)于生成直達(dá)聲起作用。換句話說(shuō),該擴(kuò)展測(cè)度表示能量所集中的區(qū)域的地點(diǎn),該地點(diǎn)不是位于兩個(gè)揚(yáng)聲器之間的連接線上(這種位置完全由這些揚(yáng)聲器之間的平衡參數(shù)來(lái)限定),但是不是位于這種連接線上。為了重構(gòu)這種位置,需要兩個(gè)以上揚(yáng)聲器。
在優(yōu)選實(shí)施例中,與所有直接揚(yáng)聲器發(fā)出完全相關(guān)的信號(hào)的情況相比,還可以使用擴(kuò)展參數(shù)作為一種相參性參數(shù)來(lái)合成地增大聲音的寬度。在此情況下,也可以使用所述向量的長(zhǎng)度來(lái)對(duì)生成待添加到針對(duì)“直接”聲道的信號(hào)的解相關(guān)信號(hào)的混響器或任何其他設(shè)備進(jìn)行控制。
在解碼器側(cè),如在圖6b的步驟74處表示的,使用角度、距離、參考位置以及播放聲道裝置來(lái)確定播放裝置中的聲道的子組。在步驟75中,使用由角度、半徑,因而由在子組中包括的聲道數(shù)量來(lái)控制的1到n擴(kuò)混來(lái)生成針對(duì)該子組的信號(hào)。當(dāng)該子組中的聲道的數(shù)量很少,并且例如等于兩個(gè)(這是當(dāng)半徑的值很大時(shí)的情況),如在圖6a的實(shí)施例中那樣,可以使用通過(guò)由所述向量的角度表示的平衡參數(shù)而進(jìn)行的簡(jiǎn)單擴(kuò)混。然而,當(dāng)半徑減小,并且因此子組內(nèi)的聲道數(shù)量增加時(shí),可以在解碼器側(cè)使用查找表,該查找表以角度和半徑作為輸入,并以對(duì)與某個(gè)向量和水平參數(shù)相關(guān)聯(lián)的子組中的每個(gè)聲道的標(biāo)識(shí)作為輸出,優(yōu)選地,該水平參數(shù)是這樣的百分比參數(shù),即,將該百分比參數(shù)施加于單聲道信號(hào)能量以確定所選擇的子組內(nèi)的輸出聲道中的每一個(gè)中的信號(hào)能量。如圖6b的步驟76所述,生成解相關(guān)環(huán)境信號(hào)并將其轉(zhuǎn)發(fā)給非選定揚(yáng)聲器。
根據(jù)所述多個(gè)創(chuàng)造性方法的特定實(shí)現(xiàn)要求,可以將所述多個(gè)創(chuàng)造性方法實(shí)現(xiàn)為硬件或軟件??梢允褂脭?shù)字存儲(chǔ)介質(zhì),尤其是其上存儲(chǔ)有電子地可讀控制信號(hào)的盤或CD,來(lái)執(zhí)行該實(shí)現(xiàn),該可讀控制信號(hào)與可編程計(jì)算機(jī)系統(tǒng)相合作,使得執(zhí)行所述多個(gè)創(chuàng)造性方法。概括起來(lái),本發(fā)明因此是具有存儲(chǔ)在機(jī)器可讀載體上的程序代碼的計(jì)算機(jī)程序產(chǎn)品,當(dāng)在計(jì)算機(jī)上運(yùn)行該計(jì)算機(jī)程序產(chǎn)品時(shí),該程序代碼可操作地執(zhí)行所述多個(gè)創(chuàng)造性方法。換句話說(shuō),所述多個(gè)創(chuàng)造性方法因此是計(jì)算機(jī)程序,該計(jì)算機(jī)程序具有用于在計(jì)算機(jī)上運(yùn)行該計(jì)算機(jī)程序時(shí)執(zhí)行所述多個(gè)創(chuàng)造性方法中的至少一個(gè)的程序代碼。
權(quán)利要求
1.一種用于生成對(duì)具有至少3個(gè)原始聲道(L、R、Rs)的原始多聲道信號(hào)的參數(shù)表示的設(shè)備,所述參數(shù)表示包括方向參數(shù)信息,該方向參數(shù)信息被用于連同從所述至少3個(gè)原始聲道推導(dǎo)出的基本聲道一起來(lái)對(duì)具有至少2個(gè)聲道的輸出信號(hào)進(jìn)行重構(gòu),所述原始聲道與位于播放裝置中的不同空間位置處的多個(gè)聲源(103、104、105)相關(guān)聯(lián),所述播放裝置具有參考位置(10),該設(shè)備包括方向信息計(jì)算器(50),用于確定表示從所述播放裝置中的所述參考位置(16)到所述至少3個(gè)原始聲道的組合聲能所集中(14)的區(qū)域(12)的方向的方向參數(shù)信息;和數(shù)據(jù)輸出生成器(52),用于生成所述參數(shù)表示,使得所述參數(shù)表示包括所述方向參數(shù)信息。
2.根據(jù)權(quán)利要求1所述的設(shè)備,其中所述方向信息計(jì)算器(50)包括聲道對(duì)搜索器,用于對(duì)在所述至少3個(gè)原始聲道中具有最大能量的原始聲道對(duì)進(jìn)行搜索(61),或用于對(duì)在至少4個(gè)原始聲道中具有最大能量的三個(gè)原始聲道進(jìn)行搜索(61);平衡參數(shù)計(jì)算器,用于計(jì)算(62)表示所述原始聲道對(duì)之間的平衡的平衡參數(shù),并且其中所述數(shù)據(jù)輸出生成器(52)可操作地將對(duì)所述原始聲道對(duì)和所述平衡參數(shù)的表示作為所述方向參數(shù)信息包括在所述參數(shù)表示中。
3.根據(jù)權(quán)利要求2所述的設(shè)備,其中所述聲道對(duì)搜索器可操作地將所述原始聲道對(duì)編碼成多個(gè)碼字中的一個(gè)碼字,其中每個(gè)碼字都被分配給所述多個(gè)原始聲道之中的可能聲道對(duì)。
4.根據(jù)以上權(quán)利要求之一所述的設(shè)備,其中所述方向信息計(jì)算器可操作地計(jì)算所述方向參數(shù)信息,使得所述方向參數(shù)信息只包括與待通過(guò)聲道的子組而重構(gòu)的能量分布有關(guān)的信息,所述聲道的子組至少包括2個(gè)聲道并且最多包括比原始聲道的數(shù)量更少的多個(gè)聲道。
5.根據(jù)權(quán)利要求4或權(quán)利要求1所述的設(shè)備,其中所述方向信息計(jì)算器可操作地計(jì)算(72)參考線(9)與從所述參考位置指向所述組合聲能所集中的區(qū)域的向量之間的角度;并且其中所述數(shù)據(jù)輸出生成器可操作地將與所述角度有關(guān)的信息作為所述方向參數(shù)信息包括在所述參數(shù)表示中。
6.根據(jù)權(quán)利要求5所述的設(shè)備,其中所述方向信息計(jì)算器(50)可操作地計(jì)算所述播放裝置內(nèi)的聲能中心點(diǎn),并且其中所述方向信息計(jì)算器(50)進(jìn)一步可操作地確定所述參考線與從所述參考位置到聲音中心點(diǎn)的所述向量之間的角度。
7.根據(jù)權(quán)利要求5或6所述的設(shè)備,還包括擴(kuò)展計(jì)算器,用于計(jì)算所述向量的長(zhǎng)度,所述向量的長(zhǎng)度表示所述原始多聲道信號(hào)的聲音擴(kuò)展情況,并且其中所述數(shù)據(jù)輸出生成器可操作地將所述向量的長(zhǎng)度信息作為擴(kuò)展參數(shù)包括在所述參數(shù)表示中。
8.根據(jù)權(quán)利要求7所述的設(shè)備,其中所述擴(kuò)展計(jì)算器可操作地將所述向量的長(zhǎng)度在0與1之間調(diào)節(jié),其中長(zhǎng)度0對(duì)應(yīng)于所述參考點(diǎn),長(zhǎng)度1對(duì)應(yīng)于所述聲源的不同空間位置可以位于的線。
9.根據(jù)權(quán)利要求5到8之一所述的設(shè)備,其中所述方向信息計(jì)算器(50)可操作地計(jì)算另一位置的另一角度,所述另一位置位于所述多個(gè)原始聲道內(nèi)的環(huán)境聲音的組合聲能所集中的區(qū)域中。
10.根據(jù)權(quán)利要求9所述的設(shè)備,其中所述方向信息計(jì)算器(50)可操作地從所述原始信號(hào)提取環(huán)境信號(hào),并對(duì)所述提取的環(huán)境信號(hào)進(jìn)行處理以獲得另一基本聲道,所述另一基本聲道在當(dāng)對(duì)所述多聲道信號(hào)的環(huán)境聲道進(jìn)行重構(gòu)時(shí)連同所述另一角度一起使用。
11.根據(jù)以上權(quán)利要求之一所述的設(shè)備,其中所述方向信息計(jì)算器(50)可操作地確定所述方向信息,使得組合能量所集中的所述區(qū)域包括所述播放裝置中的總聲能的至少50%。
12.根據(jù)以上權(quán)利要求之一所述的設(shè)備,其中所述方向信息計(jì)算器(50)可操作地確定所述方向信息,使得所述區(qū)域只包括所述播放裝置中的具有比最大局部能量值的75%更大的局部能量值的位置,該最大局部能量值也位于所述區(qū)域內(nèi)。
13.根據(jù)以上權(quán)利要求之一所述的設(shè)備,還包括用于對(duì)所述原始聲道進(jìn)行縮混以獲得至少一個(gè)基本聲道的縮混器,并且其中所述數(shù)據(jù)輸出生成器可操作地將所述至少一個(gè)縮混聲道包括在所述參數(shù)表示中。
14.根據(jù)以上權(quán)利要求之一所述的設(shè)備,該設(shè)備還包括環(huán)境信號(hào)水平計(jì)算器,用于利用所述原始多聲道信號(hào)來(lái)計(jì)算環(huán)境信號(hào)水平,并且其中所述數(shù)據(jù)輸出生成器可操作地將所述環(huán)境信號(hào)水平包括在所述參數(shù)表示中。
15.根據(jù)以上權(quán)利要求之一所述的設(shè)備,其中所述數(shù)據(jù)輸出生成器可操作地將三向聲像調(diào)節(jié)指示輸入到所述參數(shù)表示中。
16.根據(jù)以上權(quán)利要求之一所述的設(shè)備,進(jìn)一步包括參數(shù)計(jì)算控制器,用于基于所述原始多聲道信號(hào)來(lái)確定對(duì)至少一個(gè)附加參數(shù)的需要,所述參數(shù)計(jì)算控制器可操作地對(duì)所述數(shù)據(jù)輸出生成器進(jìn)行控制,以將所述至少一個(gè)附加參數(shù)包括在所述參數(shù)表示中。
17.根據(jù)以上權(quán)利要求之一所述的設(shè)備,其中所述方向信息計(jì)算器(50)可操作地計(jì)算待與所述方向參數(shù)信息一起使用的另一方向參數(shù)信息,并且其中所述數(shù)據(jù)輸出生成器可操作地將所述另一方向參數(shù)信息而不是所述方向參數(shù)信息,以及控制信號(hào)引入到所述參數(shù)表示中,其中所述控制信號(hào)是這樣的,即,其指示多聲道重構(gòu)器除了在所述參數(shù)表示中未包括的所述方向參數(shù)信息以外還要使用所述另一方向參數(shù)信息,所述參數(shù)表示中未包括的所述方向參數(shù)信息要通過(guò)插入使用所述參數(shù)表示中的其他方向參數(shù)信息來(lái)推導(dǎo)出。
18.根據(jù)以上權(quán)利要求之一所述的設(shè)備,其中所述方向信息計(jì)算器(50)可操作地計(jì)算針對(duì)所述原始多聲道信號(hào)的一個(gè)以上頻帶或針對(duì)所述原始多聲道信號(hào)的一個(gè)以上時(shí)間段的方向參數(shù)信息。
19.一種用于使用至少一個(gè)基本聲道和參數(shù)表示對(duì)多聲道信號(hào)進(jìn)行重構(gòu)的設(shè)備,該參數(shù)表示包括表示從播放裝置中的參考位置到所述播放裝置中的至少3個(gè)原始聲道的組合聲能所集中的區(qū)域的方向的方向參數(shù)信息,從所述至少3個(gè)原始聲道推導(dǎo)出了所述至少一個(gè)基本聲道,該設(shè)備包括輸出聲道生成器(54),用于生成待相對(duì)于所述參考位置(10)而定位于所述播放裝置中的多個(gè)輸出聲道,所述輸出聲道的數(shù)量比所述基本聲道的數(shù)量大,其中所述輸出聲道生成器(54)可操作地響應(yīng)于所述方向參數(shù)信息而生成所述輸出聲道,使得從所述參考位置(10)到所述重構(gòu)的輸出聲道的所述組合能量所集中的區(qū)域的方向取決于由所述方向參數(shù)信息表示的方向。
20.根據(jù)權(quán)利要求19所述的設(shè)備,其中所述輸出聲道生成器可操作地基于所述方向參數(shù)信息計(jì)算至少2個(gè)輸出聲道,并針對(duì)剩余輸出聲道使用從所述基本聲道推導(dǎo)出的信號(hào)來(lái)生成環(huán)境信號(hào),從所述基本聲道推導(dǎo)出的所述信號(hào)在延遲、增益、相關(guān)性或均衡化方面與所述基本聲道不同。
21.根據(jù)權(quán)利要求19或20所述的設(shè)備,其中所述方向參數(shù)信息包括與選擇的聲道對(duì)有關(guān)的信息,并且其中所述平衡參數(shù)表示所述選擇的輸出聲道對(duì)之間的平衡,并且其中所述輸出聲道生成器(54)可操作地計(jì)算所述選擇的輸出聲道對(duì),以使得所述聲道對(duì)之間的能量分布由所述平衡參數(shù)來(lái)確定,并且計(jì)算在所述選擇的輸出聲道對(duì)中不包括的聲道的環(huán)境聲道信號(hào)。
22.根據(jù)權(quán)利要求20或21所述的設(shè)備,其中所述輸出聲道生成器(54)可操作地計(jì)算所述剩余聲道,使得所述剩余聲道的能量與預(yù)先設(shè)定的設(shè)置相一致,或者使得所述剩余聲道的組合能量取決于在所述參數(shù)表示中附加地包括的環(huán)境參數(shù)。
23.根據(jù)權(quán)利要求19或20所述的設(shè)備,其中所述方向參數(shù)信息包括與所述播放裝置中的所述參考位置(10)相關(guān)聯(lián)的角度,所述角度限定了源自所述播放裝置中的參考位置的向量,并且其中所述輸出聲道生成器(54)可操作地將所述角度映射到所述播放裝置中的所有聲道的子組,并基于所述角度確定在所述子組中的聲道之間的能量分布。
24.根據(jù)權(quán)利要求23所述的設(shè)備,其中所述方向參數(shù)信息進(jìn)一步包括與向量的長(zhǎng)度有關(guān)的信息,其中所述輸出聲道生成器(54)可操作地對(duì)所述角度進(jìn)行映射,使得所述子組中的聲道的數(shù)量取決于所述向量的長(zhǎng)度。
25.根據(jù)權(quán)利要求23或24所述的設(shè)備,其中所述輸出聲道生成器可操作地利用取決于待與用于進(jìn)行重構(gòu)的所述設(shè)備連接的所述播放裝置的映射規(guī)則來(lái)對(duì)所述角度進(jìn)行映射,并且其中所述映射規(guī)則是這樣的,即,使得限定了所述向量所位于的扇形的兩個(gè)相鄰聲道的能量比在所述扇形的外部的聲道的能量大。
26.根據(jù)權(quán)利要求19到25之一所述的設(shè)備,其中所述輸出聲道生成器(54)包括解相關(guān)器(59),該解相關(guān)器(59)用于基于所述至少一個(gè)基本聲道來(lái)生成解相關(guān)信號(hào),并且其中所述輸出聲道生成器進(jìn)一步可操作地基于在所述參數(shù)表示中包括的相參性參數(shù)將所述解相關(guān)信號(hào)加入直達(dá)聲輸出聲道中,或者將所述解相關(guān)信號(hào)包括在環(huán)境輸出聲道中,所述環(huán)境輸出聲道具有能量分布,該能量分布不是由所述方向參數(shù)信息來(lái)控制的。
27.根據(jù)權(quán)利要求19到26之一所述的設(shè)備,其中所述參數(shù)方向信息標(biāo)識(shí)了所述播放裝置中的彼此不相鄰的輸出聲道,并且其中所述輸出聲道生成器可操作地執(zhí)行至少3聲道聲像調(diào)節(jié),以基于所述參數(shù)方向信息計(jì)算在2個(gè)所標(biāo)識(shí)的聲道之間的能量分布以及所述標(biāo)識(shí)的聲道之間的至少一個(gè)聲道。
28.一種用于生成對(duì)具有至少3個(gè)原始聲道(L、R、Rs)的原始多聲道信號(hào)的參數(shù)表示的方法,所述參數(shù)表示包括方向參數(shù)信息,該方向參數(shù)信息被用于連同從所述至少3個(gè)原始聲道推導(dǎo)出的基本聲道一起來(lái)對(duì)具有至少2個(gè)聲道的輸出信號(hào)進(jìn)行重構(gòu),所述原始聲道與位于播放裝置中的不同空間位置處的多個(gè)聲源(103、104、105)相關(guān)聯(lián),所述播放裝置具有參考位置(10),該方法包括以下步驟確定(54)方向參數(shù)信息,該方向參數(shù)信息表示從所述參考位置(16)到所述播放裝置中的所述至少3個(gè)原始聲道的組合聲能(14)所集中的區(qū)域(12)的方向;和生成(52)參數(shù)表示,使得所述參數(shù)表示包括所述方向參數(shù)信息。
29.一種用于使用至少一個(gè)基本聲道和參數(shù)表示對(duì)多聲道信號(hào)進(jìn)行重構(gòu)的方法,該參數(shù)表示包括表示從播放裝置中的參考位置到所述播放裝置中的至少3個(gè)原始聲道的組合聲能所集中的區(qū)域的方向的方向參數(shù)信息,從所述至少3個(gè)原始聲道推導(dǎo)出了所述至少一個(gè)基本聲道,該方法包括以下步驟生成(54)待相對(duì)于所述參考位置(10)定位于所述播放裝置中的多個(gè)輸出聲道,所述輸出聲道的數(shù)量比所述基本聲道的數(shù)量大,其中執(zhí)行所述生成(54)步驟,使得響應(yīng)于所述方向參數(shù)信息而生成所述輸出聲道,以使得從所述參考位置(10)到所述重構(gòu)的輸出聲道的所述組合能量所集中的區(qū)域的方向取決于由所述方向參數(shù)信息表示的方向。
30.一種具有機(jī)器可讀指令的計(jì)算機(jī)程序,當(dāng)在計(jì)算機(jī)上運(yùn)行時(shí),執(zhí)行根據(jù)權(quán)利要求28或29的方法。
31.一種參數(shù)表示,該參數(shù)表示包括對(duì)從播放裝置中的參考位置到所述播放裝置中的至少3個(gè)原始聲道的組合聲能所集中的區(qū)域的方向進(jìn)行表示的方向參數(shù)信息,從所述至少3個(gè)原始聲道推導(dǎo)出了至少一個(gè)基本聲道。
32.根據(jù)權(quán)利要求31所述的參數(shù)表示,用于當(dāng)被輸入根據(jù)權(quán)利要求19的設(shè)備中時(shí)對(duì)多聲道重構(gòu)進(jìn)行控制。
全文摘要
為了生成對(duì)尤其適合于低位速率應(yīng)用的多聲道信號(hào)的參數(shù)表示,使用方向參數(shù)信息只對(duì)播放裝置內(nèi)的最大聲能的位置進(jìn)行編碼和發(fā)送。為了進(jìn)行多聲道重構(gòu)(54),由方向參數(shù)信息對(duì)由方向參數(shù)信息標(biāo)識(shí)的輸出聲道的能量分布進(jìn)行控制(57),而不由方向參數(shù)信息來(lái)對(duì)剩余環(huán)境聲道(59)中的能量分布進(jìn)行控制。
文檔編號(hào)G10L19/008GK1957640SQ200580017078
公開日2007年5月2日 申請(qǐng)日期2005年4月14日 優(yōu)先權(quán)日2004年4月16日
發(fā)明者弗萊德里克·赫恩, 喬納斯·羅丹 申請(qǐng)人:編碼技術(shù)股份公司