用于向后兼容音頻譯碼的系統(tǒng)、方法、設(shè)備和計(jì)算機(jī)可讀媒體的制作方法
【專利摘要】本發(fā)明呈現(xiàn)用于描述聲場(chǎng)的基函數(shù)系數(shù)集合的向后兼容譯碼的系統(tǒng)、方法和設(shè)備。
【專利說(shuō)明】用于向后兼容音頻譯碼的系統(tǒng)、方法、設(shè)備和計(jì)算機(jī)可讀媒 體
[0001] 依據(jù)35U. S. C. § 119的優(yōu)先權(quán)豐張
[0002] 本專利申請(qǐng)案主張2012年7月15日申請(qǐng)且轉(zhuǎn)讓給本受讓人的標(biāo)題為"在使用球 諧系數(shù)用于空間音頻表示時(shí)提供向后兼容性(PROVIDING BACKWARD COMPATIBILITY WHEN USING SPHERICAL HARMONICS COEFFICIENTS FOR SPATIAL AUDIO REPRESENTATION) " 的第 61/671,789號(hào)臨時(shí)申請(qǐng)案的優(yōu)先權(quán)。
【技術(shù)領(lǐng)域】
[0003] 本發(fā)明涉及空間音頻譯碼。
【背景技術(shù)】
[0004] 環(huán)繞聲的演進(jìn)現(xiàn)今已使得許多用于娛樂(lè)的輸出格式可用。市場(chǎng)上的環(huán)繞聲格式 的范圍包含流行的5. 1家庭影院系統(tǒng)格式,其在應(yīng)用于起居室方面已最成功地超越了立體 聲。此格式包含以下六個(gè)通道:前左(L)、前右(R)、中心或前中心(C)、后左或環(huán)繞左(Ls)、 后右或環(huán)繞右(Rs),以及低頻效果(LFE)。環(huán)繞聲格式的其它實(shí)例包含增長(zhǎng)的7. 1格式和 由NHK (日本放送協(xié)會(huì)(Nippon Hoso Kyokai)或日本廣播公司)開發(fā)的未來(lái)的22. 2格式, 例如用于與超高清晰度電視標(biāo)準(zhǔn)一起使用。可需要一種環(huán)繞聲格式以在兩個(gè)維度中和/或 在三個(gè)維度中對(duì)音頻進(jìn)行編碼。
【發(fā)明內(nèi)容】
[0005] 描述根據(jù)一般配置的處理多個(gè)基函數(shù)系數(shù)的方法。所述多個(gè)基函數(shù)系數(shù)描述在時(shí) 間間隔期間的聲場(chǎng)。此方法包含對(duì)所述多個(gè)基函數(shù)系數(shù)的第一群組執(zhí)行可逆變換以產(chǎn)生多 個(gè)通道信號(hào),其中所述多個(gè)通道信號(hào)中的每一者與對(duì)應(yīng)不同空間區(qū)相關(guān)聯(lián)。此方法還包含 基于所述多個(gè)通道信號(hào)產(chǎn)生數(shù)據(jù)結(jié)構(gòu),所述數(shù)據(jù)結(jié)構(gòu)包含(A)所述多個(gè)基函數(shù)系數(shù)的第二 群組的表示,其中所述第二群組不同于所述第一群組,以及(B)與所述第二群組的所述表 示分開的所述多個(gè)通道信號(hào)的表示。還揭示具有有形特征的計(jì)算機(jī)可讀存儲(chǔ)媒體(例如, 非暫時(shí)性媒體),所述有形特征致使讀取所述特征的機(jī)器執(zhí)行此方法。
[0006] 描述根據(jù)一般配置的用于處理多個(gè)基函數(shù)系數(shù)的設(shè)備。所述多個(gè)基函數(shù)系數(shù)描述 在時(shí)間間隔期間的聲場(chǎng)。此設(shè)備包含用于對(duì)所述多個(gè)基函數(shù)系數(shù)的第一群組執(zhí)行可逆變 換以產(chǎn)生多個(gè)通道信號(hào)的裝置,其中所述多個(gè)通道信號(hào)中的每一者與對(duì)應(yīng)不同空間區(qū)相關(guān) 聯(lián)。此設(shè)備還包含用于基于所述多個(gè)通道信號(hào)產(chǎn)生數(shù)據(jù)結(jié)構(gòu)的裝置,所述數(shù)據(jù)結(jié)構(gòu)包含(A) 所述多個(gè)基函數(shù)系數(shù)的第二群組的表示,其中所述第二群組不同于所述第一群組,以及(B) 與所述第二群組的所述表示分開的所述多個(gè)通道信號(hào)的表示。
[0007] 描述根據(jù)另一一般配置的用于處理多個(gè)基函數(shù)系數(shù)的設(shè)備。所述多個(gè)基函數(shù)系數(shù) 描述在時(shí)間間隔期間的聲場(chǎng)。此設(shè)備包含計(jì)算器,其經(jīng)配置以對(duì)所述多個(gè)基函數(shù)系數(shù)的第 一群組執(zhí)行可逆變換以產(chǎn)生多個(gè)通道信號(hào),其中所述多個(gè)通道信號(hào)中的每一者與對(duì)應(yīng)不同 空間區(qū)相關(guān)聯(lián)。此設(shè)備還包含數(shù)據(jù)格式化器,其經(jīng)配置以基于所述多個(gè)通道信號(hào)產(chǎn)生數(shù)據(jù) 結(jié)構(gòu),所述數(shù)據(jù)結(jié)構(gòu)包含(A)所述多個(gè)基函數(shù)系數(shù)的第二群組的表示,其中所述第二群組 不同于所述第一群組,以及(B)與所述第二群組的所述表示分開的所述多個(gè)通道信號(hào)的表 /Jn 〇
【專利附圖】
【附圖說(shuō)明】
[0008] 圖IA展示不具有向后兼容性考慮的基于場(chǎng)景的譯碼的實(shí)例。
[0009] 圖IB說(shuō)明用于使用MPEG編解碼器的標(biāo)準(zhǔn)化的一般結(jié)構(gòu)。
[0010] 圖IC展示用于單聲道/立體聲的向后兼容實(shí)例。
[0011] 圖2A展示具有向后兼容設(shè)計(jì)的編碼過(guò)程的實(shí)例。
[0012] 圖2B展示無(wú)法對(duì)基于場(chǎng)景的數(shù)據(jù)進(jìn)行解碼的常規(guī)解碼器上的解碼過(guò)程的實(shí)例。
[0013] 圖3A展示可處置基于場(chǎng)景的數(shù)據(jù)的新裝置的解碼過(guò)程的實(shí)例。
[0014] 圖3B展示根據(jù)一般配置的音頻信號(hào)處理方法MlOO的流程圖。
[0015] 圖3C展示根據(jù)一般配置的用于音頻信號(hào)處理的設(shè)備MF100的框圖。
[0016] 圖3D展示根據(jù)另一一般配置的用于音頻信號(hào)處理的設(shè)備AlOO的框圖。
[0017] 圖4展示階數(shù)0和1的球諧基函數(shù)的量值的表面網(wǎng)格繪圖的實(shí)例。
[0018] 圖5展示階數(shù)2的球諧基函數(shù)的量值的表面網(wǎng)格繪圖的實(shí)例。
[0019] 圖6展示5. 1系統(tǒng)的揚(yáng)聲器角度的標(biāo)準(zhǔn)順應(yīng)性實(shí)例。
[0020] 圖7展示用于5. 1目標(biāo)系統(tǒng)的揚(yáng)聲器角度的均勻間隔布置的實(shí)例。
[0021] 圖8展示7. 1系統(tǒng)的揚(yáng)聲器角度的標(biāo)準(zhǔn)順應(yīng)性實(shí)例。
[0022] 圖9展示用于7. 1目標(biāo)系統(tǒng)的揚(yáng)聲器角度的均勻間隔布置的實(shí)例。
[0023] 圖IOA展示根據(jù)一般配置的音頻信號(hào)處理方法M200的流程圖。
[0024] 圖IOB展示方法M200的實(shí)施方案M210的流程圖。
[0025] 圖IlA展示根據(jù)一般配置的用于音頻信號(hào)處理的設(shè)備MF200的框圖。
[0026] 圖IlB展示設(shè)備MF100的實(shí)施方案MF210的框圖。
[0027] 圖IlC展示根據(jù)另一一般配置的用于音頻信號(hào)處理的設(shè)備A200的框圖。
[0028] 圖IlD展示設(shè)備AlOO的實(shí)施方案A210的框圖。
[0029] 圖IlE展示根據(jù)另一一般配置的用于音頻信號(hào)處理的設(shè)備PlOO的框圖。
【具體實(shí)施方式】
[0030] 除非由其上下文明確限制,否則術(shù)語(yǔ)"信號(hào)"在此用以指示其普通意義中的任一 者,包含如在電線、總線或其它傳輸媒體上表示的存儲(chǔ)器位置(或存儲(chǔ)器位置集合)的狀 態(tài)。除非由其上下文明確限制,否則術(shù)語(yǔ)"產(chǎn)生"在此用以指示其普通意義中的任一者,例 如計(jì)算或以其它方式產(chǎn)生。除非由其上下文明確限制,否則術(shù)語(yǔ)"計(jì)算"在此用以指示其普 通意義中的任一者,例如計(jì)算、評(píng)估、估計(jì)和/或從多個(gè)值中選擇。除非由其上下文明確限 制,否則術(shù)語(yǔ)"獲得"用以指示其普通意義中的任一者,例如計(jì)算、推導(dǎo)、接收(例如,從外部 裝置)和/或檢索(例如,從存儲(chǔ)元件陣列)。除非由其上下文明確限制,否則術(shù)語(yǔ)"選擇" 用以指示其普通意義中的任一者,例如識(shí)別、指示、應(yīng)用和/或使用兩者或兩者以上的集合 中的至少一者且少于全部。在本發(fā)明描述和權(quán)利要求書中使用術(shù)語(yǔ)"包括"的情況下,其并 不排除其它元件或操作。術(shù)語(yǔ)"基于"(如"A基于B"中)用以指示其普通意義中的任一 者,包含如下情況:(i) "推導(dǎo)自"(例如,"B是A的前體"),(ii) "至少基于"(例如,"A至 少基于B"),以及在特定上下文中適當(dāng)?shù)那闆r下,(iii) "等于"(例如,"A等于B")。類似 地,術(shù)語(yǔ)"響應(yīng)于"用以指示其普通意義中的任一者,包含"至少響應(yīng)于"。
[0031] 對(duì)多麥克風(fēng)音頻感測(cè)裝置的麥克風(fēng)的"位置"的參考指示所述麥克風(fēng)的聲學(xué)敏感 面的中心的位置,除非上下文另外指示。根據(jù)特定上下文,術(shù)語(yǔ)"通道"有時(shí)候用以指示信號(hào) 路徑且在其它時(shí)候用以指示由此路徑載運(yùn)的信號(hào)。除非另外指示,否則術(shù)語(yǔ)"系列"用以指 示兩個(gè)或兩個(gè)以上項(xiàng)目的序列。術(shù)語(yǔ)"對(duì)數(shù)"用以指示基于十的對(duì)數(shù),但此運(yùn)算向其它基數(shù) 的擴(kuò)展在本發(fā)明的范圍內(nèi)。術(shù)語(yǔ)"頻率分量"用以指示信號(hào)的一組頻率或頻帶當(dāng)中的一者, 例如所述信號(hào)的頻域表示的樣本(例如,由快速傅立葉變換產(chǎn)生)或所述信號(hào)的子帶(例 如,巴克(Bark)尺度或梅爾(mel)尺度子帶)。
[0032] 除非另外指示,否則對(duì)具有特定特征的設(shè)備的操作的任何揭示也明確預(yù)期揭示具 有類似特征的方法(且反之亦然),且對(duì)根據(jù)特定配置的設(shè)備的操作的任何揭示也明確預(yù) 期揭示根據(jù)類似配置的方法(且反之亦然)。術(shù)語(yǔ)"配置"可參考由其特定上下文指示的方 法、設(shè)備和/或系統(tǒng)來(lái)使用。術(shù)語(yǔ)"方法"、"過(guò)程"、"程序"和"技術(shù)"一般地且可互換地使 用,除非特定上下文另外指示。術(shù)語(yǔ)"設(shè)備"和"裝置"也一般地且可互換地使用,除非特定 上下文另外指示。術(shù)語(yǔ)"元件"和"模塊"通常用以指示較大配置的一部分。除非由其上下 文明確限制,否則術(shù)語(yǔ)"系統(tǒng)"在此用以指示其普通意義中的任一者,包含"相互作用以用于 共同目的的元件群組"。
[0033] 通過(guò)引用文檔的一部分的任何并入也應(yīng)當(dāng)理解為并入了在所述部分內(nèi)參考的術(shù) 語(yǔ)或變量的定義,此些定義在文檔中的別處出現(xiàn)的地方,以及在所并入部分中參考的任何 圖式。除非初始通過(guò)定冠詞介紹,否則用以修改權(quán)利要求元素的序數(shù)術(shù)語(yǔ)(例如,"第一"、 "第二"、"第三"等等)本身并不指示所述權(quán)利要求元素相對(duì)于另一元素的任何優(yōu)先級(jí)或次 序,而是僅使所述權(quán)利要求元素區(qū)別于具有相同名稱(但出于序數(shù)術(shù)語(yǔ)的使用)的另一權(quán) 利要求元素。除非通過(guò)其上下文明確限制,否則術(shù)語(yǔ)"多個(gè)"和"集合"中的每一者在本文 用以指示大于一的整數(shù)量。
[0034] 消費(fèi)型音頻中的當(dāng)前現(xiàn)有技術(shù)是使用基于通道的環(huán)繞聲的空間譯碼,所述環(huán)繞聲 有意通過(guò)預(yù)先指定位置處的揚(yáng)聲器來(lái)播放。空間音頻譯碼的另一方法是基于對(duì)象的音頻, 其涉及用于單個(gè)音頻對(duì)象的離散脈碼調(diào)制(PCM)數(shù)據(jù),具有含有所述對(duì)象在空間中的位置 坐標(biāo)(以及其它信息)的相關(guān)聯(lián)元數(shù)據(jù)。
[0035] 空間音頻譯碼(例如,環(huán)繞聲譯碼)的又一方法是基于場(chǎng)景的音頻,其涉及使用球 諧基函數(shù)(spherical harmonic basis function)的系數(shù)表示聲場(chǎng)。此些系數(shù)也稱為"球 諧系數(shù)"或SHC。圖IA描繪關(guān)于基于場(chǎng)景的方法的直觀編碼和解碼過(guò)程。在此實(shí)例中,基于 場(chǎng)景的編碼器SElO產(chǎn)生經(jīng)發(fā)射(和/或存儲(chǔ))且在基于場(chǎng)景的解碼器SDlO處解碼的SHC 的描述以接收用于再現(xiàn)的SHC (例如,由SH再現(xiàn)器SR10)。此編碼可包含用于帶寬壓縮的一 或多個(gè)有損或無(wú)損譯碼技術(shù),例如量化(例如,量化為一或多個(gè)碼簿索引)、錯(cuò)誤校正譯碼、 冗余譯碼等等。另外或替代地,此編碼可包含將音頻通道(例如,麥克風(fēng)輸出)編碼為環(huán)境 立體聲格式,例如B格式、G格式或較高階環(huán)境立體聲(HOA)。大體上,編碼器SElO可使用 利用系數(shù)之間的冗余和/或不相關(guān)性(用于有損或無(wú)損譯碼)的技術(shù)對(duì)SHC進(jìn)行編碼。
[0036] 可能希望提供空間音頻信息到經(jīng)標(biāo)準(zhǔn)化位流中的編碼以及對(duì)揚(yáng)聲器幾何形狀和 再現(xiàn)器的位置處的聲學(xué)條件可適配且無(wú)關(guān)的后續(xù)解碼。此方法可提供均勻收聽體驗(yàn)的目 標(biāo),無(wú)論最終用于再生的特定設(shè)置如何。圖IB說(shuō)明用于使用MPEG編解碼器的此標(biāo)準(zhǔn)化的 一般結(jié)構(gòu)。在此實(shí)例中,對(duì)編碼器MPlO的輸入音頻源可包含以下各項(xiàng)中的任意一或多者, 例如:基于通道的源(例如,1.0(單聲道)、2. 0(立體聲)、5. 1、7. 1、11. 1、22. 2)、基于對(duì)象 的源,以及基于場(chǎng)景的源(例如,高階球諧、環(huán)境立體聲)。類似地,由解碼器(和再現(xiàn)器) MP20產(chǎn)生的音頻輸出可包含以下各項(xiàng)中的任意一或多者,例如:用于單聲道、立體聲、5. 1、 7. 1和/或22. 2揚(yáng)聲器陣列的饋送;用于不規(guī)則分布揚(yáng)聲器陣列的饋送;用于頭戴受話器 的饋送;交互式音頻。
[0037] 還可能希望遵循"產(chǎn)生一次,使用多次"基本原理,其中音頻材料產(chǎn)生一次(例如, 由內(nèi)容產(chǎn)生器)且經(jīng)編碼為可隨后經(jīng)解碼且再現(xiàn)為不同輸出和揚(yáng)聲器設(shè)置的格式。例如好 萊塢工作室(Hollywood studio)等內(nèi)容產(chǎn)生器將通??赡墚a(chǎn)生用于電影的聲軌一次且不 會(huì)花費(fèi)努力來(lái)針對(duì)每一可能揚(yáng)聲器配置對(duì)其進(jìn)行再混合。
[0038] 對(duì)圖IB的標(biāo)準(zhǔn)化實(shí)例中的MPEG編碼器MPlO的輸入任選地為基于通道的格式、基 于對(duì)象的格式和基于場(chǎng)景的格式中的一者。存在使用基于場(chǎng)景的格式的大量?jī)?yōu)點(diǎn)。然而, 使用此格式的一個(gè)可能缺點(diǎn)是缺乏對(duì)現(xiàn)有消費(fèi)型音頻系統(tǒng)的向后兼容性。當(dāng)使用SHC時(shí)缺 乏向后兼容性是由于SHC不是PCM數(shù)據(jù)的事實(shí)。缺乏新的基于場(chǎng)景的解碼器的現(xiàn)有接收器 (也稱為"傳統(tǒng)"系統(tǒng))無(wú)法對(duì)此些信號(hào)進(jìn)行解碼且將不能播放節(jié)目。本發(fā)明描述可用以解 決在使用階層式系數(shù)集合(例如,SHC或其它基函數(shù)集合的系數(shù))來(lái)表示聲場(chǎng)時(shí)此向后兼 容性的缺乏的方法、系統(tǒng)和設(shè)備。
[0039] 本文描述的方法提供對(duì)聲場(chǎng)的基于SHC的表示的使用中的潛在缺點(diǎn)的解決方案。 在無(wú)此解決方案的情況下,基于SHC的表示將難以部署,原因在于由于不能在數(shù)百萬(wàn)現(xiàn)有 傳統(tǒng)重放系統(tǒng)中具有功能性而帶來(lái)的顯著缺點(diǎn)。
[0040] 向后兼容性即使在首先引入立體聲格式時(shí)也是問(wèn)題,因?yàn)閭鹘y(tǒng)單聲道重放系統(tǒng)必 須保持兼容性。在此情況下,使用矩陣化來(lái)保持單聲道-立體聲向后兼容性。立體聲"M中 間"和"S側(cè)面"格式能夠通過(guò)使用僅M通道來(lái)保持與具有單聲道能力的系統(tǒng)的兼容性。如 圖IC所示,具有立體聲能力的系統(tǒng)執(zhí)行簡(jiǎn)單的2x2矩陣運(yùn)算以對(duì)"L左"和"R右"通道進(jìn) 行解碼。
[0041] M-S信號(hào)可通過(guò)使用以上矩陣的逆(碰巧是相同的)從L-R信號(hào)計(jì)算。以此方式, 傳統(tǒng)單聲道播放器保持功能性,而立體聲播放器可準(zhǔn)確地對(duì)左和右通道進(jìn)行解碼。以類似 方式,可添加保持向后兼容性的第三通道,其保留單聲道播放器和立體聲播放器的功能性 且添加三通道播放器的功能性。
[0042] 傳統(tǒng)基于5. 1通道的矩陣化音頻方法包含額外通道的擴(kuò)展可通過(guò)包含5. 1樣本作 為經(jīng)擴(kuò)展通道格式的子集來(lái)繞過(guò)向后兼容性的問(wèn)題。舉例來(lái)說(shuō),最現(xiàn)有的消費(fèi)型音頻系統(tǒng) 接受5. 1通道輸入。在向后兼容擴(kuò)展位流中,5. 1樣本處于由傳統(tǒng)系統(tǒng)辨識(shí)的位置中,且額 外通道例如位于含有所有通道樣本的幀包的擴(kuò)展部分中。此方法的另一實(shí)例是杜比數(shù)字加 (Dolby Digital Plus)位流(杜比實(shí)驗(yàn)室公司,加利福尼亞舊金山),其包含具有5. 1混合 的核心包以及具有7. 1混合的四個(gè)環(huán)繞通道的擴(kuò)展包。替代地,解碼器可經(jīng)配置以通過(guò)對(duì) 較高數(shù)目的通道執(zhí)行矩陣化操作來(lái)確定5. 1通道數(shù)據(jù)。
[0043] 用于在基于對(duì)象的格式中解決向后兼容性的問(wèn)題的一個(gè)建議方法是連同對(duì)象一 起發(fā)送經(jīng)向下混合5. 1通道信號(hào)。在此情形中,傳統(tǒng)基于通道的系統(tǒng)將播放基于經(jīng)向下混 合5. 1通道的音頻,而較高級(jí)的再現(xiàn)器將使用5. 1音頻與個(gè)別音頻對(duì)象的組合或僅個(gè)別對(duì) 象來(lái)再現(xiàn)聲場(chǎng)。然而,此向后兼容性的方法可能因?yàn)橐詢蓚€(gè)不同格式發(fā)送同一音頻信息而 低效地使用帶寬。
[0044] 本發(fā)明包含其中以不同方式處理描述聲場(chǎng)的階層式元素集合(例如,SHC集合) 的兩個(gè)部分的系統(tǒng)、方法和設(shè)備的描述。在此方法中,元素的子集經(jīng)轉(zhuǎn)換(例如,使用如下 文詳述的變換矩陣)來(lái)獲得多通道音頻信號(hào)的集合。此方法可用以將階層式集合的子集 ("基本集合")轉(zhuǎn)換到與傳統(tǒng)多通道音頻格式兼容的多個(gè)音頻通道。此方法還可經(jīng)配置以 獲得任何所要數(shù)目的通道來(lái)維持向后兼容性。此向后兼容系統(tǒng)的方面的實(shí)例在圖2A、2B和 3A中的系統(tǒng)圖中概括,具有關(guān)于編碼器和解碼器結(jié)構(gòu)的闡釋。
[0045] 圖2A展示此編碼方法的一般實(shí)例。一個(gè)特定用戶是將完整SHC集合(在向后兼容 性不是問(wèn)題的情況下原本可能使用)的基本集合轉(zhuǎn)換到表示傳統(tǒng)多通道音頻格式的多個(gè) 通道(例如,由變換矩陣TMlO和再編碼器/轉(zhuǎn)碼器TClO產(chǎn)生)。SHC集合的其余部分(例 如,不是所述子集的部分的系數(shù))被視為未轉(zhuǎn)換的擴(kuò)展集合且可單獨(dú)編碼(通過(guò)基于場(chǎng)景 的編碼器SElO的實(shí)施方案SE20,例如用于帶寬壓縮)以用于經(jīng)由發(fā)射通道(例如,有線和 /或無(wú)線通道)進(jìn)行發(fā)射,和/或用于連同向后兼容多通道音頻編碼信號(hào)一起存儲(chǔ)(例如, 如本文描述且在此實(shí)例中由位流多路復(fù)用器MXlO產(chǎn)生的包或位流中)。舉例來(lái)說(shuō),這些經(jīng) 編碼位可經(jīng)包化為位流的擴(kuò)展部分或幀的包的擴(kuò)展部分(例如,用戶定義的部分)。
[0046] 在接收端,將位流多路分用(例如,由多路分用器DX10),且僅支持常規(guī)解碼器(例 如,傳統(tǒng)解碼器LD10)的傳統(tǒng)系統(tǒng)將僅使用向后兼容多通道音頻內(nèi)容,因此保持功能性,且 忽略幀包或位流的擴(kuò)展部分,如圖2B所示。
[0047] 支持基于場(chǎng)景的解碼的接收器可根據(jù)圖3A所示的一般實(shí)例執(zhí)行解碼過(guò)程,其與 圖2A所示的編碼方法互逆。如果通道已經(jīng)再編碼或轉(zhuǎn)碼,那么可執(zhí)行解碼的中間步驟。舉 例來(lái)說(shuō),轉(zhuǎn)碼解碼器TC20可用以將向后兼容位流轉(zhuǎn)換為多通道音頻信號(hào)。隨后,使用逆變 換矩陣IMlO來(lái)將多通道音頻信號(hào)轉(zhuǎn)換到階層式集合的原始子集(例如,SHC的基本集合)。 階層式集合的其余部分(例如,經(jīng)擴(kuò)展SHC集合)由基于場(chǎng)景的解碼器SDlO的實(shí)施方案 SD20恢復(fù)(例如,從包或位流的經(jīng)擴(kuò)展部分)。以此方式,完整的階層式集合(例如,完整 的SHC集合)可恢復(fù)且由SH再現(xiàn)器SRlO處理以允許進(jìn)行各種類型的聲場(chǎng)再現(xiàn)。
[0048] 使用SHC的集合來(lái)表不聲場(chǎng)是使用階層式兀素集合來(lái)表不聲場(chǎng)的一般方法的特 定實(shí)例。例如SHC集合等階層式元素集合是其中元素經(jīng)排序使得較低階元素的基本集合提 供經(jīng)建模聲場(chǎng)的完整表示的集合。由于所述集合經(jīng)擴(kuò)展以包含較高階元素,因此空間中的 聲場(chǎng)的表示變得更詳細(xì)。
[0049] 源SHC(例如,如圖3A中所示)可為由混合工程師在能夠基于場(chǎng)景的記錄工作室 中混合的源信號(hào)。源SHC還可從由麥克風(fēng)陣列俘獲的信號(hào)或從由揚(yáng)聲器的環(huán)繞陣列的聲音 表示的記錄來(lái)產(chǎn)生。PCM流和相關(guān)聯(lián)位置信息(例如,音頻對(duì)象)向SHC源集合的轉(zhuǎn)換也是 預(yù)期的。
[0050] 聲場(chǎng)可使用例如以下表達(dá)式在SHC方面來(lái)表不:
[0051]
【權(quán)利要求】
1. 一種處理描述在時(shí)間間隔期間的聲場(chǎng)的多個(gè)基函數(shù)系數(shù)的方法,所述方法包括: 對(duì)所述多個(gè)基函數(shù)系數(shù)的第一群組執(zhí)行可逆變換W產(chǎn)生多個(gè)通道信號(hào),其中所述多個(gè) 通道信號(hào)中的每一者與對(duì)應(yīng)不同空間區(qū)相關(guān)聯(lián);W及 基于所述多個(gè)通道信號(hào)產(chǎn)生數(shù)據(jù)結(jié)構(gòu),所述數(shù)據(jù)結(jié)構(gòu)包含(A)所述多個(gè)基函數(shù)系數(shù)的 第二群組的表示,其中所述第二群組不同于所述第一群組,W及炬)與所述第二群組的所 述表示分開的所述多個(gè)通道信號(hào)的表示。
2. 根據(jù)權(quán)利要求1所述的方法,其中所述多個(gè)基函數(shù)系數(shù)為球諧基函數(shù)的多個(gè)系數(shù)。
3. 根據(jù)權(quán)利要求1所述的方法,其中所述多個(gè)通道信號(hào)包含與第一揚(yáng)聲器位置相關(guān)聯(lián) 的第一通道信號(hào)W及與不同于所述第一揚(yáng)聲器位置的第二揚(yáng)聲器位置相關(guān)聯(lián)的第二通道 信號(hào)。
4. 根據(jù)權(quán)利要求1所述的方法,其中所述多個(gè)通道信號(hào)包含與第一空間方向相關(guān)聯(lián)的 第一通道信號(hào)W及與不同于所述第一空間方向的第二空間方向相關(guān)聯(lián)的第二通道信號(hào)。
5. 根據(jù)權(quán)利要求4所述的方法,其中對(duì)于所述第一群組的所述系數(shù)中的每一者,所述 系數(shù)對(duì)應(yīng)于至少與沿著第一平面外的任一方向一樣多地沿著所述第一平面內(nèi)的至少一個(gè) 方向集中能量的基函數(shù),其中所述第一平面包含所述第一和第二空間方向。
6. 根據(jù)權(quán)利要求4所述的方法,其中所述第一群組的第一系數(shù)對(duì)應(yīng)于為全向的基函 數(shù),且 其中對(duì)于所述第一群組的其它系數(shù)中的每一者,所述系數(shù)對(duì)應(yīng)于沿著第一平面內(nèi)的至 少一個(gè)方向集中能量的基函數(shù),其中所述第一平面包含所述第一和第二空間方向。
7. 根據(jù)權(quán)利要求4所述的方法,其中對(duì)于所述第二群組的所述系數(shù)中的至少一些中的 每一者,所述系數(shù)對(duì)應(yīng)于沿著包含所述第一和第二空間方向的平面外的至少一個(gè)方向集中 能量的基函數(shù)。
8. 根據(jù)權(quán)利要求1所述的方法,其中所述多個(gè)通道信號(hào)包含通道信號(hào)集合,其中所述 通道信號(hào)集合中的每一信號(hào)與彼此均勻間隔的共面方向的集合中的對(duì)應(yīng)不同一者相關(guān)聯(lián)。
9. 根據(jù)權(quán)利要求1所述的方法,其中所述多個(gè)基函數(shù)系數(shù)當(dāng)中的每一者具有在所述多 個(gè)基函數(shù)系數(shù)內(nèi)的對(duì)應(yīng)階數(shù),且 其中對(duì)于所述多個(gè)基函數(shù)系數(shù)的所述第一群組當(dāng)中的每一者,所述系數(shù)的所述階數(shù)小 于所述多個(gè)基函數(shù)系數(shù)的所述第二群組的所述系數(shù)的所述階數(shù)當(dāng)中的最低者。
10. 根據(jù)權(quán)利要求1所述的方法,其中所述多個(gè)基函數(shù)系數(shù)當(dāng)中的每一者具有在所述 多個(gè)基函數(shù)系數(shù)內(nèi)的對(duì)應(yīng)階數(shù),且 其中對(duì)于所述多個(gè)基函數(shù)系數(shù)的所述第二群組當(dāng)中的每一者,所述系數(shù)的所述階數(shù)大 于所述多個(gè)基函數(shù)系數(shù)的所述第一群組的所述系數(shù)的所述階數(shù)當(dāng)中的最高者。
11. 根據(jù)權(quán)利要求1所述的方法,其中所述執(zhí)行所述可逆變換包括計(jì)算(A)所述多個(gè)基 函數(shù)系數(shù)的所述第一群組與炬)可逆矩陣的乘積。
12. 根據(jù)權(quán)利要求1所述的方法,其中所述數(shù)據(jù)結(jié)構(gòu)包括包含所述第二群組的所述表 示的第一流和包含所述多個(gè)通道信號(hào)的所述表示的第二流。
13. 根據(jù)權(quán)利要求1所述的方法,其中所述方法包含將所述多個(gè)通道信號(hào)中的每一者 變換為時(shí)域樣本序列,且 其中所述多個(gè)通道信號(hào)的所述表示是基于所述時(shí)域樣本序列。
14. 根據(jù)權(quán)利要求1所述的方法,其中所述方法包含對(duì)多個(gè)音頻輸入信號(hào)進(jìn)行編碼W 產(chǎn)生所述多個(gè)基函數(shù)系數(shù)。
15. 根據(jù)權(quán)利要求14所述的方法,其中所述多個(gè)音頻輸入信號(hào)中的每一者是基于由麥 克風(fēng)陣列的對(duì)應(yīng)麥克風(fēng)產(chǎn)生的信號(hào)。
16. -種獲得描述在時(shí)間間隔期間的聲場(chǎng)的多個(gè)基函數(shù)系數(shù)的方法,所述方法包括: 從數(shù)據(jù)結(jié)構(gòu)獲得(A)所述多個(gè)基函數(shù)系數(shù)的第二群組的表示和炬)與所述第二群組的 所述表示分開的多個(gè)通道信號(hào)的表示,其中所述多個(gè)通道信號(hào)的子集中的每一者與對(duì)應(yīng)不 同空間區(qū)相關(guān)聯(lián);W及 對(duì)所述多個(gè)通道信號(hào)的所述子集執(zhí)行變換W產(chǎn)生所述多個(gè)基函數(shù)系數(shù)的第一群組,其 中所述第一群組不同于所述第二群組。
17. 根據(jù)權(quán)利要求16所述的方法,其中所述多個(gè)基函數(shù)系數(shù)中的每一者對(duì)應(yīng)于正交基 函數(shù)集合的唯一一者。
18. 根據(jù)權(quán)利要求16所述的方法,其中所述多個(gè)基函數(shù)系數(shù)中的每一者對(duì)應(yīng)于球諧基 函數(shù)集合的唯一一者。
19. 根據(jù)權(quán)利要求16所述的方法,其中所述方法包括基于所述多個(gè)基函數(shù)系數(shù)產(chǎn)生第 二多個(gè)通道信號(hào), 其中所述多個(gè)通道信號(hào)的所述子集中的每一信號(hào)與共面方向集合中的對(duì)應(yīng)不同一者 相關(guān)聯(lián),且 其中所述第二多個(gè)通道信號(hào)中的每一者與跨越H維空間的方向集合中的對(duì)應(yīng)不同一 者相關(guān)聯(lián)。
20. -種用于處理描述在時(shí)間間隔期間的聲場(chǎng)的多個(gè)基函數(shù)系數(shù)的設(shè)備,所述設(shè)備包 括: 用于對(duì)所述多個(gè)基函數(shù)系數(shù)的第一群組執(zhí)行可逆變換W產(chǎn)生多個(gè)通道信號(hào)的裝置,其 中所述多個(gè)通道信號(hào)中的每一者與對(duì)應(yīng)不同空間區(qū)相關(guān)聯(lián);W及 用于基于所述多個(gè)通道信號(hào)產(chǎn)生數(shù)據(jù)結(jié)構(gòu)的裝置,所述數(shù)據(jù)結(jié)構(gòu)包含(A)所述多個(gè)基 函數(shù)系數(shù)的第二群組的表示,其中所述第二群組不同于所述第一群組,W及炬)與所述第 二群組的所述表示分開的所述多個(gè)通道信號(hào)的表示。
21. 根據(jù)權(quán)利要求20所述的設(shè)備,其中所述多個(gè)基函數(shù)系數(shù)為球諧基函數(shù)的多個(gè)系 數(shù)。
22. 根據(jù)權(quán)利要求20所述的設(shè)備,其中所述多個(gè)通道信號(hào)包含與第一空間方向相關(guān)聯(lián) 的第一通道信號(hào)W及與不同于所述第一空間方向的第二空間方向相關(guān)聯(lián)的第二通道信號(hào)。
23. 根據(jù)權(quán)利要求20所述的設(shè)備,其中對(duì)于所述第二群組的所述系數(shù)中的至少一些中 的每一者,所述系數(shù)對(duì)應(yīng)于沿著包含所述第一和第二空間方向的平面外的至少一個(gè)方向集 中能量的基函數(shù)。
24. 根據(jù)權(quán)利要求20所述的設(shè)備,其中所述多個(gè)通道信號(hào)包含通道信號(hào)集合,其中所 述通道信號(hào)集合中的每一信號(hào)與彼此均勻間隔的共面方向的集合中的對(duì)應(yīng)不同一者相關(guān) 聯(lián)。
25. 根據(jù)權(quán)利要求20所述的設(shè)備,其中所述多個(gè)基函數(shù)系數(shù)當(dāng)中的每一者具有在所述 多個(gè)基函數(shù)系數(shù)內(nèi)的對(duì)應(yīng)階數(shù),且 其中對(duì)于所述多個(gè)基函數(shù)系數(shù)的所述第一群組當(dāng)中的每一者,所述系數(shù)的所述階數(shù)小 于所述多個(gè)基函數(shù)系數(shù)的所述第二群組的所述系數(shù)的所述階數(shù)當(dāng)中的最低者。
26. 根據(jù)權(quán)利要求20所述的設(shè)備,其中所述用于執(zhí)行所述可逆變換的裝置包括用于計(jì) 算(A)所述多個(gè)基函數(shù)系數(shù)的所述第一群組與炬)可逆矩陣的乘積的裝置。
27. 根據(jù)權(quán)利要求20所述的設(shè)備,其中所述設(shè)備包含用于將所述多個(gè)通道信號(hào)中的每 一者變換為時(shí)域樣本序列的裝置,且 其中所述多個(gè)通道信號(hào)的所述表示是基于所述時(shí)域樣本序列。
28. 根據(jù)權(quán)利要求20所述的設(shè)備,其中所述設(shè)備包含用于對(duì)多個(gè)音頻輸入信號(hào)進(jìn)行編 碼W產(chǎn)生所述多個(gè)基函數(shù)系數(shù)的裝置。
29. -種用于處理描述在時(shí)間間隔期間的聲場(chǎng)的多個(gè)基函數(shù)系數(shù)的設(shè)備,所述設(shè)備包 括: 計(jì)算器,其經(jīng)配置W對(duì)所述多個(gè)基函數(shù)系數(shù)的第一群組執(zhí)行可逆變換W產(chǎn)生多個(gè)通道 信號(hào),其中所述多個(gè)通道信號(hào)中的每一者與對(duì)應(yīng)不同空間區(qū)相關(guān)聯(lián);W及 數(shù)據(jù)格式化器,其經(jīng)配置W基于所述多個(gè)通道信號(hào)產(chǎn)生數(shù)據(jù)結(jié)構(gòu),所述數(shù)據(jù)結(jié)構(gòu)包含 (A)所述多個(gè)基函數(shù)系數(shù)的第二群組的表示,其中所述第二群組不同于所述第一群組,W及 炬)與所述第二群組的所述表示分開的所述多個(gè)通道信號(hào)的表示。
30. 根據(jù)權(quán)利要求29所述的設(shè)備,其中所述多個(gè)基函數(shù)系數(shù)為球諧基函數(shù)的多個(gè)系 數(shù)。
31. 根據(jù)權(quán)利要求29所述的設(shè)備,其中所述多個(gè)通道信號(hào)包含與第一空間方向相關(guān)聯(lián) 的第一通道信號(hào)W及與不同于所述第一空間方向的第二空間方向相關(guān)聯(lián)的第二通道信號(hào)。
32. 根據(jù)權(quán)利要求29所述的設(shè)備,其中對(duì)于所述第二群組的所述系數(shù)中的至少一些中 的每一者,所述系數(shù)對(duì)應(yīng)于沿著包含所述第一和第二空間方向的平面外的至少一個(gè)方向集 中能量的基函數(shù)。
33. 根據(jù)權(quán)利要求29所述的設(shè)備,其中所述多個(gè)通道信號(hào)包含通道信號(hào)集合,其中所 述通道信號(hào)集合中的每一信號(hào)與彼此均勻間隔的共面方向的集合中的對(duì)應(yīng)不同一者相關(guān) 聯(lián)。
34. 根據(jù)權(quán)利要求29所述的設(shè)備,其中所述多個(gè)基函數(shù)系數(shù)當(dāng)中的每一者具有在所述 多個(gè)基函數(shù)系數(shù)內(nèi)的對(duì)應(yīng)階數(shù),且 其中對(duì)于所述多個(gè)基函數(shù)系數(shù)的所述第一群組當(dāng)中的每一者,所述系數(shù)的所述階數(shù)小 于所述多個(gè)基函數(shù)系數(shù)的所述第二群組的所述系數(shù)的所述階數(shù)當(dāng)中的最低者。
35. 根據(jù)權(quán)利要求29所述的設(shè)備,其中所述計(jì)算器經(jīng)配置W計(jì)算(A)所述多個(gè)基函數(shù) 系數(shù)的所述第一群組與炬)可逆矩陣的乘積。
36. 根據(jù)權(quán)利要求29所述的設(shè)備,其中所述設(shè)備包含第二計(jì)算器,所述第二計(jì)算器經(jīng) 配置W將所述多個(gè)通道信號(hào)中的每一者變換為時(shí)域樣本序列,且 其中所述多個(gè)通道信號(hào)的所述表示是基于所述時(shí)域樣本序列。
37. 根據(jù)權(quán)利要求29所述的設(shè)備,其中所述設(shè)備包含編碼器,所述編碼器經(jīng)配置W對(duì) 多個(gè)音頻輸入信號(hào)進(jìn)行編碼W產(chǎn)生所述多個(gè)基函數(shù)系數(shù)。
38. -種具有有形特征的非暫時(shí)性計(jì)算機(jī)可讀數(shù)據(jù)存儲(chǔ)媒體,所述有形特征致使讀取 所述特征的機(jī)器執(zhí)行根據(jù)權(quán)利要求1所述的方法。
【文檔編號(hào)】H04L29/06GK104471960SQ201380037334
【公開日】2015年3月25日 申請(qǐng)日期:2013年6月18日 優(yōu)先權(quán)日:2012年7月15日
【發(fā)明者】D·森, 向佩 申請(qǐng)人:高通股份有限公司