8] 在一些情況下,當(dāng)執(zhí)行i)參數(shù)聲道間音頻編碼和使用空間掩蔽閾值的空間掩蔽, 或ii)使用空間掩蔽閾值的空間掩蔽,而不執(zhí)行參數(shù)聲道間音頻編碼時,音頻編碼裝置10' 可確定目標(biāo)位速率低于閾值位速率,且響應(yīng)于確定目標(biāo)位速率低于閾值位速率,執(zhí)行參數(shù) 聲道間音頻編碼和使用空間掩蔽閾值的空間掩蔽,以產(chǎn)生位流。閾值位速率可例如等于256 千位每秒(Kbps)。
[0119] 在一些情況下,當(dāng)執(zhí)行i)參數(shù)聲道間音頻編碼和使用空間掩蔽閾值的空間掩蔽, 或ii)使用空間掩蔽閾值的空間掩蔽而不執(zhí)行參數(shù)聲道間音頻編碼時,音頻編碼裝置10' 可確定目標(biāo)位速率等于或超過閾值位速率,且響應(yīng)于確定目標(biāo)位速率等于或超過閾值位速 率,執(zhí)行使用空間掩蔽閾值的空間掩蔽,而不執(zhí)行參數(shù)聲道間音頻編碼,以產(chǎn)生位流。
[0120] 在一些情況下,音頻編碼裝置10'可進(jìn)一步將多個球面諧波系數(shù)渲染到多聲道音 頻數(shù)據(jù)。當(dāng)執(zhí)行i)參數(shù)聲道間音頻編碼和使用空間掩蔽閾值的空間掩蔽,或ii)使用空間 掩蔽閾值的空間掩蔽而不執(zhí)行參數(shù)聲道間音頻編碼時,音頻編碼裝置10'可確定目標(biāo)位速 率低于閾值位速率,且響應(yīng)于確定目標(biāo)位速率低于閾值位速率,相對于多聲道音頻數(shù)據(jù)的 一或多個基礎(chǔ)聲道,執(zhí)行使用空間掩蔽閾值的空間掩蔽,且相對于所述多聲道音頻數(shù)據(jù)執(zhí) 行參數(shù)聲道間音頻編碼,以產(chǎn)生位流。并且,閾值位速率可等于256千位每秒(Kbps)。
[0121] 在一些情況下,音頻編碼裝置10'還可基于空間掩蔽閾值,為基于音頻數(shù)據(jù)的時 間的表示或音頻數(shù)據(jù)的基于頻率的表示分配位流中的位。
[0122] 在一些情況下,參數(shù)聲道間音頻編碼包括移動圖片專家組(MPEG)環(huán)繞聲。
[0123] 此外,本發(fā)明中描述的技術(shù)可使音頻編碼裝置10'能夠執(zhí)行壓縮多聲道音頻數(shù)據(jù) 的方法。在執(zhí)行此方法時,音頻編碼裝置10'可基于以三維形式描述多聲道音頻數(shù)據(jù)的聲 場的多個球面諧波系數(shù)來執(zhí)行空間分析,以識別空間掩蔽閾值,且渲染球面諧波系數(shù)以產(chǎn) 生多聲道音頻數(shù)據(jù)。音頻編碼裝置10'還可使用空間掩蔽閾值,相對于多聲道音頻數(shù)據(jù)的 一或多個基礎(chǔ)聲道執(zhí)行空間掩蔽,且相對于所述多聲道音頻數(shù)據(jù)(包含所述多聲道音頻數(shù) 據(jù)的經(jīng)空間掩蔽的一或多個基礎(chǔ)聲道)執(zhí)行參數(shù)聲道間音頻編碼,以產(chǎn)生位流。
[0124] 在一些情況下,音頻編碼裝置10'可確定將多聲道音頻數(shù)據(jù)編碼為位流的目標(biāo)位 速率。在此背景下當(dāng)執(zhí)行空間掩蔽和參數(shù)聲道間音頻編碼時,在目標(biāo)位速率小于閾值位速 率時,音頻編碼裝置10'相對于多聲道音頻數(shù)據(jù)的一或多個基礎(chǔ)聲道執(zhí)行空間掩蔽,且相 對于所述多聲道音頻數(shù)據(jù)(包含所述多聲道音頻數(shù)據(jù)的經(jīng)空間掩蔽的一或多個基礎(chǔ)聲道) 執(zhí)行參數(shù)聲道間音頻編碼,以產(chǎn)生位流。
[0125] 在一些情況下,閾值位速率等于256千位每秒(Kbps)。在一些情況下,此閾值位速 率由用戶或應(yīng)用程序指定。就是說,此閾值位速率可為可配置的,或可靜態(tài)設(shè)定。在一些情 況下,目標(biāo)位速率等于128千位每秒(Kbps)。在一些情況下,參數(shù)聲道間音頻編碼包括移動 圖片專家組(MPEG)環(huán)繞聲。
[0126] 在一些情況下,音頻編碼裝置10'還使用時間掩蔽閾值,相對于多聲道音頻數(shù)據(jù) 執(zhí)行時間掩蔽。
[0127] 另外,所述技術(shù)的各個方面可進(jìn)一步(或替代地)使音頻編碼裝置10'能夠執(zhí)行 壓縮音頻數(shù)據(jù)的方法。執(zhí)行此方法時,音頻編碼裝置10'可基于以三維形式描述音頻數(shù)據(jù) 的聲場的多個球面諧波系數(shù)來執(zhí)行空間分析,以識別空間掩蔽閾值;使用所述空間掩蔽閾 值,相對于所述多個球面諧波系數(shù)執(zhí)行空間掩蔽;以及產(chǎn)生包含所述多個經(jīng)空間掩蔽的球 面諧波系數(shù)的位流。
[0128] 在一些情況下,音頻編碼裝置10'可確定將多聲道音頻數(shù)據(jù)編碼為位流的目標(biāo)位 速率。當(dāng)執(zhí)行空間掩蔽時,在目標(biāo)位速率等于或大于閾值位速率時,音頻編碼裝置10'可相 對于所述多個球面諧波系數(shù)執(zhí)行空間掩蔽。在一些情況下,閾值位速率等于256千位每秒 (Kbps)。在這些情況下,目標(biāo)位速率等于或大于256千位每秒(Kbps)。
[0129] 在一些情況下,音頻編碼裝置10'可進(jìn)一步使用時間掩蔽閾值,相對于多個球面 諧波系數(shù)執(zhí)行時間掩蔽。
[0130] 雖然上文描述為相對于球面諧波系數(shù)執(zhí)行空間掩蔽分析,但上文相對于圖12的 實例所描述的技術(shù)也可在所謂的"聲道域"中執(zhí)行,類似于圖4B的音頻編碼裝置11如何在 聲道域中執(zhí)行空間分析。因此,所述技術(shù)在這方面不應(yīng)限于圖12的實例。
[0131] 圖13是說明可執(zhí)行本發(fā)明中描述的技術(shù)的各種方面的示范性音頻編碼裝置160 的框圖。如圖13的實例中示出,音頻編碼裝置160可包含時頻分析單元162、同時掩蔽單 元164、空間掩蔽單元166和位分配單元168。時頻單元162可類似于或大體類似于圖4A 的實例中所示的音頻編碼裝置10的時頻分析單元12。時頻單元162可接收SHC170A,將 SHC170A從時域變換到頻域(其中SHC170A的頻域版本表示為"SHC170B")。
[0132] 同時掩蔽單元164表示執(zhí)行SHC170B的同時分析(其也可被稱作"時間分析") 以確定一或多個同時掩蔽閾值172的單元。同時掩蔽單元164可評估SHC170B所描述的 聲場,以識別(作為一個實例)同時但分開的聲音。當(dāng)兩個同時聲音之間的增益存在較大 差異時,通常僅需要準(zhǔn)確地表示最響的聲音(其可表示具有最大能量的聲音),而可較不準(zhǔn) 確地表示相比之下較安靜的聲音(這通常通過將較小的位分配給相比之下安靜的聲音來 進(jìn)行)。在任何情況下,同時制作單元164可輸出一或多個同時掩蔽閾值172 (常常在逐頻 段基礎(chǔ)上指定)。
[0133] 空間掩蔽單元166可表示相對于SHC170B且根據(jù)上述技術(shù)的各個方面執(zhí)行空間 分析以確定一或多個空間掩蔽閾值174(其同樣地可在逐頻段基礎(chǔ)上指定)的單元??臻g 掩蔽單元166可輸出空間掩蔽閾值174,其由組合器176與時間掩蔽閾值172組合以形成總 掩蔽閾值178。組合器176可添加或執(zhí)行任何其它形式的數(shù)學(xué)運算,來組合時間掩蔽閾值 172與空間掩蔽閾值174,以產(chǎn)生總掩蔽閾值178。
[0134] 位分配單元168表示能夠基于閾值(例如總掩蔽閾值178)分配表示音頻數(shù)據(jù)的 位流180中的位的任何單元。位分配單元168可使用各種閾值178來分配位,以識別何時 分配較多或較少的位。通常,位分配單元168在多個所謂的"遍次"中操作,其中位分配單 元168在第一初始位配置遍次期間,分配用于表示位流180中的SHC170B的位。位分配單 元168可在此第一遍次期間保守地分配位,使得不超過位預(yù)算(其可對應(yīng)于目標(biāo)位速率)。 在第二和可能后續(xù)位配置遍次期間,位分配單元168可分配位預(yù)算(其可對應(yīng)于目標(biāo)位速 率)中剩余的任何位,以進(jìn)一步細(xì)化如何在位流180中表示SHC170B的各種頻段。雖然描 述為基于總掩蔽閾值178來分配位,但位分配單元168可基于空間掩蔽閾值174、時間掩蔽 閾值172和總掩蔽閾值178中的任何一或多者來分配位。
[0135] 圖14是說明音頻解碼裝置(例如圖13的實例中所示的音頻編碼裝置160)在執(zhí) 行本發(fā)明中描述的技術(shù)的各個方面中的示范性操作的流程圖。在操作中,音頻解碼的時頻 單元162可接收SHC170A(200),將SHC170A從時域變換到頻域(其中SHC170A的頻域版 本表示為"SHC170B")(202)。
[0136] 音頻編碼裝置160的同時掩蔽單元164可接著執(zhí)行SHC170B的同時分析(其也 可被稱作"時間分析"),以確定一或多個同時掩蔽閾值172(204)。同時制作單元164可輸 出一或多個同時掩蔽閾值172 (常常在逐頻段基礎(chǔ)上指定)。
[0137] 音頻編碼裝置160的空間掩蔽單元166可相對于SHC170B且根據(jù)上述技術(shù)的各 個方面執(zhí)行空間分析,以確定一或多個空間掩蔽閾值174(其同樣地可在逐頻段基礎(chǔ)上指 定)(206)。空間掩蔽單元166可輸出空間掩蔽閾值174,其由組合器176與同時掩蔽閾值 172 (其也可被稱作"時間掩蔽閾值172")組合,以形成總掩蔽閾值178(208)。組合器176 可添加或執(zhí)行任何其它形式的數(shù)學(xué)運算,來組合時間掩蔽閾值172與空間掩蔽閾值174,以 產(chǎn)生總掩蔽閾值178。
[0138] 位分配單元168表示能夠基于閾值(例如總掩蔽閾值178)分配表示音頻數(shù)據(jù)的 位流180中的位的任何單元。位分配單元168可使用各種閾值178以上文所描述的方式來 分配位,以識別何時分配較多或較少的位(210)。并且,雖然描述為基于總掩蔽閾值178來 分配位,但位分配單元168可基于空間掩蔽閾值174、時間掩蔽閾值172和總掩蔽閾值178 中的任何一或多者來分配位。
[0139] 在一或多個實例中,所描述的功能可在硬件、軟件、固件或其任何組合中實施。如 果在軟件中實施,那么所述功能可作為一或多個指令或代碼在計算機(jī)可讀媒體上存儲或傳 輸,且由基于硬件的處理單元執(zhí)行。計算機(jī)可讀媒體可包含計算機(jī)可讀存儲媒體,其對應(yīng)于 有形媒體,例如數(shù)據(jù)存儲媒體,或包含任何促進(jìn)將計算機(jī)程序從一處傳送到另一處的媒體 (例如,根據(jù)一種通信協(xié)議)的通信媒體。以此方式,計算機(jī)可讀媒體總體上可對應(yīng)于(1) 非暫時性的有形計算機(jī)可讀存儲媒體,或(2)通信媒體,例如信號或載波。數(shù)據(jù)存儲媒體可 為可由一個或一個以上計算機(jī)或一個或一個以上處理器存取以檢索用于實施本發(fā)明中描 述的技術(shù)的指令、代碼和/或數(shù)據(jù)結(jié)構(gòu)的任何可用媒體。計算機(jī)程序產(chǎn)品可包含計算機(jī)可 讀媒體。
[0140] 借助于實例而非限制,此類計算機(jī)可讀存儲媒體可以包括RAM、ROM、EEPR0M、 CD-ROM或其它光盤存儲裝置、磁盤存儲裝置或其它磁性存儲裝置、快閃存儲器或可以用來 存儲指令或數(shù)據(jù)結(jié)構(gòu)的形式的期望程序代碼并且可以由計算機(jī)存取的任何其它媒體。而 且,可恰當(dāng)?shù)貙⑷魏芜B接稱作計算機(jī)可讀媒體。舉例來說,如果使用同軸電纜、光纖纜線、雙 絞線、數(shù)字訂戶線(DSL)或例如紅外線、無線電及微波等無線技術(shù)從網(wǎng)站、服務(wù)器或其它遠(yuǎn) 程源發(fā)射指令,那么同軸電纜、光纖纜線、雙絞線、DSL或例如紅外線、無線電及微波等無線 技術(shù)包含在媒體的定義中。然而,應(yīng)理解,所述計算機(jī)可讀存儲媒體和數(shù)據(jù)存儲媒體并不包 含連接、載波、信號或其它暫時性媒體,而是實際上針對非暫時性的有形存儲媒體。如本文 所使用,磁盤和光盤包含壓縮光盤(CD)、激光光盤、光學(xué)光盤、數(shù)字多功能光盤(DVD)、軟性 磁盤和藍(lán)光光盤,其中磁盤通常以磁性方式再現(xiàn)數(shù)據(jù),而光盤用激光以光學(xué)方式再現(xiàn)數(shù)據(jù)。 上述各項的組合也應(yīng)該包含在計算機(jī)可讀媒體的范圍內(nèi)。
[0141] 指令可由一或多個處理器執(zhí)行,所述一或多個處理器例如是一或多個數(shù)字信號處 理器(DSP)、通用微處理器、專用集成電路(ASIC)、現(xiàn)場可編程邏輯陣列(FPGA),或其它等 效的集成或離散邏輯電路。因此,如本文中所使用的術(shù)語"處理器"可指代上述結(jié)構(gòu)或適合 于實施本文中所描述的技術(shù)的任何其它結(jié)構(gòu)中的任一者。另外,在一些方面中,本文所描述 的功能性可以提供于經(jīng)配置用于編碼及解碼的專用硬件和/或軟件模塊內(nèi),或者并入于組 合式編碼解碼器中。并且,所述技術(shù)可完全實施于一或多個電路或邏輯元件中。
[0142] 本發(fā)明的技術(shù)可在各種各樣的.裝置或設(shè)備中實施,包含無線手持機(jī)、集成電路 (1C)或一組1C(例如,芯片組)。本發(fā)明中描述各種組件、模塊或單元以強(qiáng)調(diào)經(jīng)配置以執(zhí)行 所揭示的技術(shù)的裝置的功能方面,但未必需要由不同硬件單元實現(xiàn)。實際上,如上文所描 述,各種單元可結(jié)合合適的軟件及/或固件組合在編解碼器硬件單元中,或者通過互操作 硬件單元的集合來提供,所述硬件單元包括如上文所描述的一或多個處理器。
[0143] 已描述所述技術(shù)的各種實施例。所述技術(shù)的這些和其它方面在所附權(quán)利要求書的 范圍內(nèi)。
【主權(quán)項】
1. 一種壓縮多聲道音頻數(shù)據(jù)的方法,其包括: 基于描述三維聲場的多個球面諧波系數(shù)來執(zhí)行空間分析,以識別空間掩蔽閾值; 從所述多個球面諧波系數(shù)渲染所述多聲道音頻數(shù)據(jù);以及 基于所述所識別的空間掩蔽閾值來壓縮所述多聲道音頻數(shù)據(jù),以產(chǎn)生位流。2. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括為所述位流確定目標(biāo)位速率, 其中壓縮所述多聲道音頻數(shù)據(jù)包括基于所述目標(biāo)位速率,執(zhí)行i)參數(shù)聲道間音頻編 碼和使用所述空間掩蔽閾值的空間掩蔽,或i i)使用所述空間掩蔽閾值的所述空間掩蔽, 而不執(zhí)行所述參數(shù)聲道間音頻編碼,以產(chǎn)生表示所述經(jīng)壓縮音頻數(shù)據(jù)的位流。3. 根據(jù)權(quán)利要求2所述的方法,其中執(zhí)行i)所述參數(shù)聲道間音頻編碼和使用所述空間 掩蔽閾值的所述空間掩蔽,或ii)使用所述空間掩蔽閾值的所述空間掩蔽,而不執(zhí)行所述 參數(shù)聲道間音頻編碼包括: 確定所述目標(biāo)位速率低于閾值位速率;以及 響應(yīng)于確定所述目標(biāo)位速率低于所述閾值位速率,執(zhí)行所述參數(shù)聲道間音頻編碼和使 用所述空間掩蔽閾值的