国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      相對于球面諧波系數(shù)執(zhí)行空間掩蔽的制作方法_4

      文檔序號:9493769閱讀:來源:國知局
      定位。為了對此不大合意的圖像質(zhì) 量進行校正,可進一步擴充技術(shù)以引入可被稱作"虛擬揚聲器"的概念??尚薷囊陨峡蚣芤?包含某一形式的平移,例如向量基礎(chǔ)振幅平移(VBAP)、基于距離的振幅平移或其它形式的 平移,而不是需要將一或多個擴音器再定位或定位于具有由例如上述的ITU-RBS. 775-1等 標(biāo)準(zhǔn)指定的特定角度公差的空間的特定或所定義的區(qū)中。出于說明的目的而聚焦于VBAP 上,VBAP可有效地引入可被表征為"虛擬揚聲器"的東西。VBAP可通常修改去往一或多個 擴音器的饋送,使得這些一或多個擴音器有效地輸出看起來源自虛擬揚聲器的聲音,所述 虛擬揚聲器處于不同于支持所述虛擬揚聲器的一或多個擴音器的位置和/或角度中的至 少一者的位置和角度中的一或多者處。
      [0092] 為進行說明,用于根據(jù)SHC確定擴音器饋送的以上等式可如下修改:
      [0094] 在以上等式中,VBAP矩陣具有Μ行XN列的大小,其中Μ表示揚聲器的數(shù) 目(且在以上等式中將等于五),且Ν表示虛擬揚聲器的數(shù)目??梢罁?jù)從收聽者的 經(jīng)定義位置到揚聲器的位置中的每一者的向量以及從收聽者的經(jīng)定義位置到虛擬 揚聲器的位置中的每一者的向量來計算VBAP矩陣。以上等式中的D矩陣可具有Ν 行X(階數(shù)+1)2列的大小,其中階數(shù)可指代SH函數(shù)的階數(shù)。D矩陣可表示以下矩陣:
      [0095]g矩陣(或在僅存在單個列的條件下,向量)可表示布置成解碼器局部幾何結(jié)構(gòu) 的揚聲器的揚聲器饋送的增益。在等式中,g矩陣具有大小Μ。A矩陣(或在僅存在單個列 的條件下,向量)可表示SHC520,且具有大?。A數(shù)+1)(階數(shù)+1),其也可表示為(階數(shù) +1)2〇
      [0096] 實際上,VBAP矩陣為MXN矩陣,其提供可被稱作"增益調(diào)整"的調(diào)整,所述調(diào)整將 揚聲器的位置和虛擬揚聲器的位置考慮在內(nèi)。以此方式引入平移可導(dǎo)致多通道音頻的較好 再現(xiàn),這導(dǎo)致在由局部揚聲器幾何結(jié)構(gòu)再現(xiàn)時的較好質(zhì)量圖像。此外,通過將VBAP并入到 此等式中,技術(shù)可克服與各種標(biāo)準(zhǔn)中所指定的幾何結(jié)構(gòu)不一致的不佳揚聲器幾何結(jié)構(gòu)。
      [0097] 實際上,可反轉(zhuǎn)和使用所述等式以將SHC變換回到用于擴音器的特定幾何結(jié)構(gòu)或 配置的多聲道饋送,所述特定幾何結(jié)構(gòu)或配置在本發(fā)明中可再次被稱作解碼器局部幾何結(jié) 構(gòu)。就是說,可反轉(zhuǎn)等式來求解g矩陣。經(jīng)反轉(zhuǎn)的等式可如下:
      [0099]g矩陣可表示在此實例中用于5. 1揚聲器配置中的五個擴音器中的每一者的揚聲 器增益。此配置中所使用的虛擬揚聲器位置可對應(yīng)于5. 1多聲道格式規(guī)格或標(biāo)準(zhǔn)中所定義 的位置??墒褂萌魏螖?shù)目的已知音頻定位技術(shù)來確定可支持這些虛擬揚聲器中的每一者的 擴音器的位置,所述技術(shù)中的許多技術(shù)涉及播放具有特定頻率的音調(diào),以確定每一擴音器 相對于頭端單元(例如音頻/視頻接收器(A/V接收器)、電視機、游戲系統(tǒng)、數(shù)字視頻光盤 系統(tǒng)或其它類型的頭端系統(tǒng))的位置?;蛘?,頭端單元的用戶可手動地指定擴音器中的每 一者的位置。在任何情況下,在給定這些已知位置和可能角度的情況下,假定虛擬擴音器的 通過VBAP的理想配置,頭端單元可求解增益。
      [0100] 在這方面中,所述技術(shù)可使裝置或設(shè)備能夠?qū)Χ鄠€虛擬聲道執(zhí)行向量基礎(chǔ)振幅平 移或其它形式的平移,以產(chǎn)生多個聲道,其驅(qū)動解碼器局部幾何結(jié)構(gòu)中的揚聲器發(fā)出聲音, 所述聲音看起來源自配置成不同局部幾何結(jié)構(gòu)的虛擬揚聲器。所述技術(shù)可因此使音頻解碼 單元32能夠?qū)Χ鄠€球面諧波系數(shù)(例如SHC20A)執(zhí)行變換,以產(chǎn)生多個聲道。所述多個聲 道中的每一者可與空間的對應(yīng)不同區(qū)相關(guān)聯(lián)。此外,所述多個聲道中的每一者可包括多個 虛擬聲道,其中所述多個虛擬通道可與空間的對應(yīng)不同區(qū)相關(guān)聯(lián)。在一些情況下,所述技術(shù) 可使裝置能夠?qū)μ摂M聲道執(zhí)行向量基礎(chǔ)振幅平移,以產(chǎn)生多聲道音頻數(shù)據(jù)40的多個聲道。
      [0101] 圖9是說明音頻編碼裝置(例如圖4的實例中所示的音頻編碼裝置10)在執(zhí)行本 發(fā)明中描述的技術(shù)的各個方面中的示范性操作的流程圖。在操作中,音頻編碼裝置10可通 過首先調(diào)用空間分析單元18來相對于描述三維聲場的SHC20A執(zhí)行空間分析,以識別所述 聲場的空間特性26,來實施本發(fā)明中描述的技術(shù)的各個方面(90)。音頻編碼裝置10可接 著調(diào)用音頻渲染單元14來從SHC20A(當(dāng)如上所述不執(zhí)行時頻分析時)或SHC20B(當(dāng)執(zhí) 行時頻分析時)渲染多聲道音頻數(shù)據(jù)22 (其也可被稱作"多聲道音頻數(shù)據(jù)22")(92)。在渲 染此多聲道音頻數(shù)據(jù)22之后或與之同時,音頻編碼裝置10可調(diào)用音頻編碼單元16來基于 所識別的空間特性26編碼多聲道音頻數(shù)據(jù)22,以產(chǎn)生位流24(94)。如上所述音頻編碼單 元16可以各種方式執(zhí)行已經(jīng)修改的音頻編碼的標(biāo)準(zhǔn)順應(yīng)形式,以利用空間特性26 (例如, 以執(zhí)行上述空間掩蔽)。
      [0102] 圖10是說明音頻解碼裝置(例如圖5的實例中所示的音頻解碼裝置30)在執(zhí)行 本發(fā)明中描述的技術(shù)的各個方面中的示范性操作的流程圖。在操作中,音頻解碼裝置30可 調(diào)用音頻解碼單元32來解碼位流24,以產(chǎn)生具有對應(yīng)于布置成第一揚聲器幾何結(jié)構(gòu)的揚 聲器的多個聲道的第一多聲道音頻數(shù)據(jù)22(100)。此第一揚聲器幾何結(jié)構(gòu)可包括上文所述 的密集T設(shè)計,其中作為一個實例,揚聲器的數(shù)目可為32。一般來說,第一揚聲器幾何結(jié)構(gòu) 中的揚聲器的數(shù)目應(yīng)超過解碼器局部揚聲器幾何結(jié)構(gòu)中的揚聲器的數(shù)目,以在解碼器局部 揚聲器幾何結(jié)構(gòu)對音頻數(shù)據(jù)的重放期間,提供高保真度。
      [0103] 音頻解碼裝置30可接著調(diào)用逆音頻渲染單元34來相對于所產(chǎn)生的第一多聲道音 頻數(shù)據(jù)22執(zhí)行逆渲染過程,以產(chǎn)生SHC20B(當(dāng)執(zhí)行時頻變換時)或SHC20A(當(dāng)不執(zhí)行時 頻分析時)(102)。當(dāng)音頻編碼裝置10執(zhí)行時頻分析時,音頻解碼裝置30還可調(diào)用逆時頻 分析單元36來將SHC20B從頻域變換回到時域,從而產(chǎn)生SHC20A。在任何情況下,音頻解 碼裝置10可接著調(diào)用音頻渲染單元38來基于SHC20A而渲染具有對應(yīng)于布置成局部揚聲 器幾何結(jié)構(gòu)的揚聲器的多個聲道的第二多聲道音頻數(shù)據(jù)40 (104)。
      [0104] 以此方式,所述技術(shù)可使用現(xiàn)有的音頻譯碼器(并修改其各個方面,以適應(yīng)來自 SHC的空間信息)。為了這樣做,所述技術(shù)可取SH系數(shù),并(使用渲染器R1)將其渲染到 任意但密集的一組擴音器。這些擴音器的幾何結(jié)構(gòu)可使得逆渲染器(Rl_inv)可重新產(chǎn)生 SH信號。在一些實例中,渲染器可為僅單個矩陣(與頻率無關(guān)),且其中的一者具有逆配 對矩陣,使得RlxRl_inv=單位矩陣。這些植染器針對T設(shè)計或柏拉圖多面體(Platonic Solids)所描述的幾何結(jié)構(gòu)而存在。可使用將由從SHC搜集/分析的空間信息修改的"現(xiàn) 成"音頻譯碼器來譯碼渲染器(R1)所產(chǎn)生的擴音器饋送。在一些情況下,所述技術(shù)可采取 常見的音頻譯碼方法,借此維持揚聲器饋送之間的聲道間層級/時間/相關(guān)中的一或多者。 使用壓縮來講較多聲道打包到為單個聲道等分配的位中。
      [0105] 在解碼器處,所述技術(shù)可使解碼器能夠恢復(fù)揚聲器饋送,并使其通過逆渲染器 (Rl_inv),以檢索原始SHC??蓪⑦@些SHC饋送到另一渲染器(R2)中,意在迎合局部揚聲器 幾何結(jié)構(gòu)。通常,所述技術(shù)規(guī)定R1的輸出處所產(chǎn)生的揚聲器饋送的數(shù)目相對于渲染器R2 的輸出處可能存在的揚聲器的數(shù)目來說較密集。換句話說,當(dāng)渲染第一多聲道音頻數(shù)據(jù)時, 假定揚聲器的數(shù)目比R2渲染器的輸出處可能存在的揚聲器的實際數(shù)目高得多。
      [0106] 應(yīng)認(rèn)識到,取決于實例,本文中所描述的技術(shù)中的任一者的某些動作或事件可用 不同序列來執(zhí)行,可添加、合并或全部省略所述動作或事件(例如,實踐所述技術(shù)未必需要 所有所描述動作或事件)。此外,在某些實例中,可(例如)經(jīng)由多線程處理、中斷處理或多 個處理器同時而非循序地執(zhí)行動作或事件。
      [0107]圖11是說明本發(fā)明中描述的空間掩蔽技術(shù)的各個方面的圖。在圖11的實例中, 曲線110包含X軸,其表示表達(dá)為SHC的聲場內(nèi)的三維空間中的點。曲線110的y軸指示 單位為分貝的增益。曲線110描繪如何在某一給定頻率(例如頻率f\)下為點二(P2)計算 空間掩蔽閾值??蓪⒖臻g掩蔽閾值計算為每一其它點(從P2的角度)的能量的總和。就 是說,短劃線表示從匕的角度來說點一(PJ和點三(P3)的掩蔽能量。能量的總量可表達(dá) 空間掩蔽閾值。除非匕具有大于空間掩蔽閾值的能量,否則不必發(fā)送或以其它方式編碼P2 的SHC。數(shù)學(xué)上,可根據(jù)以下等式來計算空間掩蔽(SMth)閾值:
      [0109] 其中^^表示點Pi處的能量??蓮乃鳇c的角度針對每一點且針對每一頻率(或 可表示頻帶的頻段)來計算空間掩蔽閾值。
      [0110] 作為一個實例,圖4A的實例中所示的空間分析單元18可根據(jù)以上等式來計算空 間掩蔽閾值,以便潛在地減小所得位流的大小。在一些情況下,經(jīng)執(zhí)行以計算空間掩蔽閾值 的此空間分析可結(jié)合聲道22上的單獨掩蔽塊以及到音頻編碼單元16中的反饋來執(zhí)行。雖 然曲線110描繪dB域,但所述技術(shù)也可在空間域中執(zhí)行。
      [0111] 在一些實例中,空間掩蔽閾值可與時間(或換句話說,同時)掩蔽閾值一起使用。 通常,可將空間掩蔽閾值添加到時間掩蔽閾值,以產(chǎn)生整體掩蔽閾值。在一些情況下,當(dāng)產(chǎn) 生整體掩蔽閾值時,將權(quán)重應(yīng)用于空間和時間掩蔽閾值。這些閾值可表達(dá)為比率(例如信 噪比(SNR))的函數(shù)。當(dāng)將位分配給每一頻段時,位分配器可使用整體閾值。圖4A的音頻 編碼單元16可表示一種形式的位分配器,其使用空間掩蔽閾值、時間掩蔽閾值或整體掩蔽 閾值中的一或多者將位分配給頻段。
      [0112] 圖12是說明其中可根據(jù)本發(fā)明中描述的技術(shù)的各個方面執(zhí)行產(chǎn)生位流24的不同 形式的圖4A的實例中所示的音頻編碼裝置的變化的框圖。如圖12的實例中示出,音頻編 碼裝置10的所述變化表示為音頻編碼裝置10'。音頻編碼裝置10'類似于圖4A的音頻編 碼裝置10,因為音頻編碼裝置10'包含相似單元,即圖12的實例中的時頻分析單元12、音 頻植染單元14、音頻編碼單元16和空間分析單元18。
      [0113] 然而,音頻編碼裝置10'還包含模式選擇器單元150,其表示確定是在編碼聲道22 之前渲染SHC20B還是將SHC20B直接發(fā)射到音頻編碼單元16而不首先將SHC20B渲染 到聲道22的單元。模式選擇器單元150可接收目標(biāo)位速率152作為來自用戶、另一裝置或 經(jīng)由可輸入目標(biāo)位速率152的任何其它方式的輸入。目標(biāo)位速率152可表示定義位流24 的位速率或壓縮等級的數(shù)據(jù)。
      [0114] 在一個實例中,對于位速率152所指定的較高位速率,模式選擇器單元150可確定 音頻編碼單元16將使用本發(fā)明中描述的技術(shù)的空間掩蔽方面來直接對SHC20B進行音頻 編碼。較高位速率的一個實例可為等于或高于256千位每秒(Kbps)的位速率。因此,對于 例如256Kbps、512Kbps和/或1. 2兆位每秒(Mbps)(其中在此實例中,256Kbps可表示用 以從較低位速率確定較高位速率的閾值位速率)的位速率,音頻編碼單元16可直接對SHC 20B操作,且音頻渲染單元14不再將SHC20B渲染到聲道22。
      [0115] 對于位速率152所指定的較低位速率,模式選擇器單元150可確定音頻植染單元 14將首先渲染SHC20B以產(chǎn)生聲道22,且接著隨后音頻編碼單元16對SHC20B進行編碼。 在此實例中音頻編碼單元16可相對于第一聲道執(zhí)行空間掩蔽技術(shù),而其余聲道經(jīng)歷參數(shù) 編碼,例如根據(jù)MPEG環(huán)繞聲和其它參數(shù)聲道間編碼方案來執(zhí)行的編碼。
      [0116] 音頻編碼單元16可在位流中指定(以經(jīng)編碼或未經(jīng)編碼形式)模式選擇器單元 150所選擇的模式,使得解碼裝置可確定當(dāng)產(chǎn)生位流24時,是否執(zhí)行參數(shù)聲道間編碼。雖然 未詳細(xì)展示,但音頻解碼裝置30可以與音頻編碼裝置10'的修改方式類似的方式修改(其 中此音頻解碼裝置30可被稱為音頻解碼裝置30')。此音頻解碼裝置30'可同樣地包含類 似于模式選擇器單元150的模式選擇器單元,其確定是將聲道22輸出到逆音頻植染單元34 還是將SHC20B輸出到逆時頻分析單元36。在一些情況下,可從位流24所對應(yīng)于的目標(biāo)位 速率152 (其中此目標(biāo)位速率152可在位流24中指定,且在音頻解碼裝置30'可從目標(biāo)位 速率152推斷此模式的條件下,有效地表示所述模式)推斷此模式。
      [0117] 在這方面中,本發(fā)明中描述的技術(shù)可使音頻編碼裝置10'能夠執(zhí)行壓縮音頻數(shù)據(jù) 的方法。在執(zhí)行此方法時,音頻編碼裝置10'可確定表示經(jīng)壓縮音頻數(shù)據(jù)的位流的目標(biāo)位 速率,且基于以三維形式描述音頻數(shù)據(jù)的聲場的多個球面諧波系數(shù)來執(zhí)行空間分析,以識 別空間掩蔽閾值。基于目標(biāo)位速率,音頻編碼裝置10'可執(zhí)行i)參數(shù)聲道間音頻編碼和使 用空間掩蔽閾值的空間掩蔽,或ii)使用空間掩蔽閾值的空間掩蔽,而不執(zhí)行參數(shù)聲道間 音頻編碼,以產(chǎn)生表示經(jīng)壓縮音頻數(shù)據(jù)的位流。
      [011
      當(dāng)前第4頁1 2 3 4 5 6 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1