專利名稱:用于中側(cè)立體聲的音頻編碼技術(shù)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻編碼技術(shù),且更特定而言,涉及用于根據(jù)中側(cè)(MS)立體聲編 碼技術(shù)而編碼的音頻信息的解碼技術(shù)。
背景技術(shù):
音頻編碼用于許多應(yīng)用和環(huán)境中,例如衛(wèi)星無(wú)線電、數(shù)字無(wú)線電、因特網(wǎng)流(web 無(wú)線電)、數(shù)字音樂(lè)播放器和各種移動(dòng)多媒體應(yīng)用。存在許多音頻編碼標(biāo)準(zhǔn),例如根 據(jù)運(yùn)動(dòng)圖像專家群組(MPEG)的標(biāo)準(zhǔn)、視窗操作系統(tǒng)媒體音頻(windows media audio ) (WMA)和按照杜比實(shí)驗(yàn)室股份有限公司(Dolby Laboratories, Inc)的標(biāo)準(zhǔn)。許多音頻 編碼標(biāo)準(zhǔn)繼續(xù)出現(xiàn),包含MP3標(biāo)準(zhǔn)和MP3標(biāo)準(zhǔn)的后繼者,例如在蘋(píng)果計(jì)算機(jī)股份有 限公司(Apple Computer, Inc)出售的"iPod"裝置中使用的高級(jí)音頻編碼(AAC)標(biāo) 準(zhǔn)。音頻編碼標(biāo)準(zhǔn)通常尋求使用壓縮技術(shù)達(dá)成低比特率、高質(zhì)量音頻編碼。某些音頻 編碼是"無(wú)損的",其意指所述編碼不降級(jí)音頻信號(hào),而其它音頻編碼可引入某些損 失以達(dá)成額外的壓縮。
在許多應(yīng)用中,音頻編碼與視頻編碼一起使用來(lái)為應(yīng)用(例如視頻電話(VT)或 流式視頻)提供多媒體內(nèi)容。例如,根據(jù)MPEG的視頻編碼標(biāo)準(zhǔn)經(jīng)常使用音頻和視頻 編碼。當(dāng)前,所述MPEG標(biāo)準(zhǔn)包含MPEG-1、 MPEG-2和MPEG-4,但可能會(huì)出現(xiàn)其 它標(biāo)準(zhǔn)。其它實(shí)例性視頻標(biāo)準(zhǔn)包含國(guó)際電信聯(lián)盟(ITU) H.263標(biāo)準(zhǔn)、ITUH.264標(biāo)準(zhǔn)、 由蘋(píng)果計(jì)算機(jī)股份有限公司開(kāi)發(fā)的QuickTimeTM技術(shù)、由微軟公司(Microsoft Corporation)開(kāi)發(fā)的針對(duì)WindowsTM的視頻、由英特爾公司(Intel Corporation)開(kāi)發(fā) 的IndeoTM、來(lái)自瑞耐沃股份有限公司(RealNetworks, Inc)的RealVideoTM和由休麥克 股份有限公司(SuperMac,Inc)開(kāi)發(fā)的Cinepak 。某些音頻和視頻標(biāo)準(zhǔn)是開(kāi)放來(lái)源, 而其它仍為專有。許多其它音頻和視頻編碼標(biāo)準(zhǔn)會(huì)繼續(xù)出現(xiàn)并演進(jìn)。
立體聲編碼是指使用兩個(gè)不同編碼聲道的音頻編碼。因?yàn)槿祟愑锌梢远ㄏ蚍绞綑z 測(cè)聲音的兩只耳朵,因此立體聲編碼可改良人類從經(jīng)解碼音頻信號(hào)檢測(cè)到的所感覺(jué)聲 音的質(zhì)量。 一個(gè)相對(duì)直觀的編碼立體聲聲音信息的方式是使用左和右聲道來(lái)分別編碼 左和右信號(hào)。然而,對(duì)于例如音樂(lè)唱片的復(fù)雜聲音來(lái)說(shuō),由于左和右話筒可檢測(cè)處于 不同時(shí)間延遲的相同聲音的事實(shí),左和右編碼聲道并不是特別好用。出于此原因,開(kāi) 發(fā)了中側(cè)(MS)立體聲來(lái)改良立體聲聲音質(zhì)量。
在MS立體聲中,使用兩個(gè)不同信號(hào)來(lái)分別編碼聲源的位置和立體聲圖像的混響
環(huán)境?;旧希?jīng)由中間信號(hào)和邊側(cè)信號(hào)來(lái)編碼MS立體聲。解碼之后,左聲道通常 是兩個(gè)經(jīng)編碼聲道的和,而右聲道通常是所述兩個(gè)經(jīng)編碼聲道的差。通過(guò)使用中間立 體聲分量和邊側(cè)立體聲分量,可利用左和右聲道中的立體聲冗余來(lái)達(dá)成更好質(zhì)量的立 體聲編碼,以及針對(duì)既定質(zhì)量水平的更好的壓縮水平。
發(fā)明內(nèi)容
本發(fā)明描述用于根據(jù)中側(cè)(MS)立體聲編碼而編碼的音頻信息的解碼技術(shù)。所 述技術(shù)涉及以非常規(guī)次序執(zhí)行的許多音頻解碼任務(wù)。通過(guò)重新布置所述解碼任務(wù)的次 序,可實(shí)現(xiàn)各種效率。例如,可通過(guò)允許對(duì)第一聲道進(jìn)行修正離散余弦逆變換(IMDCT) 計(jì)算任務(wù)與對(duì)第二聲道進(jìn)行預(yù)解碼任務(wù)并行執(zhí)行來(lái)消除或減少解碼過(guò)程中的等待時(shí) 間。特定而言,當(dāng)與直接存儲(chǔ)器交換(DME)技術(shù)一起使用時(shí),所述技術(shù)可允許從存 儲(chǔ)器取數(shù)據(jù)在對(duì)另一聲道進(jìn)行IMDCT計(jì)算時(shí)并行地加載解碼一個(gè)聲道時(shí)所使用的解 碼表(例如,霍夫曼(Huffman)表)。以此方式,所述技術(shù)提供計(jì)算上的優(yōu)點(diǎn)且可 加速音頻解碼過(guò)程。
在一個(gè)實(shí)施例中,本發(fā)明提供一種裝置,其包括存儲(chǔ)經(jīng)編碼音頻信息的存儲(chǔ)器和 解碼所述信息的解碼器單元。所述解碼器單元解碼所述音頻信息的第一聲道,在產(chǎn)生 MS立體聲信息之前計(jì)算第一聲道的IMDCT,解碼所述音頻信息的第二聲道,在產(chǎn)生 所述MS立體聲信息之前計(jì)算第二聲道的IMDCT,和使用所述第一和所述第二聲道的 IMDCT來(lái)產(chǎn)生MS立體聲信息。
在另一實(shí)施例中,本發(fā)明提供一種解碼MS立體聲音頻信息的方法。所述方法包 括解碼所述音頻信息的第一聲道,在產(chǎn)生MS立體聲信息之前計(jì)算第一聲道的IMDCT, 解碼所述音頻信息的第二聲道,在產(chǎn)生所述MS立體聲信息之前計(jì)算第二聲道的 IMDCT,和使用所述第一和第二聲道的IMDCT來(lái)產(chǎn)生所述MS立體聲信息。為利用 此技術(shù),可在所述第一聲道的IMDCT計(jì)算期間執(zhí)行加載用于所述第二聲道的解碼表 的從存儲(chǔ)器取數(shù)據(jù)。
可將本文所描述的這些及其它技術(shù)實(shí)施于硬件、軟件、固件或其任一組合中。如 果實(shí)施于軟件中,那么可在數(shù)字信號(hào)處理器(DSP)或其它類型的處理器中執(zhí)行所述 軟件。執(zhí)行所述技術(shù)的軟件可初始地存儲(chǔ)在計(jì)算機(jī)可讀媒體中且加載并執(zhí)行于DSP中 以有效地音頻解碼根據(jù)MS立體聲所編碼的音頻信息。
因此,本發(fā)明也考慮包括可執(zhí)行指令的計(jì)算機(jī)可讀媒體,所述可執(zhí)行指令在支持 MS立體聲的裝置中執(zhí)行時(shí)會(huì)解碼音頻信息的第一聲道,在產(chǎn)生MS立體聲信息之前 計(jì)算所述第一聲道的IMDCT,解碼所述音頻信息的第二聲道,在產(chǎn)生所述MS立體聲 信息之前計(jì)算所述第二聲道的IMDCT,和使用所述第一和第二聲道的IMDCT來(lái)產(chǎn)生 所述MS立體聲信息。
在再另一實(shí)施例中,本發(fā)明提供用于音頻解碼裝置的解碼器單元,其中所述解碼
器單元解碼音頻信息的第一聲道,在產(chǎn)生MS立體聲信息之前計(jì)算所述第一聲道的變 換,解碼所述音頻信息的第二聲道,在產(chǎn)生所述MS立體聲信息之前計(jì)算所述第二聲 道的變換,和使用所述第一和第二聲道的變換來(lái)產(chǎn)生所述MS立體聲信息。
在附圖和下文說(shuō)明中闡述各實(shí)施例的額外細(xì)節(jié)。從本說(shuō)明和圖式且從權(quán)利要求書(shū) 將明了其它特征、目的和優(yōu)點(diǎn)。
圖1是可實(shí)施本發(fā)明的技術(shù)的實(shí)例音頻解碼裝置的方框圖。
圖2-4是圖解說(shuō)明可由圖1的音頻解碼裝置或其它類似裝置執(zhí)行的技術(shù)的流程圖。
具體實(shí)施例方式
本發(fā)明描述用于根據(jù)中側(cè)(MS)立體聲編碼而編碼的音頻信息的解碼技術(shù)。在 MS立體聲中,使用兩個(gè)不同的信號(hào)分別編碼聲源的位置和立體聲圖像的混響環(huán)境。 基本上,從中間信號(hào)和邊側(cè)信號(hào)來(lái)編碼MS立體聲。解碼MS立體聲之后,左聲道通 常是第一和第二經(jīng)編碼聲道的和,而右聲道通常是所述第一和第二經(jīng)編碼聲道的差。 也可顛倒左和右聲道。
常規(guī)MS立體聲解碼涉及聲道1的解碼后跟所述聲道的逆量化。接下來(lái),解碼聲 道2后跟所述聲道的逆量化。然后,從經(jīng)解碼的聲道1和2來(lái)計(jì)算左和右聲道的立體 聲信息。例如,左聲道MS立體聲信息可包括聲道l+聲道2,且右聲道MS立體聲信 息可包括聲道1-聲道2。接下來(lái),相關(guān)于左聲道立體聲信息執(zhí)行修正離散余弦逆變換 (IMDCT),執(zhí)行開(kāi)窗口和再現(xiàn)用于左聲道的音頻樣本。類似地,相關(guān)于右聲道立體 聲信息執(zhí)行IMDCT,執(zhí)行開(kāi)窗口和再現(xiàn)用于右聲道的音頻樣本。以此方式,常規(guī)MS 立體聲解碼通常是其中IMDCT跟隨MS立體聲信息的產(chǎn)生的有序過(guò)程。
本發(fā)明中所述的技術(shù)可包含類似于常規(guī)MS立體聲解碼的步驟,但以非常規(guī)次序 來(lái)執(zhí)行所述步驟。具體來(lái)說(shuō),根據(jù)本發(fā)明,在產(chǎn)生左和右聲道的MS立體聲信息之前, 相關(guān)于聲道1和2執(zhí)行IMDCT。通過(guò)重新布置所述解碼任務(wù)的次序,可實(shí)現(xiàn)各種效率。 例如,可通過(guò)允許對(duì)第一聲道進(jìn)行IMDCT計(jì)算任務(wù)與對(duì)第二聲道進(jìn)行預(yù)解碼任務(wù)并 行地執(zhí)行來(lái)消除或減少解碼過(guò)程中的等待時(shí)間。特定而言,當(dāng)在數(shù)字信號(hào)處理器中 (DSP)與直接存儲(chǔ)器交換(DEM)技術(shù)一起使用時(shí),所述技術(shù)可允許從存儲(chǔ)器取用 于一個(gè)聲道的解碼表的數(shù)據(jù)與對(duì)另一聲道進(jìn)行IMDCT計(jì)算并行執(zhí)行。以此方式,本 文中所述的技術(shù)可提供計(jì)算上的優(yōu)點(diǎn)且可加速音頻解碼過(guò)程。
DME技術(shù)通常是指DSP執(zhí)行的從存儲(chǔ)器取數(shù)據(jù),其在DSP的時(shí)鐘周期期間與 DSP處理并行執(zhí)行。也可使用其它類型的存儲(chǔ)器或處理技術(shù),尤其是支持在處理器的 計(jì)算任務(wù)期間執(zhí)行到芯片上處理器位置中的并行存儲(chǔ)器加載的能力的任一技術(shù)。
圖1是可實(shí)施本發(fā)明的技術(shù)的音頻解碼裝置10的方框圖。所示裝置IO包含存儲(chǔ)
器12和MS立體聲解碼單元14。存儲(chǔ)器12可存儲(chǔ)已根據(jù)MS立體聲編碼的音頻信息。 音頻信息可能己通過(guò)通信聲道接收,例如對(duì)于實(shí)時(shí)音頻而言,或可能己存儲(chǔ)在存儲(chǔ)器 12中一段經(jīng)延長(zhǎng)時(shí)間。解碼單元14執(zhí)行一個(gè)或一個(gè)以上本發(fā)明的技術(shù),以改進(jìn)音頻 信息的解碼過(guò)程。特定而言,解碼單元14解碼音頻信息的第一聲道,在產(chǎn)生MS立體 聲信息之前計(jì)算第一聲道的IMDCT,解碼所述音頻信息的第二聲道,在產(chǎn)生所述MS 立體聲信息之前計(jì)算第二聲道的IMDCT,和使用所述第一和第二聲道的IMDCT來(lái)產(chǎn) 生所述MS立體聲信息。然后,MS立體聲信息可用來(lái)產(chǎn)生可驅(qū)動(dòng)左和右揚(yáng)聲器16A 和16B的信號(hào)。特定而言,驅(qū)動(dòng)電路15可接收來(lái)自MS立體聲解碼單元14的MS立 體聲信息且基于所述MS立體聲信息產(chǎn)生用于揚(yáng)聲器16A和16B的驅(qū)動(dòng)電壓。驅(qū)動(dòng)電 路15可包含一個(gè)或一個(gè)以上數(shù)字模擬轉(zhuǎn)換器(DAC)、功率放大器和其它模擬信號(hào) 調(diào)節(jié)組件。
由于常規(guī)MS解碼需要在執(zhí)行IMDCT之前解碼兩個(gè)經(jīng)編碼聲道和產(chǎn)生MS立體 聲信息的事實(shí),因此MS解碼中可發(fā)生"瓶頸"。然而,根據(jù)本發(fā)明,可在產(chǎn)生左和 右聲道的MS立體聲信息之前執(zhí)行每一經(jīng)編碼聲道(聲道1和2)的IMDCT。所觀察 的IMDCT線性特性使此變化成為可能。
此外,通過(guò)重新布置解碼過(guò)程的步驟,可利用并行處理來(lái)達(dá)成效率。例如,可通 過(guò)允許解碼單元14與第二聲道的預(yù)解碼任務(wù)并行地對(duì)第一聲道執(zhí)行IMDCT來(lái)消除或 減少解碼這程中的等待時(shí)間。特定而言,當(dāng)在計(jì)算期間與DME技術(shù)或支持從存儲(chǔ)器 取數(shù)據(jù)的類似技術(shù)一起使用時(shí),所述技術(shù)可允許解碼單元14與IMDCT計(jì)算并行地執(zhí) 行從存儲(chǔ)器12中的存儲(chǔ)器取數(shù)據(jù)。從存儲(chǔ)器取數(shù)據(jù)可加載在解碼一個(gè)聲道中使用的解 碼表(例如霍夫曼表)。同時(shí),可針對(duì)其它聲道執(zhí)行IMDCT計(jì)算。以此方式,解碼 單元14可達(dá)成計(jì)算上的效率且可加速音頻解碼過(guò)程。
裝置IO可包括可包含音頻解碼能力的眾多裝置中的任一者。實(shí)例包含例如iPod 的數(shù)字音樂(lè)播放器、數(shù)字電視、數(shù)字直接廣播系統(tǒng)、無(wú)線通信裝置、個(gè)人數(shù)字助理 (PDA)、膝上型計(jì)算機(jī)、臺(tái)式計(jì)算機(jī)、數(shù)碼相機(jī)、數(shù)字記錄裝置、蜂窩式或衛(wèi)星無(wú) 線電電話、直接雙向通信裝置(有時(shí)稱作"對(duì)講機(jī)")和類似裝置。
圖2是圖解說(shuō)明可由解碼單元14實(shí)施的解碼過(guò)程的流程圖。所示解碼單元14解
碼音頻信息的第一聲道(21),且然后在產(chǎn)生MS立體聲信息(25)之前計(jì)算第一聲
道的IMDCT (22)。接下來(lái),解碼單元14解碼所述音頻信息的第二聲道(23),且
在產(chǎn)生MS立體聲信息(25)之前計(jì)算所述第二聲道的IMDCT (24)。
第一和第二聲道的IMDCT的計(jì)算可大致上遵循以下等式1和2:
<formula>formula see original document page 8</formula>
其中聲遣—翰忠'表示聲道1的IMDCT,
聲遭_好/坊_薪幼'表示聲道2的IMDCT, L和R分別表示左和右聲道頻譜系數(shù), N表示解碼器單元14中的音頻幀長(zhǎng)度, K表示頻譜系數(shù)頻率指數(shù), n表示時(shí)間指數(shù),及 n。為常數(shù)。
然而,在其它實(shí)施例中,解碼器單元14可能使用其它類型的變換而非IMDCT。
如在圖2中所圖解說(shuō)明,解碼單元使用第一和第二聲道的IMDCT產(chǎn)生MS立體 聲信息(25) 。 MS立體聲信息包括可用來(lái)產(chǎn)生音頻樣本的左和右聲道信息,所述音 頻樣本又可用來(lái)定義用于左和右揚(yáng)聲器16A和16B的驅(qū)動(dòng)信號(hào)。另外,左聲道信息可 以是來(lái)自聲道1和2的IMDCT的相加性組合,而右聲道信息可以是聲道1和2的 IMDCT的相減性組合。然而,可以顛倒并定義右和左聲道以使得左聲道是IMDCT的 相加性組合而右聲道是IMDCT的相減性組合。值得注意的是,MS立體聲信息的產(chǎn)生 在IMDCT計(jì)算之后發(fā)生。
在大多數(shù)情況下,解碼單元14也可對(duì)第一和第二聲道執(zhí)行逆量化。具體來(lái)說(shuō), 解碼單元14可在計(jì)算音頻信息的第一聲道的IMDCT之前對(duì)所述第一聲道執(zhí)行逆量 化,且可在計(jì)算音頻信息的第二聲道的IMDCT之前對(duì)所述第二聲道執(zhí)行逆量化。
在某些情況下,解碼第一和第二聲道可包括霍夫曼解碼或使用查找表的其它類似 解碼。在此情況下,查找表(例如,霍夫曼表)可需要從存儲(chǔ)器12加載到解碼單元 14中以用于經(jīng)編碼聲道中的每一者,且可能再加載以用于相繼音頻幀。遺憾的是,霍 夫曼表可相對(duì)較大,尤其在解碼單元14實(shí)施為不包含較大芯片上存儲(chǔ)器的DSP時(shí)。 根據(jù)本發(fā)明,在解碼第一聲道之前,可將用于第一聲道的霍夫曼表從存儲(chǔ)器12加載到 解碼單元14中,且在計(jì)算第二聲道的IMDCT時(shí),可將用于第二聲道的霍夫曼表從存 儲(chǔ)器12加載到解碼單元14中。解碼單元14可包括具有足夠存儲(chǔ)一個(gè)霍夫曼表而不夠 存儲(chǔ)若干個(gè)此表的本機(jī)芯片上存儲(chǔ)器的DSP。
若解碼單元14包括支持直接存儲(chǔ)器交換(DEM)的DSP,那么在執(zhí)行IMDCT 計(jì)算時(shí)的并行存儲(chǔ)加載是特別有用的。在此情況下,DSP可執(zhí)行從存儲(chǔ)器取數(shù)據(jù)以加 載下一聲道解碼所需的下一霍夫曼表,且同時(shí)執(zhí)行當(dāng)前聲道的IMDCT計(jì)算。而且, 可針對(duì)隨后音頻幀來(lái)執(zhí)行隨后并行計(jì)算和從存儲(chǔ)器取數(shù)據(jù)。特定而言,當(dāng)將音頻信息 分解成一音頻序列的多個(gè)音頻幀時(shí),解碼單元14可在解碼第一音頻幀的第一聲道之前 加載用于第一音頻幀的第一聲道的霍夫曼表,在計(jì)算第一音頻幀的第二聲道的IMDCT 時(shí)加載用于第一音頻幀的第二聲道的霍夫曼表,和在計(jì)算第一音頻幀的第二聲道的 IMDCT時(shí)加載用于第二音頻幀的第一聲道的霍夫曼表。以此方式,對(duì)于解碼隨后音頻 幀的每一聲道可執(zhí)行同時(shí)計(jì)算和從存儲(chǔ)器取數(shù)據(jù)。
圖3是圖解說(shuō)明根據(jù)本發(fā)明的音頻解碼過(guò)程的各方面的另一流程圖。如在圖3中所示,解碼單元14 (例如)經(jīng)由直接存儲(chǔ)器存取(DMA)從存儲(chǔ)器12加載査找表以 用于聲道1 (31),且然后(例如)使用所加載的査找表對(duì)聲道1進(jìn)行解碼(32)。 解碼單元14然后計(jì)算聲道1的IMDCT (33),且同時(shí)從存儲(chǔ)器12加載不同的查找表 以用于聲道2,例如經(jīng)由直接存儲(chǔ)器交換(DEM) (34)。然后,解碼單元14可對(duì)聲 道2進(jìn)行解碼(35)且計(jì)算聲道2的IMDCT (36)。
解碼單元然后使用所述聲道1和2的IMDCT產(chǎn)生MS立體聲信息聲道1和2(35)。 MS立體聲信息包括可用來(lái)產(chǎn)生音頻樣本的左和右聲道信息,所述音頻樣本又可用來(lái) 定義用于左和右揚(yáng)聲器16A和16B的驅(qū)動(dòng)信號(hào)。如以上關(guān)于圖2所述,解碼單元14 還可對(duì)聲道1和2執(zhí)行逆量化,例如在每一聲道的對(duì)應(yīng)IMDCT計(jì)算之前。在任何情 況下,在IMDCT計(jì)算(33和36)之后發(fā)生MS立體聲信息的產(chǎn)生(37)。然后,解 碼單元14可針對(duì)左和右聲道執(zhí)行開(kāi)窗口且再現(xiàn)音頻樣本(38)。驅(qū)動(dòng)電路15可使用 所述音頻樣本來(lái)定義驅(qū)動(dòng)用于立體聲輸出的揚(yáng)聲器16A和16B所需的電壓。
另外,根據(jù)本發(fā)明,可針對(duì)一音頻序列的相繼音頻幀中的聲道1和2重復(fù)發(fā)生同 時(shí)計(jì)算IMDCT與DME加載將在解碼中使用的下一查找表。圖4在對(duì)一音頻幀序列進(jìn) 行霍夫曼解碼的上下文中來(lái)圖解說(shuō)明此有利的技術(shù)。
如圖4中所示,解碼單元14從存儲(chǔ)器12加載霍夫曼表以用于一音頻序列的第一 幀的聲道l (41),例如經(jīng)由DMA。解碼單元14然后使用已加載的霍夫曼表來(lái)解碼 聲道1 (42)。解碼單元14然后計(jì)算第一幀的聲道1的IMDCT (44),且同時(shí)從存 儲(chǔ)器12加載不同的霍夫曼表以用于第一幀的聲道2,例如經(jīng)由DME (43)。然后, 解碼單元14可使用在第一幀的聲道1的IMDCT計(jì)算期間所加載的霍夫曼表來(lái)解碼第 一幀的聲道2 (45)。
接下來(lái),解碼單元計(jì)算第一幀的聲道2的IMDCT (47),且同時(shí)從存儲(chǔ)器12加 載不同的霍夫曼表以用于所述音頻序列的第二幀的聲道l,例如經(jīng)由DME (46)。解 碼單元14然后可使用在第一幀的聲道2的IMDCT計(jì)算期間所加載的霍夫曼表來(lái)解碼 第二幀的聲道l (48)。
接下來(lái),解碼單元14計(jì)算第二幀的聲道1的IMDCT (50),且同時(shí)從存儲(chǔ)器12 加載不同的霍夫曼表以用于所述音頻序列的第二幀的聲道2,例如經(jīng)由DME (49)。 然后,解碼單元14可使用在第二幀的聲道1的IMDCT計(jì)算期間所加載的霍夫曼表來(lái) 解碼第二幀的聲道2 (51)。
接下來(lái),解碼單元14計(jì)算第二幀的聲道2的IMDCT (53),且同時(shí)從存儲(chǔ)器12 加載不同的霍夫曼表以用于所述音頻序列的第三幀的聲道l,例如經(jīng)由DME (49)。 此過(guò)程可針對(duì)音頻序列的任何數(shù)目的經(jīng)MS編碼音頻幀而繼續(xù)。借助每一后續(xù)IMDCT 計(jì)算,可執(zhí)行同時(shí)存儲(chǔ)器取數(shù)據(jù)和加載下一所需霍夫曼表來(lái)減少等待時(shí)間和加速解碼 過(guò)程。
本文己闡述許多實(shí)施例。然而,可對(duì)本文所述的技術(shù)作出各種修改。例如,MS 立體聲可由兩個(gè)聲道組成,或可以指多聲道系統(tǒng)(例如,多聲道環(huán)繞聲系統(tǒng))中的兩個(gè)聲道。另外,可使用其它類型的變換用于MS立體聲解碼,而非IMDCT。同樣,盡 管本揭示內(nèi)容已提及用于霍夫曼編碼的霍夫曼表,但根據(jù)本發(fā)明可使用其它類型的編 碼?;舴蚵幋a是有用的實(shí)例,因?yàn)槠鋵?dǎo)致無(wú)損編碼和解碼音頻信息。其它編碼技術(shù), 尤其是需要從存儲(chǔ)器加載以用于隨后音頻幀的每一聲道的査找編碼技術(shù)也可得益于本 發(fā)明的技術(shù)。
可將本文所述的技術(shù)實(shí)施于硬件、軟件、固件或其任一組合中。如果實(shí)施于軟件 中,那么所述技術(shù)可涉及包括程序碼的計(jì)算機(jī)可讀媒體,所述程序碼當(dāng)在對(duì)視頻序列 實(shí)施編碼的裝置中執(zhí)行時(shí)會(huì)執(zhí)行本文所述技術(shù)中的一者或一者以上。在所述情況下, 計(jì)算機(jī)可讀媒體可包括隨機(jī)存取存儲(chǔ)器(RAM),例如同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器 (SDRAM)、只讀存儲(chǔ)器(ROM)、非易失性隨機(jī)存取存儲(chǔ)器(NVRAM)、電可擦 可編程只讀存儲(chǔ)器(EEPROM) 、 FLASH (快閃)存儲(chǔ)器、及類似存儲(chǔ)器。
所述程序碼可以計(jì)算機(jī)可讀指令形式存儲(chǔ)在存儲(chǔ)器上。在所述情形下,處理器(例
如DSP)可執(zhí)行存儲(chǔ)在存儲(chǔ)器中的指令,以便執(zhí)行一個(gè)或一個(gè)以上所述音頻解碼技術(shù)。
在某些情形中,所述技術(shù)可由調(diào)用各種硬件組件來(lái)加速編碼過(guò)程的DSP來(lái)執(zhí)行。在其
它情形中,本文中所述的單元可實(shí)施為微處理器、 一個(gè)或一個(gè)以上應(yīng)用專用集成電路
(ASIC)、 一個(gè)或一個(gè)以上現(xiàn)場(chǎng)可編程門陣列(FPGA)、或者某些其它硬件-軟件組 合。
所述及其它實(shí)施例在隨附權(quán)利要求書(shū)的范圍內(nèi)。
權(quán)利要求
1、一種裝置,其包括存儲(chǔ)器,其用于存儲(chǔ)經(jīng)編碼的音頻信息;及解碼器單元,其用于解碼經(jīng)編碼的信息,其中所述解碼器單元可操作以解碼所述音頻信息的第一聲道;在產(chǎn)生中側(cè)(MS)立體聲信息之前計(jì)算所述第一聲道的修正離散余弦逆變換(IMDCT);解碼所述音頻信息的第二聲道;在產(chǎn)生所述MS立體聲信息之前計(jì)算所述第二聲道的IMDCT;及使用所述第一和第二聲道的所述IMDCT產(chǎn)生所述MS立體聲信息。
2、 如權(quán)利要求l所述的裝置,其中所述解碼器單元可操作以 在計(jì)算所述第一聲道的所述IMDCT之前對(duì)所述音頻信息的所述第一聲道執(zhí)行逆量化;及在計(jì)算所述第二聲道的所述IMDCT之前對(duì)所述音頻信息的所述第二聲道執(zhí)行逆 量化。
3、 如權(quán)利要求l所述的裝置,其進(jìn)一步包括左和右立體聲揚(yáng)聲器,其中所述MS 立體聲信息包括左和右聲道信息,且所述解碼器單元可操作以對(duì)所述左和右聲道信息 執(zhí)行開(kāi)窗口且再現(xiàn)用于所述左和右立體聲揚(yáng)聲器的音頻樣本。
4、 如權(quán)利要求1所述的裝置,其中解碼所述第一聲道包括霍夫曼解碼所述第一 聲道,且其中解碼所述第二聲道包括霍夫曼解碼所述第二聲道。
5、 如權(quán)利要求4所述的裝置,其中所述解碼單元可操作以在解碼所述第一聲道 之前加載用于所述第一聲道的霍夫曼表,且在計(jì)算所述第一聲道的所述IMDCT時(shí)加 載用于所述第二聲道的霍夫曼表。
6、 如權(quán)利要求1所述的裝置,其中所述解碼單元可操作以解碼一音頻序列的多 個(gè)音頻幀的所述第一和第二聲道。
7、 如權(quán)利要求6所述的裝置,其中所述解碼單元可操作以執(zhí)行霍夫曼解碼,其 中所述解碼單元可操作以在解碼第一音頻幀的所述第一聲道之前加載用于所述第一音 頻幀的所述第一聲道的霍夫曼表,在計(jì)算所述第一音頻幀的所述第一聲道的所述 IMDCT時(shí)加載用于所述第一音頻幀的所述第二聲道的霍夫曼表,和在計(jì)算所述第一音 頻幀的所述第二聲道的所述IMDCT時(shí)加載用于第二音頻幀的第一聲道的霍夫曼表。
8、 如權(quán)利要求1所述的裝置,其中所述解碼單元包括支持直接存儲(chǔ)器交換(DEM) 的數(shù)字信號(hào)處理器DSP。
9、 如權(quán)利要求1所述的裝置,其中所述裝置包括以下中的至少一者數(shù)字音樂(lè) 播放器、無(wú)線通信裝置、個(gè)人數(shù)字助理(PDA)、膝上型計(jì)算機(jī)、臺(tái)式計(jì)算機(jī)、數(shù)碼 相機(jī)、數(shù)字視頻記錄裝置、無(wú)線電電話和直接雙向通信裝置。
10、 一種解碼中側(cè)(MS)立體聲音頻信息的方法,所述方法包括解碼所述音頻信息的第一聲道;在產(chǎn)生MS立體聲信息之前計(jì)算所述第一聲道的修正離散余弦逆變換(IMDCT); 解碼所述音頻信息的第二聲道;在產(chǎn)生所述MS立體聲信息之前計(jì)算所述第二聲道的IMDCT;及 使用所述第一和第二聲道的所述IMDCT產(chǎn)生所述MS立體聲信息。
11、 如權(quán)利要求10所述的方法,其進(jìn)一步包括在計(jì)算所述第一聲道的所述IMDCT之前對(duì)所述音頻信息的所述第一聲道執(zhí)行逆 量化;及在計(jì)算所述第二聲道的所述IMDCT之前對(duì)所述音頻信息的所述第二聲道執(zhí)行逆 量化。
12、 如權(quán)利要求10所述的方法,其中所述MS立體聲信息包括左和右聲道信息, 所述方法進(jìn)一步包括對(duì)所述左和右聲道信息執(zhí)行開(kāi)窗口且再現(xiàn)用于左和右立體聲揚(yáng)聲 器的音頻樣本。
13、 如權(quán)利要求10所述的方法,其中解碼所述第一聲道包括霍夫曼解碼所述第 一聲道且其中解碼所述第二聲道包括霍夫曼解碼所述第二聲道。
14、 如權(quán)利要求13所述的方法,其進(jìn)一步包括在解碼所述第一聲道之前加載用 于所述第一聲道的霍夫曼表,且在計(jì)算所述第一聲道的所述IMDCT時(shí)加載用于所述 第二聲道的霍夫曼表。
15、 如權(quán)利要求10所述的方法,其進(jìn)一步包括解碼一音頻序列的多個(gè)音頻幀的 所述第一和第二聲道。
16、 如權(quán)利要求15所述的方法,其中解碼所述第一和第二聲道包括霍夫曼解碼 所述第一和第二聲道,其中所述解碼單元在解碼所述第一聲道之前加載用于第一音頻 幀的所述第一聲道的霍夫曼表,在計(jì)算所述第一音頻幀的所述第一聲道的所述IMDCT 時(shí)加載用于所述第一音頻幀的所述第二聲道的霍夫曼表,以及在計(jì)算所述第一音頻幀 的所述第二聲道的所述IMDCT時(shí)加載用于第二音頻幀的第一聲道的霍夫曼表。
17、 一種計(jì)算機(jī)可讀媒體,其包括在支持中側(cè)(MS)立體聲的裝置中執(zhí)行時(shí)實(shí) 現(xiàn)以下功能的可執(zhí)行指令解碼音頻信息的第一聲道;在產(chǎn)生MS立體聲信息之前計(jì)算所述第一聲道的修正離散余弦逆變換(IMDCT); 解碼所述音頻信息的所述第二聲道;在產(chǎn)生所述MS立體聲信息之前計(jì)算所述第二聲道的IMDCT;及 使用所述第一和第二聲道的所述IMDCT產(chǎn)生MS立體聲信息。
18、 如權(quán)利要求17所述的計(jì)算機(jī)可讀媒體,其進(jìn)一步包括實(shí)現(xiàn)以下功能的指令 在計(jì)算所述第一聲道的所述IMDCT之前對(duì)所述音頻信息的所述第一聲道執(zhí)行逆 量化;及在計(jì)算所述第二聲道的所述IMDCT之前對(duì)所述音頻信息的所述第二聲道執(zhí)行逆 量化。
19、 如權(quán)利要求17所述的計(jì)算機(jī)可讀媒體,其中所述MS立體聲信息包括左和 右聲道信息,且其中所述指令對(duì)所述左和右聲道信息執(zhí)行開(kāi)窗口且再現(xiàn)用于左和右立 體聲揚(yáng)聲器的音頻樣本。
20、 如權(quán)利要求17所述的計(jì)算機(jī)可讀媒體,其中所述指令使用霍夫曼解碼來(lái)解 碼所述第一聲道且其中所述指令使用霍夫曼解碼來(lái)解碼所述第二聲道。
21、 如權(quán)利要求21所述的計(jì)算機(jī)可讀媒體,其中所述指令在解碼所述第一聲道 之前加載用于所述第一聲道的霍夫曼表,且在計(jì)算所述第一聲道的所述IMDCT時(shí)加 載用于所述第二聲道的霍夫曼表。
22、 如權(quán)利要求17所述的計(jì)算機(jī)可讀媒體,其中所述指令解碼一音頻序列的多 個(gè)音頻幀的所述第一和第二聲道。
23、 如權(quán)利要求22所述的計(jì)算機(jī)可讀媒體,其中所述指令使用霍夫曼解碼,其 中所述指令在解碼第一音頻幀的所述第一聲道之前加載用于所述第一音頻幀的所述第 一聲道的霍夫曼表,在計(jì)算所述第一音頻幀的所述第一聲道的所述IMDCT時(shí)加載用 于所述第一音頻幀的所述第二聲道的霍夫曼表,且在計(jì)算所述第一音頻幀的所述第二 聲道的所述IMDCT時(shí)加載用于第二音頻幀的第一聲道的霍夫曼表。
24、 一種用于音頻解碼裝置的解碼器單元,其中所述解碼器單元可操作以 解碼音頻信息的第一聲道;在產(chǎn)生中側(cè)(MS)立體聲信息之前計(jì)算所述第一聲道的變換; 解碼所述音頻信息的所述第二聲道;在產(chǎn)生所述MS立體聲信息之前計(jì)算所述第二聲道的變換;及 使用所述第一和第二聲道的所述變換產(chǎn)生所述MS立體聲信息。
25、 如權(quán)利要求24所述的解碼器單元,其中所述第一和第二聲道的所述變換包 括修正離散余弦逆變換(IMDCT)。
26、 如權(quán)利要求24所述的解碼器單元,其中所述解碼器單元可操作以在解碼所 述第一聲道之前加載用于所述第一聲道的所述解碼的表,且在計(jì)算所述第一聲道的所 述變換時(shí)加載用于所述第二聲道的表。
全文摘要
本發(fā)明描述用于根據(jù)中側(cè)(MS)立體聲編碼而編碼的音頻信息的解碼技術(shù)。所述技術(shù)涉及以非常規(guī)次序執(zhí)行的許多個(gè)音頻解碼任務(wù)。通過(guò)重新布置所述解碼任務(wù)的次序,可實(shí)現(xiàn)各種效率。在一個(gè)實(shí)施例中,一種解碼MS立體聲音頻信息的方法包含解碼所述音頻信息的第一聲道,在產(chǎn)生MS立體聲信息之前計(jì)算所述第一聲道的修正離散余弦逆變換(IMDCT),解碼所述音頻信息的第二聲道,在產(chǎn)生所述MS立體聲信息之前計(jì)算所述第二聲道的IMDCT,以及使用所述第一和第二聲道的IMDCT產(chǎn)生所述MS立體聲信息。
文檔編號(hào)H04S1/00GK101395660SQ200780007093
公開(kāi)日2009年3月25日 申請(qǐng)日期2007年3月2日 優(yōu)先權(quán)日2006年3月2日
發(fā)明者薩蒂亞納拉亞納·卡卡拉 申請(qǐng)人:高通股份有限公司