專利名稱:音頻信號的可縮放編碼/解碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號的編碼和/或解碼,尤其涉及音頻信號的可 縮放表示。
背景技術(shù):
隨著數(shù)字信號表示和通信已經(jīng)逐漸替代模擬表示和通信,在過去 十年里,各種源信號的數(shù)字編碼已經(jīng)變得越來越重要。例如,諸如移 動通信全球系統(tǒng)之類的移動電話系統(tǒng)基于數(shù)字語音編碼。諸如視頻和 音樂之類的媒體內(nèi)容的分發(fā)也越來越基于數(shù)字內(nèi)容編碼。在音頻與視頻編碼的環(huán)境中,編碼信號的可縮放性是有利的,并 且提供了編碼信號的靈活的分發(fā)和處理。例如,編碼信號可以依據(jù)質(zhì)量、位速率和復(fù)雜度進(jìn)行縮放。視頻編碼的具體例子是JPEG (聯(lián)合圖 象專家小組)圖象的遞進(jìn)質(zhì)量。在音頻編碼中,使能快速編碼轉(zhuǎn)換到 更低的質(zhì)量的可縮放位流是已知的概念。可縮放性提供了讓例如服務(wù)器向它所尋址的每個設(shè)備遞送已適配 的流的可能性。該適配存在于一已準(zhǔn)備流(變得可縮放)的傳輸部分 中,其使用具有優(yōu)先級的分層結(jié)構(gòu)以便降低傳輸帶寬。這個唯一流由 解碼器所容許的不同層構(gòu)成如果發(fā)送和解碼全部層,則質(zhì)量最優(yōu),但是對于允許信號復(fù)原僅僅第一層是必需的。顯然,被接收/使用的 可縮放性層越多,質(zhì)量越好,但是位速率越高??煽s放性可以是具有 大步幅的粗粒度的(通常每步幾kbps )或者也可以是具有細(xì)粒度的(細(xì) 粒度可縮放性)。后者允許在初始流中的任何位置,而不是僅僅層邊 界處進(jìn)行切割。理論上,編碼器能夠遞送內(nèi)在地提供細(xì)粒度可縮放性的位流,以 便可以簡單地通過丟棄分量來提取具有任何期望位速率的位流。然 而,與專用編碼器相比,這樣的靈活的編碼裝置趨向于低效率,而專 用編碼器不提供這個功能性并因此對于許多應(yīng)用沒有竟?fàn)幜?。做為選擇,可以通過利用以小步幅可選地提供可縮放性的殘差編碼裝置來修 改高效的波形核心編碼裝置,從而構(gòu)造位速率可縮放的位流。對于較 低的質(zhì)量,可以簡單地丟棄殘差分量。這樣的方法較不靈活,但是比 較高效并因此具有竟?fàn)幜?。隨著諸如SBR (頻帶復(fù)制)和PS (參數(shù)立體聲)之類的、基于參 數(shù)編碼技術(shù)的新編碼裝置的到來,可縮放性變得較不有效,這是因為 通過從原始信號中減去參數(shù)編碼的表示所獲得的殘差信號仍然具有高 熵值。具體而言,由于在參數(shù)編碼中使用的音頻源模型,參數(shù)編碼的 信號傾向于不與原始音頻信號類似。因此,對通過參數(shù)編碼獲得的、 具有高熵值的殘差信號進(jìn)行編碼沒有效率,因為它需要相對高的位速 率。音頻編碼標(biāo)準(zhǔn)的例子是MPEG4 (活動圖像專家組4)標(biāo)準(zhǔn)。實際 上,MPEG4不是標(biāo)準(zhǔn)化單個的音頻編碼/解碼算法,而是標(biāo)準(zhǔn)化了多個 編碼和解碼參數(shù)和技術(shù),它們一起形成了可以從中進(jìn)行選擇的編碼/ 解碼工具集。MPEG4允許一些編碼裝置和工具進(jìn)行組合。因此MPEG4 提供了用于音頻信號的高度靈活和高效的編碼和解碼系統(tǒng)。或許由MPEG4標(biāo)準(zhǔn)化的最有名音頻編碼裝置為高級音頻編碼AAC 音頻編碼裝置。MPEG4允許AAC與諸如SBR或者PS編碼器的其它編 碼器相組合(分別稱為HE - AAC和HE - AAC v2 )。此外,MPEG4還允許考慮到可縮放性的編碼。例如,MPEG4定義了位片算術(shù)編碼(Bit Sliced Arithmetic Coding, BSAC)技術(shù),其用一種允許細(xì)粒度的方案來替換AAC編碼裝 置的無噪編碼核心。BSAC可以以下降到每個通道1 kbps的步幅來提 供可縮放性。結(jié)合AAC使用可縮放性,有可能實現(xiàn)大粒度可縮放性(例如8 kbps 步幅)。當(dāng)帶寬可用時,可以添加可縮放性層以便改善質(zhì)量。這些富 化(enrichment)層可以用命名為AAC可縮放的、類似于AAC的方案 來編碼。這個可縮放方案可用于支持位速率和帶寬可縮放性。有大量 的可縮放組合可用,其包括與其他技術(shù)的組合(類似于TwinVQ和CELP 編碼裝置工具)。通道可縮放性也有可能,并且允許在幾個層內(nèi)從單 聲道進(jìn)人立體聲信號。應(yīng)當(dāng)注意到,沒有定義MPEG4工具的全部組合。然而,已經(jīng)實現(xiàn) 了一些組合,并且以所謂的MPEG4簡檔的形式進(jìn)行了正式化。
碼裝置、并且將其和殘差編碼裝置相組合以生成進(jìn)一步增強(qiáng)的數(shù)據(jù), 來構(gòu)造位速率可縮放的位流。核心編碼裝置和殘差編碼裝置之一或者 兩者均可以提供大步幅或者小步幅的可縮放性。然而,這樣的系統(tǒng)不是在所有情況下都是最優(yōu)的。特別是,和其 它不可縮放的編碼裝置相比,它趨向于導(dǎo)致次最優(yōu)的質(zhì)量對位速率比。此外,所描述的方法對于諸如SBR和參數(shù)立體聲之類的、近來引 入的采用參數(shù)編碼技術(shù)的編碼裝置而言是不切實際的,這是因為在這 樣的情況下,殘差信號仍然禁止高熵值并因此要求高的位速率用于編 碼。此外,該系統(tǒng)相對不靈活并且趨向于僅僅提供有限的可縮放性。因此, 一種改進(jìn)的用于編碼和/或解碼的系統(tǒng)將是有利的,特別 是一種允許增加靈活性、改進(jìn)質(zhì)量對數(shù)據(jù)速率比、改進(jìn)可縮放性、可 實際實現(xiàn)、適合于參數(shù)編碼/解碼技術(shù)、和/或提高性能的系統(tǒng)將是有 利的。發(fā)明內(nèi)容因此,本發(fā)明尋求單獨地或以任意組合地來優(yōu)選地緩和、減輕或 者消除上述缺點的其中一個或者多個。根據(jù)本發(fā)明的第一方面,提供了一種用于從可縮放音頻位流中生 成音頻信號的解碼器,所述解碼器包含用于接收可縮放音頻位流的 裝置,該可縮放音頻位流包含第一基于波形的位流分量、第二位流分 量和第三位流分量,所述笫一基于波形的位流分量和第二位流分量對 應(yīng)于音頻信號的第一表示,而第一基于波形的位流分量和第三位流分 量對應(yīng)于音頻信號的第二表示;笫一波形解碼器,用于通過解碼第一 基于波形的位流分量來生成第一解碼信號;以及第二解碼器和第三解 碼器中的至少一個,所述第二解碼器用于通過響應(yīng)于第二位流分量來 修改第一解碼信號而生成音頻信號,而所述第三解碼器用于通過響應(yīng) 于第三位流分量來修改第一解碼信號而生成音頻信號。本發(fā)明可以提供可縮放音頻位流改進(jìn)的可縮放性。本發(fā)明可以例 如便于或者改進(jìn)編碼音頻信號的分發(fā)和/或傳輸。可以實現(xiàn)靈活的系 統(tǒng),和/或在許多系統(tǒng)中可以選擇適于特定條件的、改進(jìn)的質(zhì)量對數(shù) 據(jù)速率比折衷。本發(fā)明尤其可以利用新編碼/解碼技術(shù)的優(yōu)點,同時 保持與現(xiàn)有技術(shù)的兼容性。在許多應(yīng)用中可以實現(xiàn)改進(jìn)的向后兼容性 以及新編碼器/解碼器的方便引入??梢酝ㄟ^低復(fù)雜度的處理從可縮放音頻位流中獲得不同地縮放的 信號。具體而言,通??梢酝ㄟ^選擇不同的位流分量來簡單地獲得具 有不同位速率的表示??煽s放音頻位流可以包含基于相同基礎(chǔ)編碼的同一個音頻信號的 可替換表示。音頻信號可以由與兩個可替換附加位流分量之一相組合 的強(qiáng)制共享的位流來表示。應(yīng)當(dāng)理解,在一些實施例中,可以在該可 縮放音頻位流中存在進(jìn)一步的位流分量,該可縮放音頻位流包括與該 音頻信號的進(jìn)一步表示相對應(yīng)的進(jìn)一步可替換位流分量。由第二解碼器和/或第三解碼器進(jìn)行的解碼可以包含對第一基于波形的位流分量的殘差信號的確定。殘差信號可以具體地對應(yīng)于在由 第一基于波形的位流分量所表示的信號和音頻信號之間的差值。音頻信號可以例如是單聲道或者多聲道音頻信號??煽s放音頻位 流可以例如就質(zhì)量、位速率和/或復(fù)雜度而言是可縮放的。根據(jù)本發(fā)明的可選特征,第二位流分量是基于波形的位流分量, 而且第二解碼器是波形解碼器。這可以允許特別有利的性能,并且在許多應(yīng)用中可以允許改進(jìn) 的、與現(xiàn)有音頻信號通信和分配系統(tǒng)的兼容性?;诓ㄐ蔚奈涣鞣至勘焕斫鉃橛刹ㄐ尉幋a裝置/編碼方法生成。 在波形編碼中,其目標(biāo)是最小化作為在原始信號和編碼表示之間的差值的編碼誤差或者殘差信號。感知(Perceptual)音頻編碼是波形編 碼的特殊情況,其中在最小化之前感知地加權(quán)這個誤差。感知音頻編 碼裝置利用感知的不相干性(perceptual irrelevancy),該感知的 不相干性由那些不能由人類的聽覺系統(tǒng)感覺出的信號分量來表示。因 此,與其它信號分量相比,這樣的信號分量可以被更粗略地量化。由 人類聽覺系統(tǒng)的心理聲學(xué)(psychoacoustic )模型確定這個加權(quán)'通 常,對于較高的位數(shù)量,這個編碼誤差將降低。在一些實施例中,第二和第三解碼器兩者都是波形解碼器。 根據(jù)本發(fā)明的可選特征,第三位流分量是基于參數(shù)的位流分量, 而且第三解碼器是參數(shù)解碼器。這可以允許特別有利的性能,并且可以允許對具有高的質(zhì)量對數(shù) 據(jù)速率比的數(shù)據(jù)信號進(jìn)行高效編碼。 參數(shù)編碼/解碼的使用可以允許這樣的性能,即該性能接近于(或 者相同于)可以為專用的不可縮放編碼器/解碼器實現(xiàn)的性能。而且, 包括第三位流分量的數(shù)據(jù)速率增加趨向于是可接受的,且通常僅僅是 對于更高數(shù)據(jù)速率和質(zhì)量等級所要求的,在那里數(shù)據(jù)速率的增加是更 可接受的。參數(shù)位流分量被理解為由參數(shù)編碼裝置/編碼方法生成。在參數(shù) 編碼中,其目標(biāo)是最小化在原始的和編碼的表示的感知質(zhì)量之間的差值。因此,編碼信號可以顯著不同于原始信號,并導(dǎo)致大的誤差或者 殘差信號。感知質(zhì)量借助于人類聽覺系統(tǒng)的心理聲學(xué)模型來測量。除 感知模型之外,參數(shù)音頻編碼裝置還采用信號模型,用于對源建模。 通常,對于較高的位數(shù)量,質(zhì)量將飽和到信號模型的質(zhì)量。在一些實施例中,第二和第三解碼器兩者都是參數(shù)解碼器。 在一些實施例中,第二解碼器是波形解碼器而第三解碼器是參數(shù) 解碼器。編碼信號可以通過可利用的波形編碼和參數(shù)編碼的各自優(yōu)點來優(yōu)化。根據(jù)本發(fā)明的可選特征,第一表示的編碼質(zhì)量高于第二表示的編 碼質(zhì)量。本發(fā)明可以允許高效的可縮放性,并且可以允許在同一個位流中 實現(xiàn)不同的質(zhì)量等級。根據(jù)本發(fā)明的可選特征,該解碼器包含第二解碼器和第三解碼器 兩者、以及用于在笫二解碼器和第三解碼器之間進(jìn)行選擇以便解碼可 縮放音頻位流的裝置。這可以允許高效和靈活的解碼器。該解碼器可以例如用不同的質(zhì) 量等級和/或要求將該音頻信號分發(fā)到不同的目的地。該解碼器可以是能夠產(chǎn)生具有不同質(zhì)量的信號的代碼轉(zhuǎn)換器的一部分。根據(jù)本發(fā)明的可選特征,第一波形解碼器是MPEG — 2或者M(jìn)PEG — 4高級音頻編碼、即AAC解碼器。本發(fā)明可以為AAC編碼的音頻信號 提供改進(jìn)的性能和可縮放性。根據(jù)本發(fā)明的可選特征,第一波形解碼器是MPEG 2層II、即LII 解碼器。本發(fā)明可以為MPEG 2 LII編碼的音頻信號提供改進(jìn)的性能 和可縮放小生。根據(jù)本發(fā)明的可選特征,第三解碼器是參數(shù)立體聲、即PS解碼器。本發(fā)明可以通過對立體聲信號的高效和靈活的編碼而允許特別有 利的性能和可縮放性。參數(shù)立體聲解碼可以提供這樣的位流分量,其 具有特別良好地補(bǔ)充基于波形的位流分量的特點。根據(jù)本發(fā)明的可選特征,第三解碼器是MPEG-4頻帶復(fù)制、即SBR 解碼器。本發(fā)明可以通過對立體聲信號的高效和靈活的編碼而允許特 別有利的性能和可縮放性。頻帶復(fù)制解碼可以提供這樣的位流分量, 其具有特別良好地補(bǔ)充基于波形的位流分量的特點。根據(jù)本發(fā)明的可選特征,第三解碼器是空間音頻編碼(Spatial Audio Coder)、 即SAC解碼器。本發(fā)明可以通過對信號的高效和靈 活的空間音頻編碼而允許特別有利的性能和可縮放性。空間音頻編裝 置解碼可以提供這樣的位流分量,其具有特別良好地補(bǔ)充基于波形的 位流分量的特點。根據(jù)本發(fā)明的可選特征,第二解碼器是可縮放無損標(biāo)準(zhǔn) (Scaleable to Lossless Standard)、即SLS解碼器。本發(fā)明可以 通過對信號的高效和靈活的無損音頻編碼而允許特別有利的性能和可 縮放性??煽s放無損標(biāo)準(zhǔn)解碼可以提供這樣的位流分量,其具有特別 良好地補(bǔ)充參數(shù)位流分量的特點。具體而言,參數(shù)位流分量可以在適 中的數(shù)據(jù)速率處提供高效編碼的信號,而基于SLS的位流分量可以提 供特別高的編碼質(zhì)量。例如, 一些信號可能因為其與參數(shù)模型緊密匹 配而特別適合于參數(shù)編碼,而其它信號可能因為其不與參數(shù)模型良好 匹配而由波形編碼特別良好地編碼。根據(jù)本發(fā)明的可選特征,第二解碼器是MPEG — 2或者M(jìn)PEG — 4 高級音頻編碼、即AAC解碼器。本發(fā)明可以通過對信號的高效和靈活 的AAC編碼而允許特別有利的性能和可縮放性。AAC解碼可以提供這 樣的位流分量,其具有特別良好地補(bǔ)充參數(shù)位流分量的特點。根據(jù)本發(fā)明的可選特征,第二解碼器是MPEG 2層II、即LII多 通道擴(kuò)展解碼器。本發(fā)明可以通過對信號的高效和靈活的擴(kuò)展編碼而 允許特別有利的性能和可縮放性。MPEG 2 LII多通道擴(kuò)展解碼可以 提供這樣的位流分量,其具有特別良好地補(bǔ)充參數(shù)位流分量的特點。根據(jù)本發(fā)明的可選特征,該解碼器是MPEG 4解碼器。特別是, 全部解碼器和可縮放音頻位流可以分別遵守MPEG - 4標(biāo)準(zhǔn)。因此, 全部解碼器和解碼算法可以從所定義的算法和要求的MPEG - 4工具 箱中選擇出來。根據(jù)本發(fā)明的可選特征,可縮放音頻位流還包括相對于第一表示的、用于音頻信號的增強(qiáng)數(shù)據(jù);而且解碼器還包含用于響應(yīng)于該增強(qiáng) 數(shù)據(jù)生成音頻信號的裝置。這可以進(jìn)一步改進(jìn)解碼信號的可縮放性和/或質(zhì)量。該增強(qiáng)數(shù)據(jù) 可以對應(yīng)于相對于音頻信號的第一表示的、音頻信號的殘差信號的編 碼。該增強(qiáng)數(shù)據(jù)可以具體包含來自殘差信號的SLS編碼的位流分量。根據(jù)本發(fā)明的可選特征,所述可縮放音頻位流還包括相對于第二 表示的、用于音頻信號的增強(qiáng)數(shù)據(jù);而且該解碼器還包含用于響應(yīng)于 該增強(qiáng)數(shù)據(jù)而生成音頻信號的裝置。這可以進(jìn)一步改進(jìn)解碼信號的可縮放性和/或質(zhì)量。該增強(qiáng)數(shù)據(jù) 可以對應(yīng)于相對于音頻信號的第二表示的、音頻信號的殘差信號的編 碼。該增強(qiáng)數(shù)據(jù)可以具體包含來自殘差信號的SLS編碼的位流分量。根據(jù)本發(fā)明的可選特征,所述可縮放音頻位流還包含第四位流分 量;而且該解碼器包含第四解碼器,用于通過響應(yīng)于第四位流分量來 修改第一解碼信號而生成音頻信號。第一基于波形的位流分量和第四位流分量可以對應(yīng)于音頻信號的 第三表示。該特征可以提供改進(jìn)的靈活性、性能和/或可縮放性。例 如,第三位流分量可以是參數(shù)立體聲編碼信號,而第四位流分量可以 是頻帶復(fù)制編碼信號。根據(jù)本發(fā)明的第二方面,提供了一種用于將音頻信號編碼到可縮 放音頻位流中的編碼器,所述編碼器包含第一波形編碼器,用于將 音頻信號編碼到第一基于波形的位流分量中;第二編碼器,用于編碼 該音頻信號以生成第二位流分量,該第二位流分量包含用于第一基于 波形的位流分量的第一增強(qiáng)數(shù)據(jù),該第一基于波形的位流分量和第二 位流分量對應(yīng)于音頻信號的第一表示;第三編碼器,用于編碼該音頻 信號以生成第三位流分量,該第三位流分量包含用于第一基于波形的 位流分量的第二增強(qiáng)數(shù)據(jù),該第一基于波形的位流分量和第三位流分 量對應(yīng)于音頻信號的第二表示;以及用于生成可縮放音頻位流的裝 置,該可縮放音頻位流包含第一基于波形的位流分量、第二位流分量 和第三位流分量。本發(fā)明可以提供可縮放音頻位流改進(jìn)的可縮放性。本發(fā)明可以例 如便于或者改進(jìn)編碼音頻信號的分發(fā)和/或傳輸??梢詫崿F(xiàn)靈活的系 統(tǒng),和/或在許多系統(tǒng)中可以選擇適于特定條件的、改進(jìn)的質(zhì)量對數(shù) 據(jù)速率比折衷。本發(fā)明尤其可以利用參數(shù)編碼/解碼的優(yōu)點。此外, 在許多應(yīng)用中可以實現(xiàn)改進(jìn)的向后兼容性以及新編碼器/解碼器的方 便引入。由第二編碼器和/或第三編碼器進(jìn)行的編碼可以包含對第一基于 波形的位流分量的殘差信號的確定。該殘差信號可以具體對應(yīng)于在由 第一基于波形的位流分量所表示的信號和音頻信號之間的差值.應(yīng)當(dāng)理解上面參考解碼器描述的可選特征、評論和/或優(yōu)點趨 向于同樣良好地適用于該編碼器,而且對應(yīng)的可選特征可以分別地或 者以任意組合方式包括在該編碼器中。根據(jù)本發(fā)明的第三方面,提供了一種用于從可縮放音頻位流中生 成音頻信號的方法,所述方法包含接收可縮放音頻位流,所述可縮放音頻位流包含第一基于波形的 位流分量、笫二位流分量和第三位流分量,笫一基于波形的位流分量 和第二位流分量對應(yīng)于音頻信號的第一表示,而第一基于波形的位流 分量和第三位流分量對應(yīng)于音頻信號的第二表示;通過解碼第一基于 波形的位流分量來生成第一解碼信號;以及下述至少之一,即通過響 應(yīng)于第二位流分量來修改第一解碼信號而生成音頻信號,和通過響應(yīng) 于第三位流分量來修改第一解碼信號而生成音頻信號。根據(jù)本發(fā)明的第四方面,提供了一種用于將音頻信號編碼到可縮 放音頻位流中的方法,所述方法包含將音頻信號編碼到第一基于波 形的位流分量中;編碼該音頻信號以生成第二位流分量,該第二位流 分量包含用于第一基于波形的位流分量的第一增強(qiáng)數(shù)據(jù),該笫一基于 波形的位流分量和第二位流分量對應(yīng)于音頻信號的第一表示;編碼該 音頻信號以生成第三位流分量,該第三位流分量包含用于第一基于波 形的位流分量的第二增強(qiáng)數(shù)據(jù),該笫一基于波形的位流分量和第三位 流分量對應(yīng)于音頻信號的第二表示;以及生成可縮放音頻位流,該可 縮放音頻位流包含第一基于波形的位流分量、第二位流分量和第三位 流分量。根據(jù)本發(fā)明的第五方面,提供了一種用于音頻信號的可縮放音頻 位流,其包含第一基于波形的位流分量、笫二位流分量和第三位流分
量,所述第一基于波形的位流分量和第二位流分量對應(yīng)于音頻信號的 第一表示,而所述第一基于波形的位流分量和第三位流分量對應(yīng)于音 頻信號的第二表示。根據(jù)本發(fā)明的第六方面,提供了一種其上存儲有這樣的信號的存 儲介質(zhì)。根據(jù)本發(fā)明的第七方面,提供了一種用于接收可縮放音頻位流的接收機(jī),所述接收機(jī)包含用于接收可縮放音頻位流的裝置,所述可 縮放音頻位流包含第一基于波形的位流分量、第二位流分量和第三位 流分量,所述第一基于波形的位流分量和第二位流分量對應(yīng)于音頻信 號的第一表示,而所述第一基于波形的位流分量和第三位流分量對應(yīng) 于音頻信號的第二表示;笫一波形解碼器,用于通過解碼笫一基于波 形的位流分量來生成第一解碼信號;以及第二解碼器和第三解碼器中 的至少一個,所述第二解碼器用于通過響應(yīng)于第二位流分量來修改第 一解碼信號而生成音頻信號,所述笫三解碼器用于通過響應(yīng)于第三位流分量來修改第一解碼信號而生成音頻信號。根據(jù)本發(fā)明的第八方面,提供了一種用于以可縮放音頻位流來發(fā) 送音頻信號的發(fā)射機(jī),所述發(fā)射機(jī)包含第一波形編碼器,用于將音 頻信號編碼到第一基于波形的位流分量中;第二編碼器,用于編碼該音頻信號以生成第二位流分量,該笫二位流分量包含用于第一基于波 形的位流分量的笫一增強(qiáng)數(shù)據(jù),該第一基于波形的位流分量和第二位 流分量對應(yīng)于音頻信號的第一表示;第三編碼器,用于編碼該音頻信 號以生成第三位流分量,該第三位流分量包含用于第一基于波形的位 流分量的第二增強(qiáng)數(shù)據(jù),該第一基于波形的位流分量和第三位流分量 對應(yīng)于音頻信號的第二表示;用于生成可縮放音頻位流的裝置,該可 縮放音頻位流包含第一基于波形的位流分量、第二位流分量和第三位 流分量;以及用于發(fā)送該可縮放音頻位流的裝置。根據(jù)本發(fā)明的第九方面,提供了一種用于發(fā)送音頻信號的傳輸系 統(tǒng),所述傳輸系統(tǒng)包含發(fā)射機(jī)和接收機(jī),其中發(fā)射機(jī)包含第一波 形編碼器,用于將音頻信號編碼到第一基于波形的位流分量中;笫二 編碼器,用于編碼該音頻信號以生成第二位流分量,該第二位流分量 包含用于第一基于波形的位流分量的第一增強(qiáng)數(shù)據(jù),該第一基于波形 的位流分量和第二位流分量對應(yīng)于音頻信號的第一表示;第三編碼器,用于編碼該音頻信號以生成第三位流分量,該第三位流分量包含 用于第一基于波形的位流分量的第二增強(qiáng)數(shù)據(jù),該第一基于波形的位流分量和第三位流分量對應(yīng)于音頻信號的第二表示;用于生成可縮放 音頻位流的裝置,該可縮放音頻位流包含第一基于波形的位流分量、 第二位流分量和第三位流分量;以及用于發(fā)送該可縮放音頻位流的裝 置;而接收機(jī)包含用于接收可縮放音頻位流的裝置;第一波形解碼 器,用于通過解碼第一基于波形的位流分量來生成第一解碼信號;以 及第二解碼器和第三解碼器中的至少一個,所述第二解碼器用于通過響應(yīng)于第二位流分量來修改第一解碼信號而生成音頻信號,所述第三 解碼器用于通過響應(yīng)于第三位流分量來修改第一解碼信號而生成音頻信號。根據(jù)本發(fā)明的第十方面,提供了一種從可縮放音頻位流中接收音 頻信號的方法,所述方法包含接收可縮放音頻位流,所述可縮放音 頻位流包含第一基于波形的位流分量、笫二位流分量和第三位流分 量,第一基于波形的位流分量和笫二位流分量對應(yīng)于音頻信號的第一 表示,而第一基于波形的位流分量和第三位流分量對應(yīng)于音頻信號的 第二表示;通過解碼第一基于波形的位流分量來生成第一解碼信號; 以及下述至少之一,即通過響應(yīng)于第二位流分量來修改第一解碼信號 而生成音頻信號,和通過響應(yīng)于第三位流分量來修改第一解碼信號來 生成音頻信號。根據(jù)本發(fā)明的第十一方面,提供了一種以可縮放音頻位流來發(fā)送 音頻信號的方法,所述方法包含將音頻信號編碼到第一基于波形的 位流分量中;編碼該音頻信號以生成第二位流分量,該笫二位流分量 包含用于第一基于波形的位流分量的第一增強(qiáng)數(shù)據(jù),該第一基于波形 的位流分量和第二位流分量對應(yīng)于音頻信號的第一表示;編碼該音頻 信號以生成第三位流分量,該第三位流分量包含用于第一基于波形的 位流分量的第二增強(qiáng)數(shù)據(jù),該第一基于波形的位流分量和第三位流分 量對應(yīng)于音頻信號的第二表示;生成可縮放音頻位流,該可縮放音頻 位流包含第一基于波形的位流分量、第二位流分量和第三位流分量; 以及發(fā)送該可縮放音頻位流。根據(jù)本發(fā)明的第十二方面,提供了一種發(fā)送和接收音頻信號的方 法,所述方法包含將音頻信號編碼到第一基于波形的位流分量中;
編碼該音頻信號以生成第二位流分量,該第二位流分量包含用于第一 基于波形的位流分量的第一增強(qiáng)數(shù)據(jù),該第一基于波形的位流分量和第二位流分量對應(yīng)于音頻信號的第一表示;編碼該音頻信號以生成第 三位流分量,該第三位流分量包含用于第一基于波形的位流分量的第 二增強(qiáng)數(shù)據(jù),該第一基于波形的位流分量和第三位流分量對應(yīng)于音頻 信號的第二表示;生成可縮放音頻位流,該可縮放音頻位流包含第一基于波形的位流分量、第二位流分量和第三位流分量;發(fā)送該可縮放 音頻位流;接收該可縮放音頻位流;通過解碼第一基于波形的位流分 量來生成第一解碼信號;以及下述至少之一,即通過響應(yīng)于第二位流 分量來修改第一解碼信號而生成音頻信號,和通過響應(yīng)于第三位流分 量來修改第一解碼信號而生成音頻信號。根據(jù)本發(fā)明的第十三方面,提供了一種用于執(zhí)行先前所述的任一 方法的計算機(jī)程序產(chǎn) 品。根據(jù)本發(fā)明的第十四方面,提供了一種包含先前所述的解碼器的 音頻播放設(shè)備。根據(jù)本發(fā)明的第十五方面,提供了一種包含先前所述的解碼器的 錄音設(shè)備。通過參考下文中所述的一個或者多個實施例,本發(fā)明的這些及其 它方面、特征和優(yōu)點將變得明顯并且得到闡述。
將參考附圖,僅僅作為例子來描述本發(fā)明的實施例,在附圖中圖1說明了根據(jù)本發(fā)明的一些實施例的編碼器;圖2說明了根據(jù)本發(fā)明的一些實施例的解碼器;圖3說明了根據(jù)本發(fā)明的一些實施例的編碼器的例子;圖4說明了根據(jù)本發(fā)明一些實施例的可縮放音頻位流的例子;圖5說明了根據(jù)本發(fā)明的一些實施例的編碼器的例子;圖6說明了根據(jù)本發(fā)明一些實施例的可縮放音頻位流的例子;圖7說明了根據(jù)本發(fā)明的一些實施例的編碼器的例子;圖8說明了根據(jù)本發(fā)明一些實施例的可縮放音頻位流的例子;以及圖9說明了根據(jù)本發(fā)明的一些實施例的、用于音頻信號通信的傳
輸系統(tǒng)。具體實施例下列描述集中于與根據(jù)MPEG - 4標(biāo)準(zhǔn)的音頻編碼相兼容的本發(fā) 明實施例。然而,應(yīng)當(dāng)理解本發(fā)明不局限于這個應(yīng)用,而且可以應(yīng) 用于許多其它編碼/解碼標(biāo)準(zhǔn)或者技術(shù)。圖1說明了根據(jù)本發(fā)明的一些實施例的編碼器100。編碼器100包含編碼接收機(jī)101,其接收音頻信號以用于編碼. 音頻信號可以從任何適當(dāng)?shù)膬?nèi)部或者外部源接收,并且可以例如具有 脈碼調(diào)制(PCM)采樣的數(shù)字單聲道音頻信號的形式。編碼接收機(jī)101 耦接到第一波形編碼器103,向其饋送數(shù)字化音頻信號。第一波形編碼器編碼該音頻信號以產(chǎn)生第一基于波形的位流分 量。特別地,第一波形編碼器103可以使用被該編碼信號的預(yù)定接收 機(jī)廣泛使用的波形編碼技術(shù)。例如,在音樂分發(fā)系統(tǒng)中,大量用戶可 能使用特定解碼算法,于是第一波形編碼器103可以應(yīng)用與這種解碼 算法兼容的編碼技術(shù),以便實現(xiàn)高度兼容性。在波形編碼中,編碼器尋求最小化作為在原始信號和編碼表示之 間的差值的編碼誤差。通常,對于增加的位速率,這個編碼誤差將降 低。波形編碼技術(shù)的例子包括可縮放無損標(biāo)準(zhǔn)、即SLS,以及自適應(yīng) 差分脈碼調(diào)制(ADPCM)編碼。其它例子包括感知波形編碼技術(shù),其 中被最小化的是感知加權(quán)的編碼誤差而不是嚴(yán)格的數(shù)學(xué)距離編碼誤 差。對于感知波形編碼,位速率增加導(dǎo)致感知加權(quán)編碼誤差的降低。 感知波形編碼裝置的例子包括AAC (高級音頻編碼)、MP3 (運(yùn)動圖像 專家組3) 、 AC3 (音頻編碼3) 、 CELP (碼激勵線性預(yù)測)等。在圖1的編碼器101中,第一波形編碼器103用作基礎(chǔ)編碼器, 其使用一種提供與大量預(yù)定接收機(jī)兼容的位流的編碼算法。然而,在 該示例中,將第一波形編碼器103的編碼質(zhì)量等級設(shè)置得相對低,導(dǎo) 致第一位流分量降低的數(shù)據(jù)速率。因此,第一位流分量可以對應(yīng)于該 音頻信號的一個表示,這里,數(shù)據(jù)速率和質(zhì)量之間的折衷被設(shè)置在與 相對低數(shù)據(jù)速率和質(zhì)量相對應(yīng)的操作點處。第一波形編碼器103可以本身提供具有一些可縮放性的第一位流 分量。
在圖1的編碼器101中,編碼接收機(jī)101還耦接到第二編碼器 105。第二編碼器105也接收該音頻信號并且著手來編碼這個信號以 生成第二位流分量。第二編碼器105耦接到第一波形編碼器103,并 且著手來相對于第一位流的音頻信號表示來編碼該音頻信號,以便第 一位流分量和由第二編碼器105創(chuàng)建的第二位流分量一起形成音頻信 號的表示。因此,可以認(rèn)為第二位流分量的數(shù)據(jù)是用于第一位流分量 的增強(qiáng)數(shù)據(jù)。
在這個特定例子中,第二編碼器105是波形編碼器,但是在其它 實施例中,第二編碼器105可以例如是參數(shù)編碼器。
作為特定的例子,第二編碼器105可以生成殘差信號,作為原始 信號和基于來自第一波形編碼器103的數(shù)據(jù)的重新編碼信號之間的差 值。然后可以使用波形編碼算法對所得到的差值信號進(jìn)行編碼。例如, 可以使用SLS算法來生成第二位流分量。因此,第一位流分量可以對 應(yīng)于音頻信號的相對低質(zhì)量/低數(shù)據(jù)速率的表示,而第一和第二位流 分量一起對應(yīng)于音頻信號的相對較高質(zhì)量/較高數(shù)據(jù)速率的表示。
SLS (可縮放無損)編碼的目的在于在頻域中編碼殘差信號。在 該示例中,這個殘差信號是在音頻信號和其AAC / BSAC編碼及解碼 信號之間的差值。以這種方法,AAC / BSAC解碼器將處理有損部分, 而如果需要完美的表示,則可以恢復(fù)無損解碼信號。
編碼接收機(jī)101還耦接到第三編碼器107,其也接收音頻信號。 在圖1的特定例子中,第三編碼器107是使用參數(shù)編碼算法來編碼音 頻信號以生成第三位流分量的參數(shù)編碼器。參數(shù)編碼是參考由第一波 形編碼器103進(jìn)行的編碼來執(zhí)行的。具體而言,第三編碼器107可以 生成用于第一位流分量的增強(qiáng)數(shù)據(jù),以便第一位流分量和第三位流分 量一起對應(yīng)于音頻信號的表示,其比第一位流分量本身的表示具有更 高的質(zhì)量(但是具有增加的位速率)。
應(yīng)當(dāng)理解,第三編碼器107 —般不會僅僅編碼在原始信號和第一 波形編碼器103的編碼信號之間的差值信號,這是因為這個信號仍然 可能具有高熵值并且可能不適于參數(shù)編碼。然而,第三編碼器107可 能對音頻信號進(jìn)行編碼,以提供未由第一位流完全表示的音頻信號的 參數(shù)和特征的改進(jìn)表示。例如,第三編碼器107可特別地編碼未由第 一波形編碼器103考慮或者僅僅部分考慮的較高頻和/或多通道分量。
在該示例中,通過參數(shù)編碼算法生成第三位流分量。在參數(shù)編碼 中,編碼器尋求最小化在原始的和編碼的表示的感知質(zhì)量之間的差 值。為此目的, 一般使用參數(shù)模型并且發(fā)送該模型的參數(shù)。因此,該 編碼尋求提供允許解碼器再現(xiàn)參數(shù)模型和激勵信號(以及可能的殘差
信號)的數(shù)據(jù)。對于參數(shù)編碼器來說,不趨向于在編碼誤差量和編碼 位數(shù)目之間存在嚴(yán)格的關(guān)系。參數(shù)編碼裝置或者編碼工具的例子包
括MPEG - 4諧波獨立線和噪聲、即(Harmonics, Individual Lines and Noise, HILN) , MPEG - 4諧波矢量激勵編碼、即HVXC, MPEG4 正弦編碼、即SSC (也稱為用于高質(zhì)量音頻的參數(shù)編碼),Vo-編碼器, 頻帶復(fù)制,參數(shù)立體聲和空間音頻。
在圖1的實施例中,編碼接收機(jī)101將相同的信號饋送給第一波 形編碼器103、第二編碼器105和笫三編碼器107,第二和第三編碼 器105、 107參考由第一波形編碼器103對音頻信號進(jìn)行的編碼來編 碼該音頻信號。然而,應(yīng)當(dāng)理解,在其它實施例中,編碼接收機(jī)101 可以將不同的信號饋送給不同的編碼器。例如,編碼接收機(jī)101可以 將音頻信號劃分為低頻信號部分和高頻信號部分,并且可以將低頻部 分饋送給第一波形編碼器103,而將高頻部分饋送給第二編碼器10和 第三編碼器107。
第一波形編碼器103、第二編碼器105和第三編碼器107全部耦 接到位流生成器109,其從這些編碼器接收第一、第二和第三位流分 量。位流生成器109著手來生成包含這些位流分量的編碼位流。此外, 位流生成器109可以包括其它數(shù)據(jù),諸如控制數(shù)據(jù)、信令數(shù)據(jù)、頭標(biāo) 數(shù)據(jù)、路由數(shù)據(jù)等。在一些實施例中,位流生成器109可以生成分組 化數(shù)據(jù)流,其可以在諸如Internet之類的、基于分組的網(wǎng)絡(luò)中分發(fā).
因此,編碼器100生成用于音頻信號的可縮放音頻位流,其包含 第一基于波形的位流分量、第二位流分量和第三位流分量.此外,該 可縮放位流包含音頻信號的可替換表示,該第一基于波形的位流分量 和第二位流分量對應(yīng)于音頻信號的第一表示,以及第一基于波形的位 流分量和第三位流分量對應(yīng)于音頻信號的第二表示。此外,基于波形 的位流分量本身可以對應(yīng)于信號的獨立表示。
在傳統(tǒng)可縮放信號中每個可縮放層建立在先前層上以提供連續(xù)增 加的增強(qiáng),與傳統(tǒng)可縮放信號相反,編碼器100的可縮放信號提供了
音頻信號的可替換和無關(guān)增強(qiáng)數(shù)據(jù),其中解碼器可以在不同增強(qiáng)數(shù)據(jù) 之間進(jìn)行選擇。因此,第二和第三位流分量代表與同一個信號相關(guān)的 可替換信息,該信號具有與同一個基礎(chǔ)波形編碼位流相關(guān)的、彼此無 關(guān)的兩個分量。因此,可以重新創(chuàng)建第一表示而不考慮第三位流分量, 并且可以重新創(chuàng)建第二表示而不考慮第二位流分量。
所描述的實施例可因此生成具有增加的靈活性和改進(jìn)的性能的可
縮放信號。例如,可縮放信號可以使用第二編碼器105來生成與大量 現(xiàn)有編碼裝置兼容的增強(qiáng)數(shù)據(jù)、由此提供向后兼容性,而第三編碼器 107可以用來使用最新技術(shù)的參數(shù)編碼來生成高效編碼信號。因此, 在允許引入更新的編碼技術(shù)的同時,可以實現(xiàn)向后兼容性。
圖2說明了根據(jù)本發(fā)明的一些實施例的解碼器200。
該解碼器包含解碼接收機(jī)201,其接收可縮放音頻位流。具體而 言,解碼接收機(jī)201可以接收由圖1中的編碼器100生成的可縮放音 頻位流。因此,解碼器200接收音頻位流,該音頻位流包含第一基于 波形的位流分量、第二位流分量和第三位流分量,該第一基于波形的 位流分量和第二位流分量對應(yīng)于音頻信號的第一表示,而第一基于波 形的位流分量和第三位流分量對應(yīng)于音頻信號的第二表示。
解碼接收機(jī)201耦接到第一波形解碼器203,其通過解碼第一基 于波形的位流分量來生成第一解碼信號。因此,第一波形解碼器203 實現(xiàn)了對由第一波形編碼器103施加的編碼處理的互補(bǔ)處理。
解碼接收機(jī)201還耦接到第二解碼器205和第三解碼器207。向 第二解碼器205饋給第二位流分量,并且向第三解碼器207饋給第三 位流分量。在圖2的例子中,第二解碼器205和第三解碼器207兩者 還耦接到第一波形解碼器203,并且從那里被饋給了第一解碼信號。
第二解碼器205可進(jìn)行操作來響應(yīng)于第二位流分量的數(shù)據(jù)而修改 第一解碼信號,以便生成第二解碼信號,其可以具有相對于笫一解碼 信號的改進(jìn)質(zhì)量。
具體而言,第二解碼器205可以是波形解碼器,其通過對第二位 流分量的波形解碼來確定殘差信號。第二解碼器205然后可以著手來 將殘差信號加到第一解碼信號中,由此生成最初編碼的音頻信號的更 準(zhǔn)確表示。
類似地,第三解碼器207可進(jìn)行操作來響應(yīng)于第三位流分量的數(shù)
據(jù)而修改第一解碼信號,以便生成第三解碼信號,其可以具有相對于 第一解碼信號的改進(jìn)質(zhì)量。
例如,第三解碼器207也可以是波形解碼器,其通過對第三位流 分量的波形解碼來確定殘差信號。在這個例子中,第三位流可以對應(yīng) 于殘差信號的更準(zhǔn)確編碼(處于較高數(shù)據(jù)速率)。第三解碼器207然 后可以著手來將殘差信號加到第一解碼信號中,由此生成與第二解碼 信號相比起來更準(zhǔn)確的最初編碼音頻信號的表示。
作為另一個例子(其與作為參數(shù)編碼器的第三編碼器107兼容), 第三解碼器207可以是參數(shù)解碼器,其可以通過對第三位流分量進(jìn)行
解碼來確定第一信號的進(jìn)一步特性.例如,第三編碼器107可以確定 笫一解碼信號的多通道或者高頻特性,而且這些特性可以用來修改第
一解碼信號以生成更準(zhǔn)確的和/或多通道解碼的信號。
因此,解碼器200包含第二解碼器205和第三解碼器207,其中 第二解碼器205生成與可縮放音頻位流中的音頻信號的第一表示相對 應(yīng)音頻信號,而第三解碼器207生成與可縮放音頻位流中的音頻信號 的第二表示相對應(yīng)的音頻信號。
第二和第三解碼器205、 207耦接到輸出處理器209,其在來自解 碼器205、 207的解碼信號之間進(jìn)行選擇。
應(yīng)當(dāng)理解,在其它實施例中,可以由解碼器生成分別與第一和第 二表示相對應(yīng)的第二和笫三解碼信號的僅僅其中之一。
此外,在一些實施例中,解碼器可以生成第二和第三解碼信號兩 者,并且可以重新編碼這些信號并且將它們傳送到不同的編碼器。因 此,解碼器200可以實現(xiàn)這樣的代碼轉(zhuǎn)換功能,其中接收組合的可縮 放音頻位流,并且從中生成不同編碼的位流。然后可以將不同的位流 發(fā)送到不同的目的地。因此,解碼器200可以是代碼轉(zhuǎn)換器,其提供 了在可縮放音頻位流和不同類型解碼器之間的接口 。
還應(yīng)當(dāng)理解,在一些實施例中,組合了第一波形解碼器203和第 二解碼器205和/或第一波形解碼器203和第三解碼器207的功能性。 例如,第二解碼器205可以直接組合第一和第二位流分量以生成這樣 的編碼數(shù)據(jù),其被一起解碼以生成第二解碼信號而不用接收單獨生成 的第一解碼信號。類似地,第三解碼器207可以直接組合第一和第三 位流分量以生成這樣的編碼數(shù)據(jù),其被一起解碼以生成第三解碼信號
而不用接收單獨生成的第一解碼信號。因此,不需要生成由第二解碼
器205和第三解碼器207兩者使用的公共第一解碼信號。
在下面,將具體參考編碼器來描述一些更具體的示范性實施例。 應(yīng)當(dāng)理解,所述實施例的原理、特性和公開內(nèi)容可以容易地應(yīng)用于對 應(yīng)的解碼器實施例。
圖3說明了根據(jù)本發(fā)明的一些實施例的編碼器例子。在該例子中, 假定位流支持從低位速率(有損)朝向高位速率(無損)的小步幅的 可縮放性,并從MPEG — 4音頻編碼工具箱中取得全部編碼工具。
在該例子中,AAC編碼不僅被用于第一波形編碼器而且還用于第 二編碼器,而頻帶復(fù)制即SBR編碼器被用于笫三編碼器。
在SBR中,信號高音調(diào)(pitched)部分的形狀由編碼器表征(例 如,就等級、音噪比(tonal to noise ratio )、單音(individual tone ) 位置和噪聲最低水平而言)。該SBR解碼器使用這些提示外加頻譜的 較低部分來重建該頻譜的較高部分,其中頻譜的較低部分使用核心編 碼器(例如AAC)來發(fā)送。通常,當(dāng)與24 kbps的AAC —起使用時, 僅占核心編碼裝置位速率的一*卜部分(通常大約1.5- 4kbps)的SBR 數(shù)據(jù)被用來描述高頻內(nèi)容。結(jié)果,使用這些組合獲得的質(zhì)量已表明以 前向和后向兼容的方式被改進(jìn)了核心解碼器可以解碼核心流,丟棄 SBR信息。準(zhǔn)許SBR的解碼器可以解碼整個信號。SBR已經(jīng)成功地應(yīng) 用于MPEG — 4框架中的AAC。 SBR工具能以兩種模式進(jìn)行操作,即單 速率和雙速率模式。在雙速率模式中,核心編碼裝置以采樣頻率的一 半進(jìn)行操作,而SBR工具輸出全采樣頻率。在單速率模式中,核心編 碼裝置和SBR工具兩者都以全采樣速率進(jìn)行操作。
在圖3的例子中,低通濾波器301接收音頻信號并且將其分離為 高頻和低頻部分。
低頻部分被饋送給以采樣頻率的一半進(jìn)行操作的MPEG - 4 AAC -BSAC編碼裝置303 (即,AAC — BSAC編碼器和AAC — BSAC解碼器的 串聯(lián))。AAC — BSAC編碼裝置303生成代表所接收音頻信號的較低 頻率部分的第一位流分量。
較高頻率被饋送給以采樣頻率的一半進(jìn)行操作的常規(guī)AAC編碼裝 置305 (即,AAC編碼器和AAC解碼器的串聯(lián))。AAC編碼裝置305 生成代表所接收音頻信號的較高頻率部分的第二位流分量。在該例子
中,通過從原始音頻信號中減去較低頻率信號而導(dǎo)出較高頻率部分。
因此,較高頻率部分可以被認(rèn)為是由AAC - BSAC編碼裝置303編碼 的信號的殘差信號。
此外,音頻信號被饋送給SBR參數(shù)編碼裝置307 ,其還從AAC - BSAC 編碼裝置303接收編碼數(shù)據(jù)。SBR參數(shù)編碼裝置307著手來使用AAC / BSAC編碼裝置303作為核心編碼裝置器而生成SBR數(shù)據(jù)。因此,SBR 參數(shù)編碼裝置307生成笫三位流分量,其表示用于來自AAC - BSAC 編碼裝置303的第一位流分量的增強(qiáng)數(shù)據(jù)。具體而言,第三位流分量 包含用于AAC / BSAC編碼信號的參數(shù)較高頻率數(shù)據(jù)。
在該例子中,編碼器還包含另外的編碼裝置,其生成用于與由第 一和第二位流分量構(gòu)成的音頻信號的第一表示有關(guān)的音頻信號的增強(qiáng) 數(shù)據(jù)。具體地,AAC 一 BSAC編碼裝置303和AAC編碼裝置305耦接 到SLS編碼裝置309,其中SLS編碼裝置309確定殘差或者誤差信號, 即在原始音頻信號和AAC / BSAC編碼裝置303及AAC編碼裝置309 的組合輸出信號之間的差值。然后借助于SLS算法對殘差信號進(jìn)行無 損編碼。因此,生成了第四位流分量,其提供了可縮放性的附加層.
應(yīng)當(dāng)理解,在一些實施例中,可以使用類似的方法來生成用于由 第一位流分量和第三位流分量構(gòu)成的第二音頻信號表示的進(jìn)一步增強(qiáng) 數(shù)據(jù)。
AAC — BSAC編碼裝置303、 AAC編碼裝置305、 SBR參數(shù)編碼裝置 307和SLS編碼裝置309全部都耦接到輸出生成器311,其生成包括 第一、第二、第三和第四位流在內(nèi)的組合位流。
因此,可以實現(xiàn)包含音頻信號的可替換表示在內(nèi)的可縮放編碼音 頻信號。如圖4所示,AAC波形位流分量(即由AAC編碼器305編碼 的音頻信號的HF部分)可以由SBR位流分量所代替。因此,已經(jīng)基 于同一個核心編碼裝置導(dǎo)出了第二和第三位流分量兩者。存在由解碼 器取決于例如位速率對比質(zhì)量折衷來選擇這兩個位流中的任何一個的 靈活性。AAC / BSAC波形位流分量(第一位流分量)表示由AAC/BSAC 編碼器303編碼的音頻信號的較低頻率部分。在一些實施例中,音頻 信號的低頻部分可以由AAC編碼裝置來編碼(替代圖3中的AAC/BSAC 編碼裝置303 )。
AAC / BSAC波形位流分量和AAC波形位流分量的組合形成了輸入
音頻信號的第一高質(zhì)量表示。AAC / BSAC波形位流分量和SBR位流 分量的組合形成了輸入音頻信號的第二較低質(zhì)量表示(但是處于降低 的位速率)。
圖5說明了根據(jù)本發(fā)明的一些實施例的編碼器的另一個例子。在 這個例子中,對立體聲音頻信號進(jìn)行編碼。
該編碼器包含參數(shù)立體聲編碼裝置501,其生成參數(shù)立體聲數(shù)據(jù)。 參數(shù)立體聲編碼裝置501耦接到單聲道AAC / BSAC編碼裝置503, 其生成該立體聲信號的單聲道AAC / BSAC有損表示。參數(shù)立體聲編 碼裝置501生成允許從這個信號中生成立體聲信號的增強(qiáng)數(shù)據(jù)。
參數(shù)立體聲是這樣的編碼技術(shù),其目的在于連同起支持作用的單 聲道信號一起發(fā)送立體聲聲場的參數(shù)描述。這個參數(shù)的參數(shù)集一般僅 僅使用幾個kbps,并且可以在降至16 kbps的速率處使能立體聲。 參數(shù)立體聲已經(jīng)成功地應(yīng)用于包括MPEG - 4 SSC和AAC+SBR (MPEG -4高效AAC v2)在內(nèi)的不同技術(shù)上。
圖5中的編碼器還包含第一 SLS編碼器505,其對相對于單聲道 AAC / BSAC編碼信號的、左聲道信號的殘差信號執(zhí)行SLS編碼。此 外,該編碼器包含第二SLS編碼器507,其執(zhí)行對右立體聲信號的SLS 編碼。
參數(shù)立體聲編碼裝置501、單聲道AAC / BSAC編碼裝置503、第 一 SLS編碼器505和第二 SLS編碼器507全部都耦接到輸出生成器 509,其生成包含基礎(chǔ)AAC / BSAC編碼、參數(shù)立體聲參數(shù)和左右聲道 SLS數(shù)據(jù)在內(nèi)的可縮放編碼位流。
在該例子中,參數(shù)位流分量可以由SLS波形位流分量所代替。AAC / BSAC波形位流分量和SLS波形位流分量的組合形成了輸入音頻信號 的第一高質(zhì)量表示。AAC / BSAC波形位流分量和參數(shù)立體聲位流分 量的組合形成了輸入音頻信號的第二較低質(zhì)量表示(但是處于較低的 位速率)。
圖6說明了這樣的音頻位流的例子。在第一例子中,說明了完全 可縮放位流。在該例子中,SLS殘差基于用于左信號的AAC / BSAC 編碼裝置。已經(jīng)獨立地獲得了參數(shù)分量。在第二例子中,參數(shù)立體聲 與AAC / BSAC數(shù)據(jù)相組合,以創(chuàng)建具有較低位速率的立體聲信號的 有損表示。
圖7說明了根據(jù)本發(fā)明的一些實施例的編碼器的另一個例子。
在該例子中,編碼器包含空間音頻編碼裝置701,其生成空間音 頻數(shù)據(jù)??臻g音頻編碼裝置701耦接到MPEG2層II編碼裝置703, 其生成編碼立體聲下混合(down - mix),該編碼立體聲下混合用作 可以通過由空間音頻編碼裝置701生成的位流來增強(qiáng)的基礎(chǔ)數(shù)據(jù)。
空間音頻編碼是類似于參數(shù)立體聲的技術(shù),并且其能夠以相對低 的位速率(一般降至大約24kbps)捕獲多通道圖像。與單聲道或者立 體聲下混合相結(jié)合,空間音頻解碼器能夠重新生成多通道原始信號的 表示。這種方法的顯著優(yōu)點是僅僅下混合信號需要被編碼??臻g輔助 信息(side information)可以被包括在最終得到的位流的輔助數(shù)據(jù) 部分中,從而允許與單聲道或者立體聲解碼器的兼容性。
MPEG - 2 -層II編碼裝置703耦接到MPEG - 2 - LII擴(kuò)展編碼 裝置705。使用本領(lǐng)域技術(shù)人員已知的MPEG2矩陣技術(shù),立體聲下混 合信號的兩個通道可以由MPEG - 2 - LII擴(kuò)展編碼裝置705轉(zhuǎn)換為 多通道表示。這個數(shù)據(jù)稱為MPEG - 2 - LII多通道擴(kuò)展數(shù)據(jù)。
MPEG - 2 - LII擴(kuò)展編碼裝置705進(jìn)一步耦接到SLS編碼裝置707, 其使用SLS來為全部的通道無損編碼殘差信號。
空間音頻編碼裝置701、 MPEG - 2 -層II編碼裝置703、 MPEG - 2 -LII擴(kuò)展編碼裝置705和SLS編碼裝置707全部耦接到輸出生成器 709,其生成包含基礎(chǔ)MPEG - 2 -層II數(shù)據(jù)、MPEG - 2 - LII多通 道擴(kuò)展數(shù)據(jù)、SLS數(shù)據(jù)和空間音頻在內(nèi)的可縮放編碼位流.
圖8說明了這樣的音頻位流的例子。如所示,空間音頻編碼位流 分量可以由MPEG — 2多通道擴(kuò)展和SLS數(shù)據(jù)所代替.MPEG - 2 - LII 波形位流分量和MPEG - 2 - LII多通道擴(kuò)展及SLS波形位流分量的 組合形成了輸入音頻信號的第一高質(zhì)量表示。MPEG - 2 - LII波形 位流分量和空間音頻位流分量的組合形成了輸入音頻信號的第二較低 質(zhì)量表示(但是處于較低位速率)。
因此,在圖8的第一例子中,說明了完全可縮放位流。在該例子 中,SLS殘差數(shù)據(jù)基于MPEG - 2 - LII多通道解碼信號和原始信號 之間的差值。立體聲下混合由空間編碼器創(chuàng)建。在笫二例子中,MPEG-2 - LII多通道數(shù)據(jù)和SLS數(shù)據(jù)由就所要求的位速率而言更有效的空 間音頻數(shù)據(jù)所替代。
在可替換實施例中,SLS編碼也可以替代MPEG 一 2 LII擴(kuò)展位流 分量。
應(yīng)當(dāng)理解,雖然所描述的實施例集中于那些把音頻信號的兩個可 替換表示包含在可縮放位流中的實施例,但是在其它實施例中可以使 用三個或更多的表示。例如,編碼器可以包含波形編碼器、參數(shù)立體 聲編碼裝置和SBR編碼器,其用于為同一個下層基礎(chǔ)編碼裝置生成擴(kuò) 展數(shù)據(jù)。
還應(yīng)當(dāng)理解,能以不同的方式來應(yīng)用所述位流。例如,位流可以 在傳輸側(cè)被代碼轉(zhuǎn)換(導(dǎo)致例如降低的存儲或者發(fā)送位速率),或者 可以在接收側(cè)被代碼轉(zhuǎn)換(導(dǎo)致例如降低的解碼器復(fù)雜度或者對其它 通道配置的支持)。還應(yīng)當(dāng)理解,代碼轉(zhuǎn)換僅僅是可選的,而且可以 采用本發(fā)明的原理而不涉及任何代碼轉(zhuǎn)換。
圖9說明了根據(jù)本發(fā)明的一些實施例的、用于音頻信號通信的傳 輸系統(tǒng)900。傳輸系統(tǒng)900包含發(fā)射機(jī)901,其通過具體可以是Internet 的網(wǎng)絡(luò)905耦接到接收機(jī)903。
在這個特定例子中,發(fā)射機(jī)是信號記錄設(shè)備而接收機(jī)是信號播放 設(shè)備,但是應(yīng)當(dāng)理解,在其它實施例中,可以在其它應(yīng)用中使用一個 發(fā)射機(jī)和接收機(jī)。例如,發(fā)射機(jī)和/或接收機(jī)可以是代碼轉(zhuǎn)換功能性 的一部分,以及例如可以提供到其它信號源或者目的地的接口。
在這個支持信號記錄功能的特定例子中,發(fā)射機(jī)901包含數(shù)字化 器907,其接收模擬信號,并且通過采樣和模數(shù)轉(zhuǎn)換將其轉(zhuǎn)化為數(shù)字 PCM信號。
發(fā)射機(jī)901耦接到圖1中的編碼器100,編碼器100如先前所述 編碼PCM信號。編碼器100耦接到網(wǎng)絡(luò)發(fā)射機(jī)909,其接收編碼信號, 并且與Internet接口以便通過Internet 905將編碼信號發(fā)送到接收 機(jī)903。
接收機(jī)903包含網(wǎng)絡(luò)接收機(jī)911,其與Internet 905接口以便從 發(fā)射機(jī)901接收編碼信號。
網(wǎng)絡(luò)接收機(jī)911耦接到圖2中的解碼器200。解碼器200接收編 碼信號并且如先前所述解碼該信號。特別是,解碼器911可以解碼第 一表示或者第二表示。
在這個支持信號播放功能的特定例子中,接收機(jī)903還包含信號
播放器913,其從解碼器200接收解碼的音頻信號并且將其呈現(xiàn)給用 戶。具體而言,信號播放器913可以包含輸出多通道音頻信號所需要 的數(shù)模轉(zhuǎn)換器、放大器和揚(yáng)聲器。
應(yīng)當(dāng)理解,為了清楚起見,以上的描述已經(jīng)參考不同的功能單元 和處理器描述了本發(fā)明的實施例。然而,顯然可以在無損于本發(fā)明的 情況下,使用在不同功能單元或者處理器之間的任何適當(dāng)?shù)墓δ苄苑?布。例如,被說明為要由分離的處理器或者控制器執(zhí)行的功能性可以 由同一個處理器或者控制器執(zhí)行。因此,對特定功能單元的引用僅僅 被看做是對用于提供所述功能的適當(dāng)裝置的引用,而不是對嚴(yán)格邏輯 或物理結(jié)構(gòu)或者組織的指示。
本發(fā)明能以任何適當(dāng)形式來實現(xiàn),包括硬件、軟件、固件或者其 任意的組合。本發(fā)明可以任選地至少部分地實現(xiàn)為在一個或多個數(shù)據(jù) 處理器和/或數(shù)字信號處理器上運(yùn)行的計算機(jī)軟件。本發(fā)明實施例中 的單元和部件能以任何適當(dāng)?shù)姆绞奖晃锢淼?、功能地和邏輯地實現(xiàn)。 實際上,所述功能性可以在單個單元、多個單元中實現(xiàn),或者作為其 它功能單元的一部分來實現(xiàn)。因而,本發(fā)明可以在單個單元中實現(xiàn), 或者可以被物理地和功能地分布在不同的單元和處理器之間。
雖然已經(jīng)結(jié)合一些實施例描述了本發(fā)明,但是不打算使本發(fā)明受 限于此處闡述的特定形式。相反,本發(fā)明的范圍僅僅由所附權(quán)利要求 來限制。另外,雖然特征可能看起來是結(jié)合特定實施例予以描述的, 但是本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)認(rèn)識到,可以根據(jù)本發(fā)明來組合所述實施 例的各個特征。在權(quán)利要求中,術(shù)語包含不排除其它單元或者步驟的 存在。
此外,雖然被分別地列出,但是多個裝置、單元或者方法步驟可 以由例如單個單元或者處理器來實現(xiàn)。另外,雖然各個特征可能被包 含在不同的權(quán)利要求中,但是這些特征可被有利地組合,而且被包括 在不同權(quán)利要求中并不意味著特征組合不是可行的和/或不是有利 的。此外,將特征包括在一類權(quán)利要求中并不意味著對該類的限制, 而是表明根據(jù)情況,該特征同樣適用于其它權(quán)利要求類別。此外,特 征在權(quán)利要求中的次序并不意指這些特征必須按之操作的任何特定次 序,而且特別是,方法權(quán)利要求中的各個步驟的次序并不意味著必須 按這個次序來執(zhí)行這些步驟。相反,能以任何適當(dāng)?shù)拇涡騺韴?zhí)行這些
步驟。此外,單個引用不排除多個。因此,對"一"、"一個"、"第 一"、"第二,,等的引用不排除多個。權(quán)利要求中的參考符號僅僅作 為清晰化例子而被提供,其無論如何都不應(yīng)該被看做是對權(quán)利要求范 圍的限制。
權(quán)利要求
1、一種用于從可縮放音頻位流中生成音頻信號的解碼器(200),所述解碼器(200)包含-用于接收所述可縮放音頻位流的裝置(201),該可縮放音頻位流包含第一基于波形的位流分量、第二位流分量和第三位流分量,所述第一基于波形的位流分量和第二位流分量對應(yīng)于所述音頻信號的第一表示,而所述第一基于波形的位流分量和第三位流分量對應(yīng)于所述音頻信號的第二表示;-第一波形解碼器(203),用于通過解碼第一基于波形的位流分量來生成第一解碼信號;以及下列中的至少一個-第二解碼器(205),用于通過響應(yīng)于第二位流分量來修改第一解碼信號而生成所述音頻信號;以及-第三解碼器(207),用于通過響應(yīng)于第三位流分量來修改第一解碼信號而生成所述音頻信號。
2、 如權(quán)利要求1所述的解碼器,其中,笫二位流分量是基于波 形的位流分量,而笫二解碼器(205 )是波形解碼器.
3、 如權(quán)利要求1所述的解碼器,其中,第三位流分量是基于參 數(shù)的位流分量,而笫三解碼器(207 )是參數(shù)解碼器。
4、 如權(quán)利要求1所述的解碼器,其中,所述第一表示的編碼質(zhì) 量高于第二表示的編碼質(zhì)量。
5、 如權(quán)利要求1所述的解碼器,其包含第二解碼器(205 )和第 三解碼器(207 )兩者,以及用于在第二解碼器和第三解碼器之間進(jìn) 行選擇、以便解碼所述可縮放音頻位流的裝置(209 )。
6、 如權(quán)利要求1所述的解碼器,其中,第一波形解碼器(203 ) 是高級音頻編碼、即AAC解碼器。
7、 如權(quán)利要求1所述的解碼器,其中,第一波形解碼器(203 ) 是MPEG - 2 LII解碼器。
8、 如權(quán)利要求1所述的解碼器,其中,第三解碼器(207 )是參 數(shù)立體聲、即PS解碼器。
9、 如權(quán)利要求1所述的解碼器,其中,第三解碼器(207 )是頻 帶復(fù)制、即SBR解碼器。
10、 如權(quán)利要求1所述的解碼器,其中,第三解碼器(207 )是 空間音頻編碼、即SAC解碼器。
11、 如權(quán)利要求1所述的解碼器,其中,第二解碼器(205 )是 可縮放無損標(biāo)準(zhǔn)、即SLS解碼器。
12、 如權(quán)利要求1所述的解碼器,其中,第二解碼器(205 )是 高級音頻編碼、即AAC編碼器。
13、 如權(quán)利要求l所述的解碼器,其中,第二解碼器(205 )是MPEG -2 LII多通道擴(kuò)展編碼器。
14、 如權(quán)利要求1所述的解碼器,其中,解碼器(200 )是MPEG -4解碼器。
15、 如權(quán)利要求1所述的解碼器,其中,所述可縮放音頻位流還 包括相對于笫一表示的、用于音頻信號的增強(qiáng)數(shù)據(jù);而且解碼器(200 ) 還包含用于響應(yīng)于該增強(qiáng)數(shù)據(jù)來生成音頻信號的裝置,
16、 如權(quán)利要求1所述的解碼器,其中,所述可縮放音頻位流還 包括相對于第二表示的、用于音頻信號的增強(qiáng)數(shù)據(jù);而且解碼器(200 ) 還包含用于響應(yīng)于該增強(qiáng)數(shù)據(jù)來生成音頻信號的裝置。
17、 如權(quán)利要求1所述的解碼器,其中,所述可縮放音頻位流還 包含第四位流分量;而且所述解碼器(200 )包含第四解碼器,用于 通過響應(yīng)于第四位流分量來修改第一解碼信號而生成音頻信號。
18、 一種用于將音頻信號編碼到可縮放音頻位流中的編碼器 (200 ),所述編碼器(200 )包含-第一波形編碼器(103),用于將所述音頻信號編碼到第一基于 波形的位流分量中;-第二編碼器(105),用于編碼所述音頻信號以生成第二位流分 量,其中第二位流分量包含用于第一基于波形的位流分量的第一增強(qiáng) 數(shù)據(jù),所述第一基于波形的位流分量和第二位流分量對應(yīng)于所述音頻 信號的第一表示;-第三編碼器(107),用于編碼所述音頻信號以生成第三位流分 量,其中第三位流分量包含用于第一基于波形的位流分量的第二增強(qiáng) 數(shù)據(jù),所述第一基于波形的位流分量和第三位流分量對應(yīng)于所述音頻信號的第二表示;以及-用于生成所述可縮放音頻位流的裝置(109),該可縮放音頻位 流包含第一基于波形的位流分量、第二位流分量和第三位流分量。
19、 一種從可縮放音頻位流中生成音頻信號的方法,所述方法包含-接收所述可縮放音頻位流,該可縮放音頻位流包含第一基于波 形的位流分量、第二位流分量和第三位流分量,所述第一基于波形的 位流分量和第二位流分量對應(yīng)于音頻信號的第一表示,而所述笫一基 于波形的位流分量和第三位流分量對應(yīng)于音頻信號的第二表示;-通過解碼第一基于波形的位流分量來生成笫一解碼信號;以及下列步驟中的至少一個-通過響應(yīng)于第二位流分量來修改第一解碼信號而生成音頻信 號;以及-通過響應(yīng)于第三位流分量來修改第一解碼信號而生成音頻信號。
20、 一種將音頻信號編碼到可縮放音頻位流中的方法,所述方法 包含-將所述音頻信號編碼到第一基于波形的位流分量中;-編碼所述音頻信號以生成第二位流分量,其中第二位流分量包 含用于第一基于波形的位流分量的第一增強(qiáng)數(shù)據(jù),所述第一基于波形 的位流分量和第二位流分量對應(yīng)于所述音頻信號的笫一表示;-編碼所述音頻信號以生成第三位流分量,其中第三位流分量包 含用于第一基于波形的位流分量的第二增強(qiáng)數(shù)據(jù),所述第一基于波形 的位流分量和第三位流分量對應(yīng)于所述音頻信號的第二表示;以及-生成所述可縮放音頻位流,該可縮放音頻位流包含第一基于波 形的位流分量、第二位流分量和第三位流分量。
21、 一種用于音頻信號的可縮放音頻位流,該可縮放音頻位流包 含第一基于波形的位流分量、第二位流分量和第三位流分量,所述第 一基于波形的位流分量和第二位流分量對應(yīng)于所述音頻信號的第 一表 示,而所述第一基于波形的位流分量和第三位流分量對應(yīng)于所述音頻 信號的第二表示。
22、 一種存儲介質(zhì),其上存儲有按照權(quán)利要求26的信號。
23、 一種用于接收可縮放音頻位流的接收機(jī)(903 ),所述接收 機(jī)(903 )包含 -用于接收所述可縮放音頻位流的裝置(201),該可縮放音頻位 流包含第一基于波形的位流分量、第二位流分量和第三位流分量,所 述第一基于波形的位流分量和第二位流分量對應(yīng)于所述音頻信號的第 一表示,而所述第 一基于波形的位流分量和第三位流分量對應(yīng)于所述 音頻信號的第二表示;-第一波形解碼器(203 ),用于通過解碼第一基于波形的位流分 量來生成第一解碼信號;以及下列中的至少一個-第二解碼器(205 ),用于通過響應(yīng)于第二位流分量來修改第一 解碼信號而生成所述音頻信號;以及-第三解碼器(207 ),用于通過響應(yīng)于第三位流分量來修改第一解碼信號而生成所述音頻信號。
24、 一種用于以可縮放音頻位流來發(fā)送音頻信號的發(fā)射機(jī)(901 ), 所述發(fā)射機(jī)(901)包含-第一波形編碼器(103),用于將所述音頻信號編碼到笫一基于 波形的位流分量中;-第二編碼器(105),用于編碼所述音頻信號以生成笫二位流分 量,其中第二位流分量包含用于第一基于波形的位流分量的第一增強(qiáng) 數(shù)據(jù),所述第一基于波形的位流分量和第二位流分量對應(yīng)于所述音頻 信號的第一表示;-第三編碼器(107),用于編碼所述音頻信號以生成第三位流分 量,其中第三位流分量包含用于第 一基于波形的位流分量的笫二增強(qiáng) 數(shù)據(jù),所述第 一基于波形的位流分量和第三位流分量對應(yīng)于所述音頻 信號的第二表示;-用于生成所述可縮放音頻位流的裝置(109),該可縮放音頻位 流包含第一基于波形的位流分量、第二位流分量和第三位流分量;以 及-用于發(fā)送所述可縮放音頻位流的裝置(909 )。
25、 一種用于發(fā)送音頻信號的傳輸系統(tǒng)(900 ),所述傳輸系統(tǒng) 包含-發(fā)射機(jī)(901),其包含-第一波形編碼器(103),用于將所述音頻信號編碼到第一 基于波形的位流分量中;-第二編碼器(105),用于編碼所述音頻信號以生成笫二位 流分量,其中第二位流分量包含用于第一基于波形的位流分量的 第一增強(qiáng)數(shù)據(jù),所述第一基于波形的位流分量和第二位流分量對 應(yīng)于所述音頻信號的第一表示;-第三編碼器(107),用于編碼所述音頻信號以生成第三位 流分量,其中第三位流分量包含用于笫一基于波形的位流分量的 第二增強(qiáng)數(shù)據(jù),所述第一基于波形的位流分量和第三位流分量對 應(yīng)于所述音頻信號的第二表示;-用于生成所述可縮放音頻位流的裝置(109),該可縮放音 頻位流包含第一基于波形的位流分量、第二位流分量和第三位流 分量;以及-用于發(fā)送所述可縮放音頻位流的裝置(909 );以及 -接收機(jī),其包含-用于接收所述可縮放音頻位流的裝置(911);-第一波形解碼器(203 ),用于通過解碼第一基于波形的位 流分量來生成第一解碼信號;以及下列中的至少一個-第二解碼器(205 ),用于通過響應(yīng)于笫二位流分量來修改 第一解碼信號而生成所述音頻信號;以及-第三解碼器(207 ),用于通過響應(yīng)于第三位流分量來修改 第一解碼信號而生成所述音頻信號。
26、 一種從可縮放音頻位流中接收音頻信號的方法,所述方法包含-接收所述可縮放音頻位流,該可縮放音頻位流包含第一基于波 形的位流分量、第二位流分量和第三位流分量,所述第一基于波形的 位流分量和第二位流分量對應(yīng)于音頻信號的第一表示,而所述第一基 于波形的位流分量和第三位流分量對應(yīng)于音頻信號的第二表示;-通過解碼笫一基于波形的位流分量來生成第一解碼信號;以及下列步驟中的至少一個-通過響應(yīng)于笫二位流分量來修改第一解碼信號而生成音頻信 號;以及 -通過響應(yīng)于第三位流分量來修改第一解碼信號而生成音頻信號。
27、 一種以可縮放音頻位流的形式發(fā)送音頻信號的方法,所述方 法包含-將所述音頻信號編碼到第一基于波形的位流分量中;-編碼所述音頻信號以生成第二位流分量,其中第二位流分量包 含用于第一基于波形的位流分量的第一增強(qiáng)數(shù)據(jù),所述第一基于波形 的位流分量和第二位流分量對應(yīng)于所述音頻信號的第 一表示;-編碼所述音頻信號以生成第三位流分量,其中第三位流分量包 含用于第一基于波形的位流分量的第二增強(qiáng)數(shù)據(jù),所述第一基于波形 的位流分量和第三位流分量對應(yīng)于所述音頻信號的第二表示;-生成所述可縮放音頻位流,該可縮放音頻位流包含第一基于波 形的位流分量、第二位流分量和第三位流分量;以及-發(fā)送所述可縮放音頻位流。
28、 一種發(fā)送和接收音頻信號的方法,所述方法包含 -將所述音頻信號編碼到第 一基于波形的位流分量中; -編碼所述音頻信號以生成第二位流分量,其中第二位流分量包含用于第 一基于波形的位流分量的第 一增強(qiáng)數(shù)據(jù),所述第 一基于波形 的位流分量和第二位流分量對應(yīng)于所述音頻信號的第 一表示;-編碼所述音頻信號以生成第三位流分量,其中第三位流分量包 含用于第一基于波形的位流分量的第二增強(qiáng)數(shù)據(jù),所述第一基于波形 的位流分量和第三位流分量對應(yīng)于所述音頻信號的第二表示;-生成所述可縮放音頻位流,該可縮放音頻位流包含第一基于波 形的位流分量、笫二位流分量和笫三位流分量;-發(fā)送所述可縮放音頻位流;-接收所述可縮放音頻位流;-通過解碼第一基于波形的位流分量來生成笫一解碼信號; 以及下列步驟中的至少一個-通過響應(yīng)于第二位流分量來修改第一解碼信號而生成音頻信 號;以及-通過響應(yīng)于第三位流分量來修改第一解碼信號而生成音頻信號。
29、 一種計算機(jī)程序產(chǎn)品,用于執(zhí)行權(quán)利要求19、 20、 26、 27 或者28任何一項中的方法。
30、 一種音頻播放設(shè)備(903 ),包含按照權(quán)利要求1的解碼器 (200)。
31、 一種錄音設(shè)備(901),包含按照權(quán)利要求18的編碼器(IOO)。
全文摘要
由第一波形編碼器(103)編碼音頻信號以生成第一基于波形的位流分量。第二編碼器(105)編碼該音頻信號以生成包含第一增強(qiáng)數(shù)據(jù)的第二位流分量,而第三編碼器(107)編碼該音頻信號以生成第三位流分量,其中第三位流分量包含用于第一基于波形的位流分量的第二增強(qiáng)數(shù)據(jù)。所述第一基于波形的位流分量和第二位流分量對應(yīng)于所述音頻信號的第一表示,而第一基于波形的位流分量和第三位流分量對應(yīng)于所述音頻信號的第二表示。由位流生成器(109)生成可縮放音頻位流。由解碼器在不同的表示之間進(jìn)行選擇,由此允許傳送一種靈活的和可縮放的位流。第二編碼器(105)具體地可以是波形編碼器,而第三編碼器(107)具體地可以是參數(shù)編碼器。
文檔編號G10L19/24GK101103393SQ200680002110
公開日2008年1月9日 申請日期2006年1月6日 優(yōu)先權(quán)日2005年1月11日
發(fā)明者A·W·J·烏門, L·M·范德柯克霍夫 申請人:皇家飛利浦電子股份有限公司