專利名稱:基于核心編碼器性能進(jìn)行選擇性信號代碼化的方法和裝置的制作方法
基于核心編碼器性能進(jìn)行選擇性信號代碼化的方法和裝置
背景技術(shù):
在包括因特網(wǎng)在內(nèi)的通信信道上的文本、圖像、聲音和語言信號的傳輸正在得以 快速發(fā)展,例如,能夠提供容納諸如文本、圖像和音樂等各種類型的信息的多媒體服務(wù)器。 包括語音和音樂信號的多媒體信號在傳輸時要求寬的帶寬。因此,為了發(fā)送包括文本、圖像 和音頻的多媒體數(shù)據(jù),非常期望的是將數(shù)據(jù)壓縮。數(shù)字語音和音頻信號的壓縮是眾所周知的。常常要求壓縮以在通信信道上高效地 發(fā)送信號,或者將壓縮信號存儲在數(shù)字媒體設(shè)備上,例如,存儲在固態(tài)存儲器設(shè)備或計算機(jī) 硬盤。數(shù)據(jù)壓縮的基本原理是冗余數(shù)據(jù)的消除??梢酝ㄟ^消除冗余的暫時的信息,例如 消除在何處聲音被重復(fù)、可預(yù)測或在感覺上冗余的消息,來壓縮數(shù)據(jù)。這將人對高頻率的不 敏感性考慮在內(nèi)。通常,壓縮導(dǎo)致在信號退化,越高的壓縮率導(dǎo)致越大的退化。當(dāng)以所獲得的子流形 成用于某個目標(biāo)解碼器的另一有效比特流;并且該子流表示具有低于完整原始比特流的、 但是考慮到較低的剩余數(shù)據(jù)量而言仍然是高的重構(gòu)質(zhì)量的源內(nèi)容的方式來去除比特流的 部分時,將該比特流稱為可調(diào)節(jié)的。不提供此性質(zhì)的比特流被稱為單層比特流??烧{(diào)節(jié)性 的常見模式是時間、空間、和質(zhì)量可調(diào)節(jié)性??烧{(diào)節(jié)性允許在有限帶寬信道上調(diào)整壓縮信號 以獲得最佳性能。可以以提供包括基層和至少一個增強(qiáng)層的多個編碼層并將各層構(gòu)造成具有不同 分辨力的方式來實現(xiàn)可調(diào)節(jié)性。雖然許多編碼方案是通用的,但某些編碼方案并入了信號的模型。通常,當(dāng)模型表 示信號正在被編碼時,能實現(xiàn)更好的信號壓縮。因此,已知的是基于信號類型的分類來選擇 編碼方案。例如,可以以不同于音樂信號的方式對聲音信號進(jìn)行建模和編碼。然而,信號分 類通常是個難題。已知代碼激勵線性預(yù)測(CELP)是用于數(shù)字語音代碼化的仍然非常流行的壓縮 (或“代碼化”)技術(shù)的示例,其為“合成分析(analysis-by-synthesis)”代碼化算法族中 的一個。合成分析一般指的是如下的代碼化過程,通過該代碼化過程,使用數(shù)字模型的多個 參數(shù)來將被與輸入信號相比較并被進(jìn)行失真分析的候選信號集合進(jìn)行合成。然后,發(fā)送或 存儲提供最低失真的參數(shù)集合,并最終用來對原始輸入信號的估計進(jìn)行重構(gòu)。CELP是使用 一個或多個碼本的特定的合成分析法,所述一個或者多個密碼本本質(zhì)上均包括響應(yīng)于碼本 索弓I從碼本檢索到的代碼矢量集合。在現(xiàn)代CELP編碼器中,存在以合理的低數(shù)據(jù)速率來保持高質(zhì)量語音和音頻再現(xiàn) 方面的問題。對于不能夠非常好地適配CELP語音模型的音樂或其它一般音頻信號而言,情 況尤其如此。在這種情況下,模型失配能夠引起嚴(yán)重降低的音頻質(zhì)量,這對于采用此類方法 的設(shè)備的最終用戶而言可能是不可接受的。
附圖用于進(jìn)一步示出各種實施例并說明全部依照本發(fā)明的各種原理和優(yōu)點,在所 述附圖中,相同的附圖標(biāo)記在所有分離視圖中自始至終指示相同或功能上類似的元件,且 所述附圖連同以下詳細(xì)說明一起并入本說明并構(gòu)成本說明書的一部分。圖1是現(xiàn)有技術(shù)的代碼化系統(tǒng)和解碼系統(tǒng)的方框圖。圖2是依照本發(fā)明的某些實施例的代碼化系統(tǒng)和解碼系統(tǒng)的方框圖。圖3是依照本發(fā)明的某些實施例的用于選擇代碼化系統(tǒng)的流程圖。圖4-6是示出在輸入語音信號時的依照本發(fā)明的某些實施例的比較器/選擇器中 的示例性信號的一系列圖表。圖7-9是示出在輸入音樂信號時的依照本發(fā)明的某些實施例的比較器/選擇器中 的示例性信號的一系列圖表。圖10是依照本發(fā)明的某些實施例的用于選擇性信號編碼的方法的流程圖。本領(lǐng)域的技術(shù)人員將認(rèn)識到圖中的元件是為了簡單和明了而示出的,且不一定按 比例繪制。例如,可以將圖中的某些元件的尺寸相對于其它元件放大,以幫助改善對本發(fā)明 的實施例的理解。
具體實施例方式在詳細(xì)描述依照本發(fā)明的實施例之前,應(yīng)注意到實施例主要在于與基于模型適配 的選擇性信號代碼化有關(guān)的方法步驟和裝置組件的組合。因此,已經(jīng)在附圖中用慣用符號適 當(dāng)?shù)乇硎玖嗽撗b置組件和方法步驟,附圖僅僅示出與理解本發(fā)明的實施例相關(guān)的那些細(xì)節(jié), 以免由于對于從本文說明中獲益的本領(lǐng)域技術(shù)人員來說顯而易見的細(xì)節(jié)使本公開含糊難懂。在本文獻(xiàn)中,諸如第一和第二、上和下等關(guān)系術(shù)語僅僅被使用用于將一個實體或 動作與另一實體或動作區(qū)別開,而不一定要求或暗示此類實體或動作之間的任何實際此類 關(guān)系或順序。本文所使用的術(shù)語“包括”或其任何其它變體意圖涵蓋非排他性包括,使得包 括一系列要素的過程、方法、物件、或裝置不僅包括那些要素,而且可以包括未明確列出或 為此類過程、方法、物件、或裝置所固有的其它要素。在沒有更多限制的情況下,術(shù)語“包括” 之后的元素不排除包括該元素的過程、方法、物件、或裝置中的額外的相同元素的存在。應(yīng)認(rèn)識到本文所述的本發(fā)明的實施例可以包括一個或多個傳統(tǒng)處理器和唯一存 儲的程序指令,所述唯一存儲的程序指令控制所述一個或多個處理器與某些非處理器電路 相結(jié)合地實現(xiàn)本文所述的基于模型適配的選擇性信號代碼化的某些、大多數(shù)、或全部功能。 可選地,可以由不具有存儲程序指令的狀態(tài)機(jī)來實現(xiàn)某些或全部功能,或者可以在一個或 多個專用集成電路(ASIC)中實現(xiàn)某些或者全部功能,在所述集成電路中,每個功能或某些 功能的一些組合被實現(xiàn)為定制邏輯。當(dāng)然,可以使用兩種方法的組合。因此,本文已描述了 用于這些功能的方法和裝置。此外,可以預(yù)期的是,本領(lǐng)域的技術(shù)人員雖然可能進(jìn)行了由于 例如可用時間、當(dāng)前技術(shù)和經(jīng)濟(jì)方面的考慮所激發(fā)的重大努力和許多設(shè)計選擇,但當(dāng)其受 到本文所公開的構(gòu)思和原理的教導(dǎo)時,將容易地能夠以最少的實驗來生成此類軟件指令、 程序和IC。圖1是現(xiàn)有技術(shù)的嵌入式代碼化和解碼系統(tǒng)100的方框圖。在圖1中,原始信號 s (η) 102被輸入到編碼系統(tǒng)的核心層編碼器104中。核心層編碼器104對信號120進(jìn)行編碼并產(chǎn)生核心層編碼信號106。另外,原始信號102被輸入到編碼系統(tǒng)的增強(qiáng)層編碼器108。 增強(qiáng)層編碼器108還接收第一重構(gòu)信號s。(n) 110作為輸入。通過經(jīng)由第一核心層解碼器 112傳遞核心層編碼信號106來產(chǎn)生第一重構(gòu)信號110。增強(qiáng)層編碼器108用來基于信號 s (η) (102)和s。(n) (110)的某些比較來對附加信息進(jìn)行代碼化,并可以可選地使用來自核 心層編碼器104的參數(shù)。在一個實施例中,增強(qiáng)層編碼器108對作為重構(gòu)信號110與輸入 信號102之間的差的誤差信號進(jìn)行編碼。增強(qiáng)層編碼器108產(chǎn)生增強(qiáng)層編碼信號114。核 心層編碼信號106和增強(qiáng)層編碼信號114兩者都被傳遞到信道116。該信道表示諸如通信 信道和/或存儲介質(zhì)等的介質(zhì)。在通過信道之后,通過經(jīng)由第二核心層解碼器120傳遞接收到的核心層編碼信號 106'來產(chǎn)生第二重構(gòu)信號118。第二核心層解碼器120執(zhí)行與第一核心層解碼器112相同 的功能。如果增強(qiáng)層編碼信號114也通過信道116并被作為信號114'被接收,則可以將其 傳遞至增強(qiáng)層解碼器122。增強(qiáng)層解碼器122還接收第二重構(gòu)信號118作為輸入,并產(chǎn)生 第三重構(gòu)信號1 作為輸出。第三重構(gòu)信號124比第二重構(gòu)信號118更緊密地與原始信號 102匹配。增強(qiáng)層編碼信號114包括使得信號102能夠比第二重構(gòu)信號118更準(zhǔn)確地被重構(gòu) 的附加信息。也就是說,其為增強(qiáng)型重構(gòu)。此類嵌入式代碼化系統(tǒng)的一個優(yōu)點是特定信道116可能無法始終如一地支持與 高質(zhì)量音頻代碼化算法相關(guān)聯(lián)的帶寬要求。然而,嵌入式代碼器允許從信道116接收部分 比特流(例如,僅接收核心層比特流),以在增強(qiáng)層比特流丟失或損壞時僅產(chǎn)生例如核心輸 出音頻。然而,在嵌入式與非嵌入式編碼器的質(zhì)量之間、以及在不同嵌入式代碼化最優(yōu)化目 標(biāo)之間存在權(quán)衡。也就是說,較高質(zhì)量的增強(qiáng)層代碼化可以幫助實現(xiàn)核心和增強(qiáng)層之間的 更好平衡,并且還降低總數(shù)據(jù)速率,用于更好的傳輸特性(例如,減少的擁擠),這可以導(dǎo)致 用于增強(qiáng)層的較低分組出錯率。雖然許多編碼方案是通用的,但某些編碼方案并入了信號的模型。通常,當(dāng)模型表 示信號正在被編碼時,能實現(xiàn)更好的信號壓縮。因此,已知的是基于信號類型的分類來選擇 編碼方案。例如,可以以不同于音樂信號的方式對語音信號進(jìn)行建模和編碼。然而,信號分 類通常是個難題。圖2是依照本發(fā)明的某些實施例的代碼化和解碼系統(tǒng)200的方框圖。參照圖2, 原始信號102被輸入到編碼系統(tǒng)的核心層編碼器104。原始信號102可以是語音/音頻信 號或另一種信號。核心層編碼器104對信號120進(jìn)行編碼并產(chǎn)生核心層編碼信號106。通 過經(jīng)由第一核心層解碼器112傳遞核心層編碼信號106來產(chǎn)生第一重構(gòu)信號110。在比較 器/選擇器模塊202中比較原始信號102和第一重構(gòu)信號110。比較器/選擇器模塊202 將原始信號102與第一重構(gòu)信號110相比較,并基于該比較產(chǎn)生對要使用的增強(qiáng)層編碼器 206中的一個進(jìn)行選擇的選擇信號204。雖然在圖中僅示出兩個增強(qiáng)層編碼器,但應(yīng)認(rèn)識到 可以使用多個增強(qiáng)層編碼器。比較器/選擇器模塊模塊202可以選擇最可能生成最好重構(gòu) 信號的增強(qiáng)層編碼器。雖然核心層解碼器112被視為用于接收被相應(yīng)地發(fā)送到信道116的核心層編碼信 號106,但元件104和106之間的物理連接可以允許更高效的實現(xiàn),使得公共處理元件和/ 或狀態(tài)可以被共享,并因此不要求重新生成或復(fù)制。
每個增強(qiáng)層編碼器206接收原始信號102和第一重構(gòu)信號作為輸入(或諸如由這 些信道導(dǎo)出的差信號等信號),并且選定的編碼器產(chǎn)生增強(qiáng)層編碼信號208。在一個實施例 中,增強(qiáng)層編碼器206對作為重構(gòu)信號110與輸入信號102之間的差的誤差信號進(jìn)行編碼。 增強(qiáng)層編碼信號208包含基于信號S(ri) (102)和sc(n) (110)的比較的附加信息??蛇x地, 其可以使用來自核心層解碼器104的參數(shù)。核心層編碼信號106、增強(qiáng)層編碼信號208和選 擇信號204都被傳遞到信道116。該信道表示諸如通信信道和/或存儲介質(zhì)等的介質(zhì)。在通過信道之后,通過經(jīng)由第二核心層解碼器120傳遞接收到的核心層編碼信號 106'來產(chǎn)生第二重構(gòu)信號118。第二核心層解碼器120執(zhí)行與第一核心層解碼器112相同 的功能。如果增強(qiáng)層編碼信號208也通過信道116并被作為信號208'接收,則可以將其傳 遞至增強(qiáng)層解碼器210。增強(qiáng)層解碼器210還接收第二重構(gòu)信號118和作為輸入的接收到 的選擇信號204’,并產(chǎn)生第三重構(gòu)信號212作為輸出。增強(qiáng)層解碼器210的操作取決于接 收到的選擇信號204'。第三重構(gòu)信號212比第二重構(gòu)信號118更緊密地與原始信號102 匹配。增強(qiáng)層編碼信號208包括附加信息,因此,第三重構(gòu)信號212比第二重構(gòu)信號118 更準(zhǔn)確地與信號102匹配。圖3是依照本發(fā)明的某些實施例的用于選擇代碼化系統(tǒng)的方法的流程圖。特別 地,圖3描述本發(fā)明的實施例中的比較器/選擇器模塊的操作。在起始框302之后,根據(jù)需 要將輸入信號(圖2中的102)和重構(gòu)信號(圖2中的110)變換到選定的信號域??梢栽?沒有變換的情況下使用時域信號,或者在方框304處,可以將信號變換到譜域,例如,諸如 頻域、改進(jìn)離散余弦變換(MDCT)域、或小波域,并且還可以通過其它可選元素進(jìn)行處理,諸 如信號的某些頻率或時間特性的感知加權(quán)。已變換(或時域)輸入信號被表示為用于譜分 量k的S(k),并且已變換(或時域)重構(gòu)信號被表示為用于譜分量k的S。(k)。對于選定 的分量集合(其可以是所有或僅僅某些分量)中的每個分量k而言,將重構(gòu)信號中的所有 分量S。(k)的能量E_tot與比原始輸入信號的相應(yīng)分量S(k)大(例如,以某個因數(shù))的那 些分量中的能量E_err相比較。雖然輸入和重構(gòu)信號分量可能在振幅方面相差懸殊,但重構(gòu)信號分量的振幅的顯 著增大可指示建模不良的輸入信號。因此,可以用給定增強(qiáng)層代碼化方法來補(bǔ)償較低振幅 的重構(gòu)信號分量,而較高振幅(即,建模不良)的重構(gòu)信號分量可能更好地適合于替換增強(qiáng) 層代碼化方法。一種此類替換增強(qiáng)層代碼化方法可能涉及在增強(qiáng)層代碼化之前減少重構(gòu)信 號的某些分量的能量,使得由于核心層信號模型失配而產(chǎn)生的可聽噪聲或失真減小。再次參照圖3,在方框306處對分量的環(huán)路進(jìn)行初始化,其中,對分量k進(jìn)行初始 化,并將能量度量E_tot和E_err初始化為零。在判定框308處,進(jìn)行檢查以確定重構(gòu)信號 的分量的絕對值是否顯著大于輸入信號的相應(yīng)分量。如果其明顯較大,如來自判定框308 的正分支所描繪的,則在方框310處將該分量添加到誤差能量E_err,并且流程繼續(xù)至方框 312。在方框312處,將重構(gòu)信號的分量添加到總能量值E_tot。在判定框314處,增加分量 值并進(jìn)行檢查,以確定是否所有分量已被處理。如果不是,如來自判定框314的負(fù)分支所描 繪的,則流程返回方框308。否則,如來自判定框316的正分支所描繪的,環(huán)路完成并在判定 框316處比較總的累積能量。如果誤差能量E_err以總誤gE_tot低得多,如來自判定框 316的負(fù)分支所描繪的,則在方框318處選擇類型1增強(qiáng)層。否則,如來自判定框316的正分支所描繪的,在方框320處選擇類型2增強(qiáng)層。輸入信號的此塊的處理在方框322處終對本領(lǐng)域的技術(shù)人員顯而易見的是可以使用信號能量的其它度量,諸如提高到某 個功率的分量的絕對值。例如,可以將分量S。(k)的能量估計為IS。(k) I%并可以將分量 s(k)的能量估計為|s。(k) |p,其中,P是大于零的數(shù)。對于本領(lǐng)域的技術(shù)人員來說顯而易見的是可以將誤差能量E_err與輸入信號中 的總能量而不是重構(gòu)信號中的總能量相比較??梢栽诰幊烫幚砥魃蠈崿F(xiàn)編碼器。下面給出與圖3相對應(yīng)的示例性代碼列表。在 圖中,分另1J用E_tot禾口 E_err來表示變量energy_tot禾口 energy_err。Threshl = 0. 49 ;Thresh2 = 0. 264 ;energy_tot = 0 ;energy_err = 0 ;for(k = kStart ;k < kMax ;k++)在本示例中,閾值Threshl和Thresh2分別被設(shè)置在0. 49和0. 264.可以根據(jù)所 使用的增強(qiáng)層編碼器的類型以及根據(jù)使用哪個變換域來使用其它值??梢蕴砑訙蠹?,因此,只有當(dāng)特定數(shù)目的信號塊是相同類型時才改變增強(qiáng)層類 型。例如,如果正在使用編碼器類型1,則將不選擇類型2,除非兩個連續(xù)塊指示類型2的使用。圖4-6是示出用于語音信號的示例性結(jié)果的一系列圖表。圖4中的圖表402示出 重構(gòu)信號的能量E_t0t。在20毫秒幀中計算能量,因此,該圖表示出10秒間隔內(nèi)的信號能 量的變化。圖5中的圖表502示出誤差能量E_err與相同時間段內(nèi)的總能量E_tot的比。 閾值Thresh2被示為虛線504。在其中所述比超過閾值的幀中的語音信號未被代碼器很好 地建模。然而,對于大部分幀而言,未超過閾值。圖6中的圖表602示出相同時間段內(nèi)的選 擇或判定信號。在本示例中,值0指示選擇了類型1增強(qiáng)層代碼器,且值1指示選擇了類型 2增強(qiáng)層代碼器。在其中所述比高于閾值的隔離幀被忽視,并且該選擇只有在兩個連續(xù)幀指 示相同選擇時才改變。因此,例如,即使所述比超過閾值,也選擇類型1增強(qiáng)層編碼器用于 幀 141。圖7-9示出音樂信號的相應(yīng)的一系列圖表。圖7中的圖表702示出輸入信號的能
if (Threshl*abs(Sc[k]) > abs(S[k])){ energy_err+ = abs(Sc[k]);}energy_tot+ = abs (Sc [k]);}if(energy_err < Thresh2氺energy_tot)type = 1 ;elsetype = 2 ;量E_t0t。再次地,在20毫秒幀中計算能量,因此,該圖表示出10秒間隔內(nèi)的輸入能量變化。 圖8中的圖表示出誤差能量E_err與相同時間段內(nèi)的總能量E_tot的比。閾值Thresh2被 示為虛線504。在其中所述比超過閾值的幀中的音樂信號未被代碼器很好地建模。大多數(shù) 幀情況如此,因為核心代碼器是為語音信號而設(shè)計的。圖9中的圖表902示出相同時間段 內(nèi)的選擇或判定信號。再次地,值0指示選擇了類型1增強(qiáng)層編碼器且值1指示選擇了類 型2增強(qiáng)層編碼器。因此,大多數(shù)時間選擇類型2增強(qiáng)層編碼器。然而,在其中核心編碼器 碰巧適用于音樂的幀中,選擇類型1增強(qiáng)層編碼器。在對語音信號的22,803個幀的測試中,僅在227個幀、亦即僅1 %的時間中選擇類 型2增強(qiáng)層編碼器.在對音樂的29,644個幀的測試中,在16,145個幀、亦即的時間中 選擇類型2增強(qiáng)層編碼器。在其它幀中,核心編碼器碰巧適用于音樂并選擇了用于語音的 增強(qiáng)層編碼器。因此,比較器/選擇器不是語音/音樂分類器。這與設(shè)法將輸入信號分類 為語音或音樂并隨后相應(yīng)地選擇代碼化方案的在先方案相反。這里的方法是根據(jù)核心層編 碼器的性能來選擇增強(qiáng)層編碼器。圖10是示出依照本發(fā)明的某些實施例的嵌入式代碼器的操作的流程圖。該流程 圖示出用來對信號數(shù)據(jù)的一個幀進(jìn)行編碼的方法?;谛盘柕臅r間特性來選擇幀的長度。 例如,可以將20ms的幀用于語音信號。在圖10中的起始框1002之后,使用核心層編碼器 在方框1004處對輸入信號進(jìn)行編碼,以產(chǎn)生核心層編碼信號。在方框1006處,對核心層編 碼信號進(jìn)行解碼,以產(chǎn)生重構(gòu)信號。在本實施例中,在方框1008處生成誤差信號作為重構(gòu) 信號與輸入信號之間的差。在方框1010處將重構(gòu)信號與輸入信號相比較,并在判定框1012 處確定重構(gòu)信號是否是用于輸入信號的良好匹配。如果匹配良好,如來自判定框1012的正 分支所描繪的,則在方框1014處使用類型1增強(qiáng)層編碼器來對誤差信號進(jìn)行編碼。如果匹 配不好,如來自判定框1012的負(fù)分支所描繪的,則在方框1016處使用類型2增強(qiáng)層編碼器 來對誤差信號進(jìn)行編碼。在方框1018處,將核心層編碼信號、增強(qiáng)層編碼信號、和選擇指示 符輸出到信道(例如以便傳輸或存儲)。幀的處理在方框1020處終止。在本實施例中,增強(qiáng)層編碼器可對誤差信號進(jìn)行響應(yīng),然而,在替換實施例中,增 強(qiáng)層編碼器可對輸入信號和可選地對來自核心層編碼器和/或核心層解碼器的一個或多 個信號進(jìn)行響應(yīng)。在另一實施例中,使用替換誤差信號,諸如輸入信號和重構(gòu)信號之間的加 權(quán)差。例如,可以在形成誤差信號之前使重構(gòu)信號的某些頻率衰減??梢詫⒔Y(jié)果得到的誤 差信號稱為加權(quán)誤差信號。在替換實施例中,核心層編碼器和解碼器還可以包括其它增強(qiáng)層,并且本發(fā)明比 較器可以接收作為重構(gòu)信號的之前的增強(qiáng)層中的一個的輸出作為輸入。另外,可以存在在 上述增強(qiáng)層之后的增強(qiáng)層,其可以是或可以不是根據(jù)比較的結(jié)果而被切換。例如,嵌入式代 碼化系統(tǒng)可以包括五個層。核心層(Li)和第二層(U)可以產(chǎn)生重構(gòu)信號S。(k)。然后,可 以使用重構(gòu)信號S。(k)和輸入信號S(k)來選擇第三和四層(L3、L4)中的增強(qiáng)層編碼方法。 最后,第五層(U)可以僅包括單個增強(qiáng)層編碼方法。編碼器可以根據(jù)重構(gòu)信號和輸入信號之間的比較在兩個或更多增強(qiáng)層編碼器之 間進(jìn)行選擇。可以例如在編程處理器、可重配置處理器或?qū)S眉呻娐飞蠈崿F(xiàn)編碼器和解碼ο
在前述說明書中,已描述了本發(fā)明的特定實施例。然而,本領(lǐng)域的技術(shù)人員應(yīng)認(rèn)識 到在不脫離如以下權(quán)利要求所闡述的本發(fā)明的范圍的情況下可以進(jìn)行各種修改和變更。因 此,應(yīng)將本說明書和附圖視為說明性而不是限制性的,并且所有此類修改意圖被包括在本 發(fā)明的范圍內(nèi)。然而,不應(yīng)將所述益處、優(yōu)點、問題的解決方案、以及可促使任何益處、優(yōu)點、 或解決方案發(fā)生或變得更加明顯的任何要素理解為任何或全部權(quán)利要求的關(guān)鍵、必要、或 本質(zhì)特征或要素。僅僅由包括在本申請待決期間進(jìn)行的任何修改的隨附權(quán)利要求和發(fā)布的 那些權(quán)利要求的所有等價物來定義本發(fā)明。
權(quán)利要求
1.一種用于對輸入信號進(jìn)行代碼化的方法,所述方法包括 使用核心層編碼器對輸入信號進(jìn)行編碼,以產(chǎn)生核心層編碼信號; 對所述核心層編碼信號進(jìn)行解碼,以產(chǎn)生重構(gòu)信號;將所述重構(gòu)信號與所述輸入信號相比較;根據(jù)所述重構(gòu)信號和所述輸入信號之間的比較,從多個增強(qiáng)層編碼器中選擇增強(qiáng)層編 碼器;以及使用選定的增強(qiáng)層編碼器來生成增強(qiáng)層編碼信號,所述增強(qiáng)層編碼信號取決于所述輸 入信號。
2.如權(quán)利要求1所述的方法,進(jìn)一步包括將誤差信號生成為所述重構(gòu)信號與所述輸入信號之間的差, 其中,生成所述增強(qiáng)層編碼信號的步驟包括對所述誤差信號進(jìn)行編碼。
3.如權(quán)利要求1所述的方法,其中,所述誤差信號包括所述重構(gòu)信號與所述輸入信號 之間的加權(quán)差。
4.如權(quán)利要求1所述的方法,其中,將所述重構(gòu)信號與所述輸入信號相比較的步驟包括估計所述重構(gòu)信號的分量中的能量E_tot ;估計包含誤差的所述重構(gòu)信號的分量中的能量E_err ;以及將所述能量E_tot與所述能量E_err相比較。
5.如權(quán)利要求4所述的方法,還包括變換所述重構(gòu)信號,以產(chǎn)生所述重構(gòu)信號的分量,其中,從由傅立葉變換、改進(jìn)離散余弦變換(MDCT)和小波變換組成的變換組中選擇所 述變換。
6.如權(quán)利要求4所述的方法,其中,估計包含誤差的所述重構(gòu)信號的分量中的能量E_ err的步驟包括對所述輸入信號的分量S(k)與所述重構(gòu)信號的分量S。(k)的比S(k)/S。(k)超過閾值 的所述重構(gòu)信號的那些分量S。(k)的能量求和。
7.如權(quán)利要求4所述的方法,進(jìn)一步包括變換所述重構(gòu)信號,以產(chǎn)生所述重構(gòu)信號的分量;以及 變換所述輸入信號,以產(chǎn)生所述輸入信號的分量,其中,從由傅立葉變換、改進(jìn)離散余弦變換(MDCT)和小波變換組成的變換組中選擇所 述變換。
8.如權(quán)利要求6所述的方法,其中,分量S。(k)的所述能量被估計為|S。(k)|p,并且其 中,分量s(k)的所述能量被估計為Sc(k) ιP,其中,P是大于零的數(shù)。
9.如權(quán)利要求10所述的方法,其中,將所述能量E_tot與所述能量E_err相比較的步 驟包括將能量的比E_err/E_tot與閾值相比較。
10.如權(quán)利要求1所述的方法,其中,所述輸入信號包括音頻信號,并且其中,所述核心 層編碼包括語音編碼器。
11.如權(quán)利要求1所述的方法,進(jìn)一步包括將所述核心層編碼信號、所述增強(qiáng)層編碼信號和所述選定的增強(qiáng)層編碼器的指示符輸出到信道。
12.一種選擇性信號編碼器,包括核心層編碼器,所述核心層編碼器接收要編碼的輸入信號并產(chǎn)生核心層編碼信號;核心層解碼器,所述核心層解碼器接收所述核心層編碼信號作為輸入,并產(chǎn)生重構(gòu)信號;多個增強(qiáng)層編碼器,所述多個增強(qiáng)層編碼器中的每個可選擇地用于對誤差信號進(jìn)行編 碼,以產(chǎn)生增強(qiáng)層編碼信號,所述誤差信號包括所述輸入信號和所述重構(gòu)信號之間的差;以 及比較器/選擇器模塊,所述比較器/選擇器模塊根據(jù)所述輸入信號和核心層編碼信號 的比較來選擇所述多個增強(qiáng)層編碼器中的增強(qiáng)層編碼器,其中,所述輸入信號被編碼為所述核心層編碼信號、所述增強(qiáng)層編碼信號和選定的增 強(qiáng)層編碼器的指示符。
13.如權(quán)利要求12所述的選擇性信號編碼器,其中,所述核心層編碼器包括語音編碼ο
14.如權(quán)利要求12所述的選擇性信號編碼器,其中,所述比較器/選擇器模塊估計所述重構(gòu)信號的分量中的能量E_tot ;估計包含誤差的所述重構(gòu)信號的分量中的能量E_err ;以及將所述能量E_tot與所述能量E_err相比較。
15.如權(quán)利要求14所述的選擇性信號編碼器,其中,所述比較器/選擇器模塊通過對所 述輸入信號的分量S(k)與所述重構(gòu)信號的分量S。(k)的比S(k)/S。(k)超過閾值的所述重 構(gòu)信號的那些分量S。(k)求和來估計包含誤差的所述重構(gòu)信號的分量中的能量E_err。
16.如權(quán)利要求14所述的選擇性信號編碼器,其中,所述比較器/選擇器模塊通過將能 量的比E_err/E_tot與閾值相比較來將所述能量E_tot與所述能量E_err相比較。
17.如權(quán)利要求14所述的選擇性信號編碼器,其中,經(jīng)由從由傅立葉變換、改進(jìn)離散余 弦變換(MDCT)和小波變換組成的變換組中選擇的變換來計算所述重構(gòu)信號的分量和所述 輸入信號的分量。
18.一種用于對初始信號進(jìn)行解碼的選擇性信號解碼器,所述初始信號被編碼為核心 層編碼信號、增強(qiáng)層編碼信號和選定增強(qiáng)層編碼器的指示符,所述解碼器包括核心層解碼器,所述核心層解碼器接收所述核心層編碼信號作為輸入并產(chǎn)生第一重構(gòu) 信號;以及增強(qiáng)層解碼器,所述增強(qiáng)層解碼器由所述選定增強(qiáng)層編碼器的指示符來控制,所述增 強(qiáng)層解碼器對所述增強(qiáng)層編碼信號進(jìn)行解碼,以產(chǎn)生第二重構(gòu)信號。
19.如權(quán)利要求18所述的選擇性信號解碼器,其中,所述第二重構(gòu)信號包括誤差信號, 并且其中,所述初始信號被恢復(fù)為所述重構(gòu)信號和所述誤差信號的和。
20.如權(quán)利要求18所述的選擇性信號解碼器,其中,所述增強(qiáng)層解碼器響應(yīng)于所述第 一重構(gòu)信號第二和所述增強(qiáng)層編碼信號,并且其中,所述第二重構(gòu)信號是所述初始信號的 估計。
全文摘要
在選擇性信號編碼器中,首先使用核心層編碼器對輸入信號進(jìn)行編碼(1004),以產(chǎn)生核心層編碼信號。對核心層編碼信號進(jìn)行解碼(1006),以產(chǎn)生重構(gòu)信號并生成誤差信號(1008)作為重構(gòu)信號與誤差信號之間的差。將重構(gòu)信號與輸入信號相比較(1010)。根據(jù)比較選擇兩個或更多增強(qiáng)層編碼器中的一個(1014、1016),并將其用來對誤差信號進(jìn)行編碼。將核心層編碼信號、增強(qiáng)層編碼信號、和選擇指示符輸出(1018)到信道(例如以便傳輸或存儲)。
文檔編號G10L19/04GK102047325SQ200980112566
公開日2011年5月4日 申請日期2009年4月9日 優(yōu)先權(quán)日2008年4月9日
發(fā)明者烏達(dá)·米塔爾, 喬納森·A·吉布斯, 詹姆斯·P·阿什利 申請人:摩托羅拉移動公司