支持音頻編碼器模式間的轉(zhuǎn)換的制作方法

文檔序號：2829031閱讀：238來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：支持音頻編碼器模式間的轉(zhuǎn)換的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種用于支持音頻信號編碼的方法，其中至少第一編碼器模式和第二編碼器模式可以用于編碼該音頻信號的各個部分，并且其中至少第二編碼器模式至少基于兩種不同編碼模型啟動該音頻信號各個部分的編碼。本發(fā)明同樣涉及相應(yīng)的模塊，涉及包含相應(yīng)編碼器的電子設(shè)備并且涉及包含相應(yīng)編碼器和解碼器的音頻編碼系統(tǒng)。最后，本發(fā)明還涉及相應(yīng)的軟件程序產(chǎn)品。
背景技術(shù)：
一個音頻信號可以是語音信號或者其它類型的音頻信號，比如音樂，不同的編碼模型可以適用于不同類型的音頻信號。
用于編碼語音信號的廣泛使用的技術(shù)是代數(shù)碼激勵線性預(yù)測(ACELP)編碼。ACELP模仿人類語音生成系統(tǒng)，而且非常適合編碼語音信號的周期。作為結(jié)果，用非常低的比特率能夠?qū)崿F(xiàn)高語音品質(zhì)。例如，自適應(yīng)多速率寬帶(AMR-WB)是基于ACELP技術(shù)的語音編解碼器。例如，在技術(shù)規(guī)范3GPP TS 26.190“Speech Codec speechprocessing functions；AMR Wideband speech codec；Transcodingfunctions”，V5.1.0(2001年12月)中已經(jīng)描述了AMR-WB。然而，基于人類語音生成系統(tǒng)的語音編解碼器對其它類型的音頻信號，比如音樂通常表現(xiàn)得相當(dāng)差。
用于編碼除去語音之外的其它音頻信號的廣泛使用的技術(shù)是變換編碼(TCX)。對音頻信號變換編碼的優(yōu)越性基于感知型掩蔽和頻率域編碼。通過為該變換編碼選擇適合的編碼幀長度可以進一步改善得到的音頻信號的質(zhì)量。但是當(dāng)變換編碼技術(shù)導(dǎo)致除了語音之外的音頻信號的高質(zhì)量時，其性能在以低比特率運行時對周期性的語音信號并不好。因此，變換編碼的語音的質(zhì)量通常相當(dāng)?shù)?，尤其對長的TCX幀長度更是如此。
擴展的AMR-WB(AMR-WB+)編解碼器將立體聲音頻信號編碼為高比特率單聲道信號，并提供立體聲擴展的某些邊界信息。該AMR-WB+編解碼器利用ACELP編碼和TCX模型二者編碼0Hz到6400Hz的頻帶中的核心單聲道信號。對于TCX模型，利用20ms、40ms或者80ms的編碼幀長度。
由于ACELP模型可以降低音頻質(zhì)量，而變換編碼通常對語音表現(xiàn)很差，特別是在使用長編碼幀時，不得不取決于要編碼的信號的特性來選擇各自最佳的編碼模型?？梢砸愿鞣N各樣的方式實現(xiàn)實際要使用的編碼模型的選擇。
在需要低復(fù)雜性技術(shù)的系統(tǒng)中，比如移動多媒體業(yè)務(wù)(MMS)中，通常使用音樂/語音分類算法來選擇最佳的編碼模型。這些算法基于音頻信號的能量和頻率特性的分析，將整個源信號分類為音樂或者語音。
如果一個音頻信號僅由語音或者僅由音樂組成，基于這種音樂/語音分類對整個信號使用同一種編碼模型將是符合要求的。然而在許多其它情況中，要編碼的音頻信號是混合型的音頻信號。例如，在音頻信號中，語音可能與音樂同時出現(xiàn)和/或暫時用音樂替代。
在這些情況中，將整個源信號分類為音樂或者語音種類是一種非常有限的方法。因而，僅可以通過在編碼音頻信號時暫時在編碼模型之間轉(zhuǎn)換來使綜合音頻質(zhì)量最佳化。也就是說，ACELP模型也部分地用于編碼分類為除去語音之外的音頻信號的源信號，而TCX模型也部分地用于編碼分類為語音信號的源信號。
擴展的AMR-WB(AMR-WB+)編解碼器也設(shè)計為在一幀接一幀的基礎(chǔ)上用混合的編碼模型編碼這種混合類型的音頻信號。
可以以幾種方式實現(xiàn)AMR-WB+中編碼模型的選擇，即分類。
在最復(fù)雜的方法中，信號首先用ACELP和TCX模型的所有可能組合來編碼。接著，對每一種組合再次合成該信號。然后，基于所合成的語音信號的質(zhì)量，選擇最好的激勵。可以通過，例如，確定其信噪比(SNR)，來測量用特定的組合得到的合成語音的質(zhì)量。這種綜合分析型的方法將提供好的結(jié)果。然而，由于其非常高的復(fù)雜性，在某些應(yīng)用中它行不通。例如，這樣的應(yīng)用包括移動應(yīng)用。復(fù)雜性很大程度上來自于ACELP編碼，它是編碼器最復(fù)雜的部分。
例如，在比如MMS的系統(tǒng)中，上面提到的全閉環(huán)綜合分析方法太復(fù)雜而難以執(zhí)行。因此，在MMS編碼器中，較低復(fù)雜性的開環(huán)方法可以用于分類以確定要使用ACELP編碼模型還是TCX模型來編碼一個特殊的幀。
AMR-WB+可以使用各種各樣的低復(fù)雜性開環(huán)方法來為每個幀選擇各自的編碼模型。這種方法中使用的選擇邏輯旨在更詳細地估計源信號特征及編碼參數(shù)，以選擇各自的編碼模型。
在分類過程中一種建議的選擇邏輯包括首先使每個幀中的音頻信號分為幾個頻帶，并分析較低頻帶中的能量與較高頻帶中的能量之間的關(guān)系，即分析那些頻帶中的能量等級變化。隨后利用不同的分析窗口和判決閾值，基于所執(zhí)行的測量二者或者基于這些測量的不同組合，將該音頻信號的每個幀中的音頻內(nèi)容分類為類似音樂的內(nèi)容或者類似語音的內(nèi)容。
在另一種幫助分類的、特別地用于第一選擇邏輯之外的并因此也稱作模型分類改進的建議的選擇邏輯中，編碼模型選擇是基于該音頻信號的各個幀中的音頻內(nèi)容的周期和固定特性的估計。更特別地，通過確定相關(guān)性、長期預(yù)測(LTP)參數(shù)和頻譜距離測量來估計周期和固定特性。
倘若取樣頻率不變，AMR-WB+編解碼器此外允許，在音頻數(shù)據(jù)流編碼期間，在專門使用ACELP編碼模型的AMR-WB模式和使用ACELP編碼模型或者TCX模型的擴展模式之間的轉(zhuǎn)換。例如，取樣頻率可以是16kHz。
擴展模式輸出比AMR-WB模式較高的比特率。因而，當(dāng)連接編碼端和解碼端的網(wǎng)絡(luò)中的傳輸條件需要從較高比特率模式變化到較低比特率模式以降低網(wǎng)絡(luò)中的擁塞時，從擴展模式到AMR-WB模式的轉(zhuǎn)換可能是有利的。可能也需要從較高比特率模式到較低比特率模式的變化，以合并移動廣播/多點傳送業(yè)務(wù)(MBMS)中的新的低端接收機。
另一方面，當(dāng)網(wǎng)絡(luò)中的傳輸條件中的變化允許從較低比特率模式變化到較高比特率模式時，從AMR-WB模式到擴展模式的轉(zhuǎn)換可能是有利的。使用較高比特率模式能夠?qū)崿F(xiàn)更好的音頻質(zhì)量。
由于核心編解碼器對AMR-WB模式和AMR-WB+擴展模式使用6.4kHz的相同取樣率，并至少使用部分地類似的編碼技術(shù)，可以平滑地處理在這個頻帶從擴展模式到AMR-WB模式的變化，或者反之亦然。然而，由于ACELP核心波段編碼過程與AMR-WB模式和擴展模式稍有不同，在編碼器模式之間轉(zhuǎn)換時，不得不小心地存儲所有需要的狀態(tài)變量和緩沖器，并從一個算法復(fù)制到另一個算法。
此外，不得不考慮到變換模型僅可用于擴展模式。
為了編碼特定編碼幀，TCX模型使用了重疊窗口。這在圖1中舉例說明了。圖1是表示具有多個編碼幀和多個重疊分析窗口的時間線示圖。為了編碼一個TCX幀，使用了一個覆蓋了當(dāng)前TCX幀和先前的TCX幀的窗口。在該圖中用粗實線表示這樣的TCX幀11及相應(yīng)重疊窗口12。在該圖中用粗虛線表示下一個TCX幀13及相應(yīng)窗口14。即使實際上重疊通常較小，在所呈現(xiàn)的示例中，分析窗口重疊50％。
在AMR-WB擴展模式內(nèi)的典型操作中，在已經(jīng)編碼當(dāng)前幀之后，基于關(guān)于當(dāng)前幀的信息，生成各自的下一幀的重疊信號。
當(dāng)變換編碼模型用于當(dāng)前編碼幀時，由于該變換的分析窗口重疊，通過定義生成下一個編碼幀的重疊信號。
相反，ACELP編碼模型僅依靠來自當(dāng)前編碼幀的信息，也就是說，它不使用重疊窗口。如果一個ACELP編碼幀跟隨了一個TCX幀，則ACELP算法因此需要人為生成一個重疊信號，也就是說，加上目前的ACELP相關(guān)的處理。
圖2表示了擴展模式中的典型情況，其中，由于其緊跟著一個ACELP幀，不得不為一個TCX幀生成人為重疊信號。用粗虛線表示TCX幀23的ACELP編碼幀21和人為重疊信號22。用粗實線表示TCX幀23和來自TCX幀23的重疊信號24。如果一個ACELP幀跟隨了另一個ACELP幀，則由于ACELP編碼不需要來自先前編碼幀的任何重疊信號，所以不生成重疊信號。
在AMR-WB擴展模式中，ACELP模式中人為重疊信號的生成是固有的特征。因此，ACELP編碼和TCX之間的轉(zhuǎn)換是平滑的。
然而，當(dāng)AMR-WB+編解碼器從標(biāo)準(zhǔn)AMR-WB模式轉(zhuǎn)換到擴展模式時，還留下一個問題。由于這個編碼器模式中不需要重疊信號，標(biāo)準(zhǔn)AMR-WB模式不提供任何人為重疊信號的生成。因此，如果從AMR-WB模式轉(zhuǎn)換到擴展模式之后選擇的音頻信號幀是一個TCX幀，則編碼不能正確地執(zhí)行。作為結(jié)果，丟失的重疊信號部分將導(dǎo)致音頻信號的合成中聽得見的人為瑕疵。

發(fā)明內(nèi)容
本發(fā)明的一個目的是支持不同編碼器模式間的平滑轉(zhuǎn)換。
根據(jù)本發(fā)明的第一方面，提出了一種支持音頻信號編碼的方法，其中至少第一編碼器模式和第二編碼器模式可以用于編碼該音頻信號的各個部分。至少第二編碼器模式能夠基于至少兩種不同的編碼模型編碼該音頻信號的各個部分。該編碼模型的第一種僅需要來自該音頻信號的各個部分本身的信息來編碼該部分，而該編碼模型的第二種另外需要與來自該音頻信號先前部分的信息相重疊的信號來編碼該音頻信號的各個部分。在從第一編碼器模式轉(zhuǎn)換到第二編碼器模式之后，第一編碼模型用于編碼該音頻信號的第一部分。對該音頻信號的其它部分來說，選擇各自最適合的編碼模型。
此外，至少在為編碼該音頻信號的后續(xù)部分選擇了第二編碼模型的情況下，基于來自第一部分的信息生成人為重疊信號。各自所選的編碼模型隨后用于編碼其它部分。
根據(jù)本發(fā)明的第一方面，此外還提出了一種用于編碼音頻信號連續(xù)部分的模塊。該模塊包括適合編碼音頻信號各個部分的第一編碼器模式部分，和適合編碼音頻信號各個部分的第二編碼器模式部分。該模塊還包括適合在第一編碼器模式部分與第二編碼器模式部分之間轉(zhuǎn)換以編碼音頻信號的各個部分的轉(zhuǎn)換部分。第二編碼器模式部分包括適合為音頻信號的各個部分選擇至少兩種不同編碼模型之一的選擇部分，其中這些編碼模型的第一種僅需要來自音頻信號各個部分本身的信息來編碼該部分，而這些編碼模型的第二種另外需要與來自音頻信號先前部分的信息相重疊的信號來編碼該音頻信號的各個部分。該選擇部分還適合為音頻信號的第一部分在轉(zhuǎn)換到第二編碼器模式部分之后總是選擇第一編碼模型。該第二編碼器模式部分還包括適合基于由該選擇部分選擇的編碼模型編碼音頻信號的各個部分的編碼部分。該編碼部分至少在已經(jīng)為編碼音頻信號的后續(xù)部分選擇了第二編碼模型的情況下，還適合在轉(zhuǎn)換到第二編碼器模式部分之后生成與來自該音頻信號的第一部分的信息人為地相重疊的信號。
根據(jù)本發(fā)明的第一方面，此外還提出了一種包括具有所提出的模塊的特征的編碼器的電子設(shè)備。
根據(jù)本發(fā)明的第一方面，此外還提出了一種包括具有所提出的模塊的特征的編碼器并且另外還包括用于解碼連續(xù)編碼部分的解碼器的音頻編碼系統(tǒng)。
根據(jù)本發(fā)明的第一方面，最后提出了一種軟件程序產(chǎn)品，其中存儲了用于支持音頻信號編碼的軟件代碼。至少第一編碼器模式和第二編碼器模式可以用于編碼該音頻信號的各個部分，而至少第二編碼器模式能夠基于至少兩種不同的編碼模型編碼該音頻信號的各個部分。這些編碼模型的第一種僅需要來自該音頻信號的各個部分本身的信息來編碼該部分，而這些編碼模型的第二種另外需要與來自該音頻信號先前部分的信息相重疊的信號來編碼該音頻信號的各個部分。該軟件代碼在從第一編碼器模式轉(zhuǎn)換到第二編碼器模式之后，當(dāng)運行在一個編碼器的處理部件中時，實現(xiàn)了所提出的方法。
本發(fā)明的第一方面基于一種想法，即，可以為每個部分保證基于先前音頻信號部分的重疊信號的存在，如果這種編碼模型在一種特殊的編碼器模式中永遠不可以被選為音頻信號的第一部分的編碼模型的話，為每個部分選擇需要這樣的重疊信號的編碼模型。因此提出了在轉(zhuǎn)換到能夠使用需要重疊信號的編碼模型和不需要重疊信號的編碼模型的第二編碼器模式之后，總是選擇不需要重疊信號的編碼模型來編碼第一音頻信號部分。
本發(fā)明的第一方面的優(yōu)勢是，由于它防止使用無效的重疊信號，保證了從第一編碼器模式到第二編碼器模式的平滑轉(zhuǎn)換。
在第一編碼器模式只允許使用第一編碼模型的情況下，可以無需這樣一種防范而執(zhí)行從第二編碼器模式到第一編碼器模式的轉(zhuǎn)換。然而，對不同編碼模型的量化可能是不同的。如果在轉(zhuǎn)換之前沒有正確地初始化量化工具，由于不同的編碼方法，轉(zhuǎn)換后可能導(dǎo)致該音頻信號部分中聽得見的人為瑕疵。因此，在從第二編碼器模式轉(zhuǎn)換到第一編碼器模式之前保證正確地初始化量化工具是有利的。初始化可以包括，例如，提供存儲在某個緩沖器中的適當(dāng)?shù)某跏剂炕鲆妗?br> 本發(fā)明的第二方面是基于一種想法，通過在從第二編碼器模式轉(zhuǎn)換到第一編碼器模式之前保證第一編碼模型用于以第二編碼器模式編碼該音頻信號的最后部分。也就是說，當(dāng)作出要執(zhí)行從第二編碼器模式到第一編碼器模式的轉(zhuǎn)換的決定時，實際的轉(zhuǎn)換至少延時一個音頻信號部分。
根據(jù)本發(fā)明的第二方面，從而提出了一種支持音頻信號編碼的方法，其中至少第一編碼器模式和第二編碼器模式可以用于編碼該音頻信號的各個部分。至少第二編碼器模式能夠基于兩種不同的編碼模型編碼該音頻信號的各個部分。該編碼模型的第一種僅需要來自該音頻信號的各個部分本身的信息用于編碼該部分，而該編碼模型的第二種另外需要與來自該音頻信號先前部分的信息相重疊的信號來編碼該音頻信號的各個部分。在從第二編碼器模式轉(zhuǎn)換到第一編碼器模式之前，使用所述第一編碼模型以在轉(zhuǎn)換前編碼所述音頻信號的最后部分。
根據(jù)本發(fā)明的第二方面，此外還提出了一種用于編碼音頻信號連續(xù)部分的模塊。該模塊包括適合編碼音頻信號各個部分的第一編碼器模式部分，和適合編碼音頻信號各個部分的第二編碼器模式部分。該模塊還包括適合在第一編碼器模式部分與第二編碼器模式部分之間轉(zhuǎn)換以編碼音頻信號的各個部分的轉(zhuǎn)換部分。第二編碼器模式部分包括適合為音頻信號的各個部分選擇至少兩種不同編碼模型之一的選擇部分，其中這些編碼模型的第一種僅需要來自該音頻信號的各個部分本身的信息用于編碼該部分，而這些編碼模型的第二種另外需要與來自該音頻信號的先前部分的信息相重疊的信號來編碼該音頻信號的各個部分。該選擇部分還適合為音頻信號的最后的部分在轉(zhuǎn)換到第一編碼器模式部分之前總是選擇第一編碼器模型。
根據(jù)本發(fā)明的第二方面，此外還提出了一種電子設(shè)備，該電子設(shè)備包括具有本發(fā)明第二方面所提出模塊特征的編碼器。
根據(jù)本發(fā)明的第二方面，此外還提出了一種音頻編碼系統(tǒng)，該系統(tǒng)包括具有本發(fā)明第二方面所提出模塊功能的編碼器，以及此外用于解碼連續(xù)編碼部分的解碼器。
根據(jù)本發(fā)明的第二方面，最后提出了一種軟件程序產(chǎn)品，其中存儲了用于支持音頻信號編碼的軟件代碼。至少第一編碼器模式和第二編碼器模式可以用于編碼該音頻信號的各個部分，并且至少第二編碼器模式能夠基于至少兩種不同編碼模型編碼該音頻信號的各個部分。這些編碼模型的第一種僅需要來自該音頻信號各個部分本身的信息來編碼該部分，而這些編碼模型的第二種另外需要與來自該音頻信號先前部分的信息相重疊的信號來編碼該音頻信號的各個部分。該軟件代碼在從第二編碼器模式轉(zhuǎn)換到第一編碼器模式的情況下，當(dāng)運行在一個編碼器的處理部件中時實現(xiàn)了根據(jù)本發(fā)明第二部分所提出的方法。
因而，本發(fā)明的兩個方面是基于對平滑轉(zhuǎn)換能夠，通過在第二編碼器模式中超限運行第一編碼模型與第二編碼模型之間的常規(guī)選擇，分別在轉(zhuǎn)換后的音頻信號第一部分中或者轉(zhuǎn)換前的音頻信號最后部分中來實現(xiàn)的考慮。
要理解到，本發(fā)明的兩個方面能夠一起實現(xiàn)，但是同樣彼此互相獨立。
對本發(fā)明的兩個方面來說，第一編碼模型可以是，例如，基于時間域的編碼模型，如ACELP編碼模型，而第二編碼模型可以是，例如，基于頻率域的編碼模型，如TCX模型。此外，第一編碼器模式可以是，例如，AMR-WB+編解碼器的AMR-WB模式，而第二編碼器模式可以是，例如，該AMR-WB+編解碼器的擴展模式。
所提出的模塊可以用于本發(fā)明的兩個方面，例如，一個編碼器或者一個編碼器的一部分。
所提出的電子設(shè)備可以用于本發(fā)明的兩個方面，例如，移動通信設(shè)備或者某些其它需要低分類復(fù)雜性的移動設(shè)備。不過，要理解到，該電子設(shè)備同樣可以是一個非移動設(shè)備。
本發(fā)明的其它目的和特征將通過下面結(jié)合附圖考慮的詳細的說明而變得顯而易見。然而，要理解到，附圖的設(shè)計完全是為了說明的目的，而不是作為本發(fā)明的限制的定義，為此定義應(yīng)該參考所附權(quán)利要求書。還應(yīng)該理解到，附圖不是按比例繪制的，它們只是試圖概念性地說明本文中描述的結(jié)構(gòu)和過程。

圖1是說明TCX中使用的重疊窗口的示圖；圖2是說明在AMR-WB+模式中從ACELP編碼到TCX的常規(guī)轉(zhuǎn)換的示圖；圖3是根據(jù)本發(fā)明一種實施方式的系統(tǒng)的示意圖；圖4是說明圖3的系統(tǒng)中的操作的流程圖；以及圖5是說明圖3的實施方式中生成的重疊窗口的示圖。
具體實施例方式
圖3是根據(jù)本發(fā)明一種實施方式的音頻編碼系統(tǒng)的示意圖，該系統(tǒng)在AMR-WB+編碼器中實現(xiàn)AMR-WB模式與擴展模式的平滑過渡。
該系統(tǒng)包含包括一個AMR-WB+編碼器32的第一設(shè)備31和包括一個AMR-WB+解碼器52的第二設(shè)備51。第一設(shè)備31可以是，例如，一個移動設(shè)備或者一個非移動設(shè)備，例如一臺MMS服務(wù)器。第二設(shè)備51可以是，例如，一部移動電話或者某些其它移動設(shè)備，或者類似地在某些情況下同樣也可以是一個非移動設(shè)備。
AMR-WB+編碼器32包含一個適合執(zhí)行純粹的ACELP編碼的常規(guī)AMR-WB編碼部分34，和一個適合基于ACELP編碼模型或者基于TCX模型執(zhí)行編碼的擴展模式編碼部分35。
AMR-WB+編碼器32還包含一個用于轉(zhuǎn)發(fā)音頻信號幀到AMR-WB編碼部分34或者到擴展模式編碼部分35的轉(zhuǎn)換部分36。
轉(zhuǎn)換部分36為此目的包含一個過渡控制部分41，該部分適合接收來自某個估計部分(未示出)的轉(zhuǎn)換命令。轉(zhuǎn)換部分36還包含一個轉(zhuǎn)換元件42，它在過渡控制部分41的控制下將AMR-WB+編碼器32的信號輸入連接到AMR-WB編碼部分34或者連接到擴展模式編碼部分35。
擴展模式編碼部分35包含一個選擇部分43。與該擴展模式編碼部分35相關(guān)聯(lián)的轉(zhuǎn)換元件42的輸出端連接到選擇部分43的輸入。另外，過渡控制部分41對選擇部分43有一個控制接入，反之亦然。選擇部分的輸出還在擴展模式編碼部分35內(nèi)連接到一個ACELP/TCX編碼部分43。
要理解到，所表示的部分34到36和41到44是為編碼一個可能已經(jīng)從一個立體聲音頻信號中生成的單聲道音頻信號設(shè)計的。其它的立體聲信息可以在其它未示出的立體聲擴展部分中生成。此外，要注意到，編碼器32還包含未示出的部分。也要理解到，所表示的部分34到36和41到44不是不得不分開的部分，而是同樣能夠相互或者與其它部分交織在一起。
AMR-WB編碼部分34、擴展模式編碼部分35和轉(zhuǎn)換部分36可以特殊地由在編碼器32的處理部件33中運行的軟件SW實現(xiàn)，以虛線示出。
下面，將參考圖4的流程圖更詳細地描述AMR-WB+編碼器32中的處理。
AMR-WB+編碼器32接收已經(jīng)提供給第一設(shè)備31的一個音頻信號。該音頻信號以20ms的幀提供給AMR-WB編碼部分34或者擴展模式編碼部分35用于編碼。
該流程圖現(xiàn)在從轉(zhuǎn)換部分36提供該音頻信號的幀給AMR-WB編碼部分34用于實現(xiàn)低輸出比特率的情形繼續(xù)進行，例如由于在網(wǎng)絡(luò)連接的第一設(shè)備31和第二設(shè)備51中沒有足夠的容量。因而，音頻信號幀由AMR-WB編碼部分34利用ACELP編碼模型編碼，并提供給第二設(shè)備51用于傳輸。
現(xiàn)在，設(shè)備31的某個估計部分認識到網(wǎng)絡(luò)中的條件改變并允許較高的比特率。因此，該估計部分給轉(zhuǎn)換部分36的過渡控制部分41提供一個轉(zhuǎn)換命令。
如現(xiàn)在的情況，在該轉(zhuǎn)換命令表示需要從AMR-WB模式轉(zhuǎn)換到擴展模式的情況下，過渡控制部分41立即將該命令轉(zhuǎn)發(fā)到轉(zhuǎn)換元件42。于是，轉(zhuǎn)換元件42將進入的音頻信號幀提供給擴展模式編碼部分35而不是提供給AMR-WB編碼部分34。并行地，過渡控制部分41將一個超限運行命令提供給擴展模式編碼部分35的選擇部分42。
在擴展模式編碼部分35內(nèi)，選擇部分43為每個接收到的音頻信號幀確定應(yīng)該使用ACELP編碼模型或者TCX模型編碼該音頻信號幀。選擇部分43隨后將該音頻信號幀與所選編碼模型的指示一起轉(zhuǎn)發(fā)到ACELP/TCX編碼部分44。
當(dāng)選擇部分43接收到一個來自過渡控制部分41的超限運行命令時，它強行為同時接收到的音頻信號幀選擇ACELP編碼模型。從而，在從AMR-WB模式轉(zhuǎn)換后，選擇部分43將總是為第一接收到的音頻信號幀選擇ACELP編碼模型。
于是，根據(jù)所接收到的指示，由ACELP/TCX編碼部分44利用ACELP編碼模型編碼第一音頻信號幀。
此后，選擇部分34以開環(huán)方法或者以閉環(huán)方法為每個接收到的音頻信號幀確定應(yīng)該使用ACELP編碼模型或者TCX模型編碼該音頻信號幀。
于是，根據(jù)所選編碼模型的相關(guān)指示，由ACELP/TCX編碼部分44編碼各個音頻信號幀。
如對AMR-WB+的擴展模式所知的，在為后續(xù)音頻信號幀選擇了TCX模型的情況下，實際上各個ACELP的編碼接下來是生成重疊信號。
由于在任何情況下第一音頻信號幀都使用ACELP編碼模型編碼，因此保證了對第一TCX幀已經(jīng)有一個來自先前的音頻信號幀的重疊信號。
圖5中說明了從AMR-WB模式到擴展模式的過渡。圖5是一個表示具有在從AMR-WB模式轉(zhuǎn)換到擴展模式之前或之后處理的多個編碼幀的時間線的示圖。在時間線上，AMR-WB模式和擴展模式用垂直的虛線分開。
編碼幀61是在轉(zhuǎn)換之前以AMR-WB模式編碼的最后一個ACELP編碼幀。這個由AMR-WB編碼部分34編碼的ACELP編碼幀61接下來沒有生成重疊信號。后續(xù)編碼幀63是轉(zhuǎn)換之后在擴展模式編碼部分35中編碼的第一編碼幀。這個幀63強制為一個ACELP編碼幀。兩個ACELP編碼幀61、63的編碼排他地基于關(guān)于各個幀本身的信息，由虛線62、64指示。
下一個編碼幀65由選擇部分43選擇為一個TCX幀。TCX幀的正確編碼需要來自覆蓋該TCX幀65和先前的ACELP編碼幀63的至少一部分的重疊窗口的信息。因此，ACELP幀63的編碼接下來是生成這個TCX幀65的重疊信號，以是虛粗線的虛線64指示。覆蓋TCX幀65的重疊窗口部分以實粗線曲線66指示。
必須注意到，在TCX模型可以由使用大于20ms，例如40ms或80ms的編碼幀的選擇部分43選擇，并且需要覆蓋不只一個先前的音頻信號幀的重疊窗口的情況下，選擇部分43可能也在轉(zhuǎn)換之后為不只一個音頻信號幀強行選擇ACELP編碼模型。
如果設(shè)備31的估計部分稍后認識到再次需要較低的比特率，則它給轉(zhuǎn)換部分36提供另一個轉(zhuǎn)換命令。
如現(xiàn)在的情況，在該轉(zhuǎn)換命令表示從擴展模式轉(zhuǎn)換到AMR-WB模式的情況下，轉(zhuǎn)換部分36的過渡控制部分41立即輸出一個超限運行命令給擴展模式編碼部分35的選擇部分43。
由于該超限運行命令，選擇部分43這次再次為下一個接收到的音頻信號幀強行選擇ACELP編碼模型，為此自由選擇仍然可能。隨后，由ACELP/TCX編碼部分44根據(jù)所接收到的指示使用ACELP編碼模型編碼該音頻信號幀。
此外，在超限運行命令之后，只要可以為當(dāng)前接收到的音頻信號幀選擇ACELP編碼模型，選擇部分43就發(fā)送確認信號給過渡控制部分41。
擴展模式編碼部分35通常將以包含四個音頻信號幀的80ms特大幀為基礎(chǔ)處理所接收到的音頻信號幀。這使擴展模式編碼部分35能夠使用直到80ms的TCX幀，從而支持更好的音頻質(zhì)量。由于轉(zhuǎn)換命令的定時與音頻幀的定時互相獨立，在最壞的情況下，轉(zhuǎn)換命令可能剛好在選擇部分43為當(dāng)前的特大幀選擇了編碼模型之后的編碼過程期間給出。作為結(jié)果，由于通常僅可能為各個下一個特大幀的最后一個音頻信號幀自由選擇ACELP編碼模式，超限運行命令與確認信號之間的延時通常將至少為80ms。
僅在接收到確認信號之后，過渡控制部分41才轉(zhuǎn)發(fā)轉(zhuǎn)換命令給轉(zhuǎn)換元件42。
轉(zhuǎn)換元件42于是提供進入的音頻信號的幀給AMR-WB編碼部分34而不是給擴展模式編碼部分35。從而，轉(zhuǎn)換有至少一個，但通常有幾個音頻信號幀的延時。
延時的轉(zhuǎn)換和超限運行命令共同保證了由擴展模式編碼部分35編碼的最后一個音頻信號幀使用ACELP編碼模型編碼。作為結(jié)果，量化工具能夠在轉(zhuǎn)換到AMR-WB編碼部分34之前正確地被初始化。因此，可以避免轉(zhuǎn)換后第一幀中聽得見的人為瑕疵。
然后，AMR-WB編碼部分34使用ACELP編碼模型編碼接收到的音頻信號幀，并提供編碼幀以傳輸?shù)降诙O(shè)備51，直到轉(zhuǎn)換部分36接收到下一個轉(zhuǎn)換命令。
在第二設(shè)備51中，如果需要的話，解碼器52使用AMR-WB模式或者擴展模式解碼具有ACELP編碼模型或者TCX模型的所有接收到的編碼幀。例如，為表示給第二設(shè)備51的用戶而提供解碼的音頻信號幀。
在已經(jīng)示出、描述并指出了施加于其優(yōu)選的實施方式的本發(fā)明的基本的新穎特征的同時，將理解到，本領(lǐng)域的技術(shù)人員在不脫離本發(fā)明的精神的情況下，可以對所描述的設(shè)備和方法的形式和細節(jié)進行各種各樣的刪節(jié)、置換和改變。例如，意圖明確的是以完全相同的方式執(zhí)行完全相同的功能以實現(xiàn)相同結(jié)果的那些元件和/或方法步驟的所有組合都在本發(fā)明的范圍內(nèi)。此外，應(yīng)該認識到，結(jié)合本發(fā)明的任何公開形式或?qū)嵤┓绞绞境龅暮?或描述的結(jié)構(gòu)和/或元件和/或方法步驟可以作為設(shè)計選擇的一個普通內(nèi)容結(jié)合在任何其它公開的或描述的或建議的形式或?qū)嵤┓绞街?。因此，本發(fā)明僅受所附于此的權(quán)利要求書的范圍所指示的限制。
權(quán)利要求
1.一種用于支持音頻信號編碼的方法，其中至少第一編碼器模式和第二編碼器模式可以用于編碼所述音頻信號的各個部分，其中至少所述第二編碼器模式能夠基于至少兩種不同的編碼模型編碼所述音頻信號的各個部分，其中所述編碼模型的第一種僅需要來自所述音頻信號的各個部分本身的信息來編碼所述部分，而其中所述編碼模型的第二種另外需要與來自所述音頻信號先前部分的信息相重疊的信號來編碼所述音頻信號的各個部分，所述方法包括在從所述第一編碼器模式轉(zhuǎn)換到所述第二編碼器模式之后在所述轉(zhuǎn)換之后，將所述第一編碼模型用于編碼所述音頻信號的第一部分；為所述音頻信號的其它部分選擇各自最適合的編碼模型；至少在已經(jīng)選擇了所述第二編碼模型以編碼所述音頻信號的后續(xù)部分的情況下，基于來自所述第一部分的信息生成人為重疊信號；以及將各個所選的編碼模型用于編碼所述其它部分。
2.根據(jù)權(quán)利要求1所述的方法，還包括在從所述第一編碼器模式轉(zhuǎn)換到所述第二編碼器模式之前，使用所述第一編碼模型以在所述轉(zhuǎn)換前編碼所述音頻信號的最后部分。
3.根據(jù)權(quán)利要求1所述的方法，其中所述第一編碼器模式是擴展的自適應(yīng)多速率寬帶編解碼器的自適應(yīng)多速率寬帶模式，而其中所述第二編碼器模式是所述擴展的自適應(yīng)多速率寬帶編解碼器的擴展模式。
4.根據(jù)權(quán)利要求1所述的方法，其中所述第一編碼模型是代數(shù)碼激勵線性預(yù)測編碼模型而其中所述第二編碼模型是變換編碼模型。
5.一種用于支持由擴展的自適應(yīng)多速率寬帶編解碼器編碼音頻信號的方法，其中自適應(yīng)多速率寬帶模式和擴展模式可以用于編碼所述音頻信號的各個幀，其中所述擴展模式支持基于代數(shù)碼激勵線性預(yù)測編碼模型并基于變換編碼模型的所述音頻信號的各個幀的編碼，其中所述變換編碼模型需要與來自所述音頻信號先前的幀的信息相重疊的信號來編碼所述音頻信號的各個幀，所述方法包括在從所述自適應(yīng)多速率寬帶模式轉(zhuǎn)換到所述擴展模式之后在所述轉(zhuǎn)換之后，將所述代數(shù)碼激勵線性預(yù)測編碼模型用于編碼所述音頻信號的第一幀；為所述音頻信號的其它幀選擇各自最適合的編碼模型；至少在已經(jīng)選擇了所述變換編碼模型以編碼所述音頻信號的后續(xù)幀的情況下，基于來自所述第一幀的信息生成人為重疊信號；以及將各個所選的編碼模型用于編碼所述其它幀。
6.一種用于編碼音頻信號的連續(xù)部分的模塊，所述模塊包括一個適合編碼音頻信號各個部分的第一編碼器模式部分；一個適合編碼音頻信號各個部分的第二編碼器模式部分；以及一個適合在所述第一編碼器模式部分和所述第二編碼器模式部分之間轉(zhuǎn)換以編碼音頻信號的各個部分的轉(zhuǎn)換部分；所述第二編碼器模式部分包括適合為音頻信號的各個部分選擇至少兩種不同編碼模型之一的選擇部分，其中所述編碼模型的第一種僅需要來自音頻信號各個部分本身的信息來編碼所述部分，而其中所述編碼模型的第二種另外需要與來自音頻信號的先前部分的信息相重疊的信號來編碼所述音頻信號的各個部分，所述選擇部分還適合為音頻信號的第一部分在轉(zhuǎn)換到所述第二編碼器模式部分之后總是選擇所述第一編碼模型；以及所述第二編碼器模式部分包括適合基于由所述選擇部分選擇的編碼模型編碼音頻信號的各個部分的編碼部分，而所述編碼部分至少在已經(jīng)為編碼所述音頻信號的后續(xù)部分選擇了所述第二編碼模型的情況下，還適合在轉(zhuǎn)換到所述第二編碼器模式部分之后生成與來自音頻信號的第一部分的信息人為地相重疊的信號。
7.根據(jù)權(quán)利要求6所述的模塊，其中所述選擇部分還適合在由所述轉(zhuǎn)換部分從所述第一編碼器模式轉(zhuǎn)換到所述第二編碼器模式之前，選擇所述第一編碼模型以編碼所述音頻信號的最后部分。
8.根據(jù)權(quán)利要求6所述的模塊，其中所述第一編碼器模式部分適合以擴展的自適應(yīng)多速率寬帶編解碼器的自適應(yīng)多速率寬帶模式編碼音頻信號的各個部分，而其中所述第二編碼器模式部分適合以所述擴展的自適應(yīng)多速率寬帶編解碼器的擴展模式編碼音頻信號的各個部分。
9.根據(jù)權(quán)利要求6所述的模塊，其中所述第二編碼器模式部分適合將代數(shù)碼激勵線性預(yù)測編碼模型用作所述第一編碼模型，而將變換編碼模型用作所述第二編碼模型。
10.一種包括用于編碼音頻信號連續(xù)部分的編碼器的電子設(shè)備，該編碼器包括一個適合編碼音頻信號各個部分的第一編碼器模式部分；一個適合編碼音頻信號各個部分的第二編碼器模式部分；以及一個適合在所述第一編碼器模式部分和所述第二編碼器模式部分之間轉(zhuǎn)換以編碼音頻信號的各個部分的轉(zhuǎn)換部分；所述第二編碼器模式部分包括適合為音頻信號的各個部分選擇至少兩種不同編碼模型之一的選擇部分，其中所述編碼模型的第一種僅需要來自音頻信號各個部分本身的信息來編碼所述部分，而其中所述編碼模型的第二種另外需要與來自音頻信號的先前部分的信息相重疊的信號來編碼所述音頻信號的各個部分，所述選擇部分還適合為音頻信號的第一部分在轉(zhuǎn)換到所述第二編碼器模式部分之后總是選擇所述第一編碼模型；以及所述第二編碼器模式部分包括適合基于由所述選擇部分選擇的編碼模型編碼音頻信號的各個部分的編碼部分，而所述編碼部分至少在已經(jīng)為編碼所述音頻信號的后續(xù)部分選擇了所述第二編碼模型的情況下，還適合在轉(zhuǎn)換到所述第二編碼器模式部分之后生成與來自音頻信號的第一部分的信息人為地相重疊的信號。
11.根據(jù)權(quán)利要求10所述的電子設(shè)備，其中所述電子設(shè)備是一種移動設(shè)備。
12.根據(jù)權(quán)利要求10所述的電子設(shè)備，其中所述電子設(shè)備是一種移動通信設(shè)備。
13.一種包括用于編碼音頻信號連續(xù)部分的編碼器和用于解碼音頻信號的連續(xù)編碼部分的解碼器的音頻編碼系統(tǒng)，其中所述編碼器包括一個適合編碼音頻信號各個部分的第一編碼器模式部分；一個適合編碼音頻信號各個部分的第二編碼器模式部分；以及一個適合在所述第一編碼器模式部分和所述第二編碼器模式部分之間轉(zhuǎn)換以編碼音頻信號的各個部分的轉(zhuǎn)換部分；所述第二編碼器模式部分包括適合為音頻信號的各個部分選擇至少兩種不同編碼模型之一的選擇部分，其中所述編碼模型的第一種僅需要來自音頻信號各個部分本身的信息來編碼所述部分，而其中所述編碼模型的第二種另外需要與來自音頻信號的先前部分的信息相重疊的信號來編碼所述音頻信號的各個部分，所述選擇部分還適合為音頻信號的第一部分在轉(zhuǎn)換到所述第二編碼器模式部分之后總是選擇所述第一編碼模型；以及所述第二編碼器模式部分包括適合基于由所述選擇部分選擇的編碼模型編碼音頻信號的各個部分的編碼部分，而所述編碼部分至少在已經(jīng)為編碼所述音頻信號的后續(xù)部分選擇了所述第二編碼模型的情況下，還適合在轉(zhuǎn)換到所述第二編碼器模式部分之后生成與來自音頻信號的第一部分的信息人為地相重疊的信號。
14.一種軟件程序產(chǎn)品，其中存儲了用于支持音頻信號編碼的軟件代碼，其中至少第一編碼器模式和第二編碼器模式可以用于編碼所述音頻信號的各個部分，其中至少所述第二編碼器模式能夠基于至少兩種不同的編碼模型編碼所述音頻信號的各個部分，其中所述編碼模型的第一種僅需要來自所述音頻信號的各個部分本身的信息來編碼所述部分，而其中所述編碼模型的第二種另外需要與來自所述音頻信號先前部分的信息相重疊的信號來編碼所述音頻信號的各個部分，所述軟件代碼在從所述第一編碼器模式轉(zhuǎn)換到所述第二編碼器模式之后，當(dāng)運行在一個編碼器的處理部件中時實現(xiàn)下列步驟在所述轉(zhuǎn)換之后，將所述第一編碼模型用于編碼所述音頻信號的第一部分；為所述音頻信號的其它部分選擇各自最適合的編碼模型；至少在已經(jīng)選擇了所述第二編碼模型以編碼所述音頻信號的后續(xù)部分的情況下，基于來自所述第一部分的信息生成人為重疊信號；以及將各個所選的編碼模型用于編碼所述其它部分。
15.一種用于支持音頻信號編碼的方法，其中至少第一編碼器模式和第二編碼器模式可以用于編碼所述音頻信號的各個部分，其中至少所述第二編碼器模式能夠基于兩種不同的編碼模型編碼所述音頻信號的各個部分，其中所述編碼模型的第一種僅需要來自所述音頻信號的各個部分本身的信息來編碼所述部分，而其中所述編碼模型的第二種另外需要與來自所述音頻信號先前部分的信息相重疊的信號來編碼所述音頻信號的各個部分，所述方法包括在從所述第二編碼器模式轉(zhuǎn)換到所述第一編碼器模式之前，使用所述第一編碼模型以編碼所述音頻信號的最后部分。
16.根據(jù)權(quán)利要求15所述的方法，其中所述第一編碼器模式是擴展的自適應(yīng)多速率寬帶編解碼器的自適應(yīng)多速率寬帶模式，而其中所述第二編碼器模式是所述擴展的自適應(yīng)多速率寬帶編解碼器的擴展模式。
17.根據(jù)權(quán)利要求15所述的方法，其中所述第一編碼模型是代數(shù)碼激勵線性預(yù)測編碼模型而其中所述第二編碼模型是變換編碼模型。
18.一種用于支持由擴展的自適應(yīng)多速率寬帶編解碼器編碼音頻信號的方法其中自適應(yīng)多速率寬帶模式和擴展模式可以用于編碼所述音頻信號的各個幀，其中所述擴展模式支持基于代數(shù)碼激勵線性預(yù)測編碼模型并基于變換編碼模型的所述音頻信號的各個幀的編碼，其中所述變換編碼模型需要與來自所述音頻信號先前的幀的信息相重疊的信號來編碼所述音頻信號的各個幀，所述方法包括在從所述擴展模式轉(zhuǎn)換到所述自適應(yīng)多速率寬帶模式之前，使用所述代數(shù)碼激勵線性預(yù)測編碼模型以編碼所述音頻信號的最后部分。
19.一種用于編碼音頻信號的連續(xù)部分的模塊，所述模塊包括一個適合編碼音頻信號各個部分的第一編碼器模式部分；一個適合編碼音頻信號各個部分的第二編碼器模式部分；以及一個適合在所述第一編碼器模式部分和所述第二編碼器模式部分之間轉(zhuǎn)換以編碼音頻信號的各個部分的轉(zhuǎn)換部分；所述第二編碼器模式部分包括適合為音頻信號的各個部分選擇至少兩種不同編碼模型之一的選擇部分，其中所述編碼模型的第一種僅需要來自音頻信號各個部分本身的信息來編碼所述部分，而其中所述編碼模型的第二種另外需要與來自音頻信號的先前部分的信息相重疊的信號來編碼所述音頻信號的各個部分，所述選擇部分還適合為音頻信號的最后部分在轉(zhuǎn)換到所述第一編碼器模式部分之前總是選擇所述第一編碼器模型。
20.根據(jù)權(quán)利要求19所述的模塊，其中所述第一編碼器模式部分適合以擴展的自適應(yīng)多速率寬帶編解碼器的自適應(yīng)多速率寬帶模式編碼音頻信號的各個部分，而其中所述第二編碼器模式部分適合以所述擴展的自適應(yīng)多速率寬帶編解碼器的擴展模式編碼音頻信號的各個部分。
21.根據(jù)權(quán)利要求19所述的模塊，其中所述第二編碼器模式部分適合將代數(shù)碼激勵線性預(yù)測編碼模型用作所述第一編碼模型，而將變換編碼模型用作所述第二編碼模型。
22.一種包括用于編碼音頻信號連續(xù)部分的編碼器的電子設(shè)備，該編碼器包括一個適合編碼音頻信號各個部分的第一編碼器模式部分；一個適合編碼音頻信號各個部分的第二編碼器模式部分；以及一個適合在所述第一編碼器模式部分和所述第二編碼器模式部分之間轉(zhuǎn)換以編碼音頻信號的各個部分的轉(zhuǎn)換部分；所述第二編碼器模式部分包括適合為音頻信號的各個部分選擇至少兩種不同編碼模型之一的選擇部分，其中所述編碼模型的第一種僅需要來自音頻信號各個部分本身的信息來編碼所述部分，而其中所述編碼模型的第二種另外需要與來自音頻信號的先前部分的信息相重疊的信號來編碼所述音頻信號的各個部分，所述選擇部分還適合為音頻信號的最后部分在轉(zhuǎn)換到所述第一編碼器模式部分之前總是選擇所述第一編碼器模式。
23.根據(jù)權(quán)利要求22所述的電子設(shè)備，其中所述電子設(shè)備是一種移動設(shè)備。
24.根據(jù)權(quán)利要求22所述的電子設(shè)備，其中所述電子設(shè)備是一種移動通信設(shè)備。
25.一種包括用于編碼音頻信號連續(xù)部分的編碼器和用于解碼音頻信號的連續(xù)編碼部分的解碼器的音頻編碼系統(tǒng)，其中所述編碼器包括一個適合編碼音頻信號各個部分的第一編碼器模式部分；一個適合編碼音頻信號各個部分的第二編碼器模式部分；以及一個適合在所述第一編碼器模式部分和所述第二編碼器模式部分之間轉(zhuǎn)換以編碼音頻信號的各個部分的轉(zhuǎn)換部分；所述第二編碼器模式部分包括適合為音頻信號的各個部分選擇至少兩種不同編碼模型之一的選擇部分，其中所述編碼模型的第一種僅需要來自音頻信號各個部分本身的信息來編碼所述部分，而其中所述編碼模型的第二種另外需要與來自音頻信號的先前部分的信息相重疊的信號來編碼所述音頻信號的各個部分，所述選擇部分還適合為音頻信號的最后部分在轉(zhuǎn)換到所述第一編碼器模式部分之前總是選擇所述第一編碼器模型。
26.一種軟件程序產(chǎn)品，其中存儲了用于支持音頻信號編碼的軟件代碼，其中至少第一編碼器模式和第二編碼器模式可以用于編碼所述音頻信號的各個部分，其中至少所述第二編碼器模式能夠基于至少兩種不同的編碼模型編碼所述音頻信號的各個部分，其中所述編碼模型的第一種僅需要來自所述音頻信號的各個部分本身的信息來編碼所述部分，而其中所述編碼模型的第二種另外需要與來自所述音頻信號先前部分的信息相重疊的信號來編碼所述音頻信號的各個部分，所述軟件代碼在從所述第二編碼器模式轉(zhuǎn)換到所述第一編碼器模式之前，當(dāng)運行在一個編碼器的處理部件中時實現(xiàn)下列步驟在所述轉(zhuǎn)換之前，將所述第一編碼模型用于編碼所述音頻信號的最后部分。
全文摘要
本發(fā)明涉及一種用于支持音頻信號編碼的方法，其中第一編碼器模式和第二編碼器模式可以用于編碼音頻信號的各個部分。第二編碼器模式能夠基于僅需要來自各個部分本身的信息編碼該部分的第一編碼模型，并基于另外需要與來自先前部分的信息重疊的信號編碼各個部分的第二編碼模型，實現(xiàn)各個部分的編碼。在從第一編碼器模式轉(zhuǎn)換到第二編碼器模式之后，總是將第一編碼模型用于編碼該音頻信號的第一部分。這個部分隨后可以用于生成可能要用第二編碼模型編碼的后續(xù)部分的人為重疊信號。
文檔編號G10L19/14GK1954367SQ200580015903
公開日2007年4月25日申請日期2005年4月15日優(yōu)先權(quán)日2004年5月19日
發(fā)明者帕西·奧雅拉, 雅里·馬基南, 阿里·拉卡尼米申請人:諾基亞公司

完整全部詳細技術(shù)資料下載