音頻信號(hào)編碼方法和裝置的制作方法

文檔序號(hào)：2835925閱讀：226來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：音頻信號(hào)編碼方法和裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及通信領(lǐng)域，尤其涉及一種音頻信號(hào)編碼方法和裝置。
背景技術(shù)：
在音頻編碼時(shí)，由于比特率的限制和考慮到人耳的聽覺特性，所以優(yōu)先編碼低頻帶音頻信號(hào)的信息，而丟棄高頻帶音頻信號(hào)的信息。但隨著網(wǎng)絡(luò)技術(shù)的發(fā)展，網(wǎng)絡(luò)帶寬限制越來越小，同時(shí)隨著人們對音質(zhì)越來越高的要求,希望通過增加信號(hào)的帶寬而恢復(fù)高頻帶音頻信號(hào)的信息。由此提高音頻信號(hào)的音質(zhì)，可以通過帶寬擴(kuò)展(BandWidth Extension, BffE)技術(shù)實(shí)現(xiàn)。
帶寬擴(kuò)展可以擴(kuò)大音頻信號(hào)頻帶范圍、提高信號(hào)質(zhì)量，例如G. 729.1中的時(shí)域(Time Domain, TD)帶寬擴(kuò)展算法，活動(dòng)圖像專家組(Moving Picture Experts Group, MPEG)中的頻帶復(fù)制(Spectral Band Replication, SBR)技術(shù)，以及國際電信聯(lián)盟(International Telecommunication Union, ITU-T)G. 722B/G. 711.1D 中的頻域 (Frequency Domain, FD)帶寬擴(kuò)展算法。
圖1和圖2為現(xiàn)有技術(shù)的帶寬擴(kuò)展的示意圖，即無論低頻(如小于6. 4kHz)音頻信號(hào)的編碼是時(shí)域編碼(TD coding)或者頻域編碼(FD coding)，而高頻(如6. 4_16/14kHz) 音頻信號(hào)的帶寬擴(kuò)展都為時(shí)域帶寬擴(kuò)展(TD-BWE)或者都為頻域帶寬擴(kuò)展(FD-BWE)。
所以現(xiàn)有技術(shù)中，對于高頻的音頻信號(hào)的編碼只是時(shí)域帶寬擴(kuò)展的時(shí)域編碼或只是頻域帶寬擴(kuò)展的頻域編碼，而不會(huì)考慮低頻音頻信號(hào)的編碼方式，也不會(huì)考慮音頻信號(hào) 的特性。發(fā)明內(nèi)容
本發(fā)明實(shí)施例的音頻信號(hào)編碼方法和裝置，在帶寬擴(kuò)展時(shí)可以根據(jù)低頻信號(hào)的編碼方式和/或音頻信號(hào)的特點(diǎn)來對高頻音頻信號(hào)進(jìn)行編碼，實(shí)現(xiàn)自適應(yīng)編碼，而非固定編碼模式。
本發(fā)明實(shí)施例提供了一種音頻信號(hào)編碼方法，所述方法包括
將音頻信號(hào)分為高頻音頻信號(hào)和低頻音頻信號(hào)；
根據(jù)低頻音頻信號(hào)的特征對所述低頻音頻信號(hào)利用相應(yīng)的低頻編碼方式編碼；
根據(jù)所述低頻編碼方式和/或所述音頻信號(hào)的特征，選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼。
本發(fā)明實(shí)施例提供了一種音頻信號(hào)編碼裝置，所述裝置包括
劃分單元，用于將音頻信號(hào)分為高頻音頻信號(hào)和低頻音頻信號(hào)；
低頻信號(hào)編碼單元，用于根據(jù)低頻音頻信號(hào)的特征對所述低頻音頻信號(hào)利用相應(yīng) 的低頻編碼方式編碼；
高頻信號(hào)編碼單元，用于根據(jù)所述低頻編碼方式和/或所述音頻信號(hào)的特征，選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼。
本發(fā)明實(shí)施例音頻信號(hào)編碼方法和裝置可以根據(jù)低頻信號(hào)的編碼模式和/或音頻信號(hào)的特點(diǎn)來確定高頻音頻信號(hào)帶寬擴(kuò)展的編碼方式，避免帶寬擴(kuò)展時(shí)不考慮低頻信號(hào) 的編碼模式和音頻信號(hào)的特點(diǎn)，從而彌補(bǔ)帶寬擴(kuò)展局限于采用單一編碼模式，實(shí)現(xiàn)自適應(yīng) 的編碼，優(yōu)化音頻編碼質(zhì)量。

圖1為現(xiàn)有技術(shù)的帶寬擴(kuò)展的示意圖之一；圖2為現(xiàn)有技術(shù)的帶寬擴(kuò)展的示意圖之二；圖3為本發(fā)明實(shí)施例音頻信號(hào)編碼方法的流程圖；圖4為本發(fā)明實(shí)施例音頻信號(hào)編碼方法的帶寬擴(kuò)展示意圖之一；圖5為本發(fā)明實(shí)施例音頻信號(hào)編碼方法的帶寬擴(kuò)展示意圖之二；圖6為本發(fā)明實(shí)施例音頻信號(hào)編碼方法的帶寬擴(kuò)展示意圖之三；圖7為ITU-T G. 718中的分析窗示意圖；圖8為本發(fā)明音頻信號(hào)編碼方法的不同高頻音頻信號(hào)的加窗示意圖；圖9為本發(fā)明音頻信號(hào)編碼方法中基于高頻信號(hào)高延時(shí)窗的BWE示意圖；圖10為本發(fā)明音頻信號(hào)編碼方法中基于高頻信號(hào)零延時(shí)窗的BWE示意圖；圖11為本發(fā)明實(shí)施例音頻信號(hào)處理裝置的示意圖；圖12為本發(fā)明實(shí)施例另一音頻信號(hào)處理裝置的示意圖。
具體實(shí)施例方式下面通過附圖和實(shí)施例，對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。本發(fā)明實(shí)施例可以根據(jù)低頻帶音頻信號(hào)的編碼方式和音頻信號(hào)的特點(diǎn)來確定頻帶擴(kuò)展的方法是時(shí)域帶寬擴(kuò)展還是頻域帶寬擴(kuò)展。這樣當(dāng)?shù)皖l編碼是時(shí)域編碼時(shí)，高頻編碼可以是時(shí)域帶寬擴(kuò)展，也可以是頻域帶寬擴(kuò)展；而低頻編碼是頻域編碼時(shí)，高頻編碼可以是時(shí)域帶寬擴(kuò)展，也可以是頻域帶寬擴(kuò)展。圖3為本發(fā)明實(shí)施例音頻信號(hào)編碼方法的流程圖，如圖所示，本發(fā)明實(shí)施例音頻信號(hào)編碼方法具體包括如下步驟步驟101，將音頻信號(hào)分為高頻音頻信號(hào)和低頻音頻信號(hào)；因?yàn)榈皖l的音頻信號(hào)需要直接編碼，而高頻的音頻信號(hào)必須經(jīng)過帶寬擴(kuò)展來進(jìn)行編碼；步驟102，根據(jù)低頻音頻信號(hào)的特征對所述低頻音頻信號(hào)利用相應(yīng)的低頻編碼方式編碼；對低頻音頻信號(hào)編碼具有兩種方式，可以是時(shí)域編碼或頻域編碼方式，例如對于語音音頻信號(hào)，則利用時(shí)域編碼對低頻語音信號(hào)進(jìn)行編碼，而對于音樂音頻信號(hào)，則利用頻域編碼對低頻音樂信號(hào)進(jìn)行編碼；因?yàn)橥ǔ碇v說語音信號(hào)采用時(shí)域編碼的效果比較好，例如碼激勵(lì)線性預(yù)測(Code Excited Linear Prediction, CELP),而音樂信號(hào)采用頻域編碼的效果比較好，例如使用改進(jìn)離散余弦變換(Modified Discrete Cosine Transform, MDCT)或快速傅立葉變換(Fast Fourier Transform, FFT)等。
步驟103，根據(jù)低頻編碼方式或音頻信號(hào)的特征，選擇帶寬擴(kuò)展模式對高頻音頻信號(hào)編碼。
本步驟是說明了對高頻音頻信號(hào)編碼時(shí)的幾種可能性，一是根據(jù)低頻信號(hào)的編碼方式來決定高頻音頻信號(hào)的編碼方式，二是根據(jù)音頻信號(hào)的特征來對決定高頻音頻信號(hào)的編碼方式，三是同時(shí)參考低頻信號(hào)的編碼方式和音頻信號(hào)的特征來對決定高頻音頻信號(hào)的編碼方式。
低頻音頻信號(hào)的編碼方式可能是時(shí)域編碼或者頻域編碼，而音頻信號(hào)的特征可以是語音音頻信號(hào)或者音樂音頻信號(hào)，高頻音頻信號(hào)編碼方式可以是時(shí)域帶寬擴(kuò)展模式或者頻域帶寬擴(kuò)展模式，對于高頻音頻信號(hào)的帶寬擴(kuò)展需要參考低頻音頻信號(hào)的編碼方式或音頻信號(hào)特征來編碼。
根據(jù)所述低頻編碼方式或所述音頻信號(hào)的特征，選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼，選擇的帶寬擴(kuò)展模式與低頻編碼方式或音頻信號(hào)的特征對應(yīng)，屬于同一個(gè)域編碼方式。
一個(gè)實(shí)施例中，所選擇的帶寬擴(kuò)展模式與低頻編碼方式對應(yīng)當(dāng)?shù)皖l音頻信號(hào)采用時(shí)域編碼方式時(shí)，選擇時(shí)域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行時(shí)域編碼；當(dāng)?shù)皖l音頻信號(hào)采用頻域編碼方式，選擇頻域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行頻域編碼。即高頻音頻信號(hào)的編碼方式與低頻編碼方式屬于同一個(gè)域編碼方式(時(shí)域編碼或者頻域編碼)。
另一個(gè)實(shí)施例中，與音頻信號(hào)特征適合的低頻編碼方式對應(yīng)當(dāng)音頻信號(hào)為語音信號(hào)時(shí)，選擇時(shí)域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行時(shí)域編碼；當(dāng)音頻信號(hào)為音樂信號(hào)時(shí)，選擇頻域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行頻域編碼。即高頻音頻信號(hào)的編碼方式與音頻信號(hào)特征適合的低頻編碼方式屬于同一個(gè)域編碼方式(時(shí)域編碼或者頻域編碼)。
另一個(gè)實(shí)施例中，綜合考慮低頻編碼方式和音頻信號(hào)的特征，選擇帶寬擴(kuò)展模式對高頻音頻信號(hào)編碼當(dāng)?shù)皖l音頻信號(hào)為時(shí)域編碼方式，且音頻信號(hào)為語音信號(hào)時(shí)，選擇時(shí)域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行時(shí)域編碼；否則選擇頻域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行頻域編碼。
參見圖4的本發(fā)明實(shí)施例音頻信號(hào)編碼方法的帶寬擴(kuò)展示意圖之一所示，低頻音頻信號(hào)，例如0-6. 4kHz的音頻信號(hào)可能是TD coding或者FD c oding，而高頻音頻信號(hào)，例如6. 4-16/14kHz的音頻信號(hào)的帶寬擴(kuò)展可能是TD-BWE或者FD-BWE。
也就是說本發(fā)明實(shí)施例的音頻信號(hào)編碼方法中，低頻音頻信號(hào)的編碼方式與高頻信號(hào)的帶快擴(kuò)展之間沒有一一對應(yīng)的關(guān)系。例如，如果低頻音頻信號(hào)是TD coding，其高頻音頻信號(hào)的帶寬擴(kuò)展既可能是TD-BWE，也可能是FD-BWE ;而如果低頻音頻信號(hào)是TD coding，其高頻音頻信號(hào)的帶寬擴(kuò)展同樣可能是TD-BWE，也可能是FD-BWE。
具體的，一種選擇帶寬擴(kuò)展模式對高頻音頻信號(hào)編碼的方式是根據(jù)低頻音頻信號(hào)的低頻編碼方式進(jìn)行處理，一并參見圖5的本發(fā)明實(shí)施例音頻信號(hào)編碼方法的帶寬擴(kuò)展示意圖之二所示，低頻(0-6. 4kHz)音頻信號(hào)是時(shí)域編碼TD coding時(shí)，高頻￠. 4_16/14kHz) 音頻信號(hào)同樣也是時(shí)域帶寬擴(kuò)展TD-BWE的時(shí)域編碼；低頻(0-6. 4kHz)音頻信號(hào)是頻域編碼FD coding時(shí)，高頻(6. 4-16/14kHz)音頻信號(hào)同樣也是頻域帶寬擴(kuò)展FD-BWE的頻域編碼。
所以高頻音頻信號(hào)編碼的方式與低頻音頻信號(hào)的編碼方式是屬于相同域的，而不參考音頻信號(hào)/低音音頻信號(hào)的特征，也就是說高頻音頻信號(hào)的編碼參照低頻音頻信號(hào)編碼的方式進(jìn)行處理的，與音頻信號(hào)/低音音頻信號(hào)的特征無關(guān)。
因此，根據(jù)低頻信號(hào)的編碼方式來確定高頻音頻信號(hào)帶寬擴(kuò)展的編碼方式，避免帶寬擴(kuò)展時(shí)不考慮低頻音頻信號(hào)的編碼方式，彌補(bǔ)帶寬擴(kuò)展對不同音頻信號(hào)編碼質(zhì)量的局限性，實(shí)現(xiàn)自適應(yīng)的編碼，優(yōu)化音頻編碼質(zhì)量。
另外一種選擇帶寬擴(kuò)展模式對高頻音頻信號(hào)編碼的方式，是根據(jù)音頻信號(hào)或者低頻音頻信號(hào)的特征來處理。例如如果音頻信號(hào)/低頻音頻信號(hào)是語音音頻信號(hào)，則利用時(shí) 域編碼對高頻音頻信號(hào)進(jìn)行編碼，而如果音頻信號(hào)/低頻音頻信號(hào)是音樂音頻信號(hào)，則利用頻域編碼對高頻音頻信號(hào)進(jìn)行編碼。
同時(shí)參見圖4所示，高頻音頻信號(hào)帶寬擴(kuò)展的編碼只參考音頻信號(hào)/低音音頻信號(hào)的特征，而無論低頻音頻信號(hào)的編碼方式，所以低頻音頻信號(hào)是時(shí)域編碼時(shí)，高頻音頻信號(hào)可能是時(shí)域編碼也可能是頻域編碼，而低頻音頻信號(hào)是頻域編碼時(shí)，高頻音頻信號(hào)可能是頻域編碼也可能是時(shí)域編碼。
因此，根據(jù)音頻信號(hào)/低頻信號(hào)的特點(diǎn)來確定高頻音頻信號(hào)帶寬擴(kuò)展的編碼方式，避免帶寬擴(kuò)展時(shí)不考慮音頻信號(hào)/低頻音頻信號(hào)的特點(diǎn)，彌補(bǔ)帶寬擴(kuò)展對不同音頻信號(hào)編碼質(zhì)量的局限性，實(shí)現(xiàn)自適應(yīng)的編碼，優(yōu)化音頻編碼質(zhì)量。
再有一種選擇帶寬擴(kuò)展模式對高頻音頻信號(hào)編碼的方式，既要根據(jù)低頻音頻信號(hào) 的編碼方式也要根據(jù)音頻信號(hào)/低頻音頻信號(hào)的特征。例如當(dāng)?shù)皖l音頻信號(hào)為時(shí)域編碼方式，而且音頻信號(hào)/低頻音頻信號(hào)為語音信號(hào)時(shí)，選擇時(shí)域帶寬擴(kuò)展模式對高頻音頻信號(hào) 進(jìn)行時(shí)域編碼；而當(dāng)?shù)皖l音頻信號(hào)為頻域編碼方式，或者低頻音頻信號(hào)為時(shí)域編碼方式，且音頻信號(hào)/低頻音頻信號(hào)為音樂信號(hào)時(shí)，選擇頻域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行頻域編碼。
圖6為本發(fā)明實(shí)施例音頻信號(hào)編碼方法的帶寬擴(kuò)展示意圖之三，如圖所示，當(dāng)?shù)?頻(6. 4-16/14kHz)音頻信號(hào)為時(shí)域編碼TD coding時(shí)，高頻(6. 4_16/14kHz)音頻信號(hào)可以是頻域帶寬擴(kuò)展FD-BWE的頻域編碼，也可以是時(shí)域帶寬擴(kuò)展TD-BWE的時(shí)域編碼；而當(dāng)?shù)?頻(6. 4-16/14kHz)音頻信號(hào)為頻域編碼FD coding時(shí)，高頻(6. 4-16/14kHz)音頻信號(hào)同樣是頻域帶寬擴(kuò)展FD-BWE的頻域編碼。
因此，根據(jù)低頻信號(hào)的編碼模式和音頻信號(hào)/低頻信號(hào)的特點(diǎn)來確定高頻音頻信號(hào)帶寬擴(kuò)展的編碼方式，避免帶寬擴(kuò)展時(shí)不考慮低頻信號(hào)的編碼模式和音頻信號(hào)/低頻音頻信號(hào)的特點(diǎn)，彌補(bǔ)帶寬擴(kuò)展對不同音頻信號(hào)編碼質(zhì)量的局限性，實(shí)現(xiàn)自適應(yīng)的編碼，優(yōu)化音頻編碼質(zhì)量。
本發(fā)明實(shí)施例音頻信號(hào)的編碼方法中對于低頻音頻信號(hào)的編碼方式可以是時(shí)域編碼或者頻域編碼，而帶寬擴(kuò)展方法也是兩種，時(shí)域帶寬擴(kuò)展和頻域帶寬擴(kuò)展，可以對應(yīng)不同的低頻帶編碼方式。
時(shí)域帶寬擴(kuò)展和頻域帶寬擴(kuò)展有可能延時(shí)不同，所以需要延時(shí)對齊，以達(dá)到統(tǒng)一的延時(shí)。
假設(shè)所有低頻音頻信號(hào)編碼延時(shí)相同，這樣時(shí)域帶寬擴(kuò)展和頻域帶寬擴(kuò)展的延時(shí) 最好也相同，通常時(shí)域帶寬擴(kuò)展的延時(shí)是固定的，而頻域帶寬擴(kuò)展的延時(shí)是可調(diào)的，所以可以通過調(diào)整頻域帶寬擴(kuò)展的延時(shí)來實(shí)現(xiàn)延時(shí)統(tǒng)一。
本發(fā)明實(shí)施例可以實(shí)現(xiàn)相對于解碼低頻信號(hào)的零延時(shí)帶寬擴(kuò)展，此處零延時(shí)是相對于低頻帶而言，因?yàn)榉菍ΨQ窗本身是有延時(shí)的。而且本發(fā)明實(shí)施例可以對高頻帶信號(hào)進(jìn)行不同的加窗，此處采用的是非對稱的窗，如圖7所示的ITU-T G. 718中的分析窗。而且可以實(shí)現(xiàn)從相對于解碼低頻信號(hào)的零延時(shí)到相對于解碼低頻信號(hào)的高頻窗自身延時(shí)之間的任一延時(shí)，如圖8所示。
圖8為本發(fā)明音頻信號(hào)編碼方法的不同高頻音頻信號(hào)的加窗示意圖，如圖所示，對于不同巾貞(frame),例如對于(m_l) frame、(m) frame和(m+1) frame,可以實(shí)現(xiàn)高頻信號(hào)高延時(shí)窗(High delay windowing)、高頻信號(hào)低延時(shí)窗(Low delay windowing)和高頻信號(hào)零延時(shí)窗(Zero delay windowing)。這里高頻信號(hào)各延時(shí)窗并沒有考慮窗本身的延時(shí),只是考慮不同的高頻信號(hào)的加窗方式。
圖9為本發(fā)明音頻信號(hào)編碼方法中高頻信號(hào)高延時(shí)窗的BWE示意圖，如圖所示，當(dāng)輸入幀的低頻音頻信號(hào)完全解碼后，用解碼后的低頻音頻信號(hào)作為高頻激勵(lì)信號(hào)，輸入幀高頻音頻信號(hào)的加窗是根據(jù)輸入幀低頻音頻信號(hào)解碼的延時(shí)來確定。
例如，編解碼的低頻音頻信號(hào)延時(shí)為Dims，在編碼端Encoder對高頻音頻信號(hào)進(jìn)行時(shí)頻變換時(shí)，將延時(shí)Dims的高頻音頻信號(hào)進(jìn)行時(shí)頻變換，而高頻音頻信號(hào)的加窗變換會(huì)產(chǎn)生D2毫秒的延時(shí)，所以在解碼端Decoder解碼的高頻帶信號(hào)的總延時(shí)為D1+D2毫秒；這樣相對解碼的低頻音頻信號(hào)，高頻音頻信號(hào)有額外D2毫秒延時(shí)，即解碼的低頻音頻信號(hào)需要額外延時(shí)D2毫秒和解碼的高頻音頻信號(hào)對齊，輸出信號(hào)總延時(shí)為D1+D2。而在解碼端，因?yàn)楦哳l激勵(lì)信號(hào)需要從低頻音頻信號(hào)的預(yù)測中得到，所以對解碼端的低頻音頻信號(hào)和編碼端的高頻音頻信號(hào)來說，均做同樣的時(shí)頻變換處理，而由于編碼端的高頻音頻信號(hào)和解碼端的低頻音頻信號(hào)都是對延時(shí)Dl毫秒后的音頻信號(hào)做時(shí)頻變換，因此激勵(lì)信號(hào)是對齊的。
圖10為本發(fā)明首頻彳目號(hào)編碼方法中聞?lì)l彳目號(hào)零延時(shí)窗BWE 意圖，如圖所不,是編碼端對當(dāng)前接收的幀的高頻音頻信號(hào)直接進(jìn)行加窗，解碼端時(shí)頻變換處理用當(dāng)前幀解碼的低頻音頻信號(hào)作為激勵(lì)信號(hào)，雖然激勵(lì)信號(hào)可能會(huì)有一定錯(cuò)位，但是經(jīng)過對激勵(lì)信號(hào)進(jìn)行修正，錯(cuò)位的影響可以忽略不計(jì)。
例如，解碼的低頻帶信號(hào)延時(shí)為Dl毫秒，而編碼端對高頻帶信號(hào)做時(shí)頻變換時(shí)不做延時(shí)處理，而只是由于高頻信號(hào)加窗變換會(huì)產(chǎn)生D2毫秒的延時(shí)，所以在解碼端解碼的高頻帶信號(hào)的總延時(shí)為D2毫秒。
當(dāng)Dl等于D2時(shí)，解碼的低頻音頻信號(hào)不需要額外延時(shí)即能和解碼的高頻音頻信號(hào)對齊；但在解碼端預(yù)測高頻帶激勵(lì)信號(hào)是從對延時(shí)Dl毫秒后的低頻音頻信號(hào)做時(shí)頻變換得到的頻域信號(hào)中得到的，所以，高頻激勵(lì)信號(hào)和低頻激勵(lì)信號(hào)沒有對齊，具有Dl毫秒的錯(cuò)位。解碼信號(hào)相對于編碼端信號(hào)總體延時(shí)是Dl或者D2。
當(dāng)Dl不等于D2時(shí)，例如Dl小于D2時(shí)，解碼信號(hào)相對于編碼端信號(hào)總體延時(shí)是D2 毫秒，高頻激勵(lì)信號(hào)和低頻激勵(lì)信號(hào)之間的錯(cuò)位是Dl毫秒，解碼的低頻音頻信號(hào)需要額外延時(shí)(D2-D1)毫秒和解碼的高頻音頻信號(hào)對齊。如Dl大于D2時(shí)，這樣解碼信號(hào)相對于編碼端信號(hào)總體延時(shí)是Dl毫秒，高頻激勵(lì)信號(hào)和低頻激勵(lì)信號(hào)之間的錯(cuò)位是Dl毫秒，解碼的高頻音頻信號(hào)需要額外延時(shí)(D1-D2)毫秒和解碼的低頻音頻信號(hào)對齊。
介于如上高頻信號(hào)零延時(shí)窗和高延時(shí)窗之間的BWE，是編碼端對當(dāng)前接收的幀的高頻音頻信號(hào)延時(shí)D3毫秒后進(jìn)行加窗，該延時(shí)介于O和Dl毫秒之間，解碼端時(shí)頻變換處理用低頻音頻信號(hào)當(dāng)前幀解碼信號(hào)作為激勵(lì)信號(hào)，雖然激勵(lì)信號(hào)可能會(huì)有一定錯(cuò)位，但是經(jīng) 過對激勵(lì)信號(hào)進(jìn)行修正，錯(cuò)位的影響可以忽略不計(jì)。
當(dāng)Dl等于D2時(shí)，解碼的低頻音頻信號(hào)需要額外延時(shí)D3毫秒和解碼的高頻音頻信號(hào)對齊；但在解碼端預(yù)測高頻帶激勵(lì)信號(hào)是從對延時(shí)Dl毫秒后的低頻音頻信號(hào)做時(shí)頻變換得到的頻域信號(hào)中得到的，所以，高頻激勵(lì)信號(hào)和低頻激勵(lì)信號(hào)沒有對齊，具有(D1-D3) 毫秒的錯(cuò)位。解碼信號(hào)相對于編碼端信號(hào)總體延時(shí)是(D2+D3)或者(D1+D3)毫秒。
當(dāng)Dl不等于D2時(shí)，例如Dl小于D2時(shí)，解碼信號(hào)相對于編碼端信號(hào)總體延時(shí)是 (D2+D3)毫秒，高頻激勵(lì)信號(hào)和低頻激勵(lì)信號(hào)之間的錯(cuò)位是(D1-D3)毫秒，解碼的低頻音頻信號(hào)需要額外延時(shí)(D2+D3-D1)毫秒和解碼的高頻音頻信號(hào)對齊。
如Dl大于D2時(shí)，這樣解碼信號(hào)相對于編碼端信號(hào)總體延時(shí)是max (Dl, D2+D3)毫秒，高頻激勵(lì)信號(hào)和低頻激勵(lì)信號(hào)之間的錯(cuò)位是(D1-D3)毫秒，其中max(a，b)表示取a 和b的較大的一個(gè)值。當(dāng)max(Dl，D2+D3) = D2+D3時(shí)，解碼的低頻音頻信號(hào)需要額外延時(shí)(D2+D3-D1)毫秒和解碼的高頻音頻信號(hào)對齊，當(dāng)max(Dl，D2+D3) = Dl時(shí)，解碼的高頻音頻信號(hào)需要額外延時(shí)(D1-D2-D3)毫秒和解碼的低頻音頻信號(hào)對齊；舉一特例，當(dāng)D3 = (D1-D2)毫秒，這樣解碼信號(hào)相對于編碼端信號(hào)總體延時(shí)是Dl毫秒，高頻激勵(lì)信號(hào)和低頻激勵(lì)信號(hào)之間的錯(cuò)位是D2毫秒，此時(shí)解碼的低頻音頻信號(hào)不需要額外延時(shí)即能和解碼的高頻音頻信號(hào)對齊。
所以，本發(fā)明實(shí)施例在時(shí)域帶寬擴(kuò)展中需要對頻域帶寬擴(kuò)展的狀態(tài)保持更新，因為下一幀有可能是頻域帶寬擴(kuò)展，同理在頻域帶寬擴(kuò)展中需要對時(shí)域帶寬擴(kuò)展的狀態(tài)保持更新，因?yàn)榈较乱粠锌赡苁菚r(shí)域帶寬擴(kuò)展，由此通過這種方法來實(shí)現(xiàn)帶寬切換的連續(xù)性。
以上實(shí)施例是對于本發(fā)明音頻信號(hào)編碼方法的，同樣，可以利用音頻信號(hào)處理裝置來實(shí)現(xiàn)。圖11為本發(fā)明實(shí)施例音頻信號(hào)處理裝置的示意圖，如圖所示，本發(fā)明實(shí)施例信號(hào)處理裝置具體包括劃分單元11、低頻信號(hào)編碼單元12和高頻信號(hào)編碼單元13。
劃分單元11用于將音頻信號(hào)分為高頻音頻信號(hào)和低頻音頻信號(hào)；低頻信號(hào)編碼單元12用于根據(jù)低頻音頻信號(hào)的特征對所述低頻音頻信號(hào)利用相應(yīng)的低頻編碼方式編碼；而編碼方式可以是時(shí)域編碼或頻域編碼方式，例如對于語音音頻信號(hào)，利用時(shí)域編碼對低頻語音信號(hào)進(jìn)行編碼，而對于音樂音頻信號(hào)，利用頻域編碼對低頻音樂信號(hào)進(jìn)行編碼。因為通常來講說語音信號(hào)采用時(shí)域編碼的效果比較好，而音樂信號(hào)采用頻域編碼的效果比較好。
高頻信號(hào)編碼單元13用于根據(jù)所述低頻編碼方式和/或所述音頻信號(hào)的特征，選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼。
具體的，如果低頻信號(hào)編碼單元12采用時(shí)域編碼，則高頻信號(hào)編碼單元13選擇時(shí) 域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行時(shí)域或頻域編碼；而如果低頻信號(hào)編碼單元12 采用頻域編碼，則高頻信號(hào)編碼單元13選擇頻域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行時(shí)域或頻域編碼。
另外，如果音頻信號(hào)/低頻音頻信號(hào)是語音音頻信號(hào)，則高頻信號(hào)編碼單元13利用時(shí)域編碼對高頻頻語音信號(hào)進(jìn)行編碼，而如果音頻信號(hào)/低頻音頻信號(hào)是音樂音頻信號(hào)，則高頻信號(hào)編碼單元13利用頻域編碼對高頻頻音樂信號(hào)進(jìn)行編碼。此時(shí)不考慮低頻音頻信號(hào)的編碼模式。
再有，當(dāng)?shù)皖l信號(hào)編碼單元12對低頻音頻信號(hào)采用時(shí)域編碼方式，而且音頻信號(hào) /低頻音頻信號(hào)為語音信號(hào)時(shí)，高頻信號(hào)編碼單元13選擇時(shí)域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行時(shí)域編碼；而當(dāng)?shù)皖l信號(hào)編碼單元12對低頻音頻信號(hào)采用頻域編碼方式，或者低頻信號(hào)編碼單元12對低頻音頻信號(hào)采用時(shí)域編碼方式，且音頻信號(hào)/低頻音頻信號(hào)為音樂信號(hào)時(shí)，選擇頻域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行頻域編碼。
圖12為本發(fā)明實(shí)施例另一音頻信號(hào)處理裝置的示意圖，如圖所示，本發(fā)明實(shí)施例信號(hào)處理裝置還具體包括低頻信號(hào)解碼單元14。
低頻信號(hào)解碼單元14用于對低頻音頻信號(hào)解碼；低頻音頻信號(hào)編解碼產(chǎn)生第一延時(shí)D1。
具體的，如果高頻音頻信號(hào)有延時(shí)窗時(shí)，高頻信號(hào)編碼單元13用于對高頻音頻信號(hào)進(jìn)行第一延時(shí)Dl后編碼，高頻音頻信號(hào)編碼產(chǎn)生第二延時(shí)D2 ;使得音頻信號(hào)編解碼延時(shí) 是第一延時(shí)Dl和第二延時(shí)D2之和(D1+D2)。
如果高頻音頻信號(hào)沒有延時(shí)窗時(shí)，高頻信號(hào)編碼單元13用于對高頻音頻信號(hào)編碼，高頻音頻信號(hào)編碼產(chǎn)生第二延時(shí)D2 ;當(dāng)?shù)谝谎訒r(shí)Dl小于等于第二延時(shí)D2時(shí)，低頻信號(hào) 編碼單元12對低頻音頻信號(hào)編碼后延時(shí)第二延時(shí)D2與第一延時(shí)Dl之差(D2-D1)，使得音頻信號(hào)編解碼延時(shí)是第二延時(shí)D2 ;當(dāng)?shù)谝谎訒r(shí)Dl大于第二延時(shí)D2時(shí)，低頻信號(hào)編碼單元 12對高頻音頻信號(hào)對高頻音頻信號(hào)編碼后延時(shí)第一延時(shí)Dl與第二延時(shí)D2之差(D1-D2)；使得音頻信號(hào)編解碼延時(shí)是第一延時(shí)Dl。
如果高頻音頻信號(hào)為中間延時(shí)窗時(shí)，高頻信號(hào)編碼單元13用于對高頻音頻信號(hào) 進(jìn)行第三延時(shí)D3后編碼，高頻音頻信號(hào)編碼產(chǎn)生第二延時(shí)D2 ；當(dāng)?shù)谝粫r(shí)延小于等于第二時(shí) 延時(shí)，低頻信號(hào)編碼單元12對低頻音頻信號(hào)編碼后延時(shí)第二延時(shí)D2和第三延時(shí)D3與第一延時(shí)Dl之差(D2+D3-D1)，使得音頻信號(hào)編解碼延時(shí)是第二延時(shí)D2和第三延時(shí)D3之和 (D2+D3);當(dāng)?shù)谝粫r(shí)延大于第二時(shí)延時(shí)，具有兩種可能性，如果第一延時(shí)Dl大于等于第二延時(shí)D2和第三延時(shí)D3之和(D2+D3)，高頻信號(hào)編碼單元13對高頻音頻信號(hào)編碼后延時(shí)第一延時(shí)Dl與第二延時(shí)D2、第三延時(shí)D3和之差(D1-D2-D3)，如果第一延時(shí)Dl小于第二延時(shí)D2 和第三延時(shí)D3之和(D2+D3)，低頻信號(hào)編碼單元12對低頻音頻信號(hào)編碼后延時(shí)第二延時(shí) D2加第三延時(shí)D3與第一延時(shí)Dl之差(D2+D3-D1)，使得音頻信號(hào)編解碼延時(shí)是第一延時(shí)Dl 或第二延時(shí)D2和第三延時(shí)D3之和(D2+D3)。
因此，本發(fā)明實(shí)施例音頻信號(hào)編碼裝置可以根據(jù)低頻信號(hào)的編碼模式和/或音頻信號(hào)/低頻信號(hào)的特點(diǎn)來確定高頻音頻信號(hào)帶寬擴(kuò)展的編碼方式，避免帶寬擴(kuò)展時(shí)不考慮低頻信號(hào)的編碼模式和音頻信號(hào)/低頻音頻信號(hào)的特點(diǎn)，彌補(bǔ)帶寬擴(kuò)展對不同音頻信號(hào)編碼質(zhì)量的局限性，實(shí)現(xiàn)自適應(yīng)的編碼，優(yōu)化音頻編碼質(zhì)量。
專業(yè)人員應(yīng)該還可以進(jìn)一步意識(shí)到，結(jié)合本文中所公開的實(shí)施例描述的各示例的單元及算法步驟，能夠以電子硬件、計(jì)算機(jī)軟件或者二者的結(jié)合來實(shí)現(xiàn)，為了清楚地說明硬件和軟件的可互換性，在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行，取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對每個(gè)特定的應(yīng)用來使用不同方法來實(shí)現(xiàn)所描述的功能，但是這種實(shí)現(xiàn) 不應(yīng)認(rèn)為超出本發(fā)明的范圍。
結(jié)合本文中所公開的實(shí)施例描述的方法或算法的步驟可以用硬件、處理器執(zhí)行的軟件模塊，或者二者的結(jié)合來實(shí)施。軟件模塊可以置于隨機(jī)存儲(chǔ)器(RAM)、內(nèi)存、只讀存儲(chǔ)器 (ROM)、電可編程ROM、電可擦除可編程ROM、寄存器、硬盤、可移動(dòng)磁盤、CD-ROM、或技術(shù)領(lǐng)域內(nèi)所公知的任意其它形式的存儲(chǔ)介質(zhì)中。
以上所述的具體實(shí)施方式
，對本發(fā)明的目的、技術(shù)方案和有益效果進(jìn)行了進(jìn)一步詳細(xì)說明，所應(yīng)理解的是，以上所述僅為本發(fā)明的具體實(shí)施方式
而已，并不用于限定本發(fā)明的保護(hù)范圍，凡在本發(fā)明的精神和原則之內(nèi)，所做的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種音頻信號(hào)編碼方法，其特征在于，所述方法包括將音頻信號(hào)分為高頻音頻信號(hào)和低頻音頻信號(hào)；根據(jù)低頻音頻信號(hào)的特征對所述低頻音頻信號(hào)利用相應(yīng)的低頻編碼方式編碼；根據(jù)所述低頻編碼方式或所述音頻信號(hào)的特征，選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼。
2.根據(jù)權(quán)利要求1所述的音頻信號(hào)編碼方法，其特征在于，所述根據(jù)低頻音頻信號(hào)的特征對所述低頻音頻信號(hào)利用相應(yīng)的低頻編碼方式編碼具體為，根據(jù)低頻音頻信號(hào)的特征利用時(shí)域編碼或頻域編碼方式對所述低頻音頻信號(hào)編碼。
3.根據(jù)權(quán)利要求2所述的音頻信號(hào)編碼方法，其特征在于，所述根據(jù)所述低頻編碼方式，選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼具體為，根據(jù)所述低頻音頻信號(hào)的時(shí)域編碼方式，選擇時(shí)域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行時(shí)域編碼；或根據(jù)所述低頻音頻信號(hào)的頻域編碼方式，選擇頻域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行頻域編碼。
4.根據(jù)權(quán)利要求2所述的音頻信號(hào)編碼方法，其特征在于，所述根據(jù)所述音頻信號(hào)的特征，選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼具體為，所述音頻信號(hào)為語音信號(hào)，選擇時(shí)域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行時(shí)域編碼；所述音頻信號(hào)為音樂信號(hào)，選擇頻域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行頻域編碼。
5.根據(jù)權(quán)利要求2所述的音頻信號(hào)編碼方法，其特征在于，所述根據(jù)所述低頻編碼方式和所述音頻信號(hào)的特征，選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼具體為，所述低頻音頻信號(hào)為時(shí)域編碼方式，且所述音頻信號(hào)為語音信號(hào)，則選擇時(shí)域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行時(shí)域編碼；否則選擇頻域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行頻域編碼。
6.根據(jù)權(quán)利要求1所述的音頻信號(hào)編碼方法，其特征在于，所述方法還包括對所述低頻音頻信號(hào)解碼，所述低頻音頻信號(hào)編解碼產(chǎn)生第一延時(shí)；所述對所述高頻音頻信號(hào)編碼具體為，對所述高頻音頻信號(hào)編碼，所述高頻音頻信號(hào)編碼產(chǎn)生第二延時(shí)。
7.根據(jù)權(quán)利要求6所述的音頻信號(hào)編碼方法，其特征在于，所述對所述高頻音頻信號(hào)編碼具體為，對所述高頻音頻信號(hào)進(jìn)行第一延時(shí)后編碼，使得所述音頻信號(hào)編解碼延時(shí)是第一延時(shí)和第二延時(shí)之和。
8.根據(jù)權(quán)利要求6所述的音頻信號(hào)編碼方法，其特征在于，當(dāng)所述第一延時(shí)小于等于第二延時(shí)時(shí)，對所述低頻音頻信號(hào)編碼后延時(shí)第二延時(shí)與第一延時(shí)之差，使得音頻信號(hào)編解碼延時(shí)是第二延時(shí)；當(dāng)所述第一延時(shí)大于第二延時(shí)時(shí)，對所述高頻音頻信號(hào)對所述高頻音頻信號(hào)編碼后延時(shí)第一延時(shí)與第二延時(shí)之差；使得音頻信號(hào)編解碼延時(shí)是第一延時(shí)。
9.根據(jù)權(quán)利要求6所述的音頻信號(hào)編碼方法，其特征在于，所述方法還包括所述對所述高頻音頻信號(hào)編碼具體為，對所述高頻音頻信號(hào)進(jìn)行第三延時(shí)后編碼；當(dāng)所述第一時(shí)延小于等于第二時(shí)延時(shí)，對所述低頻音頻信號(hào)編碼后延時(shí)第二延時(shí)和第三延時(shí)與第一延時(shí)之差，使得音頻信號(hào)編解碼延時(shí)是第二延時(shí)和第三延時(shí)之和；當(dāng)所述第一時(shí)延大于第二時(shí)延時(shí)，對所述高頻音頻信號(hào)編碼后延時(shí)第一延時(shí)與第二延時(shí)、第三延時(shí)和之差，或者對所述低頻音頻信號(hào)編碼后延時(shí)第二延時(shí)加第三延時(shí)與第一延時(shí)之差，使得音頻信號(hào)編解碼延時(shí)是第一延時(shí)或第二延時(shí)和第三延時(shí)之和。
10.一種音頻信號(hào)編碼裝置，其特征在于，所述裝置包括劃分單元，用于將音頻信號(hào)分為高頻音頻信號(hào)和低頻音頻信號(hào)；低頻信號(hào)編碼單元，用于根據(jù)低頻音頻信號(hào)的特征對所述低頻音頻信號(hào)利用相應(yīng)的低頻編碼方式編碼；高頻信號(hào)編碼單元，用于根據(jù)所述低頻編碼方式和/或所述音頻信號(hào)的特征，選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼。
11.根據(jù)權(quán)利要求9所述的音頻信號(hào)編碼裝置，其特征在于，所述低頻信號(hào)編碼單元具體用于根據(jù)低頻音頻信號(hào)的特征利用時(shí)域編碼或頻域編碼方式對所述低頻音頻信號(hào)編碼。
12.根據(jù)權(quán)利要求10所述的音頻信號(hào)編碼裝置，其特征在于，所述高頻信號(hào)編碼單元具體用于根據(jù)所述低頻音頻信號(hào)的時(shí)域編碼或頻域編碼方式，選擇時(shí)域或頻域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行時(shí)域或頻域編碼。
13.根據(jù)權(quán)利要求10所述的音頻信號(hào)編碼裝置，其特征在于，所述音頻信號(hào)為語音信號(hào)時(shí)，所述高頻信號(hào)編碼單元具體用于選擇時(shí)域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行時(shí)域編碼；所述音頻信號(hào)為音樂信號(hào)時(shí)，所述高頻信號(hào)編碼單元具體用于選擇頻域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行頻域編碼。
14.根據(jù)權(quán)利要求10所述的音頻信號(hào)編碼裝置，其特征在于，所述低頻音頻信號(hào)為時(shí)域編碼方式，且所述音頻信號(hào)為語音信號(hào)時(shí)，所述高頻信號(hào)編碼單元具體用于選擇時(shí)域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行時(shí)域編碼，否則選擇頻域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行頻域編碼。
15.根據(jù)權(quán)利要求9所述的音頻信號(hào)編碼裝置，其特征在于，所述裝置還包括低頻信號(hào)解碼單元，用于對所述低頻音頻信號(hào)解碼；所述低頻音頻信號(hào)編解碼產(chǎn)生第一延時(shí)；所述高頻信號(hào)編碼單元具體用于對所述高頻音頻信號(hào)進(jìn)行第一延時(shí)后編碼，所述高頻音頻信號(hào)編碼產(chǎn)生第二延時(shí)；使得音頻信號(hào)編解碼延時(shí)是第一延時(shí)和第二延時(shí)之和；或者，所述高頻信號(hào)編碼單元具體用于對所述高頻音頻信號(hào)編碼，所述高頻音頻信號(hào)編碼產(chǎn)生第二延時(shí)；當(dāng)所述第一延時(shí)小于等于第二延時(shí)時(shí)，所述低頻信號(hào)編碼單元對所述低頻音頻信號(hào)編碼后延時(shí)第二延時(shí)與第一延時(shí)之差，使得音頻信號(hào)編解碼延時(shí)是第二延時(shí)；當(dāng)所述第一延時(shí)大于第二延時(shí)時(shí)，所述低頻信號(hào)編碼單元對所述高頻音頻信號(hào)對所述高頻音頻信號(hào)編碼后延時(shí)第一延時(shí)與第二延時(shí)之差；使得音頻信號(hào)編解碼延時(shí)是第一延時(shí)；或者，所述高頻信號(hào)編碼單元具體用于對所述高頻音頻信號(hào)進(jìn)行第三延時(shí)后編碼，所述高頻音頻信號(hào)編碼產(chǎn)生第二延時(shí)；當(dāng)所述第一時(shí)延小于等于第二時(shí)延時(shí)，所述低頻信號(hào)編碼單元對所述低頻音頻信號(hào)編碼后延時(shí)第二延時(shí)和第三延時(shí)與第一延時(shí)之差，使得音頻信號(hào)編解碼延時(shí)是第二延時(shí)和第三延時(shí)之和；當(dāng)所述第一時(shí)延大于第二時(shí)延時(shí)，所述高頻信號(hào)編碼單元對所述高頻音頻信號(hào)編碼后延時(shí)第一延時(shí)與第二延時(shí)、第三延時(shí)和之差，或者所述低頻信號(hào)編碼單元對所述低頻音頻信號(hào)編碼后延時(shí)第二延時(shí)加第三延時(shí)與第一延時(shí)之差，使得首頻彳目號(hào)編解碼延時(shí)是第一延時(shí)或第二延時(shí)和第二延時(shí)之和。
全文摘要
本發(fā)明涉及一種音頻信號(hào)編碼方法和裝置，所述方法包括將音頻信號(hào)分為高頻音頻信號(hào)和低頻音頻信號(hào)；利用低頻音頻信號(hào)特征對所述低頻音頻信號(hào)用相應(yīng)的低頻編碼方式編碼；根據(jù)所述低頻編碼方式和/或所述音頻信號(hào)的特征，選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼。本發(fā)明實(shí)施例音頻信號(hào)編碼方法和裝置可以根據(jù)低頻信號(hào)的編碼模式和/或音頻信號(hào)的特點(diǎn)來確定高頻音頻信號(hào)帶寬擴(kuò)展的編碼方式，從而彌補(bǔ)帶寬擴(kuò)展局限于采用單一編碼模式，實(shí)現(xiàn)自適應(yīng)的編碼，優(yōu)化音頻編碼質(zhì)量。
文檔編號(hào)G10L19/00GK103035248SQ20111029779
公開日2013年4月10日申請日期2011年10月8日優(yōu)先權(quán)日2011年10月8日
發(fā)明者苗磊, 劉澤新申請人:華為技術(shù)有限公司

完整全部詳細(xì)技術(shù)資料下載