專利名稱:音頻信號(hào)編碼方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信領(lǐng)域,尤其涉及一種音頻信號(hào)編碼方法和裝置。
背景技術(shù):
在音頻編碼時(shí),由于比特率的限制和考慮到人耳的聽覺特性,所以優(yōu)先編碼低頻 帶音頻信號(hào)的信息,而丟棄高頻帶音頻信號(hào)的信息。但隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)帶寬限制 越來越小,同時(shí)隨著人們對音質(zhì)越來越高的要求,希望通過增加信號(hào)的帶寬而恢復(fù)高頻帶 音頻信號(hào)的信息。由此提高音頻信號(hào)的音質(zhì),可以通過帶寬擴(kuò)展(BandWidth Extension, BffE)技術(shù)實(shí)現(xiàn)。
帶寬擴(kuò)展可以擴(kuò)大音頻信號(hào)頻帶范圍、提高信號(hào)質(zhì)量,例如G. 729.1中的 時(shí)域(Time Domain, TD)帶寬擴(kuò)展算法,活動(dòng)圖像專家組(Moving Picture Experts Group, MPEG)中的頻帶復(fù)制(Spectral Band Replication, SBR)技術(shù),以及國際電信 聯(lián)盟(International Telecommunication Union, ITU-T)G. 722B/G. 711.1D 中的頻域 (Frequency Domain, FD)帶寬擴(kuò)展算法。
圖1和圖2為現(xiàn)有技術(shù)的帶寬擴(kuò)展的示意圖,即無論低頻(如小于6. 4kHz)音頻信 號(hào)的編碼是時(shí)域編碼(TD coding)或者頻域編碼(FD coding),而高頻(如6. 4_16/14kHz) 音頻信號(hào)的帶寬擴(kuò)展都為時(shí)域帶寬擴(kuò)展(TD-BWE)或者都為頻域帶寬擴(kuò)展(FD-BWE)。
所以現(xiàn)有技術(shù)中,對于高頻的音頻信號(hào)的編碼只是時(shí)域帶寬擴(kuò)展的時(shí)域編碼或只 是頻域帶寬擴(kuò)展的頻域編碼,而不會(huì)考慮低頻音頻信號(hào)的編碼方式,也不會(huì)考慮音頻信號(hào) 的特性。發(fā)明內(nèi)容
本發(fā)明實(shí)施例的音頻信號(hào)編碼方法和裝置,在帶寬擴(kuò)展時(shí)可以根據(jù)低頻信號(hào)的編 碼方式和/或音頻信號(hào)的特點(diǎn)來對高頻音頻信號(hào)進(jìn)行編碼,實(shí)現(xiàn)自適應(yīng)編碼,而非固定編 碼模式。
本發(fā)明實(shí)施例提供了一種音頻信號(hào)編碼方法,所述方法包括
將音頻信號(hào)分為高頻音頻信號(hào)和低頻音頻信號(hào);
根據(jù)低頻音頻信號(hào)的特征對所述低頻音頻信號(hào)利用相應(yīng)的低頻編碼方式編碼;
根據(jù)所述低頻編碼方式和/或所述音頻信號(hào)的特征,選擇帶寬擴(kuò)展模式對所述高 頻音頻信號(hào)編碼。
本發(fā)明實(shí)施例提供了一種音頻信號(hào)編碼裝置,所述裝置包括
劃分單元,用于將音頻信號(hào)分為高頻音頻信號(hào)和低頻音頻信號(hào);
低頻信號(hào)編碼單元,用于根據(jù)低頻音頻信號(hào)的特征對所述低頻音頻信號(hào)利用相應(yīng) 的低頻編碼方式編碼;
高頻信號(hào)編碼單元,用于根據(jù)所述低頻編碼方式和/或所述音頻信號(hào)的特征,選 擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼。
本發(fā)明實(shí)施例音頻信號(hào)編碼方法和裝置可以根據(jù)低頻信號(hào)的編碼模式和/或音 頻信號(hào)的特點(diǎn)來確定高頻音頻信號(hào)帶寬擴(kuò)展的編碼方式,避免帶寬擴(kuò)展時(shí)不考慮低頻信號(hào) 的編碼模式和音頻信號(hào)的特點(diǎn),從而彌補(bǔ)帶寬擴(kuò)展局限于采用單一編碼模式,實(shí)現(xiàn)自適應(yīng) 的編碼,優(yōu)化音頻編碼質(zhì)量。
圖1為現(xiàn)有技術(shù)的帶寬擴(kuò)展的示意圖之一;圖2為現(xiàn)有技術(shù)的帶寬擴(kuò)展的示意圖之二;圖3為本發(fā)明實(shí)施例音頻信號(hào)編碼方法的流程圖;圖4為本發(fā)明實(shí)施例音頻信號(hào)編碼方法的帶寬擴(kuò)展示意圖之一;圖5為本發(fā)明實(shí)施例音頻信號(hào)編碼方法的帶寬擴(kuò)展示意圖之二 ;圖6為本發(fā)明實(shí)施例音頻信號(hào)編碼方法的帶寬擴(kuò)展示意圖之三;圖7為ITU-T G. 718中的分析窗示意圖;圖8為本發(fā)明音頻信號(hào)編碼方法的不同高頻音頻信號(hào)的加窗示意圖;圖9為本發(fā)明音頻信號(hào)編碼方法中基于高頻信號(hào)高延時(shí)窗的BWE示意圖;圖10為本發(fā)明音頻信號(hào)編碼方法中基于高頻信號(hào)零延時(shí)窗的BWE示意圖;圖11為本發(fā)明實(shí)施例音頻信號(hào)處理裝置的示意圖;圖12為本發(fā)明實(shí)施例另一音頻信號(hào)處理裝置的示意圖。
具體實(shí)施例方式下面通過附圖和實(shí)施例,對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。本發(fā)明實(shí)施例可以根據(jù)低頻帶音頻信號(hào)的編碼方式和音頻信號(hào)的特點(diǎn)來確定頻 帶擴(kuò)展的方法是時(shí)域帶寬擴(kuò)展還是頻域帶寬擴(kuò)展。這樣當(dāng)?shù)皖l編碼是時(shí)域編碼時(shí),高頻編碼可以是時(shí)域帶寬擴(kuò)展,也可以是頻域帶 寬擴(kuò)展;而低頻編碼是頻域編碼時(shí),高頻編碼可以是時(shí)域帶寬擴(kuò)展,也可以是頻域帶寬擴(kuò)展。圖3為本發(fā)明實(shí)施例音頻信號(hào)編碼方法的流程圖,如圖所示,本發(fā)明實(shí)施例音頻 信號(hào)編碼方法具體包括如下步驟步驟101,將音頻信號(hào)分為高頻音頻信號(hào)和低頻音頻信號(hào);因?yàn)榈皖l的音頻信號(hào)需要直接編碼,而高頻的音頻信號(hào)必須經(jīng)過帶寬擴(kuò)展來進(jìn)行 編碼;步驟102,根據(jù)低頻音頻信號(hào)的特征對所述低頻音頻信號(hào)利用相應(yīng)的低頻編碼方 式編碼;對低頻音頻信號(hào)編碼具有兩種方式,可以是時(shí)域編碼或頻域編碼方式,例如對于 語音音頻信號(hào),則利用時(shí)域編碼對低頻語音信號(hào)進(jìn)行編碼,而對于音樂音頻信號(hào),則利用頻 域編碼對低頻音樂信號(hào)進(jìn)行編碼;因?yàn)橥ǔ碇v說語音信號(hào)采用時(shí)域編碼的效果比較好, 例如碼激勵(lì)線性預(yù)測(Code Excited Linear Prediction, CELP),而音樂信號(hào)采用頻域編 碼的效果比較好,例如使用改進(jìn)離散余弦變換(Modified Discrete Cosine Transform, MDCT)或快速傅立葉變換(Fast Fourier Transform, FFT)等。
步驟103,根據(jù)低頻編碼方式或音頻信號(hào)的特征,選擇帶寬擴(kuò)展模式對高頻音頻信號(hào)編碼。
本步驟是說明了對高頻音頻信號(hào)編碼時(shí)的幾種可能性,一是根據(jù)低頻信號(hào)的編碼方式來決定高頻音頻信號(hào)的編碼方式,二是根據(jù)音頻信號(hào)的特征來對決定高頻音頻信號(hào)的編碼方式,三是同時(shí)參考低頻信號(hào)的編碼方式和音頻信號(hào)的特征來對決定高頻音頻信號(hào)的編碼方式。
低頻音頻信號(hào)的編碼方式可能是時(shí)域編碼或者頻域編碼,而音頻信號(hào)的特征可以是語音音頻信號(hào)或者音樂音頻信號(hào),高頻音頻信號(hào)編碼方式可以是時(shí)域帶寬擴(kuò)展模式或者頻域帶寬擴(kuò)展模式,對于高頻音頻信號(hào)的帶寬擴(kuò)展需要參考低頻音頻信號(hào)的編碼方式或音頻信號(hào)特征來編碼。
根據(jù)所述低頻編碼方式或所述音頻信號(hào)的特征,選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼,選擇的帶寬擴(kuò)展模式與低頻編碼方式或音頻信號(hào)的特征對應(yīng),屬于同一個(gè)域編碼方式。
一個(gè)實(shí)施例中,所選擇的帶寬擴(kuò)展模式與低頻編碼方式對應(yīng)當(dāng)?shù)皖l音頻信號(hào)采用時(shí)域編碼方式時(shí),選擇時(shí)域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行時(shí)域編碼;當(dāng)?shù)皖l音頻信號(hào)采用頻域編碼方式,選擇頻域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行頻域編碼。即高頻音頻信號(hào)的編碼方式與低頻編碼方式屬于同一個(gè)域編碼方式(時(shí)域編碼或者頻域編碼)。
另一個(gè)實(shí)施例中,與音頻信號(hào)特征適合的低頻編碼方式對應(yīng)當(dāng)音頻信號(hào)為語音信號(hào)時(shí),選擇時(shí)域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行時(shí)域編碼;當(dāng)音頻信號(hào)為音樂信號(hào)時(shí), 選擇頻域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行頻域編碼。即高頻音頻信號(hào)的編碼方式與音頻信號(hào)特征適合的低頻編碼方式屬于同一個(gè)域編碼方式(時(shí)域編碼或者頻域編碼)。
另一個(gè)實(shí)施例中,綜合考慮低頻編碼方式和音頻信號(hào)的特征,選擇帶寬擴(kuò)展模式對高頻音頻信號(hào)編碼當(dāng)?shù)皖l音頻信號(hào)為時(shí)域編碼方式,且音頻信號(hào)為語音信號(hào)時(shí),選擇時(shí)域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行時(shí)域編碼;否則選擇頻域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行頻域編碼。
參見圖4的本發(fā)明實(shí)施例音頻信號(hào)編碼方法的帶寬擴(kuò)展示意圖之一所示,低頻音頻信號(hào),例如0-6. 4kHz的音頻信號(hào)可能是TD coding或者FD c oding,而高頻音頻信號(hào),例如6. 4-16/14kHz的音頻信號(hào)的帶寬擴(kuò)展可能是TD-BWE或者FD-BWE。
也就是說本發(fā)明實(shí)施例的音頻信號(hào)編碼方法中,低頻音頻信號(hào)的編碼方式與高頻信號(hào)的帶快擴(kuò)展之間沒有一一對應(yīng)的關(guān)系。例如,如果低頻音頻信號(hào)是TD coding,其高頻音頻信號(hào)的帶寬擴(kuò)展既可能是TD-BWE,也可能是FD-BWE ;而如果低頻音頻信號(hào)是TD coding,其高頻音頻信號(hào)的帶寬擴(kuò)展同樣可能是TD-BWE,也可能是FD-BWE。
具體的,一種選擇帶寬擴(kuò)展模式對高頻音頻信號(hào)編碼的方式是根據(jù)低頻音頻信號(hào)的低頻編碼方式進(jìn)行處理,一并參見圖5的本發(fā)明實(shí)施例音頻信號(hào)編碼方法的帶寬擴(kuò)展示意圖之二所示,低頻(0-6. 4kHz)音頻信號(hào)是時(shí)域編碼TD coding時(shí),高頻¢. 4_16/14kHz) 音頻信號(hào)同樣也是時(shí)域帶寬擴(kuò)展TD-BWE的時(shí)域編碼;低頻(0-6. 4kHz)音頻信號(hào)是頻域編碼FD coding時(shí),高頻(6. 4-16/14kHz)音頻信號(hào)同樣也是頻域帶寬擴(kuò)展FD-BWE的頻域編碼。
所以高頻音頻信號(hào)編碼的方式與低頻音頻信號(hào)的編碼方式是屬于相同域的,而不參考音頻信號(hào)/低音音頻信號(hào)的特征,也就是說高頻音頻信號(hào)的編碼參照低頻音頻信號(hào)編 碼的方式進(jìn)行處理的,與音頻信號(hào)/低音音頻信號(hào)的特征無關(guān)。
因此,根據(jù)低頻信號(hào)的編碼方式來確定高頻音頻信號(hào)帶寬擴(kuò)展的編碼方式,避免 帶寬擴(kuò)展時(shí)不考慮低頻音頻信號(hào)的編碼方式,彌補(bǔ)帶寬擴(kuò)展對不同音頻信號(hào)編碼質(zhì)量的局 限性,實(shí)現(xiàn)自適應(yīng)的編碼,優(yōu)化音頻編碼質(zhì)量。
另外一種選擇帶寬擴(kuò)展模式對高頻音頻信號(hào)編碼的方式,是根據(jù)音頻信號(hào)或者低 頻音頻信號(hào)的特征來處理。例如如果音頻信號(hào)/低頻音頻信號(hào)是語音音頻信號(hào),則利用時(shí) 域編碼對高頻音頻信號(hào)進(jìn)行編碼,而如果音頻信號(hào)/低頻音頻信號(hào)是音樂音頻信號(hào),則利 用頻域編碼對高頻音頻信號(hào)進(jìn)行編碼。
同時(shí)參見圖4所示,高頻音頻信號(hào)帶寬擴(kuò)展的編碼只參考音頻信號(hào)/低音音頻信 號(hào)的特征,而無論低頻音頻信號(hào)的編碼方式,所以低頻音頻信號(hào)是時(shí)域編碼時(shí),高頻音頻信 號(hào)可能是時(shí)域編碼也可能是頻域編碼,而低頻音頻信號(hào)是頻域編碼時(shí),高頻音頻信號(hào)可能 是頻域編碼也可能是時(shí)域編碼。
因此,根據(jù)音頻信號(hào)/低頻信號(hào)的特點(diǎn)來確定高頻音頻信號(hào)帶寬擴(kuò)展的編碼方 式,避免帶寬擴(kuò)展時(shí)不考慮音頻信號(hào)/低頻音頻信號(hào)的特點(diǎn),彌補(bǔ)帶寬擴(kuò)展對不同音頻信 號(hào)編碼質(zhì)量的局限性,實(shí)現(xiàn)自適應(yīng)的編碼,優(yōu)化音頻編碼質(zhì)量。
再有一種選擇帶寬擴(kuò)展模式對高頻音頻信號(hào)編碼的方式,既要根據(jù)低頻音頻信號(hào) 的編碼方式也要根據(jù)音頻信號(hào)/低頻音頻信號(hào)的特征。例如當(dāng)?shù)皖l音頻信號(hào)為時(shí)域編碼方 式,而且音頻信號(hào)/低頻音頻信號(hào)為語音信號(hào)時(shí),選擇時(shí)域帶寬擴(kuò)展模式對高頻音頻信號(hào) 進(jìn)行時(shí)域編碼;而當(dāng)?shù)皖l音頻信號(hào)為頻域編碼方式,或者低頻音頻信號(hào)為時(shí)域編碼方式,且 音頻信號(hào)/低頻音頻信號(hào)為音樂信號(hào)時(shí),選擇頻域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行頻域 編碼。
圖6為本發(fā)明實(shí)施例音頻信號(hào)編碼方法的帶寬擴(kuò)展示意圖之三,如圖所示,當(dāng)?shù)?頻(6. 4-16/14kHz)音頻信號(hào)為時(shí)域編碼TD coding時(shí),高頻(6. 4_16/14kHz)音頻信號(hào)可 以是頻域帶寬擴(kuò)展FD-BWE的頻域編碼,也可以是時(shí)域帶寬擴(kuò)展TD-BWE的時(shí)域編碼;而當(dāng)?shù)?頻(6. 4-16/14kHz)音頻信號(hào)為頻域編碼FD coding時(shí),高頻(6. 4-16/14kHz)音頻信號(hào)同 樣是頻域帶寬擴(kuò)展FD-BWE的頻域編碼。
因此,根據(jù)低頻信號(hào)的編碼模式和音頻信號(hào)/低頻信號(hào)的特點(diǎn)來確定高頻音頻信 號(hào)帶寬擴(kuò)展的編碼方式,避免帶寬擴(kuò)展時(shí)不考慮低頻信號(hào)的編碼模式和音頻信號(hào)/低頻音 頻信號(hào)的特點(diǎn),彌補(bǔ)帶寬擴(kuò)展對不同音頻信號(hào)編碼質(zhì)量的局限性,實(shí)現(xiàn)自適應(yīng)的編碼,優(yōu)化 音頻編碼質(zhì)量。
本發(fā)明實(shí)施例音頻信號(hào)的編碼方法中對于低頻音頻信號(hào)的編碼方式可以是時(shí)域 編碼或者頻域編碼,而帶寬擴(kuò)展方法也是兩種,時(shí)域帶寬擴(kuò)展和頻域帶寬擴(kuò)展,可以對應(yīng)不 同的低頻帶編碼方式。
時(shí)域帶寬擴(kuò)展和頻域帶寬擴(kuò)展有可能延時(shí)不同,所以需要延時(shí)對齊,以達(dá)到統(tǒng)一 的延時(shí)。
假設(shè)所有低頻音頻信號(hào)編碼延時(shí)相同,這樣時(shí)域帶寬擴(kuò)展和頻域帶寬擴(kuò)展的延時(shí) 最好也相同,通常時(shí)域帶寬擴(kuò)展的延時(shí)是固定的,而頻域帶寬擴(kuò)展的延時(shí)是可調(diào)的,所以可 以通過調(diào)整頻域帶寬擴(kuò)展的延時(shí)來實(shí)現(xiàn)延時(shí)統(tǒng)一。
本發(fā)明實(shí)施例可以實(shí)現(xiàn)相對于解碼低頻信號(hào)的零延時(shí)帶寬擴(kuò)展,此處零延時(shí)是相對于低頻帶而言,因?yàn)榉菍ΨQ窗本身是有延時(shí)的。而且本發(fā)明實(shí)施例可以對高頻帶信號(hào)進(jìn)行不同的加窗,此處采用的是非對稱的窗,如圖7所示的ITU-T G. 718中的分析窗。而且可以實(shí)現(xiàn)從相對于解碼低頻信號(hào)的零延時(shí)到相對于解碼低頻信號(hào)的高頻窗自身延時(shí)之間的任一延時(shí),如圖8所示。
圖8為本發(fā)明音頻信號(hào)編碼方法的不同高頻音頻信號(hào)的加窗示意圖,如圖所示, 對于不同巾貞(frame),例如對于(m_l) frame、(m) frame和(m+1) frame,可以實(shí)現(xiàn)高頻信號(hào)高延時(shí)窗(High delay windowing)、高頻信號(hào)低延時(shí)窗(Low delay windowing)和高頻信號(hào)零延時(shí)窗(Zero delay windowing)。這里高頻信號(hào)各延時(shí)窗并沒有考慮窗本身的延時(shí),只是考慮不同的高頻信號(hào)的加窗方式。
圖9為本發(fā)明音頻信號(hào)編碼方法中高頻信號(hào)高延時(shí)窗的BWE示意圖,如圖所示,當(dāng)輸入幀的低頻音頻信號(hào)完全解碼后,用解碼后的低頻音頻信號(hào)作為高頻激勵(lì)信號(hào),輸入幀高頻音頻信號(hào)的加窗是根據(jù)輸入幀低頻音頻信號(hào)解碼的延時(shí)來確定。
例如,編解碼的低頻音頻信號(hào)延時(shí)為Dims,在編碼端Encoder對高頻音頻信號(hào)進(jìn)行時(shí)頻變換時(shí),將延時(shí)Dims的高頻音頻信號(hào)進(jìn)行時(shí)頻變換,而高頻音頻信號(hào)的加窗變換會(huì)產(chǎn)生D2毫秒的延時(shí),所以在解碼端Decoder解碼的高頻帶信號(hào)的總延時(shí)為D1+D2毫秒;這樣相對解碼的低頻音頻信號(hào),高頻音頻信號(hào)有額外D2毫秒延時(shí),即解碼的低頻音頻信號(hào)需要額外延時(shí)D2毫秒和解碼的高頻音頻信號(hào)對齊,輸出信號(hào)總延時(shí)為D1+D2。而在解碼端,因?yàn)楦哳l激勵(lì)信號(hào)需要從低頻音頻信號(hào)的預(yù)測中得到,所以對解碼端的低頻音頻信號(hào)和編碼端的高頻音頻信號(hào)來說,均做同樣的時(shí)頻變換處理,而由于編碼端的高頻音頻信號(hào)和解碼端的低頻音頻信號(hào)都是對延時(shí)Dl毫秒后的音頻信號(hào)做時(shí)頻變換,因此激勵(lì)信號(hào)是對齊的。
圖10為本發(fā)明首頻彳目號(hào)編碼方法中聞?lì)l彳目號(hào)零延時(shí)窗BWE 意圖,如圖所不,是編碼端對當(dāng)前接收的幀的高頻音頻信號(hào)直接進(jìn)行加窗,解碼端時(shí)頻變換處理用當(dāng)前幀解碼的低頻音頻信號(hào)作為激勵(lì)信號(hào),雖然激勵(lì)信號(hào)可能會(huì)有一定錯(cuò)位,但是經(jīng)過對激勵(lì)信號(hào)進(jìn)行修正,錯(cuò)位的影響可以忽略不計(jì)。
例如,解碼的低頻帶信號(hào)延時(shí)為Dl毫秒,而編碼端對高頻帶信號(hào)做時(shí)頻變換時(shí)不做延時(shí)處理,而只是由于高頻信號(hào)加窗變換會(huì)產(chǎn)生D2毫秒的延時(shí),所以在解碼端解碼的高頻帶信號(hào)的總延時(shí)為D2毫秒。
當(dāng)Dl等于D2時(shí),解碼的低頻音頻信號(hào)不需要額外延時(shí)即能和解碼的高頻音頻信號(hào)對齊;但在解碼端預(yù)測高頻帶激勵(lì)信號(hào)是從對延時(shí)Dl毫秒后的低頻音頻信號(hào)做時(shí)頻變換得到的頻域信號(hào)中得到的,所以,高頻激勵(lì)信號(hào)和低頻激勵(lì)信號(hào)沒有對齊,具有Dl毫秒的錯(cuò)位。解碼信號(hào)相對于編碼端信號(hào)總體延時(shí)是Dl或者D2。
當(dāng)Dl不等于D2時(shí),例如Dl小于D2時(shí),解碼信號(hào)相對于編碼端信號(hào)總體延時(shí)是D2 毫秒,高頻激勵(lì)信號(hào)和低頻激勵(lì)信號(hào)之間的錯(cuò)位是Dl毫秒,解碼的低 頻音頻信號(hào)需要額外延時(shí)(D2-D1)毫秒和解碼的高頻音頻信號(hào)對齊。如Dl大于D2時(shí),這樣解碼信號(hào)相對于編碼端信號(hào)總體延時(shí)是Dl毫秒,高頻激勵(lì)信號(hào)和低頻激勵(lì)信號(hào)之間的錯(cuò)位是Dl毫秒,解碼的高頻音頻信號(hào)需要額外延時(shí)(D1-D2)毫秒和解碼的低頻音頻信號(hào)對齊。
介于如上高頻信號(hào)零延時(shí)窗和高延時(shí)窗之間的BWE,是編碼端對當(dāng)前接收的幀的高頻音頻信號(hào)延時(shí)D3毫秒后進(jìn)行加窗,該延時(shí)介于O和Dl毫秒之間,解碼端時(shí)頻變換處理用低頻音頻信號(hào)當(dāng)前幀解碼信號(hào)作為激勵(lì)信號(hào),雖然激勵(lì)信號(hào)可能會(huì)有一定錯(cuò)位,但是經(jīng) 過對激勵(lì)信號(hào)進(jìn)行修正,錯(cuò)位的影響可以忽略不計(jì)。
當(dāng)Dl等于D2時(shí),解碼的低頻音頻信號(hào)需要額外延時(shí)D3毫秒和解碼的高頻音頻信 號(hào)對齊;但在解碼端預(yù)測高頻帶激勵(lì)信號(hào)是從對延時(shí)Dl毫秒后的低頻音頻信號(hào)做時(shí)頻變 換得到的頻域信號(hào)中得到的,所以,高頻激勵(lì)信號(hào)和低頻激勵(lì)信號(hào)沒有對齊,具有(D1-D3) 毫秒的錯(cuò)位。解碼信號(hào)相對于編碼端信號(hào)總體延時(shí)是(D2+D3)或者(D1+D3)毫秒。
當(dāng)Dl不等于D2時(shí),例如Dl小于D2時(shí),解碼信號(hào)相對于編碼端信號(hào)總體延時(shí)是 (D2+D3)毫秒,高頻激勵(lì)信號(hào)和低頻激勵(lì)信號(hào)之間的錯(cuò)位是(D1-D3)毫秒,解碼的低頻音頻 信號(hào)需要額外延時(shí)(D2+D3-D1)毫秒和解碼的高頻音頻信號(hào)對齊。
如Dl大于D2時(shí),這樣解碼信號(hào)相對于編碼端信號(hào)總體延時(shí)是max (Dl, D2+D3)毫 秒,高頻激勵(lì)信號(hào)和低頻激勵(lì)信號(hào)之間的錯(cuò)位是(D1-D3)毫秒,其中max(a,b)表示取a 和b的較大的一個(gè)值。當(dāng)max(Dl,D2+D3) = D2+D3時(shí),解碼的低頻音頻信號(hào)需要額外延 時(shí)(D2+D3-D1)毫秒和解碼的高頻音頻信號(hào)對齊,當(dāng)max(Dl,D2+D3) = Dl時(shí),解碼的高頻 音頻信號(hào)需要額外延時(shí)(D1-D2-D3)毫秒和解碼的低頻音頻信號(hào)對齊;舉一特例,當(dāng)D3 = (D1-D2)毫秒,這樣解碼信號(hào)相對于編碼端信號(hào)總體延時(shí)是Dl毫秒,高頻激勵(lì)信號(hào)和低頻 激勵(lì)信號(hào)之間的錯(cuò)位是D2毫秒,此時(shí)解碼的低頻音頻信號(hào)不需要額外延時(shí)即能和解碼的 高頻音頻信號(hào)對齊。
所以,本發(fā)明實(shí)施例在時(shí)域帶寬擴(kuò)展中需要對頻域帶寬擴(kuò)展的狀態(tài)保持更新,因 為下一幀有可能是頻域帶寬擴(kuò)展,同理在頻域帶寬擴(kuò)展中需要對時(shí)域帶寬擴(kuò)展的狀態(tài)保持 更新,因?yàn)榈较乱粠锌赡苁菚r(shí)域帶寬擴(kuò)展,由此通過這種方法來實(shí)現(xiàn)帶寬切換的連續(xù)性。
以上實(shí)施例是對于本發(fā)明音頻信號(hào)編碼方法的,同樣,可以利用音頻信號(hào)處理裝 置來實(shí)現(xiàn)。圖11為本發(fā)明實(shí)施例音頻信號(hào)處理裝置的示意圖,如圖所示,本發(fā)明實(shí)施例信 號(hào)處理裝置具體包括劃分單元11、低頻信號(hào)編碼單元12和高頻信號(hào)編碼單元13。
劃分單元11用于將音頻信號(hào)分為高頻音頻信號(hào)和低頻音頻信號(hào);低頻信號(hào)編碼 單元12用于根據(jù)低頻音頻信號(hào)的特征對所述低頻音頻信號(hào)利用相應(yīng)的低頻編碼方式編 碼;而編碼方式可以是時(shí)域編碼或頻域編碼方式,例如對于語音音頻信號(hào),利用時(shí)域編碼對 低頻語音信號(hào)進(jìn)行編碼,而對于音樂音頻信號(hào),利用頻域編碼對低頻音樂信號(hào)進(jìn)行編碼。因 為通常來講說語音信號(hào)采用時(shí)域編碼的效果比較好,而音樂信號(hào)采用頻域編碼的效果比較 好。
高頻信號(hào)編碼單元13用于根據(jù)所述低頻編碼方式和/或所述音頻信號(hào)的特征,選 擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼。
具體的,如果低頻信號(hào)編碼單元12采用時(shí)域編碼,則高頻信號(hào)編碼單元13選擇時(shí) 域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行時(shí)域或頻域編碼;而如果低頻信號(hào)編碼單元12 采用頻域編碼,則高頻信號(hào)編碼單元13選擇頻域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行 時(shí)域或頻域編碼。
另外,如果音頻信號(hào)/低頻音頻信號(hào)是語音音頻信號(hào),則高頻信號(hào)編碼單元13利 用時(shí)域編碼對高頻頻語音信號(hào)進(jìn)行編碼,而如果音頻信號(hào)/低頻音頻信號(hào)是音樂音頻信 號(hào),則高頻信號(hào)編碼單元13利用頻域編碼對高頻頻音樂信號(hào)進(jìn)行編碼。此時(shí)不考慮低頻音 頻信號(hào)的編碼模式。
再有,當(dāng)?shù)皖l信號(hào)編碼單元12對低頻音頻信號(hào)采用時(shí)域編碼方式,而且音頻信號(hào) /低頻音頻信號(hào)為語音信號(hào)時(shí),高頻信號(hào)編碼單元13選擇時(shí)域帶寬擴(kuò)展模式對高頻音頻信 號(hào)進(jìn)行時(shí)域編碼;而當(dāng)?shù)皖l信號(hào)編碼單元12對低頻音頻信號(hào)采用頻域編碼方式,或者低頻 信號(hào)編碼單元12對低頻音頻信號(hào)采用時(shí)域編碼方式,且音頻信號(hào)/低頻音頻信號(hào)為音樂信 號(hào)時(shí),選擇頻域帶寬擴(kuò)展模式對高頻音頻信號(hào)進(jìn)行頻域編碼。
圖12為本發(fā)明實(shí)施例另一音頻信號(hào)處理裝置的示意圖,如圖所示,本發(fā)明實(shí)施例 信號(hào)處理裝置還具體包括低頻信號(hào)解碼單元14。
低頻信號(hào)解碼單元14用于對低頻音頻信號(hào)解碼;低頻音頻信號(hào)編解碼產(chǎn)生第一 延時(shí)D1。
具體的,如果高頻音頻信號(hào)有延時(shí)窗時(shí),高頻信號(hào)編碼單元13用于對高頻音頻信 號(hào)進(jìn)行第一延時(shí)Dl后編碼,高頻音頻信號(hào)編碼產(chǎn)生第二延時(shí)D2 ;使得音頻信號(hào)編解碼延時(shí) 是第一延時(shí)Dl和第二延時(shí)D2之和(D1+D2)。
如果高頻音頻信號(hào)沒有延時(shí)窗時(shí),高頻信號(hào)編碼單元13用于對高頻音頻信號(hào)編 碼,高頻音頻信號(hào)編碼產(chǎn)生第二延時(shí)D2 ;當(dāng)?shù)谝谎訒r(shí)Dl小于等于第二延時(shí)D2時(shí),低頻信號(hào) 編碼單元12對低頻音頻信號(hào)編碼后延時(shí)第二延時(shí)D2與第一延時(shí)Dl之差(D2-D1),使得音 頻信號(hào)編解碼延時(shí)是第二延時(shí)D2 ;當(dāng)?shù)谝谎訒r(shí)Dl大于第二延時(shí)D2時(shí),低頻信號(hào)編碼單元 12對高頻音頻信號(hào)對高頻音頻信號(hào)編碼后延時(shí)第一延時(shí)Dl與第二延時(shí)D2之差(D1-D2); 使得音頻信號(hào)編解碼延時(shí)是第一延時(shí)Dl。
如果高頻音頻信號(hào)為中間延時(shí)窗時(shí),高頻信號(hào)編碼單元13用于對高頻音頻信號(hào) 進(jìn)行第三延時(shí)D3后編碼,高頻音頻信號(hào)編碼產(chǎn)生第二延時(shí)D2 ;當(dāng)?shù)谝粫r(shí)延小于等于第二時(shí) 延時(shí),低頻信號(hào)編碼單元12對低頻音頻信號(hào)編碼后延時(shí)第二延時(shí)D2和第三延時(shí)D3與第 一延時(shí)Dl之差(D2+D3-D1),使得音頻信號(hào)編解碼延時(shí)是第二延時(shí)D2和第三延時(shí)D3之和 (D2+D3);當(dāng)?shù)谝粫r(shí)延大于第二時(shí)延時(shí),具有兩種可能性,如果第一延時(shí)Dl大于等于第二延 時(shí)D2和第三延時(shí)D3之和(D2+D3),高頻信號(hào)編碼單元13對高頻音頻信號(hào)編碼后延時(shí)第一 延時(shí)Dl與第二延時(shí)D2、第三延時(shí)D3和之差(D1-D2-D3),如果第一延時(shí)Dl小于第二延時(shí)D2 和第三延時(shí)D3之和(D2+D3),低頻信號(hào)編碼單元12對低頻音頻信號(hào)編碼后延時(shí)第二延時(shí) D2加第三延時(shí)D3與第一延時(shí)Dl之差(D2+D3-D1),使得音頻信號(hào)編解碼延時(shí)是第一延時(shí)Dl 或第二延時(shí)D2和第三延時(shí)D3之和(D2+D3)。
因此,本發(fā)明實(shí)施例音頻信號(hào)編碼裝置可以根據(jù)低頻信號(hào)的編碼模式和/或音頻 信號(hào)/低頻信號(hào)的特點(diǎn)來確定高頻音頻信號(hào)帶寬擴(kuò)展的編碼方式,避免帶寬擴(kuò)展時(shí)不考慮 低頻信號(hào)的編碼模式和音頻信號(hào)/低頻音頻信號(hào)的特點(diǎn),彌補(bǔ)帶寬擴(kuò)展對不同音頻信號(hào)編 碼質(zhì)量的局限性,實(shí)現(xiàn)自適應(yīng)的編碼,優(yōu)化音頻編碼質(zhì)量。
專業(yè)人員應(yīng)該還可以進(jìn)一步意識(shí)到,結(jié)合本文中所公開的實(shí)施例描述的各示例的 單元及算法步驟,能夠以電子硬件、計(jì)算機(jī)軟件或者二者的結(jié)合來實(shí)現(xiàn),為了清楚地說明硬 件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。 這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。 專業(yè)技術(shù)人員可以對每個(gè)特定的應(yīng)用來使用不同方法來實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn) 不應(yīng)認(rèn)為超出本發(fā)明的范圍。
結(jié)合本文中所公開的實(shí)施例描述的方法或算法的步驟可以用硬件、處理器執(zhí)行的軟件模塊,或者二者的結(jié)合來實(shí)施。軟件模塊可以置于隨機(jī)存儲(chǔ)器(RAM)、內(nèi)存、只讀存儲(chǔ)器 (ROM)、電可編程ROM、電可擦除可編程ROM、寄存器、硬盤、可移動(dòng)磁盤、CD-ROM、或技術(shù)領(lǐng)域 內(nèi)所公知的任意其它形式的存儲(chǔ)介質(zhì)中。
以上所述的具體實(shí)施方式
,對本發(fā)明的目的、技術(shù)方案和有益效果進(jìn)行了進(jìn)一步 詳細(xì)說明,所應(yīng)理解的是,以上所述僅為本發(fā)明的具體實(shí)施方式
而已,并不用于限定本發(fā)明 的保護(hù)范圍,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含 在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種音頻信號(hào)編碼方法,其特征在于,所述方法包括將音頻信號(hào)分為高頻音頻信號(hào)和低頻音頻信號(hào);根據(jù)低頻音頻信號(hào)的特征對所述低頻音頻信號(hào)利用相應(yīng)的低頻編碼方式編碼;根據(jù)所述低頻編碼方式或所述音頻信號(hào)的特征,選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼。
2.根據(jù)權(quán)利要求1所述的音頻信號(hào)編碼方法,其特征在于,所述根據(jù)低頻音頻信號(hào)的特征對所述低頻音頻信號(hào)利用相應(yīng)的低頻編碼方式編碼具體為,根據(jù)低頻音頻信號(hào)的特征利用時(shí)域編碼或頻域編碼方式對所述低頻音頻信號(hào)編碼。
3.根據(jù)權(quán)利要求2所述的音頻信號(hào)編碼方法,其特征在于,所述根據(jù)所述低頻編碼方式,選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼具體為,根據(jù)所述低頻音頻信號(hào)的時(shí)域編碼方式,選擇時(shí)域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行時(shí)域編碼;或根據(jù)所述低頻音頻信號(hào)的頻域編碼方式,選擇頻域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行頻域編碼。
4.根據(jù)權(quán)利要求2所述的音頻信號(hào)編碼方法,其特征在于,所述根據(jù)所述音頻信號(hào)的特征,選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼具體為,所述音頻信號(hào)為語音信號(hào),選擇時(shí)域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行時(shí)域編碼;所述音頻信號(hào)為音樂信號(hào),選擇頻域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行頻域編碼。
5.根據(jù)權(quán)利要求2所述的音頻信號(hào)編碼方法,其特征在于,所述根據(jù)所述低頻編碼方式和所述音頻信號(hào)的特征,選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼具體為,所述低頻音頻信號(hào)為時(shí)域編碼方式,且所述音頻信號(hào)為語音信號(hào),則選擇時(shí)域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行時(shí)域編碼;否則選擇頻域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行頻域編碼。
6.根據(jù)權(quán)利要求1所述的音頻信號(hào)編碼方法,其特征在于,所述方法還包括對所述低頻音頻信號(hào)解碼,所述低頻音頻信號(hào)編解碼產(chǎn)生第一延時(shí);所述對所述高頻音頻信號(hào)編碼具體為,對所述高頻音頻信號(hào)編碼,所述高頻音頻信號(hào)編碼產(chǎn)生第二延時(shí)。
7.根據(jù)權(quán)利要求6所述的音頻信號(hào)編碼方法,其特征在于,所述對所述高頻音頻信號(hào)編碼具體為,對所述高頻音頻信號(hào)進(jìn)行第一延時(shí)后編碼,使得所述音頻信號(hào)編解碼延時(shí)是第一延時(shí)和第二延時(shí)之和。
8.根據(jù)權(quán)利要求6所述的音頻信號(hào)編碼方法,其特征在于,當(dāng)所述第一延時(shí)小于等于第二延時(shí)時(shí),對所述低頻音頻信號(hào)編碼后延時(shí)第二延時(shí)與第一延時(shí)之差,使得音頻信號(hào)編解碼延時(shí)是第二延時(shí);當(dāng)所述第一延時(shí)大于第二延時(shí)時(shí),對所述高頻音頻信號(hào)對所述高頻音頻信號(hào)編碼后延時(shí)第一延時(shí)與第二延時(shí)之差;使得音頻信號(hào)編解碼延時(shí)是第一延時(shí)。
9.根據(jù)權(quán)利要求6所述的音頻信號(hào)編碼方法,其特征在于,所述方法還包括所述對所述高頻音頻信號(hào)編碼具體為,對所述高頻音頻信號(hào)進(jìn)行第三延時(shí)后編碼;當(dāng)所述第一時(shí)延小于等于第二時(shí)延時(shí),對所述低頻音頻信號(hào)編碼后延時(shí)第二延時(shí)和第三延時(shí)與第一延時(shí)之差,使得音頻信號(hào)編解碼延時(shí)是第二延時(shí)和第三延時(shí)之和;當(dāng)所述第一時(shí)延大于第二時(shí)延時(shí),對所述高頻音頻信號(hào)編碼后延時(shí)第一延時(shí)與第二延時(shí)、第三延時(shí)和之差,或者對所述低頻音頻信號(hào)編碼后延時(shí)第二延時(shí)加第三延時(shí)與第一延時(shí)之差,使得音頻信號(hào)編解碼延時(shí)是第一延時(shí)或第二延時(shí)和第三延時(shí)之和。
10.一種音頻信號(hào)編碼裝置,其特征在于,所述裝置包括劃分單元,用于將音頻信號(hào)分為高頻音頻信號(hào)和低頻音頻信號(hào);低頻信號(hào)編碼單元,用于根據(jù)低頻音頻信號(hào)的特征對所述低頻音頻信號(hào)利用相應(yīng)的低頻編碼方式編碼;高頻信號(hào)編碼單元,用于根據(jù)所述低頻編碼方式和/或所述音頻信號(hào)的特征,選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼。
11.根據(jù)權(quán)利要求9所述的音頻信號(hào)編碼裝置,其特征在于,所述低頻信號(hào)編碼單元具體用于根據(jù)低頻音頻信號(hào)的特征利用時(shí)域編碼或頻域編碼方式對所述低頻音頻信號(hào)編碼。
12.根據(jù)權(quán)利要求10所述的音頻信號(hào)編碼裝置,其特征在于,所述高頻信號(hào)編碼單元具體用于根據(jù)所述低頻音頻信號(hào)的時(shí)域編碼或頻域編碼方式,選擇時(shí)域或頻域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行時(shí)域或頻域編碼。
13.根據(jù)權(quán)利要求10所述的音頻信號(hào)編碼裝置,其特征在于,所述音頻信號(hào)為語音信號(hào)時(shí),所述高頻信號(hào)編碼單元具體用于選擇時(shí)域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行時(shí)域編碼;所述音頻信號(hào)為音樂信號(hào)時(shí),所述高頻信號(hào)編碼單元具體用于選擇頻域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行頻域編碼。
14.根據(jù)權(quán)利要求10所述的音頻信號(hào)編碼裝置,其特征在于,所述低頻音頻信號(hào)為時(shí)域編碼方式,且所述音頻信號(hào)為語音信號(hào)時(shí),所述高頻信號(hào)編碼單元具體用于選擇時(shí)域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行時(shí)域編碼,否則選擇頻域帶寬擴(kuò)展模式對所述高頻音頻信號(hào)進(jìn)行頻域編碼。
15.根據(jù)權(quán)利要求9所述的音頻信號(hào)編碼裝置,其特征在于,所述裝置還包括低頻信號(hào)解碼單元,用于對所述低頻音頻信號(hào)解碼;所述低頻音頻信號(hào)編解碼產(chǎn)生第一延時(shí);所述高頻信號(hào)編碼單元具體用于對所述高頻音頻信號(hào)進(jìn)行第一延時(shí)后編碼,所述高頻音頻信號(hào)編碼產(chǎn)生第二延時(shí);使得音頻信號(hào)編解碼延時(shí)是第一延時(shí)和第二延時(shí)之和;或者,所述高頻信號(hào)編碼單元具體用于對所述高頻音頻信號(hào)編碼,所述高頻音頻信號(hào)編碼產(chǎn)生第二延時(shí);當(dāng)所述第一延時(shí)小于等于第二延時(shí)時(shí),所述低頻信號(hào)編碼單元對所述低頻音頻信號(hào)編碼后延時(shí)第二延時(shí)與第一延時(shí)之差,使得音頻信號(hào)編解碼延時(shí)是第二延時(shí);當(dāng)所述第一延時(shí)大于第二延時(shí)時(shí),所述低頻信號(hào)編碼單元對所述高頻音頻信號(hào)對所述高頻音頻信號(hào)編碼后延時(shí)第一延時(shí)與第二延時(shí)之差;使得音頻信號(hào)編解碼延時(shí)是第一延時(shí);或者,所述高頻信號(hào)編碼單元具體用于對所述高頻音頻信號(hào)進(jìn)行第三延時(shí)后編碼,所述高頻音頻信號(hào)編碼產(chǎn)生第二延時(shí);當(dāng)所述第一時(shí)延小于等于第二時(shí)延時(shí),所述低頻信號(hào)編碼單元對所述低頻音頻信號(hào)編碼后延時(shí)第二延時(shí)和第三延時(shí)與第一延時(shí)之差,使得音頻信號(hào)編解碼延時(shí)是第二延時(shí)和第三延時(shí)之和;當(dāng)所述第一時(shí)延大于第二時(shí)延時(shí),所述高頻信號(hào)編碼單元對所述高頻音頻信號(hào)編碼后延時(shí)第一延時(shí)與第二延時(shí)、第三延時(shí)和之差,或者所述低頻信號(hào)編碼單元對所述低頻音頻信號(hào)編碼后延時(shí)第二延時(shí)加第三延時(shí)與第一延時(shí)之差,使得首頻彳目號(hào)編解碼延時(shí)是第一延時(shí)或第二延時(shí)和第二延時(shí)之和。
全文摘要
本發(fā)明涉及一種音頻信號(hào)編碼方法和裝置,所述方法包括將音頻信號(hào)分為高頻音頻信號(hào)和低頻音頻信號(hào);利用低頻音頻信號(hào)特征對所述低頻音頻信號(hào)用相應(yīng)的低頻編碼方式編碼;根據(jù)所述低頻編碼方式和/或所述音頻信號(hào)的特征,選擇帶寬擴(kuò)展模式對所述高頻音頻信號(hào)編碼。本發(fā)明實(shí)施例音頻信號(hào)編碼方法和裝置可以根據(jù)低頻信號(hào)的編碼模式和/或音頻信號(hào)的特點(diǎn)來確定高頻音頻信號(hào)帶寬擴(kuò)展的編碼方式,從而彌補(bǔ)帶寬擴(kuò)展局限于采用單一編碼模式,實(shí)現(xiàn)自適應(yīng)的編碼,優(yōu)化音頻編碼質(zhì)量。
文檔編號(hào)G10L19/00GK103035248SQ20111029779
公開日2013年4月10日 申請日期2011年10月8日 優(yōu)先權(quán)日2011年10月8日
發(fā)明者苗磊, 劉澤新 申請人:華為技術(shù)有限公司