音頻編碼器和解碼器的制造方法
【專利說明】首頻編碼裔和解碼裔
[0001]對(duì)相關(guān)申請(qǐng)的交叉引用
[0002]本申請(qǐng)要求于2013年4月5日提交的美國臨時(shí)專利申請(qǐng)N0.61/808680的優(yōu)先權(quán),其全部內(nèi)容通過引用并入于此。
技術(shù)領(lǐng)域
[0003]本文的公開內(nèi)容一般涉及多聲道音頻編碼。特別地,它涉及用于包括參數(shù)編碼和離散多聲道編碼的混合編碼的編碼器和解碼器。
【背景技術(shù)】
[0004]在傳統(tǒng)的多聲道音頻編碼中,可能的編碼方案包括離散多聲道編碼或者諸如MPEG環(huán)繞(MPEG Surround)之類的參數(shù)編碼。所使用的方案取決于音頻系統(tǒng)的帶寬。已知參數(shù)編碼方法就收聽質(zhì)量而言是可擴(kuò)展和高效的,這使得它們?cè)诘捅忍厮俾蕬?yīng)用中特別有吸引力。在高比特速率應(yīng)用中,常常使用離散多聲道編碼。從帶寬效率的角度看,現(xiàn)有的分發(fā)或處理格式以及相關(guān)聯(lián)的編碼技術(shù)可以被改進(jìn),尤其是在具有介于低比特速率和高比特速率之間的比特速率的應(yīng)用中。
[0005]US7292901 (Kroon等人)涉及混合編碼方法,其中混合音頻信號(hào)由至少一個(gè)下混的(downmixed)頻譜成分和至少一個(gè)未混合的(unmixed)頻譜成分形成。在該申請(qǐng)中提出的方法可以提高具有某比特速率的應(yīng)用的能力,但是可以需要進(jìn)一步的改進(jìn)來進(jìn)一步提高音頻處理系統(tǒng)的效率。
【附圖說明】
[0006]現(xiàn)在將參考附圖來描述示例性實(shí)施例,其中:
[0007]圖1是根據(jù)示例性實(shí)施例的解碼系統(tǒng)的概括框圖;
[0008]圖2示出了圖1中的解碼系統(tǒng)的第一部分;
[0009]圖3示出了圖1中的解碼系統(tǒng)的第二部分;
[0010]圖4不出了圖1中的解碼系統(tǒng)的第三部分;
[0011]圖5是根據(jù)不例性實(shí)施例的編碼系統(tǒng)的概括框圖;
[0012]圖6是根據(jù)示例性實(shí)施例的解碼系統(tǒng)的概括框圖;
[0013]圖7示出了圖6中的解碼系統(tǒng)的第三部分;以及
[0014]圖8是根據(jù)示例性實(shí)施例的編碼系統(tǒng)的概括框圖。
[0015]所有附圖都是示意性的,并且一般只示出了闡明本公開內(nèi)容所必需的部分,而其它部分可能被略去或者僅作暗示。除非另有表明,否則在不同的圖中相同的標(biāo)號(hào)指代相同的部分。
【具體實(shí)施方式】
[0016]概沭-解碼器
[0017]如在本文所使用的,音頻信號(hào)可以是純音頻信號(hào)、視聽信號(hào)或多媒體信號(hào)中的音頻部分或者這些信號(hào)中的任何一個(gè)與元數(shù)據(jù)的結(jié)合。
[0018]如在本文所使用的,多個(gè)信號(hào)的下混(downmixing)意味著例如通過形成線性組合來組合這多個(gè)信號(hào),使得獲得更少數(shù)量的信號(hào)。下混的逆操作被稱為上混(upmixing),即,對(duì)更少數(shù)量的信號(hào)執(zhí)行操作以獲得更多數(shù)量的信號(hào)。
[0019]根據(jù)第一方面,示例性實(shí)施例提出了基于輸入信號(hào)來重構(gòu)多聲道音頻信號(hào)的方法、設(shè)備和計(jì)算機(jī)程序產(chǎn)品。所提出的方法、設(shè)備和計(jì)算機(jī)程序產(chǎn)品一般可以具有相同的特征和優(yōu)點(diǎn)。
[0020]根據(jù)示例性實(shí)施例,提供了用于重構(gòu)Μ個(gè)編碼聲道的多聲道音頻處理系統(tǒng)的解碼器,其中Μ>2。解碼器包括第一接收級(jí),所述第一接收級(jí)被配置為接收包括與介于第一和第二交越頻率(cross-over frequency)之間的頻率對(duì)應(yīng)的頻譜系數(shù)的N個(gè)波形編碼(waveform-coded)下混信號(hào),其中 1〈N〈M。
[0021]解碼器還包括第二接收級(jí),所述第二接收級(jí)被配置為接收包括與高至第一交越頻率的頻率對(duì)應(yīng)的頻譜系數(shù)的Μ個(gè)波形編碼信號(hào),這Μ個(gè)波形編碼信號(hào)中的每一個(gè)對(duì)應(yīng)于Μ個(gè)編碼聲道中相應(yīng)的一個(gè)。
[0022]解碼器還包括位于第二接收級(jí)下游的下混級(jí),所述下混級(jí)被配置為把Μ個(gè)波形編碼信號(hào)下混成包括與高至第一交越頻率的頻率對(duì)應(yīng)的頻譜系數(shù)的Ν個(gè)下混信號(hào)。
[0023]解碼器還包括位于第一接收級(jí)和下混級(jí)下游的第一組合級(jí),所述第一組合級(jí)被配置為把由第一接收級(jí)接收的Ν個(gè)下混信號(hào)中的每一個(gè)下混信號(hào)和來自下混級(jí)的Ν個(gè)下混信號(hào)中的對(duì)應(yīng)的一個(gè)下混信號(hào)組合成Ν個(gè)組合下混信號(hào)。
[0024]解碼器還包括位于第一組合級(jí)下游的高頻重構(gòu)級(jí),所述高頻重構(gòu)級(jí)被配置為通過執(zhí)行高頻重構(gòu)把來自組合級(jí)的Ν個(gè)組合下混信號(hào)中的每一個(gè)組合下混信號(hào)擴(kuò)展到高于第二交越頻率的頻率范圍。
[0025]解碼器還包括位于高頻重構(gòu)級(jí)下游的上混級(jí),所述上混級(jí)被配置為執(zhí)行把來自高頻重構(gòu)級(jí)的Ν個(gè)頻率擴(kuò)展信號(hào)參數(shù)上混成包括與高于第一交越頻率的頻率對(duì)應(yīng)的頻譜系數(shù)的Μ個(gè)上混信號(hào),這Μ個(gè)上混信號(hào)中的每一個(gè)上混信號(hào)對(duì)應(yīng)于Μ個(gè)編碼聲道之一。
[0026]解碼器還包括位于上混級(jí)和第二接收級(jí)下游的第二組合級(jí),所述第二組合級(jí)被配置為使來自上混級(jí)的Μ個(gè)上混信號(hào)與由第二接收級(jí)接收的Μ個(gè)波形編碼信號(hào)組合。
[0027]Μ個(gè)波形編碼信號(hào)是未混入?yún)?shù)信號(hào)的純波形編碼信號(hào),S卩,它們是被處理過的多聲道音頻信號(hào)的未下混離散表示。具有以這些波形編碼信號(hào)表示的較低頻率的優(yōu)點(diǎn)可以是人耳對(duì)音頻信號(hào)中具有低頻的部分更敏感。通過以更好的質(zhì)量對(duì)該部分進(jìn)行編碼,可以提高被解碼的音頻的整體印象。
[0028]具有至少兩個(gè)下混信號(hào)的優(yōu)點(diǎn)是:與只有一個(gè)下混聲道的系統(tǒng)相比,本實(shí)施例提供了增加維度的下混信號(hào)。因此,根據(jù)本實(shí)施例,可以提供更好的解碼音頻質(zhì)量,這可能比一個(gè)下混信號(hào)的系統(tǒng)所提供的比特速率益處更重要。
[0029]使用包括參數(shù)下混和離散多聲道編碼的混合編碼的優(yōu)點(diǎn)是:與使用傳統(tǒng)的參數(shù)編碼方法(S卩,帶HE-AAC的MPEG環(huán)繞)相比,這可以針對(duì)某些比特速率提高解碼音頻信號(hào)的質(zhì)量。在大約72千比特每秒(kbps)的比特速率處,傳統(tǒng)的參數(shù)編碼模型可能飽和,S卩,解碼音頻信號(hào)的質(zhì)量受參數(shù)模型的缺點(diǎn)限制,而非受用于編碼的比特不足限制。因此,對(duì)于從大約72kbps開始的比特速率,在離散地波形編碼較低頻率上使用比特可能更有利。同時(shí),使用參數(shù)下混和離散多聲道編碼的混合方法是:與使用其中所有比特都用于波形編碼較低頻率的方法以及對(duì)剩余頻率使用譜帶復(fù)制(spectral band replicat1n,SBR)相比,這可以針對(duì)例如128kbps或以下的某些比特速率提高解碼音頻的質(zhì)量。
[0030]具有只包括與介于第一交越頻率和第二交越頻率之間的頻率對(duì)應(yīng)的頻譜數(shù)據(jù)的N個(gè)波形編碼下混信號(hào)的優(yōu)點(diǎn)是:音頻信號(hào)處理系統(tǒng)所需的比特傳輸速率可以降低。可替代地,通過具有帶通濾波的下混信號(hào)而節(jié)省的比特可以用于波形編碼較低的頻率,例如,用于那些頻率的采樣頻率可以更高或者第一交越頻率可以增大。
[0031]如上面所提到的,由于人耳對(duì)音頻信號(hào)中具有低頻的部分更敏感,因此,作為音頻信號(hào)中具有高于第二交越頻率的頻率的部分,高頻可以在不降低解碼音頻信號(hào)的感知音頻質(zhì)量的情況下通過高頻重構(gòu)來重建。
[0032]本實(shí)施例的另一優(yōu)點(diǎn)可以是:由于在上混級(jí)中執(zhí)行的參數(shù)上混只對(duì)與高于第一交越頻率的頻率對(duì)應(yīng)的頻譜系數(shù)操作,因此降低了上混的復(fù)雜度。
[0033]根據(jù)另一實(shí)施例,在第一組合級(jí)中執(zhí)行的所述組合是在頻域中執(zhí)行的,其中包括與介于第一和第二交越頻率之間的頻率對(duì)應(yīng)的頻譜系數(shù)的N個(gè)波形編碼下混信號(hào)中的每一個(gè)和包括與高至第一交越頻率的頻率對(duì)應(yīng)的頻譜系數(shù)的N個(gè)下混信號(hào)中的對(duì)應(yīng)下混信號(hào)組合成N個(gè)組合下混。
[0034]本實(shí)施例的優(yōu)點(diǎn)可以是:M個(gè)波形編碼信號(hào)和N個(gè)波形編碼下混信號(hào)可以由波形編碼器分別使用為所述Μ個(gè)的波形編碼的信號(hào)和N個(gè)波形編碼的下混信號(hào)獨(dú)立加窗(independent windowing)的重疊窗變換(overlapping windowed transforms)來編碼,并且仍然能夠被解碼器解碼。
[0035]根據(jù)另一實(shí)施例,在高頻重構(gòu)級(jí)中把N個(gè)組合下混信號(hào)中的每一個(gè)擴(kuò)展到第二交越頻率以上的頻率范圍是在頻域中執(zhí)行的。
[0036]根據(jù)另一實(shí)施例,在第二組合步驟中執(zhí)行的組合,S卩,包括與高于第一交越頻率的頻率對(duì)應(yīng)的頻譜系數(shù)的Μ個(gè)上混信號(hào)和包括與高至第一交越頻率的頻率對(duì)應(yīng)的頻譜系數(shù)的Μ個(gè)波形編碼信號(hào)的組合,是在頻域中執(zhí)行的。如上面所提到的,在QMF域中組合信號(hào)的優(yōu)點(diǎn)是:可以使用用來對(duì)MDCT中的信號(hào)進(jìn)行編碼的重疊窗變換的獨(dú)立加窗。
[0037]根據(jù)另一實(shí)施例,在上混級(jí)執(zhí)行的Ν個(gè)頻率擴(kuò)展的組合下混信號(hào)到Μ個(gè)上混信號(hào)的參數(shù)上混是在頻域中執(zhí)行的。
[0038]根據(jù)又一實(shí)施例,把Μ個(gè)波形編碼信號(hào)下混成包括與高至第一交越頻率的頻率對(duì)應(yīng)的頻譜系數(shù)的Ν個(gè)下混信號(hào)是在頻域中執(zhí)行的。
[0039]根據(jù)實(shí)施例,頻域是正交鏡像濾波器(QMF)域。
[0040]根據(jù)另一實(shí)施例,在下混級(jí)中執(zhí)行的下混是在時(shí)域中執(zhí)行的,其中Μ個(gè)波形編碼信號(hào)被下混成包括與高至第一交越頻率的頻率對(duì)應(yīng)的頻譜系數(shù)的Ν個(gè)下混信號(hào)。
[0041]根據(jù)又一實(shí)施例,第一交越頻率取決于多聲道音頻處理系統(tǒng)的比特傳輸速率。這會(huì)導(dǎo)致可用帶寬被用來提高解碼音頻信號(hào)的質(zhì)量,因?yàn)橐纛l信號(hào)中具有低于第一交越頻率的頻率的部分是純波形編碼的。
[0042]根據(jù)另一實(shí)施例,通過在高頻重構(gòu)級(jí)執(zhí)行高頻重構(gòu)把Ν個(gè)組合下混信號(hào)中的每一個(gè)擴(kuò)展到第二交越頻率以上的頻率范圍是使用高頻重構(gòu)參數(shù)來執(zhí)行的。高頻重構(gòu)參數(shù)可以例如在接收級(jí)由解碼器接收,然后被發(fā)送到高頻重構(gòu)級(jí)。高頻重構(gòu)例如可以包括執(zhí)行譜帶復(fù)制(SBR) ο
[0043]根據(jù)另一實(shí)施例,上混級(jí)中的參數(shù)上混是利用上混參數(shù)進(jìn)行的。上混參數(shù)例如在接收級(jí)由編碼器接收,并被發(fā)送到上混級(jí)。Ν