專利名稱:用于針對(duì)視頻編碼和解碼的改進(jìn)量化舍入偏移調(diào)節(jié)的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明的原理一般地涉及視頻編碼和解碼,并且更具體地,涉及用于針對(duì)視頻編碼和解碼的改進(jìn)量化舍入偏移(improved quantization rounding offset)調(diào)節(jié)的方法和設(shè)備。
背景技術(shù):
許多視頻應(yīng)用在給定比特率的約束條件下力求盡可能高的感知質(zhì)量。例如,在諸如視頻電話系統(tǒng)之類的低比特率應(yīng)用中,視頻編碼器可以通過消除在視覺上更為重要的關(guān)心區(qū)域處的強(qiáng)視覺偽影來提供更高的質(zhì)量。另一方面,在高比特率應(yīng)用中,在圖片中的任何位置都期望視覺上無損的質(zhì)量于是視頻編碼器還需要實(shí)現(xiàn)透明質(zhì)量。在高比特率中獲得透明視覺質(zhì)量的一個(gè)挑戰(zhàn)在于保留細(xì)節(jié),特別是平滑區(qū)域處的細(xì)節(jié),由于人類視覺系統(tǒng)的紋理遮罩特性,平滑區(qū)域處的細(xì)節(jié)的損失比不平滑區(qū)域處的細(xì)節(jié)更為明顯。增大比特率是提高質(zhì)量最直接的方式之一。當(dāng)比特率是給定的時(shí),編碼器操縱其比特分配模塊來以可以獲得最大視覺質(zhì)量提高的方式使用可用的比特。在諸如DVD制作之類的非實(shí)時(shí)應(yīng)用中,視頻編碼器可以輔助可用比特率(VBR)設(shè)計(jì)來產(chǎn)生在難弄的和容易的內(nèi)容上隨時(shí)間都保持恒定質(zhì)量的視頻。在這樣的應(yīng)用中,可用比特被適當(dāng)?shù)胤植荚诓煌囊曨l片段上以便獲得恒定質(zhì)量。相比較地,恒定比特率(CBR)系統(tǒng)向一個(gè)或多個(gè)圖片的間隔指派相同數(shù)目的比特而不論它們的編碼難度如何,并且產(chǎn)生隨著視頻內(nèi)容變化的視覺質(zhì)量。對(duì)于VBR編碼系統(tǒng)和CBR編碼系統(tǒng)二者,編碼器根據(jù)圖片內(nèi)的感知模型來分配比特。人類感知的一個(gè)特點(diǎn)是紋理遮罩,其說明了為什么人眼對(duì)平滑區(qū)域中的質(zhì)量損失比紋理區(qū)域中的質(zhì)量損失更為敏感。該特性可被利用來增大被分配到平滑區(qū)域的比特?cái)?shù)以獲得高視覺質(zhì)量。視頻編碼器中的量化處理控制已編碼比特的數(shù)目以及質(zhì)量。通常通過調(diào)節(jié)量化參數(shù)來調(diào)節(jié)質(zhì)量。為了說明目的,參考國際標(biāo)準(zhǔn)化組織/國際電工委員會(huì)(IS0/IEC)運(yùn)動(dòng)圖像專家組-4(MPEG-4)第10部分高級(jí)視頻編碼(AVC)標(biāo)準(zhǔn)/國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部 (ITU-T)H. 264建議(以下稱為“MPEG-4AVC標(biāo)準(zhǔn)”)作為基準(zhǔn)示例來說明通過在MPEG-4標(biāo)準(zhǔn)上實(shí)施本發(fā)明的原理可以具有的量化處理和改進(jìn)。然而,可以明白,本發(fā)明的原理不僅僅限于MPEG-4AVC標(biāo)準(zhǔn),并且因此,在保持本發(fā)明的原理的精神的同時(shí)可以被應(yīng)用于其它視頻編碼標(biāo)準(zhǔn)、建議及其擴(kuò)展。算術(shù)上,在編碼器中,變換后的系數(shù)被量化如下
4
其中W是變換后的系數(shù)并且被量化為量化電平Ζ。這里,q是量化階梯
(quantization step)大小,并且 s 是量化舍入偏移。函數(shù)U將值舍入為最接近的整數(shù)
并且sgn(.)返回信號(hào)的符號(hào)。當(dāng)量化矩陣被應(yīng)用時(shí),系數(shù)在編碼器器處在量化處理之前首先被縮放。W被量化為0的范圍稱為死區(qū)(deadzone)。在該特定情況中,死區(qū)是Δ = (1-s) XqX2。在解碼器處,量化電平7被重構(gòu)為信號(hào)W’。這稱為逆量化并且被算術(shù)描述如下
權(quán)利要求
1.一種設(shè)備,包括視頻編碼器(100),所述視頻編碼器通過如下步驟來對(duì)輸入編碼單元進(jìn)行編碼為所述輸入編碼單元確定與所述輸入編碼單元和參考編碼單元之間的差相對(duì)應(yīng)的殘差,對(duì)所述殘差應(yīng)用變換來獲得至少一個(gè)變換系數(shù),以及通過選擇量化階梯大小和舍入偏移來對(duì)所述至少一個(gè)變換系數(shù)進(jìn)行量化。
2.如權(quán)利要求1所述的設(shè)備,其中,所述舍入偏移被選擇以被應(yīng)用于包括所述編碼單元的整個(gè)視頻序列、所述序列的一部分、與所述編碼單元有關(guān)的圖片或所述圖片中的區(qū)域。
3.如權(quán)利要求2所述的設(shè)備,其中,所述部分包括被包括在一個(gè)或多個(gè)圖片組中或獨(dú)立于一個(gè)或多個(gè)圖片組的一個(gè)或多個(gè)圖片或一個(gè)或多個(gè)場景,并且其中,所述區(qū)域包括一個(gè)或多個(gè)宏塊。
4.如權(quán)利要求3所述的設(shè)備,其中,不同的舍入偏移能夠被應(yīng)用于所述一個(gè)或多個(gè)場景、所述一個(gè)或多個(gè)圖片和所述一個(gè)或多個(gè)宏塊中的不同場景、圖片或宏塊。
5.如權(quán)利要求1所述的設(shè)備,其中,所述舍入偏移是響應(yīng)于以下中的至少一者被選擇的像素域方差、變換域方差和特定的量化階梯大小或另一量化階梯大小時(shí)的零系數(shù)的數(shù)目。
6.如權(quán)利要求1所述的設(shè)備,其中,所述舍入偏移是響應(yīng)于以下中的至少一者被選擇的包括所述編碼單元的整個(gè)視頻序列、所述視頻序列的一部分、與所述編碼單元有關(guān)的圖片、所述圖片中的區(qū)域以及所述區(qū)域被分類為平滑還是紋理。
7.如權(quán)利要求6所述的設(shè)備,其中,所述區(qū)域包括一個(gè)或多個(gè)宏塊,并且僅針對(duì)被分類為平滑的宏塊選擇和應(yīng)用舍入偏移,而對(duì)被分類為紋理的宏塊應(yīng)用所述編碼器通常所使用的默認(rèn)舍入偏移。
8.如權(quán)利要求7所述的設(shè)備,其中,所述舍入偏移是響應(yīng)于以下中的至少一者被選擇的所述輸入編碼單元是使用幀內(nèi)預(yù)測還是幀間預(yù)測被編碼的,一個(gè)或多個(gè)變換類型,以及用于對(duì)所述編碼單元進(jìn)行編碼的一個(gè)或多個(gè)不同比特率。
9.如權(quán)利要求1所述的設(shè)備,其中,所述編碼器(100)將描述所選擇的舍入偏移的信息嵌入在由所述編碼器輸出的比特流中。
10.一種視頻編碼器中用于對(duì)輸入編碼單元進(jìn)行編碼的方法,包括為所述輸入編碼單元確定(1010)與所述輸入編碼單元和參考編碼單元之間的差相對(duì)應(yīng)的殘差;對(duì)所述殘差應(yīng)用變換(1015)來獲得至少一個(gè)變換系數(shù);以及通過選擇量化階梯大小和舍入偏移來對(duì)所述至少一個(gè)變換系數(shù)進(jìn)行量化(1020)。
11.如權(quán)利要求10所述的方法,其中,所述舍入偏移被選擇以被應(yīng)用于包括所述編碼單元的整個(gè)視頻序列、所述序列的一部分、與所述編碼單元有關(guān)的圖片或所述圖片中的區(qū)域(1210)。
12.如權(quán)利要求11所述的方法,其中,所述部分包括被包括在一個(gè)或多個(gè)圖片組中或獨(dú)立于一個(gè)或多個(gè)圖片組的一個(gè)或多個(gè)圖片或一個(gè)或多個(gè)場景,并且其中,所述區(qū)域包括一個(gè)或多個(gè)宏塊。
13.如權(quán)利要求12所述的方法,其中,不同的舍入偏移能夠被應(yīng)用于所述一個(gè)或多個(gè)場景、所述一個(gè)或多個(gè)圖片和所述一個(gè)或多個(gè)宏塊中的不同場景、圖片或宏塊。
14.如權(quán)利要求10所述的方法,其中,所述舍入偏移是響應(yīng)于以下中的至少一者被選擇的像素域方差、變換域方差和特定的量化階梯大小或另一量化階梯大小時(shí)的零系數(shù)的數(shù)目(1110)。
15.如權(quán)利要求10所述的方法,其中,所述舍入偏移是響應(yīng)于以下中的至少一者被選擇的包括所述編碼單元的整個(gè)視頻序列、所述視頻序列的一部分、與所述編碼單元有關(guān)的圖片、所述圖片中的區(qū)域以及所述區(qū)域被分類為平滑還是紋理(1110)。
16.如權(quán)利要求15所述的方法,其中,所述區(qū)域包括一個(gè)或多個(gè)宏塊,并且僅針對(duì)被分類為平滑的宏塊選擇和應(yīng)用舍入偏移,而對(duì)被分類為紋理的宏塊應(yīng)用所述編碼器通常所使用的默認(rèn)舍入偏移。
17.如權(quán)利要求16所述的方法,其中,所述舍入偏移是響應(yīng)于以下中的至少一者被選擇的所述輸入編碼單元是使用幀內(nèi)預(yù)測還是幀間預(yù)測被編碼的,一個(gè)或多個(gè)變換類型,以及用于對(duì)所述編碼單元進(jìn)行編碼的一個(gè)或多個(gè)不同比特率(1110)。
18.如權(quán)利要求10所述的方法,還包括將描述所選擇的舍入偏移的信息嵌入在由所述編碼器輸出的比特流中。
19.一種設(shè)備,包括視頻解碼器000),所述視頻解碼器用于通過如下步驟對(duì)編碼單元進(jìn)行解碼接收與所述編碼單元的原始版本和參考編碼單元之間的已變換并已量化的殘差相對(duì)應(yīng)的至少一個(gè)已量化的系數(shù),通過選擇量化階梯大小和舍入偏移來對(duì)所述至少一個(gè)已量化的系數(shù)進(jìn)行逆量化以獲得至少一個(gè)逆量化后的系數(shù),以及對(duì)所述至少一個(gè)逆量化后的系數(shù)應(yīng)用逆變換來獲得重構(gòu)的殘差,其中,所述視頻解碼器從包括所述至少一個(gè)已量化的系數(shù)的比特流接收描述所選擇的舍入偏移的信息。
20.一種視頻解碼器中的用于對(duì)編碼單元進(jìn)行解碼的方法,包括接收(1310)與所述編碼單元的原始版本和參考編碼單元之間的已變換并已量化的殘差相對(duì)應(yīng)的至少一個(gè)已量化的系數(shù);通過選擇量化階梯大小和舍入偏移來對(duì)所述至少一個(gè)已量化的系數(shù)進(jìn)行逆量化 (1315)以獲得至少一個(gè)逆量化后的系數(shù);以及對(duì)所述至少一個(gè)逆量化后的系數(shù)應(yīng)用逆變換(1320)來獲得重構(gòu)的殘差,其中,所述視頻解碼器從包括所述至少一個(gè)已量化的系數(shù)的比特流接收描述所選擇的舍入偏移的信息(1310)。
21.一種將視頻信號(hào)數(shù)據(jù)編碼在其上的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),包括輸入編碼單元,所述輸入編碼單元通過如下步驟被編碼為所述輸入編碼單元確定與所述輸入編碼單元和參考編碼單元之間的差相對(duì)應(yīng)的殘差,對(duì)所述殘差應(yīng)用變換來獲得至少一個(gè)變換系數(shù),以及通過選擇量化階梯大小和舍入偏移來對(duì)所述至少一個(gè)變換系數(shù)進(jìn)行量化。
全文摘要
提供了用于針對(duì)視頻編碼和解碼的改進(jìn)量化舍入偏移調(diào)節(jié)的方法和設(shè)備。一種設(shè)備包括視頻編碼器(100),該視頻編碼器通過如下步驟來對(duì)輸入編碼單元進(jìn)行編碼為輸入編碼單元確定與所述輸入編碼單元和參考編碼單元之間的差相對(duì)應(yīng)的殘差,對(duì)所述殘差應(yīng)用變換來獲得至少一個(gè)變換系數(shù),以及通過選擇特定量化階梯大小和舍入偏移來對(duì)這至少一個(gè)變換系數(shù)進(jìn)行量化。
文檔編號(hào)H04N7/26GK102428702SQ201080021578
公開日2012年4月25日 申請(qǐng)日期2010年5月12日 優(yōu)先權(quán)日2009年5月16日
發(fā)明者克里斯蒂娜·古米拉, 呂小安, 許茜 申請(qǐng)人:湯姆遜許可證公司