專利名稱:一種視頻圖象編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻處理領(lǐng)域,具體地說,是一種視頻圖象編碼方法。
背景技術(shù):
目前,視頻領(lǐng)域的技術(shù)突飛猛進(jìn),關(guān)于視頻編碼的技術(shù)方案很多,但由于余弦變換具有較好的去相關(guān)性能,并且易于快速實現(xiàn),因此,在視頻編碼領(lǐng)域得到了非常廣泛的應(yīng)用,現(xiàn)有的視頻壓縮標(biāo)準(zhǔn)MPEG-1、MPEG-2、MPEG-4(Part 2)、H.261、H.263都是基于8×8 DCT變換的,其一般的處理框架示意圖如圖1所示。
H.263的編碼壓縮框架如圖2所示,其中的“T”指的就是圖象數(shù)據(jù)或預(yù)測差值數(shù)據(jù)的8×8 DCT變換。
余弦變換的一般表示方式為F(u)=2πC(u)Σx=0n-1f(x)cos(2x+1)uπ2n,u=0,···,n]]>其中 由于DCT變換要進(jìn)行復(fù)雜的浮點運算,在IDCT中還存在由于失配而造成的精度不高問題,因此,一些專家分別提出了一些變換性能接近于DCT變換的整數(shù)變換方法,以降低計算復(fù)雜度,提高變換精度。
在文獻(xiàn)1[Antti Hallapuro,Marta Karczewicz,“Low Complexity Transform andQuantization-Part IBasic Implementation”,ISO/IEC JTC1/SC29/WG11 and ITU-TSG16 Q.6 Document JVT-B038,January 2002.]給出了一種2D 4×4 DCT-like整數(shù)變換方法,其變換矩陣為
C=111121-1-21-1-111-22-1]]>還給出了相應(yīng)的逆變換、量化和逆量化方法。該變換矩陣元素簡單,變換計算處理中只有加法和移位操作,硬件實現(xiàn)容易,該方法已被應(yīng)用于視頻壓縮標(biāo)準(zhǔn)H.264 & MPEG-4(Part 10)中,其編碼框圖如圖3所示。
文獻(xiàn)[1]所給出的2D 4×4 DCT-like整數(shù)變換方法,雖然其變換性能比較接近于DCT變換,但其變換結(jié)果與DCT相比相差較大,從而會降低變換性能及壓縮效率。
發(fā)明內(nèi)容
本發(fā)明的目的就是給出了一種基于4×4 DCT-like整數(shù)變換的視頻圖象編碼方法,為此,本發(fā)明采用如下技術(shù)方案一種視頻圖象編碼方法,包括以下步驟a、將輸入視頻圖象分割成16×16宏塊,并對I幀圖象進(jìn)行幀內(nèi)象素預(yù)測和補償處理,對P幀圖象進(jìn)行幀間運動估計及運動補償處理;b、變換器對輸入預(yù)測差值數(shù)據(jù)進(jìn)行變換處理;c、對變換系數(shù)進(jìn)行量化及熵編碼處理,并將編碼碼流傳遞給接收端;d、接收端對編碼碼流進(jìn)行熵解碼及逆量化處理;e、逆變換器對逆量化后系數(shù)進(jìn)行逆變換處理;f、對逆變換處理后的圖象數(shù)據(jù)進(jìn)行幀內(nèi)象素補償或幀間運動補償,并將解碼后的視頻圖象輸出;其特征在于所述的步驟b,采用2D 4×4 DCT-like整數(shù)變換方法對視頻圖象進(jìn)行變換處理,其變換計算采用如下公式Y(jié)=(CXCT)E所述的步驟e,采用2D 4×4 IDCT-like逆變換方法對視頻圖象進(jìn)行逆變換處理,其逆變換采用如下公式
X=CT(YE)C其中X為圖象數(shù)據(jù)距陣或預(yù)測差值數(shù)據(jù)距陣,Y為相應(yīng)的變換系數(shù)距陣,表示兩個矩陣對應(yīng)位置的元素相乘,E為一個伸縮矩陣。
所述的視頻圖象編碼方法,可以做如下近似取值bc=2.5,a=12,c=2158,]]>C=111152-2-51-1-112-55-2,]]>E=a2ac2a2ac2ac2c24ac2c24a2ac2a2ac2ac2c24ac2c24≈0.250.06570.250.06570.06570.01720.06570.01720.250.06570.250.06570.06570.01720.06570.0172.]]>所述的視頻圖象編碼方法,可以做如下近似取值bc=0.5,a=12,c=25,]]>C=111112-2-11-1-112-11-2,]]>E=a2ac2a2ac2ac2c24ac2c24a2ac2a2ac2ac2c24ac2c24≈0.250.15810.250.15810.15810.10000.15810.10000.250.15810.250.15810.15810.10000.15810.1000.]]>所述的視頻圖象編碼方法,可以做如下近似取值bc=1.5,a=12,]]>c=2126,]]>
C=111132-2-31-1-112-33-2,]]>E=a2ac2a2ac2ac2c24ac2c24a2ac2a2ac2ac2c24ac2c24≈0.250.09810.250.09810.09810.03850.09810.03850.250.09810.250.09810.09810.03850.09810.0385.]]>所述的視頻圖象編碼方法,可以做如下近似取值bc=2.4,a=12,]]>c=51312,]]>C=1111125-5-121-1-115-1212-5,]]>E=a2ac5a2ac5ac5c225ac5c225a2ac5a2ac5ac5c225ac5c225≈0.250.02720.250.02720.02720.00300.02720.00300.250.02720.250.02720.02720.00300.02720.0030.]]>所述的視頻圖象編碼方法,可以做如下近似取值bc=2.6,a=12,]]>c=52197,]]>C=1111135-5-131-1-115-1313-5,]]>
E=a2ac5a2ac5ac5c225ac5c225a2ac5a2ac5ac5c225ac5c225≈0.250.02540.250.02540.02540.00260.02540.00260.250.02540.250.02540.02540.00260.02540.0026.]]>所述的視頻圖象編碼方法,可以做如下近似取值bc=3.0,a=12,]]>c=1215,]]>C=111131-1-31-1-111-33-1,]]>E=a2aca2acacc2acc2a2aca2acacc2acc2≈0.250.11180.250.11180.11180.05000.11180.05000.250.11180.250.11180.11180.05000.11180.0500.]]>所述的視頻圖象編碼方法,可以做如下近似取值bc=3.5,a=12,]]>c=21106,]]>C=111172-2-71-1-112-77-2,]]>E=a2ac2a2ac2ac2c24ac2c24a2ac2a2ac2ac2c24ac2c24≈0.250.04860.250.04860.04860.00940.04860.00940.250.04860.250.04860.04860.00940.04860.0094.]]>所述的視頻圖象編碼方法,可以做如下近似取值bc=4.0,a=12,]]>
c=134,]]>C=111141-1-41-1-111-44-1,]]>E=a2aca2acacc2acc2a2aca2acacc2acc2≈0.250.08570.250.08570.08570.02940.08570.02940.250.08570.250.08570.08570.02940.08570.0294.]]>將所述的“E”相乘處理并入到量化和逆量化處理過程中。
本發(fā)明所給出的整數(shù)變換方法在計算性能上與現(xiàn)有技術(shù)相當(dāng),變換過程只涉及到加法和乘法運算,但更接近于DCT的變換性能,從而具有類似于DCT的較好的去相關(guān)性能,具有更優(yōu)的變換性能,可以得到更好的視頻壓縮效果。
圖1是基于DCT的視頻編碼框架示意圖;圖2是現(xiàn)有技術(shù)中H.263視頻編碼示意圖;圖3是H.264 & MPEG-4(Part 10)視頻編碼框架示意圖;圖4是本發(fā)明對視頻圖象進(jìn)行編碼處理的示意圖;圖5是本發(fā)明對視頻圖象進(jìn)行編碼處理的流程圖。
具體實施例方式
下面結(jié)合說明書附圖來說明本發(fā)明的具體實施方式
。
如圖4及圖5所示,是本發(fā)明對視頻圖象進(jìn)行編碼處理的示意圖及流程圖,從圖中可以看出,本發(fā)明主要包括以下步驟a、將輸入視頻圖象分割成16×16宏塊,并對I幀圖象進(jìn)行幀內(nèi)象素預(yù)測和補償,對P幀圖象進(jìn)行幀間運動估計及運動補償;b、變換器對輸入預(yù)測差值數(shù)據(jù)進(jìn)行變換處理;
c、對變換系數(shù)進(jìn)行量化及熵編碼處理,并將編碼碼流傳遞給接收端;d、接收端對編碼碼流進(jìn)行熵解碼及逆量化處理;e、逆變換器對逆量化后系數(shù)進(jìn)行逆變換處理;f、對逆變換處理后的圖象數(shù)據(jù)進(jìn)行幀內(nèi)象素補償或幀間運動補償,并將解碼后的視頻圖象輸出。
對于b和e,本發(fā)明中,采用一種新的變換方法和相應(yīng)的逆變換方法,提出一種新的2D 4×4 DCT-like整數(shù)變換方法和相應(yīng)的量化方法,下面具體介紹一下其中X為4×4圖象數(shù)據(jù)矩陣或預(yù)測差值數(shù)據(jù)矩陣,Y為相應(yīng)的4×4變換系數(shù)矩陣,T表示矩陣的轉(zhuǎn)置。
我們知道,2D 4×4正向DCT變換方法為Y=AXAT=aaaabc-c-ba-a-aac-bb-cx00x01x02x03x10x11x12x13x20x21x22x23x30x31x32x33abacac-a-ba-c-aba-ba-c---(1)]]>2D 4×4逆向DCT變換方法為X=ATYA其中A為變換矩陣,a=12,b=12cos(π8),c=12cos(3π8).]]>可以將(1)式改寫為Y=BCXCTB]]>=a0000c0000a0000c1111bc1-1-bc1-1-111-bcbc-1x00x01x02x03x10x11x12x13x20x21x22x23x30x31x32x331bc1111-1-bc1-1-1bc1-bc1-1a0000c0000a0000c---(2)]]>=(1111bc1-1-bc1-1-111-bcbc-1x00x01x02x03x10x11x12x13x20x21x22x23x30x31x32x331bc1111-1-bc1-1-1bc1-bc1-1)⊗a2aca2acacc2acc2a2aca2acacc2acc2]]>其中表示兩個矩陣對應(yīng)位置的元素相乘。
在文獻(xiàn)[1]中,將cb=2-1=0.41421...]]>近似取為 再由ATA=I可得b=25,]]>c=110,]]>從而得到了如下變換方法正向變換Y=a0000b0000a0000b1111112-12-11-1-1112-11-12x00x01x02x03x10x11x12x13x20x21x22x23x30x31x32x3311112112-1-11-12-111-11-12a0000b0000a0000b]]>=(1111112-12-11-1-1112-11-12x00x01x02x03x10x11x12x13x20x21x22x23x30x31x32x3311112112-1-11-12-111-11-12)⊗a2aba2ababb2abb2a2aba2ababb2abb2]]>=(111121-1-21-1-111-22-1x00x01x02x03x10x11x12x13x20x21x22x23x30x31x32x33121111-1-21-1-121-21-1)⊗a2ab2a2ab2ab2b24ab2b24a2ab2a2ab2ab2b24ab2b24---(3)]]>逆向變換X=1111112-12-11-1-1112-11-12(y00y01y02y03y10y11y12y13y20y21y22y23y30y31y32y33⊗a2aba2ababb2abb2a2aba2ababb2abb2)11112112-1-11-12-111-11-12---(4)]]>由于bc=2+1=2.41421...,]]>比較(2)、(3)式可以看出,(3)式中的整數(shù)變換相當(dāng)于取bc≈2,]]>顯然過于粗糙,為了進(jìn)一步提高變換精度,使變換性能更接近于DCT,本專利取bc≈52=2.5,]]>再由ATA=I可得b=5158,c=2158,]]>因此,由(2)可得如下變換方法
正向變換Y=(CXCT)⊗E]]>=(1111521-1-521-1-111-5252-1x00x01x02x03x10x11x12x13x20x21x22x23x30x31x32x331521111-1-521-1-1521-521-1)⊗a2aca2acacc2acc2a2aca2acacc2acc2]]>=(111152-2-51-1-112-55-2x00x01x02x03x10x11x12x13x20x21x22x23x30x31x32x33151212-1-51-2-151-51-2)⊗a2ac2a2ac2ac2c24ac2c24a2ac2a2ac2ac2c24ac2c24---(5)]]>逆向變換X=CT(Y⊗E)C]]>=151212-1-51-2-151-51-2(y00y01y02y03y10y11y12y13y20y21y22y23y30y31y32y33⊗a2ac2a2ac2ac2c24ac2c24a2ac2a2ac2ac2c24ac2c24)111152-2-51-1-112-55-2---(6)]]>由于a=12]]>和c=2158,]]>則E=a2ac2a2ac2ac2c24ac2c24a2ac2a2ac2ac2c24ac2c24≈0.250.06570.250.06570.06570.01720.06570.01720.250.06570.250.06570.06570.01720.06570.0172]]>其相乘處理可以并入到對變換系數(shù)的量化處理過程中。
下面通過兩個典型的例子來進(jìn)行比較說明。
例14×4圖象為X1=51181098412110114196157,]]>則其DCT變換結(jié)果為Y10=35.0000-0.0793-1.50001.1152-3.2992-4.76780.4427-9.01045.50003.02862.00004.6987-4.0454-3.0104-9.3837-1.2322,]]>由(3)式計算的結(jié)果為Y11=35.0000-0.1581-1.50001.1068-3.0042-3.90001.1068-9.20005.50002.68792.00004.9015-4.2691-3.2000-9.3287-2.1000,]]>與DCT的誤差為Y10-Y11=0.00000.07890.00000.0084-0.2951-0.8678-0.66410.18960.00000.34070.0000-0.20290.22370.18960.05500.8678,]]>由(5)式計算的結(jié)果為Y12=35.0000-0.0657-1.50001.1161-3.3483-4.91380.3283-8.96555.50003.08572.00004.6614-4.0048-2.9655-9.3884-1.0862,]]>與DCT的誤差為Y10-Y12=0.0000-0.01360.0000-0.00090.04910.14600.1144-0.04490.0000-0.05710.00000.0373-0.0405-0.04490.0047-0.1460]]>例24×4圖象為X2=164149888714794901029592116119111112140150,]]>則其DCT變換結(jié)果為Y20=464.000021.030723.50003.7363-6.677779.48719.6158-17.374436.500012.7237-12.0000-15.0119-6.9755-7.3744-18.5953-7.4871,]]>
由(3)式計算的結(jié)果為Y21=464.000020.712923.50005.2178-6.166480.800010.9099-11.100036.500013.7559-12.0000-14.0721-7.4314-1.1000-17.8669-8.8000,]]>與DCT的誤差為Y20-Y21=0.00000.31780.0000-1.4814-0.5113-1.3129-1.2940-6.27440.0000-1.03220.0000-0.93970.4558-6.2744-0.72841.3129,]]>由(5)式計算的結(jié)果為Y22=464.000021.074723.50003.4796-6.762379.17249.3884-18.431036.500012.5398-12.0000-15.1659-6.8936-8.4310-18.7112-7.1724,]]>與DCT的誤差為Y20-Y22=0.0000-0.04400.00000.25670.08460.31470.22741.05670.00000.18400.00000.1540-0.08191.05670.1159-0.3147]]>本發(fā)明的基本思想如上所述,但可以將 取為
中的其它值,從而得到相應(yīng)的變換矩陣。例如(1)取bc=0.5,]]>則得到如下變換矩陣和E矩陣為C=111112-2-11-1-111-11-2]]>a=12,b=110,c=25,]]>E=a2ac2a2ac2ac2c24ac2c24a2ac2a2ac2ac2c24ac2c24≈0.250.15810.250.15810.15810.10000.15810.10000.250.15810.250.15810.15810.10000.15810.1000]]>
(2)取bc=1.5,]]>則得到如下變換矩陣和E矩陣為C=111132-2-31-1-112-33-2]]>a=12,b=3126,c=2126,]]>E=a2ac2a2ac2ac2c24ac2c24a2ac2a2ac2ac2c24ac2c24≈0.250.09810.250.09810.09810.03850.09810.03850.250.09810.250.09810.09810.03850.9810.0385]]>(3)取bc=2.4,]]>則得到如下變換矩陣和E矩陣為C=1111125-5-121-1-115-1212-5]]>a=12,b=121312,c=51312,]]>E=a2ac5a2ac5ac5c225ac5c225a2ac5a2ac5ac5c225ac5c225≈0.250.02720.250.02720.02720.00300.02720.00300.250.02720.250.02720.02720.00300.02720.0030.]]>(4)取bc=2.6,]]>則得到如下變換矩陣和E矩陣為C=1111135-5-131-1-115-1313-5]]>
a=12,b=132197,c=52197,]]>E=a2ac5a2ac5ac5c225ac5c225a2ac5a2ac5ac5c225ac5c225≈0.250.02540.250.02540.02540.00260.02540.00260.250.02540.250.02540.02540.00260.02540.0026.]]>(5)取bc=3.0,]]>則得到如下變換矩陣和E矩陣為C=111131-1-31-1-111-33-1]]>a=12,b=3215,c=1215,]]>E=a2aca2acacc2acc2a2aca2acacc2acc2≈0.250.11180.250.11180.11180.05000.11180.05000.250.11180.250.11180.11180.05000.11180.0500]]>(6)取bc=3.5,]]>則得到如下變換矩陣和E矩陣為C=111172-2-71-1-112-77-2]]>a=12,b=71106,c=21106,]]>
E=a2ac2a2ac2ac2c24ac2c24a2ac2a2ac2ac2c24ac2c24≈0.250.04860.250.04860.04860.00940.04860.00940.250.04860.250.04860.04860.00940.04860.0094]]>(7)取bc=4.0,]]>則得到如下變換矩陣和E矩陣為C=111141-1-41-1-111-44-1]]>a=12,b=4134,c=134,]]>E=a2aca2acacc2acc2a2aca2acacc2acc2≈0.250.08570.250.08570.08570.02940.08570.02940.250.08570.250.08570.08570.02940.08570.0294]]>對比(3)、(4)與(5)、(6),并通過以上例子可以看出,本專利所述DCT-like整數(shù)變換方法的計算性能與文獻(xiàn)[1]所述方法相當(dāng),但更為接近于DCT的變換性能。
以上所述,僅為本發(fā)明較佳的具體實施方式
,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求書的保護(hù)范圍為準(zhǔn)。
權(quán)利要求
1.一種視頻圖象編碼方法,包括以下步驟a、將輸入視頻圖象分割成16×16宏塊,并對I幀圖象進(jìn)行幀內(nèi)象素預(yù)測和補償處理,對P幀圖象進(jìn)行幀間運動估計及運動補償處理;b、變換器對輸入預(yù)測差值數(shù)據(jù)進(jìn)行變換處理;c、對變換系數(shù)進(jìn)行量化及熵編碼處理,并將編碼碼流傳遞給接收端;d、接收端對編碼碼流進(jìn)行熵解碼及逆量化處理;e、逆變換器對逆量化后系數(shù)進(jìn)行逆變換處理;f、對逆變換處理后的圖象數(shù)據(jù)進(jìn)行幀內(nèi)象素補償或幀間運動補償,并將解碼后的視頻圖象輸出;其特征在于所述的步驟b,采用2D 4×4 DCT-like整數(shù)變換方法對視頻圖象進(jìn)行變換處理,其變換計算采用如下公式Y(jié)=(CXCT)E所述的步驟e,采用2D 4×4 IDCT-like逆變換方法對視頻圖象進(jìn)行逆變換處理,其逆變換采用如下公式X=CT(YE)C其中X為圖象數(shù)據(jù)距陣或預(yù)測差值數(shù)據(jù)距陣,Y為相應(yīng)的變換系數(shù)距陣,CT表示矩陣C的轉(zhuǎn)置矩陣,表示兩個矩陣對應(yīng)位置的元素相乘,E為一個伸縮矩陣,在方法實施過程中,做如下近似取值bc=2.5,a=12,c=2158,]]>C=111152-2-51-1-112-55-2,]]>E=a2ac2a2ac2ac2c24ac2c24a2ac2a2ac2ac2c24ac2c24≈0.250.06570.250.06570.06570.01720.06570.01720.250.06570.250.06570.06570.01720.06570.0172.]]>
2.如權(quán)利要求1所述的視頻圖象編碼方法,其特征在于在方法實施過程中,做如下近似取值bc=0.5,a=12,c=25,]]>C=111112-2-11-1-112-11-2,]]>E=a2ac2a2ac2ac2c24ac2c24a2ac2a2ac2ac2c24ac2c24≈0.250.15810.250.15810.15810.10000.15810.10000.250.15810.250.15810.15810.10000.15810.1000.]]>
3.如權(quán)利要求1所述的視頻圖象編碼方法,其特征在于在方法實施過程中,做如下近似取值bc=1.5,a=12,c=2126,]]>C=111132-2-31-1-112-33-2,]]>E=a2ac2a2ac2ac2c24ac2c24a2ac2a2ac2ac2c24ac2c24≈0.250.09810.250.09810.09810.03850.09810.03850.250.09810.250.09810.09810.03850.09810.0385.]]>
4.如權(quán)利要求1所述的視頻圖象編碼方法,其特征在于在方法實施過程中,做如下近似取值bc=2.4,a=12,c=51312,]]>C=1111125-5-121-1-115-1212-5,]]>E=a2ac5a2ac5ac5c225ac5c225a2ac5a2ac5ac5c225ac5c225≈0.250.02720.250.02720.02720.00300.02720.00300.250.02720.250.02720.02720.00300.02720.0030.]]>
5.如權(quán)利要求1所述的視頻圖象編碼方法,其特征在于在方法實施過程中,做如下近似取值bc=2.6,a=12,c=52197,]]>C=1111135-5-131-1-115-1313-5,]]>E=a2ac5a2ac5ac5c525ac5c225a2ac5a2ac5ac5c225ac5c225≈0.250.02540.250.02540.02540.00260.02540.00260.250.02540.250.02540.02540.00260.02540.0026.]]>
6.如權(quán)利要求1所述的視頻圖象編碼方法,其特征在于在方法實施過程中,做如下近似取值bc=3.0,a=12,c=1215,]]>C=111131-1-31-1-111-33-1,]]>E=a2aca2acacc2acc2a2aca2acacc2acc2≈0.250.11180.250.11180.11180.05000.11180.05000.250.11180.250.11180.11180.05000.11180.0500.]]>
7.如權(quán)利要求1所述的視頻圖象編碼方法,其特征在于在方法實施過程中,做如下近似取值bc=3.5,a=12,c=21106,]]>C=111172-2-71-1-112-77-2,]]>E=a2ac2a2ac2ac2c24ac2c24a2ac2a2ac2ac2c24ac2c24≈0.250.04860.250.04860.04860.00940.04860.00940.250.04860.250.04860.04860.00940.04860.0094.]]>
8.如權(quán)利要求1所述的視頻圖象編碼方法,其特征在于在方法實施過程中,做如下近似取值bc=4.0,a=12,c=134,]]>C=111141-1-41-1-111-44-1,]]>E=a2aca2acacc2acc2a2aca2acacc2acc2≈0.250.08570.250.08570.08570.02940.08570.02940.250.08570.250.08570.08570.02940.08570.0294.]]>
9.如權(quán)利要求1所述的視頻圖象編碼方法,其特征在于將所述的“E”相乘處理并入到量化和逆量化處理過程中。
全文摘要
一種視頻編碼方法,該方法先對圖象進(jìn)行宏塊預(yù)測和補償處理,然后對預(yù)測差值進(jìn)行4×4 DCT-like整數(shù)變換處理,再對變換系數(shù)分別進(jìn)行量化和熵編碼處理。該方法采用了一種新的4×4 DCT-like整數(shù)變換方法和相應(yīng)的逆變換、量化、逆量化方法,該變換方法的計算復(fù)雜度較低,變換過程只涉及到加法和乘法運算,變換性能非常接近于4×4 DCT,從而具有類似于DCT的較好的去相關(guān)性能,可以得到較好的視頻壓縮效果。
文檔編號H04N7/50GK1533184SQ0314630
公開日2004年9月29日 申請日期2003年7月8日 優(yōu)先權(quán)日2003年3月24日
發(fā)明者熊聯(lián)歡 申請人:華為技術(shù)有限公司