專利名稱:一種基于幾何分割的視頻圖像解編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻圖像的編解碼方法,尤其是一種基于幾何分割的視頻圖像編解碼方法。
背景技術(shù):
現(xiàn)有的視頻編碼標(biāo)準(zhǔn)均采用規(guī)則塊分割方法進(jìn)行幀間運動估計和運動補償,規(guī)則塊分割結(jié)構(gòu)簡單,易于實現(xiàn)。特別是最新的視頻標(biāo)準(zhǔn)H.沈4,采用更小的塊尺寸(4x4)描述運動物體邊界,極大提高了運動估計的準(zhǔn)確性。但是,規(guī)則塊分割模型的塊邊界均是基于水平和垂直方向,無法描述自然圖像中運動物體復(fù)雜多變的邊界。
MPEGl、MPEG4等傳統(tǒng)視頻編碼采用8x8的二維離散余弦變換(2_D DCT),利用圖像像素亮度間的高相關(guān)性以及DCT接近于最佳KL變換的性質(zhì),消除圖像信號的空間冗余。視頻標(biāo)準(zhǔn)H. 264為了降低運算復(fù)雜度及消除DCT和IDCT的失配,采用了 4x4的二維整數(shù)變換 (2-D ICT),相比于二維離散余弦變換,其編碼效率有所下降。由于二維離散余弦變換的變換基的正交性,當(dāng)待編碼圖像塊中包含有非垂直/非水平方向的邊界信息時,DCT變換會產(chǎn)生較多的非零高頻系數(shù),限制了 DCT變換的壓縮效率。
由于自然視頻圖像中的運動物體邊界是不規(guī)則的,存在著各種斜率的邊界和具有曲率的曲線邊界,因此,不規(guī)則的幾何分割更能準(zhǔn)確描述其物體邊界。幾何分割塊經(jīng)過運動補償后,殘差更多地集中在分割邊界,經(jīng)過傳統(tǒng)二維正交變換后,將產(chǎn)生較多高頻非零系數(shù),限制了壓縮效率的提高。發(fā)明內(nèi)容
本發(fā)明提出一種基于幾何分割的視頻圖像編解碼方法,將幾何分割運動補償和像素重排相結(jié)合,利用編碼塊不規(guī)則的分割信息表達(dá)殘差塊像素的重排方向,將不規(guī)則塊分割所得到的邊界殘差旋轉(zhuǎn)到水平/垂直方向,從而減少二維正交變換系數(shù)的高頻成分,提高壓縮效率。
本發(fā)明一種基于幾何分割的視頻圖像編解碼的方法,其中編碼包括以下步驟 步驟1、將輸入視頻圖像分割成若干矩形編碼塊;步驟2、分別對分割后每一個矩形編碼塊執(zhí)行步驟3到步驟8的操作;步驟3、對選定的矩形編碼塊設(shè)定一組候選分割模式集合S,步驟4、選取候選分割模式集合S中的一種分割模式Si對所述矩形編碼塊進(jìn)行分割, 將矩形編碼塊分割成兩個不規(guī)則塊,并對這兩個不規(guī)則塊分別進(jìn)行運動估計,獲得兩個不規(guī)則殘差塊,將這兩個不規(guī)則殘差塊合并成矩形殘差塊,并計算該分割模式Si的率失真代價;步驟5、選取分割模式集合S中所有的分割模式Si對當(dāng)前矩形編碼塊進(jìn)行分割,并計算各種分割模式Si所對應(yīng)的率失真代價,并選取其中率失真代價最小的分割模式Si作為當(dāng)前矩形編碼塊的最佳分割模式;步驟6、設(shè)當(dāng)前矩形編碼塊大小為MxN,對采用最佳分割模式完成分割的該當(dāng)前矩形編碼塊所對應(yīng)的當(dāng)前矩形殘差塊進(jìn)行正交變換,得到由MxN個變換系數(shù)組成的非重排變換系數(shù)矩陣,并計算該非重排變換系數(shù)矩陣的率失真代價;步驟7、設(shè)當(dāng)前矩形編碼塊大小為MxN,對采用最佳分割模式完成分割的該當(dāng)前矩形編碼塊所對應(yīng)的當(dāng)前矩形殘差塊,根據(jù)其最佳分割模式對當(dāng)前矩形殘差塊進(jìn)行像素重排,得到重排矩形殘差塊,對重排矩形殘差塊進(jìn)行正交變換,得到由MxN個變換系數(shù)組成的重排變換系數(shù)矩陣,并計算重排變換系數(shù)矩陣的率失真代價;步驟8、比較上述非重排變換系數(shù)矩陣和重排變換系數(shù)矩陣的率失真代價值,選取其中代價值最小的為當(dāng)前矩形編碼塊的最終變換系數(shù)矩陣,對最終變換系數(shù)矩陣的系數(shù)進(jìn)行量化、熵編碼后寫入碼流,同時將最佳分割模式信息和最終變換系數(shù)矩陣信息編入碼流; 解碼為前述編碼的逆過程。
所述的候選分割模式包括不分割和幾何分割。
所述的幾何分割是指采用一條曲線或直線將矩形編碼塊分割成兩個區(qū)域,分割線與矩形編碼塊邊界交叉于兩點。
所述的像素重排是根據(jù)幾何分割的分割邊界方向,對當(dāng)前大小為MXN的矩形殘差塊中的像素點進(jìn)行重排,將沿分割邊界方向的像素進(jìn)行坐標(biāo)置換后移至水平方向或垂直方向,其中,像素點坐標(biāo)(i,j)的坐標(biāo)變換公式為R(i,j) = (k, 1),其中0<i<M,O^j <N, 0 ^ k < Μ, 0 ^ 1 < N, R( ·)為可逆變換的重排變換函數(shù),若R(i,j) = (i, j), 則為一致變換。
采用本發(fā)明的技術(shù)方案后,由于矩形編碼塊的不規(guī)則分割信息能夠表達(dá)矩形編碼塊內(nèi)的物體邊界主要方向,而矩形編碼塊內(nèi)的物體邊界恰恰是殘差較大部分,利用不規(guī)則分割信息,對矩形殘差塊的像素位置進(jìn)行重新排列,使矩形殘差塊中的邊界方向盡可能調(diào)整到水平/垂直方向,再進(jìn)行二維正交變換,從而盡可能減少變換后的高頻非零系數(shù),提高變換的壓縮效率。
圖1為本發(fā)明中編解碼的流程示意圖;圖2為本發(fā)明基于直線分割方法的宏塊分割示意圖; 圖3為本發(fā)明中重排DCT與LBP塊劃分相結(jié)合的示意圖; 圖4為本發(fā)明中像素行循環(huán)移位示意圖; 圖5為本發(fā)明中像素列循環(huán)移位示意圖。
以下結(jié)合具體實施例和附圖對本發(fā)明作進(jìn)一步詳述。
具體實施方式
如圖1所示,本發(fā)明一種基于幾何分割的視頻圖像編解碼方法,具體包括如下步驟步驟1、將輸入視頻圖像分割成若干矩形編碼塊,該矩形編碼塊可以是長方形或正方形,可以是均等分割,也可以是不均等分割,即既可以大小相同,也可以大小不同。步驟2、該輸入視頻圖像為原始圖像數(shù)據(jù);本實施例中將該輸入視頻圖像分割成規(guī)則的16X 16宏塊(編碼塊),當(dāng)然,此處矩形編碼塊不限于16X 16尺寸,分別對分割后的每一個矩形編碼塊執(zhí)行步驟3到步驟8的操作。
步驟3,對選定的矩形編碼塊設(shè)定一組候選分割模式集合S,-ST= (^J €Ω},該候選分割模式用于對矩形編碼塊進(jìn)行基于內(nèi)容的不規(guī)則幾何分割或不分割,本實施例以基于直線分割方法(LBP)的幾何分割法為例,即采用一條直線段將一個宏塊分割成兩個區(qū)域。
如圖2所示,圓圈表示像素點,大的矩形框表示一個宏塊,直線段AB (分割線)將該宏塊分割為PO和Pl兩個區(qū)域,A、B為分割線AB與宏塊邊界的交叉點,A、B的位置可以任意,也可以采用固定間距(如以1個像素或者2個像素為單位)的邊界位置。采用斜率和截距更精確的直線段對宏塊進(jìn)行分割,一定程度上能夠?qū)哂星实倪\動物體邊界進(jìn)行更為準(zhǔn)確的描述。
步驟4、選取分割模式集合S中的一種分割模式Si對當(dāng)前矩形編碼塊進(jìn)行幾何分割,將矩形編碼塊分割成兩個不規(guī)則塊,并對幾何分割后的兩個不規(guī)則塊分別進(jìn)行運動估計,獲取兩個不規(guī)則殘差塊,將這兩個不規(guī)則塊殘差塊合并成矩形殘差塊,這里,選擇SAD 匹配準(zhǔn)則進(jìn)行運動估計;并計算該分割模式&的率失真代價。
步驟5、選取分割模式集合S中所有的分割模式Si對于上述每一個宏塊進(jìn)行幾何分割,并計算各種分割模式Si所對應(yīng)的率失真代價,并選取率失真代價最小的分割模式Si 作為當(dāng)前矩形編碼快的最佳分割模式,完成幾何分割;該率失真代價函數(shù)為J(p) = iXp》+li (i )其中,P表示宏塊分割模式,R(P)表示該宏塊編碼比特數(shù),而D(P)則為在分割模式P下的失真度(如MSE ),^!為拉格郎日常數(shù)。
R(p)包含三部分,即宏塊分割模式所需比特數(shù)B(p),運動矢量信息V(p)和殘差信息(p),其公式為 _ = νφ) +B(P)+ ΡΨ (ρ)。對于LBP模式,Β(ρ)包含兩部分信息分割模式信息I0O )和分割點AB的位置信息瑪(P),因此,對于LBP模式Rl迎(P)=『(>)+ 爲(wèi)(ρ) + B1(P) + Rres (ρ)基于LBP模式分割的宏塊上分割點A、B的坐標(biāo),可根據(jù)其左邊和上邊宏塊的分割信息進(jìn)行預(yù)測。若左邊宏塊采用LBP模式且其中一個分割點與當(dāng)前宏塊的一個分割點位于同一公共邊,則通過左邊宏塊的分割點對當(dāng)前宏塊的分割點進(jìn)行預(yù)測;否則采用定長編碼方式, 對分割點相對于宏塊原點(左上角點)的相對坐標(biāo)進(jìn)行編碼。
將LBP模式分割方法與基于像素重排的DCT (簡稱RDCT)相結(jié)合,如圖3,左邊為采用LBP模式分割的原始塊,分割線AB與水平線夾角為沒;右邊為對應(yīng)殘差塊的重排方式, 在LBP模式下,線段AB的方向作為殘差塊的邊界方向或紋理方向,因此,殘差塊的重排方向角亦為■,#的取值隨著線段AB斜率的變化而改變,浸將不限于某些離散的角度。
步驟6、設(shè)當(dāng)前矩形編碼塊大小為ΜχΝ,對采用最佳分割模式完成分割的該當(dāng)前矩形編碼塊所對應(yīng)的當(dāng)前矩形殘差塊進(jìn)行正交變換,得到由MxN個變換系數(shù)組成的非重排變換系數(shù)矩陣,并計算該非重排變換系數(shù)矩陣的率失真代價;步驟7、設(shè)當(dāng)前矩形編碼塊大小為MxN,對采用最佳分割模式完成分割的該當(dāng)前矩形編 碼塊所對應(yīng)的當(dāng)前矩形殘差塊,根據(jù)最佳分割模式中幾何分割的邊界方向角,對當(dāng)前大小 為MXN的矩形殘差塊中的像素點進(jìn)行重排,將沿分割邊界方向的像素進(jìn)行坐標(biāo)置換后移 至水平方向或垂直方向,其中,像素點坐標(biāo)(i,j)的坐標(biāo)變換公式為R(i,j) = (k, 1), 其中0<i<M,O ^ j < N, O ^ k < Μ, O ^ 1 < N, R(·)為可逆變換的重排變換函數(shù), 若R(i,j) = (i, j)則為一致變換。如圖4、5所示,以ー個8X8編碼塊為例,直線I表示分割邊界方向,灰色塊表示位 于直線 上的像素,直線/與χ軸的夾角為ら逆時針方向為正,順時針為負(fù)。像素重排的目的 在于將沿分割邊界方向的像素移到水平方向或垂直方向,此時,當(dāng) r/4 <丨#丨<π 2時,采用 行循環(huán)移位,如圖4所示;當(dāng)Iタ^ττ/4時,采用列循環(huán)移位,如圖5所示。假設(shè)原始像素位 置為《 =(〗Jf ,重排后的像素位置為《 = = OW/,m與Λ的關(guān)系可以用下式表示
權(quán)利要求
1.一種基于幾何分割的視頻圖像編解碼的方法,其特征在于編碼包括以下步驟 步驟1、將輸入視頻圖像分割成若干矩形編碼塊;步驟2、分別對分割后的每一個矩形編碼塊執(zhí)行步驟3到步驟8的操作; 步驟3、對選定的矩形編碼塊設(shè)定一組候選分割模式集合S, S = (SiJeQ);步驟4、選取候選分割模式集合S中的一種分割模式Si對當(dāng)前矩形編碼塊進(jìn)行分割, 將矩形編碼塊分割成兩個不規(guī)則塊,并對這兩個不規(guī)則塊分別進(jìn)行運動估計,獲得兩個不規(guī)則殘差塊,將這兩個不規(guī)則殘差塊合并成矩形殘差塊,并計算該分割模式Si的率失真代價;步驟5、選取分割模式集合S中所有的分割模式Si對當(dāng)前矩形編碼塊進(jìn)行分割,并計算各種分割模式Si所對應(yīng)的率失真代價,并選取其中率失真代價最小的分割模式Si作為當(dāng)前矩形編碼塊的最佳分割模式;步驟6、設(shè)當(dāng)前矩形編碼塊大小為MxN,對采用最佳分割模式完成分割的該當(dāng)前矩形編碼塊所對應(yīng)的當(dāng)前矩形殘差塊進(jìn)行正交變換,得到由MxN個變換系數(shù)組成的非重排變換系數(shù)矩陣,并計算該非重排變換系數(shù)矩陣的率失真代價;步驟7、設(shè)當(dāng)前矩形編碼塊大小為MxN,對采用最佳分割模式完成分割的該當(dāng)前矩形編碼塊所對應(yīng)的當(dāng)前矩形殘差塊,根據(jù)其最佳分割模式對當(dāng)前矩形殘差塊進(jìn)行像素重排,得到重排矩形殘差塊,對重排矩形殘差塊進(jìn)行正交變換,得到由MxN個變換系數(shù)組成的重排變換系數(shù)矩陣,并計算重排變換系數(shù)矩陣的率失真代價;步驟8、比較上述非重排變換系數(shù)矩陣和重排變換系數(shù)矩陣的率失真代價值,選取其中代價值最小的為當(dāng)前矩形編碼塊的最終變換系數(shù)矩陣,對最終變換系數(shù)矩陣的系數(shù)進(jìn)行量化、熵編碼后寫入碼流,同時將最佳分割模式信息和最終變換系數(shù)矩陣信息編入碼流; 解碼為前述編碼的逆過程。
2.如權(quán)利要求1所述的一種基于幾何分割的視頻圖像編解碼方法,其特征在于所述的候選分割模式包括不分割和幾何分割。
3.如權(quán)利要求2所述的一種基于幾何分割的視頻圖像編解碼方法,其特征在于所述的幾何分割是指采用一條曲線或直線將矩形編碼塊分割成兩個區(qū)域,分割線與矩形編碼塊邊界交叉于兩點。
4.如權(quán)利要求2所述的一種基于幾何分割的視頻圖像編解碼方法,其特征在于所述的像素重排是根據(jù)幾何分割的分割邊界方向,對當(dāng)前大小為MXN的矩形殘差塊中的像素點進(jìn)行重排,將沿分割邊界方向的像素進(jìn)行坐標(biāo)置換后移至水平方向或垂直方向,其中,像素點坐標(biāo)(i,j)的坐標(biāo)變換公式為R(i,j) = (k, 1),其中0<i<M,0 ^ j < N, O^k <M, 0 ^ 1 < N, R(·)為可逆變換的重排變換函數(shù),若R(i,j) = (i, j),則為一致變換。
全文摘要
本發(fā)明一種基于幾何分割的視頻圖像編解碼方法,編碼時先將視頻圖像分割成若干矩形編碼塊,然后對矩形編碼塊進(jìn)行幾何分割;再對幾何分割后的不規(guī)則塊分別進(jìn)行運動估計,獲取各自的殘差塊,將該不規(guī)則塊所對應(yīng)的殘差塊合并成矩形殘差塊;利用幾何分割的邊界方向信息,對所述矩形殘差塊中的像素點坐標(biāo)進(jìn)行重排;最后,對重排后的矩形殘差塊進(jìn)行二維正交變換、對變換系數(shù)進(jìn)行量化及熵編碼,同時將幾何分割信息及重排信息編入碼流;解碼為前述編碼過程的逆過程。本發(fā)明在編碼時利用幾何分割的方向信息,對殘差塊進(jìn)行像素重排,減少了正交變換后的高頻非零系數(shù),提高了壓縮效率。
文檔編號H04N7/26GK102547290SQ20121001825
公開日2012年7月4日 申請日期2012年1月20日 優(yōu)先權(quán)日2012年1月20日
發(fā)明者葉驍勇, 張紹游, 張貽雄, 石江宏 申請人:廈門大學(xué)