專利名稱:變換域中零的早期檢測(cè)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻壓縮系統(tǒng)。
背景技術(shù):
活動(dòng)圖像的實(shí)時(shí)傳輸被用于若干應(yīng)用中,例如電視會(huì)議、網(wǎng)絡(luò)會(huì)議、電視廣播和可視電話。
但是,表示活動(dòng)圖像需要大量信息,因?yàn)橥ǔMㄟ^以8位(1字節(jié))表示圖像中的每個(gè)像素來描述數(shù)字視頻。這種未壓縮的視頻數(shù)據(jù)產(chǎn)生大的位用量,并且因有限帶寬而無法通過傳統(tǒng)的通信網(wǎng)絡(luò)和傳輸線路實(shí)時(shí)傳遞。
因此,實(shí)現(xiàn)實(shí)時(shí)視頻傳輸需要很大程度的數(shù)據(jù)壓縮。但是,數(shù)據(jù)壓縮可能與圖像質(zhì)量進(jìn)行折衷。因此,進(jìn)行了大量工作來開發(fā)允許高質(zhì)量視頻通過帶寬限制的數(shù)據(jù)連接實(shí)時(shí)傳輸?shù)膲嚎s技術(shù)。
在視頻壓縮系統(tǒng)中,主要目標(biāo)是采用盡可能少的容量來表示視頻信息。采用作為常數(shù)值或者作為位/時(shí)間單位的位來定義容量。在兩種情況中,主要目標(biāo)都是減少位數(shù)。
在MPEG*和H.26*標(biāo)準(zhǔn)中描述了最常見的視頻編碼方法。視頻數(shù)據(jù)在傳輸之前經(jīng)過四個(gè)主要過程,即預(yù)測(cè)、變換、量化以及熵編碼。
預(yù)測(cè)過程顯著減少了要傳遞的視頻序列中各圖像所需的位數(shù)量。它利用序列的一些部分與序列的另一些部分的相似性。由于預(yù)測(cè)值部分是編碼器和解碼器都已知的,因此只需要傳遞差值。這個(gè)差值的表示通常需要少得多的容量。預(yù)測(cè)主要基于來自先前重構(gòu)圖像的圖像內(nèi)容,其中內(nèi)容的位置由運(yùn)動(dòng)矢量來定義。通常對(duì)正方形塊大小(例如16×16像素)執(zhí)行預(yù)測(cè)過程。注意,在一些情況中,采用基于相同圖像中的相鄰像素而不是先前圖像的像素的像素預(yù)測(cè)。這稱作幀內(nèi)預(yù)測(cè),與幀間預(yù)測(cè)相對(duì)。
表示為數(shù)據(jù)塊(例如4×4像素)的剩余部分仍然包含內(nèi)部相關(guān)性。利用這的眾所周知的方法是執(zhí)行二維塊變換。ITU建議H.264采用4×4整數(shù)型變換。這把4×4像素變換為4×4變換系數(shù),并且它們通常可由比像素表示更少的位來表示。具有內(nèi)部相關(guān)性的4×4像素陣列的變換可能產(chǎn)生4×4變換系數(shù)塊,其中具有比原始4×4像素塊少得多的非零值。
變換系數(shù)的直接表示對(duì)于許多應(yīng)用仍然代價(jià)過高。執(zhí)行量化過程以便進(jìn)一步減小數(shù)據(jù)表示。因此,變換系數(shù)經(jīng)過量化。變換系數(shù)的可能值范圍被分為值區(qū)間,各由最高及最低判定值限制并且被分配固定量化值。然后,變換系數(shù)被量化為與各個(gè)系數(shù)所在的區(qū)間關(guān)聯(lián)的量化值。低于最低判定值的系數(shù)被量化為零。應(yīng)當(dāng)指出,這種量化過程導(dǎo)致重構(gòu)的視頻序列與未壓縮序列相比略有不同。
如上所述,要編碼的視頻內(nèi)容的一個(gè)特性在于,描述序列的位的要求極大地變化。對(duì)于若干應(yīng)用,本領(lǐng)域的技術(shù)人員眾所周知的是,圖像的相當(dāng)大的部分的內(nèi)容從幀到幀沒有改變。H.264擴(kuò)展這個(gè)定義,使得具有恒定運(yùn)動(dòng)的圖像的部分也可不使用附加信息來編碼。從幀到幀極少或沒有變化的區(qū)域需要最少數(shù)量的位來表示。這類區(qū)域中包含的塊被定義為“跳過”,表明相對(duì)于相應(yīng)的先前塊沒有出現(xiàn)變化或者只出現(xiàn)可預(yù)測(cè)運(yùn)動(dòng),因此,不需要數(shù)據(jù)來表示這些塊,只是指明這些塊將被解碼為“跳過”。這個(gè)指示可能是若干宏塊共同的。
由于H.264為解碼規(guī)范,因此它沒有描述用于在變換和量化過程之前檢測(cè)邊緣或沒有變化的區(qū)域的任何方法。因此,這些區(qū)域可能經(jīng)過運(yùn)動(dòng)搜索、變換和量化,即使它們最后將被定義為跳過并且不采用任何數(shù)據(jù)來表示。由于這些操作需要處理容量,因此,這是編碼器中的資源的不必要消耗。處理資源的有效利用在H.264方面極為重要,因?yàn)樗枰罅刻幚碣Y源。因此,至少對(duì)于一些應(yīng)用,極其希望減小編碼器復(fù)雜度。
與H.264關(guān)聯(lián)的另一個(gè)問題在于,在各圖像帶有一定的誤差被重構(gòu)的意義上,編碼通常是“有損的”。這個(gè)事實(shí)與源信號(hào)上的噪聲一起表示在未編碼塊與先前圖像中處于同一位置的塊之間的差異始終存在,即使圖像內(nèi)容沒有實(shí)際變化。因此,典型的編碼過程可能往往使這被編碼為殘留信號(hào)。這通常將產(chǎn)生塊的客觀重構(gòu)的細(xì)微改進(jìn),但是會(huì)在圖像的靜止區(qū)域中產(chǎn)生令人不快的閃爍效果。
發(fā)明概述本發(fā)明的一個(gè)目的是提供一種避免上述問題的方法。
所附獨(dú)立權(quán)利要求中定義的特征表征了這個(gè)方法。
具體來說,本發(fā)明提供一種視頻編碼方法,用于通過整數(shù)變換函數(shù)來變換活動(dòng)圖像的第一殘留像素值塊,產(chǎn)生相應(yīng)的第二整數(shù)變換系數(shù)塊,然后采用多個(gè)判定值所定義的量化區(qū)間對(duì)整數(shù)變換系數(shù)進(jìn)行量化,其中所述方法包括以下步驟通過二進(jìn)制變換函數(shù)來變換第一塊,產(chǎn)生相應(yīng)的第三二進(jìn)制變換系數(shù)塊;以及如果第三塊的左上角的一個(gè)或多個(gè)二進(jìn)制變換系數(shù)小于預(yù)定義的門限,則把第二塊定義為僅包括零。
附圖概述為了更易于理解本發(fā)明,以下論述將參照附圖進(jìn)行。
圖1說明分為4×4像素塊的單一16×16宏塊,4×4像素塊進(jìn)一步分為4×4變換塊。
本發(fā)明的詳細(xì)描述下面通過描述一個(gè)優(yōu)選實(shí)施例以及通過參照附圖來論述本發(fā)明。但是,在所附獨(dú)立權(quán)利要求中定義的本發(fā)明的范圍內(nèi),本領(lǐng)域的技術(shù)人員會(huì)認(rèn)識(shí)到其它應(yīng)用和修改。
本發(fā)明提供一種方法,用于在比ITU H.263和H.264標(biāo)準(zhǔn)的其它簡(jiǎn)單實(shí)現(xiàn)更早的編碼過程的階段檢測(cè)將被表示為跳過的塊。
根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例,在檢測(cè)標(biāo)記為“跳過”的塊時(shí),考慮每個(gè)單一16×16宏塊。在執(zhí)行主要判定過程之前,對(duì)于相應(yīng)宏塊需要一些預(yù)備步驟。
第一個(gè)預(yù)備步驟旨在查找所謂的跳過矢量。跳過矢量的導(dǎo)出仿效H.264中定義的16×16塊的相應(yīng)運(yùn)動(dòng)矢量的預(yù)測(cè)。主要差異在于,跳過矢量在某些條件下設(shè)置為零,而16×16預(yù)測(cè)矢量則不是。這些條件也在H.264標(biāo)準(zhǔn)中定義。16×16宏塊的跳過矢量通過附近已經(jīng)編碼的宏塊的矢量來定義。該過程在H.264中明確定義。然后,根據(jù)導(dǎo)出的跳過矢量,判定是否進(jìn)入所述宏塊的下一個(gè)步驟。如同按照H.263,用于進(jìn)行、即用于假定宏塊是在早期階段被定義為跳過的候選者的標(biāo)準(zhǔn)可能是跳過矢量等于零。這表示只是通過沒有任何運(yùn)動(dòng)來進(jìn)一步檢查該情況,而H.264還保留了采用不同于零的跳過矢量預(yù)測(cè)把宏塊定義為跳過的空間。但是,下面假定跳過矢量被確定為等于零。
下一個(gè)預(yù)備步驟是根據(jù)要編碼的宏塊與先前解碼幀中的處于同一位置的塊之間的像素差來查找被定義為像素的剩余部分。這是相當(dāng)簡(jiǎn)單的過程,不需要很多處理容量。跳過矢量等于零的上述假定意味著,通過從先前處于同一位置的塊中減去當(dāng)前宏塊的像素,始終會(huì)找到剩余部分,而不是具有相對(duì)空間偏移的塊。
在通過跳過檢測(cè)過程的預(yù)備步驟之后,就開始研究宏塊以便查看它的至少一些部分是否滿足被分類為跳過的預(yù)定義標(biāo)準(zhǔn)。
跳過檢測(cè)的最簡(jiǎn)單方式只是根據(jù)基于像素的剩余部分??啥x某個(gè)門限,而標(biāo)準(zhǔn)可能是最大值、平均值或像素的另外某個(gè)組合是否超過這個(gè)門限。
另一方面,已知的是,在對(duì)宏塊編碼時(shí),對(duì)剩余像素值執(zhí)行變換。后續(xù)的量化過程很可能引入許多零值,因?yàn)樽畹团卸ㄖ狄韵碌乃凶儞Q值將設(shè)置為零。如果所有變換系數(shù)在量化之后為零,則宏塊將被定義為跳過。由于變換值的最低判定值不是直接可導(dǎo)出到像素域的門限的,因此,與進(jìn)行變換域中的相同比較相比,與像素域中的門限的比較往往給出不同結(jié)果。另一方面,執(zhí)行所有系數(shù)的變換及后續(xù)檢查以便查找用零填充的塊的步驟是消耗容量的。
根據(jù)本發(fā)明,為了在普通變換之前檢測(cè)所跳過的塊,通過引入簡(jiǎn)化且不苛刻的變換來避免對(duì)所跳過的塊的全變換。為了說明簡(jiǎn)化變換,圖1說明根據(jù)H.264的圖像像素的分區(qū)的一部分。16×16宏塊被分為16個(gè)4×4塊,準(zhǔn)備通過二維整數(shù)變換對(duì)各4×4塊進(jìn)行變換,產(chǎn)生4×4變換系數(shù)。根據(jù)H.264的實(shí)際變換中使用的變換是4×4整數(shù)型變換,其系數(shù)經(jīng)過組織,使得已變換塊的左上值表示所有像素的和或平均值。在移動(dòng)到右下時(shí),變換系數(shù)在水平和垂直方向上表示更高頻率的成分。因此,信號(hào)的“能量”的大部分在統(tǒng)計(jì)上朝變換的低頻(左上)成分集中。左上系數(shù)往往稱作DC系數(shù)。因此,集中于朝向4×4塊的左上的4個(gè)系數(shù)是足夠的假設(shè)是適當(dāng)?shù)摹_@些系數(shù)在圖1中以陰影表示。注意,根據(jù)所使用的變換,代表待變換值的“能量”的大部分的DC系數(shù)及其它“低頻”系數(shù)不是限制于位于左上角。
一般來說,塊的“低頻”系數(shù)位于塊的低坐標(biāo)位置。
但是,如前面所述,根據(jù)本發(fā)明,簡(jiǎn)化變換用于檢測(cè)所跳過的塊。根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例的變換從Hadamard變換中推導(dǎo)。與4×4整數(shù)型變換不同,Hadamard變換的基本矢量的元素僅取二進(jìn)制值+1和-1。因此,它們極適合需要計(jì)算簡(jiǎn)單性的數(shù)字信號(hào)處理應(yīng)用。下面給出簡(jiǎn)化變換的基本矢量。
1 1 1 1 1 1-1-11 1 1 1 1 1-1-11 1 1 1 1 1-1-11 1 1 1 1 1-1-11 1 1 1 1 1-1-11 1 1 1 1 1-1-1-1-1-1-1-1-1 1 1-1-1-1-1-1-1 1 1
通過把塊與相應(yīng)系數(shù)位置關(guān)聯(lián)的基本矢量相乘來導(dǎo)出塊的系數(shù)。采用上述基本矢量,計(jì)算簡(jiǎn)化成加法和減法。這種變換將稱作二進(jìn)制變換。
采用上述基本矢量來導(dǎo)出四個(gè)左上系數(shù)的步驟提供適當(dāng)接近H.264中指定的4×4整數(shù)型變換的相應(yīng)系數(shù)的結(jié)果。實(shí)際上,左上系數(shù)將與實(shí)際變換相同。因此,4×4整數(shù)型變換的DC系數(shù)的最低判定級(jí)可直接用作簡(jiǎn)化變換的相應(yīng)四個(gè)系數(shù)的門限。
這樣,實(shí)現(xiàn)了用于檢測(cè)零系數(shù)的極佳測(cè)試,因?yàn)橐阎@四個(gè)系數(shù)在統(tǒng)計(jì)上為最大,如果這四個(gè)系數(shù)低于門限,則假定其余系數(shù)為零。
本發(fā)明提供一種在變換和量化之前檢測(cè)系數(shù)零的簡(jiǎn)單方法,由于避免了運(yùn)動(dòng)矢量搜索以及較少變換和量化而使得節(jié)省大量計(jì)算。
另外,本發(fā)明代表檢測(cè)盡可能多的沒有變化的宏塊以及盡可能少的宏塊在被編碼時(shí)被定義為跳過的兩種要求之間的良好平衡。
本發(fā)明還由于接近零的值的變換的數(shù)量減少而限制了變換引入的噪聲。
權(quán)利要求
1.一種視頻編碼方法,用于通過整數(shù)變換函數(shù)來變換活動(dòng)圖像的第一殘留像素值塊,產(chǎn)生相應(yīng)的第二整數(shù)變換系數(shù)塊,然后采用多個(gè)判定值所定義的量化區(qū)間對(duì)所述整數(shù)變換系數(shù)進(jìn)行量化,其特征在于通過二進(jìn)制變換函數(shù)來變換第一塊,產(chǎn)生相應(yīng)的第三二進(jìn)制變換系數(shù)塊,如果第三塊中的最低坐標(biāo)的一個(gè)或多個(gè)二進(jìn)制變換系數(shù)小于預(yù)定義的門限,則把第二塊定義為僅包括零。
2.如權(quán)利要求1所述的方法,其特征在于,所述預(yù)定義的門限是與第二塊中的最低變換坐標(biāo)的系數(shù)的量化關(guān)聯(lián)的多個(gè)判定值中的最小判定值。
3.如權(quán)利要求1或2所述的方法,其特征在于,所述視頻編碼根據(jù)H.264進(jìn)行,以及整數(shù)變換函數(shù)是其中定義的整數(shù)變換。
4.如以上權(quán)利要求其中之一所述的方法,其特征在于,所述塊表示活動(dòng)圖像中4×4像素的相同第一正方形區(qū)域。
5.如權(quán)利要求4所述的方法,其特征在于,所述第一正方形區(qū)域覆蓋表示所述活動(dòng)圖像中的16×16像素的第二正方形區(qū)域的宏塊的十六分之一。
6.如權(quán)利要求5所述的方法,其特征在于以下步驟根據(jù)所述活動(dòng)圖像中在空間上相鄰的塊的現(xiàn)有運(yùn)動(dòng)矢量來確定所述宏塊的跳過矢量,僅當(dāng)所述跳過矢量等于零時(shí),才執(zhí)行通過二進(jìn)制變換函數(shù)來變換第一塊的步驟。
7.如以上權(quán)利要求其中之一所述的方法,其特征在于,所述二進(jìn)制變換函數(shù)是Hadamard變換或者從所述Hadamard變換中導(dǎo)出的變換。
8.如以上權(quán)利要求其中之一所述的方法,其特征在于,所述一個(gè)或多個(gè)二進(jìn)制變換系數(shù)是第三塊的左上角的四個(gè)二進(jìn)制變換系數(shù)。
9.如以上權(quán)利要求其中之一所述的方法,其特征在于,在通過整數(shù)變換函數(shù)來變換第一塊的步驟之前,執(zhí)行通過二進(jìn)制變換函數(shù)來變換第一塊的步驟,如果第二塊已經(jīng)被定義為僅包含零,則跳過通過整數(shù)變換函數(shù)來變換第一塊的步驟。
全文摘要
本發(fā)明應(yīng)用于視頻編碼,并且公開了一種方法,用于在比ITUH.263和H.264標(biāo)準(zhǔn)的簡(jiǎn)單實(shí)現(xiàn)中的情況更早的編碼過程的階段檢測(cè)將被表示為跳過的塊。這通過采用二進(jìn)制變換函數(shù)變換具有零跳過矢量的宏塊中的4×4塊來提供。具有低于預(yù)定義門限的四個(gè)左上角二進(jìn)制變換系數(shù)值的塊被定義為跳過。因此,不需要對(duì)這些塊的其它代價(jià)高的計(jì)算要求苛刻的變換或量化。
文檔編號(hào)H03MGK1813480SQ200480017937
公開日2006年8月2日 申請(qǐng)日期2004年4月27日 優(yōu)先權(quán)日2003年6月27日
發(fā)明者G·比約恩特加德 申請(qǐng)人:坦德伯格電信公司