專利名稱:基于方差的自適應(yīng)塊大小dct圖像壓縮的制作方法
背景技術(shù):
I.發(fā)明領(lǐng)域此項發(fā)明與圖像處理有關(guān)。具體的是,此項發(fā)明與利用編碼離散余弦變換系數(shù)數(shù)據(jù)的自適應(yīng)大小排列的塊和子塊的圖像信號壓縮方案有關(guān)。
II.相關(guān)技術(shù)描述在視頻信號傳輸和接收例如用于放映電影或影片的領(lǐng)域中,對于圖像壓縮技術(shù)正得到不同的改進。許多現(xiàn)有的和提出的視頻系統(tǒng)都是用數(shù)字編碼技術(shù)。數(shù)字編碼為抗減損比如多徑衰落和干擾或信號干擾的通信連接提供了健全性,這些減損中的每一個都不同地嚴(yán)重降低圖像質(zhì)量。此外,數(shù)字技術(shù)促進使用信號加密技術(shù),發(fā)現(xiàn)此項技術(shù)在政府的和許多新興發(fā)展商業(yè)廣播應(yīng)用中是有用的或者甚至是必要的。
高清晰度視頻是從改進的圖像壓縮技術(shù)得益的領(lǐng)域。當(dāng)一開始被提出時,由于過多的帶寬需求,高清晰度視頻的在空間傳輸(或甚至通過有線或光纖傳輸)象是無法實現(xiàn)的。典型的無線或其他設(shè)計的傳輸系統(tǒng)不容易提供足夠的帶寬。然而,可以意識到的是,數(shù)字視頻信號的壓縮可以使傳輸達到能利用合理帶寬的水平。如此水平的信號壓縮與信號的數(shù)字傳輸結(jié)合在一起,能使視頻系統(tǒng)在占用更理想和更有用的帶寬時以對信道減損有更大的抗據(jù)性以更小的功率來傳輸。
一種能提供很高壓縮水平而又能保持視頻信號質(zhì)量的理想水平的壓縮技術(shù)是利用編碼離散余弦變換(DCT)系數(shù)數(shù)據(jù)的自適應(yīng)大小排列的塊和子塊。這項技術(shù)以下被稱作為自適應(yīng)塊大小差分余弦變換(ABSDCT)方法。這項技術(shù)是在美國專利號5021891題為《自適應(yīng)塊大小圖像壓縮方法與系統(tǒng)》中提出的,它已分轉(zhuǎn)讓此項發(fā)明的受讓人,通過引用而加入于此。DCT技術(shù)也在美國專利號5107345題為《自適應(yīng)塊大小圖像壓縮方法與系統(tǒng)》中提出,它已轉(zhuǎn)讓給此項發(fā)明的受讓人,通過引用而加入于此。此外,ABSDCT技術(shù)與差分四叉樹變換技術(shù)的結(jié)合應(yīng)用在美國專利號5452104題為《自適應(yīng)塊大小圖像壓縮方法與系統(tǒng)》中有論述,它也已轉(zhuǎn)讓給此項發(fā)明的受讓人,通過引用而加入于此。在這些專利中提出的系統(tǒng)利用了被稱作為幀內(nèi)編碼的技術(shù),在這里圖像數(shù)據(jù)的每一幀都經(jīng)過編碼而無須理會任何其他幀的內(nèi)容。利用ABSDCT技術(shù),可以達到的數(shù)據(jù)速度可以從大約15億比特每秒減少到約5000萬比特每秒而沒有圖像質(zhì)量的可辨降低。
ABSDCT技術(shù)可用來壓縮黑白的也可用來壓縮彩色的圖形或由圖像表示的信號。彩色輸入信號可以是YIQ格式的,在每個4×4的像素塊中,Y是亮度或明亮度樣本,而I和Q是色度或色彩樣本。其他已知的格式比如YUV或RGB格式也可以利用。由于眼睛對于色彩的低空間敏感度,大多數(shù)研究顯示通過在橫向和縱向上四倍色彩成分的子抽樣是合理的。因此,視頻信號可以表示為四個亮度成分和兩個色度成分。
利用ABSDCT,視頻信號一般被分割成處理的像素塊。對于每個塊,亮度和色度成分被傳遞到塊交織器。例如一個16×16的(像素)塊被送進塊交織器,它將每個16×16塊內(nèi)的圖像抽樣進行排序或組織來產(chǎn)生數(shù)據(jù)的塊和合成子塊以進行離散余弦變換(DCT)分析。DCT算法是將時間抽樣信號轉(zhuǎn)換到相同信號的頻率表示的一種方法。通過轉(zhuǎn)換到頻率表示,顯示DCT技術(shù)可以涉及很高水平的壓縮,因為量化器可被設(shè)計成利用圖像的頻率分布特性。在一個最佳實施例中,把一個16×16的DCT用于第一階,把四個8×8的DCT用于第二階,把16個4×4的DCT用于第三階,把64個2×2的DCT用于第四階。
DCT的操作減少了視頻來源中固有的空間冗余。在進行DCT之后,大多數(shù)視頻信號能量都趨向集中于幾個DCT系數(shù)??梢岳靡粋€附加的變換,差分四叉樹變換(DQT)減少DCT系數(shù)之間的冗余。
對于16×16的塊和每個子塊,分析DCT系數(shù)值和DQT值(如利用了DQT)確定編碼塊或子塊所需的比特數(shù)。然后選擇需要最少比特數(shù)編碼的塊或子塊的組合來代表圖像片斷。例如,可以選擇兩個8×8的子塊,六個4×4的子塊和八個2×2的塊來代表圖像片斷。
然后適當(dāng)?shù)匕堰x擇的塊或子塊的組合整齊地排進16×16的塊中。接著DCT/DQT的系數(shù)值就可以進行頻率加權(quán)、量化以及編碼(比如可變長度編碼),以準(zhǔn)備傳輸。
雖然以上所述的ABSDCT技術(shù)實現(xiàn)非常良好,但是它在計算上是增強的。這樣,技術(shù)的小型硬件執(zhí)行就會變得困難。這就需要一種可選的技術(shù)來使硬件執(zhí)行變得更有效率。通過以下方式描述的此項發(fā)明提供一種計算更有效率的圖像壓縮方法和系統(tǒng)發(fā)明概述此項發(fā)明是利用離散余弦變換系數(shù)數(shù)據(jù)的自適應(yīng)大小排列的塊和子塊進行圖像壓縮的系統(tǒng)與方法。在一個實施例中,16×16的像素塊輸入到一個編碼器中。編碼器包括一塊大小分配元件,它分割輸入的像素塊以進行處理。塊大小的分配是根據(jù)輸入塊和子塊的方差(variances)。大體上,帶有較大方差的區(qū)域?qū)⒃诒环殖筛〉膲K,反之帶有較小方差的區(qū)域就不再分割了,倘若塊與子塊的平均值進入預(yù)定的不同區(qū)間。這樣,首先根據(jù)它的平均值從標(biāo)稱值修改塊的方差閾值,然后把塊的方差與閾值作比較,如果方差比閾值要大,那么就再分割此塊。
塊大小的分配被提供給變換元件,它把像素數(shù)據(jù)變換成頻域數(shù)據(jù)。變換只在選擇的塊和子塊上通過塊大小分配來完成。變換的數(shù)據(jù)然后再經(jīng)過量化和串行化。例如,利用之字形的掃描可以使數(shù)據(jù)連續(xù)產(chǎn)生一數(shù)據(jù)流。然后把這數(shù)據(jù)流通過可變大小編碼器進行編碼以準(zhǔn)備傳輸。編碼數(shù)據(jù)通過傳輸信道被送到解碼器中,那里像素數(shù)據(jù)在準(zhǔn)備顯示時被重構(gòu)。
附圖簡述當(dāng)結(jié)合在其中全部相應(yīng)地標(biāo)注相同符號的圖,從以下提出的詳細(xì)描述中此項發(fā)明的特征、目的和優(yōu)點將會變得更加明顯,其中
圖1是合并此項發(fā)明基于方差的塊大小分配系統(tǒng)和方法的圖像處理系統(tǒng)的方框圖。
圖2是說明設(shè)計基于方差的塊大小分配的處理步驟的流程圖。
圖3a、3b和3c說明了典型的塊大小分配、相應(yīng)的四叉樹分解和相應(yīng)的PQR數(shù)據(jù)。
實施例具體描述為了促進數(shù)字信號的數(shù)字傳輸并且享受相應(yīng)的好處,使用一些形式的信號壓縮一般是必要的。為了在得到的圖像中達到高分辨率,保持圖像的高質(zhì)量也是重要的。此外,也要考慮對于小型硬件執(zhí)行的計算有效性,它在許多應(yīng)用中是重要的。
此項發(fā)明提供了在實現(xiàn)圖像壓縮中既考慮圖像質(zhì)量又考慮計算有效性的圖像壓縮系統(tǒng)或設(shè)備和方法。此項發(fā)明的圖像壓縮是根據(jù)離散余弦變換技術(shù)。通常,在數(shù)字域中處理的圖像是由分為一列N×N大小無交迭塊的像素數(shù)據(jù)所組成的??梢栽诿總€塊上應(yīng)用二維的DCT。二維的DCT通過以下關(guān)系是來確定X(k,l)=α(k)β(l)NΣm=0N-1Σn=0N-1x(m,n)cos[(2m+1)πk2N]cos[(2n+1)πl2N],0≤k,l≤N-1]]>其中, 以及x(m,n)是在N×M塊內(nèi)的像素位置(m,n),以及X(k,l)是相應(yīng)的DCT系數(shù)。
由于像素值是非負(fù)的,所以DCT分量X(0,0)已知是正的并且通常有最多的能量。事實上,對于典型的圖像,大多數(shù)變換能量都集中在分量X(0,0)的周圍。這個能量壓縮特性使DCT技術(shù)成為有吸引力的壓縮方法。
此項發(fā)明的圖像壓縮技術(shù)使用了對比自適應(yīng)編碼來完成更進一步的比特速率減少??梢园l(fā)現(xiàn),大多數(shù)自然圖像都由單調(diào)的相對慢的變化區(qū)域和復(fù)雜的區(qū)域比如物體邊界和高對比的結(jié)構(gòu)組成。對比自適應(yīng)編碼方案通過分配更多的比特給復(fù)雜的區(qū)域而分配更少的比特給不復(fù)雜的區(qū)域來利用這個因素。
對比自適應(yīng)編碼對于減少抑制效應(yīng)也是有用的。在其他DCT編碼技術(shù)的執(zhí)行中,抑制效應(yīng)可能是對于圖像質(zhì)量的最重大的損害了。此外,抑制效應(yīng)在圖像的復(fù)雜區(qū)域趨向于更加顯著。然而,可以理解的是,當(dāng)用更小DCT時,抑制效應(yīng)就會減少。當(dāng)使用2×2的DCT時,抑制效應(yīng)幾乎是看不到的,雖然每個像素的比特性能都會受損失。這樣,對比自適應(yīng)編碼可以通過給復(fù)雜區(qū)域分配更小的塊(從而有更多比特)及給相對空的區(qū)域更大的塊來減小抑制效應(yīng)。
此項發(fā)明的又一個特征就是它使用了幀內(nèi)編碼(空間處理)從而代替幀間編碼(時空處理)。采用幀內(nèi)編碼的一個理由是需要處理幀間編碼信號的接收機的高度復(fù)雜性。幀間編碼除更復(fù)雜的處理電路之外還需要多重幀緩沖。在許多應(yīng)用中,減少復(fù)雜性對于實際執(zhí)行是需要的。
使用幀內(nèi)編碼的第二個理由是可能存在一種情況或程序設(shè)備能使時空編碼方案停頓以及很差地執(zhí)行。例如,每秒24幀的電影由于積分時間就能歸于這個范疇,因為機械快門相對較短。短的積分時間就容許了更高程度的空間混疊。幀對幀相關(guān)性的假設(shè)會為了快速的運動而停頓,因為它變得很急動了。
還有使用幀內(nèi)編碼的理由是對于當(dāng)50Hz和60Hz的功率線頻率都涉及時,時空編碼方法是更難以標(biāo)準(zhǔn)化。現(xiàn)在電視傳輸信號既有50Hz又有60Hz。成為數(shù)字途徑的幀內(nèi)方案的利用既能使和50Hz的操作又能適合60Hz的操作,甚至可以通過空間分辨率對幀速率的折衷適應(yīng)于每秒24幀的電影。
為了圖像處理,在被分成一列無交迭塊的像素數(shù)據(jù)上進行DCT操作。值得注意的是,雖然在這里討論的塊大小是N×N的,但是可以想象可以使用不同的塊大小。例如,可以使用N×M塊大小,在這里M和N都是整數(shù),M可以大于N也可以小于N。另一個重要方面就是塊至少可分為一級子塊,比如N/i×N/i、N/i×N/j、N/i×M/j等等,這里i和j都是整數(shù)。此外,在這里討論的典型的塊大小是有相應(yīng)DCT系數(shù)的塊與子塊的16×16像素的塊。更進一步可以想象的是,也可以使用其他不同的整數(shù)比如偶的或奇的整數(shù)值,如9×9。
現(xiàn)在參照圖1,顯示了合并此項發(fā)明壓縮系統(tǒng)的圖像處理系統(tǒng)100。圖像處理系統(tǒng)100包含壓縮接收的視頻信號的編碼器102。通過傳輸信道104傳輸壓縮信號,并由解碼器106接收。解碼器106把接收的信號解碼成圖像抽樣,然后再顯示。
一般,圖像被分為像素塊來處理??梢园岩簧市盘枏腞GB空間轉(zhuǎn)換到Y(jié)C1C2空間,Y是亮度或明亮度分量,而C1和C2是色度或色彩分量。由于眼睛對色彩的低空間敏感度,許多系統(tǒng)通過在橫向和縱向上四倍子抽樣C1和C2分量。然而,子抽樣不是必要的。如已知4∶4∶4格式的高清晰度圖像在一些諸如被稱作為“數(shù)字影像”的應(yīng)用中或是很有用的或是必要的。兩個可能的YC1C2表示是YIQ表示和YUV表示,在此技術(shù)中這兩者都廣為所知了。還可以使用稱作YCbCr的YUV表示的變形。
在一較佳實施例中,處理Y、Cb和Cr分量中的每一個都無需子抽樣。這樣,16×16的像素塊的輸入就提供給編碼器102。編碼器102包含塊大小分配元件108,它在準(zhǔn)備視頻壓縮中進行塊大小的分配。塊大小分配元件108根據(jù)在塊中圖像的感知特性確定16×16塊的分解。塊大小分配根據(jù)在塊內(nèi)的活動把每個16×16的塊以四叉樹的形式再分為更小的塊。塊大小分配元件產(chǎn)生四叉樹數(shù)據(jù),稱作為PQR數(shù)據(jù),它的長度可以在1到21比特之間。這樣,如果塊大小分配確定16×16的塊要被分割,那么設(shè)定PQR數(shù)據(jù)的R比特,并緊跟著相應(yīng)的四個分割后的8×8塊的P數(shù)據(jù)的四個附加比特。如果塊大小分配確定8×8塊中的任意一塊還要再分割,那么就要加上對于每個再分的8×8塊的Q數(shù)據(jù)的四個附加比特。
現(xiàn)在參照圖2,提供了顯示塊大小分配元件108操作細(xì)節(jié)的流程圖。算法用塊的方差作為決定再分塊的尺度。在步驟202開始,讀取一16×16的像素塊。在步驟204計算16×16塊的方差v16。計算方差如下所示var=1N2Σi=0N-1Σj=0N-1xi,j2-(1N2Σi=0N-1Σj=0N-1xi,j)2]]>在這里N=16,而xi,j是在N×N塊內(nèi)第i行第j列的像素。在步驟206,首先如果塊的平均值在兩個預(yù)定值之間就修改方差閾值T16提供新的閾值T’16,然后比較塊的方差和新的閾值T’16。
如果方差v16不比閾值T16大,那么在步驟208就寫入16×16塊的始地址,而PQR數(shù)據(jù)的R比特就設(shè)定為0表示16×16的塊無需再分了。算法然后讀取下一個16×16的像素塊。如果方差v16比閾值T16大,那么在步驟210,PQR數(shù)據(jù)的R比特就設(shè)定為1表示16×16的塊要再分為四個8×8的塊。
如步驟212所示,四個8×8的塊,i=1∶4,可以考慮繼續(xù)進一步再分。對于每個8×8的塊,在步驟214計算方差v8i。在步驟216,首先如果塊的平均值在兩個預(yù)定值之間就修改方差閾值T8提供一個新的閾值T’8,然后比較塊的方差和新的閾值。
如果方差v8i不比閾值T8大,那么在步驟218就寫入8×8塊的始地址,而相應(yīng)的Q比特Qi就設(shè)定為0。然后處理下一個8×8的塊。如果方差v8i比閾值T8大,那么在步驟220,相應(yīng)的Q比特Qi就設(shè)定為1表示8×8的塊要再分為四個4×4的塊。
如步驟222所示,四個4×4的塊,ji=1∶4,可以考慮繼續(xù)進一步再分。對于每個4×4的塊,在步驟224計算方差v4ij。在步驟226,首先如果塊的平均值在兩個預(yù)定值之間就修改方差閾值T4提供一個新的閾值T’4,然后比較塊的方差和新的閾值。
如果方差v4ij不比閾值T4大,那么在步驟228就寫入4×4塊的地址,而相應(yīng)的P比特Pij就設(shè)定為0。然后處理下一個4×4的塊。如果方差v4ij比閾值T4大,那么在步驟230,相應(yīng)的P比特Pij就設(shè)定為1表示4×4的塊要再分為四個2×2的塊。此外,寫入4個2×2塊的地址。
可以預(yù)先確定閾值T16、T8和T4為常數(shù)。作為硬判決這是已知的。二者選一地,可以執(zhí)行自適應(yīng)判決或軟判決。軟判決根據(jù)2N×2N塊的平均像素值改變方差的閾值,在這里N可以是8、4或2。這樣,平均像素值的函數(shù)就可以被用作閾值了。
為了說明,考慮以下這個例子。讓預(yù)定的Y分量對于16×16、8×8和4×4的塊的方差閾值分別為50、1100和880。換句話說,就是T16=50,T8=1100以及T16=880。讓平均值的區(qū)間在80和100之間。假設(shè)計算的16×16塊的方差是60。由于60和它的平均值90大于T16,所以把16×16的塊再分為四個8×8的子塊。假設(shè)計算的8×8塊的方差是1180、935、980和1210。由于8×8塊中的有兩個方差超過T8,所以這兩個塊要在進一步分割產(chǎn)生總共八個4×4的子塊。最后,假設(shè)八個4×4塊的方差是620、630、670、610、590、525、930和690,相應(yīng)的平均值是90、120、110、115。由于第一個4×4塊的平均值落進區(qū)間(80,100)中,所以它的閾值將會降低到T’4=200,它小于880。因此,這個4×4的塊將會被再分,第七個4×4塊同樣也要再分。最終的塊大小分配如圖3a所示。相應(yīng)的四叉樹分解如圖3b所示。另外,通過這個塊大小分配產(chǎn)生的PQR數(shù)據(jù)如圖3c所示。
值得注意的是,利用相似的過程為色彩分量C1和C2分配塊大小。色彩分量可以在橫向、縱向或在兩者上抽取。
另外值得注意的是,雖然塊大小分配被描述為自頂向下的方法,其中首先要估計最大的塊(在此例中是16×16),但是還可以用自底向上的方法代替。自底向上的方法首先要估計最小的塊(在此例中是2×2)。
回到圖1,將要描述圖像處理系統(tǒng)110的剩余部分。PQR數(shù)據(jù)隨同所選塊的地址被送到DCT元件110。DCT元件110用PQR數(shù)據(jù)在所選塊上進行適當(dāng)大小的離散余弦變換。只有所選塊才需要接受DCT處理。
圖像處理系統(tǒng)100可以隨意包含減少DCT的DC系數(shù)間冗余的DQT元件。在每個DCT塊的頂部左角遇到一DC系數(shù)。一般DC系數(shù)與AC系數(shù)比較起來是大的。在大小上的差異使設(shè)計有效的可變長度編碼器變得困難。因此,減少DC系數(shù)間的冗余是有利的。
DQT元件112在DC系數(shù)上進行兩維的DCT,每次進行2×2。以4×4塊內(nèi)的2×2塊開始,在四個DC系數(shù)上進行兩維的DCT。這個2×2的DCT被稱作為四個DC系數(shù)的差分四叉樹變換,或DQT。接著,用DQT的DC系數(shù)隨同三個與8×8塊的相鄰的DC系數(shù)計算下一級的DQT。最后,用16×16塊內(nèi)的四個8×8塊的DC系數(shù)計算DQT。這樣,在16×16塊中有一個真DC系數(shù),而剩下的是相應(yīng)于DCT和DQT的AC系數(shù)。
變換系數(shù)(DCT和DQT兩者的)提供給量化器114來量化。在一較佳實施例中,用頻率加權(quán)掩碼(FWM)和量化標(biāo)度因子來量化DC系數(shù)。FWM是與輸入DCT系數(shù)的塊相同維數(shù)的頻率權(quán)數(shù)表。頻率權(quán)數(shù)對于不同的DCT系數(shù)施加不同的權(quán)數(shù)。權(quán)數(shù)被設(shè)計成突出帶有滿足人類視覺系統(tǒng)更敏感的頻率的輸入抽樣,而不突出帶有滿足視覺系統(tǒng)不太敏感的頻率的抽樣。也可以根據(jù)諸如觀看距離等因素來設(shè)計權(quán)數(shù)。
根據(jù)經(jīng)驗數(shù)據(jù)選擇權(quán)數(shù)。在1994年國際標(biāo)準(zhǔn)組織的ISO/IEC JTC1 CD 10918“連續(xù)色調(diào)靜止圖像的數(shù)字壓縮和編碼—第一部分需求和原則”中公開了為8×8 DCT系數(shù)設(shè)計加權(quán)掩碼的方法,通過引用而加入于此。一般設(shè)計兩個FWM,一個針對亮度分量而一個針對色度分量。通過抽取得到2×2、4×4塊大小的FWM表,而通過插補8×8塊的FWM表得到16×16塊的FWM表。標(biāo)度因子控制被量化系數(shù)的質(zhì)量和比特率。
這樣,每個DCT系數(shù)都根據(jù)關(guān)系式量化DCTq(i,j)=|8*DCT(i,j)fwm(i,j)*q±12|]]>在這里DCT(i,j)是輸入DCT系數(shù),fwm(i,j)是頻率加權(quán)掩碼,q是標(biāo)度因子以及DCTq(i,j)是被量化的系數(shù)。值得注意的是,根據(jù)DCT系數(shù)的符號,在大括號里的第一項會被上舍入或下舍入。也利用合適的加權(quán)掩碼量化DQT系數(shù)。然而,可對Y、Cb和Cr分量的每一個利用多個表或掩碼。
被量化的系數(shù)提供到之字形掃描并串行轉(zhuǎn)換器116。并串行轉(zhuǎn)換器116以之字形的方式掃描被量化系數(shù)的塊產(chǎn)生串行被量化系數(shù)流。也可以選擇一些不同之字形掃描方式,還可以選擇除了之字形以外的方式。最佳技術(shù)對于之字形掃描使用了8×8的塊大小,雖然可以使用其它大小。
值得注意的是,之字形掃描并串行轉(zhuǎn)換器116可以被放置在量化器114之前也可以之后。網(wǎng)絡(luò)結(jié)果是相同的。
在任何情況下,被量化系數(shù)流提供給可變長度編碼器118??勺冮L度編碼器118可以利用后接哈夫曼編碼的零的行程編碼。這項技術(shù)在上述美國專利號5021891、5107345和5452104中詳細(xì)討論,在這里摘錄一下。行程編碼器提取被量化系數(shù),并從非零系數(shù)中分離出零。零值被稱作為行程值并且進行哈夫曼編碼。非零值單獨進行哈夫曼編碼。
被量化系數(shù)的修正哈夫曼編碼也是合理的并用于較佳實施例中。這里,在之字形掃描后,行程編碼器將確定在每個8×8塊內(nèi)的行程/大小對。然后對這些行程/大小對進行哈夫曼編碼。
哈夫曼編碼可以從圖形的測量統(tǒng)計設(shè)計,也可以從圖像的理論統(tǒng)計設(shè)計。已經(jīng)發(fā)現(xiàn)的是,大多數(shù)自然圖像都由空白或相對慢的變化區(qū)域和復(fù)雜的區(qū)域比如物體邊界和高對比的結(jié)構(gòu)組成。頻域變換如DCT的哈夫曼編碼通過分配更多比特給復(fù)雜區(qū)域以及更少比特給空白區(qū)域來利用這個特征。一般哈夫曼編碼利用查詢表來對行程和非零值進行編碼。一般使用多個表,在此項發(fā)明中使用3個表為最佳,雖然可以據(jù)需要使用1或2個表。
由編碼器102產(chǎn)生的的壓縮圖像信號通過傳輸通道104被傳輸?shù)浇獯a器106。包含塊大小分配信息的PQR數(shù)據(jù)也被提供給解碼器106。解碼器106包含可變長度解碼器120,它解碼行程值和非零值。
可變長度解碼器120的輸出提供到反向之字形掃描并串行轉(zhuǎn)換器122來根據(jù)掃描的方式排列系數(shù)。反向之字形掃描并串行轉(zhuǎn)換器122接收PQR數(shù)據(jù)幫助把系數(shù)正確排序成為合成系數(shù)塊。
合成塊提供給反向量化器124,由于頻率加權(quán)掩碼的使用而取消處理過程。
如果已使用了差分四叉樹變換,那么系數(shù)塊提供給IDQT元件126,后面接著IDCT元件128。否則,系數(shù)塊就直接提供給IDCT元件128。IDQT元件126和IDCT元件128逆變換系數(shù)產(chǎn)生一像素塊數(shù)據(jù)。然后可以需要把像素數(shù)據(jù)插入、轉(zhuǎn)換成RGB形式,然后為將來顯示而存儲。
因此,提出了根據(jù)像素方差進行塊大小分配的圖像壓縮的系統(tǒng)和方法?;诜讲顗K大小分配提供了幾個優(yōu)點。因為在確定塊大小之后進行離散余弦變換,所以完成了有效的計算。計算上加強的變換只需在所選塊上進行。此外,塊選擇處理是有效的,是由于像素值的方差算術(shù)上很容易計算?;诜讲畹膲K大小分配還有的優(yōu)點就是它是基于知覺的。像素方差是塊中活動的量度,它提供了邊緣、結(jié)構(gòu)等存在的表示。它趨向于獲取塊的細(xì)節(jié),這比測量如像素值的平均要好得多。這樣,基于方差此項發(fā)明方法分配更小的塊給有更多邊緣的區(qū)域,更大的塊給更單調(diào)的區(qū)域。結(jié)果,就可以在重構(gòu)的圖像中得到出眾的畫質(zhì)。
還有一個重要的優(yōu)點就是由于是在量化之前進行塊大小分配,所以在控制比特率和質(zhì)量中提供了更大的適應(yīng)性。由于方差閾值適應(yīng)于本地裝置,所以可以在相對黑的區(qū)域分配小的塊。這保持了所有正好在顯著的視覺閾值以上的區(qū)域中的細(xì)節(jié)。此外,不同于如MPEG的方法量化范圍因數(shù)從低值變化到高值之時,基于方差的圖像壓縮導(dǎo)致了圖像質(zhì)量的適度降低。這對于如在數(shù)碼電影的領(lǐng)域中是特別關(guān)鍵的。
有了高需求的數(shù)字圖像,盜版就是一個嚴(yán)重的威脅。數(shù)字水印就是一個重要的需求來阻止版權(quán)的侵害和收入的損失。因為在圖像顯著重要的區(qū)域制作了水印,所以基于方差的塊大小分配對于水印就是一個很自然的候選。
以上提供較佳實施例的描述來使任何熟練于此項技術(shù)的人都能利用該項發(fā)明。對于這些實施例不同的修改對熟練于技術(shù)的人是特別明顯的,并且在其中定義的一般原理也可應(yīng)用于其他實施例而無須使用創(chuàng)造能力。這樣,不使該項發(fā)明僅限于這里說明的實施例,而是使其符合與這里公開的原理和新穎特征一致的最寬的范圍。
權(quán)利要求
1.一種確定輸入圖像像素塊的塊大小分配的方法,所述塊大小分配將在壓縮所述輸入塊時使用,所述方法包含的步驟有讀取像素數(shù)據(jù)塊;根據(jù)所述像素數(shù)據(jù)塊和所述像素數(shù)據(jù)塊的子塊的像素值的方差產(chǎn)生塊大小分配;以及提供包含有關(guān)所述塊大小分配的信息的數(shù)據(jù)結(jié)構(gòu)。
2.按權(quán)利要求1所述的方法,其特征在于所述產(chǎn)生的步驟還進一步包含的步驟有確定所述像素數(shù)據(jù)塊的像素值的方差;比較所述方差和閾值;根據(jù)所述比較步驟的結(jié)果決定再細(xì)分所述塊;如果所述決定是再細(xì)分所述塊,那么對每個子塊重復(fù)進行確定、比較和作決定的步驟直到滿足預(yù)定的標(biāo)準(zhǔn);以及指定每一不再細(xì)分的塊作為所述塊大小的分配。
3.按權(quán)利要求2所述的方法,其特征在于所述決定的步驟要求如果所述方差大于所述閾值,塊就要再分。
4.按權(quán)利要求3所述的方法,其特征在于所述閾值是預(yù)定的。
5.按權(quán)利要求3所述的方法,其特征在于所述閾值是被評估的塊的像素平均值的函數(shù)。
6.按權(quán)利要求2所述的方法,其特征在于所述閾值對于每個再分的級別都要改變。
7.按權(quán)利要求2所述的方法,其特征在于所述對于不再重復(fù)進行確定、比較和作決定步驟的預(yù)定標(biāo)準(zhǔn)是根據(jù)像素數(shù)據(jù)的預(yù)選最小塊大小的。
8.一種壓縮像素數(shù)據(jù)塊的圖像壓縮系統(tǒng)包含根據(jù)所述像素數(shù)據(jù)塊和所述像素數(shù)據(jù)塊的子塊的像素值的方差選擇待壓縮的所述塊或者所述塊的子塊的塊大小分配裝置;把所述選中的塊或子塊轉(zhuǎn)換成頻域數(shù)據(jù)的轉(zhuǎn)換裝置;量化所述頻域數(shù)據(jù)的量化裝置;掃描所述量化數(shù)據(jù)變?yōu)橐粋€連續(xù)的數(shù)據(jù)流的串行化器;以及在準(zhǔn)備傳輸中編碼所述連續(xù)數(shù)據(jù)流的可變長度編碼裝置。
9.按權(quán)利要求8所述的系統(tǒng),其特征在于所述塊大小分配裝置確定所述像素數(shù)據(jù)塊的像素值的方差、比較所述方差和閾值、根據(jù)所述比較步驟的結(jié)果決定再細(xì)分所述塊,如果所述決定是再細(xì)分所述塊,那么對每個子塊重復(fù)進行方差確定、與閾值作比較和作細(xì)分決定的步驟直到滿足預(yù)定的標(biāo)準(zhǔn),以及指定每一不再細(xì)分的塊作為所述塊大小的分配。
10.按權(quán)利要求9所述的系統(tǒng),其特征在于所述再分的決定要求如果所述方差大于所述閾值,塊就再分。
11.按權(quán)利要求10所述的系統(tǒng),其特征在于所述閾值是預(yù)定的。
12.按權(quán)利要求10所述的系統(tǒng),其特征在于所述閾值是被評估塊的像素平均值的函數(shù)。
13.按權(quán)利要求9所述的系統(tǒng),其特征在于所述閾值對于每個再分的級別都要改變。
14.按權(quán)利要求9所述的系統(tǒng),其特征在于所述不再細(xì)分預(yù)定的標(biāo)準(zhǔn)是根據(jù)獲得的像素數(shù)據(jù)的預(yù)選最小塊大小的。
15.按權(quán)利要求8所述的系統(tǒng),其特征在于所述變換裝置進行離散余弦變換。
16.按權(quán)利要求8所述的系統(tǒng),其特征在于所述變換裝置進行后跟差分四叉樹變換的離散余弦變換。
17.按權(quán)利要求8所述的系統(tǒng),其特征在于所述串行化器包含之字形掃描器。
18.按權(quán)利要求17所述的系統(tǒng),其特征在于所述之字形掃描器使用8×8塊大小進行之字形掃描。
19.按權(quán)利要求8所述的系統(tǒng),其特征在于所述可變長度編碼裝置包含哈夫曼編碼器。
20.按權(quán)利要求19所述的系統(tǒng),其特征在于所述哈夫曼編碼器使用多個查詢表對行程和非零值進行編碼。
21.按權(quán)利要求20所述的系統(tǒng),其特征在于有三個查詢表。
22.一種壓縮圖像的像素數(shù)據(jù)塊的方法,包含的步驟有讀取像素數(shù)據(jù)塊;根據(jù)所述像素數(shù)據(jù)塊和所述像素數(shù)據(jù)塊的子塊的像素值的方差產(chǎn)生塊大小分配;以及提供包含有關(guān)所述塊大小分配的信息的數(shù)據(jù)結(jié)構(gòu);把由所述數(shù)據(jù)結(jié)構(gòu)指示的所述選中塊的像素數(shù)據(jù)轉(zhuǎn)換成頻域表示;量化所述頻域數(shù)據(jù);掃描所述量化數(shù)據(jù)變?yōu)橐粋€連續(xù)的數(shù)據(jù)流;以及在準(zhǔn)備傳輸中編碼所述連續(xù)數(shù)據(jù)流。
23.按權(quán)利要求22所述的方法,其特征在于所述產(chǎn)生的步驟還進一步包含的步驟有確定所述像素數(shù)據(jù)塊的像素值的方差;比較所述方差和閾值;根據(jù)所述比較步驟的結(jié)果決定再細(xì)分所述塊;如果所述決定是再細(xì)分所述塊,那么對每個子塊重復(fù)進行確定、比較和作決定的步驟直到滿足預(yù)定的標(biāo)準(zhǔn);以及指定每一不再細(xì)分的塊作為所述塊大小的分配。
24.按權(quán)利要求23所述的方法,其特征在于所述決定的步驟要求如果所述方差大于所述閾值,塊就要再分。
25.按權(quán)利要求24所述的方法,其特征在于所述閾值是預(yù)定的。
26.按權(quán)利要求24所述的方法,其特征在于所述閾值是被評估的塊的像素平均值的函數(shù)。
27.按權(quán)利要求23所述的方法,其特征在于所述閾值對于每個再分的級別都要改變。
28.按權(quán)利要求23所述的方法,其特征在于所述對于不再重復(fù)進行確定、比較和作決定步驟的預(yù)定標(biāo)準(zhǔn)是根據(jù)像素數(shù)據(jù)的預(yù)選最小塊大小的。
29.按權(quán)利要求22所述的方法,其特征在于在所述變換步驟期間進行離散余弦變換。
30.按權(quán)利要求22所述的方法,其特征在于在所述變換步驟期間進行后跟差分四叉樹變換的離散余弦變換。
31.按權(quán)利要求22所述的方法,其特征在于在所述掃描步驟期間進行之字形掃描。
32.按權(quán)利要求31所述的方法,其特征在于用8×8的塊大小進行所述之字形掃描。
33.按權(quán)利要求22所述的方法,其特征在于在所述編碼步驟進行哈夫曼編碼。
34.按權(quán)利要求33所述的方法,其特征在于哈夫曼編碼使用多個查詢表對行程和非零值進行編碼。
35.按權(quán)利要求34所述的方法,其特征在于有三個查詢表。
全文摘要
提出利用離散余弦變換系數(shù)數(shù)據(jù)自適應(yīng)大小的塊和子塊進行圖像壓縮的系統(tǒng)和方法。在編碼器中的塊大小分配元件選擇將要處理的一組輸入像素的塊和子塊。選擇是根據(jù)像素值的方差進行的。帶有的方差比閾值更大的塊再被細(xì)分,而帶有的方差比閾值小的塊不再被細(xì)分。變換元件把所選塊的像素值變換到頻域中。然后頻域值可被量化、連續(xù)化以及在傳輸?shù)臏?zhǔn)備中被編碼成不同大小。
文檔編號H04N7/30GK1421102SQ00818271
公開日2003年5月28日 申請日期2000年11月8日 優(yōu)先權(quán)日1999年11月8日
發(fā)明者K·賽阿格拉堅, M·J·瑪瑞特 申請人:高通股份有限公司