專利名稱:改進的數(shù)字視頻和圖像的級聯(lián)壓縮方法和系統(tǒng)的制作方法
技術領域:
本發(fā)明屬視頻/圖像壓縮技術領域,具體地說,發(fā)明涉及降低由于數(shù)字視頻和圖像的級聯(lián)壓縮而引起的量化誤差的系統(tǒng)和方法。
背景技術:
電視電話、數(shù)字電視、電信會議和信息高速公路只是數(shù)字信息時代涌現(xiàn)的少數(shù)幾個例子。數(shù)字圖像和視頻處理的發(fā)展促進了數(shù)字信息時代的來臨。特別是數(shù)字圖像壓縮方法在這種發(fā)展中起了關鍵性的作用。圖像壓縮降低了表示數(shù)字圖像所需的數(shù)據(jù)量。例如,可以對彩色、灰度或黑白圖像進行壓縮,然后通過解壓縮得到原始圖象的精確表示。
壓縮通常在存儲或發(fā)送數(shù)據(jù)前進行。這使大量信息可以用一種經(jīng)濟的方式存儲和/或迅速傳送。如所周知,圖像壓縮通常是一個雙向過程,涉及壓縮和解壓縮。這些過程可能不是對稱的,即對于采用給定類型的壓縮算法來說一個過程所用的時間和/或計算能力可能不同于另一個過程。
通常有兩類圖像壓縮有損的和無損的。在有損壓縮中,經(jīng)解壓縮的圖像只是與原始圖象類似而不是完全相同。這是因為原始數(shù)據(jù)中至少有一部分已經(jīng)改變或拋棄了。有損壓縮技術包括二次采樣、差分脈碼調(diào)制(DPCM)和離散余弦變換(DCT)系數(shù)量化。相反,無損壓縮保持了原始圖象的所有數(shù)據(jù),即本質(zhì)上是一個完全可逆的編碼過程。無損壓縮技術包括可變長度編碼(VLC)和游程長度編碼(RLC)。
壓縮比通常定義為需壓縮的數(shù)據(jù)內(nèi)容與壓縮后得到的數(shù)據(jù)之比。有損壓縮方法可以提供100∶1以上的壓縮比。無損壓縮方法通常只能達到3∶1左右的壓縮比。通常,隨著有損壓縮比的增大,圖像惡化程度也增大。
可以用單級壓縮或多級壓縮來達到給定的壓縮比。一個圖像或視頻源在輸入的源信號受到串聯(lián)方式的多級壓縮時就受到了級聯(lián)壓縮。例如,在級聯(lián)壓縮中,首先以某個壓縮比壓縮源信號(圖像或視頻),然后再使經(jīng)壓縮的數(shù)據(jù)受到一個第二或較后級壓縮,以便達到一個較大的壓縮比。實際上,對于高效率的存儲或帶寬受限制的傳輸來說,可能需要較大的壓縮。
聯(lián)合攝影專家組(JPEG)和運動圖象專家組(MPEG)標準是非常廣泛采用的分別對圖像和視頻進行壓縮的方案。JPEG標準用于對逼真的現(xiàn)實世界的彩色或灰度圖像進行壓縮。雖然JPEG標準包括無損和有損模式,但是它通常用于有損模式,以便達到較大的壓縮比。通常,一個圖像利用離散余弦變換(DCT)變換到頻率域。所得到的其中值較小的頻率分量被舍棄掉,而只留下值較大的分量。這些值較大的分量然后用差分脈碼調(diào)制(DPCM)和霍夫曼碼編碼。JPEG壓縮的可調(diào)節(jié)性使得對于一個特定的應用要求可以考慮可變壓縮比和細調(diào)算法。
MPEG標準結合幀間編碼技術采用DCT和霍夫曼編碼方法,可以得到較大的壓縮比。MPEG-1和MPEG-2通常分別用于低清晰度圖象序列和高清晰度序列。MPEG-4所針對的是對象和場景的聲-像統(tǒng)一而不是幀。MPEG-7有助于聲-像內(nèi)容的定位。
上述壓縮技術采用DCT變換再對DCT系數(shù)進行量化和可變長度編碼,以達到數(shù)據(jù)壓縮。量化DCT系數(shù)使得這些壓縮技術成為有損的。如上所述,有損壓縮方案是解壓縮后的數(shù)據(jù)不是原始數(shù)據(jù)的嚴格拷貝的一種壓縮方案。例如,在JPEG或MPEG壓縮方案中,在級聯(lián)壓縮的每級壓縮實質(zhì)上都是有損的。此外,進行多級壓縮還引入了附加的損耗。
為了例示這附加的損耗,來看一下
圖1所示的兩種有損壓縮情況(a)和(b)。在情況(a)中,源數(shù)據(jù)10由壓縮系統(tǒng)11以壓縮比20∶1進行壓縮。在情況(b)中,源數(shù)據(jù)10首先受到第一級的10∶1壓縮再受到第二級的2∶1壓縮的級聯(lián)壓縮系統(tǒng)12的壓縮。在情況(b)中,第二壓縮級沒有接入原始的源數(shù)據(jù)10,而只是得到第一壓縮級輸出的經(jīng)壓縮的信號。情況(a)和(b)達到了同樣的20∶1壓縮。然而,由于級聯(lián)壓縮,情況(b)引入的均方誤差(MSE)將總是大于或等于情況(a)。這附加的誤差部分是由于在第二或較后壓縮級中量化值的選擇。
某些傳統(tǒng)的級聯(lián)壓縮系統(tǒng)對于各相繼的壓縮階段采用一組無退化的量化因子。利用諸如q值=K*(3**n)的數(shù)值關系來選擇這組量化因子。如果在第一階段使用其中一個量化器,然后在隨后的階段可以使用任何其他量化器。然而,這些系統(tǒng)沒有提供任何怎樣選擇隨后階段中的量化器以使級聯(lián)量化誤差減到最小的見識。因此,在這個技術領域內(nèi)存在著改進系統(tǒng)、方法和技術的要求,以將級聯(lián)壓縮引入的MSE減到最小,特別是通過適當?shù)倪x擇級聯(lián)壓縮方案中的第二或更后級的量化器將損耗減到最小。
發(fā)明概要本發(fā)明的一個目的是揭示以上討論的傳統(tǒng)級聯(lián)壓縮系統(tǒng)的缺點。
本發(fā)明的另一個目的是提供一種計算給定的一對量化器的級聯(lián)壓縮引入的誤差的方法。
本發(fā)明的又一個目的是提供一種通過適當?shù)倪x擇量化器將級聯(lián)壓縮引入的損耗減到最小的方法。
一個優(yōu)選實施例涉及降低在JPEG和MPEG壓縮方案的構架內(nèi)引入的量化誤差。
本發(fā)明的一個方面涉及一種用于級聯(lián)壓縮系統(tǒng)的方法,這種方法包括下列步驟確定一個由級聯(lián)壓縮系統(tǒng)的第二或較后級引入的期望量化誤差;以及對用于第二或較后級的至少兩個量化器的期望量化誤差進行比較。這種方法還包括按照比較結果選擇其中一個量化器,使得級聯(lián)壓縮系統(tǒng)的期望量化誤差減到最小。
在本發(fā)明的一個優(yōu)選實施例中,用一個概率分布函數(shù)來確定期望量化誤差。
本發(fā)明的另一個方面涉及一種執(zhí)行上述方法的存儲媒體和設備。
在下面的詳細說明中將對本發(fā)明的這些及其他一些實施例和情況進行舉例說明。
附圖簡要說明參考以下結合附圖對優(yōu)選實施例的詳細說明可以很好地理解本發(fā)明的特色和優(yōu)點。在這些附圖中圖1為一個非級聯(lián)壓縮系統(tǒng)和一個級聯(lián)壓縮系統(tǒng)的示意圖;圖2為示出在一個級聯(lián)壓縮系統(tǒng)中的兩個量化器的量化情況的示意圖;圖3為示出在一個級聯(lián)壓縮系統(tǒng)中的量化誤差的示意圖;圖4為按照本發(fā)明實現(xiàn)的一個典型計算機系統(tǒng)的方框圖。
優(yōu)選實施例詳細說明級聯(lián)壓縮引入的附加MSE可以結合圖2所示予以說明。圖2(a)示出了步長為Q1的均勻量化器的一些重建點和判決邊界。這些重建點用黑點表示,而判決邊界用短垂線表示。第n個重建點位于Qn1(未示出),Qn1兩側(cè)的判決邊界位于Dn1和D(n-1)1(未示出)。判決邊界大致處在兩個相繼的重建點的中間。對于一個步長為Q1的均勻量化器來說,重建點處在Q1的倍數(shù)處。一個輸入信號源的任何落在兩個判決邊界之間的值都量化為處在兩個判決邊界中間的重建點。
量化器Q1用于級聯(lián)壓縮的第一級(a),而量化器Q2用于壓縮的第二級(b)。對于一個單級壓縮來說,例如使用的是量化器Q2。在這個實施例中,量化器Q2的步長如同所示大于量化器Q1的步長。要指出的是,較大的量化步長可以達到較大的壓縮比,然而以引入較多的損耗為代價。可取的是,諸如在MPEG的I幀和JPEG壓縮方案中使用的那些也是均勻量化器。然而,也可以使用其他步長和不均勻量化器。
在圖2中,x表示需量化的輸入源信號的值。如果x落在[Q02,02)的范圍內(nèi),用單級量化器(在這種情況下只用級(1)),這個值將量化為Q02。要指出的是,符號“[”表示在范圍內(nèi)包括這個值,而符號“)”表示在這個范圍內(nèi)不包括這個值。在兩級量化器((a)和(b))的情況下,如果x落在
外因而會受到不正確量化的范圍。如可以看到的那樣,這個計算在均勻量化器的情況下簡單得多。
對于在一個環(huán)境內(nèi)的一些像素值的每個組合來說,黑和白的像素的概率分布可能是不同的。例如,在一個全部是白的環(huán)境中,對一個白的像素編碼的概率將比對一個黑的像素編碼的概率大得多。給定輸入源信號(x)的概率分布f(x),就可以如下計算出用量化器Q1和Q2級聯(lián)量化引入的期望量化誤差E(Q1,Q2)=∫f(x) 對于x∈ξ符號ξ表示含有如以上確定的x的值會受到不正確量化的所有區(qū)域的集合。
以上式進行的量化誤差的計算用來選擇級聯(lián)壓縮的第二級中的適當?shù)牧炕?。例如,如果第一級用量化器Q1,而假定有兩個可能的量化器Q2和Q2’可以用于第二級,于是就可以對于這兩個量化器計算出量化誤差。這兩個可能的量化器是試驗量化器。按量化誤差值最小來決定選擇量化器Q2和Q2’中哪一個最為合適。
如果預計量化器Q2提供r的比特率(較大的速率,較小的壓縮)而量化誤差為E(Q2)+E(Q1,Q2),而量化器Q2’預計提供r’的比特率而量化誤差為E(Q2’)+E(Q1,Q2’),于是可以用比特率與量化誤差之比來作為選擇量化器的度量。在這里,E(Q2)和E(Q2’)是量化器固有量化誤差,與級聯(lián)量化所引起的附加誤差無關。
當然,可以用以上討論的Q2或Q2’之外的量化器作為出發(fā)點。部分根據(jù)所需的總壓縮比來選擇量化器。在選擇初始量化器中也可以采用試算法??梢匀缟纤瞿菢佑嬎愠鋈舾蓚€量化器的量化誤差,按此選擇最適當?shù)牧炕鳌?br>
如上所述,本發(fā)明的一個實施例涉及采用JPEG和MPEG壓縮方案的應用。這兩個壓縮方案將輸入源數(shù)據(jù)在空間上劃分為一系列鄰接的大小為8x8的塊,每個塊經(jīng)DCT變換后得出64個DCT系數(shù)。接著對這些DCT系數(shù)進行量化。對DC系數(shù)進行的是差分編碼。對剩下的63個AC系數(shù)通過規(guī)定零系數(shù)的游程長度再對隨后的非零系數(shù)值編碼的方式編碼。
在JPEG的情況下,量化表的登錄項確定了用于不同的DCT系數(shù)的量化。對于不同的區(qū)域(例如,亮度和色度)可以采用不同的量化表,但是對于一個區(qū)域來說量化表是固定的。為了在對一個已經(jīng)受到JPEG壓縮的數(shù)據(jù)再壓縮中應用本發(fā)明的量化器選擇方法,必需知道每個DCT系數(shù)的概率分布f(x)。經(jīng)驗發(fā)現(xiàn),AC DCT系數(shù)的分布遵從Laplacian分布。要指出的是,與Laplacian分布關聯(lián)的參數(shù)對于不同的DCT系數(shù)是不同的。這參數(shù)可以予以估計,或者根據(jù)可用的壓縮數(shù)據(jù)得出一個不同的分布,諸如Rayleigh或Gaussian分布之類。
可以理解,對于DCT編碼圖像和MPEG誤差項都可以用Laplacian分布。MPEG壓縮方案用DCT對誤差項和圖象信息編碼。誤差項是根據(jù)MPEG運動補償算法得到的。一個誤差項是通過從一個在序列的另一個幀面上的塊減去一個圖像塊后對差進行DCT得到的。這使得幀面在圖像只有少量改變的情況下可以用較少的比特編碼。
此外,對于MPEG的情況,一個優(yōu)選實施例所針對的是MPEG格式中的I(幀內(nèi)編碼)幀。I幀只包括不參考其他幀面的幀內(nèi)編碼塊。這些幀可以用作序列中的隨機接入點。也可以使用諸如P(預測編碼)幀和B(雙向內(nèi)插)幀之類的其他MPEG幀類型。
例如,對于MPEG視頻中的每個(I)幀來說,量化值取決于量化標尺(quantizer_scale)和量化表。對于色度和亮度可以用不同的量化表。量化表對于每個幀是固定的,但是量化標尺對于每個宏塊是可以改變的。在一個實施例中,用以上論述的量化器選擇法來選擇每個MPEG幀宏塊的量化標尺。然而,要指出的是,對于每個DCT系數(shù)來說不能改變量化標尺。這個值對于整個宏塊是固定的。由于人類視覺系統(tǒng)對低頻系數(shù)的量化誤差比較敏感,因此更可取的是將量化標尺選擇成使所選擇的低頻系數(shù)的平均量化誤差減到最小。
圖4示出了一個可以實現(xiàn)本發(fā)明的視頻/圖像處理系統(tǒng)20。例如,系統(tǒng)20可以表示一個電視機,一個機頂盒,一個臺式、膝上或掌上型計算機,一個個人數(shù)字助理(PDA),一個諸如盒式磁帶錄像機(VCR)、數(shù)字錄像機(DVR)、TiVO設備之類的視頻/圖像存儲裝置,以及這些及其他設備的一些部分或組合。系統(tǒng)20包括一個或多個視頻/圖像源22,一個或多個輸入-輸出設備24,一個處理器25,以及一個存儲器26。視頻/圖像源22可以表示例如一個電視接收機,一個VCR,或者其他視頻/圖像存儲裝置。源22也可以表示一個或多個通過例如一個諸如互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、陸地廣播系統(tǒng)、有線電視網(wǎng)、衛(wèi)星網(wǎng)、無線網(wǎng)或電話網(wǎng)以及這些及其他類型的網(wǎng)絡的一些部分或組合從服務器接收視頻/圖像的網(wǎng)絡連接。
輸入-輸出設備24、處理器25和存儲器26通過通信媒體27通信。通信媒體27可以表示例如一個總線,一個通信網(wǎng),一個或多個電路、電路卡或其他設備的內(nèi)部連接,以及這些及其他通信媒體的一些部分和組合。從源22輸入的視頻/圖像按照存儲在存儲器26內(nèi)的由處理器25執(zhí)行的一個或多個軟件程序處理,產(chǎn)生輸出視頻/圖像,提供給一個諸如電視顯示器、計算機監(jiān)視器之類的顯示裝置28。
在一個優(yōu)選實施例中,計算級聯(lián)壓縮的期望量化誤差和選擇適當?shù)牧炕饔上到y(tǒng)20執(zhí)行的計算機可讀代碼實現(xiàn)。這代碼可以是存儲在存儲器26內(nèi)的,或者從一個諸如CD-ROM或軟盤之類的存儲媒體讀取/下載。在其他實施例中,可以用硬件電路來代替軟件指令或者與軟件指令結合,實現(xiàn)發(fā)明。
可以理解,如圖4所示的系統(tǒng)20的具體配置只是作為一個例子。熟悉該技術的人員可以認識到,本發(fā)明可以用多種可供選擇的系統(tǒng)配置來實現(xiàn)。
雖然以上就一些具體實施例對本發(fā)明進行了說明,但是可以理解,這并不是說本發(fā)明就局限于在這里所揭示的這些實施例。例如,本發(fā)明不局限于任何具體的壓縮方案、幀類型或概率分布。相反,本發(fā)明覆蓋了包括在所附權利要求書的精神和范圍內(nèi)的各種結構和變型。
權利要求
1.一種用于一個級聯(lián)壓縮系統(tǒng)(12)的方法,所述方法包括下列步驟確定由所述級聯(lián)壓縮系統(tǒng)的一個第二或較后級引入的期望量化誤差;對至少兩個可用于第二或較后級的量化器的期望量化誤差進行比較;以及按照比較結果從所述至少兩個量化器中選擇一個量化器。
2.按照權利要求1所述的方法,其中所述期望量化誤差用一個概率分布函數(shù)確定。
3.按照權利要求2所述的方法,其中所述概率分布函數(shù)是一個Laplacian分布。
4.按照權利要求2所述的方法,其中所述選擇步驟按照期望比特率與期望量化誤差之比選擇一個量化器。
5.按照權利要求2所述的方法,其中所述概率分布函數(shù)按照需壓縮的輸入數(shù)據(jù)(10)確定。
6.按照權利要求1所述的方法,其中所述至少兩個量化器按照所述級聯(lián)壓縮系統(tǒng)的所需壓縮比確定。
7.按照權利要求1所述的方法,其中所述級聯(lián)壓縮系統(tǒng)包括至少JPEG和MPEG系統(tǒng)之一。
8.按照權利要求1所述的方法,其中所述確定步驟包括確定一輸入數(shù)據(jù)的值將由所述級聯(lián)壓縮系統(tǒng)不正確量化的范圍的集合。
9.一種含有用于一個級聯(lián)壓縮系統(tǒng)(12)的代碼的存儲媒體,所述代碼包括計算由所述級聯(lián)壓縮系統(tǒng)的一個第二或較后級引入的期望量化誤差的確定代碼;對至少兩個可用于第二或較后級的量化器的期望量化誤差進行比較的比較代碼;以及按照比較代碼得出的結果考慮從所述至少兩個量化器中選擇一個量化器的選擇代碼。
10.按照權利要求9所述的存儲媒體,其中所述期望量化誤差用一個概率分布函數(shù)確定。
11.按照權利要求9所述的存儲媒體,其中所述概率分布函數(shù)是一個Laplacian分布。
12.按照權利要求9所述的存儲媒體,其中所述級聯(lián)壓縮系統(tǒng)包括至少JPEG和MPEG系統(tǒng)之一。
13.一種級聯(lián)壓縮設備(20),所述設備包括一個存儲可執(zhí)行代碼的存儲器(26);以及一個執(zhí)行存儲在所述存儲器(26)內(nèi)的代碼的處理器(25),所述處理器用來(i)確定由所述級聯(lián)壓縮系統(tǒng)的一個第二或較后級引入的期望量化誤差,(ii)對可用于第二或較后級的至少兩個量化器的期望量化誤差進行比較,以及(iii)按照比較結果能從所述至少兩個量化器中選擇一個量化器。
14.按照權利要求13所述的設備(20),其中所述期望量化誤差用一個概率分布函數(shù)確定。
15.按照權利要求14所述的設備(20),其中所述概率分布函數(shù)是一個Laplacian分布。
16.按照權利要求13所述的設備(20),其中所述級聯(lián)壓縮系統(tǒng)(12)包括至少JPEG和MPEG系統(tǒng)之一。
17.一種級聯(lián)壓縮系統(tǒng)(12),所述級聯(lián)壓縮系統(tǒng)包括確定由所述級聯(lián)壓縮系統(tǒng)引入的期望量化誤差的裝置(25,26);對根據(jù)一些可用于所述級聯(lián)壓縮系統(tǒng)的一個第二或較后級的可能量化器確定的所述期望量化誤差進行比較的裝置(25,26);以及從所述可能量化器中選擇一個量化器以減小所述期望量化誤差的裝置(25,26)。
全文摘要
本發(fā)明揭示了一種降低在采用級聯(lián)壓縮方案的系統(tǒng)中的量化誤差的系統(tǒng)和方法。確定由級聯(lián)壓縮方案引入的期望量化誤差后,對兩個或更多個可用于第二或較后級的試驗量化器的期望量化誤差進行比較。根據(jù)比較結果,從中選擇一個量化器用于第二或較后級壓縮,以降低這種級聯(lián)壓縮方案引起的量化誤差和/或?qū)⑺鼫p到最小。
文檔編號H04N7/30GK1342369SQ00804549
公開日2002年3月27日 申請日期2000年10月13日 優(yōu)先權日1999年11月3日
發(fā)明者S·克里斯納馬查里 申請人:皇家菲利浦電子有限公司