專利名稱:改進(jìn)的位面壓縮方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種改進(jìn)的位面(bit plane)壓縮方法,以及用于實(shí)現(xiàn)該方法的設(shè)備。
包含活動(dòng)圖象的數(shù)據(jù)文件以壓縮形式被存儲(chǔ)和發(fā)送以便減小所需要的存儲(chǔ)量或傳輸容量,是當(dāng)前普通的實(shí)踐。為了允許活動(dòng)圖象傳輸,圖象的低的傳送率是有利的,這樣,對于給定的活動(dòng)圖象組只需要通信信道的較小的容量。
通常使用離散余弦變換(DCT)來編碼活動(dòng)圖象,其中給定的圖象典型地以8象素×8象素的塊被編碼。DCT變換把8×8的塊從空間域變換成頻域。DCT系數(shù)被組織成位面,例如11個(gè)位面,因?yàn)镈CT系數(shù)典型地用11比特被編碼。8×8象素的塊的第一位面代表具有這個(gè)塊的每個(gè)系數(shù)的所有的最高位的面。因此,最后的位面由特定的塊的64個(gè)系數(shù)(8×8)中的每個(gè)系數(shù)的所有的最低位(LSB)組成。
通過從每個(gè)塊的最高位的面開始逐個(gè)位面地編碼DCT系數(shù),能夠達(dá)到比特率的可縮放性??煽s放的壓縮方法的目標(biāo)是要生成可以在任何想要的點(diǎn)處進(jìn)行截?cái)嗟谋忍亓?,而在選定的比特率下總是能給出最好可能的質(zhì)量。由于要生成可截?cái)嗟谋忍亓?,所以主要的目?biāo)是把最有意義的信息放置在比特流的開始。
由于每次把一個(gè)塊的一個(gè)位面放置在一個(gè)比特流中(每個(gè)塊被掃描或處理11次,假如有11個(gè)DCT系數(shù)的話),為了重建圖象,具有不同的方式組織包含剩余的數(shù)據(jù)的比特流。剩余的塊可以按對于人的視覺系統(tǒng)的重要性被處理。下面將給出一些例子。
活動(dòng)圖象專家組(MPEG)規(guī)定了被稱為MPEG4的標(biāo)準(zhǔn),該標(biāo)準(zhǔn)具有細(xì)粒度可縮放性(FGS)修改方案(ISO/IEC 14496-2/AMD 4;文件ISO/IEC JTC1/SC29/WG11 N3315)。MPEG4-FGS修改方案產(chǎn)生包含不可縮放的基本層(即,一個(gè)不能為了減小發(fā)送的信息量而過早地被截?cái)嗟膶?和FGS增強(qiáng)層的比特流。這個(gè)FGS增強(qiáng)層可以為了降低數(shù)據(jù)流的比特率被截割。為了改進(jìn)在增強(qiáng)層被過早地截?cái)嗟那樾蜗碌囊曨l質(zhì)量,頻率加權(quán)可被使用來強(qiáng)調(diào)某些DCT系數(shù)的質(zhì)量。頻率加權(quán)可包括把系數(shù)值乘以一個(gè)或多個(gè)作為2的冪的常數(shù)(例如,2、4、8、16等等)。如果系數(shù)被乘以4,則它的二進(jìn)制表示中的最低的兩個(gè)比特將是零;這可被稱為“移入”兩個(gè)零。這些零比特不一定只出現(xiàn)在LSB面上,而是可以出現(xiàn)在多個(gè)低位的位面上。在以下論文中討論了MPEG4-FGS、頻率加權(quán)和選定的感興趣的區(qū)域增強(qiáng)Weiping Li,“Overview of FGS scalability in MPEG4 Video Standard(MPEG4視頻標(biāo)準(zhǔn)中FGS可縮放性綜述)”,IEEE Transaction on Circuits andSystems for Video Technology Vol.11,No.3,March 2001。該文件在此引用,以供參考,以便提供背景信息和關(guān)于頻率加權(quán)、選擇的增強(qiáng)和上述的MPEG4標(biāo)準(zhǔn)的優(yōu)點(diǎn)的信息。
另外,以上文件涉及到也在這里使用的、選擇性的感興趣的區(qū)域增強(qiáng),它導(dǎo)致零點(diǎn)移入。
MPEG4-FGS標(biāo)準(zhǔn)并不對原先的圖象數(shù)據(jù)進(jìn)行編碼,而是對差分?jǐn)?shù)據(jù)(即,在原先的圖象數(shù)據(jù)與被包含在基本層中的圖象數(shù)據(jù)之間的差值)進(jìn)行編碼。
MPEG4-FGS修改方案存在缺點(diǎn),因?yàn)樵诰幋a圖象的比特流中的零值比特被移入,導(dǎo)致潛在的多個(gè)低有效位(low-significance bit)的位面。這在增強(qiáng)層沒有截割或過早截?cái)嗟那樾蜗陆档土嗽鰪?qiáng)層的效率,因?yàn)榱惚忍乇痪幋a到比特流中。
本發(fā)明的一個(gè)目的是解決上述的缺點(diǎn)。而且,本發(fā)明的一個(gè)目的是提供一種比起MPEG4-FGS標(biāo)準(zhǔn)具有提高效率的位面壓縮的方法。
按照本發(fā)明的第一方面,一種對可縮放的比特流中的圖象進(jìn)行編碼的方法包括對圖象或差分圖象進(jìn)行變換以給出變換系數(shù),對該可縮放的比特流中的系數(shù)進(jìn)行加權(quán),以及按照RUN,EOP方案來對該系數(shù)進(jìn)行編碼,其中作為加權(quán)的結(jié)果而引入的、該系數(shù)的二進(jìn)制表示中的零比特值不被編碼。
本發(fā)明有利地在圖象被編碼用于發(fā)送時(shí)減小被編碼或被發(fā)送的比特的數(shù)目,由此,減少了系統(tǒng)要求。該方法在沒有或有很少的可縮放的比特流分量被截?cái)嗟那樾蜗率翘貏e有利的。
優(yōu)選地,只有最多達(dá)到(但不包括)由于加權(quán)而引入的零比特值的那些二進(jìn)制表示的比特值才被編碼。
優(yōu)選地,加權(quán)是頻率加權(quán)和/或選擇的感興趣的區(qū)域增強(qiáng)。
優(yōu)選地,本方法是MPEG4-FGS方法的修正的版本。
可縮放的比特流可被編碼成非可縮放的比特流分量或基本層,以及可縮放的比特流分量,或增強(qiáng)層。
優(yōu)選地,用于RUN,EOP編碼的可變長度編碼被重新最佳化,以便計(jì)及零比特的不編碼。
系數(shù)優(yōu)選地是由象素塊變換到頻域而產(chǎn)生的離散余弦變換系數(shù)。象素塊優(yōu)選地由差分圖象(即,在原始地圖象與被包含在基本層中的圖象數(shù)據(jù)之間的差值)形成。圖象之間的差值或差值信號,可以在變換步驟后被計(jì)算。
按照本發(fā)明的第二方面,提供了一種對已編碼的圖象進(jìn)行解碼的方法,該已編碼的圖象是通過對圖象或差分圖象進(jìn)行變換以給出變換系數(shù)、對可縮放的比特流中的該系數(shù)進(jìn)行加權(quán)、以及按照RUN,EOP方案編碼該系數(shù)而被編碼的,其中作為加權(quán)的結(jié)果而引入的該系數(shù)的二進(jìn)制表示中的零比特值不被編碼,該方法包括把由于加權(quán)而產(chǎn)生的零重新引入到已編碼的RUN,EOP系數(shù)中;進(jìn)行RUN,EOP解碼;對系數(shù)進(jìn)行逆加權(quán);以及從頻域變換回來。
按照第三方面,編碼設(shè)備包括編碼裝置,該編碼裝置能通過變換圖象或差分圖象以給出變換系數(shù)、對可縮放的比特流中的系數(shù)進(jìn)行加權(quán)、以及按照RUN,EOP方案編碼該系數(shù)從而對圖象進(jìn)行編碼,其中作為加權(quán)的結(jié)果而引入的該系數(shù)的二進(jìn)制表示中的零比特值不被編碼。
該設(shè)備還可包括發(fā)送裝置。
該設(shè)備還可包括觀看裝置。
按照本發(fā)明的第四方面,發(fā)送設(shè)備包含先前方面的編碼設(shè)備。
按照本發(fā)明的第五方面,解碼設(shè)備包括解碼裝置,該解碼裝置能解碼已編碼的圖象,該已編碼的圖象是通過對圖象或差分圖象進(jìn)行變換以給出變換系數(shù)、對可縮放的比特流中的系數(shù)進(jìn)行加權(quán)、以及按照RUN,EOP方案編碼該系數(shù)而被編碼的,其中作為加權(quán)的結(jié)果而引入的該系數(shù)的二進(jìn)制表示中的零比特值不被編碼。
該解碼設(shè)備可包括觀看裝置。
本發(fā)明擴(kuò)展到一種已編碼圖象的信號,該已編碼圖象是通過對圖象或差分圖象進(jìn)行變換以給出變換系數(shù)、對可縮放的比特流中的系數(shù)進(jìn)行加權(quán)、以及按照RUN,EOP方案編碼該系數(shù)而被編碼的,其中作為加權(quán)的結(jié)果而引入的該系數(shù)的二進(jìn)制表示中的零比特值不被編碼,以及本發(fā)明還擴(kuò)展到載送所述信號的存儲(chǔ)媒體。
本發(fā)明還擴(kuò)展到包括第五方面的解碼設(shè)備的圖象重現(xiàn)設(shè)備。
這里揭示的所有的特征可以與以上的任何方面以任何組合相組合。
現(xiàn)在將參照附圖,通過例子,描述本發(fā)明的具體的實(shí)施例,其中
圖1是顯示本發(fā)明的壓縮方法的流程圖;以及圖2是顯示編碼與解碼設(shè)備的示意圖。
如上所述,已經(jīng)表明,DCT系數(shù)的頻率加權(quán)可顯著地改進(jìn)已解碼的圖象的質(zhì)量。除了頻率加權(quán)以外,選定的感興趣的區(qū)域(ROI)的質(zhì)量也可被改進(jìn)。
在MPEG4-FGS中頻率加權(quán)和ROI增強(qiáng)兩者都可以通過把多個(gè)零移入選定的DCT系數(shù)的最低位(LSB)而被執(zhí)行,為此,通過應(yīng)用加權(quán)矩陣來把更多的加權(quán)因子加到被選擇的系數(shù)。這把這些系數(shù)有效地向上移位幾個(gè)位面,由此,使得它們的比特比起另外的情形能更早地出現(xiàn)在增強(qiáng)層比特流中。因此,它們相對于在比特流被截割的事件中沒有被移位的或只移位較小量的系數(shù)將得到優(yōu)先權(quán)。
這里建議修正MPEG4-FGS標(biāo)準(zhǔn)的增強(qiáng)層比特流,以使得被移入的零不再被編碼,由此,當(dāng)沒有或只有小量比特從增強(qiáng)層被截割時(shí)將提高壓縮效率。
MPEG4-FGS使用被稱為(RUN,EOP)的技術(shù)。其中RUN符號代表零比特的行程(RUN),即,在下一個(gè)比特之前的零的數(shù)目。EOP符號將對該面的結(jié)尾(EOP)編碼,它在后面跟隨一個(gè)附加的(RUN,EOP)符號時(shí)具有數(shù)值零,以及對于最后的(RUN,EOP)符號具有數(shù)值1。
(RUN,EOP)技術(shù)以標(biāo)準(zhǔn)的Z字形次序(zig zag order)來將某個(gè)位面中的DCT塊系數(shù)排序,然后對具有上述數(shù)值的(RUN,EOP)符號編碼。
由于精確地知道何處出現(xiàn)移入的零,在(RUN,EOP)編碼期間它們完全可以被忽略。移入的零的位置是從頻率加權(quán)矩陣(它造成移入)獲知的。換句話說,移入的零在以RUN值代表的零的行程中完全不計(jì)及。解碼器(從加權(quán)矩陣)也知道這些零的位置,它們現(xiàn)在沒有被編碼,以及解碼器在它的DCT系數(shù)重建期間將正確地對此作出補(bǔ)償。
圖1示意地顯示該方法,包括DCT變換10、頻率加權(quán)12、(RUN,EOP)編碼(不帶有零)14、然后是發(fā)送16。解碼步驟是相反的,即在從加權(quán)矩陣獲知的位置處把零插入到DCT系數(shù)矩陣、(RUN,EOP)解碼、逆頻率加權(quán)、逆選擇增強(qiáng)加權(quán)(如果使用的話)、然后從頻域(DCT)變換回空間域。
正如在引言中提到的,MPEG4-FGS對差分圖象進(jìn)行編碼。作為對變換差分圖象的替代,在DCT變換10后產(chǎn)生差分信號是一個(gè)可任選的步驟。因此,圖象信息被變換后,接著從變換系數(shù)產(chǎn)生差分信號。
圖2顯示具有編碼裝置20和觀看裝置21的編碼設(shè)備18,以及顯示具有解碼裝置24和觀看裝置26的解碼設(shè)備22。編碼設(shè)備18可以通過發(fā)送裝置23把編碼過的信號發(fā)送到解碼裝置22,以用于解碼。發(fā)送設(shè)備(未示出)可以包括編碼設(shè)備18。圖象重現(xiàn)設(shè)備(未示出)可以包括解碼設(shè)備22。
在應(yīng)用這里建議的方法時(shí)對由(RUN,EOP)方法使用的VLC進(jìn)行重新最佳化將是有利的,但這只是可供選擇的。在VLC中,可變長度的碼字被分配給每個(gè)(RUN,EOP)對,把較短的碼字分配給更經(jīng)常出現(xiàn)的組合。在FGS中,熟知的Huffman(霍夫曼)代碼被使用于可變長度編碼。這些VLC/Huffman代碼是根據(jù)各種(RUN,EOP)組合的出現(xiàn)的頻率而設(shè)計(jì)的。由于在不計(jì)及行程中移入的零時(shí)(RUN,EOP)的出現(xiàn)會(huì)改變,通過使用對于修正的(RUN,EOP)方法得到的出現(xiàn)頻率重新設(shè)計(jì)這些代碼,性能(壓縮比)可潛在地被改進(jìn)。
相比于MPEG4-FGS標(biāo)準(zhǔn)的常規(guī)的應(yīng)用,這里描述的方法可被應(yīng)用來提高M(jìn)PEG4-FGS增強(qiáng)層的壓縮效率。尤其是,在高質(zhì)量的情況下當(dāng)沒有或有很少的比特從增強(qiáng)層比特流中截割時(shí),本方法是有利的。
因此,這里揭示的方法提供更有效的編碼,允許在給定的比特率下發(fā)送更多的信息,或在給定的比特率下允許以較少的時(shí)間發(fā)送特定的圖象組。
由于在修改標(biāo)準(zhǔn)的(RUN,EOP)方案時(shí)低估移入的零的困難,以(RUN,EOP)方法實(shí)施本發(fā)明并不是在著手進(jìn)行一個(gè)直截了當(dāng)?shù)幕蛎黠@的任務(wù)。必須從開頭就作出實(shí)施該方法的決定,因?yàn)樵?RUN,EOP)中比特是以行程(例如,組)而不是分開地被處理的。在其他的編碼系統(tǒng)中,不同的分開的處理可能使得該方法的實(shí)施更加直截了當(dāng),特別是如果移入的比特只在涉及到一個(gè)系數(shù)的數(shù)據(jù)的末尾,使得不發(fā)送這些比特的過程變得無足輕重。
這里揭示的方法可以在使用經(jīng)適當(dāng)修正的MPEG4-FGS位面壓縮方法的任何產(chǎn)品或系統(tǒng)中執(zhí)行。諸如包括用于顯示圖象的觀看裝置、半導(dǎo)體器件、和類似的部件的消費(fèi)者電子設(shè)備那樣的設(shè)備都可使用這里揭示的方法。
應(yīng)當(dāng)指出,上述的實(shí)施例是說明而不是限制本發(fā)明,以及本領(lǐng)域技術(shù)人員能夠設(shè)計(jì)許多替換的實(shí)施例,而不背離附屬權(quán)利要求的范圍。在權(quán)利要求中,被放置在括號之間的任何參考符號不應(yīng)當(dāng)看作為限制權(quán)利要求。單字“包括”并不排除存在除權(quán)利要求中所列出的以外的其他單元或步驟。本發(fā)明可藉助于包括若干不同元件的硬件和藉助于適當(dāng)?shù)鼐幊痰挠?jì)算機(jī)被實(shí)施。在枚舉幾個(gè)裝置的設(shè)備權(quán)利要求中,幾個(gè)這些裝置可以通過同一個(gè)硬件項(xiàng)被體現(xiàn)。某些措施在互相不同的相關(guān)的權(quán)利要求中被列舉的簡單事實(shí)并不表示這些措施的組合不能有利地使用。
權(quán)利要求
1.一種對可縮放的比特流中的圖象進(jìn)行編碼的方法,包括對圖象或差分圖象進(jìn)行變換以給出變換系數(shù),對在可縮放的比特流中的系數(shù)進(jìn)行加權(quán),以及按照RUN,EOP方案對該系數(shù)進(jìn)行編碼,其中作為加權(quán)的結(jié)果而引入的該系數(shù)的二進(jìn)制表示中的零比特值不被編碼。
2.如權(quán)利要求1中要求的方法,其中只有最多達(dá)到、但不包括作為加權(quán)的結(jié)果而引入的零比特值的二進(jìn)制表示中的那些比特值才被編碼。
3.如權(quán)利要求1或權(quán)利要求2中要求的方法,其中該加權(quán)是頻率或選擇的增強(qiáng)。
4.如任何前述權(quán)利要求中要求的方法,該方法是MPEG4-FGS方法的修正的版本。
5.如任何前述的權(quán)利要求中要求的方法,其中用于RUN,EOP編碼的可變長度編碼被重新最佳化,以便計(jì)及零比特的編碼。
6.如任何前述的權(quán)利要求中要求的方法,其中該系數(shù)是離散余弦變換系數(shù)。
7.如權(quán)利要求6中要求的方法,其中象素塊是由差分圖象形成的。
8.一種對已編碼的圖象進(jìn)行解碼的方法,該已編碼的圖象是通過對圖象或差分圖象進(jìn)行變換以給出變換系數(shù)、對可縮放的比特流中的該系數(shù)進(jìn)行加權(quán)、以及按照RUN,EOP方案編碼該系數(shù)而被編碼的,其中作為加權(quán)的結(jié)果而引入的該系數(shù)的二進(jìn)制表示中的零比特值不被編碼,該方法包括把由于加權(quán)而產(chǎn)生的零重新引入到已編碼的RUN,EOP系數(shù)中;進(jìn)行RUN,EOP解碼,對系數(shù)進(jìn)行逆加權(quán);以及從頻域變換回來。
9.一種編碼設(shè)備(18)包括編碼裝置(20),該編碼裝置(20)能通過變換圖象或差分圖象以給出變換系數(shù)、對可縮放的比特流中的系數(shù)進(jìn)行加權(quán)、以及按照RUN,EOP方案編碼該系數(shù)從而對圖象進(jìn)行編碼,其中作為加權(quán)的結(jié)果而引入的該系數(shù)的二進(jìn)制表示中的零比特值不被編碼。
10.發(fā)送設(shè)備,包括如權(quán)利要求9中要求的編碼設(shè)備(18)。
11.一種解碼設(shè)備(22)包括解碼裝置(24),該解碼裝置(24)能解碼已編碼的圖象,該已編碼的圖象是通過對圖象或差分圖象進(jìn)行變換以給出變換系數(shù)、對可縮放的比特流中的系數(shù)進(jìn)行加權(quán)、以及按照RUN,EOP方案編碼該系數(shù)而被編碼的,其中作為加權(quán)的結(jié)果而引入的該系數(shù)的二進(jìn)制表示中的零比特值不被編碼,或者該解碼裝置能通過把由于加權(quán)而產(chǎn)生的零重新引入到已編碼的RUN,EOP系數(shù)中、進(jìn)行RUN,EOP解碼、對系數(shù)進(jìn)行逆加權(quán)、以及從頻域變換回來而對圖象進(jìn)行解碼。
12.圖象重現(xiàn)設(shè)備,包括如權(quán)利要求11中要求的解碼設(shè)備(22)。
13.一種包括已編碼的圖象的信號,該已編碼的圖象是通過對圖象或差分圖象進(jìn)行變換以給出變換系數(shù)、對可縮放的比特流中的系數(shù)進(jìn)行加權(quán)、以及按照RUN,EOP方案編碼該系數(shù)而被編碼的,其中作為加權(quán)的結(jié)果而引入的該系數(shù)的二進(jìn)制表示中的零比特值不被編碼。
14.一種在其上存儲(chǔ)有包括已編碼的圖象的信號的存儲(chǔ)媒體,該已編碼的圖象是通過對圖象或差分圖象進(jìn)行編碼以給出變換系數(shù)、對可縮放的比特流中的系數(shù)進(jìn)行加權(quán)、以及按照RUN,EOP方案對該系數(shù)進(jìn)行編碼而被編碼的,其中作為加權(quán)的結(jié)果而引入的、該系數(shù)的二進(jìn)制表示中的零比特值不被編碼。
全文摘要
在MPEG4-FGS中頻率加權(quán)和感興趣的區(qū)域增強(qiáng)這兩者都可以通過應(yīng)用加權(quán)矩陣把多個(gè)零移入選定的離散余弦變換(DCT)系數(shù)的最低位(LSB)而被執(zhí)行。這把這些系數(shù)有效地向上移動(dòng)幾個(gè)位面,由此,使得它們的比特比起其他情形更早地出現(xiàn)在增強(qiáng)層比特流中。因此,它們相對于在比特流被截割的事件中沒有被移位的或只有較小量的移位的系數(shù)可得到優(yōu)先權(quán)。這里建議修正MPEG4-FGS標(biāo)準(zhǔn)的增強(qiáng)層比特流,以使得被移入的零不再被編碼,由此,當(dāng)沒有或只有小量比特從增強(qiáng)層被截割時(shí)可提高壓縮效率。
文檔編號H03M7/30GK1589575SQ02823084
公開日2005年3月2日 申請日期2002年10月25日 優(yōu)先權(quán)日2001年11月21日
發(fā)明者R·J·范德維勒坦 申請人:皇家飛利浦電子股份有限公司