專(zhuān)利名稱(chēng):在數(shù)字視頻信號(hào)的后處理中使用編碼信息和局部空間特征的清晰度增強(qiáng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明是針對(duì)使用編碼信息和局部空間特征來(lái)提高數(shù)字視頻信號(hào)質(zhì)量的系統(tǒng)和方法。本發(fā)明的系統(tǒng)和方法提高了被編碼或轉(zhuǎn)換代碼的數(shù)字視頻清晰度而不會(huì)增加編碼人工產(chǎn)物。
諸如機(jī)頂盒、高端電視、數(shù)字電視、個(gè)人電視、存儲(chǔ)產(chǎn)品、個(gè)人數(shù)字助理、無(wú)線互聯(lián)網(wǎng)設(shè)備等等之類(lèi)的高質(zhì)量多媒體設(shè)備的發(fā)展正引起多種結(jié)構(gòu)和對(duì)這些設(shè)備新的特征的更多開(kāi)放。另外,這些新產(chǎn)品的發(fā)展和它們顯示任何格式的視頻信息的能力產(chǎn)生了新的需求和關(guān)于視頻處理和視頻增強(qiáng)算法的機(jī)會(huì)。
MPEG(動(dòng)態(tài)圖象專(zhuān)家組)視頻壓縮被用于許多當(dāng)前以及正在出現(xiàn)的產(chǎn)品上。MPEG是數(shù)字電視機(jī)頂盒、DSS、HDTV解碼器、DVD播放器、會(huì)議電視、互聯(lián)網(wǎng)視頻和其它應(yīng)用的核心。這些應(yīng)用受益于視頻壓縮,該技術(shù)需要更少的存儲(chǔ)空間來(lái)存檔視頻信息和更少的帶寬來(lái)把視頻信息從一點(diǎn)發(fā)射到另一點(diǎn),或這兩者的結(jié)合。這些設(shè)備中的大多數(shù)用MPEG-2格式來(lái)接收和/或存儲(chǔ)視頻。將來(lái),它們可以用MPEG-4格式來(lái)接收和/或存儲(chǔ)視頻。這些MPEG源的圖像質(zhì)量可能變化極大。
對(duì)人類(lèi)視覺(jué)系統(tǒng)的研究已經(jīng)顯示,眼睛對(duì)于亮度的變化更為敏感,而對(duì)于色度的變化就不那么敏感。MPEG運(yùn)行在色空間上,它有效地利用了眼睛對(duì)亮度和色度信息的不同敏感度。從而,MPEG使用YCbCr色空間代替RGB來(lái)表示數(shù)據(jù)值;其中,Y是亮度分量,實(shí)驗(yàn)確定Y=0.299R+0.587G+0.114B,Cb是藍(lán)色色差分量,Cb=B-y,和Cr是紅色色差分量,Cr=R-Y。
MPEG視頻被安排在分層層次中來(lái)幫助例如音頻比特流的錯(cuò)誤處理、隨機(jī)搜索和編輯、以及同步。第一層或頂層被稱(chēng)為視頻序列層,并且它是任何獨(dú)立的比特流,例如被編碼的電影、廣告或動(dòng)畫(huà)片。
第一層之下的第二層是圖像組(GOP),其包含一個(gè)或多個(gè)內(nèi)部(I)幀組和/或非內(nèi)部(P或B)圖像組。I幀被嚴(yán)格地內(nèi)部壓縮,其提供了對(duì)視頻的隨機(jī)存取點(diǎn)。P幀是運(yùn)動(dòng)補(bǔ)償?shù)那跋?預(yù)測(cè)-編碼幀,它們被幀間壓縮并且一般比I幀提供更大的壓縮。B幀是運(yùn)動(dòng)補(bǔ)償?shù)碾p向-預(yù)測(cè)-編碼幀,它們被幀間壓縮并且一般提供最大的壓縮。
第二層之下的第三層是圖像層本身。在第三層之下的第四層被稱(chēng)作像條層。每個(gè)像條是光柵次序宏塊的連續(xù)序列,最常見(jiàn)的是在典型視頻應(yīng)用中以排為基礎(chǔ)。像條結(jié)構(gòu)被用于在存在誤差的情況下進(jìn)行解碼。每個(gè)像條由宏塊組成,宏塊是亮度像素或圖像數(shù)據(jù)元素的16×16的陣列,包括相關(guān)色度像素的兩個(gè)8×8陣列(取決于格式)。宏塊還可以被分成不同的8×8塊,用于諸如轉(zhuǎn)換編碼之類(lèi)的進(jìn)一步處理。當(dāng)涉及YCbCr色空間時(shí),宏塊可以用幾種不同的方式來(lái)表示。通常使用的三個(gè)格式被稱(chēng)為4:4:4、4:2:2和4:2:0視頻。4:2:2包含4:4:4一半的色度信息,4:4:4是全帶寬YCbCr視頻,而4:2:0包含四分之一的色度信息。由于亮度和色度的有效表示方式,4:2:0的表示方式允許將數(shù)據(jù)直接從12塊/宏塊簡(jiǎn)化到6塊/宏塊。
與MPEG導(dǎo)出其最大壓縮效率的P和B幀相比,I幀只提供中等壓縮。通過(guò)采用時(shí)間冗余度的基于運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè)技術(shù)可以實(shí)現(xiàn)壓縮效率。因?yàn)閹芮邢嚓P(guān),所以假設(shè)當(dāng)前的圖像可以被模式化為先前時(shí)間的圖像的轉(zhuǎn)化。然后,基于先前幀的數(shù)據(jù)來(lái)精確地預(yù)測(cè)一個(gè)幀的數(shù)據(jù)是可能的。在P幀中,每個(gè)16×16大小的宏塊跟據(jù)先前編碼的I或P圖像的宏塊而被預(yù)測(cè)。因?yàn)閹沁\(yùn)動(dòng)目標(biāo)的時(shí)間瞬態(tài),所以?xún)蓚€(gè)幀中的宏塊不可能對(duì)應(yīng)同樣的空間位置。編碼器會(huì)以半個(gè)像素為增量來(lái)搜索先前的幀(對(duì)于P幀而言,或在B幀前后的幀)以確定其它宏塊的位置,這些位置是包含在當(dāng)前宏塊中的信息的接近的匹配。來(lái)自相同位置宏塊(cosited macroblock)的最匹配宏塊在水平和垂直方向上的位移被稱(chēng)作運(yùn)動(dòng)矢量。當(dāng)前塊和匹配塊之間的差值和運(yùn)動(dòng)矢量被編碼。運(yùn)動(dòng)矢量還可以用于數(shù)據(jù)破壞情況下的運(yùn)動(dòng)預(yù)測(cè),并且復(fù)雜的解碼器算法可以使用這些矢量來(lái)消除錯(cuò)誤。對(duì)于B幀,基于運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè)和內(nèi)插通過(guò)使用每一幀兩側(cè)的參考幀而被執(zhí)行。
諸如基于藍(lán)光的數(shù)字錄像機(jī)(DVR)之類(lèi)的下一代存儲(chǔ)設(shè)備將具有某種程度上的HD(高清晰度)(ATSC)能力并且是一種適用圖象增強(qiáng)新方法的設(shè)備類(lèi)型。HD節(jié)目一般是根據(jù)MPEG-2視頻標(biāo)準(zhǔn)編碼以20Mb/s廣播的節(jié)目??紤]到DVR的存儲(chǔ)容量是25Gb左右,這表示每張光盤(pán)的HD視頻大約兩小時(shí)的記錄時(shí)間。為了增加記錄時(shí)間,可以定義幾個(gè)諸如長(zhǎng)時(shí)間播放(LP)和擴(kuò)展長(zhǎng)時(shí)間播放(ELP)模式之類(lèi)的長(zhǎng)時(shí)間播放模式。
對(duì)于長(zhǎng)時(shí)間播放模式,假設(shè)平均存儲(chǔ)比特率是大約10Mb/s,其允許兩倍的HD記錄時(shí)間。因此,轉(zhuǎn)換代碼是視頻處理鏈的不可分割的部分,其把20Mb/s的廣播比特率減少到10Mb/s的存儲(chǔ)比特率。在MPEG-2轉(zhuǎn)換代碼中,視頻的圖像質(zhì)量(例如清晰度)很可能會(huì)被降低。然而,特別是對(duì)于長(zhǎng)時(shí)間播放模式,圖像質(zhì)量將不會(huì)受到太多損害。因此,對(duì)于長(zhǎng)時(shí)間播放模式,后處理在提高被察覺(jué)的圖像質(zhì)量中扮演一個(gè)重要角色。
迄今為止,大多數(shù)現(xiàn)有技術(shù)的清晰度增強(qiáng)算法被發(fā)展并且被優(yōu)化用于模擬視頻傳輸標(biāo)準(zhǔn),比如NTSC(美國(guó)國(guó)家電視系統(tǒng)委員會(huì))、PAL(逐行倒相)和SECAM(順序傳送與存儲(chǔ)彩色電視系統(tǒng))。傳統(tǒng)上,圖像增強(qiáng)算法或者減少了圖像中某些多余的方面(例如降噪)或者提高了某些期望的圖像特征(例如清晰度增強(qiáng))。對(duì)于這些正在出現(xiàn)的存儲(chǔ)設(shè)備,由于這些圖像源的不同特征,傳統(tǒng)的清晰度增強(qiáng)算法可以次最佳地在被MPEG編碼或轉(zhuǎn)換代碼的視頻上執(zhí)行。在存儲(chǔ)系統(tǒng)的閉路視頻處理鏈中,用于確定編碼源質(zhì)量的信息可以從MPEG流中被導(dǎo)出。這個(gè)信息可能被用來(lái)提高視頻增強(qiáng)算法的性能。
因?yàn)閳D像質(zhì)量對(duì)于高端視頻產(chǎn)品仍是一個(gè)重要的因數(shù),所以執(zhí)行視頻增強(qiáng)的新途徑,特別是適用于供這些源的新途徑將會(huì)是有益的。在C-J Tsai、P.Karunaratne、N.P.Galatsanos和A.K.Katsaggelos的標(biāo)題為”A Compressed Video Enhancement Algorithm”(壓縮視頻增強(qiáng)算法)中(日本神戶(hù)1999年10月25-28號(hào)的IEEE Proc.,ICIP′99),作者提出了用于增強(qiáng)以低比特率編碼的視頻序列的一種迭代算法。對(duì)于MPEG源,圖像質(zhì)量的降低大部分起源于量化函數(shù)。從而,作者所使用的迭代的梯度投影算法使用其成本函數(shù)中諸如量化級(jí)大小、宏塊類(lèi)型和前向運(yùn)動(dòng)矢量之類(lèi)的編碼信息。算法顯示了對(duì)低比特率視頻的滿意效果,然而該方法有很高的計(jì)算復(fù)雜性。
在B.Martins和S.Forchammer的”Improved Decoding of MPEG-2Coded Video”(MPEG-2編碼視頻的改進(jìn)解碼)中(荷蘭,阿姆斯特丹2000年9月7-12號(hào)的Proc.of IBC′2000),在第109-115頁(yè)作者描述了一種用于改進(jìn)MPEG-2編碼視頻解碼的新概念。特別地,建議在解碼處理中集成用于反交錯(cuò)和格式轉(zhuǎn)換的一體化方法。該技術(shù)產(chǎn)生了比普通解碼獲得的圖像質(zhì)量高得多的圖像質(zhì)量。然而,迄今為止該方法的計(jì)算復(fù)雜性阻礙了它在消費(fèi)應(yīng)用中的實(shí)施。
兩篇文章都描述了使用MPEG編碼信息和成本函數(shù)的視頻增強(qiáng)算法。然而,這兩個(gè)方案除了不切實(shí)際之外還結(jié)合了增強(qiáng)和成本函數(shù)。成本函數(shù)確定了可以施加多少增強(qiáng)以及可以在圖像中的哪個(gè)位置施加增強(qiáng)。由成本和增強(qiáng)函數(shù)的組合引起的問(wèn)題在于只有一個(gè)算法能用于成本函數(shù)。
另外,以前的提高清晰度增強(qiáng)算法的嘗試只利用了來(lái)自MPEG比特流的編碼信息。以前的清晰度增強(qiáng)算法沒(méi)有區(qū)分不同的圖像類(lèi)型,比如I、P和B幀。因此,其沒(méi)有實(shí)現(xiàn)最佳的清晰度增強(qiáng)結(jié)果,原因是沒(méi)有區(qū)分存在編碼人工產(chǎn)物的圖像部分以及無(wú)人工產(chǎn)物的部分。該結(jié)果是次最佳的清晰度增強(qiáng)。
本發(fā)明的目的和優(yōu)點(diǎn)將會(huì)在下列描述中被闡述并且從中變得明顯,并且將通過(guò)本發(fā)明的實(shí)踐而被理解。通過(guò)在此處的描述和權(quán)利要求中并結(jié)合附圖特別指出的方法和系統(tǒng),本發(fā)明另外的優(yōu)點(diǎn)將被實(shí)現(xiàn)和獲得。
因此,本發(fā)明的一個(gè)目的是提供一種增強(qiáng)編碼數(shù)字視頻信號(hào)的圖像質(zhì)量的系統(tǒng)和方法,其利用了用于從低比特率到高比特率的各類(lèi)數(shù)字壓縮視頻源的清晰度增強(qiáng)算法。
本發(fā)明的另一個(gè)目的是提供一種增強(qiáng)編碼數(shù)字視頻信號(hào)的圖像質(zhì)量的系統(tǒng)和方法,其通過(guò)利用區(qū)分不同圖像類(lèi)型的清晰度增強(qiáng)算法來(lái)獲得更佳的清晰度增強(qiáng)結(jié)果。
本發(fā)明的另一個(gè)目的是提供一種增強(qiáng)編碼數(shù)字視頻信號(hào)的圖像質(zhì)量的系統(tǒng)和方法,其利用實(shí)現(xiàn)了較高時(shí)間連貫性的清晰度增強(qiáng)算法。
本發(fā)明的再一個(gè)目的是提供一種增強(qiáng)編碼數(shù)字視頻信號(hào)的圖像質(zhì)量的系統(tǒng)和方法,其利用了清晰度增強(qiáng)算法,該清晰度增強(qiáng)算法使用來(lái)自編碼比特流的編碼信息并結(jié)合局部空間特征來(lái)定義諸如增益之類(lèi)的數(shù)量指標(biāo),該數(shù)量指標(biāo)確定哪個(gè)像素是不錯(cuò)的增強(qiáng)候選并確定把特殊的像素增強(qiáng)多少。
為了實(shí)現(xiàn)這些和其它優(yōu)點(diǎn),并且根據(jù)被具體化和大致描述的本發(fā)明目的,本發(fā)明包括增強(qiáng)表示數(shù)字視頻系統(tǒng)中的至少一幀的編碼數(shù)字視頻信號(hào)的圖像質(zhì)量的方法。該方法包括下列步驟產(chǎn)生用于識(shí)別將被應(yīng)用于編碼數(shù)字視頻信號(hào)的清晰度增強(qiáng)限制的有效性量度,定義一幀中的局部空間特征和識(shí)別該幀的幀類(lèi)型。該方法還包括下列步驟基于局部空間特征來(lái)計(jì)算幀中每個(gè)像素的編碼增益根據(jù)幀類(lèi)型來(lái)計(jì)算有效性量度,和把編碼增益應(yīng)用于至少一個(gè)清晰度增強(qiáng)算法。最后,本方法包括通過(guò)應(yīng)用清晰度增強(qiáng)算法來(lái)產(chǎn)生增強(qiáng)的數(shù)字視頻信號(hào)。
本發(fā)明還包括用于增強(qiáng)表示至少一幀的編碼數(shù)字視頻信號(hào)清晰度的系統(tǒng)。該系統(tǒng)包括一個(gè)選擇器,用于從編碼數(shù)字視頻信號(hào)中選擇和提取統(tǒng)計(jì)信息,一個(gè)有效性量度產(chǎn)生器,用于在解碼后產(chǎn)生編碼數(shù)字視頻信號(hào)的有效性量度。有效性量度識(shí)別將被應(yīng)用于解碼視頻信號(hào)的清晰度增強(qiáng)限制。該系統(tǒng)還包括用于在一幀中定義局部空間特征的裝置,和用于識(shí)別該幀的幀類(lèi)型的裝置。另外,該系統(tǒng)包括用于基于局部空間特征來(lái)計(jì)算幀中每個(gè)像素的編碼增益和根據(jù)幀類(lèi)型來(lái)計(jì)算有效性量度的裝置,和清晰度增強(qiáng)器,其把清晰度增強(qiáng)算法應(yīng)用到被解碼的數(shù)字視頻信號(hào)上,從而基于編碼增益來(lái)提高信號(hào)清晰度。
應(yīng)當(dāng)理解,上面的概述和下列詳細(xì)說(shuō)明都是可仿效的并且被用來(lái)進(jìn)一步解釋所要求的本發(fā)明。
結(jié)合在說(shuō)明書(shū)中并構(gòu)成說(shuō)明書(shū)一部分的附圖被用來(lái)說(shuō)明和提供對(duì)本發(fā)明方法和系統(tǒng)的進(jìn)一步了解。附圖連同文字說(shuō)明一起來(lái)解釋本發(fā)明的原理。
圖1是一個(gè)包含本發(fā)明的系統(tǒng)和方法的可仿效數(shù)字電視機(jī)的框圖;圖2是一個(gè)包含本發(fā)明的有效性量度產(chǎn)生器和編碼增益控制塊的自適應(yīng)峰值單元的框圖;圖3是一個(gè)說(shuō)明根據(jù)本發(fā)明所使用的清晰度增強(qiáng)算法的替換實(shí)施例的框圖;圖4是一個(gè)說(shuō)明包含本發(fā)明的有效性量度產(chǎn)生器和編碼增益控制塊的自適應(yīng)峰值單元的可替換有利實(shí)施例的框圖;圖5是一個(gè)說(shuō)明計(jì)算I幀的編碼增益的方法的流程圖;圖6是一個(gè)說(shuō)明計(jì)算P幀的編碼增益的方法的流程圖。
圖7是一個(gè)說(shuō)明本發(fā)明操作方法的有利實(shí)施例的流程圖。
現(xiàn)在將詳細(xì)參考本發(fā)明當(dāng)前的優(yōu)選實(shí)施例,在附圖中說(shuō)明了它的一個(gè)實(shí)例。本發(fā)明的方法和相應(yīng)步驟將結(jié)合系統(tǒng)的詳細(xì)說(shuō)明來(lái)描述。
下面論述的圖1到圖7和在此用于描述該系統(tǒng)原理和本發(fā)明方法的各個(gè)實(shí)施例只是用于示例,而不應(yīng)被解釋為以任何形式限制本發(fā)明的范圍。本發(fā)明的系統(tǒng)和方法將被描述為一個(gè)系統(tǒng)和方法,其用于增強(qiáng)數(shù)字電視機(jī)中的編碼數(shù)字視頻信號(hào)的圖像質(zhì)量。重要的是,實(shí)現(xiàn)本發(fā)明的系統(tǒng)和方法不限于數(shù)字電視機(jī)。本領(lǐng)域技術(shù)人員將會(huì)容易地理解本發(fā)明原理也可以被成功地應(yīng)用于任何類(lèi)型的數(shù)字視頻系統(tǒng),包括(不加限制地)電視接收機(jī)、機(jī)頂盒、存儲(chǔ)設(shè)備、計(jì)算機(jī)視頻顯示系統(tǒng)和使用或處理數(shù)字視頻信號(hào)的任何類(lèi)型的電子裝置。術(shù)語(yǔ)″數(shù)字視頻系統(tǒng)″被用來(lái)表示這些或現(xiàn)在將來(lái)可用的其它類(lèi)似的設(shè)備類(lèi)型。在下列描述中,采用數(shù)字電視機(jī)作為數(shù)字視頻系統(tǒng)的一個(gè)典型的實(shí)例。
圖1是一個(gè)數(shù)字電視機(jī)100的框圖,其使用了本發(fā)明的設(shè)備和方法。數(shù)字電視機(jī)100包括電視接收機(jī)110和顯示單元115。顯示單元115可以是陰極射線管或平面顯示器或任何用于顯示視頻圖像的設(shè)備類(lèi)型。電視接收機(jī)110包括用于接收電視信號(hào)的天線105。天線105被連接到調(diào)諧器120。調(diào)諧器120被連接到中頻(“IF”)處理器125。在此實(shí)現(xiàn)的中頻處理器125被連接到解碼器130。雖然本發(fā)明描述一個(gè)MPEG解碼器,但本發(fā)明不受限于MPEG類(lèi)型的編碼/解碼應(yīng)用。根據(jù)本發(fā)明的其它實(shí)施例,諸如JPEG(靜像壓縮標(biāo)準(zhǔn))、MPEG-1、2、4(數(shù)字視頻標(biāo)準(zhǔn))、H.261、H.263(視頻會(huì)議標(biāo)準(zhǔn))等等之類(lèi)的任何基于塊的壓縮方案都可以被利用。在這些標(biāo)準(zhǔn)中,二維(2D)DCT(離散余弦變換)被應(yīng)用于被壓縮圖像中的8×8像素塊。由DCT產(chǎn)生的64(8×8=64)個(gè)系數(shù)然后被量化來(lái)提供實(shí)際壓縮。在典型圖像中,來(lái)自8×8像素塊上的DCT的大多數(shù)DCT系數(shù)是很小的并且在量化之后變成零。DCT在現(xiàn)實(shí)圖像上的這一特性對(duì)壓縮方案很重要。
根據(jù)本發(fā)明,提供了一種方法和相應(yīng)的系統(tǒng)來(lái)增強(qiáng)表示數(shù)字視頻系統(tǒng)中的至少一個(gè)幀的編碼數(shù)字視頻信號(hào)的圖像質(zhì)量。如在下面詳細(xì)描述的,該方法通常包括下列步驟產(chǎn)生識(shí)別將被應(yīng)用于編碼數(shù)字視頻信號(hào)的清晰度增強(qiáng)限制的有效性量度,定義一幀中的局部空間特征,和識(shí)別該幀的幀類(lèi)型。然后,基于局部空間特征來(lái)計(jì)算幀中每個(gè)像素的編碼增益和根據(jù)幀類(lèi)型來(lái)計(jì)算有效性量度。一旦被計(jì)算出來(lái),編碼增益然后就被應(yīng)用于至少一個(gè)清晰度增強(qiáng)算法來(lái)產(chǎn)生增強(qiáng)的數(shù)字視頻信號(hào)。
圖7是一個(gè)說(shuō)明本發(fā)明操作方法的有利實(shí)施例的流程圖。在此,在此實(shí)現(xiàn)的方法的步驟在下面被更詳細(xì)地描述。計(jì)算編碼增益來(lái)處理一個(gè)幀(幀”t”)的方法整體由數(shù)字700表示。首先,獲得編碼信息(步驟705)。然后,幀t的UME和局部空間特征根據(jù)本發(fā)明而被計(jì)算(步驟710、715)。
本方法還包括下列步驟基于局部空間特征來(lái)計(jì)算幀中每個(gè)像素的編碼增益和根據(jù)被識(shí)別的幀類(lèi)型來(lái)計(jì)算有效性量度(步驟710)。
最后,本方法包括下列步驟把編碼增益應(yīng)用于至少一個(gè)清晰度增強(qiáng)算法,和通過(guò)應(yīng)用清晰度增強(qiáng)算法來(lái)產(chǎn)生增強(qiáng)的數(shù)字視頻信號(hào)。
為了清楚起見(jiàn),本系統(tǒng)和方法現(xiàn)在將結(jié)合附圖而被描述。本發(fā)明為增強(qiáng)視頻信號(hào)質(zhì)量產(chǎn)生了增強(qiáng)有效性量度(UME)。MPEG解碼器130的輸出端被連接到后處理電路135來(lái)應(yīng)用至少一個(gè)清晰度增強(qiáng)算法。例如(非限制性的),后處理電路135可以包括自適應(yīng)峰值單元140,自適應(yīng)峰值單元140包含本發(fā)明的有效性量度(UME)。自適應(yīng)峰值單元140可以位于后處理電路135內(nèi)的適當(dāng)位置。后處理電路135的輸出被輸入顯示單元115。
如為了例證的目的而在此實(shí)現(xiàn)的,自適應(yīng)峰值單元140處理從MPEG解碼器130接收的視頻信號(hào)。自適應(yīng)峰值單元140使用這個(gè)例子中的UME來(lái)產(chǎn)生編碼增益值以用于自適應(yīng)峰值處理。自適應(yīng)峰值的處理是說(shuō)明性并且顯示本發(fā)明的UME是怎樣被使用的。當(dāng)然,本發(fā)明的系統(tǒng)和方法不限于該自適應(yīng)峰值處理。UME可以被用于不止一種替換類(lèi)型的視頻增強(qiáng)算法。
在考慮了視頻信號(hào)中的編碼信息以及諸如像素亮度值變化之類(lèi)的局部空間特征的方式下,自適應(yīng)峰值單元140處理視頻信號(hào)。自適應(yīng)峰值單元140的輸出是視頻信號(hào)的增強(qiáng)亮度信號(hào),自適應(yīng)峰值單元140從MPEG解碼器130接收該視頻信號(hào)。在下面將被進(jìn)一步描述的是,由自適應(yīng)峰值單元140所確定的亮度信號(hào)提供了比通過(guò)現(xiàn)有技術(shù)自適應(yīng)峰值單元所提供的視頻圖像更為精確的和視覺(jué)上更清楚的視頻圖像。自適應(yīng)峰值單元140把增強(qiáng)亮度信號(hào)傳送到后處理電路135內(nèi)的其它電路。后處理電路135能夠利用增強(qiáng)亮度信號(hào)來(lái)增強(qiáng)視頻信號(hào)質(zhì)量。
后處理電路135能夠執(zhí)行幾個(gè)不同類(lèi)型的視頻信號(hào)處理。例如,一部分視頻信號(hào)處理應(yīng)用包括(a)噪聲電平自適應(yīng)降噪算法,(b)噪聲電平自適應(yīng)清晰度增強(qiáng),(c)噪聲電平自適應(yīng)亮度-色度分離,(d)噪聲電平自適應(yīng)運(yùn)動(dòng)檢測(cè),(e)噪聲電平自適應(yīng)運(yùn)動(dòng)估值和補(bǔ)償,(f)噪聲電平自適應(yīng)上變換,(g)噪聲電平自適應(yīng)特征增強(qiáng),和(h)基于噪聲電平自適應(yīng)對(duì)象的算法。
圖2是說(shuō)明根據(jù)本發(fā)明有利實(shí)施例的自適應(yīng)峰值單元140的系統(tǒng)和方法的框圖。圖2說(shuō)明了本發(fā)明的增強(qiáng)有效性量度(UME)可以怎樣被應(yīng)用于清晰度增強(qiáng)的自適應(yīng)峰值算法。在本技術(shù)領(lǐng)域中所熟知的自適應(yīng)峰值算法是針對(duì)于增加輸入亮度信號(hào)210的瞬態(tài)幅度。自適應(yīng)峰值算法通常不一定提供″先驗(yàn)的″編碼/轉(zhuǎn)換代碼的視頻源的最佳視頻質(zhì)量。這主要是因?yàn)镸PEG源的特征沒(méi)有被考慮。
在本發(fā)明中,有效性量度產(chǎn)生器215產(chǎn)生有用量度(UME)。UME用參考數(shù)字220標(biāo)記。UME220考慮了諸如量化參數(shù)和用于編碼宏塊的比特?cái)?shù)之類(lèi)的MPEG源的特征。原始算法通過(guò)使用UME220而被擴(kuò)展,從而顯著地增加了自適應(yīng)峰值算法的性能。
自適應(yīng)峰值算法所使用的原理在現(xiàn)有技術(shù)中是熟知的。一個(gè)自適應(yīng)峰值算法的例子使用了四(4)個(gè)基于像素的控制塊。如圖2中所示,這四個(gè)(4)控制塊是對(duì)比度控制塊225、動(dòng)態(tài)范圍控制塊230、削波阻止塊235和自適應(yīng)核心塊240。對(duì)比度控制塊225產(chǎn)生增益信號(hào)”g1”。動(dòng)態(tài)范圍控制塊230產(chǎn)生增益信號(hào)”g2”。削波阻止塊235產(chǎn)生增益信號(hào)”g3”。自適應(yīng)核心塊240產(chǎn)生增益信號(hào)”g4”?;谙袼氐倪@四個(gè)(4)控制塊考慮了視頻信號(hào)的特殊局部特征,比如對(duì)比度、動(dòng)態(tài)范圍和噪聲電平。然而,這四個(gè)(4)控制塊沒(méi)有考慮視頻信號(hào)的編碼特性和局部空間特征的有關(guān)信息,比如像素亮度值的變化。
本發(fā)明的系統(tǒng)提供了編碼增益塊245。如下而進(jìn)一步描述的,編碼增益塊245使用有效性量度(UME)220和局部空間特征來(lái)確定允許的峰值量。編碼增益塊245產(chǎn)生增益信號(hào)”“gcoding”。動(dòng)態(tài)增益控制塊250選擇五個(gè)(5)增益信號(hào)(g1、g2、g3、g4、gcoding)中最小的來(lái)產(chǎn)生最終的增益信號(hào)”g”。乘法器電路255用高通信號(hào)來(lái)乘以這個(gè)最終增益信號(hào)”g”,高通信號(hào)已經(jīng)通過(guò)2D峰值濾波器260濾波。加法器265把來(lái)自乘法器電路255的結(jié)果加到由亮度輸入信號(hào)210表示的像素原始亮度值上。用這個(gè)方法,產(chǎn)生了增強(qiáng)亮度輸出信號(hào)270。這些功能中的每一個(gè)功能都可以通過(guò)在本技術(shù)領(lǐng)域中熟知的適當(dāng)部件來(lái)執(zhí)行。
為了示例(而非限制)的目的,圖3說(shuō)明了一個(gè)根據(jù)本發(fā)明用于編碼數(shù)字視頻的清晰度增強(qiáng)的典型系統(tǒng)。該系統(tǒng)包括用于過(guò)濾輸入視頻信號(hào)210的高通濾波器260,用于用通過(guò)本發(fā)明任何方法所確定的編碼增益258來(lái)乘以高通濾波信號(hào)的乘法器255。乘法運(yùn)算產(chǎn)生增益控制信號(hào)。該系統(tǒng)還包括一個(gè)加法器265,其用于相加輸入視頻信號(hào)210和增益控制信號(hào)以及用于產(chǎn)生增強(qiáng)亮度輸出信號(hào)270,增強(qiáng)亮度輸出信號(hào)270與輸入信號(hào)210相比具有提高了的圖像質(zhì)量。
在圖4中,UME220計(jì)算(以像素為基礎(chǔ)或以區(qū)域?yàn)榛A(chǔ))像素或區(qū)域可以增強(qiáng)多少而不會(huì)增加編碼人工產(chǎn)物。UME220從存在于比特流中的MPEG編碼信息中導(dǎo)出。存在于比特流中的編碼信息可以在解碼過(guò)程中被恢復(fù)。UME220提供時(shí)空特征或視頻圖像質(zhì)量指示。
根據(jù)本發(fā)明,直接在解碼過(guò)程中獲得的MPEG信息的最精細(xì)顆粒度是(1)基于宏塊(MB)數(shù)量,或(2)基于以塊為基礎(chǔ)的數(shù)量。然而,對(duì)于空間(像素)域視頻增強(qiáng),圖像的每個(gè)像素的UME都應(yīng)該被計(jì)算以確保最好的圖像質(zhì)量。
易于從MPEG信息中提取的一個(gè)參數(shù)是量化參數(shù)(q_scale),它存在于每個(gè)編碼宏塊(MB)中。量化參數(shù)越高,量化就越粗糙,因此量化誤差也就越高。高量化誤差導(dǎo)致編碼人工產(chǎn)物。因此,有高量化參數(shù)的宏塊(MB)中的像素增強(qiáng)可以被進(jìn)一步抑制。
另一個(gè)有用的信息項(xiàng)是用于編碼宏塊(MB)或塊的比特?cái)?shù)(num_bits)。通常,編碼塊用到的比特越少,塊的質(zhì)量就越低。然而,這個(gè)數(shù)量(num_bits)還高度取決于場(chǎng)景內(nèi)容、比特率、幀類(lèi)型(比如I(內(nèi)部)、P(預(yù)測(cè))、B(雙向預(yù)測(cè))幀類(lèi)型)、運(yùn)動(dòng)估值和運(yùn)動(dòng)補(bǔ)償。
還可能考慮到塊中存在的DCT系數(shù)的分布。另外,運(yùn)動(dòng)矢量可以被用來(lái)獲得將被增強(qiáng)的視頻的時(shí)間特征的信息。所熟知的是,被估算和被用于MPEG編碼的運(yùn)動(dòng)矢量不一定表示視頻中的真實(shí)運(yùn)動(dòng)。然而,即使當(dāng)運(yùn)動(dòng)矢量不可靠時(shí),運(yùn)動(dòng)矢量也有助于識(shí)別靜態(tài)區(qū)域和使用靜態(tài)區(qū)域來(lái)提高從幀到幀的增強(qiáng)的時(shí)間連貫性。
編碼宏塊(MB)或者塊所用的量化參數(shù)(q_scale)和比特?cái)?shù)(num_bits)都被廣泛的用于MPEG編碼的速率控制計(jì)算。
因?yàn)檩^大的量化參數(shù)值通常導(dǎo)致增加的編碼人工產(chǎn)物,所以UME一般是與量化參數(shù)q_scale逆相關(guān)的。
先前提到,本發(fā)明的方法和系統(tǒng)產(chǎn)生用于識(shí)別將被應(yīng)用于編碼數(shù)字視頻信號(hào)的清晰度增強(qiáng)限制的有效性量度。根據(jù)本發(fā)明的優(yōu)選實(shí)施例,下列等式可被用來(lái)產(chǎn)生UMEUME=1-M*(1+q_scaleN)2*num_bitsq_scalemax(q_scalenum_bits)]]>等式(1)其中,UME是有效性量度,q_scale是宏塊的量化比例,num_bits是用于編碼亮度塊的比特?cái)?shù)(即用于編碼亮度塊的DCT塊的AC系數(shù)的比特?cái)?shù)),max是表示整個(gè)幀中的最大值的函數(shù),以及M和N是實(shí)驗(yàn)確定的比例因數(shù)。N因數(shù)在q_scale值的范圍之內(nèi)。M因數(shù)取決于用戶(hù)的主觀感受。例如,為了較強(qiáng)的清晰度增強(qiáng)可以降低M,但是如果用戶(hù)寧愿圖像不那么清晰,則M因數(shù)可以被增加。M的值可能是1、2、4、8等等。
在本發(fā)明的有利實(shí)施例中,UME值的范圍可以從″零″(“0”)到″一(“1”)。UME的”零”值意味著對(duì)于特定像素不允許進(jìn)行清晰度增強(qiáng),″一″值意味著像素可以被自由地增強(qiáng)而不會(huì)增加任何編碼人工產(chǎn)物。
在本發(fā)明的優(yōu)選實(shí)施例中,對(duì)于每個(gè)塊都計(jì)算等式(1)中的UME。
根據(jù)本發(fā)明的優(yōu)選實(shí)施例,UME和局部空間特征都被用來(lái)計(jì)算將被用于清晰度增強(qiáng)算法中的編碼增益。因此,本發(fā)明包括定義視頻信號(hào)每一幀的局部空間特征。
如圖4中所示,對(duì)于此處的實(shí)施例,局部空間特征由計(jì)算器247來(lái)定義。在本發(fā)明的優(yōu)選實(shí)施例中,局部空間特征被定義為在覆蓋nxn像素的nxn窗口上的每個(gè)像素的亮度值變化。該變化如下被定義var(i,j)=Σk=-qqΣm=-qq|pix(i+k,j+m)-mean|]]>等式(2)其中,q=(n-1)/2,pix(i+k,j+m)是在位置(i+k,j+m)的像素值以及mean是在所述nxn窗口上的平均像素值。術(shù)語(yǔ)i和j是像素的起始座標(biāo),k和m是位移值。
可替換地,局部空間特征可以被定義為區(qū)域(紋理或無(wú)格式區(qū)域)映射。
因?yàn)閁ME被計(jì)算來(lái)說(shuō)明編碼特征,所以UME防止了諸如成塊和環(huán)圍(ringing)之類(lèi)的編碼人工產(chǎn)物的增強(qiáng)。從而,通過(guò)清晰度增強(qiáng)算法的其它部分,阻止或減少了可能由于施加太多增強(qiáng)而引起的非編碼起源的人工產(chǎn)物。
根據(jù)本發(fā)明,基于局部空間特征和UME來(lái)計(jì)算幀中每個(gè)像素的編碼增益并且將其應(yīng)用于至少一個(gè)清晰度增強(qiáng)算法。例如UME可以與任何峰值算法相結(jié)合??商鎿Q地,UME可以適應(yīng)任何空間域的清晰度增強(qiáng)算法。還可能只利用與自適應(yīng)峰值算法相結(jié)合的編碼信息和局部空間特征。
圖4說(shuō)明了這樣一個(gè)實(shí)施例。在圖4中,圖2的四個(gè)(4)控制塊225、230、235和240已經(jīng)被除去。只保留編碼增益塊245。通過(guò)區(qū)別不同的圖像類(lèi)型,利用UME和局部空間特征來(lái)計(jì)算編碼增益。局部空間特征計(jì)算器247可以在軟件或/和硬件中被執(zhí)行。在MPEG比特流中,不同的圖像類(lèi)型是I、P和B。
I(或內(nèi)部編碼)幀使用DCT編碼來(lái)僅僅壓縮單個(gè)幀而不參考序列中的任何其它幀。P(或預(yù)測(cè))幀被編碼為同前一個(gè)I或P幀的差別。通過(guò)獲取上一個(gè)I或P幀并預(yù)測(cè)每個(gè)新的像素的值,首先預(yù)測(cè)新的P幀。從而,P幀一般提供比I幀更好的壓縮比。B(或雙向)幀被編碼為同前一個(gè)或后一個(gè)I或者P幀的差別。B幀使用類(lèi)似于P幀的預(yù)測(cè),但是對(duì)于每個(gè)塊,先前的I或P幀被使用或者下一個(gè)I或P幀被使用,或者兩者都被使用。P和B幀都使用運(yùn)動(dòng)預(yù)測(cè)和DCT編碼,然而,與P幀相比B幀一般具有提高的壓縮,這是因?yàn)閷?duì)每個(gè)宏塊都可能選擇是采用先前的還是后續(xù)的幀來(lái)進(jìn)行比較。
根據(jù)本發(fā)明的優(yōu)選方面,如在此實(shí)施的為了示例,編碼增益將取決于幀是I幀、P幀還是B幀而被不同地計(jì)算。
例如對(duì)于I幀,如在圖5中說(shuō)明的一樣,如果滿足條件C1,則UME根據(jù)等式(1)被計(jì)算,并且編碼增益被設(shè)置為等于UME。這個(gè)條件被定義為((var>VAR_THREAD)并且(num_bits≠0)),其中,var是局部空間特征,VAR_THREAD是預(yù)定的變化閾值,和num_bits是用于編碼亮度塊的比特?cái)?shù)。反之,如果條件C1不滿足,則編碼增益被設(shè)置為0,并且從而輸入信號(hào)不被改變。
特別地,如果局部空間特征大于預(yù)定變化閾值和如果編碼亮度塊的比特?cái)?shù)不為零,則UME根據(jù)等式(1)被計(jì)算并且編碼增益等于該UME。如果局部空間特征不大于預(yù)定變化閾值或者如果編碼亮度塊的比特?cái)?shù)為零,則編碼增益等于零。
MPEG-2視頻壓縮標(biāo)準(zhǔn)允許不使用數(shù)據(jù)而對(duì)在P(預(yù)測(cè))和B(雙向預(yù)測(cè))圖像中的宏塊(MB)和塊進(jìn)行編碼。這些宏塊被稱(chēng)作″跳過(guò)″宏塊。使用參考圖像和來(lái)自最新編碼的非跳過(guò)宏塊(MB)中的編碼信息,在解碼過(guò)程中重建跳過(guò)宏塊(MB)。此外,對(duì)于被充分地運(yùn)動(dòng)補(bǔ)償?shù)暮陦K(MB),在比特流中沒(méi)有DCT數(shù)據(jù)或者宏塊(MB)中的某些塊不被編碼。
因此,計(jì)算P幀的編碼增益算法在圖6中被描述。如果宏塊被跳過(guò)(即宏塊的四個(gè)亮度塊被跳過(guò)),則基于本技術(shù)領(lǐng)域中已知的運(yùn)動(dòng)矢量,從參考幀中恢復(fù)編碼增益。然而,如果宏塊未被跳過(guò),則必須估計(jì)情況C2。情況C2被定義為(var<=VAR_THREAD)。因此,如果局部空間特征(var)大于預(yù)定變化閾值(VAR_THREAD),則編碼增益通過(guò)使用運(yùn)動(dòng)矢量而從參考幀中恢復(fù)。反之,如果局部空間特征(var)等于或者小于預(yù)定變化閾值(VAR_THREAD),則編碼增益被設(shè)置為0。內(nèi)部編碼塊的運(yùn)動(dòng)矢量被指派為(0,0)。
對(duì)于B幀,先前參考幀的編碼增益映射被分配了編碼增益??蛇x地,在P幀時(shí)使用的相同程序可以適用于B幀。
進(jìn)一步根據(jù)本發(fā)明,編碼增益被應(yīng)用于至少一個(gè)清晰度增強(qiáng)算法來(lái)產(chǎn)生增強(qiáng)的數(shù)字視頻信號(hào)。在圖4中,通過(guò)使用乘法器電路255,上面計(jì)算出來(lái)的編碼增益被乘以高通濾波器260的輸出。然后,該結(jié)果被加法器265加到原始亮度輸入信號(hào)210來(lái)產(chǎn)生增強(qiáng)的亮度輸出信號(hào)270。
例如,并且參考用于例證的附圖,圖3中說(shuō)明的清晰度增強(qiáng)算法應(yīng)用了編碼增益。在本發(fā)明的優(yōu)選實(shí)施例中,將被使用的高通濾波器可以是k*0-10-14-10-10]]>
其中,k是介于0和1之間的比例因數(shù),即(0,1],從而排除0而包括1。因數(shù)k一般取決于用戶(hù)的主觀感受。為了獲得更清晰的圖像需要增加k。
圖3中說(shuō)明的清晰度增強(qiáng)算法的結(jié)果是以下的等式out_pixel=input_pixel+mpeg_gain*convolution_result等式(3)其中,output_pixel是將被用于像素的最終亮度值,input_pixel是輸入像素的亮度值,mpeg_gain是編碼增益,和convolution_result是高通濾波器的輸出。然后,表示幀中每個(gè)像素的清晰度增強(qiáng)算法結(jié)果的信號(hào)用一個(gè)已知方法被產(chǎn)生。
本發(fā)明還可以被應(yīng)用于高清晰度(HD)和標(biāo)準(zhǔn)清晰度(SD)序列,例如其存在于具有高清晰度(HD)能力并且允許長(zhǎng)時(shí)間播放(LP)模式的視頻存儲(chǔ)器應(yīng)用中。大多數(shù)這類(lèi)視頻序列從廣播MPEG-2比特流被轉(zhuǎn)換代碼成較低的存儲(chǔ)比特率。對(duì)于這類(lèi)應(yīng)用的長(zhǎng)時(shí)間播放(LP)模式,還可以在轉(zhuǎn)換代碼過(guò)程中進(jìn)行格式變化。相比不使用編碼信息的算法,根據(jù)本發(fā)明被編碼、解碼,然后用清晰度增強(qiáng)算法處理的標(biāo)準(zhǔn)清晰度(SD)或高清晰度(HD)視頻序列給先驗(yàn)編碼或轉(zhuǎn)換代碼的視頻序列提供了更為出眾的視頻質(zhì)量。
通過(guò)利用清晰度增強(qiáng)算法,以上述的以及在附圖中示出的本發(fā)明的方法和系統(tǒng)提供了增強(qiáng)數(shù)字編碼視頻信號(hào)質(zhì)量的改進(jìn)方法。
在不背離本發(fā)明的精神或范圍的前提下,可以對(duì)本發(fā)明的方法和系統(tǒng)作出不同的修改和變化,這一點(diǎn)對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō)是很明顯的。從而,本發(fā)明預(yù)定包括了附加的權(quán)利要求和其等效物范圍內(nèi)的修改和變化。
權(quán)利要求
1.一種用于增強(qiáng)表示數(shù)字視頻系統(tǒng)中至少一個(gè)幀的編碼數(shù)字視頻信號(hào)(210)的圖像質(zhì)量的方法,所述方法包括下列步驟產(chǎn)生(710)有效性量度(220),其用于識(shí)別將被應(yīng)用于所述編碼數(shù)字視頻信號(hào)的清晰度增強(qiáng)限制;定義(715)一幀中的局部空間特征(247);識(shí)別該幀的幀類(lèi)型;基于所述的局部空間特征(247)來(lái)計(jì)算(720)幀中每個(gè)像素的編碼增益(258)和根據(jù)幀類(lèi)型來(lái)計(jì)算所述的有效性量度(220);把所述的編碼增益(258)應(yīng)用到至少一個(gè)清晰度增強(qiáng)算法(725);和通過(guò)應(yīng)用所述的清晰度增強(qiáng)算法來(lái)產(chǎn)生增強(qiáng)的數(shù)字視頻信號(hào)(270)。
2.權(quán)利要求1的方法,其中,在應(yīng)用步驟中所應(yīng)用的算法是out_pixel=input_pixel+mpeg_gain*convolution_result,其中,output_pixel是將被用于像素的最終亮度值(270),input_pixel是輸入像素的亮度值(210),mpeg_gain是編碼增益(258),而convolution_result是高通濾波器(260)的輸出。
3.權(quán)利要求1的方法,其中,在產(chǎn)生步驟中產(chǎn)生的所述有效性量度(220)是UME=1-M*(1+q_scaleN)2*q_scalenum_bitsmax(q_scalenum_bits)]]>其中,UME是有效性量度(220),q_scale是宏塊的量化比例,num_bits是用于編碼亮度塊的比特?cái)?shù),max是表示該幀最大值的函數(shù),以及M和N是比例因數(shù)。
4.權(quán)利要求1的方法,其中,由定義步驟定義的局部空間特征(247)是在覆蓋nxn像素的nxn窗口上的像素亮度值變化,所述的變化根據(jù)下面的等式而被定義var(i,j)=Σk=-qqΣm=-qq|pix(i+k,j+m)-mean|]]>其中,q=(n-1)/2,pix(i+k,j+m)是在位置(i+k,j+m)的像素值以及mean是在所述nxn窗口上的平均像素值。
5.權(quán)利要求1的方法,其中,由識(shí)別步驟識(shí)別的幀類(lèi)型是I幀,和其中,計(jì)算編碼增益(258)的步驟還包括下列步驟計(jì)算編碼增益如下UME=1-M*(1+q_scaleN)2*q_scalenum_bitsmax(q_scalenum_bits)]]>其中,UME是有效性量度(220),q_scale是宏塊的量化比例,num_bits是用于編碼亮度塊的比特?cái)?shù),max是表示該幀最大值的函數(shù),以及M和N是比例因數(shù),如果局部空間特征(247)大于預(yù)定變化閾值和如果用于編碼亮度塊的比特?cái)?shù)不為零;和如果局部空間特征(247)不大于預(yù)定變化閾值或如果用于編碼亮度塊的比特?cái)?shù)為零,則計(jì)算編碼增益(258)為零。
6.權(quán)利要求1的方法,其中,由識(shí)別步驟識(shí)別的幀類(lèi)型是具有使用參考幀而被跳過(guò)和不被跳過(guò)的塊的P幀或B幀,并且,計(jì)算編碼增益(258)的步驟還包括下列步驟基于被跳過(guò)塊的運(yùn)動(dòng)矢量,從參考幀中恢復(fù)編碼增益;如果局部空間特征(247)等于或小于預(yù)定變化閾值,則計(jì)算非跳過(guò)塊的編碼增益(258)為零;和如果局部空間特征大于預(yù)定變化閾值,則基于運(yùn)動(dòng)矢量從參考幀中恢復(fù)非跳過(guò)塊編碼增益。
7.權(quán)利要求1的方法,其中,由識(shí)別步驟識(shí)別的幀類(lèi)型是B幀,其具有存在編碼增益映射的參考?jí)K,并且,計(jì)算編碼增益(258)的步驟還包括下列步驟復(fù)制參考幀的編碼增益映射為B幀的編碼增益。
8.權(quán)利要求2的方法,其中,高通濾波器輸出從高通濾波器(260)被獲得,濾波器被定義為k*0-10-14-10-10]]>其中,k是介于0和1之間的比例因數(shù)。
9.權(quán)利要求1的方法,其中,應(yīng)用步驟包括應(yīng)用峰值算法作為清晰度增強(qiáng)算法(725)。
10.權(quán)利要求1的方法,其中,應(yīng)用步驟包括應(yīng)用空間域算法作為清晰度增強(qiáng)算法(725)。
11.一個(gè)系統(tǒng),用于增強(qiáng)表示至少一個(gè)幀的編碼數(shù)字視頻信號(hào)的清晰度,所述系統(tǒng)包括一個(gè)選擇器,用于從編碼數(shù)字視頻信號(hào)中選擇和提取統(tǒng)計(jì)信息;一個(gè)有效性量度產(chǎn)生器(215),用于在解碼之后產(chǎn)生所述編碼數(shù)字視頻信號(hào)的有效性量度(220),所述的有效性量度(220)識(shí)別將被應(yīng)用于解碼視頻信號(hào)的清晰度增強(qiáng)限制;用于定義幀中的局部空間特征(247)的裝置;用于識(shí)別該幀的幀類(lèi)型的裝置;用于基于所述局部空間特征(247)來(lái)計(jì)算(720)幀中每個(gè)像素的編碼增益(258)和根據(jù)幀類(lèi)型來(lái)計(jì)算所述的有效性量度(220)的裝置;和一個(gè)清晰度增強(qiáng)器,其把清晰度增強(qiáng)算法應(yīng)用于被解碼的數(shù)字視頻信號(hào),以便基于所述編碼增益來(lái)提高信號(hào)清晰度。
12.權(quán)利要求11的系統(tǒng),其中,所述的清晰度增強(qiáng)算法(725)是峰值算法。
13.權(quán)利要求11的系統(tǒng),其中,所述的清晰度增強(qiáng)算法(725)是空間域算法。
全文摘要
提供了用于提高表示數(shù)字視頻系統(tǒng)中至少一個(gè)幀的編碼數(shù)字視頻信號(hào)的圖像質(zhì)量的方法和系統(tǒng),其包括下列步驟產(chǎn)生用于識(shí)別將被應(yīng)用于編碼數(shù)字視頻信號(hào)的清晰度增強(qiáng)限制的有效性量度,定義幀中的局部空間特征,和識(shí)別幀的幀類(lèi)型。這個(gè)有效性量度是其中,UME是用于宏塊的有用的量度,q_scale是宏塊的量化比例,num_bits是編碼亮度塊的比特?cái)?shù),max是幀的最大值的函數(shù)表示,和M和N是比例因數(shù)。本方法包括下列步驟基于局部空間特征來(lái)計(jì)算幀中每個(gè)像素的編碼增益和根據(jù)幀類(lèi)型來(lái)計(jì)算有效性量度;和把編碼增益應(yīng)用于至少一個(gè)清晰度增強(qiáng)算法上;以及通過(guò)應(yīng)用清晰度增強(qiáng)算法來(lái)產(chǎn)生沒(méi)有增強(qiáng)編碼人工產(chǎn)物的增強(qiáng)的數(shù)字視頻信號(hào)。
文檔編號(hào)H04N5/208GK1695381SQ02826182
公開(kāi)日2005年11月9日 申請(qǐng)日期2002年12月10日 優(yōu)先權(quán)日2001年12月27日
發(fā)明者Y·楊, L·博羅茨基 申請(qǐng)人:皇家飛利浦電子股份有限公司