專利名稱:用于視頻編解碼的自適應偏移裝置及方法
技術領域:
本發(fā)明是有關于視頻處理。本發(fā)明尤其是關于用于自適應偏移(adaptiveoffset)復原的裝置及方法。
背景技術:
與常用模擬格式的視頻數據相比,數字格式的視頻數據具有更多優(yōu)點,并因此成為視頻儲存及傳輸的主導格式。視頻數據通常數字化為由固定數量的比特(bit)表現的整數,例如每次采樣表現為8比特或10比特的整數。此外,色彩視頻數據通常利用一個選擇的色彩系統(tǒng)表現,所述色彩系統(tǒng)例如紅綠藍(Red-Green-Blue,簡稱為RGB)原色(primarycolor)坐標或亮度-色度(luminance-chrominance)系統(tǒng)。廣泛用于數字視頻的亮度-色度色彩系統(tǒng)之一是YCrCb色彩系統(tǒng),其中Y表示亮度成分,而Cr及Cb則表示色度成分。RGB成分及Y成分分別與原色的強度及亮度相關,且其數字化表示通常映射至一個整數,該整數的范圍與其數字表示的比特的數量相關。舉例而言,8比特視頻數據通常表示0至255的強度等級。另一方面,色度成分Cr及Cb對應于不同數據,并且其數字化表示通常映射至具有正值及負值的整數。舉例而言,8比特Cr/Cb數據表示-128至+127的色度等級。在數字視頻系統(tǒng)中的處理過程中,處理的視頻的平均值可能發(fā)生變化,從而導致強度偏移(intensity offset)。強度變化可能由于濾波、數據四舍五入(data rounding)、量化或其它處理而導致。強度變化(也稱為強度偏移)可以導致視覺障礙(visualimpairment)或假象(artifact),當強度變化逐巾貞改變時,視覺障礙或假象尤為顯著。因此,需要謹慎恢復像素強度偏移以避免上述的潛在問題。然而,通常一個幀內的圖像內容非常動態(tài)。為探究一個圖像內的動態(tài)內容特性,需要研發(fā)出一種用于自適應偏移復原的裝置及方法,該裝置及方法可用于圖像中的一個區(qū)域。此外,適應于像素特性的偏移復原需要通過將區(qū)域內的底層像素(underlying pixel)的特性分類來探究偏移。從而,所執(zhí)行的偏移復原可適應于每一分類。
發(fā)明內容
本發(fā)明揭露了一種用于自適應偏移復原的裝置及方法。基于本發(fā)明的方法包含接收已處理的視頻數據;選擇用于已處理的視頻數據的區(qū)域;基于多個像素中的每一個的特性測量決定多個像素中的每一個的分類,其中多個像素位于已處理的視頻數據的區(qū)域中;依據已處理的視頻數據的區(qū)域中的多個像素以及相關聯的原始視頻數據的區(qū)域中的多個像素決定用于分類的強度偏移;以及基于用于分類的強度偏移補償已處理的視頻數據的區(qū)域。所述區(qū)域可能小于圖像以使自適應偏移適應圖像的動態(tài)特性。自適應偏移復原可在解區(qū)塊處理之前應用于重建的視頻數據。依據本發(fā)明的一個實施例中,特性測量基于組成圍繞底層像素的像素的像素模式,特性測量可與底層像素的邊緣、峰值及谷值有關。依據本發(fā)明的另一個實施例中,特性測量基于底層像素的強度,強度被分為多個帶用于分類。依據本發(fā)明的又一個實施例中,自適應偏移與自適應環(huán)路濾波器具有同樣的像素分類。本發(fā)明實施例另提供一種用于解碼視頻比特流的裝置及方法,其中對應于視頻比特流的重建視頻圖像被進行自適應偏置處理。方法用于解碼視頻比特流,其中對應于視頻比特流的重建視頻圖像被進行自適應偏置處理,包含處理視頻比特流以重建多個視頻圖像,以及提供多個處理的視頻圖像;選擇用于多個處理的視頻圖像的區(qū)域;基于多個像素中的每一個的特性測量決定多個像素中的每一個的分類,其中多個像素位于多個處理的視頻圖像的區(qū)域中;決定視頻比特流中所指示的用于分類的強度偏移,;以及基于用于分類的強度偏移補償多個處理的視頻圖像的區(qū)域。所述區(qū)域可能小于圖像以使自適應偏移適應圖像的動態(tài)特性。自適應偏移復原可在解區(qū)塊處理之前應用于重建的視頻數據。依據本發(fā)明 的一個實施例中,特性測量基于組成圍繞底層像素的像素的像素模式,特性測量可與底層像素的邊緣、峰值及谷值有關。依據本發(fā)明的另一個實施例中,特性測量基于底層像素的強度,強度被分為多個帶用于分類。依據本發(fā)明的又一個實施例中,自適應偏移與自適應環(huán)路濾波器具有同樣的像素分類。
圖I是用于高效視頻編碼的范例的視頻編碼器的示意圖。圖2是另一用于聞效視頻編碼的范例的視頻解碼器的不意圖。圖3是基于像素分類的自適應偏移的范例,所述分類依據當前像素及其鄰近像素決定。圖4是依本發(fā)明實施例用于具有自適應偏移恢復的聞效視頻編碼自適應偏移的視頻編碼器的示意圖。圖5A是將強度范圍分割為16個均勻帶的范例。圖5B是將強度范圍分割為12個不均勻帶的范例。圖6A是用于決定像素分類的當前像素及其鄰近像素的配置的示意圖。圖6B是用于決定像素分類的當前像素及其鄰近像素的另一配置的示意圖。圖7A-7D分別展示了用于決定像素分類的當前像素及其鄰近像素的不同線性配置的示意圖。
具體實施例方式與常用模擬格式的視頻數據相比,數字格式的視頻數據具有更多優(yōu)點,并因此成為視頻儲存及傳輸的主導格式。視頻數據通常數字化為由固定數量的比特(bit)表現的整數,例如每次采樣表現為8比特或10比特的整數。此外,色彩視頻數據通常利用一個選擇的色彩系統(tǒng)表現,所述色彩系統(tǒng)例如紅綠藍(Red-Green-Blue,簡稱為RGB)原色(primarycolor)坐標或亮度-色度(luminance-chrominance)系統(tǒng)。廣泛用于數字視頻的亮度-色度色彩系統(tǒng)之一是YCrCb色彩系統(tǒng),其中Y表示亮度成分,而Cr及Cb則表示色度成分。RGB成分及Y成分分別與原色的強度及亮度相關,且其數字化表示通常映射至一個整數,該整數的范圍與其數字表示的比特的數量相關。舉例而言,8比特視頻數據通常表示0至255的強度等級。另一方面,色度成分Cr及Cb對應于不同數據,并且其數字化表示通常映射至具有正值及負值的整數。舉例而言,8比特Cr/Cb數據表示-128至+127的色度等級。在數字視頻系統(tǒng)中的處理過程中,處理的視頻的平均值可能發(fā)生變化,從而導致強度偏移(intensity offset)。強度變化可能由于濾波、數據四舍五入(data rounding)、量化或其它處理而導致。強度變化(也稱為強度偏移)可以導致視覺障礙(visualimpairment)或假象(artifact),當強度變化逐巾貞改變時,視覺障礙或假象尤為顯著。因此,需要謹慎恢復像素強度偏移以避免上述的潛在問題。然而,通常幀內及幀之間的圖像內容非常動態(tài)并且會隨時間變化。為探究動態(tài)視頻環(huán)境下內容自適應處理的優(yōu)點,需要研發(fā)出一種可以為底層視頻數據選擇圖像單元、命名預定義組(termed predefined set)以進一步改善已處理的視頻數據的質量的系統(tǒng)及方法。預定義組可被選中以捕捉底層視頻數據
圖I所示的編碼器代表使用巾貞內/巾貞間預測(intra/inter-prediction)的系統(tǒng)。幀內預測單元110負責基于同一圖像中的視頻數據提供預測數據。對于幀間預測,運動估計(motion estimation,簡稱為 ME)及運動補償(motion compensation,簡稱為 MC)單元112用于基于來自于其它圖像的視頻數據提供預測數據。開關114選擇幀內預測數據或幀間預測數據,并且所選的預測數據被提供至加法器116以形成預測誤差(predictionerror),也稱為殘余(residue)。預測誤差隨后被轉換器118及量化器120處理。轉換及量化的殘余隨后通過熵編碼器(entropy coder) 122編碼以形成對應于壓縮的視頻數據的比特流。比特流與轉換系數(transform coefficient)相關,并且比特流隨后與邊信息(side information) 一同被壓縮(packed),其中邊信息例如運動信息、模式信息及與圖像區(qū)域(image area)相關的其它信息。邊信息也可以被熵編碼,以降低所需的帶寬,相應地,如圖I所示,與邊信息相關的數據(例如,幀內模式信息、幀間模式信息、自適應環(huán)路濾波信息、殘余等)被提供至熵編碼器122。當使用幀間預測模式時,編碼結束時需重建參考圖像。因此,反量化器124及反轉換器126處理轉換及量化的殘余以恢復殘余。殘余隨后在重建單元128中被加回預測數據136以重建視頻數據。重建的視頻數據可以儲存在參考圖像緩沖器134中,用于其它幀的預測。然而,在視頻數據儲存在參考圖像緩沖器之前,重建的視頻數據須先經過去區(qū)塊效應濾波器130及自適應環(huán)路濾波器(adaptive loop filter,簡稱為ALF) 132以改善視頻質量。比特流中可加入自適應環(huán)路濾波信息傳輸,以便解碼器可適當恢復所需信息以應用自適應環(huán)路濾波。從而來自于ALF 132的自適應環(huán)路濾波信息被提供至熵編碼器122以并入最終的比特流。如圖I所示,編碼系統(tǒng)中,輸入的視頻數據會經過一系列處理,而由于該系列處理,來自于重建單元128的重建的視頻數據可能受強度偏移(intensity offset)的影響。重建的視頻數據進一步通過去區(qū)塊效應130及ALF 132處理,從而可能導致進一步的強度偏移。相應地,需要執(zhí)行偏移復原(也稱為偏移校正(offsetcorrection))來恢復強度偏移。圖2是用于高效視頻編碼(high efficiency video coding)的視頻解碼器的系統(tǒng)區(qū)塊的示意圖。由于編碼器也包含用于重建視頻數據的部分,解碼器的某些部分已經在編碼器中被揭示了,但熵解碼器222并未用于編碼器。此外,不同于解碼器,編碼器方面僅需要運動補償(MC)單元212,而不需要運動估計部分。開關214選擇幀內預測或幀間預測,并且所選的預測數據被提供至重建單元128以待與被恢復的殘余合并。除執(zhí)行用于壓縮的視頻數據的熵解碼之外,熵解碼器222也用于邊信息的熵解碼,并且將邊信息提供至各個區(qū)塊。舉例而言,幀內模式信息被提供至幀內預測單元110,幀間模式信息被提供至MC單元212,而自適應環(huán)路濾波信息被提供至ALF 132,殘余被提供至反量化器124。殘余經過反量化器124、反轉換器126處理以及重建處理殘余以重建視頻數據。類似的,如圖2所示,來自于重建單元128的重建的視頻數據經過包含反量化及反轉換的一系列處理,并且受強度偏移的影響。重建的視頻數據進一步被去區(qū)塊效應濾波器130及ALF 132處理,從而可能導致進一步的強度偏移。相應地,需要執(zhí)行偏移校正來補償強度偏移。為克服偏移問題,McCann等人于2010年4月15-23在德國德勒斯登舉行的ITU-TSG16 WP3 及 IS0/IEC JTC1/SC29/WG11 視頻編碼聯合團隊協(xié)作項目(Joint CollaborativeTeam on Video Coding,簡稱為JCT-VC)第一次會議上揭露了內容自適應極端校正(extreme correction,簡稱為 EXC)及帶校正(band correction)的文件 JCTVC-A124 (三星 對于視頻壓縮技術呼吁的響應)。對于鄰近像素的內容信息的使用可探究局部邊緣(localedge)特性并且可以得到改善的性能,例如較佳的視覺質量或比特率降低。圖3是基于像素分類的自適應偏移的范例,其中所述分類依據當前像素及其鄰近像素決定。如圖3所示,McCann等人揭露了一種鄰近像素配置,其中C是當前像素值,而nl至n4分別是當前像素的上方、左方、右方及下方的四個鄰近像素。下表依據McCann等人的方法將像素分為7類。
分類條件
~~0 C〈4個鄰近像素局部最小
I C〈3個鄰近像素&&C=第4個鄰近像素目標邊緣
~ C〈3個鄰近像素&&C>第4個鄰近像素目標邊緣
C>3個鄰近像素&MX第4個鄰近像素目標邊緣
~ 03個鄰近像素&&C=第4個鄰近像素目標邊緣
~ CM個鄰近像素局部最大
~6 并非以上的任一種SI對于分類0,像素C是局部最小值,也稱為谷值(valley)。對于分類5,像素C是局部最大值,也稱為峰值(peak)。對于分類1、2、3及4,像素C位于目標邊緣(object edge)。對于每一分類的像素,已處理的視頻數據的平均值及原始視頻數據的平均值的差被計算出并被傳輸給解碼器。已處理的視頻數據可以是來自于重建單元128的重建的視頻數據、來自于去區(qū)塊效應濾波器130的去區(qū)塊的數據或來自于ALF 132的自適應環(huán)路濾波的數據。McCann等人將邊緣特性以“類別”分類,其也可稱為“級別”。圖I及圖2展示將自適應偏移應用于視頻編解碼的范例性系統(tǒng),但其它系統(tǒng)也可以利用本發(fā)明克服強度偏移問題。舉例而言,在相機圖像處理系統(tǒng)中,通過去馬賽克(demosaicing)、白平衡(white balancing)及/或邊緣加強(edge enhancement)處理的視頻數據也可以受強度偏移的影響。依據如上所述的底層像素的邊緣特性,McCann等人對解碼濾波器130及ALF 132之間的已處理的數據應用強度偏移校正。McCann等人將基于底層像素的邊緣特性的自適應偏移校正稱為極端校正(EXC)。依據McCann等人的方法,上述極端校正應用于重建的視頻數據??蓻Q定對應于分類c的重建的平均強度值Vr (c)及對應于分類c的原始平均強度值Vo (c),并將其用于視頻圖像。對應于分類c的偏移Vd(c)可依據下列公式決定Vd(C)=Vo(C) -Vr(C)。以上述方法計算出的偏移Vd(C)被加回至屬于分類c的重建的視頻數據,也就是 說,Vr’(c) =Vr (c)+Vd(c),其中Vr’ (c)是已校正偏移的視頻數據。為使解碼器能夠對不同分類應用適當偏移,所有分類的偏移Vd (c)的值均需傳送至解碼器。同時,需要適當的比特流語法(bitstream syntax)以合并偏移Vd(C)的值。McCann等人對解碼濾波器130及ALF 132之間的已處理的視頻數據應用極端校正,并對ALF 132及參考圖像緩沖器134之間的處理的數據應用帶校正,除McCann等人的方法外,也可以在重建的數據傳送至解碼濾波器130之前對重建的數據應用自適應偏移校正。圖4是依據本發(fā)明的對重建單元128及解碼濾波器130之間的已處理的視頻數據應用自適應偏移的實施例的示意圖。McCann等人揭露了另一種依據底層像素所屬帶的自適應偏移校正方法。該方法被命名為帶校正(BDC)。依據McCann等人的方法,帶基分類(band-based classification)的主要動機是量化底層數據的兩個不同概率密度函數(Probability Density Function),其中該底層數據對應于重建的視頻數據及原始視頻數據。McCann等人揭露了利用設定像素的P位最高有效比特(most significant bit)的帶基分類,該方法等效于將強度分割為具有相同間隔的2P級。在某種實施中,McCann等人選擇p=4以將強度分割為16份等距帶,也可以稱為16級。對于每一帶或每一級,平均值的差被計算出并被傳輸給解碼器,從而每一帶的偏移可被個別的校正。決定對應于帶c或分類c的重建的平均強度值Vr(C)及對應于帶c或分類c的原始平均強度值Vo (c)并用于視頻圖像。為方便起見,此處以相同的數學符號Vr(C)及Vo(C)用于EXC?;谶吘壧匦缘淖赃m應偏移校正中,對應于分類c的偏移Vd(C)可依據公式Vd(c)=Vo(c)-Vr(c)而決定。以上述方法計算出的偏移Vd(C)隨后被加回屬于分類c的重建的視頻數據,也就是說,Vr’(c) =Vr (c)+Vd(c),其中Vr’(c)是已校正偏移的視頻數據。McCann等人將帶校正應用于ALF 132及參考圖像緩沖器134之間的已處理的視頻數據。McCann等人揭露了基于特性的自適應處理方法,所述方法與鄰近像素或強度帶相關,但該方法對于圖像內的動態(tài)特性的探究并無自適應性,而一個圖像區(qū)的特性可能極不同于另一圖像區(qū)的特性。在McCann等人的方法中,分類或帶決定總是基于完整的幀或一組圖像。對于某些視頻數據而言,由于與較小圖像區(qū)相關的分類或帶可較佳的特性化區(qū)域中的底層視頻數據,對應于較小圖像區(qū)的區(qū)域可能更加有利于自適應處理。然而,較小圖像區(qū)可能需要更多附加信息(overhead information),例如McCann等人所揭露的范例中的強度偏移信息需要傳輸至解碼器。因此在潛在性能改善及與較小圖像區(qū)相關的附加信息增加之間存在權衡(tradeoff)。相應地,本實施例所揭露的像素強度處理利用較小圖像區(qū)(在本實施例中命名為區(qū)域)。區(qū)域的尺寸可獨立于用于各個視頻處理的圖像區(qū),其中視頻處理可例如壓縮系統(tǒng)中的視頻壓縮或數字相機中的傳感器圖像處理。此外,區(qū)域可逐個圖像實現自適應配置。在本實施例中,自適應偏移(AO)作為自適應偏移校正或自適應偏移復原的簡稱。在本發(fā)明的另一實施例中,AO更與ALF結合。對于圖像的每一區(qū)域,A0、ALF或AO及ALF的結合可自適應的用于該區(qū)域。當AO及ALF選擇性地應用于某一區(qū)域時,可以在不犧牲編碼效率(coding efficiency)的同時降低平均解碼時間??赡苄枰闷鞓藖碇甘続0、AF或AO及AF的合并中哪一個應該用于該區(qū)域。
McCann等人揭露了利用相同間隔用于整體圖像的帶校正,然而,本發(fā)明的實施例揭露了更為進步的帶分類,也就是說基于圖像區(qū)域的帶分類。首先利用固定尺寸的區(qū)塊或利用四叉樹(quadtree)分區(qū)將圖像分為多個分區(qū)。所劃分的每一分區(qū)也稱為上述實施例中所述的區(qū)域。每一區(qū)域內的像素隨后依據進步的帶分類方法被分為多個帶。進步的帶分類從如圖5A所示的16個均勻帶或者如圖5B所示的12個不均勻帶中自適應地選擇一帶分類。帶分類類型的選擇可逐區(qū)域進行,同時需要旗標指示所作的選擇。強度值的最小及最大值可來自于用于該區(qū)域的重建的視頻數據。從而,最小值及最大值可無需傳輸至解碼器。用于每一區(qū)域的帶偏移被傳送至解碼器方,以便解碼器可適當校正用于該區(qū)域的每一帶的帶偏移?;谶M步的帶分類的偏移恢復方法被稱為帶偏移復原或簡稱為帶偏移(BO)。作為范例性實施例,兩類帶被用于實施本發(fā)明,也可以使用更多類型的帶實施本發(fā)明。在本實施例中,以16個均勻帶及12個不均勻帶作為兩個范例的帶類型,然而,應當注意,兩個范例的帶類型所使用的帶的數量并非本發(fā)明的限制??墒褂酶嗷蚋倬鶆蚣安痪鶆驇ь愋蛯嵤┍景l(fā)明。上文揭露了兩種類型的帶,也就是說,16個均勻帶及12個不均勻帶,另外的可選的帶分類也可用于帶偏移校正??蛇x的帶分類將區(qū)域中的像素分為N個帶。N個帶隨后被分為兩組,其中一組進行偏移校正,而另一組不進行偏移校正。舉例而言,區(qū)域內的像素可被分為32個均勻帶。覆蓋強度[64,191]的中心的16個帶分區(qū)可被指定為第一組,而覆蓋剩余強度的剩余16個帶可被指定為第二組。一組是否需要偏移校正的決定可在區(qū)域上通過區(qū)域基礎(region basis)而做出。上述范例將帶分為兩組實施本發(fā)明,應當注意,也可以將帶分為更多組來實施本發(fā)明。舉例而言,N個帶可被分為M組,其中M是不小于2的整數。在該M組中,可指定P組不進行偏移校正,其中P不大于M。而剩余的(M-P)組接受偏移校正,并且用于該(M-P)組的強度偏移需要被提供至解碼器以用于偏移校正。McCann等人揭露了與底層像素的邊緣特性相關的自適應處理方法,并且像素分類是基于整體圖像而進行的,而本發(fā)明的一實施例則選擇像素配置或像素式樣,在區(qū)域上通過區(qū)域基礎自適應地測量邊緣特性。在本實施例中,旗標用于每一區(qū)域,以傳輸像素配置的選擇,用于決定邊緣特性。區(qū)域可通過利用固定尺寸的區(qū)塊或利用四叉樹分區(qū)分割圖像而形成。除如圖6A所示的像素配置之外,也可以選擇如圖6B所示的另一像素配置。如圖6A所示的交叉像素配置或交叉像素式樣對于水平邊緣或垂直邊緣的回應較佳。此外,該像素式樣也回應底層像素的峰值或谷值。另一方面,圖6B的對角線像素配置對于傾斜角度為45°或135°的斜邊及底層像素的峰值或谷值的回應較佳。如下表所示,該自適應方法也將像素分為7類
權利要求
1.一種自適應偏移處理方法,用于已處理的視頻數據,該自適應偏移處理方法包含 接收該已處理的視頻數據; 選擇該已處理的視頻數據的區(qū)域; 基于多個像素中的每一個的特性測量決定該多個像素中的每一個的分類,其中該多個像素位于該已處理的視頻數據的該區(qū)域中; 依據該已處理的視頻數據的該區(qū)域中的該多個像素以及相關聯的原始視頻數據的區(qū)域中的多個像素決定用于該分類的強度偏移;以及 基于用于該分類的該強度偏移補償該已處理的視頻數據的該區(qū)域。
2.根據權利要求I所述的方法,其特征在于,該已處理的視頻數據對應于去區(qū)塊處理之前的重建視頻數據。
3.根據權利要求I所述的方法,其特征在于,用于該區(qū)域的自適應環(huán)路濾波選擇性地取代決定該多個像素中的每一個的分類、決定用于該分類的強度偏移以及補償該已處理的視頻數據的該區(qū)域的步驟。
4.根據權利要求I所述的方法,其特征在于,決定該多個像素中的每一個的分類包含將像素強度分割為N個不均勻帶,其中N是整數。
5.根據權利要求I所述的方法,其特征在于,決定該多個像素中的每一個的分類包含將像素強度選擇性地分割為N個不均勻帶或M個均勻帶,以及將旗標提供至解碼器以指示N個不均勻帶或M個均勻帶中哪一個被選擇,其中N及M是整數。
6.根據權利要求I所述的方法,其特征在于,決定該多個像素中的每一個的分類包含將像素強度分割為N個帶,該N個帶介于最小值及最大值之間,其中N是整數。
7.根據權利要求I所述的方法,其特征在于,決定該多個像素中的每一個的分類包含將像素強度分割為N個帶,提供序列、圖像或切片等級中未受偏移校正的M個帶的信息,以及為(N-M)個帶中的每一個提供該強度偏移,其中N及M均為整數,并且M不大于N。
8.根據權利要求I所述的方法,其特征在于,決定該多個像素中的每一個的分類包含將像素強度分割為N個帶,將該N個帶分為M組,提供未受偏移校正的P組的信息,以及為(M-P)組中的每一個帶提供該強度偏移,其中N、M及P均為整數,M不小于2并且P不大于M0
9.根據權利要求I所述的方法,其特征在于,決定該多個像素中中的每一個的分類包含選擇像素式樣,以及將旗標提供至解碼器以指示被選取的該像素式樣,其中該像素式樣用于該特性測量。
10.根據權利要求I所述的方法,其特征在于,該多個像素中的每一個的該特性測量從包含編碼單元模式、預測單元尺寸、傳輸單元尺寸、量化參數、參考圖像、運動向量、幀內預測模式、殘余以及去區(qū)塊界強度的群組中選擇。
11.根據權利要求I所述的方法,更包含利用濾波器對該多個像素中的每一個應用自適應環(huán)路濾波,其中該濾波器依據該多個像素中的每一個的該分類而決定。
12.根據權利要求I所述的方法,更包含利用濾波器對該多個像素中的每一個應用自適應環(huán)路濾波,其中該濾波器依據該多個像素中的每一個的該分類而決定,并且拉普拉斯算子的總和被用作該多個像素中的每一個的該特性測量。
13.一種自適應偏移處理裝置,用于已處理的視頻數據,該自適應偏移處理裝置包含接口,接收該已處理的視頻數據; 配置單元,配置該已處理的視頻數據的區(qū)域; 第一處理單元,基于多個像素中的每一個的特性測量決定該多個像素中的每一個的分類,該多個像素位于該已處理的視頻數據的該區(qū)域中; 第二處理單元,依據該已處理的視頻數據的該區(qū)域中的該多個像素以及相關聯的原始視頻數據的區(qū)域中的多個像素決定用于該分類的強度偏移 ;以及 第三處理單元,基于用于該分類的該強度偏移補償該已處理的視頻數據的該區(qū)域。
14.根據權利要求13所述的裝置,更包含自適應環(huán)路濾波單元,其中該自適應偏移處理裝置被配置以使用于該已處理的視頻數據的該區(qū)域通過該自適應環(huán)路濾波單元或該第一處理單元、該第二處理單元及該第三處理單元處理。
15.根據權利要求13所述的裝置,更包含自適應環(huán)路濾波單元,用以利用濾波器處理該區(qū)域的該多個像素中的每一個,其中該濾波器依據該多個像素中的每一個的該分類而決定。
16.一種解碼方法,用于解碼視頻比特流,其中對應于該視頻比特流的多個重建的視頻圖像通過自適應偏移處理,該解碼方法包含 處理該視頻比特流以重建多個視頻圖像,以及提供多個處理的視頻圖像; 選擇該多個處理的視頻圖像的區(qū)域; 基于多個像素中的每一個的特性測量決定該多個像素中的每一個的分類,其中該多個像素位于該多個處理的視頻圖像的該區(qū)域中; 決定該視頻比特流中指示的用于該分類的強度偏移;以及 基于用于該分類的該強度偏移補償該多個處理的視頻圖像的該區(qū)域。
17.根據權利要求16所述的方法,其特征在于,用于該區(qū)域的自適應環(huán)路濾波選擇性地取代決定該多個像素中的每一個的分類、決定用于該分類的強度偏移以及補償該多個處理的視頻圖像的該區(qū)域的步驟。
18.根據權利要求16所述的方法,其特征在于,決定該多個像素中的每一個的分類包含自該視頻比特流中擷取旗標,以及依據該旗標將像素強度選擇性地分割為N個不均勻帶或M個均勻帶,其中M及N是整數。
19.根據權利要求16所述的方法,其特征在于,決定該多個像素中的每一個的分類包含將像素強度分割為N個帶,該N個帶介于最小值及最大值之間,其中N是整數。
20.根據權利要求16所述的方法,其特征在于,決定該多個像素中的每一個的分類包含將像素強度分割為N個帶,提供序列、圖像或切片等級中未受偏移校正的M個帶的信息,以及為(N-M)個帶中的每一個提供該強度偏移,其中N及M均為整數,并且M不大于N。
21.根據權利要求16所述的方法,其特征在于,決定該多個像素中的每一個的分類包含將像素強度分割為N個帶,將該N個帶分為M組,提供未受偏移校正的P組的信息,以及為(M-P)組中的每一帶提供該強度偏移,其中N、M及P均為整數,M不小于2并且P不大于M0
22.根據權利要求16所述的方法,其特征在于,決定該多個像素中的每一個的分類包含自該視頻比特流中擷取旗標,以及依據該旗標選擇像素式樣,其中該像素式樣用于該特性測量。
23.根據權利要求16所述的方法,其特征在于,該多個像素中的每一個的該特性測量從包含編碼單元模式、預測單元尺寸、傳輸單元尺寸、量化參數、參考圖像、運動向量、幀內預測模式、殘余以及去區(qū)塊界強度的群組中選擇。
24.根據權利要求16所述的方法,更包含利用濾波器對該區(qū)域的該多個像素中的每一個應用自適應環(huán)路濾波,其中該濾波器依據該多個像素中的每一個的該分類而決定。
25.根據權利要求16所述的方法,更包含利用濾波器對該區(qū)域的多個像素中的每一個應用自適應環(huán)路濾波,其中該濾波器依據該多個像素中的每一個的該分類而決定,并且拉普拉斯算子的總和被用作該多個像素中的每一個的該特性測量。
26.一種解碼裝置,用于解碼視頻比特流,其中對應于該視頻比特流的多個重建的視頻圖像通過自適應偏移處理,該解碼裝置包含 第一處理單元,重建來自于該視頻比特流的多個視頻圖像,以及提供多個處理的視頻圖像; 配置單元,配置該多個處理的視頻圖像的區(qū)域; 第二處理單元,基于多個像素中的每一個的特性測量決定該多個像素中的每一個的分類,其中該多個像素位于該多個處理的視頻圖像的該區(qū)域中; 第三處理單元,決定該視頻比特流中指示的用于該分類的強度偏移;以及 第四處理單元,基于該分類的該強度偏移補償該多個處理的視頻圖像的該區(qū)域。
27.根據權利要求26所述的裝置,更包含自適應環(huán)路濾波單元,其中該解碼裝置被配置以使用于該多個處理的視頻圖像的該區(qū)域通過該自適應環(huán)路濾波單元或該第二處理單元、該第三處理單元及該第四處理單元處理。
28.根據權利要求26所述的裝置,更包含自適應環(huán)路濾波單元,用以利用濾波器處理該區(qū)域的該多個像素中的每一個,其中該濾波器依據該多個像素中的每一個的該分類而決定。
全文摘要
本發(fā)明提供一種用于內容自適應偏移復原的方法與裝置。在視頻處理系統(tǒng)中,由于應用在數據上的多種數學操作,已經處理過的視頻數據的平均強度可能偏移至原始數據的平均強度。強度偏移將導致明顯的缺陷。本發(fā)明揭露了一種自適應偏移復原,基于底層像素的動態(tài)特性導出圖像的區(qū)域的強度偏移。依據底層像素的特性測量,每一區(qū)域的像素被分類,并且每一類的強度偏移被確定。特性測量可基于底層像素的像素模式,而特性可與底層像素的邊緣、峰值及谷值有關。可選的,特性測量可基于底層像素的像素強度,像素強度被分為多個帶用于分類。
文檔編號H04N7/32GK102742275SQ201180007807
公開日2012年10月17日 申請日期2011年5月3日 優(yōu)先權日2010年6月15日
發(fā)明者傅智銘, 陳慶曄, 黃毓文 申請人:聯發(fā)科技股份有限公司