專利名稱::加權(quán)預(yù)測(cè)視頻編碼的制作方法加權(quán)預(yù)測(cè)視頻編碼
技術(shù)領(lǐng)域:
背景技術(shù):
多年來(lái),已知的使用復(fù)雜視頻壓縮技術(shù)的高級(jí)圖像編碼系統(tǒng)就已經(jīng)標(biāo)準(zhǔn)化并作為商用。其中比較流行的大多數(shù)都是MPEG標(biāo)準(zhǔn)系列和其接任者。這些編碼處理的主要特點(diǎn)在于運(yùn)動(dòng)補(bǔ)償,而使用運(yùn)動(dòng)補(bǔ)償來(lái)利用移動(dòng)圖像序列中的時(shí)域冗余。這些編碼處理中,將圖像幀或圖像分割成稱之為圖像元素或像素的不可約像素(irreduciblepixel)的陣列。參考圖l,通過(guò)參考一個(gè)或多個(gè)其它圖像12中的像素,編碼當(dāng)前圖像11的像素,圖像12可以是順序位于當(dāng)前圖像的前面或者后面或多幅圖像,其中多幅圖像中的一個(gè)或多個(gè)是在當(dāng)前圖像之前或者之后;因此,可使用預(yù)測(cè)和插值來(lái)找尋基準(zhǔn)素材以與當(dāng)前圖像內(nèi)容進(jìn)行比較,并計(jì)算像素之間的差別。通常,在稱之為宏塊(MB)的像素的小矩形塊上執(zhí)行該處理,當(dāng)前多數(shù)系統(tǒng)中宏塊的尺寸為16x16像素,但也可以是其它的尺寸。為解決連續(xù)圖像之間的移動(dòng),可為每個(gè)MB獲取運(yùn)動(dòng)向量(MV)。參考圖1,在基準(zhǔn)圖像12中定義搜索區(qū)域13;基準(zhǔn)圖像12中,可能發(fā)現(xiàn)當(dāng)前MB像素14的值間的匹配;上述匹配給出了當(dāng)前編碼像素和臨近圖像中的基準(zhǔn)像素15之間的移位變化;基準(zhǔn)像素15與編碼像素非常類似,但具有空間移位。在解碼器端,重構(gòu)并存儲(chǔ)這些連續(xù)圖像,以便于,可在處理當(dāng)前圖像及其像素的同時(shí)這些連續(xù)圖像是可獲取的,并且可使用當(dāng)前MV表示。在已知的H264/AVC視頻壓縮標(biāo)準(zhǔn)中改進(jìn)了該方法,相比于MPEG2標(biāo)準(zhǔn),在諸多方面均提高了性能。特別地,在從存儲(chǔ)器中取回基準(zhǔn)像素15并將其與當(dāng)前像素?cái)?shù)據(jù)合并的處理中,具有在上述計(jì)算之前修改取回?cái)?shù)據(jù)的偏移和加權(quán)步驟。這是一個(gè)可用于任何用途的并且僅通過(guò)已傳輸?shù)奈涣骶浞ǘx的特性,所述用途被系統(tǒng)設(shè)計(jì)者分配給所述特性,所述位流必須能被相應(yīng)解碼器實(shí)現(xiàn)。編碼器從編碼圖像中獲取信息并根據(jù)相關(guān)傳輸句法發(fā)送,以便于解碼器可發(fā)現(xiàn)并使用信息。這使編碼器設(shè)計(jì)者能夠自由地建立創(chuàng)新方法以利用所述加權(quán)應(yīng)用。這些特性可能是有效的典型應(yīng)用是處理漸變(fade)或者處理亮度的快速變化對(duì)圖像的較大或較小的區(qū)域產(chǎn)生的影響,所述亮度的快速變化可發(fā)生在例如當(dāng)TV照相機(jī)前的閃光槍操作時(shí)或屏幕內(nèi)具有很多快速改變的物體的鏡面反射時(shí)。漸變是給定圖像序列和其它圖像序列間的過(guò)渡,例如,圖像信號(hào)的幅度穩(wěn)步降低的黑色,也就是沒(méi)有圖像,反之亦然。交叉漸變是兩幅內(nèi)容不同的連續(xù)圖像序列之間的類似過(guò)渡。在非加權(quán)MPEG壓縮系統(tǒng)中,不能很好地對(duì)漸變進(jìn)行編碼。通常,壓縮系統(tǒng)的說(shuō)明并不明確定義這種處理,它們僅提供一組工具,在限制比特率的情況下,使用這些工具達(dá)到高編碼質(zhì)量與編碼器設(shè)計(jì)者的靈巧設(shè)計(jì)相關(guān)。加權(quán)預(yù)測(cè)特性運(yùn)動(dòng)補(bǔ)償(MC)是已知的基本視頻編碼特性。該特性在許多視頻標(biāo)準(zhǔn)中廣泛使用的元素是包括宏塊(MB)的像素陣列。該陣列可使用固定尺寸和形狀,或根據(jù)標(biāo)準(zhǔn)采用不同的尺寸和形狀,但通常是16x16的視頻數(shù)據(jù)像素陣列。圖1中,編碼期間,當(dāng)前圖像ll中的每個(gè)MB14可根據(jù)指定的視頻基準(zhǔn)圖像12的相同尺寸像素陣列15(或來(lái)自一些小尺寸塊^l頻數(shù)據(jù)陣列的組合所構(gòu)成的16x16陣列)進(jìn)行預(yù)測(cè)。加權(quán)預(yù)測(cè)是指,當(dāng)執(zhí)行MC處理時(shí),加權(quán)來(lái)自基準(zhǔn)圖像的視頻數(shù)據(jù)值,然后使用偏移量將其移位,以給出已修改過(guò)的用于編碼當(dāng)前像素的預(yù)測(cè)視頻數(shù)據(jù)。用作編碼當(dāng)前圖像11的基準(zhǔn)圖像12,其可以是來(lái)自前面和/或后面的圖像。前面的序列構(gòu)成基準(zhǔn)圖像"list0",后面的序列構(gòu)成基準(zhǔn)圖像"list1"。在圧264/八¥(:標(biāo)準(zhǔn)中,可自由記錄這種基準(zhǔn)列表以滿足編碼需要。在每個(gè)處理級(jí)的片段處,可觸發(fā)記錄處理。片段是標(biāo)準(zhǔn)中定義的元素,其主要由包含在完整圖像的子區(qū)域中的像素組成。完整視頻圖像可由單一片段構(gòu)成,也可由多個(gè)小的視頻片段組成。<table>tableseeoriginaldocumentpage6</column></row><table>表l:H264片段頭語(yǔ)法摘錄表1是H264標(biāo)準(zhǔn)中以表格形式定義的部分基準(zhǔn)句法。表中的兩個(gè)參類$"ref—pic—list—reordering—flag—10"禾卩"ref_pic—ist一i-eordering一flag一I1"可分別被設(shè)置為0或1以打開或者關(guān)閉重排序函數(shù)(reorderingfunction),重排序函數(shù)允許將解碼器指向特定的基準(zhǔn)圖像。第一個(gè)參數(shù)指示P圖像的解碼,第二個(gè)指示B圖像的解碼。片段頭句法的前面,通過(guò)參數(shù)"sliceJype"定義了當(dāng)前圖像類型。如果將第一個(gè)ref_pic—listj-eordering—flag參數(shù)設(shè)置為0,則沒(méi)有重排序,默認(rèn)地,解碼器僅根據(jù)第一幅緊接著的先前圖像中給定的單一基準(zhǔn)圖像進(jìn)行簡(jiǎn)單的解碼操作。為使本發(fā)明能起作用,該參數(shù)必須設(shè)置為1,以允許多個(gè)基準(zhǔn)圖像。在MB級(jí)指示這些特定參考圖像,并通過(guò)每個(gè)MB頭中的參數(shù)"ref—idx"實(shí)現(xiàn)。類似地,對(duì)于B圖像,參數(shù)refjicjist—reordering—flag—Il必須設(shè)置為1以激活多個(gè)基準(zhǔn)圖像。其它的獨(dú)立參數(shù)確保正確設(shè)置編碼器以按照需要進(jìn)行解碼。這樣,句法中不同級(jí)所攜帶的參數(shù)組合確保對(duì)編碼器的設(shè)置,以恰當(dāng)?shù)刂甘揪幋a器使本發(fā)明能夠被應(yīng)用。解碼器端獲取的加權(quán)參數(shù)的句法與表2中給出的類似,表2也是參數(shù)"pred—weight—table"下的部分片段頭句法,參數(shù)"pred_weight_table"提供打開或關(guān)閉加權(quán)行為的標(biāo)志,當(dāng)打開時(shí),應(yīng)用權(quán)值和偏移量。單獨(dú)提供了亮度和色度的權(quán)值和偏移量。表的較低部分應(yīng)用于B圖像。需要對(duì)亮度(luma)像素和色度(chroma)像素分別進(jìn)行加權(quán)。例如當(dāng)使用亮度和listtypeO中的基準(zhǔn)圖像時(shí),加權(quán)應(yīng)用中的關(guān)鍵參數(shù)是luma_log2—weight—denom(注以下稱為logWD),luma—weight—10[i](注以下稱為w。),以及l(fā)uma—offsetJ0[i](注以下稱為o0)。在片段處理級(jí)可以觸發(fā)解碼器處理中的函數(shù)調(diào)用"pred—weight一table()"。一旦這三個(gè)參數(shù)值可用,就調(diào)用H.264/AVC規(guī)則中的相關(guān)公式;規(guī)則中的方程式8-270如下if(logWD>=l)predPartc[x,y]=Cliplc{((predPartLOc[x,y]*w0+2logWD")logWD)屮o0}elsepredPartc[x,y]二Cliplc(predPartL0c[x,yPw0+o0}其中,符號(hào)">〉"是右移一位運(yùn)算符,因此x〉々表示x被2整除y次。<table>tableseeoriginaldocumentpage8</column></row><table>表2:片段頭語(yǔ)法摘變量predPartL0c和predPartc與預(yù)測(cè)處理相關(guān),Cliplc是一剪裁函數(shù)(clipflmcticm),其確保預(yù)測(cè)的亮度值落入范圍。變量x和y表示圖像內(nèi)給定像素的位置。參數(shù)"predPartLOc"指示解碼器使用listO集合中的基準(zhǔn)圖像,并且單一圖像列表的使用意味著該公式用于P圖像。就MPEG-2標(biāo)準(zhǔn)來(lái)說(shuō),P圖像和B圖像的概念存在于H.264/AVC標(biāo)準(zhǔn)中。"P圖像"是"Predictivepicture"("預(yù)測(cè)圖像"),而"B圖像"是"Bi-predictiveorinterpolativepicture"("Bi預(yù)測(cè)圖或內(nèi)插圖像")。在MPEG-2標(biāo)準(zhǔn)中,其稱為雙向(預(yù)測(cè))圖像;而在H.264/AVC標(biāo)準(zhǔn)中,改變了這個(gè)定義。簡(jiǎn)言之,P圖像根據(jù)單一基準(zhǔn)圖像提供預(yù)測(cè),但可根據(jù)諸如]ist0的較長(zhǎng)的基準(zhǔn)圖像列表中的任何基準(zhǔn)圖像提供預(yù)測(cè),而B圖像根據(jù)一前一后兩個(gè)基準(zhǔn)圖像做組合預(yù)測(cè)。因此,上述H.264/AVC方程8-270可改進(jìn)為H.264/AVC方程8-272:predPartc[x,y]=CIiplc{((predPartLOc[x,y]*w0+(predPartL1c[x,y]*w,+2^,)>>logWD+l))+((o0+0l+l)l)}存在根據(jù)基準(zhǔn)listO的一個(gè)預(yù)測(cè)和根據(jù)基準(zhǔn)listl的另一個(gè)預(yù)測(cè),可將二者進(jìn)行合并,例如以固定的操作進(jìn)行平均或相加,通常,等分兩個(gè)圖像的所有值并將兩部分相加。將附加的加權(quán)和偏移函數(shù)應(yīng)用到合并處理中,并在其相加前分別應(yīng)用到兩個(gè)貢獻(xiàn)部分中的每一個(gè),然后在方程最后,通過(guò)>>1操作將和除以2。
發(fā)明內(nèi)容本發(fā)明的一個(gè)目的是提供一種方式,使得可使用加權(quán)特性提高圖像編碼質(zhì)量,尤其是在處理漸變的處理中或在圖像的某個(gè)小區(qū)域明顯不同于其它區(qū)域,并且需要使用較多的本地相關(guān)編碼參數(shù)而系統(tǒng)句法的片段級(jí)僅提供一組全局參數(shù)的情況。MB級(jí)并不給出這些本地化參數(shù)的改變,因此如這里所描述的,片段級(jí)需要做適當(dāng)?shù)恼{(diào)整。根據(jù)本發(fā)明,提供了一種使用至少兩個(gè)基準(zhǔn)圖像來(lái)編碼源圖像的方法,包括以下步驟基于預(yù)定的規(guī)則,將源圖像分割成區(qū)域;使用預(yù)定的規(guī)則,將至少兩個(gè)基準(zhǔn)圖像分割成相應(yīng)區(qū)域。通過(guò)使用基準(zhǔn)圖像區(qū)域和源圖像相應(yīng)區(qū)域的平均亮度差,對(duì)至少一個(gè)基準(zhǔn)圖像的至少一個(gè)區(qū)域的亮度值進(jìn)行加權(quán)和偏移,以及通過(guò)對(duì)來(lái)自至少兩幅基準(zhǔn)圖像的亮度值進(jìn)行平均或求和,以至少確定用于源圖像的亮度值。便利她,該方法進(jìn)一步包括在視頻壓縮系統(tǒng)的預(yù)處理級(jí),檢測(cè)基準(zhǔn)圖像和源圖像間的漸變,并在檢測(cè)到漸變時(shí)使用該方法。可選地,該方法進(jìn)一步包括檢測(cè)因閃光或短時(shí)間鏡面反射造成的局部區(qū)域和其鄰接區(qū)域在內(nèi)容上不同的情況,并在檢測(cè)到這種不同吋使用該方法。有利地,預(yù)定的規(guī)則是用于確定區(qū)域間視覺(jué)差異的心理視覺(jué)模型。便利地,心理視覺(jué)模型是區(qū)域內(nèi)亮度對(duì)比度的度量??蛇x地,心理視覺(jué)模型是區(qū)域內(nèi)紋理的度量??蛇x地,至少兩幅基準(zhǔn)圖像包括一幅重復(fù)的基準(zhǔn)圖像。便利地,至少一個(gè)區(qū)域是不連續(xù)的,并且包括區(qū)域的隔離部分。優(yōu)選地,該方法進(jìn)一步包括確定色度值,并且對(duì)來(lái)自至少兩幅基準(zhǔn)圖像的己加權(quán)和偏移的色度值進(jìn)行平均或求和。以下參考本發(fā)明。圖1是已知的運(yùn)動(dòng)向量導(dǎo)出示意圖;圖2描述了視頻亮度值漸變中的亮度范圍的變化;圖3是根據(jù)本發(fā)明的使用加權(quán)和偏移估計(jì)來(lái)對(duì)漸變進(jìn)行編碼的方法流程圖;圖4是根據(jù)本發(fā)明的使用加權(quán)和偏移的視頻編碼的示意性描述;圖5描述了根據(jù)本發(fā)明的使用加權(quán)估計(jì)的視頻亮度漸變的亮度范圍選擇;和圖6是根據(jù)本發(fā)明的確定亮度值的方法流程圖。附圖中,同一附圖標(biāo)記表示同一部分。具體實(shí)施方式在漸變中,一系列圖像逐漸提高或降低亮度和色度幅度,通常是從諸如表示黑色的0開始提高或降低到0。圖2是一簡(jiǎn)化示例,其中l(wèi)ogWD=0并且僅從p圖像示例中獲取亮度值,所述p圖像例如是序列中的前一圖像。圖2中,線21表示8位二進(jìn)制系統(tǒng)中亮度信號(hào)可獲取的最大范圍。線22表示基準(zhǔn)圖像的基準(zhǔn)MB內(nèi)亮度的實(shí)際范圍,具體來(lái)說(shuō),其在整數(shù)a和b之間(a,be)。線23表示當(dāng)前圖像內(nèi)MB像素值的實(shí)際范圍,其在c和d之間。假設(shè)基準(zhǔn)圖像內(nèi)所有亮度值均在范圍[a,b]內(nèi),當(dāng)前圖像內(nèi)所有亮度值均在范圍[c,d]內(nèi),還假設(shè)由基準(zhǔn)圖像(Ref-pic)22向當(dāng)前圖像(Cur-pic)23,朝亮度的黑色方向進(jìn)行線性漸變。換言之,a和c趨于O,b和d也一樣。因此,范圍[a,b]大于范圍[c,d],并且a〉c以及b〉d。具有以下方程lumac=lumaa*wo+Oo;lumad=lu腦b*w0+00;可變形為w0=(lumac-lumad)/(lumaa-lumab);o0=(lumaa*lumad-lumab*lumac)/(luma;,-lumab)。通常,加權(quán)和偏移估計(jì)處理完全是一編碼器處理。當(dāng)生成恰當(dāng)?shù)募訖?quán)和偏移時(shí),解碼器可根據(jù)標(biāo)準(zhǔn)說(shuō)明進(jìn)行加權(quán)預(yù)測(cè)。雖然此處描述了將加權(quán)預(yù)測(cè)應(yīng)用到視頻的漸變,但加權(quán)預(yù)測(cè)還具有其它應(yīng)用,例如應(yīng)用于處理也能夠降低編碼性能的短時(shí)間閃光和鏡面高光中。該方法允許加權(quán)因子在MB級(jí)可變,在片段級(jí)通常不可變??墒褂梅浅?fù)雜的方式進(jìn)行加權(quán)預(yù)測(cè),這意味著一些加權(quán)預(yù)測(cè)方法可能不實(shí)用。在本發(fā)明中,闡釋了生成可用的加權(quán)和偏移的創(chuàng)新的實(shí)踐方法,以有效利用H.264/AVC標(biāo)準(zhǔn)中的加權(quán)預(yù)測(cè)特性。編碼方法圖3是在所要求的編碼器的預(yù)處理級(jí)執(zhí)行的編碼器端的加權(quán)和偏移的估計(jì)32的結(jié)構(gòu)圖。該預(yù)處理級(jí)具有圖像序列的行為知識(shí),可以評(píng)估如何處理一個(gè)完整編碼處理中的序列圖像,而不僅僅是這些加權(quán)和偏移。假設(shè)當(dāng)前視頻編碼標(biāo)準(zhǔn)均使用已定義的包括像素陣列的結(jié)構(gòu),則要求該預(yù)處理能夠?qū)⑺鲂袨橹R(shí)應(yīng)用到諸如MB和片段等的每個(gè)圖像的子區(qū)域中。該處理中,可使用心理視覺(jué)模型以確定視頻素材中的某些特性的可見性。這樣,例如即使在31中,視頻預(yù)處理器檢測(cè)到視頻漸變時(shí),漸變通常并非完全是線性的,而且其特點(diǎn)是隨連續(xù)視頻圖像的不同部分的變化而變化。為闡釋如何處理這種漸變,可考慮一個(gè)簡(jiǎn)單的例子。簡(jiǎn)單P圖像示例中的區(qū)域自適應(yīng)的加權(quán)和偏移估計(jì)參考圖4,不失一般性,為了在基準(zhǔn)圖像42,44的列表中出現(xiàn)兩次,至少使用一幅P圖像作為基準(zhǔn)圖像41并被再次安排,因此,將兩個(gè)或多個(gè)不同的以參數(shù)Refldx表示的基準(zhǔn)索引分配給基準(zhǔn)圖像的實(shí)例,雖然所述基準(zhǔn)圖像在內(nèi)容上是實(shí)質(zhì)上相同的。至少兩次42,44中,通過(guò)使用相同的基準(zhǔn)圖像41,司-將兩組或多組不同的加權(quán)和偏移應(yīng)用到基準(zhǔn)圖像41中的兩個(gè)或多個(gè)不同區(qū)域41a,41b。理論上,該處理可重復(fù)用于所要求的大量不同的參數(shù)集。進(jìn)一步地,參考圖6,通過(guò)使用來(lái)自預(yù)處理器的關(guān)于圖像內(nèi)容的信息,識(shí)別61并標(biāo)記共享類似特點(diǎn)的圖像的區(qū)域41a,41b,輪流分析每個(gè)區(qū)域并將數(shù)據(jù)發(fā)送到解碼器,以協(xié)助加權(quán)和偏移估計(jì)。適當(dāng)使用基準(zhǔn)圖像41的若千區(qū)域41a,41b的紋理信息,將心理視覺(jué)模型應(yīng)用到所述分析中??蛇x地,例如可將局部對(duì)比度度量應(yīng)用到任意給定圖像,隨后將上述圖像分割為高活動(dòng)區(qū)域和低活動(dòng)區(qū)域,上述對(duì)比度度量例如是構(gòu)成"Determiningvisuallynoticeabledifferencesbetweentwoimages"EP0986264的一部分。通常,EP0986264描述了一種心理視覺(jué)建模算法,該算法使用像素級(jí)的局部對(duì)比度信息對(duì)諸如視頻幀圖像的任意兩幅給定圖像中的具有化妝效果的人進(jìn)行預(yù)測(cè)??晒烙?jì)兩幅圖像間每個(gè)像素位置處差別的可見度。還需要對(duì)當(dāng)前圖像45進(jìn)行相應(yīng)分割。通常,基于MB,分割62成區(qū)域45a,45b,也就是,將區(qū)域邊界47僅放置在MB邊界。標(biāo)記為基準(zhǔn)圖像41中的第一區(qū)域41a的MB的數(shù)量和位置可以與標(biāo)記為當(dāng)前圖像45中的第一區(qū)域45a的MB的數(shù)量和位置不同。本發(fā)明根據(jù)區(qū)域估計(jì)加權(quán)和偏移,該例子中,根據(jù)第一和第二區(qū)域,但也可以根據(jù)更多區(qū)域。在基準(zhǔn)圖像和當(dāng)前圖像上完成標(biāo)記處理后,以例如圖4所示的平均方式,比較基準(zhǔn)圖像41的第一區(qū)域41a和當(dāng)前圖像45中的第一區(qū)域45a中的視頻數(shù)據(jù)(亮度)。第二區(qū)域41b,45b中的視頻數(shù)據(jù)也進(jìn)行相同處理。這樣,在處理處理的最后,對(duì)第一區(qū)域41a,45a將生成63可稱之為集合I的一組加權(quán)和偏移。同時(shí),還將生成63適合于第二區(qū)域41b,45b視頻數(shù)據(jù)的稱之為集合II的第二組加權(quán)和偏移。然后,包括在當(dāng)前解碼圖像46的MB頭內(nèi)的索引一Re打dx將指示用來(lái)攜帶"集合I"數(shù)據(jù)而使用的基準(zhǔn)圖像42。用于另一基準(zhǔn)圖像44的另一個(gè)Reflck索引值攜帶"集合II"數(shù)據(jù)。這樣,對(duì)當(dāng)前正被解碼的圖像46來(lái)說(shuō),片段頭將確定其多個(gè)解碼序列,尤其是可獲取的基準(zhǔn)圖像42或44。此外,用于MB的運(yùn)動(dòng)向量將指向用于解碼的那些基準(zhǔn)圖像內(nèi)的特定像素組。該向量可指向基準(zhǔn)圖像的區(qū)域I或區(qū)域II。MB頭也將攜帶編碼器的命令,上述命令通過(guò)選擇Refldx值加權(quán)以使用,上述Reflck值能夠?qū)κ辜訖?quán)專用于MB產(chǎn)生影響。這意味著當(dāng)前圖像46的區(qū)域I中的MB不能使用基準(zhǔn)圖像42或44的區(qū)域I的基準(zhǔn)素材;區(qū)域II也類似。這樣,當(dāng)使用集合I的加權(quán)和偏移時(shí),對(duì)于相關(guān)的特定基準(zhǔn)圖像42,將上述加權(quán)和偏移應(yīng)用到其第一和第二區(qū)域I和Il41a,41b中。典型地,期望區(qū)域I的特定加權(quán)和偏移將為視頻數(shù)據(jù)相關(guān)的區(qū)域I41a提供更好的預(yù)測(cè)。但是對(duì)于與標(biāo)記邊界47鄰接的任何MB來(lái)說(shuō),最合適的加權(quán)和偏移可能來(lái)自區(qū)域I或區(qū)域II。如本地行為所決定的,標(biāo)記區(qū)域,區(qū)域I或區(qū)域H可包含圖像內(nèi)的不同獨(dú)立區(qū)域。上述示例僅對(duì)亮度進(jìn)行了描述,但也等效與使用色度或亮度與色度的組合;該例子中,基于區(qū)域的亮度值將用于區(qū)域加權(quán)/偏移估計(jì)。這需要如圖4所示的三幅標(biāo)記圖像42,44和46。將該處理處理的輸出結(jié)果分別分離出區(qū)域I45a和區(qū)域Il45b的加權(quán)和偏移。在漸變的例子中將進(jìn)行一個(gè)與圖4所示的類似的處理,并因此轉(zhuǎn)換區(qū)域加權(quán)。這樣,提供了一種通過(guò)完整圖像估計(jì)可變加權(quán)和偏移的明智方法。將根據(jù)視頻內(nèi)容偏置權(quán)值。圖像分段的相關(guān)算法自身也隨時(shí)間而發(fā)展和改進(jìn)。在該使用兩區(qū)域標(biāo)記方法的例子中,選擇一個(gè)基準(zhǔn)圖像的索引來(lái)攜帶一組加權(quán)和偏移,但也決定了其它基準(zhǔn)圖像的索弓1將不攜帶任何加權(quán),這與常規(guī)的MPEG-2視頻預(yù)測(cè)處理類似,也就是說(shuō),沒(méi)有;使用超過(guò)兩幅基準(zhǔn)圖像至此,簡(jiǎn)單地說(shuō),描述已經(jīng)覆蓋了僅使用一幅基準(zhǔn)圖像41但基準(zhǔn)圖像在基準(zhǔn)列表中至少出現(xiàn)兩次42,44的情況。理論上,多幅基準(zhǔn)圖像也可使用這種操作。進(jìn)一步可考慮B圖像的情況。這種情況下,首先需要獨(dú)立考慮通常出現(xiàn)在源圖像之前的list0的基準(zhǔn)圖像,然后獨(dú)立考慮通常出現(xiàn)在源圖像之后的listl的基準(zhǔn)圖像,最后執(zhí)行雙向預(yù)測(cè)處理。H.264/AVC標(biāo)準(zhǔn)中,通過(guò)以下參數(shù)觸發(fā)這種機(jī)制weightedjpred—flag(用于P圖像情況)禾口weighted—bipredjdc(用于B圖像情況)兩個(gè)參數(shù)均攜帶在用于圖像參數(shù)集(picjarameter一set)的句法中,H.264/AVC標(biāo)準(zhǔn)的圖像參數(shù)集如表3所示。pic_parameter—set—rbsp(){pic—parameter—set—idseq_parameter—set—identropy—codingjmode—flagpic—order_present—flagnum—slice』ro叩s一minuslif(n菌—slicejoups—minus1>0){slice_group—map—typeif(slicejoup—map—type=0)for(iGroup=0;iGroup<=num—sHce_^roups—minus1;iGroup++)run—length—minusl[iGroup]elseif(slice』roup—map—type=2)for(iGroup=0;iGroup<num—slice—groups一minusl;iGroup++){top—left[iGroup]bottom一right[iGroup]elseif(slice』roup—map—type=3<table>tableseeoriginaldocumentpage15</column></row><table><formula>formulaseeoriginaldocumentpage16</formula>J_表3可以看'至y,豐示記weighted—pred—flag禾口weighted—bipred—idc包括在這里。因?yàn)檫@么簡(jiǎn)單的方法穩(wěn)定性差,所以圖5中對(duì)上述方法進(jìn)行了修改。可以理解加權(quán)的預(yù)測(cè)僅具有較好的統(tǒng)計(jì)學(xué)意義,因此,為提高編碼效率,獲取較平均的加權(quán)和偏移至關(guān)重要。與其使用范圍表達(dá)式[低,高]中的亮度值"低"和"高",還不如先在范圍[低,高]尋找一個(gè)中間值,例如均值或中值,并將其命名為"中間"。將亮度值分為兩個(gè)區(qū)域[低,中間]和[中間,高]。對(duì)于這些單獨(dú)的區(qū)域,通過(guò)另一平均處理,分別計(jì)算表示上述兩個(gè)不同區(qū)域的亮度值"a"和亮度值"b"。將類似的處理應(yīng)用到當(dāng)前圖像,因此計(jì)算出表示的亮度值"c"和"d"。無(wú)需改變給定的公式,上述修訂后的與區(qū)域(I或II)相關(guān)的加權(quán)和偏移也隨后被獲取,并被傳輸?shù)浇獯a器。該處理可按照需要擴(kuò)展。其它需要考慮的事項(xiàng)實(shí)際編碼器硬件中,通常僅對(duì)視頻亮度數(shù)據(jù)進(jìn)行運(yùn)動(dòng)評(píng)估(ME)處理。因此,實(shí)際上,在色度運(yùn)動(dòng)補(bǔ)償處理的處理中,仍使用亮度的運(yùn)動(dòng)向量(MV);沒(méi)有獨(dú)立的針對(duì)色度視頻數(shù)據(jù)的運(yùn)動(dòng)搜索。很多情況下,高活動(dòng)紋理可能較低活動(dòng)區(qū)域中更能影響加權(quán)預(yù)測(cè)的準(zhǔn)確性,也就是說(shuō),低活動(dòng)區(qū)域更有助于獲取更加穩(wěn)定的較好的平均加權(quán)預(yù)測(cè)。因此,對(duì)于兩個(gè)Refldx(0和l)來(lái)說(shuō),Refld)C攜帶從低活動(dòng)區(qū)域獲取的一組加權(quán)和偏移,將這組加權(quán)和偏移傳輸?shù)浇獯a器,以解碼色度和亮度。同時(shí)、對(duì)Refl:dx—.采取不同的處理方法,當(dāng)Refldx二l時(shí),對(duì)解碼色度不傳輸任何加權(quán)和偏移。這意味著,當(dāng)選擇該基準(zhǔn)圖像索引吋,實(shí)際上沒(méi)有任何加權(quán)預(yù)測(cè)被應(yīng)用到色度視頻數(shù)據(jù)中,就像不使用加權(quán)的預(yù)測(cè)特征的通常編碼一樣。還要檢查對(duì)高活動(dòng)區(qū)域的加權(quán)和偏移評(píng)估。如果這組加權(quán)和偏移與低活動(dòng)區(qū)域中獲取的非常接近,則在RefTcb^1時(shí)將這組加權(quán)和偏移應(yīng)用到亮度視頻數(shù)據(jù)中,否則沒(méi)有任何加權(quán)參數(shù)被傳輸?shù)搅炼纫曨l數(shù)據(jù),也就是說(shuō),對(duì)亮度不執(zhí)行加權(quán)預(yù)測(cè)。這種設(shè)計(jì)有助于提高該方法在某些情況下的性能,例如當(dāng)漸變檢測(cè)錯(cuò)誤時(shí),或者加權(quán)參數(shù)評(píng)估的精度不足以為視頻編碼帶來(lái)益處時(shí),那么通過(guò)選擇沒(méi)有加權(quán)預(yù)測(cè)采用基本方法。這樣,本發(fā)明提供了一種新穎的方法,其中可使用加權(quán)特性提高圖像編碼質(zhì)量。使用該特性的一個(gè)示例是處理MPEG2系統(tǒng)中無(wú)法較好編碼的漸變。這樣,提供了一種向接收器傳送若干組適用于編碼圖像的若干區(qū)域的加權(quán)參數(shù),該編碼圖像可具有相互不同的局部屬性。公知的編碼方案中,使用僅一組編碼參數(shù)對(duì)整幅圖像進(jìn)行編碼,但本發(fā)明將圖像分割成區(qū)域,通常共享屬性的區(qū)域?qū)⑹芤嬗谶m用于每個(gè)區(qū)域行為的給定的加權(quán)參數(shù)值。將圖像分割后,便可通過(guò)調(diào)整諸如MPEG的使用中的視頻編碼標(biāo)準(zhǔn)的句法,為整幅圖像傳輸若干組加權(quán)參數(shù)。權(quán)利要求1、一種使用至少兩幅基準(zhǔn)圖像來(lái)編碼源圖像的方法,包括以下步驟a.基于預(yù)定的規(guī)則,將源圖像分割成區(qū)域;b.使用預(yù)定的規(guī)則,將至少兩個(gè)基準(zhǔn)圖像分割成相應(yīng)區(qū)域;和c.通過(guò)基準(zhǔn)圖像的區(qū)域和源圖像的相應(yīng)區(qū)域之間的平均亮度差,對(duì)至少一個(gè)基準(zhǔn)圖像的至少一個(gè)區(qū)域的亮度值進(jìn)行加權(quán)和偏移;和d.通過(guò)對(duì)來(lái)自至少兩幅基準(zhǔn)圖像的經(jīng)過(guò)加權(quán)和偏移的亮度值進(jìn)行平均或求和,以至少確定用于源圖像的亮度值。2、如權(quán)利要求1所述的方法,進(jìn)一步包括在視頻壓縮系統(tǒng)的預(yù)處理級(jí),檢測(cè)基準(zhǔn)圖像和源圖像之間的漸變,并在檢測(cè)到漸變時(shí)使用所述方法。3、如權(quán)利要求l所述的方法,進(jìn)一步包括檢測(cè)因閃光或短時(shí)間鏡面反射造成的局部區(qū)域與其鄰接區(qū)域在內(nèi)容上不同的情況,并在檢測(cè)到這種不同時(shí)使用所述方法。4、如前述任一權(quán)利要求所述的方法,其中所述預(yù)定的規(guī)則是用于確定區(qū)域之間的視覺(jué)差異的心理視覺(jué)模型。5、如權(quán)利要求4所述的方法,其中所述心理視覺(jué)模型是區(qū)域內(nèi)亮度對(duì)比度的度量。6、如權(quán)利要求4所述的方法,其中所述心理視覺(jué)模型是區(qū)域內(nèi)紋理的度量。7、如前述任一權(quán)利要求所述的方法,其中所述至少兩幅基準(zhǔn)圖像包括重復(fù)的基準(zhǔn)圖像。8、如前述任一權(quán)利耍求所述的方法,其中至少一個(gè)區(qū)域是不連續(xù)的,而是包括區(qū)域的隔離部分。9、如前述任一權(quán)利要求所述的方法,進(jìn)一步包括確定色度值,并對(duì)來(lái)自所述至少兩幅基準(zhǔn)圖像中的經(jīng)過(guò)加權(quán)和偏移的色度值進(jìn)行平均或求和。全文摘要本發(fā)明提供一種使用至少兩個(gè)基準(zhǔn)圖編碼源圖像的方法,通過(guò)基于預(yù)定的規(guī)則,將源圖像分割成區(qū)域,并使用預(yù)定的規(guī)則,將基準(zhǔn)圖像分割成相應(yīng)區(qū)域。通過(guò)使用基準(zhǔn)圖像區(qū)域和源圖像相應(yīng)區(qū)域的平均亮度差,對(duì)至少一個(gè)基準(zhǔn)圖像的至少一個(gè)區(qū)域的亮度值進(jìn)行加權(quán)和偏移,以獲取至少用于源圖像的亮度值。通過(guò)對(duì)來(lái)自至少兩幅基準(zhǔn)圖像的經(jīng)加權(quán)和偏移的亮度值進(jìn)行平均或求和,以預(yù)測(cè)源圖像的亮度值。文檔編號(hào)H04N7/26GK101227608SQ20071018008公開日2008年7月23日申請(qǐng)日期2007年12月21日優(yōu)先權(quán)日2006年12月21日發(fā)明者P·吳申請(qǐng)人:泰德廣播電視公司