專利名稱:視頻解碼器中參考畫面的隱式加權(quán)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻CODEC的領(lǐng)域。
背景技術(shù):
通常以比特流的形式處理和傳輸視頻數(shù)據(jù)。典型的視頻壓縮編碼器和解碼器(“CODEC”)通過形成要編碼畫面的參考畫面預(yù)測(cè)以及對(duì)當(dāng)前畫面和預(yù)測(cè)畫面之間的差值編碼,來獲得其大部分壓縮效率。預(yù)測(cè)與當(dāng)前畫面越相關(guān),則壓縮該畫面所需的比特越少,因此提高了處理的效率。因此,希望形成最佳可能參考畫面預(yù)測(cè)。
在一些視頻序列中,尤其是那些逐漸減弱(fade)的序列,要進(jìn)行編碼或解碼的當(dāng)前畫面與經(jīng)過加權(quán)因子變換的參考畫面的相關(guān)性比與參考畫面自身的相關(guān)性更強(qiáng)。不向參考畫面應(yīng)用加權(quán)因子的視頻編解碼器對(duì)這種逐漸消失序列的編碼效率非常低。但是,加權(quán)因子的傳輸需要在比特流中發(fā)送一些附加比特。
在包括運(yùn)動(dòng)圖片專家組(“MPEG”)-1、MPEG-2和MPEG-4的許多視頻壓縮標(biāo)準(zhǔn)中,前面參考畫面的運(yùn)動(dòng)補(bǔ)償版本用作當(dāng)前畫面的預(yù)測(cè),并且僅對(duì)當(dāng)前畫面與其預(yù)測(cè)之間的差值進(jìn)行編碼。當(dāng)形成單獨(dú)的畫面預(yù)測(cè)(“P”畫面)時(shí),不對(duì)形成運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè)時(shí)的參考畫面進(jìn)行尺度變換(scale)。
當(dāng)使用雙向畫面預(yù)測(cè)(“B”畫面)時(shí),兩個(gè)不同的畫面形成中間預(yù)測(cè),然后,對(duì)兩個(gè)中間預(yù)測(cè)的每一個(gè)使用相等的加權(quán)因子(1/2,1/2)進(jìn)行平均,從而形成單個(gè)的平均預(yù)測(cè)。在這些MPEG標(biāo)準(zhǔn)中,兩個(gè)參考畫面總是來自B畫面的前向和后向中的一個(gè)。
發(fā)明內(nèi)容
現(xiàn)有技術(shù)的上述及其它缺點(diǎn)和缺點(diǎn)通過視頻解碼器來解決,其用于利用第一和第二參考畫面序號(hào)(indices),對(duì)圖像塊進(jìn)行視頻信號(hào)數(shù)據(jù)的解碼,從而預(yù)測(cè)圖像塊。解碼器包括響應(yīng)圖像塊與第一和第二參考畫面之間的相對(duì)位置的參考畫面加權(quán)因子單元。參考畫面加權(quán)因子單元的輸出用于確定分別與第一和第二參考畫面序號(hào)的每一個(gè)相對(duì)應(yīng)的隱式(implicit)加權(quán)因子。
通過以下與附圖相關(guān)聯(lián)的典型實(shí)施例的描述,本發(fā)明的以上及其它方面、特點(diǎn)和優(yōu)點(diǎn)將更加顯而易見。
本發(fā)明使用了根據(jù)以下典型圖示的視頻編碼器和解碼器中的參考畫面的隱式加權(quán),其中圖1示出了根據(jù)本發(fā)明原理的視頻解碼器的方框圖;圖2示出了根據(jù)本發(fā)明原理的具有隱式參考畫面加權(quán)的視頻解碼器的方框圖;圖3示出了根據(jù)本發(fā)明原理的用于解碼處理的流程圖;圖4示出了根據(jù)本發(fā)明原理的視頻編碼器的方框圖;圖5示出了根據(jù)本發(fā)明原理的具有隱式參考畫面加權(quán)的視頻編碼器的方框圖;以及圖6示出了根據(jù)本發(fā)明原理的用于編碼處理的流程圖。
具體實(shí)施例方式
本發(fā)明包括用于視頻編解碼器中的參考畫面的隱式加權(quán)的設(shè)備和方法。在逐漸減弱視頻序列中,例如,要進(jìn)行編碼的當(dāng)前畫面或圖像塊與由加權(quán)因子進(jìn)行尺度變換的參考畫面的相關(guān)性大于與參考畫面自身的相關(guān)性。不向參考畫面應(yīng)用加權(quán)因子的視頻編解碼器對(duì)于衰落序列的編碼效率非常低。當(dāng)加權(quán)因子使用于編碼中時(shí),視頻編碼器需要確定加權(quán)因子和運(yùn)動(dòng)矢量。
在聯(lián)合視頻小組(“JVT”)視頻壓縮標(biāo)準(zhǔn)中,每一個(gè)P畫面可以使用多個(gè)參考畫面形成畫面的預(yù)測(cè),但是每一個(gè)單獨(dú)的運(yùn)動(dòng)塊或宏模塊的8×8區(qū)域僅使用單個(gè)參考畫面用于預(yù)測(cè)。除了編碼和發(fā)送運(yùn)動(dòng)矢量,對(duì)于每一個(gè)運(yùn)動(dòng)塊或8×8區(qū)域,還要發(fā)送參考畫面序號(hào),其指示使用哪一個(gè)參考畫面。將一組有限的可能的參考畫面存儲(chǔ)在編碼器和解碼器中,并且發(fā)送允許的參考畫面的數(shù)目。
對(duì)于雙向畫面預(yù)測(cè)(也稱作“B”畫面),對(duì)于每一個(gè)運(yùn)動(dòng)塊或8×8區(qū)域,形成兩個(gè)預(yù)測(cè)器,其中每一個(gè)可以來自獨(dú)立的參考畫面,并且將兩個(gè)預(yù)測(cè)器進(jìn)行平均,從而形成單個(gè)的平均預(yù)測(cè)器。對(duì)于雙向預(yù)測(cè)編碼的運(yùn)動(dòng)塊,參考畫面可以兩個(gè)都來自前向,也可以兩個(gè)都來自后向,或者一個(gè)來自前向,一個(gè)來自后向。保留了可以用作預(yù)測(cè)的可用參考畫面的兩個(gè)列表。兩個(gè)參考畫面可以被稱作list0和list1預(yù)測(cè)器,或者ref0和ref1參考畫面。編碼和傳輸每一個(gè)參考畫面的序號(hào)ref_idx_l0和ref_idx_l1,分別用于list0和list1參考畫面。已經(jīng)提出聯(lián)合視頻小組(“JVT”)雙向預(yù)測(cè)或者“B”畫面,以使在兩個(gè)預(yù)測(cè)之間自適應(yīng)地進(jìn)行加權(quán),例如Pred=P1*Pred1+P0*Pred0+D (等式1)其中P1和P0是加權(quán)因子,Pred0和Pred1分別是對(duì)于list0和list1的參考畫面預(yù)測(cè),并且D是偏移量。
至少已經(jīng)提出了兩種用于確定和使用加權(quán)因子的方法,即隱式方法和顯式(explicit)方法。使用隱式方法時(shí),通過用作參考畫面的方向確定加權(quán)因子。在該方法中,如果ref_fwd序號(hào)小于或等于ref_bwd序號(hào),使用加權(quán)因子(1/2,1/2),否則使用加權(quán)因子(2,-1)。在隱式模式中,加權(quán)因子(2,-1)總是用于在直接模式中編碼的宏模塊。
使用顯式方法時(shí),針對(duì)每一片段(slice)發(fā)送任意數(shù)目的加權(quán)因子。然后,針對(duì)每一個(gè)運(yùn)動(dòng)塊或使用雙向預(yù)測(cè)的宏模塊的8×8區(qū)域,發(fā)送加權(quán)因子序號(hào)。解碼器使用所接收到的加權(quán)因子序號(hào),從所發(fā)送的組中選擇適當(dāng)?shù)募訖?quán)因子,以于當(dāng)解碼運(yùn)動(dòng)塊或8×8區(qū)域時(shí)使用。
此外還提出一次針對(duì)每個(gè)片段或畫面顯式傳輸與每一個(gè)參考畫面序號(hào)相關(guān)聯(lián)的加權(quán)因子。在這種情況下,需要針對(duì)每一個(gè)片段或畫面發(fā)送少量但不能忽略的比特?cái)?shù)目。
以下描述僅示出了本發(fā)明的原理。因此可以理解本領(lǐng)域的技術(shù)人員可以設(shè)計(jì)各種組合從而體現(xiàn)本發(fā)明的原理并且其包含在本發(fā)明的實(shí)質(zhì)和范圍內(nèi),盡管這里沒有明確地描述或示出。此外,這里敘述地全部示例和條件語言主要意圖是僅專門用于教學(xué)目的,以便幫助讀者理解發(fā)明人提供的本發(fā)明的原理和概念,從而促進(jìn)技術(shù)發(fā)展,并解釋其不受限于這種具體敘述的示例和條件。
此外,這里引用了原理、方面的所有闡述和本發(fā)明的實(shí)施例、及其具體示例意欲包括其結(jié)構(gòu)和功能的等價(jià)物。另外,希望這種等價(jià)物包括當(dāng)前公知的等價(jià)物以及今后開發(fā)的等價(jià)物,即,所開發(fā)執(zhí)行相同功能的任何組件,與結(jié)構(gòu)無關(guān)。
因此,例如,那些本領(lǐng)域的技術(shù)人員可以理解,這里的方框圖表示體現(xiàn)了本發(fā)明原理的演示電路的概念圖。類似地,可以理解,任何流程圖、作業(yè)圖、狀態(tài)變換圖、偽代碼等表示各種處理,其可以在計(jì)算機(jī)可讀介質(zhì)中充分地表示并且由計(jì)算機(jī)或處理器執(zhí)行,不論這種計(jì)算機(jī)或處理器是否明確示出。
圖中所示的各個(gè)組件的功能可以通過使用專用的硬件以及能夠執(zhí)行與適當(dāng)軟件相關(guān)的軟件的硬件來提供。當(dāng)通過處理器提供時(shí),可以通過單個(gè)專用的處理器、單個(gè)共享的處理器或者多個(gè)獨(dú)立的其中部分可以共享的處理器提供功能。
此外,術(shù)語“處理器”或“控制器”的明確使用不應(yīng)該被解釋為專指可以執(zhí)行軟件的硬件,而是可以隱含地?zé)o限制地包括數(shù)字信號(hào)處理器(“DSP”)硬件、用于存儲(chǔ)軟件的只讀存儲(chǔ)器(“ROM”)、隨機(jī)存取存儲(chǔ)器(“RAM”)以及非易失性存儲(chǔ)器。也可以包括傳統(tǒng)的和/或常規(guī)的其它硬件。類似地,圖中所示的任何變換都僅是概念上的。其功能可以通過程序邏輯的操作、通過專用邏輯、通過程序控制和專用邏輯的交互甚至手工執(zhí)行,作為根據(jù)上下文的更具體的理解,具體技術(shù)對(duì)于實(shí)現(xiàn)者是可選擇的。
在本文的權(quán)利要求中,表示為用于執(zhí)行具體功能的裝置的任何組件意欲包括執(zhí)行該功能的任何方式,包括,例如,a)執(zhí)行該功能的電路組件的組合,或b)包括固件、微編碼等的任何形式的軟件,與用于執(zhí)行該軟件以便執(zhí)行該功能的適當(dāng)電路相結(jié)合。由這種權(quán)利要求所限定的本發(fā)明在于按照權(quán)利要求所需要的方式,結(jié)合并集中由所引用的各種裝置提供的功能性這一事實(shí)。因此,申請(qǐng)人認(rèn)為可以提供這種功能性的任何裝置與這里示出的是等同的。
在本發(fā)明的實(shí)施例中,將隱式加權(quán)因子應(yīng)用于使用多個(gè)參考畫面的視頻壓縮編碼器和解碼器的參考畫面預(yù)測(cè)。當(dāng)對(duì)塊進(jìn)行雙向預(yù)測(cè)編碼并且使用這里描述的新隱式模式時(shí),當(dāng)前畫面與參考畫面的差值用于根據(jù)內(nèi)插/外插公式來確定相對(duì)加權(quán)因子。
如圖1所示,視頻解碼器通常由參考數(shù)字100表示。視頻解碼器100包括信號(hào)通信中與逆量化器120相連的可變長(zhǎng)度解碼器(“VLD”)10。逆量化器120在信號(hào)通信中與逆變換器130相連。逆變換器130在信號(hào)通信中與加法器或求和結(jié)點(diǎn)(summing junction)140的第一輸入端子相連,其中將加法器或求和結(jié)點(diǎn)140的輸出提供給視頻解碼器100的輸出。求和結(jié)點(diǎn)140的輸出在信號(hào)通信中與參考畫面存儲(chǔ)器150相連。參考畫面存儲(chǔ)器150在信號(hào)通信中與運(yùn)動(dòng)補(bǔ)償器160相連,運(yùn)動(dòng)補(bǔ)償器160在信號(hào)通信中與求和結(jié)點(diǎn)140的第二輸入端子相連。
轉(zhuǎn)到圖2,具有隱式參考畫面加權(quán)的視頻解碼器通常由參考數(shù)字200表示。視頻解碼器200包括信號(hào)通信中與逆量化器220相連的VLD210。逆量化器220在信號(hào)通信中與逆變換器230相連。逆變換器230在信號(hào)通信中與求和結(jié)點(diǎn)240的第一輸入端子相連,其中將求和結(jié)點(diǎn)140的輸出提供給視頻解碼器200的輸出。求和結(jié)點(diǎn)240的輸出在信號(hào)通信中與參考畫面存儲(chǔ)250相連。參考畫面存儲(chǔ)250在信號(hào)通信中與運(yùn)動(dòng)補(bǔ)償器260相連,運(yùn)動(dòng)補(bǔ)償器260在信號(hào)通信與乘法器270的第一輸入相連。
此外VLD210在信號(hào)通信中與參考畫面加權(quán)因子查找表280相連,用于向查找表280提供隱式雙向預(yù)測(cè)系數(shù)序號(hào)。查找表280的輸出用于提供加權(quán)因子,并在信號(hào)通信中與乘法器270的第二輸入相連。乘法器270的輸出在信號(hào)通信中與求和結(jié)點(diǎn)240的第二輸入端子相連。
現(xiàn)在轉(zhuǎn)到圖3,用于使用參考畫面加權(quán)為圖像塊進(jìn)行視頻信號(hào)數(shù)據(jù)解碼的典型處理通常由參考數(shù)字300表示。處理包括向輸入塊312傳送控制的開始?jí)K310。輸入塊312接收?qǐng)D像塊壓縮數(shù)據(jù),并向輸入塊313傳送控制。輸入塊313接收與第一具體參考畫面相對(duì)應(yīng)的第一參考畫面序號(hào),并向輸入塊314傳送控制。輸入塊314接收與第二具體參考畫面相對(duì)應(yīng)的第二參考畫面序號(hào)。輸入塊314向功能塊315傳送控制,功能塊315確定圖像塊與第一和第二參考畫面之間的相對(duì)位置。功能塊315向功能塊316傳送控制信號(hào),功能塊316根據(jù)當(dāng)前圖像塊到第一和第二參考畫面的相對(duì)位置,計(jì)算與所接收的每一個(gè)參考畫面序號(hào)相對(duì)應(yīng)的隱式加權(quán)因子,并將控制傳送給功能塊317。
功能塊317針對(duì)當(dāng)前圖像塊的兩個(gè)參考畫面序號(hào)的每一個(gè),開始要執(zhí)行的程序循環(huán),并向功能塊318傳送控制。功能塊318檢索與當(dāng)前循環(huán)參考畫面序號(hào)相對(duì)應(yīng)的參考畫面,并向功能塊320傳送控制。功能塊320依次對(duì)所檢索的參考畫面進(jìn)行運(yùn)動(dòng)補(bǔ)償,并向功能塊322傳送控制。功能塊322將運(yùn)動(dòng)補(bǔ)償過的參考畫面與相應(yīng)的隱式加權(quán)因子相乘,并向功能塊323傳送控制。功能塊323迭代功能塊317的循環(huán),并在循環(huán)完成兩次后向功能塊324傳送控制。功能塊324依次形成結(jié)合加權(quán)運(yùn)動(dòng)補(bǔ)償?shù)膮⒖籍嬅?,并向結(jié)束塊326傳送控制。因此,功能塊315中確定的相對(duì)位置用于確定加權(quán)因子。
如圖4所示,標(biāo)準(zhǔn)視頻編碼器通常由參考數(shù)字400表示。編碼器400的輸入在信號(hào)通信中與求和結(jié)點(diǎn)410的非反相輸入相連。求和結(jié)點(diǎn)410的輸出在信號(hào)通信中與塊變換器420相連。塊變換器420在信號(hào)通信中與量化器430相連。量化器430的輸出在信號(hào)通信中與可變長(zhǎng)編碼器(“VLC”)440相連,其中VLC440的輸出是編碼器400的外部可用輸出。
此外,量化器430的輸出在信號(hào)通信中與逆量化器450相連。逆量化器450在信號(hào)通信中與逆塊變換器460相連,逆塊變換器460依次在信號(hào)通信中與參考畫面存儲(chǔ)器470相連。參考畫面存儲(chǔ)器470的第一輸出在信號(hào)通信中與運(yùn)動(dòng)估計(jì)器480的第一輸入相連。此外,編碼器400的輸入在信號(hào)通信中還與運(yùn)動(dòng)估計(jì)器480的第二輸入相連。運(yùn)動(dòng)估計(jì)器480的輸出在信號(hào)通信中與運(yùn)動(dòng)補(bǔ)償器490的第一輸入相連。參考畫面存儲(chǔ)器470的第二輸出在信號(hào)通信中與運(yùn)動(dòng)補(bǔ)償器490的第二輸入相連。運(yùn)動(dòng)補(bǔ)償器490的輸出在信號(hào)通信中與求和結(jié)點(diǎn)410的反相輸入相連。
轉(zhuǎn)到圖5,具有隱式參考畫面加權(quán)的視頻編碼器通常由參考數(shù)字500表示。編碼器500的輸入在信號(hào)通信中與求和結(jié)點(diǎn)510的非反相輸入相連。求和結(jié)點(diǎn)510的非反相輸入在信號(hào)通信中與塊變換器520相連。變換器520在信號(hào)通信中與量化器530相連。量化器530的輸出在信號(hào)通信中與VLC540相連,其中VLC440的輸出是編碼器500的外部可用輸出。
此外,量化器530的輸出在信號(hào)通信中還與逆量化器550相連。逆量化器550在信號(hào)通信中與逆塊變換器560相連,逆塊變換器560依次在信號(hào)通信中與參考畫面存儲(chǔ)570相連。參考畫面存儲(chǔ)器570的第一輸出在信號(hào)通信中與參考畫面加權(quán)因子分配器572的第一輸入相連。此外,編碼器500的輸入在信號(hào)通信中還與參考畫面加權(quán)因子分配器572的第二輸入相連。指示了加權(quán)因子的參考畫面加權(quán)因子分配器572的輸出在信號(hào)通信中與運(yùn)動(dòng)估計(jì)器580的第一輸入相連。參考畫面存儲(chǔ)器570的第二輸出與運(yùn)動(dòng)估計(jì)器580的第二輸入相連接進(jìn)行信號(hào)通信。
此外,編碼器500的輸入在信號(hào)通信中與運(yùn)動(dòng)估計(jì)器580的第三輸入相連。指示了運(yùn)動(dòng)矢量的運(yùn)動(dòng)估計(jì)器580的輸出在信號(hào)通信中與運(yùn)動(dòng)補(bǔ)償器590的第一輸入相連。參考畫面存儲(chǔ)器570的第三輸出在信號(hào)通信中與運(yùn)動(dòng)補(bǔ)償器590的第二輸入相連。表示運(yùn)動(dòng)補(bǔ)償?shù)膮⒖籍嬅娴倪\(yùn)動(dòng)補(bǔ)償器590的輸出在信號(hào)通信中與乘法器592的第一輸入相連。表示加權(quán)因子的參考畫面加權(quán)因子分配器572的輸出在信號(hào)通信中與乘法器592的第二輸入相連。乘法器592的輸出在信號(hào)通信中與求和結(jié)點(diǎn)510的反相輸入相連。
現(xiàn)在轉(zhuǎn)向圖6,用于使用隱式參考畫面加權(quán)為圖像塊進(jìn)行視頻信號(hào)數(shù)據(jù)編碼的典型處理通常由參考數(shù)字600表示。處理包括向輸入塊612傳送控制的開始?jí)K610。輸入塊612接收實(shí)質(zhì)上未壓縮的圖像塊數(shù)據(jù),并向功能塊614傳送控制。功能塊614針對(duì)所接收的圖像塊,從相對(duì)于圖像塊位置的一個(gè)方向或者兩個(gè)方向選擇第一和第二參考畫面,并向功能塊616傳送控制。功能塊616確定圖像塊與第一和第二參考畫面之間的相對(duì)位置,并向功能塊618傳送控制。功能塊618根據(jù)相對(duì)位置為圖像塊的每一個(gè)畫面具體參考畫面計(jì)算隱式加權(quán)因子。功能塊618向功能塊620傳送控制。功能塊620針對(duì)當(dāng)前圖像塊的兩個(gè)參考畫面序號(hào)的每一個(gè),開始程序循環(huán),并向功能塊622傳送控制。功能塊622針對(duì)圖像塊和具體參考畫面計(jì)算運(yùn)動(dòng)矢量,并向功能塊624傳送控制。功能塊624根據(jù)運(yùn)動(dòng)矢量,對(duì)具體參考畫面進(jìn)行運(yùn)動(dòng)補(bǔ)償,并向功能塊626傳送控制。功能塊626依次將運(yùn)動(dòng)補(bǔ)償?shù)膮⒖籍嬅媾c隱式加權(quán)因子相乘,從而形成加權(quán)運(yùn)動(dòng)補(bǔ)償參考畫面,并向功能塊628傳送控制。功能塊628迭代功能塊620的循環(huán),并在循環(huán)完成兩次后向功能塊630傳送控制。
功能塊630形成了結(jié)合加權(quán)運(yùn)動(dòng)補(bǔ)償?shù)膮⒖籍嬅?,并向功能塊632傳送控制。功能塊632從實(shí)質(zhì)上未壓縮的圖像塊中減去結(jié)合加權(quán)運(yùn)動(dòng)補(bǔ)償?shù)膮⒖籍嬅?,并向功能塊634傳送控制。功能塊634依次使用實(shí)質(zhì)上未壓縮的圖像塊與結(jié)合加權(quán)運(yùn)動(dòng)補(bǔ)償?shù)膮⒖籍嬅嬷g的差值,連同對(duì)應(yīng)的具體參考畫面的序號(hào)對(duì)信號(hào)進(jìn)行編碼,并向結(jié)束塊636傳送控制。因此,在雙向預(yù)測(cè)情況下,從當(dāng)前畫面之前、之后或周圍將形成兩個(gè)預(yù)測(cè)器。
在操作中,隱式加權(quán)因子應(yīng)用于使用多個(gè)參考畫面的視頻壓縮編碼器和解碼器的參考畫面預(yù)測(cè)。當(dāng)對(duì)塊進(jìn)行雙向預(yù)測(cè)編碼并且使用新的隱式模式時(shí),根據(jù)內(nèi)插/外插公式,使用當(dāng)前畫面到參考畫面的距離來確定相對(duì)加權(quán)因子。
對(duì)于本發(fā)明的優(yōu)選實(shí)施例,定義了隱式雙向預(yù)測(cè)的新定義。使用了基于所編碼畫面與其參考畫面之間距離的內(nèi)插或外插公式。內(nèi)插或外插使用相同的公式。如果按照顯示順序,兩個(gè)參考畫面一個(gè)在當(dāng)前所編碼畫面之前且一個(gè)在其之后,則公式為內(nèi)插公式,如果按顯示順序,參考畫面兩個(gè)都在當(dāng)前所編碼畫面之前或者兩個(gè)都在其之后,則公式為外插公式。
當(dāng)前畫面將在時(shí)間T處進(jìn)行顯示,參考畫面P0在時(shí)間T0處進(jìn)行顯示且參考畫面P1在時(shí)間T1處進(jìn)行顯示。在這種隱式模式下,對(duì)于雙向預(yù)測(cè)編碼宏模塊,預(yù)測(cè)定義為Pred=P0*(T1-T)/(T1-T0)+P1*(T-T0)/(T1-T0)(等式2)相對(duì)顯示時(shí)間值T、T1和T0在相對(duì)畫面的畫面頭標(biāo)中表示。在隱式模式中,可以根據(jù)畫面順序計(jì)數(shù)(“POC”)而不是顯示時(shí)間來確定WP加權(quán)因子。POC存在于或推導(dǎo)自片段頭標(biāo)(slice header)。因此,相關(guān)領(lǐng)域的普通技術(shù)人員可以理解,POC可以代替顯示時(shí)間使用。也可以實(shí)現(xiàn)當(dāng)解碼時(shí)存儲(chǔ)這種來自參考畫面的相對(duì)位置信息的實(shí)施例。在解碼畫面P1和P0的同時(shí),存儲(chǔ)顯示時(shí)間T1和T0。
當(dāng)畫面解碼時(shí),存儲(chǔ)其POC或顯示時(shí)間或位置信息。當(dāng)要計(jì)算加權(quán)因子時(shí),使用參考畫面序號(hào),以指示使用哪些所存儲(chǔ)的位置數(shù)據(jù),可以訪問所存儲(chǔ)位置的數(shù)據(jù)。存儲(chǔ)此信息,用于直接模式運(yùn)動(dòng)矢量尺度變換。(T1-T)/(T1-T0)和(T-T0)/(T1-T0)的計(jì)算還用于直接模式,保存計(jì)算結(jié)果并再次使用,從而避免重復(fù)計(jì)算的需要。對(duì)于T、T0和T1的每一個(gè)值,可以對(duì)每一個(gè)所編碼的畫面執(zhí)行一次這種除法計(jì)算,且該結(jié)果可以通過常數(shù)因子X進(jìn)行尺度變換,從而允許更有效的位移操作,而不是對(duì)于每一個(gè)像素計(jì)算Pred值的除法運(yùn)算。例如,如果X是256,則每幅畫面可以按如下計(jì)算一次Z0和Z1Z0=(256*(T1-T))/(T1-T0)(等式3)Z1=(256*(T-T0))/(T1-T0)(等式4)然后,每一個(gè)像素按以下計(jì)算一次PredPred=(P0·Z0+P1·Z1+128)>>8 (等式5)可以在此計(jì)算后,將Pred值限幅到所希望的范圍,通常是0到255。也可以限幅Z0和Z1的值。對(duì)于中值約為128的色度系數(shù),可以使用以下典型公式Pred=(P0-128)*(T1-T))/(T1-T0)+(P1-128)*(T-T0))/(T1-T0)+128 (等式6)在直接模式中,參考畫面0和參考畫面1的參考序號(hào)不是顯式地傳輸,而是推導(dǎo)出。在這種情況下,根據(jù)T1和T0的推導(dǎo)值來計(jì)算加權(quán)因子。當(dāng)可用時(shí),可以使用比特流中的參考畫面序號(hào)來得到T0和T1。
利用在線性逐漸減弱中的雙向預(yù)測(cè)編碼宏模塊,所提出的加權(quán)是理想的。在這種情況下,由于不需要比特傳輸與每一個(gè)參考畫面相關(guān)的加權(quán)因子,故可以實(shí)現(xiàn)比特率降低。
對(duì)于當(dāng)P1是在先于當(dāng)前畫面的兩個(gè)參考畫面并且P0是先于當(dāng)前畫面的一個(gè)參考畫面時(shí)的情況,公式默認(rèn)為Pred=2*P0-P1(等式7)本發(fā)明的這些和其它特點(diǎn)與優(yōu)點(diǎn)可以由相關(guān)領(lǐng)域的普通技術(shù)人員根據(jù)這里公開的原理很容易地確定。將會(huì)理解本發(fā)明的原理可以在各種形式的硬件、軟件、固件、特殊用途處理器或其聯(lián)合中實(shí)現(xiàn)。
更優(yōu)選地,將本發(fā)明實(shí)現(xiàn)為硬件和軟件的結(jié)合。此外,優(yōu)選地,將軟件實(shí)現(xiàn)為在解碼存儲(chǔ)單元上具體體現(xiàn)的應(yīng)用程序。可以將應(yīng)用程序加載到包括任何合適體系結(jié)構(gòu)的機(jī)器上并由其執(zhí)行。優(yōu)選地,在具有例如一個(gè)或多個(gè)中央處理器(“CPU”)、隨機(jī)存取存儲(chǔ)器(“RAM”)和輸入/輸出(“I/O”)接口的硬件的計(jì)算機(jī)平臺(tái)上實(shí)現(xiàn)機(jī)器。計(jì)算機(jī)平臺(tái)還可以包括操作系統(tǒng)和微指令碼。這里所描述的各種處理和功能可以是由CPU可執(zhí)行的微指令碼的部分或者應(yīng)用程序的部分,或其任何結(jié)合。另外,各種其它外設(shè)可以連接到計(jì)算機(jī)平臺(tái),例如附加數(shù)據(jù)存儲(chǔ)單元和打印單元。
此外,可以理解,因?yàn)樵诟綀D中所描述的一些組成系統(tǒng)的部件和方法優(yōu)選在軟件中實(shí)現(xiàn),所以系統(tǒng)部件或處理功能塊可以不同地依賴于本發(fā)明的程序編排方式。假設(shè)本發(fā)明的原理在這里公開,則相關(guān)領(lǐng)域的一個(gè)普通技術(shù)人員將可以考慮本發(fā)明的這些和類似實(shí)現(xiàn)或配置。
盡管這里參考附圖描述了說明性的實(shí)施例,可以理解本發(fā)明并不局限于這些具體的實(shí)施例,并且在不脫離本發(fā)明的范圍和實(shí)質(zhì)的前提下,相關(guān)領(lǐng)域的普通技術(shù)人員可以進(jìn)行各種變化和修改。正如所附的權(quán)利要求所述,所有這些變化和修改都應(yīng)在本發(fā)明的范圍之內(nèi)。
權(quán)利要求
1.一種利用第一和第二參考畫面序號(hào)針對(duì)圖像塊進(jìn)行視頻信號(hào)數(shù)據(jù)解碼以預(yù)測(cè)圖像塊的視頻解碼器(200),解碼器包括響應(yīng)圖像塊與第一和第二參考畫面之間相對(duì)位置的參考畫面加權(quán)因子單元(280),參考畫面加權(quán)因子單元具有用于確定分別與第一和第二參考畫面序號(hào)的每一個(gè)相對(duì)應(yīng)的隱式加權(quán)因子的輸出。
2.如權(quán)利要求1所述的視頻解碼器(200),其特征在于參考畫面加權(quán)因子單元(280)包括內(nèi)插部分,用于在兩個(gè)參考畫面的部分之間進(jìn)行內(nèi)插,按照顯示順序這兩個(gè)參考畫面一個(gè)設(shè)置在圖像塊之前,一個(gè)設(shè)置在圖像塊之后;以及外插部分,用于從兩個(gè)參考畫面的部分進(jìn)行外插,這兩個(gè)參考畫面按照顯示順序都設(shè)置圖像塊之前或都在圖像塊之后。
3.如權(quán)利要求1所述的視頻解碼器(200),還包括在信號(hào)通信中與參考畫面加權(quán)因子單元(280)相連的可變長(zhǎng)度解碼器(210),用于向參考畫面加權(quán)因子單元提供第一和第二參考畫面序號(hào)。
4.如權(quán)利要求1所述的視頻解碼器(200),還包括在信號(hào)通信中與參考畫面加權(quán)因子單元(280)相連的運(yùn)動(dòng)補(bǔ)償器(260),用于根據(jù)參考畫面加權(quán)因子單元來提供運(yùn)動(dòng)補(bǔ)償?shù)膮⒖籍嬅妗?br>
5.如權(quán)利要求4所述的視頻解碼器(200),還包括在信號(hào)通信中與運(yùn)動(dòng)補(bǔ)償器(260)和參考畫面加權(quán)因子單元(280)相連的乘法器(270),用于向運(yùn)動(dòng)補(bǔ)償?shù)膮⒖籍嬅鎽?yīng)用隱式加權(quán)因子。
6.如權(quán)利要求1所述的視頻解碼器(200),其特征在于視頻信號(hào)數(shù)據(jù)是包含塊變換系數(shù)的流視頻信號(hào)數(shù)據(jù)。
7.如權(quán)利要求1所述的視頻解碼器(200),還包括預(yù)測(cè)裝置,用于從兩個(gè)不同參考畫面形成第一和第二預(yù)測(cè)器;結(jié)合裝置,用于使用其相應(yīng)的隱式加權(quán)因子將第一和第二預(yù)測(cè)器結(jié)合在一起,以形成單個(gè)的結(jié)合預(yù)測(cè)器。
8.如權(quán)利要求7所述的視頻解碼器(200),其特征在于兩個(gè)不同的參考畫面都來自于相對(duì)于圖像塊相同的方向。
9.一種用于針對(duì)圖像塊進(jìn)行視頻信號(hào)數(shù)據(jù)解碼的方法(300),該方法包括獲得(312,313,314)用于圖像塊的多個(gè)參考畫面序號(hào),每一個(gè)序號(hào)對(duì)應(yīng)于具體參考畫面;根據(jù)圖像塊和多個(gè)參考畫面的相對(duì)位置來確定(315,316)隱式加權(quán)因子,這些參考畫面由多個(gè)參考畫面序號(hào)表示并且與所接收的多個(gè)參考畫面序號(hào)中的每一個(gè)相對(duì)應(yīng);檢索(318)與所接收的多個(gè)參考畫面序號(hào)中的每一個(gè)相對(duì)應(yīng)的參考畫面;對(duì)所檢索的參考畫面進(jìn)行運(yùn)動(dòng)補(bǔ)償(320);以及將運(yùn)動(dòng)補(bǔ)償?shù)膮⒖籍嬅娣謩e與其對(duì)應(yīng)的隱式加權(quán)因子相乘,從而形成對(duì)應(yīng)的加權(quán)運(yùn)動(dòng)補(bǔ)償參考畫面。
10.如權(quán)利要求9所述的方法,其特征在于獲得用于圖像塊的多個(gè)參考畫面序號(hào)包括在隱式模式中接收具有用于圖像塊的數(shù)據(jù)的多個(gè)參考畫面序號(hào)。
11.如權(quán)利要求9所述的方法,其特征在于獲得用于圖像塊的多個(gè)參考畫面序號(hào)包括在直接模式中從用于圖像塊的數(shù)據(jù)中推導(dǎo)出多個(gè)參考畫面序號(hào)。
12.如權(quán)利要求9所述的方法,其特征在于運(yùn)動(dòng)補(bǔ)償所檢索的參考畫面包括確定所檢索的參考畫面相對(duì)于圖像塊的運(yùn)動(dòng)矢量。
13.如權(quán)利要求9所述的方法,其特征在于確定隱式加權(quán)因子包括接收用于圖像塊的片段頭標(biāo)字段;從片段頭標(biāo)字段中確定畫面順序計(jì)數(shù);使用畫面順序計(jì)數(shù)來確定圖像塊與多個(gè)參考畫面的相對(duì)位置。
14.如權(quán)利要求9所述的方法,其特征在于圖像塊與多個(gè)參考畫面的相對(duì)位置對(duì)應(yīng)于各自畫面的相對(duì)顯示時(shí)間。
15.如權(quán)利要求9所述的方法,其特征在于確定隱式加權(quán)因子包括以下至少之一在兩個(gè)參考畫面的部分之間進(jìn)行內(nèi)插,按照顯示順序,這兩個(gè)參考畫面一個(gè)設(shè)置在圖像塊之前,一個(gè)設(shè)置在圖像塊之后;以及從兩個(gè)參考畫面的部分進(jìn)行外插,這兩個(gè)參考畫面按照顯示順序都設(shè)置在圖像塊之前或都設(shè)置在圖像塊之后。
16.如權(quán)利要求9所述的方法,還包括結(jié)合加權(quán)運(yùn)動(dòng)補(bǔ)償參考畫面,從而形成結(jié)合加權(quán)的運(yùn)動(dòng)補(bǔ)償參考畫面。
17.如權(quán)利要求9所述的方法,還包括將結(jié)合加權(quán)的運(yùn)動(dòng)補(bǔ)償參考畫面與用于圖像塊的數(shù)據(jù)相加,從而預(yù)測(cè)圖像塊。
18.如權(quán)利要求17所述的方法,還包括存儲(chǔ)所預(yù)測(cè)的圖像塊,作為以后檢索的參考畫面。
19.如權(quán)利要求9所述的方法,其特征在于視頻信號(hào)數(shù)據(jù)是包括塊變換系數(shù)的流視頻信號(hào)數(shù)據(jù)。
20.如權(quán)利要求9所述的方法,還包括從兩個(gè)不同的參考畫面形成第一和第二預(yù)測(cè)器;運(yùn)動(dòng)補(bǔ)償?shù)谝缓偷诙A(yù)測(cè)器的每一個(gè);使用其相應(yīng)的隱式加權(quán)因子將第一和第二預(yù)測(cè)器相結(jié)合,從而形成單個(gè)結(jié)合的預(yù)測(cè)器。
21.如權(quán)利要求9所述的方法,其特征在于確定隱式加權(quán)因子包括預(yù)計(jì)算至少一個(gè)加權(quán)因子以及存儲(chǔ)所述至少一個(gè)加權(quán)因子,用于再次使用。
22.如權(quán)利要求9所述的方法,還包括存儲(chǔ)圖像塊和多個(gè)參考畫面的相對(duì)位置信息;以及通過使用參考畫面序號(hào)來指示要使用的存儲(chǔ)的位置數(shù)據(jù),訪問所存儲(chǔ)的相對(duì)位置信息,從而計(jì)算隱式加權(quán)因子。
23.如權(quán)利要求22所述的方法,還包括在直接模式中再次使用相對(duì)位置信息,從而消除重復(fù)計(jì)算的需要。
24.如權(quán)利要求22所述的方法,還包括對(duì)于每一個(gè)所編碼的畫面和位置的每一個(gè)值執(zhí)行除法計(jì)算,并通過常數(shù)因子對(duì)結(jié)果進(jìn)行尺度變換,從而允許更有效的位移操作,而不是針對(duì)每一個(gè)像素計(jì)算預(yù)測(cè)值的除法運(yùn)算。
25.如權(quán)利要求20所述的方法,其特征在于兩個(gè)不同的參考畫面都來自相對(duì)于圖像塊相同的方向。
全文摘要
公開了一種利用兩個(gè)參考畫面序號(hào)來指示圖像塊從而對(duì)于圖像塊進(jìn)行視頻信號(hào)數(shù)據(jù)處理的視頻解碼器(200)、編碼器(500)以及相應(yīng)的方法,其利用了參考畫面的隱式加權(quán)從而增強(qiáng)視頻壓縮,其中解碼器(200)包括隱式參考畫面加權(quán)因子單元(280),用于確定與每一個(gè)參考畫面序號(hào)相對(duì)應(yīng)的加權(quán)因子;編碼器(500)包括隱式參考畫面加權(quán)因子分配器(572),用于與每一個(gè)參考畫面序號(hào)相對(duì)應(yīng)分配加權(quán)因子;以及一種用于解碼的方法,包括接收參考畫面序號(hào)與對(duì)應(yīng)于圖像塊的數(shù)據(jù),確定根據(jù)圖像塊和由每一個(gè)參考畫面序號(hào)表示的參考畫面的相對(duì)位置的隱式加權(quán)因子,對(duì)于每一個(gè)序號(hào)檢索參考畫面,對(duì)所檢索的參考畫面進(jìn)行運(yùn)動(dòng)補(bǔ)償,以及將運(yùn)動(dòng)補(bǔ)償過的參考畫面與相應(yīng)的加權(quán)相乘。
文檔編號(hào)H04N7/24GK1689242SQ03823578
公開日2005年10月26日 申請(qǐng)日期2003年9月10日 優(yōu)先權(quán)日2002年10月1日
發(fā)明者吉爾·麥克唐納·布瓦斯 申請(qǐng)人:湯姆森許可貿(mào)易公司