專利名稱:視頻編碼器中參考圖像的隱含加權(quán)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻多媒體數(shù)字信號(hào)編解碼器領(lǐng)域。
背景技術(shù):
通常視頻數(shù)據(jù)以比特流的形式處理和傳輸。典型的視頻壓縮編碼器和 解碼器(CODEC)由形成要編碼的圖像的參考圖像的預(yù)測(cè),并編碼當(dāng)前圖 像和預(yù)測(cè)之間的差獲得更多的壓縮效率。越接近與當(dāng)前圖像相關(guān)的預(yù)測(cè), 需要越少的比特壓縮此圖像,因此增加了處理的效率。因此,要求形成最 可能的參考圖像的預(yù)測(cè)。
在一些視頻序列中,特別是具有衰減的圖像,被編碼或解碼的當(dāng)前圖 像比參考圖像本身具有更強(qiáng)的由加權(quán)因子定標(biāo)的參考圖像的相關(guān)。沒(méi)有施 加到參考圖像的加權(quán)因子的視頻多媒體數(shù)字信號(hào)編解碼器非常無(wú)效的編 碼此衰減的序列。遺憾地,加權(quán)因子的傳輸要求在比特流中發(fā)送附加的比 特。
在許多視頻壓縮標(biāo)準(zhǔn)中,包括運(yùn)動(dòng)圖象專家組("MPEG")-1, MPEG-2和 MPEG-4,前面參考圖像的運(yùn)動(dòng)補(bǔ)償版本用作為當(dāng)前圖像的預(yù)測(cè),只是編碼 當(dāng)前圖像與預(yù)測(cè)之間的差。當(dāng)使用單個(gè)圖像預(yù)測(cè)("P"圖像)時(shí),在形成 運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè)時(shí),不定標(biāo)參考圖像。當(dāng)使用雙向圖像預(yù)測(cè)("B"圖像)時(shí),從兩個(gè)不同的圖像形成中間預(yù) 測(cè),然后,兩個(gè)中間預(yù)測(cè)一起平均,各使用相等的(1/2,1/2)加權(quán)因子
形成單個(gè)平均預(yù)測(cè)。在這些MPEG標(biāo)準(zhǔn)中,對(duì)B圖像,兩個(gè)參考圖像總是 來(lái)自正方向和反方向。
發(fā)明內(nèi)容
由視頻編碼器編碼圖像塊和許多參考圖像索引的視頻信號(hào)數(shù)據(jù),解決 了當(dāng)前技術(shù)的這些和其它的困難和缺點(diǎn)。編碼器包括參考圖像加權(quán)因子分 配器函數(shù),響應(yīng)在圖像塊和由許多參考圖像索引指示的第一和第二參考圖 像之間的相對(duì)位置。使用參考圖像加權(quán)因子分配器計(jì)算相應(yīng)于特定參考圖 像索引的參考圖像的隱含加權(quán)因子。
根據(jù)下面的例圖,本發(fā)明在視頻編碼器和解碼器中使用參考圖像的隱 含加權(quán)因子。
圖1顯示根據(jù)本發(fā)明原理的視頻解碼器的框圖2顯示根據(jù)本發(fā)明原理的有隱含參考圖像加權(quán)的視頻解碼器的框圖; 圖3顯示根據(jù)本發(fā)明原理的解碼處理的流程圖; 圖4顯示根據(jù)本發(fā)明原理的視頻編碼器的的框圖5顯示根據(jù)本發(fā)明原理的有隱含參考圖像加權(quán)的視頻編碼器的框圖; 圖6顯示根據(jù)本發(fā)明原理的編碼處理的流程圖。
具體實(shí)施例方式
本發(fā)明包括在視頻壓縮編碼器和解碼器中參考圖像的隱含加權(quán)的方法 和設(shè)備。例如,在有圖像衰減的視頻序列中,被編碼的當(dāng)前圖像或圖像塊 比參考圖像本身具有更強(qiáng)的由加權(quán)因子定標(biāo)的參考圖像的相關(guān)。沒(méi)有施加 到參考圖像的加權(quán)因子的視頻多媒體數(shù)字信號(hào)編碼器和解碼器非常無(wú)效 的編碼此衰減的序列。當(dāng)加權(quán)因子用于編碼時(shí),視頻編碼器需要確定加權(quán) 因子和運(yùn)動(dòng)矢量。
在聯(lián)合視頻小組("JVT")視頻壓縮標(biāo)準(zhǔn)中,每個(gè)P圖像能使用多個(gè)參考圖像形成圖像的預(yù)測(cè),但每個(gè)單獨(dú)的運(yùn)動(dòng)塊或宏塊的8X8區(qū)域只使 用單個(gè)的用于預(yù)測(cè)的參考圖像。除編碼和傳輸運(yùn)動(dòng)矢量外,對(duì)各運(yùn)動(dòng)塊或
8X8區(qū)域傳輸參考圖像索引,索引指出使用哪個(gè)參考圖像。有限的可能
參考圖像組存儲(chǔ)在編碼器和解碼器中,傳輸能允許數(shù)量的參考圖像。
對(duì)雙向預(yù)測(cè)圖像(也稱"B"圖像),對(duì)各運(yùn)動(dòng)塊或8X8區(qū)域形成兩個(gè) 預(yù)測(cè)器,其中每個(gè)來(lái)自分離的參考圖像,兩個(gè)預(yù)測(cè)器一起平均,形成單個(gè) 平均的預(yù)測(cè)器。對(duì)雙向預(yù)測(cè)編碼的運(yùn)動(dòng)塊,參考圖像可以都來(lái)自正方向, 都來(lái)自反方向,或來(lái)自正方向和反方向。保存可用于預(yù)測(cè)的可用的參考圖 像的兩個(gè)列表。兩個(gè)參考圖像可稱為list 0和list 1預(yù)測(cè)器,或ref 0 和refl參考圖像。編碼和傳輸各參考圖像的索引,對(duì)list 0和list 1 參考圖像分別為ref—idx—10和ref_idx—11 。已經(jīng)向聯(lián)合視頻小組("JVT") 建議的雙向預(yù)測(cè)或B圖像,允許在兩個(gè)預(yù)測(cè)之間自適應(yīng)的加權(quán),艮P:
Pred=Pl*Predl+PO*PredO+D (公式1)
其中PI和PO是加權(quán)因子。Pred 0和Predl分別是list 0和list 1的 參考圖像預(yù)測(cè),D是偏移值。
已提出至少兩種確定和使用加權(quán)因子的方法,隱含方法和明示方法。 使用隱含方法,由用于參考圖像的方向確定加權(quán)因子。在此方法中,如 果ref—fwd索引小于或等于ref一bwd索引,使用(1/2,1/2)加權(quán)因子, 否則,使用(2, -1)加權(quán)因子。在隱含方法中,(2, -1)加權(quán)因子常 常用于在直接模式中編碼的宏塊。
使用明示方法時(shí),為每個(gè)片斷傳輸任意數(shù)量的加權(quán)因子。那么對(duì)使用 雙向預(yù)測(cè)的各運(yùn)動(dòng)塊或宏塊的8X8區(qū)域傳輸加權(quán)因子索引。解碼器使用 接收的加權(quán)因子索引,從傳輸?shù)募现羞x擇合適的加權(quán)因子,以便解碼運(yùn) 動(dòng)塊或8X8區(qū)域時(shí)使用。
已提出明確的傳輸與每一片段或每個(gè)圖像的各參考圖像索引相關(guān)的加 權(quán)因子。在此情況中,要求對(duì)每個(gè)片斷或每個(gè)圖像傳輸小量的但不可忽略 數(shù)量的比特。
下面的描述只說(shuō)明本發(fā)明的原理。那么本領(lǐng)域的技術(shù)人員意識(shí)到能設(shè) 計(jì)實(shí)現(xiàn)本發(fā)明的原理,并包括在它的精神和范圍中的各種裝置,雖然這里 不明顯的描述和顯示這些裝置。此外,這里列舉的所有的例子和有條件的,幫助讀者理解本發(fā)明的原理和本發(fā)明 對(duì)進(jìn)一步的技術(shù)提出的概念,并解釋為這些特殊列舉的例子和條件是沒(méi)有 限制的。
此外,這里列舉的所有陳述,范圍和本發(fā)明的實(shí)施例,和它的特殊的 例子旨在包含它的結(jié)構(gòu)和功能的設(shè)備。此外,這些設(shè)備包括當(dāng)前已知的設(shè) 備和在將來(lái)研發(fā)的設(shè)備,即,不管其結(jié)構(gòu),任何實(shí)現(xiàn)同樣功能的研發(fā)的部 件。
那么,例如,本領(lǐng)域的技術(shù)人員意識(shí)到這里的框圖表示說(shuō)明具體化本 發(fā)明原理的電路的概念化觀念。同樣的,任何流程圖,流程圖表,狀態(tài)轉(zhuǎn) 變圖表,偽代碼,和可以完全在計(jì)算機(jī)可讀介質(zhì)中表現(xiàn)的并由計(jì)算機(jī)或處 理器執(zhí)行的表現(xiàn)的各種處理,無(wú)論此計(jì)算機(jī)或處理器是否是明確地顯示。
通過(guò)使用專用硬件和能執(zhí)行合適軟件相關(guān)的軟件的硬件,能提供顯示 在圖中的各種元件的功能。當(dāng)功能由處理器提供時(shí),功能可由單個(gè)專用處 理器,由單個(gè)共享處理器,或由許多單獨(dú)的用處理器提供,其中一些可共
i》:
此外,不解釋明確使用的術(shù)語(yǔ)"處理器"和"控制器"專有地涉及能
執(zhí)行軟件的硬件,可以隱含地,無(wú)限制的,包括數(shù)字信號(hào)處理器"DSP" 硬件,存儲(chǔ)軟件的只讀存儲(chǔ)器(ROMs),隨機(jī)存儲(chǔ)器(RAMs)和非易失性 存儲(chǔ)器。也包括其它硬件,常規(guī)的和/或定制。同樣的,顯示在圖中的任 何轉(zhuǎn)換器只是概念性的。可通過(guò)運(yùn)行程序邏輯,通過(guò)專用邏輯,通過(guò)程序 控制和專用邏輯的交互作用,或甚至手動(dòng),執(zhí)行它們的功能,由實(shí)施者可 選擇的特殊的技術(shù)作為從上下文更明確的理解。
在這里的權(quán)利要求中表示為實(shí)現(xiàn)特定功能的裝置的任何元件打算包含 實(shí)現(xiàn)功能的任何方式,包括,例如,a)實(shí)現(xiàn)此功能的電路元件的組合或b) 任何形式的軟件,因此包括,固件,微碼或其它,與執(zhí)行此軟件的適當(dāng)?shù)?電路組合實(shí)現(xiàn)功能。由此權(quán)利要求定義的本發(fā)明存在于以下的事實(shí),組合 由各種列舉的裝置提供的功能,并以權(quán)利要求需要的方式集合。那么申請(qǐng) 者把能提供這些功能的任何裝置看作這里顯示的設(shè)備。
在本發(fā)明的實(shí)施例中,隱含加權(quán)因子作用于使用多參考圖像的視頻壓 縮編碼器和解碼器的參考圖像預(yù)測(cè)。當(dāng)塊是雙預(yù)測(cè)編碼的并使用如這里描述的新的隱含模式時(shí),使用當(dāng)前圖像與參考圖像的距離,基于內(nèi)插法/外 推法公式確定相對(duì)加權(quán)因子。
如在圖1中所顯示的,通常由參考數(shù)字100表示視頻解碼器。視頻解
碼器100包括與逆量化器120連接作信號(hào)通信的可變長(zhǎng)解碼器 ("VLD" )110。逆量化器120與逆變換器130連接作信號(hào)通信,逆變換器 130與加法器的第一輸入端或和結(jié)點(diǎn)140連接作信號(hào)通信,其中和結(jié)點(diǎn)140 的輸出提供視頻解碼器100的輸出。和結(jié)點(diǎn)140的輸出與參考圖像存儲(chǔ)器 150連接作信號(hào)通信。參考圖像存儲(chǔ)器150與運(yùn)動(dòng)補(bǔ)償器160連接作信號(hào) 通信,運(yùn)動(dòng)補(bǔ)償器160與和結(jié)點(diǎn)140的第二輸入端連接作信號(hào)通信。
見(jiàn)圖2,通常由參考數(shù)字200表示有隱含參考圖像加權(quán)的視頻解碼器。 視頻解碼器200包括與逆量化器220連接作信號(hào)通信的VLD210。逆量化 器220與逆變換器230連接作信號(hào)通信。逆變換器230與和結(jié)點(diǎn)240的第 一輸入端連接作信號(hào)通信,其中和結(jié)點(diǎn)240的輸出提供視頻解碼器200的 輸出。和結(jié)點(diǎn)240的輸出與參考圖像存儲(chǔ)器250連接作信號(hào)通信。參考圖 像存儲(chǔ)器250與運(yùn)動(dòng)補(bǔ)償器260連接作信號(hào)通信,運(yùn)動(dòng)補(bǔ)償器260與乘法 器270的第一輸入連接作信號(hào)通信。
VLD210還與參考圖像加權(quán)因子?xùn)苏冶?80連接作信號(hào)通信,提供對(duì)査 找表280的隱含雙方向系數(shù)索引。查找表280的輸出用于提供加權(quán)因子, 并連接到乘法器270的第二輸入端作信號(hào)通信。乘法器270的輸出與和結(jié) 點(diǎn)240的第二輸入端連接作信號(hào)通信。
現(xiàn)在見(jiàn)圖3,通常由參考數(shù)字300表示有隱含參考圖像加權(quán)的圖像塊的 解碼視頻信號(hào)數(shù)據(jù)的示范處理。處理包括對(duì)輸入塊312通過(guò)控制的啟動(dòng)塊 310。輸入塊312接收壓縮數(shù)據(jù)的圖像塊,通過(guò)對(duì)輸入塊313的控制。輸 入塊313接收相當(dāng)于第一特定參考圖像的第一參考圖像索引,通過(guò)對(duì)輸入 塊314的控制。輸入塊314接收相當(dāng)于第二特定參考圖像的第二參考圖像 索引。輸入塊314通過(guò)對(duì)功能塊315的控制,功能塊315確定圖像塊和第 一和第二參考圖像之間的相對(duì)位置。功能塊315通過(guò)對(duì)功能塊316的控制, 功能塊316基于當(dāng)前圖像塊與第一和第二參考圖像的相對(duì)位置計(jì)算相當(dāng) 于各接收的參考圖像索引的隱含加權(quán)因子,并通過(guò)對(duì)功能塊317的控制。
功能塊317對(duì)當(dāng)前圖像塊的兩個(gè)參考圖像索引中的每一個(gè),啟動(dòng)要執(zhí)行的程序循環(huán),并通過(guò)對(duì)功能塊318的控制。功能塊318檢索相當(dāng)于當(dāng)前 循環(huán)參考圖像索引的參考圖像,并通過(guò)對(duì)功能塊320的控制。同時(shí),功能 塊320運(yùn)動(dòng)補(bǔ)償檢索的參考圖像,并通過(guò)對(duì)功能塊322的控制。功能塊 322用相應(yīng)的隱含加權(quán)因子乘運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像,并通過(guò)對(duì)功能塊323 的控制。功能塊323重復(fù)功能塊317的循環(huán),在完成兩次循環(huán)后,通過(guò)對(duì) 功能塊324的控制。依次,功能塊324形成組合的加權(quán)的運(yùn)動(dòng)補(bǔ)償?shù)膮⒖?圖像,并通過(guò)對(duì)功能塊326的控制。那么,使用在功能塊315中確定的相 對(duì)位置確定加權(quán)因子。
如在圖4中所示的,通常由參考數(shù)字400表示標(biāo)準(zhǔn)的視頻編碼器。編 碼器400的輸入與和結(jié)點(diǎn)410的非反向輸入連接作信號(hào)通信。和結(jié)點(diǎn)410 的輸出與塊變換器420連接作信號(hào)通信。塊變換器420與量化器430連接 作信號(hào)通信。量化器430的輸出與可變長(zhǎng)編碼器("VLC" )440連接作信 號(hào)通信,其中VLC440的輸出是編碼器400的外部可用的輸出。
量化器430的輸出還與逆量化器450連接作信號(hào)通信。逆量化器450 與逆變換器460連接作信號(hào)通信,同時(shí),逆變換器460與參考圖像存儲(chǔ)器 470連接作信號(hào)通信。參考圖像存儲(chǔ)器470的第一輸出與運(yùn)動(dòng)估計(jì)480的 第一輸入連接作信號(hào)通信。編碼器400的輸入還與運(yùn)動(dòng)估計(jì)480的第二輸 入連接作信號(hào)通信。運(yùn)動(dòng)估計(jì)480的輸出與運(yùn)動(dòng)補(bǔ)償490的第一輸入連接 作信號(hào)通信。參考圖像存儲(chǔ)器470的第二輸出與運(yùn)動(dòng)補(bǔ)償490的第二輸入 連接作信號(hào)通信。運(yùn)動(dòng)補(bǔ)償490的輸出與和結(jié)點(diǎn)410的反向輸入連接作信 號(hào)通信。
見(jiàn)圖5,通常由參考數(shù)字500表示有隱含參考圖像加權(quán)的視頻編碼器。 編碼器500的輸入與和結(jié)點(diǎn)510的非反向輸入連接作信號(hào)通信。和結(jié)點(diǎn) 510的輸出與塊變換器520連接作信號(hào)通信。塊變換器520與量化器530 連接作信號(hào)通信。量化器530的輸出與VLC540連接作信號(hào)通信,其中 VLC540的輸出是編碼器500的外部的可利用的輸出。
量化器530的輸出還與逆量化器550連接作信號(hào)通信。逆量化器550 與逆塊變換器560連接作信號(hào)通信,同時(shí),逆塊變換器560與參考圖像存 儲(chǔ)器570連接作信號(hào)通信。參考圖像存儲(chǔ)器570的第一輸出與參考圖像加 權(quán)因子分配器572的第一輸入連接作信號(hào)通信。編碼器500的輸入還與參考圖像加權(quán)因子分配器572的第二輸入連接作信號(hào)通信。參考圖像加權(quán)因
子分配器572的輸出與運(yùn)動(dòng)估計(jì)580的第一輸入連接作信號(hào)通信,參考圖 像加權(quán)因子分配器572指示加權(quán)因子。參考圖像存儲(chǔ)器570的第二輸出與 運(yùn)動(dòng)估計(jì)580的第二輸入連接作信號(hào)通信。
編碼器500的輸入還與運(yùn)動(dòng)估計(jì)580的第三輸入連接作信號(hào)通信。運(yùn) 動(dòng)估計(jì)580的輸出與運(yùn)動(dòng)補(bǔ)償590的第一輸入連接作信號(hào)通信,運(yùn)動(dòng)估計(jì) 580表示運(yùn)動(dòng)矢量。參考圖像存儲(chǔ)器570的第三輸出與運(yùn)動(dòng)補(bǔ)償590的第 二輸入連接作信號(hào)通信。表示運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像的運(yùn)動(dòng)補(bǔ)償590的輸出 與乘法器592的第一輸入連接作信號(hào)通信。表示加權(quán)因子的參考圖像加權(quán) 因子分配器572的輸出與乘法器592的第二輸入連接作信號(hào)通信。乘法器 592的輸出與和結(jié)點(diǎn)510的反向輸入連接作信號(hào)通信。
現(xiàn)在看圖6,通常由參考數(shù)字600表示有隱含參考圖像加權(quán)的圖像塊的 編碼視頻信號(hào)數(shù)據(jù)的示范處理。處理包括對(duì)輸入塊612通過(guò)控制的啟動(dòng)塊 610。輸入塊612接收完全不壓縮的圖像塊數(shù)據(jù),通過(guò)對(duì)功能塊614的控 制。功能塊614從相對(duì)于圖像塊位置的任一或兩個(gè)方向選擇接收的圖像塊 的第一和第二參考圖像,并通過(guò)對(duì)功能塊616的控制。功能塊616確定圖 像塊和第一和第二參考圖像之間的相對(duì)位置,并通過(guò)對(duì)功能塊618的控 制。功能塊618基于相對(duì)位置計(jì)算圖像塊的各特定參考圖像的隱含加權(quán)因 子。功能塊618通過(guò)對(duì)功能塊620的控制。功能塊620對(duì)當(dāng)前圖像塊的兩 個(gè)參考圖像索引中的每一個(gè),啟動(dòng)程序循環(huán),并通過(guò)對(duì)功能塊622的控制。 功能塊622計(jì)算圖像塊和特定參考圖像的運(yùn)動(dòng)矢量,并通過(guò)對(duì)功能塊624 的控制。功能塊624運(yùn)動(dòng)補(bǔ)償與運(yùn)動(dòng)矢量一致的特定參考圖像,并通過(guò)對(duì) 功能塊626的控制。依次,功能塊626用隱含加權(quán)因子乘以運(yùn)動(dòng)補(bǔ)償?shù)膮?考圖像,形成加權(quán)的運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像,并通過(guò)對(duì)功能塊628的控制。 功能塊628重復(fù)功能塊620的循環(huán),在完成兩次循環(huán)后,通過(guò)對(duì)功能塊 630的控制。
功能塊630形成組合的加權(quán)的運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像,并通過(guò)對(duì)功能塊 632的控制。功能塊632從完全不壓縮的圖像塊減去組合的加權(quán)的運(yùn)動(dòng)補(bǔ) 償?shù)膮⒖紙D像,并通過(guò)對(duì)功能塊634控制。依次,功能塊634隨同特定參 考圖像相應(yīng)的索引一起編碼完全不壓縮的圖像塊和組合的加權(quán)的運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像之間之差的信號(hào),并通過(guò)對(duì)功能塊636的控制。那么,在兩 個(gè)預(yù)測(cè)情況中可以形成當(dāng)前圖像前,后或周圍的兩個(gè)預(yù)測(cè)器。
在運(yùn)算中,隱含加權(quán)因子施加于使用多參考圖像的視頻壓縮編碼器和 解碼器的參考圖像預(yù)測(cè)。當(dāng)塊是雙預(yù)測(cè)編碼的并使用新的隱含模式時(shí),基 于內(nèi)插法/外推法公式,使用從參考圖像到當(dāng)前圖像的距離確定相對(duì)加權(quán) 因子。
對(duì)本發(fā)明的優(yōu)選實(shí)施例,確定隱含雙預(yù)測(cè)的新定義。使用基于編碼的 圖像和它的參考圖像之間距離的內(nèi)插法或外推法公式。對(duì)內(nèi)插法或外推法 使用同樣的公式。如果在顯示次序上兩個(gè)參考圖像是一個(gè)在當(dāng)前編碼的圖 像前一個(gè)在后,公式成為內(nèi)插法公式,如果在顯示次序上兩個(gè)參考圖像是 都在當(dāng)前編碼的圖像前或都在后,公式成為外推法公式。
當(dāng)前圖像是在時(shí)間T要顯示的,參考圖像P。是在時(shí)間T。要顯示的,參 考圖像是P,在時(shí)間T,要顯示的。在隱含模式中,對(duì)雙預(yù)測(cè)編碼的宏塊, 預(yù)測(cè)定義為
Pred=P * (T,-T) / (T,-T。) +P,* (T-T。) / (T,-T。) (公式2)
相對(duì)的顯示時(shí)間值,T,、 T,和T。存在于相關(guān)的圖像的頭文件。在隱含模 式中,WP加權(quán)因子的確定是基于圖像次序計(jì)數(shù)("POC")而不是顯示時(shí) 間。POC存在于或從片段頭中導(dǎo)出。那么,本領(lǐng)域技術(shù)人員可以理解可使 用POC代替顯示時(shí)間。本實(shí)施例說(shuō)明,當(dāng)解碼參考圖像時(shí),也可實(shí)現(xiàn)存儲(chǔ) 來(lái)自參考圖像的此相對(duì)位置信息。存儲(chǔ)T,和To的顯示時(shí)間,同時(shí)解碼圖 像P,和P。。
當(dāng)圖像解碼時(shí),存儲(chǔ)它們的POCs或顯示時(shí)間或位置信息。當(dāng)加權(quán)因子 要計(jì)算時(shí),訪問(wèn)存儲(chǔ)的位置數(shù)據(jù),使用參考圖像索引指出使用哪個(gè)存儲(chǔ)的 位置數(shù)據(jù)。存儲(chǔ)此信息,用于直接模式運(yùn)動(dòng)矢量定標(biāo)。對(duì)直接模式也使用 (T「T)/ (T,-T。)和(T-T。) / OVT())的計(jì)算,可保存和重新使用計(jì)算的結(jié) 果排除重新計(jì)算的要求??梢詫?duì)各編碼的圖像實(shí)現(xiàn)這些除法計(jì)算,每次對(duì) T, T。和T,各值,由常數(shù)因子X(jué)定標(biāo)此結(jié)果,允許更有效的移位運(yùn)算計(jì)算 各象元的Pred值而不是除法運(yùn)算。例如,如果X是256,每次對(duì)各圖像 計(jì)算Z。和Z,如下
Z。= (256* (T「T)) / (T,-T。) (公式3)Z,= (256* (T-T。) ) / (T,-T。) (公式4)
那么,每次對(duì)各象元計(jì)算的Pred為
Pred^P^Zo+P^Z'+^S)))^ (公式5)
可以在此計(jì)算后將Pred值減小到所要求的范圍,典型的為0到255。 也可以減小Z。和Z,值。對(duì)色度系數(shù)能居中在約128的情況下,可使用下 面有代表性的公式
Pred: (P(,-128) * (T「T) / (T,-T()) + (P,-128)) * (T-T(,)) / (T,-T。) +128 (公式
6)
在直接模式中,參考圖像0和參考圖像1的參考索引不是明顯性傳輸 而是導(dǎo)出的。在此情況中,基于T。和T,的導(dǎo)出值計(jì)算加權(quán)因子。當(dāng)在比 特流中的參考圖像索弓I可得到時(shí),可以使用它找到T()和T,。
對(duì)線性衰減的雙預(yù)測(cè)編碼的宏塊,提出的加權(quán)是理想的。在此情況中, 因?yàn)椴恍枰獋魉团c各參考圖像關(guān)聯(lián)的加權(quán)因子的比特,可以獲得比特率的 降低。
對(duì)以下情況,當(dāng)P,是兩個(gè)參考圖像在當(dāng)前圖像前和P。是一個(gè)參考圖像 在當(dāng)前圖像前時(shí),公式默認(rèn)為
Pred=2*P。-P, (公式7)
基于這里公開(kāi)的原理,本領(lǐng)域的技術(shù)人員可以發(fā)現(xiàn)本發(fā)明的這些和其 它的特征和優(yōu)點(diǎn)??梢岳斫獗景l(fā)明的原理可以用各種形式的硬件,軟件, 固件,特殊用途的處理器或它們的組合實(shí)現(xiàn)。
更適宜的,硬件和軟件的組合實(shí)現(xiàn)本發(fā)明。此外,軟件最好是內(nèi)嵌在 程序存儲(chǔ)器單元中的應(yīng)用程序。應(yīng)用程序可以裝入到包括任何合適結(jié)構(gòu)的 機(jī)器上,并由此機(jī)器執(zhí)行。更適宜的,機(jī)器在有硬件,如一個(gè)或多個(gè)中央 處理器("CPU"),隨機(jī)存儲(chǔ)器("RAM"),輸入/輸出接口 ("I/O") 的計(jì)算機(jī)平臺(tái)上實(shí)現(xiàn)。計(jì)算機(jī)平臺(tái)也可包括操作系統(tǒng)和微指令代碼。這里 描述的各種處理和功能可以是CPU執(zhí)行的部分的微指令代碼或部分的應(yīng) 用程序,或它們的任何組合。此外,各種其他的外圍設(shè)備可連接到計(jì)算機(jī) 平臺(tái),如附加的數(shù)據(jù)存儲(chǔ)器和打印設(shè)備。
應(yīng)進(jìn)一步理解,因?yàn)樵诟綀D中描述的一些構(gòu)成系統(tǒng)部件和方法優(yōu)選的 在軟件中實(shí)現(xiàn),根據(jù)本發(fā)明編程的方式,在系統(tǒng)部件或處理功能塊之間的實(shí)際連接可以是不同的。給出了在這里公開(kāi)的本發(fā)明的原理,本領(lǐng)域的技 術(shù)人員能考慮本發(fā)明的這些和同樣的實(shí)施設(shè)備或配置。
雖然這里參考附圖描述例證性的實(shí)施例,應(yīng)理解本發(fā)明不限于那些精 確的實(shí)施例,本領(lǐng)域的技術(shù)人員不離開(kāi)本發(fā)明的范圍或精神,可以實(shí)現(xiàn)各 種改變和修改。所有這些改變和修改都包括在所附權(quán)利要求中闡明的本發(fā) 明的范圍或精神中。
權(quán)利要求
1.一種編碼圖像塊的視頻信號(hào)數(shù)據(jù)的方法(600),方法包括接收(612)完全不壓縮的圖像塊數(shù)據(jù);響應(yīng)圖像塊和由第一和第二參考圖像索引指示的第一和第二參考圖像之間內(nèi)相對(duì)位置,計(jì)算(614,616,618)圖像塊的隱含加權(quán)因子;計(jì)算(622)圖像塊和各第一和第二參考圖像的運(yùn)動(dòng)矢量;運(yùn)動(dòng)補(bǔ)償(624)與各自運(yùn)動(dòng)矢量一致的各第一和第二參考圖像;用計(jì)算的隱含加權(quán)因子乘以(626)各運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像,形成加權(quán)的運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像;組合(630)各加權(quán)的運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像為組合的加權(quán)的運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像;從完全不壓縮的圖像塊減去(632)組合的加權(quán)的運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像;隨同第一和第二參考圖像相應(yīng)的索引一起,編碼(634)表示在完全不壓縮的圖像塊和組合的加權(quán)的運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像之間之差的信號(hào)。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于計(jì)算隱含加權(quán)因子包括至 少以下方法之一對(duì)在顯示次序上安排一個(gè)在圖像塊前一個(gè)在后的兩個(gè)參考圖像的部分 之間內(nèi)插;從在顯示次序上安排都在圖像塊前或都在后的兩個(gè)參考圖像的部分外 推。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于運(yùn)動(dòng)補(bǔ)償各檢索的參考圖 像包括確定檢索的參考圖像相對(duì)于圖像塊的運(yùn)動(dòng)矢量。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于還包括 編碼在圖像塊的片段頭字段中的圖像次序計(jì)數(shù),用于計(jì)算圖像塊和多個(gè)參考圖像的隱含加權(quán)因子。
5. 根據(jù)權(quán)利要求l所述的方法,其特征在于圖像塊和多個(gè)參考圖像的 相對(duì)位置相當(dāng)于各個(gè)圖像的相對(duì)顯示時(shí)間。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于計(jì)算運(yùn)動(dòng)矢量包括在預(yù)先確定的相對(duì)于圖像塊的偏移范圍中在每個(gè)位移的搜索區(qū)域中測(cè)試;計(jì)算在具有運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像的圖像塊中各象元的絕對(duì)差和均方誤差之和之中的至少一個(gè);選擇與最小的絕對(duì)差和均方誤差之和的偏移量為運(yùn)動(dòng)矢量。
全文摘要
公開(kāi)了一種視頻解碼器(200)、編碼器(500)和處理有兩個(gè)預(yù)測(cè)圖像塊的參考圖像索引的圖像塊的視頻信號(hào)數(shù)據(jù)相應(yīng)的方法,其利用參考圖像的隱含加權(quán)增強(qiáng)視頻壓縮,其中解碼器(200)包括隱含參考圖像加權(quán)因子單元(280),確定相應(yīng)于各參考圖像索引的加權(quán)因子;編碼器(500)包括隱含參考圖像分配器(572),分配相應(yīng)于各參考圖像索引的加權(quán)因子;解碼方法包括隨相應(yīng)于圖像塊的數(shù)據(jù)接收參考圖像索引,響應(yīng)圖像塊和由參考圖像索引指示的參考圖像的相對(duì)位置,確定隱含加權(quán)因子,檢索各索引的參考圖像,運(yùn)動(dòng)補(bǔ)償檢索的參考圖像,用相應(yīng)的加權(quán)因子乘以運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像,形成加權(quán)的運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像。
文檔編號(hào)H04B7/12GK101527853SQ20091011857
公開(kāi)日2009年9月9日 申請(qǐng)日期2003年9月10日 優(yōu)先權(quán)日2002年10月1日
發(fā)明者吉爾·麥克唐納·博伊斯 申請(qǐng)人:湯姆森許可貿(mào)易公司