專利名稱:用于視頻編碼中單向預測和雙向預測的不同權重的制作方法
技術領域:
本發(fā)明涉及視頻編碼,且更明確地說,涉及為B-視頻塊使用雙向加權預測且為 P-視頻塊使用單向加權預測的關于B-單元的視頻編碼技術。
背景技術:
數(shù)字多媒體能力可并入到寬范圍的裝置中,包含數(shù)字電視、數(shù)字直播系統(tǒng)、無線通信裝置、無線廣播系統(tǒng)、個人數(shù)字助理(PDA)、膝上型或桌上型計算機、數(shù)字相機、數(shù)字記錄裝置、視頻游戲裝置、視頻游戲控制臺、蜂窩式或衛(wèi)星無線電電話、數(shù)字媒體播放器及其類似者。數(shù)字多媒體裝置可實施視頻編碼技術(例如MPEG-2、ITU-H. 263, MPEG-4,或 ITU-H. ^4/MPEG-4第10部分、高級視頻編碼(AVC)),以更有效地發(fā)射和接收或存儲和檢索數(shù)字視頻數(shù)據(jù)。視頻編碼技術可經(jīng)由空間預測和時間預測來執(zhí)行視頻壓縮,以減少或去除視頻序列中固有的冗余。在視頻編碼過程中,壓縮通常包含空間預測、運動估計和運動補償。幀內(nèi)編碼依賴于空間預測和變換編碼(例如離散余弦變換(DCT)編碼),以減少或去除給定視頻幀內(nèi)視頻塊之間的空間冗余。幀間編碼依賴于時間預測和變換編碼,以減少或去除視頻序列的連續(xù)視頻幀的視頻塊之間的時間冗余。經(jīng)幀內(nèi)編碼的幀(“I-幀”)通常用作隨機存取點以及其它幀的幀間編碼的參考。然而,I-幀通常展現(xiàn)比其它幀少的壓縮。術語I-單元可指代 I-幀、I-片段(I-slice)或I-幀的其它可獨立解碼的部分。對于幀間編碼來說,視頻編碼器執(zhí)行運動估計以追蹤兩個或兩個以上相鄰幀或其它經(jīng)編碼單元(例如幀的片段)之間的匹配視頻塊的移動。經(jīng)幀間編碼的幀可包括預測幀(“P-幀”),其可包含從先前幀預測的塊;和雙向預測幀(“B-幀”),其可包含從視頻序列的先前幀和隨后幀預測的塊。在早期的編碼技術將預測限制于特定方向的意義上,術語 P-幀和B-幀是稍有歷史性的。較新的編碼格式和標準可不限制P-幀和B-幀的預測方向。 因此,術語“雙向”現(xiàn)指代基于兩個或兩個以上的參考數(shù)據(jù)列表進行的預測,不管此類參考數(shù)據(jù)與所編碼的數(shù)據(jù)的時間關系。與較新視頻標準(例如ITU H. 264) 一致,舉例來說,雙向預測可基于兩個不同列表,所述兩個不同列表未必需要具有在時間上位于當前視頻塊之前和之后的數(shù)據(jù)。換句話說,可從兩個數(shù)據(jù)列表來預測B-視頻塊,所述兩個數(shù)據(jù)列表可對應于來自兩個先前幀、兩個隨后幀或一個先前幀和一個隨后幀的數(shù)據(jù)。相反,單向預測指代基于一個列表(即,一個數(shù)據(jù)結構)來預測P-視頻塊,所述列表可對應于一個預測幀(例如,一個先前幀或一個隨后幀)。B-幀和P-幀可更通常稱為P-單元和B-單元。P-單元和B-單元也可體現(xiàn)為較小的經(jīng)編碼單元,例如幀的片段或幀的部分。B-單元可包含B-視頻塊、P-視頻塊或I-視頻塊。P-單元可包含P-視頻塊或I-視頻塊。I-單元可僅包含I-視頻塊。對于P-視頻塊和B-視頻塊來說,運動估計產(chǎn)生運動向量,其指示所述視頻塊相對于預測參考幀或其它經(jīng)編碼單元中的相應預測視頻塊的移位。運動補償使用所述運動向量來從所述預測參考幀或其它經(jīng)編碼單元來產(chǎn)生預測視頻塊。在運動補償之后,通過從待編碼的原始視頻塊減去預測視頻塊來形成殘余視頻塊。視頻編碼器通常應用變換、量化和熵編碼過程來進一步減少與殘余塊的通信相關聯(lián)的位速率。I-單元和P-單元通常用于定義用于P-單元和B-單元的幀間編碼的參考塊。
發(fā)明內(nèi)容
本發(fā)明描述可適用于雙向預測和單向預測的視頻編碼和解碼技術。在雙向預測過程中,基于兩個不同預測參考數(shù)據(jù)列表來對視頻塊進行預測性編碼和解碼,而在單向預測過程中,基于一個預測參考數(shù)據(jù)列表來對視頻塊進行預測性編碼和解碼。顯式加權預測通常指代依賴于在編碼器處定義并在位流中傳達的顯式權重的單向預測或雙向預測。將所述權重應用于預測參考數(shù)據(jù)的像素值,以定義在視頻數(shù)據(jù)的編碼和解碼中所使用的加權參考數(shù)據(jù)。本發(fā)明中所描述的技術提供單向預測權重與雙向預測權重的解耦,尤其對于 B-單元內(nèi)的視頻塊的顯式加權預測。根據(jù)本發(fā)明,在位流中傳達的顯式權重可由解碼器應用于顯式雙向預測,但可將不同權重(其可為缺省權重或獨立定義的顯式單向權重)用于顯式單向預測。所描述的技術可相對于將相同顯式權重用于B-單元內(nèi)的顯式雙向預測和顯式單向預測的技術而改進視頻質(zhì)量。在一個實例中,本發(fā)明描述一種在視頻解碼器中對視頻數(shù)據(jù)解碼的方法。所述方法包括在所述視頻解碼器處接收經(jīng)編碼單元,其中所述經(jīng)編碼單元包含指示在所述經(jīng)編碼單元中的一個或一個以上視頻塊的顯式加權預測期間將應用的顯式權重的語法元素;經(jīng)由所述視頻解碼器將所述顯式權重應用于所述經(jīng)編碼單元中的一個或一個以上雙向視頻塊的雙向顯式加權預測;以及經(jīng)由所述視頻解碼器將一個或一個以上不同權重應用于所述經(jīng)編碼單元中的一個或一個以上單向視頻塊的單向顯式加權預測。在另一實例中,本發(fā)明描述一種在視頻編碼器中對視頻數(shù)據(jù)編碼的方法。所述方法包括在所述視頻編碼器處對經(jīng)編碼單元編碼,其中所述經(jīng)編碼單元包含指示在所述經(jīng)編碼單元中的一個或一個以上視頻塊的顯式加權預測期間將應用的顯式權重的語法元素; 經(jīng)由所述視頻編碼器基于所述顯式權重對所述經(jīng)編碼單元中的一個或一個以上雙向視頻塊編碼;以及經(jīng)由所述視頻編碼器基于一個或一個以上不同權重對所述經(jīng)編碼單元中的一個或一個以上單向視頻塊編碼。在另一實例中,本發(fā)明描述一種視頻解碼設備,其包括熵單元,其接收經(jīng)編碼單元且對所述經(jīng)編碼單元的一個或一個以上語法元素解碼,其中所述語法元素指示在所述經(jīng)編碼單元中的一個或一個以上視頻塊的顯式加權預測期間將應用的顯式權重;以及預測單元,其將所述顯式權重應用于所述經(jīng)編碼單元中的一個或一個以上雙向視頻塊的雙向顯式加權預測,以及將一個或一個以上不同權重應用于所述經(jīng)編碼單元中的一個或一個以上單向視頻塊的單向顯式加權預測。在另一實例中,本發(fā)明描述一種對視頻數(shù)據(jù)編碼的視頻編碼設備。所述設備包括 存儲器,其存儲所述視頻數(shù)據(jù)和用以對所述視頻數(shù)據(jù)進行預測性編碼的兩個或兩個以上數(shù)據(jù)列表;以及預測單元,其對經(jīng)編碼單元編碼,其中所述經(jīng)編碼單元包含指示在所述經(jīng)編碼單元中的一個或一個以上視頻塊的顯式加權預測期間將應用的顯式權重的語法元素,基于所述顯式權重對所述經(jīng)編碼單元中的一個或一個以上雙向視頻塊編碼,以及基于一個或一個以上不同權重對所述經(jīng)編碼單元中的一個或一個以上單向視頻塊編碼。在另一實例中,本發(fā)明描述一種對視頻數(shù)據(jù)解碼的裝置,所述裝置包括用于接收經(jīng)編碼單元的裝置,其中所述經(jīng)編碼單元包含指示所述經(jīng)編碼單元中的一個或一個以上視頻塊的顯式加權預測期間將應用的顯式權重的語法元素;用于將所述顯式權重應用于所述經(jīng)編碼單元中的一個或一個以上雙向視頻塊的雙向顯式加權預測的裝置;以及用于將一個或一個以上不同權重應用于所述經(jīng)編碼單元中的一個或一個以上單向視頻塊的單向顯式加權預測的裝置。在另一實例中,本發(fā)明描述一種對視頻數(shù)據(jù)編碼的裝置,所述裝置包括用于對經(jīng)編碼單元編碼的裝置,其中所述經(jīng)編碼單元包含指示在所述經(jīng)編碼單元中的一個或一個以上視頻塊的顯式加權預測期間將應用的顯式權重的語法元素;用于基于所述顯式權重對所述經(jīng)編碼單元中的一個或一個以上雙向視頻塊編碼的裝置;以及用于基于一個或一個以上不同權重對所述經(jīng)編碼單元中的一個或一個以上單向視頻塊編碼的裝置??梢杂布?、軟件、固件或其任何組合來實施本發(fā)明中所描述的技術。如果以軟件來實施,那么可在一個或一個以上處理器(例如微處理器、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)或數(shù)字信號處理器(DSP))中執(zhí)行軟件。執(zhí)行所述技術的軟件最初可存儲于計算機可讀存儲媒體中且加載所述處理器中并在所述處理器中執(zhí)行。因此,本發(fā)明亦描述一種計算機可讀存儲媒體,其包括在執(zhí)行時使處理器對視頻數(shù)據(jù)解碼的指令。在接收到包含指示在所述經(jīng)編碼單元中的一個或一個以上視頻塊的顯式加權預測期間將應用的顯式權重的語法元素的經(jīng)編碼單元后,所述指令即刻使所述處理器將所述顯式權重應用于所述經(jīng)編碼單元中的一個或一個以上雙向視頻塊的雙向顯式加權預測,以及將一個或一個以上不同權重應用于所述經(jīng)編碼單元中的一個或一個以上單向視頻塊的單向顯式加權預測。另外,本發(fā)明描述一種計算機可讀存儲媒體,其包括在執(zhí)行時使處理器對視頻數(shù)據(jù)編碼的指令,其中所述指令使所述處理器對經(jīng)編碼單元編碼,所述經(jīng)編碼單元包含指示在所述經(jīng)編碼單元中的一個或一個以上視頻塊的顯式加權預測期間將應用的顯式權重的語法元素;基于所述顯式權重對所述經(jīng)編碼單元中的一個或一個以上雙向視頻塊編碼;以及基于一個或一個以上不同權重對所述經(jīng)編碼單元中的一個或一個以上單向視頻塊編碼。本發(fā)明的一個或一個以上方面的細節(jié)陳述于附圖和下文的描述中。本發(fā)明中所描述的技術的其它特征、目標和優(yōu)點將從具體實施方式
和圖式且從權利要求書而變得顯而易見。
圖1是說明可實施本發(fā)明的技術的一個例示性視頻編碼和解碼系統(tǒng)的框圖。圖2是說明與本發(fā)明一致的可執(zhí)行加權預測技術的視頻編碼器的實例的框圖。圖3是更詳細地說明運動補償單元的實例的框圖。圖4是說明與本發(fā)明一致的可執(zhí)行加權預測技術的視頻解碼器的實例的框圖。圖5和圖6是說明與本發(fā)明一致的可由視頻解碼器執(zhí)行的例示性過程的流程圖。圖7是說明與本發(fā)明一致的可由視頻編碼器執(zhí)行的例示性過程的流程圖。
具體實施例方式本發(fā)明描述可應用于雙向經(jīng)編碼單元(例如,B-單元)的視頻編碼和解碼技術,雙向經(jīng)編碼單元例如B-幀、B-片段或至少包含基于兩個不同預測參考數(shù)據(jù)列表來預測的一些視頻塊的其它獨立編碼的單元。B-單元可包含許多不同類型的視頻塊,包含基于兩個不同預測參考數(shù)據(jù)列表編碼和解碼的B-視頻塊、基于預測參考數(shù)據(jù)列表編碼和解碼的P-視頻塊,和基于所述相同經(jīng)編碼單元內(nèi)的幀內(nèi)數(shù)據(jù)編碼的I-視頻塊。已開發(fā)并應用于例如ITU H. 264的編碼標準中的一種編碼技術稱作加權預測。加權預測指代一個或一個以上權重(有時稱作權重因子)經(jīng)指派給預測數(shù)據(jù)的預測。在此情況下,可根據(jù)權重因子對預測參考數(shù)據(jù)加權以便定義加權預測參考數(shù)據(jù)。加權預測通常應用于B-單元,且尤其B-單元內(nèi)的B-視頻塊,但還可應用于P-單元或其它經(jīng)編碼單元。在 B-單元內(nèi)的B-視頻塊的情況下,可將權重指派給所述兩個不同預測數(shù)據(jù)列表以便對預測參考數(shù)據(jù)加權(所述預測參考數(shù)據(jù)接著用以對B-視頻塊編碼),使得可形成改進的預測參考數(shù)據(jù)。常規(guī)地,在將加權預測用于B-單元時,將指派到不同數(shù)據(jù)列表的相同權重應用于所述B-單元內(nèi)的B-視頻塊的雙向預測和所述B-單元內(nèi)的P-視頻塊的單向預測。在此情形中,還存在不同類型的加權預測,其可稱作顯式加權預測、隱式加權預測和缺省加權預測。顯式加權預測和隱式加權預測可對應于ITU H. 264中定義的不同加權預測模式。缺省加權預測可為顯式加權預測的特定情況,其中權重因子由缺省設置來定義。顯式加權預測指代權重因子作為編碼過程的一部分而加以動態(tài)地定義且編碼到位流中的加權預測。隱式加權預測指代在加權預測中基于與數(shù)據(jù)相關聯(lián)的一些隱式因子來定義與兩個或兩個以上不同列表相關聯(lián)的權重因子的加權預測。舉例來說,可通過所述兩個不同列表中的數(shù)據(jù)相對于經(jīng)預測性編碼的數(shù)據(jù)的時間位置來定義隱式權重因子。如果列表0中的數(shù)據(jù)比列表1中的數(shù)據(jù)在時間上更接近于經(jīng)預測性編碼的數(shù)據(jù),那么在隱式加權預測中列表0中的數(shù)據(jù)可經(jīng)指派較大的隱式權重因子。可相對于所述不同參考數(shù)據(jù)(例如, 參考像素數(shù)據(jù))列表中的原始數(shù)據(jù)應用所述權重因子以便以加權方式調(diào)整預測參考數(shù)據(jù), 從而促使參考數(shù)據(jù)比在無權重的情況下所另外達成的參考數(shù)據(jù)更類似于經(jīng)編碼數(shù)據(jù)。如所提及,缺省加權預測指代在加權預測中由某缺省設置來預定義與兩個或兩個以上不同列表相關聯(lián)的權重因子的加權預測。在一些情況下,缺省加權預測可將相等權重指派到所述列表中的每一者。缺省權重可在位流中傳達(如同顯式權重),或在一些情況下,可從位流排除且在編碼器和解碼器處得知。與缺省權重(其對于不同情節(jié)通常為靜態(tài)的)不同,顯式權重可基于對加權預測數(shù)據(jù)的分析來定義,以便促進可促進改進壓縮的較高質(zhì)量的預測數(shù)據(jù)。在一些情況下,缺省加權預測或顯式加權預測用在編碼器處以定義將針對經(jīng)編碼單元而傳達的權重。在此情況下,解碼器可將這兩個情節(jié)處理為相同編碼模式 (例如,顯式加權預測模式的不同版本)。針對所述經(jīng)編碼單元在位流中發(fā)射的權重對于缺省加權預測來說是基于缺省設置來定義的,且對于顯式加權預測來說是基于對預測數(shù)據(jù)的分析來定義的。根據(jù)本發(fā)明,在位流中傳達的顯式權重可由解碼器應用于顯式雙向預測,但可將不同權重(其可為缺省權重或獨立定義的顯式單向權重)用于顯式單向預測。以此方式, B-單元內(nèi)的B-視頻塊的雙向預測和所述B-單元內(nèi)的P-視頻塊的單向預測可應用不同權重因子。常規(guī)地,在定義和用信號發(fā)射用于B-單元的加權預測時,將指派到不同數(shù)據(jù)列表的相同權重應用于所述B-單元內(nèi)的B-視頻塊的雙向預測和所述B-單元內(nèi)的P-視頻塊的單向預測。本發(fā)明的技術認可可通過消除這些常規(guī)約束來改進編碼效率和編碼質(zhì)量。圖1是說明可實施本發(fā)明的技術的一個例示性視頻編碼和解碼系統(tǒng)10的框圖。如圖1所示,系統(tǒng)10包含經(jīng)由通信信道15將經(jīng)編碼視頻發(fā)射到目的裝置16的源裝置12。源裝置12和目的裝置16可包括寬范圍的裝置中的任一者。在一些情況下,源裝置12和目的裝置16包括無線通信裝置,例如無線手機、所謂的蜂窩式或衛(wèi)星無線電電話,或可在通信信道15上傳達視頻信息的任何裝置,其可能或可能不為無線的。然而,本發(fā)明的技術(其涉及用于B-單元內(nèi)的視頻塊的顯式加權預測的單向預測權重與雙向預測權重的解耦)未必限于無線應用或設置。在圖1的實例中,源裝置12可包含視頻源20、視頻編碼器22、調(diào)制器/解調(diào)器(調(diào)制解調(diào)器)23和發(fā)射器M。目的裝置16可包含接收器沈、調(diào)制解調(diào)器27、視頻解碼器觀和顯示裝置30。根據(jù)本發(fā)明,源裝置12的視頻編碼器22可經(jīng)配置以基于顯式權重對經(jīng)編碼單元中的一個或一個以上雙向視頻塊編碼,以及基于一個或一個以上不同權重對經(jīng)編碼單元中的一個或一個以上單向視頻塊編碼。同樣,視頻解碼器觀可將顯式權重應用于經(jīng)編碼單元中的一個或一個以上雙向視頻塊的雙向顯式加權預測,以及可經(jīng)由所述視頻解碼器將一個或一個以上不同權重應用于經(jīng)編碼單元中的一個或一個以上單向視頻塊的單向顯式加權預測。圖1所說明的系統(tǒng)10僅為例示性的。本發(fā)明的技術可由支持單向和雙向運動補償預測的任何編碼裝置執(zhí)行。源裝置12和目的裝置16僅為此類編碼裝置的實例,其中源裝置12產(chǎn)生經(jīng)編碼視頻數(shù)據(jù)以供發(fā)射到目的裝置16。在一些情況下,裝置12、16可以實質(zhì)上對稱的方式來操作,使得裝置12、16中的每一者包含視頻編碼和解碼組件。因此,系統(tǒng) 10可支持視頻裝置12、16之間的單向或雙向視頻發(fā)射,例如,用于視頻流、視頻重放、視頻廣播或視頻電話。源裝置12的視頻源20可包含視頻捕獲裝置,例如視頻相機、含有先前捕獲的視頻的視頻檔案或來自視頻內(nèi)容提供者的視頻饋送。作為另一替代方案,視頻源20可產(chǎn)生基于計算機圖形的數(shù)據(jù)作為源視頻或實況視頻、存檔視頻和計算機產(chǎn)生的視頻的組合。在一些情況下,如果視頻源20為視頻相機,那么源裝置12和目的裝置16可形成所謂的相機電話或視頻電話。在每一情況下,可通過視頻編碼器22來對所捕獲、預先捕獲或計算機產(chǎn)生的視頻編碼。可接著根據(jù)通信標準(例如,碼分多址(CDMA))或另一通信標準通過調(diào)制解調(diào)器23來調(diào)制所述經(jīng)編碼視頻信息,并經(jīng)由發(fā)射器M將所述經(jīng)編碼視頻信息發(fā)射到目的裝置16。調(diào)制解調(diào)器23可包含各種混頻器、濾波器、放大器或經(jīng)設計以用于信號調(diào)制的其它組件。發(fā)射器M可包含經(jīng)設計以用于發(fā)射數(shù)據(jù)的電路,包含放大器、濾波器和一個或一個以上天線。目的裝置16的接收器沈在信道15上接收信息,且調(diào)制解調(diào)器27對所述信息解調(diào)制。此外,視頻編碼過程可實施本文所描述的技術中的一者或多者,以使雙向預測權重與單向預測權重解耦。與本發(fā)明一致,在信道15上傳達的信息可包含用以定義權重因子的由視頻編碼器22定義的信息,且此信息可由視頻解碼器觀使用。顯示裝置30向用戶顯示經(jīng)解碼的視頻數(shù)據(jù),且可包括各種顯示裝置中的任一者,例如陰極射線管、液晶顯示器(LCD)、 等離子顯示器、有機發(fā)光二極管(OLED)顯示器,或另一類型的顯示裝置。
10
在圖1的實例中,通信信道15可包括任何無線或有線通信媒介,例如射頻(RF)頻譜或一個或一個以上物理傳輸線,或無線和有線媒介的任何組合。因此,調(diào)制解調(diào)器23和發(fā)射器M可支持許多可能無線協(xié)議、有線協(xié)議或有線和無線協(xié)議。通信信道15可形成基于包的網(wǎng)絡(例如,局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)或例如因特網(wǎng)的全球網(wǎng)絡)的部分,其包括一個或一個以上網(wǎng)絡的互連。通信信道15通常表示用于將視頻數(shù)據(jù)從源裝置12發(fā)射到目的裝置16的任何合適通信媒介或不同通信媒介的集合。通信信道15可包含路由器、交換器、基站或可用于促進從源裝置12到目的裝置16的通信的任何其它設備。視頻編碼器22和視頻解碼器28可根據(jù)視頻壓縮標準(例如ITU-T H. 264標準, 替代地描述為MPEG-4第10部分、高級視頻編碼(AVC))來操作。然而,本發(fā)明的技術不限于任何特定編碼標準。此外,在一些方面,本發(fā)明的技術可不依照ITU-T H. 264標準,因為 ITU-T H. 264標準可定義將用于單向預測和雙向預測的相同權重因子。舉例來說,在ITU-T H. 264中,可為兩個不同預測數(shù)據(jù)列表定義兩個顯式權重。在此情況下,如果使用雙向預測, 那么應用兩個權重。如果使用單向預測,那么僅應用所述權重中的一者(即,對應于用于彼單向預測的列表的權重)。本發(fā)明的技術可包括傳達四個不同權重(即,用于雙向預測的兩個權重和用于單向預測的兩個權重)。然而,在一些情況下,單向權重可為未經(jīng)傳達而是僅在解碼器處得知和應用的缺省權重。在一些情況下,單向權重(尤其此類權重為缺省權重時)可在位流中傳達。在其它情況下,單向權重可在解碼器處得知和應用而未在位流中傳達。盡管圖1中未展示,但在一些方面中,視頻編碼器22和視頻解碼器觀可各自與音頻編碼器和解碼器集成,且可包含適當MUX-DEMUX單元或其它硬件和軟件,以處置對共同數(shù)據(jù)流或獨立數(shù)據(jù)流中的音頻和視頻兩者的編碼。如果適用,MUX-DEMUX單元可遵照ITU H. 223多任務器協(xié)議,或例如用戶數(shù)據(jù)報協(xié)議(UDP)的其它協(xié)議。ITU-T H. 264/MPEG-4 (AVC)標準由 ITU-T 視頻編碼專家組(VCEG)連同 IS0/IEC 運動圖像專家組(MPEG)制定,作為被稱為聯(lián)合視頻組(JVT)的集體合伙的產(chǎn)品。在一些方面中,本發(fā)明所描述的技術可應用于大體上遵照H. 264標準的裝置。H. 264標準描述于 ITU-T研究組的注明日期為2005年3月的ITU-T推薦H.沈4、一般視聽服務的高級視頻編石馬(Advanced Video Coding for generic audiovisual services)中,其在本文中可禾爾作H. 264標準或H. 264規(guī)范或H. 264/AVC標準或規(guī)范。聯(lián)合視頻組(JVT)繼續(xù)致力于擴展 H. 264/MPEG-4AVC0在ITU-T的各種網(wǎng)絡論壇中進行推進H. 264/MPEG-4AVC標準的工作,例如“ Key Technologies Area(KTA),,網(wǎng)絡論壇。KTA網(wǎng)絡論壇部分地尋求展現(xiàn)比H. 264/AVC標準所展現(xiàn)的編碼效率高的編碼效率的編碼技術。本發(fā)明所描述的技術可提供相對于H. 264/AVC 標準的編碼改進,但如本申請案的歸檔處所定義的,所述技術可不依照H. ^4/AVC標準。視頻編碼器22和視頻解碼器觀各自可實施為一個或一個以上微處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)、離散邏輯、軟件、硬件、 固件或其任何組合。視頻編碼器22和視頻解碼器觀中的每一者可包含于一個或一個以上編碼器或解碼器中,其任一者可集成為在相應的移動裝置、用戶裝置、廣播裝置、服務器或其類似者中的組合編碼器/解碼器(CODEC)的部分。視頻序列通常包含一連串視頻幀。視頻編碼器22和視頻解碼器觀可對個別視頻幀內(nèi)的視頻塊操作,以便對視頻數(shù)據(jù)編碼和解碼。視頻塊可具有固定或變化的大小,且可根據(jù)特定編碼標準而在大小方面不同。每一視頻幀可包含一連串片段或其它可獨立解碼的單元。每一片段可包含一連串宏塊,宏塊可經(jīng)布置成子塊。作為實例,ITU-T H. 264標準支持各種塊大小(例如,用于亮度(Iuma)分量的16乘16、8乘8或4乘4,以及用于色度 (chroma)分量的8乘8)的幀內(nèi)預測,以及各種塊大小(例如,用于亮度分量的16乘16、16 乘8、8乘16、8乘8、8乘4、4乘8和4乘4,以及用于色度分量的相應經(jīng)縮放的大小)的幀間預測。舉例來說,在例如離散余弦變換(DCT)編碼或概念類似的變換過程的變換過程之后,視頻塊可包括像素數(shù)據(jù)的塊或變換系數(shù)的塊。較小視頻塊可提供較佳分辨率,且可用于包含高細節(jié)層次的視頻幀的定位。大體上,可將宏塊和各種子塊看作視頻塊。另外,可將片段看作一連串視頻塊,例如宏塊和/或子塊。每一片段可為視頻幀的可獨立解碼單元?;蛘?,幀自身可為可解碼單元,或幀的其它部分可被定義為可解碼單元。術語“經(jīng)編碼單元”指代視頻幀的任何可獨立解碼單元,例如整個幀、幀的片段、圖像群組(GOP)或根據(jù)所使用的編碼技術定義的另一可獨立解碼單元。在基于幀間的預測編碼(其包含使用不同權重因子的單向加權預測和雙向加權預測)之后,且在任何變換(例如在H. ^4/AVC中所使用的4x4或8x8整數(shù)變換或離散余弦變換或DCT)之后,可執(zhí)行量化。量化通常指代將殘余變換系數(shù)量化以減少用于表示所述系數(shù)的位的數(shù)目的過程。所述量化過程可減少與所述系數(shù)中的一些或所有相關聯(lián)的位深度。 舉例來說,在量化期間,可將16位值下舍入到15位值。在量化之后,可(例如)根據(jù)內(nèi)容自適應可變長度編碼(CAVLC)、內(nèi)容自適應二進制算術編碼(CABAC)或另一熵編碼方法來執(zhí)行熵編碼。本發(fā)明的技術特別適用于B-單元的視頻塊的加權預測。在此情況下,對用于對視頻塊編碼的預測數(shù)據(jù)加權以調(diào)整預測數(shù)據(jù)的像素值以定義加權預測數(shù)據(jù)。根據(jù)本發(fā)明,并非為不同預測數(shù)據(jù)列表(例如,列表0和列表1)指派一組權重,視頻編碼器22可為所述不同列表指派兩組不同權重,一組權重用于雙向預測,且另一組權重用以定義單向預測中所使用的用于不同列表的權重。如上文所提及,雙向預測為基于兩個不同數(shù)據(jù)列表的所謂“B-視頻塊”的預測??蓮膩碜詢蓚€先前幀的兩個數(shù)據(jù)列表、來自隨后幀的兩個數(shù)據(jù)列表或來自先前幀的一個數(shù)據(jù)列表和來自隨后幀的一個數(shù)據(jù)列表來預測B-視頻塊。相反,單向預測指代基于一個列表來預測P-視頻塊,所述列表可對應于一個預測幀(例如,一個先前幀或一個隨后幀)。B-幀和P-幀可更通常稱為P-單元和B-單元。P-單元和B-單元也可體現(xiàn)為較小的經(jīng)編碼單元,例如幀的片段或幀的部分。B-單元可包含B-視頻塊、P-視頻塊或I-視頻塊。P-單元可包含P-視頻塊或ι-視頻塊。ι-單元可僅包含I-視頻塊。加權雙向預測指代允許權重因子經(jīng)指派到兩個不同列表的雙向預測。每一列表可包括與預測幀或其它經(jīng)編碼單元相關聯(lián)的一組數(shù)據(jù)(例如,像素值)。在加權雙向預測中, 在產(chǎn)生加權預測數(shù)據(jù)過程中,一個列表可被給予更多權重。舉例來說,如果所述列表中的一者具有較類似于經(jīng)編碼的視頻塊的數(shù)據(jù),那么在定義基于所述兩個列表的加權預測數(shù)據(jù)的過程中,所述列表可被給予比另一列表更多的權重。在加權單向預測中,可將給定列表的給定權重因子應用于預測數(shù)據(jù)??蓪⒉煌瑱嘀貞糜谒霾煌斜恚诖饲闆r下,給定單向預測將僅使用對應于用于所述單向預測的數(shù)據(jù)列表的一個權重。根據(jù)本發(fā)明,針對單向預測為所述兩個數(shù)據(jù)列表定義的權重將不同于針對雙向預測定義的權重。如本發(fā)明申請時所陳述,所述技術可不依照ITUH. 2640對于不同類型的加權雙向預測來說,根據(jù)ITU-T H. 264,視頻編碼器22和視頻解碼器觀可通常支持三種不同類型的預測模式。顯式加權預測指代權重因子是作為編碼過程的部分而加以動態(tài)地定義且編碼到位流中的加權預測。在此方面,顯式加權預測不同于隱式加權預測,例如,顯式加權預測導致經(jīng)編碼成位流的部分的權重因子。隱式加權預測指代在加權預測中基于與數(shù)據(jù)相關聯(lián)的一些隱式因子來定義與兩個或兩個以上不同列表相關聯(lián)的權重因子的加權預測。舉例來說,可通過所述兩個不同列表中的數(shù)據(jù)相對于經(jīng)預測性編碼的數(shù)據(jù)的相對時間位置來定義隱式權重因子。在隱式加權預測中,權重因子不包含在位流中。而是,視頻解碼器觀可經(jīng)編程以導出隱式權重因子。缺省加權預測指代在加權預測中由某缺省設置來預定義與兩個或兩個以上不同列表相關聯(lián)的權重因子的加權預測。在一些情況下,缺省加權預測可將相等權重指派到所述列表中的每一者。在缺省加權預測中,權重因子可隨位流發(fā)送,或可在編碼器和解碼器處預定義且不在位流中發(fā)送。當缺省權重因子在位流中發(fā)送時,可將缺省預測模式看作顯式預測模式的特殊情況(上文所解釋)。因此,也可將缺省預測描述為顯式預測模式的缺省權重的應用。在此情況下,可說成僅存在兩個不同加權預測模式(例如,顯式和隱式),但顯式模式可支持缺省權重或顯式定義的權重。圖2是說明可執(zhí)行與本發(fā)明一致的技術的視頻編碼器50的實例的框圖。視頻編碼器50可對應于源裝置12的視頻編碼器22或不同裝置的視頻編碼器。視頻編碼器50可對視頻幀內(nèi)的塊執(zhí)行幀內(nèi)和幀間編碼,盡管為易于說明而未在圖2中展示幀內(nèi)編碼組件。幀內(nèi)編碼依賴于空間預測以減少或去除給定視頻幀內(nèi)視頻的空間冗余。幀間編碼依賴于時間預測以減少或去除視頻序列的相鄰幀內(nèi)視頻的時間冗余。幀內(nèi)模式(I-模式)可指代基于空間的壓縮模式,且例如預測(P-模式)或雙向(B-模式)的幀間模式可指代基于時間的壓縮模式。如圖2中所示,視頻編碼器50接收視頻幀或片段內(nèi)的待編碼的當前視頻塊。在圖 2的實例中,視頻編碼器50包含預測單元31,預測單元31包括運動估計單元32和運動補償單元35。視頻編碼器50還包含存儲器34、加法器48、變換單元38、量化單元40和熵編碼單元46。對于視頻塊重新建構來說,視頻編碼器50還包含反向量化單元42、反向變換單元44和加法器51。視頻編碼器50還可包含解塊濾波器(未圖示),以對塊邊界濾波以從重新建構的視頻中去除塊效應。如果需要,所述解塊濾波器將通常對加法器51的輸出濾波。在編碼過程期間,視頻編碼器50接收待編碼的視頻塊,且運動估計單元32和運動補償單元35執(zhí)行幀間預測編碼。運動估計單元32和運動補償單元35可高度集成,但為概念目的而對其進行獨立說明。通常將運動估計看作產(chǎn)生運動向量的過程,所述運動向量估計視頻塊的運動。舉例來說,運動向量可指示預測幀(或另一經(jīng)編碼單元)內(nèi)的預測塊相對于當前幀(或另一經(jīng)編碼單元)內(nèi)正編碼的當前塊的移位。通常將運動補償看作基于由運動估計確定的運動向量來取回或產(chǎn)生預測塊的過程。此外,運動估計單元32和運動補償單元35可在功能性上集成。為達成演示性目的,將本發(fā)明所描述的技術描述為由預測單元 31執(zhí)行。運動估計單元32通過將待編碼的視頻塊與一個或一個以上預測經(jīng)編碼單元(例
13如,依據(jù)時間或時間上的先前和/或未來幀)的視頻塊進行比較來選擇用于所述待編碼的視頻塊的適當運動向量。作為實例,運動估計單元32可以許多方法來選擇用于B-幀的運動向量。在一種方法中,運動估計單元32可從第一組幀(稱作列表0)選擇先前或未來幀, 且僅使用來自列表0的此先前或未來幀來確定運動向量,其為一類單向運動估計?;蛘撸\動估計單元32可從第二組幀(稱作列表1)選擇先前或未來幀,且僅使用來自列表1的此先前或未來幀來確定運動向量,其為另一類單向運動估計。在又一方法中,運動估計單元32 可選擇來自列表0的第一幀和來自列表1的第二幀,且選擇來自列表0的第一幀和列表1 的第二幀的一個或一個以上運動向量。此第三種形式的預測可被稱作雙預測運動估計。本發(fā)明的技術可經(jīng)實施以解耦針對單向運動補償指派到列表0和列表1的權重因子與針對雙向運動補償指派到列表0和列表1的權重因子。針對任一給定列表的選定運動向量可針對最類似于經(jīng)編碼的視頻塊的預測視頻塊,例如,如例如所述預測塊的像素值相對于經(jīng)編碼的塊的像素值的絕對差和(SAD)或平方差和(SSD)的度量所定義。在基于所述運動向量來產(chǎn)生預測數(shù)據(jù)時,運動補償單元35可應用適當權重因子。即,應用權重因子(其對于單向預測和雙向預測來說為不同的)以對預測數(shù)據(jù)加權以便定義加權預測數(shù)據(jù),其用于對當前視頻塊的編碼或解碼中。根據(jù)ITU-T H. ^4/AVC標準,可使用不同運動補償雙向預測算法或模式來預測 B-幀或其部分,例如視頻塊、宏塊或B-幀的任何其它離散和/或連續(xù)部分。第一運動補償雙預測算法或模式(其通常稱作缺省加權預測)可涉及將缺省權重應用到列表0的所述第一幀和列表1的所述第二幀的每一經(jīng)識別視頻塊。對于缺省加權預測來說,所述缺省權重可根據(jù)所述標準來編程且通常經(jīng)選擇為相等的。接著將所述第一幀與第二幀的加權塊相加并除以預測B-幀所使用的總幀數(shù)目(例如,在此例子中為二)。通常,通過將所述第一幀與第二幀的加權塊的相加值加1且接著將所述結果向右移一個位來完成此除法。加1是舍入調(diào)整,在一些實施例中,可免除加1的舍入調(diào)整。在一些情況下,可避免在右移一個位之前加1 (舍入調(diào)整),因此消除上偏倚舍入 (upward biased rounding)。運動補償單元35可產(chǎn)生具有舍入的加權塊和不具有舍入的加權塊兩者,且可選擇達成最佳編碼效率的塊。更大體來說,雙向加權預測可由下式給出pred(i, j) = (predO (i,j) *w0+predl (i,j) *wl+2r) >> (r+1)其中pred(i,j)為與加權預測塊相關聯(lián)的數(shù)據(jù),predO (i,j)為來自列表0的數(shù)據(jù), predKi, j)為來自列表1的數(shù)據(jù),wO和wl為權重因子,21^為舍入項,且>>為右移(r+1) 個位的運算。在一些情況下,可由運動補償單元35產(chǎn)生并考慮pred(i,j)之兩個不同版本。第一版本與上述方程式一致,且第二版本與無舍入(即,將項“2〃’從所述方程式去除) 的上述方程式一致。在一些情況下,消除此舍入可達成更好加權預測數(shù)據(jù),此可改進編碼效率。運動補償單元35可產(chǎn)生一個或一個以上語法元素,以定義是否將舍入用于給定視頻塊或一組視頻塊。所述雙向預測模式和指示是否使用舍入的所述一個或一個以上語法元素均可從運動補償單元35輸出到熵編碼單元46,以包含在經(jīng)編碼位流中。B圖像使用兩個先前經(jīng)編碼參考圖像列表,列表0和列表1。這兩個列表可各自含有時間次序上為過去和/或未來的經(jīng)編碼圖像??梢韵铝袔追N方法中的一者來預測B圖像中的塊來自列表0參考圖像的運動補償預測、來自列表1參考圖像的運動補償預測,或來自列表0與列表1參考圖像的組合的運動補償預測。為獲得列表0與列表1參考圖像的組合,分別從列表0和列表1參考圖像獲得兩個運動補償參考區(qū)域,且所述兩個參考區(qū)域可以加權方式組合??山又褂闷浣M合來預測當前塊。在本發(fā)明中,術語“B圖像”將用以大體上指代任何類型的B單元,其可為B幀、B 片段,或可能包含至少一些B視頻塊的其它視頻單元。如所提及,B圖像可允許3種類型的加權預測,缺省、隱式和顯式。此外,有時將缺省預測看作顯式權重因子由缺省設置定義的特定類型的顯式預測。為簡單起見,在下文的論述中僅展示單向預測中的前向預測,盡管也可將反向預測用作另一類型的單向預測??捎梢韵路匠绦蚍謩e針對單向預測和雙向預測來定義缺省加權預測。單向預測:pred(i,j) = pred0(i, j)雙向預測pred(i,j)= (pred0(i, j)+predl(i, j)+l) >> 1其中pred0(i,j)及predl(i,j)是來自列表0和列表1的預測數(shù)據(jù)。可由以下方程序分別針對單向預測和雙向預測來定義隱式加權預測。單向預測:pred(i,j) = pred0(i, j)雙向預測:pred(i, j) = (pred0(i, j)*w0+predl (i,j)*wl+32) >> 6在此情況下,每一預測由權重因子wO或wl縮放,其中wO和wl是基于列表O與列表1參考圖像的相對時間位置來計算的??捎梢韵路匠绦蚍謩e針對單向預測和雙向預測來定義顯式加權預測。單向預測:pred(i, j) = (predO(i, j)*w0+2廣O >> r+ol雙向預測pred(i, j) = (predO (i,j) *w0+predl (i,j) *wl+2r) >> (r+1) + ((ol+o2+l) >> 1)在此情況下,權重因子由編碼器確定并在片段標頭中發(fā)射,且ol和o2分別為列表 0和列表1參考圖像的圖像偏差值。常規(guī)地,在雙向預測中總是使用舍入調(diào)整。根據(jù)上述方程式,在缺省加權預測中在右移一個位之前使用1的舍入調(diào)整,且在隱式加權預測中在右移六個位之前使用32的舍入調(diào)整。大體上,在右移r個位之前通常使用的舍入調(diào)整,其中r表示正整數(shù)。此類頻繁和偏倚舍入運算可降低預測的精確度。此外,在顯式加權預測的雙向預測中,實際上存在2次舍入,一次用于參考圖像且另一次用于偏差值。因此,在此情況下,可累積舍入誤差。根據(jù)本發(fā)明的一方面,替代進行2次獨立舍入,視頻編碼器可在右移之前將偏差值加至加權預測,如下pred(i, j) = (predO (i,j) *w0+predl (i,j) *wl+((ol+o2) << r) +2r) >> (r+1),其中pred(i,j)是與舍入相關聯(lián)的加權預測數(shù)據(jù),predO (i,j)是來自列表0的數(shù)據(jù),predl(i,j)是來自列表1的數(shù)據(jù),w0和wl是權重因子,ol和o2是偏差值,且r和21^ 是與右移(r+Ι)個位的運算“>>“結合提供舍入的舍入項。此可提供更好的預測準確性。 在此情況下,還可定義新的語法元素以允許將兩個不同偏差值(ol和0 組合成一個偏差值。此外,在此情況下,舍入值可包括上述舍入調(diào)整(例如,在右移(r+Ι)個位的運算之前的 )以及與所述偏差值相關聯(lián)的另一舍入值(“r”)。上述方程式還可稍經(jīng)修改以為偏差值提供較高精確度。如果需要偏差值的較高精確度,那么可使偏差值乘以因子(例如乘以2)且接著舍入為整數(shù)。還可改變左移以指出此為偏差值添加了精確度。顯式加權預測的另一問題在于單向預測與雙向預測可共享相同權重和偏差值。為具有更多靈活性用于更好預測,根據(jù)本發(fā)明,可解耦單向預測與雙向預測。在此情況下,單向預測和雙向預測可針對給定類型的預測(缺省、隱式或顯式)來定義不同權重和偏差值。 可針對顯式預測來定義新的語法元素以允許進行更好的預測。編碼器可將所述語法元素包含在經(jīng)編碼位流中,以用信號發(fā)射所述編碼器所使用的權重因子和所述編碼器所使用的可能不同舍入模式,使得解碼器可使用相同權重因子和舍入模式。適應性地選擇舍入調(diào)整是有益的。進行此的一種方法是基于兩組或兩組以上不同的預測數(shù)據(jù)來產(chǎn)生所述兩組或兩組以上不同的預測數(shù)據(jù)(且可能對視頻塊編碼幾次)。一組所述預測數(shù)據(jù)可具有非零舍入,且另一組預測數(shù)據(jù)可消除舍入。在其它實例中,可考慮上舍入(upward rounding)、下舍入(downward rounding)禾口無舍入。運動補償單元35可產(chǎn)生這些不同類型的預測數(shù)據(jù),且可進行速率-失真(RD)分析以針對給定視頻塊選擇最佳的預測數(shù)據(jù)。速率-失真(RD)分析在視頻編碼中相當普遍,且通常涉及計算指示編碼成本的成本度量。所述成本度量可平衡編碼所需的位數(shù)目(速率)和與編碼相關聯(lián)的質(zhì)量級別(失真)。典型速率-失真成本計算可大體上對應于以下格式J(A) = λ R+D,其中J(A)為成本,R為位速率,D為失真,且λ為拉格朗日乘數(shù)。視頻編碼器50識別最合意的預測數(shù)據(jù)的一種方法是使用運動估計單元32來首先找到運動向量,且接著實施運動補償單元35和加法器48以計算在具有和不具有舍入調(diào)整的情況下的預測誤差。運動補償單元35可接著選擇產(chǎn)生最小預測誤差的預測數(shù)據(jù)。可通過使用預測數(shù)據(jù)與經(jīng)編碼的當前數(shù)據(jù)之間的絕對差和來計算預測誤差。根據(jù)本發(fā)明,針對顯式加權預測定義的權重(和任選偏差值)對于單向預測和雙向預測來說可為不同的。顯式權重可計算為顯式權重=缺省權重 * (DC_Current_frame/DC_Reference_frame)在此情況下,術語“DC_Current_frame”是當前幀(或其它經(jīng)編碼單元)的所有像素的和,且術語“DC_Reference_frame”是參考幀(或其它經(jīng)編碼單元)的所有像素的和, 參考幀可來自列表0或列表1。列表0和列表1中的每一參考幀可具有指派給其的顯式權重。此外,每一參考幀具有用于單向預測的一個權重,且雙向預測中所涉及的每一對參考圖像具有用于兩個參考幀的一對權重。常規(guī)顯式加權預測的問題在于單向預測與雙向預測共享相同權重。作為實例,如果F=當前幀F(xiàn)O =列表0中的參考幀F(xiàn)l =列表1中的參考幀wO =用于FO的顯式權重Wl =用于Fl的顯式權重wd =缺省權重那么
1權利要求
1.一種在視頻解碼器中對視頻數(shù)據(jù)解碼的方法,所述方法包括在所述視頻解碼器處接收經(jīng)編碼單元,其中所述經(jīng)編碼單元包含指示在所述經(jīng)編碼單元中的一個或一個以上視頻塊的顯式加權預測期間所將應用的顯式權重的語法元素;經(jīng)由所述視頻解碼器將所述顯式權重應用于所述經(jīng)編碼單元中的一個或一個以上雙向視頻塊的雙向顯式加權預測;以及經(jīng)由所述視頻解碼器將一個或一個以上不同權重應用于所述經(jīng)編碼單元中的一個或一個以上單向視頻塊的單向顯式加權預測。
2.根據(jù)權利要求1所述的方法,其中所述顯式權重包括雙向顯式權重,且所述一個或一個以上不同權重包括單向顯式權重,所述方法進一步包括接收所述經(jīng)編碼單元中的所述單向顯式權重。
3.根據(jù)權利要求1所述的方法,其中所述一個或一個以上不同權重包括一個或一個以上缺省權重。
4.根據(jù)權利要求3所述的方法,其中所述缺省權重是在所述視頻解碼器處定義且不包含在所述經(jīng)編碼單元的所述語法元素中。
5.根據(jù)權利要求3所述的方法,其中所述缺省權重包含在所述經(jīng)編碼單元的所述語法元素中。
6.根據(jù)權利要求1所述的方法,其進一步包括接收不包含顯式權重的另一經(jīng)編碼單元;以及產(chǎn)生一個或一個以上隱式權重并將所述一個或一個以上隱式權重應用于所述另一經(jīng)編碼單元中的一個或一個以上視頻塊的隱式加權預測。
7.一種在視頻編碼器中對視頻數(shù)據(jù)編碼的方法,所述方法包括在所述視頻編碼器處對經(jīng)編碼單元編碼,其中所述經(jīng)編碼單元包含指示在所述經(jīng)編碼單元中的一個或一個以上視頻塊的顯式加權預測期間將應用的顯式權重的語法元素;經(jīng)由所述視頻編碼器基于所述顯式權重對所述經(jīng)編碼單元中的一個或一個以上雙向視頻塊編碼;以及經(jīng)由所述視頻編碼器基于一個或一個以上不同權重對所述經(jīng)編碼單元中的一個或一個以上單向視頻塊編碼。
8.根據(jù)權利要求7所述的方法,其中所述顯式權重包括雙向顯式權重,其中所述不同權重包括單向顯式權重,且其中所述語法元素包含所述單向顯式權重。
9.根據(jù)權利要求7所述的方法,其中所述顯式權重包括雙向顯式權重,其中所述不同權重包括缺省權重,且其中所述語法元素包含所述缺省權重。
10.根據(jù)權利要求7所述的方法,其中所述顯式權重包括雙向顯式權重,其中所述不同權重包括缺省權重,且其中所述語法元素不包含所述缺省權重。
11.一種視頻解碼設備,其包括熵單元,其接收經(jīng)編碼單元且對所述經(jīng)編碼單元的一個或一個以上語法元素進行熵解碼,其中所述語法元素指示在所述經(jīng)編碼單元中的一個或一個以上視頻塊的顯式加權預測期間將應用的顯式權重;以及預測單元,其將所述顯式權重應用于所述經(jīng)編碼單元中的一個或一個以上雙向視頻塊的雙向顯式加權預測,以及將一個或一個以上不同權重應用于所述經(jīng)編碼單元中的一個或一個以上單向視頻塊的單向顯式加權預測。
12.根據(jù)權利要求11所述的視頻解碼設備,其中所述顯式權重包括雙向顯式權重且所述一個或一個以上不同權重包括單向顯式權重,其中所述語法元素包含所述單向顯式權重。
13.根據(jù)權利要求11所述的視頻解碼設備,其中所述一個或一個以上不同權重包括一個或一個以上缺省權重。
14.根據(jù)權利要求13所述的視頻解碼設備,其中所述缺省權重是在所述視頻解碼設備處定義且不包含在所述經(jīng)編碼單元的所述語法元素中。
15.根據(jù)權利要求13所述的視頻解碼設備,其中所述缺省權重包含在所述經(jīng)編碼單元的所述語法元素中。
16.根據(jù)權利要求11所述的視頻解碼設備,其中所述熵單元接收并解碼不包含顯式權重的另一經(jīng)編碼單元;以及所述預測單元產(chǎn)生一個或一個以上隱式權重并將所述一個或一個以上隱式權重應用于所述另一經(jīng)編碼單元中的一個或一個以上視頻塊的隱式加權預測。
17.根據(jù)權利要求11所述的視頻解碼設備,其中所述視頻解碼設備包括集成電路。
18.根據(jù)權利要求11所述的視頻解碼設備,其中所述視頻解碼設備包括微處理器。
19.根據(jù)權利要求11所述的視頻解碼設備,其中所述視頻解碼設備包括包含視頻解碼器的無線通信裝置。
20.一種對視頻數(shù)據(jù)編碼的視頻編碼設備,所述設備包括存儲器,其存儲所述視頻數(shù)據(jù)和用以對所述視頻數(shù)據(jù)進行預測性編碼的兩個或兩個以上數(shù)據(jù)列表;以及預測單元,其對經(jīng)編碼單元編碼,其中所述經(jīng)編碼單元包含指示在所述經(jīng)編碼單元中的一個或一個以上視頻塊的顯式加權預測期間將應用的顯式權重的語法元素;基于所述顯式權重對所述經(jīng)編碼單元中的一個或一個以上雙向視頻塊編碼;以及基于一個或一個以上不同權重對所述經(jīng)編碼單元中的一個或一個以上單向視頻塊編碼。
21.根據(jù)權利要求20所述的視頻編碼設備,其中所述顯式權重包括雙向顯式權重,其中所述不同權重包括單向顯式權重,且其中所述語法元素包含所述單向顯式權重。
22.根據(jù)權利要求20所述的視頻編碼設備,其中所述顯式權重包括雙向顯式權重,其中所述不同權重包括缺省權重,且其中所述語法元素包含所述缺省權重。
23.根據(jù)權利要求20所述的視頻編碼設備,其中所述顯式權重包括雙向顯式權重,其中所述不同權重包括缺省權重,且其中所述語法元素不包含所述缺省權重。
24.根據(jù)權利要求20所述的視頻編碼設備,其中所述視頻編碼設備包括集成電路。
25.根據(jù)權利要求20所述的視頻編碼設備,其中所述視頻編碼設備包括微處理器。
26.根據(jù)權利要求20所述的視頻編碼設備,其中所述視頻編碼設備包括包含視頻編碼器的無線通信裝置。
27.—種對視頻數(shù)據(jù)解碼的裝置,所述裝置包括用于接收經(jīng)編碼單元的裝置,其中所述經(jīng)編碼單元包含指示在所述經(jīng)編碼單元中的一個或一個以上視頻塊的顯式加權預測期間將應用的顯式權重的語法元素;用于將所述顯式權重應用于所述經(jīng)編碼單元中的一個或一個以上雙向視頻塊的雙向顯式加權預測的裝置;以及用于將一個或一個以上不同權重應用于所述經(jīng)編碼單元中的一個或一個以上單向視頻塊的單向顯式加權預測的裝置。
28.根據(jù)權利要求27所述的裝置,其中所述顯式權重包括雙向顯式權重,且所述一個或一個以上不同權重包括單向顯式權重,所述裝置進一步包括用于接收所述經(jīng)編碼單元中的所述單向顯式權重的裝置。
29.根據(jù)權利要求27所述的裝置,其中所述一個或一個以上不同權重包括一個或一個以上缺省權重。
30.根據(jù)權利要求四所述的裝置,其中所述缺省權重是在所述裝置處定義且不包含在所述經(jīng)編碼單元的所述語法元素中。
31.根據(jù)權利要求四所述的裝置,其中所述缺省權重包含在所述經(jīng)編碼單元的所述語法元素中。
32.根據(jù)權利要求27所述的裝置,其進一步包括用于接收不包含顯式權重的另一經(jīng)編碼單元的裝置;以及用于產(chǎn)生一個或一個以上隱式權重的裝置;以及用于將所述一個或一個以上隱式權重應用于所述另一經(jīng)編碼單元中的一個或一個以上視頻塊的隱式加權預測的裝置。
33.一種對視頻數(shù)據(jù)編碼的裝置,所述裝置包括用于對經(jīng)編碼單元編碼的裝置,其中所述經(jīng)編碼單元包含指示在所述經(jīng)編碼單元中的一個或一個以上視頻塊的顯式加權預測期間將應用的顯式權重的語法元素;用于基于所述顯式權重對所述經(jīng)編碼單元中的一個或一個以上雙向視頻塊編碼的裝置;以及用于基于一個或一個以上不同權重對所述經(jīng)編碼單元中的一個或一個以上單向視頻塊編碼的裝置。
34.根據(jù)權利要求33所述的裝置,其中所述顯式權重包括雙向顯式權重,其中所述不同權重包括單向顯式權重,且其中所述語法元素包含所述單向顯式權重。
35.根據(jù)權利要求33所述的裝置,其中所述顯式權重包括雙向顯式權重,其中所述不同權重包括缺省權重,且其中所述語法元素包含所述缺省權重。
36.根據(jù)權利要求33所述的裝置,其中所述顯式權重包括雙向顯式權重,其中所述不同權重包括缺省權重,且其中所述語法元素不包含所述缺省權重。
37.一種計算機可讀存儲媒體,其包括在執(zhí)行時使處理器對視頻數(shù)據(jù)解碼的指令,其中在接收包含指示在經(jīng)編碼單元中的一個或一個以上視頻塊的顯式加權預測期間將應用的顯式權重的語法元素的所述經(jīng)編碼單元后,所述指令即刻使所述處理器進行以下動作將所述顯式權重應用于所述經(jīng)編碼單元中的一個或一個以上雙向視頻塊的雙向顯式加權預測;以及將一個或一個以上不同權重應用于所述經(jīng)編碼單元中的一個或一個以上單向視頻塊的單向顯式加權預測。
38.根據(jù)權利要求37所述的計算機可讀存儲媒體,其中所述顯式權重包括雙向顯式權重,且所述一個或一個以上不同權重包括在所述經(jīng)編碼單元中接收到的單向顯式權重。
39.根據(jù)權利要求37所述的計算機可讀存儲媒體,其中所述一個或一個以上不同權重包括一個或一個以上缺省權重。
40.根據(jù)權利要求39所述的計算機可讀存儲媒體,其中所述缺省權重是預定義的且不包含在所述經(jīng)編碼單元的所述語法元素中。
41.根據(jù)權利要求39所述的計算機可讀存儲媒體,其中所述缺省權重包含在所述經(jīng)編碼單元的所述語法元素中。
42.根據(jù)權利要求37所述的計算機可讀存儲媒體,其進一步包括使所述處理器進行以下動作的指令在接收到不包含顯式權重的另一經(jīng)編碼單元后,即刻產(chǎn)生一個或一個以上隱式權重并將所述一個或一個以上隱式權重應用于所述另一經(jīng)編碼單元中的一個或一個以上視頻塊的隱式加權預測。
43.一種計算機可讀存儲媒體,其包括在執(zhí)行時使處理器對視頻數(shù)據(jù)編碼的指令,其中所述指令使所述處理器進行以下動作對經(jīng)編碼單元編碼,所述經(jīng)編碼單元包含指示在所述經(jīng)編碼單元中的一個或一個以上視頻塊的顯式加權預測期間將應用的顯式權重的語法元素;基于所述顯式權重對所述經(jīng)編碼單元中的一個或一個以上雙向視頻塊編碼;以及基于一個或一個以上不同權重對所述經(jīng)編碼單元中的一個或一個以上單向視頻塊編碼。
44.根據(jù)權利要求43所述的計算機可讀存儲媒體,其中所述顯式權重包括雙向顯式權重,其中所述不同權重包括單向顯式權重,且其中所述語法元素包含所述單向顯式權重。
45.根據(jù)權利要求43所述的計算機可讀存儲媒體,其中所述顯式權重包括雙向顯式權重,其中所述不同權重包括缺省權重,且其中所述語法元素包含所述缺省權重。
46.根據(jù)權利要求43所述的計算機可讀存儲媒體,其中所述顯式權重包括雙向顯式權重,其中所述不同權重包括缺省權重,且其中所述語法元素不包含所述缺省權重。
全文摘要
在本發(fā)明的一方面中,描述用于解耦單向預測權重與雙向預測權重的技術,尤其對于B-單元內(nèi)的視頻塊的顯式加權預測。根據(jù)本發(fā)明,在位流中傳達的顯式權重可由解碼器應用于顯式雙向預測,但可將不同權重(其可為缺省權重或獨立定義的顯式單向權重)用于顯式單向預測。相對于將相同顯式權重用于B-單元內(nèi)的顯式雙向預測和顯式單向預測的技術,所描述的技術可改進視頻質(zhì)量。
文檔編號H04N7/46GK102474600SQ200980160326
公開日2012年5月23日 申請日期2009年7月10日 優(yōu)先權日2009年7月9日
發(fā)明者拉胡爾·P·潘查爾, 馬爾塔·卡切維奇 申請人:高通股份有限公司