專利名稱:子像素分辨率下的偏移的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字視頻譯碼,且更特定來說,涉及偏移應(yīng)用于在所述視頻譯碼中所 使用的預(yù)測數(shù)據(jù)的技術(shù)。
背景技術(shù):
數(shù)字視頻能力可并入到廣泛范圍的裝置中,包括數(shù)字電視、數(shù)字直播系統(tǒng)、無線廣 播系統(tǒng)、個人數(shù)字助理(PDA)、膝上型或臺式計算機、數(shù)碼相機、數(shù)字記錄裝置、視頻游戲裝 置、視頻游戲控制臺、蜂窩式或衛(wèi)星無線電電話等。數(shù)字視頻裝置實施例如MPEG-2、MPEG-4 或ITU-T H. 264/MPEG-4第10部分高級視頻譯碼(AVC)所界定的標準中所描述的視頻壓 縮技術(shù)的視頻壓縮技術(shù),以更有效地發(fā)射和接收數(shù)字視頻信息。視頻壓縮技術(shù)可執(zhí)行空間 預(yù)測和/或時間預(yù)測以減小或移除視頻序列中所固有的冗余?;趬K的幀間譯碼是非常有用的譯碼技術(shù),其依賴于時間預(yù)測來減小或移除視頻 序列的連續(xù)經(jīng)譯碼的單元的視頻塊之間的時間冗余。經(jīng)譯碼的單元可包含視頻幀、視頻幀 的片段、圖片的群組或視頻塊的另一所界定單元。對于幀間譯碼,視頻編碼器執(zhí)行運動估計 和運動補償以追蹤兩個或兩個以上鄰近經(jīng)譯碼的單元的相應(yīng)視頻塊的移動。運動估計產(chǎn)生 運動向量,所述運動向量指示視頻塊相對于一個或一個以上參考幀或其它經(jīng)譯碼的單元中 的相應(yīng)預(yù)測視頻塊的位移。運動補償使用運動向量以從參考幀或其它經(jīng)譯碼的單元產(chǎn)生預(yù) 測視頻塊。在運動補償之后,通過從正經(jīng)譯碼的原始視頻塊減去預(yù)測視頻塊來形成殘余視 頻塊。視頻編碼器還可應(yīng)用變換、量化和熵譯碼過程來進一步減小與殘余塊的通信相關(guān) 聯(lián)的位速率。變換技術(shù)可包含離散余弦變換(DCT)或概念上類似的過程?;蛘撸墒褂眯?波變換、整數(shù)變換或其它類型的變換。在DCT過程中,作為一實例,將像素值的集合轉(zhuǎn)換為 可表示頻域中的像素值的能量的變換系數(shù)。將量化應(yīng)用于變換系數(shù),且量化大體涉及限制 與任何給定變換系數(shù)相關(guān)聯(lián)的位的數(shù)目的過程。熵譯碼包含共同地壓縮經(jīng)量化的變換系數(shù) 的序列的一個或一個以上過程。熵譯碼的實例包括(但不限于)內(nèi)容自適應(yīng)可變長度譯碼 (CAVLC)和上下文自適應(yīng)二進制算術(shù)譯碼(CABAC)??捎煽捎靡援a(chǎn)生或識別預(yù)測塊的預(yù)測信息和指示正經(jīng)譯碼的塊與預(yù)測塊之間的 差的數(shù)據(jù)的殘余塊表示經(jīng)譯碼的視頻塊。預(yù)測信息可包含用以識別數(shù)據(jù)的預(yù)測塊的所述一 個或一個以上運動向量。給定運動向量,解碼器能夠重建用以對殘余塊進行譯碼的預(yù)測塊。 因此,給定殘余塊的集合和運動向量的集合(以及有可能某一額外語法),解碼器可能能夠 重建最初經(jīng)編碼的視頻幀。因為連續(xù)視頻幀或其它類型的經(jīng)譯碼的單元常常為非常類似 的,所以基于運動估計和運動補償?shù)膸g譯碼可實現(xiàn)非常良好的壓縮。經(jīng)編碼的視頻序列可包含殘余數(shù)據(jù)的塊、運動向量,以及有可能其它類型的語法。已開發(fā)出內(nèi)插和外插技術(shù)以便改進可在幀間譯碼中實現(xiàn)的壓縮的等級。在此狀況 下,在運動補償期間所產(chǎn)生的用以對視頻塊進行譯碼的預(yù)測數(shù)據(jù)可從視頻幀或用于運動估 計中的其它經(jīng)譯碼的單元的視頻塊的像素內(nèi)插或外插。常常執(zhí)行內(nèi)插或外插以產(chǎn)生預(yù)測半 像素值(半像元(half-pel))和預(yù)測四分之一像素值(四分之一像元(quarter-pel))。此 類內(nèi)插或外插常常產(chǎn)生預(yù)測塊,所述預(yù)測塊甚至比在視頻譯碼中所使用的預(yù)測幀或其它經(jīng) 譯碼的單元的實際視頻塊更類似于正經(jīng)譯碼的視頻塊。
發(fā)明內(nèi)容
大體來說,本發(fā)明描述在視頻編碼和解碼過程期間由編碼器和解碼器所應(yīng)用的技 術(shù)。根據(jù)所述技術(shù),編碼器產(chǎn)生每一經(jīng)譯碼的單元的多個偏移值,且將所述偏移值應(yīng)用于用 以對經(jīng)譯碼的單元的視頻塊進行譯碼的預(yù)測數(shù)據(jù)。特定來說,不同偏移值可對于與經(jīng)譯碼 的單元相關(guān)聯(lián)的每一整數(shù)和子整數(shù)像素位置而界定。子整數(shù)像素位置可對應(yīng)于基于在整數(shù) 像素位置處的數(shù)據(jù)而內(nèi)插或外插的經(jīng)內(nèi)插或外插數(shù)據(jù)。通過占據(jù)在不同像素位置(整數(shù)像 素位置和各種子整數(shù)像素位置)處的不同偏移,所得偏移預(yù)測數(shù)據(jù)可提供比原始預(yù)測數(shù)據(jù) 更好的壓縮。以此方式,本發(fā)明的技術(shù)可改進視頻譯碼。編碼器可對每一經(jīng)譯碼的單元的不同偏移值進行編碼,所述不同偏移值可接著作 為經(jīng)編碼的位流的一部分而傳送到解碼器。以此方式,解碼器可接收在每一經(jīng)譯碼的單元 的編碼器處所界定的不同偏移值。因此,解碼器可產(chǎn)生預(yù)測數(shù)據(jù),且接著基于所述預(yù)測數(shù)據(jù) 和所述偏移值而重建偏移預(yù)測數(shù)據(jù)??山又谄祁A(yù)測數(shù)據(jù)對經(jīng)譯碼的單元的視頻數(shù)據(jù) (例如,視頻塊)進行解碼。通過提供對于與經(jīng)譯碼的單元相關(guān)聯(lián)的不同整數(shù)像素位置和子 整數(shù)像素位置的單獨偏移值,譯碼可相對于將單一偏移值應(yīng)用于經(jīng)譯碼的單元的技術(shù)而得 以改進。在一個實例中,本發(fā)明提供一種對視頻數(shù)據(jù)進行編碼的方法。所述方法包含計算 視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值,其中偏移值與多個不同整數(shù)像素位置和子整數(shù)像 素位置相關(guān)聯(lián);將偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊;以及基于偏移預(yù)測視 頻塊而對經(jīng)譯碼的單元的視頻塊進行編碼。在另一實例中,本發(fā)明提供一種對視頻數(shù)據(jù)進行解碼的方法。所述方法包含接收 視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值,其中偏移值與多個不同整數(shù)像素位置和子整數(shù)像 素位置相關(guān)聯(lián);將偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊;以及基于偏移預(yù)測視 頻塊而對經(jīng)譯碼的單元的視頻塊進行解碼。在另一實例中,本發(fā)明提供一種對視頻數(shù)據(jù)進行編碼的設(shè)備。所述設(shè)備包含進行 以下動作的視頻編碼器計算視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值,其中偏移值與多個 不同整數(shù)像素位置和子整數(shù)像素位置相關(guān)聯(lián);將偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測 視頻塊;以及基于偏移預(yù)測視頻塊而對經(jīng)譯碼的單元的視頻塊進行編碼。在另一實例中,本發(fā)明提供一種對視頻數(shù)據(jù)進行解碼的設(shè)備。所述設(shè)備包含進行 以下動作的視頻解碼器接收視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值,其中偏移值與多個 不同整數(shù)像素位置和子整數(shù)像素位置相關(guān)聯(lián);將偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測 視頻塊;以及基于偏移預(yù)測視頻塊而對經(jīng)譯碼的單元的視頻塊進行解碼。
在另一實例中,本發(fā)明提供一種對視頻數(shù)據(jù)進行編碼的裝置,所述裝置包含用于 計算視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值的裝置,其中偏移值與多個不同整數(shù)像素位置 和子整數(shù)像素位置相關(guān)聯(lián);用于將偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊的裝 置;以及用于基于偏移預(yù)測視頻塊而對經(jīng)譯碼的單元的視頻塊進行編碼的裝置。在另一實例中,本發(fā)明提供一種對視頻數(shù)據(jù)進行解碼的裝置,所述裝置包含用于 接收視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值的裝置,其中偏移值與多個不同整數(shù)像素位置 和子整數(shù)像素位置相關(guān)聯(lián);用于將偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊的裝 置;以及用于基于偏移預(yù)測視頻塊而對經(jīng)譯碼的單元的視頻塊進行解碼的裝置。在另一實例中,本發(fā)明提供一種包含視頻編碼器和無線發(fā)射器的裝置。視頻編碼 器計算視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值,其中偏移值與多個不同整數(shù)像素位置和 子整數(shù)像素位置相關(guān)聯(lián);將偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊;以及基于偏 移預(yù)測視頻塊而對經(jīng)譯碼的單元的視頻塊進行編碼。無線發(fā)射器將經(jīng)編碼的數(shù)據(jù)發(fā)送到另一裝置。在另一實例中,本發(fā)明提供一種包含無線接收器和視頻解碼器的裝置。無線接收 器從另一裝置接收經(jīng)編碼的視頻數(shù)據(jù)。視頻解碼器接收視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個 偏移值,其中偏移值與多個不同整數(shù)像素位置和子整數(shù)像素位置相關(guān)聯(lián);將偏移值應(yīng)用于 預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊;以及基于偏移預(yù)測視頻塊而對經(jīng)譯碼的單元的視頻塊 進行解碼。本發(fā)明中所描述的技術(shù)可以硬件、軟件、固件或其任何組合來實施。如果以軟件實 施,那么軟件可執(zhí)行于例如微處理器、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)或 數(shù)字信號處理器(DSP)等一個或一個以上處理器中。執(zhí)行所述技術(shù)的軟件最初可存儲于計 算機可讀媒體中且經(jīng)載入并執(zhí)行于處理器中。因此,本發(fā)明還涵蓋一種計算機可讀媒體,其包含在執(zhí)行后便致使一裝置對視頻 數(shù)據(jù)進行編碼的指令。特定來說,所述指令致使所述裝置計算視頻數(shù)據(jù)的經(jīng)譯碼的單元的 多個偏移值,其中偏移值與多個不同整數(shù)像素位置和子整數(shù)像素位置相關(guān)聯(lián);將偏移值應(yīng) 用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊;以及基于偏移預(yù)測視頻塊而對經(jīng)譯碼的單元的視 頻塊進行編碼。另外,本發(fā)明還涵蓋一種計算機可讀媒體,其包含在執(zhí)行后便致使一裝置對視頻 數(shù)據(jù)進行解碼的指令。在此狀況下,在接收視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值后,其中 偏移值與多個不同整數(shù)像素位置和子整數(shù)像素位置相關(guān)聯(lián),所述指令便致使所述裝置將偏 移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊,且基于偏移預(yù)測視頻塊而對經(jīng)譯碼的單元 的視頻塊進行解碼。在附圖和以下描述內(nèi)容中闡述本發(fā)明的一個或一個以上方面的細節(jié)。本發(fā)明中所 描述的技術(shù)的其它特征、目的和優(yōu)點將從所述描述內(nèi)容和圖式且從權(quán)利要求書顯而易見。
圖1是說明視頻編碼和解碼系統(tǒng)的示范性框圖。圖2是說明符合本發(fā)明的視頻編碼器的實例的框圖。圖3是說明符合本發(fā)明的視頻解碼器的實例的框圖。
圖4是說明可包含預(yù)測視頻塊的像素的整數(shù)像素和各種子整數(shù)像素的概念圖。圖5到圖7是說明符合本發(fā)明的技術(shù)的流程圖。
具體實施例方式本發(fā)明描述由編碼器和解碼器所執(zhí)行的技術(shù)以便在視頻譯碼的運動補償過程期 間對預(yù)測視頻塊添加偏移。根據(jù)本發(fā)明的一個方面,編碼器可產(chǎn)生每一經(jīng)譯碼的單元的多 個偏移值,且將所述偏移值應(yīng)用于用以對經(jīng)譯碼的單元的視頻塊進行譯碼的預(yù)測數(shù)據(jù)。特 定來說,編碼器可界定整數(shù)像素位置和不同子整數(shù)像素位置的不同偏移值。適當?shù)钠浦?可基于與相應(yīng)預(yù)測數(shù)據(jù)相關(guān)聯(lián)的像素位置而應(yīng)用于所述預(yù)測數(shù)據(jù)。子整數(shù)像素位置可對應(yīng) 于基于在整數(shù)像素位置處的數(shù)據(jù)而內(nèi)插或外插的經(jīng)內(nèi)插或外插數(shù)據(jù)。通過占據(jù)在不同像素 位置(整數(shù)像素位置和子整數(shù)像素位置)處的不同偏移,所得偏移預(yù)測數(shù)據(jù)可提供比原始 預(yù)測數(shù)據(jù)更好的壓縮。以此方式,本發(fā)明的技術(shù)可改進視頻質(zhì)量。舉例來說,偏移到預(yù)測數(shù) 據(jù)的添加可在視頻序列的幀之間的照明改變期間(例如,在幀之間的閃光、黑暗天空或其 它類型的照明改變期間)改進譯碼。ITU-T H. 264標準支持子整數(shù)像素到四分之一像素分辨率的分數(shù)內(nèi)插。在此狀 況下,對于每一整數(shù)像素位置存在十五個可能的子整數(shù)像素位置。因此,在此狀況下,根據(jù) 本發(fā)明,可對于經(jīng)譯碼的單元的每一可能的整數(shù)和子整數(shù)像素位置產(chǎn)生十六個不同的偏移 值。對應(yīng)的偏移值可基于與任何預(yù)測數(shù)據(jù)相關(guān)聯(lián)的像素位置而應(yīng)用于所述預(yù)測數(shù)據(jù)。特定 來說,偏移值可經(jīng)應(yīng)用以調(diào)整預(yù)測視頻塊的像素值,且用以進行此像素值調(diào)整的偏移值可 視與所述預(yù)測視頻塊相關(guān)聯(lián)的位置(例如,整數(shù)位置或若干可能的子像素位置中的一者) 而定。不同偏移值可經(jīng)編碼作為每一經(jīng)譯碼的單元的位流的一部分。解碼器可接收由每 一經(jīng)譯碼的單元的編碼器界定的不同偏移值。因此,解碼器可產(chǎn)生預(yù)測數(shù)據(jù)且接著基于所 述預(yù)測數(shù)據(jù)和所述偏移值而重建偏移預(yù)測數(shù)據(jù)。解碼器可基于偏移預(yù)測數(shù)據(jù)(基于預(yù)測數(shù) 據(jù)和偏移值而產(chǎn)生)對經(jīng)譯碼的單元的視頻數(shù)據(jù)(例如,視頻塊)進行解碼。如編碼一樣, 偏移到預(yù)測數(shù)據(jù)的添加可通過改進在照明改變或其它視頻效應(yīng)期間的視頻質(zhì)量而改進視 頻解碼。圖1是說明可實施本發(fā)明的技術(shù)的一個示范性視頻編碼和解碼系統(tǒng)10的框圖。如 圖1中所展示,系統(tǒng)10包括源裝置12,其經(jīng)由通信信道15將經(jīng)編碼的視頻發(fā)射到目的地裝 置16。源裝置12和目的地裝置16可包含廣泛范圍的裝置中的任一者。在一些狀況下,源 裝置12和目的地裝置16包含無線通信裝置(例如無線手機,所謂的蜂窩式或衛(wèi)星無線電 電話)或可經(jīng)由通信信道15傳送視頻信息的任何無線裝置(在所述狀況下,通信信道15 為無線的)。然而,本發(fā)明的涉及在運動補償期間偏移到預(yù)測數(shù)據(jù)的添加的技術(shù)未必限于無 線應(yīng)用或設(shè)定。 在圖1的實例中,源裝置12可包括視頻源20、視頻編碼器22、調(diào)制器/解調(diào)器(調(diào) 制解調(diào)器)23和發(fā)射器24。目的地裝置16可包括接收器26、調(diào)制解調(diào)器27、視頻解碼器 28和顯示裝置30。根據(jù)本發(fā)明,源裝置12的視頻編碼器22可經(jīng)配置以應(yīng)用本發(fā)明的作為 視頻編碼過程的一部分的偏移技術(shù)中的一者或一者以上。類似地,目的地裝置16的視頻解 碼器28可經(jīng)配置以應(yīng)用本發(fā)明的作為視頻解碼過程的一部分的偏移技術(shù)中的一者或一者以上。圖1的所說明的系統(tǒng)10僅為示范性的。可由支持對子像素分辨率的運動補償內(nèi) 插的任何編碼裝置來執(zhí)行本發(fā)明的偏移技術(shù)。源裝置12和目的地裝置16僅為其中源裝置 12產(chǎn)生用于發(fā)射到目的地裝置16的經(jīng)譯碼的視頻數(shù)據(jù)的此類譯碼裝置的實例。裝置12、 16可以實質(zhì)上對稱的方式操作,以使得裝置12、16中的每一者包括視頻編碼和解碼組件。 因此,系統(tǒng)10可支持視頻裝置12、16之間的單向或雙向視頻發(fā)射,例如以用于視頻串流、視 頻重放、視頻廣播或視頻電話。源裝置12的視頻源20可包括例如視頻相機等視頻俘獲裝置、含有先前俘獲的視 頻的視頻檔案,或來自視頻內(nèi)容提供者的視頻饋給。作為另一替代,視頻源20可產(chǎn)生基于 計算機圖形的數(shù)據(jù)作為源視頻,或直播視頻、所存檔的視頻與計算機產(chǎn)生的視頻的組合。在 一些狀況下,如果視頻源20為視頻相機,那么源裝置12和目的地裝置16可形成所謂的相 機電話或視頻電話。在每一狀況下,可由視頻編碼器22對經(jīng)俘獲、經(jīng)預(yù)俘獲或計算機產(chǎn)生 的視頻進行編碼。可接著由調(diào)制解調(diào)器23根據(jù)例如碼分多址(CDMA)或另一通信標準等通 信標準調(diào)制經(jīng)編碼的視頻信息,且將其經(jīng)由發(fā)射器24發(fā)射到目的地裝置16。調(diào)制解調(diào)器 23可包括各種混頻器、濾波器、放大器或經(jīng)設(shè)計以用于信號調(diào)制的其它組件。發(fā)射器24可 包括經(jīng)設(shè)計以用于發(fā)射數(shù)據(jù)的電路,包括放大器、濾波器和一個或一個以上天線。目的地裝置16的接收器26經(jīng)由信道15接收信息,且調(diào)制解調(diào)器27解調(diào)所述信 息。再次,視頻編碼過程可實施本文中所描述的技術(shù)中的一者或一者以上以在運動補償期 間將偏移添加到預(yù)測數(shù)據(jù)。由視頻解碼器28所執(zhí)行的視頻解碼過程還可在其解碼過程的 運動補償階段期間執(zhí)行此類技術(shù)。經(jīng)由信道15所傳送的信息可包括由視頻編碼器22所界 定的偏移信息,其也由視頻解碼器28使用。顯示裝置30將經(jīng)解碼的視頻數(shù)據(jù)顯示給用戶, 且可包含例如陰極射線管、液晶顯示器(LCD)、等離子顯示器、有機發(fā)光二極管(OLED)顯示 器或另一類型的顯示裝置等多種顯示裝置中的任一者。在圖1的實例中,通信信道15可包含任何無線或有線通信媒體,例如射頻(RF)頻 譜或者一個或一個以上物理發(fā)射線,或無線媒體與有線媒體的任何組合。通信信道15可形 成例如局域網(wǎng)、廣域網(wǎng)或全球網(wǎng)絡(luò)(例如,因特網(wǎng))等基于包的網(wǎng)絡(luò)的一部分。通信信道15 大體表示用于將視頻數(shù)據(jù)從源裝置12發(fā)射到目的地裝置16的任何合適的通信媒體或不同 通信媒體的集合。通信信道15可包括路由器、開關(guān)、基站,或可對促進從源裝置12向目的 地裝置16通信有用的任何其它設(shè)備。視頻編碼器22和視頻解碼器28可根據(jù)視頻壓縮標準(例如ITU-T H. 264標準,或 者描述為MPEG-4第10部分高級視頻譯碼(AVC))而操作。然而,本發(fā)明的技術(shù)不限于任 何特定譯碼標準。盡管未展示在圖1中,但在一些方面中,視頻編碼器22和視頻解碼器28 可各自與音頻編碼器和解碼器集成,且可包括適當?shù)腗UX-DEMUX (多路復(fù)用-多路分解)單 元或其它硬件和軟件,以處置共同數(shù)據(jù)流或單獨數(shù)據(jù)流中的音頻與視頻兩者的編碼。如果 適用,那么MUX-DEMUX單元可符合ITU H. 223多路復(fù)用器協(xié)議或例如用戶數(shù)據(jù)報協(xié)議(UDP) 等其它協(xié)議。ITU-T H. 264/MPEG-4 (AVC)標準由 ITU-T 視頻譯碼專家組(VCEG)連同 IS0/IEC 移動圖片專家組(MPEG)制定以作為被稱作聯(lián)合視頻組(JVT)的集體伙伴關(guān)系的產(chǎn)品。在 一些方面中,可將本發(fā)明中所描述的技術(shù)應(yīng)用于大體符合H. 264標準的裝置。H. 264標準由ITU-T研究團體描述于ITU-T推薦標準H. 264 “用于一般視聽服務(wù)的高級視頻譯碼 (Advanced Video Coding for generic audiovisual services),,中且標注日期 2005 年 3 月,其在本文中可被稱作H. 264標準或H. 264規(guī)范,或H. 264/AVC標準或規(guī)范。聯(lián)合視頻組 (JVT)繼續(xù)致力于對H. 264/MPEG-4 AVC的擴展??蓪⒁曨l編碼器22和視頻解碼器28每一者實施為一個或一個以上微處理器、數(shù) 字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)、離散邏輯、軟件、硬 件、固件或其任何組合??蓪⒁曨l編碼器22和視頻解碼器28中的每一者包括于一個或一 個以上編碼器或解碼器中,所述一個或一個以上編碼器或解碼器的任一者可在相應(yīng)移動裝 置、訂戶裝置、廣播裝置、服務(wù)器等中集成為組合的編碼器/解碼器(CODEC)的一部分。視頻序列通常包括一系列視頻幀。視頻編碼器22對個別視頻幀內(nèi)的視頻塊操作 以便對視頻數(shù)據(jù)進行編碼。視頻塊可具有固定或變化的大小,且其大小可根據(jù)所規(guī)定的譯 碼標準而不同。每一視頻幀包括一系列片段。每一片段可包括可布置成子塊的一系列宏塊 (macroblock) 0作為一實例,ITU-T H. 264標準支持各種塊大小的幀內(nèi)預(yù)測(例如,對于亮 度分量來說為16X16、8X8或4X4,且對于色度分量來說為8X8)以及各種塊大小的幀間 預(yù)測(例如,對于亮度分量來說為16X16、16X8、8X16、8X8、8X4、4X8和4X4,且對于 色度分量來說為相應(yīng)的經(jīng)縮放的大小)。視頻塊可包含像素數(shù)據(jù)的塊或變換系數(shù)的塊,(例 如)在例如離散余弦變換或概念上類似的變換過程等變換過程之后。較小視頻塊可提供較好分辨率,且可用于包括高階細節(jié)的視頻幀的位置。大體來 說,可認為宏塊和各種子塊為視頻塊。另外,可認為片段為一系列視頻塊,例如宏塊和/或 子塊。每一片段可為視頻幀的可獨立解碼單元?;蛘撸瑤旧砜蔀榭山獯a單元,或可將幀的 其它部分界定為可解碼單元。術(shù)語“經(jīng)譯碼的單元”指代視頻幀的任何可獨立解碼單元,例 如整個幀、幀的片段,或根據(jù)所使用的譯碼技術(shù)所界定的另一可獨立解碼單元。在基于幀間預(yù)測譯碼(其包括內(nèi)插和本發(fā)明的用以界定不同整數(shù)像素位置和子 整數(shù)像素位置的偏移值的技術(shù))之后,且在任何變換(例如,H. 264/AVC中所使用的4X4或 8X8整數(shù)變換,或離散余弦變換DCT)之后,可執(zhí)行量化。量化大體指代系數(shù)經(jīng)量化以可能 減少用以表示系數(shù)的數(shù)據(jù)的量的過程。量化過程可減小與所述系數(shù)中的一些或全部相關(guān)聯(lián) 的位深度。舉例來說,可在量化期間將16位值下舍入為15位值。在量化之后,可(例如) 根據(jù)內(nèi)容自適應(yīng)可變長度譯碼(CAVLC)、上下文自適應(yīng)二進制算術(shù)譯碼(CABAC)或另一熵 譯碼方法執(zhí)行熵譯碼。根據(jù)本發(fā)明的技術(shù),視頻編碼器22可計算視頻數(shù)據(jù)的經(jīng)譯碼的單元(例如,幀或 幀的可獨立解碼部分(例如,片段))的多個偏移值。不同偏移值與多個不同整數(shù)像素位置 和子整數(shù)像素位置(與視頻塊相關(guān)聯(lián))相關(guān)聯(lián)。子整數(shù)像素位置可界定通?;谠谡麛?shù)像 素位置處的數(shù)據(jù)而內(nèi)插或外插的經(jīng)內(nèi)插或外插數(shù)據(jù)的位置。視頻編碼器22可將偏移值應(yīng) 用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊,且基于所述偏移預(yù)測視頻塊對經(jīng)譯碼的單元的視 頻塊進行編碼。視頻編碼器22還可對作為包括經(jīng)譯碼的單元的經(jīng)譯碼的視頻塊的譯碼位 流的一部分的偏移值進行編碼,且源裝置12的發(fā)射器24可將經(jīng)譯碼的位流發(fā)射到目的地 裝置16的接收器26。特定來說,視頻編碼器可通過調(diào)整預(yù)測視頻塊的像素而應(yīng)用偏移值, 且可通過基于偏移預(yù)測視頻塊產(chǎn)生殘余塊而基于偏移預(yù)測視頻塊對視頻塊進行編碼。舉例 來說,可通過從適當?shù)钠祁A(yù)測視頻塊減去待譯碼的塊而產(chǎn)生殘余塊。由于基于預(yù)測視頻塊的位置而將偏移添加到偏移預(yù)測視頻塊的像素值,所以可改進譯碼效率,尤其在閃光或 背景光照改變期間。在目的地裝置16中,視頻解碼器28接收視頻數(shù)據(jù)的每一經(jīng)譯碼的單元的所述多 個偏移值。視頻解碼器28將偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊,且基于所述 偏移預(yù)測視頻塊對經(jīng)譯碼的單元的視頻塊進行解碼。以此方式,偏移值在視頻編碼器22處 經(jīng)界定并應(yīng)用以作為編碼過程的一部分,且作為經(jīng)編碼的位流的一部分而從源裝置12傳 送到目的地裝置16。偏移值接著應(yīng)用于視頻解碼器28處的預(yù)測數(shù)據(jù)以作為解碼過程的一 部分以便重建視頻序列。在此狀況下,在視頻重建期間產(chǎn)生并使用對預(yù)測數(shù)據(jù)的偏移。圖2是說明可執(zhí)行符合本發(fā)明的偏移技術(shù)的視頻編碼器50的實例的框圖。視頻 編碼器50可對應(yīng)于裝置20的視頻編碼器22或不同裝置的視頻編碼器。盡管為了說明便 利起見,幀內(nèi)譯碼組件未展示于圖2中,但視頻編碼器50可執(zhí)行視頻幀內(nèi)的塊的幀內(nèi)和幀 間譯碼。幀內(nèi)譯碼依賴于空間預(yù)測來減小或移除給定視頻幀內(nèi)的視頻中的空間冗余。幀間 譯碼依賴于時間預(yù)測來減小或移除視頻序列的鄰近幀內(nèi)的視頻中的時間冗余。幀內(nèi)模式(I 模式)可指代基于空間的壓縮模式,且例如預(yù)測(P模式)或雙向(B模式)等幀間模式可 指代基于時間的壓縮模式。本發(fā)明的技術(shù)在幀間譯碼期間應(yīng)用,且因此,為了說明的簡易性 和便利起見,例如空間預(yù)測單元等幀內(nèi)譯碼單元未在圖2中說明。如圖2中所展示,視頻編碼器50接收視頻幀內(nèi)的待編碼的當前視頻塊。在圖2的 實例中,視頻編碼器50包括運動估計單元32、運動補償單元35、參考幀存儲裝置34、加法器 48、變換單元38、量化單元40和熵譯碼單元46。對于視頻塊重建,視頻編碼器50還包括逆 量化單元42、逆變換單元44和加法器51。還可包括解塊濾波器(未圖示)以對塊邊界進 行濾波以從經(jīng)重建的視頻移除塊效應(yīng)假影(blockiness artifact)。視需要,解塊濾波器通 常將對加法器51的輸出進行濾波。在編碼過程期間,視頻編碼器50接收待譯碼的視頻塊,且運動估計單元32和運動 補償單元35執(zhí)行幀間預(yù)測譯碼。運動估計單元32和運動補償單元35可為高度集成的,但 為了概念的目的而單獨說明。通常認為運動估計為產(chǎn)生估計視頻塊的運動的運動向量的過 程。舉例來說,運動向量可指示預(yù)測幀(或其它經(jīng)譯碼的單元)內(nèi)的預(yù)測塊相對于當前幀 (或其它經(jīng)譯碼的單元)內(nèi)正譯碼的當前塊的位移。通常認為運動補償為基于由運動估計 所確定的運動向量而取得或產(chǎn)生預(yù)測塊的過程。再次,運動估計單元32和運動補償單元35 可為功能上集成的。為了論證的目的,本發(fā)明中所描述的偏移技術(shù)經(jīng)描述為由運動補償單 元35執(zhí)行。運動估計單元32通過將待譯碼的視頻塊與預(yù)測經(jīng)譯碼的單元(例如,先前幀)的 視頻塊進行比較而選擇所述待譯碼的視頻塊的適當運動向量。在此點處,運動補償單元35 可執(zhí)行內(nèi)插以便以子像素分辨率產(chǎn)生預(yù)測數(shù)據(jù)。特定來說,一旦運動估計單元32已選擇待 譯碼的視頻塊的運動向量,運動補償單元35就產(chǎn)生與所述運動向量相關(guān)聯(lián)的預(yù)測視頻塊。 運動補償單元35可產(chǎn)生具有子像素分辨率的任何預(yù)測視頻塊的一個或一個以上型式,例 如有可能應(yīng)用若干不同內(nèi)插濾波器以產(chǎn)生經(jīng)內(nèi)插的數(shù)據(jù)的不同集合。舉例來說,運動補償 單元35可應(yīng)用多個預(yù)界定的內(nèi)插濾波器以便產(chǎn)生待譯碼的視頻塊的多個不同經(jīng)內(nèi)插的預(yù) 測數(shù)據(jù)。運動補償單元35接著選擇實現(xiàn)最高壓縮等級的經(jīng)內(nèi)插的預(yù)測數(shù)據(jù)(例如,與內(nèi)插 濾波器中的一者相關(guān)聯(lián)的經(jīng)內(nèi)插的視頻塊)。在一些狀況下,用以產(chǎn)生預(yù)測數(shù)據(jù)的內(nèi)插濾波器可由作為一個或一個以上內(nèi)插語法元素而經(jīng)譯碼的數(shù)據(jù)指示,且傳送到熵譯碼單元46以用于包括在經(jīng)譯碼的位流中。根據(jù)本發(fā)明,運動補償單元35可執(zhí)行相對于經(jīng)譯碼的單元的第二譯碼遍次以便 將偏移添加到預(yù)測數(shù)據(jù),且借此改進可實現(xiàn)的壓縮的等級。特定來說,預(yù)測視頻塊的像素值 可根據(jù)與預(yù)測視頻塊的整數(shù)像素位置或非整數(shù)像素位置相關(guān)聯(lián)的偏移而向上或向下偏移。 由運動補償單元35所執(zhí)行的內(nèi)插可界定不同視頻塊的若干可能的子整數(shù)像素位置處的經(jīng) 內(nèi)插的數(shù)據(jù)。并非界定給定經(jīng)譯碼的單元的單一偏移值,運動補償單元可界定每一可能的 整數(shù)像素位置和子整數(shù)像素位置的不同偏移值。預(yù)測數(shù)據(jù)可接著基于與所述預(yù)測數(shù)據(jù)相關(guān) 聯(lián)的像素位置而應(yīng)用位置特定偏移。在一個實例中,運動補償單元35可計算分別與經(jīng)譯碼的單元的基于在每一整數(shù) 像素位置和子整數(shù)像素位置處的預(yù)測視頻塊而編碼的視頻塊相關(guān)聯(lián)的第一量度(例如,平 均值)集合。運動補償單元35還可計算分別與預(yù)測視頻塊(例如,實際上用以對經(jīng)譯碼的 單元的視頻塊進行編碼的那些預(yù)測塊)的每一整數(shù)像素位置和子整數(shù)像素位置相關(guān)聯(lián)的 第二量度(例如,平均值)集合。即,第一量度集合由正譯碼的數(shù)據(jù)界定,且第二量度集合 由用于預(yù)測譯碼的預(yù)測數(shù)據(jù)界定。運動補償單元35接著基于第一量度集合和第二量度集 合而計算所述多個偏移值。偏移值可包含用以使對應(yīng)的視頻塊的所有像素值向上或向下偏 離的絕對值或帶正負號的值,其再次可對視頻編碼中所遭遇的場景改變或閃光為非常有用 的。第一量度集合可包含與經(jīng)譯碼的單元的基于在每一整數(shù)像素位置和子整數(shù)像素 位置處的預(yù)測視頻塊而譯碼的相應(yīng)視頻塊相關(guān)聯(lián)的第一平均值集合,且第二量度集合可包 含分別與用以對經(jīng)譯碼的單元的相應(yīng)視頻塊進行編碼的預(yù)測視頻塊的每一整數(shù)像素位置 和子整數(shù)像素位置相關(guān)聯(lián)的第二平均值集合。在此狀況下,所述多個偏移值可包含第一平 均值集合與第二平均值集合之間的差。以此方式,若干不同偏移值可基于第一譯碼遍次中 所譯碼的實際數(shù)據(jù)而對于若干不同整數(shù)像素位置和子整數(shù)像素位置來界定。換句話說,第一量度集合可包含平均值集合,所述平均值對應(yīng)于給定經(jīng)譯碼的單 元的相應(yīng)視頻塊的像素值的平均值,基于每一相應(yīng)整數(shù)像素位置和子整數(shù)像素位置而對所 述相應(yīng)視頻塊進行譯碼。第二量度集合可包含平均值集合,所述平均值對應(yīng)于實際上用以 預(yù)測在所述經(jīng)譯碼的單元中正經(jīng)譯碼的當前塊的預(yù)測塊的每一整數(shù)像素位置和子整數(shù)像 素位置處的像素值的平均值。在界定第二量度集合的過程中,不包括經(jīng)考慮但實際上未用 于預(yù)測經(jīng)譯碼的視頻塊的任何預(yù)測塊的像素值。所述多個偏移值可包含第一平均值集合與 第二平均值集合之間的差。每一宏塊位置可由單一像素(例如,相應(yīng)宏塊的左上角中的相 應(yīng)像素)界定。然而,每一宏塊可界定促成第一平均值集合中的特定平均值的十六個像素 值。本發(fā)明的技術(shù)當然也可應(yīng)用于其它大小的視頻塊。大體來說,任何給定位置的偏移可 經(jīng)計算為具有對應(yīng)于所述像素位置或子像素位置的運動向量精確度的當前幀(或其它經(jīng) 譯碼的單元)中的所有像素的平均值與對應(yīng)于所述像素位置或子像素位置且用于預(yù)測當 前幀的視頻塊的預(yù)測數(shù)據(jù)的經(jīng)內(nèi)插值的平均值之間的差。因此,可將每一相應(yīng)偏移視作經(jīng) 譯碼的單元的像素相對于預(yù)測數(shù)據(jù)的平均差,所述預(yù)測數(shù)據(jù)在針對在譯碼方案中經(jīng)界定的 每一相應(yīng)整數(shù)、經(jīng)內(nèi)插或外插位置對經(jīng)譯碼的單元進行譯碼的過程中使用。本發(fā)明的偏移技術(shù)可相對于亮度塊、色度塊或所述兩者而應(yīng)用。不同偏移可對于與每一類型的視頻塊(例如,亮度塊和色度塊)相關(guān)聯(lián)的每一整數(shù)像素位置和子整數(shù)像素 位置而界定。此外,不同偏移可經(jīng)指派到具有每一特定大小的每一塊,每一塊的分區(qū)或子分 區(qū)。一旦界定偏移值,運動補償單元35就可執(zhí)行第二譯碼遍次以便基于預(yù)測數(shù)據(jù)和 偏移對視頻數(shù)據(jù)進行譯碼。特定來說,運動補償單元35可將偏移值應(yīng)用于原始預(yù)測視頻塊 以產(chǎn)生偏移預(yù)測視頻塊,且基于所述偏移預(yù)測視頻塊對經(jīng)譯碼的單元的視頻塊進行編碼。 通過根據(jù)預(yù)測塊的像素位置(整數(shù)位置或多個可能子整數(shù)像素位置中的一者)而以基于位 置的方式將偏移添加到預(yù)測塊的像素值,預(yù)測塊可更類似于正經(jīng)譯碼的塊,這可改進譯碼 效率。此外,由于偏移值對于不同像素位置不同地界定,所以本發(fā)明的技術(shù)可提供用以實現(xiàn) 與不同類型的內(nèi)插相關(guān)聯(lián)的數(shù)據(jù)的譯碼當中的分段的能力。一旦運動補償單元35已產(chǎn)生偏移預(yù)測數(shù)據(jù)(例如,可為經(jīng)內(nèi)插的數(shù)據(jù)或基于整數(shù) 的數(shù)據(jù)的偏移預(yù)測視頻塊),視頻編碼器50就通過從正經(jīng)譯碼的原始視頻塊減去所述偏移 預(yù)測數(shù)據(jù)而形成殘余視頻塊。加法器48表示執(zhí)行此減法運算的組件。變換單元38對殘余 塊應(yīng)用例如離散余弦變換(DCT)或概念上類似的變換等變換,從而產(chǎn)生包含殘余變換塊系 數(shù)的視頻塊。變換單元38(例如)可執(zhí)行其它變換,例如由H. 264標準界定的概念上類似 于DCT的變換。也可使用小波變換、整數(shù)變換、子帶變換或其它類型的變換。在任何狀況下, 變換單元38將變換應(yīng)用于殘余塊,從而產(chǎn)生殘余變換系數(shù)的塊。變換可將殘余信息從像素 域轉(zhuǎn)換到頻域。量化單元40量化殘余變換系數(shù)以進一步減小位速率。量化過程可減小與所述系 數(shù)中的一些或全部相關(guān)聯(lián)的位深度。舉例來說,可在量化期間將16位值下舍入為15位值。 另外,量化單元40還可使用本發(fā)明的技術(shù)來量化不同偏移以將所要數(shù)目的位分配到不同 偏移的相應(yīng)整數(shù)和分數(shù)部分。特定來說,量化單元40可對于偏移值中的每一者將第一數(shù)目 的位指派到給定偏移值的整數(shù)部分,且將第二數(shù)目的位指派到給定偏移值的分數(shù)部分,其 中基于整數(shù)部分的量值而確定位的第一數(shù)目和第二數(shù)目。熵譯碼單元46可與第二數(shù)目的 位不同地對第一數(shù)目的位進行編碼。在量化之后,熵譯碼單元46對經(jīng)量化的變換系數(shù)進行熵譯碼。舉例來說,熵譯碼 單元46可執(zhí)行內(nèi)容自適應(yīng)可變長度譯碼(CAVLC)、上下文自適應(yīng)二進制算術(shù)譯碼(CABAC) 或另一熵譯碼方法。在由熵譯碼單元46進行熵譯碼之后,可將經(jīng)編碼的視頻發(fā)射到另一裝 置或加以存檔以供稍后發(fā)射或檢索。經(jīng)譯碼的位流可包括經(jīng)熵譯碼的殘余塊、此類塊的運 動向量,和包括識別在經(jīng)譯碼的單元內(nèi)的不同整數(shù)像素位置和子整數(shù)像素位置處的所述多 個不同偏移的偏移值的其它語法。逆量化單元42和逆變換單元44分別應(yīng)用逆量化和逆變換以重建像素域中的殘余 塊(例如)以稍后用作參考塊。求和器51將經(jīng)重建的殘余塊加到由運動補償單元35產(chǎn)生 的經(jīng)運動補償?shù)念A(yù)測塊以產(chǎn)生經(jīng)重建的視頻塊以供存儲在參考幀存儲裝置34中。經(jīng)重建 的視頻塊可由運動估計單元32和運動補償單元35用作參考塊以對后續(xù)視頻幀中的塊進行 幀間編碼。圖3是說明視頻解碼器60的實例的框圖,所述視頻解碼器60對以本文中所描述 的方式進行編碼的視頻序列進行解碼。視頻解碼器60包括在解碼期間執(zhí)行本發(fā)明的偏移 技術(shù)的運動補償單元55。特定來說,在解碼側(cè),運動補償單元55可從熵解碼單元52接收語法元素,所述語法元素識別(例如)界定整數(shù)像素位置和一個或一個以上非整數(shù)像素位置 的不同偏移的經(jīng)譯碼的單元的多個偏移值。運動補償單元55可基于從熵解碼單元52所接 收的運動向量而產(chǎn)生預(yù)測數(shù)據(jù),且可(基于預(yù)測數(shù)據(jù)的像素位置)將適當偏移添加到此類 預(yù)測數(shù)據(jù)以產(chǎn)生偏移預(yù)測數(shù)據(jù)。預(yù)測數(shù)據(jù)可為經(jīng)內(nèi)插的數(shù)據(jù),在所述狀況下,非整數(shù)位置的 偏移值中的對應(yīng)一者可應(yīng)用于預(yù)測數(shù)據(jù)以產(chǎn)生偏移預(yù)測數(shù)據(jù)?;诖似祁A(yù)測數(shù)據(jù),可對 視頻數(shù)據(jù)(例如,經(jīng)重建的殘余視頻塊)進行解碼。特定來說,解碼器可將偏移預(yù)測數(shù)據(jù)與 殘余視頻塊組合以產(chǎn)生經(jīng)編碼的原始視頻塊。熵解碼單元52對所接收位流進行熵解碼以產(chǎn)生經(jīng)量化的系數(shù)和語法(例如,經(jīng)譯 碼的單元的運動向量和多個偏移值)。語法從熵譯碼單元52轉(zhuǎn)發(fā)到運動補償單元55。逆 量化單元56逆量化(即,解量化)經(jīng)量化塊系數(shù)。逆量化過程可為如由H. 264解碼所界定 的常規(guī)過程。逆變換單元58將逆變換(例如,逆DCT或概念上類似的逆變換過程)應(yīng)用于 變換系數(shù)以便產(chǎn)生在像素域中的殘余塊。運動補償單元55產(chǎn)生經(jīng)運動補償?shù)膲K,從而有可 能基于也可包括于語法中的內(nèi)插濾波器系數(shù)的一個或一個以上集合而執(zhí)行內(nèi)插。一旦運動 補償單元55基于運動向量產(chǎn)生預(yù)測塊,就可將每一預(yù)測塊的適當偏移添加到預(yù)測塊以產(chǎn) 生用于由編碼器所執(zhí)行的原始編碼中的偏移預(yù)測塊。求和器64通過使殘余塊與由運動補償單元55所產(chǎn)生的對應(yīng)的偏移預(yù)測塊相加而 對殘余塊進行解碼以形成經(jīng)解碼的塊。視需要,還可應(yīng)用解塊濾波器以對經(jīng)解碼的塊進行 濾波以便移除塊效應(yīng)假影。接著將經(jīng)解碼的視頻塊存儲于參考幀存儲裝置62中,參考幀存 儲裝置62提供用于后續(xù)運動補償?shù)膮⒖級K且還對驅(qū)動顯示裝置(例如,圖1的裝置28)產(chǎn) 生經(jīng)解碼的視頻。再次,本發(fā)明的技術(shù)涉及將偏移應(yīng)用于經(jīng)運動補償?shù)念A(yù)測數(shù)據(jù),其中不同偏移用 于由內(nèi)插所界定的整數(shù)像素位置和不同的子整數(shù)像素位置。編碼器使用本發(fā)明的技術(shù)以界 定和應(yīng)用不同的偏移值,且解碼器解譯從編碼器所發(fā)送的語法元素以便識別由編碼器所界 定和使用的相同偏移值。將適當偏移應(yīng)用于預(yù)測數(shù)據(jù)的像素值,且基于經(jīng)界定以用于此類 預(yù)測數(shù)據(jù)的像素位置(例如,整數(shù)像素位置或若干可能的非整數(shù)像素位置中的一者)來選 擇適當偏移。圖4是說明與預(yù)測數(shù)據(jù)相關(guān)聯(lián)的整數(shù)像素位置和與經(jīng)內(nèi)插的預(yù)測數(shù)據(jù)相關(guān)聯(lián)的 子整數(shù)像素位置的概念圖。在圖4的概念說明中,不同框表示像素。大寫字母(在具有實線 的框中)表示整數(shù)像素位置,而小寫字母(在具有虛線的框中)表示子整數(shù)經(jīng)內(nèi)插的像素 位置。像素位置“aa”、"bb,,、“ cc,,、“ dd”、“ ee,,、“ f f ”、“ gg”、“hh”、“ i i ” 和“ j j,,是用于分數(shù) 內(nèi)插中的半像素位置,各種分數(shù)位置與像素位置“C3”相關(guān)聯(lián)。每一像素可對應(yīng)于視頻塊的 右上角像素,以使得所述像素界定所述視頻塊。對于內(nèi)插或外插,使視頻塊的像素中的每一 者以相對于具有距相應(yīng)子整數(shù)像素相同空間距離的不同整數(shù)像素的相同方式內(nèi)插或外插。每一整數(shù)像素位置具有相關(guān)聯(lián)的15個不同的分數(shù)(“子整數(shù)”)位置。在圖4的 實例中,與像素“C3”相關(guān)聯(lián)的這15個不同的分數(shù)位置經(jīng)說明為子整數(shù)像素位置“a”、“b”、 “ c ”、“ d”、“ e ”、“ f ”、“ g”、“h ”、“ i ”、“ j ”、“ k”、“ 1 ”、“m”、“η ” 和 “ ο ”。類似地,與像素 “Ε5 ” 相 關(guān)聯(lián)的15個不同的分數(shù)位置經(jīng)說明為子整數(shù)像素位置“a',,、“b',,、“c',,、“d',,、“e' ”、 "f' ”、“g' ”、“h' ”、“i' ”、“j' ”、“k' ”、“1' ”、“m' ”、“η' ”和“ο' ”。為了簡易性起 見,未展示其它分數(shù)位置中的大多數(shù)(不同于上文所提及的用以產(chǎn)生15個不同的分數(shù)位置中的與像素“C3”相關(guān)聯(lián)的一者或一者以上的那些分數(shù)位置)。在ITU H. 264/AVC標準中,舉例來說,為了在半像素位置處獲得亮度信號,通常使 用具有系數(shù)[1,"5,20,20, -5,1]的6分接頭溫納濾波器(Wiener filter)。接著,為了在 四分之一像素位置處獲得亮度信號,使用雙線性濾波器。雙線性濾波器還可用于對于色度 分量的分數(shù)像素內(nèi)插中,色度分量可具有H. 264/AVC中的高達1/8像素精確度。在運動估計之后,例如,有可能使用速率失真模型以便使譯碼速率和視頻質(zhì)量平 衡而可識別給定視頻塊的最佳運動向量。使用最佳運動向量在運動補償期間形成預(yù)測視頻 塊。如上文所概述,通過從原始視頻塊減去預(yù)測視頻塊來形成殘余視頻塊。接著對殘余塊 應(yīng)用變換,且變換系數(shù)經(jīng)量化和熵譯碼以進一步減小位速率。然而,并非使用預(yù)測視頻塊來產(chǎn)生殘余塊,本發(fā)明的技術(shù)將偏移添加到預(yù)測視頻 塊。此外,偏移可為位置特定的,因為不同偏移對于不同整數(shù)像素位置和子整數(shù)像素位置而 界定。由于像素“b”和“b' ”界定相對于整數(shù)像素C3和E5的相同子整數(shù)像素位置,所以 與由這兩個像素所識別的視頻塊相關(guān)聯(lián)的偏移可為相同的。然而,由于像素“C”和“d',, 界定相對于整數(shù)像素C3和E5的不同子整數(shù)像素位置,所以與由像素“C”和“d' ”所識別 的視頻塊相關(guān)聯(lián)的偏移可為不同的。十六個不同像素位置“C3”、“a”、“b”、“C”、“d”、“e”、 “ f ”、“ g”、“h ”、“ i ”、“ j ”、“ k”、“ 1 ”、“m”、“η ”和“ ο ”中的每一者可界定不同偏移。此外,這些 不同偏移還可分別應(yīng)用于十六個不同像素位置“E5”、“a' ”、“b' ”、“c' ”、“d' ”、“e',,、 "f' ”、“g' ”、“h' ”、“i' ”、“j' ”、“k' ”、“1' ”、“m' ”、“η' ”和“ο' ” 中的每一者。偏 移可界定本質(zhì)上使預(yù)測塊的每一像素值向上或向下偏離以產(chǎn)生偏移預(yù)測塊的帶正負號的 值??蓪⑺銎品Q作DC偏移,因為其包含經(jīng)譯碼的單元的所有像素相對于所有對應(yīng)的預(yù) 測像素(用于在每一相應(yīng)樣本位置處的預(yù)測譯碼)的平均值的平均差,所述平均差基于特 定樣本位置(整數(shù)位置或特定子整數(shù)位置)而預(yù)測。再次,圖4展示具有大寫字母的實線框中的整數(shù)像素樣本(也稱作全像素)。對 于任何給定整數(shù)像素樣本,可存在15個子像素位置,其對于整數(shù)像素樣本“C3”而展示且在 圖4中標記為“a”到“O”。根據(jù)H. 264/AVC,運動補償單元35可首先使用一維6分接頭溫 納濾波器來計算半像素位置“b”、“h”和“j”??墒紫仍谒椒较蛏锨医又诖怪狈较蛏蠎?yīng) 用內(nèi)插濾波器,或反之亦然。運動補償單元35可接著使用雙線性濾波器和已經(jīng)計算的半像 素樣本對剩余的四分之一像素位置進行濾波。經(jīng)應(yīng)用以產(chǎn)生經(jīng)內(nèi)插的數(shù)據(jù)的實際濾波器可經(jīng)受廣泛多種實施方案。作為一個實 例,運動補償單元35可使用自適應(yīng)內(nèi)插濾波來界定經(jīng)內(nèi)插的值。在另一實例中,可應(yīng)用內(nèi) 插濾波器的若干集合,且可選擇產(chǎn)生最佳預(yù)測數(shù)據(jù)的集合。根據(jù)本發(fā)明,偏移的添加在產(chǎn)生 用于譯碼中的任何經(jīng)內(nèi)插的預(yù)測數(shù)據(jù)之后發(fā)生。ITU-T SG16/Q. 6/VCEG(視頻譯碼專家組)委員會已探索出提供比H. 264/AVC高的 譯碼效率的譯碼技術(shù)。此探索包括在KTA(關(guān)鍵技術(shù)區(qū)域)論壇上所進行的工作。將已采 用到KTA中的譯碼工具中的一者稱作自適應(yīng)內(nèi)插濾波器(AIF)。AIF經(jīng)由H. 264/AVC而提 供較大譯碼增益,尤其在具有高分辨率(例如,720p)的視頻序列上。在AIF中,通過最小化 預(yù)測錯誤能量而對于每一視頻幀分析性地計算用于每一子像素位置的內(nèi)插濾波器。每一幀 的分析性地導(dǎo)出的自適應(yīng)濾波器系數(shù)接著經(jīng)預(yù)測、量化、譯碼和在視頻位流中發(fā)送。本發(fā)明 的偏移技術(shù)可在AIF方案以及許多其它內(nèi)插方案內(nèi)工作。
三種不同類型的AIF方案已采用到KTA中。第一種為二維不可分離AIF(NS-AIF), 第二種為可分離AIF(S-AIF),且第三種為具有定向濾波器的AIF(DAIF)。然而,所有三種 AIF方案使用同一分析過程以導(dǎo)出濾波器系數(shù),其通過使用作為一實例的不可分離AIF而 在下文解釋。假設(shè)6X6 二維不可分離濾波器具有系數(shù)/^,其中i,j = 0. . . 5,且SP表示圖4中 所展示的15個子像素位置(a到ο)中的一者。注意,15個子像素位置中的6個“a”、“b”、 “c”、“d”、“h”和“i”為一維子像素位置,且運動補償單元35可使用6分接頭濾波器以內(nèi)插 此類數(shù)據(jù)。并且,假設(shè)在參考幀中的整數(shù)像素位置(圖4中的Al到F6)處的預(yù)測像素采取 像素值Pi,」,其中i,j = 0... 5。BP, Al采取值PQ,。、...,A6采取值P5,。、...,F(xiàn)l采取值P5,
。...,且F6采取值P5,5。接著,在子像素位置SP (SP e {a.....ο})處的經(jīng)內(nèi)插的值pSP可由
運動補償單元35使用以下等式計算。
權(quán)利要求
1.一種對視頻數(shù)據(jù)進行編碼的方法,所述方法包含計算所述視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值,其中所述偏移值與多個不同整數(shù)像 素位置和子整數(shù)像素位置相關(guān)聯(lián);將所述偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊;以及基于所述偏移預(yù)測視頻塊而對所述經(jīng)譯碼的單元的視頻塊進行編碼。
2.根據(jù)權(quán)利要求1所述的方法,其進一步包含對作為經(jīng)譯碼的位流的一部分的所述偏 移值進行編碼,所述經(jīng)譯碼的位流包括所述經(jīng)譯碼的單元的經(jīng)譯碼的視頻塊。
3.根據(jù)權(quán)利要求2所述的方法,其中對所述偏移值進行編碼包含對于所述偏移值中的 每一者將第一數(shù)目的位指派到給定偏移值的整數(shù)部分,且將第二數(shù)目的位指派到所述給定 偏移值的分數(shù)部分,其中位的所述第一數(shù)目和所述第二數(shù)目基于所述整數(shù)部分的量值而確 定。
4.根據(jù)權(quán)利要求3所述的方法,其進一步包含與所述第二數(shù)目的位不同地對所述第一 數(shù)目的位進行編碼。
5.根據(jù)權(quán)利要求2所述的方法,其進一步包含將所述經(jīng)譯碼的位流從源裝置發(fā)射到目 的地裝置。
6.根據(jù)權(quán)利要求1所述的方法,其中所述經(jīng)譯碼的單元包含視頻幀和視頻幀的片段中的一者。
7.根據(jù)權(quán)利要求1所述的方法,其中所述偏移值包括整數(shù)像素位置的一個偏移值和不 同子整數(shù)像素位置的若干偏移值。
8.根據(jù)權(quán)利要求7所述的方法,其中所述偏移值包括十五個不同子整數(shù)像素位置的 十五個不同偏移值。
9.根據(jù)權(quán)利要求1所述的方法,其中計算所述多個偏移值包括計算與所述經(jīng)譯碼的單元的相應(yīng)視頻塊相關(guān)聯(lián)的第一量度集合,所述相應(yīng)視頻塊基于 在每一整數(shù)像素位置和子整數(shù)像素位置處的所述預(yù)測視頻塊而編碼;計算與所述預(yù)測視頻塊的每一整數(shù)像素位置和子整數(shù)像素位置相關(guān)聯(lián)的第二量度集 合;以及基于所述第一量度集合和所述第二量度集合而計算所述多個偏移值。
10.根據(jù)權(quán)利要求9所述的方法,其中所述第一量度集合包含與所述經(jīng)譯碼的單元的所述相應(yīng)視頻塊相關(guān)聯(lián)的第一平均值 集合,所述相應(yīng)視頻塊基于在每一整數(shù)像素位置和子整數(shù)像素位置處的所述預(yù)測視頻塊而 譯碼;所述第二量度集合包含與所述預(yù)測視頻塊的每一整數(shù)像素位置和子整數(shù)像素位置相 關(guān)聯(lián)的第二平均值集合;且所述多個偏移值包含所述第一平均值集合與所述第二平均值集合之間的差。
11.根據(jù)權(quán)利要求1所述的方法,其進一步包含重新計算所述視頻數(shù)據(jù)的不同經(jīng)譯碼 的單元的所述多個偏移值。
12.—種對視頻數(shù)據(jù)進行解碼的方法,所述方法包含接收所述視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值,其中所述偏移值與多個不同整數(shù)像 素位置和子整數(shù)像素位置相關(guān)聯(lián);將所述偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊;以及基于所述偏移預(yù)測視頻塊而對所述經(jīng)譯碼的單元的視頻塊進行解碼。
13.根據(jù)權(quán)利要求12所述的方法,其中所述經(jīng)譯碼的單元包含視頻幀和視頻幀的片段中的一者。
14.根據(jù)權(quán)利要求12所述的方法,其中所述偏移值包括整數(shù)像素位置的一個偏移值和 不同子整數(shù)像素位置的若干偏移值。
15.根據(jù)權(quán)利要求14所述的方法,其中所述偏移值包括十五個不同子整數(shù)像素位置的 十五個不同偏移值。
16.根據(jù)權(quán)利要求12所述的方法,其中所述偏移值包含第一平均值集合與第二平均值 集合之間的差,所述第一平均值集合與所述經(jīng)譯碼的單元的基于在每一整數(shù)像素位置和子 整數(shù)像素位置處的所述預(yù)測視頻塊而編碼的相應(yīng)視頻塊相關(guān)聯(lián),且所述第二平均值集合與 所述預(yù)測視頻塊的每一整數(shù)像素位置和子整數(shù)像素位置相關(guān)聯(lián)。
17.根據(jù)權(quán)利要求12所述的方法,其中對于所述視頻數(shù)據(jù)的不同經(jīng)譯碼的單元重復(fù)所 述方法。
18.—種對視頻數(shù)據(jù)進行編碼的設(shè)備,所述設(shè)備包含進行以下動作的視頻編碼器計算所述視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值,其中所述偏移值與多個不同整數(shù)像 素位置和子整數(shù)像素位置相關(guān)聯(lián);將所述偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊;以及基于所述偏移預(yù)測視頻塊而對所述經(jīng)譯碼的單元的視頻塊進行編碼。
19.根據(jù)權(quán)利要求18所述的設(shè)備,其中所述視頻編碼器包括熵譯碼單元,所述熵譯碼 單元對作為經(jīng)譯碼的位流的一部分的所述偏移值進行編碼,所述經(jīng)譯碼的位流包括所述經(jīng) 譯碼的單元的經(jīng)譯碼的視頻塊。
20.根據(jù)權(quán)利要求18所述的設(shè)備,其中所述視頻編碼器包括量化單元,所述量化單元 對于所述偏移值中的每一者將第一數(shù)目的位指派到給定偏移值的整數(shù)部分,且將第二數(shù)目 的位指派到所述給定偏移值的分數(shù)部分,其中位的所述第一數(shù)目和所述第二數(shù)目基于所述 整數(shù)部分的量值而確定。
21.根據(jù)權(quán)利要求20所述的設(shè)備,其中所述視頻編碼器與所述第二數(shù)目的位不同地對 所述第一數(shù)目的位進行編碼。
22.根據(jù)權(quán)利要求18所述的設(shè)備,其中所述經(jīng)譯碼的單元包含視頻幀和視頻幀的片段 中的一者。
23.根據(jù)權(quán)利要求18所述的設(shè)備,其中所述偏移值包括整數(shù)像素位置的一個偏移值和 不同子整數(shù)像素位置的若干偏移值。
24.根據(jù)權(quán)利要求23所述的設(shè)備,其中所述偏移值包括十五個不同子整數(shù)像素位置的 十五個不同偏移值。
25.根據(jù)權(quán)利要求18所述的設(shè)備,其中所述視頻編碼器計算與所述經(jīng)譯碼的單元的相應(yīng)視頻塊相關(guān)聯(lián)的第一量度集合,所述相應(yīng)視頻塊基于 在每一整數(shù)像素位置和子整數(shù)像素位置處的所述預(yù)測視頻塊而編碼;計算與所述預(yù)測視頻塊的每一整數(shù)像素位置和子整數(shù)像素位置相關(guān)聯(lián)的第二量度集 合;以及基于所述第一量度集合和所述第二量度集合而計算所述多個偏移值。
26.根據(jù)權(quán)利要求25所述的設(shè)備,其中所述第一量度集合包含與所述經(jīng)譯碼的單元的所述相應(yīng)視頻塊相關(guān)聯(lián)的第一平均值 集合,所述相應(yīng)視頻塊基于在每一整數(shù)像素位置和子整數(shù)像素位置處的所述預(yù)測視頻塊而 譯碼;所述第二量度集合包含與所述預(yù)測視頻塊的每一整數(shù)像素位置和子整數(shù)像素位置相 關(guān)聯(lián)的第二平均值集合;且所述多個偏移值包含所述第一平均值集合與所述第二平均值集合之間的差。
27.根據(jù)權(quán)利要求18所述的設(shè)備,其中所述視頻編碼器重新計算所述視頻數(shù)據(jù)的不同 經(jīng)譯碼的單元的所述偏移值。
28.根據(jù)權(quán)利要求18所述的設(shè)備,其中所述設(shè)備包含集成電路。
29.根據(jù)權(quán)利要求18所述的設(shè)備,其中所述設(shè)備包含微處理器。
30.根據(jù)權(quán)利要求18所述的設(shè)備,其進一步包含將經(jīng)譯碼的位流發(fā)送到另一裝置的無 線發(fā)射器,其中所述經(jīng)譯碼的位流包括所述多個偏移值,且其中所述設(shè)備包含無線通信手 機。
31.一種對視頻數(shù)據(jù)進行解碼的設(shè)備,所述設(shè)備包含進行以下動作的視頻解碼器接收所述視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值,其中所述偏移值與多個不同整數(shù)像 素位置和子整數(shù)像素位置相關(guān)聯(lián);將所述偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊;以及基于所述偏移預(yù)測視頻塊而對所述經(jīng)譯碼的單元的視頻塊進行解碼。
32.根據(jù)權(quán)利要求31所述的設(shè)備,其中所述經(jīng)譯碼的單元包含視頻幀和視頻幀的片段 中的一者。
33.根據(jù)權(quán)利要求31所述的設(shè)備,其中所述偏移值包括整數(shù)像素位置的一個偏移值和 不同子整數(shù)像素位置的若干偏移值。
34.根據(jù)權(quán)利要求33所述的設(shè)備,其中所述偏移值包括十五個不同子整數(shù)像素位置的 十五個不同偏移值。
35.根據(jù)權(quán)利要求31所述的設(shè)備,其中所述偏移值包含第一平均值集合與第二平均值 集合之間的差,所述第一平均值集合與所述經(jīng)譯碼的單元的基于在每一整數(shù)像素位置和子 整數(shù)像素位置處的所述預(yù)測視頻塊而編碼的相應(yīng)視頻塊相關(guān)聯(lián),且所述第二平均值集合與 所述預(yù)測視頻塊的每一整數(shù)像素位置和子整數(shù)像素位置相關(guān)聯(lián)。
36.根據(jù)權(quán)利要求31所述的設(shè)備,其中所述視頻解碼器接收并應(yīng)用所述視頻數(shù)據(jù)的不 同經(jīng)譯碼的單元的不同的多個偏移值。
37.根據(jù)權(quán)利要求31所述的設(shè)備,其中所述設(shè)備包含集成電路。
38.根據(jù)權(quán)利要求31所述的設(shè)備,其中所述設(shè)備包含微處理器。
39.根據(jù)權(quán)利要求31所述的設(shè)備,其進一步包含從另一裝置接收經(jīng)譯碼的位流的無線 接收器,其中所述經(jīng)譯碼的位流包括所述多個偏移值,且其中所述設(shè)備包含無線通信手機。
40.一種計算機可讀媒體,其包含在執(zhí)行后便致使一裝置對視頻數(shù)據(jù)進行編碼的指令, 其中所述指令致使所述裝置計算所述視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值,其中所述偏移值與多個不同整數(shù)像素位置和子整數(shù)像素位置相關(guān)聯(lián);將所述偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊;以及 基于所述偏移預(yù)測視頻塊而對所述經(jīng)譯碼的單元的視頻塊進行編碼。
41.一種計算機可讀媒體,其包含在執(zhí)行后便致使一裝置對視頻數(shù)據(jù)進行解碼的指令, 其中在接收所述視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值后,其中所述偏移值與多個不同整 數(shù)像素位置和子整數(shù)像素位置相關(guān)聯(lián),所述指令便致使所述裝置將所述偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊;以及 基于所述偏移預(yù)測視頻塊而對所述經(jīng)譯碼的單元的視頻塊進行解碼。
42.一種對視頻數(shù)據(jù)進行編碼的裝置,所述裝置包含用于計算所述視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值的裝置,其中所述偏移值與多個 不同整數(shù)像素位置和子整數(shù)像素位置相關(guān)聯(lián);用于將所述偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊的裝置;以及 用于基于所述偏移預(yù)測視頻塊而對所述經(jīng)譯碼的單元的視頻塊進行編碼的裝置。
43.一種對視頻數(shù)據(jù)進行解碼的裝置,所述裝置包含用于接收所述視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值的裝置,其中所述偏移值與多個 不同整數(shù)像素位置和子整數(shù)像素位置相關(guān)聯(lián);用于將所述偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊的裝置;以及 用于基于所述偏移預(yù)測視頻塊而對所述經(jīng)譯碼的單元的視頻塊進行解碼的裝置。全文摘要
本發(fā)明描述在視頻編碼和解碼過程期間所應(yīng)用的技術(shù)。在一個實例中,一種對視頻數(shù)據(jù)進行編碼的方法包含計算所述視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值,其中所述偏移值與多個不同整數(shù)像素位置和子整數(shù)像素位置相關(guān)聯(lián);將所述偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊;以及基于所述偏移預(yù)測視頻塊而對所述經(jīng)譯碼的單元的視頻塊進行編碼。在另一實例中,一種對視頻數(shù)據(jù)進行解碼的方法包含接收所述視頻數(shù)據(jù)的經(jīng)譯碼的單元的多個偏移值,其中所述偏移值與多個不同整數(shù)像素位置和子整數(shù)像素位置相關(guān)聯(lián);將所述偏移值應(yīng)用于預(yù)測視頻塊以產(chǎn)生偏移預(yù)測視頻塊;以及基于所述偏移預(yù)測視頻塊而對所述經(jīng)譯碼的單元的視頻塊進行解碼。
文檔編號H04N7/26GK101999230SQ200980112681
公開日2011年3月30日 申請日期2009年4月10日 優(yōu)先權(quán)日2008年4月10日
發(fā)明者葉琰, 馬爾塔·卡切維奇 申請人:高通股份有限公司