圖像編碼設(shè)備和圖像解碼設(shè)備的制作方法
【專利摘要】在本發(fā)明中,提供一種圖像編碼設(shè)備,該圖像編碼設(shè)備具有:量化步長編碼單元(11),用于對控制量化細度的量化步長進行編碼;以及量化步長下采樣單元(12),該量化步長下采樣單元(12)對一個或多個經(jīng)編碼的量化步長執(zhí)行下采樣,以生成量化步長代表值。量化步長編碼單元(11)被配置以使得使用量化步長代表值來預(yù)測量化步長。
【專利說明】圖像編碼設(shè)備和圖像解碼設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及視頻編碼技術(shù),并且尤其涉及參考重構(gòu)圖像和通過量化的數(shù)據(jù)壓縮而執(zhí)行預(yù)測的視頻編碼技術(shù)。
【背景技術(shù)】
[0002]典型的視頻編碼設(shè)備對輸入視頻的每個幀執(zhí)行符合預(yù)定視頻編碼方案的編碼過程,以生成編碼數(shù)據(jù),即,比特流。非專利文獻(NPL)I中所描述的IS0/IEC14496-10高級視頻編碼(AVC)是預(yù)定視頻編碼方案的代表性示例,該方案將每個幀劃分為被稱為宏塊(MB)的16X 16像素尺寸的塊,并進一步將每個MB劃分為4X4像素尺寸的塊,其中MB是編碼的最小單元。圖17示出了在幀的顏色格式為YCbCr4:2:0格式并且空間分辨率為QCIF(四分之一通用中間格式)的情況下的塊劃分的示例。
[0003]通過劃分而獲得的每個圖像塊被依次輸入至視頻編碼設(shè)備并被編碼。圖18是示出用于生成符合AVC的比特流的典型視頻編碼設(shè)備結(jié)構(gòu)的示例的框圖。下文參考圖18描述典型視頻編碼設(shè)備的結(jié)構(gòu)和操作。
[0004]圖18中所示的視頻編碼設(shè)備包括變頻器101、量化器102、可變長度編碼器103、量化控制器104、逆量化器105、逆變頻器106、幀存儲器107、幀內(nèi)預(yù)測器108、幀間預(yù)測器109、預(yù)測選擇器110,以及比特流緩沖器111。
[0005]從輸入到視頻編碼設(shè)備的圖像中減去經(jīng)由預(yù)測選擇器110而從幀內(nèi)預(yù)測器108或幀間預(yù)測器109供應(yīng)的預(yù)測圖像,并將結(jié)果輸入至變頻器101作為預(yù)測誤差圖像。
[0006]變頻器101將輸入的預(yù)測誤差圖像從空間域變換至頻域,并輸出結(jié)果作為系數(shù)圖像。
[0007]量化器102使用從量化控制器104供應(yīng)的用于控制量化粒度的量化步長,來量化從變頻器101供應(yīng)的系數(shù)圖像,并輸出結(jié)果作為量化系數(shù)圖像。
[0008]可變長度編碼器103對從量化器102供應(yīng)的量化系數(shù)圖像進行熵編碼。該可變長度編碼器103還對從量化控制器104供應(yīng)的量化步長和從預(yù)測選擇器110供應(yīng)的圖像預(yù)測參數(shù)進行編碼。這些經(jīng)編碼的數(shù)據(jù)被多路復(fù)用并存儲在比特流緩沖器111中作為比特流。
[0009]比特流緩沖器111存儲從可變長度編碼器103供應(yīng)的比特流,并以預(yù)定傳輸速率輸出該比特流作為視頻編碼設(shè)備的輸出。視頻編碼設(shè)備中的處理速率和從視頻編碼設(shè)備輸出的比特流的傳輸速率由比特流緩沖器111來調(diào)節(jié)。
[0010]下文參考圖19描述可變長度編碼器103中的量化步長編碼過程。如圖19中所示,可變長度編碼器103中用于編碼量化步長的量化步長編碼器包括量化步長緩沖器10311和熵編碼器10312。
[0011]量化步長緩沖器10311保持指派給緊鄰的前一編碼的圖像塊的量化步長Q(1-1)。
[0012]如以下公式(I)中所示,從輸入的量化步長Q(i)中減去從量化步長緩沖器10311供應(yīng)的緊鄰的前一量化步長Q(1-1),并將結(jié)果輸入至熵編碼器10312作為差分量化步長dQ(i)。
[0013]dQ(i)=Q(i) -Q(1-1)..*(1)。
[0014]熵編碼器10312熵編碼輸入的差分量化步長dQ(i),并輸出結(jié)果作為對應(yīng)于量化步長的碼。
[0015]這樣就完成了對量化步長編碼過程的描述。
[0016]量化控制器104確定針對當(dāng)前輸入的圖像塊的量化步長。通常,量化控制器104監(jiān)控可變長度編碼器103的輸出碼的量,并增大量化步長以便減少針對圖像塊的輸出碼的量,或者減小量化步長以便增加針對圖像塊的輸出碼的量。增大或減小量化步長以使視頻編碼設(shè)備能夠以期望的碼量對輸入的運動圖像進行編碼。將確定的量化步長供應(yīng)至量化器102和可變長度編碼器103。
[0017]通過逆量化器105將從量化器102輸出的量化系數(shù)圖像逆量化成系數(shù)圖像,以便用于后續(xù)圖像塊編碼中的預(yù)測。通過逆變頻器106將從逆量化器105輸出的系數(shù)圖像變換回空間域,作為預(yù)測誤差圖像。將預(yù)測的圖像添加至預(yù)測誤差圖像,并且將結(jié)果作為重構(gòu)圖像輸入至幀存儲器107和幀內(nèi)預(yù)測器108。
[0018]幀存儲器107存儲先前輸入并編碼的圖像幀的重構(gòu)圖像。存儲在幀存儲器107中的圖像幀被稱為“參考幀”。
[0019]幀內(nèi)預(yù)測器108通過在當(dāng)前正在被編碼的圖像幀中參考先前編碼的圖像塊的重構(gòu)圖像來生成預(yù)測圖像。
[0020]幀間預(yù)測器109通過參考從幀存儲器107供應(yīng)的參考幀來生成預(yù)測圖像。
[0021]預(yù)測選擇器110對從幀內(nèi)預(yù)測器108供應(yīng)的預(yù)測圖像和從幀間預(yù)測器109供應(yīng)的預(yù)測圖像進行比較,并選擇和輸出更接近于輸入圖像的預(yù)測圖像。預(yù)測選擇器110還輸出關(guān)于幀內(nèi)預(yù)測器108或幀間預(yù)測器109所采用的預(yù)測方法的信息(稱為“圖像預(yù)測參數(shù)”),以將該信息供應(yīng)至可變長度編碼器103。
[0022]典型的視頻編碼設(shè)備通過上述過程對輸入的運動圖像進行壓縮編碼從而生成比特流。
[0023]將輸出的比特流傳輸至視頻解碼設(shè)備。視頻解碼設(shè)備對該比特流執(zhí)行解碼過程,以恢復(fù)運動圖像。圖20示出了用于解碼從典型視頻編碼設(shè)備輸出的比特流以獲得解碼視頻的典型視頻解碼設(shè)備的結(jié)構(gòu)的示例。下文參考圖20描述典型視頻解碼設(shè)備的結(jié)構(gòu)和操作。
[0024]圖20中所示的視頻解碼設(shè)備包括可變長度解碼器201、逆量化器202、逆變頻器203、幀存儲器204、幀內(nèi)預(yù)測器205、幀間預(yù)測器206、預(yù)測選擇器207,以及比特流緩沖器208。
[0025]比特流緩沖器208存儲輸入的比特流,并繼而將該比特流輸出至可變長度解碼器201。向視頻解碼設(shè)備輸入的比特流的傳輸速率和視頻解碼設(shè)備中的處理速率由比特流緩沖器208來調(diào)節(jié)。
[0026]可變長度解碼器201對從比特流緩沖器208輸入的比特流進行可變長度解碼,以獲得用于控制量化粒度的量化步長、量化系數(shù)圖像以及圖像預(yù)測參數(shù)。將量化步長和量化系數(shù)圖像供應(yīng)至逆量化器202。將圖像預(yù)測參數(shù)供應(yīng)至預(yù)測選擇器207。
[0027]逆量化器202基于輸入的量化步長來對輸入的量化系數(shù)圖像進行逆量化,并輸出結(jié)果作為系數(shù)圖像。
[0028]逆變頻器203將從逆量化器202供應(yīng)的系數(shù)圖像從頻域變換至空間域,并輸出結(jié)果作為預(yù)測誤差圖像。將從預(yù)測選擇器207供應(yīng)的預(yù)測圖像添加至預(yù)測誤差圖像,以生成解碼圖像。將解碼圖像作為輸出圖像從視頻解碼設(shè)備輸出,并且還將其輸入至幀存儲器204和幀內(nèi)預(yù)測器205。
[0029]幀存儲器204存儲先前解碼的圖像幀。存儲在幀存儲器204中的圖像幀被稱為“參考幀”。
[0030]幀內(nèi)預(yù)測器205通過基于從可變長度解碼器201供應(yīng)的圖像預(yù)測參數(shù),在當(dāng)前正在被解碼的圖像幀中參考先前解碼的圖像塊的重構(gòu)圖像,來生成預(yù)測圖像。
[0031]幀間預(yù)測器206通過基于從可變長度解碼器201供應(yīng)的圖像預(yù)測參數(shù),參考從幀存儲器204供應(yīng)的參考幀,來生成預(yù)測圖像。
[0032]預(yù)測選擇器207基于從可變長度解碼器201供應(yīng)的圖像預(yù)測參數(shù),來選擇從幀內(nèi)預(yù)測器205供應(yīng)的預(yù)測圖像或從幀間預(yù)測器206供應(yīng)的預(yù)測圖像。
[0033]下文參考圖21描述可變長度解碼器201中的量化步長解碼過程。如圖21中所示,可變長度解碼器201中用于解碼量化步長的量化步長解碼器包括熵解碼器20111和量化步長緩沖器20112。
[0034]熵解碼器20111熵解碼輸入的碼,并輸出差分量化步長dQ(i)。
[0035]量化步長緩沖器20112保持緊鄰的前一量化步長Q(1-1)。
[0036]如以下公式⑵中所示,將從量化步長緩沖器20112供應(yīng)的Q(i_ I)添加至由熵解碼器20111所生成的差分量化步長dQ(i)。將總和作為量化步長Q(i)輸出,并且還將其輸入至量化步長緩沖器20112。
[0037]Q(i)=Q(1- l)+dQ(i)...(2)。
[0038]這樣就完成了對量化步長解碼過程的描述。
[0039]典型視頻解碼設(shè)備通過上述過程來解碼輸入的比特流從而生成運動圖像。
[0040]通常,典型視頻編碼設(shè)備中的量化控制器104不僅分析輸出的碼的量,而且還分析輸入圖像和預(yù)測誤差圖像中之一或二者以根據(jù)人眼視覺敏感度來確定量化步長,以便保持通過編碼過程壓縮的運動圖像的主觀質(zhì)量。亦即,量化控制器104執(zhí)行視覺敏感度自適應(yīng)量化。具體而言,量化控制器104在確定對于當(dāng)前所要編碼的圖像的人眼視覺敏感度為高的情況下設(shè)置小的量化步長,而在確定人眼視覺敏感度為低的情況下設(shè)置大的量化步長。這樣的控制允許將較大量的碼指派給視覺敏感度為高的區(qū)域,從而提高主觀圖像質(zhì)量。
[0041]已知的視覺敏感度自適應(yīng)量化技術(shù)的一個示例為在MPEG-2的測試模型5 (TM5)中所采用的、基于輸入圖像的紋理復(fù)雜度的自適應(yīng)量化。紋理復(fù)雜度通常被稱為“活動(activity)”。專利文獻(PTL) I提出了一種自適應(yīng)量化方法,其中除了輸入圖像的活動之外還使用預(yù)測圖像的活動。PTL2提出了一種將邊緣部分納入考慮的基于活動的自適應(yīng)量化方法。
[0042]當(dāng)使用視覺敏感度自適應(yīng)量化技術(shù)時,存在量化步長在圖像幀內(nèi)頻繁變化的問題。用于生成符合AVC的比特流的典型視頻編碼設(shè)備在編碼量化步長時,對與緊鄰的前一編碼圖像塊的量化步長的差異進行熵編碼。相應(yīng)地,如果編碼順序方向上的量化步長的變化為大,則對量化步長進行編碼所必要的碼量會增加。這造成了比特流大小的增大,以及實現(xiàn)比特流緩沖器所需的存儲器大小的增加。
[0043]由于編碼順序方向與屏幕上視覺敏感度的連續(xù)性無關(guān),因而視覺敏感度自適應(yīng)量化技術(shù)不可避免地增加對量化步長進行編碼所必要的碼量。因此,典型視頻編碼設(shè)備具有這樣的問題:在使用視覺敏感度自適應(yīng)量化技術(shù)以改進主觀圖像質(zhì)量的情況下,比特流大小的增加和所需存儲器大小的增加是不可避免的。
[0044]鑒于這個問題,PTL3公開了一種技術(shù),其中在空間域和頻域中根據(jù)視覺敏感度來自適應(yīng)地設(shè)置死區(qū)(dead zone)——即,量化至O的范圍,而不是根據(jù)視覺敏感度來自適應(yīng)地設(shè)置量化步長。在PTL3中描述的方法中,將對于被確定為視覺敏感度為低的變換系數(shù)的死區(qū)設(shè)置成比對于被確定為視覺敏感度為高的變換系數(shù)的死區(qū)更大。這樣的控制支持在無需改變量化步長的情況下實現(xiàn)視覺敏感度自適應(yīng)量化。
[0045]引f列表
[0046]專利文獻
[0047]PTLl:日本專利 N0.2646921
[0048]PTL2:日本專利 N0.4529919
[0049]PTL3:日本專利 N0.4613909
[0050]非專利文獻
[0051]NPLl:IS0/IEC14496-10Advanced Video Coding
【發(fā)明內(nèi)容】
[0052]摶術(shù)問是頁
[0053]然而,依照PTL3中描述的技術(shù),不可能對不處于死區(qū)范圍之內(nèi)的變換系數(shù)執(zhí)行視覺敏感度自適應(yīng)量化。亦即,即使不處于死區(qū)范圍之內(nèi)的變換系數(shù)被確定為視覺敏感度為低,也無法針對該變換系數(shù)減少系數(shù)碼的量。此外,雖然在增大量化步長的情況下量化變換系數(shù)值集中在O附近,但在增大死區(qū)的情況下,不處于死區(qū)范圍之內(nèi)的變換系數(shù)在被量化時并不集中在O附近。換言之,與增大量化步長的情況相比,在增大死區(qū)的情況下熵編碼的編碼效率是不足的。由于這些原因,典型編碼技術(shù)具有如下問題:視覺敏感度自適應(yīng)量化導(dǎo)致視頻編碼設(shè)備和視頻解碼設(shè)備中所需存儲器大小增加。
[0054]鑒于上述問題而提出本發(fā)明。本發(fā)明的第一目標(biāo)是提供如下視頻編碼設(shè)備:該視頻編碼設(shè)備能夠通過在防止碼量增加的同時使量化步長能夠被頻繁地改變,而在不增加所需存儲器大小的情況下來編碼具有高圖像質(zhì)量的運動圖像。本發(fā)明的第二目標(biāo)是提供如下視頻解碼設(shè)備:該視頻解碼設(shè)備能夠在不增加所需存儲器大小的情況下再現(xiàn)具有高圖像質(zhì)量的運動圖像。
[0055]問題解決方案
[0056]根據(jù)本發(fā)明的視頻編碼設(shè)備是如下視頻編碼設(shè)備,用于將輸入的視頻數(shù)據(jù)劃分為預(yù)定大小的塊并且對通過劃分而獲得的每個圖像塊應(yīng)用量化,以執(zhí)行壓縮編碼過程,該視頻編碼設(shè)備包括:量化步長編碼裝置,用于對用來控制量化粒度的量化步長進行編碼;以及量化步長下采樣裝置,用于對一個或多個經(jīng)編碼的量化步長進行下采樣以生成量化步長代表值,其中量化步長編碼裝置使用該量化步長代表值來預(yù)測量化步長。
[0057]根據(jù)本發(fā)明的視頻解碼設(shè)備是如下視頻解碼設(shè)備,用于通過對輸入的經(jīng)壓縮的視頻數(shù)據(jù)應(yīng)用逆量化來解碼圖像塊,以執(zhí)行對作為圖像塊的集合的視頻數(shù)據(jù)的生成過程,該視頻解碼設(shè)備包括:量化步長解碼裝置,用于對用來控制逆量化粒度的量化步長進行解碼;以及量化步長下采樣裝置,用于對一個或多個經(jīng)解碼的量化步長進行下采樣以生成量化步長代表值,其中量化步長解碼裝置使用該量化步長代表值來預(yù)測量化步長。
[0058]發(fā)明有益.效果
[0059]根據(jù)本發(fā)明,在視頻編碼設(shè)備中,即使當(dāng)量化步長在圖像幀內(nèi)被頻繁改變時,也可防止生成的碼量的相關(guān)增加。換言之,能夠用較少的碼量來編碼量化步長。這解決了視覺敏感度自適應(yīng)量化所造成的、針對主觀圖像質(zhì)量改善所需的存儲器大小增加的問題。此外,根據(jù)本發(fā)明,在視頻解碼設(shè)備中,僅需要接收少量的碼來解碼頻繁變化的量化步長。因此,能夠以較小的所需存儲器大小來再現(xiàn)具有高圖像質(zhì)量的運動圖像。
【專利附圖】
【附圖說明】
[0060]圖1是示出本發(fā)明示例性實施方式I中的視頻編碼設(shè)備中的量化步長編碼器的框圖。
[0061]圖2是示出要被編碼的圖像塊與相鄰圖像塊之間位置關(guān)系的示例的解釋性圖示。
[0062]圖3是示出本發(fā)明示例性實施方式2中的視頻解碼設(shè)備中的量化步長解碼器的框圖。
[0063]圖4是示出本發(fā)明示例性實施方式3中的視頻編碼設(shè)備中的量化步長編碼器的框圖。
[0064]圖5是示出塊坐標(biāo)的示例的解釋性圖示。
[0065]圖6是示出本發(fā)明示例性實施方式4中的視頻解碼設(shè)備中的量化步長解碼器的框圖。
[0066]圖7是示出本發(fā)明示例性實施方式5中的視頻編碼設(shè)備的框圖。
[0067]圖8是示出本發(fā)明示例性實施方式5中的視頻編碼設(shè)備中的量化步長編碼器的框圖。
[0068]圖9是示出代表量化步長下采樣參數(shù)的多路復(fù)用示例的列表的解釋性圖示。
[0069]圖10是示出本發(fā)明示例性實施方式6中的視頻解碼設(shè)備的框圖。
[0070]圖11是示出本發(fā)明示例性實施方式6中的視頻解碼設(shè)備中的量化步長解碼器的框圖。
[0071]圖12是示出能夠?qū)崿F(xiàn)根據(jù)本發(fā)明的視頻編碼設(shè)備和視頻解碼設(shè)備的功能的信息處理系統(tǒng)的結(jié)構(gòu)示例的框圖。
[0072]圖13是示出根據(jù)本發(fā)明的視頻編碼設(shè)備中的特征組件的框圖。
[0073]圖14是示出根據(jù)本發(fā)明的視頻解碼設(shè)備中的特征組件的框圖。
[0074]圖15是示出根據(jù)本發(fā)明的視頻編碼方法中的特征步驟的流程圖。
[0075]圖16是示出根據(jù)本發(fā)明的視頻解碼方法中的特征步驟的流程圖。
[0076]圖17是示出塊劃分的示例的解釋性圖示。
[0077]圖18是示出視頻編碼設(shè)備的結(jié)構(gòu)示例的框圖。
[0078]圖19是示出典型視頻編碼設(shè)備中的量化步長編碼器的框圖。
[0079]圖20是示出視頻解碼設(shè)備的結(jié)構(gòu)示例的框圖。[0080]圖21是示出典型視頻解碼設(shè)備中的量化步長解碼器的框圖。
【具體實施方式】
[0081]下文參考附圖來描述本發(fā)明的示例性實施方式。
[0082]示例件實施方式I
[0083]類似于圖18中所示的典型視頻編碼設(shè)備,本發(fā)明示例性實施方式I中的視頻編碼設(shè)備包括變頻器101、量化器102、可變長度編碼器103、量化控制器104、逆量化器105、逆變頻器106、幀存儲器107、幀內(nèi)預(yù)測器108、幀間預(yù)測器109、預(yù)測選擇器110,以及比特流緩沖器111。然而,可變長度編碼器103中所包括的量化步長編碼器具有與圖19中所示結(jié)構(gòu)不同的結(jié)構(gòu)。
[0084]圖1是示出本發(fā)明示例性實施方式I中的視頻編碼設(shè)備中的量化步長編碼器的結(jié)構(gòu)的框圖。如圖1中所示,在此示例性實施方式中的量化步長編碼器與圖19中所示的量化步長編碼器的不同之處在于,其包括預(yù)測量化步長生成器10313。
[0085]量化步長緩沖器10311存儲并保持指派給先前編碼的圖像塊的量化步長。
[0086]預(yù)測量化步長生成器10313從量化步長緩沖器取回指派給先前編碼的相鄰圖像塊的量化步長,并生成預(yù)測量化步長。
[0087]從輸入的量化步長中減去從預(yù)測量化步長生成器10313供應(yīng)的預(yù)測量化步長,并將結(jié)果作為差分量化步長輸入至熵編碼器10312。
[0088]熵編碼器10312對輸入的差分量化步長進行熵編碼,并輸出結(jié)果作為對應(yīng)于量化步長的碼。
[0089]利用這樣的結(jié)構(gòu),有可能減少對量化步長進行編碼所必要的碼量。作為結(jié)果,可防止與量化步長的變化相關(guān)聯(lián)的所需存儲器大小的增加。這是因為,通過使用不依賴于編碼順序的相鄰圖像塊的量化步長來生成預(yù)測量化步長,可以由量化步長生成器10313減少向熵編碼器10312輸入的差分量化步長的絕對量。向熵編碼器10312輸入的差分量化步長的絕對量可以通過使用相鄰圖像塊的量化步長以生成預(yù)測量化步長來得以減少,其原因在于:運動圖像中的相鄰像素之間通常存在相關(guān)性,因此在使用視覺敏感度自適應(yīng)量化的情況下,聞度相關(guān)的相鄰圖像塊被指派具有聞相似度的量化步長。
[0090]下文使用特定示例來描述示例性實施方式I中的視頻編碼設(shè)備中的上述量化步長編碼器的詳細操作。
[0091]在此示例中,假設(shè)作為編碼單元的圖像塊的大小是固定的。用于量化步長預(yù)測的相鄰圖像塊是在相同圖像幀中左側(cè)相鄰、上方相鄰以及右上方相鄰的3個圖像塊。
[0092]如圖2中所示,假定要被編碼的當(dāng)前圖像塊是X,并且3個相鄰圖像塊A、B和C分別位于與圖像塊X左側(cè)相鄰、上方相鄰和右上方相鄰的位置。當(dāng)任意塊Z中的量化步長以Q(Z)表示并且預(yù)測量化步長以PQ(Z)表示時,預(yù)測量化步長生成器10313通過以下公式
(3)計算預(yù)測量化步長pQ (X)。
[0093]pQ (X) =Median (Q (A), Q (B), Q (C))...(3)。
[0094]這里,Median (X,y, z)是從x、y和z這三個值中找出中值的函數(shù)。
[0095]熵編碼器10312使用作為熵編碼的一種類型的帶符號Exp-Golomb (指數(shù)Golomb)編碼,來編碼通過以下公式(4)獲得的差分量化步長dQ(X)。熵編碼器10312輸出結(jié)果作為與圖像塊的量化步長相對應(yīng)的碼。
[0096]dQ (X) =Q (X) - pQ(X)...(4)。
[0097]盡管在此示例中使用相同圖像幀中的左側(cè)相鄰、上方相鄰和右上方相鄰的三個圖像塊作為用于量化步長預(yù)測的相鄰圖像塊,但相鄰圖像塊并不局限于此。例如,可以使用左側(cè)相鄰、上方相鄰和左上方相鄰的圖像塊來通過以下公式(5)計算預(yù)測量化步長。
[0098]pQ (X) =Median (Q (A), Q (B), Q (D))...(5)。
[0099]應(yīng)當(dāng)注意,用于預(yù)測的圖像塊數(shù)目并不局限于三個,并可以是任何數(shù)目。另外,不僅僅是中值,還可計算均值等用于預(yù)測。另外,用于預(yù)測的圖像塊并不一定需要與要被編碼的當(dāng)前圖像塊相鄰,而是可以與要被編碼的當(dāng)前圖像塊相隔預(yù)定的距離。此外,用于預(yù)測的圖像塊并不限于空間上相鄰的圖像塊,即,在相同圖像幀中的圖像塊。用于預(yù)測的圖像塊可以是在時間上相鄰的圖像塊,即,處在當(dāng)前圖像幀以外的已經(jīng)編碼的圖像幀中的圖像塊,或者任何其他相鄰的圖像塊。
[0100]雖然在本示例中假設(shè)要被編碼的圖像塊和被用于預(yù)測的圖像塊具有相同的固定大小,但本發(fā)明并不局限于作為編碼單元的圖像塊具有固定大小的情況。作為編碼單元的圖像塊的大小可以是可變的,亦即,要被編碼的圖像塊和被用于預(yù)測的圖像塊可具有不同大小。
[0101]雖然在本示例中基于Exp-Golomb編碼來對要被編碼的圖像塊的量化步長與預(yù)測量化步長之間的差異進行編碼,但本發(fā)明并不局限于使用Exp-Golomb編碼,而是可以基于其他熵編碼來對差分量化步長進行編碼。例如,可基于Huffman編碼、算術(shù)編碼等來編碼差分量化步長。
[0102]這樣就完成了對本發(fā)明示例性實施方式I中的視頻編碼設(shè)備的描述。
[0103]示例件實施方式2
[0104]類似于圖20中所示的典型視頻解碼設(shè)備,本發(fā)明示例性實施方式2中的視頻解碼設(shè)備包括可變長度解碼器201、逆量化器202、逆變頻器203、幀存儲器204、幀內(nèi)預(yù)測器205、幀間預(yù)測器206、預(yù)測選擇器207,以及比特流緩沖器208。然而,可變長度解碼器201中所包括的量化步長解碼器具有與圖21中所示的結(jié)構(gòu)不同的結(jié)構(gòu)。
[0105]圖3是示出本發(fā)明示例性實施方式2中的視頻解碼設(shè)備中的量化步長解碼器的結(jié)構(gòu)的框圖。如圖3中所示,此示例性實施方式中的量化步長解碼器與圖21中所示的量化步長解碼器的不同之處在于,其包括預(yù)測量化步長生成器20113。
[0106]熵解碼器20111對輸入的碼進行熵解碼,并輸出差分量化步長。
[0107]量化步長緩沖器20112存儲并保持先前解碼的量化步長。
[0108]預(yù)測量化步長生成器20113從量化步長緩沖器中的先前解碼的量化步長之當(dāng)中取回與要被解碼的當(dāng)前圖像塊的相鄰像素塊相對應(yīng)的量化步長,并生成預(yù)測量化步長。具體而言,預(yù)測量化步長生成器20113例如執(zhí)行與示例性實施方式I中視頻編碼設(shè)備的特定示例中的預(yù)測量化步長生成器10313相同的操作。
[0109]將從預(yù)測量化步長生成器20113供應(yīng)的預(yù)測量化步長添加至由熵解碼器20111所生成的差分量化步長,并且輸出結(jié)果作為量化步長并將其輸入至量化步長緩沖器20112。
[0110]利用量化步長解碼器的這種結(jié)構(gòu),視頻解碼設(shè)備僅需要接收較小的碼量來解碼量化步長。作為結(jié)果,可以防止與量化步長的變化相關(guān)聯(lián)的所需存儲器大小的增加。這是因為,通過使用不依賴于解碼順序的相鄰圖像塊的量化步長來生成預(yù)測量化步長,可以由預(yù)測量化步長生成器20113獲得更接近于實際指派的量化步長的預(yù)測量化步長,因此熵解碼器20111僅需要解碼更接近于O的差分量化步長。通過使用相鄰圖像塊的量化步長來生成預(yù)測量化步長可以獲得更接近于實際指派的量化步長的預(yù)測量化步長,其原因在于:運動圖像中相鄰像素之間通常存在相關(guān)性,因此在使用視覺敏感度自適應(yīng)量化的情況下,高度相關(guān)的相鄰圖像塊被指派具有高相似度的量化步長。
[0111]這樣就完成了對本發(fā)明示例性實施方式2中的視頻解碼設(shè)備的描述。
[0112]示例性實施方式3
[0113]類似于本發(fā)明示例性實施方式I中的視頻編碼設(shè)備,本發(fā)明示例性實施方式3中的視頻編碼設(shè)備包括如圖18中所示的變頻器101、量化器102、可變長度編碼器103、量化控制器104、逆量化器105、逆變頻器106、幀存儲器107、幀內(nèi)預(yù)測器108、幀間預(yù)測器109、預(yù)測選擇器110,以及比特流緩沖器111。然而,可變長度編碼器103中所包括的量化步長編碼器具有與圖19和圖1中所示結(jié)構(gòu)不同的結(jié)構(gòu)。
[0114]圖4是示出本發(fā)明示例性實施方式3中的視頻編碼設(shè)備中的量化步長編碼器的結(jié)構(gòu)的框圖。如圖4中所示,此示例性實施方式中的量化步長編碼器的結(jié)構(gòu)與圖1中所示的示例性實施方式I中的視頻編碼設(shè)備中的量化步長編碼器的結(jié)構(gòu)的不同之處在于,其包括量化步長下米樣器10314和量化步長上米樣器10315。
[0115]預(yù)測量化步長生成器10313和熵編碼器10312的操作與示例性實施方式I中的視頻編碼設(shè)備中的量化步長編碼器中的操作相同,因此這里省略其描述。
[0116]量化步長下采樣器10314基于預(yù)定方法對指派給經(jīng)編碼的圖像塊的量化步長進行下采樣,并將結(jié)果供應(yīng)至量化步長緩沖器10311。
[0117]量化步長緩沖器10311存儲并保持從量化步長下采樣器10314供應(yīng)的先前編碼的圖像塊的經(jīng)下采樣的量化步長。
[0118]量化步長上采樣器10315從量化步長緩沖器10311取回先前編碼的圖像塊的經(jīng)下采樣的量化步長,基于預(yù)定方法對取回的下采樣量化步長進行上采樣,并將結(jié)果供應(yīng)至預(yù)測量化步長生成器10313。
[0119]與示例性實施方式I中的視頻編碼設(shè)備相比,利用這種結(jié)構(gòu),本示例性實施方式中的視頻編碼設(shè)備可減少量化步長緩沖器的所需容量。作為結(jié)果,可進一步防止由于改變視頻編碼設(shè)備中的量化步長而增加所需存儲器大小。
[0120]下文使用特定示例來描述示例性實施方式3中的視頻編碼設(shè)備中的上述量化步長編碼器的詳細操作。
[0121]在此示例中,假設(shè)作為編碼單元的圖像塊具有固定大小,并且每個圖像塊由二維塊坐標(biāo)來表示,其中如圖5中所示,處于一個幀中左上角的塊被設(shè)定為原點。用于量化步長預(yù)測的相鄰圖像塊是在相同圖像幀中左側(cè)相鄰、上方相鄰和右上方相鄰的3個圖像塊。
[0122]假定要被編碼的當(dāng)前圖像塊是X,并且塊X的塊坐標(biāo)為(x(X),y(X))。如圖2中所示,還假設(shè)位于塊坐標(biāo)(x(X) - l,y(X))的左側(cè)相鄰塊為A,位于塊坐標(biāo)(X⑴,y⑴-1)的上方相鄰塊為B,以及位于塊坐標(biāo)(x(X)+l,y(X) -1)的右上方相鄰塊為C。當(dāng)任意塊Z中的編碼量化步長由Q(Z)表示并且預(yù)測量化步長由PQ(Z)表示時,預(yù)測量化步長生成器10313通過以下公式(6)計算塊X的預(yù)測量化步長pQ (X)。[0123]pQ ⑴=Median (Qds (A),Qds ⑶,Qds (C))...(6)。
[0124]這里,Median (x, y, z)是從x、y和z這三個值中找出中值的函數(shù)。Qds(Z)表示塊Z中的量化步長代表值。當(dāng)Z的塊坐標(biāo)為(x(Z),y(Z))并且位于塊坐標(biāo)(v,w)位置的塊由Blk (v, w)表示時,通過以下公式(7)計算Qds (Z)。
[0125]Qds (Z) =Q (Blk (N* (x (Z) "N),N* (y (Z) "N)))...(7)。
[0126]這里,N是指示下采樣因子的數(shù)值。例如,N=4是指在水平方向上以1/4并且在垂直方向上以1/4進行下采樣。(a*b)表示a乘以b,而(a//b)表示a除以b所得之商的整數(shù)部分(丟棄分?jǐn)?shù)部分)。
[0127]根據(jù)上述公式(6)和公式(7)所定義的操作,在經(jīng)由量化步長上采樣器10315參考從量化步長緩沖器10311供應(yīng)的量化步長時,預(yù)測量化步長生成器10313以水平N塊X垂直N塊的N2塊為單位,僅參考位于左上角的一個量化步長作為代表值。量化步長下采樣器10314相應(yīng)地進行操作,以便不向量化步長緩沖器10311供應(yīng)其他量化步長。作為結(jié)果,可將量化步長緩沖器10311的所需存儲器容量減少至1/N2。
[0128]熵編碼器10312對獲得的預(yù)測量化步長進行熵編碼并輸出結(jié)果。熵編碼器10312的操作與示例性實施方式I中的視頻編碼設(shè)備中的特定操作示例相同。 [0129]雖然在本示例中使用相同圖像幀中的左側(cè)相鄰、上方相鄰和右上方相鄰的三個圖像塊作為用于量化步長預(yù)測的相鄰圖像塊,但相鄰圖像塊并不局限于此。例如,可以使用左側(cè)相鄰、上方相鄰和左上方相鄰的圖像塊來由以下公式(8)代替公式(6)計算預(yù)測量化步長。
[0130]pQ(X) =Median (Qds (A), QdsO), Qds(D))..?⑶。
[0131]這里,D是與塊X左上方相鄰的塊,并且位于塊坐標(biāo)(x(X) - l,y(X) -1)。
[0132]用于預(yù)測的圖像塊的數(shù)目并不局限于三個,而可以是任何數(shù)目。另外,不僅僅是中值,還可計算均值等用于預(yù)測。此外,用于預(yù)測的圖像塊并不一定需要與要被編碼的當(dāng)前圖像塊相鄰,而是可以與要被編碼的當(dāng)前圖像塊相隔預(yù)定的距離。此外,用于預(yù)測的圖像塊并不限于空間上相鄰的圖像塊,即,在相同圖像幀中的圖像塊。用于預(yù)測的圖像塊可以是在時間上相鄰的圖像塊,即,處在不同于當(dāng)前圖像幀的已經(jīng)編碼的圖像幀中的圖像塊,或者任何其他相鄰的圖像塊。
[0133]雖然在本示例中假設(shè)要被編碼的圖像塊和被用于預(yù)測的圖像塊具有相同的固定大小,但本發(fā)明并不局限于作為編碼單元的圖像塊具有固定大小的情況。作為編碼單元的圖像塊的大小可以是可變的,亦即,要被編碼的圖像塊和被用于預(yù)測的圖像塊可具有不同大小。
[0134]雖然本示例中選擇位于左上角的一個量化步長作為以水平N塊X垂直N塊的N2塊為單位的量化步長代表值,但本發(fā)明并不局限于此??蓮娜我獠蓸游恢眠x擇一個量化步長。備選地,可從任意采樣位置選擇多個量化步長,而將該多個量化步長的均值設(shè)定為量化步長代表值。例如,可通過以下公式(9)代替公式(7)來計算量化步長代表值,并可使用除了平均值計算之外的任何計算,諸如中值計算。
[0135][Math.1]
【權(quán)利要求】
1.一種視頻編碼設(shè)備,用于將輸入的視頻數(shù)據(jù)劃分為預(yù)定大小的塊并且對通過劃分而獲得的每個圖像塊應(yīng)用量化,以執(zhí)行壓縮編碼過程,所述視頻編碼設(shè)備包括: 量化步長編碼裝置,用于編碼用來控制所述量化的粒度的量化步長;以及量化步長下采樣裝置,用于下采樣一個或多個經(jīng)編碼的量化步長,以生成量化步長代表值, 其中所述量化步長編碼裝置使用所述量化步長代表值來預(yù)測所述量化步長。
2.根據(jù)權(quán)利要求1所述的視頻編碼設(shè)備,其中所述量化步長編碼裝置將通過至少使用當(dāng)前幀中的經(jīng)編碼的量化步長而生成的量化步長代表值,作為所述量化步長代表值來使用。
3.根據(jù)權(quán)利要求1所述的視頻編碼設(shè)備,其中所述量化步長編碼裝置將通過至少使用不同幀中的經(jīng)編碼的量化步長而生成的量化步長代表值,作為所述量化步長代表值來使用。
4.根據(jù)權(quán)利要求1至3中任一項所述的視頻編碼設(shè)備,包括: 量化步長下采樣控制裝置,用于基于預(yù)定操作參數(shù)來控制所述量化步長下采樣裝置的操作;以及 多路復(fù)用裝置,用于在經(jīng)壓縮編碼的視頻比特流中,多路復(fù)用所述量化步長下采樣裝置的所述操作參數(shù)的至少一部分。
5.根據(jù)權(quán)利要求4所述的視頻編碼設(shè)備,其中所述操作參數(shù)至少包括下采樣因子。
6.一種視頻解碼設(shè)備,用于通過對輸入的經(jīng)壓縮的視頻數(shù)據(jù)應(yīng)用逆量化來解碼圖像塊,以執(zhí)行對作為所述圖像塊的集合的視頻數(shù)據(jù)的生成過程,所述視頻解碼設(shè)備包括: 量化步長解碼裝置,用于解碼用來控制所述逆量化的粒度的量化步長;以及量化步長下采樣裝置,用于下采樣一個或多個經(jīng)解碼的量化步長,以生成量化步長代表值, 其中所述量化步長解碼裝置使用所述量化步長代表值來預(yù)測所述量化步長。
7.根據(jù)權(quán)利要求6所述的視頻解碼設(shè)備,其中所述量化步長解碼裝置將通過至少使用當(dāng)前幀中的經(jīng)解碼的量化步長而生成的量化步長代表值,作為所述量化步長代表值來使用。
8.根據(jù)權(quán)利要求6所述的視頻解碼設(shè)備,其中所述量化步長解碼裝置將通過至少使用不同幀中的經(jīng)解碼的量化步長而生成的量化步長代表值,作為所述量化步長代表值來使用。
9.根據(jù)權(quán)利要求6至8中任一項所述的視頻解碼設(shè)備,包括: 量化步長下采樣控制裝置,用于基于預(yù)定操作參數(shù),來控制所述量化步長下采樣裝置的操作;以及 解多路復(fù)用裝置,用于解多路復(fù)用包括所述量化步長下采樣裝置的所述操作參數(shù)的至少一部分的比特流。
10.根據(jù)權(quán)利要求9所述的視頻解碼設(shè)備,其中所述操作參數(shù)至少包括下采樣因子。
【文檔編號】H04N19/124GK103548350SQ201280024448
【公開日】2014年1月29日 申請日期:2012年6月8日 優(yōu)先權(quán)日:2011年6月28日
【發(fā)明者】青木啟史, 蝶野慶一, 仙田裕三 申請人:日本電氣株式會社