視頻信號處理方法及裝置的制造方法

文檔序號：9402440閱讀：506來源：國知局

視頻信號處理方法及裝置的制造方法
【技術領域】
[0001]本發(fā)明涉及視頻信號處理方法及裝置，更詳細地，涉及對視頻信號進行編碼或解碼的視頻信號處理方法及裝置。
【背景技術】
[0002]壓縮編碼是指用于通過通信線路傳送經數字化處理的信息或以適合于存儲介質的形式存儲經數字化處理的信息的一連串信號處理技術。壓縮編碼的對象有聲音、影像、字符等，尤其，以影像作為對象來進行壓縮編碼的技術被稱作視頻影像壓縮。通過考慮空間上的相互關系、時間上的相互關系、概率上的相互關系等來對視頻信號去除冗余信息來形成對視頻信息的壓縮編碼。但是，隨著近來多種媒體及數據傳送介質的發(fā)展，更高效的視頻信號處理方法及裝置成為了一種需求。
[0003]另一方面，近來在多種多媒體環(huán)境下，隨著網絡狀況或終端的分辨率等用戶環(huán)境的變化，用于從空間上、時間上和/或圖像質量等方面分級提供視頻內容的可分級視頻編碼方式的需求逐漸增加。

【發(fā)明內容】

[0004]要解決的技術問題
[0005]本發(fā)明的目的在于提高視頻信號的編碼效率。尤其，本發(fā)明的目的在于，提供對可分級視頻信號有效進行編碼的方法。
[0006]解決問題的手段
[0007]為了解決如上所述的問題，根據本發(fā)明實施例的視頻信號處理方法的特征在于，包括:接收包含基礎層和增強層的可分級視頻信號的步驟；接收用于表示對層間預測的限制是否適用于上述基礎層的標志的步驟；對上述基礎層的圖片進行解碼的步驟；以及利用被解碼的上述基礎層的圖片，來對上述增強層的圖片進行解碼的步驟，若上述標志表示對層間預測的限制適用于上述基礎層，則上述基礎層圖片的已設定的區(qū)域不用于上述增強層圖片的層間預測。
[0008]并且，根據本發(fā)明實施例的視頻信號處理裝置的特征在于，包括:解復用器，用于接收包含基礎層和增強層的可分級視頻信號及用于表示對層間預測的限制是否適用于上述基礎層的標志；基礎層解碼器，用于對上述基礎層的圖片進行解碼；以及增強層解碼器，利用被解碼的上述基礎層的圖片，來對上述增強層的圖片進行解碼，若上述標志表示對層間預測的限制適用于上述基礎層，則上述基礎層圖片的已設定的區(qū)域不用于上述增強層圖片的層間預測。
[0009]發(fā)明的效果
[0010]根據本發(fā)明的實施例，可對采用多路解碼(mult1-loop decoding)方式的可分級視頻信號有效支持隨機訪問。
【附圖說明】
[0011]圖1為本發(fā)明實施例的視頻信號編碼器裝置的簡要框圖。
[0012]圖2為本發(fā)明實施例的視頻信號解碼器裝置的簡要框圖。
[0013]圖3為示出根據本發(fā)明實施例來分割編碼單元的一例的圖。
[0014]圖4為不出以分級方式表不圖3中分割結構的方法的一實施例的圖。
[0015]圖5為示出本發(fā)明實施例的各種大小及形式的預測單元的圖。
[0016]圖6為本發(fā)明實施例的可分級視頻編碼系統(tǒng)的簡要框圖。
[0017]圖7及圖8為示出本發(fā)明實施例的即時解碼刷新(IDR)圖片、完全隨機訪問(CRA)圖片及引導圖片的圖。
[0018]圖9為示出在采用多路解碼方式的可分級視頻信號中執(zhí)行隨機訪問的一實施例的圖。
[0019]圖10為示出在采用多路解碼方式的可分級視頻信號中執(zhí)行隨機訪問的本發(fā)明的第一實施例的圖。
[0020]圖11為示出在采用多路解碼方式的可分級視頻信號中執(zhí)行隨機訪問的本發(fā)明的第二實施例的圖。
【具體實施方式】
[0021]在本說明書中所使用的術語在考慮在本發(fā)明中的功能的情況下，盡可能選擇了當前廣泛使用的普通術語，但這可根據本發(fā)明所屬技術領域的技術人員的意圖、慣例或新技術的出現等而不同。并且，在特定情況下，還存在申請人任意選定的術語，在此情況下，將在相應的發(fā)明說明部分記述其含義。因此，需明確，在本說明書中所使用的術語應以該術語所具有的實質性的含義和本說明書的全部內容為基礎來解釋，而非術語的單純字面含義。
[0022]在本發(fā)明中，以下術語可按如下基準來解釋，即使是未記載的術語，也可按如下主旨來解釋。根據情況，可將編碼解釋為編碼或解碼，并且信息(informat1n)作為包含值(values)、參數(parameter)、系數(coefficients)、元素(elements)等全部的術語，可根據情況解釋成不同含義，因而本發(fā)明并不限定于此?！皢卧庇米髦付ㄓ跋?圖片)處理的基本單位或圖片的特定位置的含義，可根據情況與“塊”、“分區(qū)(partit1n) ”或“區(qū)域”等術語相互混用。并且，在本說明書中，單元可以作為包含編碼單元、預測單元、變換單元等全部的概念來使用。
[0023]圖1為本發(fā)明一實施例的視頻信號編碼裝置的簡要框圖。參照圖1，本發(fā)明的編碼裝置100大致包括變換部110、量化部115、逆量化部120、逆變換部125、濾波部130、預測部150及熵編碼部160。
[0024]變換部110通過變換所接收的視頻信號的像素值來獲得變換系數值。例如，可采用離散余弦變換(Discrete Cosine Transform,DCT)或小波變換(Wavelet Transform)等。尤其，離散余弦變換可通過使所輸入的圖片信號分為規(guī)定大小的塊形式來執(zhí)行變換。在變換的過程中，編碼效率可根據變換區(qū)域內的多個值的分布和特性而不同。
[0025]量化部115對從變換部110輸出的變換系數值進行量化。在逆量化部120，對變換系數值進行逆量化，而在逆變換部125，利用所逆量化的變換系數值來復原成原來的像素值。
[0026]濾波部130執(zhí)行用于改善所復原的圖片的品質的濾波運算。例如，可包括去塊效應濾波器及自適應環(huán)路濾波器等。為了進行輸出或用作參考圖片，經濾波的圖片存儲于解碼圖片緩沖器(Decoded Picture Buffer) 156。
[0027]為了提高編碼效率，并不對圖片信號直接進行編碼，而是采用以下方法:通過預測部150，利用已經被編碼的區(qū)域來預測圖片，并在所預測的圖片加上原圖片和預測圖片之間的殘值(residual value)來獲得復原圖片。幀內預測部152在當前圖片內執(zhí)行幀內預測，
幀間預測部154利用存儲于解碼圖片緩沖器156的參考圖片來預測當前圖片。幀內預測部
152通過從當前圖片內的復原的區(qū)域執(zhí)行幀內預測，來向熵編碼部160傳遞幀內編碼信息。
幀間預測部154還可包括運動估計部154a及運動補償部154b。在運動估計部154a，通過參考復原的特定區(qū)域來獲得當前區(qū)域的運動矢量值。在運動估計部154a，通過向熵編碼部
160傳遞參考區(qū)域的位置信息(參考幀、運動矢量等)等，來可使比特流包含參考區(qū)域的位置信息。在運動補償部154b，利用從運動估計部154a傳遞的運動矢量值來執(zhí)行幀間運動補m
Iz? O
[0028]熵編碼部160對量化的變換系數、幀間編碼信息、幀內編碼信息及從幀間預測部154輸入的參考區(qū)域信息等進行熵編碼，來生成視頻信號比特流。其中，在熵編碼部160采用可變長編碼(Variable Length Coding, VLC)方式和算術編碼(arithmetic coding)等。在可變長編碼(VCL)方式中，將所輸入的多個符號變換成連續(xù)的碼字，而碼字的長度可變。例如，以短的碼字表示經常發(fā)生的多個符號，以長的碼字表示不經常發(fā)生的多個符號。作為可變長編碼方式，可采用基于上下文的自適應可變長編碼(Context-based AdaptiveVariable Length Coding, CAVLC)方式。算術編碼將連續(xù)的多個數據符號變換成一個小數，而算術編碼可得到表示各個符號所需的最佳小數位(bit)。作為算數編碼，可采用基于上下文的自適應算數編碼(Context-based Adaptive Binary Arithmetic Code，CABAC)。
[0029]所生成的上述比特流以網絡抽象層(Network Abstract1n Layer，NAL)單元為基本單位來被封裝。網絡抽象層單元包括被編碼的片段，上述片段由整數個編碼樹單元(Coding Tree Unit)構成。為了在視頻解碼器中對比特流進行解碼，首先使比特流以網絡抽象層單元為單位進行分離，之后對所分離的各個網絡抽象層單元進行解碼。
[0030]圖2為本發(fā)明一實施例的視頻信號解碼裝置200的簡要框圖。參照圖2，本發(fā)明的解碼裝置200大致包括熵解碼部210、逆量化部220、逆變換部225、濾波部230、及預測部250。
[0031]熵解碼部210對視頻信號比特流進行熵解碼，來抽取各個區(qū)域的變換系數、運動矢量等。逆量化部220對經熵解碼的變換系數進行逆量化，逆變換部225利用經逆量化的變換系數來復原原來的像素值。
[0032]另一方面，濾波部230通過對圖片執(zhí)行濾波來提高圖像質量。其中，可包括用于減少塊扭曲現象的去塊效應濾波器和/或用于去除圖片整體扭曲的自適應環(huán)路濾波器等。經濾波的圖片，或者進行輸出，或者為了用作對下一幀的參考圖片而存儲于解碼圖片緩沖器(Decoded Picture Buffer)256。
[0033]并且，本發(fā)明的預測部250包括幀內預測部252及幀間預測

完整全部詳細技術資料下載

當前第1頁1 2 3 4