專利名稱:一種用于視頻圖像恢復增強的結構化稀疏詞典的構造方法
技術領域:
本發(fā)明屬于視頻圖像增強處理技術領域,更為具體地講,涉及在圖像視頻增強處理中用于視頻圖像恢復增強的結構化稀疏詞典的構造方法。
背景技術:
因為圖像視頻采集系統(tǒng)自身固有的缺陷或局限性,通過攝像系統(tǒng)從現(xiàn)實場景采集到的數(shù)字圖像數(shù)據(jù)是經(jīng)過了種種畫質(zhì)退化效應后的結果。也就是說,因為種種原因,從采集后的數(shù)字圖像上看到的畫面與真實場景在視覺質(zhì)量上存在明顯的差距。最典型的來說,有相機的點擴散函數(shù)(PSF)帶來模糊效應,相機CMOS或CCD感應芯片的分辨率限制帶來下采樣效應,空氣、相機系統(tǒng)噪聲疊加后的噪聲模糊效應等三大類圖像畫質(zhì)退化的原因。在典型的數(shù)字電視系統(tǒng)中,經(jīng)過各類視頻壓縮技術編碼的視頻會隱含有程度不一的塊效應瑕疵,而來自傳統(tǒng)的廣播電視模擬信號除了其分辨率局限在PAL/NTSC上之外,還有模擬信號解碼轉為數(shù)字信號、去隔行處理等過程中因為誤差帶來的噪聲或畫質(zhì)退化。這就是我們今天在從電視機上看到的畫面質(zhì)量差強人意的原因。在播放高清視頻片源如藍光碟片時,賞心悅目的畫面效果正好說明了我們的普通視頻圖像畫質(zhì)退化有多么嚴重。因為海量的傳統(tǒng)非高清視頻源的存在,目前廣播電視信號仍然以PAL制式標準為主,使用各種低成本便攜攝像設備拍攝的低畫質(zhì)視頻在不斷增加,這些都表明有創(chuàng)新發(fā)明新的視頻圖像畫質(zhì)增強處理技術的巨大需求。壓縮感知技術認為在滿足一定的條件下,被各種退化操作污損后的信號可以在一定程度上被準確重建與恢復。具體在圖像處理領域中,建模如下Ile = UIHE+w(1)Ihe是未污染的理想的高清圖像信號,Iui是經(jīng)過各種退化操作后所觀察到的低清圖像信號,w是加性的噪聲變量,U線性的退化算子,可以是模糊算子、下采樣算子、加性污損算子等。圖像增強處理任務就是根據(jù)已知的低清圖像Iui數(shù)據(jù)恢復出未知的理想高清圖像Im數(shù)據(jù)。為了得到視覺舒適的逼近的高清圖像Ihk,需要整合更多的自然圖像先驗知識, 以約束高清圖像Ihk的恢復過程。該過程一般建模如下 = argmin\\a\[,且|7讓 _υ ζ < ε(2)Im = Da(3)這種自然圖像的先驗知識也就是圖像信號在特定定義域里的稀疏性,也就是說高清圖像Ihk可以在變換域D以稀疏系數(shù)向量5進行合理表達,其中ε為設定的閾值。而系數(shù)向量稀疏系數(shù)向量3中大部分元素都接近于零。通常來說,變換域D是一個基元素組成的過完備稀疏詞典。傳統(tǒng)的稀疏詞典獲取方法有兩種一是預定義變換基如傅立葉基、小波基等各種知名變換域組成;另一種是從大量的訓練數(shù)據(jù)中學習得到這樣的過完備詞典??傊∈柙~典的構建決定了式(3)中稀疏系數(shù)向量3的稀疏性,同時決定了式(2)中橢圓凸優(yōu)化問題的收斂速度與穩(wěn)定性,也就最終影響了高清信號高清圖像IHR恢復的性能。當前現(xiàn)有技術的稀疏詞典及其缺陷
3
傳統(tǒng)的過完備稀疏詞典方法,隱含著假定條件是各個稀疏詞典元素間是不連貫互相獨立的,因而也就假定稀疏系數(shù)向量3中的非零系數(shù)位置是隨機均勻分布的。另一方面為了表達高清圖像Ihk的完備性,稀疏詞典,即變換域D中的元素個數(shù)N相對于稀疏系數(shù)向量 3中的非零值個數(shù)M非常大,也就是說需要滿足N >> M的條件。因此在求解式O)的優(yōu)化
(N、
問題時,理論上解空間大小,即自由度為這導致了收斂速度慢、計算量大,且最終解的
VmJ
準確性與穩(wěn)定性被減弱。有一種初步的結構化稀疏詞典的方法來獲得稀疏詞典。具體來說是從0到π的方向均勻統(tǒng)一抽取出T個角度,每個角度計算出一個PCA基,隨后將有T個PCA基外加一個 DCT基一起構成了這個結構化的稀疏詞典,如圖1所示。求解過程中,將每個PCA基看作一個獨立的詞典進行稀疏信號恢復,選擇其中精度誤差項與稀疏約束項之和最小的基為本次信號恢復計算的變換域詞典。然而這種結構化稀疏詞典的構造方法其缺陷在于,首先要從綜合出來的T個黑白線角度邊緣的圖像上計算初始化的有向PCA基,隨后使用ΕΜ(期望最大化)算法迭代更新PCA基里的內(nèi)容。
(N、結構化的稀疏詞典其優(yōu)點是明顯的,解空間大小(自由度)在u的基礎上
VmJ
大為減少。設若每個PCA基的元素個數(shù)相同,那么在該結構化詞典上求解的自由度降至 (N )
W KT+1))其次,會根據(jù)不同低清圖像Iui選擇不同的PCA基,也就是子詞典,這樣提高了低清圖像Iui與結構化的稀疏詞典之間的匹配適應性,從而獲得更為準確的稀疏性約束。稀疏詞典進行結構化約束有兩方面的價值,一方面可得到更為健壯的稀疏表達, 另一方面在信號解釋上,活躍的詞典原子項集表明了一定的信號物理屬性。然而,用從綜合的圖像計算的PCA基來表達自然圖像的局部片,有其自身固有的缺陷。因為各種自然圖像片與規(guī)則的圖像偏離只能一概由高斯模型里的方差參數(shù)進行建模,這樣就大大的損失了稀疏表達的準確性。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術的不足,提供一種用于視頻圖像恢復增強的結構化稀疏詞典的構造方法,使稀疏表達更為有效而準確。為實現(xiàn)上述目的,本發(fā)明用于視頻圖像恢復增強的結構化稀疏詞典的構造方法, 其特征在于,包括以下步驟(1)、從自然圖像庫以及邊緣分明的擬合圖像中分別選取一定數(shù)量級圖像生成尺寸為λ/^ΧΛ^全部的圖像片集合S,其中η為圖像片的像素點個數(shù);(2)、對圖像片集合S中的圖像片進行DCT變換,得到的DCT系數(shù)構成DCT系數(shù)集
合 SdCt ;(3)、對DCT系數(shù)集合&。t中的圖像片DCT系數(shù)進行K1個中心的一級聚類處理,從而將圖像片DCT系數(shù)分別劃入相應的K1個聚類·(&」,&_2Λ,_3 ··《』};
0)、對于每個聚類,對其再做結構化操作對聚彡i彡K1)中的圖像片 DCT系數(shù)提取其高頻分量,得到高頻分量構成的聚類,;(5)、對聚類SiL ,中的高頻分量執(zhí)行K2」(1 ^ i ^ Ki)個中心的聚類處理,從而劃分得到 K2 i 個二級聚類{sit j,Shdct」—2,Shdct j…Shdct j—K J,(6)、對每個二級聚類幻吣」(l^i ^K15I ^ K2i)進行主成分分解,提取其前m個主成分分量,構成對應該聚類的稀疏子詞典SubDu (1彡i彡K1,1彡j彡K2 i);全部的稀疏子詞典SubDu構成最終的結構化稀疏詞典。本發(fā)明的發(fā)明目的是這樣實現(xiàn)的本發(fā)明用于視頻圖像恢復增強的結構化稀疏詞典的構造方法,通過對從自然圖像庫以及邊緣分明的擬合圖像中分別選取的圖像片進行DCT變換,映射到頻域空間,基于圖像片的一般頻域特征進行初步聚類處理,隨后對每個聚類進一步的基于其高頻信息特征進行二級聚類處理,最后,對得到的二級聚類提取前m個主成分分量,得到該聚類的稀疏子詞典SUbDi」,全部的稀疏子詞典SUbDi j構成最終的結構化稀疏詞典,這樣建立起的兩級結構化稀疏詞典庫,區(qū)別于傳統(tǒng)冗長低效的線性過完備詞典。本發(fā)明具有以下有益效果1、在本發(fā)明二級層級結構化稀疏詞典的條件下,可以快速有效的求解輸入圖像視頻信號的稀疏表達,而避免了傳統(tǒng)的在一個過完備詞典中進行稀疏表達求解的冗長計算, 其原因在于本發(fā)明提供了兩級層級結構,從而有效的去除了稀疏詞典中各原子項之間的信肩、O2、在本發(fā)明二級層級結構化稀疏詞典的基礎上,對任意圖像視頻信號進行協(xié)同層級稀疏建模所得到稀疏系數(shù)向量3是準確、有效的,具備相當程度的抗噪聲特性。
圖1是現(xiàn)有技術初步結構化的稀疏詞典組成結構圖;圖2是本發(fā)明用于視頻圖像恢復增強的結構化稀疏詞典的構造方法的具體流程圖;圖3是層級結構化稀疏詞典的示意圖;圖4是稀疏子詞典結構示意圖。
具體實施例方式下面結合附圖對本發(fā)明的具體實施方式
進行描述,以便本領域的技術人員更好地理解本發(fā)明。需要特別提醒注意的是,在以下的描述中,當已知功能和設計的詳細描述也許會淡化本發(fā)明的主要內(nèi)容時,這些描述在這里將被忽略。圖2是本發(fā)明用于視頻圖像恢復增強的結構化稀疏詞典的構造方法的具體流程圖。在本實施中,如圖2所示,本發(fā)明具體實施過程如下(1)、在所提供的自然圖像庫201和所提供的邊緣分明的擬合圖像庫202選取一定數(shù)量級的圖像,二者的比例可以視情況而定,例如3 1。在所有選取圖像上提取長寬尺寸為V^x^的圖像片,其中η的取值區(qū)間一般為[25,100]。圖2中自然圖像庫201可從外部公開的高質(zhì)量自然圖像搜集,其所需圖像數(shù)量級一般在100以內(nèi)就足夠了。圖2中擬合圖像庫202的圖像為像素值為0或255的黑白分界圖形線的圖像,其分界線角度為從0到π的方向18個均勻等分角度。步驟203提取的 V^xi圖像片構成圖像片集合S。(2)步驟204所示意對圖像片集合S進行預處理,將其投射到頻域空間,從而為對這些圖像片樣本基于紋理、邊緣等特征進行聚類提供基礎。具體來說,對圖像片集合S中的圖像片進行DCT變換,得到的DCT系數(shù)構成DCT系數(shù)集合i5d。t,即Sdct = DCT(S),S e S,Sdct e Sdct(4)在中,s代表一個圖像片,sd。t代表其DCT變換后的DCT系數(shù)。需要注意的是, DCT變換可以有多種替換方法,只需能有效將圖像片集合S投射到頻域空間中即可。如圖2中在步驟205,對圖像片基于紋理、邊緣等頻域特征顯著的特性進行聚類處理,具體來說就是對DCT系數(shù)集合&。t中的圖像片DCT系數(shù)進行K1個中心的聚類處理,從而
將DCT系數(shù)集合Sdrt劃分為K1個聚類·(&」,& 2,&3··《j。值得注意的是,這里的聚類
處理方法可以有多種方法,一種經(jīng)典而有效的方法就是K均值聚類方法,也即
權利要求
1.一種用于視頻圖像恢復增強的結構化稀疏詞典的構造方法,其特征在于,包括以下步驟(1)、從自然圖像庫以及邊緣分明的擬合圖像中分別選取一定數(shù)量級圖像生成尺寸為 V^xV^全部的圖像片集合S,其中η為圖像片的像素點個數(shù);O)、對圖像片集合S中的圖像片進行DCT變換,得到的DCT系數(shù)構成DCT系數(shù)集合Sdct ;(3)、對DCT系數(shù)集合&。t中的圖像片DCT系數(shù)進行K1個中心的一級聚類處理,從而將圖像片DCT系數(shù)分別劃入相應的K1個聚類化」,、,,^^ ··《』};G)、對于每個聚類,對其再做結構化操作對聚類^^—JKiSK1)中的圖像片DCT系數(shù)提取其高頻分量,得到高頻分量構成的聚類Si」;(5)、對聚類中的高頻分量執(zhí)行K2」(1^ i ^ Ki)個中心的聚類處理,從而劃分得到&」個二級聚類卜1,11,* ,丄2,丄3 · · '^dct J_K2 ),(6)、對每個二級聚類幻K2i)進行主成分分解,提取其前m個主成分分量,構成對應該聚類的稀疏子詞典SubDu (1彡i彡K1,1彡j彡K2 i);全部的稀疏子詞典SubDu構成最終的結構化稀疏詞典。
2.根據(jù)權利要求1所述的用于視頻圖像恢復增強的結構化稀疏詞典的構造方法,其特征在于,所述的一級聚類是基于紋理、邊緣等頻域特征顯著的特性進行聚類處理。
全文摘要
本發(fā)明公開了一種用于視頻圖像恢復增強的結構化稀疏詞典的構造方法,通過對從自然圖像庫以及邊緣分明的擬合圖像中分別選取的圖像片進行DCT變換,映射到頻域空間,基于圖像片的一般頻域特征進行初步聚類處理,隨后對每個聚類進一步的基于其高頻信息特征進行二級聚類處理,最后,對得到的二級聚類提取前m個主成分分量,得到該聚類的稀疏子詞典subDi_j,全部的稀疏子詞典subDi_j構成最終的結構化稀疏詞典,這樣建立起的兩級結構化稀疏詞典庫,區(qū)別于傳統(tǒng)冗長低效的線性過完備詞典??梢钥焖儆行У那蠼廨斎雸D像視頻信號的稀疏表達,對任意圖像視頻信號進行協(xié)同層級稀疏建模所得到稀疏系數(shù)向量是準確、有效的,具備相當程度的抗噪聲特性。
文檔編號G06T5/00GK102521799SQ20111037150
公開日2012年6月27日 申請日期2011年11月21日 優(yōu)先權日2011年11月21日
發(fā)明者袁梓瑾 申請人:四川虹微技術有限公司