稀疏性相關(guān)度圖像質(zhì)量評(píng)價(jià)方法
【專利摘要】本發(fā)明公開了一種稀疏性相關(guān)度圖像質(zhì)量評(píng)價(jià)方法,通過(guò)預(yù)處理技術(shù)來(lái)模擬初級(jí)視覺通道的視覺信息處理;利用PCA和稀疏編碼算法得到單細(xì)胞矩陣來(lái)模擬視覺皮層的信息處理;利用單細(xì)胞矩陣計(jì)算圖像的視覺輸出信息,計(jì)算輸出信息的相關(guān)性得圖像稀疏相關(guān)度。本發(fā)明利用主成分分析和降維來(lái)模擬視網(wǎng)膜和側(cè)膝體的視覺信息處理;視覺皮層的信息處理由單細(xì)胞矩陣來(lái)模擬,單細(xì)胞矩陣?yán)孟∈杈幋a算法在參考圖像的樣本中學(xué)習(xí)得到;參考圖像和失真圖像經(jīng)過(guò)單細(xì)胞矩陣輸出兩組信息,計(jì)算其相關(guān)度得到稀疏性相關(guān)度質(zhì)量分?jǐn)?shù)。本發(fā)明利用稀疏編碼在構(gòu)建圖像信息模型的同時(shí)完成對(duì)視覺模型的構(gòu)建,質(zhì)量評(píng)判結(jié)果與人類的主觀評(píng)判更接近,適用于彩色圖像的質(zhì)量評(píng)價(jià)。
【專利說(shuō)明】
稀疏性相關(guān)度圖像質(zhì)量評(píng)價(jià)方法
技術(shù)領(lǐng)域
[0001]本發(fā)明設(shè)及圖像質(zhì)量評(píng)價(jià)的技術(shù)領(lǐng)域,具體設(shè)及一種稀疏性相關(guān)度(SCS ,Sparse Correlation Score)圖像質(zhì)量評(píng)價(jià)方法。
【背景技術(shù)】
[0002] 主觀圖像質(zhì)量評(píng)價(jià)方法需要人類觀察者來(lái)評(píng)估一幅圖像相對(duì)于參考圖像的差別 從而得出圖像的質(zhì)量分?jǐn)?shù)。主觀圖像質(zhì)量評(píng)價(jià)方法固然可W得到精確的圖像評(píng)估結(jié)果,但 是運(yùn)一方法費(fèi)時(shí)費(fèi)力,也不適用于實(shí)時(shí)環(huán)境。因此,需要設(shè)計(jì)出客觀圖像質(zhì)量評(píng)價(jià)方法,讓 其自動(dòng)地計(jì)算出接近人類評(píng)價(jià)結(jié)果的圖像質(zhì)量分?jǐn)?shù)。目前,多數(shù)的客觀質(zhì)量評(píng)價(jià)方法都為 全參考算法,它需要一個(gè)沒有失真的參考圖像來(lái)輔助評(píng)價(jià)其他對(duì)應(yīng)的失真圖像的質(zhì)量?,F(xiàn) 今,最為常用的全參考評(píng)價(jià)方法是峰值信噪比(PSNR,peak signal-to-noise ratio)或是 與其對(duì)應(yīng)的均方誤差(MSE,mean squared error)。但是MSE和PSNR得到的評(píng)價(jià)結(jié)果與人類 的評(píng)價(jià)結(jié)果之間的相關(guān)性較差,尤其在處理一些W感知為主的聲音和圖像信號(hào)時(shí),上述方 法的缺點(diǎn)就暴露的更為明顯。感知質(zhì)量評(píng)價(jià)研究的目標(biāo)就是設(shè)計(jì)出能精確地符合人類感知 結(jié)果的評(píng)價(jià)方法。由于MSE和PSNR存在很大缺陷,所W許多研究者開始研究新的感知質(zhì)量評(píng) 價(jià)方法,實(shí)現(xiàn)對(duì)圖像精確的質(zhì)量評(píng)價(jià)。
[0003] 稀疏編碼可W對(duì)視覺皮層的信息處理提供精確的定量描述。Field和Olshausen指 出,稀疏編碼可W解釋視覺皮層中單細(xì)胞的響應(yīng)特點(diǎn)。稀疏編碼的含義是:對(duì)于一個(gè)給定的 圖像,通常只用一組基函數(shù)中的少數(shù)基向量來(lái)表示運(yùn)一圖像,而其他的基向量上的系數(shù)都 為零或幾乎為零。利用稀疏編碼在數(shù)千個(gè)圖像塊上經(jīng)過(guò)訓(xùn)練后得到的一組神經(jīng)元模型與主 視覺皮層中單細(xì)胞感受野的空間特性非常相似,即空間上的局部性、方向性和帶通性均非 常相似。Bell和Se化OWSki利用一個(gè)被稱作獨(dú)立成分分析(ICA)的相似學(xué)習(xí)目標(biāo)得到了相同 的結(jié)果。顯然,稀疏編碼是人類視覺系統(tǒng)和自然圖像之間的一座橋梁。在設(shè)計(jì)圖像質(zhì)量評(píng)價(jià) 方法時(shí),可W利用運(yùn)樣一個(gè)自然圖像的統(tǒng)計(jì)模型來(lái)模擬視覺皮層中細(xì)胞的響應(yīng)特性。但是, 事實(shí)上,只有少數(shù)研究將稀疏編碼或獨(dú)立成分分析直接應(yīng)用到質(zhì)量評(píng)判領(lǐng)域中。
【發(fā)明內(nèi)容】
[0004] 為了解決上述技術(shù)問題,本發(fā)明提供了一種稀疏性相關(guān)度圖像質(zhì)量評(píng)價(jià)方法,利 用稀疏編碼和視覺感知理論來(lái)創(chuàng)建圖像質(zhì)量感知模型,可W更精確地計(jì)算出失真圖像的視 覺感知質(zhì)量;可W用于圖像設(shè)備的校準(zhǔn),W便圖像設(shè)備能輸出高質(zhì)量圖像數(shù)據(jù),還可W用于 圖像處理系統(tǒng)及算法的性能評(píng)定,為相關(guān)的圖像處理技術(shù)提供基準(zhǔn)和評(píng)判依據(jù)。
[0005] 為了達(dá)到上述目的,本發(fā)明的技術(shù)方案是:一種稀疏性相關(guān)度圖像質(zhì)量評(píng)價(jià)方法, 通過(guò)預(yù)處理技術(shù)來(lái)模擬初級(jí)視覺通道的視覺信息處理;利用獨(dú)立成分分析算法和稀疏編碼 算法得到一個(gè)單細(xì)胞模型一一單細(xì)胞矩陣,來(lái)模擬視覺皮層的信息處理;參考圖像和失真 圖像數(shù)據(jù)經(jīng)過(guò)單細(xì)胞矩陣得出接近視覺感知特性的兩組輸出信息,然后在此基礎(chǔ)上計(jì)算兩 組視覺輸出信號(hào)的相關(guān)度,從而得到符合視覺主觀判斷的圖像質(zhì)量分?jǐn)?shù)(簡(jiǎn)稱SCS分?jǐn)?shù)),其 步驟如下:
[0006] 步驟一、對(duì)參考圖像和待處理的失真圖像進(jìn)行預(yù)處理:利用滑動(dòng)窗口將參考圖像 和失真圖像劃分為不重疊的圖像塊,每個(gè)圖像塊向量化為列向量,每個(gè)列向量通過(guò)減去其 均值來(lái)進(jìn)行中屯、化,將參考圖像和失真圖像的所有列向量組成參考圖像和失真圖像的協(xié)方 差矩陣fBf和Xdis;
[0007] 步驟二、利用PCA對(duì)參考圖像的協(xié)方差矩陣進(jìn)行特征值分解,選取M個(gè)最大的特征 值和其對(duì)應(yīng)的特征向量分別組成對(duì)角矩陣D和特征矩陣E,得到白化矩陣V:V = D-i/2eT,然后 得到白化后的數(shù)據(jù)矩陣:Z = VXTBf,其中,M為選取最大特征值的個(gè)數(shù);
[0008] 步驟S、利用化StICA稀疏編碼算法對(duì)白化后的數(shù)據(jù)矩陣Z進(jìn)行學(xué)習(xí),得到白化數(shù) 據(jù)的單細(xì)胞矩陣W",然后由白化空間轉(zhuǎn)換為原始空間,得到單細(xì)胞矩陣W=WWy;
[0009] 步驟四、利用單細(xì)胞矩陣W分別乘W參考圖像和失真圖像的參考圖像和失真圖像, 得到參考圖像和失真圖像的輸出信息;
[0010] 步驟五、由參考圖像和失真圖像的輸出信息計(jì)算稀疏性相關(guān)度,利用稀疏性相關(guān) 度評(píng)價(jià)失真圖像的質(zhì)量。
[0011] 所述利用化StICA稀疏編碼算法對(duì)白化后的數(shù)據(jù)矩陣Z進(jìn)行學(xué)習(xí),得到白化數(shù)據(jù)的 單細(xì)胞矩陣r的方法為:對(duì)白化后的數(shù)據(jù)矩陣Z,尋找其中一個(gè)最大化非高斯方向的過(guò)程, 由如下固定點(diǎn)迭代表示:
[001。
[0013] 其中,W"表示白化空間中單細(xì)胞矩陣的向量,k代表迭代步數(shù),E{'}表示變量的平 均值,g代表函數(shù):g (U) = tanh (au),1《a《2,U表示變量,g '表示函數(shù)g的導(dǎo)數(shù),函數(shù)g實(shí)際上 是函數(shù)G的導(dǎo)數(shù),且
[0014] 從一個(gè)隨機(jī)的正交矩陣開始,每一次迭代利用上述公式來(lái)更新白化數(shù)據(jù)的單細(xì)胞 矩陣WW中的每一列,然后通^
W對(duì)白化數(shù)據(jù)的單細(xì)胞矩陣進(jìn)行正交 化,上述過(guò)程重復(fù)直到算法收斂為止。
[0015] 所述稀疏性相關(guān)度的質(zhì)量分?jǐn)?shù)為:
[0016]
[0017] 其中,m和n代表矩陣元素的空間位置,媒f V端分別表示矩陣S"哺S"s第m行、n 列的元素值,玄和玄W/分別表示參考圖像和失真圖像的輸出信息STBf和Sd"的均值,N表示 參考圖像和失真圖像的圖像塊個(gè)數(shù)。
[0018] 所述滑動(dòng)窗口的大小為P X P,M的大小為圖像塊總像素值個(gè)數(shù)的1/3,其中P = S。
[0019] 本發(fā)明利用自然圖像的統(tǒng)計(jì)模型來(lái)模擬人類視覺的信息處理過(guò)程,通過(guò)模擬視覺 皮層的信息處理來(lái)計(jì)算兩個(gè)圖像信號(hào)在視覺皮層階段(皮層視覺空間)中的相關(guān)性,依據(jù)主 視覺皮層傾向于提取圖像中的獨(dú)立特征并形成對(duì)圖像的稀疏表達(dá),利用稀疏性相關(guān)度 (SCS,Sparse Correlation Score)評(píng)價(jià)圖像的失真度。本發(fā)明利用主成分分析(PCA)和降 維操作來(lái)模擬視網(wǎng)膜和側(cè)膝體的視覺信息處理;視覺皮層的信息處理則由單細(xì)胞矩陣來(lái)模 擬,單細(xì)胞矩陣則是通過(guò)利用一個(gè)稀疏編碼算法在參考圖像的樣本中學(xué)習(xí)得到;最后,參考 圖像和失真圖像經(jīng)過(guò)單細(xì)胞矩陣輸出兩組信息,通過(guò)計(jì)算運(yùn)兩組信息的相關(guān)度得到最終的 稀疏性相關(guān)度質(zhì)量分?jǐn)?shù)。本發(fā)明利用稀疏編碼(或ICA)在構(gòu)建圖像信息模型的同時(shí)也完成 了對(duì)視覺模型的構(gòu)建,實(shí)現(xiàn)驗(yàn)證,其質(zhì)量評(píng)判結(jié)果與人類的主觀評(píng)判更接近,同時(shí)適用于彩 色圖像的質(zhì)量評(píng)價(jià)。
【附圖說(shuō)明】
[0020] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可W 根據(jù)運(yùn)些附圖獲得其他的附圖。
[0021] 圖1為本發(fā)明的流程圖。
[0022] 圖2為PSNR算法在LIVE數(shù)據(jù)庫(kù)上的散點(diǎn)圖。
[0023] 圖3為SSIM算法在LIVE數(shù)據(jù)庫(kù)上的散點(diǎn)圖。
[0024] 圖4為VSNR算法在LIVE數(shù)據(jù)庫(kù)上的散點(diǎn)圖。
[0025] 圖5為本發(fā)明在LIVE數(shù)據(jù)庫(kù)上的散點(diǎn)圖。
[0026] 圖6為本發(fā)明用于色彩失真質(zhì)量評(píng)價(jià)的測(cè)試圖。
【具體實(shí)施方式】
[0027] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;?本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有付出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0028] -種稀疏性相關(guān)度圖像質(zhì)量評(píng)價(jià)方法,通過(guò)預(yù)處理技術(shù)來(lái)模擬初級(jí)視覺通道的視 覺信息處理;利用獨(dú)立成分分析算法和稀疏編碼算法得到一個(gè)單細(xì)胞模型一一單細(xì)胞矩 陣,來(lái)模擬視覺皮層的信息處理;利用單細(xì)胞矩陣計(jì)算圖像的稀疏度相關(guān)性。如圖1所示,其 步驟如下:
[0029] 1.預(yù)處理
[0030] 對(duì)參考圖像和待處理的失真圖像進(jìn)行預(yù)處理:利用滑動(dòng)窗口將參考圖像和失真圖 像劃分為不重疊的圖像塊,每個(gè)二維的圖像塊向量化為列向量,每個(gè)列向量通過(guò)減去其均 值來(lái)進(jìn)行中屯、化。運(yùn)樣一來(lái),一個(gè)P XP的圖像塊變成了 一個(gè)零均值的R維的列向量X = (XI,…,xr)t,PXP為滑動(dòng)窗口和圖像塊的大小。通過(guò)該向量化操作,來(lái)自每個(gè)參考圖像和其 對(duì)應(yīng)的失真圖像的所有列向量則形成兩個(gè)二維矩陣,用)Tf和Xdis分別表示。
[0031] 2.模擬視網(wǎng)膜和側(cè)膝體上的信息處理
[0032] 去冗余理論可W很好地解釋視網(wǎng)膜和側(cè)膝體內(nèi)神經(jīng)元的響應(yīng)特點(diǎn)。因此,本發(fā)明 利用PCA來(lái)進(jìn)行降維處理W除去數(shù)據(jù)中的冗余信息。PCA還可W用來(lái)進(jìn)行白化操作,也可W 描述視網(wǎng)膜的神經(jīng)節(jié)細(xì)胞和側(cè)膝體中感受野的結(jié)構(gòu)特征。
[0033] 利用PCA對(duì)參考圖像的協(xié)方差矩陣)Tf進(jìn)行特征值分解,選取M個(gè)最大的特征值和 其對(duì)應(yīng)的特征向量分別組成對(duì)角矩陣D和特征矩陣E,其中D = diag(di,…,dM),E= (ei,…, GM),山,…,dM表示協(xié)方差矩陣)Tf的M個(gè)最大的特征值,ei,…,6M分別表示協(xié)方差矩陣ref的M 個(gè)最大特征值對(duì)應(yīng)的特征向量,M為選取最大特征值的個(gè)數(shù)。
[0034] 則白化矩陣V可W由下式得到
[0035] V =擴(kuò)i/2eT (1)
[0036] 最后,參考圖像白化后的數(shù)據(jù)矩陣Z可W通過(guò)下式得到
[0037] Z = Vxref (2)。
[0038] 3.模擬視覺皮層上的信息處理
[0039] 白化和降維操作可W解釋視網(wǎng)膜到側(cè)膝體的視覺處理,同樣的,稀疏編碼和ICA則 可W模擬側(cè)膝體到視覺皮層的信息處理。本發(fā)明視覺皮層上的信息處理是通過(guò)化StICA稀 疏編碼算法來(lái)實(shí)現(xiàn)的。
[0040] 首先從圖像表達(dá)的基本假設(shè)說(shuō)起,一個(gè)圖像向量X可W表示成一組來(lái)自矩陣A的特 征或是基向量的線性組合:x = As。系數(shù)S是一個(gè)隨機(jī)向量它隨圖像塊的不同而不同。假設(shè)圖 像向量的維數(shù)與矩陣A中特征或基的個(gè)數(shù)相等。則將運(yùn)一系統(tǒng)逆轉(zhuǎn),將得到S = Wx,其中W是 稀疏矩陣A的逆或偽逆。一般來(lái)說(shuō),稀疏編碼就是要尋找一個(gè)可逆的矩陣W,使得轉(zhuǎn)換后的數(shù) 據(jù)滿足一定的統(tǒng)計(jì)優(yōu)化特性,比如獨(dú)立性和稀疏性等。
[0041] 許多研究者都將其注意力投入到了稀疏矩陣A中的基或特征向量,因?yàn)橄∈杈仃嘇 對(duì)應(yīng)圖像中的某些組成成分,相對(duì)于矩陣W它具有更好的可視性。然而,在精神物理學(xué)的建 模上,矩陣W與主視覺皮層的神經(jīng)元細(xì)胞密切相關(guān)。每個(gè)矩陣W中的加權(quán)向量可W看作是一 個(gè)單細(xì)胞感受野的模型,而系數(shù)S則代表細(xì)胞的輸出信息。
[0042] 最大化稀疏性過(guò)程實(shí)際上與獨(dú)立成分分析非常接近,因?yàn)橄∈栊缘韧诔咚?性。所W,一個(gè)固定點(diǎn)獨(dú)立成分分析算法一一FastICA被用于訓(xùn)練單細(xì)胞矩陣。利用化StICA 稀疏編碼算法對(duì)白化后的數(shù)據(jù)矩陣Z進(jìn)行學(xué)習(xí)的方法是:對(duì)白化后的數(shù)據(jù)矩陣Z JastICA尋 找其中一個(gè)最大化非高斯方向的過(guò)程,由如下固定點(diǎn)迭代表示:
[0043] 化)=E{Zg(wW化-l)Tz)}-E{g'(W"化-l)Tz)}wW化-1) (3)
[0044] 其中,W"表示白化空間中單細(xì)胞矩陣的向量,k代表迭代步數(shù),E{'}表示變量的平 均值,g代表函數(shù):g (U) = tanh (au),1《a《2,U表示變量,g '表示函數(shù)g的導(dǎo)數(shù),而函數(shù)g實(shí)際 上是函數(shù)G的導(dǎo)數(shù),且
[0045] 從一個(gè)隨機(jī)的正交矩陣開始,每一次迭代利用上述公式來(lái)更新白化數(shù)據(jù)的單細(xì)胞 矩陣WW中的每一列,然后通過(guò)
"對(duì)白化數(shù)據(jù)的單細(xì)胞矩陣進(jìn)行正交 化。上述計(jì)算過(guò)程不斷重復(fù),當(dāng)前迭代得到的結(jié)果跟上一次迭代得到的結(jié)果之間存在的差 異會(huì)逐漸變小,一般我們判斷一個(gè)迭代優(yōu)化算法是否收斂的條件是運(yùn)一差異是否足夠小。 本算法中的收斂判定條件為:
[0046]
(4)
[0047] 其中,不等式左邊是用于計(jì)算差異的,和W。心分別表示當(dāng)前迭代和上一次迭 代過(guò)程中的矩陣r,I表示單位對(duì)角矩陣,n表示樣本個(gè)數(shù),diag( ?)表示將矩陣對(duì)角化,sum (?)表示求矩陣中所有元素的和。簡(jiǎn)單的說(shuō),當(dāng)兩次迭代結(jié)果的差異小于nXl(T5時(shí)迭代終 止。
[0048] 由于之前的計(jì)算是基于白化后的樣本數(shù)據(jù)Z,所W,學(xué)習(xí)過(guò)程完成后,為了能將得 到的單細(xì)胞模型直接應(yīng)用于圖像數(shù)據(jù),單細(xì)胞模型還需要從白化空間轉(zhuǎn)換到原始空間:
[0049] W=TXV 巧)
[0050] 其中,WW表示在白化樣本數(shù)據(jù)上訓(xùn)練得到的單細(xì)胞模型,V是變換矩陣將數(shù)據(jù)從白 化空間變換到原始空間,最終得到的單細(xì)胞矩陣W則可W直接用于原始圖像數(shù)據(jù)。
[0051 ] 4.稀疏性相關(guān)度:SCS
[0052] 通過(guò)在參考數(shù)據(jù)上訓(xùn)練得到單細(xì)胞矩陣W后,利用單細(xì)胞矩陣W分別乘W參考圖像 和失真圖像的參考圖像和失真圖像,得到參考圖像和失真圖像的輸出信息:
[0053] Stef = Wxref (5)
[0054] s"s=WX"s (6)
[0055] 其中,矩陣STBf和Sdis分別表示參考圖像和失真圖像所對(duì)應(yīng)的輸出信息。W的每一個(gè) 行代表一個(gè)單細(xì)胞感受野。
[0056] 由參考圖像和失真圖像的輸出信息計(jì)算稀疏性相關(guān)度,利用稀疏性相關(guān)度評(píng)價(jià)失 真圖像的質(zhì)量。
[0057] 稀疏性相關(guān)度SCS的質(zhì)量分?jǐn)?shù)為:
[0058]
巧
[0化9]其中,111和11代表矩陣元素的空間位置,及:^{、5:^分別表示矩陣5^6*和5413第"1行、11 列的元素值,玄和玄K/分別表示參考圖像和失真圖像的輸出信息STBf和Sdls的均值,矩陣 STBf和Sdis的大小為MXN,N表示參考圖像和失真圖像的圖像塊個(gè)數(shù),M表示系數(shù)向量的維度 (或經(jīng)過(guò)降維后的圖像向量的維度)。
[0060] 具體實(shí)例:
[0061] 1圖像塊大小
[0062] 本發(fā)明采用的標(biāo)準(zhǔn)圖像塊大小為8 X8,即P = 8,因?yàn)檫\(yùn)個(gè)大小是JPEG壓縮和其他 圖像處理中所常用的圖像塊尺寸。實(shí)際上,8X8的圖像塊尺寸會(huì)產(chǎn)生最好的圖像評(píng)估結(jié)果。 所W,一個(gè)圖像塊的RGBS個(gè)圖像通道就產(chǎn)生了R = 3X8X8 = 192個(gè)像素值。
[0063] 2降維比例
[0064] SCS對(duì)降維比例非常敏感。經(jīng)過(guò)大量的實(shí)驗(yàn),發(fā)現(xiàn)當(dāng)降維比例處于0.3125左右時(shí) SCS會(huì)給出更為精確的評(píng)估結(jié)果。令M表示降維后保留的維數(shù),則經(jīng)過(guò)降維操作后,圖像塊向 量的維數(shù)由R= 192變?yōu)镸=60。
[0065] 由于圖像質(zhì)量評(píng)價(jià)的研究目的是為了能更精準(zhǔn)地計(jì)算出符合人類主觀感受的圖 像質(zhì)量分?jǐn)?shù)。因此,圖像質(zhì)量評(píng)價(jià)研究極大地依賴于人類觀察者對(duì)圖像的主觀評(píng)測(cè)實(shí)驗(yàn),運(yùn) 些實(shí)驗(yàn)?zāi)転檠芯刻峁?zhǔn)確的質(zhì)量分?jǐn)?shù)來(lái)檢驗(yàn)客觀圖像質(zhì)量評(píng)價(jià)方法的性能,并輔助質(zhì)量評(píng) 價(jià)方法的參數(shù)調(diào)試和校準(zhǔn)。此外,由于感知系統(tǒng)會(huì)受到各種主觀因素的影響導(dǎo)致觀察者個(gè) 體對(duì)圖像的感知評(píng)價(jià)結(jié)果并不穩(wěn)定。因此,圖像質(zhì)量評(píng)價(jià)研究必須建立在大量的圖像數(shù)據(jù) 和主觀評(píng)測(cè)者的基礎(chǔ)上。
[0066] 研究圖像質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)的許多學(xué)術(shù)團(tuán)隊(duì)大都有自己的圖像質(zhì)量數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)中 不僅有各種可供實(shí)驗(yàn)的失真圖像,而且,數(shù)據(jù)庫(kù)對(duì)每一個(gè)失真圖像都提供了較為精確的主 觀質(zhì)量分?jǐn)?shù),運(yùn)些人類主觀評(píng)判分?jǐn)?shù)都是在大量觀測(cè)者評(píng)出的質(zhì)量分?jǐn)?shù)基礎(chǔ)上得出的。在 主觀評(píng)判實(shí)驗(yàn)中,針對(duì)每一幅失真圖像將得到大量評(píng)測(cè)者給出的原始質(zhì)量分?jǐn)?shù),運(yùn)些原始 分?jǐn)?shù)通過(guò)一定的統(tǒng)計(jì)方法最終得到一個(gè)平均主觀評(píng)分(Mean化inion Score,M0S)或差異 平均主觀評(píng)分化ifference Mean Opinion Score,DM0S),并W此作為該圖像最終的主觀質(zhì) 量分?jǐn)?shù)。當(dāng)需要檢查一個(gè)客觀圖像質(zhì)量評(píng)價(jià)方法是否符合人類視覺的主觀判斷時(shí)就可W將 該方法在圖像數(shù)據(jù)庫(kù)上所得出的客觀質(zhì)量評(píng)價(jià)分?jǐn)?shù)與數(shù)據(jù)庫(kù)中對(duì)應(yīng)的主觀評(píng)判分?jǐn)?shù)相比 較,并看他們的符合程度。由于LIVE數(shù)據(jù)庫(kù)是知名度和權(quán)威性較高的一個(gè)數(shù)據(jù)庫(kù)。因此,本 發(fā)明在LIVE數(shù)據(jù)庫(kù)上進(jìn)行對(duì)比和評(píng)測(cè)。
[0067] 為了便于比較,選取了其他S種方法(PSNR,VSNR和SSIM)與本發(fā)明一同進(jìn)行對(duì)比 評(píng)測(cè)。其中,VSNR(Visual Signal-t〇-Noise Ratio)算法是有美國(guó)的Damon M.化andler于 2007年提出,SSIM(Structural Similarity)算法是由Zhou Wang于2004年提出,SSIM是該 領(lǐng)域知名度最高的算法,目前已應(yīng)用在很多圖像處理相關(guān)領(lǐng)域。
[0068] 評(píng)測(cè)參數(shù)包括:皮爾遜相關(guān)系數(shù)(Pearson Linear Correlation Coefficient, 化CC)、斯皮爾曼等級(jí)相關(guān)系數(shù)(Spearman Rank-order Correlation Coefficient,SRCC)、 肯德爾等級(jí)相關(guān)系數(shù)化endall Rank-order Correlation Coefficient,KRCC)、均方根誤 差(Root Mean Squared E;;r;ro;r,RM沈)、平均絕對(duì)誤差(Mean Absolute terror,MAE)和異常 值比例(Outlier Ratio,OR)。6個(gè)評(píng)估參數(shù)中,PLCC,RMSE和MAE主要評(píng)估方法的預(yù)測(cè)精確 性;SRCC和KRCC主要評(píng)估方法的預(yù)測(cè)單調(diào)性;而OR主要評(píng)估方法的預(yù)測(cè)一致性。PLCC,SRCC 和KRCC的值越大,且OR,RMSE和MAE的值越小,則說(shuō)明該方法的評(píng)價(jià)結(jié)果越好。
[0069] 四種方法在LIVE數(shù)據(jù)庫(kù)上的運(yùn)行結(jié)果如表1所示。由表1可知,本發(fā)明的SCS方法在 各項(xiàng)評(píng)估參數(shù)上均表現(xiàn)優(yōu)異,不僅優(yōu)于傳統(tǒng)的PSNR還優(yōu)于著名的SSIM和VSNR方法。
[0070] 表1四種方法在LIVE數(shù)據(jù)庫(kù)上的性能評(píng)價(jià)結(jié)果
[0071]
[0072] 為了能更直觀地對(duì)比圖像質(zhì)量評(píng)價(jià)方法的性能,還可W采用散點(diǎn)圖。每一個(gè)質(zhì)量 評(píng)價(jià)方法在LIVE數(shù)據(jù)庫(kù)上通過(guò)計(jì)算得到全部圖像的客觀質(zhì)量分?jǐn)?shù),運(yùn)樣,關(guān)于數(shù)據(jù)庫(kù)中的 每一個(gè)圖像就有對(duì)應(yīng)的兩個(gè)分?jǐn)?shù):由人類觀測(cè)者得出的主觀質(zhì)量分?jǐn)?shù)(Sub jecti ve Score) 和由算法得到的客觀質(zhì)量分?jǐn)?shù)(Objective Score)。然后,將每個(gè)圖像所對(duì)應(yīng)的運(yùn)兩個(gè)分?jǐn)?shù) 全部顯示在一個(gè)二維的平面坐標(biāo)內(nèi),最終,數(shù)據(jù)庫(kù)中所有圖像的分?jǐn)?shù)就形成一個(gè)散點(diǎn)圖,橫 軸標(biāo)定客觀質(zhì)量分?jǐn)?shù),縱軸標(biāo)定主觀質(zhì)量分?jǐn)?shù)。如果散點(diǎn)圖中的數(shù)據(jù)點(diǎn)比較集中并且分布 趨近于直線則說(shuō)明該方法得到的結(jié)果更接近人類視覺的主觀判定,同時(shí)說(shuō)明,該圖像質(zhì)量 評(píng)價(jià)方法較好。
[007引圖2-圖5分別顯示了PSNR、SSIM、VSNR和本發(fā)明四種方法的散點(diǎn)圖,圖中每個(gè)點(diǎn)代 表著一幅圖像的質(zhì)量數(shù)據(jù),其橫軸數(shù)據(jù)是由方法得出,縱軸數(shù)據(jù)由人類的評(píng)判得出。通過(guò)對(duì) 比可W看到,本發(fā)明SCS的散點(diǎn)圖更集中且分別呈直線,運(yùn)說(shuō)明SCS方法的評(píng)價(jià)結(jié)果相對(duì)于 其他算法更精確。
[0074] 本發(fā)明與當(dāng)前的一些其他主要算法的另一個(gè)不同在于,SCS基于所有紅綠藍(lán)色彩 通道信息,而其他算法多數(shù)是基于彩色圖像的亮度分量的,例如,SSIM,PSNR等。所Wscs能 更好地檢測(cè)到圖像的色彩失真。
[0075] 如圖6所示,圖6(a)是LIVE數(shù)據(jù)庫(kù)中的一個(gè)參考圖局部,圖6(b)是一幅JPEG-2000 壓縮圖,圖6(c)是一幅白色噪聲失真圖,圖6(d)是在一幅色彩失真圖像,其中,藍(lán)綠色通道 的像素信息被隨機(jī)的減小,為了保持圖像的整體亮度信息不變,紅色通道的像素?cái)?shù)值將通 過(guò)圖像原有的亮度減去改變后的藍(lán)色和綠色像素值得到??蒞預(yù)見,只基于圖像亮度信息 的算法根本無(wú)法檢測(cè)到嚴(yán)重的色彩失真,因?yàn)榱炼刃畔⑴c原圖幾乎相同。
[0076] 用PSNR、SSIM和本發(fā)明SCSS種算法計(jì)算圖6中的S幅失真圖像的質(zhì)量,得到的結(jié) 果如表2所示。
[0077] 表2色彩失真評(píng)價(jià)結(jié)果(原始分?jǐn)?shù))
[007引
[0079] 通過(guò)對(duì)比發(fā)現(xiàn),失真最嚴(yán)重的圖6(d) ,SSIM竟給出了較高的質(zhì)量分?jǐn)?shù),PSNR雖然也 利用了全部色彩信息計(jì)算,但對(duì)于圖6(d)的判斷仍不夠準(zhǔn)確。然而,SCS給出的分?jǐn)?shù)則很好 地反應(yīng)了 S幅失真圖像的感知質(zhì)量結(jié)果。運(yùn)說(shuō)明SCS算法對(duì)于彩色圖像的失真判斷地更精 確。
[0080] 總的來(lái)說(shuō),通過(guò)參考運(yùn)些圖表可W看到,SCS可W提供更穩(wěn)定、更精確的圖像質(zhì)量 評(píng)價(jià)結(jié)果。而且,在彩色圖像質(zhì)量評(píng)價(jià)方面SCS還有較大的優(yōu)勢(shì)。
[0081] W上所述,僅為本發(fā)明較佳的【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此, 任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明掲露的技術(shù)范圍內(nèi),可輕易想到的變化或替換, 都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種稀疏性相關(guān)度圖像質(zhì)量評(píng)價(jià)方法,其特征在于,通過(guò)預(yù)處理技術(shù)來(lái)模擬初級(jí)視 覺通道的視覺信息處理;利用獨(dú)立成分分析算法和稀疏編碼算法得到一個(gè)單細(xì)胞模型一一 單細(xì)胞矩陣,來(lái)模擬視覺皮層的信息處理;參考圖像和失真圖像數(shù)據(jù)經(jīng)過(guò)單細(xì)胞矩陣得出 接近視覺感知特性的兩組輸出信息,然后在此基礎(chǔ)上計(jì)算兩組視覺輸出信號(hào)的相關(guān)度,從 而得到符合視覺主觀判斷的圖像質(zhì)量分?jǐn)?shù),其步驟如下: 步驟一、對(duì)參考圖像和待處理的失真圖像進(jìn)行預(yù)處理:利用滑動(dòng)窗口將參考圖像和失 真圖像劃分為不重疊的圖像塊,每個(gè)圖像塊向量化為列向量,每個(gè)列向量通過(guò)減去其均值 來(lái)進(jìn)行中心化,將參考圖像和失真圖像的所有列向量組成參考圖像和失真圖像的協(xié)方差矩 陣)rqpx dis; 步驟二、利用PCA對(duì)參考圖像的協(xié)方差矩陣進(jìn)行特征值分解,選取M個(gè)最大的特征值和 其對(duì)應(yīng)的特征向量分別組成對(duì)角矩陣D和特征矩陣E,得到白化矩陣V: V = Tv2Et,然后得到 白化后的數(shù)據(jù)矩陣:Z = VXraf,其中,M為選取最大特征值的個(gè)數(shù); 步驟三、利用FastICA稀疏編碼算法對(duì)白化后的數(shù)據(jù)矩陣Z進(jìn)行學(xué)習(xí),得到白化數(shù)據(jù)的 單細(xì)胞矩陣Ww,然后由白化空間轉(zhuǎn)換為原始空間,得到單細(xì)胞矩陣W=WwV; 步驟四、利用單細(xì)胞矩陣W分別乘以參考圖像和失真圖像的參考圖像和失真圖像,得到 參考圖像和失真圖像的輸出信息; 步驟五、由參考圖像和失真圖像的輸出信息計(jì)算稀疏性相關(guān)度,利用稀疏性相關(guān)度評(píng) 價(jià)失真圖像的質(zhì)量。2. 根據(jù)權(quán)利要求1所述的稀疏性相關(guān)度圖像質(zhì)量評(píng)價(jià)方法,其特征在于,所述利用 FastICA稀疏編碼算法對(duì)白化后的數(shù)據(jù)矩陣Z進(jìn)行學(xué)習(xí),得到白化數(shù)據(jù)的單細(xì)胞矩陣W w的方 法為:對(duì)白化后的數(shù)據(jù)矩陣Z,尋找其中一個(gè)最大化非高斯方向的過(guò)程,由如下固定點(diǎn)迭代 表7K:其中,^^表示白化空間中單細(xì)胞矩陣的向量,k代表迭代步數(shù),E{ ·}表示變量的平均值, g代表函數(shù):g(u) = tanh(au),l<a<2,u表示變量,g'表示函數(shù)g的導(dǎo)數(shù),函數(shù)g實(shí)際上是函 數(shù)6的導(dǎo)數(shù),且(;(")=丄丨〇8奶[1{^"); a 從一個(gè)隨機(jī)的正交矩陣開始,每一次迭代利用上述公式來(lái)更新白化數(shù)據(jù)的單細(xì)胞矩陣 Ww中的每一列,然后通過(guò)Wlt ^ 白化數(shù)據(jù)的單細(xì)胞矩陣進(jìn)行正交化,上述 過(guò)程重復(fù)直到算法收斂為止。3. 根據(jù)權(quán)利要求1所述的稀疏性相關(guān)度圖像質(zhì)量評(píng)價(jià)方法,其特征在于,所述稀疏性相 關(guān)度的質(zhì)量分?jǐn)?shù)為:其中,m和η代表矩陣元素的空間位置,S=、S=分別表示矩陣Slrrf和5(113第 111行、η列的元 素值,Yfe和友#分別表示參考圖像和失真圖像的輸出信息SM和Sdls的均值,N表示參考圖像 和失真圖像的圖像塊個(gè)數(shù)。4.根據(jù)權(quán)利要求1所述的稀疏性相關(guān)度圖像質(zhì)量評(píng)價(jià)方法,其特征在于,所述滑動(dòng)窗口 的大小為P X P,M的大小為圖像塊總像素值個(gè)數(shù)的1 /3,其中P = 8。
【文檔編號(hào)】G06T7/40GK106023267SQ201610343134
【公開日】2016年10月12日
【申請(qǐng)日】2016年5月23日
【發(fā)明人】常化文, 楊華, 張秋聞, 吳慶崗, 李曄
【申請(qǐng)人】鄭州輕工業(yè)學(xué)院