專利名稱:計(jì)算視頻圖像中的模糊的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于確定和計(jì)算視頻圖像中的模糊(blur)的方法和裝置。
背景技術(shù):
模糊是與圖像質(zhì)量相關(guān)的最重要的特征之一。精確地估計(jì)圖像的模糊級(jí)別對(duì)精確地估計(jì)它的質(zhì)量有很大幫助。已經(jīng)提出了各種方法來(lái)解決這個(gè)問(wèn)題,例如在作者為Debing Liu、Zhibo Chen、Huadong Ma、Feng Xu 禾口 Xiaodong Gu 的"No-Reference Block Based Blur Detection,,1 中,或在作者為 P. Marziliano、F. Dufaux、S. Winkler 和 Τ· Ebrahimi 的 "A no-reference perceptual blur metric"2 中,或者在類似的專利申請(qǐng)W003/092306 中。所有目前已知的模糊檢測(cè)方案僅僅根據(jù)圖像自身的信息來(lái)估計(jì)圖像的模糊級(jí)別。 然而,設(shè)計(jì)一種對(duì)于所有類型的模糊都具有高性能的普通模糊檢測(cè)方案是困難的。模糊檢測(cè)被用于圖像質(zhì)量確定或估計(jì),或者模糊檢測(cè)在模糊消除之前。對(duì)于上面兩者,令人期望的是知道模糊的來(lái)源是什么。單單根據(jù)圖像,這是比較困難的或者甚至是不可能的。因此,目前使用普通模糊檢測(cè)方案。因?yàn)檫@樣的普通解決方案在不同的情況下無(wú)法考慮特定的模糊類型,因此它的精度不高。
發(fā)明內(nèi)容
已經(jīng)意識(shí)到,存在許多類型的模糊,例如通過(guò)H. 264編碼或者通過(guò)MPEG-2編碼產(chǎn)生的模糊,并且那些不同類型的模糊具有不同的特征。模糊檢測(cè)和計(jì)算可能受許多因素例如圖像分辨率、編碼配置、編解碼器類型和模糊類型影響。缺乏那些因素的信息將明確地影響模糊檢測(cè)的性能。那些因素中的一些僅僅根據(jù)圖像自身是不能獲得的或者不能被精確地估計(jì)。在本發(fā)明中,我們提出了一種改進(jìn)的可配置的模糊檢測(cè)和/或計(jì)算方案。在一方面,模糊檢測(cè)和/或計(jì)算基于計(jì)算水平模糊值、確定視頻圖像的特性參數(shù)和規(guī)范化模糊值。 如果視頻圖像是逐行的,則也計(jì)算垂直模糊值并且在規(guī)范化之前將該垂直模糊值與該水平模糊值相組合。提高的模糊值可用于圖像質(zhì)量確定或估計(jì),或者作為用于模糊消除算法的控制參數(shù)。在一個(gè)實(shí)施例中,用戶首先給出特性因素的一些配置,并且隨后基于用戶配置應(yīng)用適當(dāng)?shù)哪:龣z測(cè)方案。在另一個(gè)實(shí)施例中,從視頻解碼器直接地獲得特性因素。附加的信息將極大地提高模糊檢測(cè)的性能。例如,可以將視頻區(qū)分為隔行的或逐行的。在它們之間有許多不同之處,并且考慮這些不同之處會(huì)改善模糊確定和模糊計(jì)算。本發(fā)明的一方面是對(duì)于隔行的視頻圖像使用特定的模糊檢測(cè)方案,對(duì)于逐行的視頻圖像使用不同的特定模糊檢測(cè)方案。根據(jù)本發(fā)明的一方面,一種確定和/或計(jì)算視頻圖像的模糊的方法,包括以下步驟計(jì)算水平模糊值;確定視頻圖像的特性參數(shù),所述特性參數(shù)至少包括逐行的/隔行的和空間分辨率級(jí)別;如果視頻圖像是逐行的,則也計(jì)算垂直模糊值,并且將其與水平模糊值相組合;和根據(jù)預(yù)定的最小值(min)和最大值(max),規(guī)范化水平模糊值、或組合的水平和垂直模糊值,其中所述最小值和最大值適應(yīng)于所述空間分辨率級(jí)別。在一個(gè)實(shí)施例中,計(jì)算水平模糊值的步驟是至少或者僅對(duì)垂直MB邊緣的中心周圍的圖像區(qū)域進(jìn)行的。在一個(gè)實(shí)施例中,計(jì)算垂直模糊值的步驟也是對(duì)水平MB邊緣的中心周圍的圖像區(qū)域進(jìn)行的。在一個(gè)實(shí)施例中,計(jì)算模糊值包括計(jì)算當(dāng)前像素周圍的局部變化。在一個(gè)實(shí)施例中,水平模糊值的局部變化是根據(jù)垂直線上的像素和水平線上的像素來(lái)計(jì)算的,其中使用了比來(lái)自垂直線更多的來(lái)自水平線的像素,并且其中水平MB邊緣的所述中心是所述兩條線的一端。在一個(gè)實(shí)施例中,如果局部變化在最大閾值以上或者在最小閾值之下,則所述當(dāng)前像素被排除在模糊計(jì)算之外。在一個(gè)實(shí)施例中,視頻圖像的特性參數(shù)中的一個(gè)或多個(gè)是通過(guò)用戶接口或者在通過(guò)用戶接口輸入之后從存儲(chǔ)器中獲得的。在一個(gè)實(shí)施例中,視頻圖像的特性參數(shù)中的一個(gè)或多個(gè)是通過(guò)機(jī)器接口從視頻解碼器中獲得的。在一個(gè)實(shí)施例中,視頻圖像的特性參數(shù)中的一個(gè)或多個(gè)是通過(guò)與視頻圖像相關(guān)聯(lián)的元數(shù)據(jù)獲得的。也可以從不同的這些源中獲得不同的特性參數(shù)。根據(jù)本發(fā)明的另一方面,一種計(jì)算機(jī)程序產(chǎn)品包括使得計(jì)算機(jī)執(zhí)行上述方法的代碼。根據(jù)本發(fā)明的另一方面,一種用于計(jì)算視頻圖像的模糊的裝置包括用于計(jì)算水平模糊值的部件;用于確定視頻圖像的特性參數(shù)的部件,所述特性參數(shù)至少包括逐行的/ 隔行的和空間分辨率級(jí)別;用于如果視頻圖像是逐行的則也計(jì)算垂直模糊值并且將其與水平模糊值相組合的部件;和用于根據(jù)預(yù)定的最小值和最大值規(guī)范化水平模糊值、或組合的水平和垂直模糊值的部件,其中所述最小值和最大值適應(yīng)于所述空間分辨率級(jí)別。所附權(quán)利要求、下面的描述和附圖中披露了本發(fā)明的有益實(shí)施例。
參考附圖來(lái)描述本發(fā)明的示例性實(shí)施例,其中圖1示出了可配置的模糊檢測(cè)方案的過(guò)程;圖2示出了針對(duì)逐行的或隔行的圖像的模糊計(jì)算;圖3示出了水平模糊計(jì)算的示例性流程圖;圖4示出了局部模糊計(jì)算的位置和局部變化計(jì)算的區(qū)域;和圖5示出了局部模糊計(jì)算的示例。
具體實(shí)施例方式本發(fā)明披露了一種靈活且可配置的模糊檢測(cè)和/或模糊計(jì)算方案。圖1 一般圖示了包含三個(gè)步驟的可配置的模糊檢測(cè)過(guò)程首先,獲得配置數(shù)據(jù)。這些可以通過(guò)用戶輸入。對(duì)于將要估計(jì)的圖像,用戶可以給出配置的特性參數(shù)以便指出特定情形。用戶配置可以是影響模糊檢測(cè)方案的任何事物,例如分辨率、逐行的或隔行的、編解碼器類型、編碼配置和模糊類型(壓縮模糊、運(yùn)動(dòng)模糊、焦點(diǎn)沒(méi)對(duì)準(zhǔn)模糊、低通濾波模糊、上取樣模糊等等)。這些特性參數(shù)可以單獨(dú)或者以任意組合被使用。將要注意,特性參數(shù)也可以在通過(guò)用戶接口輸入之后從存儲(chǔ)器中獲得,或者通過(guò)機(jī)器接口從視頻解碼器和/或通過(guò)與視頻圖像相關(guān)聯(lián)的元數(shù)據(jù)中獲得。在后一種情況,根據(jù)本發(fā)明,視頻解碼器包括用于從視頻信號(hào)提取這些元數(shù)據(jù)的部件和用于將元數(shù)據(jù)提供給模糊檢測(cè)器或計(jì)算器的部件。其次,根據(jù)配置自動(dòng)地選擇合適的模糊檢測(cè)方案。模糊檢測(cè)方案根據(jù)上述的配置數(shù)據(jù)而改變。所述改變可以是完全地框架改變,或者它可以僅僅是一些參數(shù)的調(diào)整。如果沒(méi)有定義配置,則可以選擇默認(rèn)模糊檢測(cè)方案。再次,輸出均勻(或統(tǒng)一)的模糊值。根據(jù)不同的配置,模糊檢測(cè)方案不同地工作, 這結(jié)果影響所計(jì)算的模糊值的價(jià)值。也就是,從不同的模糊檢測(cè)和/或模糊計(jì)算方案獲得的模糊值不是直接可比較的。因此,根據(jù)本發(fā)明,它們被統(tǒng)一或標(biāo)準(zhǔn)化為統(tǒng)一的格式。在一個(gè)實(shí)施例中,這可以通過(guò)縮放來(lái)獲得。例如,使用線性縮放。其他更復(fù)雜的縮放類型也是可能的。在本發(fā)明的一個(gè)實(shí)施例中,所計(jì)算的模糊值被縮放到(0-100)的范圍,其中0表示最小模糊,且100表示最大模糊??商鎿Q地,縮放可以是(0-1)或(0% -100% )或類似的范圍。針對(duì)不同的配置,縮放規(guī)則可以不同。下面是可配置的模糊檢測(cè)/計(jì)算方案的示例性實(shí)施例。它具有對(duì)應(yīng)于以下特性參數(shù)的兩個(gè)配置項(xiàng)視頻格式(具有兩個(gè)選項(xiàng))和分辨率(具有兩個(gè)選項(xiàng))。視頻格式可以是“逐行的”,其中將被估計(jì)的圖像來(lái)自逐行的視頻,或者可以是“其他/非逐行的”,其中將被估計(jì)的圖像來(lái)自隔行的視頻,或者如果視頻是逐行的或隔行的,則它是未知的。分辨率可以是“高分辨率”,例如比等于1280X720像素的更高,或者可以是“其他,,(即,低于1280X720像素,例如SD、CIF、QCIF等等)。在一個(gè)實(shí)施例中,本發(fā)明包括使用用戶配置來(lái)幫助模糊檢測(cè),S卩,設(shè)計(jì)出特定情節(jié)。在這個(gè)實(shí)施例中,用戶配置包括兩個(gè)項(xiàng)視頻分辨率(高分辨率或其它)和視頻格式 (逐行的或其它)。也可以存在其他配置,例如編解碼器類型(MPEG-2、H. 264, JPEG等)、 編碼配置和模糊類型(運(yùn)動(dòng)模糊、焦點(diǎn)沒(méi)對(duì)準(zhǔn)模糊、壓縮模糊、上取樣模糊、低通濾波模糊等)。用戶配置可以經(jīng)由文本接口、語(yǔ)音接口、存儲(chǔ)器接口、開(kāi)關(guān)配置接口來(lái)輸入。在一個(gè)實(shí)施例中,模糊檢測(cè)/計(jì)算方案可被概括如下根據(jù)配置數(shù)據(jù)(逐行的或其它、高分辨率或其它分辨率類型),自動(dòng)選擇合適的方案并且自動(dòng)設(shè)置相關(guān)的參數(shù)。同樣根據(jù)配置數(shù)據(jù),使用不同的縮放規(guī)則來(lái)獲得均勻的模糊值。本發(fā)明的一個(gè)優(yōu)點(diǎn)是,利用附加的配置信息,可以大大地提高具體特定情形中的模糊檢測(cè)的精度,并因此在更多的情形中可以使用該方案。圖2示例性示出了基于用戶配置的模糊檢測(cè)方案的流程圖。它包含三個(gè)步驟1.計(jì)算水平模糊(blur_h)。這將被圖解說(shuō)明如下(參考圖3)。2.根據(jù)用戶配置,從多個(gè)預(yù)定的不同方案中選擇合適的方案。對(duì)于逐行的圖像,計(jì)算垂直模糊,并且隨后將垂直模糊與水平模糊相組合以便獲得最終模糊。這是因?yàn)榇怪焙退侥:?jì)算具有類似的性能,并且他們的組合可以幫助獲得更穩(wěn)定的結(jié)果。垂直模糊的計(jì)算是以與水平模糊的方式相同的方式進(jìn)行的,下面將對(duì)其更詳細(xì)地說(shuō)明。對(duì)于其他(隔行的圖像或不明確的圖像),不計(jì)算垂直模糊。相反,僅僅水平模糊被用作最終模糊。這是因?yàn)樵诟粜械膱D像中頂場(chǎng)和底場(chǎng)可能未被對(duì)準(zhǔn),這將大大地影響垂直模糊計(jì)算。更好的是僅使用水平模糊作為最終模糊。已經(jīng)發(fā)現(xiàn),去隔行過(guò)程仍舊無(wú)法解決這個(gè)問(wèn)題,尤其對(duì)于低質(zhì)量圖像。3.輸出均勻的模糊值根據(jù)用戶配置,存在四種類型的圖像高分辨率/P、非高分辨率/P、高分辨率/i和非高分辨率/i。通過(guò)對(duì)大量四種類型圖像的統(tǒng)計(jì)分析或者從其他源可以獲得下限和上限。 在統(tǒng)計(jì)分析之后,公式(1)給出了縮放規(guī)則,
權(quán)利要求
1.一種計(jì)算視頻圖像的模糊的方法,包括以下步驟 計(jì)算水平模糊值;確定視頻圖像的特性參數(shù),所述特性參數(shù)至少包括逐行的/隔行的和空間分辨率級(jí)別;如果視頻圖像是逐行的,則也計(jì)算垂直模糊值,并且將其與水平模糊值相組合;和根據(jù)預(yù)定的最小值和最大值,規(guī)范化水平模糊值、或組合的水平和垂直模糊值,其中所述最小值和最大值適應(yīng)于所述空間分辨率級(jí)別。
2.根據(jù)權(quán)利要求1的方法,其中計(jì)算水平模糊值是對(duì)垂直MB邊緣的中心(P_hl)周圍的圖像區(qū)域進(jìn)行的。
3.根據(jù)權(quán)利要求1或2的方法,其中計(jì)算垂直模糊值是對(duì)水平MB邊緣的中心(P_vl) 周圍的圖像區(qū)域進(jìn)行的。
4.根據(jù)權(quán)利要求1至3之一的方法,其中計(jì)算模糊值包括計(jì)算當(dāng)前像素周圍的局部變化。
5.根據(jù)回引權(quán)利要求2時(shí)的權(quán)利要求4的方法,其中水平模糊值的局部變化是根據(jù)垂直線上的像素和水平線上的像素來(lái)計(jì)算的,其中使用比來(lái)自垂直線的像素更多的來(lái)自水平線的像素,并且其中水平MB邊緣的所述中心是所述兩條線的一端。
6.根據(jù)權(quán)利要求4或5的方法,其中如果局部變化在最大閾值以上或者在最小閾值之下,則所述當(dāng)前像素被排除在模糊計(jì)算之外。
7.根據(jù)權(quán)利要求1至6中任一項(xiàng)的方法,其中視頻圖像的特性參數(shù)中的一個(gè)或多個(gè)是通過(guò)用戶接口或者在通過(guò)用戶接口輸入之后從存儲(chǔ)器中獲得的。
8.根據(jù)權(quán)利要求1至7中任一項(xiàng)的方法,其中視頻圖像的特性參數(shù)中的一個(gè)或多個(gè)是通過(guò)機(jī)器接口從視頻解碼器中獲得的。
9.根據(jù)權(quán)利要求1至8中任一項(xiàng)的方法,其中視頻圖像的特性參數(shù)中的一個(gè)或多個(gè)是通過(guò)與視頻圖像相關(guān)聯(lián)的元數(shù)據(jù)獲得的。
10.一種用于計(jì)算視頻圖像的模糊的裝置,其使用根據(jù)權(quán)利要求1至9中任一項(xiàng)的方法。
全文摘要
模糊是與圖像質(zhì)量相關(guān)的最重要的特征之一。精確地估計(jì)圖像的模糊級(jí)別對(duì)精確地估計(jì)它的質(zhì)量有很大幫助。一種計(jì)算視頻圖像的模糊的方法包括計(jì)算水平模糊值;并確定視頻圖像的特性參數(shù),所述特性參數(shù)至少包括逐行的/隔行的和空間分辨率級(jí)別。如果視頻圖像是逐行的,則也計(jì)算垂直模糊值,并且將垂直模糊值與水平模糊值相組合。下一步驟是根據(jù)預(yù)定的最小值和最大值,規(guī)范化水平模糊值、或組合的水平和垂直模糊值,其中所述最小值和最大值適應(yīng)于所述空間分辨率級(jí)別。
文檔編號(hào)H04N17/00GK102598687SQ200980161877
公開(kāi)日2012年7月18日 申請(qǐng)日期2009年10月10日 優(yōu)先權(quán)日2009年10月10日
發(fā)明者劉德兵, 徐楓, 陳志波, 顧曉東 申請(qǐng)人:湯姆森特許公司