專利名稱:基于多尺度對(duì)比特征的對(duì)象檢測(cè)設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像的特征提取以及對(duì)象檢測(cè)技術(shù), 具體說來,涉及一種用于基于多 尺度對(duì)比特征在圖像中檢測(cè)對(duì)象的設(shè)備和方法,其中,所述多尺度對(duì)比特征用于指示圖像 中多個(gè)相關(guān)區(qū)域之間在不同尺度下關(guān)于特定圖像屬性的對(duì)比關(guān)系。
背景技術(shù):
對(duì)于特定類別的對(duì)象(諸如頭部、面部、拳頭、上身、肩部、汽車、自行車、包裹或者 其它物體)的檢測(cè)作為計(jì)算機(jī)視覺技術(shù)的基礎(chǔ),廣泛地應(yīng)用于很多領(lǐng)域,例如,人機(jī)交互、 動(dòng)作識(shí)別、智能監(jiān)視、多媒體檢索等。由于該項(xiàng)技術(shù)的學(xué)術(shù)價(jià)值及其廣闊的商業(yè)應(yīng)用前景, 人們對(duì)于它的關(guān)注度越來越高,大量的研究特別針對(duì)用于場(chǎng)景分析的實(shí)時(shí)對(duì)象檢測(cè)或?qū)ο?定位技術(shù)。目前,關(guān)于對(duì)象檢測(cè)技術(shù),采用的基本方式為針對(duì)用于檢測(cè)某種對(duì)象的特定特征 進(jìn)行大量樣本訓(xùn)練,在此基礎(chǔ)上得出有效的分類器,將分類器應(yīng)用于輸入的被檢測(cè)圖像以 檢測(cè)出對(duì)象。在上述方式中,人們采用了不同的特征提取方式,其中,Haar-Iike特征檢測(cè)方式 是實(shí)現(xiàn)快速對(duì)象檢測(cè)技術(shù)中的重要技術(shù),所述Haar-Iike特征對(duì)兩個(gè)鄰近矩形區(qū)域之間的 平均強(qiáng)度的絕對(duì)差進(jìn)行編碼,并且可通過積分圖像快速計(jì)算出Haar-Iike特征。通過引入 Boosting算法選擇少量的區(qū)分性強(qiáng)的特征來構(gòu)建有效的分類器。然而,Haar-Iike特征檢 測(cè)方式的問題在于所述特征本身比較簡(jiǎn)單,因此,為了實(shí)現(xiàn)較高的性能必須在檢測(cè)時(shí)使用 大量的特征來參與計(jì)算,這造成了運(yùn)算量的增加。此外,由于Haar-Iike特征表示的是相鄰 區(qū)域之間的絕對(duì)差值,所以這種特征無法抵抗環(huán)境亮度和圖像噪聲的影響,在應(yīng)用于環(huán)境 較為復(fù)雜的圖像時(shí)無法獲得有效的檢測(cè)結(jié)果。雖然人們?cè)噲D通過改進(jìn)Haar-Iike特征或提 出另外的特征來獲得更好的性能,但是尚未獲得能夠在檢測(cè)速度、計(jì)算量以及檢測(cè)有效性 方面均令人滿意的對(duì)象檢測(cè)方式。因此,需要提供一種能夠有效地進(jìn)行對(duì)象檢測(cè)的技術(shù)方案,從而在降低運(yùn)算量的 前提下,對(duì)檢測(cè)對(duì)象進(jìn)行更為有效的特征提取,便于構(gòu)建區(qū)分性能優(yōu)良的分類器,達(dá)到實(shí)時(shí) 對(duì)象檢測(cè)中需要的各項(xiàng)要求。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于圖像特征提取的對(duì)象檢測(cè)設(shè)備和方法,根據(jù)所述 對(duì)象檢測(cè)設(shè)備和方法,能夠基于多尺度對(duì)比特征對(duì)圖像中的對(duì)象進(jìn)行有效和快速的檢測(cè), 其中,所述多尺度對(duì)比特征用于指示圖像中多個(gè)相關(guān)矩形區(qū)域之間在不同尺度下關(guān)于特定 圖像屬性的對(duì)比關(guān)系。根據(jù)本發(fā)明的一方面,提供一種基于多尺度對(duì)比特征的對(duì)象檢測(cè)設(shè)備,包括輸入 單元,用于輸入被檢測(cè)圖像;基于多尺度對(duì)比特征的學(xué)習(xí)機(jī),用于對(duì)關(guān)于所述對(duì)象的訓(xùn)練樣 本進(jìn)行多尺度對(duì)比特征提取,并對(duì)提取的特征應(yīng)用統(tǒng)計(jì)學(xué)習(xí)處理;分類器加載單元,用于根據(jù)所述基于多尺度對(duì)比特征 的學(xué)習(xí)機(jī)的統(tǒng)計(jì)學(xué)習(xí)處理結(jié)果來構(gòu)建分類器;檢測(cè)單元,用 于利用由分類器加載單元構(gòu)建的分類器對(duì)由輸入單元輸入的被檢測(cè)圖像進(jìn)行對(duì)象檢測(cè),其 中,所述多尺度對(duì)比特征用于指示圖像中多個(gè)相關(guān)矩形區(qū)域之間在不同尺度下關(guān)于特定圖 像屬性的對(duì)比關(guān)系。所述基于多尺度對(duì)比特征的學(xué)習(xí)機(jī)可以對(duì)訓(xùn)練樣本進(jìn)行預(yù)處理。所述預(yù)處理可包括訓(xùn)練樣本圖像尺寸大小歸一化、亮度標(biāo)準(zhǔn)化、伽馬校正、梯度 提取、圖像邊緣提取中的至少一種。所述基于多尺度對(duì)比特征的學(xué)習(xí)機(jī)進(jìn)行多尺度對(duì)比特征提取的處理可包括確定 多尺度對(duì)比特征中包括的多個(gè)相關(guān)矩形區(qū)域;確定每個(gè)相關(guān)矩形區(qū)域的長度和寬度;確定 關(guān)于所述多個(gè)相關(guān)矩形區(qū)域的圖像屬性參考值;在圖像的特征提取位置,分別計(jì)算所述多 個(gè)相關(guān)矩形區(qū)域中的各個(gè)圖像屬性值與圖像屬性參考值之間的對(duì)比關(guān)系,作為提取的多尺 度對(duì)比特征。所述基于多尺度對(duì)比特征的學(xué)習(xí)機(jī)可按照下列等式來計(jì)算多尺度對(duì)比特征 Λ
權(quán)利要求
1.一種基于多尺度對(duì)比特征的對(duì)象檢測(cè)設(shè)備,包括輸入單元,用于輸入被檢測(cè)圖像;基于多尺度對(duì)比特征的學(xué)習(xí)機(jī),用于對(duì)關(guān)于所述對(duì)象的訓(xùn)練樣本進(jìn)行多尺度對(duì)比特征 提取,并對(duì)提取的特征應(yīng)用統(tǒng)計(jì)學(xué)習(xí)處理;分類器加載單元,用于根據(jù)所述基于多尺度對(duì)比特征的學(xué)習(xí)機(jī)的統(tǒng)計(jì)學(xué)習(xí)處理結(jié)果來 構(gòu)建分類器;檢測(cè)單元,用于利用由分類器加載單元構(gòu)建的分類器對(duì)由輸入單元輸入的被檢測(cè)圖像 進(jìn)行對(duì)象檢測(cè),其中,所述多尺度對(duì)比特征用于指示圖像中多個(gè)相關(guān)矩形區(qū)域之間在不同尺度下關(guān)于 特定圖像屬性的對(duì)比關(guān)系。
2.如權(quán)利要求1所述的設(shè)備,其中,所述基于多尺度對(duì)比特征的學(xué)習(xí)機(jī)對(duì)訓(xùn)練樣本進(jìn) 行預(yù)處理。
3.如權(quán)利要求2所述的設(shè)備,其中,所述預(yù)處理包括訓(xùn)練樣本圖像尺寸大小歸一化、 亮度標(biāo)準(zhǔn)化、伽馬校正、梯度提取、圖像邊緣提取中的至少一種。
4.如權(quán)利要求1所述的設(shè)備,其中,所述基于多尺度對(duì)比特征的學(xué)習(xí)機(jī)進(jìn)行多尺度對(duì) 比特征提取的處理包括確定多尺度對(duì)比特征中包括的多個(gè)相關(guān)矩形區(qū)域;確定每個(gè)相關(guān) 矩形區(qū)域的長度和寬度;確定關(guān)于所述多個(gè)相關(guān)矩形區(qū)域的圖像屬性參考值;在圖像的特 征提取位置,分別計(jì)算所述多個(gè)相關(guān)矩形區(qū)域中的各個(gè)圖像屬性值與圖像屬性參考值之間 的對(duì)比關(guān)系,作為提取的多尺度對(duì)比特征。
5.如權(quán)利要求4所述的設(shè)備,其中,所述基于多尺度對(duì)比特征的學(xué)習(xí)機(jī)按照下列等式來計(jì)算多尺度對(duì)比特征-.
6.如權(quán)利要求5所述的設(shè)備,其中,圖像屬性參考值為所述多個(gè)相關(guān)矩形區(qū)域中的圖 像屬性值的平均值,或位于所述多個(gè)相關(guān)矩形區(qū)域構(gòu)成的整體形狀的中心區(qū)域部分的圖像屬性值。
7.如權(quán)利要求1所述的設(shè)備,其中,所述圖像屬性指示圖像的深度、色度或亮度。
8.如權(quán)利要求1所述的設(shè)備,其中,分類器加載單元根據(jù)基于多尺度對(duì)比特征的學(xué)習(xí) 機(jī)的統(tǒng)計(jì)學(xué)習(xí)處理結(jié)果,通過最小平方誤差方法來構(gòu)建作為多值函數(shù)的分類器。
9.如權(quán)利要求8所述的設(shè)備,其中,分類器加載單元還通過增強(qiáng)學(xué)習(xí)方法將多個(gè)分類 器聯(lián)合為強(qiáng)分類器。
10.如權(quán)利要求1所述的設(shè)備,其中,檢測(cè)單元在利用分類器進(jìn)行檢測(cè)之前,首先提取 出被檢測(cè)圖像的前景圖像或者邊緣圖像,然后將分類器應(yīng)用于提取出的前景圖像或邊緣圖 像來檢測(cè)對(duì)象。
11.如權(quán)利要求1所述的設(shè)備,其中,在存在多個(gè)分類器的情況下,檢測(cè)單元將多個(gè)分 類器檢測(cè)出的多個(gè)待選對(duì)象根據(jù)它們的位置以及之間的重疊情況來聯(lián)合得出最終檢測(cè)的 對(duì)象位置。
12.如權(quán)利要求1所述的設(shè)備,其中,輸入單元輸入的圖像是經(jīng)過其它分類器處理后的圖像。
13.如權(quán)利要求12所述的設(shè)備,其中,所述其它分類器為基于Haar小波特征的分類器 或基于方向直方圖特征的分類器。
14.一種基于多尺度對(duì)比特征的對(duì)象檢測(cè)方法,包括步驟關(guān)于對(duì)象的訓(xùn)練樣本進(jìn)行多尺度對(duì)比特征提取,并對(duì)提取的特征應(yīng)用統(tǒng)計(jì)學(xué)習(xí)處理, 其中,所述多尺度對(duì)比特征用于指示圖像中多個(gè)相關(guān)矩形區(qū)域之間在不同尺度下關(guān)于特定 圖像屬性的對(duì)比關(guān)系;根據(jù)統(tǒng)計(jì)學(xué)習(xí)處理結(jié)果來構(gòu)建分類器;以及利用構(gòu)建的分類器對(duì)輸入的被檢測(cè)圖像進(jìn)行不同尺度的掃描,從而檢測(cè)相應(yīng)的對(duì)象。
15.如權(quán)利要求14所述的方法,其中,在對(duì)訓(xùn)練樣本進(jìn)行多尺度對(duì)比特征提取之前,對(duì) 所述訓(xùn)練樣本進(jìn)行預(yù)處理。
16.如權(quán)利要求15所述的方法,其中,所述預(yù)處理包括訓(xùn)練樣本圖像尺寸大小歸一 化、亮度標(biāo)準(zhǔn)化、伽馬校正、梯度提取、圖像邊緣提取中的至少一種。
17.如權(quán)利要求14所述的方法,其中,所述進(jìn)行多尺度對(duì)比特征特區(qū)的步驟包括確定 多尺度對(duì)比特征中包括的多個(gè)相關(guān)矩形區(qū)域;確定每個(gè)相關(guān)矩形區(qū)域的長度和寬度;確定 關(guān)于所述多個(gè)相關(guān)矩形區(qū)域的圖像屬性參考值;在圖像的特征提取位置,分別計(jì)算所述多 個(gè)相關(guān)矩形區(qū)域中的各個(gè)圖像屬性值與圖像屬性參考值之間的對(duì)比關(guān)系,作為提取的多尺 度對(duì)比特征。
18.如權(quán)利要求17所述的方法,其中,按照下列等式來計(jì)算多尺度對(duì)比特征
19.如權(quán)利要求18所述的方法,其中,圖像屬性參考值為所述多個(gè)相關(guān)矩形區(qū)域中的 圖像屬性值的平均值,或位于所述多個(gè)相關(guān)矩形區(qū)域構(gòu)成的整體形狀的中心區(qū)域部分的圖 像屬性值。
20.如權(quán)利要求14所述的方法,其中,所述圖像屬性指示圖像的深度、色度或亮度。
21.如權(quán)利要求14所述的方法,其中,根據(jù)統(tǒng)計(jì)學(xué)習(xí)處理結(jié)果,通過最小平方誤差方法 來構(gòu)建作為多值函數(shù)的分類器。
22.如權(quán)利要求21所述的方法,其中,通過增強(qiáng)學(xué)習(xí)方法將多個(gè)分類器聯(lián)合為強(qiáng)分類器。
23.如權(quán)利要求14所述的方法,其中,在利用分類器進(jìn)行檢測(cè)之前,首先提取出被檢測(cè) 圖像的前景圖像或者邊緣圖像,然后將分類器應(yīng)用于提取出的前景圖像或邊緣圖像來檢測(cè) 對(duì)象。
24.如權(quán)利要求14所述的方法,其中,在存在多個(gè)分類器的情況下,將多個(gè)分類器檢測(cè) 出的多個(gè)待選對(duì)象根據(jù)它們的位置以及之間的重疊情況來聯(lián)合得出最終檢測(cè)的對(duì)象位置。
25.如權(quán)利要求14所述的方法,其中,輸入的被檢測(cè)圖像是經(jīng)過其它分類器處理后的 圖像。
26.如權(quán)利要求25所述的方法,其中,所述其它分類器為基于Haar小波特征的分類器 或基于方向直方圖特征的分類器。
27.一種用于提取圖像的多尺度對(duì)比特征的方法,包括步驟 確定多尺度對(duì)比特征中包括的多個(gè)相關(guān)矩形區(qū)域;確定每個(gè)相關(guān)矩形區(qū)域的長度和寬度; 確定關(guān)于所述多個(gè)相關(guān)矩形區(qū)域的圖像屬性參考值;在圖像的特征提取位置,分別計(jì)算所述多個(gè)相關(guān)矩形區(qū)域中的各個(gè)圖像屬性值與圖像 屬性參考值之間的對(duì)比關(guān)系,作為提取的多尺度對(duì)比特征。
28.如權(quán)利要求27所述的方法,其中,按照下列等式來計(jì)算多尺度對(duì)比特征Nfl χ > 0MSOP ^YjSigi-gf)2' ,Φ)=‘“,其中,MSOP表示多尺度對(duì)比特征,N表示相關(guān)矩形區(qū) i=i[U5X < U域的數(shù)量,N為自然數(shù),gi表示第i個(gè)矩形區(qū)域中的圖像屬性值,gf表示圖像屬性參考值。
29.如權(quán)利要求27所述的方法,其中,圖像屬性參考值為所述多個(gè)相關(guān)矩形區(qū)域中的 圖像屬性值的平均值,或位于所述多個(gè)相關(guān)矩形區(qū)域構(gòu)成的整體形狀的中心區(qū)域部分的圖 像屬性值。
30.如權(quán)利要求27所述的方法,其中,所述圖像屬性指示圖像的深度、色度或亮度。
31.如權(quán)利要求27所述的方法,其中,所述多個(gè)相關(guān)矩形區(qū)域構(gòu)成的整體形狀為矩形、 菱形或橢圓形。
全文摘要
提供一種基于多尺度對(duì)比特征的對(duì)象檢測(cè)設(shè)備和方法。所述對(duì)象檢測(cè)設(shè)備包括輸入單元,用于輸入被檢測(cè)圖像;基于多尺度對(duì)比特征的學(xué)習(xí)機(jī),用于對(duì)關(guān)于所述對(duì)象的訓(xùn)練樣本進(jìn)行多尺度對(duì)比特征提取,并對(duì)提取的特征應(yīng)用統(tǒng)計(jì)學(xué)習(xí)處理;分類器加載單元,用于根據(jù)所述基于多尺度對(duì)比特征的學(xué)習(xí)機(jī)的統(tǒng)計(jì)學(xué)習(xí)處理結(jié)果來構(gòu)建分類器;檢測(cè)單元,用于利用由分類器加載單元構(gòu)建的分類器對(duì)由輸入單元輸入的被檢測(cè)圖像進(jìn)行對(duì)象檢測(cè),其中,所述多尺度對(duì)比特征用于指示圖像中多個(gè)相關(guān)矩形區(qū)域之間在不同尺度下關(guān)于特定圖像屬性的對(duì)比關(guān)系。
文檔編號(hào)G06K9/66GK102129569SQ20101000477
公開日2011年7月20日 申請(qǐng)日期2010年1月20日 優(yōu)先權(quán)日2010年1月20日
發(fā)明者林華書, 楚汝峰, 陳茂林 申請(qǐng)人:三星電子株式會(huì)社, 北京三星通信技術(shù)研究有限公司