基于自適應(yīng)閾值調(diào)整拒識子空間學(xué)習(xí)的人臉檢測方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明設(shè)及計算機視覺、模式識別和機器學(xué)習(xí)等技術(shù)領(lǐng)域,特別是設(shè)及了一種基 于自適應(yīng)闊值調(diào)整拒識子空間學(xué)習(xí)的人臉檢測方法。
[000^ 背景
[0003] 人臉檢測的目的是在圖像或視頻中自動判定人臉是否出現(xiàn)W及人臉出現(xiàn)的位置、 大小W及姿態(tài)等。人臉檢測是計算機視覺和人臉研究中一個非常重要的研究內(nèi)容,其在智 能圖像處理、模式識別、機器學(xué)習(xí)、智能視頻監(jiān)控等眾多研究和應(yīng)用領(lǐng)域都有著重要的研究 意義和廣泛的應(yīng)用價值,人臉檢測技術(shù)也受到了眾多研究人員和公司部分的廣泛關(guān)注和發(fā) 展。雖然人臉檢測得到了很多的關(guān)注和研究,魯邦性的人臉檢測一直是一個非常艱巨和富 于挑戰(zhàn)性的課題,運主要體現(xiàn)在W下幾個方面:現(xiàn)實中的人臉往往存在許多差異,如姿態(tài)的 變化(正面臉和側(cè)面臉等)、表情的變化(如嚴(yán)肅和大笑等)W及容貌上的差異(如亞洲人種 和歐洲人種的差異)等等;由于拍照條件和環(huán)境的變化引入的影響,如不同的光照條件(強 光照和弱光照)和人臉的遮擋(眼睛、口罩)等;實時性人臉檢測,由于無法準(zhǔn)確的確定人臉 的位置和大小,人臉檢測算法通常采取滑動窗口的方法進行判斷,該方法需要掃描海量的 候選窗口,對實時性的人臉檢測帶來了很大的負(fù)擔(dān)。
[0004] 目前關(guān)于人臉檢測問題人們提出過很多解決方案,運其中基于學(xué)習(xí)的方法在人臉 檢測領(lǐng)域取得了很好的效果,特別是基于統(tǒng)計特征的方法。該類方法旨在從大量訓(xùn)練數(shù)據(jù) 中挖掘出類別本身的統(tǒng)計特性,并利用學(xué)習(xí)得到的統(tǒng)計特性對新樣本進行分類,其中最具 代表性的人臉檢測模型是Viola Jones于2001年提出的級聯(lián)Boosting分類器人臉檢測模 型,該人臉檢測模型主要有W下Ξ個特點:利用積分圖像和Haar特征進行快速的特征計算; 利用Boosting算法進行特征選擇和弱分類器學(xué)習(xí);利用級聯(lián)檢測器框架有效的拒絕大量非 人臉窗口。該框架在提高檢測精度的同時達到了實時性的檢測要求,也得到研究人員和公 司的廣泛發(fā)展和應(yīng)用。雖然級聯(lián)Boosting分類器具有優(yōu)異的性能和快速的檢測速度,該類 方法中每一層強分類器僅是一個二值分類器(人臉窗輸出為1、非人臉窗輸出為0),并將所 有的人臉窗口和錯分的非人臉窗口都放到下一層去繼續(xù)訓(xùn)練,運種策略限制了人臉檢測模 型的靈活性,人臉檢測模型訓(xùn)練起來也非常復(fù)雜和耗時,最終得到的人臉檢測模型往往層 數(shù)很多。如何縮減人臉檢測模型的復(fù)雜度,提高人臉檢測模型的靈活性仍是一個亟待解決 的問題。
【發(fā)明內(nèi)容】
[0005] 為了解決復(fù)雜度和靈活性的問題,本發(fā)明提出一種基于自適應(yīng)闊值調(diào)整拒識子空 間學(xué)習(xí)的人臉檢測方法,有效地縮減了人臉檢測模型的復(fù)雜度,提高了人臉檢測模型的靈 活性。
[0006] 本發(fā)明提出的基于自適應(yīng)闊值調(diào)整拒識子空間學(xué)習(xí)的人臉檢測方法,包括如下步 驟:
[0007] 步驟S1,采集人臉和非人臉圖像,并將所有圖像進行灰度處理,將圖像尺寸縮放至 統(tǒng)一像素大小A,構(gòu)成訓(xùn)練樣本集合;其中人臉圖像為正樣本、非人臉圖像為負(fù)樣本;
[000引步驟S2,利用步驟S1中的訓(xùn)練樣本集合,采用Boosting算法和互信息最大化準(zhǔn)則 訓(xùn)練人臉檢測模型中第k層的強分類器;
[0009] 步驟S3,計算修正的互信息,利用修正的互信息最大化學(xué)習(xí)準(zhǔn)則自適應(yīng)的調(diào)整人 臉檢測模型中第k層強分類器的最優(yōu)拒識闊值,得到帶拒識的強分類器;
[0010] 步驟S4,利用步驟S3中已訓(xùn)練完成的前k層強分類器,在訓(xùn)練集上篩選出拒識的樣 本作為第k+1層分類器的訓(xùn)練樣本;
[0011] 步驟S5,重復(fù)步驟S2至S4直至滿足收斂性條件;
[0012] 步驟S6,給定待檢測的圖像,構(gòu)建圖像金字塔將待檢測圖像大小縮放至A,并在圖 像金字塔的每一層滑動窗口采樣,利用訓(xùn)練得到的每一層帶拒識的強分類器對每一個采樣 窗口進行判定,并將判定為人臉的采樣窗口還原到待檢測的圖像上,通過對待檢測的圖像 上所有人臉窗口進行聚類得到最終的人臉檢測結(jié)果。
[0013] 優(yōu)選的,步驟S1中正樣本為不同光照、不同姿態(tài)情況下的人臉圖像;負(fù)樣本采集方 式為先采集一個負(fù)樣本子集進行訓(xùn)練,對采用通過步驟S2至S5訓(xùn)練好的人臉檢測模型進行 測試,將人臉檢測模型誤檢的負(fù)樣本對象進行增量采集加入負(fù)樣本集中,通過N次反復(fù)訓(xùn)練 和測試得到最終的負(fù)樣本集合。
[0014] 優(yōu)選的,步驟S2中,人臉檢測模型中每層的強分類器均由弱分類器W構(gòu)成,利用 Boosting算法和互信息最大化準(zhǔn)則訓(xùn)練人臉檢測模型中第k層的強分類器步驟如下:
[0015] 步驟S21,選取化ar特征,利用總體互信息最大化準(zhǔn)則進行弱分類器W的學(xué)習(xí),選取 互信息最大的闊值為當(dāng)前弱分類器的闊值;
[0016] 步驟S22,利用S21所述方法計算得到每一個化ar特征對應(yīng)的弱分類器及其對應(yīng)的 互信息值,選取互信息值最大的弱分類器為當(dāng)前迭代輪的弱分類器wt;
[0017] 步驟S23,根據(jù)樣本在弱分類器wt下的輸出值設(shè)定樣本權(quán)重,樣本權(quán)重計算公式為
[001 引
[0019] 其中,似嗦示t-1輪迭代后樣本i的權(quán)重,L康示樣本i的真實類別,ht(xi)為樣本i 的預(yù)測類別,Zt為歸一化因子;
[0022] 步驟S24,重復(fù)步驟S21-S23直至滿足收斂性條件。
[0023] 優(yōu)選的,步驟S3中,計算修正的互信息,利用修正的互信息最大化學(xué)習(xí)準(zhǔn)則自適應(yīng) 的調(diào)整人臉檢測模型中第k層強分類器的最優(yōu)拒識闊值的步驟如下:
[0024] 步驟S31,計算每個樣本在第k層強分類器下的輸出值Fi,并設(shè)定強分類器的正、負(fù) 樣本的初始拒識闊值化1、化2 ;
[0025]
[0026] 其中Τ為當(dāng)前強分類器包含的弱分類器總數(shù);
[0027] 步驟S32,利用非參數(shù)估算方法估計正、負(fù)樣本輸出值的條件概率密度;
[002引步驟S33,計算修正的互信息,求解修正的互信息關(guān)于參數(shù)化1,化2的一階導(dǎo)數(shù),利 用擬牛頓法迭代求解互信息最大化問題,得到最優(yōu)的拒識闊值。
[0029]優(yōu)選的,步驟S32中采用的非參數(shù)估計方法為化rzen窗法,利用該方法估算正、負(fù) 樣本的條件概率密度= Z μ = +1)和口w(z) = = Z11 = -1),其估算公式如下
[0032] 其中為正樣本的條件概率密度,斯(Z)為負(fù)樣本的條件概率密度,G( ·,σ2) 表示高斯核函數(shù),σ表示窗寬。
[0033] 優(yōu)選的,所述的窗寬σ采用大拇指準(zhǔn)則進行估算。
[0034] 優(yōu)選的,步驟S4中,篩選第k+1層的訓(xùn)練樣本時,將初始正、負(fù)樣本集分別輸入已訓(xùn) 練好的前k層人臉檢測模型,將前k層人臉檢測模型均不能進行確定的分類的樣本作為第k+ 1層分類器的訓(xùn)練樣本。
[0035] 優(yōu)選的,步驟S3中,計算修正的互信息的公式為
[0036]
[0037] 其中,為給定的一組拒識闊值,N為正、負(fù)樣本總數(shù),TP(t2)表示真實類別和 預(yù)測類別均為正樣本的樣本數(shù),F(xiàn)N(ti)表示真實類別為正樣本,預(yù)測類別為負(fù)樣本的樣本 數(shù);FP(t2)表示真實類別為負(fù)樣本,預(yù)測類別為正樣本的樣本數(shù);TN(ti)表示真實類別和預(yù) 測類別均為負(fù)樣本的樣本數(shù);P(+l)與P(-l)分別是正樣本和負(fù)樣本的先驗概率。
[0038] 優(yōu)選的,所述的弱分類器W為區(qū)域分割分類器。
[0039] 優(yōu)選的,步驟5中的收斂條件為總體分類器層數(shù)或已收集不到足夠的正、負(fù)樣本用 于訓(xùn)練。
[0040] 優(yōu)選的,步驟S5的具體步驟為:給定待檢測的圖像,首先利用下采樣構(gòu)建圖像金字 塔,直至將圖像縮放至A大小,并計