基于增強型非參數(shù)最大邊緣準則的人臉識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,特別涉及是一種人臉識別方法,可用于公共安全、 視頻監(jiān)控和訪問控制。 技術(shù)背景
[0002] 人臉識別是基于人的面部特征信息進行身份識別的一種生物識別技術(shù),是模式識 別與計算機視覺等領(lǐng)域的熱點話題。人臉識別技術(shù)的目的是賦予計算機利用識別算法分析 待識別人臉圖像來辨認其身份的能力,這要求識別算法能夠有效地提取不同個體的本質(zhì)性 鑒別特征,因此,設(shè)計有效的識別方法是人臉識別技術(shù)的關(guān)鍵。目前廣泛使用的人臉識別方 法有主成分分析PCA方法和線性判別分析LDA方法。
[0003]PCA方法是以數(shù)據(jù)的最小均方誤差重構(gòu)為目的,把原始數(shù)據(jù)投影到最優(yōu)特征空間 進行分類,然而它得到的最優(yōu)投影空間并不適合識別分類。
[0004]LDA方法是以提取數(shù)據(jù)的鑒別特征為目的,利用散度矩陣描述數(shù)據(jù)的分布,通過最 大化類間散度與類內(nèi)散度的比值得到最優(yōu)的投影子空間,原始高維數(shù)據(jù)投影到最優(yōu)子空間 后,同類樣本相互靠近,不同類樣本相互分離,能有效地區(qū)分不同類別的樣本數(shù)據(jù)。然而LDA 是一種參數(shù)化的鑒別分析方法,因為它假設(shè)各類數(shù)據(jù)服從高斯分布,這一假設(shè)條件無疑限 制了LDA的應(yīng)用,使得基于LDA的人臉識別算法在處理復(fù)雜的人臉識別分類問題時顯得無 能為力。為解決此問題,K.Fukunaga對LDA進行了拓展,提出了非參數(shù)判別分析NDA。NDA 與LDA主要區(qū)別在于類間散度矩陣:LDA采用參數(shù)形式的散度矩陣,只有各類的均值參與類 間散度矩陣的計算,因此人臉識別性能依賴于估計的樣本均值的準確度;而NDA中所有的 訓(xùn)練樣本都參與類間散度矩陣的計算,針對LDA的高斯分布條件限制問題做了有效改進。 且NDA中處于邊界的樣本根據(jù)他們對分類的貢獻賦予不同的權(quán)重,樣本的原始邊界結(jié)構(gòu)信 息則通過邊界樣本信息充分融入到特征提取中。但是NDA主要針對的是二分類問題,不能 適用于像人臉識別等多分類問題。為此,LiZhiFeng和LinDaHua等人對NDA的類間散 度矩陣進行了多分類擴展,提出了多類非參數(shù)鑒別分析MNDA,并成功應(yīng)用于多類人臉識別 問題,但是MNDA的類內(nèi)散度矩陣仍然采用參數(shù)化形式。為此QiuXiPeng等人又提出了基 于非參數(shù)最大邊緣準則的人臉識別算法NMMC,該算法真正擺脫了散度矩陣的參數(shù)化形式。 NMMC通過最大化樣本與其異類最近樣本之間的距離,同時最小化樣本點與其同類最遠樣本 點之間的距離,使同類樣本的分布更加緊致,不同類別的樣本相互分離。但是,在實際應(yīng)用 過程中NMMC的泛化能力比較差,具體表現(xiàn)為:處理簡單的識別分類問題如測試圖像與訓(xùn)練 樣本圖像差別較小,NMMC表現(xiàn)出較好的識別分類性能;而處理復(fù)雜的識別分類問題如測試 圖像與訓(xùn)練樣本圖像相差較大,NMMC的識別分類性能急劇下降。因為人臉圖像數(shù)據(jù)容易受 到光照、表情、姿態(tài)、遮擋等因素的影響使得測試圖像與訓(xùn)練樣本圖像差別較大。
[0005] 發(fā)明的內(nèi)容
[0006] 本發(fā)明的目的在于提出基于增強型非參數(shù)最大邊緣準則的人臉識別方法,以解決 現(xiàn)有技術(shù)在處理復(fù)雜識別任務(wù)時泛化能力差的問題。
[0007] 本發(fā)明的技術(shù)方案是:結(jié)合增強學(xué)習(xí)Boosting思想,采用不同的訓(xùn)練樣本相繼訓(xùn) 練一組基于非參數(shù)最大邊緣準則NMMC的最優(yōu)投影子空間,每一個子空間針對不同的分類 任務(wù);采用k近鄰分類器作為子空間的子分類器,對投影到子空間中的樣本進行分類,并根 據(jù)分類結(jié)果計算子分類器的置信度;利用子分類器的置信度將各個子分類器集成為總分類 器用于解決復(fù)雜的識別任務(wù)。
[0008] 根據(jù)上述思路,本發(fā)明的技術(shù)方案包括如下步驟:
[0009] (1)人臉圖像預(yù)處理:
[0010] (la)從標準人臉庫中獲得c類樣本的G幅人臉圖像,并將其劃分為N幅訓(xùn)練樣本 圖像和M幅測試樣本圖像,構(gòu)成訓(xùn)練樣本集I=丨U,,J")丨^和測試樣本集z=
[0011] 其中c彡3,G彡2,N彡1,M彡1,Xlj表示第i類的第j個訓(xùn)練樣本,y表示x 的類別標簽,Zl]表示第i類的第j個測試樣本,v表示zu的類別標簽;
[0012] (2)分別初始化訓(xùn)練樣本集X中訓(xùn)練樣本誤分率= 和不同類 別之間的誤分率處叫其中yGY,p,qGY,p乒q,Y= {1,…,c}是類別標簽的 集合,初始化子分類器Ct的個數(shù)t= 1 ;
[0013] (3)根據(jù)訓(xùn)練樣本集X中樣本的誤分率y(Xlj,y)將訓(xùn)練樣本集X劃分為第一子 樣本集\和第二子樣本集Xp;
[0014] (4)利用第一子樣本集Xg學(xué)習(xí)第t個最優(yōu)投影子空間Wt,并將訓(xùn)練樣本集X中的 樣本投影到該空間wt,得到訓(xùn)練樣本特征;
[0015] (5)根據(jù)訓(xùn)練樣本特征,利用k近鄰分類器對訓(xùn)練樣本集X中的樣本分類,并根據(jù) 分類結(jié)果計算子分類器(;的置信度0t;
[0016] (6)根據(jù)步驟(5)得到的置信度et,利用下式更新樣本誤分率Y(Xl],y)和類間 誤分率A(p,q):
[0019] 其中,bvM表示屬于第y^類的后驗概率,表示屬于第y類的后 驗概率,Np表示第p類的個數(shù),Nq表示第q類的個數(shù);
[0020] (7)根據(jù)步驟(6)更新的誤分率Y(Xl],y)將訓(xùn)練樣本集合X中的樣本從大到小進 行排序,用前義個y(Xl],y)值對應(yīng)的訓(xùn)練樣本集X中的樣本更新第一子樣本集Xg,其中, 義為第一子樣本集Xg中訓(xùn)練樣本的個數(shù);
[0021] (8)將子分類器的個數(shù)t加1,取T1為總的子分類器數(shù),T1 = 60,判斷是否繼續(xù)學(xué) 習(xí)子空間:如果t辛T1,則返回步驟(4)繼續(xù)進行迭代;否則,子空間學(xué)習(xí)過程結(jié)束,得到T1 個最優(yōu)投影子空間Wt以及對應(yīng)的子分類器Ct,t= 1,…,T1 ;
[0022] (9)對于人臉測試樣本集Z中的任意一個人臉測試樣本Zl],分別利用學(xué)習(xí)得到的 T1個最優(yōu)投影子空間Wt以及對應(yīng)的子分類器Ct對其進行分類識別,得到T1個后驗概率 4(+,) > ,然后對T1個后驗概率進行求和,得到測試樣本Zij的識別結(jié)果, 依次對M幅人臉測試樣進行識別,得到M幅人臉測試樣本最終的識別結(jié)果。
[0023] 本發(fā)明與現(xiàn)有技術(shù)相比具有如下優(yōu)點:
[0024] 1.本發(fā)明根據(jù)訓(xùn)練樣本的誤分率y(Xl],y)構(gòu)造第一子樣本集Xg,而不考慮訓(xùn)練 樣本的類別信息,能將較復(fù)雜的任務(wù)分解為較簡單的任務(wù),從而提高了處理復(fù)雜識別分類 任務(wù)時的識別率。
[0025] 2.本發(fā)明將k近鄰分類器作為最優(yōu)投影子空間^的分類器,給出測試樣本屬于不 同類別的后驗概率,而不是測試樣本的類別標簽,改善了人臉識別的硬分類問題。
[0026] 3.本發(fā)明基于NMMC準則得到最優(yōu)投影子空間Wt,能夠適用于復(fù)雜的測試樣本分 布,增強了最優(yōu)投影子空間學(xué)習(xí)對數(shù)據(jù)分布的魯棒性。
【附圖說明】
[0027] 圖1是本發(fā)明的實現(xiàn)總流程圖;
[0028] 圖2是本發(fā)明使用數(shù)據(jù)庫中的樣本圖像;
[0029] 圖3是本發(fā)明中的分類器和k近鄰分類器對YALE人臉圖像庫的識別結(jié)果;
[0030] 圖4是本發(fā)明中的分類器和k近鄰分類器對YaleB人臉圖像庫的識別結(jié)果;
[0031] 圖5是本發(fā)明中的分類器和k近鄰分類器對FERET人臉圖像庫的識別結(jié)果。
【具體實施方式】
[0032] 參照圖1,本發(fā)明的具體實施步驟如下:
[0033] 步驟1?人臉圖像預(yù)處理。
[0034] (la)選取人臉圖像:
[0035] 本實例從YALE人臉庫中選15人組成的165幅人臉圖,從YaleB人臉庫中選38 人組成的2414幅人臉圖,從FERET人臉庫中選取160人組成的960幅人臉圖,將原人臉圖 像采樣大小設(shè)為32X32,將圖像灰度值歸一化到[0,1];
[0036](lb)構(gòu)成訓(xùn)練樣本集和測試樣本集:
[0037] 從每組人臉庫中獲得c類樣本的G幅人臉圖像,并將其劃分為N幅訓(xùn)練樣本圖像 和M幅測試樣本圖像,構(gòu)成訓(xùn)練樣本集X= {(?VA)匕和測試樣本集2 = {(zd)l^,
[0038] 其中c彡3,G彡2,N彡1,M彡1,Xlj表示第i類的第j個訓(xùn)練樣本,y表示x 的類別標簽,Zl]表示第i類的第j個測試樣本,v表示zu的類別標簽。
[0039] 步驟2.初始化訓(xùn)練樣本集。
[0040] 初始化訓(xùn)練樣本集X中訓(xùn)練樣本Xlj的誤分率為:=NJ其中yGY, Y= {1,…,c}是類別標簽的集合;
[0041] 初始化訓(xùn)練樣本集X中不同類別之間的誤分率為:鄭,g) =rx(: -1:),其中, p,qGY,p^q;
[0042] 初始化子分類器Ct的個數(shù)t= 1。
[0043] 步驟3.將訓(xùn)練樣本集X劃分為兩個樣本子集。
[0044] 根據(jù)子分類器的個數(shù)t將訓(xùn)練樣本集X劃分為第一子樣本集XjP第二子樣本集 XP;
[0045] 當t= 1,隨機地從c類訓(xùn)練樣本集X中選取義個訓(xùn)練樣本構(gòu)成第一子樣本集Xg, 將剩下的訓(xùn)練樣本構(gòu)成第二子樣本集Xp,其中Ng=mXc,m是從每一類訓(xùn)練樣本中隨機選 取的訓(xùn)練樣本個數(shù);
[0046] 當t> 1,將訓(xùn)練樣本集X中的訓(xùn)練樣本按照對應(yīng)的誤分率y(Xlj,y)值降序排序, 取前義個Y(Xl],y)值對應(yīng)的訓(xùn)練樣本構(gòu)成第一子樣本集Xg,剩下的訓(xùn)練樣本構(gòu)成第二子 樣本集Xp。
[0047]步驟4.利用第一子樣本集Xg學(xué)習(xí)第t個最優(yōu)投影子空間Wt。
[0048] (4a)定義基于非參數(shù)最大邊緣準則的類內(nèi)散度矩陣於_和類間散度矩陣 ^BWLMC
[0051] 其中,:6(巧)表示訓(xùn)練樣本Xl』的偽逆分布,
為權(quán)重,參數(shù)議? 4表示與訓(xùn)練樣本xlS同類中距離x^最遠的訓(xùn)練樣本, < =氣-.<,〇示與訓(xùn)練樣本Xi]異類中距離X。最近的訓(xùn)練樣本,)表示類7i]與類 ?之間的誤分率;
[0052] (4b)對類間散度矩陣3^與類內(nèi)散度矩陣的差值進行特征值分解,得到其 差值矩陣的前L個特征值A(chǔ)2>~>A^> 〇對應(yīng)的特征向量nn2,…,,構(gòu)成 最優(yōu)投影子空間Wt,其中L<Ng。
[0053] 步驟5.根據(jù)得到的最優(yōu)投影子空間Wt,將訓(xùn)練樣本集X中的樣本投影到該空間 Wt,得到訓(xùn)練樣本X。的特征K:
[0054]<