本發(fā)明屬于人臉識(shí)別的技術(shù)領(lǐng)域,尤其涉及的是一種基于互信息無參數(shù)局部保持投影算法的人臉識(shí)別方法。
背景技術(shù):
人臉識(shí)別技術(shù)始于二十世紀(jì)六十年代中后期,多年來一直是一個(gè)研究熱點(diǎn),近幾年,更成為一個(gè)熱門的研究課題?,F(xiàn)今人臉識(shí)別產(chǎn)品已廣泛應(yīng)用于金融、司法、軍隊(duì)、公安、邊檢、政府、航天、教育、醫(yī)療及眾多企事業(yè)單位等領(lǐng)域。對(duì)于人臉識(shí)別問題由于其樣本維數(shù)非常高,因此需要對(duì)高維樣本進(jìn)行特征提取(降維)處理?;诖?,很多特征提取方法被提出,如主成分分析(Principal Component Analysis,PCA)和線性鑒別分析(Linear Discriminant Analysis,LDA)。但這兩種方法都是基于全局思想的算法,2005年何曉飛等提出了保局投影映射(Locality Preserving Projections,LPP)算法,該算法是一種基于局部近鄰思想的特征提取算法,一經(jīng)提出就受到了學(xué)者們的關(guān)注,并從不同角度提出了一系列改進(jìn)的算法。LPP算法不同于以有的主成份分析、線性判別分析算法,該算法將訓(xùn)練樣本看成是高維空間中的一個(gè)點(diǎn),通過樣本間近鄰關(guān)系來構(gòu)造目標(biāo)函數(shù),其目的是保持樣本局部流形結(jié)構(gòu),即原始空間中近鄰樣本投影到低維空間中應(yīng)該保持原來的近鄰關(guān)系,因此更能夠發(fā)現(xiàn)樣本的本質(zhì)結(jié)構(gòu),提取出更加有效的分類特征,該算法在人臉識(shí)別等圖像識(shí)別領(lǐng)域取得了廣泛的應(yīng)用。LPP算法是通過高斯核函數(shù)來計(jì)算訓(xùn)練樣本對(duì)之間的近鄰關(guān)系并以此作為相似權(quán)值,然后再利用近鄰權(quán)值矩陣構(gòu)造目標(biāo)函數(shù),而算法的近鄰大小k和高斯核函數(shù)中的t都需要人工設(shè)置,因此LPP算法識(shí)別結(jié)果對(duì)參數(shù)設(shè)置是非常敏感,如何選擇合適的參數(shù)使得算法達(dá)到最佳效果是當(dāng)前的一個(gè)研究難點(diǎn)。最近已有學(xué)者對(duì)此進(jìn)行了研究,如非相度保持投影算法(Dissimilarity Preserving Projection,DPP)和無參數(shù)局部保持投影算法(Parameter-Free Locality Preserving Projections,PFLPP)。DPP算法考慮所有的樣本對(duì)間的相似關(guān)系,因此不需參數(shù)的設(shè)置,有效地解決了算法對(duì)參數(shù)敏感這一問題。但該算法以樣本的重構(gòu)誤差作為相似權(quán)值,這顯然與分類關(guān)系不大,另外其采用歐式距離作為度量,而歐式距離對(duì)樣本的分布是比較敏感的。PFLPP則提出采用樣本間的余弦距離來計(jì)算相似權(quán)值,可有效地避免歐式距離對(duì)樣本的分布敏感這一問題,然而該算法仍存在著以下三點(diǎn)問題:一、所采用無參數(shù)近鄰計(jì)算方法并不能有效地保持樣本的局部流形;二、忽略了非近鄰樣本對(duì)分類所起的作用;三、同LPP算法一樣,目標(biāo)函數(shù)存在著小樣本問題。因此期望找到一種算法,同時(shí)解決以上三個(gè)問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供了一種基于互信息無參數(shù)局部保持投影算法的人臉識(shí)別方法,以解決現(xiàn)有技術(shù)的計(jì)算方法不能有效保持樣本的局部流形、忽略非近鄰樣本對(duì)分類所起的作用以及目標(biāo)函數(shù)存在小樣本等問題。
本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的:
本發(fā)明提供了一種基于互信息無參數(shù)局部保持投影算法的人臉識(shí)別方法,包括以下步驟:
步驟S1:選擇標(biāo)準(zhǔn)人臉庫(kù)的圖像作為總樣本集,并劃分訓(xùn)練樣本集X;
步驟S2:計(jì)算訓(xùn)練樣本集中所有圖像之間的互信息值,獲得訓(xùn)練樣本集中所有圖像的互信息值的矩陣M,對(duì)矩陣M進(jìn)行歸一化處理,獲得GM;
步驟S3:計(jì)算訓(xùn)練樣本集圖像的平均相似度d,并根據(jù)GM和d自適應(yīng)確定每個(gè)樣本的近鄰;
步驟S4:計(jì)算訓(xùn)練樣本集的近鄰相似權(quán)值矩陣S和非近鄰權(quán)值矩陣B,再根據(jù)S和B計(jì)算近鄰散度矩陣SL和非近鄰散度矩陣SB
步驟S5:計(jì)算訓(xùn)練樣本集的總體散布矩陣St,及其非零特征值所對(duì)應(yīng)的特征向量P;
步驟S6:根據(jù)SL和SB,分別計(jì)算投影到P空間上的近鄰散度矩陣和非近鄰散度矩陣并對(duì)矩陣進(jìn)行特征值分解;
步驟S7:將獲得的特征值按降序排列,選擇前k個(gè)最大特征值所對(duì)應(yīng)的特征向量v1,v2,…,vk,令V=[v1v2…vk],獲得最優(yōu)投影方向矩陣W=PV,所述k為最終降維樣本的維度;
步驟S8:對(duì)未知樣本xi按照最優(yōu)投影方向矩陣W=PV進(jìn)行投影,獲得xi的低維的投影特征系數(shù)向量yi,即yi=WTxi,最后采用常規(guī)的最近鄰分類方法進(jìn)行分類。
進(jìn)一步地,所述步驟S1中,選擇ORL標(biāo)準(zhǔn)人臉庫(kù)作為總樣本集。
進(jìn)一步地,所述步驟S2中,訓(xùn)練樣本集中所有圖像之間的互信息值MI值的計(jì)算方法,包括以下步驟:
步驟S201:計(jì)算圖像xi和xj中各灰度級(jí)i出現(xiàn)的頻率PA(i)和PB(i),xi和xj為訓(xùn)練樣本集中的任意兩張圖像,具體為:
分別計(jì)算圖像xi和xj的灰度直方圖,并統(tǒng)計(jì)圖像xi和xj的所有灰度級(jí)i出現(xiàn)次數(shù),記為FA(i)和FB(i),其中,i∈[0,255],A代表圖像xi,B代表圖像xj;
對(duì)圖像xi所有灰度級(jí)i出現(xiàn)的次數(shù)進(jìn)行累加,獲得
對(duì)圖像xj的所有灰度級(jí)i出現(xiàn)次數(shù)進(jìn)行累加,獲得
則:PA(i)=FA(i)/sumA,PB(i)=FB(i)/sumB
步驟S202:計(jì)算圖像xi和xj對(duì)應(yīng)位置的灰度對(duì)(i,j)出現(xiàn)的頻率PAB(i,j),具體為:
根據(jù)圖像xi和xj的灰度直方圖,計(jì)算圖像xi和xj的聯(lián)合直方圖FAB(i,j),(i,j)表示圖像xi和xj對(duì)應(yīng)位置的灰度對(duì);
對(duì)圖像xi和xj的所有灰度對(duì)(i,j)出現(xiàn)的次數(shù)進(jìn)行累加,獲得
則:PAB(i,j)=FAB(i,j)/sumAB;
步驟S203:熵值計(jì)算:
圖像xi的信息熵
圖像xj的信息熵
圖像xi和xj的聯(lián)合熵
步驟S204:計(jì)算圖像xi、xj的MI值M(xi,xj)=H(A)+H(B)-H(A,B)。
進(jìn)一步地,所述步驟S3中,平均相似度d的計(jì)算方法及自適應(yīng)確定每個(gè)樣本的近鄰的方法為:
步驟S301:將矩陣M中的所有元素值規(guī)范化到[0,1]內(nèi),具體為:
找到M中最大元素max,將M中的所有元素M(xi,xj)除以max,得到歸一化圖像互信息矩陣GM,矩陣GM中個(gè)元素為GM(xi,xj);
步驟S302:對(duì)GM中所有元素進(jìn)行累加,再除以N×N,得到平均相似度d;
步驟S303:若GM(xi,xj)≥d,則圖像xi和xj是近鄰,否則為非近鄰;
進(jìn)一步地,所述步驟S4中:訓(xùn)練樣本集的近鄰相似權(quán)值矩陣S和非近鄰權(quán)值矩陣B的計(jì)算方法為:
設(shè)GS是一N×N的零矩陣,當(dāng)GM(xi,xj)≥d時(shí),令GS的元素GS(xi,xj)=GM(xi,xj),否則GS的元素不變,將所有元素檢測(cè)完畢后,得到近鄰相似權(quán)值矩陣S;非近鄰權(quán)值矩陣B=GM-S;
訓(xùn)練樣本集圖像的近鄰散度矩陣SL和非近鄰散度矩陣SB的計(jì)算方法為:
SL=XLSXT
式中:LS=DS-S為拉普拉斯矩陣,DS為對(duì)角陣,其對(duì)角元素
SB=XLBXT
式中:LN=DB-B,DB為對(duì)角陣,其對(duì)角元素
進(jìn)一步地,所述步驟S5中,訓(xùn)練樣本集的總體散布矩陣St,及其非零特征值所對(duì)應(yīng)的特征向量P的計(jì)算方法為:
計(jì)算總體散布矩陣St:
式中:其中F為訓(xùn)練樣本集的總體均值向量,e為所有元素均為1的列向量;對(duì)Ht進(jìn)行奇異值分解:Ht=UΣVT,其中U和V分別為正交陣,Σm是按降序排列的對(duì)角陣,m為Ht的秩,即m=rank(Ht);
計(jì)算St的非零特征值所對(duì)應(yīng)的特征向量P:P=U1,U1為Ht的非零特征值對(duì)應(yīng)的特征向量構(gòu)成的空間,即U1∈Rn×m,n為原始圖像樣本進(jìn)行拉直處理后的維度。
進(jìn)一步地,所述步驟S6中,投影到P空間上的近鄰散度矩陣和非近鄰散度矩陣的計(jì)算方法為:
進(jìn)一步地,所述步驟S7中,k等于或大于標(biāo)準(zhǔn)人臉庫(kù)中樣本類別數(shù)。
本發(fā)明相比現(xiàn)有技術(shù)具有以下優(yōu)點(diǎn):本發(fā)明提供了一種基于互信息無參數(shù)局部保持投影算法的人臉識(shí)別方法,該方法中,互信息MI是用來描述2個(gè)隨機(jī)變量間的信息相關(guān)性,衡量?jī)煞鶊D像相似程度的MI可以用熵來表示,熵是對(duì)圖像概率分布的一種描述;該方法采用MI來計(jì)算樣本之間的相似度,并以此值直接作為樣本間的相似系數(shù),同時(shí)為了更好地保持局部流形的結(jié)構(gòu),更加充分地使用訓(xùn)練樣本,給出了一種以總體樣本的平均MI,也稱之為平均相似度作為分界點(diǎn),將樣本分成了近鄰與非近鄰樣本,基于此確定了樣本的局部近鄰相似散度矩陣和非近鄰散度矩陣。該方法不但考慮近鄰樣本的作用,同時(shí)考慮非近鄰樣本的作用,因此該方法的目標(biāo)函數(shù)能夠使得原始為近鄰的樣本投影后仍保持近鄰關(guān)系,而非近鄰的樣本投影后將盡量遠(yuǎn)離;對(duì)于目標(biāo)函數(shù)的求解,可先采用PCA算法將樣本降維至到總體散度矩陣的非零空間,然后將目標(biāo)函數(shù)轉(zhuǎn)換為差形式,從而有效地解決了小樣本問題,該方法無需設(shè)置任何參數(shù),增強(qiáng)了方法的實(shí)用性。
附圖說明
圖1為本發(fā)明基于互信息無參數(shù)局部保持投影算法的人臉識(shí)別方法的流程圖;
圖2為MI值的計(jì)算方法流程圖;
圖3為平均相似度d的計(jì)算方法流程圖。
具體實(shí)施方式
下面對(duì)本發(fā)明的實(shí)施例作詳細(xì)說明,本實(shí)施例在以本發(fā)明技術(shù)方案為前提下進(jìn)行實(shí)施,給出了詳細(xì)的實(shí)施方式和具體的操作過程,但本發(fā)明的保護(hù)范圍不限于下述的實(shí)施例。
實(shí)施例1
在人臉識(shí)別中,首先就是要找到一個(gè)投影矩陣,該投影矩陣不但要使投影后的人臉圖像具有較低的維數(shù),而且也要具有較好的可分性,本實(shí)施例提供了一種基于互信息無參數(shù)局部保持投影算法的人臉識(shí)別方法,就是要提供一個(gè)最優(yōu)投影方向矩陣,并根據(jù)該矩陣將未知人臉圖像進(jìn)行投影,獲得未知人臉圖像的低維的投影特征系數(shù)向量,最后采用常規(guī)的最近鄰方法進(jìn)行樣本的分類,包括以下步驟:
步驟S1:選擇ORL標(biāo)準(zhǔn)人臉庫(kù)的圖像作為總樣本集,ORL標(biāo)準(zhǔn)人臉庫(kù)有40個(gè)人,每人10幅圖像,一共400幅圖像,人臉姿態(tài)有相當(dāng)程度的變化,每幅圖像的尺寸為112×92pixel,選擇每人前5幅作為訓(xùn)練樣本,后5幅作為測(cè)試樣本,因此訓(xùn)練樣本和測(cè)試樣本各有200幅圖像,假設(shè)X={x1,x2,…,x200}為人臉圖像訓(xùn)練樣本集,其中xi是第i幅人臉圖像;
步驟S2:計(jì)算訓(xùn)練樣本集中所有圖像之間的互信息值(MI值),獲得所有訓(xùn)練樣本集的MI值的矩陣M,其中,圖像xi、xj的MI值表示為M(xi,xj),矩陣M為一N階矩陣,N等于訓(xùn)練樣本集中圖像的數(shù)量,本實(shí)施例中,矩陣M為一200×200的矩陣,即N=200,圖像xi、xj的MI值的計(jì)算方法,包括以下步驟:
步驟S201:計(jì)算圖像xi和xj中各灰度級(jí)i出現(xiàn)的頻率PA(i)和PB(i),具體為:
分別計(jì)算圖像xi和xj的灰度直方圖,并統(tǒng)計(jì)圖像xi和xj的所有灰度級(jí)i出現(xiàn)次數(shù),記為FA(i)和FB(i),其中,i∈[0,255],A代表圖像xi,B代表圖像xj;
對(duì)圖像xi所有灰度級(jí)i出現(xiàn)的次數(shù)進(jìn)行累加,獲得
對(duì)圖像xj的所有灰度級(jí)i出現(xiàn)次數(shù)進(jìn)行累加,獲得
則:PA(i)=FA(i)/sumA,PB(i)=FB(i)/sumB
步驟S202:計(jì)算圖像xi和xj對(duì)應(yīng)位置的灰度對(duì)(i,j)出現(xiàn)的頻率PAB(i,j),具體為:
根據(jù)圖像xi和xj的灰度直方圖,計(jì)算圖像xi和xj的聯(lián)合直方圖FAB(i,j),(i,j)表示圖像xi和xj對(duì)應(yīng)位置的灰度對(duì);
對(duì)圖像xi和xj的所有灰度對(duì)(i,j)出現(xiàn)的次數(shù)進(jìn)行累加,獲得
則:PAB(i,j)=FAB(i,j)/sumAB;
步驟S203:熵值計(jì)算:
圖像xi的信息熵
圖像xj的信息熵
圖像xi和xj的聯(lián)合熵
步驟S204:計(jì)算圖像xi、xj的MI值M(xi,xj)=H(A)+H(B)-H(A,B);
本實(shí)施例中,根據(jù)上述步驟S2計(jì)算的ORL人臉圖像的前兩個(gè)樣本M(x1,x2)=1.525,選擇異類兩個(gè)樣本x1和x7計(jì)算MI值,M(x1,x7)=1.2884,可以看出二者的差異較大,故可以將M(xi,xj)作為權(quán)值;
步驟S3:為了自適應(yīng)確定每個(gè)樣本的近鄰,計(jì)算訓(xùn)練樣本集中所有圖像的平均相似度d,并根據(jù)平均相似度d將訓(xùn)練樣本集中的圖像分成近鄰和非近鄰,具體為:
步驟S301:將矩陣M中的所有元素值規(guī)范化到[0,1]內(nèi),具體為:
找到M中最大元素max,將M中的所有元素M(xi,xj)除以max,得到歸一化圖像互信息矩陣GM,矩陣GM中個(gè)元素為GM(xi,xj),本實(shí)施例中,max=2.2146;
步驟S302:對(duì)GM中所有元素進(jìn)行累加,再除以N×N,得到平均相似度d;本實(shí)施例中,d=0.6348;
步驟S303:若GM(xi,xj)≥d,則圖像xi和xj是近鄰,否則為非近鄰;
步驟S4:計(jì)算訓(xùn)練樣本集的近鄰相似權(quán)值矩陣S和非近鄰權(quán)值矩陣B,具體為:
設(shè)S是一N×N的零矩陣,當(dāng)GM(xi,xj)≥d時(shí),令S的元素S(xi,xj)=GM(xi,xj),否則S的元素不變,將所有元素檢測(cè)完畢后,得到近鄰相似權(quán)值矩陣S;非近鄰權(quán)值矩陣B=GM-S;
計(jì)算訓(xùn)練樣本集圖像的近鄰散度矩陣SL和非近鄰散度矩陣SB,其中:
SL=XLSXT
式中:LS=DS-S為拉普拉斯矩陣,DS為對(duì)角陣,其對(duì)角元素
SB=XLBXT
式中:LN=DB-B,DB為對(duì)角陣,其對(duì)角元素
步驟S5:計(jì)算訓(xùn)練樣本集的總體散布矩陣的非零特征值所對(duì)應(yīng)的特征向量P,具體為:
計(jì)算總體散布矩陣St:
式中:其中F為訓(xùn)練樣本集的總體均值向量,e為所有元素均為1的列向量;對(duì)Ht進(jìn)行奇異值分解:Ht=UΣVT,其中U和V分別為正交陣,Σm是按降序排列的對(duì)角陣,m為Ht的秩,即m=rank(Ht),本實(shí)施例中,m=199;
計(jì)算St的非零特征值所對(duì)應(yīng)的特征向量P:P=U1,U1為Ht的非零特征值對(duì)應(yīng)的特征向量構(gòu)成的空間,即U1∈Rn×m,n為原始圖像樣本進(jìn)行拉直處理后的維度,比如說,原圖像的維度為100×100,拉直處理,即將原圖像每列首尾相接拉直成一個(gè)10000維的列向量,n=10000;
步驟S6:分別計(jì)算投影到St的非零特征值所對(duì)應(yīng)的特征向量P空間上的近鄰散度矩陣和非近鄰散度矩陣并對(duì)矩陣進(jìn)行特征值分解:
步驟S7:,將求得的特征值λi按降序排列,選擇前k個(gè)最大特征值所對(duì)應(yīng)的特征向量v1,v2,…,vk,令V=[v1v2…vk],獲得最優(yōu)投影方向矩陣W=PV,所述k為最終降維樣本圖像的維度,優(yōu)選地,k的取值可以等于或大于標(biāo)準(zhǔn)人臉庫(kù)中樣本類別數(shù),由于ORL標(biāo)準(zhǔn)人臉庫(kù)有40個(gè)人,即ORL標(biāo)準(zhǔn)人臉庫(kù)的中樣本類別數(shù)為40,因此,本實(shí)施例中,k取值為40;
步驟S8:在人臉識(shí)別中,首先就是要找到一個(gè)投影矩陣W,該投影矩陣不但要使投影后的人臉圖像具有較低的維數(shù),而且也要具有較好的可分性,對(duì)未知樣本xi進(jìn)行投影可按下式計(jì)算yi=WTxi,yi代表未知樣本xi的低維的投影特征系數(shù)向量,最后采用常規(guī)的最近鄰分類方法進(jìn)行樣本的分類。