采用新型密度聚類(lèi)進(jìn)行人臉識(shí)別的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及采用新型密度聚類(lèi)進(jìn)行人臉識(shí)別的方法。
【背景技術(shù)】
[0002] 近年來(lái),人臉識(shí)別成為一項(xiàng)熱口的計(jì)算機(jī)技術(shù)研究領(lǐng)域。人臉識(shí)別技術(shù)作為生物 識(shí)別技術(shù)的一種,它結(jié)合了圖像處理、計(jì)算機(jī)圖形學(xué)、模式識(shí)別等多個(gè)研究領(lǐng)域。聚類(lèi)方法 是人臉識(shí)別技術(shù)的最重要組成部分之一。由于人臉圖像數(shù)據(jù)通常復(fù)雜分布,常用的聚類(lèi)方 法無(wú)法很好地識(shí)別出復(fù)雜的不規(guī)則形狀分類(lèi)。如何將準(zhǔn)確、健壯、高效的聚類(lèi)方法應(yīng)用到人 臉識(shí)別中是目前急需解決的問(wèn)題。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明的目的在于提出一種采用新型密度聚類(lèi)進(jìn)行人臉識(shí)別的方法,與其他的基 于質(zhì)屯、的聚類(lèi)方法相比,具有準(zhǔn)確度高,能識(shí)別分布無(wú)序、非球形等復(fù)雜數(shù)據(jù)的優(yōu)點(diǎn),提高 了人臉識(shí)別的準(zhǔn)確度。
[0004] 本發(fā)明一種采用新型密度聚類(lèi)進(jìn)行人臉識(shí)別的方法,包括如下幾個(gè)步驟:
[0005] 步驟1、讀取人臉圖像:
[0006] 所用人臉圖像是大小為MXN的灰度圖像,用每個(gè)像素作為一個(gè)特征點(diǎn),讀入K張人 臉圖像得到圖像特征矩陣Ai(mxn),其中i = l,2, . . .,Κ;將圖像特征矩陣Ai(mxn)轉(zhuǎn)換為特征向 量 fi(ixMN),其中 fiα:N)=Aiα,l:N),fi(N+l:2N)=Ai(2,l:N),依此類(lèi)推,對(duì)特征向量fi的 每個(gè)維度做0-1歸一化,即
其中j = 1,2,…,MN,然后更 新特征向量fi;
[0007] 步驟2、計(jì)算距離矩陣:
[0008] 用特征向量集f作為待聚類(lèi)數(shù)據(jù)集P輸入,其人臉特征向量點(diǎn)的數(shù)目記為N,待聚類(lèi) 數(shù)據(jù)集P中第i個(gè)人臉特征向量點(diǎn)記為Pi,計(jì)算待聚類(lèi)數(shù)據(jù)集P中每?jī)蓚€(gè)人臉特征向量點(diǎn)Pi之 間的距離,生成距離矩陣(di,j)NXN,其中di,康示點(diǎn)Pi到pj的距離;
[0009] 步驟3、找出所有人臉特征向量點(diǎn)Pi的密度中屯、點(diǎn):
[0010] 用r作為掃描半徑對(duì)每個(gè)人臉特征向量點(diǎn)Pi進(jìn)行掃描,將待聚類(lèi)數(shù)據(jù)集P中與Pi的 距離小于r的人臉特征向量點(diǎn)加入到Pi的r-Nei曲bor集合化ii= {pj I di, j非忡,算出集合 化ii中所有人臉特征向量點(diǎn)Pi的平均值
,其中k為集合化ii中人臉特征向量 點(diǎn)的總個(gè)數(shù),在待聚類(lèi)數(shù)據(jù)集P中找到距離平均值Meani最近的人臉特征向量點(diǎn)作為Pi的密 度中屯、點(diǎn)Ci,即
'其中I |p-meani| h表示點(diǎn)P與mearii的幾何距離;
[0011 ]步驟4、計(jì)算人臉向量特征點(diǎn)P j的密度:
[0012]將集合Neii中元素的個(gè)數(shù)作為人臉特征向量點(diǎn)Pi的密度值化= size(Neii),即
[0013] 步驟5、找出所有人臉特征向量點(diǎn)w的密度匯聚點(diǎn):
[0014] 通過(guò)迭代計(jì)算尋找每個(gè)人臉特征向量點(diǎn)W的局部密度中屯、點(diǎn),直到最后收斂,收 斂點(diǎn)稱(chēng)為該點(diǎn)的密度匯聚點(diǎn):
[001引找到Pi的密度中屯、點(diǎn)Ci = pj,找到pj的密度中屯、點(diǎn)cj = pk,若Pk的密度中屯、點(diǎn)仍然 是Ck = pk,則停止迭代,將Pk作為Pi、Pj、Pk的密度匯聚點(diǎn),記作cp(i)=cp( j)=cp化)=pk;
[0016] 步驟6、找出所有人臉特征向量點(diǎn)w的局部密度峰值點(diǎn):
[0017] 若人臉特征向量點(diǎn)Pi的密度匯聚點(diǎn)是其自身,即cp(i)=pi,并且Pi的密度值Pi大 于給定的密度闊值t,則將其加入到局部密度峰值點(diǎn)集合LPS中,記作LPS={pi|(cp(i)=pi) 八(化含t)}
[0018] 步驟7、對(duì)局部密度峰值點(diǎn)集合WS中的所有人臉特征向量點(diǎn)pi按最近鄰近算法進(jìn) 行聚類(lèi),每個(gè)類(lèi)別就是一個(gè)密度核屯、,將局部密度峰值點(diǎn)集合LPS中每個(gè)局部密度中屯、點(diǎn)Ip 的類(lèi)別記為cl(lp);
[0019] 步驟8、把其它所有非局部密度峰值點(diǎn)P的類(lèi)別初始化為-1,再劃歸到與其匯聚中 屯、點(diǎn)相同類(lèi)別,即cl(p)=cl(cp(p)),把cl(p)=-l的點(diǎn)記為離群點(diǎn);
[0020] 步驟9、輸出聚類(lèi)結(jié)果cl(p):
[0021] cl(p)表示該人臉的類(lèi)別,若cl(pl)=cl(p2),表示pi與p2所代表的兩張人臉圖像 是同一人,若cl(p)=-l表示該人臉類(lèi)別未識(shí)別。
[0022] 由于本發(fā)明通過(guò)尋找密度核屯、而非單一質(zhì)屯、來(lái)進(jìn)行聚類(lèi),一個(gè)類(lèi)別的密度核屯、由 一些密度相對(duì)較高的松散聯(lián)結(jié)在一起的匯聚點(diǎn)構(gòu)成,其它數(shù)據(jù)點(diǎn)按一定結(jié)構(gòu)聚焦在運(yùn)些點(diǎn) 外圍.因而可W克服了傳統(tǒng)聚類(lèi)算法難W識(shí)別非范數(shù)球形結(jié)構(gòu)的數(shù)據(jù),提高了人臉識(shí)別的 準(zhǔn)確度。
【具體實(shí)施方式】
[0023] 本發(fā)明一種采用新型密度聚類(lèi)進(jìn)行人臉識(shí)別的方法,包括如下幾個(gè)步驟:
[0024] 步驟1、讀取人臉圖像:
[0025] 所用人臉圖像是大小為MXN的灰度圖像,用每個(gè)像素作為一個(gè)特征點(diǎn),讀入K張人 臉圖像得到圖像特征矩陣Ai(mxn),其中i = l,2,...,K;為了方便計(jì)算,將圖像特征矩陣 Ai(MXN)轉(zhuǎn)換為特征向量fi(ixMN),其中fi(l :N) =Ai(l,1 :N),fi(N+l :2N) =Ai(2,1 :N),依此類(lèi) 推,對(duì)特征向量fi的每個(gè)維度做0-1歸一化,即:
,其中j = 1,2,…,MN,然后更新特征向量f i;
[00%] 步驟2、計(jì)算距離矩陣:
[0027]用特征向量集f作為待聚類(lèi)數(shù)據(jù)集P輸入,其人臉特征向量點(diǎn)的數(shù)目記為N,待聚類(lèi) 數(shù)據(jù)集P中第i個(gè)人臉特征向量點(diǎn)記為Pi,計(jì)算待聚類(lèi)數(shù)據(jù)集P中每?jī)蓚€(gè)人臉特征向量點(diǎn)Pi之 間的距離,生成距離矩陣(dij)NXN,其中di,康示點(diǎn)Pi到P撕距離;
[00%]步驟3、找出所有人臉特征向量點(diǎn)Pi的密度中屯、點(diǎn):
[0029] 用r作為掃描半徑對(duì)每個(gè)人臉特征向量點(diǎn)Pi進(jìn)行掃描,W第i個(gè)人臉特征向量點(diǎn)Pi 為例,將P中與Pi的距離小于r的人臉特征向量點(diǎn)加入到Pi的r-Neig化or集合化ii={pj|dij <r}中,算出集合化ii中所有人臉特征向量點(diǎn)的平均值
其中k為集合化ii 中人臉特征向量點(diǎn)的總個(gè)數(shù),在待聚類(lèi)數(shù)據(jù)集P中找到距離平均值Meam最近的人臉特征向 量點(diǎn)作為Pi的密度中屯、點(diǎn)ci,即
其中Mp-meani||2表示點(diǎn)P與 meam的幾何距離;
[0030] 步驟4、計(jì)算人臉向量特征點(diǎn)W的密度:<