專(zhuān)利名稱(chēng):一種計(jì)算復(fù)雜度低的人臉識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明屬于圖像處理、計(jì)算機(jī)視覺(jué)、模式識(shí)別技術(shù)領(lǐng)域,特別涉及人臉識(shí)別方法。
背景技術(shù):
近幾十年來(lái),人臉識(shí)別是計(jì)算機(jī)視覺(jué)和模式識(shí)別領(lǐng)域研究的一個(gè)熱點(diǎn)問(wèn)題。對(duì)于識(shí)別問(wèn)題,尋找有效的圖像特征是解決問(wèn)題的關(guān)鍵。以往的研究中,圖像特征主要分為視覺(jué)特征、統(tǒng)計(jì)特征、變換系數(shù)特征和代數(shù)特征。
文章Hong Z.Q.Algebraic feature extraction of image for recognition.Pattern Recognition,1991,24(3)211-219[1]中Hong首次提出了將奇異值向量作為圖像的一種代數(shù)特征,并證明了其具有穩(wěn)定性、旋轉(zhuǎn)不變性、平移不變性等良好性質(zhì)?;诖?,文獻(xiàn)“周德龍,高文,趙德斌?;谄娈愔捣纸夂团袆e式KL投影的人臉識(shí)別。軟件學(xué)報(bào),2003,14(4)783-789”、“王蘊(yùn)紅,譚鐵牛,朱勇?;谄娈愔捣纸夂蛿?shù)據(jù)融合的臉像鑒別。計(jì)算機(jī)學(xué)報(bào),23(6)649-653”、“魏小鵬,于萬(wàn)波,金一粟。奇異值方法用于汽車(chē)模型識(shí)別。中國(guó)圖像圖形學(xué)報(bào),2003,8A(1)47-50”等文將奇異值向量作為圖像的一種有效的代數(shù)特征用于人臉識(shí)別中。但是,文獻(xiàn)Tian Y.,TanT.N.Do singular values contain adequate information for face recognition?Pattern Recognition,2003,36649-655的研究表明,人臉圖像的奇異值向量并非包含了圖像的足夠信息,圖像的大量信息體現(xiàn)在圖像矩陣奇異值分解的兩個(gè)正交矩陣中,并提出了一種基于投影系數(shù)向量的特征提取和人臉識(shí)別方法。
發(fā)明內(nèi)容
本發(fā)明的目的是提出一種計(jì)算復(fù)雜度低的人臉識(shí)別方法。該法不僅所需的運(yùn)行時(shí)間明顯降低,提高了效率,而且其識(shí)別精度也明顯優(yōu)于常規(guī)同類(lèi)方法。
為實(shí)現(xiàn)上述目的,本發(fā)明提出了一種計(jì)算復(fù)雜度低的人臉識(shí)別方法。其技術(shù)方案是理論證明了圖像的大量信息主要體現(xiàn)在奇異值分解最大的k個(gè)奇異值所對(duì)應(yīng)的左、右奇異向量中;并利用奇異值分解的近似表示,給出了模板圖像的一組基圖像;然后將圖像表達(dá)成該組基圖像的線(xiàn)性表示,將其組合系數(shù)作為圖像的代數(shù)特征并用于人臉識(shí)別中。
本發(fā)明的人臉識(shí)別原理詳細(xì)說(shuō)明如下定理1(SVD)對(duì)于任一個(gè)秩為r的矩陣A∈RN×M,必有兩個(gè)正交矩陣U,V使得A=UΣVT=ΣI=1rσiuiviT---(1)]]>其中符號(hào)“T”表示矩陣轉(zhuǎn)置;∑=diag(σ1,σ2,…,σr,0,…,0),U=(u1,u2,…,uN)∈RN×N,V=(v1,v2,…,vM)∈RM×M。σi(i=1,…,r)均為實(shí)數(shù),即為A的奇異值;ui,vi(i=1,…,r)分別稱(chēng)為矩陣A的屬于σi的左、右奇異向量。
由奇異值分解的性質(zhì)可知,σi與左、右奇異向量ui,vi(i=1,…,r)是一一對(duì)應(yīng)的;且當(dāng)σi(i=1,…,r)按從大到小的順序排列時(shí),后面的大部分奇異值幾乎為零。這樣,式(1)可近似表示為A=Σi=1rσiuiviT≈Σi=1kσiuiviT(k<r)---(2)]]>該表示所產(chǎn)生的誤差為D=Σi=1rσiuiviT-Σi=1kσiuiviT=Σi=k+1rσiuiviT---(3)]]>文獻(xiàn)“Maria P.,Panagiota B.(賴(lài)劍煌,馮國(guó)燦等譯)。數(shù)字圖像處理疑難解析。北京機(jī)械工業(yè)出版社,2005”給出了用式(2)的近似表示重建圖像A的所損失的能量為||D||=Σi=k+1rσi2---(4)]]>即后面的r-k個(gè)奇異值的平方和,其中‖·‖為Frobenius范數(shù)。這樣,當(dāng)奇異值σi(1≤i≤r)按從大到小的順序排列時(shí),用式(2)近似重建圖像A的所損失的能量是很小的。
可以用文獻(xiàn)“Maria P.,Panagiota B.(賴(lài)劍煌,馮國(guó)燦等譯)。數(shù)字圖像處理疑難解析。北京機(jī)械工業(yè)出版社,2005”的方法類(lèi)似證明圖像A的能量為||A||=Σi=1rσi2---(5)]]>于是式(2)中k值的選取應(yīng)滿(mǎn)足下面的不等式Σi=1kσi2/Σi=1rσi2≥θ---(6)]]>其中θ是一個(gè)預(yù)給的門(mén)限值,如θ=0.95。
文獻(xiàn)“Tian Y.,Tan T.N.Do singular values contain adequate information for face recognition?Pattern Recognition,2003,36649-655”證明了圖像的大量信息體現(xiàn)在圖像矩陣的SVD的兩個(gè)正交矩陣中。這里,我們將進(jìn)一步說(shuō)明圖像的大量信息體現(xiàn)在SVD最大的k個(gè)奇異值所對(duì)應(yīng)的左、右奇異向量中。設(shè)A,A′是兩幅同類(lèi)型的圖像,對(duì)其分別作奇異值分解A=Σi=1rσiuiviT,A′=Σi=1rσi′ui′vi′T---(7)]]>令U=(u1,u2,…,uN),V=(v1,v2,…,vM),U′=(u1′,u2′,…,uN′),V′=(v1′,v2′,…,vM′)。設(shè)k(k<r)是一給定的數(shù),交換u1,u2,…,uk和u1′,u2′,…,uk′,并交換v1,v2,…,vk和v1′,v2′,…,vk′,然后按式(2)重建兩幅圖像;同樣,交換后面的k對(duì)左、右奇異向量,然后在按式(2)重建兩幅圖像。
設(shè)一模板圖像A,由式(2)可將其表示為A≈σ1u1v1T+σ2u2v2T+···+σkukvkT---(8)]]>
其中,σi(i=1,…,r)為A的按從大到小排列的最大的k個(gè)奇異值;u1,…,uk,v1,…,vk為A的屬于σi的k對(duì)左、右奇異向量。
由于圖像A的大量信息體現(xiàn)在這前k對(duì)向量中。我們稱(chēng)u1v1T,u2v2T,…,ukvkT為圖像A奇異值分解的基圖像。這樣,式(8)中,模板圖像A是基圖像u1v1T,u2v2T,…,ukvkT的線(xiàn)性組合,其組合系數(shù)即為最大的k個(gè)奇異值σ1,σ2,…,σk。我們將這k個(gè)奇異值視為圖像A的代數(shù)特征。
設(shè)B為任一幅圖像,相對(duì)于模板圖像A,可將圖像B表示為基圖像u1v1T,u2v2T,…,ukvkT的線(xiàn)性組合,B=τ1u1v1T+τ2u2v2T+···+τkukvkT---(9)]]>這樣,由于圖像A的大量信息體現(xiàn)在列向量u1,…,uk,v1,…,vk中,組合系數(shù)τ1,τ2,…,τk描述了圖像B與模板圖像A的相似程度。于是,我們可以抽取組合系數(shù)τ1,τ2,…,τk作為圖像B的代數(shù)特征。因?yàn)閡i,vi(i=1,…,k)是互相正交的列向量,式(9)中的組合系數(shù)由下式可得τi=uiTBvi(i=1,···,k)---(10)]]>假定訓(xùn)練圖像庫(kù)有c個(gè)人,每個(gè)人有M個(gè)樣本Aj(j=1,2,…,M)。設(shè)每一幅圖像的大小為n×m,p=min(m,n)。下面給出了將上述組合系數(shù)用于人臉識(shí)別的算法的主要步驟1.對(duì)第i個(gè)人的樣本圖像,計(jì)算其平均圖像BiBi=1MΣj=1MAj(i=1,2,···,c)---(11)]]>并將其作為第i個(gè)人的模板圖像;2.對(duì)Bi作奇異值分解。并按預(yù)給的門(mén)限值θ確定k值,給出第i個(gè)模板圖像Bi的最大的k個(gè)奇異值所作成的奇異值向量SMi,及對(duì)應(yīng)的k個(gè)基圖像u1v1T,u2v2T,…,ukvkT,并將SMi作為第i個(gè)人的代數(shù)特征;3.對(duì)待識(shí)別的人臉圖像B,將B表示為第i個(gè)模板圖像Bi的基圖像u1v1T,u2v2T,…,ukvkT的線(xiàn)性組合,B=τ1u1v1T+τ2u2v2T+···+τkukvkT---(12)]]>將組合系數(shù)τ1,τ2,…,τk作為圖像B相對(duì)于Bi的代數(shù)特征,并作向量τ=(τ1,τ2,…,τk)T;4.用最近鄰法分類(lèi)。計(jì)算B的第i個(gè)向量τ與奇異值向量SMi之間的距離
di=d(τ,SMi)=||τ-SMi||---(13)]]>若di0=mini(di),]]>則人臉圖像B屬于第i0個(gè)人。
圖1給出了當(dāng)k=30,20,10,5時(shí)由式(2)所得的重建圖像。從圖1可見(jiàn)重建圖像所損失的能量是很小的,且當(dāng)k值越大時(shí)重建圖像越接近原始圖像。在該圖中(a)、(b)、(c)、(d)、(e)分別為原始圖象、k=30、k=20、k=10、k=5五種情況。
圖2是k=30時(shí)原始圖像與各種情況重建圖像的比較。其中,(a)為原始圖像,(b)為交換U與U′、V與V′前k列向量時(shí)圖像,(c)為交換U與U′、V與V′后k列向量時(shí)圖像,(d)為僅交換U與U′的前k列向量圖像。由圖2的(b)(c)可知,最大的k個(gè)奇異值所對(duì)應(yīng)的左、右奇異向量的變化將引起圖像的巨大變化,而圖像對(duì)最小的k個(gè)奇異值所對(duì)應(yīng)的左、右奇異向量的變化是不敏感的;由(d)可知,圖像信息體現(xiàn)在左、右奇異向量中,而并非僅在左或右奇異向量中。
圖3是本專(zhuān)利技術(shù)的流程框圖。
具體實(shí)施例方式下面通過(guò)具體的實(shí)施對(duì)本發(fā)明的技術(shù)方案作進(jìn)一步的描述。
我們?cè)贠RL人臉庫(kù)(http://www.uk.research.att.com/facedatabase.html)上做了實(shí)驗(yàn)。ORL人臉庫(kù)由40個(gè)人,每個(gè)人10幅圖像,共400幅人臉圖像構(gòu)成。圖像的大小為112×92。對(duì)每個(gè)人的10幅圖像有姿態(tài)、表情和臉部細(xì)節(jié)(如是否戴眼鏡)等的變化;對(duì)一些圖像,可能是在不同的時(shí)期獲取的。在實(shí)驗(yàn)中,我們比較了三種方法文[1]基于奇異值向量作為代數(shù)特征的方法、文[5]中的投影系數(shù)向量作為代數(shù)特征的方法及本文提出的方法的識(shí)別精度及所需的運(yùn)行時(shí)間。
具體步驟為1、選擇任意模板圖像A,可以將其進(jìn)行奇異值分解為A≈σ1u1v1T+σ2u2v2T+···+σkukvkT,---(14)]]>其中,σi(i=1,…,r)為A的按從大到小排列的最大的k個(gè)奇異值;u1…,uk,v1…,vk為A的屬于σi的k對(duì)左、右奇異向量。圖像A的大量信息體現(xiàn)在這前k對(duì)向量中。
我們稱(chēng)u1v1T,u2v2T,…,ukvkT為圖像A奇異值分解的基圖像。這樣,式(14)中,模板圖像A是基圖像u1v1T,u2v2T,…,ukvkT的線(xiàn)性組合,其組合系數(shù)即為最大的k個(gè)奇異值σ1,σ2,…,σk。我們將這k個(gè)奇異值視為圖像A的代數(shù)特征。
2、設(shè)B為任意幅圖像,相對(duì)于模板圖像A,可將圖像B表示為基圖像u1v1T,u2v2T,…,ukvkT的線(xiàn)性組合,有B=τ1u1v1T+τ2u2v2T+···+τkukvkT.---(15)]]>式(15)中的組合系數(shù)由下式可得τi=uiTBvi(i=1,···,k)---(16)]]>3、假定訓(xùn)練圖像庫(kù)有c個(gè)人,每個(gè)人有M個(gè)樣本Aj(j=1,2,…,M)。設(shè)每一幅圖像的大小為n×m,p=min(m,n)。
對(duì)第i個(gè)人的樣本圖像,計(jì)算其平均圖像BiBi=1MΣj=1MAj(i=1,2,···,c)---(17)]]>并將其作為第i個(gè)人的模板圖像;4、對(duì)Bi作奇異值分解。并按預(yù)給的門(mén)限值θ確定k值,給出第i個(gè)模板圖像Bi的最大的k個(gè)奇異值所作成的奇異值向量SMi,及對(duì)應(yīng)的k個(gè)基圖像u1v1T,u2v2T,…,ukvkT,并將SMi作為第i個(gè)人的代數(shù)特征;5、對(duì)待識(shí)別的人臉圖像B,將B表示為第i個(gè)模板圖像Bi的基圖像u1v1T,u2v2T,…,ukvkT的線(xiàn)性組合,有B=τ1u1v1T+τ2u2v2T+···+τkukvkT---(18)]]>將組合系數(shù)τ1,τ2,…,τk作為圖像B相對(duì)于Bi的代數(shù)特征,并作向量τ=(τ1,τ2,…,τk)T;6、用最近鄰法分類(lèi)。計(jì)算B的第i個(gè)向量τi與奇異值向量SMi之間的距離di=d(τi,SMi)=||τi-SMi||---(19)]]>若di0=mini(di),]]>則人臉圖像B屬于第i0個(gè)人。
權(quán)利要求
1.本發(fā)明涉及一種計(jì)算復(fù)雜度低的人臉識(shí)別方法,其特征在于包括如下步驟步驟1、選擇任意模板圖像A,可以將其進(jìn)行奇異值分解為A≈σ1u1v1T+σ2u2v2T+···σkukvkT,---(1)]]>其中,σi(i=1,…,r)為A的按從大到小排列的最大的k個(gè)奇異值;u1,…,uk,v1,…,vk為A的屬于σi的k對(duì)左、右奇異向量。圖像A的大量信息體現(xiàn)在這前k對(duì)向量中。我們稱(chēng)u1v1T,u2v2T,…,ukvkT為圖像A奇異值分解的基圖像。這樣,式(1)中,模板圖像A是基圖像u1v1T,u2v2T,…,ukvkT的線(xiàn)性組合,其組合系數(shù)即為最大的k個(gè)奇異值σ1,σ2,…,σk。我們將這k個(gè)奇異值視為圖像A的代數(shù)特征。步驟2、設(shè)B為任意幅圖像,相對(duì)于模板圖像A,可將圖像B表示為基圖像u1v1T,u2v2T,…,ukvkT的線(xiàn)性組合,有B=τ1u1v1T+τ2u2v2T+···+τkukvkT.---(2)]]>式(2)中的組合系數(shù)由下式可得τi=uiTBvi(i=1,···,k)---(3)]]>步驟3、假定訓(xùn)練圖像庫(kù)有e個(gè)人,每個(gè)人有M個(gè)樣本Aj(j=1,2,…,M)。設(shè)每一幅圖像的大小為n×m,p=min(m,n)。對(duì)第i個(gè)人的樣本圖像,計(jì)算其平均圖像BiBi=1MΣj=1MAj(i=1,2,···,c)---(4)]]>并將其作為第i個(gè)人的模板圖像;步驟4對(duì)Bi作奇異值分解。并按預(yù)給的門(mén)限值θ確定k值,給出第i個(gè)模板圖像Bi的最大的k個(gè)奇異值所作成的奇異值向量SMi,及對(duì)應(yīng)的k個(gè)基圖像u1v1T,u2v2T,…,ukvkT,并將SMi作為第i個(gè)人的代數(shù)特征;步驟5對(duì)待識(shí)別的人臉圖像B,將B表示為第i個(gè)模板圖像Bi的基圖像u1v1T,u2v2T,…,ukvkT的線(xiàn)性組合,有B=τ1u1v1T+τ2u2v2T+···+τkukvkT]]>將組合系數(shù)τ1,τ2,…,τk作為圖像B相對(duì)于Bi的代數(shù)特征,并作向量τ=(τ1,τ2,…,τk)T;步驟6用最近鄰法分類(lèi)。計(jì)算B的第i個(gè)向量τ與奇異值向量SMi之間的距離di=d(τ,SMi)=||τ-SMi||]]>若di0=mini(di),]]>則人臉圖像B屬于第i0個(gè)人。
2.如權(quán)利要求1所說(shuō),一種計(jì)算復(fù)雜度低的人臉識(shí)別方法,其特征在于基于奇異值分解的基圖像人臉識(shí)別方法是基于人臉整體特征方法。
全文摘要
本發(fā)明屬于圖像處理、計(jì)算機(jī)視覺(jué)、模式識(shí)別技術(shù)領(lǐng)域。本發(fā)明提供了一種計(jì)算復(fù)雜度低的人臉識(shí)別方法。該法基于奇異值方法,利用模板圖像的基圖像,將圖像展開(kāi)成基圖像的線(xiàn)性表示,提取其組合系數(shù)作為圖像的代數(shù)特征并用于人臉識(shí)別中。本發(fā)明所需的系數(shù)較少,運(yùn)行時(shí)間明顯降低,而且其識(shí)別精度明顯優(yōu)于其他基于奇異值向量作為圖像特征的方法。
文檔編號(hào)G06K9/00GK101075292SQ20061003556
公開(kāi)日2007年11月21日 申請(qǐng)日期2006年5月18日 優(yōu)先權(quán)日2006年5月18日
發(fā)明者羅仁澤, 冉瑞生 申請(qǐng)人:羅仁澤