專利名稱:基于mpeg-7標(biāo)準(zhǔn)的人臉判別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于MPEG-7標(biāo)準(zhǔn)的人臉判別方法,屬于圖像信息處理技術(shù)領(lǐng)域。
背景技術(shù):
隨著現(xiàn)代社會(huì)對(duì)個(gè)人身份認(rèn)證需求的不斷增長,生物特征識(shí)別技術(shù)越來越受到人們的重視。其中,人臉識(shí)別因其非接觸式、隱蔽性好、簡單有效、成本相對(duì)低廉等優(yōu)點(diǎn),在門禁、安保等諸多領(lǐng)域有著廣泛的應(yīng)用。隨著應(yīng)用系統(tǒng)的不斷擴(kuò)展,人臉識(shí)別所利用的人臉圖像樣本庫也不斷膨脹。同時(shí), 為了增加系統(tǒng)識(shí)別的準(zhǔn)確率,對(duì)同一人臉樣本往往需要采集一組圖像數(shù)據(jù)。針對(duì)某些特殊應(yīng)用,可能還需要采集一些局部特征數(shù)據(jù)。這些人臉圖像數(shù)據(jù),往往包含表情、環(huán)境、場景等關(guān)聯(lián)內(nèi)容及語義信息,如何有效的整合和管理這一系列數(shù)據(jù)關(guān)系到整個(gè)應(yīng)用系統(tǒng)的實(shí)際效能。簡單直接的存儲(chǔ)方式一方面效率不高,同時(shí)還增加了后續(xù)查詢識(shí)別時(shí)的算法復(fù)雜度,直接導(dǎo)致整個(gè)應(yīng)用系統(tǒng)性能低下。目錄樹的管理方法雖然能保證同一樣本數(shù)據(jù)的相關(guān)性,但是管理困難,數(shù)據(jù)安全性比較差。另外,針對(duì)不同的應(yīng)用需求,通常會(huì)對(duì)同一人臉圖像庫進(jìn)行相應(yīng)的一系列處理,這些處理往往有很多共通之處。傳統(tǒng)的方法中,這些處理都是一次性的,不可重用。同時(shí),處理中得到的有關(guān)人臉圖像的特征信息也是一次性的,不可重用。例如兩眼距離,眼角距離, 鼻子距離,膚色特征,面部紋理特征等等。因?yàn)槊孔鲆淮巫R(shí)別和檢索,這些特征信息都需要重新計(jì)算,所以系統(tǒng)響應(yīng)慢,效率不高。國際標(biāo)準(zhǔn)化組織(ISO) 1996年10月開始研究并于1998年10月提出,2001年
最終完成并公布MPEG-7-多媒體內(nèi)容描述接口(Multimedia Content Description
Interface),其目標(biāo)就是產(chǎn)生一種描述多媒體內(nèi)容數(shù)據(jù)的標(biāo)準(zhǔn),滿足實(shí)時(shí)、非實(shí)時(shí)以及推-拉應(yīng)用的需求,它既不同于基于波形和基于壓縮的表示方式如MPEG-I和MPEG-2,又不同于基于對(duì)象的表示方式如MPEG-4,而是將對(duì)各種不同類型的多媒體信息進(jìn)行標(biāo)準(zhǔn)化描述,并將該描述與所描述的內(nèi)容相聯(lián)系,以實(shí)現(xiàn)快速有效的搜索。MPEG-7的目標(biāo)是支持多種音頻和視覺的描述,包括自由文本、N維時(shí)空結(jié)構(gòu)、統(tǒng)計(jì)信息、客觀屬性、主觀屬性、生產(chǎn)屬性和組合信息。對(duì)于視覺信息,描述將包括顏色、視覺對(duì)象、紋理、草圖、形狀、體積、空間關(guān)系、運(yùn)動(dòng)及變形等。另外,根據(jù)信息的抽象層次,提供一種描述多媒體材料的方法以便表示不同層次上的用戶對(duì)信息的需求。以視覺內(nèi)容為例,較低抽象層將包括形狀、尺寸、紋理、顏色、運(yùn)動(dòng)(軌道)和位置的描述。對(duì)于音頻的較低抽象層包括音調(diào)、調(diào)式、音速、音速變化、音響空間位置。最高層將給出語義信息如“這是一個(gè)場景 一個(gè)鴨子正躲藏在樹后并有一個(gè)汽車正在幕后通過?!背橄髮优c提取特征的方式有關(guān)許多低層特征能以完全自動(dòng)的方式提取,而高層特征需要更多人的交互作用。MPEG-7還允許依據(jù)視覺描述的查詢?nèi)z索聲音數(shù)據(jù),反之也一樣。MPEG-7支持?jǐn)?shù)據(jù)管理的靈活性、數(shù)據(jù)資源的全球化和互操作性。
MPEG-7標(biāo)準(zhǔn)化的范圍包括一系列的描述子(Descriptor )(描述子是特征的表示法,一個(gè)描述子就是定義特征的語法和語義學(xué));一系列的描述結(jié)構(gòu)(Description Schemes )(詳細(xì)說明成員之間的結(jié)構(gòu)和語義);一種詳細(xì)說明描述結(jié)構(gòu)的語言、描述定義語言(DDL); 一種或多種編碼描述方法。描述子是指用來定義和表達(dá)實(shí)體某一方面特征的句法或語法。 表達(dá)實(shí)體是由特征標(biāo)識(shí)符(如顏色)和數(shù)據(jù)類型(如字符串)等構(gòu)成的。數(shù)據(jù)類型可以是 “復(fù)合”的,既可以由幾個(gè)數(shù)據(jù)類型的組合來構(gòu)成,也可以由數(shù)個(gè)描述子來“描述”一個(gè)特征。 描述結(jié)構(gòu)是由一個(gè)或多個(gè)描述子和描述結(jié)構(gòu)構(gòu)成,描述結(jié)構(gòu)規(guī)定了它們相互關(guān)系的結(jié)構(gòu)和語法。描述結(jié)構(gòu)的一種語言為描述定義語言DDL (Description Definition Language)。 它是一種模式化語言,是對(duì)音視頻數(shù)據(jù)建模結(jié)果的一種表征。DDL規(guī)定了 MPEG的描述工具, 包括描述子和描述結(jié)構(gòu),并提供了把描述子構(gòu)建為描述結(jié)構(gòu)的規(guī)則。DDL同時(shí)也允許定義特殊應(yīng)用中的擴(kuò)展DS.描述工具通過DDL被實(shí)例化,并以文本格式(XML)被描述。MPEG-7規(guī)定一個(gè)用于描述各種不同類型多媒體信息的描述子的標(biāo)準(zhǔn)集合。MPEG-7 標(biāo)準(zhǔn)化將擴(kuò)展現(xiàn)有內(nèi)容識(shí)別專用解決方案的有限的能力,特別是它還包括了更多的數(shù)據(jù)類型。這為能進(jìn)行高效率地進(jìn)行訪問、交互操作和顯示多媒體信息提供了可能。
發(fā)明內(nèi)容
本發(fā)明提出了一種基于MPEG-7標(biāo)準(zhǔn)的人臉判別方法,以MPEG-7標(biāo)準(zhǔn)與XML數(shù)據(jù)交換技術(shù)為基礎(chǔ),利用事先提取好人臉圖像的幾何特征、膚色分布、紋理特性等特征的標(biāo)準(zhǔn)描述信息庫,來對(duì)人臉進(jìn)行快速識(shí)別和檢索。本發(fā)明為解決其技術(shù)問題采用如下技術(shù)方案
一種基于MPEG-7標(biāo)準(zhǔn)的人臉判別方法,包括兩大步驟A、建立人臉圖像索引庫和B、利用人臉圖像索引進(jìn)行檢索識(shí)別;所述建立人臉圖像索引庫包括如下步驟
1)建立一個(gè)人臉圖像庫,利用MPEG-7標(biāo)準(zhǔn),對(duì)人臉圖像庫中元素進(jìn)行分析;
2)提取元素的幾何特征、膚色分布、圖像紋理特性的標(biāo)準(zhǔn)描述信息;
3)對(duì)不同的描述信息,定義各自的特征描述子;
4)根據(jù)實(shí)際系統(tǒng)的情況,追加部分標(biāo)注型的特征描述子;
5)建立XML方式的索引;
6)對(duì)各個(gè)信息,根據(jù)數(shù)據(jù)量的不同,選擇不同的存儲(chǔ)方式;
7)文件名稱、大小的簡單信息類特征,直接記錄于XML索引中;而對(duì)膚色分布、紋理特性的數(shù)據(jù)量較大的信息,選擇外部存儲(chǔ),數(shù)據(jù)庫存儲(chǔ)、網(wǎng)絡(luò)存儲(chǔ)、云存儲(chǔ)方式,XML索引中只記錄存儲(chǔ)方式、存儲(chǔ)位置、讀取方法等存儲(chǔ)信息;
所述利用人臉圖像索引進(jìn)行檢索識(shí)別包括如下步驟
1)對(duì)待檢索對(duì)象的人臉進(jìn)行采樣,視實(shí)際情況,可采用正面人臉圖像采集方式、多角度人臉圖像組采集方式、視頻截取方式及手工素描人臉草圖方式;
2)對(duì)采集好的待測樣本圖像,進(jìn)行預(yù)處理;對(duì)某些樣本,須進(jìn)行圖像重構(gòu),如視頻截取所得人臉圖像;
3)分析樣本圖像,提取其幾何特征、膚色分布、圖像紋理特性的描述信息作為檢索特征提?。?br>
4)以樣本的描述信息為檢索條件,在人臉圖像庫中進(jìn)行檢索;視實(shí)際情況,采取不同的檢索策略,例如采用分層檢索方式首先利用樣本人臉的簡單幾何特征,如瞳孔距離、眼角
4距離、鼻子長度,直接與XML索引記錄的簡單特征信息進(jìn)行比對(duì),篩選出一組數(shù)據(jù)集;對(duì)數(shù)據(jù)集中的元素,通過XML索引,獲得其他詳細(xì)特征信息,與樣本進(jìn)行進(jìn)一步識(shí)別和匹配,最終得到準(zhǔn)確性較高的檢索結(jié)果;
5)針對(duì)不同的情況,選擇不同的檢索特征信息組合進(jìn)行模式匹配,進(jìn)行檢索時(shí),只需利用XML索引,根據(jù)所選的不同存儲(chǔ)策略,就能很快的獲取所需的特征描述信息來進(jìn)行檢索比對(duì)。本發(fā)明的有益效果如下
1.本發(fā)明采用MEPG-7標(biāo)準(zhǔn),描述子標(biāo)準(zhǔn)統(tǒng)一,沒有人為的主觀偏差;人臉圖像數(shù)據(jù)及其特征數(shù)據(jù)由XML索引統(tǒng)一管理,簡單靈活而且數(shù)據(jù)安全性高;而提取人臉圖像的特征描述,只在圖像入庫時(shí)計(jì)算一次,而傳統(tǒng)方法每進(jìn)行一次檢索都必須重新計(jì)算多個(gè)檢索對(duì)象的特征;由于人臉庫中并非記錄人臉圖像的單一特征,所以在檢索時(shí)可以采用多種特征共同檢索的方式,提高了檢索的效率與準(zhǔn)確性。2.相比于傳統(tǒng)方法,這種方法大大的降低了檢索過程中的重復(fù)計(jì)算和系統(tǒng)損耗, 有效的提高了檢索效率和準(zhǔn)確性。本方法因不受單一系統(tǒng)平臺(tái)的限制,具有普適性,故可以應(yīng)用于跨平臺(tái)系統(tǒng)的應(yīng)用之中。同時(shí),本方法具有很好的可擴(kuò)展性,針對(duì)不同的應(yīng)用要求或者人臉識(shí)別方法,添加相應(yīng)的特征描述子即可。
圖1為基于MPEG-7標(biāo)準(zhǔn)的人臉判別方法的流程示意圖。圖2為建立人臉圖像索引庫的流程示意圖。圖3為建立人臉圖像索引庫的算法流程圖。圖4為利用人臉圖像索引進(jìn)行檢索識(shí)別的流程示意圖。圖5為利用人臉圖像索引進(jìn)行檢索識(shí)別的算法流程圖。
具體實(shí)施例方式
下面結(jié)合附圖對(duì)本發(fā)明創(chuàng)造做進(jìn)一步詳細(xì)說明。圖1為基于MPEG-7標(biāo)準(zhǔn)的人臉判別方法,包括兩大步驟A、建立人臉圖像索引庫和B、利用人臉圖像索引進(jìn)行檢索識(shí)別;圖2為建立人臉圖像索引庫的流程示意圖,圖4為利用人臉圖像索引進(jìn)行檢索識(shí)別的流程示意圖。所述的建立人臉圖像索引庫包括如下步驟
1)建立一個(gè)人臉圖像庫,利用MPEG-7標(biāo)準(zhǔn),對(duì)人臉圖像庫中元素進(jìn)行分析;
2)提取元素的幾何特征、膚色分布、圖像紋理特性的標(biāo)準(zhǔn)描述信息;
3)對(duì)不同的描述信息,定義各自的特征描述子;
4)可根據(jù)實(shí)際系統(tǒng)的情況,追加部分標(biāo)注型的特征描述子;
5)建立XML方式的索引;
6)對(duì)各個(gè)信息,根據(jù)數(shù)據(jù)量的不同,選擇不同的存儲(chǔ)方式;
7)文件名稱、大小等簡單信息類特征,直接記錄于XML索引中;而對(duì)膚色分布、紋理特性等數(shù)據(jù)量較大的信息,可選擇外部存儲(chǔ),數(shù)據(jù)庫存儲(chǔ),網(wǎng)絡(luò)存儲(chǔ),云存儲(chǔ)等方式,XML索引中只記錄存儲(chǔ)方式、存儲(chǔ)位置、讀取方法等存儲(chǔ)信息;
所述的利用人臉圖像索引進(jìn)行檢索識(shí)別包括如下步驟
1)對(duì)待檢索對(duì)象的人臉進(jìn)行采樣,視實(shí)際情況,可采用正面人臉圖像采集方式、多角度人臉圖像組采集方式、視頻截取方式及手工素描人臉草圖方式;
2)對(duì)采集好的待測樣本圖像,進(jìn)行預(yù)處理;對(duì)某些樣本,須進(jìn)行圖像重構(gòu),如視頻截取所得人臉圖像;
3)分析樣本圖像,提取其幾何特征、膚色分布、圖像紋理特性的描述信息作為檢索特征提??;
4)以樣本的描述信息為檢索條件,在人臉圖像庫中進(jìn)行檢索;視實(shí)際情況,采取不同的檢索策略,例如采用分層檢索方式首先利用樣本人臉的簡單幾何特征(瞳孔距離、眼角距離、鼻子長度等),直接與XML索引記錄的簡單特征信息進(jìn)行比對(duì),篩選出一組數(shù)據(jù)集;對(duì)數(shù)據(jù)集中的元素,通過XML索引,獲得其他詳細(xì)特征信息,與樣本進(jìn)行進(jìn)一步識(shí)別和匹配,最終得到準(zhǔn)確性較高的檢索結(jié)果;
5)針對(duì)不同的情況,選擇不同的檢索特征信息組合進(jìn)行模式匹配,進(jìn)行檢索時(shí),只需利用XML索引,根據(jù)所選的不同存儲(chǔ)策略,就能很快的獲取所需的特征描述信息來進(jìn)行檢索比對(duì)。圖3為建立人臉圖像索引庫的算法流程圖。采集圖像數(shù)據(jù),對(duì)采集到的人臉數(shù)據(jù)進(jìn)行圖像預(yù)處理和圖像重構(gòu),利用積分投影等算法確定人臉上瞳孔的位置,對(duì)鼻子位置、嘴巴位置進(jìn)行識(shí)別,如果檢測的結(jié)構(gòu)符合五官特征,則人臉特征檢測成功;否則重新采樣。人臉特征檢測成功后,對(duì)人臉特征進(jìn)行細(xì)化,選取兩眼,鼻子,嘴巴作為特征點(diǎn),并計(jì)算兩眼間的距離,左眼與鼻子的距離,右眼與鼻子的距離,左眼與嘴唇的距離,右眼與嘴唇的距離以及鼻子與嘴唇的距離,作為人臉圖像的特征描述子,對(duì)各個(gè)信息,根據(jù)數(shù)據(jù)量的不同,選擇不同的存儲(chǔ)方式,對(duì)提取好的特征信息,建立XML索引。
圖5為利用人臉圖像索引進(jìn)行檢索識(shí)別的算法流程圖。當(dāng)人臉特征索引庫構(gòu)建成功后,即可根據(jù)待比較圖像中人臉的特征信息與現(xiàn)有人臉特征庫中所存的人臉特征信息進(jìn)行比對(duì),看是否小于閥值,如果是,則識(shí)別成功;否則就識(shí)別失敗。檢索時(shí),采用簡化的卡方統(tǒng)計(jì)距方法來計(jì)算兩個(gè)人臉圖像的相似度。D (Α, B) = Σ i ( |Ai-Bi I/ (Ai+Bi)) 式中
A,B為要比對(duì)的人臉樣本; Σ為求和符號(hào);
Ai, Bi為人臉樣本的第i個(gè)特征信息。
權(quán)利要求
1. 一種基于MPEG-7標(biāo)準(zhǔn)的人臉判別方法,其特征在于,包括兩大步驟A、建立人臉圖像索引庫和B、利用人臉圖像索引進(jìn)行檢索識(shí)別;所述建立人臉圖像索引庫包括如下步驟1)建立一個(gè)人臉圖像庫,利用MPEG-7標(biāo)準(zhǔn),對(duì)人臉圖像庫中元素進(jìn)行分析;2)提取元素的幾何特征、膚色分布、圖像紋理特性的標(biāo)準(zhǔn)描述信息;3)對(duì)不同的描述信息,定義各自的特征描述子;4)根據(jù)實(shí)際系統(tǒng)的情況,追加部分標(biāo)注型的特征描述子;5)建立XML方式的索引;6)對(duì)各個(gè)信息,根據(jù)數(shù)據(jù)量的不同,選擇不同的存儲(chǔ)方式;7)文件名稱、大小的簡單信息類特征,直接記錄于XML索引中;而對(duì)膚色分布、紋理特性的數(shù)據(jù)量較大的信息,選擇外部存儲(chǔ),數(shù)據(jù)庫存儲(chǔ)、網(wǎng)絡(luò)存儲(chǔ)、云存儲(chǔ)方式,XML索引中只記錄存儲(chǔ)方式、存儲(chǔ)位置、讀取方法等存儲(chǔ)信息;所述利用人臉圖像索引進(jìn)行檢索識(shí)別包括如下步驟1)對(duì)待檢索對(duì)象的人臉進(jìn)行采樣,視實(shí)際情況,可采用正面人臉圖像采集方式、多角度人臉圖像組采集方式、視頻截取方式及手工素描人臉草圖方式;2)對(duì)采集好的待測樣本圖像,進(jìn)行預(yù)處理;對(duì)某些樣本,須進(jìn)行圖像重構(gòu),如視頻截取所得人臉圖像;3)分析樣本圖像,提取其幾何特征、膚色分布、圖像紋理特性的描述信息作為檢索特征提取;4)以樣本的描述信息為檢索條件,在人臉圖像庫中進(jìn)行檢索;視實(shí)際情況,采取不同的檢索策略,例如采用分層檢索方式首先利用樣本人臉的簡單幾何特征,如瞳孔距離、眼角距離、鼻子長度,直接與XML索引記錄的簡單特征信息進(jìn)行比對(duì),篩選出一組數(shù)據(jù)集;對(duì)數(shù)據(jù)集中的元素,通過XML索引,獲得其他詳細(xì)特征信息,與樣本進(jìn)行進(jìn)一步識(shí)別和匹配,最終得到準(zhǔn)確性較高的檢索結(jié)果;5)針對(duì)不同的情況,選擇不同的檢索特征信息組合進(jìn)行模式匹配,進(jìn)行檢索時(shí),只需利用XML索引,根據(jù)所選的不同存儲(chǔ)策略,就能很快的獲取所需的特征描述信息來進(jìn)行檢索比對(duì)。
全文摘要
本發(fā)明涉及一種基于MPEG-7標(biāo)準(zhǔn)的人臉判別方法,屬于圖像信息處理技術(shù)領(lǐng)域。該人臉判別方法,包括兩大步驟A、建立人臉圖像索引庫和B、利用人臉圖像索引進(jìn)行檢索識(shí)別。采用本方法對(duì)人臉圖像識(shí)別判斷,簡單靈活而且數(shù)據(jù)安全性高,具有普適性和可擴(kuò)展性。
文檔編號(hào)G06K9/00GK102226908SQ201110141718
公開日2011年10月26日 申請(qǐng)日期2011年5月30日 優(yōu)先權(quán)日2011年5月30日
發(fā)明者秦亞卓, 陳國慶 申請(qǐng)人:蘇州兩江科技有限公司