專利名稱:一種基于流形距離分析的視覺對(duì)象識(shí)別方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視覺對(duì)象識(shí)別領(lǐng)域,特別是涉及一種基于流形距離分析的視覺 對(duì)象識(shí)別方法和裝置。
背景技術(shù):
模式識(shí)別是一種從大量信息和數(shù)據(jù)出發(fā),在專家經(jīng)驗(yàn)和已有認(rèn)識(shí)的基礎(chǔ) 上,利用計(jì)算機(jī)和數(shù)學(xué)推理的方法對(duì)形狀、模式、曲線、數(shù)字、字符格式和圖 形自動(dòng)完成識(shí)別的過程。視覺對(duì)象識(shí)別作為模式識(shí)別的主要應(yīng)用領(lǐng)域之一,在 諸如人臉識(shí)別、身份識(shí)別等方面正發(fā)揮著越來越重要的作用。
在^L覺對(duì)象識(shí)別領(lǐng)域,通常關(guān)注的對(duì)象都^皮從少量的樣本中進(jìn)行訓(xùn)練。隨 著視頻攝像頭及大容量多媒體數(shù)據(jù)存儲(chǔ)技術(shù)的快速發(fā)展,用于對(duì)象模式識(shí)別的 數(shù)據(jù)量也在不斷增長,從而用于訓(xùn)練的對(duì)象的圖像數(shù)量也變得很大。在這種情 況下,視覺對(duì)象識(shí)別已經(jīng)發(fā)展成基于一個(gè)對(duì)象圖片集合的訓(xùn)練及在一個(gè)圖像庫 中進(jìn)行尋找的狀況。媒體數(shù)據(jù)的巨大以及不同圖像數(shù)據(jù)之間的關(guān)系的復(fù)雜性增 加了視覺對(duì)象識(shí)別的難度,從而對(duì)視覺對(duì)象識(shí)別技術(shù)提出了新的挑戰(zhàn)。近年來 很多方法關(guān)注于應(yīng)用流形對(duì)視覺對(duì)象集合進(jìn)行建模,通過對(duì)流形之間的距離比 較分析進(jìn)行視覺對(duì)象識(shí)別。
流形是指抽象的彎曲空間中的一個(gè)超曲面,它在局部具有歐氏幾何結(jié)構(gòu)。 流形中的一個(gè)點(diǎn)可以用可變參數(shù)的一組特定值來表示,而所有的這些點(diǎn)的全體 構(gòu)成流形本身,可變參數(shù)稱為流形的坐標(biāo)。通常,流形是由高維數(shù)據(jù)組成的高 維空間中的圖形,將高維的流形降低維數(shù)得到的低維數(shù)據(jù)稱作流形的子空間, 流形中的點(diǎn)就是高維空間中的點(diǎn)。如果把單個(gè)圖像樣本看作流形中的一個(gè)點(diǎn), 那么流形的子空間就是由流形的部分樣本組成的具有局部線性特征的部分。在 視覺對(duì)象識(shí)別中,識(shí)別的勤出是視覺對(duì)象的相似度, 一種簡單的相似度可用區(qū) 域特征空間中的距離來定義。具體到流形,就是用流形之間的距離來定義相似
度,流形之間的距離越小,相似度就越高;距離越大,相似度越低。將被檢索
的對(duì)象圖片集合看作一個(gè)流形,將用于檢索的對(duì)象圖片集合視為另外的流形, 則視覺對(duì)象識(shí)別可被認(rèn)為是找出多個(gè)流形之間相似度最高的目標(biāo)對(duì)象的過程。
美國電氣及電子工程師學(xué)會(huì)計(jì)算機(jī)視覺及模式識(shí)別國際會(huì)議2008年會(huì)論 文集(In Proceedings of IEEE International Conference on Computer Vision and Pattern Recognition 2008 )中的名為"流形距離在基于圖像集的人臉識(shí)別中的應(yīng) 用"(Manifold-Manifold Distance With Application to Face Recognition based on Image Set)的論文公布了一種最新的流形距離分析方法,該方法通過定義流形 中點(diǎn)和點(diǎn)的距離,點(diǎn)和子空間之間的距離,子空間和子空間之間的距離以及點(diǎn) 和流形之間的距離,從而得到流形和流形之間的距離,最后基于流形距離分析 識(shí)別視覺對(duì)象。該方法對(duì)媒體數(shù)據(jù)具有較高的敏感性,可以有效處理大量、復(fù) 雜的視覺對(duì)象媒體數(shù)據(jù)。但是,該方法提供的流形距離分析方法只關(guān)注兩個(gè)流 形之間最相近部分的距離,且將其做為通用的流形距離。這樣做雖然簡化了流 形距離計(jì)算,但因?yàn)?,流形之間最相近部分的距離往往對(duì)噪聲數(shù)據(jù)非常敏感, 當(dāng)兩個(gè)流形中由于噪聲數(shù)據(jù)的影響使得其具有較近的子空間時(shí),則流形距離計(jì) 算分析容易產(chǎn)生錯(cuò)誤的結(jié)果,從而導(dǎo)致視覺對(duì)象的誤識(shí)別。
總之,需要本領(lǐng)域技術(shù)人員迫切解決的一個(gè)技術(shù)問題就是如何能夠有效 降低流形距離分析過程中對(duì)噪聲數(shù)據(jù)的敏感程度,提高視覺對(duì)象識(shí)別率。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種基于流形距離分析的視覺對(duì)象識(shí) 別方法和裝置,能夠有效降低流形距離分析過程中對(duì)噪聲數(shù)據(jù)的敏感程度,提 高一見覺對(duì)象識(shí)別率。
為了解決上述問題,本發(fā)明實(shí)施例提供了一種基于流形距離分析的視覺對(duì) 象識(shí)別方法,包括
依據(jù)待識(shí)別視覺對(duì)象數(shù)據(jù)構(gòu)造一個(gè)非線性的待識(shí)別對(duì)象流形,以及,依據(jù) 已知視覺對(duì)象數(shù)據(jù)構(gòu)造一個(gè)或多個(gè)非線性的已知對(duì)象流形;
將所述待識(shí)別對(duì)象流形和已知對(duì)象流形從高維降維到低維的子空間;
提取所述待識(shí)別對(duì)象流形每一個(gè)子空間的特征數(shù)據(jù),以及,所述已知對(duì)象
流形每一個(gè)子空間的特征數(shù)據(jù);
計(jì)算所述待識(shí)別對(duì)象流形每一個(gè)子空間與已知對(duì)象流形每一個(gè)子空間的 距離,進(jìn)而獲得所述待識(shí)別對(duì)象流形和已知對(duì)象流形的距離;
當(dāng)所述待識(shí)別對(duì)象流形和已知對(duì)象流形的距離滿足識(shí)別條件時(shí),則將所述 已知對(duì)象流形對(duì)應(yīng)的對(duì)象確定為待視別視覺對(duì)象。
優(yōu)選的,所述將流形從高維降維到低維的子空間為通過應(yīng)用局部線性嵌入 方法進(jìn)行降維。
優(yōu)選的,所述每一個(gè)子空間的特征數(shù)據(jù)為每一個(gè)子空間的標(biāo)準(zhǔn)正交基。 優(yōu)選的,所述待識(shí)別對(duì)象流形每一個(gè)子空間與已知對(duì)象流形每一個(gè)子空間
的距離為所述子空間的標(biāo)準(zhǔn)正交基之間的距離。
優(yōu)選的,所述待識(shí)別對(duì)象流形和已知對(duì)象流形的距離為基于子空間的距離
的豪斯多夫距離。
相應(yīng)的,本發(fā)明實(shí)施例還提供了一種基于流形距離分析的視覺對(duì)象識(shí)別裝 置,包括
流形構(gòu)造模塊,用于依據(jù)待識(shí)別視覺對(duì)象數(shù)據(jù)構(gòu)造一個(gè)非線性的待識(shí)別對(duì) 象流形,以及,依據(jù)已知視覺對(duì)象數(shù)據(jù)構(gòu)造一個(gè)或多個(gè)非線性的已知對(duì)象流形;
子空間構(gòu)造模塊,用于將所述待識(shí)別對(duì)象流形和已知對(duì)象流形從高維降維 到低維的子空間;
特征數(shù)據(jù)提取模塊,用于提取所述待識(shí)別對(duì)象流形每一個(gè)子空間的特征數(shù) 據(jù),以及,所述已知對(duì)象流形每一個(gè)子空間的特征數(shù)據(jù);
距離計(jì)算模塊,用于計(jì)算所述待識(shí)別對(duì)象流形每一個(gè)子空間與已知對(duì)象流 形每一個(gè)子空間的距離,進(jìn)而獲得所述待識(shí)別對(duì)象流形和已知對(duì)象流形的距
離;
識(shí)別條件判斷模塊,用于判斷所述待識(shí)別對(duì)象流形和已知對(duì)象流形的距離
是否滿足識(shí)別條件;
對(duì)象識(shí)別模塊,用于當(dāng)識(shí)別條件判斷模塊的結(jié)果為是時(shí),則將所述已知對(duì)
象流形對(duì)應(yīng)的對(duì)象確定為待視別視覺對(duì)象。優(yōu)選的,所述距離計(jì)算模塊進(jìn)一步包括子空間距離計(jì)算子模塊,用于計(jì)算所述待識(shí)別對(duì)象流形每一個(gè)子空間與已 知對(duì)象流形每一個(gè)子空間的距離;流形距離計(jì)算子模塊,用于依據(jù)子空間距離計(jì)算子模塊獲得的子空間距 離,計(jì)算待識(shí)別對(duì)象流形和已知對(duì)象流形的距離。優(yōu)選的,所述將流形從高維降維到低維的子空間為通過應(yīng)用局部線性嵌入 方法進(jìn)行降維。優(yōu)選的,所述每一個(gè)子空間的特征數(shù)據(jù)為每一個(gè)子空間的標(biāo)準(zhǔn)正交基。 優(yōu)選的,所述待識(shí)別對(duì)象流形每一個(gè)子空間與已知對(duì)象流形每一個(gè)子空間的距離為所述子空間的標(biāo)準(zhǔn)正交基之間的距離。優(yōu)選的,所述待識(shí)別對(duì)象流形和已知對(duì)象流形的距離為基于子空間的距離的豪斯多夫距離。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)首先,本發(fā)明對(duì)待識(shí)別對(duì)象流形和已知對(duì)象流形的所有子空間的距離進(jìn)行 了比較分析,綜合考慮了流形之間的整體位置關(guān)系,因此對(duì)噪聲數(shù)據(jù)不敏感, 在存在一定噪聲的情況下仍能獲得較好的效果,而且對(duì)流形之間距離的比較分 析更加有效。其次,本發(fā)明通過計(jì)算每一個(gè)子空間的標(biāo)準(zhǔn)正交基提取該子空間的特征數(shù) 據(jù),進(jìn)而計(jì)算子空間之間的距離,與其它子空間距離計(jì)算方法相比,如主成分 角(Principal angels)法只適用于兩個(gè)子空間維數(shù)相同情況下的距離計(jì)算,該 方法即使兩個(gè)子空間維數(shù)不相等,仍然可以有效計(jì)算子空間之間的距離,且使 用標(biāo)準(zhǔn)正交基提取子空間的特征數(shù)據(jù)計(jì)算方法簡便,計(jì)算復(fù)雜度低,設(shè)計(jì)簡單, 易于實(shí)現(xiàn)。
圖l是本發(fā)明的一種基于流形距離分析的視覺對(duì)象識(shí)別方法實(shí)施例1的步
驟流程圖;圖2是本發(fā)明的一種基于流形距離分析的視覺對(duì)象識(shí)別方法實(shí)施例2的步 驟流程圖;圖3是本發(fā)明的一種基于流形距離分析的視覺對(duì)象識(shí)別裝置實(shí)施例的結(jié) 構(gòu)框圖;圖4是本發(fā)明應(yīng)用圖2所示的裝置實(shí)施例進(jìn)行一見覺對(duì)象識(shí)別的步驟流程圖。
具體實(shí)施方式
為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式
對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說明。本發(fā)明實(shí)施例的核心構(gòu)思之一在于,通過對(duì)待識(shí)別對(duì)象流形和已知對(duì)象流 形的所有子空間的距離進(jìn)行比較分析,綜合考慮流形之間的整體位置關(guān)系,使 視覺對(duì)象識(shí)別過程對(duì)噪聲數(shù)據(jù)不敏感,取得較好的識(shí)別效果。參考圖1,示出了本發(fā)明一種基于流形距離分析的視覺對(duì)象識(shí)別方法實(shí)施 例l的步驟流程圖,具體可以包括以下步驟步驟101:依據(jù)待識(shí)別視覺對(duì)象數(shù)據(jù)構(gòu)造一個(gè)非線性的待識(shí)別對(duì)象流形, 依據(jù)已知視覺對(duì)象數(shù)據(jù)構(gòu)造一個(gè)或多個(gè)非線性的已知對(duì)象流形;流形是現(xiàn)代數(shù)學(xué)的概念,在實(shí)際應(yīng)用中,流形可以視為近看起來像歐氏空 間或其他相對(duì)簡單的空間的物體。例如人們?cè)?jīng)以為地球是平坦的,因?yàn)槲?們相對(duì)于地^M艮小,這是一個(gè)可以理解的,支象。所以, 一個(gè)理想的數(shù)學(xué)上的J求 在足夠小的區(qū)域也象一個(gè)線性的平面,這使它成為 一個(gè)局部線性的流形。在視覺對(duì)象識(shí)別中,通常一個(gè)對(duì)象的一組相關(guān)圖像被^L為一個(gè)流形。這是 因?yàn)?,同一個(gè)對(duì)象在不同距離、不同方向或不同姿態(tài)和光照強(qiáng)度下,能夠形成 多種不同的圖像。 一個(gè)對(duì)象所有圖像的集合可以看做是以位置、尺度、姿態(tài)、 光照等為參數(shù)的一個(gè)高維空間流形,且這組圖像因?yàn)槎际顷P(guān)于同 一個(gè)對(duì)象的因 而具有較強(qiáng)的相關(guān)性。如果每一個(gè)像素均對(duì)應(yīng)于空間中的一維,那么一幅圖像 就可以看做高維圖像抽象空間中的 一個(gè)點(diǎn), 一個(gè)對(duì)象在不同方向上所有圖像的
集合就是圖像空間中的一個(gè)連續(xù)流形。因此,在本實(shí)施例中,可以以一組同一待識(shí)別視覺對(duì)象的相關(guān)圖像構(gòu)造待識(shí)別對(duì)象流形;而以可供用來識(shí)別的其他一組或多組已知視覺對(duì)象的相關(guān)圖像構(gòu)造一個(gè)或多個(gè)非線性的已知對(duì)象流形。需要說明的是, 一個(gè)流形可以以不同方式構(gòu)造,如圖集、貼補(bǔ)、函數(shù)的零 點(diǎn)集等,在應(yīng)用時(shí),本領(lǐng)域技術(shù)人員可根據(jù)需要選擇合適的方法,本發(fā)明無須 對(duì)此作出限制。步驟102:將所述待識(shí)別對(duì)象流形和已知對(duì)象流形從高維降維到低維的子 空間;在視覺對(duì)象識(shí)別過程中,往往面臨龐大的高維數(shù)據(jù)量。這些高維數(shù)據(jù)一方 面提供了有關(guān)描述對(duì)象的極其豐富、詳細(xì)的信息,但另一方面,這些數(shù)據(jù)通常 包含許多冗余。在通常情況下,首先將數(shù)據(jù)的維數(shù)降低到一個(gè)合理的大小,同 時(shí)盡可能多的保留原始的信息,然后再對(duì)降維后的數(shù)據(jù)進(jìn)行處理是一個(gè)行之有 效的方法。但要在保證數(shù)據(jù)信息足夠完整的條件下合理地約簡數(shù)據(jù)集,是一個(gè) 嚴(yán)峻的挑戰(zhàn)。以往大多使用線性方法(如維數(shù)約簡中的線性主成分分析(PCA) 等),通過特征的線性組合來降維,其本質(zhì)是把數(shù)據(jù)投影到線性子空間,這種 方法相對(duì)筒單且容易計(jì)算。但是,由于視覺對(duì)象識(shí)別中的流形是非線性的,因 此線性方法不能有效地處理龐大的高維非線性流形的數(shù)據(jù)。局部線性嵌入法 (Locally Linear Embedding, LLE )是多種非線性降維方法中的一種,該方法 主要利用局部的線性來逼近全局的非線性,保持局部的幾何結(jié)構(gòu)不變,通過相 互重疊的局部鄰域來提供整體的信息,從而保持整體的幾何性質(zhì)。LLE方法采 用由N個(gè)D維向量組成的矩陣XoxN作為輸入,輸出則是一個(gè)由N個(gè)d維向量 (cK〈D)組成的矩陣YdxN。矩陣Y的第k列對(duì)應(yīng)的是矩陣X中的第k列。因?yàn)長LE算法能夠計(jì)算出較好的低維線性子空間,本實(shí)施例使用此方法 將所述待識(shí)別對(duì)象流形和已知對(duì)象流形從高維降維到低維的子空間。當(dāng)然,本 領(lǐng)域技術(shù)人員也可以采用其它的非線性降維方法如保距映射法、拉普拉斯特征 映射法等對(duì)高維流形進(jìn)行降維,本發(fā)明無須對(duì)此作出限制。步驟103:提取所述待識(shí)別對(duì)象流形每一個(gè)子空間的特征數(shù)據(jù),以及所述已知對(duì)象流形每一個(gè)子空間的特征數(shù)據(jù);一個(gè)子空間的特征數(shù)據(jù)較好地反映了 一個(gè)子空間的特征,可以作為這個(gè)子 空間的代表性數(shù)據(jù)。本實(shí)施例通過計(jì)算每一個(gè)子空間的標(biāo)準(zhǔn)正交基的方式提取 所述待識(shí)別對(duì)象流形每一個(gè)子空間的特征數(shù)據(jù)和已知對(duì)象流形每一個(gè)子空間 的特征數(shù)據(jù)。當(dāng)然,本領(lǐng)域技術(shù)人員也可以根據(jù)需要采用其它適用的方式。步驟104:計(jì)算所述待識(shí)別對(duì)象流形每一個(gè)子空間與已知對(duì)象流形每一個(gè) 子空間的距離;本實(shí)施例依據(jù)步驟103中得到的每一個(gè)子空間的標(biāo)準(zhǔn)正交基計(jì)算子空間 的距離。以待識(shí)別對(duì)象流形的一個(gè)子空間和一個(gè)已知對(duì)象流形的一個(gè)子空間為 例,4叚設(shè)待識(shí)別對(duì)象流形M,和已知對(duì)象流形M2的兩個(gè)子空間分別為t/和r , 其中C/為9^中的m維子空間,r為f中的n維子空間,f/的標(biāo)準(zhǔn)正交基為 A,"2,...,^ , r的標(biāo)準(zhǔn)正交基為v,,v^...,、,則子空間和f之間的距離為它們的 標(biāo)準(zhǔn)正交基之間的距離,其計(jì)算方法為若已知對(duì)象流形為多個(gè),可采用相同方法計(jì)算待識(shí)別對(duì)象流形和不同已知 對(duì)象流形子空間之間的距離。需要說明的是,本領(lǐng)域技術(shù)人員可采用其它方法計(jì)算子空間之間的距離, 如核方法,本發(fā)明無須對(duì)此作出限制。步驟105:依據(jù)所述待識(shí)別對(duì)象流形每一個(gè)子空間與已知對(duì)象流形每一個(gè) 子空間的距離,獲得待識(shí)別對(duì)象流形和已知對(duì)象流形的距離;本步驟以d(C/p, ^ )表示由步驟104計(jì)算出的待識(shí)別對(duì)象流形的子空間與 已知對(duì)象流形m2的子空間的距離,其中和&分別是來自所述m,和m2兩個(gè) 流型的第;?個(gè)和第《個(gè)子空間,應(yīng)用豪斯多夫(Hausdorff)距離分析方法對(duì)流 型M^口M2進(jìn)行距離計(jì)算。Hausdorff距離是一種定義于兩個(gè)點(diǎn)集上的最大最小(max-min)距離,給定 有限的兩個(gè)點(diǎn)集A和B, A和B之間的Hausdorff距離定義為
式中,<formula>formula see original document page 11</formula>h(A,B)稱有向Hausdorff距離。如果/^,"=^,則每一個(gè)」中的點(diǎn)離5中 至少一個(gè)點(diǎn)的距離不大于A而且對(duì)于X中某些(至少一個(gè))點(diǎn)來說,這個(gè)距 離恰好是d,這些點(diǎn)就是"最不匹配點(diǎn)"。所以Hausdorff距離表征了兩個(gè)點(diǎn)集 之間的最不相似程度,把它作為相似性度量必須使它最小化。本實(shí)施例使用Hausdorff距離分析方法,以子空間距離取代點(diǎn)集距離,計(jì) 算所述M,和M2兩個(gè)流型的距離,具體方法如下D(M, , M,) = max min 4"丄)待識(shí)別對(duì)象流形M,和其它已知對(duì)象流形M,的距離計(jì)算可依照上述方法進(jìn) 行。其中,t的取值范圍為從2到n+l, n為已知對(duì)象流形的個(gè)數(shù)。本領(lǐng)域技術(shù)人員也可根據(jù)其熟悉的其它方法計(jì)算流形之間的距離,本發(fā)明 無須對(duì)此作出限制。步驟106:判斷所述待識(shí)別對(duì)象流形和已知對(duì)象流形的距離是否滿足識(shí)別 條件,若是,則將滿足條件的已知對(duì)象流形對(duì)應(yīng)的對(duì)象確定為待識(shí)別視覺對(duì)象; 若否,則已知對(duì)象流形對(duì)應(yīng)的對(duì)象不為待識(shí)別視覺對(duì)象。本實(shí)施例以流形之間的距離作為度量流形相似度的標(biāo)準(zhǔn),兩個(gè)流形之間距 離越小則相似度越高;反之,距離越大,相似度越低。當(dāng)相似度滿足一定的條 件,即流形之間的距離符合一定的識(shí)別條件時(shí),則認(rèn)為已知對(duì)象流形與待識(shí)別 對(duì)象流形相似,已知對(duì)象流形對(duì)應(yīng)的對(duì)象為待識(shí)別視覺對(duì)象;若否,則已知對(duì) 象流形對(duì)應(yīng)的對(duì)象不為待識(shí)別視覺對(duì)象。其中,識(shí)別條件可根據(jù)實(shí)際需要情況 由本領(lǐng)域技術(shù)人員合理設(shè)置,本發(fā)明無須對(duì)此作出限制。需要說明的是,本方法實(shí)施例為了簡單描述,將其表述為一系列的動(dòng) 作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序 的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其 次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí) 施例,所涉及的動(dòng)作和模塊并不 一 定是本發(fā)明所必須的。
參考圖2,示出了本發(fā)明的一種基于流形距離分析的視覺對(duì)象識(shí)別方法實(shí)施例2的步驟流程圖,該實(shí)施例將本發(fā)明的視覺對(duì)象識(shí)別方法應(yīng)用于CMU Mobo數(shù)據(jù)庫進(jìn)行人臉識(shí)別。CMU(Carnegie Mellon University)的MoBo( Motion of Body)數(shù)據(jù)庫是CMU大學(xué)機(jī)器人研究所提供的用于人臉識(shí)別研究的數(shù)據(jù) 庫,該數(shù)據(jù)庫包含了 24個(gè)對(duì)象的96段一見頻序列,每個(gè)視頻序列包含300幀圖 像。每個(gè)人臉圖像的大小均為30x30。對(duì)于每個(gè)人臉對(duì)象,應(yīng)用其中一個(gè)作為 檢索對(duì)象,其他的所有數(shù)據(jù)作為測試數(shù)據(jù)。
本實(shí)施例具體可以包括以下步驟
步驟201:將與待識(shí)別人臉的有關(guān)的一組相關(guān)圖像數(shù)據(jù)構(gòu)造成一個(gè)非線性 的待識(shí)別人臉流形,其它每組相關(guān)人臉數(shù)據(jù)構(gòu)造成多個(gè)非線性的已知人臉流 形;
步驟202:使用LLE方法將所述待識(shí)別人臉流形和已知人臉流形從高維降 維到低維的子空間;
步驟203:計(jì)算所述待識(shí)別人臉流形每一個(gè)子空間的標(biāo)準(zhǔn)正交基,以及所 述已知人臉流形每一個(gè)子空間的標(biāo)準(zhǔn)正交基;
本步驟通過計(jì)算每一個(gè)子空間的標(biāo)準(zhǔn)正交基提取它的特征數(shù)據(jù)。
步驟204:計(jì)算待識(shí)別人臉流形每一個(gè)子空間與已知人臉流形每一個(gè)子空 間的標(biāo)準(zhǔn)正交基之間的距離;
計(jì)算方法為<formula>formula see original document page 12</formula>
其中d(Up, Vq)表示待識(shí)別人臉流形的子空間與某個(gè)已知人臉流形的子空 間的距離,其中Up和Vq分別是來自所述待識(shí)別人臉流形和已知人臉流型的第p 個(gè)和第q個(gè)子空間,Up為W中的m維子空間,Vq為9^中的n維子空間,Up的 標(biāo)準(zhǔn)正交基為u1,u2,...,um , Vq的標(biāo)準(zhǔn)正交基為v1,V2,…,vn 。步驟205:依據(jù)所述待識(shí)別人臉流形每一個(gè)子空間與已知人臉流形每一個(gè) 子空間的距離,獲得待識(shí)別人臉流形和已知人臉流形的Hausdorff距離;
應(yīng)用Hausdorf距離分析方法,以子空間的距離取代點(diǎn)集距離,計(jì)算流型之間的Hausdorff距離,具體方法如下D(M"M,—max-min4"",K) , H2,…,n+1)其中,t的取值范圍為從2到n+l, n為已知對(duì)象流形的個(gè)數(shù)。 步驟206:判斷所述待識(shí)別人臉流形和已知人臉流形的Hausdorff距離是 否滿足識(shí)別條件,若是,則將滿足條件的已知人臉流形對(duì)應(yīng)的人臉確定為待識(shí) 別人臉對(duì)象;若否,則已知人臉流形對(duì)應(yīng)的人臉不為待識(shí)別人臉對(duì)象。本實(shí)施例應(yīng)用于CMU MoBo數(shù)據(jù)庫人臉識(shí)別試驗(yàn)的結(jié)果及與傳統(tǒng)人臉識(shí) 別算法的比較如下表所示本發(fā)明的方法EigenfaceFisherface識(shí)別率89.3%80.5%86.7%可以看出,本實(shí)施例在人臉識(shí)別的平均識(shí)別率上,與傳統(tǒng)方法相比,能取 得更好的效果。需要說明的是,本實(shí)施例描述的是實(shí)施例1的視覺對(duì)象識(shí)別方法在CMU MoBo數(shù)據(jù)庫中的具體應(yīng)用,因此描述較為筒略,相關(guān)部分參見實(shí)施例1即可。參考圖3,示出了本發(fā)明的一種基于流形距離分析的視覺對(duì)象識(shí)別裝置 實(shí)施例的結(jié)構(gòu)框圖,可以包括流形構(gòu)造模塊301,用于依據(jù)待識(shí)別視覺對(duì)象數(shù)據(jù)構(gòu)造一個(gè)非線性的待識(shí) 別對(duì)象流形,以及,依據(jù)已知視覺對(duì)象數(shù)據(jù)構(gòu)造一個(gè)或多個(gè)非線性的已知對(duì)象 流形;子空間構(gòu)造模塊302,用于將所述待識(shí)別對(duì)象流形和已知對(duì)象流形從高維 降維到^[氐維的子空間;優(yōu)選的,本實(shí)施例通過應(yīng)用局部線性嵌入方法對(duì)流形進(jìn)行降維。 特征數(shù)據(jù)提取模塊303,用于提取所述待識(shí)別對(duì)象流形每一個(gè)子空間的特 征數(shù)據(jù),以及,所述已知對(duì)象流形每一個(gè)子空間的特征數(shù)據(jù);優(yōu)選的,所述每一個(gè)子空間的特征數(shù)據(jù)為每一個(gè)子空間的標(biāo)準(zhǔn)正交基。 距離計(jì)算模塊304,用于計(jì)算所述待識(shí)別對(duì)象流形每一個(gè)子空間與已知對(duì)
象流形每一個(gè)子空間的距離,并獲得所述待識(shí)別對(duì)象流形和已知對(duì)象流形的距離;優(yōu)選的,所述待識(shí)別對(duì)象流形每一個(gè)子空間與已知對(duì)象流形每一個(gè)子空間 的距離為所述子空間的標(biāo)準(zhǔn)正交基之間的距離。優(yōu)選的,所述待識(shí)別對(duì)象流形和已知對(duì)象流形的距離為基于子空間的距離 的豪斯多夫距離。識(shí)別條件判斷模塊305,用于判斷所述待識(shí)別對(duì)象流形和已知對(duì)象流形的距離是否滿足識(shí)別條件;對(duì)象識(shí)別模塊306,用于如果識(shí)別條件判斷模塊的結(jié)果為是,則將所述已 知對(duì)象流形對(duì)應(yīng)的對(duì)象確定為纟寺一見別纟見覺對(duì)象。優(yōu)選的,距離計(jì)算模塊304還可以進(jìn)一步包括子空間距離計(jì)算子模塊3041,用于計(jì)算所述待識(shí)別對(duì)象流形每一個(gè)子空 間與已知對(duì)象流形每一個(gè)子空間的距離;流形距離計(jì)算子模塊3042,用于依據(jù)子空間距離計(jì)算子模塊獲得的子空 間距離,計(jì)算待識(shí)別對(duì)象流形和已知對(duì)象流形的距離。參考圖4,示出了本發(fā)明應(yīng)用圖3所示的裝置實(shí)施例進(jìn)行視覺對(duì)象識(shí)別 的步驟流程圖,具體可以包括以下步驟步驟401:流形構(gòu)造模塊依據(jù)待識(shí)別視覺對(duì)象數(shù)據(jù)構(gòu)造一個(gè)非線性的待識(shí) 別對(duì)象流形,依據(jù)已知視覺對(duì)象數(shù)據(jù)構(gòu)造一個(gè)或多個(gè)非線性的已知對(duì)象流形;流形構(gòu)造模塊依據(jù)不同對(duì)象的相關(guān)圖像構(gòu)造不同的流形。步驟402:子空間構(gòu)造模塊將所述待識(shí)別對(duì)象流形和已知對(duì)象流形從高維 降維到低維的子空間;本實(shí)施例中,子空間構(gòu)造^t塊應(yīng)用局部線性嵌入方法對(duì)流形進(jìn)^f亍降維,將 流形從高維降維到低維的子空間。本領(lǐng)域技術(shù)人員也可根據(jù)實(shí)際需要采用其它 的降維方法,本發(fā)明無須對(duì)此作出限制。步驟403:特征數(shù)據(jù)提取模塊提取所述待識(shí)別對(duì)象流形每一個(gè)子空間的特 征數(shù)據(jù),以及已知對(duì)象流形每一個(gè)子空間的特征數(shù)據(jù);
本實(shí)施例的特征數(shù)據(jù)提取模塊通過計(jì)算每一個(gè)子空間的標(biāo)準(zhǔn)正交基提取 子空間的特征數(shù)據(jù),本領(lǐng)域技術(shù)人員也可根據(jù)情況使用其它方法提取子空間的 特征數(shù)據(jù)。步驟404:距離計(jì)算模塊的子空間距離計(jì)算子模塊計(jì)算所述待識(shí)別對(duì)象流 形每一個(gè)子空間與已知對(duì)象流形每一個(gè)子空間的距離;子空間距離計(jì)算子模塊依據(jù)特征數(shù)據(jù)提取模塊計(jì)算得到的子空間的標(biāo)準(zhǔn) 正交基計(jì)算所述待識(shí)別對(duì)象流形每一個(gè)子空間與已知對(duì)象流形每一個(gè)子空間 的的距離,并交給流形距離計(jì)算子模塊處理,具體計(jì)算方式可以為其中,d(t/p,^)表示待識(shí)別對(duì)象流形的子空間與某一 已知對(duì)象流形的子空 間的距離,其中C/p和^;分別是來自所述待識(shí)別對(duì)象流形和已知對(duì)象流型的第p 個(gè)和第《個(gè)子空間, 為5^中的m維子空間,^為9^中的n維子空間,^的 標(biāo)準(zhǔn)正交基為"1,"2,…,"m ,^的標(biāo)準(zhǔn)正叉基為V"V2,…,V"。步驟405:距離計(jì)算模塊的流形距離計(jì)算子模塊依據(jù)子空間距離計(jì)算子模 塊獲得的子空間距離,計(jì)算待識(shí)別對(duì)象流形和已知對(duì)象流形的距離;本實(shí)施例中,流形距離計(jì)算子才莫塊應(yīng)用Hausdorf距離分析方法,以子空 間距離取代點(diǎn)集距離,計(jì)算流型之間的距離,具體方法如下其中,t的取值范圍為從2到n+l, n為已知對(duì)象流形的個(gè)數(shù),d(^,f;)為 子空間之間的距離。步驟406:識(shí)別條件判斷^t塊判斷所述待識(shí)別對(duì)象流形和已知對(duì)象流形的 距離是否滿足識(shí)別條件;識(shí)別條件判斷模塊判斷流形距離計(jì)算子模塊的計(jì)算結(jié)果D(M,,M,)是否滿 足識(shí)別條件。步驟407:當(dāng)識(shí)別條件判斷模塊的結(jié)果為是時(shí),對(duì)象識(shí)別模塊將滿足條件 的已知對(duì)象流形對(duì)應(yīng)的對(duì)象識(shí)別為待識(shí)別視覺對(duì)象;當(dāng)識(shí)別條件判斷;f莫塊的結(jié)Z)(MpM,卜"力電,、),f(2,…,n. 果為否時(shí),對(duì)象識(shí)別模塊識(shí)別已知對(duì)象流形對(duì)應(yīng)的對(duì)象不為待識(shí)別視覺對(duì)象。由于圖4所示的實(shí)施例都可以對(duì)應(yīng)適用于前述的;f見覺對(duì)象識(shí)別方法實(shí) 施例中,所以描述專交為簡略,未詳盡之處可以參見本說明書前面相應(yīng)部分 的描述。以上對(duì)本發(fā)明所提供的一種基于流形距離分析的視覺對(duì)象識(shí)別方法和裝 置進(jìn)行了詳細(xì)介紹,文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的核心思想及實(shí)施方式進(jìn)行 了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同 時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式
及應(yīng)用 范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
權(quán)利要求
1、一種基于流形距離分析的視覺對(duì)象識(shí)別方法,其特征在于,包括以下步驟依據(jù)待識(shí)別視覺對(duì)象數(shù)據(jù)構(gòu)造一個(gè)非線性的待識(shí)別對(duì)象流形,以及,依據(jù)已知視覺對(duì)象數(shù)據(jù)構(gòu)造一個(gè)或多個(gè)非線性的已知對(duì)象流形;將所述待識(shí)別對(duì)象流形和已知對(duì)象流形從高維降維到低維的子空間;提取所述待識(shí)別對(duì)象流形每一個(gè)子空間的特征數(shù)據(jù),以及,所述已知對(duì)象流形每一個(gè)子空間的特征數(shù)據(jù);計(jì)算所述待識(shí)別對(duì)象流形每一個(gè)子空間與已知對(duì)象流形每一個(gè)子空間的距離,進(jìn)而獲得所述待識(shí)別對(duì)象流形和已知對(duì)象流形的距離;當(dāng)所述待識(shí)別對(duì)象流形和已知對(duì)象流形的距離滿足識(shí)別條件時(shí),則將所述已知對(duì)象流形對(duì)應(yīng)的對(duì)象確定為待視別視覺對(duì)象。
2、 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將流形從高維降維到 低維的子空間為通過應(yīng)用局部線性嵌入方法進(jìn)行降維。
3、 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述每一個(gè)子空間的 特征數(shù)據(jù)為每一個(gè)子空間的標(biāo)準(zhǔn)正交基。
4、 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述待識(shí)別對(duì)象流形每一 個(gè)子空間與已知對(duì)象流形每一個(gè)子空間的距離為所述子空間的標(biāo)準(zhǔn)正交基之 間的距離。
5、 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述待識(shí)別對(duì)象流形和已 知對(duì)象流形的距離為基于子空間的距離的豪斯多夫距離。
6、 一種基于流形距離分析的視覺對(duì)象識(shí)別裝置,其特征在于,包括 流形構(gòu)造模塊,用于依據(jù)待識(shí)別視覺對(duì)象數(shù)據(jù)構(gòu)造一個(gè)非線性的待識(shí)別對(duì)象流形,以及,依據(jù)已知視覺對(duì)象數(shù)據(jù)構(gòu)造一個(gè)或多個(gè)非線性的已知對(duì)象流形; 子空間構(gòu)造模塊,用于將所述待識(shí)別對(duì)象流形和已知對(duì)象流形從高維降維 到低維的子空間;特征數(shù)據(jù)提取模塊,用于提取所述待識(shí)別對(duì)象流形每一個(gè)子空間的特征數(shù) 據(jù),以及,所述已知對(duì)象流形每一個(gè)子空間的特征數(shù)據(jù);距離計(jì)算模塊,用于計(jì)算所述待識(shí)別對(duì)象流形每一個(gè)子空間與已知對(duì)象流 形每一個(gè)子空間的距離,進(jìn)而獲得所述待識(shí)別對(duì)象流形和已知對(duì)象流形的距離;識(shí)別條件判斷模塊,用于判斷所述待識(shí)別對(duì)象流形和已知對(duì)象流形的距離是否滿足識(shí)別條件;對(duì)象識(shí)別模塊,用于當(dāng)識(shí)別條件判斷模塊的結(jié)果為是時(shí),則將所述已知對(duì) 象流形對(duì)應(yīng)的對(duì)象確定為待視別視覺對(duì)象。
7、 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述距離計(jì)算模塊進(jìn)一步 包括子空間距離計(jì)算子模塊,用于計(jì)算所述待識(shí)別對(duì)象流形每一個(gè)子空間與已 知對(duì)象流形每一個(gè)子空間的距離;流形距離計(jì)算子模塊,用于依據(jù)子空間距離計(jì)算子模塊獲得的子空間距 離,計(jì)算待識(shí)別對(duì)象流形和已知對(duì)象流形的距離。
8、 根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,所述將流形從高維降 維到低維的子空間為通過應(yīng)用局部線性嵌入方法進(jìn)行降維。
9、 根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,所述每一個(gè)子空間的 特征數(shù)據(jù)為每一個(gè)子空間的標(biāo)準(zhǔn)正交基。
10、 根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,所述待識(shí)別對(duì)象流形 每一個(gè)子空間與已知對(duì)象流形每一個(gè)子空間的距離為所述子空間的標(biāo)準(zhǔn)正交 基之間的距離。
11、 根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,所述待識(shí)別對(duì)象流形 和已知對(duì)象流形的距離為基于子空間的距離的豪斯多夫距離。
全文摘要
本發(fā)明提供了一種基于流形距離分析的視覺對(duì)象識(shí)別方法,包括依據(jù)待識(shí)別視覺對(duì)象數(shù)據(jù)構(gòu)造待識(shí)別對(duì)象流形,依據(jù)已知視覺對(duì)象數(shù)據(jù)構(gòu)造已知對(duì)象流形;將所述待識(shí)別對(duì)象流形和已知對(duì)象流形降維到子空間;提取待識(shí)別對(duì)象流形和已知對(duì)象流形每一個(gè)子空間的特征數(shù)據(jù);計(jì)算子空間之間的距離,進(jìn)而獲得待識(shí)別對(duì)象流形和已知對(duì)象流形的距離;當(dāng)所述待識(shí)別對(duì)象流形和已知對(duì)象流形的距離滿足識(shí)別條件時(shí),則將所述已知對(duì)象流形對(duì)應(yīng)的對(duì)象確定為待識(shí)別視覺對(duì)象。本發(fā)明對(duì)待識(shí)別對(duì)象流形和已知對(duì)象流形的所有子空間的距離進(jìn)行了比較分析,綜合考慮了流形之間的整體位置關(guān)系,因此對(duì)噪聲數(shù)據(jù)不敏感,有較好的視覺對(duì)象識(shí)別效果。
文檔編號(hào)G06K9/00GK101393608SQ20081022552
公開日2009年3月25日 申請(qǐng)日期2008年11月4日 優(yōu)先權(quán)日2008年11月4日
發(fā)明者戴瓊海, 謝旭東, 躍 高 申請(qǐng)人:清華大學(xué)