專(zhuān)利名稱(chēng):一種基于p-SIFT特征的物體識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)視覺(jué)技術(shù)領(lǐng)域,特別涉及適用于需要平衡識(shí)別準(zhǔn)確率和計(jì)算復(fù)雜度的實(shí)時(shí)2D或3D物體識(shí)別應(yīng)用場(chǎng)景的基于p-SIFT特征的物體識(shí)別方法。
背景技術(shù):
目前,2D或3D圖片中的剛性物體識(shí)別越來(lái)越廣泛地應(yīng)用于各類(lèi)計(jì)算機(jī)視覺(jué)算法中并已開(kāi)發(fā)出很多相關(guān)的應(yīng)用系統(tǒng),例如工業(yè)生產(chǎn)中的次品檢測(cè)、交通路口的車(chē)牌識(shí)別以及互聯(lián)網(wǎng)的圖片檢索等。在衡量物體識(shí)別算法優(yōu)劣時(shí),識(shí)別準(zhǔn)確率和計(jì)算復(fù)雜度是兩個(gè)重要的指標(biāo),通常識(shí)別準(zhǔn)確率的提高是以引入更多的特征來(lái)實(shí)現(xiàn)的,這同時(shí)會(huì)帶來(lái)計(jì)算復(fù)雜度的提升,即識(shí)別準(zhǔn)確率和計(jì)算復(fù)雜度是一對(duì)相互矛盾的指標(biāo)。而現(xiàn)今應(yīng)用場(chǎng)景卻越來(lái)越復(fù)雜,例如復(fù)雜的背景、光線的明暗變化、其他物體的遮擋或多物體的識(shí)別等等,這些應(yīng)用場(chǎng)景的復(fù)雜化導(dǎo)致了識(shí)別算法必須引入更多更細(xì)致的特征或者在同一場(chǎng)景中結(jié)合多種識(shí)別算法,這在保證識(shí)別準(zhǔn)確率的前提下勢(shì)必導(dǎo)致計(jì)算復(fù)雜度的提升,影響實(shí)時(shí)系統(tǒng)的運(yùn)行速度。在軟件算法層面上,這些應(yīng)用場(chǎng)景的出現(xiàn)對(duì)平衡高的識(shí)別準(zhǔn)確率和低的計(jì)算復(fù)雜度提出了新的挑戰(zhàn)。要實(shí)現(xiàn)高的識(shí)別準(zhǔn)確率和低的計(jì)算復(fù)雜度,必須首先清楚地了解物體識(shí)別算法的構(gòu)成。一個(gè)完整的物體識(shí)別算法包括特征描述和特征匹配兩部分,而大部分算法的特征描述部分又可以分為特征點(diǎn)提取和描述子計(jì)算,魯棒性良好的特征點(diǎn)、簡(jiǎn)單且分辨率高的描述子、快速準(zhǔn)確的匹配方法對(duì)于改善識(shí)別準(zhǔn)確率和降低計(jì)算復(fù)雜度都有不同程度的貢獻(xiàn),因此想要改善算法的性能,可以從特征點(diǎn)提取、描述子計(jì)算和特征匹配方法三個(gè)方面著手。David G. Lowe 等人(Distinctive Image Features from Scale-InvariantKeypoints, International Journal of Computer Vision, 2004)提出了基于 SIFT(Scale-Invariant Feature Transform,尺度不變特征變換)特征的物體識(shí)別算法,該算法 將局部的灰度值極值點(diǎn)作為物體的特征點(diǎn),將該特征點(diǎn)周?chē)?6個(gè)子區(qū)域像素的梯度8-方向直方圖作為描述子并用歐式距離的二階匹配作為匹配方法。該算法在特征點(diǎn)提取時(shí),利用不同尺度系數(shù)的高斯濾波器構(gòu)建了一系列的尺度空間,并在所有的尺度空間中尋找上述極值點(diǎn),從而實(shí)現(xiàn)了尺度不變性;在描述子計(jì)算時(shí),先將2D圖片旋轉(zhuǎn)到其主方向后統(tǒng)計(jì)梯度方向直方圖,從而實(shí)現(xiàn)了旋轉(zhuǎn)不變性,這兩個(gè)不變性使得該算法對(duì)不同的應(yīng)用場(chǎng)景具有良好的魯棒性,能實(shí)現(xiàn)很高的識(shí)別準(zhǔn)確率。但是其識(shí)別準(zhǔn)確率的提高是以高的計(jì)算復(fù)雜度為代價(jià)的,其在構(gòu)建高斯尺度空間、統(tǒng)計(jì)梯度方向直方圖時(shí)花費(fèi)了很大的計(jì)算量,而得到的128維描述子在特征匹配階段也帶來(lái)了大量的計(jì)算,這在很大程度上限制了該算法的應(yīng)用。為了繼承SIFT算法的高識(shí)別率同時(shí)降低計(jì)算復(fù)雜度,Yan Ke等(PCA_SIFT:A MoreDistinctive Representation for Local Image Descriptors, IEEE Computer SocietyConference on Computer Vision and Pattern Recognition,2004)提出了基于 SIFT特征的改進(jìn)算法一PCA-SIFT。該算法利用K-L變換的原理將SIFT描述子投影到一個(gè)新的向量空間中,而該向量空間是經(jīng)過(guò)主成分分析篩選后的特征空間,實(shí)現(xiàn)了降低描述子維數(shù)的目的。雖然該算法能有效地降低計(jì)算量,但是其存在兩個(gè)問(wèn)題,一是其特征空間的不完備性使得特征點(diǎn)的區(qū)分度相較SIFT有所下降從而影響了識(shí)別正確率,二是其訓(xùn)練過(guò)程不易擴(kuò)展。
發(fā)明內(nèi)容
本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問(wèn)題,特別創(chuàng)新地提出了一種基于P-SIFT特征的物體識(shí)別方法。為了實(shí)現(xiàn)本發(fā)明的上述目的,本發(fā)明提供了一種基于p-SIFT(PiOminent SIFT,顯著的尺度不變特征變換)特征的物體識(shí)別方法,其包括模板庫(kù)訓(xùn)練階段和測(cè)試圖片匹配階段,所述模板庫(kù)訓(xùn)練階段包括如下步驟SI :分別計(jì)算模板庫(kù)中M張訓(xùn)練圖片中的每一張訓(xùn)練圖片的SIFT特征點(diǎn),得到M個(gè)特征矩陣,所述M為正整數(shù);
S2 :計(jì)算所述每一個(gè)特征矩陣的協(xié)方差矩陣,得到p-SIFT特征描述子;所述測(cè)試圖片匹配階段包括如下步驟S3 :計(jì)算測(cè)試圖片的SIFT特征矩陣;S4 :計(jì)算測(cè)試圖片與模版庫(kù)M張訓(xùn)練圖片的特征矩陣相似度。本發(fā)明的p-SIFT特征描述的是特征點(diǎn)的區(qū)域相關(guān)性和方向相關(guān)性,使得特征點(diǎn)從絕對(duì)位置、絕對(duì)方向變?yōu)橄鄬?duì)位置、相對(duì)方向,提高了識(shí)別正確率。在本發(fā)明的一種優(yōu)選實(shí)施例中,所述模板庫(kù)訓(xùn)練階段還具有以下步驟利用主成分分析,減少p-SIFT特征描述子個(gè)數(shù)。在本發(fā)明的另一種優(yōu)選實(shí)施例中,選取包含不少于90%信息量的特征值和特征向量的p-SIFT特征描述子。本發(fā)明利用主成分分析的思路,選取信息量大的特征值和特征向量對(duì)作為p-SIFT描述子,使得描述子數(shù)量下降到原有的一半。在本發(fā)明的一種優(yōu)選實(shí)施例中,采用測(cè)試圖片的特征矩陣在當(dāng)前訓(xùn)練圖片的L個(gè)p-SIFT特征向量上的投影P1=AX μ i與T1=A iX μ I的歐式距尚之和度量特征矩陣的相似度,其中,A為測(cè)試圖片的特征矩陣,U1為當(dāng)前訓(xùn)練圖片的第I個(gè)p-SIFT特征向量,XJ當(dāng)前訓(xùn)練圖片第I個(gè)特征值,1=1,2,…,L,L是當(dāng)前訓(xùn)練圖片的p-SIFT特征點(diǎn)的個(gè)數(shù)。在本發(fā)明的另一種優(yōu)選實(shí)施例中,所述測(cè)試圖片匹配階段的步驟S4之后還具有以下步驟在所述特征矩陣相似度中引入權(quán)值。在本發(fā)明的再一種優(yōu)選實(shí)施例中,在所述特征矩陣相似度中弓I入權(quán)值的方法為
權(quán)利要求
1.一種基于P-SIFT特征的物體識(shí)別方法,其特征在于,包括模板庫(kù)訓(xùn)練階段和測(cè)試圖片匹配階段,所述模板庫(kù)訓(xùn)練階段包括如下步驟 51:分別計(jì)算模板庫(kù)中M張訓(xùn)練圖片中的每一張訓(xùn)練圖片的SIFT特征點(diǎn),得到M個(gè)特征矩陣,所述M為正整數(shù); 52:計(jì)算所述每一個(gè)特征矩陣的協(xié)方差矩陣,得到p-SIFT特征描述子; 所述測(cè)試圖片匹配階段包括如下步驟 53:計(jì)算測(cè)試圖片的SIFT特征矩陣; 54:計(jì)算測(cè)試圖片與模版庫(kù)M張訓(xùn)練圖片的特征矩陣相似度。
2.如權(quán)利要求I所述的基于P-SIFT特征的物體識(shí)別方法,其特征在于,所述模板庫(kù)訓(xùn)練階段的步驟S2之后還具有以下步驟利用主成分分析,減少P-SIFT特征描述子個(gè)數(shù)。
3.如權(quán)利要求2所述的基于p-SIFT特征的物體識(shí)別方法,其特征在于,選取包含不少于90%信息量的特征值和特征向量的p-SIFT特征描述子。
4.如權(quán)利要求I所述的基于P-SIFT特征的物體識(shí)別方法,其特征在于,采用測(cè)試圖片的特征矩陣在當(dāng)前訓(xùn)練圖片的L個(gè)p-SIFT特征向量上的投影P1=AX μ i與T1=A iX μ i的歐式距離之和度量特征矩陣的相似度,其中,A為測(cè)試圖片的特征矩陣,μ I為當(dāng)前訓(xùn)練圖片的第I個(gè)P-SIFT特征向量,X1為當(dāng)前訓(xùn)練圖片第I個(gè)特征值,1=1,2,…,L,L是當(dāng)前訓(xùn)練圖片的P-SIFT特征點(diǎn)的個(gè)數(shù)。
5.如權(quán)利要求I所述的基于P-SIFT特征的物體識(shí)別方法,其特征在于,所述測(cè)試圖片匹配階段的步驟S4之后還具有以下步驟在所述特征矩陣相似度中引入權(quán)值。
6.如權(quán)利要求5所述的基于p-SIFT特征的物體識(shí)別方法,其特征在于,在所述特征矩陣相似度中引入權(quán)值的方法為
7.如權(quán)利要求6所述的基于p-SIFT特征的物體識(shí)別方法,其特征在于,將得到的測(cè)試圖片與M張訓(xùn)練圖片的M個(gè)歐氏距離E進(jìn)行比較,如果最小歐氏距離比第二小歐氏距離小I.6倍以上,則認(rèn)為所述測(cè)試圖片與最小歐氏距離對(duì)應(yīng)的訓(xùn)練圖片匹配。
全文摘要
本發(fā)明提出了一種基于p-SIFT特征的物體識(shí)別方法,其包括模板庫(kù)訓(xùn)練階段和測(cè)試圖片匹配階段,其中,模板庫(kù)訓(xùn)練階段包括步驟對(duì)模板庫(kù)中的每一張訓(xùn)練圖片分別計(jì)算SIFT特征點(diǎn),得到特征矩陣;計(jì)算所述特征矩陣的協(xié)方差矩陣,得到p-SIFT特征描述子;測(cè)試圖片匹配階段包括步驟計(jì)算測(cè)試圖片的SIFT特征矩陣;計(jì)算測(cè)試圖片與模版庫(kù)訓(xùn)練圖片的特征矩陣相似度。本發(fā)明的p-SIFT特征描述的是特征點(diǎn)的區(qū)域相關(guān)性和方向相關(guān)性,使得特征點(diǎn)從絕對(duì)位置、絕對(duì)方向變?yōu)橄鄬?duì)位置、相對(duì)方向,提高了識(shí)別正確率。
文檔編號(hào)G06K9/62GK102930292SQ201210395429
公開(kāi)日2013年2月13日 申請(qǐng)日期2012年10月17日 優(yōu)先權(quán)日2012年10月17日
發(fā)明者尹首一, 張杰男, 歐陽(yáng)鵬, 劉雷波, 魏少軍 申請(qǐng)人:清華大學(xué)