專利名稱:基于主梯度方向特征的目標檢測及姿態(tài)估計方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種利用機器視覺和圖像處理技術(shù),具體地涉及一種基于主梯度方向描述的復雜環(huán)境下目標檢測及姿態(tài)估計方法。
背景技術(shù):
目標檢測在工業(yè)中有廣泛應用,基于計算機視覺的目標檢測通過在視頻或圖像中匹配事先訓練好的數(shù)據(jù)來檢測目標。目前主流的目標檢測算法大致可以分成兩類基于特征的目標檢測和基于模板匹配的目標檢測。Pedro F, Felzenszwalb等人在文章ObjectDetection with Disoriminatively Trained Part Based Models (使用基于區(qū)分性訓練部分模型的目標檢測)中提出了一種使用潛在支持向量機(latent SVM)的目標檢測方法。在文章 Sparse distance learning for object recognition combining RGB and depthinformation (結(jié)合RGB和深度信息用于目標識別的稀疏距離學習)中,Kevin Lai等人使用圖像的RGB和深度信息來改善目標檢測的效果。Torralba在文章Sharing visual featuresfor multiclass and inulti-view object detection(用于多類和多視角目標檢測的共享視覺特征)中提出了一種共同推動過程(joint boosting prooedure)來強制特征共享,結(jié)果顯示特征與目標物體的類別數(shù)成子線性(sub-1 inearIy)增長。在文章Learning andusing taxononies for fast visual categorization(用于快速視覺分類的學習和使用分類法)中,Griffin和Perona通過聚類一對其余(one-vs-the_rest)檢測器的混淆矩陣(confusion metrix)來實施分類。目標檢測的目的是為了有效而緊湊地捕捉場景中感興趣物體而去除其它不感興趣的背景物體。一般根據(jù)檢測目標的性質(zhì)不同,可以分為剛體和非剛體目標檢測。其中剛體檢測主要是針對非變形體如金屬零件的檢測與識別,而非剛體檢測主要包括變形物體,比如人體,以及瀑布、煙霧、火焰等流體。目前關(guān)于剛體目標檢測主要有以下幾個方面的難題 光線變化不同場景下物體所接受的光線不同,可能有不同的照射情況。 旋轉(zhuǎn)變化待檢測的目標物體相對于訓練模板可能有各種角度的旋轉(zhuǎn)。 尺度變化待檢測視頻或圖像中的物體與訓練模板中的物體大小不同。
部分遮擋測試圖片中的目標物體可能被其他物體遮擋,只有一部分顯示在圖片中。 透視失真三維目標物體可能以任意角度投影到二維圖像上,造成不同角度的失真。 復雜背景一般訓練圖片只包含待檢測物體本身,但實際情況通常比較復雜,會包含大量背景物體信息。2OlO 年 S. Hinterstoisser 等人在論文 Dominant orientation templates forreal-time detection of texture-less objects (用于無紋理目標實時檢測的主方向模板)中提出了主梯度方向模板(DOT)方法。這個方法首先將模板圖像和待檢測圖像分解到規(guī)則格子上,模板圖像和輸入圖像的相似度度量被表達為待檢測圖像的主梯度方向在模板圖像中的比例。DOT的模板設(shè)計過程中包含了對小范圍的位移的處理。如果場景中的物體有微小變化,比如微小的位移或旋轉(zhuǎn),對模板圖像做類似的變換然后綜合得到的模板將使得匹配過程不受這些因素的影響。DOT雖然取得了顯著的效果,但是仍然未能很好解決實際工業(yè)應用中的尺度變化,透視失真以及復雜背景問題,而且只能處理待檢測目標物體的小范圍平移。由于沒有模板訓練過程,DOT算法只能處理單一角度的一張模板圖片,也即只能檢測到目標物體一個特定角度下的圖片,無法應對透視失真帶來的挑戰(zhàn)。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對實際應用中復雜環(huán)境下多視角目標檢測問題中現(xiàn)有技術(shù)的不足,提出一種基于主梯度方向特征的目標檢測及姿態(tài)估計方法。該方法能在背景環(huán)境十分復雜、目標物體被部分遮擋、目標物體表面紋理很少以及目標物體存在尺度變化的情
況下,快速檢測到各種視角下的目標物體并且對目標物體進行姿態(tài)估計。本發(fā)明通過模板訓練和目標檢測兩個階段實現(xiàn)上模板訓練階段。首先拍
攝被檢測物體不同角度的V張模板圖片,然后對于每張模板圖片旋轉(zhuǎn)360度(每Ntl度為一個步長)。并進行N種尺度變化,共得到含有張圖片的模板圖片集S,然后對S中的每張模板圖片求出主梯度方向描述,得到主梯度方向模板集Tl。接著使用漢明距離(hamming distance)作為度量準則對Tl進行聚類,對于屬于同一類的模板使用或操作(0Roperation)得到類模板,它提供了分支定界約束搜索(branch and bound constrainedsearch)中的緊上界(tightupper bounds),這樣得到聚類后的最強梯度模板集T2。最后存儲T2至硬盤以在檢測階段使用。在目標檢測階段,首先從硬盤讀取最強梯度模板集T2。給定一張測試圖片I (test image),首先計算出其主梯度方向描述I。然后使用分支定界約束搜索策略,對T2中的每個主梯度方向模板t,使用t掃描i中的每個位置,得到在最優(yōu)匹配位置Lt的最高匹配分數(shù)St。對于得到的所有St(t = 1,2,…)進行排序,最高分數(shù)Smax對應的模板即為對于測試圖片的最優(yōu)估計模板。由對應的最優(yōu)匹配位置L得到目標物體在i中的位置,由對應的模板的旋轉(zhuǎn)角度0及尺度變化系數(shù)\得到目標物體估計姿態(tài)。具體地,根據(jù)本發(fā)明的一個方面,一種基于主梯度方向特征的目標檢測及姿態(tài)估計方法,包括如下步驟模板訓練階段步驟TSl :拍攝被檢測物體不同角度的V張模板圖片;步驟TS2 :從上述V張圖片中取出某個角度的一張圖片;步驟TS3 :對這張模板圖片旋轉(zhuǎn)360度(每N。度為一個步長),并進行N種尺度變化,共得到含有張圖片的模板圖片9—步驟TS4 :對S中的每張模板圖片0求出主梯度方向描述,得到主梯度方向模板集Tl ;步驟TS5:使用漢明距離(hamming distance)作為度量準則對Tl進行聚類,得到聚類后的最強梯度模板集T2;
步驟TS6 :存儲T2至硬盤以備檢測階段使用;步驟TS7 :若V張不同角度的模板圖片已經(jīng)處理完,停止否則,轉(zhuǎn)TS2。優(yōu)選地,所述步驟TS4包括如下步驟
步驟TS41 :對于每張模板圖片0,對其實施小范圍的平移變換M,M G M,其中M是[_t,+t]2范圍內(nèi)的所有平移變換的集合,得到平移變換后的模板圖片w(0,M),這一步可以使待求取的主梯度方向描述對于小范圍平移魯棒且可以減少目標檢測階段掃描位置的個數(shù);步驟TS42 :將得到平移變換后的模板圖片w(0,M)分割成若干大小為tX t的方形網(wǎng)格R,R的大小的選取要綜合考慮運行速度和魯棒性;步驟TS43 :對于每一個方形網(wǎng)格R,計算出離散化的梯度方向列表L(0,R);步驟TS44 :將每個離散化的梯度方向列表L(0,R)表示成一個字節(jié)形式,得到模板圖片的二進制表示(binary representation),具體為一個8比特的整型二維數(shù)組;優(yōu)選地,所述步驟TS43中的梯度方向列表L(0,R)可以由如下公式計算得出LiD.R) = {p :3Af € M tfuit o G UO (H;(C^S Aif ji 4 jS ji I*其中D0(w(0,M),R)返回平移變換后的模板圖片w(0,M)中的方形網(wǎng)格R中的k個
主梯度方向;關(guān)于方形網(wǎng)格R中梯度方向的定義,為了正確處理物體的遮擋邊界,相差180度的兩個方向被看做是一個方向,這樣,不管物體是處于深色背景還是淺色背景,都不會受到影響。這樣的梯度方向又被離散化處理成Iitl = 7個整數(shù)值。若方形網(wǎng)格R中的最大梯度值小于梯度閾值t,此方形網(wǎng)格被認為是均質(zhì)區(qū)域(uniform region),此時用符號丄表示此方形網(wǎng)格中沒有可用的梯度信息,因此,D0(w(0, M),R)可以被正式地寫成
j {±}oinermse其中,S (w (0, M), R) = {ori (w (0, M), I) : I G max magk (R) A mag (w (0, M), I) > x }其中 I是方形網(wǎng)格R中的像素位置;*ori(w(0,M), I)是圖片w(0,M)在I位置的梯度方向,mag(w(0,M),I)是其梯度大?。? max magk (R)是方形網(wǎng)格中k個最強梯度的位置集合; T是最小梯度閾值。優(yōu)選地,模板訓練階段所述步驟TS5包括如下步驟步驟TS51 :從最強梯度模板集Tl中隨機選取一個沒有被歸為任何一類的模板作為第i類的聚類模板;步驟TS52 :迭代地搜尋滿足如下條件的模板t
「nn49l M m s(d;1(c or
LUUH-zlJr*€8uf '—其中dh是漢明距離,"or"是按位或操作,c是進行或操作之前的聚類模板將得到的模板t加入第i類,修改第i類的聚類模板為c = cort ;
步驟TS53 :若Tl中的模板已經(jīng)全部聚類,停止;否則,轉(zhuǎn)TS54 ;步驟TS54 :若第i類中的模板數(shù)未達到預設(shè)模板數(shù)1 ,轉(zhuǎn)TS52 ;否則,i = i+1,轉(zhuǎn)TS51。目標檢測階段步驟DSl :從硬盤讀取聚類后的最強梯度模板集T2 ;步驟DS2 :讀取一張測試圖片I ;步驟DS3 :計算出測試圖片I的主梯度方向描述i ;步驟DS4 :對聚類后的最強梯度模板集T2中的每個模板t,使用t掃描i中的每個位置,得到在最優(yōu)匹配位置的最高匹配分數(shù)St,此位置記為Lt ; 步驟DS5 :對得到的所有匹配分數(shù)進行排序,最高分數(shù)Smax對應的模板即為對于測試圖片的最優(yōu)估計模板;步驟DS6 由對應的最優(yōu)匹配位置I得到目標物體在i中的位置,由對應的模板tmax的旋轉(zhuǎn)角度0及尺度變化系數(shù) ' 得到目標物體估計姿態(tài)。優(yōu)選地,上述步驟DS3包括如下步驟步驟DS31 :將測試圖片I分割成若干大小為tXt的方形網(wǎng)格R,R的大小的選取
要綜合考慮運行速度和魯棒性;步驟DS32 :對于每一個方形網(wǎng)格R,計算出離散化的主梯度方向do (I,R);步驟DS33 :將每個離散化的主梯度方向do(I,R)表示成一個字節(jié)形式,得到測試圖片的二進制表示(binary representation),具體為一個8比特的整型二維數(shù)組。優(yōu)選地,上述步驟DS32中的主梯度方向do (I, R)通過下式計算
t r ^ —rfS{IJ^0K
do (/, ) —
[{J_} otherwise其中 S (I,R) = {ori (1,1):1 G max mag (R)八 mag (I,I) > x }其中 I是方形網(wǎng)格R中的像素位置; ori (I, I)是圖片I在I位置的梯度方向,mag (I,I)是梯度大?。? max mag(R)是方形網(wǎng)格R中最強梯度的位置; T是最小梯度閾值。優(yōu)選地,步驟DS4包括如下步驟步驟DS41 :從T2中取一個模板t ;步驟DS42 :從i的左上角開始掃描,對于每個位置P,使用下式計算匹配分數(shù);+
I SVt其中 6⑵是一個二值函數(shù),若P古0,返回1,其他情況返回0 ; p和I均為二維坐標位置。
i [p+1]表示二維數(shù)組i的p+1位置處的字節(jié)數(shù)值,t [I]表示二維數(shù)組t的I位置處的字節(jié)數(shù)值。
表示按位與操作(bitwise AND operation)。步驟DS43 :對所有位置的匹配分數(shù)進行排序,得最優(yōu)匹配位置Pt及相應匹配分數(shù)St。本發(fā)明采用基于主梯度方向的特征描述,在模板訓練階段,通過對多角度模板圖片進行旋轉(zhuǎn)和尺度變換,進而對得到的模板圖片集求取二進制的主梯度方向描述集,然后通過模板聚類加快檢測階段的搜索速度。在目標檢測階段,使用得到的模板主梯度方向描述集,掃描測試圖片,進而在復雜環(huán)境下檢測出目標物體并且對檢測到的目標物體進行姿態(tài)估計。實現(xiàn)了復雜背景環(huán)境,目標物體被遮擋以及目標物體缺少紋理情況下的魯棒性目標檢測,屬于模式識別中的目標檢測領(lǐng)域。本發(fā)明與現(xiàn)有的目標檢測方法相比的的顯著優(yōu)勢在于,實現(xiàn)了復雜環(huán)境下目標物 體的快速魯棒檢測,可將本技術(shù)應用到實際的金屬零件等剛性產(chǎn)品的實際工業(yè)生產(chǎn)中,具有精確度高,魯棒性強,耗時很少等優(yōu)點。本檢測方法對于遮擋,光照變化,復雜背景等干擾具有很好的魯棒性,并且可以處理紋理較少甚至無紋理的物體的檢測,可以對以各種角度出現(xiàn)在測試圖片中的目標物體進行檢測,而且可以進一步估計被檢測目標物體的姿態(tài),克服了以往技術(shù)難以克服的難點,真正做到了自動生產(chǎn)和實時檢測,為現(xiàn)代化工業(yè)生產(chǎn)中剛性物體的魯棒性快速檢測提供了一種可靠的方法。
圖I是采用本發(fā)明方法的實施例;圖2是本發(fā)明模板訓練階段和目標檢測階段算法流程圖;圖3是拍攝被檢測物體不同角度的9張模板圖片;圖4是得到的相應最強梯度模板圖片;圖5是四種不同形狀金屬零件的測試圖片;圖6是四種不同形狀金屬零件的測試結(jié)果。
具體實施例方式以下結(jié)合附圖以及實施例對本發(fā)明的技術(shù)方案作進一步詳細說明。以下實施例在以本發(fā)明技術(shù)方案為前提下進行實施,給出了詳細的實施方式和過程,但本發(fā)明的保護范圍不限于下述的實施例。如圖I所示,是采用本發(fā)明方法所解決問題中的一些典型實施例,具體是用于金屬零件精確檢測及銹蝕程度估計中的結(jié)果圖片。如圖2所示流程圖,本發(fā)明所提供的基于主梯度方向描述的復雜環(huán)境下目標檢測及姿態(tài)估計包括如下步驟,優(yōu)選地在本發(fā)明的實現(xiàn)過程中可以使用C++語言進行編程模板訓練階段步驟TS1,拍攝被檢測物體不同角度的V張模板圖片具體請參見圖3。本實施例中我們測試了四種不同形狀的金屬零件的檢測,由于篇幅有限,圖3中只顯示了一種零件A的9張不同角度的模板圖片。關(guān)于模板圖片個數(shù)V的選取,要折中考慮檢測魯棒性以及運行速度。顯然,更多角度的模板圖片能帶來對于不同角度的更好的魯棒性,同時會帶來目標檢測階段搜索模板數(shù)的顯著增長。在本實施例中我們選取V = 9。步驟TS2 :從上述V張圖片中取出某個角度的一張圖片;步驟TS3 :對于這張模板圖片旋轉(zhuǎn)360度(每Ntl度為一個步長),并進行N種尺度變化,共得到含有—張圖片的模板圖片集S ;為了使檢測結(jié)果對于目標物體的旋轉(zhuǎn)以及尺度變化魯棒,必須對每張模板圖片進行旋轉(zhuǎn)和尺度變化,這樣做也同時可以對檢測到的目標物體進行姿態(tài)估計。同模板圖片個數(shù)V的選取類似,旋轉(zhuǎn)步長Ntl的選取也要綜合考慮魯棒性以及運行速度=Ntl越小,對于旋轉(zhuǎn)的描述越精細,耗時越長,在本實施例中我們選取Ntl = 10。尺度變化個數(shù)的選取要根據(jù)具體的應用需要,在本實施例中我們選取N = 3。步驟TS4 :對S中的每張模板圖片0求出主梯度方向描述,得到主梯度方向模板集Tl
得到的最強梯度模板二進制表示圖片如圖4所示。模板圖片中每個像素點對應于原圖片的一個方形網(wǎng)格,用一個字節(jié)表示原方向網(wǎng)格內(nèi)的若干主梯度方向。表現(xiàn)在模板圖片中即為對應于0 255的某一個灰度值,所以最強梯度模板圖片中會出現(xiàn)模糊線條,另夕卜,因為這些像素點對應于模板中的一致背景區(qū)域,是具有一定的意義的,因此,圖4中采用了灰色的背景。具體地,所述步驟TS4包括如下步驟步驟TS41 :對于每張模板圖片0,對其實施小范圍的平移變換M(M G M,其中M是[_t,+t]2范圍內(nèi)的所有平移變換的集合),得到平移變換后的模板圖片w(0,M)。這一步可以使待求取的主梯度方向描述對于小范圍平移魯棒且可以減少目標檢測階段掃描位置的個數(shù)。步驟TS42 :將得到平移變換后的模板圖片w(0,M)分割成若干大小為tX t的方形網(wǎng)格R,R的大小的選取要綜合考慮運行速度和魯棒性;平移范圍t同時也是方形網(wǎng)格R的邊長,它的選擇要同時考慮生成的模板描述的區(qū)分能力(魯棒性)以及運行速度,通過多次試驗我們發(fā)現(xiàn)t = 7是以上兩者的很好折中。步驟TS43 :對于每一個方形網(wǎng)格R,計算出離散化的梯度方向列表L(0,R)。具體地,所述步驟TS43中的梯度方向列表L(0,R)可以由如下公式計算得出 L(CKR) - {o : 3M€ M simh Hmio E DO(^iO7M),聯(lián)其中D0(w(0,M),R)返回平移變換后的模板圖片w(0,M)中的方形網(wǎng)格R中的k個主梯度方向。其中S (w (0, M), R) = {ori (w (0, M), I) : I G max magk (R) A mag (w (0, M), I) > x }經(jīng)過參數(shù)調(diào)優(yōu),在本實旋例中我們發(fā)現(xiàn)選取k = 7會取的比較好的效果。步驟TS44 :將每個離散化的梯度方向列表L(0,R)表示成一個字節(jié)形式,得到模板圖片的二進制表示(binary representation),具體為一個8比特的整型二維數(shù)組。步驟TS5:使用漢明距離(hamming distance)作為度量準則對Tl進行聚類,得到聚類后的最強梯度模板集T2。具體地,步驟TS5包括如下步驟步驟TS51 :從最強梯度模板集Tl中隨機選取一個沒有被歸為任何一類的模板作為第i類的聚類模板;
步驟TS52 :迭代地搜尋滿足如下條件的模板t
「fH I Ql arauiiii max(i s(e o:rtJ),dh{c oi
LU ■ ■ v3」rs5i齡,將得到的模板t加入第i類,修改第i類的聚類模板為c = cort ;步驟TS53 :若Tl中的模板已經(jīng)全部聚類,停止否則,轉(zhuǎn)TS54步驟TS54 :若第i類中的模板數(shù)未達到預設(shè)模板數(shù)k0,轉(zhuǎn)TS52 :否則,i = i+1,轉(zhuǎn)TS51 ;步驟TS6 :存儲T2至硬盤以備檢測階段使用;步驟TS7 :若V張不同角度的模板圖片已經(jīng)處理完,停止否則,轉(zhuǎn)TS2。目標檢測階段步驟DSl :從硬盤讀取聚類后的最強梯度模板集T2 ;步驟DS2 :讀取一張測試圖片I ;測試圖片如圖5所示,其對A,B,C,D四種不同形狀的金屬零件進行多角度檢測。對于每種具體的金屬零件,分別拍攝三種情況下的測試圖片從圖中左到右列,依次為簡單背景、復雜背景以及銹蝕干擾。步驟DS3 :計算出測試圖片I的主梯度方向描述i ;具體地,上述步驟DS3包括如下步驟步驟DS31 :將測試圖片I分割成若干大小為tXt的方形網(wǎng)格R,R的大小的選取
要綜合考慮運行速度和魯棒性;為了同模板訓練階段保持一致,我們在這里仍然選擇方形網(wǎng)格R的邊長t = 7。步驟DS32 :對于每一個方形網(wǎng)格R,計算出離散化的主梯度方向do (I,R)具體地,上述步驟DS32中的主梯度方向do (I, R)通過下式計算;
權(quán)利要求
1.基于主梯度方向特征的目標檢測及姿態(tài)估計方法,其特征在于,包括如下步驟模板訓練階段 步驟TSl :拍攝被檢測物體不同角度的V張模板圖片; 步驟TS2 :從上述V張圖片中取出某個角度的一張圖片; 步驟TS3 :對這張模板圖片旋轉(zhuǎn)360度(每Ntl度為ー個步長),并進行N種尺度變化,共得到含有f張圖片的模板圖片集S ; 步驟TS4 :對S中的每張模板圖片O求出主梯度方向描述,得到主梯度方向模板集Tl ;步驟TS5 :使用漢明距離(hamming distance)作為度量準則對Tl進行聚類,得到聚類后的最強梯度模板集T2; 步驟TS6 :存儲T2至硬盤以備檢測階段使用; 步驟TS7 :若V張不同角度的模板圖片已經(jīng)處理完,停止否則,轉(zhuǎn)步驟TS2 ; 目標檢測階段 步驟DSl :從硬盤讀取聚類后的最強梯度模板集T2 ; 步驟DS2:讀取ー張測試圖片I; 步驟DS3 :計算出測試圖片I的主梯度方向描述i ; 步驟DS4 :對聚類后的最強梯度模板集T2中的每個模板t,使用t掃描i中的每個位置,得到在最優(yōu)匹配位置的最高匹配分數(shù)St,此位置記為Lt ; 步驟DS5 :對得到的所有匹配分數(shù)進行排序,最高分數(shù)Smax對應的模板tmax即為對于測試圖片的最優(yōu)估計模板; 步驟DS6 :由對應的最優(yōu)匹配位置4 得到目標物體在i中的位置,由對應的模板tmax的旋轉(zhuǎn)角度Θ及尺度變化系數(shù)λ得到目標物體估計姿態(tài)。
2.根據(jù)權(quán)利要求I所述的基于主梯度方向特征的目標檢測及姿態(tài)估計方法,其特征在于,所述步驟TS4包括如下步驟 步驟TS41 :對于每張模板圖片O,對其實施小范圍的平移變換Μ,得到平移變換后的模板圖片w (O, Μ),所述M e Μ,其中M是[_t, +t]2范圍內(nèi)的所有平移變換的集合; 步驟TS42 :將得到平移變換后的模板圖片w(0,M)分割成若干大小為tXt的方形網(wǎng)格R; 步驟TS43 :對于每ー個方形網(wǎng)格R,計算出離散化的梯度方向列表L(0,R); 步驟TS44 :將每個離散化的梯度方向列表L(0,R)表示成一個字節(jié)形式,得到模板圖片的ニ進制表示。
3.根據(jù)權(quán)利要求2所述的基于主梯度方向特征的目標檢測及姿態(tài)估計方法,其特征在于,所述步驟TS43包括如下過程 所述梯度方向列表L(0,R)可以由如下公式計算得出
4.根據(jù)權(quán)利要求I所述的基于主梯度方向特征的目標檢測及姿態(tài)估計方法,其特征在于,所述步驟TS5包括如下步驟 步驟TS51 :從最強梯度模板集Tl中隨機選取一個沒有被歸為任何一類的模板作為第i類的聚類模板 步驟TS52 :迭代地搜導滿足如下條件的模板t
5.根據(jù)權(quán)利要求I所述的基于主梯度方向特征的目標檢測及姿態(tài)估計方法,其特征在于,所述步驟DS3包括如下步驟 步驟DS31 :將測試圖片I分割成若干大小為tXt的方形網(wǎng)格R ; 步驟DS32 :對于每ー個方形網(wǎng)格R,計算出離散化的主梯度方向do (I,R); 步驟DS33 :將每個離散化的主梯度方向do(I,R)表示成一個字節(jié)形式,得到測試圖片的ニ進制表示。
6.根據(jù)權(quán)利要求5所述的基于主梯度方向特征的目標檢測及姿態(tài)估計方法,其特征在于,所述步驟DS32包括如下過程 DS32中的主梯度方向do (I, R)通過下式計算
7.根據(jù)權(quán)利要求I所述的基于主梯度方向特征的目標檢測及姿態(tài)估計方法,其特征在于,所述步驟DS4包括如下步驟 步驟DS41 -J人Τ2中取一個模板t ; 步驟DS42 :從i的左上角開始掃描,對于每個位置P,使用下式計算匹配分數(shù);
全文摘要
一種基于主梯度方向特征的目標檢測及姿態(tài)估計方法,步驟包括在模板訓練階段,通過對多角度模板圖片進行旋轉(zhuǎn)和尺度變換,進而對得到的模板圖片集求取二進制的主梯度方向描述集,然后通過模板聚類加快檢測階段的搜索速度;在目標檢測階段,使用得到的模板主梯度方向描述集,掃描測試圖片,進而在復雜環(huán)境下檢測出目標物體并且對檢測到的目標物體進行姿態(tài)估計。本發(fā)明方法對于遮擋,光照變化,復雜背景等干擾具有很好的魯棒性,可以對以各種角度出現(xiàn)在測試圖片中的物體進行檢測,而且可以進一步估計被檢測目標物體的姿態(tài),克服了以往技術(shù)難以克服的難點,為現(xiàn)代化工業(yè)生產(chǎn)中剛性目標物體的魯棒性快速檢測及姿態(tài)估計提供一種可靠的方法。
文檔編號G06K9/00GK102663769SQ201210065810
公開日2012年9月12日 申請日期2012年3月13日 優(yōu)先權(quán)日2012年3月13日
發(fā)明者劉允才, 卞亞濤, 孔慶杰, 魏超 申請人:上海交通大學