專利名稱:一種融合BoF模型和譜聚類算法的靜態(tài)手勢識別方法
技術領域:
本發(fā)明涉及靜態(tài)圖像中的對象識別技術,尤其涉及一種融合BoF模型和譜聚類算法的靜態(tài)手勢識別方法。
背景技術:
目前手勢識別方法大致可以分為兩類。第一類方法是利用輔助設備進行手勢識另|J,比如數(shù)據(jù)手套(Data Gloves),磁傳感器(Magnetic Sensors)和慣性傳感器(InertialSensors)等;第二類方法是基于計算機視覺的手勢識別算法。相對于基于附加設備的手勢識別算法,該類方法僅僅采用攝像頭進行數(shù)據(jù)采集,不需要在用戶身上附加任何其他設備。 但是基于計算機視覺的手勢識別算法面臨著亟待解決的問題,主要有兩點1)人手本身的結構復雜性人的一只手就有大概14個關節(jié),這就使得手部異常靈活,對于人手這種非剛性對象,如何準確、高效的區(qū)分不同手勢是手勢識別的難點之一 ;2)背景的復雜性人手這種非剛性對象很容易受到環(huán)境的影響,尤其是當背景環(huán)境具有跟人手具有相似的顏色,對手勢的識別影響更加嚴重。為了克服以上兩個面臨的問題,當前出現(xiàn)的一些方法對背景進行嚴格限制,采用膚色模型檢測手部區(qū)域。很明顯這類方法無法應用在復雜背景下的手勢識別。另一類方法是對背景進行建模,通過對手勢本身的特點進行分析檢測手指的位置,最終實現(xiàn)手勢識別。該方法針對已知背景條件下的手勢識別有著較好的識別結果,但無法應用在未知背景條件下的手勢識別。
發(fā)明內容
本發(fā)明為克服上述的不足之處,目的在于提供一種融合BoF模型和譜聚類算法的靜態(tài)手勢識別方法,構建層次化BoF模型用于快速準確地捕捉復雜背景下的手勢特征分布,再通過譜聚類算法過濾掉屬于背景的特征點,保證識別的效率和準確性。本發(fā)明是通過以下技術方案達到上述目的一種融合BoF模型和譜聚類算法的靜態(tài)手勢識別方法,包括識別訓練方法和識別應用方法,識別訓練方法包括以下步驟I)輸入正、負訓練樣本;2)提取正、負訓練樣本的特征點;3)采用基于譜聚類的過濾算法對提取的特征點進行過濾,得到屬于前景的特征占.4)采用基于HIK聚類算法對所有樣本的前景特征點進行聚類;5)根據(jù)所有特征點相對于手部中心的空間分布情況進行劃分以手部中心為圓心,劃分出若干同心區(qū)域,針對不同的區(qū)域對特征點進行分組;6)把所有分組的特征點分別向水平和垂直軸進行投影計算,構建每個投影方向上的直方圖數(shù)據(jù)結構,計算保存特征點的空間分布信息;7)把每個特征點的空間劃分信息和投影信息綜合,構建層層次化BoF模型;8)每個類別的訓練樣本通過層次化BoF模型化,分別得到其直方圖數(shù)據(jù),通過標準化最終構建分類器;9)調用構建的分類器,采用投票機制對樣本進行分類識別樣本的直方圖數(shù)據(jù)與分類器的直方圖數(shù)據(jù)進行相似度對比,直方圖數(shù)據(jù)中相同位置的子結構中包含數(shù)據(jù)數(shù)目越多,樣本就與該分類器越相似,在跟所有類別的BoF模型比較后,選擇最為接近的作為識別結果;10)輸出分類結果;識別應用方法包括以下步驟I)輸入待識別的手勢圖像;2)提取輸入的手勢圖像特征點;
3)采用基于譜聚類的過濾算法對提取的特征點進行過濾,得到屬于前景的特征占.4)調用基于HIK的聚類算法對前景特征點進行聚類;5)根據(jù)所有特征點相對于手部中心的空間分布情況進行劃分以手部中心為圓心,劃分出若干同心區(qū)域,針對不同的區(qū)域對特征點進行分組;6)把所有分組的特征點分別向水平和垂直軸進行投影計算,構建每個投影方向上的直方圖數(shù)據(jù)結構,計算保存特征點的空間分布信息;7)把每個特征點的空間劃分信息和投影信息綜合,構建出次化BoF模型;8)調用識別訓練方法得到的分類器,采用投票機制對樣本進行分類識別樣本的直方圖數(shù)據(jù)與分類器的直方圖數(shù)據(jù)進行相似度對比,直方圖數(shù)據(jù)中相同位置的子結構中包含數(shù)據(jù)數(shù)目越多,樣本就與該分類器越相似,在跟所有類別的BoF模型比較后,選擇最為接近的作為識別結果;9)輸出分類結果。作為優(yōu)選,識別訓練方法中步驟2)所述的提取正、負訓練樣本的特征點和識別應用方法中步驟2)所述的提取輸入的手勢圖像特征點均采用ASIFT算法。本發(fā)明的有益效果在于1、層次化BoF模型在保持了傳統(tǒng)BoF模型運行效率高、相對準確的優(yōu)點基礎上,同時又修正了傳統(tǒng)BoF模型中不包含特征點空間分布信息的缺陷;2、為了進一步提高整個算法的識別效率和準確率,提出了一種基于譜和HIK的過濾算法(Spectral-HIK),該算法在盡量保存前景特征點的基礎上過濾掉大部分的背景特征點,可以有效的提高整個算法的識別效率及準確率。
圖I是本發(fā)明的步驟流程圖;圖2采用基于譜聚類的過濾算法對提取的特征點進行過濾的步驟流程圖;圖3是分類器分類識別的步驟流程圖;圖4a是識別訓練方法中輸入的正、負樣本;圖4b是識別應用方法中輸入的待識別的手勢圖像;圖5a是識別訓練方法中正、負樣本特征點空間分布及投影示意圖;圖5b是識別應用方法中手勢圖像特征點空間分布及投影示意圖。
具體實施例方式下面結合具體實施例對本發(fā)明進行進一步描述,但本發(fā)明的保護范圍并不僅限于此實施例I :如圖I所示,一種融合BoF模型和譜聚類算法的靜態(tài)手勢識別方法,包括識別訓練方法和識別應用方法;(一 )識別訓練方法,步驟如下步驟110 :輸入正、負訓練樣本,輸入的正、負樣本表示如圖4a所示;步驟120 :提取正、負訓練樣本的特征點特征點越多,則識別效率就越高,本發(fā)明采用ASIFT算法作為提取正、負訓練樣本的特征點的方法,正、負訓練樣本中的手勢所在圖像范圍作為特征點的選取區(qū)域,通過特征點對手勢的形狀進行描述; 步驟130 :采用基于譜聚類的過濾算法對提取的特征點進行過濾,得到屬于前景的特征點,步驟如圖2所示步驟131 :輸入特征點集合;步驟132 :輸入的特征點集合構建仿射矩陣A (A e RnXn),其中Au表示兩個點Pi和Pj的相似度;輸入的特征點集合構建對角矩陣D,Dij表示仿射矩陣A第i行的累加;步驟133 :計算對角矩陣D與仿射矩陣A的差矩陣L = D-A;步驟134 :計算差矩陣L的特征向量構建矩陣U (U e Rnxk),其中Iu1, ···%}為矩陣U的列向量集合,{y1; "I1J為矩陣U的行向量集合;步驟135 :根據(jù) HIK 聚類算法 Zw(Vh) = Zmin(KA) (1)
I和聚類相似度算法I p-q 2 = I I Φ (hp) - Φ (hq) | | = Khi (hp-hp) +Khi (hq-hq) -2KHI (hp-hq) (2)對矩陣U的所有行向量進行聚類,得到k個聚類結果(V"Ck,其中,\和h,表示直方圖數(shù)據(jù),i表示直方圖每個子區(qū)域的序號;步驟136 :調用空間分布判斷對聚類結果進行判別,定義平均距離最大的子集判斷為背景子集,判別公式如下gbackground = arg max {averageEuc (g)}, g e G(3)其中,G表示所有特征點子集,averageEuc()表示某個子集中兩個點間的平均歐式距離;步驟137 :輸出最終的過濾結果屬于前景的特征點共23個;步驟140 :調用公式(I)對步驟137輸出的前景特征點進行聚類,聚類結果為三角形的特征點有11個,五角星形狀的特征點有7個,圓形的特征點有5個;步驟150 :根據(jù)所有特征點相對于手部中心的空間分布情況進行劃分以手部中心為圓心,劃分為內部區(qū)域、中間區(qū)域、外部區(qū)域,根據(jù)不同的區(qū)域對特征點進行分組,其中,內部區(qū)域有特征點6個,包括三角形特征點5個、五角星特征點I個;中間區(qū)域有特征點8個,包括三角形特征點4個、五角星特征點3個、圓形特征點I個;外部區(qū)域有特征點9個,包括三角形特征點2個、五角星特征點3個,圓形特征點4個;步驟160 :如圖5a所示,把所有分組的特征點分別向水平和垂直軸進行投影計算,構建每個投影方向上的直方圖數(shù)據(jù)結構,計算保存特征點的空間分布信息;
步驟170 :把每個特征點的空間劃分信息和投影信息綜合,構建出次化BoF模型;步驟180 :每個類別的訓練樣本通過層次化BoF模型化,分別得到每個類別的直方圖數(shù)據(jù),通過標準化最終構建分類器;步驟190 :調用識別訓練方法得到的分類器,采用投票機制對樣本進行分類識別樣本的直方圖數(shù)據(jù)與分類器的直方圖數(shù)據(jù)進行相似度對比,直方圖數(shù)據(jù)中相同位置的子結構中包含數(shù)據(jù)數(shù)目越多,樣本就與該分類器越相似,在跟所有類別的BoF模型比較后,選擇最為接近的作為識別結果,如圖3所示步驟191 :待分類的圖像通過層次化BoF模型處理后得到層次化直方圖數(shù)據(jù)集Hs ;步驟192 :每個手勢得到一個數(shù)據(jù)集Hm,將Hs和Hm進行相似度比較,相似度值最大 的相應的數(shù)據(jù)集為分類結果Hm <Hm,Hs>=^W.([SimQi , ))⑷
,=1 y=l= K=ΥΜ <ΚΑ )
<·(5)式中Hm表示訓練得到的直方圖數(shù)據(jù)模型,扎表示輸入圖像的直方圖數(shù)據(jù)集;Wi為手勢子區(qū)域的權值;手勢子區(qū)域的數(shù)量由N表示;1(表示特征點集聚類數(shù)目;Sim(.,.)是基于HIK的相似函數(shù)屯和h2表示直方圖數(shù)據(jù);步驟200 :輸出分類結果。( 二)識別應用方法包括以下步驟步驟310 :輸入待識別的手勢圖像,如圖4b所示;步驟320 :提取輸入的手勢圖像特征點;步驟330 :采用基于譜聚類的過濾算法對提取的特征點進行過濾,得到屬于前景的特征點,屬于前景的特征點共23個;步驟340 :調用基于HIK的聚類算法對前景特征點進行聚類,聚類結果為三角形的特征點有11個,五角星形狀的特征點有7個,圓形的特征點有5個;步驟350 :根據(jù)所有特征點相對于手部中心的空間分布情況進行劃分以手部中心為圓心,劃分為內部區(qū)域、中間區(qū)域、外部區(qū)域,根據(jù)不同的區(qū)域對特征點進行分組,其中,內部區(qū)域有特征點6個,包括三角形特征點5個、五角星特征點I個;中間區(qū)域有特征點8個,包括三角形特征點4個、五角星特征點3個、圓形特征點I個;外部區(qū)域有特征點9個,包括三角形特征點2個、五角星特征點3個,圓形特征點4個;步驟360 :如圖5b所示,把所有分組的特征點分別向水平和垂直軸進行投影計算,構建每個投影方向上的直方圖數(shù)據(jù)結構,計算保存特征點的空間分布信息;步驟370 :把每個特征點的空間劃分信息和投影信息綜合,構建出層次化BoF模型;步驟380 :樣本的直方圖數(shù)據(jù)與分類器的直方圖數(shù)據(jù)進行相似度對比,樣本的直方圖數(shù)據(jù)與分類器的直方圖數(shù)據(jù)在相同位置的子結構中包含數(shù)據(jù)數(shù)目相同,則選擇此分類器為識別結果;
步驟390 :輸出識別結果。
以上的所述乃是本發(fā)明的具體實施例及所運用的技術原理,若依本發(fā)明的構想所作的改變,其所產生的功能作用仍未超出說明書及附圖所涵蓋的精神時,仍應屬本發(fā)明的保護范圍。
權利要求
1.一種融合BoF模型和譜聚類算法的靜態(tài)手勢識別方法,其特征在于包括識別訓練方法和識別應用方法,識別訓練方法包括以下步驟 1)輸入正、負訓練樣本; 2)提取正、負訓練樣本的特征點; 3)采用基于譜聚類的過濾算法對提取的特征點進行過濾,得到屬于前景的特征點; 4)采用基于HIK聚類算法對所有樣本的前景特征點進行聚類; 5)根據(jù)所有特征點相對于手部中心的空間分布情況進行劃分以手部中心為圓心,劃分出若干同心區(qū)域,針對不同的區(qū)域對特征點進行分組; 6)把所有分組的特征點分別向水平和垂直軸進行投影計算,構建每個投影方向上的直方圖數(shù)據(jù)結構,計算保存特征點的空間分布信息; 7)把每個特征點的空間劃分信息和投影信息綜合,構建層次化BoF模型; 8)每個類別的訓練樣本通過層次化BoF模型化,分別得到每個類別的直方圖數(shù)據(jù),通過標準化最終構建分類器; 9)調用構建的分類器,采用投票機制對樣本進行分類識別樣本的直方圖數(shù)據(jù)與分類器的直方圖數(shù)據(jù)進行相似度對比,直方圖數(shù)據(jù)中相同位置的子結構中包含數(shù)據(jù)數(shù)目越多,樣本就與該分類器越相似,在跟所有類別的BoF模型比較后,選擇最為接近的作為識別結果; 10)輸出分類結果; 識別應用方法包括以下步驟 1)輸入待識別的手勢圖像; 2)提取輸入的手勢圖像特征點; 3)采用基于譜聚類的過濾算法對提取的特征點進行過濾,得到屬于前景的特征點; 4)調用基于HIK的聚類算法對前景特征點進行聚類; 5)根據(jù)所有特征點相對于手部中心的空間分布情況進行劃分以手部中心為圓心,劃分出若干同心區(qū)域,針對不同的區(qū)域對特征點進行分組; 6)把所有分組的特征點分別向水平和垂直軸進行投影計算,構建每個投影方向上的直方圖數(shù)據(jù)結構,計算保存特征點的空間分布信息; 7)把每個特征點的空間劃分信息和投影信息綜合,構建出次化BoF模型; 8)調用識別訓練方法得到的分類器,采用投票機制對樣本進行分類識別樣本的直方圖數(shù)據(jù)與分類器的直方圖數(shù)據(jù)進行相似度對比,直方圖數(shù)據(jù)中相同位置的子結構中包含數(shù)據(jù)數(shù)目越多,樣本就與該分類器越相似,在跟所有類別的BoF模型比較后,選擇最為接近的作為識別結果; 9)輸出分類結果。
2.根據(jù)權利要求I所述的一種融合BoF模型和譜聚類算法的靜態(tài)手勢識別方法,其特征在于,識別訓練方法中步驟2)所述的提取正、負訓練樣本的特征點和識別應用方法中步驟2)所述的提取輸入的手勢圖像特征點均采用ASIFT算法。
全文摘要
本發(fā)明涉及靜態(tài)圖像中的對象識別技術,尤其涉及一種融合BoF模型和譜聚類算法的靜態(tài)手勢識別方法,包括識別訓練方法和識別應用方法,構建層次化BoF模型用于快速準確地捕捉復雜背景下的手勢特征分布,再通過譜聚類算法過濾掉屬于背景的特征點,保證識別的效率和準確性。本發(fā)明的有益效果在于1、層次化BoF模型在保持了傳統(tǒng)BoF模型運行效率高、相對準確的優(yōu)點基礎上,同時又修正了傳統(tǒng)BoF模型中不包含特征點空間分布信息的缺陷;2、提出了一種基于譜和HIK的過濾算法(Spectral-HIK),該算法在盡量保存前景特征點的基礎上過濾掉大部分的背景特征點,可以有效的提高整個算法的識別效率及準確率。
文檔編號G06K9/62GK102968618SQ20121042063
公開日2013年3月13日 申請日期2012年10月24日 優(yōu)先權日2012年10月24日
發(fā)明者陳嶺, 闖躍龍, 王敬昌, 趙江奇, 解正宇 申請人:浙江鴻程計算機系統(tǒng)有限公司