專(zhuān)利名稱(chēng):一種基于表觀特征的靜態(tài)手勢(shì)快速識(shí)別法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種靜態(tài)手勢(shì)快速識(shí)別法,尤其涉及應(yīng)用在MP4、電子書(shū)、手機(jī)等電子產(chǎn)品中手勢(shì)快速識(shí)別法。
背景技術(shù):
在手勢(shì)識(shí)別的過(guò)程中,首先通過(guò)一個(gè)攝像頭獲取使用者做出手勢(shì)的視頻數(shù)據(jù)流, 然后系統(tǒng)依照膚色檢測(cè)方法檢測(cè)是否有手勢(shì)出現(xiàn)在畫(huà)面中,若發(fā)現(xiàn)了手勢(shì)則將其分割提取出來(lái),接下來(lái),對(duì)分割提取之后的手勢(shì)二值圖像進(jìn)行一系列的圖像預(yù)處理,然后進(jìn)行手勢(shì)分析,分析過(guò)程中包括了手勢(shì)的特征提取以及手勢(shì)判定,手勢(shì)判定就是將提取到的特征結(jié)果轉(zhuǎn)換成符號(hào)或語(yǔ)言的描述,系統(tǒng)會(huì)依據(jù)描述結(jié)果給予相應(yīng)的應(yīng)用。具體步驟如圖I所示?,F(xiàn)有大多數(shù)識(shí)別方法采用的是HIS (色調(diào)H\強(qiáng)度1\飽和度S)的膚色識(shí)別方法, 理由是HSI色彩模式更接近于人們對(duì)于色彩的認(rèn)識(shí)和解釋。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)中問(wèn)題,本發(fā)明提供了一種基于表觀特征的靜態(tài)手勢(shì)快速識(shí)別法,其特征在于,其包括以下步驟步驟1,手勢(shì)的檢測(cè)和手勢(shì)的分割提取,對(duì)圖像中的每一個(gè)像素點(diǎn)進(jìn)行閾值判斷, 把符合膚色在RGB色彩空間閾值范圍的像素點(diǎn)的值置為零,不符合膚色特性的區(qū)域的像素點(diǎn)的值置為一,得到手勢(shì)的二值圖像;步驟2,手勢(shì)的二值圖像的預(yù)處理,將噪聲去除;步驟3 :手勢(shì)的特征提取及識(shí)別。作為本發(fā)明的進(jìn)一步改進(jìn),步驟2中選取鄰域平滑法去噪處理,即將固定區(qū)域內(nèi)的所有點(diǎn)的灰度平均值作為該像素點(diǎn)的灰度值,對(duì)于經(jīng)過(guò)鄰域平滑法去噪處理后的二值圖像,再找出其中最大的連通區(qū)域,然后舍掉所有小的連通區(qū)域。作為本發(fā)明的進(jìn)一步改進(jìn),手勢(shì)為表示“上移”、“下移”、“左移”、“右移”、“確認(rèn)”和
“退出”的手勢(shì)。作為本發(fā)明的進(jìn)一步改進(jìn),步驟3中,首先繪制手勢(shì)區(qū)域長(zhǎng)為L(zhǎng),寬為W的矩形框, 若L/W< 1,則手是橫向的,再根據(jù)特性手指的寬度小于手掌的寬度,分別在靠近矩形框的左邊和靠近矩形框的右邊分別計(jì)算出手勢(shì)的寬度c和d,然后把c和d進(jìn)行比較,若c < d 則手指在左端,手掌在右端,若c > d則手指在右端,手掌在左端。作為本發(fā)明的進(jìn)一步改進(jìn),矩形框繪制方法如下找出畫(huà)面中手勢(shì)區(qū)域的橫坐標(biāo)的最大值Xmax和最小值Xmin,以及縱坐標(biāo)的最小值Ymin和最大值Ymax,根據(jù)公式
權(quán)利要求
1.一種基于表觀特征的靜態(tài)手勢(shì)快速識(shí)別法,其特征在于,其包括以下步驟步驟1,手勢(shì)的檢測(cè)和手勢(shì)的分割提取,對(duì)圖像中的每一個(gè)像素點(diǎn)進(jìn)行閾值判斷,把符合膚色在RGB色彩空間閾值范圍的像素點(diǎn)的值置為零,不符合膚色特性的區(qū)域的像素點(diǎn)的值置為一,得到手勢(shì)的二值圖像;步驟2,手勢(shì)的二值圖像的預(yù)處理,將噪聲去除;步驟3 :手勢(shì)的特征提取及識(shí)別。
2.根據(jù)權(quán)利要求I所述的一種基于表觀特征的靜態(tài)手勢(shì)快速識(shí)別法,其特征在于步驟2中選取鄰域平滑法去噪處理,即將固定區(qū)域內(nèi)的所有點(diǎn)的灰度平均值作為該像素點(diǎn)的灰度值,對(duì)于經(jīng)過(guò)鄰域平滑法去噪處理后的二值圖像,再找出其中最大的連通區(qū)域,然后舍掉所有小的連通區(qū)域。
3.根據(jù)權(quán)利要求2所述的一種基于表觀特征的靜態(tài)手勢(shì)快速識(shí)別法,其特征在于手勢(shì)為表示“上移”、“下移”、“左移”、“右移”、“確認(rèn)”和“退出”的手勢(shì)。
4.根據(jù)權(quán)利要求3所述的一種基于表觀特征的靜態(tài)手勢(shì)快速識(shí)別法,其特征在于步驟3中,首先繪制手勢(shì)區(qū)域長(zhǎng)為L(zhǎng),寬為W的矩形框,若L/W < I,則手是橫向的,再根據(jù)特性 手指的寬度小于手掌的寬度,分別在靠近矩形框的左邊和靠近矩形框的右邊分別計(jì)算出手勢(shì)的寬度c和d,然后把c和d進(jìn)行比較,若c < d則手指在左端,手掌在右端,若c > d則手指在右端,手掌在左端。
5.根據(jù)權(quán)利要求4所述的一種基于表觀特征的靜態(tài)手勢(shì)快速識(shí)別法,其特征在于矩形框繪制方法如下找出畫(huà)面中手勢(shì)區(qū)域的橫坐標(biāo)的最大值Xmax和最小值Xmin,以及縱坐標(biāo)的最小值Ymin和最大值Ymax,根據(jù)公式r_F m:F -求出外接最小矩形的各邊長(zhǎng),以圖像L — max min中的坐標(biāo)值為(Xmin,Ymin)的點(diǎn)為矩形的左上角繪制一個(gè)長(zhǎng)為L(zhǎng),寬為W的矩形框。
6.根據(jù)權(quán)利要求3所述的一種基于表觀特征的靜態(tài)手勢(shì)快速識(shí)別法,其特征在于步驟3中,首先繪制手勢(shì)區(qū)域長(zhǎng)為L(zhǎng),寬為W的矩形框,若L/W < I,則在距離矩形框的上半部分等間隔的畫(huà)7條線,分別求出每條線上顏色突變的點(diǎn)的個(gè)數(shù),然后這七個(gè)數(shù)字中重復(fù)次數(shù)最多的那個(gè)數(shù)就是要用到的特征值,根據(jù)它求出圖像中手指的個(gè)數(shù)。
7.根據(jù)權(quán)利要求6所述的一種基于表觀特征的靜態(tài)手勢(shì)快速識(shí)別法,其特征在于所述的上半部分指上邊的四分之一處到二分之一處。
8.根據(jù)權(quán)利要求6所述的一種基于表觀特征的靜態(tài)手勢(shì)快速識(shí)別法,其特征在于其中4出現(xiàn)的次數(shù)最多,則N = 4,說(shuō)明有二根手指,若6出現(xiàn)的次數(shù)最多,N = 6說(shuō)明有三根手指,若2出現(xiàn)的次數(shù)最多,N = 2,說(shuō)明有一根手指。
全文摘要
本發(fā)明提供了一種基于表觀特征的靜態(tài)手勢(shì)快速識(shí)別法,其包括以下步驟步驟1,手勢(shì)的檢測(cè)和手勢(shì)的分割提取,對(duì)圖像中的每一個(gè)像素點(diǎn)進(jìn)行閾值判斷,把符合膚色在RGB色彩空間閾值范圍的像素點(diǎn)的值置為零,不符合膚色特性的區(qū)域的像素點(diǎn)的值置為一,得到手勢(shì)的二值圖像;步驟2,手勢(shì)的二值圖像的預(yù)處理,將噪聲去除;步驟3手勢(shì)的特征提取及識(shí)別。本發(fā)明提出了靜態(tài)手勢(shì)快速識(shí)別法,該方法可以應(yīng)用在MP4、電子書(shū)、手機(jī)等電子產(chǎn)品中,取代基礎(chǔ)的操作,包括“上移”、“下移”、“左移”、“右移”、“確認(rèn)”、“退出”,它在沒(méi)有降低識(shí)別正確率的同時(shí)提高了系統(tǒng)的實(shí)時(shí)性,使人們?cè)诓僮魇褂弥袥](méi)有時(shí)滯的弊端,實(shí)現(xiàn)了自然地人機(jī)交互。
文檔編號(hào)G06K9/46GK102592113SQ20111043934
公開(kāi)日2012年7月18日 申請(qǐng)日期2011年12月23日 優(yōu)先權(quán)日2011年12月23日
發(fā)明者張欽宇, 方文釗, 李云鶴, 林威, 梁玉鋒, 田甜 申請(qǐng)人:哈爾濱工業(yè)大學(xué)深圳研究生院