圖像識別方法和裝置制造方法

文檔序號：6632244閱讀：280來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

圖像識別方法和裝置制造方法
【專利摘要】本發(fā)明提出一種圖像識別方法和裝置，該圖像識別方法包括：通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域；在手部特征區(qū)域中，通過對伸出手指的手部形態(tài)特征進(jìn)行模式識別；在所述手指尖對目標(biāo)物體的外緣進(jìn)行圈劃標(biāo)定的時(shí)間區(qū)間內(nèi)，將手指尖的特征點(diǎn)的幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形；將全周長幾何形在用戶的視線方向與目標(biāo)物體所在的相垂直平面上進(jìn)行投影，將投影獲得的區(qū)域作為識別區(qū)域進(jìn)行圖像識別。本發(fā)明可以實(shí)現(xiàn)用戶只需伸出手指，用手指尖對著目標(biāo)物體的外緣進(jìn)行圈劃，即可快速獲得對目標(biāo)物體的標(biāo)定和圖像分割，進(jìn)而可以作為對目標(biāo)物體進(jìn)行圖像識別的識別輸入，操作簡單，用戶體驗(yàn)度高，并且適用性較高。
【專利說明】圖像識別方法和裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】，尤其涉及一種圖像識別方法和裝置。

【背景技術(shù)】
[0002]現(xiàn)有技術(shù)中，對于圖像識別和機(jī)器視覺認(rèn)知的輸入均是采用先拍照再確定目標(biāo)物體的方式，一般是先拍照將目標(biāo)物體的前景環(huán)境和后景環(huán)境的圖片保存，然后通過手指在屏幕上圈劃將目標(biāo)物體圈選并分割，進(jìn)而進(jìn)行圖像識別。上述方式需要人工干預(yù)標(biāo)定已經(jīng)拍過的照片，例如:對已經(jīng)拍過的照片進(jìn)行圈劃和涂抹，操作步驟繁瑣并且用戶體驗(yàn)不流暢，一定程度上是反人類常見的認(rèn)知事物的過程的流程方式。另外，上述方式只適用于帶觸摸屏的智能終端，適用性較差。

【發(fā)明內(nèi)容】

[0003]本發(fā)明的目的旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
[0004]為此，本發(fā)明的第一個(gè)目的在于提出一種圖像識別方法。通過該方法，用戶在對目標(biāo)物體進(jìn)行圖像識別的過程中，只需伸出手指，用手指尖對著目標(biāo)物體的外緣進(jìn)行圈劃，即可快速獲得對目標(biāo)物體的標(biāo)定和圖像分割，進(jìn)而可以作為對目標(biāo)物體進(jìn)行圖像識別的識別輸入，操作簡單，用戶體驗(yàn)度高，并且適用性較高。
[0005]本發(fā)明的第二個(gè)目的在于提出一種圖像識別裝置。
[0006]為了實(shí)現(xiàn)上述實(shí)施例，本發(fā)明第一方面實(shí)施例的圖像識別方法，包括:通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域，并對所述手部特征區(qū)域進(jìn)行實(shí)時(shí)捕捉和追蹤；在被檢測和捕捉到的手部特征區(qū)域中，通過對伸出手指的手部形態(tài)特征進(jìn)行模式識別，獲得手指尖的特征和位置信息，并對所述手指尖的特征和位置信息進(jìn)行實(shí)時(shí)捕捉和追蹤；在所述手指尖對目標(biāo)物體的外緣進(jìn)行圈劃標(biāo)定的時(shí)間區(qū)間內(nèi)，記錄所述手指尖的特征點(diǎn)的幀間位移，將所述幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形；將所述全周長幾何形在所述用戶的視線方向與所述目標(biāo)物體所在的相垂直平面上進(jìn)行投影，將投影獲得的區(qū)域作為所述目標(biāo)物體的識別區(qū)域進(jìn)行圖像識別。
[0007]本發(fā)明實(shí)施例的圖像識別方法，通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域，在被檢測和捕捉到的手部特征區(qū)域中，通過對伸出手指的手部形態(tài)特征進(jìn)行模式識別，在手指尖對目標(biāo)物體的外緣進(jìn)行圈劃標(biāo)定的時(shí)間區(qū)間內(nèi)，記錄手指尖的特征點(diǎn)的幀間位移，將幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形，然后將上述全周長幾何形在上述用戶的視線方向與目標(biāo)物體所在的相垂直平面上進(jìn)行投影，將投影獲得的區(qū)域作為所述目標(biāo)物體的識別區(qū)域進(jìn)行圖像識別，從而可以實(shí)現(xiàn)用戶在對目標(biāo)物體進(jìn)行圖像識別的過程中，只需伸出手指，用手指尖對著目標(biāo)物體的外緣進(jìn)行圈劃，即可快速獲得對目標(biāo)物體的標(biāo)定和圖像分割，進(jìn)而可以作為對目標(biāo)物體進(jìn)行圖像識別的識別輸入，操作簡單，用戶體驗(yàn)度高，并且適用性較高。
[0008]為了實(shí)現(xiàn)上述實(shí)施例，本發(fā)明第二方面實(shí)施例的圖像識別裝置包括:獲取模塊，用于通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域；跟蹤模塊，用于對所述獲取模塊獲取的手部特征區(qū)域進(jìn)行實(shí)時(shí)捕捉和追蹤；所述獲取模塊，還用于在被所述跟蹤模塊檢測和捕捉到的手部特征區(qū)域中，通過對伸出手指的手部形態(tài)特征進(jìn)行模式識別，獲得手指尖的特征和位置信息；所述跟蹤模塊，還用于對所述手指尖的特征和位置信息進(jìn)行實(shí)時(shí)捕捉和追蹤；記錄模塊，用于在所述手指尖對目標(biāo)物體的外緣進(jìn)行圈劃標(biāo)定的時(shí)間區(qū)間內(nèi)，記錄所述手指尖的特征點(diǎn)的幀間位移，將所述幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形；投影模塊，用于將所述全周長幾何形在所述用戶的視線方向與所述目標(biāo)物體所在的相垂直平面上進(jìn)行投影，將投影獲得的區(qū)域作為所述目標(biāo)物體的識別區(qū)域進(jìn)行圖像識別。
[0009]本發(fā)明實(shí)施例的圖像識別裝置，獲取模塊通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域，在被跟蹤模塊檢測和捕捉到的手部特征區(qū)域中，獲取模塊通過對伸出手指的手部形態(tài)特征進(jìn)行模式識別，在手指尖對目標(biāo)物體的外緣進(jìn)行圈劃標(biāo)定的時(shí)間區(qū)間內(nèi)，記錄模塊記錄手指尖的特征點(diǎn)的幀間位移，將幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形，然后投影模塊將上述全周長幾何形在上述用戶的視線方向與目標(biāo)物體所在的相垂直平面上進(jìn)行投影，將投影獲得的區(qū)域作為所述目標(biāo)物體的識別區(qū)域進(jìn)行圖像識別，從而可以實(shí)現(xiàn)用戶在對目標(biāo)物體進(jìn)行圖像識別的過程中，只需伸出手指，用手指尖對著目標(biāo)物體的外緣進(jìn)行圈劃，即可快速獲得對目標(biāo)物體的標(biāo)定和圖像分割，進(jìn)而可以作為對目標(biāo)物體進(jìn)行圖像識別的識別輸入，操作簡單，用戶體驗(yàn)度高，并且適用性較高。
[0010]本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出，部分將從下面的描述中變得明顯，或通過本發(fā)明的實(shí)踐了解到。

【專利附圖】

【附圖說明】
[0011]本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對實(shí)施例的描述中將變得明顯和容易理解，其中:
[0012]圖1為本發(fā)明圖像識別方法一個(gè)實(shí)施例的流程圖；
[0013]圖2為本發(fā)明圖像識別方法另一個(gè)實(shí)施例的示意圖；
[0014]圖3為本發(fā)明圖像識別裝置一個(gè)實(shí)施例的結(jié)構(gòu)示意圖；
[0015]圖4為本發(fā)明圖像識別裝置另一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。

【具體實(shí)施方式】
[0016]下面詳細(xì)描述本發(fā)明的實(shí)施例，所述實(shí)施例的示例在附圖中示出，其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的，僅用于解釋本發(fā)明，而不能理解為對本發(fā)明的限制。相反，本發(fā)明的實(shí)施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
[0017]圖1為本發(fā)明圖像識別方法一個(gè)實(shí)施例的流程圖，如圖1所示，該圖像識別方法可以包括:
[0018]步驟101，通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域，并對上述手部特征區(qū)域進(jìn)行實(shí)時(shí)捕捉和追蹤。
[0019]進(jìn)一步地，通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域之前，還可以接收用戶通過語音、觸摸屏或者動(dòng)態(tài)傳感器輸入的圖像識別請求，以觸發(fā)通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域的操作。
[0020]步驟102，在被檢測和捕捉到的手部特征區(qū)域中，通過對伸出手指的手部形態(tài)特征進(jìn)行模式識別，獲得手指尖的特征和位置信息，并對上述手指尖的特征和位置信息進(jìn)行實(shí)時(shí)捕捉和追蹤。
[0021]步驟103，在上述手指尖對目標(biāo)物體的外緣進(jìn)行圈劃標(biāo)定的時(shí)間區(qū)間內(nèi)，記錄上述手指尖的特征點(diǎn)的幀間位移，將上述幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形。
[0022]具體地，將上述幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形可以為:通過閉合曲線優(yōu)化算法將上述幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形。
[0023]步驟104，將上述全周長幾何形在上述用戶的視線方向與上述目標(biāo)物體所在的相垂直平面上進(jìn)行投影，將投影獲得的區(qū)域作為上述目標(biāo)物體的識別區(qū)域進(jìn)行圖像識別。
[0024]上述實(shí)施例中，通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域，在被檢測和捕捉到的手部特征區(qū)域中，通過對伸出手指的手部形態(tài)特征進(jìn)行模式識別，在手指尖對目標(biāo)物體的外緣進(jìn)行圈劃標(biāo)定的時(shí)間區(qū)間內(nèi)，記錄手指尖的特征點(diǎn)的幀間位移，將幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形，然后將上述全周長幾何形在上述用戶的視線方向與目標(biāo)物體所在的相垂直平面上進(jìn)行投影，將投影獲得的區(qū)域作為所述目標(biāo)物體的識別區(qū)域進(jìn)行圖像識別，從而可以實(shí)現(xiàn)用戶在對目標(biāo)物體進(jìn)行圖像識別的過程中，只需伸出手指，用手指尖對著目標(biāo)物體的外緣進(jìn)行圈劃，即可快速獲得對目標(biāo)物體的標(biāo)定和圖像分割，進(jìn)而可以作為對目標(biāo)物體進(jìn)行圖像識別的識別輸入，操作簡單，用戶體驗(yàn)度高,并且適用性較高。
[0025]圖2為本發(fā)明圖像識別方法另一個(gè)實(shí)施例的示意圖，如圖2所示，本實(shí)施例中，帶有攝像頭的智能設(shè)備接收到用戶通過語音、或觸摸屏或者動(dòng)態(tài)傳感器輸入的圖像識別請求之后，開啟上述智能設(shè)備上的攝像頭，通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域，并對上述手部特征區(qū)域進(jìn)行實(shí)時(shí)捕捉和追蹤，然后通過語音等交互方式引導(dǎo)用戶將手指尖特征點(diǎn)進(jìn)行識別和捕捉，然后引導(dǎo)用戶完成對目標(biāo)物品進(jìn)行圈劃標(biāo)定這個(gè)手勢動(dòng)作，在上述手指尖對目標(biāo)物體的外緣進(jìn)行圈劃標(biāo)定的時(shí)間區(qū)間內(nèi)，跟蹤手指尖圈劃的路徑，記錄上述手指尖的特征點(diǎn)的幀間位移，將上述幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形，將上述全周長幾何形在上述用戶的視線方向與上述目標(biāo)物體所在的相垂直平面上進(jìn)行投影，將投影獲得的區(qū)域作為上述目標(biāo)物體的識別區(qū)域進(jìn)行圖像識別，從而在自然的圈劃標(biāo)定行為過程中進(jìn)行圖像分割進(jìn)而識別，識別之后通過上述智能設(shè)備的聲音音頻輸出通道或者屏幕圖像輸出通道將識別結(jié)果輸出給用戶，完成對于目標(biāo)物體的識別過程。本實(shí)施例中的目標(biāo)物體通常是離開用戶有一定距離的遠(yuǎn)處物體或者是用戶不能夠觸及的物體，又或是大型物體或無法移動(dòng)的固定物體，當(dāng)然本發(fā)明實(shí)施例并不僅限于此，本發(fā)明對目標(biāo)物體的具體形態(tài)不作限定。
[0026]本發(fā)明中，上述帶有攝像頭的智能設(shè)備可以為帶有攝像頭的智能移動(dòng)終端，或者帶有攝像頭的頭戴式穿戴設(shè)備，例如:谷歌眼鏡(Google Glass)、百度智能眼鏡(BaiduEye)等，或者帶有攝像頭的智能手表，或者帶有攝像頭視覺輸入的機(jī)器人，本發(fā)明對此不作限定。
[0027]圖3為本發(fā)明圖像識別裝置一個(gè)實(shí)施例的結(jié)構(gòu)示意圖，本實(shí)施例中的圖像識別裝置可以實(shí)現(xiàn)本發(fā)明圖1所示實(shí)施例的流程，如圖3所示，該圖像識別裝置可以包括:獲取模塊31、跟蹤模塊32、記錄模塊33和投影模塊34 ；
[0028]其中，獲取模塊31，用于通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域。
[0029]跟蹤模塊32，用于對獲取模塊31獲取的手部特征區(qū)域進(jìn)行實(shí)時(shí)捕捉和追蹤。
[0030]獲取模塊31，還用于在被跟蹤模塊32檢測和捕捉到的手部特征區(qū)域中，通過對伸出手指的手部形態(tài)特征進(jìn)行模式識別，獲得手指尖的特征和位置信息。
[0031]跟蹤模塊32，還用于對上述手指尖的特征和位置信息進(jìn)行實(shí)時(shí)捕捉和追蹤。
[0032]記錄模塊33，用于在上述手指尖對目標(biāo)物體的外緣進(jìn)行圈劃標(biāo)定的時(shí)間區(qū)間內(nèi)，記錄上述手指尖的特征點(diǎn)的幀間位移，將上述幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形；其中，記錄模塊33用于將上述幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形可以為:記錄模塊33，具體用于通過閉合曲線優(yōu)化算法將上述幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形。
[0033]投影模塊34，用于將上述全周長幾何形在上述用戶的視線方向與上述目標(biāo)物體所在的相垂直平面上進(jìn)行投影，將投影獲得的區(qū)域作為上述目標(biāo)物體的識別區(qū)域進(jìn)行圖像識別。
[0034]本實(shí)施例中，上述圖像識別裝置可以為帶有攝像頭的智能設(shè)備，或者帶有攝像頭的智能設(shè)備的一部分，其中，獲取模塊31、跟蹤模塊32和/或記錄模塊33的部分或全部功能可以通過上述智能設(shè)備的攝像頭實(shí)現(xiàn)。
[0035]上述帶有攝像頭的智能設(shè)備可以為帶有攝像頭的智能移動(dòng)終端，或者帶有攝像頭的頭戴式穿戴設(shè)備，例如:谷歌眼鏡(Google Glass)、百度智能眼鏡(BaiduEye)等,或者帶有攝像頭的智能手表，或者帶有攝像頭視覺輸入的機(jī)器人，本實(shí)施例對此不作限定。
[0036]上述圖像識別裝置中，獲取模塊31通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域，在被跟蹤模塊32檢測和捕捉到的手部特征區(qū)域中，獲取模塊31通過對伸出手指的手部形態(tài)特征進(jìn)行模式識別，在手指尖對目標(biāo)物體的外緣進(jìn)行圈劃標(biāo)定的時(shí)間區(qū)間內(nèi)，記錄模塊33記錄手指尖的特征點(diǎn)的幀間位移，將幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形，然后投影模塊34將上述全周長幾何形在上述用戶的視線方向與目標(biāo)物體所在的相垂直平面上進(jìn)行投影，將投影獲得的區(qū)域作為所述目標(biāo)物體的識別區(qū)域進(jìn)行圖像識別，從而可以實(shí)現(xiàn)用戶在對目標(biāo)物體進(jìn)行圖像識別的過程中，只需伸出手指，用手指尖對著目標(biāo)物體的外緣進(jìn)行圈劃，即可快速獲得對目標(biāo)物體的標(biāo)定和圖像分割，進(jìn)而可以作為對目標(biāo)物體進(jìn)行圖像識別的識別輸入，操作簡單，用戶體驗(yàn)度高，并且適用性較聞。
[0037]圖4為本發(fā)明圖像識別裝置另一個(gè)實(shí)施例的結(jié)構(gòu)示意圖，與圖3所示的裝置相比，不同之處在于，圖4所示的圖像識別裝置還可以包括:
[0038]接收模塊35，用于接收用戶通過語音、觸摸屏或者動(dòng)態(tài)傳感器輸入的圖像識別請求，以觸發(fā)通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域的操作。
[0039]也就是說，本實(shí)施例中，接收模塊35接收到用戶通過語音、或觸摸屏或者動(dòng)態(tài)傳感器輸入的圖像識別請求之后，開啟攝像頭，獲取模塊31通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域，跟蹤模塊32對上述手部特征區(qū)域進(jìn)行實(shí)時(shí)捕捉和追蹤，然后通過語音等交互方式引導(dǎo)用戶將手指尖特征點(diǎn)進(jìn)行識別和捕捉，然后引導(dǎo)用戶完成對目標(biāo)物品進(jìn)行圈劃標(biāo)定這個(gè)手勢動(dòng)作，在上述手指尖對目標(biāo)物體的外緣進(jìn)行圈劃標(biāo)定的時(shí)間區(qū)間內(nèi)，跟蹤模塊32跟蹤手指尖圈劃的路徑，記錄模塊33記錄上述手指尖的特征點(diǎn)的幀間位移，將上述幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形，投影模塊34將上述全周長幾何形在上述用戶的視線方向與上述目標(biāo)物體所在的相垂直平面上進(jìn)行投影，將投影獲得的區(qū)域作為上述目標(biāo)物體的識別區(qū)域進(jìn)行圖像識別，從而在自然的圈劃標(biāo)定行為過程中進(jìn)行圖像分割進(jìn)而識別，識別之后通過圖像識別裝置的聲音音頻輸出通道或者屏幕圖像輸出通道將識別結(jié)果輸出給用戶，完成對于目標(biāo)物體的識別過程。
[0040]上述圖像識別裝置可以實(shí)現(xiàn)用戶在對目標(biāo)物體進(jìn)行圖像識別的過程中，只需伸出手指，用手指尖對著目標(biāo)物體的外緣進(jìn)行圈劃，即可快速獲得對目標(biāo)物體的標(biāo)定和圖像分害I]，進(jìn)而可以作為對目標(biāo)物體進(jìn)行圖像識別的識別輸入，操作簡單，用戶體驗(yàn)度高，并且適用性較高。
[0041]圖像識別是人工智能方向最重要的突破，而且具有相當(dāng)廣泛且有價(jià)值的使用場景，是今后搜索領(lǐng)域的重中之重，本發(fā)明采用全新的人機(jī)交互方式，自然的用戶界面接口，比現(xiàn)有的先拍照再對目標(biāo)物體進(jìn)行圈劃涂抹的圖像識別方式更自然更便捷。對于智能穿戴設(shè)備上的圖像識別功能，自然的交互方式顯得尤為重要，本發(fā)明可以實(shí)現(xiàn)用戶對眼前的物品“直接隔空圈劃標(biāo)定即可搜索獲得結(jié)果”，本發(fā)明所實(shí)現(xiàn)的交互方式和用戶體驗(yàn)是一種相當(dāng)大的區(qū)別于其他同類或相似類別產(chǎn)品的重要特性。
[0042]本發(fā)明提供的方法是各種可以進(jìn)行第一視角做視覺圖像信息捕捉和處理的一切智能產(chǎn)品非常有可能會(huì)涉及并采用的方法，本發(fā)明提供的方法是從底層算法到表象人機(jī)交互方式都有可能會(huì)復(fù)制并立即采用到產(chǎn)品中的一個(gè)特性和技術(shù)支持，是作為穿戴式智能視覺產(chǎn)品進(jìn)行手勢識別的一個(gè)基本技術(shù)支持。
[0043]需要說明的是，在本發(fā)明的描述中，術(shù)語“第一”、“第二”等僅用于描述目的，而不能理解為指示或暗示相對重要性。此外，在本發(fā)明的描述中，除非另有說明，“多個(gè)”的含義是兩個(gè)或兩個(gè)以上。
[0044]流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為，表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分，并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn)，其中可以不按所示出或討論的順序，包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序，來執(zhí)行功能，這應(yīng)被本發(fā)明的實(shí)施例所屬【技術(shù)領(lǐng)域】的技術(shù)人員所理解。
[0045]應(yīng)當(dāng)理解，本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中，多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。例如，如果用硬件來實(shí)現(xiàn)，和在另一實(shí)施方式中一樣，可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對數(shù)據(jù)信號實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路，具有合適的組合邏輯門電路的專用集成電路，可編程門陣列(Programmable Gate Array ;以下簡稱:PGA),現(xiàn)場可編程門陣列(Field ProgrammableGate Array ;以下簡稱:FPGA)等。
[0046]本【技術(shù)領(lǐng)域】的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成，所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中，該程序在執(zhí)行時(shí)，包括方法實(shí)施例的步驟之一或其組合。
[0047]此外，本發(fā)明各個(gè)實(shí)施例中的各功能模塊可以集成在一個(gè)處理模塊中，也可以是各個(gè)模塊單獨(dú)物理存在，也可以兩個(gè)或兩個(gè)以上模塊集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn)，也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí)，也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。
[0048]上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器，磁盤或光盤等。
[0049]在本說明書的描述中，參考術(shù)語“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中，對上述術(shù)語的示意性表述不一定指的是相同的實(shí)施例或示例。而且，描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。
[0050]盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例，可以理解的是，上述實(shí)施例是示例性的，不能理解為對本發(fā)明的限制，本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對上述實(shí)施例進(jìn)行變化、修改、替換和變型。
【權(quán)利要求】
1.一種圖像識別方法，其特征在于，包括: 通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域，并對所述手部特征區(qū)域進(jìn)行實(shí)時(shí)捕捉和追蹤；在被檢測和捕捉到的手部特征區(qū)域中，通過對伸出手指的手部形態(tài)特征進(jìn)行模式識另IJ，獲得手指尖的特征和位置信息，并對所述手指尖的特征和位置信息進(jìn)行實(shí)時(shí)捕捉和追蹤; 在所述手指尖對目標(biāo)物體的外緣進(jìn)行圈劃標(biāo)定的時(shí)間區(qū)間內(nèi)，記錄所述手指尖的特征點(diǎn)的幀間位移，將所述幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形；將所述全周長幾何形在所述用戶的視線方向與所述目標(biāo)物體所在的相垂直平面上進(jìn)行投影，將投影獲得的區(qū)域作為所述目標(biāo)物體的識別區(qū)域進(jìn)行圖像識別。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述將所述幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形包括: 通過閉合曲線優(yōu)化算法將所述幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形。
3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域之前，還包括: 接收用戶通過語音、觸摸屏或者動(dòng)態(tài)傳感器輸入的圖像識別請求，以觸發(fā)通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域的操作。
4.一種圖像識別裝置，其特征在于，包括: 獲取模塊，用于通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域；跟蹤模塊，用于對所述獲取模塊獲取的手部特征區(qū)域進(jìn)行實(shí)時(shí)捕捉和追蹤；所述獲取模塊，還用于在被所述跟蹤模塊檢測和捕捉到的手部特征區(qū)域中，通過對伸出手指的手部形態(tài)特征進(jìn)行模式識別，獲得手指尖的特征和位置信息；所述跟蹤模塊，還用于對所述手指尖的特征和位置信息進(jìn)行實(shí)時(shí)捕捉和追蹤；記錄模塊，用于在所述手指尖對目標(biāo)物體的外緣進(jìn)行圈劃標(biāo)定的時(shí)間區(qū)間內(nèi)，記錄所述手指尖的特征點(diǎn)的幀間位移，將所述幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形；投影模塊，用于將所述全周長幾何形在所述用戶的視線方向與所述目標(biāo)物體所在的相垂直平面上進(jìn)行投影，將投影獲得的區(qū)域作為所述目標(biāo)物體的識別區(qū)域進(jìn)行圖像識別。
5.根據(jù)權(quán)利要求4所述的裝置，其特征在于，所述記錄模塊用于將所述幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形包括: 所述記錄模塊，具體用于通過閉合曲線優(yōu)化算法將所述幀間位移形成的圈劃軌跡封閉連接成一個(gè)全周長幾何形。
6.根據(jù)權(quán)利要求4所述的裝置，其特征在于，還包括: 接收模塊，用于接收用戶通過語音、觸摸屏或者動(dòng)態(tài)傳感器輸入的圖像識別請求，以觸發(fā)通過膚色檢測獲取第一視角的用戶視線范圍內(nèi)的手部特征區(qū)域的操作。
【文檔編號】G06K9/62GK104318218SQ201410594523
【公開日】2015年1月28日申請日期:2014年10月29日優(yōu)先權(quán)日:2014年10月29日
【發(fā)明者】顧嘉唯, 余凱申請人:百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：顧嘉唯;余凱
技術(shù)所有人：百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像識別裝置相關(guān)技術(shù)

圖像識別方法相關(guān)技術(shù)

圖像識別的方法相關(guān)技術(shù)

安檢圖像識別方法相關(guān)技術(shù)

圖像識別和特征提取相關(guān)技術(shù)

圖像識別和圖像分類相關(guān)技術(shù)

圖像識別和模式識別相關(guān)技術(shù)

圖像識別和計(jì)算機(jī)視覺相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

圖像識別方法和裝置制造方法