基于深度圖像序列的實(shí)時(shí)人體動(dòng)作識(shí)別方法及裝置的制作方法

文檔序號(hào)：6597175閱讀：414來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：基于深度圖像序列的實(shí)時(shí)人體動(dòng)作識(shí)別方法及裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及模式識(shí)別技術(shù)領(lǐng)域，具體涉及一種基于深度圖像序列的實(shí)時(shí)人體動(dòng)作識(shí)別方法及裝置。
背景技術(shù)：
隨著現(xiàn)代信息技術(shù)向智能化、人性化的方向發(fā)展，各種人機(jī)交互、虛擬現(xiàn)實(shí)、智能監(jiān)控系統(tǒng)相繼出現(xiàn)?；谟?jì)算機(jī)視覺(jué)的人體姿勢(shì)估計(jì)、動(dòng)作識(shí)別、行為理解等技術(shù)在其中扮演了重要的角色。近年來(lái)，微軟公司Kinect深度攝像機(jī)的發(fā)布，使得實(shí)時(shí)獲取場(chǎng)景三維信息的成本大幅度降低，也為動(dòng)作識(shí)別相關(guān)領(lǐng)域提供了更多可能性。然而，由于人體的非剛性、運(yùn)動(dòng)方式的多樣性、位移的隨意性，實(shí)時(shí)、魯棒地識(shí)別人體動(dòng)作仍面臨著很多挑戰(zhàn)?，F(xiàn)有技術(shù)中，對(duì)于深度圖像的動(dòng)作識(shí)別主要有兩大類方法:一類是借用已有工具，例如Microsoft Kinect SDK等直接獲取人體關(guān)節(jié)點(diǎn)或骨架信息,再使用傳統(tǒng)的模式識(shí)別算法進(jìn)行識(shí)別；另一·類是從原始深度圖像數(shù)據(jù)中提取圖像特征。前者雖然實(shí)施方便，但難以在自主研發(fā)的產(chǎn)品中使用，而且識(shí)別性能主要受制于骨架提取工具的準(zhǔn)確性。后者按照分類算法可分為運(yùn)動(dòng)模板匹配(Action template)和狀態(tài)空間方法(Temporal state-spacemodels)。運(yùn)動(dòng)模板匹配也稱為直接分類，是將一組圖像序列看成一個(gè)靜態(tài)的形狀模式，其存在難以準(zhǔn)確描述動(dòng)作的動(dòng)態(tài)過(guò)程的缺陷；狀態(tài)空間方法是將動(dòng)作視為一系列姿勢(shì)或狀態(tài)之間的動(dòng)態(tài)轉(zhuǎn)移過(guò)程，以此建立概率模型，如隱馬爾可夫模型(Hidden MarkovModels, HMM)、條件隨機(jī)場(chǎng)模型(Conditional Random Fields, CRF)、最大摘馬爾可夫模型(Maximum Entropy Markov Models, MEMM)等。目前，對(duì)于深度圖像動(dòng)作識(shí)別的研究還非常有限，現(xiàn)有技術(shù)存在一個(gè)共同的缺點(diǎn):由于提取的特征與人體區(qū)域的絕對(duì)坐標(biāo)相關(guān)，因此在識(shí)別前必須進(jìn)行歸一化，需準(zhǔn)確地檢測(cè)目標(biāo)人體在圖像中的位置和大小。然而在實(shí)際應(yīng)用場(chǎng)合中，用戶的運(yùn)動(dòng)具有很大的隨意性，尤其是復(fù)雜的動(dòng)作可能伴隨著身體的平移、傾斜或者高度的變化等等，經(jīng)常導(dǎo)致歸一化的偏差，進(jìn)而影響識(shí)別準(zhǔn)確率；而且，現(xiàn)有技術(shù)中深度圖像動(dòng)作識(shí)別方法的識(shí)別效率仍有待提聞。

發(fā)明內(nèi)容
(一)要解決的技術(shù)問(wèn)題本發(fā)明的目的在于提供一種基于深度圖像序列的實(shí)時(shí)人體動(dòng)作識(shí)別方法，用于提升動(dòng)作識(shí)別的效率以及動(dòng)作識(shí)別的準(zhǔn)確性和魯棒性；進(jìn)一步的，本發(fā)明還提供了一種基于深度圖像序列的實(shí)時(shí)人體動(dòng)作識(shí)別裝置。(二)技術(shù)方案本發(fā)明技術(shù)方案如下:一種基于深度圖像序列的實(shí)時(shí)人體動(dòng)作識(shí)別方法，包括步驟:S1.從目標(biāo)深度圖像序列中提取目標(biāo)動(dòng)作剪影，從訓(xùn)練深度圖像集中提取訓(xùn)練動(dòng)作剪影；S2.對(duì)訓(xùn)練動(dòng)作剪影進(jìn)行姿勢(shì)聚類，并對(duì)聚類結(jié)果進(jìn)行動(dòng)作標(biāo)定；S3.計(jì)算目標(biāo)動(dòng)作剪影以及訓(xùn)練動(dòng)作剪影的姿勢(shì)特征；S4.結(jié)合訓(xùn)練動(dòng)作剪影的姿勢(shì)特征進(jìn)行基于高斯混合模型的姿勢(shì)訓(xùn)練并構(gòu)建姿勢(shì)模型；S5.計(jì)算聚類結(jié)果的每個(gè)動(dòng)作中各姿勢(shì)間的轉(zhuǎn)移概率并構(gòu)建動(dòng)作圖模型；S6.根據(jù)所述目標(biāo)動(dòng)作剪影的姿勢(shì)特征、姿勢(shì)模型以及動(dòng)作圖模型對(duì)目標(biāo)深度圖像序列進(jìn)行動(dòng)作識(shí)別。優(yōu)選的，所述步驟S3包括:S31.將動(dòng)作剪影在直角坐標(biāo)系的三個(gè)坐標(biāo)平面分別投影；S32.在第c個(gè)坐標(biāo)平而的投影輪廓上選取ηε個(gè)采樣點(diǎn)；S33.對(duì)于每個(gè)采樣盧/ 計(jì)算其多維姿勢(shì)特征向量S34.每個(gè)坐標(biāo)平面上所有采樣點(diǎn)的多維姿勢(shì)特征向量^的集合Xc組成姿勢(shì)特征
{xc}。優(yōu)選的，所述步驟S33包括:以#為中心的a條輻線和以夕力圓心的b個(gè)同心圓形成k個(gè)網(wǎng)格；多維姿勢(shì)特征向量<表示第c個(gè)坐標(biāo)平面上的其他采樣點(diǎn)qe相對(duì)于P:的坐標(biāo)分布:
權(quán)利要求
1.一種基于深度圖像序列的實(shí)時(shí)人體動(dòng)作識(shí)別方法，其特征在于，包括步驟: 51.從目標(biāo)深度圖像序列中提取目標(biāo)動(dòng)作剪影，從訓(xùn)練深度圖像集中提取訓(xùn)練動(dòng)作剪影; 52.對(duì)訓(xùn)練動(dòng)作剪影進(jìn)行姿勢(shì)聚類，并對(duì)聚類結(jié)果進(jìn)行動(dòng)作標(biāo)定； 53.計(jì)算目標(biāo)動(dòng)作剪影以及訓(xùn)練動(dòng)作剪影的姿勢(shì)特征； 54.結(jié)合訓(xùn)練動(dòng)作剪影的姿勢(shì)特征進(jìn)行基于高斯混合模型的姿勢(shì)訓(xùn)練并構(gòu)建姿勢(shì)模型； 55.計(jì)算聚類結(jié)果的每個(gè)動(dòng)作中各姿勢(shì)間的轉(zhuǎn)移概率并構(gòu)建動(dòng)作圖模型； 56.根據(jù)所述目標(biāo)動(dòng)作剪影的姿勢(shì)特征、姿勢(shì)模型以及動(dòng)作圖模型對(duì)目標(biāo)深度圖像序列進(jìn)行動(dòng)作識(shí)別。
2.根據(jù)權(quán)利要求1所述的實(shí)時(shí)人體動(dòng)作識(shí)別方法，其特征在于，所述步驟S3包括: 531.將動(dòng)作剪影在直角坐標(biāo)系的三個(gè)坐標(biāo)平面分別投影； 532.在第c個(gè)坐標(biāo)平面的投影輪廓上選取ηε個(gè)采樣點(diǎn)； 533.對(duì)于每個(gè)采樣點(diǎn)，計(jì)算其多維姿勢(shì)特征向量冗； 534.每個(gè)坐標(biāo)平面上所有采樣點(diǎn)的多維姿勢(shì)特征向量A的集合f組成姿勢(shì)特征{xc}。`
3.根據(jù)權(quán)利要求2所述的實(shí)時(shí)人體動(dòng)作識(shí)別方法，其特征在于，所述步驟S33包括: 以P,為中心的a條福線和以為圓心的b個(gè)同心圓形成k個(gè)網(wǎng)格；多維姿勢(shì)特征向量片表示第c個(gè)坐標(biāo)平面上的其他采樣點(diǎn)f相對(duì)于的坐標(biāo)分布:Kik) = HcIc t P : e Γ: (qc - P-)e bin(k)}，c e {1,2,3}; 其中，fc表示第C個(gè)坐標(biāo)平面上所有采樣點(diǎn)的集合。
4.根據(jù)權(quán)利要求3所述的實(shí)時(shí)人體動(dòng)作識(shí)別方法，其特征在于，所述同心圓的直徑根據(jù)fe中各采樣點(diǎn)距離的平均值I設(shè)置。
5.根據(jù)權(quán)利要求4所述的實(shí)時(shí)人體動(dòng)作識(shí)別方法，其特征在于，a=12,b=5, k=60 ;所述同心圓的直徑分別為0.1251,0.251,0.51、1、21。
6.根據(jù)權(quán)利要求3-5任意一項(xiàng)所述的實(shí)時(shí)人體動(dòng)作識(shí)別方法，其特征在于，所述步驟S4包括: 將訓(xùn)練動(dòng)作剪影在第c個(gè)坐標(biāo)平面上投影的姿勢(shì)模型分量P (xc I ω》用K個(gè)高斯分布的混合表示: P^c I 政)=nfx聲(d-’Σ w); 其中，Ν(.)為高斯函數(shù)，、Σ 、疋分別是第t個(gè)高斯核的均值、協(xié)方差矩陣及權(quán)重；構(gòu)建姿勢(shì)模型:⑷歷)= p(xc IV)。 c~l
7.根據(jù)權(quán)利要求6所述的實(shí)時(shí)人體動(dòng)作識(shí)別方法，其特征在于，所述動(dòng)作圖模型包括若干帶權(quán)有向圖；每個(gè)帶權(quán)有向圖對(duì)應(yīng)一種動(dòng)作；帶權(quán)有向圖中的一個(gè)節(jié)點(diǎn)表示一種姿勢(shì)，帶權(quán)邊線表示兩種姿勢(shì)間的轉(zhuǎn)移概率。
8.根據(jù)權(quán)利要求7所述的實(shí)時(shí)人體動(dòng)作識(shí)別方法，其特征在于，所述步驟S6包括: 561.計(jì)算每一幀目標(biāo)深度圖像當(dāng)前最有可能的姿勢(shì)序列:
9.根據(jù)權(quán)利要求8所述的實(shí)時(shí)人體動(dòng)作識(shí)別方法，其特征在于，所述步驟S65包括: 計(jì)算動(dòng)作Ψi中產(chǎn)生S*的概率
10.一種實(shí)現(xiàn)權(quán)利要求1-9任意一項(xiàng)所述的基于深度圖像序列的實(shí)時(shí)人體動(dòng)作識(shí)別方法的裝置，其特征在于，包括: 動(dòng)作剪影提取模塊，用于從目標(biāo)深度圖像序列中提取目標(biāo)動(dòng)作剪影，從訓(xùn)練深度圖像集中提取訓(xùn)練動(dòng)作剪影；特征提取模塊，用于計(jì)算目標(biāo)動(dòng)作剪影以及訓(xùn)練動(dòng)作剪影的多維姿勢(shì)特征；姿勢(shì)模型構(gòu)建模塊，用于結(jié)合訓(xùn)練動(dòng)作剪影的多維姿勢(shì)特征進(jìn)行基于高斯混合模型的姿勢(shì)訓(xùn)練并構(gòu)建姿勢(shì)模型；動(dòng)作圖模型構(gòu)建模塊，用于對(duì)訓(xùn)練動(dòng)作剪影進(jìn)行姿勢(shì)聚類，并對(duì)聚類結(jié)果進(jìn)行動(dòng)作標(biāo)定，計(jì)算聚類結(jié)果的每個(gè)動(dòng)作中各姿勢(shì)間的轉(zhuǎn)移概率并構(gòu)建動(dòng)作圖模型；動(dòng)作識(shí)別模塊，根據(jù)所述目標(biāo)動(dòng)作剪影的多維姿勢(shì)特征、姿勢(shì)模型以及動(dòng)作圖模型對(duì)目標(biāo)深度圖像序列進(jìn)行動(dòng)作識(shí)別。
全文摘要
本發(fā)明涉及模式識(shí)別技術(shù)領(lǐng)域，具體涉及一種基于深度圖像序列的實(shí)時(shí)人體動(dòng)作識(shí)別方法及裝置。該方法包括步驟S1.從目標(biāo)深度圖像序列中提取目標(biāo)動(dòng)作剪影，從訓(xùn)練深度圖像集中提取訓(xùn)練動(dòng)作剪影；S2.對(duì)訓(xùn)練動(dòng)作剪影進(jìn)行姿勢(shì)聚類，并對(duì)聚類結(jié)果進(jìn)行動(dòng)作標(biāo)定；S3.計(jì)算目標(biāo)動(dòng)作剪影以及訓(xùn)練動(dòng)作剪影的姿勢(shì)特征；S4.結(jié)合訓(xùn)練動(dòng)作剪影的姿勢(shì)特征進(jìn)行基于高斯混合模型的姿勢(shì)訓(xùn)練并構(gòu)建姿勢(shì)模型；S5.計(jì)算聚類結(jié)果的每個(gè)動(dòng)作中各姿勢(shì)間的轉(zhuǎn)移概率并構(gòu)建動(dòng)作圖模型；S6.根據(jù)所述目標(biāo)動(dòng)作剪影的姿勢(shì)特征、姿勢(shì)模型以及動(dòng)作圖模型對(duì)目標(biāo)深度圖像序列進(jìn)行動(dòng)作識(shí)別。本發(fā)明的方法提升了動(dòng)作識(shí)別的效率及動(dòng)作識(shí)別的準(zhǔn)確性和魯棒性。
文檔編號(hào)G06K9/00GK103246884SQ20131019296
公開(kāi)日2013年8月14日申請(qǐng)日期2013年5月22日優(yōu)先權(quán)日2013年5月22日
發(fā)明者王貴錦, 李艷麗, 何禮, 林行剛申請(qǐng)人:清華大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王貴錦;李艷麗;何禮;林行剛
技術(shù)所有人：清華大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

深度優(yōu)先遍歷序列相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

基于深度圖像序列的實(shí)時(shí)人體動(dòng)作識(shí)別方法及裝置的制作方法