專(zhuān)利名稱:行人目標(biāo)識(shí)別方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像識(shí)別領(lǐng)域,特別涉及一種行人目標(biāo)識(shí)別方法及系統(tǒng)。
背景技術(shù):
行人目標(biāo)識(shí)別是近年來(lái)計(jì)算機(jī)視覺(jué)領(lǐng)域備受關(guān)注的前沿方向和研究熱點(diǎn)之一。它在智能監(jiān)控系統(tǒng)(Intelligent Video Surveillance System)、駕駛員輔助系統(tǒng)(AdvancedDriver Assistance System)、行人保護(hù)系統(tǒng)(Pedestrian Protection System)、以及運(yùn)動(dòng)分析等眾多領(lǐng)域擁有廣泛的應(yīng)用前景。行人目標(biāo)識(shí)別屬于目標(biāo)檢測(cè)的一部分。由于人體固有的一些不確定性,如穿著不同服裝、姿勢(shì)和體型的變化、攜帶各種物品等,以及應(yīng)用場(chǎng)景的復(fù)雜性,人與人或人與環(huán)境之間的相互影響,使得人體目標(biāo)的識(shí)別和跟蹤成為目標(biāo)檢測(cè)領(lǐng)域中的一大難點(diǎn)。傳統(tǒng)的行人目標(biāo)識(shí)別方法通常為基于人體全局特征的方法。這類(lèi)方法致力于找到一種特征,能夠完美地描述人體,并且盡量不受背景,光照,姿勢(shì)的影響,在各種條件下都能將行人和背景區(qū)分開(kāi)。其中,應(yīng)用較為廣泛的人體全局特征包括邊緣方向梯度分布特征(H0G,Histograms of Oriented Gradients)、小波特征、shapelet 特征等。例如 Dalal 和 Triggs首先將輸入圖片分成若干塊,每塊再分成若干格子,對(duì)每個(gè)格子統(tǒng)計(jì)其中所有像素的梯度值在各個(gè)方向上的分布,得到特征向量,再把一個(gè)塊內(nèi)所有格子的特征向量串聯(lián)起來(lái)便得到了該塊的特征向量,最后通過(guò)連接所有塊的特征向量得到多達(dá)數(shù)千維的HOG特征。然而,傳統(tǒng)的行人目標(biāo)識(shí)別方法在根據(jù)上述HOG特征識(shí)別行人目標(biāo)時(shí),由于HOG的維度較多,因此計(jì)算量過(guò)大,從而使得目標(biāo)識(shí)別效率比較低。
發(fā)明內(nèi)容
基于此,有必要提供一種能提高目標(biāo)識(shí)別效率的行人目標(biāo)識(shí)別方法。一種行人目標(biāo)識(shí)別方法,包括以下步驟采集視頻幀;提取所述視頻幀的HOG特征;提取視頻幀的包含了方向和強(qiáng)度信息的LBP特征;根據(jù)所述HOG特征和所述LBP特征識(shí)別所述視頻幀中的行人目標(biāo)。在其中一個(gè)實(shí)施例中,所述提取視頻幀的HOG特征的步驟包括使用積分圖計(jì)算視頻巾貞的HOG特征。在其中一個(gè)實(shí)施例中,所述提取所述視頻幀的HOG特征的步驟包括以16像素作為步進(jìn)提取所述視頻幀的HOG特征。在其中一個(gè)實(shí)施例中,所述根據(jù)所述HOG特征和所述LBP特征識(shí)別所述視頻幀中的行人目標(biāo)的步驟還包括將所述HOG特征和所述LBP特征輸入支持向量機(jī);
通過(guò)支持向量機(jī)根據(jù)所述HOG特征和所述LBP特征識(shí)別所述視頻幀中的行人目標(biāo)。在其中一個(gè)實(shí)施例中,所述通過(guò)支持向量機(jī)根據(jù)所述HOG特征和所述LBP特征識(shí)別所述視頻幀中的行人目標(biāo)的步驟之后還包括通過(guò)所述支持向量機(jī)的核函數(shù)根據(jù)所述HOG特征和所述LBP特征計(jì)算所述視頻幀的信心指數(shù);通過(guò)輪廓匹配算法對(duì)信心指數(shù)低于閾值的視頻幀進(jìn)行識(shí)別。在其中一個(gè)實(shí)施例中,所述通過(guò)輪廓匹配算法對(duì)信心指數(shù)較低的視頻幀進(jìn)行識(shí)別 的步驟還包括根據(jù)預(yù)設(shè)的行人典型姿態(tài)模板集通過(guò)輪廓匹配算法對(duì)視頻幀進(jìn)行識(shí)別。在其中一個(gè)實(shí)施例中,所述通過(guò)支持向量機(jī)根據(jù)所述HOG特征和所述LBP特征識(shí)別所述視頻幀中的行人目標(biāo)的步驟之后還包括使用卡爾曼濾波模型對(duì)所述視頻幀中的行人目標(biāo)進(jìn)行預(yù)跟蹤,當(dāng)在連續(xù)預(yù)設(shè)個(gè)數(shù)的視頻幀中檢測(cè)到所述行人目標(biāo)時(shí),將所述行人目標(biāo)標(biāo)記為有效行人目標(biāo)。此外,還有必要提供一種能提高目標(biāo)識(shí)別效率的行人目標(biāo)識(shí)別系統(tǒng)。一種行人目標(biāo)識(shí)別系統(tǒng),包括視頻幀采集模塊,用于采集視頻幀;HOG特征提取模塊,用于提取所述視頻幀的HOG特征;LBP特征提取模塊,用于提取所述視頻幀的包含了方向和強(qiáng)度信息的LBP特征;目標(biāo)識(shí)別模塊,用于根據(jù)所述HOG特征和所述LBP特征識(shí)別所述視頻幀中的行人目標(biāo)。在其中一個(gè)實(shí)施例中,所述HOG特征提取模塊還用于使用積分圖提取所述視頻幀的HOG特征。在其中一個(gè)實(shí)施例中,所述HOG特征提取模塊還用于以16像素作為步進(jìn)提取所述視頻幀的HOG特征。在其中一個(gè)實(shí)施例中,所述目標(biāo)識(shí)別模塊還用于將所述HOG特征和所述LBP特征輸入支持向量機(jī),通過(guò)支持向量機(jī)根據(jù)所述HOG特征和所述LBP特征識(shí)別所述視頻幀中的行人目標(biāo)。在其中一個(gè)實(shí)施例中,所述目標(biāo)識(shí)別模塊還用于通過(guò)所述支持向量機(jī)的核函數(shù)根據(jù)所述HOG特征和所述LBP特征計(jì)算所述視頻幀的信心指數(shù),通過(guò)輪廓匹配算法對(duì)信心指數(shù)低于閾值的視頻幀進(jìn)行識(shí)別。在其中一個(gè)實(shí)施例中,所述目標(biāo)識(shí)別模塊還用于根據(jù)預(yù)設(shè)的行人典型姿態(tài)模板集通過(guò)輪廓匹配算法對(duì)視頻幀進(jìn)行識(shí)別。在其中一個(gè)實(shí)施例中,還包括卡爾曼濾波模塊,用于使用卡爾曼濾波對(duì)所述視頻幀中的行人目標(biāo)進(jìn)行預(yù)跟蹤,當(dāng)在連續(xù)預(yù)設(shè)個(gè)數(shù)的視頻幀中檢測(cè)到所述行人目標(biāo)時(shí),將所述行人目標(biāo)標(biāo)記為有效目標(biāo)。采用了上述行人目標(biāo)識(shí)別方法和系統(tǒng)之后,在向支持向量機(jī)輸送視頻幀特征時(shí),輸入了 HOG特征和包含了方向和強(qiáng)度信息的LBP特征,由于包含了方向和強(qiáng)度信息LBP特征的維度較少,因此提取該LBP特征的過(guò)程和支持向量機(jī)進(jìn)行識(shí)別的計(jì)算量較小,從而提高了行人目標(biāo)識(shí)別的效率。
圖I為一個(gè)實(shí)施例中行人目標(biāo)識(shí)別方法的流程圖;圖2為一個(gè)實(shí)施例中用于計(jì)算HOG特征的積分圖的示例圖;圖3為一個(gè)實(shí)施例中使用計(jì)算積分圖HOG特征的示例圖;圖4為一個(gè)實(shí)施例中計(jì)算LBP特征的過(guò)程示意圖;圖5為一個(gè)實(shí)施例中具有代表性的7個(gè)uniform LBP特征bin的示意圖;圖6為一個(gè)實(shí)施例中數(shù)個(gè)行人典型姿態(tài)模板的示例圖;圖7為一個(gè)實(shí)施例中采用多種特征進(jìn)行行人目標(biāo)識(shí)別的識(shí)別性能的對(duì)比圖;圖8 為一個(gè)實(shí)施例中采用 3780 維 H0G+1888 維 uniform LBP 和 1152 維 H0G+1024維包含了方向和強(qiáng)度信息的LBP特征進(jìn)行行人目標(biāo)識(shí)別的識(shí)別性能的對(duì)比圖;圖9為一個(gè)實(shí)施例中行人目標(biāo)識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖;圖10為另一個(gè)實(shí)施例中行人目標(biāo)識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施方式如圖I所示,一個(gè)實(shí)施例中,一種行人目標(biāo)識(shí)別方法,包括以下步驟步驟S102,采集視頻幀。 可通過(guò)路況監(jiān)控設(shè)備、攝像機(jī)采集路況視頻,并從路況視頻中提取視頻幀。步驟S104,提取視頻幀的HOG特征。HOG (Histograms of Oriented Gradients,梯度方向直方圖)特征表不局部圖像梯度的方向信息的統(tǒng)計(jì)值,用于描述視頻幀的局部目標(biāo)的表象和形狀。在本實(shí)施例中,提取像素為64X 128的視頻幀的HOG特征的過(guò)程為將視頻幀分割成8X8像素的格子(block),且以2X2格子作為一個(gè)區(qū)塊(cell)。用Sobel算子(離散性差分算子,傳統(tǒng)技術(shù)中,用于運(yùn)算圖像亮度函數(shù)的梯度之近似值)計(jì)算每個(gè)格子的邊緣像素點(diǎn)的梯度特征,可根據(jù)下述公式計(jì)算Gx (X, y) = SobelxX I (x, y)Gy (X, y) = SobelyX I (x, y)其中,Sobelx和Sobely分別為水平和垂直方向的Sobel算子,分別用于檢測(cè)水平邊緣和垂直邊緣,Ι(χ, y)為像素坐標(biāo)(X,y)處的灰度值,Gx (X,y)和&(1,y)分別為每個(gè)格子的邊緣像素點(diǎn)的水平梯度特征和垂直梯度特征。然后計(jì)算梯度強(qiáng)度和梯度方向,可根據(jù)以下公式計(jì)算G(x, y)=(x, yf + Gy (x, yf
G (x, y)θ(χ, y) = arctan(-^-~-)
Gx(x^y)其中,G(x,y)為梯度強(qiáng)度,Gx (x,y)和6>,7)為前述的水平梯度特征和垂直梯度特征,Θ (X,y)為梯度方向。然后再根據(jù)預(yù)設(shè)的直方圖的維數(shù)通過(guò)下列公式計(jì)算梯度方向直方圖
權(quán)利要求
1.ー種行人目標(biāo)識(shí)別方法,包括以下步驟 米集視頻巾貞; 提取所述視頻幀的HOG特征; 提取視頻幀的包含了方向和強(qiáng)度信息的LBP特征; 根據(jù)所述HOG特征和所述LBP特征識(shí)別所述視頻幀中的行人目標(biāo)。
2.根據(jù)權(quán)利要求I所述的行人目標(biāo)識(shí)別方法,其特征在于,所述提取視頻幀的HOG特征的步驟包括 使用積分圖計(jì)算視頻幀的HOG特征。
3.根據(jù)權(quán)利要求I或2所述的行人目標(biāo)識(shí)別方法,其特征在于,所述提取所述視頻幀的 HOG特征的步驟包括 以16像素作為步進(jìn)提取所述視頻幀的HOG特征。
4.根據(jù)權(quán)利要求I所述的行人目標(biāo)識(shí)別方法,其特征在于,所述根據(jù)所述HOG特征和所述LBP特征識(shí)別所述視頻幀中的行人目標(biāo)的步驟還包括 將所述HOG特征和所述LBP特征輸入支持向量機(jī); 通過(guò)支持向量機(jī)根據(jù)所述HOG特征和所述LBP特征識(shí)別所述視頻幀中的行人目標(biāo)。
5.根據(jù)權(quán)利要求4所述的行人目標(biāo)識(shí)別方法,其特征在于,所述通過(guò)支持向量機(jī)根據(jù)所述HOG特征和所述LBP特征識(shí)別所述視頻幀中的行人目標(biāo)的步驟之后還包括 通過(guò)所述支持向量機(jī)的核函數(shù)根據(jù)所述HOG特征和所述LBP特征計(jì)算所述視頻幀的信心指數(shù); 通過(guò)輪廓匹配算法對(duì)信心指數(shù)低于閾值的視頻幀進(jìn)行識(shí)別。
6.根據(jù)權(quán)利要求4所述的行人目標(biāo)識(shí)別方法,其特征在于,所述通過(guò)輪廓匹配算法對(duì)信心指數(shù)較低的視頻幀進(jìn)行識(shí)別的步驟還包括 根據(jù)預(yù)設(shè)的行人典型姿態(tài)模板集通過(guò)輪廓匹配算法對(duì)視頻幀進(jìn)行識(shí)別。
7.根據(jù)權(quán)利要求4所述的行人目標(biāo)識(shí)別方法,其特征在于,所述通過(guò)支持向量機(jī)根據(jù)所述HOG特征和所述LBP特征識(shí)別所述視頻幀中的行人目標(biāo)的步驟之后還包括 使用卡爾曼濾波模型對(duì)所述視頻幀中的行人目標(biāo)進(jìn)行預(yù)跟蹤,當(dāng)在連續(xù)預(yù)設(shè)個(gè)數(shù)的視頻幀中檢測(cè)到所述行人目標(biāo)時(shí),將所述行人目標(biāo)標(biāo)記為有效行人目標(biāo)。
8.ー種行人目標(biāo)識(shí)別系統(tǒng),其特征在于,包括 視頻幀采集模塊,用于采集視頻幀; HOG特征提取模塊,用于提取所述視頻幀的HOG特征; LBP特征提取模塊,用于提取所述視頻幀的包含了方向和強(qiáng)度信息的LBP特征; 目標(biāo)識(shí)別模塊,用于根據(jù)所述HOG特征和所述LBP特征識(shí)別所述視頻幀中的行人目標(biāo)。
9.根據(jù)權(quán)利要求8所述的行人目標(biāo)識(shí)別系統(tǒng),其特征在于,所述HOG特征提取模塊還用于使用積分圖提取所述視頻幀的HOG特征。
10.根據(jù)權(quán)利要求8所述的行人目標(biāo)識(shí)別系統(tǒng),其特征在于,所述HOG特征提取模塊還用于以16像素作為步進(jìn)提取所述視頻幀的HOG特征。
11.根據(jù)權(quán)利要求8所述的行人目標(biāo)識(shí)別系統(tǒng),其特征在于,所述目標(biāo)識(shí)別模塊還用于將所述HOG特征和所述LBP特征輸入支持向量機(jī),通過(guò)支持向量機(jī)根據(jù)所述HOG特征和所述LBP特征識(shí)別所述視頻幀中的行人目標(biāo)。
12.根據(jù)權(quán)利要求11所述的行人目標(biāo)識(shí)別系統(tǒng),其特征在于,所述目標(biāo)識(shí)別模塊還用于通過(guò)所述支持向量機(jī)的核函數(shù)根據(jù)所述HOG特征和所述LBP特征計(jì)算所述視頻幀的信心指數(shù),通過(guò)輪廓匹配算法對(duì)信心指數(shù)低于閾值的視頻幀進(jìn)行識(shí)別。
13.根據(jù)權(quán)利要求12所述的行人目標(biāo)識(shí)別系統(tǒng),其特征在于,所述目標(biāo)識(shí)別模塊還用于根據(jù)預(yù)設(shè)的行人典型姿態(tài)模板集通過(guò)輪廓匹配算法對(duì)視頻幀進(jìn)行識(shí)別。
14.根據(jù)權(quán)利要求11所述的行人目標(biāo)識(shí)別系統(tǒng),其特征在于,還包括卡爾曼濾波模塊,用于使用卡爾曼濾波對(duì)所述視頻幀中的行人目標(biāo)進(jìn)行預(yù)跟蹤,當(dāng)在連續(xù)預(yù)設(shè)個(gè)數(shù)的視頻幀中檢測(cè)到所述行人目標(biāo)時(shí),將所述行人目標(biāo)標(biāo)記為有效目標(biāo)。
全文摘要
一種行人目標(biāo)識(shí)別方法,包括采集視頻幀;提取視頻幀的HOG特征;提取視頻幀的包含了方向和強(qiáng)度信息的LBP特征;根據(jù)所述HOG特征和所述LBP特征識(shí)別所述視頻幀中的行人目標(biāo)。此外,還提供了一種行人目標(biāo)識(shí)別系統(tǒng)。上述行人目標(biāo)識(shí)別方法和系統(tǒng)減少了輸入支持向量機(jī)的特征的維度,從而提高了識(shí)別效率。
文檔編號(hào)G06T7/20GK102663366SQ20121010893
公開(kāi)日2012年9月12日 申請(qǐng)日期2012年4月13日 優(yōu)先權(quán)日2012年4月13日
發(fā)明者陳先開(kāi), 陳前, 馬穎東 申請(qǐng)人:中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院