專利名稱:一種用于行人檢測(cè)的基于協(xié)同進(jìn)化的特征優(yōu)選方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種智能交通領(lǐng)域中的行人檢測(cè)方法,特別是一種用于行人檢測(cè)的基于協(xié)同進(jìn) 化的特征優(yōu)選方法。
背景技術(shù):
近年來,我國(guó)道路交通事故呈快速增長(zhǎng)趨勢(shì),其中城市交通事故占據(jù)了主要部分。針對(duì)城 市交通中場(chǎng)景復(fù)雜、行人眾多且易受傷害等特點(diǎn),行人安全保護(hù)是城市交通安全的關(guān)鍵。正因 如此,車載行人檢測(cè)系統(tǒng)(PDS: Pedestrian Detection System)己成為研究界和產(chǎn)業(yè)界極為關(guān)注 的關(guān)鍵技術(shù)。
分類檢測(cè)是目前實(shí)現(xiàn)行人檢測(cè)系統(tǒng)的主流技術(shù)。為實(shí)現(xiàn)準(zhǔn)確、快速的行人分類檢測(cè),必須 盡可能多地選取各種類型的特征;近年來,國(guó)內(nèi)外研究者在圖像特征的獲取與處理方面已取得 了許多成果,這可以加以借鑒并應(yīng)用到行人檢測(cè)研究中。例如,在特征提取方面,僅僅使用灰 度信息是不夠的,還必須融合各種顏色特征才能提高檢測(cè)性能。同時(shí),每種特征都是海量的。 為此必須設(shè)計(jì)出合適的特征優(yōu)選算法。該算法需要滿足如下要求(1)適合多類特征的優(yōu)選問 題;(2)能保證選取出的特征冗余性較??;(3)能從原始特征中選取出具有良好分類能力的 特征子集。
現(xiàn)有PDS中的特征選擇算法主要有兩類(1)大樣本試驗(yàn)加上人工分析。這使選擇的特征 具有很大的隨機(jī)性和不確定性,也難以保證特征的代表性以及不同類型特征比例的最佳。(2) Boosting算法。這類方法的優(yōu)點(diǎn)在于可以在較短的時(shí)間內(nèi)從指定的特征集中尋出一部分符合性 能要求的特征組合;但同樣不能得到特征的合理比例,也會(huì)選出一些冗余特征和分類能力較弱 的部分特征。為此,有必要針對(duì)多類海量特征,設(shè)計(jì)一種合適的智能特征優(yōu)選算法。
發(fā)明內(nèi)容
本發(fā)明的技術(shù)解決問題克服現(xiàn)有技術(shù)的不足,提供一種用于行人檢測(cè)的基于協(xié)同進(jìn)化的 特征優(yōu)選方法,該方法采用多種群協(xié)同進(jìn)化方法,把解空間中的群體劃分為若千子群體,每個(gè) 子群體代表求解問題的一個(gè)子目標(biāo),即每一個(gè)子群體優(yōu)選一類特征,所有子群體在獨(dú)立進(jìn)化的 同時(shí),基于信息遷移和知識(shí)共享,共同進(jìn)化,從而達(dá)到最優(yōu)特征選擇的目的。
本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的,步驟如下 (l)讀入訓(xùn)練樣本,包括含有行人圖像的正樣本和不含行人圖像的負(fù)樣本,所有樣本縮放為統(tǒng)一規(guī)格;
(2) 生成原始特征集合,可分為R, G, B, GRAY四類,每類各有n,, z'= 1,2,3,4個(gè)特征, 共有t",個(gè)特征。對(duì)每一個(gè)訓(xùn)練樣本進(jìn)行特征提取,得到行人圖像的特征向量,形成樣本集合;
(3) 初始化四個(gè)種群,每個(gè)種群對(duì)應(yīng)一類特征,每個(gè)種群隨機(jī)生成N個(gè)個(gè)體,每個(gè)個(gè)體編 碼為二進(jìn)制串,表示一個(gè)特征子集,其中N的取值范圍為[100,300];
(4) 將個(gè)體解碼為特征組合,得到新的樣本子集,計(jì)算所有個(gè)體的適應(yīng)度;
(5) 判斷是否滿足特征選擇終止條件,若滿足則將每個(gè)種群中的最好個(gè)體所表示特征子集 作為算法的最優(yōu)解
(6〉根據(jù)每個(gè)個(gè)體的適應(yīng)度,采用群內(nèi)競(jìng)爭(zhēng)、群間競(jìng)爭(zhēng)和自增長(zhǎng)規(guī)則選擇個(gè)體,使用單點(diǎn) 交叉法及變異生成下代個(gè)體;
(7)返回步驟(4)繼續(xù)進(jìn)化種群直到滿足步驟(5)的特征選擇終止條件。 所述的群內(nèi)競(jìng)爭(zhēng)、群間競(jìng)爭(zhēng)和自增長(zhǎng)規(guī)則如下
(1) 群內(nèi)競(jìng)爭(zhēng)在種群g中,好的個(gè)體應(yīng)該被獎(jiǎng)勵(lì),差的個(gè)體應(yīng)該受懲罰;對(duì)所有的個(gè)體 對(duì)(o,W, fl,6e《,o-6,較差的個(gè)體以a的概率被淘汰,較優(yōu)的個(gè)體以p的概率產(chǎn)生一個(gè)下一 代個(gè)體,其中;5^a;
(2) 群間競(jìng)爭(zhēng)對(duì)屬于不同種群的每一對(duì)個(gè)體(a》),fleOeA,f^P^, ft^表示個(gè)體6 對(duì)個(gè)體a的影響系數(shù),定義為6^ =(/(a)-/(W)/(Wx(/max-/min)),其中W為所有種群包含個(gè)體 的數(shù)量,/_和/^分別為本代種群個(gè)體的最高和最低適應(yīng)函數(shù)值;
(3) 自增長(zhǎng)規(guī)則每個(gè)個(gè)體以/7的概率產(chǎn)生下一代個(gè)體。
本發(fā)明方法基于分而治之原理,在運(yùn)行過程中自適應(yīng)地決定子群體的新增和滅絕,使得子 群體個(gè)數(shù)能夠動(dòng)態(tài)變化,降低計(jì)算復(fù)雜性,并解決對(duì)多類特征優(yōu)選問題中難以分解的問題,所 以具有較高的搜索性能。
本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點(diǎn)在于
(1) 特征選擇的任務(wù)就是從一組數(shù)量為"的特征中選擇出數(shù)量為J(Z) > ")的一組最優(yōu)特 征,很顯然,這是一個(gè)組合優(yōu)化問題。在行人檢測(cè)系統(tǒng)中,行人有四類特征。對(duì)于這樣的多類 特征優(yōu)選問題,適合采用分治解決的策略,協(xié)同進(jìn)化算法的分而治之的基本原理,使得它比其 他的優(yōu)化算法具有更好的性能。。
(2) 通過二進(jìn)制編碼方式表達(dá)某個(gè)特征是否被選擇,方便編碼和解碼;群內(nèi)競(jìng)爭(zhēng)、群間競(jìng) 爭(zhēng)和自增長(zhǎng)規(guī)則,得子群體個(gè)數(shù)能夠動(dòng)態(tài)變化,保證了多種群規(guī)模的穩(wěn)定,降低計(jì)算復(fù)雜性避免了過早收斂,提高找到最優(yōu)解的概率。
(3)而且本發(fā)明方法繼承了進(jìn)化算法的生物特性,具有自組織、自學(xué)習(xí)的能力,實(shí)際使用 過程中執(zhí)行效率高,適用于行人檢測(cè)的多類特征優(yōu)選。
圖1為本發(fā)明的基于協(xié)同進(jìn)化算法的特征選擇方法的流程圖; 圖2為本發(fā)明顏色特征有效的例子; 圖3為本發(fā)明的使用的Haar—like特征。
具體實(shí)施例方式
如圖1所示,本發(fā)明包括以下步驟-
(1) 讀入訓(xùn)練樣本,包括正樣本(含有行人的圖像)和負(fù)樣本(不含行人的圖像),所有 樣本縮放為統(tǒng)一規(guī)格。
所有樣本均取自實(shí)時(shí)視頻,從視頻的每幀圖像中人工截取得到。正樣本都包含有一個(gè)完整 的行人,負(fù)樣本包含形似行人的物體,如樹、路障等。每個(gè)樣本為24位的位圖,縮放為統(tǒng)一規(guī) 格16象素x32象素。
(2) 生成原始特征集合。由于顏色信息是區(qū)別行人的關(guān)鍵,需要在R、 G、 B通道以及灰 度圖像上分別提取特征,得到R, G, B, GRAY四類特征值。每類各有",,/ = 1,2,3,4個(gè)特征,
共有^",個(gè)特征,每一個(gè)訓(xùn)練樣本的特征值形成一個(gè)行人圖像的特征向量,得到樣本集合。
由于道路、樹木均有特定的顏色,兼之行人衣著顏色多變,單純的使用灰度信息不能很好 的表達(dá)出行人的本質(zhì)信息。如圖2所示,行人的顏色為RGB (180, 0, 0)(紅色),背景的顏 色為RGB (0, 30, 60),在灰度圖像中,行人完全與背景相同,而在R通道圖像中,可以明 顯的區(qū)分行人與背景。因此,在本發(fā)明中,分別在R、 G、 B通道以及灰度圖像上提取特征,分 別記為R、 G、 B、 GRAY特征,作為原始的特征集合。
特征的計(jì)算方法采用Haar—like特征計(jì)算方法在R、 G、 B通道以及灰度圖像上計(jì)算出特征 值。如圖3所示,從中選擇一個(gè)矩形框,放在樣本圖像的任意位置上,計(jì)算白色矩形框內(nèi)象素 和與黑色矩形框內(nèi)象素和的差,得到的值作為特征值。
使用不同形狀的矩形框,以及不同的放置位置,為每個(gè)樣本在R、 G、 B通道以及灰度圖像
上分別得到"i, / = 1,2,3,4個(gè)特征值,組成一個(gè)^",維的特征向量。
(3) 初始化四個(gè)種群,種群p,對(duì)應(yīng)第i類特征;每個(gè)種群隨機(jī)生成JV個(gè)個(gè)體,每個(gè)個(gè)體編 碼為二進(jìn)制串,表示一個(gè)特征子集,其中^的取值范圍為[100,300]。(3.1) 個(gè)體的編碼
在本方法中,種群中的每個(gè)個(gè)體表示該類特征的一個(gè)子集合。種群《的個(gè)體使用一個(gè)長(zhǎng)度 為",.的0/l串表示,若該串的第y位為i,則表示相應(yīng)的特征分量被選中,為0表示相應(yīng)的特征
向量未被選中。
(3.2) 種群的初始化
針對(duì)行人的特點(diǎn),考慮到算法的復(fù)雜性,種群規(guī)模W的取值范圍可取為[100,300]。每個(gè)個(gè) 體初始選擇的特征個(gè)數(shù)為w個(gè),采用隨機(jī)算法得到,方法如下 初始化個(gè)體的編碼為全O; /e"g^卄編碼長(zhǎng)度;
for,' <~ 1 to m do
t — r"wt/o附()mod /ewgA;
個(gè)體編碼的第A位為1; cndfor
(4) 將個(gè)體解碼為特征組合,得到新的樣本子集,計(jì)算所有個(gè)體的適應(yīng)度。
種群s的第y個(gè)個(gè)體/mZ/v/^^L.適應(yīng)度計(jì)算方法-
(4.1) 若當(dāng)前是第一代個(gè)體,在每個(gè)種群中隨機(jī)選擇一個(gè)個(gè)體作為該種群最優(yōu)個(gè)體;否則,
將前一代適應(yīng)度最高的個(gè)體作為相應(yīng)種群的最優(yōu)個(gè)體。
(4.2) 對(duì)!力必vWi^^和其他三個(gè)種群的最優(yōu)個(gè)體解碼,組合得到一個(gè)特征集合/、,得到 新的樣本子集。
(4.3) 對(duì)新的樣本子集,使用AdaBoost算法訓(xùn)練得到一個(gè)分類器。
(4.4) 使用訓(xùn)練得到的分類器對(duì)測(cè)試樣本進(jìn)行測(cè)試,得到分類準(zhǔn)確率"owa^ —ra&, /Wv/c/wa" 的適應(yīng)度/ /"咖(zW.v油a(》-accw)YKy —rafe-weaft一w,6er/w , 其中 wd —做w6"為AdaBoost分類器包含的弱分類器個(gè)數(shù)。
(5) 判斷是否滿足特征選擇終止條件,若滿足則確定每個(gè)種群中的最好個(gè)體所表示特征子 集作為算法的最優(yōu)解。
從每個(gè)種群中選出最優(yōu)的個(gè)體,計(jì)算它們的適應(yīng)度,若適應(yīng)度大于一指定閾值,則把最優(yōu) 個(gè)體選擇的特征作為最終的優(yōu)選結(jié)果,并終止程序。
(6) 根據(jù)每個(gè)個(gè)體的適應(yīng)度,采用群內(nèi)競(jìng)爭(zhēng)、群間競(jìng)爭(zhēng)和自增長(zhǎng)規(guī)則選擇個(gè)體,使用單點(diǎn) 交叉法及變異策略生成下代個(gè)體。
(6.1)選擇為控制個(gè)體生成與滅亡的速度,保證種群規(guī)模的穩(wěn)定,以更大概率的找到最優(yōu)解,在選擇 過程中,同時(shí)以下三個(gè)規(guī)則來選擇個(gè)體,從而有效地調(diào)節(jié)各種群的規(guī)模。
a. 群內(nèi)競(jìng)爭(zhēng)
在種群5中,好的個(gè)體應(yīng)該被獎(jiǎng)勵(lì),差的個(gè)體應(yīng)該受懲罰;對(duì)所有的個(gè)體對(duì)(a,W, a,6e《,fl-6,較差的個(gè)體以"的概率被淘汰,較優(yōu)的個(gè)體以-的概率產(chǎn)生一個(gè)下一代個(gè)體,其
b. 群間競(jìng)爭(zhēng)
對(duì)屬于不同種群的每一對(duì)個(gè)體(0,6), flef》e《,《^S, ft^表示個(gè)體6對(duì)個(gè)體"的影響系 數(shù),定義為~=(/(")-/(6))/(^(/nm-/min)),其中^為所有種群包含個(gè)體的數(shù)量,/_和/_
分別為本代種群個(gè)體的最高和最低適應(yīng)函數(shù)值。
c. 自增長(zhǎng)規(guī)則
每個(gè)個(gè)體以p的概率產(chǎn)生下一代個(gè)體。
(6.2) 交叉
本發(fā)明采用單斷點(diǎn)交叉法。該法隨機(jī)地選擇一個(gè)斷點(diǎn),交換雙親上斷點(diǎn)的右端,生成新的
后代,對(duì)于如下兩個(gè)個(gè)體,若隨機(jī)斷點(diǎn)選擇斷點(diǎn)落在第n個(gè)基因之后 v,=
交換雙親上斷點(diǎn)的右端后得到兩個(gè)后代如下
<formula>formula see original document page 8</formula>交叉率&的取值范圍可取
.
(6.3) 變異
變異以等于變異率A,的概率改變一個(gè)基因。假設(shè)v,的第16個(gè)基因被選來變異,該基因?yàn)?,
故將其變?yōu)镺。于是染色體由
v,= [1001101101001011010000000101 llOOl]變?yōu)?br>
v,' = [10011011010010110000000010111001]。
(7)返回步驟(4)繼續(xù)進(jìn)化種群直到滿足步驟(5)的特征選擇終止條件。
權(quán)利要求
1、一種用于行人檢測(cè)的基于協(xié)同進(jìn)化的特征優(yōu)選方法,其特征在于步驟如下(1)讀入訓(xùn)練樣本,包括含有行人圖像的正樣本和不含行人圖像的負(fù)樣本,所有樣本縮放為統(tǒng)一規(guī)格;(2)生成原始特征集合,可分為R,G,B,GRAY四類,每類各有ni,i=1,2,3,4個(gè)特征,共有個(gè)特征,對(duì)每一個(gè)訓(xùn)練樣本進(jìn)行特征提取,稱為行人圖像特征向量,形成樣本集合;(3)初始化四個(gè)種群,每個(gè)種群對(duì)應(yīng)一類特征,每個(gè)種群隨機(jī)生成N個(gè)個(gè)體,每個(gè)個(gè)體編碼為二進(jìn)制串,表示一個(gè)特征子集,其中N的取值范圍為[100,300];(4)將個(gè)體解碼為特征組合,得到新的樣本子集,計(jì)算所有個(gè)體的適應(yīng)度;(5)判斷是否滿足特征選擇終止條件,若滿足則將每個(gè)種群中的最好個(gè)體所表示特征子集作為算法的最優(yōu)解;(6)根據(jù)每個(gè)個(gè)體的適應(yīng)度,采用群內(nèi)競(jìng)爭(zhēng)、群間競(jìng)爭(zhēng)和自增長(zhǎng)規(guī)則選擇個(gè)體,使用單點(diǎn)交叉法及變異生成下代個(gè)體;(7)返回步驟(4)繼續(xù)進(jìn)化種群直到滿足步驟(5)的特征選擇終止條件。
2、 根據(jù)權(quán)利要求l所述一種用于行人檢測(cè)的基于協(xié)同進(jìn)化的特征優(yōu)選方法,其特征在于 所述步驟(6)中的群內(nèi)競(jìng)爭(zhēng)、群間競(jìng)爭(zhēng)和自增長(zhǎng)規(guī)則如下(1) 群內(nèi)競(jìng)爭(zhēng)在種群5中,好的個(gè)體應(yīng)該被獎(jiǎng)勵(lì),差的個(gè)體應(yīng)該受懲罰;對(duì)所有的個(gè)體對(duì)(a》),fl》e/:,a-b,較差的個(gè)體以a的概率被淘汰,較優(yōu)的個(gè)體以-的概率產(chǎn)生一個(gè)下一代個(gè)體,其中/ S";(2) 群間競(jìng)爭(zhēng)對(duì)屬于不同種群的每一對(duì)個(gè)體("》),aef,6e《,《^《,%6表示個(gè)體6 對(duì)個(gè)體a的影響系數(shù),定義為- (/(")一/(州/(Wx(/薩-/mn)),其中W為所有種群包含個(gè)體 的數(shù)量,/_和/^分別為本代種群個(gè)體的最高和最低適應(yīng)函數(shù)值;(3) 自增長(zhǎng)規(guī)則每個(gè)個(gè)體以p的概率產(chǎn)生下一代個(gè)體。
3、 根據(jù)權(quán)利要求1所述一種用于行人檢測(cè)的基于協(xié)同進(jìn)化的特征優(yōu)選方法,其特征在于 所述步驟(6)的單點(diǎn)交叉法為隨機(jī)選擇一個(gè)斷點(diǎn),交換雙親上斷點(diǎn)的右端,生成新的后代。
4、 根據(jù)權(quán)利要求I所述一種用于行人檢測(cè)的基于協(xié)同進(jìn)化的特征優(yōu)選方法,其特征在于 所述步驟(6)的變異策略為變異以等于變異率的概率改變一個(gè)基因。
5、 根據(jù)權(quán)利要求1所述一種用于行人檢測(cè)的基于協(xié)同進(jìn)化的特征優(yōu)選方法,其特征在于所述步驟(4)中的種群/^的第/個(gè)個(gè)體/"^》/^ ^適應(yīng)度計(jì)算方法(1) 若當(dāng)前是第一代個(gè)體,在每個(gè)種群中隨機(jī)選擇一個(gè)個(gè)體作為該種群最優(yōu)個(gè)體;否則, 將前一代適應(yīng)度最高的個(gè)體作為相應(yīng)種群的最優(yōu)個(gè)體;(2) 對(duì)/"&w^w^和其他三個(gè)種群的最優(yōu)個(gè)體解碼,組合得到一個(gè)特征集合A,」.,得到新的樣本子集;(3) 對(duì)新的樣本子集,使用AdaBoost算法訓(xùn)練得到一個(gè)分類器;(4) 使用訓(xùn)練得到的分類器對(duì)測(cè)試樣本進(jìn)行測(cè)試,得到分類準(zhǔn)確率oo^ra^ —, z'"i/fv/dMa/,. 乂. 的適應(yīng)度/ 加e^w(/"cfrv/c/認(rèn)/,力.)=accwczcy—raZe —weatA:_m n6er/w , 其中wd—"ww6er為AdaBoost分類器包含的弱分類器個(gè)數(shù)。
全文摘要
一種用于行人檢測(cè)的基于協(xié)同進(jìn)化的特征優(yōu)選方法,包括(1)讀入訓(xùn)練樣本;(2)生成原始特征集合,形成樣本集合;(3)初始化四個(gè)種群,每個(gè)種群對(duì)應(yīng)一類特征;(4)將個(gè)體解碼為特征組合,得到新的樣本子集,計(jì)算所有個(gè)體的適應(yīng)度;(5)判斷是否滿足終止條件,若滿足則將每個(gè)種群中的最好個(gè)體所表示特征子集作為算法的最優(yōu)解;(6)根據(jù)每個(gè)個(gè)體的適應(yīng)度,采用群內(nèi)競(jìng)爭(zhēng)、群間競(jìng)爭(zhēng)和自增長(zhǎng)規(guī)則選擇個(gè)體,使用單點(diǎn)交叉法及變異生成下代個(gè)體;(7)返回步驟(4)繼續(xù)進(jìn)化種群直到滿足步驟(5)的特征選擇終止條件。本發(fā)明降低了計(jì)算復(fù)雜性,能夠得到最優(yōu)的特征子集,提高了對(duì)行人的分類準(zhǔn)確性。
文檔編號(hào)G06K9/62GK101246555SQ20081010170
公開日2008年8月20日 申請(qǐng)日期2008年3月11日 優(yōu)先權(quán)日2008年3月11日
發(fā)明者培 吳, 嘉曉嵐, 曹先彬, 許言午, 郭圓平, 魏闖先 申請(qǐng)人:中國(guó)科學(xué)技術(shù)大學(xué)