用于提高視頻中的對象檢測性能的系統(tǒng)和方法
【專利摘要】一種用于訓(xùn)練特殊對象檢測器辨別出現(xiàn)在用于目標(biāo)域的幀序列中的前景對象的方法和系統(tǒng)。該幀序列描述不均勻背景中的前景對象的運(yùn)動。在該序列的初始幀的高置信度子窗口中檢測前景對象,其包括計算高置信度子窗口包括前景對象的置信度量并確定該置信度量超過指定置信度閾值。在出現(xiàn)在初始幀之后的后續(xù)幀的各正子窗口中跟蹤前景對象。后續(xù)幀在指定短時間段內(nèi)。使用正子窗口來訓(xùn)練特殊對象檢測器檢測目標(biāo)域中的前景對象。正子窗口包括初始幀的子窗口和后續(xù)幀的各子窗口。
【專利說明】用于提高視頻中的對象檢測性能的系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明一般地涉及視頻中的對象檢測且更具體地涉及提高視頻中的對象檢測的性能。
【背景技術(shù)】
[0002]對象檢測在智能視頻監(jiān)控系統(tǒng)中起到基礎(chǔ)作用。作為前提條件,在大視頻數(shù)據(jù)庫中或在實(shí)時視頻流中自動地搜索感興趣的對象的能力常常涉及到視頻幀中的對象的檢測和局部化。
[0003]傳統(tǒng)監(jiān)控系統(tǒng)通常應(yīng)用背景建模技術(shù)[(C.Stauffer和W.Grimson, Adaptivebackground mixture models for real-time tracking, CVPR, 1998, I);(Y.Tian, M.Lu和 A.Hampapur, Robust and efficient foreground analysis for real-time videosurveillance, CVPR, 2005, I)],用于檢測場景中的移動對象,其在低活動性情形中是高效的且相當(dāng)好地工作。然而,傳統(tǒng)監(jiān)控系統(tǒng)在其處理典型市區(qū)條件(諸如擁擠場景)和環(huán)境變化(像雨、雪、反射以及陰影)的能力方面是有限的。在擁擠場景中,多個對象被頻繁地合并成單個運(yùn)動斑點(diǎn),從而損害較高水平的任務(wù),諸如對象分類和屬性的提取。
[0004]基于外觀的對象檢測器[(N.Dalal 和 B.Triggs.Histograms of orientedgradients for human detection, CVPR, 2005, I); (P.Felzenszwalb,R.Girshick,D.McAllester 和 D.Ramanan, Object detection with discriminatively trainedpart based models, IEEE Transactions on PAMI, 2010, I)]作為用以應(yīng)對這些有挑戰(zhàn)性的條件的很有前景的方向而出現(xiàn)。具體地,對于要求實(shí)時處理的應(yīng)用而言,基于類哈爾(Haar-1ike)特征的級聯(lián)檢測器已被廣泛地用于人臉[P.Viola和M.Jones.Robust Real-time Object Detection, International Journal of ComputerVision, 2004, I, 2, 3, 4],行人[P.Viola, M.Jones 和 D.Snowi, Detecting pedestriansusing patterns of motion and appearance, ICCV, 2003, I]和車輛[R.S.Feris, B.Siddiquie,Y.Zhai,J.Petterson,L.Brown 和 S.Pankanti, Attribute-based vehiclesearch in crowded surveillance videos, ICMR, 2011,I]的檢測。雖然在此領(lǐng)域中已經(jīng)實(shí)現(xiàn)的顯著的進(jìn)步,但現(xiàn)有技術(shù)對象檢測器仍不能很好地一般化至不同的相機(jī)角度和照明條件。由于實(shí)際部署常常涉及到大量的監(jiān)控相機(jī),所以訓(xùn)練每個相機(jī)的檢測器由于標(biāo)注成本而是不可能的。已經(jīng)提出了在線自適應(yīng)方法[(V.Jair^PE.Learned-Miller, Online domainadaptation of a pre-trained cascade of classifiers, CVPR, 2011, I, 2);(S.Pan, 1.Tsang, J.Kwok 和 Q.Yang, Domain adaptation via transfer component analysis, IEEETransactions on Neural Networks, 2011, I, 2)]以使一般檢測器適應(yīng)于特定的域,但是該在線自適應(yīng)方法通常要求來自目標(biāo)域的少量的手動標(biāo)簽。大多數(shù)方法僅僅依賴于權(quán)值的自適應(yīng),同時保持原始檢測器的相同的特征和相同的計算復(fù)雜性。
[0005] 已經(jīng)提出了用于圖像和視頻中的對象檢測的各種方法?;诳勺冃尾糠值哪P蚚P.Felzenszwalb, R.Girshick, D.McAllester 和 D.Ramanan, Object detectionwith discriminatively trained part based models,IEEE Transactions onPAMI, 2010, I],基于取向梯度特征的直方圖的分類器[N.Dalal和B.Triggs.Histogramsof oriented gradients for human detection, CVPR, 2005,I]以及卷積神經(jīng)網(wǎng)絡(luò)[Y.LeCun,K.Kavukvuoglu 和 C.Farabet,Convolutional networks and applications invision, ISCAS, 2010,I]是已在多個標(biāo)準(zhǔn)數(shù)據(jù)集中實(shí)現(xiàn)現(xiàn)有技術(shù)成果的成功方法的示例。然而,一般地,這些方法在常規(guī)機(jī)器上運(yùn)行小于15幀每秒,并且因此可能不適用于要求每個服務(wù)器處理許多視頻通道的監(jiān)控應(yīng)用。
[0006]級聯(lián)檢測器[(P.Felzenszwalb,R.Girshick 和 D.McAllester,Cascadeobject detection with deformable part models, CVPR, 2010, 2) ; (P.Viola 和M.Jones.Robust Real-time Object Detection,International Journal of ComputerVision, 2004,1,2,3,4)]已被普遍地釆用以獲得高效的處理。Viola和Jones [P.Viola和M.Jones, Robust Real-time Object Detection,International Journal of ComputerVision, 2004,1,2,3,4]介紹了一種基于Adaboost分類器、使用快速至計算機(jī)的類哈爾特征的魯棒且高效的檢測器。在過去幾年中已經(jīng)提出了此算法的許多變體,包括不同的提高模型和不同的特征。用于級聯(lián)檢測器的置信度量尚未被很好地研究。
[0007]共同訓(xùn)練技術(shù)[(0.Javed,S.Ali 和 M.Shah,Online detection andclassification of moving objects using progressively improvingdetectors, CVPR, 2005,2) ; (P.Roth, H.Grabnerj D.Skocajj H.Bischof 和Leonardis,On-line conservative learning for person detection,PETSWorkshop, 2005, 2)]已通過在數(shù)據(jù)的不同視圖上訓(xùn)練單獨(dú)分類器,應(yīng)用于提高特定域中的對象檢測的性能。來自第一分類器的可信標(biāo)記樣本被用來補(bǔ)充第二分類器的訓(xùn)練集且反之亦然。共同訓(xùn)練的底層假設(shè)是數(shù)據(jù)的兩個視圖是統(tǒng)計獨(dú)立的,其尤其是在從單個模態(tài)提取特征時可能被違背。
[0008]已經(jīng)提出了多個在線自適應(yīng)方法[(V.Jain 和 E.Learned-Miller.0nline domainadaptation of a pre-trained cascade of classifiers, CVPR, 2011,1,2) ; (S.Pan, 1.TsangjJ.Kwok 和 Q.Yang, Domain adaptation via transfer component analysis, IEEETransactions on Neural Networks,2011,1,2)]以使一般檢測器適應(yīng)于特定的域。通常,這些技術(shù)要求來自目標(biāo)域的少數(shù)手動標(biāo)簽或者遭受捕捉在線數(shù)據(jù)以正確地更新分類器方面的不準(zhǔn)確性。除少數(shù)例外[H.Grabner和H.Bischofj Online boostingand visiOn,CVPR,2006,2],只有特征權(quán)值是自適應(yīng)的且特征本身并不是。結(jié)果,自適應(yīng)分類器一般地至少如原始檢測器那樣昂貴。在線學(xué)習(xí)已被應(yīng)用于改善跟蹤[(H.Grabnerj C.Leistner 和 H.Bischof,Sem1-supervised on-line boosting for robusttracking, ECCVj2008,2) ; (S.Avidanj Ensemble tracking, IEEE Transactions onPAMI, 2007,2)],假設(shè)對象僅出現(xiàn)在一個位置上。
[0009]Feris 等人[R.S.Ferisj J.Pettersonj B.Siddi quie, L.Brown 和S.Pankanti, Large-scale vehicle detection in challenging urban surveillanceenvironments, WACV, 2011,2]提出了 一種用以自動地從目標(biāo)域收集訓(xùn)練數(shù)據(jù)并學(xué)習(xí)分類器的技術(shù)。然而,該技術(shù)要求用戶輸入以指定感興趣區(qū)域和屬性,諸如感興趣對象的運(yùn)動方向和可接受A S。最近,Siddiquie等人[B.Siddiquie,R.Ferisj A.Datta和L.Davis, Unsupervised model selection for view-1nvariant object detection insurveillance environments, ICPR, 2012, 2]提出了一種將場景幾何約束考慮在內(nèi)以從源域向目標(biāo)域轉(zhuǎn)移知識的方法。這種方法甚至能夠?qū)崿F(xiàn)比用來自目標(biāo)域的樣本訓(xùn)練的檢測器更好的性能,但是要求覆蓋不同姿勢和照明條件的源域檢測器的大電池。
[0010]存在用以基于超過可見光譜(諸如紅外線)的亮度、色彩以及特征而將前景對象與背景區(qū)別開的現(xiàn)有算法。這些算法通常依賴于閾值(例如亮度閾值)來指示前景對象的存在。例如,可以由人來手動地調(diào)整閾值以解決照明的變化、相機(jī)響應(yīng)等以確保車輛的圖像勝過用以將車輛與背景區(qū)別開的可應(yīng)用閾值。然而,手動調(diào)整過程是低效的且經(jīng)受人為誤差。
【發(fā)明內(nèi)容】
[0011]本發(fā)明提供了一種用于訓(xùn)練特殊對象檢測器,以辨別出現(xiàn)在用于目標(biāo)域的幀序列中的前景對象的方法和系統(tǒng)。該幀序列描述不均勻背景中的前景對象的運(yùn)動。在序列中的最后一個幀之前的序列中的每個幀對應(yīng)于比序列中的緊接著的下一個幀所對應(yīng)的時間更早的時間。前景對象在序列的初始幀的高置信度子窗口中被檢測到。檢測前景對象包括計算子窗口包括前景對象的置信度量,并確定該置信度量超過指定置信度閾值。在出現(xiàn)于幀序列中的初始幀之后的多個后續(xù)幀的各正子窗口中跟蹤前景對象,其中,后續(xù)幀在指定的短時間段內(nèi)。該正子窗口被饋送到學(xué)習(xí)引擎以供在訓(xùn)練特殊對象檢測器檢測目標(biāo)域中的前景對象時使用,其中,正子窗口包括初始幀的子窗口和所述多個后續(xù)幀的各子窗口。
【專利附圖】
【附圖說明】
[0012]圖1描述了根據(jù)本發(fā)明的實(shí)施例的用于級聯(lián)檢測器的置信度量的確定。
[0013]圖2描述了根據(jù)本發(fā)明的實(shí)施例的高置信度檢測和相應(yīng)軌跡片段的示例。
[0014]圖3描述了根據(jù)本發(fā)明的實(shí)施例的從擁擠交通場景自動提取的負(fù)補(bǔ)丁(patch)的示例。
[0015]圖4描述了由使用本發(fā)明的置信度量的一般檢測器選擇的高置信度樣本的示例。
[0016]圖5A和5B描述了根據(jù)本發(fā)明的實(shí)施例的低活動性(圖5A)和擁擠場景(圖5B)中的一般域檢測器與目標(biāo)域中的自動生成檢測器的比較。
[0017]圖6描述了根據(jù)本發(fā)明的實(shí)施例用于一般檢測器和特殊化檢測器的特征數(shù)對比級數(shù)的圖。
[0018]圖7圖示出根據(jù)本發(fā)明的實(shí)施例的用于訓(xùn)練特殊對象檢測器辨別出現(xiàn)在用于目標(biāo)域的幀序列中的前景對象的計算機(jī)系統(tǒng)。
[0019]圖8是描述根據(jù)本發(fā)明的實(shí)施例的用于訓(xùn)練特殊對象檢測器辨別出現(xiàn)在用于目標(biāo)域的幀序列中的前景對象的特殊對象檢測器的方法的流程圖。
[0020]圖9和10是描述根據(jù)本發(fā)明的實(shí)施例的用于計算用于高置信度子窗口的置信度量的方法的流程圖。
[0021]圖11和12是描述根據(jù)本發(fā)明的實(shí)施例的負(fù)子窗口的生成的流程圖。
[0022]圖13描述了根據(jù)本發(fā)明的實(shí)施例的在序列的幀中所描述的背景中具有前景對象的幀序列。
[0023]圖14A-14D圖示出根據(jù)本發(fā)明的實(shí)施例的直至發(fā)現(xiàn)包括前景對象的子窗口為止的從圖14A至圖14D的幀中的滑動窗口的連續(xù)移動。
[0024]圖15A描述了根據(jù)本發(fā)明的實(shí)施例的初始幀中的高置信度子窗口。
[0025]圖15B描述了根據(jù)本發(fā)明的實(shí)施例的相對于圖15A的高置信度子窗口的多個相鄰
子窗口。
【具體實(shí)施方式】
[0026]本發(fā)明提出了一種用以使用借助于更昂貴的一般域檢測器獲取的樣本來自動地從視頻創(chuàng)建高效且準(zhǔn)確的特定域?qū)ο髾z測器的新型方法。本發(fā)明的方法不要求來自目標(biāo)域的手動標(biāo)簽(例如,來自新相機(jī)的視場)。使用短時間段內(nèi)的跟蹤而從由一般檢測器選擇的高置信度樣本自動地收集訓(xùn)練數(shù)據(jù)。在此背景下,基于常常被用于要求實(shí)時處理的計算機(jī)視覺應(yīng)用的分類器的級聯(lián)而針對檢測器提出新型置信度量。本發(fā)明的新型方法在擁擠監(jiān)控視頻中的車輛檢測的問題上得到證明,表明自動生成的檢測器明顯優(yōu)于具有少得多的特征計算的原始一般檢測器。
[0027]用于創(chuàng)建特定域?qū)ο髾z測器的本發(fā)明的新型方法可以在不要求來自目標(biāo)域的手動標(biāo)簽的情況下實(shí)現(xiàn),并且提供用于級聯(lián)檢測器的置信度量。這在計算機(jī)視覺中是個在很大程度上未解決的問題,因?yàn)楫?dāng)前工作僅僅將級聯(lián)檢測器視為沒有關(guān)聯(lián)置信度的二進(jìn)制輸出分類器。本發(fā)明的新型方法自動地從目標(biāo)域收集訓(xùn)練樣本。置信度量從目標(biāo)域中的一般檢測器選擇高置信度檢測樣本,并且然后從短時間內(nèi)的跟蹤收集正樣本(包含高置信度子窗口的初始幀之后的連續(xù)幀的軌跡片段)。這些正樣本包含變化,諸如可以補(bǔ)充一般檢測器的遮擋。還通過使用高置信度樣本以及具有感興趣對象的不同縱橫比的樣本周圍的區(qū)域來生成負(fù)樣本。通過根據(jù)自動收集的數(shù)據(jù)來訓(xùn)練特定域?qū)ο髾z測器,本發(fā)明相比于具有少得多的特征計算的一般檢測器獲得顯著的準(zhǔn)確度改善。實(shí)驗(yàn)分析顯示出提出的方法對擁擠監(jiān)控視頻中的車輛檢測問題的有用性。
[0028]本文中的詳細(xì)描述包括以下小節(jié):
[0029]A.用于級聯(lián)檢測器的置信度量
[0030]B.學(xué)習(xí)特定域檢測器
[0031]B1.來自軌跡片段的正樣本
[0032]B2.負(fù)樣本
[0033]C.檢測器學(xué)習(xí)
[0034]D.實(shí)驗(yàn)
[0035]E.未來工作
[0036]F.計算機(jī)系統(tǒng)
[0037]G.實(shí)施方式
[0038]A.用于級聯(lián)檢測器的置信度暈
[0039]級聯(lián)檢測器包括連續(xù)地(S卩,分級地)應(yīng)用于將特定圖像樣本分類的一組級分類器。在此過程期間,如果任何級檢測器將樣本分類為負(fù),則過程結(jié)束且樣本理解被視為負(fù)的。只有當(dāng)級聯(lián)中的所有級檢測器都將樣本分類為負(fù)時,該結(jié)果才是正的。
[0040]本發(fā)明提出了一種與級聯(lián)檢測器的輸出相關(guān)聯(lián)的置信度量,允許根據(jù)置信度來將結(jié)果排序。置信度量確保高置信度證樣本是真為正的,其能夠用于自動數(shù)據(jù)收集。檢測器FF(x)包括N個級分類器fi(x),i = 1...N,其中,N表示分類的級數(shù),并且N至少為2,并且其中,X表示幀的子窗口(即,圖像樣本)。用于級i (i=l…N)的級分類器可以在一個實(shí)施例中可以基于Boosting,其在等式(I)中被表示為用于具有用于級i的偏置Θ 1的輸入圖像樣本X的弱分類器的線性組合,其中,偏置91充當(dāng)閾值,并且其中,T是弱分類器Iiit(X)的總數(shù)且t指示級i處的第t弱分類器Iiit (X)。
[0041 ]
【權(quán)利要求】
1.一種用于訓(xùn)練特殊對象檢測器以辨別出現(xiàn)在用于目標(biāo)域的幀序列中的前景對象的方法,該幀序列描述了不均勻背景中的前景對象的運(yùn)動,在序列中的最后一個幀之前的序列中的每個幀對應(yīng)于比序列中的緊接著下一個幀所對應(yīng)的時間更早的時間,該方法包括: 計算機(jī)系統(tǒng)的一個或多個處理器檢測序列的初始幀的高置信度子窗口中的前景對象,其中,檢測前景對象包括計算高置信度子窗口包括前景對象的置信度量,并確定置信度量超過指定置信度閾值; 所述一個或多個處理器跟蹤在幀序列中的初始幀之后出現(xiàn)的多個后續(xù)幀的各正子窗口中的前景對象,其中,該后續(xù)幀在指定短時間段內(nèi);以及 所述一個或多個處理器向?qū)W習(xí)引擎饋送正子窗口,以便在訓(xùn)練特殊對象檢測器檢測目標(biāo)域中的前景對象時使用,其中,所述正子窗口包括初始幀的子窗口和所述多個后續(xù)幀的各子窗口。
2.如權(quán)利要求1所述的方法,其中,該方法還包括: 所述一個或多個處理器隨機(jī)地選擇初始幀中的多個負(fù)子窗口,其中,所述多個負(fù)子窗口中的每個負(fù)子窗口具有超過高置信度子窗口的總面積的總面積,其中,所述多個負(fù)子窗口中的每個負(fù)子窗口位于小于距高置信度子窗口的指定距離閾值處,并且其中,所述多個負(fù)子窗口中的每個負(fù)子窗口不包括前景對象; 所述一個或多個處理器將所述多個負(fù)子窗口中的每個負(fù)子窗口重新確定尺寸,以變得與高置信度子窗口一致;以及 所述一個或多個處理器向?qū)W習(xí)引擎饋送所述多個負(fù)子窗口以便連同正子窗口一起在訓(xùn)練特殊對象檢測器檢測目標(biāo)域中的前景對象時使用。
3.如權(quán)利要求1所述的方法,其中,該方法還包括: 所述一個或多個處理器隨機(jī)地選擇關(guān)于目標(biāo)域的一組窗口; 所述一個或多個處理器隨機(jī)地選擇該組窗口中的每個窗口中的負(fù)子窗口,其中,該組窗口中的每個窗口中的負(fù)子窗口具有不同于高置信度子窗口的縱橫比的縱橫比,并且其中,該組窗口中的每個窗口中的負(fù)子窗口不包括前景對象; 所述一個或多個處理器將該組窗口中的每個窗口中的每個子窗口重新確定尺寸,以變得與高置信度子窗口一致;以及 所述一個或多個處理器向該組窗口中的每個窗口中的負(fù)子窗口饋送學(xué)習(xí)引擎,以便連同正子窗口一起在訓(xùn)練特殊對象檢測器檢測目標(biāo)域中的前景對象時使用。
4.如權(quán)利要求1所述的方法,其中,計算置信度量包括; 相對于初始幀中的高置信度子窗口選擇多個相鄰子窗口,其中,每個相鄰子窗口部分地而不是完全地與高置信度子窗口重疊,并且其中,相鄰子窗口相互不同; 計算用于高置信度子窗口和用于每個相鄰子窗口的置信度分?jǐn)?shù),其中,用于高置信度子窗口中和每個相鄰子窗口中的前景對象的置信度分?jǐn)?shù)級分類器;以及 從用于高置信度子窗口和每個相鄰子窗口的置信度分?jǐn)?shù)的比較分析來計算置信度量。
5.如權(quán)利要求4所述的方法,其中,確定所述置信度量超過指定置信度閾值包括最初確定置信度量不超過指定置信度閾值,隨后迭代地執(zhí)行選擇多個相鄰子窗口,計算置信度分?jǐn)?shù)以及計算置信度量,其中,所述多個相鄰子窗口中的相鄰子窗口的總數(shù)在每次迭代中增加,直至確定置信度量超過指定置信度閾值。
6.如權(quán)利要求4所述的方法,其中,從比較分析來計算置信度量包括: 從由用于高置信度子窗口的置信度分?jǐn)?shù)和用于每個相鄰子窗口的置信度分?jǐn)?shù)的聯(lián)合形成的集合中選擇K個最高置信度分?jǐn)?shù),其中,K在I至M+1范圍內(nèi),并且其中,M表示相對于高置信度子窗口的相鄰子窗口的總數(shù); 選擇K個置信度分?jǐn)?shù)的最小置信度分?jǐn)?shù); 將最小置信度分?jǐn)?shù)歸一化至在指定范圍內(nèi),其中,所述最小置信度分?jǐn)?shù)變成置信度量;以及 確認(rèn)所述置信度量超過指定置信度閾值。
7.如權(quán)利要求6所述的方法,其中,K在2至M的范圍內(nèi)。
8.如權(quán)利要求4所述的方法,其中,每個相鄰子窗口的面積以至少指定百分比與每個高置信度子窗口的面積重疊。
9.一種用于訓(xùn)練特殊對象檢測器以辨別出現(xiàn)在用于目標(biāo)域的幀序列中的前景對象的計算機(jī)系統(tǒng),該幀序列描述了不均勻背景中的前景對象的運(yùn)動,在序列中的最后一個幀之前的序列中的每個幀對應(yīng)于比序列中的緊接著下一個幀所對應(yīng)的時間更早的時間,該計算機(jī)系統(tǒng)包括: 一個或多個處理器; 計算機(jī)可讀存儲器; 計算機(jī)可讀存儲設(shè)備; 第一程序指令,用以檢測序列的初始幀的高置信度子窗口中的前景對象,其中,檢測前景對象包括計算高置信度子窗口包括前景對象的置信度量,并確定置信度量超過指定置信度閾值; 第二程序指令,用以跟蹤在幀序列中的初始幀之后出現(xiàn)的多個后續(xù)幀的各正子窗口中的前景對象,其中,該后續(xù)幀在指定短時間段內(nèi);以及 第三程序指令,用以向?qū)W習(xí)引擎饋送正子窗口,以便在訓(xùn)練特殊對象檢測器檢測目標(biāo)域中的前景對象時使用,其中,所述正子窗口包括初始幀的子窗口和所述多個后續(xù)幀的各子窗口, 其中,所述第一程序指令、所述第二程序指令以及所述第三程序指令被存儲在計算機(jī)可讀存儲設(shè)備上,以便經(jīng)由計算機(jī)可讀存儲器由一個或多個處理器來執(zhí)行。
10.如權(quán)利要求9所述的計算機(jī)系統(tǒng),其中,所述計算機(jī)系統(tǒng)還包括: 第四程序指令,用以隨機(jī)地選擇初始幀中的多個負(fù)子窗口,其中,所述多個負(fù)子窗口中的每個負(fù)子窗口具有超過高置信度子窗口的總面積的總面積,其中,所述多個負(fù)子窗口中的每個負(fù)子窗口位于小于距高置信度子窗口的指定距離閾值處,并且其中,所述多個負(fù)子窗口中的每個負(fù)子窗口不包括前景對象; 第五程序指令,用以將所述多個負(fù)子窗口中的每個負(fù)子窗口重新確定尺寸,以變得與高置信度子窗口一致;以及 第六程序指令,用以向?qū)W習(xí)引擎饋送所述多個負(fù)子窗口以便連同正子窗口一起在訓(xùn)練特殊對象檢測器檢測目標(biāo)域中的前景對象時使用, 其中,所述第四程序指令、所述第五程序指令以及所述第六程序指令被存儲在計算機(jī)可讀存儲設(shè)備上,以便經(jīng)由計算機(jī)可讀存儲器由一個或多個處理器來執(zhí)行。
11.如權(quán)利要求9所述的計算機(jī)系統(tǒng),其中,所述計算機(jī)系統(tǒng)還包括: 第四程序指令,用以隨機(jī)地選擇關(guān)于目標(biāo)域的一組窗口 ; 第五程序指令,用以隨機(jī)地選擇該組窗口中的每個窗口中的負(fù)子窗口,其中,該組窗口中的每個窗口中的負(fù)子窗口具有不同于高置信度子窗口的縱橫比的縱橫比,并且其中,該組窗口中的每個窗口中的負(fù)子窗口不包括前景對象; 第六程序指令,用以將該組窗口中的每個窗口中的負(fù)子窗口重新確定尺寸,以變得與高置信度子窗口一致;以及 第七程序指令,用以向該組窗口中的每個窗口中的負(fù)子窗口饋送學(xué)習(xí)引擎以便連同正子窗口一起在訓(xùn)練特殊對象檢測器檢測目標(biāo)域中的前景對象時使用, 其中,所述第四程序指令、所述第五程序指令、所述第六程序指令以及第七程序指令被存儲在計算機(jī)可讀存儲設(shè)備上,以便經(jīng)由計算機(jī)可讀存儲器由一個或多個處理器來執(zhí)行。
12.如權(quán)利要求9所述的計算機(jī)系統(tǒng),其中,計算置信度量包括: 相對于初始幀中的高置信度子窗口選擇多個相鄰子窗口,其中,每個相鄰子窗口部分地而不是完全地與高置信度子窗口重疊,并且其中,相鄰子窗口相互不同; 計算用于高置信度子窗口和用于每個相鄰子窗口的置信度分?jǐn)?shù),其中,用于高置信度子窗口中和每個相鄰子窗口中的前景對象的置信度分?jǐn)?shù)級分類器;以及 從用于高置信度子 窗口和每個相鄰子窗口的置信度分?jǐn)?shù)的比較分析來計算置信度量。
13.如權(quán)利要求12所述的計算機(jī)系統(tǒng),其中,確定所述置信度量超過指定置信度閾值包括最初確定置信度量不超過指定置信度閾值,隨后迭代地執(zhí)行選擇多個相鄰子窗口,計算置信度分?jǐn)?shù)以及計算置信度量,其中,所述多個相鄰子窗口中的相鄰子窗口的總數(shù)在每次迭代中增加,直至確定置信度量超過指定置信度閾值。
14.如權(quán)利要求12所述的計算機(jī)系統(tǒng),其中,從比較分析來計算置信度量包括: 從由用于高置信度子窗口的置信度分?jǐn)?shù)和用于每個相鄰子窗口的置信度分?jǐn)?shù)的聯(lián)合形成的集合中選擇K個最高置信度分?jǐn)?shù),其中,K在I至M+1范圍內(nèi),并且其中,M表示相對于高置信度子窗口的相鄰子窗口的總數(shù); 選擇K個置信度分?jǐn)?shù)的最小置信度分?jǐn)?shù); 將最小置信度分?jǐn)?shù)歸一化至在指定范圍內(nèi),其中,所述最小置信度分?jǐn)?shù)變成置信度量;以及 確認(rèn)所述置信度量超過指定置信度閾值。
【文檔編號】G06K9/66GK103914702SQ201410001472
【公開日】2014年7月9日 申請日期:2014年1月2日 優(yōu)先權(quán)日:2013年1月2日
【發(fā)明者】A.達(dá)塔, R.S.菲利斯, S.U.潘坎蒂, 翟昀 申請人:國際商業(yè)機(jī)器公司