專利名稱::用于學(xué)習(xí)高效級聯(lián)檢測器的多實例修剪的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及基于分類器的檢測系統(tǒng),并且具體地,涉及用于高效地訓(xùn)練用來檢測數(shù)據(jù)中感興趣的信息實例的組合分類器的系統(tǒng)和方法。相關(guān)技術(shù)如本領(lǐng)域技術(shù)人員所知,存在著用于實現(xiàn)用來檢測信號內(nèi)的特定元素或成分的目標(biāo)檢測系統(tǒng)的各種各樣的技術(shù)。這種檢測包括例如,檢測或標(biāo)識圖像中的臉或其它特定對象,檢測語音樣本中的特定詞語,檢測心電圖信號中的特定心跳模式等?!N常見檢測技術(shù)涉及使用分層分類器(也被稱為"級聯(lián)檢測器"),其供在構(gòu)造常規(guī)目標(biāo)檢測系統(tǒng)時使用。級聯(lián)檢測器已經(jīng)被顯示出能以高準(zhǔn)確度來極其快速地操作,并且具有諸如臉檢測等重要應(yīng)用。因此,針對級聯(lián)學(xué)習(xí)技術(shù)進(jìn)行了大量努力來改進(jìn)在這種檢測系統(tǒng)中使用的分類器的訓(xùn)練。盡管使用典型的檢測系統(tǒng)通常是很快的(可能是實時的),但這種檢測系統(tǒng)的初始訓(xùn)練通常很慢。不幸的是,對于確定最佳級聯(lián)大小和目標(biāo)檢測率而言,用于高效且有效地訓(xùn)練級聯(lián)檢測器的過程仍然是具有挑戰(zhàn)性的技術(shù)問題。基于級聯(lián)的檢測系統(tǒng)的一種日益重要的應(yīng)用涉及實時臉檢測。例如,一種常規(guī)技術(shù)涉及結(jié)合"積分圖像"使用自適應(yīng)推進(jìn)(通常還被稱為"AdaBoost")來訓(xùn)練級聯(lián)檢測器。該檢測方案需要多個復(fù)雜參數(shù),包括例如矩形過濾器的數(shù)量和形狀、級數(shù)、每一級中的弱分類器數(shù)量、以及每一級聯(lián)級的目標(biāo)檢測率。不幸的是,盡管這一類型的系統(tǒng)提供良好的檢測結(jié)果,但它的計算復(fù)雜度意味著初始級聯(lián)訓(xùn)練過程需要大量時間(取決于所使用的CPU資源,可能數(shù)天或數(shù)星期),并且因此,挑選最佳參數(shù)是困難的任務(wù)?!慵壜?lián)訓(xùn)練過程的概念和計算復(fù)雜度引起了對這種訓(xùn)練的多種改進(jìn)和改善。例如,若干新近的基于"軟級聯(lián)"的技術(shù)通過放松各個不同且分開的級的原始級聯(lián)結(jié)構(gòu)來操作,使得較早的弱分類器分?jǐn)?shù)的計算可以與較晚的弱分類器相組合。例如,在一種這樣的"軟級聯(lián)"方法中,整個檢測器作為不具有級的單個組合分類器(具有數(shù)百或甚至數(shù)千弱分類器)來訓(xùn)練。軟級聯(lián)分配給檢測窗口的分?jǐn)?shù)只是弱分類器的和。只要部分和落在某預(yù)定閾值之下,即及早終止對和的計算。相關(guān)的軟級聯(lián)訓(xùn)練技術(shù)通常通過基于自組織檢測率目標(biāo)(被稱為"拒絕分發(fā)向量")設(shè)置中間閾值來操作。如早先基于級聯(lián)的方案一樣,該方案的軟級聯(lián)逐漸放棄多個肯定樣本,以致力于積極地減少通過該級聯(lián)的否定樣本的數(shù)量。在訓(xùn)練過程早期放棄一些肯定樣本證明是正確的,因為原始組合分類器無論如何最終都將放棄一些肯定樣本。原始組合分類器可能因為肯定樣本太難以檢測或因為最終閾值將容許太多的虛假肯定樣本而丟棄該肯定樣本。盡管設(shè)置中間閾值以便不丟失肯定樣本是可能的,但這導(dǎo)致非常保守的閾值和非常慢的檢測器。主要問題是哪些肯定樣本可被丟棄以及何時可被丟棄。不幸的是,常規(guī)級聯(lián)學(xué)習(xí)方法的一個問題是盡管許多方案同意丟棄一些肯定樣本是被批準(zhǔn)的,但這些方案未能提供用于確定最好丟棄哪些樣本的高效或有效機制。例如,一種常規(guī)訓(xùn)練方案嘗試拒絕O個肯定樣本直至不可能繼續(xù)為止,此時視需要來一次拒絕一個肯定樣本。相關(guān)方案定義確定在每一級可被丟棄的臉的數(shù)量的指數(shù)曲線。簡單地丟棄落在該有點任意的曲線的外部的任何肯定樣本。另一常規(guī)方案使用比率測試來確定拒絕閾值。盡管該方案具有某種統(tǒng)計有效性,但必須估計分布(這引入了經(jīng)驗風(fēng)險)。這些方案中的每一個都具有優(yōu)點和缺點,這一般導(dǎo)致各種因素之間的折中,這些因素包括目標(biāo)檢測率、目標(biāo)檢測速度、以及分類器訓(xùn)練速度。概述提供本概述是為了以簡化的形式介紹將在以下詳細(xì)描述中進(jìn)一步描述的一些概念。本概述不旨在標(biāo)識所要求保護(hù)的主題的關(guān)鍵特征或必要特征,也不旨在用于幫助確定所要求保護(hù)的主題的范圍。此處描述的"分類器訓(xùn)練器"使用一個或多個訓(xùn)練數(shù)據(jù)集來構(gòu)造"修剪分類器",該修剪分類器包括用于檢測數(shù)據(jù)中的特定信息實例(例如,圖像中的臉、語音中的特定詞語、信號中的模式、因特網(wǎng)上的特定文檔、搜索引擎所收集的查詢實例、數(shù)據(jù)庫中的書籍、購物數(shù)據(jù)庫中的產(chǎn)品等)的一系列弱分類器和相關(guān)聯(lián)的中間拒絕閾值。該修剪分類器是從已針對一個或多個數(shù)據(jù)集使用常規(guī)訓(xùn)練技術(shù)訓(xùn)練的原始組合分類器構(gòu)造的。構(gòu)造修剪分類器是通過學(xué)習(xí)原始組合分類器的每一弱分類器的單獨的或中間拒絕閾值來實現(xiàn)的。在附加實施例中,修剪分類器訓(xùn)練包括使用權(quán)重修整、自引導(dǎo)和被稱為"肥樹樁(fatstump)"分類器的新穎的弱分類器的各種組合?!愣?,給定包括多個弱分類器的成功訓(xùn)練的組合分類器,學(xué)習(xí)每一弱分類器的中間拒絕閾值并將其用于構(gòu)造最終的修剪分類器,該最終修剪分類器隨后取代原始組合分類器來使用。使用術(shù)語"修剪分類器"是因為中間拒絕閾值是通過為原始組合分類器的一些或全部弱分類器迭代地"修剪"表示訓(xùn)練數(shù)據(jù)中的信息實例的多個肯定樣本或窗口來學(xué)習(xí)的。一旦學(xué)習(xí)了這些中間拒絕閾值,則它們隨后可用于從提供給修剪分類器的實際(即,未訓(xùn)練的)數(shù)據(jù)中修剪(即,拒絕)肯定樣本。例如,在一個實施例中,使用多級修剪過程(在此稱為"多實例修剪"(MIP))來學(xué)習(xí)中間拒絕閾值,該多級修剪過程確保原始組合分類器檢測到的每一對象也被已訓(xùn)練的修剪分類器檢測到,從而保證對訓(xùn)練集合的檢測率在修剪之后不變。此外,修剪分類器對訓(xùn)練集合的虛假肯定率將不高于原始組合分類器。貫穿訓(xùn)練過程所需的唯一參數(shù)是最終修剪分類器的目標(biāo)檢測率,該參數(shù)提供用于設(shè)置虛假肯定/虛假否定操作點的最終閾值。因此,分類器訓(xùn)練器所提供的訓(xùn)練過程是全自動的并且不需要假定概率分布、統(tǒng)計獨立性、或自組織中間拒絕目標(biāo)。此處描述的分類器訓(xùn)練器解決關(guān)于確定最佳級聯(lián)級大小和目標(biāo)檢測率的問題。具體地,相對于原始訓(xùn)練數(shù)據(jù),此處描述的用于訓(xùn)練修剪分類器的MIP技術(shù)提供積極地終止計算而不降低檢測率或增加虛假肯定率的拒絕閾值集合。因此,分類器訓(xùn)練器的一個清楚的優(yōu)點是對所學(xué)習(xí)的最終修剪分類器的中間閾值的使用通過提高修剪分類器相對于原始組合分類器的總體效率而相對于原始組合分類器提供了顯著提高的檢測速度。此外,修剪分類器的總體檢測能力是高度準(zhǔn)確的。鑒于以上概述,很清楚,此處描述的分類器訓(xùn)練器提供用于通過自動地學(xué)習(xí)供在基于修剪分類器的檢測器系統(tǒng)中使用的中間拒絕閾值來訓(xùn)練弱分類器的獨特系統(tǒng)和方法。除了剛才所描述的好處之外,從結(jié)合附圖所考慮的以下詳細(xì)描述中將清楚該分類器訓(xùn)練器的其它優(yōu)點。附圖描述參考以下描述、所附權(quán)利要求書以及附圖,將更好地理解本發(fā)明的具體特征、方面和優(yōu)點,附圖中圖1是描繪了構(gòu)成用于實現(xiàn)此處所描述的"分類器訓(xùn)練器"的示例性系統(tǒng)的通用計算設(shè)備的概括系統(tǒng)圖。圖2是描繪了具有用于實現(xiàn)此處所描述的"分類器訓(xùn)練器"的簡化計算和I/O能力的一般設(shè)備的概括系統(tǒng)圖。圖3提供示出用于實現(xiàn)此處描述的訓(xùn)練器分類器的程序模塊的示例性體系結(jié)構(gòu)流程圖。圖4提供針對此處描述的組合分類器的弱分類器計算的示例性下包絡(luò),其用于修剪樣本來加速分類器檢測執(zhí)行。圖5提供此處描述的使用具有固定格(bin)大小的哈爾特征的常規(guī)現(xiàn)有技術(shù)查找表(LUT)分類器的示例。圖6提供此處描述的使用哈爾特征和可變格大小的"肥樹樁"多線程分類器的示例。圖7提供此處描述的示出用于學(xué)習(xí)修剪分類器的中間拒絕閾值的各實施例的示例性操作流程圖。優(yōu)選實施例的詳細(xì)描述在對本發(fā)明的優(yōu)選實施例的以下描述中,對附圖進(jìn)行了參考,附圖構(gòu)成了實施例的一部分且在其中作為說明示出了可在其中實踐本發(fā)明的具體實施例??梢岳斫猓梢允褂闷渌鼘嵤├⑶铱梢宰龀鼋Y(jié)構(gòu)上的改變而不背離本發(fā)明的范圍。1.0示例性操作環(huán)境圖1和圖2示出了其上可實現(xiàn)此處所描述的"分類器訓(xùn)練器"的各個實施例和要素的合適的計算環(huán)境的兩個示例。例如,圖1示出了可在其上實現(xiàn)本發(fā)明的合適的計算系統(tǒng)環(huán)境100的示例。計算系統(tǒng)環(huán)境100只是合適計算環(huán)境的一個示例,而非意在暗示對本發(fā)明使用范圍或功能有任何限制。也不應(yīng)該將計算環(huán)境IOO解釋為對示例性操作環(huán)境100中示出的任一組件或其組合有任何依賴性或要求。本發(fā)明可用各種其它通用或?qū)S糜嬎阆到y(tǒng)環(huán)境或配置來操作。適用于本發(fā)明的公知的計算系統(tǒng)、環(huán)境和/或配置的示例包括,但不限于,個人計算機、服務(wù)器計算機、諸如蜂窩電話和PDA等手持式、膝上型或移動計算機或通信設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、機頂盒、可編程消費電子產(chǎn)品、網(wǎng)絡(luò)PC、小型機、大型計算機、包含上述系統(tǒng)或設(shè)備中的任一個的分布式計算環(huán)境等。本發(fā)明可在諸如程序模塊等由計算機結(jié)合各種硬件模塊來執(zhí)行的計算機可執(zhí)行指令的一般上下文中描述。一般而言,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等。本發(fā)明也可以在其中任務(wù)由通過通信網(wǎng)絡(luò)鏈接的遠(yuǎn)程處理設(shè)備執(zhí)行的分布式計算環(huán)境中實現(xiàn)。在分布式計算環(huán)境中,程序模塊可以位于包括存儲器存儲設(shè)備在內(nèi)的本地和遠(yuǎn)程計算機存儲介質(zhì)中。參考圖1,用于實現(xiàn)本發(fā)明的示例性系統(tǒng)包括計算機110形式的通用計算設(shè)備。計算機110的組件可以包括,但不限于,處理單元120、系統(tǒng)存儲器130和將包括系統(tǒng)存儲器在內(nèi)的各種系統(tǒng)組件耦合至處理單元120的系統(tǒng)總線121。系統(tǒng)總線121可以是幾種類型的總線結(jié)構(gòu)中的任何一種,包括存儲器總線或存儲控制器、外圍總線、以及使用各種總線體系結(jié)構(gòu)中的任一種的局部總線。作為示例而非局限,這樣的體系結(jié)構(gòu)包括工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(ISA)總線、微通道體系結(jié)構(gòu)(MCA)總線、增強型ISA(EISA)總線、視頻電子技術(shù)標(biāo)準(zhǔn)協(xié)會(VESA)局部總線和外圍部件互連(PCI)總線(也稱為夾層(Mezzanine)總線)。計算機110通常包括各種計算機可讀介質(zhì)。計算機可讀介質(zhì)可以是能由計算機110訪問的任何可用介質(zhì),而且包含易失性和非易失性介質(zhì)、可移動和不可移動介質(zhì)。作為示例而非限制,計算機可讀介質(zhì)可包括計算機存儲介質(zhì)和通信介質(zhì)。計算機存儲介質(zhì)包括以用于存儲諸如計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)這樣的信息的任意方法或技術(shù)來實現(xiàn)的易失性和非易失性、可移動和不可移動介質(zhì)。計算機存儲介質(zhì)包括,但不限于,RAM、ROM、PROM、EPR0M、EEPR0M、閃存或其它存儲器技術(shù);CD-ROM、數(shù)字多功能盤(DVD)或其它光盤存儲;磁帶盒、磁帶、磁盤存儲或其它磁性存儲設(shè)備;或能用于存儲所需信息且可以由計算機IOO訪問的任何其它介質(zhì)。通信介質(zhì)通常以諸如載波或其它傳輸機制等已調(diào)制數(shù)據(jù)信號來體現(xiàn)計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù),并包括任意信息傳送介質(zhì)。術(shù)語"已調(diào)制數(shù)據(jù)信號"指的是其一個或多個特征以在信號中編碼信息的方式被設(shè)定或更改的信號。作為示例而非限制,通信介質(zhì)包括有線介質(zhì),諸如有線網(wǎng)絡(luò)或直接線連接,以及無線介質(zhì),諸如聲學(xué)、RF、紅外、和其它無線介質(zhì)。以上的任何組合也應(yīng)包括在計算機可讀介質(zhì)的范圍內(nèi)。系統(tǒng)存儲器130包括易失性和/或非易失性存儲器形式的計算機存儲介質(zhì),如只讀存儲器(ROM)131和隨機存取存儲器(RAM)132?;据斎?輸出系統(tǒng)133(BIOS)包括如在啟動時幫助在計算機110內(nèi)的元件之間傳輸信息的基本例程,它通常儲存在ROM131中。RAM132通常包含處理單元120可以立即訪問和/或目前正在操作的數(shù)據(jù)和/或程序模塊。作為示例而非限制,圖1示出了操作系統(tǒng)134、應(yīng)用程序135、其它程序模塊136和程序數(shù)據(jù)137。計算機110也可以包括其它可移動/不可移動、易失性/非易失性計算機存儲介質(zhì)。僅作為示例,圖l示出了從不可移動、非易失性磁介質(zhì)中讀取或向其寫入的硬盤驅(qū)動器141,從可移動、非易失性磁盤152中讀取或向其寫入的磁盤驅(qū)動器151,以及從諸如CDROM或其它光學(xué)介質(zhì)等可移動、非易失性光盤156中讀取或向其寫入的光盤驅(qū)動器155??梢栽谑纠圆僮鳝h(huán)境中使用的其它可移動/不可移動、易失性/非易失性計算機存儲介質(zhì)包括但不限于,磁帶盒、閃存卡、數(shù)字多功能盤、數(shù)字錄像帶、固態(tài)RAM、固態(tài)ROM等等。硬盤驅(qū)動器141通常由不可移動存儲器接口,諸如接口140連接至系統(tǒng)總線121,磁盤驅(qū)動器151和光盤驅(qū)動器155通常由可移動存儲器接口,諸如接口150連接至系統(tǒng)總線121。上文討論并在圖1中示出的驅(qū)動器及其相關(guān)聯(lián)的計算機存儲介質(zhì)為計算機IIO提供了對計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊和其它數(shù)據(jù)的存儲。例如,在圖1中,硬盤驅(qū)動器141被示為存儲操作系統(tǒng)144、應(yīng)用程序145、其它程序模塊146和程序數(shù)據(jù)147。注意,這些組件可以與操作系統(tǒng)134、應(yīng)用程序135、其它程序模塊136和程序數(shù)據(jù)137相同,也可以與它們不同。操作系統(tǒng)144、應(yīng)用程序145、其它程序模塊146和程序數(shù)據(jù)147在這里被標(biāo)注了不同的標(biāo)號是為了說明至少它們是不同的副本。用戶可以通過輸入設(shè)備,如鍵盤162和定點設(shè)備161(通常指鼠標(biāo)、跟蹤球或觸摸板)向計算機110輸入命令和信息。其它輸入設(shè)備(未示出)可包括操縱桿、游戲手柄、圓盤式衛(wèi)星天線、掃描儀、無線電接收機、以及電視或廣播視頻接收機等等。這些和其它輸入設(shè)備通常通過耦合至系統(tǒng)總線121的有線或無線用戶輸入接口160連接至處理單元120,但是也可以通過其它常規(guī)的接口和總線結(jié)構(gòu)來連接,如并行端口、游戲端口、通用串行總線(USB)、IEEE1394接口、藍(lán)牙TM無線接口、IEEE802.ll無線接口等等。此外,計算機110還可包括語音或音頻輸入設(shè)備,諸如話筒或話筒陣列198、以及經(jīng)由音頻接口199連接的揚聲器197或其它聲音輸出設(shè)備,音頻接口同樣包括常規(guī)的有線或無線接口,諸如并行、串行、USB、IEEE1394、藍(lán)牙等等。監(jiān)視器191或其它類型的顯示設(shè)備也經(jīng)由接口,諸如視頻接口190連接至系統(tǒng)總線121。除監(jiān)視器之外,照相機192或其它圖像捕捉設(shè)備也可經(jīng)由視頻接口190或其它輸入耦合到計算機110。計算機IIO還可包括諸如打印機196等其它外圍輸出設(shè)備,它可通過輸出外圍接口195連接。計算機110可使用至一個或多個遠(yuǎn)程計算機,如遠(yuǎn)程計算機180的邏輯連接在聯(lián)網(wǎng)環(huán)境中操作。遠(yuǎn)程計算機180可以是個人計算機、服務(wù)器、路由器、網(wǎng)絡(luò)PC、對等設(shè)備、或其它常見網(wǎng)絡(luò)節(jié)點,并且通常包括以上相對計算機110描述的許多或全部元素,但在圖1中只示出了存儲器存儲設(shè)備181。圖1中所示的邏輯連接包括局域網(wǎng)(LAN)171和廣域網(wǎng)(WAN)173,但也可以包括其它網(wǎng)絡(luò)。這樣的聯(lián)網(wǎng)環(huán)境常見于辦公室、企業(yè)范圍計算機網(wǎng)絡(luò)、內(nèi)聯(lián)網(wǎng)和因特網(wǎng)中。當(dāng)在LAN聯(lián)網(wǎng)環(huán)境中使用時,計算機IIO通過網(wǎng)絡(luò)接口或適配器170連接至LAN171。當(dāng)在WAN聯(lián)網(wǎng)環(huán)境中使用時,計算機IIO通常包括調(diào)制解調(diào)器172或用于通過諸如因特網(wǎng)等WAN173建立通信的其它裝置。調(diào)制解調(diào)器172可以是內(nèi)置或外置的,它可以經(jīng)由用戶輸入接口160或其它適當(dāng)?shù)臋C制連接至系統(tǒng)總線121。在聯(lián)網(wǎng)環(huán)境中,相對于計算機110所描述的程序模塊或其部分可被儲存在遠(yuǎn)程存儲器存儲設(shè)備中。作為示例而非限制,圖1示出了遠(yuǎn)程應(yīng)用程序185駐留在存儲器設(shè)備181上??梢岳斫?,所示的網(wǎng)絡(luò)連接是示例性的,且可以使用在計算機之間建立通信鏈路的其它手段。參考圖2,該附圖示出了顯示簡化計算設(shè)備的概括系統(tǒng)圖。這樣的計算設(shè)備通??梢栽谥辽倬哂幸恍┳钚∮嬎隳芰η医Y(jié)合了通信接口或輸入設(shè)備的設(shè)備中找到,該通信接口或輸入設(shè)備用于接收諸如例如向量像等在空間上相干的可變比率多維數(shù)據(jù)。這樣的設(shè)備包括例如,蜂窩電話;PDA;媒體播放器;手持式、膝上型或便攜式計算機;手持式或便攜式電子游戲設(shè)備等。應(yīng)當(dāng)注意,圖2中由斷開的線或虛線所表示的任何框表示簡化計算設(shè)備的替換實施例,并且以下描述的這些替換實施例中的任一個或全部可以結(jié)合貫穿本文所描述的其它替換實施例來使用。至少,為允許設(shè)備實現(xiàn)分類器訓(xùn)練器的功能,該設(shè)備必須具有一些最小計算能力、一些存儲能力、以及用于允許輸入訓(xùn)練數(shù)據(jù)的接口。另外,如下詳細(xì)描述的,該簡化計算設(shè)備還可包括用于輸出經(jīng)訓(xùn)練的檢測系統(tǒng)的輸出設(shè)備。具體地,如由圖2所示,計算能力一般由處理單元210(大致類似于以上相對于圖1所描述的處理單元120)來示出。此外,圖2的簡化計算設(shè)備還可包括用于經(jīng)由照相機295捕捉訓(xùn)練或測試圖像的照相機接口290。注意,與圖1的通用計算設(shè)備的處理單元120形成對比,圖2所示的處理單元210可以是專用微處理器,諸如DSP、VLIW、或其它微控制器,而非如上所述的PC型計算機等的通用處理器單元。另外,圖2的簡化計算設(shè)備還可包括其它組件,諸如例如一個或多個輸入設(shè)備240(類似于相對于圖1所描述的輸入設(shè)備)。圖2的簡化計算設(shè)備還可包括其它可任選組件,諸如例如一個或多個輸出設(shè)備250(類似于相對于圖1所描述的輸出設(shè)備)。圖2的簡化計算設(shè)備還包括作為可移動270和/或不可移動280的存儲260(類似于相對于圖1所描述的存儲設(shè)備)?,F(xiàn)在已討論了示例性操作環(huán)境,本說明書的其余部分將致力于討論具體化"分類器訓(xùn)練器"的程序模塊和過程,該分類器訓(xùn)練器通過自動地學(xué)習(xí)用于基于"修剪分類器"的目標(biāo)檢測系統(tǒng)的中間拒絕閾值來提供用于訓(xùn)練弱分類器的過程。2.0介紹此處描述的"分類器訓(xùn)練器"構(gòu)造用于檢測數(shù)據(jù)中的特定信息實例(例如,圖像中的臉、語音中的特定詞語、信號中的模式、因特網(wǎng)上的特定文檔、搜索引擎所收集的查詢實例、數(shù)據(jù)庫中的書籍、購物數(shù)據(jù)庫中的產(chǎn)品等)的經(jīng)訓(xùn)練的修剪分類器。該修剪分類器是從原始組合分類器來構(gòu)造的,該原始組合分類器本身已使用任何所需訓(xùn)練過程(常規(guī)或其它)針對一個或多個原始數(shù)據(jù)集被成功訓(xùn)練。所得修剪分類器相對于原始組合分類器而言提供顯著提高的檢測速度而同時維持高水平的檢測準(zhǔn)確度。—般而言,原始組合分類器包括多個弱分類器。取決于原始組合分類器的復(fù)雜度,可能存在數(shù)百或甚至數(shù)千個單獨的弱分類器。在一個實施例中,分類器訓(xùn)練器使用在此被稱為"多實例修剪"(MIP)的技術(shù)來學(xué)習(xí)原始組合分類器的每一弱分類器的各個拒絕閾值。這些學(xué)習(xí)的中間拒絕閾值隨后被用來構(gòu)造上述修剪分類器。在附加實施例中,修剪分類器訓(xùn)練包括使用權(quán)重修整、自引導(dǎo)和被稱為"肥樹樁"分類器的新穎的弱分類器的各種組合。上述MIP過程使分類器訓(xùn)練器能夠使用確保原始組合分類器檢測到的每一信息實例也被經(jīng)訓(xùn)練的修剪分類器檢測到的技術(shù)來學(xué)習(xí)中間拒絕閾值,從而保證對訓(xùn)練集合的檢測率在修剪之后不變。此外,經(jīng)修剪的檢測器對訓(xùn)練集合的虛假肯定率將不會高于原始組合分類器。貫穿訓(xùn)練過程所需的唯一參數(shù)是最終檢測系統(tǒng)的目標(biāo)檢測率,該參數(shù)提供用于設(shè)置虛假肯定/虛假否定操作點的最終閾值。因此,訓(xùn)練過程是全自動的并且不需要假定概率分布、統(tǒng)計獨立性、或自組織中間拒絕目標(biāo)。2.1系統(tǒng)概覽如上所述,此處描述的分類器訓(xùn)練器操作來學(xué)習(xí)先前訓(xùn)練的組合分類器的各個弱分類器的拒絕閾值。一般而言,如本領(lǐng)域技術(shù)人員所知,總體組合分類器中的每一弱分類器順序地檢查從訓(xùn)練數(shù)據(jù)集的每一數(shù)據(jù)元素中取出的"樣本"或"窗口",以確定關(guān)于正在檢查的特定樣本或窗口是否包括正在訓(xùn)練數(shù)據(jù)中搜索的感興趣的某特定目標(biāo)或其它信息的實例的置信度水平。每一樣本或窗口的最終"分?jǐn)?shù)"一般是所有弱分類器的置信度水平的和。在最終分?jǐn)?shù)超過某檢測閾值的情況下,該特定樣本或窗口被組合分類器標(biāo)識為包括正在搜索的感興趣的目標(biāo)或信息的檢測到的實例。例如,出于討論目的,為使用臉檢測,每一"窗口"表示圖像中被測試來檢查臉的存在(即臉的"實例")的某一區(qū)域。通常,在常規(guī)臉檢測的情況下,這些區(qū)域是矩形,但可以是任何所需形狀。在最初訓(xùn)練臉檢測系統(tǒng)時,一般針對每一圖像選擇非常大數(shù)量的窗口(還被稱為"樣本")并由總體組合分類器中的每一弱分類器處理,這些窗口通常具有不同大小和位置并且通常完全或部分與許多其它窗口重疊。這一類型的常規(guī)檢測系統(tǒng)的各個弱分類器通常最初相對于已知實例的地面真值(groundtruth)點和構(gòu)成訓(xùn)練數(shù)據(jù)的圖像中的臉位置,來針對非常大的訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練。訓(xùn)練通常是相對緩慢的過程。然而,一旦經(jīng)過訓(xùn)練,這些弱分類器則表示隨后可用于在評估實際數(shù)據(jù)(即實況或記錄的圖像)時使用以檢測該數(shù)據(jù)中的臉的總體組合分類器。這一類型的經(jīng)訓(xùn)練系統(tǒng)的總體檢測速度中的各因素之一是必須評估實際數(shù)據(jù)來檢測臉的弱分類器的數(shù)量?!愣?,給定包括多個弱分類器的成功訓(xùn)練的組合分類器,分類器訓(xùn)練器操作來學(xué)習(xí)隨后被用來構(gòu)造最終修剪分類器的中間拒絕閾值。該修剪分類器隨后取代原始組合分類器來使用。具體地,在一個實施例中,使用確保原始組合分類器檢測到的每一目標(biāo)或特定信息實例也被分類器訓(xùn)練器所產(chǎn)生的修剪分類器檢測到的多級修剪過程來學(xué)習(xí)中間拒絕閾值,從而保證在修剪后對訓(xùn)練集合的檢測率不會降低且虛假肯定率不會增加。換言之,所學(xué)習(xí)的中間拒絕閾值允許分類器訓(xùn)練器所產(chǎn)生的修剪分類器在相對于原始訓(xùn)練數(shù)據(jù)不降低檢測率或增加虛假肯定率的情況下,只要就可能積極地終止目標(biāo)檢測計算。這一終止表示"修剪"正在評估來尋找正在搜索的目標(biāo)或所信息實例的窗口或樣本。因此,窗口或樣本越早地從進(jìn)一步計算中被修剪,總體檢測系統(tǒng)將越快。—般而言,在訓(xùn)練了原始組合分類器后,分類器訓(xùn)練器通過使用訓(xùn)練數(shù)據(jù)(可以與用于訓(xùn)練原始組合分類器的數(shù)據(jù)相同或不同)來學(xué)習(xí)中間拒絕閾值來操作。對于檢測率(或虛假肯定率),沒有關(guān)于概率分布、統(tǒng)計獨立性、或自組織中間目標(biāo)的假定。基本修剪方法基于以下觀察1)在修剪期間,原始組合分類器所丟棄的肯定樣本(例如,對應(yīng)于正在搜索的目標(biāo)實例的窗口)可被安全地丟棄;以及2)信息的每一地面真值實例(例如,圖像中的臉)僅需要一個匹配的樣本或檢測窗口來維持原始組合分類器的檢測率。更具體地,通過檢查訓(xùn)練數(shù)據(jù)的每一肯定樣本或窗口穿過整個弱分類器系列的"路徑",分類器訓(xùn)練器能夠確定肯定樣本(即,對于目標(biāo)檢測的測試是肯定的樣本)的"包絡(luò)"。在一個實施例中,包絡(luò)由從在每一單獨的弱分類器處的分?jǐn)?shù)或置信度水平計算得到的下限來表示。例如,通過特定弱分類器的每一肯定窗口將具有該弱分類器的特定分?jǐn)?shù)或置信度水平。因此,通過確定穿過特定弱分類器的任何肯定樣本的最小分?jǐn)?shù),可以說,在總體組合分類器的訓(xùn)練期間,沒有具有更低分?jǐn)?shù)的肯定樣本通過該弱分類器。因此,該信息可被用于設(shè)置每一弱分類器的最小拒絕閾值,以便在通過弱分類器的任何樣本或窗口的置信度水平低于該特定弱分類器的拒絕閾值的情況下,該窗口將立即從進(jìn)一步考慮中剪除。注意,該修剪過程的具體細(xì)節(jié)在第3節(jié)中進(jìn)一步詳細(xì)討論。應(yīng)當(dāng)注意,以下討論一般指的是用于檢測圖像中的臉的臉檢測系統(tǒng)。然而,對圖像中的臉檢測的討論只是旨在提供分類器訓(xùn)練器的使用和訓(xùn)練的示例性上下文。實際上,鑒于以下討論,應(yīng)當(dāng)清楚,分類器訓(xùn)練器不旨在限于圖像或臉檢測系統(tǒng)的使用,并且可以通過1學(xué)習(xí)適當(dāng)?shù)闹虚g拒絕閾值來評估任何類型的數(shù)據(jù)以標(biāo)識特定目標(biāo)實例或感興趣的其它信息,以用于從先前訓(xùn)練的組合分類器構(gòu)造修剪分類器。2.2系統(tǒng)體系結(jié)構(gòu)概覽以上概述的過程由圖3的概括系統(tǒng)圖示出。特別地,圖3的系統(tǒng)圖示出了用于實現(xiàn)此處所描述的分類器訓(xùn)練器的程序模塊之間的相互關(guān)系。應(yīng)當(dāng)注意,圖3中由斷開的線或虛線所表示的任何框和框之間的互連表示此處所描述的分類器訓(xùn)練器的替換實施例,并且以下描述的這些替換實施例中的任一個或全部可以結(jié)合貫穿本文所描述的其它替換實施例來使用?!愣?,如圖3所示,分類器訓(xùn)練器300通過接收先前訓(xùn)練的組合分類器305和訓(xùn)練數(shù)據(jù)集310并將它們提供給修剪模塊320來開始操作。注意,該訓(xùn)練數(shù)據(jù)集310優(yōu)選地是用于原始組合分類器305的初始訓(xùn)練的同一數(shù)據(jù)集,但不要求該數(shù)據(jù)與用于組合分類器的初始訓(xùn)練的數(shù)據(jù)相同。另外,原始組合分類器305的最終檢測閾值被經(jīng)由檢測閾值模塊設(shè)為所需水平。該最終檢測閾值也被提供給修剪模塊320。如在第3.2節(jié)和第3.3節(jié)中進(jìn)一步詳細(xì)描述的,修剪模塊320隨后結(jié)合來自訓(xùn)練數(shù)據(jù)集的窗口或樣本來評估原始組合分類器305的各個弱分類器,以確定哪些窗口或樣本可被修剪以及可對各弱分類器中的每一個設(shè)置什么閾值來用于修剪。在各實施例中,修剪模塊320通過采用直接后向修剪(DBP)模塊325或多實例修剪(MIP)模塊330來修剪窗口和確定拒絕閾值來執(zhí)行上述修剪過程。在評估了訓(xùn)練數(shù)據(jù)集310之后,修剪模塊320輸出中間拒絕閾值335的集合,分類器構(gòu)造模塊340隨后將中間拒絕閾值335集合與原始組合分類器305相組合以構(gòu)造修剪分類器345,修剪分類器345可被存儲以供稍后在需要時使用。如上所述,修剪模塊320結(jié)合檢測閾值和訓(xùn)練數(shù)據(jù)集310使用先前訓(xùn)練的組合分類器305。盡管分類器訓(xùn)練器300可以使用任何常規(guī)地訓(xùn)練的級聯(lián)檢測器305,但在一個實施例中,分類器訓(xùn)練器使用級聯(lián)學(xué)習(xí)模塊350來學(xué)習(xí)新穎的組合分類器305,該新穎組合分類器305包括使用被稱為"肥樹樁"分類器的新穎弱分類器。肥樹樁分類器模塊355使用迭代過程來學(xué)習(xí)這些肥樹樁分類器,如在第3.5節(jié)中進(jìn)一步詳細(xì)描述的。此外,如第3.4節(jié)中討論的,在一個實施例中,級聯(lián)學(xué)習(xí)模塊350結(jié)合自動學(xué)習(xí)的肥樹樁分類器來使用權(quán)重修整和自引導(dǎo)的組合,以構(gòu)造組合分類器305以及保守的預(yù)備拒絕閾值集合360。在任一情況下,不管原始組合分類器305是使用常規(guī)還是基于肥樹樁分類器的技術(shù)來學(xué)習(xí)的,所得的修剪分類器345都可用于基于常規(guī)分類器的檢測系統(tǒng)中。例如,在一個實施例中,一旦構(gòu)造了修剪分類器345,則將其提供給評估實況或先前記錄的測試數(shù)據(jù)集370的目標(biāo)/實例檢測模塊。目標(biāo)/實例檢測模塊365隨后經(jīng)由修剪分類器345來評估測試數(shù)據(jù)370,并輸出包括相對于測試數(shù)據(jù)集370的目標(biāo)或?qū)嵗龣z測信息的檢測數(shù)據(jù)集375。顯然,檢測系統(tǒng),諸如參考目標(biāo)/實例檢測模塊365簡要描述的檢測系統(tǒng)被用于各種各樣的檢測操作中,并與各種各樣的數(shù)據(jù)類型一起使用。因此,在一個實施例中,使用數(shù)據(jù)輸入模塊380來從一個或多個源接收測試數(shù)據(jù)370,這些源諸如例如照相機295、雷達(dá)或雷達(dá)陣列385、話筒或話筒陣列、或生成或接收與目標(biāo)檢測準(zhǔn)則相兼容的數(shù)據(jù)的任何其它源395,其中修剪分類器345是針對該目標(biāo)檢測準(zhǔn)則來訓(xùn)練的。通常,數(shù)據(jù)輸入模塊380接收到的數(shù)據(jù)的類型將與訓(xùn)練數(shù)據(jù)集310是同一類型的。3.0操作概覽上述程序模塊用于實現(xiàn)分類器訓(xùn)練器。如上概括的,分類器訓(xùn)練器操作來學(xué)習(xí)先前訓(xùn)練的組合分類器的每一單獨弱分類器的拒絕閾值以構(gòu)造修剪分類器。以下各節(jié)提供了對該分類器訓(xùn)練器的操作,以及用于實現(xiàn)在第2節(jié)中參考圖3描述的程序模塊的示例性方法的更詳細(xì)討論。3.1分類器訓(xùn)練器的操作細(xì)節(jié)以下各段詳細(xì)描述了此處所述的分類器訓(xùn)練器的具體操作和替換實施例。具體地,以下各段描述基于原始組合分類器的最終樣本分類的直接后向修剪;基于原始組合分類器的最終樣本分類的多實例修剪;用于改進(jìn)級聯(lián)學(xué)習(xí)的權(quán)重修整和自引導(dǎo);以及"肥樹樁"分類器。3.2使用最終分類進(jìn)行修剪—般而言,如上所述,分類器訓(xùn)練器基于通過原始組合分類器的一系列弱分類器的每一樣本或窗口的最終分類(即肯定或否定)來學(xué)習(xí)中間拒絕閾值。設(shè)置這些中間閾值,以使它們盡可能早地修剪原始組合分類器所丟棄的那些肯定樣本/窗口。通過以此方式處理原始訓(xùn)練數(shù)據(jù)來學(xué)習(xí)每一弱分類器的中間拒絕閾值,分類器訓(xùn)練器產(chǎn)生修剪分類器。類似地,所得的修剪分類器參考實際(即,非訓(xùn)練)測試數(shù)據(jù)來評估的任何樣本也將被積極地修剪,從而得到對測試數(shù)據(jù)的更快的總體分類。例如,如圖4所示,原始組合分類器的最終拒絕400閾值結(jié)合訓(xùn)練數(shù)據(jù)集來使用,以構(gòu)造包含分類器訓(xùn)練器所構(gòu)造的修剪分類器的每一弱分類器的最小拒絕閾值(420到475)的拒絕"包絡(luò)"。如以下進(jìn)一步詳細(xì)描述的,該包絡(luò)表示一軌跡,沿著該軌跡,沒有具有更低分?jǐn)?shù)的肯定樣本通過任何弱分類器。如以下并且參考上述基于MIP的修剪在第3.3節(jié)中所述,使用各基于修剪的實施例來確定中間拒絕閾值(420到475)。具體地,從訓(xùn)練數(shù)據(jù)取出的每一樣本或窗口的分?jǐn)?shù)Sk(t)可被認(rèn)為是該窗口隨時間通過構(gòu)成原始組合分類器的一系列T個弱分類器的"軌跡"或"路徑"。如果肯定樣本的最終分?jǐn)?shù)Sk(t)落在最終閾值e(T)之下,則原始組合分類器拒絕該肯定樣本。在用于設(shè)置中間拒絕閾值的最簡單的實施例中,來自落在最終閾值之下的肯定窗口的所有軌跡都被移除。給定了通過最終閾值9(T)的肯定樣本的全集,隨后通過確定在每一弱分類器處觀察到的分?jǐn)?shù)來簡單地計算每一弱分類器的閾值。具體地,如等式1所示,在該實施例中,中間拒絕閾值e(T)如下計算e(t)-w蘇(r靡界^^,J"等式l其中{xk,yk}是訓(xùn)練集合,其中^=l指示特定樣本Xk的肯定窗口且yk二-l指示否定窗口。這些中間拒絕閾值產(chǎn)生非??焖俚摹⒋_保產(chǎn)生不超過原始組合分類器的誤差(相對于原始訓(xùn)練數(shù)據(jù))的修剪分類器。該修剪實施例在此被稱為"直接后向修剪"(DBP)。該基于DBP的修剪方法與常規(guī)修剪方法之間的一個區(qū)別是常規(guī)方法設(shè)置中間閾值拒絕最大數(shù)量的否定樣本同時嘗試限制相對于原始組合分類器被拒絕的肯定樣本的百分比。相反,基于DBP的修剪方法調(diào)整原始組合分類器的最終閾值來拒絕最大數(shù)量的否定樣本同時達(dá)到某檢測率目標(biāo)。分類器訓(xùn)練器隨后學(xué)習(xí)中間拒絕閾值,以使所得修剪分類器拒絕最大數(shù)量的否定樣本并且不拒絕原始組合分類器所保留的肯定樣本。因此,不同于常規(guī)方案,所得的修剪分類器所拒絕的任何特定肯定樣本只是那些注定要被原始組合分類器拒絕的肯定樣本。因此,該過程產(chǎn)生以與原始組合分類器完全相同的方式標(biāo)記所有肯定樣本的快速分類器。實際上,其產(chǎn)生保留與原始組合分類器相同(如果弱分類器未被重新排序)的肯定樣本的最快的可能修剪分類器。此外,應(yīng)當(dāng)注意,最終通過原始組合分類器閾值的一些否定樣本通常被分類器訓(xùn)練器所學(xué)習(xí)的中間拒絕閾值修剪。這提供了在所得修剪分類器中降低虛假肯定樣本率的附加好處。注意,在一個實施例中,如果需要,經(jīng)由以上描述的基于DBP修剪來訓(xùn)練的弱分類器可被重新排序,但這可影響對某些樣本的修剪。—般而言,使用從大型圖像集合(或其它數(shù)據(jù))取出的大型訓(xùn)練樣本集合(一個或多個樣本對應(yīng)于訓(xùn)練數(shù)據(jù)中的特定信息實例)來學(xué)習(xí)中間拒絕閾值。然而,出于解釋的目的,該基本過程將參考具有單個臉的單個圖像來描述。例如,給定單個圖像的情況,該圖像中的單個物理臉將對應(yīng)于處于某可接受位置和比例范圍內(nèi)的肯定檢測窗口集合中。通常,每一臉(即每一"實例")存在著大量可接受的窗口。每一肯定窗口通過一系列弱分類器的"軌跡"對應(yīng)于最終落在原始組合分類器的最終檢測閾值9(T)之上的可接受窗口。因為這些"可接受"窗口是原始組合分類器所保留的窗口,所以只有這些可接受窗口的軌跡被用于計算中間拒絕閾值。鑒于分類器訓(xùn)練器的這一能力,可以說,用于設(shè)置操作點的原始組合分類器連同閾值9(T)一起在樣本上提供比正在檢測臉的地面真值標(biāo)記更有價值的標(biāo)記。具體地,總是存在極其難以檢測的"肯定"樣本的集合,或更壞地,被錯誤地標(biāo)記的肯定樣本(即"虛假肯定樣本")的集合。實際上,將設(shè)置原始組合分類器的最終閾值e(T)以使這些特定樣本被拒絕。然而,在上述基于DBP的修剪方法中,這些特定樣本可在總體級聯(lián)的計算的極早期時候被拒絕。這可以在不損失分類準(zhǔn)確度的情況下產(chǎn)生非常顯著的速度增長。3.3多實例修剪注意,以下討論一般描述對圖像中的臉的檢測。然而,如上所述,此處描述的分類器訓(xùn)練器更一般地能夠檢測某數(shù)據(jù)或數(shù)據(jù)集中特定信息的各具體實例。示例包括檢測圖像中的臉、語音中的特定詞語、信號中的模式、因特網(wǎng)上的特定文檔、搜索引擎所收集的查詢實例、數(shù)據(jù)庫中的書籍、購物數(shù)據(jù)庫中的產(chǎn)品等。因此,應(yīng)當(dāng)理解,以下關(guān)于圖像中的臉檢測的討論僅旨在作為示例,以提供對分類器訓(xùn)練器的各實施例的操作的更好的理解。"可接受檢測窗口"的概念在用于設(shè)置最終拒絕閾值的改進(jìn)過程中扮演重要角色。具體地,通常難以定義圖像中的臉的正確位置和比例。對于完全直立和正面的臉,一般可以找到關(guān)于包括下巴、前額、以及耳朵的內(nèi)緣的最小矩形的某種一致。然而,在包括一定范圍的非直立和非正面的臉時,這些矩形變化相當(dāng)大。注意,在臉檢測的情況下,在同一臉通常導(dǎo)致多個肯定窗口或樣本時,這表示同一目標(biāo)的"多實例"檢測的情況。例如,在設(shè)置最終拒絕閾值時可以考慮的一個因素是地面真值窗口位置和比例是否應(yīng)當(dāng)根據(jù)外觀頭部大小來定義。另選地,要考慮的另一因素是眼睛位置和內(nèi)眼(i皿erocular)距離是否是用于臉檢測的更可靠的指示符。不幸的是,使用這些因素中的任一個所得的"地面真值"標(biāo)記不能與目標(biāo)臉完全一致。此外,如上所述,總體檢測過程一般通過掃描圖像并以各種比例在各個位置生成大型但有限的重疊窗口集合來操作。此外,即使在缺少比例/位置多義性時,需要某種溢出來確保所生成的窗口中的至少一個被認(rèn)為是每一臉的成功檢測(即,具有通過閾值e(T)的分?jǐn)?shù)的肯定窗口)。在地面真值位置和比例中添加不可避免的多義性后,通常將大小處于50%內(nèi)且處于(大小的)50%距離內(nèi)的任何窗口認(rèn)為是真實的肯定樣本。使用典型掃描參數(shù),這可對每一臉產(chǎn)生大量窗口,這些窗口是同樣有效的肯定檢測,其中同一臉的多個窗口具有通過閾值e(T)的分?jǐn)?shù)。因此,如果這些窗口中的任一個被分類成肯定樣本,則認(rèn)為檢測到了對應(yīng)的臉。盡管大多數(shù)臉檢測算法看到了同一臉的多個肯定窗口的這一問題,但該問題通常未得到解決。少數(shù)常規(guī)方案在"多實例學(xué)習(xí)"(MIL)框架中考慮了這一問題,其中肯定樣本被收集成"包(bag)"中。基于MIL的方案從每一個包中選擇一個或多個肯定樣本作為真實肯定樣本來用于訓(xùn)練原始組合分類器。相反,分類器訓(xùn)練器修改并采用"包"的概念來學(xué)習(xí)此處描述的中間拒絕閾值。實際上,分類器訓(xùn)練器可以使用最初使用MIL式訓(xùn)練算法(或上述任何其它級聯(lián)訓(xùn)練算法)訓(xùn)練的原始組合分類器來構(gòu)造修剪分類器。給定可接受窗口的"包"的概念,如在以下幾段中所討論的,分類器訓(xùn)練器通過實現(xiàn)基于"多實例修剪"(MIP)的過程來改進(jìn)在第3.2節(jié)描述的基于DBP的修剪過程來修剪樣本以避免進(jìn)一步考慮。具體地,假定圖像中的每一地面真值臉存在可接受窗口的集合(即"包"),有可能為每一弱分類器設(shè)置更積極的閾值,如等式2所示,其中<formula>formulaseeoriginaldocumentpage15</formula>其中i是地面真值臉的索引是與地面真值臉i相關(guān)聯(lián)的可接受窗口的集合且Ri是所保留的窗口(見下)的集合。P是具有高于最終閾值的至少一個可接受窗口的地面真值臉的集合<formula>formulaseeoriginaldocumentpage15</formula>在該基于MIP的修剪過程中,肯定樣本進(jìn)入包中,其中每一個包中的肯定樣本只有至少一個必須被分類成肯定樣本以確保成功地檢測每一臉。該準(zhǔn)則允許對肯定樣本進(jìn)行比上述基于DBP的方法更積極的修剪,而仍然確保所得的分類器訓(xùn)練器所產(chǎn)生的修剪分類器的中間拒絕閾值產(chǎn)生與原始組合分類器相同的臉檢測成功率(相對于原始訓(xùn)練數(shù)據(jù)集)。在這種情況下,在等式2和等式3的計算中使用的"保留"樣本的定義比以上針對基于DBP的修剪的情況描述的定義稍微更加復(fù)雜。具體地,如基于DBP的修剪一樣,最初保留來自肯定包中落在最終閾值之上的所有軌跡。然而,與基于DBP的方法相反,每一個包中保留的樣本的集合&在分類器訓(xùn)練器設(shè)置中間拒絕閾值時被進(jìn)一步減少。具體地,基于MIP的修剪方法檢查樣本的部分分?jǐn)?shù)是否落在特定弱分類器的當(dāng)前閾值之下(因為它處于具有更好樣本的包中)。每一這樣的樣本隨后從保留集合Ri中被移除并且不被用于設(shè)置后續(xù)閾值。換言之,對于對應(yīng)于特定臉的每一樣本包,隨著分類器訓(xùn)練器前進(jìn)通過原始組合分類器的各弱分類器,將從每一個包中消除具有針對特定弱分類器的最低分?jǐn)?shù)的肯定樣本。隨后,一旦從特定包中消除了肯定樣本,則對于后續(xù)弱分類器不再考慮該肯定樣本。很明顯,該修剪方法比上述基于DBP的修剪方法更積極。注意,在一個實施例中,從每一特定弱分類器的每一個包中的肯定樣本的最小分?jǐn)?shù)減去小的偏移值e,以便不過快地從每一個包中修剪肯定樣本。例如,通過將最小分?jǐn)?shù)減少某一小量,如果肯定樣本對于該特定弱分類器比該小值e更接近,則分類器訓(xùn)練器將在包中保留更多肯定樣本。在一測試實施例中,使用數(shù)量級大約為10—6的e值。然而,應(yīng)當(dāng)注意,該值取決于所使用的弱分類器的類型和這些弱分類器生成的分?jǐn)?shù)的相對值。上述基于MIP的修剪過程由表1中示出的偽碼來概括<table>tableseeoriginaldocumentpage16</column></row><table>_<table>tableseeoriginaldocumentpage16</column></row><table>在較早的級拒絕特定軌跡(并且因此從特定包中拒絕對應(yīng)的肯定樣本)可以對后續(xù)弱分類器造成生較高的拒絕閾值。因此,在一相關(guān)實施例中,分類器訓(xùn)練器延遲從特定包中消除肯定樣本,同時跨各消除組合來進(jìn)行搜索以實現(xiàn)最佳MIP修剪檢測器。然而,該實施例可能需要比基本的基于MIP的修剪過程顯著更多的計算開銷。最后,應(yīng)當(dāng)注意,即使基于MIP的修剪方法比基于DBP的修剪方法更積極,它仍然能保證與原始組合分類器相同的對訓(xùn)練數(shù)據(jù)集的臉檢測率。注意,通過依次設(shè)置每一閾值以使得保留所有肯定包以及最少數(shù)量的肯定樣本通過最終弱分類器,基于MIP的修剪方法被認(rèn)為是貪婪的。該過程被保證來生成至少與在第3.2節(jié)描述的基于DBP的修剪分類器一樣快的修剪分類器(因為用于設(shè)置閾值的準(zhǔn)則較不嚴(yán)格)。然而,該過程不保證所得的修剪分類器是滿足該MIP準(zhǔn)則的最快的分類器。3.4權(quán)重修整和自引導(dǎo)上述修剪過程可應(yīng)用于任何常規(guī)組合分類器(即,作為在此通常稱為"弱分類器"的較簡單功能的和的分類器)。然而,除常規(guī)組合分類器之外,以下各段描述用于從非常大的訓(xùn)練樣本集合(可能包括數(shù)百萬、數(shù)十億、或甚至更大數(shù)量的樣本)中學(xué)習(xí)組合分類器的新穎過程。為處理這種大數(shù)量的樣本,分類器訓(xùn)練器在各實施例中結(jié)合稱為"肥樹樁"分類器的新穎的弱分類器(參見第3.5節(jié))來使用權(quán)重修整和自引導(dǎo)的新穎適應(yīng)。常規(guī)上,"權(quán)重修整"是用于改進(jìn)在各學(xué)習(xí)算法中使用的"推進(jìn)"技術(shù)的概念。例如,在每一輪推進(jìn)處,常規(guī)權(quán)重修整忽略具有最小權(quán)重的訓(xùn)練樣本,直達(dá)總權(quán)重的某一百分比(通常在1%和10%之間)。因為權(quán)重通常非常偏向少量困難的樣本,所以這可以消除非常大數(shù)量的樣本。已經(jīng)證明,權(quán)重修整可以顯著地減少用于推進(jìn)方法的計算而不犧牲準(zhǔn)確度。此外,權(quán)重修整的另一有益屬性是從不完全扔掉樣本,因為即使某一樣本在一個級處被修整,它也可以在稍候級中返回。因為沒有樣本被永久丟棄,所以其對于用于學(xué)習(xí)組合分類器而言是理想的。在一個實施例中,如上所述,所學(xué)習(xí)的組合分類器隨后由分類器訓(xùn)練器處理,以通過學(xué)習(xí)組合分類器的每一弱分類器的中間拒絕閾值來從該組合分類器構(gòu)造修剪分類器?!愣?,如以下討論地,通過結(jié)合經(jīng)修改的自適應(yīng)推進(jìn)(S卩"AdaBoost")來使用周期性權(quán)重更新的組合以訓(xùn)練以訓(xùn)練原始組合分類器的原始弱分類器,分類器訓(xùn)練器提供用于數(shù)十億樣本數(shù)量級的大型訓(xùn)練樣本集合的基于級聯(lián)的學(xué)習(xí)方法。一旦使用以下描述的修整和自引導(dǎo)技術(shù)學(xué)習(xí)了該原始組合分類器,則如上所述,隨后可應(yīng)用上述修剪技術(shù)通過構(gòu)造新修剪分類器來進(jìn)一步改進(jìn)效率。具體地,如表2的偽碼所示,分類器訓(xùn)練器首先初始化大型樣本輸入{(Xl,y》,...(xK,yK)}的權(quán)重,其中K是數(shù)十億樣本的數(shù)量級。對整個樣本集合的權(quán)重更新通過預(yù)定義集合A來限制,其指定在連續(xù)的權(quán)重更新之間要對整個訓(xùn)練集合執(zhí)行的學(xué)習(xí)迭代的數(shù)量,因為進(jìn)一步更新的效果降低所以更新時間間隔通常隨時間增加。注意,如果需要,可以在學(xué)習(xí)每一弱分類器后,對整個訓(xùn)練集合的分?jǐn)?shù)執(zhí)行權(quán)重更新。然而,從附加更新得到的任何性能增益可以被增加的計算開銷所抵銷。來自該學(xué)習(xí)構(gòu)成的輸出是弱分類器的預(yù)備閾值的集合,使結(jié)果成為軟級聯(lián)。然而,這些預(yù)備拒絕閾值極其保守,保留了訓(xùn)練集合中的所有肯定樣本。它們導(dǎo)致非常慢的檢測器,其中每一窗口訪問的弱分類器的平均數(shù)量是數(shù)百數(shù)量級的。然而,如上所述,分類器訓(xùn)練器使用上述修剪技術(shù)學(xué)習(xí)每一弱分類器的新中間拒絕閾值,從而顯著地提高了所得修剪17分類器的總體性能。上述學(xué)習(xí)過程由在表2中示出的偽碼來概括表2:使用權(quán)重修整和自引導(dǎo)的AdaBoost學(xué)習(xí)_輸入1.訓(xùn)練樣本((XbyO,…(XKyK)),其中yK^-l,U分別用于否定和肯定樣本xK;以及2.T是要學(xué)習(xí)的弱分類器的總數(shù),其可通過交叉確認(rèn)來設(shè)置或經(jīng)由用戶界面來指定。初始化1.取訓(xùn)練樣本集合中的所有肯定樣本,并隨機采樣否定樣本以形成Q個樣本的子集,例如Q-10S2.初始化權(quán)重^,來保證采樣數(shù)據(jù)集上肯定和否定樣本之間的權(quán)重平衡;3.定義集合A作為用于更新所有權(quán)重的所需權(quán)重更新時間間隔,例如{2,4,8,16,32,64,128,256,...}等。經(jīng)修改的AdaBoost學(xué)習(xí)對于t=l,...,T1.對于過濾器池中的每一矩形過濾器,在當(dāng)前權(quán)重集合,ieQ(參見第3.5節(jié)和表3)下構(gòu)造最小化Z分?jǐn)?shù),即Z,;V^^的"肥樹樁"分類器;2.選擇具有最小Z分?jǐn)?shù)的最佳分類器ht,并尋找相關(guān)聯(lián)的置信度^。3.更新所有Q個采樣樣本的權(quán)重。_4.如果teA:使用先前選擇的分類器hb...,ht來更新整個訓(xùn)練集合的權(quán)重。執(zhí)行權(quán)重修整來修整否定權(quán)重的所需百分比(大約1%到10%的數(shù)量級)。從經(jīng)修整的訓(xùn)練集合中取所有肯定樣本并隨機采樣否定樣本以形成Q個樣本的新子集。5.將Z二PA的預(yù)備拒絕閾值代O設(shè)為在級t的所有肯定樣本的最小分?jǐn)?shù)。輸出1.與置信度",相關(guān)聯(lián)的弱分類器系列ht,t=l,...,T(即"肥樹樁")以及預(yù)備拒絕閾值代O。3.5"肥樹樁"弱分類器如上所述,在各實施例中,此處稱為"肥樹樁"的新類型的弱分類器結(jié)合第3.4節(jié)中描述的學(xué)習(xí)過程來使用,以訓(xùn)練原始組合分類器(即級聯(lián)檢測器),具有每一肥樹樁分類器的預(yù)備拒絕閾值。該肥樹樁弱分類器使用可變格(bin)大小來顯著地提高所得級聯(lián)的總體分類性能而在分類時間上的增加可以忽略。—般而言,此處描述的肥樹樁分類器表示基于多個閾值執(zhí)行多路劃分的決策樹。例如,圖5提供使用具有固定格大小(510到540)的哈爾(Haar)特征的常規(guī)現(xiàn)有技術(shù)查找表(LUT)分類器的示例。相反,圖6示出使用具有動態(tài)確定的格寬度和位置(610到640)的哈爾特征的"肥樹樁"多線程分類器的示例。多閾值可以從更寬范圍的矩形過濾器(例如,預(yù)測臉的值非常大還是非常小的過濾器)中提取預(yù)測值。如本領(lǐng)域技術(shù)人員所知,使用完整決策樹作為弱分類器一般對檢測性能產(chǎn)生改進(jìn)。不幸的是,這伴隨著檢測時間的可測量增加。已經(jīng)觀察到,檢測性能可以通過使用具有固定格的查找表(LUT)來代替簡單樹樁而改進(jìn)(如圖5所示)。然而,當(dāng)在LUT表中存在大量格時,通常有過多靈活性,這可導(dǎo)致過訓(xùn)練。相反,當(dāng)在LUT表中存在過少格時,常規(guī)的基于決策樹的學(xué)習(xí)算法表現(xiàn)得不比簡單樹樁更好。為解決這些問題,分類器訓(xùn)練器提供肥樹樁分類器,這些分類器是通過將輸入范圍劃分成多個靈活的可變大小的格來被迭代地學(xué)習(xí)的,這些格最終基于用于最大化每一可變大小格中肯定對否定樣本的比率的迭代操作而對每一格收斂于最佳大小。對于過濾器池中的每一矩形過濾器,在當(dāng)前權(quán)重集合""i,iGQ(參見表3的迭代偽碼)下構(gòu)造最小化Z分?jǐn)?shù)的"肥樹樁"分類器。注意,收斂是得到保證的,因為在每一迭代處Z分?jǐn)?shù)都不增加。在一測試實施例中,最大迭代次數(shù)被設(shè)為5,然而,已經(jīng)觀察到,1到3次迭代通常足以實現(xiàn)收斂。所得弱分類器像小型決策樹;然而,該樹中的每一節(jié)點使用同一矩形過濾器。這顯著地提高了每一弱分類器的速度,同時提供良好的檢測性能。用于學(xué)習(xí)肥樹樁分類器的過程由在表3中示出的偽碼來概括<table>tableseeoriginaldocumentpage20</column></row><table>例如,在一測試實施例中,從92,412個哈爾型矩形過濾器的池中構(gòu)造這些肥樹樁弱分類器的集合。這些矩形過濾器按檢測窗口的方差來歸一化。此外,在一個實施例中,該窗口方差的值作為可被選擇來用于弱分類器中的附加"過濾器"來提供。另外,該過濾器可供使用而不需要任何附加計算開銷,因為無論如何都要為每一窗口進(jìn)行計算來歸一化。注意,第一肥樹樁弱分類器總是告知(spliton)方差。4.0用于學(xué)習(xí)拒絕閾值的操作概覽以上相對于學(xué)習(xí)中間拒絕閾值描述的各實施例中的一些由圖7中提供的操作流程圖來概括。注意,圖7僅旨在作為用于學(xué)習(xí)中間拒絕閾值的一般概覽,并且應(yīng)當(dāng)鑒于圖3和圖4以及進(jìn)一步鑒于以上在第2節(jié)和第3節(jié)中提供的詳細(xì)描述來理解。具體地,圖7提供示出用于在給定已訓(xùn)練的原始組合分類器(S卩,級聯(lián)檢測器)、原始訓(xùn)練數(shù)據(jù)集、以及最終檢測閾值的情況下,學(xué)習(xí)中間拒絕閾值的各實施例的示例性流程圖。應(yīng)當(dāng)注意,圖7中由斷開的線或虛線所表示的任何框表示分類器訓(xùn)練器的替換實施例,并且以下描述的這些替換實施例中的任一個或全部可以結(jié)合貫穿本文所描述的其它替換實施例來使用。例如,如圖7所示,分類器訓(xùn)練器通過接收700級聯(lián)檢測器檢測閾值705、用于訓(xùn)練該級聯(lián)檢測器的訓(xùn)練數(shù)據(jù)310、以及當(dāng)然先前訓(xùn)練的級聯(lián)檢測器305(在此也被稱為"原始組合分類器")的輸入來開始操作。給定這些輸入,分類器訓(xùn)練器在訓(xùn)練集合310中與任何地面真值目標(biāo)相匹配的所有窗口上運行710級聯(lián)檢測器305。換言之,所有肯定樣本穿過級聯(lián)檢測器305。在將這些窗口穿過級聯(lián)檢測器305時,保留各信息。例如,每一窗口的最終檢測分?jǐn)?shù)連同總體級聯(lián)中每一弱分類器的中間分?jǐn)?shù)一起保留。給定該信息,分類器訓(xùn)練器接著收集715具有超過為級聯(lián)檢測器305設(shè)置的檢測閾值的最終分?jǐn)?shù)的所有窗口。在一個實施例(以上參考DBP(S卩"直接后向修剪")描述的實施例)中,分類器訓(xùn)練器接著評估針對每一弱分類器收集的窗口來修剪720高于在每一單獨的弱分類器處看到的最小分?jǐn)?shù)的所有中間分?jǐn)?shù)。這些單獨的最小分?jǐn)?shù)隨后被輸出(725)到每一分類器的中間拒絕閾值集合335(循環(huán)730)。在一相關(guān)的修剪實施例(以上參考MIP(S卩"多實例修剪")描述)中,分類器訓(xùn)練器收集715具有超過為級聯(lián)檢測器305設(shè)置的檢測閾值的最終分?jǐn)?shù)的窗口/樣本,隨后將所收集的窗口歸組735成各個樣本"包",其中特定包中的每一窗口或樣本對應(yīng)于同一(即多實例)地面真值目標(biāo)的肯定樣本。例如,在臉檢測的情況下,表示圖像中同一確切臉(即,同一實例)的肯定樣本的每一窗口被置于同一個包中。接著,對于每一弱分類器,分類器訓(xùn)練器確定740每一個包中剩余的每一窗口的最大分?jǐn)?shù)。分類器訓(xùn)練器隨后從每一弱分類器的所有包的最大分?jǐn)?shù)中計算745最小分?jǐn)?shù),并輸出750該最小分?jǐn)?shù)作為當(dāng)前弱分類器的中間拒絕閾值335。分類器訓(xùn)練器從特定包中修剪或消除755具有小于計算得到的最小分?jǐn)?shù)的分?jǐn)?shù)的所有窗口。(注意,如上所述,該"最小分?jǐn)?shù)"可小于各最大分?jǐn)?shù)中的實際最小值,因為在一個實施例中,從最小分?jǐn)?shù)減去了小的偏移值e。)該過程隨后通過輸出750每一弱分類器的各個中間拒絕閾值335來繼續(xù)(循環(huán)760)。然而,應(yīng)當(dāng)注意,如上所述,一旦從特定包中修剪755了窗口,則對于任何后續(xù)弱分類器,在該包中該窗口不再可用于評估(即計算該包的最大分?jǐn)?shù))。最后,不管使用哪一修剪實施例,如上所述,一旦學(xué)習(xí)了級聯(lián)檢測器305的每一弱分類器的中間拒絕閾值335,分類器訓(xùn)練器即使用這些中間拒絕閾值來構(gòu)造765修剪分類器345。隨后存儲所得修剪分類器345以供稍后在使用某基于級聯(lián)的目標(biāo)檢測應(yīng)用來檢測目標(biāo)時使用。以上對分類器訓(xùn)練器的描述是出于說明和描述的目的而提出的。這并不是要窮舉本發(fā)明或?qū)⒈景l(fā)明限于所公開的精確形式。鑒于上述教導(dǎo),許多修改和變型都是可能的。此外,應(yīng)當(dāng)注意,可以按所需的任何組合使用上述替換實施例的任一個或全部以形成分類器訓(xùn)練器的另外的混合實施例。本發(fā)明的范圍并不旨在由該詳細(xì)描述來限定,而是由所附權(quán)利要求書來限定。權(quán)利要求一種用于從數(shù)據(jù)集中的實例來訓(xùn)練分類器的過程,包括以下過程動作接收(700)包括一系列弱分類器的已訓(xùn)練的組合分類器(305);接收(700)訓(xùn)練數(shù)據(jù)集(310),所述數(shù)據(jù)集還包括所述訓(xùn)練數(shù)據(jù)集中的實例的地面真值標(biāo)記;接收(700)所述組合分類器的分類閾值(705);使用所述組合分類器(305)來計算(710)每一實例的每一樣本的中間分?jǐn)?shù)集合;使用所述組合分類器(305)來計算(710)每一實例的每一樣本的最終檢測分?jǐn)?shù);消除(710)具有低于所述分類閾值(705)的最終檢測分?jǐn)?shù)的樣本;對于每一弱分類器,從所有剩余樣本的中間分?jǐn)?shù)來計算(740、745、750)拒絕閾值(335);以及通過集成所述拒絕閾值(335)與所述組合分類器(305)的對應(yīng)弱分類器來構(gòu)造(765)修剪分類器(345)。2.如權(quán)利要求2所述的過程,其特征在于,從所有剩余樣本的中間分?jǐn)?shù)來計算所述拒絕閾值包括將所有剩余樣本歸組成單獨的樣本集合,每一樣本集合對應(yīng)于所述實例中的特定一個;以及對于每一弱分類器對于每一樣本集合,從每一樣本集合中剩余的所有樣本的中間分?jǐn)?shù)計算最大分?jǐn)?shù),基于每一樣本集合的最大分?jǐn)?shù)來計算所述拒絕閾值,以及在任何樣本具有小于所述拒絕閾值的中間分?jǐn)?shù)時,從其對應(yīng)的樣本集合中消除所述樣本。3.如權(quán)利要求2所述的過程,其特征在于,基于每一樣本集合的最大分?jǐn)?shù)計算所述拒絕閾值包括確定每一樣本集合的最大分?jǐn)?shù)中的最小值并從所述最小值中減去小偏移值。4.如權(quán)利要求1所述的過程,其特征在于,用于訓(xùn)練所述組合分類器的所述訓(xùn)練數(shù)據(jù)集表示圖像集合,并且其中所述訓(xùn)練數(shù)據(jù)集中的實例是臉。5.如權(quán)利要求1所述的過程,其特征在于,還包括使用所述修剪分類器來檢測新數(shù)據(jù)集中的實例的目標(biāo)檢測系統(tǒng)。6.如權(quán)利要求1所述的過程,其特征在于,所述修剪分類器的弱分類器中的一個或多個連同它們對應(yīng)的拒絕閾值被重新排序。7.如權(quán)利要求1所述的過程,其特征在于,構(gòu)成所述組合分類器的所述一系列弱分類器是從所述訓(xùn)練數(shù)據(jù)集中自動學(xué)習(xí)的。8.—種其上存儲有用于構(gòu)造供在檢測信號中的特定類型的信息的離散實例時使用的分類器集合的計算機可執(zhí)行指令的計算機可讀介質(zhì),所述計算機可執(zhí)行指令包括接收(700)包括一系列弱分類器并包括用戶選擇的檢測閾值(705)的已訓(xùn)練的組合分類器(305);接收(700)訓(xùn)練數(shù)據(jù)(310),所述訓(xùn)練數(shù)據(jù)還包括在所述訓(xùn)練數(shù)據(jù)中表示的特定類型的信息的多個離散實例的地面真值標(biāo)記;接收(710)包括對應(yīng)于所述離散實例中的每一個的一個或多個肯定樣本的肯定樣本隹A.朱口;使用所述組合分類器(305)來確定(710)所述肯定樣本中的每一個的最終檢測分?jǐn)?shù);使用每一弱分類器來確定(710)所述肯定樣本集合中的每一肯定樣本的對應(yīng)的中間分?jǐn)?shù);從所述肯定樣本的對應(yīng)的中間分?jǐn)?shù)中的至少一些中來計算(740、745、750)每一弱分類器的拒絕閾值(335);以及通過集成所述拒絕閾值(335)與所述對應(yīng)的弱分類器來構(gòu)造(765)修剪分類器(345)。9.如權(quán)利要求8所述的計算機可讀介質(zhì),其特征在于,使用所述組合分類器來確定所述肯定樣本中的每一個的最終檢測分?jǐn)?shù)還包括從所述肯定樣本集合中移除肯定樣本,其中所移除的肯定樣本具有落在所述檢測閾值之下的最終檢測分?jǐn)?shù)。10.如權(quán)利要求8所述的計算機可讀介質(zhì),其特征在于,從對應(yīng)的樣本的中間分?jǐn)?shù)的至少一些來計算所述拒絕閾值包括標(biāo)識并歸組對應(yīng)于所述離散實例中的特定一個的所有肯定樣本;以及對于每一弱分類器對于肯定樣本的每一分組,從每一肯定樣本分組中剩余的肯定樣本的中間分?jǐn)?shù)來計算最大分?jǐn)?shù),基于每一肯定樣本分組的最大分?jǐn)?shù)來計算所述拒絕閾值,以及在任何肯定樣本具有小于所述拒絕閾值的中間分?jǐn)?shù)時,從其對應(yīng)的肯定樣本分組中消除所述肯定樣本。11.如權(quán)利要求io所述的計算機可讀介質(zhì),其特征在于,基于每一肯定樣本分組的最大分?jǐn)?shù)來計算所述拒絕閾值還包括,確定每一肯定樣本分組的最大分?jǐn)?shù)中的最小值,并從該最小值中減去小偏移值以確定所述拒絕閾值。12.如權(quán)利要求8所述的計算機可讀介質(zhì),其特征在于,構(gòu)成所述已訓(xùn)練的組合分類器的所述一系列弱分類器是從所述訓(xùn)練數(shù)據(jù)中自動地學(xué)習(xí)的。13.如權(quán)利要求12所述的計算機可讀介質(zhì),其特征在于,從所述訓(xùn)練數(shù)據(jù)中自動地學(xué)習(xí)所述弱分類器包括用于將迭代權(quán)重修整和自引導(dǎo)過程應(yīng)用于對應(yīng)于從所述訓(xùn)練數(shù)據(jù)導(dǎo)出的離散實例中的每一個的大型肯定樣本集合以學(xué)習(xí)每一弱分類器的參數(shù)的指令。14.如權(quán)利要求8所述的計算機可讀介質(zhì),其特征在于,所述訓(xùn)練數(shù)據(jù)表示一個或多個圖像的集合,并且其中所述訓(xùn)練數(shù)據(jù)中表示的多個離散實例是每一圖像中的臉的離散實例。15.如權(quán)利要求14所述的計算機可讀介質(zhì),其特征在于,還包括用于通過實時地捕捉圖像并通過使用所述修剪分類器來處理這些捕捉的圖像來提供對所捕捉的圖像中的臉的實時檢測以實現(xiàn)所述臉檢測系統(tǒng)的指令。16.—種用于構(gòu)造供在實時目標(biāo)檢測中使用的組合分類器的方法,包括使用計算設(shè)備來接收(700)包括一系列弱分類器并包括目標(biāo)檢測閾值(705)的已訓(xùn)練的組合分類器(305);接收(700)訓(xùn)練數(shù)據(jù)集(310),所述訓(xùn)練集合還包括在所述訓(xùn)練數(shù)據(jù)中表示的多個單獨目標(biāo)的地面真值標(biāo)記;接收(710)對應(yīng)于所述單獨目標(biāo)中的每一個的一個或多個肯定樣本的集合;使用所述組合分類器來確定(710)所述肯定樣本中的每一個的最終檢測分?jǐn)?shù);消除(710)具有低于所述目標(biāo)檢測閾值的最終檢測分?jǐn)?shù)的肯定樣本;對于每一弱分類器,確定(710)每一肯定樣本的中間分?jǐn)?shù);標(biāo)識(715)并歸組(735)對應(yīng)于所述訓(xùn)練數(shù)據(jù)中表示的每一單獨目標(biāo)的所有剩余樣本;對于每一弱分類器,從每一樣本分組的對應(yīng)的中間分?jǐn)?shù)中來計算(740、745、750)中間拒絕閾值(335);以及通過組合所述拒絕閾值(335)與每一對應(yīng)的弱分類器來構(gòu)造(765)修剪分類器(345)。17.如權(quán)利要求16所述的方法,其特征在于,計算每一弱分類器的所述中間拒絕閾值包括確定每一對應(yīng)的弱分類器的每一樣本分組的中間分?jǐn)?shù)的最小值并從所述最小值中減去小偏移值。18.如權(quán)利要求16所述的方法,其特征在于,所述訓(xùn)練數(shù)據(jù)表示圖像集合,并且其中所述訓(xùn)練數(shù)據(jù)中表示的所述多個單獨目標(biāo)表示單獨的臉;以及其中實時臉檢測系統(tǒng)是通過實時地捕捉圖像并通過使用所述修剪分類器來處理這些所捕捉的圖像以提供對所捕捉的圖像中的臉的實時檢測來實現(xiàn)的。19.如權(quán)利要求16所述的方法,其特征在于,所述修剪分類器的弱分類器中的一個或多個的次序連同它們對應(yīng)的中間拒絕閾值被重新排序。20.如權(quán)利要求16所述的方法,其特征在于,構(gòu)成所述修剪分類器的所述一系列弱分類器是使用肯定和否定樣本的柱狀圖來從所述訓(xùn)練數(shù)據(jù)自動學(xué)習(xí)的,所述柱狀圖具有動態(tài)地確定的可變的格寬度和位置。全文摘要“分類器訓(xùn)練器”訓(xùn)練用于檢測信號中的特定對象(例如,圖像中的臉、語音中的詞語、信號中的模式等)的組合分類器。在一個實施例中,引入“多實例修剪”(MIP)來訓(xùn)練組合分類器的弱分類器或“特征”。具體地,將已訓(xùn)練的組合分類器和用于設(shè)置虛假肯定/否定操作點的相關(guān)聯(lián)的最終閾值與所學(xué)習(xí)的中間拒絕閾值相組合以構(gòu)造組合分類器。拒絕閾值是使用確保原始組合分類器檢測到的對象也被該組合分類器檢測到的修剪過程來學(xué)習(xí)的,從而保證在修剪之后對訓(xùn)練集合相同的檢測率。貫穿訓(xùn)練所需的唯一參數(shù)是最終級聯(lián)系統(tǒng)的目標(biāo)檢測率。在附加實施例中,組合分類器使用權(quán)重修整、自引導(dǎo)和被稱為“肥樹樁”分類器的弱分類器的各種組合來訓(xùn)練。文檔編號G06F15/18GK101743537SQ200880024082公開日2010年6月16日申請日期2008年7月1日優(yōu)先權(quán)日2007年7月13日發(fā)明者C·張,P·沃拉申請人:微軟公司