基于多示例學(xué)習(xí)的視頻人臉識別算法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)字圖像處理與計算機視覺領(lǐng)域,特別涉及一種視頻人臉識別算法。
【背景技術(shù)】
[0002] 視頻人臉識別近年來成為計算機視覺領(lǐng)域的研宄熱點和難點問題,伴隨著物聯(lián) 網(wǎng)、網(wǎng)絡(luò)安全等的發(fā)展,具有廣闊的應(yīng)用前景。相對于靜態(tài)圖像,動態(tài)視頻中可選用的特征 信息更加豐富多樣,例如,視頻的時間動態(tài)信息有助于識別率的提升;從視頻序列中可以選 取分辨率相對較高的圖像以能夠提高識別性能;還可以通過視頻學(xué)習(xí)重構(gòu)目標(biāo)三維模型, 利用這些模型可以高效的實現(xiàn)目標(biāo)識別??傊?,時間和運動信息在基于視頻的目標(biāo)識別中 起到了至關(guān)重要的作用。
[0003] 視頻人臉識別方法主要分為兩類:一類方法是設(shè)法提取出視頻序列中最具代表性 的單獨人臉幀圖像,采用傳統(tǒng)的基于靜態(tài)圖像的人臉識別方法,包括基于幾何特征的方法、 基于統(tǒng)計的方法等等。該類方法存在的主要問題是對關(guān)鍵幀的定義較為模糊,且沒有有效 利用視頻中的上下文信息。另外一類方法就是將視頻看成是一個視頻幀集合,從幀集合的 角度進行分析,利用3D建模、時空連續(xù)信息的概率模型方法、設(shè)計視頻紋理描述等提高識 別率,在這類方法中如何充分利用視頻中人臉的時間和空間信息克服視頻中人臉分辨率 低、光照、表情、姿態(tài)變化劇烈等困難是研宄的重點。因此,需要一種方法解決上述問題。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明所要解決的技術(shù)問題是為解決視頻人臉識別問題中關(guān)鍵幀難以準(zhǔn)確定位 以及高信噪比導(dǎo)致的識別率偏低等問題,提出一種基于多示例學(xué)習(xí)的視頻人臉識別方法。 所述方法在提高視頻人臉識別準(zhǔn)確率和識別性能方面有顯著地提高。
[0005] 為了解決上述技術(shù)問題,本發(fā)明所采用的技術(shù)方案是:
[0006] 一種基于多示例學(xué)習(xí)的視頻人臉識別方法,包括如下步驟:
[0007] 步驟A,對從視頻中提取的正面人臉視頻序列以雙眼坐標(biāo)為基準(zhǔn)進行人臉歸一化 處理;
[0008] 步驟B,在預(yù)處理階段,對提取出的人臉視頻序列中的每個視頻幀進行兩個尺度、 四個方向的Gabor變換,得到頻域幅值圖像,利用這些頻域幅值圖像可以獲得增強的頻域 幅值特征;
[0009] 步驟C,將上一步驟得到的頻域幅值圖像集合劃分分塊,并對每個分塊通過LBP算 子獲得分塊的紋理特征,每個分塊的紋理特征通過統(tǒng)計直方圖的形式表示,將各分塊直方 圖級聯(lián)以得到該人臉視頻的全局紋理信息;
[0010] 步驟D,通過上述步驟得到訓(xùn)練視頻的特征分布空間,通過EMDD算法得到特征空 間中多樣性密度最大點t,對于每一個測試包,計算t與測試包之間的距離。如果測試包與 t之間的距離小于分類閾值,那么就將其作為正包,否則,將其歸為反包,實現(xiàn)對測試包的二 分類。
[0011] 步驟E,對于給定的K個分類的訓(xùn)練視頻集合,通過上述步驟將得到K (κ-l) /2個子 分類器,通過采用One-Against-One方法可以建立多分類模型,對于任一測試人臉視頻,可 以通過步驟A、B、C的操作后獲得全局紋理信息,輸入到該多分類模型就可以得到測試包的 最終分類結(jié)果。
[0012] 所述的分類閾值的確定可以通在候選閾值進行選擇,當(dāng)某一候選閾值可以最大程 度上將訓(xùn)練集合中的包進行正確分類時,將該候選閾值最為最終的分類閾值。
[0013] 有益效果:本發(fā)明提出了一種基于多示例學(xué)習(xí)的視頻人臉識別算法,所述算法提 出了一種基于多示例學(xué)習(xí)的視頻人臉識別方法,該方法將人臉視頻視為一個包,而將視頻 中的人臉圖像作為包中的示例,對包中的示例提取加權(quán)的LBP特征直方圖來以獲取示例特 征,通過多示例學(xué)習(xí)算法訓(xùn)練得到分類器以實現(xiàn)對測試人臉視頻的分類預(yù)測。本文算法在 得到較高的識別精度的同時,有效解決了人臉視頻中關(guān)鍵幀難以選擇的問題,并且具有較 強的抗干擾能力,對光照變化、表情等問題也具有較好的魯棒性。
【附圖說明】
[0014] 圖1是本發(fā)明基于多示例學(xué)習(xí)的視頻人臉識別算法的流程圖。
【具體實施方式】
[0015] 下面結(jié)合附圖,對本發(fā)明提出的一種基于直方圖的彩色圖像分割方法進行詳細(xì)說 明:
[0016] 如圖1所示,本發(fā)明的視頻人臉識別方法,其步驟如下:
[0017] 下面結(jié)合圖1詳細(xì)說明本發(fā)明的基于多示例學(xué)習(xí)的視頻人臉識別算法。
[0018] 首先,進行人臉圖像的預(yù)處理。Gabor小波變換能夠提取圖像的多尺度、多方向局 部頻率信息,可以增強一些關(guān)鍵特征,在提取目標(biāo)的局部空間頻率域信息方面具有良好的 特性。在人臉識別領(lǐng)域中,Gabor變換得到了廣泛的應(yīng)用。
[0019] 二維Gabor小波函數(shù)定義為:
【主權(quán)項】
1. 一種基于多示例學(xué)習(xí)的視頻人臉識別算法,其特征在于:包括如下步驟: 步驟A,對從視頻中提取的正面人臉視頻序列以雙眼坐標(biāo)為基準(zhǔn)進行人臉歸一化處 理; 步驟B,在預(yù)處理階段,對提取出的人臉視頻序列中的每個視頻幀進行兩個尺度、四個 方向的Gabor變換,得到頻域幅值圖像,利用這些頻域幅值圖像可以獲得增強的頻域幅值 特征; 步驟C,將上一步驟得到的頻域幅值圖像集合劃分分塊,并對每個分塊通過LBP算子獲 得分塊的紋理特征,每個分塊的紋理特征通過統(tǒng)計直方圖的形式表示,將各分塊直方圖級 聯(lián)以得到該人臉視頻的全局紋理信息; 步驟D,通過上述步驟得到訓(xùn)練視頻的特征分布空間,通過EMDD算法得到特征空間中 多樣性密度最大點t,對于每一個測試包,計算t與測試包之間的距離,如果測試包與t之 間的距離小于分類閾值,那么就將其作為正包,否則,將其歸為反包,實現(xiàn)對測試包的二分 類; 步驟E,對于給定的K個分類的訓(xùn)練視頻集合,通過上述步驟將得到K(K-I) /2個子分類 器,通過采用One-Against-One方法可以建立多分類模型,對于任一測試人臉視頻,可以通 過步驟A、B、C的操作后獲得全局紋理信息,輸入到該多分類模型就可以得到測試包的最終 分類結(jié)果。
2. 根據(jù)權(quán)利要求1所述的一種基于多示例學(xué)習(xí)的視頻人臉識別算法,其特征在于:步 驟D所述的分類閾值的確定可以通在候選閾值進行選擇,當(dāng)某一候選閾值可以最大程度上 將訓(xùn)練集合中的包進行正確分類時,將該候選閾值做為最終的分類閾值。
【專利摘要】本發(fā)明提出一種基于多示例學(xué)習(xí)的視頻人臉識別算法,該算法將每個人臉視頻視為一個包,將視頻中正規(guī)化后的人臉幀圖像作為包中的示例,采用基于加權(quán)的分塊局部二值模式級聯(lián)直方圖作為示例特征,在訓(xùn)練集合的多示例特征空間中,采用多示例學(xué)習(xí)算法得到分類器,進而實現(xiàn)對測試樣本的分類及預(yù)測。通過在人臉視頻庫中的相關(guān)實驗,該算法得到了比較高的識別精度,同時,該方法對光照變化、表情變化等具有良好的魯棒性,驗證了算法的有效性。
【IPC分類】G06K9-00
【公開號】CN104778457
【申請?zhí)枴緾N201510183977
【發(fā)明人】陳海鵬, 申鉉京, 王玉, 呂穎達, 王子瑜, 徐浩然
【申請人】吉林大學(xué)
【公開日】2015年7月15日
【申請日】2015年4月18日