一種基于隨機(jī)池化卷積神經(jīng)網(wǎng)絡(luò)的人臉識別方法
【專利摘要】本發(fā)明公開了一種基于隨機(jī)池化卷積神經(jīng)網(wǎng)絡(luò)的人臉識別方法。該方法利用隨機(jī)池化的卷積神經(jīng)網(wǎng)絡(luò)來快速提取人臉圖像的特征并級聯(lián)以實現(xiàn)人臉識別。在構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)的過程中采用了新的池化值的選取策略和步驟,然后利用softmax分類器進(jìn)行有監(jiān)督的訓(xùn)練。本發(fā)明在采樣過程中使用的概率分布是基于能量的,能夠?qū)矸e神經(jīng)網(wǎng)絡(luò)提取特征的計算速度的提高和卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果的泛化應(yīng)用具有優(yōu)化作用。基于隨機(jī)池化的卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練簡單,準(zhǔn)確率高,將會促進(jìn)隨機(jī)池化在人臉識別特征提取過程中的廣泛應(yīng)用。
【專利說明】一種基于隨機(jī)池化卷積神經(jīng)網(wǎng)絡(luò)的人臉識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于機(jī)器學(xué)習(xí)、人臉識別領(lǐng)域,涉及一種基于隨機(jī)池化卷積神經(jīng)網(wǎng)絡(luò)的人 臉識別方法。
【背景技術(shù)】
[0002] 人臉識別作為一個生物特征識別技術(shù)已經(jīng)成為圖像處理與模式識別領(lǐng)域的研究 熱點,在公共安全、人機(jī)交互和身份認(rèn)證等領(lǐng)域得到廣泛研究。目前,國內(nèi)外對人臉識別的 特征提取研究主要集中在手動提取相應(yīng)特征和構(gòu)建神經(jīng)網(wǎng)絡(luò)自動提取特征兩大方向。傳統(tǒng) 的卷積神經(jīng)網(wǎng)絡(luò)參數(shù)多,一個主要問題是計算復(fù)雜度和時間開銷,需要計算的特征矩陣維 度較大,不利于分類器的訓(xùn)練。因此在卷積特征提取的過程中,卷積運(yùn)算的下一步池化過程 被用作減少特征算法計算量和存儲量的一個主要解決辦法。現(xiàn)有的池化技術(shù)主要使用求均 值或者最大值函數(shù)作為池化方法,其中均值函數(shù)池化方法會降低具有較大卷積值的影響作 用,而最大值函數(shù)池化方法會使得某些卷積值過于代表了整個池化方塊卷積向量造成訓(xùn)練 集過擬合的問題,不利于整個卷積神經(jīng)網(wǎng)絡(luò)對人臉識別問題的泛化。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明目的在于針對現(xiàn)有技術(shù)的不足,提供一種基于隨機(jī)池化卷積神經(jīng)網(wǎng)絡(luò)的人 臉識別方法,該方法在構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)過程中將隨機(jī)化和確定函數(shù)的池化方法相結(jié)合, 根據(jù)池化區(qū)域內(nèi)各個元素基于能量分布的概率進(jìn)行隨機(jī)采樣,從而快速地將提取的人臉特 征圖從較大維度矩陣降低至較小維度的矩陣,輸入SOftmax分類器訓(xùn)練后輸出類別信息以 實現(xiàn)人臉識別。
[0004] 本發(fā)明的目的是通過以下技術(shù)方案來實現(xiàn)的:一種基于隨機(jī)池化卷積神經(jīng)網(wǎng)絡(luò)的 人臉識別方法,該方法包括以下步驟:
[0005] (1)采集f?個人的標(biāo)準(zhǔn)人臉灰度圖,其中每個人采集10張,得到IOf張標(biāo)準(zhǔn)人臉灰 度圖作為訓(xùn)練圖像;每張訓(xùn)練圖像對應(yīng)一個I X f維的二值人臉類別標(biāo)記向量ylabel = [ylabeI (I),ylabel (2),? ? ?,ylabel (f)],其中第n個人臉圖像的類別標(biāo)記向量ylabel應(yīng)滿足以下條件:
[0006]
【權(quán)利要求】
1. 一種基于隨機(jī)池化卷積神經(jīng)網(wǎng)絡(luò)的人臉識別方法,其特征在于,該方法包括以下步 驟: (1) 采集f?個人的標(biāo)準(zhǔn)人臉灰度圖,其中每個人采集10張,得到l〇f張標(biāo)準(zhǔn)人臉灰度圖 作為訓(xùn)練圖像;每張訓(xùn)練圖像對應(yīng)一個lXf維的二值人臉類別標(biāo)記向量ylabel = [ylabel(l) ,ylabel (2),. . .,ylabel (f)],其中第n個人臉圖像的類別標(biāo)記向量ylabel應(yīng)滿足以下條件:
(2) 將訓(xùn)練圖像裁剪為rXc像素大小,對裁剪得到的圖像做預(yù)處理,分別計算圖像中 所有像素值Xi的均值xavOTage;和標(biāo)準(zhǔn)差〇 :
對每個像素值進(jìn)行歸一化,得到圖像定義為Xla$,具體如下:
(3) 按照0為均值,1為方差的高斯分布隨機(jī)初始化k個aXb大?。ㄆ渲?, l〈a〈r,l〈b〈c)的小塊作為卷積核模板,定義為X_ ; (4) 用步驟(3)得到的k個卷積核模板X_分別與Xlaw進(jìn)行卷積運(yùn)算,并用濾波器進(jìn) 行濾波得到k個卷積特征圖Xf,每個卷積特征圖Xf具體計算公式為:
其中《)代表卷積運(yùn)算,max(x,y)代表濾波器函數(shù),它可取x和y兩個值的較大值作為 輸出;Xf的矩陣大小均為(r-a+1)X(c-b+1); (5) 將卷積特征圖Xf劃分為若干大小為mXn的池化區(qū)域,其中m取(r-a+1)大于1的 因子,n?。╟-b+1)大于1的因子;在每個池化區(qū)域&中,計算每個矩陣元素值&基于能 量分布的概率值:
;對每個池化區(qū)域&按照概率值 Pi進(jìn)行隨機(jī)采樣得到采 樣值tq,其中q滿足Pfp. . ?,的分布;令該池化區(qū)域的值& =sq代表整個池化區(qū)域 Rj,并對該卷積特征圖Xf內(nèi)所有mXn大小的池化區(qū)域&進(jìn)行重復(fù)操作,即可得到基于能量 分布的隨機(jī)池化結(jié)果特征矩陣Xsmall。本步驟將卷積特征圖&從(r-a+1)X(c-b+1)維度的 特征矩陣降低至
維度的特征矩陣Xsmall ; (6) 對步驟⑷得到的k個卷積特征圖Xf分別進(jìn)行步驟(5)的操作,得到k個 特征矩陣Xsmall ;將計算得到的k個特征矩陣Xsmall按照行的順序依次級聯(lián),得到 維的級聯(lián)特征向量X
cascade ? (7) 對于步驟(1)采集的10f張人臉訓(xùn)練圖重復(fù)步驟(2)-步驟(6),分別得到各自的 級聯(lián)特征向量Xeaseade,輸入至f?維的softmax分類器,根據(jù)步驟(1)得到的lXf?維的人臉 類別標(biāo)記向量ylabel對softmax分類器進(jìn)行有監(jiān)督的反向傳播算法訓(xùn)練,得到分類器映射關(guān) 系Y〇utput-g(Xc:asc:ade),其中Youtput為類別輸出矩陣; (8) 采集步驟(1)中f?個人中任一個人的人臉圖像作為測試人臉圖像,重復(fù)步驟 (2)-步驟(6)計算得到其級聯(lián)特征向量乂_仏^_。^,利用步驟(7)訓(xùn)練得到的分類器映射 關(guān)系g計算相應(yīng)的類別輸出矩陣Yjesi^put=g(X_testrasc;ade;);類別輸出矩陣Yjesi^put 是一個lXf?維的向量,其最大元素值所在的標(biāo)號即為該測試人臉圖像的類別序號,從而實 現(xiàn)人臉識別。
【文檔編號】G06K9/00GK104408435SQ201410735010
【公開日】2015年3月11日 申請日期:2014年12月5日 優(yōu)先權(quán)日:2014年12月5日
【發(fā)明者】劉云海, 王璟堯 申請人:浙江大學(xué)