本發(fā)明涉及人臉檢測(cè)技術(shù)領(lǐng)域,尤其涉及一種基于人臉對(duì)齊的人臉檢測(cè)方法及系統(tǒng)。
背景技術(shù):
在圖片拍攝或視頻拍攝中,由于需要對(duì)被攝客體進(jìn)行識(shí)別、美化等等臉部處理,因此需要在圖片或視頻中對(duì)被攝客體的人臉位置進(jìn)行定位,即人臉檢測(cè)。
在實(shí)際環(huán)境中,被攝客體經(jīng)常處于與他人合照的情況中,因此會(huì)出現(xiàn)被攝客體人臉較小、光照環(huán)境較弱、人臉角度較大、人臉表情夸張等等復(fù)雜問(wèn)題,由于視頻及圖像在移動(dòng)端應(yīng)用時(shí)需要在有限計(jì)算資源下實(shí)時(shí)處理,因此容易導(dǎo)致人臉檢測(cè)問(wèn)題情況復(fù)雜、效果及時(shí)間難以平衡等等問(wèn)題。
現(xiàn)有的傳統(tǒng)人臉檢測(cè)技術(shù)中,對(duì)于人臉檢測(cè)的方法通常為:首先對(duì)輸入圖像提取HOG、顏色等特征后,在多尺度特征圖上進(jìn)行掃窗,并將掃描窗口輸入Adaboost或SVM等分類(lèi)器進(jìn)行是人臉或不是人臉的區(qū)分。此人臉檢測(cè)為了適應(yīng)不同人臉角度,需要訓(xùn)練多個(gè)分類(lèi)器,同時(shí)每個(gè)窗口都需要分別輸入至多個(gè)分類(lèi)器中進(jìn)行分類(lèi),導(dǎo)致需要耗費(fèi)大量的時(shí)間,速度較慢,很難在移動(dòng)端實(shí)時(shí)處理。又由于在多尺度掃窗速度較慢,因此若使用多尺度掃窗方法獲取窗口,當(dāng)掃描速度快則效果不好,無(wú)法適用于多個(gè)分類(lèi)器;當(dāng)掃描效果好則速度較慢,很難在移動(dòng)端實(shí)時(shí)處理。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的一個(gè)目的是提供一種人臉檢測(cè)方法及系統(tǒng),對(duì)人臉圖像進(jìn)行預(yù)處理得到人臉熱度圖,然后通過(guò)人臉對(duì)齊模型對(duì)人臉熱度圖進(jìn)行處理進(jìn)行人臉識(shí)別,可以在資源有限的情況下,快速地對(duì)于人臉進(jìn)行比較準(zhǔn)確的識(shí)別。
為了實(shí)現(xiàn)上述目的,本發(fā)明采取了如下技術(shù)方案:
根據(jù)本發(fā)明的一個(gè)方面,提供了一種人臉檢測(cè)方法,包括:利用人臉可能區(qū)域檢測(cè)器獲取待檢測(cè)圖像中的人臉可能區(qū)域;利用人臉對(duì)齊模型從人臉可能區(qū)域中識(shí)別出人臉區(qū)域。
根據(jù)本發(fā)明的一個(gè)方面,人臉檢測(cè)方法還包括:在利用人臉對(duì)齊模型識(shí)別出人臉區(qū)域的同時(shí),利用人臉對(duì)齊模型獲取人臉區(qū)域中的人臉五官和外輪廓的位置信息。
根據(jù)本發(fā)明的一個(gè)方面,人臉檢測(cè)方法還包括:利用人臉區(qū)域回歸模型獲取人臉區(qū)域的位置信息。
根據(jù)本發(fā)明的一個(gè)方面,人臉區(qū)域檢測(cè)器是全卷積神經(jīng)網(wǎng)絡(luò)。
根據(jù)本發(fā)明的一個(gè)方面,利用全卷積神經(jīng)網(wǎng)絡(luò)獲取人臉可能區(qū)域的熱度圖。
根據(jù)本發(fā)明的一個(gè)方面,全卷積神經(jīng)網(wǎng)絡(luò)包括多個(gè)處理組件組合以及設(shè)置在多個(gè)處理組件組合后端的兩個(gè)卷積層,其中每個(gè)處理組件組合包括卷積層、激活層和池化層。
根據(jù)本發(fā)明的一個(gè)方面,人臉對(duì)齊模型是包括多個(gè)處理組件組合以及設(shè)置在多個(gè)處理組件組合后端的卷積層和全連接層的神經(jīng)網(wǎng)絡(luò),其中每個(gè)處理組件組合包括卷積層、激活層和池化層。
根據(jù)本發(fā)明的一個(gè)方面,人臉區(qū)域回歸模型是包括多個(gè)處理組件組合以及設(shè)置在多個(gè)處理組件組合后端的卷積層和全連接層的神經(jīng)網(wǎng)絡(luò),其中每個(gè)處理組件組合包括卷積層、激活層和池化層。
根據(jù)本發(fā)明的一個(gè)方面,激活層的激活函數(shù)為ReLU函數(shù),池化層的池化函數(shù)為Pooling函數(shù)。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種人臉檢測(cè)系統(tǒng),包括:對(duì)象拾取單元,用于利用人臉可能區(qū)域檢測(cè)器獲取待檢測(cè)圖像中的人臉可能區(qū)域;圖像處理單元,用于利用人臉對(duì)齊模型從人臉可能區(qū)域中識(shí)別出人臉區(qū)域。
根據(jù)本發(fā)明的另一個(gè)方面,在利用人臉對(duì)齊模型識(shí)別出人臉區(qū)域的同時(shí),圖像處理單元還能夠利用人臉對(duì)齊模型獲取人臉區(qū)域中的人臉五官和外輪廓的位置信息。
根據(jù)本發(fā)明的另一個(gè)方面,人臉檢測(cè)系統(tǒng)還包括回歸模型單元,回歸模型單元用于利用人臉區(qū)域回歸模型獲取人臉區(qū)域的位置信息。
根據(jù)本發(fā)明的另一個(gè)方面,人臉區(qū)域檢測(cè)器是全卷積神經(jīng)網(wǎng)絡(luò)。
根據(jù)本發(fā)明的另一個(gè)方面,對(duì)象拾取單元能夠利用全卷積神經(jīng)網(wǎng)絡(luò)獲取人臉可能區(qū)域的熱度圖。
根據(jù)本發(fā)明的另一個(gè)方面,全卷積神經(jīng)網(wǎng)絡(luò)包括多個(gè)處理組件組合以及設(shè)置在多個(gè)處理組件組合后端的兩個(gè)卷積層,其中每個(gè)處理組件組合包括卷積層、激活層和池化層。
根據(jù)本發(fā)明的另一個(gè)方面,人臉對(duì)齊模型是包括多個(gè)處理組件組合以及設(shè)置在多個(gè)處理組件組合后端的卷積層和全連接層的神經(jīng)網(wǎng)絡(luò),其中每個(gè)處理組件組合包括卷積層、激活層和池化層。
根據(jù)本發(fā)明的另一個(gè)方面,人臉區(qū)域回歸模型是包括多個(gè)處理組件組合以及設(shè)置在多個(gè)處理組件組合后端的卷積層和全連接層的神經(jīng)網(wǎng)絡(luò),其中每個(gè)處理組件組合包括卷積層、激活層和池化層。
根據(jù)本發(fā)明的另一個(gè)方面,激活層的激活函數(shù)為ReLU函數(shù),所述池化層的池化函數(shù)為Pooling函數(shù)。
采用根據(jù)本發(fā)明實(shí)施例的人臉檢測(cè)方法及系統(tǒng),直接省去了傳統(tǒng)方法中掃窗和多尺度提取特征的步驟,而是利用人臉可能區(qū)域檢測(cè)器通過(guò)一次檢測(cè)直接獲取待檢測(cè)圖像中的人臉可能區(qū)域,因此,可以快速地獲得人臉可能區(qū)域,無(wú)需通過(guò)大量的掃描和計(jì)算,提高了圖像處理的速度,保證了移動(dòng)終端處理圖片的實(shí)時(shí)性。另外,本發(fā)明實(shí)施例將各個(gè)人臉可能區(qū)域輸入至人臉對(duì)齊模型進(jìn)行分析,并且判斷該人臉可能區(qū)域是否為人臉區(qū)域,同時(shí)輸出人臉五官特征點(diǎn)位置,這樣相當(dāng)于兩個(gè)模型做到一個(gè)里面才能說(shuō)比傳統(tǒng)的多個(gè)分類(lèi)器更快,相比于現(xiàn)有技術(shù)中通過(guò)多個(gè)分類(lèi)器進(jìn)行區(qū)分的方法,具有速度更快、精度更高的優(yōu)點(diǎn)。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)本發(fā)明實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面所描述的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1示出了根據(jù)本發(fā)明一實(shí)施例的人臉檢測(cè)方法流程圖;
圖2示出了根據(jù)本發(fā)明一實(shí)施例的人臉檢測(cè)系統(tǒng)的示意性框圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
下面將詳細(xì)描述本發(fā)明的各個(gè)方面的特征和示例性實(shí)施例。在下面的詳細(xì)描述中,提出了許多具體細(xì)節(jié),以便提供對(duì)本發(fā)明的全面理解。但是,對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō)很明顯的是,本發(fā)明可以在不需要這些具體細(xì)節(jié)中的一些細(xì)節(jié)的情況下實(shí)施。下面對(duì)實(shí)施例的描述僅僅是為了通過(guò)示出本發(fā)明的示例來(lái)提供對(duì)本發(fā)明的更好的理解。本發(fā)明決不限于下面所提出的任何具體配置和算法,而是在不脫離本發(fā)明的精神的前提下覆蓋了部件和算法的任何修改、替換和改進(jìn)。在附圖和下面的描述中,沒(méi)有示出公知的結(jié)構(gòu)和技術(shù),以便避免對(duì)本發(fā)明造成不必要的模糊。
現(xiàn)在將參考附圖更全面地描述示例實(shí)施方式。然而,示例實(shí)施方式能夠以多種形式實(shí)施,且不應(yīng)被理解為限于在此闡述的實(shí)施方式;相反,提供這些實(shí)施方式使得本發(fā)明更全面和完整,并將示例實(shí)施方式的構(gòu)思全面地傳達(dá)給本領(lǐng)域的技術(shù)人員。在圖中,為了清晰,可能夸大了區(qū)域和層的厚度。在圖中相同的附圖標(biāo)記表示相同或類(lèi)似的結(jié)構(gòu),因而將省略它們的詳細(xì)描述。
需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來(lái)詳細(xì)說(shuō)明本申請(qǐng)。
圖1示出了根據(jù)本發(fā)明一實(shí)施例的人臉檢測(cè)方法流程圖。圖1所示的人臉檢測(cè)方法包括:
S1、利用人臉可能區(qū)域檢測(cè)器獲取待檢測(cè)圖像中的人臉可能區(qū)域;
S2、利用人臉對(duì)齊模型從人臉可能區(qū)域中識(shí)別出人臉區(qū)域。
根據(jù)本發(fā)明的實(shí)施例,步驟S1中所述的人臉可能區(qū)域檢測(cè)器為全卷積神經(jīng)網(wǎng)絡(luò)。具體地步驟為:采用全卷積神經(jīng)網(wǎng)絡(luò)替換傳統(tǒng)深度學(xué)習(xí)模型,對(duì)待檢測(cè)圖像進(jìn)行處理,獲得帶有人臉可能區(qū)域的熱度圖。
根據(jù)本發(fā)明的實(shí)施例,步驟S1中,對(duì)待檢測(cè)圖像處理獲得帶有人臉可能區(qū)域的熱度圖的方法包括:將原始的未經(jīng)過(guò)處理的彩色的待檢測(cè)圖像輸入至訓(xùn)練好的全卷積神經(jīng)網(wǎng)絡(luò)中并且得到其對(duì)應(yīng)的熱度圖。
其中,傳統(tǒng)深度學(xué)習(xí)模型包括多個(gè)處理組件組合以及設(shè)置在多個(gè)處理組件組合后端的卷積層和全連接層,其中每個(gè)處理組件組合包括卷積層、激活層和池化層。而全卷積神經(jīng)網(wǎng)絡(luò)包括多個(gè)處理組件組合以及設(shè)置在多個(gè)處理組件組合后端的兩個(gè)卷積層,其中每個(gè)處理組件組合包括卷積層、激活層和池化層,即全卷積神經(jīng)網(wǎng)絡(luò)是將傳統(tǒng)深度學(xué)習(xí)模型的全連接層替換為了卷積層,從而可以卷積輸出熱度圖。上述的激活層的激活函數(shù)為ReLU函數(shù),池化層的池化函數(shù)為Pooling函數(shù),即全卷積神經(jīng)網(wǎng)絡(luò)可以表示為:卷積->ReLU->Pooling->卷積->ReLU->Pooling->…->卷積->ReLU->卷積,另外,傳統(tǒng)深度學(xué)習(xí)模型也可以相應(yīng)地采用上述函數(shù)進(jìn)行替換表示。
其中的人臉可能區(qū)域檢測(cè)器還可以基于Adaboost學(xué)習(xí)算法、Boosting Tree學(xué)習(xí)算法、SVM等。這里的Adaboost學(xué)習(xí)算法,可以把一些比較弱的分類(lèi)器在一起,組合出新的很強(qiáng)的分類(lèi)器可以較準(zhǔn)確的獲得人臉可能區(qū)域的圖像數(shù)據(jù);Boosting Tree學(xué)習(xí)算法是一種改進(jìn)型AdaBoost方法,在數(shù)據(jù)過(guò)濾、分類(lèi)方面都有很好的性能;SVM(支持向量機(jī)學(xué)習(xí)算法,英文:support vector machine)同樣可以對(duì)圖像數(shù)據(jù)進(jìn)行分類(lèi)識(shí)別,識(shí)別出人臉可能的圖像數(shù)據(jù)。
在一個(gè)示例中,通過(guò)全卷積神經(jīng)網(wǎng)絡(luò)輸出的熱度圖中越紅的區(qū)域代表越有可能是人臉。
根據(jù)本發(fā)明的實(shí)施例,當(dāng)獲得熱度圖后,可在熱度上選擇至少一塊疑似區(qū)域,其具體方法為:將熱度圖中的每一個(gè)紅色區(qū)域分別包圍成一個(gè)正方形,該正方形即為疑似區(qū)域。例如,取熱度圖某一紅色疑似區(qū)域的方法為:取這個(gè)紅色區(qū)域的最上、最下、最左、最右四個(gè)坐標(biāo)值;通過(guò)這四個(gè)坐標(biāo)值計(jì)算出該紅色區(qū)域的最長(zhǎng)邊,并且以該最長(zhǎng)邊作為可以包圍該區(qū)域的正方形的邊長(zhǎng);取最上和最下坐標(biāo)的中點(diǎn)作為正方形中心點(diǎn)的Y坐標(biāo),取最左和最右坐標(biāo)的中點(diǎn)作為正方形中心點(diǎn)的X坐標(biāo),可以獲得該正方形的中心點(diǎn);利用計(jì)算出的中心點(diǎn)坐標(biāo)、正方形邊長(zhǎng)即可獲得該正方形,即疑似區(qū)域的坐標(biāo)值和邊長(zhǎng)等信息。
根據(jù)本發(fā)明的實(shí)施例,根據(jù)計(jì)算獲得的疑似區(qū)域的坐標(biāo)值、邊長(zhǎng)等信息帶入到待檢測(cè)圖像中,可以拾取待檢測(cè)圖像中對(duì)應(yīng)的人臉可能區(qū)域,拾取的方法為將待檢測(cè)圖像上的人臉可能區(qū)域內(nèi)的全部像素點(diǎn)的值復(fù)制下來(lái),并形成一張新的人臉可能區(qū)域圖。
根據(jù)本發(fā)明的實(shí)施例,步驟S2中,通過(guò)人臉對(duì)齊模型判斷人臉可能區(qū)域是否為人臉區(qū)域,具體的為,將該人臉可能區(qū)域圖輸入至基于傳統(tǒng)深度學(xué)習(xí)模型的人臉對(duì)齊模型中,并且獲得一個(gè)該人臉可能區(qū)域是否為人臉區(qū)域的輸出,當(dāng)確認(rèn)該人臉可能區(qū)域?yàn)槿四槄^(qū)域時(shí),保留該人臉可能區(qū)域并進(jìn)行后續(xù)操作;當(dāng)判斷該人臉可能區(qū)域不是人臉區(qū)域時(shí),則舍棄該人臉可能區(qū)域。其中,人臉對(duì)齊模型的輸入為人臉可能區(qū)域圖。例如,熱度圖中一個(gè)人臉可能區(qū)域?qū)?yīng)的待檢測(cè)圖像中的區(qū)域?yàn)橐路?,此時(shí)人臉對(duì)齊模型就會(huì)輸出該人臉可能區(qū)域不是人臉區(qū)域的結(jié)果,那么,這個(gè)人臉可能區(qū)域就會(huì)被舍去,并且不再進(jìn)行后續(xù)的操作。其中,該人臉對(duì)齊模型是包括多個(gè)處理組件組合以及設(shè)置在多個(gè)處理組件組合后端的卷積層和全連接層的神經(jīng)網(wǎng)絡(luò),其中每個(gè)處理組件組合包括卷積層、激活層和池化層,并且可以表示為:卷積->ReLU->Pooling->卷積->ReLU->Pooling->…->卷積->全連接。
另外,在利用人臉對(duì)齊模型識(shí)別出人臉區(qū)域的同時(shí),利用人臉對(duì)齊模型獲取人臉區(qū)域中的人臉五官和外輪廓的位置信息。在一個(gè)實(shí)施例中,可以通過(guò)人臉對(duì)齊模型同時(shí)判斷各個(gè)人臉可能區(qū)域是否為人臉區(qū)域并且計(jì)算出各個(gè)人臉可能區(qū)域?qū)?yīng)的人臉五官和人臉外輪廓的具體坐標(biāo),此時(shí),人臉對(duì)齊模型可以同時(shí)輸出某一人臉可能區(qū)域是否為人臉區(qū)域以及其對(duì)應(yīng)的人臉五官和人臉外輪廓的具體坐標(biāo),當(dāng)該人臉可能區(qū)域被判斷為人臉區(qū)域時(shí),其對(duì)應(yīng)的人臉五官和人臉外輪廓的具體坐標(biāo)被保留,并可以進(jìn)行后續(xù)的其他操作;當(dāng)該人臉可能區(qū)域被判斷為不是人臉區(qū)域時(shí),其對(duì)應(yīng)的人臉五官和人臉外輪廓的具體坐標(biāo)被舍去。該具體坐標(biāo)可以應(yīng)用于后期的人臉美顏等功能。在另一個(gè)實(shí)施例中,還可以先通過(guò)人臉對(duì)齊模型同時(shí)判斷各個(gè)人臉可能區(qū)域是否為人臉區(qū)域,然后針對(duì)各個(gè)人臉區(qū)域計(jì)算對(duì)應(yīng)的人臉五官和人臉外輪廓的具體坐標(biāo)。
由于通過(guò)五官和外輪廓定位出一個(gè)人臉區(qū)域時(shí),外輪廓點(diǎn)不包括額頭,因此,此時(shí)定位出的人臉區(qū)域不包含額頭,致使人臉區(qū)域可能出現(xiàn)缺失。另外,如果人臉為側(cè)臉、遮擋或者張大嘴夸張表情等的情況,通過(guò)外輪廓點(diǎn)或者五官點(diǎn)的定位會(huì)造成不夠準(zhǔn)的情況。為了得到更精確穩(wěn)定的人臉位置,人臉檢測(cè)方法還包括利用訓(xùn)練好的人臉區(qū)域回歸模型獲取人臉區(qū)域的位置信息,其主要目的是獲得更為精準(zhǔn)的人臉區(qū)域框的位置,防止出現(xiàn)人臉區(qū)域的缺失和定位的不準(zhǔn)確的問(wèn)題。具體地方法包括:將被確認(rèn)為人臉區(qū)域的人臉可能區(qū)域圖輸入至人臉區(qū)域回歸模型中,獲得該人臉區(qū)域的具體定位。例如,具體定位包括但不限于該人臉區(qū)域的左上角、右下角的X坐標(biāo)和Y坐標(biāo)。其中,人臉區(qū)域回歸模型是包括多個(gè)處理組件組合以及設(shè)置在多個(gè)處理組件組合后端的卷積層和全連接層的神經(jīng)網(wǎng)絡(luò),其中每個(gè)處理組件組合包括卷積層、激活層和池化層,并且可以表示為:卷積->ReLU->Pooling->卷積->ReLU->Pooling->…->卷積->全連接。
圖2示出了根據(jù)本發(fā)明一實(shí)施例的人臉檢測(cè)系統(tǒng)100的示意性框圖。根據(jù)圖2所示實(shí)施例的人臉檢測(cè)系統(tǒng)100,對(duì)象拾取單元110和圖像處理單元120。其中,對(duì)象拾取單元110用于利用人臉可能區(qū)域檢測(cè)器獲取待檢測(cè)圖像中的人臉可能區(qū)域,圖像處理單元120用于利用人臉對(duì)齊模型從人臉可能區(qū)域中識(shí)別出人臉區(qū)域。
具體地,對(duì)象拾取單元110包括:全卷積處理單元111、區(qū)域選擇單元112和區(qū)域拾取單元113,其中,全卷積處理單元111用于將待檢測(cè)圖像對(duì)輸入至全卷積神經(jīng)網(wǎng)絡(luò)中并處理得到熱度圖,區(qū)域選擇單元112用于在通過(guò)全卷積處理單元111獲得的熱度圖中選擇至少一個(gè)疑似區(qū)域,區(qū)域拾取單元113用于在待檢測(cè)圖像上對(duì)應(yīng)于疑似區(qū)域的位置拾取至少一個(gè)人臉可能區(qū)域。
根據(jù)本發(fā)明的實(shí)施例,經(jīng)過(guò)訓(xùn)練后的全卷積神經(jīng)網(wǎng)絡(luò)存儲(chǔ)于全卷積處理單元111中。其中,全卷積神經(jīng)網(wǎng)絡(luò)包括多個(gè)處理組件組合以及設(shè)置在多個(gè)處理組件組合后端的兩個(gè)卷積層,其中每個(gè)處理組件組合包括卷積層、激活層和池化層。上述的激活層的激活函數(shù)為ReLU函數(shù),池化層的池化函數(shù)為Pooling函數(shù),即全卷積神經(jīng)網(wǎng)絡(luò)可以表示為:卷積->ReLU->Pooling->卷積->ReLU->Pooling->…->卷積->ReLU->卷積。
根據(jù)本發(fā)明的實(shí)施例,區(qū)域選擇單元112用于在通過(guò)熱度圖中選擇至少一個(gè)疑似人臉的疑似區(qū)域。在一個(gè)實(shí)施例中,具體的疑似區(qū)域的選擇方法為:取任一個(gè)紅色區(qū)域的最上、最下、最左、最右四個(gè)坐標(biāo)值;通過(guò)這四個(gè)坐標(biāo)值計(jì)算出該紅色區(qū)域的最長(zhǎng)邊,并且以該最長(zhǎng)邊作為可以包圍該區(qū)域的正方形的邊長(zhǎng);取最上和最下坐標(biāo)的中點(diǎn)作為正方形中心點(diǎn)的Y坐標(biāo),取最左和最右坐標(biāo)的中點(diǎn)作為正方形中心點(diǎn)的X坐標(biāo),可以獲得該正方形的中心點(diǎn);利用計(jì)算出的中心點(diǎn)坐標(biāo)、正方形邊長(zhǎng)即可獲得該正方形,即疑似區(qū)域的坐標(biāo)值和邊長(zhǎng)等信息。
根據(jù)本發(fā)明的實(shí)施例,區(qū)域拾取單元113拾取人臉可能區(qū)域的方法為將待檢測(cè)圖像上的與熱度圖的疑似區(qū)域?qū)?yīng)的人臉可能區(qū)域內(nèi)的全部像素點(diǎn)的值復(fù)制下來(lái),并形成一張新的人臉可能區(qū)域圖。
根據(jù)本發(fā)明的實(shí)施例,圖像處理單元120內(nèi)預(yù)先存儲(chǔ)有人臉對(duì)齊模型,其中,該人臉對(duì)齊模型是包括多個(gè)處理組件組合以及設(shè)置在多個(gè)處理組件組合后端的卷積層和全連接層的神經(jīng)網(wǎng)絡(luò),其中每個(gè)處理組件組合包括卷積層、激活層和池化層,并且可以表示為:卷積->ReLU->Pooling->卷積->ReLU->Pooling->…->卷積->全連接。將任一個(gè)人臉可能區(qū)域圖輸入至基于傳統(tǒng)深度學(xué)習(xí)模型的人臉對(duì)齊模型中,并且獲得一個(gè)該人臉可能區(qū)域是否為人臉區(qū)域的輸出,當(dāng)確認(rèn)該人臉可能區(qū)域?yàn)槿四槄^(qū)域時(shí),保留該人臉可能區(qū)域并進(jìn)行后續(xù)操作;當(dāng)判斷該人臉可能區(qū)域不是人臉區(qū)域時(shí),則舍棄該人臉可能區(qū)域。
根據(jù)本發(fā)明的實(shí)施例,在確認(rèn)某一人臉可能區(qū)域?yàn)槿四槄^(qū)域時(shí),圖像處理單元120還能對(duì)該人臉可能區(qū)域進(jìn)行計(jì)算,并且根據(jù)人臉對(duì)齊模型計(jì)算出被被判斷為人臉區(qū)域的人臉五官和外輪廓的具體坐標(biāo),該具體坐標(biāo)可以應(yīng)用于后期的人臉美顏等功能。
根據(jù)本發(fā)明的實(shí)施例,人臉檢測(cè)系統(tǒng)100還包括回歸模型單元130,其中,回歸模型單元130用于將被確認(rèn)為人臉區(qū)域的人臉可能區(qū)域圖輸入至訓(xùn)練好的人臉區(qū)域回歸模型中并獲得該人臉可能區(qū)域的具體定位的回歸模型處理單元。例如,具體定位包括但不限于該疑似人臉區(qū)域的左上角、右下角的X坐標(biāo)和Y坐標(biāo)。該人臉區(qū)域回歸模型是包括多個(gè)處理組件組合以及設(shè)置在多個(gè)處理組件組合后端的卷積層和全連接層的神經(jīng)網(wǎng)絡(luò),其中每個(gè)處理組件組合包括卷積層、激活層和池化層,并且可以表示為:卷積->ReLU->Pooling->卷積->ReLU->Pooling->…->卷積->全連接。
綜上所述,根據(jù)本發(fā)明的實(shí)施例,通過(guò)采用基于全卷積神經(jīng)網(wǎng)絡(luò)的處理方法,從而將待檢測(cè)圖像轉(zhuǎn)化為熱度圖,并根據(jù)熱度圖提取疑似區(qū)域,從而獲得對(duì)應(yīng)的待檢測(cè)圖像上的人臉可能區(qū)域,直接省去了傳統(tǒng)方法中掃窗和多尺度提特征的步驟,其魯棒性強(qiáng),并且可以快速地獲得人臉可能區(qū)域,無(wú)需通過(guò)大量的掃描和計(jì)算,提高了圖像處理的速度,保證了移動(dòng)終端處理圖片的實(shí)時(shí)性。根據(jù)本發(fā)明的實(shí)施例,通過(guò)采用人臉對(duì)齊模型進(jìn)行對(duì)人臉可能區(qū)域的判斷替代傳統(tǒng)的分類(lèi)器,使復(fù)雜環(huán)境下的人臉不再需要通過(guò)多個(gè)分類(lèi)器來(lái)區(qū)分,其速度更快精度更高,并且還可以同時(shí)得到人臉各器官及外輪廓的精確位置。根據(jù)本發(fā)明的實(shí)施例,通過(guò)人臉區(qū)域回歸模型,可以得到精度更高的人臉區(qū)域位置。因此,根據(jù)本發(fā)明的實(shí)施例,具有精度高、速度快、魯棒性強(qiáng)的特點(diǎn),能夠在移動(dòng)端等計(jì)算資源有限的環(huán)境下得到很好表現(xiàn)。
本領(lǐng)域普通技術(shù)人員可以意識(shí)到,結(jié)合本文中所公開(kāi)的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、計(jì)算機(jī)軟件或者二者的結(jié)合來(lái)實(shí)現(xiàn),為了清楚地說(shuō)明硬件和軟件的可互換性,在上述說(shuō)明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來(lái)執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來(lái)使用不同方法來(lái)實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為了描述的方便和簡(jiǎn)潔,上述描述的系統(tǒng)和單元的具體工作過(guò)程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過(guò)程,在此不再贅述。
在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng)和方法,可以通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。
另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以是兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到各種等效的修改或替換,這些修改或替換都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以權(quán)利要求的保護(hù)范圍為準(zhǔn)。