一種基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē)款識(shí)別方法及裝置的制造方法
【專利摘要】本發(fā)明提供了一種基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē)款識(shí)別方法,該方法包括:選取標(biāo)簽車(chē)款的車(chē)臉灰度圖像為樣本,采用卷積神經(jīng)網(wǎng)絡(luò)對(duì)樣本進(jìn)行反復(fù)訓(xùn)練,獲取訓(xùn)練好的車(chē)款識(shí)別模型;采集場(chǎng)景的視頻圖像;從場(chǎng)景的視頻圖像中獲取車(chē)臉區(qū)域;利用訓(xùn)練好的車(chē)款識(shí)別模型對(duì)車(chē)臉區(qū)域進(jìn)行識(shí)別,輸出車(chē)款識(shí)別結(jié)果。與現(xiàn)有技術(shù)相比,本發(fā)明的車(chē)款識(shí)別方法的識(shí)別準(zhǔn)確率較高。
【專利說(shuō)明】
-種基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē)款識(shí)別方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及圖像處理、視頻監(jiān)控W及安防,特別設(shè)及車(chē)款識(shí)別方法及裝置。
【背景技術(shù)】
[0002] 隨著經(jīng)濟(jì)技術(shù)的發(fā)展,機(jī)動(dòng)車(chē)輛的與日俱增,傳統(tǒng)的人工管理方式越來(lái)越無(wú)法滿 足實(shí)際的需要。與此同時(shí),隨著科技的發(fā)展,智能交通管理系統(tǒng)正日益成熟,漸漸取代傳統(tǒng) 的人工管理方式。車(chē)款識(shí)別技術(shù)是實(shí)現(xiàn)智能交通管理的一個(gè)分支,能夠用于電子警察監(jiān)控, 對(duì)肇事、嫌疑、被盜車(chē)輛進(jìn)行智能識(shí)別,因此近年來(lái)得到極大地關(guān)注。
[0003] 公開(kāi)號(hào)為CN104408431A的中國(guó)發(fā)明專利申請(qǐng)公開(kāi)了一種交通監(jiān)控下的車(chē)款識(shí)別 方法,該方法包括:W車(chē)牌位置為基準(zhǔn),獲取候補(bǔ)矩形區(qū)域;分析候補(bǔ)區(qū)域直方圖,識(shí)別是車(chē) 頭還是車(chē)尾;定位車(chē)頭中的進(jìn)氣孔或車(chē)尾中的車(chē)燈;獲取每一像素點(diǎn)的邊緣方向,計(jì)算邊緣 直方圖描述子;根據(jù)邊緣直方圖描述子匹配數(shù)據(jù)庫(kù),獲取對(duì)應(yīng)的車(chē)款類(lèi)型。公開(kāi)號(hào)為 CN105279476A的中國(guó)發(fā)明專利申請(qǐng)公開(kāi)了一種基于多特征的車(chē)臉識(shí)別方法與裝置,采用 Adaboost和SVM定位車(chē)輛位置,根據(jù)車(chē)輛的水平邊緣特征,進(jìn)行車(chē)臉精確定位,將定位到的 車(chē)臉?biāo)腿敕诸?lèi)模塊,分類(lèi)模塊的特征提取方法采用冊(cè)G特征提取和LBP特征提取相結(jié)合,分 類(lèi)器采用線性SVM的一對(duì)多分類(lèi)器進(jìn)行分類(lèi),該發(fā)明可W針對(duì)目前常見(jiàn)的1000多種車(chē)型進(jìn) 行識(shí)別。然而,由于上述發(fā)明是根據(jù)人工選取的特征進(jìn)行車(chē)款識(shí)別,因此車(chē)款識(shí)別的準(zhǔn)確率 較低。
[0004] 綜上所述,目前迫切需要提出一種識(shí)別準(zhǔn)確率高的車(chē)款識(shí)別方法及裝置。
【發(fā)明內(nèi)容】
[0005] 有鑒于此,本發(fā)明的主要目的在于實(shí)現(xiàn)車(chē)款識(shí)別,且識(shí)別準(zhǔn)確率高。
[0006] 為達(dá)到上述目的,按照本發(fā)明的第一個(gè)方面,提供了一種基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē) 款識(shí)別方法,該方法包括:
[0007] 第一步驟,選取標(biāo)簽車(chē)款的車(chē)臉灰度圖像為樣本,采用卷積神經(jīng)網(wǎng)絡(luò)對(duì)樣本進(jìn)行 反復(fù)訓(xùn)練,獲取訓(xùn)練好的車(chē)款識(shí)別模型;
[000引第二步驟,采集場(chǎng)景的視頻圖像;
[0009] 第=步驟,從場(chǎng)景的視頻圖像中獲取車(chē)臉區(qū)域;
[0010] 第四步驟,利用訓(xùn)練好的車(chē)款識(shí)別模型對(duì)車(chē)臉區(qū)域進(jìn)行識(shí)別,輸出車(chē)款識(shí)別結(jié)果。
[0011] 所述第一步驟進(jìn)一步包括:
[0012] 樣本選取步驟,選取Th_Re個(gè)標(biāo)簽車(chē)款的車(chē)臉灰度圖像作為樣本圖像;
[001引初步訓(xùn)練步驟,利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)樣本圖像進(jìn)行特征訓(xùn)練,獲得初步訓(xùn)練的模 型;
[0014] 二次訓(xùn)練步驟,選取Th_Test個(gè)測(cè)試圖像,根據(jù)初步訓(xùn)練的模型對(duì)測(cè)試圖像進(jìn)行反 復(fù)訓(xùn)練,直至模型收斂;
[0015] 模型輸出步驟,將收斂的模型作為訓(xùn)練好的車(chē)款識(shí)別模型并輸出。
[0016] 所述初步訓(xùn)練步驟S12中卷積神經(jīng)網(wǎng)絡(luò)包括:輸入層、Th_Con個(gè)卷積層、Th_Pool個(gè) 池化層、Th_Full個(gè)全連接層。其中,每層卷積層包括Th_CK個(gè)卷積核,卷積核的大小為CKSi* CKSi、步長(zhǎng)為1。每層池化層的核的大小為KSi*KSi、步長(zhǎng)為KSi。所述全連接層的最后一層全 連接層輸出的神經(jīng)元的數(shù)量CNum即為車(chē)款的類(lèi)別數(shù)。
[0017] 進(jìn)一步地,所述卷積神經(jīng)網(wǎng)絡(luò)包括:
[001引輸入層,輸入Th_Wi化h*Th_Height的圖像;
[0019] 第一層卷積層Cl,輸出Th_CKl個(gè)卷積核,卷積核的大小為CKSil*CKSil、步長(zhǎng)為1;
[0020] 第一層池化層S2,采用最大池化法輸出KSi*KSi、步長(zhǎng)為KSi的核;
[0021] 第二層卷積層C3,輸出Th_CK2個(gè)卷積核,卷積核的大小為CKSi巧CKSi2、步長(zhǎng)為1;
[0022] 第二層池化層S4,采用最大池化法輸出KSi*KSi、步長(zhǎng)為KSi的核;
[0023] 第=層卷積層巧,輸出Th_CK3個(gè)卷積核,卷積核的大小為CKSi3*CKSi3、步長(zhǎng)為1;
[0024] 全連接層Fl,采用ReLU作為激活函數(shù),輸出Th_Neur個(gè)神經(jīng)元;
[0025] 全連接層F2,輸出CNum個(gè)神經(jīng)元,即CNum個(gè)車(chē)款類(lèi)別。
[0026] 所述第一層池化層S2和第二層池化層S4中的最大池化法可W替換為平均池化法。
[0027] 所述全連接層Fl中ReLU可W替換為sigmoid函數(shù)或者化nh函數(shù)作為激活函數(shù)。
[0028] 所述二次訓(xùn)練步驟進(jìn)一步包括:
[0029] 訓(xùn)練特征提取步驟,根據(jù)初步訓(xùn)練的模型提取測(cè)試圖像的特征;
[0030] 訓(xùn)練分類(lèi)判定步驟,計(jì)算該特征與每一車(chē)款類(lèi)別特征的相似度Simik,k表示第k個(gè) 類(lèi)別,k = {1,2,…,CNum},選取Simik值最大的車(chē)款類(lèi)別作為候選車(chē)款類(lèi)別;
[0031] 反復(fù)訓(xùn)練步驟,計(jì)算判定結(jié)果與真實(shí)結(jié)果的誤差,利用反向傳播算法來(lái)訓(xùn)練模型, 重復(fù)訓(xùn)練特征提取步驟和訓(xùn)練分類(lèi)判定步驟,直至該模型收斂。
[0032] 所述第四步驟進(jìn)一步包括:
[0033] 識(shí)別特征提取步驟,利用訓(xùn)練好的車(chē)款識(shí)別模型提取車(chē)臉區(qū)域的特征;
[0034] 識(shí)別分類(lèi)判定步驟,計(jì)算該特征與每一車(chē)款類(lèi)別特征的相似度Simik,k表示第k個(gè) 類(lèi)別,k={l,2,…,CNumK選取Simik值最大的車(chē)款類(lèi)別作為候選車(chē)款類(lèi)別并輸出結(jié)果。
[0035] 按照本發(fā)明的另一個(gè)方面,提供了一種基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē)款識(shí)別裝置,該裝 置包括:
[0036] 車(chē)款識(shí)別模型獲取模塊,用于選取標(biāo)簽車(chē)款的車(chē)臉灰度圖像為樣本,采用卷積神 經(jīng)網(wǎng)絡(luò)對(duì)樣本進(jìn)行反復(fù)訓(xùn)練,獲取訓(xùn)練好的車(chē)款識(shí)別模型.
[0037] 場(chǎng)景視頻圖像獲取模塊,用于采集場(chǎng)景的視頻圖像;
[0038] 車(chē)臉區(qū)域獲取模塊,用于從場(chǎng)景的視頻圖像中獲取車(chē)臉區(qū)域;
[0039] 車(chē)款識(shí)別模塊,用于利用訓(xùn)練好的車(chē)款識(shí)別模型對(duì)車(chē)臉區(qū)域進(jìn)行識(shí)別,輸出車(chē)款 識(shí)別結(jié)果。
[0040] 所述車(chē)款識(shí)別模型獲取模塊進(jìn)一步包括:
[0041] 樣本選取模塊,用于選取Th_Re個(gè)標(biāo)簽車(chē)款的車(chē)臉灰度圖像作為樣本圖像;
[0042] 初步訓(xùn)練模塊,用于利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)樣本圖像進(jìn)行特征訓(xùn)練,獲得初步訓(xùn)練 的模型;
[0043] 二次訓(xùn)練模塊,用于選取化_Test個(gè)測(cè)試圖像,根據(jù)初步訓(xùn)練的模型對(duì)測(cè)試圖像進(jìn) 行反復(fù)訓(xùn)練,直至模型收斂;
[0044] 模型輸出模塊,用于將收斂的模型作為訓(xùn)練好的車(chē)款識(shí)別模型并輸出。
[0045] 所述初步訓(xùn)練模塊中卷積神經(jīng)網(wǎng)絡(luò)包括:輸入層、Th_Con個(gè)卷積層、Th_Poo 1個(gè)池 化層、Th_Full個(gè)全連接層。其中,每層卷積層包括化_CK個(gè)卷積核,卷積核的大小為CKSi* CKSi、步長(zhǎng)為1。每層池化層的核的大小為KSi*KSi、步長(zhǎng)為KSi。所述全連接層的最后一層全 連接層輸出的神經(jīng)元的數(shù)量CNum即為車(chē)款的類(lèi)別數(shù)。
[0046] 進(jìn)一步地,所述卷積神經(jīng)網(wǎng)絡(luò)包括:
[0047] 輸入層,輸入Th_Wi化h*Th_Height的圖像;
[004引第一層卷積層Cl,輸出Th_CKl個(gè)卷積核,卷積核的大小為CKSil*CKSil、步長(zhǎng)為1;
[0049] 第一層池化層S2,采用最大池化法輸出KSi*KSi、步長(zhǎng)為KSi的核;
[0050] 第二層卷積層C3,輸出Th_CK2個(gè)卷積核,卷積核的大小為CKSi巧CKSi2、步長(zhǎng)為1; [0051 ]第二層池化層S4,采用最大池化法輸出KSi*KSi、步長(zhǎng)為KSi的核;
[0052] 第=層卷積層巧,輸出Th_CK3個(gè)卷積核,卷積核的大小為CKSi3*CKSi3、步長(zhǎng)為1;
[0053] 全連接層Fl,采用ReLU作為激活函數(shù),輸出Th_Neur個(gè)神經(jīng)元;
[0054] 全連接層F2,輸出CNum個(gè)神經(jīng)元,即CNum個(gè)車(chē)款類(lèi)別。
[0055] 所述第一層池化層S2和第二層池化層S4中的最大池化法可W替換為平均池化法。
[0056] 所述全連接層Fl中ReLU可W替換為sigmoid函數(shù)或者化nh函數(shù)作為激活函數(shù)。
[0057] 所述二次訓(xùn)練模塊進(jìn)一步包括:
[0058] 訓(xùn)練特征提取模塊,用于根據(jù)初步訓(xùn)練的模型提取測(cè)試圖像的特征;
[0059] 訓(xùn)練分類(lèi)判定模塊,用于計(jì)算該特征與每一車(chē)款類(lèi)別特征的相似度Simik, k表示 第k個(gè)類(lèi)別,k = {1,2,…,CNum},選取Simik值最大的車(chē)款類(lèi)別作為候選車(chē)款類(lèi)別;
[0060] 反復(fù)訓(xùn)練模塊,用于計(jì)算判定結(jié)果與真實(shí)結(jié)果的誤差,利用反向傳播算法來(lái)訓(xùn)練 模型,重復(fù)訓(xùn)練特征提取模塊和訓(xùn)練分類(lèi)判定模塊,直至該模型收斂。
[0061 ]所述車(chē)款識(shí)別模塊進(jìn)一步包括:
[0062]識(shí)別特征提取模塊,用于利用訓(xùn)練好的車(chē)款識(shí)別模型提取車(chē)臉區(qū)域的特征;
[0063 ]識(shí)別分類(lèi)判定模塊,用于計(jì)算該特征與每一車(chē)款類(lèi)別特征的相似度S i m i k,k表示 第k個(gè)類(lèi)別,k= {1,2,…,CNum},選取Simik值最大的車(chē)款類(lèi)別作為候選車(chē)款類(lèi)別并輸出結(jié) 果。
[0064] 與現(xiàn)有的車(chē)款識(shí)別技術(shù)相比,本發(fā)明的基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē)款識(shí)別方法及裝置 由于采用卷積神經(jīng)網(wǎng)絡(luò),可W自動(dòng)地學(xué)習(xí)車(chē)款的特征,因此車(chē)款識(shí)別準(zhǔn)確率較高。
【附圖說(shuō)明】
[0065] 圖1示出了按照本發(fā)明的基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē)款識(shí)別方法的流程圖。
[0066] 圖2示出了按照本發(fā)明的第一步驟Sl的流程圖。
[0067] 圖3示出了按照本發(fā)明的基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē)款識(shí)別裝置的框架圖。
[0068] 圖4示出了按照本發(fā)明的車(chē)款識(shí)別模型獲取模塊1的框架圖。
【具體實(shí)施方式】
[0069] 為使貴審查員能進(jìn)一步了解本發(fā)明的結(jié)構(gòu)、特征及其他目的,現(xiàn)結(jié)合所附較佳實(shí) 施例詳細(xì)說(shuō)明如下,所說(shuō)明的較佳實(shí)施例僅用于說(shuō)明本發(fā)明的技術(shù)方案,并非限定本發(fā)明。
[0070] 圖I給出了按照本發(fā)明的基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē)款識(shí)別方法的流程圖。如圖I所 示,按照本發(fā)明的基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē)款識(shí)別方法包括:
[0071] 第一步驟SI,選取標(biāo)簽車(chē)款的車(chē)臉灰度圖像為樣本,采用卷積神經(jīng)網(wǎng)絡(luò)對(duì)樣本進(jìn) 行反復(fù)訓(xùn)練,獲取訓(xùn)練好的車(chē)款識(shí)別模型;
[0072] 第二步驟S2,采集場(chǎng)景的視頻圖像;
[0073] 第=步驟S3,從場(chǎng)景的視頻圖像中獲取車(chē)臉區(qū)域;
[0074] 第四步驟S4,利用訓(xùn)練好的車(chē)款識(shí)別模型對(duì)車(chē)臉區(qū)域進(jìn)行識(shí)別,輸出車(chē)款識(shí)別結(jié) 果。
[0075] 圖2給出了按照本發(fā)明的第一步驟Sl的流程圖。如圖2所示,所述第一步驟Sl進(jìn)一 步包括:
[0076] 樣本選取步驟Sll,選取Th_Re個(gè)標(biāo)簽車(chē)款的車(chē)臉灰度圖像作為樣本圖像;
[0077] 初步訓(xùn)練步驟S12,利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)樣本圖像進(jìn)行特征訓(xùn)練,獲得初步訓(xùn)練的 模型;
[0078] 二次訓(xùn)練步驟S13,選取化_Test個(gè)測(cè)試圖像,根據(jù)初步訓(xùn)練的模型對(duì)測(cè)試圖像進(jìn) 行反復(fù)訓(xùn)練,直至模型收斂;
[0079] 模型輸出步驟S14,將收斂的模型作為訓(xùn)練好的車(chē)款識(shí)別模型并輸出。
[0080] 所述樣本選取步驟Sll中標(biāo)簽車(chē)款包括標(biāo)簽W下信息:車(chē)所屬的品牌、品牌下所屬 的車(chē)款、車(chē)的年代。所述Th_Re > 4000。優(yōu)選地,Th_Re > 16000。
[0081] 所述初步訓(xùn)練步驟S12中卷積神經(jīng)網(wǎng)絡(luò)包括:輸入層、Th_Con個(gè)卷積層、Th_Pool個(gè) 池化層、Th_Full個(gè)全連接層。其中,每層卷積層包括Th_CK個(gè)卷積核,卷積核的大小為CKSi* CKSi、步長(zhǎng)為1。每層池化層的核的大小為KSi*KSi、步長(zhǎng)為KSi。所述全連接層的最后一層全 連接層輸出的神經(jīng)元的數(shù)量CNum即為車(chē)款的類(lèi)別數(shù)。
[0082] 其中,所述化_(:〇11 G [ 2,8 ],化_口〇〇 1 G [ 2,8 ]。化_尸1111 G [ 1,3 ]?;痏0( G [ Th_CKmin, Th-CKmax] ,Th-CKminG [6,16] ,Th-CKmaxG [30,512] oCKSi G [3,7]且為奇數(shù),KSi G [2,4]。 CNumG[50,4000]。
[0083] 進(jìn)一步地,所述卷積神經(jīng)網(wǎng)絡(luò)包括:
[0084] 輸入層,輸入Th_Wi化h*Th_Height的圖像;
[0085] 第一層卷積層Cl,輸出Th_CKl個(gè)卷積核,卷積核的大小為CKSil*CKSil、步長(zhǎng)為1;
[0086] 第一層池化層S2,采用最大池化法輸出KSi*KSi、步長(zhǎng)為KSi的核;
[0087] 第二層卷積層C3,輸出Th_CK2個(gè)卷積核,卷積核的大小為CKSi巧CKSi2、步長(zhǎng)為1; [008引第二層池化層S4,采用最大池化法輸出KSi*KSi、步長(zhǎng)為KSi的核;
[0089] 第=層卷積層巧,輸出Th_CK3個(gè)卷積核,卷積核的大小為CKSi3*CKSi3、步長(zhǎng)為1;
[0090] 全連接層Fl,采用ReLU作為激活函數(shù),輸出Th_Neur個(gè)神經(jīng)元;
[0091 ]全連接層F2,輸出CNum個(gè)神經(jīng)元,即CNum個(gè)車(chē)款類(lèi)別。
[0092] 其中,Th_Width和化_Height分別為輸入圖像的寬度和高度,Th_WidthG [26, 110] Jh-Hei 曲 tG[18,46]?;痏0(1£ [6,20LCKSilG [3,5]且為奇數(shù)。KSiG [2,4]。化_0(2 £[10,40]。0(512£[3,5]且為奇數(shù)?;痏0(3£[10,40]。0(513£[3,5]且為奇數(shù)?;痏化11'£ [160,10000] oCNumG [ 100,3000]。
[0093] 優(yōu)選地,Th_Width設(shè)為62,化_胎1旨^設(shè)為30?;痏〇(1設(shè)為16,〇(511設(shè)為3,1(51設(shè)為 2,化_(:1(2設(shè)為32,CKSi2設(shè)為3,化_(:1(3設(shè)為32,CKSi3設(shè)為3?;痏化肥設(shè)為256 dCNuhi設(shè)為 2000 O
[0094]所述第一層池化層S2和第二層池化層S4中的最大池化法可W替換為平均池化法。 [00巧]所述全連接層Fl中ReLU全稱為Rectified Linear化its,中文譯為修正線性單 元,可 W 參考文南犬"Tamin 邑 the ReLU with Parallel Dither in a Deep Neural Network.AJR Simpson.Computer Science,2015"。
[0096] 所述全連接層Fl中ReLU可W替換為sigmoid函數(shù)或者化nh函數(shù)作為激活函數(shù)。
[0097] 所述二次訓(xùn)練步驟Sl 3進(jìn)一步包括:
[0098] 訓(xùn)練特征提取步驟S131,根據(jù)初步訓(xùn)練的模型提取測(cè)試圖像的特征;
[0099] 訓(xùn)練分類(lèi)判定步驟Sl 32,計(jì)算該特征與每一車(chē)款類(lèi)別特征的相似度Simik,k表示 第k個(gè)類(lèi)別,k = {1,2,…,CNum},選取Simik值最大的車(chē)款類(lèi)別作為候選車(chē)款類(lèi)別;
[0100] 反復(fù)訓(xùn)練步驟S133,計(jì)算判定結(jié)果與真實(shí)結(jié)果的誤差,利用反向傳播算法來(lái)訓(xùn)練 模型,重復(fù)訓(xùn)練特征提取步驟S131和訓(xùn)練分類(lèi)判定步驟S132,直至該模型收斂。
[0101] 其中,Th_Test>1000。優(yōu)選地,Th_Test>4000。反向傳播算法通過(guò)現(xiàn)有的技術(shù)實(shí) 現(xiàn)。
[0102] 所述第=步驟S3可W通過(guò)現(xiàn)有的車(chē)臉定位算法或者車(chē)輛檢測(cè)算法實(shí)現(xiàn),輸出的車(chē) 臉區(qū)域?yàn)榛叶鹊能?chē)臉區(qū)域。
[0103] 優(yōu)選地,所述第=步驟S3進(jìn)一步包括:
[0104] 車(chē)牌區(qū)域定位步驟S31,根據(jù)車(chē)牌定位算法獲取場(chǎng)景圖像中的車(chē)牌區(qū)域;
[0105] 車(chē)臉區(qū)域邊界獲取步驟S32,根據(jù)車(chē)牌區(qū)域獲取車(chē)牌區(qū)域的左邊邊界x = pl、右邊 邊界x = p;r、上邊邊界y = pt、下邊邊界y = pb,則車(chē)臉區(qū)域的左邊邊界為
上邊邊界 Wr為車(chē)牌 區(qū)域的寬度,W和H分別為場(chǎng)景圖像的寬度和高度;
[0106] 車(chē)臉區(qū)域獲取步驟S33,根據(jù)車(chē)臉區(qū)域的左邊邊界、右邊邊界、上邊邊界、下邊邊 界,確定矩形區(qū)域,該矩形區(qū)域即為車(chē)臉區(qū)域,并對(duì)車(chē)臉區(qū)域進(jìn)行灰度化處理,獲取灰度的 車(chē)臉區(qū)域。
[0107] 所述車(chē)牌區(qū)域定位步驟S31中車(chē)牌定位算法為現(xiàn)有的車(chē)牌定位算法。例如,"基于 邊緣顏色對(duì)的車(chē)牌定位新方法.李文舉,梁德群,張旗,樊蠢.《計(jì)算機(jī)學(xué)報(bào)》,2004,27(2): 204-20滬。
[010引所述入IG [1.1,1.4],入2G [1.1,1.4],入3G [1.2,1.6] ,MG [0.3,0.8]。優(yōu)選地,入 1 選為1.2,A2選為1.2,A3選為1.3,M選為0.5。
[0109] 所述第四步驟S4進(jìn)一步包括:
[0110] 識(shí)別特征提取步驟S41,利用訓(xùn)練好的車(chē)款識(shí)別模型提取車(chē)臉區(qū)域的特征;
[0111] 識(shí)別分類(lèi)判定步驟S42,計(jì)算該特征與每一車(chē)款類(lèi)別特征的相似度Simik,k表示第 k個(gè)類(lèi)別,k={l,2,…,CNumK選取Simik值最大的車(chē)款類(lèi)別作為候選車(chē)款類(lèi)別并輸出結(jié)果。
[0112] 圖3給出了按照本發(fā)明的基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē)款識(shí)別裝置的框架圖。如圖3所 示,按照本發(fā)明的基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē)款識(shí)別裝置包括:
[0113] 車(chē)款識(shí)別模型獲取模塊1,用于選取標(biāo)簽車(chē)款的車(chē)臉灰度圖像為樣本,采用卷積神 經(jīng)網(wǎng)絡(luò)對(duì)樣本進(jìn)行反復(fù)訓(xùn)練,獲取訓(xùn)練好的車(chē)款識(shí)別模型.
[0114] 場(chǎng)景視頻圖像獲取模塊2,用于采集場(chǎng)景的視頻圖像;
[0115] 車(chē)臉區(qū)域獲取模塊3,用于從場(chǎng)景的視頻圖像中獲取車(chē)臉區(qū)域;
[0116] 車(chē)款識(shí)別模塊4,用于利用訓(xùn)練好的車(chē)款識(shí)別模型對(duì)車(chē)臉區(qū)域進(jìn)行識(shí)別,輸出車(chē)款 識(shí)別結(jié)果。
[0117] 圖4給出了按照本發(fā)明的車(chē)款識(shí)別模型獲取模塊1的框架圖。如圖4所示,所述車(chē)款 識(shí)別模型獲取模塊1進(jìn)一步包括:
[0118] 樣本選取模塊11,用于選取Th_Re個(gè)標(biāo)簽車(chē)款的車(chē)臉灰度圖像作為樣本圖像;
[0119] 初步訓(xùn)練模塊12,用于利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)樣本圖像進(jìn)行特征訓(xùn)練,獲得初步訓(xùn) 練的模型;
[0120] 二次訓(xùn)練模塊13,用于選取Th_Test個(gè)測(cè)試圖像,根據(jù)初步訓(xùn)練的模型對(duì)測(cè)試圖像 進(jìn)行反復(fù)訓(xùn)練,直至模型收斂;
[0121] 模型輸出模塊14,用于將收斂的模型作為訓(xùn)練好的車(chē)款識(shí)別模型并輸出。
[0122] 所述樣本選取模塊11中標(biāo)簽車(chē)款包括標(biāo)簽W下信息:車(chē)所屬的品牌、品牌下所屬 的車(chē)款、車(chē)的年代。所述Th_Re > 4000。優(yōu)選地,Th_Re > 16000。
[0123] 所述初步訓(xùn)練模塊12中卷積神經(jīng)網(wǎng)絡(luò)包括:輸入層、Th_Con個(gè)卷積層、Th_Pool個(gè) 池化層、Th_Full個(gè)全連接層。其中,每層卷積層包括Th_CK個(gè)卷積核,卷積核的大小為CKSi* CKSi、步長(zhǎng)為1。每層池化層的核的大小為KSi*KSi、步長(zhǎng)為KSi。所述全連接層的最后一層全 連接層輸出的神經(jīng)元的數(shù)量CNum即為車(chē)款的類(lèi)別數(shù)。
[0124] 其中,所述化_(:〇11 G [ 2,8 ],化_口〇〇 1 G [ 2,8 ]?;痏尸1111 G [ 1,3 ]。Th-CK G [ Th-CKmin, Th-CKmax] ,Th-CKminG [6,16] ,Th-CKmaxG [30,512] oCKSi G [3,7]且為奇數(shù),KSi G [2,4]。 CNumG[50,4000]。
[01巧]進(jìn)一步地,所述卷積神經(jīng)網(wǎng)絡(luò)包括:
[01%] 輸入層,輸入Th_Wi化h*Th_Height的圖像;
[0127]第一層卷積層Cl,輸出Th_CKl個(gè)卷積核,卷積核的大小為CKSil*CKSil、步長(zhǎng)為1; [01 %]第一層池化層S2,采用最大池化法輸出KSi*KSi、步長(zhǎng)為KSi的核;
[0129] 第二層卷積層C3,輸出Th_CK2個(gè)卷積核,卷積核的大小為CKSi巧CKSi2、步長(zhǎng)為1;
[0130] 第二層池化層S4,采用最大池化法輸出KSi*KSi、步長(zhǎng)為KSi的核;
[0131] 第=層卷積層巧,輸出Th_CK3個(gè)卷積核,卷積核的大小為CKSi3*CKSi3、步長(zhǎng)為1; [01創(chuàng)全連接層Fl,采用ReLU作為激活函數(shù),輸出Th_Neur個(gè)神經(jīng)元;
[0133] 全連接層F2,輸出CNum個(gè)神經(jīng)元,即CNum個(gè)車(chē)款類(lèi)別。
[0134] 其中,Th_Width和化_Height分別為輸入圖像的寬度和高度,Th_WidthG [26, 110] Jh-Hei 曲 tG[18,46]?;痏0(1£ [6,20LCKSilG [3,5]且為奇數(shù)。KSiG [2,4]。化_0(2 £[10,40]。0(512£[3,5]且為奇數(shù)。化_0(3£[10,40]。0(513£[3,5]且為奇數(shù)?;痏化11'£ [160,10000] oCNumG [ 100,3000]。
[0135] 優(yōu)選地,Th_Width設(shè)為62,化_胎1旨^設(shè)為30?;痏〇(1設(shè)為16,〇(511設(shè)為3,1(51設(shè)為 2,化_(:1(2設(shè)為32,CKSi2設(shè)為3,化_(:1(3設(shè)為32,CKSi3設(shè)為3?;痏化肥設(shè)為256 dCNuhi設(shè)為 2000 O
[0136] 所述第一層池化層S2和第二層池化層S4中的最大池化法可W替換為平均池化法。
[0137] 所述全連接層Fl中ReLU全稱為Rectified Linear化its,中文譯為修正線性單 元,可 W 參考文南犬"Tamin 邑 the ReLU with Parallel Dither in a Deep Neural Network.AJR Simpson.Computer Science,2015"。
[0138] 所述全連接層Fl中ReLU可W替換為sigmoid函數(shù)或者化nh函數(shù)作為激活函數(shù)。
[0139] 所述二次訓(xùn)練模塊13進(jìn)一步包括:
[0140] 訓(xùn)練特征提取模塊131,用于根據(jù)初步訓(xùn)練的模型提取測(cè)試圖像的特征;
[0141] 訓(xùn)練分類(lèi)判定模塊132,用于計(jì)算該特征與每一車(chē)款類(lèi)別特征的相似度Simik, k表 示第k個(gè)類(lèi)別,k = {1,2,…,CNum},選取Simik值最大的車(chē)款類(lèi)別作為候選車(chē)款類(lèi)別;
[0142] 反復(fù)訓(xùn)練模塊133,用于計(jì)算判定結(jié)果與真實(shí)結(jié)果的誤差,利用反向傳播算法來(lái)訓(xùn) 練模型,重復(fù)訓(xùn)練特征提取模塊131和訓(xùn)練分類(lèi)判定模塊132,直至該模型收斂。
[0143] 其中,Th_Test>1000。優(yōu)選地,Th_Test>4000。反向傳播算法通過(guò)現(xiàn)有的技術(shù)實(shí) 現(xiàn)。
[0144] 所述車(chē)臉區(qū)域獲取模塊3可W通過(guò)現(xiàn)有的車(chē)臉定位算法或者車(chē)輛檢測(cè)算法實(shí)現(xiàn), 輸出的車(chē)臉區(qū)域?yàn)榛叶鹊能?chē)臉區(qū)域。
[0145] 優(yōu)選地,所述車(chē)臉區(qū)域獲取模塊3進(jìn)一步包括:
[0146] 車(chē)牌區(qū)域定位模塊31,用于根據(jù)車(chē)牌定位算法獲取場(chǎng)景圖像中的車(chē)牌區(qū)域;
[0147] 車(chē)臉區(qū)域邊界獲取模塊32,用于根據(jù)車(chē)牌區(qū)域獲取車(chē)牌區(qū)域的左邊邊界x = pl、右 邊邊界x = p;r、上邊邊界y = pt、下邊邊界y = pb,則車(chē)臉區(qū)域的左邊邊界為
t邊邊界為 Wr為車(chē)牌 區(qū)域的寬度,W和H分別為場(chǎng)景圖像的寬度和高度;
[0148] 車(chē)臉區(qū)域獲取模塊33,用于根據(jù)車(chē)臉區(qū)域的左邊邊界、右邊邊界、上邊邊界、下邊 邊界,確定矩形區(qū)域,該矩形區(qū)域即為車(chē)臉區(qū)域,并對(duì)車(chē)臉區(qū)域進(jìn)行灰度化處理,獲取灰度 的車(chē)臉區(qū)域。
[0149] 所述車(chē)牌區(qū)域定位模塊31中車(chē)牌定位算法為現(xiàn)有的車(chē)牌定位算法。例如,"基于邊 緣顏色對(duì)的車(chē)牌定位新方法.李文舉,梁德群,張旗,樊蠢.《計(jì)算機(jī)學(xué)報(bào)》,2004,27(2) :204- 20滬。
[0150] 所述人IG [1.1,1.4],人2G [1.1,1.4],人3G [1.2,1.6] ,MG [0.3,0.8]。優(yōu)選地,入1 選為1.2,A2選為1.2,A3選為1.3,M選為0.5。
[0151 ]所述車(chē)款識(shí)別模塊4進(jìn)一步包括:
[0152] 識(shí)別特征提取模塊41,用于利用訓(xùn)練好的車(chē)款識(shí)別模型提取車(chē)臉區(qū)域的特征;
[0153] 識(shí)別分類(lèi)判定模塊42,用于計(jì)算該特征與每一車(chē)款類(lèi)別特征的相似度Simik,k表 示第k個(gè)類(lèi)別,k={l,2,…,CNumK選取Simik值最大的類(lèi)別作為候選車(chē)款類(lèi)別并輸出結(jié)果。
[0154] 與現(xiàn)有的車(chē)款識(shí)別技術(shù)相比,本發(fā)明的基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē)款識(shí)別方法及裝置 由于采用卷積神經(jīng)網(wǎng)絡(luò),可W自動(dòng)地學(xué)習(xí)車(chē)款的特征,因此車(chē)款識(shí)別準(zhǔn)確率較高。
[0155] W上所述,僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍,應(yīng)當(dāng) 理解,本發(fā)明并不限于運(yùn)里所描述的實(shí)現(xiàn)方案,運(yùn)些實(shí)現(xiàn)方案描述的目的在于幫助本領(lǐng)域 中的技術(shù)人員實(shí)踐本發(fā)明。任何本領(lǐng)域中的技術(shù)人員很容易在不脫離本發(fā)明精神和范圍的 情況下進(jìn)行進(jìn)一步的改進(jìn)和完善,因此本發(fā)明只受到本發(fā)明權(quán)利要求的內(nèi)容和范圍的限 審IJ,其意圖涵蓋所有包括在由所附權(quán)利要求所限定的本發(fā)明精神和范圍內(nèi)的備選方案和等 同方案。
【主權(quán)項(xiàng)】
1. 一種基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē)款識(shí)別方法,其特征在于,該方法包括: 第一步驟,選取標(biāo)簽車(chē)款的車(chē)臉灰度圖像為樣本,采用卷積神經(jīng)網(wǎng)絡(luò)對(duì)樣本進(jìn)行反復(fù) 訓(xùn)練,獲取訓(xùn)練好的車(chē)款識(shí)別模型; 第二步驟,采集場(chǎng)景的視頻圖像; 第三步驟,從場(chǎng)景的視頻圖像中獲取車(chē)臉區(qū)域; 第四步驟,利用訓(xùn)練好的車(chē)款識(shí)別模型對(duì)車(chē)臉區(qū)域進(jìn)行識(shí)別,輸出車(chē)款識(shí)別結(jié)果。2. 如權(quán)利要求1所述的方法,其特征在于,所述第一步驟進(jìn)一步包括: 樣本選取步驟,選取Th_Re個(gè)標(biāo)簽車(chē)款的車(chē)臉灰度圖像作為樣本圖像; 初步訓(xùn)練步驟,利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)樣本圖像進(jìn)行特征訓(xùn)練,獲得初步訓(xùn)練的模型; 二次訓(xùn)練步驟,選取Th_Test個(gè)測(cè)試圖像,根據(jù)初步訓(xùn)練的模型對(duì)測(cè)試圖像進(jìn)行反復(fù)訓(xùn) 練,直至模型收斂; 模型輸出步驟,將收斂的模型作為訓(xùn)練好的車(chē)款識(shí)別模型并輸出; 其中,所述標(biāo)簽車(chē)款包括標(biāo)簽以下信息:車(chē)所屬的品牌、品牌下所屬的車(chē)款、車(chē)的年代; 所述 Th_Re 彡 4000,Th_Tes t 彡 1000 。3. 如權(quán)利要求2所述的方法,其特征在于,所述卷積神經(jīng)網(wǎng)絡(luò)包括:輸入層、Th_Con個(gè)卷 積層、Th_Pool個(gè)池化層、Th_Ful 1個(gè)全連接層; 其中,每層卷積層包括Th_CK個(gè)卷積核,卷積核的大小為CKSi*CKSi、步長(zhǎng)為1;每層池化 層的核的大小為KSi*KSi、步長(zhǎng)為KSi;所述全連接層的最后一層全連接層輸出的神經(jīng)元的 數(shù)量CNum即為車(chē)款的類(lèi)別數(shù); 所述Th_Con e [ 2,8 ],Th_P。。I e [ 2,8 ],Th_Fu11 e [ 1,3 ],Th_CK e [ Th_CIWn,Th_CK腹], 111_0(*£[6,16],111_0(麗£[30,512],0(51£[3,7]且為奇數(shù),1(51£[2,4],。燦111£[50, 4000] 〇4. 如權(quán)利要求3所述的方法,其特征在于,所述卷積神經(jīng)網(wǎng)絡(luò)進(jìn)一步包括: 輸入層,輸入Th_Wi dth*Th_He i ght的圖像; 第一層卷積層C1,輸出Th_CKl個(gè)卷積核,卷積核的大小為CKSil*CKSil、步長(zhǎng)為1; 第一層池化層S2,采用最大池化法輸出KSi*KSi、步長(zhǎng)為KSi的核; 第二層卷積層C3,輸出Th_CK2個(gè)卷積核,卷積核的大小為CKSi2*CKSi2、步長(zhǎng)為1; 第二層池化層S4,采用最大池化法輸出KSi*KSi、步長(zhǎng)為KSi的核; 第三層卷積層C5,輸出Th_CK3個(gè)卷積核,卷積核的大小為CKSi3*CKSi3、步長(zhǎng)為1; 全連接層Fl,采用ReLU作為激活函數(shù),輸出Th_Neur個(gè)神經(jīng)元; 全連接層F2,輸出CNum個(gè)神經(jīng)元,即CNum個(gè)車(chē)款類(lèi)別; 其中,Th_Width和ThJfeight分別為輸入圖像的寬度和高度,Th_Widthe [26,110],Th_ 此181^£[18,46],111_〇(1£[6,20],〇(511£[3,5]且為奇數(shù),1(51£[2,4] ;111_〇(2£[10, 40],0(512£[3,5]且為奇數(shù),111_0(3£[1〇,40],0(513£[3,5]且為奇數(shù),111_此證£[160, 10000],CNume[ 100,3000] 〇5. 如權(quán)利要求4所述的方法,所述第一層池化層S2和第二層池化層S4中的最大池化法 替換為平均池化法。6. 如權(quán)利要求4所述的方法,所述全連接層Fl中ReLU替換為sigmoid函數(shù)或者tanh函數(shù) 作為激活函數(shù)。7. 如權(quán)利要求2所述的方法,其特征在于,所述二次訓(xùn)練步驟進(jìn)一步包括: 訓(xùn)練特征提取步驟,根據(jù)初步訓(xùn)練的模型提取測(cè)試圖像的特征; 訓(xùn)練分類(lèi)判定步驟,計(jì)算該特征與每一車(chē)款類(lèi)別特征的相似度Simik,k表示第k個(gè)類(lèi)別, k= {1,2, M^CNumh選取Simik值最大的車(chē)款類(lèi)別作為候選車(chē)款類(lèi)別;反復(fù)訓(xùn)練步驟,計(jì)算 判定結(jié)果與真實(shí)結(jié)果的誤差,利用反向傳播算法來(lái)訓(xùn)練模型,重復(fù)訓(xùn)練特征提取步驟和訓(xùn) 練分類(lèi)判定步驟,直至該模型收斂。8. 如權(quán)利要求1所述的方法,其特征在于,所述第三步驟進(jìn)一步包括: 車(chē)牌區(qū)域定位步驟,根據(jù)車(chē)牌定位算法獲取場(chǎng)景圖像中的車(chē)牌區(qū)域; 車(chē)臉區(qū)域邊界獲取步驟,根據(jù)車(chē)牌區(qū)域獲取車(chē)牌區(qū)域的左邊邊界X = Pl、右邊邊 界x = pr、上邊邊界y = pt、下邊邊界y = pb,則車(chē)臉區(qū)域的左邊邊界為匕邊邊界為 ,Wr為車(chē)牌 區(qū)域的寬度,W和H分別為場(chǎng)景圖像的寬度和高度; 車(chē)臉區(qū)域獲取步驟,根據(jù)車(chē)臉區(qū)域的左邊邊界、右邊邊界、上邊邊界、下邊邊界,確定矩 形區(qū)域,該矩形區(qū)域即為車(chē)臉區(qū)域,并對(duì)車(chē)臉區(qū)域進(jìn)行灰度化處理,獲取灰度的車(chē)臉區(qū)域; 其中,所述入1£ [1 ·1,1·4],λ2ε [1 ·1,1·4],λ3ε [1·2,1·6],λ4ε [0.3,0.8]。9. 如權(quán)利要求1所述的方法,其特征在于,所述第四步驟進(jìn)一步包括: 識(shí)別特征提取步驟,利用訓(xùn)練好的車(chē)款識(shí)別模型提取車(chē)臉區(qū)域的特征; 識(shí)別分類(lèi)判定步驟,計(jì)算該特征與每一車(chē)款類(lèi)別特征的相似度Simik,k表示第k個(gè)類(lèi)別, k={l,2, H^CNumh選取Simik值最大的車(chē)款類(lèi)別作為候選車(chē)款類(lèi)別并輸出結(jié)果。10. -種基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē)款識(shí)別裝置,其特征在于,該裝置包括: 車(chē)款識(shí)別模型獲取模塊,用于選取標(biāo)簽車(chē)款的車(chē)臉灰度圖像為樣本,采用卷積神經(jīng)網(wǎng) 絡(luò)對(duì)樣本進(jìn)行反復(fù)訓(xùn)練,獲取訓(xùn)練好的車(chē)款識(shí)別模型; 場(chǎng)景視頻圖像獲取模塊,用于采集場(chǎng)景的視頻圖像; 車(chē)臉區(qū)域獲取模塊,用于從場(chǎng)景的視頻圖像中獲取車(chē)臉區(qū)域; 車(chē)款識(shí)別模塊,用于利用訓(xùn)練好的車(chē)款識(shí)別模型對(duì)車(chē)臉區(qū)域進(jìn)行識(shí)別,輸出車(chē)款識(shí)別 結(jié)果。11. 如權(quán)利要求10所述的裝置,其特征在于,所述車(chē)款識(shí)別模型獲取模塊進(jìn)一步包括: 樣本選取模塊,用于選取Th_Re個(gè)標(biāo)簽車(chē)款的車(chē)臉灰度圖像作為樣本圖像; 初步訓(xùn)練模塊,用于利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)樣本圖像進(jìn)行特征訓(xùn)練,獲得初步訓(xùn)練的模 型; 二次訓(xùn)練模塊,用于選取Th_Test個(gè)測(cè)試圖像,根據(jù)初步訓(xùn)練的模型對(duì)測(cè)試圖像進(jìn)行反 復(fù)訓(xùn)練,直至模型收斂; 模型輸出模塊,用于將收斂的模型作為訓(xùn)練好的車(chē)款識(shí)別模型并輸出; 其中,所述標(biāo)簽車(chē)款包括標(biāo)簽以下信息:車(chē)所屬的品牌、品牌下所屬的車(chē)款、車(chē)的年代; 所述 Th_Re 彡 4000,Th_Tes t 彡 1000。12. 如權(quán)利要求11所述的裝置,其特征在于,所述卷積神經(jīng)網(wǎng)絡(luò)包括:輸入層、Th_Con個(gè) 卷積層、Th_Pool個(gè)池化層、Th_Ful 1個(gè)全連接層; 其中,每層卷積層包括Th_CK個(gè)卷積核,卷積核的大小為CKSi*CKSi、步長(zhǎng)為1;每層池化 層的核的大小為KSi*KSi、步長(zhǎng)為KSi;所述全連接層的最后一層全連接層輸出的神經(jīng)元的 數(shù)量CNum即為車(chē)款的類(lèi)別數(shù); 所述Th_Con e [ 2,8 ],Th_P。。I e [ 2,8 ],Th_Fu11 e [ 1,3 ],Th_CK e [ Th_CIWn,Th_CK腹], 111_0(*£[6,16],111_0(麗£[30,512],0(51£[3,7]且為奇數(shù),1(51£[2,4],。燦111£[50, 4000] 〇13. 如權(quán)利要求12所述的裝置,其特征在于,所述卷積神經(jīng)網(wǎng)絡(luò)進(jìn)一步包括:輸入層,輸 入 Th_Wi d th*Th_He i gh t 的圖像; 第一層卷積層C1,輸出Th_CKl個(gè)卷積核,卷積核的大小為CKSil*CKSil、步長(zhǎng)為1; 第一層池化層S2,采用最大池化法輸出KSi*KSi、步長(zhǎng)為KSi的核; 第二層卷積層C3,輸出Th_CK2個(gè)卷積核,卷積核的大小為CKSi2*CKSi2、步長(zhǎng)為1; 第二層池化層S4,采用最大池化法輸出KSi*KSi、步長(zhǎng)為KSi的核; 第三層卷積層C5,輸出Th_CK3個(gè)卷積核,卷積核的大小為CKSi3*CKSi3、步長(zhǎng)為1; 全連接層Fl,采用ReLU作為激活函數(shù),輸出Th_Neur個(gè)神經(jīng)元; 全連接層F2,輸出CNum個(gè)神經(jīng)元,即CNum個(gè)車(chē)款類(lèi)別; 其中,Th_Width和ThJfeight分別為輸入圖像的寬度和高度,Th_Widthe [26,110],Th_ 此181^£[18,46],111_〇(1£[6,20],〇(511£[3,5]且為奇數(shù),1(51£[2,4] ;111_〇(2£[10, 40],0(512£[3,5]且為奇數(shù),111_0(3£[1〇,40],0(513£[3,5]且為奇數(shù),111_此證£[160, 10000],CNume[ 100,3000] 〇14. 如權(quán)利要求13所述的裝置,其特征在于,所述第一層池化層S2和第二層池化層S4中 的最大池化法替換為平均池化法。15. 如權(quán)利要求13所述的裝置,其特征在于,所述全連接層Fl中ReLU替換為sigmoid函 數(shù)或者tanh函數(shù)作為激活函數(shù)。16. 如權(quán)利要求11所述的裝置,其特征在于,所述二次訓(xùn)練模塊進(jìn)一步包括:訓(xùn)練特征 提取模塊,用于根據(jù)初步訓(xùn)練的模型提取測(cè)試圖像的特征; 訓(xùn)練分類(lèi)判定模塊,用于計(jì)算該特征與每一車(chē)款類(lèi)別特征的相似度Simik,k表示第k個(gè) 類(lèi)別,k = {1,2,…,CNum},選取Simik值最大的車(chē)款類(lèi)別作為候選車(chē)款類(lèi)別; 反復(fù)訓(xùn)練模塊,用于計(jì)算判定結(jié)果與真實(shí)結(jié)果的誤差,利用反向傳播算法來(lái)訓(xùn)練模型, 重復(fù)訓(xùn)練特征提取模塊和訓(xùn)練分類(lèi)判定模塊,直至該模型收斂。17. 如權(quán)利要求10所述的裝置,其特征在于,所述車(chē)臉區(qū)域獲取模塊進(jìn)一步包括: 車(chē)牌區(qū)域定位模塊,用于根據(jù)車(chē)牌定位算法獲取場(chǎng)景圖像中的車(chē)牌區(qū)域; 車(chē)臉區(qū)域邊界獲取模塊,用于根據(jù)車(chē)牌區(qū)域獲取車(chē)牌區(qū)域的左邊邊界X = Pl、右 邊邊界x = pr、上邊邊界y = pt、下邊邊界y = pb,則車(chē)臉區(qū)域的左邊邊界為7 ,右邊邊界為 ,上邊邊界為Wr為車(chē)牌區(qū) 域的寬度,W和H分別為場(chǎng)景圖像的寬度和高度; 車(chē)臉區(qū)域獲取模塊,用于根據(jù)車(chē)臉區(qū)域的左邊邊界、右邊邊界、上邊邊界、下邊邊界,確 定矩形區(qū)域,該矩形區(qū)域即為車(chē)臉區(qū)域,并對(duì)車(chē)臉區(qū)域進(jìn)行灰度化處理,獲取灰度的車(chē)臉區(qū) 域; 其中,所述入1£ [1 ·1,1·4],λ2ε [1 ·1,1·4],λ3ε [1·2,1·6],λ4ε [0.3,0.8]。18.如權(quán)利要求10所述的裝置,其特征在于,所述車(chē)款識(shí)別模塊進(jìn)一步包括:識(shí)別特征 提取模塊,用于利用訓(xùn)練好的車(chē)款識(shí)別模型提取車(chē)臉區(qū)域的特征; 識(shí)別分類(lèi)判定模塊,用于計(jì)算該特征與每一車(chē)款類(lèi)別特征的相似度Simik,k表示第k個(gè) 類(lèi)別,k={l,2, ···,CNum},選取Simik值最大的車(chē)款類(lèi)別作為候選車(chē)款類(lèi)別并輸出結(jié)果。
【文檔編號(hào)】G06K9/62GK106022285SQ201610368032
【公開(kāi)日】2016年10月12日
【申請(qǐng)日】2016年5月30日
【發(fā)明人】李志國(guó)
【申請(qǐng)人】北京智芯原動(dòng)科技有限公司