一種車輛識別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本申請涉及計算機視覺技術(shù)領(lǐng)域,尤其涉及一種車輛識別方法及裝置。
【背景技術(shù)】
[0002]目前,在識別圖片中的具體內(nèi)容時,通常是包括如下步驟:
[0003]第一步,在圖片中檢測感興趣物體的位置,比如:若要進行車輛的識別則需要先使用一個檢測器將這輛車從圖片中找出來,檢測器的輸出結(jié)果為該車在圖片上的坐標;
[0004]第二步,將該車按照坐標位置從原圖中剪切下來,將剪切后的圖片放到分類器中,分類器的輸出結(jié)果為這輛車的識別結(jié)果。
[0005]在第二步中,通常是將輸入的原始圖片像素值轉(zhuǎn)化為人工定義的特征(human-engineered features),比如:尺度不變特征變換(SIFT,Scale-1nvariant featuretransform)、方向梯度直方圖(H0G,Histogram of Oriented Gradient)特征等,然后將這些變換得到的特征放入分類器中進行分類,最終得到物體的識別結(jié)果。采用這種方式進行識別,由于分類算法是基于人工定義的特征進行分類,使用的模型通常只包含一個提取特征的隱含層,特征往往不足以刻畫和區(qū)分物體,導(dǎo)致識別的準確率較低。
[0006]現(xiàn)有技術(shù)不足在于:
[0007]采用現(xiàn)有的方式識別物體準確率較低。
【發(fā)明內(nèi)容】
[0008]本申請實施例提出了一種車輛識別方法及裝置,以解決現(xiàn)有技術(shù)中的物體識別方法識別物體的準確率較低的技術(shù)問題。
[0009]本申請實施例提供了一種車輛識別方法,包括如下步驟:
[0010]獲取待識別車輛圖像;
[0011]利用預(yù)先訓(xùn)練得到的第一深度學習網(wǎng)絡(luò)識別所述待識別車輛圖像;所述第一深度學習網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)包括卷積層、池化層和全連接層,所述卷積層的后面連接所述池化層,所述池化層后面連接所述全連接層,最后的全連接層上的每個輸出節(jié)點為所述車輛圖像的車輛屬性概率;
[0012]根據(jù)所述車輛屬性概率確定所述待識別車輛圖像的車輛屬性信息。
[0013]本申請實施例提供了一種車輛識別裝置,包括:
[0014]獲取模塊,用于獲取待識別車輛圖像;
[0015]訓(xùn)練模塊,用于訓(xùn)練第一深度學習網(wǎng)絡(luò);所述第一深度學習網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)包括卷積層、池化層和全連接層,所述卷積層的后面連接所述池化層,所述池化層后面連接所述全連接層,最后的全連接層上的每個輸出節(jié)點為所述車輛圖像的車輛屬性概率;
[0016]識別模塊,用于利用預(yù)先訓(xùn)練得到的所述第一深度學習網(wǎng)絡(luò)識別所述待識別車輛圖像;
[0017]確定模塊,用于根據(jù)所述車輛屬性概率確定所述待識別車輛圖像的車輛屬性信息。
[0018]有益效果如下:
[0019]本申請實施例所提供的車輛識別方法及裝置,在獲取到待識別車輛圖像之后,無需用戶手動定義特征再進行分類,直接利用預(yù)先訓(xùn)練得到的第一深度學習網(wǎng)絡(luò)即可識別所述待識別車輛圖像,依次經(jīng)過卷積層、池化層和全連接層后得到車輛屬性概率,從而確定車輛屬性信息。由于本申請實施例所提供的方案利用的是深度學習網(wǎng)絡(luò)識別車輛,深度學習網(wǎng)絡(luò)足以刻畫和區(qū)分物體,相比現(xiàn)有的人工定義特征進行分類的方式準確性更高,使得誤報率和漏報率同時降低。
【附圖說明】
[0020]下面將參照附圖描述本申請的具體實施例,其中:
[0021]圖1示出了本申請實施例中車輛識別方法實施的流程示意圖;
[0022]圖2示出了本申請實施例中第一深度學習網(wǎng)絡(luò)的結(jié)構(gòu)示意圖;
[0023]圖3示出了本申請實施例中車輛識別裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0024]為了使本申請的技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖對本申請的示例性實施例進行進一步詳細的說明,顯然,所描述的實施例僅是本申請的一部分實施例,而不是所有實施例的窮舉。并且在不沖突的情況下,本說明中的實施例及實施例中的特征可以互相結(jié)合。
[0025]發(fā)明人在發(fā)明過程中注意到:
[0026]現(xiàn)有方式還存在著如下缺點:
[0027]I)誤報和漏報是一對矛盾,即可以人為地調(diào)整模型外在參數(shù),使得誤報率降低而造成漏報率上升,反之亦然。由于現(xiàn)有方式準確性不高,造成無論怎樣調(diào)整參數(shù),結(jié)果的誤報和漏報率都難以同時降低;
[0028]2)現(xiàn)有算法是基于手工定義的特征,在輸入圖片后進行提取特征時需要人手動參與;
[0029]3)現(xiàn)有技術(shù)中大多為淺層模型,不能很好的刻畫出欲分類物體的特征。
[0030]針對現(xiàn)有技術(shù)的不足,本申請實施例提出了一種車輛識別方法及裝置,下面進行說明。
[0031]圖1示出了本申請實施例中車輛識別方法實施的流程示意圖,如圖所示,所述車輛識別方法可以包括如下步驟:
[0032]步驟101、獲取待識別車輛圖像;
[0033]步驟102、利用預(yù)先訓(xùn)練得到的第一深度學習網(wǎng)絡(luò)識別所述待識別車輛圖像;所述第一深度學習網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)包括卷積層、池化層和全連接層,所述卷積層的后面連接所述池化層,所述池化層后面連接所述全連接層,最后的全連接層上的每個輸出節(jié)點為所述車輛圖像的車輛屬性概率;
[0034]步驟103、根據(jù)所述車輛屬性概率確定所述待識別車輛圖像的車輛屬性信息。
[0035]具體實施時,可以首先獲取待識別車輛圖像,所述圖像中可以為具有一定屬性的車輛,所述屬性可以為車型、車款、年份等,例如,所述待識別車輛圖像上可以為奧迪-A4-2012這輛車。
[0036]然后利用預(yù)先訓(xùn)練得到的第一深度學習網(wǎng)絡(luò)識別所述待識別車輛圖像。其中,深度學習(deep learning)屬于神經(jīng)網(wǎng)絡(luò)的一種,近年來在計算機視覺、語音識別等領(lǐng)域有較多應(yīng)用,它是一種解決訓(xùn)練問題的深層神經(jīng)網(wǎng)絡(luò),可以通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。
[0037]本申請實施例中的第一深度學習網(wǎng)絡(luò)可以包括卷積層、池化層和全連接層這三個層次,其中:
[0038]卷積層(Convolut1n),通過卷積運算使得原信號特征增強并降低噪音,具體的卷積計算可以采用現(xiàn)有技術(shù)實現(xiàn);
[0039]池化層(Pooling),利用圖像局部性原理通過抽樣的方法減少很多特征,可以包括最大池化、均值池化、隨機池化等方式,具體實現(xiàn)可以采用現(xiàn)有技術(shù);
[0040]全連接層(Full Connected),全連接層的每個神經(jīng)元都與下一層的每個神經(jīng)元相連,像傳統(tǒng)的多層感知器(MLP,Mult1-layer perceptron)神經(jīng)網(wǎng)絡(luò)一樣,執(zhí)行正常分類。
[0041]將所述待識別車輛圖像作為輸入,從輸入層到卷積層通過卷積操作,卷積層的每個神經(jīng)元可以與輸入層中一定尺寸的局部感受野相連,通過卷積后獲得了所述待識別車輛圖像的特征(features);從卷積層到池化層的過程可以稱為池化過程,目的在于減少上一層的特征數(shù)量;經(jīng)過卷積層和池化層之后得到的特征會由全連接層進行分類,經(jīng)過全連接層的計算處理,最終輸出結(jié)果。
[0042]所述全連接層上的每個輸出節(jié)點為所述車輛圖像的車輛屬性概率,即每個輸出節(jié)點上輸出的是該車輛屬于某個屬性的概率,例如:第一個輸出節(jié)點為該車輛屬于奧迪-A4-2012的概率、第二個輸出節(jié)點為該車輛屬于奧迪-A3-2010的概率等,最終根據(jù)車輛屬性概率確定出該車輛的屬性信息,即,根據(jù)概率確定出該車輛具體屬于哪種車型、車款、年份等,具體實施時可以將最大的車輛屬性概率確定為該車輛屬于哪種車型、車款、年份等,例如:第一個輸出節(jié)點為該車輛屬于奧迪-A4-2012的概率為90%,其他節(jié)點輸出的概率均小于90%,則可以確定該車輛為奧迪-A4-2012。
[0043]本申請實施例所提供的車輛識別方法及裝置,在獲取到待識別車輛圖像之后,無需用戶手動定義特征再進行分類,直接利用預(yù)先訓(xùn)練得到的第一深度學習網(wǎng)絡(luò)即可識別所述待識別車輛圖像,依次經(jīng)過卷積層、池化層和全連接層后得到車輛屬性概率,從而確定車輛屬性信息。由于本申請實施例所提供的方案利用的是深度學習網(wǎng)絡(luò)識別車輛,深度學習網(wǎng)絡(luò)足以刻畫和區(qū)分物體,相比現(xiàn)有的人工定義特征進行分類的方式準確性更高,使得誤報率和漏報率同時降低。
[0044]實施中,所述第一深度學習網(wǎng)絡(luò)的訓(xùn)練步驟具體可以包括:
[0045]獲取帶有標記的車輛圖像樣本;所述標記包括車輛的車身信息和車輛的屬性信息;
[0046]利用預(yù)先設(shè)置有初始參數(shù)的第一深度學習網(wǎng)絡(luò)對所述車輛圖像樣本進行分類;
[0047]根據(jù)所述第一深度學習網(wǎng)絡(luò)輸出結(jié)果與所述車輛的屬性信息之間的差異逐層反傳至所述第一深度學習網(wǎng)絡(luò),訓(xùn)練所述第一深度學習網(wǎng)絡(luò)的參數(shù)。
[0048]具體實施時,可以獲取若干車輛圖像樣本,這些樣本可以包括各類車型車款的車輛圖像,在獲取到這些車輛圖像后可以在車輛圖像上標定車輛外框,并標記這輛車的車型、車款、年份等屬性。例如:獲取近2000類車型車款的車輛圖像,將近2000類車型車款進行人工標定,在圖像中畫出標定框并給出這輛車的車型、車款、年份(如:奧迪-A4-2012),標定數(shù)據(jù)的圖像數(shù)量可以大于20萬張。
[0049]然后利用預(yù)先設(shè)置有初始參數(shù)的第一深度學習網(wǎng)絡(luò)對所述車輛圖像進行分類,所述第一深度學習網(wǎng)絡(luò)的全連接層上的每一個輸出節(jié)點對應(yīng)該圖片是相應(yīng)車輛類別的概率,這一操作過程也可以稱為sof tmax。其中,輸出的概率可以為一數(shù)組。
[0050]最終,將輸出概率與真實標記(可以為與輸出概率等長數(shù)組)進行比較,計算二者的差異。具體實施時,可以利用交叉熵損失函數(shù)cross entropy loss funct1n來度量模型輸出結(jié)果與真實值之間的差異。將該差異反逐層反傳到所述第一深度學習網(wǎng)絡(luò)中,進行模型的參數(shù)訓(xùn)練。
[0051]本申請實施例利用第一深度學習網(wǎng)絡(luò)模型不斷訓(xùn)練參數(shù),從而使得所述第一深度學習網(wǎng)絡(luò)可以精確的識別車輛,無需人工參與即可利用機器深度學習自動達到分類的目的。
[0052]實施中,所述訓(xùn)練所述深度學習網(wǎng)絡(luò)的參數(shù)具體可以為使用深度網(wǎng)絡(luò)訓(xùn)練工具c