本發(fā)明涉及計算機視覺技術(shù)領(lǐng)域,特別是涉及一種行駛證識別方法及裝置。
背景技術(shù):
在車險理財業(yè)務(wù)、二手車交易業(yè)務(wù)、掌上投保等應(yīng)用中,都涉及到車主行駛證信息的錄入,由于行駛證是一種沒有芯片的證件,只能通過手動錄入,如果手動去輸入車輛識別碼和發(fā)動機信息,速度非常慢,且用戶體驗差,效率低。為了提高在輸入行駛證信息的速度和準確性,OCR(Optical Character Recognition,光學(xué)字符識別)技術(shù)逐漸被應(yīng)用到行駛證信息的識別中,以滿足應(yīng)用需求,給用戶帶來更好的體驗。
但是,現(xiàn)有的行駛證識別方法是基于通用的OCR框架或者離線的OCR分類器,只利用打印字符圖像(如楷體/宋體等)或者電腦生成的字符圖像進行訓(xùn)練,得到行駛證上信息對應(yīng)的模板,再然后通過根據(jù)模板匹配對行駛證圖像進行截取獲得行駛證上信息對應(yīng)的圖像,進而根據(jù)OCR識別進行行駛證上信息的識別,如此使得只能實現(xiàn)行駛證信息的粗略定位、識別,使得識別準確率低;同時,現(xiàn)有的行駛證識別方法對圖像角度/光照等自然條件要求嚴格,使得對于自然環(huán)境下行駛證圖像的識別效果欠佳,識別準確率低。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例的目的在于提供一種行駛證識別方法及裝置,以提高行駛證的識別準確率。具體技術(shù)方案如下:
一方面,本發(fā)明實施例提供了一種行駛證識別方法,包括:
接收、并預(yù)處理行駛證圖像;
確定所述行駛證圖像上印章區(qū)域的位置;
根據(jù)印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系,以及所述印章區(qū)域的位置,粗定位行駛證雙碼區(qū)域,其中,所述行駛證雙碼區(qū)域包括車輛識別代號和發(fā)動機號碼;
通過灰度投影、以及字符的像素點灰度值與背景的對比度,細定位經(jīng)過粗定位的行駛證雙碼區(qū)域,其中,細定位經(jīng)過粗定位的行駛證雙碼區(qū)域包括:從行駛證圖像中分離出行駛證雙碼所在的字符行區(qū)域;
按照每一個單個字符所呈形狀、以及預(yù)設(shè)形狀規(guī)則,將所述字符行區(qū)域進行分割,得到分割后的單個字符圖像;
通過深度字符識別模型,對所述單個字符圖像進行識別,得到所述行駛證圖像對應(yīng)的行駛證雙碼字符串。
可選的,所述確定所述行駛證圖像上印章區(qū)域的位置,包括:
檢測所述行駛證圖像上的顯著性區(qū)域,其中,所述顯著性區(qū)域包括預(yù)設(shè)形狀且顏色突出的顯著性區(qū)域;
利用訓(xùn)練完成的支持向量機分類器,從至少一個所述顯著性區(qū)域中,篩選出分類可信度最大的區(qū)域為所述印章區(qū)域,其中,所述支持向量機分類器是根據(jù)所述行駛證圖像的顏色直方圖特征以及方向梯度直方圖特征,訓(xùn)練得到的。
可選的,所述根據(jù)印章區(qū)域與行駛證雙碼的位置關(guān)系,以及所述印章區(qū)域的位置,粗定位所述行駛證雙碼區(qū)域,包括:
從預(yù)先建立的印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系中,得到所述印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系;
根據(jù)所述位置關(guān)系以及所述印章區(qū)域的位置,粗定位所述行駛證雙碼區(qū)域。
可選的,所述通過灰度投影、以及字符的像素點灰度值與背景的對比度,細定位經(jīng)過粗定位的所述行駛證雙碼區(qū)域,包括:
對所述行駛證雙碼區(qū)域進行水平方向投影,在字符行和字符行間隔區(qū)域?qū)?yīng)的位置上,分別得到最大像素點灰度值對應(yīng)的波峰和最小像素點灰度值對應(yīng)的波谷,對所述波峰和所述波谷進行垂直方向投影,粗分離出第一字符行區(qū)域;
根據(jù)字符與背景的對比度,并利用像素點灰度值變化的極值,確定所述極值的個數(shù)超過預(yù)設(shè)個數(shù)的第一字符行區(qū)域為第二候選字符行區(qū)域;
利用訓(xùn)練完成的字符分類器,從至少一個所述第二候選字符行區(qū)域中,篩選出分類可信度最大的區(qū)域為第二字符行區(qū)域;其中,所述字符分類器包括根據(jù)圖像特征進行訓(xùn)練完成的字符分類器。
可選的,所述按照每一個單個字符所呈形狀、以及預(yù)設(shè)形狀規(guī)則,將所述字符行區(qū)域進行分割,得到分割后的單個字符圖像,包括:
按照長方形規(guī)則,將所述第二字符行區(qū)域進行分割,得到數(shù)字或者字母對應(yīng)的單個字符圖像;
按照正方形規(guī)則,將所述第二字符行區(qū)域進行分割,得到漢字對應(yīng)的單個字符圖像。
可選的,所述通過深度字符識別模型,對所述單個字符圖像進行識別,最終得到所述行駛證圖像對應(yīng)的行駛證雙碼字符串,包括:
分別對每個所述單個字符圖像,通過所述深度字符識別模型進行識別,返回每個所述單個字符圖像的識別結(jié)果以及每個所述單個字符圖像的識別結(jié)果對應(yīng)的單個概率;
根據(jù)所述單個概率,得到識別整個所述行駛證圖像的整體概率;
確定所述整體概率最大時對應(yīng)的字符串,為所述行駛證圖像對應(yīng)的行駛證雙碼字符串。
可選的,在所述通過所述深度字符識別模型進行識別,返回每個所述單個字符圖像的識別結(jié)果,之后,所述方法還包括:
檢查所述單個字符圖像的識別結(jié)果,是否符合行駛證雙碼的雙碼規(guī)則;
在所述單個字符圖像的識別結(jié)果不符合所述雙碼規(guī)則時,將所述單個字符圖像的識別結(jié)果調(diào)整為符合所述雙碼規(guī)則的結(jié)果;
在所述確定所述整體概率最大時對應(yīng)的字符串,為所述行駛證圖像對應(yīng)的行駛證雙碼字符串,之后,所述方法還包括:
檢查所述行駛證雙碼字符串的結(jié)果是否符合所述雙碼規(guī)則,在所述行駛證雙碼字符串的結(jié)果不符合所述雙碼規(guī)則時,重新識別所述行駛證雙碼字符串。
可選的,所述根據(jù)印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系,以及所述印章區(qū)域的位置,粗定位所述行駛證雙碼區(qū)域,包括:
根據(jù)所述印章區(qū)域的直線檢測的結(jié)果,確定所述行駛證圖像的擺放位置;
基于所述擺放位置,對所述行駛證圖像進行版面位置分析,得到所述印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系;
根據(jù)所述位置關(guān)系以及所述印章區(qū)域的位置,粗定位所述行駛證雙碼區(qū)域。
另一方面,本發(fā)明實施例還提供了一種行駛證識別裝置,包括:
接收處理模塊,用于接收、并預(yù)處理行駛證圖像;
確定模塊,用于確定所述行駛證圖像上印章區(qū)域的位置;
粗定位模塊,用于根據(jù)印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系,以及所述印章區(qū)域的位置,粗定位行駛證雙碼區(qū)域,其中,所述行駛證雙碼區(qū)域包括車輛識別代號和發(fā)動機號碼;
細定位模塊,用于通過灰度投影、以及字符的像素點灰度值與背景的對比度,細定位經(jīng)過粗定位的行駛證雙碼區(qū)域,其中,細定位經(jīng)過粗定位的行駛證雙碼區(qū)域包括:從行駛證圖像中分離出行駛證雙碼所在的字符行區(qū)域;
分割模塊,用于按照每一個單個字符所呈形狀、以及預(yù)設(shè)形狀規(guī)則,將所述字符行區(qū)域進行分割,得到分割后的單個字符圖像;
識別模塊,用于通過深度字符識別模型,對單個字符圖像進行識別,得到行駛證圖像對應(yīng)的行駛證雙碼字符串。
可選的,所述確定模塊包括:
檢測子模塊,用于檢測行駛證圖像上的顯著性區(qū)域,其中,顯著性區(qū)域包括預(yù)設(shè)形狀且顏色突出的顯著性區(qū)域;
篩選子模塊,用于利用訓(xùn)練完成的支持向量機分類器,從至少一個顯著性區(qū)域中,篩選出分類可信度最大的區(qū)域為印章區(qū)域,其中,支持向量機分類器是根據(jù)行駛證圖像的顏色直方圖特征以及方向梯度直方圖特征,訓(xùn)練得到的。
本發(fā)明實施例提供的一種行駛證識別方法及裝置,可以根據(jù)行駛證圖像的顏色和形狀,定位行駛證圖像上的印章區(qū)域;根據(jù)印章區(qū)域的位置,粗定位行駛證雙碼區(qū)域,通過灰度投影,細定位行駛證雙碼區(qū)域;按照字符的形狀規(guī)則,將字符行區(qū)域進行分割,得到分割后的單個字符圖像;進而通過深度字符識別模型,對各個單個字符圖像進行識別,最終得到行駛證圖像對應(yīng)的行駛證雙碼字符串。提高自然環(huán)境下行駛證的識別準確率。當然,實施本發(fā)明的任一產(chǎn)品或方法必不一定需要同時達到以上所述的所有優(yōu)點。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實施例行駛證識別方法流程圖;
圖2為本發(fā)明實施例行駛證識別裝置的結(jié)構(gòu)示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
圖1為本發(fā)明實施例行駛證識別方法流程圖,參照圖1對本發(fā)明實施行駛證識別方法進行詳細說明,包括:
步驟101:接收、并預(yù)處理行駛證圖像。
在需要對行駛證進行識別時,可以直接使用實際的行駛證圖片進行識別;同時,也可以通過圖像采集技術(shù),得到行駛證圖像,通過對行駛證圖像進行識別,完成對實際的行駛證的識別。其中,采集行駛證圖像可以通過照相機對實際的行駛證圖片拍照完成,當然,這不是采集行駛證圖像的唯一實現(xiàn)方式,本發(fā)明實施例不對圖像采集的方式進行限制,任何可以采集到行駛證圖像的方式都在本發(fā)明實施例保護范圍內(nèi)。
需要說明的是,本發(fā)明實施例中將采集的行駛證圖像和實際的行駛證圖片,統(tǒng)稱為行駛證圖像。當接收到行駛證圖像后,首先對該行駛證圖像進行預(yù)處理,其中,對行駛證圖像進行預(yù)處理包括:降除噪聲、光照歸一化以及傾斜規(guī)正等。
步驟102,確定行駛證圖像上印章區(qū)域的位置。
行駛證圖像上包括車牌號碼、車型、車輛所有人以及車輛識別代號和發(fā)動機編號等信息,同時,還包括印章。通過觀察實際的行駛證可以發(fā)現(xiàn),印章與車牌號碼、車型、所有人以及車輛識別代號和發(fā)動機編號等信息相比較,十分突出。
所以本發(fā)明實施例考慮,通過印章查找行駛證圖像上的其他信息。印章區(qū)域具有顯著的特征,比如顏色、形狀、字符紋理等。具體地可以通過印章的這些特征,從行駛證圖像上確定出印章區(qū)域的位置,進而根據(jù)印章區(qū)域的位置,確定出需要的行駛證圖像上的信息的位置,為后面行駛證的準確識別提供良好的條件。
步驟103,根據(jù)印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系,以及印章區(qū)域的位置,粗定位行駛證雙碼區(qū)域,其中,行駛證雙碼區(qū)域包括車輛識別代號和發(fā)動機號碼。
根據(jù)上面的步驟可以確定行駛證圖像上印章區(qū)域的位置,印章區(qū)域的位置確定后,根據(jù)印章區(qū)域與行駛證上其他信息的位置關(guān)系,就可以確定出對應(yīng)的其他信息的位置。
在實際的應(yīng)用過程中,車輛識別代號和發(fā)動機號碼是很重要的信息,通過車輛識別代號和發(fā)動機號碼可以唯一地定位到具體的一輛車,進而為實際生活中辦理保險、維修以及違章繳費等提供方便。同時,從實際的行駛證中可以發(fā)現(xiàn),車輛識別代號和發(fā)動機號碼的位置與印章區(qū)域的位置也更加親密,所以本發(fā)明實施例重點針對車輛識別代號和發(fā)動機號碼進行定位、識別。
需要說明的是,通過印章區(qū)域的位置定位行駛證圖像上、除行駛證雙碼區(qū)域之外的其他信息的位置的方法、與通過印章區(qū)域的位置定位行駛證圖像上行駛證雙碼區(qū)域位置的方法類似,這里就不再贅述。需要對行駛證圖像上的其他信息進行識別時,參照通過印章區(qū)域的位置定位行駛證圖像上行駛證雙碼區(qū)域的位置方法,確定其他信息的位置,進而對其他信息進行識別。
需要說明的是,在自然環(huán)境中,行駛證的擺放位置不同,對行駛證圖像上印章區(qū)域位置的定位以及根據(jù)印章區(qū)域的位置,定位行駛證雙碼區(qū)域的過程,有著很大的影響。所以,在本發(fā)明一種可選的實施方式中,通過首先對行駛證的擺放位置進行確定,根據(jù)行駛證擺放位置的不同,粗定位行駛證雙碼區(qū)域,具體地過程,包括:
首先,根據(jù)印章區(qū)域的直線檢測的結(jié)果,確定行駛證圖像的擺放位置。
然后,基于行駛證圖像的擺放位置,對行駛證圖像進行版面位置分析,得到印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系。
最后,根據(jù)印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系,以及印章區(qū)域的位置,粗定位行駛證雙碼區(qū)域。
例如,正常擺放的行駛證的印章區(qū)域,其印章區(qū)域內(nèi)的漢字從左到右逐行排列,因此容易檢測到水平方向直線。如此可根據(jù)直線檢測的結(jié)果,對行駛證擺放方向進行判斷,然后結(jié)合印章區(qū)域與整個行駛證圖像的相對位置關(guān)系,判斷出行駛證的擺放方向(如與水平方向直線的夾角為:0度、90度、180度或者270度等)。
確定行駛證圖像的擺放位置后,然后按照實際的行駛證圖像的擺放位置,找到印章區(qū)域與行駛證雙碼區(qū)域的相對關(guān)系,進而粗定位行駛證雙碼區(qū)域。如此使得,本發(fā)明實施例行駛證識別方法,不受限于自然環(huán)境下行駛證擺放位置的影響,提高自然環(huán)境下行駛證識別結(jié)果的準確率。
步驟104,通過灰度投影、以及字符的像素點灰度值與背景的對比度,細定位經(jīng)過粗定位的行駛證雙碼區(qū)域,其中,細定位經(jīng)過粗定位的行駛證雙碼區(qū)域包括:從行駛證圖像中分離出行駛證雙碼所在的字符行區(qū)域。
根據(jù)印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系,以及印章區(qū)域的位置,粗定位行駛證雙碼區(qū)域,僅是從位置上粗定位行駛證雙碼區(qū)域。為了更加準確地定位行駛證雙碼區(qū)域的位置,通過更加細節(jié)性的特征細定位行駛證雙碼區(qū)域,其中,細節(jié)性的特征可以是行駛證圖像上,行駛證雙碼區(qū)域內(nèi)像素點的灰度值、與整個行駛證圖像的背景的對比度。
另外,定位到行駛證雙碼區(qū)域的位置后,從行駛證圖像上分離出行駛證雙碼,因為,行駛證雙碼是以字符的形式存在于行駛證圖像上,所以最后得到的細定位行駛證雙碼區(qū)域的結(jié)果是,分離出行駛證雙碼所在的字符行區(qū)域。
步驟105,按照每一個單個字符所呈形狀、以及預(yù)設(shè)形狀規(guī)則,將字符行區(qū)域進行分割,得到分割后的單個字符圖像。
上述得到行駛證雙碼所在的字符行區(qū)域后,接下來就是對所有字符在一起的字符行區(qū)域進行處理,得到單獨的每個字符。因為每一個字符顯示在行駛證圖像上都呈一定的形狀,例如可以看成漢字呈正方形形狀、數(shù)字呈長方形形狀。所以在將字符行區(qū)域進行分割的過程中,可以根據(jù)每個字符所呈的形狀,將字符行區(qū)域進行分割,進而得到每一個單獨的字符圖片。
具體地,在本發(fā)明實施例的一種可選的實施例中,按照每一個單個字符所呈形狀、以及預(yù)設(shè)形狀規(guī)則,將字符行區(qū)域進行分割,得到分割后的單個字符圖像,包括:
一方面,按照長方形規(guī)則,將第二字符行區(qū)域進行分割,得到數(shù)字或者字母對應(yīng)的單個字符圖像。
另一方面,按照正方形規(guī)則,將第二字符行區(qū)域進行分割,得到漢字對應(yīng)的單個字符圖像。
具體的,可以通過預(yù)設(shè)形狀規(guī)則定義的預(yù)設(shè)形狀、與字符行區(qū)域的不同部分分別進行匹配,在結(jié)果匹配時,分割、提取出對應(yīng)的區(qū)域即為單個字符,如此重復(fù),直至分割得到所有的單個字符?;蛘呖梢允紫纫詭讉€像素值為間隔,判斷字符行區(qū)域不同部分的形狀,再然后比較得到的形狀結(jié)果是否符合預(yù)設(shè)形狀規(guī)則,如果符合,則說明該部分是正確的單個字符區(qū)域,進而將該單個字符分離出來,如此重復(fù),直至分割得到所有的單個字符。
步驟106,通過深度字符識別模型,對單個字符圖像進行識別,得到行駛證圖像對應(yīng)的行駛證雙碼字符串。
得到每一個單獨的字符圖片后,將單個字符圖片輸入到訓(xùn)練好的深度字符識別模型中應(yīng)用OCR技術(shù),即可返回識別結(jié)果。其中,深度字符識別模型通過CNN(Convolutional Neural Network,卷積神經(jīng)網(wǎng)絡(luò))進行訓(xùn)練得到,具體的通過CNN訓(xùn)練得到深度字符識別模型是現(xiàn)有技術(shù),這里就不再贅述;同時,OCR技術(shù)是行駛證識別領(lǐng)域很成熟的技術(shù),這里也不再贅述。
對單個字符圖像進行識別,得到行駛證圖像對應(yīng)的行駛證雙碼字符串,即行駛證圖像上行駛證雙碼所在的字符行區(qū)域,完成識別,得到的結(jié)果就是分離的車/輛/識/別/代/號/、發(fā)/動/機/號/碼以及后面具體的數(shù)字和字母組成的號碼。
本發(fā)明實施例行駛證識別方法,通過確定行駛證圖像上印章區(qū)域的位置,根據(jù)印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系,粗定位出行駛證雙碼區(qū)域;接著通過灰度投影、以及字符的像素點灰度值與背景的對比度,細定位經(jīng)過粗定位的行駛證雙碼區(qū)域;在定位得到行駛證雙碼區(qū)域所在的字符行區(qū)域之后,按照每一個單個字符所呈形狀、以及預(yù)設(shè)形狀規(guī)則,將字符行區(qū)域進行分割,得到分割后的單個字符圖像,最后通過深度字符識別模型,對單個字符圖像進行識別,得到行駛證圖像對應(yīng)的行駛證雙碼區(qū)域字符串,完成行駛證識別。通過本發(fā)明實施例行駛證識別方法,提高行駛證的識別準確率。
本發(fā)明的一種可選的實施例中,確定行駛證圖像上印章區(qū)域的位置,包括:
首先,檢測行駛證圖像上的顯著性區(qū)域,其中,顯著性區(qū)域包括預(yù)設(shè)形狀且顏色突出的顯著性區(qū)域。
檢測行駛證圖像上預(yù)設(shè)形狀且顏色突出的顯著性區(qū)域,其中,預(yù)設(shè)形狀可以是正方形,因為通過統(tǒng)計觀察實際的行駛證可以發(fā)現(xiàn),印章區(qū)域一般是正方形,當然,在實際的應(yīng)用過程中,預(yù)設(shè)形狀還可以是其他的形狀,只要是符合印章區(qū)域的形狀規(guī)則,都在本發(fā)明實施例的保護范圍內(nèi)。同時,實際應(yīng)用過程中的行駛證上的印章一般是區(qū)別于其他區(qū)域黑色的紅色,所以在本發(fā)明實施例的一種可選的實施方式中,顯著性區(qū)域即指正方形且紅色區(qū)域。
然后,利用訓(xùn)練完成的支持向量機分類器,從至少一個顯著性區(qū)域中,篩選出分類可信度最大的區(qū)域為印章區(qū)域,其中,支持向量機分類器是根據(jù)行駛證圖像的顏色直方圖特征以及方向梯度直方圖特征,訓(xùn)練得到的。
通過上述的檢測顯著性區(qū)域過程,可以得到多個疑似印章區(qū)域。從多個疑似印章區(qū)域中,進一步找到確定的印章區(qū)域,還需要進一步的處理。
本發(fā)明實施例中,從多個疑似印章區(qū)域中最終定位找到確定的印章區(qū)域,通過下面具體的步驟完成,包括:
第一步,提取多尺度的行駛證圖像的顏色直方圖特征以及方向梯度直方圖特征,將該顏色直方圖特征以及方向梯度直方圖特征,串聯(lián)作為圖像特征。
第二步,通過該圖像特征,訓(xùn)練svm(Support Vector Machine,支持向量機)分類器。
第三步,在印章精確定位階段,利用訓(xùn)練好的svm分類器,對所有的疑似印章區(qū)域進行篩選,選取分類可信度最大的區(qū)域,作為精確地印章區(qū)域位置。
在確定印章區(qū)域之后,根據(jù)印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系,以及印章區(qū)域的位置,粗定位行駛證雙碼區(qū)域,包括:
從預(yù)先建立的印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系中,得到印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系。
根據(jù)位置關(guān)系以及印章區(qū)域的位置,粗定位行駛證雙碼區(qū)域。
其中,印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系,即印章區(qū)域與行駛證雙碼區(qū)域的相對關(guān)系,一般情況下,印章區(qū)域與行駛證雙碼區(qū)域的相對關(guān)系是確定的,例如,印章區(qū)域后多少個像素點是行駛證雙碼區(qū)域,這都是確定的,所以印章區(qū)域的位置確定后,根據(jù)印章區(qū)域與行駛證雙碼區(qū)域的相對關(guān)系,即可得到行駛證雙碼區(qū)域的位置。
從上面的描述不難看出,通過印章區(qū)域的位置,定位行駛證雙碼區(qū)域的位置,得到的結(jié)果只是粗定位的結(jié)果。為了更加精確地定位包含行駛證雙碼區(qū)域的字符行區(qū)域,還需要更加詳細地處理過程,具體的處理過程如下。
通過灰度投影、以及字符的像素點灰度值與背景的對比度,細定位經(jīng)過粗定位的行駛證雙碼區(qū)域,包括:
首先,對行駛證雙碼區(qū)域進行水平方向投影,在字符行和字符行間隔區(qū)域?qū)?yīng)的位置上,分別得到最大像素點灰度值對應(yīng)的波峰和最小像素點灰度值對應(yīng)的波谷,對波峰和波谷進行垂直方向投影,粗分離出第一字符行區(qū)域。
字符區(qū)域存在于行駛證圖像上,往往具有明顯的紋理或者邊緣信息,對粗定位的包含行駛證雙碼區(qū)域的圖像,進行水平方向投影,在字符行和字符行間隔區(qū)域?qū)?yīng)的位置上,可以分別得到最大像素點灰度值對應(yīng)的波峰和最小像素點灰度值對應(yīng)的波谷,再然后對波峰和波谷進行垂直方向投影,即可粗略分離出字符行區(qū)域。
然后,根據(jù)字符與背景的對比度,并利用像素點灰度值變化的極值,確定極值的個數(shù)超過預(yù)設(shè)個數(shù)的區(qū)域為第二候選字符行區(qū)域。
另外,字符區(qū)域存在于行駛證圖像上,不僅僅具有明顯的紋理或者邊緣信息,而且與行駛證圖像上有很大的對比度,所以在上述的基礎(chǔ)上,還可以利用像素點灰度值變化的極值,確定極值的個數(shù)超過預(yù)設(shè)個數(shù)的區(qū)域為字符行區(qū)域。對上述的通過灰度投影得到的字符行區(qū)域結(jié)果進行進一步的精確。
最后,利用訓(xùn)練完成的字符分類器,從至少一個第二候選字符行區(qū)域中,篩選出分類可信度最大的區(qū)域為第二字符行區(qū)域;其中,字符分類器包括根據(jù)圖像特征進行訓(xùn)練完成的字符分類器。
通過對大量的行駛證進行人工標記,利用字符特征訓(xùn)練得到字符分類器,進而將上述通過灰度投影以及字符與背景的對比度,得到的字符行區(qū)域進行最終的定位。
本發(fā)明實施例行駛證識別方法的目的就是為了更加精確地對行駛證進行識別,而定位出行駛證雙碼圖片是其中的重要過程,本發(fā)明實施例通過結(jié)合灰度投影、字符與背景的對比度以及訓(xùn)練完成的字符分類器,遞進地定位行駛證雙碼區(qū)域,使得精確地定位行駛證雙碼區(qū)域,進而為最終精確地行駛證識別提供了重要的基礎(chǔ)。
細定位行駛證雙碼區(qū)域,即從行駛證圖像中分離出行駛證雙碼所在的字符行區(qū)域,接下來就需要對整個的字符行區(qū)域進行分割,得到單個字符圖像,具體的,按照每一個單個字符所呈形狀、以及預(yù)設(shè)形狀規(guī)則,將字符行區(qū)域進行分割,得到分割后的單個字符圖像,上文已經(jīng)對該內(nèi)容進行了詳細地介紹,這里就不再贅述。
將字符行區(qū)域進行分割,得到分割后的單個字符圖像,接下來需要完成的就是最后的識別過程,具體地,在本發(fā)明實施例的一種可選的實施例中,通過深度字符識別模型,對單個字符圖像進行識別,最終得到行駛證圖像對應(yīng)的行駛證雙碼字符串,包括:
第一步,分別對每個單個字符圖像,通過深度字符識別模型進行識別,返回每個單個字符圖像的識別結(jié)果以及每個單個字符圖像的識別結(jié)果對應(yīng)的單個概率。
第二步,根據(jù)單個概率,得到識別整個行駛證圖像的整體概率。
第三步,確定整體概率最大時對應(yīng)的字符串,為行駛證圖像對應(yīng)的行駛證雙碼字符串。
對通過字符行區(qū)域進行分割,得到的所有單個字符圖像,進行識別,可以得到每個單個字符圖像的識別結(jié)果;同時,在識別過程中,對具體的一個單個字符按不同的概率,可以被識別成不同的字符,所以,再返回識別結(jié)果的同時,返回將該單個字符的圖像識別為具體字符的概率。對每一個單個字符都進行同樣的處理,最后可以得到所有單個字符的識別結(jié)果、以及識別成對應(yīng)的字符的概率。
然后,將每一個單個字符識別成對應(yīng)的字符的所有概率,通過運算得到識別整個行駛證圖像的整體概率,具體的運算過程可以是簡單地將所有的單個概率相加,或者計算所有單個概率的加權(quán)和,具體的權(quán)重可以在實際的使用過程中,根據(jù)需要選取。當然,計算識別整個行駛證圖像的整體概率的運算不限于這里所說的這兩種方式,任何可以計算出識別整個行駛證圖像的整體概率的方式都是允許的。
針對每一個單個字符識別為不同的具體的字符,計算對應(yīng)的識別整個行駛證圖像的整體概率,最終確定整體概率最大時對應(yīng)的字符串,為行駛證圖像對應(yīng)的行駛證雙碼字符串,完成整個的行駛證雙碼的識別過程。
需要說明的是,在實際的識別過程中,不可避免地會出現(xiàn)識別出的字符是行駛證雙碼在實際中不可能出現(xiàn)的字符,為了使識別結(jié)果更加準確,本發(fā)明實施例還將對識別結(jié)果進行優(yōu)化。具體地優(yōu)化過程可以是在對每個單個字符識別之后,即檢查是否識別錯誤;或者也可以在整個識別過程已經(jīng)完成后,對整個的識別結(jié)果進行優(yōu)化。具體地,在通過深度字符識別模型進行識別,返回每個單個字符圖像的識別結(jié)果,之后,包括:
檢查單個字符圖像的識別結(jié)果,是否符合行駛證雙碼的雙碼規(guī)則;
在單個字符圖像的識別結(jié)果不符合雙碼規(guī)則時,將單個字符圖像的識別結(jié)果調(diào)整為符合雙碼規(guī)則的結(jié)果。
比如車輛識別號中,第一個位置代表生產(chǎn)國家或地區(qū)代碼,只能為123469wtjsklvryz其中之一,如果識別結(jié)果不是其中的字符,則說明識別結(jié)果有誤,則重新識別,對結(jié)果進行調(diào)優(yōu)。
同樣地,在確定整體概率最大時對應(yīng)的字符串,為行駛證圖像對應(yīng)的行駛證雙碼字符串,之后,包括:
檢查行駛證雙碼字符串的結(jié)果是否符合雙碼規(guī)則,在行駛證雙碼字符串的結(jié)果不符合雙碼規(guī)則時,重新識別行駛證雙碼字符串。例如,檢查得到的車輛識別號、對應(yīng)的字符串的識別結(jié)果,是否滿足具有17個字符等等,具體的行駛證雙碼規(guī)則是本領(lǐng)域技術(shù)人員熟知的技術(shù),這里就不再贅述。
本發(fā)明一種可選的實施例中,可以將本發(fā)明實施例行駛證識別方法應(yīng)用于由客戶端和后端服務(wù)器組成的系統(tǒng)中??蛻舳嘶趇os系統(tǒng)開發(fā),用戶通過客戶端選擇具體的工作模式,具體的工作模式可以包括:標準行駛證識別、旋轉(zhuǎn)行駛證識別、行駛證圖片的采集以及識別結(jié)果顯示等模式。后端服務(wù)器運行本發(fā)明實施例識別方法。如此后端服務(wù)器,針對行駛證雙碼識別場景,進行算法定制,識別精度高,識別速度快;客戶端不需要執(zhí)行具體的計算過程,只需要向后端交付任務(wù),使得客戶端輕便,復(fù)雜計算交給服務(wù)器處理,低功耗。同時,本發(fā)明實施例行駛證識別方法易于擴展,便于擴展到其他待識別條目,或者待識別證件。
另外,本發(fā)明實施例還提供了一種行駛證識別裝置,圖2為本發(fā)明實施例行駛證識別裝置的結(jié)構(gòu)示意圖,參照圖2對本發(fā)明實施例行駛證識別裝置進行詳細說明。包括:
接收處理模塊201,用于接收、并預(yù)處理行駛證圖像。
確定模塊202,用于確定行駛證圖像上印章區(qū)域的位置。
粗定位模塊203,用于根據(jù)印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系,以及印章區(qū)域的位置,粗定位行駛證雙碼區(qū)域,其中,行駛證雙碼區(qū)域包括車輛識別代號和發(fā)動機號碼。
細定位模塊204,用于通過灰度投影、以及字符的像素點灰度值與背景的對比度,細定位經(jīng)過粗定位的行駛證雙碼區(qū)域,其中,細定位經(jīng)過粗定位的行駛證雙碼區(qū)域包括:從行駛證圖像中分離出行駛證雙碼所在的字符行區(qū)域。
分割模塊205,用于按照每一個單個字符所呈形狀、以及預(yù)設(shè)形狀規(guī)則,將字符行區(qū)域進行分割,得到分割后的單個字符圖像。
識別模塊206,用于通過深度字符識別模型,對單個字符圖像進行識別,得到行駛證圖像對應(yīng)的行駛證雙碼字符串。
本發(fā)明實施例行駛證識別裝置,通過接收處理模塊201、確定模塊202、粗定位模塊203、細定位模塊204、分割模塊205以及識別模塊206,確定行駛證圖像上印章區(qū)域的位置,根據(jù)印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系,粗定位出行駛證雙碼區(qū)域;接著通過灰度投影、以及字符的像素點灰度值與背景的對比度,細定位經(jīng)過粗定位的行駛證雙碼區(qū)域;在定位得到行駛證雙碼所在的字符行區(qū)域之后,按照每一個單個字符所呈形狀、以及預(yù)設(shè)形狀規(guī)則,將字符行區(qū)域進行分割,得到分割后的單個字符圖像,最后通過深度字符識別模型,對單個字符圖像進行識別,得到行駛證圖像對應(yīng)的行駛證雙碼字符串,完成行駛證識別,通過本發(fā)明實施例行駛證識別裝置,提高行駛證的識別準確率。
在本發(fā)明實施例一種可選的實施例中,行駛證識別裝置中確定模塊202,包括:
檢測子模塊,用于檢測行駛證圖像上的顯著性區(qū)域,其中,顯著性區(qū)域包括預(yù)設(shè)形狀且顏色突出的顯著性區(qū)域。
篩選子模塊,用于利用訓(xùn)練完成的支持向量機分類器,從至少一個顯著性區(qū)域中,篩選出分類可信度最大的區(qū)域為印章區(qū)域,其中,支持向量機分類器是根據(jù)行駛證圖像的顏色直方圖特征以及方向梯度直方圖特征,訓(xùn)練得到的。
在本發(fā)明實施例一種可選的實施例中,行駛證識別裝置中粗定位模塊203,包括:
第一位置關(guān)系得到子模塊,用于從預(yù)先建立的印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系中,得到印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系。
第一粗定位子模塊,用于根據(jù)位置關(guān)系以及印章區(qū)域的位置,粗定位行駛證雙碼區(qū)域。
在本發(fā)明實施例一種可選的實施例中,行駛證識別裝置中細定位模塊204,包括:
粗分離子模塊,用于對行駛證雙碼區(qū)域進行水平方向投影,在字符行和字符行間隔區(qū)域?qū)?yīng)的位置上,分別得到最大像素點灰度值對應(yīng)的波峰和最小像素點灰度值對應(yīng)的波谷,對波峰和波谷進行垂直方向投影,粗分離出第一字符行區(qū)域。
確定字符行子模塊,用于根據(jù)字符與背景的對比度,并利用像素點灰度值變化的極值,確定極值的個數(shù)超過預(yù)設(shè)個數(shù)的第一字符行區(qū)域為第二候選字符行區(qū)域。
篩選字符行子模塊,用于利用訓(xùn)練完成的字符分類器,從至少一個第二候選字符行區(qū)域中,篩選出分類可信度最大的區(qū)域為第二字符行區(qū)域;其中,字符分類器包括根據(jù)圖像特征進行訓(xùn)練完成的字符分類器。
在本發(fā)明實施例一種可選的實施例中,行駛證識別裝置中分割模塊205,包括:
第一分割子模塊,用于按照長方形規(guī)則,將第二字符行區(qū)域進行分割,得到數(shù)字或者字母對應(yīng)的單個字符圖像。
第二分割子模塊,用于按照正方形規(guī)則,將第二字符行區(qū)域進行分割,得到漢字對應(yīng)的單個字符圖像。
在本發(fā)明實施例一種可選的實施例中,行駛證識別裝置中識別模塊206,包括:
單個結(jié)果返回子模塊,用于分別對每個單個字符圖像,通過深度字符識別模型進行識別,返回每個單個字符圖像的識別結(jié)果以及每個單個字符圖像的識別結(jié)果對應(yīng)的單個概率。
整體概率計算子模塊,用于根據(jù)單個概率,得到識別整個行駛證圖像的整體概率。
結(jié)果確定子模塊,用于確定整體概率最大時對應(yīng)的字符串,為行駛證圖像對應(yīng)的行駛證雙碼字符串。
在本發(fā)明實施例一種可選的實施例中,行駛證識別裝置還包括:
檢查模塊,用于檢查單個字符圖像的識別結(jié)果,是否符合行駛證雙碼的雙碼規(guī)則。
第一調(diào)整模塊,用于在單個字符圖像的識別結(jié)果不符合雙碼規(guī)則時,將單個字符圖像的識別結(jié)果調(diào)整為符合雙碼規(guī)則的結(jié)果。
第二調(diào)整模塊,用于檢查行駛證雙碼字符串的結(jié)果是否符合雙碼規(guī)則,在行駛證雙碼字符串的結(jié)果不符合雙碼規(guī)則時,重新識別行駛證雙碼字符串。
在本發(fā)明實施例一種可選的實施例中,行駛證識別裝置中粗定位模塊203,還包括:
擺放位置確定子模塊,用于根據(jù)印章區(qū)域的直線檢測的結(jié)果,確定行駛證圖像的擺放位置。
第二位置關(guān)系得到子模塊,用于基于擺放位置,對行駛證圖像進行版面位置分析,得到印章區(qū)域與行駛證雙碼區(qū)域的位置關(guān)系。
第二粗定位子模塊,用于根據(jù)位置關(guān)系以及印章區(qū)域的位置,粗定位行駛證雙碼區(qū)域。
需要說明的是,本發(fā)明實施例的裝置是應(yīng)用上述行駛證識別方法的裝置,則上述行駛證識別方法的所有實施例均適用于該裝置,且均能達到相同或相似的有益效果。
需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
本說明書中的各個實施例均采用相關(guān)的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于系統(tǒng)實施例而言,由于其基本相似于方法實施例,所以描述的比較簡單,相關(guān)之處參見方法實施例的部分說明即可。
以上所述僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進等,均包含在本發(fā)明的保護范圍內(nèi)。