一種鈔票冠字號識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及鈔票識別技術(shù)領(lǐng)域,尤其涉及一種鈔票冠字號識別方法。
【背景技術(shù)】
[0002] 隨著光學(xué)字符識別技術(shù)在人類生產(chǎn)、生活中廣泛應(yīng)用,鈔票冠字號識別已經(jīng)成為 金融領(lǐng)域一種防止經(jīng)濟犯罪的重要手段,光學(xué)字符自動識別技術(shù)越來越受到研究者的關(guān) 注。
[0003] 鈔票冠字號一般由數(shù)字0~9以及字母A~Z組合而成。以目前人民幣冠字號序 列規(guī)則來說,第1位為字母,第2、3、4位為數(shù)字或字母,第5到10位為數(shù)字。
[0004] 在字符識別處理中,字符特征提取是非常重要的步驟之一,特別是在鈔票識別領(lǐng) 域中相似字符(〇和〇, 1和I等)的特征相似度極高。然而基于傳統(tǒng)的局部結(jié)構(gòu)特征或全 局的統(tǒng)計特征,都不能很好的解決相似字符的問題,因此本領(lǐng)域技術(shù)人員亟需尋找一種可 識別相似字符的鈔票冠字號識別方法。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明實施例提供了一種鈔票冠字號識別方法,能夠解決現(xiàn)有字符識別處理無法 很好地識別相似字符的問題。
[0006] 本發(fā)明實施例提供的一種鈔票冠字號識別方法,包括:
[0007] 獲取鈔票的冠字號圖像;
[0008] 對所述冠字號圖像進行字符切割處理,得到多個字符圖像;
[0009] 將所有所述字符圖像縮放成預(yù)設(shè)的同一尺寸;
[0010] 提取所述字符圖像的特征向量;
[0011] 根據(jù)所述特征向量和預(yù)先訓(xùn)練的分類器模型對所述字符圖像進行字符識別,得到 初步識別結(jié)果;
[0012] 判斷所述初步識別結(jié)果是否落入預(yù)設(shè)的相似字符組中,若是,則對所述字符圖像 進行二次識別,若否,則輸出所述初步識別結(jié)果;
[0013] 所述對所述字符圖像進行二次識別具體包括以下步驟:
[0014] 根據(jù)所述初步識別結(jié)果獲取所述字符圖像的預(yù)設(shè)特定區(qū)域;
[0015] 根據(jù)所述初步識別結(jié)果獲取所述字符圖像的預(yù)設(shè)筆畫模板;
[0016] 通過所述筆畫模板在所述特定區(qū)域內(nèi)進行滑動匹配,將匹配成功的所述字符圖像 的像素數(shù)最大值作為最大匹配值;
[0017] 根據(jù)所述最大匹配值和預(yù)設(shè)的閾值得到所述字符圖像在所述相似字符組中的識 別結(jié)果,作為二次識別結(jié)果;
[0018] 輸出所述二次識別結(jié)果。
[0019] 可選地,通過所述筆畫模板在所述特定區(qū)域內(nèi)進行滑動匹配之前還包括:
[0020] 將所述字符圖像進行二值化處理。
[0021] 可選地,所述筆畫模板包括:筆畫橫、筆畫豎以及筆畫點。
[0022] 可選地,與所述初步識別結(jié)果對應(yīng)的所述相似字符組包括第一相似字符和第二相 似字符;
[0023] 所述根據(jù)所述最大匹配值和預(yù)設(shè)的閾值得到所述字符圖像在所述相似字符組中 的識別結(jié)果具體為:
[0024] 判斷所述最大匹配值是否大于或等于預(yù)設(shè)的閾值,若是,則所述字符圖像的識別 結(jié)果為第一相似字符,若否,則所述字符圖像的識別結(jié)果為第二相似字符。
[0025] 可選地,對所述冠字號圖像進行字符切割處理之前還包括:
[0026] 對所說冠字號圖像進行圖像預(yù)處理;
[0027] 所述對所說冠字號圖像進行圖像預(yù)處理具體包括:
[0028] 對所述冠字號圖像進行去噪處理;
[0029] 或,對所述冠字號圖像進行圖像糾偏處理。
[0030] 可選地,提取所述字符圖像的特征向量具體包括:
[0031] 計算所述字符圖像的梯度圖,得到梯度矩陣;
[0032] 在標(biāo)準(zhǔn)八方向分解所述梯度矩陣,得到特征矩陣;
[0033] 將所述特征矩陣與預(yù)設(shè)的權(quán)重矩陣進行卷積生成第一特征子向量;
[0034] 根據(jù)所述梯度矩陣在標(biāo)準(zhǔn)八方向上分解次數(shù)最多的方向及其最大數(shù)量,和分解值 累加最大的方向及最大累加值,生成第二特征子向量;
[0035] 將所述第一特征子向量和所述第二特征子向量合成為所述特征向量。
[0036] 可選地,所述分類器模型由SMO二分類器組成,其包括數(shù)字模型、字母模型、以及 數(shù)字和字母模型;
[0037] 所述分類器模型與所述字符圖像在鈔票冠字號上的位置存在對應(yīng)關(guān)系。
[0038] 可選地,所述鈔票為人民幣;
[0039] 所述相似字符組包括第一相似字符組0和D、第二相似字符組8和B、第三相似字 符組1和I、第四相似字符組2和Z、或者第五相似字符組0和D ;
[0040] 所述鈔票冠字號的第一位與所述字母模型對應(yīng),第五位至第十位與所述數(shù)字模型 對應(yīng),第二位至第四位與所述數(shù)字和字母模型對應(yīng)。
[0041] 可選地,所述判斷所述初步識別結(jié)果是否落入預(yù)設(shè)的相似字符組中具體為:
[0042] 判斷所述初步識別結(jié)果是否為0、D、8、B、1、1、2、Z或者0。
[0043] 可選地,將所有所述字符圖像縮放成預(yù)設(shè)的同一尺寸具體為:
[0044] 根據(jù)插值法將所有所述字符圖像縮放成同一尺寸的矩形圖像。
[0045] 從以上技術(shù)方案可以看出,本發(fā)明實施例具有以下優(yōu)點:
[0046] 本發(fā)明實施例中,首先,獲取鈔票的冠字號圖像;對所述冠字號圖像進行字符切割 處理,得到多個字符圖像;將所有所述字符圖像縮放成預(yù)設(shè)的同一尺寸;然后,提取所述字 符圖像的特征向量;根據(jù)所述特征向量和預(yù)先訓(xùn)練的分類器模型對所述字符圖像進行字符 識別,得到初步識別結(jié)果;最后,判斷所述初步識別結(jié)果是否落入預(yù)設(shè)的相似字符組中,若 是,則對所述字符圖像進行二次識別,若否,則輸出所述初步識別結(jié)果;其中,所述對所述字 符圖像進行二次識別具體包括以下步驟:根據(jù)所述初步識別結(jié)果獲取所述字符圖像的預(yù)設(shè) 特定區(qū)域;根據(jù)所述初步識別結(jié)果獲取所述字符圖像的預(yù)設(shè)筆畫模板;通過所述筆畫模板 在所述特定區(qū)域內(nèi)進行滑動匹配,將匹配成功的所述字符圖像的像素數(shù)最大值作為最大匹 配值;根據(jù)所述最大匹配值和預(yù)設(shè)的閾值得到所述字符圖像在所述相似字符組中的識別結(jié) 果,作為二次識別結(jié)果;輸出所述二次識別結(jié)果。在本發(fā)明實施例中,根據(jù)所述特征向量和 預(yù)先訓(xùn)練的分類器模型對字符圖像進行初步識別,然后對落入相似字符組的字符圖像進行 二次識別,結(jié)合了全局統(tǒng)計特征的分析和局部結(jié)構(gòu)特征分析的特點,可以識別鈔票冠字號 中的相似字符,極大提升鈔票冠字號識別的準(zhǔn)確性。
【附圖說明】
[0047] 圖1為本發(fā)明實施例中一種鈔票冠字號識別方法一個實施例流程圖;
[0048] 圖2為本發(fā)明實施例中一種鈔票冠字號識別方法另一個實施例流程圖;
[0049] 圖3為本發(fā)明實施例中一種鈔票冠字號識別方法的識別原理圖;
[0050] 圖4為本發(fā)明實施例中梯度分解示意圖;
[0051] 圖5為筆畫模板示意圖;
[0052] 圖6為本發(fā)明實施例中相似字符的模板分配區(qū)域的示意圖。
【具體實施方式】
[0053] 本發(fā)明實施例提供了一種鈔票冠字號識別方法,用于解決現(xiàn)有字符識別處理無法 很好地識別相似字符的問題。
[0054] 為使得本發(fā)明的發(fā)明目的、特征、優(yōu)點能夠更加的明顯和易懂,下面將結(jié)合本發(fā)明 實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,下面所描述 的實施例僅僅是本發(fā)明一部分實施例,而非全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域 普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其它實施例,都屬于本發(fā)明保護 的范圍。
[0055] 請參閱圖1,本發(fā)明實施例中一種鈔票冠字號識別方法一個實施例包括:
[0056] 101、獲取鈔票