一種基于清分機的多國紙幣序列號字符識別方法
【技術領域】
[0001] 本發(fā)明屬于自動識別技術領域,特別地設及一種基于清分機的多國紙幣序列號字 符識別方法,在模板訓練部分中設及了邏輯回歸模型。
【背景技術】
[0002] 字符模板生成是紙幣序列號字符識別的重要步驟。紙幣序列號識別首先用預訓練 的方式產生字符模板,然后通過將輸入的字符圖像與字符模板進行匹配而得到識別結果。 因此字符模板生成該個步驟對后續(xù)識別結果影響較大。
[0003] W往的字符模板生成往往是通過手工調試產生的,調試的方法是首先獲得每個字 符的統(tǒng)計矩巧
【主權項】
1. 一種基于清分機的多國紙幣序列號字符識別方法,其特征在于,該方法為:首先對 序列號圖像I進行分割,獲得多個字符的圖像,將每個字符的圖像的大小歸一化為mXn,即 歸一化后的字符圖像X e Rmx",IT…表示m行η列的實數矩陣;在此基礎上,歸一化后的字 符圖像X按以下步驟進行處理: 步驟1 :首先對此字符圖像X進行二值化處理,獲得該字符圖像X的二值化矩陣 X'e股_,然后將此二值化矩陣V轉換為二值化向量i e ITm。其中,二值化處理所使用的 閾值通過雙峰法計算得到。 步驟2 :將二值化向量i與模板集W中的各個子模板進行匹配。匹配的方法是將 二值化向量分分別與各個子模板進行點乘,并對點乘獲得乘積矩陣的各個元素求和, 得到元素總和r,若i與字符k的匹配子模板W k點乘時,元素總和r取得最大值,即
2' = 1,2,···,_,則k即為識別結果。
2. 根據權利要求1所述的方法,其特征在于,所述步驟2中的模板集W中的各個子模板 通過以下方法得到: (2. 1)輸入N個字符圖像,獲得各個圖像的二值化向量。所述二值化向量通過以下 方式得到:首先對輸入的每個字符圖像進行二值化處理,獲得該字符圖像的二值化矩陣 之,戶H·!,然后將此二值化矩陣X'』轉換為二值化向量七eE?。其中,二值 化處理所使用的閾值通過雙峰法計算得到。將這N個字符圖像的二值化向量作為訓練集X 中的元素,組成訓練集X,即1 = _丨無,毛,…,4}。 (2. 2)根據訓練集X,得到任一字符c的預匹配模板W。為:W。= argmaxl ( Θ ) 其中:
,Yj為真實標記值,為〇或1,字符 C的標記值為1,其它字符的標記值為O ;Xj為訓練集X中的第j個元素,即Z7 =七,函數
應用梯度下降法進行迭代即可求解出最優(yōu)參數W。,每次迭代中,參數Θ根據下式進行 更新直至收斂:
(3)對字符C的預匹配模板W。進行定點化操作,得到字符C的預匹配模板W /,具體方 式如下: ffcF= (ff c-min (Wc)). / (max (Wc) -min (Wc)) * (2P-1) 其中./是點除操作,P是定點化時模板w。中每個元素所需轉化成的整數位數。
【專利摘要】本發(fā)明實施例公開了一種基于清分機的多國紙幣序列號字符識別方法,對序列號圖像進行分割,獲得多個字符的圖像,將每個字符的圖像的大小歸一化,在此基礎上,對歸一化后的字符圖像x按以下步驟處理:對x進行二值化處理,獲得字符圖像的二值化矩陣x′,并將其轉換為二值化向量其中,二值化處理所使用的閾值通過雙峰法計算得到。然后通過對訓練集X訓練,產生模板集W各個子模板的結果。最后將此模板W與字符圖像進行匹配,獲得識別結果。
【IPC分類】G06K9-62
【公開號】CN104866867
【申請?zhí)枴緾N201510253055
【發(fā)明人】于慧敏, 施成燕, 李天豪
【申請人】浙江大學
【公開日】2015年8月26日
【申請日】2015年5月15日