專利名稱:一種尋找左右字符的字符切分位置評價方法
技術(shù)領(lǐng)域:
本發(fā)明屬于字符識別領(lǐng)域。字符識別分聯(lián)機(jī)和脫機(jī)兩類,聯(lián)機(jī)字符識別是對采集得到的書寫筆經(jīng)過的軌跡點進(jìn)行識別;脫機(jī)字符識別是通過掃描儀或照相的方式得到字符圖像來識別。本發(fā)明對聯(lián)機(jī)和脫機(jī)字符識別都適用。對于一串脫機(jī)字符圖像或聯(lián)機(jī)筆跡序列進(jìn)行識別時需要把這串文字中的每個字符分割出來。本發(fā)明涉及一種判斷每個可分割的位置是否應(yīng)該分開的方法,以本發(fā)明為基礎(chǔ)可以實現(xiàn)字符分割和識別系統(tǒng),該系統(tǒng)與已有的字符分割和識別系統(tǒng)有很大不同。
背景技術(shù):
目前,對于整串字符進(jìn)行識別系統(tǒng)的系統(tǒng)一般需要利用字符分割方法,有些系統(tǒng)先分割后識別,另一些系統(tǒng)把識別和分割結(jié)合在一起。先切分后識別的系統(tǒng),由于分割時不利用識別信息,分割錯誤較多,目前已比較少采用。切分和識別結(jié)合的方法,其主流的做法是先進(jìn)行過切分,即設(shè)法根據(jù)一些規(guī)則獲得所有可能的切分位置,為了盡量減少漏掉真正的切分位置的情況,通常獲取的切分位置遠(yuǎn)多于真正正確的切分位置,因此叫過切分。切分位置可以通過投影分析、連通域分析、輪廓分析等方法獲得。過切分以后,認(rèn)為所有可能切點的集合的任何一個子集都決定了一種切分結(jié)果,通過對每一種切分結(jié)果進(jìn)行評價,選取在該評價準(zhǔn)則下最優(yōu)的切分結(jié)果作為最終結(jié)果。評價準(zhǔn)則一般是計算每個切分出來的字符的大小分布、識別可信度和與利用語言模型計算出來的概率。參考lYi Lu, Machine printed character segmentation-An overview, Pattern Recognition Volume 28, Issue 1, January 1995, Pages 67-802C.-L.Liu, M. Koga, H. Fuj i sawa, Lexicon-driven segmentation and recognition of handwritten character strings for Japanese address reading,IEEE Trans. Pattern Analysis and Machine Intelligence, Volume 24,Issue 11, 2002, Pages 1425-1437這種基于全局最優(yōu)的切分識別方法的問題主要有1.計算量大,如果過切分得到的切點數(shù)是N個,則所有可能的切分結(jié)果有2的N次方種。雖然可以采用動態(tài)規(guī)劃等方法減少計算量,但有可能找不到最優(yōu)解,且計算量仍然非常大。2.評價準(zhǔn)則難以確定,現(xiàn)有的評價準(zhǔn)則都還不夠令人滿意。3.誤差擴(kuò)散,某一個局部的錯誤會影響周圍較大范圍。為了解決這些問題,可以把全局評價最優(yōu)的方法等價為對每一個可能的切分點進(jìn)行評價的問題,通過選取評價指標(biāo)比較好的切點,獲得最終的識別結(jié)果?,F(xiàn)有切分點評價方法一般在切點左右各取固定范圍的圖形,計算其形狀和位置特征,設(shè)計分類器判斷是否是正確的切分點。這些方法不能充分利用字符識別結(jié)果和字符之間的約束關(guān)系信息。
發(fā)明內(nèi)容
為了解決現(xiàn)有切分點評價方法不能充分利用字符識別和字符之間關(guān)系信息的問題,本發(fā)明提出了一種新方法。本發(fā)明在過切分后,對某個切分位置評價時,窮舉找到這個切分位置兩邊所有可能切分出來的字的位置,并根據(jù)這兩個字組合的大小、位置、間距,以及字的識別結(jié)果對切分位置進(jìn)行評價。以便找到最佳的切分位置。本發(fā)明需要利用已有字符識別器,字符識別器對輸入圖像塊或筆劃軌跡點進(jìn)行識別后得到M個候選識別結(jié)果,M的數(shù)值由字符識別器決定,一般取10。為了說明方便,我們假設(shè)待識別的文字串是橫方向書寫的。(對于豎方向書寫的情況,把左右位置關(guān)系用上下代替,本發(fā)明中的方法也可以適用。)如附圖1所示,0-9是所有預(yù)先獲得的過切分點,其中有些是正確的切分點,有些是非正確的切分點。我們需要對每個點進(jìn)行評價,以便找到其中正確的切分點。假設(shè)A是一個待評價的切分位置,A左邊的過切分位置從近到遠(yuǎn)分別是A-l、A-2、A-3. . . A-N, A右邊的過切分位置從近到遠(yuǎn)分別是A+l、A+2、A+3. . . A+N。N是一個經(jīng)驗參數(shù),相當(dāng)于一個字符內(nèi)部最多可能包含的候選切分位置數(shù),一般不會超過5。如果A是一個正確的切分位置,則A左邊必然存在一個切分位置A-x,A與A-x之間的圖像或筆劃組成一個字符L,且A右邊必然存在另一個切分位置A+y,A與A+y之間的圖像或筆劃組成另一個字符R,χ與y都是1到N之間的正整數(shù)。本發(fā)明中X,y用如下方法確定任取一個χ屬于從1到N,任取一個y屬于從1到N,得到對應(yīng)的左字符候選L和右字符候選R,并利用字符識別器分別對L、R進(jìn)行識別,識別結(jié)果分別為CL和CR,CL和CR 都是有M個候選字的集合。本發(fā)明需要設(shè)計一個對(L,R,CL, CR)是一組正確切分識別結(jié)果的評價公式,公式的形式可以有不同,根據(jù)使用的分類器的特性以及識別的語言不同特點來設(shè)計,設(shè)計原則是使正確的結(jié)果評價分?jǐn)?shù)高。利用該評價公式對每一個不同的X與y產(chǎn)生的(L,R,CL,CR) 組合進(jìn)行評價,取其中最高的評價分?jǐn)?shù)作為切分位置A的評價分?jǐn)?shù),該分?jǐn)?shù)與左右兩個切分位置A-x及A+y —起作為切點A的評價信息。評價公式通常需要利用相鄰兩個字符之間大小、距離和位置關(guān)系的一致性約束關(guān)系,識別器給出的可信度信息,以及左右兩個字符在二元語言模型中的轉(zhuǎn)移概率。字符之間大小一致性約束關(guān)系是指左右兩個字的大、小、瘦長或扁平情況,在形狀上能夠通過與另一個字的對比體現(xiàn)出來,例如漢字里“一”與其它字比扁平;排列的一致性是指左右字符之間的位置排列有一定關(guān)系,如有些字或標(biāo)點符號偏上排列,有些居中排列, 有些偏下排列。對于能夠輸出M個候選字的識別器,L的候選識別結(jié)果為CLpCLy. . . CLm, CL分別取其中的任意一個,R的候選識別結(jié)果為CRpCI^... CI M,CR分別取其中的任意一個。對每一組可選的CL與CR,分別用上文同樣的公式對(L,R,CL,CR)進(jìn)行評價,取分?jǐn)?shù)最高的作為 X,y組合的評價。對每個切分位置的評價可以保留最優(yōu)、次優(yōu)、第三優(yōu)等多個組合。本發(fā)明的優(yōu)點有
a.形式簡潔。b.具有通用性,對于印刷、手寫、聯(lián)機(jī)、脫機(jī)字符的切分問題都適用,對于多種語言都適用。c.有效利用了字符之間的大小、排列一致性信息。d.有效利用了字符識別器給出的信息。e.能夠利用語言模型的信息。f.能夠確定每個切分位置的左右切分位置,為字符切分算法提供更多信息。
圖1 一組候選切分點的例子
具體實施例方式以一串印刷體字符為例,說明利用本發(fā)明實現(xiàn)的一個完整的字符切分識別方法。1)獲取候選過切分點根據(jù)輸入行圖像的豎直投影值確定候選切分點的位置。候選切分點分為兩類第一類是豎直投影值為零的點;第二類是豎直投影值的局部極小值點。如圖1的圖像,得到候選切分點0-9。2)切分結(jié)果的評價公式大小一致性評價用已知CL與CR條件下,左右兩字寬度比的出現(xiàn)概率Pa, CE(ffL/ Wk)、左右兩字高度比的出現(xiàn)概率Pa,oiOVU)來描述,概率分布函數(shù)可以預(yù)先統(tǒng)計得到。位置關(guān)系一致性評價用已知CL與CR條件下,左右字符上邊高
度差出現(xiàn)概率屯
權(quán)利要求
1.一種尋找左右字符的字符切分位置評價方法,其輸入為一串印刷體、脫機(jī)手寫或聯(lián)機(jī)手寫字符以及字符間所有可能的切分位置,輸出為每一個切分位置正確性的評價,屬于字符識別領(lǐng)域,其特征在于為每個切分位置尋找該位置兩邊的另外兩個切分位置,待評價的切分位置與其每邊的切分位置之間的筆畫分別構(gòu)成了兩個可能的字符,通過對每種可能的雙字符組合評分,并選取最好的評分作為給切分點的評價。
2.如權(quán)利說明書1所述的位置評價方法,其特征在于評分方法是針對這兩個可能的字符風(fēng)格的一致程度和對這兩個字符識別得到的可信程度,用來評價這3個位置構(gòu)成的切分組合的好壞。
3.如權(quán)利說明書2所述的風(fēng)格一致程度的評分,其特征在于兩個可能字符的大小、排列位置關(guān)系出現(xiàn)的概率越大則評分越高。
全文摘要
一種尋找左右字符的字符切分位置評價方法屬于字符識別領(lǐng)域。其解決整串字符識別過程中如何確定正確的字符之間切分位置的問題,可以通用于印刷體、脫機(jī)手寫、聯(lián)機(jī)手寫字符識別領(lǐng)域。其主要技術(shù)特征在于對某個切分位置評價時,窮舉找到這個切分位置兩邊所有可能切分出來的字的位置,并根據(jù)這兩個字組合的大小、位置、間距關(guān)系,以及字的識別結(jié)果對切分位置進(jìn)行評價,選取評價結(jié)果最優(yōu)的組合作為對該切分位置的評價。
文檔編號G06K9/00GK102254157SQ20111018867
公開日2011年11月23日 申請日期2011年7月7日 優(yōu)先權(quán)日2011年7月7日
發(fā)明者丁曉青, 劉長松, 彭良瑞, 王琳婉, 陳彥 申請人:北京文通圖像識別技術(shù)研究中心有限公司