專利名稱:一種基于擬合函數(shù)的文字識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明屬于模式識(shí)別、人工智能和文字信息處理領(lǐng)域,特別涉及一種基于擬合函
數(shù)的文字識(shí)別方法。
背景技術(shù):
隨著計(jì)算機(jī)技術(shù)的推廣應(yīng)用,尤其是互聯(lián)網(wǎng)的日益普及,人類越來越多地依靠計(jì) 算機(jī)獲得各種信息。大量地信息處理工作也都轉(zhuǎn)移到計(jì)算機(jī)上進(jìn)行。在日常的生活和工作 中,存在著大量的文字信息處理問題,因而將文字信息快速輸入到計(jì)算機(jī)這一要求變得非 常迫切。 現(xiàn)在一般的文字識(shí)別算法是基于對(duì)待識(shí)別圖形的點(diǎn)陣分析,對(duì)構(gòu)成文字的線條較 復(fù)雜的文字進(jìn)行識(shí)別有很大的局限性,例如對(duì)漢字有專門的漢字識(shí)別方法,對(duì)字母有專門 的字母識(shí)別方法,即使用同一類算法思想也是需要不同的程序來實(shí)現(xiàn)。尤其將多種類型符 號(hào)混在一起時(shí),大部分算法都很難識(shí)別出來。如果是手寫輸入,識(shí)別的難度就更大。
現(xiàn)有的通用文字識(shí)別算法,例如模板匹配算法, 一般用訓(xùn)練樣本特征的平均值來 描述,分類器根據(jù)輸入樣本特征與各個(gè)文字的參照特征的距離進(jìn)行識(shí)別。由于漢字存在各 種各樣字體,手寫漢字中還存在各種各樣的變形,因此文件的任何特征都存在一個(gè)分布空 間。只有把這些分布考慮進(jìn)去,才能更精確地進(jìn)行分類識(shí)別,因此只用特征平均值來描述特 征是不夠的。 貝葉斯分類算法則是采用一種用分段線性函數(shù)描述漢字特征的概率密度函數(shù)方 法,能很好的識(shí)別出漢字的特征分布,但是由于特征值的分布通常不是某種簡單的統(tǒng)計(jì)分 布,如果沒有簡單的方法描述這些概率密度函數(shù),則表示所有的漢字的各維特征的概率密 度函數(shù)需要的存儲(chǔ)空間將是實(shí)用系統(tǒng)所不能承受的。 以上這兩種方法都不能很好的將復(fù)雜圖形分類,對(duì)文字識(shí)別執(zhí)行的準(zhǔn)確率和效率 很低。
發(fā)明內(nèi)容
本發(fā)明目的是針對(duì)現(xiàn)有技術(shù)存在的缺陷,根據(jù)文字圖像的特點(diǎn),應(yīng)用擬合函數(shù)的 技術(shù)和特征,提出一種有效的基于擬合函數(shù)的文字識(shí)別方法。本發(fā)明更好的兼顧了文字識(shí) 別的準(zhǔn)確度和速度。 本發(fā)明為實(shí)現(xiàn)上述目的,采用如下技術(shù)方案 本發(fā)明是一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于包括如下步驟
(1)在聯(lián)機(jī)或者在離線的情況下讀入待識(shí)別的文字樣本; (2)文字圖像預(yù)處理首先將步驟(1)所述的待識(shí)別的文字樣本圖像二值化,然后 線條消抖,再進(jìn)行斷點(diǎn)連接,最后把文字圖像規(guī)范化; (3)分析樣本先從步驟(2)所述的規(guī)范化后的待識(shí)別的文字樣本圖像中拆分出 文字筆畫,然后將拆分出的每個(gè)筆畫歸類到筆畫集中,并以此生成可識(shí)別的符號(hào)序列;對(duì)筆畫集中的每條線段尋找特征點(diǎn),根據(jù)特征點(diǎn)集擬合多項(xiàng)式找出最佳擬合函數(shù),選取最佳擬
合函數(shù)的系數(shù)作為最佳擬合向量;用最佳擬合向量匹配筆畫寫入符號(hào)向量; (4)識(shí)別樣本首先根據(jù)步驟(3)所述的符號(hào)序列在知識(shí)庫中尋找與之匹配的多
個(gè)模板;然后提取這多個(gè)模板圖案的符號(hào)向量并與步驟(3)所述的待識(shí)別的文字樣本圖像
的符號(hào)向量進(jìn)行匹配; (5)輸出結(jié)果將與步驟(3)所述的待識(shí)別的文字樣本圖像的符號(hào)向量相似度最 高的那個(gè)模板文字圖案作為識(shí)別結(jié)果。 本發(fā)明是針對(duì)二值文字圖像的識(shí)別,二值化后的圖像能使圖像的處理速度高、成 本低,此外,由于最終是對(duì)字符串進(jìn)行匹配,使用索引提高了匹配速度,因此具有較高的執(zhí) 行效率;本發(fā)明將各種復(fù)雜的文字圖形轉(zhuǎn)化為多項(xiàng)式函數(shù)進(jìn)行描述,生成符號(hào)向量,然后通 過分析與知識(shí)庫中模板的相似度進(jìn)行文字識(shí)別,對(duì)文字識(shí)別正確率高,穩(wěn)定性好。
圖1 :本發(fā)明方法的總體框圖;
圖2 :聯(lián)機(jī)情況下筆畫拆分流程圖。
具體實(shí)施例方式
為了便于敘述本發(fā)明提供的基于擬合函數(shù)的文字識(shí)別方法,首先給出關(guān)于本方法 如下的基本定義 定義一線段(LS, Line Segment)與線段集(LSS, Line Segment Set): —段連續(xù)的,由若干個(gè)點(diǎn)構(gòu)成,可以被擬合的點(diǎn)序列稱為線段(可以為曲線段或
直線段),由線段組成的序列稱為線段集。 定義LS = ((X" Y》,(X2, Y2) , , (XNpi, YNpi) , , (XNp, YNp)) , Np為點(diǎn)的數(shù)量。 LSS = (IA, LS2, . . LSNli, . . . , LSN1) , Nl為線段的數(shù)量。 其中NPi、 Nl" Np、 Nl G Z+, XNpi、 YNpi G Z, LS G LSS, | XNp「XNpi—丄|《1,
I Ynp「Ynph |^1。 定義二特征點(diǎn)(LX, Line Character points)與特征點(diǎn)集(LXS, Line Character pointsSet): 對(duì)于一條由Np個(gè)點(diǎn)構(gòu)成的線段LS,選取其中Ncp個(gè)點(diǎn)進(jìn)行擬合,每個(gè)被選取的點(diǎn) 稱為線段LS的特征點(diǎn),由這Ncp個(gè)特征點(diǎn)組成的序列稱為特征點(diǎn)集。
定義LC G LS。 LCS = {LQ, LC2, , LCNcpi, , LCNcp} , Ncp為特征點(diǎn)的數(shù)量。 其中LCNcpi G LS,O《NcPi《Ncp《Np。 定義三最佳擬合函數(shù)(BFF, Best-Fitting Function): 利用一條線段LS的一個(gè)特征點(diǎn)集LCS對(duì)線段進(jìn)行擬合得到的p階多項(xiàng)式Y(jié)(X)或 X(Y)稱為這條線段的擬合函數(shù),其中最優(yōu)的擬合函數(shù)稱為最佳擬合函數(shù)。
定義:BFF (X) = Ap*Xp+Ap—、 Aj*XJ+. +A。*X°, Flag標(biāo)志位0。
BFF (Y) = Ap*Yn+Ap—^Y『、..Aj*Xj+. . . +A。*Y0, Flag標(biāo)志位1. 其中A,. e R, j、p e Z+。
(1)在聯(lián)機(jī)或者在離線的情況下讀入待識(shí)別的文字樣本; (2)文字圖像預(yù)處理首先將步驟(1)所述的待識(shí)別的文字樣本圖像二值化,然后 線條消抖,再進(jìn)行斷點(diǎn)連接,最后把文字圖像規(guī)范化; (3)分析樣本先從步驟(2)所述的規(guī)范化后的待識(shí)別的文字樣本圖像中拆分出
文字筆畫,然后將拆分出的每個(gè)筆畫歸類到筆畫集中,并以此生成可識(shí)別的符號(hào)序列;對(duì)筆
畫集中的每條線段尋找特征點(diǎn),根據(jù)特征點(diǎn)集擬合多項(xiàng)式找出最佳擬合函數(shù),選取最佳擬
合函數(shù)的系數(shù)作為最佳擬合向量;用最佳擬合向量匹配筆畫寫入符號(hào)向量; (4)識(shí)別樣本首先根據(jù)步驟(3)所述的符號(hào)序列在知識(shí)庫中尋找與之匹配的多
個(gè)模板;然后提取這多個(gè)模板圖案的符號(hào)向量并與步驟(3)所述的待識(shí)別的文字樣本圖像
的符號(hào)向量進(jìn)行匹配; (5)輸出結(jié)果將與步驟(3)所述的待識(shí)別的文字樣本圖像的符號(hào)向量相似度最 高的那個(gè)模板文字圖案作為識(shí)別結(jié)果。 所述的一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于步驟(5)輸出結(jié)果后,將 步驟(3)所述的待識(shí)別的文字樣本圖像存為模板。 所述的一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于步驟(2)所述的二值化方 法如下 首先取1\ = 70作為第一次選用的閾值,對(duì)步驟(1)所述的待識(shí)別的文字樣本圖像 進(jìn)行整體閾值二值化,區(qū)分待識(shí)別的文字樣本圖像的背景和圖像;再分別求出對(duì)應(yīng)閾值1\ 的待識(shí)別的文字樣本圖像的圖像和背景的灰度平均值Fa和Ba,定出二次選用的閾值為 T2 = ^~(Fa + B a ) 最后再用二次選用的閾值T2對(duì)原圖進(jìn)行整體閾值二值化。 所述的一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于步驟(2)所述的線條消抖 方法如下 在二值化后的待識(shí)別的文字樣本圖像中的文字筆跡中隨機(jī)抽取占總數(shù)據(jù)點(diǎn)50% 的點(diǎn),用直線連接最近的點(diǎn)并且距離不超過3個(gè)像素點(diǎn)的相鄰點(diǎn)。 所述的一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于步驟(2)所述的文字?jǐn)帱c(diǎn) 連接方法如下 在線條消抖后的待識(shí)別的文字樣本圖像中的文字筆跡中隨機(jī)抽取占總數(shù)據(jù)點(diǎn) 60%的點(diǎn),用直線連接最近的點(diǎn)并且距離不超過3個(gè)像素點(diǎn)的相鄰點(diǎn)。 如圖2所示。所述的一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于步驟(3)所 述的拆分文字筆畫的方法如下
聯(lián)機(jī)情況 ①初始化兩個(gè)覆蓋表CovX和CovY,分別用于記錄X軸和Y軸的被覆蓋情況,并將 所有項(xiàng)置為False,表示兩個(gè)覆蓋表CovX和CovY都未被覆蓋;初始化一個(gè)數(shù)組LS,用來存儲(chǔ)拆分出來的線段,Nlj二O; ②建立兩個(gè)空隊(duì)列QueueX和QueueY,分別用于壓入按Y(X)方式記錄和按X(Y)方 式記錄的點(diǎn)序列; ③每當(dāng)獲取一個(gè)點(diǎn)(Xi, Y》時(shí),分別判斷在兩個(gè)覆蓋表CovX和CovY的&位置和Yt 位置是否為False :若CovX的&位置為False,則將(&, Y》壓入隊(duì)列QueueX并在覆蓋表 CovX的Xi位置寫入True ;若覆蓋表CovY的Yt位置為False則將",Y》壓入隊(duì)列QueueY 并在覆蓋表CovY的Yi位置寫入True ;直到遇到兩個(gè)覆蓋表CovX和CovY表中的一個(gè)Cov 表突即對(duì)應(yīng)位置為True的Xi或Yt位置已經(jīng)為True,則進(jìn)入步驟④;當(dāng)點(diǎn)全部處理完,則進(jìn) 入步驟⑤; ④如果有一個(gè)Cov表沖突,則將對(duì)應(yīng)的隊(duì)列Queue中的元素全部出隊(duì)列清空并且 將Cov表復(fù)位;另一個(gè)Cov表繼續(xù)進(jìn)行步驟③中的操作,直到也出現(xiàn)沖突,則將對(duì)應(yīng)隊(duì)列 Queue全部出隊(duì)列到線段LS[Nlj] , Nlj = Nlj+1,清空Cov表; ⑤如果是一條文字筆畫線畫完,則進(jìn)入步驟①拆分下一條文字筆畫;如果沒有點(diǎn)
可以獲取了,則結(jié)束; 離線情況 A.按照從左向右,從上到下的掃描方法,只要掃描到一個(gè)點(diǎn),就用這個(gè)點(diǎn)用種子填
充法的方法擴(kuò)散,把能連通的線段全部連通,然后用聯(lián)機(jī)識(shí)別的方法生成LS,轉(zhuǎn)步驟(B); B.每取走一條線段,判斷這條線段是否與其他線段交叉,如果不交叉則從圖中刪
掉這條線段,如有交叉則補(bǔ)上交叉點(diǎn),轉(zhuǎn)步驟(A),直到圖中沒有點(diǎn)了為止。 其中點(diǎn)(Xi, Y》表示構(gòu)成一條文字筆畫的第i點(diǎn),i G Z+,0《i《Np, Np為一條
文字筆畫的點(diǎn)數(shù)。 所述的一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于步驟(3)所述的特征點(diǎn)選 取方法如下 線段的起點(diǎn)(&, Y》和終點(diǎn)(XNp, YNp)應(yīng)當(dāng)被選取,其余的點(diǎn)應(yīng)當(dāng)以一定規(guī)則從線 段的各個(gè)部分取,本發(fā)明每隔5個(gè)點(diǎn)取一個(gè)特征點(diǎn),保證特征點(diǎn)能較好的描述原線段的輪廓。 所述的一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于步驟(3)所述的確定最佳 擬合向量的方法如下 確定最佳擬合函數(shù)中階數(shù)p和系數(shù)Aj, j = 1,2...p,然后選取最佳擬合函數(shù)的系
數(shù)最為最佳擬合向量; 最佳擬合函數(shù)中階數(shù)p通過以下方式獲得p從1開始擬合,求出擬合相似度R2, 每當(dāng)P+l可以使擬合相似度R2增加一個(gè)閾值a = 5%,則取p+1為當(dāng)前的p,再次進(jìn)行判 斷,直到P+1階擬合不能使擬合相似度R2增加a為止; 最佳擬合函數(shù)中各系數(shù)Aj通過以下方式獲得對(duì)于系數(shù)Aj,如果Aj的絕對(duì)值小于 一個(gè)閾值P = 1E-3,那么測(cè)試去掉A,XJ'項(xiàng)后,擬合相似度R2會(huì)不會(huì)減小一個(gè)閾值Y = 5%,如果不會(huì)減小Y那么多,就去掉A,XJ'項(xiàng)即把Aj賦值為O。 所述的一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于步驟(4)所述的尋找相似 度最高的模板作為識(shí)別結(jié)果的方法如下 (a)根據(jù)圖形拆分出的各個(gè)最佳擬合向量,在知識(shí)庫的筆畫集里查找最匹配的筆畫,生成符號(hào)向量; (b)利用符號(hào)向量在知識(shí)庫的符號(hào)集里查找最匹配的符號(hào),如果筆畫是有序的那 么在查找過程中筆畫和順序都要匹配;如果筆畫無序那么按照筆畫的數(shù)量和類型進(jìn)行查 找,不考慮順序能否匹配; (c)如果在筆畫有序和無序的情況下既不能找到筆畫數(shù)相同的也不能找到所用筆 畫完全相同的,則用最接近匹配原則,找最接近的符號(hào)對(duì)于筆畫有序的字符向量,則取各 個(gè)位按順序能匹配到正確筆畫數(shù)量最多的字符;如果筆畫無序的,則取所有筆畫中能匹配 到所用筆畫最多的字符,然后根據(jù)需要,可以取出字符向量的圖像,用圖像進(jìn)行對(duì)比確認(rèn)結(jié) 果。
0100] 本發(fā)明算法的執(zhí)行過程為
0101] SI. KB = CreatKB ()或LoadKB (KB);〃建立知識(shí)庫或載入知識(shí)庫 0102] S2. SV. Pic = ReadSV();〃讀入樣本 0103] S3. AnalysisSV(SV) 〃分析樣本 0104] Begin
0105]LSS = GetLSS(SV. Pic);〃將圖像拆分成筆畫集 0106]For k:= 1 To LSS.size()Do 0107] Begin 〃生成特征點(diǎn)集合
0108] LCS = GetLCS(LSS[k]);〃生成最佳擬合向量寫入符號(hào)向量
0109] SV. SKV[k].BFV. add(GetBFV(LCS));〃用最佳擬合向量匹配筆畫
0110] SV. SKV[k] = MatchingSK(SV. SKV[k]. BFV);
O川] End
0112]return SUCCESS ; 0113] End
0114] S4. SVS = MatchingTP(SV);〃匹配模板 0115] S5. Begin 〃按向量匹配得若干個(gè)符號(hào)向量 0116] SVS = MatchingSV(SV. SKV);
0117] 〃如果需要,比較樣本的圖像和每個(gè)可能的符號(hào)的圖像進(jìn)行匹配
0118] SVS = MatchingPIC (SV. Pic);
0119] If (用戶需要更新知識(shí)庫)
0120] Then
0121] StoreKB(SV);
0122] return SVS ;
0123] End
0124] Write (SVS[O]);〃輸出最匹配的結(jié)果
權(quán)利要求
一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于包括如下步驟(1)在聯(lián)機(jī)或者在離線的情況下讀入待識(shí)別的文字樣本;(2)文字圖像預(yù)處理首先將步驟(1)所述的待識(shí)別的文字樣本圖像二值化,然后線條消抖,再進(jìn)行斷點(diǎn)連接,最后把文字圖像規(guī)范化;(3)分析樣本先從步驟(2)所述的規(guī)范化后的待識(shí)別的文字樣本圖像中拆分出文字筆畫,然后將拆分出的每個(gè)筆畫歸類到筆畫集中,并以此生成可識(shí)別的符號(hào)序列;對(duì)筆畫集中的每條線段尋找特征點(diǎn),根據(jù)特征點(diǎn)集擬合多項(xiàng)式找出最佳擬合函數(shù),選取最佳擬合函數(shù)的系數(shù)作為最佳擬合向量;用最佳擬合向量匹配筆畫寫入符號(hào)向量;(4)識(shí)別樣本首先根據(jù)步驟(3)所述的符號(hào)序列在知識(shí)庫中尋找與之匹配的多個(gè)模板;然后提取這多個(gè)模板圖案的符號(hào)向量并與步驟(3)所述的待識(shí)別的文字樣本圖像的符號(hào)向量進(jìn)行匹配;(5)輸出結(jié)果將與步驟(3)所述的待識(shí)別的文字樣本圖像的符號(hào)向量相似度最高的那個(gè)模板文字圖案作為識(shí)別結(jié)果。
2. 根據(jù)權(quán)利要求l所述的一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于步驟(5)輸 出結(jié)果后,將步驟(3)所述的待識(shí)別的文字樣本圖像存為模板。
3. 根據(jù)權(quán)利要求l所述的一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于步驟(2)所 述的二值化方法如下首先取1\ = 70作為第一次選用的閾值,對(duì)步驟(1)所述的待識(shí)別的文字樣本圖像進(jìn) 行整體閾值二值化,區(qū)分待識(shí)別的文字樣本圖像的背景和圖像;再分別求出對(duì)應(yīng)閾值1\的 待識(shí)別的文字樣本圖像的圖像和背景的灰度平均值Fa和Ba,定出二次選用的閾值為T2 == ^(Fa + B a )最后再用二次選用的閾值T2對(duì)原圖進(jìn)行整體閾值二值化。
4. 根據(jù)權(quán)利要求l所述的一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于步驟(2)所 述的線條消抖方法如下在二值化后的待識(shí)別的文字樣本圖像中的文字筆跡中隨機(jī)抽取占總數(shù)據(jù)點(diǎn)50%的點(diǎn), 用直線連接最近的點(diǎn)并且距離不超過3個(gè)像素點(diǎn)的相鄰點(diǎn)。
5. 根據(jù)權(quán)利要求l所述的一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于步驟(2)所 述的文字?jǐn)帱c(diǎn)連接方法如下在線條消抖后的待識(shí)別的文字樣本圖像中的文字筆跡中隨機(jī)抽取占總數(shù)據(jù)點(diǎn)60%的 點(diǎn),用直線連接最近的點(diǎn)并且距離不超過3個(gè)像素點(diǎn)的相鄰點(diǎn)。
6. 根據(jù)權(quán)利要求l所述的一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于步驟(3)所 述的拆分文字筆畫的方法如下聯(lián)機(jī)情況① 初始化兩個(gè)覆蓋表CovX和CovY,分別用于記錄X軸和Y軸的被覆蓋情況,并將所有 項(xiàng)置為False,表示兩個(gè)覆蓋表CovX和CovY都未被覆蓋;初始化一個(gè)數(shù)組LS [Nlj],用來存儲(chǔ)拆分出來的線段,Nlj二O;② 建立兩個(gè)空隊(duì)列QueueX和QueueY,分別用于壓入按Y(X)方式記錄和按X(Y)方式記 錄的點(diǎn)序列;每當(dāng)獲取一個(gè)點(diǎn)(Xi,Yi)時(shí),分別判斷在兩個(gè)覆蓋表CovX和CovY的Xi位置和Yi位置 是否為False :若CovX的Xt位置為False,則將(Xi,Y》壓入隊(duì)列QueueX并在覆蓋表CovX 的&位置寫入True ;若覆蓋表CovY的^位置為False則將(&, Y》壓入隊(duì)列QueueY并在 覆蓋表CovY的Yi位置寫入True ;直到遇到兩個(gè)覆蓋表CovX和CovY表中的一個(gè)Cov表突 即對(duì)應(yīng)位置為True的Xi或Yt位置已經(jīng)為True,則進(jìn)入步驟④;當(dāng)點(diǎn)全部處理完,則進(jìn)入步 驟⑤;④ 如果有一個(gè)Cov表沖突,則將對(duì)應(yīng)的隊(duì)列Queue中的元素全部出隊(duì)列清空并且將Cov 表復(fù)位;另一個(gè)Cov表繼續(xù)進(jìn)行步驟③中的操作,直到也出現(xiàn)沖突,則將對(duì)應(yīng)隊(duì)列Queue全 部出隊(duì)列到線段LS[Nlj] , Nlj — Nlj+1,清空Cov表,其中一表示賦值;⑤ 如果是一條文字筆畫線畫完,則進(jìn)入步驟①拆分下一條文字筆畫;如果沒有點(diǎn)可以 獲取了,則結(jié)束;離線情況A. 按照從左向右,從上到下的掃描方法,只要掃描到一個(gè)點(diǎn),就用這個(gè)點(diǎn)用種子填充法 的方法擴(kuò)散,把能連通的線段全部連通,然后用聯(lián)機(jī)識(shí)別的方法生成LS,轉(zhuǎn)步驟B ;B. 每取走一條線段,判斷這條線段是否與其他線段交叉,如果不交叉則從圖中刪掉這 條線段,如有交叉則補(bǔ)上交叉點(diǎn),轉(zhuǎn)步驟A,直到圖中沒有點(diǎn)了為止;其中點(diǎn)(I Y》表示構(gòu)成一條文字筆畫的第i點(diǎn),i G Z+即正整數(shù),O《i《Np, Np為 一條文字筆畫的點(diǎn)數(shù)。
7. 根據(jù)權(quán)利要求l所述的一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于步驟(3)所 述的特征點(diǎn)選取方法如下線段的起點(diǎn)(&, Y》和終點(diǎn)(XNP, YNP)應(yīng)當(dāng)被選取,其余的點(diǎn)應(yīng)當(dāng)以一定規(guī)則從線段的 各個(gè)部分取,本發(fā)明每隔5個(gè)點(diǎn)取一個(gè)特征點(diǎn),保證特征點(diǎn)能較好的描述原線段的輪廓。
8. 根據(jù)權(quán)利要求l所述的一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于步驟(3)所 述的確定最佳擬合向量的方法如下確定最佳擬合函數(shù)中階數(shù)P和系數(shù)Aj, j = 1,2...p,然后選取最佳擬合函數(shù)的系數(shù)最 為最佳擬合向量;最佳擬合函數(shù)中階數(shù)P通過以下方式獲得P從1開始擬合,求出擬合相似度R2,每當(dāng) P+1可以使擬合相似度R2增加一個(gè)閾值a = 5X,則取p+l為當(dāng)前的p,再次進(jìn)行判斷,直 到P+l階擬合不能使擬合相似度R2增加a為止;最佳擬合函數(shù)中各系數(shù)Aj通過以下方式獲得對(duì)于系數(shù)Aj,如果Aj的絕對(duì)值小于一個(gè) 閾值13 = lE-3,那么測(cè)試去掉A,XJ'項(xiàng)后,擬合相似度f會(huì)不會(huì)減小一個(gè)閾值Y = 5%, 如果不會(huì)減小Y那么多,就去掉A,XJ'項(xiàng)即把Aj賦值為O。
9. 根據(jù)權(quán)利要求l所述的一種基于擬合函數(shù)的文字識(shí)別方法,其特征在于步驟(4)所 述的尋找相似度最高的模板作為識(shí)別結(jié)果的方法如下(a) 根據(jù)圖形拆分出的各個(gè)最佳擬合向量,在知識(shí)庫的筆畫集里查找最匹配的筆畫,生 成符號(hào)向量;(b) 利用符號(hào)向量在知識(shí)庫的符號(hào)集里查找最匹配的符號(hào),如果筆畫是有序的那么在 查找過程中筆畫和順序都要匹配;如果筆畫無序那么按照筆畫的數(shù)量和類型進(jìn)行查找,不 考慮順序能否匹配;(c)如果在筆畫有序和無序的情況下既不能找到筆畫數(shù)相同的也不能找到所用筆畫完 全相同的,則用最接近匹配原則,找最接近的符號(hào)對(duì)于筆畫有序的字符向量,則取各個(gè)位 按順序能匹配到正確筆畫數(shù)量最多的字符;如果筆畫無序的,則取所有筆畫中能匹配到所 用筆畫最多的字符,然后根據(jù)需要,可以取出字符向量的圖像,用圖像進(jìn)行對(duì)比確認(rèn)結(jié)果。
全文摘要
本發(fā)明公布了一種基于擬合函數(shù)的文字識(shí)別方法。本發(fā)明方法對(duì)構(gòu)成待識(shí)別的文字的線條進(jìn)行擬合,將文字轉(zhuǎn)化為多個(gè)多項(xiàng)式函數(shù)來描述,然后通過分析擬合函數(shù)與模板庫的標(biāo)準(zhǔn)函數(shù)的相似度,取出相似度最高的模板作為識(shí)別結(jié)果。本發(fā)明不僅能夠識(shí)別漢字,還能夠識(shí)別數(shù)字、字母和一些特殊的符號(hào),且具有較高的執(zhí)行效率和準(zhǔn)確率。
文檔編號(hào)G06K9/68GK101763516SQ20101001793
公開日2010年6月30日 申請(qǐng)日期2010年1月15日 優(yōu)先權(quán)日2010年1月15日
發(fā)明者彭立勛, 王明濤, 皮德常 申請(qǐng)人:南京航空航天大學(xué)