一種基于擬合函數(shù)的文字識(shí)別方法

文檔序號(hào)：6597302閱讀：764來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種基于擬合函數(shù)的文字識(shí)別方法
技術(shù)領(lǐng)域：
本發(fā)明屬于模式識(shí)別、人工智能和文字信息處理領(lǐng)域，特別涉及一種基于擬合函
數(shù)的文字識(shí)別方法。
背景技術(shù)：
隨著計(jì)算機(jī)技術(shù)的推廣應(yīng)用，尤其是互聯(lián)網(wǎng)的日益普及，人類越來越多地依靠計(jì) 算機(jī)獲得各種信息。大量地信息處理工作也都轉(zhuǎn)移到計(jì)算機(jī)上進(jìn)行。在日常的生活和工作中，存在著大量的文字信息處理問題，因而將文字信息快速輸入到計(jì)算機(jī)這一要求變得非常迫切。現(xiàn)在一般的文字識(shí)別算法是基于對(duì)待識(shí)別圖形的點(diǎn)陣分析，對(duì)構(gòu)成文字的線條較復(fù)雜的文字進(jìn)行識(shí)別有很大的局限性，例如對(duì)漢字有專門的漢字識(shí)別方法，對(duì)字母有專門的字母識(shí)別方法，即使用同一類算法思想也是需要不同的程序來實(shí)現(xiàn)。尤其將多種類型符號(hào)混在一起時(shí)，大部分算法都很難識(shí)別出來。如果是手寫輸入，識(shí)別的難度就更大。
現(xiàn)有的通用文字識(shí)別算法，例如模板匹配算法，一般用訓(xùn)練樣本特征的平均值來描述，分類器根據(jù)輸入樣本特征與各個(gè)文字的參照特征的距離進(jìn)行識(shí)別。由于漢字存在各種各樣字體，手寫漢字中還存在各種各樣的變形，因此文件的任何特征都存在一個(gè)分布空間。只有把這些分布考慮進(jìn)去，才能更精確地進(jìn)行分類識(shí)別，因此只用特征平均值來描述特征是不夠的。貝葉斯分類算法則是采用一種用分段線性函數(shù)描述漢字特征的概率密度函數(shù)方法，能很好的識(shí)別出漢字的特征分布，但是由于特征值的分布通常不是某種簡單的統(tǒng)計(jì)分布，如果沒有簡單的方法描述這些概率密度函數(shù)，則表示所有的漢字的各維特征的概率密度函數(shù)需要的存儲(chǔ)空間將是實(shí)用系統(tǒng)所不能承受的。以上這兩種方法都不能很好的將復(fù)雜圖形分類，對(duì)文字識(shí)別執(zhí)行的準(zhǔn)確率和效率很低。

發(fā)明內(nèi)容
本發(fā)明目的是針對(duì)現(xiàn)有技術(shù)存在的缺陷，根據(jù)文字圖像的特點(diǎn)，應(yīng)用擬合函數(shù)的技術(shù)和特征，提出一種有效的基于擬合函數(shù)的文字識(shí)別方法。本發(fā)明更好的兼顧了文字識(shí) 別的準(zhǔn)確度和速度。本發(fā)明為實(shí)現(xiàn)上述目的，采用如下技術(shù)方案本發(fā)明是一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于包括如下步驟
(1)在聯(lián)機(jī)或者在離線的情況下讀入待識(shí)別的文字樣本； (2)文字圖像預(yù)處理首先將步驟(1)所述的待識(shí)別的文字樣本圖像二值化，然后線條消抖，再進(jìn)行斷點(diǎn)連接，最后把文字圖像規(guī)范化； (3)分析樣本先從步驟(2)所述的規(guī)范化后的待識(shí)別的文字樣本圖像中拆分出文字筆畫，然后將拆分出的每個(gè)筆畫歸類到筆畫集中，并以此生成可識(shí)別的符號(hào)序列；對(duì)筆畫集中的每條線段尋找特征點(diǎn)，根據(jù)特征點(diǎn)集擬合多項(xiàng)式找出最佳擬合函數(shù)，選取最佳擬
合函數(shù)的系數(shù)作為最佳擬合向量；用最佳擬合向量匹配筆畫寫入符號(hào)向量； (4)識(shí)別樣本首先根據(jù)步驟(3)所述的符號(hào)序列在知識(shí)庫中尋找與之匹配的多
個(gè)模板；然后提取這多個(gè)模板圖案的符號(hào)向量并與步驟(3)所述的待識(shí)別的文字樣本圖像
的符號(hào)向量進(jìn)行匹配； (5)輸出結(jié)果將與步驟(3)所述的待識(shí)別的文字樣本圖像的符號(hào)向量相似度最高的那個(gè)模板文字圖案作為識(shí)別結(jié)果。本發(fā)明是針對(duì)二值文字圖像的識(shí)別，二值化后的圖像能使圖像的處理速度高、成本低，此外，由于最終是對(duì)字符串進(jìn)行匹配，使用索引提高了匹配速度，因此具有較高的執(zhí) 行效率；本發(fā)明將各種復(fù)雜的文字圖形轉(zhuǎn)化為多項(xiàng)式函數(shù)進(jìn)行描述，生成符號(hào)向量，然后通過分析與知識(shí)庫中模板的相似度進(jìn)行文字識(shí)別，對(duì)文字識(shí)別正確率高，穩(wěn)定性好。

圖1 :本發(fā)明方法的總體框圖；
圖2 :聯(lián)機(jī)情況下筆畫拆分流程圖。
具體實(shí)施例方式
為了便于敘述本發(fā)明提供的基于擬合函數(shù)的文字識(shí)別方法，首先給出關(guān)于本方法如下的基本定義定義一線段(LS， Line Segment)與線段集(LSS， Line Segment Set): —段連續(xù)的，由若干個(gè)點(diǎn)構(gòu)成，可以被擬合的點(diǎn)序列稱為線段(可以為曲線段或
直線段)，由線段組成的序列稱為線段集。定義LS = ((X" Y》，(X2， Y2) ，， (XNpi， YNpi) ，， (XNp， YNp)) ， Np為點(diǎn)的數(shù)量。 LSS = (IA， LS2， . . LSNli， . . . ， LSN1) ， Nl為線段的數(shù)量。其中NPi、 Nl" Np、 Nl G Z+， XNpi、 YNpi G Z， LS G LSS， | XNp「XNpi—丄|《1，
I Ynp「Ynph |^1。定義二特征點(diǎn)(LX， Line Character points)與特征點(diǎn)集(LXS， Line Character pointsSet): 對(duì)于一條由Np個(gè)點(diǎn)構(gòu)成的線段LS，選取其中Ncp個(gè)點(diǎn)進(jìn)行擬合，每個(gè)被選取的點(diǎn) 稱為線段LS的特征點(diǎn)，由這Ncp個(gè)特征點(diǎn)組成的序列稱為特征點(diǎn)集。
定義LC G LS。 LCS = {LQ, LC2，， LCNcpi，， LCNcp} ， Ncp為特征點(diǎn)的數(shù)量。其中LCNcpi G LS，O《NcPi《Ncp《Np。定義三最佳擬合函數(shù)(BFF， Best-Fitting Function): 利用一條線段LS的一個(gè)特征點(diǎn)集LCS對(duì)線段進(jìn)行擬合得到的p階多項(xiàng)式Y(jié)(X)或 X(Y)稱為這條線段的擬合函數(shù)，其中最優(yōu)的擬合函數(shù)稱為最佳擬合函數(shù)。
定義:BFF (X) = Ap*Xp+Ap—、 Aj*XJ+. +A。*X°， Flag標(biāo)志位0。
BFF (Y) = Ap*Yn+Ap—^Y『、..Aj*Xj+. . . +A。*Y0， Flag標(biāo)志位1. 其中A，. e R， j、p e Z+。
(1)在聯(lián)機(jī)或者在離線的情況下讀入待識(shí)別的文字樣本； (2)文字圖像預(yù)處理首先將步驟(1)所述的待識(shí)別的文字樣本圖像二值化，然后線條消抖，再進(jìn)行斷點(diǎn)連接，最后把文字圖像規(guī)范化； (3)分析樣本先從步驟(2)所述的規(guī)范化后的待識(shí)別的文字樣本圖像中拆分出
文字筆畫，然后將拆分出的每個(gè)筆畫歸類到筆畫集中，并以此生成可識(shí)別的符號(hào)序列；對(duì)筆
畫集中的每條線段尋找特征點(diǎn)，根據(jù)特征點(diǎn)集擬合多項(xiàng)式找出最佳擬合函數(shù)，選取最佳擬
合函數(shù)的系數(shù)作為最佳擬合向量；用最佳擬合向量匹配筆畫寫入符號(hào)向量； (4)識(shí)別樣本首先根據(jù)步驟(3)所述的符號(hào)序列在知識(shí)庫中尋找與之匹配的多
個(gè)模板；然后提取這多個(gè)模板圖案的符號(hào)向量并與步驟(3)所述的待識(shí)別的文字樣本圖像
的符號(hào)向量進(jìn)行匹配； (5)輸出結(jié)果將與步驟(3)所述的待識(shí)別的文字樣本圖像的符號(hào)向量相似度最高的那個(gè)模板文字圖案作為識(shí)別結(jié)果。所述的一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于步驟(5)輸出結(jié)果后，將步驟(3)所述的待識(shí)別的文字樣本圖像存為模板。所述的一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于步驟(2)所述的二值化方法如下首先取1\ = 70作為第一次選用的閾值，對(duì)步驟(1)所述的待識(shí)別的文字樣本圖像進(jìn)行整體閾值二值化，區(qū)分待識(shí)別的文字樣本圖像的背景和圖像；再分別求出對(duì)應(yīng)閾值1\ 的待識(shí)別的文字樣本圖像的圖像和背景的灰度平均值Fa和Ba，定出二次選用的閾值為 T2 = ^~(Fa + B a ) 最后再用二次選用的閾值T2對(duì)原圖進(jìn)行整體閾值二值化。所述的一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于步驟(2)所述的線條消抖方法如下在二值化后的待識(shí)別的文字樣本圖像中的文字筆跡中隨機(jī)抽取占總數(shù)據(jù)點(diǎn)50% 的點(diǎn)，用直線連接最近的點(diǎn)并且距離不超過3個(gè)像素點(diǎn)的相鄰點(diǎn)。所述的一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于步驟(2)所述的文字?jǐn)帱c(diǎn) 連接方法如下在線條消抖后的待識(shí)別的文字樣本圖像中的文字筆跡中隨機(jī)抽取占總數(shù)據(jù)點(diǎn) 60%的點(diǎn)，用直線連接最近的點(diǎn)并且距離不超過3個(gè)像素點(diǎn)的相鄰點(diǎn)。如圖2所示。所述的一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于步驟(3)所述的拆分文字筆畫的方法如下
聯(lián)機(jī)情況 ①初始化兩個(gè)覆蓋表CovX和CovY，分別用于記錄X軸和Y軸的被覆蓋情況，并將所有項(xiàng)置為False,表示兩個(gè)覆蓋表CovX和CovY都未被覆蓋；初始化一個(gè)數(shù)組LS，用來存儲(chǔ)拆分出來的線段，Nlj二O; ②建立兩個(gè)空隊(duì)列QueueX和QueueY，分別用于壓入按Y(X)方式記錄和按X(Y)方式記錄的點(diǎn)序列； ③每當(dāng)獲取一個(gè)點(diǎn)(Xi， Y》時(shí)，分別判斷在兩個(gè)覆蓋表CovX和CovY的&位置和Yt 位置是否為False :若CovX的&位置為False,則將(&， Y》壓入隊(duì)列QueueX并在覆蓋表 CovX的Xi位置寫入True ;若覆蓋表CovY的Yt位置為False則將"，Y》壓入隊(duì)列QueueY 并在覆蓋表CovY的Yi位置寫入True ;直到遇到兩個(gè)覆蓋表CovX和CovY表中的一個(gè)Cov 表突即對(duì)應(yīng)位置為True的Xi或Yt位置已經(jīng)為True,則進(jìn)入步驟④；當(dāng)點(diǎn)全部處理完，則進(jìn) 入步驟⑤； ④如果有一個(gè)Cov表沖突，則將對(duì)應(yīng)的隊(duì)列Queue中的元素全部出隊(duì)列清空并且將Cov表復(fù)位；另一個(gè)Cov表繼續(xù)進(jìn)行步驟③中的操作，直到也出現(xiàn)沖突，則將對(duì)應(yīng)隊(duì)列 Queue全部出隊(duì)列到線段LS[Nlj] ， Nlj = Nlj+1，清空Cov表； ⑤如果是一條文字筆畫線畫完，則進(jìn)入步驟①拆分下一條文字筆畫；如果沒有點(diǎn)
可以獲取了，則結(jié)束；離線情況 A.按照從左向右，從上到下的掃描方法，只要掃描到一個(gè)點(diǎn)，就用這個(gè)點(diǎn)用種子填
充法的方法擴(kuò)散，把能連通的線段全部連通，然后用聯(lián)機(jī)識(shí)別的方法生成LS，轉(zhuǎn)步驟(B); B.每取走一條線段，判斷這條線段是否與其他線段交叉，如果不交叉則從圖中刪
掉這條線段，如有交叉則補(bǔ)上交叉點(diǎn)，轉(zhuǎn)步驟(A)，直到圖中沒有點(diǎn)了為止。其中點(diǎn)(Xi， Y》表示構(gòu)成一條文字筆畫的第i點(diǎn)，i G Z+，0《i《Np， Np為一條
文字筆畫的點(diǎn)數(shù)。所述的一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于步驟(3)所述的特征點(diǎn)選取方法如下線段的起點(diǎn)(&， Y》和終點(diǎn)(XNp， YNp)應(yīng)當(dāng)被選取，其余的點(diǎn)應(yīng)當(dāng)以一定規(guī)則從線段的各個(gè)部分取，本發(fā)明每隔5個(gè)點(diǎn)取一個(gè)特征點(diǎn)，保證特征點(diǎn)能較好的描述原線段的輪廓。所述的一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于步驟(3)所述的確定最佳擬合向量的方法如下確定最佳擬合函數(shù)中階數(shù)p和系數(shù)Aj， j = 1，2...p，然后選取最佳擬合函數(shù)的系
數(shù)最為最佳擬合向量；最佳擬合函數(shù)中階數(shù)p通過以下方式獲得p從1開始擬合，求出擬合相似度R2，每當(dāng)P+l可以使擬合相似度R2增加一個(gè)閾值a = 5%，則取p+1為當(dāng)前的p，再次進(jìn)行判斷，直到P+1階擬合不能使擬合相似度R2增加a為止；最佳擬合函數(shù)中各系數(shù)Aj通過以下方式獲得對(duì)于系數(shù)Aj，如果Aj的絕對(duì)值小于一個(gè)閾值P = 1E-3，那么測(cè)試去掉A,XJ'項(xiàng)后，擬合相似度R2會(huì)不會(huì)減小一個(gè)閾值Y = 5%，如果不會(huì)減小Y那么多，就去掉A,XJ'項(xiàng)即把Aj賦值為O。所述的一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于步驟(4)所述的尋找相似度最高的模板作為識(shí)別結(jié)果的方法如下 (a)根據(jù)圖形拆分出的各個(gè)最佳擬合向量，在知識(shí)庫的筆畫集里查找最匹配的筆畫，生成符號(hào)向量； (b)利用符號(hào)向量在知識(shí)庫的符號(hào)集里查找最匹配的符號(hào)，如果筆畫是有序的那么在查找過程中筆畫和順序都要匹配；如果筆畫無序那么按照筆畫的數(shù)量和類型進(jìn)行查找，不考慮順序能否匹配； (c)如果在筆畫有序和無序的情況下既不能找到筆畫數(shù)相同的也不能找到所用筆畫完全相同的，則用最接近匹配原則，找最接近的符號(hào)對(duì)于筆畫有序的字符向量，則取各個(gè)位按順序能匹配到正確筆畫數(shù)量最多的字符；如果筆畫無序的，則取所有筆畫中能匹配到所用筆畫最多的字符，然后根據(jù)需要，可以取出字符向量的圖像，用圖像進(jìn)行對(duì)比確認(rèn)結(jié) 果。
0100] 本發(fā)明算法的執(zhí)行過程為
0101] SI. KB = CreatKB ()或LoadKB (KB);〃建立知識(shí)庫或載入知識(shí)庫 0102] S2. SV. Pic = ReadSV();〃讀入樣本 0103] S3. AnalysisSV(SV) 〃分析樣本 0104] Begin
0105]LSS = GetLSS(SV. Pic);〃將圖像拆分成筆畫集 0106]For k:= 1 To LSS.size()Do 0107] Begin 〃生成特征點(diǎn)集合
0108] LCS = GetLCS(LSS[k]);〃生成最佳擬合向量寫入符號(hào)向量
0109] SV. SKV[k].BFV. add(GetBFV(LCS));〃用最佳擬合向量匹配筆畫
0110] SV. SKV[k] = MatchingSK(SV. SKV[k]. BFV);
O川] End
0112]return SUCCESS ; 0113] End
0114] S4. SVS = MatchingTP(SV);〃匹配模板 0115] S5. Begin 〃按向量匹配得若干個(gè)符號(hào)向量 0116] SVS = MatchingSV(SV. SKV);
0117] 〃如果需要，比較樣本的圖像和每個(gè)可能的符號(hào)的圖像進(jìn)行匹配
0118] SVS = MatchingPIC (SV. Pic);
0119] If (用戶需要更新知識(shí)庫)
0120] Then
0121] StoreKB(SV);
0122] return SVS ;
0123] End
0124] Write (SVS[O]);〃輸出最匹配的結(jié)果
權(quán)利要求
一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于包括如下步驟(1)在聯(lián)機(jī)或者在離線的情況下讀入待識(shí)別的文字樣本；(2)文字圖像預(yù)處理首先將步驟(1)所述的待識(shí)別的文字樣本圖像二值化，然后線條消抖，再進(jìn)行斷點(diǎn)連接，最后把文字圖像規(guī)范化；(3)分析樣本先從步驟(2)所述的規(guī)范化后的待識(shí)別的文字樣本圖像中拆分出文字筆畫，然后將拆分出的每個(gè)筆畫歸類到筆畫集中，并以此生成可識(shí)別的符號(hào)序列；對(duì)筆畫集中的每條線段尋找特征點(diǎn)，根據(jù)特征點(diǎn)集擬合多項(xiàng)式找出最佳擬合函數(shù)，選取最佳擬合函數(shù)的系數(shù)作為最佳擬合向量；用最佳擬合向量匹配筆畫寫入符號(hào)向量；(4)識(shí)別樣本首先根據(jù)步驟(3)所述的符號(hào)序列在知識(shí)庫中尋找與之匹配的多個(gè)模板；然后提取這多個(gè)模板圖案的符號(hào)向量并與步驟(3)所述的待識(shí)別的文字樣本圖像的符號(hào)向量進(jìn)行匹配；(5)輸出結(jié)果將與步驟(3)所述的待識(shí)別的文字樣本圖像的符號(hào)向量相似度最高的那個(gè)模板文字圖案作為識(shí)別結(jié)果。
2. 根據(jù)權(quán)利要求l所述的一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于步驟(5)輸出結(jié)果后，將步驟(3)所述的待識(shí)別的文字樣本圖像存為模板。
3. 根據(jù)權(quán)利要求l所述的一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于步驟(2)所述的二值化方法如下首先取1\ = 70作為第一次選用的閾值，對(duì)步驟(1)所述的待識(shí)別的文字樣本圖像進(jìn) 行整體閾值二值化，區(qū)分待識(shí)別的文字樣本圖像的背景和圖像；再分別求出對(duì)應(yīng)閾值1\的待識(shí)別的文字樣本圖像的圖像和背景的灰度平均值Fa和Ba，定出二次選用的閾值為T2 == ^(Fa + B a )最后再用二次選用的閾值T2對(duì)原圖進(jìn)行整體閾值二值化。
4. 根據(jù)權(quán)利要求l所述的一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于步驟(2)所述的線條消抖方法如下在二值化后的待識(shí)別的文字樣本圖像中的文字筆跡中隨機(jī)抽取占總數(shù)據(jù)點(diǎn)50%的點(diǎn)，用直線連接最近的點(diǎn)并且距離不超過3個(gè)像素點(diǎn)的相鄰點(diǎn)。
5. 根據(jù)權(quán)利要求l所述的一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于步驟(2)所述的文字?jǐn)帱c(diǎn)連接方法如下在線條消抖后的待識(shí)別的文字樣本圖像中的文字筆跡中隨機(jī)抽取占總數(shù)據(jù)點(diǎn)60%的點(diǎn)，用直線連接最近的點(diǎn)并且距離不超過3個(gè)像素點(diǎn)的相鄰點(diǎn)。
6. 根據(jù)權(quán)利要求l所述的一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于步驟(3)所述的拆分文字筆畫的方法如下聯(lián)機(jī)情況① 初始化兩個(gè)覆蓋表CovX和CovY，分別用于記錄X軸和Y軸的被覆蓋情況，并將所有項(xiàng)置為False,表示兩個(gè)覆蓋表CovX和CovY都未被覆蓋；初始化一個(gè)數(shù)組LS [Nlj]，用來存儲(chǔ)拆分出來的線段，Nlj二O;② 建立兩個(gè)空隊(duì)列QueueX和QueueY，分別用于壓入按Y(X)方式記錄和按X(Y)方式記錄的點(diǎn)序列；每當(dāng)獲取一個(gè)點(diǎn)(Xi，Yi)時(shí)，分別判斷在兩個(gè)覆蓋表CovX和CovY的Xi位置和Yi位置是否為False :若CovX的Xt位置為False,則將(Xi，Y》壓入隊(duì)列QueueX并在覆蓋表CovX 的&位置寫入True ;若覆蓋表CovY的^位置為False則將(&， Y》壓入隊(duì)列QueueY并在覆蓋表CovY的Yi位置寫入True ;直到遇到兩個(gè)覆蓋表CovX和CovY表中的一個(gè)Cov表突即對(duì)應(yīng)位置為True的Xi或Yt位置已經(jīng)為True,則進(jìn)入步驟④；當(dāng)點(diǎn)全部處理完，則進(jìn)入步驟⑤；④ 如果有一個(gè)Cov表沖突，則將對(duì)應(yīng)的隊(duì)列Queue中的元素全部出隊(duì)列清空并且將Cov 表復(fù)位；另一個(gè)Cov表繼續(xù)進(jìn)行步驟③中的操作，直到也出現(xiàn)沖突，則將對(duì)應(yīng)隊(duì)列Queue全部出隊(duì)列到線段LS[Nlj] ， Nlj — Nlj+1，清空Cov表，其中一表示賦值；⑤ 如果是一條文字筆畫線畫完，則進(jìn)入步驟①拆分下一條文字筆畫；如果沒有點(diǎn)可以獲取了，則結(jié)束；離線情況A. 按照從左向右，從上到下的掃描方法，只要掃描到一個(gè)點(diǎn)，就用這個(gè)點(diǎn)用種子填充法的方法擴(kuò)散，把能連通的線段全部連通，然后用聯(lián)機(jī)識(shí)別的方法生成LS，轉(zhuǎn)步驟B ;B. 每取走一條線段，判斷這條線段是否與其他線段交叉，如果不交叉則從圖中刪掉這條線段，如有交叉則補(bǔ)上交叉點(diǎn)，轉(zhuǎn)步驟A，直到圖中沒有點(diǎn)了為止；其中點(diǎn)(I Y》表示構(gòu)成一條文字筆畫的第i點(diǎn)，i G Z+即正整數(shù)，O《i《Np， Np為一條文字筆畫的點(diǎn)數(shù)。
7. 根據(jù)權(quán)利要求l所述的一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于步驟(3)所述的特征點(diǎn)選取方法如下線段的起點(diǎn)(&， Y》和終點(diǎn)(XNP， YNP)應(yīng)當(dāng)被選取，其余的點(diǎn)應(yīng)當(dāng)以一定規(guī)則從線段的各個(gè)部分取，本發(fā)明每隔5個(gè)點(diǎn)取一個(gè)特征點(diǎn)，保證特征點(diǎn)能較好的描述原線段的輪廓。
8. 根據(jù)權(quán)利要求l所述的一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于步驟(3)所述的確定最佳擬合向量的方法如下確定最佳擬合函數(shù)中階數(shù)P和系數(shù)Aj， j = 1，2...p，然后選取最佳擬合函數(shù)的系數(shù)最為最佳擬合向量；最佳擬合函數(shù)中階數(shù)P通過以下方式獲得P從1開始擬合，求出擬合相似度R2，每當(dāng) P+1可以使擬合相似度R2增加一個(gè)閾值a = 5X，則取p+l為當(dāng)前的p，再次進(jìn)行判斷，直到P+l階擬合不能使擬合相似度R2增加a為止；最佳擬合函數(shù)中各系數(shù)Aj通過以下方式獲得對(duì)于系數(shù)Aj，如果Aj的絕對(duì)值小于一個(gè) 閾值13 = lE-3，那么測(cè)試去掉A,XJ'項(xiàng)后，擬合相似度f會(huì)不會(huì)減小一個(gè)閾值Y = 5%，如果不會(huì)減小Y那么多，就去掉A,XJ'項(xiàng)即把Aj賦值為O。
9. 根據(jù)權(quán)利要求l所述的一種基于擬合函數(shù)的文字識(shí)別方法，其特征在于步驟(4)所述的尋找相似度最高的模板作為識(shí)別結(jié)果的方法如下(a) 根據(jù)圖形拆分出的各個(gè)最佳擬合向量，在知識(shí)庫的筆畫集里查找最匹配的筆畫，生成符號(hào)向量；(b) 利用符號(hào)向量在知識(shí)庫的符號(hào)集里查找最匹配的符號(hào)，如果筆畫是有序的那么在查找過程中筆畫和順序都要匹配；如果筆畫無序那么按照筆畫的數(shù)量和類型進(jìn)行查找，不考慮順序能否匹配；(c)如果在筆畫有序和無序的情況下既不能找到筆畫數(shù)相同的也不能找到所用筆畫完全相同的，則用最接近匹配原則，找最接近的符號(hào)對(duì)于筆畫有序的字符向量，則取各個(gè)位按順序能匹配到正確筆畫數(shù)量最多的字符；如果筆畫無序的，則取所有筆畫中能匹配到所用筆畫最多的字符，然后根據(jù)需要，可以取出字符向量的圖像，用圖像進(jìn)行對(duì)比確認(rèn)結(jié)果。
全文摘要
本發(fā)明公布了一種基于擬合函數(shù)的文字識(shí)別方法。本發(fā)明方法對(duì)構(gòu)成待識(shí)別的文字的線條進(jìn)行擬合，將文字轉(zhuǎn)化為多個(gè)多項(xiàng)式函數(shù)來描述，然后通過分析擬合函數(shù)與模板庫的標(biāo)準(zhǔn)函數(shù)的相似度，取出相似度最高的模板作為識(shí)別結(jié)果。本發(fā)明不僅能夠識(shí)別漢字，還能夠識(shí)別數(shù)字、字母和一些特殊的符號(hào)，且具有較高的執(zhí)行效率和準(zhǔn)確率。
文檔編號(hào)G06K9/68GK101763516SQ20101001793
公開日2010年6月30日申請(qǐng)日期2010年1月15日優(yōu)先權(quán)日2010年1月15日
發(fā)明者彭立勛, 王明濤, 皮德常申請(qǐng)人:南京航空航天大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：皮德常;彭立勛;王明濤
技術(shù)所有人：南京航空航天大學(xué)
我是此專利的發(fā)明人

上一篇：多屏電腦顯示器的制作方法
上一篇：提高彩色圖像的色溫的設(shè)備和方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

matlab曲線擬合函數(shù)相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種基于擬合函數(shù)的文字識(shí)別方法