国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種手寫文字的識(shí)別方法

      文檔序號(hào):6526139閱讀:261來源:國知局
      專利名稱:一種手寫文字的識(shí)別方法
      技術(shù)領(lǐng)域
      本發(fā)明屬于模式識(shí)別與人工智能技術(shù)領(lǐng)域,特別是涉及一種手寫文字圖像識(shí)別處理方法。
      背景技術(shù)
      漢字在線識(shí)別是指用戶一邊書寫一邊識(shí)別。一般是指用戶通過手寫輸入設(shè)備(比如手寫板、觸摸屏、鼠標(biāo)等)書寫漢字,同時(shí)計(jì)算機(jī)將手寫輸入設(shè)備采集到的漢字書寫軌跡轉(zhuǎn)換為相應(yīng)的漢字機(jī)器內(nèi)碼的識(shí)別技術(shù)。按書寫限制的程度,一般可以分為限制性手寫體(如限制筆順,橫平豎直,沒有連筆),手寫印刷體(指書寫工整的漢字),行書手寫體(指有部分筆畫變形和連筆的漢字),草書手寫體(指大部分筆畫變形以及幾乎完全連筆書寫的漢字)。這幾種手寫體的識(shí)別難度依次增大,以草書手寫體的識(shí)別難度最大。因?yàn)椴輹謱戵w的漢字字型通常已經(jīng)和原漢字字形有了較大的不同,不僅表現(xiàn)在筆畫的變形上,還表現(xiàn)在漢字結(jié)構(gòu)的變形上。這些變形一般是由于書寫者為了達(dá)到更快、更流暢的書寫速度而在原有漢字字形的基礎(chǔ)上改變而來的。因此在以上幾種手寫體漢字中,以草書手寫體的書寫速度最快,因而這種書寫方式也是人們最樂于接受的一種書寫方式。
      已有的漢字識(shí)別方法大多數(shù)是基于漢字筆畫來進(jìn)行識(shí)別的,比如中國發(fā)明專利98106953.3號(hào)專利《手寫漢字識(shí)別方法及裝置》、98108373.0號(hào)專利《文字識(shí)別裝置及文字識(shí)別方法》以及98122949.2號(hào)專利《一種無筆畫順序的手寫字符辨識(shí)系統(tǒng)》等專利使用的方法都依賴于筆畫的正確提取與識(shí)別,而草書手寫體漢字不但連筆書寫,大部分筆畫變形嚴(yán)重,而且有很多短的筆畫會(huì)被省去,因此以上識(shí)別方法無法很好地解決草書手寫體漢字的識(shí)別。
      在中國發(fā)明專利93101683.5號(hào)專利《自由書寫聯(lián)機(jī)手寫漢字識(shí)別方法及其系統(tǒng)》中也提到已有的基于筆畫或筆段的字形結(jié)構(gòu)識(shí)別方法很難處理分解不出筆段的漢字,該專利的特征在于將兩種識(shí)別不同書寫風(fēng)格漢字的識(shí)別方法相結(jié)合,一種用于識(shí)別楷書和部分行書,另一種識(shí)別不規(guī)范連筆字,而該專利提出的識(shí)別方法的結(jié)合方式是采用一種串行的方式,即先用前種方法識(shí)別,拒識(shí)以后才用后一種方法識(shí)別。這種方法的不足之處在于針對(duì)不規(guī)范連筆字的識(shí)別只采用了一種識(shí)別方法,而其采用的串行結(jié)合的識(shí)別方式的不足在于如果某個(gè)草書漢字沒有被拒識(shí),則不會(huì)用后一種識(shí)別不規(guī)范連筆字的識(shí)別方法進(jìn)行識(shí)別。

      發(fā)明內(nèi)容
      本發(fā)明的目的在于克服上述漢字手寫識(shí)別方法的不足,提供一種通過脫機(jī)識(shí)別方法和聯(lián)機(jī)識(shí)別方法相結(jié)合的手寫文字識(shí)別方法。
      本發(fā)明采用的技術(shù)方案為一種手寫文字的識(shí)別方法,通過脫機(jī)文字識(shí)別方法和聯(lián)機(jī)文字識(shí)別方法相結(jié)合對(duì)手寫文字進(jìn)行識(shí)別,所述脫機(jī)文字識(shí)別方法包括(1)、重構(gòu)手寫文字圖像;(2)、通過文字圖像提取文字筆畫的輪廓方向角特征;(3)、選取脫機(jī)識(shí)別候選字;所述聯(lián)機(jī)文字識(shí)別方法包括
      (A)、提取手寫文字時(shí)序點(diǎn)的聯(lián)機(jī)筆畫方向特征;(B)、選取聯(lián)機(jī)識(shí)別候選字。
      所述步驟(1)重構(gòu)手寫文字圖像通過采集手寫文字時(shí)序點(diǎn)軌跡坐標(biāo),并將時(shí)序點(diǎn)軌跡線性歸一化到固定大小,再用等寬的線段依次連接所有相鄰的時(shí)序點(diǎn),從而重構(gòu)出原手寫漢字的圖像。
      所述步驟(2)提取文字筆畫的輪廓方向角特征通過把漢字圖像在水平和垂直兩個(gè)方向上的直方圖投影畫出4×4的全局彈性網(wǎng)格,使得每一列網(wǎng)格在水平方向上的直方圖投影累積量相等,每一行網(wǎng)格在垂直方向上的直方圖投影累積量相等,再根據(jù)每個(gè)網(wǎng)格水平和垂直兩個(gè)方向上的直方圖投影在網(wǎng)格內(nèi)畫出2×2的局部彈性網(wǎng)格,形成64個(gè)局部彈性網(wǎng)格,再從這64個(gè)網(wǎng)格中提取出文字的輪廓,然后對(duì)每個(gè)彈性網(wǎng)格單元內(nèi)的輪廓在4個(gè)方向上進(jìn)行輪廓方向角特征提取,得出輪廓方向角特征。所述4個(gè)方向?yàn)闄M撇、撇豎、豎捺、橫捺。對(duì)漢字圖像經(jīng)過輪廓提取后,對(duì)字符輪廓點(diǎn)P的8鄰域通過&theta;(p)=tan-1(DxDy)]]>計(jì)算該輪廓點(diǎn)的輪廓方向角,其中Dx、Dy是p點(diǎn)在x軸和y軸上的梯度函數(shù),且Dx、Dy定義為Dx=(p6+2p7+p8)-(p1+2p2+p3),Dy=(p3+2p5+p8)-(p1+2p4+p6)而輪廓點(diǎn)p的8鄰域?yàn)?

      ,方向角的取值范圍為0到180度,整個(gè)文字64個(gè)彈性網(wǎng)格單元總共得到256維輪廓方向角特征矢量。
      所述步驟(2)還包括線性判決分析(LDA)對(duì)輪廓方向角特征進(jìn)行降維,將原先的256維數(shù)降為128維數(shù)。
      所述步驟(3)選取脫機(jī)識(shí)別候選字通過計(jì)算128維輪廓方向角特征與模板中所有文字特征的歐式距離,選出距離最小的前100個(gè)候選字作為脫機(jī)識(shí)別候選字。
      所述步驟(A)提取手寫文字筆畫時(shí)序點(diǎn)的方向特征通過對(duì)手寫文字筆畫時(shí)序點(diǎn)按固定距離進(jìn)行采樣,又定義采樣后的特征點(diǎn)的筆畫方向角為前一特征點(diǎn)指向該特征點(diǎn)的方向角度,范圍為0到255,線性對(duì)應(yīng)0到359度,然后計(jì)算每個(gè)特征點(diǎn)的筆畫方向角,作為該特征點(diǎn)的聯(lián)機(jī)筆畫方向特征。
      所述步驟(B)選取聯(lián)機(jī)識(shí)別候選字通過動(dòng)態(tài)時(shí)間規(guī)整(DTW)的方法對(duì)聯(lián)機(jī)筆畫方向特征矢量與步驟(3)得出的脫機(jī)識(shí)別候選字的多種不同筆順的模板特征矢量進(jìn)行彈性模板匹配,計(jì)算脫機(jī)識(shí)別候選字與聯(lián)機(jī)筆畫方向特征的匹配相似度,其中,DTW彈性匹配的局部距離函數(shù)采用如下關(guān)系式計(jì)算d(i,j)=(&Delta;&theta;)20&le;&Delta;&theta;&le;64-(&Delta;&theta;-128)2+819264&le;&Delta;&theta;&le;128,]]>而&Delta;&theta;=|&theta;i-&theta;j|0&le;|&theta;i-&theta;j|&lt;128256-|&theta;i-&theta;j|128&le;|&theta;i-&theta;j|&lt;256,]]>i和j分別為當(dāng)前匹配的兩特征值在各自特征序列中的位置,θ為輪廓方向角特征;然后再將100個(gè)脫機(jī)識(shí)別候選字按其與聯(lián)機(jī)筆畫方向特征匹配相似度由大到小排序,組成100個(gè)聯(lián)機(jī)識(shí)別方法候選字。
      本發(fā)明通過對(duì)脫機(jī)識(shí)別候選字和聯(lián)機(jī)識(shí)別候選字進(jìn)行集成完成對(duì)手寫文字的識(shí)別,其算法稱之為首選識(shí)別結(jié)果選擇器,具體包括如下規(guī)則(I)、計(jì)算脫機(jī)識(shí)別候選字中每個(gè)候選字的位置分?jǐn)?shù)Si,
      Si=i*exp(1-i)*D+i′*exp(1-i′)*C其中i為該候選字在脫機(jī)識(shí)別候選字序列中的位置,范圍為1到100,i’為該候選字在聯(lián)機(jī)識(shí)別候選字序列中所處的位置,范圍也為1到100,C和D為兩個(gè)常數(shù);(II)、計(jì)算聯(lián)機(jī)識(shí)別候選字中每個(gè)候選字的位置分?jǐn)?shù)Tj,Tj=j(luò)*exp(1-j)*C-Pj其中j為該候選字在聯(lián)機(jī)識(shí)別候選字序列中的位置,范圍為1到100,C為常數(shù),且與步驟(I)的C相同,Pj為預(yù)先定義好的懲罰分?jǐn)?shù),根據(jù)j的不同而不同;(III)、根據(jù)聯(lián)機(jī)識(shí)別候選字的匹配相似度選擇可信度區(qū)間1到M,位置在M以后的候選字認(rèn)為是不可信的候選字;(IV)、將脫機(jī)識(shí)別候選字與聯(lián)機(jī)識(shí)別候選字序列合在一起按照每個(gè)候選字的位置分?jǐn)?shù)從大到小排序,得出集成候選字序列;(V)、選取一個(gè)候選字作為識(shí)別結(jié)果,通過定義Ai為聯(lián)機(jī)識(shí)別候選字,Bj為脫機(jī)識(shí)別候選字,i和j的范圍為1到100,分別對(duì)應(yīng)100個(gè)候選字,如果A1=B1,則選擇A1;如果A1非??尚牛鳥1不太可信,則選擇A1;如果B1很可信,則選擇B1;如果Ak=B1且B1=A1,k和1的范圍為1到35,而k<1,則選B1,k>1則選A1;如果Ak=B2且B1=A2,k和1的范圍為1到15,而k<1,則選B1,k>1則選A1;
      如果以上各個(gè)條件均不滿足,則選擇集成候選字序列的首個(gè)候選字。
      本發(fā)明的基本原理是用戶在書寫連筆草書漢字時(shí),雖然漢字的筆畫和整字的結(jié)構(gòu)會(huì)有較大變形,但總體的筆畫方向特征分布較為穩(wěn)定,通過彈性網(wǎng)格特征提取技術(shù)能較好地提取穩(wěn)定的筆畫方向特征而不對(duì)漢字筆畫和結(jié)構(gòu)的變形過于敏感,通過提取的這種特征對(duì)漢字進(jìn)行識(shí)別,本發(fā)明所采用的脫機(jī)識(shí)別方法能較好地解決自由筆順的問題;另外,連筆草書漢字即使會(huì)有一些短的筆畫被省略,但整字筆畫大體的走向比較穩(wěn)定,通過采用一種限制大體筆順方向的聯(lián)機(jī)識(shí)別方法能識(shí)別出一些變形較為嚴(yán)重的草書漢字;本發(fā)明將這兩種識(shí)別方法結(jié)合起來,即使一些變形嚴(yán)重而且筆順與模板不一致的草書漢字在兩種識(shí)別方法識(shí)別出的候選字位置較后,通過采用一種集成策略,使原本位置較后的正確候選字被提前,從而大大提高了系統(tǒng)對(duì)連筆草書漢字的識(shí)別效果。
      本發(fā)明與已有的漢字識(shí)別方法相比,具有如下的優(yōu)點(diǎn)和有益效果(1)、由于采用的兩種識(shí)別方法均不依賴于筆畫或筆段的正確提取與識(shí)別,因此能很好地解決對(duì)筆畫或筆段不容易提取的草書漢字的識(shí)別;(2)、由于一般的脫機(jī)識(shí)別方法不考慮筆順信息,而本發(fā)明結(jié)合聯(lián)機(jī)識(shí)別方法,能增強(qiáng)對(duì)一些變形嚴(yán)重但筆順大體與模板中某一種書寫筆順一致的草書漢字的識(shí)別效果;(3)、與限制筆順的聯(lián)機(jī)識(shí)別方法相比,本發(fā)明結(jié)合了脫機(jī)識(shí)別方法后,能彌補(bǔ)對(duì)自由筆順書寫的漢字識(shí)別的不足;(4)、本發(fā)明由于對(duì)書寫軌跡的所有時(shí)序點(diǎn)用線段連接,所以無論書寫中有無連筆,用于進(jìn)行識(shí)別的漢字都是一樣的,所以能較好地識(shí)別任意用戶書寫的連筆草書漢字;
      (5)、本發(fā)明可準(zhǔn)確識(shí)別連筆草書,所以本發(fā)明能讓用戶在用手寫輸入法輸入漢字時(shí)書寫漢字的速度達(dá)到最快。


      圖1是本發(fā)明的系統(tǒng)結(jié)構(gòu)框圖;圖2是本發(fā)明的脫機(jī)識(shí)別方法的流程框圖;圖3是本發(fā)明的聯(lián)機(jī)識(shí)別方法的流程框圖;圖4是本發(fā)明的脫機(jī)與聯(lián)機(jī)的識(shí)別結(jié)果集成的流程框圖。
      具體實(shí)施例方式
      下面結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步的說明,實(shí)施本發(fā)明所用的識(shí)別設(shè)備可以采用手寫板書寫漢字,用計(jì)算機(jī)進(jìn)行識(shí)別,用純平型顯示器顯示用戶圖形界面,可采用C語言編制各類處理程序,便能較好地實(shí)施本發(fā)明。
      本發(fā)明的系統(tǒng)結(jié)構(gòu)框圖如附圖1所示,漢字筆畫的時(shí)序點(diǎn)輸入后,可通過脫機(jī)識(shí)別和聯(lián)機(jī)識(shí)別的方式同時(shí)對(duì)漢字進(jìn)行識(shí)別,脫機(jī)識(shí)別包括重構(gòu)漢字圖像、彈性網(wǎng)格特征提取、LDA降維、通過距離分類器選取脫機(jī)識(shí)別候選字、脫機(jī)識(shí)別候選字可跟聯(lián)機(jī)識(shí)別候選字進(jìn)行彈性模板匹配,通過候選字集成,得出識(shí)別結(jié)果;聯(lián)機(jī)識(shí)別包括筆畫方向特征提取、彈性模板匹配得出聯(lián)機(jī)識(shí)別候選字;本發(fā)明也分別采用脫機(jī)識(shí)別方法或聯(lián)機(jī)識(shí)別方法對(duì)一些手寫較為規(guī)范的漢字進(jìn)行識(shí)別。本發(fā)明脫機(jī)識(shí)別的模板是經(jīng)過大量包含草書的訓(xùn)練樣本統(tǒng)計(jì)學(xué)習(xí)得到的,聯(lián)機(jī)識(shí)別方法的模板也是經(jīng)過學(xué)習(xí)這些樣本,通過對(duì)筆順的聚類得到的多筆順模板。
      本發(fā)明的脫機(jī)識(shí)別方法的流程圖如附圖2所示,具體為將輸入軌跡的時(shí)序點(diǎn)位置歸一化,然后用等寬線段連接所有相鄰時(shí)序點(diǎn),從而重構(gòu)漢字圖像,再用彈性網(wǎng)格提取漢字輪廓方向角特征,得出多維特征后,通過LDA降維,以便距離分類器的計(jì)算,通過距離分類器計(jì)算降維后的特征矢量與模板中所有漢字的特征矢量的歐式距離,將模板中所有漢字按歐式距離從小到大排序,選取前100個(gè)漢字作為脫機(jī)識(shí)別的候選字序列。
      本發(fā)明的聯(lián)機(jī)識(shí)別方法流程框圖如附圖3所示,對(duì)輸入時(shí)序點(diǎn)進(jìn)行特征點(diǎn)采樣,然后計(jì)算每個(gè)特征點(diǎn)的筆畫方向角,作為特征點(diǎn)的方向特征,再將所有特征點(diǎn)的方向特征依序作為整個(gè)漢字筆畫方向特征矢量,與每一個(gè)脫機(jī)識(shí)別候選字進(jìn)行彈性匹配,按匹配相似度將所有候選字按從大到小排序,最后記錄排序后的漢字序列作為聯(lián)機(jī)識(shí)別候選字序列。
      本發(fā)明的脫機(jī)與聯(lián)機(jī)的識(shí)別結(jié)果集成的流程框圖如附圖4所示,其通過分別計(jì)算每個(gè)脫機(jī)識(shí)別候選字在候選字序列中的位置分?jǐn)?shù),和每個(gè)聯(lián)機(jī)識(shí)別候選字的位置分?jǐn)?shù),然后計(jì)算聯(lián)機(jī)識(shí)別結(jié)果候選字的可信度區(qū)間,再將可信度區(qū)間內(nèi)的聯(lián)機(jī)識(shí)別候選字與脫機(jī)識(shí)別候選字按每個(gè)字的位置分?jǐn)?shù)從大到小排序,再按首選識(shí)別結(jié)果選擇器的規(guī)則選出首選結(jié)果,作為識(shí)別結(jié)果。
      權(quán)利要求
      1.一種手寫文字的識(shí)別方法,其特征在于通過脫機(jī)文字識(shí)別方法和聯(lián)機(jī)文字識(shí)別方法相結(jié)合對(duì)手寫文字進(jìn)行識(shí)別,所述脫機(jī)文字識(shí)別方法包括(1)、重構(gòu)手寫文字圖像;(2)、通過文字圖像提取文字筆畫的輪廓方向角特征;(3)、選取脫機(jī)識(shí)別候選字;所述聯(lián)機(jī)文字識(shí)別方法包括(A)、提取手寫文字時(shí)序點(diǎn)的聯(lián)機(jī)筆畫方向特征;(B)、選取聯(lián)機(jī)識(shí)別候選字。
      2.根據(jù)權(quán)利要求1所述的手寫文字的識(shí)別方法,其特征在于所述步驟(1)重構(gòu)手寫文字圖像通過采集手寫文字時(shí)序點(diǎn)軌跡坐標(biāo),并將時(shí)序點(diǎn)軌跡線性歸一化到固定大小,再用等寬的線段依次連接所有相鄰的時(shí)序點(diǎn),從而重構(gòu)出原手寫漢字的圖像。
      3.根據(jù)權(quán)利要求1或2所述的手寫文字的識(shí)別方法,其特征在于所述步驟(2)提取文字筆畫的輪廓方向角特征通過把漢字圖像在水平和垂直兩個(gè)方向上的直方圖投影畫出4x4的全局彈性網(wǎng)格,使得每一列網(wǎng)格在水平方向上的直方圖投影累積量相等,每一行網(wǎng)格在垂直方向上的直方圖投影累積量相等,再根據(jù)每個(gè)網(wǎng)格水平和垂直兩個(gè)方向上的直方圖投影在網(wǎng)格內(nèi)畫出2x2的局部彈性網(wǎng)格,提取出文字的輪廓,然后對(duì)每個(gè)彈性網(wǎng)格單元內(nèi)的輪廓在4個(gè)方向上進(jìn)行輪廓方向角特征提取,得出輪廓方向角特征。
      4.根據(jù)權(quán)利要求3所輸?shù)氖謱懳淖值淖R(shí)別方法,其特征在于所述4個(gè)方向?yàn)闄M撇、撇豎、豎捺、橫捺。
      5.根據(jù)權(quán)利要求4所述的手寫文字的識(shí)別方法,其特征在于對(duì)漢字圖像經(jīng)過輪廓提取后,對(duì)字符輪廓點(diǎn)P的8鄰域通過&theta;(p)=tan-1(DxDy)]]>計(jì)算該輪廓點(diǎn)的輪廓方向角,其中Dx、Dy是p點(diǎn)在x軸和y軸上的梯度函數(shù),且Dx、Dy定義為Dx=(p6+2p7+p8)-(p1+2p2+p3)Dy=(p3+2p5+p8)-(p1+2p4+p6)而輪廓點(diǎn)p的8鄰域?yàn)?br> 6.根據(jù)權(quán)利要求5所述的手寫文字的識(shí)別方法,其特征在于所述步驟(2)提取文字筆畫的輪廓方向角特征還包括線性判決分析(LDA)對(duì)輪廓方向角特征進(jìn)行降維,將原先的256維數(shù)降為128維數(shù)。
      7.根據(jù)權(quán)利要求6所述的手寫文字的識(shí)別方法,其特征在于所述步驟(3)選取脫機(jī)識(shí)別候選字通過計(jì)算輪廓方向角特征與模板中所有文字特征的歐式距離,選出距離最小的前100個(gè)候選字作為脫機(jī)識(shí)別候選字。
      8.根據(jù)權(quán)利要求7所述的手寫文字的識(shí)別方法,其特征在于所述步驟(A)提取手寫文字筆畫時(shí)序點(diǎn)的方向特征通過對(duì)手寫文字筆畫時(shí)序點(diǎn)按固定距離進(jìn)行采樣,又定義采樣后的特征點(diǎn)的筆畫方向角為前一特征點(diǎn)指向該特征點(diǎn)的方向角度,范圍為0到255,線性對(duì)應(yīng)0到359度,然后計(jì)算每個(gè)特征點(diǎn)的筆畫方向角,作為該特征點(diǎn)的聯(lián)機(jī)筆畫方向特征。
      9.根據(jù)權(quán)利要求8所述的手寫文字的識(shí)別方法,其特征在于所述步驟(B)選取聯(lián)機(jī)識(shí)別候選字通過動(dòng)態(tài)時(shí)間規(guī)整(DTW)的方法對(duì)聯(lián)機(jī)筆畫方向特征矢量與步驟(3)得出的脫機(jī)識(shí)別候選字的多種不同筆順的模板特征矢量進(jìn)行彈性模板匹配,計(jì)算脫機(jī)識(shí)別候選字與聯(lián)機(jī)筆畫方向特征的匹配相似度,其中,DTW彈性匹配的局部距離函數(shù)采用如下關(guān)系式計(jì)算d(i,j)=(&Delta;&theta;)20&le;&Delta;&theta;&lt;64-(&Delta;&theta;-128)2+819264&le;&Delta;&theta;&lt;128,]]>而&Delta;&theta;=|&theta;i-&theta;j|0&le;|&theta;i-&theta;j|&lt;128256-|&theta;i-&theta;j|128&le;|&theta;i-&theta;j|&lt;256,]]>i和j分別為當(dāng)前匹配的兩特征值在各自特征序列中的位置,θ為輪廓方向角特征;然后再將100個(gè)脫機(jī)識(shí)別候選字按其與聯(lián)機(jī)筆畫方向特征匹配相似度由大到小排序,組成100個(gè)聯(lián)機(jī)識(shí)別方法候選字。
      10.根據(jù)權(quán)利要求9所述的手寫文字的識(shí)別方法,其特征在于通過對(duì)脫機(jī)識(shí)別候選字和聯(lián)機(jī)識(shí)別候選字進(jìn)行集成完成對(duì)手寫文字的識(shí)別,具體包括如下步驟(I)、計(jì)算脫機(jī)識(shí)別候選字中每個(gè)候選字的位置分?jǐn)?shù)Si,Si=i*exp(1-i)*D+i′*exp(1-i′)*C其中i為該候選字在脫機(jī)識(shí)別候選字序列中的位置,范圍為1到100,i’為該候選字在聯(lián)機(jī)識(shí)別候選字序列中所處的位置,范圍也為1到100,C和D為兩個(gè)常數(shù);(II)、計(jì)算聯(lián)機(jī)識(shí)別候選字中每個(gè)候選字的位置分?jǐn)?shù)Tj,Tj=j(luò)*exp(1-j)*C-Pj其中j為該候選字在聯(lián)機(jī)識(shí)別候選字序列中的位置,范圍為1到100,C為常數(shù),且與步驟(I)的C相同,Pj為預(yù)先定義好的懲罰分?jǐn)?shù),根據(jù)j的不同而不同;(III)、根據(jù)聯(lián)機(jī)識(shí)別候選字的匹配相似度選擇可信度區(qū)間1到M,位置在M以后的候選字認(rèn)為是不可信的候選字;(IV)、將脫機(jī)識(shí)別候選字與聯(lián)機(jī)識(shí)別候選字序列合在一起按照每個(gè)候選字的位置分?jǐn)?shù)從大到小排序,得出集成候選字序列;(V)、選取一個(gè)候選字作為識(shí)別結(jié)果,通過定義Ai為聯(lián)機(jī)識(shí)別候選字,Bj為脫機(jī)識(shí)別候選字,i和j的范圍為1到100,分別對(duì)應(yīng)100個(gè)候選字,如果A1=B1,則選擇A1;如果A1非??尚?,而B1不太可信,則選擇A1;如果B1很可信,則選擇B1;如果Ak=B1且B1=A1,k和l的范圍為1到35,而k<l,則選B1,k>l則選A1;如果Ak=B2且B1=A2,k和l的范圍為1到15,而k<l,則選B1,k>l則選A1;如果以上各個(gè)條件均不滿足,則選擇集成候選字序列的首個(gè)候選字。
      全文摘要
      本發(fā)明提供一種基于脫機(jī)識(shí)別方法和聯(lián)機(jī)識(shí)別方法集成的手寫文字的識(shí)別方法,其脫機(jī)識(shí)別方法主要包括對(duì)漢字筆畫輪廓方向角特征的彈性網(wǎng)格特征提取技術(shù)以及線性判別分析(LDA)對(duì)高維特征降維;聯(lián)機(jī)識(shí)別方法主要包括對(duì)漢字筆畫方向特征進(jìn)行模糊提取以及一種可變性較強(qiáng)的筆畫模板彈性匹配方法;本發(fā)明大大提高了對(duì)連筆草書漢字的識(shí)別效果,不僅能識(shí)別規(guī)范書寫的漢字,也能夠?qū)B筆草書漢字進(jìn)行識(shí)別,故而可以讓用戶無限制地自由書寫漢字,還可以提高手寫輸入時(shí)用戶書寫漢字的速度。
      文檔編號(hào)G06K9/00GK1652138SQ20051003317
      公開日2005年8月10日 申請(qǐng)日期2005年2月8日 優(yōu)先權(quán)日2005年2月8日
      發(fā)明者金連文, 龍騰 申請(qǐng)人:華南理工大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1