一種手寫識別方法、系統(tǒng)及手寫識別終端的制作方法

文檔序號：6371831閱讀：134來源：國知局

專利名稱：一種手寫識別方法、系統(tǒng)及手寫識別終端的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及模式識別技術(shù)，特別是涉及一種基于最大熵模型的手寫識別方法、系統(tǒng)及手寫識別終端。
背景技術(shù)：
手寫識別(Handwriting Recognize),是指將在手寫設(shè)備上書寫時產(chǎn)生的有序軌跡信息轉(zhuǎn)化為漢字內(nèi)碼的過程，實際上是手寫軌跡的坐標序列到漢字內(nèi)碼的一個映射過程，是人機交互最自然、最方便的手段之一。目前用于手寫輸入的設(shè)備有許多種，比如電磁感應手寫板、壓感式手寫板、觸摸屏、觸控板、超聲波筆等。用戶在手寫輸入設(shè)備上書寫的筆畫以類似于矢量圖的形式被計算機存儲下來，通過對文字圖像的抬筆、落筆、筆跡上各像素的空間位置等信息進行處理與對照，系統(tǒng)將數(shù)據(jù)轉(zhuǎn)化為計算機所使用的文字編碼進行輸出。隨著智能手機、掌上電腦等移動信息工具的普及，手寫識別技術(shù)也進入了規(guī)模應用時代，可廣泛應用于各種桌面操作系統(tǒng)、嵌入式操作系統(tǒng)中。手輸入的模式也從單字手寫識別發(fā)展到了多字手寫識別，多字字符的切割是影響手寫識別準確性和用戶體驗性的關(guān)鍵技術(shù)，目前采用的字符切割算法大部分是基于規(guī)則來完成切割點的判斷，且無法給出判斷為切割點的概率，因此切割后的字符識別結(jié)果經(jīng)常出現(xiàn)錯誤，從而導致識別率的下降，影響多字輸入的手寫體驗。

發(fā)明內(nèi)容
本發(fā)明提供一種手寫識別方法、系統(tǒng)及字符識別終端，以解決現(xiàn)有的字符識別結(jié)果經(jīng)常出現(xiàn)錯誤，導致識別率下降，進而影響多字輸入的手寫體驗的問題。為了解決上述問題，本發(fā)明公開了一種手寫識別方法，包括采集連續(xù)輸入的筆跡；提取筆跡特征；將筆跡特征輸入到最大熵模型中，最大熵模型判斷當前的筆畫是否為切割點；如果是，則對字符進行切割，得到最終識別結(jié)果。優(yōu)選的，最大熵模型判斷當前的筆畫是否為切割點包括最大熵模型利用筆跡特征給出當前筆畫為切割點的概率；如果得到的概率大于預設(shè)概率則當前筆畫為切割點。優(yōu)選的，還包括確定預設(shè)概率的步驟，確定預設(shè)概率包括對所述字符筆跡進行切害I]，得到至少一條切分路徑；對各切分路徑進行單字識別，針對每一個切分路徑得到候選識別結(jié)果及得到該候選識別結(jié)果的第一概率值；利用語言模型對各候選識別結(jié)果進行打分，得出針對每個候選識別結(jié)果的表示字符間關(guān)聯(lián)信息的第二概率值；根據(jù)各候選識別結(jié)果的第一概率值和第二概率值得到各候選識別結(jié)果的綜合概率值；選擇最大綜合概率值為預設(shè)概率。優(yōu)選的，采集連續(xù)輸入的筆跡包括采集以疊字連續(xù)輸入的字符筆跡或以行或以列連續(xù)輸入的字符筆跡。優(yōu)選的，還包括建立最大熵模型,所述建立最大熵模型包括選擇最大熵模型特征，準備訓練數(shù)據(jù)，訓練最大熵模型。優(yōu)選的，選擇的最大熵模型特征包括選擇以疊字連續(xù)輸入的字符筆跡的筆跡特征；即選擇筆畫間的相對位置、筆畫位于書寫區(qū)域的位置、筆畫落筆點所在的區(qū)域位置、抬筆點所在的區(qū)域位置、增加筆畫的大小比例、筆畫高度占書寫區(qū)域高度的比例或筆畫寬度占書寫區(qū)域?qū)挾鹊谋壤兄辽僖粋€特征作為最大熵模型的特征。優(yōu)選的，選擇的最大熵模型特征包括選擇以行連續(xù)輸入的字符筆跡的筆跡特征，即選擇當前字符前面空隙的寬度、后面空隙的寬度和當前字符的寬高比中至少一個特征作為最大熵模型的特征；選擇以列連續(xù)輸入的字符筆跡的筆跡特征，即選擇當前字符上面空隙的寬度、下面空隙的寬度和當前字符的寬高比中至少一個特征作為最大熵模型的特征。本發(fā)明還公開了一種手寫識別系統(tǒng)，包括采集模塊，用于采集連續(xù)輸入的筆跡；特征提取模塊用于提取筆跡特征；切割模塊，用于將筆跡特征輸入到最大熵模型中，最大熵模型判斷當前的筆畫是否為切割點；識別模塊，用于當當前的筆畫為切割點時，對字符進行切割，得到最終識別結(jié)果。優(yōu)選的，手寫識別系統(tǒng)還包括確定模塊，用于確定預設(shè)概率；所述確定模塊包括切割子模塊；用于對所述字符筆跡進行切割，得到至少一條切分路徑；單字識別子模塊；用于對各切分路徑進行單字識別，針對每一個切分路徑得到候選識別結(jié)果及得到該候選識別結(jié)果的第一概率值；語言模型識別子模塊；用于利用語言模型對各候選識別結(jié)果進行打分，得出針對每個候選識別結(jié)果的表示字符間關(guān)聯(lián)信息的第二概率值；綜合判斷子模塊；用于根據(jù)各候選識別結(jié)果的第一概率值和第二概率值得到各候選識別結(jié)果的綜合概率值；選擇子模塊；用于選擇最大綜合概率值為預設(shè)概率。本發(fā)明還公開了一種手寫識別終端，包括本發(fā)明公開的一種手寫識別系統(tǒng)。與現(xiàn)有技術(shù)相比，本發(fā)明具有以下優(yōu)點本發(fā)明給出的基于最大熵的字符切割方法，是基于統(tǒng)計的預測模型，可以對字符筆畫與筆畫之間的關(guān)系進行更加準確的判斷，從而確認是否為切割點，并給出判斷為切割點的概率，更加綜合且全面的判斷字符間的切割，提高識別結(jié)果的準確性。

圖I是本發(fā)明實施例所述一種手寫識別方法流程圖；圖2是本發(fā)明實施例所述一種手寫識別系統(tǒng)的結(jié)構(gòu)圖。
具體實施例方式為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂，下面結(jié)合附圖和具體實施方式
對本發(fā)明作進一步詳細的說明。本發(fā)明提出一種手寫識別方法、系統(tǒng)及終端，該方法可以提取用戶連續(xù)書寫的筆跡特征輸入到最大熵模型中進行是否為切割點的判斷，可以對字符筆畫與筆畫之間的關(guān)系進行更加準確的判斷，提高識別結(jié)果的準確性。
下面通過實施例進行詳細說明。參照圖1，是本發(fā)明實施例所述一種手寫識別方法流程圖。步驟11，采集連續(xù)輸入的筆跡；步驟12，提取筆跡特征；用戶在同一塊手寫區(qū)域中可以重復連續(xù)輸入多個字符，所述字符包含中文文字、標點符號、英文字母等形式。采集用戶連續(xù)輸入的字符筆跡，所述字符筆跡是指以筆畫形式輸入的信息。采集手寫輸入的設(shè)備有多種，如電磁感應手寫板、壓感式手寫板、觸摸屏、觸控板、超聲波筆等，不同設(shè)備在采集時都是利用設(shè)備上安裝的感應裝置記錄下用戶書寫的坐標，即筆跡點。通常將落筆的位置記為一個筆畫的起始位置，將抬筆的位置記為一個筆畫的終止位置，落筆位置和抬筆位置之間的一系列筆跡點構(gòu)成一個輸入筆畫。步驟13，將筆跡特征輸入到最大熵模型中，最大熵模型判斷當前的筆畫是否為切割點;本實施例所述的手寫識別方法中，采集到的是用戶連續(xù)輸入的多個字符筆跡，實際應用中可以是采集以疊字連續(xù)輸入的字符筆跡的筆跡點；或者采集以行連續(xù)輸入的字符筆跡的筆跡點；或者采集以列連續(xù)輸入的字符筆跡的筆跡點。在進行判斷是否為切割點之前還需要建立最大熵模型，具體的建立最大熵模型可以包括選擇最大熵模型特征，準備訓練數(shù)據(jù)，訓練最大熵模型。下面舉個具體的例子詳細說明( I)選擇最大熵模型特征選擇與字符筆畫位置有關(guān)的特征作為最大熵模型的特征。在選擇時根據(jù)不同的輸入情況選擇不同的筆跡特征，例如在疊字連續(xù)輸入的情況下，選擇的筆跡特征可以包括筆畫間的相對位置、筆畫位于書寫區(qū)域的位置、筆畫落筆點所在的區(qū)域位置、抬筆點所在的區(qū)域位置、增加筆畫的大小比例、筆畫高度占書寫區(qū)域高度的比例或筆畫寬度占書寫區(qū)域?qū)挾鹊谋壤忍卣髦械闹辽僖粋€等特征作為最大熵模型的特征。所選取的特征包括但不局限于上述羅列的特征，可以根據(jù)實際應用的需用而選取所需筆跡特征。在以行連續(xù)輸入的情況下，選擇的筆跡特征可以包括當前字符前面空隙的寬度、后面空隙的寬度、當前字符的寬高比等特征中的至少一個特征作為最大熵模型的特征；以列連續(xù)輸入的字符筆跡的筆跡特征，即選擇當前字符上面空隙的寬度、下面空隙的寬度和當前字符的寬高比中至少一個特征作為最大熵模型的特征。下面以疊字輸入舉例說明。(2)準備訓練數(shù)據(jù)在選擇最大熵模型的特征之后，進行訓練數(shù)據(jù)的準備，需要確定模型中字符筆畫位置的特征。如筆畫間的相對位置、筆畫位于書寫區(qū)域的位置等等，即上述模型中的X。然后進行數(shù)據(jù)準備，準備一些疊字字符筆畫，并根據(jù)確定的特征進行標注?？紤]一個隨機過程p (y I x)，它根據(jù)能觀測到的向量x，以一定的概率輸出某個y，y屬于一個有限集合Y。在字符切割的判斷中，Y={1，0}，分別表示切割點和非切割點。X代表與字符筆畫位置有關(guān)的特征，即待判決的疊字字符筆畫，包括筆畫間的相對位置、筆畫位于書寫區(qū)域的位置等等。為了重建隨機過程P (y I x)，我們對其輸出進行采樣，得到N個訓練樣例(Xpy1), (x2, y2),……，(xN，yN)。由于這些訓練樣例由此隨機過程產(chǎn)生，所以我們假設(shè)某個事件在訓練樣例中的經(jīng)驗概率，等于該事件在已知P(y|x)時的期望概率。(3)訓練最大熵模型在準備好訓練數(shù)據(jù)后，利用準備好的訓練數(shù)據(jù)來訓練最大熵模型。將上一步標注了筆畫間的相對位置、筆畫位于書寫區(qū)域位置的字符筆畫位置后的數(shù)據(jù)送入最大熵模型訓練，數(shù)據(jù)格式為是否切割，特征1，特征2……某個事件可以用一個表征函數(shù)&(1，y)來表示。如果樣例(Xj，Yj)中發(fā)生了此事件，則fi(Xi，Yi) =1；否則為O。例如如果X滿足前一個字符書寫完成，且y為切割點，則fi (x, y)=l ;其他情況，則fi(x, y)=0。該事件在訓練樣例中的經(jīng)驗概率表示為
權(quán)利要求
1.一種手寫識別方法，其特征在于，包括采集連續(xù)輸入的筆跡；提取筆跡特征；將筆跡特征輸入到最大熵模型中，最大熵模型判斷當前的筆畫是否為切割點；如果是，則對字符進行切割，得到最終識別結(jié)果。
2.根據(jù)權(quán)利要求I所述的方法，其特征在于，所述最大熵模型判斷當前的筆畫是否為切割點包括最大熵模型利用筆跡特征給出當前筆畫為切割點的概率；如果得到的概率大于預設(shè)概率則當前筆畫為切割點。
3.根據(jù)權(quán)利要求2所述的方法，其特征在于，還包括確定預設(shè)概率，所述確定預設(shè)概率包括對所述字符筆跡進行切割，得到至少一條切分路徑；對各切分路徑進行單字識別，針對每一個切分路徑得到候選識別結(jié)果及得到該候選識別結(jié)果的第一概率值；利用語言模型對各候選識別結(jié)果進行打分，得出針對每個候選識別結(jié)果的表示字符間關(guān)聯(lián)信息的第二概率值；根據(jù)各候選識別結(jié)果的第一概率值和第二概率值得到各候選識別結(jié)果的綜合概率值；選擇最大綜合概率值為預設(shè)概率。
4.根據(jù)權(quán)利要求I所述的方法，其特征在于，所述采集連續(xù)輸入的筆跡包括采集以疊字連續(xù)輸入的字符筆跡或以行或以列連續(xù)輸入的字符筆跡。
5.根據(jù)權(quán)利要求I所述的方法，其特征在于，還包括建立最大熵模型，所述建立最大熵模型包括選擇最大熵模型特征，準備訓練數(shù)據(jù)，訓練最大熵模型。
6.根據(jù)權(quán)利要求5所述的方法，其特征在于，所述選擇的最大熵模型特征包括選擇以疊字連續(xù)輸入的字符筆跡的筆跡特征；即選擇筆畫間的相對位置、筆畫位于書寫區(qū)域的位置、筆畫落筆點所在的區(qū)域位置、抬筆點所在的區(qū)域位置、增加筆畫的大小比例、筆畫高度占書寫區(qū)域高度的比例或筆畫寬度占書寫區(qū)域?qū)挾鹊谋壤兄辽僖粋€特征作為最大熵模型的特征。
7.根據(jù)權(quán)利要求5所述的方法，其特征在于，所述選擇的最大熵模型特征包括選擇以行連續(xù)輸入的字符筆跡的筆跡特征，即選擇當前字符前面空隙的寬度、后面空隙的寬度和當前字符的寬高比中至少一個特征作為最大熵模型的特征；選擇以列連續(xù)輸入的字符筆跡的筆跡特征，即選擇當前字符上面空隙的寬度、下面空隙的寬度和當前字符的寬高比中至少一個特征作為最大熵模型的特征。
8.一種手寫識別系統(tǒng)，其特征在于，包括采集模塊，用于采集連續(xù)輸入的筆跡；特征提取模塊用于提取筆跡特征；切割模塊，用于將筆跡特征輸入到最大熵模型中，最大熵模型判斷當前的筆畫是否為切割點；識別模塊，用于當當前的筆畫為切割點時，對字符進行切割，得到最終識別結(jié)果。
9.根據(jù)權(quán)利要求8所述系統(tǒng)，其特征在于，還包括確定模塊，用于確定預設(shè)概率；所述確定模塊包括切割子模塊；用于對所述字符筆跡進行切割，得到至少一條切分路徑；單字識別子模塊；用于對各切分路徑進行單字識別，針對每一個切分路徑得到候選識別結(jié)果及得到該候選識別結(jié)果的第一概率值；語言模型識別子模塊；用于利用語言模型對各候選識別結(jié)果進行打分，得出針對每個候選識別結(jié)果的表示字符間關(guān)聯(lián)信息的第二概率值；綜合判斷子模塊；用于根據(jù)各候選識別結(jié)果的第一概率值和第二概率值得到各候選識別結(jié)果的綜合概率值；選擇子模塊；用于選擇最大綜合概率值為預設(shè)概率。
10.一種手寫識別終端，其特征在于，包括權(quán)利要求8-9任一所述的手寫識別系統(tǒng)。
全文摘要
本發(fā)明提供一種手寫識別方法、系統(tǒng)及字符識別終端，以解決現(xiàn)有的字符識別結(jié)果經(jīng)常出現(xiàn)錯誤，導致識別率下降，進而影響多字輸入的手寫體驗的問題。本發(fā)明公開的一種手寫識別方法，包括采集連續(xù)輸入的筆跡；提取筆跡特征；將筆跡特征輸入到最大熵模型中，最大熵模型判斷當前的筆畫是否為切割點；如果是，則對字符進行切割，得到最終識別結(jié)果。本發(fā)明給出的基于最大熵的字符切割方法，是基于統(tǒng)計的預測模型，可以對字符筆畫與筆畫之間的關(guān)系進行更加準確的判斷，從而確認是否為切割點，并給出判斷為切割點的概率，更加綜合且全面的判斷字符間的切割，提高識別結(jié)果的準確性。
文檔編號G06K9/46GK102750552SQ20121020591
公開日2012年10月24日申請日期2012年6月18日優(yōu)先權(quán)日2012年6月18日
發(fā)明者張連毅, 李健, 武衛(wèi)東, 鄭曉明申請人:北京捷通華聲語音技術(shù)有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李健;鄭曉明;張連毅;武衛(wèi)東
技術(shù)所有人：北京捷通華聲語音技術(shù)有限公司
我是此專利的發(fā)明人

上一篇：用于電遷移容忍電源分配的自動置放和布線方法
上一篇：極地投影模式下多變量時空數(shù)據(jù)的可視化方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構(gòu)動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>