專利名稱:手寫體字符識別裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及手寫體字符的識別裝置。
本發(fā)明是在使用不按輸入筆劃數(shù)進(jìn)行大分類的樹型結(jié)構(gòu)辭典的手寫體字符識別裝置上,在樹結(jié)構(gòu)的每一分枝上定義有該分枝所允許的保留筆劃數(shù),然后根據(jù)輸入字符的未檢驗(yàn)筆劃數(shù)與分枝上的筆劃數(shù)相比較,以實(shí)現(xiàn)更高的識別速度。
一般,聯(lián)機(jī)方式的手寫體字符識別,按下列二個階段進(jìn)行處理,亦即第一階段從手寫體字符的筆跡提取出各種特征(特征數(shù)據(jù)),這些手寫體字符從圖形輸入板上輸入。
第二階段將提取出的特征數(shù)據(jù)和辭典中所登錄的各字符的特征(測試碼)進(jìn)行比較檢驗(yàn),檢測出一致度足夠高的字符。
此時如果進(jìn)行第二階段的處理時的識別辭典為樹型結(jié)構(gòu),那么,不僅識別辭典的容量可以減小,且可高速進(jìn)行比較檢驗(yàn)。
圖4是這種樹型結(jié)構(gòu)識別辭典的示意簡圖,(31)~(42)是測試分枝(亦即比較檢驗(yàn)不間斷掃描時的比較檢驗(yàn)掃描順序),(51)~(56)是分叉節(jié)點(diǎn),C1~C7是識別結(jié)果的字符碼。其中,字符碼Cn(n=1~7)是在分枝(31)~(42)中的末端分枝(34)~(36),(38),(40)~(42)中一一分別定義的。
當(dāng)手寫體字符被輸入,其特征被提取后,首先,在分枝(31)上,從識別辭典中取出測試碼,并根據(jù)此測試碼來檢驗(yàn)該特征數(shù)據(jù)。然后,根據(jù)分枝(31)的檢驗(yàn)結(jié)果,掃描從分叉節(jié)點(diǎn)(51)向下一分枝例如分枝(32)前進(jìn),同樣地,從分叉節(jié)點(diǎn)(52)轉(zhuǎn)到分枝(33)。
但是,在分枝(33)上,如果測試碼與筆跡數(shù)據(jù)的不一致度很高的話,那么該分枝(33)便被認(rèn)為是不合格。
于是,掃描返回到分枝(33)和分枝(36)的分叉節(jié)點(diǎn)(52),然后轉(zhuǎn)入分枝(36),在該分枝(36)上,若測試碼與特征數(shù)據(jù)的一致度足夠高的話,由于分枝(36)是末端分枝,就把定義于這個分枝(36)中的字符碼C3作為輸入字符的識別結(jié)果而輸出之。
進(jìn)而,在分枝(38)中,若測試碼與筆跡數(shù)據(jù)的一致度也很高的話,那么就把定義在這個分枝(38)中的字符碼C4作為輸入字符識別結(jié)果的第2候選加以輸出,同樣地,有時還會輸出第3或更多的候選碼。
但是,在上述這樣的樹型結(jié)構(gòu)的識別字典中,因?yàn)樵谳斎胱址墓P劃數(shù)和測試字符的筆劃數(shù)并不一致的分枝上也要進(jìn)行檢驗(yàn),因此使識別的速度被降低了。
本發(fā)明就是要解決這樣的問題而研制的裝置。
為此,本發(fā)明中,在識別辭典的分枝中,登錄著該分枝中所允許保留的筆劃數(shù)的范圍,在上述手寫體字符識別時,把上述保留筆劃數(shù)的范圍與上述被輸入的手寫體字符的未檢驗(yàn)筆劃數(shù)進(jìn)行比較測試,僅當(dāng)上述被輸入的手寫體字符的未檢驗(yàn)筆劃數(shù)處于上述保留筆劃數(shù)的范圍內(nèi)時,才在該分枝上繼續(xù)進(jìn)行掃描,對上述被輸入的手寫體字符進(jìn)行識別。
由于對不必要的分枝不再進(jìn)行檢驗(yàn),從而使識別速度得到提高。
圖1是本發(fā)明的功能構(gòu)成示例框圖;圖2是該辭典的構(gòu)造示意圖;圖3是本發(fā)明的一個示例的流程圖,圖4是用于說明的圖,其中(11)是圖形輸入板;(12)是預(yù)處理電路;(13)是緩沖器;(14)是筆劃特征提取電路;(15)是筆劃特征緩沖器;(16)是未檢驗(yàn)緩沖器;(17)是識別電路;(18)是識別辭典;(19)是輸出緩沖器。
圖1中,若在圖形輸入板(11)上書寫字符,則該圖形輸入板(11)的輸出數(shù)據(jù)便提供給予處理電路(12),以進(jìn)行除去噪音和數(shù)字化(折線近似)等予處理,經(jīng)過予處理的數(shù)據(jù),被提供給輸入緩沖器(13),并加以存儲。
進(jìn)而,在筆劃特征提取電路(14)中,從緩沖器(13)的數(shù)據(jù)中,針對輸入字符的每一筆劃,提取作為特征數(shù)據(jù)的該筆劃的特征,在把這些特征數(shù)據(jù)存儲到筆劃特征緩沖器(15)中的同時,把未檢驗(yàn)緩沖器(16)的值遞增1。
這樣地,從圖形輸入板(11)輸入的一個字符,對它的每一筆劃,生成一個特征數(shù)據(jù),在把這些特征數(shù)據(jù)順序地存儲到緩沖器(15)中的同時,緩沖器(16)的值也隨之遞增。
進(jìn)而,當(dāng)輸入完一個字符時,在識別電路(17)中,把存儲在緩沖器(15)中的特征數(shù)據(jù)與識別辭典(18)的測試碼進(jìn)行比較檢驗(yàn)。而且每檢驗(yàn)一劃,就將檢驗(yàn)緩沖器(16)的值遞減1。
這種識別辭典(18)的結(jié)構(gòu)情況,例如可以用“枚”和“検”字來加以說明。
“枚”具有構(gòu)辭部分“木”,此外,剩余的筆劃數(shù)是2~4劃,具有構(gòu)辭部分“攵”。
“検”具有構(gòu)辭部分“木”,此外,剩余的筆劃數(shù)為5~8劃,具有構(gòu)辭部分“人”和“
”。因此,用樹型結(jié)構(gòu)來表示時,如圖2所示,經(jīng)由檢驗(yàn)“木”的分枝(21)→分叉節(jié)點(diǎn)(22)→檢驗(yàn)出具有保留劃數(shù)為2~4劃的分枝(23)→檢定“攵”的分枝(24)這一途徑由分枝(21)至(24)進(jìn)行,在分枝(24)上定義出“枚”的字符碼Cm。
此外,沿分叉節(jié)點(diǎn)(22)→檢驗(yàn)保留有筆劃數(shù)為5~8劃的分枝(25)→檢定“人”的分枝(26)→檢定“
”的分枝(27)這條途徑由分枝(22)至(27)進(jìn)行,在分枝(27)上定義出“検”的字符碼Ck。
此時,當(dāng)掃描辭典(18)時,或者是碰到了分叉節(jié)點(diǎn),或者碰到如命令(23)、(25)那樣的檢驗(yàn)保留筆劃數(shù)的命令的情形,即把緩沖器(16)的值與識別辭典中所登錄的保留筆劃數(shù)的范圍相比較,在范圍內(nèi)時,掃描進(jìn)入后續(xù)分枝,而在范圍外時,掃描轉(zhuǎn)入下一分枝(相鄰的分枝)。
例如,當(dāng)輸入“枚”字時,掃描從分枝(21)開始,通過分叉節(jié)點(diǎn)(22),進(jìn)入分枝(23),在分枝(23),將緩沖器(16)的值,與分枝(23)中存儲的保留筆劃數(shù)的范圍“2~4劃”相比較,在現(xiàn)在所說的情形,因?yàn)榍≡诜秶鷥?nèi),因此掃描從分枝(23)進(jìn)入分枝(24),由于分枝(24)的檢驗(yàn)合格,從而取出了“枚”的字符碼Cm。
此外,在輸入“検”字時,掃描從分枝(21),通過分叉節(jié)點(diǎn)(22),進(jìn)入分枝(23),在這個分枝(23)內(nèi),把緩沖器(16)的值與分枝(23)中登錄著的保留筆劃數(shù)范圍“2~4劃”相比較,此次因在范圍外,故掃描從分枝(23),通過分叉節(jié)點(diǎn)(22),進(jìn)入分枝(25),在此分枝(25)中,將緩沖器(16)的值與分枝(25)中登錄著的保留筆劃數(shù)范圍“5~8劃”相比較,現(xiàn)在因在范圍以內(nèi),故掃描從分枝(25)進(jìn)入分枝(26)、(27),從而取出了“検”的字符碼Ck。
這樣地順序地進(jìn)行檢驗(yàn),當(dāng)?shù)玫搅嗽撟R別結(jié)果的字符碼后,便把它們從識別電路(17)輸出,存儲到輸出緩沖器(19)中。
圖3是采用軟件處理進(jìn)行上述字符識別的處理子程序示例。
亦即,當(dāng)從圖形輸入板(11)輸入一個字符部分時,檢驗(yàn)處理即從第(101)步開始,在(102)步,輸入字符的全部筆劃數(shù)被存儲到未檢驗(yàn)緩沖器(16)中。
其后,在(111)步,檢查登錄在辭典(18)中的命令是否是保留筆劃范圍檢驗(yàn)命令?如果是,處理便進(jìn)入(112)步;在(112)步,檢查緩沖器(16)中的值是否在辭典(18)中所登錄的保留筆劃數(shù)范圍內(nèi),若在范圍內(nèi),處理便從(112)步返回到(111)步。這些處理對應(yīng)著例如掃描從分叉節(jié)點(diǎn)(22),通過分枝(23)而進(jìn)入分枝(24)的情形。
此外,在(111)步,若不是檢驗(yàn)保留筆劃數(shù)范圍的命令,處理即從(111)步進(jìn)入(121)步。在(121)步,檢查辭典(18)中登錄的命令是否是筆劃形狀檢定命令,如果是,處理從(121)步進(jìn)入(122)步,在(121)步,對筆劃形狀進(jìn)行檢驗(yàn),確定其是否合格。
進(jìn)而,在筆劃形狀合格時,處理從(122)步進(jìn)入(123)步。在此(123)步,每當(dāng)(122)步檢驗(yàn)出一條合格筆劃,便將未檢驗(yàn)緩沖器(16)中所存儲的保留筆劃數(shù)遞減1,然后處理返回到(111)步。這些處理,對應(yīng)著例如掃描通過分枝(24)的情形。
此外,在(121)步,若不是筆劃形狀檢驗(yàn)命令,處理從(121)步進(jìn)入(131)步,在(131)步,進(jìn)行其它內(nèi)容的檢驗(yàn),確定其是否合格;合格時,處理從(131)步進(jìn)入(132)步,在(132)步,檢查是否還存在下一檢驗(yàn),若存在,則處理從(132)步返回到(111)步。
進(jìn)而,在(132)步,在不存在下一檢驗(yàn)時,處理從(132)步進(jìn)入(133)步,在(133)步,由于現(xiàn)在所處分枝中不再進(jìn)行上述諸項(xiàng)檢驗(yàn),因而將所求得的候選字符碼存儲到輸出緩沖器(19)中,此后,處理進(jìn)入(141)步。
此外,在(112)步,當(dāng)緩沖器(16)的值超出辭典(18)中登錄的保留筆劃數(shù)范圍時,處理從(112)步進(jìn)入(141)步。進(jìn)而,在(122)步和(131)步,檢驗(yàn)不合格時,也從(122)步、(131)步進(jìn)入(141)步。
另外,在(141)步,檢查是否存在相鄰的分枝(節(jié)點(diǎn)),存在時,處理從(141)步進(jìn)入(142)步,在(142)步,掃描返回到相鄰的分枝,與此同時,未檢驗(yàn)緩沖器(16)的保留筆劃數(shù)也被恢復(fù),其后,返回(111)步進(jìn)行處理。
還有,在(141)步,當(dāng)不存在相鄰的分枝時,處理從(141)步進(jìn)入(151)步,在(151)步,輸出緩沖器(19)的字符碼被輸出到顯示裝置(圖中未示出),顯示出對應(yīng)的字符。在(152)步,本子程序結(jié)束。
這樣根據(jù)本發(fā)明,雖然也是利用樹型結(jié)構(gòu)的辭典來進(jìn)行手寫體字符的識別,但在此場合,特別是根據(jù)本發(fā)明中,在樹結(jié)構(gòu)的分枝中,登錄著該分枝中所允許的保留筆劃數(shù)范圍,使之能與輸入字符的未檢驗(yàn)筆劃數(shù)進(jìn)行比較檢驗(yàn),因而便無須對與保留筆劃數(shù)不對應(yīng)的分枝進(jìn)行掃描或檢驗(yàn)。因而,在使識別速度高速化的同時,干擾也大為減少,從而也使識別率得到提高。
另外,如上所述,在分枝的途中,例如在分枝(26)和(27)之間,也可以登錄保留筆劃數(shù)范圍,因而也可以進(jìn)行檢驗(yàn)。此外,還可以把是否進(jìn)行保留筆劃數(shù)的檢驗(yàn)作為一個識別檢驗(yàn)命令設(shè)置為相應(yīng)的字段。
按照本發(fā)明,在樹結(jié)構(gòu)的分枝中,登錄著該分枝中所允許的保留筆劃數(shù)范圍,使之能把輸入字符的未檢驗(yàn)筆劃數(shù)與其進(jìn)行比較檢驗(yàn),因而,便不必對那些與保留筆劃數(shù)不符的分枝進(jìn)行掃描或檢驗(yàn)。這樣,在使識別速度高速化的同時,干擾也相應(yīng)減少,從而也可使識別率得到提高。
權(quán)利要求
1.利用樹型結(jié)構(gòu)的識別辭典對手寫體字符進(jìn)行識別的字符識別裝置,其特征在于在上述識別辭典的分枝上,登錄有該分枝上所允許的保留筆劃數(shù)范圍;對上述手寫體字符進(jìn)行識別時,把上述保留筆劃數(shù)范圍與上述輸入的手寫體字符的未檢驗(yàn)筆劃數(shù)進(jìn)行檢驗(yàn);僅當(dāng)上述輸入的手寫體字符的未檢驗(yàn)筆劃數(shù)處于上述保留筆劃數(shù)范圍內(nèi)時,才在該分枝上繼續(xù)掃描和對上述輸入的手寫體字符進(jìn)行識別。
全文摘要
本發(fā)明涉及手寫體字符識別裝置,在樹結(jié)構(gòu)的識別辭典的各分枝上,登錄著該分枝上所允許的保留筆劃數(shù)的范圍。對字符進(jìn)行識別時,將輸入字符的未檢驗(yàn)筆劃數(shù)與分枝的保留筆劃數(shù)范圍進(jìn)行比較檢驗(yàn),只有二者相符的分枝,才進(jìn)一步作掃描和進(jìn)行筆形檢驗(yàn)。這一方法既提高了識別速度,也減少了干擾,從而提高了識別率。
文檔編號G06K9/68GK1053697SQ9110040
公開日1991年8月7日 申請日期1991年1月23日 優(yōu)先權(quán)日1990年1月23日
發(fā)明者坂野秋夫, 井上暢朗, 安黑政行, 茶谷公之, 吉田公義 申請人:索尼公司