專利名稱:建立適用于識別手寫東亞字符的hmm拓?fù)浣Y(jié)構(gòu)的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及手寫字符識別技術(shù),更具體地說,涉及手寫東亞字符的識 別技術(shù)。
背景技術(shù):
手寫輸入識別一直是計(jì)算機(jī)應(yīng)用技術(shù)中的一個重要的研究方向。與靜 態(tài)的圖像或者文字識別不同的是,在線手寫輸入識別是一個時間隨機(jī)過程, 而不是一個靜態(tài)的對象。因此,在在線手寫識別領(lǐng)域,隱性馬爾可夫(HMM) 模型經(jīng)常被使用。首先簡單介紹一下HMM模型,HMM模型即隱性馬爾可夫模型,是馬 爾可夫模型的一種。馬爾可夫模型可以用來預(yù)測未來某一事件出現(xiàn)某種狀 態(tài)的概率,而這種概率將僅僅基于該事件當(dāng)前的狀態(tài)。馬爾可夫模型表現(xiàn) 為一個有限狀態(tài)自動機(jī),狀態(tài)之間可以互相轉(zhuǎn)換,并且,每一次將從一個 狀態(tài)轉(zhuǎn)換到下一個狀態(tài)(可能是其他的狀態(tài),也可能是該狀態(tài)本身)。馬爾可夫模型可以分為兩種, 一種稱之為顯性馬爾可夫模型,在顯性 馬爾可夫模型中,狀態(tài)之間的轉(zhuǎn)換順序是已知的。另一種稱為隱性馬爾可夫模型(HMM),其中狀態(tài)之間的轉(zhuǎn)換順序是 未知的,所知道的僅僅是狀態(tài)之間的轉(zhuǎn)移概率。因此,HMM模型可以被定 義為具有如下的特征1 )是一個有限狀態(tài)自動機(jī),狀態(tài)之間可以互相轉(zhuǎn)換,并且,每一次將 從一個狀態(tài)轉(zhuǎn)換到下一個狀態(tài)(可能是其他的狀態(tài),也可能是該狀態(tài)本身);2)狀態(tài)之間的轉(zhuǎn)移由 一組轉(zhuǎn)移概率決定, 一組觀測事件(觀測序列) 的出現(xiàn)概率由與狀態(tài)相關(guān)的轉(zhuǎn)移概率決定。比如,舉一個例子說明HMM模型。有一臺飲料售貨機(jī),提供兩種飲 料,分別是可樂和茶。這個飲料售貨機(jī)會具有兩種狀態(tài),"偏好可樂"的 狀態(tài)和"偏好茶"的狀態(tài),當(dāng)投入一枚硬幣購買飲料時,售貨機(jī)會根據(jù)其所處的狀態(tài)決定所售出的飲料,即,處于"偏好可樂,,的狀態(tài)時將出售可 樂,而處于"偏好茶"的狀態(tài)時將出售茶。該售貨機(jī)會在每次出售之后在兩種狀態(tài)之間進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換的概率如下處于"偏好可樂"狀態(tài)時,轉(zhuǎn)換到"偏好茶"狀態(tài)的概率是30。/。,保 持在"偏好可樂"狀態(tài)的概率是70%;出于"偏好茶"的狀態(tài)時,轉(zhuǎn)換到"偏好可樂"狀態(tài)的概率是50%, 保持在"偏好茶"狀態(tài)的概率也是50%。對于上述的飲料售貨機(jī),如果希望確定某一種特定的出售飲料序列的 概率,可以為上述的飲料售貨機(jī)建立HMM模型。該模型可參考圖1b所示, 其中包括兩個狀態(tài)"偏好可樂"狀態(tài)和"偏好茶"狀態(tài),根據(jù)上面列出 的狀態(tài)轉(zhuǎn)換概率,確定轉(zhuǎn)態(tài)每一條轉(zhuǎn)移路徑的概率,如圖1b所示。當(dāng)需要 確定某一個特定的出售序列時,可以通過計(jì)算所有會出現(xiàn)上述結(jié)果的路徑 的概率,并將它們求和,就能夠獲得這一種特定出售序列的出現(xiàn)概率。HMM拓樸結(jié)構(gòu)正是反映了在HMM模型中各個狀態(tài)之間的轉(zhuǎn)移順序連 接關(guān)系。HMM模型以及HMM拓樸結(jié)構(gòu)的應(yīng)用涉及三類主要的問題1) 當(dāng)給出一個HMM模型時,確定某一種特定的"觀測事件"(對應(yīng) 一個狀態(tài)轉(zhuǎn)移順序)出現(xiàn)的概率。2) 當(dāng)給出一個HMM模型和一個特定的"觀測事件"時,選擇一個狀 態(tài)轉(zhuǎn)移順序,該狀態(tài)轉(zhuǎn)移順序能最好地描述該特定的"觀測事件"。3) 當(dāng)給出一個特定的"觀測事件,,時以及一組可能的HMM模型空間, 確定最佳的HMM模型來描述該"觀測事件"。HMM模型的上述特點(diǎn)使得它在解決下列的問題時尤其有用潛在的事 件的出現(xiàn)概率會影響觀測事件。 一個典型的應(yīng)用是在識別領(lǐng)域,尤其是語 言識別,包括語音識別技術(shù)和手寫識別技術(shù)。HMM模型是一種可訓(xùn)練的模 型,通過大量的數(shù)據(jù)訓(xùn)練,能夠獲得一組最適合于表示"觀測事件"的HMM 模型參數(shù),之后,采用這個從數(shù)據(jù)訓(xùn)練中獲得的HMM模型,就能確定另 外一個"觀測事件"與該模型的匹配程度,根據(jù)匹配程度,就能確定一個 未知的"觀測事件,,最可能屬于哪一個模型。這樣,就達(dá)到了識別的目的。目前,雖然已經(jīng)開發(fā)了多種利用HMM模型的識別技術(shù),但是它們大 多應(yīng)用于西文,而對于東方文字,尤其是東亞地區(qū)使用的文字,諸如漢字, 卻不能進(jìn)行有效的識別。這主要是由于西文,例如英語和東亞字符,例如 漢字在字形結(jié)構(gòu)上的差異所造成的。對于西文來說,每一個字都是由字母組成,而單個的字母結(jié)構(gòu)簡單, 通常都是一筆可以完成,不存在可變的筆劃順序的問題,同時,字母和字 母之間的相似程度相對較低,除了個別的字母之外,大多數(shù)字母具有自己 明顯的特征。這些特點(diǎn)都給手寫識別帶來了許多的便利。因此,目前開發(fā) 的以西文為主要識別對象的HMM模型一般都具有左至右的HMM拓樸結(jié) 構(gòu),通過限定HMM拓樸結(jié)構(gòu)的起始點(diǎn)和終止點(diǎn)基本就能夠描述一般西文 字母的特點(diǎn)。但是東亞字符具有明顯不同的特點(diǎn),以漢字為例1) 筆劃多,在手寫過程中存在筆劃順序不同的問題;2) 結(jié)構(gòu)復(fù)雜,使得字形變化較多,體現(xiàn)在手寫方面,就是具有多種手 寫風(fēng)格;3) 存在筆劃間連接的問題,由于漢字筆劃多,結(jié)構(gòu)復(fù)雜,再加上個人 的手寫習(xí)慣,會導(dǎo)致筆劃之間的連接存在很多的不確定性;4) 數(shù)據(jù)量大,漢字的每一個字都是一個獨(dú)立的個體,而不是像英文那 樣可以進(jìn)一步度拆分成字母這樣一個數(shù)量有限的單位,因此,對于漢字來 說,手寫識別模型的數(shù)據(jù)量是十分巨大的。通過上面的分析,就可看到,由于東亞字符和西文在字形特點(diǎn)上存在 很多明顯的差異,就導(dǎo)致了目前針對西文字符開發(fā)的HMM模型并不適用 于東亞字符,尤其是,目前的HMM模型不能有效地解決筆劃順序、書寫 風(fēng)格的問題,同時,對于東亞字符筆劃之間的連接,也無法很好地提供解 決方案,因此,導(dǎo)致了目前在手寫東亞字符識別方面,尚沒有一種很好的 識別技術(shù)。發(fā)明內(nèi)容本發(fā)明的目的旨在提供一種構(gòu)建用于識別手寫東亞字符的HMM拓樸結(jié)構(gòu)的方法及系統(tǒng),以針對手寫東亞字符的特點(diǎn)對手寫的東亞字符進(jìn)行有 效的識別。根據(jù)本發(fā)明的一方面,針對手寫東亞字符筆劃多,筆劃間的連接過度關(guān)系復(fù)雜的特點(diǎn),設(shè)計(jì)一種建立適用于識別手寫東亞字符的HMM拓樸結(jié) 構(gòu)的方法,該設(shè)計(jì)在所建立的HMM拓樸結(jié)構(gòu)中提供描述手寫東亞字符持 續(xù)筆劃的持續(xù)狀態(tài)以及描述手寫東亞字符筆劃間轉(zhuǎn)角的轉(zhuǎn)角狀態(tài)。通過引 入針對筆劃間轉(zhuǎn)角的轉(zhuǎn)角狀態(tài),來使得整個HMM拓樸結(jié)構(gòu)很好地反映手 寫東亞字符的特點(diǎn)。在本發(fā)明的一個實(shí)現(xiàn)中,HMM拓樸結(jié)構(gòu)是被設(shè)計(jì)成左向右HMM拓樸 結(jié)構(gòu),從一起始狀態(tài)開始,至一終止?fàn)顟B(tài)結(jié)束;HMM拓樸結(jié)構(gòu)中的持續(xù)狀 態(tài)可以轉(zhuǎn)移至下一狀態(tài)或者自轉(zhuǎn)移,而轉(zhuǎn)角狀態(tài)只能轉(zhuǎn)移至下一狀態(tài),不 能自轉(zhuǎn)移;并且,持續(xù)狀態(tài)和轉(zhuǎn)角狀態(tài)依次交替存在。根據(jù)本發(fā)明的另一方面,針對手寫東亞字符筆劃順序多樣,書寫風(fēng)格 多樣的特點(diǎn)。提供一種多路徑HMM拓樸結(jié)構(gòu),該多路徑HMM拓樸結(jié)構(gòu) 中的每一條路徑對應(yīng)手寫東亞字符的多種筆劃順序中的一個;或者多路徑 HMM拓樸結(jié)構(gòu)中的每一條路徑對應(yīng)手寫東亞字符的多種手寫風(fēng)格中的一 個。通過將反映多種筆劃順序或者手寫風(fēng)格的路徑集成到一個HMM拓樸 結(jié)構(gòu)中,就能很好地解決手寫東亞字符筆劃順序多樣和手寫風(fēng)格多樣的問 題。在本發(fā)明的一個實(shí)現(xiàn)中,多路徑HMM拓樸結(jié)構(gòu)中的每一條路徑是左 向右HMM拓樸結(jié)構(gòu),從一起始狀態(tài)開始,至一終止?fàn)顟B(tài)結(jié)束;在該多路 徑HMM拓樸結(jié)構(gòu)中同樣提供描述手寫東亞字符持續(xù)筆劃的持續(xù)狀態(tài)以及持續(xù)狀態(tài)可以轉(zhuǎn)移至下一狀態(tài)或者自轉(zhuǎn)移,轉(zhuǎn)角狀態(tài)只能轉(zhuǎn)移至下一狀態(tài), 不能自轉(zhuǎn)移;持續(xù)狀態(tài)和轉(zhuǎn)角狀態(tài)也是依次交替存在;并且,其中所有路 徑起始于同一入口狀態(tài),至同一出口狀態(tài)結(jié)束。同時,本發(fā)明還對多路經(jīng) HMM拓樸結(jié)構(gòu)中的路徑進(jìn)行合并處理,以控制路徑的數(shù)量。根據(jù)本發(fā)明的另 一方面,針對手寫東亞字符筆劃之間連接過渡的不確 定性,即存在即可能是實(shí)筆,也可能是虛筆的部分,本發(fā)明同樣提供了解決的方法,比如,在HMM拓樸結(jié)構(gòu)中提供平行狀態(tài),對應(yīng)手寫東亞字符 中既可能是虛筆劃,也可能是實(shí)筆劃的部分?;蛘撸瑢MM拓樸結(jié)構(gòu)應(yīng) 用多空間概率分布(MSD),對應(yīng)手寫東亞字符中既可能是虛筆劃,也可 能是實(shí)筆劃的部分。根據(jù)本發(fā)明的另一方面,為了減少冗余的數(shù)據(jù)量,降低運(yùn)算的復(fù)雜程 度,本發(fā)明還對HMM拓樸結(jié)構(gòu)中的狀態(tài)進(jìn)行聚類,使HMM拓樸結(jié)構(gòu)中 的至少一組狀態(tài)共用參數(shù),且對于一組共用參數(shù)的狀態(tài),在HMM拓樸結(jié) 構(gòu)中只保存一套參數(shù)。本發(fā)明同樣提供適合于手寫東亞字符識別的HMM拓樸結(jié)構(gòu)的實(shí)現(xiàn)方 法,該多路徑HMM拓樸結(jié)構(gòu)從手寫東亞字符的訓(xùn)練數(shù)據(jù)中自動構(gòu)建;根 據(jù)手寫東亞字符的筆劃順序或者書寫風(fēng)格,應(yīng)用一機(jī)器自學(xué)習(xí)的自動分類 方法對訓(xùn)練數(shù)據(jù)進(jìn)行聚類,每一個類別的數(shù)據(jù)對應(yīng)于一個書寫順序或一個 書寫風(fēng)格。根據(jù)一種實(shí)現(xiàn)方式,該HMM拓樸結(jié)構(gòu)是根據(jù)手寫東亞字符的訓(xùn)練數(shù) 據(jù)自動生成而不需要人工的干預(yù),該訓(xùn)練數(shù)據(jù)包括手寫東亞字符筆跡樣本, 筆跡樣本包括不同筆劃順序或者不同手寫風(fēng)格的筆跡樣本;在構(gòu)建HMM 拓樸結(jié)構(gòu)的過程中,可包括如下幾個階段對于每一個筆跡樣本,按弧長 將其分成數(shù)個分段,每一分段分別提取一特征;從而將分段特征順序排列 組成整個筆跡樣本的一個特征;對上述特征進(jìn)行聚類,每一個聚類對應(yīng)于 一種筆劃順序或者一種手寫風(fēng)格;基于每一個聚類的數(shù)據(jù)確定對應(yīng)于每一 種筆劃順序或者每一種手寫風(fēng)格的HMM拓樸結(jié)構(gòu)中的一路徑的拓樸及初 始參數(shù)。在本發(fā)明的一個實(shí)現(xiàn)中,還建立對應(yīng)于分段及特征的子序列方向直方 圖向量,以幫助建立該HMM拓樸結(jié)構(gòu)。在本發(fā)明的一個實(shí)現(xiàn)中,還對多路徑HMM拓樸結(jié)構(gòu)中的路徑進(jìn)行合 并,以控制路徑的數(shù)量。由于手寫東亞字符的數(shù)據(jù)量巨大,為了減小數(shù)據(jù)量,降低實(shí)現(xiàn)的復(fù)雜 度,在本發(fā)明的一個實(shí)現(xiàn)中,通過計(jì)算HMM拓樸結(jié)構(gòu)中每兩個狀態(tài)之間 的狀態(tài)相似度度量來確定是否進(jìn)行聚類的操作。本發(fā)明同樣提供能夠?qū)崿F(xiàn)上述的各個方面的系統(tǒng),利用HMM模型來 對手寫東亞字符進(jìn)行識另'J 。本發(fā)明針對手寫東亞字符的特點(diǎn)提供了一種建立適用于對手寫東亞字符進(jìn)行識別的HMM拓樸結(jié)構(gòu),充分考慮了手寫東亞字符筆劃多、筆劃順 序多樣、結(jié)構(gòu)復(fù)雜、書寫風(fēng)格多樣、筆劃間連接不確定的特點(diǎn),通過在HMM 拓樸結(jié)構(gòu)中引入轉(zhuǎn)角狀態(tài)、提供多路徑、提供平行狀態(tài)的手段來解決上述 的問題,并且,通過聚類和合并的操作來減小數(shù)據(jù)量,降低運(yùn)算的復(fù)雜程 度。
本發(fā)明的上述的以及其他的特征,性質(zhì)和優(yōu)勢將通過下面結(jié)合附圖對 實(shí)施例的描述而變得更加明顯,在附圖中,相同的附圖標(biāo)記始終表示相同 的特征,其中,圖1 a是可實(shí)現(xiàn)本發(fā)明的適當(dāng)?shù)挠?jì)算系統(tǒng)環(huán)境的一示例;圖化示出了一 HMM模型的示例;圖2a示出了手寫東亞字符中的"轉(zhuǎn)角";圖2b示出了能體現(xiàn)手寫東亞字符中轉(zhuǎn)角特性的HMM拓樸結(jié)構(gòu);圖2c示出了手寫東亞字符中持續(xù)筆劃與轉(zhuǎn)角的區(qū)分規(guī)則;圖3a示出了手寫東亞字符的筆劃順序的多樣性;圖3b示出了手寫東亞字符的手寫風(fēng)格的多樣性;圖4a示出了根據(jù)本發(fā)明的一實(shí)施例的多路徑HMM拓樸結(jié)構(gòu)的結(jié)構(gòu)圖;圖4b示出了每一路徑對應(yīng)一種筆劃順序的多路徑HMM拓樸結(jié)構(gòu)的示例;圖4c示出了每一路徑對應(yīng)一種手寫風(fēng)格的多路徑HMM拓樸結(jié)構(gòu)的示例;圖5a示出了手寫東亞字符書寫過程中實(shí)筆劃/虛筆劃不確定性的情況; 圖5b示出了根據(jù)本發(fā)明的一實(shí)施例的具有平行狀態(tài)的HMM拓樸結(jié)構(gòu) 的示意圖;圖5c示出了根據(jù)圖5a所示的手寫示例構(gòu)建的具有平行狀態(tài)的HMM 拓樸機(jī)構(gòu)的示意圖;圖6a示出了對筆跡樣本應(yīng)用子序列方向直方圖的一個實(shí)例; 圖6b示出了對訓(xùn)練數(shù)據(jù)進(jìn)行聚類操作的一個實(shí)例;圖6C示出了采用雙高斯混合模型實(shí)現(xiàn)平行狀態(tài)的一個實(shí)例;圖7示出了根據(jù)本發(fā)明的一實(shí)施例的利用HMM模型對手寫東亞字符 進(jìn)行識別的系統(tǒng)的結(jié)構(gòu)圖;圖8示出了根據(jù)本發(fā)明的另一實(shí)施例的利用HMM模型對手寫東亞字 符進(jìn)行識別的系統(tǒng)的結(jié)構(gòu)圖。
具體實(shí)施方式
本發(fā)明針對手寫東亞字符的特點(diǎn)筆劃多、筆劃順序多樣、結(jié)構(gòu)復(fù)雜、 書寫風(fēng)格多樣、筆劃間連接不確定。提供了一種利用改進(jìn)的HMM模型來 對手寫東亞字符進(jìn)行識別的方案,改進(jìn)了 HMM拓樸結(jié)構(gòu)的特點(diǎn),通過在 HMM拓樸結(jié)構(gòu)中加入轉(zhuǎn)角狀態(tài)、提供多路徑、提供平行狀態(tài)的手段來很好 地反映手寫東亞字符的上述特點(diǎn),并且,通過聚類和合并的操作來減小數(shù) 據(jù)量,降低運(yùn)算的復(fù)雜程度。本發(fā)明的HMM拓樸結(jié)構(gòu)是從訓(xùn)練數(shù)據(jù)中自 行生成,并不需要人工干預(yù)。需要說明的一點(diǎn)是,在下面所要描述的實(shí)施例中,是以漢字為例進(jìn)行 說明的,但是本發(fā)明的范圍不限于漢字,而是具有和漢字相似特征的所有 的東亞文字字符,包括日本漢字,日本的假名等等。適當(dāng)?shù)膶?shí)現(xiàn)環(huán)境圖1a說明了適當(dāng)?shù)挠?jì)算系統(tǒng)環(huán)境100的一例,其中可以實(shí)現(xiàn)本發(fā)明。 計(jì)算系統(tǒng)環(huán)境100僅是適當(dāng)?shù)挠?jì)算環(huán)境的 一例并且并非意圖限制本發(fā)明的 使用范圍或功能。計(jì)算環(huán)境100不應(yīng)被解釋為具有與示例性操作環(huán)境100 中所述的組件的任一或組合有關(guān)的從屬性或要求。本領(lǐng)域的技術(shù)人員可以理解,計(jì)算機(jī)或其它客戶機(jī)或服務(wù)器設(shè)備可以 作為部分計(jì)算機(jī)網(wǎng)絡(luò)而采用,或者用于分布式計(jì)算環(huán)境中。在這點(diǎn)上,本 發(fā)明屬于具有任意數(shù)量內(nèi)存或存儲單元的任意計(jì)算機(jī)系統(tǒng),以及發(fā)生在任意數(shù)量存儲單元或容量上的任意數(shù)量的應(yīng)用程序和過程,它們可以與本發(fā) 明 一起使用。本發(fā)明可以應(yīng)用于在網(wǎng)絡(luò)環(huán)境或分布式計(jì)算環(huán)境中采用服務(wù) 器計(jì)算機(jī)和客戶機(jī)計(jì)算機(jī)的環(huán)境。本發(fā)明還可以用于獨(dú)立計(jì)算設(shè)備,具有 編程語言功能、以及與遠(yuǎn)程或本地服務(wù)一起產(chǎn)生、接收和發(fā)射信息的解譯 和執(zhí)行能力。本發(fā)明可以用多種其它通用或?qū)S糜?jì)算系統(tǒng)環(huán)境或配置來操作??梢?適合與本發(fā)明一起使用的公知計(jì)算系統(tǒng)、環(huán)境和/或配置的示例包括、但不 限于個人計(jì)算機(jī)、服務(wù)器計(jì)算機(jī)、手提或便攜式設(shè)備、多處理器系統(tǒng)、 基于微處理器的系統(tǒng)、機(jī)頂盒、可編程用戶電子設(shè)備、網(wǎng)絡(luò)PC、小型計(jì)算 機(jī)、大型計(jì)算機(jī)、包括任一上述系統(tǒng)的分布式計(jì)算環(huán)境等等。本發(fā)明可以用計(jì)算機(jī)可執(zhí)行指令的一般上下文來描述,譬如由計(jì)算機(jī) 執(zhí)行的程序模塊。 一般而言,程序模塊包括例程、程序、對象、組件、數(shù) 據(jù)結(jié)構(gòu)等,它們執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類型。本發(fā)明還可以 實(shí)際用于分布式計(jì)算環(huán)境中,其中由通過通信網(wǎng)絡(luò)或其它數(shù)據(jù)傳輸媒質(zhì)連 接的遠(yuǎn)程處理設(shè)備來執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中,程序模塊及其它數(shù) 據(jù)可以位于本地和遠(yuǎn)程存儲媒質(zhì)中,包括內(nèi)存存儲設(shè)備。分布式計(jì)算通過 計(jì)算設(shè)備和系統(tǒng)間的直接交換便于共享計(jì)算機(jī)資源和服務(wù)。這些資源和服 務(wù)包括信息、高速緩存、及文件磁盤存儲的交換。分布式計(jì)算利用網(wǎng)絡(luò)連 接性,允許用戶機(jī)發(fā)揮它們的集體功效來有利于整個公司。在這點(diǎn)上,多 種設(shè)備可以具有應(yīng)用程序、對象或資源,它們可以利用本發(fā)明的技術(shù)。參考圖1 a ,用于實(shí)現(xiàn)本發(fā)明的示例性系統(tǒng)包括形式為計(jì)算機(jī)110的通 用計(jì)算設(shè)備。計(jì)算機(jī)110的組件可以包括、但不限于處理單元120、系 統(tǒng)內(nèi)存130、及把包括系統(tǒng)內(nèi)存在內(nèi)的各種系統(tǒng)組件耦合至處理單元120 的系統(tǒng)總線121。系統(tǒng)總線121可以是多種類型總線結(jié)構(gòu)的任一種,包括 內(nèi)存總線或內(nèi)存控制器、外圍設(shè)備總線、及使用任一多種總線結(jié)構(gòu)的本地 總線。通過示例但非限制,這種結(jié)構(gòu)包括工業(yè)標(biāo)準(zhǔn)結(jié)構(gòu)(ISA)總線、微通道 結(jié)構(gòu)(MCA)總線、增強(qiáng)型ISA(EISA)總線、視頻電子標(biāo)準(zhǔn)聯(lián)盟(VESA)本地 總線、及外圍組件互連(PCI)總線(也稱為Mezzanine總線)。計(jì)算機(jī)110—般包括各種計(jì)算機(jī)可讀媒質(zhì)。計(jì)算機(jī)可讀媒質(zhì)可以是能由計(jì)算機(jī)11 0訪問的任何可用媒質(zhì)并包括易失性和非易失性的媒質(zhì)、可移 動和不可移動媒質(zhì)。通過示例但非限制,計(jì)算機(jī)可讀媒質(zhì)可以包括計(jì)算機(jī) 存儲媒質(zhì)和通信媒質(zhì)。計(jì)算機(jī)存儲媒質(zhì)包括易失性和非易失性、可移動和 不可移動媒質(zhì),它們以用于存儲諸如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模 塊或其它數(shù)據(jù)這樣的信息的任意方法或技術(shù)來實(shí)現(xiàn)。計(jì)算機(jī)存儲媒質(zhì)包括、但不限于RAM、 ROM、 EEPROM、閃存或其它存儲技術(shù)、CDROM、數(shù) 字化通用光盤(DVD)或其它光盤存儲器、磁帶盒、磁帶、磁盤存儲器或其 它磁性存儲設(shè)備、或用于存儲期望信息并能由計(jì)算機(jī)110訪問的任意其它 媒質(zhì)。通信媒質(zhì)一般在諸如載波或其它傳輸機(jī)制這樣的已調(diào)數(shù)據(jù)信號中包 含計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù),并且包括任意信息 傳遞媒質(zhì)。術(shù)語"已調(diào)數(shù)據(jù)信號"意指其一個或多個特性以對信號內(nèi)信息 進(jìn)行編碼的方式被設(shè)置或改變的信號。通過示例但非限制,通信媒質(zhì)包括 諸如有線網(wǎng)絡(luò)或直接線連接這樣的有線媒質(zhì)、以及諸如聲音、RF、紅外這 樣的無線媒質(zhì)及其它無線媒質(zhì)。上述的任意組合應(yīng)該包含在計(jì)算機(jī)可讀媒 質(zhì)的范圍內(nèi)。系統(tǒng)內(nèi)存130包括計(jì)算機(jī)存儲媒質(zhì),其形式為易失性和/或非易失性內(nèi) 存,譬如只讀內(nèi)存(ROM)131和隨機(jī)存取內(nèi)存(RAM)132?;据斎?輸出 系統(tǒng)133(BIOS)—般存儲在ROM 131內(nèi),它包含例如啟動期間幫助在計(jì) 算機(jī)110內(nèi)的組件間傳輸信息的基本例程。RAM 132—般包含數(shù)據(jù)和/或 程序模塊,它們可以立即訪問并且/或者當(dāng)前由處理單元120在其上操作。 通過示例但非限制,圖1a說明了操作系統(tǒng)134、應(yīng)用程序135、其它程序 模塊136和程序數(shù)據(jù)137。計(jì)算機(jī)110還可以包括其它可移動/不可移動、易失性/非易失性計(jì)算 機(jī)存儲媒質(zhì)。僅僅通過示例,圖1說明了對不可移動、非易失性磁性媒質(zhì) 進(jìn)行讀寫的硬盤驅(qū)動器141、對可移動、非易失性磁盤152進(jìn)行讀寫的磁 盤驅(qū)動器151、以及對可移動、非易失性光盤156進(jìn)行讀寫的光盤驅(qū)動器 155,譬如CD ROM或其它光學(xué)媒質(zhì)。示例性操作環(huán)境中可用的其它可移 動/不可移動、易失性/非易失性計(jì)算存儲媒質(zhì)包括、但不限于磁帶盒、閃 存卡、數(shù)字通用盤、數(shù)字視頻磁帶、固態(tài)RAM、固態(tài)ROM等等。硬盤驅(qū)動器141 一般通過如接口 140這樣的不可移動存儲器接口與系統(tǒng)總線121 相連,且磁盤驅(qū)動器151和光盤驅(qū)動器155—般用如接口 150這樣的可移 動存儲器接口與系統(tǒng)總線121相連。上面討論并在圖1a中說明的驅(qū)動器和它們的相關(guān)計(jì)算機(jī)存儲媒質(zhì)為 計(jì)算機(jī)110提供了計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊和其它數(shù)據(jù)的存 儲。在圖1中,例如,所述硬盤驅(qū)動器141存儲操作系統(tǒng)144、應(yīng)用程序 145、其它程序模塊146和程序數(shù)據(jù)147。注意到這些組件或者可與操作 系統(tǒng)134、應(yīng)用程序135、其它程序模塊136和程序數(shù)據(jù)137相同,或者 與它們不同。這里為操作系統(tǒng)144、應(yīng)用程序145、其它程序模塊146和 程序數(shù)據(jù)147給出不同數(shù)字以說明它們至少是不同的副本。用戶可以通過 諸如鍵盤162和指示設(shè)備161這樣的輸入設(shè)備把命令和信息輸入到計(jì)算機(jī) 110中,輸入設(shè)備通常稱為鼠標(biāo)、軌跡球或觸板。其它輸入設(shè)備(未示出) 可以包括麥克風(fēng)、游戲桿、游戲板、衛(wèi)星式轉(zhuǎn)盤、掃描儀等等。這些和其 它輸入設(shè)備經(jīng)常通過與系統(tǒng)總線121耦合的用戶輸入接口 160與處理單元 120相連,但也可以用其它接口和總線結(jié)構(gòu)連4妄,譬如并行端口、游戲端 口或通用串行總線(USB)。監(jiān)視器191或其它類型的顯示設(shè)備也通過諸如 視頻接口 190這樣的接口與系統(tǒng)總線121相連。除了監(jiān)視器191之外,計(jì) 算機(jī)還可以包括其它外部設(shè)備,如揚(yáng)聲器197和打印機(jī)196,它們可以通 過輸出外設(shè)接口 190連接。計(jì)算機(jī)110可以工作在聯(lián)網(wǎng)環(huán)境中,該環(huán)境使用與諸如遠(yuǎn)程計(jì)算機(jī) 180這樣的 一 個或多個遠(yuǎn)程計(jì)算機(jī)之間的邏輯連接。遠(yuǎn)程計(jì)算機(jī)180可以 是個人計(jì)算機(jī)、服務(wù)器、路由器、網(wǎng)絡(luò)PC、對等設(shè)備或其它公共網(wǎng)絡(luò)節(jié)點(diǎn), 并且一般包括上述與計(jì)算機(jī)110有關(guān)的許多或全部元件,盡管圖1中僅說 明了內(nèi)存存儲設(shè)備181。圖1a所述的邏輯連接包括局域網(wǎng)(LAN)171和廣 域網(wǎng)(WAN)173,但可以還包括其它網(wǎng)絡(luò)。這種聯(lián)網(wǎng)環(huán)境在辦公室、企業(yè)范 圍計(jì)算機(jī)網(wǎng)絡(luò)、企業(yè)內(nèi)聯(lián)網(wǎng)和互聯(lián)網(wǎng)中是常見的。當(dāng)用于LAN聯(lián)網(wǎng)環(huán)境中時,計(jì)算機(jī)110通過網(wǎng)絡(luò)接口或適配器170 與LAN171相連。當(dāng)用于WAN聯(lián)網(wǎng)環(huán)境中時,計(jì)算機(jī)110—般包括用于 在諸如互聯(lián)網(wǎng)這樣的WAN 173上建立通信的調(diào)制解調(diào)器172或其它裝置。調(diào)制解調(diào)器172可以是內(nèi)部或外部的,它可以通過用戶輸入接口 160或其 它適當(dāng)機(jī)制與系統(tǒng)總線121相連。在網(wǎng)絡(luò)化環(huán)境中,關(guān)于計(jì)算機(jī)110所述 的程序模塊或其部分可以存儲在遠(yuǎn)程內(nèi)存存儲設(shè)備中。通過示例但非限制, 圖1a說明了駐留在內(nèi)存設(shè)備181上的遠(yuǎn)程應(yīng)用程序185??梢岳斫?,所 示網(wǎng)絡(luò)連接是示例性的,也可以使用在計(jì)算機(jī)間建立通信連接的其它裝置。術(shù)i吾定義為了更簡潔、清楚地描述本發(fā)明,在本文中,下列的術(shù)語特指如下的 含義,筆劃書寫時的運(yùn)動軌跡。對于識別采樣來說,在書寫時,筆尖與接 觸板接觸時,就會留下"筆跡",不與接觸板接觸時,就不會留下"筆跡"。 但是,如果考慮書寫時筆尖在空間的運(yùn)動,則是一個連續(xù)的軌跡。在本發(fā) 明中,術(shù)語"筆劃"將泛指這種運(yùn)動的軌跡,無論其是否留下"筆跡"。實(shí)筆劃實(shí)筆劃指留下筆跡的筆劃,即在書寫時,筆尖與接觸板接觸 時的運(yùn)動軌跡。虛筆劃虛筆劃指不留下筆跡的筆劃,即在書寫時,筆尖與不接觸板 接觸時的運(yùn)動軌跡,虛筆劃多用于體現(xiàn)實(shí)筆劃之間的連接,需要說明的是, 本發(fā)明中,虛筆劃主要體現(xiàn)筆尖的運(yùn)動趨勢和方向,對于虛筆劃,并不一 定要求完全反映筆尖在這個階段所經(jīng)過的實(shí)際軌跡。持續(xù)筆劃在一段時間中,方向基本不變的筆劃。持續(xù)筆劃可以是實(shí) 筆劃,也可以是虛筆劃,持續(xù)筆劃反映的是連續(xù)在基本相同方向上的筆尖 運(yùn)動。轉(zhuǎn)角方向明顯變化的筆劃。轉(zhuǎn)角是持續(xù)筆劃之間的轉(zhuǎn)換過程,轉(zhuǎn)角 反映具有顯著方向改變的筆尖運(yùn)動。在筆劃轉(zhuǎn)換是會出現(xiàn)轉(zhuǎn)角是手寫東亞 字符的顯著特征,本發(fā)明為此專門提供"轉(zhuǎn)角"來更好地反映這個特征。筆跡筆跡是指手寫東亞字符所留下的具體的痕跡。字根 一部分的筆劃或者組合。概述盡管HMM模型已經(jīng)被廣泛地用于在線的手寫字符的識別領(lǐng)域,但是 對于在線的手寫東亞字符的識別,仍然具有兩個主要方面的挑戰(zhàn)手寫東 亞字符的筆劃順序多樣和書寫風(fēng)格多樣。典型的用于手寫字體識別的HMM 拓樸結(jié)構(gòu)是左向右(left-to-right) HMM拓樸結(jié)構(gòu)。在本發(fā)明中,涉及對 HMM拓樸結(jié)構(gòu)的改進(jìn),主要包括在HMM拓樸結(jié)構(gòu)中添加"轉(zhuǎn)角狀態(tài)",以反映手寫東亞字符手寫過 程筆劃之間的"轉(zhuǎn)角"。"轉(zhuǎn)角狀態(tài)"的自轉(zhuǎn)移是受限制的,并且"轉(zhuǎn)角 狀態(tài)"與反映手寫東亞字符手寫過程中持續(xù)筆劃的"持續(xù)狀態(tài)"是交替出 現(xiàn)。在一個HMM中使用多條路徑,以反映同一個手寫東亞字符的不同的 筆劃順序以及書寫風(fēng)格。在構(gòu)建這種HMM拓樸結(jié)構(gòu)的過程中,本發(fā)明考慮了如下的問題首先,在一個HMM模型中,多少數(shù)量的路徑是合適的。對于這個問 題,本發(fā)明提出了一種新的解決方案,采用子序列方向直方圖向量 (Subsequence Direction Histogram Vector)來對從字符數(shù)據(jù)中得到的路 徑進(jìn)行聚類,已確定合適的路徑數(shù)量。第二,在一個路徑中,多少數(shù)量的狀態(tài)是合適的。對于這個問題,本 發(fā)明利用手寫東亞字符中的"轉(zhuǎn)角"這一特性,利用曲率尺度空間中轉(zhuǎn)角 的連接關(guān)系來確定一個路徑中"轉(zhuǎn)角狀態(tài)"的數(shù)量,再利用"轉(zhuǎn)角狀態(tài)" 和"持續(xù)狀態(tài)"是交替出現(xiàn)這一特征,確定路徑中合適的狀態(tài)數(shù)。第三,對于手寫東亞字符中特有的筆劃間連續(xù)的不確定性,本發(fā)明采 用了在HMM拓樸結(jié)構(gòu)中設(shè)置平行狀態(tài)(比如雙高斯混合模型)的方法, 或者應(yīng)用MSD的方法來加以解決。下面將分別就上述的問題詳細(xì)地加以描述。適于識別手寫東亞字符的HMM拓樸結(jié)構(gòu)本發(fā)明主要針對手寫東亞字符的識別技術(shù),分析手寫東亞字符的特點(diǎn), 可以歸結(jié)為以下幾個主要方面1)筆劃順序多樣,書寫風(fēng)格多樣。正如上面所分析的,手寫東亞字符的筆劃多,并且字型結(jié)構(gòu)復(fù)雜,導(dǎo)致了同一個字會出現(xiàn)多種筆劃順序,并 且,最終寫完的字會呈現(xiàn)出多種字形或者字體,也就是所謂的手寫風(fēng)格。2)由于書寫風(fēng)格的多樣性,同一個字的不同寫法會出現(xiàn)如下兩種典型 的區(qū)別2a)對局部連續(xù)筆劃的不同的簡化寫法,導(dǎo)致不同的書寫風(fēng)格可 能具有不同的筆劃數(shù)。2b)在實(shí)筆劃之間的連接過程中,可以以實(shí)筆劃相連,也可以以 虛筆劃相連,而對于真正的東亞字符的使用者來說,無論以哪種筆劃 相連,都被認(rèn)可為正確的字符,這就個機(jī)器識別帶來了難度。 手寫東亞字符識別所要解決的第一個問題,即問題1 )筆劃順序多樣、 手寫風(fēng)格多樣。同一個漢字,不同的人的書寫習(xí)慣決定了會出現(xiàn)多種筆劃的順序,雖 然按照規(guī)范漢字的標(biāo)準(zhǔn),書寫的筆劃順序是固定的,但是實(shí)際的統(tǒng)計(jì)表明, 大多數(shù)的漢字在實(shí)際的應(yīng)用中存在數(shù)種書寫順序,并且,采用每一種書寫 順序的人群都占有相當(dāng)?shù)谋壤W鳛槭謱懽R別這樣面向大眾的技術(shù),必須 考慮這種情況。據(jù)一個例子,參考圖3a所示,其中的"九,,字就有兩種不 同的筆劃順序,其中,用虛線表示兩個筆劃之間的連接。同樣,手寫東亞字符的書寫分格更是多種多樣,例如,參考圖3b所示, 同樣的漢字"復(fù)",就可能出現(xiàn)很多種不同的書寫風(fēng)格。一種實(shí)現(xiàn)方式是為每一種筆劃順序、每一種手寫風(fēng)格都構(gòu)建一個HMM 拓樸結(jié)構(gòu),這樣做的數(shù)據(jù)量和運(yùn)算復(fù)雜度比較大,并且,另一個問題是這 樣方案將給實(shí)現(xiàn)和訓(xùn)練都帶來一定的難度。為此,本發(fā)明提供一種多路徑的HMM拓樸結(jié)構(gòu),對于相同的字符, 只提供一個HMM拓樸結(jié)構(gòu)(HMM模型),使用其中的路徑來表現(xiàn)不同的 筆劃順序或者是手寫風(fēng)格。參考圖4a,圖4a示出了根據(jù)本發(fā)明的一實(shí)施例,所提出的一種適用 于進(jìn)行手寫東亞字符識別的多路徑HMM拓樸結(jié)構(gòu)的結(jié)構(gòu)圖。參考圖4a所 示,該多路徑HMM拓樸結(jié)構(gòu)對應(yīng)于一個手寫東亞字符;多路徑HMM拓 樸結(jié)構(gòu)中的每一條路徑對應(yīng)手寫東亞字符的多種筆劃順序中的一個;或者多路徑HMM拓樸結(jié)構(gòu)中的每一條路徑對應(yīng)手寫東亞字符的多種手寫風(fēng)格 中的一個。比如,參考圖4b,根據(jù)圖3a中所使出的漢字"九,,的兩個手寫示例 所構(gòu)建的多路徑HMM拓樸結(jié)構(gòu)具有2條路徑,其中的每一條對應(yīng)"九,, 字的一種筆劃順序。參考圖4c,根據(jù)圖3b所示出的漢字"復(fù)"的多個手寫示例,在構(gòu)建 用于漢字"復(fù),,的多路徑HMM拓樸結(jié)構(gòu)之后,聚類出兩種具有典型特征 的手寫風(fēng)格(聚類的過程將在下面詳細(xì)描述),這樣,該多路徑HMM拓 樸結(jié)構(gòu)具有兩條路徑,其中的每一條對應(yīng)一種手寫風(fēng)格的"復(fù),,字。如上面所說的,由于書寫風(fēng)格的多樣性所帶來的問題,其中一個即是 2a)對局部連續(xù)筆劃的不同的簡化寫法,導(dǎo)致不同的書寫風(fēng)格可能具有不 同的筆劃數(shù)。每一條路徑上的狀態(tài)數(shù)是由這條路徑所對應(yīng)的書寫風(fēng)格的筆 劃數(shù)確定的。東亞字符在相鄰筆劃間具有明顯的方向轉(zhuǎn)變特征,即"轉(zhuǎn)角", 而持續(xù)筆劃與轉(zhuǎn)角是交替出現(xiàn)的。根據(jù)本發(fā)明,首先需要通過對某 一路徑所對應(yīng)的訓(xùn)練樣本進(jìn)行轉(zhuǎn)角的 檢測,統(tǒng)計(jì)出這種書寫風(fēng)格的典型筆劃數(shù),從而確定該條路徑的狀態(tài)數(shù), 具體的步驟會在下面進(jìn)行詳細(xì)的描述。正是由于持續(xù)筆劃和轉(zhuǎn)角是交替出 現(xiàn)這 一 特點(diǎn),可以利用曲率尺度空間(CSS )中的精細(xì)化算法 (coarse-to-fine algorithm )來實(shí)現(xiàn)一個路徑中狀態(tài)數(shù)量的確定。對于每一條具體路徑而言,本發(fā)明還在路徑中引入了 "轉(zhuǎn)角狀態(tài)"用 來描述轉(zhuǎn)角處的短暫的筆劃轉(zhuǎn)變特征。在同一種書寫風(fēng)格所對應(yīng)的一條路徑上,持續(xù)筆劃對應(yīng)于"持續(xù)狀態(tài)",轉(zhuǎn)角對應(yīng)于"轉(zhuǎn)角狀態(tài)",持續(xù)狀 態(tài)與轉(zhuǎn)角狀態(tài)是交替出現(xiàn)的。由于筆劃轉(zhuǎn)角處的短時性,本發(fā)明將"轉(zhuǎn)角狀態(tài)"設(shè)為不自轉(zhuǎn),這種不自轉(zhuǎn)的特性結(jié)合持續(xù)筆劃特征與轉(zhuǎn)角特征的差 異,可以明顯改善訓(xùn)練樣本的特征序列與路徑狀態(tài)之間的正確的對應(yīng)關(guān)系。 再研究手寫東亞字符的特征,可以發(fā)現(xiàn),手寫東亞字符在完成一個筆 劃,開始下一個筆劃之前,會出現(xiàn)一個顯著的轉(zhuǎn)向的過程,也就是上面所 說的"轉(zhuǎn)角,,。參考圖2a所示,圖2a以一個十分簡單的漢字"上,,的一 個手寫示例為例。在圖2a的示例中,"上"字的實(shí)筆劃是3劃,就是圖2a中所顯示的筆跡,虛筆劃有2劃,在圖2a中用帶箭頭的虛線表示。這 樣,在總共5個筆劃(3個實(shí)筆劃、2個虛筆劃)之間,出現(xiàn)了 4個轉(zhuǎn)角 202a-202d,在圖中使用虛線框的圓團(tuán)表示。于是,本發(fā)明提供了一種改進(jìn)的HMM模型,利用這種HMM模型, 能很好地對東亞字符的轉(zhuǎn)角進(jìn)行建模。根據(jù)本發(fā)明,提供一種利用HMM模型識別手寫東亞字符的方法,提 供對應(yīng)于手寫東亞字符的HMM拓樸結(jié)構(gòu);其中在HMM拓樸結(jié)構(gòu)中提供描述手寫東亞字符持續(xù)筆劃的持續(xù)狀態(tài);以 及,在HMM拓樸結(jié)構(gòu)中提供描述手寫東亞字符筆劃間轉(zhuǎn)角的轉(zhuǎn)角狀態(tài)。上述的HMM拓樸結(jié)構(gòu)被構(gòu)建成左向右HMM拓樸結(jié)構(gòu),從一起始狀 態(tài)開始,至一終止?fàn)顟B(tài)結(jié)束。HMM拓樸結(jié)構(gòu)中的持續(xù)狀態(tài)可以轉(zhuǎn)移至下一 狀態(tài)或者自轉(zhuǎn)移,而轉(zhuǎn)角狀態(tài)只能轉(zhuǎn)移至下一狀態(tài),不能自轉(zhuǎn)移。持續(xù)狀 態(tài)和轉(zhuǎn)角狀態(tài)依次交替存在。上述的這個改進(jìn)的HMM拓樸結(jié)構(gòu)符合手寫東亞字符的特點(diǎn),能很好 地反映手寫東亞字符的特征。參考圖2b,圖2b示出了根據(jù)本發(fā)明的上述原理從圖2a的"上"字筆 跡中構(gòu)建的對應(yīng)于"上"字的HMM拓樸結(jié)構(gòu)。圖2a所示的"上"字手寫示例中的5個筆劃,包括3個實(shí)筆劃和2 個虛筆劃分別對應(yīng)圖2b中的5個持續(xù)狀態(tài)204a-204e,持續(xù)狀態(tài) 204a-204e的每一個都可以自轉(zhuǎn)移或者向下一個狀態(tài)轉(zhuǎn)移。繼續(xù)參考圖2b,圖2a所示的4個轉(zhuǎn)角202a-202d分別對應(yīng)圖2b中 的4個轉(zhuǎn)角狀態(tài)206a-206d,轉(zhuǎn)角狀態(tài)206a-206d不能自轉(zhuǎn)移,只能轉(zhuǎn)移 到下一狀態(tài)。并且,轉(zhuǎn)角狀態(tài)206a-206d插入到持續(xù)狀態(tài)204a-204e之間。在另一個實(shí)施例中,圖2b所示的該HMM拓樸結(jié)構(gòu)還可以起始于一個 起始狀態(tài),這個狀態(tài)對應(yīng)于起筆的時刻,并且,如果存在起始狀態(tài)的話, 該起始狀態(tài)是不能自轉(zhuǎn)移的。同樣,圖2b所示的HMM拓樸結(jié)構(gòu)的另一個實(shí)施例中也可以結(jié)束于終 止?fàn)顟B(tài),終止?fàn)顟B(tài)代表收筆的時刻,如果使用終止?fàn)顟B(tài)的話,終止?fàn)顟B(tài)也 不能自轉(zhuǎn)移的。這樣,圖2a所示的"上"的手寫示例就被構(gòu)建成了圖2b所示的HMM 拓樸結(jié)構(gòu),該HMM拓樸結(jié)構(gòu)符合下面的特征是左向右HMM拓樸結(jié)構(gòu), 從一起始狀態(tài)開始,至一終止?fàn)顟B(tài)結(jié)束,HMM拓樸結(jié)構(gòu)中的持續(xù)狀態(tài)可以 轉(zhuǎn)移至下一狀態(tài)或者自轉(zhuǎn)移,而轉(zhuǎn)角狀態(tài)只能轉(zhuǎn)移至下一狀態(tài),不能自轉(zhuǎn) 移,持續(xù)狀態(tài)和轉(zhuǎn)角狀態(tài)依次交替存在。需要說明的是,在圖2a所示的"上"字的手寫示例中,根據(jù)本發(fā)明定 義的實(shí)筆劃的數(shù)量與規(guī)范漢字寫法中的筆劃數(shù)量是相等的,但是,對于有 一些漢字或者漢字筆劃來說,根據(jù)本發(fā)明所定義的筆劃數(shù)量(包括實(shí)筆劃 和虛筆劃)與規(guī)范漢字寫法中的筆劃數(shù)量可能是不相等的。參考圖2c所示 出的示例,"口,,字,根據(jù)規(guī)范漢字寫法,共有3劃,但是根據(jù)本發(fā)明的 定義,實(shí)筆劃共有4劃,虛筆劃共有2劃。主要的區(qū)別在于"1"這一筆, 在規(guī)范漢字中,這是一個筆劃,而根據(jù)本發(fā)明的定義,"i"包含了2個 實(shí)筆劃和1個轉(zhuǎn)角。因此,根據(jù)本發(fā)明的定義,圖2c所示的"口"字的手寫示例包括實(shí)筆 劃212a-212d,虛筆劃214a和214b,以及轉(zhuǎn)角216a-216e。排列的順序 是實(shí)筆劃212a、轉(zhuǎn)角216a、虛筆劃214a、轉(zhuǎn)角216b、實(shí)筆劃212b、 轉(zhuǎn)角216c、實(shí)筆劃212c、轉(zhuǎn)角216d、虛筆劃214b、轉(zhuǎn)角216e、實(shí)筆劃 212d。在本發(fā)明中,所說的筆劃是按照上面的術(shù)語定義中所定義的筆劃。 回到前面所提到的多路徑的HMM拓樸結(jié)構(gòu),由于主要適用于手寫東亞字符的識別,因此在每一條HMM路徑中,仍然會提供上述的"轉(zhuǎn)角"狀態(tài)?;氐綀D4a,在該多路徑HMM拓樸結(jié)構(gòu)中,由于每一個路徑都是對應(yīng) 于手寫的東亞文字,因此這些路徑中的每一條都具有如下的特點(diǎn)每一條路徑是左向右HMM拓樸結(jié)構(gòu),從一起始狀態(tài)開始,至一終止 狀態(tài)結(jié)束;HMM拓樸結(jié)構(gòu)包括描述手寫東亞字符持續(xù)筆劃的持續(xù)狀態(tài),以及描述 手寫東亞字符筆劃間轉(zhuǎn)角的轉(zhuǎn)角狀態(tài),其中持續(xù)狀態(tài)可以轉(zhuǎn)移至下一狀態(tài) 或者自轉(zhuǎn)移,轉(zhuǎn)角狀態(tài)只能轉(zhuǎn)移至下一狀態(tài),不能自轉(zhuǎn)移;持續(xù)狀態(tài)和轉(zhuǎn)角狀態(tài)依次交替存在;對于整個多路徑HMM拓樸結(jié)構(gòu)來說,其中所有路徑起始于同一入口 狀態(tài),至同一出口狀態(tài)結(jié)束。在圖4a中,每一個圓圈代表一個狀態(tài),帶箭頭的線段表示轉(zhuǎn)移,其中, 指向自己的箭頭表示自轉(zhuǎn)移,具有狀態(tài)自轉(zhuǎn)移的狀態(tài)是持續(xù)狀態(tài),不能自 轉(zhuǎn)移的狀態(tài)是轉(zhuǎn)角狀態(tài)。所有路徑都開始于公共的入口狀態(tài),并結(jié)束于公 共的出口狀態(tài)。需要說明的是,雖然在上面所示的示例中,多路徑HMM拓樸結(jié)構(gòu)中 的每一個路徑都是符合前面所定義的特點(diǎn)的路徑,并且,多路徑HMM拓 樸結(jié)構(gòu)中的路徑被示為用來一致地對應(yīng)多種筆劃順序或者手寫風(fēng)格。但是, 本領(lǐng)域的技術(shù)人員能夠理解,本發(fā)明的范圍決不限制與此,本發(fā)明中的多 路徑HMM拓樸結(jié)構(gòu)的寬泛的限定應(yīng)該是至少有一條路徑是左向右HMM拓樸結(jié)構(gòu),從一起始狀態(tài)開始,至一 終止?fàn)顟B(tài)結(jié)束;對于整個多路徑HMM拓樸結(jié)構(gòu)來說,其中所有路徑起始于同一入口 狀態(tài),至同一出口狀態(tài)結(jié)束。并且,描述多種不同的筆劃順序和不同的手寫風(fēng)格的路徑可以被放置 在同一個多路徑HMM拓樸結(jié)構(gòu)中,也就是說,在一個多路徑HMM拓樸 結(jié)構(gòu)中,可以由部分的路徑對應(yīng)不同的筆劃順序,而另一部分的路徑對應(yīng) 不同的手寫風(fēng)格。在一種情況中,由于手寫東亞字符中"轉(zhuǎn)角"特性的作用,至少有一 條路徑包括描述手寫東亞字符持續(xù)筆劃的持續(xù)狀態(tài),以及描述手寫東亞字 符筆劃間轉(zhuǎn)角的轉(zhuǎn)角狀態(tài),其中持續(xù)狀態(tài)可以轉(zhuǎn)移至下一狀態(tài)或者自轉(zhuǎn)移, 轉(zhuǎn)角狀態(tài)只能轉(zhuǎn)移至下一狀態(tài),不能自轉(zhuǎn)移;持續(xù)狀態(tài)和轉(zhuǎn)角狀態(tài)依次交 替存在。由于本發(fā)明的HMM拓樸結(jié)構(gòu)是從訓(xùn)練數(shù)據(jù)中自行生成,而訓(xùn)練數(shù)據(jù) 中的樣本可能存在很大的冗余性,或者其中可能記錄了一些極低概率的偶然性數(shù)據(jù),這樣,就可能使得所得到的多路徑HMM拓樸結(jié)構(gòu)中,存在冗 余路徑,或者只有少量手寫數(shù)據(jù)覆蓋的路徑,這將使得模型數(shù)據(jù)量大量增加,增加整個HMM拓樸結(jié)構(gòu)的復(fù)雜度。為此,本發(fā)明還需要對路徑進(jìn)行 合并處理,消除冗余的路徑和基本不會使用到的路徑。關(guān)于路徑合并的具 體實(shí)現(xiàn)方法在下面會詳細(xì)描述。還需要說明的一點(diǎn)是,對于本領(lǐng)域的技術(shù) 人員來說,完全可以通過已有的手段來在一個HMM拓樸結(jié)構(gòu)中實(shí)現(xiàn)多路 徑,因此,本發(fā)明在此處主要是提供一種新型的HMM拓樸結(jié)構(gòu)以及實(shí)現(xiàn) 這種新型的HMM拓樸結(jié)構(gòu)的多路徑HMM模型,因此,本領(lǐng)域的技術(shù)人 員完全可以在閱讀了本發(fā)明的說明書之后實(shí)現(xiàn)這里所述的多路徑HMM模 型而不需要再做出任何的創(chuàng)造性勞動?,F(xiàn)在,本發(fā)明的方法已經(jīng)通過提供"轉(zhuǎn)角"狀態(tài)很好地解決了手寫東 亞字符的筆劃間連接問題,提供多路徑的HMM拓樸結(jié)構(gòu)解決了多種書寫 順序和多種書寫風(fēng)格的問題。最后一個需要解決的問題,也就是問題2b), 在實(shí)筆劃之間的連接過程中,可以以實(shí)筆劃相連,也可以以虛筆劃相連, 而對于真正的東亞字符的使用者來說,無論以哪種筆劃相連,都被認(rèn)可為 正確的字符,這種書寫可變性給機(jī)器識別帶來了難度。舉例說明,參考圖 5a所示,對于"上"字來說,在寫完"I",到下一筆"一"之間,可能 會出現(xiàn)兩種連接方式,實(shí)筆劃連接,例如圖5a中所示的實(shí)筆劃502,或者 虛筆劃連接,例如圖5a中所示的虛筆劃504,當(dāng)然,可能還有其他的連接 方式,比如部分的實(shí)筆劃加上部分的虛筆劃,此處,為了簡明地進(jìn)行說明, 暫時以兩種情況為例進(jìn)行說明。圖5a所示的情況可以稱之為"虛筆劃/實(shí)筆劃的不確定性,,。這也是 本發(fā)明所要解決的問題之一 。對于這種情況,本發(fā)明提供兩種解決的方案。第一種方式,是在HMM拓樸結(jié)構(gòu)中提供平行狀態(tài),對應(yīng)手寫東亞字 符中既可能是虛筆劃,也可能是實(shí)筆劃的部分。參考圖5b所示,其示出了根據(jù)本發(fā)明的 一 實(shí)施例的 一 種具有平行狀態(tài) 的HMM拓樸結(jié)構(gòu)的結(jié)構(gòu)圖。其中,在狀態(tài)506和508之間的狀態(tài)510具 有一個平行的狀態(tài)510b,狀態(tài)506可以轉(zhuǎn)移到狀態(tài)510或者510b之中的 任何一個,狀態(tài)510或者510b之中的任何一個也可以轉(zhuǎn)移到狀態(tài)508。需要說明的是,本發(fā)明所提出的平行狀態(tài)的可以與之前所提出的具有持續(xù)狀態(tài)和轉(zhuǎn)角狀態(tài)的HMM拓樸結(jié)構(gòu)結(jié)合使用,比如,HMM拓樸結(jié)構(gòu)中 的任何一個持續(xù)狀態(tài)或者轉(zhuǎn)角狀態(tài)都可以具有平行的狀態(tài)。上述的平行狀態(tài)的概念也可以應(yīng)用到多路徑HMM拓樸結(jié)構(gòu)中,即, 在多路徑HMM拓樸結(jié)構(gòu)的任何一條路徑中,都可能有一個或者數(shù)個的狀 態(tài)是具有平行狀態(tài)的。圖5c示出了根據(jù)圖5a的手寫示例所構(gòu)建的具有平行狀態(tài)的HMM拓 樸機(jī)構(gòu)的示意圖,其中只示出了平行狀態(tài)的相關(guān)部分。其中,持續(xù)狀態(tài)512 代表實(shí)筆劃"I ",持續(xù)狀態(tài)518代表實(shí)筆劃"一"。對于圖5a中所示 的可能為實(shí)筆劃也可能為虛筆劃的部分,在圖5c所示的HMM拓樸結(jié)構(gòu)中, 采用持續(xù)狀態(tài)520代表圖5a中的實(shí)筆劃502,用持續(xù)狀態(tài)520b代表圖 5b中的虛筆劃504。在圖5c所示的實(shí)施例中,轉(zhuǎn)角狀態(tài)514和516同樣 具有一個平行的轉(zhuǎn)角狀態(tài)514b和516b。轉(zhuǎn)角狀態(tài)是否具有一平行狀態(tài)與 其所對應(yīng)的轉(zhuǎn)角在字跡中所處的位置有關(guān),如果轉(zhuǎn)角的位置更加接近可能 為實(shí)筆劃也可能為虛筆劃的部分,那么這個轉(zhuǎn)角所對應(yīng)的轉(zhuǎn)角狀態(tài)也會具 有一個平行狀態(tài),相應(yīng)的,如果轉(zhuǎn)角的位置遠(yuǎn)離可能為實(shí)筆劃也可能為虛 筆劃的部分,那么這個轉(zhuǎn)角所對應(yīng)的轉(zhuǎn)移狀態(tài)就沒有平行狀態(tài)。通常,在 例如圖5c所示的情況的HMM拓樸結(jié)構(gòu)中,轉(zhuǎn)角狀態(tài)514和516各自具 有一個平行狀態(tài)514b和516b。在其他的實(shí)施例中,可能是516具有平行 的狀態(tài)而514沒有,或者514具有平行狀態(tài)而516沒有。當(dāng)然,本發(fā)明也 不排除兩個轉(zhuǎn)角狀態(tài)都沒有平行狀態(tài)的情況。提供平行狀態(tài)的一種實(shí)現(xiàn)形式是采用雙高斯混合模型(GMM),即利 用高斯函數(shù)的分布特性,使得實(shí)筆劃和虛筆劃分別對應(yīng)不同的高斯函數(shù)的 峰值。第二種解決實(shí)筆劃/虛筆劃不確定性的方法是對HMM拓樸結(jié)構(gòu)應(yīng)用多 空間概率分布(MSD),對應(yīng)手寫東亞字符中既可能是虛筆劃,也可能是 實(shí)筆劃的部分。MSD是一種常用的算法,因此在本發(fā)明中不具體描述其詳 細(xì)的原理,將MSD應(yīng)用到HMM拓樸結(jié)構(gòu)上,可以根據(jù)下述的方式來實(shí)現(xiàn) 對于每一個HMM拓樸結(jié)構(gòu),定義兩個空間,分別對應(yīng)實(shí)筆劃和虛筆劃。 通過MSD可以對不確定的部分分別在兩個空間內(nèi)進(jìn)行多空間概率分布的計(jì)算,得到對應(yīng)實(shí)筆劃的第一度量值和對應(yīng)虛筆劃的第二度量值,通過對 于度量值的處理來解決實(shí)筆劃/虛筆劃不確定性的問題。這樣,本發(fā)明有效地針對手寫東亞字符的主要特點(diǎn)提供了 一種識別的 技術(shù),能夠很好地適應(yīng)手寫東亞字符的特征。但是,還面臨的一個問題是 模型數(shù)據(jù)量的問題。就如上面所描述的,對于每一個手寫東亞字符,會提供一個多路徑的HMM拓樸結(jié)構(gòu),并且,每一條路徑中,都會提供數(shù)個狀 態(tài)來對應(yīng)每一個筆劃,在筆劃之間還需要提供"轉(zhuǎn)角"狀態(tài),對于存在實(shí) 筆劃/虛筆劃不確定性的部分,還需要提供平行狀態(tài)或者應(yīng)用MSD技術(shù)。 這些都將導(dǎo)致HMM模型的數(shù)據(jù)量非常龐大。為了有效地節(jié)省數(shù)據(jù)空間, 降低本發(fā)明的實(shí)現(xiàn)成本,還需要考慮數(shù)據(jù)壓縮的問題。雖然東亞字符相互之間的相似性不是很明顯,但是如果將東亞字符分 割成數(shù)個部分,這些局部的結(jié)構(gòu)還是具有不少相似之處的。利用這個特點(diǎn), 能夠?qū)崿F(xiàn)HMM拓樸結(jié)構(gòu)中狀態(tài)的聚類,從而減小數(shù)據(jù)量,降低HMM拓 樸結(jié)構(gòu)的復(fù)雜度。根據(jù)本發(fā)明,在構(gòu)建HMM拓樸結(jié)構(gòu)之后還會對HMM拓樸拓樸結(jié)構(gòu) 中的狀態(tài)進(jìn)行聚類,使HMM拓樸拓樸結(jié)構(gòu)中的至少一組狀態(tài)共用參數(shù), 且對于一組共用參數(shù)的狀態(tài),在HMM拓樸結(jié)構(gòu)中只保存一套參數(shù)。狀態(tài)的聚類可能在同一路徑上的狀態(tài)之間進(jìn)行,也可能在不同路徑上 的狀態(tài)之間進(jìn)行,被認(rèn)為是可以聚類的狀態(tài),HMM拓樸結(jié)構(gòu)中將只為所有 這些狀態(tài)保留一套參數(shù)。這樣就可以有效地減少數(shù)據(jù)量,降低HMM拓樸結(jié)構(gòu)的復(fù)雜度。適于識別手寫東亞字符的HMM拓樸結(jié)構(gòu)的實(shí)現(xiàn)方法 對于上面所介紹的HMM拓樸結(jié)構(gòu),可以按照下面所描述的方法來實(shí)現(xiàn)1)產(chǎn)生字根訓(xùn)練數(shù)據(jù)在進(jìn)行HMM訓(xùn)練過程之前,需要對數(shù)據(jù)進(jìn)行標(biāo)記,對于東亞字符來 說,數(shù)據(jù)通常是采用字符而不是字根來進(jìn)行標(biāo)記。而對于本發(fā)明的識別方 法來說,建立的HMM拓樸結(jié)構(gòu)中更需要利用的是由字根進(jìn)行標(biāo)記的數(shù)據(jù)。維特比(Viterbi)解碼的一個附加效果就能提供筆跡樣本和HMM狀態(tài)之 間的對應(yīng)關(guān)系。因此,借助維特比解碼,就能夠自動從字符數(shù)據(jù)中獲得對 應(yīng)于字根的筆跡數(shù)據(jù),比如,參照對應(yīng)字根的HMM模型中對應(yīng)關(guān)系的分 界點(diǎn),將筆跡樣本進(jìn)行分解。為了做上述的切分得到字根數(shù)據(jù),首先要得到一個初步的HMM模型。 此模型雖然可能不一定能非常準(zhǔn)確的識別手寫字符,但能相對準(zhǔn)確的得到 字根的分界點(diǎn)。該初步的HMM模型從單一路徑開始構(gòu)建,并逐漸地分割 出越來越多的路徑直到路徑數(shù)足夠?yàn)橹梗窂綌?shù)是否足夠采用路徑的收斂 度量來衡量。該方法的一個示例如下a) 初始化一具有單一路徑的HMM (n-1);b) 對于HMM中已經(jīng)存在的n條路徑P1、 P2…Pn,計(jì)算它們的收斂 度量C(P1)、 C(P2)…C(Pn),并選擇其中收斂度量C(Pj)最大的路徑Pj;c) 如果C(Pj)《T, T為預(yù)定的收斂門限值,則說明對于目前的訓(xùn)練數(shù) 據(jù)來說,這個HMM拓樸結(jié)構(gòu)中的路徑數(shù)已經(jīng)足夠多,不必繼續(xù)分割路徑;d) 如果C(Pj)〉T,則將路徑Pj復(fù)制,增加噪聲后構(gòu)建一條新的路徑, 此時,HMM模型中具有了 n+1條路徑;e) 在n+1條路徑的基礎(chǔ)上進(jìn)行HMM模型的訓(xùn)練,直到無法再提高識 別精度為止;至此,已經(jīng)獲得了初步的多路徑HMM模型,將字符數(shù)據(jù)作 字根對齊并切分,得到相對比較正確的字根數(shù)據(jù)。得到的字根數(shù)據(jù)將被后 面的步驟用于訓(xùn)練來得到識別手寫字符的拓樸結(jié)構(gòu)優(yōu)化的HMM模型。2)最優(yōu)路徑數(shù)確定根據(jù)本法明,還提供一種統(tǒng)計(jì)特征來解決對最優(yōu)路徑數(shù)確定的問題, 該特征稱之為"子序列方向直方圖向量"。對于每一個筆跡樣本,按弧長將其分成數(shù)個分段,每一分段分別提取 一特征。其中,這里所說的弧長是指所有筆劃長度之和,就是所有的實(shí)筆 劃加上所有的虛筆劃的長度之和,分段的過程是基于這個求和之后的弧長。 其中的特征該分段的形狀特征。因此,經(jīng)過分段和提取特征的操作之后, 能夠獲取一個字跡樣本在每一個分段上的一種形狀特征。將每個分段上的 特征按順序連接,從而得到該筆跡樣本的一個特征。筆跡樣本的每個分段上的形狀特征可以實(shí)現(xiàn)為子序列方向直方圖向 量。將筆跡樣本的分段進(jìn)一步劃分成數(shù)個子段,每一個子段確定一量化的 方向特征,每一個量化的方向特征對應(yīng)一預(yù)定角度范圍的方向。每一個分 段上的形狀特征為一子序列方向直方圖,每一個筆跡樣本的特征為一子序 列方向直方圖向量。參考圖6a所示,說明了子序列方向直方圖的建立過程。首先,字跡樣 本"王,,602被按照弧長分割成了數(shù)個分段,其中該弧長是實(shí)筆劃和虛筆 劃相連之后的總弧長604,在這些分段中,有一些只包括實(shí)筆劃,比如分 段604a,有一些只包括虛筆劃,比如分段604c,還有一些既有實(shí)筆劃, 也有虛筆劃,比如分段604b。以分段604b為例,其又可以被分割成數(shù)個 字分段,對于這些子分段,根據(jù)它們的方向(參考方向指針606)和筆劃 密度得到了子序列方向直方圖。比如,604b的虛筆劃部分的一個分段605a 對應(yīng)的子序列方向直方圖為605b, 604b的實(shí)筆劃部分的一個分段607a 對應(yīng)的子序列方向直方圖為607b。將所有子分段的子序列方向直方圖組合 在一起,就能得到對應(yīng)于每一個分段的子序列方向直方圖,進(jìn)一步將每一 個分段的子序列方向直方圖組合,就能得到對應(yīng)筆跡樣本的子序列方向直 方圖向量,比如圖6a中的608。在獲得了子序列方向直方圖向量之后,就能容易地對上述特征進(jìn)行聚 類,每一個聚類對應(yīng)于一種筆劃順序或者一種手寫風(fēng)格。聚類的操作可以 通過諸如高斯混合模型(Guassian Mixture Model)來實(shí)現(xiàn)。最終,將獲得m個聚類后的結(jié)果,m也是對應(yīng)于一個手寫東亞字符的 優(yōu)化的路徑數(shù)量。然后,基于每一個聚類的數(shù)據(jù)確定對應(yīng)于每一種筆劃順 序或者每一種手寫風(fēng)格的HMM拓樸結(jié)構(gòu)中的一路徑的參數(shù)。參考圖6b,圖6b是進(jìn)行訓(xùn)練數(shù)據(jù)自動分類,更確切地說是經(jīng)過聚類 操作的實(shí)例。圖6b中,從訓(xùn)練數(shù)據(jù)中總共提供了 9個樣本數(shù)據(jù)。通過數(shù)據(jù) 自動分類,將它們聚類成2個典型的類,代表兩個經(jīng)過聚類處理之后的書 寫風(fēng)格的"復(fù)"字。3)最優(yōu)狀態(tài)數(shù)量的確定在確定了路徑的數(shù)量之后,還需要確定路徑中狀態(tài)的數(shù)量,根據(jù)本發(fā)明,依然采用來自數(shù)據(jù)的機(jī)器自學(xué)習(xí)的方法來確定狀態(tài)的數(shù)量。確定一個路徑中的狀態(tài)的數(shù)量時,采用的數(shù)據(jù)是來自上述的步驟2)中同一個類中 的筆跡樣本。HMM中的狀態(tài)反映的是筆跡樣本的形態(tài)和變化,因此,狀態(tài) 包括兩類對于方向變化不明顯(彎曲度不大)的部分,稱之為"持續(xù)筆 劃",對應(yīng)HMM中的"持續(xù)狀態(tài)";對于方向變化明顯(彎曲度大)的 部分,就是"轉(zhuǎn)角",對應(yīng)于"轉(zhuǎn)角狀態(tài)"。 一個路徑中狀態(tài)的數(shù)量就是 "持續(xù)筆劃"與"轉(zhuǎn)角"的數(shù)量之和,也就是"持續(xù)狀態(tài)"的數(shù)量與"轉(zhuǎn) 角狀態(tài)"的數(shù)量之和。逐漸精細(xì)化的曲率尺度空間算法(coarse-to-fine Curvature Scale Space )可被用于進(jìn)行轉(zhuǎn)角的檢測,從而確定轉(zhuǎn)角的數(shù)量, 同時,由于轉(zhuǎn)角和持續(xù)筆劃是交替出現(xiàn)的,又能從轉(zhuǎn)角的數(shù)量推算出持續(xù) 筆劃的數(shù)量,這樣,狀態(tài)的數(shù)量就能被確定。4) 狀態(tài)連接設(shè)計(jì)如前面所述的"虛筆劃/實(shí)筆劃的不確定性"的問題,本發(fā)明提供兩種 解決的方案。第一種方式,是在HMM拓樸結(jié)構(gòu)中提供平行狀態(tài),對應(yīng)手寫東亞字 符中既可能是虛筆劃,也可能是實(shí)筆劃的部分。提供平行狀態(tài)的一種實(shí)現(xiàn) 形式是采用雙高斯混合模型(GMM),即利用高斯函數(shù)的分布特性,使得 實(shí)筆劃和虛筆劃分別對應(yīng)不同的高斯函數(shù)的峰值,利用這樣的雙高斯混合 模型,就能夠解決解決實(shí)筆劃/虛筆劃不確定性的問題。參考圖6c,對于"木" 字,有連筆和不連筆兩種寫法,連筆的寫法對應(yīng)"實(shí)筆劃"的情況,而不 連筆的寫法對應(yīng)"虛筆劃"的情況,參考圖6c,實(shí)筆劃和虛筆劃分別具有 各自的高斯函數(shù)分布,它們的峰值不同,因此將它們組合可以獲得雙高斯 混合模型,具有兩個不同的峰值,從而實(shí)現(xiàn)平行狀態(tài)。第二種方法,對HMM拓樸結(jié)構(gòu)應(yīng)用多空間概率分布(MSD),對應(yīng) 手寫東亞字符中既可能是虛筆劃,也可能是實(shí)筆劃的部分。5) 路徑合并在上述的步驟完成之后,獲得了初步的多路徑的HMM拓樸結(jié)構(gòu),其 中包括了對應(yīng)于訓(xùn)練數(shù)據(jù)中所有情況的路徑,包括反映筆劃順序和手寫風(fēng) 格的路徑,但是,由于訓(xùn)練數(shù)據(jù)中存在的冗余信息和極低概率的信息,需要對所獲得的路徑進(jìn)行合并處理。路徑的合并處理可以包括兩個方面將 出現(xiàn)概率極低的路徑去除;以及,將類似的路徑進(jìn)行合并。將出現(xiàn)概率極低的路徑,也就是該路徑所對應(yīng)的訓(xùn)練數(shù)據(jù)中的數(shù)據(jù)量 較小,占訓(xùn)練數(shù)據(jù)總量的比例低去除,去除這些路徑可以通過設(shè)置預(yù)定門 限的方法實(shí)現(xiàn)。而類似的路徑合并的操作可以通過為路徑計(jì)算相似度度量的方式來實(shí) 現(xiàn),通過相似度度量來表示路徑之間的相似程度,當(dāng)兩條路徑足夠相似時, 就把路徑合并。比如,相似度度量可以用Kullback-Leibler差值來表示, Kullback-Leibler差值表示路徑之間相似的程度。如果Kullback-Leibler差值低于一預(yù)定值,就表示兩條路徑足夠相似,則可以把它們合并,合并操 作將對兩條路徑進(jìn)行平衡化的處理,以得到 一條能夠很好地反映原來兩條 路徑中的主要特點(diǎn)的路徑。 6)狀態(tài)聚類之后,還需要對HMM拓樸結(jié)構(gòu)中狀態(tài)進(jìn)行聚類。如果將東亞字符分 割成數(shù)個部分,這些局部的結(jié)構(gòu)還是具有不少相似之處的。利用這個特點(diǎn), 能夠?qū)崿F(xiàn)HMM拓樸結(jié)構(gòu)中狀態(tài)的聚類,從而減小數(shù)據(jù)量,降低HMM拓 樸結(jié)構(gòu)的復(fù)雜度。狀態(tài)的聚類可能在同一路徑上的狀態(tài)之間進(jìn)行,也可能 在不同路徑上的狀態(tài)之間進(jìn)行,被認(rèn)為是可以聚類的狀態(tài),HMM拓樸結(jié)構(gòu) 中將只為所有屬于同一個聚類的狀態(tài)保留一套參數(shù)。根據(jù)本發(fā)明,聚類操作包括計(jì)算該HMM拓樸結(jié)構(gòu)中每兩個狀態(tài)之 間的狀態(tài)相似度度量,當(dāng)狀態(tài)相似度度量表示兩個狀態(tài)足夠相似時,使該 兩個狀態(tài)共用參數(shù);其中,當(dāng)兩個以上的狀態(tài)相互之間的狀態(tài)相似度度量 都足夠相似時,使該這些狀態(tài)都共用參數(shù)。在本發(fā)明的一個實(shí)現(xiàn)中,狀態(tài) 相似度度量通過Kullback-Leibler差值表示,Kullback-Leibler差值低于一 預(yù)定值,則表示這兩個狀態(tài)足夠相似。比如一個具體的聚類操作的過程被 顯示如下初始化階段設(shè)定所有狀態(tài)的總數(shù)為M個,將第m個狀態(tài)歸類到第m個類中(1 《m《M);對于任意的兩個狀態(tài)m和n,計(jì)算它們之間的Kullback-Leibler差值,并表示為D ( m,n )。 聚類階段尋找具有最小的Kullback-Leibler差值的一組狀態(tài)(m',n'),可通過 下面的函凄t實(shí)J見(m',n') -argmin (m,n)。通過在Kullback-Leibler差值矩陣中將對應(yīng)于m'和n'的行與列相加, 合并第m'和n'狀態(tài)。將狀態(tài)M的總數(shù)減1。循環(huán)操作如果M的數(shù)量大于一預(yù)定值,則重復(fù)上面的操作,否則完成合并操作。通過上面的步驟1)-5),就能從手寫東亞字符的訓(xùn)練數(shù)據(jù)中自動構(gòu) 建對應(yīng)于手寫東亞字符的多路徑HMM拓樸結(jié)構(gòu),其中的每一條路徑對應(yīng) 手寫東亞字符的多種筆劃順序中的一個,或者,其中的每一條路徑對應(yīng)手 寫東亞字符的多種手寫風(fēng)格中的一個;在HMM拓樸結(jié)構(gòu)中提供描述手寫東亞字符持續(xù)筆劃的持續(xù)狀態(tài),和 描述手寫東亞字符筆劃間轉(zhuǎn)角的轉(zhuǎn)角狀態(tài);其中,多路徑HMM拓樸結(jié)構(gòu)中的每一條路徑是左向右HMM拓樸結(jié) 構(gòu),從一起始狀態(tài)開始,至一終止?fàn)顟B(tài)結(jié)束;其中持續(xù)狀態(tài)可以轉(zhuǎn)移至下 一狀態(tài)或者自轉(zhuǎn)移,轉(zhuǎn)角狀態(tài)只能轉(zhuǎn)移至下一狀態(tài),不能自轉(zhuǎn)移;HMM拓 樸結(jié)構(gòu)中持續(xù)狀態(tài)和轉(zhuǎn)角狀態(tài)依次交替存在;以及其中所有路徑起始于同 一入口狀態(tài),至同一出口狀態(tài)結(jié)束??赡艿挠布?shí)現(xiàn)形式本發(fā)明可以通過軟件的形式實(shí)現(xiàn),比如通過一通用計(jì)算系統(tǒng)運(yùn)行實(shí)現(xiàn) 本發(fā)明所述的方法的軟件,就能實(shí)現(xiàn)本發(fā)明。本發(fā)明也可以以指令或者程 序的形式被實(shí)現(xiàn),這些指令或者程序可以保存在一個存儲介質(zhì)上,當(dāng)一計(jì) 算設(shè)備從存儲介質(zhì)上獲取這些指令或者程序并執(zhí)行之后,就能夠?qū)崿F(xiàn)本發(fā) 明。此外,本發(fā)明也可以使用硬件的形式實(shí)現(xiàn),需要說明的是,對于本領(lǐng)域的技術(shù)人員來說,很顯然在本發(fā)明所處的領(lǐng)域中,軟硬件之間的轉(zhuǎn)換是 具有多種形式的,即具有不同形式的硬件可以實(shí)現(xiàn)相同的功能,因此,本 發(fā)明下面所列舉的可能的硬件實(shí)現(xiàn)形式是限定硬件的功能,而不限定其具 體實(shí)現(xiàn)形式,對于本領(lǐng)域的技術(shù)人員來說,根據(jù)這些功能實(shí)現(xiàn)各種形式的 功能是顯而意見的。參考圖7所示,本發(fā)明的一示例的利用HMM模型識別手寫東亞字符 的系統(tǒng)700包括HMM拓樸結(jié)構(gòu)構(gòu)建裝置702,構(gòu)建對應(yīng)于手寫東亞字符的HMM拓樸 結(jié)構(gòu);持續(xù)狀態(tài)設(shè)置裝置704,在HMM拓樸結(jié)構(gòu)中提供描述手寫東亞字符 持續(xù)筆劃的持續(xù)狀態(tài);轉(zhuǎn)角狀態(tài)設(shè)置裝置706,在HMM拓樸結(jié)構(gòu)中提供描述手寫東亞字符 筆劃間轉(zhuǎn)角的轉(zhuǎn)角狀態(tài)。其中,HMM拓樸結(jié)構(gòu)構(gòu)建裝置702構(gòu)建的HMM拓樸結(jié)構(gòu)是左向右 HMM拓樸結(jié)構(gòu),從一起始狀態(tài)開始,至一終止?fàn)顟B(tài)結(jié)束;并且,HMM拓 樸結(jié)構(gòu)中的持續(xù)狀態(tài)可以轉(zhuǎn)移至下一狀態(tài)或者自轉(zhuǎn)移,轉(zhuǎn)角狀態(tài)只能轉(zhuǎn)移 至下一狀態(tài),不能自轉(zhuǎn)移;持續(xù)狀態(tài)和轉(zhuǎn)角狀態(tài)依次交替存在。在另一實(shí)施例中,該HMM拓樸結(jié)構(gòu)構(gòu)建裝置702構(gòu)建多路徑HMM 拓樸結(jié)構(gòu),對應(yīng)于手寫東亞字符;其中的每一條路徑對應(yīng)手寫東亞字符的多種筆劃順序中的一個;或者,其中的每一條路徑對應(yīng)手寫東亞字符的多 種手寫風(fēng)格中的一個。其中,HMM拓樸結(jié)構(gòu)構(gòu)建裝置702構(gòu)建的多路徑HMM拓樸結(jié)構(gòu)中的 每一條路徑是左向右HMM拓樸結(jié)構(gòu),從一起始狀態(tài)開始,至一終止?fàn)顟B(tài) 結(jié)束;并且,其中持續(xù)狀態(tài)可以轉(zhuǎn)移至下一狀態(tài)或者自轉(zhuǎn)移,轉(zhuǎn)角狀態(tài)只 能轉(zhuǎn)移至下一狀態(tài),不能自轉(zhuǎn)移;HMM拓樸結(jié)構(gòu)中持續(xù)狀態(tài)和轉(zhuǎn)角狀態(tài)依 次交替存在;以及其中所有路徑起始于同一入口狀態(tài),至同一出口狀態(tài)結(jié) 束。一個實(shí)施例中,該系統(tǒng)700還包括平行狀態(tài)提供裝置708,在HMM 拓樸結(jié)構(gòu)中提供平行狀態(tài),對應(yīng)手寫東亞字符中既可能是虛筆劃,也可能是實(shí)筆劃的部分。該平行狀態(tài)提供裝置708可以應(yīng)用雙高斯混合模型實(shí)現(xiàn) 平行狀態(tài)?;蛘?,包括多空間概率分布(MSD)處理裝置710,對HMM拓樸結(jié) 構(gòu)應(yīng)用多空間概率分布,對應(yīng)手寫東亞字符中既可能是虛筆劃,也可能是 實(shí)筆劃的部分。需要說明的是,平行狀態(tài)提供裝置708和多空間概率分布處理裝置 710是二選其一的。在一個實(shí)施例中,該系統(tǒng)700還包括狀態(tài)聚類裝置712,對HMM拓 樸結(jié)構(gòu)中的狀態(tài)進(jìn)行聚類,使HMM拓樸結(jié)構(gòu)中的至少一組狀態(tài)共用參數(shù), 且對于所述一組共用參數(shù)的狀態(tài),在HMM拓樸結(jié)構(gòu)中只保存一套參數(shù)。需要說明的是,此處描述的利用HMM模型識別手寫東亞字符的系統(tǒng) 700的各個裝置可用于實(shí)現(xiàn)上面結(jié)合附圖2-5所描述的方法,其中的各個 細(xì)節(jié)特征都對應(yīng),因此這里就不再重復(fù)地進(jìn)行描述。圖8示出了根據(jù)本發(fā)明的另一實(shí)施例的利用HMM模型識別手寫東亞 字符的系統(tǒng)800的結(jié)構(gòu)圖,該系統(tǒng)800包括HMM拓樸結(jié)構(gòu)構(gòu)建裝置802,構(gòu)建對應(yīng)于手寫東亞字符的多路徑 HMM拓樸結(jié)構(gòu),其中的每一條路徑對應(yīng)手寫東亞字符的多種筆劃順序中的 一個,或者,其中的每一條路徑對應(yīng)手寫東亞字符的多種手寫風(fēng)格中的一 個;持續(xù)狀態(tài)設(shè)置裝置804,在HMM拓樸結(jié)構(gòu)中設(shè)置描述手寫東亞字符 持續(xù)筆劃的持續(xù)狀態(tài);轉(zhuǎn)角狀態(tài)設(shè)置裝置806,在HMM拓樸結(jié)構(gòu)中設(shè)置和描述手寫東亞字 符筆劃間轉(zhuǎn)角的轉(zhuǎn)角狀態(tài);其中,多路徑HMM拓樸結(jié)構(gòu)中的每一條路徑是左向右HMM拓樸結(jié) 構(gòu),從一起始狀態(tài)開始,至一終止?fàn)顟B(tài)結(jié)束;持續(xù)狀態(tài)可以轉(zhuǎn)移至下一狀 態(tài)或者自轉(zhuǎn)移,轉(zhuǎn)角狀態(tài)只能轉(zhuǎn)移至下一狀態(tài),不能自轉(zhuǎn)移;持續(xù)狀態(tài)和 轉(zhuǎn)角狀態(tài)依次交替存在;并且所有路徑起始于同一入口狀態(tài),至同一出口 狀態(tài)結(jié)束;以及下列兩個裝置的其中之一平行狀態(tài)提供裝置808,在HMM拓樸結(jié)構(gòu)中提供平行狀態(tài),對應(yīng)手 寫東亞字符中既可能是虛筆劃,也可能是實(shí)筆劃的部分;平行狀態(tài)提供裝 置808可以采用雙高斯混合模型(GMM),即利用高斯函數(shù)的分布特性, 使得實(shí)筆劃和虛筆劃分別對應(yīng)不同的高斯函數(shù)的峰值,利用這樣的雙高斯 混合模型,也能夠解決解決實(shí)筆劃/虛筆劃不確定性的問題。多空間概率分布處理裝置810,對HMM拓樸結(jié)構(gòu)應(yīng)用多空間概率分 布,對應(yīng)手寫東亞字符中既可能是虛筆劃,也可能是實(shí)筆劃的部分。根據(jù)圖8所示的系統(tǒng)800,其中的HMM拓樸結(jié)構(gòu)構(gòu)建裝置802從手 寫東亞字符的訓(xùn)練數(shù)據(jù)中自動構(gòu)建多路徑HMM拓樸結(jié)構(gòu);以及該HMM拓 樸結(jié)構(gòu)構(gòu)建裝置802根據(jù)手寫東亞字符的筆劃順序或者書寫風(fēng)格,應(yīng)用一 機(jī)器自學(xué)習(xí)的自動分類方法對訓(xùn)練數(shù)據(jù)進(jìn)行分類。繼續(xù)參考圖8,該系統(tǒng)800采用的訓(xùn)練數(shù)據(jù)包括手寫東亞字符筆跡樣 本,筆跡樣本包括不同筆劃順序或者不同手寫風(fēng)格的筆跡樣本;該HMM 拓樸結(jié)構(gòu)構(gòu)建裝置802包括,筆跡樣本分段裝置820,對于每一個筆跡樣本,按弧長將其分成數(shù)個 分段;這里所說的弧長是指所有筆劃長度之和,就是所有的實(shí)筆劃加上所 有的虛筆劃的長度之和,分段的過程是基于這個求和之后的弧長。特征提取裝置822,對每一分段分別提取一特征;其中的特征該分段 的形狀特征。因此,經(jīng)過分段和提取特征的操作之后,能夠獲取一個字跡 樣本在每一個分段上的一種形狀特征。將每個分段上的特征按順序連接, 從而得到該筆跡樣本的一個特征。聚類裝置824,對上述的特征進(jìn)行聚類,每一個聚類對應(yīng)于一種筆劃 順序或者一種手寫風(fēng)格;HMM拓樸結(jié)構(gòu)構(gòu)建裝置802基于每一個聚類的數(shù)據(jù)確定對應(yīng)于每一 種筆劃順序或者每一種手寫風(fēng)格的HMM拓樸結(jié)構(gòu)中的一路徑的參數(shù)。進(jìn) 一步的,根據(jù)一實(shí)施例,HMM拓樸結(jié)構(gòu)構(gòu)建裝置802還可包括子序列方 向直方圖向量建立裝置826,將上述的筆跡樣本的每個分段上的形狀特征 實(shí)現(xiàn)為子序列方向直方圖向量。其中,筆跡樣本分段裝置對于每一個筆跡 樣本,將實(shí)筆劃和虛筆劃相連,并將實(shí)筆劃和虛筆劃相連后的弧長分成數(shù)段;而特征為量化的方向,特征提取裝置822使每一個特征對應(yīng)一預(yù)定角 度范圍的方向;該子序列方向直方圖向量建立裝置826建立對應(yīng)于分段及特征的子序 列方向直方圖向量,該子序列方向直方圖向量建立裝置826將筆跡樣本的 分段進(jìn)一步劃分成數(shù)個子段,每一個子段確定一量化的方向特征,每一個 量化的方向特征對應(yīng)一預(yù)定角度范圍的方向。每一個分段上的形狀特征為 一子序列方向直方圖,每一個筆跡樣本的特征為一子序列方向直方圖向量。繼續(xù)參考圖8,在一實(shí)施例中,該系統(tǒng)800還包括路徑合并裝置814,對多路徑HMM拓樸結(jié)構(gòu)中的路徑進(jìn)行合并,以 控制路徑的數(shù)量。該路徑合并裝置814判斷路徑所對應(yīng)的訓(xùn)練數(shù)據(jù)的數(shù)據(jù) 量,刪除對應(yīng)的數(shù)據(jù)量小于一預(yù)定值的路徑;計(jì)算多路徑HMM拓樸結(jié)構(gòu) 中每兩個路徑之間的路徑相似度度量,當(dāng)路徑相似度度量表示兩個狀態(tài)足 夠相似時,合并該兩個路徑,其中,當(dāng)兩個以上的路徑的路徑相似度度量 都足夠相似時,合并這些路徑。在一個實(shí)現(xiàn)中,該路徑相似度度量用 Kullback-Leibler差值表示,當(dāng)Kullback-Leibler差值低于一預(yù)定值時,表 示路徑足夠相似,可以合并這些路徑。該系統(tǒng)800還可包括狀態(tài)聚類裝置812,對HMM拓樸結(jié)構(gòu)中狀態(tài)進(jìn) 行聚類,使HMM拓樸結(jié)構(gòu)中的至少一組狀態(tài)共用參數(shù),且對于一組共用 參數(shù)的狀態(tài),在HMM拓樸結(jié)構(gòu)中只保存一套參數(shù)。狀態(tài)聚類裝置812計(jì) 算該HMM拓樸結(jié)構(gòu)中每兩個狀態(tài)之間的狀態(tài)相似度度量,當(dāng)狀態(tài)相似度 度量表示兩個狀態(tài)足夠相似時,使該兩個狀態(tài)共用參數(shù);其中,當(dāng)兩個以 上的狀態(tài)相互之間的狀態(tài)相似度度量都足夠相似時,使該這些狀態(tài)都共用 參數(shù)。并且狀態(tài)聚類裝置812狀態(tài)通過Kullback-Leibler差值表示相似度 度量,當(dāng)Kullback-Leibler差值低于一預(yù)定值時,表示這些狀態(tài)足夠相似, 可以合并這些狀態(tài)。需要說明的是,此處利用HMM模型識別手寫東亞字符的系統(tǒng)800的 各個裝置可用于實(shí)現(xiàn)上面結(jié)合附圖6所描述的方法,包括上面所描述的步 驟1 )-5)來構(gòu)建多路徑HMM拓樸結(jié)構(gòu),其中的各個細(xì)節(jié)特征都對應(yīng),因此這里就不再重復(fù)地進(jìn)行描述。本發(fā)明針對手寫東亞字符的特點(diǎn)提供了一種利用改進(jìn)的HMM模型來 對手寫東亞字符進(jìn)行識別的方案,充分考慮了手寫東亞字符筆劃多、筆劃 順序多樣、結(jié)構(gòu)復(fù)雜、書寫風(fēng)格多樣、筆劃間連接不確定的特點(diǎn),改進(jìn)了 HMM拓樸結(jié)構(gòu)的特點(diǎn),通過在HMM拓樸結(jié)構(gòu)中加入轉(zhuǎn)角狀態(tài)、提供多路 徑、提供平行狀態(tài)的手段來解決上述的問題,并且,通過聚類和合并的操 作來減小數(shù)據(jù)量,降低運(yùn)算的復(fù)雜程度。上面結(jié)合本發(fā)明的 一 實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的描述,但是需要說 明的是,這并不是對于本發(fā)明的范圍作出任何的限制,對于上面所說的實(shí) 施例的所作出的各種不需要創(chuàng)造性勞動的變化,修改,都應(yīng)被視為是在本 發(fā)明的范圍之內(nèi),對于本發(fā)明而言,應(yīng)當(dāng)擴(kuò)展到符合權(quán)利要求所限定的發(fā) 明原理的最寬泛的范圍。
權(quán)利要求
1. 一種建立適用于識別手寫東亞字符的隱性馬爾可夫(HMM)模型的方法,其特征在于,提供HMM拓?fù)浣Y(jié)構(gòu),該HMM拓?fù)浣Y(jié)構(gòu)用于識別手寫東亞字符;在HMM拓?fù)浣Y(jié)構(gòu)中提供持續(xù)狀態(tài),該持續(xù)狀態(tài)用于描述手寫東亞字符的持續(xù)筆劃;在HMM拓?fù)浣Y(jié)構(gòu)中提供轉(zhuǎn)角狀態(tài),該轉(zhuǎn)角狀態(tài)用于描述手寫東亞字符的筆劃間轉(zhuǎn)角。
2. 如權(quán)利要求1所述的方法,其特征在于,所構(gòu)建的HMM拓樸結(jié)構(gòu)是左向右HMM拓樸結(jié)構(gòu),從一起始狀態(tài)開 始,至一終止?fàn)顟B(tài)結(jié)束;所述HMM拓樸結(jié)構(gòu)中的持續(xù)狀態(tài)被設(shè)置為能夠轉(zhuǎn)移至下一狀態(tài)或者 自轉(zhuǎn)移,轉(zhuǎn)角狀態(tài)被設(shè)置為只能轉(zhuǎn)移至下一狀態(tài),不能自轉(zhuǎn)移;所述HMM拓樸結(jié)構(gòu)中持續(xù)狀態(tài)和轉(zhuǎn)角狀態(tài)被設(shè)置為依次交替存在。
3. 如權(quán)利要求1所述的方法,其特征在于,還包括 提供多路徑HMM拓樸結(jié)構(gòu),對應(yīng)于手寫東亞字符;多路徑HMM拓樸結(jié)構(gòu)中的每一條路徑被構(gòu)建為手寫東亞字符的多種 筆劃順序中的一個;或者多路徑HMM拓樸結(jié)構(gòu)中的每一條路徑被構(gòu)建為手寫東亞字符的多種 手寫風(fēng)格中的一個。
4. 如權(quán)利要求3所述的方法,其特征在于,所述多路徑HMM拓樸結(jié)構(gòu)中的每一條路徑是左向右HMM拓樸結(jié)構(gòu), 從一起始狀態(tài)開始,至一終止?fàn)顟B(tài)結(jié)束;所述HMM拓樸結(jié)構(gòu)包括持續(xù)狀態(tài)和轉(zhuǎn)角狀態(tài),其中持續(xù)狀態(tài)可以轉(zhuǎn) 移至下一狀態(tài)或者自轉(zhuǎn)移,轉(zhuǎn)角狀態(tài)只能轉(zhuǎn)移至下一狀態(tài),不能自轉(zhuǎn)移;所迷HMM拓樸結(jié)構(gòu)中持續(xù)狀態(tài)和轉(zhuǎn)角狀態(tài)依次交替存在;以及 其中所有路徑起始于同一入口狀態(tài),至同一出口狀態(tài)結(jié)束。
5. 如權(quán)利要求3所述的方法,其特征在于,還包括在HMM拓樸結(jié)構(gòu)中提供平行狀態(tài),對應(yīng)手寫東亞字符中既可能是虛 筆劃,也可能是實(shí)筆劃的部分。
6. 如權(quán)利要求3所述的方法,其特征在于,還包括對HMM拓樸結(jié)構(gòu)應(yīng)用多空間概率分布(MSD),對應(yīng)手寫東亞字符 中既可能是虛筆劃,也可能是實(shí)筆劃的部分。
7. 如權(quán)利要求3所述的方法,其特征在于,還包括對HMM拓樸結(jié)構(gòu)中的狀態(tài)進(jìn)行聚類,使所述HMM拓樸結(jié)構(gòu)中的至 少一組狀態(tài)共用參數(shù),且對于所述一組共用參數(shù)的狀態(tài),在HMM拓樸結(jié) 構(gòu)中只保存一套參數(shù)。
8. —種利用HMM模型識別手寫東亞字符的方法,其特征在于, 提供對應(yīng)于手寫東亞字符的多路徑HMM拓樸結(jié)構(gòu),其中的每一條路徑對應(yīng)手寫東亞字符的多種筆劃順序中的一個,或者,其中的每一條路徑 對應(yīng)手寫東亞字符的多種手寫風(fēng)格中的一個;在HMM拓樸結(jié)構(gòu)中提供描述手寫東亞字符持續(xù)筆劃的持續(xù)狀態(tài),和 描述手寫東亞字符筆劃間轉(zhuǎn)角的轉(zhuǎn)角狀態(tài);其中,所述多路徑HMM拓樸結(jié)構(gòu)中的每一條路徑是左向右HMM拓 樸結(jié)構(gòu),從一起始狀態(tài)開始,至一終止?fàn)顟B(tài)結(jié)束;其中持續(xù)狀態(tài)可以轉(zhuǎn)移 至下一狀態(tài)或者自轉(zhuǎn)移,轉(zhuǎn)角狀態(tài)只能轉(zhuǎn)移至下一狀態(tài),不能自轉(zhuǎn)移;所 述HMM拓樸結(jié)構(gòu)中持續(xù)狀態(tài)和轉(zhuǎn)角狀態(tài)依次交替存在;以及其中所有路 徑起始于同一入口狀態(tài),至同一出口狀態(tài)結(jié)束;在HMM拓樸結(jié)構(gòu)中提供平行狀態(tài),或者對HMM拓樸結(jié)構(gòu)應(yīng)用多空 間概率分布(MSD),對應(yīng)手寫東亞字符中既可能是虛筆劃,也可能是實(shí)筆劃的部分。
9.如權(quán)利要求8所述的方法,其特征在于,所述多路徑HMM拓樸結(jié)構(gòu)從手寫東亞字符的訓(xùn)練數(shù)據(jù)中自動構(gòu)建; 根據(jù)手寫東亞字符的筆劃順序或者書寫風(fēng)格,應(yīng)用 一機(jī)器自學(xué)習(xí)的自 動分類方法對所述訓(xùn)練數(shù)據(jù)進(jìn)行分類。
10.如權(quán)利要求9所述的方法,其特征在于,所述訓(xùn)練數(shù)據(jù)包括手寫東亞字符筆跡樣本,所述筆跡樣本包括不同筆 劃順序或者不同手寫風(fēng)格的筆跡樣本;對于每一個筆跡樣本,按弧長將其分成數(shù)個分段,每一分段分別提取 一特征,將每個分段上的特征按順序連接,從而得到該筆跡樣本的一個特 征;對上述特征進(jìn)行聚類,每一個聚類對應(yīng)于一種筆劃順序或者一種手寫 風(fēng)格;基于每一個聚類的數(shù)據(jù)確定對應(yīng)于每一種筆劃順序或者每一種手寫風(fēng) 格的HMM拓樸結(jié)構(gòu)中的一路徑的拓樸和初始參數(shù)。
11.如權(quán)利要求10所述的方法,其特征在于,還包括建立對應(yīng)于分段及特征的子序列方向直方圖向量,其中,對于每一個筆跡樣本,將實(shí)筆劃和虛筆劃相連,并將實(shí)筆劃和 虛筆劃相連后的弧長分成數(shù)段,每一個子段確定一量化的方向特征,每一個量化的方向特征對應(yīng)一預(yù) 定角度范圍的方向;每一個分段上的形狀特征為一子序列方向直方圖,每一個筆跡樣本的 特征為一子序列方向直方圖向量。
12.如權(quán)利要求9所述的方法,其特征在于,還包括 對多路徑HMM拓樸結(jié)構(gòu)中的路徑進(jìn)行合并,以控制路徑的數(shù)量。
13. 如權(quán)利要求12所述的方法,其特征在于,所述路徑合并包括 判斷路徑所對應(yīng)的訓(xùn)練數(shù)據(jù)的數(shù)據(jù)量,刪除對應(yīng)的數(shù)據(jù)量小于一預(yù)定值的路徑;計(jì)算多路徑HMM拓樸結(jié)構(gòu)中每兩個路徑之間的路徑相似度度量,當(dāng) 路徑相似度度量表示兩個路徑足夠相似時,合并該兩個路徑,其中,當(dāng)兩 個以上路徑的路徑相似度度量表示這些路徑都足夠相似時,合并這些路徑。
14. 如權(quán)利要求13所述的方法,其特征在于,該路徑相似度度量使 用Kullback-Leibler差值表示,當(dāng)當(dāng)Kullback-Leibler差值低于一預(yù)定值時,表示所述路徑足夠相似。
15. 如權(quán)利要求12所述的方法,其特征在于,還包括對HMM拓樸結(jié)構(gòu)中狀態(tài)進(jìn)行聚類,使所述HMM拓樸結(jié)構(gòu)中的至少 一組狀態(tài)共用參數(shù),且對于所述一組共用參數(shù)的狀態(tài),在HMM拓樸結(jié)構(gòu) 中只保存一套參數(shù)。
16. 如權(quán)利要求15所述的方法,其特征在于,聚類多個HMM拓樸結(jié) 構(gòu)中的狀態(tài)包括計(jì)算該HMM拓樸結(jié)構(gòu)中每兩個狀態(tài)之間的狀態(tài)相似度度量,當(dāng)狀態(tài) 相似度度量表示兩個狀態(tài)足夠相似時,使該兩個狀態(tài)共用參數(shù);其中,當(dāng)兩個以上的狀態(tài)相互之間的狀態(tài)相似度度量都足夠相似時, 使該這些狀態(tài)都共用參數(shù)。
17. 如權(quán)利要求16所述的方法,其特征在于, 狀態(tài)相似度度量通過Kullback-Leibler差值表示,當(dāng)Kullback-Leibler差值低于一預(yù)定值時,表示所述狀態(tài)足夠相似。
18. —種建立適用于識別手寫東亞字符的HMM模型的系統(tǒng),其特征在于,包括HMM拓樸結(jié)構(gòu)構(gòu)建裝置,構(gòu)建對應(yīng)于手寫東亞字符的HMM拓樸結(jié)構(gòu); 持續(xù)狀態(tài)設(shè)置裝置,在HMM拓樸結(jié)構(gòu)中提供描述手寫東亞字符持續(xù) 筆劃的持續(xù)狀態(tài);轉(zhuǎn)角狀態(tài)設(shè)置裝置,在HMM拓樸結(jié)構(gòu)中提供描述手寫東亞字符筆劃 間轉(zhuǎn)角的轉(zhuǎn)角狀態(tài)。
19. 如權(quán)利要求18所述的系統(tǒng),其特征在于,HMM拓樸結(jié)構(gòu)構(gòu)建裝置構(gòu)建的HMM拓樸結(jié)構(gòu)是左向右HMM拓樸結(jié)構(gòu),從一起始狀態(tài)開始,至一終止?fàn)顟B(tài)結(jié)束;并且,HMM拓樸結(jié)構(gòu)中的持續(xù)狀態(tài)被設(shè)置為能夠轉(zhuǎn)移至下一狀態(tài)或者 自轉(zhuǎn)移,轉(zhuǎn)角狀態(tài)被設(shè)置為只能轉(zhuǎn)移至下一狀態(tài),不能自轉(zhuǎn)移;所述HMM拓樸結(jié)構(gòu)中持續(xù)狀態(tài)和轉(zhuǎn)角狀態(tài)被設(shè)置為依次交替存在。
20. 如權(quán)利要求18所述的系統(tǒng),其特征在于,HMM拓樸結(jié)構(gòu)構(gòu)建裝置構(gòu)建多路徑HMM拓樸結(jié)構(gòu),對應(yīng)于手寫東亞 字符;其中的每一條路徑對應(yīng)手寫東亞字符的多種筆劃順序中的一個;或 者,其中的每一條路徑對應(yīng)手寫東亞字符的多種手寫風(fēng)格中的一個。
21. 如權(quán)利要求20所述的系統(tǒng),其特征在于,HMM拓樸結(jié)構(gòu)構(gòu)建裝置構(gòu)建的多路徑HMM拓樸結(jié)構(gòu)中的每一條路徑 是左向右HMM拓樸結(jié)構(gòu),從一起始狀態(tài)開始,至一終止?fàn)顟B(tài)結(jié)束;并且,其中持續(xù)狀態(tài)可以轉(zhuǎn)移至下一狀態(tài)或者自轉(zhuǎn)移,轉(zhuǎn)角狀態(tài)只能 轉(zhuǎn)移至下一狀態(tài),不能自轉(zhuǎn)移;所述HMM拓樸結(jié)構(gòu)中持續(xù)狀態(tài)和轉(zhuǎn)角狀態(tài)依次交替存在;以及其中所有路徑起始于同一入口狀態(tài),至同一出口狀態(tài)結(jié)束。
22. 如權(quán)利要求20所述的系統(tǒng),其特征在于,還包括 平行狀態(tài)提供裝置,在HMM拓樸結(jié)構(gòu)中提供平行狀態(tài),對應(yīng)手寫東亞字符中既可能是虛筆劃,也可能是實(shí)筆劃的部分。
23. 如權(quán)利要求20所述的系統(tǒng),其特征在于,還包括 多空間概率分布(MSD)處理裝置,對HMM拓樸結(jié)構(gòu)應(yīng)用多空間概率分布,對應(yīng)手寫東亞字符中既可能是虛筆劃,也可能是實(shí)筆劃的部分。
24. 如權(quán)利要求20所述的系統(tǒng),其特征在于,還包括 狀態(tài)聚類裝置,對HMM拓樸結(jié)構(gòu)中的狀態(tài)進(jìn)行聚類,使所述HMM拓樸結(jié)構(gòu)中的至少一組狀態(tài)共用參數(shù),且對于所述一組共用參數(shù)的狀態(tài), 在HMM拓樸結(jié)構(gòu)中只保存一套參數(shù)。
25. —種利用HMM模型識別手寫東亞字符的系統(tǒng),其特征在于,包括HMM拓樸結(jié)構(gòu)構(gòu)建裝置,構(gòu)建對應(yīng)于手寫東亞字符的多路徑HMM拓 樸結(jié)構(gòu),其中的每一條路徑對應(yīng)手寫東亞字符的多種筆劃順序中的 一個,或者,其中的每一條路徑對應(yīng)手寫東亞字符的多種手寫風(fēng)格中的一個;持續(xù)狀態(tài)設(shè)置裝置,在HMM拓樸結(jié)構(gòu)中設(shè)置描述手寫東亞字符持續(xù) 筆劃的持續(xù)狀態(tài);轉(zhuǎn)角狀態(tài)設(shè)置裝置,在HMM拓樸結(jié)構(gòu)中設(shè)置和描述手寫東亞字符筆 劃間轉(zhuǎn)角的轉(zhuǎn)角狀態(tài);其中,所述多路徑HMM拓樸結(jié)構(gòu)中的每一條路徑是左向右HMM拓 樸結(jié)構(gòu),從一起始狀態(tài)開始,至一終止?fàn)顟B(tài)結(jié)束;持續(xù)狀態(tài)可以轉(zhuǎn)移至下 一狀態(tài)或者自轉(zhuǎn)移,轉(zhuǎn)角狀態(tài)只能轉(zhuǎn)移至下一狀態(tài),不能自轉(zhuǎn)移;持續(xù)狀 態(tài)和轉(zhuǎn)角狀態(tài)依次交替存在;并且所有路徑起始于同一入口狀態(tài),至同一 出口狀態(tài)結(jié)束;以及下列兩個裝置的其中之一平行狀態(tài)提供裝置,在HMM拓樸結(jié)構(gòu)中提供平行狀態(tài),對應(yīng)手寫東 亞字符中既可能是虛筆劃,也可能是實(shí)筆劃的部分;多空間概率分布處理裝置,對HMM拓樸結(jié)構(gòu)應(yīng)用多空間概率分布,對應(yīng)手寫東亞字符中既可能是虛筆劃,也可能是實(shí)筆劃的部分。
26. 如權(quán)利要求25所述的系統(tǒng),其特征在于,HMM拓樸結(jié)構(gòu)構(gòu)建裝置從手寫東亞字符的訓(xùn)練數(shù)據(jù)中自動構(gòu)建多路 徑HMM拓樸結(jié)構(gòu);以及該HMM拓樸結(jié)構(gòu)構(gòu)建裝置根據(jù)手寫東亞字符的筆劃順序或者書寫風(fēng) 格,應(yīng)用 一機(jī)器自學(xué)習(xí)的自動分類方法對所述訓(xùn)練數(shù)據(jù)進(jìn)行分類。
27. 如權(quán)利要求26所述的系統(tǒng),其特征在于,所述訓(xùn)練數(shù)據(jù)包括手寫東亞字符筆跡樣本,所述筆跡樣本包括不同筆 劃順序或者不同手寫風(fēng)格的筆跡樣本;該HMM拓樸結(jié)構(gòu)構(gòu)建裝置包括,筆跡樣本分段裝置,對于每一個筆跡樣本,按弧長將其分成數(shù)個分段, 將每個分段上的特征按順序連接,從而得到該筆跡樣本的一個特征;特征提取裝置,對每一分段分別提取一特征;聚類裝置,對上述分段和特征進(jìn)行聚類,每一個聚類對應(yīng)于一種筆劃 順序或者一種手寫風(fēng)格;HMM拓樸結(jié)構(gòu)構(gòu)建裝置基于每一個聚類的數(shù)據(jù)確定對應(yīng)于每一種筆 劃順序或者每一種手寫風(fēng)格的HMM拓樸結(jié)構(gòu)中的一路徑的拓樸和初始參 數(shù)。
28. 如權(quán)利要求27所述的系統(tǒng),其特征在于,還包括 子序列方向直方圖向量建立裝置,其中,筆跡樣本分段裝置對于每一個筆跡樣本,將實(shí)筆劃和虛筆劃相 連,并將實(shí)筆劃和虛筆劃相連后的弧長分成數(shù)段;每一個子段確定一量化的方向特征,每一個量化的方向特征對應(yīng)一預(yù) 定角度范圍的方向;該子序列方向直方圖向量建立裝置建立每一個分段上的形狀特征為一 子序列方向直方圖,每一個筆跡樣本的特征為一子序列方向直方圖向量。
29. 如權(quán)利要求25所述的系統(tǒng),其特征在于,還包括 路徑合并裝置,對多路徑HMM拓樸結(jié)構(gòu)中的路徑進(jìn)行合并,以控制路徑的數(shù)量。
30. 如權(quán)利要求29所述的系統(tǒng),其特征在于,該路徑合并裝置 判斷路徑所對應(yīng)的訓(xùn)練數(shù)據(jù)的數(shù)據(jù)量,刪除對應(yīng)的數(shù)據(jù)量小于一預(yù)定值的路徑;計(jì)算多路徑HMM拓樸結(jié)構(gòu)中每兩個路徑之間的路徑相似度度量,當(dāng) 路徑相似度度量表示兩個路徑足夠相似時,合并該兩個路徑,其中,當(dāng)兩 個以上路徑的路徑相似度度量表示這些路徑都足夠相似時,合并這些路徑。
31. 如權(quán)利要求30所述的系統(tǒng),其特征在于,該路徑合并裝置路徑 用Kullback-Leibler差值表示相似度度量,當(dāng)Kullback-Leibler差值低于一 預(yù)定值時,表示所述路徑足夠相似。
32. 如權(quán)利要求29所述的系統(tǒng),其特征在于,還包括 狀態(tài)聚類裝置,對HMM拓樸結(jié)構(gòu)中狀態(tài)進(jìn)行聚類,使所述HMM拓樸結(jié)構(gòu)中的至少一組狀態(tài)共用參數(shù),且對于所述一組共用參數(shù)的狀態(tài),在 HMM拓樸結(jié)構(gòu)中只保存一套參數(shù)。
33. 如權(quán)利要求32所述的系統(tǒng),其特征在于,狀態(tài)聚類裝置計(jì)算該HMM拓樸結(jié)構(gòu)中每兩個狀態(tài)之間的狀態(tài)相似度 度量,當(dāng)狀態(tài)相似度度量表示兩個狀態(tài)足夠相似時,使該兩個狀態(tài)共用參 數(shù);其中,當(dāng)兩個以上的狀態(tài)相互之間的狀態(tài)相似度度量都足夠相似時, 使該這些狀態(tài)都共用參數(shù)。
34. 如權(quán)利要求33所述的系統(tǒng),其特征在于, 狀態(tài)聚類裝置通過Kullback-Leibler差值表示狀態(tài)相似度度量,當(dāng)Kullback-Leibler差值低于一預(yù)定值時,表示所述狀態(tài)足夠相似。
全文摘要
本發(fā)明針對手寫東亞字符的特點(diǎn)提供了一種適用于對手寫東亞字符進(jìn)行識別的HMM模型的拓?fù)浣Y(jié)構(gòu)的設(shè)計(jì)方案,以及建立此拓?fù)浣Y(jié)構(gòu)的HMM模型的方法,充分考慮了手寫東亞字符筆劃多、筆劃順序多樣、結(jié)構(gòu)復(fù)雜、書寫風(fēng)格多樣、筆劃間連接不確定的特點(diǎn),通過在HMM拓?fù)浣Y(jié)構(gòu)中引入轉(zhuǎn)角狀態(tài)、提供多路徑、提供平行狀態(tài)的手段來解決上述的問題,并且,通過聚類和合并的操作來減小數(shù)據(jù)量,降低運(yùn)算的復(fù)雜程度。
文檔編號G06K9/00GK101256624SQ20071008528
公開日2008年9月3日 申請日期2007年2月28日 優(yōu)先權(quán)日2007年2月28日
發(fā)明者鵬 劉, 吳義堅(jiān), 宋謌評, 明 常, 張冬梅, 堅(jiān) 王, 宇 鄒, 石 韓, 磊 馬 申請人:微軟公司