專利名稱:一種字符書寫規(guī)范度評(píng)測(cè)的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及模式識(shí)別領(lǐng)域,特別是涉及ー種字符書寫規(guī)范度評(píng)測(cè)的方法和裝置。
背景技術(shù):
隨著信息交互的發(fā)展,計(jì)算機(jī)輔助教學(xué)得到了廣泛的應(yīng)用。例如,在漢語教學(xué)方面,計(jì)算機(jī)輔助教學(xué)提供了漢字演化、拼音示范、漢字書寫動(dòng)態(tài)演示等應(yīng)用,然而,在對(duì)用戶漢字書寫規(guī)范度評(píng)估方面卻較少涉及。ー個(gè)書寫規(guī)范的漢字通常要求筆畫標(biāo)準(zhǔn)、筆順符合規(guī)范,同時(shí)字符整體結(jié)構(gòu)緊湊符合美觀的要求。由于漢字?jǐn)?shù)量較大,對(duì)漢字的規(guī)范性評(píng)估實(shí)現(xiàn)較為復(fù)雜,涉及圖像處理、模式識(shí)別等技術(shù),因此如何 有效地針對(duì)用戶書寫的字符進(jìn)行規(guī)范度評(píng)估成為ー個(gè)具有挑戰(zhàn)性的課題?,F(xiàn)有技術(shù)中,在對(duì)書寫字符進(jìn)行規(guī)范度評(píng)價(jià)時(shí),往往采用書寫字符與單個(gè)標(biāo)準(zhǔn)字符比較計(jì)算相似度進(jìn)行評(píng)判的方法,由此獲取的評(píng)價(jià)結(jié)果往往不夠可靠。這時(shí),出現(xiàn)了ー種基于置信度的漢字書寫質(zhì)量評(píng)價(jià)方法。在這種方法中,通過計(jì)算字符匹配的置信度,獲知當(dāng)前書寫字符和標(biāo)準(zhǔn)模板相似的可靠程度,進(jìn)而對(duì)漢字書寫質(zhì)量進(jìn)行評(píng)價(jià)。在這一方法中,首先利用修正二次判決函數(shù)分類器對(duì)手寫漢字進(jìn)行識(shí)別,得到K個(gè)候選字,并計(jì)算每個(gè)候選字與手寫樣本的距離;隨后利用候選字距離計(jì)算置信度,再利用置信度進(jìn)行漢字書寫質(zhì)量評(píng)價(jià)。這里,采用基于手寫漢字字符模板和候選字符集模板得分比值的方法來計(jì)算置信度。一般來說,置信度越高,說明書寫字符與其他候選字符的區(qū)分性越大,字符書寫越規(guī)范。這種方法與傳統(tǒng)的漢字書寫質(zhì)量評(píng)價(jià)方法相比,評(píng)價(jià)的標(biāo)準(zhǔn)主要基于訓(xùn)練樣本的選取,在訓(xùn)練樣本書寫エ整的條件下,該評(píng)價(jià)系統(tǒng)對(duì)樣本書寫エ整性有較好的評(píng)價(jià)能力。在實(shí)現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題現(xiàn)有技術(shù)提供的方法中,采用的基于應(yīng)用字符模板和候選字符集模板得分比值的置信度計(jì)算來評(píng)估書寫字符的規(guī)范度,雖然能較好的區(qū)分大部分字符的書寫規(guī)范度,然而對(duì)諸如“天,夫”,“人,入”,“日,曰” “己、已、巳”等僅在局部有細(xì)微差異的字符對(duì)卻存在低估其書寫規(guī)范度的問題。一般來說,混淆字符的參考模板較為相似,相應(yīng)的其和輸入字符的特征向量的相似度也較為接近,在基于比值的置信度計(jì)算設(shè)定下,計(jì)算出的置信度得分往往偏低,即使用戶正確規(guī)范地輸入了該字符,系統(tǒng)也容易給出字符書寫不夠規(guī)范的結(jié)論。例如,對(duì)于用戶輸入漢字字符“己”,通過識(shí)別得出候選字符分別是“己”、“已”、“巳”,假設(shè)分別與候選字符計(jì)算得出的距離(或相似度)是O. 9、0.8、0. 7,在基于比值的置信度計(jì)算設(shè)定下,得出的置信度是O. 375。盡管用戶輸入的字符與標(biāo)準(zhǔn)模板的相似度很高,由于得出的置信度得分偏低,系統(tǒng)會(huì)得出書寫不規(guī)范的結(jié)論。因此,現(xiàn)有技術(shù)提供的方法對(duì)于易混淆字符的評(píng)價(jià)往往不夠準(zhǔn)確。
發(fā)明內(nèi)容
為解決上述技術(shù)問題,本發(fā)明實(shí)施例提供了字符書寫規(guī)范度評(píng)測(cè)的方法和裝置,可以有效解決現(xiàn)有技術(shù)中對(duì)混淆字符評(píng)價(jià)不準(zhǔn)確的問題,提高了書寫規(guī)范度評(píng)估的合理性、準(zhǔn)確性。一方面,本發(fā)明實(shí)施例提 供了ー種字符書寫規(guī)范度評(píng)測(cè)的方法,所述方法包括提取書寫字符的筆畫軌跡的原始特征矢量;將提取的所述原始特征矢量與第一字符集中的字符模板進(jìn)行匹配,獲取第一置信度;當(dāng)判斷所述第一置信度不滿足預(yù)設(shè)的評(píng)測(cè)條件吋,執(zhí)行二次匹配處理,獲取第二特征矢量,將所述第二特征矢量與第二字符集中的字符模板進(jìn)行匹配,獲取第二置信度;根據(jù)所述第二置信度對(duì)所述書寫字符進(jìn)行評(píng)價(jià)。優(yōu)選的,所述提取書寫字符的筆畫軌跡的原始特征矢量包括采集并記錄書寫字符的筆畫軌跡;對(duì)所述書寫字符的筆畫軌跡進(jìn)行預(yù)處理;提取預(yù)處理后的書寫字符的筆畫軌跡的原始特征矢量。優(yōu)選的,所述將提取的所述原始特征矢量與第一字符集中的字符模板進(jìn)行匹配,獲取第一置信度包括獲取與書寫字符對(duì)應(yīng)的標(biāo)準(zhǔn)字符模板;獲取第一字符集;分別將提取的所述原始特征矢量與所述標(biāo)準(zhǔn)字符模板、第一字符集中的字符模板進(jìn)行匹配,獲取多個(gè)相似度值;根據(jù)所述多個(gè)相似度值獲取第一置信度。優(yōu)選的,在分別將提取的所述原始特征矢量與所述標(biāo)準(zhǔn)字符模板、第一字符集中的字符模板進(jìn)行匹配之前,所述方法還包括對(duì)所述原始特征矢量進(jìn)行特征轉(zhuǎn)換,獲取第一特征矢量;所述分別將提取的所述原始特征矢量與所述標(biāo)準(zhǔn)字符模板、第一字符集中的字符模板進(jìn)行匹配為將獲取的第一特征矢量與所述標(biāo)準(zhǔn)字符模板、第一字符集中的字符模板進(jìn)行匹配。優(yōu)選的,所述執(zhí)行二次匹配處理,獲取第二特征矢量,將所述第二特征矢量與第二字符集中的字符模板進(jìn)行匹配,獲取第二置信度包括獲取第二字符集;根據(jù)所述第二字符集獲取第二特征轉(zhuǎn)換矩陣,根據(jù)所述第二特征變換矩陣對(duì)所述原始特征矢量進(jìn)行特征變換以獲取第二特征矢量;將所述第二特征矢量與第二字符集中的字符模板進(jìn)行匹配,獲取第二置信度。優(yōu)選的,所述根據(jù)第二字符集獲取第二特征轉(zhuǎn)換矩陣包括根據(jù)與所述書寫字符對(duì)應(yīng)的標(biāo)準(zhǔn)字符模板以及與所述書寫字符對(duì)應(yīng)的混淆字符模板確定所述標(biāo)準(zhǔn)字符模板與所述混淆字符模板共屬的子集;判斷所述子集是否為決策樹的根節(jié)點(diǎn),如果不是,獲取所述子集對(duì)應(yīng)的特征轉(zhuǎn)換矩陣作為第二特征變換矩陣。優(yōu)選的,所述根據(jù)與所述書寫字符對(duì)應(yīng)的標(biāo)準(zhǔn)字符模板以及與所述書寫字符對(duì)應(yīng)的混淆字符模板確定所述標(biāo)準(zhǔn)字符模板與所述混淆字符模板共屬的子集包括
判斷書寫字符對(duì)應(yīng)的標(biāo)準(zhǔn)字符以及與所述書寫字符對(duì)應(yīng)的混淆字符是否屬于同
一子集;如果不是,獲取所述標(biāo)準(zhǔn)字符以及所述混淆字符的上ー級(jí)子集,重復(fù)上ー判斷步驟;如果是,將所述子集作為所述標(biāo)準(zhǔn)字符模板與所述混淆字符模板共屬的子集。優(yōu)選的,所述方法進(jìn)ー步包括 當(dāng)判斷所述第二置信度不滿足預(yù)設(shè)條件時(shí),執(zhí)行再次二次匹配處理。另ー方面,本發(fā)明實(shí)施例還公開了ー種字符書寫規(guī)范度評(píng)測(cè)裝置,所述裝置包括特征提取単元,用于提取書寫字符的筆畫軌跡的原始特征矢量;第一匹配単元,用于將提取的所述原始特征矢量與第一字符集中的字符模板進(jìn)行匹配,獲取第一置信度;第一判斷単元,用于判斷所述第一置信度是否滿足預(yù)設(shè)條件;第二匹配単元,用于接收第一判斷単元的判斷結(jié)果,當(dāng)判斷結(jié)果表明所述第一置信度不滿足預(yù)設(shè)的評(píng)測(cè)條件時(shí),執(zhí)行二次匹配處理,獲取第二特征矢量,將所述第二特征矢量與第二字符集中的字符模板進(jìn)行匹配,獲取第二置信度;第二評(píng)價(jià)單元,用于根據(jù)所述第二置信度對(duì)所述書寫字符進(jìn)行評(píng)價(jià)。優(yōu)選的,所述特征提取單元包括采集單元,用于采集并記錄書寫字符的筆畫軌跡;預(yù)處理単元,用于對(duì)所述書寫字符的筆畫軌跡進(jìn)行預(yù)處理;提取單元,用于提取預(yù)處理后的書寫字符的筆畫軌跡的原始特征矢量。優(yōu)選的,所述第二匹配単元包括第一獲取單元、第二獲取單元、特征轉(zhuǎn)換單元、第三獲取單元,其中所述第一獲取單元用于獲取第二字符集;所述第二獲取單元用于根據(jù)所述第二字符集獲取第二特征轉(zhuǎn)換矩陣;所述特征轉(zhuǎn)換單元,用于根據(jù)所述第二特征變換矩陣對(duì)所述原始特征矢量進(jìn)行特征變換以獲取第二特征矢量;所述第三獲取單元,用于將所述第二特征矢量與第二字符集中的字符模板進(jìn)行匹配,獲取第二置信度。優(yōu)選的,所述第二獲取單元包括確定單元,用于根據(jù)與所述書寫字符對(duì)應(yīng)的標(biāo)準(zhǔn)字符模板以及與所述書寫字符對(duì)應(yīng)的混淆字符模板確定所述標(biāo)準(zhǔn)字符模板與所述混淆字符模板共屬的子集;第二判斷単元,用于判斷所述子集是否為決策樹的根節(jié)點(diǎn),如果不是,獲取所述子集對(duì)應(yīng)的特征轉(zhuǎn)換矩陣作為第二特征變換矩陣。本發(fā)明實(shí)施例能夠達(dá)到的有益效果為本發(fā)明實(shí)施例提供的方法提取書寫字符的筆畫軌跡的原始特征矢量,將提取的所述原始特征矢量與第一字符集中的字符模板進(jìn)行ー次匹配,獲取第一置信度;當(dāng)判斷根據(jù)所述第一置信度不滿足預(yù)設(shè)條件時(shí),執(zhí)行二次匹配處理,獲取第二特征矢量,將所述第二特征矢量與第二字符集中的字符模板進(jìn)行匹配,獲取第ニ置信度;根據(jù)所述第二置信度對(duì)所述書寫字符進(jìn)行評(píng)價(jià)。在本發(fā)明實(shí)施例提供的方法中,當(dāng)根據(jù)一次匹配獲取的置信度無法對(duì)書寫字符做出正確的評(píng)價(jià)時(shí),則對(duì)書寫字符進(jìn)行二次匹配,在二次匹配中由于采用了高區(qū)分性的第二特征矢量,井根據(jù)所述第二特征矢量與第二字符集即混淆字符集進(jìn)行匹配,提高了模型匹配的區(qū)分性,由此獲取的置信度評(píng)估結(jié)果往往比較可靠,提高了書寫規(guī)范度評(píng)價(jià)的準(zhǔn)確性和合理性。
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明中記載的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖I為本發(fā)明實(shí)施例提供的字符書寫規(guī)范度評(píng)測(cè)方法第一實(shí)施例流程圖;圖2為本發(fā)明實(shí)施例提供的字符書寫規(guī)范度評(píng)測(cè)方法第二實(shí)施例流程圖;圖3為本發(fā)明實(shí)施例提供的基于決策樹的聚類算法示意圖;圖4為本發(fā)明實(shí)施例提供的字符子集的樹結(jié)構(gòu)示意圖;圖5本發(fā)明實(shí)施例提供的字符書寫規(guī)范度評(píng)測(cè)裝置示意圖。
具體實(shí)施例方式本發(fā)明實(shí)施例提供了字符書寫規(guī)范度評(píng)測(cè)的方法和裝置,可以有效解決現(xiàn)有技術(shù)中對(duì)混淆字符評(píng)價(jià)不準(zhǔn)確的問題,提高了書寫規(guī)范度評(píng)估的合理性、準(zhǔn)確性。為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明中的技術(shù)方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。參見圖1,為本發(fā)明提供的字符書寫規(guī)范度評(píng)測(cè)的方法第一實(shí)施例流程圖,所述方法包括SlOl,提取書寫字符的筆畫軌跡的原始特征矢量。在本發(fā)明實(shí)施例提供的方法中,用戶可以預(yù)先選定當(dāng)前想要練習(xí)的漢字,并在預(yù)設(shè)的書寫區(qū)域內(nèi)書寫對(duì)應(yīng)的字符,以建立用戶書寫的待評(píng)估的字符與標(biāo)準(zhǔn)字符的對(duì)應(yīng)關(guān)系。當(dāng)然,也可以不包括選擇的步驟,直接提供書寫區(qū)域,采集用戶書寫的字符的筆畫軌跡。系統(tǒng)將采集得到的字符的筆畫軌跡記錄為一系列ニ維坐標(biāo)點(diǎn)列PiOci, Yi)。原始筆跡的ニ維坐標(biāo)點(diǎn)列信號(hào)容易受到各種噪音的干擾,且存在大量冗余信息,直接據(jù)其進(jìn)行書寫規(guī)范度評(píng)估將導(dǎo)致運(yùn)算量和評(píng)估準(zhǔn)確度的下降。因此,本發(fā)明實(shí)施例提供的方法首先從原始筆畫軌跡中提取具有高表征カ的特征向量,例如八方向特征或DEF特征(Directional Element Feature,方向單元特征)等。通過原始特征矢量的提取,將用戶輸入的書寫字符的原始T個(gè)采樣點(diǎn)序列的筆跡表征為ー個(gè)D維特征矢量。具體實(shí)現(xiàn)時(shí),系統(tǒng)首先將字符筆跡調(diào)整到預(yù)先設(shè)定的尺寸大小,進(jìn)行大小歸ー化處理。優(yōu)選的,還可以對(duì)調(diào)整后的字符筆跡進(jìn)行預(yù)處理,例如通過非線性規(guī)整、平滑、重采樣等預(yù)處理技術(shù)獲得干凈的字符軌跡。隨后系統(tǒng)從原有時(shí)域的字符軌跡坐標(biāo)構(gòu)成的ニ維空間上考慮筆跡的各采樣點(diǎn)位置,形成描述字符像素點(diǎn)分布ニ維圖像。最后在該ニ維圖像上,對(duì)其進(jìn)行分區(qū),在每個(gè)單獨(dú)區(qū)域提取描述該區(qū)域像素分布規(guī)律的特征,并據(jù)此形成描述整個(gè)ニ維圖像的像素分布規(guī)律特征矢量。具體的,提取的特征矢量可以是八方向特征或DEF特征等,本發(fā)明對(duì)此不進(jìn)行限定。下面以提取八方向特征為例進(jìn)行說明。其中,八方向特征用于衡量字符圖像中在系統(tǒng)預(yù)設(shè)八個(gè)方向上的投影分量的分布規(guī)律。具體的,前面提到,系統(tǒng)將原有時(shí)域的字符軌跡坐標(biāo)變換成ニ維圖像,然后對(duì)ニ維圖像進(jìn)行分區(qū),這時(shí),對(duì)于獲取的每個(gè)單獨(dú)分區(qū)內(nèi)的每個(gè)字符采樣點(diǎn),分別計(jì)算其和前一或后一采樣點(diǎn)形成的筆段在8個(gè)方向上的投影大小,隨后將該分區(qū)內(nèi)八個(gè)方向上的分量通過累計(jì)等方法形成一個(gè)新的八維特征。最后將每個(gè)分區(qū)的八維特征拼接,或通過高斯擬和等統(tǒng)計(jì)方法構(gòu)成新的特征矢量。在本發(fā)明實(shí)施例中,是將字符筆跡當(dāng)作一個(gè)ニ維圖像來提取特征矢量的,著重考慮其空間分布特點(diǎn)。舉例進(jìn)行說明,系統(tǒng)將時(shí)間順序的筆跡按照筆跡采樣點(diǎn)的位置分布規(guī)整到ー個(gè)N*N大小空間的圖像,隨后將該N*N的圖像劃分成8*8個(gè)小分區(qū),分別考慮每個(gè)分區(qū)的所有采樣點(diǎn)在八個(gè)不同方向上的投影,并累計(jì)得到ー個(gè)8維的特征矢量。最后每個(gè)分區(qū)提供ー個(gè)8維特征,8*8個(gè)分區(qū)將提供8*8*8維的特征??蛇x的,系統(tǒng)還可繼續(xù)將對(duì)8*8*8的特征進(jìn)行后處理,或者通過高斯擬和方法以突出字符之間的區(qū)分性。S102,將提取的所述原始特征矢量與第一字符集中的字符模板進(jìn)行匹配,獲取第
一置信度。S102A,獲取第一字符集。在本發(fā)明第一實(shí)施例中,第一字符集是系統(tǒng)預(yù)置的字符模型集,存儲(chǔ)有系統(tǒng)支持的所有字符參考模板。具體的,所述字符模型集是系統(tǒng)通過在采集的海量訓(xùn)練樣本上訓(xùn)練得到的,用于模擬字符的筆畫、筆順及字體結(jié)構(gòu)等特征。具體的,為了提高系統(tǒng)運(yùn)行效率,在本發(fā)明實(shí)施例中,每個(gè)字符采用單模板的模型結(jié)構(gòu),并利用其對(duì)應(yīng)訓(xùn)練樣本訓(xùn)練其模型參數(shù)。其中第i個(gè)字符的單模板模型參量記為
權(quán)利要求
1.一種字符書寫規(guī)范度評(píng)測(cè)的方法,其特征在于,所述方法包括 提取書寫字符的筆畫軌跡的原始特征矢量; 將提取的所述原始特征矢量與第一字符集中的字符模板進(jìn)行匹配,獲取第一置信度;當(dāng)判斷所述第一置信度不滿足預(yù)設(shè)的評(píng)測(cè)條件時(shí),執(zhí)行二次匹配處理,獲取第二特征矢量,將所述第二特征矢量與第二字符集中的字符模板進(jìn)行匹配,獲取第二置信度; 根據(jù)所述第二置信度對(duì)所述書寫字符進(jìn)行評(píng)價(jià)。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述提取書寫字符的筆畫軌跡的原始特征矢量包括 采集并記錄書寫字符的筆畫軌跡; 對(duì)所述書寫字符的筆畫軌跡進(jìn)行預(yù)處理; 提取預(yù)處理后的書寫字符的筆畫軌跡的原始特征矢量。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述將提取的所述原始特征矢量與第一字符集中的字符模板進(jìn)行匹配,獲取第一置信度包括 獲取與書寫字符對(duì)應(yīng)的標(biāo)準(zhǔn)字符模板; 獲取第一字符集; 分別將提取的所述原始特征矢量與所述標(biāo)準(zhǔn)字符模板、第一字符集中的字符模板進(jìn)行匹配,獲取多個(gè)相似度值; 根據(jù)所述多個(gè)相似度值獲取第一置信度。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,在分別將提取的所述原始特征矢量與所述標(biāo)準(zhǔn)字符模板、第一字符集中的字符模板進(jìn)行匹配之前,所述方法還包括 對(duì)所述原始特征矢量進(jìn)行特征轉(zhuǎn)換,獲取第一特征矢量; 所述分別將提取的所述原始特征矢量與所述標(biāo)準(zhǔn)字符模板、第一字符集中的字符模板進(jìn)行匹配為 將獲取的第一特征矢量與所述標(biāo)準(zhǔn)字符模板、第一字符集中的字符模板進(jìn)行匹配。
5.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述執(zhí)行二次匹配處理,獲取第二特征矢量,將所述第二特征矢量與第二字符集中的字符模板進(jìn)行匹配,獲取第二置信度包括 獲取第二字符集; 根據(jù)所述第二字符集獲取第二特征轉(zhuǎn)換矩陣,根據(jù)所述第二特征變換矩陣對(duì)所述原始特征矢量進(jìn)行特征變換以獲取第二特征矢量; 將所述第二特征矢量與第二字符集中的字符模板進(jìn)行匹配,獲取第二置信度。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)第二字符集獲取第二特征轉(zhuǎn)換矩陣包括 根據(jù)與所述書寫字符對(duì)應(yīng)的標(biāo)準(zhǔn)字符模板以及與所述書寫字符對(duì)應(yīng)的混淆字符模板確定所述標(biāo)準(zhǔn)字符模板與所述混淆字符模板共屬的子集; 判斷所述子集是否為決策樹的根節(jié)點(diǎn),如果不是,獲取所述子集對(duì)應(yīng)的特征轉(zhuǎn)換矩陣作為第二特征變換矩陣。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)與所述書寫字符對(duì)應(yīng)的標(biāo)準(zhǔn)字符模板以及與所述書寫字符對(duì)應(yīng)的混淆字符模板確定所述標(biāo)準(zhǔn)字符模板與所述混淆字符模板共屬的子集包括判斷書寫字符對(duì)應(yīng)的標(biāo)準(zhǔn)字符以及與所述書寫字符對(duì)應(yīng)的混淆字符是否屬于同一子集; 如果不是,獲取所述標(biāo)準(zhǔn)字符以及所述混淆字符的上一級(jí)子集,重復(fù)上一判斷步驟; 如果是,將所述子集作為所述標(biāo)準(zhǔn)字符模板與所述混淆字符模板共屬的子集。
8.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述方法進(jìn)一步包括 當(dāng)判斷所述第二置信度不滿足預(yù)設(shè)條件時(shí),執(zhí)行再次二次匹配處理。
9.一種字符書寫規(guī)范度評(píng)測(cè)裝置,其特征在于,所述裝置包括 特征提取單元,用于提取書寫字符的筆畫軌跡的原始特征矢量; 第一匹配單元,用于將提取的所述原始特征矢量與第一字符集中的字符模板進(jìn)行匹配,獲取第一置信度; 第一判斷單元,用于判斷所述第一置信度是否滿足預(yù)設(shè)的評(píng)測(cè)條件; 第二匹配單元,用于接收第一判斷單元的判斷結(jié)果,當(dāng)判斷結(jié)果表明所述第一置信度不滿足預(yù)設(shè)的評(píng)測(cè)條件時(shí),執(zhí)行二次匹配處理,獲取第二特征矢量,將所述第二特征矢量與第二字符集中的字符模板進(jìn)行匹配,獲取第二置信度; 第二評(píng)價(jià)單元,用于根據(jù)所述第二置信度對(duì)所述書寫字符進(jìn)行評(píng)價(jià)。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述特征提取單元包括 采集單元,用于采集并記錄書寫字符的筆畫軌跡; 預(yù)處理單元,用于對(duì)所述書寫字符的筆畫軌跡進(jìn)行預(yù)處理; 提取單元,用于提取預(yù)處理后的書寫字符的筆畫軌跡的原始特征矢量。
11.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述第二匹配單元包括第一獲取單元、第二獲取單元、特征轉(zhuǎn)換單元、第三獲取單元,其中 所述第一獲取單元用于獲取第二字符集; 所述第二獲取單元用于根據(jù)所述第二字符集獲取第二特征轉(zhuǎn)換矩陣; 所述特征轉(zhuǎn)換單元,用于根據(jù)所述第二特征變換矩陣對(duì)所述原始特征矢量進(jìn)行特征變換以獲取第二特征矢量; 所述第三獲取單元,用于將所述第二特征矢量與第二字符集中的字符模板進(jìn)行匹配,獲取第二置信度。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述第二獲取單元包括 確定單元,用于根據(jù)與所述書寫字符對(duì)應(yīng)的標(biāo)準(zhǔn)字符模板以及與所述書寫字符對(duì)應(yīng)的混淆字符模板確定所述標(biāo)準(zhǔn)字符模板與所述混淆字符模板共屬的子集; 第二判斷單元,用于判斷所述子集是否為決策樹的根節(jié)點(diǎn),如果不是,獲取所述子集對(duì)應(yīng)的特征轉(zhuǎn)換矩陣作為第二特征變換矩陣。
全文摘要
本發(fā)明涉及模式識(shí)別領(lǐng)域,特別是一種字符書寫規(guī)范度評(píng)測(cè)的方法和裝置,所述方法包括提取書寫字符的筆畫軌跡的原始特征矢量;將提取的所述原始特征矢量與第一字符集中的字符模板進(jìn)行匹配,獲取第一置信度;當(dāng)判斷所述第一置信度不滿足預(yù)設(shè)評(píng)測(cè)條件時(shí),執(zhí)行二次匹配處理,獲取第二特征矢量,將所述第二特征矢量與第二字符集中的字符模板進(jìn)行匹配,獲取第二置信度;根據(jù)所述第二置信度對(duì)所述書寫字符進(jìn)行評(píng)價(jià)。本發(fā)明實(shí)施例提供的方法有效解決了現(xiàn)有技術(shù)對(duì)混淆字符評(píng)價(jià)不準(zhǔn)確的問題,提高了書寫規(guī)范度評(píng)估的合理性、準(zhǔn)確性。
文檔編號(hào)G06K9/68GK102663454SQ201210115469
公開日2012年9月12日 申請(qǐng)日期2012年4月18日 優(yōu)先權(quán)日2012年4月18日
發(fā)明者何婷婷, 劉慶峰, 胡國(guó)平, 胡郁 申請(qǐng)人:安徽科大訊飛信息科技股份有限公司