本發(fā)明涉及藏文字處理技術(shù)領(lǐng)域,具體涉及一種藏文字檢錯(cuò)方法及系統(tǒng),以及一種藏文字串檢錯(cuò)方法及系統(tǒng)。
背景技術(shù):
伴隨著信息社會(huì)的發(fā)展,藏文電子文檔、報(bào)刊、新聞及網(wǎng)頁(yè)等種類繁多的藏文信息日益增多,供人們閱讀、學(xué)習(xí)和使用。這些藏文信息主要是通過鍵盤人工錄入到計(jì)算機(jī)中的,但是,人工輸入和校對(duì)時(shí)無法保證存入和修改的信息準(zhǔn)確無誤。
目前,現(xiàn)代藏文字校對(duì)的方法主要是采用字典匹配的方法:將藏文字與字庫(kù)中的標(biāo)準(zhǔn)藏文字進(jìn)行匹配,若匹配成功,則認(rèn)為正確,否則認(rèn)為錯(cuò)誤。這種方法在運(yùn)行時(shí)需要占用大量的處理器資源和內(nèi)存空間,計(jì)算機(jī)運(yùn)行負(fù)荷高且運(yùn)算效率低下。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供一種藏文字檢錯(cuò)方法和系統(tǒng),以及一種藏文字串檢錯(cuò)方法和系統(tǒng),以解決目前字典匹配的方法占用處理器資源和內(nèi)存空間大,計(jì)算機(jī)運(yùn)行負(fù)荷高且運(yùn)算效率低下的問題。
第一方面,本發(fā)明提供的一種藏文字檢錯(cuò)方法,包括:
獲取待檢錯(cuò)的藏文字;
將所述待檢錯(cuò)藏文字與預(yù)設(shè)的藏文字檢錯(cuò)正則表達(dá)式進(jìn)行匹配;
根據(jù)匹配是否成功判斷所述待檢錯(cuò)的藏文字是否有錯(cuò)誤。
可選的,所述根據(jù)匹配結(jié)果判斷所述待檢錯(cuò)的藏文字是否有錯(cuò),包括:
在匹配成功時(shí),判斷所述待檢錯(cuò)的藏文字沒有錯(cuò)誤;
在匹配不成功時(shí),判斷所述待檢錯(cuò)的藏文字有錯(cuò)誤。
可選的,所述在匹配不成功時(shí),判斷所述待檢錯(cuò)的藏文字有錯(cuò)誤,包括:
在匹配不成功時(shí),將所述待檢錯(cuò)藏文字與預(yù)設(shè)的梵文檢錯(cuò)正則表達(dá)式進(jìn)行匹配;
在與預(yù)設(shè)的梵文檢錯(cuò)正則表達(dá)式匹配成功時(shí),判斷所述待檢錯(cuò)的藏文字沒有錯(cuò)誤;
在與預(yù)設(shè)的梵文檢錯(cuò)正則表達(dá)式匹配不成功時(shí),判斷所述待檢錯(cuò)的藏文字有錯(cuò)誤。
可選的,所述預(yù)設(shè)的梵文檢錯(cuò)正則表達(dá)式具體為:
可選的,所述預(yù)設(shè)的藏文字檢錯(cuò)正則表達(dá)式包括不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式,單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式,藏文字元音的檢錯(cuò)正則表達(dá)式,藏文字后加字及又后加字組合的檢錯(cuò)正則表達(dá)式,藏文字后加字及緊縮字的檢錯(cuò)正則表達(dá)式中的任意一種正則表達(dá)式或任意多種正則表達(dá)式的組合;
其中,所述不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式具體為:
所述單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式具體為:
所述藏文字元音的檢錯(cuò)正則表達(dá)式具體為:
所述藏文字后加字及又后加字組合的檢錯(cuò)正則表達(dá)式具體為:
所述藏文字后加字及緊縮字的檢錯(cuò)正則表達(dá)式具體為:
可選的,所述預(yù)設(shè)的藏文字檢錯(cuò)正則表達(dá)式包括不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式,單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式,藏文字元音的檢錯(cuò)正則表達(dá)式,藏文字后加字及又后加字組合的檢錯(cuò)正則表達(dá)式,藏文字后加字及緊縮字的檢錯(cuò)正則表達(dá)式的組合,其組合形式如下:
其中,rp表示藏文字檢錯(cuò)正則表達(dá)式,p表示不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式,q表示單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式,v表示藏文字元音的檢錯(cuò)正則表達(dá)式,b表示藏文字后加字及又后加字組合的檢錯(cuò)正則表達(dá)式,a表示藏文字后加字及緊縮字的檢錯(cuò)正則表達(dá)式。
可選的,在根據(jù)匹配是否成功判斷所述待檢錯(cuò)的藏文字是否有錯(cuò)誤的步驟后,還包括:
在所述待檢錯(cuò)的藏文字有錯(cuò)誤時(shí),對(duì)所述藏文字做與檢錯(cuò)前進(jìn)行區(qū)分的標(biāo)記。
第二方面,本發(fā)明提供的一種藏文字檢錯(cuò)系統(tǒng),包括:
藏文字獲取模塊,用于獲取待檢錯(cuò)的藏文字;
藏文字匹配模塊,用于將所述待檢錯(cuò)藏文字與預(yù)設(shè)的藏文字檢錯(cuò)正則表達(dá)式進(jìn)行匹配;
藏文字判斷模塊,用于根據(jù)匹配是否成功判斷所述待檢錯(cuò)的藏文字是否有錯(cuò)誤。
可選的,所述藏文字判斷模塊,包括:
匹配成功單元,用于在匹配成功時(shí),判斷所述待檢錯(cuò)的藏文字沒有錯(cuò)誤;
匹配不成功單元,用于在匹配不成功時(shí),判斷所述待檢錯(cuò)的藏文字有錯(cuò)誤。
可選的,所述匹配不成功單元,包括:
梵文匹配子單元,用于在匹配不成功時(shí),將所述待檢錯(cuò)藏文字與預(yù)設(shè)的梵文檢錯(cuò)正則表達(dá)式進(jìn)行匹配;
梵文匹配成功子單元,用于在與預(yù)設(shè)的梵文檢錯(cuò)正則表達(dá)式匹配成功時(shí),判斷所述待檢錯(cuò)的藏文字沒有錯(cuò)誤;
梵文匹配不成功子單元,用于在與預(yù)設(shè)的梵文檢錯(cuò)正則表達(dá)式匹配不成功時(shí),判斷所述待檢錯(cuò)的藏文字有錯(cuò)誤。
可選的,所述預(yù)設(shè)的梵文檢錯(cuò)正則表達(dá)式具體為:
可選的,所述預(yù)設(shè)的藏文字檢錯(cuò)正則表達(dá)式包括不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式,單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式,藏文字元音的檢錯(cuò)正則表達(dá)式,藏文字后加字及又后加字組合的檢錯(cuò)正則表達(dá)式,藏文字后加字及緊縮字的檢錯(cuò)正則表達(dá)式中的任意一種正則表達(dá)式或任意多種正則表達(dá)式的組合;
其中,所述不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式具體為:
所述單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式具體為:
所述藏文字元音的檢錯(cuò)正則表達(dá)式具體為:
所述藏文字后加字及又后加字組合的檢錯(cuò)正則表達(dá)式具體為:
所述藏文字后加字及緊縮字的檢錯(cuò)正則表達(dá)式具體為:
可選的,所述預(yù)設(shè)的藏文字檢錯(cuò)正則表達(dá)式包括不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式,單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式,藏文字元音的檢錯(cuò)正則表達(dá)式,藏文字后加字及又后加字組合的檢錯(cuò)正則表達(dá)式,藏文字后加字及緊縮字的檢錯(cuò)正則表達(dá)式的組合,其組合形式如下:
其中,rp表示藏文字檢錯(cuò)正則表達(dá)式,p表示不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式,q表示單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式,v表示藏文字元音的檢錯(cuò)正則表達(dá)式,b表示藏文字后加字及又后加字組合的檢錯(cuò)正則表達(dá)式,a表示藏文字后加字及緊縮字的檢錯(cuò)正則表達(dá)式。
可選的,所述藏文字檢錯(cuò)系統(tǒng),還包括:
錯(cuò)誤標(biāo)記模塊,用于在所述待檢錯(cuò)的藏文字有錯(cuò)誤時(shí),對(duì)所述藏文字做與檢錯(cuò)前進(jìn)行區(qū)分的標(biāo)記。
第三方面,本發(fā)明提供的一種藏文字串檢錯(cuò)方法,包括:
獲取待檢錯(cuò)的藏文字串;
按照所述藏文字串的順序,將所述藏文字串中的每個(gè)藏文字依次按照本發(fā)明提供的任一項(xiàng)所述藏文字檢錯(cuò)方法進(jìn)行檢錯(cuò),獲得每個(gè)所述藏文字各自的檢錯(cuò)結(jié)果;
對(duì)所述藏文字串中檢錯(cuò)結(jié)果為有錯(cuò)誤的藏文字,做與沒有錯(cuò)誤的藏文字進(jìn)行區(qū)分的標(biāo)記。
第四方面,本發(fā)明提供的一種藏文字串檢錯(cuò)系統(tǒng),包括:
藏文字串獲取模塊,用于獲取待檢錯(cuò)的藏文字串;
藏文字檢錯(cuò)模塊,用于按照所述藏文字串的順序,將所述藏文字串中的每個(gè)藏文字依次按照本發(fā)明提供的任一項(xiàng)所述藏文字檢錯(cuò)方法進(jìn)行檢錯(cuò),獲得每個(gè)所述藏文字各自的檢錯(cuò)結(jié)果;
錯(cuò)誤文字標(biāo)記模塊,用于對(duì)所述藏文字串中檢錯(cuò)結(jié)果為有錯(cuò)誤的藏文字,做與沒有錯(cuò)誤的藏文字進(jìn)行區(qū)分的標(biāo)記。
由上述技術(shù)方案可知,本發(fā)明提供的一種藏文字檢錯(cuò)方法,首先,獲取待檢錯(cuò)的藏文字;然后,將所述待檢錯(cuò)藏文字與預(yù)設(shè)的藏文字檢錯(cuò)正則表達(dá)式進(jìn)行匹配;最后,根據(jù)匹配是否成功判斷所述待檢錯(cuò)的藏文字是否有錯(cuò)誤。相較于現(xiàn)有技術(shù)中利用字典匹配的方式進(jìn)行藏文字檢錯(cuò)的方法,本發(fā)明基于現(xiàn)代藏文字的構(gòu)字規(guī)律,利用藏文字檢錯(cuò)正則表達(dá)式進(jìn)行藏文字的檢錯(cuò),具有占用處理器資源少、內(nèi)存占用低、運(yùn)行負(fù)荷小、檢錯(cuò)效率高等優(yōu)點(diǎn)。
基于相同的發(fā)明構(gòu)思,本發(fā)明還提供一種藏文字串檢錯(cuò)方法,首先,獲取待檢錯(cuò)的藏文字串;然后,按照所述藏文字串的順序,將所述藏文字串中的每個(gè)藏文字依次按照本發(fā)明提供的任一項(xiàng)所述藏文字檢錯(cuò)方法進(jìn)行檢錯(cuò),獲得每個(gè)所述藏文字各自的檢錯(cuò)結(jié)果;最后,對(duì)所述藏文字串中檢錯(cuò)結(jié)果為有錯(cuò)誤的藏文字,做與沒有錯(cuò)誤的藏文字進(jìn)行區(qū)分的標(biāo)記。本藏文字串檢錯(cuò)方法基于上述藏文字檢錯(cuò)方法實(shí)施,同樣具有占用處理器資源少、內(nèi)存占用低、運(yùn)行負(fù)荷小、檢錯(cuò)效率高等優(yōu)點(diǎn),此外,本方法將有錯(cuò)誤的藏文字進(jìn)行與沒有錯(cuò)誤的藏文字進(jìn)行區(qū)分的標(biāo)記,可以使用戶能夠在藏文字串中直觀、快速的看到錯(cuò)誤的藏文字,以幫助用戶避免輸入錯(cuò)誤和校正遺漏。
附圖說明
為了更清楚地說明本發(fā)明具體實(shí)施方式或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)具體實(shí)施方式或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹。在所有附圖中,類似的元件或部分一般由類似的附圖標(biāo)記標(biāo)識(shí)。附圖中,各元件或部分并不一定按照實(shí)際的比例繪制。
圖1示出了本發(fā)明第一實(shí)施例所提供的一種藏文字檢錯(cuò)方法的流程圖;
圖2示出了本發(fā)明第二實(shí)施例所提供的一種藏文字檢錯(cuò)系統(tǒng)的示意圖。
圖3示出了本發(fā)明第三實(shí)施例所提供的一種藏文字串檢錯(cuò)方法的流程圖;
圖4示出了本發(fā)明第四實(shí)施例所提供的一種藏文字串檢錯(cuò)系統(tǒng)的示意圖。
具體實(shí)施方式
下面將結(jié)合附圖對(duì)本發(fā)明技術(shù)方案的實(shí)施例進(jìn)行詳細(xì)的描述。以下實(shí)施例僅用于更加清楚地說明本發(fā)明的技術(shù)方案,因此只是作為示例,而不能以此來限制本發(fā)明的保護(hù)范圍。
需要注意的是,除非另有說明,本申請(qǐng)使用的技術(shù)術(shù)語或者科學(xué)術(shù)語應(yīng)當(dāng)為本發(fā)明所屬領(lǐng)域技術(shù)人員所理解的通常意義。
本發(fā)明提供一種藏文字檢錯(cuò)方法及系統(tǒng),以及一種藏文字串檢錯(cuò)方法及系統(tǒng)。下面結(jié)合附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行說明。
圖1示出了本發(fā)明第一實(shí)施例所提供的一種藏文字檢錯(cuò)方法的流程圖。如圖1所示,本發(fā)明第一實(shí)施例提供的一種藏文字檢錯(cuò)方法包括以下步驟:
步驟S101:獲取待檢錯(cuò)的藏文字。
步驟S102:將所述待檢錯(cuò)藏文字與預(yù)設(shè)的藏文字檢錯(cuò)正則表達(dá)式進(jìn)行匹配。
本發(fā)明中,發(fā)明人根據(jù)通過研究現(xiàn)代藏文字的構(gòu)字規(guī)律,建立了與現(xiàn)代藏文字相應(yīng)的藏文字檢錯(cuò)正則表達(dá)式,通過將待檢錯(cuò)的藏文字與該藏文字檢錯(cuò)正則表達(dá)式進(jìn)行匹配來進(jìn)行檢錯(cuò),需要說明的是,由于藏文字歷史悠久,其字體形式也是經(jīng)歷了漫長(zhǎng)的發(fā)展、演變過程,本發(fā)明實(shí)施例提供的藏文字檢錯(cuò)正則表達(dá)式是基于現(xiàn)代藏文字的構(gòu)字規(guī)律提出的,因此,本發(fā)明實(shí)施例所提供的藏文字檢錯(cuò)方法主要用于現(xiàn)代藏文字的檢錯(cuò)。
根據(jù)藏文字的構(gòu)字規(guī)律,所述預(yù)設(shè)的藏文字檢錯(cuò)正則表達(dá)式可以是以下任意一種正則表達(dá)式或任意多種正則表達(dá)式的組合:
不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式,單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式,藏文字元音的檢錯(cuò)正則表達(dá)式,藏文字后加字及又后加字組合的檢錯(cuò)正則表達(dá)式,藏文字后加字及緊縮字的檢錯(cuò)正則表達(dá)式;
其中,所述不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式具體為:
所述單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式具體為:
所述藏文字元音的檢錯(cuò)正則表達(dá)式具體為:
所述藏文字后加字及又后加字組合的檢錯(cuò)正則表達(dá)式具體為:
所述藏文字后加字及緊縮字的檢錯(cuò)正則表達(dá)式具體為:
其中,上述每個(gè)正則表達(dá)式都是根據(jù)藏文字的構(gòu)字規(guī)律總結(jié)形成的,例如:
根據(jù)現(xiàn)代藏文文法,藏文字有五個(gè)前加字:每個(gè)前加字后可跟隨的基字是有區(qū)別的:后可跟隨基字后可跟隨基字后可跟隨基字后可跟隨基字后可跟隨基字
基于此,可以建立不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式:
又如,根據(jù)現(xiàn)代藏文文法,30個(gè)藏文字母可以在沒有前加字、上加字、下加字時(shí)可以單獨(dú)拼寫現(xiàn)代藏文字,所以,建立檢錯(cuò)正則表達(dá)式:
另外,疊加藏文字因字性文法,有以下約束:
前加字為后可放置的有字符串組字時(shí)相互獨(dú)立的,所以,檢錯(cuò)正則表達(dá)式可表示為:
前加字后可加疊加的有檢錯(cuò)正則表達(dá)式可表示為:
前加字后可疊加的有檢錯(cuò)正則表達(dá)式可表示為:
前加字后可疊加的有檢錯(cuò)正則表達(dá)式可表示為:
無前加字而上加字為可疊加的有檢錯(cuò)正則表達(dá)式可表示為:
無前加字而上加字為的可疊加字有檢錯(cuò)正則表達(dá)式可表示為:
無前加字而上加字為的可疊加字有檢錯(cuò)正則表達(dá)式可表示為:
無前加字和上加字而下加字為的可疊加字有檢錯(cuò)正則表達(dá)式可表示為:
無前加字和上加字而下加字為的可疊加的字有檢錯(cuò)正則表達(dá)式表示為:
無前加字和上加字而下加字為的可疊加的字有檢錯(cuò)正則表達(dá)式表示為:
無前加字和上加字而下加字為的可疊加的字有檢錯(cuò)正則表達(dá)式可表示為:
基于此,可以建立單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式:
在本發(fā)明提供的一個(gè)實(shí)施例中,所述預(yù)設(shè)的藏文字檢錯(cuò)正則表達(dá)式包括不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式,單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式,藏文字元音的檢錯(cuò)正則表達(dá)式,藏文字后加字及又后加字組合的檢錯(cuò)正則表達(dá)式,藏文字后加字及緊縮字的檢錯(cuò)正則表達(dá)式的組合,其組合形式如下:
其中,rp表示藏文字檢錯(cuò)正則表達(dá)式,p表示不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式,q表示單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式,v表示藏文字元音的檢錯(cuò)正則表達(dá)式,b表示藏文字后加字及又后加字組合的檢錯(cuò)正則表達(dá)式,a表示藏文字后加字及緊縮字的檢錯(cuò)正則表達(dá)式。
對(duì)于上述組合的藏文字檢錯(cuò)正則表達(dá)式的解釋如下:
正則表達(dá)式p所生成字串的第二個(gè)字符后有元音時(shí),正則表達(dá)式b所生成的字串或正則表達(dá)式a所生成字串可存在也可不存在,如,所以,這時(shí)可建立藏文字的檢錯(cuò)正則表達(dá)式:
(p)v(b|a)?
正則表達(dá)式p所生成字串的第二個(gè)字符后沒有元音時(shí),正則表達(dá)式b所生成的字串、正則表達(dá)式a生成字串和字符三者之一必需要存在,否則,不符合藏文字文法,如,是合法的,但不合法。所以,這時(shí)可建立藏文字的檢錯(cuò)正則表達(dá)式:
正則表達(dá)式q所生成的字串可獨(dú)立成字,其后元音、正則表達(dá)式b所生成的字串、正則表達(dá)式a所生成字串都可存在也可不存在,如,都合法,但正則表達(dá)式b所生成的字串和正則表達(dá)式a所生成字串只能是二選一,否則如,不合法。所以,這時(shí)可建立藏文字的檢錯(cuò)正則表達(dá)式:
(q)(v)?(b|a)?
將上述三種情形綜合考慮,既可形成組合的藏文字檢錯(cuò)正則表達(dá)式
步驟S103:根據(jù)匹配是否成功判斷所述待檢錯(cuò)的藏文字是否有錯(cuò)誤。
本步驟的實(shí)施方式可以是:
在匹配成功時(shí),判斷所述待檢錯(cuò)的藏文字沒有錯(cuò)誤;
在匹配不成功時(shí),判斷所述待檢錯(cuò)的藏文字有錯(cuò)誤。
由于所述藏文字有可能是梵文字符,因此,在本發(fā)明提供的一個(gè)實(shí)施例中,對(duì)于匹配不成功的情況,還需要與梵文檢錯(cuò)正則表達(dá)式進(jìn)行匹配,以提高判斷的準(zhǔn)確性:所述在匹配不成功時(shí),判斷所述待檢錯(cuò)的藏文字有錯(cuò)誤,包括:
在匹配不成功時(shí),將所述待檢錯(cuò)藏文字與預(yù)設(shè)的梵文檢錯(cuò)正則表達(dá)式進(jìn)行匹配;
在與預(yù)設(shè)的梵文檢錯(cuò)正則表達(dá)式匹配成功時(shí),判斷所述待檢錯(cuò)的藏文字沒有錯(cuò)誤;
在與預(yù)設(shè)的梵文檢錯(cuò)正則表達(dá)式匹配不成功時(shí),判斷所述待檢錯(cuò)的藏文字有錯(cuò)誤。
其中,所述預(yù)設(shè)的梵文檢錯(cuò)正則表達(dá)式具體可以為:
考慮到在檢錯(cuò)完成后,需要將錯(cuò)誤的藏文字進(jìn)行突出顯示,以使用戶能夠直觀、快速的發(fā)現(xiàn)錯(cuò)誤的藏文字,因此,在本發(fā)明提供的一個(gè)實(shí)施例中,在根據(jù)匹配是否成功判斷所述待檢錯(cuò)的藏文字是否有錯(cuò)誤的步驟后,還包括:
在所述待檢錯(cuò)的藏文字有錯(cuò)誤時(shí),對(duì)所述藏文字做與檢錯(cuò)前進(jìn)行區(qū)分的標(biāo)記。
其中,做與檢錯(cuò)前進(jìn)行區(qū)分的標(biāo)記,可以通過將有錯(cuò)誤的藏文字的字體顏色、底紋顏色、下劃線顏色進(jìn)行變更,或者將有錯(cuò)誤的藏文字的進(jìn)行加粗、傾斜等處理,或者在文字底部增加下劃線、波浪線等方式實(shí)現(xiàn),也可以將以上方式以任意形式組合實(shí)現(xiàn),例如,對(duì)有錯(cuò)誤的藏文字做紅色雙波浪線下劃線標(biāo)記等等,只要能將有錯(cuò)誤的藏文字與檢錯(cuò)前進(jìn)行區(qū)分,任何現(xiàn)有的標(biāo)記方式都在本發(fā)明的保護(hù)范圍之內(nèi),此處不再一一贅述,其均在本發(fā)明的保護(hù)范圍之內(nèi)。
至此,通過步驟S101至步驟S103,完成了本發(fā)明第一實(shí)施例所提供的一種藏文字檢錯(cuò)方法的流程。相較于現(xiàn)有技術(shù)中利用字典匹配的方式進(jìn)行藏文字檢錯(cuò)的方法,本發(fā)明基于現(xiàn)代藏文字的構(gòu)字規(guī)律,利用藏文字檢錯(cuò)正則表達(dá)式進(jìn)行藏文字的檢錯(cuò),具有占用處理器資源少、內(nèi)存占用低、運(yùn)行負(fù)荷小、檢錯(cuò)效率高等優(yōu)點(diǎn)。
在上述的第一實(shí)施例中,提供了一種藏文字檢錯(cuò)方法,與之相對(duì)應(yīng)的,本申請(qǐng)還提供一種藏文字檢錯(cuò)系統(tǒng)。請(qǐng)參考圖2,其為本發(fā)明第二實(shí)施例提供的一種藏文字檢錯(cuò)系統(tǒng)的示意圖。由于系統(tǒng)實(shí)施例基本相似于方法實(shí)施例,所以描述得比較簡(jiǎn)單,相關(guān)之處參見方法實(shí)施例的部分說明即可。下述描述的系統(tǒng)實(shí)施例僅僅是示意性的。
本發(fā)明第二實(shí)施例提供的一種藏文字檢錯(cuò)系統(tǒng),包括:
藏文字獲取模塊101,用于獲取待檢錯(cuò)的藏文字;
藏文字匹配模塊102,用于將所述待檢錯(cuò)藏文字與預(yù)設(shè)的藏文字檢錯(cuò)正則表達(dá)式進(jìn)行匹配;
藏文字判斷模塊103,用于根據(jù)匹配是否成功判斷所述待檢錯(cuò)的藏文字是否有錯(cuò)誤。
在本發(fā)明提供的一個(gè)實(shí)施例中,所述藏文字判斷模塊103,包括:
匹配成功單元,用于在匹配成功時(shí),判斷所述待檢錯(cuò)的藏文字沒有錯(cuò)誤;
匹配不成功單元,用于在匹配不成功時(shí),判斷所述待檢錯(cuò)的藏文字有錯(cuò)誤。
在本發(fā)明提供的一個(gè)實(shí)施例中,所述匹配不成功單元,包括:
梵文匹配子單元,用于在匹配不成功時(shí),將所述待檢錯(cuò)藏文字與預(yù)設(shè)的梵文檢錯(cuò)正則表達(dá)式進(jìn)行匹配;
梵文匹配成功子單元,用于在與預(yù)設(shè)的梵文檢錯(cuò)正則表達(dá)式匹配成功時(shí),判斷所述待檢錯(cuò)的藏文字沒有錯(cuò)誤;
梵文匹配不成功子單元,用于在與預(yù)設(shè)的梵文檢錯(cuò)正則表達(dá)式匹配不成功時(shí),判斷所述待檢錯(cuò)的藏文字有錯(cuò)誤。
在本發(fā)明提供的一個(gè)實(shí)施例中,所述預(yù)設(shè)的梵文檢錯(cuò)正則表達(dá)式具體為:
在本發(fā)明提供的一個(gè)實(shí)施例中,所述預(yù)設(shè)的藏文字檢錯(cuò)正則表達(dá)式包括不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式,單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式,藏文字元音的檢錯(cuò)正則表達(dá)式,藏文字后加字及又后加字組合的檢錯(cuò)正則表達(dá)式,藏文字后加字及緊縮字的檢錯(cuò)正則表達(dá)式中的任意一種正則表達(dá)式或任意多種正則表達(dá)式的組合;
其中,所述不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式具體為:
所述單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式具體為:
所述藏文字元音的檢錯(cuò)正則表達(dá)式具體為:
所述藏文字后加字及又后加字組合的檢錯(cuò)正則表達(dá)式具體為:
所述藏文字后加字及緊縮字的檢錯(cuò)正則表達(dá)式具體為:
在本發(fā)明提供的一個(gè)實(shí)施例中,所述預(yù)設(shè)的藏文字檢錯(cuò)正則表達(dá)式包括不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式,單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式,藏文字元音的檢錯(cuò)正則表達(dá)式,藏文字后加字及又后加字組合的檢錯(cuò)正則表達(dá)式,藏文字后加字及緊縮字的檢錯(cuò)正則表達(dá)式的組合,其組合形式如下:
其中,rp表示藏文字檢錯(cuò)正則表達(dá)式,p表示不疊加藏文字中前加字和基字組合的檢錯(cuò)正則表達(dá)式,q表示單字母藏文字和疊加藏文字中前加字、上加字、基字和下加字組合的檢錯(cuò)正則表達(dá)式,v表示藏文字元音的檢錯(cuò)正則表達(dá)式,b表示藏文字后加字及又后加字組合的檢錯(cuò)正則表達(dá)式,a表示藏文字后加字及緊縮字的檢錯(cuò)正則表達(dá)式。
在本發(fā)明提供的一個(gè)實(shí)施例中,所述藏文字檢錯(cuò)系統(tǒng),還包括:
錯(cuò)誤標(biāo)記模塊,用于在所述待檢錯(cuò)的藏文字有錯(cuò)誤時(shí),對(duì)所述藏文字做與檢錯(cuò)前進(jìn)行區(qū)分的標(biāo)記。
以上,為本發(fā)明第二實(shí)施例提供的一種藏文字檢錯(cuò)系統(tǒng)的實(shí)施例說明。
本發(fā)明提供的一種藏文字檢錯(cuò)系統(tǒng)與上述藏文字檢錯(cuò)方法出于相同的發(fā)明構(gòu)思,具有相同的有益效果,此處不再贅述。
本發(fā)明還提供一種藏文字串檢錯(cuò)方法,請(qǐng)參考圖3,圖3示出了本發(fā)明第三實(shí)施例所提供的一種藏文字串檢錯(cuò)方法的流程圖。如圖3所示,本發(fā)明第三實(shí)施例提供的一種藏文字串檢錯(cuò)方法包括以下步驟:
步驟S201:獲取待檢錯(cuò)的藏文字串。
步驟S202:按照所述藏文字串的順序,將所述藏文字串中的每個(gè)藏文字依次按照本發(fā)明提供的任一項(xiàng)所述藏文字檢錯(cuò)方法進(jìn)行檢錯(cuò),獲得每個(gè)所述藏文字各自的檢錯(cuò)結(jié)果。
在本發(fā)明提供的一個(gè)實(shí)施例中,對(duì)藏文字串中的每個(gè)藏文字均通過藏文字檢錯(cuò)正則表達(dá)式和梵文檢錯(cuò)正則表達(dá)式進(jìn)行檢錯(cuò),例如,首先將藏文字與藏文字檢錯(cuò)正則表達(dá)式進(jìn)行匹配,若匹配成功,則輸出表示所述藏文字沒有錯(cuò)誤的檢測(cè)結(jié)果;若匹配不成功,在將所述藏文字與梵文檢錯(cuò)正則表達(dá)式進(jìn)行匹配,若匹配成功,則輸出表示所述藏文字沒有錯(cuò)誤的檢測(cè)結(jié)果,若匹配不成功,則輸出表示所述藏文字有錯(cuò)誤的檢測(cè)結(jié)果。
步驟S203:對(duì)所述藏文字串中檢錯(cuò)結(jié)果為有錯(cuò)誤的藏文字,做與沒有錯(cuò)誤的藏文字進(jìn)行區(qū)分的標(biāo)記。
其中,做與沒有錯(cuò)誤的藏文字進(jìn)行區(qū)分的標(biāo)記,可以通過將有錯(cuò)誤的藏文字的字體顏色、底紋顏色、下劃線顏色進(jìn)行變更,或者將有錯(cuò)誤的藏文字的進(jìn)行加粗、傾斜等處理,或者在文字底部增加下劃線、波浪線等方式實(shí)現(xiàn),也可以將以上方式以任意形式組合實(shí)現(xiàn),例如,對(duì)有錯(cuò)誤的藏文字做紅色雙波浪線下劃線標(biāo)記等等,只要能將有錯(cuò)誤的藏文字與沒有錯(cuò)誤的藏文字進(jìn)行區(qū)分,任何現(xiàn)有的標(biāo)記方式都在本發(fā)明的保護(hù)范圍之內(nèi),此處不再一一贅述,其均在本發(fā)明的保護(hù)范圍之內(nèi)。
至此,通過步驟S201至步驟S203,完成了本發(fā)明第三實(shí)施例所提供的一種藏文字串檢錯(cuò)方法的流程。本藏文字串檢錯(cuò)方法基于上述藏文字檢錯(cuò)方法實(shí)施,同樣具有占用處理器資源少、內(nèi)存占用低、運(yùn)行負(fù)荷小、檢錯(cuò)效率高等優(yōu)點(diǎn),此外,本方法將有錯(cuò)誤的藏文字進(jìn)行與沒有錯(cuò)誤的藏文字進(jìn)行區(qū)分的標(biāo)記,可以使用戶能夠在藏文字串中直觀、快速的看到錯(cuò)誤的藏文字,以幫助用戶避免輸入錯(cuò)誤和校正遺漏。
在本發(fā)明提供的一個(gè)優(yōu)選的實(shí)施例中,所述藏文字串檢錯(cuò)方法可以通過VB.NET實(shí)現(xiàn),具體代碼如下:
在上述的第三實(shí)施例中,提供了一種藏文字串檢錯(cuò)方法,與之相對(duì)應(yīng)的,本申請(qǐng)還提供一種藏文字串檢錯(cuò)系統(tǒng)。請(qǐng)參考圖4,其為本發(fā)明第四實(shí)施例提供的一種藏文字串檢錯(cuò)系統(tǒng)的示意圖。由于系統(tǒng)實(shí)施例基本相似于方法實(shí)施例,所以描述得比較簡(jiǎn)單,相關(guān)之處參見方法實(shí)施例的部分說明即可。下述描述的系統(tǒng)實(shí)施例僅僅是示意性的。
本發(fā)明第四實(shí)施例提供的一種藏文字串檢錯(cuò)系統(tǒng),包括:
藏文字串獲取模塊201,用于獲取待檢錯(cuò)的藏文字串;
藏文字檢錯(cuò)模塊202,用于按照所述藏文字串的順序,將所述藏文字串中的每個(gè)藏文字依次按照本發(fā)明提供的任一項(xiàng)所述藏文字檢錯(cuò)方法進(jìn)行檢錯(cuò),獲得每個(gè)所述藏文字各自的檢錯(cuò)結(jié)果;
錯(cuò)誤文字標(biāo)記模塊203,用于對(duì)所述藏文字串中檢錯(cuò)結(jié)果為有錯(cuò)誤的藏文字,做與沒有錯(cuò)誤的藏文字進(jìn)行區(qū)分的標(biāo)記。
本發(fā)明提供的一種藏文字串檢錯(cuò)系統(tǒng)與上述藏文字串檢錯(cuò)方法出于相同的發(fā)明構(gòu)思,具有相同的有益效果,此處不再贅述。
在本說明書的描述中,參考術(shù)語“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對(duì)上述術(shù)語的示意性表述不必須針對(duì)的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說明書中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。
需要說明的是,附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個(gè)實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或動(dòng)作的專用的基于硬件的系統(tǒng)來實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來實(shí)現(xiàn)。
本發(fā)明實(shí)施例所提供的藏文字檢錯(cuò)系統(tǒng)和藏文字串檢錯(cuò)系統(tǒng)可以是計(jì)算機(jī)程序產(chǎn)品,包括存儲(chǔ)了程序代碼的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述程序代碼包括的指令可用于執(zhí)行前面方法實(shí)施例中所述的方法,具體實(shí)現(xiàn)可參見方法實(shí)施例,在此不再贅述。
所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的系統(tǒng)、系統(tǒng)和單元的具體工作過程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過程,在此不再贅述。
在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng)、系統(tǒng)和方法,可以通過其它的方式實(shí)現(xiàn)。以上所描述的系統(tǒng)實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,又例如,多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些通信接口,系統(tǒng)或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。
所述功能如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(ROM,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求和說明書的范圍當(dāng)中。