本發(fā)明涉及一種中文漢字標(biāo)注拼音的系統(tǒng)及方法,特別涉及一種中文漢字自動標(biāo)注拼音的系統(tǒng)及方法。
背景技術(shù):
目前,不少出版社為了讓孩子多識字,多讀書,出版了大量多種多樣的注音讀物。注音讀物就是在文章中的文字上方標(biāo)注拼音的讀物。除了常見的各類童話故事、少兒故事和科普讀本,一些經(jīng)典文學(xué)名著等也被改編成標(biāo)注有拼音的精簡本。
但是,不同的漢字,其對應(yīng)的拼音英文字母數(shù)不一,例如“的”對應(yīng)的拼音英文字母數(shù)僅2個,“?!睂?yīng)的拼音英文字母數(shù)有5個,而有的漢字對應(yīng)的拼音英文字母數(shù)高達6個,例如“狀”、“雙”、“窗”等。因此,現(xiàn)有的注音讀物存在以下問題:
(例如下面作為比較例1的一段標(biāo)注有拼音的文字,摘自2013年出版的《EQ情商教育童話自我認(rèn)知卷》第12頁)
1.為了使英文字母排在漢字的正上方,必然會造成漢字之間的字距不一,從而嚴(yán)重破壞注音讀物版面的整齊和美觀。例如在上面的一段文字中“?!迸c“常”之間和“?!迸c“嘲”之間的間距遠大于“完”與“好”之間和“好”與“的”之間的間距。
2.漢字過大,而英文字母過小。在上述比較例1中漢字是加粗華文楷體“四號”字,英文字母是“小六號”(與原著完全一致)。如果文章中有“狀”等漢字,為了使“狀”對應(yīng)的拼音“zhuang”正好排在“狀”字的正上方和使?jié)h字之間的字距相同,則當(dāng)漢字使用“一號”字(尺寸為9.17mm)時,即使英文字母采用“七號”字(尺寸為1.94mm),也會偏大。
3.由于拼音英文字母過小,不僅影響兒童的學(xué)習(xí),而且對于兒童的視力將造成不良的影響。
另外,對于學(xué)習(xí)漢字的人而言,如何根據(jù)用戶需求而自動為中文漢字標(biāo)注拼音,使有注音需求的用戶隨時能夠了解中文漢字的讀音,也是迫切需要解決的問題。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于解決現(xiàn)有拼音讀物中存在的上述問題。
為了實現(xiàn)上述目的,提供一種中文漢字自動標(biāo)注拼音的系統(tǒng),用于對中文漢字自動標(biāo)注拼音,
該系統(tǒng)包括:一數(shù)據(jù)庫,儲存有中文漢字及其對應(yīng)的拼音,所述數(shù)據(jù)庫中的中文漢字包括單字和詞組,所述數(shù)據(jù)庫中的拼音包括單字對應(yīng)的拼音和詞組對應(yīng)的拼音,所述詞組對應(yīng)的優(yōu)先級別較高,拼音采用兩拼法,即每個中文漢字至多用兩個字符:一個聲母和一個韻母標(biāo)注拼音,聲母按照下列聲母表一至聲母表三中的一種,韻母按照下列韻母表一至韻母表四中的一種,其中韻母表一中的“i”、“A”、“E”、“O”和韻母表二中的“i”、“丨”、“a”、“e”、“o”是基本韻母,字符分別表示“n”、“ng”,韻母表三中的“丨”、或者韻母表四中的分別代替注音字符“丨”、“乂”、“凵”,
[表1]
聲母表一
[表2]
聲母表二
[表3]
聲母表三
[表4]
韻母表一
[表5]
韻母表二
(接前表)
[表6]
韻母表三
[表7]
韻母表四
一提取模塊,采用全屏提取的方式,提取當(dāng)前所顯示的中文頁面中的中文漢字串,或采用鼠標(biāo)取詞的方式,提取當(dāng)前鼠標(biāo)所在位置的中文漢字串,并將該中文漢字串與該數(shù)據(jù)庫中的詞組對比,判斷該中文漢字串能否組成詞組,如果不能,則與所述單字進行對比;
一轉(zhuǎn)換模塊,根據(jù)該數(shù)據(jù)庫,將該中文漢字串轉(zhuǎn)換為對應(yīng)的拼音;及
一顯示模塊,將該拼音顯示在與該中文漢字串對應(yīng)的位置。
另外,對于所述的中文漢字自動標(biāo)注拼音的系統(tǒng),該顯示模塊還包括一位置單元,用以確定該拼音的顯示區(qū)域。
另外,對于所述的中文漢字自動標(biāo)注拼音的系統(tǒng),所述顯示區(qū)域為該頁面中的中文漢字串的各個漢字的正上方區(qū)域。
另外,對于所述的中文漢字自動標(biāo)注拼音的系統(tǒng),所述顯示區(qū)域為在當(dāng)前鼠標(biāo)所在位置開啟的一窗口。
本發(fā)明還提供了一種中文漢字自動標(biāo)注拼音的方法,用于對中文漢字自動標(biāo)注拼音,
該方法包括如下步驟:建立中文漢字與對應(yīng)的拼音的數(shù)據(jù)庫,所述數(shù)據(jù)庫中的中文漢字包括單字和詞組,所述數(shù)據(jù)庫中的拼音包括單字對應(yīng)的拼音和詞組對應(yīng)的拼音,所述詞組對應(yīng)的優(yōu)先級別較高,拼音采用兩拼法,即每個中文漢字至多用兩個字符:一個聲母和一個韻母標(biāo)注拼音,聲母按照上述聲母表一至聲母表三中的一種,韻母按照上述韻母表一至韻母表四中的一種,其中韻母表一中的“i”、“A”、“E”、“O”和韻母表二中的“i”、“丨”、“a”、“e”、“o”是基本韻母,字符分別表示“n”、“ng”,韻母表三中的“丨”、或者韻母表四中的分別代替注音字符“丨”、“乂”、“凵”,
提取中文頁面,采用全屏提取的方式,提取當(dāng)前顯示的中文頁面中的中文漢字串,或采用鼠標(biāo)取詞的方式,提取當(dāng)前鼠標(biāo)所在位置的中文漢字串,并將該中文漢字串與該數(shù)據(jù)庫中的詞組對比,判斷該中文漢字串能否組成詞組,如果不能,則與所述單字進行對比,
根據(jù)該數(shù)據(jù)庫將該中文漢字串轉(zhuǎn)換為對應(yīng)的拼音,及
將該拼音顯示在與該中文漢字串對應(yīng)的位置。
另外,所述的中文漢字自動標(biāo)注拼音的方法,還包括確定該拼音的顯示區(qū)域的步驟。
另外,對于所述的中文漢字自動標(biāo)注拼音的方法,所述確定該拼音的顯示區(qū)域的步驟是將該中文漢字串的各個漢字的正上方作為顯示區(qū)域。
另外,對于所述的中文漢字自動標(biāo)注拼音的方法,所述確定該拼音的顯示區(qū)域的步驟是在當(dāng)前鼠標(biāo)的所在位置開啟一窗口作為顯示區(qū)域。
根據(jù)本發(fā)明的中文漢字自動標(biāo)注拼音的系統(tǒng)及方法,不僅能夠自動為中文網(wǎng)頁中所有的中文漢字標(biāo)注拼音,而且在每個漢字的正上方僅標(biāo)注兩個字符組成的拼音或一個字符的拼音,從而使注音讀物的版面整齊、美觀,同時使拼音字符的大小顯著地增大,另外,本發(fā)明中的韻母以及各種字符容易記憶,因此,非常有利于孩子的學(xué)習(xí)和保護孩子的視力。結(jié)合屏幕取詞功能,可以根據(jù)用戶需要,在顯示的頁面中截取中文漢字,顯示其對應(yīng)的拼音,從而使用戶可以隨時了解該中文漢字的讀音,方便了用戶的使用。
附圖說明
圖1是本發(fā)明的中文漢字自動標(biāo)注拼音的系統(tǒng)的模塊結(jié)構(gòu)圖。
圖2是本發(fā)明的實施方式的模塊結(jié)構(gòu)圖。
圖3是本發(fā)明的中文漢字自動標(biāo)注拼音的方法的流程圖。
圖4是本發(fā)明的第一實施方式頁面轉(zhuǎn)換的流程圖。
圖5是本發(fā)明的第二實施方式的鼠標(biāo)取詞的流程圖。
具體實施方式
下面對本發(fā)明進行詳細說明。
圖1是本發(fā)明的中文漢字自動標(biāo)注拼音系統(tǒng)的模塊結(jié)構(gòu)圖,包括一數(shù)據(jù)庫110,一提取模塊120,一轉(zhuǎn)化模塊130以及一顯示模塊140。
下面對本系統(tǒng)的各模塊進行詳細說明:
(1)數(shù)據(jù)庫110,儲存有中文漢字及其按兩拼法對應(yīng)的拼音,包括中文漢字的單字對應(yīng)的拼音和由單字組成的詞對應(yīng)的拼音。
(2)提取模塊120,用于根據(jù)用戶需要提取當(dāng)前頁面中的中文漢字。如果用戶選擇全屏提取,則提取模塊120提取當(dāng)前頁面中的所有中文漢字。如果用戶選擇鼠標(biāo)取詞,則提取模塊120只提取當(dāng)前鼠標(biāo)所在位置的中文漢字,同時判斷當(dāng)前漢字與其相鄰漢字能否組成詞組,如果能夠組成詞組,則提取詞組。
(3)轉(zhuǎn)換模塊130,用于接收提取模塊120提取的內(nèi)容,并且通過數(shù)據(jù)庫110,將該中文漢字轉(zhuǎn)換為對應(yīng)的拼音。
(4)顯示模塊140,用于將該拼音顯示在與該漢字對應(yīng)的位置。其中,顯示模塊140還包括一位置單元141(見圖2),用以確定拼音顯示的具體位置。如果用戶選擇全屏提取,則位置單元141將中文漢字的正上方作為顯示區(qū)域,使中文漢字與拼音對應(yīng)。如果用戶選擇的是鼠標(biāo)取詞,則該位置單元141將根據(jù)當(dāng)前鼠標(biāo)所在的位置,自動開啟一顯示窗口,作為拼音顯示區(qū)域。
參見圖3,該圖是本發(fā)明的中文漢字自動標(biāo)注拼音的方法的流程圖,首先建立中文漢字及其按兩拼法對應(yīng)的拼音的數(shù)據(jù)庫(步驟310),然后,提取當(dāng)前頁面中的中文漢字(步驟320),根據(jù)該數(shù)據(jù)庫將該中文漢字轉(zhuǎn)換為對應(yīng)的拼音(步驟330),最后將該拼音顯示在該漢字對應(yīng)的位置(步驟340)。
第一實施方式
下面以中文網(wǎng)頁標(biāo)注拼音為例,對本發(fā)明進行詳細說明。
參見圖4,該圖是本發(fā)明第一實施方式的流程圖。本發(fā)明的數(shù)據(jù)庫是預(yù)先建立的,其中詞組具有較高的優(yōu)先級,提取的中文漢字首先與“中文”字段中的詞組進行對照,如果存在與的匹配的內(nèi)容,則提取對應(yīng)的拼音,如果不存在相匹配的內(nèi)容,再與其中的單字進行對照。
首先顯示中文頁面(步驟410),如果用戶按下標(biāo)注拼音的按鍵,則系統(tǒng)提取當(dāng)前頁面的中文漢字串(步驟420),提取過程中,實時判斷當(dāng)前中文漢字串是否能夠組成詞組(步驟430),即將當(dāng)前漢字串與數(shù)據(jù)庫中的詞組進行對照,如存在相匹配的內(nèi)容,則認(rèn)為其能夠組成詞組,然后提取該詞組對應(yīng)的拼音(步驟441)。如果當(dāng)前漢字與其相鄰的漢字不能組成詞組,即數(shù)據(jù)庫中不存在與其對應(yīng)的詞組,則提取該單個漢字對應(yīng)的拼音(步驟442)。再將拼音顯示在中文漢字的正上方(步驟450),使中文漢字與其拼音對應(yīng),從而就可以對所有的中文漢字自動標(biāo)注拼音。
第二實施方式
下面以中文頁面中通過鼠標(biāo)取詞顯示拼音為例,對本發(fā)明進行詳細說明。
參見圖5,該圖5是本發(fā)明第二實施方式的流程圖。首先顯示中文頁面(步驟510),當(dāng)用戶需要查看當(dāng)前頁面的漢字對應(yīng)的拼音時,用戶只需要將鼠標(biāo)移動至該中文漢字處,提取鼠標(biāo)位置的中文漢字串(步驟520),然后將該中文漢字串與數(shù)據(jù)庫的詞組進行對照,判斷是否能組成詞組(步驟530),如果存在相匹配的詞組,則提取該詞組對應(yīng)的拼音(步驟541),如果不存在相匹配的詞組,則提取該單字對應(yīng)的拼音(步驟540),然后在當(dāng)前鼠標(biāo)所在位置處,另外開啟一窗口(步驟550),在該窗口中顯示拼音(步驟560),從而使用戶隨時能夠看到中文漢字的讀音。
實施例
首先,對于上述聲母表和上述韻母表加以說明。
在表1的聲母表一中,聲母采用大寫英文字母,在表2的聲母表二中,聲母采用小寫英文字母,在表3的聲母表三中,聲母采用注音字母。
表4的韻母表一的韻母按照以下方法構(gòu)成:首先選擇6個基本字符“i”、“A”、“E”、“O”,分別表示單韻母i、u、ü、a、e、o,選擇兩個特殊字符分別表示n、ng,再由該8個字符分別構(gòu)成29個單一的字符,表示29個復(fù)合韻母。表5的韻母表二的韻母按照類似的方法構(gòu)成。另外,表4的韻母表一中的和表5的韻母表二中的“l(fā)e”、“l(fā)e”可以分別用“丨”、和“丨”代替。
表6的韻母表三的韻母按照以下方法構(gòu)成:首先選擇3個字符“丨”、分別表示注音字符“丨”、“乂”、“凵”,再由“丨”、分別與丫、乁、幺、尢、Λ構(gòu)成20個單一的字符,表示20個復(fù)合韻母。表7的韻母表四的韻母按照類似的方法構(gòu)成。
當(dāng)漢字的拼音僅為時,可用“丨”代替,而當(dāng)漢字的拼音僅為或時,或也可分別用“乂”、“凵”代替。例如,“屋”的標(biāo)注拼音僅為也可用“乂”代替。另外,在表6的韻母表三和表7的韻母表四中,增加了一個新韻母“Λ”,代替(即轟的韻母ong)。(可參考商務(wù)印書館2012年1月第11版《新華字典大字本》第680頁三韻母表)
下面以實施例詳細說明中文漢字標(biāo)注拼音后的結(jié)果。
在以下的實施例1至4中,均以“完好的水罐常常嘲笑那個有裂縫的水罐”這句話為例對漢字標(biāo)注拼音。
實施例1
在本實施例1中按照表1的聲母表一的聲母和表4的韻母表一的韻母標(biāo)注拼音。例如按照現(xiàn)有的拼音方法,“水”的拼音是“shui(shuei)”,按照本專利的兩拼法,“sh”用表示,“uei”用表示,因此,“水”的拼音是按照現(xiàn)有的拼音方法,“?!钡钠匆羰恰癱hang”,按照本專利的兩拼法,“ch”和“ang”分別用和“A”表示,因此,“?!钡钠匆羰穷愃频兀靶Α钡臉?biāo)注拼音是其余漢字的拼音可以類推。
在本發(fā)明中,聲調(diào)符號可以統(tǒng)一標(biāo)在第一個字符上,也可以規(guī)定如下,即當(dāng)拼音只有一個字符時,聲調(diào)符號標(biāo)在第一個字符上;當(dāng)拼音有兩個字符時,聲調(diào)符號標(biāo)在第二個字符上。但為方便起見,在以下的實施例和比較例中,除比較例1外,都省略了聲調(diào)符號。
[表8]
表8中的第3行表示的是本實施例1標(biāo)注拼音的結(jié)果。與比較例1相比,本實施例1的漢字標(biāo)注拼音后,漢字之間的字距統(tǒng)一,保證了版面的整齊和美觀。另外,在比較例1和本實施例1中,漢字都是“四號”字,但在比較例1中英文字母是“小六號”字,而在本實施例1中字符的大小顯著增大,更加清晰易讀,因此,有利于保護兒童和學(xué)習(xí)漢語的人的視力。
實施例2
在本實施例2中按照表2的聲母表二的聲母和表5的韻母表二的韻母標(biāo)注拼音。例如按照現(xiàn)有的拼音方法,“水”的拼音是“shui(shuei)”,按照本專利的兩拼法,“sh”用表示,“uei”用“l(fā)i”表示,因此,“水”的拼音是按照現(xiàn)有的拼音方法,“?!钡钠匆羰恰癱hang”,按照本專利的兩拼法,“ch”和“ang”分別用和“a”表示,因此,“?!钡钠匆羰穷愃频兀靶Α钡臉?biāo)注拼音是“xi@”,其余漢字的拼音可以類推。
表8中的第4行表示的是本實施例2標(biāo)注拼音的結(jié)果。與實施例1一樣,本實施例2能夠獲得相同的效果。
實施例3
在本實施例3中按照表3的聲母表三的聲母和表6的韻母表三的韻母標(biāo)注拼音。例如按照現(xiàn)有的拼音方法,“水”的拼音是“shui(shuei)”,按照本專利的兩拼法,“sh”用表示,“uei”用表示,因此,“水”的拼音是按現(xiàn)有的拼音方法,“?!钡钠匆羰恰癱hang”,按照本專利的兩拼法,“ch”和“ang”分別用“彳”和“尢”表示,因此,“?!钡钠匆羰恰搬苻獭薄n愃频?,“笑”的標(biāo)注拼音是“丅丨幺”,其余漢字的拼音可以類推。
表8中的第5行表示的是本實施例3標(biāo)注拼音的結(jié)果。與實施例1一樣,本實施例3能夠獲得相同的效果。
實施例4
本實施例4與實施例3的區(qū)別是:在本實施例4中韻母按照表7的韻母表四,在實施例3中韻母按照表6的韻母表三,其余相同。例如,按照本專利的兩拼法,“水”的拼音是“笑”的標(biāo)注拼音是表8中的第6行表示的是本實施例4標(biāo)注拼音的結(jié)果。與實施例3相比,本實施例4能夠獲得更好的效果。
在以下的實施例5至8中,均以“風(fēng)箏的形狀像蝴蝶”這句話為例對漢字標(biāo)注拼音。
實施例5
在本實施例5中,按照表1的聲母表一的聲母和表4的韻母表一的韻母標(biāo)注拼音。表9中的第3行表示的是本實施例5標(biāo)注拼音的結(jié)果。
[表9]
與比較例2相比,本實施例5的漢字標(biāo)注拼音后,漢字之間的字距統(tǒng)一,保證了版面的整齊和美觀。并且,在本實施例5中,字符的大小顯著增大,更加清晰易讀,因此,有利于保護兒童和學(xué)習(xí)漢語的人的視力。
實施例6
在本實施例6中,按照表2的聲母表二的聲母和表5的韻母表二的韻母標(biāo)注拼音。表9中的第4行表示的是本實施例6標(biāo)注拼音的結(jié)果。與實施例5一樣,本實施例6能夠獲得相同的效果。
實施例7
在本實施例7中,按照表3的聲母表三的聲母和表6的韻母表三的韻母標(biāo)注拼音。表9中的第5行表示的是本實施例7標(biāo)注拼音的結(jié)果。與實施例5一樣,本實施例7能夠獲得相同的效果。
實施例8
在本實施例6中,按照表3的聲母表三的聲母和表7的韻母表四的韻母標(biāo)注拼音。表9中的第6行表示的是本實施例6標(biāo)注拼音的結(jié)果。與實施例5一樣,本實施例8能夠獲得相同的效果。
在以下的實施例9至12中,均以“海鷗在水面上翱翔”這句話為例對漢字標(biāo)注拼音。
實施例9
在本實施例9中,按照表1的聲母表一的聲母和表4的韻母表一的韻母標(biāo)注拼音。表10中的第3行表示的是本實施例9標(biāo)注拼音的結(jié)果。與比較例3相比,本實施例9的漢字標(biāo)注拼音后,漢字之間的字距統(tǒng)一,保證了版面的整齊和美觀,漢字排列更加緊湊。并且,在本實施例9中,字符的大小顯著增大,更加清晰易讀,因此,有利于保護兒童和學(xué)習(xí)漢語的人的視力。
[表10]
實施例10
在本實施例10中,按照表2的聲母表二的聲母和表5的韻母表二的韻母標(biāo)注拼音。表10中的第4行表示的是本實施例10標(biāo)注拼音的結(jié)果。與實施例9一樣,本實施例10能夠獲得相同的效果。
實施例11
在本實施例11中,按照表3的聲母表三的聲母和表6的韻母表三的韻母標(biāo)注拼音。表10中的第5行表示的是本實施例11標(biāo)注拼音的結(jié)果。與實施例9一樣,本實施例11能夠獲得相同的效果。
實施例12
在本實施例12中,按照表3的聲母表三的聲母和表7的韻母表四的韻母標(biāo)注拼音。表10中的第6行表示的是本實施例12標(biāo)注拼音的結(jié)果。與實施例9一樣,本實施例12能夠獲得相同的效果。
以上,通過12個實施例詳細說明了本發(fā)明的中文漢字標(biāo)注拼音的結(jié)果。但還可以列舉其他的實施例,例如按照表1的聲母表一的聲母和表4的韻母表二的韻母對漢字標(biāo)注拼音,或者按照表1的聲母表一的聲母或表2的聲母表二的聲母和表6的韻母表三的韻母或表7的韻母表四的韻母對漢字標(biāo)注拼音,都能夠獲得相同的效果。另外,還可選擇其他的基本字符或特殊字符代替本發(fā)明的基本字符或特殊字符,例如選擇等代替基本字符“i”或“丨”或或者選擇等代替基本字符或或或或者選擇等代替表4的韻母表一中的“i”、另外,或者選擇等代替特殊字符或
總之,在不背離本發(fā)明的精神和實質(zhì)的情況下,熟悉本領(lǐng)域的技術(shù)人員可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變形,但這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明的所附的權(quán)利要求書的保護范圍。