專利名稱:中文漢字字符轉(zhuǎn)換方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明總地涉及一種中文漢字字符轉(zhuǎn)換方法及一種中文漢字字符轉(zhuǎn)換裝置。更具體地,本發(fā)明針對這樣的中文漢字字符轉(zhuǎn)換方法/裝置,即在中文輸入程序中,指示中文漢字字符串的發(fā)音的語音符號串被輸入,然后將輸入的語音符號串轉(zhuǎn)換成漢字字符。
通常,為了處理中文字符,將由字母符號構(gòu)成的語音符號(拼音)串輸入,然后使對應(yīng)于輸入語音符號串的中文漢字字符從字典中檢索出來,使得檢索出的中文漢字字符被輸出。
這就是,基本上類似于日文字符處理操作,需要將輸入語音符號串轉(zhuǎn)換成中文漢字字符的中文漢字字符轉(zhuǎn)換裝置(所謂的“前端處理器”),以便進行中文漢字處理操作。
通常,在與由多個漢字字符習(xí)語構(gòu)成的漢字字符串相對應(yīng)的語音符號串被輸入了以后的這一情況下,這些語音符號串以分批處理方式在中文漢字字符轉(zhuǎn)換裝置中被轉(zhuǎn)換,隨著檢索字典,輸入語音符號串的符號部分從其頂部(開頭部分)開始被順序地轉(zhuǎn)換成相應(yīng)的漢字習(xí)語。
在此情況下,具有任意語音符號串長度的開頭部分所對應(yīng)的漢字字符習(xí)語首先被在字典中檢索。當檢索出多個漢字字符習(xí)語且這些檢索的漢字習(xí)語字符數(shù)彼此不同時,具有最大字符數(shù)(量)的漢字字符可被優(yōu)先選擇。
然后,與上述語音符號串的選擇漢字字符習(xí)語相對應(yīng)的開頭部分被識別為單個詞組片。
接著,對于這個語音符號串當與檢索的漢字字符習(xí)語對應(yīng)的開頭部分被從上述語音符號串中提取出來時,執(zhí)行上述的處理操作,并重復(fù)進行上述處理操作直到所有的語音符號串部分被轉(zhuǎn)換成漢字字符為止。
換句話說,當相應(yīng)于多個漢字字符習(xí)語組成的漢字字符串的語音符號串以分批方式被轉(zhuǎn)換時,語音字符串被再分成多個詞組片。并接著將各詞組片轉(zhuǎn)換成漢字字符習(xí)語。
在相對語音符號串的單個詞組片選擇多個漢字字符習(xí)語的情況下,即當出現(xiàn)相同發(fā)音的漢字字符習(xí)語時,操作者從多個漢字字符習(xí)語中選擇一個漢字字符習(xí)語,由此確定出與單個詞組片相對應(yīng)的單個漢字字符習(xí)語。
在上述漢字字符轉(zhuǎn)換裝置中,當相應(yīng)于上述詞組的一個漢字字符習(xí)語作為同音詞習(xí)記功能被確定時,構(gòu)成上述詞組的語音符號串及漢字字符習(xí)語就被確定并然后作為記憶信息被記錄在字典中。接著,當構(gòu)成同一語音符號串的另一詞組片如上地被輸入時,則已被在先確定及作為習(xí)記信息的這個漢字字符習(xí)語將作為第一對象被輸出。
例如,當“gong si”被作為語音符號串輸入到漢字字符轉(zhuǎn)換裝置中時,對字典檢索并輸出下述兩個漢字字符習(xí)語1、公司2、公私。
在此情況下,因為字典中第一個所述的漢字字符習(xí)語“公司”被優(yōu)先記錄,該漢字字符轉(zhuǎn)換裝置將首先輸出該漢字字符習(xí)語“公司”。
但是,當真正被輸入的漢字字符習(xí)語是另一漢字字符習(xí)語“公私”時,操作者將再指令輸出構(gòu)成該對象的漢字字符習(xí)語。然后,當該漢字字符習(xí)語“公私”被輸出時,輸入的漢字字符習(xí)語就確定為“公私”。
在此情況下,將漢字字符習(xí)語“公私”確認為對應(yīng)語音符號串“gong si”的優(yōu)先漢字字符習(xí)語的這個習(xí)記信息被記錄到字典中。
其結(jié)果是,當下一處理操作期間再次輸入語音符號串“gong si”時,該漢字字符習(xí)語“公私”將首先從漢字字符轉(zhuǎn)換裝置中被輸出。
然后,當要輸入的漢字字符習(xí)語是“公私”時,該習(xí)語“公私”可被直接地確定。因此,當相同的詞在同一文件中頻繁地使用時,就能提高轉(zhuǎn)換的效率。
應(yīng)該理解,語音符號串在上述漢字字符轉(zhuǎn)換裝置中被分成多個詞組片。當語音符號串在與所需詞組片分段位置不同的位置上被劃分時,則輸出與相應(yīng)詞組片對應(yīng)的漢字字符習(xí)語,操作者必須改變詞組片分段位置來重新開始轉(zhuǎn)換處理。
對于漢語發(fā)音,甚至當漢字用相同的字母符號(拼音)表達時,通過增加/減小發(fā)音間隔時間可使?jié)h字具有不同的意思,這些不同的意思具有不同的漢字字符。
作為結(jié)果,具有重音(音調(diào))符號的語音符號用來指示升/降發(fā)音間隔。
因而,如果字母語音符號與音調(diào)符號結(jié)合起來被輸入到漢字字符轉(zhuǎn)換裝置中,由于減少了相同發(fā)音詞(包括同音詞及同音字)則可增加漢字字符轉(zhuǎn)換效率。但是,在用鍵盤輸入具有音調(diào)符號的語音符號的情況下,將需要另一種輸入漢字語音符號的鍵盤,并且詞的輸入速度將會降低。
上述的漢字字符轉(zhuǎn)換方法是使用無音調(diào)符號的語音符號的例子。
還應(yīng)指出,上述漢字字符習(xí)語相當于與字典中記錄的單個語音符號串對應(yīng)的單個漢字字符串,但它不總是等于日文漢字字符習(xí)語。例如,當具有單個字符的漢字字符對應(yīng)于單個語音符號被記錄在字典中時,具有單個字符的該漢字字符變?yōu)橐粋€漢字字符習(xí)語。
另一方面,在漢語中具有用單個語音符號串指示的同音漢字字符習(xí)語。
這就是,由一個字符構(gòu)成的大量單個漢字字符習(xí)語已被記錄在上述漢字字符轉(zhuǎn)換裝置的字典中。相對于語音符號串的數(shù)目將具有大量的漢字字符習(xí)語數(shù),及記錄了大量的同音漢字字符習(xí)語。
相應(yīng)地,具有很多可能性,即當單個句子的相同語音符號串被輸入兩次時,甚至是相同的語音符號串,對應(yīng)于前一個語音符號串的漢字字符習(xí)語并不等于對應(yīng)于后一語音符號串的漢字字符習(xí)語。
因此,甚至當使用了上述同音詞習(xí)記功能,使得在轉(zhuǎn)換后一語音符號串時優(yōu)選輸出對前一語音符號串確定的漢字字符習(xí)語的情況下,優(yōu)先輸出的這個漢字字符習(xí)語在很多實例中是不能采用的。這將使由同音詞記憶功能獲得的轉(zhuǎn)換高效率的優(yōu)點受到損失。
如前所述,具有這樣一個問題,即,當特別對于具有大量字符的漢字字符習(xí)語確定詞組片分段位置,并然后改變詞組片分段位置,由此確定具有小數(shù)目字符的漢字字符習(xí)語時,該同音詞習(xí)記功能實質(zhì)上沒有起作用。
例如,現(xiàn)在假定輸入由語音符號串“yi zhi”指示的這個漢字字符習(xí)語“一只”,但它沒有被記錄在字典中。
另外,也假定相應(yīng)于另一個“yi zhi”的語音符號的具有兩個漢字字符的另一漢字字符習(xí)語“意志”被記錄在字典中。
在此情況下,當語音符號串“yi zhi”被輸入到漢字字符轉(zhuǎn)換裝置中時,由于具有兩個字符的漢字字符習(xí)語的處理比具有一個字符的漢字字符習(xí)語的處理具有更高的優(yōu)選權(quán),故語音符號串“yi zhi”被確認為單個詞組片,并然后將漢字字符習(xí)語“意志”作為對象漢字字符習(xí)語輸出。
現(xiàn)在,操作者將在一個漢字字符“意(yi)”及另一漢字字符“志(zhi)”之間確定詞組片分段位置。
然后,操作者從與語音符號“yi”對應(yīng)的對象漢字字符習(xí)語中選擇出一個漢字字符“一”,及從與語音符號“zhi”對應(yīng)的對象漢字字符中選擇出另一漢字字符“只”,由此確定出所需的漢字字符習(xí)語“一只”。
在此情況下,通過上述的同音詞記憶功能,對于語音符號“yi”,漢字字符習(xí)語“一”被設(shè)置成具有優(yōu)選權(quán)的漢字字符習(xí)語,而對于語音符號“zhi”,漢字字符習(xí)語“只”被設(shè)置成具有優(yōu)選權(quán)的漢字字符習(xí)語。
當語音符號串“yi zhi”被再次輸入時,由于具有兩個字符的漢字字符習(xí)語比單個字符的另一漢字字符習(xí)語更優(yōu)先地處理,故該語音符號串“yi zhi”被確認為單個詞組片,由此將輸出漢字字符習(xí)語“意志”作為對象漢字字符習(xí)語。相應(yīng)地,操作者必須再次改變詞組片分段位置。
其結(jié)果是,雖然同音詞習(xí)記功能對于在詞組片分段位置改變后,對應(yīng)于語音符號“yi”及“zhi”選擇漢字字符習(xí)語“一”及“只”時可以成為有效的,但詞組片分段位置改變的操作是不能省掉的。因而,在轉(zhuǎn)換效率上不能期望有大的改善。
在這種情況下,本發(fā)明的一個目的是通過以與單個詞組片相似的方式相對多個詞組片執(zhí)行同音詞習(xí)記功能來提高中文漢字字符轉(zhuǎn)換操作的轉(zhuǎn)換效率。
此外,在傳統(tǒng)的中文漢字字符轉(zhuǎn)換裝置中,當相應(yīng)于多個漢字字符習(xí)語組成的漢字字符串的語音字符串以分批處理方式被轉(zhuǎn)換時,該語音符號串被從其開頭(頂)部分被分成多個詞組片。在此情況下,將以這樣的方式來進行具有最大字符數(shù)的單個詞組片處理的處理操作,即使得構(gòu)成詞組片的漢字字符串的字符數(shù)(量)變?yōu)樽畲蟆?br>
對于具有最大字符數(shù)的單個詞組片處理的處理操作如下地執(zhí)行現(xiàn)在假定,用于“中國人民”的語音符號串“zhong guo ren min”被輸入到漢字字符輸入裝置中。
然后,如表1中所示的漢字字符習(xí)語被記錄在字典中表1語音符號 漢字字符表達zhong 中
zhong guo 中國zhong guo ren 中國人zhong guo ren min 中國人民在此情況下,當從字典中檢索一個漢字字符串時,它相當于具有上述語音符號串“zhong guoren min”中任何字符長度,這些漢字字符習(xí)語“中”,“中國”,“中國人”,“中國人民”均包括在檢索范圍中。
在此情況下,由于詞組片基于在具有與具有任意長度(字符數(shù))的輸入語音符號串的開頭部分相應(yīng)的漢字字符串中的最大字符數(shù)的漢字字符串被分段,故與漢字字符習(xí)語相對應(yīng)的語音字符串“zhong guoren min”被設(shè)置成單個詞組片。
然后,如果在字典中僅記錄了漢字字符習(xí)語“中國人民”作為與設(shè)置為單個詞組片的語音符號串“zhong guo ren min”相對應(yīng)的漢字字符串時,則輸出用于上述語音符號串的漢字字符習(xí)語“中國人民”。
如上所述,因為具有大量相同發(fā)音的漢字字符,在語音符號串被分成多個單漢字字符字以便轉(zhuǎn)換成漢字字符的情況下,在各劃分部分中將要輸出大量的對象漢字字符。因此,需要長時間的麻煩的轉(zhuǎn)換處理操作,以便能從同音的漢字字符中選出所需的漢字字符。
相應(yīng)地,如上所述,因為語音符號串被分成盡可能長的詞組片,相應(yīng)于每個劃分部分的漢字字符串的總數(shù)目將可大大地減少。因此,可以簡化對于選擇所需漢字字符串的處理操作并由此使用于轉(zhuǎn)換處理所需的時間減少。
應(yīng)該理解,在上述漢字字符轉(zhuǎn)換裝置中語音符號串被劃分成詞組片。當該語音符號串在不同于所需詞組片分段位置上被劃分及然后待被輸出的漢字字符串不包括在該轉(zhuǎn)換對象中的情況下,操作者則必需改變詞組片分段位置來重新開始轉(zhuǎn)換處理。
對于漢字發(fā)音,甚至當漢字用相同的字母符號(拼音)表達時,通過升/降發(fā)音間隔,該漢字可具有不同意思,而這些不同的意思擁有不同的漢字字符。
作為其結(jié)果,漢字的語音符號被設(shè)有重音(音調(diào))符號,用來指示升/降發(fā)音間隔。
因此,如果語音符號結(jié)合音調(diào)符號被輸入到漢字字符轉(zhuǎn)換裝置中,則漢字字符轉(zhuǎn)換效率將會提高,因為減少了同音詞(包括同音詞及同音字)。但是,在具有音調(diào)符號的語音符號被從鍵盤輸入的情況下,需要另一種用于輸入漢字語音字符的鍵盤,且詞的輸入速度將會降低。
上述的漢字字符轉(zhuǎn)換方法是使用無音調(diào)符號的語音符號的一個例子。
還應(yīng)指出,上述的漢字字符習(xí)語相當于與在字典中記錄的單個語音符號串相對應(yīng)的單個漢字字符串。例如,當具有單個字符的漢字字符對應(yīng)于單個語音符號被記錄在字典中時,該具有單個字符的漢字字符就成為漢字字符習(xí)語。
另一方面,在漢語中具有很多可能性在單個句子的開頭詞組片中,具有單個字符的漢字字符習(xí)語可作為主語(例如“我”,“他”),前置詞(例如“在”,“從”及“又”),否定詞(例如“不”),及修飾詞(例如“很”)出現(xiàn)。因而,具有許多的實例,其中輸入字符串的開頭詞組片是由單個字符構(gòu)成的。
但是,根據(jù)上述用于處理單個詞組的最大字符數(shù)的處理操作,輸入語音符號串的開頭詞組片的字符數(shù)是基于與在上述語音符號串的開頭部分相應(yīng)的漢字字符習(xí)語中最長的漢字字符習(xí)語來確定的。其結(jié)果是,具有大的可能性,即開頭詞組片擁有多于兩個的字符。
另一方面,根據(jù)中文語法,開頭詞組頻繁地由單個字符構(gòu)成。但是,因為具有某些可能性,即在傳統(tǒng)的中文漢字字符轉(zhuǎn)換裝置中開頭詞組片具有多于兩個的字符,故詞組片分段位置將會作得不正確。
換言之,當由多個詞組片構(gòu)成的語音符號串被輸入到該中文漢字字符轉(zhuǎn)換裝置中時,如上所述,將具有很大可能性,即詞組片分段以不正確的方式進行,因此在第一次轉(zhuǎn)換期間將輸出與要輸入的漢字字符串不同的漢字字符串。作為其結(jié)果,使轉(zhuǎn)換效率降低。
并且,如上所述,在該例中由于詞組片未正確地分段,輸出了與要輸入的漢字字符串不同的漢字字符串,甚至在字典中再嘗試了對應(yīng)于各詞組片的同音漢字字符串,仍具有一定的可能性,即所需漢字字符未包括在同音漢字字符串中。
在此情況下,如果在詞組片分段位置改變后未再執(zhí)行轉(zhuǎn)換操作,則字符輸入速度將會降低,因為要輸入的漢字字符串未能檢索到。
例如,假定相應(yīng)于一漢字字符習(xí)語的語音字符串“zai bu zhi bu jue zhong”被輸入到傳統(tǒng)的中文漢字轉(zhuǎn)換裝置中。
應(yīng)該指出,當詞組片分段位置用“”指示時,對于該漢字字符習(xí)語“在不知不覺中”的正確詞組片是在不知不覺中另外,現(xiàn)在假定,表示在表2中的漢字字符習(xí)語被記錄在字典中表2語音符號 漢字字符表達zai 在zai bu 再不根據(jù)該中文漢字字符轉(zhuǎn)換裝置的轉(zhuǎn)換操作,借助上述處理單個詞組片的最大字符數(shù)的處理操作來劃分第一詞組,該處理操作是基于具有已記錄在字典中相應(yīng)于語音符號串“zai bu zhi bu jue zhong”的開頭部分的任意字符數(shù)的漢字字符串中最大字符數(shù)的漢字字符進行的。
在此情況下,記錄了與語音符號串“zai buzhi bu jue zhong”的開頭部分相對應(yīng)的兩個漢字字符串“在”及“再不”。由于漢字字符串“再不”的字符數(shù)大于另一漢字字符串的字符數(shù),將對應(yīng)于漢字字符串“再不”的語音符號串“zaibu”確定為第一詞組片,因此構(gòu)成第一詞組片的第一對象的漢字字符串變?yōu)椤霸俨弧薄?br>
對于除第一詞組片以外的語音符號串,在劃分詞組片并然后根據(jù)上述的處理最大字符數(shù)的單個詞組片的處理操作輸出用于構(gòu)成每個詞組片第一對象的漢字字符串的情況下,例如,它將變成漢字字符串“再不支部絕種”。
應(yīng)該指出,該漢字字符串“再不支部絕種”的詞組片分段位置如下地給出再不支部絕種(zai buzhi bujue zhong)。
如前所述,如果第一詞組片分散位置作得不正確,則隨后的詞組片分段位置也變得不正確,于是,各詞組片的漢字字符串將不能正確地被轉(zhuǎn)換。
并且,具有某些可能性,即甚至當相應(yīng)于要輸入的漢字字符串的漢字字符串從構(gòu)成對于各詞組片的另外同音漢字字符詞的語音符號串的漢字字符串中檢索時,也不會檢索到所需的漢字字符串。
作為其結(jié)果,操作者必須使詞組片分段位置改變到正確的詞組片分段位置上并重新開始轉(zhuǎn)換操作。
因此,本發(fā)明的另一目的是在中文漢字字符轉(zhuǎn)換裝置中通過根據(jù)中文語法對輸入語音符號串詞組片的正確分段來提高漢字字符輸入轉(zhuǎn)換效率以及漢字字符的輸入速度。
從以下的說明中將會闡明本發(fā)明的各種特征。根據(jù)本發(fā)明的一個方面,提出一種用于中文漢字字符轉(zhuǎn)換裝置中的基于詞典將輸入語音符號串轉(zhuǎn)換成與它相對應(yīng)的漢字字符串的中文漢字字符轉(zhuǎn)換方法,該中文漢字字符轉(zhuǎn)換裝置包括輸入裝置,用于輸入指示漢字字符串發(fā)音的語音符號串;及詞典,用于在其中記錄語音符號串及與它對應(yīng)的漢字字符串,所述的轉(zhuǎn)換方法包括輸入步驟,用于輸入所述語音符號串;輸出步驟,用于根據(jù)所述輸入語音符號串檢索所述詞典并用于將所述輸入語音符號串轉(zhuǎn)換成相對每個詞組片的漢字字符串,由此輸出對象漢字串;指令步驟,用于指令詞組片分段位置的改變;轉(zhuǎn)換步驟,用于響應(yīng)改變指令來改變分段語音符號串用的詞組片分段位置,并基于改變的詞組片分段位置將所述語音符號串轉(zhuǎn)換成漢字字符串;記錄步驟,用于當發(fā)出了指令以確定轉(zhuǎn)換的漢字字符串時對應(yīng)于所述轉(zhuǎn)換漢字字符串及所述詞組片分段位置信息將所述輸入語音符號串記錄到所述詞典中;及再輸出步驟,用于當將記錄在所述詞典中的語音符號串輸出時,再次輸出與所述輸入語音符號串對應(yīng)的所述漢字字符串,作為對象漢字字符串。
根據(jù)本發(fā)明,當由多個詞組片構(gòu)成的漢字字符串被習(xí)記時,將不習(xí)記對應(yīng)于那些詞組片的漢字字符串,但可作為單個漢字字符串習(xí)記。作為其結(jié)果,當輸入語音符號串以轉(zhuǎn)換成由多個詞組片構(gòu)成的漢字字符串時,不再在每次執(zhí)行轉(zhuǎn)換時改變詞組片分段位置。因此,可提高漢字字符的轉(zhuǎn)換效率,并使?jié)h字字符輸入處理操作能快速地進行。
此外,根據(jù)本發(fā)明的另一方面,提出一種用于中文漢字字符轉(zhuǎn)換裝置中的基于詞典將輸入語音符號串轉(zhuǎn)換成與它相對應(yīng)的漢字字符串的中文漢字字符轉(zhuǎn)換方法,該中文漢字字符轉(zhuǎn)換裝置包括輸入裝置,用于輸入指示漢字字符串發(fā)音的語音符號串;及詞典,用于在其中記錄語音符號串及與它對應(yīng)的漢字字符串,所述轉(zhuǎn)換方法包括下列步驟輸入所述語音符號串;在離開頭部分的任意詞組片分段位置上將所述輸入語音符號串分段,從所述詞典中檢索對應(yīng)于分段語音符號串的第一漢字字符串,及從所述詞典中檢索與剩余語音符號串對應(yīng)的第二漢字字符串,該剩余語音符號串是從所述輸入語音符號串中減去與所述第一漢字字符串對應(yīng)的語音符號串部分獲得的;及當檢索到所述第一漢字字符串及所述第二漢字字符串之間的多個組合組時,以這樣的方式從所述多個組合組中選擇詞組片分段位置,即使得由所述第一字符符號串的字符數(shù)及由所述第二漢字字符串的字符數(shù)獲得的總字符數(shù)變得最大,及將基于選擇的詞組片分段位置轉(zhuǎn)換的第一及第二漢字字符的組合輸出,作為對象漢字字符串。
根據(jù)本發(fā)明,詞組的位置可以根據(jù)中文語法來正確地劃分。這就是根據(jù)中文語法,具有單個字符的漢字字符習(xí)語位于一個句子的第一詞組片將有大的可能性。作為其結(jié)果,在一個句子中其第一詞組片的字符數(shù)為單個字符時,該句子被錯誤地轉(zhuǎn)換成其中第一詞組片包含多于兩個字符的轉(zhuǎn)換字符串的可能性極小。因而,可以提高漢字字符的轉(zhuǎn)換效率,并且在轉(zhuǎn)換操作期間操作者不再需要改變詞組片分段位置。因此,漢字字符輸入處理操作能以高效率進行。
為了更好地理解本發(fā)明,將結(jié)合以下的附圖來進行詳細的說明,附圖為
圖1表示根據(jù)本發(fā)明第一優(yōu)選實施例的中文漢字字符轉(zhuǎn)換裝置的電路布置的概要框圖2概要地表示用于圖1的中文漢字字符轉(zhuǎn)換裝置中的一個工作存儲器7的存儲結(jié)構(gòu);圖3概要地表示用于圖1中的中文漢字字符轉(zhuǎn)換裝置中的一個習(xí)記詞典6的存儲結(jié)構(gòu);圖4是用于描述根據(jù)本發(fā)明第一優(yōu)選實施例的中文漢字字符轉(zhuǎn)換方法的操作的流程圖;圖5是用于解釋根據(jù)第一優(yōu)選實施例的中文漢字字符轉(zhuǎn)換方法的示意圖;圖6是用于解釋圖1的工作存儲器7中數(shù)據(jù)存儲狀態(tài)的示意圖;圖7是用于描述根據(jù)第一優(yōu)選實施例的另一中文漢字字符轉(zhuǎn)換操作的示意圖;圖8是用于描述圖1的工作存儲器7的數(shù)據(jù)存儲狀態(tài)的示意圖;圖9是表示根據(jù)本發(fā)明第二優(yōu)選實施例的中文漢字字符轉(zhuǎn)換裝置電路布置的概要框圖;圖10概要地表示用于圖9的中文漢字字符轉(zhuǎn)換裝置中的一個工作存儲器70的存儲結(jié)構(gòu);圖11是用于描述根據(jù)本發(fā)明第二優(yōu)選實施例的中文漢字字符轉(zhuǎn)換方法的操作的流程圖;圖12是用于解釋圖9的工作存儲器70中數(shù)據(jù)存儲狀態(tài)的示意圖;圖13是用于描述根據(jù)第二優(yōu)選實施例的另一中文漢字字符轉(zhuǎn)換操作的示意圖。
現(xiàn)在將參照圖1至8來對根據(jù)本發(fā)明第一優(yōu)選實施例的中文漢字字符轉(zhuǎn)換裝置及中文漢字字符轉(zhuǎn)換方法進行描述。
應(yīng)該理解,具有兩種型式的漢字字符,即,中文(漢字)字符及日文漢字字符,雖然這些字符起源相同,但彼此并不相同。
圖1概要地表示了根據(jù)本發(fā)明第一優(yōu)選實施例的中文漢字字符轉(zhuǎn)換裝置的結(jié)構(gòu)。應(yīng)該指出,該第一個中文漢字字符轉(zhuǎn)換裝置是組裝在例如一個計算機系統(tǒng)(例如,通用計算機系統(tǒng),文字處理機,計算機型排版系統(tǒng),及其它系統(tǒng))中,并通過例如能輸入ASCII碼的鍵盤的使用能將中文輸入到該計算機系統(tǒng)中。
如圖1所示,根據(jù)第一實施例的中文漢字字符轉(zhuǎn)換裝置由以下構(gòu)成能輸入中文字符的語音符號(拼音)的鍵輸入單元1,其語音符號由字母碼構(gòu)成;CPU(中央處理單元)2,用于將輸入的語音符號轉(zhuǎn)換成相對應(yīng)的中文漢字字符及輸出該中文漢字字符;顯示存儲器3,用于在其中存儲作為圖象數(shù)據(jù)(字體數(shù)據(jù))的字符形狀,例如語音符號及由CPU2得出的中文漢字字符;及打印單元5,用于打印輸出語音符號及由CPU2輸出的中文漢字字符。該中文漢字字符轉(zhuǎn)換裝置還包括一個外部存儲單元6,用于在其中存儲由CPU2輸出的數(shù)據(jù)及需要CPU2處理操作的數(shù)據(jù),例如上述中文漢字字符及語音符號的字體數(shù)據(jù);一個工作存儲器7,用于暫時存儲對于CPU2處理操作所需的數(shù)據(jù)及由CPU2得出的數(shù)據(jù);一個轉(zhuǎn)換詞典8,用于在其中記錄語音符號串及與語音符號串相對應(yīng)的漢字字符習(xí)語;及一個習(xí)記詞典9,用于當由CPU2轉(zhuǎn)換的中文漢字字符被確定時在其中記錄抽取的習(xí)記信息。
上述的鍵輸入單元1相當于通稱的“用于字母字符的鍵盤”。該鍵輸入單元1能輸入無重音(音調(diào))符號的中文漢字字符的語音符號(拼音)。
鍵輸入單元1上裝有“CONVERT”(轉(zhuǎn)換)鍵,“EXECUTE”(執(zhí)行)鍵,“←”鍵,“ESC”鍵及類似鍵,以便作出轉(zhuǎn)換指令,詞組片分段位置的改變指令,及確定指令。這就是,“CONVERT”鍵用于指令漢字字符轉(zhuǎn)換?!癊SC”鍵用于指令詞組片分段位置改變?!啊辨I是用于使詞組片分段位置向左側(cè)移動1個字符的鍵?!癊XECUTE”鍵是用于指令確定的鍵。工作存儲器7的存儲區(qū)工作存儲器7在其中暫時存儲對于將語音符號轉(zhuǎn)換成與它對應(yīng)的中文漢字字符所需的數(shù)據(jù),并具有如圖2中所示的存儲區(qū)域。
這就是,在該工作存儲器7中設(shè)置了一個輸入緩沖區(qū)IB,用于在其中存儲由鍵輸入單元1輸入的語音符號串;一個檢索語音符號區(qū)PY,用于在其中存儲對于在輸入的語音符號串中檢索轉(zhuǎn)換詞典8及習(xí)記詞典9所需的語音符號串部分;一個對象顯示信息區(qū)SC,用于在其中存儲待在顯示單元4上顯示的對象漢字字符串;及一個初始轉(zhuǎn)換對象信息區(qū)T1,用于在其中存儲初始轉(zhuǎn)換期間作為第一對象的漢字字符串。該工作存儲器7還包括初始轉(zhuǎn)換詞組片信息區(qū)W1,用于在其中存儲作為各詞組片字符數(shù)的漢字字符串的詞組片分段位置,它與在初始轉(zhuǎn)換期間輸入的語音符號串對應(yīng)地輸出;一個用于確定輸入的對象信息區(qū)T2,用于存儲確定的漢字字符串;及一個用于確定輸入的詞組片信息區(qū)域W2,用于在其中存儲作為各詞組的字符數(shù)的確定漢字字符串的詞組分段位置。
上述的轉(zhuǎn)換詞典8是一個用于轉(zhuǎn)換漢字字符的通用類型的詞典,在該轉(zhuǎn)換詞典8中,作為漢字字符習(xí)語記錄了在中文中以一定高的頻繁率使用的漢字字符串,并還記錄了相應(yīng)于記錄的漢字字符習(xí)語并用于讀該漢字字符習(xí)語的語音(拼音)符號串。
然后,可從語音符號串來檢索出漢字字符習(xí)語。應(yīng)該理解,在該第一實施例中,上述漢字字符串及漢字字符習(xí)語包含由一個字符構(gòu)成的漢字字符。
換句話說,作為單漢字字符串(漢字字符習(xí)語),由一個字符構(gòu)成的漢字字符也被記錄在上述轉(zhuǎn)換詞典中。習(xí)記詞典9的存儲區(qū)如圖3中所示,在上述習(xí)記詞典9中,對于每個這些待被記錄在其中的漢字字符串記錄了語音符號(串),漢字字符注解,詞組信息及另外信息。
由字母表示但不包含重音(音調(diào)符號)的語音符號被記錄在其中作為上述語音符號。
與工作存儲器7的初始詞組信息區(qū)域W1及用于確定輸入的詞組片信息區(qū)域W2相類似,將記錄的漢字字符串的詞組片分段位置作為每個詞組片中的字符數(shù)記錄在上述詞組信息中。
例如,由一個詞組片構(gòu)成具有兩個字符的漢字字符習(xí)語的情況下,該詞組片信息被置成“2”。在由兩個詞組片構(gòu)成具有兩組單個字符的漢字字符串(漢字字符習(xí)語)的另一情況下,該詞組片信息被置成“1,1”。在一個漢字字符串中,在具有一個字符的一個詞組片后跟隨著具有兩個字符的一個詞組片,該詞組片信息被置成“1,2”。
正如下面將描述的,CPU2基于由鍵輸入單元1輸入的語音符號串檢索轉(zhuǎn)換字典8及習(xí)記字典9,以便將語音符號串轉(zhuǎn)換成漢字字符串。并且,當轉(zhuǎn)換的漢字字符串被確認時CPU2抽取習(xí)記信息,并由此將抽取的習(xí)記信息記錄到習(xí)記詞典9中。第一轉(zhuǎn)換方法接下來,現(xiàn)在將對由上述中文漢字字符轉(zhuǎn)換裝置執(zhí)行的中文漢字字符轉(zhuǎn)換方法進行說明。
在圖4中表示了用于解釋根據(jù)該第一實施例的中文漢字字符轉(zhuǎn)換方法的流程圖。這就是,在該實施例中,該中文漢字字符轉(zhuǎn)換方法是由一個漢字字符轉(zhuǎn)換方法及另一個分批習(xí)記方法構(gòu)成的,漢字字符轉(zhuǎn)換方法用于將語音符號(拼音)轉(zhuǎn)換成與它對應(yīng)漢字字符并用于輸出該漢字字符,分批習(xí)記方法用于以分批方式習(xí)記對于同音詞的多個詞組片。應(yīng)該指出,“同音詞”意指“同音詞”及“同音字”。
在該中文漢字字符轉(zhuǎn)換方法中,首先,從鍵輸入單元1輸入指示要輸入的具有任意字符數(shù)的漢字字符串讀音的語音符號串(步驟S1)。
在此情況下,如圖5A所示,將作為中文漢字串“工死”的語音符號串“gong si”輸入。
由鍵輸入單元1輸入的該語音符號串被存儲在圖6A中所示的輸入緩沖區(qū)IB中。
輸入的語音符號串的第一詞組片部分被存儲在工作存儲器7的檢索語音符號區(qū)PY中。
在此階段,因為輸入的語音符號串還未被分成多個詞組片,輸入語音符號串的輸入部分,即“gongsi”被直接地存儲。
存儲在輸入緩沖器IB中的該語音符號串的字形信息再存儲到顯示存儲器3中,然后顯示在顯示單元4上,如圖5A中所示。
應(yīng)該指出,在圖5中矩形框中的內(nèi)容表示在顯示單元4中顯示屏上的顯示內(nèi)容。
接著,如圖5B中所示,通過操作“CONVERT”鍵基于存儲在檢索語音符號區(qū)PY中的語音符號串來檢索轉(zhuǎn)換詞典8及習(xí)記詞典9,使得用于檢出與該語音符號串對應(yīng)的漢字字符習(xí)語的漢字字符轉(zhuǎn)換處理被執(zhí)行(步驟S2)。
還應(yīng)指出,在轉(zhuǎn)換詞典8及習(xí)記詞典9中未記錄與整個語音符號串相對應(yīng)的漢字字符習(xí)語的情況下,將檢索與具有語音符號串中任意字符數(shù)的開始部分相對應(yīng)的另一漢字字符習(xí)語。
在此時,當檢索到多個具有不同字符數(shù)的漢字字符習(xí)語時,將優(yōu)先地檢索出具有較大字符數(shù)的漢字字符。然后,與具有上述語音符號串的較大字符數(shù)的漢字字符習(xí)語相對應(yīng)的部分,當其優(yōu)先地被檢索出來時,將作為單個詞組片來處理。
對于從上述語音符號串中除去上述設(shè)定的詞組片(開頭部分)的剩余語音符號串再執(zhí)行從轉(zhuǎn)換詞典8的上述檢索操作。
并且,在該檢索操作中,當沒有在轉(zhuǎn)換詞典中記錄相應(yīng)于剩余語音符號串整個部分的漢字字符習(xí)語時,將如前所述地,檢索與語音符號串中具有任意字符數(shù)的開頭部分相對應(yīng)的漢字字符習(xí)語,并由此將與該檢索的漢字字符對應(yīng)的部分識別為單個詞組片。
此外,當在該語音符號串中具有另一剩余部分時,重復(fù)地執(zhí)行上述處理操作,以使得該語音符號串被劃分成多個詞組片,然后由對應(yīng)于多個這些詞組片的第一對象組成的漢字字符習(xí)語就被檢索出來。
應(yīng)該理解,在上述漢字轉(zhuǎn)換處理中使用了存儲在習(xí)記詞典9中的習(xí)記信息(步驟S2a),以下將討論使用習(xí)記信息的漢字字符轉(zhuǎn)換處理。
然后,將由用于構(gòu)成對各詞組片檢索的第一對象的漢字字符所組成的漢字字符串存儲到圖6A的對象顯示信息區(qū)SC中。
在此例中,中文語音符號串“gongsi”被識別為單個詞組片,由記錄在轉(zhuǎn)換詞典8或習(xí)記詞典9中的漢字字符習(xí)語中檢索出與該中文語音符號串“gongsi”相對應(yīng)的漢字字符串的第一對象“公私”,并將該檢索出的第一對象存儲在對象顯示信息區(qū)SC中。
應(yīng)該指出,當相對同一語音符號串的漢字字符串被記錄在轉(zhuǎn)換詞典8及習(xí)記詞典9中時,記錄在習(xí)記詞典9中的漢字字符串將優(yōu)先作為第一對象被使用。
另外,應(yīng)該指出,當多個漢字字符串被記錄在轉(zhuǎn)換詞典8或習(xí)記詞典中時,具有第一(最高)優(yōu)先權(quán)的漢字字符串被識別為第一對象。
然后,將第一對象的漢字字符串,即關(guān)于初始轉(zhuǎn)換對象的信息存儲到初始轉(zhuǎn)換對象信息區(qū)T1中(步驟S3) 。
在此情況下,如圖6A中所示,漢字字符串“公私”被存儲在初始轉(zhuǎn)換信息區(qū)T1中。
包含在記錄于初始轉(zhuǎn)換對象信息區(qū)T1中的漢字字符串內(nèi)的各詞組片的字符數(shù)隨后被記錄到初始轉(zhuǎn)換詞組信息區(qū)W1中。
還應(yīng)指出,記錄在初始轉(zhuǎn)換對象信息區(qū)中的漢字字符串并非與確定的漢字字符串相一致(將解釋于后),習(xí)記信息將被記錄(將描述于后)。
然后,如圖5B中所示,存儲在對象顯示信息區(qū)域SC中的漢字字符串“公私”被顯示在顯示單元4上(步驟S4)。
在此情況下,因為漢字字符串“公私”代替了另一要輸入的漢字字符串“工死”被顯示出來,故操作者再次操作“CONVERT”鍵(步驟S5)以便確認所需的中文漢字字符串“工死”是否被作為用于構(gòu)成記錄在轉(zhuǎn)換詞典8中的對象漢字字符串“工死”的漢字字符習(xí)語被輸出。
換言之,操作者通過操作“CONVERT”鍵并由此輸出構(gòu)成接在第一對象后的另一對象的漢字字符習(xí)語來確認所需的中文漢字字符串“工死”是否包含在作為中文語音符號串“gongsi”記錄在轉(zhuǎn)換詞典8中的漢字字符習(xí)語內(nèi)。
假定在此例中,中文漢字字符串“工死”未作為中文語音符號串“gongsi”的對象被記錄在轉(zhuǎn)換詞典8及習(xí)記詞典9中。
接著,操作者識別將要構(gòu)成對象的顯示漢字字符習(xí)語,由此確定是否要執(zhí)行輸入處理。這就是,操作者在顯示了選擇漢字字符習(xí)語的情況下判斷是否要按“EXECUTE”鍵(步驟S6)。在該步驟上,因為漢字字符串“工死”沒有顯示出來,則不要執(zhí)行輸入處理操作。
然后,改變詞組片分段位置作為另一處理操作(步驟S7)。
應(yīng)該理解,當沒有執(zhí)行確定輸入處理操作時,改變語音符號串作為另一處理操作,并然后使處理操作返回到步驟S2,在該步驟上執(zhí)行漢字字符轉(zhuǎn)換處理。
在此情況下,建立了這一狀態(tài),即語音符號串“gongsi”已被轉(zhuǎn)換成一個漢字字符習(xí)語,即作為單詞組片。如圖5C中所示,在該實施例中,通過操作“ESC”鍵及表示詞組片改變的鍵“←”使詞組片分段位置移動到一個漢字字符“公”及另一漢字字符“私”之間。
接著,將轉(zhuǎn)換處理操作返回到步驟S5,在該步驟上操作者操作“CONVERT”鍵,以便在如圖5D中所示的相應(yīng)于第一詞組片的漢字字符“公”被指定的情況下再執(zhí)行漢字字符轉(zhuǎn)換。
在此情況下,如圖6B中所示,存儲在工作存儲器7的檢索語音符號區(qū)PY中的語音符號串“gongsi”被更新為另一語音符號串“gong”,它構(gòu)成第一詞組片的語音符號串,然后從轉(zhuǎn)換詞典8及習(xí)記詞典9中檢索與該語音符號串“gong”相對應(yīng)的漢字字符習(xí)語。
然后,當漢字字符“工”相對于該語音符號串“gong”被檢索出來時,一個新的漢字字符串“工私”代替上一個漢字字符串“公私”被存儲在對象顯示信息區(qū)SC中。
接著,如圖5D中所示,存儲在對象顯示信息區(qū)SC中的漢字字符串“工私”被顯示在顯示單元4上。
應(yīng)該理解,當漢字字符“工”沒有作為相對于語音符號串“gong”的第一對象被檢索時,將再次操作“CONVERT”鍵,以便檢索已在轉(zhuǎn)換詞典8或習(xí)記詞典9中相對于該語音字符串“gong”記錄的漢字字符“工”。
因為想輸入的漢字字符串“工死”在此階段還未顯示出來,將不執(zhí)行確定處理。作為另一處理操作,相應(yīng)于顯示漢字字符串“工私”中的第二詞組片的漢字字符“私”被指定,然后操作“CONVERT”鍵再執(zhí)行漢字字符轉(zhuǎn)換操作,如圖5E中所示。
在此情況下,如圖6C中所示,存儲在工作存儲器7的檢索語音符號PY中的語音符號串“gong”被更新成另一語音符號串“si”,它構(gòu)成了第二詞組片的語音符號串,然后從轉(zhuǎn)換詞典8及習(xí)記詞典9中檢索與該語音符號串“si”相對應(yīng)的漢字字符習(xí)語。
接著,類似于上述漢字字符“工”的情況,當漢字字符“死”相對該語音符號串“si”被檢索出來時,一個新的漢字字符串“工死”便替代了上一漢字字符串“工私”被存儲到對象顯示信息區(qū)SC中。
然后,如圖5 E中所示,存儲在對象顯示信息區(qū)SC中的漢字字符串“工死”被顯示在顯示單元4上。
現(xiàn)在,因為想輸入的漢字字符串“工死”已顯示在顯示單元4上-如圖5 F所示,故通過操作“EXECUTE”鍵來確定漢字字符串“工死”,并由此執(zhí)行確定輸入處理(步驟S8)。
在此情況下,如圖6C中所示,相應(yīng)于對于語音符號串“gong si”確定的漢字字符串的該漢字字符串“工死”可被存儲在工作存儲器7的用于確定輸入的對象信息區(qū)域T2中(步驟S9)。
并且,對于確定的漢字字符串的各個詞組片的字符數(shù)被存儲到用于確定輸入的詞組片信息區(qū)W2中。在漢字字符串“工死”的情況下,具有兩個單字符的詞組片,即一個詞組片“工”及另一詞組片“死”,因此如圖5F中所示,可確定出漢字字符串“工死”。相應(yīng)地,如圖6C中所示,“1”及“1”被存儲到用于確定輸入的詞組片信息區(qū)W2中。習(xí)記處理接著將執(zhí)行圖4中所示的上述流程圖的步驟S10至步驟S14所規(guī)定的習(xí)記處理操作。
首先,在步驟S10上,基于已被記錄在初始轉(zhuǎn)換對象區(qū)T1及初始轉(zhuǎn)換詞組片信息區(qū)W1中的漢字字符串及各個詞組片的字符數(shù)來得到在初始轉(zhuǎn)換操作期間漢字字符串的詞組片分段位置。
在此情況下,記錄的漢字字符串是“公私”,它是一個具有字符數(shù)“2”的單詞組片。
基于已被記錄在用于確定輸入的對象區(qū)T2及用于確定輸入的詞組片信息區(qū)W2中的漢字字符串及各個詞組片的字符數(shù)來得到確定漢字字符串的另一詞組片分割位置。
在此情況下,確定的漢字字符串是“工死”,并具有兩個各具有字符數(shù)“1”的詞組片。
換句話說,在詞組片分段位置由符號“”指示的情況下,在初始轉(zhuǎn)換及確定輸入期間詞組片的序列位置給出如下公私工私然后,將在初始轉(zhuǎn)換期間及確定輸入期間公用的詞組片分段位置用作為公共詞組片分段位置。
在上述兩個漢字字符串“公私”和“工死”中,在第一字符前的位置,及在第二字符后的位置構(gòu)成了公共詞組片分段位置。
簡言之,對于在上述步驟S10上規(guī)定的處理操作現(xiàn)在可用更通用的方式來描述。
首先,現(xiàn)在假定作為語言符號串的“------”被存儲在工作存儲器7的輸入緩沖器(未詳細表示)中;“ABCDEFGHIJKL”被存儲在初始轉(zhuǎn)換對象信息區(qū)T1中;“2,2,3,5”被存儲在初始轉(zhuǎn)換詞組片信息區(qū)W1中;“AMNOPQRSTUVW”被存在用于確定輸入的對象信息區(qū)T2中;“2,3,2,3,2”被存儲在用于確定輸入的詞組片信息區(qū)W2中。
還假定,符號“-”表示一個語音符號,一個大寫的字母代表一個中文漢字字符。在此情況下,當詞組片分段位置由“”表示時,存儲在工作存儲器7中的各信息可表示如下在初始轉(zhuǎn)換期為ABCDEFGHIJKL在確定輸入期間為AMNOPQRSTUVW公共分段位置則為
在此情況下,當在上述詞組片分段位置中,在初始轉(zhuǎn)換期間的詞組片分段位置與在確定輸入期間的詞組片分段位置相一致時,這些詞組片分段位置被識別為公共分段位置。
然后,在初始轉(zhuǎn)換期間的漢字字符串及在確定輸入期間的漢字字符串以上述的公共分段位置被劃分。對于在初始轉(zhuǎn)換期間及確定輸入期間的這些分段位置是否彼此一致將作出判斷。該判斷是從開頭分割位置順序地進行的(步驟S11)。
在上述語音符號串“gong si”的情況下,漢字字符串“公私”對應(yīng)于初始轉(zhuǎn)換期間的分段位置,而漢字字符串“工死”對應(yīng)于在確定輸入期間的分段位置,因此這些分段位置不能作到彼此相一致。
然后,當初始轉(zhuǎn)換期間的分段位置與確定輸入期間的分段位置不相一致時(步驟S12),將確定期間的詞組片分段位置作為習(xí)記信息記錄到習(xí)記詞典9中,并給出它們的對應(yīng)關(guān)系(步驟S13)。
在初始轉(zhuǎn)換期間的公共分段部分作到與確定輸入期間的公共分割部分相一致時,則作出判斷,看是否具有后繼的分割部分,即剩余數(shù)據(jù)(步驟S14)。當判斷出該剩余部分存在時,處理操作返回到步驟S12。
然后,對于所有的輸入語音符號串的公共分段部分,對初始轉(zhuǎn)換期間的漢字字符串與確定輸入期間的漢字字符串是否相一致作出判斷。當這些漢字字符串作到彼此相一致時,處理操作就在確定輸入期間的語音符號串、漢字字符串及上述公共分割部分的詞組片分割位置的情況下被執(zhí)行。
應(yīng)該理解,如圖3中所示,語音符號串(語音符號),漢字字符串(漢字字符表示),及詞組片分段位置(詞組片信息)以彼此相對應(yīng)的關(guān)系被記錄到習(xí)記詞典9中。
這就是,對于關(guān)于上述漢字字符串“工死”情況的習(xí)記信息,“gong si”被記錄為語音符號串。“工死”被記錄為漢字字符串及“1,1”被記錄為詞組片分段位置。
并且,在對習(xí)記詞典9的記錄處理操作中,例如,在初始轉(zhuǎn)換期間語音符號串“gong si”被轉(zhuǎn)換成漢字字符串“公私”。然后,由操作者再執(zhí)行轉(zhuǎn)換。在相應(yīng)于該語音符號串“gong si”的另一同音漢字字符習(xí)語、例如“公司”被選擇并然后確定輸出該選擇的漢字字符習(xí)語時,“gong si”將作為語音符號串、“公司”將作為漢字字符串、及“2”將作為詞組片分段位置被記錄到習(xí)記詞典9中。
在此情況下,同音詞的習(xí)記是以與現(xiàn)有技術(shù)相同的方式進行的。
換句話說,根據(jù)該第一實施例,同音詞的習(xí)記是類似于傳統(tǒng)習(xí)記方式進行的。類似于上述漢字字符串“工死”,由多個詞組片構(gòu)成的漢字字符串用與由單詞組片構(gòu)成的漢字字符習(xí)語相類似的方式來記錄,并且也記錄詞組片的分段位置。
如圖5G中所示,當“gong si”作為語音符號串被再次地輸入到根據(jù)該第一實施例的中文漢字字符轉(zhuǎn)換裝置中時(步驟S1),當漢字字符轉(zhuǎn)換處理在步驟S2上被執(zhí)行時,就利用了習(xí)記詞典9中的習(xí)記信息(步驟S2a)。
換言之,從習(xí)記詞典9中檢索出語音符號串“gong si”,因此在漢字字符轉(zhuǎn)換處理時就檢索出漢字字符串“工死”及詞組片分段位置“1,1”兩者。
然后,如圖5H中所示,記錄在習(xí)記詞典9中具有兩個字符的漢字字符串“工死”以最高優(yōu)先權(quán)顯示,而不是顯示記錄在轉(zhuǎn)換詞典8中的具有兩個字符的漢字字符習(xí)語如“公私”。并且,詞組片分段位置是設(shè)置在一個漢字字符“工”及另一個漢字字符“死”之間。
作為其結(jié)果,就可以避免在傳統(tǒng)漢字字符轉(zhuǎn)換裝置中出現(xiàn)的這樣一種問題,這就是,在傳統(tǒng)上,一個漢字字符“工”及另一漢字字符“死”被同音詞習(xí)記分開地處理。因為當語音符號串“gong si”被再次輸入時,漢字字符串“工死”未被同音詞習(xí)記處理,而是一個語音符號“gong (工)”及另一語音符號“Si(死)”被記錄在習(xí)記詞典中。然后,甚至當可以相對于語音符號“gong”檢索出漢字字符“工”時,由于轉(zhuǎn)換詞典的語音符號串“gong si(公私)”比語音符號“gong”長,故將輸出記錄在轉(zhuǎn)換詞典8中的相對于語音符號串“gong si”的第一對象的漢字字符串“公私”。
應(yīng)該理解,由于詞組片分段位置也在上述的處理操作中被存儲,如果操作者再執(zhí)行漢字字符轉(zhuǎn)換時,則對關(guān)于一個指定語音符號“gong”或是另一指定語音符號“si”的同音漢字字符習(xí)語再次進行轉(zhuǎn)換。其結(jié)果是,在僅是這些指定語音符號中的一個要被轉(zhuǎn)換的情況下或是在與轉(zhuǎn)換詞典8中語音符號“gong si”對應(yīng)的具有兩字符的漢字字符習(xí)語中沒有漢字字符要被輸入的情況下,可以提高轉(zhuǎn)換效率。其它語音符號串接下來,現(xiàn)在將對圖7及圖8中所示的另外語音符號串作出說明。
首先,如圖7 A中所示,對應(yīng)于漢字字符串“不懂事”的語音符號串“budong shi”被輸入到根據(jù)該第一實施例的中文漢字字符轉(zhuǎn)換裝置中。
應(yīng)該理解,雖然包括在中文漢字字符串“不懂事”中的中文漢字字符“懂”,如圖7F中所示地實際具有日文漢字字符的“忄”部分,但由于沒有與它相對應(yīng)的(日文)漢字字符,故在該說明書中使用該漢字字符“懂”。
在此情況下,如圖8A中所示,該語音符號串“bu dong shi”被存儲在工作存儲器7的輸入緩沖區(qū)IB中。
如圖8B中所示,當按鍵“CONVERT”時,從轉(zhuǎn)換詞典8及習(xí)記詞典9中檢索語音符號串“bu dong shi”。
在此實施例中,從語音符號串“bu dong shi”的開頭部分中優(yōu)先檢索與具有較大漢字字符數(shù)的漢字字符習(xí)語相對應(yīng)的部分。
在此情況下,假定相應(yīng)于語音符號串“bu dong shi”的漢字字符習(xí)語既未記錄在轉(zhuǎn)換詞典8中也未記錄在習(xí)記詞典9中。然后,再假定,起到對于語音符號串“bu dong”的第一對象作用的漢字字符串“不動”已被記錄在轉(zhuǎn)換詞典8及習(xí)記詞典9中,作為在包括語音符號串“bu dong shi”的開頭部分及具有任意字符數(shù)的這些漢字字符串中具有最大字數(shù)的漢字字符串。
在此情況下,語音符號串“bu dong”被存儲在工作存儲器7的檢索語音符號區(qū)P Y中,并然后檢索出漢字字符串“不動”。
還假定,作為與剩余的語音符號串“Shi”相對應(yīng)的漢字字符習(xí)語的第一對象,從轉(zhuǎn)換詞典8或習(xí)記詞典9中檢索出漢字字符“是”。
在此情況下,漢字字符習(xí)語“不動是”被存儲在對象顯示信息區(qū)SC中,并且在顯示單元4上顯示該漢字字符習(xí)語“不動是”,如圖7B中所示。
上述漢字字符習(xí)語“不動是”也存儲在初始轉(zhuǎn)換對象信息區(qū)+1中,及指示詞組片分段位置的“2,1”存儲在初始轉(zhuǎn)換詞組片信息區(qū)W1中。
接著,因為在初始轉(zhuǎn)換期間的詞組片分段位置不對,操作者操作“ESC”鍵,以使從當前方式改變到詞組片分段位置改變方式,如圖7C中所示。并且然后操作箭頭鍵,使得詞組片分段位置設(shè)置在一個漢字字符“不(bu)”及另一漢字字符“動是(dong shi)”之間。
然后,因為漢字字符“不”的詞組片是與待輸入的漢字字符串相一致的,則在指定漢字字符“不”的狀態(tài)下操作“EXECUTE”鍵,以便如圖7D所示地確定漢字字符“不”。
接著,如圖7 E中所示,在漢字字符習(xí)語“動是”被指定的狀態(tài)下操作“CONVERT”鍵,則再執(zhí)行如圖7E所示的轉(zhuǎn)換。
在此情況下,如圖8B中所示,語音符號串“dong shi”被存儲在檢索語音符號區(qū)PY中,并也是從轉(zhuǎn)換詞典8及習(xí)記詞典9中進行檢索。
然后,假定漢字字符習(xí)語“懂事”作為對于語音符號串“dong shi”的第一對象被檢索出來。
如圖8B中所示,在此情況下,由上述漢字字符“不”及習(xí)語“懂事”組成的組合漢字字符習(xí)語“不懂事”被存儲在對象顯示信息區(qū)SC中,并使得該組合漢字字符習(xí)語“不懂事”被顯示在顯示單元4上。
然后,如圖7F所示,當操作“EXECUTE”鍵時,漢字字符習(xí)語“懂事”被確定,以使得它可與在先確定的漢字字符“不”相結(jié)合確定要輸入的組合漢字字符習(xí)語“不懂事”。
在此情況下,如圖8C中所示,漢字字符習(xí)語“不懂事”被存儲在用于確定輸入的對象信息區(qū)T2中,及隨后由字符數(shù)指示詞組片分段位置的“1,2”被存儲在用于確定輸入的詞組片信息區(qū)W2中。
現(xiàn)在,當將在初始轉(zhuǎn)換期間的數(shù)據(jù)與在確定輸入期間的數(shù)據(jù)相比較時,可得到如下的結(jié)果不動是不 懂事在此情況下,由于上述公共分段部分相當于整個語音符號串“bu dong shi”,習(xí)記信息由“budong shi”給出作為語音符號串,“不懂事”給出作為漢字字符串及“1,2”給出作為詞組片分段位置。這些被記錄在圖3中所示的習(xí)記詞典9中。
接著,如圖7G所示,當再次輸入語音符號串“bu dong shi”時,漢字字符串“不懂事”及詞組片分段位置“1,2”將作為記錄在習(xí)記詞典9中的習(xí)記信息被檢測出來。如圖7H中所示,漢字字符串“不懂事”通過初始轉(zhuǎn)換就顯示出來。
在此情況下,詞組片分段位置被設(shè)置在漢字字符“不”及漢字字符串“懂事”之間。
換言之,類似于上述漢字字符串“工死”,由多個詞組片構(gòu)成的該漢字字符串“不懂事”是通過同音詞習(xí)記來處理的,然后該漢字字符串“不懂事”將構(gòu)成語音字符串“bu dong shi”的第一對象,并保留了多個詞組片。
在此情況下,因為具有較大字符數(shù)的對象通常以最高優(yōu)先權(quán)被轉(zhuǎn)換,如果在轉(zhuǎn)換詞典8或習(xí)記詞典9中記錄了漢字字符串“不動(bu dong)”則詞組片分段位置將設(shè)置在第二字符及第三字符之間。如前所述,當另一漢字字符串“不懂事(bu dong shi)”已記錄在習(xí)記詞典9中時,該漢字符串將以最高優(yōu)先權(quán)顯示,及它的詞組片分段位置將如前所述,因為具有大數(shù)目的字符且該漢字字符串已被記錄在習(xí)記詞典9中了。
如上所述,根據(jù)該中文漢字字符轉(zhuǎn)換裝置及中文漢字字符轉(zhuǎn)換方法,在詞組片分段位置未改變的詞組片部分中,或是當初始轉(zhuǎn)換及確定輸入期間詞組片分段位置彼此相一致時,記錄在習(xí)記詞典9中的漢字字符串將以最高優(yōu)先權(quán)被轉(zhuǎn)換。其結(jié)果是,可以獲得類似于傳統(tǒng)同音詞習(xí)記的優(yōu)點。
當在初始轉(zhuǎn)換期間詞組片位置變化時,如前所述,因為包含在公共分段部分中的多個詞組片在多個這些詞組片組合的狀態(tài)下被記錄在習(xí)記詞典中,因此由多個詞組片構(gòu)成的漢字字符串可被作為單漢字字符習(xí)語來被檢索。
相應(yīng)地,現(xiàn)在假定,當任意語音符號串被轉(zhuǎn)換時具有大字符數(shù)的漢字字符串優(yōu)先被轉(zhuǎn)換,在當初始轉(zhuǎn)換期間由單詞組片構(gòu)成的轉(zhuǎn)換漢字字符被轉(zhuǎn)換成由多個詞組片及剛述的漢字字符串組成的漢字字符串的情況下,則通過類似于由單詞組片構(gòu)成的漢字字符串的同音詞習(xí)記方式處理多個詞組片構(gòu)成的漢字字符串。當在第二語音符號串后輸入類似的語音符號串時,由多個詞組片構(gòu)成的漢字字符串以最高優(yōu)先權(quán)被轉(zhuǎn)換而不具有傳統(tǒng)的問題。這就是,在現(xiàn)有技術(shù)中,由大字符數(shù)詞組片構(gòu)成的漢字字符串以最高優(yōu)先權(quán)被轉(zhuǎn)換及然后在初始轉(zhuǎn)換期間該漢字字符串被用作第一對象。
并且,該處理操作可作為一種未知詞(即未記錄在詞典中的漢字字符)記錄操作來執(zhí)行。換言之,初始被轉(zhuǎn)換的要輸入的未知詞的語音符號串被分成多個詞組片,以便由單字符的單漢字字符習(xí)語來重建還未記錄在字典中的漢字字符習(xí)語。在各個詞組片中進行再轉(zhuǎn)換,以便選擇漢字字符。相應(yīng)地,在類似于上述未知詞的漢字字符串被確定及輸出的情況下,首先被輸入的語音符號串及上述未知詞的漢字字符串被記錄在習(xí)記詞典9中。
作為其結(jié)果,當上述語音符號串被再次輸入時,未記錄在轉(zhuǎn)換詞典8中的未知詞可通過基于習(xí)記詞典9的一次轉(zhuǎn)換被輸入。
類似于上述關(guān)于漢字字符串“不動是”及“不懂事”的情況,當詞組片分段位置改變時,該詞組片分段位置的改變已被習(xí)記,而不用重新設(shè)置詞組片分段位置。在上述否定詞的漢字字符“不”位于第一字符的情況下,將通過在曾已確定/輸入的漢字符串中的漢字符部分來劃分詞組片。其結(jié)果是,可能得到符合中文語法的更好的漢字字符轉(zhuǎn)換。第一實施例的優(yōu)點如前面詳細描述的,在根據(jù)該第一實施例的中文漢字字符轉(zhuǎn)換裝置及中文漢字符轉(zhuǎn)換方法中,當詞組片的分段包括在確定的漢字字符串中時,能夠通過詞組片分段位置習(xí)記來處理多個詞組片,并且對上述未知詞的習(xí)記可通過與單詞組片類似方式的同音詞習(xí)記來處理。同時,該轉(zhuǎn)換裝置設(shè)置了習(xí)記詞組片分段位置的功能。作為其結(jié)果,可以提高轉(zhuǎn)換效率。
尤其是,因為多個詞組片通過同音詞習(xí)記被分批地處理,該習(xí)記方法類似于基于成功詞組串之間的交叉關(guān)系的一種分析,而不分析詞組片單元中的漢字字符串。作為其結(jié)果,可顯著地提高轉(zhuǎn)換效率。
應(yīng)該指出,雖然在上述實施例中使用了無音調(diào)符號的語音符號,但作為替換,也可使用具有音調(diào)符號的語音符號。第二中文漢字字符轉(zhuǎn)換裝置的結(jié)構(gòu)現(xiàn)在參照圖9至13,將對根據(jù)本發(fā)明第二優(yōu)選實施例的中文漢字字符轉(zhuǎn)換裝置及中文漢字字符轉(zhuǎn)換方法進行說明。
圖9概要地表示根據(jù)本發(fā)明第二優(yōu)選實施例的中文漢字字符轉(zhuǎn)換裝置的結(jié)構(gòu)。應(yīng)該指示,該第二中文漢字字符轉(zhuǎn)換裝置是組裝在例如一個計算機系統(tǒng)(例如,通用型計算機系統(tǒng),文字處理機,計算機型排版系統(tǒng),及其它系統(tǒng))中的,并通過例如能輸入ASCII碼的鍵盤的使用能將中文輸入到該計算機系統(tǒng)中。
如圖9中所示,根據(jù)第二實施例的中文漢字字符轉(zhuǎn)換裝置由以下構(gòu)成能輸入中文文字的語音符號(拼音)的鍵輸入單元10,其語音符號由字母碼構(gòu)成;CPU(中央處理單元)20,用于將輸入的語音符號轉(zhuǎn)換成相對應(yīng)的中文漢字字符及輸出該中文漢字字符;顯示存儲器30,用于在其中存儲作為圖象數(shù)據(jù)(字體數(shù)據(jù))的字符形狀,例如語音符號及由CPU20得出的中文漢字字符;及打印單元50,用于打印輸出語音符號及由CPU20輸出的中文漢字字符。該中文漢字字符轉(zhuǎn)換裝置還包括一個外部存儲單元60,用于在其中存儲由CPU20輸出的數(shù)據(jù)及需要CPU20處理操作的數(shù)據(jù),例如上述中文漢字字符及語音符號的字體數(shù)據(jù);一個工作存儲器70,用于暫時存儲對于CPU20處理操作所需的數(shù)據(jù)及由CPU20得出的數(shù)據(jù);及一個轉(zhuǎn)換詞典80,用于在其中記錄語音符號串及與語音符號串相對應(yīng)的漢字字符習(xí)語。
上述的鍵輸入單元10相當于裝有字母鍵的鍵盤。該鍵輸入單元10能輸入無重音(音調(diào))符號的中文漢字字符的語音符號(拼音)。
鍵輸入單元10裝有各種鍵,例如“CONVERT”鍵,詞組片分段位置的“CHANGE”鍵,確定鍵,利用后者可作出確定指令。工作存儲器70的存儲區(qū)工作存儲器70在其中暫時存儲對于將語音符號轉(zhuǎn)換成與它對應(yīng)的中文漢字字符所需的數(shù)據(jù),并具有如圖10中所示的存儲區(qū)。
這就是,在該工作存儲器70中設(shè)置了一個輸入緩沖區(qū)IB,用于在其中存儲由鍵輸入單元10輸入的語音符號串;一個檢索語音符號區(qū)PY,用于在其中存儲對于在輸入的語音符號串中檢索轉(zhuǎn)換詞典80所需的語音符號串部分;一個檢索漢字字符串區(qū)SC,用于在其中存儲基于存儲在該檢索語音符號區(qū)PY中的語音符號的第一對象漢字字符串;第一詞組片度量區(qū)B1,用于在其中存儲檢索的第一詞組片的漢字字符串的字符數(shù);第二詞組片度量區(qū)B2,用于在其中存儲檢索的第二詞組片的漢字字符串的字符數(shù);詞組片度量組合存儲區(qū)SK,在其中一個接一個地存儲分別存儲在第一詞組片度量區(qū)B1及第二詞組片度量區(qū)B2中的一組詞組片度量;及一個確定漢字字符串區(qū)FC,用于在其中存儲確定的漢字字符串。
應(yīng)該理解,上述第一及第二詞組片如下地確定。在從輸入語音符號串的開頭部分中相繼連續(xù)的兩個詞組片中,前一個詞組片被認為是第一詞組片,而后一詞組片被認為是第二詞組片。
上述的轉(zhuǎn)換詞典80是一個用于用轉(zhuǎn)換漢字字符的通用類型的詞典,在該轉(zhuǎn)換詞典80中,作為漢字字符習(xí)語記錄了在中文中以一定高的頻繁率使用的漢字字符串,并還記錄了相應(yīng)于記錄的漢字字符習(xí)語并用于讀該漢字字符習(xí)語的語音(拼音)符號串。
并且,作為同音漢字字符習(xí)語優(yōu)先次序的數(shù)據(jù)也被記錄在該轉(zhuǎn)換詞典80中。然后利用該轉(zhuǎn)換詞典80可從語音符號串中檢索出漢字字符習(xí)語。應(yīng)該理解,在該第二實施例中,上述的漢字字符串及漢字字符習(xí)語包含由單字符構(gòu)成的漢字字符。
換言之,作為單漢字字符串(漢字字符習(xí)語),由單字符構(gòu)成的漢字字符也被記錄在上述轉(zhuǎn)換詞典中。
正如下面將描述的,上述CPU20基于由鍵輸入單元10輸入的語音符號串檢索轉(zhuǎn)換詞典80,以便將語音符號串劃分成各個詞組片,并將各個詞組片部分轉(zhuǎn)換成漢字字符串。第二轉(zhuǎn)換方法接下來,現(xiàn)在將對由上述中文漢字字符轉(zhuǎn)換裝置執(zhí)行的中文漢字字符轉(zhuǎn)換方法進行說明。
在圖11中表示了用于解釋根據(jù)該第二實施例的中文漢字字符轉(zhuǎn)換方法的流程圖。這就是,在該實施例中,該中文漢字字符轉(zhuǎn)換方法是通過將詞組片分段并以轉(zhuǎn)換的漢字字符串的字符數(shù)(量)的方式將語音符號轉(zhuǎn)換成漢字字符的。
在該第二中文漢字字符轉(zhuǎn)換方法中,首先,從鍵輸入單元10由操作者輸入指示要輸入的具有任意字符數(shù)的漢字字符串讀音的語音符號串(步驟A1)。
在此情況下,如圖13A中所示,作為中文漢字字符串“在不知不覺中”的語音符號串“zai bu zhi bu jue zhong”被輸入。
由鍵輸入單元10輸入的語音符號串被存儲在如圖12A中所示的輸入緩沖區(qū)IB中。
存儲在輸入緩沖區(qū)IB中的該語音符號串的字形信息被存儲到顯示存儲器30中,然后顯示在顯示單元40上,如圖13A中所示。
應(yīng)該指出,在圖13中矩形框中的內(nèi)容表示在顯示單元40中顯示屏上的顯示內(nèi)容。
接著,如圖13B中所示,通過由操作者操作“CONVERT”鍵開始漢字轉(zhuǎn)換處理。
首先,對輸入語音符號串基于轉(zhuǎn)換詞典80進行分析(步驟A2),及作出判斷,看基于詞典是否將輸入語音符號串轉(zhuǎn)換成與它相對應(yīng)的漢字字符串(步驟A3)。
如果輸入了不能轉(zhuǎn)換成漢字字符串的語音符號串,則轉(zhuǎn)換處理操作前進到步驟A19,在該步驟上將錯誤輸入通告操作者并隨后結(jié)束該處理操作。
相反地,當輸入的語音符號串能被轉(zhuǎn)換成漢字字符串時,該轉(zhuǎn)換處理操作前進到步驟A4。
然后,從轉(zhuǎn)換詞典80中檢索與輸入語音符號串中具有任意字符數(shù)的開始部分對應(yīng)的漢字字符串(步驟A4)。
將檢索漢字字符串中最長(最大字符數(shù))的漢字字符串(最長的習(xí)語)作為第一詞組片字符數(shù)使用,并將該字符數(shù)存儲到第一詞組片度量區(qū)B1中(步驟A5)。
在此情況下,現(xiàn)在假設(shè)漢字字符串“再不”相當于該最大的習(xí)語,它是從相當于語音符號串“zai buzhi bu jue zhong”的開始部分的語音符號串“zai bu”中檢索出來的。
如圖12A中所示,該相當于輸入語音符號串的最長習(xí)語相對應(yīng)的開始部分中分“zai bu”被存儲在檢索語音符號區(qū)PY中。該漢字字符串(在此情況下,為漢字字符串“再不”)被檢索出來并被存儲在檢索漢字字符串區(qū)SC中,它構(gòu)成了基于存儲的語音符號串“zai bu”檢索的同音漢字字符習(xí)語中的第一對象。
并且,上述第一詞組片的字符數(shù)“2”也存儲在第一詞組片度量區(qū)B1中。
接著,當從輸入語音符號串中去除第一詞組片的語音符號串時,對是否存在剩余語音符號串作出判斷(步驟A6)。
在沒有剩余語音符號串,即所有輸入的語音符號串均被轉(zhuǎn)換成在詞典中存儲的單個漢字字符串的情況下,則可以判斷沒有必要執(zhí)行一個處理操作來發(fā)現(xiàn)出后繼兩個詞組片的字符數(shù)變?yōu)樽畲蟮脑~組片分段位置,因為僅是一個詞組片構(gòu)成的語音符號串被操作輸入的可能性小,并且詞組片分段位置不正確的可能性更小。
其結(jié)果是,如果沒有語音符號串,即所有被輸入的語音符號串均被轉(zhuǎn)換成記錄在詞典中的一個漢字符號串時,該漢字字符串被確定為對象漢字字符串,并且也確定了詞組片的度量(步驟A7),然后轉(zhuǎn)換處理操作前進到步驟A18。
應(yīng)該指出,上述的表達“確定”是表示這樣的事實,即最后輸入的漢字字符串沒有確定,但對操作者建議的對象漢字字符串被確定作為第一對象。
作為其結(jié)果,當沒有剩余詞組片留下時,在已確定第一詞組串的對象漢字字符串后,操作者將對該對象漢字字符串是否與要輸入的漢字字符串相一致,同時該對象漢字字符串被顯示在顯示單元40上。
相反地,當具有剩余語音符號串時,對第一詞組片字符數(shù)(即第一詞組片度量)是否等于單字符作出檢驗(步驟A8)。
如果第一詞組片度量等于單字符,則處理操作前進到步驟A7,其方式類似于上述沒有剩余語音符號串的情況。
然后,第一詞組片的度量被確定為單字符,接著將可構(gòu)成具有單字符的第一對象的漢字字符確定為對象漢字字符串。
還應(yīng)該指出,對處理兩個詞組片的最大字符數(shù)的處理操作的執(zhí)行應(yīng)該避免這樣一個問題。這就是,要輸入的漢字字符串的第一正確詞組片的度量等于單個字符時,第一詞組片的度量,用類似于處理一個詞組片的最大字符數(shù)的處理操作時,將變得大于兩個字符。在通過上述處理操作第一詞組片度量變?yōu)閱巫址那闆r下,因為對于處理兩個詞組片的最大字符數(shù)的處理操作不需要再被繼續(xù),該處理操作前進到步驟A18。
對于上述語音符號串“zai bu zhi bu jue zhong”,因為第一詞組片的漢字字符串被識別為“再不”,存在著剩余的語音符號,及第一詞組片的字符數(shù)等于“2”,處理操作前進到步驟A9。
然后,當?shù)谝辉~組片的度量不等于單字符時,則基于具有除第一詞組片外的剩余語音符號串的任意長度的開始部分檢索轉(zhuǎn)換詞典80(步驟A9)。
于是,將具有在檢索漢字字符串中最大字符數(shù)(最長習(xí)語)的漢字字符串的字符數(shù)識別為第二詞組片的字符數(shù),然后將該字符數(shù)存儲到第二詞組片度量區(qū)B2中(步驟A10)。
在該實施例中,假定從除去語音符號串“zai bu”后的語音符號串“zhi bu jue zhong”的開始部分所對應(yīng)的語音符號串“zhi bu”中,檢索出的最長習(xí)語對應(yīng)為漢字字符串“支部”。
如圖12B中所示,與輸入語音符號串的最長習(xí)語相對應(yīng)的開始部分“zhi bu”被存儲在檢索語音符號區(qū)PY中。漢字字符串(在此情況下,為漢字字符串“支部”)被檢索出來并與另一個漢字字符串“再不”一起存儲在檢索漢字字符串區(qū)SC中,“再不”是基于存儲的語音符號串“zhi bu”檢索出的同音漢字字符習(xí)語中構(gòu)成第一對象的漢字字符串。
并且,上述第二詞組片的字符數(shù)“2”被存儲在第二詞組片度量區(qū)B2中。
然后將第一及第二詞組片的詞組片度量(B1,B2)存儲到詞組片度量組合存儲區(qū)SK中(步驟A11)。
在此情況下,如圖12C中所示,詞組片度量“2,2”被存儲在詞組串度量組合存儲區(qū)SK中。
接著,從第一詞組片的詞組度量(B1)中減去1,及將結(jié)果數(shù)值設(shè)置為第一詞組片的度量(步驟A12)。
然后,作出檢驗,看新的第一詞組度量是否等于“0”(步驟A13)。
應(yīng)該指出,因為在該實施例中已忽略了第一詞組片的度量為單字符的情況,故該第一詞組片的度量不等于“0”。但是,由于上述步驟A12的處理操作將被重復(fù)地執(zhí)行,第一詞組片的度量最后將變?yōu)椤?”。
并且,在該實施例中,第一詞組片被置為漢字字符串“再不”,及第一詞組片的度量被選擇為“2”,因此第一詞組片度量變成“1”。
然后,當該第一詞組片的度量不等于“0”時,從轉(zhuǎn)換詞典80中檢索漢字字符串,它相應(yīng)于具有輸入語音符號串的任意長度的開頭部分,其度量等于第一詞組片的度量。
接著,檢驗是否已從轉(zhuǎn)換詞典80中能檢索出具有上述狀態(tài)的漢字字符串(步驟A15)。
如果不能檢索出這樣的漢字字符串,則處理操作返回到步驟A12。而且重復(fù)進行步驟A12后規(guī)定的處理操作,在步驟A12上將從第一詞組片度量中減去1。
在此情況下,假定漢字字符“在(zai)”可以作為具有與上述語音符號串“zai bu zhi bu jue zhong”的開頭部分相應(yīng)的單字符的漢字字符習(xí)語被檢索出來。
如圖12C中所示,將與輸入語音符號串的第一詞組片度量(1)相對應(yīng)的開頭部分“zai”存儲到檢索語音符號區(qū)PY中。漢字字符串(在此情況下,為漢字字符“在”)被檢索出來并存儲到檢索漢字字符串區(qū)SC中,它構(gòu)成了基于存儲語音符號串“zai”檢索出的同音漢字字符習(xí)語中的第一對象。
并且,上述第一詞組片的字符數(shù)“1”被存儲在第一詞組片度量區(qū)B1中。
然后,如前所述,當具有該條件的漢字字符串可從轉(zhuǎn)換詞典80中被檢索到時,處理操作被返回到步驟A9,以便檢索第二詞組片。于是,將重復(fù)執(zhí)行在步驟A9后規(guī)定的處理操作。
這就是,在步驟A9上,從轉(zhuǎn)換詞典80中檢索漢字字符串,它相應(yīng)于具有除第一詞組片“zai”外的剩余語音符號串“bu zhi bu jue zhong”的任意長度的開頭部分。
接著,在步驟A10上,使用檢索的漢字字符串中最大字符數(shù)的漢字字符串(最長習(xí)語)作為第二詞組片的字符數(shù),并將該字符數(shù)存儲在第二詞組片度量區(qū)B2中。
在該情況下,現(xiàn)在假定,漢字字符串“不知不覺”相當于從與語音符號串“bu zhi bu jue zhong”的開頭部分相應(yīng)的語音符號串“bu zhi bujeu”中檢索出的最長習(xí)語。
如圖12D所示,與輸入語音符號串的最長習(xí)語相對應(yīng)的該開頭部分“bu zhi bu jue”被存儲在檢索語音符號區(qū)PY中。漢字字符串(在此情況下,為漢字字符串“不知不覺”)被檢索出來并與漢字字符“在”一起存儲在檢索漢字字符串區(qū)SC中,它構(gòu)成了基于存儲語音符號串“bu zhi bu jue”檢索出的同音漢字字符習(xí)語中的第一對象。
并且,上述第二詞組片的字符數(shù)“4”被存儲在第二詞組片度量區(qū)B2中。
然后,在步驟A11上,該新的第一及第二詞組片度量(B1,B2)被附加地存儲到詞組片組合存儲區(qū)SK中。
在此情況下,如圖12D中所示,“1,4”附加于第一量度“2,2”地被存儲在詞組片組合存儲區(qū)SK中。
接著,在步驟A12上,從第一詞組片度量中減去1。
在此情況下,因為第一詞組片等于漢字字符“在”,及詞組片度量等于1,當從該詞組片度量中減去1時,第一詞組片度量則變?yōu)椤?”。于是,處理操作前進到步驟A16。
應(yīng)該指出,當?shù)谝辉~組片度量不等于0時,上述的處理操作將再重復(fù)地執(zhí)行。
然后,對第一及第二詞組片度量作出計算,它們的總和度量變成記錄在詞組片組合存儲區(qū)SK中第一及第二詞組片度量中的最大值?;谠撚嬎愕牡谝患暗诙~組片度量,確定出第一詞組片的對象漢字字符串的字符數(shù)及第二詞組片的對象漢字字符串的字符數(shù)(步驟A16) 。
在此例中,在“再不支部”情況下,第一詞組片度量及第二詞組片度量之和等于2+2=4,而在“在不知不覺”情況下,第一詞組片度量及第二詞組片度量之和等于1+4=5。
相應(yīng)地,由于第一詞組片度量及第二詞組片度量之和為5的情況相應(yīng)于最大的詞組片度量,其第一詞組片度量被置為“1”及第二詞組片度量被置為“4”。
接著,在上述第一詞組片及第二詞組片中,對漢字字符串作出選擇,看誰的優(yōu)先權(quán)等級在轉(zhuǎn)換詞典中在與具有確定詞組片度量的上述語音符號串相應(yīng)的漢字字符串中為最高優(yōu)先權(quán)級。然后,將選擇出的漢字字符串確定為對象漢字字符串(步驟A17)。
在此情況下,因為上述漢字字符串“在不知不覺”是對于上述詞組片度量中第一詞組片及第二詞組片的第一對象,該漢字字符串“在不知不覺”被確定為對于第一及第二詞組片的對象漢字字符串,并然后被存儲到確定漢字字符串區(qū)FC中,如圖12D中所示。
然后,作出判斷,看在第一詞組片及第二詞組片中是否還剩留語音符號串(步驟A18)。
接著,當還剩余語音符號時,處理操作返回到步驟A4,在該步驟上對于輸入語音符號串執(zhí)行類似于上述處理操作的處理操作。
相反地,當無剩余語音符號串時,假定所有包括在輸入語音符號串中的所有詞組片的詞組片度量及各個詞組片的對象漢字字符串已被確定,則處理操作前進到步驟A18。
應(yīng)當指出,當無剩余語音符號串時,在步驟A6上,對所有輸入語音符號串是否已轉(zhuǎn)換成單個漢字字符串并且已無剩余語音符號作出判斷。在步驟A7上,確定第一詞組片的詞組片度量及對象漢字字符串,然后處理操作前進到步驟A18。
在此情況下,第一及第二詞組片的詞組片度量及輸入語音符號串“zai bu zhi bu jue”的對象漢字字符串均已被確定。換言之,在上述語音符號串中的語音符號串“zai bu zhi bu jue”已被確定,而留下另外的語音符號串“zhong”。
作為其結(jié)果,處理操作返回到前面步驟A 4。
然后,在步驟A4上,從轉(zhuǎn)換詞典80中檢索與具有語音符號串“zhong”的任意長度的開頭部分相對應(yīng)的漢字字符串。
在此情況下,假定對于語音符號串“zhong”檢索出漢字字符“中”,而具有的字符長于該一個漢字字符的漢字字符串未被檢索到。
在該情況下,如圖12E中所示,確定了漢字字符“中”并將該漢字字符“中”與上述的漢字字符串“在不知不覺”相組合作為另一漢字字符串“在不知不覺中”存儲在確定漢字字符串區(qū)FC中。
然后,在步驟A18上也不具有剩余語音符號串,因此處理操作前進到步驟A19。
接著,在包含在輸入語音符號串中的所有詞組片的詞組片度量及各詞組片的對象漢字字符串均已確定的情況下,如圖13B中所示,該對象漢字字符串被顯示在顯示單元40上(步驟A19)。
然后,當顯示的對象漢字字符串與要輸入的漢字字符串相一致時,操作者確定該顯示的對象漢字字符串,由此實現(xiàn)了漢字字符串的輸入。
應(yīng)該理解,當對象漢字字符串與要輸入的漢字字符串不相一致時,需要從相對每個詞組片的另外漢字字符串中檢索主觀要輸入的漢字字符串,或者改變詞組片位置來執(zhí)行轉(zhuǎn)換操作。第二轉(zhuǎn)換方法的優(yōu)點如上面詳細描述的,根據(jù)該第二實施例的中文漢字字符轉(zhuǎn)換裝置及中文漢字字符轉(zhuǎn)換方法,當對于輸入語音符號串確定轉(zhuǎn)換漢字字符串的詞組片時,該詞組片以這樣的方式來確定,即開頭詞組片的詞組片度量及第二詞組片的詞組片度量的和值變?yōu)樽畲笾怠O鄳?yīng)地,具有較大的可能性,即第一詞組片不總是等于基于詞典中檢索出的漢字字符串構(gòu)成的最大詞組片,而第一詞組串變成由具有單詞組串的漢字字符串構(gòu)成的單漢字字符習(xí)語。
在中文語法中,具有許多這樣的情況,被安排在一個句子的第一詞組片中的一種單漢字字符習(xí)語作為構(gòu)成主語的各詞,另一種單漢字字符習(xí)語作為前置詞,再一種單漢字字符習(xí)語作為否定詞,又一種單漢字字符習(xí)語作為修飾詞。
然而,根據(jù)傳統(tǒng)的轉(zhuǎn)換方法,當從詞典中檢索對應(yīng)于輸入語音符號串的開頭部分的漢字字符串時,具有較大的可能性,即在句子的第一詞組片上檢索出具有多于兩個字符的漢字字符串。
相反地,根據(jù)該第二實施例,如前所述,因為第二詞組片的長度是與第一詞組片一起被分析的,即使具有帶單字符的單詞組片的漢字字符串及具有多于兩個字符的漢字字符串均可被檢索時,還具某些可能性,即當?shù)谝辉~組片由單字符組成時,如果在第二詞組片上較長的漢字字符串可被轉(zhuǎn)換的話,則第一詞組片可成為具有單字符的漢字字符串。
較具體地,在第一詞組片不能被正確地設(shè)成輸入語音符號串中根據(jù)中文語法具有單字符的詞組片的情況下,因為第一詞組片由單字符構(gòu)成,第二詞組片的起始位置可以相應(yīng)于正確位置。然后,具有某些可能性,即記錄在詞典中的符合語言習(xí)慣的較長漢字字符串將設(shè)置在第二詞組片中。相反地,當?shù)谝辉~組串由多于兩個字符組成時,第二詞組片的起始位置將構(gòu)成錯誤位置,因此具有小的可能性,即在詞典中記錄了相應(yīng)的長漢字字符串。而具有大的可能性,即檢索出短的漢字字符串作為第二詞組片的對象漢字字符串。
另一方面,在第一詞組片正確地設(shè)成輸入語音符號串中根據(jù)中文語法具有單字符的詞組片的情況下,則在當?shù)谝辉~組片由單字符構(gòu)成時的第一詞組片度量及第二詞組片度量的一個和值與當?shù)谝辉~組片由多于兩個字符構(gòu)成時的第一詞組片量度及第二詞組片度量的另一和值之間作出比較。作為比較結(jié)果,具有大的可能性, 即當?shù)谝辉~組片由單字符構(gòu)成時,第一及第二詞組片度量的和值變大。
其結(jié)果,具有較大可能性的是,當?shù)谝辉~組片是按照中文語法由單字符構(gòu)成的時,如果使用了本發(fā)明的第二實施例的中文漢字字符轉(zhuǎn)換方法,則第一詞組片由單字符構(gòu)成。
從以上的說明中可以明顯看出,根據(jù)該第二實施例的中文漢字字符轉(zhuǎn)換方法/裝置可具有這樣的優(yōu)點,即與傳統(tǒng)的漢字字符轉(zhuǎn)換方法/裝置相比較,可以改善字符轉(zhuǎn)換效率。這是因為當?shù)谝辉~組片由單字符組成及語音符號串被正確地輸入時,不會出現(xiàn)這樣的情況即第一詞組片由多于兩個字符組成,并造成低的轉(zhuǎn)換效率。
此外,根據(jù)該第二實施例的中文漢字字符轉(zhuǎn)換方法/裝置的另一優(yōu)點,可以避免傳統(tǒng)的中文漢字字符轉(zhuǎn)換方法/裝置中的問題。這就是,在現(xiàn)有技術(shù)中,雖然第一詞組片應(yīng)正確設(shè)置成單字符,但第一詞組片作成由多于兩個字符組成,然后,如前所述,將會輸出錯誤的對象漢字字符串。為了使該對象漢字字符串與要輸入的漢字字符串相一致。就需要新的詞組片段位置,這將會延長漢字字符的輸入處理。但是,該第二實施例可解決傳統(tǒng)問題,因此可最終提高漢字字符的輸入速度。
應(yīng)該理解,雖然在該第二實施例中是使用的無音調(diào)符號的語音符號,但也可替換地使用具有音調(diào)符號的另一種語音符號。
權(quán)利要求
1.一種用于中文漢字字符轉(zhuǎn)換裝置中的基于詞典將輸入語音符號串轉(zhuǎn)換成與它相對應(yīng)的漢字字符串的中文漢字字符轉(zhuǎn)換方法,該中文漢字字符轉(zhuǎn)換裝置包括輸入裝置,用于輸入指示漢字字符串發(fā)音的語音符號串;及詞典,用于在其中記錄語音符號串及與它對應(yīng)的漢字字符串,所述轉(zhuǎn)換方法包括輸入步驟,用于輸入所述語音符號串;輸出步驟,用于根據(jù)所述輸入語音符號串檢索所述詞典并用于將所述輸入語音符號串轉(zhuǎn)換成相對每個詞組片的漢字字符串,由此輸出對象漢字串;指令步驟,用于指令詞組片分段位置的改變;轉(zhuǎn)換步驟,用于響應(yīng)改變指令來改變分段語音符號串用的詞組片分段位置,并基于改變的詞組片分段位置將所述語音符號串換成漢字字符串;記錄步驟,用于當發(fā)出了指令以確定轉(zhuǎn)換的漢字字符串時對應(yīng)于所述轉(zhuǎn)換漢字字符串及所述詞組片分段位置信息將所述輸入語音符號串記錄到所述詞典中;及再輸出步驟,用于當將記錄在所述詞典中的語音符號串輸出時,再次輸出與所述輸入語音符號串對應(yīng)的所述漢字字符串,作為對象漢字字符串。
2.根據(jù)權(quán)利要求1所述的中文漢字字符轉(zhuǎn)換方法,其中在所述再輸出步驟中,當輸入記錄在所述詞典中的語音符號串時,相應(yīng)于所述輸入語音符號串的所述漢字字符串在這樣的條件下作為對象漢字字符串被輸出即所述語音符號串在記錄在所述詞典的所述詞組片的分段位置上被劃分。
3.根據(jù)權(quán)利要求1所述的中文漢字字符轉(zhuǎn)換方法,其中在所述記錄步驟中,當所述輸入的語音符號串對應(yīng)于轉(zhuǎn)換的漢字字符串被記錄在所述詞典中時,在對象漢字字符串中在它們的詞組片分段位置改變前與所述轉(zhuǎn)換的漢字字符串的詞組片分段位置相一致的詞組片分段位置被用作公共分段位置;所述輸入語音符號串及所述轉(zhuǎn)換的漢字字符串均在所述公共分段位置上被劃分;所述語音符號串,所述漢字字符串及所述詞組片分段位置信息對于每個分段部分彼此對應(yīng)地被記錄在所述詞典中。
4.一種中文漢字字符轉(zhuǎn)換裝置,用于向其中輸入指示漢字字符串的語音符號串及用于將輸入的語音符號串轉(zhuǎn)換成漢字字符串,它包括詞典,用于在其中對應(yīng)所述漢字字符串記錄所述語音符號串;輸入裝置,用于輸入所述語音符號串;轉(zhuǎn)換裝置,用于基于所述輸入語音符號串檢索所述詞典并將所述語音符號串轉(zhuǎn)換成相對每個詞組片的漢字字符串,以便由此輸出對象字符串;指令裝置,用于指令詞組片分段位置的改變;確定裝置,用于指令對所述轉(zhuǎn)換的漢字字符串的確定;及習(xí)記裝置,用于使所述輸入的語音符號串與確定的漢字字符串相對應(yīng)地記錄在所述詞典中,其中在由所述確定裝置作出確定期間,所述習(xí)記裝置將多個詞組片構(gòu)成的漢字字符串作為單個漢字字符串記錄在所述詞典中;及當所述輸入語音符號串基于所述詞典轉(zhuǎn)換成漢字字符串時,在相應(yīng)于輸入語音符號串的漢字字符串被所述習(xí)記裝置記錄到所述詞典中的情況下,所述轉(zhuǎn)換裝置優(yōu)先地輸出所述記錄的漢字字符串。
5.根據(jù)權(quán)利要求4所述的中文漢字字符轉(zhuǎn)換裝置,其中當由所述多個詞組片構(gòu)成的漢字字符串作為單個漢字字符串被記錄到所述詞典中時,所述習(xí)記裝置將所述漢字字符串及它的詞組片分段位置輸入到所述詞典中;及當所述輸入語音符號串被轉(zhuǎn)換成由多個詞組片構(gòu)成的漢字字符串時,所述轉(zhuǎn)換裝置使所述漢字字符串成為在所述詞典中對應(yīng)所述漢字字符串記錄的詞組片分段位置上的分段狀態(tài)。
6.根據(jù)權(quán)利要求4所述的中文漢字字符轉(zhuǎn)換裝置,其中所述習(xí)記裝置將這樣的詞組片分段位置,即當所述轉(zhuǎn)換裝置第一欠轉(zhuǎn)換期間的詞組片分段位置與由所述確定裝置確定的漢字字符串的詞組片分段位置相一致的詞組片分段位置,設(shè)置成公共分段位置;將確定的漢字字符串在所述公共分段位置上分段;及接著將所述語音符號串,所述漢字字符串及所述詞組片分段位置信息相對每個分段部分彼此對應(yīng)地記錄到所述詞典中。
7.一種用于中文漢字字符轉(zhuǎn)換裝置中的基于詞典將輸入語音符號串轉(zhuǎn)換成與它相對應(yīng)的漢字字符串的中文漢字字符轉(zhuǎn)換方法,該中文漢字字符轉(zhuǎn)換裝置包括輸入裝置用于輸入指示漢字字符串發(fā)音的語音符號串;及詞典,用于在其中記錄語音符號串及與它對應(yīng)的漢字字符串,所述轉(zhuǎn)換方法包括下列步驟輸入所述語音符號串;在離開頭部分的任意詞組片分段位置上將所述輸入語音符號串分段,從所述詞典中檢索對應(yīng)于分段語音符號串的第一漢字字符串,及從所述詞典中檢索與剩余語音符號串對應(yīng)的第二漢字字符串,該剩余語音符號串是從所述輸入語音符號串中減去與所述第一漢字字符串對應(yīng)的語音符號串部分獲得的;及當檢索到所述第一漢字字符串及所述第二器字字符串之間的多個組合組時,以這樣的方式從所述多個組合組中選擇詞組片的分段位置,即使得由所述第一字符符號串的字符數(shù)及由所述第二漢字字符串的字符數(shù)獲得的總字符數(shù)變得最大,及將基于選擇的詞組片分段位置轉(zhuǎn)換的第一及第二漢字字符的組合作為對象漢字字符串輸出。
8.一種中文漢字字符轉(zhuǎn)換裝置,用于向其中輸入指示漢字字符串的語音符號串及用于將輸入的語音符號串轉(zhuǎn)換成漢字字符串,它包括詞典,用于在其中對應(yīng)所述漢字字符串記錄所述語音符號串;輸入裝置,用于輸入所述語音符號串;轉(zhuǎn)換裝置,用于基于所述詞典將所述輸入語音符號串轉(zhuǎn)換成相對每個詞組片的漢字字符串,以便由此輸出所述轉(zhuǎn)換的漢字字符串;其中當要被轉(zhuǎn)換的漢字字符串由多個詞組片構(gòu)成時,以這樣的方式來改變詞組片分段位置,即使分別轉(zhuǎn)換的第一漢字字符串的字符數(shù)及第二漢字字符串的字符數(shù)的和值變?yōu)樽畲?,并且從所述輸入語音符號串的開頭開始相繼連續(xù)的第一詞組片及第二詞組片被用作分段。
全文摘要
在中文漢字字符轉(zhuǎn)換方法及裝置中,語音符號串被輸入及每詞組片地被轉(zhuǎn)換成漢字字符串,然后作為對象字符串輸出。當所需的字符串不同于輸出的對象字符串時,則改變詞組片分段位置,然后語音符號串在改變的分段位置上被轉(zhuǎn)換成漢字字符串。將確定的漢字字符串對應(yīng)于語音符號串及詞組片分段位置記錄到習(xí)記詞典中。當輸入記錄在習(xí)記詞典中的語音符號串時,習(xí)記在習(xí)記詞典中的漢字字符串將在以記錄的詞組片分段位置分段的情況下被顯示出來。
文檔編號G06F17/28GK1152148SQ96107169
公開日1997年6月18日 申請日期1996年6月24日 優(yōu)先權(quán)日1995年6月23日
發(fā)明者王斌 申請人:卡西歐計算機公司