專利名稱:中英通雙向漢字輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電腦漢字處理應(yīng)用中的漢字鍵盤輸入編碼技術(shù)。
第二部分背景技術(shù)一、英漢翻譯類輸入法概覽現(xiàn)時(shí)有不少流行的漢字輸入法,或多或少地提供了部分漢語(yǔ)字詞使用英語(yǔ)單詞作為輸入編碼的功能,但都只限于個(gè)別或部分字詞,而且只能實(shí)現(xiàn)英譯中而不能實(shí)現(xiàn)中譯英。
例如“萬(wàn)能五筆輸入法”根據(jù)互聯(lián)網(wǎng)上公開的資料,“它是一種集國(guó)內(nèi)目前流行的五筆字型輸入法及拼音、英語(yǔ)、筆畫、拼音+筆畫等多種輸入法為一體的多元輸入法。而且是一種以優(yōu)先選擇五筆字型高速輸入為主的快速輸入法”,由此可見,該輸入法是一種“以五筆字型為主”的輸入法,只有小部分漢語(yǔ)字詞能夠用英語(yǔ)單詞編碼輸入,像這樣錦上添花地提供小部份字詞可用英語(yǔ)作為輸入法編碼的軟件還有很多,因?yàn)槠溆h輸入功能類同,因此不在此一一列舉。
又如“意音漢字輸入法”(專利號(hào)94101030.9)根據(jù)國(guó)家知識(shí)產(chǎn)權(quán)局在網(wǎng)上公布的信息,“意音漢字輸入法”是一種以英漢翻譯方式為主要輸入方式的漢字輸入法。根據(jù)其說(shuō)明摘要“對(duì)于大部分漢字及詞,提取它常用的、原始的意義以英文單詞編碼;對(duì)于難以取意或不便取意的漢字及詞,用它的漢語(yǔ)拼音編碼;用雙寫聲母或雙寫韻母或意音結(jié)合編碼的方法處理重碼”,由此可知,這種輸入法也并不是完全的英漢輸入法,其中仍有大量的單字和詞組只能用“漢語(yǔ)拼音、雙寫聲母、雙寫韻母或意音結(jié)合編碼的方法處理”,不能用英語(yǔ)單詞作為輸入編碼。
再如“多重漢字輸入法及其實(shí)現(xiàn)方法”(專利號(hào)97114315.3)根據(jù)國(guó)家知識(shí)產(chǎn)權(quán)局在網(wǎng)上公布的信息,“多重漢字輸入法及其實(shí)現(xiàn)方法”是一種包含英漢翻譯輸入方式的漢字輸入法。根據(jù)其說(shuō)明摘要“一種萬(wàn)能漢字輸入法,一個(gè)漢字詞同時(shí)可用多種編碼方法輸入計(jì)算機(jī)而無(wú)需切換。它利用英語(yǔ)單詞與漢語(yǔ)拼音或筆畫組合之間重碼率(重疊)較低的特點(diǎn),直接對(duì)所有漢字或詞以拼音或英語(yǔ)或筆畫代碼等分別編碼,所得的編碼即為該字或詞的編碼”,由此可知,這種輸入法也只是對(duì)部份字詞提供了相應(yīng)的英語(yǔ)輸入編碼,而且英漢輸入方式也不是其主要輸入方式。
綜上所述,至今還沒有出現(xiàn)真正普及的、具有完整實(shí)用性的英漢轉(zhuǎn)換功能的漢字輸入法。
二、英漢翻譯輸入法的難題為什么以前一直沒有真正實(shí)用普及的英漢輸入法出現(xiàn)呢?這是因?yàn)榉g輸入法的編碼工作量非常巨大,而且存在一系列難題,不是一般人輕而易舉可以解決的,這是一項(xiàng)需要有多方面的知識(shí)、技能、條件,并要花費(fèi)大量創(chuàng)造性勞動(dòng)才能完成好的艱巨工作。
中英轉(zhuǎn)換的輸入法,簡(jiǎn)單而言就是打入英文輸入中文,打中文出英文,這看起來(lái)似乎很簡(jiǎn)單,好像只要把漢英詞典和英漢詞典輸入電腦,用漢語(yǔ)字詞對(duì)應(yīng)的英文詞語(yǔ)作為該漢語(yǔ)字詞的輸入代碼就可以了,但實(shí)際上遠(yuǎn)沒有這么簡(jiǎn)單,真正開發(fā)的難題很多,以致人們一直難以創(chuàng)造出實(shí)用普及的產(chǎn)品,這些難題主要有(一)英漢詞典不能滿足漢字輸入法的取詞需要1.詞義解釋格式問(wèn)題英漢詞典的詞義解釋,有很多并不是單個(gè)獨(dú)立的中文詞語(yǔ),而是一些解釋性的詞句,這些解釋性的詞句不適用于中文寫作的描述性用詞需要,因此英漢詞典并不能作為漢語(yǔ)寫作詞組的直接來(lái)源;2.漢字單字編碼的問(wèn)題英漢詞典的中文釋義絕大部分并不使用單個(gè)孤立的漢字,因此英漢詞典也無(wú)法解決漢語(yǔ)單字的編碼問(wèn)題。
3.英漢組詞方式差異的問(wèn)題中文詞語(yǔ)的組詞方式與英語(yǔ)的顯著不同,英語(yǔ)使用的是詞根詞綴衍生法,即每個(gè)詞目通過(guò)前綴、后綴、詞根等不同,而衍生出動(dòng)詞、名詞、形容詞、副詞、分詞等多種不同形態(tài),而漢語(yǔ)使用的是單字組詞法(單字排列組合法,例如形容詞為“...的”;副詞為“...地”、“...得”,名詞為“...者”、“...物”),因此用英漢詞典的英語(yǔ)單詞反譯為漢語(yǔ)字詞的方法,不能提供適合漢字組詞規(guī)律和使用習(xí)慣所需的實(shí)用詞組。
4.重碼問(wèn)題一個(gè)英語(yǔ)單詞可有多個(gè)不同的中文詞義,這樣會(huì)帶來(lái)大量的重碼字詞(多個(gè)漢語(yǔ)字詞使用同一個(gè)英語(yǔ)編碼),而重碼字詞是與其使用頻率無(wú)關(guān)地隨機(jī)排序的,由此將會(huì)嚴(yán)重降低中文輸入的效率,因此不能照搬詞典的內(nèi)容,必須根據(jù)漢語(yǔ)字詞的使用頻度進(jìn)行合理的排序和取舍。
5.一個(gè)字詞多個(gè)編碼的問(wèn)題不同的英語(yǔ)單詞可包含相同的中文詞義,這樣會(huì)帶來(lái)大量的重復(fù)漢語(yǔ)字詞,浪費(fèi)編碼的空間(一個(gè)漢語(yǔ)字詞占用多個(gè)編碼),因此不能照搬詞典的內(nèi)容,必須根據(jù)英語(yǔ)字詞的使用頻度進(jìn)行合理的取舍,同一漢語(yǔ)單字一般最多只取最常用的兩至三個(gè)英語(yǔ)字詞編碼,同一漢語(yǔ)詞組一般只取最常用的一個(gè)英語(yǔ)字詞編碼。
(二)漢英詞典也不能滿足漢字輸入法的取詞需要1.市面上的漢英詞典中所收錄的詞組,很多并不是來(lái)自漢語(yǔ)的固有使用習(xí)慣和需要,而是從英漢的詞典中反譯過(guò)來(lái),因此大量的詞條并不適合中文寫作的需要,例如在UCDOS自配的UCDICT《漢英詞典》中,以“阿”開頭的詞組共有阿slender and beautiful;corner;tofavor;阿波羅apollo;阿爾巴尼亞albania;阿爾卑斯登山家alpinist;阿爾卑斯那邊的transalpine;阿爾卑斯山the alps;阿爾卑斯山脈akos;the alps;阿爾卑斯山那邊的人transal pine;阿爾法alpha;阿爾及爾algiers;阿爾及利亞algeria;阿爾及利亞的algerian;阿爾及利亞人algerian;阿飛teddy boy;阿富汗afghanistan;阿富汗的afghan;阿富汗人afghan;阿富汗人的afghan;阿富汗語(yǔ)afghan;阿根廷的argentine;阿根廷人argentine;阿基米德archimedes;阿基米德的archimedean;阿肯色州state ofarkansas;阿拉allah;阿拉巴馬州state of alabama;阿拉伯a(chǎn)rabia;阿拉伯半島arabianpeninsula;阿拉伯的arab;arabian;阿拉伯人arab;阿拉伯人的arab;arabian;arabic;阿拉伯式圖飾arabesque;阿拉伯?dāng)?shù)字arabic numerals;阿拉伯同盟arab league;阿拉伯文arabic language;阿拉伯橡膠樹acacia;阿拉伯學(xué)者arabist;阿拉伯語(yǔ)arabic;阿拉丁aladdin;阿拉斯加alaska;阿拉斯加州alaska;阿里山mt.ali;阿里斯多德的aristotelian;阿曼oman;阿門amen;阿彌陀佛amitabha;阿米巴amoeba;amoebae;阿米巴的amoebic;阿摩尼亞ammonia;阿姆斯特丹amsterdam;阿契里斯achilles;阿薩姆assam;阿叔爾神ashur;阿斯德爾特神astarte;阿斯堪ascham;阿斯匹林aspirin;阿斯匹是aspirin;阿斯萬(wàn)水壩aswandam;阿姨auntie;阿訇imam;阿諛to toady;toflatter;阿諛的adulatory;encomiastic;sycophantic;阿諛奉承g(shù)reasiness;阿諛者encomiast;flatterer;共計(jì)64個(gè)。但其中只有阿、阿波羅、阿爾巴尼亞、阿爾卑斯山、阿爾法、阿爾及爾、阿爾及利亞、阿飛、阿富汗、阿基米德、阿拉、阿拉伯、阿拉伯半島、阿拉丁、阿拉斯加、阿里山、阿曼、阿門、阿彌陀佛、阿采巴、阿姆斯特丹、阿斯匹林、阿姨、阿訇、阿諛、阿諛奉承等26個(gè)詞組在一般中文寫作中稍有機(jī)會(huì)使用,而這些詞中大部分的使用率也很低,因此,漢英詞典并不能提供足夠多的真正實(shí)用的中文詞組。
2.收錄漢字集的完整性問(wèn)題漢英詞典同樣無(wú)法全面提供所有6763個(gè)國(guó)標(biāo)一二級(jí)漢字的對(duì)應(yīng)英語(yǔ)單詞,例如UCDICT的《漢英詞典》中只提供了4378個(gè)單字的英語(yǔ)解釋,另外2400多個(gè)國(guó)標(biāo)一二級(jí)漢字則沒有收錄。
3.漢語(yǔ)字詞的多義性問(wèn)題一個(gè)漢語(yǔ)字詞可有很多個(gè)對(duì)應(yīng)的英語(yǔ)字詞,這會(huì)嚴(yán)重浪費(fèi)編碼資源,同一漢語(yǔ)字詞只能取最主要的兩三個(gè)英文詞義編碼,因此漢英詞典也不能直接作為漢英輸入法的編碼來(lái)源和依據(jù)。
(三)表達(dá)對(duì)象、語(yǔ)言習(xí)慣的差異問(wèn)題漢語(yǔ)和英語(yǔ)的字詞使用范圍和習(xí)慣是不同的,英語(yǔ)中有很多詞語(yǔ)表達(dá)對(duì)象和詞語(yǔ)只在西方社會(huì)特有的自然、宗教、文化、習(xí)俗環(huán)境中存在,這些詞語(yǔ)在英語(yǔ)國(guó)家經(jīng)常會(huì)用到,但在中國(guó)這些表達(dá)對(duì)象不存在,也極少會(huì)被提及;相對(duì)地,在漢語(yǔ)中有很多詞語(yǔ)表達(dá)對(duì)象和用語(yǔ)在中國(guó)社會(huì)特有的自然、宗教、文化、習(xí)俗環(huán)境中存在,并在中國(guó)經(jīng)常會(huì)被用到,但在西方社會(huì)這些表達(dá)對(duì)象不存在(例如成語(yǔ)、歇后語(yǔ)等),也極少會(huì)被提及,因此要開發(fā)出適用于中國(guó)漢字輸入需要的英漢輸入法,英語(yǔ)字詞編碼要服務(wù)于漢字輸入,必須以中國(guó)的字詞使用范圍和習(xí)慣為主導(dǎo),選詞根據(jù)漢語(yǔ)習(xí)慣,使用常用的漢語(yǔ)詞組,編碼則照顧英語(yǔ)的用詞習(xí)慣,盡可能使用常用的英語(yǔ)詞匯作為編碼。
三、現(xiàn)有英漢翻譯類輸入法的不足由于上述原因,現(xiàn)有的輸入法存在諸多的不足,難以滿足在漢字輸入過(guò)程中兼顧英漢雙向翻譯和雙向教學(xué)的需要,這些不足包括(一)片面性問(wèn)題只有一部份中文單字和詞組可以使用對(duì)應(yīng)的英語(yǔ)字詞編碼輸入,還有相當(dāng)部份的中文單字和詞組無(wú)法使用英語(yǔ)字詞編碼輸入,不能全面地應(yīng)用于漢語(yǔ)字詞的輸入編碼。
(二)單向性問(wèn)題只能實(shí)現(xiàn)英譯中而不能實(shí)現(xiàn)中譯英,難以滿足廣大用戶學(xué)習(xí)英語(yǔ)的需要。
(三)實(shí)用性問(wèn)題1.無(wú)法適應(yīng)循序漸進(jìn)學(xué)習(xí)英語(yǔ)的實(shí)際需要正是英語(yǔ)水平欠缺的用戶,才最有需要利用輸入中文的機(jī)會(huì)學(xué)習(xí)英語(yǔ),但現(xiàn)有的英漢輸入法,由于其“單向性”,都沒有可以運(yùn)用傳統(tǒng)的漢字輸入法(如拼音、五筆、活字碼等)輸入漢字而顯示相應(yīng)英語(yǔ)詞匯的功能,這對(duì)于英語(yǔ)水平低的廣大用戶而言,由于缺少學(xué)習(xí)上的過(guò)渡和緩沖,難以一步登天地完全使用英文詞匯編碼輸入全部的漢字詞語(yǔ),因此根本無(wú)法使用純粹的“英漢輸入法”,以至像“意音漢字輸入法”之類的單向的“英漢輸入法”顯得曲高和寡,難以被廣大用戶接受而無(wú)法普及,面世已十年仍只能閑置一隅,無(wú)法真正發(fā)揮其希望發(fā)揮的作用。
2.選詞不適合中文寫作的實(shí)際需要和語(yǔ)言習(xí)慣如前所述,無(wú)論《英漢詞典》或《漢英詞典》,其選詞都不能直接滿足中文寫作的需要,但現(xiàn)有的“英漢輸入法”的詞組只是移植自《漢英詞典》或《英漢詞典》,存在大量中文寫作用不上的詞,而中文寫作所真正需要經(jīng)常使用的詞組卻又相對(duì)匱乏(例如成語(yǔ)、歇后語(yǔ)等),因此大大限制了其可用性。
第三部分發(fā)明內(nèi)容第一節(jié)、本發(fā)明的目的隨著中國(guó)經(jīng)濟(jì)持續(xù)高速增長(zhǎng)、中國(guó)加入WTO、經(jīng)濟(jì)全球化的不斷推進(jìn),漢語(yǔ)在國(guó)際上的地位不斷提高,漢語(yǔ)越來(lái)越被全世界人民所重視,很多國(guó)家的高等院校紛紛增設(shè)或擴(kuò)充漢語(yǔ)課程,很多外國(guó)人紛紛把漢語(yǔ)選作自己最主要的外語(yǔ),更有數(shù)以萬(wàn)計(jì)的外國(guó)留學(xué)生前來(lái)中國(guó)留學(xué)...,全球范圍內(nèi)出現(xiàn)了一股學(xué)習(xí)漢語(yǔ)的熱潮,據(jù)《參考消息》的報(bào)道,2002年來(lái)華留學(xué)生有8.58萬(wàn)人,全球有85個(gè)國(guó)家2100多所大學(xué)開設(shè)了漢語(yǔ)課程;2004年參加漢語(yǔ)水平考試(HSK)的外國(guó)考生超過(guò)10萬(wàn)人。
然而,令人遺憾的是,至今國(guó)內(nèi)外仍未出現(xiàn)真正實(shí)用意義上的英漢互譯漢字輸入方法,這與漢語(yǔ)在國(guó)際上日益上升的重要地位是不相適應(yīng)的。漢字輸入法是我國(guó)在軟件技術(shù)領(lǐng)域難得的一片擁有自主核心技術(shù)的保留地,而漢語(yǔ)教育將在全球造就一個(gè)高速成長(zhǎng)的巨大的市場(chǎng),一旦讓外國(guó)人搶先開發(fā)成功“英漢輸入法”系列并申請(qǐng)相應(yīng)專利,那么中國(guó)人豈不又要在輸入法領(lǐng)域重蹈DVD專利費(fèi)的覆轍?由此而造成的損失將會(huì)比DVD專利費(fèi)的損失大得多!如此,中國(guó)人將不得不反過(guò)來(lái)向外國(guó)人購(gòu)買中國(guó)老祖宗留下的文化遺產(chǎn),這對(duì)于中國(guó)人來(lái)說(shuō)不僅是貽笑大方,而且更是中國(guó)文化歷史的悲哀和恥辱。為此,必須搶在外國(guó)人之前發(fā)明出真正實(shí)用可普及的“英漢輸入法”,因此,針對(duì)現(xiàn)有輸入法的不足,本發(fā)明人本著以下目的發(fā)明了“中英通雙向漢字輸入法”(以下簡(jiǎn)稱“中英通輸入法”)一、為中國(guó)人提供在日常工作和生活中大量學(xué)習(xí)和使用英語(yǔ)詞語(yǔ)的可行機(jī)會(huì)和實(shí)用工具;讓中國(guó)人通過(guò)漢字輸入這種日?;顒?dòng),潛移默化地學(xué)習(xí)、使用和掌握大量的英語(yǔ)詞匯;在不增加社會(huì)教育資源耗費(fèi)、不增加個(gè)人學(xué)習(xí)時(shí)間開銷的情況下,顯著地促進(jìn)中國(guó)人英語(yǔ)水平的快速提高,增強(qiáng)中國(guó)人在國(guó)際勞動(dòng)力市場(chǎng)和國(guó)際貿(mào)易市場(chǎng)上的競(jìng)爭(zhēng)力;二、為外國(guó)人學(xué)習(xí)漢語(yǔ)提供有效的輔助工具,促進(jìn)漢語(yǔ)走向世界、成為國(guó)際化的強(qiáng)勢(shì)語(yǔ)種,為中華民族的偉大復(fù)興作貢獻(xiàn);三、為外國(guó)人提供輸入漢字的便捷工具,促進(jìn)漢語(yǔ)成為國(guó)際通行語(yǔ)言;四、通過(guò)在中文語(yǔ)言環(huán)境中以中國(guó)的語(yǔ)言思維方式大規(guī)模地使用英語(yǔ)詞匯,使英語(yǔ)在某種程度上被“漢化”改造,逐步讓國(guó)際英語(yǔ)變成有中國(guó)特色的“世界英語(yǔ)”,而不再僅僅是“不列顛英語(yǔ)”或“波士頓英語(yǔ)”,結(jié)束長(zhǎng)期以來(lái)漢語(yǔ)文化在與英語(yǔ)文化交流中的弱勢(shì)。
五、通過(guò)改變?nèi)藗冚斎霛h字的習(xí)慣,使英語(yǔ)在使用上變成漢語(yǔ)的標(biāo)簽和附庸,從而減少甚至避免英語(yǔ)舶來(lái)詞語(yǔ)在漢語(yǔ)中的直接引用,以抵御英語(yǔ)文化對(duì)漢語(yǔ)文化本體純潔性的侵蝕。
六、保衛(wèi)“漢字輸入法”這一片中國(guó)人的文化和技術(shù)領(lǐng)地免受外部占領(lǐng)。
第二節(jié)、技術(shù)方案隨著中外經(jīng)貿(mào)、科技和文化交流的蓬勃發(fā)展,中國(guó)需要大批外語(yǔ)人才,中國(guó)有數(shù)以億計(jì)的人在長(zhǎng)年累月地學(xué)英語(yǔ),中國(guó)人學(xué)英語(yǔ)的人數(shù)比起英美兩國(guó)的人口還多,中國(guó)人在英語(yǔ)教學(xué)方面的投入十分驚人(甚至在很多時(shí)候超過(guò)了對(duì)漢語(yǔ)教育的投入!),教育部門對(duì)英語(yǔ)教育也極其重視,但英語(yǔ)教學(xué)的效果卻一直是強(qiáng)差人意,經(jīng)歷了幾十年的努力,能夠精通英語(yǔ)的人仍是百中無(wú)幾,其中一個(gè)主要的原因是在中國(guó)學(xué)習(xí)英語(yǔ)缺乏運(yùn)用英語(yǔ)的語(yǔ)言環(huán)境,英語(yǔ)學(xué)習(xí)與工作和生活嚴(yán)重脫節(jié),大部分人所學(xué)的英語(yǔ)僅僅被用于應(yīng)付考試,而在日常生活和工作中根本用不上英語(yǔ)或極少用得上英語(yǔ),因此英語(yǔ)知識(shí)和技能難以得到鞏固和提高,就像沒有根的樹必然會(huì)凋萎、沒有源的水必然會(huì)干枯,學(xué)而無(wú)用的英語(yǔ)久而久之就使人們失去了興趣和信心。對(duì)此,人們想出了不少點(diǎn)子,例如有人在家里的每一件物品上貼上相應(yīng)的英語(yǔ)單詞,例如在床上貼“bed”、電視機(jī)上貼television、冰箱上貼refrigerator......等等,這樣做確實(shí)能收到一些效果,但局限性很大,能貼標(biāo)簽的東西畢竟非常有限,人們總不能為了學(xué)英語(yǔ)而在臉上貼“face”、在鼻子上貼“nose”、在顧客的額頭上貼“customer”吧?因此這種做法注定收效甚微。對(duì)此,本發(fā)明人經(jīng)過(guò)長(zhǎng)期的思索,終于發(fā)明了一種方便快捷、行之有效而且成本低廉的解決辦法,就是“語(yǔ)言標(biāo)簽教學(xué)法”。
所謂“語(yǔ)言標(biāo)簽教學(xué)法”,就是給每一個(gè)漢語(yǔ)字詞“貼”上英文詞語(yǔ)的標(biāo)簽,讓用戶在使用每一個(gè)漢語(yǔ)字詞時(shí)都能同時(shí)看到相應(yīng)的英語(yǔ)詞匯,這樣就能為用戶創(chuàng)造一個(gè)英漢雙語(yǔ)并存的詞語(yǔ)使用和思維環(huán)境,令用戶在日常的語(yǔ)言思維中能夠頻繁地、與自己的思路密切相關(guān)地接觸到大量實(shí)用的英文詞語(yǔ),從而潛移默化地學(xué)習(xí)和掌握大量實(shí)用英文詞語(yǔ)?!罢Z(yǔ)言標(biāo)簽教學(xué)法”在實(shí)物世界里是匪夷所思的,語(yǔ)言又怎能貼上標(biāo)簽?但在電腦的軟件世界里卻是切實(shí)可行的。只要在我們慣用的拼音、活字碼(專利申請(qǐng)?zhí)?00410027961.8,以下同)、五筆字型等傳統(tǒng)的漢字輸入法的碼表中,在每個(gè)字詞的輸入編碼后追加相應(yīng)的英文詞語(yǔ)(與原來(lái)的編碼之間用兩個(gè)半角減號(hào)“--”分隔),在使用該輸入法時(shí),就可以通過(guò)我們習(xí)以為常的“編碼提示”功能,在編碼提示欄(選字欄)的相應(yīng)漢語(yǔ)字詞后面顯示出其對(duì)應(yīng)的英語(yǔ)詞語(yǔ)的完整拼寫,筆者稱這種編碼方式為“漢英碼”。
與“漢英碼”相對(duì)應(yīng)的反向編碼方式是“英漢碼”,“英漢碼”就是通過(guò)鍵入英文詞語(yǔ)編碼,向電腦輸入相應(yīng)的中文詞語(yǔ),同時(shí)顯示該中文詞語(yǔ)的傳統(tǒng)的漢字輸入法編碼,其原理是直接用英文詞語(yǔ)作為其對(duì)應(yīng)中文詞語(yǔ)的輸入編碼,再在每一個(gè)英語(yǔ)字詞編碼后面,用半角等號(hào)“=”分隔后追加相應(yīng)的傳統(tǒng)的漢字輸入法編碼(例如拼音、活字碼、五筆字型等編碼),,在使用該輸入法時(shí),就可以用直接鍵入英文詞語(yǔ)來(lái)輸入中文詞語(yǔ)并可在編碼提示欄(選字欄)上顯示相應(yīng)中文詞語(yǔ)的漢字輸入法編碼(例如拼音、活字碼、五筆字型等編碼)。
如果把“漢英碼”、“英漢碼”同時(shí)編入一個(gè)輸入法碼表,那么更會(huì)產(chǎn)生意想不到的理想效果,使用該輸入法,當(dāng)鍵入英語(yǔ)詞語(yǔ)編碼時(shí),電腦可輸入相應(yīng)的中文,并可在編碼提示欄(選字欄)上顯示相應(yīng)的中文詞語(yǔ)及其中文輸入法編碼,外國(guó)人(或懂英語(yǔ)的中國(guó)人)就能很方便地運(yùn)用英語(yǔ)字詞編碼輸入中文字詞,同時(shí)又能很方便地學(xué)習(xí)相應(yīng)中文詞語(yǔ)的中文輸入法編碼(例如拼音、活字碼、五筆字型等編碼);當(dāng)鍵入中文輸入法編碼時(shí),電腦可輸入相應(yīng)的中文,并在編碼提示欄(選字欄)上顯示相應(yīng)的中文詞語(yǔ)及其對(duì)應(yīng)的英文詞語(yǔ)編碼,我國(guó)的英語(yǔ)學(xué)員就能在很方便地輸入中文詞語(yǔ)的同時(shí),學(xué)習(xí)對(duì)應(yīng)的英文詞語(yǔ);英語(yǔ)詞匯量少的用戶,開始時(shí)可以用拼音或活字碼、五筆字型等常規(guī)的輸入法輸入中文詞語(yǔ),同時(shí)通過(guò)“編碼提示”功能,透過(guò)編碼提示欄(選字欄)上的顯示,頻繁接觸大量的英文詞語(yǔ),潛移默化之中,便可在不知不覺之中記住一些常見的英語(yǔ)詞語(yǔ),之后這部份英語(yǔ)詞語(yǔ)所對(duì)應(yīng)的中文詞語(yǔ),就可以使用英語(yǔ)字詞編碼輸入,通過(guò)長(zhǎng)期使用本輸入法,就能記住越來(lái)越多的英文詞語(yǔ),用戶使用英語(yǔ)字詞編碼輸入漢字詞語(yǔ)的比例就會(huì)越來(lái)越高,用戶的英語(yǔ)詞匯量也就會(huì)循序漸進(jìn)地不斷得到有效的擴(kuò)充和鞏固。
在中國(guó)每天都有數(shù)千萬(wàn)人在進(jìn)行大量的漢字輸入工作,例如作家、編輯、文員、科技工作者、機(jī)關(guān)工作人員、上網(wǎng)聊天者、教師、學(xué)生等等,用電腦輸入中文已是中國(guó)現(xiàn)代人生活中的不可分割的一部份,職業(yè)的文字工作者更是幾乎整天都在對(duì)著電腦進(jìn)行中文輸入操作。當(dāng)人們苦于缺乏時(shí)間和精力學(xué)習(xí)英語(yǔ)、沒有機(jī)會(huì)運(yùn)用英語(yǔ)的時(shí)候,大量可用于學(xué)習(xí)和運(yùn)用英語(yǔ)詞匯的時(shí)間和機(jī)會(huì),卻又一直在不知不覺之中無(wú)聲無(wú)息地白白流逝,從不被人發(fā)現(xiàn)和利用過(guò)。如果一邊輸入漢字的同時(shí)能夠一邊自然而然地接觸和學(xué)習(xí)對(duì)應(yīng)的英語(yǔ)詞匯,那么人們學(xué)習(xí)英語(yǔ)詞匯的時(shí)間將是唾手可得;如果漢語(yǔ)字詞都能用英語(yǔ)的相應(yīng)詞語(yǔ)作為輸入編碼來(lái)輸入,那么中文打字就變成了活用英語(yǔ)詞匯的大舞臺(tái),那么人們大量運(yùn)用英語(yǔ)詞匯的機(jī)會(huì)也將變得唾手可得,并且還極有利于形成中英雙語(yǔ)思維,從根本上提高英語(yǔ)水平。由此可見,本發(fā)明人發(fā)明的“語(yǔ)言標(biāo)簽教學(xué)法”與各種漢字輸入法相結(jié)合,編成各種版本的“漢英碼”、“英漢碼”、“雙向碼”并廣為普及,將會(huì)大大改善中國(guó)人學(xué)習(xí)英語(yǔ)和運(yùn)用英語(yǔ)的環(huán)境,甚至可望在中國(guó)掀起一場(chǎng)英語(yǔ)教學(xué)方式的革命。
第三節(jié)、本發(fā)明所取得的突破性成果哥倫布發(fā)現(xiàn)新大陸后,得到女王的重賞,在慶功宴上,不少人對(duì)此憤憤不平,認(rèn)為哥倫布沒什么了不起的,更有人聲言“這再簡(jiǎn)單不過(guò)了,給我船隊(duì),我也能發(fā)現(xiàn)新大陸!”,為此,哥倫布取來(lái)一個(gè)雞蛋,對(duì)這些人說(shuō)“先生們,你們當(dāng)中有誰(shuí)可以使雞蛋在桌上豎立不倒?”,不少人反復(fù)試過(guò)多次,但都失敗了,其余的人面面相覷、無(wú)言以對(duì),哥倫布當(dāng)著這些人的面,把雞蛋的一端輕輕敲破一點(diǎn)兒,于是雞蛋就可以在桌上豎著屹立不倒了。哥倫布平靜地說(shuō)“這再簡(jiǎn)單不過(guò)了!任何人都可以做的——在有人做過(guò)了以后?!?,偉大的發(fā)明在公諸于眾后,往往看似“再簡(jiǎn)單不過(guò)”和“顯而易見”的。門捷列夫在夢(mèng)中發(fā)明了的《元素周期表》,愛因斯坦在奔馳的馬車上萌生了《狹義相對(duì)論》的基本思想,這一切似乎是那么輕松寫意、那么幸運(yùn),仿佛是上天對(duì)他們的格外眷顧,然而這背后卻是他們長(zhǎng)期努力研究、不懈探索和艱苦思索的結(jié)晶。
“中英通輸入法”的原理看似簡(jiǎn)單,但為什么這樣簡(jiǎn)單的原理,在本發(fā)明出現(xiàn)之前這么長(zhǎng)的時(shí)間就一直沒有被人們實(shí)施和公開過(guò)?因?yàn)楸景l(fā)明也同樣凝聚了發(fā)明人長(zhǎng)期的研究和思索、開拓性的艱辛創(chuàng)造和長(zhǎng)期艱苦繁重的勞動(dòng),并且通過(guò)多方面的知識(shí)和技能的綜合活用,才取得了如此顯著的突破和進(jìn)步,與現(xiàn)有的輸入法相比,“中英通輸入法”具有本質(zhì)性的飛躍,它具有以下顯著的優(yōu)點(diǎn)一、意想不到的雙向教學(xué)性能本輸入法除了具有輸入漢語(yǔ)字詞的功能外,同時(shí)具有方便外國(guó)人學(xué)習(xí)漢語(yǔ)和方便中國(guó)人學(xué)習(xí)英語(yǔ)的理想效果,而且不會(huì)增加社會(huì)教育資源的花費(fèi),也不會(huì)增加用戶在學(xué)習(xí)時(shí)間上的開銷;在一定程度上還創(chuàng)造了日常工作和生活中所缺乏的漢英雙語(yǔ)環(huán)境,此舉將顯著改善中國(guó)人的英語(yǔ)學(xué)習(xí)條件,這是任何現(xiàn)有已公開的輸入法所不具備的突出優(yōu)點(diǎn)。
二、完整性6763個(gè)國(guó)標(biāo)漢字都可通過(guò)英語(yǔ)字詞編碼輸入,并且可以輸入55000多個(gè)漢語(yǔ)詞組、成語(yǔ)、歇后語(yǔ),是一個(gè)充分和完整的漢語(yǔ)字詞編碼體系,而不僅僅是英語(yǔ)字詞在個(gè)別漢語(yǔ)字詞上的編碼應(yīng)用。
三、雙向性可以鍵入英語(yǔ)字詞編碼而輸入漢語(yǔ)字詞并顯示漢語(yǔ)輸入法編碼,也可以輸入漢語(yǔ)輸入法編碼而輸入漢語(yǔ)字詞同時(shí)顯示相應(yīng)的英語(yǔ)詞語(yǔ)。
四、實(shí)用性可以輸入55000多個(gè)實(shí)用漢語(yǔ)詞組,這些詞語(yǔ)都是選自現(xiàn)代漢語(yǔ)詞典、漢語(yǔ)成語(yǔ)詞典、雙語(yǔ)經(jīng)典語(yǔ)詞典等權(quán)威的漢語(yǔ)典籍,能夠普遍適應(yīng)于漢語(yǔ)寫作的需要和用語(yǔ)習(xí)慣,而不僅僅是英語(yǔ)字詞在個(gè)別詞組上的應(yīng)用,也不是英漢詞典的簡(jiǎn)單反向翻譯;涵蓋了23000多個(gè)精選的實(shí)用英語(yǔ)通用詞語(yǔ),可完全滿足英語(yǔ)人士的一般語(yǔ)言表達(dá)需要和表達(dá)習(xí)慣,而不僅僅是個(gè)別英文單詞在個(gè)別漢語(yǔ)字詞上的編碼,也不是冷僻英語(yǔ)詞語(yǔ)的隨意拼湊;五、通用性“中英通輸入法”的編碼規(guī)則可應(yīng)用于現(xiàn)有任何漢字鍵盤輸入編碼技術(shù),例如而不限于拼音、五筆字型、活字碼等等,可使后者很容易增加英語(yǔ)教學(xué)的功能;“語(yǔ)言標(biāo)簽教學(xué)法”也不僅僅限于英語(yǔ),也可用于各種可用鍵盤字母拼寫語(yǔ)言,例如法語(yǔ)、德語(yǔ)、意大利語(yǔ)、西班牙語(yǔ)、俄語(yǔ)、葡萄牙語(yǔ),等等,“語(yǔ)言標(biāo)簽教學(xué)法”應(yīng)用于這些外語(yǔ),可編碼為“中法通”、“中德通”、“中意通”“中西通”“中俄通”“中葡通”等等多語(yǔ)種應(yīng)用形式。
六、便捷性對(duì)具有相同英語(yǔ)字詞輸入編碼的重碼漢語(yǔ)詞語(yǔ),均按漢語(yǔ)詞語(yǔ)的使用頻度由高至低排序,這樣有利于方便常用漢字詞語(yǔ)的輸入,大大提高了漢字輸入的效率;對(duì)于具有多個(gè)英語(yǔ)字詞輸入編碼的漢語(yǔ)字詞,在其漢英編碼中所追加的相應(yīng)英語(yǔ)詞語(yǔ)編碼,按英語(yǔ)詞語(yǔ)的實(shí)用價(jià)值由高至低排序,這樣能夠方便用戶學(xué)習(xí)常用的英語(yǔ)詞語(yǔ),大大提高了英漢輸入的實(shí)用性。
第四部分、本發(fā)明的具體實(shí)施方式
中英通輸入法是通過(guò)科學(xué)嚴(yán)謹(jǐn)?shù)囊?guī)則和步驟,經(jīng)過(guò)大量艱苦細(xì)致的工作而開發(fā)成功的一項(xiàng)巨大信息工程,其實(shí)施方式和步驟如下一、英漢詞匯對(duì)照碼表的建立(一)、“中文實(shí)用詞庫(kù)”(1號(hào)庫(kù))的建立和各單字、詞組的使用價(jià)值評(píng)估1.為了確保中英通輸入法收錄詞條的規(guī)范性、實(shí)用性、豐富性,本發(fā)明人廣泛收集了規(guī)范詞語(yǔ)工具書中的詞條,從《現(xiàn)代漢語(yǔ)詞典》(商務(wù)印書館2002年增補(bǔ)本)、《漢語(yǔ)成語(yǔ)小詞典》(商務(wù)印書館2003年修訂本)、《雙語(yǔ)經(jīng)典語(yǔ)》(四川人民出版社ISBN7-220-05843-8/H·282)、WINDOWS全拼輸入法碼表、五筆字型86版輸入法碼表、五筆字型98版輸入法碼表等來(lái)源,共收集到中文詞組和習(xí)語(yǔ)85000多條,全部錄入電腦數(shù)據(jù)庫(kù)文件中。
2.從前述85000多中文詞組中,刪除其中的冷僻詞,精選出實(shí)用中文詞組55000多條,另加上6763個(gè)國(guó)標(biāo)一二級(jí)單字,從而建立了“中文實(shí)用詞庫(kù)”數(shù)據(jù)庫(kù)文件。
3.對(duì)6763個(gè)國(guó)標(biāo)一二級(jí)單字進(jìn)行使用價(jià)值評(píng)估通過(guò)電腦數(shù)據(jù)庫(kù)編程技術(shù),根據(jù)各單字在55000個(gè)實(shí)用詞組中的出現(xiàn)次數(shù),作為其使用價(jià)值的評(píng)分,在各詞組中出現(xiàn)率較高的單字的使用價(jià)值相應(yīng)較高,對(duì)于具有相同英語(yǔ)輸入編碼的不同漢字,根據(jù)其使用價(jià)值由高到低在輸入法碼表中排序,以此提高中文單字的輸入效率。
4.對(duì)55000個(gè)實(shí)用詞組進(jìn)行使用價(jià)值評(píng)估,根據(jù)漢字的一般組詞規(guī)律,由高頻單字組成的詞組比由高頻單字組成的詞組的使用價(jià)值更高,因此,本發(fā)明創(chuàng)造了一條簡(jiǎn)易公式各詞組的實(shí)用價(jià)值評(píng)分=所含單字的使用價(jià)值評(píng)分的幾何平均值,通過(guò)電腦數(shù)據(jù)庫(kù)編程技術(shù),把各詞組所含單字的使用價(jià)值數(shù)據(jù)代入此公式,即可計(jì)算各詞組的實(shí)用價(jià)值評(píng)分。對(duì)于具有相同英語(yǔ)輸入編碼的不同中文詞組,根據(jù)其使用價(jià)值由高到低在輸入法碼表中排序,以此提高中文詞組的輸入效率。
(二)、“漢英詞典參考詞庫(kù)”(2號(hào)庫(kù))的建立1.利用UCDOS中附帶的UCDICT《漢英詞典》,提取其中的出全部漢英對(duì)照詞目94000多條,全部錄入電腦數(shù)據(jù)庫(kù)文件中;2.對(duì)于《漢英詞典》中未被收錄的一些國(guó)標(biāo)一二級(jí)單字,給予補(bǔ)充并翻譯其相應(yīng)的英語(yǔ)字詞;3.通過(guò)《金山詞霸2002》軟件,對(duì)每一條詞語(yǔ)的英語(yǔ)解釋進(jìn)行反查校對(duì),刪除其中與漢字詞語(yǔ)關(guān)系不密切的英語(yǔ)詞語(yǔ);4.對(duì)于小量無(wú)法意譯的單字,例如曹、鄧、狄、龔、廖、劉、盧、呂、譚、吳、鄒......,用其漢語(yǔ)拼音作為英語(yǔ)音譯。
5.經(jīng)過(guò)校對(duì)和補(bǔ)充的詞庫(kù)作為漢英對(duì)照翻譯的參考詞庫(kù)(2號(hào)庫(kù))。
(三)、“英漢詞典參考詞庫(kù)”(3號(hào)庫(kù))的建立1.詞匯的收集和詞匯數(shù)據(jù)庫(kù)的建立為了選取實(shí)用價(jià)值較高的英語(yǔ)單詞和短語(yǔ)作為中英通的英語(yǔ)字詞編碼,本發(fā)明人廣泛收集現(xiàn)有流行英語(yǔ)教材的詞匯表,建立了70個(gè)英漢詞匯數(shù)據(jù)庫(kù)文件,詳見“表1”。
2.詞庫(kù)的合并和詞匯實(shí)用價(jià)值的評(píng)估把前述的82個(gè)詞庫(kù)全部吸收到“英漢詞典參考詞庫(kù)”(3號(hào)庫(kù))中,刪除重復(fù)的詞條后,共收錄詞匯23000多條,并根據(jù)每個(gè)英語(yǔ)字詞被各種教材和詞典收錄的情況,統(tǒng)計(jì)其各自的使用分值,分值越高則實(shí)用價(jià)值越高。其中各詞庫(kù)的計(jì)分標(biāo)準(zhǔn)如“表1”表1中英通輸入法的英語(yǔ)詞匯來(lái)源和詞條使用價(jià)值評(píng)分表
根據(jù)上表,同一個(gè)單詞或短語(yǔ)如被多個(gè)詞庫(kù)收錄,則其使用價(jià)值是相應(yīng)各詞庫(kù)“使用價(jià)值積分”的總和,例如某個(gè)詞被《初中英語(yǔ)》(第一冊(cè))詞匯庫(kù)收錄,則它的實(shí)用價(jià)值評(píng)分為8,若這個(gè)詞同時(shí)又被《新概念英語(yǔ)》(第一冊(cè))詞匯庫(kù)收錄,則它的實(shí)用價(jià)值評(píng)分為8+5=13,依此類推,被較多教材廣泛收錄的詞匯的使用價(jià)值評(píng)分會(huì)相對(duì)較高,由此所得的各詞條的實(shí)用價(jià)值評(píng)分作為英語(yǔ)詞匯編碼取舍和排序的重要參考指標(biāo)。
3.詞義的賦予和校對(duì)為了確保詞英漢詞典庫(kù)中英文拼寫和中文詞義的準(zhǔn)確性,運(yùn)用《21世紀(jì)小小漢英詞典》(外語(yǔ)教學(xué)與研究出版社)、《袖珍英漢詞典》(南京大學(xué)出版社)、《金山詞霸2002》(軟件)等工具對(duì)每一條英語(yǔ)詞匯的詞義賦予其詞義并進(jìn)行校對(duì)。
(四)、把“英漢詞典參考詞庫(kù)”(3號(hào)庫(kù))的每一個(gè)多義性詞條拆解,把每個(gè)多義詞拆分成一個(gè)英語(yǔ)單詞(或短語(yǔ))對(duì)應(yīng)一個(gè)中文詞的形式,以便于使用于輸入法編碼(由于此項(xiàng)工作的勞動(dòng)量很大,為提高效率和避免人工操作的失誤,本發(fā)明人采用了電腦數(shù)據(jù)庫(kù)編程的方法讓計(jì)算機(jī)自動(dòng)處理),由此把“3號(hào)庫(kù)”建成全部為一個(gè)中文字詞對(duì)一個(gè)英語(yǔ)詞匯數(shù)據(jù)庫(kù)。
(五)、建立“中英對(duì)照編碼庫(kù)”(4號(hào)庫(kù))利用“2號(hào)庫(kù)”和“3號(hào)庫(kù)”的數(shù)據(jù),編寫專用的數(shù)據(jù)庫(kù)程序,對(duì)“中文實(shí)用詞庫(kù)”(1號(hào)庫(kù))的每一個(gè)詞條進(jìn)行查找和聯(lián)合翻譯、賦予每一個(gè)漢語(yǔ)字詞一串英語(yǔ)對(duì)應(yīng)同義詞語(yǔ)代碼,從而建立“中英對(duì)照編碼庫(kù)”(4號(hào)庫(kù)),該庫(kù)中的每個(gè)中文詞條對(duì)應(yīng)多個(gè)英文同義詞語(yǔ)代碼。
(六)、“中英對(duì)照編碼庫(kù)”(4號(hào)庫(kù))的改進(jìn)和完善由于4號(hào)庫(kù)中漢語(yǔ)字詞和英語(yǔ)詞語(yǔ)之間不是一一對(duì)應(yīng)的,一個(gè)漢語(yǔ)字詞對(duì)應(yīng)多個(gè)英語(yǔ)詞語(yǔ),而一個(gè)英語(yǔ)詞語(yǔ)又對(duì)應(yīng)多個(gè)漢語(yǔ)字詞,這樣會(huì)形成大量的重碼字詞和重復(fù)字詞,致使輸入法編碼過(guò)于龐大而且低效,因此有必要精簡(jiǎn)對(duì)漢英字詞之間的對(duì)應(yīng)關(guān)系,優(yōu)選和保留實(shí)用度高的編碼,刪除實(shí)用度低的編碼,其實(shí)施方法為1.利用電腦數(shù)據(jù)庫(kù)技術(shù),把“4號(hào)庫(kù)”所有多義漢語(yǔ)字詞拆分成一個(gè)漢語(yǔ)字詞對(duì)一個(gè)英語(yǔ)字詞的記錄形式,使“4號(hào)庫(kù)”轉(zhuǎn)變成英漢一對(duì)一格式。
2.利用電腦數(shù)據(jù)庫(kù)技術(shù),以“中文字詞”作為第一關(guān)鍵字,以“英語(yǔ)字詞”的實(shí)用價(jià)值(由高到低的降序)作為第二關(guān)鍵字,將“4號(hào)庫(kù)”的全部數(shù)據(jù)記錄進(jìn)行索引排序。排序后把中文字詞相同的不同英語(yǔ)字詞按照其實(shí)用度高低的先后順序編予“E序號(hào)”(從1開始的連續(xù)正整數(shù))。
3.利用電腦數(shù)據(jù)庫(kù)技術(shù),以“英語(yǔ)字詞”作為第一關(guān)鍵字,以“中文字詞”的實(shí)用價(jià)值(由高到低的降序)作為第二關(guān)鍵字,將“4號(hào)庫(kù)”的全部數(shù)據(jù)記錄進(jìn)行索引排序。
排序后把英語(yǔ)字詞相同的不同中文字詞按照其實(shí)用度高低的先后順序編予“C序號(hào)”(從1開始的連續(xù)正整數(shù))。
4.刪除所有“E序號(hào)”大于3或者“C序號(hào)”大于1的中文單字?jǐn)?shù)據(jù)記錄,這樣剩下的每個(gè)中文單字最多可保留三個(gè)最實(shí)用的英語(yǔ)字詞表達(dá)方式;可以表達(dá)漢語(yǔ)單字的英語(yǔ)字詞都有至少有一個(gè)最實(shí)用的記錄被保留,而其他非首選的漢語(yǔ)單字編碼方式則被刪除,這樣在保持英語(yǔ)字詞編碼豐富性的同時(shí)又大大減少了重復(fù)的漢語(yǔ)單字編碼數(shù)據(jù),大大提高了單字編碼的簡(jiǎn)潔性和實(shí)用性。
5.刪除所有“E序號(hào)”大于1并且“C序號(hào)”大于1的中文詞組數(shù)據(jù)記錄,這樣剩下的每個(gè)中文詞組至少留一個(gè)最優(yōu)的英語(yǔ)字詞編碼表達(dá)方式,可以表達(dá)漢語(yǔ)單字的英語(yǔ)字詞編碼都有至少保留一個(gè)最實(shí)用的記錄,而非最實(shí)用的編碼方式則被刪除,這樣在保持英語(yǔ)字詞編碼豐富性的同時(shí)又大大減少了重復(fù)的漢語(yǔ)詞組編碼數(shù)據(jù),大大提高了詞組編碼的簡(jiǎn)潔性和實(shí)用性。
6.英語(yǔ)字詞重碼字詞的排序把英語(yǔ)字詞編碼相同的不同中文字詞編碼按“C序號(hào)”升序排序,以提高編碼的實(shí)用性,經(jīng)過(guò)排序后的數(shù)據(jù)表(5號(hào)庫(kù)),形成一套英漢詞語(yǔ)對(duì)照表,適用于“英譯中輸入”編碼。
7.經(jīng)過(guò)步驟“6.”處理后的數(shù)據(jù)表(5號(hào)庫(kù)),是一個(gè)漢字對(duì)一個(gè)英語(yǔ)單詞的數(shù)據(jù)表,把編碼數(shù)據(jù)按“E序號(hào)”升序排序,然后把多個(gè)中文詞語(yǔ)相同的數(shù)據(jù)記錄合并為一個(gè)漢語(yǔ)字詞對(duì)應(yīng)多個(gè)英語(yǔ)字詞的形式,這樣的數(shù)據(jù)表(6號(hào)庫(kù)),形成一套漢英詞語(yǔ)對(duì)照表,適用于“中譯英輸入”編碼。
經(jīng)過(guò)上述“(一)”至“(六)”的步驟,完成了“英漢詞匯對(duì)照碼表”數(shù)據(jù)庫(kù)(4號(hào)庫(kù))、英譯中輸入”編碼數(shù)據(jù)表(5號(hào)庫(kù))的建立并應(yīng)用于中英通輸入法的“英譯中編碼”、完成了中譯英輸入”編碼數(shù)據(jù)表(6號(hào)庫(kù))的建立并應(yīng)用于中英通輸入法的“中譯英編碼”。
二、中英通輸入法的編碼規(guī)則1.中英通輸入法的碼表格式中英通輸入法碼表的表頭按WINDOWS通用碼表的規(guī)則編碼。碼表的主體部份由每個(gè)字詞的編碼行組成,每個(gè)編碼行由連續(xù)的兩大部份組成第一部份為“漢語(yǔ)字詞”,緊接每行的最左側(cè)排列;第二部份是與第一部份相對(duì)應(yīng)的“鍵盤符號(hào)編碼”,緊接第一部份的右側(cè)排列。“漢語(yǔ)字詞”就是需要用輸入法輸入的各個(gè)中文單字或字串;“鍵盤符號(hào)編碼”是指按一定的規(guī)則編制的用以指引輸入法系統(tǒng)輸入相應(yīng)漢語(yǔ)字詞的鍵盤符號(hào)或符號(hào)串。
中英通輸入法的碼表可使用WINDOWS98、WIN2000、WINXP自帶的輸入法生成器程序(IMEGEN.EXE)編譯和安裝到相應(yīng)的操作系統(tǒng)中。
1)中英通輸入法的碼表中表頭的格式,每行前面不留空格,根據(jù)拼音、五筆字型、活字碼等輸入法的規(guī)則而相應(yīng)設(shè)定,應(yīng)用于相應(yīng)的編碼方式,例如[Description]Name=中英通輸入法MaxCodes=38MaxElement=2UsedCodes=abcdefghijklmnopqrstuvwxyz,/;′[]=-WildChar?NumRules=3ca4=p11+p21+p31+n11ce2=p11+p12+p21+p22ce3=p11+p21+p31+32[Text]2)中英通輸入法的碼表在主體部份從緊接表頭中“[Text]”之后的一行開始,每行的格式為 2.每行“鍵盤符號(hào)編碼”的構(gòu)成中英通輸入法的每行“鍵盤符號(hào)編碼”由連續(xù)緊鄰的“傳統(tǒng)的漢字輸入法編碼”和“英語(yǔ)字詞編碼”兩部份組成“傳統(tǒng)的漢字輸入法編碼”是指按“拼音輸入法”、“五筆字型輸入法”、“活字碼輸入法”或其他流行的鍵盤漢字輸入編碼規(guī)則編制的鍵盤符號(hào)編碼(以下同);“英語(yǔ)字詞編碼”是與所輸入的漢語(yǔ)字詞含義相對(duì)應(yīng)的英語(yǔ)字詞編碼。
3.每行“鍵盤符號(hào)編碼”的排列方式“傳統(tǒng)的漢字輸入法編碼”和“英語(yǔ)字詞編碼”在每行“鍵盤符號(hào)編碼”中的先后順序根據(jù)編碼的目的不同而異,可有兩種排列方式(1)英譯中編碼方式需要鍵入英語(yǔ)詞語(yǔ)而輸入漢字并顯示“傳統(tǒng)的漢字輸入法編碼”的,“英語(yǔ)字詞編碼”在“鍵盤符號(hào)編碼”中居左側(cè)位置,“傳統(tǒng)的漢字輸入法編碼”在“鍵盤符號(hào)編碼”中居右側(cè)位置。
英譯中編碼方式每行格式 (2)中譯英編碼方式需要鍵入“傳統(tǒng)的漢字輸入法編碼”(拼音、五筆字型、活字碼等等編碼)而輸入漢字并顯示相應(yīng)英語(yǔ)詞語(yǔ)的,“傳統(tǒng)的漢字輸入法編碼”在“鍵盤符號(hào)編碼”中居左側(cè)位置,“英語(yǔ)字詞編碼”在“鍵盤符號(hào)編碼”中居右側(cè)位置。
中譯英編碼方式每行格式 4.“鍵盤符號(hào)編碼”中的分隔符號(hào)(1)“傳統(tǒng)的漢字輸入法編碼”和“英語(yǔ)字詞編碼”的分隔符號(hào)在中譯英編碼中,“傳統(tǒng)的漢字輸入法編碼”和“英語(yǔ)字詞編碼”之間用兩個(gè)半角減號(hào)“--”分隔; 在英譯中編碼中,“英語(yǔ)字詞編碼”和“傳統(tǒng)的漢字輸入法編碼”之間用壹個(gè)半角等號(hào)“=”分隔;中譯英方式 (2)有些“英語(yǔ)字詞編碼”不是英語(yǔ)單詞,而是英語(yǔ)短語(yǔ),對(duì)短語(yǔ)構(gòu)成的“英語(yǔ)字詞編碼”,使用“/”代替英文短語(yǔ)中的空格。
例如“按兵不動(dòng)”的“英語(yǔ)字詞編碼”為“take/no/action”其活字碼編碼為“abbd”;因此,“按兵不動(dòng)”一詞的“活字碼”中譯英輸入編碼為“按兵不動(dòng)abbd--take/no/action”;“按兵不動(dòng)”一詞的“活字碼”英譯中輸入編碼為“按兵不動(dòng)take/no/action=abbd”(3)在中譯英編碼方式中,允許二個(gè)或多個(gè)不同的“英語(yǔ)字詞編碼”同時(shí)存在于一個(gè)漢語(yǔ)字詞的編碼之中(一詞多義),不同的“英語(yǔ)字詞編碼”之間用一個(gè)半角分號(hào)“;”分隔。
……例如“產(chǎn)”一字的“拼音中英通輸入法”中譯英編碼為“產(chǎn)chan--produce;property;lay”5.單向輸入法編碼的單獨(dú)使用按照“英譯中編碼方式”編成的編碼,單獨(dú)安裝到輸入法軟件中,即實(shí)現(xiàn)了“輸入英文打出中文及顯示傳統(tǒng)的漢字輸入法編碼”的英漢學(xué)習(xí)和輸入漢字的效果;按照“中譯英編碼方式”編成的編碼,單獨(dú)安裝到輸入法軟件中,即實(shí)現(xiàn)了“輸入傳統(tǒng)的漢字輸入法編碼打出中文及顯示英文輸入編碼”的漢英學(xué)習(xí)和輸入漢字的效果。
6.雙向輸入法編碼的集成使用按照“英譯中編碼方式”編成的編碼和按照“中譯英編碼方式”編成的編碼,同時(shí)收集到一個(gè)輸入法碼表中,就實(shí)現(xiàn)了“輸入英文打出中文并顯示傳統(tǒng)的漢字輸入法編碼;輸入傳統(tǒng)的漢字輸入法編碼打出中文并顯示英文輸入編碼”的雙向?qū)W習(xí)和漢字輸入效果。
7.“拼音中英通雙向輸入法”的拼音編碼簡(jiǎn)化規(guī)則由于傳統(tǒng)全拼輸入法的編碼比較長(zhǎng),如再加上英語(yǔ)字詞編碼和分隔符號(hào),將會(huì)形成幾十位長(zhǎng)的輸入編碼,這對(duì)于漢字輸入效率和教學(xué)效果都會(huì)產(chǎn)生不利的影響,因此在“拼音中英通雙向輸入法”的編碼過(guò)程中,必須對(duì)傳統(tǒng)全拼輸入法進(jìn)行簡(jiǎn)化。本發(fā)明中約定拼音部份編碼的簡(jiǎn)化規(guī)則為1)漢字單字、二字詞使用全拼編碼;2)由三個(gè)或三以個(gè)漢字組成的多字詞,使用每個(gè)漢字的全拼首字母串成的拼音縮寫作為拼音。
8.單字編碼優(yōu)先于詞組編碼,中譯英編碼優(yōu)先于英譯中編碼在輸入法編碼表中,單字的編碼優(yōu)先于詞組的編碼(當(dāng)單字的輸入編碼和詞組的輸入編碼相同時(shí),單字編碼排在較前的編碼行);中譯英編碼優(yōu)先于英譯中編碼(當(dāng)中譯英編碼中的傳統(tǒng)的漢字輸入法編碼部份,與其他字詞的英譯中編碼中的英語(yǔ)編碼部份相同時(shí),中譯英編碼排在較前的編碼行)。
三、中英通雙向輸入法編碼表文件及其安裝使用1.本發(fā)明人已經(jīng)編制完成6763個(gè)國(guó)標(biāo)一二級(jí)漢字和55000個(gè)漢語(yǔ)詞語(yǔ)的“拼音中英通雙向輸入法碼表”。
2.本發(fā)明人已經(jīng)編制完成6763個(gè)國(guó)標(biāo)一二級(jí)漢字和55000個(gè)漢語(yǔ)詞組的“五筆字型中英通雙向輸入法碼表”。
3.本發(fā)明人已經(jīng)編制完成6763個(gè)國(guó)標(biāo)一二級(jí)漢字和55000個(gè)漢語(yǔ)詞組的“活字碼中英通雙向輸入法碼表”。
4.本發(fā)明人編制的中英通雙向漢字輸入法碼表,可加入到WINDOWS通用輸入法標(biāo)準(zhǔn)TXT格式的碼表文件中,使用WINDOWS98、WIN2000、WINXP自帶的輸入法生成器程序(IMEGEN.EXE)編譯和安裝到相應(yīng)WINDOWS系統(tǒng)中自由使用于各種文字處理軟件。
權(quán)利要求
1.一種漢字電腦鍵盤輸入法編碼方法和編碼方案,它包括①一種使輸入法具有中英雙向翻譯提示功能的編碼規(guī)則(以下簡(jiǎn)稱“中英通編碼規(guī)則”)、②一種對(duì)中文單字的實(shí)用進(jìn)行性評(píng)估的方法、③一種對(duì)中文詞組的實(shí)用性進(jìn)行評(píng)估方法、④一種對(duì)英文字詞的實(shí)用性進(jìn)行評(píng)估的方法、⑤一種對(duì)輸入法編碼按其字詞的實(shí)用性進(jìn)行排序和篩選的方法、⑥一種拼音輸入法編碼的簡(jiǎn)化規(guī)則、⑦一套英漢詞語(yǔ)對(duì)照表和一套漢英詞語(yǔ)對(duì)照表、⑧一套“拼音中英通輸入法”碼表、⑨一套“五筆字型中英通輸入法”碼表、⑩一套“活字碼中英通輸入法”碼表,其特征在于1)在權(quán)利要求1中①的“中英通編碼規(guī)則”,是根據(jù)本發(fā)明首創(chuàng)的“語(yǔ)言標(biāo)簽教學(xué)法”原理而創(chuàng)造的,所謂“語(yǔ)言標(biāo)簽教學(xué)法”,就是給每一個(gè)漢語(yǔ)字詞“貼”上英文詞語(yǔ)的標(biāo)簽,讓用戶在使用每一個(gè)漢語(yǔ)字詞時(shí)都能同時(shí)看到相應(yīng)的英語(yǔ)詞匯,這樣就能為用戶創(chuàng)造一個(gè)英漢雙語(yǔ)并存的詞語(yǔ)使用和思維環(huán)境,令用戶在日常的語(yǔ)言思維中能夠頻繁地、與自己的思路密切相關(guān)地接觸到大量實(shí)用的英文詞語(yǔ),從而潛移默化地學(xué)習(xí)和掌握大量實(shí)用英文詞語(yǔ)?!罢Z(yǔ)言標(biāo)簽教學(xué)法”在實(shí)物世界里是匪夷所思的,但在電腦的軟件世界里卻是切實(shí)可行的。只要在我們慣用的拼音、活字碼(專利申請(qǐng)?zhí)?00410027961.8,以下同)、五筆字型等傳統(tǒng)的漢字輸入法的碼表中,在每個(gè)字詞的輸入編碼后追加相應(yīng)的英文詞語(yǔ)(英文詞語(yǔ)與原來(lái)的漢字輸入編碼之間用兩個(gè)半角減號(hào)“--”分隔),在使用該輸入法時(shí),就可以通過(guò)我們習(xí)以為常的“編碼提示”功能,在編碼提示欄(選字欄)的相應(yīng)漢語(yǔ)字詞后面顯示出其對(duì)應(yīng)的英語(yǔ)詞語(yǔ)的完整拼寫內(nèi)容。與“漢英碼”相對(duì)應(yīng)的反向編碼方式是“英漢碼”,“英漢碼”就是通過(guò)鍵入英文詞語(yǔ)編碼,向電腦輸入相應(yīng)的中文詞語(yǔ),同時(shí)顯示該中文詞語(yǔ)的傳統(tǒng)的漢字輸入法編碼,其原理是直接用英文詞語(yǔ)作為其對(duì)應(yīng)中文詞語(yǔ)的輸入編碼,再在每一個(gè)英語(yǔ)字詞編碼后面,用一個(gè)半角等號(hào)“=”分隔后追加相應(yīng)的傳統(tǒng)的漢字輸入法編碼(例如拼音、活字碼、五筆字型等編碼),這樣就可以用直接鍵入英文詞語(yǔ)來(lái)輸入中文詞語(yǔ)并可在編碼提示欄(選字欄)上顯示相應(yīng)中文詞語(yǔ)的漢字輸入法編碼(例如拼音、活字碼、五筆字型等編碼)。2)在權(quán)利要求1中①的“中英通編碼規(guī)則”中,輸入法碼表的主體部份由每個(gè)字詞的編碼行組成,每個(gè)編碼行由連續(xù)的兩大部份組成第一部份為“漢語(yǔ)字詞”,緊接每行的最左側(cè)排列;第二部份是與第一部份相對(duì)應(yīng)的“鍵盤符號(hào)編碼”,緊接第一部份的右側(cè)排列。“漢語(yǔ)字詞”就是需要用輸入法輸入的各個(gè)中文單字或字串;“鍵盤符號(hào)編碼”是指按特定的規(guī)則編制的用以指引輸入法系統(tǒng)輸入相應(yīng)漢語(yǔ)字詞的鍵盤符號(hào)或鍵盤符號(hào)串。輸入法碼表主體部份每行的格式為 3)在權(quán)利要求1中①的“中英通編碼規(guī)則”中,輸入法碼表的主體部份每行“鍵盤符號(hào)編碼”由連續(xù)緊鄰的“傳統(tǒng)的漢字輸入法編碼”和“英語(yǔ)字詞編碼”兩部份組成“傳統(tǒng)的漢字輸入法編碼”是指按“拼音輸入法”、“五筆字型輸入法”、“活字碼輸入法”的編碼規(guī)則編制的鍵盤符號(hào)編碼(以下同);“英語(yǔ)字詞編碼”是與所輸入的漢語(yǔ)字詞含義相對(duì)應(yīng)的英語(yǔ)字詞編碼?!皞鹘y(tǒng)的漢字輸入法編碼”和“英語(yǔ)字詞編碼”在每行“鍵盤符號(hào)編碼”中的先后順序根據(jù)編碼的目的不同而異,可有兩種排列方式(1)英譯中編碼方式需要鍵入英語(yǔ)詞語(yǔ)而輸入漢字并在編碼提示欄(選字欄)上顯示“傳統(tǒng)的漢字輸入法編碼”的,“英語(yǔ)字詞編碼”在“鍵盤符號(hào)編碼”中居左側(cè)位置,“傳統(tǒng)的漢字輸入法編碼”在“鍵盤符號(hào)編碼”中居右側(cè)位置。英譯中編碼方式每行格式 (2)中譯英編碼方式需要鍵入“傳統(tǒng)的漢字輸入法編碼”而輸入漢字并在編碼提示欄(選字欄)上顯示相應(yīng)英語(yǔ)詞語(yǔ)的,“傳統(tǒng)的漢字輸入法編碼”在“鍵盤符號(hào)編碼”中居左側(cè)位置,“英語(yǔ)字詞編碼”在“鍵盤符號(hào)編碼”中居右側(cè)位置。中譯英編碼方式每行格式 4)在權(quán)利要求1中①的“中英通編碼規(guī)則”中,輸入法碼表的主體部份每行“鍵盤符號(hào)編碼”中的分隔符號(hào)規(guī)定為(1)“傳統(tǒng)的漢字輸入法編碼”和“英語(yǔ)字詞編碼”的分隔符號(hào)在中譯英編碼中,“傳統(tǒng)的漢字輸入法編碼”和“英語(yǔ)字詞編碼”之間用兩個(gè)半角減號(hào)“--”分隔; 在英譯中編碼中,“英語(yǔ)字詞編碼”和“傳統(tǒng)的漢字輸入法編碼”之間用壹個(gè)半角等號(hào)“=”分隔; (2)有些“英語(yǔ)字詞編碼”不是英語(yǔ)單詞,而是英語(yǔ)短語(yǔ),對(duì)短語(yǔ)構(gòu)成的“英語(yǔ)字詞編碼”、使用“/”代替英文短語(yǔ)中的空格,例如“按兵不動(dòng)”的“英語(yǔ)字詞編碼”為“take/no/action”其活字碼編碼為“abbd”,因此,“按兵不動(dòng)”一詞的“活字碼”中譯英輸入編碼為“按兵不動(dòng)abbd--take/no/action”;“按兵不動(dòng)”一詞的“活字碼”英譯中輸入編碼為“按兵不動(dòng)take/no/action=abbd”(3)在中譯英編碼方式中,允許二個(gè)或多個(gè)不同的“英語(yǔ)字詞編碼”同時(shí)存在于一個(gè)漢語(yǔ)字詞的編碼之中(一詞多義),每段不同的“英語(yǔ)字詞編碼”之間用一個(gè)半角分號(hào)“;”分隔 例如“產(chǎn)”一字的“拼音中英通輸入法”中譯英編碼為“產(chǎn)chan--produce;property;lay”5)在權(quán)利要求1中①的“中英通編碼規(guī)則”中,按照“英譯中編碼方式”編成的編碼,單獨(dú)安裝到輸入法軟件中,就實(shí)現(xiàn)了“輸入英文打出中文及顯示傳統(tǒng)的漢字輸入法編碼”的英漢學(xué)習(xí)和輸入漢字的效果;按照“中譯英編碼方式”編成的編碼,單獨(dú)安裝到輸入法軟件中,就實(shí)現(xiàn)了“輸入傳統(tǒng)的漢字輸入法編碼打出中文及顯示英文輸入編碼”的漢英學(xué)習(xí)和輸入漢字的效果;按照“英譯中編碼方式”編成的編碼和按照“中譯英編碼方式”編成的編碼,同時(shí)收集到一個(gè)輸入法碼表中,就實(shí)現(xiàn)了“輸入英文打出中文并顯示傳統(tǒng)的漢字輸入法編碼;輸入傳統(tǒng)的漢字輸入法編碼打出中文并顯示英文輸入編碼”的雙向?qū)W習(xí)和漢字輸入效果。6)在權(quán)利要求1中①的“中英通編碼規(guī)則”中,單字的編碼優(yōu)先于詞組的編碼(當(dāng)單字編碼和詞組編碼相同時(shí),單字編碼排在較前的編碼行);中譯英編碼優(yōu)先于英譯中編碼(當(dāng)中譯英編碼中的傳統(tǒng)的漢字輸入法編碼部份,與其他字詞的英譯中編碼中的英語(yǔ)編碼部份相同時(shí),中譯英編碼排在較前的編碼行)。7)在權(quán)利要求1中①的“中英通編碼規(guī)則”中,根據(jù)該規(guī)則編制的碼表可使用WINDOWS98、WIN2000、WINXP自帶的“輸入法生成器”程序(IMEGEN.EXE)編譯和安裝到相應(yīng)的操作系統(tǒng)中。8)在權(quán)利要求1中“②一種對(duì)中文單字的實(shí)用進(jìn)行性評(píng)估的方法”,是對(duì)6763個(gè)國(guó)標(biāo)一二級(jí)單字進(jìn)行使用價(jià)值評(píng)估,通過(guò)電腦數(shù)據(jù)庫(kù)編程技術(shù),根據(jù)各單字在55000個(gè)實(shí)用詞組中的出現(xiàn)次數(shù),作為其使用價(jià)值的評(píng)分,在詞組中出現(xiàn)率較高的單字的使用價(jià)值相應(yīng)較高。9)在權(quán)利要求1中“③一種對(duì)中文詞組的實(shí)用進(jìn)行性評(píng)估的方法”,是對(duì)55000個(gè)實(shí)用詞組進(jìn)行使用價(jià)值評(píng)估,根據(jù)漢字的一般組詞規(guī)律,由高頻單字組成的詞組比由高頻單字組成的詞組的使用價(jià)值更高,因此,本發(fā)明創(chuàng)造了一條簡(jiǎn)易公式各詞組的實(shí)用價(jià)值評(píng)分=所含單字的使用價(jià)值評(píng)分的幾何平均值,通過(guò)電腦數(shù)據(jù)庫(kù)編程技術(shù),把各詞組所含單字的使用價(jià)值數(shù)據(jù)代入此公式,即可計(jì)算各詞組的實(shí)用價(jià)值評(píng)分。10)在權(quán)利要求1中“④一種對(duì)英文字詞的實(shí)用性進(jìn)行評(píng)估的方法”,根據(jù)每個(gè)英語(yǔ)字詞被各種教材和詞典收錄的情況,統(tǒng)計(jì)其各自的使用分值,分值越高則實(shí)用價(jià)值越高。其中各詞庫(kù)的計(jì)分標(biāo)準(zhǔn)如“表1”表1中英通輸入法的英語(yǔ)詞匯來(lái)源和詞條使用價(jià)值評(píng)分表
根據(jù)上表,越是初級(jí)的教材所收錄的詞匯的實(shí)用度越高,同一個(gè)英語(yǔ)單詞如被多個(gè)詞庫(kù)收錄,則其使用價(jià)值是相應(yīng)各詞庫(kù)“使用價(jià)值積分”的總和,例如某個(gè)詞被《初中英語(yǔ)》(第一冊(cè))詞匯庫(kù)收錄,則它的實(shí)用價(jià)值評(píng)分為8,若這個(gè)詞同時(shí)又被《新概念英語(yǔ)》(第一冊(cè))詞匯庫(kù)收錄,則它的實(shí)用價(jià)值評(píng)分為8+5=13,依此類推,被較多教材廣泛收錄的詞匯的使用價(jià)值評(píng)分會(huì)相對(duì)較高,由此所得的各詞條的實(shí)用價(jià)值評(píng)分作為英語(yǔ)詞匯編碼取舍和排序的重要參考指標(biāo)。11)在權(quán)利要求1中“⑤一種對(duì)輸入法編碼按其字詞的實(shí)用性進(jìn)行排序和篩選的方法”,是指(1)利用電腦數(shù)據(jù)庫(kù)技術(shù),以“中文字詞”作為第一關(guān)鍵字,以“英語(yǔ)字詞”的實(shí)用價(jià)值(由高到低的降序)作為第二關(guān)鍵字,將編碼數(shù)據(jù)進(jìn)行索引排序。排序后把中文字詞相同的不同英語(yǔ)字詞按照其實(shí)用度高低的先后順序編予“E序號(hào)”(從1開始的連續(xù)正整數(shù))。(2)利用電腦數(shù)據(jù)庫(kù)技術(shù),以“英語(yǔ)字詞”作為第一關(guān)鍵字,以“中文字詞”的實(shí)用價(jià)值(由高到低的降序)作為第二關(guān)鍵字,將編碼數(shù)據(jù)進(jìn)行索引排序。排序后把英語(yǔ)字詞相同的不同中文字詞按照其實(shí)用度高低的先后順序編予“C序號(hào)”(從1開始的連續(xù)正整數(shù))。(3)刪除所有“E序號(hào)”大于3或者“C序號(hào)”大于1的中文單字?jǐn)?shù)據(jù)記錄,這樣剩下的每個(gè)中文單字最多可保留三個(gè)最實(shí)用的英語(yǔ)字詞表達(dá)方式;可以表達(dá)漢語(yǔ)單字的英語(yǔ)字詞都有至少有一個(gè)最實(shí)用的記錄被保留,而其他非首選的漢語(yǔ)單字編碼方式則被刪除,這樣在保持英語(yǔ)字詞編碼豐富性的同時(shí)又大大減少了重復(fù)的漢語(yǔ)單字編碼數(shù)據(jù),大大提高了單字編碼的簡(jiǎn)潔性和實(shí)用性。(4)刪除所有“E序號(hào)”大于1并且“C序號(hào)”大于1的中文詞組數(shù)據(jù)記錄,這樣剩下的每個(gè)中文詞組至少留一個(gè)最優(yōu)的英語(yǔ)字詞編碼表達(dá)方式,可以表達(dá)漢語(yǔ)單字的英語(yǔ)字詞編碼都有至少保留一個(gè)最實(shí)用的記錄,而非最實(shí)用的編碼方式則被刪除,這樣在保持英語(yǔ)字詞編碼豐富性的同時(shí)又大大減少了重復(fù)的漢語(yǔ)詞組編碼數(shù)據(jù),大大提高了詞組編碼的簡(jiǎn)潔性和實(shí)用性。(5)英語(yǔ)字詞重碼字詞的排序把英語(yǔ)字詞編碼相同的不同中文字詞編碼按“C序號(hào)”升序排序,以提高編碼的實(shí)用性,由此形成一套英漢詞語(yǔ)對(duì)照表,用于“英譯中輸入”編碼。(6)經(jīng)過(guò)上一步驟“(5)”處理后的數(shù)據(jù)表,是一個(gè)漢語(yǔ)字詞對(duì)一個(gè)英語(yǔ)單詞的數(shù)據(jù)表,把該編碼數(shù)據(jù)按“E序號(hào)”升序排序,然后把多個(gè)中文詞語(yǔ)相同的數(shù)據(jù)記錄合并為一個(gè)漢語(yǔ)字詞對(duì)應(yīng)多個(gè)英語(yǔ)字詞的形式,形成一套漢英詞語(yǔ)對(duì)照表,用于“中譯英輸入”編碼。12)權(quán)利要求1中“⑥一種拼音輸入法編碼的簡(jiǎn)化規(guī)則”是指(1)漢字單字、二字詞使用全拼編碼;(2)由三個(gè)或三以個(gè)漢字組成的多字詞,使用每個(gè)漢字的全拼首字母串成的拼音縮寫作為拼音。
2.權(quán)利要求1中“⑦一套英漢詞語(yǔ)對(duì)照表和一套漢英詞語(yǔ)對(duì)照表”,其特征為(1)包含了6763個(gè)國(guó)標(biāo)一二級(jí)漢字、55000條漢語(yǔ)詞組和習(xí)語(yǔ)、25000條英語(yǔ)詞語(yǔ)。(2)55000條漢語(yǔ)詞組和習(xí)語(yǔ)取源于《現(xiàn)代漢語(yǔ)詞典》(商務(wù)印書館2002年增補(bǔ)本)、《漢語(yǔ)成語(yǔ)小詞典》(商務(wù)印書館2003年修訂本)、《雙語(yǔ)經(jīng)典語(yǔ)》(四川人民出版社ISBN7-220-05843-8/H·282)、WINDOWS全拼輸入法碼表、五筆字型86輸入法碼表、五筆字型98版輸入法碼表;25000條英語(yǔ)詞語(yǔ)取源于UCDOS中附帶的UCDICT《漢英詞典》、《21世紀(jì)小小漢英詞典》(外語(yǔ)教學(xué)與研究出版社)、《袖珍英漢詞典》(南京大學(xué)出版社)、《雙語(yǔ)經(jīng)典語(yǔ)》(四川人民出版社ISBN7-220-05843-8/H·282)。(3)是運(yùn)用權(quán)利要求1中的“②一種對(duì)中文單字的實(shí)用進(jìn)行性評(píng)估的方法”、“③一種對(duì)中文詞組的實(shí)用性進(jìn)行評(píng)估方法”、“④一種對(duì)英文字詞的實(shí)用性進(jìn)行評(píng)估的方法”、“⑤一種對(duì)輸入法編碼按其字詞的實(shí)用性進(jìn)行排序和篩選的方法”處理而獲得的。
3.權(quán)利要求1中“⑧一套‘拼音中英通輸入法’碼表”,是根據(jù)權(quán)利要求1中的“①一種使輸入法具有中英雙向翻譯提示功能的編碼規(guī)則”和權(quán)利要求1中的“⑥一種拼音輸入法編碼的簡(jiǎn)化規(guī)則”,對(duì)權(quán)利要求1中的“⑦一套英漢詞語(yǔ)對(duì)照表和一套漢英詞語(yǔ)對(duì)照表”的詞語(yǔ)進(jìn)行編碼而獲得。
4.權(quán)利要求1中“⑨一套‘套五筆字型中英通輸入法’碼表”,是根據(jù)權(quán)利要求1中的“①一種使輸入法具有中英雙向翻譯提示功能的編碼規(guī)則”和“五筆字型”輸入法的編碼規(guī)則(參照《五筆字型速成教程》ISBN7-115-05278-6/TP·123和五筆字型輸入法86版編碼表),對(duì)權(quán)利要求1中的“⑦一套英漢詞語(yǔ)對(duì)照表和一套漢英詞語(yǔ)對(duì)照表”的詞語(yǔ)進(jìn)行編碼而獲得。
5.權(quán)利要求1中“⑩一套‘活字碼中英通輸入法’碼表”,是根據(jù)權(quán)利要求1中的“①一種使輸入法具有中英雙向翻譯提示功能的編碼規(guī)則”和“活字碼”輸入法(專利申請(qǐng)?zhí)?00410027961.8)的編碼規(guī)則,對(duì)權(quán)利要求1中的“⑦一套英漢詞語(yǔ)對(duì)照表和一套漢英詞語(yǔ)對(duì)照表”的詞語(yǔ)進(jìn)行編碼而獲得。
全文摘要
中英通雙向漢字輸入法是一種計(jì)算機(jī)鍵盤漢字輸入法,通過(guò)英漢字詞對(duì)照表與傳統(tǒng)漢字輸入法編碼(拼音、五筆字型、活字碼等等)的有機(jī)結(jié)合,實(shí)現(xiàn)了漢字輸入過(guò)程中的英漢、漢英雙向翻譯提示的功能,大大方便了用戶在輸入漢字的過(guò)程中學(xué)習(xí)和運(yùn)用英語(yǔ)詞匯,也為英語(yǔ)人士學(xué)習(xí)和輸入漢字提供了有效的工具??墒褂糜⒄Z(yǔ)詞語(yǔ)作為漢語(yǔ)字詞的輸入編碼,輸入6763個(gè)國(guó)標(biāo)一二級(jí)漢字、55000條漢語(yǔ)詞語(yǔ),并在輸入法編碼提示欄(選字欄)上顯示相應(yīng)漢語(yǔ)字詞的傳統(tǒng)輸入法編碼;也可使用傳統(tǒng)的漢字輸入法編碼,輸入6763個(gè)國(guó)標(biāo)一二級(jí)漢字、55000條漢語(yǔ)詞語(yǔ),并在輸入法編碼提示欄(選字欄)上顯示相應(yīng)漢語(yǔ)字詞的對(duì)應(yīng)英語(yǔ)詞語(yǔ)。
文檔編號(hào)G06F3/023GK1687877SQ200510034080
公開日2005年10月26日 申請(qǐng)日期2005年4月14日 優(yōu)先權(quán)日2005年4月14日
發(fā)明者劉伊翰 申請(qǐng)人:劉伊翰