專利名稱:全漢字定義碼輸入法的制作方法
技術領域:
本發(fā)明涉及漢字的計算機輸入。
自從發(fā)明計算機輸入漢字以來,已經涌現出六百多種不同的漢字輸入法,它們大致可以劃分為“音碼”、“形碼”和“音形碼”三大類。
“音碼”的優(yōu)點是知道讀音就可以輸入,但是其重碼多,而且拼音知識在國內尚不夠普及,對于一些冷僻的漢字知道讀音的人就更少,所以,無形的“讀音”與有形的“字形”相比較,后者也許更具吸引力。
“形碼”雖然重碼少,輸入較快,但是字型的劃分規(guī)則不統一,非得下一番死記硬背的苦功不可,常令非專業(yè)操作者望而生畏。
另外,現有的漢字輸入法一般還存在以下兩方面的問題1、鍵位的使用不統一,有的限于二十六個英文字母鍵,但也有的還得另外再增加幾個數字鍵,由于數字1,2和0容易與字母I,Z和O混淆,所以常會出錯,如果另設專用鍵,則又難以與計算機的標準通用鍵盤接軌;2、能夠輸入的漢字數有限,絕大部分方案只能覆蓋GB2312-80基本集中的漢字(6763個),實際上漢字的字數遠不止這些,例如《新華字典》收字11100個左右,《康熙字典》收字47216個,《漢語大字典》收字57000左右,此外,漢字還有簡體、繁體以及訛體之分,如果還要包括像日本與韓國的外造漢字,則數量就更多,顯然,不有效地解決全漢字(包括簡體、繁體、訛體以及外造漢字)的計算機輸入的問題,將成為中國計算機產業(yè)發(fā)展的主要瓶頸。
本發(fā)明的目的在于提供一種通過標準鍵盤上的二十六個字母鍵來輸入全漢字的方法。
為了實現上述目的,本發(fā)明首先將組成漢字的所有部件和筆畫劃分成二十六個組類;然后將每一組類與二十六個字母鍵中的一個鍵位相對應以構成該組類的部件碼或筆畫碼。另外,為了盡可以減少重碼,本發(fā)明規(guī)定每個漢字由四碼組成。因此,只要按照漢字的筆畫順序,就很容易獲得其相應的本發(fā)明定義碼。
本發(fā)明所稱的部件,指的是組成漢字的不再拆分的最小構字單位,它由筆畫(含筆畫字)、部件字和多筆畫不成字的部件構成,其中,筆畫包括以下六種橫(提)、豎、撇、捺(點)、折和O形折;部件字指單獨作為部件而不再拆分的字,包括鍵名,共二十六個字,即通常所謂的單鍵碼;相交拆分會引起歧義的字;外形相似,定義規(guī)定的字;多筆畫不成字的部件,如 等等。
具體地,本發(fā)明定義的二十六個組類部件和筆畫如下所示
(1)人(合)入(氽)亻(作) (睫)八(只、分);(2)田巴中串甲申由電毋禺里央史曳 (更)屯囗(國) (龜) (象) (貫) (卑) (革)口(四、罰) (皿) (單)匃(渴) (勤)蟲 (禹) (眉) (臨) (漢)(3)臣 (頤)匚(區(qū)) (迎) (氏)廠(皮) (反) (越)廣 匚 (4)乛 (買、敢) (今) (司)乚(孔)(亡) (以)馬(馬) (烏)了子(孑)孓 (承)亅(丁) (考) (勇)ス(輕)コ(兜) (侯)乙 (丐) (飛)ㄋ(場) (幾風) (烏)(幾) く;(5)水 (泰)氵(汁) (鰥) (聚) (象) (永、求、承) (6)扌(打)事車( )豐韋專夫吏夷 (段) (輿)镸(肆)市(肺) (垂) (捷) (或) (惠) (堯)(半) (囊) (壽) (制) (妻) (青) (秦) (東);(7)足(路) (留)厶(臺) (瓜)(8)也井曲弗世廿卅(帶)艸(草) 鹿)廾(升) (舞) (曹) (典) (匆) (西) (兩) (要) (兼)廿(華) (9)丨(引)讠(言)主 (難)亠(文) (斗) (今)二冫(冰) (永)辛辛;(10)丿(才)丿(夭)豸(豹)我 (曦);(11)竹(筆) (監(jiān))飛 (氣) (農) (衣)疒(病)片 (乍) (鼎)匕 (此)卜(占) (旅)爿丬(將)(虐) (藏) (收) (亥)比業(yè)非北兆 (亦)(亥) (牻) (龍) 、蕭);(12)(尺)乀(達)、(下)止 (延) (卸) (走) (平捺);(13)月 (周)冂(同)門冖(冗)宀(定)冊( )用 (風)兒幾 (見)尢(尢)兀內 (離)丌(鼻)冘(沈) (羌) (既) (免) (鬼)冉(再) (14)刀刁及乃勹(句) (萬) (角) (欠)久刂(別) (勿) (介) (粼) (歸) (臨) (班)丑刃(刄) (那) (州)
(15)○(數的空位) 口凹凸 (互) (面) (沔) (丘)又 (對)丈女夂(冬)攵(收) (處) (年) (降) (姊) (揀)夬(塊) (五) (書)亞(齊) (倒置詞) (正)(反向詞);(16)耳尸卩(印)(部)卩(衛(wèi)) (報) (假)尺戶目且 (其) (具) (追) (身)己已巳( )弓 (民) (改) (倉)弔(弟) (戢)弓 (17)丸寸太義勺夕叉 (夜)丹 (舟)玉母乎傘平 (卵) (卵) (然) (瓦)鳥(鳥)凡 (雨)肅 (潦)圡(壓) (黑) (熏) (曾) (鼠) (為) (麗) (兔) (啄) (釜) (登)氐 (戍)夾 (喪) (善)聿(津) (偽)日曰 (冒)甘 (衰) (酉) (即)艮(良) (殷) (柬) (來) (爭) (庚) (唐) (庸)尹(君) 凡(互) 丼 (幾)玊 (門) (門) (書);(18)金钅(錢)(乞、舞);(19)十 (協) (于)木;(20)土(地)耂(老)士乜 (切)七 (民) 丁 (斤) (予)丆(石) (百) (可);(21)心必臼凵(兇)忄(懷)(恭)小(常) (應) (步) (不)(小字形的變形)三川彡(彤)巛(巡) (荒) (22)丷(兌)(關)火;(23)山屮(出) (朔) (叟)臾巾 (農)爪彐(當) (錄)習 (輿) (虐) (印) (黎) (芽) (樂) (發(fā)) (24)九乂(文)ナ(右)力車大犭(狗) (東) (25)一(旦) (或)灬(點);(26)之纟(級) (鄉(xiāng))幺(玄)糸(索)辶( )(邊)廴(建),其中,上述括號中的漢字,除少數說明性內容外,主要系為包括其左邊所示部件或筆畫在內的漢字例,以加深對該部件或筆畫定義的了解。
如上所述,只要將上述定義的二十六組部件和筆畫任意地與二十六個字母鍵相對應起來就可以構成本發(fā)明全漢字定義碼,但是,在具體實施時,最好還是要兼顧到人們記憶上的方便性,例如,A與人相似,W與山相似等等,有鑒于此,本發(fā)明將上述二十六組部件和筆畫順序地與二十六個英文字母相對應起來,也就是說,組(1)對應鍵A,組(2)對應鍵B,……組(26)對應鍵Z。
顯然,本發(fā)明對于部件和筆畫組類劃分的首要考慮是它的完全性,也即用它可以表示全部的漢字,包括簡體、繁體、訛體以及外造漢字,此外,本發(fā)明所定義的二十六個部件和筆畫組類還體現了以下二個特征一、每一組類可以用口訣來概括,所以雖說有二十六組,實際上并不難記憶,各組口訣與其對應的字母鍵如下所示A人字單人旁,入、八形相似B封閉框內含豎筆,豎穿橫貫可相交C廠形、區(qū)字框D筆畫折E水字、三點水,水筆兩邊掛Ff小寫提手旁,借用提手架,提筆包萬象;F大寫肆、段、輿Gg小寫足字旁,G大寫形似貿左角H頭上有多角I筆畫豎,上下兩筆形似小寫iJ筆畫撇K左腰、右腰連筆畫L筆畫捺和點M周、門之框π腳,風、幾之框兒字腳N刀字形,側刀旁O筆畫O形折,空心小口框,倒置和反向P單耳、左耳與右耳,耳框內含多橫筆,尸字形似亦入類Q封閉框內橫一筆,開口、閉口均含點R金字旁,r角S兩線垂直相交T七字形、丁字形,提土旁,土、士相似列一起
U臼、凵形相似,心字豎心旁,小、似心歸其類V招呼點形似VW山形不分上、下、左和右X斜線相交、亂線纏一團Y筆畫橫和提,四點成一線Z大寫之字形,多折也在內二、部件和筆畫的劃分遵循目前漢字電腦輸入的慣例,主要包括1、先交后連,先連后散,多筆優(yōu)先2、交件不拆,例如“申”不拆分成“曰”和“|”3、末端點捺不拆,如“專”4、兩筆關聯不拆,例如“了”和“ス”因此,雖然有的組類所包括的部件較多,但只要從其基本定義出發(fā),加上習用的拆分慣例,還是不難記住的。
本發(fā)明規(guī)定,對于不足四碼的漢字,補一個末筆筆畫碼,仍然不足四碼的,用該字的拼音順序補到四碼為止,仍不足的用J代碼補充;對于字音忘記的也可直接用J代碼補充至四碼即可。
本發(fā)明的重碼率很低,約為千分之二左右。對于這少數重碼的漢字,除按漢字使用頻率排列供選擇外,還可采用一種手譯機中常用的自動漫游系統來處置,即將重碼字末一碼改為J、K、L…ABC…GHI的排列,其中該字的字音頭為專用,不配置給其它字。
雖然本發(fā)明定義碼是一個等長的四碼,但是,通過軟件很容易實現單鍵字的輸入,一則這也是目前漢字輸入的一個慣例,二則由于設計的單鍵字,即所謂的鍵名,常與該鍵對應的部件有密切的關系,所以記住鍵名也有助于對部件組類的記憶,為此,下面列出本發(fā)明所設定的二十六個鍵名A人;B田;C臣;D馬;E水;F長;G足;H也;I辛;J我;K竹;L止;M月;N魚;O口;P耳;Q鳥;R金;S木;T土;U心;V火;W山;X大;Y王;Z纟
圖1是本發(fā)明全漢字定義碼鍵盤圖實施例1,部件字的編碼部件字因為本身作為部件,不再拆分,所以取四碼順序為部件碼,末筆筆畫碼,漢語拼音或J代。
例
實施例2,兩部件合體字的編碼按照漢字筆順取四碼的順序為第一部件的代碼,第二部件的代碼,末筆筆畫碼,漢語拼音音首或J代。
例
實施例3,三部件合體字的編碼按照漢字筆順取四碼的順序為第一部件的代碼,第二部件的代碼,第三部件的代碼,末筆筆畫碼。
例
實施例4,四部件合體字的編碼按照漢字筆順四碼的順序為第一部件的代碼,第二部件的代碼,第三部件的代碼,第四部件也就是最后一個部件的代碼。
例
實施例5,五部件以上合體字的編碼按照漢字筆順取四碼的順序為第一部件的代碼,第二部件的代碼,第三部件的代碼,末一個部件的代碼。
例
實施例6,雙字詞組碼的編碼取兩個字的各前兩碼組成
例猜測--XJ氵冂(XJEM)如果雙漢字詞中第一個字為部件字,則第二碼改為第一個字的末筆筆畫碼
例人民--人已七(ALPT)如果雙字詞中第二個字為部件字,則第四碼改為第二個字的末筆筆畫碼
例猜中--XJ中I(XJBI)如果雙字詞中的兩個字均為部件字,則第二碼改為第一個字的末筆筆畫碼,同理,第四碼則可改為第二個字的末筆筆畫碼
例工人--工一人(TYAL)實施例7,三字詞的編碼取第一,二個字的各第一部件代碼和第三個字的前兩碼組成
例蒙古包--艸十勹
(HSNP)如果三字詞中的第三個字為部件字,則第四碼改為第三個字的末筆筆畫碼
例星期日--日
日-(QPQY)實施例8,四字詞的編碼各取四字詞的每個字的第一個部件代碼組成
例耳聞目睹--耳門目目(PMPP)實施例9,四字以上詞的編碼各取前三個字的每個字的第一部件代碼和最后一個字的第一部件代碼組成
例馬克思列寧主義--馬,十,田,義(DSBQ)綜上所述,本發(fā)明全漢字定義碼具有以下特點1、能覆蓋全漢字,并且,根據部件劃分的定義,可隨時擴充以包括新漢字;2、使用標準鍵盤作為輸入設備,易于推廣;3、重碼率低,有利于輸入速度的提高;4、部件劃分從定義出發(fā),并兼顧習常慣例,便于熟練掌握。
權利要求
1.一種全漢字定義碼輸入法,系指一種經由包括二十六個字母鍵的計算機鍵盤輸入漢字的方法,每個漢字按其筆順由四個鍵碼組成,鍵碼包括部件碼、筆畫碼及音碼,其中,部件碼、筆畫碼是指漢字的部件或筆畫所對應的字母鍵碼,音碼則指漢字拼音所對應的字母鍵碼,其特征在于組成漢字的所有部件和筆畫劃分成以下的二十六組類(1)人入亻人八;(2)田巴中串甲申由電毋禺里央史曳 屯 口 匈 蟲 (3)臣 匚 廠 廣 匚 (4)乛 乚 馬 了子孓 亅 スコ 乙 ㄋ (5)水 氵 (6)扌事車豐韋專夫吏夷 镸 市 (7)足 厶 ;(8)也井曲弗世廿卅艸 廿 ;(9)丨讠主 亠 二冫 辛 ;(10)丿 豸我 (11)竹 飛 疒片 匕 卜 爿 丬 比業(yè)非北兆 (12)乀丶止 (13)月 門門冖宀冊用兒幾 尢兀內 丌冘 冉 (14)刀刁及乃勹 久刂 丑刃 ;(15)○ 口凹凸 又 丈女夊攵 夬 亞 (16)耳尸卩阝卩 尺戶目且 己已巳弓 弔 弓 ;(17)丸寸太義勺夕叉 丹 玉母乎傘平 鳥凡 肅 圡 氐 夾 日曰 甘 艮 肀 尹 凡 丼 (18)金钅;(19)十 木;(20)土耂士 七 丁 丆 ;(21)心必臼凵忄小 三川彡 巛 ;(22)丷火;(23)山屮 臾巾 爪彐 習 (24)九 力車大犭 (25)一 灬;(26)之纟 幺 糸辶廴,上述二十六組類中每一組系分別與二十六個字母鍵中一個鍵位相對應以構成該組部件碼或筆畫碼。
2.根據權利要求1所述的全漢字定義碼輸入法,其特征在于該二十六個部件和筆畫組類系順序地與二十六個英文字母鍵相一一對應以構成各組的部件碼或筆畫碼。
3.根據權利要求1或2所述的全漢字定義碼輸入法,其特征在于按漢字筆順取四碼的順序為第一部件碼、第二部件碼、第三部件碼和末部件碼。
4.根據權利要求3所述的全漢字定義碼輸入法,其特征在于對于不足四碼的漢字需補足四碼,其補碼順序為末筆筆畫碼,拼音順序的音碼以及J代碼。
5.根據權利要求1或2所述的全漢字定義碼輸入法,其特征在于可采用詞組輸入法,不論組詞的長短,按先部件碼后末筆筆畫碼的原則一律取四碼。
6.根據權利要求5所述的全漢字定義碼輸入法,其特征在于雙字詞組各取兩個字的前兩碼組成。
7.根據權利要求5所述的全漢字定義碼輸入法,其特征在于三字詞組取第一、二字的第一部件碼和第三字的前兩碼組成。
8.根據權利要求6所述的全漢字定義碼輸入法,其特征在于四字詞組各取每個字的第一部件碼組成。
9.根據權利要求5所述的全漢字定義碼輸入法,其特征在于四字以上詞組各取前三個字的第一部件碼和最后一個字的第一部件碼組成。
全文摘要
一種全漢字定義碼輸入法,首先將組成漢字的所有部件和筆畫劃分成二十六個組類,然后將每一組類與計算機標準鍵盤上的二十六個字母鍵的一個鍵位相對應以構成該組類的部件碼或筆畫碼,因此只要按照漢字的筆畫順序,可獲得其相應的本發(fā)明定義碼。本發(fā)明定義碼能覆蓋全漢字,包括簡、繁體、訛體以及外造漢字;使用標準鍵盤又使它易于推廣,此外,由于重碼率低,有利于輸入速度的提高。
文檔編號G06F3/023GK1149154SQ9611649
公開日1997年5月7日 申請日期1996年8月28日 優(yōu)先權日1996年8月28日
發(fā)明者李運吉 申請人:李運吉