專利名稱:二維計(jì)算機(jī)簡繁漢字輸入系統(tǒng)的制作方法
文字是社會發(fā)展和生產(chǎn)力發(fā)展的產(chǎn)物。在人類活動(dòng)中,由于交換信息和意見的需要,產(chǎn)生了語言和文字。在大汶口出土的五千年前的陶器上已經(jīng)發(fā)現(xiàn)文字,這是目前發(fā)現(xiàn)的我國最早的文字。五千年來漢字對我國文明和社會發(fā)展作出了巨大的貢獻(xiàn)。要使?jié)h字適應(yīng)信息時(shí)代的需要,解決漢字輸入計(jì)算機(jī)的問題,使?jié)h字輸入計(jì)算機(jī)的方法既好學(xué)、又打得快,既規(guī)范、又適用,適應(yīng)計(jì)算機(jī)的需要、又繼承漢字的傳統(tǒng),就需要研究漢字的造字規(guī)律和造字方法。
由原始社會的結(jié)繩記事,至象形文字的出現(xiàn),經(jīng)歷了漫長的過程。大汶口出土的陶器上發(fā)現(xiàn)的六個(gè)文字符號,是目前我國發(fā)現(xiàn)的最早的象形文字,經(jīng)文字學(xué)家的識別,炅(熱)字共有三個(gè),兩個(gè)繁體,一個(gè)簡體。簡體的上面是日,下面是火( );繁體的上面是日,中間是火,下面是山( )。三個(gè)炅字出于兩地,筆畫結(jié)構(gòu)如出一手,可見當(dāng)時(shí)文字已經(jīng)規(guī)格化。一個(gè) 字寫在灰陶背壺上,筆畫結(jié)構(gòu)整齊規(guī)則。從 字和 字可以看出,漢字的基本筆畫—橫、豎、撇、捺、折的雛型已經(jīng)出現(xiàn)在象形文字中。其后在小屯村出土的商代的甲骨文,周代的金文中漢字的筆畫結(jié)構(gòu)更加明顯,至?xí)x、唐漢字的基本筆畫已經(jīng)完善,它們是一脈相承的。
從古至今總結(jié)五千年的造字歷史,漢字的造字方法有六種象形、指事、會意、假借、轉(zhuǎn)注、形聲,合稱六書。秦隸、漢隸的出現(xiàn)和發(fā)展,為形聲造字鋪平了道路。漢字的大部份是用形聲造字法創(chuàng)造出來的,一半取其形以為意,一半取其聲以為音,例如舫字的左半從舟取其意,右半從方取其音;鞘字的左半從革取其意,右半從肖取其音;髁字的左半從骨取其意,右半從果取其音;雹字的上半從雨取其意,下半從包取其音。這些形聲字的上半部、下半部、左半部、右半部或其中的某一部份就是用來組成漢字的基本造字單元。這些基本造字單元的形成已有二千多年的歷史,后來被用于書法教學(xué)和漢字撿索中,被人們稱之為偏旁、部首?!墩f文解字》中所載九千三百多字中,用象形、指事、會意的造字方法所造出的表意的獨(dú)體字約為五百四十多個(gè),約占百分之5.7左右,其余為形聲字。被人們稱之為獨(dú)體字的五百四十多個(gè)字中的三百多個(gè)字也是由基本造字單元組成的,例如內(nèi)字是由‘冂人’組成的,其意是人從門口而入;冊字是由‘ 一’組成的,其意為用一繩把竹書簡串起來;串字由‘口口丨’組成,其意為用一根棍子把一些果子穿起來;因此,不必把五百多個(gè)獨(dú)體字都看作是基本造字單元,這樣可以減少記憶量,增加易學(xué)性,又符合漢字的造字規(guī)律和造字方法。我們認(rèn)為這些在漢字的造字歷史中形成的、在社會上得到廣泛應(yīng)用和認(rèn)可的基本造字單元,應(yīng)該在計(jì)算機(jī)漢字輸入方法中得到廣泛的應(yīng)用。這些基本造字單元在計(jì)算機(jī)漢字輸入技術(shù)中,被人們稱之為編旁、部首、字根、字元、部件、字件等,我們認(rèn)為稱之為字件較為合適。如果稱之為部件,在既念上容易與機(jī)器、儀器的部件既念相混淆,也容易被引入機(jī)械學(xué)的觀點(diǎn)來定義漢字的基本造字單元,使之與在造字歷史上形成的傳統(tǒng)的被人們廣泛認(rèn)可的基本造字單元的既念相去甚遠(yuǎn)。有人認(rèn)為‘漢字字形中的任何一部份,都是部件’。由此‘部件’的既念出發(fā),被定義為部件的可以是三百多個(gè),也可以是六百多個(gè),甚至可以是無數(shù)個(gè)。由此‘部件’的既念出發(fā),被定義的部件與傳統(tǒng)的基本造字單元相差甚大,既難學(xué),又與中、小學(xué)語文、書法教學(xué)脫節(jié)。
從五十年代開始,我國漢字計(jì)算機(jī)輸入技術(shù)經(jīng)過三十多年的研究和攻關(guān),使?jié)h字輸入電腦的速度超過了西文,進(jìn)入九十年代漢字輸入計(jì)算機(jī)技術(shù)存在的主要問題是“容易學(xué)的打不快,打得快的太難學(xué)?!薄段骞P二維計(jì)算機(jī)漢字輸入方法及其鍵盤》(以下簡稱《五筆二維碼》,筆者是《五筆二維碼》的第一發(fā)明人和第一專利權(quán)人)的問世使這個(gè)問題的解決取得了較大的進(jìn)展,但是《五筆二維碼》還存在繁體漢字的輸入、字根較小、拆分存在一定困難的問題。
為了解決上述問題,我們研究和提出《二維計(jì)算機(jī)簡繁漢字輸入系統(tǒng)》?!抖S計(jì)算機(jī)簡繁漢字輸入系統(tǒng)》,根據(jù)漢字的造字規(guī)律,以國家語委提出的201個(gè)部首為基礎(chǔ),結(jié)合計(jì)算機(jī)漢字輸入的需要,采用了傳統(tǒng)的基本造字單元以及筆畫較多的編旁、部首及繁體部首作為字件,刪去了一些不必要的字件,增加了一些不按首筆、次筆決定其代碼的字件,字件總數(shù)較《五筆二維碼》的字根總數(shù)增加82個(gè),使《五筆二維計(jì)算機(jī)簡繁漢字輸入系統(tǒng)》的字件總數(shù)達(dá)261個(gè)。這樣,就提高了二維計(jì)算機(jī)簡繁漢字輸入法字件的規(guī)范性,使?jié)h字的拆分更為容易方便,增加了易學(xué)性,解決了繁體漢字輸入的同題,降低了重碼率,提高了輸入速度。
《二維計(jì)算機(jī)簡繁漢字輸入系統(tǒng)》根據(jù)國家標(biāo)準(zhǔn)GB2312-80,選取橫、豎、撇、點(diǎn)(捺)、折作為五種基本筆畫,其中折包括各種折畫和各種彎鉤(乙)。
《二維計(jì)算機(jī)簡繁漢字輸入系統(tǒng)》使用一種以字根的首筆按照“橫、豎、撇、點(diǎn)、折”定義其第一位代碼為“1、2、3、4、5”,次筆按照“零、橫、豎、撇、折”定義其第二位代碼為“0、1、2、3、4、5、”的字件總表,即
圖1。在二維計(jì)算機(jī)簡繁漢字輸入法的字件總表中,一些筆畫較多的字件可以直接查到其代碼,例加“母”的代碼為“55”,“艮”的代碼為“51”,“發(fā)”的代碼為“53”,“羊”的代碼為“43”,“衤”的代碼為“45”,“鬼”的代碼為“32”,“鼠”的代碼為“32”,“面”的代碼為“31”,“夾”的代碼為“14”,“亥”的代碼為“41”…。而在《五筆二維計(jì)算機(jī)漢字輸入方法及鍵盤》中沒有這些字根,需要把它們折分才能得到其代碼“母”折分為“ 一 ”,代碼為“551044”;“艮”折分為“彐 ”,代碼為“5153”;“發(fā)”折分為“乙丿又丶”,代碼為“50305440”;“羊”折分為“”,代碼為“4311”;“衤”折分為“礻ノ”,代碼為“4530”;“鬼”折分為“白兒厶”,代碼為“323554”;“鼠”折分為“臼乙 乙”,代碼為“32504450”;“面”折分為“丆ㄇ 三”,代碼為“13252211”;“夾”拆分為“一人”,代碼為“104334”;“亥”拆分為“亠乙丿人”,代碼為“41503034”…。《二維計(jì)算機(jī)簡繁漢字輸入系統(tǒng)》與《五筆二維計(jì)算機(jī)漢字輸入方法及其鍵盤》相比較,前者較后者新增82個(gè)字件,刪去后者不必要的字件13個(gè),改變了后者14個(gè)字件的代碼,這樣就使?jié)h字的拆分更為容易方便,增加了易學(xué)性,提高了規(guī)范性,提高了輸入漢字的速度。
《二維計(jì)算機(jī)簡繁漢字輸入系統(tǒng)》采用標(biāo)準(zhǔn)通用鍵盤,漢字字件總表中的代碼“10、20、30、40、50”分別設(shè)置在“N、M、,、.、/”鍵位上;“11、12、13、14、15”分別設(shè)置在“G、F、D、S、A”鍵位上;“21、22、23、24、25”分別設(shè)置在“H、J、K、L、;”鍵位上;“31、32、33、34、35”分別設(shè)置在“T、R、E、W、Q”鍵位上;“41、42、43、44、45”分別設(shè)置在“Y、U、I、O、P”鍵位上;“51、52、53、54、55”分別設(shè)置在“B、V、C、X、Z”鍵位上。使標(biāo)準(zhǔn)通用鍵盤成為用于漢字輸入的中文鍵盤。
《二維計(jì)算機(jī)簡繁漢字輸入系統(tǒng)》從漢字中提取拼形信息及語音信息進(jìn)行編碼,其漢字具體輸入是1.形—音四碼輸入法對于由四個(gè)以上字件組成的漢字取其第一、二、三和末字件的代碼參加編碼;對于不足四個(gè)字根的漢字,取其全部字根的代碼及其漢語拼音第一字母碼參加編碼,加拼音字母后仍不足四碼者,再補(bǔ)一個(gè)空格鍵。例加鼴=32224453(意思是鼴字的取碼為32224453);魎=32102534;銀=3451Y;緬=5513M;梅=143155M;蝽=221122C。
2.音—形四碼輸入法對于由有三個(gè)以上字件組成的漢字取其漢語拼音第一字母為首碼,取漢字的第一、二及末字件的代碼參加編;對于不足三個(gè)字件組成的漢字,則補(bǔ)一個(gè)空格鍵。例如幫=B115220;春=C1122;坪=P14;顏=Y(jié)413313。
3.形—音三碼輸入法對于由三個(gè)以上字件組成的漢字取其首、次、末字件的代碼參加編碼;對于不足三個(gè)字根的漢字,取其全部字根的代碼及其漢語拼音第一字母碼參加編碼,加拼音字母后仍不足三碼者,再補(bǔ)一個(gè)空格鍵。例如參=541333;姆=5355M;為=43W;樣=1443Y;珠=1131Z。
4.音—形三碼輸入法對于由二個(gè)以上字件組成的漢字取其漢語拼音第一個(gè)字母為首碼,取漢字的首、末字件的代碼參加編碼;對于不足二個(gè)字件的漢字,則補(bǔ)一個(gè)空格鍵。例如孩=H5541;補(bǔ)=B4524;缸=G3112;發(fā)=F53。
5.對漢字的一級簡碼的輸入是該字的首碼加空格鍵,例如一=10;的=32;入=34。對漢字的二級簡碼的輸入是該字的第一、二碼加空格鍵,例如二=11E;開=1013;大=13D。對漢字的三級簡碼的輸入是該字的第一、二、三碼加空格鍵,例如語=451220;設(shè)=453554。
6.對二字詞的詞組的輸入是取每字的第一、二碼,例如系統(tǒng)=30555541;歷史=13532034。對三字詞的詞組的輸入是取每字的首碼加第三字的第二碼,例如工業(yè)化=12223235;計(jì)算機(jī)=45311435。對四字詞的詞組的輸入是取每字的首碼,例如中華人民共和國=20323421;全國人民代表大會=34213434。
利用本發(fā)明的字件總表和編碼方法,對漢字和中文詞組進(jìn)行編碼,按此編成字典、詞典及其計(jì)算機(jī)軟件、應(yīng)用軟件或軟件工具,可以用在一切大、中、小、微型計(jì)算機(jī)、漢字電傳機(jī)、漢字電子計(jì)算機(jī)打字機(jī)、漢字終端、通訊系統(tǒng)中,以及進(jìn)行漢字、詞組和中文資料的檢索。
權(quán)利要求
1.一種用于計(jì)算機(jī)輸入漢字的二維簡繁漢字輸入系統(tǒng),其特征是根據(jù)漢字的造字規(guī)律以及計(jì)算機(jī)輸入漢字的需要,擇優(yōu)選取基本造字單元(即字件),字件的首筆按照“橫、豎、撇、點(diǎn)、折”定義其第一位代碼為“1、2、3、4、5、”;字件的次筆按照“零、橫、豎、撇、點(diǎn)、拆”定義其第二位代碼為“0、1、2、3、4、5、”,其中“零”表示字件沒有第二筆;字件的代碼按照5×6的關(guān)系全排列組合成30個(gè)代碼10、11、12、13、14、15;20、21、22、23、24、25;30、31、32、33、34、35;40、41、42、43、44、45;50、51、52、53、54、55與代碼對應(yīng)的字件是10一;20丨;30丿;40丶;50乙;11二三干豐王夫韋未 戔耒 馬豐;12十工土士廿 五西(覀)耳 其革;13丆廠ナ卄大犬尢石頁龍面豕頁;14 平夾來;15丁匚 七扌寸弋 戈木車;21 上止 齒非;22 業(yè); 23 ;24卜、 ;25刂冂山貝貝 骨黑;31 牛( )攵氣手毛長禾缶朱舌竹;32 亻丘白臼身鬼鼠;33 彡彳斤舟;34 八人乂 金钅豸;35兒匕幾勹 及九夕夂犭ク 用鳥魚魚鳥; 41冫亠丬廣六文方立立疒產(chǎn)隹言 亥辛;42門忄;43丷 火為米半羊 ;44宀灬 45讠 辶之礻心衤;51彐尸己(已巳 )弓艮三尹 門; 52 凵卩阝也 巴;53刀乃力小 女 皮發(fā); 54 厶廴又習(xí) 予; 55了巳 子孑 巛纟水母 ;
2.加同權(quán)利要求1的方法,字件代碼設(shè)置在標(biāo)準(zhǔn)鍵盤的鍵位上,與字件對應(yīng)的鍵位是字件代碼“10、11、12、13、14、15”分別設(shè)置在“N、G、F、D、S、A”鍵位上;字件代碼“20、21、22、23、24、25”分別設(shè)置在“M、H、J、K、L、;”鍵位上;字件代碼“30、31、32、33、34、35”分別設(shè)置在“,、T、R、E、W、Q”鍵位上;字件代碼“40、41、42、43、44、45”分別設(shè)置在“.、Y、U、I、O、P”鍵位上;字件代碼“50、51、52、53、54、55”分別設(shè)置在“/、B、V、C、X、Z”鍵位上;漢語拼音字母的排列,完全采用標(biāo)準(zhǔn)通用鍵盤的英文字母的鍵名;形成漢字字件的代碼與漢字拼音字母碼混合使用的鍵盤。
3.如同權(quán)利要求1的方法,《二維計(jì)算機(jī)簡繁漢字輸入系統(tǒng)》對漢字的具體輸入是a.形—音四碼輸入法對于由4個(gè)以上字件組成的漢字取第一、二、三和末字件的代碼參加編碼,對于不足4個(gè)字件的漢字則補(bǔ)一個(gè)該字的漢語拼音第一字母碼,加拼音字母碼后仍不足四碼者,再補(bǔ)一個(gè)空格鍵。b.音—形四碼輸入法對漢字取其漢語拼音第一字母為首碼,取漢字的第一、二及末字件的代碼參加編碼;對于不足三個(gè)字件組成的漢字,再補(bǔ)一個(gè)空格鍵。c.形—音三碼輸入法對漢字取其首、未字件的代碼及漢字的漢語拼音第一字母碼參加編碼,對于不足二個(gè)字件的漢字再補(bǔ)一個(gè)空格鍵。d.音—形三碼輸入法對漢字取其漢語拼音第一字母為首碼,取漢字的第一、末字件的代碼參加編碼;對于不足二個(gè)字件組成的漢字,再補(bǔ)一個(gè)空格鍵。e.對漢字的一級簡碼的輸入是該字的首碼加空挌鍵;對漢字的二級簡碼的輸入是該字的第一、二碼加空格鍵;對漢字的三級簡碼的輸入是該字的第一、二、三碼加空格鍵。f.對二字詞的詞組的輸入是取每字的第一、二碼;對三字詞的詞組的輸入是取每字的首碼加第三字的第二碼;對四個(gè)字以上的多字詞的詞組的輸入,取其第一、二、三、未字的首碼。
4.如同權(quán)利要求1的方法,只有個(gè)別字件不按其首、次筆確定其代碼,與代碼對應(yīng)的這些字件是10艸;20口;30月;40氵;50馬;14木;15車;21口;22日日蟲;23目罒皿且;25田 ;
5.按權(quán)利要求1、2、3、4中的任何一條或數(shù)條,對漢字和中文詞組進(jìn)行編碼,依此編制成計(jì)算機(jī)軟件、應(yīng)用軟件或軟件工具,可以用在一切大、中、小、微型計(jì)算機(jī)、漢字電傳機(jī)、漢字電子計(jì)算機(jī)打字機(jī)、漢字終端、通訊系統(tǒng)中,以及進(jìn)行漢字、詞組和中文資料的檢索。
全文摘要
二維計(jì)算機(jī)簡繁漢字輸入系統(tǒng)是一種既易學(xué),又打得快,既規(guī)范,又適用,既適應(yīng)計(jì)算機(jī)的需要,又繼承漢字傳統(tǒng)的計(jì)算機(jī)漢字輸入方法。其特征是根據(jù)漢字的造字規(guī)律和計(jì)算機(jī)輸入漢字的需要,擇優(yōu)選取漢字的基本造字單元(即字件),字件的首筆按照“橫、豎、撇、點(diǎn)、折”定義字件的第一位代碼為“1、2、3、4、5”;字件的次筆按照“零、橫、豎、撇、點(diǎn)、折”定義字件的第二位代碼為“0、1、2、3、4、5”。本發(fā)明從漢字中提取拼形信息和語音信息,以字件代碼及該字的漢語拼音第一字母碼相結(jié)合進(jìn)行編碼。因此,本漢字輸入方法的記憶量小,簡單易學(xué),重碼率低,輸入速度快,適合專業(yè)漢字輸入人員使用,更適合非專業(yè)漢字輸入人員使用。
文檔編號G06F3/023GK1124854SQ94119699
公開日1996年6月19日 申請日期1994年12月15日 優(yōu)先權(quán)日1994年12月15日
發(fā)明者莫積鈞 申請人:莫積鈞