專利名稱:數(shù)字式漢字心角處理系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字的筆形編碼及其相應(yīng)的數(shù)字電腦輸入鍵盤。
漢字是中國特有的文字,是由一些基本的筆劃構(gòu)成的方框形圖案。目前雖有許多漢字編碼輸入方法,但他們?nèi)源嬖谥鴮W(xué)習(xí)較難或重碼較多的缺點(diǎn)。如“四角號碼”編碼法,它雖然抓住了漢字四角這個(gè)外部特征,但忽略了漢字的內(nèi)部特征,故重碼太多。又如中國專利85101817公開的“安子介式漢字筆形電腦編碼及其鍵盤”和清華大學(xué)出版社1995年6月出版的《縱橫漢字系統(tǒng)》等,它們基本上是四角號碼的基礎(chǔ)上增加了偏旁的2位碼,從四角碼變到了六角碼,但由于取碼部位和方法未作根本改進(jìn),因而重碼依然較多。在已公開的這類漢字輸入方法中,有的雖無重碼,但有一些字不是按規(guī)則編的碼,使用學(xué)習(xí)不便,沒達(dá)到易學(xué)易用的目的。
本發(fā)明的目的是提供一種數(shù)字式漢字心角處理系統(tǒng)。在“四角號碼”的基礎(chǔ)上,對漢字作進(jìn)一步分解,即對取碼部位和筆畫的編碼方法進(jìn)行改進(jìn),使其既有四角號碼易學(xué)易用、不易忘記的優(yōu)點(diǎn),又能克服重碼多的缺點(diǎn)。
本發(fā)明的具體方案是把漢字筆畫分成“撇、橫、豎、點(diǎn)與捺叉、插、方、角、人、小”10類,依次用0至9這10個(gè)數(shù)作它們的代碼,在漢字規(guī)定的部位上取碼,并在數(shù)字鍵盤上輸入相應(yīng)的數(shù)碼,其特征在于A.把10類漢字筆畫分別用1位數(shù)碼或2位數(shù)碼或4位數(shù)碼作代碼;B.把漢字分為包圍型、非包圍型、交叉型三類結(jié)構(gòu),其中包圍型分解為“框”和“心”,非包圍型分解為“字旁”和“字身”或兩個(gè)字身,交叉型不分解;C.把字身再分解為兩字旁,但交叉型字身不分解;D.字旁取2碼,字身取4碼,按從“框”到“心”,從左上角到右下角、從上到下的順序和部位取碼,分別編為心角6位數(shù)字碼,心角8位數(shù)字碼。
下面結(jié)合筆畫分類及編碼表、漢字常見包圍結(jié)構(gòu)和字例表以及心角編碼字例表對本發(fā)明進(jìn)一步說明。
由筆畫分類及編碼表可知本發(fā)明借用“四角號碼”的編碼方法,把漢字筆畫分成“撇、橫、豎、點(diǎn)與捺叉、插、方、角、人、小”10類,依次用0至9這10個(gè)數(shù)作它們的代碼,在漢字規(guī)定的部位上取碼,并在數(shù)字鍵盤上輸筆畫分類及編碼表
漢字常見包圍結(jié)構(gòu)和字例表
心角編碼字例表
入相應(yīng)的數(shù)碼。前四類是單筆畫,其余的是復(fù)筆畫。
從筆畫分類及編碼表、漢字常見包圍結(jié)構(gòu)和字例表、心角編碼字例表進(jìn)一步得知本發(fā)明對漢字作了分類,A.把10類漢字筆畫分別用1位數(shù)碼或2位數(shù)碼或4位數(shù)碼作代碼;B.把漢字分為包圍型、非包圍型、交叉型三類結(jié)構(gòu),其中包圍型分解為“框”和“心”,非包圍型分解為“字旁”和“字身”或兩個(gè)字身,交叉型不分解;C.把字身再分解為兩字旁,但交叉型字身不分解;D.字旁取2碼,字身取4碼,按從“框”到“心”,從左上角到右下角、從上到下的部位和順序取碼,分別編為心角6位數(shù)字碼,心角8位數(shù)字碼。
一.本發(fā)明在漢字筆畫編碼上作了新的規(guī)定當(dāng)“撇、橫、豎、點(diǎn)與捺”類筆畫取2碼或4碼時(shí),在它們的代碼后面加1個(gè)0或3個(gè)0。例“舊”中的“丨”筆,取2碼為20,取4碼為2000。
當(dāng)“叉”或“人”兩類筆畫取2碼時(shí),在其代碼“4”或“8”后加上它們各自第二筆畫的代碼;當(dāng)取4碼時(shí),在其2碼后再加上第一、第二筆畫的代碼。如“全”中的“人”,在心角6位數(shù)碼中取83,在心角8位數(shù)碼中取8303。
在“插”類筆畫中,與另兩筆畫相交的筆畫叫作主筆畫,當(dāng)“插”類筆畫取2碼時(shí),在其代碼“5”后加上主筆畫的代碼,當(dāng)取4碼時(shí),在其2碼后依書寫序順加上另兩筆畫的代碼。如“草”中的“艸”,在心角6位數(shù)碼中取51,在心角8位數(shù)碼中取5122。
當(dāng)“方”與“角”類筆畫取2碼時(shí),在其代碼的前或后加一個(gè)0。
當(dāng)“小”類筆畫取2碼時(shí),在其代碼9后加上中間筆畫的代碼,取4碼時(shí),在其2碼后依書寫順序加上另兩筆畫的代碼。如“系”中的“小”,在心角6位數(shù)碼中取92,在心角8位數(shù)碼中取9203。
本發(fā)明為了異化重碼,作了幾個(gè)特殊規(guī)定(1)“十”的2碼取40,4碼取4012;(2)左鉤取2,如“刂”的2碼取22,4碼取2022;(3)“八”取一碼時(shí)作8,取2碼為03,4碼為0030,(4)“讠”在6位數(shù)字碼中取2碼時(shí),依“言”取為36;(5)若干個(gè)相同筆畫并排在一起取2碼時(shí),第一碼取相同筆畫的個(gè)數(shù),第二碼取筆畫的代碼。例如“灬”取43,“彡”取30;如只取一碼,則取筆畫的個(gè)數(shù)。
二.本方法把漢字的結(jié)構(gòu)分為三類1.包圍型它又分為全包圍、三面包圍、兩面包圍、角包圍、以及由兩個(gè)不可分離的包圍結(jié)構(gòu)組成的相連包圍。例如國、巨、王、這、慶、鳥、與。包圍型結(jié)構(gòu)的漢字在外包圍的部分叫“框”,被包圍的部分叫“心”。
2.非包圍結(jié)構(gòu)它又分為有不相連筆畫的分離型和筆畫全部相連的相連型,例如,合、魚、千、克。
3.交叉型它又分為不含包圍結(jié)構(gòu)的純交叉型和含有包圍結(jié)構(gòu)的包圍交叉型。例如,十、車、內(nèi)、甲、申、電?!皟?nèi)”和“甲”的內(nèi)部的筆畫只在上部或下部伸出框外,叫全包圍交叉型;“申”和“電”的內(nèi)部的筆畫在上和下都伸出框外,叫半包圍交叉型?!靶摹鄙斐隹蛲獾牟糠纸小巴庑摹?,在框內(nèi)的部分叫“內(nèi)心”。
本發(fā)明根據(jù)漢字的類型、部首,各部分的縱橫排列的方向,按分離優(yōu)先、交叉不拆的原則,把字分為若干個(gè)單元,小的單元叫字旁取2位數(shù)字作代碼,大的單元叫字身取4碼,字身一般又可分作兩字旁。
當(dāng)把一個(gè)漢字分解成一個(gè)字旁和一個(gè)字身時(shí),用字旁的2碼與字身的4碼合起來表示一個(gè)漢字,即為心角6位數(shù)字碼;當(dāng)把漢字分解成兩個(gè)字身各取4碼時(shí),即為心角8位數(shù)字碼。
三.字旁和字身的分解規(guī)則如下1.在心角6位數(shù)字碼中,包圍型漢字的字旁和字身的劃分是框作字旁,心作字身。例如“匡”的分解是“匚”作字旁、“王”作字身。
2.在心角6位數(shù)字碼中,非包圍型漢字的字旁和字身的劃分是A.如能分解為兩個(gè)并列的部分,那么當(dāng)其中只有一部分的筆畫超過3畫時(shí),筆畫少的部分作字旁,另一部分作字身,例如“剛”中的“刂”作字旁;如這兩部分的筆畫都不超過3畫,當(dāng)筆畫數(shù)相等時(shí),取右面或上面的部分為字旁,當(dāng)筆畫數(shù)不相等時(shí),取筆畫少的作字旁。例如,“億”中“乙”作字旁,“仃”中的“亻”作字旁;如這兩部分都超過3畫,則當(dāng)筆畫數(shù)相差不超過3畫時(shí),取左面或上面的部分作字旁,當(dāng)筆畫數(shù)相差超過3畫時(shí),取筆畫少的部分作字旁。例如“耕”和“期”中的“耒”和“月”作字旁。
B.如漢字正好是分離或相連的并列三部分時(shí),則把第一部分字旁,另兩部分合作字身,如“糊”中的“米”作字旁,“胡”作字身。
3.在心角8位數(shù)字碼中,包圍型漢字的劃分是“框”和“心”各作一字身,各取4碼。
例如“街”中的框“彳”和心“圭”各作一字身取4碼,其編碼是08414112。
4.在心角8位數(shù)字碼中,非包圍型漢字的劃分是A.如能分解為兩個(gè)并列部分則各作一字身;B.如正好分解為并列的三部分,則兩邊的部分合作一包圍型字身,中間部分作一字身。
例如“糊”中的“米…月”作一字身,“古”作一字身。
5.交叉型漢字和筆畫數(shù)不超過3畫的漢字皆只作字身取4碼,不足6或8碼的部分添0。
如“申”取6碼時(shí)為564600;取8碼為56460000;“于”取6碼為104200,取8碼為10420000;為異化重碼在心角6位數(shù)字碼中,下列部首只作字旁,但它們單獨(dú)作字時(shí)照上述方法分解艸木竹酉頁口齒魚骨革金钅冖黑羽鳥皿心髟攵讠。
6.本發(fā)明將字身再分解為兩字旁的規(guī)則是A.如字身是包圍型的,則框和心各作一字旁,但如框的左上角附有一撇時(shí),仍作包圍結(jié)構(gòu)看,把撇作為框的左上角的筆畫;例如字旁“白”的取碼為01;B.如字身是非包圍型的,且能分作并列的兩部分,則各作一字旁;如“覃”中的字身“早”,分為“日”和“十”兩字旁;C.如字身剛好是分離或相連的并列3部分,則作為二面包圍類型把框和心各作一字旁。
如“贏”中的下部剛好是月、貝、凡并列,把“月…凡”作框, “貝”作心。
四.字旁和字身的編碼方法(一)字旁的編碼1.包圍型字旁的取碼是角包圍則取包圍框的上一邊的筆畫代碼和心的左上角的筆畫代碼;多層包圍取最外框和最內(nèi)的心的左上角代碼;其他包圍結(jié)構(gòu)取框和心的左上角筆畫的代碼。
例如字旁“日”取碼為61。
2.非包圍型字旁的取碼是取它的左上角和右下角的筆畫代碼,或取上下或取左右筆畫的代碼。例如字旁“欠”取左上角和右下角代碼各為08,而字旁“文”的編碼為34。
如果字旁分離為并列的三部分時(shí),按兩面包圍結(jié)構(gòu)取碼。如“流”中的“ ”作字旁,編碼為02。
如字旁是“叉、插、方、人、小”類筆畫時(shí),則取它們相對應(yīng)的筆畫的2碼作為這個(gè)字旁的編碼。如光的上部“ ”是“小”類筆畫,取碼為92。
如字旁的上部或下部含有包圍結(jié)構(gòu)時(shí),則取其心的代碼作為左上角或右下角的代碼。例如“宿”中的字旁“百”的編碼為81。
如“點(diǎn)”畫在右上角時(shí),則按右上角、左下角的部位次序取碼。例如,犬38,戈35。
3.交叉型字旁的取碼是如是純交叉型,一般取左上角、右下角的筆畫代碼,當(dāng)是叉、插、方、人、小等類筆畫時(shí),則按它們的2碼取碼。如“卅”取54,“艸取51”。
如是全包圍交叉型,則按外心,左上角或左上角、內(nèi)心的順序取碼。如由取56,“甲”取65。
如果是半包圍交叉型時(shí),取左上角、右下角筆畫代碼。例如“繩”中的字旁“電”取57。
(二)字身的編碼1.包圍型字身的取碼是角包圍分兩種情況,當(dāng)包圍框的兩邊的筆畫數(shù)相差不到2時(shí),按上下順序各取一碼放在首和尾,心取2碼放在中間,例如“溝”中的“勾”取0232;當(dāng)框的兩邊的筆畫數(shù)相差達(dá)2畫時(shí),或某一邊是交叉結(jié)構(gòu)時(shí),則取筆畫較多的一邊為字旁,取2碼放在前面,心取2碼放在后面,例如“波”中的“皮”取4714;其他包圍型字身,按框左上角、框右下角的部位和次序各取一碼放在首和尾,心作字旁取2碼放在中間;如漢字的框作字身碼不足時(shí),在框角代碼的前面各添一個(gè)0。例如“國”的“口”作字身在左上和右下角各取2碼,但它們都只能取一碼6,故在這兩個(gè)6前各添一個(gè)0,故“國”的心角8位數(shù)字碼為06143106;又如“風(fēng)”的8位數(shù)字編碼是07430307。
2.非包圍型字身的取碼是按分得的字旁各自取碼;當(dāng)“點(diǎn)”畫在右上角時(shí),取右上角的碼放在前面。
如“犬”作字身時(shí),取碼為3048。
3.交叉型字身的取碼是A.純交叉型,按左上角和右下角各取2碼,左上角第2碼取主筆畫代碼,右下角取碼從左上角末取完的部位開始,末尾碼不足時(shí)添0;例“耒”取5249,“木”取4090。
B.金包圍交叉型,按外心、框左上角、內(nèi)心、框右下角或框左上角、內(nèi)心、框右下角、外心的順序和部位取碼,末尾碼不足時(shí)添0;例“油”中的“由”其內(nèi)心已被外心取完,故內(nèi)心取0,碼為5606。
C.半包圍交叉型,按在上的外心、框左上角、內(nèi)心、內(nèi)心的延伸部分等4個(gè)順序和部位取碼;例“申”取5640,“曳”取5657。
D.半包圍交叉型字身的左上角不構(gòu)成“方”或“角”,則框的左上角取0。
例“隸”取5049,“巾”4702,“束”取5649。
4.異化重碼的取碼規(guī)則是交換首二碼位置或交換末二碼位置。
例“葒”和“蘊(yùn)”的編碼都是512112,若改“葒”的編碼為512121,則可使兩碼區(qū)別開。
5.非漢字的符號一律按字身取碼規(guī)則取4碼放在末尾,前面的碼一律取0。
例區(qū)位碼為6019的“艸”取005122,區(qū)位碼為6760的“丬”取008120。
本發(fā)明的優(yōu)點(diǎn)是抓住了漢字包圍結(jié)構(gòu)的重要特點(diǎn),把漢字的外部和內(nèi)部特征統(tǒng)一在編碼中,故重碼很少。由于無字根、規(guī)則性強(qiáng),所以易學(xué)難忘。字符集可擴(kuò)充至大漢字集,且重碼少。
權(quán)利要求
1.一種數(shù)字式漢字心角處理系統(tǒng),把漢字筆畫分成“撇、橫、豎、點(diǎn)與捺叉、插、方、角、人、小”10類,依次用0至9這10個(gè)數(shù)作它們的代碼,在漢字規(guī)定的部位上取碼,并在數(shù)字鍵盤上輸入相應(yīng)的數(shù)碼,其特征在于A.把10類漢字筆畫分別用1位數(shù)碼或2位數(shù)碼或4位數(shù)碼作代碼;B.把漢字分為包圍型、非包圍型、交叉型三類結(jié)構(gòu),其中包圍型分解為“框”和“心”,非包圍型分解為“字旁”和“字身”或兩個(gè)字身,交叉型不分解;C.把字身再分解為兩字旁,但交叉型字身不分解;D.字旁取2碼,字身取4碼,按從“框”到“心”,從左上角到右下角、從上到下的順序和部位取碼,分別編為心角6位數(shù)字碼,心角8位數(shù)字碼。
2.根據(jù)權(quán)利要求1所述的數(shù)字式漢字心角處理系統(tǒng),其特征在于漢字筆畫中“撇、橫、豎、點(diǎn)與捺”類筆畫取2碼或4碼時(shí),在它們的代碼后面加1個(gè)0或3個(gè)0;“叉”和“人”類筆畫取2碼時(shí),在其代碼“4”或“8”后加上它們各自第二筆畫的代碼;當(dāng)取4碼時(shí),在其2碼后再加上第一、第二筆畫的代碼;“插”類筆畫中,與另兩筆畫相交的筆畫為主筆畫;在“插”類筆畫取7碼時(shí),在其代碼“5”后加上主筆畫的代碼,當(dāng)取4碼時(shí),在其2碼后依書寫序順加上另兩筆畫的代碼,當(dāng)取4碼時(shí),在其2碼后依書寫順序加上另兩筆畫的代碼;“方”與“角”類筆畫取2碼時(shí),在其代碼的前或后加一個(gè)0;“小”類筆畫取2碼時(shí),在其代碼“9”后加上中間筆畫代碼,取4碼時(shí),在其2碼后依書寫順序加上另兩筆畫的代碼。
3.根據(jù)權(quán)利要求1所述的數(shù)字式漢字心角處理系統(tǒng),其特征在于當(dāng)把一個(gè)漢字分解成一個(gè)字旁和一個(gè)字身時(shí),用字旁的2碼與字身的4碼合起來表示一個(gè)漢字,即為心角6位數(shù)字碼;當(dāng)把漢字分解成兩個(gè)字身各取4碼時(shí),即為心角8位數(shù)字碼。
4.根據(jù)權(quán)利要求1或權(quán)利要求3所述的數(shù)字式漢字心角處理系統(tǒng),其特征在于在心角6位數(shù)字碼中包圍型漢字的字旁和字身的劃分是字框作字旁,字心作字身。
5.根據(jù)權(quán)利要求1或權(quán)利要求3所述的數(shù)字式漢字心角處理系統(tǒng),其特征在于在心角6位數(shù)字碼中,非包圍型漢字的字旁和字身的劃分是A.如能分解為兩個(gè)并列的部分,那么,當(dāng)其中只有一部分筆畫超過3畫時(shí),筆畫少的部分作字旁,另一部分作字身;如這兩部分的筆畫都不超過3畫,當(dāng)筆畫數(shù)相等時(shí),取右面或上面的部分為字旁,當(dāng)筆畫數(shù)不相等時(shí),取筆畫少的作字旁;如這兩部分都超過3畫,當(dāng)筆畫數(shù)相差不超過3畫時(shí),取左面或上面的部分作字旁,當(dāng)筆畫數(shù)相差超過3畫時(shí)取筆畫少的部分作字旁;B.如漢字正好是分離或相連的并列三部分,則把第一部分作字旁,另兩部分合作字身。
6.根據(jù)權(quán)利要求1或權(quán)利要求3所述的數(shù)字式漢字心角處理系統(tǒng),其特征在于在心角8位數(shù)字碼中,包圍型漢字的劃分是“框”和“心”各作一字身,各取4碼。
7.根據(jù)權(quán)利要求1或權(quán)利要求3所述的數(shù)字式漢字心角處理系統(tǒng),其特征在于在心角8位數(shù)字碼中,非包圍型漢字的劃分是A.如能分解為兩個(gè)并列部分則各作一字身;B.如正好分解為并列的三部分,則兩邊的部分合作一包圍型字身,中間部分作一字身。
8.根據(jù)權(quán)利要求1所述的數(shù)字式漢字心角處理系統(tǒng),其特征在于交叉型漢字和筆畫數(shù)不超過3畫的漢字皆只作字身取4碼,不足6或8碼的部分添0。
9.根據(jù)權(quán)利要求1所述的數(shù)字式漢字心角處理系統(tǒng),其特征在于字身再分解為兩字旁的規(guī)則是A.如字身是包圍型的,則框和心各作一字旁,但如框的左上角附有一撇時(shí),仍作包圍結(jié)構(gòu)看,把撇作為框的左上角的筆畫;B.如字身是非包圍型的,且能分作并列的兩部分,則各作一字旁;C.如字身剛好是分離或相連的并列3部分,則作為二面包圍類型把框和心各作一字旁。
10.根據(jù)權(quán)利要求1所述的數(shù)字式漢字心角處理系統(tǒng),其特征在于包圍型字旁的取碼是;角包圍則取包圍框的上一邊的筆畫代碼和心的左上角的筆畫代碼;多層包圍取最外框和最內(nèi)的心的左上角代碼;其他包圍結(jié)構(gòu)取框和心的左上角筆畫的代碼。
11.根據(jù)權(quán)利要求1所述的數(shù)字式漢字心角處理系統(tǒng),其特征在于非包圍型字旁的取碼是取它的左上角和右下角筆畫的代碼,或取上下或取左右筆畫的代碼;如字旁分離為并列的三部分,按兩面包圍結(jié)構(gòu)取碼;如字旁是“叉、插、方、人、小”類筆畫時(shí),則取它們相對應(yīng)的筆畫的7碼作為這個(gè)字旁的編碼;如字旁的上部或下部含有包圍結(jié)構(gòu)時(shí),則取其心的代碼作為左上角或右下角的代碼;如“點(diǎn)”畫在右上角時(shí),則按右上角、左下角的部位次序取碼。
12.根據(jù)權(quán)利要求1所述的數(shù)字式漢字心角處理系統(tǒng),其特征在于交叉型字旁的取碼是一般取左上角和右下角的代碼,當(dāng)是叉、插、方、人、小等類筆畫時(shí),則按它的2碼取碼;如字旁是全包圍交叉型,則按外心、左上角或左上角、內(nèi)心的順序取碼;如字旁是半包圍交叉型時(shí),則取左上角、右下角的筆畫代碼。
13.根據(jù)權(quán)利要求1或權(quán)利要求9所述的數(shù)字式漢字心角處理系統(tǒng),其特征在于包圍型字身的取碼是;角包圍分兩種情況,當(dāng)包圍框的兩邊的筆畫數(shù)相差不到2時(shí),按上下順序各取一碼放在首和尾,心取2碼放在中間;當(dāng)框的兩邊的筆畫數(shù)相差達(dá)2畫時(shí),或某一邊是交叉結(jié)構(gòu)時(shí),則取筆畫較多的一邊為字旁,取2碼放在前面,心取2碼放在后面;其他包圍型字身按框左上角、框右下角的部位和次序各取一碼放在首和尾,心作字旁取2碼放在中間;如漢字的框作字身碼不足時(shí),在框角代碼的前面各添一個(gè)0。
14.根據(jù)權(quán)利要求1或權(quán)利要求9所述的數(shù)字式漢字心角處理系統(tǒng),其特征在于非包圍型字身取碼是按分得的字旁各自取碼;當(dāng)“點(diǎn)”畫在右上角時(shí),取右上角的碼放在前面。
15.根據(jù)權(quán)利要求1或權(quán)利要求3所述的數(shù)字式漢字心角處理系統(tǒng),其特征在于交叉型字身取碼分下列幾種情況A.純交叉型,按左上角和右下角各取2碼,左上角第2碼取主筆畫代碼,右下角取碼從左上角末取完的部位開始,末尾碼不足時(shí)添0;B.全包圍交叉型,按外心、框左上角、內(nèi)心、框右下角或框左上角、內(nèi)心、框右下角、外心的順序和部位取碼,末尾碼不足時(shí)添0;C.半包圍交叉型,按在上的外心、框左上角、內(nèi)心、內(nèi)心的延伸部分等4個(gè)部位和順序取碼;D.半包圍交叉型字身的左上角不構(gòu)成“方”或“角”時(shí),則框的左上角取0。
全文摘要
本發(fā)明涉及一種數(shù)字式漢字心角處理系統(tǒng),它在四角號碼的基礎(chǔ)上,改進(jìn)了筆畫代碼和取碼部位,仍用10個(gè)數(shù)字給漢字編碼,由于它碼元少、規(guī)則性強(qiáng)、無字根、重碼少、故易學(xué)易用,可用于計(jì)算機(jī)輸入漢字。
文檔編號G06F3/023GK1189645SQ97107350
公開日1998年8月5日 申請日期1997年1月28日 優(yōu)先權(quán)日1997年1月28日
發(fā)明者謝力 申請人:謝力