專利名稱:計算機漢字聲元碼的制作方法
技術領域:
本發(fā)明涉及計算機的漢字輸入編碼,特別是根據(jù)漢字地聲、形進行編碼的漢字聲元碼。將漢字的雙拼韻母、筆畫同字元的各種拼形分別與計算機的英文字母鍵對應,并選列了9個部首,且依次取漢字的聲、形所在鍵名為代碼將漢字編碼的聲元碼。
現(xiàn)有的計算機的漢字輸入編碼中,規(guī)律性較強、得到廣泛運用的主要有根據(jù)漢字的讀音、漢字的字形或將二者結合起來的編碼。但根據(jù)讀音編碼因讀音不準、生字、特別是重碼多等因素而嚴重影響漢字輸入速度。根據(jù)字形編碼,雖有見字識碼、重碼較少的優(yōu)點,但因字形多、規(guī)則雜、記憶量大,漢字處理人員需經過專門記憶和大量訓練、且必須長期運用才不影響漢字的輸入速度,因此,僅適合專職漢字處理人員。
本發(fā)明的漢字輸入編碼,利用漢字“形似音不同”的本質特點,將近千種形塊高度歸納,并將相近的音也合并,從而提供一種編碼短,歸納性強,對應性好,直觀自然,重碼少的漢字編碼,使其不僅適合計算機專職漢字處理人員,而且是廣大的非專職人員作長期或間隔的漢字處理。
本編碼根據(jù)漢字是由筆畫和字元相拼合的特點,將漢字的3種筆畫與3種字元的各種拼形依序且分別對應計算機鍵盤上英文字母鍵,并選列了9個部首。雙拼韻母各設定了提示的高頻字。依次取漢字的聲、形所在鍵名為代碼將漢字編排為四位碼,并定了詞、句編碼。還有一替代鍵,可作為編碼中任一代碼,從而對生字進行輸入。詞、句編碼均為四位碼。
本發(fā)明的漢字編碼具有以下明顯的優(yōu)點
一、稍有拼音基礎即可編碼,即使生字也可由替代碼輸入進行查找。
二、將漢字邊讀邊“寫”,符合人的思維特點。
三、根據(jù)漢字“形似音不同的”的本質特點,將各相似的形、相近的音分別歸類,歸納性好,對應形強,直觀自然。
四、規(guī)則一致,編碼短,重碼少,輸入速度快。
下面,結合筆畫、字元的的分類和雙拼韻母相對應的計算機鍵盤表以及字形代碼的確定方法,再參照具體的字例編碼對本發(fā)明作進一步的說明一、漢字的筆畫和字元
筆畫是書寫漢字時不間斷地連續(xù)寫成的線條,根據(jù)運筆的方向,將筆畫分為三種
名稱運筆方向 筆畫形
橫 從左至右 一一
垂 從上至下、從下至上丨丿丶
折筆畫方向改變 乙乛
亅
乚
字元是具有特征的圖形,它們是口、匚、乂,其各自的特點如下字元 特點 字元例口四角整齊 口匚開口匡形 門冂凵匚
乂若干筆畫交叉 乂十又七九豐艸女車乜
ナ卅
毋
力也
井韋
丈書
二、漢字的組成及結構型
漢字是表意的拼形文字,它是單獨或若干個由筆畫、字元拼合成的圖形方塊狀組成。漢字明顯地呈兩種結構型左右型、混合型。
1、左右型如混、拼、料、例、鱔、鞭、嘖
2、混合型如哥、果、早、合、型、蒲、過、局、照、呂、回、親三、鍵位表
注每一字母鍵右上角為提示雙拼韻母的高頻字,U鍵為任一未知代碼的替代輸入碼。四、漢字編碼
漢字具有“音同形不同,形似不同音”的內在規(guī)律,聲元碼用漢字的首聲母、雙拼韻母的鍵名為第一、二代碼,結合字形所對應的鍵名代碼依序編為四位碼,編碼方法如下
1、具有聲、韻母的單字編碼
首聲母代碼+雙拼韻母代碼+首形代碼+末形代碼(碼長不足補空格鍵)
2、無聲母或韻母為“i”的單字編碼
雙拼韻(聲)母代碼+首形代碼+次形代碼+末形代碼
3、詞句編碼
雙字詞--第一、二代碼(首字)+第一、二代碼(次字)
多字詞、句--第一、二代碼(首字)+第一代碼(次字)+第一代碼(末字)五、字形代碼的確定
(一)部首代碼獨立地存在于漢字中的部首以各種指定鍵名為代碼。I(水、
氵、冫、灬),O(竹、、蟲),P(石),J(人、亻、彳、
,K(手、扌),L(心、忄、、足、
),M(金、钅)。
(二)字元代碼左右結構型漢字中字元的代碼為V(口)、B(匚)、N(乂),混合結構型的字元代碼為Z(口)、X(匚)、C(乂)。
(三)筆畫、字元拼形的代碼拼形時相粘或相近的同種筆畫一次取盡。分別以起始的筆畫或字元指定的第一行鍵名Q(橫)、W(垂)、E(折)、R(口)、T(匚)、Y(乂)[橫畫拼形];其各自的下一鍵[垂畫拼形];下二鍵[折畫拼形]所對應的鍵名為各種拼形代碼。如中(口元、垂畫拼形、口→垂)的代碼為F,不(橫起筆、垂畫拼形、橫→垂)的代碼為A。例
且
廿 T(匚橫) 尺尸貝G(匚垂)已弓饣B(匚折)
止產立 W(垂橫) 火彡州S(垂垂)讠衤刂X(垂折)六、編碼規(guī)則
(一)依序編碼、混元前置
漢字的形碼按“先上后下,先左后右,先外后內”的書寫習慣取代碼?;旌辖Y構型漢字中字元的代碼為Z(口)、X(匚)、C(乂)。如
努女力 LZCC違韋辶 NCX照日灬 ZARI
(二)獨畫無碼、直觀拆分1、漢字中單獨或者拆分出來的單筆畫均不取代碼,必須是兩筆畫才能拼形,因而形體分散但相近的多筆畫則同取一代碼,如
旦日 DSR舊日 JTR豆口 DPZW酉口兒 TZX
川 CCS三 SSQ火HBS 習 XD2、三種不同的筆畫粘連為一體按“以折為主”直觀拆分,即折畫與相粘、相近且同高度的筆畫同取一代碼,其它筆畫分拆開取代碼。如
云二厶 YJQD元二兒 YLQX允厶兒 YJDX方亠勹 FSWX
辰
瓦
XD豕
SX 3、不同的筆畫同字元粘連,按“前畫拆分”將字元前筆畫分拆開取代碼,如
當
彐 DSST 先 士兒 XFYX角 勹豐 JRXC爾冖小 EXD
生主 SQY 天 大 TFH 匹 匚兒 PXX 見冂兒 JFXX
冖兒 白 日 BDR 甬
冂豐 GDXC 良彐
LFTD
(三)字元交叉、分別取碼
兩字元交叉成型,則按書寫順序分別取各字元代碼。如
重圭口 COYZ里口圭 LZY聿匚豐 YIXC制牛冂刂 ZHXX附編碼舉例
會人厶 H N J D家宀
J R G X
建匚廴 J F X D洞氵口 D O I V
典冂八 D F X S兌
兒 D N S X
患中心 H C F L甲口十 J R Z C
科 技 K E G K進步 J Y B Z貴州省 G N Z S
老有所為 L A Y N中華人民共和國 Z O H G
權利要求
1、計算機的漢字輸入編碼,特別是根據(jù)漢字的聲、形進行編碼的漢字聲元碼,其特征是依次取漢字的聲、形所在鍵名為代碼進行編碼。
2、如權利要求1所述的漢字聲元碼,其特征是將漢字的3種筆畫與3種字元的各種拼形依序且分別對應計算機鍵盤上英文字母鍵,并選列了9個構字常用的部首,設定了替代輸入碼。
3、如權利要求1所述的漢字聲元碼,其特征是字母鍵上的雙拼韻母各設定了提示的的高頻字,依次取漢字的首聲母、雙拼韻母、字形所在鍵名為代碼將漢字編排為四位碼,不足四位時擊空格鍵,并設定了詞、句編碼。
4、如權利要求1、2、3所述的漢字聲元碼,其特征是遵循“依序編碼,單畫無碼,直觀拆分”的編碼規(guī)則。
全文摘要
本發(fā)明涉及計算機的漢字輸入編碼,特別是根據(jù)漢字的聲、形進行編碼的漢字聲元碼。將漢字的3種筆畫與3種字元的各種拼形依序且分別對應計算機鍵盤上英文字母鍵,并選列了9個部首。各英文字母鍵上的雙拼韻母均設定了提示的高頻字。依次取漢字的聲、形所在鍵名為代碼將漢字編排為四位碼,并設定了詞、句編碼。編碼短,歸納性強,對應性好,直觀自然,邊讀邊“寫”,重碼少。
文檔編號G06F3/023GK1210299SQ97118308
公開日1999年3月10日 申請日期1997年9月4日 優(yōu)先權日1997年1月21日
發(fā)明者劉濤 申請人:劉濤