專利名稱:漢字離合碼編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及漢字編碼方法,尤其是一種漢字離合碼編碼方法。
漢字的編碼方法種類繁多,各具特色,音形碼是一種較為普遍的編碼方法,它是以漢字的讀音及外形來進行編碼,由于以讀音來編碼,因此,對不認識的字就較難進行準確的編碼。另外現(xiàn)有的音形碼其重碼率較高,使其輸入效率較低。
本發(fā)明目的就是提供一種以讀“聲”定位,以字“形”組拼的漢字離合碼編碼方法,其具有靜態(tài)重碼率為零,簡單、繁體、疊字通用無需換擋的特點。
本發(fā)明的漢字離合碼編碼方法是以25個英文字母(除O外)作為代碼,根據(jù)其讀聲定義相應地碼元,作為“離合碼”的主碼,“O”只參與輔碼編碼,同時又作為繁、異體字輸出專用鍵。將除M外的,25個英文字母分作五個區(qū)位,每個區(qū)位又分出五個順序位置以與25組筆對相對應,作為離合碼的輔碼,“M”只參與主碼編碼,同時又作為疊字輸出專用鍵,筆對是指每個漢字的首筆和末筆的組合模式,按橫(一)、豎(丨)、撇(丿)、點(
)、折(
)的順序(用數(shù)字代表則為1、2、3、4、5)排列組合。
漢字離合碼編碼方法的碼元表如下
A愛爫
艸
B
丷
宀勹貝
C出
彡長镸車
巛
D的
刂
E而
亻
阝(右)
F發(fā)
阝(左)
G個
H和 一
灬
I以
衤
纟糹
J就丬
钅釒
廴
K看
L來
疒亠
彐彑
M門
馬
N年
P平
扌
Q其
礻
匚
廾犭
R人
曰冖
髟
S是丨
罒ナ氺
饣
T天夂
U于
魚
V為氵卩
W我
丂
X小
鄉(xiāng)覀
彳亍
Y一
讠
Z在
乛亅乚
辶
漢字離合碼編碼方法的區(qū)位、筆對和輔碼表
漢字離合碼編碼方法按漢語拼音讀“聲”設計,最長碼為四碼(繁異體字為五碼),其編碼規(guī)則為
1、基本筆型橫(一)、豎(丨)、撇(丿)、折(
)五種,其編碼為代碼加三碼“O”鍵。
2、數(shù)字一、二、三、五、六、七、八、九為代碼加一碼“O”鍵,O與四為代碼加兩碼“O”鍵。
3、單字編碼規(guī)則
單碼字取兩碼為代碼加輔碼;二碼字取三碼為首碼、末碼加輔碼;三碼字取四碼為首碼、次碼、未碼加輔碼;四碼及四碼以上字取四碼不加輔碼,為一、二、三碼加末碼。
4、詞組的編碼規(guī)則
二字詞組為每字取前兩碼;三字詞組為前兩字各取首碼,后一字取前兩碼;四字及四字以上詞組均取前三字及末字的首碼。
5、“O”為繁、異體字及生、冷僻字輸出專用代碼。
6、“M”為“疊字”輸出專用代碼。
本發(fā)明的漢字離合碼編碼方法以“聲”定位,以字“形”組拼,既具有音碼通俗易懂好掌握的優(yōu)點,又具有形碼簡捷明快重碼少的長處,凡字無論能否認、讀,均可順利輸出,此外該碼對6763個國標字庫中字符進行編碼其靜態(tài)重碼率為零,且簡、繁體、異、疊字通用,無需換檔。
下面結(jié)合碼元表在區(qū)位、筆對、輔碼表對本發(fā)明作詳細說明。
漢字離合碼編碼方法的編碼規(guī)則
1、基本筆型橫(一)、豎(丨)、撇(丿)、點(
)、折(
)在實際使用中極少單獨輸出,因此賦于它們對特殊編碼,代碼加三碼“O”,如“丨”→S000。
2、數(shù)字一 二 三 四 五 六 七 八 九 0 在基礎字型中經(jīng)常需要單獨輸出,也賦于它們特殊編碼,一 二 三 五 六 七 八 九為代碼加一碼“0”鍵,如“五”→W O,O為四為代碼加兩碼“O”鍵,如O→L O O
3、單字編碼規(guī)則
單碼字取兩碼為代碼加輔碼,如人→R W;
二碼字取三碼為首碼、末碼加輔碼,如燈→H D P;
三碼字取四碼為首碼、次碼、末碼加輔碼,如強→G K C X;
四碼及四碼以上字取四碼不加輔碼,為一 二 三碼加末碼,如超→土
刀 口→T Z D K,豁→宀 豐 口 口→B F K K,壑→卜
土→S R F T。
4、詞組的編碼規(guī)則
二字詞組為每字取前兩碼,如發(fā)展→FXSN;
三字詞組為前兩字各取首碼,后一字取前兩碼,如紅領(lǐng)巾→IRJJ;
四字及四字以上詞組均取前三字及末字的首碼,如一日千里→YRXQL,中華人民共和國→ZERW。
5、“O”為繁、異體字及生、冷僻字輸出專用代碼,如
→DN口0(其中口代表空格鍵),
→MS口0,
→GSUX0。
6、“M”為“疊字”輸出專用代碼,如慢慢→XRSU+M口,嘟嘟嘟嘟→KTPE+M口+M口+M口。
漢字離合碼編碼方法在進行編碼時,應采取“成字優(yōu)先,非字大前,首不作尾,順序綴連”原則,各舉一例說明,如,
羨→ 次→Y C 0 而不應為冫欠→Y D Q 0
丹→冂 亠→D L T 而不應為
一→D D H T
會→人 二
→R E C W 而不應為
→R Z W
戴→
田 廿 八→D T N B
本發(fā)明的漢字離合碼編碼方法對下列36個漢字采用主碼加兩碼輔碼,賦予其特定編碼
凹AVV卜BLL寶BOOCRR 的DWW額EOO缶FRR凡FWW
古GGG亦IOO弋ISS縊IBB家JOO豕JSS戔JDD來LSS
鹿LPP為LOO皿MHH年NRR囊NSS祺Q00其QSS冉RHH
是SLL石SGG四S00ULL 溈V00文W00小XXX日YHH永Y00隹ZTT早ZJJ 東DSS
本發(fā)明的漢字離合碼編碼方法對以224個字采用依照讀聲取第一碼、筆對取第二碼原則,賦予特定二碼
案A0艾AS愛AW安AY
北BA百BG貝BL吧BN八BO匕BQ不BS白BT半BU辦BX巴BZ
丑CB參CC廠CD車CF產(chǎn)CI蟲CL次CO川CR寸CS出CV長CW
丁DA刀DC帶DF電DN凍D0兌DP大DS斗DU斷DV
厄EA而EF耳EG二EO兒EQ爾EW
分FE豐FF否FG非FH法FO方FP央FS番F(xiàn)T父FW 發(fā)FX 防FZ
戈GD干GF工GG廣GI果GL光GN關(guān)GO港GP個GR隔GV公GW弓GZ
胡HG 戶HI 黑HL 虎HN 火HO 乎HQ禾HW
衣IO醫(yī)IS義IW益IY已IZ
巾JJ九JO就JP凡JQ斤JR束JS金JT己JZ
可KA開KF口KH卡KL康KO看KT
龍LA力LC里LH另LK六LO療LP
林LS樂LW立LY了LZ
馬MB矛MC目MH米MO門MP毛MQ木MS母MX民MZ
女NB廿NG內(nèi)NL凝NO乃NP牛NR鳥NT
匹PAPC 平PF品PH派PO片PQ披PS皮PW
期QG且QH七QO氣QQ千QR犬QS丘QT齊QU群QV欠QW請QY
髯RG日RH入RI識RO榮RS壬RT人RW刃RX
尸SC身SE十SF士SG上SH山SJ
少SK歲SL三SO手SQ生ST食SW水SX已SZ
屯TA土TG田TH頭TO它TP天TS條TW
于UA羽UB酉UG余UW又UX予UZ
兀VA衛(wèi)VB勿VE為VO完VP未VS烏VT
萬WA戊WD我WE韋WF王WG圍WJ五WO亡WP午WR瓦WS
習XB鄉(xiāng)XC西XG心XO行XQ下XS向XT辛XU夕XW 學XY
牙YD業(yè)YH也YN一YO用YR頁YS月YT羊YU天YW幺YX言YY乙YZ
子ZB止ZH中ZJ只ZL之Z0兆ZP竹ZQ自ZT舟ZT祖ZY
權(quán)利要求
1.一種漢字離合編碼方法,其特征在于(1)它是以除0外的25個英文字母作為代碼,每個代碼賦予相應碼元,作為主碼,其對應關(guān)系為
A愛爫
艸
B不丷
宀勹
C出
厶
彡
長镸車
巛
D的
ナ
冫
癶
刂
E而
亻
阝(右)咢
F發(fā)
阝(左)
G個
H和-
灬
I以
衤
纟糹
J就丬
钅釒
廴
K看
L來
疒亠
彐彑
M門
馬
N年
牜
P平
扌
丿
Q其
礻
匚
廾犭
R人
曰
冖
髟
S是丨
リ罒
饣
T天
冂
U于
魚
V為氵卩
W我
丂囗
攵
X小
覀
彳亍
Y-
讠
Z在
乛亅乚
辶
(2)它是將除M外的25個英文字母分作五個區(qū)位,每個區(qū)域又分出五個順序位置與25組筆對相對應作為輔碼,筆對是指每個漢字的首筆和末筆的組合模式,橫(一)、豎(丨)、撇(丿)、點(
)、折(
)順序用1、2、3、4、5代表,其區(qū)位、筆對和輔碼表為
2、根據(jù)權(quán)利要求1所述的漢字離合碼編碼方法,其編碼規(guī)則為
(1)基本筆型橫(一)、豎(丨)、撇(丿)、點(
)、折(
)其編碼為代碼加三碼“O”鍵;
(2)數(shù)字一、二、三、五、六、七、八、九為代碼加一碼“O”鍵,O、四為代碼加兩碼“O”鍵;
(3)單字單碼字取兩碼為代碼加輔碼、二碼字取三碼為首碼、末碼加輔碼,三碼字取四碼為首碼、次碼、末碼加輔碼,四碼為首碼、次碼、末碼加輔碼,四碼及四碼以上字取四碼為一、二、三碼加末碼;
(4)詞組二字詞組為每字取前兩碼,三字詞組為前兩字各取首碼后一字取前兩碼,四字及四字以上詞組均取前三字及末字的首碼。
3、根據(jù)權(quán)利要求1或2所述的漢字離合碼編碼方法,其特征在于“O”為繁、異體字及生、冷僻字輸出專用代碼。
4、根據(jù)權(quán)利要求1或2所述的漢字離合碼編碼方法,其特征在于“M”為“疊字”輸出專用代碼。
全文摘要
一種漢字離合碼編碼方法是以除0外的25個英文字母作為代碼,每個代碼予相應碼元,同時將除M外的25個英文字母分作五個區(qū)位、每個區(qū)域又分成五個順序位置與25組筆對相應作為輔碼,其編碼規(guī)則采用代碼加輔碼。本發(fā)明的漢字離合編碼方法以聲“聲”定位,以字“形”組拼,既有音碼通俗易懂好掌握的優(yōu)點,又能形碼簡捷明快重碼少的長處,其靜態(tài)重碼率為零,且簡、繁體、異、疊字通用,無需換檔。
文檔編號G06F3/023GK1180190SQ9711886
公開日1998年4月29日 申請日期1997年10月31日 優(yōu)先權(quán)日1997年10月31日
發(fā)明者湯漢林 申請人:湯漢林