專利名稱:模塊漢字編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)漢字編碼方法或漢字輸入方法,更具體地說(shuō),模塊漢字編碼方法實(shí)際上是將漢字輸入到計(jì)算機(jī)的一種方法。
背景技術(shù):
漢字編碼當(dāng)前技術(shù)水平從上個(gè)世紀(jì)七十年代末起,很多人參與漢字輸入計(jì)算機(jī)的工作,不僅解決了從無(wú)到有的問(wèn)題、而且有很大的進(jìn)展;也曾出現(xiàn)過(guò)好多漢字編碼,推行開(kāi)的也有幾種,例如五筆字型法,雙拼音法,智能ABC法等方法。五筆字型法雖然可以實(shí)現(xiàn)盲打,但由于記憶難,僅適用于專業(yè)打字人員;雙拼音法和智能ABC法等方法雖然使用簡(jiǎn)便,但由于重碼太多,不能盲打,影響速度;對(duì)于以高速、大量信息處理為特點(diǎn)的計(jì)算機(jī)而言,漢字輸入仍然是信息處理的瓶頸。因此社會(huì)上迫切需要一種既能盲打、沒(méi)有重碼,又易記易行的漢字編碼方法或漢字輸入方法。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是克服現(xiàn)有技術(shù)的缺點(diǎn),提供一種沒(méi)有重碼,能夠盲打;編碼規(guī)則簡(jiǎn)單,不需要添加設(shè)備的,容易記憶的漢字編碼方法或計(jì)算機(jī)漢字輸入方法。即“模塊漢字編碼方法”。
使用本發(fā)明的“模塊漢字編碼方法”,有以下步驟按編碼規(guī)則先將某漢字拆分并選取四個(gè)模塊,對(duì)照‘模塊表,轉(zhuǎn)換成代碼,四個(gè)代碼再組合即組成該漢字的編碼,從鍵盤(pán)鍵入編碼。計(jì)算機(jī)就會(huì)從‘漢字與模塊漢字編碼轉(zhuǎn)換表’找出該漢字顯示在屏幕上。
其特征在于1)、編碼規(guī)則;2)、怎樣選取四個(gè)模塊;3)、設(shè)置助記詞;1)、編碼規(guī)則有三個(gè)輸入規(guī)則(1)漢字拆分規(guī)則;(2)解決重碼問(wèn)題的復(fù)合拆分規(guī)則;(3)解決重碼問(wèn)題的代碼移位規(guī)則;(1)上述漢字拆分規(guī)則有以下三個(gè)內(nèi)容a)模塊,b)反偏首模塊以及c)模塊變形;a)其中模塊是指將每個(gè)漢字按字形拆分為若干模塊,所有模塊都被寫(xiě)入模塊表中,模塊表中共有70個(gè)模塊,分別均有對(duì)應(yīng)的英文26個(gè)字母作代碼或字符,按筆順取其第1、2、3及最后一個(gè)模塊所對(duì)應(yīng)的英文代碼或字符,就組成該漢字的英文編碼,上述26個(gè)英文字母就是分配在計(jì)算機(jī)鍵盤(pán)上的26個(gè)英文字母;不足四個(gè)模塊者用空模塊補(bǔ)齊,空模塊代碼為D;模塊與英文代碼的對(duì)照見(jiàn)模塊表;b)反偏首模塊將上述70個(gè)模塊中的13個(gè)偏旁部首定義為反偏首模塊或反常模塊,它們是日、月、钅、木、氵、火、亻、扌、口、疒、艸、又、石;要給反偏首漢字編碼,只需將第一個(gè)(即反偏首)模塊的代碼移到第4位,將第2、3、最后一個(gè)模塊的代碼分別左移到首位、第2位、第3位;在計(jì)算機(jī)術(shù)語(yǔ)中,這稱為循環(huán)左移一位規(guī)則;c)模塊變形模塊表中用方括號(hào)括起的模塊可看成模塊的變形‘已,或‘己,是模塊“巳”的變形;‘氺’是模塊“氵”的變形,‘心’是“忄”的變形,模塊變形的英文代碼與其模塊英文代碼一樣;當(dāng)該漢字少于四個(gè)模塊時(shí),下列模塊變形需加前綴或后綴上述前綴加代碼D或U,上述后綴加代碼D或U或C;模塊變形需加前綴或后綴的是指讠(D)L,方(D)G,衤Y(U),牜(U)F,禾(U)R,辶(D)V,宀(D)B,廣(D)W,戶(D)P(U),廿H(C);關(guān)于模塊說(shuō)明‘模塊’與‘字根’或‘字元’大同小異,“模塊漢字編碼方法”只采用‘模塊’,名副其實(shí),更具個(gè)性。
(2)解決重碼問(wèn)題的復(fù)合拆分規(guī)則復(fù)合拆分規(guī)則是對(duì)一個(gè)漢字進(jìn)行二次拆分將“異”拆分為“巳”、“艸”兩個(gè)模塊,對(duì)后一個(gè)模塊“艸”再進(jìn)行二次拆分為“一”、“丨”,“異”的英文編碼為ZHCI;(3)解決重碼問(wèn)題的代碼移位規(guī)則代碼移位規(guī)則是對(duì)某個(gè)漢字拆分后模塊對(duì)應(yīng)的四個(gè)英文代碼循環(huán)左移一位;2)、怎樣選取四個(gè)模塊是指在拆分漢字時(shí)為了避免出現(xiàn)二義性,根據(jù)各種漢字結(jié)構(gòu)有五種選取考慮按筆順選取第1(首)、2、3、4(尾)模塊;邊角優(yōu)先選?。皇孜矁?yōu)先、尾優(yōu)于首選??;上下或左右結(jié)構(gòu)者,平均選取;左中右結(jié)構(gòu)者,按1∶2∶1比例選??;3)、助記詞的設(shè)置設(shè)置反偏首模塊、復(fù)合拆分和代碼移位三項(xiàng)技術(shù),目的都是為了消除重碼。其實(shí),漢字編碼要解決的核心問(wèn)題就是消除重碼。漢字中筆劃完全相同的重碼字就有112個(gè),如已己巳、未末、貝內(nèi)岡、人入八義、晾景、吧邑等。助記詞共需記住180字,以設(shè)置助記詞的代價(jià)換得用三項(xiàng)技術(shù)簡(jiǎn)便解決了重碼的難題;助記詞有四類字(1)、復(fù)合拆分字共有56字;(2)、代碼移位字共有97個(gè);(3)、筆劃字這里指需要記住的18個(gè)筆劃字,這18個(gè)字盡管也能拆分為模塊,但只按筆劃拆分,筆劃也是模塊,所以筆劃字完全遵守第一條編碼規(guī)則;(4)、一碼字共有10字,一碼字指漢字就是模塊,它的代碼是唯一的有效代碼,其它3個(gè)為空模塊的代碼D。
各類助記字都遵守編碼規(guī)則。
本發(fā)明的“模塊漢字編碼方法”方法與現(xiàn)有技術(shù)相比較有以下有益效果1、沒(méi)有重碼,能夠盲打;2、編碼規(guī)則簡(jiǎn)單,容易記憶;3、本編碼通過(guò)鍵盤(pán)輸入計(jì)算機(jī)來(lái)實(shí)現(xiàn),不需要添加專用設(shè)備。
具體實(shí)施方法字例實(shí)施例1(模塊)“給”由纟、人、一、口4個(gè)模塊構(gòu)成,纟的代碼為E,人代碼為G,一代碼為C,口代碼為O,于是漢字“給”的編碼為EGCO;“峰”由5個(gè)模塊山、丿、又、二、十構(gòu)成,取其4個(gè)模塊山、丿、又、十,“峰”的編碼為AUKI;“粉”由三個(gè)模塊米、八、刀構(gòu)成,補(bǔ)一個(gè)空模塊,“粉”的編碼為NKBD;“間”由兩個(gè)模塊門(mén)、日構(gòu)成,補(bǔ)兩個(gè)空模塊,“間”的編碼為NQDD;實(shí)施例2(反偏首模塊)“曙”拆分為日、四、土、丿、日,取日、四、土、目,編碼為FTQQ;“膜”拆分為月、艸、日、大,編碼為HQYA;“銘”拆分為钅、夕、口,編碼為NODG;“村”拆分為木、寸,編碼為HDDR;“照”拆分為日、刀、口、灬,編碼為QBOX;值得注意的是(1)反偏首指純粹的偏旁部首,如“昭BODQ中的“日”,而“照”QBOX中的“日”則不是反偏首。同樣,楚RRJS,嗣OHJO,渠ZPPR,哲FUIO,勤HTJU,甲QIDD,暢QIJU,忠OIXD,男QJUD,恁MUTX,顙KRXG等,起筆模塊都不是反偏首。不言而喻,不在起筆位置的這些模塊,就更不是反偏首了。如普HXCQ,朝IQIA,淦GDDZ,桀NFRD,衍KZTJ,災(zāi)DBXD,苻MHDH,皙RUUQ,鼻UBKH,圍OTJI,峪AKGO,褻XFSY,磬TUSE,蠹CESS,淑RZKZ。
(2)廣而知之,模塊表中所列70個(gè)模塊,它們的檢字功能適用于漢字的各個(gè)位置;而字典中的近二百個(gè)偏旁部首,其檢字功能只限于起筆,還不嚴(yán)格。
實(shí)施例3(模塊變形)讓DLRC,記DLZD,譜LHXQ,襖YUUY,褥YWTH,利URIJ,穆RUQU,牲UFMT,物FUJU,逞OMDV,退JTYV,廻OOVD,延USVD,宴DBQW,密BXUA,應(yīng)DWZC,啟DPUO,扁DPSH,編EPSH,洪HCKZ,黃HSTK,潢HSKZ,放GMUV,防PDGD;[注]下列常遇見(jiàn)的偏旁部首沒(méi)定成模塊,因?yàn)樗鼈兛梢杂闷涫孜材K的兩個(gè)代碼表示虍RL,斤UI,鳥(niǎo)UC,隹MT,耳CU,骨SA,身UU,皮JK,鼠NL,雨CZ,革HI;但也可以不限。因而這些偏旁部首不需要記憶。其例字見(jiàn)實(shí)施例4。
實(shí)施例4(未定成模塊的偏旁部首實(shí)例)虎RLUS,虢GHRS,慮RJLX,雄WEMT,雕SOMT,難MXTK,骸SAXG,滑SJAZ,頗JKXG,波JIKZ,皮JIUK,鞭HIMV,新XRUI,沂UUIZ,餌KCIU,聾WLCU,聰CUKX,耳CIIU,聊UUPC,射UIUH,躺UUZO,身UIJU,雪CZJT,雹CZUZ;實(shí)施例5(復(fù)合拆分)復(fù)合拆分是對(duì)一個(gè)漢字進(jìn)行二次拆分。
如“異”拆分為“巳”、“艸”兩個(gè)模塊,對(duì)后一個(gè)模塊“艸”二次拆分為“一”、“丨”,于是“異”的編碼為ZHCI;同樣,“仁”TCCM,“權(quán)”KJVR,“豈”AZPL,“肯”SAST,“休”RCZM。
從這些例字可知,復(fù)合拆分都出現(xiàn)在第一次拆分為兩個(gè)模塊的漢字上。
實(shí)施例6(代碼移位)代碼移位就是對(duì)某個(gè)漢字拆分后模塊對(duì)應(yīng)的四個(gè)代碼循環(huán)左移一位。左移方法與反偏首字一樣,可見(jiàn)左移字中的反偏首字要經(jīng)過(guò)二次循環(huán)左移。
具體例子凡SDDU,著UQHT,敘CRKG,跋SWKO(注多于四個(gè)模塊的漢字,模塊,通常忽略),及JJVU,標(biāo)ZDRT,引SIDP。
實(shí)施例7(怎樣選取四個(gè)模塊)實(shí)施例7(1)按筆順選取第一(首)、二、三、四(尾)模塊。
窨BKXQ,烹XOJX,跑OSUZ,膀XKGA,礴HZHE,旮USQD,旯USDQ,蔬JSLH實(shí)施例7(2)邊角優(yōu)先選取。靜TABJ,萍ZCIH,鞣HIER,戳JJMB,戮JGUB,氄EOUL,劐HMKJ,倒CTJM,熬TBMX,巔AIKG,簫GJUI實(shí)施例7(3)
首尾優(yōu)先、尾優(yōu)于首選取。例糴UVKR,悍XQCI,邗TIPD,末CRDD實(shí)施例7(4)上下或左右結(jié)構(gòu)者,平均選取。例甓PXLS,瓴GECS,罄TSMA,誓FUXO,瓢FZUV實(shí)施例7(5)左中右結(jié)構(gòu)者,按1∶2∶1比例選取。例弼PXQS,掰UKBJ,嘏IPTK,衢KBTJ,蹾OXVV,懶XCZG,辨XUDI,鍛UTKG。
實(shí)施例8(助記詞復(fù)合拆分字,代碼移位字,筆劃字和一碼字)需要助記的字(個(gè))1個(gè)不進(jìn)行代碼移位的反偏首字唄OSGD。
3個(gè)需二次左移的正常模塊字九DDUS紖SIEP動(dòng)JUTE。
(十)10個(gè)一碼字。
(百)97個(gè)代碼移位字,(含二次左移的正常模塊字三個(gè)九纼動(dòng))(二)18個(gè)筆劃字(五)56個(gè)復(fù)合拆分字總共180字,只占全部漢字的0.027%。
實(shí)施例8(1)復(fù)合拆分字復(fù)合拆分字總共56字,全部在例中。
例刁JUUD仁權(quán)豈肯休閑,侜RUIM立XHKC異,厲申示云七CLLD弁,萬(wàn)CBJU名NOSC好漢,闖NQJC入生林內(nèi),覓扒硨芷,未果。幾蠆GSOE蜆現(xiàn)MYSL,叭KUVO嘆,失MYCG足SRGO,血USSH灑FCCZ沐漁RBCZ汩圯下,由STIC鈿KSTG粟FNKR忌ZXUD址TSRC右WOSC走TSRG出PAII來(lái)CNKR。
實(shí)施例8(2)代碼移位字代碼移位字總共97個(gè),全部在例中。
例皈QUKU鈉GDGS轱IODF架UORJ(皈鈉轱架諧音歸納估價(jià)),眷YBDH洗ULZF漱ZGZC抻踐SQUO棉恤,田TDDS張SUVP旌MMTG纼SIEP*符MHDG,勞JUHB動(dòng)JUTE*。猷OYDK聊UUPC吧ILOJ酤IODO旰IDQC。葷FDHB味RDOC炸ITXM蚺蝤鯛羔TXDH,胗椎胛IDAQ,爪蹄虱骼。唯靳飯菜毫嫌奢雜,蕎糗蒲善茴茹莉柑,漸糧荒,炱屑,另信磯庇颶霆,濠江九DDUS*浬渦泓,旭暮坳吠,禽窠鴰啼,籟渲呻吟,刀吶救命,景貌蔭涼。*代碼移位字中含三個(gè)需要二次左移的正常模塊字纼SIEP動(dòng)JUTE九DDUS實(shí)施例8(3)筆劃字(18字)例子川井太岡夫曰IJCC己友干藝虧CCSD,化三弔僅刄尺牛UCCI。
實(shí)施例8(4)一碼字(10字)一碼字指漢字就是模塊,它的代碼是唯一的有效代碼,其它三個(gè)為空模塊的代碼D。
例子日DDDQ,月DDDA,土TDDD,木DDDR,人GDDD,心XDDD,匕ADDD,巳ZDDD,八KDDD,夕NDDD。
上述‘模塊表’,如下所示Q 日 馬A 月 山 匕G 钅 人 爫 萬(wàn) [方]R 木 魚(yú) 舟 [禾]Z 氵 犭 巳 小 [已 己 ツ 氺]X 火 忄 灬 亠 [心 ]M 亻 王 []N 疒 門(mén) 夕 米 臼 O 口 酉 [囗]H 艸 寸 冫 [廾 ]F 扌 車(chē) 西 罒 [牜 ]E 石 纟 [厶 ]K 又 饣 田 彳 八 [丷]T 土 二 B 冖 刀 戈 目 [ク 宀]Y 礻 見(jiàn) 大 [ 衤]W 女 廠 [ナ 廣]P 阝 匚 [ㄩ 卩 尸 戶]S 蟲(chóng) 止 皿 冂 乁 V 子 [辶 廴]
U 丿C 一[ ]I 丨十J [乛]L [讠]D 丶空模塊以上模塊共70個(gè),模塊變形42個(gè)。上述‘漢字與模塊漢字編碼轉(zhuǎn)換表,的說(shuō)明它是全部漢字與其“模塊漢字編碼方法”編碼一一對(duì)應(yīng)的字庫(kù),是本發(fā)明不可分的一部分。此轉(zhuǎn)換表可利用WORD字處理文件實(shí)現(xiàn)。如欲將此轉(zhuǎn)換表置入計(jì)算機(jī),還需經(jīng)早已公開(kāi)的技術(shù)進(jìn)行漢字與計(jì)算機(jī)內(nèi)碼的轉(zhuǎn)換。無(wú)需贅述。
以上實(shí)施例只是對(duì)本發(fā)明作較為詳細(xì)的描述,不是用來(lái)限定本發(fā)明的保護(hù)范圍的,在不脫離本發(fā)明的精神和構(gòu)思的范圍內(nèi),本領(lǐng)域普通技術(shù)人員可以進(jìn)行各種改進(jìn)或變化,仍然屬于本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.模塊漢字編碼方法是一種漢字編碼方法或計(jì)算機(jī)漢字輸入方法,該方法使用編碼規(guī)則、模塊表和漢字與模塊漢字編碼轉(zhuǎn)換表,有以下步驟按編碼規(guī)則先將某漢字拆分并選取四個(gè)模塊,對(duì)照模塊表轉(zhuǎn)換成代碼,四個(gè)代碼再組合即該漢字的編碼,從鍵盤(pán)鍵入編碼,計(jì)算機(jī)就會(huì)從漢字與模塊漢字編碼轉(zhuǎn)換表中找出該漢字顯示在屏幕上;其特征在于1)、編碼規(guī)則;2)、怎樣選取四個(gè)模塊;3)、設(shè)置助記詞;1)、編碼規(guī)則有3個(gè)輸入規(guī)則(1)拆分規(guī)則;(2)解決重碼問(wèn)題的復(fù)合拆分規(guī)則;(3)解決重碼問(wèn)題的代碼移位規(guī)則;(1)上述拆分規(guī)則有以下三個(gè)內(nèi)容a)模塊,b)反偏首模塊以及c)模塊變形;a)其中模塊是指將每個(gè)漢字按字形拆分為若干模塊,所有模塊都被寫(xiě)入模塊表中,模塊表中共有70個(gè)模塊,分別均有對(duì)應(yīng)的英文2 6個(gè)字母作代碼或字符,按筆順取其第1、2、3及最后一個(gè)模塊所對(duì)應(yīng)的英文代碼或字符,就組成該漢字的英文編碼,上述26個(gè)英文字母就是分配在計(jì)算機(jī)鍵盤(pán)上的26個(gè)英文字母;不足四個(gè)模塊者用空模塊補(bǔ)齊,空模塊代碼為D;模塊與英文代碼的對(duì)照見(jiàn)模塊表;b)反偏首模塊將上述70個(gè)模塊中的13個(gè)偏旁部首定義為反偏首模塊或反常模塊,它們是日、月、钅、木、氵、火、亻、扌、口、疒、艸、又、石;要給反偏首漢字編碼,只需將第一個(gè)反偏首模塊的代碼移到第4位,將第2、3、最后一個(gè)模塊的代碼分別左移到首位、第2位、第3位;在計(jì)算機(jī)術(shù)語(yǔ)中,這稱為循環(huán)左移一位規(guī)則;c)模塊變形模塊表中用方括號(hào)括起的模塊可看成模塊的變形已或己是模塊巳的變形;氺是模塊氵的變形,心是忄的變形,模塊變形的英文代碼與其模塊英文代碼一樣;當(dāng)該漢字少于四個(gè)模塊時(shí),下列模塊變形需加前綴或后綴上述前綴加代碼D或U,上述后綴加代碼D或U或C;模塊變形需加前綴或后綴的是指讠(D)L,方(D)G,衤Y(U),牜(U)F,禾(U)R,辶(D)V,宀(D)B,廣(D)W,戶(D)P(U), H(C);(2)解決重碼問(wèn)題的復(fù)合拆分規(guī)則復(fù)合拆分規(guī)則是對(duì)一個(gè)漢字進(jìn)行二次拆分將異拆分為巳、艸兩個(gè)模塊,對(duì)后一個(gè)模塊艸再進(jìn)行二次拆分為一、丨,異的英文編碼為ZHCI;(3)解決重碼問(wèn)題的代碼移位規(guī)則代碼移位規(guī)則是對(duì)某個(gè)漢字拆分后選取模塊對(duì)應(yīng)的四個(gè)英文代碼循環(huán)左移一位;2)、上述怎樣選取四個(gè)模塊是指從漢字拆分出的若干模塊中怎樣選取其四,按筆順選取第1(首)、2、3、4(尾)模塊;邊角優(yōu)先選??;首尾優(yōu)先、尾優(yōu)于首選?。簧舷禄蜃笥医Y(jié)構(gòu)者,平均選取;左中右結(jié)構(gòu)者,按1∶2∶1的比例選?。?)、助記詞的設(shè)置助記詞有四類字(1)、復(fù)合拆分字56個(gè),(2)、代碼移位字97個(gè),(3)、筆劃字18個(gè)和(4)、一碼字10個(gè);各類助記字都遵守上述的編碼規(guī)則;上述模塊表如下所示Q 日 馬;A 月 山 匕;G 钅 人 爫 萬(wàn) [方];R 木 魚(yú) 舟 [禾];Z 氵 犭 巳 小 [已 己 ツ 氺];X 火 忄 灬 亠 [心 ];M 亻王 [];N 疒 門(mén) 夕 米 臼 [ ];O 口 酉 [囗];H 艸 寸 冫[ 廾 ];F 扌車(chē) 西 罒 [牜 ];E 石 纟 [ム ];K 又 饣 田 彳 八 [丷];T 土 二 [ ];B 冖 刀 戈 目 [ク 宀];Y 礻 見(jiàn) 大 [ 衤];W 女 廠 [ナ 廣];P 阝 匚 [凵 コ卩 尸 戶];S 蟲(chóng) 止 皿 冂 乁[ ];V 子 [辶 廴];U 丿;C 一 [ ];I 丨 十;J [亅 乛];L [讠];D 丶 空模塊;模塊70個(gè),模塊變形42個(gè);上述漢字與模塊漢字編碼轉(zhuǎn)換表是全部漢字與其模塊漢字編碼一一對(duì)應(yīng)的字庫(kù)。
全文摘要
本發(fā)明涉及模塊漢字編碼方法,更具體地說(shuō)涉及計(jì)算機(jī)漢字輸入方法。該方法有以下步驟利用編碼規(guī)則及模塊表將漢字按筆順拆分成幾個(gè)模塊;取其第1、2、3及最后一個(gè)模塊;對(duì)照模塊表替換成與之對(duì)應(yīng)的英文字母作代碼;四個(gè)代碼再組合就是該漢字的編碼;從鍵盤(pán)上鍵入編碼。從漢字拆分的模塊中取其四,依漢字結(jié)構(gòu)有五種取法按筆順選取第1、2、3、4(尾)模塊;邊角優(yōu)先選??;首尾優(yōu)先、尾優(yōu)于首選??;上下或左右結(jié)構(gòu),平均選?。蛔笾杏医Y(jié)構(gòu),按1∶2∶1的比例選取。助記詞共180字分四類復(fù)合拆分字、代碼移位字、筆劃字、一碼字,都遵守編碼規(guī)則。其中,復(fù)合拆分字編碼時(shí)要用復(fù)合拆分規(guī)則,代碼移位字要用代碼移位規(guī)則。
文檔編號(hào)G06F3/023GK1700157SQ20051008501
公開(kāi)日2005年11月23日 申請(qǐng)日期2005年7月19日 優(yōu)先權(quán)日2005年7月19日
發(fā)明者庚以津 申請(qǐng)人:庚以津