專利名稱:和碼漢字?jǐn)?shù)字輸入法的第二種編碼方法
技術(shù)領(lǐng)域:
“和碼漢字?jǐn)?shù)字輸入法”的第二種編碼方法,屬于漢字編碼輸入法技術(shù)領(lǐng)域,是適用于計(jì)算機(jī),手機(jī),電話機(jī)等設(shè)備的漢字鍵盤(pán)輸入方法。
背景技術(shù):
漢字輸入法是通過(guò)輸入鍵盤(pán)的有限個(gè)鍵輸入六千多個(gè),甚至更多漢字的方法,其關(guān)鍵技術(shù)是對(duì)這么多漢字進(jìn)行編碼,通過(guò)一碼或多碼輸入一個(gè)漢字或詞組,每個(gè)碼對(duì)應(yīng)輸入鍵盤(pán)上的一個(gè)鍵。對(duì)漢字不同的編碼,就產(chǎn)生不同的漢字輸入法。漢字輸入法就其所使用的漢字信息的不同大致可分為三類形碼,音碼,形音結(jié)合碼。
形碼是以漢字字形,筆畫(huà)和筆畫(huà)構(gòu)成的部件作為輸入碼輸入漢字,漢字一字一形,形碼與漢字最有可能構(gòu)成有效的對(duì)應(yīng)關(guān)系。由于漢字有大量的筆畫(huà)和部件,漢字的構(gòu)成又沒(méi)有很好的規(guī)律性,如何選取和利用字型、筆畫(huà)和部件進(jìn)行編碼,又有許多家的看法,這就形成了現(xiàn)有的多種漢字形碼輸入法?,F(xiàn)有的漢字形碼輸入根據(jù)輸入鍵盤(pán)的大小又可分為兩類標(biāo)準(zhǔn)計(jì)算機(jī)鍵盤(pán)形碼輸入法,和數(shù)字鍵盤(pán)形碼輸入法。
為標(biāo)準(zhǔn)計(jì)算機(jī)鍵盤(pán)設(shè)計(jì)的形碼輸入法的碼個(gè)數(shù)多,一般都在25個(gè)以上。構(gòu)成漢字的筆畫(huà)和部件按其特點(diǎn)分類組合到這些碼中。主要優(yōu)點(diǎn)有碼長(zhǎng)短,多為4,重碼率低。主要缺點(diǎn)有各碼所含的筆畫(huà)和部件難記、拆分取碼規(guī)則主觀、復(fù)雜、難記難用。許多輸入法中各碼的設(shè)計(jì)和安排都按“形托”或“音托”找與英文26個(gè)字母的關(guān)系,這些關(guān)系牽強(qiáng)附會(huì),26個(gè)英語(yǔ)字母在鍵盤(pán)上的排布本來(lái)就是無(wú)序的,就些方法使?jié)h字輸入法各碼在鍵盤(pán)上的位置更混亂,更難記。
為數(shù)字鍵盤(pán)設(shè)計(jì)的形碼輸入法的碼個(gè)數(shù)少,一般是5至10個(gè),各碼表示的內(nèi)容大都為單筆畫(huà)、簡(jiǎn)單易記。主要缺點(diǎn)有碼長(zhǎng)長(zhǎng)(取碼個(gè)數(shù)多),都為6個(gè)以上,獲取的字結(jié)構(gòu)與字意的信息量小,重碼率高,取碼困難。
許多輸入法不能同時(shí)適用于標(biāo)準(zhǔn)計(jì)算機(jī)鍵盤(pán)和數(shù)字鍵盤(pán),不能做到了同一輸入法在兩種鍵盤(pán)上的統(tǒng)一。
和碼漢字?jǐn)?shù)字輸入法是25個(gè)碼的純形碼數(shù)字輸入法,是電腦大小鍵盤(pán)與手機(jī)統(tǒng)一通用的。和碼電是由我(歐陽(yáng)貴林)發(fā)明的。專利申請(qǐng)?zhí)柺?00410017084.6,已于2005年1月12日公布。和碼輸入法的第一種編碼方法寫(xiě)在200410017084.6號(hào)專利中,其方法的主要內(nèi)容是字碼長(zhǎng)為4,漢字分為左右型和其它型,左右型字在左部起筆位置,右部的起筆位置和右部的末筆位置各取一個(gè)最大碼值的輸入碼,在剩余的筆畫(huà)與部件中再取一個(gè)最大碼值的碼;其它型字在起筆位置和末筆位置各取一個(gè)最大碼值的碼,在剩余的筆畫(huà)與部件中取最大碼值和次大碼值的碼。
發(fā)明內(nèi)容
一、和碼漢字?jǐn)?shù)字輸入法的第二種編碼方法的目的1、使和碼漢字?jǐn)?shù)字輸入法中,單字的編碼順序能盡量與漢字的書(shū)寫(xiě)順序相同。
2、使單字的取碼更順暢、自然。
3、使單字編碼最大程度地包涵漢字的字義與字結(jié)構(gòu)信息。
二、和碼漢字?jǐn)?shù)字輸入法的第二種編碼方法的技術(shù)方案1、第二種編碼方法的25個(gè)數(shù)字輸入碼所含筆畫(huà)與部件的選取與排布,是按照和碼漢字?jǐn)?shù)字輸入法專利(200410017084.6)所述的方法進(jìn)行的。
各數(shù)字碼所含筆畫(huà)與部件在5×5的矩陣格子中的縱橫有序地排序,在橫方向以橫(包括提與橫折)(橫是與其它筆畫(huà)相離或相接的橫)、橫(與其它筆畫(huà)相交的橫)、豎、撇、點(diǎn)(捺)為序,縱方向按筆畫(huà)與部件對(duì)字義與字結(jié)構(gòu)的限定性大小為序。第二種編碼方法的碼表如以下表1所示和碼碼表 (表1)各個(gè)碼在矩陣格子中的行數(shù)與列數(shù)的組合,構(gòu)成該碼的碼名與碼值。如“丿”的碼名(碼值)是14;“艸”的碼名(碼值)是42;“月”是54。
2、25個(gè)數(shù)字碼在電腦大鍵盤(pán)上的排布按碼值的大小順序,由中間向兩邊排布,與英文字母無(wú)關(guān)。25個(gè)碼在計(jì)算機(jī)大鍵盤(pán)上的排布如下表2示
(表2)3、漢字的一分、二分、三分方法漢字字形的結(jié)構(gòu)大體可概括為①、整型大、中、小、事、術(shù)、爭(zhēng)、不、臣、半、書(shū)、片、斤、自等等。
②、左右型漢、和、順、概、語(yǔ)、韻、贛等等。
③、上下型字、要、章、蔓、智、蘚、熊等等。
④、包圍、半包圍型國(guó)、圓、網(wǎng)、閥、兇、匡、虱、慶、病、匍、趣、過(guò)、題等等和碼的第二種編碼方法,依據(jù)漢字的字形結(jié)構(gòu)特點(diǎn),將漢字區(qū)分為一分(整體)、二分、三分等三類。
一分漢字為整型漢字大、中、小、事、術(shù)、爭(zhēng)、不、臣、半、書(shū)、片、斤、自等等。
二分漢字漢、和、順、字、要、章、國(guó)、匡、病等等。
三分漢字概、語(yǔ)、蔓、智、蘚、熊、贛、圓、網(wǎng)、閥、趣、題等等。
區(qū)分漢字的基本原則,按重要性由大到小排列如下,也即考慮的優(yōu)先順序①、漢字最多只分為三個(gè)部份;②、簡(jiǎn)單的單筆畫(huà)橫(一)豎(|)撇(丿)點(diǎn)(丶)捺,不能單獨(dú)成為一個(gè)部份。但不包括橫折筆畫(huà)(乙)③、相交的不能分成不同的部份,相接、相離的可分;④、和碼碼表中所列的各部件不能分成不同的部份;⑤、新華字典的部首目錄中所列的部首不能拆成不同的部份。
饣、馬、巛、比、瓦、支、水、氣、片、斤、爪、父、風(fēng)、殳、文、方、斗、礻、示、石、矢、瓜、疒、立、穴、衤、疋、艮、皮、矛、老、虍、蟲(chóng)、缶、舌、竹、血、衣、羊、米、羽、糸、麥、走、赤、豆、辰、豕、足、谷、辛、青、其、隹、食、革、骨、鬼、音、髟、麻、鹿、黑、鼠、鼻。
⑥、盡量保持各部份在結(jié)構(gòu)上的均衡,與筆畫(huà)數(shù)的均勻。
⑦、盡量使編碼順序保留與漢字的書(shū)寫(xiě)順序相同。
⑧、在以上各原則下,仍不好確定為幾分字的漢字,只有極少數(shù),一般都有容錯(cuò)碼。
4、和碼漢字?jǐn)?shù)字輸入法的第二種編碼方法的編碼規(guī)則①、單字的取碼規(guī)則字的最大碼長(zhǎng)為4。
一分(整體型)漢字的編碼方法是在漢字起筆位置的第一筆畫(huà)及其后續(xù)筆畫(huà),取一個(gè)最大碼值的筆畫(huà)或部件碼(包含第一筆畫(huà))作為第一碼,在余下的筆畫(huà)與部件中(剩余部份),按各個(gè)筆畫(huà)與部件碼值的由大到小的順序,取最大、次大、次次大碼值的3個(gè)筆畫(huà)或部件碼,分別作為第二、三、四碼。
例半15 22 14 12;書(shū)21 21 15 13。
二分漢字的編碼方法是在兩個(gè)部分的起筆位置各取一個(gè)最大碼值的筆畫(huà)或部件碼,按二個(gè)部份在漢字書(shū)寫(xiě)順序中的位置先后,分別定為第一、二碼,在剩余部份的筆畫(huà)與部件中,按各個(gè)筆畫(huà)與部件碼值的由大到小的順序,取最大、次大碼值的2個(gè)筆畫(huà)或部件碼,分別作為第三、四碼。
例字55 21 22;國(guó)43 51 15;碼11 21 33 14。
三分漢字的編碼方法是在三個(gè)部分的起筆位置各取一個(gè)最大碼值的筆畫(huà)或部件碼,按三個(gè)部份在漢字書(shū)寫(xiě)順序中的位置先后,分別定為第一、二、三碼,在剩余部份的筆畫(huà)與部件中,取一個(gè)最大碼值的筆畫(huà)或部件碼作為第四碼。
例語(yǔ)55 11 33 21;想52 53 45;蔓42 53 43 41;題53 11 51 34。
②、詞組的取碼規(guī)則詞組的碼長(zhǎng)為4,有的詞組的碼少于4個(gè)。
二字詞,取第一字的前兩個(gè)碼加上后一字的前兩個(gè)碼。如第一字只有一碼,則第二字取前3碼。三字詞取三個(gè)單字的第一碼和末一字的第二碼。四字和四字以上的詞取前四個(gè)字的第一碼。
三、和碼漢字?jǐn)?shù)字輸入法的第二種編碼方法的有益效果1、和碼漢字?jǐn)?shù)字輸入法的單字編碼方法,都是采用“定點(diǎn)位置加剩余部份”取最大碼值的取碼方法。但第一種編碼方法(見(jiàn)專利200410017084.6)中,漢字的第二(或第三)碼取自該字的末筆位置,使大多數(shù)單字的編碼順序與漢字的書(shū)寫(xiě)順序不合。
第二種編碼方法,革除了第一種方法在單字末筆位置取碼的不足,將漢字區(qū)分為一分、二分、三分漢字。取碼在各部份的起筆位置加剩余部份。GB2312的6763個(gè)漢字中,三分漢字約占60%,二分漢字約占30%,一分漢字約占10%。第二種編碼方法使70%的漢字的編碼順序與書(shū)寫(xiě)順序一致,余下的30%漢字的編碼順序也不同程度地與書(shū)寫(xiě)順序一致。
第二種編碼更合乎人們的寫(xiě)字習(xí)慣,更易接受,編碼更方便。
2、第二種編碼方法對(duì)碼表(字根表)做了一些調(diào)整,使其更好人體現(xiàn)和碼的縱橫順序規(guī)則,和簡(jiǎn)單易記的目的。
具體實(shí)施例方式
和碼漢字?jǐn)?shù)字輸入法具體實(shí)施需要結(jié)合不同的設(shè)備通過(guò)制作輸入軟件在設(shè)備上由鍵盤(pán)實(shí)現(xiàn)。和碼的25個(gè)數(shù)字碼可按其數(shù)字順序分布在不同設(shè)備的輸入鍵盤(pán)上。
對(duì)于計(jì)算機(jī)的標(biāo)準(zhǔn)大鍵盤(pán),和碼的25個(gè)碼使用26個(gè)英語(yǔ)字母鍵中的25個(gè)鍵,多余的一個(gè)字母鍵作為和碼的0碼值鍵,在漢字編碼中如果字或詞的碼數(shù)不夠4碼時(shí)可用0碼值補(bǔ)足。大鍵盤(pán)上的標(biāo)點(diǎn)符號(hào)鍵,可直接輸入對(duì)應(yīng)的標(biāo)點(diǎn)符號(hào)。大鍵盤(pán)上的其他輔助鍵和功能鍵也可為和碼輸入法的程序所用。
手機(jī)和其它數(shù)字鍵盤(pán)上都有十個(gè)數(shù)字鍵0、1、2、3、4、5、6、7、8、9,和碼漢字的編碼只使用其中1~5五個(gè)鍵。利用1、2、3、4、5的兩兩組合輸入和碼的25個(gè)數(shù)字碼。6、7、8、9四個(gè)鍵可用作輸入的標(biāo)點(diǎn)符號(hào)、數(shù)字運(yùn)算符號(hào),數(shù)字符號(hào)及英文字母。
權(quán)利要求
1.一種“和碼漢字?jǐn)?shù)字輸入法”的單字編碼方法,其特征是按照漢字字形的結(jié)構(gòu)特點(diǎn)(整體、上下、左右、包圍、半包圍等),將漢字區(qū)分為一分(整體)、二分、三分漢字等三類,單字最多取4個(gè)碼,一分(整體型)漢字的編碼方法是在漢字起筆位置的第一筆畫(huà)及其后續(xù)筆畫(huà),取一個(gè)最大碼值的筆畫(huà)或部件碼(包含第一筆畫(huà))作為第一碼,在余下的筆畫(huà)與部件中(剩余部份),按各個(gè)筆畫(huà)與部件碼值的由大到小的順序,取最大、次大、次次大碼值的3個(gè)筆畫(huà)或部件碼,分別作為第二、三、四碼;二分漢字的編碼方法是在兩個(gè)部分的起筆位置各取一個(gè)最大碼值的筆畫(huà)或部件碼,按二個(gè)部份在漢字書(shū)寫(xiě)順序中的位置先后,分別定為第一、二碼,在剩余部份的筆畫(huà)與部件中,按各個(gè)筆畫(huà)與部件碼值的由大到小的順序,取最大、次大碼值的2個(gè)筆畫(huà)或部件碼,分別作為第三、四碼;三分漢字的編碼方法是在三個(gè)部分的起筆位置各取一個(gè)最大碼值的筆畫(huà)或部件碼,按三個(gè)部份在漢字書(shū)寫(xiě)順序中的位置先后,分別定為第一、二、三碼,在剩余部份的筆畫(huà)與部件中,取一個(gè)最大碼值的筆畫(huà)或部件碼作為第四碼。
2.根據(jù)權(quán)利要求1所述的一種“和碼漢字?jǐn)?shù)字輸入法”的單字編碼方法,各數(shù)字碼所含筆畫(huà)與部件及其在5×5的矩陣格子中的排序特征是橫方向以橫(包括提與橫折)(橫是與其它筆畫(huà)相離或相接的橫)、橫(與其它筆畫(huà)相交的橫)、豎、撇、點(diǎn)(捺)為序,縱方向按筆畫(huà)與部件對(duì)字義或字結(jié)構(gòu)的限定性大小為序,碼表如以下表所示。和碼碼表
3.根據(jù)權(quán)利要求1所述的一種“和碼漢字?jǐn)?shù)字輸入法”的單字編碼方法,25個(gè)數(shù)字碼在電腦大鍵盤(pán)上的排序特征是按碼值的大小順序,由中間向兩邊排布,與英文字母無(wú)關(guān)。排布如下表所示
全文摘要
和碼漢字?jǐn)?shù)字輸入法的第二種編碼方法,按照漢字字形的結(jié)構(gòu)特點(diǎn)(整體、上下、左右、包圍、半包圍等),將漢字區(qū)分為一分、二分、三分漢字等三類。單字最多為四個(gè)碼。一分漢字的編碼方法是在漢字起筆位置取一個(gè)最大碼值的筆畫(huà)或部件碼作為第一碼,在剩余部件取最大、次大、次次大碼值的3個(gè)筆畫(huà)或部件碼作為第二、三、四碼;二分漢字的編碼是在兩個(gè)部分的起筆位置各取一個(gè)最大碼值的筆畫(huà)或部件碼,分別作為第一、二碼,在剩余部份取最大、次大碼值的2個(gè)筆畫(huà)或部件碼作為第三、四碼;三分漢字的編碼是在三個(gè)部分的起筆位置各取一個(gè)最大碼值的筆畫(huà)或部件碼作為第一、二、三碼,在剩余部份取一個(gè)最大碼值的筆畫(huà)或部件碼作為第四碼。
文檔編號(hào)G06F3/023GK1700154SQ200510025790
公開(kāi)日2005年11月23日 申請(qǐng)日期2005年5月10日 優(yōu)先權(quán)日2005年5月10日
發(fā)明者歐陽(yáng)貴林 申請(qǐng)人:歐陽(yáng)貴林