專利名稱::漢字雙元碼的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明屬于漢字編碼方法,涉及漢字雙元碼。漢字的計(jì)算機(jī)鍵盤輸入技術(shù),是普及計(jì)算機(jī)應(yīng)用的關(guān)健技術(shù)。據(jù)報(bào)導(dǎo),目前已有數(shù)百種漢字編碼方案問(wèn)世,然而,從實(shí)際應(yīng)用看,易學(xué)易用的漢字編碼方法還沒(méi)有到達(dá)人們的手中。已有的漢字編碼(主要指按字根方式進(jìn)行編碼的形碼)之所以不便使用,其原因主要有以下兩個(gè)方面一、編碼方法復(fù)雜;二、字根不便識(shí)別和記憶。例如王永民發(fā)明的五筆字型碼,以下對(duì)該碼進(jìn)行簡(jiǎn)要分析(一)編碼方法復(fù)雜。這表現(xiàn)在編碼規(guī)則與拆字根規(guī)則兩個(gè)方面。在編碼規(guī)則方面,其編碼既要判斷字根、筆劃、字根結(jié)構(gòu)類型的代碼,又要將筆劃代碼和字根結(jié)構(gòu)類型代碼進(jìn)行合并,從而“計(jì)算”出識(shí)別碼,這種編碼的不直接性增加了思維的負(fù)擔(dān);在拆分字根方面,該碼為了確定識(shí)別碼,將漢字通常的字形結(jié)構(gòu)分析改為字根結(jié)構(gòu)分析,從而將漢字分為單字根結(jié)構(gòu)、散字根結(jié)構(gòu)、連筆結(jié)構(gòu)、交叉結(jié)構(gòu)等,然后再分為左右結(jié)構(gòu)、上下結(jié)構(gòu)和混和結(jié)構(gòu)。這種分析將漢字結(jié)構(gòu)人為的復(fù)雜化了,以致增加了該碼的學(xué)習(xí)難度。(二)字根不便識(shí)別和記憶。該碼的拆分規(guī)則較為復(fù)雜,不易理解。許多字根屬于硬性規(guī)定的筆劃組合,對(duì)這些筆劃組合的識(shí)別不符合漢字認(rèn)知的常規(guī),不符合對(duì)于漢字字形結(jié)構(gòu)的正常理解,由于這一原因,編碼時(shí)字根不便識(shí)別;該碼共有199個(gè)字根,由于字根數(shù)量多和字根的非常規(guī)性,也使該碼字根不便記憶。五筆字型碼具有重碼少,專業(yè)速度快的優(yōu)點(diǎn),是目前普及面最廣的漢字輸入方法。但由于該碼存在以上缺點(diǎn),致使許多非專業(yè)用戶感到難學(xué)難用。這種情況的存在,直接影響了計(jì)算機(jī)的普及應(yīng)用。本發(fā)明的目的提出一種規(guī)則簡(jiǎn)單,不拆字根,使用完整部首等規(guī)范化程度高、易于識(shí)別和記憶的漢字信息的漢字編碼方法。本發(fā)明的目的是通過(guò)以下兩條途徑實(shí)現(xiàn)的第一條途徑漢字包括獨(dú)體字與合體字兩種字形,其中合體字由部首與右文兩個(gè)部件所構(gòu)成,獨(dú)體字與合體字的右文均有一個(gè)或多個(gè)筆劃,獨(dú)體字的右下角有一個(gè)角形,或獨(dú)體字的左下角與右下角共同構(gòu)成一個(gè)角形,合體字的右文的右下角有一個(gè)角形,或合體字的右文的左下角與右下角共同構(gòu)成一個(gè)角形,將全部部首、筆劃、角形分別區(qū)分為相應(yīng)數(shù)量的類,再將各類部首、筆劃、角形分別規(guī)定出相應(yīng)的代碼,本發(fā)明的特征是其編碼規(guī)則由(1)獨(dú)體字編碼規(guī)則,即將筆劃代碼、角形代碼加以組合,(2)合體字的編碼規(guī)則,即將部首代碼、筆劃代碼、角形代碼加以組合,所構(gòu)成。根據(jù)以上所述,本發(fā)明可有以下五種具體方案第一種方案,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將4個(gè)筆劃代碼、1個(gè)角形代碼加以組合,(2)合體字的編碼規(guī)則,即;將1個(gè)部首代碼、3個(gè)筆劃代碼、1個(gè)角形代碼加以組合,所構(gòu)成。第二種方案,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將3個(gè)筆劃代碼、1個(gè)角形代碼加以組合,(2)合體字的編碼規(guī)則,即;將1個(gè)部首代碼、3個(gè)筆劃代碼、1個(gè)角形代碼加以組合,所構(gòu)成。第三種方案,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將3個(gè)筆劃代碼、1個(gè)角形代碼加以組合,(2)合體字的編碼規(guī)則,即;將1個(gè)部首代碼、2個(gè)筆劃代碼、1個(gè)角形代碼加以組合,所構(gòu)成。第四種方案,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將2個(gè)筆劃代碼、1個(gè)角形代碼加以組合,(2)合體字的編碼規(guī)則,即;將1個(gè)部首代碼、2個(gè)筆劃代碼、1個(gè)角形代碼加以組合,所構(gòu)成。第五種方案,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將2個(gè)筆劃代碼、1個(gè)角形代碼加以組合,(2)合體字的編碼規(guī)則,即;將1個(gè)部首代碼、1個(gè)筆劃代碼、1個(gè)角形代碼加以組合,所構(gòu)成。第二條途徑第二條途徑的內(nèi)容與第一條途徑基本相同,不同之處在于其漢字編碼增加一個(gè)聲母代碼,其作用在于降低重碼率。漢字包括獨(dú)體字與合體字兩種字形,其中合體字由部首與右文兩個(gè)部件所構(gòu)成,獨(dú)體字與合體字的右文均有一個(gè)或多個(gè)筆劃,獨(dú)體字的右下角有一個(gè)角形,或獨(dú)體字的左下角與右下角共同構(gòu)成一個(gè)角形,合體字的右文的右下角有一個(gè)角形,或合體字的右文的左下角與右下角共同構(gòu)成一個(gè)角形,每個(gè)字的音節(jié)均有一個(gè)聲母,將全部部首、筆劃、角形、聲母分別區(qū)分為相應(yīng)數(shù)量的類,再將各類部首、筆劃、角形、聲母分別規(guī)定出相應(yīng)的代碼,本發(fā)明的特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將筆劃代碼、角形代碼、聲母代碼加以組合,(2)合體字的編碼規(guī)則,即將部首代碼、筆劃代碼、角形代碼、聲母代碼加以組合,所構(gòu)成。根據(jù)以上所述,本發(fā)明可有以下五種具體方案第一種方案,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將4個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,(2)合體字的編碼規(guī)則,即將1個(gè)部首代碼、3個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,所構(gòu)成。第二種方案,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將3個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,(2)合體字的編碼規(guī)則,即將1個(gè)部首代碼、3個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,所構(gòu)成。第三種方案,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將3個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,(2)合體字的編碼規(guī)則,即將1個(gè)部首代碼、2個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,所構(gòu)成。第四種方案,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將2個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,(2)合體字的編碼規(guī)則,即將1個(gè)部首代碼、2個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,所構(gòu)成。第五種方案,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將2個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,(2)合體字的編碼規(guī)則,即將1個(gè)部首代碼、1個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,所構(gòu)成。本發(fā)明具有以下優(yōu)點(diǎn)1、編碼規(guī)則簡(jiǎn)單;2、不拆字根,只使用完整部首、筆劃、角形進(jìn)行編碼,避免了對(duì)字形的硬性拆分;3、所使用的漢字信息符合漢字認(rèn)知的常規(guī),規(guī)范化程度高,因而易于識(shí)別和記憶;4、用于計(jì)算機(jī)的漢字輸入時(shí),可使用標(biāo)準(zhǔn)鍵盤。實(shí)施例1(一)編碼規(guī)則(1)獨(dú)體字的編碼規(guī)則將3個(gè)筆劃代碼、1個(gè)角形代碼加以組合,(2)合體字的編碼規(guī)則將1個(gè)部首代碼、2個(gè)筆劃代碼、1個(gè)角形代碼加以組合。(二)漢字信息代碼(1)筆劃代碼。本例將漢字筆劃分為10類,每類筆劃由一個(gè)數(shù)字為代碼。下表為10類筆劃的10個(gè)代表筆劃與代碼對(duì)照表10類筆劃的名稱分別是(1)橫、(2)豎、(3)撇、(4)捺、(5)點(diǎn)、(6)提、(7)橫折、(8)豎折、(9)橫鉤、(0)豎鉤。其中,(7)橫折類筆劃包括フㄋ(8)豎折類筆劃包括ㄑㄅ(10)豎鉤類筆劃包括口訣橫豎撇捺點(diǎn)和提,一二三四五和六;橫折是七豎折八,橫鉤是九豎鉤零。(2)角形代碼。本例將漢字角形分為10類,每類角形由一個(gè)數(shù)字(加撇)為代碼。下表為10類角形的10個(gè)代表角形與代碼對(duì)照表:本例角形分類方法與《四角號(hào)碼新詞典》的角形分類方法基本一致,不同之處在于取消了“點(diǎn)下有橫”的角形,以“0′”作為“右鉤”的代碼。10類角形的名稱分別是(1′)橫、(2′)豎、(3′)點(diǎn)捺、(4′)叉、(5′)插、(6′)方塊、(7′)角、(8′)八、(9′)小、(0′)右鉤。其中右鉤類角形包括,同時(shí)也包括有交叉筆劃的右鉤和右折,如弋、戈、戔、必、。口訣橫一豎二三點(diǎn)捺,叉四插五方塊六,角七八八九是小,向右一鉤都是零。(3)部首代碼。本例將漢字部首分為20類,每類部首由一個(gè)字母為代碼。下表為20類部首的20個(gè)代表部首與代碼的對(duì)照表</tables>20類部首的名稱分別是單人旁,言字旁,女字旁,提手旁,口字旁,金字旁,木字旁,三點(diǎn)水,火字旁,土字旁,走之旁,絞絲旁,廣字旁,月字旁,田字旁,竹字頭,草字頭,寶蓋頭,魚字旁,龍字旁。其中,前19類部首的每類部首分別包括1個(gè)或多個(gè)常用的部首,“龍”類部首包括19類部首以外的所有部首。下表為20類部首總表口訣你記好,提手口,金木水火土,送給廣,月旁田,竹草寶魚龍。(三)編碼實(shí)例(1)獨(dú)體字編碼。該碼有4個(gè)代碼,其中前三個(gè)代碼為筆劃代碼,即獨(dú)體字前三個(gè)筆劃的代碼。當(dāng)字形不足三個(gè)筆劃時(shí),每空缺一個(gè)筆劃代碼補(bǔ)上一個(gè)數(shù)字“0”作為代碼。第四個(gè)代碼為角形代碼,即字形右下角角形的代碼,也可以是字形左下角與右下角共同構(gòu)成的角形的代碼。當(dāng)下角角形偏在左下角時(shí),角形代碼為“0”。編碼舉例木1239′禾3129′年3125′一1001′力7302′大1348′廣5130′戶5710′中2715′(2)合體字編碼。由兩個(gè)以上構(gòu)件組成的字形的為合體字。在本例中,合體字分析為部首與右文兩個(gè)部件。除含有辶(或廴、阝、皿、心、刂、鳥、頁(yè))部首的合體字以外,合體字中先寫的構(gòu)件為部首。右文為部首以外的部分。合體字編碼也有4個(gè)代碼,即1個(gè)部首代碼、2個(gè)筆劃代碼、1個(gè)角形代碼。合體字編碼分為以下兩種情況第一種情況。先寫部首,后寫右文的合體字的編碼。該碼的第1個(gè)代碼為部首代碼,第2、第3兩個(gè)代碼為合體字右文第1、第2兩個(gè)筆劃的代碼。當(dāng)右文不足兩個(gè)筆劃時(shí),所空缺的筆劃代碼補(bǔ)上一個(gè)數(shù)字“0”作為代碼。第四個(gè)代碼為右文右下角角形的代碼,也可以是右文左下角與右下角共同構(gòu)成的角形的代碼。當(dāng)下角角形偏在左下角時(shí),角形代碼為“0”。編碼舉例信A516′好C704′字R704′投D374′護(hù)D570′漢H744′期T372′引L202′孔C800′第二種情況。先寫右文,后寫部首(只限辶、廴、阝、皿、心、刂、鳥、頁(yè)8個(gè)部首)的合體字的編碼。該碼的第1、第2兩個(gè)代碼為合體字右文第1、第2兩個(gè)筆劃的代碼。當(dāng)右文不足兩個(gè)筆劃時(shí),所空缺的筆劃代碼補(bǔ)上一個(gè)數(shù)字“0”作為代碼。第3個(gè)代碼為右文右下角角形的代碼,也可以是右文左下角與右下角共同構(gòu)成的角形的代碼。當(dāng)下角角形偏在左下角時(shí),角形代碼為“0”。第4個(gè)代碼為部首代碼。編碼舉例送538′K建715′K那712′P領(lǐng)353′N盆342′O思276′B到181′F鴨275′S本發(fā)明可用于計(jì)算機(jī)標(biāo)準(zhǔn)鍵盤的漢字輸入。在本例中,筆劃代碼有10個(gè),角形代碼有10個(gè),部首代碼有20個(gè),它們可設(shè)置于標(biāo)準(zhǔn)鍵盤的三十個(gè)鍵位上,即10個(gè)筆劃代碼設(shè)置于從Q鍵向右數(shù)的10個(gè)鍵位上;10個(gè)角形代碼設(shè)置于從A鍵向右數(shù)的10個(gè)鍵位上;20個(gè)部首代碼設(shè)置于從A鍵向右數(shù)的10個(gè)鍵位和從Z鍵向右數(shù)的10個(gè)鍵位的共20個(gè)鍵位上。實(shí)施例2(一)編碼規(guī)則(1)獨(dú)體字的編碼規(guī)則將3個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,(2)合體字的編碼規(guī)則將1個(gè)部首代碼、2個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合。(二)漢字信息代碼(1)筆劃代碼(同例1)。(2)角形代碼(同例1)。(3)部首代碼(同例1)。(4)聲母代碼每個(gè)字的音節(jié)均有一個(gè)聲母,漢語(yǔ)拼音有26個(gè)聲母。本例漢字聲母代碼與“漢語(yǔ)拼音方案”聲母字母基本相同,不同之處在于以代碼z′表示zh,以代碼c′表示ch,以代碼s′表示sh。下表為26個(gè)聲母代碼表</tables>(三)編碼實(shí)例(1)獨(dú)體字編碼。內(nèi)容與例1基本相同,不同之外在于該碼有5個(gè)代碼,第5個(gè)代碼為聲母代碼。編碼舉例木1239′M禾3129′H年3125′N一1001′Y力7302′L大1348′D廣5130′G戶5710′H中2715′Z′(2)合體字編碼。內(nèi)容與例1基本相同,不同之處在于該碼有5個(gè)代碼,第5個(gè)代碼為聲母代碼。第一種情況編碼舉例信A516′X好C704′H字R704′Z投D374′T護(hù)D570′H漢H744′H期T372′Q引L202′Y孔C800′K第二情況編碼舉例送538′KS建715′KJ那712′PN領(lǐng)353′NL盆342′OP思276′BS到171′FD鴨275′SY本發(fā)明可用于計(jì)算機(jī)標(biāo)準(zhǔn)鍵盤的漢字輸入。本例中的漢字信息代碼在鍵盤上的設(shè)置與例1基本相同,不同之處在于26個(gè)聲母代碼按照bpmfgkhaoe,dtnljqxyw,z′c′s′rzcs的順序與鍵盤上從Q鍵到M鍵的26個(gè)字母鍵位一一對(duì)應(yīng)。聲母代碼在鍵盤上的這種排列方法,主要考慮了學(xué)習(xí)漢語(yǔ)拼音聲母的常規(guī)和聲母代碼在鍵盤上排列的整齊性。雙元碼由郭祖安發(fā)明。權(quán)利要求1.一種屬于漢字編碼方法的漢字雙元碼,漢字包括獨(dú)體字與合體字兩種字形,本發(fā)明的特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將筆劃代碼、角形代碼加以組合,(2)合體字的編碼規(guī)則,即將部首代碼、筆劃代碼、角形代碼加以組合,所構(gòu)成。2.根據(jù)權(quán)利要求1所述的漢字雙元碼,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將4個(gè)筆劃代碼、1個(gè)角形代碼加以組合,(2)合體字的編碼規(guī)則,即將1個(gè)部首代碼、3個(gè)筆劃代碼、1個(gè)角形代碼加以組合,所構(gòu)成。3.根據(jù)權(quán)利要求1所述的漢字雙元碼,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將3個(gè)筆劃代碼、1個(gè)角形代碼加以組合,(2)合體字的編碼規(guī)則,即將1個(gè)部首代碼、3個(gè)筆劃代碼、1個(gè)角形代碼加以組合,所構(gòu)成。4.根據(jù)權(quán)利要求1所述的漢字雙元碼,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將3個(gè)筆劃代碼、1個(gè)角形代碼加以組合,(2)合體字的編碼規(guī)則,即將1個(gè)部首代碼、2個(gè)筆劃代碼、1個(gè)角形代碼加以組合,所構(gòu)成。5.根據(jù)權(quán)利要求1所述的漢字雙元碼,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將2個(gè)筆劃代碼、1個(gè)角形代碼加以組合,(2)合體字的編碼規(guī)則,即將1個(gè)部首代碼、2個(gè)筆劃代碼、1個(gè)角形代碼加以組合,所構(gòu)成。6.根據(jù)權(quán)利要求1所述的漢字雙元碼,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將2個(gè)筆劃代碼、1個(gè)角形代碼加以組合,(2)合體字的編碼規(guī)則,即將1個(gè)部首代碼、1個(gè)筆劃代碼、1個(gè)角形代碼加以組合,所構(gòu)成。7.一種屬于漢字編碼方法的漢字雙元碼,漢字包括獨(dú)體字與合體字兩種字形,本發(fā)明的特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將筆劃代碼、角形代碼、聲母代碼加以組合,(2)合體字的編碼規(guī)則,即將部首代碼、筆劃代碼、角形代碼、聲母代碼加以組合,所構(gòu)成。8.根據(jù)權(quán)利要求7所述的漢字雙元碼,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將3個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,(2)合體字的編碼規(guī)則,即將1個(gè)部首代碼、2個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,所構(gòu)成。9.根據(jù)權(quán)利要求7所述的漢字雙元碼,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將2個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,(2)合體字的編碼規(guī)則,即將1個(gè)部首代碼、2個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,所構(gòu)成。10.根據(jù)權(quán)利要求7所述的漢字雙元碼,其特征是其編碼規(guī)則由(1)獨(dú)體字的編碼規(guī)則,即將2個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,(2)合體字的編碼規(guī)則,即將1個(gè)部首代碼、1個(gè)筆劃代碼、1個(gè)角形代碼、1個(gè)聲母代碼加以組合,所構(gòu)成。全文摘要本發(fā)明屬于漢字編碼方法,涉及漢字雙元碼。為解決目前漢字編碼所存在的方法復(fù)雜,字根難拆、難記的問(wèn)題,本發(fā)明以部首、筆劃、角形三種漢字信息對(duì)漢字進(jìn)行編碼,即獨(dú)體字編碼由筆劃代碼、角形代碼所構(gòu)成,合體字編碼由部首代碼、筆劃代碼、角形代碼所構(gòu)成。本發(fā)明的優(yōu)點(diǎn)在于,規(guī)則簡(jiǎn)單,不拆字根,所使用的漢字信息易于識(shí)別和記憶。本發(fā)明可用于計(jì)算機(jī)標(biāo)準(zhǔn)鍵盤的漢字輸入及字典的漢字排序等。文檔編號(hào)G06F3/023GK1152739SQ9610171公開日1997年6月25日申請(qǐng)日期1996年1月5日優(yōu)先權(quán)日1996年1月5日發(fā)明者郭祖安申請(qǐng)人:郭祖安