單字二碼輸入法
【專利摘要】一種計算機漢字編碼輸入方法即單字二碼輸入法,它選用28個左右的多筆畫部件和五種基本筆畫編碼,優(yōu)選編碼規(guī)則,單字碼長只有二碼,能做到既簡單又方便地輸入漢字。
【專利說明】單字二碼輸入法
【技術領域】
[0001]本發(fā)明屬于電腦漢字編碼輸入方法,也就是計算機漢字編碼輸入法。因為本輸入法在輸入單個漢字最多只用2碼,與其他輸入法都不同,所以稱為單字二碼輸入法,還涉及了為實現(xiàn)這一輸入法的鍵盤。
【背景技術】
[0002]鍵盤輸入法是目前漢字輸入法中技術最成熟,使用最廣泛的輸入法。鍵盤輸入的特點是必須對輸入的漢字進行編碼,漢字編碼是指用一組代碼表示一個漢字,按漢字編碼所在鍵,通常要按1?4鍵輸入一個漢字。鍵盤輸入按編碼劃分,可分為音碼、形碼、音形碼三類。本發(fā)明屬于形碼輸入法。
[0003]形碼利用漢字的字形特征進行編碼,具有輸入速度快等優(yōu)點,但往往漢字部件太多,記憶麻煩,有時拆分也麻煩。最初的形碼利用漢字的首尾部件的代碼編碼,漢字部件數(shù)量為60個以上,單字的編碼只有二碼,雖然編碼規(guī)則簡單,碼長短,但重碼率較高,為降低重碼,四碼的形碼被發(fā)明出來,只要精選100多個部件,就能做到高速盲打輸入,缺點是單個漢字的碼長有4碼,比較難記,而且這類輸入法因為碼長較長,不能與拼音輸入法組合成一種新的輸入法,與其他輸入法的兼容性較差。有的形碼采用將漢字五種基本筆畫二二組合的方法,漢字部件少,記憶方便,但卻付出了不夠直觀,將漢字部件拆散了的代價。單字只有二碼的輸入法,就首尾碼這一類輸入法,這類輸入法其實跟拼音輸入法的重碼差不多,但由于漢字部件多,比拼音難記,如能減少漢字部件,可以象拼音輸入法那樣簡單地輸入漢字,優(yōu)點也是明顯的。
【發(fā)明內容】
[0004]這樣,目前的形碼漢字輸入法要么選取漢字部件過多;要么單個漢字的碼長不止二碼,通常有四碼,不夠簡單;要么不能與其他輸入法兼容組合成一種新的輸入法。
[0005]本發(fā)明的目的是提供一種漢字部件數(shù)量少、簡單易學、輸入漢字簡便快捷的計算機漢字編碼輸入方法,那就是單字二碼輸入法。
[0006]為達到單字二碼輸入法的目的,本發(fā)明在對單個漢字編碼時,由兩個代碼組成。本發(fā)明優(yōu)選了五種基本筆畫和28個左右的多筆畫部件參與編碼,這五種基本筆畫和28個左右的多筆畫部件被統(tǒng)稱為基本部件,全部選自漢字的偏旁部首,既簡單常見又直觀,并且數(shù)量少,容易記憶。由于國家語委將五種基本筆畫也稱為漢字部件,因此在本發(fā)明中稱五種基本筆畫稱為單筆畫部件,而其它28個左右的優(yōu)選的漢字部件由多個筆畫組成,稱為多筆畫部件。在編碼時要優(yōu)先按筆畫多的基本部件編碼,否則由于多筆畫部件可拆分成單筆畫部件,若按單筆畫部件編碼的話,選取多筆畫部件就無意義。
[0007]單字的取碼規(guī)則是:若按書寫順序,某個漢字的第一個基本部件為多筆畫部件,而該多筆畫部件且處于整個漢字的正左方或正上方或包圍方時,按書寫順序取該漢字的前二個基本部件的相應代碼編碼;其他漢字則按書寫順序取第一個和最末一個基本部件的相應代碼編碼;只有一個基本部件的漢字就取這個基本部件的相應代碼編碼,或者接連二次取這個基本部件的相應代碼編碼。這一編碼規(guī)則與正左上方漢字輸入法的編碼兼容,優(yōu)點十分明顯。
[0008]由于第一個基本部件為優(yōu)選的多筆畫部件且處于包圍方的漢字很少,取這類漢字的首、末基本部件的代碼編碼幾乎不會增加重碼,因此也可不考慮這類漢字的取碼規(guī)則,這時編碼的取碼規(guī)則也可規(guī)定為:若按書寫順序某個漢字的第一個基本部件為多筆畫部件,而該多筆畫部件處于整個漢字的正左方或正上方時,按書寫順序取該漢字的前二個基本部件的相應代碼編碼;其他漢字則按書寫順序取第一個和最末一個基本部件的相應代碼編碼;只有一個基本部件的漢字就取這個基本部件的相應代碼編碼。另外編碼的取碼規(guī)則還可規(guī)定為:若某個漢字按書寫順序的第一個基本部件為多筆畫部件,而該多筆畫部件處于整個漢字的正左方時,按書寫順序取該漢字的前二個基本部件的相應代碼編碼;其他漢字則按書寫順序取第一個和最末一個基本部件的相應代碼編碼;只有一個基本部件的漢字就取這個基本部件的相應代碼編碼。此外編碼規(guī)則還可規(guī)定為:若按書寫順序某個漢字的第一個基本部件為多筆畫部件,則按書寫順序取該漢字的前二個基本部件的相應代碼編碼;其他漢字則按書寫順序取第一個和最末一個基本部件的相應代碼編碼;只有一個基本部件的漢字就取這個基本部件的相應代碼編碼。當然,對于只有一個基本部件的漢字,編碼的取碼規(guī)則也可規(guī)定接連取二次該基本部件的相應代碼編碼。這一編碼規(guī)則比其他任何編碼規(guī)則簡單,因此在編碼實例中就采用這一編碼規(guī)則。所說的漢字的正左方是指處于整個漢字的左方,而不是整個漢字的左上方或左下方。所說的漢字的正上方是指處于整個漢字的上方,而不是整個漢字的左上方或右上方。所說的漢字的包圍方是指處于整個漢字的包圍方,而不是漢字中某個部件的包圍方。另外還要指出的是取基本部件編碼時要遵循取大優(yōu)先的原則,即要優(yōu)先取筆畫多的基本部件編碼。
[0009]下面再解說優(yōu)選基本部件的方法。在國標6763個漢字中,合體字占了絕大多數(shù),約為95%。為減少重碼,以及與正左上方漢字輸入法兼容、*、口、木、子、韋、4、女、1、個、月、蟲、土、鄉(xiāng)、火、廣、、、山、石、日U、魚、禾、貝等這些偏旁被選了出來,分別用一個字母或別的符號編碼,當然個別偏旁也可棄而不選。部件、鳥慣常出現(xiàn)在漢字的字尾,也被優(yōu)選出來,分別用一個字母或別的符號編碼。
[0010]為便于記憶,在單字二碼輸入法中排列多筆畫部件時不按筆畫數(shù)和橫、豎、撇、點、折的次序排列,而按拼音或象形排列,見附圖1或附圖2所示。附圖1以按基本部件的拼音字母排列為主,對少數(shù)幾個拼音首字母或聲母相同的基本部件改按象形的方式排列。這樣由于按基本部件的讀音編碼幾乎無需記憶,少數(shù)幾個改按象形的方式排列的基本部件也能很快記住,記憶量很小,因此極為簡單。附圖2完全按象形排列,可漢字的方塊筆畫部件與西文字母畢竟有所區(qū)別,難以做到十分相像,需要按象形記憶的漢字基本部件就要多上幾倍,記憶量也相應多上幾倍,因此本發(fā)明也不太建議用這種方式排列經過反復優(yōu)選的基本部件。當然有人可能更喜歡這種排列方式。二種編碼的取碼規(guī)則均可采用附圖1或附圖2編碼。
[0011]橫、豎、撇、點、折等基本筆畫在編碼中出現(xiàn)的頻率較高,為輸入標點方便,不將多筆畫部件和單筆畫部件排在標點符號鍵上,將這五個基本筆畫按拼音首字母,分別用H、S、P、D、Z編碼,不再用標點符號編碼。[0012]這樣,通過優(yōu)選27個左右的多筆畫部件和五種基本筆畫,創(chuàng)造性地規(guī)定取碼規(guī)貝U,就做到了編碼規(guī)則簡單,碼長短,輸入速度足以與拼音輸入法相比??胺Q標準的漢字形碼輸入法。
【專利附圖】
【附圖說明】
[0013]附圖1為編碼鍵盤排列圖之一
[0014]附圖2為編碼鍵盤排列圖之二
【具體實施方式】
[0015]形碼輸入法取碼規(guī)則是:若按書寫順序某個漢字的第一個基本部件為多筆畫部件,且該多筆畫部件處于整個漢字的正左方或正上方或包圍方時,則按書寫順序取該漢字的前二個基本部 件的相應代碼編碼;其他的漢字按書寫順序其第一個和最末一個基本部件的相應代碼編碼,這里所說的其他的漢字意思很清楚,一類是指按書寫順序第一個基本部件不是多筆畫部件的漢字,另一類是指雖然按書寫順序第一個基本部件為多筆畫部件但該多筆畫部件不處于整個漢字的正左方或正上方或包圍方的漢字;當某個漢字只有一個基本部件時可規(guī)定只取這個基本部件的相應代碼編碼。所說的正左方是指處于整個漢字的左方,而不是整個漢字的左上方或左下方。所說的正上方是指處于整個漢字的上方,而不是整個漢字的左上方或右上方。所說的包圍方是指處于整個漢字的包圍方,而不在整個漢字的被包圍方。例如“?!弊?,多筆畫部件“彳”處于“保”字的正左方,因此按書寫順序取“保”字的前二個基本部件“彳”和“ 口 ”的相應代碼編碼,而“煲”字,按書寫順序第一個基本部件為多筆畫部件“彳”,處于“煲”字的左上方,而不在正左方,則編碼按書寫順序取“煲”字第一個基本部件“彳”和最末一個基本部件“火”的相應代碼編碼。
[0016]為簡化編碼規(guī)則,在編碼實例中規(guī)定:若按書寫順序某個漢字的第一個基本部件為多筆畫部件,則按書寫順序取該漢字的前二個基本部件的相應代碼編碼;其他漢字則按書寫順序取第一個和最末一個基本部件的相應代碼編碼;只有一個基本部件的漢字就取這個基本部件的相應代碼編碼。當然,對于只有一個基本部件的漢字,編碼的取碼規(guī)則或者規(guī)定接連取二次該基本部件的相應代碼編碼。
[0017]為便于記憶,排列時主要以多筆畫部件的讀音的拼音首字母或聲母為代碼。為避免重碼,還將若干聲母相同的部件取了出來,改按象形或韻母的方式編碼。排列單筆畫部件時,五種基本筆畫按拼音首字母編碼。多筆畫部件和五種基本筆畫在鍵盤上的優(yōu)選排列見附圖1所示。多筆畫部件、五種基本筆畫與字母、標點符號的影射關系設定為:
[0018]a-韋 b-廣 1_ c-廿 d-?點
[0019]e——禾 f——孑 g——貝鳥h——火橫
[0020]1-蟲 j-纟 k-口 1-魚
[0021]m-木 η-女 ο-月 ρ-15 撇
[0022]q-日 r-\s-石豎 t-土
[0023]u-山 V--w-王 X-個
[0024]y——i z—— 折
[0025]根據(jù)設定關系將部件分別用相應的字母和標點符號編碼。[0026]下面作具體解說:a的大寫六與韋相似;b是廣的聲母;(:是*的聲母;d是?、點的聲母;e是禾的韻母;f似子;g形似貝、鳥;h是火、橫的聲母;i因為ch排在其上,而ch是蟲的聲母;j是鄉(xiāng)的聲母;k是口的聲母;L似魚的左上角;m是木的聲母;n是女的聲母;0似月亮的外形;P似卩,為撇的聲母首字母;Q似日,就作為日代碼;r是彳的聲母;s是石、豎的拼音首字母;t是土的聲母;u因為sh排在u上,而sh是山的聲母;v因為zh排在u上,而zh是的聲母;w是王的聲母;X是丨的聲母;Y是i的聲母;2是和折的聲母;這些字母就分別作為相應的基本部件的代碼。這種排列方式基本上是按表音排列的,往往將基本部件按其拼音首字母或聲母排列,對拼音首字母相同的少數(shù)多筆畫部件,改按象形或韻母排列。
[0027]當然也可以按漢字部件與英文的相似程度排列,即根據(jù)象形排列。一種優(yōu)選的排列見附圖2。這時選用了多筆畫部件~參與編碼,舍棄了多筆畫部件“鳥”。27個多筆畫部件、五種基本筆畫與字母、標點符號的影射關系設定為:
【權利要求】
1.一種計算機漢字編碼鍵盤輸入法即單字二碼輸入法,將漢字的各種筆畫按國家語委的規(guī)定歸類為橫、豎、撇、點、折五種基本筆畫后,其特征是: (1)、取碼規(guī)則是:若按書寫順序某個漢字的第一個基本部件為多筆畫部件,而該多筆畫部件且處于整個漢字的正左方或正上方或包圍方時,按書寫順序取該漢字的前二個基本部件的相應代碼編碼;其他漢字則按書寫順序取第一個和最末一個基本部件的相應代碼編碼;只有一個基本部件的漢字就取這個基本部件的相應代碼編碼; (2)取碼規(guī)則或者規(guī)定為:若按書寫順序,某個漢字的第一個基本部件為多筆畫部件,則按書寫順序取該漢字的前二個基本部件的相應代碼編碼;其他漢字則按書寫順序取第一個和最末一個基本部件的相應代碼編碼;這就是說,若某個漢字的第一個基本部件為單筆畫部件,只有一個基本部件的漢字就取這個基本部件的相應代碼編碼; (3)、采用第一、二種形部編碼取碼規(guī)則時,優(yōu)選五種基本筆畫和27個左右的多筆畫部件參與編碼,27個左右的多筆畫部件、五種基本筆畫與字母、標點符號的一種影射關系設定為:
2.根據(jù)權利要求1所述的字首部件拼音輸入法,其特征是:詞語輸入的步驟是:二字詞的編碼由詞組所含的兩個漢字各取前兩個碼組成;三字詞的編碼是由前兩個漢字的第一碼和后一個漢字的前兩個碼構成;四字及以上多字詞的編碼按"一、二、三、末"的規(guī)則,即分別取第一、第二、第三及最末一個漢字的第一個碼來構成的編碼。
【文檔編號】G06F3/023GK103838390SQ201210530307
【公開日】2014年6月4日 申請日期:2012年11月26日 優(yōu)先權日:2012年11月26日
【發(fā)明者】王治陽 申請人:王治陽