專利名稱:一種計算機結(jié)構(gòu)聲讀漢字輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種計算機的輸入方法,是一種漢字的計算機輸入方法。
在現(xiàn)有的計算機漢字輸入方法中,百家爭鳴,紛繁復(fù)雜,可分為五類,(1)分類序號類(如區(qū)位碼),(2)拼音類(如全拼、雙拼等),(3)筆畫類(如筆順碼),(4)字根部件類(如五筆字型及聲聲輸入法等),(5)想像歸屬類(字元碼)。分類序號類無重碼但無法記憶,拼音筆劃類易學(xué),但碼位長,字根部件類重碼較少,但難學(xué)難記又易忘,如聲聲輸入法中的諸多部件為常人所不知,既非漢字又非常用,卻要記憶并聲讀,增加了許多漢字文化以外的多余的額外負擔;想象歸屬類易產(chǎn)生想象偏差等。這些輸入方法都不符合漢字本身的文化、不符合漢字的教學(xué)和識字的習(xí)慣。偏離了漢字文化自身的規(guī)律和內(nèi)容的重心,故而顯現(xiàn)出以上方法的不足。
本發(fā)明的目的是提供一種與識字教育相互支持,對應(yīng)于漢字內(nèi)部規(guī)律和漢字文化的易學(xué)、易記、易用、通俗化和大眾化,特別是重碼率極低,輸入便捷的計算機漢字輸入方法。
本發(fā)明的方法是一種計算機結(jié)構(gòu)聲讀漢字的輸入方法,它包括按書寫筆劃順序,連續(xù)筆劃形成方塊漢字等整體,以其最大整體的原則聲讀并取讀音第一字母等作為對應(yīng)碼位的聲讀碼。聲讀碼可以選用四位碼、也可以采用五位碼,或多位碼的形式進行漢字輸入。
它還包括所述的最大整體是漢字整體、偏旁整體及筆劃整體,漢字筆劃是輔助性地聲讀對象,具體定義如下1>、成字整體(即漢字整體)的范疇定義在國標一級、二級漢字的范圍。
以示例一欄中所列“搞”字作一說明,左偏旁部件為提示,部件碼為6,非同構(gòu)部件前兩筆中第一筆“丶”編碼為4,第二筆“一”編碼為1,最后兩筆中倒數(shù)第二筆“乛”編碼為5,最后一筆“一”編碼為1,故為64151。
(6)對于高頻字的特殊處理眾所周知,漢字中有不少高頻字,如的、經(jīng)、我、是等等,按上述規(guī)則,這些高頻字的編碼長度多數(shù)為5,為進一步提高錄入速度,就對這些常常出現(xiàn)的高頻字作了一些特殊處理,我們引入了一級、二級、三級簡碼的概念,所謂一級簡碼就是只需擊一個數(shù)字鍵和空格鍵就可輸入的,我們稱為一級簡碼(漢字),同理,只需擊兩個數(shù)字鍵和空格鍵就可輸入的,我們稱為二極簡碼(漢字),依此類推。為便于敘述,我們把高頻字原來的編碼稱為原碼,如“是”的原碼是25134,而它的簡碼是2,換句話說,用同構(gòu)輸入法錄入時,鍵入2和25134都可以輸入“是”字,因此不難看出用簡碼錄入,可以大大提高錄入速度。
表5、表6和表7分別給出了一級、二級和三級簡碼,其中,一<p>它還包括在對首位外的后幾位聲讀碼進行編制時,每一位的確定聲讀整體均有一個嚴格的優(yōu)先順序,一般為首先,聲讀成字最大整體;其次,聲讀成偏旁最大整體;最后,聲讀對應(yīng)筆劃。
它還包括除聲讀碼外還另有全碼或次全碼;1>、次全碼對漢字結(jié)構(gòu)中按以上編碼方法,整體讀盡,形成該字的次全碼;2>、全碼對聲讀碼、次全碼中各位聲讀碼對應(yīng)整體進行聲讀,各自形成四位碼,并按聲讀碼中對應(yīng)位置順次排列,形成全碼。
它還包括雙字詞和各類多字詞的輸入編碼,并用以下符號表示1>I,II,III,......表示多字詞中第一字,第二字,第三字,.....;2>1,2,3,......作為角標,表示讀位字的第一位,第二位,第三位,......聲讀碼;如“II2”表示詞中第二字的第二位結(jié)構(gòu)聲讀碼;于是雙字詞的編碼I1II2II2II3一級簡碼I1II1二級簡碼I1II1I2II2三字詞的編碼I1II1III1II2III2簡碼I1II1III1四字詞的編碼I1II1III1IV1IV2簡碼I1II1III1IV1五字詞的編碼I1II1III1IV1V1六字詞及六字以上詞的編碼I1II1III1IV1V1VI1。
它還包括碼位通配符“]”右方括號,用作查詢和替代未知部分的聲讀碼。
它還包括字數(shù)的識別位,設(shè)在編碼的第六位上,以數(shù)字表示。聲讀字或詞、或者手敲鍵盤入字詞的一級簡碼后,按空格鍵由程序完成該位數(shù)字的編制和輸入,六字及更多字詞則無有此數(shù)字識別位。
它還包括“聲讀加鍵盤輸入法”,聲讀句子中的字或詞;即實現(xiàn)一級簡碼或字數(shù)識別位的編制和輸入,所需剩余碼位由手敲鍵盤輸入,最終完成字、詞和句子的漢字輸入。
本發(fā)明的方法是以漢字對應(yīng)漢字編碼的方法,易學(xué)、易記、易用,實現(xiàn)了大眾化和通俗化,能夠與漢字文化、漢字教學(xué)相結(jié)合,在漢字教育中邊識字邊可在計算機上學(xué)習(xí)漢字輸入。重碼率極低,四位聲讀碼重碼率為17%,大多數(shù)為兩字相重碼;五位聲讀碼重碼率僅為5%,僅有一百多個二級漢字涉及從兩字中選擇的問題,它大大地提高了漢字的計算機輸入速度,是計算機在中國普及應(yīng)用較好的輸入方法之一。在該方法及理論下的次全碼和全碼,則更能反映出漢字本質(zhì)和全貌。其中全碼能在絕對意義上消滅了重碼,其編碼猶如錄音帶一樣詳細全面地反映出漢字筆劃在該漢字中所能形成的各種信息,這對漢字的研究也將起到積極的作用。
以下結(jié)合實施例詳細說明本發(fā)明的方法本發(fā)明一種計算機結(jié)構(gòu)聲讀漢字的輸入方法,在使用方法時,可以采用四位聲讀碼編碼輸入,也可以采用五位聲讀碼編碼輸入。
1、四位碼讀碼的編制方法四位聲讀碼依次對漢字的組成整體(最大整體)進行聲讀,取其讀音的第一位字母作為聲讀碼,最后形成四位有序的英文字母(亦即拼音字母),其組合具體如下1>、第一位碼即為該漢字讀音第一字母。
對于字庫中無讀音的整體第一位碼規(guī)定為“V”如二丶,一,一。VDHH(5779區(qū)位碼)2>、第二位碼有一個嚴格的優(yōu)先順序,即首先,按書寫順序,第一最大成字整體讀音的第一字母,此整體相對獨立,與其它部分無穿插。
其次,按書寫順序,第一最大偏旁整體讀音的第一字母,此整體相對獨立,與其它部分無穿插。
最后,按書寫順序,第一筆劃讀音第一字母。
3>、第三位碼也有一個嚴格的優(yōu)先順序,即首先,按書寫順序,其余部分中第一最大成字整體讀音的第一字母,此整體與其它部分相對獨立,無穿插。
其次,按書寫順序,其余部分中第一最大偏旁整體讀音的第一字母,此整體與其它部分相對獨立,無穿插。
最后,按書寫順序,其余部分中第一筆劃讀音第一字母。
4>、第四位碼也有一個嚴格的優(yōu)先順序,即首先,按書寫順序,其余部分(前面聲讀整體以外的部分)第一最大成字整體讀音的第一字母,與其它部分相對獨立,無穿插。
其次,按書寫順序,其余部分第一最大偏旁整體讀音的第一個字母與其它部分相對獨立,無穿插。
再次,按書寫順序,最后幾筆最大成字整體處于已取過碼的整體讀音的第一字母,與其它部分相對獨立,無穿插。
最后,按書寫順序,最后一筆讀音的第一個字母。
例最旦,二,又。ZDEY寶玉,宀,丶。BYGD復(fù)白,攵,。FRWN八丿,,。BPNN舊日,丨,二。JRSE湖;沽,月,二。HGYE在編碼時,每一位碼的確定必須遵循以下原則1>、最大整體的原則無論是成字,還是成偏旁部首,都要遵從最大整體的原則,即按漢字書寫筆劃順序,連續(xù)筆劃構(gòu)成的整體必須是最大的。如最旦,二,又。ZDEY,而不能是日,取,又。ZRQY將夕,寸,丬。JXCJ,而不能是夕,寸,冫。JXCD復(fù)白,攵,。FRWN,而不能是日,又,。FRYN2>、所成最大整體要與其它結(jié)構(gòu)部分相對獨立,無穿插,所謂穿插,即為穿過,穿透,插入通過之意,所謂相對獨立,指最大整體成塊成團,獨立可分空間范圍下交叉(重疊是可以的)。
例天大,一,。TDHN,而不是二,人,。TERN奧米,大,冂。AMDK,而不是類,冂,大。ALKD3>、錯位兩部分不能視為單元整體例格本,各,口。GMEK,而不是木,口,一。GMKH葫胡,艸,日。HUCR,而不是苦,月,二。HKYE4>、成字整體的聲碼與該字的第一位碼不相重復(fù),具體為發(fā)生重復(fù)的開頭字母為“JI、QI、XI、ZI、CH、SH”時,取第三位拼音字母作為該位聲讀碼,其余情況發(fā)生重復(fù)時,只取第二位拼音字母作為該位聲讀碼。
例消肖,氵,月。XADY,而不是XXDY腫月,中,丨。ZYOS,而不是ZYZS而對于A、O、E開頭拼音的成字整體不考慮此原則。
例噢口,奧,大。AKAD2、五位聲讀碼的編制方法即在四位聲讀碼的基礎(chǔ)上再追加編制第五位聲讀碼。具體規(guī)則如下它是一個嚴格的優(yōu)先順序,適用于各種漢字的不同情形。
首先,前第一聲讀整體中第一成字最大整體聲讀并編碼,與第四位碼的聲讀整體不能重復(fù)。
其次,前第二聲讀整體中第一成字最大整體聲讀并編碼,與第四位碼的聲讀整體不能重復(fù)。
再次,對前第一聲讀整體中第一最大偏旁整體聲讀并編碼。
最后,對前第二聲讀整體中第一最大偏旁整體聲讀并編碼。
當然,當無有以上整體可聲讀時,則原四位聲讀碼即同時為該字五位聲讀碼。
例碼石,馬,一。四位聲讀碼為MSDH石,馬,一,口。五位聲讀碼為MSAHK彎亦,弓,ㄅ。四位聲讀碼為WYGW無聲讀整體,故五位碼也為WYGW本發(fā)明方法規(guī)定的一級簡碼的漢字如下全(Q),我(W),二(E) ,人(R) ,他(T),要(Y),無(U),一(I),偶(O),片(P),安(A),是(S),的(D),非(F),個(G),和(H),及(J),可(K),了(L),在(Z),小(X),次(C),著(V),不(B),你(N),沒(M)。
助字詞為你我他一和二的及了全無偶非要不可 平安在個人次小 是沒著本發(fā)明方法還包括全碼和次全碼。
1>、次全碼對漢字結(jié)構(gòu)中按前邊規(guī)則定出的整體讀盡,形成該字的次全碼。如例璺二,同,二。四位聲讀碼為WETE其余整體玉、冖次全碼為WETEYG2>、全碼對聲讀碼,次全碼中各位聲讀碼對應(yīng)整體進行聲讀;各自形成四位碼聲讀碼,并按原聲讀碼中對應(yīng)位置順次排列。
例鮑魚,包,己。BYAS魚田ク,一。YTDH包己,ㄅ,。ASBW
己,一,。SZHW全碼為BYTDH ASBW SZHW打點的為原聲讀碼。
本發(fā)明方法,還包括雙字詞、各類多字詞及習(xí)慣用語的編碼輸入,以符號說明如下aI、II、III...表示多字詞的第一字、第二字、第三字...;b1、2、3...作下角標,表示該位字第一位,第二位,第三位等的結(jié)構(gòu)讀聲碼。(如II2表示詞中第二字的第二位結(jié)構(gòu)聲讀碼);1、雙字詞的編碼I1II1I2II2II3,五位碼;一級簡碼I1II2二級簡碼I1II1I2II2例我們我WPHD 們MERW雙字詞編碼為WMPEW一級簡碼WM二級簡碼WMPE2、三字詞的編碼I1II1III3II2III2,五位碼;簡碼I1II1III1例計算機計JSYS 算SMEN 機JMIW三字詞的編碼為JSJMM簡碼JSJ3、四字詞的編碼為I1II1III1IV1IV2 簡碼I1II1III1IV1例社會主義義YDPN四字詞編碼為SHZYD 簡碼SHZY4、五字詞的編碼I1II1III1IV1V1例吐魯番盆地編碼為TLFPD中華人民共和國編碼為ZHRMGH5、六字及六詞以上字詞的編碼I1II1III1IV1V1VI1例中華人民共和國編碼為ZHRMGH在字詞輸入中還包括字數(shù)數(shù)字識別位,在編碼的第六位,以數(shù)字表示出字數(shù)。聲讀字、詞或手敲鍵盤輸入字或詞的一級簡碼后,按空格鍵,由程序完成該位數(shù)字的編制和輸入,六字及六字以上多字詞則無有此數(shù)字識別位。
例“我們”先輸入“WM”,一級簡碼,按空格鍵,電腦在輸入字的顯示位置的第三位處顯示“2”,“WM---2”。
例“鍵”,先輸入“J”,一級簡碼,按空格鍵,電腦在輸入位置的第六處顯示“1”,即“J---1”。
本發(fā)明的方法中還包括有碼位通配符“]”右方括號鍵,用來查詢和代替未知部分的聲讀碼,管理程序會將只有該位碼不同的所有存在漢字輸出,讓操作者尋找選用并學(xué)習(xí)編碼。
本發(fā)明方法還包括鍵盤輸入方法以外的一種全新輸入方法“聲讀加鍵盤輸入法”,具體為用口發(fā)音讀句子中的字或詞,借助于讀音識別系統(tǒng),即實現(xiàn)一級簡碼和字數(shù)識別位的編制和輸入,所需剩余碼位字母由鍵盤輸入,最終完成字詞的輸入。
例1詞組“經(jīng)濟界”的輸入,語音聲讀“經(jīng)濟界”由語音識別系統(tǒng)識別輸入“JJ J--3”,手敲操作鍵盤,輸入“QJ”兩位編碼,即顯示為“JJJQJ3”于是“經(jīng)濟界”一詞在計算機屏幕上顯示,再敲空格鍵完成該詞的輸入。
例2單字“晚”的輸入,語音聲讀‘晚”(Wan)由語音識別系統(tǒng)識別輸入“W----1”手敲鍵盤,輸入“RMW”(五位聲讀碼輸入時,要輸入“RMWE”),顯示為“WRMW-1”(五位碼輸入時“WRMWE”)于是該字在計算機屏幕上顯示,再按空格鍵實現(xiàn)輸入。
該方法可使單一鍵盤輸入法中的工作量下降至30%,由語音聲讀原文自然不覺地完成漢字輸入,它是編碼輸入的新概念,大大提高了速度,減輕了腦手等的疲勞程度。
權(quán)利要求
1.一種計算機結(jié)構(gòu)聲讀漢字輸入方法,其特征在于它包括按書寫筆劃順序連續(xù)筆劃形成方塊漢字整體,以其最大整體的原則,聲讀并取讀音第一字母等作為對應(yīng)碼位的聲讀碼,聲讀碼可以以四位碼或者五位碼,或者至少一位碼的形式進行漢字輸入。
2.根據(jù)權(quán)利要求1所述的一種計算機結(jié)構(gòu)聲讀漢字輸入方法,其特征在于所述的最大整體主要為漢字整體的偏旁整體或漢字筆劃,以其為聲讀對象,具體定義如下1>、成字整體(即漢字整體)的范疇可定義在國標一級、二級漢字的范圍內(nèi);2>、偏旁整體內(nèi)容為常見熟知偏旁,此以下內(nèi)容以外的偏旁部首編碼時不以偏旁整體論,(括號內(nèi)的字為其讀音漢字)讠(言) 衤(衣) 尢(尤) 艸(草)(春) 亻(人)廴(建) 辶(建) 钅(金)(卷) 丬(將) 爿(將)卩(耳) 阝(耳) 冖(蓋) 宀(蓋) 穴(蓋)(蓋)巛(拐) 巜(拐) 凵(匡) 冂(匡)(虎) 攵(文)攵(文) 犭(犬) 饣(食) 纟(絲) 礻(示) 四(四)扌(手)
(足) (竹) 彡(撇) 疒(病) ㄅ(包)廾(弄)(登)(登) 勹(刀) 刂(刀) 冫(點)氵(點) 灬(點)忄(心)3>、漢字筆劃聲讀讀音定義如下(括號內(nèi)為其讀音)(1)、單一筆劃丶(點) 一(橫) 丨(豎) 丿(撇) (捺) 亅(鉤)乛(鉤)
(提)(2)單折的筆劃∠(折) フ(折) (折)
(折)(3)彎形或兩折以上的筆劃
(彎)(彎)弓(彎)ㄋ(彎)(彎)ㄅ(彎)
(彎)ㄣ(彎)
3.根據(jù)權(quán)利要求1所述的一種計算機結(jié)構(gòu)聲讀漢字輸入方法,其特征在于它包括所述最大整體的確定要遵循“最大整體的原則”,“相對獨立無穿插的原則”及“錯位兩部分不為單元整體的原則”。
4.根據(jù)權(quán)利要求1所述的一種計算機結(jié)構(gòu)聲讀漢字輸入方法,其特征在于它還包括以聲讀碼拼音第一字母等進行編碼時要遵循“成字整體的聲讀碼與該字第一位碼不相重復(fù)的原則”,在重復(fù)時,以“JI、QI、XI、ZH、CH、SH”開頭的讀音,取第三位拼音字母作為該位聲讀碼,則否,在重復(fù)時,取第二位讀音作為該位聲讀碼;以A、O、E字母開頭的讀音不考慮重復(fù)。對于一級、二級字庫中即不為漢字,又不為規(guī)定偏旁的整體,其第一位聲讀碼為“V”打頭。
5.根據(jù)權(quán)利要求1所述的一種計算機結(jié)構(gòu)聲讀漢字輸入方法,其特征在于它還包括在對首位外的后幾位聲讀碼進行編制時,每一位的確定聲讀整體均有一個嚴格的優(yōu)先順序,一般為首先,聲讀成字最大整體;其次,聲讀成偏旁最大整體;最后,聲讀對應(yīng)筆劃。
6.根據(jù)權(quán)利要求1所述的一種計算機結(jié)構(gòu)聲讀漢字輸入方法,其特征在于它還包括除聲讀碼外還另有全碼或次全碼;1>、次全碼對漢字結(jié)構(gòu)中按權(quán)利要求1-5所述的聲讀碼編碼方法,整體讀盡,形成該字的次全碼;2>、全碼對聲讀碼、次全碼中各位聲讀碼對應(yīng)整體進行聲讀,各自形成四位碼,并按聲讀碼中對應(yīng)位置順次排列,形成全碼。
7.根據(jù)權(quán)利要求1所述的結(jié)構(gòu)聲讀漢字輸入方法,其特征在于它還包括雙字詞及各類多字詞的輸入編碼,并用以下符號表示1>I,II,III,......表示多字詞中第一字,第二字,第三字,......;2>1,2,3,......作為角標,表示讀位字的第一位,第二位,第三位,......聲讀碼;如“II2”表示詞中第二字的第二位結(jié)構(gòu)聲讀碼;雙字詞的編碼I1II2II2II3一級簡碼I1II1二級簡碼I1II1I2II2三字詞的編碼I1II1III1II2III2簡碼I1II1III1四字詞的編碼I1II1III1IV1IV2簡碼I1II1III1IV1五字詞的編碼I1II1III1IV1V1六字詞及六字以上詞的編碼I1II1III1IV1V1VI1。
8.根據(jù)權(quán)利要求2或3或4或5或7所述的一種計算機結(jié)構(gòu)聲讀漢字輸入方法,其特征在于它還包括碼位通配符“]”右方括號,用作查詢和替代未知部分的聲讀碼。
9.根據(jù)權(quán)利要求2或3或4或5或7所述的一種計算機結(jié)構(gòu)聲讀漢字輸入方法,其特征在于它還包括字數(shù)的識別位,并在編碼的第六位上以數(shù)字表示,聲讀字或詞、或者手敲鍵盤輸入字詞的一級簡碼后,按空格鍵由計算機程序完成該位數(shù)字的編制和輸入,六字及更多字詞則無有此數(shù)字識別位。
10.根據(jù)權(quán)利要求1所述的結(jié)構(gòu)聲讀漢字輸入法,其特征在于它還包括“聲讀加鍵盤輸入法”,聲讀句子中的字或詞;即實現(xiàn)一級簡碼或字數(shù)識別位的編制和輸入,所需剩余碼位由手敲鍵盤輸入,最終完成字、詞、句子的漢字輸入。
全文摘要
本發(fā)明涉及一種計算機輸入方法,是一種結(jié)構(gòu)聲讀漢字輸入方法,從漢字連續(xù)筆劃在漢字中所形成的最大整體的角度出發(fā),是一種以方塊漢字對方塊漢字編碼的方法。該方法以四位聲讀碼輸入,重碼率17%左右,幾乎全為兩字相重碼;以五位聲讀碼輸入,重碼率僅為5%左右,僅有一百多個漢字涉及從兩字中選擇的問題。它易學(xué)、易記、易用,實現(xiàn)了大眾化和通俗化,能識字教育相互支持,是漢字文化下最好的輸入方法之一。
文檔編號G06F3/023GK1270343SQ9910555
公開日2000年10月18日 申請日期1999年4月12日 優(yōu)先權(quán)日1999年4月12日
發(fā)明者馬云海 申請人:馬云海