專利名稱:手機數(shù)碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于電腦漢字編碼輸入方法,也就是中文輸入法。因為不但可在電腦數(shù)字鍵上使用,而且特別適宜移植到手機上使用,所以稱為手機數(shù)碼。它包含手機數(shù)碼十部輸入法和手機數(shù)碼七部輸入法兩種輸入法。
背景技術(shù):
利用數(shù)字鍵編碼由來已久,電報碼、區(qū)位碼就屬于數(shù)字編碼,具有四位數(shù)字等長,無重碼,輸入速度很快等優(yōu)點。但因為其編碼幾乎毫無規(guī)律,能熟記其編碼的人是寥寥無幾的,據(jù)我所知,手機上還沒安裝這種輸入法。四角號碼也是數(shù)字編碼,但它不合筆順規(guī)律,還有些重碼,效率較低,手機上也沒安裝這種輸入法。另外一些按四角編碼的輸入法,雖作了很大改進,重碼大為降低,可因為與人們最習慣的書寫順序不符合,并且包含的同類部件太多,所以注定不大會有人使用。將漢字的各種筆畫歸類為幾種筆畫,用幾個數(shù)字編碼,并逐筆輸入的輸入法,因為象寫字一樣簡單,所以在手機上廣泛應用??芍鸸P輸入碼長較長,不利于提高輸入速度。為此作了智能化改進,每輸入一筆就出現(xiàn)最有可能的幾個字或偏旁供挑選,這樣許多字不必逐筆輸完就出現(xiàn)在屏上,明顯提高輸入速度,成為手機市場上主流的輸入法,可少數(shù)漢字仍要擊鍵七、八下甚至更多,選字麻煩,輸入速度不快。著名的T9輸入法好象就屬于這類輸入法。于是有人做出改進,將合體字一分為二或一分為三,再選取筆畫和部件進行編碼。這類輸入法的典型代表是五筆數(shù)碼,誠如其宣稱的那樣,既簡單又快速,一般人十幾分鐘可學會,輸入速度約為西文的二倍??蛇@類輸入法有個重大缺點,那就是部件選取不當,以五筆數(shù)碼為例,它的六鍵輸入法只在五類基本筆畫的基礎(chǔ)上增加一個“口”部件,它的九鍵輸入法卻令人吃驚地選用了“王”“幺”“心”等組字頻率底的漢字部件。另外讓人感到麻煩的是五筆數(shù)碼犯了一個與四角號碼同樣的錯誤,那就是有的基本部件還包含了幾個其他部件,此舉一來不利于把部件排到數(shù)字鍵上,因為手機上的數(shù)字鍵太小,二來增加了部件數(shù),顯得繁瑣,不利于記憶。市場調(diào)研表明,很多人懶得發(fā)抖,不愿學這種十幾分鐘才能學會的輸入法,只有幾分鐘就能學會的輸入法才有市場。這樣幾分鐘就能學會的輸入法就被推向市場。目前手機市場上在用的一種輸入法是這樣的將五種基本筆畫和幾個漢字部件分別排在數(shù)字鍵上,合體字的漢字,按筆順第一部取二碼,第二部取一碼;獨體字的漢字按筆順取二碼,對漢字作過深入研究的人都知道,有幾個部首“管轄”二百多個漢字,第二部只取一碼的話,會造成大量的重碼,這種試圖在區(qū)區(qū)幾個數(shù)字鍵上以二、三碼輸入七千個漢字的做法必定付出重碼高的代價。針對這種情況,本人發(fā)明了五筆八部輸入法,該輸入法有個特點,那就是合體字的第二部分取按筆順取首尾兩碼,可后來我做了進一步研究,感到為便于想打,合體字的第一、二部分都必須完全按書寫順序取碼,不能出現(xiàn)“跳筆”現(xiàn)象,即不能出現(xiàn)跳過幾個筆畫而取字尾的部件進行編碼的情況。盡管這樣可能會降低重碼,但與日常書寫習慣不符,不利于想打。
發(fā)明內(nèi)容
這樣目前漢字的數(shù)字編碼輸入法要么不合筆順規(guī)范,出現(xiàn)跳筆現(xiàn)象;要么部件選取不當,不能幾分鐘學會;要么碼長太短或太長;要么重碼過高,影響輸入速度。都沒能很好解決簡單的不快速,快速的不簡單這一技術(shù)難題,輸入漢字不甚方便。
本發(fā)明的目的是提供一種符合筆順規(guī)范、直觀、簡單易學、輸入漢字方便快捷的電腦漢字輸入法即手機數(shù)碼。它提供了手機數(shù)碼十部輸入法和手機數(shù)碼七部輸入法兩種輸入法,并且每種輸入法都有三套不同的取碼規(guī)則,以適應不同的需要。
為達到手機數(shù)碼的目的,本發(fā)明將漢字分為獨體字和合體字二類。本人在長期的編碼研究中早就認識到一個漢字是否為左右結(jié)構(gòu)是一目了然的,左右結(jié)構(gòu)的漢字很容易在其產(chǎn)生空隙處將它一分為二,而上下、包圍結(jié)構(gòu)的漢字有時不易一分為二,甚至有時難以分清一個字是獨體字還是上下結(jié)構(gòu)或包圍結(jié)構(gòu)。根據(jù)一個漢字是否為左右結(jié)構(gòu)劃分最簡單易學,但這樣不利于降低重碼,實際上對于難以劃分結(jié)構(gòu)的漢字還可以用容錯碼的技術(shù)加以解決,即容許對同一個漢字根據(jù)不同的劃分進行不同編碼,所以還是劃分為獨體字和合體字為好。這樣也與人們的傳統(tǒng)思維一致。需要指出的是將合體字一分為二,分成二個部分別進行編碼的技術(shù)由來已久,二筆輸入法和五筆數(shù)碼等輸入法都屬于這類輸入法,并非我獨創(chuàng)。
合體字根據(jù)整體結(jié)構(gòu)在最初的分界線處將其一分為二,先寫的第一部,后寫的為第二部,對左中右結(jié)構(gòu)的漢字將其中間部分、右邊部分劃為第二部。對上中下結(jié)構(gòu)的漢字將其中間部分、下面部分劃為第二部。當然也可根據(jù)成字優(yōu)先的原則將中間部分劃分到第一部。也可無條件地規(guī)定將中間部分劃分到第一部。另外對包圍部分按筆順要分開書寫的漢字如“或”、“載”等字,按該漢字第一筆的先后,規(guī)定含有第一筆的部分為第一部,不含第一筆的部分為第二部。由于包圍部分的第一筆往往先寫,這條規(guī)定實際上是規(guī)定包圍部分為第一部、被包圍部分為第二部。當然也可將該類漢字歸類到獨體字中,按獨體字編碼。另外鑲嵌型的漢字如“乘”等字也可按獨體字編碼。
又將漢字的各種筆畫按國家語委的規(guī)定歸類為橫、豎、撇、點、折五種基本筆畫,分別用五個互不相同的數(shù)字比如1、2、3、4、5編碼。為降低重碼,還優(yōu)選組字頻率或?qū)嵱妙l率高的幾個筆畫結(jié)構(gòu)即國家語委規(guī)定的漢字部件排到鍵上,參與編碼。本人在發(fā)明雙優(yōu)碼中曾將雙筆畫參與編碼,可后來經(jīng)過實用操作,發(fā)現(xiàn)利用雙筆畫參與編碼不利于頭腦反應,所以只好舍棄雙筆畫了。漢字部件在選取時數(shù)量要少,且要有利于降低重碼,另外漢字部件最好是本身就是偏旁或漢字,以便于記憶。這樣漢字部件“口”、“艸”、“扌”、“氵”、“木”、“十”、“八”以及“日”、“亠”、“冂”就被優(yōu)選出來排到鍵上,“十”可規(guī)定含“乂”,都為正叉。“冂”可規(guī)定含“冖”,都為下框。“八”可用“人”代替,也可規(guī)定“八”含“人”,或含“丷”。當規(guī)定漢字的碼長為四碼時,為降低重碼,最好選用“日”、“亠”、“冂”等漢字部件編碼。當規(guī)定漢字的碼長為五碼,特別是規(guī)定漢字的碼長為六碼時,不選用“日”、“亠”、“冂”等漢字部件編碼也能很好降低重碼,從易學角度講,還是不選用這幾個漢字部件編碼為好。這就是兩套輸入法的來歷。
本發(fā)明提供了手機數(shù)碼十部輸入法和手機數(shù)碼七部輸入法兩種輸入法。手機數(shù)碼有三套單字和詞組取碼規(guī)則,可任選一套取碼規(guī)則。這三套單字和詞組取碼規(guī)則適用于手機數(shù)碼十部輸入法,也適用于手機數(shù)碼七部輸入法。即手機數(shù)碼十部輸入法和手機數(shù)碼七部輸入法這兩種輸入法的取碼規(guī)則實際上是相同的,不同之處是所精選的漢字部件不同。這也是本發(fā)明將兩種輸入法合并為手機數(shù)碼的原因。
第一套單字取碼規(guī)則是規(guī)定漢字的碼長最多為四碼時的取碼規(guī)則合體字的第一部按筆順取前二個部件編碼,第二部按筆順取前二個部件編碼,當?shù)谝徊恐挥幸粋€部件,只能取一碼時,第二部可按筆順取前三個部件編碼,當?shù)诙克胁考蝗⊥?,漢字的總碼長仍不足四碼時,編碼結(jié)束,不再編碼;獨體字按筆順取前四個部件編碼,當取完該漢字的所有部件,漢字總碼長不足四碼時,編碼結(jié)束,不再編碼。注意某個部件已取碼后不可重復取碼,這一規(guī)則也適用于第二、三套取碼方案。
這時相應的詞組輸入規(guī)則是二字詞各取每個字完整編碼的前二碼;三字詞規(guī)定取第一、二個字的前一碼,第三個字的前二碼;當然也可規(guī)定三字詞取第一個字的前二碼,第二、三個字的前一碼;四字及以上詞,各取前三個字和最末個字的前一碼。當某個字只能取一碼而不能取二碼時,就取一碼。當詞組編碼時某個字取不足規(guī)定碼長時,一律重復補上該字的尾碼,直到補夠為止。
第一套單字取碼規(guī)則由于規(guī)定碼長為四碼,最多可容納10000個漢字,而常用的漢字有七千個,為避免單字和詞組重碼,因此最好規(guī)定詞組輸入時編碼前加一個特定的鍵比如“*”鍵作為引導符。第二、三套取碼可以不在詞組編碼前加引導符,字詞兼容,當然也可加引導符。
該套取碼規(guī)則適用于手機數(shù)碼十部輸入法,也適用于手機數(shù)碼七部輸入法。不選用第一套單字取碼規(guī)則也可選用第二套單字取碼規(guī)則。
第二套單字取碼規(guī)則是規(guī)定漢字的碼長最多為五碼的取碼規(guī)則合體字的第一部按筆順取前二個部件編碼,第二部按筆順取前三個部件編碼,當?shù)谝徊恐挥幸粋€部件,只能取一碼時,第二部可取前四個部件編碼,當取完第二部所有的部件進行編碼,漢字的總碼長不足五碼時,編碼結(jié)束,不再編碼;獨體字按筆順取前五個部件編碼,當獨體字的所有部件已被取完,該字的總碼長不足五碼時,編碼結(jié)束,不再編碼。
這時相應的詞組輸入規(guī)則是二字詞,第一個字取前二碼。第二個字取前三碼;三字詞,第一、二個字各取前二碼,第三個字取前一碼;四字以上詞,第一、二個字各取前二碼,最末字取前一碼。當詞組編碼時某個字取不足規(guī)定碼長時,一律重復補上該字的尾碼,直到補夠為止。
該套取碼規(guī)則適用于手機數(shù)碼十部輸入法,也適用于手機數(shù)碼七部輸入法。該套取碼規(guī)則適用于手機數(shù)碼十部輸入法,也適用于手機數(shù)碼七部輸入法。不選用第一套或第二套單字取碼規(guī)則也可選用第三套單字取碼規(guī)則。
第三套單字取碼規(guī)則是漢字的碼長最多為六碼時的取碼規(guī)則合體字的漢字,第一部按筆順取前二個部件編碼,第二部按筆順取前四個部件編碼,當?shù)谝徊恐挥幸粋€部件只能取一碼時,第一部就取一碼,第二部可取前五個部件編碼,當?shù)诙堪垂P順取完所有的部件,漢字的總碼長不足六碼時,編碼結(jié)束,不再編碼;獨體字的漢字按筆順取前六個部件編碼,當取完所有部件,編碼不足六碼時,編碼結(jié)束,不再編碼。
第三套取碼規(guī)則的詞組輸入規(guī)則是二字詞,第一字取前二碼,第二字取前四碼;三字詞,每字各取前二碼;四字及以上詞,第一、二和最末詞各取前二碼。當詞組編碼時某個字取不足規(guī)定碼長時,一律重復補上該字的尾碼,直到補夠為止。
該套取碼規(guī)則適用于手機數(shù)碼十部輸入法,也適用于手機數(shù)碼七部輸入法。
每一套單字取碼規(guī)則都要遵循取大優(yōu)先原則,即要優(yōu)先按筆畫數(shù)多的漢字部件編碼,應保證按書寫順序每次拆分出盡可能大的漢字部件,不要把筆畫多的部件拆分成筆畫少的部件。根據(jù)這一規(guī)則可引申出一條規(guī)則那就是多筆畫部件肯定比單筆畫部件即五種基本筆畫優(yōu)先編碼。另外還要兼顧直觀,避免把四邊封閉的方框即“口”型按書寫順序拆開編碼,這條規(guī)則實際上也是取大優(yōu)先原則引申出來的。這樣通過劃分合體字和獨體字,精選部件和取碼規(guī)則就做到了既簡單又快速。利用輸入法軟件,在鍵盤上敲擊某個漢字相應的編碼所在的鍵就可輸入該漢字。
圖1為手機數(shù)碼十部輸入法數(shù)字鍵盤排列圖,圖中一、丨、丿、丶、乙分別代表橫、豎、撇、點、折。
圖2為手機數(shù)碼七部輸入法數(shù)字鍵盤排列圖,圖中一、丨、丿、丶、乙分別代表橫、豎、撇、點、折。
具體實施例方式
下面結(jié)合優(yōu)選的實施例和附圖作詳細說明。
本發(fā)明在編碼時對漢字筆畫的認識完全科學。筆畫是構(gòu)成楷書漢字字形的最小連筆單位,是書寫漢字時一次連續(xù)寫成的一個線條。按國家語委的規(guī)定,在只考慮漢字的運筆方向而不計其輕重長短時,即只考慮其筆形時可分為橫、豎、撇、點、折五種基本筆畫,其中提并入橫,豎鉤并入豎,捺并入點,各種折筆都作折,也就是說其他各種帶轉(zhuǎn)折的筆畫都作折。國家語委稱五種基本筆畫為橫、豎、撇、點、折,而本人傾向于稱橫、豎、撇、捺、折。因為點的筆畫是很短的,不象其它筆畫那樣具有一定的長度,且有時運筆方向下垂,幾乎與撇相同。當然國家語委規(guī)定稱點可能是因為點成字,而且組字頻率高于捺。由于是國家語委的規(guī)定,只好遵守,其實國家語委還可規(guī)定稱捺也允許。漢字都件是由幾個筆畫組成的具有組配漢字功能的構(gòu)字單位漢字部件有多筆畫部件和單筆畫部件之分,單筆畫部件即五種基本筆畫。
接著將漢字分為合體字和獨體字二類,合體字是指具有上下、左右、里外即包圍或鑲嵌結(jié)構(gòu)的漢字,它的二個部分往往具有明顯的界線。獨體字是指不具有上下、左右、里外即包圍或鑲嵌結(jié)構(gòu)的漢字,它的筆畫往往交叉粘連、渾然一體。也可把鑲嵌結(jié)構(gòu)的漢字按獨體字編碼。很容易區(qū)分一個字是否為合體字。有的漢字為左中右結(jié)構(gòu),由于左邊部分往往是部首,因此將中間部分和右邊部分一起劃入第二部。即左中右結(jié)構(gòu)的漢字,除左邊部分為第一部外,其余部分為第二部。比如“撤”的第一部為扌,其余部分為第二部。當然也可對中間部分置之不理,只取右邊部分編碼。在本實施例中一律將中間、右邊部分劃入第二部。
漢字部件的定義與國家語委的規(guī)定相同,它由幾個筆畫構(gòu)成的相對不變的筆畫結(jié)構(gòu),組合后可構(gòu)成漢字。為便于記憶,本發(fā)明規(guī)定橫、豎、撇、點、折五種基本筆畫分別用1、2、3、4、5編碼,漢字部件“木”、“扌”、“氵”、“艸”、“口”分別排到6、7、8、9、0上。記憶方法是十八只木頭手在水草中,“口”和“0”近形。漢字部件“十”、“八”分別排在數(shù)字鍵“7”、“8”鍵上,分別用7、8編碼,也十分便于記憶。漢字部件“十”排在數(shù)字鍵“7”上的話,“7”可看成橫豎接成,而“十”是由橫豎組成,兩者具有共同點,也便于記憶,部件“八”的阿拉伯數(shù)字就是8,排在數(shù)字鍵“8”,用8編碼,容易記憶。,“八”含“人”。
為減少記憶,基本部件盡量不包含其他部件,因為包含一個漢字部件相當于增加0.5個基本部件。所選用的漢字部件組字頻率都極高,選用“扌”是為與“土”作區(qū)分,選用“氵”是為與“忄”、“宀”、“穴”等偏旁作區(qū)分。將“扌”和“十”排在一起,將“氵”和“八”排在一起,都是因為這樣排重碼較少。選用“口”和“木”是因為它組字頻率極高,不僅出現(xiàn)在字首,還出現(xiàn)在漢字的其他各個位置,因此優(yōu)選出來?!翱凇痹谑謾C數(shù)碼中指的是四周封閉的方框,既可成正方形,也可成長方形,而非單純的漢字部件“口”,如“日”可看成方框“口”加一橫組成,取碼時先取漢字部件“口”,再取一橫的編碼?!疤铩薄ⅰ澳俊?、“四”等部件依此類推。在編碼實例中這么規(guī)定。當然也可把“口”看成是偏旁部首“口”,而非方框?!捌H”、“木”、“氵”、“扌”、“口”都屬于必選的漢字部件,必須分別排在其他幾個不同的鍵上,且不能排在五種基本筆畫上。還要指出,當規(guī)定漢字碼長為4碼時,由于碼長較短,且漢字部件“日”、“亠”、“冂”在合體字第二部分的組字頻率高,也應當取出來排在鍵盤上,分別將它們排到數(shù)字鍵2、3、5上,用2、3、5編碼。這么排是充分考慮了這三個漢字部件與基本筆畫的兼容性,有利于降低重碼和便于記憶?!叭铡钡牡谝还P為豎,與豎兼容,“冂”的第二筆為折,與折兼容,“亠”為降低重碼,排在撇上,與撇兼容。其中“冂”含“冖”。當選用漢字部件“日”時,“口”最好看成偏旁“口”,而非方框。其鍵盤排列圖見附圖1。當規(guī)定漢字碼長為五碼或六碼時,選用“日”、“亠”、“冂”等漢字部件編碼在降低重碼方面所起的作用是有限的,而且會增加記憶量,所以可以不再選用“日”、“亠”、“冂”等漢字部件編碼。這樣可構(gòu)成另一種漢字輸入法即手機數(shù)碼七部輸入法,其鍵盤排列圖見附圖2。需要指出的是手機數(shù)碼七部輸入法也可規(guī)定單字的碼長為四碼。
單字的取碼規(guī)則有三套,可任選一套單字取碼規(guī)則編碼。
第一套單字取碼規(guī)則是合體字的第一部按筆順取前二個部件編碼,第二部按筆順取前二個部件編碼,第二部只有一個部件時就取一碼。但當?shù)谝徊恐挥幸粋€部件,只能取一個部件的代碼時,第二部就可按筆順最多取前三個部件的代碼進行編碼,不足三碼時,可以是一碼或二碼,在編碼實例中這么規(guī)定。當然也可規(guī)定第二部仍然只能取二碼,但會付出增加重碼的代價,不宜這么規(guī)定。獨體字按筆順取前四個部件編碼,當取完獨體字所有的部件,漢字的碼長仍不足四碼時,不再編碼,即不足四碼時,取完為止。這一取碼規(guī)則很好記,并且能有效降低重碼,是千錘百煉出來的。
不選第一套單字取碼規(guī)則時,也可選第二套單字取碼規(guī)則,第二套單字取碼規(guī)則是合體字的漢字,第一部按筆順取前二個部件,第二部按筆順取前三個部件編碼,當?shù)诙坎蛔闳a時,碼長可以是一碼、二碼,即取完第二部所有的部件進行編碼就是。當?shù)谝徊恐挥幸淮a時,第二部可按筆順取前四個部件編碼,當?shù)诙坎蛔闼拇a時,碼長可以是一碼或二碼或三碼,即按筆順取完第二部所有的部件的代碼就是。在編碼實例中這么規(guī)定。當然也可規(guī)定第二部仍然只能取三碼,但會付出增加重碼的代價,不宜這么規(guī)定。獨體字的漢字按筆順取字首的五個部件編碼,當取完獨體所有的部件,漢字的碼長仍不足五碼時,不再編碼。
不選第一、二套單字取碼規(guī)則時,也可選第三套單字取碼規(guī)則,第三套單字取碼規(guī)則是合體字的第一部按筆順取前二個部件,第二部按筆順取前四個部件編碼。第一部只有一個部件,就取一碼,這時第二部就可規(guī)定按筆順最多取前五個部件編碼,當然也可規(guī)定第二部最多只能取四碼。當?shù)诙咳〔蛔阕疃啻a長時,取完所有的部件進行編碼;獨體字按筆順取前六個部件,當不足六碼時,取完所有的部件為止。
三套單字取碼規(guī)則均應掌握一個規(guī)則,那就是取大優(yōu)先,即要優(yōu)先按筆畫數(shù)多的部件編碼,同時還要兼顧直觀,不要把方框“口”拆開編碼,不可拆成豎、折、橫或“冂”、橫。
利用輸入法軟件在計算機上敲擊漢字的編碼所在的鍵就可輸入漢字。
下面結(jié)合附圖1舉出手機數(shù)碼十部輸入法的編碼實例。
第一套單字取碼規(guī)則的編碼實例。由于手機數(shù)碼十部輸入法主要在規(guī)定碼長為四碼時也能非常有效地降低重碼,輸入速度快速,因此詳細講解它的編碼實例。如“記”字,它的第一部分是讠,編碼為45,第二部分是“己”,對首二筆編碼,為折橫,編碼為51。這樣“記”的編碼為4551。在利用輸入法軟件在計算機數(shù)字鍵盤上敲擊4、5、5、1就可輸入“記”字,其余類推。如“舊”字,它也屬于合體字,第一部為一豎,代碼為2,第二部的第一個筆畫為豎,但遇到筆畫數(shù)更多的漢字部件“日”,它的代碼為2,“舊”的編碼就為22。雖然第一部只有一碼時,第二部可按筆順最多取前三碼,可第二部只取一碼就取完了所有的部件,因此第二部只取一碼。又如“國”字,它的第一部為方框“口”,代碼為0。第二部的前三碼為橫、十、橫,代碼為1、7、1,“國”的編碼就為0171。又如“納”字,它的第一部按筆順前二個部件為折、折,編碼為5、5,第二部按書寫前二個部件按取大優(yōu)先的原則,應為冂、人,編碼為5、8,“納”的編碼就為5558。又如“米”字,它是獨體字,按筆順前二個部件為點、撇,編碼為4、3,第三個部件按取大優(yōu)先的原則,應取部件“木”,而不是取部件“十”或單筆畫部件橫,因為“木”比“十”或“一”的筆畫多,編碼就取“木”的代碼6,米的編碼就為436。又如“中”字,它為獨體字,按筆順最多取前四個部件??扇⊥辍翱凇?、豎后就取完所有的部件,因此只取二個部件,編碼為02。詞組“納米”編碼時,取“納”的前二碼55,“米”的前二碼43,“納米”的編碼就為5543。
第二套單字取碼規(guī)則的編碼實例。手機數(shù)碼十部輸入法在規(guī)定碼長為五碼時也更能有效地降低重碼,但是會增加記憶。如“記”字,它的第一部分是讠,編碼為45,第二部分是“己”,對首三筆編碼,為折、橫、折,代碼為5、1、5。這樣“記”的編碼為45515。
第三套單字取碼規(guī)則的編碼實例。如“國”字,它的第一部為方框“口”,代碼為0。第二部的前四碼為橫、十、橫、點,代碼分別為1、7、1、4,雖然第二部最多可取五碼,但因為所有的部件都已取完,因此只取四碼,“國”的編碼就為01714。
下面結(jié)合附圖2舉出手機數(shù)碼七部輸入法的編碼實例。
第一套單字取碼規(guī)則的編碼實例。如“舊”字,它也屬于合體字,第一部為一豎,代碼為2,第一部只有一碼時,第二部可按筆順最多取前三碼,第二部的前三個部件為口、橫,代碼分別為0、1,“舊”的編碼就為201。又如“中”字,它為獨體字,按筆順最多取前四個部件??扇⊥辍翱凇?、豎后就取完所有的部件,因此只取二個部件,編碼分別為0、2,“中”的編碼就為02。
第二套單字取碼規(guī)則的編碼實例。手機數(shù)碼七部輸入法在規(guī)定碼長為五碼時能非常有效地降低重碼,輸入速度快速,因此詳細講解它的編碼實例。如“扒”字,它的第一部分是部件“扌”,代碼為7,第二部分是部件“八”,代碼為8,第一部只有一碼時,第二部最多可取四碼,可第二部只取一碼就取完了第二部的全部部件,所以第二部只取一碼,扒的編碼就為78。又如“獲”字,它的第一部為艸,代碼為9,這時第二部可按筆順最多取四碼,分別為撇、折、撇、橫,代碼分別為3、5、3、1,“獲”的編碼就為93531。又如“納”字,它的第一部按筆順為折、折,代碼分別為5、5,第二部按筆順部件為豎、折、人,代碼分別為2、5、8,又如“油”字,它的第一部為氵,編碼為8,第二部的第一個部件按方框“口”形不拆原則,為“口”,編碼為0,第二部為“十”,編碼為7,“油”的編碼就為807?!凹{”的編碼就為55258。又如“米”字,它按筆順前三個部件為點、撇,木,編碼分別為4、3、6,“米”的編碼就為436。又如“事”字,它是獨體字,按筆順前五個部件分別是橫、口、折、橫、橫,代碼分別為1、0、5、1、1,“事”的編碼就為10511?!凹{米”的編碼時取納的前二碼55,取米的前三碼436,“納米”的編碼就為55436。
第三套單字取碼規(guī)則的編碼實例。如“渦”字,它的第一部為氵,代碼為8,第二部的部件按筆順為“口”、豎、折、人、代碼分別為0、2、5、8,雖然第一部只有一碼時,第二部最多可取五個部件的代碼,但只取四個部件就取完了第二部的全部部件,因此第二部只取四碼。渦的編碼就為80258。
有時漢字的筆畫順序可能不清楚,或者分不清第一部或第二部,也有可能把多筆畫部件拆成單筆畫部件即基本筆畫進行編碼,為此本輸入法軟件容許按不規(guī)范的方法輸入,這種輸入碼就稱為容錯碼。
上述編碼方法是用數(shù)字編碼的,其實也可用字母或別的符號編碼,比如用Q、W、E、R、T、Y、U、I、O、P分別代替1、2、3、4、5、6、7、8、9、0編碼。
為提高輸入速度,還設(shè)置了簡碼輸入規(guī)則。手機數(shù)碼十部輸入法和手機數(shù)碼七部輸入法的簡碼和標點符號輸入規(guī)則完全相同。
本發(fā)明每輸入一個數(shù)字編碼,就按高頻先見的方法顯示排列出漢字,使得很多常用字不必輸入全部編碼,就可挑選漢字上屏,這就是簡碼。排列侯選字時有二種方法比較理想一是分二行上下排列,每行五個漢字。二是按電腦數(shù)字鍵區(qū)或手機上0~9個阿拉伯數(shù)字鍵區(qū)那樣排列,即按三行三列排列,用阿拉伯數(shù)字挑選上屏。在按第一套取碼規(guī)則輸入不足四碼要挑選漢字時,必須按一個表示選擇漢字的鍵比如“/”鍵,再按數(shù)字鍵方可挑選漢字上屏,處于最先顯示排列的漢字可按另外一個鍵比如回車鍵上屏,輸入達到四碼并且有重碼時無須按表示選擇的鍵比如“/”,就可直接按數(shù)字鍵挑選漢字上屏,無重碼的漢字可直接上屏。類似的規(guī)則也可套用于碼長最多為五碼或六碼的取碼規(guī)則,只要將四碼改為五碼或六碼即可。目前有的手機上的輸入法用*和#鍵移動到所要挑選的漢字,再按確定鍵使該漢字上屏,實在太緩慢。
本發(fā)明經(jīng)移植可應用到手機之類的移動通訊設(shè)備,也可應用到機頂盒、電話機、電子字典、收款機等設(shè)備中,還可應用到配有數(shù)字鍵盤的其他設(shè)備的鍵錄輸入。
權(quán)利要求
1.一種手機數(shù)碼十部輸入法,其特征是(一)、優(yōu)選漢字部件進行編碼(1)選用漢字的五種單筆畫部件即五種基本筆畫橫(一)、豎(丨)、撇(丿)、點(、)、折(乙)分別用1、2、3、4、5作為其代碼;(2)選用五個組字頻率高的漢字部件木、扌、氵、艸、口分別用6、7、8、9、0作代碼;(3)選用另外五個組字頻率高的漢字部件日、亠、冂、十、八分別用2、3、5、7、8作代碼;(二)、取碼規(guī)則有三套,分別是(1)、第一套單字取碼規(guī)則是規(guī)定漢字的碼長最多為四碼時的取碼規(guī)則合體字的第一部按筆順取前二個部件編碼,第二部按筆順取前二個部件編碼,當?shù)谝徊恐挥幸粋€部件,只能取一碼時,第二部可按筆順取前三個部件編碼,當?shù)诙克胁考蝗⊥?,漢字的總碼長仍不足四碼時,編碼結(jié)束,不再編碼;獨體字按筆順取前四個部件編碼,當取完該漢字的所有部件,漢字總碼長不足四碼時,編碼結(jié)束,不再編碼;注意某個部件已取碼后不可重復取碼,這一規(guī)則也適用于第二、三套單字取碼方案;(2)、第二套單字取碼規(guī)則是規(guī)定漢字的碼長最多為五碼的取碼規(guī)則合體字的第一部按筆順取前二個部件編碼,第二部按筆順取前三個部件編碼,當?shù)谝徊恐挥幸粋€部件,只能取一碼時,第二部可取前四個部件編碼,當取完第二部所有的部件進行編碼,漢字的總碼長不足五碼時,編碼結(jié)束,不再編碼;獨體字按筆順取前五個部件編碼,當獨體字的所有部件已被取完,該字的總碼長不足五碼時,編碼結(jié)束,不再編碼;(3)、第三套單字取碼規(guī)則是漢字的碼長最多為六碼時的取碼規(guī)則合體字的漢字,第一部按筆順取前二個部件編碼,第二部按筆順取前四個部件編碼,當?shù)谝徊恐挥幸粋€部件只能取一碼時,第一部就取一碼,第二部可取前五個部件編碼,當?shù)诙堪垂P順取完所有的部件,漢字的總碼長不足六碼時,編碼結(jié)束,不再編碼;獨體字的漢字按筆順取前六個部件編碼,當取完所有部件,編碼不足六碼時,編碼結(jié)束,不再編碼;每一套單字取碼規(guī)則都要遵循取大優(yōu)先原則,即要優(yōu)先按筆畫數(shù)多的漢字部件編碼,應保證按書寫順序每次拆分出盡可能大的漢字部件,不要把筆畫多的部件拆分成筆畫少的部件;另外還要兼顧直觀,避免把四邊封閉的方框即“口”型按書寫順序拆開編碼,(三)利用輸入法軟件,在鍵盤上敲擊某個漢字相應的編碼所在的鍵就可輸入該漢字。
2.一種手機數(shù)碼十部輸入法,其特征是(一)、優(yōu)選漢字部件進行編碼(1)選用漢字的五種單筆畫部件即五種基本筆畫橫(一)、豎(丨)、撇(丿)、點(、)、折(乙)分別用1、2、3、4、5作為其代碼;(2)選用五個組字頻率高的漢字部件木、扌、氵、艸、方框口分別用6、7、8、9、0作代碼;(3)選用另外二個組字頻率高的漢字部件十、八分別用7、8作代碼;(二)、單字的取碼規(guī)則有三套,分別是(1)、第一套單字取碼規(guī)則是規(guī)定漢字的碼長最多為四碼時的取碼規(guī)則合體字的第一部按筆順取前二個部件編碼,第二部按筆順取前二個部件編碼,當?shù)谝徊恐挥幸粋€部件,只能取一碼時,第二部可按筆順取前三個部件編碼,當?shù)诙克胁考蝗⊥?,漢字的總碼長仍不足四碼時,編碼結(jié)束,不再編碼;獨體字按筆順取前四個部件編碼,當取完該漢字的所有部件,漢字總碼長不足四碼時,編碼結(jié)束,不再編碼;注意某個部件已取碼后不可重復取碼,這一規(guī)則也適用于第二、三套取碼方案;(2)、第二套單字取碼規(guī)則是規(guī)定漢字的碼長最多為五碼的取碼規(guī)則合體字的第一部按筆順取前二個部件編碼,第二部按筆順取前三個部件編碼,當?shù)谝徊恐挥幸粋€部件,只能取一碼時,第二部可取前四個部件編碼,當取完第二部所有的部件進行編碼,漢字的總碼長不足五碼時,編碼結(jié)束,不再編碼;獨體字按筆順取前五個部件編碼,當獨體字的所有部件已被取完,該字的總碼長不足五碼時,編碼結(jié)束,不再編碼;(3)、第三套單字取碼規(guī)則是漢字的碼長最多為六碼時的取碼規(guī)則合體字的漢字,第一部按筆順取前二個部件編碼,第二部按筆順取前四個部件編碼,當?shù)谝徊恐挥幸粋€部件只能取一碼時,第一部就取一碼,第二部可取前五個部件編碼,當?shù)诙堪垂P順取完所有的部件,漢字的總碼長不足六碼時,編碼結(jié)束,不再編碼;獨體字的漢字按筆順取前六個部件編碼,當取完所有部件,編碼不足六碼時,編碼結(jié)束,不再編碼;每一套單字取碼規(guī)則都要遵循取大優(yōu)先原則,即要優(yōu)先按筆畫數(shù)多的漢字部件編碼,應保證按書寫順序每次拆分出盡可能大的漢字部件,不要把筆畫多的部件拆分成筆畫少的部件;另外還要兼顧直觀,避免把四邊封閉的方框即“口”型按書寫順序拆開編碼,(三)利用輸入法軟件,在鍵盤上敲擊某個漢字相應的編碼所在的鍵就可輸入該漢字。
3.根據(jù)權(quán)利要求1、2所述的手機數(shù)碼,其特征是第一套單字取碼規(guī)則的詞組輸入規(guī)則是二字詞各取每個字完整編碼的前二碼;三字詞規(guī)定取第一、二個字的前一碼,第三個字的前二碼;當然也可規(guī)定三字詞取第一個字的前二碼,第二、三個字的前一碼;四字及以上詞,各取前三個字和最末個字的前一碼;當詞組編碼時某個字取不足規(guī)定碼長時,一律重復補上該字的尾碼,直到補夠為止;第二套單字取碼規(guī)則相應的詞組輸入規(guī)則是二字詞,第一個字取前二碼;第二個字取前三碼;三字詞,第一、二個字各取前二碼,第三個字取前一碼;四字以上詞,第一、二個字各取前二碼,最末字取前一碼;當詞組編碼時某個字取不足規(guī)定碼長時,一律重復補上該字的尾碼,直到補夠為止;第三套單字取碼規(guī)則第三套取碼規(guī)則的詞組輸入規(guī)則是二字詞,第一字取前二碼,第二字取前四碼;三字詞,每字各取前二碼;四字及以上詞,第一、二和最末詞各取前二碼;當詞組編碼時某個字取不足規(guī)定碼長時,一律重復補上該字的尾碼,直到補夠為止。
4.根據(jù)權(quán)利要求1、2所述的手機數(shù)碼,其特征是不足規(guī)定最多碼長時,必須按一個表示選擇漢字的鍵比如“/”鍵,再按數(shù)字鍵方可挑選漢字上屏,處于最先顯示排列的漢字可按另外一個鍵比如回車鍵上屏,輸入達到規(guī)定最多碼長,并且有重碼時無須按表示選擇的鍵比如“/”,就可直接按數(shù)字鍵挑選漢字上屏,無重碼的漢字可直接上屏。
5.根據(jù)權(quán)利要求1或2所述的手機數(shù)碼,其特征是其實也可用十個字母或別的符號編碼,比如用Q、W、E、R、T、Y、U、I、O、P分別代替1、2、3、4、5、6、7、8、9、0十個數(shù)字編碼。
全文摘要
本發(fā)明手機數(shù)碼屬于電腦漢字編碼輸入方法,也就是中文輸入法。該輸入法將漢字分為獨體字和合體字分別取碼,并優(yōu)選橫、豎、撇、點、折五種基本筆畫和“口”、“木”“扌”、“氵”、“艸”、“十”、“八”和“人”等幾個漢字部件進行編碼,還可選用“日”、“亠”、“冂”等漢字部件參與編碼。做到了既簡單又快速??稍谟嬎銠C的數(shù)字鍵上輸入漢字,經(jīng)過移植也可在手機、電話等設(shè)備中使用。
文檔編號H04Q7/32GK101083676SQ200610084959
公開日2007年12月5日 申請日期2006年5月31日 優(yōu)先權(quán)日2006年5月31日
發(fā)明者王治陽 申請人:王治陽