專利名稱:拼音首部數(shù)字輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于電腦漢字編碼輸入方法,也就是計算機中文輸入法。 因為它是一種組合手機數(shù)碼輸入法和拼音輸入法的計算機輸入法,并 且還結(jié)合了首部輸入技術(shù),因此稱為拼音首部數(shù)字輸入法,經(jīng)過移植 也可在手機、電話等設(shè)備中使用。
背景技術(shù):
利用數(shù)字對漢字編碼由來已久,早期的電報碼、區(qū)位碼就屬于數(shù) 字編碼,具有四位數(shù)字等長,無重碼,輸入速度很快等優(yōu)點,但因為 其編碼毫無規(guī)律,只能死記硬背地逐個記住六、七千個漢字的編碼, 自然能熟記其編碼的人是寥寥無幾的,如今,這樣的編碼連計算機上 都淘汰了,更甭提手機了。四角號碼也是數(shù)字編碼,它算有規(guī)律可循, 但不合筆順規(guī)律,包含的同類部件太多,還有些重碼,且不適合想打, 效率較低,手機上也沒安裝這種輸入法。將漢字的各種筆畫歸類為幾 種筆畫,用幾個數(shù)字編碼,并逐筆輸入的輸入法,因為象寫字一樣簡 單,幾乎人人都能使用,所以在手機上獲得廣泛應(yīng)用??芍鸸P輸入漢 字時,筆畫較多的漢字碼長較長,輸入速度較慢,為此,作了智能化 改進,每輸入一筆就出現(xiàn)最有可能的幾個字或偏旁供挑選,這樣許多 字不必逐筆輸完就出現(xiàn)在屏上,明顯提高輸入速度,成為手機市場上 主流的筆畫輸入法,可少數(shù)漢字仍要擊鍵七、八下甚至更多,選字麻
煩,輸入速度欠快。著名的T9輸入法好象就屬于這類輸入法。于是 有人做出改進,將合體字一分為二或一分為三,再選取筆畫和部件進 行編碼。這類輸入法典型的代表是五筆數(shù)碼,誠如其宣稱的那樣,既 簡單又快速, 一般人十幾分鐘可學(xué)會,輸入速度約為西文的二倍???這類輸入法有個重大缺點,那就是部件選取不當(dāng),以五筆數(shù)碼為例, 它的六鍵輸入法只在五類基本筆畫的基礎(chǔ)上增加一個"口"部件,選取的部件少了點,它的九鍵輸入法卻令人吃驚地選用了 "王""幺"
"心"等組字頻率底的漢字部件。另外讓人感到麻煩的是五筆數(shù)碼犯 了一個與四角號碼同樣的錯誤,那就是有的基本部件還包含了幾個其
他部件,此舉一來不利于把部件排到數(shù)字鍵上,因為手機上的數(shù)字鍵 太小,二來增加了部件數(shù),顯得煩瑣,不利于記憶。市場調(diào)研表明, 很多人懶得發(fā)抖,不愿學(xué)這種十幾分鐘才能學(xué)會的輸入法,只有幾分 鐘就能學(xué)會的輸入法才有市場。
這樣幾分鐘就能學(xué)會的輸入法就被推向市場。目前手機市場上在 用的一種輸入法是這樣的將五種基本筆畫和幾個漢字部件分別排在 數(shù)字鍵上,合體字的漢字,按筆順第一部取二碼,第二部取一碼;獨 體字的漢字按筆順取二碼,對漢字作過深入研究的人都知道,有幾個 部首"管轄"二百多個漢字,第二部只取一碼的話,會造成大量的重 碼,這種試圖在區(qū)區(qū)幾個數(shù)字鍵上以二、三碼輸入七千個漢字的做法 必定付出重碼高的代價。針對這種情況,本人發(fā)明了一種新的漢字輸 入法手機數(shù)碼輸入法。該輸入法選用的多筆畫部件只有五個,分別是 十人凈? *,當(dāng)時還規(guī)定部件"八"含"人",后來出于簡單易學(xué)考 慮,將相對不常用的部件"八"去掉了。經(jīng)實踐證明這五個部件是最 合理的,能以最少的記憶、最少的擊鍵數(shù)、較少的重碼完成輸入。對 于不太熟悉拼音的人來說是最合適不過的輸入法。
然而,中國人最常用的輸入法不是筆畫輸入法,而是拼音輸入法。 因為拼音輸入法輸入漢字時無須考慮字形結(jié)構(gòu),便于想打,因而最為 流行。拼音輸入法最初移植到手機上使用時存在著一個輸入拼音字母 不便的問題,由于幾個字母排在一個數(shù)字鍵上,有的拼音字母要按幾 下數(shù)字才能出現(xiàn)在屏上,擊鍵次數(shù)過多,解決的辦法是采用智能拼音, 按拼音字母的次序敲擊一下每個字母所在的數(shù)字鍵后,出現(xiàn)幾種可能 的拼音組合供選擇,這樣就大大減少了擊鍵的次數(shù),更便于輸入。采用智能拼音后,拼音輸入法就開始流行開來,可拼音輸入法還存在著 重碼率高的缺點,有時不得不從數(shù)十個甚至上百個同音字中選擇一 個,嚴重影響輸入速度,極為不便。隨著手機的全民普及,如何利用 數(shù)字鍵來簡便快速地輸入漢字仍是目前手機輸入法的一個重大技術(shù)
難關(guān)。
發(fā)明內(nèi)容
這樣目前漢字的數(shù)字編碼輸入法要么不合筆順規(guī)范;要么部件選 取不當(dāng);要么碼長太短或太長;要么重碼過高,影響輸入速度;要么 不便想打。都沒能很好解決簡便的不快速,快速的不簡便這一技術(shù)難 題,輸入漢字不甚方便。
本發(fā)明的目的是提供一種符合筆順規(guī)范、直觀、漢字部件少,簡 單易學(xué)、輸入漢字方便快捷的電腦漢字輸入法即拼音首部數(shù)字輸入 法。
為達到拼音首部數(shù)字輸入法的目的,本發(fā)明將拼音輸入法與手機 數(shù)碼輸入法組合,拼音在先,形部編碼接后,該形部編碼為碼長縮短 了的手機數(shù)碼。形部編碼的碼長最多為二碼,而且規(guī)定合體字只取字 首部分,如果字首部分只有一碼,就取一碼,而不能取剩余部分。這 是不同于手機數(shù)碼的創(chuàng)新之處。獨體字也最多取二碼。
本發(fā)明將漢字的各種筆畫按國家語委的規(guī)定歸類為橫、豎、撇、 點、折五種基本筆畫,分別用五個互不相同的數(shù)字比如l、 2、 3、 4、 5編碼。為降低重碼,還優(yōu)選組字頻率或?qū)嵱妙l率高的幾個筆畫結(jié)構(gòu) 即國家語委規(guī)定的漢字部件"木"、"凈,,、",,、"廿"、"口"、排到 鍵上,分別用另外五個互不相同的數(shù)字如6、 7、 8、 9、 0編碼。漢字 部件是由幾個筆畫組成的具有組配漢字功能的構(gòu)字單位,漢字部件有 多筆畫部件和單筆畫部件之分,單筆畫部件即五種基本筆畫。
形部編碼的取碼規(guī)則是將漢字分為獨體字和合體字,合體字又根據(jù)整體結(jié)構(gòu)一分為二,先寫部分為第一部,簡稱首部,后寫部分為第 二部,簡稱剩部。合體字的首部按筆順取前二個部件的相應(yīng)代碼進行 編碼,當(dāng)只有一個部件時,就只取一個部件的相應(yīng)代碼進行編碼,而 不必取剩部進行編碼,獨體字的首部按筆順取前二個部件的相應(yīng)代碼 進行編碼,當(dāng)只有一個部件時,就只取一個部件的相應(yīng)代碼進行編碼。
圖1是GSM蜂窩電話的鍵盤,其中各字母鍵的排列符合 ITU-TE.161標(biāo)準(zhǔn)。
圖2為形部編碼數(shù)字鍵盤排列圖,圖中一、I、 j、、、乙分別 代表橫、豎、撇、點、折。
具體實施例方式
下面結(jié)合優(yōu)選的實施例和附圖作詳細說明。
本人在長期的漢字編碼研究中,認識到漢字輸入時選用拼音輸入 法比較簡單,且便于想打,可漢字的同音字較多,必須附加形部編碼 來減少同音字。本人研究發(fā)現(xiàn)同音同偏旁的漢字很少,即便有,也一 般只有兩三對,通常不會超過四對,因此在設(shè)計形部編碼時只要能區(qū) 分偏旁即可,也就是說對合體字只要選用其偏旁即可,而無須考慮其 剩余部分,由于偏旁往往在字首,因此一般的漢字只要選取字首部分, 進行編碼即可,但也有的偏旁在字中或字尾,為了符合書寫順序習(xí)慣, 便于想打輸入,規(guī)定也只選用一個字的字首部分,只對字首部分編碼。 由于偏旁部首有200多個,組字頻率高的偏旁也有近30個,而數(shù)字 鍵卻只有10個,因此字首部分只有一碼的話是不夠的,至少要有二 碼,選用三碼的話,由于一來字首部分往往筆畫較少,二來只有200 多個偏旁,大部分偏旁的組字頻率不高,只有30來個偏旁頻率較高, 因此似乎多了一點,所以規(guī)定最多選用二碼是最合適的。
這樣本發(fā)明的取碼規(guī)則是編碼由兩部分組成 一部分為拼音,另一部分為形部編碼。為便于輸入,規(guī)定拼音在先,且最好采用智能拼 目前絕大多數(shù)蜂窩移動電話用的都是全拼輸入法,其鍵盤通常符
合ITU-T E.161標(biāo)準(zhǔn),見附圖l。使用全拼輸入法輸入一個漢字時, 需要輸入該漢字的標(biāo)準(zhǔn)漢語拼音中的每個字母。例如,要輸入"張" 字,用戶必須按鍵盤上的順序輸入字母"z-h-a-n-g",蜂窩電話用戶 要想在其電話上拼出這個"張"字必須在鍵盤上找5次字母,總共按 10下才能找到該漢字的拼音,這對于蜂窩電話的用戶來說是非常麻 煩和費時的。
為減少蜂窩電話的擊鍵次數(shù),目前流行的一種智能拼音輸入法在 輸入完某個漢字的全部拼音字母后給出了幾種可能的組合供挑選,這 樣輸入"張"字,只要擊z、 h、 a、 n、 g這五個拼音字母所再的數(shù)字 鍵,再根據(jù)提示行擊一次數(shù)字鍵進行選擇即可,也就是說只要擊鍵六 次就可輸入它的整個拼音。這能明顯提高輸入速度。在本發(fā)明中,拼 音部分建議采用智能拼音。
本發(fā)明在編碼時對漢字筆畫的認識完全科學(xué)。筆畫是構(gòu)成楷書漢 字字形的最小連筆單位,是書寫漢字時一次連續(xù)寫成的一個線條。按 國家語委的規(guī)定,在只考慮漢字的運筆方向而不計其輕重長短時,即 只考慮其筆形時可分為橫、豎、撇、點、折五種基本筆畫,其中提并 入橫,豎鉤并入豎,捺并入點,各種折筆都作折,也就是說其他各種 帶轉(zhuǎn)折的筆畫都作折。國家語委稱五種基本筆畫為橫、豎、撇、點、 折,而本人傾向于稱橫、豎、撇、捺、折。因為點的筆畫是很短的, 不象其它筆畫那樣具有一定的長度,且有時運筆方向下垂,幾乎與撇 相同。當(dāng)然國家語委規(guī)定稱點可能是因為點成字,而且組字頻率高于 捺。由于是國家語委的規(guī)定,只好遵守,其實國家語委還可規(guī)定稱捺也允許。漢字部件是由幾個筆畫組成的具有組配漢字功能的構(gòu)字單位 漢字部件有多筆畫部件和單筆畫部件之分,單筆畫部件即五種基本筆畫。
漢字部件的定義與國家語委的規(guī)定相同,它由幾個筆畫構(gòu)成的相 對不變的筆畫結(jié)構(gòu),組合后可構(gòu)成漢字。為便于記憶,本發(fā)明規(guī)定橫、
豎、撇、點、折五種基本筆畫分別用1、 2、 3、 4、 5編碼,漢字部件 "木"、"矛"、""、"卄"、"口"分別用6、 7、 8、 9、 0編碼。記憶
方法是木頭手在水草中,"口 "和"0"近形。在手機數(shù)碼中也將"十"、 "八"等部件刪除,只留下這五個部件。
接著將漢字分為獨體字和合體字二類。本人在長期的編碼研究中
早就認識到一個漢字是否為左右結(jié)構(gòu)是一目了然的,左右結(jié)構(gòu)的漢字
很容易在其產(chǎn)生空隙處將它一分為二,而上下、包圍結(jié)構(gòu)的漢字有時
不易一分為二,甚至有時難以分清一個字是獨體字還是上下結(jié)構(gòu)或包 圍結(jié)構(gòu)。根據(jù)一個漢字是否為左右結(jié)構(gòu)進行劃分最為簡單易學(xué),但這 樣不利于降低重碼,實際上對于難以劃分結(jié)構(gòu)的漢字還可以用容錯碼 的技術(shù)加以解決,即容許對同一個漢字根據(jù)不同的劃分進行不同編 碼,所以還是劃分為獨體字和合體字為好。這樣也與人們的傳統(tǒng)思維 一致。需要指出的是將合體漢字一分為二,分成二部分別進行編碼的 技術(shù)由來已久,并非我獨創(chuàng)。
合體字根據(jù)整體結(jié)構(gòu)在最初的分界線處將其一分為二,先寫的第 一部,后寫的為第二部,對左中右結(jié)構(gòu)的漢字將其中間部分、右邊部 分劃為第二部。對上中下結(jié)構(gòu)的漢字將其中間部分、下面部分劃為第 二部。當(dāng)然也可根據(jù)成字優(yōu)先的原則將中間部分劃分到第一部。也可 無條件地規(guī)定將中間部分劃分到第一部。另外對包圍部分按筆順要分 開書寫的漢字如"或"、"載"等字,按該漢字第一筆的先后,規(guī)定含 有第一筆的部分為第一部,不含第一筆的部分為第二部。由于包圍部分的第一筆往往先寫,這條規(guī)定實際上是規(guī)定包圍部分為第一部、被 包圍部分為第二部。當(dāng)然也可將該類漢字歸類到獨體字中,按獨體字 編碼。另外鑲嵌型的漢字如"乘"等字也可按獨體字編碼。
又將漢字的各種筆畫按國家語委的規(guī)定歸類為橫、豎、撇、點、 折五種基本筆畫,分別用五個互不相同的數(shù)字比如1、 2、 3、 4、 5編 碼。為降低重碼,還優(yōu)選組字頻率或?qū)嵱妙l率高的幾個筆畫結(jié)構(gòu)即國 家語委規(guī)定的漢字部件排到鍵上,參與編碼。本人在發(fā)明雙優(yōu)碼中曾 將雙筆畫參與編碼,可后來經(jīng)過實用操作,發(fā)現(xiàn)利用雙筆畫參與編碼 不利于頭腦反應(yīng),所以只好舍棄雙筆畫了。漢字部件在選取時數(shù)量要 少,且要有利于降低重碼,另外漢字部件最好是本身就是偏旁或漢字, 以便于記憶。這樣漢字部件"口"、"廿"、"凈,,、",,、"木"等部件 就被選出來,從便于記憶的角度出發(fā),將漢字部件"木"、"t "、"?"、
"卄"、"口"分別用6、 7、 8、 9、 0編碼。見附圖2。記憶方法是 木頭手在水草中,"口"和"0"近形。
形部編碼的取碼規(guī)則是合體字的首部按筆順取前二個部件的相
應(yīng)代碼進行編碼,當(dāng)只有一個部件時,就只取一個部件的相應(yīng)代碼進 行編碼,而不必取剩部進行編碼,獨體字的首部按筆順取前二個部件 的相應(yīng)代碼進行編碼,當(dāng)只有一個部件時,就只取一個部件的相應(yīng)代 碼進行編碼。之所以規(guī)定取合體字或獨體字的前二個部件進行編碼, 而不取合體字或獨體字的首尾二個部件是為了便于想打。
編碼實例"漢"的編碼,在按智能拼音輸入han后,即敲擊"h"、 "a"、 "n"所在的數(shù)字鍵后,會出現(xiàn)相應(yīng)的拼音組合供挑選,挑選后 就完成了拼音的智能輸入。再敲擊"漢"的字首部分"?"的編碼代 號8所在的鍵,就會出現(xiàn)漢、涵、汗、瀚4個字供挑選,根據(jù)提示項 利用相應(yīng)的數(shù)字鍵進行挑選即可完成輸入。
"字"的編碼,在按智能拼音輸入法輸入zi后,即敲擊"z"、"i"所在的數(shù)字鍵后,會出現(xiàn)相應(yīng)的拼音組合供挑選,挑選后就完成了拼 音的智能輸入。"字"一分為二后,字首部分為"、",字尾部分為"子", 字首部分第一、二筆為點、點,相應(yīng)的編碼代號分別為4、 4,輸入
拼音后再敲擊編碼代號4、 4所在的數(shù)字鍵,提示項就會出現(xiàn)字和窒 2個字供挑選,根據(jù)提示項利用相應(yīng)的數(shù)字鍵進行挑選即可完成輸入。 又如"又"字,在按智能拼音輸入法輸入you后,即敲擊"y"、 "o" "u"所在的數(shù)字鍵后,會出現(xiàn)相應(yīng)的拼音組合供挑選,挑選后 就完成了拼音的智能輸入。"又"為獨體字,第一、二筆為折、點, 相應(yīng)的編碼代號分別為5、 4,輸入拼音后再敲擊數(shù)字5、 4所在鍵,
提示項就會出現(xiàn)1個"又"字,這時按確定鍵就可直接上屏,完成輸入。
為提高輸入速度,還設(shè)置了聯(lián)想輸入法和詞組輸入法。聯(lián)想輸入 法的原理是輸入一個漢字后,會出現(xiàn)幾個相關(guān)的漢字供挑選。在手機 上輸入詞組時,不必要再考慮形部編碼,跟拼音輸入完全相同,只要 按拼音輸入法輸入即可,在手機上輸入拼音時,由于數(shù)字鍵少、屏幕 小,為減少重碼,盡量不用簡拼輸入, 一般只輸入每個漢字的完整拼
音
當(dāng)然本發(fā)明也可移植到配有字母鍵盤的計算機上使用,這時為便 于輸入,還可用十個互不相同的字母代替十個互不相同的數(shù)字進行編 碼,比如用q、 w、 e、 r、 t、 y、 u、 I、 o、 p分別代替l、 2、 3、 4、 5、 6、 7、 8、 9、 0進行編碼。
權(quán)利要求
1、一種拼音首部數(shù)字輸入法,其特征是漢字的各種筆畫按國家語委的規(guī)定歸類為橫、豎、撇、點、折五種基本筆畫,分別用五個互不相同的數(shù)字比如1、2、3、4、5編碼,還優(yōu)選組字頻率或?qū)嵱妙l率高的幾個筆畫結(jié)構(gòu)即國家語委規(guī)定的漢字部件“木”、“扌”、“氵”、“艸”、“口”排到鍵上,分別用另外五個互不相同的數(shù)字如6、7、8、9、0編碼,拼音之后為形部編碼,漢字分為合體字和獨體字二類,形部編碼的取碼規(guī)則是合體字的首部按筆順取前二個部件的相應(yīng)代碼進行編碼,當(dāng)只有一個部件時,就只取一個部件的相應(yīng)代碼進行編碼,而不取剩部進行編碼,獨體字的首部按筆順取前二個部件的相應(yīng)代碼進行編碼,當(dāng)只有一個部件時,就只取一個部件的相應(yīng)代碼編碼。
2、 根據(jù)權(quán)利要求1所述的一種拼音首部數(shù)字輸入法,其特征是-橫、豎、撇、點、折五種基本筆畫,分別用五個互不相同的數(shù)字比如 1、 2、 3、 4、 5編碼"木"、"t "、""、"卄"、"口,,用另外五個 互不相同的數(shù)字如6、 7、 8、 9、 0編碼。
3、 根據(jù)權(quán)利要求2所述的一種拼音首部數(shù)字輸入法,其特征是 可用十個互不相同的字母分別代替十個互不相同的數(shù)字進行編碼,比 如用q、 w、 e、 r、 t、 y、 u、 I、 o、 p分別代替1、 2、 3、 4、 5、 6、 7、 8、 9、 0進行編碼。
4、 根據(jù)權(quán)利要求1所述的一種拼音首部數(shù)字輸入法,其特征是:聯(lián)想輸入法的原理是輸入一個漢字后,會出現(xiàn)幾個相關(guān)的漢字供挑選;在手機上輸入詞組時,跟拼音輸入完全相同,只要按拼音輸入法 輸入即可,在手機上輸入拼音時, 一般只輸入每個漢字的完整拼音。
全文摘要
本發(fā)明屬于電腦漢字編碼輸入方法,也就是計算機中文輸入法。因為它是一種組合手機數(shù)碼輸入法和拼音輸入法的計算機輸入法,并且還結(jié)合了首部輸入技術(shù),因此稱為拼音首部數(shù)字輸入法,經(jīng)過移植也可在手機、電話等設(shè)備中使用。
文檔編號H04M1/23GK101441518SQ200710192849
公開日2009年5月27日 申請日期2007年11月19日 優(yōu)先權(quán)日2007年11月19日
發(fā)明者王治陽 申請人:王治陽