專利名稱::用于數(shù)字鍵盤的漢語拼音輸入方法
技術領域:
:本發(fā)明涉及一種漢字輸入法,尤其是一種利用數(shù)字鍵盤的漢語拼音輸入方法,屬于特殊鍵盤定義下的漢語拼音編碼輸入漢字的
技術領域:
。
背景技術:
:通過英文字母鍵盤輸入漢字,己經(jīng)有很多成熟的輸入法,包括音碼和形碼的輸入法。然而很多信息設備使用數(shù)字鍵盤,與英文鍵盤輸入方式有明顯差別。除了手機短信的漢字輸入需求外,個人數(shù)字助理(PDA)、機頂盒遙控器的頻道選擇、甚至電話機鍵盤漢字撥號都需要數(shù)字編碼方案。在數(shù)字鍵盤中,每個按鍵對應多個字母。在大多數(shù)輸入法中,數(shù)字按鍵上對應的第一個字母通過按一下該按鍵即可,其它字母則通過連續(xù)多次按健以及超時機制來輸入,這種機制效率較低。例如,在手機上輸入英文字母時,如果連著輸入在同一個數(shù)字鍵上的字母A和B,則輸入A后不能緊接著輸入B而要等待超時,即按鍵方式就是"2—22"。這是操作者難以忍受的。拼音輸入時的一種改進是每字母僅按鍵一次,所有字母對應的數(shù)字輸完后,往往有多個備選拼音。先按鍵挑拼音,再挑選漢字。這樣兩次挑選顯得不夠流暢。目前手機漢字輸入法主要有T9、iTAP和字能輸入法等。這幾種輸入法中,字、詞混合輸入的平均擊鍵次數(shù)均大于4鍵/字。用戶滿意度明顯低于英文字母鍵盤上的漢字輸入法。而普遍使用的單字加聯(lián)想方式,不如詞組方式好用。采用標準漢語拼音進行詞組輸入時,某些字母既可以看做當前字的韻母,也可看做下一個字的聲母。例如,全拼輸入"f'angan",既可理解為"反感fan'gan"也可以理解為"方案fang'an"。漢字輸入法要盡量避免這種編碼二義性,不要出現(xiàn)切分困難。而在已知的現(xiàn)有技術中,解決這一問題的技術方案都比較麻煩。和英文鍵盤一樣,數(shù)字鍵盤的漢字輸入法目前也以拼音輸入法為主導。采用漢語拼音編碼時,分為全拼和雙拼兩類。在英文鍵盤拼音輸入方案中有多個雙拼方案,由于需要記憶的規(guī)則太多,使用者學習困難,雙拼遠不如全拼輸入普及,也不象五筆字型快速。雙拼方案不宜移植到數(shù)字鍵盤。全拼方案中,韻母有1到4個字母,長短不一。全拼韻母應用于數(shù)字鍵盤需要適當變換,但不要象雙拼方案那樣難記難學。有人專門針對漢語拼音設計了數(shù)字鍵盤布局,但改動太大牽涉到鍵盤的生產(chǎn)制造。如果改動不大,人腦容易轉(zhuǎn)換過來,就可以將就原來的鍵盤外針對有些人拼音不準,不少輸入法設有模糊音。例如,有人分不清楚聲母n和l,可以事先設置rpl為模糊音。將這兩個聲母拼音對應的漢字都列在候選字中,無論輸入lai還是nai,候選字都有"來、賴、耐、奶"。雖然重碼率有所提高,但拼音不準的時候無需來回試探兩個拼音。盡管如此,用戶還是要努力提高區(qū)分模糊音的能力,從而降低重碼。在區(qū)分能力不斷提高的過程中,往往出現(xiàn)部分字能夠確定,另外一部分需要模糊音。這時,需要給模糊音另外編碼,如編碼為nl,與n或l不同,從而無需事先設定模糊音,想用就用??傊@些方法都普遍存在著重碼率高、按鍵太多或定義復雜的問題。
發(fā)明內(nèi)容針對上述問題,本發(fā)明目的在于提供一種用于數(shù)字鍵盤的漢語拼音輸入方法,降低漢語拼音編碼的重碼率,簡潔易學且按鍵較少?;緲?gòu)思是在拼音編碼中加入聲調(diào),拼音輸入分為聲部輸入和韻部輸入兩個部分聲部輸入碼長定長為2鍵;韻部輸入包括韻母的輸入和聲調(diào)的輸入,其中韻母可以省略,但聲調(diào)不能省略,因此韻部輸入碼長為13鍵?,F(xiàn)有的標準數(shù)字鍵盤(手機、電話等設備所使用)如圖l的左半部分所示,為了充分利用數(shù)字鍵盤以結(jié)合上述構(gòu)思實現(xiàn)漢語拼音輸入的目的,可以對標準鍵盤稍做改動,使6個元音字母分別對應6個數(shù)字鍵,4個聲調(diào)分別對應其余的4個數(shù)字鍵,從而將聲調(diào)和韻母的輸入完全區(qū)分開來,并且以聲調(diào)輸入作為判斷一個拼音(單個字或整個詞組)輸入結(jié)束的標志。對于聲部的輸入,可以調(diào)整原數(shù)字鍵盤上部分數(shù)字鍵所對應的英文字母,使每個數(shù)字鍵上對應的幾個英文字母中的首字母均為漢語拼音的聲母。漢語拼音的聲母較數(shù)字鍵的數(shù)量有2倍多,除0鍵外的每個數(shù)字鍵都對應1個以上的聲母,因此在聲部輸入過程中,鍵入某個聲母所在的數(shù)字鍵后,還需要結(jié)合另一個鍵來表示該聲母在該數(shù)字鍵上的位置,稱為位置鍵。數(shù)字鍵盤上單鍵所在的聲母最多不超多三個,因此只要用兩個位置鍵分別表示中間和后面的位置就可以了。對位于鍵首的聲母,由于聲部的輸入為定長2鍵,因此可以輸入韻母的首字母來補足。注意位置鍵應該是元音字母鍵之外的其它鍵,避免二義性。根據(jù)上述構(gòu)思,本發(fā)明采用短韻母編碼,將漢語拼音韻母中所有包含非元音字母的韻母,都用元音字母編碼來表示(由于英文字母中沒有ii,因此根據(jù)慣例,用v來表示漢語拼音中的ii。漢語拼音方案的韻母表中有6個單字母韻母,即元音字母jaoeiuv};有l(wèi)l個只用上述6個元音字母的雙字母韻母,即bo,ai,ou,ei,ia,ie,iu,ua,uo,ui,ve},其中ve有時寫成ue,共有12個編碼。短韻母編碼方案中,每個韻母只用一個或者兩個元音字母的組合編碼來表示。除了釆用上述18個編碼外,對其它韻母給出了只用6個元音字母的特別編碼??紤]到某些韻母不會與相同聲母組成拼音,有兩個韻母共用相同編碼的情況,如ong和iong可以使用相同編碼。為了方便某些初學者,還可以對本發(fā)明做一些變通,例如,除了上述的18個單字母和雙字母的韻母之外,其它長度大于2的韻母可以按照至多3個元音字母的原則進行編碼,只需很少的編碼規(guī)則就能實現(xiàn)三元音韻母編碼,從而減輕對較長的韻母進行2鍵編碼的記憶負擔。拼音聲部分為3種情況9個數(shù)字鍵定義了9個單鍵聲母;18個雙鍵字母;6個模糊音聲母。對位于數(shù)字鍵首位的單鍵聲母,由于需要補足2位碼長,第2鍵可以借用韻母編碼首字母,而在隨后的韻部輸入過程中只輸剩余的韻母和/或聲調(diào)。拼音輸入完成后進入漢字重碼挑選時,可以直接利用現(xiàn)有技術中的重碼挑選方法,也可以自定義挑選方法,比如,如果直接輸入0鍵(該鍵上沒有字母)表示選擇候選字中最常用的(排在最前面的);否則要先輸入功能鍵表示拼音輸入結(jié)束,再通過數(shù)字鍵選擇候選的字、詞,以詞定字功能可選擇至多3個候選詞的首字或者尾字。對于部分字發(fā)音分不清的用戶,模糊音功能可以避免分別嘗試兩個近似拼音。模糊音采用與原來的兩個編碼不同的新編碼。對于能夠區(qū)分的拼音用原來的編碼(重碼率低),不能區(qū)分的才用新的模糊音編碼。這樣有利于用戶逐步提高區(qū)分模糊音的能力。在重碼率不高時省略部分輸入鍵,可以提高輸入速度。雙鍵聲母的全部韻母可以省略,單鍵聲母的韻母第二字母可以省略。詞組中非首字的雙鍵聲母也可以事先設置為省略,但不能同時省略前一個字的韻母和緊接在該字后的聲母。除了直接鍵入重碼挑選功能鍵來省略拼音或拼音串的末尾拼音聲調(diào)外,其它拼音聲調(diào)不能省略。單字輸入的聲調(diào)在重碼率低時也可以省略,但此時必須輸入拼音輸入的結(jié)束標志,如#鍵,翻頁鍵等非數(shù)字鍵,或者數(shù)字鍵按下時間較長表示重碼字挑選。本發(fā)明的技術方案明顯降低了拼音輸入的重碼率,單字和詞組的輸入效率大大提高。GB2312標準規(guī)定的字庫包括6763個字。如果多音字算多個字,有7809個漢字。經(jīng)過對GB2312字庫讀音表統(tǒng)計,不算音調(diào)的拼音有401個,區(qū)分音調(diào)后則有1302個。無調(diào)拼音平均每拼音對應近20個漢字,而有調(diào)拼音只有6個漢字,因此兩者的平均重碼率比例接近10:3。在利用計算機鍵盤輸入漢字時,一般使用無調(diào)拼音用字母鍵表示拼音,數(shù)字鍵表示候選字的序號,這樣可以通過兩種不通種類的按鍵省略拼音輸入結(jié)束標志。但對于數(shù)字鍵盤而,,由于只有數(shù)字和字母都在同一種按鍵中,且鍵數(shù)太少(10個),就必須在每次輸入結(jié)束后加上拼音輸入結(jié)束符。字母鍵盤能夠忍受每拼音近20個字的平均重碼率,其原因還在于計算機內(nèi)存足以容納較大詞組庫,且可以動態(tài)更新詞頻和加入新詞組。由于詞組輸入時重碼明顯比單字輸入減少,因此漢字輸入多數(shù)是詞組形式,少數(shù)是單字形式,且單字往往是常用字,排在候選字的前面。但目前手機類設備的詞組庫容量還有限,動態(tài)更新困難。因此,有調(diào)拼音將平均重碼率由約20個減少為6個,對數(shù)字鍵盤輸入法顯得更加重要。雙字詞組的重碼率理論上降低更多,是平方的關系,即100:9的比例。無調(diào)拼音shishi對應的詞組是重碼最多的之一,紫光拼音3.0的詞庫中有28個詞組。加兩個聲調(diào)變?yōu)橛姓{(diào)拼音后,多數(shù)沒有重碼;即使有重碼,重碼最多的2、4聲shishi只有6個。又如無調(diào)拼音yizhi對應的詞組有23個,加聲調(diào)后重碼最多的只有3個。音調(diào)的散列特性相對均勻,拼音輸入時不宜省略。除少數(shù)北方人聲調(diào)不準外,多數(shù)中國人發(fā)音的聲調(diào)是準確的。因此,采用具有聲調(diào)的漢語拼音編碼方法和漢字輸入方法,能大大降低重碼率,簡化輸入過程,提高輸入效率。對于需要進一歩提高輸入效率的專業(yè)級用戶,還可以將一些無效編碼利用起來,節(jié)省輸入鍵數(shù)。例如,對于漢字和數(shù)字混合輸入時,444丌頭表示輸入數(shù)字串,以#結(jié)束。對于一些事先設置(或稱為初始化設置),可以使用前綴數(shù)字鍵O表示臨時設置。例如,拼音輸入前附加0鍵,表示詞組輸入時省略后面字拼音的聲母;而該詞組輸入完成后,其它詞組輸入時沒有附加0鍵甜綴,則仍然要輸入聲母。圖l是電話機數(shù)字鍵盤與本發(fā)明一實施例數(shù)字鍵盤的對照,其中,左邊的是現(xiàn)有的標準鍵盤,右邊的是該實施例釆用的特殊鍵盤定義;圖2是計算器數(shù)字鍵盤與本發(fā)明另一實施例的對照,其中,左邊的是現(xiàn)有的計算機鍵盤中的數(shù)字鍵盤區(qū),或者稱為計算器數(shù)字鍵盤,右邊的是該實施例采用的特殊鍵盤定義;圖3是舉例說明詞組"技術"的輸入過程圖4是舉例說明詞組"軟件"的輸入過程。具體實施方式數(shù)字鍵盤的短韻母編碼輸入屬于特殊鍵盤定義下的漢語拼音輸入技術。電話機鍵盤定義見圖l,計算器鍵盤定義見圖2。以下結(jié)合圖1對本發(fā)明實施例進行詳細描述。如圖1所示,對標準的電話機鍵盤(左)略加改動,得到本實施例使用的特殊鍵盤(右)。其中,將聲母zh、ch、sh看作單字聲母^^,置于1字鍵上,5、7、9、0四個鍵表示聲調(diào),元音字母a、o、e、i、u、v分別位于其他數(shù)字鍵2、6、3、4、8、1上。鍵2的字母次序由ABC調(diào)整為BCA,鍵8為聲母TWS和韻母U的定義鍵,鍵7的末字母和鍵9的首字母相應舍去,減少到3字母。拼音輸入分為聲部和韻部輸入兩個部分,每個單字的拼音編碼長度為35鍵。聲部定長為2鍵,主要指聲母,還包括零聲母拼音時以韻母首字母作為聲部字母,以及單鍵聲母加一個韻母的類型;韻部為其余13鍵,主要指韻母和聲調(diào),也可能只有聲調(diào),或部分韻母加聲調(diào)。聲部輸入兩位數(shù)字漢語拼音聲部字母包括漢語拼音表所有聲母21個,加上iuv開頭的零聲母拼音對應的聲母yw,以及其它零聲母拼音的首字母aoe,共26個。這些字母統(tǒng)稱聲部首字母,其中三個雙字母聲母ZhChSh分別看成單個字母fd^。見圖l,列在各個數(shù)字鍵開頭的聲母,直接采用該數(shù)字鍵編碼,這9個聲母稱為單鍵聲母。例如Zh對應數(shù)字鍵l,B對應2,D對應3等等。聲部首字母如果不是列在各個數(shù)字鍵開頭的,需要兩位數(shù)字表示。前一位數(shù)字采用標有該聲部字母的數(shù)字,后一位數(shù)字采用位置鍵"7"表示位于中間,"5"表示位于木尾。例如,Ch對應的數(shù)字鍵編碼為17,Sh對應15,C對應27,A對應25等等。由于韻母首字母為元音,只會使用數(shù)字鍵123468,而不會用到5和7鍵。因此,雙鍵方式的聲部首字母,不會與單鍵聲母加一個韻母的編碼混淆。如果用"字母一數(shù)字"串起來表示漢語拼音聲部字母與數(shù)字鍵的對應關系,這種對應關系如表1所示。單鍵聲母Zhl,B2'D3,G4,J5,M6,P7,T8'X99個雙鍵Chl7,Shl5,C27,A25,E37,F35,H47,145,K57,L55,N67,065,Q77,R75,W87,S85,Y97,Z9518個模糊音FH39,GK49,LN59,ZZh99,CCh29,SSh896個表1——前兩個數(shù)字編碼表<table>tableseeoriginaldocumentpage8</column></row><table>從表中可以看出,聲部首字母多數(shù)需要用兩個數(shù)字鍵表示,但有9個只需要用一位數(shù)表2枚舉了所有兩位9鍵編碼的情況,其中行首數(shù)字表示數(shù)字鍵編碼的第1位,列首數(shù)字表示數(shù)字鍵編碼的第2位,例如鍵編碼31對應dv,是拼音duan經(jīng)短韻母編碼為dvu后的前兩個字母,其中,vu是對uan進行2位數(shù)短韻母編碼的結(jié)果。表格中"一"表示編碼結(jié)果為不存在的拼音,例如44=gi不存在;"?"表示未定義編碼,如19,69,79等;加下劃線的是供高級用戶使用的參考定義,初學者可以不用。對零聲母拼音er特別編碼為i,數(shù)字編碼為45。不存在的拼音編碼和未定義編碼統(tǒng)稱無效編碼。對于高級用戶,還可以將一些無效編碼利用起來,節(jié)省輸入鍵數(shù)。無效編碼44,可以作為特殊符號輸入起始標志,具體定義為,441表示標點符號輸入(顯示符號數(shù)字對應關系,單鍵),442表示小寫字母字符串輸入,443表示大寫字母字符串,444表示數(shù)字串輸入,以ft表示串輸入結(jié)束。<table>tableseeoriginaldocumentpage9</column></row><table>表2前兩個數(shù)字編碼表追求高效輸入的用戶可多記一些特殊編碼,將無效編碼做一些變通。由于ja和je是不存在的拼音,以52和53分別表示jia和jie不會產(chǎn)生歧義。不存在的拼音bv,可以21表示bian,這是b開頭對應字數(shù)最多的拼音之一;或者表示常用字"不",這兩種選擇究竟選誰可以事先設置好。利用無效編碼形成的特別編碼能提高效率,但學習難度增加,初學者可以忽略。對于無效編碼的高級定義,軟件上提供屬性設置功能,用戶可以自由修改定義。單鍵聲母輸入明顯比其它聲母輸入容易。對于國標字庫GB2312統(tǒng)計的7809個字(多音字算多個字),26個聲母編碼平均字數(shù)約300字,單鍵聲母除P為280字外,其它聲母編碼的字數(shù)均高于平均數(shù)。字數(shù)排在第3的L雖然雙鍵,但連擊5鍵兩次,比其它雙鍵還是方便一些。聲母Q編碼77也是因為字數(shù)較多??紤]到"和了"是很常見的單字(難以組詞),特別設立"4700和5500了"編碼來表示,無需選字。四鍵常用字還可以增加一些特別定義。韻部輸入韻部包括韻母和聲調(diào)。聲調(diào)分別采用{5,7,0,9}表示1234聲(陰平、陽平、上聲、去聲),即"—v\",而輕聲采用0鍵表示,與上聲用相同的數(shù)字。數(shù)字鍵盤輸入拼音時,鍵入的第3個數(shù)字如果是化2,3,4,6,8}之一,表示韻母編碼:如果是{5,7,0,9}之一,表示是聲調(diào),如bi=240。聲調(diào)是韻部的末位鍵,也兼作一個拼音的結(jié)束標志,若聲調(diào)前面沒有韻母,表示省略了韻母,如詞組"參加"省略"參"的韻母表示為c—jia=275542。單鍵聲母非常直觀,不能省略。詞組中除首字外,省略雙鍵聲母是可以的,但需要事先設置省略聲母功能,或者加拼音前綴O鍵表示臨時省略。詞組首字的拼音一般不省略。除了拼音結(jié)束符tt號前的聲調(diào)可省外,其它聲調(diào)不能省略。兩字母韻母中的次字母可省略兩鍵聲母時,全部韻母都可省略,以聲調(diào)表示該字的拼音輸入結(jié)束。省略韻母在詞組輸入時可以明顯減少擊鍵次數(shù),也能有效避開不準確的韻母。利用詞頻動態(tài)調(diào)整功能,輸入省略的拼音編碼,就能夠快速輸入剛剛用過的詞組。省略后一般每字3鍵(或4鍵),如果僅有兩個鍵,會認為是"單韻母加聲調(diào)"而不是"單聲母加聲調(diào)",不然會產(chǎn)生混亂。不過號鍵前面的字(單字或詞組的末字),也許可以省略到僅l個單鍵聲母,此時兩個鍵會優(yōu)選雙鍵聲母,除非事先設置了省略聲母選項??梢允÷缘牡胤胶芏啵脩艨梢愿鶕?jù)重碼率多少的經(jīng)驗適當選擇省略成分。雙字拼音一般只省略一處;單字僅在常用字輸入時省略。<table>tableseeoriginaldocumentpage10</column></row><table>表3短韻母編碼規(guī)則表韻部可以采用三元音韻母編碼方案。除了純元音漢語拼音韻母采用原形外,其它韻母可以按照至多3元音字母的定義,制定3條規(guī)則V^g;i=er;所有以n結(jié)尾的韻母,將韻母靠近n的元音字母重復,如AA,,EE=en,II-in,UU,,磁=,,VAA=van,IAA=iem等。規(guī)則V=ng的例子,除了如表3規(guī)則4所示的例子,還包括IAV二iang和I0V=iong等。所有三字母編碼列舉如下IA0,IAA,IAV,I0V,UAI,UAA,UAV,VAA。雖然三元音韻母編碼方案比較簡單,畢竟鍵數(shù)較多。在用戶略微熟練后,這8個三字母編碼都改由兩個字母的編碼表示,即采用短韻母編碼方案。這兩種韻母編碼方案在本數(shù)字鍵盤輸入法中的兼容性較好,可以混用而無需特別指明。本發(fā)明主要以短韻母編碼方案來介紹。韻部采用短韻母編碼,只用六個元音字母aeiouv,組成的一到兩個字母的組合,共有42種組合方式,足以表示漢語拼音的所有韻母。31個短韻母編碼規(guī)則如表3所示。規(guī)則l、2的18個編碼與原來的漢語拼音韻母相同,占大多數(shù)。元音加n的韻母,如an,en,in,un,用規(guī)則3,將首字母重復;元音加ng的韻母,如ang,eng,ing,ong,用規(guī)則4,以v代替ng;對于uang、uai、uan和van,增加規(guī)則"以v代替前面的ua";規(guī)則7、8和9為特殊編碼。規(guī)則4、5、6中v有兩種指代,如果v出現(xiàn)在韻母編碼開頭,貝ijv-ua;如果v出現(xiàn)在韻母編碼尾部,v-ng.由以上規(guī)則,可得到編碼到韻母的對照如表4所示,其中等號表示對應關系,如AA=an,表示編碼AA對應的韻母是an;"*"星號表示無效編碼;空白位置是保留的編碼。<table>tableseeoriginaldocumentpage11</column></row><table>表4編碼到韻母對照表五個韻母模糊音盡量在8個無效編碼中選。定義an/ang-AU,en/eng=EU,即首字母加U;定義in/ing:VI,ian/iang=V0,S卩V加in和ian的短韻母編碼首字母;定義uan/uang-VA,這是V開頭的最后一個無效編碼了。注意到uai也使用VI編碼,但它與in/ing不會使用相同聲母,可以共用相同編碼VI。重碼挑選和詞組輸入在本實施例中,使用鍵作為拼音輸入結(jié)束標志,此后就轉(zhuǎn)入選字狀態(tài)??梢栽诼曊{(diào)輸入結(jié)束后直接加o鍵表示選擇候選字中的頭一個,而無須在o前面加結(jié)束符號"#"鍵。例如,字頻最高的漢字"的",采用de0-3300表示。對于詞組,顯示至多3個詞分別由U,2,3r來選中相應的詞,{4,5,6}選中相應詞的首字,{7,8,9}選中相應詞的尾字。對于單字,相應的數(shù)字選相應次序的漢字。例如,拼音shi2shi4對應詞組有"實事、時事、時勢"等,#1的分別表示"實事,時事,時勢,實,時,時,事,事,勢"。編碼舉例如見圖3所示,輸入兩個字的詞組"技術",拼音為jishti,編碼為5491589tt,編碼依據(jù)是5表示JKL5之單鍵首字母;4表示韻母I(韻母只用123468);9表示去聲"\"聲調(diào)(5709之一);15表示ZhChShVl中的最后聲母Sh,其中l(wèi)為鍵上的數(shù)字,5為位置鍵,表示聲母串ZhChSh次序的最后一個(若是7表示選擇Ch);8表示"術"的韻母U;9表示"術"的去聲"\"聲調(diào);tt號表示準備候選詞。編碼輸入結(jié)束后,候選詞"l技術2計數(shù)3記述"會顯示出來,輸入1選擇。如果要選擇單字,則不選U,2,3h首字選456(技4計5記6),尾字選789(術7數(shù)8述9)。這是"以詞定字"功能。如果有些用戶分不清楚Sh和S,可以采用模糊音,拼音編碼為549898卯,前面的89表示S和Sh之中任意一個,而S編碼為87,Sh編碼為15。模糊音采用新的編碼89,與原來的兩個編碼87和15不同。候選詞組會多出一個"寄宿",重碼率有所提高。如果沒有模糊音功能,用戶只能先試試jisfi找不到,再試試jishti才找到。模糊音另外編碼的好處在于,對于部分字發(fā)音s和Sh分不清的用戶,能夠確定是S(或Sh)的那些字可以直接用87(或15),無法確定的才用模糊音特別編碼,對能夠確定的場合重碼率會降低。對"技術"這個例子,可以省略韻母,拼音為"jish"',候選詞組會增加"寄售、紀事"等。不過,有些詞并不會增加重碼,如"吃飯chlf"'。另外,對于"jijO寄居",單韻母u配單鍵聲母j,如果只省略u而沒有省略聲調(diào)則誤認為"jil",容易產(chǎn)生二義性。末尾的U1可以一齊省略,輸入"、UJtt"則沒有二義性。在附圖3中,有些鍵的右邊是開口的,表示可以省略的鍵。如果前后兩個可省略鍵的下邊相連,表示要省都得省。如果事先設置了省略雙鍵聲母,對"技術"這個例子,拼音為"jiQ",候選詞會增加"既不、季度、忌妒、繼父、記錄"等。不過,有些詞并不會增加重碼,如"擊敗jidi"。見附圖4。輸入"軟件=ru5njiem"這個例子中,編碼751805649tt,聲母R以75表示,5為PQR位置鍵;韻母uan的短韻母編碼為VL',對應18;上聲聲調(diào)編碼為O;聲母J是單鍵聲母,以7表示;韻母ian的短韻母編碼為Ol,對應64;去聲聲調(diào)編碼為9;#是拼音結(jié)束標志。韻母uan的編碼可以省略;韻母ian的編碼只能省略后面數(shù)字4,不能省略6;末尾ian4可以全部省略,即編碼751805#。如果用模糊音韻母uan/uang-VA,編碼為751205649#。對于上述短韻母編碼雖然相對易學,但有些不愿意學習或者學習有困難的用戶,除了三元音韻母編碼外,還可以采用韻母首字母加音調(diào)的方法(可稱為首字母法),或者省略掉韻母中所有非元音字母的方法(可稱為留元音法)。例如,拼音"段dudn"首字母法編碼為ck^=389,而留元音法編碼為dua、=3829。采用首字母法的拼音碼長34鍵,重碼率往往高于無調(diào)拼音,輸入詞組時重碼率能夠忍受;留元音法的拼音碼長36鍵,各編碼的重碼率差別明顯增加。"以詞定字"功能在拼音類輸入法中很常見,先用詞組拼音輸入,再從候選詞組中挑選單字。例如"時"的重碼很多,"時刻"重碼就很少,待詞組"時刻"出現(xiàn)在備選框中時,再使用{4,5,6}之一來選擇首字。本發(fā)明主要針對數(shù)字鍵盤。不過短韻母編碼也可以用于英文字母鍵盤,而且規(guī)則更簡單一些。主要是聲母無需特別編碼,沿用漢語拼音方案,僅僅使用短韻母。應該將聲調(diào)定義為字母鍵以外的其它鍵,如四個鍵(;,{[,'",}])分別表示四個聲調(diào)(—,',v,》,從而以聲調(diào)為字間標識。在沒有強制輸入聲調(diào)時,零聲母拼音需要在前面加o,如oa,oou,oe等,否則無法切分詞組中各字的拼音。對于特別韻母er,其特別編碼考慮用oiu更加易于切分且比較順手,這與數(shù)字鍵盤的編碼不同。針對PC鍵盤右側(cè)的數(shù)字鍵盤區(qū),其定義按照計算器鍵盤布局,與前面所述電話機數(shù)字鍵盤有所不同。參見圖2,為本發(fā)明另一實施例中定義的特殊鍵盤,其中,只有中間的456鍵位置相同,計算器鍵盤上面一行789鍵表示內(nèi)容與電話機鍵盤上面一行123鍵相同。計算器鍵盤下面一行123鍵表示內(nèi)容與電話機鍵盤上面一行789鍵相同。上面針對電話機鍵盤的描述,將123鍵與789鍵的字母定義對調(diào)一下,并且以小數(shù)點鍵(也稱為Del鍵)代替ft號鍵,就能推廣到計算器鍵盤上。短韻母編碼的平均碼長,比全拼方案少不了太多。然而短韻母編碼的特點主要不在平均碼長,而是規(guī)則簡化,字母個數(shù)相對整齊,并且可以邊想邊輸入。無論字母鍵盤,還是數(shù)字鍵盤,都有良好表現(xiàn)。推薦國標GB/T18031對數(shù)字鍵盤編碼的要求是"應包括GB2312或GB13000.1或GB18030中定義的全部漢字字符"。它們對應的字數(shù)分別是6763字、20902字和27533字。GB/T18031規(guī)定"輸入漢字的編碼元素,設定在09的數(shù)字鍵范圍內(nèi)"。不能使用其它功能鍵作為編碼,如翻頁鍵只能作為挑選候選字時使用,不能作為編碼元素。漢字輸入平均碼長定義為,在輸入給定的測試樣本時,測出的輸入每個漢字的平均擊鍵次數(shù)。計算公式平均碼長:輸入樣本的擊鍵次數(shù)/測試樣本總字數(shù)(鍵/字)。GB18031針對數(shù)字鍵盤給出的指標,逐字字段輸入時平均碼長至多每字6鍵;字、詞混合輸入時平均碼長至多每字4鍵。重碼字詞鍵選率定義為在輸入給定測試樣本過程中,通過重碼選擇鍵確認的漢字字數(shù)與測試樣本總字數(shù)的百分比。計算公式重碼字詞鍵選率=(重碼選擇鍵確認的字數(shù)/測試樣本總字數(shù))X1001GB/T18031針對數(shù)字鍵盤給出的指標,逐字字段拼音輸入(IO鍵位)時平均碼長至多每字13鍵,字詞混合拼音輸入時至多12鍵。這個指標一般不難達到。下面以公式形式描述本發(fā)明的漢字輸入過程,每個公式后面的漢字部分是解釋。SR={PYn+TX};輸入SR分為拼音PY和挑選TX兩個部分,可以多個PY加一個TX;PY={SB+YB};拼音PY分為聲部SB和韻部YB兩個部分;SB={SM19+(YM/WZ57/MH1)};聲部兩個數(shù)字,前面數(shù)字為19之一,表示各數(shù)字鍵首字母(缺省);后面數(shù)字若為{1,2,3,4,6,8}之一表示韻母首字母,若為7或5意味著聲部兩個數(shù)字表示一個聲母;若為9表示模糊音聲母。YB={YD1/{YMn+YD}};韻部可以是l個數(shù)字,取值范圍是{5,7,0,9},表示音調(diào)YD;也可以是n+l個數(shù)字,表示n個韻母字母YM加音調(diào)YD,YM取值范圍是U,2,3,4,6,8}.對于短韻母編碼11=12;三元音韻母編碼和留元音韻母編碼rFl3;首字母法1!=1.TX={tt+SZ}/W+FY+SZ}/{0};表示以#結(jié)束,用數(shù)字鍵SZ選中一個候選者;或者翻頁FY后直到候選字出現(xiàn)后,才通過數(shù)字鍵SZ其中選一個候選者;或者直接以O鍵結(jié)束,表示選擇候選者中排在最前面的那個。實際上,io個數(shù)字鍵之外的任意鍵也可以作為拼音輸入結(jié)束鍵,特別是翻頁鍵通過加長按鍵時間來表示選擇候選字的序號,也可以省略結(jié)束標志,減少擊鍵次數(shù)(但輸入花費的時間也許更長,適合部分用戶)。由于聲部首字母取值不為O,可以加前綴O,表示本拼音輸入采用一些臨時設置,臨時生效的內(nèi)容可以是一些事先設置內(nèi)容的相反狀態(tài)。前綴為O也可以表示其它的特殊模式,比如表示詞組輸入時每字僅由聲部2鍵組成,省略了所有韻部。權利要求1.一種數(shù)字鍵盤漢語拼音輸入方法,包括聲部輸入步驟,輸入為定長的2個鍵,包括兩種情況位于數(shù)字鍵首位的聲母即單鍵聲母,其輸入包括該單鍵聲母所在的數(shù)字鍵和韻母首字母所在的數(shù)字鍵;位于數(shù)字鍵第二、三位的聲母即雙鍵聲母,其輸入包括該雙鍵聲母所在的數(shù)字鍵和用于表示該聲母在所述數(shù)字鍵上的位置的另一鍵;韻部輸入步驟,輸入1至3個鍵,包括韻母和聲調(diào)輸入兩部分,采用特殊編碼方法將所有漢語拼音韻母用元音字母表示,6個元音字母分別對應6個數(shù)字鍵,其他4個數(shù)字鍵表示4個聲調(diào),用聲調(diào)鍵或其它功能鍵的輸入來表示單個字或整個詞組拼音輸入的結(jié)束。2.如權利要求1所述的方法,其特征在于,還包括重碼挑選歩驟,用一指定的數(shù)字鍵表示選中所有重碼字或詞中的首選者,用另一指定的功能鍵表示開始選擇其他重碼字或詞。3.如權利要求2所述的方法,其特征在于,拼音輸入結(jié)束后,按照顯示的字或詞與數(shù)字的對應關系,通過數(shù)字鍵選擇,可以對至多3個候選詞提供6種以詞定字功能的選字可能。4.如權利要求l所述的方法,其特征在于,在聲部輸入的步驟中,將翹舌音聲母zhchsh定義為單個字的聲母,在所述的數(shù)字鍵盤上分別用i(f^表示。5.如權利要求1所述的方法,其特征在于,所述的特殊編碼方法包括三種情況6個單字母韻母分別用元音字母a、o、e、i、u、v表示;ll個雙字母韻母分別用上述6個元音字母的組合來表示;上述17個韻母之外的韻母采用1到2個元音字母的特別組合來表示。6.如權利要求l所述的方法,其特征在于,在連續(xù)輸入多個漢語的拼音串時,可選省略部分數(shù)字鍵,省略原則包括詞組拼音的非末字的聲調(diào)不能省略,而各字拼音的部分或全部韻母可以省略,非首字的聲母可以事先設置為全部強制省略,拼音串加前綴O鍵表示臨時設置為與事先設置的省略規(guī)則相反的規(guī)則,本拼音輸入結(jié)束后失效。7.如權利要求1所述漢語輸入方法,其特征在于,對ll個模糊音,包括6對聲母模糊音和5對韻母模糊音,采用不同于各個模糊音聲韻母編碼的新編碼。8.—種用于權利要求17中任一項的數(shù)字鍵盤,其特征在于,所述鍵盤上的10個數(shù)字鍵分別對應a、o、e,i、u、v六個元音字母和4個聲調(diào)。9.如權利要求8所述的數(shù)字鍵盤,其特征在于,所述鍵盤上除了0以外的9個數(shù)字鍵上,均有2至3個表示拼音聲母的字母,其中有9個聲母分別位于這9個數(shù)字鍵的首位。10.如權利要求8所述的數(shù)字鍵盤,其特征在于,所述的鍵盤上用2(f^分別表示zh、ch、shc全文摘要一種數(shù)字鍵盤漢語拼音輸入方法,包括聲部輸入步驟輸入定長的2個鍵,有兩種情況位于數(shù)字鍵首位的聲母即單鍵聲母,其輸入包括該單鍵聲母所在的數(shù)字鍵和韻母首字母所在的數(shù)字鍵;位于數(shù)字鍵第二、三位的聲母即雙鍵聲母,其輸入包括該雙鍵聲母所在的數(shù)字鍵和用于表示該聲母在所述數(shù)字鍵上的位置的另一鍵;韻部輸入步驟輸入1至3鍵,包括韻母和聲調(diào)輸入兩部分,采用特殊編碼方法將韻母用元音字母表示,6個元音字母分別對應6數(shù)字鍵,其他4個數(shù)字鍵表示4個聲調(diào),用聲調(diào)鍵或其它功能鍵的輸入表示單字或詞組拼音輸入的結(jié)束。有調(diào)拼音將平均重碼率由約20個減少為6個,因此本發(fā)明明顯降低了拼音輸入的重碼率,單字和詞組的輸入效率大大提高。文檔編號G06F3/023GK101118463SQ200610089130公開日2008年2月6日申請日期2006年8月4日優(yōu)先權日2006年8月4日發(fā)明者方貴明,重鄭申請人:中國科學院軟件研究所