專利名稱:漢字拼音編碼輸入法(藝峰輸入法)的制作方法
技術領域:
本發(fā)明是關于使用中文信息處理系統(tǒng)處理中文信息時對漢字進行編碼輸入的方法,具體地說就是關于使用漢語拼音作為編碼將漢字輸入中文信息處理系統(tǒng)。
先有技術描述長期以來,漢字的編碼輸入在電子計算機中文信息處理中一直是一個亟待解決的難題,也是中文信息處理研究的重點。目前采用的方法有整字輸入和字形輸入。整字輸入法類似于中文打字的方法,其設備也相似,它是做一個能容納所有漢字的鍵盤,輸入時,在盤上找到所需輸入的漢字并鍵入。這種方法需要復雜的設備,同時輸入速度較慢,需要培訓專門的操作人員。
字形輸入法是將漢字按一定規(guī)則拆開,取其組字頻度最高的部分作基本部分,輸入時按規(guī)則鍵入漢字的各部分即可。拆字的方法有許多種,可以自由選擇,字形輸入法的鍵盤比整字的鍵盤小許多,從而節(jié)省了設備,但它的組字方法比較復雜,且不易掌握,鍵盤越小,字鍵越少,組字的方法就越復雜,規(guī)則就越多。這樣就需要培訓專門的操作人員,不利于普及應用。
發(fā)明概述本發(fā)明是采用人所共知的漢語拼音作為其編碼輸入的編碼,每個漢字只要按其普通話語音將由拉丁字母代表的拼音的聲母和韻母鍵入拉丁文鍵盤或聲韻母鍵盤,就可實現(xiàn)漢字的編碼輸入。還可以將詞組的拼音鍵入,實現(xiàn)詞組的編碼輸入,以減少同音異義字的出現(xiàn)。
較佳實施方法的詳述一九五八年第一屆全國人民代表大會第五次會議通過和批準的《漢語拼音方案》中對漢語拼音訂立了下列原則1.漢語拼音是以北京語音為標準音,以北方話為基礎的典型現(xiàn)代語音規(guī)范;
2.因-漢字代表-音節(jié),故漢語拼音方案采用音素制的音節(jié)結(jié)構(gòu);
3.以國際通用的羅馬字母(拉丁字母)作為拼音方案的字母。
該方案還規(guī)定了組成漢字拼音的21個聲母和35個韻母,它們是聲母b、p、m、f、d、t、n、l、g、k、j、q、x、h、zh、ch、sh、r、z、c、s。
韻母a、o、e、i、u、ü、ai、ei、ao、ou、au、eu、ang、eng、ong、ia、ie、iao、iou、ian、in、ian、ing、iong、ao、uo、uai、uei、uan、uen、uang、ueng、üe、üan、ün。聲母既為輔音,韻母就是除聲母之外的部分。另外,該方案還規(guī)定了普通的四聲陰平一、陽平
、上聲
、去聲
,輕聲不標。
本發(fā)明就是以根據(jù)上述規(guī)則得出的《普通話語音表》中的拼音作為輸入編碼。每個中文字的普通話語音都是由其聲母、韻母及聲調(diào)所組成,為了減少輸入碼的長度及與英文字母相類似,因此撇開了聲調(diào),而只用以拉丁字母表示的聲母,韻母所組成的拼音作為輸入碼,當遇到有同拼音異義字時,所有的同音字將會顯示出來,供操作人員選擇。
當使用拉丁字母鍵盤輸入漢字拼音編碼時,每個拼音字母逐一輸入。例如輸入拼音pian時,按“p”、“i”、“a”、“n”鍵。
當使用聲、韻母鍵盤輸入漢字拼音編碼時,按對應的聲母、韻母鍵,例如輸入拼音pian時,按“p”、“ian”鍵。
為了方便用戶,特別設計了幾種輸入形式1.單字輸入。上面所提及的即為單字輸入形式,當中文信息系統(tǒng)進入漢字輸入狀態(tài)時,系統(tǒng)自動接收單字輸入,每個中文字都需用其拼音碼來輸入。當遇有同拼音異字時,同拼音字將會顯示出來,讓使用者選擇其所需的字。例如當輸入拼音碼CUN時,就顯示單字村、存、忖、寸、吋、皴等。
2.詞組輸入。經(jīng)過分析,中文句法基本上是單字與兩字詞組的混合,單字拼音碼常會遇到同拼音異字的情況,然而雙字組成的詞組拼音碼則較少同音詞。使用詞組輸入可減少使用者輸入拼音碼后,再需選擇字的情況。進入詞組狀態(tài)后與單字輸入法相似,使用者將詞組拼音碼輸入,詞組拼音碼都是詞組兩字的拼音。例如詞組“我們”的拼音碼就是由“我”的拼音“wo”和“們”的拼音“men”所組成,即是“women”。
使用詞組輸入時,詞組的兩個字同時輸入系統(tǒng)中,當有同拼音異詞時,同拼音詞組將會顯示出來,供操作人員選擇,詞組與單字一樣,都是預先儲于中文系統(tǒng)內(nèi)字庫中的。
3.常用字輸入。中文中有許多字是經(jīng)常用到的,因此常用字輸入可幫助使用者快速輸入常用字,提高速度。根據(jù)《漢字綜合頻度表》,現(xiàn)選擇了39個常用單字,它們是的、以、是、在、了、不、和、有、大、這、主、中、人、上、為、們、地、個、用、工、時、要、動、國、產(chǎn)、零、一、二、三、四、五、六、七、八、九、十、百、千、萬。
當輸入常用字時,使用者用常用字鍵直接輸入常用字。一般均由一字母鍵代表一常用字,例如常用單字“的”的對應鍵可用d鍵表示。
4.縮寫字輸入。許多常用的名稱都有其簡稱和英文縮寫??s寫字輸入就是將常用名稱的縮寫字母輸入,代替正常的拼音輸入,提高速度,對于一些使用頻度較高的詞組也可采用縮寫字母形式輸入。所有的縮寫碼和對應的中文名稱及詞組均是預先儲于中文系統(tǒng)內(nèi)字序中的,為了避免輸入碼過長,規(guī)定了所有縮寫字母最多不超過4個字母。例如當輸入縮寫碼CAAC時,即可顯示出中國民航總局的字樣。
5.國標碼輸入。熟識漢字國標碼使用者,可采用國標碼來輸入中文字。所謂國標碼,就是根據(jù)GB2312-80《信息交換用字漢字編碼字符集》中對日常使用的6763個漢字所規(guī)定的4位數(shù)字碼。這四位數(shù)字的首兩位為區(qū)碼,尾兩位為區(qū)碼,例如國標碼為“1706”的對應漢字就是“寶”。采用國標碼輸入就是將代表一漢字的國標碼輸入便可實現(xiàn)該漢字的輸入,當系統(tǒng)進入國標碼輸入時,它接受國標碼輸入中文字。
6.電報碼輸入,熟識電報碼的使用者,可用電報碼來輸入中文字,進入電報碼輸入狀態(tài)后,系統(tǒng)接受電報碼輸入中文字。所謂電報碼就是根據(jù)《標準電碼(修訂本)》對日常用的約7000字所訂的4位數(shù)字碼。例電報碼1405中文字寶使用者還可以根據(jù)自己的需要,增加中文信息處理系統(tǒng)中字庫的中文單字,詞組和縮寫詞句,名稱。
當增加單字時,使用者需將字形和該字的拼音碼輸入系統(tǒng)中。當增加詞組時,使用者需將詞組的拼音字輸入系統(tǒng)中。當用戶增加中文系統(tǒng)的縮寫名稱和縮寫詞組時,需將縮寫字母及所表示的詞組或名稱輸入系統(tǒng)中。
權(quán)利要求
1.一漢字編碼輸入法,其特征為將每一漢字按其拼音編碼通過鍵盤輸入中文信息處理系統(tǒng)。
2.權(quán)項1中所要求的漢字編碼輸入法,其進一步特征為采用現(xiàn)通用的《漢語拼音方案》作為所說的漢字拼音編碼的基礎。
3.權(quán)項1中所要求的漢字編碼輸入法,其進一步特征為在拉丁文鍵盤上將代表漢字的拼音編碼逐字母地輸入,以實現(xiàn)中文信息的輸入。
4.權(quán)項1中所要求的漢字編碼輸入法,其進一步特征為在聲、韻母鍵盤上輸入代表漢字的拼音編碼,以實現(xiàn)中文信息的輸入。
5.權(quán)項3或權(quán)項4中所要求的漢字編碼輸入法,其進一步特征為鍵入詞組的拼音編碼,可實現(xiàn)詞組的輸入,從而減少了同音異義字的出現(xiàn)。
6.權(quán)項3中或權(quán)項4所要求的漢字編碼輸入法,其進一步特征為對使用頻度較高的幾個單字可在鍵盤上一次直接鍵入。
7.權(quán)項3中所要求的漢字編碼輸入法,其進一步的特征為對一些常用名稱和詞組可按其縮寫碼輸入。
8.一漢字輸入系統(tǒng),其特征為所說的系統(tǒng)可接受拼音編碼輸入、國標碼輸入、電報碼輸入和縮寫碼輸入。
專利摘要
在中文信息處理系統(tǒng)中,采用以普通話為標準音的漢字拼音作為漢字輸入的編碼,再按拼音的拉丁字母或聲、韻母鍵入中文信息處理系統(tǒng)。也可將詞組的拼音碼鍵入中文信息處理系統(tǒng),實現(xiàn)詞組的輸入,還可采用國標碼輸入、電報碼輸入和一些常用名稱及詞組的縮寫碼輸入。
文檔編號G06F3/023GK85101055SQ85101055
公開日1987年1月24日 申請日期1985年4月1日
發(fā)明者吳漢杰 申請人:藝達電腦有限公司導出引文BiBTeX, EndNote, RefMan