專利名稱:規(guī)范五形編碼方案及其中文鍵盤設(shè)計(jì)的制作方法
自五筆誕生以來,二十年的中文信息輸入的實(shí)踐來看,現(xiàn)在中文信息輸入的格局是職業(yè)錄入人員用五筆輸入,非職業(yè)錄入人員用拼音輸入,且拼音帶有智能化的趨勢(shì),總體看拼音占有一定的優(yōu)勢(shì)。這樣的中文輸入格局非常不適應(yīng)中國(guó)信息化的進(jìn)程,也非常不利于中華漢字的傳承,更不利于漢字的發(fā)揚(yáng)光大。
從五筆的實(shí)踐來看,五筆破壞了漢字的美學(xué)規(guī)律,將漢字肢解的支離破碎。如“長(zhǎng)”分解為“丿七、”是人們不能接受的。所以,五筆至今為我國(guó)的漢學(xué)家所不容,稱其是“計(jì)算機(jī)對(duì)漢字的最大病毒”。這也是五筆二十年推廣遇到的最大阻礙,五筆的客戶群只能限定于職業(yè)打字員領(lǐng)域,而非適用于普遍的計(jì)算機(jī)用戶,也是五筆進(jìn)不了中小學(xué)信息技術(shù)課程的最根本原因,人們至今對(duì)拼音輸入念念不忘。
中國(guó)的語言文字需要現(xiàn)代化,需要信息化,這是中國(guó)與時(shí)俱進(jìn)的時(shí)代要求,也是中國(guó)語言文字必須做好和必須完成的歷史使命。,中文信息工程是漢語漢字文化和IT技術(shù)的有效結(jié)合。
中國(guó)人有沒有漢字信息化輸入的障礙?我們中國(guó)人在學(xué)習(xí)和使用計(jì)算機(jī)時(shí),卻不得不多學(xué)一樣枯燥而又十分重要的技能,這就是漢字輸入。漢字輸入看似一項(xiàng)簡(jiǎn)單的技能,但要想“輸”得隨心所欲,“輸”得痛痛快快,卻又不是一件簡(jiǎn)單的事。
現(xiàn)代社會(huì)已日趨信息化,但作為國(guó)家信息化基礎(chǔ)工程的漢字編碼技術(shù),一直沒有得到很好有效的解決。
西方人在文字錄入方面不存在障礙,但中國(guó)人在漢字輸入方面存在一定的障礙。一類是拼音用戶的心理障礙,常聽人說“這么多l(xiāng)i(李)。”不停地翻頁是拼音用戶揮之不去的心魔。拼音解決不了漢字問題。另一類是速度障礙。從理論上說,信息化給人類帶來了革命性的高效率。鍵盤“寫字”的高效率取代了傳統(tǒng)的手寫。這在西方已經(jīng)驗(yàn)證了。但是,中國(guó)計(jì)算機(jī)用戶中有60%的用戶打字的速度沒有手寫快,這是中國(guó)信息化進(jìn)程中的一種倒退。這可是大問題了!嚴(yán)格地說,漢語拼音不屬中文信息標(biāo)準(zhǔn)范疇因?yàn)橹形臎]有類似于日文的法定注音字母文字---假名。漢語拼音只是中文漢字的注音符號(hào),它不是法定漢字。必須運(yùn)用文字學(xué)基本理論對(duì)中文信息進(jìn)行管理。
中文現(xiàn)在有兩套符號(hào)標(biāo)準(zhǔn)一個(gè)是漢字部件、一個(gè)是漢語拼音,究竟哪個(gè)更適合信息時(shí)代發(fā)展的需要?哪個(gè)更能加強(qiáng)中文信息化的競(jìng)爭(zhēng)力呢?哪個(gè)更符合中國(guó)漢字的本質(zhì)?中文走拼音化道路是此路不通。拼音處理計(jì)算機(jī)漢字比計(jì)算機(jī)處理英文要慢得多,拼音在中文信息處理上無法與英文制式競(jìng)爭(zhēng)。
從中文特點(diǎn)考慮,中國(guó)非常需要發(fā)展自己的整套中文信息工程標(biāo)準(zhǔn)。中國(guó)非常需要有自主知識(shí)產(chǎn)權(quán)的中文信息工程的核心技術(shù)。以提高中國(guó)信息化競(jìng)爭(zhēng)力和效能。只有形碼的漢字處理水平超過英文制式,形碼中文輸入比英文輸入快得多。開發(fā)規(guī)范(標(biāo)準(zhǔn))、實(shí)用、高效的形碼技術(shù)是打造中文信息工程核心技術(shù)的一個(gè)重要環(huán)扣,不可或缺。
現(xiàn)在輸入法較多,但大多是低水平、低技術(shù)的重復(fù)。缺乏精品力作。軟件開發(fā)要有精品意識(shí),寧缺勿濫。五形由先進(jìn)統(tǒng)計(jì)語言模型(CIDM)智能擎引,將中文錄入提升到人工智能階段。
已經(jīng)有了拼音輸入法,有開發(fā)形碼的必要嗎?安徽大學(xué)著名漢學(xué)專家王光漢教授曾指出我不主張用拼音打字,尤其是我們的孩子!因?yàn)槠匆舨皇菨h字的最終選擇。拼音是漢字的表象因素,不是漢字的本質(zhì)特征。因?yàn)闈h字是象形文字,不同于類似英語的音素文字。為了中華文明的傳承,為了漢語漢字的發(fā)揚(yáng)光大,我不主張我們的孩子用拼音打字,因?yàn)檫@會(huì)讓我們的孩子逐漸地形成某種定向思維。使得我們的孩子,逐步遠(yuǎn)離漢字的“形”,只對(duì)漢字的“音”感興趣。隨著中國(guó)信息化進(jìn)程的加速,手工寫字將過渡到電腦打字,已成為信息化的必然趨勢(shì)。經(jīng)常拼音打字,往往會(huì)“提筆忘字”,甚至使用諧音字來代替,這種現(xiàn)象在大中學(xué)生中普遍存在,這是一個(gè)明確的弱化漢字“形”的信號(hào)。值得大家警惕和反思。如果拼音輸入法占據(jù)主流中文輸入法的位置,長(zhǎng)此以往,人們尤其是我們的孩子,只記得漢字的音,而逐步弱化漢字的形,甚至討厭漢字的形。任其發(fā)展下去,漢字總有一天會(huì)淹沒在音素文字的浪潮里,中華文化的精髓——漢字將不復(fù)存在。
一次,與外國(guó)朋友就“漢字是否難學(xué)”話題閑聊時(shí),外國(guó)朋友說“漢語難學(xué)是你們中國(guó)人自己說的。我學(xué)習(xí)漢字從來就是把漢字當(dāng)藝術(shù)來學(xué),當(dāng)美來欣賞。所以,我是在欣賞漢字的藝術(shù)美,我不覺得漢字有多難學(xué)?!睂?duì)漢字的認(rèn)識(shí),外國(guó)人有時(shí)比我們清醒。3000萬外國(guó)人學(xué)漢語,如果從文化的層次來考量,恐怕更多的人還是為了感受中華漢字的東方神韻來的吧!臺(tái)灣著名文化人士鐵嘴李敖在復(fù)旦大學(xué)作的《中國(guó)人的機(jī)會(huì)》演講中說現(xiàn)在的中國(guó)、中國(guó)人、中國(guó)文化、中國(guó)的語言文字正面臨前所未有的大好機(jī)會(huì)。應(yīng)該把中文固有優(yōu)點(diǎn)用現(xiàn)代科技方法把它開發(fā)下去。中文有它好的語言,有它好的表現(xiàn)力。中文有很多的意境是洋人所沒有的。中文里面有很多同音字,我們知道有困難,「衣」字有156個(gè)字的同音字,怎么解決這個(gè)問題?有待于復(fù)旦的學(xué)子來面對(duì)。我們中文把它發(fā)揚(yáng)光大,為什么消滅不了它了?因?yàn)樗心敲春竦奈幕A(chǔ),它有十萬字的古書在我們的背后,它不是埃及文字,也不是巴比倫文字,中文是一個(gè)活的語言。過去說中文不利于社會(huì)發(fā)展,要消滅它,今天忽然發(fā)現(xiàn)中文咸魚翻身,就是因?yàn)楝F(xiàn)在的科技,當(dāng)打字的時(shí)候發(fā)現(xiàn)一個(gè)字一個(gè)音是最好的中文輸入方法。
李敖寄希望于包括復(fù)旦在內(nèi)的中國(guó)新一代學(xué)子,能很好地解決中文信息工程領(lǐng)域所面臨的問題。
為什么力挺形碼?漢字是中華民族的“第五大發(fā)明”。為了我們孩子語文教育,為了將來漢字的前途。在漢字信息化進(jìn)程中,我們必須進(jìn)一步強(qiáng)化漢字的“形”,必須在中小學(xué)信息技術(shù)課程中,倡導(dǎo)使用形碼。使?jié)h字得以很好的傳承下去。如果大中小學(xué)生普遍使用音碼,一音多字的拼音誰見了都煩。這樣會(huì)在他們幼小的心靈,容易產(chǎn)生討厭漢字的心緒和弱化漢字的傾向。一音多字不符合中國(guó)人的認(rèn)字理念,也不符合漢字的本質(zhì)規(guī)律。這不利于漢語漢字的傳承。
有人會(huì)說五筆我學(xué)過記不住,又忘了。這確實(shí)是個(gè)問題。這也是五筆字型為什么沒有獲得國(guó)家技術(shù)發(fā)明特等獎(jiǎng)的根本原因。
五筆字型是中文信息工程的一個(gè)里程碑,它開創(chuàng)了一個(gè)形碼時(shí)代到來,意義重大。但五筆的缺點(diǎn)和它的優(yōu)點(diǎn)一樣明顯,最根本的弱點(diǎn)就是不規(guī)范,破壞漢字的美學(xué)結(jié)構(gòu)。所以,從漢字學(xué)的角度來看,五筆是一個(gè)不夠理想的形碼,五筆存在明顯致命的缺點(diǎn)。這從許嘉璐副委員長(zhǎng)在《中文信息處理的現(xiàn)狀和發(fā)展方向》一文中說得很清楚。他說字根式形碼方案存在著違背漢字結(jié)構(gòu)原則、與人們?cè)趯W(xué)校所學(xué)得的文字和語言知識(shí)不合的弊??;筆畫式形碼方案也存在著任意拆分和筆順不夠規(guī)范的問題。有人說這是電腦對(duì)漢語言文字的“污染”,或者是一種漢語漢字信息處理的“病毒”,我想,從加強(qiáng)基礎(chǔ)教育、提高全民族文化素質(zhì)和快速普及計(jì)算機(jī)的角度說,這話并不過分。
學(xué)習(xí)形碼的過程應(yīng)該是欣賞漢字結(jié)構(gòu)美、藝術(shù)美的過程。
五筆字型是八十年代的產(chǎn)物,經(jīng)過二十年的技術(shù)積累和技術(shù)創(chuàng)新,以及全球漢語熱的到來。我們中國(guó)人再一次重新審視一下我們自己的漢字,形碼面臨著重大的技術(shù)突破。形碼開發(fā)人員應(yīng)該是具有很高漢語漢字的理論造詣,同時(shí)又掌握IT最新技術(shù)的通識(shí)人才。從文字學(xué)的角度來考查,形碼開發(fā)應(yīng)遵循“規(guī)范(標(biāo)準(zhǔn))、實(shí)用(易學(xué))、高效”的原則。
現(xiàn)在漢字編碼是處于萬碼奔騰時(shí)期,隨著中國(guó)信息化進(jìn)程的不斷深入,這種春秋戰(zhàn)國(guó)時(shí)代越來越不利于中華文化的傳承,不利于漢字的發(fā)揚(yáng)光大,規(guī)范和統(tǒng)一漢字編碼方案,是中文信息化進(jìn)程中的客觀要求,也是中文信息化的必然趨勢(shì)。各級(jí)政府、教育主管部門和學(xué)術(shù)界應(yīng)當(dāng)因勢(shì)利導(dǎo),推動(dòng)和加速這一進(jìn)程。這是對(duì)中華文明應(yīng)有的態(tài)度,也是政府的應(yīng)盡職責(zé)。
許嘉璐副委員長(zhǎng)在《中文信息處理的現(xiàn)狀和發(fā)展方向》一文中寫到令人擔(dān)憂的是,這種既不規(guī)范,又不統(tǒng)一的″萬‘碼′奔騰″局面,對(duì)中文信息處理事業(yè),對(duì)我國(guó)的教育,為害極大,亟需扭轉(zhuǎn)。可以說,編碼方案的缺乏優(yōu)化和規(guī)范,現(xiàn)在越來越成了阻礙計(jì)算機(jī)進(jìn)一步普及和中文信息處理技術(shù)發(fā)展的重要因素之一。而在相當(dāng)長(zhǎng)的一段時(shí)間內(nèi),漢字鍵盤輸入還將一直是我國(guó)信息處理的主要輸入手段,因此編碼的優(yōu)化和規(guī)范就成了刻不容緩的事。在這基礎(chǔ)上運(yùn)用行政的方法,促進(jìn)技術(shù)市場(chǎng)通過正當(dāng)競(jìng)爭(zhēng)優(yōu)化出幾種符合規(guī)范和標(biāo)準(zhǔn)的優(yōu)秀方案,是可行的,也是十分必要的。
經(jīng)過二十年的技術(shù)積累和技術(shù)創(chuàng)新,五形在傳統(tǒng)五筆的基礎(chǔ)上進(jìn)行了重大的技術(shù)突破。五形編碼方案日趨優(yōu)化和成熟,且與人工智能(CIDM)技術(shù)成功對(duì)接,將形碼技術(shù)提升到人工智能階段。五形已初具二代形碼“規(guī)范、易學(xué)、高效”的明顯特征。
規(guī)范(標(biāo)準(zhǔn))五形遵循漢字學(xué)的基本理論,繼承了漢字美學(xué)規(guī)律,并進(jìn)一步強(qiáng)化了漢字的美學(xué)特征。五形符合國(guó)家頒布的<現(xiàn)代漢語用字筆順規(guī)范>和<信息處理用BG13000.I字符集漢字部件規(guī)范>二個(gè)規(guī)范化文件,五形編碼方案與小學(xué)語文課文成功對(duì)接。五形實(shí)現(xiàn)了學(xué)方塊字、認(rèn)方塊字、打方塊字的高度統(tǒng)一。
實(shí)用(易學(xué))五形降低了形碼的學(xué)習(xí)難度。五形是目前市面上唯一不需要背字根的形碼輸入法,只要記住漢字的形,就可以根據(jù)其鍵盤的排布邏輯輸入;通過使用其智能學(xué)習(xí)軟件更是如虎添翼,其友好的操作界面、完善的功能,使用戶在輕松學(xué)習(xí)的同時(shí),欣賞中華漢字的部件美和結(jié)構(gòu)美。學(xué)習(xí)漢字變負(fù)擔(dān)為享受,讓人真正領(lǐng)略漢字的精妙!通過智能學(xué)習(xí)軟件用戶30分鐘即可掌握五形,一至二小時(shí)即可上機(jī)操作,在掌握300個(gè)各種類型經(jīng)典常用字,打字關(guān)即可通過。十小時(shí)上機(jī)操作后可熟練運(yùn)用。
高效五形第一次將人工智能CIDM技術(shù)引入中文輸入領(lǐng)域,使人耳目一新。有效突破了中文輸入效率低、信息記憶量大的瓶頸。使中國(guó)的老百姓真正擁有了一個(gè)輕松、方便、快捷的符合中文特點(diǎn)的輸入法。
21世紀(jì)經(jīng)濟(jì)已經(jīng)向知識(shí)經(jīng)濟(jì)轉(zhuǎn)行,知識(shí)經(jīng)濟(jì)競(jìng)爭(zhēng)的核心是技術(shù)標(biāo)準(zhǔn)的競(jìng)爭(zhēng)。知識(shí)經(jīng)濟(jì)的特征充分體現(xiàn)為技術(shù)進(jìn)一步推動(dòng)標(biāo)準(zhǔn),標(biāo)準(zhǔn)進(jìn)一步提升技術(shù)。從通信的3G標(biāo)準(zhǔn)之爭(zhēng),到數(shù)字電視的標(biāo)準(zhǔn)之爭(zhēng)。誰掌握并擁有更多的新技術(shù)標(biāo)準(zhǔn),誰就是知識(shí)經(jīng)濟(jì)競(jìng)爭(zhēng)的贏家。
五形是一款根據(jù)中文信息工程標(biāo)準(zhǔn)設(shè)計(jì)的中文輸入法。它集五筆、智能拼音ABC、微軟拼音優(yōu)點(diǎn)于一身,同時(shí)又克服了其弱點(diǎn)。五形繼承了五筆碼短、重碼低優(yōu)點(diǎn),克服了五筆要背易忘弱點(diǎn);繼承智能ABC簡(jiǎn)拼、混拼、自由造詞優(yōu)點(diǎn),克服拼音重碼高弱點(diǎn)繼承了微軟拼音智能化優(yōu)點(diǎn),克服微軟拼音整句輸入差錯(cuò)率高弱點(diǎn)。它將改變?nèi)藗兊闹形妮斎肓?xí)慣,將人們從拼音輸入習(xí)慣中解脫出來,進(jìn)入一個(gè)全新的智能形碼新時(shí)代。
五形克服了五筆要記字根、背口訣,學(xué)后容易忘的缺點(diǎn),讓一位計(jì)算機(jī)初學(xué)者在很短時(shí)間內(nèi)(二夭)就能學(xué)會(huì)打字并能運(yùn)用自如。可以說,五形是五筆最佳的替代輸入法,是今后漢字輸入的發(fā)展方向,形碼編碼技術(shù)是目前最適合中國(guó)人用、最符合漢字特點(diǎn)的中文輸入技術(shù),具有很好的市場(chǎng)前景。
五形兼容五筆,方便遺忘五筆的用戶順利地過渡到五形,也有利于五筆用戶比較鑒別。
五形編碼方案對(duì)漢字結(jié)構(gòu)作出了一種科學(xué)的歸納即漢字結(jié)構(gòu)分為左右結(jié)構(gòu)(左中右)、上下結(jié)構(gòu)(上中下)、半包圍結(jié)構(gòu)、全包圍結(jié)構(gòu)、整體字結(jié)構(gòu)(獨(dú)體字)五種。五形是在對(duì)國(guó)標(biāo)深入研究的基礎(chǔ)上并結(jié)合中國(guó)人的思維習(xí)慣,其大腦思考和書寫的步驟如下漢字整體的形→漢字部件→最后落實(shí)到筆劃順序。
五形輸入法正是基于這樣的一種大腦的順序思維以及漢字結(jié)構(gòu)、漢字部件及漢字筆順等文字理論開發(fā)的。
五形編碼其實(shí)很簡(jiǎn)單就是漢字結(jié)構(gòu)碼+漢字部件碼。
如“美”編碼V(上下結(jié)構(gòu))+(部首)+大(部首)。
在漢字結(jié)構(gòu)中,87%漢字是左右、上下結(jié)構(gòu)。漢字的字形結(jié)構(gòu)也非常容易掌握。
智能五形漢語句輸入法,是根據(jù)漢字五種結(jié)構(gòu)(五形)作為漢字編碼信息特征,利用計(jì)算機(jī)自動(dòng)識(shí)別和無極轉(zhuǎn)化(智能)實(shí)現(xiàn)字、詞、句無縫連接的一種不要背誦字根的人工智能中文輸入方法。
五形技術(shù)方案分為兩部份即“漢字的五形編碼方案”和“CIDM人工智能技術(shù)”中國(guó)科大研發(fā)先進(jìn)統(tǒng)計(jì)語言模型CIDM技術(shù)CIDM是一種先進(jìn)的統(tǒng)計(jì)語言模型。統(tǒng)計(jì)語言模型研究是在大規(guī)模語料庫(kù)上進(jìn)行句法知識(shí)的自動(dòng)獲取研究,是當(dāng)前國(guó)際計(jì)算語言學(xué)界研究的前沿課題。CIDM可以廣泛地運(yùn)用到像漢字輸入、語音識(shí)別、文本檢索、信息抽取、信息安全和機(jī)器翻譯等處理大規(guī)模文本領(lǐng)域。
CIDM作為通用應(yīng)用軟件的智能后臺(tái)擎引,順應(yīng)了通用軟件的高集成、高智能的發(fā)展趨勢(shì)。加載CIDM的通用軟件,其智能性會(huì)發(fā)生質(zhì)的變化。
中文智能識(shí)別模型技術(shù),簡(jiǎn)稱CIDM技術(shù)。(Chinese Intellective Discriminative Model),它是由中國(guó)科學(xué)技術(shù)大學(xué)的三位人工智能領(lǐng)域博士領(lǐng)導(dǎo)的五人開發(fā)小組經(jīng)過近一年時(shí)間的努力研發(fā)而成的。CIDM是采用現(xiàn)代生物數(shù)學(xué)算法,經(jīng)過對(duì)近50億字材料進(jìn)行的統(tǒng)計(jì)提取和統(tǒng)計(jì)分析,涉及現(xiàn)代漢語中經(jīng)濟(jì)、政治、文化、科技、教育、文學(xué)、歷史、哲學(xué)、軍事、體育等20個(gè)語系,進(jìn)行了詳盡的邏輯語法分析和字詞關(guān)聯(lián)統(tǒng)計(jì),智能識(shí)別字詞之間關(guān)聯(lián)技術(shù)的一種新型模型。
CIDM具體表現(xiàn)為三個(gè)方面一、智能識(shí)別字與字之間關(guān)連關(guān)系,即字智能動(dòng)態(tài)匹配;二、智能識(shí)別詞與詞之間關(guān)連關(guān)系,即詞智能動(dòng)態(tài)匹配;三、智能識(shí)別字與詞之間關(guān)連關(guān)系,即字、詞智能動(dòng)態(tài)匹配。
字、詞智能動(dòng)態(tài)匹配是指字、詞的排列順序并不是固定靜止的(即靜態(tài)列舉),而是根據(jù)上下文的語義智能定向排列的(即動(dòng)態(tài)匹配)。真正實(shí)現(xiàn)了“所想即所得”。例如,輸入“國(guó)家”后,鍵入ZB-,第一位出“主權(quán)”;輸入“地球”后,鍵入ZB-,第一位出“兩極”。同樣ZB-鍵,出詞的順序是不同的。即“國(guó)家”匹配“主權(quán)”,“地球”匹配“兩極”。
漢字的五形編碼方案本發(fā)明采用五形部件按形組合漢字的方法,直觀易學(xué)。經(jīng)過優(yōu)化的五形部件映射在英文鍵盤的字母鍵上,使之成為五形中文鍵盤,使用這個(gè)鍵盤便可輸入漢字及詞匯。
規(guī)范五形編碼方案認(rèn)為,漢字是象形文字,漢字分為筆劃、部件、整字三個(gè)層面。筆劃結(jié)合成部件,部件組合便形成漢字。按照書寫順序以部件為單位組字詞,并在優(yōu)化了部件的五形中文鍵盤上,按鍵完成編碼輸入。
五形編碼方案認(rèn)為,組成漢字部件的基本筆劃概括為橫、豎、撇、捺、折五種。這里的筆劃是一種廣意的概念,它是將運(yùn)筆方向一致的筆畫歸為同一類,如橫、提同歸為橫類筆畫。如圖l所示。
為實(shí)現(xiàn)五形編碼方案,本發(fā)明提出了五形部件(碼元)技術(shù)方案。
本發(fā)明對(duì)漢字組字部件(碼元)進(jìn)行計(jì)算機(jī)數(shù)理統(tǒng)計(jì)及計(jì)算機(jī)統(tǒng)計(jì)分析,通過計(jì)算機(jī)優(yōu)選計(jì)算和優(yōu)化篩選,按部件規(guī)范性、部件美學(xué)性、部件架構(gòu)性、部件組字率、部件數(shù)量指標(biāo)、部件易記性、組字重碼率等十項(xiàng)技術(shù)指標(biāo),經(jīng)過計(jì)算機(jī)輔助設(shè)計(jì)計(jì)算而得來的五形部件(碼元)技術(shù)方案。這樣形成了五形部件(碼元)總表,如圖2所示。
英文構(gòu)字單位是26個(gè)英文字母。依據(jù)漢字學(xué)原理,漢字構(gòu)字單位是漢字部件,漢字部件不能破壞漢字部首的美學(xué)內(nèi)涵。五形提出了全新的五形部件(碼元)方案。其技術(shù)特征一是出現(xiàn)頻度高,二是保持漢字美學(xué)特征。其技術(shù)特點(diǎn)是構(gòu)字規(guī)范、簡(jiǎn)單;為便于分類管理,把那些與五形部件具有相同或相似字形特征的部件,稱之為五形派生部件。進(jìn)行分類管理。
漢字部件紛繁龐雜,多達(dá)800種,是漢字處理的難點(diǎn)。五形部件方案,在保持漢字美學(xué)特征、簡(jiǎn)化漢字組合(拆分)、減少漢字部件數(shù)量、降低漢字重碼率方面,做了有益的探索。具有獨(dú)創(chuàng)性、新穎性和實(shí)用性。如“ (曹字頭)、 (其字頭)”被收入五形部件。這樣,既保持漢字美學(xué)特征,又簡(jiǎn)化漢字拆分。同時(shí)重碼率也不高。
五形部件(碼元)方案進(jìn)一步改進(jìn)并完善了五筆字型字根方案,使得漢字部件更趨科學(xué)、更趨規(guī)范、更趨合理。
由于五形軟件設(shè)計(jì)了鍵位部件提示欄,鍵入任何一鍵時(shí),鍵位部件提示欄中都會(huì)顯示該鍵位所有五形部件,五形軟件的這種設(shè)計(jì)特別適合初學(xué)者練習(xí)使用。所以五形部件只要了解即可,無須刻意去背。如圖3所示。
為實(shí)現(xiàn)五形編碼方案,本發(fā)明提出了五形中文鍵盤技術(shù)方案。
將五形部件(碼元)按首筆和次筆的筆順劃區(qū)分位映射到英文鍵盤上,歸并在六個(gè)區(qū)即橫區(qū)為GFDSA、豎區(qū)為HJKL;、撇區(qū)為TREWQ、捺區(qū)為YUIOP、折區(qū)及單筆畫區(qū)為NM,。/。每區(qū)再分成五個(gè)鍵位,分別用橫[一]、豎[丨]、撇[丿]、捺[、]、折[乙]筆劃表示每個(gè)鍵位的位號(hào)。每位都用二個(gè)筆劃作為其所在區(qū)位的區(qū)位碼。區(qū)號(hào)與該區(qū)五形部件的首筆筆劃一致,位號(hào)與該位五形部件次筆筆劃一致。如“一丨位”(橫豎位)F鍵表示首筆是橫[一]、次筆是豎[丨]的所有五形部件。單筆畫區(qū)分別代表橫[一]、豎[丨]、撇[丿]、捺[、]、折[乙]五種筆劃。部首區(qū)(分別代表木、扌、土、口、日)為--=\[]、五形結(jié)構(gòu)區(qū)(分別代表左右、上下、半包、全包、獨(dú)體字結(jié)構(gòu))為BVCXZ。這樣形成了五形中文鍵盤,如圖4所示。
英文鍵盤是隨機(jī)分布英文字母的。依據(jù)漢字學(xué)原理,五形提出了全新的五形中文鍵盤技術(shù)方案。鍵盤布局趨近完美,邏輯性強(qiáng),嚴(yán)謹(jǐn)規(guī)范,使人在聯(lián)想中打字,不需死記硬背。五形部件嚴(yán)格按照中文筆畫區(qū)位邏輯分布的。
五形中文鍵盤方案,進(jìn)一步改進(jìn)并完善了五筆字型中文鍵盤的筆畫區(qū)位分布,使筆畫區(qū)位分布更趨合理。五筆字型2區(qū)5位是M鍵,即25M,顯然不合理,合理布局應(yīng)是“25;”。但“;”鍵是常用標(biāo)點(diǎn),五筆不好用,才改道用25M。五形結(jié)構(gòu)碼技術(shù)巧妙解決了這一難題。
為實(shí)現(xiàn)五形編碼方案,本發(fā)明提出了五形編碼技術(shù)方案。
本發(fā)明按漢字書寫順序以五形部件(碼元)為單位對(duì)漢字編碼或在鍵盤上鍵入代碼,每個(gè)漢字最多四碼。五形編碼其實(shí)很簡(jiǎn)單,就是五形結(jié)構(gòu)碼(簡(jiǎn)稱結(jié)構(gòu)碼)+五形部件碼(簡(jiǎn)稱部件碼)。三個(gè)部件漢字,輸入時(shí)依書寫順序鍵入結(jié)構(gòu)碼、第一、第二、第三部件碼。漢字分解后部件數(shù)超過三個(gè)的。只鍵入結(jié)構(gòu)碼、第一、第二、末部件碼。
如“職”可取b(左右) 耳(一丨F) 口([八(丿、W)如“輸”可取b(左右) 車(一乙A) 人(丿、W) 刂(丨丨J)對(duì)于二個(gè)部件漢字,在編碼或鍵入代碼時(shí)應(yīng)在部件代碼后補(bǔ)上末筆代碼。
如“杯”取 B(左右) 木(--)不(一丿D)、(。末筆代碼)對(duì)于只有一個(gè)部件漢字(部件字),其編碼為·結(jié)構(gòu)碼z+第1,2筆畫區(qū)位碼+第3,4筆畫區(qū)位碼+末筆區(qū)位碼。
如“金”(部件字)取Z(獨(dú)體) 丿、(W) 一一(G) 一(N)由于五形結(jié)構(gòu)碼的獨(dú)特設(shè)計(jì),五形詞組編碼可完全實(shí)現(xiàn)類似智能ABC拼音輸入簡(jiǎn)拼、混拼、自由造詞的功能,且實(shí)現(xiàn)了字、詞分屏顯示功能,使形碼的詞組輸入效能趕上了拼音詞組輸入功能。
如“中華”取zv zvr,zvrq,z[v均可輸入如“小康社會(huì)”取ZCBV(表示獨(dú)體、半包、左右、上下結(jié)構(gòu))如“中華人民共和國(guó)”取ZVZZVBX本發(fā)明設(shè)計(jì)了允錯(cuò)碼,對(duì)結(jié)構(gòu)容易搞錯(cuò)的字允許容錯(cuò)。如“年”是獨(dú)體字結(jié)構(gòu),用戶識(shí)別成上下結(jié)構(gòu)也能打得出。
如“年”取Z(獨(dú)體) (丿一T) 一(N) 丨(M)如“年”取V(上下) (丿一T) 一(N) 丨(M)
圖1.漢字基本筆畫圖2.五形部件(碼元)總表圖3.五形軟件界面圖4.五形中文鍵盤圖
權(quán)利要求
1.規(guī)范五形編碼方案及其中文鍵盤設(shè)計(jì),其特征是將計(jì)算機(jī)優(yōu)化過的五形部件(碼元)按首筆和次筆的筆順劃區(qū)分位映射到英文鍵盤的字母鍵上,歸并在八個(gè)區(qū)即橫區(qū)(橫起筆)、豎區(qū)(豎起筆)、撇區(qū)(撇起筆)、捺區(qū)(捺起筆)、折區(qū)(折起筆)及單筆畫區(qū)、部首區(qū)、五形結(jié)構(gòu)區(qū)。每區(qū)再分成五個(gè)鍵位,分別用橫[一]、豎[丨]、撇[丿]、捺[丶]、折[乙]筆劃表示每個(gè)鍵位的位號(hào)。每位都用二個(gè)筆劃作為其所在區(qū)位的位碼。區(qū)號(hào)與該區(qū)五形部件的首筆筆劃一致,位號(hào)與該位五形部件次筆筆劃一致。使之成為五形中文鍵盤,使用這個(gè)鍵盤,采用五形部件按形組合漢字的方法便可按形輸入漢字及詞匯。
2.按照權(quán)利要求1,英文鍵盤的八個(gè)區(qū)是橫區(qū)為GFDSA、豎區(qū)為HJKL、撇區(qū)為TREWQ、捺區(qū)為YUIOP、折區(qū)及單筆畫區(qū)為NM,。/、部首區(qū)(分別代表木、扌、土、口、日)為-=\[]、五形結(jié)構(gòu)區(qū)(分別代表左右、上下、半包、全包、獨(dú)體字結(jié)構(gòu))為BVCXZ。
3.按照權(quán)利要求l,每區(qū)五形部件再分成五個(gè)鍵位,分別用橫[一]、豎[丨]、撇[丿]、捺[丶]、折[乙]筆劃表示每個(gè)鍵位的位號(hào)。
4.按照權(quán)利要求1和2,每位五形部件都用二個(gè)筆劃作為其所在區(qū)位的區(qū)位碼。區(qū)號(hào)與該區(qū)五形部件的首筆筆劃一致,位號(hào)與該位五形部件次筆筆劃一致。
5.按照權(quán)利要求l、2、3,同一鍵位上的所有五形部件可用其所在鍵的同一個(gè)區(qū)位碼來表示。
6.按照權(quán)利要求1和5,5區(qū)共25位五形部件及其代碼是G[一一]二三干韋戔王[ 耒]F[一丨]艸[ 廿革 ]十 寸丁工五耳甫酉[西覀]D[一丿]石不大犬豕戊廠[ナ 廾]S[一丶] A[一乙]萬車牙瓦七 戈戉[弋 ]H[丨一]上止 虍J[丨丨] 刂 業(yè)K[丨丿]小 L[丨]丶 氺;[丨 乙]足蟲由田目水山巾貝皿冂[口月用 ]T[丿一] 千手 毛氣長(zhǎng)禾牛牜 钅攵R[丿丨]白臼片身鬼乑亻[ ]E[丿丿]彳爪瓜舟斤彡 W[丿丶]金 八人父豸爫Q[丿乙]魚氏月用及九 兒幾勹夕 鳥[烏 犭 夂饣 匚Y[丶一]言[亠冫 圭]廣疒立方衣文U[丶丨]忄門I[丶丿]丷火`米羊[ ]O[丶丶] 氵 灬宀穴P[丶乙]心之[ 辶讠礻衤]01N[一]一 51N[乙一] 彐 巳己 弓尸艮[ ]02M[丨]丨亅52M[乙丨] 阝凵也巴子[了 疋 ]03,[丿]丿53,[乙丿]力乃女皮刀[]04.[丶]丶 54.[乙丶]癶廴又厶 マ 05/[乙]乙 55/[乙乙]馬母毋幺[ 纟巜巛 彑]
7.按照權(quán)利要求1和5,三個(gè)部件漢字,輸入時(shí)依書寫順序鍵入結(jié)構(gòu)碼、第一、第二、第三部件碼。
8.按照權(quán)利要求1和5,漢字分解后部件數(shù)超過三個(gè)的。只鍵入結(jié)構(gòu)碼、第一、第二、末部件碼。
9.按照權(quán)利要求l和5,對(duì)于二個(gè)部件漢字,鍵入代碼時(shí)應(yīng)在部件代碼后補(bǔ)上末筆代碼。
10.按照權(quán)利要求1利5,對(duì)于只有一個(gè)部件漢字(部件字),其編碼為結(jié)構(gòu)碼z+第1,2筆畫區(qū)位碼+第3,4筆畫區(qū)位碼+末筆區(qū)位碼。
全文摘要
規(guī)范五形編碼方案及其中文鍵盤設(shè)計(jì),對(duì)漢字的"形"作出深刻揭示。第一次提出漢字"五形"結(jié)構(gòu)科學(xué)分類。經(jīng)過二十年的技術(shù)積累和技術(shù)創(chuàng)新,五形在傳統(tǒng)五筆的基礎(chǔ)上進(jìn)行了重大的技術(shù)突破。五形編碼方案日趨優(yōu)化和成熟,且與人工智能(CIDM)技術(shù)成功對(duì)接,將形碼技術(shù)提升到人工智能階段。五形已初具二代形碼"規(guī)范、易學(xué)、高效"的明顯特征。
文檔編號(hào)G06F3/023GK1979389SQ20051012655
公開日2007年6月13日 申請(qǐng)日期2005年11月30日 優(yōu)先權(quán)日2005年11月30日
發(fā)明者陸春榮 申請(qǐng)人:陸春榮