專利名稱:漢字數(shù)據(jù)庫首筆組合編碼法的制作方法
技術領域:
本發(fā)明是一種漢字數(shù)據(jù)庫首筆組合編碼法,屬于計算機漢字信息輸入領域。
隨著科學的發(fā)展和計算機的性能/價格比升值,微機的應用迅速普及,漢字數(shù)據(jù)庫的編碼成為當前迫切需要解決的難題之一。在醫(yī)療衛(wèi)生部門目前所用的數(shù)據(jù)編碼僅起著貸號的作用,微機操作人員很難記憶,手中離不開編碼本,怠機現(xiàn)象嚴重,限制了工作效率。
本發(fā)明針對上述問題,設計一種只在微機小字盤區(qū)數(shù)字鍵操作的漢字首筆組合的編碼法,它將數(shù)據(jù)庫中的漢字信息直按轉化為2-8位數(shù)的純數(shù)字碼。
本發(fā)明是這樣實現(xiàn)的一種漢字數(shù)據(jù)庫首筆組合編碼法,是給予漢字的偏旁(部首)一相應代碼,其技術要點是利用其代碼對數(shù)據(jù)庫中漢字信息的關鍵進行編碼,每一編碼即相應一條漢字信息,該編碼法遵循以下幾個規(guī)則(1)根據(jù)專業(yè)名詞、詞匯的使用情況,統(tǒng)計出漢字偏旁(部門)出現(xiàn)的頻率,按其頻率從高到低依次排序,然后分別賦予相應數(shù)字代碼;
(2)使用頻率低的偏旁(部首),可與使用頻率高的使用同一代碼;
(3)起始碼是由最大的代碼縮小10倍之后,其整數(shù)部分加1,即a=INT(Max/10)+1其中a-起始碼,INT-取整函數(shù),Max-最大的代碼。
以下對其它技術特點進行展開說明規(guī)則(3)是一個避免重碼的重要的規(guī)則,除此之外還有兩點降低重碼率的規(guī)則(1)對使用頻率高,且易造成重碼的偏旁(部首)代碼,可將該偏旁(部首)用標記框起來,在編碼時,取該偏旁(部首)之后的第二筆結構的代碼。如“钅”的代碼是17,在編氯化鉀、氯化鈉、氯化鎂、氯化鈣時,其編碼分別是51916、51923、5194、51925,其中帶下劃線標記部分為上列名詞中第三個漢字的第二筆結構的代碼。
(2)當同一藥物有多種劑型時,除片劑省略劑型代碼外,其他劑型在其編碼不足8位數(shù)時,可補加劑型碼加以區(qū)別。
劑型代碼如下眼膏0,膠囊1,注射劑2,散劑,粉劑3,溶液劑4,霜劑、膏、糊5,氣霧劑、栓劑6,貼劑、膜劑7,耳、鼻用滴劑8,眼藥水9。
根據(jù)規(guī)則,本法在西藥藥品數(shù)據(jù)庫編碼中使用的漢字偏旁(部首)與代碼之間的對應關系如下所示
代碼 代表字母 偏旁(部首) 代碼 代表字母偏旁(部首)3 a 一王主 17 O 钅(金)勹夕 4 b 二冫丷雨十 18 P 扌(手)白斤5 c 丿竹夂 19 q 人亻八癶 6 d 木艸弋 20 r 乙(習)乛7 e 禾西(酉)忄心 21 s 厶 又8 f 氵水 小() 22 t 子阝耳疒9 g 宀冖 彳 23 u 蟲 (己已巳)10 h 三石古 24 v 女彐 臼11 i 幺七弓七 25 w 丨 卜 刂12 j 亠讠廣 26 x 山由 幾13 k 匚( )丁工廠 27 y 灬米14 l 月爫(爪) 28 z 火車力兒丶15 m 口土士干川 29 乂 (乃)16 n 囗日曰田四目 30 馬本法主要優(yōu)點(1)操作速度快,主要是純數(shù)字碼,且直接由漢字結構轉換,不是通過其他途徑間接轉換,其二,是純數(shù)字碼只用小鍵盤區(qū)的數(shù)字鍵,單手操作,擊鍵頻率高。
(2)準確、易掌握利用漢語拼音聲母轉換、或四角號碼轉換的所謂“見名釋碼”法,有些漢字的讀音掌握不準、或有些漢字的角碼莫棱兩可使其準確率不高。本法,只要記熟其偏旁(部首)代碼,準確率較高、且易掌握。
(3)重碼率低本法在實踐應用中其重碼率比漢語拼音聲母轉換法低10倍,比角碼法低20多倍。
(4)用途廣泛,易于推廣,適用于各行業(yè)的微機漢字數(shù)據(jù)庫編碼。
權利要求
1.一種漢字數(shù)據(jù)庫首筆組合編碼法,是給予漢字的偏旁(部首)一相應代碼,其特征在于利用其代碼對數(shù)據(jù)庫中漢字信息的關鍵字進行編碼,每一編碼即對應一條漢字信息,該編碼法遵循以下幾個規(guī)則(1)根據(jù)專業(yè)名詞、詞匯的使用情況,統(tǒng)計出漢字偏旁(部首)出現(xiàn)的頻率,按其頻率從高到低依次排序,然后分別賦予相應數(shù)字代碼;(2)使用頻率低的偏旁(部首),可與使用頻率高的使用同一代碼;(3)起始碼是由最大的代碼縮小10倍之后,其整數(shù)部分加1,即起始碼=INT(最大的代碼/10)+1。
2.按照權利要求1所述的編碼法,其特征在于它的降低重碼率的規(guī)則為(1)對使用頻率高,且易造成重碼的偏旁(部首)代碼,可將該偏旁(部首)用標記框起來,在編碼時,取該偏旁(部首)之后的第二筆結構的代碼。(2)當同一藥物有多種劑型時,除片劑省略劑型代碼外,其他劑型在其編碼不足8位數(shù)時,可補加劑型碼加以區(qū)別。
3.按照權利要求2所述的編碼法,其特征在于劑型代碼為眼膏0,膠囊1,注射劑2,散劑、粉劑3,溶液劑4,霜劑、膏、糊5,氣霧劑、栓劑6,貼劑、膜劑7,耳、鼻用滴劑8,眼藥水9。
4.按照權利要求1所述的編碼法,其特征在于漢字偏旁(部首)與代碼之間的對應關系為代碼 代表字母 偏旁(部首) 代碼 代表字母偏旁(部首)3 a 一王主 17 O 钅(金)勹夕 4 b 二冫丷雨十 18 P 扌(手)白斤5 c 丿竹夂 19 q 人亻八癶 6 d 木艸弋 20 r 乙(習)乛7 e 禾西(酉)忄心 21 s 厶 又8 f 氵水 小() 22 t 子阝耳疒9 g 宀冖 彳 23 u 蟲 (己已巳)10 h 三石古 24 v 女彐 臼11 i 幺七弓七 25 w 丨 卜 刂12 j 亠讠廣 26 x 山由 幾13 k 匚( )丁工廠 27 y 灬米14 l 月爫(爪) 28 z 火車力兒丶15 m 口土士干川 29 乂 (乃)16 n 囗日曰田四目 30 馬
全文摘要
漢字數(shù)據(jù)庫首筆組合編碼法屬于計算機漢字信息輸入領域。它是給予漢字偏旁(部首)一相應代碼,其要點是對數(shù)據(jù)庫中漢字信息的關鍵字進行編碼,該編碼法規(guī)則如下根據(jù)專業(yè)名詞、詞匯漢字偏旁(部首)出現(xiàn)的頻率,從高到低依次排序,分別賦予相應數(shù)字代碼;使用頻率低的偏旁(部首)可與頻率高的用同一代碼;起始碼=INT(最大的代碼/10)+1。它有見名釋碼、重碼率極低,易掌握的優(yōu)點,本法尤適用于醫(yī)藥等行業(yè)。
文檔編號G06F3/023GK1102262SQ93115190
公開日1995年5月3日 申請日期1993年11月2日 優(yōu)先權日1993年11月2日
發(fā)明者于佳臣, 劉麗娟, 魏愛英, 周愛華, 蘇德民 申請人:山東省立醫(yī)院