一種維哈柯文顯示方法及應(yīng)用的制作方法
【專利摘要】本發(fā)明公開了一種維哈柯文顯示方法及應(yīng)用,本發(fā)明在目標(biāo)語言的字符集編碼的基礎(chǔ)上,提取出基本區(qū)編碼矩陣和擴(kuò)展區(qū)編碼矩陣,基于矩陣數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn)對(duì)應(yīng)語義字母到顯示字母的選型替換,提高了選型替換的處理效率。本發(fā)明可應(yīng)用于桌面操作系統(tǒng)、智能移動(dòng)終端操作系統(tǒng)或?yàn)g覽器等應(yīng)用程序當(dāng)中,實(shí)現(xiàn)對(duì)維哈柯文的以正確的書寫習(xí)慣進(jìn)行顯示。
【專利說明】一種維哈柯文顯示方法及應(yīng)用
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)、網(wǎng)絡(luò)文字處理【技術(shù)領(lǐng)域】,尤其涉及一種維哈柯文的顯示方法及應(yīng)用。
【背景技術(shù)】
[0002]中國新疆的維吾爾語(以下簡稱維文)、哈薩克語(以下簡稱哈文)、柯爾克孜語(以下簡稱柯文)同屬于阿爾泰語系突厥語族。維、哈、柯文在進(jìn)行通過計(jì)算機(jī)系統(tǒng)進(jìn)行信息交互、信息存儲(chǔ)時(shí)使用的是位于基本編碼區(qū)的語義字母,然而根據(jù)這些語言書寫習(xí)慣,終端在進(jìn)行信息呈現(xiàn)時(shí)必須按這些語言的書寫習(xí)慣,根據(jù)每個(gè)字母在詞中出現(xiàn)的位置,對(duì)基本編碼區(qū)的字母進(jìn)行字形的轉(zhuǎn)換,才能以正確的方式顯示每個(gè)詞。例如維文有32個(gè)語義字母(或稱為名義字母),大部分的語義字母有四種寫法,四種寫法分別對(duì)應(yīng)字母在句首、句中、句尾以及單獨(dú)出現(xiàn)時(shí)的書寫方式。
[0003]經(jīng)過不斷發(fā)展和演化,上述語言形成了很多自身特色,在語素、語法、構(gòu)詞等方面不同于其它地域同語系的語種?,F(xiàn)有的很多軟件平臺(tái),包括移動(dòng)智能設(shè)備的操作系統(tǒng)等,還不能很好的支持上述語言,例如在安卓Android智能移動(dòng)終端的系統(tǒng)中,顯示上述語言文字時(shí)存在不能正確顯示、詞中的字母互相不關(guān)聯(lián)的問題。為了促進(jìn)基于上述語言文字的文化交流與發(fā)展,迫切需要一種能夠很好地支持上述語言文字,使上述語言文字能在各種終端設(shè)備上進(jìn)行正確高效顯示的技術(shù)方案,以滿足使用上述語言文字的人們進(jìn)行信息交互的需求。
【發(fā)明內(nèi)容】
[0004]有鑒于此,本發(fā)明目的在于提供一種維哈柯文顯示方法及基于該顯示方法的軟件應(yīng)用,用于解決維哈柯文在各種軟件平臺(tái)和/或智能終端上的顯示問題,提高上述語言文字在各種軟件平臺(tái)和/或智能終端上的顯示效率。
[0005]為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
[0006]一種維哈柯文的顯示方法,該方法包括:
[0007]獲取以目標(biāo)語言的基本區(qū)編碼組成的源字符串,所述目標(biāo)語言為維文,哈文,柯文中的任一種或多種的組合;
[0008]針對(duì)所述源字符串中的每一個(gè)語義字母,基于所述目標(biāo)語言的基本區(qū)編碼矩陣及所述目標(biāo)語言的擴(kuò)展區(qū)編碼矩陣,進(jìn)行選型替換后輸出用于顯示的目標(biāo)字符串;
[0009]所述基本區(qū)編碼矩陣為N行I列,由目標(biāo)語言的語義字母編碼依據(jù)編碼順序構(gòu)成,所述N由目標(biāo)語言包含語義字母的基本區(qū)編碼范圍確定,該矩陣的每一行對(duì)應(yīng)目標(biāo)語言的一個(gè)基本區(qū)編碼;
[0010]所示擴(kuò)展區(qū)編碼矩陣為N行4列,由目標(biāo)語言的顯示字母編碼依據(jù)編碼順序構(gòu)成,該矩陣的每一行分別與所述基本區(qū)編碼矩陣中的語義字母編碼一一對(duì)應(yīng),每一行的4列分別為對(duì)應(yīng)語義字母在詞首,詞中,詞尾,單獨(dú)出現(xiàn)時(shí)的顯示字母編碼。[0011]進(jìn)一步地,所述選型替換的處理步驟包括:
[0012]從所述源字符串中獲取當(dāng)前待處理的語義字母編碼,基于該語義字母編碼在所述基本區(qū)編碼矩陣中定位,確定該語義字母編碼在所述基本區(qū)編碼矩陣中的行下標(biāo);
[0013]根據(jù)所述當(dāng)前待處理的語義字母前后是否連接其它語義字母來確定該語義字母在詞首,詞中,詞尾或單獨(dú)形式,基于所述擴(kuò)展區(qū)編碼矩陣的列下標(biāo)與字形的對(duì)應(yīng)關(guān)系,確定顯示該語義字母的字形在所述擴(kuò)展區(qū)編碼矩陣中的列下標(biāo);
[0014]根據(jù)所確定的所述行下標(biāo)和列下標(biāo)從所述擴(kuò)展區(qū)編碼矩陣中讀取所述當(dāng)前待處理的語義字母對(duì)應(yīng)的顯示字母編碼,執(zhí)行字符替換。
[0015]進(jìn)一步地,所述基本區(qū)編碼矩陣和所述擴(kuò)展區(qū)編碼矩陣通過數(shù)組來構(gòu)造;
[0016]所述基于該語義字母的編碼在所述基本區(qū)編碼矩陣中定位,確定該語義字母在所述基本區(qū)編碼矩陣中的行下標(biāo)的方法具體為:用所述當(dāng)前待處理的語義字母編碼減去所述基本區(qū)編碼矩陣中的首行語義字母編碼獲得偏移量,將所述偏移量確定為所述行下標(biāo)。
[0017]進(jìn)一步地,當(dāng)以文件為單位對(duì)文件中所包含至少一個(gè)源字符串進(jìn)行選型替換時(shí),所述方法還包括:
[0018]根據(jù)目標(biāo)語言的基本區(qū)編碼范圍從所述文件中獲取每個(gè)源字符串形成源字符串列表,并使用與源字符串一一對(duì)應(yīng)的占位符替換所述文件中對(duì)應(yīng)的每個(gè)源字符串;
[0019]從所述源字符串列表中獲取所述源字符串,通過所述的對(duì)源字符串進(jìn)行選型替的步驟獲得目標(biāo)字符串后,根據(jù)所述占位符用得到的目標(biāo)字符串替換所述文件中對(duì)應(yīng)位置的源字符串。
[0020]進(jìn)一步地,所述方法可應(yīng)用于瀏覽器中,所述文件為本地網(wǎng)頁文件或加載的WEB服務(wù)器端的網(wǎng)頁文件;或所述方法以應(yīng)用程序接口的形式集成到操作系統(tǒng)當(dāng)中,以供上層應(yīng)用在需要時(shí)加載使用。
[0021]進(jìn)一步地,所述方法可應(yīng)用于智能移動(dòng)終端的操作系統(tǒng)或應(yīng)用軟件當(dāng)中。
[0022]基于本發(fā)明實(shí)施例的另一方面,本發(fā)明還提供一種維、哈、柯文顯示裝置,該裝置用于將文件內(nèi)容中以目標(biāo)語言基本區(qū)編碼表達(dá)的文字內(nèi)容替換為以目標(biāo)語言擴(kuò)展區(qū)編碼表達(dá)的文字內(nèi)容;所述目標(biāo)語言為維文,哈文,柯文中的任一種;該裝置包括:
[0023]獲取單元,用于根據(jù)目標(biāo)語言的基本區(qū)編碼范圍從文件內(nèi)容中獲取以目標(biāo)語言基本區(qū)編碼組成的源字符串;
[0024]選型單元,用于基于所述目標(biāo)語言的基本區(qū)編碼矩陣及所述目標(biāo)語言的擴(kuò)展區(qū)編碼矩陣,對(duì)所述源字符串中的語義字母進(jìn)行選型處理;所述基本區(qū)編碼矩陣為N行I列,由目標(biāo)語言的語義字母編碼依據(jù)編碼順序構(gòu)成,所述N由目標(biāo)語言包含語義字母的基本區(qū)編碼范圍確定,該矩陣的每一行對(duì)應(yīng)目標(biāo)語言的一個(gè)基本區(qū)編碼;所示擴(kuò)展區(qū)編碼矩陣為N行4列,由目標(biāo)語言的顯示字母編碼依據(jù)編碼順序構(gòu)成,該矩陣的每一行分別與所述基本區(qū)編碼矩陣中的語義字母編碼一一對(duì)應(yīng),每一行的4列分別為對(duì)應(yīng)語義字母在詞首,詞中,詞尾,單獨(dú)出現(xiàn)時(shí)的顯示字母編碼;
[0025]替換單元,用于依據(jù)所述選型單元的選型結(jié)果替換所述源字符串中的語義字母得到最終用于顯示的目標(biāo)字符串,并用目標(biāo)字符串替換所述文件中以目標(biāo)語言基本區(qū)編碼表達(dá)的文字內(nèi)容。
[0026]進(jìn)一步地,所述選型單元包括:[0027]行下標(biāo)確定單元,用于確定源字符串中當(dāng)前待處理的語義字母編碼在所述基本區(qū)編碼矩陣中的行下標(biāo);
[0028]位置判斷單元,用于根據(jù)所述當(dāng)前待處理的語義字母前后是否連接其它語義字母來確定該語義字母在詞首,詞中,詞尾或單獨(dú)形式;
[0029]列下標(biāo)確定單元,用于根據(jù)所述擴(kuò)展區(qū)編碼矩陣的列下標(biāo)與字形的對(duì)應(yīng)關(guān)系,確定顯示所述當(dāng)前待處理的語義字母所采用的字形在所述擴(kuò)展區(qū)編碼矩陣中對(duì)應(yīng)的列下標(biāo);
[0030]所述替換單元依據(jù)所述選型單元確定的行下標(biāo)和列下標(biāo)從所述擴(kuò)展區(qū)編碼矩陣中讀取與所述當(dāng)前待處理的語義字母的顯示字形相對(duì)應(yīng)的顯示字母編碼,替換源字符串中所述當(dāng)前待處理的語義字母。
[0031]進(jìn)一步地,所述基本區(qū)編碼矩陣和所述擴(kuò)展區(qū)編碼矩陣通過數(shù)組來構(gòu)造;
[0032]所述行下標(biāo)確定單元通過用所述當(dāng)前待處理的語義字母編碼減去所述基本區(qū)編碼矩陣中的首行語義字母編碼,將得到的偏移量確定為所述行下標(biāo)。
[0033]進(jìn)一步地,所述文件為標(biāo)簽語言格式的網(wǎng)頁文件,所述獲取單元從所述標(biāo)簽中獲取所述源字符串,當(dāng)所述網(wǎng)頁文件中包含多個(gè)以目標(biāo)語言基本區(qū)編碼組成的源字符串時(shí),所述獲取單元從所述網(wǎng)頁文件中獲取每個(gè)源字符串形成源字符串列表,并使用與源字符串--對(duì)應(yīng)的占位符替換所述網(wǎng)頁文件中對(duì)應(yīng)的每個(gè)源字符串;
[0034]所述選型單元及替換單元在完成所有源字符串到目標(biāo)字符串的選型替換后,所述替換單元根據(jù)所述占位符將與各源字符串對(duì)應(yīng)的目標(biāo)字符串替換到所述網(wǎng)頁文件中。
[0035]本發(fā)明在目標(biāo)語言的字符集編碼的基礎(chǔ)上,提取出基本區(qū)編碼矩陣和擴(kuò)展區(qū)編碼矩陣,基于矩陣數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn)對(duì)應(yīng)語義字母到顯示字母的選型替換,提高了選型替換的處理效率。本發(fā)明可應(yīng)用于桌面操作系統(tǒng)、智能移動(dòng)終端操作系統(tǒng)或?yàn)g覽器等應(yīng)用程序當(dāng)中,實(shí)現(xiàn)對(duì)維哈柯文的以正確的書寫習(xí)慣進(jìn)行顯示。
【專利附圖】
【附圖說明】
[0036]圖1為本發(fā)明一實(shí)施例提供一種維哈柯文顯示方法的步驟流程圖;
[0037]圖2為本發(fā)明一實(shí)施例提供的維文基本區(qū)編碼矩陣與擴(kuò)展區(qū)編碼矩陣的對(duì)應(yīng)關(guān)系不意圖;
[0038]圖3為本發(fā)明一實(shí)施例提供的維文的顯示裝置模塊功能結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0039]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,以下舉實(shí)施例并參照附圖,對(duì)本發(fā)明進(jìn)一步詳細(xì)說明。
[0040]需要的說明的是,本發(fā)明的發(fā)明名稱雖然包括了維文、哈文和柯文三種語言文字類型,但其含義不應(yīng)理解為限定本發(fā)明只能應(yīng)用于上述三種語言同時(shí)出現(xiàn)的情況,應(yīng)理解為本發(fā)明既可應(yīng)用于其中任意一種語言單獨(dú)顯示的情況,也可應(yīng)用于上述三種語言中的任意兩種混排或三種混排顯示的情況,以及上述三種語言中的任意一種或多種與其它語言文字進(jìn)行混排顯示的情況,例如同中文、英文等進(jìn)行混排的情況。
[0041]本發(fā)明一具體實(shí)施例中,針對(duì)維哈柯文提供了一種高效的顯示方法,該方法的核心思想是采用了基于矩陣數(shù)據(jù)結(jié)構(gòu)的選型算法,該算法可應(yīng)用于任何需要對(duì)上述語言進(jìn)行顯示的軟件環(huán)境中,例如在安卓Android系統(tǒng)中編程實(shí)現(xiàn)該方法,以實(shí)現(xiàn)在Android系統(tǒng)中以正確的字母連接形式顯示上述語言文字。該方法包括如下步驟:
[0042]步驟101、獲取以目標(biāo)語言的基本區(qū)編碼組成的源字符串,所述目標(biāo)語言為維文,哈文,柯文中的任一種或多種的組合;
[0043]當(dāng)目標(biāo)語言與其他任意一種語言文字同在一個(gè)待顯示的文件或緩沖區(qū)中時(shí),首先需要從文件或緩沖區(qū)中將以目標(biāo)語言的基本區(qū)編碼組成的源字符串讀取出來。這里的源字符串是指還未經(jīng)過選型替換的以基本區(qū)編碼組成的原始字符串,對(duì)應(yīng)將經(jīng)選型替換后的能夠以正確的字形進(jìn)行顯示的結(jié)果字符串稱為目標(biāo)字符串。
[0044]步驟102、針對(duì)所述源字符串中的每一個(gè)語義字母,基于所述目標(biāo)語言的基本區(qū)編碼矩陣及所述目標(biāo)語言的用于顯示的擴(kuò)展區(qū)編碼矩陣,進(jìn)行選型替換;
[0045]所述基本區(qū)編碼矩陣為N行I列,由目標(biāo)語言的語義字母編碼依據(jù)編碼順序構(gòu)成,所述N由目標(biāo)語言包含語義字母的基本區(qū)編碼范圍確定,該矩陣的每一行對(duì)應(yīng)目標(biāo)語言的一個(gè)基本區(qū)編碼;
[0046]所示擴(kuò)展區(qū)編碼矩陣為N行4列,由目標(biāo)語言的顯示字母編碼依據(jù)編碼順序構(gòu)成,該矩陣的每一行分別與所述基本區(qū)編碼矩陣中的語義字母編碼一一對(duì)應(yīng),每一行的4列分別為對(duì)應(yīng)語義字母在詞首,詞中,詞尾,單獨(dú)出現(xiàn)時(shí)的顯示字母編碼。
[0047]該步驟在目標(biāo)語言的字符集編碼的基礎(chǔ)上,提取出基本區(qū)編碼矩陣和擴(kuò)展區(qū)編碼矩陣,基于矩陣數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn)對(duì)應(yīng)語義字母到顯示字母的選型替換,提高了選型替換的處理效率。
[0048]本發(fā)明不限定所采用的矩陣數(shù)據(jù)結(jié)構(gòu)的具體實(shí)現(xiàn)方式,例如可以采用數(shù)組方式模擬實(shí)現(xiàn)矩陣對(duì)象或直接使用編程軟件提供的矩陣對(duì)象等。
[0049]步驟103、輸出經(jīng)選型替換后的能夠以正確的字形進(jìn)行顯示的目標(biāo)字符串;
[0050]本發(fā)明實(shí)施例中以新疆維吾爾自治區(qū)地方標(biāo)準(zhǔn)DB65/2190-2005 (信息交換用維吾爾文、哈薩克文、柯爾克孜文編碼字符集、基本集與擴(kuò)展集)中所定義的維哈柯文字符集為例進(jìn)行描述,但這并不代表本發(fā)明受限于該標(biāo)準(zhǔn),應(yīng)理解為本發(fā)明所提供的技術(shù)方案可以應(yīng)用于任何遵循類似上述三種語言編碼規(guī)則的任何語言的字符集或編碼集合。
[0051]由于維文、哈文和柯文同屬于阿爾泰語系突厥語族,三種語言的字母、單詞、語法、書寫習(xí)慣等都基本相似,只有少量的區(qū)別,三種語言基本區(qū)編碼整合后編碼范圍在(十六進(jìn)制):0600?06FF之內(nèi),三種語言的名義字母都位于這個(gè)編碼區(qū)域范圍內(nèi),基本區(qū)編碼用于上述三種語言文字信息的傳輸、交換、處理、存儲(chǔ)。三種語言的擴(kuò)展區(qū)編碼范圍為(十六進(jìn)制):FB50?FDFF和FE70?FEFF,顯示字母都位于擴(kuò)展區(qū)編碼范圍內(nèi),擴(kuò)展區(qū)編碼用于信息的顯示,不用于信息交換、傳輸及存儲(chǔ)。
[0052]本發(fā)明一具體實(shí)施例分別給出三種語言所使用的基本區(qū)編碼矩陣和擴(kuò)展區(qū)編碼矩陣。
[0053]維吾爾文專用的名義字母編碼有:0698,062E,063A ;專用的顯示字母編碼為:FB8A, FB8B, FEA5, FEA6, FEA7, FEA8, FECD,F(xiàn)ECE, FECF, FED0。如表 I 所示,為維文對(duì)應(yīng)基本區(qū)編碼矩陣和擴(kuò)展區(qū)編碼矩陣:
[0054]表I[0055]
【權(quán)利要求】
1.一種維哈柯文顯示方法,其特征在于,該方法包括: 獲取以目標(biāo)語言的基本區(qū)編碼組成的源字符串,所述目標(biāo)語言為維文,哈文,柯文中的任一種或多種的組合; 針對(duì)所述源字符串中的每一個(gè)語義字母,基于所述目標(biāo)語言的基本區(qū)編碼矩陣及所述目標(biāo)語言的擴(kuò)展區(qū)編碼矩陣,進(jìn)行選型替換后輸出用于顯示的目標(biāo)字符串; 所述基本區(qū)編碼矩陣為N行I列,由目標(biāo)語言的語義字母編碼依據(jù)編碼順序構(gòu)成,所述N由目標(biāo)語言包含語義字母的基本區(qū)編碼范圍確定,該矩陣的每一行對(duì)應(yīng)目標(biāo)語言的一個(gè)基本區(qū)編碼; 所示擴(kuò)展區(qū)編碼矩陣為N行4列,由目標(biāo)語言的顯示字母編碼依據(jù)編碼順序構(gòu)成,該矩陣的每一行分別與所述基本區(qū)編碼矩陣中的語義字母編碼一一對(duì)應(yīng),每一行的4列分別為對(duì)應(yīng)語義字母在詞首、詞中、詞尾、單獨(dú)出現(xiàn)時(shí)的顯示字母編碼。
2.如權(quán)利要求1所述的方法,其特征在于,所述選型替換的處理步驟包括: 從所述源字符串中獲取當(dāng)前待處理的語義字母編碼,基于該語義字母編碼在所述基本區(qū)編碼矩陣中定位,確定該語義字母編碼在所述基本區(qū)編碼矩陣中的行下標(biāo); 根據(jù)所述當(dāng)前待處理的語義字母前后是否連接其它語義字母來確定該語義字母在詞首,詞中,詞尾或單獨(dú)形式,基于所述擴(kuò)展區(qū)編碼矩陣的列下標(biāo)與字形的對(duì)應(yīng)關(guān)系,確定顯示該語義字母的字形在所述擴(kuò)展區(qū)編碼矩陣中的列下標(biāo); 根據(jù)所確定的所述行下標(biāo)和列下標(biāo)從所述擴(kuò)展區(qū)編碼矩陣中讀取所述當(dāng)前待處理的語義字母對(duì)應(yīng)的顯示字母編碼,執(zhí)行字符替換。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基本區(qū)編碼矩陣和所述擴(kuò)展區(qū)編碼矩陣通過數(shù)組來構(gòu)造;` 所述基于該語義字母的編碼在所述基本區(qū)編碼矩陣中定位,確定該語義字母在所述基本區(qū)編碼矩陣中的行下標(biāo)的方法具體為:用所述當(dāng)前待處理的語義字母編碼減去所述基本區(qū)編碼矩陣中的首行語義字母編碼獲得偏移量,將所述偏移量確定為所述行下標(biāo)。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,當(dāng)以文件為單位對(duì)文件中所包含至少一個(gè)源字符串進(jìn)行選型替換時(shí),所述方法還包括: 根據(jù)目標(biāo)語言的基本區(qū)編碼范圍從所述文件中獲取每個(gè)源字符串形成源字符串列表,并使用與源字符串一一對(duì)應(yīng)的占位符替換所述文件中對(duì)應(yīng)的每個(gè)源字符串; 從所述源字符串列表中獲取所述源字符串,通過所述的對(duì)源字符串進(jìn)行選型替換的步驟獲得目標(biāo)字符串后,根據(jù)所述占位符用得到的目標(biāo)字符串替換所述文件中對(duì)應(yīng)位置的源字符串。
5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法,其特征于, 所述方法應(yīng)用于瀏覽器中,所述文件為本地網(wǎng)頁文件或加載的WEB服務(wù)器端的網(wǎng)頁文件;或 所述方法以應(yīng)用程序接口的形式集成到操作系統(tǒng)當(dāng)中,以供上層應(yīng)用在需要時(shí)加載使用。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述方法應(yīng)用于智能移動(dòng)終端的操作系統(tǒng)或應(yīng)用軟件當(dāng)中。
7.—種維哈柯文顯示裝置,其特征在于,該裝置用于將文件內(nèi)容中以目標(biāo)語言基本區(qū)編碼表達(dá)的文字內(nèi)容替換為以目標(biāo)語言擴(kuò)展區(qū)編碼表達(dá)的文字內(nèi)容;所述目標(biāo)語言為維文,哈文,柯文中的任一種;該裝置包括: 獲取單元,用于根據(jù)目標(biāo)語言的基本區(qū)編碼范圍從文件內(nèi)容中獲取以目標(biāo)語言基本區(qū)編碼組成的源字符串; 選型單元,用于基于所述目標(biāo)語言的基本區(qū)編碼矩陣及所述目標(biāo)語言的擴(kuò)展區(qū)編碼矩陣,對(duì)所述源字符串中的語義字母進(jìn)行選型處理;所述基本區(qū)編碼矩陣為N行I列,由目標(biāo)語言的語義字母編碼依據(jù)編碼順序構(gòu)成,所述N由目標(biāo)語言包含語義字母的基本區(qū)編碼范圍確定,該矩陣的每一行對(duì)應(yīng)目標(biāo)語言的一個(gè)基本區(qū)編碼;所示擴(kuò)展區(qū)編碼矩陣為N行4列,由目標(biāo)語言的顯示字母編碼依據(jù)編碼順序構(gòu)成,該矩陣的每一行分別與所述基本區(qū)編碼矩陣中的語義字母編碼一一對(duì)應(yīng),每一行的4列分別為對(duì)應(yīng)語義字母在詞首、詞中、詞尾、單獨(dú)出現(xiàn)時(shí)的顯示字母編碼; 替換單元,用于依據(jù)所述選型單元的選型結(jié)果替換所述源字符串中的語義字母得到最終用于顯示的目標(biāo)字符串,并用目標(biāo)字符串替換所述文件中以目標(biāo)語言基本區(qū)編碼表達(dá)的文字內(nèi)容。
8.如權(quán)利要求7所述的裝置,其特征在于,所述選型單元包括: 行下標(biāo)確定單元,用于確定源字符串中當(dāng)前待處理的語義字母編碼在所述基本區(qū)編碼矩陣中的行下標(biāo); 位置判斷單元,用于根據(jù)所述當(dāng)前待處理的語義字母前后是否連接其它語義字母來確定該語義字母在詞首,詞中,詞尾或單獨(dú)形式; 列下標(biāo)確定單元,用于根據(jù)所述擴(kuò)展區(qū)編碼矩陣的列下標(biāo)與字形的對(duì)應(yīng)關(guān)系,確定顯示所述當(dāng)前待處理的語義字母所 采用的字形在所述擴(kuò)展區(qū)編碼矩陣中對(duì)應(yīng)的列下標(biāo); 所述替換單元依據(jù)所述選型單元確定的行下標(biāo)和列下標(biāo)從所述擴(kuò)展區(qū)編碼矩陣中讀取與所述當(dāng)前待處理的語義字母的顯示字形相對(duì)應(yīng)的顯示字母編碼,替換源字符串中所述當(dāng)前待處理的語義字母。
9.如權(quán)利要求8所述的裝置,其特征在于, 所述基本區(qū)編碼矩陣和所述擴(kuò)展區(qū)編碼矩陣通過數(shù)組來構(gòu)造; 所述行下標(biāo)確定單元通過用所述當(dāng)前待處理的語義字母編碼減去所述基本區(qū)編碼矩陣中的首行語義字母編碼,將得到的偏移量確定為所述行下標(biāo)。
10.如權(quán)利要求8所述的裝置,其特征在于,所述文件為標(biāo)簽語言格式的網(wǎng)頁文件,所述獲取單元從所述標(biāo)簽中獲取所述源字符串,當(dāng)所述網(wǎng)頁文件中包含多個(gè)以目標(biāo)語言基本區(qū)編碼組成的源字符串時(shí),所述獲取單元從所述網(wǎng)頁文件中獲取每個(gè)源字符串形成源字符串列表,并使用與源字符串一一對(duì)應(yīng)的占位符替換所述網(wǎng)頁文件中對(duì)應(yīng)的每個(gè)源字符串; 所述選型單元及替換單元在完成所有源字符串到目標(biāo)字符串的選型替換后,所述替換單元根據(jù)所述占位符將與各源字符串對(duì)應(yīng)的目標(biāo)字符串替換到所述網(wǎng)頁文件中。
【文檔編號(hào)】G06F17/21GK103870439SQ201410063620
【公開日】2014年6月18日 申請(qǐng)日期:2014年2月24日 優(yōu)先權(quán)日:2014年2月24日
【發(fā)明者】舒泓新, 阿斯木·阿不力孜, 熱依拉·阿布都許庫爾 申請(qǐng)人:中通服公眾信息產(chǎn)業(yè)股份有限公司