專利名稱:輸入法智能性評測系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機(jī)輸入法技術(shù)領(lǐng)域,特別涉及一種輸入法智能性評測系統(tǒng)和方法。
背景技術(shù):
目前市場上輸入法種類繁多,成熟的商業(yè)輸入法功能全面,通常包含單字輸入、詞 語輸入、整句輸入等多種輸入方式。其中,在整句輸入方式下,用戶的輸入思維能夠保持連 貫,用戶能夠更加專注于輸入內(nèi)容本身,而不是輸入過程。整句輸入方式成為當(dāng)前用戶的主 要輸入方式。輸入法在整句輸入方式下的性能表現(xiàn),是輸入法智能性的直接體現(xiàn)。
對于一款輸入法軟件,如何評價輸入法的智能性呢?目前主要的評測方式為人工 評測。即,在開發(fā)過程中,由開發(fā)人員根據(jù)自己的個人習(xí)慣和喜好,挑選待輸入的語句,用輸 入法進(jìn)行輸入,觀察輸入法給出的候選輸出是否符合預(yù)期,從而判斷輸入法的智能性高低。 這種方法的局限性在于,評測人員以及評測用例的代表性有限——代表的是相同類型用戶 的特定的輸入需求——使得測試結(jié)果的偏差較大。并且,評測人員對于輸入法的智能性只 能夠給出模糊的評價,如很好、好、還不錯、不好等等,這些評價不夠精確;在智能性沒有 明顯提高或降低的情況下,這些評價的區(qū)分度也不大。還有一種評測方法,就是將輸入法發(fā) 布,直接讓廣大輸入法用戶進(jìn)行評測。但由于此時輸入法軟件產(chǎn)品已經(jīng)發(fā)布,如果智能性較 之前有所下降,則對廣大用戶來講是一種損害;并且當(dāng)產(chǎn)品發(fā)布周期較長時,這種做法是對 用戶的不負(fù)責(zé)任。
可見,現(xiàn)有的輸入法智能性評測方法均無法自動、客觀地評測輸入法軟件的智能 性。發(fā)明內(nèi)容
本發(fā)明實施例提出一種輸入法智能性評測系統(tǒng)和方法,能夠自動、客觀地評價輸 入法軟件的智能性水平。
本發(fā)明的技術(shù)方案是這樣實現(xiàn)的
一種輸入法智能性評測系統(tǒng),包括
測試集采集裝置,用于采集測試集,將所述測試集提供給評測服務(wù)器;
所述評測服務(wù)器,用于利用所述測試集對所述輸入法軟件的智能性進(jìn)行評測。
其中,上述測試集采集裝置包括
網(wǎng)頁抓取器,用于抓取不同類別網(wǎng)頁的內(nèi)容,生成網(wǎng)頁文本,將所述網(wǎng)頁文本發(fā)送 至網(wǎng)頁文本過濾器;所述網(wǎng)頁的類別包括聊天網(wǎng)頁、微博網(wǎng)頁、論壇網(wǎng)頁、博客網(wǎng)頁、搜索 網(wǎng)頁或正式文檔網(wǎng)頁;
所述網(wǎng)頁文本過濾器,用于對所述網(wǎng)頁文本進(jìn)行過濾,生成測試集,并將所述測試 集提供給評測服務(wù)器。
評測服務(wù)器包括
拼音標(biāo)注工具,用于生成所述測試集中的原始文字所對應(yīng)的拼音序列;
按鍵產(chǎn)生器,用于將所述拼音序列轉(zhuǎn)換為計算機(jī)按鍵的按鍵序列,并將所述按鍵序列輸入到所述輸入法軟件,產(chǎn)生文字輸出結(jié)果;
文本校對器,用于將所述測試集中的原始文字和所述文字輸出結(jié)果進(jìn)行比對,得到所述輸入法軟件的智能性指標(biāo)。
輸入法軟件的智能性指標(biāo)為句準(zhǔn)確率、字準(zhǔn)確率或測試集的迷惑度;其中,
所述句準(zhǔn)確率等于所述比對結(jié)果一致的句子數(shù)與測試集中的句子數(shù)的商;
所述字準(zhǔn)確率等于所述比對結(jié)果一致的文字?jǐn)?shù)與測試集中的原始文字?jǐn)?shù)的商;
測試集的迷惑度的計算方式為
權(quán)利要求
1.一種輸入法智能性評測系統(tǒng),用于評測預(yù)先選定的輸入法軟件的智能性,其特征在于,所述系統(tǒng)包括 測試集采集裝置,用于采集測試集,將所述測試集提供給評測服務(wù)器; 所述評測服務(wù)器,用于利用所述測試集對所述輸入法軟件的智能性進(jìn)行評測。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述測試集采集裝置包括 網(wǎng)頁抓取器,用于抓取不同類別網(wǎng)頁的內(nèi)容,生成網(wǎng)頁文本,將所述網(wǎng)頁文本發(fā)送至網(wǎng)頁文本過濾器;所述網(wǎng)頁的類別包括聊天網(wǎng)頁、微博網(wǎng)頁、論壇網(wǎng)頁、博客網(wǎng)頁、搜索網(wǎng)頁或正式文檔網(wǎng)頁; 所述網(wǎng)頁文本過濾器,用于對所述網(wǎng)頁文本進(jìn)行過濾,生成測試集,并將所述測試集提供給評測服務(wù)器。
3.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述評測服務(wù)器包括 拼音標(biāo)注工具,用于生成所述測試集中的原始文字所對應(yīng)的拼音序列; 按鍵產(chǎn)生器,用于將所述拼音序列轉(zhuǎn)換為計算機(jī)按鍵的按鍵序列,并將所述按鍵序列輸入到所述輸入法軟件,產(chǎn)生文字輸出結(jié)果; 文本校對器,用于將所述測試集中的原始文字和所述文字輸出結(jié)果進(jìn)行比對,得到所述輸入法軟件的智能性指標(biāo)。
4.根據(jù)權(quán)利要求3所述的系統(tǒng),其特征在于,所述輸入法軟件的智能性指標(biāo)為句準(zhǔn)確率、字準(zhǔn)確率或測試集的迷惑度;其中, 所述句準(zhǔn)確率等于所述比對結(jié)果一致的句子數(shù)與測試集中的句子數(shù)的商; 所述字準(zhǔn)確率等于所述比對結(jié)果一致的文字?jǐn)?shù)與測試集中的原始文字?jǐn)?shù)的商; 測纖的迷惑度的計算方式為
5.根據(jù)權(quán)利要求1至4任意一項所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括 代碼管理服務(wù)器,用于接收并保存外界輸入的輸入法軟件代碼,所述輸入法軟件代碼是根據(jù)所述輸入法軟件的智能性評測結(jié)果生成的; 輸入法資源生成裝置,用于生成優(yōu)化詞典和優(yōu)化語言模型; 自動編譯機(jī),用于根據(jù)所述輸入法軟件代碼、優(yōu)化詞典和優(yōu)化語言模型生成優(yōu)化的輸入法軟件,將所述優(yōu)化的輸入法軟件輸入評測服務(wù)器,供評測服務(wù)器對其智能性進(jìn)行評測。
6.一種輸入法智能性評測方法,應(yīng)用權(quán)利要求1所述的系統(tǒng)評測預(yù)先選定的輸入法軟件的智能性,其特征在于,所述方法包括 測試集采集裝置采集測試集,將所述測試集提供給評測服務(wù)器;所述評測服務(wù)器利用所述測試集對所述輸入法軟件的智能性進(jìn)行評測。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述采集測試集的過程包括 抓取不同類別網(wǎng)頁的內(nèi)容,生成網(wǎng)頁文本,對所述網(wǎng)頁文本進(jìn)行過濾,生成測試集;其中,所述網(wǎng)頁的類別包括聊天網(wǎng)頁、微博網(wǎng)頁、論壇網(wǎng)頁、博客網(wǎng)頁、搜索網(wǎng)頁或正式文檔網(wǎng)頁。
8.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述評測服務(wù)器利用測試集對輸入法軟件的智能性進(jìn)行評測的過程包括 生成所述測試集中的原始文字所對應(yīng)的拼音序列;將所述拼音序列轉(zhuǎn)換為計算機(jī)按鍵的按鍵序列,并將所述按鍵序列輸入到所述輸入法軟件,產(chǎn)生文字輸出結(jié)果;將所述測試集中的原始文字和所述文字輸出結(jié)果進(jìn)行比對,得到所述輸入法軟件的智能性指標(biāo)。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述輸入法軟件的智能性指標(biāo)為句準(zhǔn)確率、字準(zhǔn)確率或測試集的迷惑度;其中, 所述句準(zhǔn)確率等于所述比對結(jié)果一致的句子數(shù)與測試集中的句子數(shù)的商; 所述字準(zhǔn)確率等于所述比對結(jié)果一致的文字?jǐn)?shù)與測試集中的原始文字?jǐn)?shù)的商;測纖的迷惑度的計算方式為
10.根據(jù)權(quán)利要求6至9任意一項所述的方法,其特征在于,所述方法還包括 接收外界輸入的輸入法軟件代碼,所述輸入法軟件代碼是根據(jù)所述輸入法軟件的智能性評測結(jié)果生成的; 生成優(yōu)化詞典和優(yōu)化語言模型; 根據(jù)所述輸入法軟件代碼、優(yōu)化詞典和優(yōu)化語言模型生成優(yōu)化的輸入法軟件,將所述優(yōu)化的輸入法軟件輸入評測服務(wù)器,供評測服務(wù)器對其智能性進(jìn)行評測。
全文摘要
本發(fā)明提出一種輸入法智能性評測系統(tǒng)和方法,用于評測預(yù)先選定的輸入法軟件的智能性,其中系統(tǒng)包括測試集采集裝置,用于采集測試集,將所述測試集提供給評測服務(wù)器;所述評測服務(wù)器,用于利用所述測試集對所述輸入法軟件的智能性進(jìn)行評測。本發(fā)明能夠自動、客觀地評價輸入法軟件的智能性水平。
文檔編號G06F11/36GK103019924SQ20111028563
公開日2013年4月3日 申請日期2011年9月23日 優(yōu)先權(quán)日2011年9月23日
發(fā)明者司天歌, 曹菲, 侯杰, 周楊, 肖鏡輝, 劉廷超, 楊洋, 周曉波 申請人:騰訊科技(深圳)有限公司