專利名稱:動態(tài)數(shù)據(jù)庫重排序系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對從數(shù)據(jù)庫中提取的元素的排序。特別是,本發(fā)明涉及通過用戶實(shí)際選擇的數(shù)據(jù)庫元素的順序?qū)υ醋詳?shù)據(jù)庫的顯示元素的排序。
背景技術(shù):
技術(shù)進(jìn)步已經(jīng)使制造商造出各種小型個人電子裝置。如個人數(shù)字助理(PDA)、蜂窩電話、小形狀系數(shù)(small-form-factor)的數(shù)據(jù)輸入單元、和其它小形狀系數(shù)的通信單元。
由于這些小型電子數(shù)據(jù)裝置的尺寸減小,使得這些裝置上的數(shù)據(jù)輸入鍵盤的尺寸也在縮小。減小鍵盤尺寸的方案是減少鍵盤上按鍵的數(shù)量。減少按鍵的數(shù)量產(chǎn)生了許多問題。最明顯的問題是,造成如在一蜂窩電話上的鍵盤超載。一個單鍵可能代表許多字符。當(dāng)使用已縮減按鍵數(shù)的鍵盤裝置輸入文本時,會使用戶輸入任何合理量的文本變得又慢又難。超載按鍵通常需要多次按鍵處理來獲取正確字符。
鍵盤消除歧義系統(tǒng)(比如,本申請人所擁有的美國專利US5818437、US5953541、US6011554和US6286064公開的鍵盤消除歧義系統(tǒng))通過處理用戶鍵擊,形成與按壓按鍵相關(guān)聯(lián)的單詞,將單詞呈現(xiàn)給用戶,來解決文本輸入問題。呈現(xiàn)給用戶的完整的單詞開始于由按鍵按壓所代表的字母。呈現(xiàn)與按鍵按壓關(guān)聯(lián)的一列單詞使用戶節(jié)約了為拼寫整個單詞的附加鍵擊輸入,同時還節(jié)省了時間。用戶只需選擇該列的第一個單詞或者向下滾動來選擇所需的單詞。
呈現(xiàn)給用戶的單詞被存儲在詞匯數(shù)據(jù)庫中。本申請人所擁有的美國專利US5818437、US5953541、US6011554和US6286064公開的詞匯數(shù)據(jù)庫就是一個例子。
另一個例子是摩托羅拉公司(Schaumburg,IL)的iTap,它在蜂窩電話上執(zhí)行預(yù)測的小鍵盤文本輸入。iTap系統(tǒng)還將預(yù)測的單詞顯示給用戶。然而,iTap不能以用戶實(shí)際選擇單詞為基礎(chǔ),對顯示給用戶的單詞排序。這樣一個特征(排序特征)將極大地便于用戶節(jié)約更多的時間,并且能夠使用戶更快和更有效地輸入文本。
提供一個動態(tài)數(shù)據(jù)庫重排序系統(tǒng)將是有利的,該系統(tǒng)能夠根據(jù)用戶實(shí)際的使用單詞的情況,將與按鍵按壓相關(guān)聯(lián)的單詞以一定的順序顯示給用戶。提供一個不在主數(shù)據(jù)庫中存儲使用信息的頻度的動態(tài)數(shù)據(jù)庫重排序系統(tǒng),也將是有利的。
發(fā)明內(nèi)容
本發(fā)明提供了一種動態(tài)數(shù)據(jù)庫重排序系統(tǒng)。本發(fā)明以基于用戶實(shí)際使用單詞(如果有的話)的順序向用戶顯示與按鍵按壓相關(guān)聯(lián)的單詞。此外,本發(fā)明不在主數(shù)據(jù)庫中存儲使用信息的頻度,從而需要最小的存儲空間。
本發(fā)明的優(yōu)選實(shí)施例提供了一種包含根據(jù)語言模型排序的單詞的語言數(shù)據(jù)庫,該語言模型支配被呈現(xiàn)給用戶的單詞的排序。用戶在通信裝置的小鍵盤上輸入鍵擊。在用戶按壓按鍵輸入的同時,本發(fā)明預(yù)測用戶正在試圖輸入的單詞、字母、數(shù)字或者截短單詞(word stub)。完成的單詞被動態(tài)地顯示給用戶,而那些單詞開始于由按鍵按壓所代表的字母。用戶通常按壓與數(shù)據(jù)庫中一個以上單詞相關(guān)聯(lián)的按鍵序列。為了節(jié)省貯存語言數(shù)據(jù)庫的空間,首先對語言數(shù)據(jù)庫預(yù)排序,然后再置入產(chǎn)品中。
本發(fā)明提供了基于用戶的系統(tǒng)使用情況對語言模型順序的重新排序。如果有一個以上的單詞共享相同的按鍵序列,則最常使用的單詞作為第一選擇顯示于顯示目錄中。如果用戶不需要該單詞,而是要與按鍵序列相關(guān)聯(lián)的另一個單詞,則用戶可以通過按壓下一按鍵或者按壓上/下翻滾按鍵,來翻滾單詞的顯示目錄。一旦用戶發(fā)現(xiàn)了所需的單詞,用戶就激活一個選擇按鍵,于是系統(tǒng)在插入點(diǎn)將所需的單詞輸入到用戶的文本消息中。
本發(fā)明的優(yōu)先實(shí)施例跟蹤用戶的單詞選擇。一旦一個單詞已經(jīng)被選擇為下一按鍵選擇的結(jié)果(接續(xù)單詞),就把一個頻度值應(yīng)用于該所選單詞,并通過語言數(shù)據(jù)庫中的語言模型將該單詞列在該按鍵序列的關(guān)聯(lián)單詞的首位。
當(dāng)一個單詞第一次被用戶接續(xù)選擇(nexted),接續(xù)單詞的頻度值通常低于顯示目錄中第一排序單詞的頻度值。在該接續(xù)單詞再次被接續(xù)選擇時,相對于第一排序單詞的頻度值,該接續(xù)單詞的頻度值增加。每次選擇一個單詞時,都會調(diào)整頻度值。
本發(fā)明另一個實(shí)施例查找接續(xù)單詞在顯示目錄中的位置。如果接續(xù)單詞被定位在顯示目錄中的第二單詞之后,則將該接續(xù)單詞提升到第二單詞位置。這使接續(xù)單詞頻度增加到第二單詞的頻度或者高于第二單詞頻度的頻度,但是低于第一單詞的頻度。
當(dāng)接續(xù)單詞再三接續(xù)同一單詞時,該接續(xù)單詞的頻度值將變得大于第一顯示單詞的頻度值。隨后,用戶輸入用于接續(xù)單詞和第一排序單詞的按鍵序列會導(dǎo)致,該接續(xù)單詞顯示在由語言模型第一排序的單詞之前。
在本發(fā)明的一個實(shí)施例中,當(dāng)一個單詞被接續(xù)選擇的次數(shù)為第一排序單詞的三倍(或預(yù)定數(shù))以上時,該單詞的頻度變得大于第一排序單詞或者其它具有較高頻度的單詞。
本發(fā)明的其它方面和優(yōu)點(diǎn)將通過下面結(jié)合附圖的詳細(xì)說明,變得更加清楚,其中附圖通過實(shí)施例說明了本發(fā)明的原理。
圖1是根據(jù)本發(fā)明原理的具有簡化鍵盤的便攜通信裝置的示意圖;圖2是根據(jù)本發(fā)明原理的蜂窩電話鍵盤的示意圖;圖3是根據(jù)本發(fā)明原理的一個任務(wù)觀點(diǎn)的方框示意圖;圖4是根據(jù)本發(fā)明原理的語言、制造商、用戶數(shù)據(jù)庫成分的方框示意圖;圖5是根據(jù)本發(fā)明原理的存儲于用戶數(shù)據(jù)庫中的頻度信息的示意圖。
具體實(shí)施例方式
本發(fā)明被實(shí)施于動態(tài)數(shù)據(jù)庫重排序系統(tǒng)。本發(fā)明的系統(tǒng)以基于用戶實(shí)際使用單詞(如果有的話)的順序向用戶顯示與按鍵按壓關(guān)聯(lián)的單詞。此外,本發(fā)明不在主數(shù)據(jù)庫中存儲使用信息的頻度,從而需求最小的存儲空間。
本發(fā)明的一個優(yōu)選實(shí)施例提供了一種方法,該方法可向用戶顯示從語言數(shù)據(jù)庫中檢索得到的結(jié)果,而此結(jié)果與用戶在鍵盤上的按鍵按壓相匹配。將源自顯示結(jié)果的由用戶選擇的任何單詞賦予一由用戶的單詞使用模式確定的頻度值。該頻度值最好不存儲在主語言數(shù)據(jù)庫中,并且僅把用戶實(shí)際使用的單詞賦予一頻度。用戶使用的不會與其它單詞碰撞的某些單詞不需要有指定的頻度。本方法將所需的存儲量減小到為通常跟蹤用戶的使用所需存儲量的1/7。
參見圖1,這里顯示了一個具有簡化鍵盤的個人通信裝置101。鍵盤消除歧義系統(tǒng)(比如本申請人擁有的美國專利US5818437、US5953541、US6011554和US6286064中公開的鍵盤消除歧義系統(tǒng))解決了輸入按鍵102超載和單一按鍵可代表幾個字符的文本輸入問題。在鍵盤102上用戶的鍵擊被處理并顯示在103上。在用戶按壓按鍵的同時,系統(tǒng)預(yù)測用戶正在試圖輸入的單詞106、107、字母108、數(shù)字109或者截短字(未顯示)。完成的單詞動態(tài)地顯示在105上,而該些單詞開始于按鍵按壓所代表的字母。
呈現(xiàn)與按鍵按壓相關(guān)聯(lián)的單詞目錄使用戶省去了輸入拼寫整個單詞的附加鍵擊,并且還節(jié)省了時間。用戶選擇目錄中的第一單詞,或者向下翻滾目錄并選擇所需的單詞。在該實(shí)施例中,用戶可以按壓空格鍵112,以接受目錄中的第一單詞。所選單詞出現(xiàn)在用戶文本輸入位置104中。用戶還可以繼續(xù)按壓按鍵,以進(jìn)一步縮減或者推敲所顯示單詞的選擇。
呈現(xiàn)給用戶的單詞被存儲在詞匯數(shù)據(jù)庫中。如果通過每個單詞的使用頻度對數(shù)據(jù)庫中的單詞整理,那么,相同的單詞總是以相同的排序呈現(xiàn)在105上給用戶。
本發(fā)明的T9語言數(shù)據(jù)庫(LDB)包含根據(jù)語言模型排序的單詞,該語言模型支配向用戶呈現(xiàn)的單詞的順序。用戶通常按壓與數(shù)據(jù)庫中一個以上單詞關(guān)聯(lián)的按鍵的一個序列。
為了節(jié)省存儲LDB的空間,LDB在裝入產(chǎn)品之前被預(yù)先排序。利用一個語言模型對單詞進(jìn)行排序,該語言模型測量用于數(shù)據(jù)庫中每個單詞的通用頻度值。數(shù)據(jù)庫利用頻度排序來匯編。編譯數(shù)據(jù)庫時,頻度值將不與單詞一起存儲到數(shù)據(jù)庫中,從而減少存儲LDB的空間。
例如,圖2顯示了典型的蜂窩電話鍵盤201。如果語言模型指示單詞“in”具有高于“go”的頻度,那么當(dāng)按此排序選擇傳統(tǒng)蜂窩電話鍵盤上的4按鍵202和6按鍵203時,在顯示目錄中“in”出現(xiàn)在“go”之前。
本發(fā)明提供了根據(jù)用戶對系統(tǒng)的使用情況對語言模型順序進(jìn)行重排序。
再參見圖1,如果一個以上的單詞共享相同按鍵序列,則最常用的單詞將被作為第一選擇呈現(xiàn)在顯示目錄中。如果用戶不需要該單詞,而是要另一個與按鍵序列關(guān)聯(lián)的單詞,那么用戶可以通過按壓0或者NEXT按鍵或者上/下翻滾按鍵(如果有的話),來翻滾單詞的顯示目錄105。一旦用戶發(fā)現(xiàn)了所需的單詞,則用戶可激活一選擇按鍵或者空格鍵112,于是系統(tǒng)在插入點(diǎn)104將所需的單詞輸入到用戶的文本消息103中。
本發(fā)明的優(yōu)選實(shí)施例跟蹤用戶單詞選擇。一旦一單詞被選擇為NEXT按鍵選擇的結(jié)果,就將一頻度值應(yīng)用于所選單詞,并通過LDB的語言模型將該單詞排在與該按鍵序列相關(guān)的單詞列表的首位。應(yīng)用于通過語言模型第一排序單詞的頻度值以及被選作NEXT按鍵(接續(xù)單詞)結(jié)果的單詞依賴于多個因素。一個示例因素包括接續(xù)單詞相對于第一排序單詞的使用通用性。
在用戶接續(xù)選用一個單詞的首次,在顯示目錄中該接續(xù)單詞的頻度值通常低于第一排序單詞的頻度值。該接續(xù)單詞被再次接續(xù)選擇時,相對于第一排序單詞的頻度值,該接續(xù)單詞的頻度值增加。當(dāng)每次選擇一個單詞時,就調(diào)整頻度值。
本發(fā)明的另一個實(shí)施例在顯示目錄中查找接續(xù)單詞的位置。如果該接續(xù)單詞被定位在顯示目錄中的第二單詞之后,那么把接續(xù)單詞提升到第二單詞位置。這將接續(xù)單詞的頻度增加到第二單詞的頻度或高于第二單詞的頻度,但是低于第一單詞的頻度。下面將討論碰撞問題。
在接連接續(xù)相同單詞的某個點(diǎn)上,接續(xù)單詞的頻度值將變得大于第一顯示單詞的頻度值。這樣,對于接續(xù)單詞和第一排序單詞的按鍵序列的隨后的用戶輸入將導(dǎo)致在被由語言模型第一排序的單詞之前顯示該接續(xù)單詞。
在本發(fā)明的一個實(shí)施例中,當(dāng)選擇一個單詞的次數(shù)是第一排序單詞的三倍(或預(yù)定數(shù))以上時,該單詞的頻度變得大于第一排序單詞或者具有較高頻度的其它單詞。
在本發(fā)明的另一個實(shí)施例中,將單詞和該單詞的排序存儲到語言數(shù)據(jù)庫中,并且將作為接續(xù)結(jié)果的頻度值存儲到一個單獨(dú)數(shù)據(jù)庫(一個重排序數(shù)據(jù)庫)中。重排序數(shù)據(jù)庫中由頻度值標(biāo)識的排序的優(yōu)先級高于語言數(shù)據(jù)庫中單詞的排序。當(dāng)頻度值被存儲在語言數(shù)據(jù)庫中時,語言數(shù)據(jù)庫中的頻度為重排序數(shù)據(jù)庫中的頻度提供初始值。
仍在本發(fā)明的另一實(shí)施例中,如果語言數(shù)據(jù)庫中沒有存儲頻度值,則語言數(shù)據(jù)庫中的單詞的排序用來在重排序數(shù)據(jù)庫中合成頻度的初始值。
參見圖3,圖中示出了本發(fā)明的文本處理器的一部分。鍵盤管理器303監(jiān)視用戶的按鍵按壓。每個按鍵按壓被發(fā)送到數(shù)據(jù)庫管理器301。數(shù)據(jù)庫管理器301收集每個按鍵按壓,并執(zhí)行預(yù)測單詞處理。
數(shù)據(jù)庫管理器301訪問在主機(jī)裝置的存儲裝置304上的語言數(shù)據(jù)庫,并且從匹配按鍵按壓的語言數(shù)據(jù)庫中提取第一n個單詞,形成預(yù)測單詞目錄。n值取決于制造商或者用戶推薦的目錄的長度。如果目錄太長,則用于翻滾目錄的鍵擊數(shù)量將大于打字輸入完整單詞所需的按鍵按壓的總量。數(shù)據(jù)庫管理器301將單詞目錄傳送到顯示管理器302。顯示管理器302向用戶顯示單詞的目錄。
當(dāng)每次按壓翻滾按鍵或者選擇按鍵時,鍵盤管理器303通知顯示管理器302。顯示管理器302利用翻滾按鍵按壓增亮顯示目錄中的適當(dāng)單詞。當(dāng)用戶按壓選擇按鍵時,顯示管理器302將所選單詞插入到用戶的文本輸入字段中,并通知數(shù)據(jù)庫管理器301已選擇了該單詞。
如果一個單詞正在被跟蹤,數(shù)據(jù)庫管理器301則調(diào)整所選用單詞的頻度記錄。該頻度通過各用戶單詞使用模式來設(shè)置。本發(fā)明不跟蹤使用的每個單詞。一些單詞不會發(fā)生碰撞并且不需要對頻度計(jì)數(shù)。本發(fā)明對因頻度值彼此相等而出現(xiàn)的碰撞排序。該技術(shù)方案通常將存儲頻度數(shù)據(jù)所需的存儲量減至典型技術(shù)方案所需的1/7。
顯示管理器301必須限制所跟蹤單詞的頻度,因?yàn)槿绻幌拗?,?jì)數(shù)可能超過裝置上寄存器的存儲容量。系統(tǒng)必須適應(yīng)用戶的使用變化。本發(fā)明的老化算法能完成已記錄頻度的計(jì)算,并扣除較老的使用頻度。較老的使用不反映用戶的當(dāng)前習(xí)慣,因此價值低。
該部分詳細(xì)說明了學(xué)習(xí)用戶使用模式以及生成模仿用戶使用模式的顯示部分目錄的過程。
參見圖4,本發(fā)明數(shù)據(jù)庫實(shí)施的一個優(yōu)選實(shí)施例包含一個語言數(shù)據(jù)庫(LDB)401,一個制造商數(shù)據(jù)庫(MDB)402,和一個用戶數(shù)據(jù)庫(UDB)403。語言數(shù)據(jù)庫401是一個固定的預(yù)編輯數(shù)據(jù)庫,含有按照語言模型測量的單詞使用頻度排序的單詞。
制造商數(shù)據(jù)庫402是OEM提供的定制數(shù)據(jù)庫。制造商數(shù)據(jù)庫402是任選的,并且是在除語言數(shù)據(jù)庫401中備有的數(shù)據(jù)庫外,OEM需要一個附加的定制數(shù)據(jù)庫時提供。
用戶數(shù)據(jù)庫403包含用戶定義的多個單詞以及一個重排序數(shù)據(jù)庫(RDB),該重排序數(shù)據(jù)庫是跟蹤用戶選擇的單詞以及這些單詞頻度的用戶數(shù)據(jù)庫403的一個區(qū)域。圖5顯示了某些信息501的示例性說明,這些信息包含在跟蹤用戶單詞使用的用戶數(shù)據(jù)庫403中。該信息列出了每個單詞502的所有字母、單詞503的使用頻度、單詞504的輸入按鍵序列、包含在語言數(shù)據(jù)庫401中的單詞在LDB505中的對象編號。
下面各項(xiàng)在文本中按以下方式使用UDB重排序單詞-一個經(jīng)由單詞選擇添加到RDB上的LDB單詞。
有效單詞-一個具有匹配當(dāng)前LDB的LDB字段的UDB重排序單詞。當(dāng)下面討論老化和垃圾收集算法時,有效單詞的概念是重要的。
最近刪除截止頻度-這是利用垃圾收集算法從RDB中刪除的最近UDB重排序單詞的頻度。
重排序單詞-重排序單詞是其頻度大于或等于最近刪除截止頻度的單詞。這些單詞將排在選擇顯示目錄的首位,它們包括UDB添加單詞和UDB重排序單詞。
UDB添加單詞-UDB添加單詞和UDB單詞具有相同含義;它們涉及已經(jīng)被用戶添加到UDB上的單詞,該單詞或者是由用戶直接添加,或者是由系統(tǒng)檢測到的由用戶構(gòu)成的新單詞。
重排序數(shù)據(jù)庫(RDB)-存儲UDB重排序單詞的UDB部分。RDB駐留在與UDB相同的存儲器內(nèi)或者存儲空間中。
第一單詞和非第一單詞-第一單詞和非第一單詞都是LDB單詞。相對于LDB,第一單詞是第一顯示的LDB單詞,而非第一單詞則不第一顯示。
本發(fā)明的數(shù)據(jù)庫管理器301通過保持跟蹤多個UDB添加單詞和每個UDB重排序單詞的頻度或者使用計(jì)數(shù),學(xué)習(xí)用戶的使用模式。根據(jù)單詞的使用模式更新和設(shè)置每個單詞的使用計(jì)數(shù)(頻度)。使用計(jì)數(shù)被用來為垃圾收集、老化算法確定顯示選擇目錄中的單詞相對位置。
保持對LDB單詞使用模式的跟蹤的第一步驟是將該LDB單詞添加到RDB中。當(dāng)一個單詞被接受時,踢開該添加處理。下面描述接受一個單詞的按鍵事件。一旦一個LDB單詞被添加到RDB上,就將其稱作UDB重排序單詞。表1描述了把單詞添加到RDB上的規(guī)則。在表1中,列涉及選擇目錄中第一對象的類型,行涉及當(dāng)前選擇的對象類型。表中的編號涉及添加規(guī)則,如下表所示表1-添加規(guī)則
基于當(dāng)前選擇對象類型和顯示選擇目錄中的第一項(xiàng)對象類型,該表顯示了以下規(guī)則●規(guī)則_0目錄中的第一對象是UDB添加單詞或是MDB單詞以及所選對象也同樣是UDB添加單詞或是MDB單詞的情況。在這種情況下,顯示選擇目錄中所選對象和第一對象都不會添加到RDB中。
●規(guī)則_1在選擇目錄中的第一對象是LDB第一單詞以及選擇對象是UDB添加單詞的情況下,本發(fā)明將LDB第一單詞(顯示選擇目錄中的第一對象)添加到RDB上。
●規(guī)則_2該規(guī)則應(yīng)用于顯示選擇目錄中的第一對象是LDB第一單詞以及所選對象是LDB非第一單詞的時候。此時這兩個單詞都被添加到RDB中。
●規(guī)則_3當(dāng)選擇對象是LDB單詞(LDB第一或者LDB非第一單詞)以及顯示選擇目錄中的第一對象或者是UDB添加單詞或者是MDB單詞時,將所選的LDB單詞添加到RDB中。
當(dāng)接受有效單詞時,基于添加規(guī)則,該單詞被添加到或者不被添加到RDB上。如果該單詞已經(jīng)在RDB/UDB中,則提升該單詞的頻度。下面描述接受單詞的事件。
●當(dāng)通過切換到一個新語言、注冊或者不注冊MDB、或者終止數(shù)據(jù)庫管理器來改變建立單詞目錄的上下文時。
●當(dāng)按壓右箭頭按鍵時。
●當(dāng)按壓空格鍵時,當(dāng)空格鍵或者箭頭按鍵被按壓后,隨后再按空格鍵將不起任何作用,因?yàn)樵搯卧~已經(jīng)被接受。
●當(dāng)用戶輸入標(biāo)點(diǎn)或者與已知單詞不匹配的顯式字符時。
如上所述,當(dāng)接受UDB添加單詞時,該單詞被添加到UDB上。初始頻度將被設(shè)置為比第一單詞高3個使用計(jì)數(shù)的值(可以被設(shè)置到與第一單詞無關(guān)的任何值)。當(dāng)使用該單詞時,提升UDB添加單詞的頻度。
本發(fā)明通過對用戶使用模式的漸進(jìn)學(xué)習(xí)促使單詞的排序,來使用“不侵犯”學(xué)習(xí)原則,其中非第一單詞的單一使用將不會迫使第一單詞到達(dá)顯示選擇目錄中的第一位置。“不侵犯”原則可以通過仔細(xì)更新和設(shè)置頻度來實(shí)現(xiàn)。
●當(dāng)把第一單詞和非第一單詞添加到RDB上時,設(shè)置第一單詞的頻度,以便對于第一單詞失去顯示選擇目錄中第一放置位置來說,將得到非第一單詞的三次(或一個預(yù)定數(shù))不對消的使用。用戶按壓空格鍵選擇非第一單詞的第一次被認(rèn)為是一次使用。例如,如果正好添加了這兩個單詞,那么非第一單詞的二次以上的使用將使該單詞移動到顯示選擇目錄的第一位置。
●所有非第一單詞開始于相同的初始頻度。它們的頻度增加或者減少將取決于每隔多長時間使用它們。頻度在老化處理時減少。
●如果從顯示選擇目錄中選擇一個第一單詞,并且該第一單詞已經(jīng)在RDB中,則提升該單詞的頻度。
●如果試圖將第一單詞添加到RDB(當(dāng)選擇非第一單詞時),并且第一單詞已經(jīng)在RDB中,則不增加其頻度。假定該第一單詞已經(jīng)處于正確位置。
●UDB添加單詞的初始頻度是高于第一單詞的兩個使用計(jì)數(shù)。可以為不同實(shí)施方式調(diào)整δ值。
在某些時間間隔,將老化所有的UDB添加和UDB重排序單詞。老化是指通過某些因素減少這些單詞的頻度。每隔多長時間執(zhí)行老化取決于所使用的時間間隔的單位,時間間隔的單位由數(shù)據(jù)庫管理員維持。由于數(shù)據(jù)庫沒有時間概念,本發(fā)明通過維護(hù)一個更新計(jì)數(shù)試探地計(jì)算時間間隔。每當(dāng)按壓空格鍵選擇一個單詞時,該更新計(jì)數(shù)就遞增1。當(dāng)更新計(jì)數(shù)達(dá)到某一值時,就踢開(中止)老化處理。這一過程按以下方式執(zhí)行
●當(dāng)更新計(jì)數(shù)達(dá)到其最大值(本實(shí)施例中是1000),老化處理中止。在統(tǒng)計(jì)學(xué)中,1000適用于一個快速T9用戶,該用戶可以使用T9鍵入20wpm(每分鐘20個單詞),50分鐘內(nèi)在持續(xù)的狀態(tài)下輸入文本。也就是約為50個信息,每條信息有20個單詞(~120個字符)。
●所有單詞的頻度被老化的一個(31/32)因數(shù)減小。本領(lǐng)域熟練技術(shù)人員將容易地理解任何老化因數(shù)都可以用來實(shí)現(xiàn)預(yù)期的衰減速率。例如,如果非第一單詞的頻度是54,則它將被減小到52(54×(31/32))。
對于垃圾收集,“來得容易去得快”原則用于從RDB和UDB存儲空間中先刪除UDB重排序單詞,然后刪除UDB添加單詞。建議使用因數(shù)2來刪除重排序單詞。這樣,在刪除具有X頻度的UDB添加單詞之前,本發(fā)明首先移除頻度小于或等于2*X的所有重排序單詞。下面說明垃圾收集算法1、移除已經(jīng)被標(biāo)上刪除標(biāo)記的所有UDB添加單詞。
2、如果步驟1執(zhí)行后自由空間的空間量大于或者等于總UDB數(shù)據(jù)空間的1/8,則進(jìn)行垃圾收集。
3、反之,增加最近刪除截止頻度,并刪除具有該頻度的所有UDB重排序單詞和具有一半該頻度的所有UDB添加單詞。該處理持續(xù)進(jìn)行直至UDB空間的1/8是自由空間。
本領(lǐng)域的熟練技術(shù)人員將容易理解可以調(diào)整1/8的閾值,以達(dá)到預(yù)期的UDB自由空間量。
新顯示選擇目錄由第一(從頂部看)重排序單詞、UDB、LDB和MDB單詞(依賴于MDB柵欄(fence))組成。MDB柵欄用來設(shè)置可出現(xiàn)在MDB單詞目錄之前的LDB單詞的最大量。這確保了OEM將可以顯示其單詞。顯示選擇目錄中的重排序單詞的數(shù)量由最近刪除截止頻度或者非第一單詞初始頻度所確定的,其數(shù)量總是較少的-稱之為RDB計(jì)數(shù)。其頻度大于或等于RDB計(jì)數(shù)的所有UDB添加單詞和UDB重排序單詞,是重排序單詞,并且將出現(xiàn)在顯示選擇目錄中的首位。下面分層次說明它們出現(xiàn)在顯示選擇目錄中的排序1、其頻度高于截止頻度的所有重排序單詞。
2、UDB終結(jié)單詞。
3、達(dá)到MDB柵欄的LDB單詞。
4、MDB終結(jié)單詞。
5、UDB詞干。
6、MDB詞干。
當(dāng)具有相同頻度的重排序單詞在競爭顯示選擇目錄的前5個位置時,會涉及到連接中斷器。下面的規(guī)則適用于中斷連接1、如果兩個UDB添加單詞被連接,則添加到UDB上的最新單詞獲勝。
2、如果UDB添加和UDB重排序單詞被連接,則UDB添加單詞獲勝。
3、如果兩個UDB重排序單詞被連接,則具有較小LDB對象編號的單詞獲勝。
每個UDB重排序單詞與它的LDB對象編號一起被存儲為按鍵序列。具有了它們來自哪個LDB的信息和消息,就可以重構(gòu)單詞。該技術(shù)使用了更少的存儲器來存儲RDB單詞。一個字符只使用半個字節(jié),而不是每字符使用一個或者兩個字節(jié)。
一個UDB重排序單詞將平均消耗8個字節(jié)-兩個頻度字節(jié),一個長度字節(jié),一個LDB對象編號字節(jié),一個語言ID字節(jié),加上用于六個字符單詞的三個字節(jié)(平均單詞長)。RDB空間的4K字節(jié)能夠容納約512個UDB重排序單詞,3K字節(jié)將能夠容納約384個單詞,2K字節(jié)將能夠容納約256個單詞,1K字節(jié)容納約128個單詞。
用戶可以接通和斷開RDB。下面描述其操作動作如果還未接通RDB,則接通RDB功能部件。
斷開RDB將具有以下兩個效果●顯示選擇目錄回到它的原始排序。
●在垃圾收集之前,RDB中的任何UDB排序單詞都將保留。
本領(lǐng)域熟練技術(shù)人員將容易理解,盡管在上文中已經(jīng)使用了術(shù)語“單詞”,但本發(fā)明同樣適用于其它語言輸入單位,比如音節(jié)(字節(jié))或者詞組(短語)。例如,在中文中可以輸入單音節(jié),在日本語中可以輸入整個詞組。
盡管已經(jīng)參照優(yōu)選實(shí)施例說明了本發(fā)明,但是本領(lǐng)域熟練技術(shù)人員將容易理解,在不背離本發(fā)明精神和范圍的條件下,也可以用其它應(yīng)用取代這里所述的應(yīng)用。因此,本發(fā)明僅僅由其權(quán)利要求限定。
權(quán)利要求
1.一種將從數(shù)據(jù)庫檢索得到的條目重排序以顯示給用戶的方法,包括以下步驟接受用戶從鍵盤的輸入;提供一個語言數(shù)據(jù)庫;其中所述語言數(shù)據(jù)庫包含使用語言模型排序的單詞;從所述語言數(shù)據(jù)庫動態(tài)檢索單詞,該單詞包含有由用戶鍵盤輸入而形成的字母;向用戶顯示所述已檢索單詞的目錄;其中使用語言數(shù)據(jù)庫排序和動態(tài)重排序頻度計(jì)數(shù)對所述目錄中的單詞排序;其中對于所述目錄中的單詞,動態(tài)重排序計(jì)數(shù)優(yōu)先于語言數(shù)據(jù)庫排序;將動態(tài)重排序頻度計(jì)數(shù)分配給用戶從所述目錄中選擇的單詞。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括以下步驟提供一個重排序數(shù)據(jù)庫;其中所述分配步驟將選擇的單詞和與這些單詞相關(guān)聯(lián)的重排序頻度插入到所述重排序數(shù)據(jù)庫中。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括以下步驟提供一個用戶數(shù)據(jù)庫;其中用戶特別輸入到系統(tǒng)中的單詞被存儲到所述用戶數(shù)據(jù)庫中;以及其中所述檢索步驟還從所述用戶數(shù)據(jù)庫中檢索包括通過用戶鍵盤輸入所形成的字母的單詞。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,如果用戶第一次選擇一個非第一排序單詞,則所述分配步驟將來自所述目錄的第一排序單詞和該非第一排序單詞插入到所述重排序數(shù)據(jù)庫中,如果第一排序單詞未存在于所述重排序數(shù)據(jù)庫中,則插入該第一排序單詞。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,如果用戶選擇非第一排序單詞達(dá)到一個預(yù)定次數(shù),則所述目錄中的第一排序單詞失去其位置,然后該非第一排序單詞被分配一個高于第一排序單詞的頻度值。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,輸入到所述重排序數(shù)據(jù)庫中的所有非第一排序單詞最初被分配相等的重排序頻度。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,每次當(dāng)用戶選擇一個單詞時,該單詞的重排序頻度增加。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,如果用戶選擇所述目錄中的一個單詞,并且該單詞位于第二排序位置之下,則所述分配步驟將該單詞的重排序頻度指定到一個把該單詞置于所述目錄中第二排序位置的值。
9.根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括以下步驟對所述重排序數(shù)據(jù)庫中的重排序頻度周期性地執(zhí)行老化處理;和其中,所述老化步驟利用一個預(yù)定因數(shù)減少所述重排序數(shù)據(jù)庫中的重排序頻度。
10.根據(jù)權(quán)利要求3所述的方法,其特征在于,還包括以下步驟周期性地檢查所述重排序數(shù)據(jù)庫的自由空間;其中,如果所述重排序數(shù)據(jù)庫的自由空間低于一個預(yù)定閾值,則從所述重排序數(shù)據(jù)庫中移除重排序頻度低于預(yù)定閾值的單詞。
11.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述檢查步驟從所述重排序數(shù)據(jù)庫中移除用戶定義的單詞,該用戶定義單詞具有低于預(yù)定閾值的重排序頻度,并且位于具有低于該預(yù)定閾值的重排序頻度的其它單詞之后。
12.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括以下步驟解決所述目錄中的重排序頻度碰撞;其中,如果兩個單詞具有相同的重排序頻度,則所述解決步驟通過對這兩個單詞中最新選擇的單詞首先排序來解決碰撞。
13.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括以下步驟解決所述目錄中的重排序頻度碰撞;其中,如果兩個單詞具有相同的重排序頻度,則所述解決步驟通過對所述語言數(shù)據(jù)庫中具有較高排序的單詞首先排序來解決碰撞。
14.根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括以下步驟解決所述目錄中的重排序頻度碰撞;其中,如果用戶定義單詞和來自語言數(shù)據(jù)庫的單詞發(fā)生碰撞,如果該兩個單詞具有相同的重排序頻度,則所述解決步驟通過對用戶定義單詞首先排序來解決碰撞。
15.根據(jù)權(quán)利要求1所述的方法,其特征在于,對用戶選擇的不具備與其它單詞發(fā)生碰撞可能的單詞,不分配重排序頻度計(jì)數(shù)。
16.一種將從數(shù)據(jù)庫檢索得到的條目重排序以顯示給用戶的設(shè)備,包括一個接受源自鍵盤的用戶輸入的模塊;一個語言數(shù)據(jù)庫;其中所述語言數(shù)據(jù)庫包含使用語言模型排序的單詞;一個從所述語言數(shù)據(jù)庫動態(tài)檢索單詞的模塊,該單詞包含有用戶通過鍵盤輸入而形成的字母;一個用于向用戶顯示所述已檢索到的單詞的目錄的模塊;其中使用語言數(shù)據(jù)庫排序和動態(tài)重排序頻度計(jì)數(shù)對所述目錄中的單詞排序;其中對于所述目錄中的單詞,動態(tài)重排序頻度計(jì)數(shù)優(yōu)先于語言數(shù)據(jù)庫排序;一個用于把動態(tài)重排序頻度計(jì)數(shù)分配給被用戶從所述目錄中選中的單詞的模塊。
17.根據(jù)權(quán)利要求16所述的設(shè)備,其特征在于,還包括一個重排序數(shù)據(jù)庫;其中所述的分配模塊將選擇的單詞和與它們相關(guān)聯(lián)的重排序頻度插入到所述重排序數(shù)據(jù)庫中。
18.根據(jù)權(quán)利要求17所述的設(shè)備,其特征在于,還包括一個用戶數(shù)據(jù)庫;其中用戶特別輸入到系統(tǒng)中的單詞被存儲到所述用戶數(shù)據(jù)庫中;所述檢索模塊還從所述用戶數(shù)據(jù)庫中檢索單詞,該些單詞包括通過用戶鍵盤輸入所形成的字母。
19.根據(jù)權(quán)利要求17所述的設(shè)備,其特征在于,如果用戶第一次選擇一個非第一排序單詞,則所述分配模塊將來自所述目錄的第一排序單詞和該非第一排序單詞插入到所述重排序數(shù)據(jù)庫中,其中如果第一排序單詞未存在于所述重排序數(shù)據(jù)庫中,則插入該第一排序單詞。
20.根據(jù)權(quán)利要求19所述的設(shè)備,其特征在于,如果用戶選擇非第一排序單詞的次數(shù)達(dá)到一個預(yù)定次數(shù),則所述目錄中的第一排序單詞將失去其位置,然后該非第一排序單詞被分配一個高于第一排序單詞的頻度值。
21.根據(jù)權(quán)利要求19所述的設(shè)備,其特征在于,輸入到所述重排序數(shù)據(jù)庫中的所有非第一排序單詞最初被分配相等的重排序頻度。
22.根據(jù)權(quán)利要求16所述的設(shè)備,其特征在于,每次用戶選擇一個單詞時,就增加該單詞的重排序頻度。
23.根據(jù)權(quán)利要求16所述的設(shè)備,其特征在于,如果用戶選擇所述目錄中的一個單詞,并且該單詞位于第二排序位置之下,則所述分配模塊將該單詞的重排序頻度指定到一個把該單詞置于所述目錄中第二排序位置的值。
24.根據(jù)權(quán)利要求17所述的設(shè)備,其特征在于,還包括一個對所述重排序數(shù)據(jù)庫中的重排序頻度周期性地執(zhí)行老化處理的模塊;這其中,所述老化模塊利用一個預(yù)定因數(shù)減少所述重排序數(shù)據(jù)庫中的重排序頻度。
25.根據(jù)權(quán)利要求17所述的設(shè)備,其特征在于,還包括一個周期性地檢查所述重排序數(shù)據(jù)庫的自由空間的模塊;其中,如果所述重排序數(shù)據(jù)庫的自由空間低于一個預(yù)定閾值,則從所述重排序數(shù)據(jù)庫中移除重排序頻度低于預(yù)定閾值的單詞。
26.根據(jù)權(quán)利要求25所述的設(shè)備,其特征在于,所述檢查模塊從所述重排序數(shù)據(jù)庫中移除用戶定義的單詞,該用戶定義單詞具有低于預(yù)定閾值的重排序頻度,并且位于具有低于該預(yù)定閾值的重排序頻度的其它單詞之后。
27.根據(jù)權(quán)利要求16所述的設(shè)備,其特征在于,還包括一個解決所述目錄中的重排序頻度碰撞的模塊;其中,如果兩個單詞具有相同的重排序頻度,則所述解決模塊通過對這兩個單詞中最新選擇單詞首先排序來解決碰撞。
28.根據(jù)權(quán)利要求16所述的設(shè)備,其特征在于,還包括一個解決所述目錄中的重排序頻度碰撞的模塊;其中,如果兩個單詞具有相同的重排序頻度,則所述解決模塊通過對所述語言數(shù)據(jù)庫中具有較高排序的單詞首先排序來解決碰撞。
29.根據(jù)權(quán)利要求18所述的設(shè)備,其特征在于,還包括一個解決所述目錄中的重排序頻度碰撞的模塊;其中,如果用戶定義單詞和來自語言數(shù)據(jù)庫的單詞發(fā)生碰撞,如果該兩個單詞具有相同的重排序頻度,則所述解決模塊通過對用戶定義單詞首先排序來解決碰撞。
30.根據(jù)權(quán)利要求16所述的設(shè)備,其特征在于,對用戶選擇的不具備與其它單詞發(fā)生碰撞可能的單詞,不分配重排序頻度計(jì)數(shù)。
31.一種將從數(shù)據(jù)庫檢索得到的條目重排序以顯示給用戶的方法,包括以下步驟接受來自鍵盤的用戶輸入;提供一個語言數(shù)據(jù)庫;其中所述語言數(shù)據(jù)庫包含使用語言模型和用于每個單詞的排序頻度來排序的單詞;從所述語言數(shù)據(jù)庫動態(tài)檢索單詞,該單詞包含有用戶鍵盤輸入而形成的字母;向用戶顯示所述已檢索單詞的目錄;其中使用語言數(shù)據(jù)庫排序和動態(tài)重排序頻度計(jì)數(shù)對所述目錄中的單詞排序;其中對于所述目錄中的單詞,動態(tài)重排序計(jì)數(shù)優(yōu)先于語言數(shù)據(jù)庫排序;將動態(tài)重排序頻度計(jì)數(shù)分配給被用戶從所述目錄中選擇的單詞,并且將用于一個單詞的所述已分配的動態(tài)重排序頻度計(jì)數(shù)初始化到從用于該單詞的所述語言數(shù)據(jù)庫中獲得的排序頻度值。
32.根據(jù)權(quán)利要求31所述的方法,其特征在于,還包括以下步驟提供一個重排序數(shù)據(jù)庫;其中所述分配步驟將選擇的單詞和與其相關(guān)聯(lián)的重排序頻度插入到所述重排序數(shù)據(jù)庫中。
33.根據(jù)權(quán)利要求32所述的方法,其特征在于,還包括以下步驟提供一個用戶數(shù)據(jù)庫;其中用戶特別輸入到系統(tǒng)中的單詞被存儲到所述用戶數(shù)據(jù)庫中;和其中所述檢索步驟還從所述用戶數(shù)據(jù)庫中檢索包括通過用戶鍵盤輸入所形成的字母的單詞。
34.根據(jù)權(quán)利要求33所述的方法,其特征在于,所述分配步驟對用戶特別輸入的所有單詞最初分配相等的重排序頻度。
35.根據(jù)權(quán)利要求32所述的方法,其特征在于,如果用戶第一次選擇一個非第一排序單詞,則所述分配步驟將來自所述目錄的第一排序單詞和該非第一排序單詞插入到所述重排序數(shù)據(jù)庫中,如果第一排序單詞未存在于所述重排序數(shù)據(jù)庫中,則插入該第一排序單詞。
36.根據(jù)權(quán)利要求35所述的方法,其特征在于,如果用戶選擇非第一排序單詞次數(shù)達(dá)到一個預(yù)定次數(shù),則所述目錄中的第一排序單詞失去其位置,然后該非第一排序單詞被分配一個高于第一排序單詞的頻度值。
37.根據(jù)權(quán)利要求31所述的方法,其特征在于,每次用戶選擇一個單詞時,就增加該單詞的重排序頻度。
38.根據(jù)權(quán)利要求31所述的方法,其特征在于,如果用戶選擇所述目錄中的一個單詞,并且該單詞位于第二排序位置之下,則所述分配步驟將該單詞的重排序頻度指定到一個把該單詞置于所述目錄中第二排序位置的值。
39.根據(jù)權(quán)利要求32所述的方法,其特征在于,還包括以下步驟對所述重排序數(shù)據(jù)庫中的重排序頻度周期性地執(zhí)行老化處理;和其中,所述老化步驟利用一個預(yù)定因數(shù)來降低所述重排序數(shù)據(jù)庫中的重排序頻度。
40.根據(jù)權(quán)利要求32所述的方法,其特征在于,還包括以下步驟周期性地檢查所述重排序數(shù)據(jù)庫的自由空間;其中,如果所述重排序數(shù)據(jù)庫的自由空間低于一個預(yù)定閾值,則從所述重排序數(shù)據(jù)庫中移除重排序頻度低于預(yù)定閾值的單詞。
41.根據(jù)權(quán)利要求40所述的處理,其特征在于,所述檢查步驟從所述重排序數(shù)據(jù)庫中移除用戶定義的單詞,該用戶定義單詞具有低于預(yù)定閾值的重排序頻度,并且位于重排序頻度低于該預(yù)定閾值的其它單詞之后。
42.根據(jù)權(quán)利要求31所述的方法,其特征在于,還包括以下步驟解決所述目錄中的重排序頻度碰撞;其中,如果兩個單詞具有相同的重排序頻度,則所述解決步驟通過對這兩個單詞中最新選擇的單詞首先排序來解決碰撞。
43.根據(jù)權(quán)利要求31所述的方法,其特征在于,還包括以下步驟解決所述目錄中的重排序頻度碰撞;其中,如果兩個單詞具有相同的重排序頻度,則所述解決步驟通過對所述語言數(shù)據(jù)庫中具有較高排序的單詞首先排序來解決碰撞。
44.根據(jù)權(quán)利要求43所述的方法,其特征在于,還包括以下步驟解決所述目錄中的重排序頻度碰撞;其中,如果用戶定義單詞和來自語言數(shù)據(jù)庫的單詞發(fā)生碰撞,如果該兩個單詞具有相同的重排序頻度,則所述解決步驟通過對用戶定義單詞首先排序來解決碰撞。
45.一種將從數(shù)據(jù)庫檢索得到的條目重排序以顯示給用戶的設(shè)備,包括一個接受來自鍵盤的用戶輸入的模塊;一個語言數(shù)據(jù)庫;其中所述語言數(shù)據(jù)庫包含使用語言模型和每個單詞的排序頻度來排序的單詞;一個從所述語言數(shù)據(jù)庫動態(tài)檢索單詞的模塊,而檢索得到的單詞包含有用戶通過用鍵盤輸入形成的字母;一個用于向用戶顯示所述已檢索到的單詞的目錄的模塊;其中使用語言數(shù)據(jù)庫排序和動態(tài)重排序頻度計(jì)數(shù)對所述目錄中的單詞排序;對于所述目錄中的單詞,動態(tài)重排序計(jì)數(shù)優(yōu)先于語言數(shù)據(jù)庫排序;一個用于把動態(tài)重排序頻度計(jì)數(shù)分配給被用戶從所述目錄中選中的單詞的模塊,該模塊還將用于對一個單詞的所述已分配的動態(tài)重排序頻度計(jì)數(shù)初始化,該初始值為從語言數(shù)據(jù)庫中獲得的該單詞的排序頻度值。
46.根據(jù)權(quán)利要求45所述的設(shè)備,其特征在于,還包括一個重排序數(shù)據(jù)庫;其中所述的分配模塊將選擇的單詞和與其相關(guān)聯(lián)的重排序頻度插入到所述重排序數(shù)據(jù)庫中。
47.根據(jù)權(quán)利要求46所述的設(shè)備,其特征在于,還包括一個用戶數(shù)據(jù)庫;用戶特別輸入到系統(tǒng)中的單詞被存儲到所述用戶數(shù)據(jù)庫中;所述檢索模塊還從所述用戶數(shù)據(jù)庫中檢索包含有用戶通過鍵盤輸入所形成的字母的單詞。
48.根據(jù)權(quán)利要求47所述的設(shè)備,其特征在于,所述分配模塊對用戶特別輸入的所有單詞最初分配相等的重排序頻度。
49.根據(jù)權(quán)利要求46所述的設(shè)備,其特征在于,如果用戶第一次選擇一個非第一排序單詞,則所述分配模塊將來自所述目錄的第一排序單詞和該非第一排序單詞插入到所述重排序數(shù)據(jù)庫中,如果第一排序單詞未存在于所述重排序數(shù)據(jù)庫中,則插入該第一排序單詞。
50.根據(jù)權(quán)利要求49所述的設(shè)備,其特征在于,如果用戶選擇非第一排序單詞的次數(shù)達(dá)到一個預(yù)定次數(shù),則所述目錄中的第一排序單詞失去其位置,然后該非第一排序單詞被分配一個高于第一排序單詞的頻度值。
51.根據(jù)權(quán)利要求45所述的設(shè)備,其特征在于,用戶每選擇一個單詞,就增加該單詞的重排序頻度。
52.根據(jù)權(quán)利要求45所述的設(shè)備,其特征在于,如果用戶選擇所述目錄中的一個單詞,并且該單詞位于第二排序位置之下,則所述分配模塊將該單詞的重排序頻度指定到一個把該單詞置于所述目錄中第二排序位置的值。
53.根據(jù)權(quán)利要求46所述的設(shè)備,其特征在于,還包括一個對所述重排序數(shù)據(jù)庫中的重排序頻度周期性地執(zhí)行老化處理的模塊;所述老化模塊利用一個預(yù)定因數(shù)降低減少所述重排序數(shù)據(jù)庫中的重排序頻度。
54.根據(jù)權(quán)利要求46所述的設(shè)備,其特征在于,還包括一個周期性地檢查所述重排序數(shù)據(jù)庫的自由空間的模塊;其中,如果所述重排序數(shù)據(jù)庫的自由空間低于一個預(yù)定閾值,則從所述重排序數(shù)據(jù)庫中移除重排序頻度低于預(yù)定閾值的單詞。
55.根據(jù)權(quán)利要求54所述的設(shè)備,其特征在于,所述檢查模塊從所述重排序數(shù)據(jù)庫中移除用戶定義的單詞,該用戶定義單詞具有低于預(yù)定閾值的重排序頻度,并且位于具有低于該預(yù)定閾值的重排序頻度的其它單詞之后。
56.根據(jù)權(quán)利要求45所述的設(shè)備,其特征在于,還包括一個解決所述目錄中的重排序頻度碰撞的模塊;其中,如果兩個單詞具有相同的重排序頻度,則所述解決模塊通過對這兩個單詞中最新一次被選中的單詞首先排序來解決碰撞。
57.根據(jù)權(quán)利要求45所述的設(shè)備,其特征在于,還包括一個解決所述目錄中的重排序頻度碰撞的模塊;其中,如果兩個單詞具有相同的重排序頻度,則所述解決模塊通過對在所述語言數(shù)據(jù)庫中具有較高排序的單詞首先排序來解決碰撞。
58.根據(jù)權(quán)利要求43所述的設(shè)備,其特征在于,還包括一個解決所述目錄中的重排序頻度碰撞的模塊;其中,如果用戶定義單詞和來自語言數(shù)據(jù)庫的單詞發(fā)生碰撞,如果該兩個單詞具有相同的重排序頻度,則所述解決模塊通過首先排序用戶定義單詞來解決碰撞。
全文摘要
本發(fā)明的動態(tài)數(shù)據(jù)庫重排序系統(tǒng)提供了一種語言數(shù)據(jù)庫,該語言數(shù)據(jù)庫包括根據(jù)語言模型排序的單詞,而所述語言模型則決定單詞被呈現(xiàn)給用戶的順序。在一個用戶通過按壓按鍵在通信裝置的小鍵盤上輸入鍵擊的同時,本發(fā)明預(yù)測用戶正在試圖輸入的單詞、字母、數(shù)字或者截短字。本發(fā)明通過跟蹤用戶用詞選擇,根據(jù)用戶系統(tǒng)使用情況對語言模型排序重排序。一旦一個單詞已經(jīng)被選作接續(xù)按鍵選擇的結(jié)果(接續(xù)單詞),則將一個頻度值賦于所選單詞,并且通過按鍵序列的語言數(shù)據(jù)庫的語言模型,對該單詞進(jìn)行第一排序。當(dāng)重復(fù)接續(xù)相同單詞時,該接續(xù)單詞的頻度值將變得大于第一顯示單詞的頻度。接續(xù)單詞和第一排序單詞的按鍵序列的隨后用戶輸入,將導(dǎo)致接續(xù)單詞顯示在由語言模型確定的第一排序的單詞之前。
文檔編號G06F17/28GK1703693SQ03800789
公開日2005年11月30日 申請日期2003年7月17日 優(yōu)先權(quán)日2002年7月18日
發(fā)明者伊斯安·布哦福特, 大衛(wèi)·彰·柯 申請人:美國在線服務(wù)公司