專利名稱:以自然語言進(jìn)行移動式信息訪問的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種使用移動通信裝置進(jìn)行移動式信息訪問的方法和設(shè) 備。更具體來講,它涉及一種使用小型移動通信裝置進(jìn)行移動式信息訪問的 方法和設(shè)備,而該小型移動通信裝置具有受限帝啲接收和輸出訪問信息的能 力。
背景技術(shù):
移動通信裝置除提供用于個人、人際通信的實際手段之外,其進(jìn)一步應(yīng) 用是通過訪問駐留在一個機(jī)器上的遠(yuǎn)程信息源為用戶提供具有滿足她的或 他的信息需要的能力。一個重要例子是使用移動通信裝置搜索信息。對移動通信裝置為此目的搜索信息的效率的重要約束是 由于受限制的信道能力造成發(fā)送大量數(shù)據(jù)緩慢;-移動通信裝置和信息提供者間的用于發(fā)送信息的消息協(xié)議采用的格式受限制,例如短文本消息(SMS)的160個字符限制; 當(dāng)輸入文本時移動通信裝置的鍵盤小并且不方便使用;-在輸出端,移動電話或其它裝置通常只有很小的顯示器,用于給用戶顯7jvf言息o傳輸容量和消息、鍵盤及顯示尺寸柳艮制通常要求搜索査詢和應(yīng)答也必 須受尺寸限制。關(guān)于搜索査詢,用戶必須能夠提供非常短和簡明的查詢。關(guān) 于應(yīng)答,應(yīng)答系統(tǒng)必須能夠產(chǎn)生非常簡明和相關(guān)的應(yīng)答。簡明的查詢和應(yīng)答可以通過特定范圍系統(tǒng)實現(xiàn),其中特定范圍系統(tǒng)只允 許非常受限制的、定義了范圍的査詢,并提供訪問以預(yù)定結(jié)構(gòu)化數(shù)據(jù)。在以 下位置/范圍中這個是足夠的,其中可能的査詢組是公知的,并且查詢具有 公知的結(jié)構(gòu)。如果査詢是公知的,那么在高速緩沖存儲器或?qū)iT數(shù)據(jù)庫引擎
中的查找通常足夠用來檢索正確和相關(guān)的應(yīng)答。該方法的一個例子是查詢火 車時間表,可以把它識別和分解為一個簡單的模板(起點,目的地,時間), 并且可以從結(jié)構(gòu)化數(shù)據(jù)庫中重新準(zhǔn)確地檢索到信息。特定范圍信息檢索系統(tǒng)在下面公開:Gallwitz, F., M.Aretoulaki, M.Boros, J.haas, S.Harbeck, R.Huber, H.Niemann,禾卩E.N6th的"Erlangen發(fā)言對話 系統(tǒng)EVAR:最新技術(shù)水平情報檢索系統(tǒng)"(在1998年國際討論會中關(guān)于 發(fā)言對話的會議記錄中(98年發(fā)表),第19-26頁,澳大利亞,悉尼,1998 年11月,黃學(xué)東、AlexAcero和Hsiao-WuenHon (2001)的"口語處理理 論指導(dǎo)、算法和系統(tǒng)開發(fā)",Prentice Hall PTO和Young, S. (2002)在劍橋 大學(xué)工程系的技術(shù)報告CUED/F-INFENGATR.433中的"發(fā)言對話系統(tǒng)設(shè)計 的統(tǒng)計學(xué)方法"。然而,特定范圍方法通常在可以處理的查詢方面不很靈活。此外,實現(xiàn) 的代價高并且它通常只覆蓋非常有限的范圍。換句話說,并且尤其是如果査詢的范圍(domain)不是公知的,那么可 以使用第二種方法。這通常是開放范圍或更通常是混合(特定范圍的和開放 范圍的)方法具有對査詢和對其范圍的知識了解很少時,它仍試圖通過分 析結(jié)果檢索相關(guān)的應(yīng)答。最近,這個第二種方法已經(jīng)得到更多注意,由于因特網(wǎng)上有大量以超文 本文件的形式存在的免費(fèi)信息。在那一點上,可通過全球網(wǎng)絡(luò)系統(tǒng)(WWW) 訪問的任何檢索引擎也可通過使用WAP (無線存取協(xié)議)的移動式電話進(jìn) 行訪問。例如都經(jīng)由WAP的基于關(guān)鍵字的'Google Wireless'檢索服務(wù)(http: 〃www.google.com/options/wireless.html)禾口基于關(guān)鍵字的'Yahoo! Mobile, 檢索月艮務(wù)(http: 〃mobile.yahoo.com/search)。然而,如果輸入輸出不是特別適用于移動式環(huán)境,那么將十分不便使用。在移動式空間中搜索信息當(dāng)前是兩個步驟處理用戶首先必須找出他或她在 哪里可以獲得信息,和第二步,去那里并滿足正確的需要信息。在臺式計算機(jī)上,第一步通常使用基于因特網(wǎng)檢索引擎(如Google或 Yahoo)的關(guān)鍵字執(zhí)行,其返回一個列超鏈接地址,其中可以找到信息本身。 因為可以顯示眾多結(jié)果,所以臺式計算機(jī)屏幕的大型尺寸使得基于關(guān)鍵字的 檢索在臺式計算機(jī)上有效率。甚至當(dāng)不是所有結(jié)果都恰當(dāng)時,這個處理仍然 工作。用戶人工點擊鼠標(biāo)到表面上恰當(dāng)?shù)恼军c,而且如果網(wǎng)站似乎包含所探
求的信息,那么他們?yōu)g覽以找到它,由于它包含眾多進(jìn)一步的步驟因而很復(fù) 雜。另一方面,在一個移動式的方案中,由于沒有鼠標(biāo)而且屏幕更小,因此 導(dǎo)航更加困難,它需要更多的手工導(dǎo)航步驟(例如滾動、換頁等等)。因此, 僅僅在移動通信裝置上模仿臺式計算機(jī)機(jī)構(gòu)是不夠的。因此,當(dāng)訪問基于網(wǎng)頁的査詢-應(yīng)答系統(tǒng)時,例如檢索引擎時,必須調(diào) 整査詢和應(yīng)答機(jī)構(gòu)以更適合移動用戶的需要,。在J.-D.Ruvini的"在小型裝置上適應(yīng)于用戶的因特網(wǎng)檢索策略"(在 2003年美國佛羅里達(dá)的邁阿密舉行的第8界國際信息處理會議中的關(guān)于智 能用戶接口的第284-286頁)中描述了一種方法,它向Google檢索引擎顯 示前端為移動電話提供網(wǎng)絡(luò)瀏覽。另一種方法是通過SMS的基于關(guān)鍵字的GoogleSMS檢索(http: 〃www.google.com/sms )。這里,覆蓋范圍通常比自頂向下的方法中的大,然而,由于底層數(shù)據(jù) 的未結(jié)構(gòu)化性質(zhì),很難實現(xiàn)相關(guān)和準(zhǔn)確的應(yīng)答。結(jié)果,可能必須發(fā)送一些短 消息以確保包括恰當(dāng)?shù)膽?yīng)答,需要在移動通信裝置上提高存儲容量,而使用 戶不便讀取。然而,即使那樣,也并非理所當(dāng)然會接收到相關(guān)的應(yīng)答。發(fā)明內(nèi)容本發(fā)明的一個目標(biāo)是適配應(yīng)答的組成,使它滿足當(dāng)前移動裝置的資源限 制,而同時保留/獲得與應(yīng)答的高度相關(guān)性,即確保包含針對問題的正確答 案的高概率。本發(fā)明的另 一個目標(biāo)是增加移動式查詢-應(yīng)答系統(tǒng)的可用性。 根據(jù)本發(fā)明,通過按照獨立的權(quán)利要求1的一種用于移動式信息訪問的方法,和通過按照權(quán)利要求15的一種用于移動式信息訪問的設(shè)備,來實現(xiàn)這些目標(biāo)。在附屬的權(quán)利要求中定義優(yōu)選的實施例。通過提供一個將查詢作為自然語言問題或語言短語的接口并使用語言工具來分析它們,提高檢索結(jié)果的相關(guān)性,并且因此可以相應(yīng)地減少應(yīng)答的大小,使為用戶提供一個恰當(dāng)?shù)幕卮鸪蔀榭赡?,而不管他的移動通信裝置的資源限制。通過另外提供一個用戶的簡檔表,移動通信裝置或用戶通過標(biāo)識號為系
統(tǒng)所知或識別,進(jìn)一步地用于提高為特定的用戶自動提供應(yīng)答的關(guān)聯(lián)性,特 別是因為裝置參數(shù)的固有知識。此外,借助于使用關(guān)于用戶的信息和他或她 的移動通信裝置,用戶的簡檔表也確??煽康挠脩艚?jīng)驗,不需要再進(jìn)入這個 簡檔表信息,并借助于使用這種先前的上下文知識的優(yōu)點來把考慮的候選應(yīng)答的數(shù)目(步驟650)約束到更可能符合用戶需求的一組。根據(jù)這個權(quán)利要求的形成自然語言問題的接口提供統(tǒng)一的對結(jié)構(gòu)和未結(jié)構(gòu)化信息源的訪問。當(dāng)參照附圖閱讀以下詳細(xì)說明時,進(jìn)一步的特性和優(yōu)點將明顯化。
圖1是一個示例系統(tǒng)的示意圖,其中根據(jù)本發(fā)明的在移動式信息訪問服務(wù)器上執(zhí)行移動式信息訪問方法。圖2顯示根據(jù)本發(fā)明的移動式信息訪問方法的實施例的示意圖。圖3顯示根據(jù)本發(fā)明的移動式信息訪問方法的實施例中一個消息分析的示意圖。圖4顯示在分析圖3中顯示的消息的分析期間提取的問題的語言分析 細(xì)節(jié)。圖5顯示根據(jù)本發(fā)明的信息檢索方法的實施例中的査詢應(yīng)答的語言處理。圖6顯示另一個根據(jù)本發(fā)明的移動式信息訪問方法的實施例的示意圖。 圖7顯示圖2中說明的本發(fā)明實施例中使用的可能的用戶的簡檔表內(nèi) 容的表格。圖S顯示根據(jù)本發(fā)明的移動式信息訪問方法的示意性輸出。 圖9顯示根據(jù)本發(fā)明的移動式信息訪問設(shè)備的實施例。
具體實施方式
圖1是示例系統(tǒng)的示意圖,其中在移動式信息訪問服務(wù)器上執(zhí)行根據(jù)本 發(fā)明的移動式信息訪問方法。在圖1中,參考標(biāo)志IOO表示移動通信裝置,例如蜂窩電話、智能電話、個人數(shù)字助理(PDA)、可佩帶的裝置等等。每個移動通信裝置100通過無線通信網(wǎng)絡(luò)110通信,根據(jù)本發(fā)明,例如
電話網(wǎng)或無線局域網(wǎng)、具有移動式信息訪問服務(wù)器160的網(wǎng)關(guān)120和因特網(wǎng) 140。網(wǎng)關(guān)120在無線通信網(wǎng)絡(luò)110到因特網(wǎng)140間橋接通信,反之亦然。移動式信息訪問服務(wù)器160與提供非結(jié)構(gòu)化數(shù)據(jù)的一個或多個非結(jié)構(gòu) 化數(shù)據(jù)源130,以及與提供結(jié)構(gòu)化數(shù)據(jù)的一個或多個結(jié)構(gòu)化數(shù)據(jù)源150相連。非結(jié)構(gòu)化數(shù)據(jù)源可以包括,但是不局限于本地索引全文集合、內(nèi)部網(wǎng) 檢索引擎及特別的因特網(wǎng)/全球網(wǎng)搜索引擎。結(jié)構(gòu)化數(shù)據(jù)來源可以包括,但是不局限于簡單的聯(lián)機(jī)訪問協(xié)議 (SOAP)網(wǎng)絡(luò)服務(wù)、關(guān)系數(shù)據(jù)庫或半結(jié)構(gòu)化XML庫(例如索引資源描述 格式(RDF)數(shù)據(jù)和真實簡單辛迪加組織(RSS)流。圖1中未顯示,但也在示例系統(tǒng)中出現(xiàn)的是與因特網(wǎng)相連的大量的文件 服務(wù)器,其中根據(jù)本發(fā)明的移動式信息訪問的方法在移動式信息訪問服務(wù)器 上執(zhí)行,文件服務(wù)器提供例如以HTML (超文本標(biāo)記語言)頁面的形式的文 件,由例如因特網(wǎng)搜索引擎130對其進(jìn)行索引。圖2顯示根據(jù)本發(fā)明的移動式信息訪問方法的實施例的示意圖。在步驟200中,移動式信息訪問服務(wù)器160接收源自移動通信裝置100 的消息。在步驟210中,分析接收的消息;特別是從査詢中抽取用自然語言的問 題或語言短語。詳細(xì)的分析過程將隨后參考圖3進(jìn)行描述。語言短語象'愛 丁堡的餐館'將被當(dāng)作問題??梢越o它們分配缺省的問題類型。在步驟220中,根據(jù)從信息中抽取的問題或短語以及根據(jù)在步驟210 中的隨后分析來構(gòu)造查詢。首先,導(dǎo)出一組關(guān)鍵字和關(guān)鍵短語作為基本搜索 引擎查詢構(gòu)成。然后用問題類型特定和范圍特定的關(guān)鍵字展開這些,并考慮 到在文件查找引擎語法中的各個特性。另外,可以把限制算子添加到所述檢索引擎査詢中,以便把它聚焦在一 組主題相關(guān)文件或網(wǎng)址上,并且合并這種主題專用搜索與一般搜索。在步驟230中,從結(jié)構(gòu)和非結(jié)構(gòu)化數(shù)據(jù)源中以Web頁面、數(shù)據(jù)庫字節(jié) 組或XML樹的形式檢索信息。相對于各自搜索引擎執(zhí)行在步驟220中獲得 的査詢,所述搜索引擎例如Google、 Yahoo!或MSN檢索和類似數(shù)據(jù)庫的 結(jié)構(gòu)化信息源。因為可能已經(jīng)把由文件搜索引擎提供的文件標(biāo)識符或鏈接的列表看作 需要的文件,由于它們常常以所謂片斷的形式提供相關(guān)信息連同文件識別
符。由此可以或者直接對這些文件進(jìn)行摘要,或者由服務(wù)器下載由搜索弓摩 結(jié)果參考的文件,并分析/摘要這些下載文件。在本發(fā)明的一個實施例中,所有進(jìn)一步處理都在搜索引擎概要片斷(snippet)上執(zhí)行。在另一個實施例 中,從搜索引擎檢索恒定數(shù)量的文件識別符(例如超鏈接),并下載所涉及 的文件。在從未結(jié)構(gòu)化和結(jié)構(gòu)化的數(shù)據(jù)源獲得結(jié)果之后,將它們合并。 在步驟240中,使用文本分析來分析檢索結(jié)果以便指定候選應(yīng)答。使用來自文本分析和上述問題分析的信息,從步驟230中獲得的文件中抽取候選應(yīng)答。在步驟中250中,驗證候選應(yīng)答,即按照似真掛應(yīng)答的似然性減少的 順序過濾和分級。根據(jù)相關(guān)標(biāo)準(zhǔn)(應(yīng)答a比應(yīng)答b好)排列候選應(yīng)答以反映 應(yīng)答的似然性。在步驟260中,應(yīng)答概要由頂端的n個候選分量組成,考慮限制輸出為 預(yù)定大小的需要。該預(yù)定大小可能取決于輸出裝置的顯示大小、單文本消息 的最大尺寸或各個用戶的喜好。取決于預(yù)定大小和檢索到的候選應(yīng)答片段的 數(shù)目n,其中n超過最小置信度閾值,考慮并合并數(shù)值c二f (s, n)個候選應(yīng) 答A1, A2,…AN215,盡可能地格式化或用特殊符號(例如一條線或類似 7'的分隔字符)分開以形成應(yīng)答概要。將該應(yīng)答概要送回移動單元(108)。可選的,語音合成單元可以把該應(yīng) 答概要轉(zhuǎn)換為語音。圖3更加詳細(xì)顯示了執(zhí)行消息分析的步驟210。消息分析用于生成查詢,用該查詢輸入搜索引擎,把這個問題歸類到 一個寬泛但是公知的類別或問題類型,并生成關(guān)鍵字詞條用于以后的流水 線。在步驟300中,首先確定消息是否由移動通信裝置100以口語形式發(fā)起。 在這種情況下,它將在步驟中310中受到自動語音識別(ASR)。在步驟320中,從該消息中提取問題或短語。 一旦問題或短語分離,將 進(jìn)一步分析它以便能夠理解這個問題或短語,或者至少能夠在期待的應(yīng)答的 類型上得出某些推斷。在步驟330中,使用語言問題類型模型計算該問題或者短語類型(尋求 什么類型的信息?)。由于問題M加利略什么時候出生?'是尋求時間的信
息,因此其應(yīng)答不能是人名。同樣導(dǎo)出這個問題或短語的焦點(尋求與哪個 信息有關(guān)的實體)(在這個例子中是伽利略)。在步驟340中,問題文本用于從語言學(xué)上分析這個問題,它使用一個 (組)包括詞類(POS)標(biāo)志、詞干、按屈折變化形式歸類、字節(jié)片、命名 實體標(biāo)識、去除字意多義性和地名判定的語言模型。圖4顯示圖3所示分析信息期間提取的問題的語言分析的細(xì)節(jié)。 標(biāo)志化將問題(步驟400)分解為標(biāo)志。按屈折變化形式歸類(未顯示)生成每個字的規(guī)范形式,例如術(shù)語"are" 生成"be"。POS標(biāo)識(步驟410)用語法上的標(biāo)識符標(biāo)注標(biāo)志,例如用JJ表示形 容詞術(shù)語"大"。命名實體標(biāo)識識別和分類專有名詞,例如人名或者位置名、日期與時間等等。字節(jié)片是指非遞歸合成字句的識別及分類,例如動詞組,名詞組,命題組。圖5顯示根據(jù)本發(fā)明的移動式信息訪問方法的實施例中的檢索結(jié)果的 語言處理。在步驟510中,檢索結(jié)果可能是規(guī)范的,S卩,文本可能必須與適合檢索 引擎的元數(shù)據(jù)分離,或者從特定格式(例如HTML)轉(zhuǎn)換成純文本。在步驟520中,如圖4和上述描述所示執(zhí)行類似的分析,現(xiàn)在對規(guī)范化 的檢索結(jié)果進(jìn)行描述。在步驟530中,所有與問題類型單元兼容的文本單元(例如,"2月14 日"是一個日期,其與"什么時候"的查詢兼容,"而伊莎貝拉"是名字, 其與"誰"的問題)兼容,和依照它們對該問題進(jìn)行應(yīng)答的似然性進(jìn)行驗證 /分級,產(chǎn)生稱為'等級'的記錄,該記錄考慮了語言上下文,由從其中提 取回答候選的文檔上下文的語言分析結(jié)果和語言問題分析單元的結(jié)果給出 該語言上下文,。具有最高等級的N個候選應(yīng)答用作在應(yīng)答概要組成步驟540的輸入,其 中考慮到消息大小約束條件及其它從用戶簡檔表得到的屬性來組成應(yīng)答概 要。圖6顯示根據(jù)本發(fā)明的移動式信息訪問方法的更進(jìn)一步的實施例。以下
描述將集中在與圖2中顯示的方法的特殊差異上。在這個實施例中,該消息也包括標(biāo)識符,以便根據(jù)接收的消息來識別移動通信裝置,例如在步驟610提取和存儲的電話號碼。在步驟620中,發(fā)起消息的移動通信裝置的標(biāo)識符用于檢索用戶的簡檔表。用戶簡檔表用于協(xié)商查詢它是否包含關(guān)于該移動通信裝置特殊屬性的知識(包括但不限于顯示尺寸、分辯率、色彩數(shù)量、圖形顯示能力、聲音 能力、和播放電影的能力),以及檢索優(yōu)選用戶主題區(qū)域(包括但不限于 瑣事/一般知識、運(yùn)動、電影等等,或者自定義站點)。在問題分析處理中,來自簡檔表的該信息用于提煉査詢結(jié)構(gòu),以使其偏 向用戶優(yōu)選區(qū)域,并同樣地使候選應(yīng)答提取及驗證偏向優(yōu)選區(qū)域,可選地, 使用在一組主題區(qū)域中感興趣的預(yù)先表示的優(yōu)先級順序。在步驟630中,考慮到個別偏愛,根據(jù)確定的問題類型和提取的關(guān)鍵字/關(guān)鍵短語,還可以構(gòu)造一個搜索引擎查詢或者一組搜索引擎查詢。例如, 用戶可能想要設(shè)置他的簡檔表,以限制他的搜尋在世界杯期間在足球范圍內(nèi) (因此只指向足球網(wǎng)站和網(wǎng)絡(luò)服務(wù))?;蛘?,他或她可能僅僅想要表示對時 尚的興趣比金融信息優(yōu)先,以便不從財經(jīng)網(wǎng)站或服務(wù)中尋求關(guān)于問題的應(yīng)答。另外,可以根據(jù)從用戶簡檔表檢索的主題區(qū)域信息執(zhí)行對特別站點的特 別搜索。考慮至鵬尋引,信息檢索引擎的語法的憐性(例如類似"+"的特 殊算符以確保頁面"+足球規(guī)則-法律"中必須存在某些字),將這樣提取或 形成的短語或關(guān)鍵字轉(zhuǎn)換為搜索引擎或信息檢索査詢。在步驟650中,候選應(yīng)答提取和驗證步驟,也考慮用戶用戶偏好和喜愛例如,用戶的簡檔表反映對運(yùn)動領(lǐng)域的強(qiáng)烈興趣及對政治領(lǐng)域缺少興趣的用 戶,通過添加或去除指示各個領(lǐng)域的查詢成分,尋求用于査詢結(jié)構(gòu)檢索(步驟630)的以前領(lǐng)域的文件而回避以后領(lǐng)域的文件。由此,分別以隊列形式 提升和降級指示體育領(lǐng)域和政治領(lǐng)域的來自上下文的候選應(yīng)答。在步驟660中,應(yīng)答概要組成步驟,從存儲在用戶簡檔表中的移動裝置 自身的類型和模型有關(guān)的信息得到限制其輸出的預(yù)定尺寸?;谝陨纤鲂畔ⅲ瑢τ谝苿友b置最合適的應(yīng)答概要,用戶使用呼叫方 標(biāo)識發(fā)送問題以標(biāo)識他或她的簡檔表記錄。取決于從用戶的簡檔表s得到的
喜好或?qū)W術(shù)上的移動裝置最大信息尺寸限制(例如在SMS的情況下),并且 候選檢索應(yīng)答片斷的數(shù)目n超過一個最小置信度閾值,數(shù)值c^f (s, n)個 候選應(yīng)答A1, A2,…AN215由概要組成模塊216考慮并合并,盡可能地格 式化或用特殊符號(例如一條線或分隔字符如7')分開,以形成應(yīng)答概要 217。另外,保持在用戶的簡檔表中的用戶移動通信裝置的屬性可以用于組成應(yīng)答概要,以創(chuàng)建使用移動通信裝置能力概要例如,在本發(fā)明可能的實施例中,如果該移動用戶的移動通信裝置具備彩色顯示,那么應(yīng)答概要的重要 部分(例如標(biāo)題、候選應(yīng)答短語頭部)可以顯示為不同色彩。此外,根據(jù)用戶的簡檔表設(shè)置,結(jié)果應(yīng)答概要可以以文本(潛在包含圖 像和電影)或語音(在這種情況下引用語音合成模塊)呈現(xiàn)。最后,將輸出發(fā)送給移動通信裝置。圖7顯示可能具有移動式用戶的簡檔表內(nèi)容的表,包含特定于移動裝置 和移動裝置的所有者的參數(shù)。用戶的簡檔表存儲關(guān)于用戶和他或她的移動通信裝置的標(biāo)識、認(rèn)證、以 及用來向用戶調(diào)整移動式信息訪問服務(wù)器的行為的數(shù)據(jù)。在移動式信息訪問服務(wù)器中用用戶標(biāo)識符(用戶ID)識別彼此。在一 個基于因特網(wǎng)的用戶的簡檔表運(yùn)轉(zhuǎn)圖形用戶界面,暗號(密碼)限制用戶自 己只能訪問其簡檔表。保持一列用戶標(biāo)識特征(呼叫方標(biāo)識),包括但不限 于用戶呼叫標(biāo)識,例如移動電話號碼,當(dāng)從用戶的簡檔表中檢索用戶信息時, 其用作關(guān)鍵字。在存儲中保存用戶的移動裝置的屬性和能力(移動裝置信 息),包括是否支持類似色彩或亮顯的特征屏幕的大小和分辯率移動通信裝 置是否分別支持SMS、 EMS和MMS、它是否是3 G電話、它是否能夠?qū)?多個文本信息合并為一個。 一列偏愛(用戶偏好)存儲用戶喜好的系統(tǒng)行為, 包括但不限于主題區(qū)域重要意義的絕對和相對順序、應(yīng)答信息的最大數(shù)量 (例如SMS (存儲管理服務(wù))的最大數(shù)量)要求、是否適當(dāng)考慮發(fā)送MMS (模塊化存儲系統(tǒng))、和用戶是否可接受附加廣告。布爾寄存器(位置了解標(biāo)記)存儲用戶是否明示同意自動位置檢測,由 此允許考慮發(fā)送査詢的用戶的移動通信裝置,以改進(jìn)該搜尋(基于位置的搜 尋)。用戶的歷史問題(問題歷史)允許考慮先前的信息需要以改進(jìn)檢索結(jié) 果。 一列喜愛的網(wǎng)站和服務(wù)(喜歡的事物)允許把搜尋聚焦在這些更可能與 用戶需求相關(guān)的站點上。如何與用戶的電子郵件存儲連接的有關(guān)信息(電子 郵件帳戶)允許從用戶的個人信息檢索。帳戶余額存儲與用戶帳單有關(guān)的信 息,例如獎賞方案中的貨幣或虛擬的信用點帳戶。圖8顯示根據(jù)本發(fā)明移動式信息檢索方法生成的應(yīng)答的實施例的格式。應(yīng)答概要包括一組應(yīng)答候選窗口 (802到807),該窗口每個都包含一個確切 的應(yīng)答候選,由左邊(804)和右邊(805)的上下文圍繞(g卩,在其被找到 的文件中圍繞應(yīng)答候選的文本)。在一個實施例中,應(yīng)答候選窗口由分隔符標(biāo)志(例如,但不限于字符"/") 分隔808,以標(biāo)記邊界,來防止混淆用戶。在一個實施例中,包含最可能應(yīng) 答的應(yīng)答候選在初始位置806插入,其沒有任何上下文,以確保在應(yīng)答可能 很長的情況下,在最后的應(yīng)答候選窗口 807之后的截止不會導(dǎo)致丟失最佳的 應(yīng)答候選。圖9顯示根據(jù)本發(fā)明的用于移動式信息訪問的服務(wù)器的實施例的結(jié)構(gòu)圖。移動式信息訪問服務(wù)器包括用于從移動通信裝置接收消息的接收器 900和發(fā)送器901,其將消息發(fā)回到移動通信裝置。語音識別單元910、問題類型單元920、問題分析單元921、和用戶簡 檔表存儲器940的輸入與接收器900的輸出相連。語音識別單元910也與問 題類型單元920、查詢分析單元921和接收器900相連接。問題類型單元920 的輸出和查詢分析單元921與査詢構(gòu)造單元930的輸入連接。該査詢構(gòu)造單 元的輸出與檢索單元950的輸入相連接。用戶的簡檔表的輸出與查詢構(gòu)造單元930的輸入、歸券驗證單元970 和應(yīng)答概要單元980相連接。檢索單元的輸出與候選應(yīng)答和提取單元960的輸入相連接。候選應(yīng)答的 輸出和提取單元與應(yīng)答概要組成單元(980)的輸入相連接。應(yīng)答概要組成 單元(980)的輸出與語音合成單元(911)和發(fā)送器(901)的輸入相連接。 語音合成單元的輸出也與該發(fā)送器相連接。
權(quán)利要求
1.一種用于移動式信息訪問的方法,其在網(wǎng)絡(luò)計算機(jī)系統(tǒng)中執(zhí)行,該網(wǎng)絡(luò)計算機(jī)系統(tǒng)包括至少一個移動式信息訪問服務(wù)器和一個或多個信息檢索系統(tǒng),該方法包括步驟從移動通信裝置接收消息;分析接收到的消息;根據(jù)消息分析形成一個或多個查詢;根據(jù)該一個或多個查詢獲得文件;從該文件中提取候選應(yīng)答;驗證候選應(yīng)答;組成應(yīng)答概要;發(fā)回該應(yīng)答概要到移動通信裝置,其特征在于該應(yīng)答概要受限于預(yù)定的尺寸。
2. 根據(jù)權(quán)利要求1的方法,特征在于根據(jù)以下一個或多個條件限制應(yīng) 答概要的大小-移動通信裝置的最大顯示尺寸; -移動通信協(xié)議的最大消息尺寸; -各個用戶的喜好。
3. 根據(jù)權(quán)利要求1或2的方法,特征在于分析接收到的消息的步驟包 括從消息中用自然語言提取一個問題或語言短語的步驟。
4. 根據(jù)權(quán)利要求3的方法,特征在于分析接收到的信息的步驟還包括 確定從消息中用自然語言提取的該問題或短語的類型和語言屬性的步驟。
5. 根據(jù)前面任何一個權(quán)利要求的方法,特征在于還包括步驟 -檢驗該消息是否以語音形式接收;以及,如果是,-借助于自動語音識別將該消息從語音轉(zhuǎn)換為文本形式。
6. 根據(jù)權(quán)利要求4或5的方法,特征在于形成一個或多個査詢考慮了該提取的問題或短語是否涉及一個命名實體。
7. 根據(jù)前面任何一個權(quán)利要求的方法,特征在于自動識別用戶和t艮據(jù) 該識別來檢索用戶的簡檔表。
8. 根據(jù)權(quán)利要求7的方法,特征在于從用戶的簡檔表中獲取一個或多 個以下內(nèi)容--移動通信裝置的最大顯示尺寸; -移動通信協(xié)議的最大消息尺寸; -各個用戶的喜好。
9. 根據(jù)權(quán)利要求7或8的方法,特征在于形成一個或多個查詢的步驟 還基于從用戶簡檔表獲得的信息。
10. 根據(jù)權(quán)利要求7到9中一個的方法,特征在于提取應(yīng)答候選的步驟 還考慮了從用戶簡檔表獲得的信息。
11. 根據(jù)權(quán)利要求7到10的方法,特征在于驗證應(yīng)答候選的步驟還考 慮了從用戶簡檔表獲得的信息。
12. 根據(jù)權(quán)利要求7到11的方法,特征在于組成應(yīng)答概要的步驟還考 慮了從用戶簡檔表獲得的信息。
13. 根據(jù)前面任何一個權(quán)利要求的方法,特征在于組成應(yīng)答概要的步驟 生成應(yīng)答概要,該應(yīng)答概要包括一組應(yīng)答候選窗口,這些窗口每個都包含確 切的應(yīng)答候選,并由左邊和右邊的上下文圍繞。
14. 根據(jù)前面任何一個權(quán)利要求的方法,特征在于組成應(yīng)答概要的步驟 生成應(yīng)答概要,在應(yīng)答概要中,將包含具有最高驗證等級的應(yīng)答的應(yīng)答候選 插入在沒有任何上下文的初始位置。
15. —種用于移動式信息訪問的設(shè)備,包括 從移動通信裝置接收消息的單元; 分析接收到的消息的單元; 根據(jù)消息分析形成一個或多個查詢的單元; 基于一個或多個查詢獲得文件的單元; 從文件中提取候選應(yīng)答的單元; 驗證候選應(yīng)答的單元;組成應(yīng)答概要的單元,其中應(yīng)答概要受限于預(yù)定的尺寸;和 發(fā)回應(yīng)答概要到移動通信裝置的單元。
全文摘要
一種在一個網(wǎng)絡(luò)計算機(jī)系統(tǒng)中執(zhí)行的移動式信息訪問的方法,該系統(tǒng)包括至少一個移動式信息訪問服務(wù)器和一個或多個信息檢索系統(tǒng),該方法包括步驟從一個移動通信裝置接收信息;分析接收到的信息;根據(jù)該信息分析形成一個或多個查詢;根據(jù)該一個或多個查詢獲得文件;從該文件中提取候選應(yīng)答;驗證候選應(yīng)答;組成一個應(yīng)答概要;將該應(yīng)答概要發(fā)回到移動通信裝置,其中該應(yīng)答概要限于預(yù)定的尺寸。本發(fā)明同樣描述了一種用于移動式信息訪問的設(shè)備。
文檔編號G06F17/30GK101120341SQ200580047695
公開日2008年2月6日 申請日期2005年2月6日 優(yōu)先權(quán)日2005年2月6日
發(fā)明者約亨·萊得勒, 蒂普海恩·達(dá)爾馬斯 申請人:凌圭特股份有限公司