国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      利用綜合語義語境的信息處理的制作方法

      文檔序號:6594593閱讀:399來源:國知局
      專利名稱:利用綜合語義語境的信息處理的制作方法
      技術領域
      本發(fā)明涉及通過通信網絡來有效訪問信息。
      背景技術
      由于通過諸如搜索引擎的各種搜索工具而可以在線獲取的可用信息不斷擴大的 可利用性,互聯網的使用日益流行。遍及本地企業(yè)和遠程互聯網,計算機用戶面臨不得不把 巨大數量的信息分類?;ヂ摼W快速成為了用于獲取有關產品、地點、人物等信息的主要信息 搜索工具。遺憾地,由于可用數據難于管理的數量以及用戶不能接收對于用戶高效使用所 期望的搜索結果,互聯網也迅速變成其自身成功的受害者。與互聯網搜索方法學有關的一個問題是通過表面上直接搜索所獲得的不期望數 量的搜索結果。即使對于最有經驗的互聯網搜索者,關于任何特定論題的可用信息的數量 也可能是巨大的。通常,搜索結果充滿了可能不適用于搜索者所希望的搜索語境的大量信 息。此外,搜索者可能希望多于其他類型的某種信息類型。當然,缺點是搜索者不得不篩選 表面上不屬于搜索者興趣/希望的搜索結果容量。因此,諸如搜索引擎的工具和文檔管理 系統可能通過將越來越多數量的信息推向用戶桌面,產生被數據淹沒的感覺而加重了該問 題。此外,認識到當前搜索技術是反應性的并且同樣地,需要用戶停止他們當前任務并且查 詢訪問信息的數據源。此外,增加“信息混亂”是當今許多計算機用戶從事多重、通常不同的項目的事實, 并且用戶對于存儲在其計算機中的相關信息(與他們當前項目有關)的有序且優(yōu)化訪問 可能是難以解決的。這種組織能力的缺乏可能顯著降低用戶(例如,律師、會計、顧問、教育 者、醫(yī)生…)利用與其當前項目相關的信息經由計算機來高效工作的的能力。在用戶計算 機上與信息雜亂無章有關的普遍問題是“哪個相關文檔在桌面上?,,;“哪個電子郵件線索 是項目的一部分”;“什么網絡搜索和結果在該項目內?”;“什么文檔、報告、數據、電子郵件、 圖片、視頻為該項目的一部分”;以及“哪個文件在桌面系統、服務器上、或者在文檔管理系 統中? ”。這些組織問題的一種解決方案是用戶手動創(chuàng)建并且管理用于相關信息的大量目 錄和文件夾。然而,這種組織類型的本質是任何希望的改變需要用戶方的大量人力。當前搜索技術的另一缺點在于即使存在多個搜索者當前在線搜索類似的主題 (例如,佛羅里達的低價旅行),但是多個搜索者孤立地進行搜索。因此,多個搜索者不能平 衡彼此花費在找到類似主題的任務上的時間。

      發(fā)明內容
      本發(fā)明的目的是提供信息處理環(huán)境以消除或者緩解至少一些以上所提出的缺點。諸如搜索引擎的工具和文檔管理系統可能通過將越來越多數量的信息推向用戶 桌面,產生被數據淹沒的感覺從而加重信息過載問題。此外,認識到,當前搜索技術是反應 性的并且同樣地,需要用戶停止其當前任務并且查詢訪問信息的數據源。與當前系統和方 法相反地,提供了用于生成用于多個信息的參照系的系統和方法,多個信息含有文本數據
      5并且由用戶通過與一個或者多個信息源交互所獲得。該方法和系統包括接收用于分析的經 選擇信息,該信息包括多種文本數據并且識別文本數據的多個邏輯單元。還包括識別每個 邏輯單元中多個獨立正文部并且計算與多個正文部的每個獨立正文部的相關的邏輯單元 的數量以便在識別包括用于每個獨立正文部的各個模式的多個模式中使用?;谒R別的 模式,計算用于多個模式中每一個的重要性測度并且基于其對應的、滿足用于在多種模式 中的保持相應模式的預先定義的模式重要性閾值的重要性測度來從多個模式選擇相應模 式。此外,基于選擇的各個模式生成多個信息語境定義并且將生成的信息語境定義指定為 與參照系相關的語義語境的語境定義。多個信息彼此相關并且通過所生成的語義語境的語 境定義來表示這種關系。所提供的第一方面是用于生成用于多個信息的參照系的方法,多個信息含有文本 數據并且由用戶通過與一個或者多個信息源交互所獲得,該方法包括接收經選擇的用于 分析的信息,該信息包括多個文本數據;識別文本數據的多個邏輯單元;識別在每個邏輯 單元中的多個單獨語境部;計算與多個正文部的每個獨立正文部相關的邏輯單元的數量以 便在識別包括用于每個獨立正文部的相應模式的多個模式中使用;計算用于多個模式中每 一個的重要性測度;基于滿足用于在多個模式中保持各個模式的預先定義模式重要性閾值 的模式的相應重要性測度,來從多個模式中選擇各個模式;基于選擇的各個模式生成多個 信息語境定義;以及將從選擇信息中所獲得的生成的信息語境定義指定為與參照系相關的 語義語境的語境定義,多個信息彼此相關并且通過語義語境的語境定義來表示這種關系。提供的另一方面是從多個經選擇的信息中選擇語境定義作為獨立正文部;識別包 括語境定義的文本數據的多個邏輯單元;計算與每個語境定義相關的邏輯單元的數量以便 在識別包括用于每個單獨語境定義的相應語境定義模式的多個語境定義模式中使用;計算 用于多個語境定義模式中每一個的重要性測度;基于語境定義模式滿足用于在多個語境定 義模式中保持各個語境模式的預先定義的語境定義模式重要性閾值的相應重要性測度,來 從多個語境定義模式中選擇各個語境定義模式;基于所選擇的各個語境定義模式生成多個 二次信息語境定義;以及將從選擇的多個信息中所獲得的生成的信息二次語境定義指定為 與參照系相關聯的語義語境的二次語境定義。所提供的另一方面是接收用于分析的另外信息,該另外信息包括多個其他文本數 據;識別其他文本數據的多個其他邏輯單元;識別在每個邏輯單元中的多個其他單獨正文 部;計算與多個其他正文部的每個獨立其他正文部相關的邏輯單元的數量以便在識別包括 用于每個獨立其他正文部的相應其他模式的多個其他模式中使用;計算用于多個其他模式 中每一個的重要性的其他測度;基于滿足用于在多個其他模式中保持各個其他模式的預先 定義的其他模式重要性閾值的其他模式的相應其他重要性測度,來從多個模式中選擇各個 模式基于滿足用于保持在多個其他模式中的各個其他模式的其他預先定義的模式重要性 閾值的重要性其對應其他測度來從多個其他模式中選擇各個其他模式;基于選擇的各個其 他模式生成多個其他信息語境定義;以及將生成的其他信息語境定義與語義語境的語境定 義相比較以確定通過接收的另外信息與語義語境相關的多個信息的關聯性程度。所提供的另一方面是接收的其他信息是根據信息查詢所獲得的信息并且接收到 的其他信息是基于用戶請求或者基于獨立于用戶互動的用戶的語境引擎的請求。從以下各 項選擇信息查詢數據庫查詢;文檔的結構化查詢;以及網頁查詢。語境引擎的請求是基于用戶的活動由語境引擎所發(fā)起的預測性查詢,其中,用戶的活動選自以下各項除了在提交 用戶請求以前,當用戶在參照系的語義語境中時;除了在提交用戶請求期間,當用戶在參照 系的語義語境中時;以及除了在提交用戶請求以后,用戶在參照系的語義語境中時。將來自 語義語境的語境定義提供給用戶作為用于通過用戶選擇的查詢建議。


      現在僅以示例方式,結合附圖描述本發(fā)明的典型實施方式,其中
      圖1是信息處理系統的部件的框圖;圖2示出了圖1的系統的語境引擎的示例性配置;圖3示出了圖2的語境引擎的示例性工作流程;圖4是用于實現圖1和圖10的系統部件的示例性計算裝置的框圖;圖5是圖3的語境引擎的操作流程圖;圖6示出了通過圖3的語境引擎的信息14的示例性劃分;圖7是圖1的系統的語境引擎的示例性操作的流程圖;圖8是圖1的系統的信息集合和語義語境15的組織的示例性實施方式圖9是圖1的系統的語境引擎的示例性操作的流程圖;圖10是可以耦合至圖1的系統的協作環(huán)境的部件的框圖;圖11示出了圖10的環(huán)境的示例性搜尋信息集;圖12是圖10的環(huán)境的選擇性實施方式;圖13示出了圖12環(huán)境的對應搜索語境和示例性搜索信息集;圖14是圖10的環(huán)境的協作引擎的部件的框圖;圖15示出了圖10的環(huán)境的協作服務器的比較處理的示例性結果;圖16示出了圖10的環(huán)境的語境引擎的示例性配置;圖17是圖10的環(huán)境的協作服務器的部件的框圖;圖18是圖10的環(huán)境的操作流程圖;以及圖19是經由圖10的協作服務器所提供的示例性用戶界面內容。
      具體實施例方式信息處理系統10參照圖1和圖2,示出了用于創(chuàng)建和保持用于用戶工作活動的定義的參照系 (FoR) 12的信息處理系統10,該信息處理系統包括通過通信網絡11經由信息請求18和信 息響應20從各種信息源16檢索的信息14。信息源16可以被配置為直接與用戶通信(例 如,在用戶與Web服務之間)和/或被配置為間接與用戶通信(例如,通過信息源16的組 17在用戶與第三方搜尋引擎M之間)。信息14可以是諸如(但不限于)如下信息對象類 型電子文檔(例如,含有正文和/或圖像信息);網絡消息(例如,諸如Web服務消息的 其他網絡11通信或者電子郵件);數據庫內容(從遠程17和/或本地210存儲器(參見 圖4)獲得的內容);和/或(例如)基于搜尋查詢的搜索結果。如下文中進一步描述的, 認識到信息14可能包括應用程序(例如,Microsoft Word、PowerPoint、Excel、Outlook、 Internet Explorer)的狀態(tài)和/或應用程序的特定生成結果(例如,Word文檔、報告、電子數據表、電子郵件、瀏覽器搜索結果)。應當認識到,信息請求18和信息響應20可能涉及諸如(但不限于)以下28信息 查詢數據庫查詢;文檔(或者其他信息14)的結構化查詢;以及Web(例如,網絡11)查詢。 認識到,當以結構化定義語言(例如,XML)存儲越來越多的信息,以結構化定義語言交換越 來越多的信息,或者通過各種界面以結構化定義語言提交越來越多的信息時,期望智能查 詢結構化定義語言數據源的能力。例如,可以將以結構化定義語言定義的信息14(例如,文 檔)稱作結構化信息(例如,文檔)并且因此,可以把信息14看作數據源并且可以把傳統 數據源(例如,數據庫)看作信息14 (例如,文檔)。如下文中進一步描述的,12可以包括具有與12相關的一個或者多個語 義語境15和與其相關的信息14的可視外殼(例如,參見圖4,在計算裝置101的用戶界面 202上的顯示203)。當用戶繼續(xù)以12工作時,可以維持/開發(fā)其工作環(huán)境的可視方面 以有助于表示與!^0R 12相關的語義語境15。同時,如下文中進一步描述的,基于用戶正在 創(chuàng)建或參考的信息14內容(例如,文檔),通過語境引擎100(參見圖2、來建立語義語境 15,或者相反地進行修改,以考慮從信息14所確定的信息語境19 (包括所確定的語境定義 105)。認識到,基于通過語境引擎100與信息14相關的信息語境19,當用戶操作/訪問 本地創(chuàng)建/存儲的(例如,用戶創(chuàng)建的文檔、信息請求18等)和/或從遠程信息源16所獲 得的信息14的時候,語境引擎100可以動態(tài)地開發(fā)與12相關的語義語境15。在任何 情況下,為了斷定所選擇的信息14涉及哪種(如果有)語義語境15,將系統10用于定義 FoR 12的語義語境15并且用于將從選擇的信息14所確定的信息語境19 (例如,在創(chuàng)建語 義語境15以后,由用戶訪問的文檔)與12的語義語境15進行比較。認識到,語境引 擎100可能確定信息語境19不與任何一種語義語境15匹配,并且因此,可以將信息語境19 作為基礎來創(chuàng)建I^oR 12的新語義語境15。例如,語境定義104集合表示或者另外定義用于信息14集合的語義語境15的語 義論題內容。例如,結合自一個或者多個文檔的語境定義104表示指定給文檔組/與文檔 組相關的總語義內容15。同樣地,對于單獨信息14部(例如,文檔、Web頁等),所確定的 語境定義105集合表示信息14的語義論題內容,然后,將該信息接著用于與現有語義語境 15的比較目的,以確定單獨信息14部是否涉及該語義語境15。換句話說,將獨立信息14 部的語境定義105與語義語境15的語境定義104進行比較。例如,從文檔所獲得的語境定 義105表示該文檔的信息內容19。經由一個或者多個通信網絡11 (諸如,內部網和/或外延網-例如,互聯網)便 于在用戶裝置101、信息源16、以及搜索引擎M之間的通信,并且由用戶通過用戶界面 202(參見圖4)實現。如所期望的,系統10可以包括多個用戶裝置101、多個語境引擎100、 多個信息源16、多個搜索引擎M、以及一個或者多個耦合的通信網絡11。認識到,語境引擎 100可以存在于用戶裝置101上(如通過實施例所示的)或者可以被配置為通過網絡11由 用戶裝置101容易訪問的網絡服務。信息請求18作為通過用戶搜索和檢索的信息14的實施例,以下論述使用通過通信網絡11的 信息請求18和信息響應20,從而通過語境引擎100來處理信息14(可能包括相關的信息請求18)以使用所確定的信息語境19動態(tài)建立/修改與12相關的語義語境15。認識 到,更普遍地,信息請求18和信息響應20還可能包括用于在用戶計算裝置101上本地創(chuàng)建 /修改/獲得/存儲文檔和/或消息(和其他信息14)的用戶活動。用戶的請求18包括搜索參數22 (例如,關鍵詞術語、詞組等),以便在有助于從一 個或者多個信息源16中識別適當地涉及已經存在于(例如,與其相關的)所定義的12 中的信息14的所期望的信息14。認識到,FoR 12的定義的初始/預備版本可能包括初始/ 預備信息14,諸如但不限于用戶定義的標題和/或內容定義/描述;用戶選擇的文檔(例 如,來自本地存儲器17);和/或用戶從搜索響應20中選擇的信息對象(例如,關于含有對 于另一文檔、網頁或其他網絡資源的索引或者導航元素、以及對于網頁位置的索引和導航 元素的搜索結果頁的選擇鏈接)。認識到,選擇的信息14對象對于用戶而言可能位于本地 (例如,諸如數據庫的文件系統)或者位于遠程(例如,經由互聯網的訪問的Web服務)。如 下文中進一步描述的,語境引擎100可以使用初始/預備信息14,以構造12的語義語 境15以便隨后在分析由用戶通過與其計算裝置101交互所獲得的后續(xù)信息14中使用。搜索請求18含有搜索參數22以有助于從信息源16中識別所期望的信息14,信 息源諸如但不限于是以下各項圖像文件、視頻文件、音頻文件、文本或者文學文件;文章/ 書籍評論;網頁/網站;電子文檔;網絡廣告;RSS種子;博客;和/或播客。用戶通過網絡 11提交搜索請求18,以定位潛在地涉及12的語義語境15的期望信息14。隨后,可以 通過語境引擎100來過濾通過搜索請求18 (例如,通過與至少某些搜索參數22匹配)返回 的該信息14,以獲得認為與用戶興趣最相關的信息14子集,即,與在語義語境15中所含有 的語境定義104(參見圖2、相關的信息14。還認識到,可以通過內容搜索模塊106可選地 增加搜索請求18的搜索參數22(例如,補充搜索請求18),以在向信息源16提交搜索請求 18之前包括至少一些語境定義104(以幻圖示出)。可替換地,或者作為補充,在報告給用 戶以前,可以通過內容搜索模塊106進一步分析基于用戶提供的搜索參數22的、接收到的 搜索結果20 (例如,來自基于Web的搜索引擎)。例如,內容搜索模塊106可能使用至少一 些語境定義104修改或者以其他方式對于在搜索結果20中所含有的信息14鏈接的排列進 行重新排序。在一個實施方式中,接收到的其他信息(例如,來自經由網絡11連接至用戶的其 他用戶)可能是從以下的信息查詢18所獲得的信息14,信息查詢諸如(但不限于)數據 庫查詢;文檔的結構化查詢;和/或Web查詢。接收到的其他信息可能基于用戶請求18或 者基于與用戶交互無關地用戶的語境引擎100的請求18。例如,引擎100的請求18可能是 基于用戶活動由引擎100發(fā)起的預測性查詢,用戶活動諸如但不限于當用戶在參照系(例 如,FoR 12)的語境15中時,但是在提交用戶請求18以前;當用戶在參照系(例如,FoR 12) 的語境15中時,但是在提交用戶請求18期間;以及當用戶在參照系(例如,FoR 12)的語 境15中時,但是在提交用戶請求18以后。此外,例如,當在已經進行任何搜索之前、期間、或之后用戶處于語境15中時,可 能發(fā)生直接通過引擎100的預測性搜索(例如,提交請求18)和相關的預測性檢索(例如, 接收響應20)。引擎100可以根據在語境15中最確定的語境定義104的確定重要模式來構 造查詢字符串(預測性請求18的查詢字符串)。搜索字符串可能為結合(例如,或的)在 一起的非重疊模式的集合。通過與信息源16 (或者耦合至信息源16的諸如搜索引擎M的第三方服務器)的通信由引擎100發(fā)起搜索。注意,搜索字符串可能不用于與其他語境15 匹配,而是用于在語境15內的選擇的語境定義104。然后,當用戶打開12的相應的應 用程序(例如,MicrosoftWord、Web Browser等)時,用戶可被呈現搜索結果20。還認識 到,語境引擎100可以使用搜索字符串。當不存在可用的語境定義104時,語境引擎100可 以使用搜索字符串作為退化情況(例如,選擇作為單個語境定義104),從而可以在可由語 境引擎100使用的唯一信息(例如,用于語義語境15)的情況下把搜索字符串看作語境定 義 104。此外,例如,當用戶在其計算機上打開12的應用程序(諸如,網頁瀏覽器或者 文件資源管理器)或者其他應用程序時,在搜索文本框中的自動完成能力可以在下拉組合 框中向用戶提供搜索建議。例如,這通過使用從選自語境15的語境定義104的關鍵模式經 由引擎100來實現,以為用戶提供在用戶可以從下拉列表中選擇的基于語境類型的前面搜 索/查詢建議。請求18實施例系統10的用戶可能使用語義語境15的語境定義104來使搜索請求18的搜索參 數22具有傾向性,以提煉請求18和/或結果20的評價。搜索模塊106可以將請求18的 初始參數22與語境定義104進行比較,以確定在語境定義104中含有的詞Wn是否包括至 少一些搜索參數22。例如,當提交搜索請求18時,如果在用戶的12的語義語境15中 不存在相關的語境定義104,則搜索模塊106(語境引擎106-參見圖2、沒有修改用于查詢 搜索引擎(例如,信息源16)的搜索字符串(例如,搜索參數22)。然而,如果在參數22和語境定義104之間存在確定的匹配,則通過搜索模塊106 從語境定義104(例如,論題)中選擇信息(例如,詞、短語等)然后用于增加搜索請求 18 (例如,查詢)的參數22,然后將其發(fā)送至安排相應搜索的搜索引擎。換句話說,搜索模塊 106可以利用從語境定義104中選擇的內容(例如,確定的最重要的模式)附加參數22(例 如,傾向的單詞)的基本術語,以增加查詢字符串。例如,這可能通過語境定義104(例如論 題)執(zhí)行語境定義104。在包括選擇模式的單詞最小化重疊的情況下,從最重要的語境定義 104(或者滿足定義重要性閾值的另外的語境定義104)中選擇最重要的模式(或者滿足模 式重要性閾值的另外的模式)。例如,通過搜索模塊106接收對于Research h Motion (RIM),電信公司工作的 用戶搜索請求。在這種情況下,用戶尋找RIM的工程師職位。然而,如果用戶搜索“RIM工 作”(例如,作為向搜索引擎所提交的搜索參數22),則至少對于在搜索結果列表中的較高排 序結果的搜索結果20可能全部/大部分涉及性別材料。例如,在Microsoft Live Search 和Google上測試搜索請求“RIM工作”。Live搜索返回的搜索結果20在結果(每頁約10 條)的前5頁中沒有包含就業(yè)機會的索引而Google搜索返回的搜索結果20在前5頁中含 有在第二頁上的第一條、在第三頁中的第二條的兩條索引。通過將“RIM”和“ job”的搜索參數22與用戶尋找職業(yè)處所定義的語義語境15的 語境定義104進行比較來重復搜索請求18。語境定義104含有單詞“工作”、“職業(yè)”、“工程 師”、“職位”及其組合,和“性別”、“口才”等的排除/否定/限制語境定義104。搜索模塊 106確定在搜索參數22和語境定義104之間存在匹配,S卩,這兩者都含有單詞“工作”。因 此,搜索模塊106利用來自語境定義104的匹配模式來增加基礎查詢18,從而搜索請求18的查詢字符串變?yōu)椴樵?(RIM+工作I RIM+職業(yè)I工作+工程師+職位非(性別I 口才 等…)…)?;谶x自語境定義104的內容而增加/修改的查詢18使得搜索引擎106從所 提供的所有搜索字符串中返回結果20??蛇x地,還對比語境定義104模式給結果20評分, 使得沒有結果涉及性別內容并且返回涉及就業(yè)機會的所有結果用于用戶在用戶界面202 上審閱。認識到,可能基于選自語境定義104的內容(例如,單詞Wn)修改基礎搜索參數22 和/或可能基于選自語境定義104(例如,通過評分技術過濾性別索引,從而沒有經由搜索 結果20向用戶顯示的性別索引)的內容(例如,單詞to)修改結果20。認識到,可能將系統10配置為使得在用戶沒有主動地做任何事情的情況下來開 始搜索信息。由搜索模塊106從語義語境15的語境定義104選擇的匹配模式結合在查詢 字符串(例如,參數22)中,以催化該搜尋(例如,搜索請求18)。搜索模塊106可能還給結 果20評分并且用戶以前攝方式得到結果(即,在用戶方面不需要請求或者行動),從而向用 戶示出結果20的最相關信息,例如,將語境定義104用于排序搜索結果20。另外,如果用戶訪問選擇信息14(例如,打開Microsoft word),則協作引擎150可 以在與選擇信息14的信息語境19相關的信息源16中搜索,然后提出顯示了所認為的相關 信息源16的任務窗格(例如,在用戶界面202上)。下文中,對于協作環(huán)境140進一步描述 的,認識到,所認為的相關信息源16可能包括被認為正從事相關材料(即,信息14的信息 語境19與相關信息源16的信息語境19相匹配)的一些其他用戶分組(例如,遠離用戶但 經由互聯網11可訪問的)或者在用戶企業(yè)中的同事。在另一實施例中,用戶可能將語境定義104與其語義語境15 (該用戶12的語 義語境)相關聯,表明用戶從在線視頻商店獲得/審查一些記錄片并且該用戶是某一在線 歷史興趣組的會員。因此,語境搜索模塊106可以修改用戶搜索請求18,以在搜索參數22 中包括來自定義表的語境定義104,其聲明用戶對紀錄片感興趣并且參加歷史興趣群(例 如,使用指定的與用戶的語義語境15相關的“記錄片”和“歷史興趣”語境定義104)。包含 這些語境定義104可以優(yōu)選地對搜索結果20進行加權(例如,在更新搜索請求18以后所 生成的的搜索結果,以包括“紀錄片”和“歷史興趣”)以包括屬于記錄片和/或歷史興趣的 信息14,或者按照其他方式,在隨后搜索結果20中所包括的信息14的列表中使這些信息 14排序更高。通常,語境搜索模塊106可能利用所選擇的一些語境定義104 (或者至少從語 境定義104中選取的單詞/短語)修改搜索請求18,從而使搜索結果20更適用于用戶。另 一種選擇是內容搜索模塊106將搜索結果20與語義語境15的語境定義104進行比較,從 而為來自搜索結果20、(例如)與語義語境15的語境定義104的閾值評分測量相匹配(經 由其確定的信息語境19)的這些信息14提供較高排序。FoR 12系統10的一個特性在于其能夠如用戶所希望的而有助于建立、使用以及從
      12中刪除語義語境15。例如,在動態(tài)12的情況下,當用戶搜索涉及多個不同語義語境 15的信息14時,語境引擎100可以確定正在查找的信息14的信息語境19是否與動態(tài) 12的現有語義語境15(或者,多個現有語義語境15)相匹配。如果匹配,則語境引擎100使 用所確定的信息語境19的內容定義105作為附加信息,以建立/提煉語境定義104??梢?將修訂/修正/修改的語義語境15用于將當前搜索結果20的剩余信息14結果進行分類 或者以其他方式對剩余信息結果進行過濾(例如,這使得基于改變的語義語境15來相應地改變當前檢索結果的排序/內容),和/或可以將其用于過濾隨后搜索結果20 (和/或修改 隨后搜索請求18的搜索參數22)。此外,基于在各個信息語境19的內容定義105和語義語境15的語境定義104之 間的比較,如果正在查找的新信息14不符合現有語義語境15,則語境引擎100可能使用不 匹配的內容定義105來自動創(chuàng)建新語義語境15。因此,當用戶在數個語義語境15間切換 (例如,混合格斗、去牙買加旅行、專利保護等)同時與12互動時,可以將語境引擎100 配置為基于確定的語境定義105與現有語義語境15的內容定義104的比較結果來動態(tài)創(chuàng) 建新語義語境15或者不斷磨練現有語義語境15。此外,認識到,可以由系統10無限期地或 者在所選擇的時間段內(例如,直到在由多個家庭成員共享的計算機上關閉使用的所有瀏 覽器窗口)使動態(tài)i^oR 12中創(chuàng)建的語義語境15持續(xù)存在。此外,參照圖1,FoR 12可能包括在裝置101 (參見圖4)與定義的語義語境15相 關的用戶的工作會話。例如,工作會話可能包括如通過內容引擎100所維持的語義語境15, 以及內容引擎100與表示另一程序、或者程序集的圖形用戶界面(GUI)的互動,其中這些程 序通過圖標、窗口、工具欄、文件夾、壁紙/背景、和/或專用界面工具集向用戶呈現。該程 序或者程序集的一個實施例是被認為窗口管理程序或者包括窗口管理程序的一系列程序 的桌面環(huán)境(例如,Microsoft Windows XP或者MicrosoftVista)。總體上,GUI有助于用 戶使用與實體世界(諸如按鈕和窗口)互動時所使用的類似概念來與計算機程序互動。僅 為了證明的目的,以下使用表示為桌面的!^0R 12。認識到,語境引擎100與由桌面所提供 的一個或者多個程序合作,以經由語義語境15來優(yōu)化基于用戶正在進行的工作會話內的 語境定義104(例如,論題)的用戶信息14訪問。認識到,當用戶完成涉及定義的語義語境 15(其還可以與其他用戶共享)的工作活動時,用戶可以保存包括桌面程序狀態(tài)的用戶工 作會話狀態(tài)。可替換地,一旦完成用戶的工作會話,可以刪除語義語境15(以及對桌面程序 的任何修改)。因此,12⑶I的用戶交互特性可以包括應用程序狀態(tài)項,諸如但不限于桌面 圖標;最近使用的用于窗口和應用程序的菜單項;網頁瀏覽器愛好;以及維持狀態(tài)的窗口 桌面的其他通用特性。下文中進一步描述的程序修改器模塊108可以經由語義語境15增 加這些交互!^0R 12用戶特性的狀態(tài)。例如,程序修改器模塊108可以使用語義語境15的 內容定義104以重新排序最近使用的菜單項、網頁瀏覽器愛好、以及維持狀態(tài)的窗口桌面 的其他通用特性,從而動態(tài)更新窗口特性以解釋定義的語義語境15。例如,程序修改器模塊 108將基于與一個或者多個語境定義104(或者其他預先定義的定義匹配閾值)最匹配的這 些愛好來修改列出的網頁瀏覽器愛好的順序,例如,在愛好列表中將與大部分語境定義14 匹配的愛好(例如,在定義104的指定閾值數量之上匹配的愛好)放置高于與語境定義104 較差匹配的愛好。以這種方式,將語境引擎100用于阻止經由12向用戶呈現的混亂和 /或不相關信息14,這些混亂和/或不相關信息與涉及與當前定義的語義語境15無關的先 前的方案/工作的信息14相關。在一實施方式中,在語義語境15創(chuàng)建中的第一步是用戶識別語義語境15并且將 信息14提供給語境引擎100以便在創(chuàng)建初始語境定義104中使用,認識到,用戶可能實際 上除了識別語義語境15以外不必做任何事然后可以沒有從用戶識別的任何初始定義/信 息14的擦除而通過語境引擎100來建立語義語境15。還可以明確定義、命名語境15并將語境與桌面(例如,FoR 12)關聯。例如,用戶可以運行或者另外啟動與語境引擎100(或者本地或者遠程)的通信, 其為用戶提供輸入語義語境15的名稱和/或描述。一旦開始,定義的語義語境15表示用 于用戶的特定方案的工作環(huán)境。可能通過語境引擎100使用語義語境15以包括用戶工作 環(huán)境(例如,桌面GUI)的可視和環(huán)境方面,以及例如用戶正在工作的論題的方案的語義方 面。雖然用戶在!^0R 12中工作,但是語境引擎100可能在后臺運行并且基于對于用戶看不 見的和/或需要用于修改/更新語義語境15的用戶輸入的用戶活動來生成語義語境15。如 上所述的,當用戶在諸如對于商業(yè)用戶通用的文字處理器、電子數據表、網頁瀏覽器以及其 他應用程序的應用程序中工作時,語境引擎100還可以保持應用程序狀態(tài)信息??梢詫⒃?應用程序(包括諸如文檔、搜索結果等的應用程序的生成結果)定義為包括所有類型的文 檔和其相關程序。例如,文檔類型可能包括諸如但不限于=Microsoft Office文檔-Word、 PowerPoint、Excel、Visio、Access、Publisher、Frontpage、OneNote 等;在諸如 Microsoft Outlook的電子郵件/管理器程序中的電子郵件、日歷事件、記錄(在寫字板上打字或者手 寫的)以及任務;網頁和基于SGML的文檔(例如,XML)的其他形式;數據庫、數據庫報告、 以及數據的其他示圖;Adobe Acrobat PDF ;照片、掃描圖像以及視頻。應該注意,用戶沒有 必要明確命名或者識別語境15。語境引擎100可以通過測量看起來用戶感興趣的材料的關 聯性(即,下文中進一步描述的語境定義104、105的計算)基于用戶與系統10互動來暗示 和創(chuàng)建語境15。此外,認識到,可以由語境引擎100保持的信息14的類型可能包括諸如但不限于 包括桌面(圖標、背景、主題以及其他配置)的Windows、最近的程序(和諸如表示歷史監(jiān) 控用戶與應用程序互動的臨時非獨立狀態(tài)信息的程序內部的狀態(tài)信息)、最近的文檔、我的 文檔、以及文件夾查看;包括我的愛好、書簽、最近搜索、歷史搜索、最近網頁等的網絡瀏覽 器;以及包括在文件菜單中的最近文檔的Office Applications、電子郵件、記事本、任務、 日歷、聯系人和電話(例如,在MS 0utlook、MS OneNoteNotebooks內)、以及文檔管理系統 索引和查詢。語義語境15和信息語境19再次參照圖2,與12關聯的語義語境15包含用來存儲用于定義語義語境15 的語境定義104的表(或者其他結構化存儲結構)。認識到,語境定義104可能提供關于語 義語境15的標識、分類、描述、和/或標簽信息。例如,用戶可能經由用戶界面202(參見圖 4)向語境引擎100提供初始定義104(作為代表期望的語義語境15而被處理的材料)以 便在創(chuàng)建初始語義語境15中使用。認識到,用戶還可能使語境引擎100從用戶訪問的信息 14中選擇語境定義104,以便在創(chuàng)建初始語義語境15中使用。將語義語境15用于定義還 稱作搜索信息集154(參見圖10)的多個信息14(例如,一系列搜索結果20以及由用戶收 集的其他文檔)彼此相關的方式并且通過語境定義104來定義這種關系的方式。此外,用 戶訪問的、對于選擇的信息14所確定的信息語境19具有用于定義信息14的語境的相關語 境定義105。參照圖8,示出了在系統10內的信息14的組織的示例性實施方式。由用戶所收集 的信息14的集合具有包括多個語境定義104的指定語義語境15。信息的集合還具有單獨 信息14 (例如,一個或者多個文檔集、網頁、網頁鏈接-例如,瀏覽器書簽等),每個單獨信息均具有其自身指定的信息語境19。下文中進一步論述的語境引擎100還將語境定義104、 105彼此進行比較324(參見圖7)以確定是否通過信息的集合包括新信息14 (通過在圖8 中的重影項14、19來表示判定)。例如,包括用于佛羅里達的旅游、酒店、以及娛樂活動的網頁的多個單獨信息 14(例如,信息集合)將分配到具有“佛羅里達”、“低價旅行”、“推薦旅游勝地”、“帆傘活動”、 “佛羅里達冒險行程”、“邁阿密夜總會”、以及“佛羅里達旅游和娛樂活動”(作為結合所有其 他語境定義104的超級論題的實施例)等語境定義104的語義語境15。單獨信息14還通 過指定的語境定義105具有獨立的信息語境19,例如,旅游網頁將具有表示其信息語境19 的信息語境105 “低價旅游”和“佛羅里達”,酒店網頁具有表示其信息語境19的信息語境 105 “推薦旅游勝地”和“佛羅里達”,并且娛樂信息(例如,旅游手冊文檔)具有表示其信息 語境19的信息語境105 “帆傘活動”、“佛羅里達冒險行程”、“邁阿密夜總會”。參見圖10, 認識到,從用于還稱作搜索信息集巧4的單獨信息14的集合的語義語境15的語境定義104 動態(tài)收集單獨信息語境19的語境定義105,并且語義語境還稱作搜索語境156。如下文中 進一步描述的,當用戶獲得新信息14(例如,推薦的佛羅里達所有旅游勝地的列表)時,語 境引擎100確定用于新信息14的信息語境19的語境定義105(例如,“旅游勝地”、“最佳推 薦”、“佛羅里達”、“包括一切的”),然后進行比較以確定是否通過信息集合和語義語境15添 加/收集新信息14和/或其信息語境19。認識到,語境定義104、105可能提供關于信息14的標識、分類、描述、和/或標簽 信息。認識到,用戶可以使語境引擎100確定用于由用戶訪問的信息14的語境定義104、 105以便在創(chuàng)建信息語境15、19中使用,和/或用戶可以指定在生成語境15、19期間由語境 引擎100使用的語境定義104、105。例如,用戶可以在信息14中選擇一些單詞或者單詞組 合,在確定語義語境104、105中使用。例如,語境15、19可以包括超級論題、論題及模式(例如,語境定義104、105),其 中,每一個均根據另一個來建立(即,由論題來建立超級論題,由模式來建立論題,從而超 級論題可以被認為是論題的進一步概況)。每個模式均包括在模式中的單詞和在分析文檔 (例如,信息14)中的單詞相對頻率。通過參照發(fā)現該結構的文檔(例如,信息14),將這些 結構(例如,超級論題、論題、以及模式)添加在存儲器210中。此外,通過在存儲器210中 指向全局詞典109(參見圖2)的關鍵字來表示該結構的所有單詞,全局詞典包括識別每個 單詞Wn的語言全局統計、其唯一指示符In(例如,唯一整數或者其他值)以及在包括每個 單詞Wn的全局單詞集(例如,語言)中的其全局自信息(例如,相對頻率)。認識到,全局 統計可能來自該語言的單詞Wn使用和/或來自通過文檔主體的訓練。你還可以在給定了 單詞Wn使用的任何差別的詞典109中具有醫(yī)學、法律、以及(專門(例如,技術))傾向。隨后,可能允許用戶104明確(例如,提供實際單詞/短語)或者隱含地經由信息 14的關聯來監(jiān)控(例如,添加、修改、或者刪除)語境定義104,其中,信息14的關聯包括在 確定語境定義104期間通過語境引擎100使用的潛在單詞/短語。例如,用戶可以命令語 境引擎100包括一個或者多個文檔內容以便在創(chuàng)建或者另外修正12的語義語境15期 間使用。還認識到,語境引擎100可以自動(例如,沒有接收來自用戶的指示)包括由用戶 訪問的信息14,以便在確定語義語境15的語境定義104期間使用。除非另有建議(例如, 通過語境引擎100),否則用戶可以希望在搜索請求18和/或結果20的隨后處理中主動關聯/使用語境定義104。再次參照圖2,基于內容分析器模塊102的模式識別算法(例如,模式集群和規(guī)則 集103的數據分組)通過信息14來確定語境定義104。模式識別從對于與語義語境15關 聯(或者潛在關聯的確定)選擇(或者另外為了比較目的選擇)的信息14提取包括確定 的語境定義105的信息語境19,然后模塊102使用確定的語境定義105動態(tài)更新語境定義 104。語境定義104、105可以是用于使信息14的內容分類或者另外標注信息14的內容 的單個/多個字母和/或數字描述符(例如,單詞),從而內容引擎100可以將信息14與 用戶手頭項目的語義語境15進行最佳匹配。語境定義105是與信息14 (例如,文檔、圖片、 文章、視頻剪輯、博客等)相關的或者另外指定給信息14的(相關)單詞或者術語或者短 語(和其模式),因此描述信息14并且能夠使信息14的基于描述/單詞分類作為信息語境 19。例如,可以將語境定義104、105定義為包括η階模式,其中,一個單詞為第一階模 式,兩個關聯單詞被認為是第二階模式,三個關聯單詞被認為是第三階模式,四個單詞被認 為是第四階模式,以及五個關聯單詞被認為是第五階模式等。如下文中進一步描述的,語境 定義104、105由在單詞模式/分組中包括的單詞組成。語境定義104、105由選擇的(例如, 基于模式重要性閾值)單詞模式形成,該單詞模式已經由選擇的(例如,基于單詞重要性閾 值)單詞形成。例如,模式映射至將何稱作一個關鍵詞的情況是存在第一階模式的情況。此外,雖然信息14的相關性測量可以表示其與語義語境15的相關性(S卩,比較語 境104、105以判定在選擇的單獨信息14和語義語境15的信息14之間是否存在匹配),還 可以創(chuàng)建否定/過濾語境定義104,以從與語義語境15相關的信息14集合中過濾不期望的 信息14內容。例如,否定語境定義104、105可以包括對于廣告材料、色情材料或者由用戶 識別為不期望的簡單材料的定義。為了有助于識別不期望的材料,用戶可以創(chuàng)建否定語境 定義104、105并且指示語境引擎100將他們分配至單獨信息14的各個信息語境19和/或 表示信息14集合的語義語境15。此外,語境引擎100可以基于通過語境引擎100使用的否定/過濾材料(例如, 單詞、短語、指定文檔等)建議(例如,通過用戶)來自動識別和分配否定/過濾語境定義 104、105。例如,用戶可以指定含有令人反感的/不期望的材料的信息14(例如,大量網站 /網頁、文檔等)。然后,語境引擎100將使用分析器模塊102確定對于經識別的不期望材 料的信息語境19的語境定義105。用戶可能允許語境引擎100自動將這些確定的語境定義 105(表示不期望信息14)分配給語義語境15的語境定義104和/或可以主動地選擇應當 分配哪些確定的語境定義105。用戶還可以建議由語境引擎100使用的一些單詞和/或短 語,以協助可疑信息14的語境定義105的生成。例如,用戶可以強制語境引擎100使用指 定單詞(例如,“性別”、“廣告”等),否則該指定單詞由于缺少對于與指定單詞/短語關聯 的指定單詞/短語和/或模式所確定的重要性可能從語境定義105生成處理(下文中所述 的)被剔除。認識到,在表示不期望信息14的確定的語境定義105的情況下,將確定的語境定 義105添加至語義語境15,但是可能沒有將相關的不期望信息14添加至與語義語境15相 關的信息14集合。否則,可以將不期望/過濾信息14添加至過濾信息文件夾,用于用戶預
      15覽以有助于估計語境引擎100在識別不期望材料中的性能。因此,可以在否定語境中包括 否定/過濾語境定義104、105并且與為代表用戶所希望的材料(例如,信息14集合)的當 前語義語境15相關聯。每個語義語境15均可以既為與語義語境15相關聯的肯定語境定 義104又為與語義語境15相關聯的否定語境定義104。同樣地,全局信息集109(參見圖 2)還可以具有用于自動/手動選擇語義語境15的任何數量的全局否定過濾器(例如,語境 定義104)。全局否定過濾器的實施例可能涉及廣告術語和材料或者涉及色情材料。例如,每種語境15可以具有與其相關聯的否定語境。除了用戶已經識別不期望材 料(例如,用于識別否定語境定義104的信息14)以外,可以按照與肯定語境相同的方式將 材料添加至否定語境。在比方說色情的其他過濾器的情況下,否定語境定義104可以為全 局的(例如,在詞典109中列出)并且用戶可能不需要采取任何行動來創(chuàng)建由系統10(例 如,將具有不期望模式的語義語境15載入詞典109)訪問的預先定義的全局過濾器(包含 在詞典109中可用的全部或者選擇部分的否定語境定義104)。最終,信息14的評分可能 為少于否定語境評分(即,從信息14所獲得的語境定義105與語義語境15的否定語境定 義104匹配)的肯定語境評分(即,從信息14所獲得的語境定義105與語義語境15的肯 定語境定義104匹配)。如果模式在肯定語境定義和否定語境定義104、105下重疊,則對于 在肯定方的模式(但沒有排除)可以減小信息14的評分。因此,認識到語境15可以具有 與其相關聯的肯定和否定語境定義104這兩者??梢园凑誗QL數據庫格式(例如,Microsoft SQL 2005)存儲語境定義104、105, 以存儲所有的語境信息104、105。SQL數據庫格式是用于在相關數據庫管理系統(RDBMS) 中檢索和管理語境定義104、105的一個實施例。SQL數據庫格式通過檢索、插入、更新、 以及刪除在存儲器210中的語境定義104、105數據來提供查詢和修改語境定義104、105 數據并且管理數據庫(例如,存儲器210-參見圖4)。用于訪問在存儲器210中的語境 定義104、105的SQL語言可能包括以下示例性語言要素,例如但不限于Statements (語 句),其對于存儲器210的圖式和數據可以具有持久影響,或者其可以控制事物處理、程 序流程、連接、會話、或者診斷;Queries (查詢),其基于特有標準檢索語境定義104、105 ; Expression"表達式),其可以產生由用于語境定義104、105的數據行和列組成的表格或 者標量值;!dedicates (判定),其能夠指定可以被評估為SQL三值邏輯(3VL)布爾真值的 條件并且該條件用于限制語句和查詢的效果,或者用于改變程序流程;Clauses (條款),其 為語句和查詢的組成成分(在任選的某些情況下);WhiteSpace(空白符),其可以在SQL語 句和查詢中忽略。在另一實施方式中,語境定義104、105可以為涉及描述符與對象關聯的元數據并 且可以體現為用于定界元素的開始和結尾、元素的內容、或其組合的句法(例如,諸如編碼 語句的HTML標志/定界符)。可以使用諸如但不限于定義可以根據其邏輯結構(標題、段 落、或者思想單元等)如何描述文檔的標準通用標記語言(SGML)的結構化定義語言來定義 語境定義104、105。因為SGML提供了 “如何描述語言的語言”,因此SGML通常還稱作元語 言。SGML的特定用法被稱為文檔類型定義(DTD),其精確定義了所容許的語言。例如,超文 本標記語言(HTML)是用于定義語境定義104、105的結構化定義語言的實施例。結構化定 義語言的另一實施例為可擴展標記語言(XML),其定義如何描述數據集合。因此,可以將語 境定義104、105用于提供語境15、19的底層定義/描述,還有助于定義用于生成或者另外操作(例如,修正、查看等)信息的14的12應用的狀態(tài)。例如,可以將HTML定界符用 于圍繞關于HTML頁的描述語言(例如,語境定義104),其作為標題部分位于Web頁中HTML 的頂部附近。認識到,由語境引擎100使用語境定義104、105這兩者,以識別適用于搜索請求18 語境的相關信息14,以及組織與信息14關聯的12應用的狀態(tài)(例如,組織Outlook中 最貼切的電子郵件、組織Word中最相關的文檔、組織最相關的瀏覽器鏈接等)。還認識到, 如下文中參照處理300(參見圖幻進一步描述的,可以使用根據信息14所確定的語境定義 105以有助于相對于語義語境15的語境定義104對信息14排序,即,在根據信息14所確定 的語境定義105與語義語境15的語境定義104之間的類似度。認識到,如果在信息14的 語境定義105與語義語境15的語境定義104之間發(fā)現合適的類似度,則可以將信息14的 語境定義105添加至語境15的語境定義104,以更新語義語境15從而表示信息14是通過 語義語境15所表示的用戶的信息14集的一部分。還認識到,用戶可能已經將任何不相關的信息14 (例如,文檔)添加至與語義語境 15關聯的信息14主體??赡艽嬖谝韵虑闆r,其中,系統10對在與語義語境15關聯的信息 14的主體中的從屬關系來預先測試(例如,識別語境定義105然后將其與語義語境15的語 境定義104相匹配)信息14,或者僅將信息14添加至與語義語境15關聯的信息14主體, 而不考慮信息14是否含有匹配語境定義105。例如,用戶可以對于系統10簡單指定應添加 信息14。認識到,在其他情況下,當已經處理信息14的內容并且具有已經視為擁有了標識 其作為相關材料的評分時,系統10將僅添加信息14。語境引擎100參照圖2,當用戶工作以在12內創(chuàng)建或者編譯文檔和其他數據時,語境引擎 100管理并使用語義語境15的語境信息。分析與語義語境15關聯(手動、自動、半自動) 的每個用戶操作信息14(例如,文檔)。由語境引擎100使用12語境定義104、105,以 引導并且添加網絡搜索18和/或然后區(qū)分搜索結果20的先后順序,是否該結果在整個互 聯網11上、或者位于本地企業(yè)(例如,計算機本地網絡)或在用戶自己的計算機101上。為 了協作目的,經由協作引擎150,可以將語義語境15和/或信息語境19的該論題信息用于 找到在企業(yè)中正在從事相同主題的同事而同時例如遵守隱私和安全策略。如所期望的,參 見下文中描述的協作環(huán)境140,還認識到可能便于在互聯網11上的系統10的用戶和其他用 戶之間的協作。另外,在所希望的情況下,語境引擎100使用這些確定的論題(例如,語境 15,19)以對信息14和其關聯的12程序分類并且對其進行注釋。在向企業(yè)搜索引擎M 和/或文檔管理系統提交信息14 (例如,文檔)之前,可以在企業(yè)中完成信息14的注釋。例 如,可以將系統10配置為存儲或者另外將確定的信息語境19與存儲在存儲器210(例如, 通過數據庫表示的)中各自信息14關聯。為了動態(tài)修改12的語義語境15,可以積極或被動引導語境引擎100以包括 用于通過內容分析器102(參見圖2)分析的用戶操作信息14。積極引導的實施例是用戶 選擇要分配給語義語境15 (例如,用于有助于通過語境引擎100進一步定義/生成12 的語義語境15)的一個或者多個信息14。被動引導的實施例是將語境引擎100配置為自 動選擇(例如,沒有用戶手動互交互)通過在與信息源16和/或本地存儲17交互中用戶 所操作的(例如,創(chuàng)建、修正、存取、或者另外獲得等)任何信息14。例如,語境引擎100可以確定根據用戶從搜尋結果20列表中選擇(例如,通過從列表中點擊鏈接)的這些搜索結 果20所確定的適當的語境定義105,并且將這些適當的語境定義105添加至語義語境15, 同時進行選擇以忽略用戶沒有從搜索結果20列表中選擇(例如,沒有從列表中點擊鏈接) 的那些搜索結果。還認識到,例如可以使用向用戶提供接受或者拒絕所選擇的信息14與語義語境 15的關聯的能力的顯示提示,通過語境引擎100向用戶自動建議在語義語境15生成中使用 的信息14選擇。認識到,當選擇要與語義語境15關聯的選擇信息14時,語境引擎100確 定常駐在選擇信息14中的任何語境定義105(經由內容分析器10 ,以這些新確定的語境 定義105更新語義語境15的語境定義104,從而提供語義語境15的動態(tài)更新能力。認識到,選擇信息14與12的語義語境15關聯的另一實施方式可以是使用基 于時間的被動引導。例如,如果用戶繼續(xù)停留(即,與其交互)在目的源上長達大于預定時 段(例如,45秒),則可以將搜索結果20用于積極地精煉語義語境15的語境定義104,如果 用戶在預定時段內(例如,5秒)關閉目的源,則可以將搜索結果20用于消極地精煉語義 語境15的語境定義104。此外,例如,當用戶將信息14(例如,實際文件或對于信息14的 鏈接)移動至諸如“我的文檔(My Document)”或者用戶桌面的12的監(jiān)控區(qū)域時,信息 14(例如,文件或者網絡內容)的信息語境19可以自動添加至語義語境15。在網頁作為信 息14的情況下,將信息添加至瀏覽器應用程序的“我的愛好(My Favourites) ”將自動將關 聯信息語境19添加至語義語境15。認識到,還可能存在與12的其他應用程序關聯的 其他眾所周知的位置(例如,監(jiān)控區(qū)域)。參照圖2,示出了語境引擎100的一個實施例,其用于處理搜索請求18、向用戶100 提供搜索結果20、以及基于常駐在用于認為的這些新獲取的信息14(通過語境引擎100和 /或通過用戶手動)的搜索結果20的新獲取的信息14中的確定語境定義105更新語義語 境15ο語境引擎100包括內容搜索模塊106,用于接收搜索請求18和/或用于處理(例 如,通過根據語義語境15的內容添加額外參數22來修正搜索請求18的參照22 (參見圖1)) 的搜索結果20 ;內容分析器模塊102,用于為了確定常駐其中的適當的語境定義105(根據 語境確定規(guī)則的集合10 來分析搜索請求18、搜索結果20以及與用戶交互的任何其他信 息14的內容。如果確定了根據信息14所確定的新語境定義105不與語義語境15的任何 一個語境定義104匹配,則將內容分析器模塊102配置為用于使用非匹配語境定義105來 創(chuàng)建新的語義語境15。此外,還包括程序更新模塊108,其用于更新與102關聯的任何 應用程序的狀態(tài)。內容分析器模塊102內容分析器模塊102可以被指令為經由通過用戶界面202 (參見圖4)所提供的菜 單分析用于任何常駐語境定義105的特定信息14。優(yōu)選實施方式使用托盤圖標來允許用戶 訪問語境菜單,其便于選擇與語義語境15關聯的信息14。作為實施例,可以暗示和/或明確進行要包括在語義語境15中的信息14內容的 識別。明確包括的內容是由用戶所識別的信息14(例如,文檔)。例如,通過用戶在文件或 者文件夾上“點擊右鍵”然后選擇添加至語義語境15的菜單選項將導致選擇的信息14對 于用于語境定義105分析的內容分析器模塊102可用。
      18CN 102138140 A
      說明書
      15/61頁此外,可以通過在12內監(jiān)控通過用戶創(chuàng)建或者訪問信息14(例如,文檔或者 其他數據源),利用語義語境15暗示地包括信息14內容。否則,可以通過檢查信息14位于 本地存儲器210何處(和/或信息來源于何源16),利用語義語境15暗示地包括信息14文 檔。例如,可能經由內容分析器模塊102暗示地在語義語境15中包括位于用于12的 我的文檔文件夾中的信息14。另一選項是對于網頁,可以通過用戶簡單查看網頁(例如,長 達預定時段)或者通過用戶由在語義語境15中應該包括頁(URL)的基于工具欄的控制識 別來暗示在語義語境15中包括這些網頁。此外,內容分析器模塊102使用模式群集和數據分組算法(例如,規(guī)則集103)以 從要作為在修正語義語境15的語境定義104中使用的新語境定義的選擇信息14中選取關 鍵論題(例如,語境定義105)。在協作(例如,匿名)的情況下,參見圖10,實施例可以是用戶Un共享搜索結果 20和/或搜索信息集154。當用戶Un搜索互聯網和/或文件系統(例如,數據庫)時,模 塊102基于用戶Un的活動建立語境定義104、105數據,用戶Un的活動觸發(fā)正添加至語義 語境15的材料。這些觸發(fā)可能包括在瀏覽器中讀取結果、將結果20 (例如,文檔)識別為 相關或者非相關(例如,結果20存儲在預先定義的文件夾或者應用文件中)、書簽結果20 或者將鏈接添加至用戶文件系統。認識到,例如,模塊102可以通過監(jiān)控文件系統和瀏覽器 行為來跟蹤用戶的活動。內容規(guī)則集103參照圖2和圖5,示出了由內容分析器模塊102所使用的示例性內容規(guī)則集103, 內容分析器模塊用于從要用作在修正或者另外創(chuàng)建語義語境15中使用的語境定義105的 選擇信息14中提取論題(例如,諸如但不限于單詞和單詞分組的正文部17)。認識到,在 正文部17中包括兩個以上單詞的情況下,這些單詞可以在信息14的文本中彼此鄰近(例 如,認作多詞短語),可以通過在信息14的文本中位于中間的一個或多個單詞彼此分離,或 者其結合。還可以將語境定義105稱作分析信息14的自信息??梢愿鶕Q于在確定自 信息中所使用的表達式中使用的對數的基數,將自信息稱作與以例如位的信息單位所表達 的隨機變量結果關聯的信息內容的測量。例如,在概率事件中所含有的自信息數量可能取 決于該事件的相對概率/頻率,即,相對概率/頻率越小,與事件真正出現的接收信息關聯 的自信息越大。此外,自信息的測量可能具有以下性質如果事件C由兩個相互獨立事件A 和B組成,則表明C已經發(fā)生的信息量等于分別表明事件A和事件B的信息量的和??紤] 到該性質,可以將與結果ωη關聯的自信息Ι(ωη)(以位測量)確定為 {ωη) = Iog2 ( 1 ) = -Iog2 (Pr( ))
      Pr( )在信息14處理的語境下,例如,IL(Wn) = _log2 (Pr (Wn)),其中,Pr是在信息14 中(例如,在文檔中或者在諸如部分、段落、頁等的文檔子集中)找到單詞Wn(或者其他正 文部)的概率(例如,相對頻率)。此外,對于在信息14 (例如,文檔)中的每個單詞/正文 部Wn,可以將用于單詞/正文部Wn的重要性IMP(Wn)測度確定為IMP (Wn) = IG (Wn) -IL (Wn),其中,IL(Wn)為單詞/正文部Wn的局部自信息(LSI) ,IG(Wn)為單詞/正文部Wn 的全局自信息(GSI)。
      換句話說,局部自信息(LSI)可以描述為在考慮中的局部信息14(例如,文檔)中 單詞/正文部Wn發(fā)生的相對概率/頻率描述,并且全局自信息(GSI)可以描述為在全局信 息109集(例如,定義為諸如詞典的單詞和/或短語的詞匯表的語言,文檔和/或者其他信 息源的分組等)中單詞/正文部17發(fā)生的預先定義的(例如,已經已知的)相對概率/頻 率??赡芑谠谶x擇文檔中發(fā)生的其相對概率/頻率以及其在可以包括來自除了選擇文檔 (或者除了選擇文檔以外)的文檔的(例如文檔的分組、詞典等)的單詞/短語的全局信息 109集中發(fā)生的相對概率/頻率這兩者來確定選擇的正文部17的重要性測量。鑒于以上所述,將在選擇信息14中的單詞的相對局部頻率與在選擇的信息14中 其他單詞相比較(用于計算I局部中使用的)并且將全局單詞集(例如,詞典109)中的單 詞的相對頻率與在全局單詞集中的其他單詞(在計算I全局中使用的)相比較。將全局單 詞集表示為如下語言,其可以符號化為可以根據其來計算全局相對頻率值的文檔集合。將 這些全局值存儲在用于在詞典109中含有的每個單詞的詞典109中。重要性計算考慮在信 息14中的單詞的相對頻率與其在標準語言使用或者文檔訓練集中的相對頻率相對。在優(yōu) 選實施方式中,局部自信息與全局自信息之間的偏差提供這種測度。認識到,在詞典109中含有的單詞Wn可以包括在信息14(例如,通過用戶)內識別 (例如,通過用戶)的行話或者用戶定義術語??梢詾檫@些用戶識別的單詞Wn給定或者另 外分配(例如,通過語境引擎100)非常高(例如,與在語言中很少出現的單詞Wn相對應) 的默認全局自信息,因此,這些識別的單詞Wn可以作為任何其他單詞處理。此外,詞典109 可能體現為含有多種語言和/或特定詞典。此外,例如,將GSI描述為在普遍語言中使用的單詞(例如,英語)。用于詞典109 中的GSI來源于處理在大量跨該語言的書籍和文檔中所含有的單詞的相對頻率。對于每種 語言,可能存在含有對于用在該語言中的單詞已經計算的GSI測度的詞典109。當可能出 現在與工程、法律、或者醫(yī)學材料相關的文檔中的時候,對于語言的非標準應用可以計算不 同GSI。在這種情況下,可以將用于單詞的GSI分配給從例如具有醫(yī)學偏愛的材料訓練的單 詞。認識到,在任何情況下,鑒于在全局信息集中的內容定義105的相對頻率(例如, 全局相對頻率),通過考慮在信息14中的內容定義105的相對頻率(例如,局部相對信息) 進行正考慮/分析的信息14的內容定義105的確定。再次參照圖5,在作為用戶與12互動/工作活動的結果,向語境引擎100提交 信息14 (例如,一個或者多個文檔、諸如來自搜索引擎或者文檔管理系統的搜索結果列表、 諸如來自文檔的段落的文本部、諸如我的文檔的興趣位置或者在用戶文件系統中的興趣其 他位置的存在等),或者另外通過語境引擎100接收信息14的情況下,規(guī)則集103可以包括 步驟300。在步驟301處,在每個事件21均可以是公認的(例如,或者靜態(tài)地或者動態(tài)地 預先定義)文本的邏輯單位的情況下,處理信息14的內容以創(chuàng)建一系列事件。例如,在良 好形成的信息14集中,這種公認的/識別的邏輯單元可以為句子、段落、或者連續(xù)段落、頁 或者多頁、PowerPoint中的文本行(點)、單元、在用于HTML(或者其他網頁/內容)的MS ExceKExcel的用戶對其熟悉)的其他邏輯描繪或者行、在網頁/內容主體內句子組合、和 /或在信息14中(例如,在頁中)邏輯分組的文本塊。因此,在信息14中事件21的識別/ 認識可能基于用于事件21的定義機制,該定義機制諸如但不限于標點符號(例如,句號或
      20者逗號);空格(例如,制表位或者空格);元數據(例如,標志和/或用于定義事件21文本 內容的開始和/或結束的定界符);文檔中斷(例如,分頁符、分行符等);以及本領域中眾 所周知的其他定義機制。認識到,信息14可能為一種或者多種格式(例如,PDF、MicrosoftOffice格式、 HTML、XML、以及其他類型SGML及格式)。此外,認識到,事件21結構可以使用在文檔內的 諸如段落的其他結構或者在諸如<DIV>、
      等的網頁(例如,HTML)內的邏輯分類,這表示 在信息14內的邏輯分組文本或者信息14的定義部。信息14可以包括多種語言或者單種 語言。因此,認識到,可以作為獨立語言實現規(guī)則集103。另外,當每個單詞添加至事件21 列表時,可以阻止每個單詞。例如,將stop、stops、stopped、stopping全部添加至事件21 列表作為stop ;但是可以將stopper保持為stopper。認識到,每個正文部17可能屬于一 個或者多個事件21 (例如,單詞為句子的一部分,句子為定位在一頁或者多頁上的段落的 一部分,頁為章或者其他定義信息14部的一部分)。在每個事件21均包括作為文本串形成每個事件21的單詞(例如,被阻止的)和 術語/短語的列表的情況下,步驟301的結果為形成信息14的事件21的列表。因此,步驟 301用于將信息14分成一系列文本串,S卩,表示識別事件21的內容,以使文本串的每個集合 均表示認為信息14的文本的邏輯分組塊的各個事件21。因此,認為信息14的每個公認/ 識別事件21含有一個或者多個正文部17。在步驟302處,對于在信息14(現在表示為事件21的列表)中的每個正文部 17(例如,單詞或者短語),例如,計算局部自信息IL(Wn) = -log2(Pr(ffn))其中,ft·為在 信息14中局部找到的正文部17Wn的概率(例如,發(fā)生的相對概率)。接下來,對于在信息 14中的每個正文部17,例如,計算用于正文部17的重要性測度IMP(Wn) = IG(Wn)-IL(Wn)其中,IL(Wn)為正文部17的局部自信息(LSI),IG(Wn)為正文部17的全局自信 息(GSI)。認識到,可以在保持用于語言正文部17的預先定義的GSI值的全局信息109(例 如,可以存儲在數據庫表中的詞典、或者在存儲器210中的任何其他數據結構-參見圖4) 中保持用于正文部17的GSI的預先定義值111。例如,認識到,可以通過處理大量文檔(或者其他信息源14)來訓練用于全局信 息Iio中的文本部17的GSI的預先定義值111,以獲得代表在語言中使用的文本部17(例 如,單詞/短語)的統計表(例如,該統計表可以源于正文部17相對于該語言中其他正文 部17的發(fā)生頻率的頻率數)。此外,作為從全局信息109中所獲得的唯一整數或者其他代 表值(例如,混列碼、⑶ID、…)“In”與信息14中的每個正文部17(例如,單詞Wn)關聯。 該整數/值對于存儲在全局信息109(例如,詞典)中的每個正文部17是唯一的。因此,正文部107的每個單詞映射至全局信息109中的代碼^1。如果對于遇到的 正文部17不存在代碼In,則在全局信息109中附加代碼化輸入項。這可能發(fā)生在信息14 中出現的俚語、綽號、縮寫詞等。此外,認識到,如果所識別的正文部17的使用被認為是重 要的,則僅實現這些新添加的代碼In,并且因此,在將要使其通過語境定義104、105生成的 模式中涉及該代碼h。為了清晰,可以將代碼h分配給信息14中的每個單詞Wn (以及定 義的詞組-例如,共同考慮組成短語的單詞的情況下的醫(yī)學短語或者其他技術短語)。一個 這種實施例為術語“副神經”,從而將單詞副和神經的組合一起用于定義神經類型。在這種情況下,全局信息109可能具有用于“副神經”的輸入項,其具有用于將該輸入項處理為單 詞組合(例如,短語)的指定代碼h。通過從全局信息109中所獲得的其對應代碼h來表 示在事件21(例如,句子)中的每個單詞(或者預定義詞組)。同樣地,應該理解,還將用于 單詞和詞組的GSI存儲在全局信息109中并且由模塊102通過查找來取出。認識到,鑒于在事件21中的單詞或者預先定義的詞組的上述實施例,如所希望 的,可能或者不可能將合成術語配置為通過系統10使用。例如,如果認為識別的合成詞重 要(例如,滿足重要性閾值),則用戶可能使用用于在處理信息14的識別模式下自動識別合 成詞(例如,詞組)的語境引擎100。步驟302的結果為將唯一值In (例如,整數)分配給在信息14中所識別的每個正 文部17并且對于在信息14中所識別的每個正文部17已經計算了 GSI、LSI、以及IMP。因 此,除了表示為文本串的事件21的原始列表以外,現在可以呈現所有值(例如,整數)事件 21列表。如所描述的,每個事件21 (文本的句子或者其他塊,例如,段落、節(jié)、章)由在信息 的事件21中呈現的單詞Wn的列表組成。然后,信息14成為事件21的列表,其中,每個事 件21都為表示在事件21中的每個單詞Wn (或者預先定義的詞組)的代碼h (例如,整數) 的列表。如下文中所述的,在信息14內的事件21之間找到模式。此外,已經把像“1(我)” 和“am(是)”的單詞視為完全沒有具有實質信息內容,因此在關聯挖掘以前,類似這些單詞 可能決不將其制作為模式并且結束從單詞列表中剔除。還認識到,可以將與局部計算相對 的全局用于剔除一些單詞Wn。剔除這些典型單詞,但是可能存在(或可能不存在)要剔除 的預先定義的單詞Wn的專用表。規(guī)則集103的下一步驟304是鑒于在信息14中存在的一些正文部17相對缺少關 于在信息14中存在的其他識別正文部17的重要性,而將其剔除/刪除。換句話說,正文 部17的IMP(IMP = GSI-LSI)提供在正在考慮中的當前信息14內的正文部17的重要性測 度。通常,IMP越高(在正文部17之間的相對重要性的實施例),則正文部17對于正在考 慮中的信息14的信息內容越重要。該技術的一個優(yōu)勢在于,可以從基于信息內容的進一 步處理中剔除正文部17。這可能還自動包括可能被認為含有相對可以忽略的信息(即,與 認為在全局信息109中相對很少常見/共用的其他正文部17相比較,通過具有在全局信息 110中所分配的較低值所表示的)的例如冠詞和連詞的單詞(例如,the (這個)、and(和)、 but (但)、or (或)…)。認識到,例如相反地,認為在全局信息109中相對很少常見/共用 的正文部17更重要,因此具有比認為含有/表示相對可以忽略的信息的正文部17的值的 較高分配值111。還認識到,如所希望的,與用于更不重要的正文部17的更高值相比較,可 能向更重要的正文部17分配更低值111。因此,使用分配值In(和其計算的LSI)可以進行從信息14的內容中濾除或者另 外的去除考慮的一些正文部17,而沒有通過使用專用詞典(或者其他單詞列表)來識別要 過濾的特定正文部17。因此,在信息14(例如,文檔)中的正文部17(例如,單詞)每一個 均從全局信息集109接收通過其分配值111的類似處理。因此,可以通過正文部17確定的 IMP值相對于包含閾值的IMP的比較來進行從信息14的內容中濾除一些正文部17 (例如, 小于包括閾值的IMP的用于正文部17的任何IMP值為通過進一步考慮去除的正文部17的 候選者)。此外,還實現了可以通過考慮其GSI值并且使用重要性閾值和要剔除的GSI閾值 進行該過濾。
      因此,可以將重要性閾值用于確定將從信息14中剔除以下哪些單詞??梢哉{整該 閾值以增大或者減小剔除的正文部17的百分比。例如,為了減小對于稍后步驟中所執(zhí)行的 模式集群和數據分組(POTG)的計算要求,可能期望基于正文部17的總事件21計數(含有 正文部17的事件21數)或者在信息14內的唯一正文部17的總數來增加從信息14中所 剔除的正文部17的百分比,例如,正文部17僅在信息14中出現有限次數(例如,一次)。 大信息14集通常含有比更小信息14集更多的句子(例如,事件21)和唯一單詞(例如,正 文部17)。步驟304的結果是用于信息14的事件21列現在含有具有最高IMP的正文部17 的子集(即,通過下文所述的模式發(fā)現步驟306中進一步考慮重要性而沒有剔除/去除的 正文部17)。接下來的步驟306是用于在信息14中發(fā)現/識別正文部17的模式并且去除認為 不如其他更顯著模式那樣重要的那些模式。在步驟306中,計算在信息14中所含有的所有 模式(例如,定義為在一個或者多個正文部17之間的確定關聯性)。可以將模式描述為在 多個事件21中出現的一個或者多個正文部17中發(fā)生。例如,可以在模式收集/識別中設 置多個模式閾值??梢詫⒛J降念l率設置為閾值。例如,如果模式沒有出現多于某次數,則將從模式 列表中把該模式排除在外。同樣地,可以將模式閾值設置為相對頻率模式閾值,其中,僅選 擇相對最高頻率數(例如,通常最高出現5次)進行進一步處理。認識到,模式的一個實施 例為在兩個以上不同事件21中重復兩個以上正文部17 (例如,在多個不同句子中共同找到 兩個單詞,因此指示它們彼此具有某種關系)。還認識到,在事件21中的正文部17的相對 定位/位置可能便于模式識別,例如,主要(例如,總是)找到彼此相鄰的兩個單詞,主要 (例如,總是)在每段的第一句中或者在每頁的第一段中或者在每節(jié)的標題中找到一個單 詞等。例如,可以將用于小文檔的值2和用于更大文檔的3用作頻率閾值。此外,可以將第 1階模式(例如,可以將模式的階定義為在模式中的單詞(正文部)數量以使第1階模式具 有一個單詞,第2階具有兩個,第3階具有三個等…)用在較小文檔中以有助于取在計算論 題中可用的模式數量最大值。在較大文檔中,可以使用第2階和更大模式。例如,語境引擎 100可以配置模式挖掘以在第5階模式處停止。認識到,如果降低模式階,則空間相關的模 式仍可以聚集在一起。認識到,用于在事件21中的正文部17的GSI和LSI值的整數表示可能有助于提 高計算模式的計算性能。還認識到,作為在步驟304中進行計算和剔除的結果,在步驟306 中所計算的模式可以由可能與信息14最相關(例如,具有最大IMP)的正文部17組成。因 此,在步驟306中發(fā)生模式挖掘以前,從事件列表中去除具有低IMP的正文部17(即,那些 被認為不滿足重要性閾值的正文部)。這可以減少包括無意義單詞Wn(例如,the(這)、 this(這)、were(是)等…)的模式數量并且可以減少用于隨后找到模式的計算然后加權、 計算重要性,然后挑選這些模式。還認識到,步驟304可以為在確定語境定義104、105中進 行的可選步驟。此外,對于每個模式,引擎100可以計算識別模式的重要性(P-IMP)。該計算的 第一步是要計算用于每個識別模式的模式權數(PW(Pi)),例如像PW(Pi)=包括模式的正 文部17的IMP的和(或者其他數學組合),同樣地,P-IMP(Pi) = P-GSI-P-LSI和P-LSI
      23=-log2 (Pr (Pn) )*PW (Pi)。同樣地,在用于正文部17的GSI的情況下,可以通過利用大量文檔訓練來計算 P-GSI。例如,ft~(Pn)為在信息14內找到模式的概率(例如相對頻率f發(fā)生)。就像單詞 可以建立模式的全局信息109 —樣,可以根據文檔來訓練模式。例如,可以基于文檔訓練結 果向用于每個正文部17的GSI值分配獨立GSI值或者分配用于所有模式的常量。在任何 情況下,認識到,如在全局信息109中指定的,GSI值對于每個正文部17可以相同或者不同。 在當前實施方式中,語境引擎100使用M.0作為用于模式的全球自信息GSI的示例性占位 符。例如,選擇M的原因其是表示在16000000中找到低于1的模式的概率的數字。該數 字意味著任何P-GSI-P-LSI大于0。步驟306的合成計算為語境引擎100具有模式的有序 列表,以使模式的P-IMP越高,則其在表示信息14中越重要。至于用于挑選正文部17的步驟304,可以執(zhí)行模式挑選以包括在信息14中所含有 的最重要的模式。至于正文部17,可以在與信息大小和發(fā)現的模式的總數的關系中改變該 模式閾值。通常,利用更小的文檔來降低信息閾值,以增加對于找到論題可用的數據。認識 到,可以動態(tài)地設置模式閾值以留下充分數量的正文部17來找到模式,并且因此,確定語 境定義104、105。如果模式已經通過重要性處理但是與任何其他模式不相關,則退化情況是 使模式為語境定義104、105。接下來的步驟308是用于計算另外稱為論題的語境定義104,可以將語境定義定 義為置于信息14的模式上的一個示例性語義拓撲,其中,可以將多個信息14(例如,多個文 檔)用于形成語義語境15、19。幸存步驟306的重要模式集合轉到模式集群算法(在這種情況下為P⑶G)。輸出 為模式集群集。模式集群為通過其含有的正文部17并且可能通過其在信息14內的位置而 在信息14中相關的模式。認識到,模式集群的一個實施例為在兩個以上不同事件21中重 復兩個以上正文部17(例如,在多個不同句子中共同找到兩個單詞,因此,指出它們彼此具 有某種關系)。還認識到,事件21中正文部17的相對定位/位置可以便于模式集群的識 別,例如,主要(例如,總是)找到彼此相鄰的兩個單詞,主要(例如,總是)在每段的第一 句中或者在每頁的第一段中或者在每節(jié)的標題中找到一個單詞等。PCDG中原型模式為覆蓋 集群中所有模式的正文部17的集合。此外,在步驟308中將所有正文部17表示為整數的 事實可能促進計算的計算性能。例如,步驟308可以使用模式中的元素(單詞)連同其在事件21結構內的位置使 模式群集(即,形成語境定義104、10 。這意味著共享單詞/短語的模式可以在相同集群 中結束。此外,一直出現在相同事件21中的低階模式可以在相同集群中結束。例如,模式 原型為在包括語境定義104、105的模式中的單詞/短語集合。在一些情況下,其為在包括 /形成語境定義104、105的模式中的單詞Wn的適當子集。因此,語境引擎100將確定的論題(例如,語境定義104)表示為模式集合(集群)。 引擎100保持用于與集群的原型模式一致的論題(集群)的單詞/短語列表。至于模式和 正文部17,可以基于在語境定義104單詞(模式原型)內含有的正文部17的重要性和/或 模式重要性來排列語境定義104、105的先后順序。語境定義104、105的集合表示語義語境 15/信息14的語義論題內容。例如,與一個或者多個文檔結合的語境定義104表示文檔組 的語義語境15。
      在接下來的步驟310中,由于將信息14連同統計計算的結果一起存儲在存儲器 210中(例如,相關數據庫-MS SQL Server 2005),引擎100存儲語境定義104 (和單詞、通 過語境定義104所表示的模式)。保持語境定義104的存儲緊湊的一個特性為將用于正文 部17的整數表示用在存儲器210中,連同全局正文部統計表一起,還保存并且把保持正文 部17與整數(或者其他值In)之間的映射的詞典(例如,全局信息109)除外。因此,鑒于以上情況,使用分析規(guī)則103對于模式關系分析在語境內所包括的內 容。在文本的情況下,在優(yōu)選實施方式中,關聯性(模式)使用句子作為事件21。在電子表 格(或者數據型數據格式)的情況下,在記錄或者單元為事件21的情況下,使用模式分析 技術。將在信息14內所找到的模式用于使用模式集群和數據分組規(guī)則形成論題(即,語境 定義104)。此外,可以將論題群集為超級論題以進一步總結在語義語境15內的數據。語 義語境15可以包括文檔參考、單詞、模式、論題、超級論題,當通過內容分析器模塊102分 析新信息14的時候,保持/更新文檔參考、單詞、模式、論題、超級論題。例如,可以將標準 SQL數據庫用于更新/維持語義語境15的語境定義104。對于語義語境15的所有語境定 義104,SQL數據庫可以為全局的;然而,可以分等級地組織所有信息以識別信息14與其相 關的語義語境15(注解可以將相同的語境定義104用于定義多個信息14)。此外,內容分析器模塊102模塊經由分析器規(guī)則103創(chuàng)建在信息14中所識別的單 詞、模式、語義結構以及數據之間的知識網(即,獨立語境定義104之間的互連)??梢园凑?任何數量的方法分等級訪問該網并且在任何時候通過新關系覆蓋該網。這意味著可以按照 任何水平來組織和訪問語義語境15內的信息。這包括論題(主題)、模式、關鍵詞、段落、 句子、以及其他語言結構。實際上,這意味著可以基于其主題(論題)或根據信息14中的 實際文本通過用戶組織和/或訪問主題。例如,用戶可以點擊提及特定論題(即,語境定義 104)的段落并且語境引擎100可以識別與該論題相關的其他信息14(例如,文檔)的所有 部分。例如,可以將任何材料、文檔、或者部分文檔用于創(chuàng)建語境15。在段落(其被看作小 文檔)的情況下,語境引擎100使用信息測度和模式以找到最重要的正文部17??梢詫⒃?信息用于構成新搜索以找到相關信息或者可以將該信息用于對照用戶的現有語境15進行 測試。認識到,可以將上述規(guī)則集103用于確定用于選擇獨立信息14(用于可能添加至 用戶信息14集合)的語境定義105和/或用于確定組合語境定義104(例如,來自語義語 境15的語境定義104的現有集合的超級論題)。鑒于以上情況,可以作為還稱作超級論題的概括語境定義104、105計算語境定義 104的概括版本,可以不考慮文檔源(例如,用于多個文檔的語境定義104、105的概要)將 超級論題稱作語境定義104、105的概括。在概括語境定義104、105的計算中,首先,獲得用 于語境定義104、105的“模式原型”的集群,然后基于重要性和相互信息(參見下文中的相 互信息定義)混合對用于每個概括語境定義104、105的模式原型中的單詞Wn排序。概括 語境定義104、105為與包括概括語境定義104、105的所形成語境定義104、105的所有模式 關聯的新原型(例如,為了數據庫的壓縮性以16個單詞入選)。以下為概括語境定義104、105的計算的實施方式。1)搜集語境定義104a.載入用于語境15的所有語境定義104
      25
      b.建立用于在所有語境定義104中所指定的所有單詞Wn的WorcKtats對象,包 括i.全局自信息(來自單詞表-例如,詞典109)ii.局部自信息=_log2(局部單詞計數/總語境單詞計數)iii.重要性=全局自信息-局部自信息c.建立論題詞典(語境定義104列表的列表)2)集群語境定義104a.創(chuàng)建用于每個語境定義104的語境定義104集群b.語境定義104集群的目標#=(語境定義104#)/(log2(語境定義104#)) +概 括語境定義104的最小數(例如,1)c.通過對在每個語境定義104對之間類似單詞的#計數來建立用于語境定義 104(集群)的相似矩陣d.當語境定義104集群# >目標(并且存在不同但類似的對)i.找到最靠近/類似對并且將語境定義104結合至較大集群,然后從常規(guī)可用語 境定義104的集合中去除添加的語境定義104ii.相似性測度當前使用“平均相似性”,例如,(在兩種集群中的所有相似性的 和)/ ((在集群0中的論題#) * (在集群1中的語境定義104#))e.把語境定義104集群提交給數據庫3)生成概括語境定義104a.使用以下公式對在每個語境定義104集群中的多個(例如,16)最重要單詞Wn 排序i.單詞重要性=(全局自信息-局部自信息)*相互信息ii.單詞頻率=每個語境來自每個文檔的一單個語境定義104(模式)的所有單詞 頻率的總和iii.全局自信息=來自單詞表的全局自信息iv.局部自信息=_l*log(單詞頻率/單詞的#)/logQ)v.相互信息=log((a*t)/(c*b))/log(2);其中1. a =在含有單詞的語境定義104集群中的語境定義104#2. b =在含有單詞的語境15中的語境定義104#3. c =在語境定義104集群中的語境定義104#4. t =在語境15中的語境定義104#b.把所有的當前模式遷移到用于語境15的概括的語境定義104關聯性c.去除用于語境15的所有當前概括的語境定義104d.對于每個語境定義104集群i.將概括的語境定義104提交給數據庫ii.找到與關鍵詞關聯的所有模式(最多16個)iii.根據模式的語境權重對找到的所有模式排序1.語境權重=(log(語境中模式頻率)/log(》)*(模式權重);其中,模式權重= 在語境定義104集群的排序中所計算的所有單詞的重要性的總和(參見a)
      e.剔除至每個概括語境定義104的模式的最大值#(例如,語境定義104集群)= (關鍵詞5)+1f.將模式提交給概括語境定義104關聯性g.從數據庫中移除語境定義104集群鑒于以上情況,按照概率論和信息論,兩個隨機變量的相互信息、或者傳送信息可 以為測量兩個變量的相互依賴性的量。當使用基數為2的對數時,相互信息的測度的最普 通單位為位。形式上,可以將兩個離散隨機變量X和Y的相互信息定義為聯)= ΣΣ 俞
      y^rxfcXP\\x)P2\y),其中,ρ (x, y)為X和Y的聯合概率分布函數,且pl(x)和p2 (y)分別為X和Y的 邊緣概率分布函數。假設log的基數為2。此外,直觀地,相互信息可以測量X和Y共享的信息其測量已知這些變量之一減 小多少人們對于另一個的不確定性。例如,如果X和Y獨立,則知曉X沒有給出關于Y的任 何信息,反之亦然,因此其相互信息為0。在另一極端,如果X和Y相同,則Y共享由X所傳 達的所有信息知曉X確定Y值并且反之亦然。結果,相互信息與單獨在Y(或者X)中含有 的不確定性相同,即,Y的平均信息量(或者X 顯然,如果X和Y相同,則它們具有相等的平 均信息量)。相互信息量化在聯合分布X和Y的聯合分布之間距離,并且如果X和Y獨立, 則量化聯合分布將是什么。相互信息為在以下檢測中的依賴性測量如果并且只要X和Y 為獨立隨機變量,則I (X;Y) =O0這易于在一個方向上了解如果X和Y獨立,則P(x,y) =P(x) Xp(y),并且因此:logi P(X'y) I = Iogl = O
      {p(x)p(y)J內容搜索模塊106通過語境引擎100使用內容搜索模塊106以為用戶提供考慮到語義語境15相關 的增強的信息14檢索。例如,可以從桌面(例如,FoR 12)、企業(yè)以及互聯網搜索結果20獲 得信息14,可以通過用戶和/或用于通過內容分析器模塊102分析的語境引擎100選擇適 當信息14。例如,可以使用精確論題信息(即,從語義語境15所獲得的語境定義)通過內 容搜索模塊106增加出站搜索請求18。此外,篩選來自搜索結果20的入站數據(即,信息 14)并且經由內容分析器模塊102排列該入站數據的先后順序。參考圖3,示出了語境引擎100操作的實施例,該語境引擎有助于通過使他們立即 重回其12工作環(huán)境來提高用戶效率,該工作環(huán)境具有所有的語境提示和他們在工作 于由語義語境15所表示的其項目時已經建立的其信息14源的組織。內容引擎100象智能 隔膜一樣運轉,其中,運輸代理(例如,模塊102、106)通過信息通道便于數據輸入和輸出 (例如,至信息源16和來自信息源16)??梢岳闷渲獣哉?2內繼續(xù)工作的當前論 題(例如,語義語境1 通過語境引擎100增加出站數據訪問請求??梢曰诋斍?2 的語義語境15(主題和論題)通過語境引擎100組織并且排列來自搜索、文件訪問、RSS種 子以及其他形式的數據種子(網頁機器人等…)的入站數據(還被稱作搜索結果20)的先 后順序。將模式集群和數據分組(PCDG)算法和規(guī)則102-103用于分析用戶操作的信息14。內容搜索模塊106的示例性操作為當用戶進入查詢18(搜索偏愛)(通常通過使用關鍵詞)時,內容搜索模塊106檢查其語義語境15并且提供可以用于增加用戶提供的搜 索參數22(例如,當“記錄片”的定義綁定至語義語境15中的“歷史興趣”的語境定義104 時,將通過“歷史興趣”的語境定義104增加紀錄片的用戶參數22)的最匹配語境定義104 的列表。因此,經修改的搜索請求18發(fā)送至搜索引擎M以獲得使“記錄片”和“歷史興趣” 最匹配的搜索結果20 (例如,作為根據搜索引擎M的標準的一系列網頁,通常具有含有文 檔標題和有時包含部分文本的摘要)。認識到,例如,內容搜索模塊106可以支持布爾操作 符AND、OR、以及NOT的使用,以進一步經由語義語境15指定搜索查詢18。此外,內容搜索 模塊106還可以通過考慮到語義語境15定義近似搜索來增加搜索請求18,該近似搜索定義 在搜索結果20中關鍵詞之間的可接受距離。內容搜索模塊106的另一實施方式是使用在搜索結果20的信息中確定的語境定 義104與語義語境15的語境定義104匹配,以對結果20排序以首先提供“最好”結果(例 如,對于具有語境定義104的更大數量的結果或者評分測度與相關性程度匹配)。此外,內 容搜索模塊106還可以包括蘊含閾值。例如,在匹配小于語義語境15的定義104的最小數 量或者評分測度的特定信息14之間的任何匹配將排除在搜索結果20中的特定信息的顯示 (或者另外,與通過搜索引擎M提供的信息相比將該信息置于排序中的較低的位置處)。信息14和語境15評分作為信息搜索和/或社會性網絡活動(參見在協作環(huán)境140中描述的協作搜索) 的結果,用戶活動可以促使向語境引擎100提交信息14(例如,文檔)和/或語義語境 15 (例如,搜索語境156-參見圖10)。參見圖2、6以及7,論述了在將通過用戶所獲得的新信息14與語義語境15的語 境定義104進行比較中使用的比較處理320。可以將新信息14的內容和與語義語境15關 聯的所有語境定義104相比較,或者將其與語義語境15的語境定義104的選擇子集進行比 較。此外,認識到,語境定義104可以包括包含/肯定語境定義104和/或否定/濾除語境 定義104。語境引擎100用于將選擇信息14(例如,來自搜索結果或者另外通過系統10的用 戶從本地存儲器210獲得的-或者經由網絡11遠程獲得)與12的語義語境15的語 境定義104相比較。認識到,在期望對照語義語境15或者語義語境15的集合給未知文檔 或者文檔集(例如,新信息14)評分的情況下,有時用戶或者語境引擎100可以啟動活動。 最終結果是提供新信息14的內容對于現有語義語境15的相關性的評分。可以將這種評分 用于多種目的。一些目的包括諸如但不限于使用評分基于與語義語境15的相關性(例 如,互聯網搜索結果、文檔管理搜索結果、文檔集合等)對內容排序向用戶顯示新信息14的 內容;確定文檔(例如,信息14)與來自語境集15的哪個語境15相關;諸如在將對照另一 用戶語境15測量一用戶語境15用于確定相關性然后提供網絡化機會的社會網絡環(huán)境140 中,將一語義語境15與另一語義語境15 (例如,通過協作服務器152使用的)進行比較;和 /或使用用于人們共同參加協作活動(例如,協作搜索)的認為相關的語境15匿名或者非 匿名協作搜索的目的。從以下說明中,顯而易見,將關聯性與來自語義語境15的語境定義104或者與來 自選擇信息14(例如,文檔)的語境定義105相比較可以為類似處理。當處理信息14時, 結果為最代表信息14內容的語境定義105的集合。聚集來自一個或者多個信息14的語境定義105以形成信息語境19,并且聚集來自一個或者多個信息14的語境定義105以形成分 配給所有一個或者多個信息14的對應搜索語境15的語境定義104。因此,對于從信息14 或者從語義語境15所獲得的語境定義105集合的評分可以是對稱處理。對于來自語境15 或者信息14的語境定義104、105的評分給出了語境數據的相關性測度(例如,在信息14 和語境15之間、信息14對信息14,或者語境15對語境15,這種情況可以為任何一個)。參考圖7的處理320,在步驟322處,處理語境數據。例如,用戶或者語境引擎100 促使對照語境15或者語境15集合給信息14 (例如,一個或者多個文檔網頁等)的集合或 者語境15評分。如所提及的,可以將信息14的集合處理為臨時語境或者永久語境。也就 是說,可以對照信息14的集合測試信息14的集合,以使動態(tài)創(chuàng)建信息集合14中每一個的 信息語境19。在最簡單的情況下,對照語境15處理信息14。通過示例,將信息14處理為以上所 述的語境定義105。該處理的結果為來自信息14的最有代表性的語境定義105的集合。在步驟3M處,確定評分(例如,在兩組語境數據集合之間的相關度)。在步驟324 中,測量在目標語境定義(例如,文檔的)和其他語境定義(例如,語境15定義104)之間 的重疊測度??梢詫⒄倩卦撜Z境定義105定義為來自信息14的單詞模式的集群(例如,連 同其原型模式一起,通過上述模式辨別相關)。計算一系列測度以識別目標信息14和語境 15之間有多少相關語境定義。在兩組語境定義集合之間,模式匹配計數為通過在兩個語境 定義集合之間的語境定義計算的語境定義。此外,計算在語境定義的這兩個集合之間的每 個語境定義的模式中的單詞之間的匹配計數。實際上,這是用于語境定義104、105的模式 原型。這里,系統10可以設置用于評分的雙閾值,其中,對模式命中/匹配的評分高于單詞 命中/與模式原型匹配但是這兩者均可以用在總匹配評分中。例如,單獨使用或者結合這兩種測度以通過語境定義匹配評分或者在目標信息14 與語境15之間的相關性來提供總語境定義??梢约纤姓Z境定義的評分以表示信息14 對于語境15的關聯性的總評分?;蛘?,其可能為用戶的活動僅正設法識別來自語境15和 信息14的語境定義的子集是否相關的情況。在這種情況下,可以測試來自語境15和/或 信息14的語境定義的一個或者多個子集以確定相關性。一旦已經對照語境15給信息14(或者來自另一目標的語境定義,例如,另一語境 15)評分,還可以在類似處理中對照信息14(或者另一語境1 給任何否定語境評分。對 照語境15的語境定義集合的總評分為肯定語境定義匹配的語境評分較少或者另外,通過 否定語境定義匹配的評分減少。否定/過濾語境定義104可以與語境15直接關聯和/或 主動為如從全局信息集109所獲得的全局否定語境的每個全局分配該否定/過濾語境定義 104 (例如,可以通過客戶端用戶任選地激活色情和廣告過濾,在這種情況下,這些全局否定 語境定義的情況將為計算的一部分)。因此,認識到,可以使信息14和/或語義語境15的 語境定義與其他信息14、其他語境15的語境定義、和/或從全局信息集合109所獲得的全 局語境定義(例如,否定語境定義)匹配。在步驟3 處,可以將評分有利的信息14 (例如,滿足語境定義匹配閾值)添加至 與語義語境15關聯的信息14集合。此外,還可以通過語義語境15的語境定義104集合信 息14 (例如,信息語境19)的確定的語境定義105。在一些情況下,用于信息14 (例如,文檔 或者文檔集)的評分結果可以具有在文檔級別與其關聯的匹配閾值或者通過語境定義級別與語境定義關聯的匹配閾值。如果滿足這種匹配閾值,則可以通過語境引擎100來使用 這些匹配閾值以將信息14添加至語境15。例如,如果通過來自語境15的一個或者多個語 境定義104來覆蓋在構成用于語境定義105的原型模式的單詞集合中的所有單詞,則可以 在與語境15關聯的信息14的集合中包括信息14。在步驟3 處,可以在用戶界面202(參見圖4)上向用戶顯示信息14的評分結果。 還認識到,可以不顯示評分結果并且可以通過由用戶訪問限制信息14與語義語境15的關 聯性,和語境定義104、105的集合體。認識到,在確定的語境定義105表示不期望信息14的情況下,將確定的語境定義 105添加至語義語境15,但是可以不將關聯的不期望信息14添加至與語義語境15關聯的 信息14集合。否則,可以將不期望/過濾的信息14添加至過濾的信息文件夾,用于用戶預 覽,以有助于估計語境引擎100在不期望材料的識別中的性能。因此,可以在否定語境內包 括否定/過濾語境定義104、105,并且否定/過濾語境定義104、105與代表用戶的期望材 料(例如,信息14的集合)的當前語義語境15關聯。每個語義語境15可以為與語義語境 15關聯的肯定和否定語境定義104這兩者。同樣地,全局信息集109(參見圖2、還可以具 有用于自動/手動選擇語義語境15的任何數量的全局否定過濾器(例如,語境定義104)。 全局否定過濾器的實施例可以涉及廣告措辭和材料或者涉及色情材料。語境15評分(例如,逐個論題)的一個實施例如下。評分技術查看在語境定義 104、105的原型模式(包括在語境定義104、105中的模式的單詞集合)和具有來自另一信 息14源(例如,另一文檔或者語境、文檔集合等)的語境定義104、105或者語境定義104、 105的列表的模式之間的匹配。例如,假設來自考慮中的文檔的語境定義105的集合Td和 來自語境Tc的集合,語境引擎100可以執(zhí)行如下語境引擎100查看在Td(包括在語境定 義105中的模式的單詞集合)中的每個T(例如,語境定義105)的模式原型并且確定由在 Tc (總體上,語境定義104的所有關鍵詞)中模式原型覆蓋多少。這為我們提供了用于Td 的原型模式對Tc的原型模式的覆蓋百分比。然后,語境引擎100查看在Td的每個T中的 模式并且查明在Tc的模式(同時,語境的所有模式)中覆蓋多少。這為我們提供用于在Td 中的每個T的模式的覆蓋百分比。在這兩種計算中,語境引擎100可以使用重要性數來計算覆蓋百分比。所以其不 僅簡單,為含有或者沒有的單詞。因此,對于在Td中的T,可以計算覆蓋百分比作為和(覆蓋單詞的重要性)/和(在模式原型中的所有單詞的重要性)*100和(覆蓋模式的重要性)/和(在論題中的所有模式的重要性)*100僅將它們保留為分數。*100是為了人們查看百分比結果。現在,語境引擎100具 有多個選項。如果可以通過最好的語境定義104、105匹配的評分、非零語境定義的平均語 境定義評分、所有語境定義的平均評分、或者語境定義(例如)的最壞評分來確定會員。語 境引擎100還可以使用覆蓋的語境定義100的百分比。在一實施例中,當測試來自文檔14的語境定義105的集合以參加語境15時,語境 引擎100可以使用用于一個或者多個度量(例如,三個度量)的最小閾值以確定在語境中 的文檔會員。1.非零論題關鍵詞(原型模式)對語境論題的平均評分;2.所有模式對所有語境模式的評分(實際上,其對在目標文檔和語境中的所有共同論題求和并且對它們評分);和/或3.在目標文檔中所覆蓋的論題的百分比。因此,如果滿足一個或者多個(例如,所有3個)閾值,則將文檔14識別為屬于語 境15ο語境引擎100的操作的數字實施例參照附錄Α,示出了關于產品市場,具體地,目標市場營銷的論題的正文內容的12 頁文檔14。電子表格示出了模式集群(即,nsl =CID為識別的集群ID,nsl =PID為識別的 模式ID,nsl =Freq為計算的模式頻率,nsl :W為模式權重,nsl 1為計算的模式重要性, nsl 為識別的一個單詞,nsl :wfl為用于一個單詞的單詞頻率,并且類似地,nsl :w2/nsl wf2ns 1 :w3/nsl :wf3nsl :w4/nsl :wf4nsl :w5/nsl :wf5 為用于兩個單詞、三個單詞、四個單 詞以及五個單詞)。還包括單詞計算結果的列表(即,nsl :Word為單詞,nsl =Count為在文 檔中的單詞頻率,nsl =LocalSurprisal為單詞的局部重要性,nsl =GlobalSurprisal為單 詞的全局重要性,并且nsl =Importance為單詞的總重要性)。如在模式集群表的左列中的集群ID(nsl =CID)中所示的,集群(論題)41和39抽 出文檔14的主要語境內容。文檔14是關于產品定位和獨特競爭優(yōu)勢的全部。其他識別集 群ID 34、33、32也說明文檔14。語境引擎100的示例性操作360步驟362參照圖9,語境引擎100具有分成一系列事件(例如,句子)的文檔的三個公認事 件En,每個事件均含有多個單詞Wn。El-Wl, W2, W3E2-W2, W3, W4E3-W1, W2, W3, W5注意,在該實施例中,文檔由總共10個單詞Wn組成,具有三個句子作為分離事件 En0步驟364語境引擎100計算在文檔中找到的每個單詞Wn的概率I3r(Wn)(例如,發(fā)生的相對
      頻率)及其局部自fn息ο
      Pr (wl)=0· 2 和 Ilocal(wl)=-log (0· 2)
      Pr (w2)=0. 3 和 Ilocal (w2)=-log (0· 3)
      Pr (w3)=0. 3 和 Ilocal (w3)=-log(0. 3)
      Pr (w4)=0. 1 禾Π Ilocal (w4)=-log(0. 1)
      Pr (w5)=0· 1 禾Π Ilocal (w5)=-log(0. 1)順便提及,例如,作為在通過文檔中的單詞總數所劃分的文檔中的單詞的出現數 (即,頻率)計算Pr (Wn)。語境引擎100從詞典中選擇用于每個單詞Wn的全局自信息109值GSI作為 lg(wl)、Ig (w2)、Ig (w3)、Ig (w4)、Ig (w5),然后,計算用于每個單詞重要性測度IMPn為IMPl = Ig(Wl)-Ilocal (wl)IMP2 = lg(w2)-Ilocal(w2)
      IMP3 = lg(w3)-Ilocal(w3)IMP4 = lg(w4)-Ilocal(w4)IMP5 = lg(w5)-Ilocal(w5)順便提及,Ig(Wn)可以基于大量文檔的處理以得到代表在語言中單詞使用的統計 表(還稱作源于頻率數量的數)。此外,語境引擎100從詞典中選擇用于每個單詞Wn的唯一整數。il用于wl,i2用于w2,i3用于w3,i4用于w4,i5用于w5,給出El-il, i2, i3Ε2- 2, i3, i4Ε3- 1, i2, i3, i5步驟366語境引擎100可以任選地剔除具有低于指定重要性閾值以下的較低IMPn的單詞 Wn。例如,讓我們假定IMP1、IMP2以及IMP5都高于閾值,因此,導致從事件En的列表 中剔除單詞W3和W4,給出El-Wl, W2E2-W2E3-W1,W2,W5 以及El-il, i2Ε2- 2Ε3- 1, i2, i5認識到,如果剔除在事件中的所有單詞,則從事件列表中去除該事件。步驟368現在,語境引擎100使用剩余單詞Wn計算在文檔內所含有的所有模式/關聯性, 從而將模式定義為在多個事件中一個或者多個單詞的發(fā)生。通過允許的第一階至第五階 (即,Wl為第1階模式并且W1、W2為第2階模式)將模式頻率設置為在如大于1的該實施 例中的模式閾值。因此,語境引擎100具有Pl = il(在事件 E1、E3 中)P2 = il,i2(在事件 E1、E3 中)P3 = i2(在事件 E1、E2、E3 中)其中,當i5沒有在大于一個事件中發(fā)生的時候,沒有把E3中的i5視為模式。注意,可以將單詞Wn表示為整數h以提高模式檢測的計算性能。接下來,計算模式權重,包括包含模式Pn的單詞的所有IMP的組合PW(Pn)(例如, 和)。認識到,可以通過使用大量文檔訓練來計算P-GSI并且或是保持為用于所有模式的常 數和/或唯一值可以與在全局信息集合109(例如,預先定義的ft~(Pn)全局值)中的獨立 單詞關聯。(a)因此,語境引擎 100 計算 PW(Pl) = IMPl,Pff (P2) = IMP1+IMP2, Pff (P3)= IMP2,(b)然后,語境引擎 100 確定 P-GSI (Pl) ,P-GSI (Pl) ,P-GSI (Pl)(例如,全部等于 24), (c)然后,語境引擎 100 確定局部 ft· (Pn)為 ft· (Pl) =2/3,Pr(P2) =2/3,Pr(P3) =3/3(作
      32為在事件中的模式發(fā)生的相對頻率),然后,語境引擎100使用來自步驟(a)、(b)、(c)的確 定值來確定模式P-IMP的重要性為P-IMP (Pl)、P-IMP (P2)、P-IMP (P3)??商鎿Q地,系統10可以計算模式的重要性為m重要性=(M.O+Math. Log((兩倍)mFreq/(兩倍)文檔描述符.句子計數, 2. 0d)) *m 權重其中,作為在用于該信息14(例如,文檔)的模式中的每個單詞的重要性的和來計 算權重。注意,可以將值對視為用于模式的全局自信息的占位符,然而,如果系統10訪問 在該語言中模式發(fā)生的詞典109,則替代地,系統10可以使用該值。log術語表示在信息14 中的模式的自信息(例如,在信息14中找到該模式的概率的log)。該log值乘以模式權 重。所以,可以將模式重要性定義為(全局-局部自信息)*模式權重。因此,可以通過來 自含有用于訓練集(或者全體語言)的全局自信息的語言的模式詞典來代替值M。和步驟366 —樣,接下來,執(zhí)行模式剔除以包括最重要的模式。例如,讓我們假定 P-IMP (P2)、P-IMP (P3)全部高于模式閾值,因此,導致從模式Pn的列表中剔除Pl。步驟370接下來的步驟是通過模式含有的單詞Wn并且可能通過其在文檔中的位置來確定 模式(在這種情況下,P2和P3)的關聯性(相關程度)。對于該步驟,可以將每個模式表示 為整數。讓我們假定,對于該實施例,由于在每個模式中的其類似“單詞” i2和其在文檔內 的相對定位,將模式P2和P3確定為模式集群。因此,把模式P2-P3視為“論題” -Tl,該論 題具有il、i2作為在論題Tn(—般地,稱作語境定義104)中的單詞列表。還認識到,在該 文檔中確定多個論題Tn的情況下,可以重復僅用于在論題Tn中所含有的這些單詞Wn的以 上處理來確定超級論題STn。這些論題Tn和超級論題STn與12的語義語境15關聯。順便提及,在隨后的文檔評分中,可以將論題Tn(例如,W1、W2)的單詞分組用于與 在對于文檔(即,目標文檔)評分的事件中所找到的類似單詞分組匹配。此外,可以結合或 者單獨使用在模式集群P2-P3中所表示的單詞的相對定位。換句話說,認為語義語境15的 論題Tl具有單詞wl和w2、模式P2和P3、以及模式集群P2-P3??梢詫⒄擃}Tl的所有這些 屬性獨自或者結合地用于與對于目標文檔所確定的論題的單詞內容Wn進行比較。實質上, 計算測度作為代表在目標文檔的論題和語義語境15的論題之間的重疊程度。步驟372相對于它們來自的文檔,將所有的單詞Wru模式Pru以及論題Tn/STn連同統計計 算的結果一起存儲在數據庫(例如,存儲器210)中。將單詞表示為整數并且將詞典109 用于表示整數化與單詞之間的映射,和用于每個單詞的全局統計。以這種方式,例如,現在 通過包括論題Tl的屬性的論題Tl來定義語義語境15??商鎿Q地,除原始文檔(例如,信息14)的參考以外,語境引擎100還可以將模式、 論題以及超級論題連同用于每個的相關統計一起存儲在數據庫210中。因此,可以將語境 引擎100配置為加載信息14并且訪問對應的單詞Wn統計。同樣地,認識到,可以通過在詞 典109中的其值(例如,整數值)表示在模式或者語境定義104中的每個單詞Wn。協作環(huán)境140參照圖10,示出了用于基于對于搜索信息集154的不同對之間共享搜索語境156的確定,促進在多個用戶Un之間共享/訪問各個搜索信息集IM的協作環(huán)境140。共享語 境156可以為具有某些重疊級別的任何語境定義160集合。這可以基于逐個定義或者在聚 合體中的語境156進行評分。如上文中通過示例所述的,可以基于利用包括搜索請求18和 搜索結果20的多個信息源16 (例如,經由第三方搜索引擎24)用戶Un搜索活動生成搜索信 息集合154的內容。搜索信息集合巧4還可以含有所希望的對于用戶Un生成信息14(例 如,文檔等)的參考。用戶Un的工作活動可以包括在通信網絡11上經由信息請求18 (含 有搜索參數22)和信息響應20 (含有產生的信息14和/或其參考)從多個信息源16的信 息14檢索。上文中關于信息處理系統10(參見圖1)給出了在環(huán)境140中訪問的信息14 的實施例。此外,當已經建立搜索語境156時,協作環(huán)境140暗含地可以搜索協作者的信息集 合154。當用戶提出語境156內的R)R12的應用程序(例如,Microsoft Word)時,在用戶 進行相同的搜索請求18以前,協作引擎150可以通過協作者的列表和/或搜索結果20增 減應用情況??梢詫f作服務器152配置為向協作引擎150廣播(或者多播)并且詢問他 們是否具有可以通過網絡11在用戶之間共享的相關語境156和/或信息集合154。一個 實施例為搜索結果20。其還可能為以下情況,在一臺機器上的協作客戶端150發(fā)起關于用 于新和/或現有語境156的給定語境定義160 (和/或語境156)的對于協作者的請求18。 除了通過打開由用戶的協作引擎150所監(jiān)控的12中的語境156,用戶甚至不能發(fā)起該 請求18。為了確定哪個搜索信息集IM具有共同的搜索語境156,環(huán)境140具有配置為將 每個搜索信息集154的搜索語境156彼此進行比較的協作服務器152。用戶Un均具有為 了通過網絡11與協作服務器152通信而耦合的協作引擎150。協作引擎150將與每個用 戶Un的每個搜索信息集IM關聯的各自搜索語境156通信至協作服務器152,以便隨后在 確定共享搜索語義156中使用。協作服務器152還可以存儲如相對于用戶Un所獲得的搜 索信息集1 的副本,和/或如對于搜索信息集IM與其他用戶Un通信的需要,協作服務 器可以請求來自用戶Un的搜索信息集合154的副本作為確定對應搜索語境156之間匹配 的結果。協作引擎150還與協作服務器152通信,以請求并且獲得與用戶Un的指定搜索語 境156匹配的搜索結果集合154。用戶Un還可以具有在確定屬于用戶Un的搜索信息集合 154的搜索語境156中使用的語境引擎151。認識到,語境引擎151的一個實施方式為上文 關于信息處理系統10 (參見圖1)所述的語境引擎100。網絡 11經由一個或者多個通信網絡(諸如內網和/或外網-例如,互聯網)便于在用戶 Un (例如,經由網絡通信裝置101-參見圖4)、協作服務器152、信息源16、以及搜索引擎M 之間的通信,并且通過用戶裝置101(參見圖4)的用戶界面202由用戶進行訪問。如所希 望的,環(huán)境140可以包括多個用戶裝置101、多個協作服務器152、多個信息源16、多個搜索 引擎對、以及一個或者多個耦合的通信網絡11。認識到,協作引擎150的一個實施方式是作為協作服務器152的客戶端。協作引 擎150可以駐留在用戶裝置101 (如通過示例所示的)上,或者可以將其配置為駐留在遠程 裝置101(例如,作為在用戶Un和協作服務器150之間的代理服務器-未示出,或者駐留在 與協作服務器152相同的服務器裝置101上)上并且通過網絡11由用戶裝置101可訪問
      34的網絡協作服務(例如,協作網絡服務)。認識到,如所希望的,關于用戶Un的搜索請求18 和搜索結果20的網絡通信可以是在用戶Un和搜索引擎M之間、在用戶Un和直接與信息 源16之間(例如,繞過搜索引擎24)、和/或在用戶Un和協作服務器150 (其作為在用戶 Un和搜索引擎對和/或信息源16之間的代理裝置運轉)之間。作為僅用于論述目的的典 型實施例,以下論述使用駐留在用戶裝置上101并在與協作服務器152網絡通信中的協作 引擎I50的實施方式。捭索信息集154參照圖11,搜索信息IM的實施方式包括諸如但不限于包括多個搜索參數22的 搜索請求18的內容;包括對于與所請求的搜索參數22匹配(例如,某種程度上)的多個信 息14(例如,文檔,網頁等)的參考鏈接158的列表的搜索結果20的內容;包括信息14的 搜索結果20 ;或者其組合。可以將參考鏈接158引導160至搜索信息IM文件內所含有的 信息14和/或引導162至位于搜索信息IM文件外部的信息14。這還可以包括來自語境 156(從其發(fā)起搜索18)的語境定義160的選擇子集或者語境定義160。認識到,搜索信息154的參考鏈接158的配置可以包括諸如但不限于超鏈接,其 被稱為信息14中對于相同信息14或者可以在不同域上或者可以為不同域的一部分的另一 信息14的另一部分的參考或者導航元素(例如,可以將URI的參考或者導航元素用于保持 文件或者URL索引,以使參考可以為URL、文件名等…)。參考鏈接158可以包括嵌入鏈接和 /或內聯鏈接。例如,將嵌入鏈接158稱作嵌入在諸如超文本或者熱區(qū)域(例如,覆蓋文本 標簽或者圖形圖像的用戶界面202屏幕的區(qū)域)的信息14的對象中的鏈接。可以將內聯鏈 接158用于顯示(在用戶界面202上)遠程信息內容而沒有將內容嵌入在信息14中。諸 如內聯鏈接158顯示遠程信息內容的特定部分的情況下(例如,索引圖像、低分辨率預覽、 裁剪部、放大部、描述文本等),遠程信息內容可以通過用戶Un選擇鏈接158或者在沒有用 戶Un選擇鏈接的情況下被訪問,并且當激活時訪問其他部分或者全部信息內容。此外,如 下所述,搜索信息1 具有與例如文檔、網頁、文檔和/或網頁的參考鏈接158等中的每個 信息14內容關聯的搜索語境156。搜索語境156搜索信息154的搜索語境156包括提供關于搜索信息154的識別、種類、描述、 和/或標注信息的語境定義160。例如,語境定義160可以為用于分類或者另外標注搜索 信息154的內容(例如,信息14本身、搜索參數22、和/或參考鏈接158)的單個/多個字 母和/或數字描述符(例如,一個或者多個單詞),以使下文中進一步描述的、協作服務器 152可以將與搜索信息IM關聯的搜索語境156與其他搜索信息集154的搜索語境156最 佳匹配。因此,語境定義160可以為與搜索信息154(例如,網頁、文檔、圖片、文章、視頻剪 輯、博客等)關聯或者另外分配給搜索信息154的(相關)單詞或者術語或者短語(或者 其模式),因此描述信息巧4并且便于搜索信息IM的基于描述/單詞的分類作為搜索語境 156。認識到,參照信息處理系統10 (參見圖1),語境定義160的一示例性實施方式為上文 所述的語境定義105,并且搜索語境156的一實施方式為上述語義語境19。例如,語境定義160可以由作為單詞模式/分組/短語包括的單詞組成。可以選 擇語境定義160作為代表搜索信息154的正文和/或圖形內容??梢允褂迷谒阉餍畔M 的任何正文主題中不存在(例如,基于用于從信息源16獲得圖形圖像的搜索參數22和/或圖像識別分析,將描述標簽附至圖形圖像的內容)的術語學通過語境引擎151來分配語境 定義160和/或可以分析用于從其選擇有代表性的單詞模式/分子/短語的搜索信息IM 的正文內容。還認識到,無論關聯搜索信息集巧4的實際圖形和/或正文內容怎樣,用戶Un 可以將語境定義160分配給搜索語境156。上文中,參照語境引擎100(參見圖幻的內容分 析器模塊102描述了從搜索信息14中選擇有代表性的單詞模式/分組/短語的一示例性 實施方式。還認識到,如上文中參照圖1的系統的語義語境15、19所述的,搜索語境160還 可以含有應用狀態(tài)信息(例如,瀏覽器書簽)??梢园凑誗QL數據庫格式(例如,SQL 2005)將語境定義160存儲在存儲器210 中。SQL數據庫格式為用于檢索和管理相關數據庫管理系統(RDBMQ中的語境定義160的 一個實施例。SQL數據庫格式通過檢索、插入、更新、以及刪除存儲器210中的語境定義160 數據提供查詢和修改語境定義160數據并且管理數據庫(例如,存儲器210-參見圖4)。用 于訪問存儲器210中的語境定義160的SQL語言可以包括以下示例性語言元素,諸如但不 限于statement (語句),其可以對存儲器210的圖解和數據具有永久影響,或者其可以控 制事物處理、程序流程、連接、會話、或者診斷;Query (查詢),其基于特有標準檢索語境定 義160 ;Experssi0n(表達式),其可以產生由用于語境定義160的數據行和列組成的標量 值或者表;!dedicate (判定),其可以將可以估計的條件指定給SQL三值邏輯(3VL)布爾真 值并且用于限制語句和查詢的效果,或者用于改變程序流程;Clause(條款),其(在任選的 某些情況下)為語句和查詢的組成成分;以及Whitespace (空白符),其可以在SQL語句和 查詢中省略。在另一實施方式中,語境定義160可以為涉及描述符與搜索信息154的對象關 聯的元數據并且可以體現為用于分割元素的開始和結尾、元素的內容、或者其組合的句法 (例如,諸如編碼語句的HTML標記/定界符)??梢允褂弥T如但不限于定義可以根據其邏 輯結構(標題、段落、或者思想單元等)如何描述搜索信息1 的標準通用標記語言(SGML) 的結構化定義語言來定義語境定義160。SGML通常還稱作元語言。SGML的特定用法被稱為 文檔類型定義(DTD),其精確定義了所容許的語言。例如,超文本標記語言(HTML)為用于定 義語境定義160的結構化定義語言的實施例。結構化定義語言的另一實施例為可擴展標記 語言(XML),其定義如何描述搜索信息IM數據的集合。因此,可以將語境定義160用于提 供語境156的底層定義/描述。例如,可以將HTML定界符用于圍繞關于HTML頁的描述語 言(例如,語境定義160),其作為標題部分位于Web頁中HTML的頂部附近。認識到,通過語境引擎151來確定與各自搜索信息IM相關的搜索語境156的語 境定義160,然后通過協作引擎150使用其以響應于協作引擎150已知的用戶的語境156, 通過用戶對于協作引擎150的明確請求和/或通過協作引擎150暗示做出從協作服務器 152請求其他用戶Un的相關搜索信息154。還認識到,如下文中參照處理400(參見圖4) 進一步描述的,可以將語境定義160(與其他搜索語境156的語境定義160相比較)用于有 助于對其他搜索信息集1 相對于用戶Un的搜索信息154的相對相關性(S卩,用戶Un的 搜索語境156與其他用戶Un的搜索語境156之間的相似性程度)的排序。如果在用戶的 搜索信息154的搜索語境156和其他用戶的搜索信息154的搜索語境156之間找到(如通 過協作服務器152所確定的)適當的相似性程度(例如,滿足語境匹配閾值),則如下文中 進一步描述的,對于用戶來說對于相應搜索信息1 的訪問(與匹配的搜索語境156關聯)是可用的。示例件捭索語境156比較參照圖12和13,例如,用戶Ul具有有關聯搜索語境156a的搜索信息集IMa,用戶 U2具有有關聯搜索語境156b的搜索信息集1Mb,并且用戶U3具有有關聯搜索語境156c的 搜索信息集K4c。此外,協作服務器152至少還具有存儲在存儲器210中的搜索語境156b、 156c,并且搜索語境156b、156c與用戶U2、U3(例如,經由諸如用戶Un的網絡11地址的用 戶ID)關聯。通過實例,搜索信息集154b包括關于佛羅里達豪華旅行、旅游公司、以及重點推 薦旅游勝地公司和游輪公司的列表的信息。搜索語境156b的關聯語境定義160b包括術語 “佛羅里達”、“豪華旅行”、以及幾個旅游勝地公司名稱。通過實例,搜索信息集15 包括關 于佛羅里達低價旅行、佛羅里達旅游公司、以及重點推薦旅游勝地的列表的信息。搜索語 境156c的關聯語境定義160c包括術語“佛羅里達”、“低價旅行”、以及幾個旅游勝地公司名 稱。用戶Ul經由搜索請求18和對應搜索結果20與搜索引擎M交互。用戶Ul的語境 引擎151(參見圖10)分析與搜索請求18 (含有多個搜索參數2 和結果20(例如,含有一 系列網頁鏈接158的大量結果列表)關聯的搜索信息IMa,并且生成代表搜索信息集15 的內容的搜索語境156a。例如,搜索請求18含有“便宜”、“旅行”、“佛羅里達”、以及“包括一切旅游勝地”的 參數22。搜索結果20含有用于用戶選擇旅游公司的網頁鏈接158的列表、關于佛羅里達 的網站、機票價格、以及具有旅游者評論的用戶選擇旅游勝地(包括和不包括這兩者)的列 表。認識到,如下所述,為了有助于精煉或者另外過濾未經分析的(例如,從搜索引擎對所 獲得的)搜索信息IMa,用戶Ul與語境引擎151交互以有助于從搜索信息集15 中去除 不期望的(對于用戶Ul)信息內容。因此,認識到,搜索信息集15 代表對于佛羅里達旅 行的用戶Ul特有的分析。還認識到,搜索信息集15 可以包括通過用戶Ul保存的與某些 鏈接158相關的或者另外通過在收集搜索信息集15 中通過用戶Ul所使用的各個應用程 序自動跟蹤的應用狀態(tài)信息(例如,瀏覽器書簽和瀏覽器搜索歷史)。因此,通過實例,分配給搜索信息集15 的搜索語境156a包括“佛羅里達旅行” 的語境定義160a(例如,通過返回網頁的內容分析指定的語境引擎151)、選擇旅游勝地和 /或旅游勝地名稱的URL(例如,由于用戶Ul在從搜索結果20中所獲得的選擇網頁URL進 行書簽的行為,通過用戶Ul和/或語境引擎151指定的)、搜索參數“包括一切的”(例如, 通過分析大部分與在搜索請求18中所重復的搜索參數22之一匹配的返回網頁的內容指定 的語境引擎51)、以及“便宜”和“最后一刻交易”的關鍵詞/短語(例如,當通過監(jiān)控用戶 Ul與搜索結果20作用由用戶Ul認為更相關的,通過分析返回網頁的內容指定的搜索引擎 151)。因此,認識到,作為搜索信息集15 的內容的最好代表,可以通過用戶Ul和/或語 境引擎151將語境定義160a指定給搜索語境156a。例如,用戶Ul和/或語境引擎151已 經加權或者另外對“便宜”、和“佛羅里達旅行”的語境定義160a的排序高于搜索語境156a 的其他語境定義160a。再次參照圖12和圖13,用戶Ul提交其搜索語境156a(例如,經由其協作引擎 150-參見圖10)并且協作服務器152將語境定義160a與搜索語境156b、156c的語境定義160b、160c進行比較。即使搜索語境156a、156b這兩者都與佛羅里達旅行相關,但是基于 “所有一切的”語境定義160a與語境定義160b “豪華”不匹配,協作服務器152確定搜索語 境156b與搜索語境156a不相關(或者另外,與搜索語境156c很少相關)。此外,在搜索語 境156a和156c的比較中,協作服務器152尤其基于“便宜”與“低價旅行”以及“佛羅里達 旅行”與“佛羅里達”語義匹配確定在語境定義160a、160c之間存在充分匹配。然后,協作服務器152聯系(例如,服務器152聯系用戶Ul的協作引擎150然后, 協作引擎150為用戶Ul提供匿名或者非匿名的潛在協作搜索者的列表)用戶U1,表明其搜 索語境156a與一個其他搜索語境156c匹配。還聯系用戶U3,并且提供使搜索信息集15 與用戶Ul通信的選項(例如,經由協作服務器152)。同樣地,如所希望的,還可以為用戶U3 提供訪問搜索信息集15 的選項。認識到,在各個搜索信息集M4a、15k與用戶U3、U1通 信以前,可以匿名進行搜索信息集15 、巧4c的交換,即,可以從搜索信息集15 、巧4c中 除去用戶U1、U3的身份。因此,給出以上實例,用戶Ul經由搜索信息集15 獲得訪問用于 佛羅里達旅游公司的用戶U3的搜索經驗/工作并且在其搜索工作期間通過用戶Ul沒有覆 蓋的任何旅游勝地的推薦的權益。協作引擎150可以在用戶裝置101 (參見圖4)上駐留協作引擎150(或者經由在另一計算機裝 置上駐留的協作引擎150的代理服務器運行-例如,服務器)并且可以在通信網絡11上與 協作服務器152通信?;诮邮盏降挠脩鬠n的搜索語境156與其他用戶的搜索語境156 的匹配結果,通過用戶Un使用協作引擎150以有助于從其自身和其他用戶Un收集或者另 外集合搜索信息集154。如下文中進一步描述的,協作引擎150使用協作服務器152獲取 對其他用戶Un的搜索信息集IM的訪問。為了關于識別的搜索項目的協作,協作引擎150 還可以有助于各種用戶Un之間的網絡11通信。一旦將用戶Un對識別為具有類似的搜索 語境156和關聯的搜索信息集154,用戶Un就可以合作進一步搜索/定義搜索項目的不同 方面。例如,用戶Ul (參見圖12)可以調查并且共享(與用戶U3)關于通過其搜索工作所 確定的最好排序的佛羅里達旅游勝地的信息,并且另一用戶U3可以調查并且共享(與用戶 Ul)關于通過其搜索工作所確定的航空旅行的最低價錢和佛羅里達旅行的信息。因此,協作 引擎150可以便于關于訪問彼此的搜索信息集IM和/或搜索語境156的用戶Un的社會 性網絡活動。參照圖14,示出了協作引擎150的典型配置。協作引擎150具有通信模塊160,其 有助于在不同用戶Un之間通信(直接在網絡11上或者經由如所配置的協作服務器152), 具體地,其有助于搜索信息集巧4和任何其他消息(例如,聊天)的交換。協作引擎150還 可以作為例如動態(tài)構建社會性網絡(或者其他結構)或者協作活動的一部分的對等網絡11 的一部分通信。協作引擎150還具有信息模塊162,其用于例如經由搜索引擎M訪問來自存儲器 210以及來自信息源16 (參見圖10)的用戶Un的搜索信息集154。認識到,存儲器210可 以含有均具有其指定的搜索語境156的不同搜索信息集154。協作引擎150還具有被配置 為與從語境引擎151和/或存儲器210所獲得的用戶Un的搜索語境156通信的語境模塊 164,和從協作服務器152接收任何與其他用戶Un的搜索語境156匹配的結果。如下文中 進一步描述的,語境模塊164向用戶顯示(例如,經由用戶界面202)用于通過用戶Un隨后選擇并且與用戶交互的識別的其他用戶Un和其關聯搜索語境156。信息樽塊162弓丨擎150具有信息模塊162,其用于例如經由搜索引擎M訪問來自存儲器210以 及來自信息源16 (參見圖10)的用戶Un的搜索信息集154。認識到,存儲器210可以含有 均具有其指定搜索語境156的不同搜索信息集154。否則,可以通過用戶Un來使用信息模 塊162以從信息源16(經由網絡11)獲得搜索信息集巧4然后與語境引擎151交互以確定 新獲得的搜索信息集巧4的各個搜索語境156。例如,在對于佛羅里達旅行通過互聯網上的 搜索中間,在用戶Un找到可接受的推薦旅游勝地有困難的情況下,用戶Un可以提交(經由 語境模塊164)搜索信息集154的搜索語境156以查明任何其他用戶Un當前是否具有關于 可接受旅游勝地的信息。在通過用戶Un請求并且獲得來自其他用戶Un的期望的搜索信息集IM的情況 下,可以將信息模塊162用于集合或者另外結合用戶Un的搜索信息集154的選擇內容以導 致改善的/修改的搜索信息集154。為了生成相應的改善/修改的搜索語境156,可以基于 改善/修改的搜索信息集1 的改善/搜索的信息14內容將改善/修改的搜索信息集IM 發(fā)送至用于隨后分析的語境引擎151。在這點上,認識到,為了識別可以與改善的/修改的 搜索語境156更緊密匹配的其他用戶Un的搜索語境156,然后用戶Un可以提交改善的/修 改的搜索語境156(例如,經由語境模塊164)。在這點上,認識到,用戶Un可以通過與其他 用戶(其具有與用戶Un的修正搜索信息集IM反復匹配的搜索語境156)的協作反復改善 /修正選擇搜索信息集154的信息14內容。還可以將信息模塊162配置為便于用戶使安全屬性與搜索信息集IM的多部分關 聯。這些安全屬性為選擇信息14提供完全私有的(例如,指定為限于所有其他用戶Un)、 指定為在用戶Un識別組和/或者單獨用戶Un內共享的(例如,指定為與某些識別的用戶 Un共享/限制)、或者以公共方式共享的(例如,指定為與所有用戶Un共享的)搜索信息 集154。此外,可以將部分搜索信息集IM指定為匿名共享或者明確識別用戶Un。例如,在 他們與其他用戶Un通信以前,可以從搜索信息集IM去除或者通過搜索信息集154(和/ 或關聯搜索語境156)保持諸如但不限于用戶名、用戶網絡地址、諸如電話號碼的電子郵件 地址和/或用戶地點的用戶聯系信息等的用戶Un的識別信息。同樣地,如果用戶Un滿足 與其他用戶Un的搜索語境156和/或對應搜索信息集IM相關的安全性要求,則將僅返回 (或者匿名返回)通過用戶Un所要求的任何搜索語境156評分結果。此外,取決于指定給其他用戶Un的搜索語境156的每部分和/或搜索信息集IM 的安全性級別(例如,標記私有、標記公共、或者標記請求用戶Un為其他用戶Un的可靠會 員),可以僅將其他用戶Un的部分搜索語境156和/或搜索信息集IM返回至請求用戶Un。 例如,如果請求用戶Un滿足內容部分的對應安全屬性,則僅發(fā)送內容部分(搜索語境156 和/搜索信息集154的內容部分)。認識到,可以將部分用于描述所有(例如,全部)搜索 語境156和/或搜索信息集154,或者所有搜索語境156和/或搜索信息集154的子集。語境模塊164弓丨擎150具有被配置為使從語境引擎151和/或存儲器210所獲得的用戶Un的 搜索語境156與協作服務器152通信的語境模塊164。如果可用,則語境模塊164還從協作 服務器152接收任何與其他用戶Un的搜索語境156匹配的結果。還認識到,語境模塊164可以接收空集(例如,沒有可用的匹配搜索語境156)。如下文中進一步描述的,語境模塊 164向用戶顯示(例如,經由用戶界面202)用于通過用戶Un隨后選擇和與用戶交互的識別 的其他用戶Un和其關聯搜索語境156。還可以將語境模塊162配置為便于用戶使安全屬性(例如,標記私有、標記公共、 或者標記請求用戶Un為其他用戶Un的可靠會員)與所有(或者其選擇部分)搜索語境 156關聯/將安全屬性指定給所有(或者其選擇部分)搜索語境。這些安全屬性為選擇信 息語境定義160提供完全私有的(例如,指定為限于所有其他用戶Un)、指定為在用戶Un識 別組和/或者單獨用戶Un內共享的(例如,指定為僅與某些識別的用戶Un共享/限制)、 或者以公共方式共享的(例如,指定為與所有用戶Un共享的)搜索語境156。此外,可以將 選擇的語境定義160(例如,其全部或者部分)指定為匿名共享或者明確識別用戶Un。例 如,在他們與其他用戶Un通信以前,可以從語境定義160去除或者通過語境定義保持諸如 但不限于用戶名、用戶網絡地址、和/或用戶地點等的用戶Un的識別信息。同樣地,如果用 戶Un滿足與其他用戶Un的搜索語境156和/或對應語境定義160關聯的安全性要求,則 將僅返回(或者匿名返回)通過用戶Un所請求的任何搜索語境156評分結果。通信樽塊160如所希望的,協作引擎150還具有通信模塊160,該模塊用于便于在用戶Un和協 作服務器152之間和直接在用戶Un和其他用戶Un之間的消息155和搜索信息集154的通 信。通信模塊160可以經由顯示在用戶界面202中的聊天窗口便于用戶Un的協作。用戶 可能希望不向其他用戶Un暴露自身(例如,保持匿名),在這種情況下,通過模塊160格式 化聊天消息155為匿名。否則,基于共同決定,用戶Un可以同意繼續(xù)關于論題匿名或者通 過用戶識別綽號共享所有的將來搜索(例如,搜索信息集154)。可以通過搜索語境156偏 愛關于搜索語境156做出對于這種類型的同意。參照圖15,如通過用于與用戶Un交互的通信模塊160所生成和提交的,在用戶界 面202上示出典型顯示窗格170 (例如,顯示框)。在互聯網搜索的情況下,窗型窗格170 可以為示出(例如,匿名地)其他用戶Un搜索(通過協作服務器152)視為含有通過用戶 Un向協作服務器152所提交的與搜索語境156(例如,指示作為實施可以用于隨后用戶Un 搜索協作的類似搜索的用戶Un)相關的信息14的內容的瀏覽器。例如,窗格170可以含有 均具有確定為與用戶Un提交的搜索語境156匹配的各自搜索語境156(例如,156a、156b、 156c)的鏈接174(例如,對于用戶U1、U2、U3)的列表。還認識到,窗格170還可以含有(未 示出)均具有與用戶Un(例如,用戶Un具有與如顯示在窗格170中的其他用戶Un的搜索 語境156匹配的一個以上的搜索語境156)的不同特定搜索語境156相關的搜索語境156 的用戶的單獨列表170。例如,每個顯示用戶列表172(其他用戶Un的用戶列表)可以與向 協作服務器152提交搜索語境156的用戶Un的不同搜索語境關聯。基于列表172的預覽,為了直接請求或者經由協作服務器152請求來自其他用戶 (例如,用戶ui、U2、和/或U3)的對應搜索信息集154,用戶Un可以在一個或者多個鏈接 174上選擇(例如,點擊)。例如,可以將聊天機會顯示為在網頁上的可點擊鏈接。在企業(yè) 的情況下,可以在用戶的用戶界面202上呈現同事的圖片和名字。還認識到,為了有助于用戶Un決定選擇哪個鏈接174,可以將鏈接174配置為顯示 與搜索語境156關聯的一些或者全部語境定義160。如上文中所述的,一旦選擇,就經由通
      40信模塊160訪問對應搜索信息集IM然后將其轉到用于信息14內容(例如,通過語境引擎 151自動選擇和/或通過用戶Un手動選擇信息14)的潛在集合體的信息模塊162。例如, 語境引擎151可以基于通過內容分析器模塊102(參見圖2、所執(zhí)行的信息評分從由其他用 戶Un所接收到的搜索信息集IM中選擇信息14,以使類似配置語境引擎151的內容分析器 模塊182。還可以將通信模塊160配置為便于用戶Un匿名傳達消息155或者具體地識別用 戶Un0例如,在他們與其他用戶Un通信以前,可以從消息155去除或者通過消息155保持 諸如但不限于用戶名、用戶網絡地址、和/或用戶地點等的用戶Un的識別信息。還可以將 通信消息巧5用于便于關于訪問彼此的搜索信息集IM和/搜索語境156的用戶Un的社 會性網絡活動。語境引擎151參照圖16,當用戶工作以創(chuàng)建或者編譯關于搜索信息集IM文檔和其他數據的 時候,語境引擎151管理并使用搜索語境156的正文信息。為了確定有代表性的語境定義 160,可以分析與搜索語境156關聯(手動、自動、半自動)的每個用戶操作信息14(例如, 文檔)。為了經由協作引擎150的協作目的,可以將搜索語境156的這些語境定義160用于 找到在企業(yè)中正在從事相同主題工作的同事同時例如遵守隱私和安全策略。如所希望的, 還認識到,可能便于在互聯網11上環(huán)境140(參見圖10)的用戶其他用戶Un和Un之間的 協作。另外,在所希望的情況下,語境引擎151使用這些確定的語境定義160以給信息14 和任選的其關聯應用程序分類并且對其注釋。在向企業(yè)搜索引擎M和/或文檔管理系統 提交信息14(例如,文檔)以前,可以在企業(yè)中完成信息14的這種注釋。為了確定搜尋信息集IM的搜索語境156,可以積極或者被動引導語境引擎151以 包括用于通過內容分析器182(參見圖16)分析的用戶操作信息14。積極引導的實例為用 戶選擇要分配給搜索語境156的一個或者多個信息14。被動引導的實例為將語境引擎151 配置為自動選擇通過與信息源16和/或本地存儲器210交互的用戶所操作的(例如,創(chuàng)建、 修正、存取、或者另外獲得等)任何信息14。例如,語境引擎151可以確定通過用戶從搜尋 結果20列表中選擇(例如,通過從列表的鏈接上點擊)的這些搜索結果20所確定的適當 的語境定義160并且將這些適當的語境定義160添加至信息集IM的搜索語境156,同時選 擇省略用戶沒有從搜索結果20列表中選擇(例如,通過沒有在從列表的鏈接上點擊)的那 些搜索結果。還認識到,例如使用顯示提示,通過語境引擎151向用戶自動建議在搜索語境156 生成中使用的信息14選擇,這可以向用戶提供接受或者拒絕選擇信息14與語搜索語境156 確定的關聯性的能力。認識到,當選擇與搜索語境156關聯的選擇信息14時,語境引擎151 確定常駐在選擇信息14中的任何語境定義160(經由內容分析器18 ,然后通過這些新確 定的語境定義160更新搜索語境156的語境定義160,從而提供搜索語境156的動態(tài)更新能 力。認識到,選擇信息14與搜索信息集154的搜索語境156的關聯性的另一實施例可 以使用基于時間的被動引導。例如,如果用戶繼續(xù)停留(即,與其交互)在目的地資源16 上長達大于預定時段(例如,45秒),則可以將搜索結果20用于積極地精煉搜索語境156 的語境定義160,如果用戶在預定時段內(例如,5秒)關閉目的地資源16,則可以將搜索結果20用于消極地精煉搜索語境156的語境定義160。此外,例如,當用戶將信息14 (例如, 實際文件或者對于信息14的鏈接)移動至諸如“我的文檔”或者其桌面的用戶桌面的監(jiān)控 區(qū)域中時,可以將信息14(例如,文件或者網絡內容)的搜索語境156自動添加至搜索信息 集154的搜索語境15。在網頁作為信息14的情況下,將信息添加至瀏覽器應用程序的“我 的愛好”將自動將關聯語境定義160添加至對應的搜索語境156。參照圖10和圖16,示出了語境引擎151的一個實施例,其用于處理搜索請求 18 (如果通過協作引擎150引導)、向用戶100提供搜索結果20 (如果通過協作引擎150引 導)、以及基于常駐在用于認為的這些新獲取的信息14 (通過語境引擎151和/或通過用戶 手動)的搜索結果20的新獲取的信息14中的確定語境定義160更新搜索語境156(如果 通過協作引擎150引導)。內容分析器模塊182內容分析器模塊182可以使用規(guī)則集183以指令或者另外指示模塊182經由通過 用戶界面202 (參見圖4)所提供的菜單分析用于任何常駐語境定義160的特定信息14 (例 如,搜索信息集154)。優(yōu)選實施方式可以使用托盤圖標來允許用戶訪問便于要選擇用于與 搜索語境156關聯的信息14的語境菜單。認識到,特定信息14可以為來自新獲取的用 戶Un搜索結果20并且因此用于生成用于用戶Un的新搜索語境156 ;和/或要集合或者另 外與用戶的現有搜索信息集1 結合的附加信息14(或者來自用戶Un或者來自其他用戶 Un)。例如,規(guī)則集183可以為用于識別頻繁發(fā)生和另外在信息14中的不常用單詞和/ 或分組的搜索方法。此外,認識到,可以將規(guī)則集183配置為使用用戶Un協作以選擇使用 的識別單詞/單詞分組作為語境定義160。例如,可以將規(guī)則集183配置為省略某些單詞或 者單詞分組(例如,and(和)、or(或)、but(但)等)還識別在含有預先定義單詞的信息 14中的選擇段落(例如,句子、頁、段落、標題等)。例如,可以將規(guī)則集183配置為指令模 塊182突出(向用戶Un)含有術語“佛羅里達”、“旅行”、“旅游勝地”、以及“交易”的所有信 息14段落。認識到,可以通過用戶修改規(guī)則集183以含有來自選擇的搜索語境156的語境 定義160作為這些預先定義單詞和/或單詞模式。一旦在信息中識別段落,可以通過模塊 182為用戶Un提供機會(例如,經由在用戶界面202上的段落的顯示)以從如用戶Un視為 代表信息14的識別段落選擇某些單詞和/或單詞分組。然后,模塊182將關聯用戶選擇單 詞和/或單詞分子以成為用于含有信息14的搜索信息集154的搜索語境156 (作為語境定 義160)的一部分。作為實例,可以暗示和/或明確進行要包括在搜索語境156中的信息14內容的識 別和分析。明確包括內容為通過用戶所識別的信息14(例如,文檔)。例如,通過用戶在文 件或者文件夾上“右鍵單擊”然后選擇添加至搜索語境156的菜單選擇將導致選擇信息14 對于用于內容定義160分析的內容分析器模塊182可用。同樣地,還可以將在識別段落中 的單詞上右鍵單擊用于指令模塊182以將選擇單詞分配給關聯的搜索語境156。還可以向 用戶Un提供選項(例如,經由顯示器)以從將選擇單詞分配給那個搜索語境156的列表中 識別。例如,在更接近信息14和識別段落的審查的時候,用戶Un可以判定信息14不是代 表當前搜索語境156而是代替地可歸于不同搜索語境156(新的或者現有的)。此外,可以通過由用戶監(jiān)控關于搜索信息集154(用戶Un的和/或如從其他用戶
      42Un所獲得的)信息14的創(chuàng)建或者訪問(例如,文檔或者其他數據源)通過搜索語境156 暗示地包括信息14內容。否則,可以通過檢查信息14位于本地存儲器210 (和/或信息來 源于哪個源16,包括其他用戶Un)何處通過搜索語境156暗示地包括信息14文檔。例如, 可以經由內容分析器模塊182在搜索語境156中暗示地包括位于我的文檔文件夾中的信息 14。另一選項是用于網頁,可以通過用戶簡單查看網頁(例如,在預先確定的時段內)或者 通過用戶由在搜索語境156中包括頁(URL)的基于工具欄的控制識別來在搜索語境156中 暗示地包括該網頁。例如,響應于通過協作服務器152所執(zhí)行的確定匹配,可以通過用戶經 由與從其他用戶Un所獲得的搜索信息集合154的信息14內容交互來訪問這些網頁。還認 識到,可以通過用戶由將在語義語境15中包括頁(URL)的基于工具欄的控制、菜單選擇、或 者其他用戶輸入反饋機制識別在語義語境15中暗示地包括網頁。將內容分析器模塊182配置為從要用作語境定義160的選擇信息14中選取單詞 /多個單詞/短語/單詞分組(例如,正文部17)以便在修正或者另外創(chuàng)建搜索語境15中 使用。認識到,在正文部17中包括兩個以上單詞的情況下,這些單詞可以在信息14的文本 中彼此鄰近(例如,視為多單詞短語),可以通過在信息14文本中位于中間的一個或者多個 單詞或者其組合將其彼此分離。語境定義160可以包括檢測的單詞模式,因此指示在信息14中所含有的單詞彼此 具有某種關系。此外,在信息14中的正文部17的相對定位/位置可能便于單詞模式/關 聯性的識別,例如,主要(例如,總是)找到彼此相鄰的兩個單詞,主要(例如,總是)在每 段的第一句中或者在每頁的第一段中或者在每節(jié)的標題中等找到一個單詞。此外,鑒于以上情況,認識到,語境引擎151的一典型實施例為關于圖1的系統10 所述的語境引擎100,其中,將內容分析器模塊182配置為與內容分析器模塊102(參見圖 2)類似。此外,內容分析器模塊182可以創(chuàng)建在信息14中所識別的單詞、模式、語義結構、 和數據的知識網(即,在單獨語境定義160之間的互聯)??梢园凑杖魏味喾N方法分等級 地訪問該網并且在任何時候通過新關系覆蓋該網。這意味著能夠以任何級別組織和訪問搜 索語境156內的信息。該主題、模式、關鍵詞、段落、句子、以及其他語言結構。實際上,這意 味著可以通過用戶基于其主題或者來自在信息14中的正文的其主題組織和/或訪問主題。 例如,用戶可以在引用特定語境定義160的段落上單擊并且語境引擎151可以識別與語境 定義160相關的其他信息14(例如,文檔)的所有部分。例如,可以將任何材料、文檔、或者 部分文檔用于創(chuàng)建搜索語境156??梢詫⒃撔畔⒂糜跇嫿ㄕ业较嚓P信息的新搜索或者可以 將其用于對照用戶的現有搜索語境156進行測試。在協作(例如,匿名)的情況下,實施例可以是用戶Un共享搜索結果20和/或搜 索信息集154。當用戶Un搜索互聯網和/或文件系統(例如,數據庫)的時候,模塊182基 于用戶Un的活動(其觸發(fā)正添加至搜索語境156的材料)建立語境定義160數據。這些 觸發(fā)可能包括在瀏覽器中讀取結果、將結果20 (例如,文檔)識別為相關或者非相關(例 如,將結果20存儲在預先定義的文件夾或者應用文件中)、書簽結果20或者將鏈接添加至 用戶文件系統。例如,認識到,模塊182可以通過監(jiān)控文件系統和瀏覽器行為來跟蹤用戶的 活動。如通過用戶和/或協作引擎150所指定的,還認識到,可以根據選擇時間周期過濾與其他用戶關聯的任何匹配語境定義160(和/或搜索信息集154)。例如,用戶可能希望識 別具有與選擇時間周期(例如,在最近一月內、在最近一周內、在當天內、在最近一年內等) 關聯的內容的那些其他用戶。因此,例如,如與用戶不相關的,可以通過協作引擎150濾除 不滿足選擇時間周期的任何內容定義160和/或搜索信息集154。信息捭索樽塊186通過語境引擎151使用內容搜索模塊186以為用戶Un提供可能鑒于搜索語境156 關聯的檢索的信息14。例如,可以從桌面、企業(yè)、以及互聯網搜索結果20中獲得信息14并 且可以通過用戶和/或用于通過內容分析器模塊182分析的語境引擎151來選擇適當信息 14。例如,可以使用精確論題信息(即,從搜索語境156所獲得的語境定義160)通過內容 搜索模塊186增加出站搜索請求18。此外,可以經由內容分析器模塊182篩選來自搜索結 果20的入站數據(即,信息14)并且排列入站數據先后順序/對入站數據排序。搜索模塊186的一個典型操作為當用戶進入查詢18 (搜索偏愛)(通常通過使用 用于參數22的關鍵詞和任何邏輯操作符-括號、AND、NOT、OR等_用于限制參數22),語境 搜索模塊186檢查其搜索語境15并且提供可以用于增加用戶提供的搜索參數22的最匹配 語境定義160的列表(例如,當“紀錄片”的定義綁定至搜索語境156中的“歷史興趣”的 語境定義160時,將通過“歷史興趣”的語境定義160增加記錄片的用戶參數2 。因此, 將修改的搜索請求18發(fā)送至搜索引擎M以獲得與“記錄片”AND (及)“歷史興趣”最匹配 的搜索結果20(例如,作為根據搜索引擎M的標準的一系列網頁,通常具有含有文檔的標 題的簡短總結和有時具有部分文本)。認識到,例如,內容搜索模塊186可以支持布爾操作 符AND、0R、以及NOT的使用,以進一步經由搜索語境156指定搜索查詢18。此外,搜索模塊 186還通過鑒于搜索語境156定義近似搜索來增加搜索請求18,該近似搜索定義了搜索結 果20中的關鍵詞之間的可接受距離。搜索模塊186的另一實施方式是使用與搜索語境156的語境定義160匹配的搜索 結果20的信息14中的單詞、詞組,以對結果20排序以首先提供“最好”結果(例如,對于 具有更大相對數量或者語境定義160的評分測度的這些結果與搜索語境156匹配作為信息 14的關聯性程度)。此外,搜索模塊186還可以包括蘊含閾值。例如,在匹配小于語義語境 15的定義160的最小數量或者評分測度的特定信息14之間的任何匹配將排除在搜索結果 20中的特定信息的顯示(或者另外,與通過搜索引擎對提供的信息相比將該信息置于排序 中的較低的位置處)。認識到,在任何情況下,通過協作引擎150使用語境引擎151以檢查用于與搜索語 境156的相關性的確定程度接收到的信息14,并且通過任何新的識別的語境定義160更新 搜索語境156。此外,語境引擎151可以輔助協作引擎150在網絡11上提交搜索結果18以 獲得用于修改搜索信息集154的內容,包括使用選自搜索語境156的語境定義160修改搜 索參數22的能力的信息14。還認識到,如上文中參照圖1所述的,語境引擎151的一個實 施例為語境引擎100。協作服務器152參照圖17,示出了協作服務器152的示例性實施方式。例如,在協作環(huán)境140(參 見圖10)的某些協作和/或社會性網絡活動中,在其他用戶Un可能潛在從事與用戶Un相 同的主題(例如,搜索項目)的工作或者對與用戶Un相同的主題感興趣的情況下,用戶Un期望在社會性網絡環(huán)境內協作搜索或者識別同事/朋友(例如,其他用戶Un)。協作服務器 152包括可以由用戶Un的客戶端機器101上的協作引擎150訪問的比較模塊192。在這種 情況下,通信模塊190從協作引擎150接收或者另外請求可以與從其獲得搜索語境156的 各個Un相關的一個或者多個搜索語境156。將獲得的搜索語境156存儲在存儲器194中并 將其與用戶Un和/或對應搜索信息集IM關聯。認識到,提交搜索語境156的用戶Un可 能希望還與搜索語境156 —起發(fā)送搜索信息集154,還可以將該搜索信息集存儲在與對應 搜索語境156關聯的存儲器194中。然后,為了例如根據諸如但不限于搜索語境156對搜索語境156 ;語境定義160 對搜索語境156 ;語境定義160對語境定義160 ;和/或搜索語境156對語境定義160的匹 配粒度的不同級別確定在搜索語境156之間的匹配,服務器152使用比較模塊192將搜索 語境156彼此進行比較。將語境匹配的評分結果用于識別具有共享興趣的用戶Un(例如, 在其搜索信息集巧4中的信息14的一個或者多個部分潛在可用于每個匹配用戶Un)。通過 經由其各自搜索語境156滿足與每個用戶Un關聯的語境定義160之間的匹配閾值的評分 來識別共享興趣。然后,通信模塊190可以為協作引擎150提供用戶Un身份(例如,實際或者匿名使 用例如通過協作服務器152所存儲的別名/綽號NN),和其他用戶的對應搜索語境156。例 如,參照圖12,在確定所提交的搜索語境156a與搜索語境156c匹配的情況下,將通過協作 服務器152利用其他用戶的身份聯系用戶Ul、U3的這兩個或者至少一個(例如,通知用戶 Ul搜索語境156a與用戶U3的搜索語境156c匹配和/或通知用戶U3搜索語境156c與用 戶Ul的搜索語境156a匹配)。然后,聯系的用戶Un可以審查其他用戶Un的搜索語境156 然后決定是否聯系其他用戶Un以獲得與審查的搜索語境156相對應的搜索信息集154(或 者至少其部分)。認識到,可以用于在用戶Un之間共享身份或者信息14的信息可能基于與搜索語 境156(或者單獨語境定義160等)關聯的安全屬性。此外,該信息共享可能不包括協助服 務器152并且可能改為在提供廣播或者對等能力的網絡11上實現該信息共享。認識到,在 任何情況下,將協作服務器152配置為確定不同搜索語境156之間的匹配然后使匹配處理 的結果和與搜索語境156關聯的用戶Un通信。通信模塊190如所希望的,通信模塊190可以便于在用戶Un和協作服務器152之間以及在用戶 Un和其他用戶Un之間的搜索語境156和搜索信息集154的通信。用戶Un可能不希望向其 他用戶Un標識自身(例如,保持匿名),在這種情況下,通過模塊190將用于用戶Un的消息 格式化為匿名的(例如,使用用戶to的別名NN)。否則,基于共同決定,用戶Un可以同意繼 續(xù)匿名或者通過用戶識別綽號共享所有的將來搜索(例如,搜索信息集154)??梢酝ㄟ^搜 索語境156偏愛關于搜索語境156進行這種類型的同意。還認識到,可以經由模塊190便 于用戶Un之間的通信(例如,用戶Un經由模塊190發(fā)送并且接收與其他用戶Un關聯的消 息)或者用戶Un可以直接經由網絡11彼此進行通信。可以將通信模塊190配置為便于用戶Un與其他用戶Un匿名通信或者具體地識別 用戶Un。例如,在用戶內容(例如,搜索語境156、搜索信息集IM等)傳達至其他用戶Un 以前,可以通過模塊190去除或者保持諸如但不限于用戶名、用戶網絡地址、和/或用戶地
      45點等的用戶Un的識別信息。可以將模塊190用于便于關于訪問彼此的搜索信息集IM和 /或搜索語境156的用戶Un的社會性網絡活動。比較樽塊192比較模塊192可以使用規(guī)則集193以指令或者另外引導模塊192分析與用于在存 儲器194中的其他可用搜索語境156的其他語境定義160匹配的任何常駐語境定義160的 搜索語境156。認識到,搜索語境156可以是從用戶Un新獲得的和/或作為先前從用戶Un 或者從其他用戶Un所獲得的駐存在存儲器194中。例如,規(guī)則集193可以為用于識別在不同搜索語境156中的類似語境定義160,和 語境定義160的不同改變(例如,單詞分組)的搜索方法。例如,將在一搜索語境156中的 “佛羅里達”的語境定義視為另一搜索語境156的“低價旅行”和“佛羅里達”的語境定義對 的匹配。認識到,可以將匹配閾值用于確定匹配的語境定義160的數量是否表示該搜索語 境156匹配對。然后,模塊192將匹配搜索語境156與對應用戶Un (例如,來自存儲器194 的可用的)關聯,然后模塊192將產生對于通信模塊190可用的匹配處理的結果。為了對于來自不同搜索語境156的彼此進行比較的目的,將模塊192配置為從搜 索語境156選取語境定義160 (例如,單詞/多個單詞/短語/單詞分組)。認識到,語境定 義160還可以含有關于在信息14中的單詞的定位的信息(例如,單詞“佛羅里達”在鏈接 標題中并且在與鏈接關聯的內容的第一段中)。同樣地,語境定義160還可以通過彼此含 有關于單詞的相對分組的信息(例如,“佛羅里達”或者“佛羅里達州的”和“旅行”和“豪 華”)。此外,可以在語境定義160中指定單詞可以在信息14的文本中彼此鄰近(例如,視 為多字詞組),可以通過在信息14的文本中位于中間的的一個或者多個單詞或者其結合彼 此分離。語境定義160可以包括檢測到的單詞模式,因此,指出在信息14中所含有的單詞 彼此具有某種關系。此外,在信息14中的單詞的相對定位/位置(在語境定義160中)可 能便于單詞模式/關聯性的識別,例如,主要(例如,總是)找到彼此相鄰的兩個單詞,主要 (例如,總是)在每段的第一句中或者在每頁的第一段中或者在每節(jié)的標題等中找到一個 單詞。此外,鑒于以上情況,認識到,比較模塊192的一個典型實施方式為關于圖1的系 統10的語境引擎100所描述的語境分析器模塊102。還可以將比較模塊192用于集合來自多個用戶Un的匹配搜索語境156,然后向通 信模塊190提供可以向用戶Un顯示的匹配數據(例如,匹配搜索語境156和/或對應搜索 信息集1 的鏈接)以便于與正在從事用戶Un的搜索項目的語義語境類似的搜索項目的 其他用戶Un交互。還認識到,正如通過用戶和/或協作引擎150 (或者服務器152)所指定的,可以根 據選擇的時間周期過濾與其他用戶關聯的任何匹配語境定義160(和/或搜索信息集154)。 例如,用于可能希望識別具有與選擇的時間周期(例如,在最近一月內、在最近一周內、在 當天內、在最近一年內等)關聯的內容的那些其他用戶。因此,作為與用戶不相關的,例如, 可以通過協作引擎150(或者服務器15 濾除不滿足選擇時間周期的任何內容定義160和 /或搜索信息集154。存儲器194
      存儲器194將獲得的搜索語境156存儲在表格195中或者其他結構化存儲器結構 中并且搜索語境156與用戶Un和/或對應搜索信息集IM關聯。認識到,提交搜索語境 156的用戶Un可能希望還與搜索語境156 —起發(fā)送搜索信息集合154,還可以將如與對應 搜索語境156關聯的搜索信息集合巧4存儲在存儲器194中。還可以將存儲器194用于存 儲用戶Un的別名NN。捭索樽塊196可以通過協作服務器152使用搜索模塊196以與搜索引擎M通信(例如,互聯網 搜索引擎,數據庫管理器等)。例如,如所希望的,可以通過搜索引擎152駐留協作服務器 152并因此,可以將協作服務器用作用于搜索請求18和搜索結果20(參見圖10)的通信的 客戶端界面(用于用戶Un)以及用于接收和處理用于指定的搜索語境156的匹配請求。認識到,環(huán)境140的通信網絡11可以包括多個協作服務器152。還認識到,鑒于系 統10和環(huán)境140的上述部件,可以與術語系統互換地使用術語引擎并且可以與術語系統互 換地使用術語服務器。因此,鑒于以上情況,認識到,在沒有任何用戶交互的情況下(除了通過使能或者 另外地,選擇用于!^0R 12的語境156),可以通過引擎150啟動搜索18。此外,不可能經由 信息源16或者協作服務器152通過匹配用戶搜索僅找到語境/協作匹配。在協作服務器 152的情況下,即使當用戶沒有明確啟動搜索18時,服務器152也可以鏈接協作引擎150。 例如,用戶的協作引擎150可以向協作服務器152發(fā)送語境定義160和/或語境156并且 服務器152可以連接至具有關于該語境定義160和/或語境156的信息的其他協作引擎 150(例如,其他用戶的)并且設立用于請求協作引擎150合作者(例如,用戶)的識別或者 聊天的適當鏈接。不是作為搜索而是作為協作請求18通過協作服務器152發(fā)送語境定義 160和/或語境156。在一實施方式中,接收到的其他信息(例如,經由網絡11來自連接至用戶的其他 用戶)可以為從諸如但不限于數據庫查詢;文檔的結構化查詢;和/或Web查詢的信息查 詢18所獲得的信息14。接收到的其他信息可能基于用戶請求18或者與用戶交互無關地、 基于用戶的協作引擎150的請求18。例如,基于諸如但不限于除了在用戶請求18提交以 前,當用戶在參照系(例如,!^0R 12)的語境156中時;除了在用戶請求18提交期間,當用 戶在參照系(例如,FoR 12)的語境156中時;以及除了在用戶請求18提交以后,當用戶在 參照系(例如,FoR 12)的語境156中時的用戶的活動,引擎150的請求18可以為通過引 擎150所啟動的預測性查詢。此外,例如,在已經進行任何搜索以前、在已經進行任何搜索期間、或者在已經進 行任何搜索以后,當用戶在語境156中時,可能出現直接通過引擎150的預測性搜索(例 如,提交請求18)和關聯的預測性檢索(例如,接收響應20)。引擎150可以根據語境156 中最確定的語境定義160的確定重要模式構建查詢串(預測性請求18的)。搜索串可以為 結合在一起的非重疊模式(例如,OR的)的集合。通過與服務器152和/或信息源16通 信由引擎150啟動搜索。注意,在協作服務器152的情況下,不但沒有將搜索串用于其他語 境156的匹配,反而在語境156內選擇語境定義160。然后,當用戶打開(或者另外,與其交 互)FoR 12的對應應用程序(例如,Microsoft WorcUWeb Browser等)時,用戶可以獲得 搜尋和協作結果20。還認識到,引擎150可以使用搜索串。當不存在可用的語境定義160時,引擎150和/或服務器152可以使用例如作為單個語境定義160所選擇的搜索串作為 退化情況,以使在其為通過引擎150和/或服務器152僅有的可用信息(例如,用于搜索語 境156的)的情況下,將搜索串視為語境定義160。此外,例如,當用戶在其計算機上打開諸如網頁瀏覽器或者文件管理器的12 的應用程序或者其他應用程序時,在搜索文本框中的自動完成能力可以在下拉組合框中向 用戶提供搜索建議。例如,這通過使用來自選自語境156的語境定義160的關鍵模式經由 引擎150進行,以為用戶提供用戶可以從(例如)下拉列表中選擇的正文地基于前面語境 類型的搜索/查詢建議。環(huán)境140的操作參照圖10、圖14、以及圖18,示出了用于便于在通信網絡11上屬于共享主題的多 個用戶Un的社會性網絡的協作環(huán)境140的典型操作400。在步驟401處,語境模塊164向 協作服務器152發(fā)送搜索語境156以便在確定與類似主題關聯的協作服務器152的另一用 戶中使用。認識到,搜索語境156包括第一多個語境定義160以使第一多個語境定義160 的每個均具有從屬于用戶的第一搜索信息集合154的第一多個信息14選擇的一個或者多 個單詞。第一多個信息14彼此相關,以使通過搜索語境156的第一多個語境定義160來表 不關系。在步驟402處,協作服務器確定在第一搜索語境156的第一語境定義160與任何 第二搜索語境156的第二語境定義160之間的任何適當匹配。在步驟404處,語境模塊164接收至少一個與另一用戶關聯的匹配的第二搜索156 語境,以使匹配的第二搜索語境156含有視為至少與第一多個語境定義160的一些匹配的 第二多個語境定義160,該匹配的搜索語境定義160包括從屬于與另一用戶關聯的第二搜 索信息集154的第二多個信息14選擇的一個或者多個單詞Wn。在步驟406處,用戶Un(例如)經由用戶界面202調查或者另外評審接收到的第 二搜索語境156。在步驟408處,用戶使用通信模塊106以請求訪問與其他用戶關聯的第二 搜索信息集合154??梢越浻蓞f作服務器152發(fā)送該請求或者直接經由網絡11向另一用 戶發(fā)送該請求。認識到,可以從與多個各自其他用戶關聯的多個接收到的匹配的搜索語境 156的列表172(參見圖1 選擇匹配的搜索語境,以使多個接收到的匹配的搜索語境156 的每個均與對應搜索信息集IM關聯。在步驟408處,將信息模塊162用于集合具有第一搜索信息集合IM的信息內容 14的第二搜索信息集合154的選擇的信息14內容,還集合具有指定給第一搜索信息集合 154的搜索語境156的語境定義160的與選擇的信息內容14相對應的選擇語境定義160。在步驟410處,語境模塊164可以向協作服務器152發(fā)送集合的搜索語境156,以 便在確定與通過集合的搜索語境156所代表的類似主題關聯的協作服務器152的另一用戶 中使用。還認識到,在步驟412處,用戶可以任選地將一個或者多個安全屬性分配給第一 搜索信息集合154的部分,并分配給第一搜索語境156,該安全屬性定義與協作服務器152 的多個用戶相關的部分的訪問級別。在步驟414處,在發(fā)送搜索語境156以前,用戶可以過 濾第一搜索語境156的內容,該過濾基于指定的安全屬性。在步驟416處,用戶可以任選地 從另一用戶接收用于第一搜索信息集合154的請求然后,作為響應發(fā)送第一搜索信息集合154。任選地,在步驟418處,在向其他用戶發(fā)送以前,用戶可以過濾第一搜索信息集合154 的內容,該過濾基于指定的安全屬性。參照圖19,示出了通過協作服務器152所提供的并因此通過用戶的協作引擎150 所操作的典型用戶界面202顯示。例如,點擊一個按鈕170可以指示協作引擎150將選擇 的信息14添加至語境156的肯定語境定義160而點擊另一按鈕170可以指示協作引擎152 將選擇的信息14添加至語境156的否定語境定義160。此外,例如,在信息14參考上點擊 并且將其加入書簽將/可能還便于將信息14參考添加至語境156。此外,還可以將按鈕172 用于訪問識別的協作者174(例如,在網絡11上經由協作服務器152)。計算裝置101參照圖1和圖4,可以在一臺或者多臺各自計算裝置101上實現例如用戶、語境引 擎100、151、協作服務器152、協作引擎150、信息源16、以及搜索引擎M的系統10和/或 協作環(huán)境140的上述部件中的每一個。裝置101通??梢园ㄖT如經由連接218耦合至裝 置基礎設施204的網絡接口卡或者調制解調器的網絡連接接口 200。在裝置101操作期間 可將連接接口 200連接至網絡11 (例如,諸如互聯網的內聯和/外聯,包括無線網絡),該網 絡使裝置101能夠彼此適當通信。網絡11可以支持系統10和/或協作環(huán)境140的部件之 間的搜索請求18和對應搜索結果20的通信。認識到,可以在用戶裝置101上駐留、經由網 絡11在遠離用戶的裝置101上駐留、或者其結合上駐留任何部件的功能性。再次參照圖4,裝置101還可以具有通過連接222耦合至裝置基礎設施204的用 戶接口 202以與用戶交互。通過裝置101的用戶使用用戶接口 202以查看12并且與 FoR 12交互。用戶接口 202可以包括諸如但不限于標準鍵盤、鍵區(qū)、走行輪、輸入筆、鼠標、 麥克風的一個或者多個用戶輸入裝置以及諸如LCD屏幕顯示器和/或揚聲器的用戶輸出裝 置。如果屏幕為觸敏的,則還可以將顯示器用作根據通過裝置基礎設施204所控制的用戶 輸入裝置。例如,可以將通過用戶使用的用于裝置101的用戶接口 202配置為與網頁瀏覽 器(例如,FoR 12的一部分)互動以用公式表示搜索請求18,還處理接收到的搜索結果20。再次參照圖4,通過裝置基礎設施204來便于裝置101的操作。裝置基礎設施204 包括一個或者多個計算機處理器208并且可以包括關聯的存儲器210 (例如,隨機存取存儲 器)。計算機處理器208通過執(zhí)行任務相關指令通過裝置101的網絡接口 200、用戶接口 202、以及其他應用程序/軟件207促進配置為計劃任務的裝置101的性能。可以通過操作 系統、和/或位于存儲器210中的軟件應用程序207、和/或通過配置成被設計為執(zhí)行特定 任務的處理器208的電子/數字電路的可操作性提供這些任務相關指令。此外,認識到,裝 置基礎設施204可能包括耦合至處理器208的計算機可讀存儲介質212,用于為處理器208 提供指令和/或如果本地訪問,則載入/更新客戶端應用程序207和語境引擎100。計算 機可讀介質212可以包括諸如,僅作為實例的磁盤、磁帶、諸如⑶/DVD ROMS的光學可讀介 質、以及存儲卡的硬件和/或軟件。在每種情況下,計算機可讀介質212可以采用小磁碟、 軟盤、盒式磁帶、硬盤驅動器、固態(tài)存儲卡、或者設置在存儲模塊210中的RAM的形式。應該 注意,可以單獨或者結合使用以上列出的典型計算機可讀介質212。可以將裝置存儲器210 和/或計算機可讀介質212用于存儲裝置101的用戶的語境15信息,以使在從裝置101向 網絡11所提交的搜索請求18的處理中使用語境15信息。此外,還可以通過語境引擎100、 151、協作引擎150、以及協作服務器152將裝置存儲器210用作用于存儲和訪問語境15信息的裝置,以便在例如與搜索請求18關聯的來自信息14的確定的語境定義105 (和/或來 自其他語境15的語境定義104)匹配中使用。此外,認識到,計算裝置101可以包括可執(zhí)行應用程序100、207,該可執(zhí)行應用程 序包括用于執(zhí)行(例如)包括了操作系統、網頁瀏覽器、語境引擎100的那些預定功能/操 作的代碼或者機器可讀指令。如用于本文的處理器208,其為用于執(zhí)行如通過以上實例所 述的操作的配置裝置和/或機器可讀指令的集合。如在本文中所使用的,處理器208可以 包括硬件、固件、和/或軟件的任何一個或者組合。處理器208通過操作、分析、修改、轉換、 或者傳輸通過可執(zhí)行程序或者信息裝置使用的信息,和/或通過關于輸出裝置路由信息來 作用于信息。例如,處理器208可以使用或者包括控制器或者微處理器的能力。因此,可以 在硬件、軟件、或者這兩者的結合中實現語境引擎100、151、協作引擎150、和/或協助服務 器152的任何模塊(和其子集)的任何功能性。因此,為了簡單起見,下文中,通常將作為 裝置和/或機器可讀指令的集合的處理器208的使用稱作處理器/模塊。應該理解,用戶的計算裝置101可以為(例如)個人計算機、個人數字助理、以及 移動電話。如所希望的,可以為信息源16和搜索引擎M配置服務器計算裝置101。此外, 認識到,如所希望的,盡管描述為單個計算機系統,但是可以作為計算機處理器的網絡實現 每個計算裝置101。附錄A-系統10的操作的數字實例
      50
      權利要求
      1.一種用于生成用于多個信息的參照系的方法,所述多個信息含有文本數據并且由用 戶通過與一個或者多個信息源交互所獲得,所述方法包括接收經選擇的用于分析的信息,所述信息包括多個文本數據;識別所述文本數據的多個邏輯單元;識別在每個所述邏輯單元中的多個獨立正文部;計算與所述多個正文部的所述獨立正文部中的每一個關聯的邏輯單元的數量,以便在 識別包括用于每個所述獨立正文部的各個模式的多個模式中使用;計算用于每個所述多個模式的重要性測度;基于滿足用于在所述多個模式中保持所述各個模式的預先定義的模式重要性閾值的 多個模式對應的重要性測度從所述多個模式中選擇所述各個模式;基于選擇的所述各個模式生成多個信息語境定義;以及分配從選擇的所述信息中所獲得的生成的所述信息語境定義作為與所述參照系關聯 的語義語境的語境定義,所述多個信息彼此相關并且通過所述語義語境的語境定義來表示 這種關系。
      2.根據權利要求1所述的方法,其中,所選擇的所述信息和所述多個信息選自包括電 子文檔;網絡消息;從數據庫所獲得的內容;網頁;電子文件;搜索結果;以及搜索請求參 數的組。
      3.根據權利要求1所述的方法,其中,所選擇的所述信息和所述多個信息選自包括所 述參照系的應用的應用狀態(tài)信息;以及所述參照系的應用的生成結果的組。
      4.根據權利要求3所述的方法,其中,所述應用狀態(tài)信息選自包括桌面圖標;最近使用的菜單項;以及應用書簽的組。
      5.根據權利要求3所述的方法,進一步包括以下步驟基于所述語義語境的所述語境 定義修改所述參照系的所述應用狀態(tài)。
      6.根據權利要求2所述的方法,其中,所述參照系包括多個語義語境,每個所述語義語 境均具有相對于彼此的所述語境定義的唯一集合。
      7.根據權利要求6所述的方法,其中,所述語境定義包括表示所述參照系的圖形用戶 界面的視覺方面的定義,以使選擇所述語義語境之一用于配置所述參照系的視覺顯示。
      8.根據權利要求6所述的方法,其中,如果確定生成的所述信息語境定義與所述多個 語義語境的所述語境定義的任何一個不匹配,則創(chuàng)建新的語義語境并且將生成的所述信息 語境定義分配為新的語義語境的語境定義。
      9.根據權利要求2所述的方法,進一步包括接收由用戶所選擇的正文部以便在生成 所述信息語境定義中使用,以使選擇的所述正文部包括選自所述文本數據的單詞或者單詞 組合。
      10.根據權利要求2所述的方法,其中,從包括句子;頁;一系列頁;文本行;段落;以 及一系列段落的組中選擇所述邏輯單元。
      11.根據權利要求10所述的方法,其中,使用選自包括標點符號;空格;元數據;分行 符;以及分頁符的組的定義機制識別所述邏輯單元。
      12.根據權利要求11所述的方法,其中,從包括單詞;詞組;以及預先定義短語的組 中選擇所述正文部。
      13.根據權利要求2所述的方法,進一步包括計算用于所述多個正文部中的每一個的 重要性測度,所述重要性測度包括確定在選擇的所述信息中各個所述正文部出現的局部相 對頻率。
      14.根據權利要求13所述的方法,進一步包括基于訓練信息的全局集合使用每個所 述正文部的出現的全局相對頻率,各個所述正文部的每個的重要性測度進一步基于出現的 所述全局相對頻率。
      15.根據權利要求13所述的方法,進一步包括基于滿足用于在多個所述正文部中保 持所述正文部以便在識別所述多個模式中使用的預先定義的重要性閾值的正文部對應的 重要性測度,從所述多個正文部中選擇正文部。
      16.根據權利要求13所述的方法,進一步包括分配用于每個所述正文部的唯一值以 便在識別所述多個模式中使用,所述唯一值被預先定義并且存儲在正文部的預先定義列表 中。
      17.根據權利要求16所述的方法,其中,從包括整數和哈希值的組中選擇所述唯一值。
      18.根據權利要求17所述的方法,進一步包括在所述獨立正文部的識別的所述多個 模式中的所述各個模式的每個中包括相對于彼此的所述正文部的相對定位信息,所述相對 定位信息用于基于滿足所述預先定義的模式重要性閾值的多個模式對應的重要性測度,從 所述多個模式中選擇所述各個模式。
      19.根據權利要求1所述的方法,進一步包括從多個選擇的信息中選擇所述語境定義 作為所述單獨正文部;識別包括所述語境定義的所述文本數據的多個邏輯單元;計算與每個所述語境定義關聯的邏輯單元的數量以便在識別包括用于所述單獨語境 定義的每個的各個語境定義模式的多個語境定義模式中使用;計算用于所述多個語境定義模式中每一個的重要性測度;基于滿足用于在所述多個語境定義模式中保持所述各個語境定義模式的預先定義的 語境定義模式重要性閾值的多個模式對應的重要性測度從所述多個語境定義模式中選擇 所述各個語境定義模式;基于選擇的所述各個語境定義模式生成多個二次信息語境定義;以及分配從選擇的所述多個信息中所獲得的生成的所述二次信息語境定義作為與所述參 照系關聯的語義語境的二次語境定義。
      20.根據權利要求19所述的方法,其中,所述二次語境定義表示所述語境定義之間的 關系并且所述二次語境定義用于進一步定義與所述語義語境關聯的信息之間的關系。
      21.根據權利要求2所述的方法,進一步包括接收用于分析的另外信息,所述另外信息 包括多個其他文本數據;識別所述其他文本數據的多個其他邏輯單元;識別在每個所述邏輯單元中的多個其他獨立正文部;計算與所述多個其他正文部的所述獨立其他正文部的每個關聯的其他邏輯單元的數 量,以便在識別包括用于每個所述獨立其他正文部的各個其他模式的多個其他模式中使 用;計算用于所述多個其他模式的每一個的其他重要性測度;基于滿足用于在所述多個其他模式中保持所述各個其他模式的其他預先定義的模式 重要性閾值的各個其他模式對應的其他重要性測度,從所述多個其他模式中選擇所述各個 其他模式;基于選擇的所述各個其他模式生成多個其他信息語境定義;以及將生成的所述其他信息語境定義與所述語義語境的所述語境定義相比較,以通過與所 述語義語境關聯的所述多個信息確定接收的所述另外信息的相關性程度。
      22.根據權利要求21所述的方法,其中,接收的所述其他信息為從信息查詢所獲得的fn息ο
      23.根據權利要求22所述的方法,其中,接收的所述其他信息基于用戶請求或者與用 戶交互無關地、基于所述用戶的語境引擎的請求。
      24.根據權利要求21所述的方法,進一步包括如果確定比較的所述其他信息語境定 義與所述語義語境的所述語境定義匹配,則通過所述語義語境的所述語境定義集合所述其 他信息語境定義。
      25.根據權利要求M所述的方法,進一步包括將所述其他信息集合至與所述語義語 境關聯的所述多個信息。
      26.根據權利要求21所述的方法,進一步包括如果確定比較的所述其他信息語境定 義與所述語義語境的所述語境定義匹配,則通過所述語義語境的所述語境定義過濾所述其 他信息語境定義。
      27.根據權利要求沈所述的方法,進一步包括通過所述語義語境過濾所述其他信息。
      28.根據權利要求19所述的方法,其中,從包括肯定;否定;以及在計算全局匹配中 所使用的全局語境的組中選擇所述多個語境。
      29.根據權利要求1所述的方法,其中,所述語義語境持續(xù)所選擇的時段。
      30.根據權利要求22所述的方法,其中,從包括數據庫查詢;文檔的結構化查詢;以 及網頁查詢的組中選擇所述信息查詢。
      31.根據權利要求23所述的方法,其中,所述語境引擎的所述請求為基于所述用戶的 活動通過所述語境引擎啟動的預測性查詢。
      32.根據權利要求31所述的方法,其中,所述用戶的所述活動選自包括下列內容的組 當所述用戶在所述參照系的所述語義語境中時,但是在提交所述用戶請求以前;當所述用 戶在所述參照系的所述語義語境中時,但是在提交所述用戶請求期間;以及當所述用戶在 所述參照系的所述語義語境中時,但是在提交所述用戶請求以后。
      33.根據權利要求32所述的方法,其中,向所述用戶提供來自所述語義語境的語境定 義作為用于所述用戶進行選擇的查詢建議。
      全文摘要
      用于生成用于多個信息的參照系的系統和方法,多個信息含有由用戶通過與一個或者多個信息源交互所獲得的文本數據,包括接收所選擇的用于分析的信息,該信息包括文本數據并且識別文本數據的多個邏輯單元。識別在邏輯單元的每個中的多個獨立正文部,并且計算與每個獨立正文部關聯的邏輯單元的數量以便在識別模式中使用?;谀J?,計算重要性測度并且基于滿足預先定義的重要性閾值的重要性測度選擇模式?;谶x擇的模式生成多個信息語境定義并且分配所生成的信息語境定義作為與參照系關聯的語義語境的語境界定。多個信息彼此相關并且通過語義語境的生成的語境定義來表示這種關系。
      文檔編號G06F17/30GK102138140SQ200980133722
      公開日2011年7月27日 申請日期2009年6月30日 優(yōu)先權日2008年7月1日
      發(fā)明者哈施·漢德爾瓦爾, 尼克·福西, 布魯斯·斯坎蘭, 斯蒂芬·巴克索 申請人:多斯維公司
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1