專利名稱::信息管理、檢索和顯示系統(tǒng)以及相關(guān)方法
技術(shù)領(lǐng)域:
:本發(fā)明是搜索信息資源并從中檢索信息的計(jì)算機(jī)化系統(tǒng)和方法,更具體來說,本發(fā)明是信息管理、檢索和顯示系統(tǒng),用于搜索信息資源,并基于用戶選擇的顯示條件或?qū)哟谓Y(jié)構(gòu),以可折疊的/可展開的格式顯示搜索的結(jié)果。
背景技術(shù):
:許多常規(guī)的搜索引擎或搜索工具(如InfoseekTM、AltaVistaTM、HotbotTM)的一個(gè)固有缺點(diǎn)是,搜索的結(jié)果通常按照正在搜索的每個(gè)文檔(Web頁)中的搜索字或短語的匹配數(shù)量來組織。這種類型的搜索結(jié)果顯示要求最終用戶一個(gè)一個(gè)地瀏覽匹配項(xiàng),最終才能訪問到他/她要查找的文檔。此類常規(guī)搜索引擎的另一個(gè)缺點(diǎn)是,搜索的結(jié)果不考慮一個(gè)單詞可能有多種不同意思的情況,以及在許多不同的上下文中使用的情況。例如,如果最終用戶要查找有關(guān)卡通老鼠的信息,因?yàn)樗阉鞑樵儗瑔卧~“mouse”,匹配列表將包括有關(guān)電子光標(biāo)控制設(shè)備的文檔、提供有關(guān)老鼠的生物信息的文檔、提供有關(guān)老鼠的寵物信息的文檔。因此,最終用戶可能必須瀏覽許多此類匹配項(xiàng),最終才能(如果有的話)找到涉及卡通老鼠的匹配項(xiàng)。因此,需要有一個(gè)這樣的搜索引擎或搜索工具,以便使最終用戶以這樣的方式來組織搜索結(jié)果,以使最終用戶有效而快速地獲得感興趣的內(nèi)容。本發(fā)明是信息管理、檢索和顯示系統(tǒng),用于搜索信息資源,如文檔(例如,條約)、許多單個(gè)文檔(例如駐留在因特網(wǎng)上的Web頁)、信息流(例如,DNA代碼、源代碼、衛(wèi)星數(shù)據(jù)傳輸信息等),并基于用戶選擇的顯示條件或?qū)哟谓Y(jié)構(gòu),以可折疊的/可展開的格式顯示搜索的結(jié)果。這樣的顯示層次結(jié)構(gòu)將使最終用戶有效而快速地從搜索結(jié)果中獲得感興趣的內(nèi)容。信息資源的類型或格式并不重要。本發(fā)明包括四個(gè)主要模塊中斷模塊、索引模塊、搜索模塊和非中斷模塊。中斷模塊是一個(gè)專家系統(tǒng),它根據(jù)定義其運(yùn)行的一組專家規(guī)則來運(yùn)行。中斷模塊分析信息資源,以將信息資源分為有限元素(如段、節(jié)、子節(jié)、小段等)。中斷模塊還為每一個(gè)有限元素創(chuàng)建分類標(biāo)記,其中分配到每個(gè)有限元素的分類標(biāo)記都基于對(duì)每個(gè)有限元素的內(nèi)容的分析(由一組專家系統(tǒng)規(guī)則來定義)。分類標(biāo)記可以包括標(biāo)準(zhǔn)分類,如,“Dewey十進(jìn)制類型”號(hào)碼。分類標(biāo)記還可以包括組織屬性(如關(guān)于有限元素的類型或相對(duì)于信息資源的其余部分的位置)、日期戳、分類詞等。優(yōu)選情況下,將分類標(biāo)記插入到有限元素中。索引模塊分析由中斷模塊標(biāo)識(shí)/創(chuàng)建/處理的有限元素,并創(chuàng)建可搜索的數(shù)據(jù)庫,該數(shù)據(jù)庫有針對(duì)中斷模塊標(biāo)識(shí)的每個(gè)有限元素的數(shù)據(jù)庫記錄??伤阉鞯臄?shù)據(jù)庫是一種反向索引,其中每個(gè)記錄都包括對(duì)應(yīng)的有限元素的地址或位置(反過來又包括分類標(biāo)記),有限元素中包含的字符串(如單詞、短語等)以及它們?cè)谟邢拊貎?nèi)出現(xiàn)的頻率(即,它們的權(quán)重)。在本發(fā)明的用戶不能控制正在搜索的信息(即,因特網(wǎng)上的Web頁)的應(yīng)用場合,每個(gè)數(shù)據(jù)庫記錄還可能包括分類標(biāo)記,因?yàn)榉诸悩?biāo)記無法由中斷模塊插入到有限元素中。因此,對(duì)于Web搜索應(yīng)用場合,可能根本就不需要利用中斷模塊和非中斷模塊,因?yàn)閷?duì)于本發(fā)明,每個(gè)Web頁或鏈接都可能被認(rèn)為是一個(gè)有限元素。一旦創(chuàng)建反向索引,就可以對(duì)反向索引進(jìn)行搜索。最終用戶可以提供關(guān)鍵字符串(如關(guān)鍵字、短語或符號(hào)段)作為搜索查詢,用戶還可以選擇或定義顯示層次結(jié)構(gòu)或條件。所選擇的顯示條件將指示搜索模塊如何處理搜索結(jié)果的數(shù)據(jù)。具體來說,所選擇的顯示條件將定義,搜索結(jié)果是否完全根據(jù)分類標(biāo)記內(nèi)包含的信息按某種順序或結(jié)構(gòu)來顯示(以研究為中心),搜索結(jié)果是否完全取決于關(guān)鍵字符串在有限元素中出現(xiàn)的頻率按某種順序來顯示(常規(guī)),或者搜索結(jié)果是否根據(jù)兩種情況的組合按某種順序或結(jié)構(gòu)來顯示(以文檔為中心)。搜索模塊訪問搜索查詢,并搜索反向索引,以查找與特定的搜索條件或搜索查詢匹配的數(shù)據(jù)庫記錄。然后通過將滿足搜索條件的每個(gè)有限元素的分類標(biāo)記中的信息應(yīng)用到所選擇的顯示層次結(jié)構(gòu),以可折疊的/可展開的(樹形)結(jié)構(gòu)顯示搜索結(jié)果。例如,如果所選擇的層次結(jié)構(gòu)是以文檔為中心的層次結(jié)構(gòu),顯示層次結(jié)構(gòu)的第一層次可以是,例如,創(chuàng)建有限元素的年份,顯示層次結(jié)構(gòu)的第二層次可以是,例如,有限元素在文檔中出現(xiàn)的順序,顯示層次結(jié)構(gòu)的第三層次可以,例如,基于搜索字在每個(gè)有限元素中出現(xiàn)的頻率。搜索模塊的運(yùn)行,與中斷模塊和索引模塊一樣,基于一組專家規(guī)則。因此,如果搜索結(jié)果不令人滿意,則修改中斷模塊、索引模塊和/或搜索模塊中的專家規(guī)則,然后再次執(zhí)行該過程。一旦最終用戶選擇了搜索結(jié)果顯示中的一個(gè)有限元素,那么非中斷模塊就允許最終用戶查看所選擇的有限元素所屬的信息資源的連續(xù)部分。非中斷模塊將所選擇的有限元素與其他相關(guān)的有限元素匯編在一起,以重新構(gòu)建信息資源的連續(xù)部分。非中斷模塊參考所選擇的有限元素的分類標(biāo)記,獲得有關(guān)有限元素相對(duì)于整個(gè)信息資源的位置的信息,然后用從屬于該部分的所有有限元素來構(gòu)建信息資源的一部分。例如,如果所選擇的有限元素是文檔的一個(gè)段落,那么可以配置非中斷模塊,以重新構(gòu)建該段落所屬的文檔的章節(jié)。與本發(fā)明的其他模塊一樣,非中斷模塊的運(yùn)行受一組專家規(guī)則的控制,如果結(jié)果不令人滿意,可以修改這些規(guī)則。可以想象,由熟悉正在搜索的文檔或信息的專家來創(chuàng)建和精煉規(guī)則集。例如,如果本發(fā)明的系統(tǒng)將要與《聯(lián)邦管理法典》的第37卷關(guān)聯(lián),那么非常熟悉該卷的個(gè)人(或幾個(gè)人)將最適合制定和微調(diào)這些規(guī)則集。對(duì)這些規(guī)則集的微調(diào)將涉及個(gè)人使用規(guī)則集連續(xù)地對(duì)該卷執(zhí)行示例搜索,以及連續(xù)地修改規(guī)則集以獲得所需要的內(nèi)容和格式。一旦對(duì)規(guī)則集微調(diào)完畢,可以將本發(fā)明的搜索模塊與該卷一起打包,并作為可搜索的卷來銷售或分發(fā)。同樣,搜索模塊也可以在Web站點(diǎn)上運(yùn)行,以便用戶可以訪問Web站點(diǎn),并對(duì)該卷執(zhí)行搜索。由于“專家”已經(jīng)對(duì)規(guī)則集進(jìn)行定義和微調(diào),用戶將擁有完全可操作的搜索引擎,該引擎可以根據(jù)專家掌握的卷的知識(shí)來執(zhí)行搜索和顯示結(jié)果。正如上文所提及的,可以想象,本發(fā)明的實(shí)施例可用于搜索駐留在因特網(wǎng)上的單個(gè)Web頁,并基于用戶所選擇的顯示條件或?qū)哟谓Y(jié)構(gòu),采用可折疊的/可展開的格式來顯示搜索結(jié)果。在這樣的實(shí)施例中,采用上文所描述的形式的中斷模塊可能并不需要,因?yàn)槊總€(gè)Web頁可能已經(jīng)被認(rèn)為是“有限元素”,且搜索引擎將無法修改Web頁。相應(yīng)地,在這樣的應(yīng)用場合,索引模塊將分析每個(gè)Web頁(有限元素),以創(chuàng)建具有每個(gè)Web頁的記錄的可搜索數(shù)據(jù)庫??伤阉鲾?shù)據(jù)庫中的每個(gè)記錄將包括Web頁的Web地址,包含在Web頁中的非共用詞以及它們的頻率(權(quán)重),分類標(biāo)記,如上文所述,這種分類標(biāo)記包括基于對(duì)Web頁的內(nèi)容的分析的數(shù)據(jù)。索引模塊還將檢查每個(gè)Web頁,以確定Web頁的創(chuàng)建者是否在Web頁中嵌入了分類標(biāo)記,如果找到這樣的嵌入分類標(biāo)記,那么索引模塊只需將這種預(yù)先定義的分類標(biāo)記插入數(shù)據(jù)庫記錄中,而不需要重新創(chuàng)建。因此,隨著本發(fā)明在因特網(wǎng)上越來越廣泛地應(yīng)用,Web頁的創(chuàng)建者可能希望為他們的Web頁創(chuàng)建他們自己的分類標(biāo)記,而不是讓搜索引擎為他們創(chuàng)建。有了這一功能,Web頁設(shè)計(jì)人員就可以影響搜索結(jié)果,以便獲得對(duì)Web站點(diǎn)的更準(zhǔn)確描述。當(dāng)然,這樣的功能也可以由Web設(shè)計(jì)人員以虛假的方式使用,在這種情況下,當(dāng)搜索者在查找完全不同類型的信息時(shí),分類標(biāo)記將使Web頁列在搜索結(jié)果中。由于認(rèn)識(shí)到這一潛在的問題,索引模塊將包括一個(gè)選項(xiàng),它將把Web頁的實(shí)際內(nèi)容與嵌入的分類標(biāo)記進(jìn)行比較,如果存在顯著的差異,它就會(huì)創(chuàng)建新的分類標(biāo)記,以插入到數(shù)據(jù)庫記錄中。同樣,還可以對(duì)索引模塊進(jìn)行配置,使其根據(jù)嵌入的分類標(biāo)記的指示或者通過檢查Web頁內(nèi)容本身,過濾掉具有不需要的或令人討厭的內(nèi)容的Web站點(diǎn)。在本發(fā)明的另一個(gè)實(shí)施例中,可以配置動(dòng)態(tài)專家規(guī)則集,以在全局范圍內(nèi)接受和索引各種各樣的靜態(tài)和動(dòng)態(tài)信息(如新聞饋送、數(shù)據(jù)傳輸?shù)?,在這種情況下,根據(jù)分類組織方案(如Dewey十進(jìn)制系統(tǒng)),最終用戶將能夠從分層次搜索結(jié)果顯示中有效而快速地獲得他/她所需要的任何種類的信息。因此,在本發(fā)明的一個(gè)方面,從信息資源中檢索信息的方法包括下面的步驟(a)將信息資源分為眾多有限元素;(b)向每個(gè)有限元素分配分類標(biāo)記,其中分類標(biāo)記包括關(guān)于有限元素的內(nèi)容的數(shù)據(jù);(c)為各個(gè)有限元素產(chǎn)生可搜索數(shù)據(jù)庫記錄,其中每個(gè)可搜索數(shù)據(jù)庫記錄都至少包括有限元素內(nèi)所包含的一個(gè)字符串,其中字符串可以是單詞、短語、符號(hào)、符號(hào)組、數(shù)據(jù)段等等;(d)提供搜索字符串;(e)搜索可搜索的數(shù)據(jù)庫,以查找包含搜索字符串的可搜索數(shù)據(jù)庫記錄;(f)根據(jù)(至少部分地)分配到在搜索步驟中查找到的有限元素的分類標(biāo)記中的數(shù)據(jù),以層次結(jié)構(gòu)排列搜索步驟的結(jié)果;(g)以層次結(jié)構(gòu)顯示搜索步驟的結(jié)果。信息資源可以是單個(gè)文檔、眾多文檔或數(shù)據(jù)流,標(biāo)識(shí)有限元素的步驟可以包括標(biāo)識(shí)文檔內(nèi)的節(jié)或子節(jié)或數(shù)據(jù)流的步驟或只需標(biāo)識(shí)文檔本身。將信息資源分為眾多有限元素的步驟在優(yōu)選的情況下由專家系統(tǒng)根據(jù)規(guī)則集來執(zhí)行,向每個(gè)有限元素分配分類標(biāo)記的步驟在優(yōu)選的情況下由專家系統(tǒng)根據(jù)另一個(gè)規(guī)則集來執(zhí)行。如果在上述步驟(g)中獲得的結(jié)果不令人滿意,那么可以由最終用戶修改一個(gè)或兩個(gè)規(guī)則,然后再重新執(zhí)行一遍步驟(a)到(g)。每個(gè)數(shù)據(jù)庫記錄在優(yōu)選的情況下包括對(duì)應(yīng)的有限元素的地址或指向該有限元素的指針,還進(jìn)一步優(yōu)選地包括對(duì)應(yīng)的有限元素內(nèi)所包含的所有非共用字符串(例如,單詞或短語)以及這些字符串所出現(xiàn)的頻率。在本發(fā)明的另一個(gè)方面,從信息資源中檢索信息的方法包括下列步驟定義第一個(gè)規(guī)則集,用于將信息資源分為眾多有限元素;利用第一個(gè)規(guī)則集,將信息資源分為眾多有限元素;定義第二個(gè)規(guī)則集,用于為其中一個(gè)有限元素創(chuàng)建分類標(biāo)記,利用第二個(gè)規(guī)則集,為各個(gè)有限元素創(chuàng)建分類標(biāo)記;產(chǎn)生可搜索數(shù)據(jù)庫,包括每個(gè)有限元素的可搜索數(shù)據(jù)庫記錄;搜索可搜索數(shù)據(jù)庫,以查找相關(guān)的數(shù)據(jù)庫記錄;將在搜索中查找到的相關(guān)的數(shù)據(jù)庫記錄與對(duì)應(yīng)的相關(guān)有限元素關(guān)聯(lián);選擇用于顯示關(guān)于相關(guān)有限元素的標(biāo)識(shí)短語的層次結(jié)構(gòu);根據(jù)(至少部分地)每個(gè)有限元素的分類標(biāo)記,按層次結(jié)構(gòu)排列相關(guān)的有限元素;根據(jù)排序步驟中的結(jié)果,顯示關(guān)于相關(guān)有限元素的標(biāo)識(shí)短語。在本發(fā)明的另一個(gè)方面,提供數(shù)據(jù)存儲(chǔ)設(shè)備(如CDROM),該設(shè)備包括分為眾多有限元素的信息資源,其中每個(gè)有限元素都包括分類標(biāo)記以及分配的數(shù)據(jù)庫記錄,其中分類標(biāo)記包括關(guān)于有限元素的內(nèi)容的數(shù)據(jù),而數(shù)據(jù)庫記錄至少包括有限元素內(nèi)包含的一個(gè)字符串,還包括軟件指令,這些指令經(jīng)過編程,以至少檢索和顯示該信息資源的一部分??梢詫?duì)軟件指令進(jìn)行配置,使它們執(zhí)行下列步驟提供搜索字符串,搜索數(shù)據(jù)庫記錄,以查找包含搜索字符串的相關(guān)數(shù)據(jù)庫記錄,根據(jù)分配到與相關(guān)的數(shù)據(jù)庫記錄對(duì)應(yīng)的有限元素的分類標(biāo)記中的信息,以層次結(jié)構(gòu)排列搜索步驟的結(jié)果,為與層次結(jié)構(gòu)中的相關(guān)數(shù)據(jù)庫記錄對(duì)應(yīng)的有限元素顯示標(biāo)識(shí)短語。圖1是本發(fā)明的第一個(gè)實(shí)施例的操作的流程圖表示;圖2A和2B是圖1中所說明的實(shí)施例的操作的流程圖表示;圖3是本發(fā)明的第二個(gè)實(shí)施例的操作的流程圖表示,駐留在數(shù)據(jù)存儲(chǔ)設(shè)備(如CDROM)中圖4是本發(fā)明的第三個(gè)實(shí)施例的操作的流程圖表示;圖5A和5B是圖4中所說明的實(shí)施例的流程圖表示。詳細(xì)說明本發(fā)明是信息管理、檢索和顯示系統(tǒng),用于搜索信息資源,如文檔(例如條約)、許多單個(gè)文檔(例如,駐留在因特網(wǎng)上的Web頁),或信息流(例如DNA代碼、源代碼、衛(wèi)星數(shù)據(jù)傳輸信息等),并基于用戶選擇的顯示條件或?qū)哟谓Y(jié)構(gòu),以可折疊的/可展開的格式顯示搜索的結(jié)果。這樣的顯示層次結(jié)構(gòu)將使最終用戶有效而快速地從搜索結(jié)果中獲得感興趣的內(nèi)容。如圖1所示,在本發(fā)明的第一個(gè)實(shí)施例中,信息管理、檢索和顯示系統(tǒng)包括四個(gè)主要模塊中斷模塊10、索引模塊12、搜索模塊14和非中斷模塊16。這些處理模塊中的每個(gè)模塊在優(yōu)選的情況下都是專家引擎,它們根據(jù)一組專家規(guī)則來運(yùn)行,這些規(guī)則定義單個(gè)模塊的運(yùn)行。正如在下文中所詳細(xì)描述的,針對(duì)這些模塊的專家規(guī)則在優(yōu)選的情況下由熟悉正在搜索的文檔18的人(多人)來制定;對(duì)專家規(guī)則的微調(diào)是一個(gè)反復(fù)的過程,在這個(gè)過程中,如果對(duì)文檔的搜索證明是不令人滿意的,專家就會(huì)對(duì)上述一個(gè)或多個(gè)模塊的規(guī)則進(jìn)行修改。中斷模塊10分析信息資源,如一組文檔18,以將文檔組分為“有限元素”20a-20z。每個(gè)有限元素都是文檔中的用戶定義的信息“籃”,可以對(duì)這些信息“籃”分別進(jìn)行索引和搜索。有限元素通常不是單個(gè)單詞、短語或符號(hào),而是信息資源的節(jié)或部分,可以由中斷模塊來標(biāo)識(shí)和隔離。有限元素的簡單例子是文檔的單個(gè)段落。有限元素的其他例子將包括文檔的子章節(jié)、文檔的單個(gè)頁、文檔的其他類型的可標(biāo)識(shí)節(jié)。在一些實(shí)例中,有限元素可以是整個(gè)文檔本身。中斷模塊還負(fù)責(zé)分析每個(gè)有限元素20a-20z的內(nèi)容,為各個(gè)有限元素創(chuàng)建分類標(biāo)記22a-22z,這些分類標(biāo)記將要插入到有限元素中。分類標(biāo)記22a-22z可以包括基于內(nèi)容分析的標(biāo)準(zhǔn)分類,例如“Dewey十進(jìn)制”類型號(hào)碼,或一些其他分類引用號(hào)碼。分類標(biāo)記還可以包括組織屬性,如關(guān)于有限元素的類型或有限元素在文檔內(nèi)的位置、日期戳、概括有限元素的內(nèi)容的分類單詞或短語等。正如下文將要詳細(xì)描述的,每個(gè)分類標(biāo)記的內(nèi)容將向搜索模塊12提供信息,以便幫助搜索模塊創(chuàng)建搜索結(jié)果的分層次顯示。索引模塊分析由中斷模塊創(chuàng)建的每個(gè)有限元素,并創(chuàng)建可搜索的數(shù)據(jù)庫23,該數(shù)據(jù)庫包括中斷模塊創(chuàng)建的每個(gè)有限元素的數(shù)據(jù)庫記錄24a-24z。可搜索的數(shù)據(jù)庫23是一種反向索引,其中每個(gè)記錄24a-24z包括對(duì)應(yīng)的有限元素的地址或位置,有限元素內(nèi)所包含的所有單詞(優(yōu)選的情況下排除共用詞,如“and”、“in”、“the”...)以及它們?cè)谟邢拊貎?nèi)出現(xiàn)的頻率(即它們的權(quán)重)。在該過程中的某一時(shí)刻,用戶(該用戶可能是最終用戶,也可能是制定規(guī)則集的專家)將輸入搜索查詢26和可選層次結(jié)構(gòu)選擇28。搜索查詢可以是現(xiàn)有技術(shù)中那些普通技術(shù)人員可用的任何常規(guī)搜索查詢,也可以包括搜索字或短語和/或?qū)卧~連接起來的運(yùn)算符。層次結(jié)構(gòu)選擇通知搜索模塊有關(guān)用戶希望看到的顯示結(jié)果所采用的顯示格式的類型。具體來講,層次結(jié)構(gòu)選擇將通知搜索模塊,搜索結(jié)果是否完全根據(jù)分類標(biāo)記內(nèi)包含的信息按某種順序或結(jié)構(gòu)來顯示(以研究為中心),搜索結(jié)果是否完全取決于關(guān)鍵字或短語在有限元素中出現(xiàn)的頻率按某種順序來顯示(常規(guī)),或者搜索結(jié)果是否根據(jù)兩種情況的組合按某種順序或結(jié)構(gòu)來顯示(以文檔為中心)。搜索模塊將利用搜索查詢,來搜索數(shù)據(jù)庫記錄24a-24z,以便查找與搜索查詢中的單詞或短語匹配的數(shù)據(jù)庫記錄30。然后,取決于所選擇的層次結(jié)構(gòu)28,基于有限元素20(這些有限元素與匹配搜索查詢的記錄30相關(guān)聯(lián))中所包括的分類標(biāo)記22中的信息,搜索模塊將按順序或以可折疊的/可展開的樹形結(jié)構(gòu)顯示搜索結(jié)果32。例如,顯示層次結(jié)構(gòu)的第一個(gè)層次可能根據(jù)有限元素所在的文檔的章節(jié)來排列順序。有關(guān)有限元素所在的章節(jié)的信息將駐留在與有限元素關(guān)聯(lián)的分類標(biāo)記內(nèi)。顯示結(jié)果的第二個(gè)層次可能根據(jù)搜索字或短語在每個(gè)有限元素內(nèi)出現(xiàn)的權(quán)重或頻率,來排列每個(gè)章節(jié)的有限元素。因此,在搜索結(jié)果屏幕中,最終用戶將選擇他或她希望查看的相關(guān)的有限元素所在的章節(jié),然后,顯示屏幕展開,以顯示與搜索查詢匹配的該章節(jié)中的有限元素。包含在該章節(jié)內(nèi)的這些有限元素將根據(jù)搜索查詢或單詞的權(quán)重來排列順序。從那里,用戶將作出選擇34,向非中斷模塊16指出用戶希望查看哪一個(gè)有限元素?,F(xiàn)有技術(shù)中的那些普通技術(shù)人員應(yīng)該認(rèn)識(shí)到,排序方案和任何給定的層次結(jié)構(gòu)中的層次的不同的組合幾乎是無限的。排序方案和層次的其他例子可以基于有限元素的主題、有限元素的作者或提供者、有限元素的時(shí)間/日期、有限元素相對(duì)于信息資源的位置等。層次結(jié)構(gòu)只包括一個(gè)排序?qū)哟蔚那闆r,也在本發(fā)明的范圍內(nèi)。盡管搜索模塊以可折疊的/可展開的樹形結(jié)構(gòu)來顯示搜索結(jié)果是優(yōu)選的,但以可替換的層次結(jié)構(gòu)來顯示搜索結(jié)果也在本發(fā)明的范圍內(nèi)??商鎿Q的層次結(jié)構(gòu)的一個(gè)例子是,使用層疊或平鋪顯示來呈現(xiàn)層次結(jié)構(gòu)的各個(gè)層次。當(dāng)然,如果只有一個(gè)排序?qū)哟?,顯示結(jié)構(gòu)就不必是可折疊的/可展開的。還可以對(duì)搜索模塊進(jìn)行配置,使其識(shí)別出搜索查詢中的字符串可能有其他滲透,它們可以由搜索引擎用來提供與數(shù)據(jù)庫記錄的匹配項(xiàng)。例如,如果搜索查詢包括以第一種語言表示的單詞,當(dāng)查找與數(shù)據(jù)庫記錄的匹配項(xiàng)時(shí),搜索模塊提供以其他語言表示的單詞,這種情況也在本發(fā)明的范圍內(nèi)。同樣,搜索模塊提供單詞的其他已知的詞形或時(shí)態(tài),這種情況也在本發(fā)明的范圍內(nèi),搜索模塊提供具有相似的或相同意思的其他搜索字,這種情況也在本發(fā)明的范圍內(nèi)。非中斷模塊16訪問所選擇的有限元素34的分類標(biāo)記,以確定文檔18的其他有限元素36,這些有限元素將要組合在一起以便形成單個(gè)連續(xù)顯示38。例如,如果所選擇的有限元素34是文檔的段落,那么非中斷模塊16將參看其余的有限元素的分類標(biāo)記,以確定與所選擇的有限元素出現(xiàn)在相同頁中的其他有限元素36,以便顯示整個(gè)頁38,而不是單個(gè)段落。同樣,非中斷模塊可以將連續(xù)的章、節(jié)或一個(gè)文檔或多個(gè)文檔的其他連續(xù)的可標(biāo)識(shí)的部分的相關(guān)的有限元素組合在一起。簡而言之,非中斷模塊用于在上下文中與信息資源的其余部分一起顯示所選擇的有限元素。盡管利用非中斷模塊來重新構(gòu)建信息資源的連續(xù)部分是優(yōu)選的,但配置非中斷模塊的專家規(guī)則集,以使用所選擇的有限元素和原始信息資源中的其他有限元素構(gòu)建新的信息資源,這種情況也在本發(fā)明的范圍內(nèi)。例如,可以配置非中斷模塊,以將匹配搜索查詢的所有有限元素匯編為新的信息資源,并使用這些有限元素的分類標(biāo)記,規(guī)定匯編有限元素時(shí)所采用的順序。在另一個(gè)例子中,可以配置非中斷模塊,以檢查所選擇的有限元素的分類標(biāo)記,從而基于創(chuàng)建有限元素時(shí)的日期、或有限元素的作者/所有者、或有限元素的內(nèi)容,來確定與所選擇的有限元素相關(guān)的其他有限元素,然后非中斷模塊將構(gòu)建新的信息資源,同時(shí)匯編所有相關(guān)的有限元素。圖2A和2B是上文所描述的實(shí)施例的信息管理、檢索和顯示系統(tǒng)的操作的流程圖表示。如功能塊40所示,第一個(gè)步驟是訪問正在檢查的信息資源。如功能塊42中所說明的,下一個(gè)步驟是選擇適當(dāng)?shù)膶<乙?guī)則集,將其應(yīng)用于對(duì)信息資源的搜索。所選擇的特定的規(guī)則集將取決于在步驟40中訪問的信息資源的類型。例如,用于搜索和分析《南極條約》的一組專家規(guī)則將與用于搜索和分析《聯(lián)邦管理法典》的第37卷的一組規(guī)則不同。如功能塊44所示,下一個(gè)步驟是根據(jù)第一組專家系統(tǒng)規(guī)則,將信息資源分為眾多有限元素。正如上文所討論的,此步驟涉及將信息資源分為可標(biāo)識(shí)的信息段,如段落、子節(jié)、頁、章、子章等等。下面的表1提供了將《南極條約》分為眾多有限元素的示例規(guī)則集。如上面的表格所示,采用示例規(guī)則集,以將《南極條約》分為眾多的層次,其中條約的第一層次(該層次涉及《南極條約、約定、協(xié)議及其附件》)由搜索引擎通過標(biāo)識(shí)頁中間的大號(hào)粗體來識(shí)別。第二個(gè)層次(它們是包含在條約內(nèi)的建議和措施)由搜索引擎通過標(biāo)識(shí)羅馬數(shù)字來識(shí)別。利用第三個(gè)層次來將第一層次和第二層次分為較小的有限元素。此第三層次的有限元素由搜索引擎通過標(biāo)識(shí)帶有冒號(hào)的頁中間的中號(hào)字體來識(shí)別。根據(jù)對(duì)本表以及相關(guān)的模式匹配規(guī)則的分析,該表中的其余層次對(duì)現(xiàn)有技術(shù)中的那些普通技術(shù)人員是顯而易見的。相應(yīng)地,上面的規(guī)則集的目的是為匹配模式創(chuàng)建一個(gè)自動(dòng)工具,匹配模式區(qū)分任何類型的信息資源內(nèi)的層次結(jié)構(gòu)、段或元素。根據(jù)用戶定義的針對(duì)信息資源內(nèi)的需要索引和搜索的段或元素的要求,來制定規(guī)則集。在包括已經(jīng)區(qū)分的段或元素(如在單獨(dú)的欄或塊中)的信息資源中,規(guī)則集將大大地簡化,這對(duì)于現(xiàn)有技術(shù)中的那些普通技術(shù)人員是顯而易見的。優(yōu)選的情況下,規(guī)則集由非常熟悉信息資源的專家來設(shè)計(jì),利用反饋循環(huán)反復(fù)地進(jìn)行,關(guān)于這一點(diǎn),將在下文中詳細(xì)描述。如功能塊46所示,下一個(gè)步驟是,根據(jù)第二組專家系統(tǒng)規(guī)則,基于對(duì)有限元素的位置和/或內(nèi)容分析,為各個(gè)有限元素創(chuàng)建分類標(biāo)記。下面的表2提供了為從《南極條約》中提取的有限元素定義分類標(biāo)記的規(guī)則集的示例。如表2所示,分類標(biāo)記將包括一種表示法,指示有限元素在《南極條約》的各種標(biāo)識(shí)的層次內(nèi)的位置。例如,分類標(biāo)記將包括指示在第一層次有限元素是否包含在《南極條約、約定、協(xié)議及其附件》內(nèi)的信息。在第二層次,分類標(biāo)記將指出有限元素是否包含在《建議、措施》中。如該表的最底部所示,每個(gè)有限元素的分類標(biāo)記還將包括內(nèi)容基表示法,指出創(chuàng)建特定的節(jié)或有限元素的年份。當(dāng)然,分類標(biāo)記中所包括的位置和/或內(nèi)容基表示法的類型和變體幾乎是無限的。例如,可以配置規(guī)則集,以分析有限元素的內(nèi)容,以便提供分類詞或短語,這些分類詞或短語向用戶提供有關(guān)有限元素的內(nèi)容的提示。同樣,不是利用單詞或短語,規(guī)則集可以分析有限元素的內(nèi)容或位置,以提供有限元素的分類引用號(hào)碼,如Dewey十進(jìn)制類型號(hào)碼。如功能步驟48所示,下一個(gè)步驟是將在上面的步驟46中創(chuàng)建的分類標(biāo)記插入到在步驟44中創(chuàng)建的有限元素中。如功能塊50所示,下一個(gè)步驟是,為各個(gè)有限元素產(chǎn)生可搜索的數(shù)據(jù)庫記錄。每個(gè)數(shù)據(jù)庫記錄都優(yōu)選地包含有限元素內(nèi)所包含的非共用字符串(例如單詞、短語、符號(hào))以及它們的頻率(即權(quán)重)。此外,每個(gè)數(shù)據(jù)庫記錄將包括對(duì)應(yīng)的有限元素的地址、位置或指向它的鏈接。如功能塊52所示,下一個(gè)步驟是,輸入搜索字符串,如單詞、短語或符號(hào),并選擇顯示層次結(jié)構(gòu)。如功能塊54所示,下一個(gè)步驟是,搜索在功能塊50中創(chuàng)建的數(shù)據(jù)庫記錄,以查找搜索字符串和數(shù)據(jù)庫記錄的非共用字符串之間的匹配。此搜索步驟將標(biāo)識(shí)具有與搜索字符串匹配的非共用字符串的相關(guān)數(shù)據(jù)庫記錄。如功能塊56所示,將對(duì)在搜索步驟54中查找到的相關(guān)數(shù)據(jù)庫記錄進(jìn)行排序,方法是,將相關(guān)的數(shù)據(jù)庫記錄的關(guān)聯(lián)的有限元素的每個(gè)分類標(biāo)記中的信息應(yīng)用到所選擇的顯示層次結(jié)構(gòu),和/或?qū)⑾嚓P(guān)的數(shù)據(jù)庫記錄中的匹配搜索字符串的權(quán)重應(yīng)用到所選擇的顯示層次結(jié)構(gòu)。例如,《南極條約》的顯示層次結(jié)構(gòu)的第一層次可能是創(chuàng)建有限元素的年份;第二層次可能根據(jù)《南極條約》的條款的順序進(jìn)行排序;顯示層次結(jié)構(gòu)的第三層次可能根據(jù)數(shù)據(jù)庫記錄內(nèi)包含的匹配字符串的權(quán)重進(jìn)行排序。如功能塊58所示,下一個(gè)步驟是,在顯示屏幕上以可折疊的/可展開的層次結(jié)構(gòu)顯示搜索結(jié)果。如功能塊60所示,用戶將確定搜索結(jié)果是否令人滿意,如果不令人滿意,過程將進(jìn)入到功能塊62,此處用戶將修改一個(gè)或多個(gè)規(guī)則集,并取決于修改了哪些規(guī)則集,返回到功能塊44或功能塊52。如果在功能塊60中搜索結(jié)果令人滿意,過程將進(jìn)入功能塊64,此處用戶將從搜索結(jié)果顯示中選擇其中一個(gè)有限元素。然后在功能塊66中,所選擇的有限元素的分類標(biāo)記將用來標(biāo)識(shí)其他有限元素,這些有限元素將與所選擇的有限元素組合在一起,以創(chuàng)建要顯示的信息資源的連續(xù)部分。最后,在功能塊68中,信息資源的連續(xù)部分將顯示在顯示屏中或打印出來??梢韵胂?,熟悉信息資源的專家將基于他或她對(duì)信息資源的了解來制定規(guī)則集。此后,一旦規(guī)則集完全制定出來,上面所描述的流程圖的反饋部分將不再需要。此外,一旦規(guī)則集完全制定出來,可以將搜索模塊、非中斷模塊和制定完全的規(guī)則集合并到數(shù)據(jù)存儲(chǔ)設(shè)備(如CDROM、磁盤驅(qū)動(dòng)器、軟盤等等)中,還包括預(yù)先分為眾多有限元素的信息資源(其中每個(gè)有限元素包括以前創(chuàng)建的對(duì)應(yīng)的分類標(biāo)記),還包括預(yù)先創(chuàng)建的眾多有限元素的可搜索數(shù)據(jù)庫。因此,此類存儲(chǔ)設(shè)備將提供可搜索的文檔,該文檔包括信息資源的全部內(nèi)容,以及已經(jīng)由專家使用其信息資源的知識(shí)進(jìn)行微調(diào)的搜索引擎,這樣,CDROM(或其他類型的存儲(chǔ)設(shè)備)的最終用戶將能夠利用專家的知識(shí)和經(jīng)驗(yàn)來搜索所包含的信息資源。如圖3所示,提供了駐留在數(shù)據(jù)存儲(chǔ)設(shè)備(如CDROM)中的本發(fā)明的實(shí)施例的流程圖表示。此實(shí)施例相當(dāng)于上文圖2A和2B所描述的實(shí)施例,只不過不再需要制定規(guī)則集。如功能塊52'所示,第一個(gè)步驟是最終用戶輸入搜索字符串,并選擇顯示層次結(jié)構(gòu)。在功能塊54'中,下一個(gè)步驟是搜索模塊搜索包含在CDROM或從CDROM中下載的數(shù)據(jù)庫記錄,以將搜索字符串與可搜索數(shù)據(jù)庫記錄中包含的非共用字符串匹配。如功能塊56'所示,下一個(gè)步驟是,搜索模塊對(duì)搜索結(jié)果進(jìn)行排序,方法是,向如上文所討論的所選擇的顯示層次結(jié)構(gòu)應(yīng)用匹配有限元素(它們包含在CDROM或從CDROM中下載)的分類標(biāo)記中的信息和/或應(yīng)用匹配字符串的權(quán)重。如功能塊58'所示,下一個(gè)步驟是優(yōu)選地以可折疊的/可展開的層次結(jié)構(gòu)顯示搜索結(jié)果。如功能塊60'所示,最終用戶在查看搜索結(jié)果時(shí)將確定結(jié)果是否令人滿意。如果不令人滿意,過程將返回到功能塊52',在此最終用戶將輸入新搜索字符串和/或?qū)⑦x擇新的顯示層次結(jié)構(gòu)。如果步驟58'的顯示結(jié)果令人滿意,過程將進(jìn)入功能塊64',在此最終用戶將從搜索結(jié)果顯示中選擇一個(gè)有限元素。進(jìn)入功能塊66'后,非中斷模塊將重新構(gòu)建信息資源的部分,該部分包括所選擇的有限元素,其方法是,訪問所選擇的有限元素和CDROM中的其他周圍的或相關(guān)的有限元素,以創(chuàng)建包含該有限元素的信息資源的連續(xù)部分。在本發(fā)明的另一個(gè)實(shí)施例中,可以特別配置信息管理、檢索和顯示系統(tǒng),以搜索駐留在因特網(wǎng)上的許多單個(gè)Web頁,基于用戶選擇的顯示條件或?qū)哟谓Y(jié)構(gòu),以可折疊的/可展開的格式顯示搜索的結(jié)果。在這樣的實(shí)施例中,可能不需要上文所描述的形式的中斷模塊,因?yàn)槊總€(gè)Web頁可能已經(jīng)被認(rèn)為是“有限元素”,且搜索引擎將無法修改Web頁。因此,對(duì)于這樣的實(shí)施例,搜索引擎也將無法把分類標(biāo)記插入到有限元素中。因此,在此實(shí)施例中,可以將分類標(biāo)記與有限元素分開存儲(chǔ)或直接合并到數(shù)據(jù)庫記錄中。此外,可以想象,Web頁的創(chuàng)建者可能希望為他們的Web頁創(chuàng)建他們自己的分類標(biāo)記,而不是讓搜索引擎為他們創(chuàng)建。有了這一功能,Web頁設(shè)計(jì)人員就可以影響搜索結(jié)果,以便獲得對(duì)他或她的Web站點(diǎn)的更準(zhǔn)確描述。當(dāng)然,這樣的功能也可以由Web設(shè)計(jì)人員以虛假的方式使用,在這種情況下,當(dāng)搜索者在查找完全不同類型的信息時(shí),分類標(biāo)記將使Web頁列在搜索結(jié)果中。由于認(rèn)識(shí)到這一潛在的問題,索引模塊將包括一個(gè)選項(xiàng),它將把Web頁的實(shí)際內(nèi)容與Web頁設(shè)計(jì)人員插入的嵌入式分類標(biāo)記進(jìn)行比較,如果兩者之間存在顯著的差異,它就會(huì)創(chuàng)建新的分類標(biāo)記,以插入到數(shù)據(jù)庫記錄中。同樣,還可以對(duì)搜索引擎進(jìn)行配置,以包括一個(gè)可選的過濾器,該過濾器將根據(jù)嵌入的分類標(biāo)記的指示或者通過檢查Web頁內(nèi)容本身,過濾掉具有令人討厭的內(nèi)容的Web站點(diǎn)。如圖4所示,在本發(fā)明的實(shí)施例中,信息管理、檢索和顯示系統(tǒng)包括兩個(gè)主要模塊,索引模塊70和搜索模塊72。這些處理模塊中的每個(gè)模塊優(yōu)選情況下都是專家引擎,它們根據(jù)一組專家規(guī)則來運(yùn)行,這些規(guī)則定義單個(gè)模塊的運(yùn)行。索引模塊70將定期利用常規(guī)的Web爬行遍歷或Web搜索技術(shù)(如“蜘蛛”技術(shù),該技術(shù)用來檢查因特網(wǎng)上提供的每個(gè)Web頁,或盡可能多地檢查Web頁)爬行遍歷Web頁74的卷。如圖4所示,一些Web頁可能包括預(yù)先定義的、所包括的嵌入分類標(biāo)記76。如上文所討論的,這樣的嵌入標(biāo)記76將由Web頁設(shè)計(jì)人員插入到Web頁中,這樣圖4的搜索引擎將利用此預(yù)先定義的嵌入分類標(biāo)記,而不是單獨(dú)創(chuàng)建分類標(biāo)記。在此實(shí)施例中定義分類標(biāo)記的專家規(guī)則集的規(guī)則示例是,標(biāo)識(shí)在訪問Web站點(diǎn)時(shí)在初始屏幕上出現(xiàn)的最突出的單詞或短語。索引模塊70還將創(chuàng)建可搜索的數(shù)據(jù)庫78,包括上面所訪問的每個(gè)Web頁的數(shù)據(jù)庫記錄80a-80z。此可搜索的數(shù)據(jù)庫78是一種反向索引,或者每個(gè)記錄80a-80z包括指向?qū)?yīng)的Web頁的鏈接,包含在Web頁內(nèi)的所有單詞(最好排除共用單詞)以及它們?cè)赪eb頁內(nèi)出現(xiàn)的頻率,以及上文所描述的特定的Web頁內(nèi)所包括的索引模塊所創(chuàng)建的分類標(biāo)記或分類標(biāo)記的副本??梢韵胂?,索引模塊將不斷地反復(fù)訪問Web頁74并更新可搜索的數(shù)據(jù)庫78,因?yàn)閃eb頁的內(nèi)容也不斷地更新或更改。當(dāng)用戶希望使用搜索引擎進(jìn)行搜索時(shí),用戶將輸入搜索查詢82,并選擇可選的層次結(jié)構(gòu)選擇84。搜索查詢可以是現(xiàn)有技術(shù)中那些普通技術(shù)人員可用的任何常規(guī)搜索查詢,它可能包括搜索字或短語和/或?qū)卧~連接起來的運(yùn)算符。層次結(jié)構(gòu)選擇通知搜索模塊有關(guān)用戶希望看到的顯示結(jié)果所采用的顯示格式的類型。具體來講,層次結(jié)構(gòu)選擇將通知搜索模塊,搜索結(jié)果是否完全根據(jù)分類標(biāo)記內(nèi)包含的信息按某種順序或結(jié)構(gòu)來顯示(以研究為中心),搜索結(jié)果是否完全取決于關(guān)鍵字或短語在有限元素中出現(xiàn)的頻率按某種順序來顯示(常規(guī)),或者搜索結(jié)果是否根據(jù)兩種情況的組合按某種順序或結(jié)構(gòu)來顯示(以文檔為中心)。搜索模塊72將利用搜索查詢82,來搜索數(shù)據(jù)庫記錄80a-80z,以便查找與搜索查詢中的單詞或短語匹配的數(shù)據(jù)庫記錄86。然后,取決于所選擇的層次結(jié)構(gòu)84,基于與搜索查詢匹配的數(shù)據(jù)庫記錄87內(nèi)所包括的分類標(biāo)記89中的信息,搜索模塊將按順序或以可折疊的/可展開的樹形結(jié)構(gòu)顯示搜索結(jié)果88。從顯示屏幕88中,用戶將對(duì)指向他或她希望查看的Web頁的鏈接進(jìn)行選擇90,然后搜索模塊將在顯示屏幕上顯示W(wǎng)eb頁92。圖5A和5B提供上面的圖4所描述的實(shí)施例的操作的流程圖表示。如功能塊94所示,第一個(gè)步驟是訪問因特網(wǎng)上的Web頁。在功能塊96中,下一個(gè)步驟是確定所訪問的Web頁是否包括嵌入分類標(biāo)記。如果Web頁包括嵌入分類標(biāo)記,過程將進(jìn)入功能塊98,在此該過程將確定嵌入的分類標(biāo)記是否與Web頁的內(nèi)容相一致。如果Web頁不包括嵌入分類標(biāo)記或者如果分類標(biāo)記與Web頁的內(nèi)容不一致,那么過程將進(jìn)入功能塊100,在此將為Web頁創(chuàng)建分類標(biāo)記。如果在步驟98中嵌入分類標(biāo)記與Web頁的內(nèi)容相一致,或者在步驟100中為Web頁創(chuàng)建分類標(biāo)記,那么過程將進(jìn)入功能塊102,在此將為Web頁產(chǎn)生可搜索的數(shù)據(jù)庫記錄。此可搜索的數(shù)據(jù)庫記錄將包括Web頁內(nèi)包含的非共用詞或短語以及它們的頻率(即權(quán)重),指向Web頁的鏈接,嵌入在Web頁內(nèi)的或在上面的步驟100中創(chuàng)建的分類標(biāo)記。然后,過程將進(jìn)入功能塊104,以確定是否要訪問下一個(gè)Web頁。如果如此,過程將返回到功能塊94。如果可搜索數(shù)據(jù)庫是完整的,那么過程將進(jìn)入功能塊106,在此用戶將在所選擇的顯示層次結(jié)構(gòu)中輸入搜索字或短語。進(jìn)入功能塊108后,搜索引擎將搜索數(shù)據(jù)庫記錄,以查找搜索字或短語和數(shù)據(jù)庫記錄內(nèi)包含的非共用詞或短語之間的匹配。進(jìn)入功能塊110后,搜索引擎將對(duì)搜索結(jié)果進(jìn)行排序,方法是,通過將匹配數(shù)據(jù)庫記錄的分類標(biāo)記中的信息應(yīng)用到所選擇的顯示層次結(jié)構(gòu),和/或?qū)⒚總€(gè)匹配數(shù)據(jù)庫記錄中的搜索字或短語的權(quán)重應(yīng)用到所選擇的顯示層次結(jié)構(gòu)。進(jìn)入功能塊112后,下一步將涉及在顯示屏幕上顯示搜索結(jié)果。在功能塊114中,如果搜索結(jié)果令人滿意,用戶將選擇顯示屏幕上的Web頁鏈接,搜索引擎將顯示所選擇的關(guān)聯(lián)的Web頁。如果搜索結(jié)果不令人滿意,過程將進(jìn)入功能塊118,在此用戶將輸入新的搜索字或短語和/或選擇新的顯示層次結(jié)構(gòu),該過程將返回到功能塊108,以便可以執(zhí)行另一個(gè)搜索。在本實(shí)施例中,創(chuàng)建分類標(biāo)記、數(shù)據(jù)庫記錄的專家規(guī)則集可以由專家利用上面的過程的反復(fù)的變體針對(duì)因特網(wǎng)的有限的部分(類似于上面的圖2A和2B中所描述的部分)來進(jìn)行定義。一旦精煉了規(guī)則集,則可以將規(guī)則集應(yīng)用到整個(gè)因特網(wǎng)。上面所描述的搜索引擎可以在Web站點(diǎn)上運(yùn)行或者包含在存儲(chǔ)設(shè)備(例如CDROM)中,其上的內(nèi)容可以下載到可以訪問因特網(wǎng)的計(jì)算機(jī)中。下面的附錄提供了示例代碼段,用于將《南極條約》分為眾多有限元素,以及用于為有限元素創(chuàng)建分類標(biāo)記。附錄ATable1<prelisting-type="program-listing"><![CDATA[1)$line=~m/<FONTFACE=\″Helvetica.Arial″SIZE=\d>((\d)\.(\d\d|\d)?\?(\d\d|\d)\.?(d\d|\d)?)([a-zA-z\-\_\s]+)2)$line=~m/<PALIGN=\″CENTER\″>(([IXVLDCM]+)\-([^<]+?))<VP>/3)$line=~m/<PALIGN=\″CENTER\″>(Extract(s)?\s+from\s+Report\s+of\s+([IXVLDCM]+)(th|st)\s+ATCM[^<]*)/i4)SimplevariablesubstitutionàààAHashtableisgeneratedusingthecode######################################################################################################################SUBgen_hashes# #PurposeTogenerateatablesbasedonasetpatternfroman #filesrelatedtotheAntarcticTreatyProject. ##################################################################################################################### subgen_hashes { my$FileList=@_; print″FileList$FileList<br>\n″; print″GeneratingYear-RomanNumeralandYear-MajorDocumentNameHashes.\n\n″; print″Processing″; while($InputFN=glob(″$FileList″)) { open(InFile,″<$InputFN″)||die(″Cannotopen$InputFN\n$!″) print″.″; while(defined($line=<InFile>)) { chomp($line); #Removeunwantedcharactersfromtheline $line=rem_all($line); #print$line; #BeginMatching#Attempttograbthelastfordigitsofaline.iftheyareontheline if($line=~m/^(\w+\w+\w+\w+|\w+\w+\w+).?(\w+|\w+\w+|\w+\w+\w+).??(\d|\d\d)(\w+)?-(\d|\d\d)(\w+)?\w+(\d\d\d\d)/) { #DebuggingCode #print″$1$2$3$4$5$6$7$8$9$10\n″; $MajorDoc=$1; $year=$7; if(″$year″ne″″) { if(defined($NextLine=<InFile>)) { #Removeunwantedcharactersfromtheline $NextLine=rem_all($NextLine); #MatchtheRomanNumeralsatthebeginningofthe #nextline if($NextLine=~m/^([IVXLCDM]+)/) { $RomanNumeral=$1; SYearTrans{$RomanNumeral}=$year; $DocTrans{$year}=$MajorDoc; } } } } } closeInFile; } print″\n″; } Then,whentheDeweytagiswrittenout,theATCMisplacedintheappropriateposition.whetheritbethefirst,second,orthirdlevelusingtheYearfromthecurrentlymatchedpatterntoobtainthecorrectATCMfromthehashtable(DocTranstablespecifically)asgeneratedabove5)SimplevariablesubstitutionàààAHashtableisgeneratedusingthecode########################################################################################### #SUBgenhashes # #PurposeTogenerateatablesbasedonasetpatternfroman #filesrelatedtotheAntarcticTreatyProject ########################################################################################### subgen_hashes { my$FileList=@_; print″FileList$FileList<br>\n″; print″GeneratingYear-RomanNumeralandYear-MajorDocumentNameHashes.\n\n″; print″Processing″; while($InputFN=glob(″$FileList″)) { open(InFile,″<$InputFN″)||die(″Cannotopen$InputFN\n$!″); print″.″; while(defined($line=<InFile>)) { chomp($line); #Removeunwantedcharactersfromtheline $line=rem_all($line); #print$line; #BeginMatching #Attempttograbthelastfordigitsofaline,iftheyareontheline if($line=~m/^(\w+\w+\w+\w+|\w+\w+\w+),?(\w+|\w+\w+|\w+\w+\w+),??(\d|\d\d)(\w+)?-(\d|\d\d)(\w+)?\w+(\d\d\d\d)/) { #DebuggingCode #print″$1$2$3$4$5$6$7$8$9$10\n″; $MajorDoc=$1; $year=$7; if(″$year″ne″″) {if(defined($NextLine=<InFile>)) } #Removeunwantedcharactersfromtheline SNextLine=rem_all($NextLine); #MatchtheRomanNumeralsatthebeginningofthe #nextline if($NextLine=~m/^([IVXLCDM]+)/) { $RomanNumeral=$1; $YearTrans{$RomanNumeral}=$year; $DocTrans{$year}=$MajorDoc; } } } } } closeInFile; } print″\n″; } Then,whentheDeweytagiswrittenout,theYearisplacedintheappropriateposition,whetheritbethefirst,second,orthirdlevelusingtheRomanNumeralfromthecurrentlymatchedpatterntoobtainthecorrectYearfromthehashtable(YearTranstablespecifically)asgeneratedaboveTable2‘1)<metaname=″Dewey″content=″SeventeenthAntarcticConsultativeMeeting%%====%%%%====%%%%====%%%%====%%ArticleXII″>2)<metaname=″Dewey″content=″CONSERVATIONOFANTARCTICMARINELIVINGRESOURCES%%====%%ConventionontheConservationofAntarctic%%====%%%%====%%%%====%%1981ArticleVIRelationshiptoexistingconventionsrelatingtotheconservationofwhalesandseals″>3)<metaname=″Dewey″content=″ResolutionsandMeasuresadoptedattheXIXthAntarcticTreatyConsultativeMeeting%%====%%AnnexC%%====%%Resolutions%%====%%%%====%%Resolution8″>4)<metaname=″Dewey″content=″SeventeenthAntarcticConsultativeMeeting%%====%%%%====%%%%====%%%%====%%ArticleXII″>5)<metaname=″Dewey″content=″1980%%====%%ConventionontheConservationofAntarctic%%====%%%%====%%%%====%%1980Article]]></pre>盡管這里所描述的系統(tǒng)和方法構(gòu)成了本發(fā)明的優(yōu)選實(shí)施例,但要理解,本發(fā)明不局限于這些準(zhǔn)確的形式,也可以在不超過本發(fā)明的范圍的情況下作出更改。權(quán)利要求1.檢索信息資源上的信息的方法,包括下列步驟(a)將信息資源分為眾多有限元素;(b)將分類標(biāo)記分配到每個(gè)有限元素,分類標(biāo)記包括有關(guān)有限元素的內(nèi)容的數(shù)據(jù);(c)為各個(gè)有限元素生成可搜索的數(shù)據(jù)庫記錄,每個(gè)可搜索的數(shù)據(jù)庫記錄至少包含有限元素內(nèi)的一個(gè)字符串;(d)提供搜索字符串;(e)搜索可搜索的數(shù)據(jù)庫,以查找包含搜索字符串的可搜索的數(shù)據(jù)庫記錄,從而提供搜索結(jié)果;(f)根據(jù)分配到有限元素(它們與在搜索步驟中查找到的可搜索的數(shù)據(jù)庫記錄相對(duì)應(yīng))的分類標(biāo)記中的信息,按層次結(jié)構(gòu)排列搜索步驟的結(jié)果;(g)以層次結(jié)構(gòu)顯示搜索步驟的結(jié)果。2.根據(jù)權(quán)利要求1的方法,其特征在于,信息資源是單個(gè)文檔,將信息資源分為眾多有限元素的步驟包括標(biāo)識(shí)單個(gè)文檔中的眾多節(jié)的步驟,其中每個(gè)有限元素都是眾多節(jié)中的其中一節(jié)。3.根據(jù)權(quán)利要求1的方法,其特征在于,信息資源是多個(gè)文檔,將信息資源分為眾多有限元素的步驟包括標(biāo)識(shí)眾多文檔的步驟,其中每個(gè)有限元素都是眾多文檔中的其中一個(gè)文檔。4.根據(jù)權(quán)利要求1的方法,其特征在于,信息資源是多個(gè)文檔,將信息資源分為眾多有限元素的步驟包括標(biāo)識(shí)眾多文檔和標(biāo)識(shí)眾多文檔內(nèi)的節(jié)的步驟,其中每個(gè)有限元素都是標(biāo)識(shí)的節(jié)。5.根據(jù)權(quán)利要求4的方法,其特征在于,標(biāo)識(shí)的節(jié)是眾多文檔中的整個(gè)文檔。6.根據(jù)權(quán)利要求1的方法,其特征在于,信息資源是數(shù)據(jù)流,將信息資源分為眾多有限元素的步驟包括標(biāo)識(shí)數(shù)據(jù)流內(nèi)的段的步驟。7.根據(jù)權(quán)利要求1的方法,其特征在于,將信息資源分為眾多有限元素的步驟由專家系統(tǒng)根據(jù)規(guī)則集來執(zhí)行。8.權(quán)利要求7的方法,進(jìn)一步包括下列步驟如果在顯示步驟(g)中最終用戶查看到不令人滿意的結(jié)果,則對(duì)規(guī)則集進(jìn)行修改,然后使用修改后的規(guī)則集重復(fù)步驟(a)到(g)。9.根據(jù)權(quán)利要求1的方法,其特征在于,將分類標(biāo)記分配到各個(gè)有限元素的步驟由專家系統(tǒng)根據(jù)規(guī)則集來執(zhí)行。10.權(quán)利要求9的方法,進(jìn)一步包括下列步驟如果在顯示步驟(g)中最終用戶查看到不令人滿意的結(jié)果,則對(duì)規(guī)則集進(jìn)行修改,然后使用修改后的規(guī)則集重復(fù)步驟(a)到(g)。11.根據(jù)權(quán)利要求1的方法,其特征在于,分類標(biāo)記包括關(guān)于有限元素相對(duì)于信息資源的組織屬性的數(shù)據(jù)。12.根據(jù)權(quán)利要求1的方法,其特征在于,分類標(biāo)記包括關(guān)于有限元素的位置的數(shù)據(jù)。13.根據(jù)權(quán)利要求1的方法,其特征在于,分類標(biāo)記包括關(guān)于有限元素的內(nèi)容的分類短語。14.根據(jù)權(quán)利要求1的方法,其特征在于,分類標(biāo)記包括關(guān)于有限元素的內(nèi)容的分類號(hào)碼。15.根據(jù)權(quán)利要求14的方法,其特征在于,分類號(hào)碼是基于Dewey十進(jìn)制的號(hào)碼。16.根據(jù)權(quán)利要求1的方法,其特征在于,將信息資源分為眾多有限元素的步驟包括標(biāo)識(shí)和區(qū)分信息資源內(nèi)的標(biāo)題與子標(biāo)題的步驟。17.根據(jù)權(quán)利要求1的方法,其特征在于,每個(gè)數(shù)據(jù)庫記錄進(jìn)一步包括對(duì)應(yīng)的有限元素的地址或指向它的鏈接。18.根據(jù)權(quán)利要求1的方法,其特征在于,數(shù)據(jù)庫記錄包括有限元素內(nèi)包含的非共用字符串。19.根據(jù)權(quán)利要求18的方法,其特征在于信息資源至少是一個(gè)文檔;數(shù)據(jù)庫記錄包括有限元素內(nèi)包含的非共用字;并且提供搜索字符串的步驟涉及至少分配一個(gè)搜索字的步驟。20.根據(jù)權(quán)利要求19的方法,其特征在于,每個(gè)數(shù)據(jù)庫記錄進(jìn)一步包括關(guān)于對(duì)應(yīng)的有限元素內(nèi)包含的非共用單詞的頻率的單詞頻率數(shù)據(jù)。21.根據(jù)權(quán)利要求20的方法,其特征在于,層次結(jié)構(gòu)是可折疊的/可展開的層次結(jié)構(gòu),至少有兩個(gè)層次,排序步驟(f)涉及根據(jù)第一層對(duì)搜索步驟的結(jié)果進(jìn)行排序,然后根據(jù)下一個(gè)層次對(duì)搜索步驟的結(jié)果進(jìn)一步進(jìn)行排序。22.根據(jù)權(quán)利要求21的方法,其特征在于,層次結(jié)構(gòu)的至少一個(gè)層次的排序基礎(chǔ)是,分配到有限元素的分類標(biāo)記中包括的數(shù)據(jù),有限元素與在搜索步驟(e)中查找到的數(shù)據(jù)庫記錄相關(guān)聯(lián)。23.根據(jù)權(quán)利要求22的方法,其特征在于,層次結(jié)構(gòu)中的兩個(gè)層次中的另一個(gè)層次根據(jù)在搜索步驟(e)中查找到的數(shù)據(jù)庫記錄的單詞頻率數(shù)據(jù)來進(jìn)行排序。24.根據(jù)權(quán)利要求1的方法,其特征在于,層次結(jié)構(gòu)是可折疊的/可展開的層次結(jié)構(gòu),至少有兩個(gè)層次,排列步驟(f)涉及根據(jù)第一個(gè)層次對(duì)搜索步驟的結(jié)果進(jìn)行排序,然后進(jìn)一步根據(jù)下一個(gè)層次對(duì)搜索步驟的結(jié)果進(jìn)行排序的步驟。25.根據(jù)權(quán)利要求24的方法,其特征在于,層次結(jié)構(gòu)中的至少一個(gè)層次的排序基礎(chǔ)是,分配到有限元素的分類標(biāo)記中包括的數(shù)據(jù),有限元素與在搜索步驟(e)中查找到的數(shù)據(jù)庫記錄相關(guān)聯(lián)。26.根據(jù)權(quán)利要求1的方法,其特征在于信息資源包括文檔;將信息資源分為眾多有限元素的步驟包括標(biāo)識(shí)文檔中的眾多節(jié)的步驟,每個(gè)有限元素都是眾多節(jié)中的其中一節(jié),分類標(biāo)記包括關(guān)于有限元素相對(duì)于文檔中的其他有限元素的位置的信息;以及根據(jù)分配到有限元素(它們與在搜索步驟中查找到的可搜索的數(shù)據(jù)庫記錄相對(duì)應(yīng))的分類標(biāo)記中的信息,按層次結(jié)構(gòu)排列搜索步驟的結(jié)果的步驟,包括按照有限元素在文檔中出現(xiàn)的順序來排列有限元素的步驟。27.根據(jù)權(quán)利要求1的方法,其特征在于,顯示步驟包括在計(jì)算機(jī)屏幕上顯示有限元素名稱的步驟,有限元素與在搜索步驟中查找到的可搜索的數(shù)據(jù)庫記錄對(duì)應(yīng),該方法進(jìn)一步包括下列步驟選擇其中一個(gè)顯示名稱;訪問與所選擇的名稱對(duì)應(yīng)的有限元素;在被訪問的有限元素的周圍重新構(gòu)建信息資源的連續(xù)部分。28.根據(jù)權(quán)利要求27的方法,其特征在于,重新構(gòu)建步驟包括下列步驟檢查分配到被訪問的有限元素的分類標(biāo)記,以查找被訪問的有限元素相對(duì)于信息資源的位置的數(shù)據(jù);基于與被訪問的有限元素的位置對(duì)應(yīng)的數(shù)據(jù),確定要重新構(gòu)建的信息資源的連續(xù)部分;檢索屬于信息資源的連續(xù)部分的其他有限元素。29.根據(jù)權(quán)利要求28的方法,其特征在于,檢索步驟涉及檢查分配到其他有限元素的分類標(biāo)記的步驟,以確定其他有限元素是否屬于信息資源的連續(xù)部分。30.根據(jù)權(quán)利要求29的方法,其特征在于,重新構(gòu)建步驟進(jìn)一步包括,基于被訪問的和檢索到的有限元素的每個(gè)分類標(biāo)記中包含的排序和位置數(shù)據(jù),將被訪問有限元素和檢索到的有限元素匯編在一起的步驟。31.根據(jù)權(quán)利要求27的方法,其特征在于,重新構(gòu)建步驟由專家系統(tǒng)根據(jù)規(guī)則集來執(zhí)行。32.權(quán)利要求31的方法進(jìn)一步包括下列步驟在最終用戶查看重新構(gòu)建的信息資源的連續(xù)部分之后,修改規(guī)則集;使用修改后的規(guī)則集,至少重復(fù)一次重新構(gòu)建步驟。33.根據(jù)權(quán)利要求1的方法,其特征在于,顯示步驟包括在計(jì)算機(jī)屏幕上顯示有限元素名稱的步驟,有限元素與在搜索步驟中查找到的可搜索的數(shù)據(jù)庫記錄對(duì)應(yīng),該方法進(jìn)一步包括下列步驟選擇其中一個(gè)顯示名稱;訪問與所選擇的名稱對(duì)應(yīng)的有限元素;使用被訪問的有限元素和其他相關(guān)的有限元素,構(gòu)建新的信息資源供查看。34.根據(jù)權(quán)利要求33的方法,其特征在于,其他相關(guān)的有限元素基于被訪問的有限元素的分類標(biāo)記內(nèi)包含的信息來確定。35.根據(jù)權(quán)利要求33的方法,其特征在于,其他相關(guān)的有限元素是與在搜索步驟中查找到的數(shù)據(jù)庫記錄對(duì)應(yīng)的有限元素。36.根據(jù)權(quán)利要求35的方法,其特征在于,構(gòu)建新信息資源的步驟包括,根據(jù)其他相關(guān)有限元素和被訪問的有限元素內(nèi)包含的信息,對(duì)其他相關(guān)有限元素和被訪問的有限元素進(jìn)行排序的步驟。37.根據(jù)權(quán)利要求1的方法,其特征在于,步驟(b)包括將每個(gè)分類標(biāo)記插入到相應(yīng)的其中一個(gè)有限元素中的步驟。38.根據(jù)權(quán)利要求1的方法,其特征在于,步驟(c)包括將各個(gè)分類標(biāo)記插入到與相應(yīng)的其中一個(gè)有限元素對(duì)應(yīng)的數(shù)據(jù)庫記錄中的步驟。39.根據(jù)權(quán)利要求1的方法,其特征在于,提供步驟(d)包括下列步驟提供初始搜索字符串;以及至少創(chuàng)建一個(gè)其他搜索字符串,該字符串具有與初始搜索字符串極其相似的意思或效果。40.根據(jù)權(quán)利要求39的方法,其特征在于,初始搜索字符串是第一種語言的單詞,至少有一個(gè)其他搜索字符串是第二種語言的單詞。41.根據(jù)權(quán)利要求39的方法,其特征在于,初始搜索字符串是具有第一個(gè)意思的單詞,至少一個(gè)其他搜索字符串是具有與第一個(gè)意思相似的第二個(gè)意思的另一個(gè)單詞。42.根據(jù)權(quán)利要求39的方法,其特征在于,至少一個(gè)其他搜索字符串基于初始搜索字符串的已知滲透。43.從信息資源中檢索信息的方法包括下列步驟將信息資源分為眾多有限元素;為各個(gè)有限元素創(chuàng)建分類標(biāo)記;為各個(gè)有限元素生成可搜索的數(shù)據(jù)庫,該數(shù)據(jù)庫包括可搜索的數(shù)據(jù)庫記錄;搜索可搜索的數(shù)據(jù)庫,以查找相關(guān)的數(shù)據(jù)庫記錄;將相關(guān)的數(shù)據(jù)庫記錄與對(duì)應(yīng)的相關(guān)有限元素關(guān)聯(lián);選擇層次結(jié)構(gòu),用于顯示關(guān)于相關(guān)有限元素的標(biāo)識(shí)短語;根據(jù)(至少部分地)為各個(gè)有限元素創(chuàng)建的分類標(biāo)記,在層次結(jié)構(gòu)中對(duì)相關(guān)有限元素進(jìn)行排序;根據(jù)排序步驟中的結(jié)果,顯示關(guān)于相關(guān)有限元素的標(biāo)識(shí)短語。44.根據(jù)權(quán)利要求43的方法,其特征在于,信息資源是文檔,可選層次結(jié)構(gòu)包括基于有限元素在文檔中出現(xiàn)的順序的層次結(jié)構(gòu)。45.根據(jù)權(quán)利要求43的方法,其特征在于,可選的層次結(jié)構(gòu)包括基于分類系統(tǒng)的層次結(jié)構(gòu)。46.根據(jù)權(quán)利要求45的方法,其特征在于,分類系統(tǒng)是Dewey十進(jìn)制系統(tǒng)。47.根據(jù)權(quán)利要求43的方法,其特征在于,可選的層次結(jié)構(gòu)包括可折疊的/可展開的層次結(jié)構(gòu),至少具有兩個(gè)層次。48.根據(jù)權(quán)利要求47的方法,其特征在于,可選的層次結(jié)構(gòu)的兩個(gè)層次結(jié)構(gòu)中的至少一個(gè)層次基于為各個(gè)有限元素創(chuàng)建的分類標(biāo)記進(jìn)行排序。49.根據(jù)權(quán)利要求48的方法,其特征在于每個(gè)可搜索的數(shù)據(jù)庫記錄包括關(guān)于某字符串出現(xiàn)在對(duì)應(yīng)的有限元素中的頻率的字符串頻率數(shù)據(jù);以及可選的層次結(jié)構(gòu)的兩個(gè)層次結(jié)構(gòu)中的另一個(gè)層次基于相關(guān)的有限元素的字符串頻率數(shù)據(jù)進(jìn)行排序。50.根據(jù)權(quán)利要求43的方法,其特征在于,分類標(biāo)記至少包括下列信息組中的一個(gè)信息項(xiàng),該信息組包括關(guān)于有限元素的內(nèi)容的內(nèi)容數(shù)據(jù)、關(guān)于有限元素相對(duì)于信息資源的位置的位置數(shù)據(jù)、關(guān)于有限元素在信息資源的組織框架內(nèi)的布局的組織數(shù)據(jù)、作者數(shù)據(jù)、所有者數(shù)據(jù)和時(shí)間數(shù)據(jù)。51.從出現(xiàn)在因特網(wǎng)上的眾多Web頁中檢索Web頁以及查看Web頁的方法包括下列步驟(a)向各個(gè)Web頁分配分類標(biāo)記,分類標(biāo)記包括關(guān)于Web頁的內(nèi)容的數(shù)據(jù);(b)為各個(gè)Web頁產(chǎn)生可搜索的數(shù)據(jù)庫記錄,每個(gè)可搜索的數(shù)據(jù)庫記錄至少包括包含在Web頁內(nèi)的一個(gè)單詞或短語,并包括分配到Web頁的分類標(biāo)記;(c)提供搜索字或短語;(d)搜索可搜索的數(shù)據(jù)庫,以查找包含搜索字或短語的可搜索的數(shù)據(jù)庫記錄;(e)根據(jù)(至少部分地)在搜索步驟中查找到的可搜索的數(shù)據(jù)庫記錄中包括的分類標(biāo)記中的信息,在層次結(jié)構(gòu)中排列搜索步驟的結(jié)果;以及(f)在層次結(jié)構(gòu)中顯示搜索步驟的結(jié)果。52.權(quán)利要求51的方法進(jìn)一步包括下列步驟檢查各個(gè)Web頁,以獲得包含在Web頁內(nèi)的嵌入分類標(biāo)記;以及對(duì)查找Web頁中的嵌入分類標(biāo)記作出反應(yīng),將分類標(biāo)記的副本插入到為Web頁生成的數(shù)據(jù)庫記錄內(nèi)。53.權(quán)利要求52的方法進(jìn)一步包括下列步驟對(duì)查找Web頁中的嵌入分類標(biāo)記作出反應(yīng),檢查Web頁的內(nèi)容,并將包含在分類標(biāo)記內(nèi)的內(nèi)容數(shù)據(jù)與Web頁的內(nèi)容相比較。54.權(quán)利要求53的方法進(jìn)一步包括下列步驟對(duì)確定包含在分類標(biāo)記內(nèi)的內(nèi)容數(shù)據(jù)與Web頁的內(nèi)容不匹配作出反應(yīng),為Web頁生成新的分類標(biāo)記,并將新的分類標(biāo)記插入到為Web頁生成的數(shù)據(jù)庫記錄內(nèi)。55.搜索和檢索部分信息資源的方法包括下列步驟(a)將信息資源分為眾多有限元素,各個(gè)有限元素都是信息資源的可定義的節(jié),每個(gè)可定義的節(jié)都包括眾多單詞;(b)為各個(gè)有限元素生成可搜索的數(shù)據(jù)庫記錄,各可搜索的數(shù)據(jù)庫記錄都至少包括有限元素內(nèi)包含的一個(gè)單詞或短語;(c)提供搜索字或短語;(d)搜索可搜索的數(shù)據(jù)庫,以查找包含搜索字或短語的可搜索的數(shù)據(jù)庫記錄,從而至少產(chǎn)生一個(gè)相關(guān)的數(shù)據(jù)庫記錄;以及(e)顯示相關(guān)的數(shù)據(jù)庫記錄的標(biāo)識(shí)符。56.根據(jù)權(quán)利要求55的方法,其特征在于,信息資源是單個(gè)文檔,將信息資源分為眾多有限元素的步驟包括標(biāo)識(shí)單個(gè)文檔中的眾多節(jié)的步驟,其中每個(gè)有限元素都是眾多節(jié)中的其中一節(jié)。57.根據(jù)權(quán)利要求55的方法,其特征在于,信息資源是多個(gè)文檔,將信息資源分為眾多有限元素的步驟包括標(biāo)識(shí)眾多文檔的步驟,其中每個(gè)有限元素都是眾多文檔中的其中一個(gè)文檔。58.根據(jù)權(quán)利要求55的方法,其特征在于,信息資源是多個(gè)文檔,將信息資源分為眾多有限元素的步驟包括標(biāo)識(shí)眾多文檔和標(biāo)識(shí)眾多文檔內(nèi)的節(jié)的步驟,其中每個(gè)有限元素都是標(biāo)識(shí)的節(jié)。59.根據(jù)權(quán)利要求55的方法,其特征在于,標(biāo)識(shí)的節(jié)是眾多文檔中的整個(gè)文檔。60.根據(jù)權(quán)利要求55的方法,其特征在于,信息資源是動(dòng)態(tài)信息流,將信息資源分為眾多有限元素的步驟包括標(biāo)識(shí)動(dòng)態(tài)信息流內(nèi)的中斷的步驟。61.根據(jù)權(quán)利要求55的方法,其特征在于,將信息資源分為眾多有限元素的步驟由專家系統(tǒng)根據(jù)規(guī)則集來執(zhí)行。62.權(quán)利要求61的方法進(jìn)一步包括下列步驟如果在顯示步驟(e)中最終用戶查看到不令人滿意的結(jié)果,則對(duì)規(guī)則集進(jìn)行修改,然后使用修改后的規(guī)則集重復(fù)步驟(a)到(e)。63.根據(jù)權(quán)利要求55的方法,其特征在于,將信息資源分為眾多有限元素的步驟包括標(biāo)識(shí)和區(qū)分信息資源內(nèi)的標(biāo)題與子標(biāo)題的步驟。64.根據(jù)權(quán)利要求55的方法,其特征在于,顯示步驟包括在計(jì)算機(jī)屏幕上顯示有限元素名稱的步驟,有限元素與在搜索步驟中查找到的可搜索的數(shù)據(jù)庫記錄對(duì)應(yīng),該方法進(jìn)一步包括下列步驟選擇其中一個(gè)顯示名稱;訪問與所選擇的名稱對(duì)應(yīng)的有限元素;在被訪問的有限元素的周圍重新構(gòu)建信息資源的連續(xù)部分。65.根據(jù)權(quán)利要求64的方法,其特征在于,重新構(gòu)建步驟由專家系統(tǒng)根據(jù)規(guī)則集來執(zhí)行。66.權(quán)利要求65的方法進(jìn)一步包括下列步驟在最終用戶查看重新構(gòu)建的信息資源的連續(xù)部分之后,修改規(guī)則集;使用修改后的規(guī)則集,至少重復(fù)一次重新構(gòu)建步驟。67.數(shù)據(jù)存儲(chǔ)設(shè)備,包括分為眾多有限元素的信息資源,每個(gè)有限元素包括分類標(biāo)記和分配的數(shù)據(jù)庫記錄,分類標(biāo)記至少包括下列信息組中的一個(gè)信息項(xiàng),該信息組包括關(guān)于有限元素的內(nèi)容的內(nèi)容數(shù)據(jù)、關(guān)于有限元素相對(duì)于信息資源的位置的位置數(shù)據(jù)、關(guān)于有限元素在信息資源的組織框架內(nèi)的布局的組織數(shù)據(jù)、作者數(shù)據(jù)、所有者數(shù)據(jù)和時(shí)間數(shù)據(jù);以及軟件指令,這些指令經(jīng)過編程,以至少檢索和顯示該信息資源的一部分,可以對(duì)軟件指令進(jìn)行配置,使它們執(zhí)行下列步驟提供搜索查詢,搜索數(shù)據(jù)庫記錄,以查找匹配搜索查詢的相關(guān)數(shù)據(jù)庫記錄;根據(jù)(至少部分地)分配到與相關(guān)的數(shù)據(jù)庫記錄對(duì)應(yīng)的有限元素的分類標(biāo)記中的信息,以層次結(jié)構(gòu)排列搜索步驟的結(jié)果;以及為與層次結(jié)構(gòu)中的相關(guān)數(shù)據(jù)庫記錄對(duì)應(yīng)的有限元素顯示標(biāo)識(shí)短語。全文摘要本系統(tǒng)搜索信息資源,如一個(gè)或多個(gè)文檔(18),或信息流,并以基于用戶選擇的顯示條件或?qū)哟谓Y(jié)構(gòu)(32)的格式顯示搜索結(jié)果。顯示層次結(jié)構(gòu)將使用戶能夠有效地獲得感興趣的內(nèi)容。本系統(tǒng)執(zhí)行一種檢索信息的方法,該方法包括下列步驟:(a)將信息資源分為有限元素;(b)將分類標(biāo)記分配到每個(gè)元素;(c)為各個(gè)元素生成可搜索的數(shù)據(jù)庫記錄(23),其中每個(gè)記錄至少包含元素內(nèi)的一個(gè)字符串;(d)提供搜索字符串;(e)搜索數(shù)據(jù)庫,以查找包含搜索字符串的記錄;(f)根據(jù)(至少部分地)分配到搜索所返回的元素的分類標(biāo)記中的數(shù)據(jù),按層次結(jié)構(gòu)排列結(jié)果;以及(g)以層次結(jié)構(gòu)顯示結(jié)果。文檔編號(hào)G06F17/30GK1363069SQ00809232公開日2002年8月7日申請(qǐng)日期2000年5月17日優(yōu)先權(quán)日1999年5月20日發(fā)明者喬治·梅納德申請(qǐng)人:伊夫色什有限公司