專利名稱:結(jié)構(gòu)化文檔檢索顯示方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及根據(jù)SGML、HTML等而生成的結(jié)構(gòu)化文檔的檢索顯示技術(shù),特別是對(duì)結(jié)構(gòu)化文檔進(jìn)行檢索并對(duì)檢索結(jié)果以高亮度進(jìn)行顯示的結(jié)構(gòu)化文檔檢索顯示方法和裝置。
隨著文字處理器等的普及,所生成的文檔信息的電子化獲得了很大發(fā)展。這些電子化文檔根據(jù)生成的機(jī)器、軟件不同而具有各自的格式,別的機(jī)器或軟件不能利用,或者需要準(zhǔn)備某種變換手段。
作為這種文檔交換用的共同格式,已提出了各種結(jié)構(gòu)化文檔。這些結(jié)構(gòu)化文檔,不僅可以定義作為文檔的基本結(jié)構(gòu)的章、節(jié)、項(xiàng)等層次結(jié)構(gòu),而且可以包含格式信息。
作為結(jié)構(gòu)化文檔的記述語(yǔ)言,現(xiàn)在已標(biāo)準(zhǔn)化了,這就是SGML(Standard Generalized Markup Language)=「標(biāo)準(zhǔn)通用置標(biāo)語(yǔ)言」。
SGML使用通過(guò)把稱為標(biāo)記的特定結(jié)構(gòu)化文檔的結(jié)構(gòu)信息的字符串插入到文本中來(lái)表現(xiàn)文檔的結(jié)構(gòu)的方法。在SGML中,可以根據(jù)DTD(Document Type Definition)=「文檔類型定義」規(guī)定標(biāo)記的名稱、內(nèi)容以及由標(biāo)記所示的文檔結(jié)構(gòu)。
對(duì)于上述SGML、DTD,在「實(shí)踐SGML」(SGML懇談會(huì)實(shí)用化WG監(jiān)譯1992年4月20日財(cái)團(tuán)法人日本規(guī)格協(xié)會(huì)發(fā)行)中已詳細(xì)說(shuō)明。
設(shè)想了將這些結(jié)構(gòu)化文檔登錄到檢索系統(tǒng)的DB中,指定結(jié)構(gòu)名進(jìn)行檢索的情況。想登錄的各文檔的DTD不同時(shí),作為處理方法,提出了對(duì)各文檔分析文檔結(jié)構(gòu),在分析了所指定的結(jié)構(gòu)名與哪一部分相當(dāng)?shù)幕A(chǔ)上,取得檢索對(duì)象的字符串進(jìn)行檢索的方法。
但是,該方法需要很長(zhǎng)的處理時(shí)間。另外,使用對(duì)各結(jié)構(gòu)名用表就各文檔的對(duì)應(yīng)的地方的等方法時(shí),必須全部統(tǒng)一管理在各文檔中出現(xiàn)的結(jié)構(gòu)名,必須對(duì)各結(jié)構(gòu)名登錄各文檔的對(duì)應(yīng)的部分,從而需要龐大的管理表。
此外,即使登錄了不同的DTD混合存在的文檔,也不限于所有的文檔具有檢索對(duì)象的結(jié)構(gòu),另外,例如像「摘要」、「大意」那樣,即使是相同的內(nèi)容也起了不同的結(jié)構(gòu)名時(shí),則必須全部指定這些不同的結(jié)構(gòu)名進(jìn)行檢索,所以,不能認(rèn)為是現(xiàn)實(shí)的結(jié)構(gòu)化文檔的檢索。
因此,在結(jié)構(gòu)化文檔的檢索中,必須運(yùn)用的是只登錄按相同的文檔類型定義生成的文檔。對(duì)于預(yù)先指定的結(jié)構(gòu)名,管理各文檔的對(duì)應(yīng)的部分。
在進(jìn)行檢索時(shí),如果指定了檢索對(duì)象的結(jié)構(gòu)名和檢索條件,在與各文檔的指定的結(jié)構(gòu)對(duì)應(yīng)的部分包含符合檢索條件的字符串時(shí),就判定與檢索條件匹配。
作為結(jié)構(gòu)化文檔的檢索結(jié)果,下面介紹用于顯示文檔的內(nèi)容的功能的的先有技術(shù)。
首先,作為第1先有技術(shù),有特開(kāi)平8-339369「文檔顯示裝置和文檔顯示方法」。
本先有技術(shù),介紹了SGML文檔的結(jié)構(gòu)分析和向結(jié)構(gòu)顯示用的格式的變換以及進(jìn)行指定結(jié)構(gòu)的內(nèi)容的顯示的方法,通過(guò)使用本技術(shù)可以按結(jié)構(gòu)單位顯示結(jié)構(gòu)化文檔。此外,在本先有技術(shù)中,提供了指定結(jié)構(gòu)的高亮度顯示(就是強(qiáng)調(diào)的顯示,改變顏色、字體、字的大小等,附加下劃線)的手段。
但是,這里所說(shuō)的所謂的高亮度顯示手段,就是對(duì)各結(jié)構(gòu)控制顯示方法的手段,按結(jié)構(gòu)單位進(jìn)行有無(wú)顯示、高亮度顯示等的指定。因此,在本先有技術(shù)中,當(dāng)然沒(méi)有給出實(shí)現(xiàn)結(jié)構(gòu)化文檔的檢索結(jié)果的顯示時(shí)所需要的實(shí)現(xiàn)對(duì)已匹配的檢索項(xiàng)的高亮度顯示的方法。
另外,作為第2先有技術(shù),有在特開(kāi)平8-212230「文檔檢索方法和文檔檢索裝置」中給出的對(duì)結(jié)構(gòu)化文檔以外的文檔的檢索結(jié)果的高亮度顯示方法。
但是,本先有技術(shù)只實(shí)現(xiàn)了對(duì)用于進(jìn)行顯示的文本的匹配范圍的取得和高亮度信息的附加,對(duì)于作為結(jié)構(gòu)化文檔的檢索結(jié)果而得到的文檔則不具有附加高亮度信息的功能。
只將上述2個(gè)先有技術(shù)組合,對(duì)于作為對(duì)結(jié)構(gòu)化文檔的檢索結(jié)果而輸出的文檔不能實(shí)現(xiàn)對(duì)已匹配的項(xiàng)的高亮度信息的附加。
即,在結(jié)構(gòu)化文檔中,為了實(shí)現(xiàn)高亮度顯示,需要在顯示對(duì)象的文檔生成時(shí)的DTD中生成追加高亮度用的結(jié)構(gòu)信息的DTD的手段。
關(guān)于對(duì)結(jié)構(gòu)化文檔附加高亮度信息時(shí)的文檔類型定義的變更方法,就是第3先有技術(shù)。在特愿平8-159202「結(jié)構(gòu)化文檔的版管理方法和裝置」中給出了對(duì)原來(lái)的DTD生成追加新的結(jié)構(gòu)的DTD的方法。
通過(guò)使用本先有技術(shù),可以生成附加高亮度信息的文檔類型定義。
利用第1、第2先有技術(shù)可知,進(jìn)行顯示可以知道結(jié)構(gòu)化文檔的結(jié)構(gòu),此外在未結(jié)構(gòu)化的文檔中,可以進(jìn)行匹配范圍的高亮度顯示。
另外,通過(guò)使用第3先有技術(shù),可以指定附加了對(duì)各結(jié)構(gòu)取得的高亮度信息的文檔類型定義。
通過(guò)將這些技術(shù)組合,輸出對(duì)結(jié)構(gòu)化文檔的特定的結(jié)構(gòu)的檢索結(jié)果附加了高亮度信息的結(jié)構(gòu)化文檔,可以實(shí)現(xiàn)高亮度顯示。
另外,作為獲得最新的信息的方法,近年來(lái)國(guó)際互聯(lián)網(wǎng)絡(luò)獲得了突飛猛進(jìn)的發(fā)展。作為從國(guó)際互聯(lián)網(wǎng)絡(luò)上的大量的信息中最快地知道自己所需要的信息的手段,也充實(shí)了網(wǎng)上的信息的檢索功能。
HTML(Hyper Text Markup Language)是在WWW(WorldWide Web)上記述文檔內(nèi)容、用于表現(xiàn)向其他資源的鏈接信息、文檔的格式的語(yǔ)言。HTML可以視為按照特定的DTD記述的SGML。作為生成、加工該HTML文檔的手段,有HTML編輯器。另外,還有分析并顯示所生成的HTML文檔的HTML瀏覽器。
有的具有將進(jìn)行檢索的字符串(以下,稱為「檢索項(xiàng)」)輸入HTML瀏覽器,對(duì)顯示中的HTML文檔進(jìn)行檢索并將匹配的地方進(jìn)行反相顯示等強(qiáng)調(diào)顯示的功能。
對(duì)于SGML,也存在具有進(jìn)行格式顯示并加工的功能的SGML瀏覽器。在SGML瀏覽器上,對(duì)瀏覽器上顯示中的SGML文檔進(jìn)行全文檢索并對(duì)與檢索條件匹配的地方進(jìn)行高亮度顯示。在這些瀏覽器中,在顯示文檔時(shí)進(jìn)行文檔的分析并生成顯示用的數(shù)據(jù)。檢索是對(duì)該瀏覽器上的顯示用的數(shù)據(jù)進(jìn)行檢索,并在畫(huà)面上將匹配位置進(jìn)行高亮度顯示。
利用上述先有技術(shù)的組合,對(duì)所給定的結(jié)構(gòu)化文檔,可以將對(duì)各結(jié)構(gòu)檢索的結(jié)果分別進(jìn)行高亮度顯示。
但是,在結(jié)構(gòu)信息中不僅表示了像章、節(jié)、項(xiàng)那樣的文檔結(jié)構(gòu)本身,而且有時(shí)也包含下劃線的附加等格式用的信息。這些結(jié)構(gòu)信息不一定按文章的段落而插入。在進(jìn)行文檔檢索時(shí),如果未去除這種結(jié)構(gòu)信息,盡管是包含在文檔中的語(yǔ)句,也不能進(jìn)行檢索。這樣,在以下的說(shuō)明中將去除檢索時(shí)不需要的結(jié)構(gòu)信息的處理稱為「規(guī)格化處理」。
為了以進(jìn)行了規(guī)格化處理的結(jié)構(gòu)化文檔為檢索對(duì)象、對(duì)原來(lái)的結(jié)構(gòu)化文檔實(shí)現(xiàn)附加了高亮度信息的顯示,對(duì)進(jìn)行了規(guī)格化處理的結(jié)構(gòu)化文檔只利用使用上述先有技術(shù)的方法是不能實(shí)現(xiàn)的。即,使用該方法在進(jìn)行檢索時(shí)只保留原來(lái)的文檔的結(jié)構(gòu)信息的一部分,所以,對(duì)該結(jié)構(gòu)信息只附加高亮度信息,對(duì)原來(lái)的結(jié)構(gòu)化文檔不能實(shí)現(xiàn)與檢索項(xiàng)匹配的高亮度顯示。
本發(fā)明的目的在于,為了根據(jù)對(duì)規(guī)格化處理過(guò)的文檔的檢索結(jié)果實(shí)現(xiàn)對(duì)原來(lái)的文檔的高亮度信息的附加,實(shí)現(xiàn)從檢索用的文檔向原來(lái)的文檔的高亮度范圍信息的變換。
本發(fā)明的其他目的在于,規(guī)格化后的匹配項(xiàng)在原來(lái)的文檔與多個(gè)結(jié)構(gòu)匹配時(shí),就按各結(jié)構(gòu)對(duì)匹配的范圍附加高亮度信息,進(jìn)行高亮度顯示。
本發(fā)明的另一個(gè)目的在于,為了將包括滿足包含匹配的項(xiàng)的整個(gè)結(jié)構(gòu)的高亮度顯示或者出現(xiàn)位置的距離條件的2個(gè)檢索項(xiàng)的整個(gè)區(qū)域進(jìn)行高亮度顯示等處理,附加層次性的高亮度信息,利用不同的高亮度顯示形式進(jìn)行高亮度顯示。
本發(fā)明的另一個(gè)目的在于,在只抽出結(jié)構(gòu)化文檔的部分結(jié)構(gòu)進(jìn)行顯示時(shí),對(duì)這部分結(jié)構(gòu)的內(nèi)容也附加高亮度信息進(jìn)行高亮度顯示。
另一方面,HTML文檔存在通過(guò)瀏覽器的單獨(dú)的擴(kuò)展根據(jù)多個(gè)DTD生成的HTML文檔,但是,不知道是根據(jù)哪個(gè)DTD記述的。此外,由于存在大量的未根據(jù)SGML的語(yǔ)法正確地記述的文檔,所以,難于使用和SGML相同的方法進(jìn)行結(jié)構(gòu)分析。
另外,(1)對(duì)明文(plain text)文檔進(jìn)行檢索處理,通過(guò)生成在檢索匹配位置的前后插入高亮度用的標(biāo)記的HTML文檔,在HTML瀏覽器上就可以強(qiáng)調(diào)顯示檢索匹配的字符串。但是,標(biāo)記內(nèi)的字符串與檢索項(xiàng)一致時(shí),如果對(duì)該檢索匹配位置的前后插入高亮度用的標(biāo)記,由于改變了原來(lái)的HTML的標(biāo)記的內(nèi)容,所以,將不能正確地進(jìn)行顯示。
此外,(2)在HTML瀏覽器上連續(xù)地顯示的字符串的中途,有時(shí)插入表現(xiàn)格式的標(biāo)記,對(duì)HTML文檔進(jìn)行檢索時(shí),如果未除去標(biāo)記進(jìn)行檢索,就不能正確地進(jìn)行檢索。例如,在HTML文檔中寫(xiě)入「本月的<FONT SIZE=+1>專集</FONT>記事」,將檢索項(xiàng)定為「專集記事」時(shí),在HTML文檔中,由于在「專集」和「記事」之間記述了用于放大字符進(jìn)行顯示的「</FONT>」的標(biāo)記,所以,如果不跳過(guò)標(biāo)記進(jìn)行檢索,就不能正確地進(jìn)行檢索。
為了解決上述問(wèn)題,本發(fā)明是具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示方法,上述處理裝置分析輸入的結(jié)構(gòu)化文檔,生成分析過(guò)的結(jié)構(gòu)化文檔,將該分析過(guò)的結(jié)構(gòu)化文檔存儲(chǔ)到上述文件裝置中,從該分析過(guò)的結(jié)構(gòu)化文檔中取得各結(jié)構(gòu)內(nèi)的內(nèi)容字符串信息、生成文檔檢索用信息,并存儲(chǔ)到上述文件裝置中,根據(jù)輸入的檢索條件檢索該文件裝置存儲(chǔ)的文檔檢索用信息,判斷是否有滿足該檢索條件的內(nèi)容字符串信息,取得具有認(rèn)為滿足該檢索條件的內(nèi)容字符串信息的文檔的分析過(guò)的結(jié)構(gòu)化文檔,并且取得滿足該文檔的檢索條件的范圍的信息,生成用于將滿足該文檔的檢索條件的范圍進(jìn)行高亮度顯示的顯示用文檔類型定義(顯示用DTD),根據(jù)滿足上述文檔的檢索條件的范圍的信息和顯示用文檔類型定義生成附加了用于在結(jié)構(gòu)化文檔中進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔。
另外,本發(fā)明是具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示方法,上述處理裝置分析輸入的結(jié)構(gòu)化文檔,生成分析過(guò)的結(jié)構(gòu)化文檔,將該分析過(guò)的結(jié)構(gòu)化文檔存儲(chǔ)到上述文件裝置中,生成從上述輸入的結(jié)構(gòu)化文檔中去除預(yù)先給定的檢索對(duì)象外的結(jié)構(gòu)信息的文檔檢索用的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,并且生成用于將該去除的結(jié)構(gòu)信息復(fù)原的復(fù)原信息,并存儲(chǔ)到上述文件裝置中,根據(jù)輸入的檢索條件檢索該文件裝置存儲(chǔ)的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,判斷是否有滿足該檢索條件的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,取得認(rèn)為滿足該檢索條件的文檔的的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,并且取得滿足該文檔的檢索條件的范圍的信息,生成用于將滿足該文檔的檢索條件的范圍進(jìn)行高亮度顯示的顯示用文檔類型定義,利用上述復(fù)原信息將通過(guò)上述檢索而取得的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔復(fù)原為具有去除的結(jié)構(gòu)信息的結(jié)構(gòu)化文檔,根據(jù)滿足上述文檔的檢索條件的范圍的信息和顯示用文檔類型定義,生成附加了用于在結(jié)構(gòu)化文檔中進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔。
另外,本發(fā)明是具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示方法,上述處理裝置分析輸入的結(jié)構(gòu)化文檔,生成分析過(guò)的結(jié)構(gòu)化文檔,將該分析過(guò)的結(jié)構(gòu)化文檔存儲(chǔ)到上述文件裝置中,從該分析過(guò)的結(jié)構(gòu)化文檔中取得各結(jié)構(gòu)內(nèi)的內(nèi)容字符串信息,生成文檔檢索用信息,并存儲(chǔ)到上述文件裝置中,根據(jù)輸入的檢索條件檢索該文件裝置存儲(chǔ)的文檔檢索用信息,判斷是否有滿足該檢索條件的內(nèi)容字符串信息,取得具有認(rèn)為滿足該檢索條件的內(nèi)容字符串信息的文檔的分析過(guò)的結(jié)構(gòu)化文檔,并且取得滿足該文檔的檢索條件的范圍的信息,取得輸入的顯示對(duì)象的部分結(jié)構(gòu),生成用于將滿足該顯示對(duì)象的部分結(jié)構(gòu)中的上述檢索條件的范圍進(jìn)行高亮度顯示的部分結(jié)構(gòu)顯示用文檔類型定義,對(duì)該顯示對(duì)象的部分結(jié)構(gòu),根據(jù)滿足上述文檔的檢索條件的范圍的信息和部分結(jié)構(gòu)顯示用文檔類型定義,生成附加了用于在結(jié)構(gòu)化文檔中進(jìn)行高亮度顯示的信息的部分結(jié)構(gòu)顯示用結(jié)構(gòu)化文檔。
另外,本發(fā)明是具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示裝置,上述處理裝置包括分析輸入的結(jié)構(gòu)化文檔生成分析過(guò)的結(jié)構(gòu)化文檔并將該分析過(guò)的結(jié)構(gòu)化文檔存儲(chǔ)到上述文件裝置中的單元;生成從上述輸入的結(jié)構(gòu)化文檔中去除預(yù)先給定的檢索對(duì)象外的結(jié)構(gòu)信息的文檔檢索用的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔并存儲(chǔ)到上述文件裝置中的單元;生成用于將該去除的結(jié)構(gòu)信息復(fù)原的復(fù)原信息并存儲(chǔ)到上述文件裝置中的單元;根據(jù)輸入的檢索條件檢索該文件裝置存儲(chǔ)的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔、判斷是否有滿足該檢索條件的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔、取得認(rèn)為滿足該檢索條件的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔的信息并且取得滿足該文檔的檢索條件的范圍的信息的單元;生成用于將滿足該文檔的檢索條件的范圍進(jìn)行高亮度顯示的顯示用文檔類型定義的單元;根據(jù)上述復(fù)原信息將通過(guò)上述檢索而取得的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔復(fù)原為具有去除的結(jié)構(gòu)信息的結(jié)構(gòu)化文檔的單元;和根據(jù)滿足上述文檔的檢索條件的范圍的信息和顯示用文檔類型定義生成附加了用于在結(jié)構(gòu)化文檔中進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔的單元。
本發(fā)明是具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示方法,上述處理裝置將符合輸入的特定的文檔類型定義的結(jié)構(gòu)化文檔作為保留著標(biāo)記的明文存儲(chǔ)到上述文件裝置中,根據(jù)輸入的檢索條件檢索該文件裝置存儲(chǔ)的明文,判斷是否有滿足該檢索條件的范圍,取得具有滿足該檢索條件的范圍的文檔作為明文,并且取得滿足該文檔的檢索條件的范圍的信息,將上述特定的文檔類型定義作為顯示用文檔類型定義,對(duì)上述輸入的結(jié)構(gòu)化文檔,根據(jù)該顯示用文檔類型定義對(duì)滿足上述檢索條件的范圍生成附加了用于進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔。
另外,本發(fā)明是具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示方法,上述處理裝置將符合輸入的特定的文檔類型定義的結(jié)構(gòu)化文檔作為保留著標(biāo)記的明文存儲(chǔ)到上述文件裝置中,根據(jù)輸入的檢索條件檢索該文件裝置存儲(chǔ)的明文,判斷是否有滿足該檢索條件的范圍,取得具有滿足該檢索條件的范圍的文檔作為明文,并且取得滿足該文檔的檢索條件的范圍的信息,判斷滿足檢索條件的范圍在結(jié)構(gòu)化文檔中在表示文檔結(jié)構(gòu)的標(biāo)記的屬性信息中是否存在,滿足該檢索條件的范圍在標(biāo)記的屬性信息中存在時(shí),就在結(jié)構(gòu)化文檔的內(nèi)容字符串中追加包含滿足該檢索條件的范圍的字符串的字符串,對(duì)在該字符串中滿足該檢索條件的范圍根據(jù)上述特定的文檔類型定義生成附加了用于進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔。
另外,本發(fā)明是具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示方法,上述處理裝置將符合輸入的特定的文檔類型定義的結(jié)構(gòu)化文檔作為保留著標(biāo)記的明文存儲(chǔ)到上述文件裝置中,從檢索對(duì)象中去除構(gòu)成預(yù)先指定的特定的標(biāo)記的字符串,對(duì)于滿足通過(guò)對(duì)連結(jié)構(gòu)成該特定的標(biāo)記的字符串的前后的字符串進(jìn)行檢索而得到的檢索條件的范圍,根據(jù)上述特定的文檔類型定義生成附加了用于進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔。
另外,本發(fā)明是具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示方法,上述處理裝置將符合輸入的特定的文檔類型定義的結(jié)構(gòu)化文檔作為保留著標(biāo)記的明文存儲(chǔ)到上述文件裝置中,根據(jù)輸入的檢索條件檢索該文件裝置作為明文存儲(chǔ)的結(jié)構(gòu)化文檔時(shí),判斷滿足檢索條件的范圍是否夾在表示預(yù)先給定的文檔結(jié)構(gòu)的開(kāi)始的特定的標(biāo)記和表示文檔結(jié)構(gòu)的結(jié)尾的特定的標(biāo)記之間,夾在上述兩標(biāo)記之間時(shí),就在表示文檔結(jié)構(gòu)的開(kāi)始的特定的標(biāo)記之前或表示文檔結(jié)構(gòu)的結(jié)尾的標(biāo)記之后的內(nèi)容字符串中追加包含滿足該檢索條件的范圍的字符串的字符串,對(duì)該字符串中滿足該檢索條件的范圍,根據(jù)上述特定的文檔類型定義生成附加了用于進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔。
圖1是實(shí)施例1、2的結(jié)構(gòu)化文檔檢索顯示裝置的處理框圖。
圖2是表示結(jié)構(gòu)化文檔檢索顯示處理的流程圖。
圖3是表示結(jié)構(gòu)化文檔登錄的內(nèi)容的圖。
圖4是表示結(jié)構(gòu)化文檔登錄處理的流程圖。
圖5是表示檢索用的文本的圖。
圖6是表示更新處理的流程圖。
圖7是表示指定結(jié)構(gòu)的抽出處理的流程圖。
圖8是表示作為結(jié)構(gòu)指定的分析結(jié)果而輸出的信息的圖。
圖9是表示文檔顯示處理的流程圖。
圖10是表示結(jié)構(gòu)化文檔和高亮度處理結(jié)果的例子的圖。
圖11是表示文檔顯示用DTD生成處理的流程圖。
圖12是表示結(jié)構(gòu)化文檔檢索用的規(guī)格化處理的內(nèi)容的圖。
圖13是表示進(jìn)行了規(guī)格化處理的結(jié)果的存儲(chǔ)內(nèi)容的圖。
圖14是表示進(jìn)行了規(guī)格化處理時(shí)的匹配范圍信息的變換處理內(nèi)容的圖。
圖15是表示進(jìn)行了規(guī)格化處理時(shí)的匹配范圍信息的變換處理的流程圖。
圖16是表示附加高亮度信息的處理的流程圖。
圖17是表示實(shí)施例2的匹配范圍信息的圖。
圖18是表示實(shí)施例2的各匹配信息的高亮度方法的定義的圖。
圖19是表示實(shí)施例2的向高亮度顯示用DTD的變換內(nèi)容的圖。
圖20是表示實(shí)施例2的高亮度處理的流程圖。
圖21是表示根據(jù)實(shí)施例2附加了高亮度信息的SGML文檔的例子的圖。
圖22是表示高亮度顯示的例子的圖。
圖23是實(shí)施例3的結(jié)構(gòu)化文檔檢索顯示裝置的概略處理框圖。
圖24是表示實(shí)施例3的處理內(nèi)容的流程圖。
圖25是表示向部分結(jié)構(gòu)顯示用的DTD的變換處理的圖。
圖26是表示部分結(jié)構(gòu)顯示用的DTD生成處理的流程圖。
圖27是實(shí)施例4的系統(tǒng)結(jié)構(gòu)圖。
圖28是表示數(shù)據(jù)控制部的流程圖。
圖29是表示實(shí)施例4的字符檢索處理和高亮度位置信息的生成處理的流程圖。
圖30是高亮度位置信息存儲(chǔ)區(qū)域的結(jié)構(gòu)。
圖31是高亮度數(shù)存儲(chǔ)區(qū)域的結(jié)構(gòu)。
圖32是高亮度標(biāo)記字符存儲(chǔ)區(qū)域的結(jié)構(gòu)。
圖33是表示實(shí)施例4的帶高亮度標(biāo)記的HTML文檔的生成處理的流程圖。
圖34是高亮度插入例子的圖。
圖35是高亮度插入后的例子。
圖36是實(shí)施例5的系統(tǒng)結(jié)構(gòu)圖。
圖37是表示實(shí)施例5的檢索處理和高亮度位置信息生成處理的流程圖。
圖38是表示實(shí)施例5的標(biāo)記內(nèi)檢索和標(biāo)記外檢索處理的流程圖。
圖39是表示實(shí)施例5的標(biāo)記外用檢索處理的流程圖。
圖40是表示實(shí)施例5的高亮度用標(biāo)記的插入HTML文檔的生成處理的流程圖。
圖41是表示實(shí)施例5的高亮度標(biāo)記插入處理的流程圖。
圖42是表示實(shí)施例5的標(biāo)記外高亮度標(biāo)記插入處理的流程圖。
圖43是實(shí)施例6的檢索條件的例子的圖。
圖44是實(shí)施例6的匹配范圍信息的例子的圖。
圖45是表示實(shí)施例6的向高亮度顯示用DTD的變換處理的圖。
圖46是表示實(shí)施例6的高亮度顯示用的SGML文檔的例子的圖。
圖47是實(shí)施例6的高亮度顯示的例子的圖。
實(shí)施例1的概略的處理框圖示于圖1。
101是結(jié)構(gòu)化文檔檢索顯示裝置。通過(guò)將登錄數(shù)據(jù)文件(114)中存儲(chǔ)的結(jié)構(gòu)化文檔(102)作為輸入進(jìn)行文檔登錄的處理,生成進(jìn)行結(jié)構(gòu)分析過(guò)的結(jié)構(gòu)化文檔(后面根據(jù)圖3進(jìn)行說(shuō)明)和用于文檔檢索的文檔檢索用信息(后面根據(jù)圖5進(jìn)行說(shuō)明)。
進(jìn)行結(jié)構(gòu)分析過(guò)的結(jié)構(gòu)化文檔存儲(chǔ)到結(jié)構(gòu)化文檔數(shù)據(jù)庫(kù)(以后,將數(shù)據(jù)庫(kù)記為DB)(105)中,檢索用信息存儲(chǔ)到檢索用信息DB(106)中。
其次,從輸入輸出裝置(115)輸入檢索條件(103)時(shí),就分析檢索條件,得出文檔檢索用信息,進(jìn)行檢索處理(108)。作為檢索結(jié)果,輸出匹配的文檔序號(hào)的信息(109)和匹配范圍的信息(110)。
顯示處理,首先在文檔得出的處理(107)中,根據(jù)匹配的文檔序號(hào)的信息(109),從結(jié)構(gòu)化文檔DB(105)中得出指定的結(jié)構(gòu)分析過(guò)的結(jié)構(gòu)化文檔(111)。在文檔顯示(112)的處理中,根據(jù)匹配范圍信息(110),對(duì)結(jié)構(gòu)分析過(guò)的結(jié)構(gòu)化文檔(111)生成插入了匹配信息的顯示用的結(jié)構(gòu)化文檔(113)。生成的顯示用的結(jié)構(gòu)化文檔在輸入輸出裝置(115)上進(jìn)行顯示。
圖2表示結(jié)構(gòu)化文檔檢索顯示的處理的流程圖。
首先,進(jìn)行結(jié)構(gòu)化文檔的登錄處理(201)。對(duì)于登錄處理的內(nèi)容,后面使用圖4的流程圖進(jìn)行說(shuō)明。
其次,使用指定的檢索條件檢索結(jié)構(gòu)化文檔(202)。檢索處理的詳細(xì)情況,后面使用圖6的流程圖進(jìn)行說(shuō)明。
作為檢索結(jié)果,有識(shí)別匹配文檔數(shù)和匹配文檔的序號(hào)和各文檔的檢索項(xiàng)的匹配范圍。匹配范圍的信息是用于識(shí)別包含匹配的檢索項(xiàng)的結(jié)構(gòu)的結(jié)構(gòu)ID(結(jié)構(gòu)標(biāo)識(shí)符)和結(jié)構(gòu)內(nèi)的匹配開(kāi)始位置,輸出文本長(zhǎng)度的信息。
在結(jié)構(gòu)化文檔檢索的處理中,如果匹配文檔數(shù)大于1(203),就順序讀出匹配的文檔的內(nèi)容(204),取得讀出的文檔的匹配范圍信息(205),實(shí)現(xiàn)高亮度顯示(206)。對(duì)于顯示處理的詳細(xì)情況,后面使用圖9進(jìn)行說(shuō)明。
此外,如果有匹配的文檔,就反復(fù)進(jìn)行204~206的處理。
顯示處理結(jié)束時(shí),就確認(rèn)有無(wú)下一個(gè)檢索處理(208),如果沒(méi)有檢索條件,就結(jié)束處理,如果有檢索條件,就返回到202的處理,反復(fù)進(jìn)行結(jié)構(gòu)化文檔的檢索顯示處理。
圖3是表示結(jié)構(gòu)化文檔登錄處理的概要的圖。
首先,分析SGML文檔(301)的結(jié)構(gòu),生成樹(shù)結(jié)構(gòu)(302)。將生成的樹(shù)結(jié)構(gòu)的各項(xiàng)目的內(nèi)容以表形式的數(shù)據(jù)(303)輸出,并將其作為分析過(guò)的結(jié)構(gòu)化文檔進(jìn)行登錄。這里,所謂CDATA,就是字符串?dāng)?shù)據(jù)。
圖4是結(jié)構(gòu)化文檔登錄處理的流程圖。
首先,分析結(jié)構(gòu)化文檔(401)。將分析過(guò)的結(jié)構(gòu)化文檔作為已完成分析的結(jié)構(gòu)化文檔進(jìn)行登錄(402)。對(duì)于結(jié)構(gòu)化文檔的分析,可以利用DTD,通過(guò)使用分析SGML文檔的SGML檢查器而實(shí)現(xiàn)。
其次,對(duì)分析過(guò)的結(jié)構(gòu)化文檔,進(jìn)行用于去除檢索所不需要的結(jié)構(gòu)的規(guī)格化處理(403)。
對(duì)于規(guī)格化處理的順序,后面使用圖12進(jìn)行說(shuō)明。并且,將規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔登錄到文檔數(shù)據(jù)庫(kù)中(404)。
此外,從登錄到數(shù)據(jù)庫(kù)中的分析過(guò)的結(jié)構(gòu)化文檔中,取出結(jié)構(gòu)信息、結(jié)構(gòu)內(nèi)的文本的信息作為結(jié)構(gòu)化文檔的檢索所需要的檢索用信息(405)。將這里得到的檢索用信息登錄到檢索用信息DB(106)中(406)。這里,登錄的檢索用信息去出了SGML文檔中的結(jié)構(gòu)信息(標(biāo)記),對(duì)各結(jié)構(gòu)存儲(chǔ)表示結(jié)構(gòu)信息及其內(nèi)容的文本串。
圖5表示由上述檢索用信息和已規(guī)格化的結(jié)構(gòu)化文檔構(gòu)成的檢索用的文本的存儲(chǔ)例子。對(duì)登錄文檔反復(fù)進(jìn)行上述處理,在沒(méi)有了登錄文檔時(shí)將結(jié)束處理(407)。登錄內(nèi)容用于登錄文檔的全文檢索。
圖5是作為檢索用的文本而輸出的內(nèi)容的例子。這樣,就將由使文檔結(jié)構(gòu)的結(jié)構(gòu)ID與文本串對(duì)應(yīng)的表和字符串信息構(gòu)成的信息作為檢索與的文本進(jìn)行登錄。在檢索時(shí),根據(jù)結(jié)構(gòu)ID抽出所需要的字符串進(jìn)行檢索。
圖6是圖2的結(jié)構(gòu)化文檔檢索顯示處理的202步驟的結(jié)構(gòu)化文檔檢索的處理流程。
檢索條件按「檢索對(duì)象的結(jié)構(gòu)指定檢索條件式」那樣給定。
檢索對(duì)象的結(jié)構(gòu),例如像「<文檔.標(biāo)題>」那樣,用‘<’和‘>’包圍,上位結(jié)構(gòu)(例中為「文檔」)和下位結(jié)構(gòu)(例中為「標(biāo)題」)用‘.’進(jìn)行區(qū)分,指定對(duì)層次結(jié)構(gòu)中的哪個(gè)結(jié)構(gòu)進(jìn)行檢索。
檢索條件式,例如用and(“檢索”、“文檔”)表示“檢索”和“文檔”兩個(gè)都出現(xiàn)的條件,用C<=10(“檢索”、“文檔”)表示“檢索”和“文檔”夾著小于10字符的字符而出現(xiàn)的條件。
結(jié)構(gòu)化文檔檢索中,首先清除匹配文檔數(shù)的計(jì)數(shù)器(601),其次,進(jìn)行檢索條件中的檢索對(duì)象的結(jié)構(gòu)指定的部分的分析(602)。在602,從如<文檔.標(biāo)題>那樣指定結(jié)構(gòu)的字符串中取得可以唯一地特定分析過(guò)的結(jié)構(gòu)化文檔對(duì)應(yīng)的結(jié)構(gòu)的結(jié)構(gòu)ID(結(jié)構(gòu)標(biāo)識(shí)符)。結(jié)構(gòu)ID取得的處理內(nèi)容,后面使用圖7的流程圖進(jìn)行說(shuō)明。
其次,讀出作為檢索對(duì)象而登錄的文檔(檢索用的文本),取得與在602取得的指定結(jié)構(gòu)ID對(duì)應(yīng)的文本部分(603)。
根據(jù)檢索條件分析由檢索項(xiàng)以及多個(gè)檢索項(xiàng)出現(xiàn)的“與”、距離條件等的邏輯條件構(gòu)成的檢索條件式(604),根據(jù)得到的檢索項(xiàng)進(jìn)行在603取得的文本部分的全文檢索,判斷是否滿足檢索條件式的邏輯條件,即判斷是否與檢索條件匹配(605)。
與檢索條件匹配時(shí)(606),作為檢索結(jié)果,輸出文檔序號(hào)、包含檢索項(xiàng)的結(jié)構(gòu)的ID和結(jié)構(gòu)中的檢索項(xiàng)匹配的范圍的信息(607)。
此外,計(jì)數(shù)匹配的文檔的數(shù)(608),對(duì)全部文檔進(jìn)行本處理后(609),輸出匹配文檔數(shù)(610)。
圖7是圖6的檢索條件的分析中結(jié)構(gòu)指定內(nèi)容的分析處理的流程圖。
首先,取得文檔的最上位結(jié)構(gòu)(701)。其次,從最上位結(jié)構(gòu)開(kāi)始順序取得下位結(jié)構(gòu)。如果取得的結(jié)構(gòu)是指定結(jié)構(gòu)的下位結(jié)構(gòu)(703),就將該結(jié)構(gòu)作為檢索對(duì)象的結(jié)構(gòu)而輸出結(jié)構(gòu)ID(704)。
如果有下位結(jié)構(gòu)(705),則進(jìn)而對(duì)該下位結(jié)構(gòu)同樣判斷是否為指定的結(jié)構(gòu)的下位結(jié)構(gòu),如果是下位結(jié)構(gòu),就反復(fù)進(jìn)行輸出結(jié)構(gòu)ID的處理(706)直至不再有下位結(jié)構(gòu)為止(707),如果對(duì)全部結(jié)構(gòu)的處理結(jié)束,便可獲得檢索對(duì)象的結(jié)構(gòu)ID的一覽表。
圖8表示作為檢索對(duì)象的結(jié)構(gòu)ID一覽表的輸出形式。
輸出作為檢索對(duì)象的結(jié)構(gòu)ID的數(shù)(801)和作為檢索對(duì)象的ID(802)。
圖9是表示顯示處理的內(nèi)容的流程圖。下面,使用本流程圖說(shuō)明顯示處理的內(nèi)容。
首先,由于檢索對(duì)象的結(jié)構(gòu)化文檔是進(jìn)行清除檢索所不需要的結(jié)構(gòu)的規(guī)格化處理后的文檔,所以,根據(jù)檢索而匹配的結(jié)構(gòu)和匹配范圍信息與登錄的未規(guī)格化的結(jié)構(gòu)化文檔的結(jié)構(gòu)和范圍不一定一致(參見(jiàn)圖3的樹(shù)結(jié)構(gòu)302和圖12的樹(shù)結(jié)構(gòu)1203)。
顯示所使用的文檔,是對(duì)登錄的未規(guī)格化的結(jié)構(gòu)化文檔將高亮度信息附加到匹配的范圍上的文檔。
因此,首先,根據(jù)登錄文檔的DTD進(jìn)行顯示所使用的文檔用的顯示用DTD的生成處理(901)。對(duì)于顯示用DTD生成處理的內(nèi)容,后面使用圖11進(jìn)行說(shuō)明。
此外,對(duì)于對(duì)規(guī)格化后的結(jié)構(gòu)化文檔而得到的匹配范圍,變換為規(guī)格化前登錄的結(jié)構(gòu)化文檔的結(jié)構(gòu)和高亮度范圍信息(902)。對(duì)于規(guī)格化后的文檔的匹配范圍信息向規(guī)格化前的文檔的高亮度范圍信息的變換處理的內(nèi)容,后面使用圖15進(jìn)行說(shuō)明。
其次,讀出顯示所使用的分析過(guò)的文檔的最上位結(jié)構(gòu)的信息,通過(guò)順序反復(fù)進(jìn)行903~911的處理,進(jìn)行顯示用的文檔的輸出處理。
首先,讀出結(jié)構(gòu)信息(903),開(kāi)始,輸出結(jié)構(gòu)的開(kāi)始標(biāo)記(904)。在本結(jié)構(gòu)中如果進(jìn)而存在下位結(jié)構(gòu)(905),就對(duì)下位結(jié)構(gòu)再次進(jìn)行顯示處理(903~911的處理)(906)。如果沒(méi)有下位結(jié)構(gòu),就轉(zhuǎn)移到輸出表示結(jié)構(gòu)的結(jié)尾的標(biāo)記的處理(911)。
這里,所謂下位結(jié)構(gòu),包括字符串。因此,對(duì)于<文檔>
<標(biāo)題>
結(jié)構(gòu)化文檔<正文>
<強(qiáng)調(diào)>結(jié)構(gòu)化文檔</強(qiáng)調(diào)>的檢索、…</正文>
</文檔>
等的結(jié)構(gòu)化文檔,作為<標(biāo)題>的下位結(jié)構(gòu),存在字符串(在SGML中,表現(xiàn)為CDATA)這樣的結(jié)構(gòu)。CDATA不具有下位結(jié)構(gòu),作為字符串信息,上述例子的情況就是具有「結(jié)構(gòu)化文檔」這樣的內(nèi)容。
對(duì)于<正文>,同樣,作為下位結(jié)構(gòu)也存在<強(qiáng)調(diào)>這樣的結(jié)構(gòu)和具有「的檢索、…」這樣的內(nèi)容的字符串。
在905的步驟,判定不存在下位結(jié)構(gòu)時(shí),由于是字符串的結(jié)構(gòu),所以,對(duì)本結(jié)構(gòu)的內(nèi)容,與匹配范圍信息進(jìn)行比較(908),如果是包含匹配范圍的結(jié)構(gòu),就進(jìn)行高亮度處理(909)。對(duì)于高亮度處理,后面使用圖16進(jìn)行說(shuō)明。
如果是不包含匹配范圍的字符串,就直接將內(nèi)容作為文本而輸出(910)。輸出內(nèi)容為字符串時(shí),在904、911的步驟,就不輸出開(kāi)始標(biāo)記和結(jié)束標(biāo)記。
通過(guò)上述處理,實(shí)現(xiàn)各結(jié)構(gòu)的高亮度顯示。如果有應(yīng)進(jìn)一步處理的結(jié)構(gòu),就反復(fù)進(jìn)行從903開(kāi)始的處理(912)。
圖10是登錄用DTD(1001)、登錄的SGML文檔(文檔實(shí)例)的例子(1002)、高亮度顯示使用的顯示用DTD(1003)和變換為顯示用的SGML文檔(文檔實(shí)例)的例子(1004)。所謂DTD(Document Type Definition),如在先有的技術(shù)一項(xiàng)所述的那樣,是規(guī)定標(biāo)記的名稱、內(nèi)容以及由標(biāo)記表示的文檔結(jié)構(gòu)的文檔類型定義。
在DTD中,表現(xiàn)結(jié)構(gòu)時(shí),在″<!ELEMENT標(biāo)記名″之后,并列2個(gè)″-″或″0″。
開(kāi)始的″-″或″0″表示可否省略結(jié)構(gòu)開(kāi)始標(biāo)記,為″-″時(shí),就不能省略。為″0″時(shí),可以省略。第2個(gè)″-″或″0″表示可否省略結(jié)束標(biāo)記。
下面,對(duì)于內(nèi)容模型,描述在下位結(jié)構(gòu)可以出現(xiàn)的結(jié)構(gòu)。
為圖10的DTD1001的(標(biāo)題,正文)時(shí),標(biāo)題為下位結(jié)構(gòu)1,正文為下位結(jié)構(gòu)2。
描述為″(下位結(jié)構(gòu)1,下位結(jié)構(gòu)2 ?)″那樣時(shí),表示在下位結(jié)構(gòu)1之后分別只出現(xiàn)1次下位結(jié)構(gòu)2,″?″表示也可以不出現(xiàn)下位結(jié)構(gòu)2。
為″(下位結(jié)構(gòu)1|下位結(jié)構(gòu)2)*″時(shí),表示下位結(jié)構(gòu)1、2順序不同地多次(包括0次)出現(xiàn)。
這里,在內(nèi)容模型中記述為″CDATA″時(shí),表示在該結(jié)構(gòu)中只存在1個(gè)字符串。
#PCDATA也表示字符串,但是,可以反復(fù)出現(xiàn)。字符串和結(jié)構(gòu)混合存在時(shí),就必須使用#PCDATA。
在內(nèi)容模型中,有時(shí)指定″RCDATA″取代″CDATA″。CDATA和RCDATA的不同,是在結(jié)構(gòu)內(nèi)出現(xiàn)實(shí)體參照(如″&xxxx,″那樣記述時(shí),就利用于向外字的置換等。)時(shí),CDATA不進(jìn)行向?qū)嶓w(外字等)的變換,所出現(xiàn)的字符串直接作為字符串進(jìn)行處理。指定″RCDATA″時(shí),就將向進(jìn)行向?qū)嶓w的變換的字符串作為字符串進(jìn)行處理。
為了進(jìn)行高亮度顯示,必須改變文檔結(jié)構(gòu),用以對(duì)字符串附加高亮度信息。如在1003用下劃線所示的變更點(diǎn)那樣,對(duì)各結(jié)構(gòu)的字符串部分全部追加高亮度顯示用的結(jié)構(gòu)信息,此外,還必須附加高亮度顯示用的結(jié)構(gòu)信息(<!ELEMENT高亮度--(#PCDATA)>。
在原來(lái)的DTD中成為內(nèi)容模型的″CDATA″的部分變更為″(#PCDATA|高亮度)*″,表示CDATA在該結(jié)構(gòu)中只存在1個(gè)字符串,不能作為反復(fù)的要素出現(xiàn)。由于附加了高亮度用的標(biāo)記,所以,即使原來(lái)的結(jié)構(gòu)是CDATA,變更為#PCDATA后,就采用″(#PCDATA|高亮度)*″,以使高亮度可以反復(fù)出現(xiàn)。
圖11是表示用于根據(jù)登錄用的DTD生成高亮度顯示用的DTD的處理內(nèi)容的流程圖。
首先,讀出登錄用DTD(1101),分析DTD的內(nèi)容,取得ELEMENT項(xiàng)目(1102)。在ELEMENT項(xiàng)目的內(nèi)容模型中指定了CDATA、RCDATA、#PCDATA等時(shí),就全部改變內(nèi)容模型,使之成為可以附加高亮度用的結(jié)構(gòu)(1103~1106)。
內(nèi)容模型的變更,首先將″CDATA″、″RCDATA″變更為″#PCDATA″,然后將″#PCDATA″定義為如″(#PCDATA|高亮度)*″那樣反復(fù)出現(xiàn)用高亮度標(biāo)記包圍的字符串和不包圍的字符串。
原來(lái)的內(nèi)容模型如″(#PCDATA|下劃線)*″那樣記述為多個(gè)結(jié)構(gòu)反復(fù)出現(xiàn)時(shí),如″(#PCDATA|下劃線|高亮度)*″那樣,可以只記述出現(xiàn)高亮度結(jié)構(gòu)。
對(duì)于所有的ELEMENT聲明變更處理結(jié)束時(shí)(1107),作為高亮度用的結(jié)構(gòu)的定義,追加″<!ELEMENT高亮度--CDATA>″(1108)。通過(guò)以上的處理,生成圖10的1003所示的高亮度用的DTD。
圖12是表示結(jié)構(gòu)化文檔的規(guī)格化處理的內(nèi)容的圖。
將圖10的1001所示的結(jié)構(gòu)化文檔表示為樹(shù)結(jié)構(gòu)時(shí),就成為1201那樣。
作為不需要的結(jié)構(gòu),指定了″下劃線″時(shí),作為規(guī)格化處理的最初的處理,如1202所示的那樣,就是刪除下劃線這樣的結(jié)構(gòu),包含在下劃線的下位結(jié)構(gòu)中的字符串直接作為上位結(jié)構(gòu)即″正文″的要素。
此外,作為″正文″的下位結(jié)構(gòu),由于并列了2個(gè)字符串(CDATA),所以,如1203那樣,將字符串連結(jié),作為1個(gè)字符串?dāng)?shù)據(jù)。
圖13是分析規(guī)格化處理前的結(jié)構(gòu)化文檔(1301)、規(guī)格化處理后的結(jié)構(gòu)化文檔(1302)的內(nèi)容變換為表形式而輸出的內(nèi)容。1303是存儲(chǔ)結(jié)構(gòu)信息的表,附加了0~6的結(jié)構(gòu)ID的結(jié)構(gòu)是規(guī)格化前的結(jié)構(gòu)的信息。0是最上位結(jié)構(gòu),通過(guò)追尋下位結(jié)構(gòu)的信息,就知道了文檔結(jié)構(gòu)。
附加了7~9的結(jié)構(gòu)ID(結(jié)構(gòu)標(biāo)識(shí)符)的結(jié)構(gòu)是規(guī)格化后變更、追加的結(jié)構(gòu)。
7是最上位結(jié)構(gòu),通過(guò)追尋下位結(jié)構(gòu),便可知道規(guī)格化后的文檔結(jié)構(gòu)。這里,未變更的結(jié)構(gòu)即″標(biāo)題″以下的結(jié)構(gòu)即結(jié)構(gòu)ID1、2的結(jié)構(gòu)信息仍然保留。
此外,對(duì)于在規(guī)格化處理中追加的結(jié)構(gòu)ID7~9的結(jié)構(gòu),根據(jù)1304的規(guī)格化對(duì)應(yīng)表,存儲(chǔ)與規(guī)格化前的結(jié)構(gòu)的對(duì)應(yīng)關(guān)系。
圖14表示對(duì)規(guī)格化后的結(jié)構(gòu)化文檔將檢索時(shí)的匹配范圍的信息變換為規(guī)格化前的結(jié)構(gòu)化文檔的范圍信息的結(jié)果。
利用圖13的1304的規(guī)格化對(duì)應(yīng)表的信息,將根據(jù)1401的規(guī)格化后的結(jié)構(gòu)信息而得到的匹配范圍的信息變換為規(guī)格化前的結(jié)構(gòu)化文檔的范圍信息(1402)。
在本圖的例子中,由于在規(guī)格化前的文檔中分為結(jié)構(gòu)ID5和6,所以,規(guī)格化后的結(jié)構(gòu)ID9的匹配范圍變更為2個(gè)結(jié)構(gòu)中的高亮度對(duì)象的范圍信息。
圖15表示將對(duì)圖9的902步驟的規(guī)格化處理后的結(jié)構(gòu)化文檔的匹配范圍信息變換為對(duì)規(guī)格化處理前的結(jié)構(gòu)化文檔的匹配范圍信息的處理內(nèi)容的流程圖。
首先,順序讀出規(guī)格化后的匹配范圍信息(1501),判斷匹配范圍信息的結(jié)構(gòu)ID是規(guī)格化后追加的還是規(guī)格化前就存在的(1502)。
如果是規(guī)格化前就存在的結(jié)構(gòu)ID,就不變更,所以,直接作為規(guī)格化前的匹配范圍信息而輸出(1503)。
如果是規(guī)格化后生成的結(jié)構(gòu)ID,就追尋圖14的規(guī)格化對(duì)應(yīng)表的規(guī)格化后結(jié)構(gòu)ID,根據(jù)字符范圍的信息獲得對(duì)應(yīng)的規(guī)格化前的結(jié)構(gòu)ID和匹配范圍(1504)。如果得到了規(guī)格化處理前的結(jié)構(gòu)的匹配范圍,就將其作為規(guī)格化前的匹配范圍而輸出(1505)。
對(duì)所有的匹配范圍信息處理結(jié)束時(shí)(1506),就可以獲得顯示用的高亮度范圍信息。
圖16是圖9的909步驟的高亮度處理的流程圖。首先,輸出從文檔的開(kāi)頭到高亮度開(kāi)始的字符串(1601)。其次,輸出高亮度顯示使用的結(jié)構(gòu)的開(kāi)始標(biāo)記(1602)。
此外,輸出高亮度范圍的字符串(1603),輸出高亮度顯示使用的結(jié)構(gòu)的結(jié)束標(biāo)記(1604)。
所有的高亮度處理結(jié)束時(shí)(1605),就輸出其余的文本,并結(jié)束高亮度處理(1606)。
下面,對(duì)實(shí)施例2說(shuō)明根據(jù)匹配條件改變高亮度顯示方法的處理以及按層次進(jìn)行多個(gè)高亮度處理時(shí)的處理。概略處理框圖和圖1相同。
圖17是在本實(shí)施例中使用的匹配范圍信息(1701)。
對(duì)圖14所示的匹配范圍信息追加的信息,就是追加存儲(chǔ)各匹配的條件的區(qū)域(1702)。
此外,在圖14中,只輸出匹配的檢索項(xiàng)的范圍,但是,根據(jù)檢索條件不同,除了匹配的檢索項(xiàng)外,還可以指定對(duì)包含該檢索項(xiàng)的整個(gè)結(jié)構(gòu)的高亮度等包含檢索項(xiàng)的區(qū)域。
這些匹配條件的信息,在結(jié)構(gòu)化文檔的檢索處理時(shí)附加。這里,附加了檢索條件使用的距離條件和各檢索項(xiàng)的出現(xiàn)頻度等信息,但是,也可以使用對(duì)各檢索項(xiàng)預(yù)先進(jìn)行加權(quán)等方法。
圖18是定義匹配條件和高亮度方法(高亮度顯示形式)的對(duì)應(yīng)的表(1801)。
記述與匹配條件(1802)對(duì)應(yīng)的高亮度方法(1803)。按照各匹配條件而匹配的范圍根據(jù)本表的內(nèi)容進(jìn)行高亮度顯示。
此外,給定層次信息(1804),層次信息的值越大,則越是整個(gè)結(jié)構(gòu)的高亮度等上位的高亮度結(jié)構(gòu)。
圖19是表示用于實(shí)現(xiàn)上述高亮度處理的顯示用DTD生成的處理內(nèi)容。
對(duì)于登錄所使用的原來(lái)的DTD(1901),在上位的高亮度結(jié)構(gòu)內(nèi)可以按層次指定下位的高亮度結(jié)構(gòu),進(jìn)而為了也可以省略而生成變更或追加定義的高亮度顯示用的DTD(1902)。
DTD的生成方法,對(duì)于使用圖11進(jìn)行的上述處理,可以在1106步驟的高亮度信息附加時(shí)全部附加上多個(gè)存在的高亮度信息(1903),此外,在1108步驟的高亮度用ELEMENT聲明追加時(shí),可以根據(jù)圖18的層次信息(1804),對(duì)于各高亮度結(jié)構(gòu)的下位結(jié)構(gòu),將下位的高亮度結(jié)構(gòu)和字符串作為內(nèi)容模型進(jìn)行保持。
如果沒(méi)有下位的高亮度結(jié)構(gòu),則作為內(nèi)容模型只出現(xiàn)字符串(1904)。
圖20是實(shí)施例2的高亮度處理的流程圖。
首先,將高亮度信息進(jìn)行分類,將開(kāi)始位置順序作為第1鍵,將從層次信息的上位到下位的順序作為第2鍵(2001)。其次,輸出高亮度開(kāi)始之前的文本(2002),并輸出高亮度開(kāi)始標(biāo)記(2003)。
此外,如果在高亮度范圍的結(jié)尾之前已開(kāi)始了下一個(gè)高亮度,由于存在下位的結(jié)構(gòu)信息(2004),所以,在輸出該位置之前的文本之后(2005),進(jìn)行下位的高亮度結(jié)構(gòu)的高亮度處理(2006)。下位結(jié)構(gòu)的高亮度處理和2003~2009的處理相同。
對(duì)下位的高亮度結(jié)構(gòu)的處理結(jié)束之后,如果進(jìn)而還有下位的高亮度結(jié)構(gòu)(2007),就返回到2005步驟的處理,輸出下一個(gè)高亮度結(jié)構(gòu)之前的文本,進(jìn)行下位的高亮度結(jié)構(gòu)的處理。
如果已沒(méi)有下位的高亮度結(jié)構(gòu),就輸出到結(jié)構(gòu)的結(jié)尾為止的文本(2008),并輸出高亮度結(jié)束標(biāo)記(2009)。
如果還有高亮度的信息,就返回到2002的步驟,反復(fù)進(jìn)行處理。如果高亮度的信息結(jié)束了(2010),就輸出其余的文本,并結(jié)束處理(2011)。
圖21是通過(guò)上述處理而生成的SGML文檔的例子。
圖22是圖21的SGML文檔的正文的顯示例子。對(duì)于重疊的高亮度范圍,重復(fù)進(jìn)行多個(gè)高亮度用的顯示方法。作為實(shí)施例3,就是只分離出結(jié)構(gòu)化文檔的部分結(jié)構(gòu),進(jìn)行高亮度顯示時(shí)的處理內(nèi)容。
圖23是表示本實(shí)施例的概略處理框圖。
圖1的變更點(diǎn),是指定顯示對(duì)象的結(jié)構(gòu)(2301),根據(jù)顯示對(duì)象的結(jié)構(gòu)的指定內(nèi)容進(jìn)行部分結(jié)構(gòu)顯示的處理(2302)取代文檔顯示(112)的處理。
圖24是表示抽出部分結(jié)構(gòu)進(jìn)行顯示時(shí)的處理順序的流程圖。
首先,生成部分結(jié)構(gòu)顯示用的DTD(2401)。對(duì)于部分結(jié)構(gòu)顯示用的DTD的生成處理,后面使用圖26進(jìn)行說(shuō)明。
此外,將對(duì)規(guī)格化后的結(jié)構(gòu)化文檔而得到匹配范圍變換為規(guī)格化前的登錄時(shí)的文檔的結(jié)構(gòu)ID和匹配范圍信息(2402)。關(guān)于規(guī)格化后的文檔的信息向規(guī)格化前的文檔的范圍信息的變換處理的內(nèi)容,可以使用上述使用圖16說(shuō)明的方法。
其次,讀出作為顯示對(duì)象的分析過(guò)的文檔的結(jié)構(gòu)的信息,通過(guò)反復(fù)進(jìn)行2403~2411的處理,進(jìn)行顯示用的文檔的輸出處理。
首先,讀出作為顯示對(duì)象的結(jié)構(gòu)信息(2403)。這里,是否為顯示對(duì)象的結(jié)構(gòu)的判斷,使用上述使用圖7說(shuō)明的方法來(lái)實(shí)現(xiàn)。
如果是顯示對(duì)象的結(jié)構(gòu)信息,首先輸出結(jié)構(gòu)的開(kāi)始標(biāo)記(2404)。進(jìn)而如果存在下位結(jié)構(gòu)(2405),就對(duì)下位結(jié)構(gòu)進(jìn)行顯示處理(2403~2411的處理)(2406)。如果沒(méi)有下位結(jié)構(gòu),就轉(zhuǎn)移到輸出表示結(jié)構(gòu)的結(jié)尾的標(biāo)記的處理(2411)。
在2405的步驟中判定不存在下位結(jié)構(gòu)時(shí),由于是字符串的結(jié)構(gòu),所以,對(duì)本結(jié)構(gòu)的內(nèi)容與匹配范圍信息進(jìn)行比較(2408),如果是匹配范圍包含的結(jié)構(gòu),就進(jìn)行高亮度處理(2409)。對(duì)于高亮度處理,使用上述使用圖15說(shuō)明的方法。
如果是高亮度范圍不包含的字符串,就將內(nèi)容直接作為文本而輸出(2410)。輸出內(nèi)容為字符串時(shí),在2404、2411的步驟中,就不輸出開(kāi)始標(biāo)記和結(jié)束標(biāo)記。
通過(guò)上述處理,實(shí)現(xiàn)各結(jié)構(gòu)的高亮度顯示。如果進(jìn)而有應(yīng)處理的結(jié)構(gòu),就反復(fù)進(jìn)行從2403開(kāi)始的處理(2412)。
圖25是部分結(jié)構(gòu)顯示用的DTD的生成內(nèi)容。
根據(jù)部分結(jié)構(gòu)的輸出,有時(shí)不輸出定義為在原來(lái)的DTD(2501)一定出現(xiàn)的結(jié)構(gòu)。此外,也不一定必須輸出上位結(jié)構(gòu)。
因此,即使對(duì)于不是必須出現(xiàn)上位結(jié)構(gòu)的開(kāi)始標(biāo)記和結(jié)束標(biāo)記的結(jié)構(gòu)本身,也必須變更為可以不一定出現(xiàn)。生成的部分結(jié)構(gòu)顯示用的DTD如2502所示。
使用該DTD生成的SGML文檔,如2503所示。在該例中,只抽出了標(biāo)題。
圖26是表示部分結(jié)構(gòu)顯示用的DTD生成順序的流程圖。首先,取得登錄用的DTD(2601)。
其次,取出DTD中的ELEMENT項(xiàng)目(2602)。在內(nèi)容模型中包含CDATA、RCDATA、#PCDATA時(shí),附加高亮度信息(2603~2606)。
高亮度信息的附加,和圖11的1103~1106步驟的處理相同。
其次,檢查內(nèi)容模型中的出現(xiàn)指示符(*、+、?、無(wú)),如果是″+″(2607),就變更為″*″(2608),如果沒(méi)有指示符(2609),就附加″?″(2610)。
對(duì)所有的ELEMENT聲明的處理結(jié)束時(shí)(2611),就追加高亮度用的結(jié)構(gòu)的ELEMENT聲明(2612),進(jìn)而如果必須出現(xiàn)存在下位結(jié)構(gòu)的結(jié)構(gòu)的標(biāo)記,就變更為不需要(0)。
下面,參照
使用本發(fā)明的實(shí)施例4。
圖27是本實(shí)施例的系統(tǒng)結(jié)構(gòu)圖。
WWW(World Wide Web)檢索系統(tǒng)(2700)使用網(wǎng)絡(luò)(2702)與客戶(2701)連接。
客戶(2701)是PC、WC等,在客戶(2701)上工作的網(wǎng)絡(luò)瀏覽器(2703)上的檢索項(xiàng)設(shè)定畫(huà)面上,輸入檢索項(xiàng)。在WWW檢索系統(tǒng)(2700)中,使用該檢索項(xiàng)進(jìn)行檢索,并將該檢索結(jié)果向網(wǎng)絡(luò)瀏覽器(2703)輸出。
WWW檢索系統(tǒng)(2700)由接收客戶(2701)的檢索項(xiàng)的HTTP服務(wù)器(2704)、插入檢索處理和高亮度用標(biāo)記的數(shù)據(jù)控制部(2705)和預(yù)先存儲(chǔ)高亮度標(biāo)記的位置信息等的存儲(chǔ)器(2706)構(gòu)成,連接預(yù)先存儲(chǔ)作為檢索對(duì)象的HTML文檔的磁盤裝置(2707)。
在數(shù)據(jù)控制部(2705)中,將HTTP服務(wù)器(2704)接收的檢索項(xiàng)對(duì)在磁盤(2707)中存在的HTML文檔進(jìn)行檢索處理,將高亮度標(biāo)記插入到與檢索項(xiàng)匹配的HTML文檔的檢索匹配位置。
存儲(chǔ)器(2706)由存儲(chǔ)各文檔的檢索匹配數(shù)的高亮度數(shù)存儲(chǔ)區(qū)域(2708)、存儲(chǔ)檢索結(jié)果位置信息的高亮度位置信息存儲(chǔ)區(qū)域(2709)、預(yù)先存儲(chǔ)插入的高亮度用標(biāo)記的內(nèi)容的高亮度用標(biāo)記字符存儲(chǔ)區(qū)域(2710)、存儲(chǔ)插入高亮度用標(biāo)記的HTML文檔的HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)和由WWW檢索系統(tǒng)(2700)的HTTP服務(wù)器(2704)取得在客戶(2701)輸入的檢索項(xiàng)并暫時(shí)存儲(chǔ)的檢索項(xiàng)存儲(chǔ)區(qū)域(2712)構(gòu)成。
由WWW檢索系統(tǒng)(2700)插入高亮度用標(biāo)記的HTML文檔,從HTTP服務(wù)器(2704)經(jīng)過(guò)網(wǎng)絡(luò)(2702)在客戶(2701)的網(wǎng)絡(luò)瀏覽器(2703)上進(jìn)行顯示。
下面,使用圖28說(shuō)明數(shù)據(jù)控制部(2705)的處理內(nèi)容。
這里,取得由客戶(2701)設(shè)定的檢索項(xiàng),進(jìn)行檢索處理,檢測(cè)檢索匹配位置,生成高亮度位置信息(2709),將高亮度用的標(biāo)記插入到與和檢索條件匹配的HTML文檔的檢索項(xiàng)匹配的HTML文檔的檢索匹配位置,并在客戶(2701)的網(wǎng)絡(luò)瀏覽器(2703)上進(jìn)行顯示。
步驟2800在WWW檢索系統(tǒng)(2700)中,使用HTTP服務(wù)器(2704)取得由客戶(2701)設(shè)定的檢索項(xiàng)。取得的檢索項(xiàng)存儲(chǔ)到存儲(chǔ)器(2706)的檢索項(xiàng)存儲(chǔ)區(qū)域(2712)中。
步驟2801使用在步驟2800存儲(chǔ)到檢索項(xiàng)存儲(chǔ)區(qū)域(2712)中的檢索項(xiàng),對(duì)磁盤裝置(2707)存儲(chǔ)的HTML文檔進(jìn)行全文檢索。檢索匹配時(shí),取得HTML文檔中的檢索匹配位置及檢索匹配數(shù)等,并將該信息存儲(chǔ)到高亮度位置信息存儲(chǔ)區(qū)域(2709)和高亮度數(shù)存儲(chǔ)區(qū)域(2708)中。對(duì)于該處理,使用圖29詳細(xì)說(shuō)明。
步驟2802根據(jù)在步驟2801生成的存儲(chǔ)在高亮度位置信息存儲(chǔ)區(qū)域(2709)中的信息,將存儲(chǔ)在高亮度標(biāo)記字符存儲(chǔ)區(qū)域(2710)中的高亮度用標(biāo)記插入到HTML文檔的檢索匹配的位置,并存儲(chǔ)到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。詳細(xì)情況,使用圖33進(jìn)行說(shuō)明。
步驟2803使用HTTP服務(wù)器(2704)將由步驟2802生成的存儲(chǔ)在HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中的高亮度用HTML文檔在客戶(2701)的網(wǎng)絡(luò)瀏覽器(2703)上進(jìn)行顯示。
通過(guò)反復(fù)進(jìn)行步驟2800~2803的處理,使用由客戶(2701)輸入的檢索條件檢索磁盤(2707)存儲(chǔ)的HTML文檔,對(duì)與檢索條件匹配的文檔可以采用多個(gè)地方的檢索匹配位置的高亮度顯示。
下面,使用圖29說(shuō)明圖28的步驟2801的高亮度位置信息的生成處理。
步驟2900讀出磁盤(2707)存儲(chǔ)的HTML文檔。圖34的HTML文檔(3400),就是讀出的HTML文檔的例子。
用網(wǎng)絡(luò)瀏覽器顯示該HTML文檔時(shí),則顯示為3401所示的畫(huà)面。
步驟2901將存儲(chǔ)高亮度位置信息的區(qū)域即高亮度位置信息存儲(chǔ)區(qū)域(2709)確保α件數(shù)。α是任意的正整數(shù)。另外,確保存儲(chǔ)高亮度數(shù)的高亮度數(shù)存儲(chǔ)區(qū)域(2708)。
高亮度位置信息存儲(chǔ)區(qū)域(2709)和高亮度數(shù)存儲(chǔ)區(qū)域(2708)的數(shù)據(jù)形式示于圖30和圖31。
如圖30所示,高亮度位置信息存儲(chǔ)區(qū)域(2709)由HTML文檔序號(hào)(3000)、從開(kāi)頭開(kāi)始的高亮度位置序號(hào)(3001)、高亮度字節(jié)數(shù)(3002)和高亮度插入標(biāo)記序號(hào)(3003)構(gòu)成。
HTML文檔序號(hào)(3000),是在步驟2900讀出的HTML文檔的序號(hào)。存儲(chǔ)著存儲(chǔ)HTML文檔時(shí)附加的系列序號(hào)等。
從開(kāi)頭開(kāi)始的高亮度位置序號(hào)(3001)在由步驟2900讀出的HTML文檔中與在步驟2800取得的檢索示于匹配時(shí),從文檔開(kāi)頭開(kāi)始按字節(jié)數(shù)存儲(chǔ)HTML文檔中的檢索匹配位置。
高亮度字節(jié)數(shù)(3002),按字節(jié)數(shù)存儲(chǔ)高亮度的長(zhǎng)度。即,存儲(chǔ)檢索項(xiàng)的字符串長(zhǎng)度。
高亮度插入標(biāo)記序號(hào)(3003),在按多個(gè)檢索項(xiàng)進(jìn)行高亮度顯示時(shí),可以按各檢索項(xiàng)區(qū)別高亮度有標(biāo)記而進(jìn)行顯示。根據(jù)這里存儲(chǔ)的信息,區(qū)別高亮度用標(biāo)記。即,這里存儲(chǔ)判斷高亮度顯示所利用的標(biāo)記的種類的數(shù)據(jù)。
步驟2902將表示高亮度位置信息存儲(chǔ)區(qū)域(2709)存儲(chǔ)的計(jì)數(shù)的i_cnt初始設(shè)定為0。
步驟2903檢查在步驟2800讀出的檢索項(xiàng)與在步驟2900讀出的HTML文檔是否一致。存在檢索匹配地方時(shí),就進(jìn)入步驟2904。另外,不存在時(shí),就進(jìn)入步驟2908。
步驟2904檢查在步驟2901或2905確保的高亮度位置信息存儲(chǔ)區(qū)域(2709)是否大于表示高亮度存儲(chǔ)數(shù)的i_cnt。還存在存儲(chǔ)數(shù)據(jù)的區(qū)域時(shí),就進(jìn)入步驟2906。另外,不存在存儲(chǔ)的區(qū)域時(shí),就進(jìn)入步驟2905。
步驟2905將高亮度位置信息存儲(chǔ)區(qū)域(2709)放大一定值,重新進(jìn)行確保,并進(jìn)入步驟2906。
步驟2906將HTML文檔序號(hào)(3000)、從HTML文檔的開(kāi)頭開(kāi)始的位置(3001)、高亮度字符數(shù)(3002)和高亮度標(biāo)記插入序號(hào)(3003)存儲(chǔ)到在步驟2901或2905確保的高亮度位置信息存儲(chǔ)區(qū)域(2709)的第i_cnt個(gè)的位置。由于i_cnt初始化為0,所以,i_cnt為0時(shí),第0個(gè)就存儲(chǔ)數(shù)據(jù)。
在1個(gè)HTML文檔中存儲(chǔ)多個(gè)高亮度信息時(shí),由于更新i_cnt,所以,存儲(chǔ)到i_cnt所示的位置。
將在步驟2900讀出的HTML文檔(3400)定為HTML文檔序號(hào)「001」。此外,將在步驟2800抽出的檢索項(xiàng)定為「專集」。
在該HTML文檔(3400)中檢索該檢索項(xiàng)「專集」時(shí),就可以從HTML文檔(3400)的開(kāi)頭開(kāi)始到第122字節(jié)(3403)找到「專集」的字符。
這時(shí),對(duì)于HTML文檔序號(hào)(3000),就存儲(chǔ)作為HTML文檔序號(hào)的「001」(3404),對(duì)于從HTML文檔的開(kāi)頭開(kāi)始的位置(3001),存儲(chǔ)「122」(3405),對(duì)于高亮度字符數(shù)(3002),存儲(chǔ)「專集」的字節(jié)數(shù)「4」(3406)。最后,對(duì)于高亮度標(biāo)記插入序號(hào)(3003),存儲(chǔ)表示用于強(qiáng)調(diào)檢索結(jié)果的標(biāo)記的序號(hào)。這里,存儲(chǔ)「1」(3407)。
高亮度插入標(biāo)記與實(shí)際存儲(chǔ)的高亮度標(biāo)記對(duì)應(yīng)的結(jié)構(gòu)示于圖32。在圖32的(1)中,示出了高亮度標(biāo)記字符存儲(chǔ)區(qū)域(2710)存儲(chǔ)的高亮度插入標(biāo)記用的結(jié)構(gòu)體3200。
高亮度插入標(biāo)記用的結(jié)構(gòu)體(3200)由存儲(chǔ)系列序號(hào)的標(biāo)記序號(hào)1(3202)、存儲(chǔ)高亮度開(kāi)始標(biāo)記名的開(kāi)始標(biāo)記1(3203)、存儲(chǔ)高亮度結(jié)束標(biāo)記名的結(jié)束標(biāo)記1(3204)和存儲(chǔ)標(biāo)記的個(gè)數(shù)的高亮度標(biāo)記數(shù)(3201)構(gòu)成。存在高亮度標(biāo)記數(shù)存儲(chǔ)個(gè)數(shù)的標(biāo)記序號(hào)、開(kāi)始標(biāo)記、結(jié)束標(biāo)記。
下面,說(shuō)明高亮度標(biāo)記字符存儲(chǔ)區(qū)域的使用例(2)。
這里,給出了存儲(chǔ)3種高亮度標(biāo)記的情況。因此,在存儲(chǔ)高亮度標(biāo)記數(shù)的地方存儲(chǔ)「3」(3205)。對(duì)于標(biāo)記序號(hào)「0」(3206)的地方的開(kāi)始標(biāo)記,存儲(chǔ)表示紅色的標(biāo)記「<FONT COLOR=“RED”>」(3207),對(duì)于結(jié)束標(biāo)記,存儲(chǔ)「</FONT>」(3208)。同樣,對(duì)于標(biāo)記序號(hào)「1」(3209),存儲(chǔ)表示閃爍的標(biāo)記「<BLINK>」,對(duì)于標(biāo)記序號(hào)「2」(3210),存儲(chǔ)表示字符大的「<H1>」。
高亮度標(biāo)記字符存儲(chǔ)區(qū)域(2710),在高亮度位置信息存儲(chǔ)區(qū)域(2709)生成之前生成。另外,該高亮度標(biāo)記字符存儲(chǔ)區(qū)域(2710),也可以使用用戶界面而生成。
通過(guò)準(zhǔn)備多個(gè)高亮度用標(biāo)記,在進(jìn)行不同標(biāo)記或同義詞的檢索處理時(shí),對(duì)于用不同表記檢索的字符,可以用標(biāo)記序號(hào)「1」表示,對(duì)于用同義詞檢索的字符,可以用標(biāo)記序號(hào)「2」表示,對(duì)各檢索條件可以進(jìn)行不同的高亮度顯示。
對(duì)于高亮度用標(biāo)記,使用「<BLINK>」時(shí),對(duì)于高亮度位置信息存儲(chǔ)區(qū)域(3402)的高亮度標(biāo)記插入序號(hào)(3407),存儲(chǔ)「1」。
步驟2907由于在步驟2906將數(shù)據(jù)存儲(chǔ)到了高亮度位置信息存儲(chǔ)區(qū)域(2709)中,所以,將i_cnt增加1,并返回到步驟2903。
步驟2908取得在步驟2900取得的HTML文檔中的高亮度數(shù),并存儲(chǔ)到高亮度數(shù)存儲(chǔ)區(qū)域(2708)中。下面,使用圖31說(shuō)明高亮度數(shù)存儲(chǔ)區(qū)域(2708)的結(jié)構(gòu)體的內(nèi)容。
圖31是高亮度數(shù)存儲(chǔ)區(qū)域(2708)的結(jié)構(gòu)體的內(nèi)容。3100是在步驟2900讀出的HTML文檔的文檔序號(hào)。另外,3101是預(yù)先存儲(chǔ)取得的高亮度數(shù)的地方。這里,將文檔序號(hào)「001」存儲(chǔ)到文檔序號(hào)3100處,將i_cnt存儲(chǔ)到高亮度數(shù)存儲(chǔ)區(qū)域(3101)處,并結(jié)束處理。
下面,使用圖33說(shuō)明帶高亮度用標(biāo)記的HTML文檔生成處理。
步驟3300檢查在步驟2900讀出的HTML文檔中是否必須插入高亮度標(biāo)記。
存在(2709)HTML文檔序號(hào)(3000)時(shí),就進(jìn)入步驟3301。不存在時(shí),在步驟3309就輸出所有的文本,并結(jié)束處理。
步驟3301將表示處理計(jì)數(shù)的i_cnt初始化為0。
步驟3302確保存儲(chǔ)插入了高亮度標(biāo)記的HTML文檔的HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)。
HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)確保HTML原文檔字節(jié)數(shù)中將高亮度用開(kāi)始標(biāo)記和結(jié)束標(biāo)記的字節(jié)數(shù)總和乘以高亮度插入數(shù)的字節(jié)數(shù)的區(qū)域。
高亮度的開(kāi)始標(biāo)記和結(jié)束標(biāo)記,根據(jù)高亮度位置信息存儲(chǔ)區(qū)域(2709)的高亮度插入標(biāo)記序號(hào)(3003)計(jì)算高亮度用標(biāo)記的標(biāo)記字符串長(zhǎng)度。高亮度數(shù)取得在步驟2908存儲(chǔ)到高亮度數(shù)存儲(chǔ)區(qū)域(2708)中的高亮度數(shù)(3101)。
步驟3303檢查高亮度數(shù)(3101)是否小于i_cnt。
小于時(shí),由于存在未處理的高亮度地方,所以,就進(jìn)入步驟3304。除此之外,由于應(yīng)處理的高亮度地方全部結(jié)束了,所以,就進(jìn)入步驟3309。
步驟3304將高亮度位置之前的HTML文檔存儲(chǔ)到在步驟3302確保的HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。
步驟3305將高亮度開(kāi)始標(biāo)記存儲(chǔ)HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。高亮度開(kāi)始標(biāo)記,是根據(jù)從高亮度插入標(biāo)記序號(hào)(3003)抽出的序號(hào)而得到的高亮度標(biāo)記字符存儲(chǔ)區(qū)域(2710)中的標(biāo)記名。
圖34(3)的情況,對(duì)于高亮度插入標(biāo)記序號(hào)(3003),就是存儲(chǔ)「1」。將圖32(2)所示的高亮度標(biāo)記字符存儲(chǔ)區(qū)域(2710)存儲(chǔ)為標(biāo)記序號(hào)「1」(3209)的「<BLINK>」存儲(chǔ)到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。
步驟3306將檢索項(xiàng)存儲(chǔ)到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。
圖34的情況,就是將「專集」存儲(chǔ)到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。
步驟3307將刮亮度結(jié)束標(biāo)記存儲(chǔ)到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。高亮度結(jié)束標(biāo)記,和在步驟3305處理的高亮度開(kāi)始標(biāo)記一樣,存儲(chǔ)根據(jù)用高亮度插入標(biāo)記序號(hào)(3003)存儲(chǔ)的序號(hào)而得到的高亮度標(biāo)記字符存儲(chǔ)區(qū)域(2710)存儲(chǔ)的標(biāo)記名。
圖34(3)的情況,就是存儲(chǔ)「1」。因此,將存儲(chǔ)為圖32(2)的標(biāo)記序號(hào)「1」的「</BLINK>」存儲(chǔ)到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。
步驟3308在步驟3305~步驟3307,將數(shù)據(jù)存儲(chǔ)到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中后,將i_cnt增加1,并返回到步驟3303。
步驟3309從高亮度插入位置到HTML文檔最后,將文本存儲(chǔ)到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中,結(jié)束帶高亮度標(biāo)記的HTML文檔的生成處理。
通過(guò)使用上述處理,根據(jù)客戶(2701)設(shè)定的檢索項(xiàng)檢索HTML文檔,對(duì)與檢索項(xiàng)一致的文檔,可以生成存儲(chǔ)高亮度數(shù)的高亮度數(shù)存儲(chǔ)區(qū)域(2708)和存儲(chǔ)高亮度位置的高亮度位置信息存儲(chǔ)區(qū)域(2709)的內(nèi)容。
上述處理結(jié)果的例子示于圖9。3500是插入高亮度用標(biāo)記的HTML文檔。高亮度用標(biāo)記插入到檢索匹配的「專集」的前后(3501、3502)。
將該HTML文檔顯示在畫(huà)面上時(shí),如3503那樣,檢索匹配的「專集」(3504)進(jìn)行閃爍顯示。
以上,作為本發(fā)明的實(shí)施例1,說(shuō)明了從HTML文檔(2707)中檢索客戶(2701)插入的檢索項(xiàng)并生成將高亮度用標(biāo)記插入到匹配位置的帶高亮度用標(biāo)記的HTML文檔的方法。
下面,使用圖36~圖42說(shuō)明本發(fā)明的實(shí)施例5。
圖36是用HTML文檔的標(biāo)記分割檢索項(xiàng)時(shí)和在標(biāo)記內(nèi)存在檢索項(xiàng)時(shí)的高亮度顯示方法的系統(tǒng)結(jié)構(gòu)圖。
和圖27一樣,在客戶(2701)的網(wǎng)絡(luò)瀏覽器(2703)上設(shè)定檢索項(xiàng)。
WWW檢索系統(tǒng)(2700)由取得檢索項(xiàng)的HTTP服務(wù)器(2704)、進(jìn)行檢索處理的數(shù)據(jù)的控制部(2705)和確保區(qū)域的存儲(chǔ)器(2706)構(gòu)成。
存儲(chǔ)器(2706),除了在圖27的說(shuō)明中所述的以外,由用設(shè)計(jì)顯示等使用的標(biāo)記存儲(chǔ)跳躍讀取的標(biāo)記名的跳躍讀取標(biāo)記名存儲(chǔ)區(qū)域(3600)、預(yù)先暫時(shí)存儲(chǔ)客戶(2701)輸入的檢索項(xiàng)和HTML文檔(2707)一致的開(kāi)始位置的開(kāi)始位置存儲(chǔ)區(qū)域(3601)、在HTML標(biāo)記的開(kāi)始字符「<」和結(jié)束字符「>」之間存在與檢索項(xiàng)匹配的位置時(shí)預(yù)先存儲(chǔ)作為記號(hào)的標(biāo)志的再次記述標(biāo)志存儲(chǔ)區(qū)域(3602)、檢索項(xiàng)與HTML標(biāo)記的開(kāi)始標(biāo)記和結(jié)束標(biāo)記之間匹配時(shí)預(yù)先存儲(chǔ)在檢索匹配的地方的前后不能輸入高亮度用標(biāo)記的高亮度用標(biāo)記不能插入標(biāo)記名存儲(chǔ)區(qū)域(3603)構(gòu)成。
檢索項(xiàng)用HTML文檔的標(biāo)記跨越時(shí)或在標(biāo)記內(nèi)存在檢索項(xiàng)時(shí)的檢索項(xiàng)的取得、高亮度位置信息的生成和高亮度用標(biāo)記插入方法按圖28所示的處理順序進(jìn)行。另外,使用圖37~圖42說(shuō)明各個(gè)處理內(nèi)容。
使用在步驟2800取得的檢索項(xiàng),在步驟2801的處理中,進(jìn)行檢索處理和高亮度位置信息生成處理。處理內(nèi)容示于圖37的流程圖。
步驟3700從磁盤(2707)中讀出作為處理對(duì)象的HTML文檔。
步驟3701在存儲(chǔ)器(2706)中確保存儲(chǔ)高亮度位置信息的高亮度位置信息存儲(chǔ)區(qū)域(2709)和高亮度數(shù)存儲(chǔ)區(qū)域(2708)。
步驟3702讀出插入到檢索匹配位置的前后的高亮度標(biāo)記。
在圖32(2)的使用例中示出了具體例,從高亮度標(biāo)記字符存儲(chǔ)區(qū)域(2710)中讀出高亮度用標(biāo)記。這時(shí),根據(jù)「3」(3205)可知高亮度插入標(biāo)記序號(hào)的個(gè)數(shù)為「3個(gè)」。對(duì)于第1個(gè)的「0」(3206),存儲(chǔ)「<FONT COLOR=“RED”>」(3207)和「</FONT>」(3208)。因此,高亮度插入標(biāo)記序號(hào)第0個(gè)的開(kāi)始標(biāo)記為「<FONT COLOR=“RED”>」,結(jié)束標(biāo)記為「</FONT>」。同樣,高亮度插入標(biāo)記序號(hào)第1個(gè)的開(kāi)始標(biāo)記為「<BLINK>」,結(jié)束標(biāo)記為「</BLINK>」,高亮度插入標(biāo)記序號(hào)第2個(gè)的開(kāi)始標(biāo)記為「<H1>」,結(jié)束標(biāo)記為「</H1>」。
步驟3703將表示HTML文檔的處理過(guò)的字符數(shù)的計(jì)數(shù)的i_cnt和存儲(chǔ)高亮度數(shù)的區(qū)域的內(nèi)容初始設(shè)定為0。
步驟3704
檢查檢索項(xiàng)和HTML文檔的字符串是否一致。作為檢查方法,根據(jù)HTML文檔的第i_cnt個(gè)字節(jié)檢索與檢索項(xiàng)的開(kāi)頭字符一致的字符。在步驟3703,由于初始設(shè)定是設(shè)定為0,所以,開(kāi)始時(shí)從HTML文檔的第0個(gè)字節(jié)開(kāi)始檢索一致的字符。一致時(shí),就進(jìn)入步驟3705。不一致時(shí),就結(jié)束處理。
另外,這里,作為抽出檢索項(xiàng)的方法,使用跳過(guò)指定的標(biāo)記進(jìn)行檢索的方法。具體而言,就是在HTML文檔中存在跳躍讀取標(biāo)記名存儲(chǔ)區(qū)域(3600)存儲(chǔ)的標(biāo)記名時(shí),就跳躍讀取該標(biāo)記名,進(jìn)行檢索處理。
將「IMG」預(yù)先存儲(chǔ)到跳躍讀取標(biāo)記名存儲(chǔ)區(qū)域(3600)中,檢索圖34的HTML文檔(3400)時(shí),從HTML文檔(3400)中的開(kāi)頭開(kāi)始掃描數(shù)據(jù),在抽出「IMG」(3413)的時(shí)刻,跳過(guò)標(biāo)記內(nèi)的字符。即,跳躍到標(biāo)記的結(jié)束字符「>」(3414)之前。
通過(guò)將該跳躍讀取標(biāo)記名存儲(chǔ)區(qū)域(3600)預(yù)先設(shè)定到檢索處理之前,就可以進(jìn)行跳躍讀取處理。
步驟3705將在步驟3704從HTML文檔的開(kāi)頭到與檢索項(xiàng)的開(kāi)頭字符一致的字符的字符數(shù)暫時(shí)存儲(chǔ)到開(kāi)始位置存儲(chǔ)區(qū)域(3601)中。
步驟3706檢查檢索項(xiàng)的字符串與書(shū)寫(xiě)在HTML文檔中的字符是否一致,一致時(shí)就檢查一致的地方是否存在于HTML標(biāo)記內(nèi)或HTML標(biāo)記外。此外,用從HTML文檔的開(kāi)頭開(kāi)始的字符數(shù)確保檢索匹配的字符串的最后的字符的位置。詳細(xì)情況,使用圖38說(shuō)明。
步驟3707檢查步驟3706的結(jié)果是否已檢索匹配了。在HTML文檔中存在檢索項(xiàng)時(shí),就進(jìn)入步驟3708。不存在檢索項(xiàng)時(shí),就進(jìn)入步驟3712。
步驟3708將在步驟3701確保的高亮度數(shù)存儲(chǔ)區(qū)域(3708)與高亮度存儲(chǔ)數(shù)進(jìn)行比較,如果確保的區(qū)域多于存儲(chǔ)的高亮度數(shù),就進(jìn)入步驟3709。如果少于存儲(chǔ)的高亮度數(shù),就進(jìn)入步驟3710。
步驟3709
在高亮度位置信息存儲(chǔ)區(qū)域(2709)中,由于存儲(chǔ)數(shù)據(jù)的區(qū)域不足,所以,再次進(jìn)行區(qū)域設(shè)定,并進(jìn)入步驟3710。
步驟3710將高亮度顯示的字符數(shù)和高亮度的位置信息存儲(chǔ)到高亮度位置信息存儲(chǔ)區(qū)域(3600)中。具體而言,對(duì)于用圖30說(shuō)明的高亮度位置信息存儲(chǔ)區(qū)域(3600)的HTML文檔序號(hào)(3000),存儲(chǔ)在步驟3700讀出的HTML文檔的文檔序號(hào),對(duì)于從開(kāi)頭開(kāi)始的高亮度位置信息(3001),存儲(chǔ)在步驟3705取得的開(kāi)始位置。另外,對(duì)于高亮度的字節(jié)數(shù)(3002),存儲(chǔ)檢索項(xiàng)的字符串長(zhǎng)度,對(duì)于高亮度插入標(biāo)記序號(hào)(3003),存儲(chǔ)在步驟3702讀出的標(biāo)記的序號(hào)。
高亮度插入標(biāo)記序號(hào)(3003),作為缺省,設(shè)定為「0」。
步驟3711對(duì)于檢索項(xiàng)存在多個(gè)匹配的字符串時(shí),從檢索匹配的位置的下一個(gè)字符開(kāi)始,再次進(jìn)行檢查檢索項(xiàng)與HTML文檔中的一致的地方的處理。因此,將從記述在步驟3706確保的檢索匹配的最后的字符的位置的HTML文檔的開(kāi)頭開(kāi)始的字符數(shù)加上1的值賦值于i_cnt。如果更新了處理位置,就返回到步驟3704。
步驟3712在步驟3705取得的開(kāi)始位置存儲(chǔ)區(qū)域(3600)存儲(chǔ)的從開(kāi)始位置開(kāi)始的字符串與檢索項(xiàng)不一致時(shí),就從開(kāi)始位置的下一個(gè)字符開(kāi)始再次進(jìn)行檢查檢索項(xiàng)與HTML文檔中的一致的地方的處理。因此,將開(kāi)始位置存儲(chǔ)區(qū)域(3600)存儲(chǔ)的開(kāi)始位置增加1的值賦值于i_cnt。如果更新了處理位置,就返回到步驟3704。
以上,說(shuō)明了包括標(biāo)記內(nèi)和標(biāo)記外的檢查的檢索處理和高亮度位置信息生成處理。
下面,使用圖38說(shuō)明步驟3706的標(biāo)記內(nèi)的檢索和標(biāo)記外的檢索處理。這里,檢查在步驟3705取得的檢索匹配的開(kāi)始位置是存在于表示文檔結(jié)構(gòu)的標(biāo)記的屬性中或存在于標(biāo)記之外,并檢查從檢索匹配的開(kāi)始位置開(kāi)始的字符串與檢索項(xiàng)是否一致。
步驟3800
在步驟3705中開(kāi)始位置存儲(chǔ)區(qū)域(3600)存儲(chǔ)的檢索匹配的開(kāi)始位置,檢查是HTML標(biāo)記內(nèi)或標(biāo)記外。
從步驟3706時(shí)刻的HTML文檔的第i_cnt個(gè)字節(jié)開(kāi)始,檢查到檢索匹配的開(kāi)始位置之前的數(shù)據(jù)。檢查與標(biāo)記的開(kāi)始字符「<」對(duì)應(yīng)的標(biāo)記的結(jié)束字符「>」,檢查在標(biāo)記內(nèi)是否存在檢索匹配的開(kāi)始位置。有標(biāo)記的開(kāi)始字符「<」并在標(biāo)記的結(jié)束字符「>」之前存在檢索匹配的開(kāi)始位置時(shí),就假定開(kāi)始位置存在于標(biāo)記內(nèi),并進(jìn)入步驟3801。在未由標(biāo)記的開(kāi)始字符「<」和標(biāo)記的結(jié)束字符「>」包圍的范圍內(nèi)存在檢索匹配的開(kāi)始位置時(shí),就假定檢索匹配的開(kāi)始位置存在于標(biāo)記外,并進(jìn)入步驟3804。
步驟3801檢查檢索項(xiàng)與從檢索匹配的開(kāi)始位置開(kāi)始的字符串是否一致。檢索項(xiàng)的字符串由多個(gè)字節(jié)構(gòu)成時(shí),就檢查每個(gè)字節(jié)的字符串。檢索項(xiàng)的字符串與從檢索匹配的位置開(kāi)始的字符串一致時(shí),就進(jìn)入步驟3802。不一致時(shí),就進(jìn)入步驟3803。
步驟3802在步驟3801,與檢索項(xiàng)一致時(shí),就假定已「檢索匹配」,并結(jié)束處理。
另外,求檢索匹配的字符串的終端位置。假定終端位置是在檢索匹配的開(kāi)始字符位置加上檢索項(xiàng)的字符串長(zhǎng)度的字節(jié)數(shù)。這里所求的終端位置,在步驟3711中使用。
步驟3803在步驟3801檢索項(xiàng)不一致時(shí),就假定「檢索不匹配」,不結(jié)束處理。
步驟3804在步驟3800,檢索匹配的開(kāi)始位置存在于標(biāo)記外時(shí),就進(jìn)行標(biāo)記外用的檢索處理。標(biāo)記外用的檢索處理,使用圖39進(jìn)行說(shuō)明。
步驟3805檢查在步驟3804檢索項(xiàng)匹配的地方在HTML文檔中是否存在。存在時(shí),就進(jìn)入步驟3807。不存在時(shí),就進(jìn)入3806。
步驟3806在步驟3805檢索項(xiàng)不匹配時(shí),就結(jié)束處理。
步驟3807在步驟3805與檢索項(xiàng)一致時(shí),就假定「檢索匹配」,并結(jié)束處理。
另外,求檢索匹配的字符串的終端位置。假定終端位置是在檢索匹配的開(kāi)始字符位置加上記述在步驟3804檢測(cè)的檢索匹配的最后的字符的位置的值。這里所求的終端位置,在步驟3711中使用。
以上,說(shuō)明了標(biāo)記內(nèi)檢索和標(biāo)記外檢索處理。
下面,使用圖39說(shuō)明步驟3804的標(biāo)記外用的檢索處理。
步驟3900檢查在HTML文檔中是否存在檢索項(xiàng)。檢查檢索項(xiàng)的字符串與在HTML文檔中存在字符串是否一致,但是,從檢索匹配的開(kāi)始位置,通過(guò)跳過(guò)途中存在的標(biāo)記,有一致的情況,所以,這里檢查從檢索匹配的開(kāi)始位置開(kāi)始是否每1個(gè)字符與檢索項(xiàng)一致。
下面,具體地使用圖34進(jìn)行說(shuō)明。
假定檢索項(xiàng)為「專集記事」時(shí),就在(2)的顯示畫(huà)面上,在3408處顯示「專集記事」。但是,在HTML文檔(3400)中,在「專集」(3403)和「記事」(3416)之間有「</H1>」(3417)的標(biāo)記。這樣,在檢索項(xiàng)的中途存在HTML標(biāo)記時(shí),就跳躍讀取該HTML標(biāo)記,抽出與檢索項(xiàng)一致的字符串。
這里,將檢索項(xiàng)按每1字符與HTML文檔的字符進(jìn)行對(duì)照檢查。
檢索項(xiàng)的第1個(gè)字符與HTML文檔中的字符一致時(shí),就對(duì)檢索項(xiàng)的下一個(gè)字符和HTML文檔的下一個(gè)字符反復(fù)進(jìn)行相同的處理。
檢索項(xiàng)的字符串的所有的字符一致時(shí),具體地就進(jìn)行「特」(3403)、「集」、與字符的比較,跳躍讀取「</H1>」(3417),進(jìn)而進(jìn)行「記」(3416)、「事」與字符比較。將所有的檢索項(xiàng)全部抽出時(shí),就進(jìn)入步驟3901。
檢索項(xiàng)與HTML文檔中的字符串完全不一致時(shí),就進(jìn)入步驟3902。
步驟3901
由于在HTML文檔中存在檢索項(xiàng),所以,設(shè)定已「檢索匹配」,并結(jié)束處理。
另外,求檢索匹配的終端位置。終端位置就是在步驟3900最后抽出的字符的位置。
步驟3902在步驟3900檢索項(xiàng)的字符與HTML文檔的字符不一致時(shí),就檢查HTML文檔的字符是否為標(biāo)記的開(kāi)始字符「<」。
是標(biāo)記的開(kāi)始字符「<」時(shí),就進(jìn)入步驟3903。是除此以外的字符時(shí),就進(jìn)入步驟3904。
步驟3903在步驟3902,HTML文檔中的字符是標(biāo)記的開(kāi)始字符「<」時(shí),就跳過(guò)標(biāo)記的內(nèi)容,并返回到步驟3900。
具體而言,就是抽出標(biāo)記的結(jié)束字符「>」,跳躍讀取到抽出的字符之前。在圖34的HTML文檔中(3400),假定檢索項(xiàng)為「專集記事」時(shí),就跳躍讀取從處于「專集」(3403)的下一個(gè)字符的「<」(3417)到標(biāo)記的結(jié)束字符「>」(3418)。即,跳躍讀取「</H1>」。
步驟3904在步驟3902,檢索項(xiàng)不一致時(shí),就假定「檢索不匹配」,并結(jié)束處理。
以上,說(shuō)明了在HTML文檔中存在檢索項(xiàng)的字符串時(shí)抽出檢索匹配位置并將高亮度位置信息存儲(chǔ)到高亮度位置信息存儲(chǔ)區(qū)域中的處理。
下面,使用圖40說(shuō)明根據(jù)存儲(chǔ)到高亮度位置信息存儲(chǔ)區(qū)域中的高亮度位置信息為了強(qiáng)調(diào)顯示HTML文檔的檢索匹配的字符串而插入高亮度用標(biāo)記的方法。
步驟4000讀出在步驟3710存儲(chǔ)到高亮度信息存儲(chǔ)區(qū)域(2709)中的高亮度位置信息。
步驟4001確保用于存儲(chǔ)插入了高亮度標(biāo)記的HTML文檔的HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)。
確保的區(qū)域的大小,是HTML文檔的原文檔的數(shù)據(jù)乘以高亮度標(biāo)記數(shù)的高亮度開(kāi)始標(biāo)記和結(jié)束標(biāo)記的長(zhǎng)度之和的值的字節(jié)數(shù)。
從高亮度標(biāo)記數(shù)存儲(chǔ)區(qū)域(2708)讀出高亮度標(biāo)記數(shù)。另外,根據(jù)高亮度位置信息存儲(chǔ)區(qū)域(2709)的高亮度插入標(biāo)記序號(hào)(3003)和高亮度標(biāo)記字符存儲(chǔ)區(qū)域(2710)檢測(cè)高亮度的開(kāi)始標(biāo)記和結(jié)束標(biāo)記,并求檢測(cè)的標(biāo)記的字符串長(zhǎng)度。
步驟4002將表示HTML文檔中的處理過(guò)的位置的i_cnt和高亮度處理數(shù)初始化為0。
步驟4003將處理過(guò)的高亮度地方的數(shù)即高亮度處理數(shù)與應(yīng)處理的高亮度數(shù)進(jìn)行比較。高亮度處理數(shù)少時(shí),用于進(jìn)行插入高亮度用標(biāo)記的處理,所以,就進(jìn)入步驟4004。在除此以外的情況時(shí),就進(jìn)入步驟4007。
步驟4004將從表示處理過(guò)的位置的i_cnt到檢索匹配的開(kāi)始位置的數(shù)據(jù)存儲(chǔ)到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。
具體而言,就是在圖34的HTML文檔(3400)中,將檢索項(xiàng)作為「專集記事」時(shí),就將從HTML文檔開(kāi)頭到「專集記事」(3403)前的字符「本月的」的數(shù)據(jù)存儲(chǔ)到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。
步驟4005將高亮度用標(biāo)記存儲(chǔ)到檢索匹配位置。使用圖41說(shuō)明高亮度用標(biāo)記的插入處理。
步驟4006將從插入了高亮度結(jié)束標(biāo)記的位置的開(kāi)頭開(kāi)始的字節(jié)數(shù)賦值于表示HTML文檔的處理過(guò)的位置的i_cnt,并返回到步驟4003。
步驟4007將從表示HTML文檔的處理過(guò)的位置的i_cnt到HTML文檔的最后的數(shù)據(jù)存儲(chǔ)到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中,并結(jié)束處理。
下面,使用圖41說(shuō)明在步驟4005中處理的高亮度標(biāo)記的插入處理。
這里,檢查檢索匹配的位置是在標(biāo)記內(nèi)或標(biāo)記外,并進(jìn)行將高亮度用標(biāo)記插入到檢索匹配位置的前后的處理。
步驟4100檢查在HTML文檔中匹配的位置是在HTML標(biāo)記內(nèi)還是標(biāo)記外。
檢查方法,是在到檢索匹配的開(kāi)始位置之前的HTML文檔中,找HTML標(biāo)記的開(kāi)始字符「<」和標(biāo)記的結(jié)束字符「>」的對(duì)應(yīng),來(lái)判斷在標(biāo)記內(nèi)還是標(biāo)記外。檢索匹配的開(kāi)始位置處于標(biāo)記的開(kāi)始字符「<」與標(biāo)記的結(jié)束字符「>」之間時(shí),就視為存在于標(biāo)記內(nèi),并進(jìn)入步驟4101。是除此以外的情況時(shí),就視為檢索匹配位置的開(kāi)始位置存在于標(biāo)記外,并進(jìn)入步驟4110。
步驟4101從標(biāo)記的開(kāi)始字符「<」的下一個(gè)字符開(kāi)始抽出字符,取得標(biāo)記的種類。
例如,在圖34的HTML文檔(3400)的情況時(shí),假定檢索項(xiàng)為「hitachi」時(shí),就可以在HTML文檔(3400)中的3409處取得「hitachi」。取得該HTML標(biāo)記的種類時(shí),就可以知道寫(xiě)在標(biāo)記的開(kāi)始字符「<」之后的「A」(3410)。
步驟4102檢查在步驟4101取得的標(biāo)記是開(kāi)始用的標(biāo)記還是結(jié)束用的標(biāo)記。是結(jié)束用的標(biāo)記時(shí),則標(biāo)記的開(kāi)始字符「<」的下一個(gè)字符就是「/(斜杠)」。因此,就檢查、判斷標(biāo)記的開(kāi)始字符「<」的下一個(gè)字符。該標(biāo)記的開(kāi)始字符「<」的下一個(gè)字符是「/」時(shí),就判定為結(jié)束用的標(biāo)記,并進(jìn)入步驟4105。除此以外的情況時(shí),就判定為開(kāi)始標(biāo)記,并進(jìn)入步驟4103。
步驟4103檢查是否可以將高亮度用的標(biāo)記插入到開(kāi)始用標(biāo)記與結(jié)束用標(biāo)記之間。
可以插入時(shí),就進(jìn)入步驟4105。另外,不能插入時(shí),就進(jìn)入步驟4106。
具體而言,在圖34的HTML文檔(3400)中,檢索項(xiàng)為「hitachi」時(shí),HTML標(biāo)記的種類就是在「hitachi」(3409)之前存在的「A」(3410)。所謂開(kāi)始用的標(biāo)記,就是夾在包圍HTML標(biāo)記的種類的「<」和「>」之間的部分的「<A~>」(3410),所謂結(jié)束用的標(biāo)記,就是「</A>」(3412)。
該HTML標(biāo)記是寫(xiě)為開(kāi)始用標(biāo)記和結(jié)束用標(biāo)記的字符串在畫(huà)面上顯示并選擇該字符串時(shí)與在開(kāi)始與標(biāo)記內(nèi)指定的URL鏈接的標(biāo)記。將高亮度用的標(biāo)記插入到該「<A~>」(3410)和「</A>」(3412)之間時(shí),就發(fā)生不能正確地進(jìn)行強(qiáng)調(diào)顯示的現(xiàn)象。因此,視為不能將高亮度用的標(biāo)記插入到該「<A~>」(3410)和「</A>」(3412)之間,并進(jìn)入步驟4104。
高亮度標(biāo)記的插入可否的判斷,是根據(jù)HTML標(biāo)記的種類存儲(chǔ)在高亮度標(biāo)記插入不可能標(biāo)記名存儲(chǔ)區(qū)域(3603)中時(shí),如果與標(biāo)記的某一個(gè)一致,就判定為不可能,如果與哪一個(gè)都不一致,就判定為可以插入。
存儲(chǔ)在高亮度標(biāo)記插入不可能標(biāo)記名存儲(chǔ)區(qū)域(3603)中的標(biāo)記,使用用戶接口在進(jìn)行數(shù)據(jù)控制(2705)的處理之前預(yù)先生成。
步驟4104不能將檢索匹配的字符串插入到開(kāi)始用標(biāo)記和結(jié)束用標(biāo)記之間時(shí),跳躍到可以插入的地方讀取。
這里,跳躍到結(jié)束用標(biāo)記的結(jié)尾的字符「>」進(jìn)行讀取,取得跳躍讀取的數(shù)據(jù)。
具體而言,在圖34的HTML文檔(3400)中,設(shè)檢索項(xiàng)為「hitachi」時(shí),HTML標(biāo)記就是「A」(3410)。其結(jié)束標(biāo)記就是「</A>」(3412)。
因此,直至「</A)」取得數(shù)據(jù)。
具體而言,設(shè)圖34的HTML文檔(3400)的檢索項(xiàng)為「imagefile.gif」(3411)時(shí),HRML標(biāo)記的種類就是「IMG」(3413),其結(jié)尾的標(biāo)記字符就是「>」(3414)。因此,跳躍讀取到「>」(3414),取得跳躍讀取的數(shù)據(jù)。
步驟4106將在步驟4104、步驟4105取得的數(shù)據(jù)插入到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。另外,求檢索匹配的字符的終端位置。終端位置就是在步驟4104或步驟4105跳躍讀取的位置的字節(jié)數(shù)。
步驟4107將高亮度用的開(kāi)始標(biāo)記插入到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。將寫(xiě)為圖32的開(kāi)始標(biāo)記1(3203)的標(biāo)記名插入到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。
設(shè)高亮度位置信息存儲(chǔ)區(qū)域存儲(chǔ)的數(shù)據(jù)為3402、高亮度標(biāo)記字符存儲(chǔ)區(qū)域?yàn)閳D32的(2)時(shí),由于對(duì)高亮度位置信息存儲(chǔ)區(qū)域的高亮度插入標(biāo)記序號(hào)(3407)記述為「1」,所以,從圖32的(2)可以取得「<BLINK>」。因此,這里,就將「<BLINK>」插入到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。
步驟4108將檢索匹配字符插入到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。但是,由于記述再次檢索匹配字符,所以,存儲(chǔ)再次記述的標(biāo)志。這里,插入再次記述標(biāo)志的存儲(chǔ)區(qū)域(3602)存儲(chǔ)的數(shù)據(jù)。
再次記述標(biāo)志的存儲(chǔ)區(qū)域(3602)在進(jìn)行數(shù)據(jù)控制之前預(yù)先存儲(chǔ)數(shù)據(jù)。例如,預(yù)先存儲(chǔ)「@」標(biāo)志。
步驟4109將高亮度用的結(jié)束標(biāo)記插入到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。將寫(xiě)為圖32的結(jié)束標(biāo)記1(3204)的標(biāo)記名插入到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。這里,是插入「</BLINK>」。
步驟4110檢索匹配的位置存在標(biāo)記外時(shí),進(jìn)行標(biāo)記外用高亮度標(biāo)記插入處理。使用圖42說(shuō)明該處理。
下面,使用圖42說(shuō)明在步驟4110進(jìn)行處理的標(biāo)記外用高亮度插入處理。
步驟4200是「<A~>」標(biāo)記時(shí),將高亮度用的標(biāo)記插入到夾在開(kāi)始用的標(biāo)記「<A~>」和結(jié)束用的標(biāo)記「</A>」之間的地方時(shí),不能反映強(qiáng)調(diào)顯示。這里,檢查是否夾在開(kāi)始標(biāo)記和結(jié)束標(biāo)記之間,判斷是否為在步驟4201可以插入高亮度標(biāo)記的標(biāo)記。但是,在HTML文檔中,存在「HTML」和「<BODY>」的標(biāo)記,由于這些標(biāo)記作為包圍整個(gè)文檔的標(biāo)記使用,所以,這里不作為檢查的對(duì)象。
檢查存儲(chǔ)在從圖30的開(kāi)頭開(kāi)始的高亮度位置信息(3001)中的位置是否被HTML文檔的開(kāi)始用標(biāo)記和結(jié)束用標(biāo)記所包圍。被包圍時(shí),就進(jìn)入步驟4201。不被包圍時(shí),就進(jìn)入步驟4209。
具體而言,在圖34的HTML文檔(3400)中,檢索項(xiàng)為「日立」時(shí),就抽出HTML文檔(3400)的「日立」(3415)。由于它被HTML標(biāo)記「<A~>」(3410)和「</A>」(3412)所包圍,所以,這里就進(jìn)入步驟4201。
步驟4201檢查是否可以將高亮度用標(biāo)記插入到檢索匹配的字符串的前后。
檢查方法,就是抽出被檢索匹配的檢索字符串所包圍的HTML標(biāo)記。將抽出的標(biāo)記的種類與高亮度標(biāo)記插入不可能標(biāo)記名存儲(chǔ)區(qū)域(3603)存儲(chǔ)的標(biāo)記進(jìn)行比較。如果一致,就進(jìn)入步驟4202,不一致時(shí),就進(jìn)入步驟4209。
在高亮度標(biāo)記插入不可能標(biāo)記名存儲(chǔ)區(qū)域(3603)中記述的標(biāo)記名,在開(kāi)始用標(biāo)記和結(jié)束用標(biāo)記之間不能插入高亮度用標(biāo)記。
因此,與高亮度標(biāo)記插入不可能標(biāo)記名存儲(chǔ)區(qū)域(3603)存儲(chǔ)的HTML標(biāo)記進(jìn)行比較,如果一致,就進(jìn)入步驟4202,不一致時(shí),就進(jìn)入步驟4209。
該高亮度插入不可能標(biāo)記名存儲(chǔ)區(qū)域(3603),使用用戶界面在數(shù)據(jù)控制(2705)之前預(yù)先生成。
步驟4202不能插入高亮度用標(biāo)記時(shí),就跳躍讀取結(jié)束用標(biāo)記的結(jié)尾的字符「>」之前的HTML文檔。
在圖34中,假定為檢索項(xiàng)「日立」時(shí),就跳躍讀取「</A>」(3412)之前的HTML文檔。
步驟4203將在步驟4202跳躍讀取的HTML文檔存儲(chǔ)到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。
在圖34中,假定為檢索項(xiàng)「日立」時(shí),將從位于在步驟4002設(shè)定的第i_cnt個(gè)或在步驟4006更新的第i_cnt個(gè)HTML文檔的字符開(kāi)始到「</A>」(3412)的數(shù)據(jù)存儲(chǔ)到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。
步驟4204將高亮度用標(biāo)記的開(kāi)始標(biāo)記插入到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。設(shè)高亮度位置信息存儲(chǔ)區(qū)域?yàn)?402、高亮度標(biāo)記字符存儲(chǔ)區(qū)域?yàn)閳D32的(2)時(shí),就抽出「<BLINK>」。因此,這里,就插入「<BLINK>」。
步驟4205存儲(chǔ)再顯示用標(biāo)志。和步驟4108一樣,讀出存儲(chǔ)在再次記述標(biāo)志的存儲(chǔ)區(qū)域(3602)中的HTML文檔,存儲(chǔ)到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。
步驟4206再一次將檢索匹配的字符串插入到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。
但是,在檢索匹配的字符串的途中存在標(biāo)記時(shí),就插入存在標(biāo)記的地方之前的字符串。
步驟4207將高亮度用的結(jié)束標(biāo)記插入到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。這里,就是插入「</BLINK>」。
步驟4208檢查在步驟4206是否存儲(chǔ)了全部檢索項(xiàng)的字符串。
在檢索匹配的字符串中存在標(biāo)記、未全部存儲(chǔ)檢索匹配的字符串時(shí),就返回到步驟4200。另外,存儲(chǔ)了全部字符串時(shí),就結(jié)束處理。
步驟4209跳躍到檢索匹配的開(kāi)始位置讀取數(shù)據(jù),將跳躍讀取的HTML文檔存儲(chǔ)到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。
具體而言,在圖34的HTML文檔(3400)中,假定檢索項(xiàng)為「專集記事」時(shí),就將在檢索匹配的「專集」(3403)之前存在的「本月的」之前的HTML文檔插入到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。
步驟4210和步驟4205一樣,將高亮度用標(biāo)記的開(kāi)始標(biāo)記存儲(chǔ)到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。這里,就是插入「<BLINK>」。
步驟4211將檢索匹配的字符串插入到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。
但是,在檢索匹配的字符串的途中存在標(biāo)記時(shí),就插入存在標(biāo)記的地方之前的字符串。
例如,在HTML文檔(著400)中,假定檢索項(xiàng)為「專集記事」時(shí),在「專集」(3403)和「記事」(3416)之間存在「</H1>」。因此,這里,就存儲(chǔ)「專集」。
步驟4212將高亮度用標(biāo)記的結(jié)束標(biāo)記插入到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。這里,就是插入「</BLINK>」。
步驟4213檢查在步驟4211是否已將檢索項(xiàng)的全部字符串插入到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。通過(guò)去除HTML的標(biāo)記,使檢索項(xiàng)與HTML文檔的字符串匹配,在從檢索匹配的開(kāi)頭位置開(kāi)始的檢索項(xiàng)長(zhǎng)度的字符串之間存在HTML的標(biāo)記時(shí),在步驟4211,就將HTML標(biāo)記之前的HTML文檔插入到HTML文檔暫時(shí)存儲(chǔ)區(qū)域(2711)中。這時(shí),必須從HTML標(biāo)記開(kāi)始處理其余的檢索匹配的字符。
將所有的檢索項(xiàng)插入到HTML文檔暫時(shí)存儲(chǔ)區(qū)域中時(shí),就結(jié)束處理。另外,從HTML標(biāo)記開(kāi)始處理其余的檢索匹配的字符時(shí),就返回到步驟4200。
在圖34的HTML文檔(3400)中,假定檢索項(xiàng)為「專集記事」時(shí),在「專集」(3403)和「記事」(3416)之間,存在「</H1>」。在步驟4206只插入了「專集」的狀態(tài)下,未插入「記事」,所以,返回到步驟4200。
通過(guò)進(jìn)行這樣的處理,使用客戶(2701)設(shè)定的檢索項(xiàng),將高亮度標(biāo)記插入到與檢索項(xiàng)一致的HTML文檔中,就可以在網(wǎng)絡(luò)瀏覽器(2703)上顯示高亮度匹配地方。
這里,對(duì)1個(gè)檢索項(xiàng)檢查HTML文檔,如果在HTML文檔中存在檢索項(xiàng)的字符串,就在客戶(2701)的網(wǎng)絡(luò)瀏覽器上顯示表示處理結(jié)果的處理方法,但是,也可以對(duì)1個(gè)檢索項(xiàng)從多個(gè)HTML文檔中進(jìn)行檢索,存儲(chǔ)檢索匹配的HTML文檔數(shù)的高亮度位置信息,一起生成存儲(chǔ)了高亮度用標(biāo)記的多個(gè)HTML文檔。
另外,也可以對(duì)多個(gè)檢索項(xiàng)從多個(gè)HTML文檔中進(jìn)行檢索,存儲(chǔ)檢索匹配的HTML文檔數(shù)的高亮度位置信息,一起生成存儲(chǔ)了高亮度用標(biāo)記的多個(gè)HTML文檔。
下面,說(shuō)明使用本發(fā)明的實(shí)施例6。
本實(shí)施例與實(shí)施例2的不同點(diǎn)在于,在檢索條件中可以與檢索項(xiàng)等一起定義與檢索條件匹配時(shí)的高亮度方法。這樣,對(duì)任意的檢索條件,就可以按各檢索條件指定高亮度方法。
本實(shí)施例的系統(tǒng)結(jié)構(gòu)和圖1相同。但是,檢索條件103的記載方法不同。下面,使用圖43說(shuō)明本實(shí)施例的檢索條件103的記述方法的例子。
圖43表示本實(shí)施例的檢索條件的例子。如圖所示,在各檢索項(xiàng)或檢索條件等之后,如「{下劃線}」那樣指定高亮度方法。實(shí)施例2的檢索條件,是「檢索對(duì)象的結(jié)構(gòu)指定檢索條件式」,但是,此處則為「檢索對(duì)象的結(jié)構(gòu)條件{高亮度方法}帶高亮度方法的檢索條件式」。高亮度方法的指定,可以省略。省略時(shí),用實(shí)施例2所示的方法進(jìn)行高亮度顯示。即,對(duì)于未在檢索條件中記載高亮度方法的地方,讀出圖18所示的高亮度方法定義1801,使用本定義信息記載的高亮度方法進(jìn)行高亮度顯示。
圖44表示本實(shí)施例的匹配范圍信息4401的存儲(chǔ)內(nèi)容。與實(shí)施例2的圖17所示的匹配范圍信息的不同點(diǎn)在于,對(duì)各匹配范圍不僅存儲(chǔ)匹配條件4402,而且存儲(chǔ)高亮度方法4403。本信息可以通過(guò)使用圖43分析上述檢索條件、讀出檢索條件中記載的高亮度方法的信息而取得。
圖45表示本實(shí)施例的高亮度顯示用DTD的生成方法。在本例中,每次檢索時(shí)可以重新改變高亮度方法,所以,每次進(jìn)行高亮度顯示時(shí),生成只追加所需要的結(jié)構(gòu)的高亮度顯示用DTD。這時(shí),在DTD中,不僅記述檢索條件,而且直接記述高亮度方法。
如圖所示,對(duì)于登錄使用的原來(lái)的DTD(1901),在上位的高亮度結(jié)構(gòu)內(nèi),可以按層次指定下位的高亮度結(jié)構(gòu),進(jìn)而也可以省略而生成改變、追加定義的高亮度顯示用的DTD(4501)。
DTD的生成方法,首先在圖44的匹配范圍信息中未記載高亮度方法4403時(shí),根據(jù)圖18所示的高亮度方法定義取得與匹配條件對(duì)應(yīng)的高亮度方法。首先,對(duì)于原來(lái)的DTD的各結(jié)構(gòu),變更結(jié)構(gòu)信息(4502),用以可以在內(nèi)容模型中具有在下位結(jié)構(gòu)中出現(xiàn)的高亮度方法。此外,從匹配范圍信息4401的匹配范圍的層次關(guān)系中獲得出現(xiàn)的高亮度用結(jié)構(gòu)的層次關(guān)系。根據(jù)這里得到的高亮度顯示用的層次關(guān)系,作為各高亮度結(jié)構(gòu)的下位結(jié)構(gòu),則具有下位的高亮度結(jié)構(gòu)和字符串作為內(nèi)容模型。如果沒(méi)有下位的高亮度結(jié)構(gòu),則作為內(nèi)容模型,就只出現(xiàn)字符串(4503)。
根據(jù)本實(shí)施例的高亮度處理,不是將檢索條件作為高亮度結(jié)構(gòu),而是生成記述所記載的高亮度方法的高亮度顯示用結(jié)構(gòu)化文檔和高亮度顯示用的DTD。因此,按照本實(shí)施例,是生成圖46所示的顯示用結(jié)構(gòu)化文檔。將本顯示用結(jié)構(gòu)化文檔進(jìn)行高亮度顯示時(shí),就進(jìn)行圖47所示的高亮度顯示。
按照本發(fā)明,作為結(jié)構(gòu)化文檔的檢索結(jié)果,顯示匹配的文檔的內(nèi)容時(shí),可以向各結(jié)構(gòu)的檢索項(xiàng)匹配的范圍輸出附加了高亮度信息的結(jié)構(gòu)化文檔。通過(guò)向結(jié)構(gòu)化文檔中插入高亮度信息而不是與瀏覽器有關(guān)的高亮度信息,則不論在哪個(gè)瀏覽器上都可以進(jìn)行高亮度顯示。
可以根據(jù)檢索時(shí)的條件或各檢索項(xiàng)的重要程度、出現(xiàn)頻度等條件而進(jìn)行不同的高亮度處理,對(duì)于重要的檢索項(xiàng),可以進(jìn)行表明是高加權(quán)的高亮度處理。此外,通過(guò)在檢索條件中記述高亮度方法,可以對(duì)各用戶進(jìn)行任意的高亮度顯示。
此外,只抽出部分結(jié)構(gòu)就可以輸出附加了高亮度信息的結(jié)構(gòu)化文檔。
另外,從存在表示文檔結(jié)構(gòu)的HTML標(biāo)記的文檔中檢索字符串時(shí),在HTML標(biāo)記內(nèi)存在與設(shè)定的檢索項(xiàng)一致的字符串時(shí),或檢索項(xiàng)跨越HTML標(biāo)記記述時(shí),也可以很容易地進(jìn)行檢索匹配。另外,可以將檢索匹配的字符串進(jìn)行高亮度顯示。
權(quán)利要求
1.一種用于具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于分析輸入的結(jié)構(gòu)化文檔,生成分析過(guò)的結(jié)構(gòu)化文檔,將該分析過(guò)的結(jié)構(gòu)化文檔存儲(chǔ)到上述文件裝置中;從該分析過(guò)的結(jié)構(gòu)化文檔中取得各結(jié)構(gòu)內(nèi)的內(nèi)容字符串信息、生成文檔檢索用信息,并存儲(chǔ)到上述文件裝置中;根據(jù)輸入的檢索條件檢索該文件裝置中存儲(chǔ)的文檔檢索用信息,判斷是否有滿足該檢索條件的內(nèi)容字符串信息,取得具有認(rèn)為滿足該檢索條件的內(nèi)容字符串信息的文檔的分析過(guò)的結(jié)構(gòu)化文檔,并且取得滿足該文檔的檢索條件的范圍的信息;生成用于將滿足該文檔的檢索條件的范圍進(jìn)行高亮度顯示的顯示用文檔類型定義(顯示用DTD);根據(jù)滿足上述文檔的檢索條件的范圍的信息和顯示用文檔類型定義生成附加了用于在結(jié)構(gòu)化文檔中進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔。
2.按權(quán)利要求1所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于對(duì)于檢索條件中的2個(gè)檢索項(xiàng),當(dāng)滿足關(guān)于各檢索項(xiàng)的相對(duì)的出現(xiàn)位置的條件時(shí),對(duì)構(gòu)成檢索條件的各檢索項(xiàng)的高亮度顯示和對(duì)包含該2個(gè)檢索項(xiàng)的最小的字符串范圍的高亮度顯示分別使用不同的高亮度顯示形式進(jìn)行高亮度顯示。
3.按權(quán)利要求1所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于對(duì)于檢索條件的多個(gè)檢索項(xiàng),對(duì)構(gòu)成檢索條件的各檢索項(xiàng)的高亮度顯示和對(duì)包含該檢索項(xiàng)的整個(gè)結(jié)構(gòu)的高亮度顯示分別使用不同的高亮度顯示形式進(jìn)行高亮度顯示。
4.按權(quán)利要求1所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于根據(jù)上述顯示用文檔類型定義生成附加了用于進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔時(shí),用于進(jìn)行高亮度顯示的信息,使用在檢索條件中指定的方法進(jìn)行附加。
5.按權(quán)利要求1所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于檢索結(jié)果的高亮度顯示,對(duì)各檢索項(xiàng)使用多個(gè)高亮度顯示中的某一個(gè)進(jìn)行高亮度顯示。
6.按權(quán)利要求5所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于各檢索項(xiàng)的高亮度顯示的高亮度顯示形式,根據(jù)各檢索項(xiàng)的出現(xiàn)頻度的信息而決定。
7.按權(quán)利要求5所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于各檢索項(xiàng)的高亮度顯示的高亮度顯示形式,根據(jù)對(duì)各檢索項(xiàng)預(yù)先給定的加權(quán)的信息而決定。
8.一種用于具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于分析輸入的結(jié)構(gòu)化文檔,生成分析過(guò)的結(jié)構(gòu)化文檔,將該分析過(guò)的結(jié)構(gòu)化文檔存儲(chǔ)到上述文件裝置中,生成從上述輸入的結(jié)構(gòu)化文檔中去除預(yù)先給定的檢索對(duì)象外的結(jié)構(gòu)信息的文檔檢索用的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,并且生成用于將該去除的結(jié)構(gòu)信息復(fù)原的復(fù)原信息,并存儲(chǔ)到上述文件裝置中;根據(jù)輸入的檢索條件檢索該文件裝置中存儲(chǔ)的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,判斷是否有滿足該檢索條件的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,取得認(rèn)為滿足該檢索條件的文檔的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,并且取得滿足該文檔的檢索條件的范圍的信息;生成用于將滿足該文檔的檢索條件的范圍進(jìn)行高亮度顯示的顯示用文檔類型定義;利用上述復(fù)原信息將通過(guò)上述檢索而取得的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔復(fù)原為具有去除的結(jié)構(gòu)信息的結(jié)構(gòu)化文檔,根據(jù)滿足上述文檔的檢索條件的范圍的信息和顯示用文檔類型定義,生成附加了用于在結(jié)構(gòu)化文檔中進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔。
9.按權(quán)利要求8所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于對(duì)于檢索條件中的2個(gè)檢索項(xiàng),當(dāng)滿足關(guān)于各檢索項(xiàng)的相對(duì)的出現(xiàn)位置的條件時(shí),對(duì)構(gòu)成檢索條件的各檢索項(xiàng)的高亮度顯示和對(duì)包含該2個(gè)檢索項(xiàng)的最小的字符串范圍的高亮度顯示分別使用不同的高亮度顯示形式進(jìn)行高亮度顯示。
10.按權(quán)利要求8所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于對(duì)于檢索條件的多個(gè)檢索項(xiàng),對(duì)構(gòu)成檢索條件的各檢索項(xiàng)的高亮度顯示和對(duì)包含該檢索項(xiàng)的整個(gè)結(jié)構(gòu)的高亮度顯示分別使用不同的高亮度顯示形式進(jìn)行高亮度顯示。
11.按權(quán)利要求8所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于根據(jù)上述顯示用文檔類型定義生成附加了用于進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔時(shí),用于進(jìn)行高亮度顯示的信息,使用在檢索條件中指定的方法進(jìn)行附加。
12.按權(quán)利要求9所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于檢索結(jié)果的高亮度顯示,對(duì)各檢索項(xiàng)使用多個(gè)高亮度顯示中的某一個(gè)進(jìn)行高亮度顯示。
13.按權(quán)利要求12所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于各檢索項(xiàng)的高亮度顯示的高亮度顯示形式,根據(jù)各檢索項(xiàng)的出現(xiàn)頻度的信息而決定。
14.按權(quán)利要求12所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于各檢索項(xiàng)的高亮度顯示的高亮度顯示形式,根據(jù)對(duì)各檢索項(xiàng)預(yù)先給定的加權(quán)的信息而決定。
15.一種用于具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于分析輸入的結(jié)構(gòu)化文檔,生成分析過(guò)的結(jié)構(gòu)化文檔,將該分析過(guò)的結(jié)構(gòu)化文檔存儲(chǔ)到上述文件裝置中;從該分析過(guò)的結(jié)構(gòu)化文檔中取得各結(jié)構(gòu)內(nèi)的內(nèi)容字符串信息,生成文檔檢索用信息,并存儲(chǔ)到上述文件裝置中;根據(jù)輸入的檢索條件檢索該文件裝置中存儲(chǔ)的文檔檢索用信息,判斷是否有滿足該檢索條件的內(nèi)容字符串信息,取得具有認(rèn)為滿足該檢索條件的內(nèi)容字符串信息的文檔的分析過(guò)的結(jié)構(gòu)化文檔;取得滿足該文檔的檢索條件的范圍的信息;取得輸入的顯示對(duì)象的部分結(jié)構(gòu),生成用于將滿足該顯示對(duì)象的部分結(jié)構(gòu)中的上述檢索條件的范圍進(jìn)行高亮度顯示的部分結(jié)構(gòu)顯示用文檔類型定義;對(duì)該顯示對(duì)象的部分結(jié)構(gòu),根據(jù)滿足上述文檔的檢索條件的范圍的信息和部分結(jié)構(gòu)顯示用文檔類型定義,生成附加了用于在結(jié)構(gòu)化文檔中進(jìn)行高亮度顯示的信息的部分結(jié)構(gòu)顯示用結(jié)構(gòu)化文檔。
16.按權(quán)利要求15所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于對(duì)于檢索條件中的2個(gè)檢索項(xiàng),當(dāng)滿足關(guān)于各檢索項(xiàng)的相對(duì)的出現(xiàn)位置的條件時(shí),對(duì)構(gòu)成檢索條件的各檢索項(xiàng)的高亮度顯示和對(duì)包含該2個(gè)檢索項(xiàng)的最小的字符串范圍的高亮度顯示分別使用不同的高亮度顯示形式進(jìn)行高亮度顯示。
17.按權(quán)利要求15所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于對(duì)于檢索條件的多個(gè)檢索項(xiàng),對(duì)構(gòu)成檢索條件的各檢索項(xiàng)的高亮度顯示和對(duì)包含該檢索項(xiàng)的整個(gè)結(jié)構(gòu)的高亮度顯示分別使用不同的高亮度顯示形式進(jìn)行高亮度顯示。
18.按權(quán)利要求15所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于根據(jù)上述顯示用文檔類型定義生成附加了用于進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔時(shí),用于進(jìn)行高亮度顯示的信息,使用在檢索條件中指定的方法進(jìn)行附加。
19.按權(quán)利要求15所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于檢索結(jié)果的高亮度顯示,對(duì)各檢索項(xiàng)使用多個(gè)高亮度顯示中的某一個(gè)進(jìn)行高亮度顯示。
20.按權(quán)利要求19所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于各檢索項(xiàng)的高亮度顯示的高亮度顯示形式,根據(jù)各檢索項(xiàng)的出現(xiàn)頻度的信息而決定。
21.按權(quán)利要求19所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于各檢索項(xiàng)的高亮度顯示的高亮度顯示形式,根據(jù)對(duì)各檢索項(xiàng)預(yù)先給定的加權(quán)的信息而決定。
22.一種用于具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于將符合輸入的特定的文檔類型定義的結(jié)構(gòu)化文檔作為保留著標(biāo)記的明文存儲(chǔ)到上述文件裝置中;根據(jù)輸入的檢索條件檢索該文件裝置中存儲(chǔ)的明文,判斷是否有滿足該檢索條件的范圍,取得具有滿足該檢索條件的范圍的文檔作為明文,并且取得滿足該文檔的檢索條件的范圍的信息;將上述特定的文檔類型定義作為顯示用文檔類型定義,對(duì)上述輸入的結(jié)構(gòu)化文檔,根據(jù)該顯示用文檔類型定義對(duì)滿足上述檢索條件的范圍生成附加了用于進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔。
23.按權(quán)利要求22所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于判斷滿足檢索條件的范圍在結(jié)構(gòu)化文檔中是否在表示文檔結(jié)構(gòu)的標(biāo)記的屬性信息中存在;滿足該檢索條件的范圍在標(biāo)記的屬性信息中存在時(shí),在結(jié)構(gòu)化文檔的內(nèi)容字符串中追加包含滿足該檢索條件的范圍的字符串的字符串,對(duì)在該字符串中滿足該檢索條件的范圍,根據(jù)上述特定的文檔類型定義生成附加了用于進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔。
24.按權(quán)利要求22所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于根據(jù)輸入的檢索條件,檢索在該文件裝置中作為仍然保留標(biāo)記的明文而存儲(chǔ)的結(jié)構(gòu)化文檔時(shí),從檢索對(duì)象中去除構(gòu)成預(yù)先指定的特定的標(biāo)記的字符串,對(duì)于滿足對(duì)連結(jié)構(gòu)成該特定的標(biāo)記的字符串的前后的字符串進(jìn)行檢索而得到的檢索條件的范圍,根據(jù)上述特定的文檔類型定義生成附加了用于進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔。
25.按權(quán)利要求22所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于根據(jù)輸入的檢索條件,檢索在該文件裝置中作為明文而存儲(chǔ)的結(jié)構(gòu)化文檔時(shí),判斷滿足檢索條件的范圍是否夾在表示預(yù)先指定的文檔結(jié)構(gòu)的開(kāi)始的特定的標(biāo)記和表示文檔結(jié)構(gòu)的結(jié)尾的特定的標(biāo)記之間,夾在之間時(shí)就在表示文檔結(jié)構(gòu)的開(kāi)始的特定的標(biāo)記之前或表示文檔結(jié)構(gòu)的結(jié)尾的標(biāo)記之后的內(nèi)容字符串中,追加包含滿足該檢索條件的范圍的字符串的字符串,對(duì)在該字符串中滿足該檢索條件的范圍,根據(jù)上述特定的文檔類型定義生成附加了用于進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔。
26.按權(quán)利要求22所述的結(jié)構(gòu)化文檔檢索顯示方法,其特征在于根據(jù)上述顯示用文檔類型定義生成附加了用于進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔時(shí),用于進(jìn)行高亮度顯示的信息,使用在檢索條件中指定的方法進(jìn)行附加。
27.一種具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示裝置,其特征在于包括分析輸入的結(jié)構(gòu)化文檔、生成分析過(guò)的結(jié)構(gòu)化文檔并將該分析過(guò)的結(jié)構(gòu)化文檔存儲(chǔ)到上述文件裝置中的單元;生成從上述輸入的結(jié)構(gòu)化文檔中去除預(yù)先給定的檢索對(duì)象外的結(jié)構(gòu)信息的、文檔檢索用的、規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,并存儲(chǔ)到上述文件裝置中的單元;生成用于將該去除的結(jié)構(gòu)信息復(fù)原的復(fù)原信息并存儲(chǔ)到上述文件裝置中的單元;根據(jù)輸入的檢索條件檢索該文件裝置存儲(chǔ)的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔、判斷是否有滿足該檢索條件的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔、取得認(rèn)為滿足該檢索條件的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔的信息并且取得滿足該文檔的檢索條件的范圍的信息的單元;生成用于將滿足該文檔的檢索條件的范圍進(jìn)行高亮度顯示的顯示用文檔類型定義的單元;根據(jù)上述復(fù)原信息將通過(guò)上述檢索而取得的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔復(fù)原為具有去除的結(jié)構(gòu)信息的結(jié)構(gòu)化文檔的單元;和根據(jù)滿足上述文檔的檢索條件的范圍的信息和顯示用文檔類型定義生成附加了用于在結(jié)構(gòu)化文檔中進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔的單元。
28.一種用于具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示程序,其特征在于上述處理裝置通過(guò)執(zhí)行上述程序,分析輸入的結(jié)構(gòu)化文檔,生成分析過(guò)的結(jié)構(gòu)化文檔,將該分析過(guò)的結(jié)構(gòu)化文檔存儲(chǔ)到上述文件裝置中;從該分析過(guò)的結(jié)構(gòu)化文檔中取得各結(jié)構(gòu)內(nèi)的內(nèi)容字符串信息、生成文檔檢索用信息,并存儲(chǔ)到上述文件裝置中;根據(jù)輸入的檢索條件檢索該文件裝置存儲(chǔ)的文檔檢索用信息,判斷是否有滿足該檢索條件的內(nèi)容字符串信息,取得具有認(rèn)為滿足該檢索條件的內(nèi)容字符串信息的文檔的分析過(guò)的結(jié)構(gòu)化文檔,并且取得滿足該文檔的檢索條件的范圍的信息;生成用于將滿足該文檔的檢索條件的范圍進(jìn)行高亮度顯示的顯示用文檔類型定義(顯示用DTD);根據(jù)滿足上述文檔的檢索條件的范圍的信息和顯示用文檔類型定義生成附加了用于在結(jié)構(gòu)化文檔中進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔。
29.一種用于具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示程序,其特征在于上述處理裝置通過(guò)執(zhí)行上述程序,分析輸入的結(jié)構(gòu)化文檔,生成分析過(guò)的結(jié)構(gòu)化文檔,將該分析過(guò)的結(jié)構(gòu)化文檔存儲(chǔ)到上述文件裝置中;生成從上述輸入的結(jié)構(gòu)化文檔中去除預(yù)先給定的檢索對(duì)象外的結(jié)構(gòu)信息的、文檔檢索用的、規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,并且生成用于將該去除的結(jié)構(gòu)信息復(fù)原的復(fù)原信息,并存儲(chǔ)到上述文件裝置中;根據(jù)輸入的檢索條件檢索該文件裝置存儲(chǔ)的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,判斷是否有滿足該檢索條件的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,取得認(rèn)為滿足該檢索條件的文檔的的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,并且取得滿足該文檔的檢索條件的范圍的信息;生成用于將滿足該文檔的檢索條件的范圍進(jìn)行高亮度顯示的顯示用文檔類型定義;利用上述復(fù)原信息將通過(guò)上述檢索而取得的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔復(fù)原為具有去除的結(jié)構(gòu)信息的結(jié)構(gòu)化文檔,根據(jù)滿足上述文檔的檢索條件的范圍的信息和顯示用文檔類型定義,生成附加了用于在結(jié)構(gòu)化文檔中進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔。
30.一種用于具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示程序,其特征在于上述處理裝置通過(guò)執(zhí)行上述程序,分析輸入的結(jié)構(gòu)化文檔,生成分析過(guò)的結(jié)構(gòu)化文檔,將該分析過(guò)的結(jié)構(gòu)化文檔存儲(chǔ)到上述文件裝置中;從該分析過(guò)的結(jié)構(gòu)化文檔中取得各結(jié)構(gòu)內(nèi)的內(nèi)容字符串信息,生成文檔檢索用信息,并存儲(chǔ)到上述文件裝置中;根據(jù)輸入的檢索條件檢索該文件裝置存儲(chǔ)的文檔檢索用信息,判斷是否有滿足該檢索條件的內(nèi)容字符串信息,取得具有認(rèn)為滿足該檢索條件的內(nèi)容字符串信息的文檔的分析過(guò)的結(jié)構(gòu)化文檔,并且取得滿足該文檔的檢索條件的范圍的信息;取得輸入的顯示對(duì)象的部分結(jié)構(gòu);生成用于將滿足該顯示對(duì)象的部分結(jié)構(gòu)中的上述檢索條件的范圍進(jìn)行高亮度顯示的部分結(jié)構(gòu)顯示用文檔類型定義;對(duì)該顯示對(duì)象的部分結(jié)構(gòu),根據(jù)滿足上述文檔的檢索條件的范圍的信息和部分結(jié)構(gòu)顯示用文檔類型定義,生成附加了用于在結(jié)構(gòu)化文檔中進(jìn)行高亮度顯示的信息的部分結(jié)構(gòu)顯示用結(jié)構(gòu)化文檔。
31.一種存儲(chǔ)用于具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示程序的存儲(chǔ)媒體,其特征在于上述處理裝置通過(guò)執(zhí)行上述程序,分析輸入的結(jié)構(gòu)化文檔,生成分析過(guò)的結(jié)構(gòu)化文檔,將該分析過(guò)的結(jié)構(gòu)化文檔存儲(chǔ)到上述文件裝置中;從該分析過(guò)的結(jié)構(gòu)化文檔中取得各結(jié)構(gòu)內(nèi)的內(nèi)容字符串信息,生成文檔檢索用信息,并存儲(chǔ)到上述文件裝置中;根據(jù)輸入的檢索條件檢索該文件裝置存儲(chǔ)的文檔檢索用信息,判斷是否有滿足該檢索條件的內(nèi)容字符串信息,取得具有認(rèn)為滿足該檢索條件的內(nèi)容字符串信息的文檔的分析過(guò)的結(jié)構(gòu)化文檔,并且取得滿足該文檔的檢索條件的范圍的信息;生成用于將滿足該文檔的檢索條件的范圍進(jìn)行高亮度顯示的顯示用文檔類型定義(顯示用DTD);根據(jù)滿足上述文檔的檢索條件的范圍的信息和顯示用文檔類型定義生成在結(jié)構(gòu)化文檔中附加用于進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔。
32.一種存儲(chǔ)用于具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示程序的存儲(chǔ)媒體,其特征在于上述處理裝置通過(guò)執(zhí)行上述程序,分析輸入的結(jié)構(gòu)化文檔,生成分析過(guò)的結(jié)構(gòu)化文檔,將該分析過(guò)的結(jié)構(gòu)化文檔存儲(chǔ)到上述文件裝置中;生成從上述輸入的結(jié)構(gòu)化文檔中去除預(yù)先給定的檢索對(duì)象外的、結(jié)構(gòu)信息的、文檔檢索用的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,并且生成用于將該去除的結(jié)構(gòu)信息復(fù)原的復(fù)原信息,并存儲(chǔ)到上述文件裝置中;根據(jù)輸入的檢索條件檢索該文件裝置存儲(chǔ)的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,判斷是否有滿足該檢索條件的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,取得認(rèn)為滿足該檢索條件的文檔的的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔,并且取得滿足該文檔的檢索條件的范圍的信息;生成用于將滿足該文檔的檢索條件的范圍進(jìn)行高亮度顯示的顯示用文檔類型定義;利用上述復(fù)原信息將通過(guò)上述檢索而取得的規(guī)格化處理過(guò)的結(jié)構(gòu)化文檔復(fù)原為具有去除的結(jié)構(gòu)信息的結(jié)構(gòu)化文檔,根據(jù)滿足上述文檔的檢索條件的范圍的信息和顯示用文檔類型定義,生成附加了用于在結(jié)構(gòu)化文檔中進(jìn)行高亮度顯示的信息的顯示用結(jié)構(gòu)化文檔。
33.一種存儲(chǔ)用于具有處理裝置、存儲(chǔ)裝置、文件裝置和輸入輸出裝置的信息處理系統(tǒng)的結(jié)構(gòu)化文檔檢索顯示程序的存儲(chǔ)媒體,其特征在于上述處理裝置通過(guò)執(zhí)行上述程序,分析輸入的結(jié)構(gòu)化文檔,生成分析過(guò)的結(jié)構(gòu)化文檔,將該分析過(guò)的結(jié)構(gòu)化文檔存儲(chǔ)到上述文件裝置中;從該分析過(guò)的結(jié)構(gòu)化文檔中取得各結(jié)構(gòu)內(nèi)的內(nèi)容字符串信息,生成文檔檢索用信息,并存儲(chǔ)到上述文件裝置中;根據(jù)輸入的檢索條件檢索該文件裝置存儲(chǔ)的文檔檢索用信息,判斷是否有滿足該檢索條件的內(nèi)容字符串信息,取得具有認(rèn)為滿足該檢索條件的內(nèi)容字符串信息的文檔的分析過(guò)的結(jié)構(gòu)化文檔,并且取得滿足該文檔的檢索條件的范圍的信息;取得輸入的顯示對(duì)象的部分結(jié)構(gòu);生成用于將滿足該顯示對(duì)象的部分結(jié)構(gòu)中的上述檢索條件的范圍進(jìn)行高亮度顯示的部分結(jié)構(gòu)顯示用文檔類型定義;對(duì)該顯示對(duì)象的部分結(jié)構(gòu),根據(jù)滿足上述文檔的檢索條件的范圍的信息和部分結(jié)構(gòu)顯示用文檔類型定義,生成附加了用于在結(jié)構(gòu)化文檔中進(jìn)行高亮度顯示的信息的部分結(jié)構(gòu)顯示用結(jié)構(gòu)化文檔。
全文摘要
將文件的結(jié)構(gòu)化文檔作為輸入進(jìn)行文檔登錄,生成進(jìn)行過(guò)結(jié)構(gòu)分析的結(jié)構(gòu)化文檔和用于文檔檢索的信息,分別存儲(chǔ)到DB105和DB106中。然后,輸入檢索條件并分析,進(jìn)行檢索輸出匹配的文檔序號(hào)信息和匹配范圍信息。從DB105中讀出對(duì)應(yīng)的結(jié)構(gòu)分析過(guò)的結(jié)構(gòu)化文檔。在文檔根據(jù)匹配范圍信息,對(duì)結(jié)構(gòu)化文檔插入匹配信息,生成附加了高亮度信息的顯示用的結(jié)構(gòu)化文檔,并顯示該結(jié)構(gòu)化文檔。
文檔編號(hào)G06F17/30GK1206883SQ9811557
公開(kāi)日1999年2月3日 申請(qǐng)日期1998年7月1日 優(yōu)先權(quán)日1997年7月1日
發(fā)明者岡本卓哉, 高橋亨, 青山由紀(jì), 山崎紀(jì)之, 村田英子 申請(qǐng)人:株式會(huì)社日立制作所