專利名稱:文檔搜索裝置及文檔搜索方法
技術(shù)領(lǐng)域:
本申請涉及用于顯示所檢索到的文檔的技術(shù)。
背景技術(shù):
近年來,由于計算機相關(guān)技術(shù)的發(fā)展以及網(wǎng)絡(luò)環(huán)境的改良和擴展,越來越 多的文檔被轉(zhuǎn)化為電子形式。這促進了大量辦公室內(nèi)的無紙化環(huán)境。
在辦公室中工作的員工在他們的個人計算機(PCs)上創(chuàng)建作為電子文檔 的各種文檔。隨后,將這些電子文檔編輯、拷貝、傳輸、并在PC或者服務(wù)器 上共享。如果存儲這些文檔的PC或者服務(wù)器通過網(wǎng)絡(luò)與第二臺PC連接,可 以通過使用第二臺PC對電子文進行檔瀏覽、編輯等。
在這種辦公環(huán)境中,由于多個員工通過多臺PC創(chuàng)建電子文檔,因此難以 對這些獨立的電子文檔進行統(tǒng)一的管理。作為結(jié)果,員工有時會感到困惑。例 如,由于不知道電子以何種方式存儲在哪臺PC,員工無法找到所需的電子文 檔。為了克服這個問題,提出了一些文檔管理系統(tǒng)。
例如,早期公開號為mi-120202的日本專利申請描述了一種系統(tǒng),其存
儲被掃描的文檔、傳真文檔、通過應(yīng)用程序創(chuàng)建的電子文檔、www文檔等從 而使每個文檔的原始數(shù)據(jù)、文本文件、每一頁的縮略圖像等相互關(guān)聯(lián)。這樣, 當搜索一個電子文檔時,可以按照需要顯示電子文檔的每一頁的縮略圖像。然 而這種系統(tǒng)的缺點在于,當用戶搜索文檔數(shù)據(jù)的多個項目,并以一頁一頁的基 礎(chǔ)顯示文檔數(shù)據(jù)時,由于經(jīng)常會顯示多個頁面,用戶在尋找期望的頁面時會感 到困難。
發(fā)明內(nèi)容
本發(fā)明的目的在于至少部分解決現(xiàn)有技術(shù)中存在的問題。
5根據(jù)本發(fā)明的一個方面,提供了一種文檔搜索裝置,包括對應(yīng) (correspondence)存儲單元,用于以相互關(guān)聯(lián)的方式存4渚文檔信息以及組成 所述文檔信息的多個元素;搜索單元,用于從存儲在對應(yīng)存儲單元的元素中檢 索至少一個滿足搜索標準的元素;文檔識別單元,用于識別與由搜索單元所檢 索到的每個元素相關(guān)聯(lián)的文檔信息;整理(collating)單元,用于根據(jù)由文檔 識別單元識別到的文檔信息,將由搜索單元檢索到的每個元素進行分組;和顯 示處理單元,用于根據(jù)文檔信息顯示由整理單元分組后的每個元素。
根據(jù)本發(fā)明的另一個方面,提供了一種文檔搜索方法,包括以相互關(guān)聯(lián) 的方式在存儲單元中存儲文檔信息以及組成文檔信息的多個元素;從在存儲時 存儲于存儲單元的元素中搜索并檢索至少一個滿足搜索標準的元素;識別與在 搜索及檢索時檢索到的每個元素相關(guān)聯(lián)的文檔信息;根據(jù)在識別時識別到的文 檔信息將在搜索及檢索時檢索到的每個元素分組;以及根據(jù)文檔信息對在分組 時分組的每個元素進行處理和顯示。
結(jié)合附圖閱讀下文本發(fā)明優(yōu)選實施例的詳細說明,將會更好地理解本發(fā)明 的上述和其他目標、特征、優(yōu)點以及技術(shù)和工業(yè)上的重要性。
圖1示出了根據(jù)本發(fā)明第一實施例的文檔搜索裝置的示例結(jié)構(gòu)的框圖; 圖2示出了圖1所示的文檔管理表的示例表結(jié)構(gòu)的圖例; 圖3示出了圖1所示的頁面對應(yīng)管理表的示例表結(jié)構(gòu)的圖例; 圖4示出了用于刪除由如圖1所示的搜索單元找到的一些頁面的條件的第 一示例;
圖5示出了用于刪除由搜索單元找到的一些頁面的條件的第二示例;
圖6示出了用于刪除由搜索單元找到的一些頁面的條件的第三示例;
圖7示出了用于刪除由搜索單元找到的一些頁面的條件的第四示例;
圖8示出了由如圖1所示的顯示處理單元所顯示的示例搜索屏幕的圖例;
圖9示出了傳統(tǒng)頁面搜索結(jié)果屏幕的圖例;
圖10示出了由顯示處理單元顯示的搜索結(jié)果的第一示例的圖例;
圖11示出了由顯示處理單元顯示的搜索結(jié)果的第二示例的圖例;
圖12示出了由如圖1所示的列表顯示處理單元顯示的頁面列表的第一示例的圖例;
圖13示出了由列表顯示處理單元顯示的頁面列表的第二示例的圖例; 圖14示出了由列表顯示處理單元顯示的頁面列表的第三示例的圖例; 圖15示出了由顯示處理單元顯示的搜索結(jié)果的第三示例的圖例; 圖16示出了由顯示處理單元顯示的搜索結(jié)果的第四示例的圖例; 圖17示出了由列表顯示處理單元顯示的頁面列表的第四示例的圖例;
例;
圖19示出了由如圖1所示的文檔搜索裝置執(zhí)行的文檔數(shù)據(jù)搜索過程的流 程圖20示出了根據(jù)本發(fā)明第二實施例的文檔搜索裝置的結(jié)構(gòu)的示例框圖; 圖21示出了如圖20所示的區(qū)域?qū)?yīng)管理表的表結(jié)構(gòu)的示意圖例; 圖22示出了由如圖1所示的列表顯示處理單元所顯示的示例頁面列表的 圖例;
圖23示出了執(zhí)行計算機程序的PC的硬件結(jié)構(gòu)的示意圖,所述計算機程 序?qū)崿F(xiàn)根據(jù)第 一及第二實施例的文檔搜索裝置的功能。
具體實施例方式
下面參照
本發(fā)明的示例實施例。
圖1示出了根據(jù)本發(fā)明第一實施例的文檔搜索裝置100的示例結(jié)構(gòu)的框 圖。該文檔搜索裝置100包括元素對應(yīng)(element-correspondence )存儲單元101、 文檔數(shù)據(jù)存儲單元102、頁面圖像存儲單元103、操作處理單元104、搜索單 元105、注冊單元106、刪除單元107、文檔識別單元108、顯示處理單元109、 以及整理單元110,用于對文檔數(shù)據(jù)進行注冊、管理、檢索等。所述文檔搜索 裝置100與顯示監(jiān)視器152及輸入設(shè)備151連接。
由文檔搜索裝置100所管理的文檔數(shù)據(jù)包括其中字符也被描述為圖像的 文檔圖像,以及由文檔生成應(yīng)用程序創(chuàng)建的電子文檔。
元素對應(yīng)存儲單元101存儲文檔管理表和頁面對應(yīng)(page correspondence) 管理表。圖2示出了文檔管理表的示例表結(jié)構(gòu)的圖例。文檔管理表以相關(guān)聯(lián)的 方式存儲文檔ID、標題、創(chuàng)建或最后修改日期、頁面數(shù)目、文件格式、文件路徑以及文件名稱。
文檔ID是分配給每個文檔數(shù)據(jù)項目的唯一 ID,其可以用于識別特定的文 檔數(shù)據(jù)。標題是文檔數(shù)據(jù)的標題。創(chuàng)建或最后修改日期表示文檔數(shù)據(jù)的創(chuàng)建日 期或者最后修改日期。頁面數(shù)目表示文檔數(shù)據(jù)中包含的頁面的數(shù)目。文件格式 表示文檔數(shù)據(jù)的格式。文件格式可以用于識別是否所管理的相關(guān)文檔是被掃描 的文檔、傳真文檔、應(yīng)用程序創(chuàng)建的電子文檔或WWW文檔。文件路徑表示 存儲文檔數(shù)據(jù)的位置。文件名稱表示文檔數(shù)據(jù)的文件名稱。
圖3示出了頁面對應(yīng)管理表的示例表結(jié)構(gòu)的圖例。頁面對應(yīng)管理表存儲頁 面ID、文檔ID、頁碼(page number)、屬性、文本屬性、縮略路徑、以及預(yù) 覽路徑,從而使這些項目相互關(guān)聯(lián)。
頁面ID是分配給組成文檔數(shù)據(jù)的每個頁面的唯一 ID,其可以用于唯一地 識別由文檔搜索裝置100所管理的文檔數(shù)據(jù)的特定頁面。文檔ID是用于識別 包含相關(guān)頁面的文檔數(shù)據(jù)的ID。頁碼是在包括相關(guān)頁面的文檔數(shù)據(jù)中的相關(guān) 頁面的頁碼。屬性表示從代表相關(guān)完整頁面的圖像中所提取的特征。
文本屬性表示從包含在相關(guān)頁面中的文本信息中所提取的特征,如關(guān)鍵字 以及其在文檔信息中的出現(xiàn)頻率。如果文檔數(shù)據(jù)是文檔圖像,可以從文本信息 中提取文本屬性,所述文本信息是由OCR從相關(guān)頁面的文檔圖像中提取的。 縮略路徑表示代表整個屏幕的縮略圖像的存儲位置。預(yù)覽路徑表示代表整個屏 幕的預(yù)覽圖像的存儲位置。
文檔數(shù)據(jù)存儲單元102存儲文檔數(shù)據(jù)和代表相關(guān)文檔的縮略圖像。頁面圖 像存儲單元103存儲代表文檔數(shù)據(jù)的每個頁面的預(yù)覽圖像以及代表文檔數(shù)據(jù) 的每個頁面的縮略圖像。元素對應(yīng)存儲單元101、文檔數(shù)據(jù)存儲單元102、頁 面圖像存儲單元103可以通過通常使用的任意存儲單元來實現(xiàn),如硬盤驅(qū)動器 (HDD)、光學磁盤、存儲卡或者隨機接入存儲器(RAM)。
注冊單元106執(zhí)行對要被搜索的文檔數(shù)據(jù)的注冊。為此,注冊單元106 對文檔數(shù)據(jù)存儲單元102中的文檔數(shù)據(jù)進行注冊,并且對從頁面圖像存儲單元 103中的相關(guān)文檔數(shù)據(jù)的每個頁面生成的頁面圖像數(shù)據(jù)和縮略圖像進行注冊。 此外,注冊單元106對文檔管理表和頁面對應(yīng)管理表中的相關(guān)文檔數(shù)據(jù)及每個 頁面的信息進行注冊。操作處理單元104包括輸入接收單元111、選擇接收單元112以及從輸入 設(shè)備151輸入的處理操作。
輸入接收單元111接收用戶通過輸入設(shè)備151輸入的搜索標準。該搜索標 準輸入可以在例如初始顯示的搜索屏幕上執(zhí)行,或者在搜索操作完成以后要顯 示的搜索結(jié)果屏幕上執(zhí)行。
選擇接收單元112從由顯示處理單元109在顯示監(jiān)視器152上顯示的文檔 數(shù)據(jù)的多個項目中接收來自用戶的文檔數(shù)據(jù)的選擇。
搜索單元105才艮據(jù)由輸入接收單元111輸入的搜索標準搜索文檔管理表和 頁面對應(yīng)管理表中的至少一個。搜索單元105可以用于搜索特定的文檔數(shù)據(jù), 或者用于搜索具體文檔數(shù)據(jù)中所包含的特定頁面。
如果頁面的搜索標準包括多個字符串,搜索單元105搜索至少包含一個所 輸入的字符串的頁面。更具體的講,搜索單元105在頁面對應(yīng)管理表的"文本 屬性"域中搜索被指定為搜索標準的多個字符串中的至少一個,并尋找滿足搜 索標準的記錄的頁面ID、頁碼、文檔ID、以及縮略路徑。
當搜索單元105搜索頁面時,文檔識別單元108識別包含每個尋找到的頁 面的文檔數(shù)據(jù)?;陧撁鎸?yīng)管理表中與頁面ID相關(guān)聯(lián)的文檔ID,可以識別 包含相關(guān)頁面的文檔數(shù)據(jù)。這樣,可以為每個文檔數(shù)據(jù)項單獨地顯示尋找到的 頁面。
如果作為搜索標準輸入的字符串分布在由文檔識別單元108識別到的文 檔數(shù)據(jù)的不同頁面上,并且如果由頁碼代表的頁面之間的距離(即差別)大于 預(yù)定值,則刪除單元107將頁面從由搜索單元105產(chǎn)生的搜索結(jié)果中刪除。在 第一實施例中,如果頁面距離大于兩頁,則刪除相關(guān)頁面。然而,可以按需要 改變這個預(yù)定頁面距離。
圖4至7示出了刪除由搜索單元105找到的部分頁面的條件的示例。在圖 4至7中,假設(shè)已經(jīng)將字符串"A"和字符串"B"作為搜索標準輸入。
在圖4所示的示例中,頁面401包含字符串"A"和字符串"B"。由于包 含字符串"A"的頁面與包含字符串"B"的頁面間的距離在兩頁之內(nèi),刪除 單元107不刪除頁面401。
在圖5所示的示例中,頁面501包含字符串"A",頁面501之后的頁面
9502包含字符串"B"。在這種情況下,頁面501和頁面502之間的距離在兩頁 之內(nèi)。因此,刪除單元107不刪除頁面501和502。
在圖6所示的示例中,頁面601包含字符串"A",頁面601兩頁之前的 頁面602包含字符串"B"。在這種情況下,頁面601與頁面602之間的距離 在兩頁之內(nèi),因此,刪除單元107不刪除頁面601和602。
在圖7所示的示例中,頁面701包含字符串"A",頁面701三頁之前的 頁面702包含字符串"B"。在這種情況下,頁面701和頁面702之間的距離 大于兩頁,因此,刪除單元107刪除頁面701和702。
換句話說,當用戶通過指定字符串"A"和字符串"B"作為搜索條件進 行頁面搜索時,只要這些字符串"A"和"B"分布在多個頁面上,則認為沒 有頁面滿足搜索標準??墒?,只要字符串"A"和字符串"B"相互靠近地存 在,則這些頁面可以為用戶提供有用的信息。
另一方面,如果用戶通過指定字符串"A"和字符串"B"作為搜索條件 進行文檔數(shù)據(jù)搜索時,雖然可以找到包括這些頁面的文檔數(shù)據(jù),用戶仍需要進 一步通過指定這些字符串作為搜索標準以搜索相關(guān)文檔,從而得知已經(jīng)找到的 文檔數(shù)據(jù)中的哪些頁包含字符串"A"或者字符串"B"。對于文檔數(shù)據(jù)的搜索 操作,即使字符串"A"包含在一個頁面上而字符串"B,,在另一頁面上,仍 然可以檢索文檔數(shù)據(jù)。這可能對用戶并不是非常有用。
根據(jù)這些情況,將文檔搜索裝置IOO設(shè)計為使得當將多個字符串指定為搜 索標準時,如果包含這些字符串的頁面間的距離在兩頁之內(nèi),則檢索這些頁面。 這樣,即使頁面不包括這些字符串,仍然可以提供給用戶與這些字符串相關(guān)的 頁面。
整理單元IIO根據(jù)由文檔識別單元108識別到的文檔數(shù)據(jù),對由刪除單元 107執(zhí)行刪除后的頁面進行分類。
顯示處理單元109包括列表顯示處理單元121,并在顯示監(jiān)視器152上顯 示信息。顯示處理單元109在顯示監(jiān)視器152上顯示文檔搜索屏幕和搜索結(jié)果 屏幕。例如,顯示處理單元109在顯示監(jiān)視器152上顯示一組頁面,其中所述 頁面是由整理單元110為每項文檔數(shù)據(jù)合并而成的。顯示處理單元109可以在 網(wǎng)絡(luò)瀏覽器中顯示這些屏幕。
10當顯示處理單元109顯示由每項文檔數(shù)據(jù)分類后的頁面并且選擇接收單 元112接收文檔數(shù)據(jù)的選擇時,列表顯示處理單元121在顯示監(jiān)視器152上顯 示包含在凈皮選擇的文檔數(shù)據(jù)中的一列頁面。
圖8示出了由顯示處理單元109在顯示監(jiān)視器152上顯示的示例搜索屏幕 的圖例。參考圖8,用戶在關(guān)鍵字輸入窗口 801中輸入作為搜索關(guān)鍵字的字符 串。用戶在搜索目標輸入窗口 802中選擇作為搜索目標的頁面或者文檔數(shù)據(jù)。 本實施例中假設(shè)用戶在搜索目標輸入窗口 802中選擇頁面進行說明。用戶在顯 示單元輸入窗口 803中選擇是否以頁面單元或是文檔單元顯示搜索結(jié)果。用戶 在具體描述輸入窗口 804中選擇在顯示搜索結(jié)果時是否顯示文檔數(shù)據(jù)或者頁 面的具體描述。按下搜索按鈕805開始搜索操作。
下面說明傳統(tǒng)的搜索結(jié)果。圖9示出了傳統(tǒng)頁面搜索結(jié)果屏幕的圖例。參 照圖9, "D+數(shù)字"表示文檔數(shù)據(jù)的名稱,"P+數(shù)字"表示頁碼。對于傳統(tǒng) 的頁面搜索結(jié)果,無論頁面是否包含在相同的文檔數(shù)據(jù)中,都會顯示滿足搜索 標準的頁面。如果發(fā)生上述情況,用戶無法掌握作為搜索結(jié)果進行顯示的頁面 間的關(guān)系。
為了克服這個問題,在文檔搜索裝置100中,根據(jù)文檔數(shù)據(jù)將符合搜索標 準的頁面進行顯示和分類。
圖IO示出了由顯示處理單元109在顯示監(jiān)視器152上顯示的搜索結(jié)果的 第一示例的圖例。為了顯示搜索結(jié)結(jié)果,假設(shè)在搜索屏幕上將顯示單元設(shè)為"頁 面單元",并將具體描述設(shè)為"否"(見圖8)。在圖IO所示的搜索結(jié)果中,將 包含在文檔數(shù)據(jù)D32、 D20和D2中的頁面按頁碼順序顯示,并根據(jù)文檔數(shù)據(jù) 對頁面進行分類。
在圖IO所示的示例中,即使對于包含在同一文檔數(shù)據(jù)中的頁面,也將其 并排顯示在屏幕上。因此,當多項文檔數(shù)據(jù)符合搜索標準時,用戶在瀏覽頁面 時會感到困難。為了克服這個問題,將說明用于當多項文檔數(shù)據(jù)符合搜索標準 時的顯示的技術(shù)。
圖11示出了由顯示處理單元109顯示的搜索結(jié)果的第二示例的圖例。為 了顯示搜索結(jié)果,假設(shè)在搜索屏幕上將顯示單元設(shè)為"文檔單元",并將具體 描述設(shè)為"否"(見圖8)。在圖11所示的搜索結(jié)果中,才艮據(jù)文檔數(shù)據(jù)(D32、D20和D2)對頁面進行層疊和分類。
在圖11示出的示例中,可以閱覽具有文檔數(shù)據(jù)的所有項中最小頁碼的頁 面的圖像數(shù)據(jù)。作為結(jié)果,用戶可以識別他/她期望的文檔數(shù)據(jù)。
此外,顯示處理單元109可以從檢索到的頁面中顯示文檔數(shù)據(jù)的首頁(而 不是具有最小頁碼的頁面)作為最前頁(foremost page )。另外,顯示處理單
許用戶以某些方式識別符合搜索標準的頁面??梢圆捎萌我饧夹g(shù)來識別符合搜 索標準的頁面。用于識別特定頁面的技術(shù)的示例包括以彩色方式顯示這些頁 面。此外,顯示處理單元109可以提供轉(zhuǎn)換按鈕,用于在操作處理單元104
下面說明如圖11所示的顯示由文檔數(shù)據(jù)所分類的每個頁面的操作過程。 在這種情況下,用戶使用輸入設(shè)備151指出期望的文檔。作為結(jié)果,列表顯示 處理單元121顯示以文檔數(shù)據(jù)分組的每個頁面。
圖12示出了由列表顯示處理單元121顯示的頁面列表的第一示例的圖例。 參照圖12,當通過光標1202選擇了文檔數(shù)據(jù)D20時,列表顯示處理單元121 在窗口 1201中顯示組成文檔數(shù)據(jù)D20的兩個頁面(頁面P4和頁面PIO)。以 這種方式,僅在窗口 1201中顯示作為搜索操作結(jié)果檢索到的頁面。其他頁面 則可以基于接收翻頁(paging)梯:作的輸入進行查看。因此,當列表顯示處理 單元121接收到翻頁操作的輸入時,顯示之前或之后的頁面。另外,列表顯示 處理單元121并不限于僅顯示作為搜索操作結(jié)果檢索到的頁面,同樣可以顯 示,例如由用戶選擇的文檔數(shù)據(jù)的所有頁面,并在所有頁面中僅將作為搜索操 作結(jié)果檢索到的頁面加亮。
窗口 1201中還包括在文檔中搜索的框1203,允許用戶在文檔數(shù)據(jù)D20中 搜索特定頁面。對于這種文檔搜索操作,用戶可以僅從作為之前的文檔搜索操 作結(jié)果檢索到的頁面中搜索特定頁面,或者可以從文檔的所有頁面中搜索特定 頁面。
在圖12所示的示例屏幕中,當要顯示頁面P10后面的頁面時,用戶用光 標1202點擊頁面PIO。隨后列表顯示處理單元121將最前頁面移動到末尾位 置,從而顯示第二最前頁面。此外,列表顯示處理單元121可以在窗口 1201中將頁面層疊,這樣用戶可以點擊期望的頁面的可^L部分從而將頁面彈出到最 前位置。
如上所述,當用戶在由顯示處理單元109所顯示的文檔數(shù)據(jù)上執(zhí)行如鼠標 經(jīng)過(mouse-over)操作或者雙擊操作等處理時,列表顯示處理單元121以雙 頁格式顯示所選擇的文檔數(shù)據(jù)的頁面。隨后,點擊操作,例如引起將當前頁面 翻過。
頁面列出技術(shù)并不限于如圖12所示的方式;可以采用各種其他技術(shù)。其 他頁面列出技術(shù)的示例會被進一步說明。
圖13示出了由列表顯示處理單元121顯示的頁面列表的第二示例的圖例。 在窗口 1301中顯示對應(yīng)于四個頁面的縮略圖像。在圖13所示的示例屏幕中, 窗口尺寸基于分組為搜索結(jié)果的頁面數(shù)量而改變。
圖14示出了由列表顯示處理單元121顯示的頁面列表的第三示例的圖例。 在圖14所示的窗口 1401中,文檔數(shù)據(jù)中包含大量符合搜索標準的頁面。在這 種情況下,列表顯示處理單元121提供滾動條1402。通過這個滾動條1402, 用戶可以向上或向下滾動以查看對應(yīng)于所有符合搜索標準的頁面的縮略圖^象。
此外,用戶只需要將搜索屏幕上的具體描述設(shè)置為"是",便可以顯示信 息而不是縮略圖像。通過這樣,可以顯示文檔標題、頁碼、文件格式等。
下面說明搜索結(jié)果的顯示示例。圖15示出了由顯示處理單元109顯示的 搜索結(jié)果的第三示例的圖例。為了顯示搜索結(jié)果,假設(shè)將搜索屏幕上顯示單元 設(shè)為"頁單元",并將具體描述設(shè)為"是,,(見圖8)。如圖15所示的搜索結(jié)果 所示,按頁碼順序顯示由文檔數(shù)據(jù)分組的頁面。顯示處理單元109顯示關(guān)于每 個頁面的具體信息。由顯示處理單元109所顯示的具體信息的示例包括文檔標 題、創(chuàng)建日期、頁碼以及包括匹配的字符串(單詞)的文本。對于這種文本顯 示,例如,可以將匹配的字符串加亮。
圖16示出了由顯示處理單元109顯示的搜索結(jié)果的第四示例的圖例。為 了顯示搜索結(jié)果,假設(shè)將搜索屏幕上的顯示單元設(shè)備"文檔單元",并將具體 描述設(shè)為"是,,(見圖8)。在圖16所示的搜索結(jié)果中,由文檔數(shù)據(jù)分組的頁 面被層疊。顯示處理單元109顯示關(guān)于每項文檔數(shù)據(jù)的具體信息。由顯示處理 單元109所顯示的具體信息的示例包括文檔標題、創(chuàng)建日期、頁碼以及包括匹配字符串(單詞)的文本。
如圖16所示,當由文檔數(shù)據(jù)將頁面分組時,同樣可以顯示頁面列表。由 于在這種情況下的操作與上文所述相同,因此省略了相應(yīng)描述。
圖17示出了由列表顯示處理單元121顯示的頁面列表的第四示例的圖例。 參照圖17,列表顯示處理單元121在窗口 1701中顯示與符合搜索標準的每個 頁面相對應(yīng)的縮略圖^象和具體信息。為了顯示,可以采用如圖13所示的屏幕 格式代替圖17所示的屏幕格式來進行顯示。
此外,在如圖13或17所示的屏幕上,當操作處理單元104接收任意縮略 圖像的選擇以及在該縮略圖像上的鼠標滾輪操作時,列表顯示處理單元121 放大用于顯示的縮略圖像。下面將說明經(jīng)過;^文大顯示的屏幕示例。
圖18示出了由列表顯示處理單元121放大顯示后的頁面列表的示例的圖 例。在圖18所示的示例中,列表顯示處理單元121在窗口 1805的下部顯示頁 面列表1804。列表顯示處理單元121顯示放大后的頁面圖像1806。通過從頁 面列表1804中選擇頁面或者按下前一頁1801或者下一頁1802 ,可以放大用 于顯示另外一個頁面。此外,同樣可以在窗口 1805中顯示搜索框1803,從而 允許用戶搜索任意頁面。
在本實施例中,當輸入接收單元111接收輸入搜索框1803的文檔中的字 符串時,搜索單元105從在窗口 1805中顯示的頁面列表中將頁面縮減為包含 所輸入的字符串的頁面。這樣,可以顯示更適于用戶的頁面。
此外,采用在文檔中搜索的框的搜索技術(shù)并不限于以上描述的方式??纱?替的是,搜索單元可以搜索元素對應(yīng)存儲單元101,從而可以顯示所有包含輸 入到在文檔中搜索的框的字符串的頁面。
下面將說明具有上述結(jié)構(gòu)的文檔搜索裝置IOO的文檔搜索處理。圖19示 出了文檔搜索裝置100中的上述處理過程的流程圖。假設(shè)用戶輸入了多個字符 串作為搜索標準。
首先,輸入接收單元111在搜索屏幕上接收作為搜索標準的多個字符串的 輸入(步驟S1901)。
下一步,搜索單元105在頁面對應(yīng)管理表中搜索包含文本屬性中至少一個 所輸入的字符串的頁面(步驟S1902)。然后,搜索單元105獲取尋找到的記錄的頁面ID、頁碼、文檔ID和縮略^各徑。
隨后,文檔識別單元108基于所獲取的文檔ID識別包含尋找到的頁面的 文檔數(shù)據(jù)(步驟S1903)。
下一步,如果多個字符串出現(xiàn)在由文檔識別單元108識別出的文檔數(shù)據(jù)中 的不同頁面上,并且頁面間的距離(頁數(shù))大于預(yù)定值,則刪除單元107從由 搜索單元105產(chǎn)生的搜索結(jié)果中刪除這些頁面(步驟S1094)。這一實施例假 設(shè)預(yù)定距離是兩頁。
然后,在刪除單元107執(zhí)行過刪除后,整理單元110#>據(jù)由文檔識別單元 108所識別的文檔數(shù)據(jù)將作為搜索結(jié)果而產(chǎn)生的頁面分類(步驟S1905 )。
其后,顯示處理單元109基于在搜索屏幕上設(shè)置的顯示單元確定是否以文 檔數(shù)據(jù)單元顯示數(shù)據(jù)(步驟S1906)。更具體的講,如果將搜索屏幕上的顯示 單元設(shè)置為文檔單元則確定以文檔數(shù)據(jù)單元顯示數(shù)據(jù),并且如果將顯示單元設(shè) 置為頁面單元則以頁面單元顯示數(shù)據(jù)。
如果確定顯示處理單元109以文檔數(shù)據(jù)單元顯示數(shù)據(jù)(在步驟S1906中的 是),則將由文檔數(shù)據(jù)分組的頁面層疊(步驟S1907)。在這種情況下的示例屏 幕是圖11或者圖16所示的屏幕。
另一方面,若確定顯示處理單元109不以文檔數(shù)據(jù)單元方式進行顯示(在 步驟S1906中的否),則按照頁碼順序顯示對應(yīng)于由文檔數(shù)據(jù)分類后的每個頁 面的縮略圖像(步驟S1908)。在這種情況下的示例屏幕是圖IO或者圖15所 示的屏幕。
通過上述處理過程,文檔搜索裝置IOO可以為用戶提供由文檔數(shù)據(jù)分類后 的頁面。
由于根據(jù)這一實施例的文檔搜索裝置100顯示例如由文檔數(shù)據(jù)分組后的 頁面的元素,可以更加有效地瀏覽數(shù)據(jù)。
以搜索文檔的獨立裝置為示例說明了第一實施例。然而,可以在客戶端實 現(xiàn)操作處理單元以及顯示處理單元(GUI屏幕),而在網(wǎng)絡(luò)應(yīng)用程序服務(wù)器上 實現(xiàn)其他部件,從而構(gòu)造所謂的客戶端/服務(wù)器系統(tǒng)。
盡管以將字符串作為搜索標準輸入作為示例說明了第一實施例,用于搜索 文檔數(shù)據(jù)的技術(shù)并不限于串搜索;可以采用各種搜索技術(shù),包括圖像搜索。此外,當將多個字符串設(shè)置為搜索標準時,如果頁面間的距離在預(yù)定距離 之內(nèi)則檢索頁面。因此,易于找到相關(guān)的元素。此外,即使數(shù)據(jù)分布在例如頁 面的兩個或者更多元素單元中,仍然可以容易地找到數(shù)據(jù)。而且,在以例如頁 面的元素為單元執(zhí)行搜索操作時,可以有效地識別期望的信息。
以搜索目標是頁面為示例說明了第一實施例。然而,所要搜索的元素不限 于頁面。根據(jù)這種情況,以可以選擇頁面中的一個區(qū)域作為所要搜索的元素作 為示例說明第二實施例。
圖20示出了根據(jù)第二實施例的文檔搜索裝置2000的構(gòu)造的示例框圖。圖 20所示的文檔搜索裝置2000與如圖1所示的文檔搜索裝置IOO在下述方面不 同元素對應(yīng)存儲單元2001還包括區(qū)域?qū)?yīng)管理表;將搜索單元105替換為 執(zhí)行不同的處理的:l叟索單元2002;將文檔識別單元108替換為執(zhí)行不同處理 的文檔識別單元2003;將刪除單元107替換為執(zhí)行不同處理的刪除單元2006; 將整理單元110替換為執(zhí)行不同處理的整理單元2005;以及將顯示處理單元 109替換為執(zhí)行不同處理的顯示處理單元2004。在下面的描述中,使用相同的 附圖標記表示與第一實施例相同的部件,并省略相應(yīng)描述。
為了搜索元素,元素對應(yīng)存儲單元2001進一步存儲區(qū)域?qū)?yīng)管理表。
圖21示出了區(qū)域?qū)?yīng)管理表的示例表結(jié)構(gòu)的圖例。區(qū)域?qū)?yīng)管理表存儲 區(qū)域ID、文檔ID、頁面ID、區(qū)域坐標、類型、標題、文本、圍繞文本、屬性、 以及縮略路徑,/人而^f吏這些項目之間相互關(guān)聯(lián)。
區(qū)域ID是分配給從文檔數(shù)據(jù)中劃分的每個區(qū)域的唯一 ID。通過這個ID, 可以識別由文檔搜索裝置2000管理的包含在文檔中的區(qū)域。文檔ID和頁面 ID是用于識別文檔數(shù)據(jù)和包含相關(guān)區(qū)域的頁面的ID。區(qū)域坐標包含用于定位 相關(guān)區(qū)域的坐標。在這個實施例中,可以基于左上角的坐標和右下角的坐標將 期望的區(qū)域定位。
類型包含用于識別在相關(guān)區(qū)域中的數(shù)據(jù)類型的信息。數(shù)據(jù)類型包括,如文 本、圖像和視頻。標題包含代表相關(guān)區(qū)域的標題。文本包含在相關(guān)區(qū)域中所包 含的文本信息。
如果數(shù)據(jù)的類型是例如圖像,則圍繞文本包含布置于相關(guān)圖像周圍的文本 信息。這樣,用戶可以在搜索屏幕上指定文本形式的搜索標準,從而搜索與文本相關(guān)的圖像。
屬性包含用于識別區(qū)域的屬性。而且,如果類型是例如圖像,則屬性是指 圖像的屬性。如果類型是文本,則屬性是指文本屬性。以這種方式,屬性基于 類型包含不同類型的屬性。作為結(jié)果,可以通過比較相同類型的特征量來確定 區(qū)域之間是否相似。提取屬性的方法會在下文中進行說明。縮略路徑包含代表 所述區(qū)域的縮略圖像的存儲位置。
當用戶在搜索屏幕上選擇區(qū)域作為搜索目標時,搜索單元2002搜索區(qū)域 對應(yīng)管理表。在搜索區(qū)域時,搜索單元2002搜索區(qū)域?qū)?yīng)管理表的"屬性" 域,并且隨后尋找滿足相應(yīng)搜索標準的記錄的區(qū)域ID、頁面ID、頁碼、文檔 ID、以及縮略路徑。其他搜索方法與在第一實施例中的描述相同,因此省略了 相關(guān)描述。
當搜索單元2002搜索區(qū)域時,文檔識別單元2003識別包含每個尋找到的 區(qū)域的頁面和文檔數(shù)據(jù)?;谂c區(qū)域?qū)?yīng)管理表中的區(qū)域ID相關(guān)聯(lián)的頁面ID 和文檔ID,可以識別包含期望區(qū)域的頁面和文檔數(shù)據(jù)。由此,可以顯示由頁 面或者文檔數(shù)據(jù)所分類的尋找到的區(qū)域。用于搜索頁面的處理與第一實施例中 的描述相同,因此省略了相關(guān)說明。
如果輸入多個字符串作為搜索標準,并且發(fā)現(xiàn)所述字符串分布于由文檔識 別單元2003識別出的文檔數(shù)據(jù)或者頁面中的不同頁面或者區(qū)域上,并且所述 頁面間的距離(即頁數(shù))或者區(qū)域間的距離大于預(yù)定值,則刪除單元2006從 由搜索單元2002產(chǎn)生的搜索結(jié)果中刪除區(qū)域(或者如果使用了頁碼,則刪除 包含在頁面中的區(qū)域)。
在已經(jīng)由刪除單元2006執(zhí)行刪除之后,整理單元2005根據(jù)由文檔識別單 元2003識別出的文檔數(shù)據(jù)或者頁面進行分類。
顯示處理單元2004包括列表顯示處理單元2011,并在顯示監(jiān)視器152上 顯示信息。
顯示處理單元2004與根據(jù)第一實施例的顯示處理單元109之間的差別在 于如果搜索目標是區(qū)域,則以文檔數(shù)據(jù)單元或者由整理單元2005所分組的 頁面單元顯示這些區(qū)域。如果以文檔單元顯示區(qū)域,則以與第一實施例相同的 方式進行顯示。另一方面,當以頁面單元方式顯示區(qū)域時,顯示處理單元2004通過文檔數(shù)據(jù)對區(qū)域進行分類,然后按照頁碼順序?qū)撁孢M行顯示。在這種情
況下,顯示處理單元2004將尋找到的區(qū)域加亮。
當在顯示處理單元2004顯示由文檔數(shù)據(jù)所分類的頁面時選擇接收單元 112已經(jīng)接收到文檔數(shù)據(jù)的選擇時,則列表顯示處理單元2001從所選擇的文 檔數(shù)據(jù)中所包含的頁面中顯示包含尋找到的區(qū)域的 一列頁面。
圖22示出了根據(jù)第二實施例由列表顯示處理單元2011顯示的示例頁面列 表的圖例。參照圖22,列表顯示處理單元2011在窗口 2201中顯示包含符合 搜索標準的區(qū)域的頁面的縮略圖像和具體信息。在這種情況下,列表顯示處理 單元2011將符合搜索標準的區(qū)域2202、 2203以及2204加亮。區(qū)域2203和 2204示出了在一個頁面上發(fā)現(xiàn)兩個文檔元素的示例。
以區(qū)域是文本的方式作為示例,已經(jīng)說明了根據(jù)本實施例的文檔搜索裝置 2000。然而,本發(fā)明同樣適用于區(qū)域是圖像的情況。
此外,除了由文檔搜索裝置IOO所提供的優(yōu)點,文檔搜索裝置2000還具 有優(yōu)點可以更加容易地檢索文檔中包括的區(qū)域;以及由于將找到的區(qū)域加亮, 可以提高可視性。
圖23示出了執(zhí)行計算機程序的PC的硬件結(jié)果的示意圖,所述計算機程 序?qū)崿F(xiàn)文檔搜索裝置100及2000的功能。文檔搜索裝置100及2000中的每個 包括例如中央處理器(CPU) 2301的控制裝置,例如只讀存儲器(ROM) 2302 和隨機接入存儲器(RAM)的存儲器設(shè)備,用于存儲例如文檔數(shù)據(jù)的硬盤驅(qū) 動器(HDD) 2305,通信接口 (I/F) 2304以及連接上述單元的總線2306。即, 所述PC具有與標準計算機相同的硬件結(jié)構(gòu)。
由所述實施例中的文檔搜索裝置100和2000所執(zhí)行的文檔搜索程序是可 裝載或者可執(zhí)行的文件,并且被提供存儲于計算機可讀的記錄介質(zhì)上,如 CD-ROM、軟盤(FD)、 CD-R、或者數(shù)字多功能盤(DVD)。
可選擇的是,由所述實施例中的文檔搜索裝置100和2000所執(zhí)行的文檔 搜索程序可以存儲在與網(wǎng)絡(luò)(例如互聯(lián)網(wǎng))連接的計算機上,從而可以通過網(wǎng) 絡(luò)進行下載以提供文檔搜索程序??蛇x擇的是,由實施例中的文檔搜索裝置 100和2000所執(zhí)行的文檔搜索程序可以通過如互聯(lián)網(wǎng)的網(wǎng)絡(luò)進行提供或者分 配。
18可選擇的是,所述實施例的文檔搜索程序可以例如預(yù)裝在ROM中進行提供。
由所述實施例中的文檔搜索裝置100和2000所執(zhí)行文檔搜索程序由包括 上述單元(操作處理單元、注冊單元、搜索單元、文檔識別單元、刪除單元、 以及顯示控制單元)的模塊組成。在實際硬件中,當CPU從記錄介質(zhì)中讀出 文檔搜索程序并執(zhí)行時,將所有單元裝載入RAM 2303,即,在RAM 2032中 產(chǎn)生操作處理單元、注冊單元、搜索單元、文檔識別單元、刪除單元、以及顯 示處理單元。
根據(jù)本發(fā)明,因為顯示由文檔信息分類的元素,提高了瀏覽效率并可以容 易地識別期望的元素。
注釋(note)l.—種文檔搜索方法,包括
存儲步驟,以相互關(guān)聯(lián)的方式在存儲單元中存儲文檔信息以及組成文檔信 息的多個元素;
搜索及檢索步驟,從在存儲步驟存儲于存儲單元的元素中搜索并檢索至少 一個滿足搜索標準的元素;
識別步驟,識別與在搜索及檢索步驟檢索到的每個元素相關(guān)聯(lián)的文檔信
臺
分組步驟根據(jù)在識別步驟識別到的文檔信息將在搜索及檢索步驟檢索到 的每個元素分組;以及
處理及顯示步驟,根據(jù)文檔信息對在分組步驟分組后的每個元素進行處理 及顯示。
注釋2.根據(jù)注釋l所述的文檔搜索方法,進一步包括刪除步驟,其中 存儲步驟還包括在存儲單元中存儲用于表示組成文檔信息的每個元素序 數(shù)的元素號碼;
如果所述搜索標準包括多個字符串,所述搜索及檢索步驟包括檢索包含至 少一個所輸入的字符串的至少一個元素;以及
如果至少一個字符串包含于在識別步驟識別到的文檔信息的不同元素中, 并且如果作為元素號碼的不同元素之間的差別大于預(yù)定值,所述刪除步驟包括 從在所述搜索及檢索步驟檢索到的元素中將所述不同元素刪除。注釋3. 根據(jù)注釋1或2所述的文檔搜索方法包括,其中
在存儲步驟存儲于所述存儲單元中的所述元素是頁面,以及
所述處理包括將在搜索及檢索步驟檢索到的、根據(jù)在識別步驟識別的文檔
信息而分類的頁面層疊。
注釋4.根據(jù)注釋1到3中的任意一項所述的文檔搜索方法,進一步包括 接收選擇步驟,從在所述處理及顯示步驟中所顯示的文檔信息中接收對文
檔信息的選擇;以及
顯示步驟,顯示所述文檔信息的一列頁面,其中對所述文檔信息的選擇在
所述接收選擇步驟中接收的。
注釋5.根據(jù)權(quán)利要求1至3中任意一項所述的文檔搜索方法,進一步包
括
接收選擇步驟,從在所述處理及顯示步驟所顯示的文檔信息中接收對文檔 信息的選擇;以及
接收輸入步驟,接收用于搜索在所述處理及顯示步驟所顯示的文檔信息的 搜索標準的輸入,其中
所述搜索及檢索步驟包括從在所述處理及顯示步驟中顯示的至少一個元 素中檢索滿足所述搜索標準的至少一個元素,所述搜索標準的輸入是在所述接 收輸入步驟接收的,所述至少一個元素包括在于所述接收選擇步驟所選擇的文 檔信息中。
注釋6.根據(jù)注釋1至3中任意一項所述的文檔搜索方法,進一步包括
接收選擇步驟,從在所述處理及顯示步驟中所顯示的文檔信息中接收對文 檔信息的選擇;以及
接收輸入步驟,接收用于搜索在所述處理及顯示步驟所顯示的文檔信息的 搜索標準的輸入,其中
所述搜索及檢索步驟包括檢索滿足所述搜索標準的至少一個元素,所述搜
索標準的輸入是在所述接收輸入步驟接收的,在所述存儲單元中所述至少一個 元素與在所述接收選擇步驟中選擇的文檔信息相關(guān)聯(lián)。
注釋7.根據(jù)注釋l所述的文檔搜索方法,其中 每個元素是組成文檔信息的頁面的區(qū)域;所述存儲步驟包括在所述存儲單元中存儲將區(qū)域信息與文檔信息的頁面 相關(guān)聯(lián)的區(qū)域?qū)?yīng)信息,以及將頁面、代表頁面的頁面圖像信息、以及文檔信
息相關(guān)聯(lián)的頁面對應(yīng)信息;
信息進行搜索;以及
所述處理及顯示步驟包括顯示在所述搜索及檢索步驟檢索到的至少一個 區(qū)域的信息,以及代表所述存儲單元中相關(guān)聯(lián)的頁面的頁面圖像信息,基于在 所述識別步驟識別到的文檔信息將所述顯示分類。
注釋8.根據(jù)注釋7所述的文檔搜索方法,其中所述處理及顯示步驟包括 顯示在所述搜索及檢索步驟檢索到的至少一個區(qū)域,從而將所述至少一個檢索 到的區(qū)域與頁面圖像信息中的其他區(qū)域區(qū)分。
盡管已經(jīng)結(jié)合特定實施例對本發(fā)明進行了完整清楚的描述,但是上述描述 并不構(gòu)成對所附權(quán)利要求的限制,而是用于解釋落入前述基本教示中的本領(lǐng)域 技術(shù)人員可能遇到的所有變型和可選構(gòu)造。
2權(quán)利要求
1. 一種文檔搜索裝置,包括對應(yīng)存儲單元,用于以相互關(guān)聯(lián)的方式存儲文檔信息以及組成所述文檔信息的多個元素;搜索單元,用于從存儲在所述對應(yīng)存儲單元中的元素中檢索至少一個滿足搜索標準的元素;文檔識別單元,用于識別與由所述搜索單元所檢索到的每個元素相關(guān)聯(lián)的文檔信息;整理單元,用于根據(jù)由所述文檔識別單元識別到的文檔信息,將由所述搜索單元檢索到的每個元素進行分組;以及顯示處理單元,用于根據(jù)所述文檔信息顯示由所述整理單元分組后的每個元素。
2. 根據(jù)權(quán)利要求1所述的文檔搜索裝置,進一步包括刪除單元,其中 所述對應(yīng)存儲單元進一步存儲元素號碼,該元素號碼用于表示組成文檔信息的每個元素的序數(shù),如果所述搜索標準包括多個字符串,所述搜索單元檢索包含至少一個輸入 字符串的至少一個元素,以及如果至少一個字符串包含在由所述文檔識別單元識別到的文檔信息的不 同元素中,并且如果作為元素號碼的不同元素之間的差別大于預(yù)定值,所述刪 除單元從由所述搜索單元檢索到的元素中將所述不同元素刪除。
3. 才艮據(jù)權(quán)利要求1或2所述的文檔搜索裝置,其中 在所述對應(yīng)存儲單元中存儲的所述元素是頁面,以及 所述顯示處理單元將由所述搜索單元檢索到的、根據(jù)由文檔識別單元識別的文檔信息分類后的頁面層疊。
4. 根據(jù)權(quán)利要求1至3中任意一項所述的文檔搜索裝置,進一步包括 選捧接收單元,用于從由所述顯示處理單元所顯示的文檔信息中接收對文檔信息的選擇;以及列表顯示單元,用于顯示所述文檔信息的一列頁面,其中對所述文檔信息的選擇由所述選擇接收單元接收。
5. 根據(jù)權(quán)利要求1至3中任意一項所述的文檔搜索裝置,進一步包括 選擇接收單元,用于從由所述顯示處理單元顯示的文檔信息中接收對文檔信息的選擇;以及輸入接收單元,用于接收用于搜索由所述顯示處理單元顯示的文檔信息的 搜索標準的輸入,其中所述搜索單元從由顯示處理單元顯示的至少一個元素中檢索滿足所述搜 索標準的至少一個元素,所述搜索標準的輸入是由所述輸入接收單元所接收 的,所述至少一個元素包括在由所述選擇接收單元所選擇的文檔信息中。
6. 根據(jù)權(quán)利要求1至3中任意一項所述的文檔搜索裝置,進一步包括 選捧接收單元,用于從由顯示處理單元顯示的文檔信息中接收對文檔信息的選擇;以及輸入接收單元,用于接收用于搜索由所述顯示處理單元顯示的文檔信息的 搜索標準的輸入,其中所述搜索單元^r索滿足所述搜索標準的至少一個元素,所述搜索標準的輸 入是由所述輸入接收單元接收的,在所述對應(yīng)存儲單元中所述至少一個元素和 由所述選擇接收單元選擇的所述文檔信息相關(guān)聯(lián)。
7. 根據(jù)權(quán)利要求1所述的文檔搜索裝置,其中 每個元素是組成文檔信息的頁面的區(qū)域;所述對應(yīng)存儲單元存儲將區(qū)域信息與文檔信息的頁面相關(guān)聯(lián)的區(qū)域?qū)?yīng) 信息,以及將頁面、代表頁面的頁面圖像信息、以及文檔信息相關(guān)聯(lián)的頁面對 應(yīng)信息;所述搜索單元基于搜索標準對存儲在所述對應(yīng)存儲單元中的區(qū)域信息進 行搜索;以及顯示處理單元顯示由所述搜索單元檢索到的至少一個區(qū)域的信息,以及代 表由所述對應(yīng)存儲單元所關(guān)聯(lián)的頁面的頁面圖像信息,根據(jù)由所述文檔識別單 元識別到的文檔信息將所述顯示分類。
8. 根據(jù)權(quán)利要求7所述的文檔搜索裝置,其中所述顯示處理單元顯示由 所述搜索單元檢索到的至少一個區(qū)域,從而將所述至少一個檢索到的區(qū)域與頁面圖像信息中的其他區(qū)域區(qū)分。
9. 一種文檔搜索方法,包括存儲步驟,以相互關(guān)聯(lián)的方式在存儲單元中存儲文檔信息以及組成文檔信 息的多個元素;搜索及檢索步驟,從在存儲步驟存儲于存儲單元的元素中搜索并檢索至少 一個滿足搜索標準的元素;識別步驟,識別與在搜索及檢索步驟檢索到的每個元素相關(guān)聯(lián)的文檔信自.,&,分組步驟根據(jù)在識別步驟識別到的文檔信息將在搜索及檢索步驟檢索到 的每個元素分組;以及處理及顯示步驟,根據(jù)文檔信息對在分組步驟分組后的每個元素進行處理及顯示。
全文摘要
本發(fā)明涉及文檔搜索裝置以及文檔搜索方法。文檔搜索裝置包括元素對應(yīng)存儲單元,用于存儲頁面對應(yīng)管理表,在頁面對應(yīng)管理表中文檔數(shù)據(jù)和組成文檔數(shù)據(jù)的每個頁面相關(guān)聯(lián);搜索單元,用于搜索頁面對應(yīng)管理表從而找到滿足搜索標準的頁面;文檔識別單元,用于識別與搜索到的頁面相關(guān)聯(lián)的文檔數(shù)據(jù);整理單元,用于根據(jù)識別的文檔信息將搜索到的頁面分組;以及顯示處理單元,用于顯示根據(jù)文檔信息分組的頁面。
文檔編號G06F17/30GK101488145SQ20091000234
公開日2009年7月22日 申請日期2009年1月7日 優(yōu)先權(quán)日2008年1月11日
發(fā)明者巖崎雅二郎 申請人:株式會社理光