文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),搭建了某一專業(yè)領(lǐng)域的基于計(jì)算機(jī)系統(tǒng)的知識(shí)管理系統(tǒng),提高了對(duì)專業(yè)領(lǐng)域知識(shí)的學(xué)習(xí)效率和利用效率。其技術(shù)方案為:在不特定文檔中以關(guān)鍵詞搜索方式標(biāo)識(shí)和關(guān)聯(lián)與一組關(guān)鍵詞有文檔間邏輯關(guān)系的一系列文檔,并對(duì)該系列文檔組成的關(guān)系圖以該組關(guān)鍵詞按一定的邏輯組合進(jìn)行命名。并以符合人腦思維邏輯的方式將該系列的文檔間關(guān)系圖通過(guò)圖形化的形式展現(xiàn)出來(lái)。
【專利說(shuō)明】文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及文檔系統(tǒng),尤其涉及在某一特定專業(yè)領(lǐng)域中對(duì)在線或單機(jī)文檔(含手持設(shè)備)的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索和展現(xiàn)的高效的處理系統(tǒng)。
【背景技術(shù)】
[0002]通過(guò)世界上現(xiàn)有的許多文檔的搜索及展示的系統(tǒng),專業(yè)技術(shù)人員獲取、學(xué)習(xí)并研究文檔,并需要從多份生成日期不同、作者不同(獨(dú)立作者或聯(lián)合作者)的文檔中獲取有效的信息作為相關(guān)行事準(zhǔn)則的參考依據(jù)??赡茏罱K需要的某一知識(shí)內(nèi)容僅占其所查詢的文檔內(nèi)容5%以下,而且這些知識(shí)內(nèi)容可能分散在若干個(gè)不明顯相關(guān)的文檔之中。
[0003]本 申請(qǐng)人:認(rèn)識(shí)到,需要為這些專業(yè)技術(shù)人員,從他們所關(guān)心的領(lǐng)域中尋找到符合他們要求的、準(zhǔn)確的特定信息,即需要在海量文檔提取出相應(yīng)信息的解答是非常耗時(shí)的。而且能夠?yàn)檫@些專業(yè)人員提供相關(guān)類似服務(wù)的人員非常稀少。
[0004]因此,本 申請(qǐng)人:認(rèn)識(shí)到需要建立一種更好的針對(duì)文檔進(jìn)行采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)方法。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于解決上述問(wèn)題,提供了一種文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),搭建了某一專業(yè)領(lǐng)域的基于計(jì)算機(jī)系統(tǒng)的知識(shí)管理系統(tǒng),提高了對(duì)專業(yè)領(lǐng)域知識(shí)的學(xué)習(xí)效率和利用效率。
[0006]本發(fā)明的技術(shù)方案為:本發(fā)明揭示了一種文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),包括文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器、文檔庫(kù)平臺(tái)服務(wù)器以及客戶端訪問(wèn)裝置,其中文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器包括單一文檔的采集裝置、單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置以及文檔間關(guān)系圖建立裝置,文檔庫(kù)平臺(tái)服務(wù)器包括文檔間關(guān)系圖的搜索裝置以及文檔間關(guān)系圖的展現(xiàn)裝置,文檔存儲(chǔ)裝置的主節(jié)點(diǎn)部署在文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器上,文檔存儲(chǔ)裝置的主節(jié)點(diǎn)的鏡像版本部署在文檔庫(kù)平臺(tái)服務(wù)器上,其中:
[0007]單一文檔的采集裝置,用于將所需管理類型的文檔進(jìn)行搜集、初步加工和系統(tǒng)導(dǎo)A ;
[0008]單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置,按照不同的維度和層級(jí)對(duì)預(yù)設(shè)的專業(yè)術(shù)語(yǔ)進(jìn)行分類和定義,建立和維護(hù)對(duì)應(yīng)專業(yè)領(lǐng)域的關(guān)鍵詞列表,對(duì)單一文檔按照不同的屬性和層級(jí)進(jìn)行定義,在單一文檔中設(shè)置若干個(gè)文檔單元,對(duì)文檔單元進(jìn)行若干個(gè)關(guān)鍵詞的系統(tǒng)標(biāo)識(shí),定義任意兩個(gè)單一文檔或文檔單元之間可能產(chǎn)生的邏輯關(guān)系列表,并通過(guò)已設(shè)定的邏輯關(guān)系種類實(shí)現(xiàn)兩個(gè)單一文檔之間的邏輯關(guān)系的關(guān)聯(lián)設(shè)置;
[0009]文檔間關(guān)系圖建立裝置,對(duì)文檔間關(guān)系圖進(jìn)行定義,對(duì)文檔間關(guān)系圖的各組成部分之間的關(guān)系進(jìn)行定義;
[0010]文檔存儲(chǔ)裝置,根據(jù)單一文檔的采集裝置、單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置、文檔間關(guān)系圖建立裝置的調(diào)用將相關(guān)信息存儲(chǔ)到文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器的數(shù)據(jù)庫(kù)中,將指定的格式文件歸檔到文檔庫(kù)平臺(tái)服務(wù)器中,并通過(guò)數(shù)據(jù)交換引擎將相關(guān)數(shù)據(jù)信息在文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器和文檔庫(kù)平臺(tái)服務(wù)器之間傳輸數(shù)據(jù);
[0011]文檔間關(guān)系圖的搜索裝置,建立具有自動(dòng)維護(hù)功能的文檔間關(guān)系圖索引,并根據(jù)輸入的查詢?cè)~語(yǔ)對(duì)文檔間關(guān)系圖進(jìn)行全文檢索;
[0012]文檔間關(guān)系圖的展現(xiàn)裝置,對(duì)文檔間關(guān)系圖進(jìn)行展示、對(duì)文檔間關(guān)系圖中的某個(gè)文檔單元的單獨(dú)展現(xiàn)以及對(duì)文檔間關(guān)系圖中的某個(gè)文檔單元對(duì)應(yīng)的單一文檔全文進(jìn)行展現(xiàn)。
[0013]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,單一文檔的采集裝置進(jìn)一步包括:
[0014]格式整理模塊,將文檔整理成指定的格式文件;
[0015]分類信息標(biāo)識(shí)模塊,連接格式整理模塊,將格式文件按要求添加初步的分類信息標(biāo)識(shí);
[0016]文件導(dǎo)入模塊,連接分類信息標(biāo)識(shí)模塊,將添加了分類信息的格式文件導(dǎo)入到系統(tǒng)中。
[0017]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置進(jìn)一步包括:
[0018]關(guān)鍵詞維度設(shè)定模塊,對(duì)關(guān)鍵詞的維度進(jìn)行設(shè)定;
[0019]關(guān)鍵詞定義模塊,連接關(guān)鍵詞維度設(shè)定模塊,對(duì)關(guān)鍵詞各維度所對(duì)應(yīng)的關(guān)鍵詞進(jìn)行定義;
[0020]文檔分類設(shè)定模塊,按照關(guān)鍵詞對(duì)單一文檔進(jìn)行分類設(shè)定;
[0021]文檔片段設(shè)定模塊,按照關(guān)鍵詞對(duì)文檔的各文檔片段進(jìn)行分類設(shè)定。
[0022]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置還包括:
[0023]文檔單元設(shè)置模塊,將單一文檔的具有相同關(guān)鍵詞標(biāo)識(shí)的文檔片段組合為若干個(gè)文檔單元;
[0024]文檔單元標(biāo)識(shí)模塊,對(duì)文檔單元進(jìn)行若干個(gè)關(guān)鍵詞的系統(tǒng)標(biāo)識(shí);邏輯關(guān)聯(lián)模塊,定義任意兩個(gè)單一文檔之間可能產(chǎn)生的邏輯關(guān)系列表,通過(guò)已設(shè)定的邏輯關(guān)系種類在系統(tǒng)內(nèi)實(shí)現(xiàn)兩個(gè)單一文檔或者文檔單元之間的邏輯關(guān)系的關(guān)聯(lián)。
[0025]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,文檔間關(guān)系圖建立裝置進(jìn)一步包括:
[0026]關(guān)鍵詞命名模塊,對(duì)任一具體的文檔間關(guān)系圖通過(guò)特定的一組關(guān)鍵詞進(jìn)行命名;
[0027]文檔間關(guān)系圖生成模塊,生成文檔間關(guān)系圖,包括文檔間關(guān)系圖中按文檔單元間的特定邏輯關(guān)系排列的一系列文檔單元的展現(xiàn)、文檔單元之間的邏輯關(guān)系的圖形標(biāo)識(shí)、單一文檔單元的展現(xiàn)。
[0028]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,文檔存儲(chǔ)裝置進(jìn)一步包括:
[0029]關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),用于建立文檔分類存儲(chǔ)管理平臺(tái);
[0030]文檔庫(kù)管理系統(tǒng),用于建立文檔庫(kù)平臺(tái);
[0031]寫入操作模塊,對(duì)各裝置的調(diào)用執(zhí)行數(shù)據(jù)庫(kù)的寫入操作;[0032]保存操作模塊,對(duì)各裝置的調(diào)用以歸檔功能保存相應(yīng)的單一文檔文件或文檔間關(guān)系圖文件;
[0033]平臺(tái)數(shù)據(jù)傳輸模塊,通過(guò)數(shù)據(jù)交換引擎將相關(guān)數(shù)據(jù)在文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器和文檔庫(kù)平臺(tái)服務(wù)器之間傳遞。
[0034]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,文檔間關(guān)系圖的搜索裝置進(jìn)一步包括:
[0035]索引建立模塊,建立一套具有自動(dòng)維護(hù)功能的文檔間關(guān)系圖索引;
[0036]關(guān)鍵詞檢索模塊,根據(jù)用戶輸入的查詢?cè)~語(yǔ)對(duì)文檔間關(guān)系圖進(jìn)行全文檢索。
[0037]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,文檔間關(guān)系圖的展現(xiàn)裝置進(jìn)一步包括:
[0038]文檔間關(guān)系圖展現(xiàn)模塊,根據(jù)用戶的搜索結(jié)果展現(xiàn)指定的文檔間關(guān)系圖;
[0039]文檔單元展現(xiàn)模塊,根據(jù)用戶的搜索結(jié)果對(duì)指定的文檔間關(guān)系圖中的某個(gè)文檔單元的展現(xiàn);
[0040]單一文檔展現(xiàn)模塊,根據(jù)用戶的搜索結(jié)果對(duì)指定的文檔間關(guān)系圖中的某個(gè)文檔單元對(duì)應(yīng)的單一文檔全文的展現(xiàn)。
[0041]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,系統(tǒng)還包括文檔釋讀采集平臺(tái)服務(wù)器,其中包括:
[0042]文檔釋讀采集裝置,采集用戶對(duì)文檔的解釋內(nèi)容相關(guān)的輸入數(shù)據(jù);
[0043]數(shù)據(jù)采集審核裝置,對(duì)采集到的輸入數(shù)據(jù)進(jìn)行審核;
[0044]文檔釋讀存儲(chǔ)裝置,將通過(guò)審核的文檔解釋內(nèi)容相關(guān)的輸入數(shù)據(jù)鏈接到相應(yīng)的文檔或文檔間關(guān)系圖中進(jìn)行存儲(chǔ)。
[0045]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,具體的實(shí)現(xiàn)方式還包括基于云技術(shù)構(gòu)建的服務(wù)架構(gòu)體系,實(shí)現(xiàn)諸如云端的數(shù)據(jù)查詢、程序更新以及文件更新處理等服務(wù)。
[0046]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,文檔間的邏輯關(guān)系包括但不限于派生關(guān)系、平行關(guān)系、或關(guān)系、與關(guān)系、包含關(guān)系、修訂關(guān)系、覆蓋關(guān)系、否定關(guān)系的邏輯關(guān)系,其中每一種文檔間的邏輯關(guān)系對(duì)應(yīng)系統(tǒng)中唯一的標(biāo)識(shí)。
[0047]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,文檔包括但不限于論文、教材、歷史文獻(xiàn)、法律法規(guī)、培訓(xùn)課件、新聞和公告,包括但不限于文字、音頻、視頻、網(wǎng)頁(yè)的多媒體介質(zhì)。
[0048]本發(fā)明還揭示了一種文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),以單機(jī)版的方式在單臺(tái)設(shè)備上運(yùn)行,包括:
[0049]單一文檔的采集裝置,用于將所需管理類型的文檔進(jìn)行搜集、初步加工和系統(tǒng)導(dǎo)A ;
[0050]單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置,按照不同的維度和層級(jí)對(duì)預(yù)設(shè)的專業(yè)術(shù)語(yǔ)進(jìn)行分類和定義,建立和維護(hù)對(duì)應(yīng)專業(yè)領(lǐng)域的關(guān)鍵詞列表,對(duì)單一文檔按照不同的屬性和層級(jí)進(jìn)行定義,在單一文檔中設(shè)置若干個(gè)文檔單元,對(duì)文檔單元進(jìn)行若干個(gè)關(guān)鍵詞的系統(tǒng)標(biāo)識(shí),定義任意兩個(gè)單一文檔或文檔單元之間可能產(chǎn)生的邏輯關(guān)系列表,并通過(guò)已設(shè)定的邏輯關(guān)系種類實(shí)現(xiàn)兩個(gè)單一文檔之間的邏輯關(guān)系的關(guān)聯(lián)設(shè)置;[0051]文檔間關(guān)系圖建立裝置,對(duì)文檔間關(guān)系圖進(jìn)行定義,對(duì)文檔間關(guān)系圖的各組成部分之間的關(guān)系進(jìn)行定義;
[0052]文檔存儲(chǔ)裝置,根據(jù)單一文檔的采集裝置、單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置、文檔間關(guān)系圖建立裝置的調(diào)用將相關(guān)信息存儲(chǔ)到單臺(tái)設(shè)備的數(shù)據(jù)庫(kù)中,將指定的格式文件歸檔到單臺(tái)設(shè)備的數(shù)據(jù)庫(kù)中;
[0053]文檔間關(guān)系圖的搜索裝置,建立具有自動(dòng)維護(hù)功能的文檔間關(guān)系圖索引,并根據(jù)輸入的查詢?cè)~語(yǔ)對(duì)文檔間關(guān)系圖名稱進(jìn)行全文檢索;
[0054]文檔間關(guān)系圖的展現(xiàn)裝置,對(duì)文檔間關(guān)系圖進(jìn)行展示、對(duì)文檔間關(guān)系圖中的某個(gè)文檔單元的單獨(dú)展現(xiàn)以及對(duì)文檔間關(guān)系圖中的某個(gè)文檔單元對(duì)應(yīng)的單一文檔全文進(jìn)行展現(xiàn)。
[0055]單機(jī)版打包發(fā)布裝置,將通過(guò)文檔存儲(chǔ)裝置所最終保存的數(shù)據(jù)及歸檔后指定格式的文件、文檔間關(guān)系圖的搜索裝置程序可執(zhí)行文件及配套附屬文件、文檔間關(guān)系圖的展現(xiàn)裝置程序可執(zhí)行文件及配套附屬文件打包成一個(gè)完整的發(fā)布包裹。并根據(jù)目標(biāo)平臺(tái)的不同有針對(duì)性的生成發(fā)布裝置程序可執(zhí)行文件及配套附屬文件。
[0056]客戶端安裝裝置,通過(guò)執(zhí)行發(fā)布裝置的程序可執(zhí)行文件,將發(fā)布包裹完整的展開到單臺(tái)設(shè)備上,包括:通過(guò)文檔存儲(chǔ)裝置所最終保存的數(shù)據(jù)及歸檔后指定格式的文件、文檔間關(guān)系圖的搜索裝置程序可執(zhí)行文件及配套附屬文件、文檔間關(guān)系圖的展現(xiàn)裝置程序可執(zhí)行文件及配套附屬文件。
[0057]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,單一文檔的采集裝置進(jìn)一步包括:
[0058]格式整理模塊,將文檔整理成指定的格式;
[0059]分類信息標(biāo)識(shí)模塊,連接格式整理模塊,將格式文件按要求添加初步的分類信息標(biāo)識(shí);
[0060]文件導(dǎo)入模塊,連接分類信息標(biāo)識(shí)模塊,將添加了分類信息標(biāo)識(shí)的格式文件導(dǎo)入到系統(tǒng)中。
[0061]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置進(jìn)一步包括:
[0062]關(guān)鍵詞維度設(shè)定模塊,對(duì)關(guān)鍵詞的維度進(jìn)行設(shè)定;
[0063]關(guān)鍵詞定義模塊,連接關(guān)鍵詞維度設(shè)定模塊,對(duì)關(guān)鍵詞各維度所對(duì)應(yīng)的關(guān)鍵詞進(jìn)行定義;
[0064]文檔分類設(shè)定模塊,按照關(guān)鍵詞對(duì)單一文檔進(jìn)行分類設(shè)定;
[0065]文檔片段設(shè)定模塊,按照關(guān)鍵詞對(duì)文檔的各文檔片段進(jìn)行分類設(shè)定。
[0066]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置還包括:
[0067]文檔單元設(shè)置模塊,將單一文檔的具有相同關(guān)鍵詞標(biāo)識(shí)的文檔片段組合為若干個(gè)文檔單元;
[0068]文檔單元標(biāo)識(shí)模塊,對(duì)文檔單元進(jìn)行若干個(gè)關(guān)鍵詞的系統(tǒng)標(biāo)識(shí);
[0069]邏輯關(guān)聯(lián)模塊,定義任意兩個(gè)單一文檔之間可能產(chǎn)生的邏輯關(guān)系列表,通過(guò)已設(shè)定的邏輯關(guān)系種類在系統(tǒng)內(nèi)實(shí)現(xiàn)兩個(gè)單一文檔或者文檔單元之間的邏輯關(guān)系的關(guān)聯(lián)。[0070]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,文檔間關(guān)系圖建立裝置進(jìn)一步包括:
[0071]關(guān)鍵詞命名模塊,對(duì)任一具體的文檔間關(guān)系圖通過(guò)特定的一組關(guān)鍵詞進(jìn)行命名;
[0072]文檔間關(guān)系圖生成模塊,生成文檔間關(guān)系圖,包括文檔間關(guān)系圖中按文檔單元間的特定邏輯關(guān)系排列的一系列文檔單元的展現(xiàn)、文檔單元之間的邏輯關(guān)系的圖形標(biāo)識(shí)、單一文檔單元的展現(xiàn)。
[0073]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,文檔間關(guān)系圖的搜索裝置進(jìn)一步包括:
[0074]索引建立模塊,建立一套具有自動(dòng)維護(hù)功能的文檔間關(guān)系圖索引;
[0075]關(guān)鍵詞檢索模塊,根據(jù)用戶輸入的查詢?cè)~語(yǔ)對(duì)文檔間關(guān)系圖名稱進(jìn)行全文檢索。
[0076]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,文檔間關(guān)系圖的展現(xiàn)裝置進(jìn)一步包括:
[0077]文檔間關(guān)系圖展現(xiàn)模塊,根據(jù)用戶的搜索結(jié)果展現(xiàn)指定的文檔間關(guān)系圖;
[0078]文檔單元展現(xiàn)模塊,根據(jù)用戶的搜索結(jié)果展現(xiàn)指定的文檔間關(guān)系圖中的某個(gè)文檔單元的展現(xiàn);
[0079]單一文檔展現(xiàn)模塊,根據(jù)用戶的搜索結(jié)果展現(xiàn)指定的文檔間關(guān)系圖中的某個(gè)文檔單元對(duì)應(yīng)的單一文檔全文的展現(xiàn)。
[0080]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,系統(tǒng)還包括文檔釋讀采集子系統(tǒng),其中包括:
[0081]文檔釋讀采集裝置,采集用戶對(duì)文檔的解釋內(nèi)容相關(guān)的輸入數(shù)據(jù);
[0082]數(shù)據(jù)采集審核裝置,對(duì)采集到的輸入數(shù)據(jù)進(jìn)行審核;
[0083]文檔釋讀存儲(chǔ)裝置,將通過(guò)審核的文檔解釋內(nèi)容相關(guān)的輸入數(shù)據(jù)鏈接到相應(yīng)的文檔或文檔間關(guān)系圖中進(jìn)行存儲(chǔ)。
[0084]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,文檔間的邏輯關(guān)系包括但不限于派生關(guān)系、平行關(guān)系、或關(guān)系、與關(guān)系、包含關(guān)系、修訂關(guān)系、覆蓋關(guān)系、否定關(guān)系的邏輯關(guān)系,其中每一種文檔間的邏輯關(guān)系對(duì)應(yīng)系統(tǒng)中唯一的圖標(biāo)。
[0085]根據(jù)本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例,文檔包括但不限于論文、教材、歷史文獻(xiàn)、法律法規(guī)、培訓(xùn)課件、新聞和公告,包括但不限于文字、音頻、視頻、網(wǎng)頁(yè)的多媒體介質(zhì)。
[0086]本發(fā)明對(duì)比現(xiàn)有技術(shù)有如下的有益效果:本發(fā)明的方案是在海量文檔中以關(guān)鍵詞搜索方式尋找到與一組特定的關(guān)鍵詞有文檔邏輯關(guān)系的一系列文檔,并對(duì)該特定的一系列文檔間的關(guān)系圖以一組與之強(qiáng)相關(guān)的關(guān)鍵詞進(jìn)行命名,以符合人腦思維邏輯的方式將該系列的文檔間關(guān)系圖通過(guò)圖形化的形式展現(xiàn)出來(lái)。具體而言,本發(fā)明的方案是由若干臺(tái)服務(wù)器群以約定的排序方式收集保存某一專業(yè)領(lǐng)域的日益增多的文檔,并將其放置于相應(yīng)的數(shù)據(jù)庫(kù)進(jìn)行保存。由文檔分類存儲(chǔ)管理平臺(tái)對(duì)最新文檔進(jìn)行采集后按多個(gè)維度的關(guān)鍵詞對(duì)文檔進(jìn)行文檔片段分類,根據(jù)指定的關(guān)鍵詞抽取所有對(duì)應(yīng)的文檔片段組成文檔單元,建立關(guān)鍵詞索引,并通過(guò)文檔單元同時(shí)產(chǎn)生符合人腦思維邏輯的關(guān)系圖,并以多個(gè)維度的關(guān)鍵詞組對(duì)該文檔關(guān)系圖進(jìn)行命名。通過(guò)數(shù)據(jù)交換引擎將多個(gè)維度的關(guān)鍵詞定義文檔片段分類后的文檔及其索引,以及符合人腦思維邏輯的文檔關(guān)系圖傳送到文檔庫(kù)平臺(tái)。系統(tǒng)使用者可以通過(guò)電腦終端登錄或其他單機(jī)設(shè)備(含手持設(shè)備)文檔庫(kù)平臺(tái)的網(wǎng)頁(yè)入口,并從系統(tǒng)中輸入多個(gè)維度的關(guān)鍵詞來(lái)查詢特定文檔及文檔關(guān)系圖,系統(tǒng)以關(guān)聯(lián)程度自動(dòng)排序,系統(tǒng)將進(jìn)行文檔正文、文檔間關(guān)系圖名稱等元素進(jìn)行分詞并進(jìn)行全文檢索,幫助用戶找到相關(guān)特定知識(shí)點(diǎn)的關(guān)系圖。
[0087]通過(guò)這一系統(tǒng)的搭建,可以幫助使用者以最快的速度從數(shù)據(jù)庫(kù)的海量文檔中搜索到某一具體文檔間關(guān)系圖完整內(nèi)容和相關(guān)信息,提高對(duì)該專業(yè)領(lǐng)域知識(shí)的學(xué)習(xí)效率和利用效率。
【專利附圖】
【附圖說(shuō)明】
[0088]圖1是對(duì)應(yīng)于本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例的框圖。
[0089]圖2A-2F分別示出了系統(tǒng)中各個(gè)裝置的細(xì)化結(jié)構(gòu)。
[0090]圖3是對(duì)應(yīng)于本發(fā)明的一個(gè)操作圖1系統(tǒng)及針對(duì)文檔搜索及展現(xiàn)的示例性方法的框圖。
[0091]圖4是對(duì)應(yīng)于本發(fā)明的單一文檔的采集裝置的數(shù)據(jù)庫(kù)層面實(shí)現(xiàn)原理圖。
[0092]圖5是對(duì)應(yīng)于本發(fā)明中的文檔采集加工及文檔間關(guān)系圖定義的框圖。
[0093]圖6是對(duì)應(yīng)于本發(fā)明的單一文檔標(biāo)識(shí)關(guān)聯(lián)裝置及文檔間關(guān)系圖建立裝置數(shù)據(jù)庫(kù)層面實(shí)現(xiàn)原理圖。
[0094]圖7是對(duì)應(yīng)于本發(fā)明中的文檔分類存儲(chǔ)管理平臺(tái)、文檔庫(kù)平臺(tái)之間數(shù)據(jù)流通部分實(shí)現(xiàn)框圖。
[0095]圖8是對(duì)應(yīng)于本發(fā)明中的文檔間關(guān)系圖的搜索實(shí)現(xiàn)原理框圖。
[0096]圖9是對(duì)應(yīng)于本發(fā)明的文檔間關(guān)系圖搜索裝置數(shù)據(jù)庫(kù)層面實(shí)現(xiàn)原理圖。
[0097]圖10是對(duì)應(yīng)于本發(fā)明中的文檔間關(guān)系圖展示實(shí)現(xiàn)原理框圖。
[0098]圖11是本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的另一實(shí)施例的框圖。
[0099]圖12是圖11所示的實(shí)施例的系統(tǒng)運(yùn)行流程圖。
[0100]圖13是文檔釋讀采集平臺(tái)服務(wù)器的細(xì)化結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0101]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的描述。
[0102]圖1示出了本發(fā)明的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng)的一實(shí)施例的結(jié)構(gòu)。本發(fā)明的系統(tǒng)既適用于在線文檔,也適用于單機(jī)文檔(包含手持設(shè)備)。本發(fā)明的實(shí)施例是以在線文檔為例來(lái)說(shuō)明的,單機(jī)文檔的應(yīng)用類似,區(qū)別僅在于改成單機(jī)版,這是本領(lǐng)域技術(shù)人員熟知的。請(qǐng)參見圖1,本實(shí)施例的系統(tǒng)包括文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器10、文檔庫(kù)平臺(tái)服務(wù)器12以及客戶端訪問(wèn)裝置14??蛻舳嗽L問(wèn)裝置14不限數(shù)量,可以為圖1所示的三個(gè):客戶端訪問(wèn)裝置140、142、144。
[0103]文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器10除了常見的中央處理器、操作系統(tǒng)以及數(shù)據(jù)交換引擎之外,還包括控制應(yīng)用部分:單一文檔的采集裝置100、單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置102、文檔間關(guān)系圖建立裝置104、以及部署在文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器上的文檔存儲(chǔ)裝置的主節(jié)點(diǎn)106。
[0104]文檔庫(kù)平臺(tái)服務(wù)器12除了常見的中央處理器、操作系統(tǒng)以及數(shù)據(jù)交換引擎之外,還包括控制應(yīng)用部分:文檔間關(guān)系圖的搜索裝置120、文檔間關(guān)系圖的展現(xiàn)裝置122以及部署在文檔庫(kù)平臺(tái)服務(wù)器上的文檔存儲(chǔ)裝置的主節(jié)點(diǎn)的鏡像版本124。
[0105]單一文檔的采集裝置100總體實(shí)現(xiàn)了所需管理類型文檔的搜集、初步加工以及導(dǎo)入系統(tǒng)的功能。圖2A示出了單一文檔的采集裝置100的內(nèi)部結(jié)構(gòu),結(jié)合圖2A,單一文檔的采集裝置100部署在文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器10上,裝置100包括:格式整理模塊1000、分類信息標(biāo)識(shí)模塊1002、文件導(dǎo)入模塊1004。
[0106]格式整理模塊1000在系統(tǒng)外將文檔整理成指定的格式文件。
[0107]分類信息標(biāo)識(shí)模塊1002在系統(tǒng)外將格式文件按照要求添加初步分類信息,包括但不限于:標(biāo)題信息、標(biāo)識(shí)號(hào)信息、文檔頭信息、文檔正文信息、附件信息、多語(yǔ)目版本信息
坐寸ο
[0108]文件導(dǎo)入模塊1004將格式文件通過(guò)系統(tǒng)導(dǎo)入到文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器10上。
[0109]圖3示出了本發(fā)明系統(tǒng)的運(yùn)行流程,結(jié)合圖3說(shuō)明單一文檔的采集裝置100的運(yùn)行流程如下。
[0110]首先,提供包含至少一個(gè)將指定格式的文檔文件與文檔數(shù)據(jù)關(guān)聯(lián)起來(lái)的數(shù)據(jù)結(jié)構(gòu)(文檔信息基礎(chǔ)表、作者表、文檔全文內(nèi)容表、文檔全文關(guān)鍵詞表)的知識(shí)庫(kù)。圖4示出了單一文檔的采集裝置100的數(shù)據(jù)庫(kù)層面的表間關(guān)系。
[0111]本發(fā)明的系統(tǒng)提供給用戶一套完整的采集指定文檔的系統(tǒng)工具及其實(shí)現(xiàn)方法,用戶可以發(fā)起一個(gè)文檔采集的流程。流程請(qǐng)參見圖5所示的第I列部分。
[0112]用戶可以對(duì)由上一步搜集的文檔進(jìn)行判斷,判斷其是否具有收錄的價(jià)值,如果沒(méi)有則本流程終止,反之則繼續(xù)進(jìn)行后續(xù)處理。
[0113]然后,將文檔整理成系統(tǒng)能夠識(shí)別的指定文件格式后上傳到系統(tǒng)臨時(shí)庫(kù)中。響應(yīng)于接收到來(lái)自請(qǐng)求者的上傳請(qǐng)求,將所使用的上傳文件通過(guò)文件流的方式傳送到服務(wù)器端,將指定的符合格式要求的文件分行讀取并解析。
[0114]對(duì)提交的文檔進(jìn)行審核,判斷其格式及內(nèi)容是否符合要求,如果不符合要求則退回文件上傳臨時(shí)庫(kù)這一步驟要求重新處理。如果審核通過(guò)后,則將指定格式文件中的信息分字段并經(jīng)過(guò)轉(zhuǎn)換后存入到文檔信息基礎(chǔ)表中,將該文檔的作者存入到作者表中(一個(gè)文檔可以有多個(gè)作者,因此允許有多條記錄),其中基礎(chǔ)表ID字段是文檔信息基礎(chǔ)表的外鍵,并將文檔正文對(duì)應(yīng)的關(guān)鍵詞存入文檔全文關(guān)鍵詞表中(文檔正文可以有多個(gè)關(guān)鍵詞,因此允許有多條記錄),其中全文內(nèi)容表ID是全文內(nèi)容表的外健。
[0115]在上述操作全部成功之后,將指定格式文件存入到文檔庫(kù)中,并將執(zhí)行結(jié)果反饋給請(qǐng)求者。上述寫入數(shù)據(jù)庫(kù)以及文檔庫(kù)的操作都是調(diào)用文檔存儲(chǔ)裝置106來(lái)實(shí)現(xiàn)的。
[0116]單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置102是本發(fā)明的重要組成部分之一,部署于文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器10上,其主要實(shí)現(xiàn)以下功能:1、按照不同的維度對(duì)預(yù)設(shè)的專業(yè)術(shù)語(yǔ)進(jìn)行分類和定義,建立和維護(hù)對(duì)應(yīng)專業(yè)領(lǐng)域的關(guān)鍵詞列表;2、對(duì)單一文檔按照不同的屬性進(jìn)行定義,這些相關(guān)屬性成為系統(tǒng)的查詢條件;3、在單一文檔中設(shè)置若干個(gè)文檔單元;4、定義任意兩個(gè)單一文檔或文檔單元之間可能產(chǎn)生的邏輯關(guān)系列表;5、通過(guò)已設(shè)定的邏輯關(guān)系種類實(shí)現(xiàn)兩個(gè)單一文檔之間的邏輯關(guān)系的關(guān)聯(lián)設(shè)置。
[0117]圖2B示出了單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置102的內(nèi)部結(jié)構(gòu)。結(jié)合圖2B,單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置102包括:關(guān)鍵詞維度設(shè)定模塊1020、關(guān)鍵詞定義模塊1022、文檔單元標(biāo)識(shí)模塊1023、文檔分類設(shè)定模塊1024、文檔片段設(shè)定模塊1026。
[0118]除此之外,單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置102還包括:文檔單元設(shè)置模塊1021、邏輯關(guān)聯(lián)模塊1025。文檔單元設(shè)置模塊1021將單一文檔的具有相同關(guān)鍵詞標(biāo)識(shí)的文檔片段組合為若干個(gè)文檔單元。邏輯關(guān)聯(lián)模塊1025定義任意兩個(gè)單一文檔之間可能產(chǎn)生的邏輯關(guān)系列表,通過(guò)已設(shè)定的邏輯關(guān)系種類在系統(tǒng)內(nèi)實(shí)現(xiàn)兩個(gè)單一文檔或者文檔單元之間的邏輯關(guān)系的關(guān)聯(lián)。
[0119]關(guān)鍵詞維度設(shè)定模塊1020對(duì)關(guān)鍵詞的維度進(jìn)行設(shè)定。關(guān)鍵詞定義模塊1022連接關(guān)鍵詞維度設(shè)定模塊1022,對(duì)關(guān)鍵詞各維度所對(duì)應(yīng)的關(guān)鍵詞進(jìn)行定義。文檔單元標(biāo)識(shí)模塊1023對(duì)文檔單元進(jìn)行若干個(gè)關(guān)鍵詞的系統(tǒng)標(biāo)識(shí)。文檔分類設(shè)定模塊1024按照關(guān)鍵詞對(duì)單一文檔進(jìn)行分類設(shè)定。文檔片段設(shè)定模塊1026按照關(guān)鍵詞對(duì)文檔的各文檔片段進(jìn)行分類設(shè)定。
[0120]在單一文檔進(jìn)行屬性標(biāo)識(shí)的同時(shí),建立起多個(gè)維度的關(guān)鍵詞分類體系,使用關(guān)鍵詞對(duì)文檔進(jìn)行多角度全方位的劃分。具體方法包括:針對(duì)文檔的每一個(gè)文檔片段分別標(biāo)識(shí)一組關(guān)鍵詞;在同一個(gè)文檔中將擁有含義相似、概念相近關(guān)鍵詞的文檔片段從不同維度定義為若干個(gè)文檔單元;依據(jù)分門別類、解構(gòu)建構(gòu)的思路設(shè)定這些文檔單元之間的邏輯關(guān)系,并對(duì)每一種邏輯關(guān)系設(shè)定一個(gè)專屬的圖標(biāo)進(jìn)行標(biāo)識(shí),組成的最基本展現(xiàn)畫面稱之為文檔間關(guān)系圖展現(xiàn)。例如,派生關(guān)系表示:文檔B是依據(jù)文檔A的某一的文檔片段撰寫的。平行關(guān)系表示:對(duì)于共同基于文檔A的某一的文檔片段撰寫的兩個(gè)或多個(gè)文檔間的關(guān)系,為平行文檔。設(shè)定平行文檔時(shí),發(fā)布時(shí)間早的居左,發(fā)布時(shí)間晚的居右。
[0121]文檔間關(guān)系圖一般會(huì)根據(jù)不同的專業(yè)領(lǐng)域分別定義若干個(gè)不同維度的關(guān)鍵詞中至少選擇不少于2個(gè)的關(guān)鍵詞組成。
[0122]單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置102在收到操作者的對(duì)單一文檔進(jìn)行標(biāo)識(shí)和關(guān)聯(lián)的命令后執(zhí)行相關(guān)操作并與用戶進(jìn)行交互,內(nèi)部數(shù)據(jù)庫(kù)表間的關(guān)系請(qǐng)參見圖6。
[0123]單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置102的內(nèi)部運(yùn)行流程參見圖5第2列所示。提供包含至少一個(gè)將關(guān)鍵詞數(shù)據(jù)與文檔數(shù)據(jù)、文檔片段數(shù)據(jù)關(guān)聯(lián)起來(lái)的數(shù)據(jù)結(jié)構(gòu)(關(guān)鍵詞表、文檔信息基礎(chǔ)表、文檔全文內(nèi)容表、文檔全文關(guān)鍵詞表、文檔段落內(nèi)容表、文檔段落關(guān)鍵詞表)的知識(shí)庫(kù)。
[0124]系統(tǒng)提供對(duì)關(guān)鍵詞維度進(jìn)行定義的功能,對(duì)應(yīng)數(shù)據(jù)庫(kù)關(guān)鍵詞表中的關(guān)鍵詞種類字段。系統(tǒng)提供對(duì)已確認(rèn)的關(guān)鍵詞維度進(jìn)行編輯具體的關(guān)鍵詞的功能,包括但不限于:關(guān)鍵詞名稱、關(guān)鍵詞維度(種類)等屬性進(jìn)行編輯,并發(fā)起一個(gè)關(guān)鍵詞定義的流程。
[0125]系統(tǒng)提供對(duì)提交的關(guān)鍵詞必要性及其各屬性設(shè)置情況進(jìn)行審核的功能,如果審核不通過(guò)則退回具體關(guān)鍵詞編輯的步驟,如果審核通過(guò)則將數(shù)據(jù)保存入數(shù)據(jù)庫(kù)的關(guān)鍵詞表中。
[0126]系統(tǒng)提供將文檔按文檔片段分別定義對(duì)應(yīng)的關(guān)鍵詞的功能。該功能將數(shù)據(jù)存入文檔段落內(nèi)容表、文檔段落關(guān)鍵詞表。文檔片段其中文檔段落內(nèi)容表的基礎(chǔ)表ID字段是文檔信息基礎(chǔ)表的自增長(zhǎng)ID字段的外鍵文檔段落關(guān)鍵詞表的段落表ID是文檔段落內(nèi)容表的自增長(zhǎng)ID字段的外鍵,關(guān)鍵詞ID字段是關(guān)鍵詞表的自增長(zhǎng)ID字段的外鍵。
[0127]系統(tǒng)提供將文檔正式存入文檔分類存儲(chǔ)管理平臺(tái)數(shù)據(jù)庫(kù)及文檔庫(kù),并執(zhí)行發(fā)布操作的功能。
[0128]上述寫入數(shù)據(jù)庫(kù)、文檔庫(kù)的操作最終都是調(diào)用文檔存儲(chǔ)裝置106來(lái)實(shí)現(xiàn)。
[0129]文檔間關(guān)系圖建立裝置104部署于文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器10之上,其對(duì)文檔間關(guān)系圖進(jìn)行定義,對(duì)文檔間關(guān)系圖的各組成部分之間的關(guān)系進(jìn)行定義。
[0130]如圖2C所不,文檔間關(guān)系圖建立裝置104包括關(guān)鍵詞命名|旲塊1040和文檔間關(guān)系圖生成模塊1042。關(guān)鍵詞命名模塊1040對(duì)任一具體的文檔間關(guān)系圖通過(guò)特定的一組關(guān)鍵詞進(jìn)行命名。文檔間關(guān)系圖生成模塊1042用于生成文檔間關(guān)系圖,包括文檔間關(guān)系圖中相關(guān)文檔單元群的展現(xiàn)、文檔單元之間的邏輯關(guān)系的圖形標(biāo)識(shí)、單一文檔單元的展現(xiàn)。
[0131]文檔間關(guān)系圖建立裝置104在接收到操作者的文檔間關(guān)系圖建立命名后執(zhí)行相關(guān)操作,并與用戶進(jìn)行交互,流程請(qǐng)參見圖5第3列所示,而數(shù)據(jù)庫(kù)表間關(guān)系請(qǐng)參見圖6。
[0132]提供包含至少一個(gè)將關(guān)鍵詞數(shù)據(jù)與文檔數(shù)據(jù)、文檔間關(guān)系圖數(shù)據(jù)關(guān)聯(lián)起來(lái)的數(shù)據(jù)結(jié)構(gòu)(關(guān)鍵詞表、文檔信息基礎(chǔ)表、文檔全文內(nèi)容表、文檔全文關(guān)鍵詞表、文檔段落內(nèi)容表、文檔段落關(guān)鍵詞表、文檔間關(guān)系圖頭表、文檔間關(guān)系圖基本表、文檔間關(guān)系圖對(duì)應(yīng)段落表)的知識(shí)庫(kù)。
[0133]系統(tǒng)中提供一套完整的對(duì)文檔間關(guān)系圖進(jìn)行創(chuàng)建及維護(hù)流程的功能。系統(tǒng)提供一種定義本文檔間關(guān)系圖所涉及到的關(guān)鍵詞維度的功能。并定義所設(shè)計(jì)關(guān)鍵詞維度中需要對(duì)應(yīng)的具體關(guān)鍵詞。將數(shù)據(jù)存入文檔知識(shí)點(diǎn)頭表,其中關(guān)鍵詞維度IID?關(guān)鍵詞維度[N]ID分別是關(guān)鍵詞表自增長(zhǎng)ID字段的外鍵。
[0134]系統(tǒng)將會(huì)根據(jù)所設(shè)定的關(guān)鍵詞列出所有符合條件的文檔,并且按同時(shí)符合數(shù)的數(shù)量降序排序。
[0135]系統(tǒng)提供一種列出在所有符合條件的文檔中篩選出最符合本文檔間關(guān)系圖概念的文檔單元的功能。就某一特定專業(yè)領(lǐng)域的文檔間的邏輯關(guān)系而言,可分為N類(N為自然數(shù))邏輯關(guān)系,比如:派生關(guān)系(即A派生B)、平行關(guān)系/與關(guān)系(即A與B平行)、或關(guān)系(即A或B皆成立)、包含關(guān)系(即A包含B)、修訂關(guān)系(即B對(duì)A的部分表述、內(nèi)容進(jìn)行修訂)、覆蓋關(guān)系(B的內(nèi)容完全包含A,但又明顯比A完整,業(yè)內(nèi)廣泛認(rèn)同B而不是A,則A被B覆蓋)、否定關(guān)系(A與B相反)。
[0136]舉例來(lái)說(shuō),A教材中分為10章,每章分10節(jié)。第4章和第5章分別講解同一事物的兩個(gè)不同的屬性,屬于平行關(guān)系。第I章與第I章第2節(jié)屬于包含關(guān)系,即第I章包含第I章第2節(jié)。第8章第3節(jié)和第8章第4節(jié)闡述了同一事物的兩個(gè)相反的但都未被證實(shí)的理論假設(shè),前者成立則后者不能成立,反之亦如是,即兩者是否定關(guān)系。第9章第7節(jié)和第9章第8節(jié)闡述了同一事物的兩個(gè)平行的但都未被證實(shí)的理論假設(shè),前者成立與后者成立沒(méi)有必然關(guān)系,即兩者是或關(guān)系。B教材中的第X章是對(duì)A教材第5章的釋讀,則前者與后者是派生關(guān)系。
[0137]在此,系統(tǒng)將會(huì)為每一種文檔間的邏輯關(guān)系賦與唯一的圖形標(biāo)識(shí),在展示時(shí)以該特定標(biāo)識(shí)作為兩個(gè)文檔單元之間的邏輯關(guān)系的標(biāo)識(shí),以便系統(tǒng)使用者直接理解和辨識(shí)。
[0138]每一個(gè)單一文檔都可以被分解成若干個(gè)文檔片段,每個(gè)文檔片段可以被定義為一個(gè)文檔單元。對(duì)于某一專業(yè)領(lǐng)域的任何文檔,必然擁有該領(lǐng)域的一個(gè)以上專業(yè)術(shù)語(yǔ)的屬性,這個(gè)專業(yè)術(shù)語(yǔ)可以通過(guò)計(jì)算機(jī)系統(tǒng)賦值的形式定義為與該文檔單元文檔片段對(duì)應(yīng)的關(guān)鍵
ο
[0139]舉例來(lái)說(shuō),文檔片段X和Y是平行關(guān)系,文檔片段X對(duì)應(yīng)的關(guān)鍵詞為A、B、C、D,文檔片段Y對(duì)應(yīng)的關(guān)鍵詞為B、C、D、E,則當(dāng)以B-C-D關(guān)鍵詞進(jìn)行搜索,則系統(tǒng)顯示結(jié)果為B-C-D。
[0140]每一個(gè)選中的文檔單元都會(huì)在文檔間關(guān)系圖基本表中以記錄的形式體現(xiàn),其中知識(shí)點(diǎn)頭表1D字段是文檔間關(guān)系圖頭表的自增長(zhǎng)ID字段的外鍵,文檔基礎(chǔ)表1D是文檔信息基礎(chǔ)表的自增長(zhǎng)ID字段的外鍵,元素ID字段是根據(jù)規(guī)則自動(dòng)產(chǎn)生的。具體規(guī)則為:
[0141]文檔單元:“PF_” +選擇元素時(shí)時(shí)間戳所轉(zhuǎn)換的數(shù)字;
[0142]派生關(guān)系:“PL_” +選擇元素時(shí)時(shí)間戳所轉(zhuǎn)換的數(shù)字;
[0143]平行關(guān)系:“PE_” +選擇元素時(shí)時(shí)間戳所轉(zhuǎn)換的數(shù)字;
[0144]修訂關(guān)系:“PM_” +選擇元素時(shí)時(shí)間戳所轉(zhuǎn)換的數(shù)字;
[0145]覆蓋關(guān)系:“PN_” +選擇元素時(shí)時(shí)間戳所轉(zhuǎn)換的數(shù)字;
[0146]包含關(guān)系:“PQ_” +選擇元素時(shí)時(shí)間戳所轉(zhuǎn)換的數(shù)字;
[0147]否定關(guān)系:“PT_” +選擇元素時(shí)時(shí)間戳所轉(zhuǎn)換的數(shù)字。 [0148]同時(shí)在子表文檔間關(guān)系圖對(duì)應(yīng)段落表中需要填入所選擇文檔單元具體所對(duì)應(yīng)的段落號(hào),其中文檔間關(guān)系圖基本表1D字段是文檔間關(guān)系圖基本表自增長(zhǎng)ID字段的外鍵,段落序號(hào)字段是文檔段落內(nèi)容表的段落排序號(hào)字段的外鍵。
[0149]系統(tǒng)提供對(duì)所篩選出的文檔單元進(jìn)行布局,同時(shí)設(shè)置這些文檔單元之間的邏輯關(guān)系的功能,這種邏輯關(guān)系包括但不僅限于:派生關(guān)系、平行關(guān)系、修訂關(guān)系、覆蓋關(guān)系、包含關(guān)系、否定關(guān)系等。
[0150]實(shí)現(xiàn)的方法為:先添加所要連接關(guān)系的文檔單元到設(shè)計(jì)區(qū)上,調(diào)整坐標(biāo)位置;再添加所需要設(shè)計(jì)的關(guān)系到設(shè)計(jì)區(qū)上,系統(tǒng)將實(shí)時(shí)畫出關(guān)系圖形效果,并可以根據(jù)用戶的拖拽移動(dòng)調(diào)整關(guān)系元素的位置、大小、粗細(xì)等細(xì)節(jié);分別設(shè)定關(guān)系元素的連接兩端的文檔單元元素,關(guān)系元素的兩端只能選擇文檔單元元素,文檔單元元素也只能由關(guān)系元素連接起來(lái)。
[0151]以派生關(guān)系為例,在文檔間關(guān)系圖基本表中,派生關(guān)系元素需要分別設(shè)置它的上元素ID、下元素ID。同時(shí)被上元素ID、下元素ID選中的兩個(gè)文檔單元,在該表中同樣要更新下元素ID及相應(yīng)的上元素ID,以及對(duì)被上元素ID所對(duì)應(yīng)的文檔單元需要設(shè)置它跳過(guò)關(guān)系元素直接連接到的下元素實(shí)體ID,對(duì)被下元素ID所對(duì)應(yīng)的文檔單元需要設(shè)置它跳過(guò)關(guān)系元素直接連接到的上元素實(shí)體ID。這里的上元素ID、下元素ID、上元素實(shí)體ID、下元素實(shí)體ID都是文檔間關(guān)系圖基本表中的元素ID字段的外鍵。
[0152]其他如平行關(guān)系、修訂關(guān)系、覆蓋關(guān)系、包含關(guān)系、否定關(guān)系都是按與派生關(guān)系相同的處理方法進(jìn)行處理;
[0153]同時(shí)對(duì)于文檔單元在文檔間關(guān)系圖基本表中需要記錄它在設(shè)計(jì)區(qū)上的元素開始X坐標(biāo)、元素開始Y坐標(biāo),以設(shè)計(jì)區(qū)左上角為(0,0)點(diǎn)。
[0154]同時(shí)對(duì)于各關(guān)系元素在文檔間關(guān)系圖基本表中需要記錄它在設(shè)計(jì)區(qū)上的元素開始X坐標(biāo)、元素開始Y坐標(biāo)、元素結(jié)束X坐標(biāo)、元素結(jié)束Y坐標(biāo),以設(shè)計(jì)區(qū)左上角為(0,0)點(diǎn),以及線條圖片流數(shù)據(jù)。
[0155]其中線條圖片流數(shù)據(jù),是將在設(shè)計(jì)區(qū)上所最終確定下來(lái)關(guān)系元素的大小、粗細(xì)等細(xì)節(jié)轉(zhuǎn)換成非常通用的矢量圖Png圖片格式并再次轉(zhuǎn)換成二進(jìn)制的圖片流數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù)。
[0156]系統(tǒng)提供對(duì)所提交的文檔間關(guān)系圖進(jìn)行審核的功能,判斷該文檔間關(guān)系圖的定義以及文檔單元間的邏輯關(guān)系設(shè)置等是否正確,如果不正確則將退回文檔間關(guān)系圖的創(chuàng)建的這一步重新執(zhí)行,反之審核通過(guò)則繼續(xù)進(jìn)行后續(xù)處理。
[0157]系統(tǒng)提供將文檔間關(guān)系圖正式存入文檔分類存儲(chǔ)管理平臺(tái)數(shù)據(jù)庫(kù)及文檔庫(kù),并執(zhí)行發(fā)布操作的功能。
[0158]上述寫入數(shù)據(jù)庫(kù)、文檔庫(kù)的操作最終都是調(diào)用文檔存儲(chǔ)裝置106來(lái)實(shí)現(xiàn)。
[0159]文檔存儲(chǔ)裝置的主節(jié)點(diǎn)106部署在文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器10之上,而在文檔庫(kù)平臺(tái)上部署主節(jié)點(diǎn)的鏡像版本124。文檔存儲(chǔ)裝置106根據(jù)單一文檔的采集裝置、單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置、文檔間關(guān)系圖建立裝置的調(diào)用將相關(guān)信息存儲(chǔ)到文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器的數(shù)據(jù)庫(kù)中,將指定的格式文件歸檔到文檔庫(kù)平臺(tái)服務(wù)器中,并通過(guò)數(shù)據(jù)交換引擎將相關(guān)數(shù)據(jù)信息在文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器和文檔庫(kù)平臺(tái)服務(wù)器之間傳輸數(shù)據(jù)。
[0160]如圖2D所示,文檔存儲(chǔ)裝置106包括關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)1060、文檔庫(kù)管理系統(tǒng)1061、寫入操作模塊1062、保存操作模塊1063和平臺(tái)數(shù)據(jù)傳輸模塊1064。關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)1060用于建立文檔分類存儲(chǔ)管理平臺(tái)。文檔庫(kù)管理系統(tǒng)1061用于建立文檔庫(kù)平臺(tái)。寫入操作模塊1062對(duì)各裝置的調(diào)用執(zhí)行數(shù)據(jù)庫(kù)的寫入操作。保存操作模塊1063對(duì)各裝置的調(diào)用以歸檔功能保存相應(yīng)的單一文檔文件或文檔間關(guān)系圖文件。平臺(tái)數(shù)據(jù)傳輸模塊1064通過(guò)數(shù)據(jù)交換引擎將相關(guān)數(shù)據(jù)在文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器10和文檔庫(kù)平臺(tái)服務(wù)器12之間傳遞。
[0161]文檔存儲(chǔ)裝置106在接收到來(lái)自其他裝置的請(qǐng)求后執(zhí)行數(shù)據(jù)庫(kù)存儲(chǔ)和文檔庫(kù)歸檔的交互式方法。
[0162]請(qǐng)參見圖7,文檔存儲(chǔ)裝置106提供包含至少一個(gè)將本系統(tǒng)所有平臺(tái)所有數(shù)據(jù)全部關(guān)聯(lián)起來(lái)的數(shù)據(jù)結(jié)構(gòu)的知識(shí)庫(kù)。提供包含至少一個(gè)經(jīng)過(guò)配置可以按版本歸檔指定格式文件的文檔庫(kù)。提供包含至少一套完整的數(shù)據(jù)庫(kù)調(diào)用接口,供單一文檔的采集裝置100、單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置102、文檔間關(guān)系圖建立裝置104、文檔間關(guān)系圖的搜索裝置120、文檔間關(guān)系圖的展現(xiàn)裝置124按需使用。提供包含至少一套完整的文檔庫(kù)調(diào)用接口,供單一文檔的采集裝置100、單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置102用來(lái)歸檔及更新指定格式文件。
[0163]提供包含至少一套完整的數(shù)據(jù)同步機(jī)制,并調(diào)用數(shù)據(jù)交換引擎來(lái)使恰當(dāng)?shù)臄?shù)據(jù)能夠及時(shí)在文檔分類存儲(chǔ)管理平臺(tái)、文檔庫(kù)平臺(tái)兩者之間流通。
[0164]文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器10通過(guò)接口程序與文檔庫(kù)平臺(tái)服務(wù)器12進(jìn)行數(shù)據(jù)的交互傳遞,部分實(shí)現(xiàn)請(qǐng)參見圖7。它將需要發(fā)送的數(shù)據(jù)通過(guò)遠(yuǎn)端寫入的方式寫入到文檔庫(kù)平臺(tái)待同步信號(hào)表及相關(guān)臨時(shí)表,再由文檔庫(kù)平臺(tái)的接口程序進(jìn)行相關(guān)后續(xù)處理。同時(shí)它也將根據(jù)并主動(dòng)抓取文檔庫(kù)平臺(tái)中的待回傳信號(hào)表及同步臨時(shí)表中的數(shù)據(jù)。
[0165]當(dāng)在文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器10上執(zhí)行各種發(fā)布操作,包括但不僅限于:關(guān)鍵詞發(fā)布、單一文檔發(fā)布、文檔間關(guān)系圖發(fā)布等時(shí),首先將待同步信號(hào)寫入到臨時(shí)表,以便接口程序循環(huán)執(zhí)行周期開始時(shí)進(jìn)行后續(xù)相關(guān)處理。
[0166]文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器10上的調(diào)度定時(shí)器,根據(jù)所設(shè)定的時(shí)間步長(zhǎng)向量,定時(shí)循環(huán)執(zhí)行接口程序,一旦因?yàn)榻涌诔绦蛭丛谝粋€(gè)時(shí)間步長(zhǎng)向量?jī)?nèi)完成數(shù)據(jù)傳遞工作,或者因?yàn)榻涌诔绦虺霈F(xiàn)異常等情況,具備智能恢復(fù)的功能。
[0167]文檔庫(kù)平臺(tái)服務(wù)器12通過(guò)接口程序來(lái)獲取文檔分類存儲(chǔ)管理庫(kù)平臺(tái)服務(wù)器10傳遞過(guò)來(lái)的數(shù)據(jù),部分實(shí)現(xiàn)請(qǐng)參見圖6。根據(jù)文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器10的接口程序主動(dòng)推送到本平臺(tái)的待同步信號(hào)表及同步臨時(shí)表的相關(guān)數(shù)據(jù)對(duì)目標(biāo)數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行更新處理。同時(shí)對(duì)于由本平臺(tái)的包括但不僅限于:用戶行為信息等操作所產(chǎn)生的數(shù)據(jù)進(jìn)行抓取后并寫入待回傳信號(hào)表及同步臨時(shí)表,以便文檔分類存儲(chǔ)管理平臺(tái)的接口程序進(jìn)行后續(xù)處理。
[0168]當(dāng)文檔庫(kù)平臺(tái)服務(wù)器12通過(guò)接口程序接收到文檔間關(guān)系圖等數(shù)據(jù)時(shí),會(huì)觸發(fā)全文搜索引擎重建索引的功能。
[0169]文檔間關(guān)系圖的搜索裝置120建立具有自維護(hù)功能的文檔間關(guān)系圖索引,并根據(jù)輸入的查詢?cè)~語(yǔ)對(duì)文檔間關(guān)系圖進(jìn)行全文檢索。文檔間關(guān)系圖的搜索裝置120包括如圖2E所示的索引建立模塊1200和關(guān)鍵詞檢索模塊1202。
[0170]索引建立模塊1200建立一套具有自動(dòng)維護(hù)功能的文檔間關(guān)系圖索引。關(guān)鍵詞檢索模塊1202根據(jù)用戶輸入的查詢?cè)~語(yǔ)對(duì)文檔間關(guān)系圖進(jìn)行全文檢索。
[0171]文檔間關(guān)系圖的搜索裝置120部署在文檔庫(kù)平臺(tái)服務(wù)器12之上,在搜到來(lái)自最終用戶的請(qǐng)求后按照既定規(guī)則執(zhí)行數(shù)據(jù)檢索。運(yùn)行流程如圖8所示,數(shù)據(jù)庫(kù)表間關(guān)系圖如圖9所示。
[0172]系統(tǒng)提供包含至少一套將文檔間關(guān)系圖與查詢條件元素建立組合索引的數(shù)據(jù)結(jié)構(gòu)的知識(shí)庫(kù)。在數(shù)據(jù)庫(kù)中當(dāng)有文檔間關(guān)系圖相關(guān)信息進(jìn)行同步更新時(shí)系統(tǒng)將自動(dòng)更新,針對(duì)文檔間關(guān)系圖查詢而特別建立的由文檔間關(guān)系圖名稱的字段而聯(lián)合建立的全文搜索索引表,數(shù)據(jù)庫(kù)表間關(guān)系圖請(qǐng)參見圖9。
[0173]當(dāng)用戶使用文檔間關(guān)系圖的全文檢索時(shí),系統(tǒng)首先調(diào)用全文搜索引擎中的分詞組件進(jìn)行分詞處理。再次調(diào)用全文搜索引擎進(jìn)行預(yù)搜索并自動(dòng)完成查詢?cè)~語(yǔ),針對(duì)用戶輸入的查詢?cè)~語(yǔ)在文檔間關(guān)系圖名稱列中進(jìn)行檢索,并根據(jù)用戶的漸進(jìn)輸入自動(dòng)完成,給出的自動(dòng)完成列表中按文檔間關(guān)系圖被查詢調(diào)用的次數(shù)(根據(jù)文檔間關(guān)系圖被搜索詞頻記錄表的次數(shù)字段,該表的文檔間關(guān)系圖頭表ID字段是文檔間關(guān)系圖頭表的自增長(zhǎng)ID字段的外鍵)降序排序。
[0174]系統(tǒng)根據(jù)確切的查詢?cè)~語(yǔ)或者在自動(dòng)完成列表中所選擇的具體文檔間關(guān)系圖名稱,再次調(diào)用全文搜索引擎中的分詞組件進(jìn)行分詞處理。將分詞后的各詞語(yǔ)到全文搜索索引表中根據(jù)文檔間關(guān)系圖名稱執(zhí)行檢索。系統(tǒng)將判斷是否找到相關(guān)的結(jié)果,如果未找到將執(zhí)行記錄查詢?cè)~語(yǔ)的功能,反之則繼續(xù)進(jìn)行后續(xù)處理。
[0175]系統(tǒng)將記錄該查詢?cè)~語(yǔ)(寫入無(wú)結(jié)果詞記錄表),并將通過(guò)文檔存儲(chǔ)裝置調(diào)用數(shù)據(jù)交換引擎將數(shù)據(jù)傳回文檔分類存儲(chǔ)管理平臺(tái)。
[0176]將檢索到的查詢結(jié)果按文檔間關(guān)系圖被搜索選擇次數(shù)及網(wǎng)羅度進(jìn)行降序排序后分頁(yè)返回,將由用戶點(diǎn)擊進(jìn)入查看某個(gè)具體文檔間關(guān)系圖。并且搜索詞將高亮顯示。
[0177]當(dāng)用戶點(diǎn)擊某個(gè)具體的文檔間關(guān)系圖進(jìn)入明細(xì)查看畫面,系統(tǒng)將調(diào)用文檔間關(guān)系圖的展現(xiàn)裝置122進(jìn)行展示。
[0178]文檔間關(guān)系圖的展現(xiàn)裝置122對(duì)文檔間關(guān)系圖進(jìn)行展示,對(duì)文檔間關(guān)系圖中的某個(gè)文檔單元的單獨(dú)展現(xiàn)以及對(duì)文檔間關(guān)系圖中的某個(gè)文檔單元對(duì)應(yīng)的單一文檔全文進(jìn)行展現(xiàn)。文檔間關(guān)系圖的展現(xiàn)裝置122包括如圖2F所示的文檔間關(guān)系圖展現(xiàn)模塊1220、文檔單元展現(xiàn)模塊1222、單一文檔展現(xiàn)模塊1224。文檔間關(guān)系圖展現(xiàn)模塊1220根據(jù)用戶的搜索結(jié)果展現(xiàn)指定的文檔間關(guān)系圖。文檔單元展現(xiàn)模塊1222根據(jù)用戶的搜索結(jié)果展現(xiàn)指定的文檔間關(guān)系圖中的某個(gè)文檔單元的展現(xiàn)。單一文檔展現(xiàn)模塊1224根據(jù)用戶的搜索結(jié)果展現(xiàn)指定的文檔間關(guān)系圖中的某個(gè)文檔單元對(duì)應(yīng)的單一文檔全文的展現(xiàn)。
[0179]文檔間關(guān)系圖的展現(xiàn)裝置122部署在文檔庫(kù)平臺(tái)服務(wù)器12之上。
[0180]文檔間關(guān)系圖的展現(xiàn)裝置122在收到來(lái)自最終用戶的請(qǐng)求后按既定規(guī)則將信息進(jìn)行展現(xiàn)的交互式方法如圖10所示,具體描述如下。
[0181]系統(tǒng)提供包含至少一套完整文檔全文信息、完整文檔間關(guān)系圖信息數(shù)據(jù)結(jié)構(gòu)的知識(shí)庫(kù)。
[0182]系統(tǒng)根據(jù)最終用戶的選擇,將所選擇的文檔間關(guān)系圖的自增長(zhǎng)ID到文檔間關(guān)系圖頭表中執(zhí)行檢索操作,執(zhí)行文檔間關(guān)系圖的展示功能,數(shù)據(jù)庫(kù)表間關(guān)系圖請(qǐng)參見圖6。
[0183]文檔間關(guān)系圖的展示處理過(guò)程為:根據(jù)文檔間關(guān)系圖編號(hào)到文檔間關(guān)系圖基本表中獲取該文檔間關(guān)系圖的所有組成元素及其相關(guān)屬性。
[0184]構(gòu)建所有的文檔單元,并初始化文檔單元的寬度和高度以及進(jìn)行坐標(biāo)定位。
[0185]構(gòu)建所有文檔單元之間的邏輯關(guān)系,并初始化這些邏輯關(guān)系線條的長(zhǎng)度、高度、寬度以及進(jìn)行坐標(biāo)定位。從數(shù)據(jù)庫(kù)文檔間關(guān)系圖基本表中的線條圖片流數(shù)據(jù)字段中將二進(jìn)制數(shù)據(jù)轉(zhuǎn)成為Png格式的圖片文件并在畫面上進(jìn)行顯示。
[0186]處理包括但不限于:修訂/被修訂、覆蓋/被覆蓋等特殊關(guān)系的位置以及文檔單元的層疊屬性。當(dāng)某兩個(gè)文檔單元修訂關(guān)系元素、覆蓋關(guān)系元素等特殊元素所連接時(shí),連接的文檔單元將置于上層,被連接的文檔單元將被置于下層。例如:覆蓋關(guān)系,A覆蓋于B,則A文檔單元將置于上層,B文檔單元將置于A文檔單元的下層,兩個(gè)文檔單位呈層疊顯示狀。
[0187]獲取所有文檔單元中所對(duì)應(yīng)文檔的具體文檔片段內(nèi)容,根據(jù)文檔間關(guān)系圖基本表的文檔基礎(chǔ)表ID字段+文檔間關(guān)系圖對(duì)應(yīng)段落表的段落序號(hào)字段到文檔段落內(nèi)容表獲取該文檔單元所對(duì)應(yīng)的全部段落內(nèi)容記錄,并排段落序號(hào)升序排序。
[0188]至此,文檔間關(guān)系圖展示處理完成,將處理結(jié)果返回并顯示。
[0189]根據(jù)最終用戶的選擇,將所選擇文檔單元傳遞給系統(tǒng)執(zhí)行文檔單元的單獨(dú)展現(xiàn)。
[0190]根據(jù)所選擇的文檔單元在文檔間關(guān)系圖基本表的文檔基礎(chǔ)表ID字段+文檔間關(guān)系圖對(duì)應(yīng)段落表的段落序號(hào)字段到文檔段落內(nèi)容表獲取該文檔單元所對(duì)應(yīng)的全部段落內(nèi)容記錄,并排段落序號(hào)升序排序,以單一文檔單元的獨(dú)立方式展示,獨(dú)立方式整個(gè)屏幕只能看到該文檔單元而不顯示其他文檔單元。
[0191]根據(jù)所選擇的文檔單位,在該單元的四周按邏輯關(guān)系的不同,在不同位置,并按該文檔單元的實(shí)際連接情況,構(gòu)建邏輯關(guān)系連接線。例如:A文檔單元被派生關(guān)系連接于下方,同時(shí)被平行關(guān)系連接于右邊,則在該文檔單元的上部顯示派生關(guān)系向上箭頭圖標(biāo),在文檔單元的左邊顯示平行關(guān)系向左箭頭圖標(biāo)。
[0192]同時(shí),在文檔單元單獨(dú)展現(xiàn)畫面上還提供該文檔單元所在文檔的文檔標(biāo)識(shí)號(hào)連接。
[0193]通過(guò)點(diǎn)擊文檔標(biāo)識(shí)號(hào),畫面將跳轉(zhuǎn)到該單一文檔全文展示畫面,以便用戶查看完整的文檔內(nèi)容。[0194]文檔單元的單獨(dú)展現(xiàn)處理完畢,將處理結(jié)果返回并顯示。
[0195]根據(jù)最終用戶的選擇,將所選擇的文檔標(biāo)識(shí)號(hào)到文檔信息基礎(chǔ)表中執(zhí)行檢索操作,執(zhí)行對(duì)應(yīng)該文檔單元的單一文檔全文展示功能。
[0196]從文檔段落內(nèi)容表中抽取該文檔的所有段落,并按段落排序號(hào)升序排序后展現(xiàn)在畫面上。
[0197]圖11示出了本發(fā)明的系統(tǒng)的另一實(shí)施例的結(jié)構(gòu)。本實(shí)施例的系統(tǒng)除了圖1所示的實(shí)施例的客戶端訪問(wèn)裝置、文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器和文檔庫(kù)平臺(tái)服務(wù)器之外,還包括了文檔釋讀采集平臺(tái)服務(wù)器,該服務(wù)器和文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器、客戶端訪問(wèn)裝置均有交互。圖13示出了文檔釋讀采集平臺(tái)服務(wù)器的細(xì)化結(jié)構(gòu),文檔釋讀采集平臺(tái)服務(wù)器包括文檔釋讀采集裝置160、數(shù)據(jù)采集審核裝置162、文檔釋讀存儲(chǔ)裝置164。而與圖1實(shí)施例相同的模塊在此不再贅述。
[0198]文檔釋讀采集裝置160采集用戶對(duì)文檔的解釋內(nèi)容相關(guān)的輸入數(shù)據(jù)。數(shù)據(jù)采集審核裝置162對(duì)采集到的輸入數(shù)據(jù)進(jìn)行審核。文檔釋讀存儲(chǔ)裝置164將通過(guò)審核的文檔解釋內(nèi)容相關(guān)的輸入數(shù)據(jù)加入到相應(yīng)的原文中進(jìn)行存儲(chǔ)。
[0199]圖12示出了系統(tǒng)的運(yùn)行流程。文檔庫(kù)平臺(tái)展示來(lái)源于兩方面,一方面是和圖1實(shí)施例相同的多維度關(guān)鍵詞定義和維護(hù)、最新文檔采集、文檔整理及多維度定義建立索引、關(guān)系圖建立和維護(hù);另一方面是文檔釋讀采集、文檔釋讀審核以及對(duì)應(yīng)關(guān)系的設(shè)置。
[0200]需要注意的是,在本發(fā)明中,可以被采集、定義、關(guān)聯(lián)、搜索和展現(xiàn)的文檔包括但不限于論文、教材、歷史文獻(xiàn)、法律法規(guī)、培訓(xùn)課件、新聞和公告等,包括但不限于文字、音頻、視頻、網(wǎng)頁(yè)等多媒體介質(zhì),包括但不限于某一特定專業(yè)領(lǐng)域的知識(shí)(可以是自然科學(xué)知識(shí),也可以是社會(huì)科學(xué)知識(shí)),也不限于中文或其它文字。
[0201]此外,上述方案具體的實(shí)現(xiàn)方式還包括基于云技術(shù)構(gòu)建的服務(wù)架構(gòu)體系,例如部署于云端的數(shù)據(jù)查詢、程序更新以及文件更新處理等服務(wù)。
[0202]以上的實(shí)施例均是基于在線文檔來(lái)描述的,本發(fā)明的上述方案還可稍作修改之后應(yīng)用于單機(jī)文檔。系統(tǒng)是以單機(jī)版的方式在單臺(tái)設(shè)備(例如單機(jī)方式運(yùn)行的計(jì)算機(jī)、手持設(shè)備等)上運(yùn)行。單機(jī)版系統(tǒng)包括:單一文檔的采集裝置、單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置、文檔間關(guān)系圖建立裝置、文檔存儲(chǔ)裝置、文檔間關(guān)系圖的搜索裝置、文檔間關(guān)系圖的展現(xiàn)裝置、單機(jī)版打包發(fā)布裝置和客戶端安裝裝置。
[0203]單一文檔的采集裝置用于將所需管理類型的文檔進(jìn)行搜集、初步加工和系統(tǒng)導(dǎo)入。單一文檔的采集裝置進(jìn)一步包括:格式整理模塊、分類信息標(biāo)識(shí)模塊、文件導(dǎo)入模塊。格式整理模塊將文檔整理成指定的格式。分類信息標(biāo)識(shí)模塊連接格式整理模塊,將格式文件按要求添加初步的分類信息標(biāo)識(shí)。文件導(dǎo)入模塊連接分類信息標(biāo)識(shí)模塊,將添加了分類信息標(biāo)識(shí)的格式文件導(dǎo)入到系統(tǒng)中。
[0204]單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置按照不同的維度和層級(jí)對(duì)預(yù)設(shè)的專業(yè)術(shù)語(yǔ)進(jìn)行分類和定義,建立和維護(hù)對(duì)應(yīng)專業(yè)領(lǐng)域的關(guān)鍵詞列表,對(duì)單一文檔按照不同的屬性和層級(jí)進(jìn)行定義,在單一文檔中設(shè)置若干個(gè)文檔單元,對(duì)文檔單元進(jìn)行若干個(gè)關(guān)鍵詞的系統(tǒng)標(biāo)識(shí),定義任意兩個(gè)單一文檔或文檔單元之間可能產(chǎn)生的邏輯關(guān)系列表,并通過(guò)已設(shè)定的邏輯關(guān)系種類實(shí)現(xiàn)兩個(gè)單一文檔之間的邏輯關(guān)系的關(guān)聯(lián)設(shè)置。單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置進(jìn)一步包括:關(guān)鍵詞維度設(shè)定模塊、關(guān)鍵詞定義模塊、文檔分類設(shè)定模塊、文檔片段設(shè)定模塊。關(guān)鍵詞維度設(shè)定模塊對(duì)關(guān)鍵詞的維度進(jìn)行設(shè)定。關(guān)鍵詞定義模塊連接關(guān)鍵詞維度設(shè)定模塊,對(duì)關(guān)鍵詞各維度所對(duì)應(yīng)的關(guān)鍵詞進(jìn)行定義。文檔分類設(shè)定模塊按照關(guān)鍵詞對(duì)單一文檔進(jìn)行分類設(shè)定。文檔片段設(shè)定模塊按照關(guān)鍵詞對(duì)文檔的各文檔片段進(jìn)行分類設(shè)定。此外,單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置還包括:文檔單元設(shè)置模塊、文檔單元標(biāo)識(shí)模塊、邏輯關(guān)聯(lián)模塊。文檔單元設(shè)置模塊將單一文檔的具有相同關(guān)鍵詞標(biāo)識(shí)的文檔片段組合為若干個(gè)文檔單元。文檔單元標(biāo)識(shí)模塊對(duì)文檔單元進(jìn)行若干個(gè)關(guān)鍵詞的系統(tǒng)標(biāo)識(shí)。邏輯關(guān)聯(lián)模塊定義任意兩個(gè)單一文檔之間可能產(chǎn)生的邏輯關(guān)系列表,通過(guò)已設(shè)定的邏輯關(guān)系種類在系統(tǒng)內(nèi)實(shí)現(xiàn)兩個(gè)單一文檔或者文檔單元之間的邏輯關(guān)系的關(guān)聯(lián)。
[0205]文檔間關(guān)系圖建立裝置對(duì)文檔間關(guān)系圖進(jìn)行定義,對(duì)文檔間關(guān)系圖的各組成部分之間的關(guān)系進(jìn)行定義。文檔間關(guān)系圖建立裝置進(jìn)一步包括:關(guān)鍵詞命名模塊、文檔間關(guān)系圖生成模塊。關(guān)鍵詞命名模塊對(duì)任一具體的文檔間關(guān)系圖通過(guò)特定的一組關(guān)鍵詞進(jìn)行命名。文檔間關(guān)系圖生成模塊生成文檔間關(guān)系圖,包括文檔間關(guān)系圖中按文檔單元間的特定邏輯關(guān)系排列的一系列文檔單元的展現(xiàn)、文檔單元之間的邏輯關(guān)系的圖形標(biāo)識(shí)、單一文檔單元的展現(xiàn)。
[0206]文檔存儲(chǔ)裝置根據(jù)單一文檔的采集裝置、單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置、文檔間關(guān)系圖建立裝置的調(diào)用將相關(guān)信息存儲(chǔ)到單臺(tái)設(shè)備的數(shù)據(jù)庫(kù)中,將指定的格式文件歸檔到單臺(tái)設(shè)備的數(shù)據(jù)庫(kù)中。
[0207]文檔間關(guān)系圖的搜索裝置,建立具有自動(dòng)維護(hù)功能的文檔間關(guān)系圖索引,并根據(jù)輸入的查詢?cè)~語(yǔ)對(duì)文檔間關(guān)系圖名稱進(jìn)行全文檢索。文檔間關(guān)系圖的搜索裝置進(jìn)一步包括:索引建立模塊和關(guān)鍵詞檢索模塊。索引建立模塊建立一套具有自動(dòng)維護(hù)功能的文檔間關(guān)系圖索引。關(guān)鍵詞檢索模塊,根據(jù)用戶輸入的查詢?cè)~語(yǔ)對(duì)文檔間關(guān)系圖名稱進(jìn)行全文檢索。
[0208]文檔間關(guān)系圖的展現(xiàn)裝置對(duì)文檔間關(guān)系圖進(jìn)行展示、對(duì)文檔間關(guān)系圖中的某個(gè)文檔單元的單獨(dú)展現(xiàn)以及對(duì)文檔間關(guān)系圖中的某個(gè)文檔單元對(duì)應(yīng)的單一文檔全文進(jìn)行展現(xiàn)。文檔間關(guān)系圖的展現(xiàn)裝置進(jìn)一步包括:文檔間關(guān)系圖展現(xiàn)模塊、文檔單元展現(xiàn)模塊、單一文檔展現(xiàn)模塊。文檔間關(guān)系圖展現(xiàn)模塊根據(jù)用戶的搜索結(jié)果展現(xiàn)指定的文檔間關(guān)系圖。文檔單元展現(xiàn)模塊根據(jù)用戶的搜索結(jié)果展現(xiàn)指定的文檔間關(guān)系圖中的某個(gè)文檔單元的展現(xiàn)。單一文檔展現(xiàn)模塊根據(jù)用戶的搜索結(jié)果展現(xiàn)指定的文檔間關(guān)系圖中的某個(gè)文檔單元對(duì)應(yīng)的單一文檔全文的展現(xiàn)。
[0209]單機(jī)版打包發(fā)布裝置將通過(guò)文檔存儲(chǔ)裝置所最終保存的數(shù)據(jù)及歸檔后指定格式的文件、文檔間關(guān)系圖的搜索裝置程序可執(zhí)行文件及配套附屬文件、文檔間關(guān)系圖的展現(xiàn)裝置程序可執(zhí)行文件及配套附屬文件打包成一個(gè)完整的發(fā)布包裹。并根據(jù)目標(biāo)平臺(tái)的不同有針對(duì)性的生成發(fā)布裝置程序可執(zhí)行文件及配套附屬文件。
[0210]客戶端安裝裝置通過(guò)執(zhí)行發(fā)布裝置的程序可執(zhí)行文件,將發(fā)布包裹完整的展開到單臺(tái)設(shè)備上,包括:通過(guò)文檔存儲(chǔ)裝置所最終保存的數(shù)據(jù)及歸檔后指定格式的文件、文檔間關(guān)系圖的搜索裝置程序可執(zhí)行文件及配套附屬文件、文檔間關(guān)系圖的展現(xiàn)裝置程序可執(zhí)行文件及配套附屬文件。
[0211]系統(tǒng)還包括文檔釋讀采集子系統(tǒng),文檔釋讀采集子系統(tǒng)包括:文檔釋讀采集裝置、數(shù)據(jù)采集審核裝置、文檔釋讀存儲(chǔ)裝置。文檔釋讀采集裝置采集用戶對(duì)文檔的解釋內(nèi)容相關(guān)的輸入數(shù)據(jù)。數(shù)據(jù)采集審核裝置對(duì)采集到的輸入數(shù)據(jù)進(jìn)行審核。文檔釋讀存儲(chǔ)裝置將通過(guò)審核的文檔解釋內(nèi)容相關(guān)的輸入數(shù)據(jù)鏈接到相應(yīng)的文檔或文檔間關(guān)系圖中進(jìn)行存儲(chǔ)。
[0212]在單機(jī)版的實(shí)施例中,文檔間的邏輯關(guān)系包括但不限于派生關(guān)系、平行關(guān)系、或關(guān)系、與關(guān)系、包含關(guān)系、修訂關(guān)系、覆蓋關(guān)系、否定關(guān)系的邏輯關(guān)系,其中每一種文檔間的邏輯關(guān)系對(duì)應(yīng)系統(tǒng)中唯一的圖標(biāo)。文檔包括但不限于論文、教材、歷史文獻(xiàn)、法律法規(guī)、培訓(xùn)課件、新聞和公告,包括但不限于文字、音頻、視頻、網(wǎng)頁(yè)的多媒體介質(zhì)。
[0213]上述實(shí)施例是提供給本領(lǐng)域普通技術(shù)人員來(lái)實(shí)現(xiàn)和使用本發(fā)明的,本領(lǐng)域普通技術(shù)人員可在不脫離本發(fā)明的發(fā)明思想的情況下,對(duì)上述實(shí)施例做出種種修改或變化,因而本發(fā)明的保護(hù)范圍并不被上述實(shí)施例所限,而應(yīng)該是符合權(quán)利要求書所提到的創(chuàng)新性特征的最大范圍。
【權(quán)利要求】
1.一種文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),包括文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器、文檔庫(kù)平臺(tái)服務(wù)器以及客戶端訪問(wèn)裝置,其中文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器包括單一文檔的采集裝置、單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置以及文檔間關(guān)系圖建立裝置,文檔庫(kù)平臺(tái)服務(wù)器包括文檔間關(guān)系圖的搜索裝置以及文檔間關(guān)系圖的展現(xiàn)裝置,文檔存儲(chǔ)裝置的主節(jié)點(diǎn)部署在文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器上,文檔存儲(chǔ)裝置的主節(jié)點(diǎn)的鏡像版本部署在文檔庫(kù)平臺(tái)服務(wù)器上,其中: 單一文檔的采集裝置,用于將所需管理類型的文檔進(jìn)行搜集、初步加工和系統(tǒng)導(dǎo)入;單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置,按照不同的維度和層級(jí)對(duì)預(yù)設(shè)的專業(yè)術(shù)語(yǔ)進(jìn)行分類和定義,建立和維護(hù)對(duì)應(yīng)專業(yè)領(lǐng)域的關(guān)鍵詞列表,對(duì)單一文檔按照不同的屬性和層級(jí)進(jìn)行定義,在單一文檔中設(shè)置若干個(gè)文檔單元,對(duì)文檔單元進(jìn)行若干個(gè)關(guān)鍵詞的系統(tǒng)標(biāo)識(shí),定義任意兩個(gè)單一文檔或文檔單元之間可能產(chǎn)生的邏輯關(guān)系列表,并通過(guò)已設(shè)定的邏輯關(guān)系種類實(shí)現(xiàn)兩個(gè)單一文檔之間的邏輯關(guān)系的關(guān)聯(lián)設(shè)置; 文檔間關(guān)系圖建立裝置,對(duì)文檔間關(guān)系圖進(jìn)行定義,對(duì)文檔間關(guān)系圖的各組成部分之間的關(guān)系進(jìn)行定義; 文檔存儲(chǔ)裝置,根據(jù)單一文檔的采集裝置、單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置、文檔間關(guān)系圖建立裝置的調(diào)用將相關(guān)信息存儲(chǔ)到文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器的數(shù)據(jù)庫(kù)中,將指定的格式文件歸檔到文檔庫(kù)平臺(tái)服務(wù)器中,并通過(guò)數(shù)據(jù)交換引擎將相關(guān)數(shù)據(jù)信息在文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器和文檔庫(kù)平臺(tái)服務(wù)器之間傳輸數(shù)據(jù); 文檔間關(guān)系圖的 搜索裝置,建立具有自動(dòng)維護(hù)功能的文檔間關(guān)系圖索引,并根據(jù)輸入的查詢?cè)~語(yǔ)對(duì)文檔間關(guān)系圖名稱進(jìn)行全文檢索; 文檔間關(guān)系圖的展現(xiàn)裝置,對(duì)文檔間關(guān)系圖進(jìn)行展示、對(duì)文檔間關(guān)系圖中的某個(gè)文檔單元的單獨(dú)展現(xiàn)以及對(duì)文檔間關(guān)系圖中的某個(gè)文檔單元對(duì)應(yīng)的單一文檔全文進(jìn)行展現(xiàn)。
2.根據(jù)權(quán)利要求1所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,單一文檔的采集裝置進(jìn)一步包括: 格式整理模塊,將文檔整理成指定的格式; 分類信息標(biāo)識(shí)模塊,連接格式整理模塊,將格式文件按要求添加初步的分類信息標(biāo)識(shí); 文件導(dǎo)入模塊,連接分類信息標(biāo)識(shí)模塊,將添加了分類信息標(biāo)識(shí)的格式文件導(dǎo)入到系統(tǒng)中。
3.根據(jù)權(quán)利要求2所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置進(jìn)一步包括: 關(guān)鍵詞維度設(shè)定模塊,對(duì)關(guān)鍵詞的維度進(jìn)行設(shè)定; 關(guān)鍵詞定義模塊,連接關(guān)鍵詞維度設(shè)定模塊,對(duì)關(guān)鍵詞各維度所對(duì)應(yīng)的關(guān)鍵詞進(jìn)行定義; 文檔分類設(shè)定模塊,按照關(guān)鍵詞對(duì)單一文檔進(jìn)行分類設(shè)定; 文檔片段設(shè)定模塊,按照關(guān)鍵詞對(duì)文檔的各文檔片段進(jìn)行分類設(shè)定。
4.根據(jù)權(quán)利要求3所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置還包括: 文檔單元設(shè)置模塊,將單一文檔的具有相同關(guān)鍵詞標(biāo)識(shí)的文檔片段組合為若干個(gè)文檔單元; 文檔單元標(biāo)識(shí)模塊,對(duì)文檔單元進(jìn)行若干個(gè)關(guān)鍵詞的系統(tǒng)標(biāo)識(shí); 邏輯關(guān)聯(lián)模塊,定義任意兩個(gè)單一文檔之間可能產(chǎn)生的邏輯關(guān)系列表,通過(guò)已設(shè)定的邏輯關(guān)系種類在系統(tǒng)內(nèi)實(shí)現(xiàn)兩個(gè)單一文檔或者文檔單元之間的邏輯關(guān)系的關(guān)聯(lián)。
5.根據(jù)權(quán)利要求4所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,文檔間關(guān)系圖建立裝置進(jìn)一步包括: 關(guān)鍵詞命名模塊,對(duì)任一具體的文檔間關(guān)系圖通過(guò)特定的一組關(guān)鍵詞進(jìn)行命名; 文檔間關(guān)系圖生成模塊,生成文檔間關(guān)系圖,包括文檔間關(guān)系圖中按文檔單元間的特定邏輯關(guān)系排列的一系列文檔單元的展現(xiàn)、文檔單元之間的邏輯關(guān)系的圖形標(biāo)識(shí)、單一文檔單元的展現(xiàn)。
6.根據(jù)權(quán)利要求5所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,文檔存儲(chǔ)裝置進(jìn)一步包括: 關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),用于建立文檔分類存儲(chǔ)管理平臺(tái); 文檔庫(kù)管理系統(tǒng),用于建立文檔庫(kù)平臺(tái); 寫入操作模塊,對(duì)各裝置的調(diào)用執(zhí)行數(shù)據(jù)庫(kù)的寫入操作; 保存操作模塊,對(duì)各裝置的調(diào)用以歸檔功能保存相應(yīng)的單一文檔文件或文檔間關(guān)系圖文件; 平臺(tái)數(shù)據(jù)傳輸模塊,通過(guò)數(shù)據(jù)交換引擎將相關(guān)數(shù)據(jù)在文檔分類存儲(chǔ)管理平臺(tái)服務(wù)器和文檔庫(kù)平臺(tái)服務(wù)器之間傳遞。
7.根據(jù)權(quán)利要求6所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,文檔間關(guān)系圖的搜索裝置進(jìn)一步包括: 索引建立模塊,建立一套具有自動(dòng)維護(hù)功能的文檔間關(guān)系圖索引; 關(guān)鍵詞檢索模塊,根據(jù)用戶輸入的查詢?cè)~語(yǔ)對(duì)文檔間關(guān)系圖名稱進(jìn)行全文檢索。
8.根據(jù)權(quán)利要求7所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,文檔間關(guān)系圖的展現(xiàn)裝置進(jìn)一步包括: 文檔間關(guān)系圖展現(xiàn)模塊,根據(jù)用戶的搜索結(jié)果展現(xiàn)指定的文檔間關(guān)系圖; 文檔單元展現(xiàn)模塊,根據(jù)用戶的搜索結(jié)果展現(xiàn)指定的文檔間關(guān)系圖中的某個(gè)文檔單元的展現(xiàn); 單一文檔展現(xiàn)模塊,根據(jù)用戶的搜索結(jié)果展現(xiàn)指定的文檔間關(guān)系圖中的某個(gè)文檔單元對(duì)應(yīng)的單一文檔全文的展現(xiàn)。
9.根據(jù)權(quán)利要求1所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,系統(tǒng)還包括文檔釋讀采集平臺(tái)服務(wù)器,其中包括: 文檔釋讀采集裝置,采集用戶對(duì)文檔的解釋內(nèi)容相關(guān)的輸入數(shù)據(jù); 數(shù)據(jù)采集審核裝置,對(duì)采集到的輸入數(shù)據(jù)進(jìn)行審核; 文檔釋讀存儲(chǔ)裝置,將通過(guò)審核的文檔解釋內(nèi)容相關(guān)的輸入數(shù)據(jù)鏈接到相應(yīng)的文檔或文檔間關(guān)系圖中進(jìn)行存儲(chǔ)。
10.根據(jù)權(quán)利要求1所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,文檔間的邏輯關(guān)系包括但不限于派生關(guān)系、平行關(guān)系、或關(guān)系、與關(guān)系、包含關(guān)系、修訂關(guān)系、覆蓋關(guān)系、否定關(guān)系的邏輯關(guān)系,其中每一種文檔間的邏輯關(guān)系對(duì)應(yīng)系統(tǒng)中唯一的圖標(biāo)。
11.根據(jù)權(quán)利要求1所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,具體的實(shí)現(xiàn)方式還包括基于云技術(shù)構(gòu)建的服務(wù)架構(gòu)體系,實(shí)現(xiàn)諸如云端的數(shù)據(jù)查詢、程序更新以及文件更新處理等服務(wù)。
12.根據(jù)權(quán)利要求1所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,文檔包括但不限于論文、教材、歷史文獻(xiàn)、法律法規(guī)、培訓(xùn)課件、新聞和公告,包括但不限于文字、音頻、視頻、網(wǎng)頁(yè)的多媒體介質(zhì)。
13.一種文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),以單機(jī)版的方式在單臺(tái)設(shè)備上運(yùn)行,包括: 單一文檔的采集裝置,用于將所需管理類型的文檔進(jìn)行搜集、初步加工和系統(tǒng)導(dǎo)入; 單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置,按照不同的維度和層級(jí)對(duì)預(yù)設(shè)的專業(yè)術(shù)語(yǔ)進(jìn)行分類和定義,建立和維護(hù)對(duì)應(yīng)專業(yè)領(lǐng)域的關(guān)鍵詞列表,對(duì)單一文檔按照不同的屬性和層級(jí)進(jìn)行定義,在單一文檔中設(shè)置若干個(gè)文檔單元,對(duì)文檔單元進(jìn)行若干個(gè)關(guān)鍵詞的系統(tǒng)標(biāo)識(shí),定義任意兩個(gè)單一文檔或文檔單元之間可能產(chǎn)生的邏輯關(guān)系列表,并通過(guò)已設(shè)定的邏輯關(guān)系種類實(shí)現(xiàn)兩個(gè)單一文檔之間的邏輯關(guān)系的關(guān)聯(lián)設(shè)置; 文檔間關(guān)系圖建立裝置,對(duì)文檔間關(guān)系圖進(jìn)行定義,對(duì)文檔間關(guān)系圖的各組成部分之間的關(guān)系進(jìn)行定義; 文檔存儲(chǔ)裝置,根據(jù)單一文檔的采集裝置、單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置、文檔間關(guān)系圖建立裝置的調(diào)用將相關(guān)信息存儲(chǔ)到單臺(tái)設(shè)備的數(shù)據(jù)庫(kù)中,將指定的格式文件歸檔到單臺(tái)設(shè)備的數(shù)據(jù)庫(kù)中; 文檔間關(guān)系圖的搜索裝置,建立具有自動(dòng)維護(hù)功能的文檔間關(guān)系圖索引,并根據(jù)輸入的查詢?cè)~語(yǔ)對(duì)文檔間關(guān)系圖名稱進(jìn)行全文檢索; 文檔間關(guān)系圖的展現(xiàn)裝置,對(duì)文檔間關(guān)系圖進(jìn)行展示、對(duì)文檔間關(guān)系圖中的某個(gè)文檔單元的單獨(dú)展現(xiàn)以及對(duì)文檔間關(guān)系圖中的某個(gè)文檔單元對(duì)應(yīng)的單一文檔全文進(jìn)行展現(xiàn); 單機(jī)版打包發(fā)布裝置,將通過(guò)文檔存儲(chǔ)裝置所最終保存的數(shù)據(jù)及歸檔后指定格式的文件、文檔間關(guān)系圖的搜索裝置程序可執(zhí)行文件及配套附屬文件、文檔間關(guān)系圖的展現(xiàn)裝置程序可執(zhí)行文件及配套附屬文件打包成一個(gè)完整的發(fā)布包裹,并根據(jù)目標(biāo)平臺(tái)的不同有針對(duì)性的生成發(fā)布裝置程序可執(zhí)行文件及配套附屬文件; 客戶端安裝裝置,通過(guò)執(zhí)行發(fā)布裝置的程序可執(zhí)行文件,將發(fā)布包裹完整的展開到單臺(tái)設(shè)備上,包括:通過(guò)文檔存儲(chǔ)裝置所最終保存的數(shù)據(jù)及歸檔后指定格式的文件、文檔間關(guān)系圖的搜索裝置程序可執(zhí)行文件及配套附屬文件、文檔間關(guān)系圖的展現(xiàn)裝置程序可執(zhí)行文件及配套附屬文件。
14.根據(jù)權(quán)利要求13所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,單一文檔的采集裝置進(jìn)一步包括: 格式整理模塊,將文檔整理成指定的格式; 分類信息標(biāo)識(shí)模塊,連接格式整理模塊,將格式文件按要求添加初步的分類信息標(biāo)識(shí); 文件導(dǎo)入模塊,連接分類信息標(biāo)識(shí)模塊,將添加了分類信息標(biāo)識(shí)的格式文件導(dǎo)入到系統(tǒng)中。
15.根據(jù)權(quán)利要求14所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置進(jìn)一步包括: 關(guān)鍵詞維度設(shè)定模塊,對(duì)關(guān)鍵詞的維度進(jìn)行設(shè)定; 關(guān)鍵詞定義模塊,連接關(guān)鍵詞維度設(shè)定模塊,對(duì)關(guān)鍵詞各維度所對(duì)應(yīng)的關(guān)鍵詞進(jìn)行定義; 文檔分類設(shè)定模塊,按照關(guān)鍵詞對(duì)單一文檔進(jìn)行分類設(shè)定; 文檔片段設(shè)定模塊,按照關(guān)鍵詞對(duì)文檔的各文檔片段進(jìn)行分類設(shè)定。
16.根據(jù)權(quán)利要求15所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,單一文檔的標(biāo)識(shí)和關(guān)聯(lián)裝置還包括: 文檔單元設(shè)置模塊,將單一文檔的具有相同關(guān)鍵詞標(biāo)識(shí)的文檔片段組合為若干個(gè)文檔單元; 文檔單元標(biāo)識(shí)模塊,對(duì)文檔單元進(jìn)行若干個(gè)關(guān)鍵詞的系統(tǒng)標(biāo)識(shí); 邏輯關(guān)聯(lián)模塊,定義任意兩個(gè)單一文檔之間可能產(chǎn)生的邏輯關(guān)系列表,通過(guò)已設(shè)定的邏輯關(guān)系種類在系統(tǒng)內(nèi)實(shí)現(xiàn)兩個(gè)單一文檔或者文檔單元之間的邏輯關(guān)系的關(guān)聯(lián)。
17.根據(jù)權(quán)利要求16所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,文檔間關(guān)系圖建立裝置進(jìn)一步包括: 關(guān)鍵詞命名模塊,對(duì)任一具體的文檔間關(guān)系圖通過(guò)特定的一組關(guān)鍵詞進(jìn)行命名; 文檔間關(guān)系圖生成模塊,生成文檔間關(guān)系圖,包括文檔間關(guān)系圖中按文檔單元間的特定邏輯關(guān)系排列的一系列文檔單元的展現(xiàn)、文檔單元之間的邏輯關(guān)系的圖形標(biāo)識(shí)、單一文檔單元的展現(xiàn)。
18.根據(jù)權(quán)利要求17所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,文檔間關(guān)系圖的搜索裝置進(jìn)一步包括: 索引建立模塊,建立一套具有自動(dòng)維護(hù)功能的文檔間關(guān)系圖索引; 關(guān)鍵詞檢索模塊,根據(jù)用戶輸入的查詢?cè)~語(yǔ)對(duì)文檔間關(guān)系圖名稱進(jìn)行全文檢索。
19.根據(jù)權(quán)利要求18所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,文檔間關(guān)系圖的展現(xiàn)裝置進(jìn)一步包括: 文檔間關(guān)系圖展現(xiàn)模塊,根據(jù)用戶的搜索結(jié)果展現(xiàn)指定的文檔間關(guān)系圖; 文檔單元展現(xiàn)模塊,根據(jù)用戶的搜索結(jié)果展現(xiàn)指定的文檔間關(guān)系圖中的某個(gè)文檔單元的展現(xiàn); 單一文檔展現(xiàn)模塊,根據(jù)用戶的搜索結(jié)果展現(xiàn)指定的文檔間關(guān)系圖中的某個(gè)文檔單元對(duì)應(yīng)的單一文檔全文的展現(xiàn)。
20.根據(jù)權(quán)利要求13所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,系統(tǒng)還包括文檔釋讀采集子系統(tǒng),其中包括: 文檔釋讀采集裝置,采集用戶對(duì)文檔的解釋內(nèi)容相關(guān)的輸入數(shù)據(jù); 數(shù)據(jù)采集審核裝置,對(duì)采集到的輸入數(shù)據(jù)進(jìn)行審核; 文檔釋讀存儲(chǔ)裝置,將通過(guò)審核的文檔解釋內(nèi)容相關(guān)的輸入數(shù)據(jù)鏈接到相應(yīng)的文檔或文檔間關(guān)系圖中進(jìn)行存儲(chǔ)。
21.根據(jù)權(quán)利要求13所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,文檔間的邏輯關(guān)系包括但不限于派生關(guān)系、平行關(guān)系、或關(guān)系、與關(guān)系、包含關(guān)系、修訂關(guān)系、覆蓋關(guān)系、否定關(guān)系的邏輯關(guān)系,其中每一種文檔間的邏輯關(guān)系對(duì)應(yīng)系統(tǒng)中唯一的圖標(biāo)。
22.根據(jù)權(quán)利要求13所述的文檔的采集、標(biāo)識(shí)、關(guān)聯(lián)、搜索及展現(xiàn)的系統(tǒng),其特征在于,文檔包括但不限于論文、教材、歷史文獻(xiàn)、法律法規(guī)、培訓(xùn)課件、新聞和公告,包括但不限于文字、音頻、視頻、網(wǎng)頁(yè)的 多媒體介質(zhì)。
【文檔編號(hào)】G06F17/30GK103914488SQ201310006266
【公開日】2014年7月9日 申請(qǐng)日期:2013年1月8日 優(yōu)先權(quán)日:2013年1月8日
【發(fā)明者】鄧寅生 申請(qǐng)人:鄧寅生