本發(fā)明涉及云信息管理及處理領(lǐng)域,具體涉及一種基于內(nèi)容的云文檔管理方法、系統(tǒng)及服務(wù)端。
背景技術(shù):
在現(xiàn)代化辦公的過程當(dāng)中,由于需要企業(yè)內(nèi)部員工共享一些文檔,因而能夠存儲文檔的服務(wù)端被各企業(yè)廣泛的運用。將需要共享的文檔上傳至服務(wù)端后,企業(yè)內(nèi)部的員工就能自主的進(jìn)行下載或其它操作。
然而,當(dāng)企業(yè)內(nèi)部的員工數(shù)量太多并且需要共享的電子文檔也過多時,若所有員工都對存儲文檔的服務(wù)端進(jìn)行訪問及文檔操作,則會造成該服務(wù)端的文檔存放無序,管理混亂,導(dǎo)致員工無法從該服務(wù)端中快速的找到有效的信息。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例提供了一種基于內(nèi)容的云文檔管理方法、服務(wù)端及系統(tǒng),旨在提高用戶使用云文檔時查找有效信息的效率及安全性,幫助用戶在眾多云文檔中快速找到需要的信息。
本發(fā)明實施例的第一方面,提供一種基于內(nèi)容的云文檔管理方法,所述方法包括:
服務(wù)端接收客戶端發(fā)送的身份認(rèn)證信息及請求數(shù)據(jù)包;
所述服務(wù)端驗證所述身份認(rèn)證信息,并解析所述請求數(shù)據(jù)包;
若所述身份認(rèn)證信息通過驗證并且所述請求數(shù)據(jù)包包括歸類請求信息及待歸類文檔,則依據(jù)所述待歸類文檔的內(nèi)容,將所述待歸類文檔歸類至所述服務(wù)端的托管目錄的對應(yīng)子目錄中,所述托管目錄為受所述服務(wù)端保護(hù)的目錄,所述服務(wù)端中所有的文檔均存放于所述托管目錄下;
若所述身份認(rèn)證信息通過驗證并且所述請求數(shù)據(jù)包包括定位請求信息,則在所述托管目錄中檢索符合所述定位請求信息中攜帶的定位條件的文檔,生成定位中間結(jié)果,將所述定位中間結(jié)果發(fā)送至所述客戶端;
若所述身份認(rèn)證信息無法通過驗證,則終止與所述客戶端的會話。
本發(fā)明實施例的第二方面,提供一種基于內(nèi)容的云文檔管理系統(tǒng),所述基于內(nèi)容的云文檔管理系統(tǒng)包括:
客戶端以及服務(wù)端;
所述服務(wù)端接收所述客戶端發(fā)送的身份認(rèn)證信息及請求數(shù)據(jù)包;
所述服務(wù)端驗證所述身份認(rèn)證信息,并解析所述請求數(shù)據(jù)包;
若所述身份認(rèn)證信息通過驗證并且所述請求數(shù)據(jù)包包括歸類請求信息及待歸類文檔,則依據(jù)所述待歸類文檔的內(nèi)容,將所述待歸類文檔歸類至所述服務(wù)端的托管目錄的對應(yīng)子目錄中,所述托管目錄為受所述服務(wù)端保護(hù)的目錄,所述服務(wù)端中所有的文檔均存放于所述托管目錄下;
若所述身份認(rèn)證信息通過驗證并且所述請求數(shù)據(jù)包包括定位請求信息,則在所述托管目錄中檢索符合所述定位請求信息中攜帶的定位條件的文檔,生成定位中間結(jié)果,將所述定位中間結(jié)果發(fā)送至所述客戶端;
若所述身份認(rèn)證信息通過驗證并且所述請求數(shù)據(jù)包包括分析請求信息,則在所述托管目錄中檢索符合所述分析請求信息中攜帶的分析條件的一個子目錄作為分析目錄,并對所述分析目錄下的所有文檔進(jìn)行關(guān)鍵信息的分析與挖掘,生成與所述分析目錄相關(guān)的關(guān)鍵信息報告,將所述關(guān)鍵信息報告發(fā)送至客戶端;
若所述身份認(rèn)證信息無法通過驗證,則終止所述服務(wù)端與所述客戶端的會話。
本發(fā)明實施例的第三方面,提供一種基于內(nèi)容的云文檔管理服務(wù)器,所述基于內(nèi)容的云文檔管理服務(wù)器包括:
請求接收模塊,用于接收客戶端發(fā)送的身份認(rèn)證信息及請求數(shù)據(jù)包;
驗證解析模塊,用于驗證所述請求接收模塊接收的身份認(rèn)證信息,并解析所述請求接收模塊接收的請求數(shù)據(jù)包;
歸類處理模塊,用于當(dāng)所述驗證解析模塊確定身份認(rèn)證信息通過驗證并且所述請求數(shù)據(jù)包包括歸類請求信息及待歸類文檔時,依據(jù)所述待歸類文檔的內(nèi)容,將所述待歸類文檔歸類至所述服務(wù)端的托管目錄的對應(yīng)子目錄中,所述托管目錄為受所述服務(wù)端保護(hù)的目錄,所述服務(wù)端中所有的文檔均存放于所述托管目錄下;
定位處理模塊,用于當(dāng)所述驗證解析模塊確定身份認(rèn)證信息通過驗證并且所述請求數(shù)據(jù)包包括定位請求信息時,在所述托管目錄中檢索符合所述定位請求信息中攜帶的定位條件的文檔,生成定位中間結(jié)果,將所述定位中間結(jié)果發(fā)送至所述客戶端;
分析處理模塊,用于當(dāng)所述驗證解析模塊確定身份認(rèn)證信息通過驗證并且所述請求數(shù)據(jù)包包括分析請求信息時,在所述托管目錄中檢索符合所述分析請求信息中攜帶的分析條件的一個子目錄作為分析目錄,并對所述分析目錄下的所有文檔進(jìn)行關(guān)鍵信息的分析與挖掘,生成與所述分析目錄相關(guān)的關(guān)鍵信息報告,將所述關(guān)鍵信息報告發(fā)送至客戶端;
終止會話模塊,用于當(dāng)所述驗證解析模塊確定身份認(rèn)證信息無法通過驗證時,終止與所述客戶端的會話。
由上可見,本發(fā)明實施例中,首先由服務(wù)端接收客戶端發(fā)送的身份認(rèn)證信息及請求數(shù)據(jù)包,然后由所述服務(wù)端驗證所述身份認(rèn)證信息,并解析所述請求數(shù)據(jù)包,當(dāng)所述身份認(rèn)證信息通過驗證并且所述請求數(shù)據(jù)包包括歸類請求信息及待歸類文檔時,則依據(jù)所述待歸類文檔的內(nèi)容,將所述待歸類文檔歸類至所述服務(wù)端的托管目錄的對應(yīng)子目錄中,當(dāng)所述身份認(rèn)證信息通過驗證并且所述請求數(shù)據(jù)包包括定位請求信息時,則在所述托管目錄中檢索符合所述定位請求信息中攜帶的定位條件的文檔,生成定位中間結(jié)果,并將所述定位中間結(jié)果發(fā)送至所述客戶端,當(dāng)所述身份認(rèn)證信息無法通過驗證時,則終止與所述客戶端的會話。本發(fā)明實施例在用戶將文檔上傳至服務(wù)端時,將該文檔歸類至服務(wù)端的相應(yīng)目錄下,使得所有文檔是有序地存放在服務(wù)端的,這樣在用戶通過服務(wù)端請求定位所需要的文檔時,能夠更快地找到所需要的文檔,也即提高了用戶使用云文檔時查找有效信息的效率及安全性。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實施例提供的基于內(nèi)容的云文檔管理方法的實現(xiàn)流程圖;
圖2為本發(fā)明實施例提供的基于內(nèi)容的云文檔管理系統(tǒng)的結(jié)構(gòu)框圖;
圖3為本發(fā)明實施例提供的基于內(nèi)容的云文檔管理服務(wù)端的結(jié)構(gòu)框圖。
具體實施方式
為使得本發(fā)明的發(fā)明目的、特征、優(yōu)點能夠更加的明顯和易懂,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而非全部實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
以下結(jié)合具體實施例對本發(fā)明的實現(xiàn)進(jìn)行詳細(xì)描述:
實施例一
圖1示出了本發(fā)明實施例一提供的基于內(nèi)容的云文檔管理方法的實現(xiàn)流程圖,首先說明的是,本發(fā)明實施例中提及的云文檔是指存儲于服務(wù)端的文檔。具體的,如圖1所示,本發(fā)明實施例中的基于內(nèi)容的云文檔管理方法包括:
步驟s101,服務(wù)端接收客戶端發(fā)送的身份認(rèn)證信息及請求數(shù)據(jù)包。
在步驟s101中,服務(wù)端接收客戶端通過網(wǎng)絡(luò)傳輸協(xié)議(例如安全套接字層長文本傳輸協(xié)議〔https,hypertexttransferprotocaloversecuresocketlayer〕)發(fā)送的身份認(rèn)證信息及請求數(shù)據(jù)包。具體地,可以在服務(wù)端中設(shè)置一個后臺守護(hù)進(jìn)程,該后臺守護(hù)進(jìn)程可以對網(wǎng)絡(luò)傳輸協(xié)議中的可擴展標(biāo)記語言遠(yuǎn)程過程調(diào)用(即xml-rpc,英文全稱為:extensiblemarkuplanguageremoteprocedurecall)、web-service相關(guān)端口和統(tǒng)一資源標(biāo)識符(uri,uniformresourceidentifier)進(jìn)行網(wǎng)絡(luò)監(jiān)聽,自動接收上述客戶端通過網(wǎng)絡(luò)傳輸協(xié)議發(fā)送的身份認(rèn)證信息及請求數(shù)據(jù)包。其中,https提供了加密通訊的方法,對于一般企業(yè)來說,可以采用商用級公開密鑰基礎(chǔ)設(shè)施(pki,publikkeyinfrastructures)和3des(tripledes,tripledataencryption)作為加密算法的一種選擇。在此基礎(chǔ)上,對于保密級別高的企業(yè),還可以引入保密的最新研究的強加密算法模塊,未來還可以使用量子密鑰協(xié)商算法作為上述強加密算法模塊中的密鑰協(xié)商算法,以此保證客戶端與服務(wù)端傳輸信道上不會發(fā)生竊聽、篡改等信息安全問題,實現(xiàn)服務(wù)端文檔的高強度加密,保證文檔的加密傳輸。
步驟s102,上述服務(wù)端驗證上述身份認(rèn)證信息,并解析上述請求數(shù)據(jù)包。
在步驟s102中,上述服務(wù)端在接收了客戶端發(fā)送過來的身份認(rèn)證信息及請求數(shù)據(jù)包之后,對上述身份認(rèn)證信息進(jìn)行驗證,并對上述請求數(shù)據(jù)包進(jìn)行解析。其中,對身份認(rèn)證信息的驗證是通過安全套接層/傳輸層安全(ssl/tls,securesocketlayer/transportlayersecurity)進(jìn)行的,它提供了數(shù)據(jù)加密、消息完整性等功能??蛇x地,上述步驟s101中在服務(wù)端設(shè)置的后臺用戶進(jìn)程可以自動驗證上述身份認(rèn)證信息,并解析上述請求數(shù)據(jù)包。其中,根據(jù)用戶的不同需求,上述請求數(shù)據(jù)包可以包括歸類請求信息,以便通過該歸類請求信息請求文檔歸類;或者,上述請求數(shù)據(jù)包可以包括定位請求信息,以便通過該定位請求信請求文檔定位;或者,上述請求數(shù)據(jù)包還可以包括分析請求信息,以便通過該分析請求信息請求文檔分析,此處不做限定。
步驟s103,若上述身份認(rèn)證信息通過驗證并且上述請求數(shù)據(jù)包包括歸類請求信息及待歸類文檔,則依據(jù)上述待歸類文檔的內(nèi)容,將上述待歸類文檔歸類至上述服務(wù)端的托管目錄的對應(yīng)子目錄中。
在步驟s103中,當(dāng)用戶通過客戶端圖形用戶界面將待歸類文檔及歸類請求信息發(fā)送至服務(wù)端后,服務(wù)端可以在身份認(rèn)證信息驗證通過的前提下對用戶的請求作出處理??蛇x地,上述服務(wù)端可以獲取上述待歸類文檔的歸類關(guān)鍵詞,并根據(jù)歸類關(guān)鍵詞及預(yù)設(shè)的歸類相似度計算方案,確定托管目錄中的一個目錄為歸類目錄,并將上述待歸類文檔歸類至上述歸類目錄中。其中,上述托管目錄為受上述服務(wù)端保護(hù)的目錄,上述服務(wù)端中所有的文檔均存放于上述托管目錄下。本步驟使得具有相似內(nèi)容,表達(dá)相似主題的文檔在上傳至托管目錄后,可以存放于托管目錄的同一個子目錄下,達(dá)到各文檔有序存放于服務(wù)端的托管目錄中的效果。
步驟s104,若上述身份認(rèn)證信息通過驗證并且上述請求數(shù)據(jù)包包括定位請求信息,則在上述托管目錄中檢索符合上述定位請求信息中攜帶的定位條件的文檔,生成定位中間結(jié)果,將上述定位中間結(jié)果發(fā)送至上述客戶端。
在步驟s104中,當(dāng)用戶通過客戶端圖形用戶界面將定位請求信息發(fā)送至服務(wù)端后,服務(wù)端可以在身份認(rèn)證信息驗證通過的前提下根據(jù)上述定位請求信息攜帶的定位條件為用戶檢索匹配的文檔??蛇x地,上述定位請求信息攜帶的定位條件可以為定位關(guān)鍵詞,則上述服務(wù)端可以根據(jù)上述定位關(guān)鍵詞及預(yù)設(shè)的定位相似度計算方案,確定符合上述定位條件的文檔,并將這些符合上述定位條件的文檔作為定位中間結(jié)果,通過網(wǎng)絡(luò)傳輸協(xié)議發(fā)送給客戶端,供用戶查閱。以此使得用戶利用客戶端圖形用戶界面與服務(wù)端進(jìn)行交互,獲取用戶需要的信息。
可選地,為了進(jìn)一步提高云文檔的安全性,使用戶只能查閱其權(quán)限內(nèi)的云文檔內(nèi)容,在上述將上述定位中間結(jié)果發(fā)送至上述客戶端之前,上述方法還包括:
上述服務(wù)端從上述客戶端獲取當(dāng)前用戶安全級別;
比較當(dāng)前用戶安全級別與上述定位中間結(jié)果的安全級別;
上述將上述定位中間結(jié)果發(fā)送至上述客戶端,具體為:若上述當(dāng)前用戶安全級別不低于上述定位中間結(jié)果的安全級別,則將上述定位中間結(jié)果發(fā)送至上述客戶端。
其中,用戶在初次使用客戶端進(jìn)行登錄時,客戶端可以默認(rèn)其為最低安全級別?;蛘?,可以是通過預(yù)設(shè)的程序,為各個用戶分配各自的默認(rèn)的安全級別。同時,客戶端的登錄界面也有提升安全級別的選項,供用戶選擇自己需要的安全級別進(jìn)行提升,但該提升安全級別的過程需要通過服務(wù)端的認(rèn)證才能得以確認(rèn)。定位中間結(jié)果可能包含多個文檔,這些文檔的安全級別可能有高有低,對于定位中間結(jié)果的任一個文檔,在發(fā)送給客戶端之前,都需要與當(dāng)前用戶安全級別進(jìn)行比對,只有當(dāng)當(dāng)前用戶安全級別不低于該文檔的安全級別時,才認(rèn)為當(dāng)前用戶有查看該文檔的權(quán)限。
可選地,為了在用戶不具備查閱相應(yīng)文檔的權(quán)限時,及時提示用戶作出反應(yīng),在上述比較獲取的上述當(dāng)前用戶安全級別與上述定位中間結(jié)果的安全級別之后,上述方法還包括:
若上述當(dāng)前用戶安全級別低于上述定位中間結(jié)果的安全級別,則向上述客戶端發(fā)送錯誤權(quán)限指令,用以提示用戶提升當(dāng)前用戶安全等級或者放棄查閱上述定位中間結(jié)果。
其中,如果定位中間結(jié)果中有部分文檔的安全級別高于上述當(dāng)前用戶安全級別,則認(rèn)為此時用戶無查看這部分文檔的權(quán)限,服務(wù)端會向客戶端發(fā)送錯誤權(quán)限指令,用以提示用戶當(dāng)前用戶安全級別過低,用戶可以在如下兩種操作中作出選擇:對當(dāng)前用戶級別作出提升或者用戶放棄查閱這部分安全級別高于當(dāng)前用戶安全級別的文檔。
可選地,為了讓用戶有再次查閱定位中間結(jié)果中權(quán)限較高文檔的機會,在上述向上述客戶端發(fā)送錯誤權(quán)限指令之后,上述方法還包括:
若接收到上述客戶端發(fā)送的提升當(dāng)前用戶安全等級指令,則對上述提升當(dāng)前用戶安全等級指令進(jìn)行驗證;
若驗證通過,則提升上述當(dāng)前用戶安全級別,之后返回執(zhí)行上述比較當(dāng)前用戶安全級別與上述定位中間結(jié)果的安全級別的步驟。
其中,若在服務(wù)端向客戶端發(fā)送錯誤權(quán)限指令之后,用戶選擇了提升當(dāng)前用戶級別,則服務(wù)端會接收客戶端發(fā)送的提升當(dāng)前用戶安全等級指令,并對上述提升當(dāng)前用戶安全等級指令進(jìn)行驗證,以確保該提升操作是正確的,可以執(zhí)行的。若上述提升當(dāng)前用戶安全等級指令通過了驗證,則再次返回步驟“比較當(dāng)前用戶安全級別與上述定位中間結(jié)果的安全級別”,以再次確認(rèn)用戶是否有權(quán)限查看定位中間結(jié)果的各個文檔。
可選地,為了避免用戶在定位中間結(jié)果中不具備相應(yīng)權(quán)限的文檔上浪費過多時間,在上述向上述客戶端發(fā)送錯誤權(quán)限指令之后,上述方法還包括:
若接收到放棄查閱指令,則在定位中間結(jié)果中只保留安全級別不高于當(dāng)前用戶安全級別的文檔,并將上述定位中間結(jié)果發(fā)送至客戶端。
其中,若在服務(wù)端向客戶端發(fā)送錯誤權(quán)限指令之后,用戶選擇了發(fā)起查閱這部分安全級別高于當(dāng)前用戶安全級別的文檔,則上述服務(wù)端會接收上述放棄查閱指令,對定位中間結(jié)果作篩選,將定位中間結(jié)果中安全級別高于當(dāng)前用戶安全級別的文檔剔除掉,只保留安全級別不高于當(dāng)前用戶安全級別的文檔,并將篩選后的定位中間結(jié)果發(fā)送至客戶端,供用戶查閱。
步驟s105,若上述身份認(rèn)證信息通過驗證并且上述請求數(shù)據(jù)包包括分析請求信息,則在上述托管目錄中檢索符合上述分析請求信息中攜帶的分析條件的一個子目錄作為分析目錄,并對上述分析目錄下的所有文檔進(jìn)行關(guān)鍵信息的分析與挖掘,生成與上述分析目錄相關(guān)的關(guān)鍵信息報告,將上述關(guān)鍵信息報告發(fā)送至客戶端。
在步驟s105中,當(dāng)用戶通過客戶端圖形用戶界面將分析請求信息發(fā)送至服務(wù)端后,服務(wù)端可以在身份認(rèn)證信息驗證通過的前提下根據(jù)上述分析請求信息攜帶的分析條件為用戶檢索匹配的文檔。與步驟s104類似的,上述分析請求攜帶的分析條件可以為分析關(guān)鍵詞,其實質(zhì)上與步驟s104中的定位關(guān)鍵詞并無區(qū)別,只是在步驟s105中,被用作查找用戶想要進(jìn)行文檔分析及挖掘的目錄,因此在步驟s105中,稱呼其為分析條件。上述服務(wù)端可以根據(jù)上述分析關(guān)鍵詞及預(yù)設(shè)的定位相似度計算方案,在確定符合上述分析條件的文檔后,將這些符合分析條件的文檔所在的子目錄返回給客戶端,并由用戶在客戶端在這些符合條件的文檔所在的若干個子目錄中做出選擇,指定其中的一個作為分析目錄。上述服務(wù)端可以對上述分析目錄進(jìn)行關(guān)鍵信息的分析與挖掘,將挖掘出的關(guān)鍵信息寫入關(guān)鍵信息報告中,并最終在對各個文檔都分析、挖掘完畢后,將關(guān)鍵信息報告發(fā)送至客戶端中,供用戶查閱??蛇x地,可以將上述關(guān)鍵信息報告保存于上述分析目錄下。當(dāng)用戶數(shù)量(例如企業(yè)內(nèi)部員工)較多,需要共享的文檔也較多時,服務(wù)端的托管目錄中的子目錄數(shù)量也會上升,并且每個子目錄下也會存放有大量文檔。由于子目錄中的文檔數(shù)量過多,而用戶又不可能有時間與精力去仔細(xì)查閱所有的文檔,因而通過本步驟,可以使得用戶在不一一查閱子目錄中的所有文檔的情況下,通過閱讀關(guān)鍵信息報告對目錄中的所有文檔的大致情況有所了解,獲取子目錄中各個文檔的隱含的知識和商業(yè)情報,提升用戶獲知有效信息的效率??蛇x地,由于關(guān)鍵信息報告涉及到了子目錄下的所有文檔信息,因而在將關(guān)鍵信息報告發(fā)送至客戶端之前,可以以檢驗當(dāng)前用戶安全級別的方式確定當(dāng)前用戶是否有查看該關(guān)鍵信息報告的權(quán)限,其具體實現(xiàn)流程可以參照步驟s104,在此不作贅述。
具體地,上述對上述分析目錄下的所有文檔進(jìn)行關(guān)鍵信息的分析與發(fā)掘,生成與上述分析目錄相關(guān)的關(guān)鍵信息報告,包括:
提取上述分析目錄下所有文檔的關(guān)鍵信息,上述關(guān)鍵信息包括如下一種以上:命名實體,金額,數(shù)量短語及關(guān)鍵短語,其中,上述命名實體又包括如下一種以上:組織機構(gòu)名稱,人名,時間及地名;
在各個關(guān)鍵信息的對應(yīng)文檔中,摘錄出上述關(guān)鍵信息的上下文,生成與上述分析目錄相關(guān)的關(guān)鍵信息報告。
其中,由于本方法主要面向的用戶是企業(yè)的內(nèi)部員工,對于企業(yè)及其內(nèi)部員工來說,商業(yè)類的信息是最值得關(guān)注的,因而在提取分析目錄下所有文檔的關(guān)鍵信息時,上述關(guān)鍵信息包括但不限于如下一種以上:命名實體,金額,數(shù)量短語及關(guān)鍵短語,上述命名實體又包括但不限于如下一種以上:組織機構(gòu)名稱,人名,時間及地名。對于組織機構(gòu)名稱,人名,時間,地名,金額及數(shù)量短語來說,由于其具備一定的規(guī)則性,較為容易被服務(wù)端所識別,可以直接從文檔中提取出這些關(guān)鍵信息。但對于關(guān)鍵短語來說,其并沒有內(nèi)容上的限制,可以是任何內(nèi)容、任何格式,因而服務(wù)端可以分別對分析目錄中的各個文檔進(jìn)行統(tǒng)計句法的分析及計算,利用統(tǒng)計知識提取出各個文檔的關(guān)鍵短語。
而僅僅得出這些關(guān)鍵信息還是不夠的,因為其僅僅是一些零散的,沒有意義的詞、句而已。為了使得提取出的關(guān)鍵信息有實際意義,還可以根據(jù)各個關(guān)鍵信息,返回到對應(yīng)的文檔中,摘取關(guān)鍵信息在對應(yīng)文檔的上下文。有了上文的基礎(chǔ)及下文的解釋,這些關(guān)鍵信息才能夠被用戶所理解,才能顯示出它們的意義。在摘錄出了各個關(guān)鍵信息的上下文,形成能夠理解的內(nèi)容后,生成與上述分析目錄相關(guān)的關(guān)鍵信息報告。
可選地,為了了解目錄中各個文檔的重要程度,幫助用戶快速找到重要文檔,在上述提取上述分析目錄下所有文檔的關(guān)鍵信息之后,上述方法還包括:
依次將上述分析目錄下的各個文檔確定為受評文檔;
根據(jù)上述受評文檔的相關(guān)信息對上述受評文檔進(jìn)行重要度評分,得到評分結(jié)果,其中,上述相關(guān)信息包括如下一種以上:文檔關(guān)鍵信息的頻次,文檔關(guān)鍵信息的支持度,文檔生成時間,文檔修改時間,上述重要度評分包括如下一種以上:技術(shù)復(fù)雜度評分,技術(shù)分布度評分,技術(shù)原創(chuàng)度評分。
其中,用戶不僅希望對分析目錄有一個整體的認(rèn)識,還希望對分析目錄下的各個文檔進(jìn)行重要度評分,以此得到目錄中較為重要的幾個文檔,并對這幾個文檔重點查閱。因而,可以將分析目錄中的各個文檔依次確定為受評文檔,根據(jù)上述受評文檔的相關(guān)信息進(jìn)行文檔的重要度評分。上述相關(guān)信息包括但不限于如下一種以上:文檔關(guān)鍵信息的頻次,文檔關(guān)鍵信息的支持度,文檔歸入托管目錄中的時間。而上述重要度評分也包括如下一種以上:技術(shù)復(fù)雜度,技術(shù)分布度,技術(shù)原創(chuàng)度。
在一種應(yīng)用場景中,上述重要度評分包括:技術(shù)復(fù)雜度,則上述根據(jù)上述受評文檔的相關(guān)信息對上述受評文檔進(jìn)行評分,具體為:
統(tǒng)計出上述受評文檔的關(guān)鍵信息中,關(guān)鍵短語的個數(shù),命名實體的個數(shù)和不同命名實體的種類數(shù),并同時統(tǒng)計出上述受評文檔的字?jǐn)?shù)及和去重字?jǐn)?shù);
對上述統(tǒng)計得到的上述受評文檔的關(guān)鍵短語的個數(shù),命名實體的個數(shù)和不同命名實體的種類數(shù)及上述受評文檔的字?jǐn)?shù)和去重字?jǐn)?shù)進(jìn)行加權(quán)平均計算;
將上述加權(quán)平均計算的結(jié)果作為上述文檔的技術(shù)復(fù)雜度的評分結(jié)果。
其中,在進(jìn)行文檔的技術(shù)復(fù)雜度評分時,主要運用到了關(guān)鍵信息的頻次。上述進(jìn)行加權(quán)平均計算時,各元素的權(quán)重可以由開發(fā)人員預(yù)先設(shè)置,也可以由用戶在進(jìn)行技術(shù)復(fù)雜度評分之前通過客戶端用戶圖形界面對各元素權(quán)重作出修改及調(diào)整。
當(dāng)然,文檔的技術(shù)復(fù)雜度評分還可以使用其他方式獲得,此處不作限制。
在另一種應(yīng)用場景中,上述重要度評分包括:技術(shù)分布度,則上述根據(jù)上述受評文檔的相關(guān)信息對上述受評文檔進(jìn)行評分,具體為:
將上述分析目錄中除上述受評文檔之外的其它各個文檔與上述受評文檔進(jìn)行相似度計算;
將上述其它各個文檔與上述受評文檔進(jìn)行相似度計算得到的值作累加;
將上述累加的結(jié)果作為上述受評文檔的技術(shù)分布度的評分結(jié)果。
其中,由于進(jìn)行相似度計算時,是將上述分析目錄中除上述受評文檔之外的其它各個文檔都與上述受評文檔進(jìn)行相似度計算,而分析目錄中的所有文檔都可以依次被作為受評文檔,因而可以將受評文檔與其他各文檔進(jìn)行相似度計算的值保存下來,可以節(jié)省后續(xù)相似度計算的計算量。例如,分析目錄中有三個文檔a,b,c。當(dāng)a作為受評文檔時,服務(wù)端將計算并保存a與b的相似度及a與c的相似度,并將這兩個相似度計算的值相加,作為a的技術(shù)分布度的評分結(jié)果。當(dāng)b作為受評文檔時,服務(wù)端將計算b與a的相似度及b與c的相似度,由于在對a進(jìn)行技術(shù)分布度評分時,已經(jīng)保存了a與b的相似度的值,因而此時可以不再對b與a的相似度進(jìn)行計算,只計算b與c的相似度,并將b與c的相似度的值進(jìn)行保存。在最后對c進(jìn)行相似度計算時,實際上在對a及b進(jìn)行技術(shù)分布度評分時已經(jīng)計算過a與c的相似度及b與c的相似度,所以此時只需將保存的a與c的相似度及b與c的相似度的值取出后相加,即可得到c的技術(shù)分布度的評分結(jié)果。這樣,可以大大節(jié)約對各個文檔技術(shù)分布度進(jìn)行評分時占用的資源,減少相似度計算的計算量。
當(dāng)然,文檔的技術(shù)分布度評分還可以使用其他方式獲得,此處不作限制。
在另一種應(yīng)用場景中,上述重要度評分包括:技術(shù)原創(chuàng)度,則上述根據(jù)上述受評文檔的相關(guān)信息對上述受評文檔進(jìn)行評分,具體為:
獲取上述受評文檔的關(guān)鍵短語的支持度及上述受評文檔歸入托管目錄中的時間;
根據(jù)預(yù)設(shè)的技術(shù)原創(chuàng)度評分公式,利用上述受評文檔的關(guān)鍵短語的支持度及受評文檔歸入托管目錄中的時間,計算得到上述受評文檔的技術(shù)原創(chuàng)度的評分結(jié)果。
其中,預(yù)設(shè)的技術(shù)原創(chuàng)度評分公式可以為:
上述公式中,s.t.為約束條件,ti為該受評文檔的第i個關(guān)鍵短語,sup(ti)為第i個關(guān)鍵短語ti的支持度,age-in-days(ti)為關(guān)鍵短語出現(xiàn)的時間,以天為單位計數(shù),即受評文檔歸入托管目錄中時間,o(ti)為關(guān)鍵短語ti的技術(shù)原創(chuàng)度,o1為將受評文檔中所有的關(guān)鍵短語的技術(shù)原創(chuàng)度相加后,得到的受評文檔的技術(shù)原創(chuàng)度。
可選地,在上述公式的的基礎(chǔ)上,還有另一種計算技術(shù)原創(chuàng)度的方法,其公式為:
o2=|s|
s.t.s={t|o(t)>0}
其中,{t|o(t)>0},表示在上述第一個公式中的o(ti)的值大于0的那些關(guān)鍵短語,這些關(guān)鍵短語組成了集合s,o2取了集合s的絕對值,表示取這個集合s中包含元素的數(shù)量后,得到的受評文檔的技術(shù)原創(chuàng)度。
當(dāng)然,也可以選用其他得分公式用以計算文檔的原創(chuàng)度評分,此處不作限制。
上述提及的三種應(yīng)用場景,可以獨立出現(xiàn),也可以根據(jù)用戶的需求組合出現(xiàn),此處不作限制。
可選地,為了對托管目錄進(jìn)行優(yōu)化,使其下的類別更為準(zhǔn)確,在上述提取上述分析目錄下所有文檔的關(guān)鍵信息之后,上述方法還包括:
對上述分析目錄下的相關(guān)文檔進(jìn)行聚類操作。
其中,可以是使用k均值(k-means)算法進(jìn)行聚類操作,以此種方法提供詞語支持的相似性聚集類別;或者,可以是使用關(guān)鍵信息支持度進(jìn)行聚類操作,以此種方法提供關(guān)鍵信息支持的相似性聚集類別。當(dāng)然,也可以使用跟其他聚類算法進(jìn)行聚類操作,此處不作限制。
步驟s106,若上述身份認(rèn)證信息無法通過驗證,則終止與上述客戶端的會話。
在步驟s106中,如果上述服務(wù)端接收到的客戶端發(fā)送過來的身份認(rèn)證信息無法通過驗證,則說明與該客戶端進(jìn)行通信存在危險,因此服務(wù)端可以及時終止與上述客戶端的會話,防止信息泄露。
可選地,為了進(jìn)一步防止重要文檔的泄露,在上述步驟s104或步驟s105之后,上述基于內(nèi)容的云文檔管理方法還包括:
上述客戶端利用預(yù)先定制的閱讀工具打開服務(wù)端發(fā)送的定位中間結(jié)果或關(guān)鍵信息報告。
其中,為了避免因用戶的客戶端被惡意木馬感染而導(dǎo)致泄露企業(yè)機密信息,可以在客戶端定制閱讀工具,以定制的閱讀工具打開服務(wù)端發(fā)送過來的文件??梢允窃趙ps的基礎(chǔ)上進(jìn)行定制,也可以在開源office軟件的基礎(chǔ)上進(jìn)行定制,用以閱讀office類別的電子文檔。當(dāng)在國產(chǎn)的操作平臺上作客戶端閱讀工具的定制時,可以有效過濾境外商業(yè)軟件可能的惡意漏洞和風(fēng)險。
可選地,為了使服務(wù)端掌握用戶對文檔進(jìn)行安全分級的基本標(biāo)準(zhǔn),上述基于內(nèi)容的云文檔管理方法還包括:
上述服務(wù)端定期對托管目錄中的電子文檔進(jìn)行安全分級訓(xùn)練,生成安全分級知識庫。
其中,服務(wù)端可以定期的對托管目錄中已經(jīng)標(biāo)注有安全級別的文檔進(jìn)行安全分級訓(xùn)練,具體為,針對每一個已有安全級別的文檔,提取出該文檔的關(guān)鍵詞,安全級別,權(quán)重信息,本次安全訓(xùn)練的時間,生成安全分級知識庫,并將提取出的這些信息記錄在托管目錄的數(shù)據(jù)庫的訓(xùn)練安全分級詞集信息表中。
可選地,為了完善服務(wù)端自動生成的安全分級知識庫,上述基于內(nèi)容的云文檔管理方法還包括:
上述服務(wù)端接收用戶經(jīng)驗分級詞庫,根據(jù)接收的用戶經(jīng)驗分級詞庫更新安全分級知識庫。
其中,為了完善安全分級知識庫,還可以由特權(quán)用戶直接在服務(wù)端錄入或?qū)胗脩艚?jīng)驗分級詞庫,將用戶經(jīng)驗分級詞庫存儲于數(shù)據(jù)庫的用戶特殊重要信息表中,同時安全分級知識庫也可以根據(jù)用戶經(jīng)驗分級詞庫進(jìn)行補充與完善。
可選地,為了達(dá)到對文檔自動標(biāo)注安全級別的效果,在上述生成安全分級知識庫之后,上述基于內(nèi)容的云文檔管理方法還包括:
采用機器學(xué)習(xí)算法,根據(jù)安全分級知識庫,生成安全分級分類器,用以在服務(wù)端接收到待歸類文檔時,自動對待歸類文檔進(jìn)行安全級別標(biāo)注。
其中,上述機器學(xué)習(xí)算法涉及到信息檢索、統(tǒng)計學(xué)指標(biāo)、中文信息處理領(lǐng)域的原理、概念機模型,包括但不限于如下一種以上:詞袋模型(bow,bagofwords),磁鏈模型(bol,bagoflink),詞頻與逆向詞頻模型(tf-idf,term-frequencyandinverseterm-frequency),互信息模型(mi,matualinformation),位置權(quán)重(location-weight)。所生成的安全分級分類器可以被服務(wù)器用于在對待歸類電子文檔進(jìn)行歸類時,為沒有標(biāo)注安全級別的待歸類電子文檔進(jìn)行安全級別的標(biāo)注。
由上可見,在本發(fā)明實施例中,首先由服務(wù)端接收客戶端發(fā)送的身份認(rèn)證信息及請求數(shù)據(jù)包,然后由上述服務(wù)端驗證上述身份認(rèn)證信息,并解析上述請求數(shù)據(jù)包,當(dāng)上述身份認(rèn)證信息通過驗證并且上述請求數(shù)據(jù)包包括歸類請求信息及待歸類文檔時,則依據(jù)上述待歸類文檔的內(nèi)容,將上述待歸類文檔歸類至上述服務(wù)端的托管目錄的對應(yīng)子目錄中,當(dāng)上述身份認(rèn)證信息通過驗證并且上述請求數(shù)據(jù)包包括定位請求信息時,則在上述托管目錄中檢索符合上述定位請求信息中攜帶的定位條件的文檔,生成定位中間結(jié)果,并將上述定位中間結(jié)果發(fā)送至上述客戶端,當(dāng)上述身份認(rèn)證信息無法通過驗證時,則終止與上述客戶端的會話。本發(fā)明實施例可以由服務(wù)端接收客戶端發(fā)送的請求數(shù)據(jù)指令,根據(jù)請求數(shù)據(jù)指令的類別,作出相應(yīng)的歸類、定位或者分析操作,幫助企業(yè)實現(xiàn)云文檔的統(tǒng)一管理,并提高用戶獲取云文檔中有效信息的效率及安全性。
實施例二
圖2示出了本發(fā)明實施例二提供的基于內(nèi)容的云文檔管理系統(tǒng)的組成結(jié)構(gòu),為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。
如圖2所示,上述基于內(nèi)容的云文檔管理系統(tǒng)包括客戶端1,以及服務(wù)端2。
其中,上述客戶端包括但不限于手機,平板電腦或者計算機。用戶可以通過上述客戶端達(dá)到訪問服務(wù)端存儲的文檔的目的。上述基于內(nèi)容的云文檔管理系統(tǒng)可以采用客戶機/服務(wù)器架構(gòu)(c/sstructs,clientserverstructs)、瀏覽器/服務(wù)器架構(gòu)(b/sstructs,browserserverstructs)或者基于上述兩種架構(gòu)進(jìn)行了改進(jìn)的其他架構(gòu),此處不作限定。
上述服務(wù)端2接收上述客戶端1發(fā)送的身份認(rèn)證信息及請求數(shù)據(jù)包。
其中,服務(wù)端接收客戶端通過網(wǎng)絡(luò)傳輸協(xié)議發(fā)送的身份認(rèn)證信息及請求數(shù)據(jù)包。可以在服務(wù)端中設(shè)置一個后臺守護(hù)進(jìn)程進(jìn)行網(wǎng)絡(luò)監(jiān)聽,自動接收上述客戶端1通過網(wǎng)絡(luò)傳輸協(xié)議發(fā)送的身份認(rèn)證信息及請求數(shù)據(jù)包。
上述服務(wù)端2驗證上述身份認(rèn)證信息,并解析上述請求數(shù)據(jù)包。
其中,上述服務(wù)端2在接收了用戶經(jīng)由客戶端1發(fā)送過來的身份認(rèn)證信息及請求數(shù)據(jù)包之后,對上述身份認(rèn)證信息進(jìn)行驗證,并對上述請求數(shù)據(jù)包進(jìn)行解析。其中,根據(jù)用戶的不同需求,上述請求數(shù)據(jù)包可以包括歸類請求信息,以便通過該歸類請求信息請求文檔歸類;或者,上述請求數(shù)據(jù)包可以包括定位請求信息,以便通過該定位請求信請求文檔定位;或者,上述請求數(shù)據(jù)包還可以包括分析請求信息,以便通過該分析請求信息請求文檔分析,此處不做限定。
若上述身份認(rèn)證信息通過驗證并且上述請求數(shù)據(jù)包包括歸類請求信息及待歸類文檔,則依據(jù)上述待歸類文檔的內(nèi)容,將上述待歸類文檔歸類至上述服務(wù)端2的托管目錄的對應(yīng)子目錄中。
其中,當(dāng)用戶通過客戶端將待歸類文檔及歸類請求信息發(fā)送至服務(wù)端后,服務(wù)端將在身份認(rèn)證信息驗證通過的前提下對用戶的請求作出處理。上述服務(wù)端可以獲取上述待歸類文檔的歸類關(guān)鍵詞,并根據(jù)歸類關(guān)鍵詞及預(yù)設(shè)的歸類相似度計算方案,確定托管目錄中的一個目錄為歸類目錄,并將上述待歸類文檔歸類至上述歸類目錄中。上述托管目錄為受上述服務(wù)端保護(hù)的目錄,上述服務(wù)端中所有的文檔均存放于上述托管目錄下。
若上述身份認(rèn)證信息通過驗證并且上述請求數(shù)據(jù)包包括定位請求信息,則在上述托管目錄中檢索符合上述定位請求信息中攜帶的定位條件的文檔,生成定位中間結(jié)果,將上述定位中間結(jié)果發(fā)送至上述客戶端1。
其中,當(dāng)用戶通過客戶端將定位請求信息發(fā)送至服務(wù)端后,服務(wù)端將在身份認(rèn)證信息驗證通過的前提下根據(jù)上述定位請求信息攜帶的定位條件為用戶檢索匹配的文檔。作為本發(fā)明的一個實施示例,上述定位請求信息攜帶的定位條件可以為定位關(guān)鍵詞,則上述服務(wù)端將根據(jù)上述定位關(guān)鍵詞及預(yù)設(shè)的定位相似度計算方案,確定符合上述定位條件的文檔,并將這些符合上述定位條件的文檔作為定位中間結(jié)果,通過網(wǎng)絡(luò)傳輸協(xié)議發(fā)送給客戶端,供用戶查閱。以此使得用戶利用客戶端圖形用戶界面與服務(wù)端進(jìn)行交互,獲取用戶需要的信息。
若上述身份認(rèn)證信息通過驗證并且上述請求數(shù)據(jù)包包括分析請求信息,則在上述托管目錄中檢索符合上述分析請求信息中攜帶的分析條件的一個子目錄作為分析目錄,并對上述分析目錄下的所有文檔進(jìn)行關(guān)鍵信息的分析與挖掘,生成與上述分析目錄相關(guān)的關(guān)鍵信息報告,將上述關(guān)鍵信息報告發(fā)送至客戶端1。
其中,當(dāng)用戶通過客戶端將分析請求信息發(fā)送至服務(wù)端后,服務(wù)端將在身份認(rèn)證信息驗證通過的前提下根據(jù)上述分析請求信息攜帶的分析條件為用戶檢索匹配的文檔,并將與分析條件匹配的一個文檔所在的目錄確定為分析目錄。上述服務(wù)端則將對上述分析目錄進(jìn)行關(guān)鍵信息的分析與挖掘,將挖掘出的關(guān)鍵信息寫入關(guān)鍵信息報告中,并最終在對各個文檔都分析、挖掘完畢后,將關(guān)鍵信息報告發(fā)送至客戶端中,供用戶查閱。
若上述身份認(rèn)證信息無法通過驗證,則終止上述服務(wù)端2與上述客戶端1的會話。
其中,如果上述服務(wù)端接收到的客戶端發(fā)送過來的身份認(rèn)證信息無法通過驗證,則說明服務(wù)端與該客戶端進(jìn)行通信存在危險,因此服務(wù)端將及時終止與上述客戶端的會話,防止服務(wù)端存有的重要信息泄露。
應(yīng)理解,本發(fā)明實施例中的基于內(nèi)容的云文檔管理系統(tǒng)可以用于實現(xiàn)上述方法實施例中的全部技術(shù)方案,其各個功能模塊的功能可以根據(jù)上述方法實施例中的方法具體實現(xiàn),其具體實現(xiàn)過程可參照上述實施例中的相關(guān)描述,此處不再贅述。
在本實施例中,基于內(nèi)容的云文檔管理系統(tǒng)的服務(wù)端接收客戶端發(fā)送的請求數(shù)據(jù)指令,根據(jù)請求數(shù)據(jù)指令的類別,作出相應(yīng)的歸類、定位或者分析操作,幫助企業(yè)實現(xiàn)云文檔的統(tǒng)一管理,并提高用戶獲取云文檔中有效信息的效率及安全性。
實施例三
圖3示出了本發(fā)明實施例三提供的基于內(nèi)容的云文檔管理服務(wù)端的結(jié)構(gòu)框架,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。
如圖3所示,上述基于內(nèi)容的云文檔管理服務(wù)端3包括:請求接收模塊31,驗證解析模塊32,歸類處理模塊33,定位處理模塊34,分析處理模塊35。
其中,請求接收模塊31,用于接收客戶端發(fā)送的身份認(rèn)證信息及請求數(shù)據(jù)包;
驗證解析模塊32,用于驗證上述請求接收模塊31接收的身份認(rèn)證信息,并解析上述請求接收模塊接收的請求數(shù)據(jù)包;
歸類處理模塊33,用于當(dāng)上述驗證解析模塊32確定身份認(rèn)證信息通過驗證并且上述請求數(shù)據(jù)包包括歸類請求信息及待歸類文檔時,依據(jù)上述待歸類文檔的內(nèi)容,將上述待歸類文檔歸類至上述服務(wù)端的托管目錄的對應(yīng)子目錄中,上述托管目錄為受上述服務(wù)端保護(hù)的目錄,上述服務(wù)端中所有的文檔均存放于上述托管目錄下;
定位處理模塊34,用于當(dāng)上述驗證解析模塊32確定身份認(rèn)證信息通過驗證并且上述請求數(shù)據(jù)包包括定位請求信息時,在上述托管目錄中檢索符合上述定位請求信息中攜帶的定位條件的文檔,生成定位中間結(jié)果,將上述定位中間結(jié)果發(fā)送至上述客戶端;
分析處理模塊35,用于當(dāng)上述驗證解析模塊32確定身份認(rèn)證信息通過驗證并且上述請求數(shù)據(jù)包包括分析請求信息時,在上述托管目錄中檢索符合上述分析請求信息中攜帶的分析條件的一個子目錄作為分析目錄,并對上述分析目錄下的所有文檔進(jìn)行關(guān)鍵信息的分析與挖掘,生成與上述分析目錄相關(guān)的關(guān)鍵信息報告,將上述關(guān)鍵信息報告發(fā)送至客戶端;
終止會話模塊36,用于當(dāng)上述驗證解析模塊32確定身份認(rèn)證信息無法通過驗證時,終止與上述客戶端的會話。
可選地,上述基于內(nèi)容的云文檔管理服務(wù)端3還包括:
用戶安全級別獲取模塊,用于當(dāng)上述請求接收模塊31接收的身份認(rèn)證信息通過驗證并且請求數(shù)據(jù)包包括定位請求信息時,從上述客戶端獲取當(dāng)前用戶安全級別;
安全級別驗證模塊,用于比較上述用戶級別獲取模塊獲取到的當(dāng)前用戶安全級別與上述定位中間結(jié)果的安全級別;
具體地,上述定位處理模塊用于,若上述當(dāng)前用戶安全級別不低于上述定位中間結(jié)果的安全級別,則將上述定位中間結(jié)果發(fā)送至上述客戶端。
可選地,上述基于內(nèi)容的云文檔管理服務(wù)端3還包括:
錯誤權(quán)限發(fā)送模塊,用于當(dāng)上述安全級別驗證模塊確定當(dāng)前用戶安全級別低于上述定位中間結(jié)果的安全級別時,向上述客戶端發(fā)送錯誤權(quán)限指令,用以提示用戶提升當(dāng)前用戶安全等級或者放棄查閱上述定位中間結(jié)果。
可選地,上述基于內(nèi)容的云文檔管理服務(wù)端3還包括:
提升指令操作模塊,用于當(dāng)接收到上述客戶端發(fā)送的提升當(dāng)前用戶安全等級指令時,對上述提升當(dāng)前用戶安全等級指令進(jìn)行驗證,并在驗證通過后,提升上述當(dāng)前用戶安全級別,并通知安全級別驗證模塊再次進(jìn)行驗證。
可選地,上述分析處理模塊35,還包括:
關(guān)鍵信息獲取子模塊,用于提取上述分析目錄下所有文檔的關(guān)鍵信息,上述關(guān)鍵信息包括如下一種以上:命名實體,金額,數(shù)量短語及關(guān)鍵短語,其中,上述命名實體又包括如下一種以上:組織機構(gòu)名稱,人名,時間及地名;
關(guān)鍵信息報告生成子模塊,用于在各個關(guān)鍵信息的對應(yīng)文檔中,摘錄出上述關(guān)鍵信息的上下文,生成與上述分析目錄相關(guān)的關(guān)鍵信息報告。
可選地,上述分析處理模塊35,還包括:
重要度評分子模塊,用于依次將上述分析目錄下的一個文檔確定為受評文檔;根據(jù)上述受評文檔的相關(guān)信息對上述受評文檔進(jìn)行重要度評分,得到評分結(jié)果,其中,上述相關(guān)信息包括如下一種以上:文檔關(guān)鍵信息的頻次,文檔關(guān)鍵信息的支持度,文檔歸入托管目錄中的時間,上述重要度評分包括如下一種以上:技術(shù)復(fù)雜度評分,技術(shù)分布度評分,技術(shù)原創(chuàng)度評分。
具體地,上述重要度評分子模塊,還包括:
關(guān)鍵信息統(tǒng)計子模塊,用于當(dāng)重要度評分包括技術(shù)復(fù)雜度評分時,統(tǒng)計出上述受評文檔的關(guān)鍵信息中,關(guān)鍵短語的個數(shù),命名實體的個數(shù)和不同命名實體的種類數(shù),并同時統(tǒng)計出上述受評文檔的字?jǐn)?shù)及和去重字?jǐn)?shù);
加權(quán)計算子模塊,用于對上述統(tǒng)計得到的上述受評文檔的關(guān)鍵短語的個數(shù),命名實體的個數(shù)和不同命名實體的種類數(shù)及上述受評文檔的字?jǐn)?shù)和去重字?jǐn)?shù)進(jìn)行加權(quán)平均計算;
技術(shù)復(fù)雜度確定子模塊,用于將上述加權(quán)平均計算的結(jié)果作為上述文檔的技術(shù)復(fù)雜度的評分結(jié)果。
具體地,上述重要度評分子模塊,還包括:
相似度計算子模塊,用于將上述分析目錄中除上述受評文檔之外的其它各個文檔與上述受評文檔進(jìn)行相似度計算;
相似度累加子模塊,用于將上述其它各個文檔與上述受評文檔進(jìn)行相似度計算得到的值作累加;
技術(shù)分布度確定子模塊,用于將上述累加的結(jié)果作為上述受評文檔的技術(shù)分布度的評分結(jié)果。
具體地,上述重要度評分子模塊,還包括:
技術(shù)原創(chuàng)度信息獲取子模塊,用于獲取上述受評文檔的關(guān)鍵短語的支持度及上述受評文檔歸入托管目錄中的時間。
技術(shù)原創(chuàng)度確定子模塊,用于根據(jù)預(yù)設(shè)的技術(shù)原創(chuàng)度評分公式,利用上述受評文檔的關(guān)鍵短語的支持度及受評文檔歸入托管目錄中的時間,計算得到上述受評文檔的技術(shù)原創(chuàng)度的評分結(jié)果。
應(yīng)理解,本發(fā)明實施例中的基于內(nèi)容的云文檔管理服務(wù)端可以用于實現(xiàn)上述方法實施例中以服務(wù)端角度實現(xiàn)的全部技術(shù)方案,其各個功能模塊的功能可以根據(jù)上述方法實施例中的方法具體實現(xiàn),其具體實現(xiàn)過程可參照上述實施例中的相關(guān)描述,此處不再贅述。
由上可見,在本實施例中的基于內(nèi)容的云文檔管理服務(wù)端可以接收客戶端發(fā)送的請求數(shù)據(jù)指令,根據(jù)請求數(shù)據(jù)指令的類別,作出相應(yīng)的歸類、定位或者分析操作,幫助企業(yè)實現(xiàn)云文檔的統(tǒng)一管理,并提高用戶獲取云文檔中有效信息的效率及安全性。
需要說明的是,在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,上述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機械或其它的形式。
對于前述的各方法實施例,為了簡便描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動作順序的限制,因為依據(jù)本發(fā)明,某些步驟可以采用其它順序或者同時進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定都是本發(fā)明所必須的。
在上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部分,可以參見其它實施例的相關(guān)描述。
以上為對本發(fā)明所提供的一種較佳實施例,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明實施例的思想,在具體實施方式及應(yīng)用范圍上均會有改變之處,綜上,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。