基于通用文檔格式提交文檔數(shù)據(jù)挖掘的方法
【專(zhuān)利摘要】本發(fā)明涉及一種基于通用文檔格式提交文檔數(shù)據(jù)挖掘的方法,其方法使用ASP.net和后臺(tái)網(wǎng)絡(luò)服務(wù),對(duì)既有文件系統(tǒng)進(jìn)行文件檢索和全文檢索,得到相關(guān)文件系統(tǒng)所屬的eCTD格式和區(qū)域規(guī)范,再根據(jù)相關(guān)規(guī)范組織數(shù)據(jù)的算法排序并存儲(chǔ)到數(shù)據(jù)庫(kù)中,通過(guò)使用網(wǎng)頁(yè)端訪(fǎng)問(wèn)的模式對(duì)相關(guān)數(shù)據(jù)進(jìn)行檢索和查詢(xún),并提供用戶(hù)查詢(xún)和修改的相關(guān)接口。本發(fā)明通過(guò)使用本方法,可以減少客戶(hù)查找相關(guān)文檔所需要的時(shí)間和精力,同時(shí)檢查待提交文檔是否符合相關(guān)的eCTD規(guī)范,并根據(jù)該地區(qū)規(guī)范給出相關(guān)的警告和提示,以方便用戶(hù)在應(yīng)用軟件中快速的查找相關(guān)文檔和對(duì)文檔中的問(wèn)題進(jìn)行修改。
【專(zhuān)利說(shuō)明】基于通用文檔格式提交文檔數(shù)據(jù)挖掘的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計(jì)算機(jī)【技術(shù)領(lǐng)域】,尤其是一種基于通用文檔格式提交文檔數(shù)據(jù)挖掘的方法。
【背景技術(shù)】
[0002]由于在美國(guó)和歐盟等地區(qū)用于藥品申報(bào)的電子提交使用大量的電子文檔,且需嚴(yán)格遵守當(dāng)?shù)仃P(guān)于eCTD的規(guī)范,如何使用應(yīng)用程序管理大量的電子文檔,成為各個(gè)國(guó)家藥企的主要問(wèn)題,故希望通過(guò)將文件系統(tǒng)中存在的文檔按eCTD規(guī)范整理成為可識(shí)別的格式,本方法主要解決這個(gè)問(wèn)題,并通過(guò)數(shù)據(jù)庫(kù)定時(shí)刷新來(lái)解決該問(wèn)題。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種基于通用文檔格式提交文檔數(shù)據(jù)挖掘的方法,該方法簡(jiǎn)單易行,方便用戶(hù)在應(yīng)用軟件中快速的查找相關(guān)文檔和對(duì)文檔中的問(wèn)題進(jìn)行修改。
[0004]本發(fā)明解決其技術(shù)問(wèn)題是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的:
[0005]一種基于通用文檔格式提交文檔數(shù)據(jù)挖掘的方法,其方法使用ASP.net和后臺(tái)網(wǎng)絡(luò)服務(wù),對(duì)既有文件系統(tǒng)進(jìn)行文件檢索和全文檢索,得到相關(guān)文件系統(tǒng)所屬的eCTD格式和區(qū)域規(guī)范,再根據(jù)相關(guān)規(guī)范組織數(shù)據(jù)的算法排序并存儲(chǔ)到數(shù)據(jù)庫(kù)中,通過(guò)使用網(wǎng)頁(yè)端訪(fǎng)問(wèn)的模式對(duì)相關(guān)數(shù)據(jù)進(jìn)行檢索和查詢(xún),并提供用戶(hù)查詢(xún)和修改的相關(guān)接口。
[0006]本發(fā)明的優(yōu)點(diǎn)和有益效果為:
[0007]本發(fā)明通過(guò)使用本方法,可以減少客戶(hù)查找相關(guān)文檔所需要的時(shí)間和精力,同時(shí)檢查待提交文檔是否符合相關(guān)的eCTD規(guī)范,并根據(jù)該地區(qū)規(guī)范給出相關(guān)的警告和提示,以方便用戶(hù)在應(yīng)用軟件中快速的查找相關(guān)文檔和對(duì)文檔中的問(wèn)題進(jìn)行修改。
【具體實(shí)施方式】
[0008]下面通過(guò)具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳述,以下實(shí)施例只是描述性的,不是限定性的,不能以此限定本發(fā)明的保護(hù)范圍。
[0009]一種基于通用文檔格式提交文檔數(shù)據(jù)挖掘的方法,其方法使用ASP.net和后臺(tái)網(wǎng)絡(luò)服務(wù),對(duì)既有文件系統(tǒng)進(jìn)行文件檢索和全文檢索,得到相關(guān)文件系統(tǒng)所屬的eCTD格式和區(qū)域規(guī)范,再根據(jù)相關(guān)規(guī)范組織數(shù)據(jù)的算法排序并存儲(chǔ)到數(shù)據(jù)庫(kù)中,通過(guò)使用網(wǎng)頁(yè)端訪(fǎng)問(wèn)的模式對(duì)相關(guān)數(shù)據(jù)進(jìn)行檢索和查詢(xún),并提供用戶(hù)查詢(xún)和修改的相關(guān)接口。
[0010]通過(guò)使用后臺(tái)進(jìn)程進(jìn)行對(duì)于對(duì)象文件系統(tǒng)的數(shù)據(jù)挖掘,將目標(biāo)系統(tǒng)中可識(shí)別為符合eCTD規(guī)范的文檔,按照元數(shù)據(jù)的要求進(jìn)行整理,并將其所屬的地區(qū)、藥品信息、種類(lèi)等元數(shù)據(jù)進(jìn)行記錄并保存的數(shù)據(jù)庫(kù)中,通過(guò)這種方式,實(shí)現(xiàn)了文檔數(shù)據(jù)的持久化,并可通過(guò)第三方應(yīng)用程序進(jìn)行元數(shù)據(jù)的分析和檢索,將大批量的電子文檔,轉(zhuǎn)換成可以通過(guò)網(wǎng)頁(yè)直觀(guān)訪(fǎng)問(wèn)瀏覽的符合eCTD格式的輸出物。
【權(quán)利要求】
1.一種基于通用文檔格式提交文檔數(shù)據(jù)挖掘的方法,其特征在于:該方法使用ASP.net和后臺(tái)網(wǎng)絡(luò)服務(wù),對(duì)既有文件系統(tǒng)進(jìn)行文件檢索和全文檢索,得到相關(guān)文件系統(tǒng)所屬的eCTD格式和區(qū)域規(guī)范,再根據(jù)相關(guān)規(guī)范組織數(shù)據(jù)的算法排序并存儲(chǔ)到數(shù)據(jù)庫(kù)中,通過(guò)使用網(wǎng)頁(yè)端訪(fǎng)問(wèn)的模式對(duì)相關(guān)數(shù)據(jù)進(jìn)行檢索和查詢(xún),并提供用戶(hù)查詢(xún)和修改的相關(guān)接口。
【文檔編號(hào)】G06F17/30GK103530287SQ201210224229
【公開(kāi)日】2014年1月22日 申請(qǐng)日期:2012年7月2日 優(yōu)先權(quán)日:2012年7月2日
【發(fā)明者】趙克鳴, 李駿, 劉曉鐘, 王百康 申請(qǐng)人:愛(ài)思愛(ài)(天津)高科技有限公司