專利名稱:數(shù)據(jù)庫搜尋系統(tǒng)的制作方法
技術領域:
本發(fā)明是關于一種數(shù)據(jù)庫搜尋系統(tǒng),特別是關于一種提供經(jīng)由不同途徑對同一主題進行搜尋。并可保留及攜帶搜尋經(jīng)驗的數(shù)據(jù)庫搜尋系統(tǒng)。
背景技術:
隨著計算機化的普及以及互聯(lián)網(wǎng)進入人類生活,許多資料已經(jīng)數(shù)字化,存放于各種數(shù)據(jù)庫中。互聯(lián)網(wǎng)將這些數(shù)據(jù)庫網(wǎng)網(wǎng)相連,形成一個巨大的大型數(shù)據(jù)庫,其結果,如何在這個大型數(shù)據(jù)庫中檢索,尋找到所需的資料文件,成為每一個人在工作上、生活上重要的課題。
為提供數(shù)據(jù)庫搜尋所需,業(yè)者已發(fā)展出各種搜尋工具。其中,最常見的乃是所謂「全文檢索」方式的搜尋工具。全文檢索的搜尋工具,一般而言是利用若干如“與(and)”、“與非(nand)”、“或(or)”等組合成為一組搜尋參數(shù),比對數(shù)據(jù)庫中的資料文件內(nèi)容,而將符合該搜尋條件的資料文件,作為搜尋成功的結果。
另一種常見的搜尋工具,乃是令使用者輸入一段文字,作為搜尋條件。搜尋工具在文字中找尋關鍵詞,并依據(jù)文中關鍵詞的內(nèi)容及組合,自動組成一組搜尋參數(shù),再依據(jù)該組搜尋參數(shù)進行檢索。
上述兩種方法,以及其它已知方法,通常只能單次檢索。使用者再度對相同主題進行檢索,需重新鍵入搜尋條件。事實上,由于檢索條件并非復雜,也無列入記錄以供之后再度利用的價值。
TW專利申請案第93105874號揭示一種可依據(jù)資料文件內(nèi)容,建立一組搜尋參數(shù)的方法。該方法包括對一資料文件例如一篇文章的內(nèi)容進行分析,得到一組搜尋參數(shù)。這組搜尋參數(shù)經(jīng)過使用者反復訓練之后,成為一組能搜尋到使用者所需資料文件的搜尋參數(shù)。這組搜尋參數(shù)成為一個數(shù)據(jù)庫搜尋代理器,使用者可以重復利用。
與本案同日申請的TW專利申請案「可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng)」揭示一種可攜式搜尋代理器。該代理器可為上述第93105874號專利申請案所揭示的搜尋代理器。而該搜尋代理器為可攜式,使用者可將之移轉到其它計算機設備,而在該另一計算機設備由自己或他人修正該搜尋代理器的內(nèi)容,成為符合另一種搜尋目的之代理器。
目前必須有一種整合式數(shù)據(jù)庫搜尋系統(tǒng),該系統(tǒng)可整合不同數(shù)據(jù)庫搜尋工具,而供使用者選擇使用。
同時也必須有一種新穎的數(shù)據(jù)庫搜尋系統(tǒng),該系統(tǒng)可供使用者建立搜尋代理器,以供重復使用。
同時也必須有一種整合的數(shù)據(jù)庫搜尋系統(tǒng),可供使用者以不同搜尋工具,建立有用的數(shù)據(jù)庫搜尋代理器。
同時也必須有一種數(shù)據(jù)庫搜尋系統(tǒng),可供使用者以不同搜尋工具,建立及訓練數(shù)據(jù)庫搜尋代理器。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種整合式數(shù)據(jù)庫搜尋系統(tǒng),該系統(tǒng)可整合不同數(shù)據(jù)庫搜尋工具,而供使用者選擇使用。
本發(fā)明的再一目的也在于提供一種新穎的數(shù)據(jù)庫搜尋系統(tǒng),該系統(tǒng)可供使用者建立搜尋代理器,以供重復使用。
本發(fā)明的另一目的也在于提供一種整合的數(shù)據(jù)庫搜尋系統(tǒng),可供使用者以不同搜尋工具,建立有用的數(shù)據(jù)庫搜尋代理器。
本發(fā)明的另一目的也在于提供一種數(shù)據(jù)庫搜尋系統(tǒng),可供使用者以不同搜尋工具,建立及訓練數(shù)據(jù)庫搜尋代理器。
為達上述目的,依據(jù)本發(fā)明采用的技術手段如下一種數(shù)據(jù)庫搜尋系統(tǒng),其包括一復合式數(shù)據(jù)庫搜尋引擎,其中包括至少二種數(shù)據(jù)庫搜尋工具,各數(shù)據(jù)庫搜尋工具提供至少一種數(shù)據(jù)庫搜尋條件格式,可供該數(shù)據(jù)庫搜尋引擎在一數(shù)據(jù)庫中搜尋符合該搜尋條件格式下的搜尋資料文件;一數(shù)據(jù)庫搜尋代理器建立及訓練模塊,可對一組資料文件的內(nèi)容,進行分析、建立一數(shù)據(jù)庫搜尋代理器;并可依據(jù)另一組數(shù)據(jù)庫搜尋代理器的內(nèi)容,修正該數(shù)據(jù)庫搜尋代理器的內(nèi)容;其中,該數(shù)據(jù)庫搜尋代理器記錄一組搜尋參數(shù),各搜尋參數(shù)包括一搜尋條件及其權值;及一使用者介面,提供一組激活手段,以供使用者激活該至少二種數(shù)據(jù)庫搜尋工具的任一者,該數(shù)據(jù)庫搜尋代理器建立及訓練功能的任一者,及顯示搜尋結果;其中,該至少二種數(shù)據(jù)庫搜尋工具包括一個可利用數(shù)據(jù)庫搜尋代理器進行資料搜尋的工具;且該數(shù)據(jù)庫搜尋代理器建立及訓練模塊針對依據(jù)該至少二種數(shù)據(jù)庫搜尋工具之一者所搜尋得到的一群資料文件中特定數(shù)量的資料文件內(nèi)容,建立數(shù)據(jù)庫搜尋代理器。
圖1表示本發(fā)明數(shù)據(jù)庫搜尋系統(tǒng)的系統(tǒng)圖。
圖2即表示一種自一文字文件產(chǎn)生一個數(shù)據(jù)庫搜尋代理器的方法流程圖。
圖3顯示本發(fā)明數(shù)據(jù)庫搜尋系統(tǒng)的操作介面示意圖。
圖4表示本發(fā)明的數(shù)據(jù)庫搜尋代理器修正方法流程圖。
圖中符號說明10 復合式數(shù)據(jù)庫搜尋引擎11 關鍵詞檢索工具12 短文檢索工具13 相關性檢索工具14 代理器檢索工具16 修正模塊20 數(shù)據(jù)庫搜尋代理器建立及訓練模塊30 數(shù)據(jù)庫40 數(shù)據(jù)庫搜尋系統(tǒng)的操作介面41 關鍵詞檢索工具按鍵42 短文檢索工具按鍵43 相關性檢索工具按鍵44 搜尋代理器檢索工具按鍵45 訓練工具按鍵46 正面評價按鍵47 負面評價按鍵具體實施方法以下說明本發(fā)明數(shù)據(jù)庫搜尋系統(tǒng)的實施例。本發(fā)明揭示一種整合式數(shù)據(jù)庫搜尋系統(tǒng),整合了不同的搜尋工具于其搜尋引擎,使用者可任選其中一種或數(shù)種搜尋工具,在數(shù)據(jù)庫例如互聯(lián)網(wǎng)中檢索所需的資料。所得的資料可以用來建立或修正一數(shù)據(jù)庫搜尋代理器。該搜尋代理器經(jīng)過反復修正,成為可在數(shù)據(jù)庫中搜尋到所需的資料文件的搜尋工具。
圖1表示本發(fā)明數(shù)據(jù)庫搜尋系統(tǒng)的系統(tǒng)圖。如圖1所示,本發(fā)明的數(shù)據(jù)庫搜尋系統(tǒng)主要包括一個復合式數(shù)據(jù)庫搜尋引擎10以及一個數(shù)據(jù)庫搜尋代理器建立及訓練模塊20。以下分別說明。
復合式數(shù)據(jù)庫搜尋引擎10包括數(shù)種數(shù)據(jù)庫搜尋工具11、12、13。在本發(fā)明的實例中,可以適用在該復合式數(shù)據(jù)庫搜尋引擎10的搜尋工具包括各種適用的搜尋工具,例如關鍵詞檢索工具11,可以利用一組關鍵詞以及其運算關系,如“與(and)”、“與非(nand)”、“或(or)”等,在一數(shù)據(jù)庫30中找到含有該組關鍵詞并符合其運算關系的資料文件;短文檢索工具12,可以供使用者輸入一段短文,對該短文進行分析,組織成一串關鍵詞以及其運算關系,作為數(shù)據(jù)庫搜尋條件,而在數(shù)據(jù)庫30中找尋符合或接近該搜尋條件的資料文件;相關性檢索工具13,可以輸入一個資料文件,自動分析、建立一個數(shù)據(jù)庫搜尋代理器,并依其內(nèi)容在數(shù)據(jù)庫30中檢索出符合檢索條件的資料文件;代理器檢索工具14,可以利用一數(shù)據(jù)庫搜尋代理器,在數(shù)據(jù)庫30中檢索出符合該搜尋代理器所代表的檢索條件的資料文件;以及其它可能用來在數(shù)據(jù)庫30中檢索出符合其搜尋條件的資料文件的搜尋工具。
在本發(fā)明中,數(shù)據(jù)庫搜尋代理器Si可表為Si=(xi1,wi1),(xi2,wi2),...(xin,win)其中,x表搜尋用指標,如所搜尋的檔案為文字文件,則x可為一關鍵詞,如為影像,則為一特征,如為聲音,則可為一段波形或其它特征;w則表其相對應的權值。
在本發(fā)明中,該搜尋代理器可為一外來搜尋代理器,也可為一內(nèi)部產(chǎn)生的搜尋代理器。該數(shù)據(jù)庫搜尋代理器可以利用任何已知技術產(chǎn)生。例如,TW專利申請案第92123876號,即揭示一種以手動方式,將一搜尋用關鍵詞,轉化成一串搜尋用指標的技術。
又例如TW專利申請案93105874號,則揭示一種對一個或數(shù)個資料文件內(nèi)容進行分析,自動產(chǎn)生一串搜尋用指標的技術。
茲以該93105874號專利申請案新揭示的技術為例,說明該數(shù)據(jù)庫搜尋代理器的產(chǎn)生方法。以下的說明,以對一文字文件文章進行分析,產(chǎn)生描述該文章特性的搜尋代理器為實例。
圖2即表示一種自一文字文件產(chǎn)生一個數(shù)據(jù)庫搜尋代理器的方法流程圖。如圖2所示,于201取得一資料文件,該資料文件為一文字文件;于202將該文字文件轉換成文字資料格式,以供處理。于203對該文字文件進行字詞分割處理,而將該文字文件轉換成一串以「詞」(word)為單位的連續(xù)資料。接著,于204計算各「詞」在該文字文件中出現(xiàn)的次數(shù),得到一串由「詞」與「詞頻」所組合的指標集合,稱為「指標資料串」。其次,于205對該指標資料串進行正規(guī)化處理(normalization)。正規(guī)化處理可消除文字文件長短對指標及其權值所造成的影響。在實際應用上,可以設定一文字文件標準長度。將所有待處理文章與該設定值比較,而將其詞頻值以該比較值作正規(guī)化處理。
再次,于206對于詞頻極高,但并無指標意義的詞,進行調(diào)整。在進行調(diào)整時,可對某些在大多數(shù)文字文件都會出現(xiàn)的詞,降低其權值。
進行調(diào)整時,乃是將前步驟所得的詞頻值,乘以一調(diào)整值。使得當一個詞所出現(xiàn)的文章數(shù)量越大比例越高時,其權值即趨近于0。
經(jīng)過上述處理步驟后,于207得到所有詞的權值,分別加以記錄,成為一數(shù)據(jù)庫搜尋代理器。在該過程中,如果是利用多數(shù)文字文件,并包括「符合」該搜尋目的及「不符」該搜尋目的之文字文件,則所得的數(shù)據(jù)庫搜尋代理器可包括權值為正的指標及權值為負的指標。
經(jīng)過上述步驟之后,將在步驟中曾經(jīng)分析過的文字文件,加以挑選,取得預訂數(shù)量的代表性文字文件,較好包括經(jīng)判斷為「符合」該搜尋目的及「不符」該搜尋目的之文字文件,連同其「符合」該搜尋目的及「不符」該搜尋目的之標示,加以存盤備用。在選擇具代表性文字文件時,可挑選近似度<詳下述>的絕對值較高的文字文件。
除上述方法外,其它可以建立類似結構的數(shù)據(jù)庫搜尋代理器的方法,也可應用在本發(fā)明。
該復合式搜尋引擎10可在該數(shù)據(jù)庫30中,取得資料文件A,并與該數(shù)據(jù)庫搜尋代理器所含的指標比對,標示出在該數(shù)據(jù)庫中所存在的指標,計算近似度(Similarity)Similarity=∑xjwjxj∈(A)其中,A代表所檢索的資料文件,A表其內(nèi)含資料的集合xj該數(shù)據(jù)庫搜尋代理器所含的指標,wj為其權值。
該復合式搜尋引擎10將近似值計算結果與一臨界值比較,挑選出近似值大于臨界值的資料文件,作為搜尋結果。
在本發(fā)明的一些實例中,該關鍵詞搜尋工具11可依據(jù)使用者所輸入的一組關鍵詞,自動產(chǎn)生一個代表該組關鍵詞所指涉的「概念」的數(shù)據(jù)庫搜尋代理器。該「概念型」數(shù)據(jù)庫搜尋代理器可以利用人工方式建立,也可利用特定的方法自動建立。TW專利申請案第92123876號「概念式文章搜尋器」即揭示一種將輸入關鍵詞轉化成一個數(shù)據(jù)庫搜尋代理器的方法??勺鳛楸景l(fā)明的參考。
此外,該短文檢索工具12也可提供一種可依據(jù)使用者所輸入的短文,自動形成一數(shù)據(jù)庫搜尋代理器的功能。至于自動產(chǎn)生該數(shù)據(jù)庫搜尋代理器的方法,可以參照上開TW專利第93105874號所揭示的技術。再者,該相關性檢索工具13也可利用類似方法,建立一數(shù)據(jù)庫搜尋代理器,以供檢索之用。
使用者利用該復合式數(shù)據(jù)庫搜尋引擎10進行資料檢索時,可以選擇其搜尋工具的至少一種,在指定的數(shù)據(jù)庫中進行檢索。該數(shù)據(jù)庫可為一計算機的磁盤、光盤等記錄媒體,也可為一內(nèi)部網(wǎng)站、互聯(lián)網(wǎng)或任何網(wǎng)站。
圖3顯示本發(fā)明數(shù)據(jù)庫搜尋系統(tǒng)的操作介面示意圖。如圖3所示,本發(fā)明的數(shù)據(jù)庫搜尋系統(tǒng)的操作介面40包括一關鍵詞檢索工具按鍵41,一短文檢索工具按鍵42、一相關性檢索工具按鍵43及一搜尋代理器檢索工具按鍵44。此外并包括一訓練工具按鍵45及一正面評價按鍵46及一負面評價按鍵47。使用者以鼠標按下任一檢索工具按鍵,并選定一個以上數(shù)據(jù)庫后,即可在該數(shù)據(jù)庫中檢索出符合或接近相關搜尋條件的資料文件。如果所使用的搜尋代理器為外部移入,則使用者另需建置該搜尋代理器,自不待言。
經(jīng)由上述搜尋所得的資料文件,通常含有較符合使用者搜尋目的之內(nèi)容。不過,在本發(fā)明中,另提供一個數(shù)據(jù)庫搜尋代理器建立及訓練模塊20,除可透過上述數(shù)據(jù)庫搜尋代理器的建立方法,建立搜尋代理器外,并可對一數(shù)據(jù)庫搜尋代理器,加以修正,成為更符合使用者所需的數(shù)據(jù)庫搜尋代理器。
換言之,該數(shù)據(jù)庫搜尋代理器建立及訓練模塊20用以依據(jù)上述以關鍵詞建立數(shù)據(jù)庫搜尋代理器,以短文建立數(shù)據(jù)庫搜尋代理器,以資料文件內(nèi)容建立搜尋代理器等方式,建立數(shù)據(jù)庫搜尋代理器;將一外界移入搜尋代理器,建立為數(shù)據(jù)庫搜尋代理器;及依據(jù)另一組數(shù)據(jù)庫搜尋代理器的內(nèi)容,修正一數(shù)據(jù)庫搜尋代理器的內(nèi)容。
在本發(fā)明中,該數(shù)據(jù)庫搜尋代理器建立及訓練模塊20憑以修正數(shù)據(jù)庫搜尋代理器的修正用數(shù)據(jù)庫搜尋代理器,依據(jù)該復合式數(shù)據(jù)庫搜尋引擎10所提供的至少一種搜尋工具檢索所得的一組包含至少一個資料文件的內(nèi)容所建立。因此,使用者可以利用或不利用一個數(shù)據(jù)庫搜尋代理器,進行搜尋,并以搜尋所得的資料文件,修正一個已建立的數(shù)據(jù)庫搜尋代理器,使的更符合其所需。上述TW專利申請案「可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng)」所揭示的方法與系統(tǒng),也可適用在本發(fā)明的數(shù)據(jù)庫搜尋代理器建立及訓練模塊20,在本發(fā)明中列為參考。以下參考該方法,說明該數(shù)據(jù)庫搜尋代理器建立及訓練模塊20修正數(shù)據(jù)庫搜尋代理器的步驟。
為使一數(shù)據(jù)庫搜尋代理器能符合特定使用者的需求,該數(shù)據(jù)庫搜尋代理器建立及訓練模塊20乃將上述搜尋的結果顯示在該操作介面40,供使用者進行評價。該使用者可閱讀其內(nèi)容,并進行評價。該評價通常包括是否符合搜尋目的之評價。在實際應用上,可提供一按鈕,使用者僅需鍵入「Y 」及「N 」,即可完成評價。當使用者按下「Y 」即表示該資料文件符合搜尋目的,按下「N 」則表示該資料文件不符合該搜尋目的之評價,按「T」則進行訓練。當然,其它評價方式,例如令使用者給予評分,也屬可行。
經(jīng)過使用者評價的數(shù)據(jù)文件,給予標記。當使用者已評價過特定數(shù)量的資料文件,或者使用者指示停止評價后,該數(shù)據(jù)庫搜尋代理器建立及訓練模塊20即將經(jīng)過評價的文字文件,加入該外來數(shù)據(jù)庫搜尋代理器所附的該群代表性文字文件中,并對該群代表性文字文件進行分析,得到一個修正用數(shù)據(jù)庫搜尋代理器,該代理器St仍以下式表示St=(xt1,wt1),(xt2,wt2),...(xtm,wtm)x、w定義同前。
其中,對使用者評為「不符」的資料文件,由該資料文件所產(chǎn)生的指標,其權值可標為負值。綜合使用者已評價的資料文件及該外來數(shù)據(jù)庫搜尋代理器所附的該群代表性文字文件的內(nèi)容,可產(chǎn)生一具有負權值的修正用數(shù)據(jù)庫搜尋代理器。建立修正用數(shù)據(jù)庫搜尋代理器的方式,可以參考上述93105874號專利申請案所揭示的技術,于此不再贅述。
在實際操作上,如該搜尋系依據(jù)一外來數(shù)據(jù)庫搜尋代理器而為,該修正用數(shù)據(jù)庫搜尋代理器St將包括大量與該外來數(shù)據(jù)庫搜尋代理器相同的搜尋用指標。這是因為一個外來數(shù)據(jù)庫搜尋代理器乃是經(jīng)過他人長期使用,訓練所得的結果。
該數(shù)據(jù)庫搜尋代理器建立及修正模塊20以所得的修正用數(shù)據(jù)庫搜尋代理器,再度對該群加入新數(shù)據(jù)文件的代表性資料文件進行比對,測試各文字文件比對結果是否與所標示的「符合」或「不符」相同。其后,對比對結果進行統(tǒng)計,計算該修正數(shù)據(jù)庫搜尋代理器的正確率(acc)。
其次,該數(shù)據(jù)庫搜尋代理器建立及修正模塊20以該正確率acc修正該修正用數(shù)據(jù)庫搜尋代理器,并將該修正用數(shù)據(jù)庫搜尋代理器St與該外來數(shù)據(jù)庫搜尋代理器Si合并,成為測試用數(shù)據(jù)庫搜尋代理器SsSs={(xsk,wsk)}其中,xsk=xi,wsk=wik+acc*wtkxi=xtxsk=xi,wsk=wi∀xi∉{xt}]]>xsk=xt,wsk=wt∀xt∉{xi}]]>妿k∈N丅接者,該數(shù)據(jù)庫搜尋代理器建立及修正模塊20再度對該群加入新文字文件的文字文件進行比對,并將所得知正確率與一標準值比較。如該正確率已達標準值,則該測試用數(shù)據(jù)庫搜尋代理器即為合格的數(shù)據(jù)庫搜尋代理器,所搜尋的結果足以符合使用者的需求。
如該正確率未達該標準值,則數(shù)據(jù)庫搜尋代理器建立及修正模塊20繼續(xù)對該外來數(shù)據(jù)庫搜尋代理器進行修正。其修正方式可例如將該修正用數(shù)據(jù)庫搜尋代理器所含的權值,全部乘以該正確率或歷次正確率的乘積,再與該原數(shù)據(jù)庫搜尋代理器合并?;蛞云渌椒?,修正該修正用數(shù)據(jù)庫搜尋代理器的指標或其權值。此外,也可分別修正該原數(shù)據(jù)庫搜尋代理器及該修正用數(shù)據(jù)庫搜尋代理器,再予合并,均無不可。
將修正后的測試用數(shù)據(jù)庫搜尋代理器,再度進行搜尋、評價,計算其正確率,直到其正確率超過該標準值。即可獲得符合所需的數(shù)據(jù)庫搜尋代理器。
綜合上述,本發(fā)明的數(shù)據(jù)庫搜尋代理器建立及修正模塊20處理系統(tǒng)修正該原數(shù)據(jù)庫搜尋代理器的流程,如圖4的數(shù)據(jù)庫搜尋代理器修正方法流程圖所示,而包括下列步驟于401取得一個外來數(shù)據(jù)庫搜尋代理器中所記錄之一組資料搜尋參數(shù);該參數(shù)包括至少一搜尋條件及其相對應的權值;于402取得一群與該組資料搜尋參數(shù)相關的資料文件;該群資料文件包括多數(shù)經(jīng)標示為與該可攜式數(shù)據(jù)庫搜尋代理器的搜尋目的「相符」的數(shù)據(jù)文件及多數(shù)經(jīng)標示為與該可攜式數(shù)據(jù)庫搜尋代理器的搜尋目的「不符」的數(shù)據(jù)文件;于403依據(jù)該一組資料搜尋參數(shù)在數(shù)據(jù)庫30中進行搜尋,得到若干符合或接近搜尋條件的資料文件;于404在所得的資料文件中選取特定數(shù)量的資料文件,顯示于該操作介面40供使用者閱讀;于405接受使用者對所提供的資料文件的評價;該評價包括代表是否符合搜尋目的之評價;于406將經(jīng)使用者評價的資料文件及其標示加入該群資料文件中;于407分析該群資料文件,產(chǎn)生一修正用數(shù)據(jù)庫搜尋代理器;該修正用數(shù)據(jù)庫搜尋代理器記錄一組資料搜尋參數(shù);各搜尋參數(shù)包括至少一搜尋指標及其相對應的權值;于408以該修正用數(shù)據(jù)庫搜尋代理器在該群資料文件中進行比對,判斷預定數(shù)量的資料文件分別為符合搜尋目的或不符搜尋目的;于409計算以該修正用數(shù)據(jù)庫搜尋代理器所比對結果與該預定數(shù)量資料文件所標示的符合搜尋目的或不符搜尋目的相符的比例,作為正確率;于410以該正確率調(diào)整該修正用數(shù)據(jù)庫搜尋代理器的參數(shù)權值;于411合并該可攜式數(shù)據(jù)庫搜尋代理器與該調(diào)整后修正用數(shù)據(jù)庫搜尋代理器,得到修正后數(shù)據(jù)庫搜尋代理器;于412輸出該修正后的數(shù)據(jù)庫搜尋代理器,作為修正結果。
最后,于413在該群資料文件中刪除對訓練效果較無影響的資料文件,以防止資料文件所占記憶空間過大。
如上所述,本發(fā)明的數(shù)據(jù)庫搜尋系統(tǒng),可以整合各種不同的數(shù)據(jù)庫搜尋工具,供使用者進行資料搜尋,形成一個數(shù)據(jù)庫搜尋代理器,并可隨時訓練該數(shù)據(jù)庫搜尋代理器,使其更符合所需。該數(shù)據(jù)庫搜尋代理器可為外來或內(nèi)建,并可隨時加以訓練。本發(fā)明提供一種全面且整合的數(shù)據(jù)庫搜尋系統(tǒng)。
以上是對本發(fā)明數(shù)據(jù)庫搜尋系統(tǒng)的說明,屬于該領域的人士不難由上述的說明,明了本發(fā)明的精神進而作出不同的衍伸與變化,唯只要不超出本發(fā)明的精神,均應包含于其權利要求范圍內(nèi)。
權利要求
1.一種數(shù)據(jù)庫搜尋系統(tǒng),其特征是,包括一復合式數(shù)據(jù)庫搜尋引擎,其中包括至少二種數(shù)據(jù)庫搜尋工具,各數(shù)據(jù)庫搜尋工具提供至少一種數(shù)據(jù)庫搜尋條件格式,可供該數(shù)據(jù)庫搜尋引擎在一數(shù)據(jù)庫中搜尋符合該搜尋條件格式下的搜尋條件的資料文件;一數(shù)據(jù)庫搜尋代理器建立及訓練模塊,可對一組資料文件的內(nèi)容,進行分析、建立一數(shù)據(jù)庫搜尋代理器;并可依據(jù)另一組數(shù)據(jù)庫搜尋代理器的內(nèi)容,修正該數(shù)據(jù)庫搜尋代理器的內(nèi)容;其中,該數(shù)據(jù)庫搜尋代理器記錄一組搜尋參數(shù),各搜尋參數(shù)包括一搜尋條件及其權值;及一使用者介面,提供一組激活手段,以供使用者激活該至少二種數(shù)據(jù)庫搜尋工具的任一者,該數(shù)據(jù)庫搜尋代理器建立及訓練功能的任一者,及顯示搜尋結果;其中,該至少二種數(shù)據(jù)庫搜尋工具包括一個可利用數(shù)據(jù)庫搜尋代理器進行資料搜尋的數(shù)據(jù)庫搜尋代理器搜尋工具;且該數(shù)據(jù)庫搜尋代理器建立及訓練模塊針對依據(jù)該至少二種數(shù)據(jù)庫搜尋工具之一者所搜尋得到的一群資料文件中特定數(shù)量的資料文件內(nèi)容,建立數(shù)據(jù)庫搜尋代理器。
2.如權利要求1所述的數(shù)據(jù)庫搜尋系統(tǒng),其特征是,該數(shù)據(jù)庫搜尋代理器包括Si=(xi1,wi1),(xi2,wi2),…(xin,win)其中,Si表第i搜尋代理器,x表其指標,w表權值。
3.如權利要求1所述的數(shù)據(jù)庫搜尋系統(tǒng),其特征是,該復合式數(shù)據(jù)庫搜尋引擎提供的搜尋工具包括關鍵詞搜尋工具,短文搜尋工具,相關性搜尋工具及數(shù)據(jù)庫搜尋代理器搜尋工具。
4.如權利要求1所述的數(shù)據(jù)庫搜尋系統(tǒng),其特征是,該使用者介面提供包括關鍵詞搜尋工具,短文搜尋工具,相關性搜尋工具及數(shù)據(jù)庫搜尋代理器搜尋工具的激活按鍵,建立數(shù)據(jù)庫搜尋代理器及修正數(shù)據(jù)庫搜尋代理器的激活按鍵,及供使用者輸入對特定資料文件是否符合特定搜尋目的之評價的按鍵。
5.如權利要求1所述的數(shù)據(jù)庫搜尋系統(tǒng),其特征是,該數(shù)據(jù)庫搜尋代理器建立及訓練模塊可接受使用者對特定的數(shù)據(jù)文件進行與特定搜尋目的符合或不符的評價,并依據(jù)復數(shù)資料文件的內(nèi)容及其評價,修正數(shù)據(jù)庫搜尋代理器的內(nèi)容。
6.如權利要求5所述的數(shù)據(jù)庫搜尋系統(tǒng),其特征是,該數(shù)據(jù)庫搜尋代理器建立及訓練模塊系以下式依據(jù)數(shù)據(jù)庫搜尋代理器St={(xtk,wtk)}與修正另一數(shù)據(jù)庫搜尋代理器Si={(xik,wik)},成為修正后的數(shù)據(jù)庫搜尋代理器SsSs={(xsk,wsk)}xsk=xi,wik=wik+acc*wtkxi=xt其中,xsk=xi,wsk=wi∀xi∉{xt}]]>xsk=xt,wsk=wt∀xt∉{xi}]]>妿k∈N;k∈N;xk表一指標,wk表其權值,acc表該數(shù)據(jù)庫搜尋代理器搜尋特定資料文件的結果正確率。
全文摘要
本發(fā)明為一種數(shù)據(jù)庫搜尋系統(tǒng),包括一復合式數(shù)據(jù)庫搜尋引擎,其中包括至少二種數(shù)據(jù)庫搜尋工具,各數(shù)據(jù)庫搜尋工具提供至少一種數(shù)據(jù)庫搜尋條件格式,可供該數(shù)據(jù)庫搜尋引擎搜尋符合該條件格式下的資料文件;一數(shù)據(jù)庫搜尋代理器建立及訓練模塊,其中,該數(shù)據(jù)庫搜尋代理器記錄一組搜尋參數(shù),各搜尋參數(shù)包括一搜尋條件及其權值;及一使用者界面,其中,該至少二種數(shù)據(jù)庫搜尋工具包括一個可利用數(shù)據(jù)庫搜尋代理器進行資料搜尋的工具;且該數(shù)據(jù)庫搜尋代理器建立及訓練模塊針對依據(jù)該至少二種數(shù)據(jù)庫搜尋工具之一者所搜尋得到的一群資料文件中特定數(shù)量的資料文件內(nèi)容,建立數(shù)據(jù)庫搜尋代理器。
文檔編號G06F17/30GK1811755SQ20051000631
公開日2006年8月2日 申請日期2005年1月26日 優(yōu)先權日2005年1月26日
發(fā)明者周培林 申請人:宇匯知識科技股份有限公司