国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種提高數(shù)據(jù)庫檢索信息相關(guān)度的方法

      文檔序號(hào):6402031閱讀:583來源:國知局
      專利名稱:一種提高數(shù)據(jù)庫檢索信息相關(guān)度的方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種提高數(shù)據(jù)庫檢索信息相關(guān)度的方法,屬數(shù)據(jù)庫檢索技術(shù)領(lǐng)域。
      背景技術(shù)
      在許多專業(yè)領(lǐng)域數(shù)據(jù)庫系統(tǒng)中,往往存在大量的專業(yè)術(shù)語或?qū)I(yè)名詞的記錄,如在冶金領(lǐng)域的礦物介電常數(shù)數(shù)據(jù)庫所涉及的礦物名稱的記錄非常多,而在大量記錄的數(shù)據(jù)庫中,如何根據(jù)用戶的帶有專業(yè)術(shù)語的檢索詞有效的檢索出更多相關(guān)的信息也是各種專業(yè)領(lǐng)域數(shù)據(jù)庫系統(tǒng)的一個(gè)重要研究方向。通常在數(shù)據(jù)庫中檢索礦物介電常數(shù)記錄時(shí),會(huì)根據(jù)礦物的名稱來進(jìn)行檢索。如檢索“硫鐵礦”,采用常規(guī)的數(shù)據(jù)庫檢索方法,可以應(yīng)用SQL (Structured Query Language)語句來檢索數(shù)據(jù)庫的表(Table)中的某個(gè)字段(Field)的值為某一指定的值,例如:“SELECT礦物名稱,介電常數(shù)FROM礦物介電常數(shù)表WHERE礦物名稱=‘鈦鐵礦’ ”這樣的語句來檢索數(shù)據(jù)庫。這種檢索方式往往檢索到單一的信息,而無法得到與“鈦鐵礦”相關(guān)聯(lián)的礦物,如“錳鐵礦”、“硫鐵礦”的介電常數(shù)信息。這種方式下,用戶往往需要多次輸入檢索詞才能檢索到所需要的信息,而且每次的顯示結(jié)果都是單一的,不能將一些用戶需要的信息整合到一起顯示,以便用戶對(duì)比研究。目前很多檢索系統(tǒng)是通過提供高級(jí)檢索方式,由用戶輸入多個(gè)檢索詞以構(gòu)造檢索語句來實(shí)現(xiàn),而這種方式也需要用戶錄入較多的檢索詞,很不方便用戶的使用。為了得到更多的信息,對(duì)單一檢索詞,通常的做法就是將SQL語句的條件表達(dá)式改為模糊檢索方式,并將檢索詞進(jìn)行拆分,如:對(duì)“硫鐵礦”可以拆分成條件表達(dá)式“礦物名稱LIKE ‘%硫%’”、“礦物名稱LIKE ‘%鐵%”,和“礦物名稱LIKE ‘%礦%’”,然后將這些條件表達(dá)式構(gòu)造為檢索語句在數(shù)據(jù)庫中進(jìn)行檢索,最后將檢索結(jié)果通過UNION連詞合并起來。這種檢索方式又將會(huì)檢索出大量的與用戶的期望不相關(guān)的信息,用戶需要花費(fèi)大量的時(shí)間來自行篩選和判斷,也就是說,信息量很大,但相關(guān)度卻很低。另一種方法就是采用分詞技術(shù)來解析檢索詞,如將“硫鐵礦”解析為“硫鐵礦”和“鐵礦”,而將“錳鐵礦”解析為“錳鐵礦”和“鐵礦”,然后再進(jìn)行模糊檢索。但是很多專業(yè)術(shù)語并沒有統(tǒng)一的規(guī)律可循,如“鈦精礦”,如果解析為“鈦精礦”和“精礦”顯然不合適。同時(shí),使用模糊檢索方式,數(shù)據(jù)庫系統(tǒng)在檢索時(shí)將會(huì)掃描文本性字段,如果過多使用模糊檢索將會(huì)導(dǎo)致系統(tǒng)的檢索性能下降。

      發(fā)明內(nèi)容
      針對(duì)上述問題,本發(fā)明提供了一種提高數(shù)據(jù)庫檢索信息相關(guān)度的方法,包括如下步驟:
      (A)建立概念樹:利用所屬領(lǐng)域的概念間內(nèi)在的關(guān)聯(lián)因素建立概念樹,所述概念樹分為多層,第一層為根結(jié)點(diǎn),除根結(jié)點(diǎn)外,概念樹中的每一結(jié)點(diǎn)至少包括一個(gè)或一個(gè)以上的數(shù)據(jù)庫表中檢索字段的值以及權(quán)值;
      (B)在概念樹中搜索用戶檢索詞,以得到更多相關(guān)檢索詞:當(dāng)獲取用戶輸入的檢索詞后,在所述概念樹中按照一定的策略搜索檢索字段的值,如果存在該結(jié)點(diǎn)檢索字段的值與檢索詞相匹配,則按規(guī)則將該結(jié)點(diǎn)及其相關(guān)結(jié)點(diǎn)插入一個(gè)結(jié)點(diǎn)列表中,完成搜索后,返回該結(jié)點(diǎn)列表;
      (C)生成查詢條件表達(dá)式:若返回的結(jié)點(diǎn)列表不為空,則順序遍歷結(jié)點(diǎn)列表中的結(jié)點(diǎn),將檢索字段的值與檢索詞相匹配的字段按“字段名=字段值”組成表達(dá)式,多個(gè)表達(dá)式之間用邏輯連詞“OR”進(jìn)行連接。當(dāng)遍歷完整個(gè)結(jié)點(diǎn)列表后,生成一個(gè)完整的SQL查詢條件表達(dá)式,執(zhí)行下一步驟(D),若返回的結(jié)點(diǎn)列表為空,則返回空的最終的檢索結(jié)果;
      (D)檢索數(shù)據(jù)庫:根據(jù)生成的查詢條件表達(dá)式,進(jìn)一步生成完整的SQL查詢語句,提交給數(shù)據(jù)庫進(jìn)行檢索并返回結(jié)果集;
      (E)檢索結(jié)果重新排序:對(duì)結(jié)果集在內(nèi)存中按結(jié)點(diǎn)列表中結(jié)點(diǎn)的權(quán)值重新進(jìn)行排序,并返回最終的檢索結(jié)果,清空結(jié)點(diǎn)列表。步驟(B)中,若概念樹為η層,為提高檢索信息的相關(guān)度,所述搜索策略為:先搜索第η層,即先搜索葉結(jié)點(diǎn),若搜索完第η層,有檢索字段的值與檢索詞相匹配的結(jié)點(diǎn),按規(guī)則插入結(jié)點(diǎn)列表,并返回結(jié)點(diǎn)列表,結(jié)束搜索;若沒有搜索到,則繼續(xù)搜索第η-1層,以此類推,直到搜索到第I層的根結(jié)點(diǎn),則表明搜索失敗,返回空的結(jié)點(diǎn)列表。步驟(B)中,為量化相關(guān)度,依據(jù)概念樹的層數(shù),引入相關(guān)度參數(shù),在所述結(jié)點(diǎn)列表中插入搜索到的結(jié)點(diǎn)及其相關(guān)結(jié)點(diǎn)的規(guī)則是通過相關(guān)度參數(shù)來決定的:
      相關(guān)度參數(shù)r,概念樹的層數(shù)為n,相關(guān)度參數(shù)r的取值范圍為:Kr < n,當(dāng)在第i層搜索到結(jié)點(diǎn),其相關(guān)度參數(shù)r ^ i,則將該結(jié)點(diǎn)及其子孫結(jié)點(diǎn)插入所述結(jié)點(diǎn)列表中,對(duì)葉結(jié)點(diǎn),僅插入該葉結(jié)點(diǎn)到所述結(jié)點(diǎn)列表中;若r〈i,則將該結(jié)點(diǎn)在第i層的父結(jié)點(diǎn)及其父結(jié)點(diǎn)的所有子孫結(jié)點(diǎn)插入所述結(jié)點(diǎn)列表中。步驟(B)中,所述 概念樹的結(jié)點(diǎn)的權(quán)值是在每次搜索到結(jié)點(diǎn)后,插入結(jié)點(diǎn)列表時(shí)應(yīng)用權(quán)值計(jì)算的算法來動(dòng)態(tài)計(jì)算的,對(duì)檢索到的結(jié)點(diǎn)的權(quán)值要增加權(quán)值,而對(duì)其相關(guān)結(jié)點(diǎn)的權(quán)值則要降低。本發(fā)明的有益效果是:
      1)本發(fā)明的基本思路是利用領(lǐng)域概念之間的某種內(nèi)在的關(guān)聯(lián)關(guān)系建立概念樹,將用戶檢索詞使用概念樹制導(dǎo),得到更多的與用戶檢索詞相關(guān)聯(lián)的檢索詞,利用“0R”邏輯連接詞生成條件表達(dá)式,進(jìn)而提聞傳統(tǒng)關(guān)系型數(shù)據(jù)庫檢索的相關(guān)性,實(shí)際應(yīng)用表明,本發(fā)明大幅提高了傳統(tǒng)關(guān)系數(shù)據(jù)庫信息檢索的相關(guān)度,節(jié)省了用戶查找信息的時(shí)間;
      2)結(jié)合概念樹,進(jìn)一步量化相關(guān)度,引入相關(guān)度參數(shù),為用戶檢索信息時(shí),在精確與模糊之間提供了更多的選項(xiàng),更加方便了用戶的使用。3)利用檢索詞及概念之間的關(guān)系動(dòng)態(tài)計(jì)算權(quán)值,再利用動(dòng)態(tài)權(quán)值重新進(jìn)行排序,使得系統(tǒng)能夠更好的“感知”用戶,進(jìn)一步提升用戶體驗(yàn);
      4)整個(gè)檢索僅在單條查詢語句中完成,而且不包括任何子查詢,便于數(shù)據(jù)庫系統(tǒng)執(zhí)行查詢優(yōu)化的同時(shí),還有效減少了與數(shù)據(jù)庫系統(tǒng)的交互和減少了數(shù)據(jù)庫系統(tǒng)的負(fù)擔(dān),提高了整個(gè)系統(tǒng)的執(zhí)行效率;
      5)提高檢索信息的相關(guān)度的同時(shí),避免了使用Like操作符,提高了數(shù)據(jù)庫系統(tǒng)的檢索速度。


      :圖1是本發(fā)明的一種提高數(shù)據(jù)庫檢索信息相關(guān)度的方法的主要流程 圖2是本發(fā)明的實(shí)施例的礦物概念樹的示意圖。
      具體實(shí)施方式
      :
      為了使技術(shù)人員對(duì)本發(fā)明的目的、優(yōu)點(diǎn)更加明白,下面結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步說明。如圖1所示,為本發(fā)明所述方法的主要流程。該方法包括:
      步驟SlOl:建立概念樹,利用所屬領(lǐng)域的概念間內(nèi)在關(guān)聯(lián)因素建立概念樹,所述概念樹分為多層,第一層為根結(jié)點(diǎn),除根結(jié)點(diǎn)外,概念樹中的每一結(jié)點(diǎn)至少包括權(quán)值以及一個(gè)或一個(gè)以上的數(shù)據(jù)庫表中被檢索的字段的值;
      概念樹構(gòu)造為:第一層為根結(jié)點(diǎn),第二層為金屬元素,第三層為化合物,第四層為礦物,金屬元素結(jié)點(diǎn)的子結(jié)點(diǎn)為含該金屬元素的化合物,化合物結(jié)點(diǎn)的子結(jié)點(diǎn)為含該化合物的礦物,除根結(jié)點(diǎn)外,每個(gè)結(jié)點(diǎn)的信息除包括礦物名稱的字段值外,還包括分子式、品位和權(quán)值,礦物結(jié)點(diǎn)的品位為該結(jié)點(diǎn) 的礦物所含其父結(jié)點(diǎn)的化合物的含量,為百分比,其余結(jié)點(diǎn)的品位均設(shè)置為I。步驟S102:在概念樹中搜索與用戶檢索詞相關(guān)聯(lián)的檢索詞,當(dāng)獲取用戶輸入的檢索詞后,在所述概念樹中搜索字段值,如果存在該結(jié)點(diǎn)的字段值與檢索詞相匹配,則按規(guī)則將該結(jié)點(diǎn)及其相關(guān)結(jié)點(diǎn)插入一個(gè)結(jié)點(diǎn)列表中,繼續(xù)執(zhí)行搜索,直到搜索完整個(gè)概念樹,并返回結(jié)點(diǎn)列表;
      若所述概念樹為η層,為提高檢索信息的相關(guān)度,所述搜索策略為:先搜索第η層,即先搜索葉結(jié)點(diǎn),若搜索完第η層,有檢索字段的值與檢索詞相匹配的結(jié)點(diǎn),按規(guī)則插入結(jié)點(diǎn)列表,并返回結(jié)點(diǎn)列表,結(jié)束搜索;若沒有搜索到,則繼續(xù)搜索第η-1層,以此類推,直到搜索到第I層的根結(jié)點(diǎn),則表明搜索失敗,返回空的結(jié)點(diǎn)列表。為量化相關(guān)度,依據(jù)概念樹的層數(shù),引入相關(guān)度參數(shù),在所述結(jié)點(diǎn)列表中插入搜索到的結(jié)點(diǎn)及其相關(guān)結(jié)點(diǎn)的規(guī)則是通過相關(guān)度參數(shù)來決定的:
      相關(guān)度參數(shù)r,概念樹的層數(shù)為n,相關(guān)度參數(shù)r的取值范圍為:Kr < n,當(dāng)在第i層搜索到結(jié)點(diǎn),其相關(guān)度參數(shù)r ^ i,則將該結(jié)點(diǎn)及其子孫結(jié)點(diǎn)插入所述結(jié)點(diǎn)列表中,對(duì)葉結(jié)點(diǎn),僅插入該葉結(jié)點(diǎn)到所述結(jié)點(diǎn)列表中;若r〈i,則將該結(jié)點(diǎn)在第i層的父結(jié)點(diǎn)及其父結(jié)點(diǎn)的所有子孫結(jié)點(diǎn)插入所述結(jié)點(diǎn)列表中。概念樹的結(jié)點(diǎn)的權(quán)值是在每次搜索到結(jié)點(diǎn)后,插入結(jié)點(diǎn)列表時(shí)應(yīng)用權(quán)值計(jì)算的算法來動(dòng)態(tài)計(jì)算的,結(jié)點(diǎn)的權(quán)值是這樣來計(jì)算的:當(dāng)被檢索到的結(jié)點(diǎn)的品位為P,其權(quán)值W,需要提高權(quán)值,則W=p+1 ;而對(duì)其子結(jié)點(diǎn)、兄弟結(jié)點(diǎn)或父結(jié)點(diǎn),需要降低權(quán)值,當(dāng)某一結(jié)點(diǎn)的品位為Pi,則該結(jié)點(diǎn)對(duì)應(yīng)的權(quán)值為Wi=PiXPc步驟S103:生成查詢條件表達(dá)式,若返回的結(jié)點(diǎn)列表不為空,則順序遍歷結(jié)點(diǎn)列表中的結(jié)點(diǎn),將結(jié)點(diǎn)中字段值匹配檢索詞字段值按:“字段名=字段值”,生成表達(dá)式,多個(gè)表達(dá)式之間用邏輯連詞“0R”進(jìn)行連接。當(dāng)遍歷完整個(gè)結(jié)點(diǎn)列表后,生成一個(gè)完整的SQL查詢條件表達(dá)式,執(zhí)行下一步驟S104,若返回的結(jié)點(diǎn)列表為空,則返回空的最終的檢索結(jié)果;
      步驟S104:檢索數(shù)據(jù)庫,根據(jù)生成的查詢條件表達(dá)式,進(jìn)一步生成完整的SQL查詢語句,提交給數(shù)據(jù)庫進(jìn)行檢索并返回結(jié)果集;
      步驟S105:檢索結(jié)果重新排序,對(duì)結(jié)果集在內(nèi)存中按結(jié)點(diǎn)列表中結(jié)點(diǎn)的權(quán)值重新進(jìn)行排序,并返回最終的檢索結(jié)果,清空結(jié)點(diǎn)列表。下面結(jié)合具體實(shí)例,從開發(fā)及應(yīng)用的角度,對(duì)本發(fā)明再做詳細(xì)說明。如表I所示,為本實(shí)施例的數(shù)據(jù)庫中的礦物介電常數(shù)表,主要包括:ID、礦物名稱、介電常數(shù)、介電損耗和品位等字段,ID為主鍵。表2為礦物成份表,包括:ID、化合物、中文名、百分比、品位標(biāo)記等字段,其中,ID與化合物為礦物成分表的聯(lián)合主鍵。礦物成份表的ID是礦物介電常數(shù)表的外鍵。
      權(quán)利要求
      1.一種提高數(shù)據(jù)庫檢索信息相關(guān)度的方法,其特征在于,包括如下步驟: (A)建立概念樹:利用所屬領(lǐng)域的概念間內(nèi)在的關(guān)聯(lián)因素建立概念樹,所述概念樹分為多層,第一層為根結(jié)點(diǎn),除根結(jié)點(diǎn)外,概念樹中的每一結(jié)點(diǎn)至少包括一個(gè)或一個(gè)以上的數(shù)據(jù)庫表中檢索字段的值以及權(quán)值; (B)在概念樹中搜 索用戶檢索詞,以得到更多相關(guān)檢索詞:當(dāng)獲取用戶輸入的檢索詞后,在所述概念樹中按照一定的策略搜索檢索字段的值,如果存在該結(jié)點(diǎn)檢索字段的值與檢索詞相匹配,則按規(guī)則將該結(jié)點(diǎn)及其相關(guān)結(jié)點(diǎn)插入一個(gè)結(jié)點(diǎn)列表中,完成搜索后,返回該結(jié)點(diǎn)列表; (C)生成查詢條件表達(dá)式:若返回的結(jié)點(diǎn)列表不為空,則順序遍歷結(jié)點(diǎn)列表中的結(jié)點(diǎn),將檢索字段的值與檢索詞相匹配的字段按“字段名=字段值”組成表達(dá)式,多個(gè)表達(dá)式之間用邏輯連詞“OR”進(jìn)行連接,當(dāng)遍歷完整個(gè)結(jié)點(diǎn)列表后,生成一個(gè)完整的SQL查詢條件表達(dá)式,執(zhí)行下一步驟(D),若返回的結(jié)點(diǎn)列表為空,則返回空的最終的檢索結(jié)果; (D)檢索數(shù)據(jù)庫:根據(jù)生成的查詢條件表達(dá)式,進(jìn)一步生成完整的SQL查詢語句,提交給數(shù)據(jù)庫進(jìn)行檢索并返回結(jié)果集; (E)檢索結(jié)果重新排序:對(duì)結(jié)果集在內(nèi)存中按結(jié)點(diǎn)列表中結(jié)點(diǎn)的權(quán)值重新進(jìn)行排序,并返回最終的檢索結(jié)果,清空結(jié)點(diǎn)列表。
      2.根據(jù)權(quán)利要求1所述的提高數(shù)據(jù)庫檢索信息相關(guān)度的方法,其特征在于,步驟(B)中,若概念樹為η層,為提高檢索信息的相關(guān)度,所述搜索策略為:先搜索第η層,即先搜索葉結(jié)點(diǎn),若搜索完第η層,有檢索字段的值與檢索詞相匹配的結(jié)點(diǎn),按規(guī)則插入結(jié)點(diǎn)列表,并返回結(jié)點(diǎn)列表,結(jié)束搜索;若沒有搜索到,則繼續(xù)搜索第η-1層,以此類推,直到搜索到第I層的根結(jié)點(diǎn),則表明搜索失敗,返回空的結(jié)點(diǎn)列表。
      3.根據(jù)權(quán)利要求1所述的提高數(shù)據(jù)庫檢索信息相關(guān)度的方法,其特征在于,步驟(B)中,為量化相關(guān)度,依據(jù)概念樹的層數(shù),引入相關(guān)度參數(shù),在所述結(jié)點(diǎn)列表中插入搜索到的結(jié)點(diǎn)及其相關(guān)結(jié)點(diǎn)的規(guī)則是通過相關(guān)度參數(shù)來決定的: 相關(guān)度參數(shù)r,概念樹的層數(shù)為n,相關(guān)度參數(shù)r的取值范圍為:Kr < n,當(dāng)在第i層搜索到結(jié)點(diǎn),其相關(guān)度參數(shù)r ^ i,則將該結(jié)點(diǎn)及其子孫結(jié)點(diǎn)插入所述結(jié)點(diǎn)列表中,對(duì)葉結(jié)點(diǎn),僅插入該葉結(jié)點(diǎn)到所述結(jié)點(diǎn)列表中;若r〈i,則將該結(jié)點(diǎn)在第i層的父結(jié)點(diǎn)及其父結(jié)點(diǎn)的所有子孫結(jié)點(diǎn)插入所述結(jié)點(diǎn)列表中。
      4.根據(jù)權(quán)利要求1所述的提高數(shù)據(jù)庫檢索信息相關(guān)度的方法,其特征在于,在步驟(B)中,所述概念樹的結(jié)點(diǎn)的權(quán)值是在每次搜索到結(jié)點(diǎn)后,插入結(jié)點(diǎn)列表時(shí)應(yīng)用權(quán)值計(jì)算的算法來動(dòng)態(tài)計(jì)算的,對(duì)檢索到的結(jié)點(diǎn)的權(quán)值要增加權(quán)值,而對(duì)其相關(guān)結(jié)點(diǎn)的權(quán)值則要降低。
      全文摘要
      本發(fā)明提供了一種提高數(shù)據(jù)庫檢索信息相關(guān)度的方法,該方法包括如下步驟(A)建立概念樹;(B)在概念樹中搜索用戶檢索詞,以得到更多相關(guān)檢索詞;(C)生成查詢條件表達(dá)式;(D)檢索數(shù)據(jù)庫;(E)檢索結(jié)果重新排序。本發(fā)明的有益效果是1)提高了關(guān)系型數(shù)據(jù)庫信息檢索的相關(guān)度,節(jié)省了用戶查找信息的時(shí)間;2)結(jié)合概念樹,進(jìn)一步量化相關(guān)度,引入相關(guān)度參數(shù),為用戶檢索信息時(shí),在精確與模糊之間提供了更多的選項(xiàng),更加方便了用戶的使用;3)利用檢索詞及概念之間的關(guān)系動(dòng)態(tài)計(jì)算權(quán)值,再利用動(dòng)態(tài)權(quán)值重新進(jìn)行排序,進(jìn)一步提升用戶體驗(yàn);4)整個(gè)檢索在單條語句中完成,有效減少了與數(shù)據(jù)庫系統(tǒng)的交互,提高了執(zhí)行效率。
      文檔編號(hào)G06F17/30GK103177123SQ201310129209
      公開日2013年6月26日 申請(qǐng)日期2013年4月15日 優(yōu)先權(quán)日2013年4月15日
      發(fā)明者劉秉國, 劉明, 彭金輝, 劉晨輝, 張利波, 何廣軍 申請(qǐng)人:昆明理工大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1