一種針對中醫(yī)藥學(xué)信息的檢索系統(tǒng)和方法
【專利摘要】本發(fā)明公開一種針對中醫(yī)藥學(xué)信息的檢索系統(tǒng)和方法,該檢索方法包括:在關(guān)鍵詞屬性表中,查詢用戶提供的一組檢索詞中每一個檢索詞的屬性類型;按照屬性類型對該組檢索詞進(jìn)行聚類,將屬性類型相同的檢索詞歸為一類,根據(jù)該組檢索詞中占比最大的檢索詞類別確定用戶的檢索意圖;根據(jù)該組檢索詞查詢索引表和知識單元數(shù)據(jù)庫,得到匹配結(jié)果集,并將所述匹配結(jié)果集按照屬性類別進(jìn)行分類,根據(jù)用戶的檢索意圖向用戶返回相應(yīng)屬性類別的匹配結(jié)果。本發(fā)明通過對用戶提供的一組關(guān)鍵詞進(jìn)行分析和處理,推測用戶的檢索意圖,并依據(jù)推測結(jié)果恰當(dāng)?shù)亟M織檢索結(jié)果,更好地滿足用戶的檢索期望,提高檢索結(jié)果的準(zhǔn)確度。
【專利說明】一種針對中醫(yī)藥學(xué)信息的檢索系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及醫(yī)藥領(lǐng)域,具體而言,涉及一種針對中醫(yī)藥學(xué)信息的檢索系統(tǒng)和方法。
【背景技術(shù)】
[0002]針對中醫(yī)藥學(xué)的信息檢索結(jié)構(gòu)包含以下四種不同類型的信息單元:
[0003]方劑:在辨證審因確定治法之后,選擇合適的藥物,酌定用量,按照組方結(jié)構(gòu)的要求,妥善配伍而成。
[0004]本草:在中醫(yī)理論指導(dǎo)下,用于預(yù)防、治療、診斷疾病并具有康復(fù)與保健作用的物質(zhì)。
[0005]病證:即疾病,是致病邪氣作用于人體,人體正氣與之抗?fàn)幎鸬臋C(jī)體陰陽失調(diào)、臟腑組織損傷、生理機(jī)能失?;蛐睦砘顒诱系K的一個完整的生命過程。
[0006]醫(yī)案:即病案,是醫(yī)生治療疾病時辨證、立法、處方用藥的連續(xù)記錄。
[0007]癥狀:是疾病過程中表現(xiàn)出的個別、孤立的現(xiàn)象,可以是病人異常的主觀感覺或行為表現(xiàn),也可以是醫(yī)生檢查病人時發(fā)現(xiàn)的異常征象。
[0008]隨著信息化程度的日益提高,人們已經(jīng)可以通過各種信息終端獲取醫(yī)療信息,但如何推測用戶的意圖以便為用戶提供更準(zhǔn)確的中醫(yī)藥信息仍是一個亟需解決的問題。
【發(fā)明內(nèi)容】
[0009]本發(fā)明提供一種針對中醫(yī)藥學(xué)信息的檢索系統(tǒng)和方法,用以根據(jù)用戶提供的檢索詞推測用戶的意圖以便為用戶提供更準(zhǔn)確的中醫(yī)藥信息。
[0010]為達(dá)到上述目的,本發(fā)明提供了一種針對中醫(yī)藥學(xué)信息的檢索系統(tǒng),包括:
[0011]屬性查詢模塊,用于在關(guān)鍵詞屬性表中,查詢用戶提供的一組檢索詞中每一個檢索詞的屬性類型,其中,所述關(guān)鍵詞屬性表中的每條結(jié)構(gòu)化信息包括關(guān)鍵詞及其對應(yīng)的屬性類別,所述屬性類型包括本草、方劑、病癥和癥狀;
[0012]意圖推測模塊,用于按照查詢得到的屬性類型對該組檢索詞進(jìn)行聚類,將屬性類型相同的檢索詞歸為一類,根據(jù)該組檢索詞中占比最大的檢索詞類別確定用戶的檢索意圖;
[0013]結(jié)果返回模塊,用于根據(jù)該組檢索詞查詢索引表和知識單元數(shù)據(jù)庫,得到匹配結(jié)果集,并將所述匹配結(jié)果集按照屬性類別進(jìn)行分類,根據(jù)用戶的檢索意圖向用戶返回相應(yīng)屬性類別的匹配結(jié)果,其中,所述知識單元數(shù)據(jù)庫用于存儲知識單元,所述知識單元包含信息內(nèi)容和信息所屬類別,所述索引表是對所述知識單元數(shù)據(jù)庫內(nèi)的每一個知識單元進(jìn)行切詞后建立的倒排索引。
[0014]進(jìn)一步地,如果占比最大的檢索詞類別存在多個,則按照本草 > 方劑 > 病癥 >癥狀的優(yōu)先級順序確定用戶的檢索意圖。
[0015]進(jìn)一步地,所述意圖推測模塊包括:
[0016]聚類單元,按照屬性類型對該組檢索詞進(jìn)行聚類,得到Kt = {kj [ T(kj) = t,j為自然數(shù),m},其中假設(shè)用戶輸入的該組檢索詞為K = [k1; k2,…,km],在關(guān)鍵詞屬性表中查詢到的K中每一個檢索詞Ici的屬性類型TCO e P,其中,t e P,m、i為自然數(shù),
I^ i ^ m, P = {本草,方劑,病癥,癥狀};
[0017]意圖推測單元,用P表示聚類后占比最大的檢索詞類別,BPII},根據(jù)Kp和P的取值確定用戶的檢索意圖:
[0018]情況C1:如果|κρ| > I且P為本草,則推測用戶的主要檢索目標(biāo)為方劑;
[0019]情況C2:如果|κρ| > I且P為癥狀,則推測用戶的主要檢索目標(biāo)為病癥;
[0020]情況C3:除C1和C2之外的情況,推測用戶的主要檢索目標(biāo)為類別為P的信息單元。
[0021]進(jìn)一步地,所述結(jié)果返回模塊包括:
[0022]結(jié)果查詢單元,用于根據(jù)該組檢索詞查詢索引表和知識單元數(shù)據(jù)庫,得到匹配結(jié)果集R= Ir [ 3' kj e K,使得a (r) e I (K」)},其中a (r)表示信息單元r在知識單元數(shù)據(jù)庫中的索引位置,I og表示檢索詞h在索引表中對應(yīng)的包含h的信息單元的索引位置集;
[0023]分類單元,用于將R中的匹配結(jié)果按照屬性類別進(jìn)行分類,得到Rt = Ir I β (r)=t,r e R},其中 t e P ;
[0024]結(jié)果返回單元,用于根據(jù)所確定的用戶檢索意圖,向用戶返回如下結(jié)果頁面的各個卡片:
[0025]對于情況C1,將方劑類結(jié)果作為默認(rèn)類別的結(jié)果頁面卡片;
[0026]對于情況C2,將病癥類結(jié)果作為默認(rèn)類別的結(jié)果頁面卡片;
[0027]對于情況C3,將屬性類別為P的結(jié)果頁面作為默認(rèn)類別的結(jié)果頁面卡片;
[0028]對于默認(rèn)類別之外的結(jié)果頁面卡片,按照各類別含有結(jié)果數(shù)量由大到小的順序進(jìn)行排列。
[0029]進(jìn)一步地,上述系統(tǒng)還包括:
[0030]更新模塊,用于添加或更新所述關(guān)鍵詞屬性表中本草、方劑、病癥和癥狀對應(yīng)的關(guān)鍵詞,以及創(chuàng)建或更新所述知識單元數(shù)據(jù)庫中的知識單元,并更新所述索引表。
[0031]為達(dá)到上述目的,本發(fā)明還提供了一種針對中醫(yī)藥學(xué)信息的檢索方法,包括以下步驟:
[0032]在關(guān)鍵詞屬性表中,查詢用戶提供的一組檢索詞中每一個檢索詞的屬性類型,其中,所述關(guān)鍵詞屬性表中的每條結(jié)構(gòu)化信息包括關(guān)鍵詞及其對應(yīng)的屬性類別,所述屬性類型包括本草、方劑、病癥和癥狀;
[0033]按照屬性類型對該組檢索詞進(jìn)行聚類,將屬性類型相同的檢索詞歸為一類,根據(jù)該組檢索詞中占比最大的檢索詞類別確定用戶的檢索意圖;
[0034]根據(jù)該組檢索詞查詢索引表和知識單元數(shù)據(jù)庫,得到匹配結(jié)果集,并將所述匹配結(jié)果集按照屬性類別進(jìn)行分類,根據(jù)用戶的檢索意圖向用戶返回相應(yīng)屬性類別的匹配結(jié)果,其中,所述知識單元數(shù)據(jù)庫用于存儲知識單元,所述知識單元包含信息內(nèi)容和信息所屬類別,所述索引表是對所述知識單元數(shù)據(jù)庫內(nèi)的每一個知識單元進(jìn)行切詞后建立的倒排索引。
[0035]進(jìn)一步地,如果占比最大的檢索詞類別存在多個,則按照本草 > 方劑 > 病癥 >癥狀的優(yōu)先級順序確定用戶的檢索意圖。
[0036]進(jìn)一步地,所述按照屬性類型對該組檢索詞進(jìn)行聚類,將屬性類型相同的檢索詞歸為一類,根據(jù)該組檢索詞中占比最大的檢索詞類別確定用戶的檢索意圖步驟包括:
[0037]假設(shè)用戶輸入的該組檢索詞為K = [k1; k2,…,km],在關(guān)鍵詞屬性表中查詢到的K中每一個檢索詞h的屬性類型T CO e P,其中,m、i為自然數(shù),I彡i彡m,P = {本草,方齊U,病癥,癥狀};
[0038]按照屬性類型對該組檢索詞進(jìn)行聚類,得到Kt = {kj [ T(kj) = t,j為自然數(shù),I ^ j ^ m},其中 t e P ;
[0039]用p表示聚類后占比最大的檢索詞類別,即=根據(jù)|κρ|和P的取值確定用戶的檢索意圖:
[0040]情況C1:如果|κρ| > I且P為本草,則推測用戶的主要檢索目標(biāo)為方劑;
[0041]情況C2:如果|κρ| > I且P為癥狀,則推測用戶的主要檢索目標(biāo)為病癥;
[0042]情況C3:除C1和C2之外的情況,推測用戶的主要檢索目標(biāo)為類別為P的信息單元。
[0043]進(jìn)一步地,所述根據(jù)該組檢索詞查詢索引表和知識單元數(shù)據(jù)庫,得到匹配結(jié)果集,并將所述匹配結(jié)果集按照屬性類別進(jìn)行分類,根據(jù)用戶的檢索意圖向用戶返回相應(yīng)屬性類別的匹配結(jié)果步驟包括:
[0044]根據(jù)該組檢索詞查詢索引表和知識單元數(shù)據(jù)庫,得到匹配結(jié)果集R= Ir [ 3kj e K,使得a (r) e I(Kj)K其中a (r)表示信息單元r在知識單元數(shù)據(jù)庫中的索引位置,I (Kj)表示檢索詞h在索引表中對應(yīng)的包含h的信息單元的索引位置集;
[0045]將R中的匹配結(jié)果按照屬性類別進(jìn)行分類,得到Rt = Ir I β (r) = t, r e R},其中t e P ;
[0046]根據(jù)所確定的用戶檢索意圖,向用戶返回如下結(jié)果頁面的各個卡片:
[0047]對于情況C1,將方劑類結(jié)果作為默認(rèn)類別的結(jié)果頁面卡片;
[0048]對于情況C2,將病癥類結(jié)果作為默認(rèn)類別的結(jié)果頁面卡片;
[0049]對于情況C3,將屬性類別為P的結(jié)果頁面作為默認(rèn)類別的結(jié)果頁面卡片;
[0050]對于默認(rèn)類別之外的結(jié)果頁面卡片,按照各類別含有結(jié)果數(shù)量由大到小的順序進(jìn)行排列。
[0051]進(jìn)一步地,上述檢索方法還包括以下步驟:
[0052]對所述關(guān)鍵詞屬性表中本草、方劑、病癥和癥狀對應(yīng)的關(guān)鍵詞進(jìn)行添加或更新;和/或
[0053]創(chuàng)建或更新所述知識單元數(shù)據(jù)庫中的知識單元,并更新所述索引表。
[0054]本發(fā)明通過對用戶提供的一組關(guān)鍵詞進(jìn)行分析和處理,推測用戶的檢索意圖,并依據(jù)推測結(jié)果恰當(dāng)?shù)亟M織檢索結(jié)果,更好地滿足用戶的檢索期望,提高檢索結(jié)果的準(zhǔn)確度。
【專利附圖】
【附圖說明】
[0055]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0056]圖1為本發(fā)明一個實施例的針對中醫(yī)藥學(xué)信息的檢索方法流程圖;
[0057]圖2為本發(fā)明一個實施例的針對中醫(yī)藥學(xué)信息的檢索系統(tǒng)模塊圖。
【具體實施方式】
[0058]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有付出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
[0059]圖1為本發(fā)明一個實施例的針對中醫(yī)藥學(xué)信息的檢索方法流程圖;如圖所示,該檢索方法包括以下步驟:
[0060]S110,在關(guān)鍵詞屬性表中,查詢用戶提供的一組檢索詞中每一個檢索詞的屬性類型,其中,所述關(guān)鍵詞屬性表中的每條結(jié)構(gòu)化信息包括關(guān)鍵詞及其對應(yīng)的屬性類別,所述屬性類型包括本草、方劑、病癥和癥狀;
[0061]例如,假設(shè)用戶輸入的該組檢索詞為K= [I^k2,…,km],在關(guān)鍵詞屬性表中查詢到的K中每一個檢索詞匕的屬性類型T(ki) e P,其中,m、i為自然數(shù),I彡i彡m,P = {本草,方劑,病癥,癥狀}。
[0062]S120,按照屬性類型對該組檢索詞進(jìn)行聚類,將屬性類型相同的檢索詞歸為一類,根據(jù)該組檢索詞中占比最大的檢索詞類別確定用戶的檢索意圖;其中,如果占比最大的檢索詞類別存在多個,則按照本草 > 方劑 > 病癥 > 癥狀的優(yōu)先級順序確定用戶的檢索意圖。
[0063]例如,按照屬性類型對該組檢索詞K進(jìn)行聚類,得到Kt = {kj [ T (kj) = t,j為自然數(shù),I ( j ( m},其中t e P ;
[0064]用p表示聚類后占比最大的檢索詞類別,即I夂=根據(jù)|κρ|和P的取值確定用戶的檢索意圖:
[0065]情況C1:如果|κρ| > I且P為本草,則推測用戶的主要檢索目標(biāo)為方劑;
[0066]情況C2:如果|κρ| > I且P為癥狀,則推測用戶的主要檢索目標(biāo)為病癥;
[0067]情況C3:除C1和C2之外的情況,推測用戶的主要檢索目標(biāo)為類別為P的信息單元。
[0068]S130,根據(jù)該組檢索詞查詢索引表和知識單元數(shù)據(jù)庫,得到匹配結(jié)果集,并將所述匹配結(jié)果集按照屬性類別進(jìn)行分類,根據(jù)用戶的檢索意圖向用戶返回相應(yīng)屬性類別的匹配結(jié)果,其中,所述知識單元數(shù)據(jù)庫用于存儲知識單元,所述知識單元包含信息內(nèi)容和信息所屬類別,所述索引表是對所述知識單元數(shù)據(jù)庫內(nèi)的每一個知識單元進(jìn)行切詞后建立的倒排索引,給定一個詞W,能夠通過查詢該索引表得到知識單元數(shù)據(jù)庫中所有包含W的知識單元的索引位置集。
[0069]例如,根據(jù)該組檢索詞查詢索引表和知識單元數(shù)據(jù)庫,得到匹配結(jié)果集R= Ir [3:kj e K,使得a (r) e I(Kj)K其中a (r)表示信息單元r在知識單元數(shù)據(jù)庫中的索引位置,I (Kj)表示檢索詞h在索引表中對應(yīng)的包含h的信息單元的索引位置集;
[0070]將R中的匹配結(jié)果按照屬性類別進(jìn)行分類,得到Rt = Irl β (r) = t, r e R},其中t e P ;
[0071]根據(jù)所確定的用戶檢索意圖,向用戶返回如下結(jié)果頁面的各個卡片:
[0072]對于情況C1,將方劑類結(jié)果作為默認(rèn)類別的結(jié)果頁面卡片;
[0073]對于情況C2,將病癥類結(jié)果作為默認(rèn)類別的結(jié)果頁面卡片;
[0074]對于情況C3,將屬性類別為P的結(jié)果頁面作為默認(rèn)類別的結(jié)果頁面卡片;
[0075]對于默認(rèn)類別之外的結(jié)果頁面卡片,按照各類別含有結(jié)果數(shù)量由大到小的順序進(jìn)行排列。
[0076]此外,上述檢索方法還包括以下步驟:
[0077]對所述關(guān)鍵詞屬性表中本草、方劑、病癥和癥狀對應(yīng)的關(guān)鍵詞進(jìn)行添加或更新;和/或
[0078]創(chuàng)建或更新所述知識單元數(shù)據(jù)庫中的知識單元,并更新所述索引表。
[0079]與上述方法實施例相對應(yīng),以下為本發(fā)明的針對中醫(yī)藥學(xué)信息的檢索系統(tǒng)實施例,該檢索系統(tǒng)包括:
[0080]屬性查詢模塊,用于在關(guān)鍵詞屬性表中,查詢用戶提供的一組檢索詞中每一個檢索詞的屬性類型,其中,所述關(guān)鍵詞屬性表中的每條結(jié)構(gòu)化信息包括關(guān)鍵詞及其對應(yīng)的屬性類別,所述屬性類型包括本草、方劑、病癥和癥狀;
[0081]意圖推測模塊,用于按照查詢得到的屬性類型對該組檢索詞進(jìn)行聚類,將屬性類型相同的檢索詞歸為一類,根據(jù)該組檢索詞中占比最大的檢索詞類別確定用戶的檢索意圖;
[0082]結(jié)果返回模塊,用于根據(jù)該組檢索詞查詢索引表和知識單元數(shù)據(jù)庫,得到匹配結(jié)果集,并將所述匹配結(jié)果集按照屬性類別進(jìn)行分類,根據(jù)用戶的檢索意圖向用戶返回相應(yīng)屬性類別的匹配結(jié)果,其中,所述知識單元數(shù)據(jù)庫用于存儲知識單元,所述知識單元包含信息內(nèi)容和信息所屬類別,所述索引表是對所述知識單元數(shù)據(jù)庫內(nèi)的每一個知識單元進(jìn)行切詞后建立的倒排索引。
[0083]其中,如果占比最大的檢索詞類別存在多個,則按照本草 > 方劑> 病癥 > 癥狀的優(yōu)先級順序確定用戶的檢索意圖。
[0084]例如,所述意圖推測模塊可以包括:
[0085]聚類單元,按照屬性類型對該組檢索詞進(jìn)行聚類,得到Kt = {kj [ T(kj) = t,j為自然數(shù),m},其中假設(shè)用戶輸入的該組檢索詞為K = [k1; k2,…,km],在關(guān)鍵詞屬性表中查詢到的K中每一個檢索詞Ici的屬性類型TCO e P,其中,t e P,m、i為自然數(shù),
I^ i ^ m, P = {本草,方劑,病癥,癥狀};
[0086]意圖推測單元,用P表示聚類后占比最大的檢索詞類別,即N =,根據(jù)Kp和P的取值確定用戶的檢索意圖:
[0087]情況C1:如果|κρ| > I且P為本草,則推測用戶的主要檢索目標(biāo)為方劑;
[0088]情況C2:如果|κρ| > I且P為癥狀,則推測用戶的主要檢索目標(biāo)為病癥;
[0089]情況C3:除C1和C2之外的情況,推測用戶的主要檢索目標(biāo)為類別為P的信息單元。
[0090]例如,所述結(jié)果返回模塊可以包括:
[0091]結(jié)果查詢單元,用于根據(jù)該組檢索詞查詢索引表和知識單元數(shù)據(jù)庫,得到匹配結(jié)果集R= Ir [ 3 kj e K,使得a (r) e I (K」)},其中a (r)表示信息單元r在知識單元數(shù)據(jù)庫中的索引位置,I og表示檢索詞h在索引表中對應(yīng)的包含h的信息單元的索引位置集;
[0092]分類單元,用于將R中的匹配結(jié)果按照屬性類別進(jìn)行分類,得到Rt = Ir I β (r)=t,r e R},其中 t e P ;
[0093]結(jié)果返回單元,用于根據(jù)所確定的用戶檢索意圖,向用戶返回如下結(jié)果頁面的各個卡片:
[0094]對于情況C1,將方劑類結(jié)果作為默認(rèn)類別的結(jié)果頁面卡片;
[0095]對于情況C2,將病癥類結(jié)果作為默認(rèn)類別的結(jié)果頁面卡片;
[0096]對于情況C3,將屬性類別為P的結(jié)果頁面作為默認(rèn)類別的結(jié)果頁面卡片;
[0097]對于默認(rèn)類別之外的結(jié)果頁面卡片,按照各類別含有結(jié)果數(shù)量由大到小的順序進(jìn)行排列。
[0098]此外,上述檢索系統(tǒng)還可以包括:
[0099]更新模塊,用于添加或更新所述關(guān)鍵詞屬性表中本草、方劑、病癥和癥狀對應(yīng)的關(guān)鍵詞,以及創(chuàng)建或更新所述知識單元數(shù)據(jù)庫中的知識單元,并更新所述索引表。
[0100]本發(fā)明的上述檢索系統(tǒng)和方法通過對用戶提供的一組關(guān)鍵詞進(jìn)行分析和處理,推測用戶的檢索意圖,并依據(jù)推測結(jié)果恰當(dāng)?shù)亟M織檢索結(jié)果,更好地滿足用戶的檢索期望,提高檢索結(jié)果的準(zhǔn)確度。
[0101]本領(lǐng)域普通技術(shù)人員可以理解:附圖只是一個實施例的示意圖,附圖中的模塊或流程并不一定是實施本發(fā)明所必須的。
[0102]本領(lǐng)域普通技術(shù)人員可以理解:實施例中的裝置中的模塊可以按照實施例描述分布于實施例的裝置中,也可以進(jìn)行相應(yīng)變化位于不同于本實施例的一個或多個裝置中。上述實施例的模塊可以合并為一個模塊,也可以進(jìn)一步拆分成多個子模塊。
[0103]最后應(yīng)說明的是:以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述實施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明實施例技術(shù)方案的精神和范圍。
【權(quán)利要求】
1.一種針對中醫(yī)藥學(xué)信息的檢索系統(tǒng),其特征在于,包括: 屬性查詢模塊,用于在關(guān)鍵詞屬性表中,查詢用戶提供的一組檢索詞中每一個檢索詞的屬性類型,其中,所述關(guān)鍵詞屬性表中的每條結(jié)構(gòu)化信息包括關(guān)鍵詞及其對應(yīng)的屬性類另IJ,所述屬性類型包括本草、方劑、病癥和癥狀; 意圖推測模塊,用于按照查詢得到的屬性類型對該組檢索詞進(jìn)行聚類,將屬性類型相同的檢索詞歸為一類,根據(jù)該組檢索詞中占比最大的檢索詞類別確定用戶的檢索意圖;結(jié)果返回模塊,用于根據(jù)該組檢索詞查詢索引表和知識單元數(shù)據(jù)庫,得到匹配結(jié)果集,并將所述匹配結(jié)果集按照屬性類別進(jìn)行分類,根據(jù)用戶的檢索意圖向用戶返回相應(yīng)屬性類別的匹配結(jié)果,其中,所述知識單元數(shù)據(jù)庫用于存儲知識單元,所述知識單元包含信息內(nèi)容和信息所屬類別,所述索引表是對所述知識單元數(shù)據(jù)庫內(nèi)的每一個知識單元進(jìn)行切詞后建立的倒排索引。
2.根據(jù)權(quán)利要求1所述的檢索系統(tǒng),其特征在于,如果占比最大的檢索詞類別存在多個,則按照本草>方劑>病癥>癥狀的優(yōu)先級順序確定用戶的檢索意圖。
3.根據(jù)權(quán)利要求1所述的檢索系統(tǒng),其特征在于,所述意圖推測模塊包括: 聚類單元,按照屬性類型對該組檢索詞進(jìn)行聚類,得到Kt= {kj [ T(kj) =t,j為自然數(shù),I彡j彡m},其中假設(shè)用戶輸入的該組檢索詞為K = [k1; k2,…,km],在關(guān)鍵詞屬性表中查詢到的K中每一個檢索詞Iii的屬性類型T (Iii) £?,其中3£?,!11、1為自然數(shù),P = {本草,方劑,病癥,癥狀}; 意圖推測單元,用P表示聚類后占比最大的檢索詞類別,即I;I 二1},根據(jù)I kP I和P的取值確定用戶的檢索意圖: 情況c1:如果|κρ| > I且P為本草,則推測用戶的主要檢索目標(biāo)為方劑; 情況c2:如果|κρ| > I且1)為癥狀,則推測用戶的主要檢索目標(biāo)為病癥; 情況C3:除C1和C2之外的情況,推測用戶的主要檢索目標(biāo)為類別為P的信息單元。
4.根據(jù)權(quán)利要求3所述的檢索系統(tǒng),其特征在于,所述結(jié)果返回模塊包括: 結(jié)果查詢單元,用于根據(jù)該組檢索詞查詢索引表和知識單元數(shù)據(jù)庫,得到匹配結(jié)果集R=Ir [ 3 kj e K,使得a (r) e I (K」)},其中a (r)表示信息單元r在知識單元數(shù)據(jù)庫中的索引位置,I (Kj)表示檢索詞h在索引表中對應(yīng)的包含h的信息單元的索引位置集;分類單元,用于將R中的匹配結(jié)果按照屬性類別進(jìn)行分類,得到Rt = {r| β (r)=t,r e R},其中 t e P ; 結(jié)果返回單元,用于根據(jù)所確定的用戶檢索意圖,向用戶返回如下結(jié)果頁面的各個卡片: 對于情況C1,將方劑類結(jié)果作為默認(rèn)類別的結(jié)果頁面卡片; 對于情況C2,將病癥類結(jié)果作為默認(rèn)類別的結(jié)果頁面卡片; 對于情況C3,將屬性類別為P的結(jié)果頁面作為默認(rèn)類別的結(jié)果頁面卡片; 對于默認(rèn)類別之外的結(jié)果頁面卡片,按照各類別含有結(jié)果數(shù)量由大到小的順序進(jìn)行排列。
5.根據(jù)權(quán)利要求1所述的檢索系統(tǒng),其特征在于,還包括: 更新模塊,用于添加或更新所述關(guān)鍵詞屬性表中本草、方劑、病癥和癥狀對應(yīng)的關(guān)鍵詞,以及創(chuàng)建或更新所述知識單元數(shù)據(jù)庫中的知識單元,并更新所述索引表。
6.一種針對中醫(yī)藥學(xué)信息的檢索方法,其特征在于,包括以下步驟: 在關(guān)鍵詞屬性表中,查詢用戶提供的一組檢索詞中每一個檢索詞的屬性類型,其中,所述關(guān)鍵詞屬性表中的每條結(jié)構(gòu)化信息包括關(guān)鍵詞及其對應(yīng)的屬性類別,所述屬性類型包括本草、方劑、病癥和癥狀; 按照屬性類型對該組檢索詞進(jìn)行聚類,將屬性類型相同的檢索詞歸為一類,根據(jù)該組檢索詞中占比最大的檢索詞類別確定用戶的檢索意圖; 根據(jù)該組檢索詞查詢索引表和知識單元數(shù)據(jù)庫,得到匹配結(jié)果集,并將所述匹配結(jié)果集按照屬性類別進(jìn)行分類,根據(jù)用戶的檢索意圖向用戶返回相應(yīng)屬性類別的匹配結(jié)果,其中,所述知識單元數(shù)據(jù)庫用于存儲知識單元,所述知識單元包含信息內(nèi)容和信息所屬類別,所述索引表是對所述知識單元數(shù)據(jù)庫內(nèi)的每一個知識單元進(jìn)行切詞后建立的倒排索引。
7.根據(jù)權(quán)利要求6所述的檢索方法,其特征在于,如果占比最大的檢索詞類別存在多個,則按照本草>方劑>病癥>癥狀的優(yōu)先級順序確定用戶的檢索意圖。
8.根據(jù)權(quán)利要求6所述的檢索方法,其特征在于,所述按照屬性類型對該組檢索詞進(jìn)行聚類,將屬性類型相同的檢索詞歸為一類,根據(jù)該組檢索詞中占比最大的檢索詞類別確定用戶的檢索意圖步驟包括: 假設(shè)用戶輸入的該組檢索詞為K = [k1; k2,…,km],在關(guān)鍵詞屬性表中查詢到的K中每一個檢索詞h的屬性類型T (Iii) e P,其中,m、i為自然數(shù),I彡i彡m,P = {本草,方劑,病癥,癥狀}; 按照屬性類型對該組檢索詞進(jìn)行聚類,得到Kt = {kj [ T(kj) =t,j為自然數(shù),I^ j ^ m},其中 t e P ; 用P表示聚類后占比最大的檢索詞類別,即丨Kll,根據(jù)IKpI和P的取值確定用戶的檢索意圖: 情況C1:如果IkpI > I且P為本草,則推測用戶的主要檢索目標(biāo)為方劑; 情況c2:如果|κρ| > I且P為癥狀,則推測用戶的主要檢索目標(biāo)為病癥; 情況C3:除C1和C2之外的情況,推測用戶的主要檢索目標(biāo)為類別為P的信息單元。
9.根據(jù)權(quán)利要求8所述的檢索方法,其特征在于,所述根據(jù)該組檢索詞查詢索引表和知識單元數(shù)據(jù)庫,得到匹配結(jié)果集,并將所述匹配結(jié)果集按照屬性類別進(jìn)行分類,根據(jù)用戶的檢索意圖向用戶返回相應(yīng)屬性類別的匹配結(jié)果步驟包括: 根據(jù)該組檢索詞查詢索引表和知識單元數(shù)據(jù)庫,得到匹配結(jié)果集R= Ir [ B kj e K,使得a (r) e I(Kj)K其中a (r)表示信息單元r在知識單元數(shù)據(jù)庫中的索引位置,I(Kj)表示檢索詞h在索引表中對應(yīng)的包含h的信息單元的索引位置集; 將R中的匹配結(jié)果按照屬性類別進(jìn)行分類,得到Rt = {r| β (r) = t, r e R},其中t e P ; 根據(jù)所確定的用戶檢索意圖,向用戶返回如下結(jié)果頁面的各個卡片: 對于情況C1,將方劑類結(jié)果作為默認(rèn)類別的結(jié)果頁面卡片; 對于情況C2,將病癥類結(jié)果作為默認(rèn)類別的結(jié)果頁面卡片; 對于情況C3,將屬性類別為P的結(jié)果頁面作為默認(rèn)類別的結(jié)果頁面卡片; 對于默認(rèn)類別之外的結(jié)果頁面卡片,按照各類別含有結(jié)果數(shù)量由大到小的順序進(jìn)行排列。
10.根據(jù)權(quán)利要求6所述的檢索方法,其特征在于,還包括以下步驟: 對所述關(guān)鍵詞屬性表中本草、方劑、病癥和癥狀對應(yīng)的關(guān)鍵詞進(jìn)行添加或更新;和/或 創(chuàng)建或更新所述知識單元數(shù)據(jù)庫中的知識單元,并更新所述索引表。
【文檔編號】G06F17/30GK104199855SQ201410397651
【公開日】2014年12月10日 申請日期:2014年8月13日 優(yōu)先權(quán)日:2014年8月13日
【發(fā)明者】唐力, 王和平, 周晉, 黃權(quán) 申請人:王和平