一種基于本體匹配的語義查詢方法
【專利摘要】本發(fā)明公開了一種基于本體匹配的語義查詢方法,屬于計算機應用【技術領域】。本方法先計算本體資源的名稱、注釋與用戶輸入字符串的語義相似度,然后分別將本體類、本體個體、本體屬性與用戶輸入字符串的語義相似度按從大到小排序,選出最符合用戶查詢要求的不超過λ*3個本體資源。本方法能夠在語義層面進行檢索,捕捉設計人員檢索意圖,提高系統(tǒng)檢索效率。
【專利說明】—種基于本體匹配的語義查詢方法
【技術領域】
[0001]本發(fā)明涉及一種基于本體匹配的語義查詢方法,屬于計算機應用【技術領域】。
【背景技術】
[0002]隨著網絡技術、通訊技術的飛速發(fā)展,人們可以接觸到的信息呈爆炸式增長,引發(fā)了信息過載、檢索負荷加重等問題,急需的知識通常被實際不需要的信息垃圾淹沒。而世界經濟正由工業(yè)經濟向知識經濟轉變,知識正在逐漸取代貨幣資本、勞動力和原材料等有形資源成為經濟增長中的關鍵性生產要素,知識成為具有經濟價值的稀缺性資源。人們需要更準確、快速、方便地查詢所需的信息、知識,以便更加科學、快速地應用知識指導生活和生產。
[0003]語義查詢技術是對傳統(tǒng)信息查詢的改進,它更關注信息的含義,而不停留在其表層文本上,可以克服基于關鍵詞的信息查詢的弊端?,F(xiàn)有語義查詢技術研究大多將本體及相關技術作為語義查詢的重要基礎,大多實現(xiàn)了領域本體的構建及基本推理,但對本體類、實例、屬性之間的關系考慮不足,在某些領域需要充分挖掘類、實例和屬性之間的語義關聯(lián)。本體通過對領域概念和概念之間關系的嚴格定義來確定概念的精確含義,為信息查詢提供語義支持。
【發(fā)明內容】
[0004]本發(fā)明的目的是為解決如何根據用戶關鍵詞從知識庫中查詢出檢索結果的問題,提出一種基于本體匹配的語義查詢方法。本方法能夠在語義層面進行檢索,捕捉設計人員檢索意圖,提高系統(tǒng)檢索效率。
[0005]為實現(xiàn)上述目的,本發(fā)明所采用的技術方案如下:
[0006]步驟一、設置一個閾值λ,`本發(fā)明中最終返回的本體類、本體個體、本體屬性個數都不超過入;
[0007]步驟二、設置一個相似度閾值σ,本發(fā)明中最終返回的本體類、本體個體、本體屬性與用戶輸入的字符串的相似度都不低于σ ;
[0008]步驟三、設定一個相近詞對閾值Θ,提取含X個詞語的句子S1與含y個詞語的句子S2的相近詞對時,先依次計算句子S1中每個詞語與句子S2中每個詞語的語義相似度,構成X*y的相似度矩陣S [x*y],再將相似度從大到小并且相似度不小于閾值Θ的詞對設置為相近詞對,每提取一個相近詞對,則將相似度矩陣中其所對應的行和列的值都置為O ;
[0009]步驟三、獲取本體類列表1OntClass1, OntClass2,..., OntClass1I ,其中 OntClassi(1^1^ I)代表一個本體類,I為正整數,表示含有I個本體類classList是一個鏈表,其結點是一個這樣的二元組:< OntClassi, Simi >,其中OntClassi是一個本體類,Simi是這個本體類與用戶輸入的字符串string的相似度,classList的初始大小為O ;
[0010]步驟四、對每一個OntClassi, I ^ i ^ I執(zhí)行以下步驟:
[0011](I)計算關鍵詞與本體類名稱的相似度SimNamei:[0012]
【權利要求】
1.一種基于本體匹配的語義查詢方法,其特征在于: 步驟一、設置一個閾值λ,本發(fā)明中最終返回的本體類、本體個體、本體屬性個數都不超過λ ; 步驟二、設置一個相似度閾值σ,本發(fā)明中最終返回的本體類、本體個體、本體屬性與用戶輸入的字符串的相似度都不低于σ ; 步驟三、設定一個相近詞對閾值Θ,提取含有X個詞語的句子S1與含有y個詞語的句子S2的相近詞對時,先依次計算句子S1中每個詞語與句子S2中每個詞語的語義相似度,構成x*y的相似度矩陣s [x*y],再將相似度從大到小并且相似度不小于閾值Θ的詞對設置為相近詞對,每提取一個相近詞對,則將相似度矩陣中其所對應的行和列的值都置為O ;
步驟三、獲取本體類列表 IOntClass1, OntClass2,..., OntClass1I ,其中 OntClassi 代表一個本體類,(I ≤ i ≤ 1)1為正整數,表示含有I個本體類;claSSLiSt是一個鏈表,其結點是一個這樣的二元組:< OntClassi, Simi >,其中OntClassi是一個本體類,Simi是這個本體類與用戶輸入的字符串string的相似度,classList的初始大小為O ; 步驟四、對每一個OntClassi, I ≤ i ≤ I執(zhí)行以下步驟:
【文檔編號】G06F17/30GK103744955SQ201410004084
【公開日】2014年4月23日 申請日期:2014年1月4日 優(yōu)先權日:2014年1月4日
【發(fā)明者】黃河燕, 史樹敏, 蘇超, 馮沖, 李侃 申請人:北京理工大學