国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于圖模型的描述邏輯EL本體并行推理方法與流程

      文檔序號:11262181閱讀:478來源:國知局
      一種基于圖模型的描述邏輯EL本體并行推理方法與流程

      本發(fā)明屬于計算機軟件技術(shù)領(lǐng)域,具體涉及邏輯語言在知識庫上的應(yīng)用與技術(shù)。



      背景技術(shù):

      owl本體作為目前較流行的知識庫形式,受到各個領(lǐng)域科學(xué)家的關(guān)注與研究。描述邏輯el是用來構(gòu)建owl本體的一種邏輯語言。近年來,el因其較充分的表達能力以及較低的計算復(fù)雜度,受到科研人員和工業(yè)界的重視。例如,gene項目以及snomedct項目都采用了el作為底層的數(shù)據(jù)建模語言。近來,el還被用于交通領(lǐng)域本體的構(gòu)建,應(yīng)用在交通阻塞診斷等場景中。

      在描述邏輯el中,基本的組成元素是概念和角色。概念用來描述一個類別,比如“疾病”這個類別;角色用來描述一個關(guān)系,比如“位于”。一個概念按照如下語法規(guī)則構(gòu)成:

      其中,a表示一個原子概念,t表示頂概念,原子概念與頂概念統(tǒng)稱為基本概念,r表示一個原子角色,c和d表示基于原子概念和頂概念迭代構(gòu)造得到的概念。一個el本體是如下公理的集合:形如的概念包含公理,描述概念c包含于概念d;形如的角色包含公理,其中表示角色的復(fù)合,描述復(fù)合角色包含于角色r。

      為了方便處理,一個el本體通常首先被轉(zhuǎn)化為其規(guī)范化形式。在一個規(guī)范化的el本體中,所有的概念包含公理都必須是如下幾種形式之一:其中a和b是基本概念,r是角色;所有的角色包含公理都必須是如下兩種形式之一:badder等人提出了一個可以在線性時間內(nèi)結(jié)束的對el本體進行規(guī)范化的方法,該方法被應(yīng)用在本發(fā)明的規(guī)范化處理階段。

      推理技術(shù)在本體應(yīng)用中起到了非常重要的作用,如優(yōu)化查詢,輔助本體調(diào)試等。el的核心推理任務(wù)是“本體分類”,即計算本體中概念之間的層次包含關(guān)系。在現(xiàn)有el推理方法中,cel推理機是第一個針對el開發(fā)的串行推理機,然而在處理較大規(guī)模本體時cel表現(xiàn)不佳;牛津大學(xué)開發(fā)的elk推理機首次采用多核并行技術(shù),但是elk受限于單臺機器內(nèi)存容量,其可擴展性受到約束;美國懷特大學(xué)和東南大學(xué)合作研究了基于mapreduce模型的并行推理技術(shù),該技術(shù)因為大量的冗余計算以及具體計算框架的i/o開銷導(dǎo)致推理效率低下。



      技術(shù)實現(xiàn)要素:

      技術(shù)問題:為克服現(xiàn)有el推理技術(shù)的缺點,本發(fā)明提出一種基于圖模型的el并行推理方法,該方法利用并行技術(shù)處理大規(guī)模本體推理,同時基于圖模型實現(xiàn)平臺無關(guān)的特性,使得并行推理的效率不會受到特定計算平臺的限制。

      技術(shù)方案:本發(fā)明的基于圖模型的描述邏輯el本體并行推理方法,包括如下步驟:

      1)根據(jù)給定的el本體做規(guī)范化處理,并將規(guī)范化后的本體轉(zhuǎn)換成語義等價的有向圖

      2)將所述步驟1)轉(zhuǎn)化得到的有向圖做并行化存儲,并同步到并行計算平臺;

      3)利用并行計算平臺的超步完成推理過程的迭代,分別為:請求、應(yīng)答、推理、加邊;迭代后有向圖完成更新,所述超步為針對不同平臺的宏操作;

      4)最后,將完成更新的有向圖逆向轉(zhuǎn)換為新的el本體作為結(jié)果輸出。

      進一步的,本發(fā)明方法中,步驟1)的具體流程如下:

      11)將給定的el本體做規(guī)范化:所有的“概念包含公理”規(guī)范化為以下四種形式之一:其中a和b是基本概念,r是角色;所有的“角色包含公理”規(guī)范化成如下兩種形式之一:所述“概念包含公理”描述概念之間的包含關(guān)系,所述“角色包含公理”描述角色之間的包含關(guān)系;

      12)將規(guī)范化后的el本體利用如下規(guī)則轉(zhuǎn)換成語義等價的有向圖

      轉(zhuǎn)換過程具體為:利用轉(zhuǎn)化規(guī)則(t1)針對中每一個形如的公理,添加一條從頂點a指向頂點b的邊到有向圖中,且邊的標簽為利用規(guī)則(t2)針對中每一個形如的公理,添加一條從頂點a1指向頂點b的邊以及一條從頂點a2指向頂點b的邊到有向圖中,且兩條邊的標簽分別為利用規(guī)則(t3)針對中每一個形如的公理,添加一條從頂點a指向頂點b的邊到有向圖中,且邊的標簽為′+r′;利用規(guī)則(t4)針對中每一個形如的公理,添加一條從頂點a指向頂點b的邊到有向圖中,且邊的標簽為′-r′;利用規(guī)則(t5)針對中每一個形如的公理,添加一條從頂點r指向頂點s的邊到有向圖中,且邊的標簽為利用規(guī)則(t6)針對中每一個形如的公理,添加一條從頂點r指向頂點t的邊以及一條從頂點s指向頂點t的邊到有向圖中,且兩條邊的標簽分別為

      進一步的,本發(fā)明方法中,步驟4)中利用轉(zhuǎn)換規(guī)則(t1-t6)的可逆性,將有向圖每一條邊通過(t1-t6)對應(yīng)的規(guī)則逆向轉(zhuǎn)換為el中的公理,即得到新的el本體

      進一步的,本發(fā)明方法中,步驟2)中的有向圖并行化存儲是基于平臺無關(guān)模型設(shè)計的,具體過程為:

      41)利用平臺的“轉(zhuǎn)譯超步”將有向圖轉(zhuǎn)譯為底層平臺的數(shù)據(jù)結(jié)構(gòu);

      42)利用平臺的“存儲超步”將轉(zhuǎn)譯后的有向圖同步存儲到平臺的文件系統(tǒng)中。

      進一步的,本發(fā)明方法中,步驟41)中的“轉(zhuǎn)譯超步”與42)中的“存儲超步”是并行計算平臺的宏操作,對上層應(yīng)用屏蔽底層平臺的具體實現(xiàn)。

      進一步的,本發(fā)明方法中,步驟3)基于“不動點原則”完成,當沒有新的邊添加至有向圖時,即完成有向圖的更新。

      進一步的,本發(fā)明方法中,步驟3)的具體流程如下:

      31)初始化:遍歷有向圖的所有頂點a,在有向圖中加入邊

      32)請求:遍歷有向圖中的所有頂點a,針對頂點a的每一條出邊e,根據(jù)如下規(guī)則r1-r7向有向圖中的其它頂點發(fā)送消息以請求頂點a所需要的信息:

      請求過程具體為:根據(jù)規(guī)則r1,請求返回有向圖中形如的邊;根據(jù)規(guī)則r2,請求返回有向圖中形如的邊;根據(jù)規(guī)則r3,請求返回有向圖中形如及e+r(b,c)的邊;根據(jù)規(guī)則r4,請求返回有向圖中形如及e-r(b,c)的邊;根據(jù)規(guī)則r5,請求返回有向圖中形如e+r(a,b)及e-r(b,c)的邊;根據(jù)規(guī)則r6,請求返回有向圖中形如e+r(a,b)及的邊;根據(jù)規(guī)則r6,請求返回有向圖中形如e+r(a,b)及e+s(b,c)的邊;

      33)應(yīng)答:有向圖中的其它頂點返回頂點a所需要的信息;

      34)推理:根據(jù)所述步驟33)返回的信息,針對頂點a進行推理,得到相應(yīng)結(jié)論,推理過程具體為:根據(jù)規(guī)則r1,若有向圖中不存在推理得出結(jié)論根據(jù)規(guī)則r2,若有向圖中不存在推理得出結(jié)論根據(jù)規(guī)則r3,若有向圖中不存在e+r(a,c),推理得出結(jié)論e+r(a,c);根據(jù)規(guī)則r4,若有向圖中不存在e-r(a,c),推理得出結(jié)論e-r(a,c);根據(jù)規(guī)則r5,若有向圖中不存在推理得出結(jié)論根據(jù)規(guī)則r6,若有向圖中不存在e+s(a,b),推理得出結(jié)論e+s(a,b);根據(jù)規(guī)則r7,若有向圖中不存在e+t(a,c),推理得出結(jié)論e+t(a,c);

      35)加邊:將所述步驟34)中的推理結(jié)論作為新的邊加入到有向圖中。

      規(guī)范化的el本體因其形式簡單,從而有利于并行化處理,因此本發(fā)明也引入規(guī)范化技術(shù)。另外,圖結(jié)構(gòu)具有“信息相鄰”的特性,即圖中的頂點所表達的信息僅與出邊,入邊以及相鄰頂點相關(guān),與其他頂點和邊不相關(guān)。該特性使得圖結(jié)構(gòu)被廣泛用于并行數(shù)據(jù)處理任務(wù)及平臺中,如neo4j圖數(shù)據(jù)處理系統(tǒng),以及谷歌的pregel并行圖數(shù)據(jù)處理平臺。因此,本發(fā)明將規(guī)范化的el本體進一步轉(zhuǎn)換為結(jié)構(gòu)簡單的含標記有向圖由于語義等價性,有向圖可以等價地表達本體中的概念和角色的包含關(guān)系。另外,由于有向圖的“信息相鄰”的特性,為進一步給出并行推理過程以及引入平臺無關(guān)模型打下基礎(chǔ)。

      步驟1)中的規(guī)范化處理以及將規(guī)范化后的本體轉(zhuǎn)換成語義等價的有向圖,具體流程如下:

      11)將給定的el本體做規(guī)范化:所有的“概念包含公理”規(guī)范化為以下四種形式之一:其中a和b是基本概念,r是角色;所有的“角色包含公理”規(guī)范化成如下兩種形式之一:所述“概念包含公理”描述概念之間的包含關(guān)系,所述“角色包含公理”描述角色之間的包含關(guān)系;

      12)將規(guī)范化后的el本體利用如下規(guī)則轉(zhuǎn)換成語義等價的有向圖

      轉(zhuǎn)換過程具體為:利用轉(zhuǎn)化規(guī)則(t1)針對中每一個形如的公理,添加一條從頂點a指向頂點b的邊到有向圖中,且邊的標簽為利用規(guī)則(t2)針對中每一個形如的公理,添加一條從頂點a1指向頂點b的邊以及一條從頂點a2指向頂點b的邊到有向圖中,且兩條邊的標簽分別為利用規(guī)則(t3)針對中每一個形如的公理,添加一條從頂點a指向頂點b的邊到有向圖中,且邊的標簽為′+r′;;利用規(guī)則(t4)針對中每一個形如的公理,添加一條從頂點a指向頂點b的邊到有向圖中,且邊的標簽為′-r′利;利用規(guī)則(t5)針對中每一個形如的公理,添加一條從頂點r指向頂點s的邊到有向圖中,且邊的標簽為利;利用規(guī)則(t6)針對中每一個形如的公理,添加一條從頂點r指向頂點t的邊以及一條從頂點s指向頂點t的邊到有向圖中,且兩條邊的標簽分別為

      如背景技術(shù)所述,已有推理機是基于特定的計算平臺設(shè)計的,如多核多線程平臺,mapreduce平臺等。這使得推理機受到特定平臺的限制,無法根據(jù)不同需求進行移植,并且影響推理效率。為解決該問題,本發(fā)明引入平臺無關(guān)模型,以消除特定平臺帶來的影響,方便推理機在不同平臺進行移植,并且可以兼顧不同平臺的特點達到推理效率最優(yōu)的目的。

      步驟2)中對有向圖進行并行化存儲是基于平臺無關(guān)模型設(shè)計的,具體過程為:首先,利用平臺的“轉(zhuǎn)譯超步”將有向圖轉(zhuǎn)譯為底層平臺的數(shù)據(jù)結(jié)構(gòu);其次,利用平臺的“存儲超步”將轉(zhuǎn)譯后的有向圖存儲到平臺的文件系統(tǒng)中。上述步驟中的“轉(zhuǎn)譯超步”與“存儲超步”是并行計算平臺的宏操作,對上層應(yīng)用屏蔽底層平臺的具體實現(xiàn)。

      并行化存儲后進行并行推理。由于平臺無關(guān)模型的引入,本發(fā)明通過不同平臺抽象出的統(tǒng)一宏操作來完成推理方法的設(shè)計,并行平臺上的宏操作被稱為“超步”。推理方法的具體設(shè)計思路如下:推理任務(wù)通過有向圖上的操作完成,這些操作被上的進一步映射到平臺的超步。

      步驟3)利用并行計算平臺的超步完成推理過程的迭代,涉及到的超步為:請求、應(yīng)答、推理、加邊;迭代后完成有向圖的更新,具體流程如下:

      31)初始化:程序遍歷有向圖的所有頂點a,在中加入邊

      32)請求:程序遍歷有向圖中的所有頂點a,針對頂點a的每一條出邊e,根據(jù)如下規(guī)則r1-r7向有向圖中的其它頂點發(fā)送消息以請求頂點a所需要的信息:

      請求過程具體為:根據(jù)規(guī)則r1,請求返回有向圖中形如的邊;根據(jù)規(guī)則r2,請求返回有向圖中形如的邊;根據(jù)規(guī)則r3,請求返回有向圖中形如及e+r(b,c)的邊;根據(jù)規(guī)則r4,請求返回有向圖中形如及e-r(b,c)的邊;根據(jù)規(guī)則r5,請求返回有向圖中形如e+r(a,b)及e-r(b,c)的邊;根據(jù)規(guī)則r6,請求返回有向圖中形如e+r(a,b)及的邊;根據(jù)規(guī)則r6,請求返回有向圖中形如e+r(a,b)及e+s(b,c)的邊;

      33)應(yīng)答:有向圖中的其它頂點返回頂點a所需要的信息;

      34)推理:根據(jù)所述步驟33)返回的信息,程序針對頂點a進行推理,得到相應(yīng)結(jié)論,推理過程具體為:根據(jù)規(guī)則r1,若不存在有向圖中不存在推理得出結(jié)論根據(jù)規(guī)則r2,若不存在有向圖中不存在推理得出結(jié)論根據(jù)規(guī)則r3,若不存在有向圖中不存在e+r(a,c),推理得出結(jié)論e+r(a,c);根據(jù)規(guī)則r4,若不存在有向圖中不存在e-r(a,c),推理得出結(jié)論e-r(a,c);根據(jù)規(guī)則r5,若不存在有向圖中不存在推理得出結(jié)論根據(jù)規(guī)則r6,若不存在有向圖中不存在e+s(a,b),推理得出結(jié)論e+s(a,b);根據(jù)規(guī)則r7,若不存在有向圖中不存在e+t(a,c),推理得出結(jié)論e+t(a,c;);

      35)加邊:將所述步驟34)中的推理結(jié)論作為新的邊加入到有向圖中。

      步驟4)中利用轉(zhuǎn)換規(guī)則(t1-t6)的可逆性,將有向圖中每一條邊通過(t1-t6)對應(yīng)的規(guī)則逆向轉(zhuǎn)換為el中的公理,即得到新的el本體

      有益效果:el本體推理的現(xiàn)有研究工作如下:badder等人開發(fā)的推理機cel,牛津大學(xué)開發(fā)的推理系統(tǒng)elk以及raghava與zhou等人基于mapreduce開發(fā)的分布式el推理系統(tǒng)。與以上現(xiàn)有系統(tǒng)及技術(shù)相比,本發(fā)明優(yōu)點及有益效果分析如下。

      cel是首個針對el推理任務(wù)開發(fā)的推理系統(tǒng)。cel系統(tǒng)也引入了規(guī)范化技術(shù)來預(yù)處理el本體。但是,cel是基于串行技術(shù)實現(xiàn)的推理機,其推理能力受制于本體的規(guī)模。實驗結(jié)果表明,在相同配置下,含有百萬數(shù)量公理的本體snomedct,在cel系統(tǒng)上完成分類需要20分鐘時間。本發(fā)明實現(xiàn)的系統(tǒng)引入了并行化技術(shù),在處理snomedct本體的推理時僅需半分鐘計算時間。

      elk是首個引入了并行推理技術(shù)的el本體推理機,具體而言,elk引入了多核多線程技術(shù)來實現(xiàn)owlel本體分類。elk針對公理中的特定位置(在符號左側(cè)或右側(cè))將概念或角色分布到不同頂點進行處理。這種方式使得數(shù)據(jù)劃分的粒度較粗。本發(fā)明同樣引入并行技術(shù),不同的是采用基于圖模型的并行化,即將所有圖頂點進行并行處理。本發(fā)明的數(shù)據(jù)劃分粒度要細于elk提出的方法。實驗結(jié)果表明并行效果要更優(yōu)。另外,elk推理機只能部署在多核多線程系統(tǒng),因而受限于單臺機器內(nèi)存容量。本發(fā)明采用平臺無關(guān)模型設(shè)計推理過程,因而允許系統(tǒng)部署在不同的并行計算平臺,增強了不同并行平臺使用的靈活性。

      基于mapreduce平臺開發(fā)的el推理系統(tǒng)具有分布式、高吞吐量的特點。能夠滿足大規(guī)模本體推理的需求。但是mapreduce系統(tǒng)是著重針對表單數(shù)據(jù)設(shè)計的。因而,基于mapreduce平臺開發(fā)的el推理系統(tǒng)只能按照表單數(shù)據(jù)格式存儲el本體,以及做相應(yīng)操作。但是el本體具有圖的特征,可以利用圖上的優(yōu)化來提升推理效果。因此,本發(fā)明利用圖結(jié)構(gòu)的“信息相鄰”特性,基于圖模型設(shè)計并行推理系統(tǒng)。這使得基于圖操作的優(yōu)化和改進得以實現(xiàn)。另外,基于mapreduce平臺開發(fā)的推理系統(tǒng)只能部署在mapreduce計算平臺上,因而受限于具體平臺的使用。如上一段所述,本發(fā)明采用平臺無關(guān)模型設(shè)計推理過程,在不同平臺使用方面具有靈活性。

      附圖說明

      圖1是整個并行系統(tǒng)流程圖。

      圖2是由本體轉(zhuǎn)換得到的有向圖。

      具體實施方式

      以下結(jié)合實施例和說明書附圖,詳細說明本發(fā)明的實施過程。

      給定el本體作為實施例,其包含如下公理:

      上述本體包含六條公理,分別描述了如下事實:α1描述了“膝關(guān)節(jié)(kneejoint)”是“從屬于膝蓋”的“關(guān)節(jié)部分(joint)”;α2描述了“從屬于腿部”的“結(jié)構(gòu)(structure)”屬于“腿結(jié)構(gòu)(legstructure)”;α3描述了“關(guān)節(jié)”屬于結(jié)構(gòu);α4描述了“膝蓋(knee)”位于“腿部”;α5描述了“位于(haslocation)”這個角色被“從屬于(partof)”這個角色包含;α6描述了“從屬于(partof)”這個角色具有傳遞性。

      本發(fā)明提出了一種基于圖模型的描述邏輯el本體并行推理方法,可以對本體進行分類。具體而言,通過本體表達的知識,可以推理出“膝關(guān)節(jié)屬于腿結(jié)構(gòu)”這條概念包含知識。分類任務(wù)是計算出所有這樣的知識。本發(fā)明方法流程如圖1所示,具體包含如下步驟:

      1)根據(jù)給定的el本體做規(guī)范化處理,并將規(guī)范化后的本體轉(zhuǎn)換成語義等價的有向圖;

      首先,對本體做規(guī)范化處理,得到如下規(guī)范化公理:

      接下來,將所有公理按照轉(zhuǎn)換規(guī)則(t1-t6)轉(zhuǎn)換為有向圖(如圖2所示),有向圖的頂點包含:kneejoint,joint,knee,a,structure,legstructure,leg,partof,haslocation;邊包含如下e1-e8八條邊:

      2)將所述步驟1)轉(zhuǎn)化得來的有向圖做并行化存儲,并同步到并行計算平臺;

      上述并行化存儲過程具體為:首先,利用平臺的“轉(zhuǎn)譯超步”將有向圖轉(zhuǎn)譯為底層平臺的數(shù)據(jù)結(jié)構(gòu);其次,利用平臺的“存儲超步”將轉(zhuǎn)譯后的有向圖存儲到平臺的文件系統(tǒng)中。

      3)利用并行計算平臺的超步完成推理過程的迭代,所使用超步分別為:請求、應(yīng)答、推理、加邊;迭代后有向圖完成更新;

      對轉(zhuǎn)換得到的有向圖應(yīng)用以上超步以及規(guī)則(r1-r7)進行操作以完成推理。在進行圖更新過程中,得到以下新添加的邊,對于每條邊的推理過程在下表給出:

      以上新添加的邊e9至e13添加進有向圖后,有向圖即完成更新。

      4)最后,將完成更新的有向圖逆向轉(zhuǎn)換為新的el本體,作為結(jié)果輸出;

      利用轉(zhuǎn)換規(guī)則(t1-t6)的可逆性,將有向圖每一條邊通過(t1-t6)對應(yīng)的規(guī)則逆向轉(zhuǎn)換為el中的公理,其中邊e1-e8逆向轉(zhuǎn)換為α1-α8;邊e9-e13逆向轉(zhuǎn)換為α9-α13(如下表所示):

      所得到新的el本體為最終輸出的結(jié)果。

      上述實施例僅是本發(fā)明的優(yōu)選實施方式,應(yīng)當指出:對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和等同替換,這些對本發(fā)明權(quán)利要求進行改進和等同替換后的技術(shù)方案,均落入本發(fā)明的保護范圍。

      當前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1