領(lǐng)域本體的構(gòu)建方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及本體工程領(lǐng)域,具體而言,設(shè)及一種領(lǐng)域本體的構(gòu)建方法和裝置。
【背景技術(shù)】
[0002] 當(dāng)前通用的領(lǐng)域本體構(gòu)建方法都是國外學(xué)者在具體項(xiàng)目實(shí)施過程中總結(jié)出來的, 但由于每個(gè)項(xiàng)目的需求不同,所采用的流程也各不相同,缺乏具有參考意義的領(lǐng)域本體構(gòu) 建一般化流程。
[0003] 現(xiàn)有技術(shù)在本體工程領(lǐng)域,可W通過如下方式來進(jìn)行本體的開發(fā):
[0004] (1)循環(huán)獲取法 陽0化]Alexander Maedche 等提出的切clic Acquisition Process (循環(huán)獲取法),是一 種環(huán)狀結(jié)構(gòu),各環(huán)節(jié)相互影響和制約,其具體的本體開發(fā)流程如下:
[0006] 首先,選擇數(shù)據(jù)源:運(yùn)是環(huán)形結(jié)構(gòu)的起點(diǎn),用戶需要選擇一個(gè)通用本體、語義網(wǎng)或 領(lǐng)域本體作為基礎(chǔ)本體,并確定用于抽取領(lǐng)域相關(guān)實(shí)體的文本。
[0007] 其次,概念學(xué)習(xí):從選擇的文本中獲取相關(guān)的核屯、概念,并建立概念之間的分類關(guān) 系。
[0008] 然后,領(lǐng)域聚焦:去除掉與領(lǐng)域無關(guān)的概念,從而建立起目標(biāo)本體的概念結(jié)構(gòu)。
[0009] 接著,關(guān)系學(xué)習(xí):除了從基礎(chǔ)本體中繼承的一些關(guān)系,其它的關(guān)系需要通過學(xué)習(xí)的 方法從文本中抽取。
[0010] 最后,本體評價(jià)及優(yōu)化:按照一定的規(guī)則,對得到的領(lǐng)域本體進(jìn)行評價(jià),有必要的 話可W重復(fù)上述過程進(jìn)行優(yōu)化。
[0011] 似人工方法
[0012] 由于領(lǐng)域本體是一種??谟糜诿枋鎏囟I(lǐng)域知識(shí)的本體,它提供了該領(lǐng)域內(nèi)的概 念及其相互關(guān)系,W及該領(lǐng)域內(nèi)所具有的特性和規(guī)律。當(dāng)前國內(nèi)一些研究機(jī)構(gòu)主要是采用 手工歸納的方法邀請領(lǐng)域?qū)<覍︻I(lǐng)域內(nèi)的概念、屬性、關(guān)系、約束等進(jìn)行標(biāo)注形成最終的領(lǐng) 域本體。
[0013] 分析可追,上述方案實(shí)現(xiàn)的領(lǐng)域本體的構(gòu)建基本上停留在人工或半人工階段,難 W構(gòu)建大規(guī)模的領(lǐng)域本體。需要領(lǐng)域?qū)<覅⑴cW及本體的人工操作是當(dāng)前領(lǐng)域本體構(gòu)建方 法中的關(guān)鍵瓶頸。具體存在的缺陷包括:成本高:當(dāng)前方法需要邀請領(lǐng)域?qū)<也捎萌斯さ?形式對領(lǐng)域知識(shí)進(jìn)行歸納,費(fèi)時(shí)費(fèi)力,同時(shí)會(huì)大大降低效率、提高成本;領(lǐng)域本體規(guī)模受限: 由于之前方法受人工操作的限制,所構(gòu)建的領(lǐng)域本體規(guī)模不會(huì)太大,不適用于大規(guī)模的領(lǐng) 域本體構(gòu)建,缺乏實(shí)用意義。
[0014] 針對上述現(xiàn)有技術(shù)構(gòu)建本體的方法效率低的問題,目前尚未提出有效的解決方 案。
【發(fā)明內(nèi)容】
[0015] 本發(fā)明實(shí)施例提供了一種領(lǐng)域本體的構(gòu)建方法和裝置,W至少解決現(xiàn)有技術(shù)構(gòu)建 本體的方法效率低的技術(shù)問題。
[0016] 根據(jù)本發(fā)明實(shí)施例的一個(gè)方面,提供了一種領(lǐng)域本體的構(gòu)建方法,該方法包括:獲 取任意一個(gè)技術(shù)領(lǐng)域的多個(gè)原始數(shù)據(jù);確定任意兩個(gè)原始數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,關(guān)聯(lián)關(guān)系 包括:等同關(guān)系、層級關(guān)系和相關(guān)關(guān)系;使用本體編輯工具將多個(gè)原始數(shù)據(jù)W及原始數(shù)據(jù) 之間的關(guān)聯(lián)關(guān)系按照示例本體文件進(jìn)行編寫,生成技術(shù)領(lǐng)域的領(lǐng)域本體。
[0017] 根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種領(lǐng)域本體的構(gòu)建裝置,該裝置包括: 獲取模塊,用于獲取任意一個(gè)技術(shù)領(lǐng)域的多個(gè)原始數(shù)據(jù);確定模塊,用于確定任意兩個(gè)原始 數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,關(guān)聯(lián)關(guān)系包括:等同關(guān)系、層級關(guān)系和相關(guān)關(guān)系;生成模塊,用于使 用本體編輯工具將多個(gè)原始數(shù)據(jù)W及原始數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系按照示例本體文件進(jìn)行編 寫,生成技術(shù)領(lǐng)域的領(lǐng)域本體。
[0018] 在本發(fā)明實(shí)施例中,采用獲取任意一個(gè)技術(shù)領(lǐng)域的多個(gè)原始數(shù)據(jù);確定任意兩個(gè) 原始數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,關(guān)聯(lián)關(guān)系包括:等同關(guān)系、層級關(guān)系和相關(guān)關(guān)系;使用本體編輯 工具將多個(gè)原始數(shù)據(jù)W及原始數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系按照示例本體文件進(jìn)行編寫,生成技術(shù) 領(lǐng)域的領(lǐng)域本體的方式。本申請上述提供的領(lǐng)域本體的形式化表示的方案,采用的是半自 動(dòng)化的構(gòu)建方法,在建立一個(gè)示例本體文件OWL之后,通過使用本體編輯工具來編寫程序, 實(shí)現(xiàn)將原始數(shù)據(jù)按照本體可識(shí)別的格式讀入文件,由于本發(fā)明采用程序自動(dòng)化實(shí)現(xiàn)本體構(gòu) 建,能高效構(gòu)建大規(guī)模的領(lǐng)域本體,體現(xiàn)實(shí)際領(lǐng)域中存在的屬性及關(guān)系,進(jìn)而解決了現(xiàn)有技 術(shù)構(gòu)建本體的方法效率低的技術(shù)問題。
【附圖說明】
[0019] 此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本申請的一部分,本發(fā) 明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
[0020] 圖1是本發(fā)明實(shí)施例的一種運(yùn)行領(lǐng)域本體的構(gòu)建方法的計(jì)算機(jī)終端的硬件結(jié)構(gòu) 框圖;
[0021] 圖2是根據(jù)本發(fā)明實(shí)施例一的領(lǐng)域本體的構(gòu)建方法的流程圖;
[0022] 圖3是根據(jù)本發(fā)明實(shí)施例一的一種優(yōu)選的領(lǐng)域本體的構(gòu)建方法的詳細(xì)流程圖;W 及
[0023] 圖4是根據(jù)本發(fā)明實(shí)施例二的領(lǐng)域本體的構(gòu)建裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0024] 為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的 附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是 本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù) 人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范 圍。
[0025] 需要說明的是,本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語"第一"、"第 二"等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解運(yùn)樣使用 的數(shù)據(jù)在適當(dāng)情況下可W互換,W便運(yùn)里描述的本發(fā)明的實(shí)施例能夠W除了在運(yùn)里圖示或 描述的那些W外的順序?qū)嵤?。此外,術(shù)語"包括"和"具有"W及他們的任何變形,意圖在于 覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限 于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶\(yùn)些過程、方法、產(chǎn) 品或設(shè)備固有的其它步驟或單元。
[00%] 下面就本申請?jiān)O(shè)及到的部分名詞解釋如下:
[0027] 本體,是一種對于某種概念體系(概念表達(dá)、概念化、概念化體系或者說概念化過 程)的明確而又詳細(xì)的說明,是由若干概念及其在某種邏輯理論支持下的定義所構(gòu)成的一 種分類法。對于特定一個(gè)領(lǐng)域而言,本體表達(dá)的是其那套術(shù)語、實(shí)體、對象、類、屬性及其之 間的關(guān)系,提供的是形式化的定義和公理,用來約束對于運(yùn)些術(shù)語的解釋。 陽0測實(shí)施例1
[0029] 根據(jù)本發(fā)明實(shí)施例,提供了一種領(lǐng)域本體的構(gòu)建方法的方法實(shí)施例,需要說明的 是,在附圖的流程圖示出的步驟可W在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行, 并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可W W不同于此處的順序執(zhí)行 所示出或描述的步驟。
[0030] 本申請實(shí)施例一所提供的方法實(shí)施例可W在移動(dòng)終端、計(jì)算機(jī)終端或者類似的運(yùn) 算裝置中執(zhí)行。W運(yùn)行在計(jì)算機(jī)終端上為例,圖1是本發(fā)明實(shí)施例的一種運(yùn)行領(lǐng)域本體的 構(gòu)建方法的計(jì)算機(jī)終端的硬件結(jié)構(gòu)框圖。如圖1所示,計(jì)算機(jī)終端10可W包括一個(gè)或多 個(gè)(圖中僅示出一個(gè))處理器102 (處理器102可W包括但不限于微處理器MCU或可編程 邏輯器件FPGA等的處理裝置)、用于存儲(chǔ)數(shù)據(jù)的存儲(chǔ)器104、W及用于通信功能的傳輸裝置 106。本領(lǐng)域普通技術(shù)人員可W理解,圖1所示的結(jié)構(gòu)僅為示意,其并不對上述電子裝置的 結(jié)構(gòu)造成限定。例如,計(jì)算機(jī)終端10還可包括比圖1中所示更多或者更少的組件,或者具 有與圖1所示不同的配置。
[0031] 存儲(chǔ)器104可用于存儲(chǔ)應(yīng)用軟件的軟件程序W及模塊,如本發(fā)明實(shí)施例中的領(lǐng)域 本體的構(gòu)建方法所對應(yīng)的程序指令/模塊,處理器102通過運(yùn)行存儲(chǔ)在存儲(chǔ)器104內(nèi)的軟 件程序W及模塊,從而執(zhí)行各種功能應(yīng)用W及數(shù)據(jù)處理,即實(shí)現(xiàn)上述的領(lǐng)域本體的構(gòu)建方 法。存儲(chǔ)器104可包括高速隨機(jī)存儲(chǔ)器,還可包括非易失性存儲(chǔ)器,如一個(gè)或者多個(gè)磁性存 儲(chǔ)裝置、閃存、或者其他非易失性固態(tài)存儲(chǔ)器。在一些實(shí)例中,存儲(chǔ)器104可進(jìn)一步包括相 對于處理器102遠(yuǎn)程設(shè)置的存儲(chǔ)器,運(yùn)些遠(yuǎn)程存儲(chǔ)器可W通過網(wǎng)絡(luò)連接至計(jì)算機(jī)終端10。 上述網(wǎng)絡(luò)的實(shí)例包括但不限于互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、局域網(wǎng)、移動(dòng)通信網(wǎng)及其組合。
[0032] 傳輸裝置106用于經(jīng)由一個(gè)網(wǎng)絡(luò)接收或者發(fā)送數(shù)據(jù)。上述的網(wǎng)絡(luò)具體實(shí)例可包括 計(jì)算機(jī)終端10的通信供應(yīng)商提供的無線網(wǎng)絡(luò)。在一個(gè)實(shí)例中,傳輸裝置106包括一個(gè)網(wǎng)絡(luò) 適配器(Network Interface Controller,NIC),其可通過基站與其他網(wǎng)絡(luò)設(shè)備相連從而可 與互聯(lián)網(wǎng)進(jìn)行通訊。在一個(gè)實(shí)例中,傳輸裝置106可W為射頻(Radio化equency,RF)模 塊,其用于通過無線方式與互聯(lián)網(wǎng)進(jìn)行通訊。
[0033] 在上述運(yùn)行環(huán)境下,本申請?zhí)峁┝巳鐖D2所示的領(lǐng)域本體的構(gòu)建方法。圖2是根 據(jù)本發(fā)明實(shí)施例一的領(lǐng)域本體的構(gòu)建方法的流程圖。
[0034] 如圖2所示,該領(lǐng)域本體的構(gòu)建方法可W包括如下步驟:
[0035] 步驟S20,獲取任意一個(gè)技術(shù)領(lǐng)域的多個(gè)原始數(shù)據(jù)。