国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于敘詞表的本體自動生成系統(tǒng)及其方法

      文檔序號:6380394閱讀:302來源:國知局
      專利名稱:一種基于敘詞表的本體自動生成系統(tǒng)及其方法
      技術(shù)領(lǐng)域
      本發(fā)明是一種基于敘詞表的本體自動生成系統(tǒng)及其方法,屬于信息檢索領(lǐng)域。
      背景技術(shù)
      當(dāng)前以計算機技術(shù)和網(wǎng)絡(luò)技術(shù)為核心的現(xiàn)代信息技術(shù)迅速發(fā)展,尤其是個人電腦和因特網(wǎng)的廣泛應(yīng)用與普及和知識可視化的探索和發(fā)展,使得各學(xué)科中知識體系在計算機中的實現(xiàn)越來越引起人們的關(guān)注,學(xué)科知識體系在計算機或者網(wǎng)絡(luò)中的查找和共享也變得尤為重要。利用信息技術(shù)知識構(gòu)建一個完備的靈活的可兼容可擴充的知識地圖是當(dāng)前一個較為有效的科學(xué)的方法。本體構(gòu)建有多種途徑,如直接構(gòu)建領(lǐng)域本體、以現(xiàn)有分類法為基礎(chǔ)構(gòu)建領(lǐng)域本體、以現(xiàn)有敘詞表為基礎(chǔ)構(gòu)建領(lǐng)域本體等。敘詞表是特定學(xué)科領(lǐng)域內(nèi)的表達事物概念的詞匯集合;是通過各種方式對敘詞之間的各種詞義聯(lián)系進行顯示的詞匯系統(tǒng);是領(lǐng)域本體的目標是捕獲相關(guān)領(lǐng)域的知識,確定該領(lǐng)域內(nèi)共同認可的詞匯,并從不同層次的形式化模式上給出這些詞匯之間相互關(guān)系的明確定義。本體是一種能在語義層次上描述信息的概念模型,它通過對概念及其關(guān)系的描述,使得領(lǐng)域敘詞在共享范圍內(nèi)具有被共同認可的、明確的、形式化的定義。然而,本體構(gòu)建的方式仍然以手工構(gòu)建為主,這種構(gòu)建方法自動化程度低,工程繁瑣而浩大,且難以進行維護和修改。本發(fā)明中將敘詞表本體化與關(guān)系學(xué)習(xí)技術(shù)結(jié)合起來,構(gòu)建了本體文件自動生成系統(tǒng),一方面用敘詞表彌補概念及分類關(guān)系獲取效果不理想的問題;另一方面提高了用戶搜索、查看術(shù)語的效率和準確性。

      發(fā)明內(nèi)容
      本發(fā)明的技術(shù)解決問題克服現(xiàn)有技術(shù)的不足,提供一種基于敘詞表的本體自動生成系統(tǒng)及其方法,用戶不需要逐條術(shù)語進行手動編輯,減少了用戶輸入錯誤,極大的提高系統(tǒng)效率;本發(fā)明提供了一種基于用戶查詢和正反雙向展示的圖譜,方便用戶查看術(shù)語及其關(guān)系。本發(fā)明的技術(shù)解決方案基于敘詞表的本體自動生成系統(tǒng),如圖I所示包括服務(wù)器和客戶端,其中服務(wù)器端包括敘詞表解析模塊、術(shù)語及關(guān)系映射模塊、術(shù)語及關(guān)系重構(gòu)模塊、規(guī)范性自檢模塊、本體文件更新模塊、本體解析模塊、本體推演模塊和術(shù)語圖譜構(gòu)建模塊;客戶端進行敘詞表文件導(dǎo)入、本體編輯和展示,具體如下敘詞表解析模塊首先對敘詞表進行預(yù)處理,將序詞表解析成方便程序進行處理的txt格式;然后逐條地對敘詞中敘詞進行處理,分離出敘詞及敘詞關(guān)系,所述術(shù)語關(guān)系是用代關(guān)系、屬分關(guān)系及相關(guān)關(guān)系;把敘詞表中的敘詞及敘詞關(guān)系通過索引的形式映射到敘詞映射文件中,所示敘詞映射文件是用于存儲敘詞及敘詞關(guān)系的文件,敘詞映射文件供術(shù)語及術(shù)語關(guān)系映射模塊解析。術(shù)語及關(guān)系映射模塊對敘詞映射文件進行解析,獲取敘詞索引信息,將敘詞按敘詞所屬范疇分成若干類,并區(qū)分出上位詞、下位詞和族首詞,存儲到術(shù)語表,即:thesaurusTable ;根據(jù)解析結(jié)果,對敘詞術(shù)語關(guān)系進行語法分析,檢查每個敘詞的關(guān)系是否符合語法規(guī)則,分析完一個敘詞,并進行相應(yīng)的存儲,當(dāng)所有的敘詞分析完后,構(gòu)成形成敘詞關(guān)系分析樹,各相關(guān)敘詞存放在分析樹的節(jié)點中,并按照等同關(guān)系、屬分關(guān)系以及相關(guān)關(guān)系存儲到關(guān)系表,即relati0nTable ;通過對敘詞映射文件進行預(yù)處理,將敘詞轉(zhuǎn)變成本體中的概念,使敘詞映射文件真正成為領(lǐng)域本體建設(shè)的基礎(chǔ)資源。術(shù)語及關(guān)系重構(gòu)模塊對thesaurusTable進行循環(huán)遍歷,取出每個術(shù)語,把每個術(shù)語轉(zhuǎn)換成本體類的主屬性,然后遍歷relationTable表,獲取當(dāng)前術(shù)語關(guān)系分析樹,確定與其相關(guān)術(shù)語間的等級關(guān)系,然后對術(shù)語及術(shù)語關(guān)系進行處理,轉(zhuǎn)換為初始本體中相應(yīng)的類及層次關(guān)系,最終生成初始本體文件,供規(guī)范性自檢模塊調(diào)用。規(guī)范性自檢模塊讀取初始本體文件,對初始本體文件進行概念、類、及屬性進行檢查,如果不存在問題,則自動生成本體文件;如果存在問題,則保存到日志文件中,繼續(xù)解析下一條術(shù)語;當(dāng)解析完成后,系統(tǒng)自動把初始本體文件及日志推送到客戶端本體編輯模塊。本體文件更新模塊響應(yīng)用戶對本體文件或初始本體文件編輯操作,所述操作有添加、刪除、修改,并根據(jù)用戶的操作,重新構(gòu)建新的本體文件。本體文件更新模塊會自動調(diào)用規(guī)范性自檢模塊,最終生成本體文件,供本體解析模塊調(diào)用。本體解析模塊負責(zé)解析本體文件,把術(shù)語及術(shù)語關(guān)聯(lián)關(guān)系進行分解,一個術(shù)語節(jié)點可以分解為多個子節(jié)點,從而構(gòu)成樹狀結(jié)構(gòu);一組被連接的術(shù)語節(jié)點代表一個術(shù)語集合或一個術(shù)語流程,從而構(gòu)成圖狀結(jié)構(gòu);在本體文件解析過程中,將術(shù)語及術(shù)語關(guān)系封裝成具有雙向鏈表功能的鄰接表即adjTable,供本體推演模塊調(diào)用,從而實現(xiàn)正向和方向兩個方向的遍歷和查找功能。本體推演模塊負責(zé)讀取adjTable中數(shù)據(jù),根據(jù)用戶的需求,所述用戶需求為術(shù)語樹、術(shù)語地圖、正向展示、反向展示;系統(tǒng)從adjTable中讀取相關(guān)數(shù)據(jù),封裝到成tempData數(shù)據(jù)包,供術(shù)語圖譜模塊調(diào)用。術(shù)語圖譜構(gòu)建模塊對tempData數(shù)據(jù)包進行解析,根據(jù)用戶選擇,系統(tǒng)自動生成術(shù)語樹或術(shù)語地圖,并利用信息可視化技術(shù)和工具進行展示;根據(jù)用戶的需要可以正向展示圖譜或者反向展示圖譜,并為用戶提供搜索、瀏覽某個具體術(shù)語的功能?;跀⒃~表的本體自動生成方法,實現(xiàn)步驟如下(I)對敘詞表文件進行解析,分離出敘詞及敘詞關(guān)系;首先對敘詞表進行預(yù)處理,將序詞表轉(zhuǎn)換成方便程序進行處理的txt格式,即thesaurus. txt ;然后遍歷thesaurus,txt文件,逐條地對敘詞進行處理,分離出敘詞及敘詞關(guān)系;把敘詞表中的敘詞及敘詞關(guān)系通過索引的形式映射到存儲到已經(jīng)定義好的哈希表中,即HashMap,當(dāng)解析結(jié)束后,把全部數(shù)據(jù)存儲到敘詞映射文件,即AhesaurusMapFile,供術(shù)語及關(guān)系映射模塊調(diào)用。(2)對thesaurusMapFile進行解析,根據(jù)索引信息,將敘詞按其概念所屬范疇分成若干類,第一次循環(huán)遍歷thesaurusMapFile,讀取每個敘詞,區(qū)分出上位詞、下位詞和族首詞,并存儲到術(shù)語表中,即thesaurusTable ;再次遍歷敘詞映射文件,解析出敘詞的用、代、屬、分等關(guān)系根據(jù)等同關(guān)系、屬分關(guān)系以及相關(guān)關(guān)系;當(dāng)所有的敘詞分析完后,構(gòu)成形成敘詞關(guān)系分析樹,各相關(guān)敘詞存放在分析樹的節(jié)點中,并存儲到關(guān)系表中,即relationTable,供術(shù)語及關(guān)系重構(gòu)模塊調(diào)用。(3)對thesaurusTable進行循環(huán)遍歷,取出每個術(shù)語,把每個術(shù)語轉(zhuǎn)換成本體類的主屬性,再次遍歷relationTable表,獲取當(dāng)前術(shù)語關(guān)系分析樹,獲取術(shù)語的用代關(guān)系,屬分關(guān)系和相關(guān)關(guān)系,并轉(zhuǎn)換為初始本體中相應(yīng)的類及層次關(guān)系,最終生成初始本體文件,供規(guī)范性自檢模塊調(diào)用。(4)客戶端可以對術(shù)語進行編輯,方便查看、修改已經(jīng)生成的術(shù)語初始本體文件或本體文件;對于有問題的初始本體文件,系統(tǒng)自動推送到客戶端,供有戶進行修改;沒有問題的初始本體文件,用戶可以手動調(diào)用進行編輯;用戶對本體做修改時,修改信息儲存在緩存臨時表中,即tempTab,當(dāng)用戶退出程序或點擊保存按鈕時修改信息自動傳送到服務(wù)器中,并寫入本體文件;初始本體文件沒有問題后,經(jīng)過規(guī)范性自檢流程,自動生成本體文件。(5)客戶端發(fā)起查看術(shù)語及術(shù)語關(guān)系的請求,所示請求有知識樹、知識地圖、正向展示和反向展示;根據(jù)客戶端的請求,服務(wù)器端對本體文件的解析,把術(shù)語及術(shù)語關(guān)聯(lián)關(guān)系進行分解,一個術(shù)語節(jié)點可以分解為多個子節(jié)點,從而構(gòu)成樹狀結(jié)構(gòu)。一組術(shù)語節(jié)點代表一個術(shù)語集合或一個術(shù)語流程,從而構(gòu)成圖狀結(jié)構(gòu);在術(shù)語解析過程中,將術(shù)語及術(shù)語關(guān)系解析成具有雙向鏈表功能的鄰接表,即adjTable中,可實現(xiàn)正向展示圖譜功能和反向展示圖譜功能。本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點在于(I)本發(fā)明提供的一種本體庫自動生成系統(tǒng)及其方法,用戶不需要逐條術(shù)語進行手動編輯,同時,減少了用戶輸入錯誤,提高效率。(2)本發(fā)明首次采用具有雙向結(jié)構(gòu)的鄰接表作為術(shù)語顯示的映射表,在術(shù)語展示層實現(xiàn)了傳統(tǒng)的正向展示圖譜、查看術(shù)語間的關(guān)系,又可以反向展示圖譜、查看術(shù)語間的關(guān)系,方便用戶查看術(shù)語的關(guān)系。(3)本發(fā)明在術(shù)語顯示層實現(xiàn)了術(shù)語樹和術(shù)語地圖兩種展示方式,避免了單一的展示方式,同時支持搜索功能,便于查找術(shù)語。


      圖I為本發(fā)明框架圖;圖2為本發(fā)明的敘詞表解析流程;圖3為本發(fā)明的本體文件自動構(gòu)建流程;圖4為本發(fā)明的本體文件更新流程圖;圖5為本發(fā)明的術(shù)語可視化流程圖;圖6為本發(fā)明的術(shù)語檢索流程圖。
      具體實施例方式
      為了更好地理解本發(fā)明,先對一些基本概念進行一下解釋說明。敘詞表敘詞表是由敘詞及敘詞之間關(guān)系組成,采用參照符號顯示、并清楚的區(qū)分敘詞間基本語義關(guān)系。用代關(guān)系例計算機語言Y程序設(shè)計語言;Y后的詞為正式敘詞,用程序設(shè)計語言D計算機語言;D后的詞為非正式敘詞,代Y-D是相互關(guān)系。屬分關(guān)系例回路式風(fēng)洞S風(fēng)洞;屬風(fēng)洞F回路式風(fēng)洞;分S-F是相互關(guān)系。參關(guān)系例風(fēng)洞氣源C壓力容器;參壓力容器C風(fēng)洞氣源;破裂試驗C是相互關(guān)系。族首詞例Z程序設(shè)計語言*族首詞,屬的頂級,只有”F”分。在數(shù)據(jù)庫的詞間關(guān)系字段中,族首詞前用Z做標
      O領(lǐng)詞例文件系統(tǒng)##是領(lǐng)詞標志,是屬的特殊形式,領(lǐng)詞必有屬。說明詞族太大,分為分詞族,分詞族的族首詞為領(lǐng)詞,領(lǐng)詞的下分項在其詞族中不顯示。在數(shù)據(jù)庫的詞間關(guān)系字段中,領(lǐng)詞前有L做標志。多層屬例膛內(nèi)氣體動力學(xué)S氣體動力學(xué)流體動力學(xué)動力學(xué)力學(xué)本體對某一領(lǐng)域知識共同的理解,確定該領(lǐng)域內(nèi)共同認可的概念,從不同的層次的形式化模式給出這些概念以及概念相互間關(guān)系的明確定義,并通過概念間的關(guān)系來描述概念的語義。同義關(guān)系A(chǔ) < X > B,指概念A(yù)含義與概念B含義相同。近義關(guān)系A(chǔ) < X > B,概念A(yù)與概念B存在著相近的關(guān)系。反義關(guān)系A(chǔ)<X>B,概念A(yù)與概念B存在著相反的關(guān)系,或相對的關(guān)系。部分與整體關(guān)系A(chǔ) < X > B,指概念A(yù)表示組成部分概念,概念B表示一個整體概念。因果關(guān)系A(chǔ) < X > B,指概念A(yù)是導(dǎo)致或造成概念B的一個原因??蛻舳耸怯脩艉头?wù)器進行數(shù)據(jù)傳輸?shù)闹虚g系統(tǒng),在客戶端,用戶向服務(wù)器發(fā)起操作請求,所述請求包括解析敘詞表文件,修改初始本體文件,術(shù)語展示方式;客戶端負責(zé)解析數(shù)據(jù),并以可視化的窗口的形式展示服務(wù)器響應(yīng)用戶請求的數(shù)據(jù)??蛻舳朔?wù)器最低配置要求CPU 主頻IGHz
      內(nèi)存1GB硬盤容量IT以太網(wǎng)卡百兆服務(wù)器主要是響應(yīng)用戶的請求,由敘詞表解析模塊,術(shù)語及關(guān)系映射模塊,術(shù)語及關(guān)系重構(gòu)模塊,規(guī)范性自檢模塊,本體文件更新模塊,本體解析模塊組成;服務(wù)器根據(jù)用戶輸入的約束條件自動處理數(shù)據(jù),所述數(shù)據(jù)包括敘詞表文件,初始本體文件和本體文件;服務(wù)器在解析數(shù)據(jù)的同時生成臨時文件,所述臨時文件包括敘詞映射文件,初始本體文件和本體文件。服務(wù)器最低配置要求CPU 主頻128GHz內(nèi)存64GB硬盤容量128T以太網(wǎng)卡千兆如圖I所示,本發(fā)明一種基于敘詞表的本體自動生成系統(tǒng)由敘詞表解析模塊、術(shù)語及關(guān)系映射模塊、術(shù)語及關(guān)系重構(gòu)模塊、規(guī)范性自檢模塊、本體文件更新模塊、本體解析模塊、本體推演模塊和術(shù)語圖譜構(gòu)建構(gòu)成。本發(fā)明整個實現(xiàn)過程如下(I)首先對敘詞表進行預(yù)處理,將序詞表解析成方便程序進行處理的txt格式;然后逐條地對敘詞中敘詞進行處理,分離出敘詞及敘詞關(guān)系;把敘詞表中的敘詞及敘詞關(guān)系通過索引的形式映射到敘詞映射文件。(2)對敘詞映射文件進行解析,獲取敘詞索引信息,將敘詞按敘詞概念所屬范疇分成若干類,并區(qū)分出上位詞、下位詞和族首詞,存儲到術(shù)語表,即thesaurusTable ;根據(jù)解析結(jié)果,對敘詞術(shù)語關(guān)系進行語法分析,并按照等同關(guān)系、屬分關(guān)系以及相關(guān)關(guān)系存儲到關(guān)系表,即relationTable ;通過對敘詞映射文件進行預(yù)處理,將敘詞轉(zhuǎn)變成本體中的概念,使敘詞映射文件真正成為領(lǐng)域本體建設(shè)的基礎(chǔ)資源。(3)對thesaurusTable進行循環(huán)遍歷,取出每個術(shù)語,把每個術(shù)語轉(zhuǎn)換成本體類的主屬性,然后遍歷relationTable表,獲取當(dāng)前術(shù)語關(guān)系分析樹,確定與其相關(guān)術(shù)語間的等級關(guān)系,然后對術(shù)語及術(shù)語關(guān)系進行處理,轉(zhuǎn)換為初始本體中相應(yīng)的類及層次關(guān)系,最終生成初始本體文件。(4)讀取初始本體文件,對初始本體文件進行概念、類、及屬性進行檢查,如果不存在問題,則自動生成本體文件;如果存在問題,則保存到日志文件中,繼續(xù)解析下一條術(shù)語;當(dāng)解析完成后,系統(tǒng)自動把初始本體文件及日志推送到客戶端本體編輯模塊。(5)響應(yīng)用戶對本體文件或初始本體文件編輯操作,所述操作有添加、刪除、修改,并根據(jù)用戶的操作,重新構(gòu)建新的本體文件。本體文件更新模塊會自動調(diào)用規(guī)范性自檢模塊,最終生成本體文件。(6)解析本體文件,把術(shù)語及術(shù)語關(guān)聯(lián)關(guān)系進行分解,一個術(shù)語節(jié)點可以分解為多個子節(jié)點,從而構(gòu)成樹狀結(jié)構(gòu);一組被連接的術(shù)語節(jié)點代表一個術(shù)語集合或一個術(shù)語流程,從而構(gòu)成圖狀結(jié)構(gòu);在本體文件解析過程中,將術(shù)語及術(shù)語關(guān)系封裝成具有雙向鏈表功能的鄰接表即adjTable,供本體推演模塊調(diào)用,從而實現(xiàn)正向和方向兩個方向的遍歷和查找功能。
      (7)讀取adjTable中數(shù)據(jù),根據(jù)用戶的需求,所述用戶需求為術(shù)語樹、術(shù)語地圖、正向展示、反向展示;系統(tǒng)從adjTable中讀取相關(guān)數(shù)據(jù),封裝到成tempData數(shù)據(jù)包。(8)解析tempData數(shù)據(jù)包,根據(jù)用戶選擇,系統(tǒng)自動生成術(shù)語樹或術(shù)語地圖,并利用信息可視化技術(shù)和工具進行展示;根據(jù)用戶的需要可以正向展示圖譜或者反向展示圖譜,并為用戶提供搜索、瀏覽某個具體術(shù)語的功能。上述各模塊的具體實現(xiàn)過程如下I.敘詞表解析流程該流程的實現(xiàn)過程如圖2所示(I)系統(tǒng)首先讀入敘詞表文件,驗證敘詞表文件是否合法;(2)將敘詞表文件通過轉(zhuǎn)換模塊,將文件轉(zhuǎn)換成txt文件,即temp. txt ;(3)程序首次遍歷待解析temp, txt,按照敘詞表中分節(jié)符進行讀取,以創(chuàng)建敘詞,在創(chuàng)建過程中如果創(chuàng)建出錯則跳過,解析下一條敘詞;(3. I)第二次遍歷待解析文本,根據(jù)讀取的敘詞進行定位,讀取術(shù)語之間的關(guān)系以寫入本體模型;(3. 2)把敘詞及其關(guān)系存儲到HashMap中。(4)跳轉(zhuǎn)到第2步;(5)最后在解析轉(zhuǎn)換完成后,生成敘詞映射文件。(6)結(jié)束。2.本體文件自動解析流程該流程主要包括術(shù)語及關(guān)系重構(gòu)、術(shù)語及關(guān)系映射和規(guī)范性自檢組成,其的實現(xiàn)過程如圖3所示(I)系統(tǒng)首先讀入敘詞表映射文件,驗證敘詞表文件是否合法;(2)解析敘詞表映射文件;(3)遍歷敘詞表映射文件,讀取敘詞,按照本體的生成規(guī)則,創(chuàng)建相應(yīng)的術(shù)語;(3. I)如果成功,則并存入術(shù)語映射表中;(3. 2)如果不成功,則把錯誤信息記錄到日志文件。(4)根據(jù)當(dāng)前術(shù)語,再次遍歷敘詞表映射文件,獲取術(shù)語的關(guān)系;(4. I)用、代關(guān)系存儲到敘詞相關(guān)的map <索弓丨,關(guān)系>中。(4.2)屬、分關(guān)系存儲到敘詞相關(guān)的map <索引,關(guān)系> 中,在敘詞A中存儲的是屬的關(guān)系,在敘詞B中存儲的分的關(guān)系。(4. 3)其他關(guān)系處理(5)敘詞及其關(guān)系樹結(jié)構(gòu)存儲到relationTable中;(6)轉(zhuǎn)到步驟4繼續(xù)。(7)敘詞結(jié)構(gòu)體存儲到thesaurusTable中;(9)轉(zhuǎn)到步驟2繼續(xù)。3.本體文件更新流程該流程其的實現(xiàn)過程如圖4所示(I)讀取初始本體文或本體文件,并進行校驗;(2)解析初始本體文件或本體文件;
      (3)獲取用戶需求信息;(3. I)修改初始本體文件讀取日志文件,讀取錯誤信息,進行修改相關(guān)的術(shù)語及其關(guān)系。(3. 2)編輯本體文件添加術(shù)語在本體文件中,增加一條術(shù)語;刪除術(shù)語在本體文件中,刪除一條術(shù)語;修改術(shù)語在本體文件中,修改一條術(shù)語;(4)跳轉(zhuǎn)到第3步;(5)用戶發(fā)送修改數(shù)據(jù)到服務(wù)器端;(6)術(shù)語更新根據(jù)用戶的修改信息,調(diào)用規(guī)范性自檢模塊進行校對,對本體文件進行校對,如果沒有錯誤,則重新生成本體文件;(7)跳轉(zhuǎn)到第I部或介紹。4.術(shù)語可視化展示流程該流程主要包括術(shù)語及關(guān)系重構(gòu)、術(shù)語及關(guān)系映射和規(guī)范性自檢組成,其的實現(xiàn)過程如圖5所示(I)接受用戶請求查詢的術(shù)語;(2)判斷術(shù)語是否在本體庫中(3)根據(jù)用戶請求的展示方式(樹狀展示或網(wǎng)狀展示,正向展示或反向展示),構(gòu)建圖形。(3. I)若用戶選擇樹狀展示,遍歷本體庫中各本體術(shù)語,將術(shù)語及術(shù)語屬性內(nèi)容構(gòu)建到prefuse樹狀數(shù)據(jù)類型的對象中,同時屏蔽由于網(wǎng)狀結(jié)構(gòu)而造成的重復(fù)循環(huán)情況。(3. 2)若用戶選擇網(wǎng)狀漲勢,遍歷本體庫中各本體術(shù)語,將術(shù)語及術(shù)語屬性內(nèi)容構(gòu)建到prefuse網(wǎng)狀數(shù)據(jù)類型的對象中。(4)將知識圖譜通過applet小程序展現(xiàn)出來。(5)根據(jù)用戶選擇,圖形可以更改根節(jié)點,網(wǎng)絡(luò)或樹圖方向,展開級別等。(6)根據(jù)用戶菜單選擇提交選擇術(shù)語關(guān)聯(lián)的知識。5.術(shù)語檢索流程該流程的實現(xiàn)過程如圖6所示(I)系統(tǒng)中提供概念語義檢索與關(guān)鍵詞檢索兩種檢索方式,系統(tǒng)根據(jù)用戶選擇進行判斷。(2)若用戶概念語義網(wǎng)檢索,系統(tǒng)將根據(jù)用戶的檢索關(guān)鍵詞匹配本體庫中相關(guān)術(shù)語,按照關(guān)鍵詞及相關(guān)度最高的術(shù)語查詢知識庫中知識,系統(tǒng)同時匹配用戶的知識瀏覽權(quán)限。(3)若用戶選擇關(guān)鍵詞檢索,則系統(tǒng)將根據(jù)用戶填寫的查詢表單進行查詢,表單中包括一般知識中的各種屬性。系統(tǒng)將用戶查詢的條件匹配用戶的知識瀏覽權(quán)限進行查詢。(4)系統(tǒng)提供在結(jié)果中查詢方法,根據(jù)用戶上次操作的查詢條件與本次查詢條件交集取得最終查詢結(jié)果。應(yīng)用舉例本發(fā)明的系統(tǒng)及方法已經(jīng)成功應(yīng)用于航天運載火箭技術(shù)研究院的航天器型號的研制中,輔助不同業(yè)務(wù)領(lǐng)域的設(shè)計人員不需要逐條術(shù)語進行手動編輯,減少了設(shè)計人員輸入錯誤,極大的提高了工作效率,保證了型號研發(fā)進度。本發(fā)明未詳細描述的部分屬于本領(lǐng)域公知技術(shù)。
      權(quán)利要求
      1.一種基于敘詞表的本體自動生成系統(tǒng),其特征在于包括服務(wù)器和客戶端,其中服務(wù)器端包括敘詞表解析模塊、術(shù)語及關(guān)系映射模塊、術(shù)語及關(guān)系重構(gòu)模塊、規(guī)范性自檢模塊、本體文件更新模塊、本體解析模塊、本體推演模塊和術(shù)語圖譜構(gòu)建模塊;客戶端進行敘詞表文件導(dǎo)入、本體編輯和展示,具體如下 敘詞表解析模塊首先對敘詞表進行預(yù)處理,將序詞表解析成方便程序進行處理的txt格式;然后逐條地對敘詞中敘詞進行處理,分離出敘詞及敘詞關(guān)系,所述術(shù)語關(guān)系是用代關(guān)系、屬分關(guān)系及相關(guān)關(guān)系;把敘詞表中的敘詞及敘詞關(guān)系通過索引的形式映射到敘詞映射文件中,所示敘詞映射文件是用于存儲敘詞及敘詞關(guān)系的文件,敘詞映射文件供術(shù)語及術(shù)語關(guān)系映射模塊解析; 術(shù)語及關(guān)系映射模塊對敘詞映射文件進行解析,獲取敘詞索引信息,將敘詞按敘詞所屬范疇分成若干類,并區(qū)分出上位詞、下位詞和族首詞,存儲到術(shù)語表,即thesaurusTable ;根據(jù)解析結(jié)果,對敘詞術(shù)語關(guān)系進行語法分析,檢查每個敘詞的關(guān)系是否符合語法規(guī)則,分析完一個敘詞,并進行相應(yīng)的存儲,當(dāng)所有的敘詞分析完后,構(gòu)成形成敘詞關(guān)系分析樹,各相關(guān)敘詞存放在分析樹的節(jié)點中,并按照等同關(guān)系、屬分關(guān)系以及相關(guān)關(guān)系存儲到關(guān)系表,即relati0nTable ;通過對敘詞映射文件進行預(yù)處理,將敘詞轉(zhuǎn)變成本體中的概念,使敘詞映射文件真正成為領(lǐng)域本體建設(shè)的基礎(chǔ)資源; 術(shù)語及關(guān)系重構(gòu)模塊對thesaurusTable進行循環(huán)遍歷,取出每個術(shù)語,把每個術(shù)語轉(zhuǎn)換成本體類的主屬性,然后遍歷relationTable表,獲取當(dāng)前術(shù)語關(guān)系分析樹,確定與其相關(guān)術(shù)語間的等級關(guān)系,然后對術(shù)語及術(shù)語關(guān)系進行處理,轉(zhuǎn)換為初始本體中相應(yīng)的類及層次關(guān)系,最終生成初始本體文件,供規(guī)范性自檢模塊調(diào)用; 規(guī)范性自檢模塊讀取初始本體文件,對初始本體文件進行概念、類、及屬性進行檢查,如果不存在問題,則自動生成本體文件;如果存在問題,則保存到日志文件中,繼續(xù)解析下一條術(shù)語;當(dāng)解析完成后,系統(tǒng)自動把初始本體文件及日志推送到客戶端本體編輯模塊;本體文件更新模塊響應(yīng)用戶對本體文件或初始本體文件編輯操作,所述操作有添加、刪除、修改,并根據(jù)用戶的操作,重新構(gòu)建新的本體文件。本體文件更新模塊會自動調(diào)用規(guī)范性自檢模塊,最終生成本體文件,供本體解析模塊調(diào)用; 本體解析模塊負責(zé)解析本體文件,把術(shù)語及術(shù)語關(guān)聯(lián)關(guān)系進行分解,一個術(shù)語節(jié)點可以分解為多個子節(jié)點,從而構(gòu)成樹狀結(jié)構(gòu);一組被連接的術(shù)語節(jié)點代表一個術(shù)語集合或一個術(shù)語流程,從而構(gòu)成圖狀結(jié)構(gòu);在本體文件解析過程中,將術(shù)語及術(shù)語關(guān)系封裝成具有雙向鏈表功能的鄰接表即ad j Tab I e,供本體推演模塊調(diào)用,從而實現(xiàn)正向和方向兩個方向的遍歷和查找功能; 本體推演模塊負責(zé)讀取adjTable中數(shù)據(jù),根據(jù)用戶的需求,所述用戶需求為術(shù)語樹、術(shù)語地圖、正向展示、反向展示;系統(tǒng)從adjTable中讀取相關(guān)數(shù)據(jù),封裝到成tempData數(shù)據(jù)包,供術(shù)語圖譜模塊調(diào)用; 術(shù)語圖譜構(gòu)建模塊對tempData數(shù)據(jù)包進行解析,根據(jù)用戶選擇,系統(tǒng)自動生成術(shù)語樹或術(shù)語地圖,并利用信息可視化技術(shù)和工具進行展示;根據(jù)用戶的需要可以正向展示圖譜或者反向展示圖譜,并為用戶提供搜索、瀏覽某個具體術(shù)語的功能。
      2.基于敘詞表的本體自動生成方法,其特征在于步驟如下 (I)對敘詞表文件進行解析,分離出敘詞及敘詞關(guān)系;首先對敘詞表進行預(yù)處理,將序詞表轉(zhuǎn)換成方便程序進行處理的txt格式,即thesaurus. txt ;然后遍歷thesaurus, txt文件,逐條地對敘詞進行處理,分離出敘詞及敘詞關(guān)系;把敘詞表中的敘詞及敘詞關(guān)系通過索引的形式映射到存儲到已經(jīng)定義好的哈希表中,即HashMap,當(dāng)解析結(jié)束后,把全部數(shù)據(jù)存儲到敘詞映射文件,即thesaurusMapFile,供術(shù)語及關(guān)系映射模塊調(diào)用; (2)對thesaurusMapFile進行解析,根據(jù)索引信息,將敘詞按其概念所屬范疇分成若干類,第一次循環(huán)遍歷thesaurusMapFile,讀取每個敘詞,區(qū)分出上位詞、下位詞和族首詞,并存儲到術(shù)語表中,即thesaurusTable ;再次遍歷敘詞映射文件,解析出敘詞的用、代、屬、分等關(guān)系根據(jù)等同關(guān)系、屬分關(guān)系以及相關(guān)關(guān)系;當(dāng)所有的敘詞分析完后,構(gòu)成形成敘詞關(guān)系分析樹,各相關(guān)敘詞存放在分析樹的節(jié)點中,并存儲到關(guān)系表中,即relationTable,供術(shù)語及關(guān)系重構(gòu)模塊調(diào)用; (3)對thesaurusTable進行循環(huán)遍歷,取出每個術(shù)語,把每個術(shù)語轉(zhuǎn)換成本體類的主屬性,再次遍歷relationTable表,獲取當(dāng)前術(shù)語關(guān)系分析樹,獲取術(shù)語的用代關(guān)系,屬分關(guān)系和相關(guān)關(guān)系,并轉(zhuǎn)換為初始本體中相應(yīng)的類及層次關(guān)系,最終生成初始本體文件,供規(guī)范性自檢模塊調(diào)用; (4)客戶端可以對術(shù)語進行編輯,方便查看、修改已經(jīng)生成的術(shù)語初始本體文件或本體文件;對于有問題的初始本體文件,系統(tǒng)自動推送到客戶端,供有戶進行修改;沒有問題的初始本體文件,用戶可以手動調(diào)用進行編輯;用戶對本體做修改時,修改信息儲存在緩存臨時表中,即tempTab,當(dāng)用戶退出程序或點擊保存按鈕時修改信息自動傳送到服務(wù)器中,并寫入本體文件;初始本體文件沒有問題后,經(jīng)過規(guī)范性自檢流程,自動生成本體文件; (5)客戶端發(fā)起查看術(shù)語及術(shù)語關(guān)系的請求,所示請求有知識樹、知識地圖、正向展示和反向展示;根據(jù)客戶端的請求,服務(wù)器端對本體文件的解析,把術(shù)語及術(shù)語關(guān)聯(lián)關(guān)系進行 分解,一個術(shù)語節(jié)點可以分解為多個子節(jié)點,從而構(gòu)成樹狀結(jié)構(gòu);一組術(shù)語節(jié)點代表一個術(shù)語集合或一個術(shù)語流程,從而構(gòu)成圖狀結(jié)構(gòu);在術(shù)語解析過程中,將術(shù)語及術(shù)語關(guān)系解析成具有雙向鏈表功能的鄰接表,即adjTable中,實現(xiàn)正向展示圖譜功能和反向展示圖譜功倉泛。
      全文摘要
      一種基于敘詞表的本體自動生成系統(tǒng)及其方法,自動完成由敘詞表到本體文件的轉(zhuǎn)換。該系統(tǒng)由8個模塊組成解析模塊、術(shù)語及關(guān)系映射模塊、術(shù)語及關(guān)系重構(gòu)模塊、規(guī)范性自檢模塊、本體文件更新模塊、本體解析模塊、本體推演模塊和術(shù)語圖譜構(gòu)建構(gòu)成。該系統(tǒng)提供一種本體庫自動生成系統(tǒng)及其方法,用戶不需要逐條術(shù)語進行手動編輯,減少了用戶輸入錯誤,提高效率;同時,首次采用具有雙向結(jié)構(gòu)的鄰接表作為術(shù)語顯示的映射表,在術(shù)語展示層實現(xiàn)了傳統(tǒng)的正向展示圖譜、查看術(shù)語間的關(guān)系,又可以反向展示圖譜、查看術(shù)語間的關(guān)系,方便用戶查看術(shù)語的關(guān)系;避免了單一的展示方式,同時支持搜索功能,便于查找術(shù)語。
      文檔編號G06F17/30GK102982095SQ20121043383
      公開日2013年3月20日 申請日期2012年10月31日 優(yōu)先權(quán)日2012年10月31日
      發(fā)明者王立偉, 張巍, 楊秋皓, 許怡婷, 張冶, 王志勇, 章樂平, 楊玉堃, 畢經(jīng)元, 褚厚斌, 賈倩, 杜俊鵬 申請人:中國運載火箭技術(shù)研究院
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1