一種基于語(yǔ)義分析的知識(shí)推送系統(tǒng)及方法
【專利摘要】本發(fā)明公開了一種基于語(yǔ)義分析的知識(shí)推送系統(tǒng),包括知識(shí)捕獲模塊、知識(shí)推送模塊、知識(shí)采集模塊和知識(shí)庫(kù);通過(guò)知識(shí)采集模塊錄入知識(shí)的基本信息、進(jìn)行知識(shí)上傳、對(duì)上傳的知識(shí)進(jìn)行主題計(jì)算獲得該知識(shí)對(duì)應(yīng)的主題,并將上傳的知識(shí)和該知識(shí)對(duì)應(yīng)的基本信息、主題存入知識(shí)庫(kù);其中主題計(jì)算采用基于潛在語(yǔ)義分析的算法進(jìn)行處理;知識(shí)捕獲模塊每隔一段時(shí)間調(diào)用一次設(shè)計(jì)系統(tǒng)的接口函數(shù)從而捕獲設(shè)計(jì)場(chǎng)景信息,并將捕獲的設(shè)計(jì)場(chǎng)景信息發(fā)送至知識(shí)推送模塊;知識(shí)推送模塊根據(jù)捕獲的設(shè)計(jì)場(chǎng)景信息按知識(shí)的類別將相應(yīng)的知識(shí)推送至設(shè)計(jì)系統(tǒng)。本發(fā)明能夠自動(dòng)準(zhǔn)確捕獲用戶設(shè)計(jì)場(chǎng)景下的實(shí)際需求,并可以獲得更加準(zhǔn)確、符合設(shè)計(jì)人員需求的知識(shí)資源,節(jié)省了大量搜索知識(shí)的時(shí)間。
【專利說(shuō)明】一種基于語(yǔ)義分析的知識(shí)推送系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種基于語(yǔ)義分析的知識(shí)推送系統(tǒng)及方法。
【背景技術(shù)】
[0002]傳統(tǒng)的通過(guò)搜索技術(shù)獲取知識(shí)的方式不能滿足用戶在缺乏關(guān)鍵詞情況時(shí)的知識(shí)需求,且搜索方式獲取的知識(shí)內(nèi)容準(zhǔn)確性低,知識(shí)之間缺乏關(guān)聯(lián)關(guān)系,設(shè)計(jì)人員甚至不希望在執(zhí)行任務(wù)時(shí)花費(fèi)大量的時(shí)間在搜索上,而希望在需要相關(guān)知識(shí)時(shí),系統(tǒng)能夠“雪中送炭”。知識(shí)推送系統(tǒng)的出現(xiàn)使得知識(shí)的獲取方式由“搜索”變?yōu)椤巴扑汀?,解決了該問(wèn)題。
[0003]目前的知識(shí)推送系統(tǒng)一般是基于設(shè)計(jì)人員自定義關(guān)鍵詞的方式進(jìn)行知識(shí)推送,不能對(duì)設(shè)計(jì)人員的真實(shí)需求做出準(zhǔn)確的判斷,導(dǎo)致推送的知識(shí)難以符合設(shè)計(jì)人員的需求。另夕卜,在獲取設(shè)計(jì)人員需求之后,獲取知識(shí)的方式一般采用關(guān)鍵詞出現(xiàn)的頻率決定搜索結(jié)果的排序,獲取方式過(guò)于單一。
【發(fā)明內(nèi)容】
[0004]本發(fā)明所要解決的技術(shù)問(wèn)題是:提供一種基于語(yǔ)義分析的知識(shí)推送系統(tǒng)及方法,能夠自動(dòng)準(zhǔn)確捕獲用戶設(shè)計(jì)場(chǎng)景下的實(shí)際需求,并可以獲得更加準(zhǔn)確、具有關(guān)聯(lián)關(guān)系、符合設(shè)計(jì)人員需求的知識(shí)資源,節(jié)省了大量搜索知識(shí)的時(shí)間,提高了工作效率。
[0005]本發(fā)明技術(shù)方案如下:
[0006]一種基于語(yǔ)義分析的知識(shí)推送系統(tǒng),包括知識(shí)捕獲模塊、知識(shí)推送模塊、知識(shí)采集模塊和知識(shí)庫(kù);在設(shè)計(jì)系統(tǒng)中封裝用于捕獲設(shè)計(jì)場(chǎng)景信息的接口函數(shù);
[0007]通過(guò)知識(shí)采集模塊錄入知識(shí)的基本信息、進(jìn)行知識(shí)上傳、對(duì)上傳的知識(shí)進(jìn)行主題計(jì)算獲得該知識(shí)對(duì)應(yīng)的主題,并將上傳的知識(shí)和該知識(shí)對(duì)應(yīng)的基本信息、主題存入知識(shí)庫(kù);其中主題計(jì)算采用基于潛在語(yǔ)義分析的算法進(jìn)行處理;所述知識(shí)的基本信息包括知識(shí)資源名稱、所屬知識(shí)的類別、創(chuàng)建人和創(chuàng)建時(shí)間;
[0008]知識(shí)捕獲模塊每隔一段時(shí)間調(diào)用一次所述接口函數(shù)從而捕獲設(shè)計(jì)場(chǎng)景信息,并將捕獲的設(shè)計(jì)場(chǎng)景信息發(fā)送至知識(shí)推送模塊;
[0009]知識(shí)推送模塊對(duì)捕獲的設(shè)計(jì)場(chǎng)景信息進(jìn)行分詞形成特征詞集合;計(jì)算特征詞集合中每個(gè)特征詞在設(shè)計(jì)場(chǎng)景信息中的權(quán)重形成權(quán)重集合;遍歷知識(shí)庫(kù)中所有的知識(shí),使用特征詞集合與知識(shí)庫(kù)中的每個(gè)知識(shí)的主題進(jìn)行匹配計(jì)算,統(tǒng)計(jì)特征詞集合的每個(gè)特征詞的匹配次數(shù)獲得匹配次數(shù)集合;將匹配次數(shù)集合與權(quán)重集合中的對(duì)應(yīng)元素相乘后求和獲得該知識(shí)的主題與特征詞集合的匹配度;對(duì)知識(shí)庫(kù)中的所有知識(shí)按知識(shí)的類別進(jìn)行匹配度排序獲得排序后的結(jié)果;將排序后的結(jié)果按知識(shí)的類別推送至設(shè)計(jì)系統(tǒng)。
[0010]所述知識(shí)的類別包括設(shè)計(jì)規(guī)范、最佳實(shí)踐、經(jīng)驗(yàn)技巧和故障案例。
[0011]所述設(shè)計(jì)場(chǎng)景信息包括具體參數(shù)信息、任務(wù)信息、模型信息和文檔信息;所述任務(wù)信息包括任務(wù)名稱、任務(wù)描述和任務(wù)所屬專業(yè)名稱;所述文檔信息為文檔的關(guān)鍵詞;所述模型信息包括模型名稱、類別名稱以及模型打開工具名稱。[0012]一種基于語(yǔ)義分析的知識(shí)推送方法,包括如下步驟:
[0013]錄入知識(shí)的基本信息、進(jìn)行知識(shí)上傳、對(duì)上傳的知識(shí)進(jìn)行主題計(jì)算獲得該知識(shí)對(duì)應(yīng)的主題,并將上傳的知識(shí)和該知識(shí)對(duì)應(yīng)的基本信息、主題存入知識(shí)庫(kù);其中主題計(jì)算采用基于潛在語(yǔ)義分析的算法進(jìn)行處理;所述知識(shí)的基本信息包括知識(shí)資源名稱、所屬知識(shí)的類別、創(chuàng)建人和創(chuàng)建時(shí)間;
[0014]每隔一段時(shí)間調(diào)用一次設(shè)計(jì)系統(tǒng)中的接口函數(shù)從而捕獲設(shè)計(jì)場(chǎng)景信息;
[0015]對(duì)捕獲的設(shè)計(jì)場(chǎng)景信息進(jìn)行分詞形成特征詞集合;計(jì)算特征詞集合中每個(gè)特征詞在設(shè)計(jì)場(chǎng)景信息中的權(quán)重形成權(quán)重集合;遍歷知識(shí)庫(kù)中所有的知識(shí),使用特征詞集合與知識(shí)庫(kù)中的每個(gè)知識(shí)的主題進(jìn)行匹配計(jì)算,統(tǒng)計(jì)特征詞集合的每個(gè)特征詞的匹配次數(shù)獲得匹配次數(shù)集合;將匹配次數(shù)集合與權(quán)重集合中的對(duì)應(yīng)元素相乘后求和獲得該知識(shí)的主題與特征詞集合的匹配度;對(duì)知識(shí)庫(kù)中的所有知識(shí)按知識(shí)的類別進(jìn)行匹配度排序獲得排序后的結(jié)果;將排序后的結(jié)果按知識(shí)的類別推送至設(shè)計(jì)系統(tǒng)。
[0016]本發(fā)明與現(xiàn)有技術(shù)相比具有如下有益效果:
[0017](I)本發(fā)明通過(guò)知識(shí)捕獲模塊自動(dòng)捕獲用戶設(shè)計(jì)場(chǎng)景下的實(shí)際需求,解決了現(xiàn)有知識(shí)推送系統(tǒng)獲取設(shè)計(jì)人員需求的不準(zhǔn)確性問(wèn)題。
[0018](2)采用基于潛在語(yǔ)義分析技術(shù)的知識(shí)采集技術(shù),實(shí)際上對(duì)上傳的知識(shí)資源做了“降噪”處理,使得主題更加清晰、準(zhǔn)確,提高了知識(shí)推送時(shí)捕獲信息與知識(shí)資源匹配的精確度,使得推送的知識(shí)資源與設(shè)計(jì)人員的需求更加吻合。
[0019](3)通過(guò)知識(shí)捕獲信息與知識(shí)資源主題進(jìn)行匹配計(jì)算,與傳統(tǒng)的全文匹配計(jì)算相比,大大提升了計(jì)算速度。
[0020](4)采用推送技術(shù)節(jié)省了設(shè)計(jì)人員搜索知識(shí)時(shí)花費(fèi)的大量時(shí)間,提高了工作效率。采用推送技術(shù)使得知識(shí)管理系統(tǒng)與企業(yè)業(yè)務(wù)系統(tǒng)相互融合,解決了一般知識(shí)管理系統(tǒng)訪問(wèn)量低的問(wèn)題,大大提高了知識(shí)資源的使用率。
【專利附圖】
【附圖說(shuō)明】
[0021]圖1為本發(fā)明系統(tǒng)的總體結(jié)構(gòu)圖;
[0022]圖2為本發(fā)明中知識(shí)捕獲模塊的算法流程圖;
[0023]圖3為本發(fā)明中知識(shí)推送模塊的算法流程圖;
[0024]圖4為本發(fā)明中知識(shí)采集模塊中主題計(jì)算的算法流程圖。
【具體實(shí)施方式】
[0025]如圖1所示,本發(fā)明的系統(tǒng)包括知識(shí)捕獲模塊、知識(shí)推送模塊、知識(shí)采集模塊和知識(shí)庫(kù)。
[0026]1、知識(shí)捕獲,主要通過(guò)軟件集成技術(shù)實(shí)現(xiàn)對(duì)設(shè)計(jì)人員的設(shè)計(jì)場(chǎng)景信息進(jìn)行捕獲,獲取設(shè)計(jì)人員設(shè)計(jì)場(chǎng)景的具體任務(wù)信息、模型信息、文檔信息、參數(shù)信息,然后將捕獲的信息發(fā)送給知識(shí)推送模塊。
[0027]如圖1所示,在業(yè)務(wù)系統(tǒng)或者設(shè)計(jì)系統(tǒng)的設(shè)計(jì)場(chǎng)景中包括任務(wù)(例如任務(wù)1、任務(wù)2和任務(wù)3)、模型(例如設(shè)計(jì)模型、有限元模型)、文檔(例如分析報(bào)告)和參數(shù)(例如指標(biāo)參數(shù)
1、指標(biāo)參數(shù)2和指標(biāo)參數(shù)3)。知識(shí)捕獲模塊的知識(shí)捕獲方式主要包括任務(wù)提取、模型提取、文檔提取和參數(shù)提取四種方式,四種知識(shí)捕獲方式使用的軟件集成技術(shù)主要通過(guò)web服務(wù)技術(shù)實(shí)現(xiàn),具體在業(yè)務(wù)系統(tǒng)或者設(shè)計(jì)系統(tǒng)中封裝上述四種捕獲方式所需的接口函數(shù),并對(duì)外開放,知識(shí)推送模塊每隔一段時(shí)間會(huì)調(diào)用一次接口函數(shù),來(lái)獲取設(shè)計(jì)人員的設(shè)計(jì)場(chǎng)景信息,并將捕獲的設(shè)計(jì)場(chǎng)景信息發(fā)送至知識(shí)推送模塊。四種獲取方式的算法執(zhí)行流程如圖2所示。
[0028]( I)任務(wù)提取,一般設(shè)計(jì)人員的任務(wù)通過(guò)設(shè)計(jì)系統(tǒng)進(jìn)行發(fā)放和審核,其主要實(shí)現(xiàn)機(jī)制一般基于工作流技術(shù)實(shí)現(xiàn),任務(wù)提取主要通過(guò)軟件集成技術(shù)根據(jù)當(dāng)前設(shè)計(jì)人員的用戶名,在工作流中獲取當(dāng)前用戶正在執(zhí)行的任務(wù)信息,獲取的任務(wù)信息包括任務(wù)名稱、任務(wù)描述、任務(wù)所屬專業(yè)名稱,然后將獲取的信息發(fā)送至知識(shí)推送模塊。例如,通過(guò)捕獲某結(jié)構(gòu)模態(tài)分析任務(wù)信息,可以知道該任務(wù)的結(jié)構(gòu)件名稱信息及載荷特性專業(yè)信息。
[0029](2)模型提取,設(shè)計(jì)人員操作的模型一般作為任務(wù)附件進(jìn)行管理,通過(guò)軟件集成技術(shù)獲取任務(wù)的附件名稱,再對(duì)交付物本身進(jìn)行格式判別,根據(jù)文件格式可以從系統(tǒng)配置信息中獲取設(shè)計(jì)人員當(dāng)前操作的模型名稱、類別名稱以及模型打開工具名稱,然后將獲取的信息發(fā)送至知識(shí)推送模塊。
[0030](3)文檔提取,設(shè)計(jì)人員查看和編寫的文檔一般作為任務(wù)附件進(jìn)行管理,同樣通過(guò)軟件集成技術(shù)獲取任務(wù)附件,經(jīng)過(guò)格式判別后獲取文檔的名稱信息,并在后臺(tái)打開該文檔對(duì)該文檔做分詞、濾詞、頻率統(tǒng)計(jì)處理,獲取該文檔的關(guān)鍵詞,然后將獲取的信息發(fā)送至知識(shí)推送模塊。
[0031](4)參數(shù)提取,參數(shù)是任務(wù)的指標(biāo)信息包括輸入?yún)?shù)和輸出參數(shù),可以通過(guò)軟件集成技術(shù)獲取參數(shù)的名稱,然后將獲取的信息發(fā)送至知識(shí)推送模塊。
[0032]2、知識(shí)推送,知識(shí)推送模塊在獲取設(shè)計(jì)人員需求信息后,對(duì)信息進(jìn)行分詞、權(quán)重計(jì)算,然后與知識(shí)庫(kù)中經(jīng)過(guò)知識(shí)采集處理的知識(shí)資源信息進(jìn)行匹配計(jì)算,對(duì)匹配結(jié)果進(jìn)行分類、排序后推送至設(shè)計(jì)人員桌面,詳細(xì)執(zhí)行過(guò)程如圖3所示。
[0033](I)對(duì)從知識(shí)捕獲模塊獲得的設(shè)計(jì)場(chǎng)景信息進(jìn)行分詞形成特征詞集合G= Ig1, g2, g3.? ? gn};
[0034](2)計(jì)算每個(gè)特征詞在設(shè)計(jì)場(chǎng)景信息中的權(quán)重形成權(quán)重集合Q=Iq1, q2, q3.? ? qj ;
[0035](3)遍歷知識(shí)庫(kù)中所有的知識(shí)資源,該類知識(shí)資源在進(jìn)行知識(shí)采集時(shí)是經(jīng)過(guò)主題計(jì)算處理的;
[0036](4)使用特征詞集合G與知識(shí)庫(kù)中的知識(shí)主題進(jìn)行匹配計(jì)算,統(tǒng)計(jì)每一個(gè)特征詞的匹配次數(shù)形成匹配次數(shù)集合M=Im1, m2, m3...mn},M與權(quán)重Q的乘積和形成匹配度P,
【權(quán)利要求】
1.一種基于語(yǔ)義分析的知識(shí)推送系統(tǒng),其特征在于,包括知識(shí)捕獲模塊、知識(shí)推送模塊、知識(shí)采集模塊和知識(shí)庫(kù);在設(shè)計(jì)系統(tǒng)中封裝用于捕獲設(shè)計(jì)場(chǎng)景信息的接口函數(shù); 通過(guò)知識(shí)采集模塊錄入知識(shí)的基本信息、進(jìn)行知識(shí)上傳、對(duì)上傳的知識(shí)進(jìn)行主題計(jì)算獲得該知識(shí)對(duì)應(yīng)的主題,并將上傳的知識(shí)和該知識(shí)對(duì)應(yīng)的基本信息、主題存入知識(shí)庫(kù);其中主題計(jì)算采用基于潛在語(yǔ)義分析的算法進(jìn)行處理;所述知識(shí)的基本信息包括知識(shí)資源名稱、所屬知識(shí)的類別、創(chuàng)建人和創(chuàng)建時(shí)間; 知識(shí)捕獲模塊每隔一段時(shí)間調(diào)用一次所述接口函數(shù)從而捕獲設(shè)計(jì)場(chǎng)景信息,并將捕獲的設(shè)計(jì)場(chǎng)景信息發(fā)送至知識(shí)推送模塊; 知識(shí)推送模塊對(duì)捕獲的設(shè)計(jì)場(chǎng)景信息進(jìn)行分詞形成特征詞集合;計(jì)算特征詞集合中每個(gè)特征詞在設(shè)計(jì)場(chǎng)景信息中的權(quán)重形成權(quán)重集合;遍歷知識(shí)庫(kù)中所有的知識(shí),使用特征詞集合與知識(shí)庫(kù)中的每個(gè)知識(shí)的主題進(jìn)行匹配計(jì)算,統(tǒng)計(jì)特征詞集合的每個(gè)特征詞的匹配次數(shù)獲得匹配次數(shù)集合合;將匹配次數(shù)集合與權(quán)重集合中的對(duì)應(yīng)元素相乘后求和獲得該知識(shí)的主題與特征詞集合的匹配度;對(duì)知識(shí)庫(kù)中的所有知識(shí)按知識(shí)的類別進(jìn)行匹配度排序獲得排序后的結(jié)果;將排序后的結(jié)果按知識(shí)的類別推送至設(shè)計(jì)系統(tǒng)。
2.如權(quán)利要求1所述的知識(shí)推送系統(tǒng),其特征在于:所述知識(shí)的類別包括設(shè)計(jì)規(guī)范、最佳實(shí)踐、經(jīng)驗(yàn)技巧和故障案例。
3.如權(quán)利要求1所述的知識(shí)推送系統(tǒng),其特征在于:所述設(shè)計(jì)場(chǎng)景信息包括具體參數(shù)信息、任務(wù)信息、模型信息和文檔信息;所述任務(wù)信息包括任務(wù)名稱、任務(wù)描述和任務(wù)所屬專業(yè)名稱;所述文檔信息為文檔的關(guān)鍵詞;所述模型信息包括模型名稱、類別名稱以及模型打開工具名稱。
4.一種基于語(yǔ)義分析的知識(shí)推送方法,其特征在于,包括如下步驟: 錄入知識(shí)的基本信息、進(jìn)行知識(shí)上傳、對(duì)上傳的知識(shí)進(jìn)行主題計(jì)算獲得該知識(shí)對(duì)應(yīng)的主題,并將上傳的知識(shí)和該知識(shí)對(duì)應(yīng)的基本信息、主題存入知識(shí)庫(kù);其中主題計(jì)算采用基于潛在語(yǔ)義分析的算法進(jìn)行處理;所述知識(shí)的基本信息包括知識(shí)資源名稱、所屬知識(shí)的類別、創(chuàng)建人和創(chuàng)建時(shí)間; 每隔一段時(shí)間調(diào)用一次設(shè)計(jì)系統(tǒng)中的接口函數(shù)從而捕獲設(shè)計(jì)場(chǎng)景信息; 對(duì)捕獲的設(shè)計(jì)場(chǎng)景信息進(jìn)行分詞形成特征詞集合;計(jì)算特征詞集合中每個(gè)特征詞在設(shè)計(jì)場(chǎng)景信息中的權(quán)重形成權(quán)重集合;遍歷知識(shí)庫(kù)中所有的知識(shí),使用特征詞集合與知識(shí)庫(kù)中的每個(gè)知識(shí)的主題進(jìn)行匹配計(jì)算,統(tǒng)計(jì)特征詞集合的每個(gè)特征詞的匹配次數(shù)獲得匹配次數(shù)集合;將匹配次數(shù)集合與權(quán)重集合中的對(duì)應(yīng)元素相乘后求和獲得該知識(shí)的主題與特征詞集合的匹配度;對(duì)知識(shí)庫(kù)中的所有知識(shí)按知識(shí)的類別進(jìn)行匹配度排序獲得排序后的結(jié)果;將排序后的結(jié)果按知識(shí)的類別推送至設(shè)計(jì)系統(tǒng)。
5.如權(quán)利要求4所述的知識(shí)推送方法,其特征在于:所述知識(shí)的類別包括設(shè)計(jì)規(guī)范、最佳實(shí)踐、經(jīng)驗(yàn)技巧和故障案例。
6.如權(quán)利要求4所述的知識(shí)推送方法,其特征在于:所述設(shè)計(jì)場(chǎng)景信息包括具體參數(shù)信息、任務(wù)信息、模型信息和文檔信息。
【文檔編號(hào)】G06F17/30GK103593336SQ201310526924
【公開日】2014年2月19日 申請(qǐng)日期:2013年10月30日 優(yōu)先權(quán)日:2013年10月30日
【發(fā)明者】褚厚斌, 杜俊鵬, 王立偉, 賈倩, 畢經(jīng)元, 章樂(lè)平, 王長(zhǎng)慶, 楊玉堃, 侯雄, 許怡婷, 章雯, 楊秋皓, 張巍 申請(qǐng)人:中國(guó)運(yùn)載火箭技術(shù)研究院