專利名稱:利用醫(yī)藥語義網(wǎng)絡(luò)提高異構(gòu)系統(tǒng)之間匹配精度的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息技術(shù)領(lǐng)域,尤其涉及一種建立數(shù)據(jù)倉儲(chǔ)的方法。
背景技術(shù):
兩個(gè)或多個(gè)不同醫(yī)藥制造企業(yè)并購過程中,信息系統(tǒng)異構(gòu)數(shù)據(jù)源導(dǎo)致各個(gè)醫(yī)藥制造企業(yè)的數(shù)據(jù)無法有效整合,大大降低了企業(yè)信息系統(tǒng)整合效果,對(duì)并購過程和并購后的工作產(chǎn)生很多難題。目前解決這一問題都是通過手工匹配完成。對(duì)此,以前所作的研究大都集中在數(shù)據(jù)庫系統(tǒng)方面,特別是數(shù)據(jù)庫不同模式之間的轉(zhuǎn)換和匹配方面。然而,隨著INTERNET的發(fā)展,目前很多系統(tǒng)的數(shù)據(jù)都是在網(wǎng)絡(luò)上發(fā)布, 存在大數(shù)據(jù)量,數(shù)據(jù)動(dòng)態(tài)等問題。除去結(jié)構(gòu)化數(shù)據(jù)之外,很多數(shù)據(jù)都是半結(jié)構(gòu)化或無結(jié)構(gòu)地,而且數(shù)據(jù)量極為龐大。傳統(tǒng)的啟發(fā)式的,手動(dòng)的模式匹配方式無論是在效率或是精度方面都無法滿足目前應(yīng)用對(duì)數(shù)據(jù)集成的要求。數(shù)據(jù)模式的自動(dòng)匹配一直是提高系統(tǒng)智能化的一個(gè)難點(diǎn)。尤其是醫(yī)藥行業(yè),目前信息化程度較弱,匹配的精度很難提高。因此,提高異構(gòu)系統(tǒng)之間匹配精度,利用計(jì)算機(jī)系統(tǒng)對(duì)異構(gòu)數(shù)據(jù)源進(jìn)行匹配整合, 從而實(shí)現(xiàn)信息系統(tǒng)的有效整合是當(dāng)前存在并急需解決的問題。
發(fā)明內(nèi)容
為彌補(bǔ)現(xiàn)有技術(shù)的不足,本發(fā)明目的是提供一種利用醫(yī)藥語義網(wǎng)絡(luò)提高異構(gòu)系統(tǒng)之間匹配精度的方法,提供靈活多變、安全穩(wěn)定的游戲環(huán)境。為了實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案如下一種利用醫(yī)藥語義網(wǎng)絡(luò)提高異構(gòu)系統(tǒng)之間匹配精度的方法,其特征在于包含如下步驟建立醫(yī)藥行業(yè)的語義網(wǎng)絡(luò),該建立醫(yī)藥行業(yè)的語義網(wǎng)絡(luò)的方法為將第一語義和第二語義轉(zhuǎn)換為標(biāo)準(zhǔn)模式的語義,建立語義對(duì)應(yīng)關(guān)系;對(duì)于給定的第一語義,按照對(duì)應(yīng)關(guān)系給出匹配的第二語義。所述對(duì)應(yīng)關(guān)系包括標(biāo)準(zhǔn)模式與第一語義的對(duì)應(yīng)關(guān)系,標(biāo)準(zhǔn)模式與第二語義的對(duì)應(yīng)關(guān)系。所述將第一語義和第二語義轉(zhuǎn)換為標(biāo)準(zhǔn)模式的語義的過程為利用語義網(wǎng)絡(luò),采用由上而下的,配以剪枝的方法盡快得到候選匹配結(jié)果列表。所述結(jié)果列表的排序按照匹配度的值從高到低排列。本發(fā)明的有益效果應(yīng)用本發(fā)明可以使不同醫(yī)藥企業(yè)的不同信息系統(tǒng)異構(gòu)數(shù)據(jù)有效整合。
以下結(jié)合附圖和具體實(shí)施方式
來進(jìn)一步說明本發(fā)明。
圖1為本發(fā)明方法流程示意圖;圖2為本發(fā)明建立醫(yī)藥行業(yè)的語義網(wǎng)絡(luò)的具體流程圖。
具體實(shí)施例方式為了使本發(fā)明實(shí)現(xiàn)的技術(shù)手段、創(chuàng)作特征、達(dá)成目的與功效易于明白了解,下面結(jié)合具體圖示,進(jìn)一步闡述本發(fā)明。某個(gè)制藥企業(yè)的語義我們稱為第一語義,另外一個(gè)制藥企業(yè)的語義我們稱為第二語義,本發(fā)明的目標(biāo)是提高第一語義和第二語義的匹配精度與速度。此處為了描述與理解本發(fā)明簡(jiǎn)單化,僅以兩家制藥企業(yè)的兩種語義為例,更多語義采用相同的原理與方法。參見圖1,本發(fā)明一種利用醫(yī)藥語義網(wǎng)絡(luò)提高異構(gòu)系統(tǒng)之間匹配精度的方法,包含步驟101,建立醫(yī)藥行業(yè)的語義網(wǎng)絡(luò),存儲(chǔ)在數(shù)據(jù)庫中。因?yàn)獒t(yī)藥行業(yè)的特點(diǎn)是專用術(shù)語數(shù)目龐大,但內(nèi)容單一,所以建立語義網(wǎng)絡(luò)非常重要且可行。建立語義網(wǎng)絡(luò)的詳細(xì)方法為步驟a,將第一語義和第二語義轉(zhuǎn)換為標(biāo)準(zhǔn)模式的語義。本發(fā)明提供一個(gè)模式標(biāo)準(zhǔn), 所有不同模式的(例如兩個(gè)不同的制藥企業(yè)的兩個(gè)模式。為了描述簡(jiǎn)單化,我們僅用兩個(gè)模式為例。更多模式采用同樣的原理與方法。)語義均對(duì)應(yīng)并轉(zhuǎn)換成同一個(gè)標(biāo)準(zhǔn)模式。步驟 b,建立語義對(duì)應(yīng)關(guān)系,對(duì)應(yīng)關(guān)系包括標(biāo)準(zhǔn)模式與第一語義的對(duì)應(yīng)關(guān)系、標(biāo)準(zhǔn)模式與第二語義的對(duì)應(yīng)關(guān)系。在轉(zhuǎn)換過程中,利用語義網(wǎng)絡(luò),采用由上而下的,并配以剪枝的方法來盡快得到候選匹配結(jié)果列表,列表的排序按照匹配度的值從高到低排列??梢栽谌斯さ膸椭禄蚴峭ㄟ^機(jī)器學(xué)習(xí)的方法來進(jìn)一步提高轉(zhuǎn)化的自動(dòng)化程度和精度。步驟102,對(duì)于給定的第一語義,按照對(duì)應(yīng)關(guān)系給出匹配的第二語義。應(yīng)用本發(fā)明可以使不同醫(yī)藥企業(yè)的不同信息系統(tǒng)異構(gòu)數(shù)據(jù)有效整合,大大提高了企業(yè)信息系統(tǒng)的整合效果,對(duì)并購過程和并購后的工作順利展開提供支撐。
權(quán)利要求
1.一種利用醫(yī)藥語義網(wǎng)絡(luò)提高異構(gòu)系統(tǒng)之間匹配精度的方法,其特征在于包含如下步驟建立醫(yī)藥行業(yè)的語義網(wǎng)絡(luò),該建立醫(yī)藥行業(yè)的語義網(wǎng)絡(luò)的方法為將第一語義和第二語義轉(zhuǎn)換為標(biāo)準(zhǔn)模式的語義,建立語義對(duì)應(yīng)關(guān)系;對(duì)于給定的第一語義,按照對(duì)應(yīng)關(guān)系給出匹配的第二語義。
2.根據(jù)權(quán)利要求1所述的一種利用醫(yī)藥語義網(wǎng)絡(luò)提高異構(gòu)系統(tǒng)之間匹配精度的方法, 其特征在于,所述對(duì)應(yīng)關(guān)系包括標(biāo)準(zhǔn)模式與第一語義的對(duì)應(yīng)關(guān)系,標(biāo)準(zhǔn)模式與第二語義的對(duì)應(yīng)關(guān)系。
3.根據(jù)權(quán)利要求2所述的一種利用醫(yī)藥語義網(wǎng)絡(luò)提高異構(gòu)系統(tǒng)之間匹配精度的方法, 其特征在于,所述將第一語義和第二語義轉(zhuǎn)換為標(biāo)準(zhǔn)模式的語義的過程為利用語義網(wǎng)絡(luò), 采用由上而下的,配以剪枝的方法盡快得到候選匹配結(jié)果列表。
4.根據(jù)權(quán)利要求3所述的一種利用醫(yī)藥語義網(wǎng)絡(luò)提高異構(gòu)系統(tǒng)之間匹配精度的方法, 其特征在于,所述結(jié)果列表的排序按照匹配度的值從高到低排列。
5.根據(jù)權(quán)利要求1所述的一種利用醫(yī)藥語義網(wǎng)絡(luò)提高異構(gòu)系統(tǒng)之間匹配精度的方法, 其特征在于,還包含在人工的幫助下或是通過機(jī)器學(xué)習(xí)的方法來進(jìn)一步提高轉(zhuǎn)化的自動(dòng)化程度和精度。
全文摘要
本發(fā)明公開的是一種利用醫(yī)藥語義網(wǎng)絡(luò)提高異構(gòu)系統(tǒng)之間匹配精度的方法,其包括建立醫(yī)藥行業(yè)的語義網(wǎng)絡(luò),將第一語義和第二語義轉(zhuǎn)換為標(biāo)準(zhǔn)模式的語義并建立語義對(duì)應(yīng)關(guān)系;對(duì)于給定的第一語義,按照對(duì)應(yīng)關(guān)系給出匹配的第二語義。本發(fā)明提供了使不同醫(yī)藥企業(yè)的不同信息系統(tǒng)異構(gòu)數(shù)據(jù)有效整合的方法,大大提高了企業(yè)信息系統(tǒng)的整合效果,對(duì)企業(yè)并購過程和并購后的工作順利展開提供了有力支撐。
文檔編號(hào)G06F17/30GK102236671SQ20101016410
公開日2011年11月9日 申請(qǐng)日期2010年4月29日 優(yōu)先權(quán)日2010年4月29日
發(fā)明者劉卉, 王軼彤, 陸明偉 申請(qǐng)人:劉卉, 王軼彤, 陸明偉