一種Web服務(wù)相似度的計(jì)算方法
【專(zhuān)利摘要】本發(fā)明涉及一種Web服務(wù)相似度的計(jì)算方法。它是一種改進(jìn)最大二分匹配的兩階段服務(wù)相似度計(jì)算方法。它將Web服務(wù)所含的關(guān)鍵詞作為整體,考慮到了關(guān)鍵詞之間的關(guān)聯(lián)對(duì)Web服務(wù)相似度的影響,因而能夠更加有效的區(qū)分Web服務(wù)之間的相似程度,提高相似度計(jì)算的精度,其步驟是根據(jù)詞網(wǎng)或搜索引擎計(jì)算兩個(gè)Web服務(wù)中關(guān)鍵詞之間的距離;利用最大二分匹配算法找到未被匹配的關(guān)鍵詞;由于未被匹配的關(guān)鍵詞也是Web服務(wù)的一部分,而且與其它已經(jīng)匹配的關(guān)鍵詞之間存在內(nèi)在聯(lián)系,因此利用改進(jìn)的最大二分匹配的兩階段服務(wù)相似度計(jì)算方法可以得到更加精確的結(jié)果。
【專(zhuān)利說(shuō)明】一種Web服務(wù)相似度的計(jì)算方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種計(jì)算Web服務(wù)(網(wǎng)絡(luò)服務(wù))相似度的計(jì)算方法,特別是一種改進(jìn)最大二分匹配的兩階段服務(wù)相似度計(jì)算方法。
【背景技術(shù)】
[0002]Web服務(wù)的功能描述文檔WSDL,包含很少的文本信息,以傳統(tǒng)的信息檢索技術(shù)中的相似度計(jì)算方式,如TF/IDF,LSI等,不能很好的反映服務(wù)之間的相似程度。將Web服務(wù)作為獨(dú)立的關(guān)鍵詞集,根據(jù)關(guān)鍵詞之間的語(yǔ)義距離,計(jì)算最大二分匹配值作為Web服務(wù)相似度的方法,具有較好的可行性。但很多情況下,最大二分匹配不能將Web服務(wù)所包含的所有關(guān)鍵詞都考慮進(jìn)去,而一個(gè)Web服務(wù)所含的關(guān)鍵詞并不是孤立的,而是相互關(guān)聯(lián)的,為了在相似度計(jì)算過(guò)程中,更好的反映服務(wù)所包含的信息,需要更深入的相關(guān)研究。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的在于針對(duì)使用最大二分匹配計(jì)算網(wǎng)絡(luò)服務(wù)相似度的不足,提供一種Web服務(wù)相似度的計(jì)算方法,能更好的反映服務(wù)包含的關(guān)鍵詞之間的關(guān)聯(lián),并提高相似度計(jì)算的準(zhǔn)確度。
[0004]為了達(dá)到上述的目的,本發(fā)明的構(gòu)思是:第一步利用最大二分匹配衡量服務(wù)之間關(guān)系,第二步,考慮最大二分匹配不能包含的關(guān)鍵詞對(duì)服務(wù)相似度的影響,選取可以反映此種影響的計(jì)算方法,獲取服務(wù)之間的相似度。
[0005]
根據(jù)上述發(fā)明構(gòu)思,本發(fā)明采用下述技術(shù)方案:
一種Web服務(wù)(網(wǎng)絡(luò)服務(wù))相似度的計(jì)算方法,是一種兩階段法計(jì)算Web服務(wù)的相似度,對(duì)二分圖法進(jìn)行了改進(jìn),具體操作步驟如下:
(1)從需要比較的兩個(gè)Web服務(wù)的描述文檔WSDL(Web Service DescriptionLanguage)中提取關(guān)鍵詞,關(guān)鍵詞為名詞和形容詞;
兩個(gè)Web服務(wù)記為S11S2,服務(wù)的WSDL文檔中提取的關(guān)鍵詞集合,分別記為
S1=Iki) , S2=Ikj];
(2)計(jì)算兩個(gè)Web服務(wù)的每一對(duì)關(guān)鍵詞之間的距離,可以利用詞網(wǎng)Wordnet直接得到,也可以利用搜索引擎谷歌計(jì)算得到;
利用Wordnet提供的應(yīng)用程序可以直接得到每對(duì)關(guān)鍵詞之間的距離值;
利用搜索引擎歌谷歌計(jì)算每對(duì)關(guān)鍵詞之間距離的計(jì)算公式如下:
【權(quán)利要求】
1.一種Web服務(wù)相似度的計(jì)算方法,是一種兩階段法計(jì)算Web服務(wù)的相似度,對(duì)二分圖法進(jìn)行了改進(jìn),具體操作步驟如下: (1)從需要比較的兩個(gè)Web服務(wù)的描述文檔WSDL中提取關(guān)鍵詞,關(guān)鍵詞為名詞和形容詞; (2)計(jì)算兩個(gè)Web服務(wù)的每一對(duì)關(guān)鍵詞之間的距離:利用詞網(wǎng)Wordnet直接得到,或利用搜索引擎谷歌計(jì)算得到; (3)首先使用二分圖法,將兩個(gè)Web服務(wù)所含的關(guān)鍵詞看作圖中的點(diǎn),兩個(gè)Web服務(wù)是兩個(gè)不相交的點(diǎn)集,每對(duì)關(guān)鍵詞之間的距離作為點(diǎn)之間的帶權(quán)邊,權(quán)值即為距離值,計(jì)算二分圖的最大二分匹配值,計(jì)算公式如下:
【文檔編號(hào)】G06F17/30GK103455598SQ201310394586
【公開(kāi)日】2013年12月18日 申請(qǐng)日期:2013年9月3日 優(yōu)先權(quán)日:2013年9月3日
【發(fā)明者】劉方方, 王蕾, 張高唯 申請(qǐng)人:上海大學(xué)