i, 因此RTN能夠表示傳統(tǒng)相似度單數(shù)據(jù)空間應(yīng)用中的數(shù)據(jù)相似關(guān)系,若有多個(gè)數(shù)據(jù)對(duì)象空間 參與計(jì)算,運(yùn)也是新的相似度計(jì)算算法性能提升的關(guān)鍵,貝化TN矩陣能夠記錄任意兩個(gè)數(shù)據(jù) 對(duì)象空間內(nèi)任意數(shù)據(jù)對(duì)象之間的相似關(guān)系,RSi^k,f)表示第i個(gè)數(shù)據(jù)空間內(nèi)第k個(gè)數(shù)據(jù)對(duì)象 與第j個(gè)數(shù)據(jù)空間內(nèi)第f個(gè)數(shù)據(jù)對(duì)象之間的相似關(guān)系,其中l(wèi)<i<n,l<j<n,l<k<ci,l <f <cj〇
[0092] 4.相似度傳播矩陣RTS
[0093] 關(guān)系傳播網(wǎng)絡(luò)W點(diǎn)來表示數(shù)據(jù)對(duì)象,W連接數(shù)據(jù)對(duì)象點(diǎn)的無向邊來表示兩個(gè)數(shù)據(jù) 對(duì)象之間有相似關(guān)系,如果給關(guān)系傳播網(wǎng)絡(luò)中的每條邊都加上權(quán)重,則每條邊的權(quán)重就可 W表示運(yùn)條邊的兩個(gè)端點(diǎn)數(shù)據(jù)對(duì)象之間的相似度值,權(quán)重越大表示兩個(gè)端點(diǎn)數(shù)據(jù)對(duì)象的相 似度越大,權(quán)重越小表示兩個(gè)端點(diǎn)數(shù)據(jù)對(duì)象的相似度越小,最小權(quán)重0表示兩個(gè)端點(diǎn)數(shù)據(jù)對(duì) 象完全獨(dú)立相似度為0,運(yùn)被稱為帶權(quán)關(guān)系傳播網(wǎng)絡(luò),如圖4所示,a,b,c,d,e,f,g,h,i,j表 示數(shù)據(jù)對(duì)象,數(shù)據(jù)對(duì)象之間的實(shí)線表示直接的相似關(guān)系,數(shù)據(jù)對(duì)象之間的虛線表示隱藏的 相似關(guān)系,數(shù)據(jù)對(duì)象之間實(shí)線或虛線上的數(shù)字表示數(shù)據(jù)對(duì)象之間的相似度值。運(yùn)樣關(guān)系傳 播網(wǎng)絡(luò)不僅可W表示數(shù)據(jù)對(duì)象之間是否有相似關(guān)系還,可W量化表示數(shù)據(jù)對(duì)象之間的相似 度值。帶權(quán)關(guān)系傳播網(wǎng)路不僅可W傳播數(shù)據(jù)對(duì)象之間的相似性關(guān)系,還能傳播數(shù)據(jù)對(duì)象之 間的相似度值RTS,運(yùn)使得帶權(quán)關(guān)系傳播網(wǎng)絡(luò)能夠作為相似度迭代計(jì)算中相似度傳播的基 礎(chǔ)。圖4中數(shù)據(jù)對(duì)象a和g沒有直接的相似關(guān)系,相似度值為0,但是在a和g之間有通路a-〉c-> g或a-〉d-〉e-乂-〉g,通路中的每條邊都是已知的相似關(guān)系并有相似度值,通過通路,各已知 的相似度值得到傳播并使得a和g之間也存在著相似關(guān)系,運(yùn)種相似關(guān)系是隱藏的,不直觀 的,需要通過傳播來體現(xiàn)的。
[0094] 如果重新定義RSu = Si X &矩陣,就可W得到相似度傳播矩陣,即定義RSu '表示數(shù) 據(jù)空間Si和數(shù)據(jù)空間&中數(shù)據(jù)對(duì)象之間的相似度值,如果用矩陣表示可得到:
[0095]
[0096] 矩陣RSij'中i = l,2……n,j = l,2……n,矩陣中各元素記
,其中1 非含Cl,1 y含Cj,C功數(shù)據(jù)空間S沖的數(shù)據(jù)對(duì)象個(gè)數(shù),C功數(shù)據(jù)空間S沖的數(shù)據(jù)對(duì)象個(gè)數(shù), wf為數(shù)據(jù)空間Si中第k個(gè)數(shù)據(jù)對(duì)象和數(shù)據(jù)空間Sj中第f個(gè)數(shù)據(jù)對(duì)象相似度值,且 0<H>f《1;如果i = j貝化Sij'就是表示同一數(shù)據(jù)空間內(nèi)的數(shù)據(jù)對(duì)象之間的相似度值,如果i 辛j則RSij '就是表示不同數(shù)據(jù)空間內(nèi)的數(shù)據(jù)對(duì)象之間的相似度值。
[0097] 將ηΧη矩陣RSi/作為子矩陣組成的矩陣稱為相似度傳播矩陣RTS,用來表示帶權(quán) 關(guān)系傳播網(wǎng)絡(luò),貝化TS表示為:
[009引
[0099] 相似度傳播矩陣RTS也為NXN維方陣,其中
[0100] 關(guān)系傳播矩陣RTS也W-種統(tǒng)一的方式來表示不同數(shù)據(jù)空間內(nèi)數(shù)據(jù)對(duì)象之間的相 似關(guān)系,若只有一個(gè)數(shù)據(jù)對(duì)象空間,貝化TS退化到只有一個(gè)子矩陣即RTS = RSn',此時(shí)RTS表 示傳統(tǒng)相似度單數(shù)據(jù)空間應(yīng)用中的數(shù)據(jù)對(duì)象之間的相似度,若有多個(gè)數(shù)據(jù)對(duì)象空間,貝化TS 矩陣能夠表示任意兩個(gè)數(shù)據(jù)對(duì)象空間內(nèi)任意數(shù)據(jù)對(duì)象之間的相似度,RSi/化,f)表示第i個(gè) 數(shù)據(jù)空間內(nèi)第k個(gè)數(shù)據(jù)對(duì)象與第j個(gè)數(shù)據(jù)空間內(nèi)第f個(gè)數(shù)據(jù)對(duì)象之間的相似度值,其中1 < i <n,l<j<n,l<k<ci,l<f<cj。
[0101] 如圖5所示為基于關(guān)系傳播網(wǎng)絡(luò)的多維數(shù)據(jù)空間相似度匹配迭代算法,該算法包 括如下步驟:
[0102] 執(zhí)行步驟1:建立η個(gè)不同數(shù)據(jù)空間的關(guān)系傳播網(wǎng)絡(luò),并建立其關(guān)系傳播矩陣RTN:
[0103]
[0104] 矩陣RTN各元素記作RSij,其中i = l,2……n,j = l,2……n,RSu為數(shù)據(jù)空間Si和數(shù) 據(jù)空間&的相似關(guān)系矩陣,RSi期為CiXc濰矩陣,Cl為數(shù)據(jù)空間Si中的數(shù)據(jù)對(duì)象個(gè)數(shù),Cj為 數(shù)據(jù)空間&中的數(shù)據(jù)對(duì)象個(gè)數(shù);
[0105] 執(zhí)行步驟2:分別確定數(shù)據(jù)空間Si和數(shù)據(jù)空間&相似關(guān)系重要性權(quán)重矩陣λυ,如果 越大說明RSu在計(jì)算相似度傳播矩陣RTS過程中的相對(duì)重要性程度越大,反之則越小,且 對(duì)于任意i = l,2......n,滿巧
[0106] 執(zhí)行步驟3:根據(jù)關(guān)系傳播矩陣RTN和重要性權(quán)重矩陣λυ建立常數(shù)矩陣R,具體為:
[0107]
[010引其中
,其維數(shù)與關(guān)系傳播矩陣RTN維數(shù)相同。
[0109] 運(yùn)里R矩陣等式右邊的加號(hào)右邊部分用來調(diào)整R矩陣,因?yàn)镽矩陣左半部分可能存 在某個(gè)子矩陣全部為0的情況,因此給R左半部分矩陣中的每一個(gè)值加上
農(nóng)調(diào) 整其值,使得R矩陣中每一個(gè)元素都不為0。
[0110] 執(zhí)行步驟4:賦值1( = 0,獲取初始相似度傳播矩陣^5<^ = 6,其中^5<^與關(guān)系傳播矩 陣RT腺隹數(shù)相同,Ε為單位矩陣;
[0111] 執(zhí)行步驟5:計(jì)莫
[0112] 執(zhí)行步驟6:判斷ABS(SUM(RTSK+l-RTSK))>F是否成立,其中SUM(RTSKパ-RTSK)表示 對(duì)矩陣(RTSK+1-RTSK)中各元素求和,485(5刪(1^'5"^+1-腳5"^))表示矩陣(1^'5"^+1-1^'5"^)中各元 素求和后的絕對(duì)值,F(xiàn)為相似度闊值,其中F取值范圍為0.005~0.01,若ABS(SUM(RTSK+i- RTSK))含F(xiàn)成立,則執(zhí)行步驟7,否則執(zhí)行步驟8;
[0113] 執(zhí)行步驟7:賦值RTS = RTSK+i,保存得到相似度傳播矩陣RTS并執(zhí)行步驟9;
[0114] 執(zhí)行步驟8:賦值Κ=Κ+1,并返回步驟5;
[0115] 執(zhí)行步驟9:獲取相似度傳播矩陣RTS中的元素,進(jìn)行多維數(shù)據(jù)空間中的數(shù)據(jù)對(duì)象 之間的匹配,由上可知相似度傳播矩陣RTS中的元素可表示為RSij'化,f),表示為數(shù)據(jù)空間 Si中的第k個(gè)數(shù)據(jù)對(duì)象和數(shù)據(jù)空間&中第f個(gè)數(shù)據(jù)對(duì)象之間的相似度值,獲取相似度值后便 可得知多維數(shù)據(jù)空間內(nèi)數(shù)據(jù)對(duì)象的匹配程度。
[0116] 步驟1中所述的RSu具體為:
[0117]
[011引矩陣RSi沖各元素記作RSij化,f),其中<Cj,RSu化,f)為數(shù)據(jù)空間 Si中第k個(gè)數(shù)據(jù)對(duì)象和數(shù)據(jù)空間S沖的第f個(gè)數(shù)據(jù)對(duì)象之間的相似關(guān)系。
[0119] 其中相似關(guān)系矩陣RSi^k,f)滿足:
[0120]
[0121] 算法采用迭代方式計(jì)算相似度,3了5"^表示第1(次迭代計(jì)算后得到的腳5矩陣,1^'5<^是 初始的^5矩陣,因?yàn)閊5<^并沒有經(jīng)過迭代計(jì)算,而是人為指定的,所^^5<^的選取會(huì)對(duì)算法 計(jì)算的結(jié)果產(chǎn)生影響,計(jì)算開始時(shí)并不知道某個(gè)數(shù)據(jù)對(duì)象與其他數(shù)據(jù)對(duì)象之間的相似度, 可W假設(shè)數(shù)據(jù)對(duì)象與其本身的相似度為1,與其他數(shù)據(jù)對(duì)象的相似度都為0,即:
[0122]
[0123] 由于RTSD是方陣,所W只有對(duì)角線上的元素值為1,其他元素都是0,故RTSD = E,E為 單位矩陣。
[0124] 本算法的計(jì)算過程需要為R矩陣指定λυ值,且要保證對(duì)任意對(duì)于任意i = l,2…… n,滿月
,λυ可W由個(gè)人指定,但往往不能精確體現(xiàn)多個(gè)數(shù)據(jù)空間真實(shí)的相對(duì)重 要性程度,因此所述的步驟2中采用專家評(píng)定法確定數(shù)據(jù)空間Si和數(shù)據(jù)空間S姻似關(guān)系重要 性權(quán)重矩陣λυ,該方法由應(yīng)用領(lǐng)域內(nèi)的m個(gè)專家分別指定多個(gè)數(shù)據(jù)空間的相對(duì)重要性程度, 然后綜合m個(gè)專家的指定