鏈接強度計算方法和鏈接強度計算設(shè)備的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明一般地涉及信息處理領(lǐng)域。具體而言,本發(fā)明涉及一種計算二部圖中的鏈 接的強度的方法和設(shè)備。
【背景技術(shù)】
[0002] 近年來,隨著社會化網(wǎng)絡(luò)、電子商務(wù)等領(lǐng)域的飛速發(fā)展,相關(guān)的信息處理技術(shù)得到 越來越多的關(guān)注。其中,圖結(jié)構(gòu),尤其是二部圖結(jié)構(gòu)中的鏈接相關(guān)的研究對于數(shù)據(jù)的分析很 有幫助。
[0003] 例如,二部圖結(jié)構(gòu)可W表征在電子商務(wù)領(lǐng)域中的用戶-產(chǎn)品映射關(guān)系、在社會化 網(wǎng)絡(luò)中的用戶-主題映射關(guān)系,在文獻數(shù)據(jù)庫中的作者-文章映射關(guān)系等。
[0004] 因此,可W直接從二部圖中查找到二元的鏈接關(guān)系。例如,用戶-產(chǎn)品、用戶-主 題、或者作者-文章之間的鏈接關(guān)系等。可W基于該樣的鏈接關(guān)系進行進一步的研究。
[0005] 然而,在該些二部圖的結(jié)構(gòu)中,存在著鏈接無效、鏈接虛假、鏈接缺失等問題。該些 問題的解決都依賴于準(zhǔn)確、適當(dāng)?shù)逆溄訌姸取?br>[0006] 因此,期望一種針對二部圖的鏈接強度計算方法和鏈接強度計算設(shè)備,其計算的 鏈接強度能夠準(zhǔn)確、適當(dāng)?shù)乇碚麈溄觾啥说墓?jié)點之間的關(guān)系。
【發(fā)明內(nèi)容】
[0007] 在下文中給出了關(guān)于本發(fā)明的簡要概述,W便提供關(guān)于本發(fā)明的某些方面的基本 理解。應(yīng)當(dāng)理解,該個概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的 關(guān)鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是W簡化的形式給出某些概 念,W此作為稍后論述的更詳細描述的前序。
[0008] 本發(fā)明的目的是針對現(xiàn)有技術(shù)的上述問題,提出了一種能夠基于二部圖中的已有 信息,給出準(zhǔn)確、適當(dāng)?shù)逆溄訌姸戎档逆溄訌姸扔嬎惴椒ê玩溄訌姸扔嬎阍O(shè)備。
[0009] 為了實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種計算二部圖中鏈接的強 度的方法,該方法包括:針對給定的二部圖中的選定鏈接,基于所述二部圖,構(gòu)建針對該選 定鏈接的N級完備子圖,其中所述N級完備子圖中的第0級完備子圖包括該選定鏈接W及 該選定鏈接兩端的兩節(jié)點,所述N級完備子圖中的第n+1級完備子圖包括所述二部圖中的、 W第n級完備子圖中的所有鏈接兩端的節(jié)點作為端點的鏈接及其兩端的節(jié)點,其中N為預(yù) 定正整數(shù),且N〉2,n為正整數(shù),且N-2 >n> 0,分別計算該選定鏈接兩端的兩節(jié)點與第N-2 級完備子圖中的同類節(jié)點之間的相似度,分別計算該選定鏈接兩端的兩節(jié)點與第N-2級完 備子圖中的所述同類節(jié)點之間的共同鏈接程度值;W及基于所述相似度和共同鏈接程度 值、W及該選定鏈接兩端的兩節(jié)點與第N-2級完備子圖中的異類節(jié)點之間鏈接的強度初始 值,利用針對該二部圖的鏈接強度模型,計算所述選定鏈接的強度值。
[0010] 根據(jù)本發(fā)明的另一個方面,提供了一種計算二部圖中鏈接的強度的設(shè)備,該設(shè)備 包括:子圖構(gòu)建裝置,被配置為:針對給定的二部圖中的選定鏈接,基于所述二部圖,構(gòu)建 針對該選定鏈接的N級完備子圖,其中所述N級完備子圖中的第0級完備子圖包括該選定 鏈接W及該選定鏈接兩端的兩節(jié)點,所述N級完備子圖中的第n+1級完備子圖包括所述二 部圖中的、W第n級完備子圖中的所有鏈接兩端的節(jié)點作為端點的鏈接及其兩端的節(jié)點, 其中N為預(yù)定正整數(shù),且N〉2,n為正整數(shù),且N-2 >n> 0,相似度計算裝置,被配置為;針 對給定的二部圖中的選定鏈接,分別計算該選定鏈接兩端的兩節(jié)點與第N-2級完備子圖中 的同類節(jié)點之間的相似度,程度值計算裝置,被配置為:針對給定的二部圖中的選定鏈接, 分別計算該選定鏈接兩端的兩節(jié)點與第N-2級完備子圖中的所述同類節(jié)點之間的共同鏈 接程度值;W及強度計算裝置,被配置為:基于所述相似度計算裝置計算的相似度和所述 程度值計算裝置計算的共同鏈接程度值、W及該選定鏈接兩端的兩節(jié)點與第N-2級完備子 圖中的異類節(jié)點之間鏈接的強度初始值,利用針對該二部圖的鏈接強度模型,計算所述選 定鏈接的強度值。
[0011] 另外,根據(jù)本發(fā)明的另一方面,還提供了 一種存儲介質(zhì)。所述存儲介質(zhì)包括機器可 讀的程序代碼,當(dāng)在信息處理設(shè)備上執(zhí)行所述程序代碼時,所述程序代碼使得所述信息處 理設(shè)備執(zhí)行根據(jù)本發(fā)明的上述方法。
[0012] 此外,根據(jù)本發(fā)明的再一方面,還提供了 一種程序產(chǎn)品。所述程序產(chǎn)品包括機器可 執(zhí)行的指令,當(dāng)在信息處理設(shè)備上執(zhí)行所述指令時,所述指令使得所述信息處理設(shè)備執(zhí)行 根據(jù)本發(fā)明的上述方法。
【附圖說明】
[0013] 參照下面結(jié)合附圖對本發(fā)明實施例的說明,會更加容易地理解本發(fā)明的W上和其 它目的、特點和優(yōu)點。附圖中的部件只是為了示出本發(fā)明的原理。在附圖中,相同的或類似 的技術(shù)特征或部件將采用相同或類似的附圖標(biāo)記來表示。附圖中:
[0014]圖1示出了根據(jù)本發(fā)明的實施例的鏈接強度計算方法的流程圖;
[0015] 圖2示出了二部圖的示例;
[0016] 圖3示出了針對鏈接<42,?2〉的第0、1、2級完備子圖;
[0017] 圖4示出了根據(jù)本發(fā)明的實施例的鏈接強度模型的訓(xùn)練方法的流程圖;
[0018]圖5示出了根據(jù)本發(fā)明的實施例的鏈接強度計算設(shè)備的結(jié)構(gòu)方框圖;W及
[0019] 圖6示出了可用于實施根據(jù)本發(fā)明實施例的方法和設(shè)備的計算機的示意性框圖。
【具體實施方式】
[0020] 在下文中將結(jié)合附圖對本發(fā)明的示范性實施例進行詳細描述。為了清楚和簡明起 見,在說明書中并未描述實際實施方式的所有特征。然而,應(yīng)該了解,在開發(fā)任何該種實際 實施方式的過程中必須做出很多特定于實施方式的決定,W便實現(xiàn)開發(fā)人員的具體目標(biāo), 例如,符合與系統(tǒng)及業(yè)務(wù)相關(guān)的那些限制條件,并且該些限制條件可能會隨著實施方式的 不同而有所改變。此外,還應(yīng)該了解,雖然開發(fā)工作有可能是非常復(fù)雜和費時的,但對得益 于本公開內(nèi)容的本領(lǐng)域技術(shù)人員來說,該種開發(fā)工作僅僅是例行的任務(wù)。
[0021] 在此,還需要說明的一點是,為了避免因不必要的細節(jié)而模糊了本發(fā)明,在附圖中 僅僅示出了與根據(jù)本發(fā)明的方案密切相關(guān)的裝置結(jié)構(gòu)和/或處理步驟,而省略了與本發(fā)明 關(guān)系不大的其他細節(jié)。另外,還需要指出的是,在本發(fā)明的一個附圖或一種實施方式中描述 的元素和特征可w與一個或更多個其它附圖或?qū)嵤┓绞街惺境龅脑睾吞卣飨嘟Y(jié)合。
[0022] 下面將參照圖1描述根據(jù)本發(fā)明的實施例的鏈接強度計算方法的流程。
[002引圖1示出了根據(jù)本發(fā)明的實施例的鏈接強度計算方法的流程圖。如圖1所示,根 據(jù)本發(fā)明的實施例的鏈接強度計算方法,包括如下步驟;針對給定的二部圖中的選定鏈接, 基于所述二部圖,構(gòu)建針對該選定鏈接的N級完備子圖,其中所述N級完備子圖中的第0級 完備子圖包括該選定鏈接W及該選定鏈接兩端的兩節(jié)點,所述N級完備子圖中的第n+1級 完備子圖包括所述二部圖中的、W第n級完備子圖中的所有鏈接兩端的節(jié)點作為端點的鏈 接及其兩端的節(jié)點,其中N為預(yù)定正整數(shù),且N〉2,n為正整數(shù),且N-2 >n> 0 (步驟S1); 分別計算該選定鏈接兩端的兩節(jié)點與第N-2級完備子圖中的同類節(jié)點之間的相似度(步驟 S2);分別計算該選定鏈接兩端的兩節(jié)點與第N-2級完備子圖中的所述同類節(jié)點之間的共同 鏈接程度值(步驟S3);W及基于所述相似度和共同鏈接程度值、W及該選定鏈接兩端的兩 節(jié)點與第N-2級完備子圖中的異類節(jié)點之間鏈接的強度初始值,利用針對該二部圖的鏈接 強度模型,計算所述選定鏈接的強度值(步驟S4)。
[0024]在步驟S1中,針對給定的二部圖中的選定鏈接,基于所述二部圖,構(gòu)建針對該選 定鏈接的N級完備子圖,其中所述N級完備子圖中的第0級完備子圖包括該選定鏈接W及 該選定鏈接兩端的兩節(jié)點,所述N級完備子圖中的第n+1級完備子圖包括所述二部圖中的、 W第n級完備子圖中的所有鏈接兩端的節(jié)點作為端點的鏈接及其兩端的節(jié)點,其中N為預(yù) 定正整數(shù),且N〉2,n為正整數(shù),且N-2 >n> 0。
[00巧]首先,介紹完備子圖的創(chuàng)建。
[0026] 二部圖是本領(lǐng)域已知的數(shù)據(jù)結(jié)構(gòu)。在二部圖中,只存在兩種類型的節(jié)點。兩種類 型的節(jié)點之間可W有鏈接相連,并且鏈接僅連接不同類型的節(jié)點。目P,同一類型的節(jié)點之間 沒有鏈接。鏈接的強度體現(xiàn)了鏈接兩端的兩節(jié)點的關(guān)系。節(jié)點之間的鏈接關(guān)系可W是一對 一的,也可W是一對多的、多對一的、或者多對多的,依不同的應(yīng)用場景而定。
[0027] 舉例來說,如果二部圖中的兩種節(jié)點類型是作者和文章,那么節(jié)點之間的鏈接可 表明鏈接一端的作者是鏈接另一端的文章的作者。鏈接的強度表明該作者是該文章的作者 的置信度。一篇文章可W有多個作者,一個作者也可W寫多篇文章。
[002引圖2示出了二部圖的示例。在圖2中,有兩種類型的節(jié)點;A類型節(jié)點和P類型節(jié) 點。兩種節(jié)點之間的連線表示兩者之間的鏈接。
[0029] 傳統(tǒng)技術(shù)僅基于二部圖進行分析和處理。本發(fā)明的發(fā)明人創(chuàng)新地提出完備子圖的 概念。針對二部圖中的每一個鏈接,均可生成與之對應(yīng)的一組完備子圖。完備子圖匯集了 與該鏈接及其兩端的節(jié)點關(guān)聯(lián)的其它節(jié)點和鏈接,不同級的完備子圖的信息量不同。通過 利用該樣的其它節(jié)點和鏈接的信息可W幫助完善與完備子圖對應(yīng)的鏈接的強度的計算。同 時