一種基于節(jié)點(diǎn)特性的影響力最大化初始節(jié)點(diǎn)選取方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計(jì)算機(jī)技術(shù)領(lǐng)域,涉及一種基于節(jié)點(diǎn)特性的影響力最大化初始節(jié)點(diǎn)選 取方法。
【背景技術(shù)】
[0002] 互聯(lián)網(wǎng)的發(fā)展不僅為我們帶來(lái)了便捷生活方式,還使我們交流與溝通的方式發(fā)生 了巨大的變化。我們交友與分享智慧的途徑也隨著在線社會(huì)網(wǎng)絡(luò)的發(fā)展變得更加豐富多 樣。隨著越來(lái)越多的人使用諸如移動(dòng)終端等更加便捷的數(shù)據(jù)交換服務(wù),我們的社會(huì)結(jié)構(gòu)和 社會(huì)關(guān)系網(wǎng)絡(luò)變得更加復(fù)雜和緊密。一般情況下,我們使用圖結(jié)構(gòu)對(duì)社會(huì)群體中的人與人 之間的關(guān)系進(jìn)行建模,節(jié)點(diǎn)代表個(gè)體,而邊或者弧代表個(gè)體之間的關(guān)系。通過(guò)在線社會(huì)網(wǎng)絡(luò) 中用戶之間的關(guān)系,信息可極快的速度和極小的代價(jià)進(jìn)行傳播,正因?yàn)槿绱?,影響力?社會(huì)網(wǎng)絡(luò)中的傳播和分布為病毒式營(yíng)銷帶來(lái)了前所未有的機(jī)遇和挑戰(zhàn),如何找到初始用戶 群體使得信息最終的影響傳播范圍最大已成為熱點(diǎn)研究領(lǐng)域之一。
[0003] 對(duì)于影響力最大化問(wèn)題,當(dāng)前大部分的研究工作都是基于對(duì)傳統(tǒng)經(jīng)典影響力級(jí)聯(lián) 模型的優(yōu)化,或者對(duì)啟發(fā)式算法的準(zhǔn)確度進(jìn)行改進(jìn),對(duì)于影響力的評(píng)估則主要基于網(wǎng)絡(luò)結(jié) 構(gòu)和節(jié)點(diǎn)度值,用戶自身的特性和用戶與用戶之間的行為相似性很少被挖掘并被應(yīng)用于對(duì) 節(jié)點(diǎn)影響力的評(píng)估中。
[0004] 針對(duì)上述不足,我們提出一種對(duì)于節(jié)點(diǎn)初始影響力的評(píng)估方案,該種方法結(jié)合了 用戶特性,用戶與行為之間關(guān)聯(lián)關(guān)系W及用戶之間行為相似度對(duì)節(jié)點(diǎn)之間的影響力進(jìn)行評(píng) 價(jià)。同時(shí),我們依據(jù)提出的節(jié)點(diǎn)之間的影響力評(píng)價(jià)標(biāo)準(zhǔn)對(duì)信用進(jìn)行分配,并結(jié)合貪也算法得 到初始影響力最大化節(jié)點(diǎn)集合。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明提出了一種更加真實(shí)有效的基于節(jié)點(diǎn)特性的影響力最大化初始節(jié)點(diǎn)選取 方法,在評(píng)價(jià)節(jié)點(diǎn)之間影響力的過(guò)程中結(jié)合用戶活躍度,用戶敏感度W及用戶親密度對(duì)節(jié) 點(diǎn)之間的影響力進(jìn)行評(píng)價(jià),根據(jù)時(shí)間特性計(jì)算節(jié)點(diǎn)之間的用戶影響力大小,并且結(jié)合網(wǎng)絡(luò) 結(jié)構(gòu)和用戶行為日志對(duì)信用分布和影響力的傳播過(guò)程進(jìn)行構(gòu)建,最后結(jié)合貪也算法選取邊 際收益最大的節(jié)點(diǎn)得到初始影響力最大化節(jié)點(diǎn)集合。具體步驟如下:
[0006] 步驟1 ;對(duì)在線社會(huì)網(wǎng)絡(luò)數(shù)據(jù)集進(jìn)行處理,得到真實(shí)的用戶行為日志和網(wǎng)絡(luò)結(jié)構(gòu) 文件;
[0007] 步驟2 ;遍歷用戶行為日志,對(duì)網(wǎng)絡(luò)中的每一個(gè)節(jié)點(diǎn),分別計(jì)算用戶活躍度,用戶 敏感度和用戶親密度,對(duì)U節(jié)點(diǎn),用戶活躍度act(u)定義為:
【主權(quán)項(xiàng)】
1. 一種基于節(jié)點(diǎn)特性的影響力最大化初始節(jié)點(diǎn)選取方法包括以下步驟: 步驟1:對(duì)在線社會(huì)網(wǎng)絡(luò)數(shù)據(jù)集進(jìn)行處理,得到真實(shí)的用戶行為日志和網(wǎng)絡(luò)結(jié)構(gòu)文件; 步驟2 :遍歷用戶行為日志,對(duì)網(wǎng)絡(luò)中的每一個(gè)節(jié)點(diǎn),分別計(jì)算用戶活躍度,用戶敏感 度和用戶親密度,對(duì)u節(jié)點(diǎn),用戶活躍度act(u)定義為:
'代表節(jié)點(diǎn)u執(zhí)行的行為的個(gè)數(shù),代表節(jié)點(diǎn)u受到鄰居節(jié)點(diǎn)影響而被動(dòng)執(zhí)行的行 為個(gè)數(shù),I識(shí)[代表訓(xùn)練集中記錄的行為總個(gè)數(shù),參數(shù)A對(duì)兩種行為數(shù)量指標(biāo)進(jìn)行控制,取值 范圍為(〇, 1),用戶敏感度:定義如下:
記錄節(jié)點(diǎn)u的所有鄰居節(jié)點(diǎn)中首次執(zhí)行行為a的時(shí)刻,tu(a)代表節(jié)點(diǎn)u最終被 影響而執(zhí)行相同行為a的時(shí)刻,tu代表節(jié)點(diǎn)u與其鄰居節(jié)點(diǎn)之間的平均延遲時(shí)間;當(dāng)兩個(gè) 時(shí)刻的時(shí)間跨度LW- 越長(zhǎng),u的值就越小,用戶親密度Pv,u計(jì)算公式如下:
表示節(jié)點(diǎn)U和節(jié)點(diǎn)V執(zhí)行行為種類集合的并集,表示節(jié)點(diǎn)U和節(jié)點(diǎn)V執(zhí)行行 為種類集合的交集; 步驟3 :分別對(duì)用戶敏感度和用戶親密度進(jìn)行歸一化處理,節(jié)點(diǎn)u的用戶平均敏感度 艽:和用戶平均親密度於計(jì)算規(guī)則如下:
#代表訓(xùn)練集中記錄的行為,fle此N(u)表示節(jié)點(diǎn)u的鄰接節(jié)點(diǎn)集合,VGN(U),初 始用戶影響力定義為:
給定節(jié)點(diǎn)u與其鄰居節(jié)點(diǎn)V之間的平均延遲時(shí)間Tv,u和節(jié)點(diǎn)u的初始用戶影響力iniful(u),使用連續(xù)衰減函數(shù)對(duì)鄰接節(jié)點(diǎn)v和節(jié)點(diǎn)u之間的影響力進(jìn)行變換,計(jì)算公式如 下:
⑷代表節(jié)點(diǎn)V對(duì)節(jié)點(diǎn)U對(duì)于行為a的用戶影響力,tMa>是節(jié)點(diǎn)V執(zhí)行行為a的時(shí)刻,N^Jv)表示節(jié)點(diǎn)v的出鄰居節(jié)點(diǎn)集合,uGNMt(v),tu(a)代表節(jié)點(diǎn)u最終被影響 而執(zhí)行相同行為a的時(shí)刻; 步驟4 :定義分配給節(jié)點(diǎn)v讓其影響節(jié)點(diǎn)u的信用,對(duì)于任意的兩個(gè)節(jié)點(diǎn)v和節(jié)點(diǎn)u,給 予節(jié)點(diǎn)v讓其影響節(jié)點(diǎn)u的總信用定義為:
其中,Nin(u)表示節(jié)點(diǎn)u的入鄰居節(jié)點(diǎn)集合,節(jié)點(diǎn)w為節(jié)點(diǎn)u的入鄰居,wGNin(u),yw,u(a)代表給予節(jié)點(diǎn)w讓其影響鄰接節(jié)點(diǎn)u的直接信用,公式表示對(duì)于任意的兩個(gè)節(jié)點(diǎn)v和 節(jié)點(diǎn)u,給予節(jié)點(diǎn)v讓其影響節(jié)點(diǎn)u的總信用等于以節(jié)點(diǎn)u的所有入鄰居為中間節(jié)點(diǎn),給予 節(jié)點(diǎn)v讓其影響節(jié)點(diǎn)u的信用乘積之和,令Yw,u(a)等于節(jié)點(diǎn)w對(duì)節(jié)點(diǎn)u對(duì)于行為a的用 戶影響力,即相似地,給予一個(gè)節(jié)點(diǎn)集合S讓其影響節(jié)點(diǎn)u的總信用 計(jì)笪公式如下:
步驟5 :通過(guò)遍歷用戶行為傳播日志,沿著行為傳播路徑逆向進(jìn)行信用分配,計(jì)算節(jié)點(diǎn)x對(duì)于所有行為的邊際收益:
〇jx)為對(duì)于節(jié)點(diǎn)x的影響力傳播函數(shù),S為當(dāng)前初始節(jié)點(diǎn)集合,V代表網(wǎng)絡(luò)中全體 節(jié)點(diǎn)的總集,〇氣為通過(guò)行為a在節(jié)點(diǎn)集合V-S中給予節(jié)點(diǎn)x讓其影響節(jié)點(diǎn)u的信用,
J給予節(jié)點(diǎn)v讓其影響除當(dāng)前初始節(jié)點(diǎn)集合S之外的其他節(jié)點(diǎn)的總信 用,rs,x(a)代表對(duì)于行為a,給予當(dāng)前初始節(jié)點(diǎn)集合的S的信用值,節(jié)點(diǎn)的信用值越高代表 影響力越大,結(jié)合貪心算法遞歸選取邊際收益最大的節(jié)點(diǎn)插入初始節(jié)點(diǎn)集合S; 步驟6 :判斷初始節(jié)點(diǎn)集合中元素的個(gè)數(shù)是否已經(jīng)達(dá)到要求的個(gè)數(shù)k,如果已經(jīng)達(dá)到, 則得到最終的初始節(jié)點(diǎn)集合,如果未達(dá)到,則對(duì)除當(dāng)前初始節(jié)點(diǎn)集合之外的節(jié)點(diǎn)之間的信 用分布進(jìn)行更新,并重新回到步驟5。
【專利摘要】本發(fā)明提出了一種基于節(jié)點(diǎn)特性的在線社會(huì)網(wǎng)絡(luò)影響力最大化初始節(jié)點(diǎn)選取方法。首先在網(wǎng)絡(luò)中,基于用戶活躍度、用戶敏感度和用戶親密度三方面因素,對(duì)節(jié)點(diǎn)特性進(jìn)行評(píng)價(jià),并以此為依據(jù)對(duì)節(jié)點(diǎn)之間的信用值進(jìn)行重新定義和分配,節(jié)點(diǎn)之間的信用值大小體現(xiàn)節(jié)點(diǎn)之間的影響力,如果兩個(gè)相鄰節(jié)點(diǎn)相繼執(zhí)行相同的行為,則認(rèn)為后者被前者影響,為前者分配信用,之后我們結(jié)合網(wǎng)絡(luò)結(jié)構(gòu)和用戶行為日志,計(jì)算網(wǎng)絡(luò)中任意兩節(jié)點(diǎn)之間的信用值大小,并通過(guò)貪心算法,遞歸選取邊際收益最大的節(jié)點(diǎn)組成影響力最大化初始節(jié)點(diǎn)集合。本發(fā)明改進(jìn)了以往僅依據(jù)節(jié)點(diǎn)度值評(píng)價(jià)節(jié)點(diǎn)影響力規(guī)則的弊端,減少了運(yùn)算時(shí)間和內(nèi)存消耗,能更真實(shí)有效地描述并預(yù)測(cè)影響力的傳播過(guò)程。
【IPC分類】G06Q50-00
【公開號(hào)】CN104616200
【申請(qǐng)?zhí)枴緾N201510072839
【發(fā)明人】鄧曉衡, 潘琰, 朱從旭, 林立新, 沈海瀾, 李登
【申請(qǐng)人】中南大學(xué)
【公開日】2015年5月13日
【申請(qǐng)日】2015年2月11日