專利名稱:一種復(fù)雜網(wǎng)絡(luò)局部社區(qū)挖掘方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,具體涉及到一種復(fù)雜網(wǎng)絡(luò)局部社區(qū)挖掘方法。
背景技術(shù):
近年來復(fù)雜網(wǎng)絡(luò)已經(jīng)得到了廣泛的應(yīng)用,如在線社會網(wǎng)絡(luò)、科學(xué)家合作關(guān)系網(wǎng)等,但目前復(fù)雜網(wǎng)絡(luò)還沒有精確嚴格的定義。隨著對復(fù)雜網(wǎng)絡(luò)性質(zhì)的物理意義和數(shù)學(xué)特性的深入研究,發(fā)現(xiàn)很多實際網(wǎng)絡(luò)中存在社區(qū)結(jié)構(gòu),即整個網(wǎng)絡(luò)由若干個社區(qū)構(gòu)成,每個社區(qū)內(nèi)部節(jié)點之間的連接相對緊密,但各個社區(qū)之間的連接相對來說比較稀疏。能夠在大型復(fù)雜網(wǎng)絡(luò)中快速發(fā)現(xiàn)“社區(qū)”具有重要的實際應(yīng)用價值,如在線社會網(wǎng)絡(luò)中的社區(qū)可能代表的是根據(jù)共同愛好而形成的真實的社會團體。
如何在復(fù)雜網(wǎng)絡(luò)中進行正確的社區(qū)劃分成為當前復(fù)雜網(wǎng)絡(luò)研究中的一個熱點。為了尋找復(fù)雜網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu),研究人員提出了多種全網(wǎng)絡(luò)的社區(qū)劃分算法,例如CNM算法、GN算法、LP算法等。然而,當網(wǎng)絡(luò)規(guī)模過于龐大時,獲得全局信息非常困難,特別是不斷動態(tài)變化的網(wǎng)絡(luò),如互聯(lián)網(wǎng),另外,在很多情況下,研究人員關(guān)注的是網(wǎng)絡(luò)的局部社區(qū)結(jié)構(gòu),例如,在社會網(wǎng)絡(luò)中搜索時通常只關(guān)心某些具有重大影響力的人所在的社區(qū),而不需要了解整個社會網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu),在這種情況下,就不需要耗時劃分網(wǎng)絡(luò)的全局社區(qū)結(jié)構(gòu),而只需搜索網(wǎng)絡(luò)中某個局部社區(qū)。近期,研究者提出了多種局部社區(qū)發(fā)現(xiàn)算法,例如一種基于Hub的挖掘社區(qū)結(jié)構(gòu)的方法,該算法需要事先知道網(wǎng)絡(luò)社區(qū)的數(shù)目,而在現(xiàn)實網(wǎng)絡(luò)中很難事先知道網(wǎng)絡(luò)社區(qū)的數(shù)目;再如BB算法,其為尋找某個節(jié)點所在社區(qū)結(jié)構(gòu)的局部方法,該算法缺陷在于它把社區(qū)整個一層鄰居節(jié)點全部加入或全部排除在社區(qū)之外。
發(fā)明內(nèi)容
有鑒于此,為了解決上述問題,本發(fā)明公開了一種復(fù)雜網(wǎng)絡(luò)局部社區(qū)挖掘方法,能夠有效識別復(fù)雜網(wǎng)絡(luò)的局部社區(qū)結(jié)構(gòu),具有較低的時間復(fù)雜度,誤劃分的節(jié)點數(shù)較少。本發(fā)明的目的是這樣實現(xiàn)的復(fù)雜網(wǎng)絡(luò)局部社區(qū)挖掘方法,其特征在于包括如下步驟I)以網(wǎng)絡(luò)中的最大度節(jié)點為起始節(jié)點,計算其鄰居節(jié)點,獲得其鄰居節(jié)點集;2)找到與最大度節(jié)點擁有最多共同鄰居節(jié)點的節(jié)點;3)將步驟I)獲得的起始節(jié)點與步驟2)獲得的與最大度節(jié)點擁有最多共同鄰居節(jié)點的節(jié)點組成初始局部社區(qū);4)獲得初始局部社區(qū)的鄰居節(jié)點的接近度,取網(wǎng)絡(luò)中接近度最大的鄰居節(jié)點加入初始局部社區(qū)形成新的初始局部社區(qū),若接近度最大的鄰居節(jié)點不止一個,則將這些接近度最大的鄰居節(jié)點同時加入初始局部社區(qū)形成新的初始局部社區(qū);5)計算步驟4)的初始局部社區(qū)的Q值;6)重復(fù)步驟4-5),直到形成新的初始局部社區(qū)Q值大于0或網(wǎng)絡(luò)中節(jié)點為空。
進一步,所述步驟I)中,所述網(wǎng)絡(luò)以G= (V,E)表示,其中,V表示網(wǎng)絡(luò)節(jié)點的集合,E表示網(wǎng)絡(luò)連接的集合,找到V中度最大的節(jié)點Va,計算其鄰居節(jié)點集N(va), N(Va)={j I節(jié)點j與節(jié)點va直接相連},并令V = V-vao進一步,所述步驟2)中,在N(Va)中找到與最大度節(jié)點Va擁有最多共同鄰居節(jié)點的節(jié)點vb,同享鄰居數(shù)通過下式計算W (va, vb) = |N(va) H N(Vb) I。進一步,所述步驟3)中令初始局部社區(qū)C = va+vb,令V = V-vb,令局部社區(qū)C的Q 值 Q(C) = I。進一步,所述步驟4)中具體包括如下步驟41)利用下式,獲得初始局部社區(qū)C在網(wǎng)絡(luò)中的鄰居節(jié)點集N(C)
權(quán)利要求
1.復(fù)雜網(wǎng)絡(luò)局部社區(qū)挖掘方法,其特征在于包括如下步驟 1)以網(wǎng)絡(luò)中的最大度節(jié)點為起始節(jié)點,計算其鄰居節(jié)點,獲得其鄰居節(jié)點集; 2)找到與最大度節(jié)點擁有最多共同鄰居節(jié)點的節(jié)點; 3)將步驟I)獲得的起始節(jié)點與步驟2)獲得的與最大度節(jié)點擁有最多共同鄰居節(jié)點的節(jié)點組成初始局部社區(qū); 4)獲得初始局部社區(qū)的鄰居節(jié)點的接近度,取網(wǎng)絡(luò)中接近度最大的鄰居節(jié)點加入初始局部社區(qū)形成新的初始局部社區(qū),若接近度最大的鄰居節(jié)點不止一個,則將這些接近度最大的鄰居節(jié)點同時加入初始局部社區(qū)形成新的初始局部社區(qū); 5)計算步驟4)的初始局部社區(qū)的Q值; 6)重復(fù)步驟4-5),直到形成新的初始局部社區(qū)Q值大于O或網(wǎng)絡(luò)中節(jié)點為空。
2.如權(quán)利要求I所述的復(fù)雜網(wǎng)絡(luò)局部社區(qū)挖掘方法,其特征在于所述步驟I)中,所述網(wǎng)絡(luò)以G= (V,E)表示,其中,V表示網(wǎng)絡(luò)節(jié)點的集合,E表示網(wǎng)絡(luò)連接的集合,找到V中度最大的節(jié)點va,計算其鄰居節(jié)點集N (Va), N (va) = {j I節(jié)點j與節(jié)點Va直接相連},并令V = V-Va。
3.如權(quán)利要求2所述的復(fù)雜網(wǎng)絡(luò)局部社區(qū)挖掘方法,其特征在于所述步驟2)中,在N(va)中找到與最大度節(jié)點Va擁有最多共同鄰居節(jié)點的節(jié)點vb,同享鄰居數(shù)通過下式計算
4.如權(quán)利要求3所述的復(fù)雜網(wǎng)絡(luò)局部社區(qū)挖掘方法,其特征在于所述步驟3)中令初始局部社區(qū)c = va+vb,令V = V-Vb,令局部社區(qū)C的Q值Q (C) = I。
5.如權(quán)利要求3所述的復(fù)雜網(wǎng)絡(luò)局部社區(qū)挖掘方法,其特征在于所述步驟4)中具體包括如下步驟 41)利用下式,獲得初始局部社區(qū)C在網(wǎng)絡(luò)中的鄰居節(jié)點集N(C)
6.如權(quán)利要求5所述的復(fù)雜網(wǎng)絡(luò)局部社區(qū)挖掘方法,其特征在于所述步驟5)中,利用下式,計算初始局部社區(qū)C的Q值Q(C)
全文摘要
本發(fā)明涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,具體涉及到一種復(fù)雜網(wǎng)絡(luò)局部社區(qū)挖掘方法,能夠有效識別復(fù)雜網(wǎng)絡(luò)的局部社區(qū)結(jié)構(gòu),具有較低的時間復(fù)雜度,誤劃分的節(jié)點數(shù)較少,包括如下步驟以網(wǎng)絡(luò)中的最大度節(jié)點為起始節(jié)點,計算其鄰居節(jié)點,獲得其鄰居節(jié)點集;找到與最大度節(jié)點擁有最多共同鄰居節(jié)點的節(jié)點;以此兩個節(jié)點組成初始局部社區(qū);獲得初始局部社區(qū)的各鄰居節(jié)點接近度,取接近度最大的節(jié)點加入初始局部社區(qū)形成新的初始局部社區(qū);計算初始局部社區(qū)的Q值;重復(fù)上述步驟,直到形成新的初始局部社區(qū)Q值大于0或網(wǎng)絡(luò)中節(jié)點為空。
文檔編號G06F17/30GK102819611SQ20121030632
公開日2012年12月12日 申請日期2012年8月27日 優(yōu)先權(quán)日2012年8月27日
發(fā)明者方平 申請人:方平