基于svi的互聯(lián)網(wǎng)as推斷以及路由器劃分方法
【專利摘要】本發(fā)明的基于SVI的互聯(lián)網(wǎng)AS推斷以及路由器劃分方法,首先建立數(shù)學(xué)模型,確定節(jié)點(diǎn)、社團(tuán)指示向量、從屬向量這三者之間的關(guān)系;然后建立從屬向量到觀測(cè)值的先驗(yàn)概率模型;通過SVI算法求解先驗(yàn)概率模型,計(jì)算出節(jié)點(diǎn)的隸屬度,得到節(jié)點(diǎn)的AS劃分結(jié)果,并提出了一種對(duì)劃分結(jié)果的檢驗(yàn)方法。
【專利說明】基于SVI的互聯(lián)網(wǎng)AS推斷以及路由器劃分方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,具體涉及一種AS推斷以及路由器劃分方法。
【背景技術(shù)】
[0002]隨著Internet規(guī)模的不斷擴(kuò)大,結(jié)構(gòu)日益復(fù)雜,準(zhǔn)確獲取網(wǎng)絡(luò)設(shè)備互聯(lián)結(jié)構(gòu)變得更加困難。而網(wǎng)絡(luò)拓?fù)湫畔⒃诰W(wǎng)絡(luò)監(jiān)測(cè)和診斷、網(wǎng)絡(luò)模擬、路由協(xié)議行為研究、網(wǎng)絡(luò)性能優(yōu)化、網(wǎng)絡(luò)安全實(shí)施等方面有著重要的應(yīng)用。Internet可以被劃分為多個(gè)獨(dú)立的管理域,稱為自治系統(tǒng)(Autonomous System, AS),每個(gè)AS由具有單一路由策略的一組路由器和其他網(wǎng)絡(luò)設(shè)備及相互連接構(gòu)成,由一個(gè)管理機(jī)構(gòu)控制管理。不同AS通過外部網(wǎng)關(guān)協(xié)議(Exter1rGateway Protocol, EGP)來交換路由信息,目前廣泛采用的協(xié)議是邊界網(wǎng)關(guān)協(xié)議(BorderGateway Protocol, BGP)0
[0003]現(xiàn)有的互聯(lián)網(wǎng)拓?fù)淠P椭饕譃槁酚善?RL)級(jí)拓?fù)淠P秃妥灾斡?AS)級(jí)拓?fù)淠P?,但由于互?lián)網(wǎng)的復(fù)雜性,這些拓?fù)淠P筒⒉荒軌蛉嬲故净ヂ?lián)網(wǎng)的拓?fù)涮匦?AS級(jí)拓?fù)淠P蜔o法模擬大規(guī)模復(fù)雜網(wǎng)絡(luò)范圍,且不能很好反映多種實(shí)際網(wǎng)絡(luò)拓?fù)涮匦?;由于現(xiàn)有路由器級(jí)拓?fù)浒l(fā)現(xiàn)算法都不能保證測(cè)量集合的準(zhǔn)確性以及完備性,從而對(duì)RL級(jí)拓?fù)浣.a(chǎn)生了一定的困難,且現(xiàn)階段的理論分析不夠成熟。
[0004]互聯(lián)網(wǎng)作為復(fù)雜網(wǎng)絡(luò)的一種,可以利用當(dāng)前已有的大量復(fù)雜網(wǎng)絡(luò)拓?fù)淠P蛯?duì)其進(jìn)行分析,但基于復(fù)雜網(wǎng)絡(luò)的拓?fù)淠P歪槍?duì)的是自然界中普遍存在的復(fù)雜網(wǎng)絡(luò)的基本規(guī)律,其追求一般化的復(fù)雜網(wǎng)絡(luò)模型或生成模型,導(dǎo)致這些模型只能在一定程度上適用于互聯(lián)網(wǎng),因此需要討論復(fù)雜網(wǎng)絡(luò)(特別地,大規(guī)模復(fù)雜網(wǎng)絡(luò))建模方法對(duì)當(dāng)前互聯(lián)網(wǎng)拓?fù)浣Y(jié)構(gòu)的適應(yīng)性,并建立專門針對(duì)互聯(lián)網(wǎng)的模型。
[0005]MMSB (Mixed Membership Stochastic Blockmodel)是近年來出現(xiàn)的較好的社團(tuán)劃分法,適用于分析處理具有復(fù)雜關(guān)聯(lián)關(guān)系的數(shù)據(jù),數(shù)據(jù)在數(shù)學(xué)上可以表達(dá)為復(fù)雜的圖(graph)或者網(wǎng)絡(luò)(network)結(jié)構(gòu)。MMSB提出了混合隸屬度的重要概念,并且有較高的劃分準(zhǔn)確性。
[0006]麗SB中,每個(gè)個(gè)體用一個(gè)節(jié)點(diǎn)來表示,節(jié)點(diǎn)之間的關(guān)系用邊來表達(dá),邊可以分為有向邊和無向邊,某些節(jié)點(diǎn)之間存在一定的相似性或者相比之下聯(lián)系更加緊密,呈現(xiàn)出模塊或者社團(tuán)的結(jié)構(gòu)。每個(gè)節(jié)點(diǎn)關(guān)聯(lián)一個(gè)屬性值(隸屬度),用于表達(dá)該節(jié)點(diǎn)與其他每個(gè)社團(tuán)的從屬關(guān)系,MMSB通過觀測(cè)值來推算每個(gè)節(jié)點(diǎn)的隸屬度,進(jìn)而可以分析出節(jié)點(diǎn)的模塊劃分情況。
[0007]傳統(tǒng)的方法在網(wǎng)絡(luò)規(guī)模較小的時(shí)候,可以較好的工作,在網(wǎng)絡(luò)節(jié)點(diǎn)巨大時(shí),由于其較高的算法復(fù)雜度,不能工作或需要花費(fèi)太長(zhǎng)的時(shí)間。SVI (Stochastic Variat1nalInference),
[0008]隨機(jī)變分推斷,可以在網(wǎng)絡(luò)規(guī)模巨大時(shí)較好地工作。SVI采用變分和最優(yōu)化方法求解模型,可以并行實(shí)現(xiàn)。
[0009]互聯(lián)網(wǎng)拓?fù)渲械腁S識(shí)別以及路由器劃分至AS至少包括兩個(gè)部分:一是在互聯(lián)網(wǎng)中采集與拓?fù)湎嚓P(guān)的信息;二是根據(jù)采集的信息,推斷互聯(lián)網(wǎng)拓?fù)浣Y(jié)構(gòu)。現(xiàn)有的互聯(lián)網(wǎng)拓?fù)渥R(shí)別方法存在兩方面的缺陷:
[0010](I)現(xiàn)有拓?fù)渥R(shí)別方法大都從一種或少量幾種與網(wǎng)絡(luò)拓?fù)湎嚓P(guān)的信息出發(fā),恢復(fù)網(wǎng)絡(luò)拓?fù)?。?zhǔn)確的互聯(lián)網(wǎng)拓?fù)浠謴?fù)對(duì)單個(gè)信息的完備性和準(zhǔn)確性提出了很高的要求,通常難以做到。實(shí)際情況是:可以獲得與網(wǎng)絡(luò)拓?fù)湎嚓P(guān)的多種信息,但每一種信息都不足以完全準(zhǔn)確地恢復(fù)互聯(lián)網(wǎng)拓?fù)?,需要綜合我們所能獲得的全部信息,以最終獲得的拓?fù)淠茏畲笙薅鹊臐M足所有與拓?fù)湎嚓P(guān)信息為目標(biāo),構(gòu)建多源信息融合的大型最優(yōu)化問題,通過該最優(yōu)化問題的求解,恢復(fù)互聯(lián)網(wǎng)拓?fù)洹?br>
[0011](2)現(xiàn)有拓?fù)浠謴?fù)方法大都從網(wǎng)絡(luò)的一個(gè)節(jié)點(diǎn)或一條邊出發(fā),通過對(duì)采集獲得的拓?fù)湎嚓P(guān)信息深入分析,以某種規(guī)則逐步加入節(jié)點(diǎn)和邊,每次只加入一條邊或一個(gè)節(jié)點(diǎn)。對(duì)于小規(guī)模的網(wǎng)絡(luò),這樣的方法是合適的,但針對(duì)互聯(lián)網(wǎng)拓?fù)溥@樣的復(fù)雜巨系統(tǒng),現(xiàn)有方法的計(jì)算復(fù)雜度太高,幾乎難以實(shí)現(xiàn),需要根據(jù)我們獲得的所有拓?fù)湎嚓P(guān)信息,通過少量步驟,以較少的計(jì)算工作量恢復(fù)互聯(lián)網(wǎng)拓?fù)洹?br>
[0012]以上問題產(chǎn)生的原因在于:針對(duì)互聯(lián)網(wǎng)拓?fù)溥@一復(fù)雜巨系統(tǒng),缺乏一種簡(jiǎn)單有效的數(shù)學(xué)方法進(jìn)行準(zhǔn)確完整的描述與表達(dá),便于進(jìn)行互聯(lián)網(wǎng)拓?fù)涞南嚓P(guān)研究,便于解釋互聯(lián)網(wǎng)這種無處不在的復(fù)雜網(wǎng)絡(luò)的共同結(jié)構(gòu)。
【發(fā)明內(nèi)容】
[0013]針對(duì)現(xiàn)有技術(shù)存在的上述問題,本發(fā)明提出了基于SVI的互聯(lián)網(wǎng)AS推斷以及路由器劃分方法。本發(fā)明的方案具體包含以下步驟:
[0014]步驟S1:建立數(shù)學(xué)模型,具體包括以下步驟:
[0015]步驟Sll:對(duì)于每個(gè)節(jié)點(diǎn),從屬向量QiNDirichlet(Ct);其中,i表示節(jié)點(diǎn),符號(hào)“?”表示服從(后同)的意思,即ρ Θ i = Dirichlet ( Θ j ; α ),等式右邊為參數(shù)為向量α的狄利克雷分布;
[0016]步驟S12:對(duì)于每一對(duì)節(jié)點(diǎn)i和j,其中i〈j,社團(tuán)指示向量與從屬向量Qi*聯(lián),社團(tuán)指示向量ZiM與從屬向量Θ」關(guān)聯(lián);其中社團(tuán)指示向量ZiI與社團(tuán)指示向量Ziy取值為I到K,所述K表示社團(tuán);
[0017]步驟S2:建立從屬向量Θ到觀測(cè)值y的先驗(yàn)概率模型:
_8] Piyij = l\Z^j,Zi”.,β) = m二 ^ z:::.
[0019]其中,民M表示第Al個(gè)社團(tuán)的內(nèi)部節(jié)點(diǎn)之間聯(lián)系緊密程度,e為常數(shù),e取極小值1.0X 10_9,y為實(shí)際觀測(cè)數(shù)據(jù)中節(jié)點(diǎn)之間的連接情況,兩點(diǎn)之間連接時(shí),y取值為1,否則取O ;
[0020]步驟S3:求解先驗(yàn)概率模型,通過求解以下公式,計(jì)算出節(jié)點(diǎn)的隸屬度Θ,得到節(jié)點(diǎn)的AS劃分結(jié)果;
[0021 ] L( Y , Φ, λ ) =E(log(ρ θ , ζ, β y)))-E(log(q θ , ζ, β )));
[0022]其中,Υ為從屬向量θ的分布的參數(shù),Φ為社團(tuán)指示向量ζ的分布的參數(shù),λ分別為β的分布的參數(shù),符號(hào)Ε(.)表示數(shù)學(xué)期望,上式等號(hào)右側(cè)中,前項(xiàng)與后項(xiàng)分別為 E (log (ρ θ , ζ, β |y)))表示求 log (ρ ( θ,ζ, β y)), E (log (q θ,ζ, β )))表示求log (q θ,ζ, β ))在分布q ( θ,ζ, β )下的期望;
[0023]步驟S4:求解步驟 S3 所述公式:L( Y , Φ,λ ) = E(log(p θ,ζ, β | y)))-E (log(q(θ , ζ, β )));
[0024]步驟S4具體包括以下分步驟:
[0025]步驟S41:初始化全局變量
【權(quán)利要求】
1.基于SVI的互聯(lián)網(wǎng)AS推斷以及路由器劃分方法,其特征在于,包括以下步驟: 步驟S1:建立數(shù)學(xué)模型,具體包括以下步驟: 步驟Sll:對(duì)于每個(gè)節(jié)點(diǎn),從屬向量QiNDirichlet(Ct);其中,i表示節(jié)點(diǎn),符號(hào)“?”表示服從(后同)的意思,即P(Qi) =DiriChlet(0i;a),等式右邊為參數(shù)為向量a的狄利克雷分布; 步驟S12:對(duì)于每一對(duì)節(jié)點(diǎn)i和j,其中i〈j,社團(tuán)指示向量ZiI與從屬向量Θ i關(guān)聯(lián),社團(tuán)指示向量Zi叫與從屬向量Θ j關(guān)聯(lián);其中社團(tuán)指示向量ZiI與社團(tuán)指示向量Zi叫取值為I到K,所述K表示社團(tuán); 步驟S2:建立從屬向量Θ到觀測(cè)值y的先驗(yàn)概率模型: Pivij =本叫,工葉 β) = ^ if^^; 其中,民μ表示第Z".個(gè)社團(tuán)的內(nèi)部節(jié)點(diǎn)之間聯(lián)系緊密程度,e為常數(shù),e取極小值1.0X 10_9,y為實(shí)際觀測(cè)數(shù)據(jù)中節(jié)點(diǎn)之間的連接情況,兩點(diǎn)之間連接時(shí),y取值為1,否則取O ; 步驟S3:求解先驗(yàn)概率模型,通過求解以下公式,計(jì)算出節(jié)點(diǎn)的隸屬度Θ,得到節(jié)點(diǎn)的AS劃分結(jié)果;
L( Y , Φ,λ ) =E (log (p ( θ,Ζ, β I Y))) —Ε (log (q( θ , ζ, β ))); 其中,Y為從屬向量θ的分布的參數(shù),Φ為社團(tuán)指示向量ζ的分布的參數(shù),λ分別為β的分布的參數(shù),符號(hào)Ε(.)表示數(shù)學(xué)期望,上式等號(hào)右側(cè)中,前項(xiàng)與后項(xiàng)分別為 E (log (P ( Θ,ζ, β I y)))表示求 log (P θ,ζ, β I y)),E (logq θ,ζ, β )))表示求log (q θ,ζ, β ))在分布q ( θ,ζ, β )下的期望;
步驟 S4:求解步驟 S3 所述公式:L( Y , Φ, λ ) = E (log (ρ θ,ζ, β y)))-E (log (q ( θ,ζ,β))); 步驟S4具體包括以下分步驟:
Ti] [A1 步驟S4l:初始化全局變量γ= , λ=::
-YnJ -λ/。 步驟S42:從節(jié)點(diǎn)中抽取一定量的節(jié)點(diǎn)對(duì),記做集合S ; 步驟S43:對(duì)于集合S中的所有節(jié)點(diǎn)對(duì),根據(jù)當(dāng)前全局變量值計(jì)算最優(yōu)局部變量和最優(yōu)局部變量Φ卜j ; 步驟S44:對(duì)于每個(gè)節(jié)點(diǎn)a,更新Y a,對(duì)于每個(gè)社團(tuán)k,更新Ak; 步驟S45:重復(fù)步驟S2,步驟S3,步驟S4直到收斂。
2.根據(jù)權(quán)利要求1基于SVI的互聯(lián)網(wǎng)AS推斷以及路由器劃分方法,其特征在于,所述步驟S43的更新公式如下:
cK^bJyab = O exp (Eq [log θ 3^] + Φ3^?3;1?Ε(1[1οδ(1-β1?)] + (1-φ3^?3;1?)1οδ1- e ));
cK^Jyab = I 00 exp (Eq [log θ 3^] + Φ3^?3;1?Ε(1[1οδ(1-β1?)]+1-φ3^?3;1?)1οδ e ; 其中—b,k和—b,k表不第k個(gè)社團(tuán)的最優(yōu)局部變量,Eq[log Θ a,k]中,下標(biāo)q表不在分布q( θ,ζ, β )下求log Θ a,k的數(shù)學(xué)期望,yab表示節(jié)點(diǎn)a和b之間的連接情況,exp ?表示以e為底的指數(shù)函數(shù),β,表示第k個(gè)社團(tuán)的內(nèi)部節(jié)點(diǎn)之間聯(lián)系緊密程度。
3.根據(jù)權(quán)利要求1基于SVI的互聯(lián)網(wǎng)AS推斷以及路由器劃分方法,其特征在于,所述步驟S44的更新公式如下
其中,yab,ci = yab,yab,i = 1-yab,p t = (tQ+t)_k,k e 0.5,1,的值為多重圖情況下節(jié)點(diǎn)對(duì)yab的重?cái)?shù),Yah表示節(jié)點(diǎn)a和b之間的連接情況,上式中的梯度為自然梯度。
4.根據(jù)權(quán)利要求1基于SVI的互聯(lián)網(wǎng)AS推斷以及路由器劃分方法,其特征在于,所述β為服從參數(shù)為η的Beta分布的隨機(jī)變量。
5.一種針對(duì)模型結(jié)果的驗(yàn)證方法,其特征在于,通過求解式子= argmaxA來判斷換份結(jié)果的準(zhǔn)確性,該式的意思為,求一個(gè)標(biāo)號(hào)i,且標(biāo)號(hào)i使得yi取最大值,如果右瓦0.與劃分的結(jié)果一致,從而劃分正確,否則調(diào)整參數(shù),重新進(jìn)行計(jì)算; 其中,表示連接數(shù)量最大的 AS, Yi表示節(jié)點(diǎn)i與每個(gè)AS內(nèi)部節(jié)點(diǎn)中的連接數(shù)量。
【文檔編號(hào)】H04L12/701GK104168188SQ201410415718
【公開日】2014年11月26日 申請(qǐng)日期:2014年8月22日 優(yōu)先權(quán)日:2014年8月22日
【發(fā)明者】胡光岷, 袁明凱, 劉唯一 申請(qǐng)人:電子科技大學(xué)