本發(fā)明涉及一種復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法。特別是涉及一種基于時間序列模式表征的加權(quán)有向復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法。
背景技術(shù):
復(fù)雜網(wǎng)絡(luò)分析方法是把復(fù)雜系統(tǒng)內(nèi)部基元之間的關(guān)系抽象為網(wǎng)絡(luò)的節(jié)點(diǎn)和連邊形式,然后通過量化分析網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)及動力學(xué)行為,揭示復(fù)雜系統(tǒng)的內(nèi)在屬性及運(yùn)行規(guī)律等重要信息。復(fù)雜網(wǎng)絡(luò)分析方法為不同類型的復(fù)雜系統(tǒng)研究(例如生物網(wǎng)絡(luò)、腦神經(jīng)網(wǎng)絡(luò)、萬維網(wǎng)、社交網(wǎng)絡(luò)等)提供了全新的視角,因此受到了不同學(xué)科科研人員的廣泛關(guān)注,并取得了一系列可喜的進(jìn)展。但隨著研究的不斷深入及應(yīng)用對象的劇增,現(xiàn)有的復(fù)雜網(wǎng)絡(luò)方法的缺陷和不足也逐漸凸顯,因此探尋新的適用度更廣且性能更優(yōu)的復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法成為該領(lǐng)域亟待解決的難題之一。
近些年來,科研人員研究發(fā)現(xiàn)復(fù)雜網(wǎng)絡(luò)分析方法不僅能夠挖掘出時間序列中的重要信息,而且便于研究理論模型難以精確描述的復(fù)雜非線性系統(tǒng),因此,逐漸發(fā)展成為一類全新的(非線性)時間序列的分析工具。目前,(非線性時間序列映射為復(fù)雜網(wǎng)絡(luò)最經(jīng)典的方法有:基于相空間重構(gòu)建網(wǎng)方法和可視圖建網(wǎng)方法。相空間重構(gòu)建網(wǎng)方法是通過嵌入維數(shù)和延遲時間估算技術(shù)從原始時間序列中抽取一組多維向量,將這些向量作為復(fù)雜網(wǎng)絡(luò)的節(jié)點(diǎn),然后依據(jù)向量之間的相似性確定網(wǎng)絡(luò)節(jié)點(diǎn)的連邊(節(jié)點(diǎn)間的相似性度大于某一給定閾值),從而構(gòu)造出原始時間序列對應(yīng)的復(fù)雜網(wǎng)絡(luò),該方法在嵌入維數(shù)和延遲時間估算過程中存在不穩(wěn)定因素,且連邊關(guān)系判斷的最佳閾值也很難確定,導(dǎo)致該方法應(yīng)用的魯棒性較差??梢晥D建網(wǎng)方法是將原始時間序列中的數(shù)據(jù)點(diǎn)作為網(wǎng)絡(luò)的節(jié)點(diǎn),將數(shù)據(jù)點(diǎn)之間的可視關(guān)系作為網(wǎng)絡(luò)的連邊,其中可視關(guān)系是通過節(jié)點(diǎn)之間的數(shù)據(jù)大小和可視規(guī)則確定的。相比相空間重構(gòu)建網(wǎng)方法,可視圖建網(wǎng)方法參數(shù)較少,算法魯棒性較好,但這種建網(wǎng)方法網(wǎng)絡(luò)規(guī)模與時間序列長度直接相關(guān),當(dāng)分析的時間序列長度較長時,對應(yīng)復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)較多,導(dǎo)致后續(xù)復(fù)雜網(wǎng)絡(luò)特性的抽取計算復(fù)雜度較大。此外,上述兩種建網(wǎng)方法只能構(gòu)建無權(quán)、無向復(fù)雜網(wǎng)絡(luò)。
在無權(quán)、無向復(fù)雜網(wǎng)絡(luò)中,各基元之間僅存在“有關(guān)聯(lián)和沒關(guān)聯(lián)”這種簡單的關(guān)系,如果有關(guān)聯(lián)代表基元的兩個節(jié)點(diǎn)之間就存在連邊,否則就不存在連邊。但在很多實(shí)際復(fù)雜系統(tǒng)中,各基元之間關(guān)聯(lián)程度存在量上的差異,因此不能簡單地用“0”或“1”表示。此外,很多基元之間關(guān)聯(lián)還存在一定的方向性差異,例如基元A可以影響基元B,但基元B可能對基元A的狀態(tài)沒有影響,即基元A對基元B具有單向傳遞性。由此看出,無權(quán)、無向復(fù)雜網(wǎng)絡(luò)無法精確反應(yīng)節(jié)點(diǎn)(或基元)之間的關(guān)聯(lián)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是,提供一種能夠更精細(xì)的反映原始時間序列各分段之間關(guān)系的基于時間序列模式表征的加權(quán)有向復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法。
本發(fā)明所采用的技術(shù)方案是:一種基于時間序列模式表征的加權(quán)有向復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法,包括如下步驟:
1)采用零均值規(guī)范化方法將原始時間序列規(guī)范化,通過如下計算公式:
其中,是時間序列的均值,a為原始時間序列的標(biāo)準(zhǔn)偏差,
對于原始時間序列{xi},i=1,…,t,進(jìn)行標(biāo)準(zhǔn)化后得到新的時間序列{yi},i=1,…,t;
2)將新的時間序列{yi},i=1,…,t等概率劃分為n個區(qū)間,然后用設(shè)定的字符串中的字符來表示各個區(qū)間,每個區(qū)間對應(yīng)一個字符,從而將新的時間序列{yi},i=1,…,t表示為字符串序列{sk},k=1,…,t,其中sk是設(shè)定的字符串中的字符,所述設(shè)定的字符串是由英文字母中的前n個字母組成;
3)用一個長度為l的滑窗,l的默認(rèn)值為4,從字符串序列{sk},k=1,…,n的第一個字符開始自左向右移動,滑窗每次移動1步,就將字符串序列{sk}劃分為長度均為l的(n-l+1)個片段,將每一個片段視為一個模態(tài);
4)將不同模態(tài)作為復(fù)雜網(wǎng)絡(luò)的節(jié)點(diǎn),由節(jié)點(diǎn)之間的轉(zhuǎn)換頻次和轉(zhuǎn)換方向確定復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)之間的連邊權(quán)重和方向,從而將字符串序列{sk}映射為一個加權(quán)有向復(fù)雜網(wǎng)絡(luò);
5)計算加權(quán)有向復(fù)雜網(wǎng)絡(luò)的網(wǎng)絡(luò)拓?fù)浣y(tǒng)計特性,包括網(wǎng)絡(luò)規(guī)模SN、加權(quán)有向平均路徑長度WPL和介數(shù)中心性BC;
SN=N (4)
其中,
其中,
其中N為網(wǎng)絡(luò)的節(jié)點(diǎn)總數(shù);Pl(p,q)為節(jié)點(diǎn)p到節(jié)點(diǎn)q的加權(quán)有向最短路徑長度,wpq為節(jié)點(diǎn)p到節(jié)點(diǎn)q的加權(quán)路徑;Bc(p)為節(jié)點(diǎn)p的介數(shù)中心性,Lmq為從節(jié)點(diǎn)m到節(jié)點(diǎn)q的所有最短路徑的總數(shù)目,Lmq(p)從節(jié)點(diǎn)m到節(jié)點(diǎn)q且經(jīng)過節(jié)點(diǎn)p的所有最短路徑數(shù)目。
步驟4)是依據(jù)如下規(guī)則確定復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)之間的連邊權(quán)重和方向:如果當(dāng)前節(jié)點(diǎn)與下一時刻節(jié)點(diǎn)相同,即節(jié)點(diǎn)保持不變;如果從當(dāng)前節(jié)點(diǎn)到下一時刻的節(jié)點(diǎn)發(fā)了變化,那么這兩個節(jié)點(diǎn)之間存在一條連邊,方向?yàn)閺漠?dāng)前節(jié)點(diǎn)指向下一個節(jié)點(diǎn),且這兩個節(jié)點(diǎn)之間的連邊權(quán)重增加1。
步驟4)還包括借助UCINET軟件的NETDRAW工具包繪制有向加權(quán)網(wǎng)絡(luò)的連接狀況可視圖。
本發(fā)明的基于時間序列模式表征的加權(quán)有向復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法,借助時間序列符號化表征技術(shù)和滑窗技術(shù),獲得一系列符號化模式作為網(wǎng)絡(luò)節(jié)點(diǎn),然后分析符號化模式之間的關(guān)聯(lián)確定網(wǎng)絡(luò)的權(quán)重和方向。本發(fā)明能夠更精細(xì)的反映原始時間序列各分段之間的關(guān)系,因此其網(wǎng)絡(luò)結(jié)構(gòu)和特性能更靈敏、更準(zhǔn)確的體現(xiàn)不同信號的差異,從而顯著提升時間序列信號的分類或識別精度。本發(fā)明主要優(yōu)點(diǎn)及特色體現(xiàn)在如下幾個方面:
1、本發(fā)明提出的加權(quán)有向復(fù)雜網(wǎng)絡(luò)由于能更精細(xì)地反映基元之間的關(guān)聯(lián),因此其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和特性能更靈敏、更準(zhǔn)確地體現(xiàn)時間序列的差異,顯著提升時間序列分類和識別性能。
2、本發(fā)明方法利用時間序列符號化模式表征技術(shù)確定網(wǎng)絡(luò)節(jié)點(diǎn),然后通過計算符號化模式的轉(zhuǎn)換頻次確定網(wǎng)絡(luò)權(quán)重,符號化模式的轉(zhuǎn)換方向確定節(jié)點(diǎn)間的連接方向。上述處理方法受時間序列的長度影響較小,可適用于長度較長甚至超長的時間序列分析,而經(jīng)典時間序列復(fù)雜網(wǎng)絡(luò)分析方法(如可視圖方法和相空間方法)無法實(shí)現(xiàn)。
3、本發(fā)明提出的時間序列有向、加權(quán)復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法適用范圍非常廣,分析信號可以是線性信號也可以是非線性信號。該方法為不同類型的復(fù)雜系統(tǒng)的分析,如氣象數(shù)據(jù)、股票數(shù)據(jù)、心腦電等數(shù)據(jù)的分析提供一全新的解讀工具。
附圖說明
圖1是本發(fā)明基于時間序列模式表征的加權(quán)有向復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法的流程圖;
圖2是本發(fā)明實(shí)例選取的Logistics映射在不同參數(shù)下對應(yīng)的時間序列圖;
圖3是本發(fā)明實(shí)例選取的Logistics映射在不同參數(shù)下對應(yīng)的時間序列標(biāo)準(zhǔn)化后得到的序列圖;
圖4是Logistics映射在參數(shù)μ=3.8時的標(biāo)準(zhǔn)化序列進(jìn)行符號化表征的示意圖;
圖5a是不同參數(shù)下Logistics映射對應(yīng)的周期狀態(tài)時間序列建立的加權(quán)有向復(fù)雜網(wǎng)絡(luò)的網(wǎng)絡(luò)規(guī)模SN變化圖;
圖5b是不同參數(shù)下Logistics映射對應(yīng)的混沌狀態(tài)時間序列建立的加權(quán)有向復(fù)雜網(wǎng)絡(luò)的網(wǎng)絡(luò)規(guī)模SN變化圖;
圖6a是不同參數(shù)下Logistics映射對應(yīng)的混沌狀態(tài)時間序列建立的加權(quán)有向復(fù)雜網(wǎng)絡(luò)的加權(quán)有向平均路徑長度WDPL變化圖;
圖6b是不同參數(shù)下Logistics映射對應(yīng)的混沌狀態(tài)時間序列建立的加權(quán)有向復(fù)雜網(wǎng)絡(luò)的介數(shù)中心性BC變化圖。
具體實(shí)施方式
下面結(jié)合實(shí)施例和附圖對本發(fā)明的基于時間序列模式表征的加權(quán)有向復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法做出詳細(xì)說明。
本發(fā)明的基于時間序列模式表征的加權(quán)有向復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法,包括如下步驟:
1)采用零均值規(guī)范化方法將原始時間序列規(guī)范化,零均值規(guī)范化方法是將所有時間序列數(shù)據(jù)轉(zhuǎn)化為均值為0,方差為1的標(biāo)準(zhǔn)化時間序列。通過如下計算公式:
其中,是時間序列的均值,a為原始時間序列的標(biāo)準(zhǔn)偏差,
對于原始時間序列{xi},i=1,…,t,進(jìn)行標(biāo)準(zhǔn)化后得到新的時間序列{yi},i=1,…,t;
2)將新的時間序列{yi},i=1,…,t等概率劃分為n個區(qū)間,然后用設(shè)定的字符串中的字符來表示各個區(qū)間,每個區(qū)間對應(yīng)一個字符,從而將新的時間序列{yi},i=1,…,t表示為字符串序列{sk},k=1,…,t,其中sk是設(shè)定的字符串中的字符,所述設(shè)定的字符串是由英文字母中的前n個字母組成;
3)用一個長度為l的滑窗,l的默認(rèn)值為4,從字符串序列{sk},k=1,…,n的第一個字符開始自左向右移動,滑窗每次移動1步,就將字符串序列{sk}劃分為長度均為l的(n-l+1)個片段,將每一個片段視為一個模態(tài);
4)將不同模態(tài)作為復(fù)雜網(wǎng)絡(luò)的節(jié)點(diǎn),由節(jié)點(diǎn)之間的轉(zhuǎn)換頻次和轉(zhuǎn)換方向確定復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)之間的連邊權(quán)重和方向,從而將字符串序列{sk}映射為一個加權(quán)有向復(fù)雜網(wǎng)絡(luò);具體是依據(jù)如下規(guī)則確定復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)之間的連邊權(quán)重和方向:如果當(dāng)前節(jié)點(diǎn)與下一時刻節(jié)點(diǎn)相同,即節(jié)點(diǎn)保持不變;如果從當(dāng)前節(jié)點(diǎn)到下一時刻的節(jié)點(diǎn)發(fā)了變化,那么這兩個節(jié)點(diǎn)之間存在一條連邊,方向?yàn)閺漠?dāng)前節(jié)點(diǎn)指向下一個節(jié)點(diǎn),且這兩個節(jié)點(diǎn)之間的連邊權(quán)重增加1;
該步驟還包括借助UCINET軟件的NETDRAW工具包繪制有向加權(quán)網(wǎng)絡(luò)的連接狀況可視圖。
5)計算加權(quán)有向復(fù)雜網(wǎng)絡(luò)的網(wǎng)絡(luò)拓?fù)浣y(tǒng)計特性,包括網(wǎng)絡(luò)規(guī)模SN、加權(quán)有向平均路徑長度WDPL和介數(shù)中心性BC;
SN=N (4)
其中,
其中,
其中N為網(wǎng)絡(luò)的節(jié)點(diǎn)總數(shù);Pl(p,q)為節(jié)點(diǎn)p到節(jié)點(diǎn)q的加權(quán)有向最短路徑長度,wpq為節(jié)點(diǎn)p到節(jié)點(diǎn)q的加權(quán)路徑;Bc(p)為節(jié)點(diǎn)p的介數(shù)中心性,Lmq為從節(jié)點(diǎn)m到節(jié)點(diǎn)q的所有最短路徑的總數(shù)目,Lmq(p)從節(jié)點(diǎn)m到節(jié)點(diǎn)q且經(jīng)過節(jié)點(diǎn)p的所有最短路徑數(shù)目。
下面結(jié)合Logistics映射實(shí)例及附圖詳細(xì)的說明基于時間序列模式表征的加權(quán)有向復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法如下:
Logistics映射是典型的一維混沌時間序列模型,它是通過倍周期分叉進(jìn)入混沌的。Logistics映射模型參照下面的方程:
xn+1=μxn(1-xn) (8)
參數(shù)μ的取值不同,即對應(yīng)不同的狀態(tài)。在本實(shí)例中,我們設(shè)定Logistics系統(tǒng)的初始值為0.5,步長為0.01,時間為100s。參數(shù)μ分別取3.5,3.6,3.628,3.7,3.74,3.8,3.84,3.9,3.99這9個值時,可以得到長度均為10000的不同狀態(tài)的Logistics時間序列,如圖2所示。各個參數(shù)下的狀態(tài)參照表1。
表1 Logistics系統(tǒng)在各個參數(shù)下的狀態(tài)
1)將每一個Logistics時間序列{xn},n=1,…,10000規(guī)范化,這里我們采用零均值規(guī)范化方法。該方法是將所有時間序列數(shù)據(jù)轉(zhuǎn)化為均值為0,方差為1的標(biāo)準(zhǔn)化時間序列。對于原始時間序列{xn},n=1,…,10000,將其進(jìn)行標(biāo)準(zhǔn)化為后得到新的時間序列{yn},i=1,…,10000,如圖3所示。其計算公式為:
其中,是時間序列的均值,a為原始時間序列的標(biāo)準(zhǔn)偏差。
2)將得到的標(biāo)準(zhǔn)化的時間序列{yi},i=1,…,10000等概率劃分為12個區(qū)間,然后用設(shè)定的字符串中的字符表示各個區(qū)域,每個區(qū)域?qū)?yīng)一個字符,如圖4所示。這樣就將數(shù)據(jù)序列{yi},i=1,…,10000轉(zhuǎn)化為字符串序列{sk},k=1,…,10000,其中sk是設(shè)定的字符串中的字符,所述設(shè)定的字符串是由英文字母中的前12個字母組成
3)用一個長度為4的滑窗,從從字符串序列{sk},k=1,…,10000的第一個字符開始自左向右移動,劃分字符串序列{sk},k=1,…,10000為各個子片段,滑窗每次移動1步。這樣,就將字符串序列劃分為長度均為4的9997個片段,將每一個片段視為一個模態(tài)。
4)將不同模態(tài)作為復(fù)雜網(wǎng)絡(luò)的節(jié)點(diǎn),由節(jié)點(diǎn)之間的轉(zhuǎn)換頻次和轉(zhuǎn)換方向確定復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)之間的連邊權(quán)重和方向,從而將字符串序列{sk}映射為一個加權(quán)有向復(fù)雜網(wǎng)絡(luò)。具體是依據(jù)如下規(guī)則確定復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)之間的連邊權(quán)重和方向:如果當(dāng)前節(jié)點(diǎn)與下一時刻節(jié)點(diǎn)相同,即節(jié)點(diǎn)保持不變;如果從當(dāng)前節(jié)點(diǎn)到下一時刻的節(jié)點(diǎn)發(fā)了變化,那么這兩個節(jié)點(diǎn)之間存在一條連邊,方向?yàn)閺漠?dāng)前節(jié)點(diǎn)指向下一個節(jié)點(diǎn),且這兩個節(jié)點(diǎn)之間的連邊權(quán)重增加1。
5)借助UCINET軟件的NETDRAW工具包繪制有向加權(quán)網(wǎng)絡(luò)的連接狀況可視圖;
6)計算得到的加權(quán)有向網(wǎng)絡(luò)圖的網(wǎng)絡(luò)拓?fù)浣y(tǒng)計特性,包括網(wǎng)絡(luò)規(guī)模SN、加權(quán)有向平均路徑長度WDPL和介數(shù)中心性BC;
SN=N (4)
其中,
其中,
其中N為網(wǎng)絡(luò)的節(jié)點(diǎn)總數(shù);Pl(p,q)為節(jié)點(diǎn)p到節(jié)點(diǎn)q的加權(quán)有向最短路徑長度,wpq為節(jié)點(diǎn)p到節(jié)點(diǎn)q的加權(quán)路徑;Bc(p)為節(jié)點(diǎn)p的介數(shù)中心性,Lmq為從節(jié)點(diǎn)m到節(jié)點(diǎn)q的所有最短路徑的總數(shù)目,Lmq(p)從節(jié)點(diǎn)m到節(jié)點(diǎn)q且經(jīng)過節(jié)點(diǎn)p的所有最短路徑數(shù)目。
如圖5a所示,不同參數(shù)下Logistics映射對應(yīng)的周期時間序列建立的加權(quán)有向復(fù)雜網(wǎng)絡(luò)的網(wǎng)絡(luò)規(guī)模恰好等于周期解集的個數(shù),如圖5b所示,不同參數(shù)下Logistics映射對應(yīng)的混沌時間序列建立的加權(quán)有向復(fù)雜網(wǎng)絡(luò)的網(wǎng)絡(luò)規(guī)模隨混沌程度的增大而增加。如圖6a所示,不同參數(shù)下Logistics映射對應(yīng)的混沌時間序列建立的加權(quán)有向復(fù)雜網(wǎng)絡(luò)的加權(quán)有向平均路徑長度WDPL的值,隨著混沌程度的增大而增大,如圖6b所示,不同參數(shù)下Logistics映射對應(yīng)的混沌時間序列建立的加權(quán)有向復(fù)雜網(wǎng)絡(luò)的介數(shù)中心性BC隨著混沌程度的增加而不斷減小。