專利名稱:遠(yuǎn)距離相關(guān)參數(shù)的實(shí)時(shí)估計(jì)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及以實(shí)時(shí)方式估計(jì)參數(shù)的一種方法,這些參數(shù)是用于說(shuō)明數(shù)據(jù)流中那種遠(yuǎn)距離相關(guān)(LRD)過(guò)程的。更具體地說(shuō),本發(fā)明涉及實(shí)時(shí)地估計(jì)電信數(shù)據(jù)通信序列中赫斯特(H)參數(shù)和尺寸參數(shù)cf的一種方法,它能幫助分析長(zhǎng)途通信業(yè)務(wù)應(yīng)用中的數(shù)據(jù)。
隨著人們?cè)诟鞣N類型的數(shù)據(jù)和通信信息中發(fā)現(xiàn)自相似和遠(yuǎn)距離相關(guān)特性,LRD現(xiàn)象引起了電信領(lǐng)域的強(qiáng)烈興趣。關(guān)于這一現(xiàn)象對(duì)電信網(wǎng)絡(luò)性能的影響的調(diào)查顯現(xiàn)了對(duì)LRD參數(shù)非常精確和具有很高計(jì)算效率的估計(jì)算法的需要。
人們已經(jīng)知道遠(yuǎn)距離相關(guān)存在于大量推廣類型的數(shù)據(jù)中,包括高速電信網(wǎng)中的數(shù)據(jù)通信信號(hào)。在數(shù)據(jù)集合之間存在強(qiáng)相關(guān)的情況下,LRD的存在使得人們能夠預(yù)測(cè)數(shù)據(jù)通信的趨勢(shì)。LRD的一個(gè)常用定義是,平穩(wěn)隨機(jī)時(shí)間序列{xi}自協(xié)方差函數(shù)的緩慢、冪律一樣的衰減??梢詫⑺葍r(jià)地定義為以下序列譜起始點(diǎn)的冪律散度f(wàn)x(V)~cf|V|-a,|V|→O ( 1 )或者~Cf|V1-2H,|V|→O其中H=(1+α)/2是赫斯特參數(shù),0.5<H<1,α是“尺度”參數(shù),cf是“尺寸”參數(shù)。
LRD現(xiàn)象主要說(shuō)的是從任意給定時(shí)刻開(kāi)始所有下游相關(guān)的和總是可以察覺(jué)的,即使這些相關(guān)單個(gè)地都很小。重要的是它意味著根本不可能定義一個(gè)特征時(shí)間尺度,超過(guò)它以后相關(guān)就基本消失,就象自相關(guān)函數(shù)按指數(shù)規(guī)律衰減過(guò)程這種情形一樣,這也是經(jīng)典假設(shè)。這樣,例如,人們無(wú)法找到一個(gè)基準(zhǔn)時(shí)間單位,在這一基準(zhǔn)之上數(shù)據(jù)的一些特性能夠可靠地測(cè)量出來(lái)。LRD的特征在于參數(shù)α決定的尺度不變特性,而不是單個(gè)重要的時(shí)間尺度,這個(gè)參數(shù)α描述的是尺度之間的關(guān)系。
LRD的最簡(jiǎn)單定義涉及到前面介紹過(guò)的兩個(gè)參數(shù)α和cf,其中α更重要。
由于α因而H出現(xiàn)在(1)式的指數(shù)中,因此,它定義了LRD現(xiàn)象的存在,并支配著LRD過(guò)程的特征尺度行為以及從它導(dǎo)出的統(tǒng)計(jì)量,包括序列抽樣平均這樣的基本量。這樣,H給出了數(shù)據(jù)集合之間相關(guān)的衰減速率的一個(gè)度量。因此正確地估計(jì)α非常重要。
參數(shù)cf在確定LRD產(chǎn)生的效應(yīng)的絕對(duì)尺寸里起著主要作用,它的一般特性由H決定。估計(jì)cf對(duì)量化分析非常重要,但是也存在著H估計(jì)所固有的統(tǒng)計(jì)困難。
赫斯特參數(shù)有基于時(shí)域或者基于頻域的估計(jì)值,它的統(tǒng)計(jì)性能很差,包括高偏差和/或很大的方差。
但是,利用小波分析的估計(jì)器會(huì)以一種無(wú)偏差的方式給出自然的,在統(tǒng)計(jì)意義上和計(jì)算方面具有高效率的赫斯特參數(shù)H估計(jì)。小波分析是一種工具,直接通過(guò)尺度一時(shí)間聯(lián)合小波分解來(lái)研究數(shù)據(jù)跟尺度有關(guān)的特性。通過(guò)進(jìn)行多尺度分析,小波分解考慮了過(guò)程的尺度特性。這樣,關(guān)于其中的過(guò)程不需要進(jìn)行許多假設(shè)。如果找到了LRD跡象,它就會(huì)給出一個(gè)無(wú)偏差半?yún)?shù)估計(jì)器,這可以用離散多分辨率分析(MRA)中的技術(shù)來(lái)高效實(shí)現(xiàn)(見(jiàn)P.Abry,P.Goncalves和P.Flandrin的“小波、頻譜估計(jì)、1/f過(guò)程”,統(tǒng)計(jì)學(xué)演講記錄,小波和統(tǒng)計(jì)學(xué),1995年,第105卷,第15~30頁(yè))。
然而,這樣的小波估計(jì)器只將直到特定時(shí)刻的數(shù)據(jù)集或者某一時(shí)間段內(nèi)的數(shù)據(jù)集的“靜態(tài)”分析考慮在內(nèi)。因此,它是一種離線處理,需要大量的存儲(chǔ)器儲(chǔ)存用于這一分析的所有數(shù)據(jù)組。如果在已有的數(shù)據(jù)集中需要添加新的數(shù)據(jù)組然后進(jìn)行分析,那就仍然需要保留所有的數(shù)據(jù)組,從而需要更多的存儲(chǔ)器來(lái)儲(chǔ)存這些數(shù)據(jù)組。隨著添加越來(lái)越多的數(shù)據(jù)組,擁有巨大的存儲(chǔ)器儲(chǔ)存裝置陣列變得越來(lái)越不現(xiàn)實(shí)。
有必要能夠分析實(shí)時(shí)數(shù)據(jù),例如長(zhǎng)途通信業(yè)務(wù)數(shù)據(jù),其中增加的數(shù)據(jù)對(duì)電信網(wǎng)絡(luò)的影響可以當(dāng)時(shí)就考慮進(jìn)去,而不需要在一個(gè)特定的時(shí)間段內(nèi)儲(chǔ)存大量的數(shù)據(jù)集。
本發(fā)明在小波分析的基礎(chǔ)上提供一種實(shí)時(shí)方法,用于估計(jì)在線數(shù)據(jù)流的LRD參數(shù),而不需要很大的存儲(chǔ)器,并且能夠以足夠塊的速度處理高速率數(shù)據(jù)。
該方法自然地確定尺度,這樣,當(dāng)數(shù)據(jù)傳輸速率隨著時(shí)間遷移變得更高的時(shí)候,從速度和存儲(chǔ)器容量方面考慮,該方法將是既可行又有效的。
一方面,本發(fā)明提供了一種方法,用于實(shí)時(shí)估計(jì)遠(yuǎn)距離相關(guān)(LRD)參數(shù),比方說(shuō)數(shù)據(jù)流的赫斯特參數(shù)H和尺寸參數(shù)cf,該方法包括以下步驟將所述數(shù)據(jù)流的每一個(gè)數(shù)據(jù)塊輸入到一個(gè)實(shí)時(shí)離散小波分解裝置中去;提取所述小波分解裝置產(chǎn)生的每一塊輸入數(shù)據(jù)的小波系數(shù);對(duì)于許多尺度中的每一個(gè)尺度,維持所述小波系數(shù)的一個(gè)平方和,并維持所述和中合并了的元素個(gè)數(shù);需要進(jìn)行估計(jì)的時(shí)候,該方法還包括以下步驟對(duì)于許多尺度中的每一個(gè),計(jì)算所述小波系數(shù)平方的平均值;在一個(gè)尺度范圍內(nèi)用所述平均值進(jìn)行加權(quán)線性回歸分析;和在所述線性回歸分析的基礎(chǔ)上計(jì)算LRD參數(shù)的估計(jì)。
第二方面,本發(fā)明提供了對(duì)LRD參數(shù),比方說(shuō)數(shù)據(jù)流的H和cf參數(shù),進(jìn)行實(shí)時(shí)估計(jì)的一種方法,該方法包括以下步驟從所述數(shù)據(jù)流中提取數(shù)據(jù)包;在一個(gè)n階時(shí)間間隔上將數(shù)據(jù)包聚集起來(lái),產(chǎn)生一個(gè)數(shù)據(jù)點(diǎn)x(n);將所有數(shù)據(jù)點(diǎn)x(n)輸入給一個(gè)實(shí)時(shí)離散小波分解裝置;從所述分解裝置提取產(chǎn)生的每一個(gè)數(shù)據(jù)點(diǎn)x(n)的小波系數(shù)dj;針對(duì)許多尺度中的每一個(gè)尺度j,維持所述小波系數(shù)的平方d2j的一個(gè)和Sj,并維持每一和Sj中使用的數(shù)據(jù)點(diǎn)的個(gè)數(shù)nj;需要進(jìn)行估計(jì)的時(shí)候,該方法還包括以下步驟針對(duì)每一個(gè)尺度j,從所述和Sj計(jì)算所述小波系數(shù)平方d2j的平均值;在一個(gè)尺度范圍內(nèi)用所述平均值進(jìn)行線性回歸分析;和在所述線性回歸的基礎(chǔ)上計(jì)算LRD參數(shù)的估計(jì)。
該方法還可以包括為所述估計(jì)計(jì)算置信區(qū)間。最好在計(jì)算完所述小波系數(shù)的平均值以后丟棄小波系數(shù)。最好在進(jìn)行線性回歸分析的步驟以前,選擇一個(gè)尺度范圍,在這一個(gè)范圍內(nèi)畫(huà)出線性回歸曲線。選擇尺度范圍的步驟可以在長(zhǎng)時(shí)間尺度上手工完成,或者按照一個(gè)適當(dāng)?shù)乃惴ㄗ詣?dòng)完成。
小波分解裝置可以包括一個(gè)多分辨率算法裝置或者通用濾波器組裝置。這一小波分解裝置可以用軟件或者用硬件實(shí)現(xiàn),例如,用一個(gè)數(shù)字信號(hào)處理芯片實(shí)現(xiàn)。
本發(fā)明還提供對(duì)數(shù)據(jù)流的LRD參數(shù),比方說(shuō)H和cf,進(jìn)行實(shí)時(shí)估計(jì)的裝置,所述裝置包括接收所述數(shù)據(jù)流的數(shù)據(jù)包的裝置;在一些時(shí)間間隔內(nèi)聚集收到的數(shù)據(jù)包,產(chǎn)生相應(yīng)的數(shù)據(jù)點(diǎn)x(n)的預(yù)處理器裝置;接收所有數(shù)據(jù)點(diǎn)x(n)的一個(gè)實(shí)時(shí)離散小波分解裝置;該分解裝置為每一個(gè)收到的數(shù)據(jù)點(diǎn)x(n)產(chǎn)生小波系數(shù)dj;在許多尺度的每一個(gè)尺度j上,計(jì)算所述系數(shù)平方d2j的和Sj,并得到用于所述和Sj中的數(shù)據(jù)點(diǎn)的個(gè)數(shù)nj的裝置;儲(chǔ)存Sj和nj的存儲(chǔ)器裝置;其中需要LRD參數(shù)的估計(jì)的時(shí)候,所述計(jì)算裝置(a)從所述和Sj計(jì)算每一個(gè)尺度j上所述系數(shù)平方d2j的平均;(b)在一個(gè)尺度范圍內(nèi)用所述平均值進(jìn)行線性回歸分析,和(c)在所述線性回歸分析的基礎(chǔ)上計(jì)算LRD參數(shù)的估計(jì)。
下面將參考以下附圖介紹本發(fā)明的一個(gè)優(yōu)選實(shí)施方案,在這些附圖中
圖1中的框圖說(shuō)明的是從數(shù)據(jù)信息流計(jì)算LRD參數(shù)的算法;圖2中的原理圖說(shuō)明的是進(jìn)行離散小波變換、計(jì)算小波系數(shù)的金字塔狀濾波器組形式的小波分解裝置;圖3是用于實(shí)現(xiàn)圖1所示算法的硬件的框圖;圖4中的流程圖說(shuō)明的是用離線算法計(jì)算LRD參數(shù)時(shí)所用的步驟;圖5是yj隨j變化的一個(gè)線性回歸分析圖,和圖6是以太網(wǎng)數(shù)據(jù)的對(duì)數(shù)一對(duì)數(shù)圖。
在圖1里,給出了一個(gè)流程圖10,它描述了從最初輸入的要分析的數(shù)據(jù)流開(kāi)始,實(shí)時(shí)計(jì)算LRD參數(shù)H和cf的一系列步驟。
在步驟20中,這一過(guò)程開(kāi)始于跟攜帶以太網(wǎng)通信信號(hào)的物理媒介進(jìn)行接口,以便提取通信信號(hào)數(shù)據(jù)包。然后在步驟30中對(duì)這些通信信號(hào)數(shù)據(jù)包濾波,提取相關(guān)數(shù)據(jù)。然后這一過(guò)程進(jìn)行到步驟40,在那里在n階時(shí)間間隔上將相關(guān)數(shù)據(jù)聚集起來(lái),產(chǎn)生要分析的序列的下一個(gè)數(shù)據(jù)點(diǎn)x(n)。在步驟50中將產(chǎn)生的每一個(gè)數(shù)據(jù)點(diǎn)x(n)輸入一個(gè)實(shí)時(shí)濾波器組,該濾波器組是用于提取和更新離散小波變換(DWT)系數(shù)的,下面將參考圖2進(jìn)行介紹。為每一個(gè)數(shù)據(jù)點(diǎn)x(n)計(jì)算出系數(shù)以后,在步驟60中針對(duì)每一尺度j將每一個(gè)新的數(shù)據(jù)點(diǎn)加到已有的數(shù)據(jù)點(diǎn)個(gè)數(shù)上去,這樣(nj+1)替換掉nj,作為新的更新后的數(shù)據(jù)點(diǎn)總數(shù)。平方和Sj也被更新,以包括這一尺度上新的系數(shù)平方。已有系數(shù)上的信息被丟棄。最后在步驟70里,在適當(dāng)?shù)臅r(shí)間間隔上,計(jì)算每一j的時(shí)間平均μj,并計(jì)算LRD參數(shù)H和cf,下面要進(jìn)行討論。
在每一個(gè)數(shù)據(jù)點(diǎn)x(n)上進(jìn)行離散小波變換(DWT),其中利用實(shí)時(shí)濾波器組通過(guò)一個(gè)小波分解過(guò)程產(chǎn)生許多小波系數(shù)。
小波變換可以理解為更加靈活的傅里葉變換,其中的原始信號(hào)不是被變換到頻域,而是變換到時(shí)間-尺度小波域。傅里葉理論里的正弦函數(shù)被小波基函數(shù)取代,這些小波基函數(shù)是通過(guò)將母小波ψ0進(jìn)行簡(jiǎn)單的平移和伸縮得到的,母波自己則是通過(guò)多分辨率理論定義的(見(jiàn)I.Daubechies的“小波十講”,SIAM,1992)。小波變換可以被看成同時(shí)在不同尺度或者分辨率j上觀察信號(hào)的一種方法。每一個(gè)數(shù)據(jù)點(diǎn)x(n)的小波系數(shù)主要包括每一尺度j上的細(xì)節(jié)dj和近似aj。
在圖2里給出了一個(gè)小波分解裝置200,它可以是一個(gè)實(shí)時(shí)濾波器形式的多分辨率算法。在一個(gè)時(shí)間段上要分析的序列中的每一個(gè)數(shù)據(jù)點(diǎn)x(n)被輸入到小波分解裝置200,并饋入帶通濾波器(BPF)202和向下采樣器204。第一個(gè)尺度上數(shù)據(jù)點(diǎn)的小波系數(shù)即細(xì)節(jié)d1被輸出。輸入數(shù)據(jù)點(diǎn)x(n)的一部分被饋入低通濾波器(LPF)206,通過(guò)向下采樣器208然后再一次分裂。一部分被輸入到BPF210和向下采樣器212以提取尺度2上的系數(shù)d2。另一部分被輸入給LPF214和向下采樣器216。這一過(guò)程重復(fù)下去,直到提取出尺度j的系數(shù)。于是,每隔一個(gè)新的數(shù)據(jù)點(diǎn)x(n)輸出d1都被更新,每隔三個(gè)新的x(n)更新輸出d2,每隔2j-1個(gè)新的x(n),都要更新輸出dj。
在小波分解裝置200中的每一個(gè)BPF和LPF都具有一個(gè)有限長(zhǎng)度K,這樣,只有K個(gè)輸入值保存在每一個(gè)BPF或者LPF的存儲(chǔ)器里。一旦輸入到BPF202里的一個(gè)值例如x(n)自己經(jīng)過(guò)了濾波器,這個(gè)值就被丟掉或者拋棄。于是每一個(gè)濾波器的存儲(chǔ)量要求就固定下來(lái),總共在濾波器組里儲(chǔ)存了K.log2(n)個(gè)值。每一個(gè)濾波器都可以用有限沖擊響應(yīng)(FIR)濾波器來(lái)實(shí)現(xiàn)。這一小波分解裝置可以用軟件或者硬件來(lái)實(shí)現(xiàn),例如在一個(gè)DSP芯片上實(shí)現(xiàn)。
參考圖1,步驟50中在實(shí)時(shí)濾波器組里利用x(n)更新了DWT系數(shù)dj以后,在步驟60中進(jìn)行許多步驟。對(duì)于針對(duì)每一尺度j更新的每一個(gè)x(n)-這一個(gè)尺度上小波系數(shù)增加一個(gè),也就是說(shuō),nj用(nj+1)替換;-用(Sj+d2j)替換系數(shù)平方的和Sj,產(chǎn)生一個(gè)更新了的平方和。然后系數(shù)值dj被丟棄,因?yàn)樵僖膊恍枰恕?br>
于是,需要儲(chǔ)存在存儲(chǔ)器里的就只有更新過(guò)的和Sj和數(shù)據(jù)點(diǎn)數(shù)nj。要注意,只有在步驟50中dj被更新以后,才進(jìn)入下一步驟60,計(jì)算新的nj和Sj,然后丟棄dj。新值nj、Sj儲(chǔ)存在RAM中的存儲(chǔ)器里。
在步驟70中,在適合于用戶的各種時(shí)間間隔中,針對(duì)每一j利用儲(chǔ)存的Sj和nj計(jì)算出一個(gè)時(shí)間平均值μj,其中μj=1nj(Σdj2)=Sjnj-----------(2)]]>然后,利用(nj)和(μj)的值,用基于小波的聯(lián)合估計(jì)器或者離線算法估計(jì)LRD參數(shù)H和cf,下面將詳細(xì)介紹。
圖3用框圖的形式說(shuō)明了用于實(shí)現(xiàn)圖1所示算法的硬件。一個(gè)網(wǎng)絡(luò)接口卡(NIC)302用于跟以太網(wǎng)300連接,并從中捕獲通信數(shù)據(jù)包。這一以太網(wǎng)可以是無(wú)屏蔽雙絞線以太網(wǎng)或者同軸電纜以太網(wǎng)。然后將它提供給PC 304,它包括一個(gè)英特爾奔騰PC,運(yùn)行著叫做免費(fèi)BSD的一個(gè)UNIX(R)操作系統(tǒng)版本。PC 304運(yùn)行著用C編寫(xiě)的通信分析軟件,進(jìn)行必要的計(jì)算,以獲得平方d2j的和Sj,導(dǎo)出和Sj中所用的數(shù)據(jù)點(diǎn)數(shù)nj。這樣的軟件也可以用于針對(duì)每一尺度計(jì)算d2j的平均值,從而完成線性回歸分析,計(jì)算出H和cf的一個(gè)估計(jì)值,并在新數(shù)據(jù)點(diǎn)x(n)到達(dá)時(shí)計(jì)算Sj和nj的新值?;蛘?,可以用DSP這樣的硬件,針對(duì)每一尺度j,計(jì)算平方d2j的和Sj,導(dǎo)出nj并計(jì)算出d2j的平均μj。PC304包括一個(gè)軟件預(yù)處理器306、一個(gè)DWT估計(jì)器單元308和存儲(chǔ)器單元310。預(yù)處理器306利用伯克利數(shù)據(jù)包濾波器對(duì)通信信號(hào)測(cè)量結(jié)果進(jìn)行預(yù)處理,并輸出每一時(shí)間間隔內(nèi)字節(jié)數(shù)的一個(gè)時(shí)間序列。預(yù)處理過(guò)的通信信號(hào)測(cè)量結(jié)果被傳遞給單元308,更新正在進(jìn)行的小波分解、累計(jì)統(tǒng)計(jì)和赫斯特參數(shù)估計(jì),并將結(jié)果周期性地輸出給打印機(jī)、繪圖儀或者其它裝置。存儲(chǔ)器單元310的形式是RAM,用于儲(chǔ)存預(yù)處理過(guò)的通信信號(hào)測(cè)量結(jié)果、從測(cè)量結(jié)果獲得的小波系數(shù)和累計(jì)統(tǒng)計(jì)。注意,針對(duì)每一尺度只需要N個(gè)最新的測(cè)量結(jié)果和系數(shù),這里N是用于實(shí)現(xiàn)這一小波分解過(guò)程中使用的LPF和BPF的FIR濾波器的長(zhǎng)度。其余的數(shù)據(jù)已經(jīng)濃縮并儲(chǔ)存在累計(jì)統(tǒng)計(jì)中。
在圖4里,給出了利用“基于小波的遠(yuǎn)距離相關(guān)參數(shù)聯(lián)合估計(jì)器,D.Veitch和P.Abry 1997年的技術(shù)報(bào)告SERC-0043”中描述的基于小波的聯(lián)合估計(jì)器估計(jì)LRD參數(shù)H和cf所采取的步驟的流程圖400。步驟410~470不需要解釋就會(huì)明白,后面是這些步驟的詳細(xì)說(shuō)明。
小波估計(jì)器在LRD現(xiàn)象的分析過(guò)程中,這一個(gè)小波基函數(shù)族的以下兩個(gè)特征(F1、F2)至關(guān)重要F1從母小波ψ0產(chǎn)生的那族小波基函數(shù)是通過(guò)以下運(yùn)算符的伸縮或者改變構(gòu)成的ψj,0(t)=2-j12ψ0(2-jt) (3)這意味著這一分析族在結(jié)構(gòu)上表現(xiàn)出了尺度不變性特性。這一LRD現(xiàn)象可以理解為在靠近原點(diǎn)的頻率范圍內(nèi)沒(méi)有任何特征頻率(因而沒(méi)有任何尺度)。于是這一LPD特性可以被解釋為尺度不變性特性,能夠用小波進(jìn)行有效的分析。
F2ψ0有N個(gè)消失矩,它們可以自由選擇,只要N≥1。從定義上講,這意味著∫tkψ0(t)dt≡0,k=0,……,N-1(但對(duì)于k≥N則不這樣),或者等價(jià)于在原點(diǎn)ψ0的傅里葉變換滿足|ψ0(υ)|=O(|υ|N)。這一特性可以用于控制原點(diǎn)處由于具有冪律譜的過(guò)程導(dǎo)致的散度。
對(duì)于LRD過(guò)程這樣的冪律譜過(guò)程,這些特性在冪律尺度成立的尺度范圍2j,j=j1……j2內(nèi),產(chǎn)生了小波系數(shù)dj的以下關(guān)鍵特性。
P1由于F1,尺度不變性(冪律特性)可以精確地表示為IEd2j=2jαcfC (4)其中C=∫|υ|-α|ψ0(υ)|2dυ (5)精確地重新得到這一冪律不是毫無(wú)價(jià)值的,它直接源自設(shè)計(jì)小波基所采用的伸縮運(yùn)算符?;跁r(shí)間-頻率或者周期圖的估計(jì)不會(huì)有這樣的特點(diǎn)。
P2由于F1和F2,這些dj是準(zhǔn)去相關(guān)隨機(jī)變量的一個(gè)集合(見(jiàn)P.Flandrin于1992年在IEEE信息理論學(xué)報(bào)IT-38第910~917上發(fā)表的文章“小波分析和分維布朗運(yùn)動(dòng)綜合”)。特別是,時(shí)域表示中存在的遠(yuǎn)距離相關(guān)在小波系數(shù)平面{j,k}上根本不存在。
對(duì)特性P2的詳細(xì)討論說(shuō)明了時(shí)間-尺度平面里的相關(guān)在所有方向上都至少以雙曲線規(guī)律衰減,其指數(shù)由消失矩的個(gè)數(shù)控制,對(duì)應(yīng)于近距離相關(guān)。由于按照定義倍頻程j=log2(尺度),因此這意味著在倍頻程j范圍上的指數(shù)衰減。
從這以后,log2表示以2為底的對(duì)數(shù),而ln則表示自然對(duì)數(shù)。
估計(jì)器的直覺(jué)基可以通過(guò)分析等式(4)來(lái)找出。將它重新寫(xiě)成log2(IEdx(j,.)2)=jα+log2(cfC),很容易就可以看出估計(jì)(α,cf)的一種線性回歸方法,顯然這一回歸線的斜率估計(jì)為α,截距則跟cf有關(guān)。當(dāng)指數(shù)是感興趣的對(duì)象時(shí),采用對(duì)數(shù)-對(duì)數(shù)圖的方法極其常見(jiàn)。真正關(guān)心的是,一旦考慮進(jìn)了不可避免的復(fù)雜性,得到的估計(jì)器中這一簡(jiǎn)單線性形式能夠?qū)崿F(xiàn)到什么程度。
第一個(gè)復(fù)雜化,也是主要的復(fù)雜化,當(dāng)然是IEd2j是未知的,但必須估計(jì),它是可以跟x的譜相關(guān)的一個(gè)二階量。在這里,這是主要困難,因?yàn)楸娝苤?見(jiàn)J.Beran,Chapman和Hall 1994年的“長(zhǎng)記憶過(guò)程統(tǒng)計(jì)學(xué)”)在遠(yuǎn)距離相關(guān)情形中二階(以及其它)量的估計(jì)是非常棘手的工作。而在這里,特性P2,dj的準(zhǔn)去相關(guān),則允許我們有效地使用簡(jiǎn)單的“時(shí)間平均”μj=1njΣdj2----------(6)]]>其中nj是可以用于分析的倍頻程j處的系數(shù)個(gè)數(shù)。這一個(gè)量是IEd2j的一個(gè)無(wú)偏差的相容估計(jì)值。(注意μj是變量dj的一個(gè)抽樣,因?yàn)閺腇2可知對(duì)于所有j,dj的期望等于0。
這樣,計(jì)算小波分解在尺度j的nj個(gè)抽樣的抽樣數(shù)據(jù)dj的平方并加起來(lái),然后用nj除,得到“時(shí)間平均”。
第二個(gè)復(fù)雜化是log2引入的非線性性,它使估計(jì)出現(xiàn)了偏差。在下面我們會(huì)看到這一問(wèn)題如何也能在合理的假設(shè)下加以解決。略微簡(jiǎn)化一下,我們證實(shí)我們的估計(jì)器的基本方法確實(shí)是log2(2j)=j上log2(μj)的一個(gè)線性回歸。一個(gè)加權(quán)線性回歸將用作隨j變化的log2(μj)的變量。
線性回歸線性回歸的基本假設(shè)是IEyj=bxj+a.我們定義S=Σ1/σj2,]]>Sx=Σxj/σj2]]>以及Sxx=Σxj2/σj2,]]>其中σj2]]>是跟yj有關(guān)的任意一個(gè)權(quán)。通常的(b,a)的無(wú)偏差估計(jì)器(_,_)為b^=Σyj(Sxj-Sx)/σj2SSxx-Sx2=Σwjyj,----------(8)]]>a^=Σyj(SxxSxx)/σj2SSxx-Sx2=Σvjyj,--------(9)]]>其中權(quán)wj和vj滿足∑wj=∑jυj=0,∑jwj=∑υj=1。注意,這些條件意味著nj和wj總是有正值和負(fù)值的。
如果除此以外yj是相互獨(dú)立的,那么,協(xié)方差矩陣就由下式給出Var(b^)=Σσj2wj2=SSSxx-Sx2′--------(10)]]>Var(a^)=Σσj2υj2=SxxSSxx-Sx2′--------(11)]]>Cov(a^,b^)=Σσj2wjυj=-SxSSxx-Sx2′------(12)]]>r=-Sx/SSxx′----------(13)]]>其中r是相關(guān)系數(shù)。如果對(duì)于所有的j都有xj≥0,就會(huì)很容易地看出r取負(fù)值,而且如果x1很大,它的幅度就很大,因?yàn)樾甭省跋蛴摇备淖円稽c(diǎn)點(diǎn),就會(huì)導(dǎo)致截距在符號(hào)的相反方向改變很多。
最后,如果我們?cè)O(shè)定σ2j=Var(yj),那么(_,_)就是具有上述協(xié)方差矩陣的最小方差無(wú)偏差估計(jì)器(MVUE)(見(jiàn)Prentice-Hall 1993年出版的S.M.Kay的書(shū)“統(tǒng)計(jì)信號(hào)處理基礎(chǔ)”)。
注意,如果σ2j的值誤差很小,而且yj之間的相關(guān)很小,那么這一估計(jì)器就仍然是無(wú)偏差的,而且它的協(xié)方差矩陣可以用剛剛給出的表達(dá)式精確地估計(jì)。
到此為止,我們已經(jīng)說(shuō)明了log2(μj)是滿足IEyj=bj+a的所需線性回歸的變量yj。因?yàn)榭偟膩?lái)說(shuō),IE log2(μj)≠log2(IEμj)=jα+log2(cfC),所以這不可能完全正確,盡管在以下條件H1~H3下,并假設(shè)nj很大,可以估計(jì)log2(μj)d-N(jc+log2cfC2j-1nln22)]]>其中d表示分布相同,N(μ,σ2)是一個(gè)高斯隨機(jī)變量。而在LRD情形中,大尺度常常是最重要的,而且nj確實(shí)不大。這里,通過(guò)更加仔細(xì)地查看log2(μj)的分布而去掉了條件nj。結(jié)果是,這樣做只是稍微改進(jìn)了α的估計(jì),但是對(duì)cf的估計(jì)卻有著非常重要的意義。
在整個(gè)分析過(guò)程中,牢牢記住當(dāng)尺度加倍的時(shí)候,可以得到的細(xì)節(jié)系數(shù)個(gè)數(shù)nj基本上會(huì)減半這一點(diǎn)是有指導(dǎo)意義的,也就是說(shuō)nj-1≈nj/2,于是,nj+1≈n2-j,這里n是初始數(shù)據(jù)的長(zhǎng)度。
我們假定以下補(bǔ)充假設(shè)成立。
H1過(guò)程x,于是過(guò)程d(j,.),是高斯過(guò)程。
H2對(duì)于固定的j,過(guò)程d(j,.)是iid。
H3如果j≠j’,那么過(guò)程d(j,.)跟d(j’,.)相互獨(dú)立。
說(shuō)明這一方法對(duì)x的邊緣分布形式非常敏感的數(shù)字證據(jù)使得假設(shè)H1成立..特性P2使得假設(shè)H2和H3也成立(將它們分開(kāi)的目的是使得在什么地方需要什么特性更加清楚)。
盡管第一眼看來(lái)對(duì)它們的限制似乎非常嚴(yán),但是,在實(shí)際中這些附加的條件事實(shí)上非常合理,跟模擬結(jié)果一樣。其原因是該方法固有的效率來(lái)自P1和P2,增加H1~H3只是為了擴(kuò)展定量分析。
令χ平方變量XvdXv2的密度表示為fυ(x)=(12υ/2Γ(υ/2))xυ/2-1e-υ/2•]]>這樣一個(gè)變量的平均值和方差分別是v和2v。還設(shè)zj=2jacfC。從H1和H2以及等式4和6,我們得到μjd-zjnjXnj---------(14)]]>其中IEμj=zj,因?yàn)槭铅蘪無(wú)偏差的,于是log2(μj)dlog2zj-log2nj+log2Xnjdjα+log2cfC-log2nj+lnXnj/ln2(15)這樣,對(duì)log2(μj)的研究縮減為對(duì)χ平方變量的對(duì)數(shù)的研究。利用關(guān)系 (見(jiàn)學(xué)院出版社1980年更正和擴(kuò)版,I.S.Gradshteyn和I.M.Ryzhik的書(shū)“積分、數(shù)列和乘積表”中的等式∮4.352),以及 (前面引用的等式2,∮4.358),這里ψ(z)=r*(z)/г(z)是ψ函數(shù),而ζ(z,V)則是廣義的黎曼ζ函數(shù),從前面fv(x)的定義很容易就能看出IE lnXv=ψ(v/2)+ln2 (16)Var(lnXv)=ζ(2,v/2) (17)于是IE log2(μj)=jα+log2cfC+gj(18)Var (log2(μj))=ζ(2,nj/2)/ln22 (19)其中g(shù)j=ψ(nj/2)/ln2-log2(nj/2)(20)只是nj的一個(gè)負(fù)函數(shù),能夠針對(duì)所有的nj值很容易地計(jì)算出來(lái)。
gj這一項(xiàng)是一個(gè)很小的修正項(xiàng),它被減去,以補(bǔ)償log引入的非線性失真。
為了供以后參考,下面給出了大nj情形下上述量的漸近形式gj~-1njln2----(21)]]>Var(log2(μj))-2njln22----(22)]]>將變量yj定義為yj≡log2(μj)-gj(23)我們從以上描述中可以看出,很明顯在假設(shè)H1和H2下,它們滿足IEyj=jα+log2cfC (24)Var(yj)=ζ(2,nj/2)/ln22 (25)因此,滿足加權(quán)線性回歸的要求。
在j=xj處對(duì)yj的加權(quán)回歸估計(jì)(_,_)是根據(jù)等式8和9進(jìn)行的,其中σ2j=Var(yj)。
利用模擬數(shù)據(jù)組的一個(gè)回歸擬合實(shí)例在圖5中給出,其中以j為自變量畫(huà)出了yi=log2(μj)-gj,并畫(huà)出了95%的置信區(qū)間??梢钥闯?,在每一個(gè)倍頻程j處用垂直線表示的每一個(gè)yj的95%置信區(qū)間隨著j的增大而增大。這可以從等式(22)來(lái)理解,只要記住nj≈n2-j,它意味著j每增加1,數(shù)據(jù)點(diǎn)數(shù)就減半。這些間隔是在高斯假設(shè)下從估計(jì)yj的已知抽樣方差σ2j得到的。LRD過(guò)程的尺度顯然處于4和10之間,而強(qiáng)SRD或者進(jìn)程相關(guān)的尺度顯然小于4,特別是對(duì)于范圍j=1到j(luò)=3.對(duì)于yj,每一個(gè)倍頻程上的垂直棒都給出了95%的置信區(qū)間。在d=0.25(α=0.50)和ψ=[-2,-1],意味著cf=6.38,的情況下模擬了這一數(shù)列(0,d,2)。選擇(j1,j2)=(4,10)就確定了有關(guān)的尺度范圍,允許進(jìn)行精確的估計(jì),而不管很強(qiáng)的SRD_=0 53±0.7,c^f=6.0]]>with4.5<Cf^<7.8]]>。
在圖6里,畫(huà)出了真實(shí)以太網(wǎng)數(shù)據(jù)的一個(gè)對(duì)數(shù)-對(duì)數(shù)圖。這些數(shù)據(jù)來(lái)源于一個(gè)以太網(wǎng)記錄,包括3千萬(wàn)個(gè)以上的觀測(cè)數(shù)據(jù),分析它們只需要幾秒鐘。圖中畫(huà)的是以j為自變量的log2(μj)。它給出了連續(xù)時(shí)間以太網(wǎng)數(shù)據(jù)基于小波的尺度分析的一個(gè)實(shí)例。在倍頻程j=14處進(jìn)入LRD的漸近線特征。自相似參數(shù)H=1-β|2的估計(jì)是H=0.8。
通過(guò)利用小波分解裝置,這一靜態(tài)LRD估計(jì)方法在存儲(chǔ)器存儲(chǔ)量、存儲(chǔ)器利用率和計(jì)算時(shí)間方面擁有明顯的優(yōu)點(diǎn)。利用這一方法,輸入數(shù)據(jù)可以分成塊,進(jìn)行分析然后重新組合,這樣在處理任意長(zhǎng)度n的數(shù)據(jù)時(shí),就不會(huì)碰到存儲(chǔ)器問(wèn)題。這一方法在運(yùn)行時(shí)間不復(fù)雜,數(shù)量級(jí)為n或者O(n),使得它非常適合于分析非常大的數(shù)據(jù)組。這些優(yōu)點(diǎn)使得這一方法適合于實(shí)時(shí)使用,其中的數(shù)據(jù)收集,LRD參數(shù)估計(jì)以一種連續(xù)的不間斷方式進(jìn)行。將來(lái),當(dāng)要處理的數(shù)據(jù)總量從兆比特上升到吉比特甚至兆兆比特時(shí),不會(huì)出現(xiàn)存儲(chǔ)容量問(wèn)題,因?yàn)閷?shí)時(shí)算法的要求隨著數(shù)據(jù)長(zhǎng)度的對(duì)數(shù)變化而變化。
這里描述的實(shí)時(shí)版以及有指導(dǎo)意義的優(yōu)選實(shí)施方案說(shuō)明了這些潛在的實(shí)時(shí)優(yōu)勢(shì)可以在實(shí)際中發(fā)揮出來(lái)。
權(quán)利要求
1.一種方法,用于對(duì)數(shù)據(jù)流的遠(yuǎn)距離相關(guān)(LRD)參數(shù),諸如赫斯特參數(shù)H和尺寸參數(shù)cf,進(jìn)行實(shí)時(shí)估計(jì),該方法包括以下步驟將所述數(shù)據(jù)流的每一塊數(shù)據(jù)輸入給一個(gè)實(shí)時(shí)離散小波分解裝置;提取所述小波分解裝置產(chǎn)生的每一塊輸入數(shù)據(jù)的小波系數(shù);在許多尺度中的每一個(gè)尺度上,維持所述小波系數(shù)的一個(gè)平方和,并維持所述和中合并了的元素的個(gè)數(shù);在需要進(jìn)行估計(jì)的時(shí)候,該方法還包括以下步驟在許多尺度中的每一個(gè)尺度上,計(jì)算所述小波系數(shù)的所述平方的平均值;在一個(gè)尺度范圍上用所述平均值進(jìn)行加權(quán)線性回歸分析;和在這一線性回歸分析的基礎(chǔ)上計(jì)算LRD參數(shù)的估計(jì)值。
2.權(quán)利要求1的方法,其中對(duì)于每一個(gè)更新過(guò)的尺度,已有的小波系數(shù)平方和被一個(gè)新的平方和取代,它等于每一個(gè)新小波系數(shù)的平方再加上已有的和。
3.權(quán)利要求1或2的方法,其中對(duì)于每一個(gè)更新過(guò)的尺度,在已有的和里合并了的元素的已有個(gè)數(shù)被增加每一尺度上新元素的個(gè)數(shù)。
4.權(quán)利要求2或3的方法,其中每一次更新以后每一個(gè)系數(shù)的值不再保留或者儲(chǔ)存。
5.以上權(quán)利要求中任意一個(gè)的方法,其中輸入到分解裝置中的每一塊數(shù)據(jù)都不保留或者儲(chǔ)存。
6.以上權(quán)利要求中任意一個(gè)的方法,其中計(jì)算平均值的步驟包括在每一個(gè)尺度上計(jì)算一個(gè)時(shí)間平均值的步驟,該平均值等于更新過(guò)的系數(shù)平方和除以更新過(guò)的和里合并的元素的更新過(guò)的個(gè)數(shù)。
7.以上權(quán)利要求中任意一個(gè)的方法,其中的線性回歸結(jié)果被畫(huà)出圖來(lái),并在加權(quán)線性回歸分析步驟之前,選擇一個(gè)尺度范圍。
8.以上權(quán)利要求中任意一個(gè)的方法,還包括計(jì)算得到的每一個(gè)估計(jì)的置信區(qū)間的步驟。
9.一種方法,用于對(duì)數(shù)據(jù)流里的LRD參數(shù),比方說(shuō)H和cf,進(jìn)行實(shí)時(shí)估計(jì),該方法包括以下步驟從所述數(shù)據(jù)流中提取數(shù)據(jù)包;在一個(gè)n階時(shí)間間隔上將數(shù)據(jù)包聚集起來(lái),產(chǎn)生一個(gè)數(shù)據(jù)點(diǎn)x(n);將每一個(gè)數(shù)據(jù)點(diǎn)x(n)輸入給一個(gè)實(shí)時(shí)離散小波分解裝置;提取所述分解裝置為每一個(gè)數(shù)據(jù)點(diǎn)x(n)產(chǎn)生的小波系數(shù)dj;在許多尺度中的每一個(gè)尺度j上,維持所述小波系數(shù)的平方d2j的一個(gè)和Sj,并維持用于所述和Sj的數(shù)據(jù)點(diǎn)的個(gè)數(shù)nj;需要估計(jì)的時(shí)候,該方法還包括以下步驟對(duì)于每一個(gè)尺度j,從所述和Sj計(jì)算所述小波系數(shù)的平方d2j的一個(gè)平均值;在一個(gè)尺度范圍內(nèi)利用所述平均值進(jìn)行線性回歸分析;和在所述線性回歸分析的基礎(chǔ)上,計(jì)算LRD參數(shù)的估計(jì)。
10.權(quán)利要求9的方法,對(duì)于每一個(gè)更新過(guò)的尺度j,和Sj被替換成一個(gè)新的和(Sj+d2j),從而獲得更新過(guò)的平方和。
11.權(quán)利要求9或10的方法,其中對(duì)于在尺度j上更新過(guò)的每一個(gè)x(n),數(shù)據(jù)點(diǎn)的個(gè)數(shù)nj,或者等價(jià)地在尺度j上系數(shù)的個(gè)數(shù),被加一,從而使nj被替換成(nj+1)。
12.權(quán)利要求9~11中任意一個(gè)的方法,其中每一個(gè)dj的值在每一次更新后都不保留或者儲(chǔ)存。
13.權(quán)利要求9~12中任意一個(gè)的方法,其中輸入到分解裝置中的每一個(gè)數(shù)據(jù)點(diǎn)x(n)都不保留或者儲(chǔ)存。
14.權(quán)利要求9~13中任意一個(gè)的方法,其中計(jì)算平均值的步驟包括利用維持的每一個(gè)尺度的Sj和nj,在每一個(gè)尺度j上形成一個(gè)時(shí)間平均μj的步驟,從而使μj=1nj(Σdj2)=Sjnj]]>。
15.權(quán)利要求14的方法,還包括計(jì)算一個(gè)隨機(jī)變量yj的步驟,其中yj=log2(μj)-gj這里,gj是一個(gè)很小的修正項(xiàng)。
16.權(quán)利要求15的方法,還包括以j為自變量,畫(huà)出yj的曲線,以及關(guān)于j在σj的基礎(chǔ)上畫(huà)出置信區(qū)間的步驟,其中σ2j是一個(gè)跟j有關(guān)的任意權(quán)。
17.權(quán)利要求16的方法,其中在畫(huà)出曲線的步驟以后,選擇一個(gè)尺度范圍,線性回歸分析在這一尺度范圍內(nèi)進(jìn)行。
18.權(quán)利要求17的方法,其中在選擇好尺度范圍以后,用權(quán)σ2j在選定的尺度范圍內(nèi)關(guān)于j對(duì)yj進(jìn)行加權(quán)線性回歸分析。
19.權(quán)利要求18的方法,其中H(或者α,這里α=2H-1)的估計(jì)是從回歸曲線的斜率獲得的,cf的估計(jì)是從回歸曲線的截距獲得的。
20.權(quán)利要求19的方法,還包括計(jì)算LRD參數(shù)H和cf的估計(jì)的置信區(qū)間的步驟。
21.對(duì)數(shù)據(jù)流的LRD參數(shù),比方說(shuō)H和cf,進(jìn)行實(shí)時(shí)估計(jì)的裝置,該裝置包括接收所述數(shù)據(jù)流的數(shù)據(jù)包的裝置;預(yù)處理器裝置,用于將時(shí)間間隔上收到的數(shù)據(jù)包聚集起來(lái)產(chǎn)生對(duì)應(yīng)的數(shù)據(jù)點(diǎn)x(n);一個(gè)實(shí)時(shí)離散小波分解裝置,用于接收每一個(gè)數(shù)據(jù)點(diǎn)x(n);為每一個(gè)收到的數(shù)據(jù)點(diǎn)x(n)產(chǎn)生小波系數(shù)dj的所述分解裝置;在許多尺度中的每一個(gè)尺度j上,計(jì)算所述系數(shù)的平方d2j的和Sj,并得到用于所述和Sj中的數(shù)據(jù)點(diǎn)的個(gè)數(shù)nj的裝置;用于儲(chǔ)存Sj和nj的存儲(chǔ)器裝置;其中需要LRD參數(shù)的估計(jì)的時(shí)候,所述計(jì)算裝置(a)在每一個(gè)尺度j上用所述和Sj計(jì)算所述系數(shù)的平方d2j的平均值;(b)在一個(gè)尺度范圍內(nèi)用所述平均值進(jìn)行線性回歸分析,和(c)在所述線性回歸分析的基礎(chǔ)上計(jì)算LRD參數(shù)的估計(jì)。
22.權(quán)利要求21的裝置,其中對(duì)于每一個(gè)更新過(guò)的j,和Sj被一個(gè)新的和(Sj+d2j)所取代,從而得到一個(gè)更新過(guò)的平方和,這一新的和隨后存入所述存儲(chǔ)器裝置。
23.權(quán)利要求21或22的裝置,其中對(duì)于尺度j上更新過(guò)的每一個(gè)x(n),數(shù)據(jù)點(diǎn)的個(gè)數(shù)nj,或者等價(jià)地尺度j上系數(shù)的個(gè)數(shù),被增加1,從而使每一個(gè)nj都被替換成(nj+1),更新過(guò)的值(nj+1)被隨后存入所述存儲(chǔ)器裝置。
24.權(quán)利要求21~23中任意一個(gè)的裝置,其中的計(jì)算裝置是用軟件實(shí)現(xiàn)的。
25.權(quán)利要求21~23中任意一個(gè)的裝置,其中的計(jì)算裝置用硬件計(jì)算和Sj,得到nj并形成所述平均,并用軟件進(jìn)行線性回歸分析和所述估計(jì)。
26.權(quán)利要求21~25中任意一個(gè)的裝置,其中每一dj的值都不保留或者儲(chǔ)存在所述存儲(chǔ)器裝置中。
27.權(quán)利要求21~26中任意一個(gè)的裝置,其中的分解裝置收到的每一個(gè)數(shù)據(jù)點(diǎn)x(n)隨后都不被所述存儲(chǔ)器裝置保留或者儲(chǔ)存。
28.權(quán)利要求21~27中任意一個(gè)的裝置,其中的預(yù)處理裝置、分解裝置和存儲(chǔ)器裝置都是PC這樣的計(jì)算處理器的一部分。
29.權(quán)利要求21~28中任意一個(gè)的裝置,其中的分解裝置包括一個(gè)多分辨率算法裝置。
30.權(quán)利要求29的裝置,其中的多分辨率算法裝置是一個(gè)實(shí)時(shí)濾波器組,包括一系列的低通濾波器(LPF)和帶通濾波器(BPF)。
31.權(quán)利要求30的裝置,其中的LPF和BPF都是有限沖擊響應(yīng)濾波器。
32.基本上就象前面參考附圖所介紹的一種方法或者系統(tǒng)。
全文摘要
對(duì)數(shù)據(jù)流里的遠(yuǎn)距離相關(guān)參數(shù),比方說(shuō)赫斯特參數(shù)H和尺寸參數(shù)c
文檔編號(hào)H04L12/54GK1296688SQ99804819
公開(kāi)日2001年5月23日 申請(qǐng)日期1999年2月5日 優(yōu)先權(quán)日1998年2月6日
發(fā)明者D·N·維特克, M·羅漢, P·阿布賴 申請(qǐng)人:愛(ài)立信澳大利亞股份有限公司, 皇家墨爾本技術(shù)研究所, 法國(guó)國(guó)家科學(xué)研究中心