j) =Pj (t^i)+c?m2 公式 3
[0055] 其中公式3是一個(gè)累加過程,PjUi)表示傳感器節(jié)點(diǎn)在采樣時(shí)刻&出現(xiàn)異常的概 率,P^t iJ表示傳感器節(jié)點(diǎn)在前一采樣時(shí)刻出現(xiàn)異常的概率,m表示傳感器節(jié)點(diǎn)采集 的數(shù)據(jù)h (tj滿足公式1或公式2的次數(shù),c表示控制m增長(zhǎng)速度的參數(shù),m和c在MATLAB 軟件進(jìn)行仿真時(shí),根據(jù)經(jīng)驗(yàn)設(shè)定m和c的值,通常情況下取c = 0. 002, m = 8 ;
[0056] 判斷傳感器節(jié)點(diǎn)是否為異常節(jié)點(diǎn),根據(jù)公式4計(jì)算傳感器節(jié)點(diǎn)的Pt (tj值,如果傳 感器節(jié)點(diǎn)的Pt Ui)值不小于80%,則判定該傳感器節(jié)點(diǎn)為異常節(jié)點(diǎn):
[0059] 接著采用異常數(shù)據(jù)的驗(yàn)證方法對(duì)判定的異常節(jié)點(diǎn)進(jìn)行確認(rèn)該異常節(jié)點(diǎn)的異常來 源,所述異常來源包括異常節(jié)點(diǎn)所在區(qū)域發(fā)生特定事件和節(jié)點(diǎn)本身存在故障,具體包括以 下步驟:
[0060] S31計(jì)算被判定為異常節(jié)點(diǎn)的傳感器節(jié)點(diǎn)的鄰居節(jié)點(diǎn)的PtUi)值;
[0061] S32如果被判定為異常節(jié)點(diǎn)的傳感器節(jié)點(diǎn)的鄰居節(jié)點(diǎn)中存在半數(shù)以上的鄰居節(jié)點(diǎn) 的Pt (h)值大于80 %,則判定該異常節(jié)點(diǎn)所在區(qū)域發(fā)生特定事件;如果被判定為異常節(jié)點(diǎn) 的傳感器節(jié)點(diǎn)的鄰居節(jié)點(diǎn)中存在半數(shù)以上的鄰居節(jié)點(diǎn)的Pt (ti)值小于60%,則判定該異常 節(jié)點(diǎn)本身存在故障。
[0062] 如果被判定為異常節(jié)點(diǎn)的傳感器節(jié)點(diǎn)的鄰居節(jié)點(diǎn)中僅存在一個(gè)鄰居節(jié)點(diǎn)的Pt (tj 值小于60%,則判定該異常節(jié)點(diǎn)可能出現(xiàn)測(cè)量誤差并利用K-means算法對(duì)該異常節(jié)點(diǎn)采集 的誤差數(shù)據(jù)進(jìn)行篩選,具體包括以下步驟:
[0063] S41將該異常節(jié)點(diǎn)在一個(gè)采樣周期內(nèi)采集的數(shù)據(jù)點(diǎn)進(jìn)行分簇:
[0064] 該異常節(jié)點(diǎn)在&時(shí)刻采集的數(shù)據(jù)r ^ti)表示傳感器節(jié)點(diǎn)在采樣時(shí)刻&采集到的 j種不同類型的數(shù)據(jù),可以將傳感器節(jié)點(diǎn)在采樣時(shí)刻h采集到的數(shù)據(jù)看作是一個(gè)j維空間 的數(shù)據(jù)點(diǎn)X i,數(shù)據(jù)點(diǎn)Xi表示為X i= (ai, bi, Ci, . . .,(Ii),其中ai表示該異常節(jié)點(diǎn)在t i時(shí)刻采 集的數(shù)據(jù)中第一種類型的數(shù)據(jù),h表示該異常節(jié)點(diǎn)在t,時(shí)刻采集的數(shù)據(jù)中第二種類型的數(shù) 據(jù),其中數(shù)據(jù)的類型一共包括j種,對(duì)照傳感器節(jié)點(diǎn)采集的多維數(shù)據(jù)模型,如表1所示:
[0065]表1
[0066]
[0067] 該異常節(jié)點(diǎn)在一個(gè)采樣周期內(nèi)采集的數(shù)據(jù)點(diǎn)的集合用X表示,X= (XiIi = 1,2,. . .,n),n表示數(shù)據(jù)點(diǎn)的個(gè)數(shù);
[0068] S42針對(duì)每一個(gè)簇,計(jì)算該簇內(nèi)所有數(shù)據(jù)點(diǎn)到簇心的平均距離值davg;
[0069] S43計(jì)算該異常節(jié)點(diǎn)采集的數(shù)據(jù)點(diǎn)Xi到該數(shù)據(jù)點(diǎn)X #斤在簇內(nèi)的簇心…的距離值 Cl(XilIIli);
[0070]最后如果滿足公式5,則判定異常節(jié)點(diǎn)采集的該數(shù)據(jù)點(diǎn)Xi為該異常節(jié)點(diǎn) 采集的誤差數(shù)據(jù)并將該誤差數(shù)據(jù)篩選出來,
[0072] 其中上述步驟S34中計(jì)算該簇內(nèi)所有數(shù)據(jù)點(diǎn)到簇心的平均距離值davg具體包括以 下步驟:根據(jù)公式6計(jì)算該簇內(nèi)所有數(shù)據(jù)點(diǎn)到簇心的距離,
[0074] 其中,Xi表示該簇內(nèi)的數(shù)據(jù)點(diǎn),X』表示該簇內(nèi)的簇心,k表示數(shù)據(jù)維數(shù),k = (I, 2, . . . , d);
[0075] 通過MATLAB軟件對(duì)本發(fā)明提出的算法進(jìn)行實(shí)驗(yàn)仿真,在仿真實(shí)驗(yàn)種,將200個(gè)傳 感器節(jié)點(diǎn)均勻分布在200a*200a的區(qū)域中,預(yù)先在這200個(gè)傳感器節(jié)點(diǎn)中設(shè)置故障節(jié)點(diǎn)12 個(gè),事件節(jié)點(diǎn)56個(gè),正常節(jié)點(diǎn)112個(gè),參照?qǐng)D2,為仿真實(shí)驗(yàn)的檢測(cè)結(jié)果效果圖,從圖中可以 看出,通過本發(fā)明提出的算法共檢測(cè)出故障節(jié)點(diǎn)11個(gè)、事件節(jié)點(diǎn)54個(gè),正常節(jié)點(diǎn)109個(gè),誤 差節(jié)點(diǎn)19個(gè),出現(xiàn)誤判的節(jié)點(diǎn)總計(jì)7個(gè),故障節(jié)點(diǎn)、事件節(jié)點(diǎn)、正常節(jié)點(diǎn)及誤差節(jié)點(diǎn)的檢測(cè) 準(zhǔn)確率分別為91. 7%、96. 4%、97. 3%和95%,總的誤判率為6. 3%,其中故障節(jié)點(diǎn)檢測(cè)準(zhǔn) 確率是算法正確判定為故障節(jié)點(diǎn)的個(gè)數(shù)與無線傳感器網(wǎng)絡(luò)實(shí)際的事件節(jié)點(diǎn)個(gè)數(shù)之比,事件 節(jié)點(diǎn)檢測(cè)準(zhǔn)確率是算法正確判定為事件節(jié)點(diǎn)的個(gè)數(shù)與無線傳感器網(wǎng)絡(luò)實(shí)際的事件節(jié)點(diǎn)個(gè) 數(shù)之比,正常節(jié)點(diǎn)檢測(cè)準(zhǔn)確率是算法正確判定為正常節(jié)點(diǎn)的個(gè)數(shù)與無線傳感器網(wǎng)絡(luò)實(shí)際的 事件節(jié)點(diǎn)個(gè)數(shù)之比,誤差節(jié)點(diǎn)檢測(cè)準(zhǔn)確率是算法正確判定為誤差節(jié)點(diǎn)的個(gè)數(shù)與無線傳感器 網(wǎng)絡(luò)實(shí)際的事件節(jié)點(diǎn)個(gè)數(shù)之比,事件節(jié)點(diǎn)檢測(cè)誤判率是正常節(jié)點(diǎn)中被算法誤判為事件節(jié)點(diǎn) 的個(gè)數(shù)與傳感器網(wǎng)絡(luò)中總的正常節(jié)點(diǎn)個(gè)數(shù)之比。
[0076] 以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出:對(duì)于本技術(shù)領(lǐng)域的技術(shù)人員來 說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為 本發(fā)明的保護(hù)范圍。
【主權(quán)項(xiàng)】
1. 基于多維數(shù)據(jù)模型的傳感器數(shù)據(jù)流異常檢測(cè)方法,其特征在于:包括以下步驟: S1構(gòu)造多維數(shù)據(jù)模型,傳感器節(jié)點(diǎn)采集的多維數(shù)據(jù)模型表示為:其中j表示數(shù)據(jù)維數(shù),表示傳感器節(jié)點(diǎn)在采樣時(shí)刻ti采集的數(shù)據(jù); S2采用異常數(shù)據(jù)的檢測(cè)方法判斷傳感器節(jié)點(diǎn)是否為異常節(jié)點(diǎn),如果是,則進(jìn)入S3 ; S3采用異常數(shù)據(jù)的驗(yàn)證方法對(duì)S2中判定的異常節(jié)點(diǎn)進(jìn)行確認(rèn)該異常節(jié)點(diǎn)的異常來 源,所述異常來源包括異常節(jié)點(diǎn)所在區(qū)域發(fā)生特定事件和節(jié)點(diǎn)本身存在故障。2. 根據(jù)權(quán)利要求1所述的基于多維數(shù)據(jù)模型的傳感器數(shù)據(jù)流異常檢測(cè)方法,其特征在 于:S2中所述異常數(shù)據(jù)的檢測(cè)方法包括以下步驟: S21如果傳感器節(jié)點(diǎn)采集的數(shù)據(jù)滿足公式1或者傳感器節(jié)點(diǎn)在若干個(gè)采樣時(shí)刻 采集的數(shù)據(jù)均相同即滿足公式2,則判定傳感器節(jié)點(diǎn)采集的數(shù)據(jù)為潛在異常數(shù)據(jù),其中,Ee(t)表示正常工作的傳感器節(jié)點(diǎn)在發(fā)生特定事件的區(qū)域中讀數(shù)的期望函數(shù),En(t)表示正常工作的傳感器節(jié)點(diǎn)在正常區(qū)域中讀數(shù)的期望函數(shù),En(t)為常數(shù),S表示預(yù) 先設(shè)定的閾值, rj(ti) =rj(t^j) 公式 2 其中,表示傳感器節(jié)點(diǎn)在1^時(shí)刻采集的數(shù)據(jù),:rjUg)表示傳感器節(jié)點(diǎn)在tg時(shí) 刻采集的數(shù)據(jù); S22針對(duì)存在潛在異常數(shù)據(jù)的傳感器節(jié)點(diǎn),根據(jù)公式3計(jì)算傳感器節(jié)點(diǎn)出現(xiàn)異常的概 率卩辦): Pj(t^ =Pj(t^j)+c?m2 公式 3 其中,P^ti)表示傳感器節(jié)點(diǎn)在采樣時(shí)亥iJh出現(xiàn)異常的概率,P^tH)表示傳感器節(jié)點(diǎn) 在采樣時(shí)刻出現(xiàn)異常的概率,m表示傳感器節(jié)點(diǎn)采集的數(shù)據(jù)滿足公式1或公式2 的次數(shù),c表示控制m增長(zhǎng)速度的參數(shù); S23判斷傳感器節(jié)點(diǎn)是否為異常節(jié)點(diǎn),根據(jù)公式4計(jì)算傳感器節(jié)點(diǎn)的PT(ti)值,如果傳 感器節(jié)點(diǎn)的PT(ti)值不小于80%,則判定該傳感器節(jié)點(diǎn)為異常節(jié)點(diǎn):其中,\表示第j維數(shù)據(jù)的權(quán)重系數(shù),3. 根據(jù)權(quán)利要求1或2所述的基于多維數(shù)據(jù)模型的傳感器數(shù)據(jù)流異常檢測(cè)方法,其特 征在于:S3中所述異常數(shù)據(jù)的驗(yàn)證方法具體包括以下步驟: S31計(jì)算被判定為異常節(jié)點(diǎn)的傳感器節(jié)點(diǎn)的鄰居節(jié)點(diǎn)的&(&)值; S32如果被判定為異常節(jié)點(diǎn)的傳感器節(jié)點(diǎn)的鄰居節(jié)點(diǎn)中存在半數(shù)以上的鄰居節(jié)點(diǎn)的 PT(ti)值大于80%,則判定該異常節(jié)點(diǎn)所在區(qū)域發(fā)生特定事件;如果被判定為異常節(jié)點(diǎn)的 傳感器節(jié)點(diǎn)的鄰居節(jié)點(diǎn)中存在半數(shù)以上的鄰居節(jié)點(diǎn)的PT(ti)值小于60%,則判定該異常節(jié) 點(diǎn)本身存在故障。4. 根據(jù)權(quán)利要求3所述的基于多維數(shù)據(jù)模型的傳感器數(shù)據(jù)流異常檢測(cè)方法,其特征在 于:如果被判定為異常節(jié)點(diǎn)的傳感器節(jié)點(diǎn)的鄰居節(jié)點(diǎn)中僅存在一個(gè)鄰居節(jié)點(diǎn)的&(以值小 于60%,則判定該異常節(jié)點(diǎn)可能出現(xiàn)測(cè)量誤差并利用K-means算法對(duì)該異常節(jié)點(diǎn)采集的誤 差數(shù)據(jù)進(jìn)行篩選,具體包括以下步驟: S41將該異常節(jié)點(diǎn)在一個(gè)采樣周期內(nèi)采集的數(shù)據(jù)點(diǎn)進(jìn)行分簇:該異常節(jié)點(diǎn)在&時(shí)刻采 集的數(shù)據(jù)r^ti)可以用數(shù)據(jù)點(diǎn)Xi表示,xi=(ai,hCi,. . .,cQ,該異常節(jié)點(diǎn)在一個(gè)采樣周 期內(nèi)采集的數(shù)據(jù)點(diǎn)的集合用X表示,X=(Xi|i= 1,2,. . .,n),n表示數(shù)據(jù)點(diǎn)的個(gè)數(shù); S42針對(duì)每一個(gè)簇,計(jì)算該簇內(nèi)所有數(shù)據(jù)點(diǎn)到簇心的平均距離值davg; S43計(jì)算該異常節(jié)點(diǎn)采集的數(shù)據(jù)點(diǎn)\到該數(shù)據(jù)點(diǎn)^所在簇內(nèi)的簇心…的距離值 d(Xi,ihj); S44如果d(Xi,mi)滿足公式5,則判定異常節(jié)點(diǎn)采集的該數(shù)據(jù)點(diǎn)Xi為該異常節(jié)點(diǎn)采集 的誤差數(shù)據(jù)并將該誤差數(shù)據(jù)篩選出來,5. 根據(jù)權(quán)利要求4所述的基于多維數(shù)據(jù)模型的傳感器數(shù)據(jù)流異常檢測(cè)方法,其特征在 于:S34中計(jì)算該簇內(nèi)所有數(shù)據(jù)點(diǎn)到簇心的平均距離值davg具體包括以下步驟:根據(jù)公式6 計(jì)算該簇內(nèi)所有數(shù)據(jù)點(diǎn)到簇心的距離,其中,11表示該簇內(nèi)的數(shù)據(jù)點(diǎn),xj表示該簇內(nèi)的簇心,k表示數(shù)據(jù)維數(shù),k= (1,2,? ? ?,d) 〇
【專利摘要】本發(fā)明公開了一種基于多維數(shù)據(jù)模型的傳感器數(shù)據(jù)流異常檢測(cè)方法,包括以下步驟:首先構(gòu)造多維數(shù)據(jù)模型,然后采用異常數(shù)據(jù)的檢測(cè)方法判斷傳感器節(jié)點(diǎn)是否為異常節(jié)點(diǎn),如果是則采用異常數(shù)據(jù)的驗(yàn)證方法對(duì)判定的異常節(jié)點(diǎn)進(jìn)行確認(rèn)該異常節(jié)點(diǎn)的異常來源,所述異常來源包括異常節(jié)點(diǎn)所在區(qū)域發(fā)生特定事件和節(jié)點(diǎn)本身存在故障;本發(fā)明的方法針對(duì)傳感器節(jié)點(diǎn)采集的多維屬性數(shù)據(jù)提出了異常數(shù)據(jù)檢測(cè)方法,充分考慮了傳感器數(shù)據(jù)流之間的時(shí)空相關(guān)性和多維屬性數(shù)據(jù)之間的關(guān)聯(lián)性,具有可擴(kuò)展性;與傳統(tǒng)的檢測(cè)方法比較,本發(fā)明提出的方法具有較高的檢測(cè)率和較低的誤報(bào)率。
【IPC分類】H04W24/06, H04W24/04
【公開號(hào)】CN104994535
【申請(qǐng)?zhí)枴緾N201510305314
【發(fā)明人】李光輝, 費(fèi)歡, 馮海林
【申請(qǐng)人】浙江農(nóng)林大學(xué)
【公開日】2015年10月21日
【申請(qǐng)日】2015年6月4日