一種基于決策樹的智能電表故障實(shí)時(shí)預(yù)測(cè)方法
【專利摘要】一種基于決策樹的智能電表故障實(shí)時(shí)預(yù)測(cè)方法,步驟為:1、對(duì)用電信息采集系統(tǒng)的智能電表數(shù)據(jù)預(yù)處理;2、根據(jù)智能電表故障判斷模型,篩選用電信息采集系統(tǒng)的智能電表有故障的數(shù)據(jù)至智能電表故障數(shù)據(jù)庫(kù)中;3、將智能電表故障數(shù)據(jù)庫(kù)中的歷史數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,采用決策樹算法對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)挖掘,形成智能電表故障決策樹和初步分類規(guī)則;4、通過測(cè)試集的數(shù)據(jù)對(duì)初步分類規(guī)則進(jìn)行正確率評(píng)估,若正確率滿足要求,則確定分類規(guī)則,若不滿足要求,則返回訓(xùn)練集,重新訓(xùn)練;5、由最終確定的分類規(guī)則生成智能電表故障實(shí)時(shí)預(yù)測(cè)模型;6、將智能電表實(shí)時(shí)故障數(shù)據(jù)庫(kù)鏈接至智能電表故障實(shí)時(shí)預(yù)測(cè)模型進(jìn)行實(shí)時(shí)預(yù)測(cè),得到智能電表故障實(shí)時(shí)預(yù)測(cè)結(jié)果。
【專利說明】
一種基于決策樹的智能電表故障實(shí)時(shí)預(yù)測(cè)方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及一種智能電表故障預(yù)測(cè)方法,特別涉及一種基于決策樹的智能電表故 障實(shí)時(shí)預(yù)測(cè)方法。
【背景技術(shù)】
[0002] 隨著國(guó)家電網(wǎng)公司"三集五大"體系建設(shè)的深入推進(jìn),"大營(yíng)銷"推廣的用電信息采 集系統(tǒng)建設(shè)已具規(guī)模,特別是智能電能表已獲得大范圍的推廣應(yīng)用。如此龐大數(shù)量的智能 電表一旦出現(xiàn)故障,直接影響到用戶的切身利益和社會(huì)的安全穩(wěn)定,因此及時(shí)預(yù)測(cè)出智能 電表故障并對(duì)其維修或更換是十分重要的。
[0003] 隨著智能電表的廣泛應(yīng)用,運(yùn)行故障越來越多地呈現(xiàn)出突發(fā)性、多面性、復(fù)雜性的 特征,傳統(tǒng)電表的故障預(yù)測(cè)方法已不再適用。目前國(guó)內(nèi)外學(xué)者主要研究的神經(jīng)網(wǎng)絡(luò)、灰色預(yù) 測(cè)和專家系統(tǒng)等預(yù)測(cè)方法已在各領(lǐng)域得到了應(yīng)用,并取得了良好的效果,但仍存在不足之 處。用電信息采集系統(tǒng)提供的海量數(shù)據(jù)恰好給了數(shù)據(jù)挖掘技術(shù)一個(gè)用武之地,而在智能電 表故障預(yù)測(cè)領(lǐng)域,數(shù)據(jù)挖掘技術(shù)方面的相關(guān)研究尚未深入展開。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的是針對(duì)上述問題,提出一種基于決策樹的智能電表故障實(shí)時(shí)預(yù)測(cè)方 法,以實(shí)現(xiàn)在預(yù)測(cè)正確率可靠的情況下,對(duì)智能電表故障進(jìn)行實(shí)時(shí)預(yù)測(cè)。
[0005] 為達(dá)到上述目的,本發(fā)明采用技術(shù)方案是:
[0006] 步驟1,對(duì)用電信息采集系統(tǒng)的智能電表數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理;
[0007] 步驟2,根據(jù)智能電表故障判斷模型,將用電信息采集系統(tǒng)的智能電表有故障的數(shù) 據(jù)篩選至智能電表故障數(shù)據(jù)庫(kù)中;
[0008] 所述的智能電表故障判斷模型的作用是判斷智能電表是否發(fā)生故障。
[0009] 步驟3,選取智能電表故障數(shù)據(jù)庫(kù)中的歷史數(shù)據(jù),將其分為訓(xùn)練集和測(cè)試集,采用 決策樹算法對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)挖掘,形成智能電表故障決策樹,然后形成初步分類規(guī)則;
[0010] 步驟4,通過測(cè)試集的數(shù)據(jù)對(duì)初步分類規(guī)則進(jìn)行正確率評(píng)估,若正確率滿足要求, 則確定分類規(guī)則,若正確率不滿足要求,則返回至訓(xùn)練集,重新進(jìn)行訓(xùn)練;
[0011] 步驟5,由最終確定的分類規(guī)則生成智能電表故障實(shí)時(shí)預(yù)測(cè)模型;
[0012] 步驟6,將智能電表實(shí)時(shí)故障數(shù)據(jù)庫(kù)鏈接至智能電表故障實(shí)時(shí)預(yù)測(cè)模型進(jìn)行實(shí)時(shí) 預(yù)測(cè),得到智能電表故障實(shí)時(shí)預(yù)測(cè)結(jié)果。
[0013] 所述的步驟1對(duì)用電信息采集系統(tǒng)的智能電表數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理的步驟為,首 先去除與智能電表故障無關(guān)的屬性數(shù)據(jù)、有明顯錯(cuò)誤的數(shù)據(jù)和屬性重復(fù)的數(shù)據(jù),然后將各 個(gè)屬性連續(xù)數(shù)據(jù)離散化。
[0014] 所述的步驟2根據(jù)智能電表故障判斷模型將用電信息采集系統(tǒng)的智能電表有故障 的數(shù)據(jù)篩選至智能電表故障數(shù)據(jù)庫(kù)中的方法如下:
[0015] (1)當(dāng)進(jìn)行電表總電量與各費(fèi)率電量之和不等的故障數(shù)據(jù)篩選時(shí),采用下式判斷 電表總電量與各費(fèi)率電量之和不等的故障:
[0017]式中:W代表電量,+代表電量的方向?yàn)檎颍?代表電量的方向?yàn)榉聪?,i = l代表總 時(shí)段,W+1代表正向總電量,W-i代表反向總電量,i = 2代表高峰時(shí)段,i = 3代表平時(shí)段,i = 4 代表低谷時(shí)段,i = 5代表尖峰時(shí)段,e為電表費(fèi)率數(shù),P為總電量與各費(fèi)率電量之和不等的判 斷因子。當(dāng)e = 4時(shí),表示電表為四費(fèi)率電表,取P = 0.4;當(dāng)e = 3時(shí),表示電表為三費(fèi)率電表, 取P = 0.3;當(dāng)e = 2時(shí),表示電表為二費(fèi)率電表,取P = 0.2;
[0018]所述的四費(fèi)率電表指支持高峰時(shí)段、平時(shí)段、低谷時(shí)段、尖峰時(shí)段4個(gè)時(shí)段計(jì)費(fèi)的 電表;三費(fèi)率電表指支持僅高峰時(shí)段、平時(shí)段、低谷時(shí)段3個(gè)時(shí)段計(jì)費(fèi)的電表;二費(fèi)率電表指 僅支持平時(shí)段、低谷時(shí)段2個(gè)時(shí)段計(jì)費(fèi)的電表;
[0019] 判斷原則如下:
[0020]①電表的正反向總電量、正反向高峰時(shí)段電量、正反向平時(shí)段電量、正反向低谷時(shí) 段電量均大于〇,且不為空;
[0021] ②電表正反向各費(fèi)率電量之和大于0;
[0022] ③電表總電量與各費(fèi)率電量之和差值的絕對(duì)值大于某個(gè)閥值,閾值規(guī)則如下:如 果是四費(fèi)率電表,按〇. 4判斷,三費(fèi)率電表按0.3判斷,二費(fèi)率電表按0.2判斷;
[0023] ④若同時(shí)滿足判斷原則①②③,則判斷為嚴(yán)重故障;
[0024] (2)當(dāng)進(jìn)行電能表飛走和突變故障數(shù)據(jù)篩選時(shí),判斷電能表飛走和突變的故障程 序如下:
[0025] a.首先計(jì)算當(dāng)天最大電量Wf:
[0027]式中:Wf為當(dāng)天最大電量;Imax為最大電流;Ib為基本電流;
[0028] b.然后計(jì)算電表飛走和突變因子K:
[0030] 式中:K為電表飛走和突變因子,Wt為當(dāng)日電量;
[0031] 判斷原則如下:
[0032]①針對(duì)居民表,在1、2、7、8、9、12月份取最大電流Imax,按12小時(shí)計(jì)算電表飛走和突 變因子K;在3、4、5、6、10、11月份取3倍基本電流1^按8小時(shí)計(jì)算電表飛走和突變因子1(; [0033]③當(dāng)進(jìn)行電能表飛走和突變故障數(shù)據(jù)篩選時(shí),采用公式(4)判斷電能表飛走和突 變故障:
[0034] K彡 1 (4)
[0035]③若滿足判據(jù)②,則判斷為嚴(yán)重故障;
[0036] (3)當(dāng)進(jìn)行電表反向有功示值大于零故障數(shù)據(jù)篩選時(shí),采用下式判斷電表反向有 功示值大于零的故障:
[0038]式中:P代表有功功率,Q代表無功功率,P-總代表電表反向有功總功率,Q-總代表電表 反向無功總功率;
[0039] 判斷原則如下:
[0040]①電能表出現(xiàn)反向有功總功率或反向無功總功率大于0;
[0041 ]②若滿足判據(jù)①,則判斷為嚴(yán)重故障;
[0042] (4)當(dāng)進(jìn)行電能表倒走故障數(shù)據(jù)篩選時(shí),電能表倒走判斷的前提為排除抄讀電表 正反總電量總為空的記錄,采用下式判斷電能表倒走的故障:
[0044] 式中:W+ly為前一天的正向總電量,W-ly為前一天的反向總電量;
[0045] 判斷原則如下:
[0046] 根據(jù)日電量統(tǒng)計(jì)表判斷,針對(duì)低壓居民和單相工商業(yè)戶,只判斷前一天正向總電 量和反向總電量是否大于當(dāng)天的抄表示值,如果成立,則判斷為嚴(yán)重故障;
[0047] (5)當(dāng)進(jìn)行電表時(shí)鐘不對(duì)故障數(shù)據(jù)篩選時(shí),電表時(shí)鐘不對(duì)的故障判斷程序如下:
[0048] 首先判斷對(duì)時(shí)錯(cuò)誤次數(shù)m,如果對(duì)時(shí)錯(cuò)誤次數(shù)大于3次,則直接判定為嚴(yán)重故障, 即:
[0049] m>3 嚴(yán)重(7)
[0050]式中:m為對(duì)時(shí)錯(cuò)誤次數(shù);
[0051 ]若m不大于3,由在線監(jiān)測(cè)查詢是否滿足A t的要求,并按A t的標(biāo)準(zhǔn)生成電能表時(shí) 鐘超差等級(jí),則采用公式(8)判斷:
[0053] 式中:A t為終端與電能表時(shí)鐘之差,計(jì)算方法見式(9):
[0054] A t = 11麵Tt植| (9)
[0055] 式中:切#瑞表示終端時(shí)鐘,t喊表示電能表時(shí)鐘;
[0056] 判斷原則如下:
[0057]①如果對(duì)時(shí)錯(cuò)誤次數(shù)m超過3次,直接判斷為嚴(yán)重故障;
[0058] ②如終端與電能表時(shí)鐘之差A(yù) t滿足5min< A t<15min,判斷為一般故障;
[0059] 若15min< A t<30min判斷為重要故障;若A t>30min判斷為嚴(yán)重故障;
[0060] (6)當(dāng)進(jìn)行電表電能費(fèi)率設(shè)置異常故障數(shù)據(jù)篩選時(shí),采用下式判斷電表電能費(fèi)率 設(shè)置異常的故障:
[0061] ff+5^〇 或w-5乒〇 (1〇)
[0062] 判斷原則如下:
[0063] ①只判斷DLT-2007規(guī)約的電能表;
[0064]②判斷是否存在正向尖峰時(shí)段電量或反向尖峰時(shí)段電量,若存在,則判斷為嚴(yán)重 故障;
[0065] (7)當(dāng)進(jìn)行電能表正向潛動(dòng)故障數(shù)據(jù)篩選時(shí),采用下式判斷電能表正向潛動(dòng)的故 障:
[0067] 判斷原則如下:
[0068] 若滿足公式(11)3次,則判斷為重要故障,若滿足公式(11)5次,則判斷為嚴(yán)重故 障;
[0069] (8)當(dāng)進(jìn)行電能表反向潛動(dòng)故障數(shù)據(jù)篩選時(shí),采用下式判斷電能表反向潛動(dòng)的故 障:
[0071] 判斷原則如下:
[0072] 針對(duì)結(jié)算類的電能表正向總電量和反向總電量同時(shí)存在并大于0.1的情況,則判 斷為嚴(yán)重故障。
[0073]所述的步驟3選取智能電表故障數(shù)據(jù)庫(kù)中的歷史數(shù)據(jù),將其分為訓(xùn)練集和測(cè)試集, 采用決策樹算法對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)挖掘,形成智能電表故障決策樹,然后形成初步分類規(guī) 貝1J,其步驟如下:
[0074]設(shè)R是智能電表故障數(shù)據(jù)庫(kù)的歷史數(shù)據(jù),并將R的60 %數(shù)據(jù)分給訓(xùn)練集S,R的40 % 數(shù)據(jù)分給測(cè)試集T。以采用C5.0算法為例對(duì)訓(xùn)練集S進(jìn)行數(shù)據(jù)挖掘。
[0075]設(shè)具有n個(gè)值的屬性X將S分成n個(gè)子集Si,S2,…,Sn,設(shè)S中樣本的總數(shù)為| S |,freq (Ci,S)是S中屬于類別匕(1 = 1,2,…,N)的樣本個(gè)數(shù),S中某個(gè)樣本屬于類別(^的概率為
,它所傳達(dá)的信息為:
[0076]訓(xùn)練集S的熵info(S)由式(13)表示;
[0078]將訓(xùn)練集S根據(jù)屬性X分割成n個(gè)子集后,計(jì)算各個(gè)子集的信息熵,則集合S的期望 信息inf ox(S)用公式(14)來表示;
[0080] 為了度量按照屬性檢驗(yàn)X進(jìn)行分區(qū)的S所得到的信息,使用增益標(biāo)準(zhǔn)gain(X),它選 擇使其值能最大化,即此標(biāo)準(zhǔn)選擇的是具有最高信息增益的屬性來進(jìn)行每次分區(qū);
[0081] gain(X) = info(S)-infox(S) (15)
[0082] 根據(jù)屬性X的n個(gè)不同取值將S分割成Si,S2,…,S#n個(gè)子集后產(chǎn)生的潛在信息 split_info(X)用式(16)所示;
[0084] 公式(17)為X對(duì)S進(jìn)行劃分信息增益率gain_ratio(X);
[0086]首次計(jì)算采用選擇最高信息增益率的屬性作為決策樹的根節(jié)點(diǎn),然后決策樹的每 一個(gè)節(jié)點(diǎn)用此方法計(jì)算剩余屬性的信息增益率,扔選擇最高信息增益率的屬性作為決策樹 的當(dāng)前節(jié)點(diǎn),直到最終形成整個(gè)決策樹;
[0087]由該決策樹形成初步分類規(guī)則。
[0088]所述的步驟4通過測(cè)試集的數(shù)據(jù)對(duì)初步分類規(guī)則進(jìn)行正確率評(píng)估,若正確率滿足 要求,則確定分類規(guī)則,若正確率不滿足要求,則返回至訓(xùn)練集,重新進(jìn)行訓(xùn)練,其詳細(xì)步驟 如下:
[0089] (1)正確率評(píng)估公式為:
[0091]式中Z為評(píng)估正確率,A為初步分類規(guī)則在測(cè)試集T中預(yù)測(cè)正確的個(gè)數(shù);B為測(cè)試集T 的總數(shù)據(jù)個(gè)數(shù);
[0092] (2)設(shè)Z'為設(shè)定的正確率;若Z彡Z',則確定分類規(guī)則;gZ<Z',則返回訓(xùn)練集重新 訓(xùn)練決策樹。
[0093] 本發(fā)明智能電表故障實(shí)時(shí)預(yù)測(cè)方法可準(zhǔn)確地反映智能電表實(shí)時(shí)故障情況。
【附圖說明】
[0094] 圖1是本發(fā)明方法的總體實(shí)施流程框圖。
【具體實(shí)施方式】
[0095]下面結(jié)合附圖及【具體實(shí)施方式】對(duì)本發(fā)明做進(jìn)一步說明。
[0096] 下面以一批型號(hào)為DDZY102-Z智能電表在新疆某地區(qū)2年的運(yùn)行數(shù)據(jù)統(tǒng)計(jì)為例對(duì) 本發(fā)明作進(jìn)一步說明。
[0097] 如圖1所示,本發(fā)明基于決策樹的智能電表故障實(shí)時(shí)預(yù)測(cè)方法包括以下步驟:
[0098]步驟1,對(duì)用電信息采集系統(tǒng)的DDZY102-Z智能電表數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,步驟如 下:
[0099] (1)去除與智能電表故障無關(guān)的屬性數(shù)據(jù)、有明顯錯(cuò)誤的數(shù)據(jù)和屬性重復(fù)的數(shù)據(jù);
[0100] (2)將各個(gè)屬性連續(xù)數(shù)據(jù)離散化。
[0101] 步驟2,根據(jù)DDZY102-Z智能電表故障判斷模型,將用電信息采集系統(tǒng)的智能電表 有故障的數(shù)據(jù)篩選至智能電表故障數(shù)據(jù)庫(kù)中,步驟如下:
[0102] 所述的智能電表故障判斷模型的作用是判斷智能電表是否發(fā)生故障。
[0103] DDZY102-Z智能電表故障判斷模型如下:
[0104] (1)當(dāng)進(jìn)行電表總電量與各費(fèi)率電量之和不等的故障數(shù)據(jù)篩選時(shí),因 DDZY102-Z智 能電表為四費(fèi)率電表,e = 4,總電量與各費(fèi)率電量之和不等的判斷因子P取0.4。采用下式判 斷電表總電量與各費(fèi)率電量之和不等的故障:
[0106] 判斷原則如下:
[0107]①電表的正反向總電量、正反向高峰時(shí)段電量、正反向平時(shí)段電量、正反向低谷時(shí) 段電量均大于〇,且不為空。
[0108] ②電表正反向各費(fèi)率電量之和大于0;
[0109] ③電表總電量與各費(fèi)率電量之和差值的絕對(duì)值大于0.4。
[0110]④若同時(shí)滿足判斷原則①②③,則判斷為嚴(yán)重故障。
[0111] (2)當(dāng)進(jìn)行電能表飛走和突變故障數(shù)據(jù)篩選時(shí),判斷電能表飛走和突變的故障程 序如下:
[0112] a.首先計(jì)算當(dāng)天最大電量Wf:
[0114]式中:Wf為當(dāng)天最大電量;Imax為最大電流;Ib為基本電流。
[0115] b.然后計(jì)算電表飛走和突變因子K:
[0117] 式中:K為電表飛走和突變因子;Wt為當(dāng)日電量。
[0118] 判斷原則如下:
[0119] ①針對(duì)DDZY102-Z智能電表的兩年數(shù)據(jù)中,在1、2、7、8、9、12月份取最大電流1麗, 按12小時(shí)計(jì)算電表飛走和突變因子K;在3、4、5、6、10、11月份取3倍基本電流I b,按8小時(shí)計(jì) 算電表飛走和突變因子K。
[0120] ②當(dāng)進(jìn)行電能表飛走和突變故障數(shù)據(jù)篩選時(shí),采用公式(4)判斷電能表飛走和突 變故障:
[0121] K彡 1 (4)
[0122] ③若滿足判據(jù)②,則判斷為嚴(yán)重故障。
[0123] (3)當(dāng)進(jìn)行電表反向有功示值大于零故障數(shù)據(jù)篩選時(shí),采用下式判斷電表反向有 功示值大于零的故障:
[0125]式中:P代表有功功率,Q代表無功功率,P-總代表電表反向有功總功率,Q-總代表電表 反向無功總功率。
[0126] 判斷原則如下:
[0127] ①電能表出現(xiàn)反向有功總功率或反向無功總功率大于0。
[0128] ②若滿足判據(jù)①,則判斷為嚴(yán)重故障。
[0129] (4)當(dāng)進(jìn)行電能表倒走故障數(shù)據(jù)篩選時(shí),電能表倒走判斷的前提為排除抄讀電能 示值正、反向有功總為空的記錄,采用下式判斷電能表倒走的故障:
[0131 ]式中:W+ly為前一天的正向總電量,W-ly為前一天的反向總電量。
[0132] 判斷原則如下:
[0133] 根據(jù)日電量統(tǒng)計(jì)表判斷,針對(duì)低壓居民和單相工商業(yè)戶,只判斷前一天正向總電 量和反向總電量是否大于當(dāng)天的抄表示值,如果成立,則判斷為嚴(yán)重故障。
[0134] (5)當(dāng)進(jìn)行電表時(shí)鐘不對(duì)故障數(shù)據(jù)篩選時(shí),電表時(shí)鐘不對(duì)的故障判斷程序如下:
[0135] 首先判斷對(duì)時(shí)錯(cuò)誤次數(shù)m,如果對(duì)時(shí)錯(cuò)誤次數(shù)大于3次,則直接判定為嚴(yán)重故障, 即:
[0136] m>3 嚴(yán)重(7)
[0137] 式中:m為對(duì)時(shí)錯(cuò)誤次數(shù)。
[0138] 若m不大于3,由在線監(jiān)測(cè)查詢是否滿足A t的要求,并按A t的標(biāo)準(zhǔn)生成電能表時(shí) 鐘超差等級(jí),則采用公式(8)判斷:
[0140] 式中:At為終端與電能表時(shí)鐘之差,計(jì)算方法見式(9):
[0141] At=|t^-t?| (9)
[0142] 式中:t纟編表示終端時(shí)鐘,t植表示電能表時(shí)鐘。
[0143] 判斷原則如下:
[0144] ①如果對(duì)時(shí)錯(cuò)誤次數(shù)m超過3次,直接判斷為嚴(yán)重故障;
[0145] ②如終端與電能表時(shí)鐘之差A(yù) t滿足5min彡A t<15min,判斷為一般故障;
[0146] 若15min< A t<30min判斷為重要故障;若A t>30min判斷為嚴(yán)重故障;
[0147] (6)當(dāng)進(jìn)行電表電能費(fèi)率設(shè)置異常故障數(shù)據(jù)篩選時(shí),采用下式判斷電表電能費(fèi)率 設(shè)置異常的故障:
[0148] ff+5^〇 或w-5乒〇 (1〇)
[0149] 判斷原則如下:
[0150] ①只判斷DLT-2007規(guī)約的電能表。
[0151] ②判斷是否存在正向尖峰時(shí)段電量或反向尖峰時(shí)段電量,若存在,則判斷為嚴(yán)重 故障。
[0152] (7)當(dāng)進(jìn)行電能表正向潛動(dòng)故障數(shù)據(jù)篩選時(shí),采用下式判斷電能表正向潛動(dòng)的故 障:
[0154] 判斷原則如下:
[0155] 若滿足公式(11)3次,則判斷為重要故障,若滿足公式(11)5次,則判斷為嚴(yán)重故 障。
[0156] (8)當(dāng)進(jìn)行電能表反向潛動(dòng)故障數(shù)據(jù)篩選時(shí),采用下式判斷電能表反向潛動(dòng)的故 障:
[0158] 判斷原則如下:
[0159]針對(duì)結(jié)算類的電能表正向總電量和反向總電量同時(shí)存在并大于0.1的情況,則判 斷為嚴(yán)重故障。
[0160] 將DDZY102-Z智能電表故障判斷模型篩選出的所有故障存放至DDZY102-Z智能電 表故障數(shù)據(jù)庫(kù)中。
[0161] 步驟3,選取DDZY102-Z智能電表故障數(shù)據(jù)庫(kù)中的歷史數(shù)據(jù),將其分為訓(xùn)練集和測(cè) 試集,采用決策樹算法對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)挖掘,形成智能電表故障決策樹,然后形成初步分 類規(guī)則,其詳細(xì)步驟如下:
[0162] 設(shè)R是智能電表故障數(shù)據(jù)庫(kù)的歷史數(shù)據(jù),并將R的60 %數(shù)據(jù)分給訓(xùn)練集S,R的40 % 數(shù)據(jù)分給測(cè)試集T。以采用C5.0算法為例對(duì)訓(xùn)練集S進(jìn)行數(shù)據(jù)挖掘。
[0163] 設(shè)具有n個(gè)值的屬性X將S分成n個(gè)子集Si,S2,…,Sn,設(shè)S中樣本的總數(shù)為| S |,freq (Ci,S)是S中屬于類別匕(1 = 1,2,…,N)的樣本個(gè)數(shù),S中某個(gè)樣本屬于類別(^的概率為
,它所傳達(dá)的信息為:
[0164] 訓(xùn)練集S的熵info(S)由式(13)表示;
[0166]將訓(xùn)練集S根據(jù)屬性X分割成n個(gè)子集后,計(jì)算各個(gè)子集的信息熵,則集合S的期望 信息inf ox(S)用公式(14)來表示;
[0168] 為了度量按照屬性檢驗(yàn)X進(jìn)行分區(qū)的S所得到的信息,使用增益標(biāo)準(zhǔn)gain(X),它選 擇使其值能最大化,即此標(biāo)準(zhǔn)選擇的是具有最高信息增益的屬性來進(jìn)行每次分區(qū);
[0169] gain(X) = info(S)-infox(S) (15)
[0170] 根據(jù)屬性X的n個(gè)不同取值將S分割成…,Sn*n個(gè)子集后產(chǎn)生的潛在信息 split_info(X)用式(16)所示;
[0172]公式(17)為X對(duì)S進(jìn)行劃分信息增益率gain_ratio(X);
[0174] 首次計(jì)算采用選擇最高信息增益率的屬性作為決策樹的根節(jié)點(diǎn),然后決策樹的每 一個(gè)節(jié)點(diǎn)用此方法計(jì)算剩余屬性的信息增益率,扔選擇最高信息增益率的屬性作為決策樹 的當(dāng)前節(jié)點(diǎn),直到最終形成整個(gè)決策樹。
[0175] 由該決策樹形成初步分類規(guī)則。
[0176]步驟4,通過測(cè)試集的數(shù)據(jù)對(duì)初步分類規(guī)則進(jìn)行正確率評(píng)估,若正確率滿足要求, 則確定分類規(guī)則,若正確率不滿足要求,則返回至訓(xùn)練集,重新進(jìn)行訓(xùn)練,其詳細(xì)步驟如下: [0177] (3)正確率評(píng)估公式為:
[0179]式中Z為評(píng)估正確率,A為初步分類規(guī)則在測(cè)試集T中預(yù)測(cè)正確的個(gè)數(shù);B為測(cè)試集T 的總數(shù)據(jù)個(gè)數(shù)。
[0180] (4)設(shè)Z'為設(shè)定的正確率。若Z彡Z',則確定分類規(guī)則;gZ<Z',則返回訓(xùn)練集重新 訓(xùn)練決策樹。
[0181 ]步驟5,由最終確定的分類規(guī)則生成DDZY102-Z智能電表故障實(shí)時(shí)預(yù)測(cè)模型;
[0182] 步驟6,將DDZY102-Z智能電表實(shí)時(shí)故障數(shù)據(jù)庫(kù)連接至DDZY102-Z智能電表故障實(shí) 時(shí)預(yù)測(cè)模型進(jìn)行實(shí)時(shí)預(yù)測(cè),得到DDZY102-Z智能電表故障實(shí)時(shí)預(yù)測(cè)結(jié)果。
【主權(quán)項(xiàng)】
1. 一種基于決策樹的智能電表故障實(shí)時(shí)預(yù)測(cè)方法,其特征在于,所述的實(shí)時(shí)預(yù)測(cè)方法 的具體步驟如下: 步驟1,對(duì)用電信息采集系統(tǒng)的智能電表數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理; 步驟2,根據(jù)智能電表故障判斷模型,將用電信息采集系統(tǒng)的智能電表有故障的數(shù)據(jù)篩 選至智能電表故障數(shù)據(jù)庫(kù)中; 步驟3,選取智能電表故障數(shù)據(jù)庫(kù)中的歷史數(shù)據(jù),將其分為訓(xùn)練集和測(cè)試集,采用決策 樹算法對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)挖掘形成智能電表故障決策樹,然后形成初步分類規(guī)則; 步驟4,通過測(cè)試集的數(shù)據(jù)對(duì)初步分類規(guī)則進(jìn)行正確率評(píng)估,若正確率滿足要求,則確 定分類規(guī)則,若正確率不滿足要求,則返回至訓(xùn)練集,重新進(jìn)行訓(xùn)練; 步驟5,由最終確定的分類規(guī)則生成智能電表故障實(shí)時(shí)預(yù)測(cè)模型; 步驟6,將智能電表實(shí)時(shí)故障數(shù)據(jù)庫(kù)鏈接至智能電表故障實(shí)時(shí)預(yù)測(cè)模型進(jìn)行實(shí)時(shí)預(yù)測(cè), 得到智能電表故障實(shí)時(shí)預(yù)測(cè)結(jié)果。2. 根據(jù)權(quán)利要求1所述的基于決策樹的智能電表故障實(shí)時(shí)預(yù)測(cè)方法,其特征在于,所述 的步驟1對(duì)用電信息采集系統(tǒng)的智能電表數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理的步驟為:首先去除與智能 電表故障無關(guān)的屬性數(shù)據(jù)、有明顯錯(cuò)誤的數(shù)據(jù)和屬性重復(fù)的數(shù)據(jù),然后將各個(gè)屬性連續(xù)數(shù) 據(jù)離散化。3. 根據(jù)權(quán)利要求1所述的基于決策樹的智能電表故障實(shí)時(shí)預(yù)測(cè)方法,其特征在于,所述 的步驟2根據(jù)智能電表故障判斷模型將用電信息采集系統(tǒng)的智能電表有故障的數(shù)據(jù)篩選至 智能電表故障數(shù)據(jù)庫(kù)中的方法如下: (1)當(dāng)進(jìn)行電表總電量與各費(fèi)率電量之和不等的故障數(shù)據(jù)篩選時(shí),采用下式判斷電表 總電量與各費(fèi)率電量之和不等的故障:式中:W代表電量,+代表電量的方向?yàn)檎颍?代表電量的方向?yàn)榉聪?,i = l代表總時(shí) 段,W+i代表正向總電量,W-i代表反向總電量,i = 2代表高峰時(shí)段,i = 3代表平時(shí)段,i = 4代 表低谷時(shí)段,i = 5代表尖峰時(shí)段,e為電表費(fèi)率數(shù),P為總電量與各費(fèi)率電量之和不等的判斷 因子;當(dāng)e = 4時(shí),表示電表為四費(fèi)率電表,取P = 0.4;當(dāng)e = 3時(shí),表示電表為三費(fèi)率電表,取P = 0.3;當(dāng)e = 2時(shí),表示電表為二費(fèi)率電表,取P = 0.2; 所述的四費(fèi)率電表指支持高峰時(shí)段、平時(shí)段、低谷時(shí)段、尖峰時(shí)段4個(gè)時(shí)段計(jì)費(fèi)的電表; 三費(fèi)率電表指支持僅高峰時(shí)段、平時(shí)段、低谷時(shí)段3個(gè)時(shí)段計(jì)費(fèi)的電表;二費(fèi)率電表指僅支 持平時(shí)段、低谷時(shí)段2個(gè)時(shí)段計(jì)費(fèi)的電表; 判斷原則如下: ①電表的正反向總電量、正反向高峰時(shí)段電量、正反向平時(shí)段電量、正反向低谷時(shí)段電 量均大于0,且不為空; ② 電表正反向各費(fèi)率電量之和大于0; ③ 電表總電量與各費(fèi)率電量之和差值的絕對(duì)值大于某個(gè)閥值,閾值規(guī)則如下:如果是 四費(fèi)率電表,按0.4判斷,三費(fèi)率電表按0.3判斷,二費(fèi)率電表按0.2判斷; ④ 若同時(shí)滿足判斷原則①②③,則判斷為嚴(yán)重故障; (2) 當(dāng)進(jìn)行電能表飛走和突變故障數(shù)據(jù)篩選時(shí),判斷電能表飛走和突變的故障程序如 下: a. 首先計(jì)算當(dāng)天最大電量Wf:式中:Wf為當(dāng)天最大電量;Imax為最大電流;Ib為基本電流; b. 然后計(jì)算電表飛走和突變因子K:式中:K為電表飛走和突變因子,Wt為當(dāng)日電量; 判斷原則如下: ① 針對(duì)居民表,在1、2、7、8、9、12月份取最大電流1_\,按12小時(shí)計(jì)算電表飛走和突變因 子K;在3、4、5、6、10、11月份取3倍基本電流1^按8小時(shí)計(jì)算電表飛走和突變因子1(; ② 當(dāng)進(jìn)行電能表飛走和突變故障數(shù)據(jù)篩選時(shí),采用公式(4)判斷電能表飛走和突變故 障: K彡1 (4) ③ 若滿足判據(jù)②,則判斷為嚴(yán)重故障; (3) 當(dāng)進(jìn)行電表反向有功示值大于零故障數(shù)據(jù)篩選時(shí),采用下式判斷電表反向有功示 值大于零的故障:式中:P代表有功功率,Q代表無功功率,P-總代表電表反向有功總功率,Q-總代表電表反向 無功總功率; 判斷原則如下: ① 電能表出現(xiàn)反向有功總功率或反向無功總功率大于〇; ② 若滿足判據(jù)①,則判斷為嚴(yán)重故障; (4) 當(dāng)進(jìn)行電能表倒走故障數(shù)據(jù)篩選時(shí),電能表倒走判斷的前提為排除抄讀電表正反 總電量總為空的記錄,采用下式判斷電能表倒走的故障:式中:W+ly為前一天的正向總電量,W-ly為前一天的反向總電量; 判斷原則如下: 根據(jù)日電量統(tǒng)計(jì)表判斷,針對(duì)低壓居民和單相工商業(yè)戶,只判斷前一天正向總電量和 反向總電量是否大于當(dāng)天的抄表示值,如果成立,則判斷為嚴(yán)重故障; (5) 當(dāng)進(jìn)行電表時(shí)鐘不對(duì)故障數(shù)據(jù)篩選時(shí),電表時(shí)鐘不對(duì)的故障判斷程序如下: 首先判斷對(duì)時(shí)錯(cuò)誤次數(shù)m,如果對(duì)時(shí)錯(cuò)誤次數(shù)大于3次,則直接判定為嚴(yán)重故障,即: m>3嚴(yán)重 (7) 式中:m為對(duì)時(shí)錯(cuò)誤次數(shù); 若m不大于3,由在線監(jiān)測(cè)查詢是否滿足A t的要求,并按A t的標(biāo)準(zhǔn)生成電能表時(shí)鐘超 差等級(jí),則采用公式(8)判斷:式中:A t為終端與電能表時(shí)鐘之差,計(jì)算方法見式(9): a t = | (9) 式中:tiw表示終端時(shí)鐘,表示電能表時(shí)鐘; 判斷原則如下: ① 如果對(duì)時(shí)錯(cuò)誤次數(shù)m超過3次,直接判斷為嚴(yán)重故障; ② 如終端與電能表時(shí)鐘之差A(yù) t滿足5min< A t<15min,判斷為一般故障; 若15min< A t<30min判斷為重要故障;若A t>30min判斷為嚴(yán)重故障; (6) 當(dāng)進(jìn)行電表電能費(fèi)率設(shè)置異常故障數(shù)據(jù)篩選時(shí),采用下式判斷電表電能費(fèi)率設(shè)置 異常的故障: W+5乒0或 W-5乒0 (10) 判斷原則如下: ① 只判斷DLT-2007規(guī)約的電能表; ② 判斷是否存在正向尖峰時(shí)段電量或反向尖峰時(shí)段電量,若存在,則判斷為嚴(yán)重故障; (7) 當(dāng)進(jìn)行電能表正向潛動(dòng)故障數(shù)據(jù)篩選時(shí),采用下式判斷電能表正向潛動(dòng)的故障:判斷原則如下: 若滿足公式(11)3次,則判斷為重要故障,若滿足公式(11)5次,則判斷為嚴(yán)重故障; (8) 當(dāng)進(jìn)行電能表反向潛動(dòng)故障數(shù)據(jù)篩選時(shí),采用下式判斷電能表反向潛動(dòng)的故障:判斷原則如下: 針對(duì)結(jié)算類的電能表正向總電量和反向總電量同時(shí)存在并大于0.1的情況,則判斷為 嚴(yán)重故障。
【文檔編號(hào)】G01R35/04GK106054104SQ201610342042
【公開日】2016年10月26日
【申請(qǐng)日】2016年5月20日
【發(fā)明人】李寧, 袁鐵江, 楊金成, 蔣平, 王剛, 董小順, 羅慶, 李國(guó)軍, 薛飛, 段志尚, 山憲武
【申請(qǐng)人】國(guó)網(wǎng)新疆電力公司電力科學(xué)研究院, 新疆大學(xué)