本發(fā)明涉及電力設備狀態(tài)監(jiān)控技術領域,具體涉及基于數(shù)據(jù)挖掘和主成分分析的電力設備狀態(tài)評估方法。
背景技術:
電力設備的正常運行是電力系統(tǒng)安全穩(wěn)定的保障,因此對電力設備的狀態(tài)評價和故障預測顯得尤為重要。
目前的電力設備狀態(tài)評價研究中,存在諸多問題:電力設備狀態(tài)指標量眾多,但缺乏綜合評價體系,導致指標信息利用不足,狀態(tài)評價不全面;已有的方法多需要利用設備故障數(shù)據(jù),但實際上設備故障案例匱乏;應用閾值法對同類設備進行評價的時候,無法體現(xiàn)設備的個體差異,精度太低等等。
隨著智能電網(wǎng)建設的快速發(fā)展,電網(wǎng)信息系統(tǒng)的逐步改善升級,電力行業(yè)也已經(jīng)步入“大數(shù)據(jù)時代”,各項數(shù)據(jù)挖掘技術也已經(jīng)開始在電力設備的狀態(tài)評估中應用開來。數(shù)據(jù)挖掘作為一種多學科綜合的產物,綜合利用人工智能、機器學習、模式識別、統(tǒng)計學、數(shù)據(jù)庫、可視化技術等,自動分析數(shù)據(jù)并從中得到潛在隱含的知識,具有較好的應用價值。主成分分析算法是一種利用較為廣泛的數(shù)據(jù)挖掘技術,該算法遵循“方差最小”原則對坐標空間進行旋轉,可以在最低程度減少數(shù)據(jù)信息損失的前提下實現(xiàn)數(shù)據(jù)的降維壓縮,將相關度高的變量轉化成彼此獨立或者不相關的新變量(即主成分),形成主成分體系,然后對各個主成分進行加權求和,其中,各個主成分的累加權重由其對應的信息貢獻率確定。
主成分分析法應用條件很寬松:指標是正向的、標準化的,主成分載荷矩陣簡單,主成分正向,主成分與變量顯著相關,就可以應用主成分分析綜合評價方法進行評價,所以基于主成分分析方法建立的綜合評估模型具有較好的普適性;對同類設備的不同個體進行數(shù)據(jù)分析會得到不同的主成分載荷矩陣,進而得到不同的主成分構成,最終對于不同個體會得到不同的預警值,可以實現(xiàn)同類設備不同個體的差異化評價;主成分分析法的實質是對高維數(shù)據(jù)的降維和壓縮,在對高維多源的電力大數(shù)據(jù)進行挖掘時具有非常重要的意義,可以大大減少指標變量,節(jié)省存儲空間和計算時間;同時,因為這種降維和壓縮是建立在“原始變量最大方差”基礎上的,因而可以把信息損失量降到最低,充分保留原始數(shù)據(jù)涵蓋的關于評價對象的信息,無損于原始數(shù)據(jù)的“信息價值”,因而具有很高的評價效率和準確性。
此外,各個主成分對綜合評估值的權重大小是通過分析計算樣本數(shù)據(jù)得到,而非人為設置,因此可以排除評估人的主觀干擾,使得評價結果更加客觀公正。而且,基于主成分分析的綜合評價得到的是關于評價對象的得分值(或稱為評估值),得分的大小直接反映出評價對象的優(yōu)劣,簡單明了,而且便于評估結果的“可視化”。
現(xiàn)有的技術中,公開號為CN20120057797的專利申請文件《一種電力設備載流故障在線診斷預警方法》說明書中描述了一種基于主成分分析法進行故障預警的方法,該專利公開的技術內容存在的技術問題是:
第一,該專利中,僅僅利用第1主成分方向上的特征值,遺漏了第二,三,四··等主成分方向上的特征值,第1主成分方向上的特征值僅能表現(xiàn)第一主成分的信息貢獻率,并不能全部代表所有分析變量的特征,遺漏了第二,三,四··等主成分含有的原始變量的信息,增大了判斷誤差。
第二,該專利中,選擇第1主成分方向上的特征值作為狀態(tài)評估值,不夠全面,僅能反映第一主成分的變化狀態(tài)。
技術實現(xiàn)要素:
為解決現(xiàn)有技術存在的不足,本發(fā)明公開了基于數(shù)據(jù)挖掘和主成分分析的電力設備狀態(tài)評估方法,本發(fā)明的目的是對反映電力設備狀態(tài)的在線監(jiān)測、帶電檢測、試驗測試等大量數(shù)據(jù)進行挖掘分析,利用主成分分析方法建立了電力設備運行狀態(tài)的綜合評估模型,該模型可以充分挖掘分析現(xiàn)有狀態(tài)信息,對電力設備健康狀態(tài)進行個性化和差異化的動態(tài)評估。
為實現(xiàn)上述目的,本發(fā)明的具體方案如下:
基于數(shù)據(jù)挖掘和主成分分析的電力設備狀態(tài)評估方法,包括以下步驟:
確定電力設備的待評估參量;
對確定的電力設備的待評估參量進行挖掘分析,利用主成分分析方法建立電力設備運行狀態(tài)的綜合評估模型;
選擇建模數(shù)據(jù),求解模型參數(shù),確定預警值,進行實時動態(tài)評估。
進一步的,所述利用主成分分析方法建立電力設備運行狀態(tài)的綜合評估模型之前需要建立主成分體系。
進一步的,所述主成分體系在建立的過程中,需要將電力設備的待評估參量數(shù)據(jù)標準化,將標準化的數(shù)據(jù)求解特征值及求解特征向量,由特征向量確定主成分體系的載荷矩陣。
進一步的,在確定電力設備的待評估參量時,假設需要進行綜合評估的電力設備指標變量有m個:x1,x2,…,xm,共有n個評價對象,記為
X=(xij)n*m。
其中xij表示第n個樣本的第m個指標變量的值。
進一步的,電力設備的待評估參量數(shù)據(jù)標準化時,為消除數(shù)量級引起的數(shù)據(jù)差別,需要將樣本數(shù)據(jù)X標準化處理為X*。
進一步的,將標準化的數(shù)據(jù)求解特征值及求解特征向量之前需要求取X*變量間的相關系數(shù)矩陣R=X*TX*。
進一步的,求解特征值及求解特征向量時,求解相關系數(shù)矩陣R的特征值λ1≥λ2≥…≥λm≥0,對應的特征向量β1,β2,...,βm,其中,βj=(β1j,β2j,…,βnj)',稱為第j主成分載荷,以各個特征向量作為列向量形成的矩陣就是主成分載荷矩陣,表明各個指標變量對主成分的影響程度,由主成分載荷矩陣形成m個新的指標變量,即主成分。
進一步的,在得到所有的主成分之后按照“使前p個主成分y1,y2,…,yp的累積貢獻率接近于1”的原則確定p的大小,,根據(jù)各個主成分的信息貢獻率得到最終綜合評估值。
進一步的,對電力設備狀態(tài)評估時,選擇時間t=1,2,…,T內的電力設備指標變量作樣本數(shù)據(jù),就可以得到綜合評估值的時間序列,得到初期的L組綜合評估值s1,s2,…,sL就對應設備最佳的評估值得分,因此把這L組綜合評估值作為“標準值”,將sL+1,sL+2,…,sT均與“標準值”進行比較,超過設定的預警值時即認為設備狀態(tài)出現(xiàn)異常,發(fā)出故障警告。
進一步的,將得到的綜合評估值時間序列作為初始數(shù)據(jù)來預測未來的綜合評估值,對電力設備的未來狀態(tài)進行預測。
進一步的,根據(jù)計算得到的電力設備的綜合評估值數(shù)據(jù),進行電力設備的潛伏性故障的預判時,首先,選擇反向傳播神經(jīng)網(wǎng)絡、極限學習機神經(jīng)網(wǎng)絡和最小二乘支持向量機算法作為基本預測算法,利用已知數(shù)據(jù)訓練模型、優(yōu)化模型參數(shù),獲得各自的最優(yōu)模型;
然后,利用這幾種優(yōu)化模型分別進行預測,獲得各個最優(yōu)模型的預測數(shù)據(jù);
最后,基于“測量誤差平方和最小”原則計算幾種預測模型的最優(yōu)組合權系數(shù),利用最優(yōu)組合權系數(shù)對基本預測模型進行線性組合獲得最終的綜合預測模型。
本發(fā)明的有益效果:
本發(fā)明對反映電力設備狀態(tài)的在線監(jiān)測、帶電檢測、試驗測試等大量數(shù)據(jù)進行挖掘分析,利用主成分分析方法建立了電力設備運行狀態(tài)的綜合評估模型,該模型可以充分挖掘分析現(xiàn)有狀態(tài)信息,對電力設備健康狀態(tài)進行個性化和差異化的動態(tài)評估。該方法通過降維技術建立電力設備狀態(tài)關鍵參數(shù)體系,減少了計算空間和時間,提高了運算速率和效率;而且在缺乏電力設備的歷史故障樣本數(shù)據(jù)的情況下,依然可以針對同類設備的不同個體實現(xiàn)差異化評價。
本申請的專利方法中利用了所有主成分方向上的特征值和大部分的特征向量進行狀態(tài)評估模型構建,幾乎涵蓋了原始變量的所有信息,提高了判斷準確度。
本申請的專利將主成分的所有主成分方向上的特征值作為相應主成分得分的“信息貢獻率”,也即權重,進行加權求和,得到的總主成分得分作為綜合評估值,進行狀態(tài)評估,更全面。
附圖說明
圖1基于數(shù)據(jù)挖掘和主成分分析的電力設備狀態(tài)評價流程圖;
圖2(a)-圖2(b)1號變壓器及2號變壓器油中溶解氣體相關系數(shù)示意圖;
圖3(a)1號變壓器實際值與預警值的數(shù)據(jù)對比示意圖;
圖3(b)2號變壓器實際值與預警值的數(shù)據(jù)對比示意圖;
圖4(a)1號變壓器數(shù)據(jù)對比示意圖;
圖4(b)2號變壓器數(shù)據(jù)對比示意圖;
圖5為1、2號變壓器預測結果誤差平方和對比示意圖;
圖6(a)為1號變壓器預測結果示意圖;
圖6(b)為2號變壓器預測結果示意圖;
圖7為2號變壓器檢修前后綜合評估值示意圖。
具體實施方式:
下面結合附圖對本發(fā)明進行詳細說明:
基于主成分分析的綜合評價方法是把各個主成分對原始指標變量的信息貢獻率作為權重系數(shù),通過主成分的加權求和得到綜合評估值。
如圖1所示,基于數(shù)據(jù)挖掘和主成分分析的電力設備狀態(tài)評估方法,包括以下步驟:
1)確定待評估參量,假設需要進行綜合評估的電力設備指標變量有m個,:x1,x2,…,xm,共有n個評價對象,記為
X=(xij)n*m (1)
其中xij表示第n個樣本的第m個指標變量的值。
2)標準化:為消除數(shù)量級引起的數(shù)據(jù)差別,需要將樣本數(shù)據(jù)X標準化處理為X*。
3)相關系數(shù)矩陣:求取X*變量間的相關系數(shù)矩陣R=X*TX*。
4)特征值和特征向量:求解R的特征值λ1≥λ2≥…≥λm≥0,對應的特征向量β1,β2,...,βm。其中,βj=(β1j,β2j,…,βnj)',稱為第j主成分載荷矩陣。由特征向量組成m個新的指標變量,即主成分:
式中y1是第一主成分,y2是第二主成分,...,ym是第m主成分。
5)確定主成分:確定p大小,使前p個主成分y1,y2,…,yp的累積貢獻率
接近于1。最終綜合評估值為:
其中稱為λj的信息貢獻率,表示yj對原始變量的信息涵蓋量。
選擇時間t=1,2,…,T內的電力設備指標變量作樣本數(shù)據(jù),就可以得到綜合評估值的時間序列:
S=(s1,s2,…,sT) (5)
因為模型建立選擇的是評估時間段T內最初的L組數(shù)據(jù),也就是設備狀態(tài)最為良好的時候,所以得到的初期的L組綜合評估值s1,s2,…,sL就對應設備最佳的評估值得分,因此把這L組綜合評估值作為“標準值”,將sL+1,sL+2,…,sT均與“標準值”進行比較,與“標準值”相差過大的,即說明設備狀態(tài)與初期相比發(fā)生了劣化。為排除系統(tǒng)誤差和保留一定裕度,本發(fā)明選擇最初L組綜合評估值的次最大值的1.1倍,即
Smax=1.1*maxsi{si<maxst,i,t=1,2,…L} (6)
作為“預警值”,當某時刻的評估值超過該“預警值”時,即認為設備狀態(tài)出現(xiàn)異常,發(fā)出故障警告。
實例驗證:
為驗證上面提出的基于數(shù)據(jù)挖掘和主成分分析的電力設備狀態(tài)綜合評估方法的可行性和準確性,采用實際的變壓器狀態(tài)數(shù)據(jù)對變壓器絕緣狀態(tài)進行評估,同時,利用基于集成學習的綜合預測模型實現(xiàn)變壓器潛伏性故障的預判。
變壓器絕緣狀態(tài)評估:
在變壓器狀態(tài)指標變量中,與絕緣狀態(tài)有關的有油中溶解氣體濃度,油中微水量,油流帶電量,局部放電量等等,均可作為絕緣狀態(tài)評價的指標變量,本發(fā)明選擇變壓器油中溶解氣體(H2,CH4,C2H2,C2H4,C2H6,CO,CO2)數(shù)據(jù),進行模型檢驗和數(shù)據(jù)分析。
從某220kV變電站獲得2014年7月1日到2014年8月31日的1號主變壓器和2號主變壓器油中溶解氣體數(shù)據(jù)共61組,缺乏8月5日的數(shù)據(jù),根據(jù)“平均值”法,求取8月4日與8月6日的平均值代替缺失數(shù)據(jù);通過“峰度檢驗法”和“偏度檢驗法”對62組數(shù)據(jù)進行檢驗,并未發(fā)現(xiàn)異常,因此可以認為處理后的數(shù)據(jù)都是有效可用的。
取L=10,即利用前10天的數(shù)據(jù)進行主成分分析,建立主成分分析綜合評估模型,得到這10天的綜合評估值,進而有兩臺變壓器的“預警值”:Smax1=98.99,Smax2=15.52。再將7月11日到8月31日的52組數(shù)據(jù)帶入該模型,就可以得到這兩個月變壓器油中溶解氣體主成分分析綜合得分的時間序列S={s1,s2,…,s62}。
求得指標變量間的相關系數(shù)如圖2(a)-圖2(b)所示。
指標間的相關系數(shù)顯示指標變量間確實存在一定的相關性。相關系數(shù)矩陣特征值及貢獻率如表1。
表1特征值貢獻率
上表1可以看出,前4個特征根的累計貢獻率就達到90%以上,說明主成分分析效果很好,而一般累計貢獻率達到85%以上就說明所選擇的主成分可以涵蓋大部分的原變量信息了,為降低信息損失率,本發(fā)明選擇貢獻率最大的四個主成分作為新的指標變量。前四個特征值對應的特征向量為:
1號主變:
β1=(0.387,0.480,0.089,0.230,0.352,0.464,0.469)
β2=(0.078,-0.152,0.716,0.618,0.046,-0.195,-0.188)
β3=(0.390,0.085,0.433,-0.412,-0.670,0.187,0.030)
β4=(-0.550,0.057,0.532,-0.483,0.378,0.168,0.081)
2號主變:
β1=(0.520,0.309,-0.194,0.194,0.323,0.526,0.422)
β2=(-0.096,-0.423,0.431,0.731,-0.014,-0.003,0.304)
β3=(-0.084,0.605,0.653,-0.194,-0.099,-0.178,0.349)
β4=(-0.394,0.080,-0.136,0.042,0.835,-0.328,0.113)
兩臺設備的個體差異引起指標變量間的相關系數(shù)不同,導致兩個變壓器的主成分的載荷矩陣不同,體現(xiàn)出主成分分析方法可以對同類設備進行差異化評價。
由2014年7月1日到8月31日兩個變壓器的油中溶解氣體主成分綜合評估值時間序列S={s1,s2,…,s62},以及“預警值”畫出綜合得分的時間序列圖,如圖3(a)-圖3(b)所示。
從上圖3(a)-圖3(b)可以清晰地看出,與最初10天的綜合評估值和“預警值”相比,隨著時間的推進,1號變壓器油色譜綜合評估值變化不大,處于波動狀態(tài),基本都在“預警值”以下;而2號變壓器的評估值上升趨勢非常明顯,7月22日的評估值首次超過了“預警值”,之后很多評估值都在“預警值”以上。
參照《變壓器油中溶解氣體分析和判斷導則》(GB 7252-87)中的“注意值”法對7月1日至8月31日的油中溶解氣體數(shù)據(jù)進行分析,氣體含量均未超過各注意值;利用“產氣速率”法分析,各氣體的相對產氣速率均未超過10%/月,判斷不出異常;應用IEC提出的特征氣體“三比值法”對兩臺變壓器7月1日到8月31日的油色譜數(shù)據(jù)進行分析,結果顯示如下:
表2“三比值法”判斷結果
由上表2結果可以看出,2號變壓器在7月24日,8月20日,8月25日的故障編碼是001,判定可能存在“低于150℃的熱故障”問題。因為油色譜的六個指標變量H2,CH4,C2H2,C2H4,C2H6,CO,CO2均是正向指標變量,其含量越大,說明變壓器油主成分分析綜合評估值越大,因此可以認為2號變壓器的絕緣狀態(tài)確實隨著時間發(fā)生了劣化。
為了進一步了解變壓器絕緣狀態(tài)的發(fā)展趨勢,需要對未來狀態(tài)進行預測。
變壓器絕緣異常預判:
輸變電設備狀態(tài)預測是狀態(tài)維護策略中必不可少的一個環(huán)節(jié),通過對電力設備狀態(tài)進行預測,可以推斷設備狀態(tài)未來發(fā)展、演變的過程,并進一步預測異常狀態(tài)或故障可能發(fā)生的時間等。
本發(fā)明利用已有的綜合預測模型,結合上面計算得到的變壓器油綜合評估值數(shù)據(jù),進行變壓器潛伏性故障的預判:首先,根據(jù)系統(tǒng)特點選擇反向傳播神經(jīng)網(wǎng)絡(BP網(wǎng)絡)、極限學習機神經(jīng)網(wǎng)絡(ELM網(wǎng)絡)和最小二乘支持向量機算法(LSSVM模型)作為基本預測算法,利用已知數(shù)據(jù)訓練模型、優(yōu)化模型參數(shù),獲得各自的最優(yōu)模型。然后,利用這幾種優(yōu)化模型分別進行預測,獲得各個最優(yōu)模型的預測數(shù)據(jù)。最后,基于“測量誤差平方和最小”原則計算幾種預測模型的最優(yōu)組合權系數(shù),利用最優(yōu)組合權系數(shù)對基本預測模型進行線性組合獲得最終的綜合預測模型。將上節(jié)得到的綜合評估值時間序列作為初始數(shù)據(jù)來預測未來的綜合評估值,對變壓器絕緣未來狀態(tài)進行預測。
利用之前求得的2014年7月1日到8月26日油中溶解氣體的57組主成分分析綜合評估值數(shù)據(jù)分別對BP網(wǎng)絡模型,ELM網(wǎng)絡模型,LSSVM模型三種預測模型進行訓練,求解最優(yōu)網(wǎng)絡閾值參數(shù)。然后,利用8月27日到8月31日的5組實際評估值數(shù)據(jù)對三種模型進行測試,得到誤差矩陣,進而獲得最優(yōu)權值系數(shù)形成綜合預測模型。1、2號變壓器基本預測模型綜合模型預測結果對比如圖4(a)-圖4(b)所示。
三種時間序列預測模型和綜合預測模型的誤差平方和對比如圖5所示:從對比圖5可以看出來,綜合預測模型的預測結果符合“最小誤差平方和”原則,預測精度要優(yōu)于任何單一預測方法的結果。
利用預測值與實際值之間的誤差矩陣,得到最優(yōu)權值系數(shù),即三種基本預測模型的組合權系數(shù):
W1=(0,0.667,0.333),W2=(0.616,0.734,-0.350)。
利用訓練好的綜合預測模型對9月1日到9月20日的綜合評估值進行預測,結果見圖6(a)-圖6(b)。
由預測曲線可以看出,跟最初10天的評估值相比,1號變壓器綜合評估值基本保持平穩(wěn),變化不大;2號變壓器綜合評估值出現(xiàn)大幅上升,明顯異常,說明2號變壓器絕緣油健康狀態(tài)下降,很有可能存在潛伏性故障。
9月初,該變電站對2號變壓器進行了檢修,在檢修時確實發(fā)現(xiàn)了鐵芯局部過熱的問題。
把2號變壓器9月1日至10月29日的油中氣體數(shù)據(jù)代入之前建立的綜合評估模型,得到其主成分綜合評估值時間序列,如圖7所示。
由上圖7可以清晰地看到,在檢修之后,2號變壓器油綜合評估值呈現(xiàn)下降趨勢,最后基本上都降到了“預警值”以下,驗證了變壓器在維修之后潛伏性故障已經(jīng)基本消除、性能開始恢復正常的事實。
本發(fā)明所建立的變壓器絕緣狀態(tài)綜合評估模型,以投運初期的油色譜數(shù)據(jù)(實際應用中也可以選擇剛剛檢修完的變壓器最初10天的數(shù)據(jù))建立綜合評模型,并以這10天的評估結果作為正常狀態(tài)的“標準值”,將之后的油色譜數(shù)據(jù)帶入模型求得評估值時間序列,與“標準值”進行比較分析,就可觀察出變壓器絕緣狀態(tài)的發(fā)展變化,計算操作簡單易行。因為只需要利用已有的正常狀態(tài)數(shù)據(jù)建模設置“標準值”,與“標準值”相差過大的,就說明存在異常狀態(tài)或者潛伏性故障,所以解決了故障樣本數(shù)據(jù)缺乏的問題。
與傳統(tǒng)的變壓器絕緣狀態(tài)評價方法相比,本發(fā)明在氣體含量未超過《導則》中規(guī)定的“注意值”和閾值的時候,就發(fā)現(xiàn)了存在的異常;也發(fā)現(xiàn)了“產氣速率法”未能發(fā)現(xiàn)的緩慢的劣化發(fā)展趨勢;做到了“對同類設備不同個體的差異化評價”:1號變壓器和2號變壓器應用于同一個模型時得到了不同的模型參數(shù)、橫向可以比較出1號變壓器的狀態(tài)優(yōu)于2號變壓器;“三比值方法”本身是在設備已經(jīng)確定發(fā)生故障以后,才可以進行故障類型判別,變壓器絕緣的評估案例也表明“三比值法”在應用時編碼缺失情況非常嚴重,本發(fā)明評估模型不存在上述弊端,而且在7月22日就發(fā)現(xiàn)了問題,早于“三比值法”(7月24日)。
本發(fā)明對在線監(jiān)測數(shù)據(jù),帶電檢測數(shù)據(jù),地理環(huán)境數(shù)據(jù)和氣象環(huán)境數(shù)據(jù),實驗數(shù)據(jù)等均可應用,都可以作為評估變量;在發(fā)明案例中,只選擇了在線監(jiān)測數(shù)據(jù)進行驗證。
上述雖然結合附圖對本發(fā)明的具體實施方式進行了描述,但并非對本發(fā)明保護范圍的限制,所屬領域技術人員應該明白,在本發(fā)明的技術方案的基礎上,本領域技術人員不需要付出創(chuàng)造性勞動即可做出的各種修改或變形仍在本發(fā)明的保護范圍以內。