本發(fā)明涉及大數據的數據填補領域,具體講涉及一種電網用戶用電功率曲線數據填補方法和裝置。
背景技術:
隨著大數據時代的到來和電力系統(tǒng)信息化程度的不斷提高,電力大數據呈爆炸式增長,且種類也越來越多?,F有電力系統(tǒng)分析中多用采集的數據建立模型實現用戶用電分析,對后續(xù)竊電檢測、負荷預測等提供幫助,對智能電網業(yè)務模式創(chuàng)新和發(fā)展極為重要。
電力系統(tǒng)中的各類數據的監(jiān)控與采集是電力系統(tǒng)調度運行、安全穩(wěn)定分析、設備狀態(tài)與風險評估的基礎。然而,在電力系統(tǒng)的實際運行中,由于數據采集通道錯誤、遠程終端單元故障等原因會導致觀測數據出現反常態(tài)勢,與大多數觀測值不一致,此外由于線路的檢修、切負荷停電和大事件沖擊有可能會導致觀測數據違背常規(guī),使電力系統(tǒng)數據對智能電網系統(tǒng)的分析造成困難,因此在數據分析前需采用一種數據補充方法將缺失的數據補充完整,提高電力系統(tǒng)數據分析的準確性和曲線類數據的可用性,為后續(xù)分析提供支持。
技術實現要素:
為滿足現有技術發(fā)展的需要,本發(fā)明提供了一種電網用戶用電功率曲線數據填補方法。
本發(fā)明提供的電網用戶用電功率曲線數據填補方法,其改進之處在于,所述方法包括:
根據臺區(qū)線路T的狀態(tài)估計線損率,并根據用戶日曲線狀態(tài)估計缺失的用戶功率;
微調線損率估計值和缺失的用戶功率估計值。
進一步的,所述線損率的估計包括:
按下式計算樣本Rdm在時刻(d,m)∈G時的線損率rdm0:
其中,樣本Rdm=[rdm1,rdm2,…,rdmN],PdmT:臺區(qū)總功率;rdmn:用戶n在d天時刻m的功率占臺區(qū)總功率的比率,Pdmn:用戶n的功率;Pdm0:線損功率;N:臺區(qū)下的用戶數目;n:用戶編號,為從1到N的整數;時刻(d,m):第d天的時刻m的記錄,d∈D,D:記錄日的集合;m∈M,M:記錄時刻的集合;G:臺區(qū)所有用戶功率記錄的時刻集合。
進一步的,所述線損率的估計包括:
時刻樣本Rdm不完整,則通過“城市塊距離”的K-近鄰算法在u個用戶有記錄的數據中節(jié)選最近的k1個樣本按下式估計樣本Rdm的線損率
式中,i:天數,i∈D;j:時刻數,j∈M;n1,n2,…,nu:表示u個用戶;第i天第j時刻用戶nu的功率占臺區(qū)總功率的比率;u個用戶在第i天第j時刻的線損率。
進一步的,所述缺失的用戶功率的估計包括:
設第d天用戶n的功率日曲線記錄為Ldn=[Pd1n,Pd2n,…,PdMn],在時刻通過“相關性距離”的K-近鄰算法在第i天用戶t的功率日曲線記錄中節(jié)選相關性最大的k2個樣本按下式估計缺失的用戶功率數據
式中,ml:采集數據的時刻;第i天t個用戶記錄mw時刻點的功率,w=1,2,3…,l;l:樣本數量;
進一步的,在所述微調前,根據用戶功率記錄和估計的線損率按下式估計缺失功率的總和
其中,e:記錄了功率的用戶n1,n2,…,nu;f:缺失功率記錄的用戶q1,q2,…,qv;有不完整記錄時刻時,樣本Rdm的線損率。
進一步的,所述微調包括:
在時刻選擇k2個中的值作為需要填補的的估計值分別計算并與比較,設差值最小的為
進一步的,計算線損率設置閾值r1,r2并與比較,確定最終估計的線損率:
若則線損率的估計值為
若則線損率的估計值為
若則線損率的估計值為
進一步的,根據估計的線損率按下式計算缺失用戶功率的和
對估計的用戶功率按比例縮放,得最終的缺失功率估計
一種電網用戶用電功率曲線的數據填補裝置,所述裝置包括:
估計單元,用于根據臺區(qū)線路T的狀態(tài)估計線損率,并根據用戶日曲線狀態(tài)估計缺失的用戶功率數據;
調節(jié)單元,用于微調線損率估計和缺失的用戶功率估計,完成缺失數據的填補。
進一步的,所述估計單元包括:
第一估計子單元,用于根據臺區(qū)線路T的狀態(tài)估計線損率;
第二估計子單元,用于根據用戶日曲線狀態(tài)估計缺失的用戶功率數據;
所述調節(jié)單元包括:
第一調節(jié)子單元,用于根據設置的閾值和修正的線損率確定線損率的最終估計值;
第二調節(jié)子單元,用于根據線損率的最終估計值計算缺失用戶功率值的最終估計值。
與最接近的現有技術比,本發(fā)明提供的技術方案具有以下優(yōu)異效果:
(1)本發(fā)明提供的技術方案不對臺區(qū)狀態(tài)進行分類即可估計線路線損,可通過近鄰算法快速便捷的找到狀態(tài)最接近的臺區(qū)時刻;不必對用戶日曲線進行用電行為分類,可直接匹配最相似的日曲線進行缺失功率數據填補,有效提高數據填補的準確性和實效性,為電力系統(tǒng)數據分析提供數據支撐。
(2)本發(fā)明提供的技術方案用橫縱結合的方式,通過兩個維度方向分別對狀態(tài)和缺失數據進行估計,并綜合考慮進行微調,能夠得到更優(yōu)更穩(wěn)健的結果,能有效提高曲線數據填補的正確性。
附圖說明
圖1為本發(fā)明提供的數據填補方法流程圖;
圖2為本發(fā)明提供的對缺失率和線損率微調的細節(jié)圖。
具體實施方式
以下將結合說明書附圖,以具體實施例的方式詳細介紹本發(fā)明提供的技術方案。
本發(fā)明提供的技術方案針對電網臺區(qū)用戶的用電曲線類數據的缺失問題,進行數據填補。在用電用戶的電流、功率等曲線類數據的采集過程中,通常會出現缺失現象,以功率曲線類數據為例,本發(fā)明提供的技術方案包括:
已知一個電網單相臺區(qū)或多相臺區(qū)的某一相線T,下面接有N個用電用戶C1,C2,…,CN。智能電表每隔一定時間t0分鐘記錄臺區(qū)和每個用戶的功率,每天記錄M點,其中M×t0=1440,共連續(xù)記錄D天,即M×D個記錄時刻的數據。對時刻(d,m),即第d天的第m時刻的記錄,T的輸出功率為PdmT,為全部已知;N個用戶的功率分別為Pdm1,Pdm2,…,PdmN,為全部已知或部分已知;線損功率為Pdm0≥0,并滿足Pdm0=PdmT-(Pdm1+Pdm2+…+PdmN),當臺區(qū)所有用戶的功率都已知時,可以通過計算得到線損。問題需求就是要填補缺失部分的用戶功率數據Pdmn。
本發(fā)明提供的電網用戶用電功率曲線數據缺失的填補方法基于K-近鄰算法,該方法中,為防止出現分母為0的情況,僅對臺區(qū)總功率PdmT>0的記錄進行后續(xù)工作,對于總功率PdmT=0的記錄,下面所有缺失的用戶功率全部記為0。首先通過估計臺區(qū)T的狀態(tài)來估計線損率,然后通過估計用戶日曲線的狀態(tài)來估計缺失的用戶功率數據,技術路線圖如附圖1所示,具體流程如下:
(1)根據臺區(qū)線路T的狀態(tài)估計線損率rdm0
對于時刻(d,m)的功率記錄,用戶n的功率占臺區(qū)總功率的比率為通過每個用戶功率占臺區(qū)總功率的比率來估計當前時刻的線損率,具體細節(jié)如下:
設時刻(d,m)對應的樣本數據為Rdm=[rdm1,rdm2,…,rdmN],其中N表示用電用戶數量,設G是臺區(qū)所有用戶功率記錄完整的時刻集合,即對于時刻(d,m)∈G,臺區(qū)下所有用戶的功率都已知,所以此時樣本數據Rdm是完整的,線損率可按下式計算得到:
將{(Rij,rij0)|(i,j)∈}作為已知的(樣本,線損率)集合,其中,i:天數,i∈D;j:時刻,j∈M。
而對于時刻臺區(qū)下用戶功率記錄不完整,因此樣本Rdm不完整,線損率未知,下面對Rdm進行線損率估計。設某時刻記錄了u個用戶n1,n2,…,nu的功率,節(jié)選Rdm中有記錄的部分并對所有已知樣本進行相同的節(jié)選操作,通過“城市塊距離”的K-近鄰方法,在節(jié)選的已知樣本中尋找最近的k1個節(jié)選樣本用它們對應的原樣本的線損率的算術平均值來對樣本Rdm的線損率進行初步估計,即
(2)根據用戶日曲線狀態(tài)估計缺失的用戶功率數據
設用戶n的第d天的功率日曲線記錄為Ldn=[Pd1n,Pd2n,…,PdMn],根據已知完整的用戶日功率曲線,來估計不完整日曲線的缺失部分功率,具體細節(jié)如下:
對某一記錄不完整的時刻分別估計每個缺失的用戶功率記錄Pdmq。由于Pdmq的缺失,日曲線Ldq一定不完整,節(jié)選Ldq中有記錄的部分為:
設Hdq為Lit中所有和Pimt都有記錄的日曲線集合,并對其進行節(jié)選其中,ml:采集數據的時刻;Pimlj:第i天t個用戶記錄ml時刻點的功率;l:樣本數量;得到已知(樣本,標簽)集合{(Lit,Pimt)|,t)∈Hdq}。通過“相關性距離”的K-近鄰方法,在已知樣本中尋找相關性最大的k2個樣本按樣本總功率比例估計Pdmq的k2個候選值,
(3)填補數據的微調修正
設某時刻記錄了u個用戶n1,n2,…,nu的功率,缺失v個用戶q1,q2,…,qv。根據已知的用戶功率記錄和由(1)估計的線損率,可以估計缺失功率的總和
,其中,缺失的用戶qf的功率;不完整樣本數據的線損率平均值。根據(2)中對缺失功率的估計,得到若干個估計j=1,2,…,v,u=1,2,…,k2;其中,缺失用戶qf的估計值。下面以線損率估計為主導,對缺失功率估計和線損率估計進行微調,得到最終的線損率和用戶功率數據的估計,技術圖如附圖2所示,具體細節(jié)如下:
在時刻對于每個需要填補的可以選擇k2個中的某一個作為估計值共有k2v種估計值。分別計算并跟進行比較,設差值最小的為
計算由此估計得到的線損率與進行比較,并設置2個閾值r1,r2:
如果則對線損率的最終估計為
如果則對線損率的最終估計修改為
如果則對線損率的最終估計修改為
根據最終估計的線損率計算缺失用戶功率的和:
再對初步估計的用戶功率按比例縮放,得到最終的缺失功率估計:
最終完成所有缺失數據的填補工作。
一種電網用戶用電功率曲線數據填補裝置,該裝置包括:
估計單元,用于根據臺區(qū)線路T的狀態(tài)估計線損率,并根據用戶日曲線狀態(tài)估計缺失的用戶功率數據;
所述估計單元包括:
第一估計子單元,用于根據臺區(qū)線路T的狀態(tài)估計線損率;
第二估計子單元,用于根據用戶日曲線狀態(tài)估計缺失的用戶功率數據;
調節(jié)單元,用于微調線損率估計和缺失的用戶功率估計,完成缺失數據的填補。
所述調節(jié)單元包括:
第一調節(jié)子單元,用于根據設置的閾值和修正的線損率確定線損率的最終估計值;
第二調節(jié)子單元,用于根據線損率的最終估計值計算缺失用戶功率值的最終估計值。
以上實施例僅用以說明本發(fā)明的技術方案而非對其限制,盡管參照上述實施例對本發(fā)明進行了詳細的說明,所屬領域的普通技術人員依然可以對本發(fā)明的具體實施方式進行修改或者等同替換,這些未脫離本發(fā)明精神和范圍的任何修改或者等同替換,均在申請待批的本發(fā)明的權利要求保護范圍之內。