法,如圖1所示,首先,采集 居民用電數(shù)據(jù),提取出階梯電價(jià)機(jī)制下居民用電行為的屬性特征,通過聚類分析識別出階 梯電價(jià)機(jī)制下居民不同的用電行為特征,將具有相同或相似的用電行為特征的用戶歸聚為 同一用戶類別;
[0046] 然后,針對每個(gè)用戶類別分別建立起對應(yīng)的負(fù)載預(yù)測模型,并進(jìn)行預(yù)測;
[0047] 最后,匯總各個(gè)用戶類別的預(yù)測結(jié)果。
[0048] 本發(fā)明所述的方法的核心是一種分類負(fù)載預(yù)測模型,先把居民用電數(shù)據(jù)按不同的 用電行為特征分成若干個(gè)類,得到一組若干個(gè)具有不同輸入輸出的數(shù)據(jù)集,然后對每個(gè)數(shù) 據(jù)集建立起相應(yīng)的負(fù)載預(yù)測模型。分類負(fù)載預(yù)測模型通過對單一負(fù)載預(yù)測模型所有含的信 息先進(jìn)行分類,不同的用電行為特征采用不同的預(yù)測模型,這有助于提供更精確的預(yù)測結(jié) 果。比如,有兩個(gè)不同的用戶群,分別為價(jià)格敏感度高的和價(jià)格敏感度低的用戶群,分類預(yù) 測可以讓我們知道每個(gè)用戶群的精確行為,而傳統(tǒng)的總量的平均模型則會導(dǎo)致對價(jià)格敏感 度高的用戶群預(yù)測過高,而價(jià)格敏感度低的用戶群預(yù)測過低。
[0049] 采集居民用電數(shù)據(jù)后,進(jìn)行如下操作,完成數(shù)據(jù)準(zhǔn)備階段:
[0050] 1)數(shù)據(jù)預(yù)處理:獲取各用戶當(dāng)日用電量;
[0051] 2)缺失值處理:如果缺失某日用電量,則通過計(jì)算用電缺失時(shí)間段前后一天的累 計(jì)電量之差,并按照缺失的天數(shù)進(jìn)行平均,作為缺失的某日用電量;
[0052] 3)異常值處理:對超出設(shè)定的指標(biāo)閾值范圍的當(dāng)日用電量進(jìn)行過濾。
[0053] 具體地,完成數(shù)據(jù)準(zhǔn)備階段后,利用聚類算法捕捉和識別不同用戶在分析期內(nèi)的 用電行為特征,將用電行為特征相同或相似的用戶聚成一類。然后對居民用電數(shù)據(jù)進(jìn)行分 類,即每個(gè)數(shù)據(jù)類的輸入和輸出都不同。接著,對不同類型的用戶(即不同數(shù)據(jù)集)分別建 立最適合的負(fù)載預(yù)測模型。
[0054] 進(jìn)行預(yù)測時(shí),首先要識別待預(yù)測的用戶所歸的用戶類別,然后選擇對應(yīng)的負(fù)載預(yù) 測模型進(jìn)行負(fù)載預(yù)測,最后,匯總單個(gè)預(yù)測結(jié)果,得到最終總體預(yù)測結(jié)果。
[0055] 提取居民用電行為的屬性特征主要包括聚類屬性選擇、預(yù)測輸入變量提取。
[0056] 經(jīng)過數(shù)據(jù)分析和預(yù)實(shí)驗(yàn),本發(fā)明提取了各用戶日均用電量、第二階梯比例、第三階 梯比例與高溫敏感性四組聚類屬性,來反映居民一定時(shí)間段內(nèi)的負(fù)荷變化規(guī)律。
[0057]日均用電量主要取決于家庭所擁有的各類電器設(shè)備的數(shù)目,借此可推測居民的收 入水平。而收入水平接近的居民用電行為往往比較相似。
[0058] 第二階梯比例、第三階梯比例則可以反映用戶在過去幾個(gè)月內(nèi)用電的波動(dòng)性以及 對階梯電價(jià)機(jī)制的反映,捕獲階梯電價(jià)機(jī)制下各用戶長期的用電規(guī)律。比如,對價(jià)格較為敏 感的用戶,在快進(jìn)入下一階梯時(shí),會有意識地減少用電量,以避免進(jìn)入下一階梯,從而減少 總電價(jià)。
[0059] 此外,氣象因素,尤其是溫度,往往對居民用電變化產(chǎn)生影響。尤其是夏季持續(xù)高 溫,空調(diào)等家用電器使用頻率較高,日用電量往往大幅提高。高溫敏感性指標(biāo)反映用戶在高 溫天氣用電量的波動(dòng)情況。
[0060] 上述四組聚類屬性的計(jì)算方法為:
[0061] 日均用電量=總用電量/采樣總天數(shù);
[0062] 第二階梯比例=到達(dá)第二階梯月份數(shù)/總月份數(shù);
[0063] 第三階梯比例=到達(dá)第三階梯月份數(shù)/總月份數(shù);
[0064] 高溫敏感性=高溫日平均用電量/日均用電量;其中,本實(shí)施例所定義的高溫日 是指平均溫度大于等于25°C的日子。
[0065] 同時(shí),所有負(fù)載預(yù)測模型的輸入變量主要提取出過去七天的用電量與當(dāng)天的溫度 共計(jì)八個(gè)輸入屬性。其中,應(yīng)用歷史負(fù)荷數(shù)據(jù)對預(yù)測有益,因?yàn)榭梢允褂脻L動(dòng)預(yù)測方式進(jìn) 行。而如果溫度未知且需要預(yù)測,可以使用天氣預(yù)報(bào)數(shù)據(jù)或該地區(qū)過去幾年同一日的平均 溫度進(jìn)行估計(jì)。
[0066] 本發(fā)明提出的分類負(fù)載預(yù)測模型具有通用性與兼容性好的特點(diǎn),適用于不同聚類 方法與負(fù)載預(yù)測模型在本框架下自由組合,包括常用的聚類方法(K均值,自組織特征映射 神經(jīng)網(wǎng)絡(luò))、負(fù)載預(yù)測模型(回歸,時(shí)間序列,支持向量機(jī))。此外,不同的用戶類別可以采 用完全不同的負(fù)載預(yù)測模型來進(jìn)行負(fù)載預(yù)測,有助于對每個(gè)用戶類別采用最適合的負(fù)載預(yù) 測模型,將極大地提高分類負(fù)載預(yù)測模型的靈活性和預(yù)測精度。
[0067] 本實(shí)施例中,使用模糊C均值聚類算法(FCM)與自組織模糊神經(jīng)網(wǎng)絡(luò)(SOFNN)模 型結(jié)合的方法,進(jìn)行分類負(fù)載預(yù)測。
[0068] 相較于傳統(tǒng)的K-means聚類算法,F(xiàn)CM加入了模糊的概念,使得每一個(gè)輸入向量 (屬性特征)不再僅隸屬于某一個(gè)特定的聚類,而是以其隸屬度來表示其屬于不同聚類的 程度。即用戶的每個(gè)屬性特征隸屬于一個(gè)或多個(gè)用戶類別,以隸屬度表示其歸屬于不同用 戶類別的程度。
[0069] 另外,SOFNN的優(yōu)點(diǎn)在于:第一,簡單易用,即使使用者對模糊系統(tǒng)與神經(jīng)網(wǎng)絡(luò)認(rèn) 識不深,SOFNN也能自動(dòng)確定模型的結(jié)構(gòu),識別模型的參數(shù);第二,預(yù)測精度較高。
[0070] FCM的基本思想是通過不斷優(yōu)化目標(biāo)函數(shù)來獲得各樣本點(diǎn)對于所有聚類中心的隸 屬度,進(jìn)而確定樣本點(diǎn)的類屬,最終達(dá)到自動(dòng)對樣本數(shù)據(jù)聚類的目的。
[0071] 假設(shè)樣本集合為Z = {Zl,Z2,…,zN},N為樣本總數(shù)。將其分為C個(gè)模糊聚類組, 并且求出聚類中心集為V= {Vl,v2,…,vj,依據(jù)最小二乘法原理,采用以下優(yōu)化目標(biāo)函數(shù) 來劃分?jǐn)?shù)據(jù):
[0073] 其中,m為模糊調(diào)節(jié)參數(shù),Um是第η個(gè)樣本第c類的隸屬度,且 0彡Ucn彡1,U= [UJ是CXN維的矩陣。
[0074] 此外,在模糊聚類之前,需將提取出的特征屬性需進(jìn)行歸一化,即將這些的屬性值 映射到[0.1]之間,以去除不同量級對用戶用電量特征的影響。通常采用極大極小值法對 數(shù)據(jù)集進(jìn)行歸一化處理,處理方法如下:
[0076] 式中Zn'為采用極大極小值法歸一化后的第η樣本數(shù)據(jù),分別為數(shù) 據(jù)序列的最大值和最小值。
[0077] 負(fù)載預(yù)測模型基于自組織模糊神經(jīng)網(wǎng)絡(luò)模型,圖2所示,SOFNN模型包括輸入層、 橢球基函數(shù)(EBF)層、標(biāo)準(zhǔn)化層、加權(quán)平均層和輸出層構(gòu)成。其中,
[0078] (1)輸入層中的神經(jīng)元i = 1,2, · · ·,r表示輸入變量xi;
[0079] (2)EBF層中的神經(jīng)元j = 1,2,. . .,u表示一個(gè)模糊規(guī)則的前提,各神經(jīng)元將其中 所有隸屬函數(shù)的值相乘作為輸出結(jié)果Φ,,具體算法如下:
[0081] 式中,Clj表示隸屬函數(shù)的中心,δ 表示隸屬函數(shù)的寬度;
[0082] (3)標(biāo)準(zhǔn)化層中的神經(jīng)元個(gè)數(shù)一般與EBF層相同,其對應(yīng)的輸出結(jié)果Ψ,* :
[0084] (4)加權(quán)平均層中各個(gè)神經(jīng)元的輸出是將標(biāo)準(zhǔn)化層輸出結(jié)果乘以加權(quán)偏差W2,該 層神經(jīng)兀輸出結(jié)果為fj = w 2Ψ」。
[0085] (5)輸出層中的每個(gè)神經(jīng)元表示通過加總加權(quán)平均層中的輸出結(jié)果得到的變量, 因此,該層的輸出結(jié)果y為:
[0087] 自組織模糊神經(jīng)網(wǎng)絡(luò)(SOFNN)的學(xué)習(xí)過程主要包括參數(shù)學(xué)習(xí)與結(jié)構(gòu)學(xué)習(xí)。
[0088] 參數(shù)學(xué)習(xí)通過在線遞推最小二乘算法使得網(wǎng)絡(luò)快速收斂。
[0089] 結(jié)構(gòu)學(xué)習(xí)通過自動(dòng)地增加、修改或刪減橢球基函數(shù)層中的神經(jīng)元的自組織,找到 最為合適的神經(jīng)網(wǎng)絡(luò)規(guī)模。
[0090] 結(jié)構(gòu)學(xué)習(xí)主要包括三個(gè)關(guān)鍵步驟:
[0091] 1)增加神經(jīng)元;
[0092] 2)修剪神經(jīng)元;
[0093] 3)合并橢球基函數(shù)層中的隸屬度函數(shù)與模糊規(guī)則。
[0094] 因此,通過SOFNN中的參數(shù)學(xué)習(xí)與結(jié)構(gòu)學(xué)習(xí)算法,可以為每個(gè)聚類尋找最優(yōu)的網(wǎng) 絡(luò)結(jié)構(gòu)進(jìn)行預(yù)測。
[0095] 實(shí)施例
[0096] 本實(shí)施例以某地區(qū)533戶居民為對象進(jìn)行實(shí)例分析,由于該地區(qū)抄表日為11日, 我們以2014年4月11日至2015年1月10日的用電數(shù)據(jù)作為訓(xùn)練集,2015年1月11日至 2月10日的用電數(shù)據(jù)作為測試集來進(jìn)行實(shí)驗(yàn)。
[0097] 數(shù)據(jù)準(zhǔn)備階段主要包括:
[0098] (1)數(shù)據(jù)預(yù)處理:由于所收集的智能電表記錄的居民用電數(shù)據(jù)均為累計(jì)值,因此, 計(jì)算各用戶當(dāng)日用電量需要通過將當(dāng)日的用電累計(jì)值減去前一日的用電累計(jì)值;
[0099] (2)缺失值處理:預(yù)處理后需檢測數(shù)據(jù)中是否存在缺失的現(xiàn)象。通過計(jì)算用電缺 失時(shí)間段前后一天的累計(jì)電量之差,并按照缺失的天數(shù)進(jìn)行平均,將缺失的數(shù)據(jù)補(bǔ)齊;
[0100] (3)異常值處理:對超出設(shè)定的指標(biāo)閾值范圍的數(shù)據(jù)樣本進(jìn)行過濾,例如:路燈、 工業(yè)用戶與長期無主的住戶等。
[0101] FCM聚類分析
[0102] 傳統(tǒng)的FCM算法,需要用戶事先確定聚類個(gè)數(shù)。在聚類分析中,聚類個(gè)數(shù)的確定對 聚類結(jié)果將產(chǎn)生很大影響。為了客觀地確定合適的聚類個(gè)