基于最小二乘支持向量機(jī)模型的城市短期用水量預(yù)測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種城市用水量預(yù)測方法,特別是涉及一種基于最小二乘支持向量機(jī) 模型的城市短期用水量預(yù)測方法。
【背景技術(shù)】
[0002] 隨著城市化進(jìn)程的加快,城市規(guī)模和人口數(shù)量不斷增加,生產(chǎn)用水和居民生活用 水的需求越來越大。根據(jù)水利部的統(tǒng)計(jì)資料,中國660個(gè)城市中約有2/3已面臨水資源危 機(jī),預(yù)計(jì)到2030年,全國將會(huì)消耗水資源7500億立方米,約占可用水資源總量的90%。同 時(shí)中國也面臨著嚴(yán)重的水污染問題,中國地質(zhì)調(diào)查局報(bào)告表示,全國90%的地下水資源受 到污染,其中60%污染嚴(yán)重。如何有效的指導(dǎo)并做好水資源開發(fā)、城市用水規(guī)劃以及城市供 水系統(tǒng)的優(yōu)化調(diào)度工作,已成為城市發(fā)展亟需解決的問題。城市用水量預(yù)測能夠?qū)ξ磥硪?段時(shí)間的用水量進(jìn)行分析,如今在水資源規(guī)劃、用水管理以及對(duì)供水系統(tǒng)進(jìn)行科學(xué)調(diào)度等 方面發(fā)揮著越來越重要的指導(dǎo)作用。因此,研宄城市用水量預(yù)測技術(shù)和方法是實(shí)現(xiàn)水資源 可持續(xù)利用的重要工作。
[0003] 現(xiàn)階段水量預(yù)測方法主要有時(shí)間序列、人工神經(jīng)網(wǎng)絡(luò)、回歸分析、灰色模型、系統(tǒng) 動(dòng)力學(xué)等方法。時(shí)間序列預(yù)測方法基于歷史水量數(shù)據(jù)預(yù)測未來用水量,存在較為明顯的滯 后性,且無法反映氣象因素(溫度、降水量等)的影響。當(dāng)氣象等因素的突然變化導(dǎo)致用水 量波動(dòng)較大時(shí),無法及時(shí)跟蹤水量變化,導(dǎo)致預(yù)測效果較差。而人工神經(jīng)網(wǎng)絡(luò)存在以下不 足:1)有陷入局部極值的風(fēng)險(xiǎn),導(dǎo)致訓(xùn)練誤差較大;2)算法學(xué)習(xí)基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小,使得算 法的訓(xùn)練誤差最小,因而建立的網(wǎng)絡(luò)模型泛化能力不強(qiáng);3)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì)(例如隱含層 的層數(shù)和節(jié)點(diǎn)數(shù)的選擇)依賴先驗(yàn)知識(shí)和經(jīng)驗(yàn)。因此,在采用神經(jīng)網(wǎng)絡(luò)模型預(yù)測城市用水 量時(shí)誤差較大。回歸分析法是根據(jù)用水量與影響因素間的關(guān)系對(duì)應(yīng)模型,通過分析影響因 素的變化來對(duì)用水量的變化情況進(jìn)行預(yù)測,這些影響因素與用水量之間存在穩(wěn)定的變化關(guān) 系,是較為宏觀的影響,比如人口規(guī)模等。因此,該方法適用于長期預(yù)測。由于灰色模型對(duì) 數(shù)據(jù)量的要求不高,系統(tǒng)動(dòng)力學(xué)方法分析過程復(fù)雜、工作量大,主要用于預(yù)測城市長期用水 量。
[0004] 本領(lǐng)域技術(shù)人員致力于提供一種城市短期用水量預(yù)測方法,能夠需要滿足以下幾 點(diǎn)基本要求:(1)模型建立過程方便、易行;(2)能夠反映氣象因素(溫度、降水量等)和節(jié) 假日對(duì)用水量的影響;(3)能夠有效處理工程實(shí)際數(shù)據(jù)中數(shù)據(jù)缺失、數(shù)據(jù)異常等常見情況; (4) 預(yù)測方法精度高、泛化能力好,滿足工程應(yīng)用的要求。而現(xiàn)有預(yù)測技術(shù)和方法尚未能有 效地解決上述問題。
【發(fā)明內(nèi)容】
[0005] 針對(duì)上述預(yù)測方法中存在的不足,本發(fā)明的目的是提供一種基于最小二乘支持向 量機(jī)模型的城市短期用水量預(yù)測方法,該方法簡單易行,能同時(shí)反映用水量自身變化規(guī)律、 氣象因素(溫度、降水量等)和節(jié)假日等對(duì)用水量的影響,預(yù)測誤差滿足城市供水規(guī)劃、水 資源開發(fā)利用、供水系統(tǒng)科學(xué)調(diào)度。
[0006] 支持向量機(jī)是一種小樣本學(xué)習(xí)方法,實(shí)現(xiàn)了高效的從訓(xùn)練樣本到預(yù)測樣本的轉(zhuǎn)導(dǎo) 推理,算法簡單,且具有較好的"魯棒性"。
[0007] 最小二乘支持向量機(jī)是支持向量機(jī)的擴(kuò)展,目前已被廣泛地推廣至預(yù)測領(lǐng)域。 LS-SVM系統(tǒng)方法在解決小樣本,高維模式識(shí)別等問題中有著獨(dú)特的優(yōu)勢,具有較高的泛化 性能其將模型的訓(xùn)練過程歸結(jié)為線性方程組求解問題,大大提高了訓(xùn)練的速度,LS-SVM的 正規(guī)化參數(shù)和核參數(shù)影響模型的預(yù)測精度和泛化能力,可以兼顧經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍,取 得模型復(fù)雜性和學(xué)習(xí)能力之間的平衡。
[0008] 本發(fā)明提供一種基于最小二乘支持向量機(jī)模型的城市短期用水量預(yù)測方法,包括 以下步驟:
[0009] (1)獲取原始數(shù)據(jù),原始數(shù)據(jù)包括歷史用水量序列;
[0010] (2)對(duì)歷史用水量序列進(jìn)行預(yù)處理,以去除歷史用水量序列中的異常數(shù)據(jù);
[0011] (3)對(duì)預(yù)處理后的歷史用水量序列進(jìn)行相關(guān)性分析;
[0012] (4)采用最小二乘支持向量機(jī)方法,建立城市短期用水量預(yù)測模型,選取相關(guān)系數(shù) 大于設(shè)定值的一組歷史用水量的時(shí)間序列組合作為訓(xùn)練樣本集,對(duì)城市短期用水量預(yù)測模 型進(jìn)行訓(xùn)練;
[0013] (5)采用城市短期用水量預(yù)測模型進(jìn)行實(shí)時(shí)預(yù)測;
[0014] (6)計(jì)算預(yù)測誤差,如果預(yù)測誤差不滿足預(yù)測精度要求,對(duì)城市短期用水量預(yù)測模 型進(jìn)行改進(jìn)。
[0015] 進(jìn)一步地,步驟(1)獲取原始數(shù)據(jù)包括以下步驟:
[0016] (11)獲取一個(gè)城市供水管網(wǎng)中的一個(gè)支線在一個(gè)時(shí)間段內(nèi)的歷史用水量序列;
[0017] (12)獲取時(shí)間段內(nèi)每日的氣象數(shù)據(jù),包括最高氣溫和最低氣溫,計(jì)算最高氣溫與 最低氣溫的平均值作為日平均氣溫;
[0018] (13)從日歷中判斷時(shí)間段內(nèi)每日是否為節(jié)假日,獲得節(jié)假日因子。
[0019] 進(jìn)一步地,步驟(2)對(duì)歷史用水量序列進(jìn)行預(yù)處理包括以下步驟:
[0020] (21)異常數(shù)據(jù)包括突變跳點(diǎn)數(shù)據(jù),對(duì)歷史用水量序列中的突變跳點(diǎn)數(shù)據(jù)進(jìn)行處 理。
[0021] 進(jìn)一步地,步驟(21)對(duì)歷史用水量序列中的突變跳點(diǎn)數(shù)據(jù)進(jìn)行處理包括以下步 驟:
[0022] (211)采用流量閾值約束處理突變跳點(diǎn)數(shù)據(jù);
[0023] (212)采用相鄰值變化率閾值約束處理突變跳點(diǎn)數(shù)據(jù)。
[0024] 進(jìn)一步地,步驟(2)對(duì)歷史用水量序列進(jìn)行預(yù)處理還包括以下步驟:
[0025] (22)異常數(shù)據(jù)包括缺失數(shù)據(jù),對(duì)歷史用水量序列中的缺失數(shù)據(jù)進(jìn)行處理。
[0026] 進(jìn)一步地,步驟(22)對(duì)歷史用水量序列中的缺失數(shù)據(jù)進(jìn)行處理包括以下步驟:
[0027] (221)數(shù)據(jù)缺失率小于設(shè)定值,采用統(tǒng)計(jì)方法中的前后相鄰填充方法進(jìn)行缺失數(shù) 據(jù)填補(bǔ);
[0028] (222)數(shù)據(jù)缺失率大于或等于設(shè)定值,采用關(guān)聯(lián)規(guī)則算法的類均值填補(bǔ)算法進(jìn)行 缺失數(shù)據(jù)填補(bǔ),選取相關(guān)性最大的三個(gè)屬性作為標(biāo)準(zhǔn)數(shù)據(jù)對(duì)缺失屬性進(jìn)行分組,然后用各 組的均值去填補(bǔ)相應(yīng)的缺失數(shù)據(jù)。
[0029] 進(jìn)一步地,步驟(4)選取相關(guān)系數(shù)大于設(shè)定值的一組歷史用水量,其中設(shè)定值 為0. 75, 一組歷史用水量包括預(yù)測時(shí)刻前l(fā)h、23h、24h、25h、48h、72h、96h、120h、144h以及 168h的用水量,h為小時(shí)。
[0030] 進(jìn)一步地,原始數(shù)據(jù)還包括氣象數(shù)據(jù)和/或節(jié)假日因子,步驟(4)中作為訓(xùn)練樣本 集的時(shí)間序列組合還包括氣象數(shù)據(jù)和/或節(jié)假日因子。
[0031] 作為訓(xùn)練樣本集的時(shí)間序列組合還包括氣象數(shù)據(jù)和/或節(jié)假日因子,能夠綜合反 映氣象和/或節(jié)假日等因素對(duì)用水量的影響,從而提高城市短期用水量預(yù)測的精度。
[0032] 進(jìn)一步地,氣象數(shù)據(jù)為日平均溫度。
[0033] 進(jìn)一步地,步驟(6)對(duì)城市短期用水量預(yù)測模型進(jìn)行改進(jìn)為選擇最小二乘支持向 量機(jī)中核參數(shù)〇和正規(guī)化參數(shù)Y,包括以下步驟:
[0034] (61)采用精英策略kbest,只有較優(yōu)的粒子會(huì)影響其他粒子的位置及速度,加快 收斂速度;
[0035] (62)采用自適應(yīng)的慣性權(quán)重策略,按照粒子與最優(yōu)粒子的差距自適應(yīng)地改變位置 及速度,提高搜索能力;
[0036] (63)引入歷史最優(yōu)信息,結(jié)合了 PS0的個(gè)體歷史最優(yōu)及群體歷史最優(yōu)提高算法的 搜索能力。
[0037] 與現(xiàn)有技術(shù)相比,本發(fā)明提供的基于最小二乘支持向量機(jī)模型的城市短期用水量 預(yù)測方法,具有以下有益效果:
[0038] (1)對(duì)歷史用水量數(shù)據(jù)進(jìn)行了充分的預(yù)處理(包括修正和填補(bǔ)處理),盡可能使得 用水量序列保持原有的變化規(guī)律;
[0039] (2)城市用水系統(tǒng)是一個(gè)多變量非線性的動(dòng)態(tài)系統(tǒng)且無法建立精確模型。最小二 乘支持向量機(jī)方法對(duì)系統(tǒng)采取黑箱模擬的方式,能夠?qū)崿F(xiàn)對(duì)任意非線性函數(shù)的逼近,很好 地解決了供水系統(tǒng)非線性、無法建立精確模型等問題;且該方法建立在統(tǒng)計(jì)學(xué)習(xí)理論的VC 維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理上,能夠兼顧經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍,取得模型復(fù)雜性和學(xué)習(xí)能 力之間的平衡,具有更好的泛化能力;
[0040] (3)采用最小二乘支持向量機(jī)模型,輸入變量包括歷史用水量以及氣象數(shù)據(jù)和/ 或節(jié)假日因子,能夠綜合反映用水量自身變化規(guī)律的作用以及氣象和/或節(jié)假日等因素對(duì) 用水量的影響,從而提高城市短期用水量預(yù)測的精度。
【附圖說明】
[0041] 圖1是本發(fā)明的一個(gè)實(shí)施例的基于最小二乘支持向量機(jī)模型的城市短期用水量 預(yù)測方法的框圖;
[0042] 圖2是本發(fā)明針對(duì)高數(shù)據(jù)缺失率提出的類均值填補(bǔ)算法流程圖;
[0043] 圖3是本發(fā)明預(yù)測模型的數(shù)據(jù)樣本流量趨勢圖;
[0044] 圖4是本發(fā)明采用類均值填補(bǔ)算法進(jìn)行缺失數(shù)據(jù)填補(bǔ)的效果圖;
[0045] 圖5是本發(fā)明城市短期水量預(yù)測模型的預(yù)測效果圖。
【具體實(shí)施方式】
[0046] 以下將結(jié)合附圖對(duì)本發(fā)明的構(gòu)思、具體結(jié)構(gòu)及產(chǎn)生的技術(shù)效果作進(jìn)一步說明,以 充分地了解本發(fā)明的目的、特征和效果,但本發(fā)明的保護(hù)不僅限于此。
[0047] 本發(fā)明的一個(gè)實(shí)施例的基于最小二乘支持向量機(jī)模型的城市短期用水量預(yù)測方 法,包括以下步驟:
[0048] (1)獲取原始數(shù)據(jù),原始數(shù)據(jù)包括歷史用水量序列;
[0049] (2)對(duì)歷史用水量序列進(jìn)行預(yù)處理,以去除歷史用水量序列中的異常數(shù)據(jù);
[0050] (3)對(duì)預(yù)處理后的歷史用水量序列進(jìn)行相關(guān)性分析;
[0051] (4)采用最小二乘支持向量機(jī)方法,建立城市短期用水量預(yù)測模型,選取相關(guān)系數(shù) 大于設(shè)定值的一組歷史用水量的時(shí)間序列組合作為訓(xùn)練樣本集,對(duì)城市短期用水量預(yù)測模 型進(jìn)行訓(xùn)練;
[0052] (5)采用城市短期用水量預(yù)測模型進(jìn)行實(shí)時(shí)預(yù)測;
[0053] (6)計(jì)算預(yù)測誤差,如果預(yù)測誤差不滿足預(yù)測精度要求,對(duì)城市短期用水量預(yù)測模 型進(jìn)行改進(jìn)。
[0054] 步驟⑴獲取原始數(shù)據(jù)包括以下步驟:
[0055] (11)獲取一個(gè)城市供水管網(wǎng)中的一個(gè)支線在一個(gè)時(shí)間段內(nèi)的歷史用水量序列;
[0056] (12)獲取時(shí)間段內(nèi)每日的氣象數(shù)據(jù),包括最高氣溫和最低氣溫,計(jì)算最高氣溫與 最低氣溫的平均值作為日平均氣溫;
[0057] (13)從日歷中判斷時(shí)間段內(nèi)每日是否為節(jié)假日,獲得節(jié)假日因子。
[0058] 步驟(2)對(duì)歷史用水量序列進(jìn)行預(yù)處理包括以下步驟:
[0059] (21)異常數(shù)據(jù)包括突變跳點(diǎn)數(shù)據(jù),對(duì)歷史用水量序列中的突變跳點(diǎn)數(shù)據(jù)進(jìn)行處 理。
[0060] 突變跳點(diǎn)數(shù)據(jù)是指:某時(shí)刻或時(shí)間段的用水量與前后相鄰時(shí)刻或時(shí)間段用水量的 偏差值超過一定閾值,則認(rèn)為該時(shí)刻或時(shí)間段用水量為異常數(shù)據(jù)。
[0061] 本實(shí)施例中,設(shè)定前后數(shù)據(jù)的偏差閾值0為平均用水量的10%,若超過這一閾 值,則采取數(shù)據(jù)修正或數(shù)據(jù)填補(bǔ)操作。
[00