本發(fā)明涉及數(shù)據(jù)處理的,具體為一種基于物聯(lián)網(wǎng)的水利水位數(shù)據(jù)采集與傳輸系統(tǒng)及方法。
背景技術(shù):
1、水利水位數(shù)據(jù)采集對農(nóng)業(yè)灌溉、洪水預(yù)警和防災(zāi)減災(zāi)具有重要影響,但是傳統(tǒng)水利水位數(shù)據(jù)測量方法費(fèi)時費(fèi)力,對水尺進(jìn)行目測讀數(shù),水利水位數(shù)據(jù)誤差大,安全性較低;同時水面上干擾較多,不利于實(shí)時測量出水利水位數(shù)據(jù),得到的水利水位數(shù)據(jù)缺失異常數(shù)據(jù)多,導(dǎo)致測量結(jié)果不正確。
2、公開號為cn117972357a的中國發(fā)明專利申請公開了一種水位測量裝置的水位監(jiān)測數(shù)據(jù)智能處理方法。該方法具體包括:首先設(shè)定一個水位監(jiān)控數(shù)據(jù)作為目標(biāo)數(shù)據(jù)點(diǎn),以所述目標(biāo)數(shù)據(jù)點(diǎn)為起點(diǎn)構(gòu)建待壓縮數(shù)據(jù)區(qū)間,在所述待壓縮數(shù)據(jù)區(qū)間內(nèi)設(shè)定抽稀閾值;其次根據(jù)待壓縮數(shù)據(jù)區(qū)間內(nèi)水位增量獲得待壓縮數(shù)據(jù)區(qū)間的抽稀閾值調(diào)整系數(shù),根據(jù)待壓縮數(shù)據(jù)區(qū)間的峰谷值點(diǎn)的差異確定壓縮數(shù)據(jù)區(qū)間的峰谷值點(diǎn)的轉(zhuǎn)折異常可能性,由轉(zhuǎn)折異常可能性生成壓縮數(shù)據(jù)區(qū)間的約束參數(shù);再根據(jù)所述抽稀閾值調(diào)整系數(shù)和約束參數(shù)獲取修正抽稀閾值,最后由所述修正抽稀閾值根據(jù)道格拉斯普克壓縮模型對水位數(shù)據(jù)進(jìn)行壓縮處理,獲取水位數(shù)據(jù)。但是該方法沒有使用物聯(lián)網(wǎng)等高新技術(shù),沒有實(shí)現(xiàn)水位數(shù)據(jù)實(shí)時獲取,同時也不能實(shí)現(xiàn)水位數(shù)據(jù)預(yù)測。
技術(shù)實(shí)現(xiàn)思路
1、針對相關(guān)技術(shù)中的問題,本發(fā)明提供了一種基于物聯(lián)網(wǎng)的水利水位數(shù)據(jù)采集與傳輸系統(tǒng)及方法,以克服現(xiàn)有相關(guān)技術(shù)所存在的上述技術(shù)問題。
2、為解決上述技術(shù)問題,本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的:
3、本發(fā)明為一種基于物聯(lián)網(wǎng)的水利水位數(shù)據(jù)采集與傳輸方法,包括如下步驟:
4、s1、獲取實(shí)時水尺圖像,對所述實(shí)時水尺圖像進(jìn)行切割,得到刻度線區(qū)域圖像和數(shù)字區(qū)域圖像,對所述刻度線區(qū)域圖像進(jìn)行圖像處理實(shí)現(xiàn)刻度識別,對所述數(shù)字區(qū)域圖像進(jìn)行分割字符和13點(diǎn)特征值提取法處理后使用bp神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)字識別,得到待處理的水利水位數(shù)據(jù)集合;
5、s2、對所述待處理水利水位數(shù)據(jù)集合進(jìn)行擬合確定平滑系數(shù),使用雙向指數(shù)平滑修復(fù)法對待處理水利水位數(shù)據(jù)集合中缺失數(shù)據(jù)進(jìn)行填充,得到處理好的水利水位數(shù)據(jù)集合,并引入誤差系數(shù)評價處理好的水利水位數(shù)據(jù)集合;
6、s3、由所述處理好的水利水位數(shù)據(jù)集合生成水利水位數(shù)據(jù)矩陣,使用孤立森林算法和三支聚類算法找到異常數(shù)據(jù)后刪除異常數(shù)據(jù),并基于紅嘴藍(lán)鵲優(yōu)化算法尋找最優(yōu)初始聚類中心,得到最終水利水位數(shù)據(jù)集合;
7、s4、將往年水利水位數(shù)據(jù)集合分成水利水位樣本集和水利水位測試集,對lstm神經(jīng)網(wǎng)絡(luò)預(yù)測模型進(jìn)行訓(xùn)練,得到最終lstm神經(jīng)網(wǎng)絡(luò)預(yù)測模型,使用所述最終水利水位數(shù)據(jù)集合對水利水位數(shù)據(jù)進(jìn)行預(yù)測。
8、該發(fā)明通過獲取實(shí)時水尺圖像并對實(shí)時水尺圖像進(jìn)行切割,分成刻度線區(qū)域圖像和數(shù)字區(qū)域圖像,對所述刻度線區(qū)域圖像進(jìn)行形態(tài)學(xué)處理,將刻度線像素點(diǎn)進(jìn)行四鄰?fù)ㄌ幚?,利用貼標(biāo)簽的方法得到刻度線根數(shù),提高了識別速度及正確性;再對所述數(shù)字區(qū)域圖像進(jìn)行分割字符和13點(diǎn)特征值提取法處理,提取數(shù)字區(qū)域圖像的13個特征值,輸入bp神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,進(jìn)行數(shù)字識別,得到水利水位數(shù)據(jù)集合,具有良好容錯性和自適應(yīng)能力;其次對水利水位數(shù)據(jù)集合中缺失數(shù)據(jù)使用指數(shù)平滑修復(fù)法進(jìn)行填充,通過獲取平滑系數(shù)對缺失數(shù)據(jù)的正向和反向預(yù)測,使用預(yù)測值填補(bǔ)缺失數(shù)據(jù),有效地提高了水利水位數(shù)據(jù)地精度;再對水利水位數(shù)據(jù)集合中異常數(shù)據(jù)使用孤立森林算法和三支聚類算法進(jìn)行異常刪除,基于紅嘴藍(lán)鵲優(yōu)化算法尋找三支聚類算法中的最優(yōu)初始聚類中心,通過紅嘴藍(lán)鵲覓食過程中不斷更新位置找最佳適應(yīng)度函數(shù)值,該新型算法收斂速度快,具有很強(qiáng)的開發(fā)能力,消除了隨機(jī)尋找初始聚類中心的影響,提高了聚類結(jié)果的準(zhǔn)確性;最后用往年水利水位數(shù)據(jù)對lstm神經(jīng)網(wǎng)絡(luò)預(yù)測模型進(jìn)行訓(xùn)練,實(shí)現(xiàn)對水利水位數(shù)據(jù)的預(yù)測。
9、優(yōu)選地,所述s1包括以下步驟:
10、s11、獲取實(shí)時水尺圖像,設(shè)定所述實(shí)時水尺圖像的橫向特征維度為,縱向特征維度為,生成實(shí)時水尺圖像矩陣如下,
11、,
12、其中,表示實(shí)時水尺圖像中橫向特征維度為,縱向特征維度為的像素點(diǎn);
13、設(shè)定實(shí)時水尺圖像的垂直投影函數(shù),當(dāng)實(shí)時水尺圖像的垂直投影函數(shù)取最小值時對應(yīng)的橫坐標(biāo)數(shù)值為,以橫坐標(biāo)數(shù)值將所述實(shí)時水尺圖像矩陣分成第一分割矩陣和第二分割矩陣;將所述第一分割矩陣內(nèi)的像素點(diǎn)填充為白色,得到刻度線區(qū)域圖像,再將所述第二分割矩陣內(nèi)的像素點(diǎn)填充為白色,得到數(shù)字區(qū)域圖像,完成實(shí)時水尺圖像切割;
14、s12、對所述刻度線區(qū)域圖像進(jìn)行刻度識別,具體過程如下:
15、s121、設(shè)定所述刻度線區(qū)域圖像的橫向特征維度為,縱向特征維度為,生成刻度線區(qū)域圖像矩陣如下,
16、,
17、其中,表示刻度線區(qū)域圖像中橫向特征維度為,縱向特征維度為的像素點(diǎn);
18、對所述刻度線區(qū)域圖像進(jìn)行腐蝕操作,設(shè)定結(jié)構(gòu)元素,所述結(jié)構(gòu)元素包含原點(diǎn),選擇所述刻度線區(qū)域圖像矩陣中像素點(diǎn);將所述原點(diǎn)移動到刻度線區(qū)域圖像矩陣中像素點(diǎn)處,當(dāng)刻度線區(qū)域圖像矩陣中像素點(diǎn)完全包含原點(diǎn),則將刻度線區(qū)域圖像矩陣中像素點(diǎn)記為1,否則將刻度線區(qū)域圖像矩陣中像素點(diǎn)記為0,得到腐蝕處理后的刻度線區(qū)域圖像;再將腐蝕處理后的刻度線區(qū)域圖像進(jìn)行開運(yùn)算處理,得到去噪后的刻度線區(qū)域圖像;
19、s122、由所述去噪后的刻度線區(qū)域圖像生成去噪后的刻度線區(qū)域圖像矩陣,設(shè)定圖像標(biāo)簽且標(biāo)簽值為0,已貼好圖像標(biāo)簽數(shù),去噪后的刻度線區(qū)域圖像貼標(biāo)簽后得到圖像;在所述去噪后的刻度線區(qū)域圖像矩陣依次掃描尋找像素值為1的像素點(diǎn),更新已貼好圖像標(biāo)簽數(shù);將所述像素值為0的像素點(diǎn)記為沒有貼標(biāo)簽的像素點(diǎn),設(shè)定沒有貼標(biāo)簽的像素點(diǎn)的右下、正下、左下和左邊的四鄰?fù)?biāo)簽組成鄰?fù)ㄓ?;?dāng)所述鄰?fù)ㄓ虻臉?biāo)簽值等于0,則,圖像中像素點(diǎn)個數(shù)為;當(dāng)所述鄰?fù)ㄓ虻臉?biāo)簽值為1種時,則圖像中像素點(diǎn)個數(shù)為;當(dāng)所述鄰?fù)ㄓ虻臉?biāo)簽值為2種時,此時標(biāo)簽值為和,將標(biāo)簽值替換成且;重復(fù)s122將去噪后的刻度線區(qū)域圖像矩陣中像素點(diǎn)處理完畢,得到處理后的刻度線區(qū)域圖像矩陣;
20、統(tǒng)計相同標(biāo)簽值的像素點(diǎn)個數(shù),再計算鄰?fù)ㄓ虻钠骄袼攸c(diǎn)個數(shù),設(shè)定像素點(diǎn)閾值為,當(dāng)所述相同標(biāo)簽值的像素點(diǎn)個數(shù)和鄰?fù)ㄓ虻钠骄袼攸c(diǎn)個數(shù)的差的絕對值大于,則將鄰?fù)ㄓ騼?nèi)像素點(diǎn)的像素值修改為0且;否則不修改鄰?fù)ㄓ騼?nèi)像素點(diǎn)的像素值,得到更新后的已貼好圖像標(biāo)簽數(shù),當(dāng)不是連續(xù)編號時,對更新后的已貼好圖像標(biāo)簽數(shù)進(jìn)行編碼映射操作,得到修正后的已貼好圖像標(biāo)簽數(shù);選擇所述修正后的已貼好圖像標(biāo)簽數(shù)的最大標(biāo)簽號,將最大標(biāo)簽號記為刻度線根數(shù),實(shí)現(xiàn)刻度識別;
21、s13、對所述數(shù)字區(qū)域圖像進(jìn)行數(shù)字識別,具體過程如下:
22、s131、設(shè)定所述數(shù)字區(qū)域圖像的橫向特征維度為,縱向特征維度為,生成數(shù)字區(qū)域圖像矩陣如下,
23、,
24、其中,表示數(shù)字區(qū)域圖像中橫向特征維度為,縱向特征維度為的像素點(diǎn);
25、對所述數(shù)字區(qū)域圖像矩陣進(jìn)行從上到下、從左到右的掃描,得到每行黑色像素點(diǎn)個數(shù)和投影直方圖,所述投影直方圖存在間隙,所述間隙即行分割點(diǎn),以行分割點(diǎn)對數(shù)字區(qū)域圖像矩陣進(jìn)行分割,選取行分割后的數(shù)字區(qū)域圖像最下面行的字符,記為行分割字符;再將所述行分割字符在列上進(jìn)行輪廓投影,所述輪廓投影存在間隔,以所述間隔對行分割字符進(jìn)行列分割,得到分割字符圖像;
26、將所述分割字符圖像歸一化處理,得到歸一化分割字符圖像,使用三次樣條插值法對歸一化分割字符圖像進(jìn)行大小變換,得到標(biāo)準(zhǔn)分割字符圖像;設(shè)定所述標(biāo)準(zhǔn)分割字符圖像生成標(biāo)準(zhǔn)分割字符圖像矩陣,將所述標(biāo)準(zhǔn)分割字符圖像矩陣劃分成2×4大小相同的子矩陣,統(tǒng)計所述子矩陣中黑色像素點(diǎn)的個數(shù),得到子矩陣中黑色像素點(diǎn)的8個特征值;再統(tǒng)計所述標(biāo)準(zhǔn)分割字符圖像矩陣水平方向中間兩列和豎直方向中間兩列的黑色像素點(diǎn)的個數(shù),得到標(biāo)準(zhǔn)分割字符圖像矩陣水平方向中間兩列和豎直方向中間兩列的4個特征值;再統(tǒng)計所述標(biāo)準(zhǔn)分割字符圖像矩陣的黑色像素點(diǎn)的個數(shù),得到標(biāo)準(zhǔn)分割字符圖像矩陣的1個特征值,得到13個特征值,記為待處理的特征值;
27、s132、設(shè)定bp(后向傳播)神經(jīng)網(wǎng)絡(luò)輸入層節(jié)點(diǎn)數(shù)為13,激活函數(shù)為sigmoid函數(shù),輸出層節(jié)點(diǎn)數(shù)為4,將所述bp神經(jīng)網(wǎng)絡(luò)中的0修正為0.1,1修正為0.9,輸出層輸出8421碼;設(shè)定學(xué)習(xí)率為,期望誤差為,當(dāng)前迭代次數(shù)為,最大迭代次數(shù)為,獲取訓(xùn)練樣本集,所述訓(xùn)練樣本集中樣本數(shù)據(jù)包含13個特征值;將訓(xùn)練樣本集輸入到bp神經(jīng)網(wǎng)絡(luò)中,設(shè)定誤差閾值為,當(dāng)小于且當(dāng)前迭代次數(shù)等于最大迭代次數(shù)時,得到訓(xùn)練好的bp神經(jīng)網(wǎng)絡(luò);否則調(diào)整權(quán)值直至小于且當(dāng)前迭代次數(shù)等于最大迭代次數(shù);將所述待處理的特征值輸入訓(xùn)練好的bp神經(jīng)網(wǎng)絡(luò)中,輸出離水面最近的數(shù)字,完成數(shù)字識別;
28、s14、設(shè)定所述刻度線根數(shù)為,所述離水面最近的數(shù)字為,水尺精度為,則水利水位計算公式如下,
29、
30、由所述水利水位組成待處理的水利水位數(shù)據(jù)集合。
31、該發(fā)明通過獲取實(shí)時水尺圖像并對實(shí)時水尺圖像進(jìn)行切割,分成刻度線區(qū)域圖像和數(shù)字區(qū)域圖像,對所述刻度線區(qū)域圖像進(jìn)行形態(tài)學(xué)處理,將刻度線像素點(diǎn)進(jìn)行四鄰?fù)?,利用貼標(biāo)簽的方法得到刻度線根數(shù),方法巧妙簡便,提高了識別速度及正確性;再對所述數(shù)字區(qū)域圖像進(jìn)行分割字符和13點(diǎn)特征值提取法處理,提取數(shù)字區(qū)域圖像13個特征值,再輸入bp神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,進(jìn)行數(shù)字識別,提高了字符提取識別效率。
32、優(yōu)選地,所述s2包括以下步驟:
33、s21、將所述待處理的水利水位數(shù)據(jù)集合中的待處理的水利水位數(shù)據(jù)進(jìn)行
34、一階差分和二階差分運(yùn)算,得到一階差分結(jié)果和二階差分結(jié)果,將一階差分結(jié)果和二階差分結(jié)果進(jìn)行擬合,得到平滑系數(shù);選定待處理的水利水位數(shù)據(jù)集合中的時刻缺失數(shù)據(jù),設(shè)定時刻參數(shù)為、和,則時刻、時刻和時刻預(yù)測值計算公式如下,
35、
36、其中,表示時刻、時刻和時刻預(yù)測值,且;
37、當(dāng)時,得到1時刻、2時刻和3時刻預(yù)測值,結(jié)合所述平滑系數(shù)得到初始估算值,用所述初始估算值替換待處理的水利水位數(shù)據(jù)集合中的初始水利水位數(shù)據(jù)得到替換后的水利水位數(shù)據(jù)集合;
38、s22、設(shè)定所述替換后的水利水位數(shù)據(jù)集合,其中表示時刻水利水位數(shù)據(jù);設(shè)定時刻缺失數(shù)據(jù)為,將替換后的水利水位數(shù)據(jù)集合分割成正向預(yù)測集合和反向預(yù)測集合,其中表示時刻缺失數(shù)據(jù)的前一位數(shù)據(jù),表示時刻缺失數(shù)據(jù)的后一位數(shù)據(jù),對所述正向預(yù)測集合進(jìn)行正向預(yù)測,對所述反向預(yù)測集合進(jìn)行反向預(yù)測,計算公式如下,
39、
40、
41、其中,表示時刻的正向預(yù)測值,表示時刻的反向預(yù)測值,正向預(yù)測參數(shù)為、和,反向預(yù)測參數(shù)為、和,,;
42、將所述時刻的正向預(yù)測值和時刻的反向預(yù)測值進(jìn)行加權(quán)求和后計算均值,得到最終預(yù)測結(jié)果,所述最終預(yù)測結(jié)果即時刻缺失數(shù)據(jù),使用最終預(yù)測結(jié)果對替換后的水利水位數(shù)據(jù)集合缺失數(shù)據(jù)進(jìn)行填充;
43、s23、重復(fù)s22計算替換后的水利水位數(shù)據(jù)集合中的缺失數(shù)據(jù),得到最終預(yù)測結(jié)果集,以所述最終預(yù)測結(jié)果集填充替換后的水利水位數(shù)據(jù)集合得到處理后的水利水位數(shù)據(jù)集合;對處理后的水利水位數(shù)據(jù)集合進(jìn)行擬合得到擬合數(shù)據(jù)集,計算擬合數(shù)據(jù)集和所述待處理的水利水位數(shù)據(jù)集合的誤差系數(shù),設(shè)定擬合數(shù)據(jù)集中擬合數(shù)據(jù)為,擬合數(shù)據(jù)集中擬合數(shù)據(jù)平均值為,待處理的水利水位數(shù)據(jù)集合中待處理的水利水位數(shù)據(jù)為,計算公式如下,
44、,
45、其中,表示誤差系數(shù),表示擬合數(shù)據(jù)集中第個擬合數(shù)據(jù),表示擬合數(shù)據(jù)集中第個擬合數(shù)據(jù)平均值,表示待處理的水利水位數(shù)據(jù)集合中第個待處理的水利水位數(shù)據(jù),;
46、設(shè)定第一閾值為,當(dāng)所述誤差系數(shù)小于時,所述最終預(yù)測結(jié)果集準(zhǔn)確,得到處理好的水利水位數(shù)據(jù)集合;否則最終預(yù)測結(jié)果集不準(zhǔn)確,重復(fù)s21和s22直至誤差系數(shù)小于。
47、該發(fā)明通過對缺失數(shù)據(jù)使用指數(shù)平滑修復(fù)法進(jìn)行填充,先對水利水位數(shù)據(jù)集合中數(shù)據(jù)進(jìn)行擬合獲取平滑系數(shù),得到初始預(yù)測值,再對缺失數(shù)據(jù)的正向預(yù)測和反向預(yù)測,加權(quán)求和得到預(yù)測值即缺失數(shù)據(jù),使用預(yù)測值填補(bǔ)缺失數(shù)據(jù),并引入誤差系數(shù)評價預(yù)測值的準(zhǔn)確性,有效地提高了水利水位數(shù)據(jù)地精度。
48、優(yōu)選地,所述s3包括以下步驟:
49、s31、設(shè)定所述處理好的水利水位數(shù)據(jù)集合為,其中表示第個處理好的水利水位數(shù)據(jù),處理好的水利水位數(shù)據(jù)的特征維度為,生成水利水位數(shù)據(jù)矩陣如下,
50、,
51、其中,表示第個、特征維度為的處理好的水利水位數(shù)據(jù);
52、選取所述水利水位數(shù)據(jù)矩陣中一列作為水利水位抽樣樣本集,記為,其中表示第個、特征維度為的水利水位抽樣樣本數(shù)據(jù),使用孤立森林算法計算所述水利水位抽樣樣本集的異常得分,設(shè)定第二閾值為,當(dāng)水利水位抽樣樣本集的異常得分大于時,將水利水位抽樣樣本集的異常得分對應(yīng)的水利水位樣本數(shù)據(jù)加入到正常水利水位樣本數(shù)據(jù)集,否則將水利水位抽樣樣本集的異常得分對應(yīng)的水利水位樣本數(shù)據(jù)加入到異常水利水位樣本數(shù)據(jù)集,并舍棄所述異常水利水位樣本數(shù)據(jù)集;
53、s32、對所述正常水利水位樣本數(shù)據(jù)集使用三支聚類算法,選擇個樣本數(shù)據(jù)作為初始聚類中心得到類簇集合,計算正常水利水位樣本數(shù)據(jù)集中樣本數(shù)據(jù)到初始聚類中心的距離,記為,將最小的對應(yīng)的正常水利水位樣本數(shù)據(jù)集中樣本數(shù)據(jù)加入到類簇集合中,使用紅嘴藍(lán)鵲優(yōu)化算法在所述類簇集合中尋找最優(yōu)初始聚類中心,具體過程如下:
54、s321、設(shè)定類簇集合包含個樣本數(shù)據(jù),樣本數(shù)據(jù)的特征維度為,在紅嘴藍(lán)鵲種群中,紅嘴藍(lán)鵲種群規(guī)模為,紅嘴藍(lán)鵲的特征維度為,設(shè)定表示紅嘴藍(lán)鵲在維上限,表示紅嘴藍(lán)鵲在維下限,表示隨機(jī)數(shù)且,紅嘴藍(lán)鵲初始位置計算公式如下,
55、
56、s322、設(shè)定適應(yīng)度函數(shù)為,其中表示類簇集合中的樣本個數(shù),表示類簇集合的個數(shù),表示類簇集合中第個樣本的質(zhì)心,表示類簇集合的質(zhì)心,表示類簇集合中第個樣本數(shù)據(jù),,;
57、紅嘴藍(lán)鵲在尋找食物過程中,設(shè)定當(dāng)前迭代次數(shù)為,第次迭代食物位置為,紅嘴藍(lán)鵲種群數(shù)為,紅嘴藍(lán)鵲種群中隨機(jī)選擇紅嘴藍(lán)鵲個體位置為,第次迭代紅嘴藍(lán)鵲種群中隨機(jī)選擇紅嘴藍(lán)鵲個體位置為,表示隨機(jī)數(shù)且,則第次迭代紅嘴藍(lán)鵲位置計算公式如下,
58、
59、其中,表示紅嘴藍(lán)鵲種群中第個紅嘴藍(lán)鵲個體位置,表示第次迭代紅嘴藍(lán)鵲位置,表示第次迭代紅嘴藍(lán)鵲位置,;
60、紅嘴藍(lán)鵲在尋找食物過程中不斷移動位置,所述類簇集合不斷迭代尋找最小適應(yīng)度函數(shù)值;
61、s323、紅嘴藍(lán)鵲在攻擊食物過程中,此時更新適應(yīng)度函數(shù)值,設(shè)定食物位置為,食物系數(shù)為,表示正態(tài)分布隨機(jī)數(shù),最大迭代次數(shù)為,則第次迭代紅嘴藍(lán)鵲更新位置計算公式如下,
62、,
63、;
64、紅嘴藍(lán)鵲將食物存儲,當(dāng)?shù)诖蔚倪m應(yīng)度函數(shù)值小于第次迭代的適應(yīng)度函數(shù)值,保存第次迭代的適應(yīng)度函數(shù)值;不斷更新適應(yīng)度函數(shù)值,當(dāng)當(dāng)前迭代次數(shù)等于最大迭代次數(shù),停止迭代,得到最佳紅嘴藍(lán)鵲位置,所述最佳紅嘴藍(lán)鵲位置即所述最優(yōu)初始聚類中心;
65、s33、計算所述正常水利水位樣本數(shù)據(jù)集中樣本數(shù)據(jù)到所述最優(yōu)初始聚類中心的隸屬度,得到隸屬度集合,將所述隸屬度集合分成核心域和邊界域,設(shè)定第三閾值為,將隸屬度集合中隸屬度大于對應(yīng)的聚類中心加入到核心域,隸屬度集合中隸屬度小于或者等于對應(yīng)的聚類中心加入到邊界域;計算正常水利水位樣本數(shù)據(jù)集中樣本數(shù)據(jù)的平均值作為新的聚類中心,重復(fù)s33直至聚類中心不再改變,完成正常水利水位樣本數(shù)據(jù)集的聚類,刪除所述邊界域中隸屬度對應(yīng)的正常水利水位樣本數(shù)據(jù)集中的樣本數(shù)據(jù),完成異常數(shù)據(jù)刪除,得到最終水利水位數(shù)據(jù)集合。
66、該發(fā)明通過對水利水位數(shù)據(jù)集合中異常數(shù)據(jù)使用孤立森林算法和三支聚類算法進(jìn)行異常刪除,將異常值和正常值區(qū)分聚類,再基于紅嘴藍(lán)鵲優(yōu)化算法尋找三支聚類算法中的最優(yōu)初始聚類中心,消除了隨機(jī)尋找初始聚類中心的影響,提高了聚類結(jié)果的準(zhǔn)確性,紅嘴藍(lán)鵲優(yōu)化算法收斂速度快,具有很強(qiáng)的開發(fā)能力。
67、優(yōu)選地,所述s4包括以下步驟:
68、s41、獲取往年水利水位數(shù)據(jù),組成往年水利水位數(shù)據(jù)集合為,其中表示往年第個水利水位數(shù)據(jù),將往年水利水位數(shù)據(jù)集合分成水利水位樣本集和水利水位測試集,其中表示往年第個水利水位數(shù)據(jù);將所述水利水位樣本集輸入到lstm(長短期記憶)神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,水利水位樣本集中樣本數(shù)據(jù)通過輸入門更新細(xì)胞狀態(tài),再通過遺忘門的sigmoid激活函數(shù)處理后輸入到輸入門,細(xì)胞狀態(tài)輸出預(yù)測值;
69、設(shè)定lstm神經(jīng)網(wǎng)絡(luò)的均方根誤差和學(xué)習(xí)率,均方根誤差閾值為,當(dāng)均方根誤差小于時,lstm神經(jīng)網(wǎng)絡(luò)停止迭代,得到lstm神經(jīng)網(wǎng)絡(luò)預(yù)測模型,否則調(diào)整權(quán)重直至均方根誤差小于;再將所述水利水位測試集輸入lstm神經(jīng)網(wǎng)絡(luò)預(yù)測模型中,設(shè)定精度閾值為,當(dāng)輸出結(jié)果的精度大于時,停止迭代,得到最終lstm神經(jīng)網(wǎng)絡(luò)預(yù)測模型,否則重復(fù)s41和s42直至輸出結(jié)果的精度大于;將所述最終水利水位數(shù)據(jù)集合輸入到最終lstm神經(jīng)網(wǎng)絡(luò)預(yù)測模型中,輸出水利水位預(yù)測值,實(shí)現(xiàn)水利水位數(shù)據(jù)預(yù)測,并將處理好的水利水位數(shù)據(jù)集合和水利水位預(yù)測值上傳水利水位監(jiān)控平臺。
70、該發(fā)明通過將往年水利水位數(shù)據(jù)分成訓(xùn)練集和測試集,使用訓(xùn)練集和測試集對lstm神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和驗(yàn)證,得到最終lstm神經(jīng)網(wǎng)絡(luò)預(yù)測模型,實(shí)現(xiàn)對水利水位數(shù)據(jù)的預(yù)測,lstm神經(jīng)網(wǎng)絡(luò)通過隱藏單元加入復(fù)雜門控機(jī)制的循環(huán)網(wǎng)絡(luò)架構(gòu),保持信息的長期存儲,預(yù)測效果高于其他神經(jīng)網(wǎng)絡(luò)。
71、本實(shí)施例還公開了一種基于物聯(lián)網(wǎng)的水利水位數(shù)據(jù)采集與傳輸方法的系統(tǒng),具體包括:實(shí)時水尺圖像識別處理模塊、水利水位缺失數(shù)據(jù)填充模塊、水利水位異常數(shù)據(jù)刪除模塊和水利水位數(shù)據(jù)預(yù)測模塊;
72、所述實(shí)時水尺圖像識別處理模塊用于分別處理識別實(shí)時水尺圖像的刻度和數(shù)字,計算水利水位數(shù)據(jù);
73、所述水利水位缺失數(shù)據(jù)填充模塊用于使用雙向指數(shù)平滑修復(fù)法對待處理水利水位數(shù)據(jù)集合中缺失數(shù)據(jù)進(jìn)行填充;
74、所述水利水位異常數(shù)據(jù)刪除模塊用于使用孤立森林算法和三支聚類算法找到異常數(shù)據(jù)后刪除異常數(shù)據(jù);
75、所述水利水位數(shù)據(jù)預(yù)測模塊用于使用lstm神經(jīng)網(wǎng)絡(luò)預(yù)測模型對水利水位數(shù)據(jù)進(jìn)行預(yù)測。
76、本發(fā)明具備以下有益效果:
77、1.該發(fā)明通過獲取實(shí)時水尺圖像并對實(shí)時水尺圖像進(jìn)行切割,分成刻度線區(qū)域圖像和數(shù)字區(qū)域圖像,對所述刻度線區(qū)域圖像進(jìn)行形態(tài)學(xué)處理,提高了識別速度及正確性;再對所述數(shù)字區(qū)域圖像進(jìn)行分割字符和13點(diǎn)特征值提取法處理,再輸入bp神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,實(shí)現(xiàn)數(shù)字識別,提高字符提取識別效率。
78、2.該發(fā)明對水利水位數(shù)據(jù)集合中缺失數(shù)據(jù)使用指數(shù)平滑修復(fù)法進(jìn)行填充,通過獲取平滑系數(shù)對缺失數(shù)據(jù)的正向和反向預(yù)測,使用預(yù)測值填補(bǔ)缺失數(shù)據(jù),有效地提高了水利水位數(shù)據(jù)的精度。
79、3.該發(fā)明通過對水利水位數(shù)據(jù)集合中異常數(shù)據(jù)使用孤立森林算法和三支聚類算法進(jìn)行異常刪除,再基于紅嘴藍(lán)鵲優(yōu)化算法尋找三支聚類算法中的最優(yōu)初始聚類中心,消除了隨機(jī)尋找初始聚類中心的影響,提高了聚類結(jié)果的準(zhǔn)確性;最后用往年水利水位數(shù)據(jù)對lstm神經(jīng)網(wǎng)絡(luò)預(yù)測模型進(jìn)行訓(xùn)練,實(shí)現(xiàn)對水利水位數(shù)據(jù)的預(yù)測,lstm神經(jīng)網(wǎng)絡(luò)可以保持信息的長期存儲,預(yù)測效果高于其他神經(jīng)網(wǎng)絡(luò)。
80、當(dāng)然,實(shí)施本發(fā)明的任一產(chǎn)品并不一定需要同時達(dá)到以上所述的所有優(yōu)點(diǎn)。