本發(fā)明主要涉及計量數(shù)據(jù)處理,具體涉及一種計量檢定數(shù)據(jù)上鏈方法及系統(tǒng)。
背景技術(shù):
1、目前,電網(wǎng)的實驗室資源和數(shù)據(jù)共享程度低,大量檢測數(shù)據(jù)未得到有效貫通和融合應(yīng)用的問題成為計量數(shù)據(jù)研究的絆腳石。因此,亟需開展計量實驗室全場景感知與檢測數(shù)據(jù)共享融合技術(shù)研究及應(yīng)用,通過試驗檢測數(shù)據(jù)的統(tǒng)一規(guī)范化可信接入與共享,實現(xiàn)兩級計量實驗室數(shù)據(jù)的縱向貫通、融合共享和示范應(yīng)用,支撐全場景、可視化計量智慧實驗室建設(shè),支撐電力行業(yè)其他實驗室數(shù)據(jù)共享融合應(yīng)用,提升電力行業(yè)實驗室智能化管理水平。
技術(shù)實現(xiàn)思路
1、本發(fā)明要解決的技術(shù)問題就在于:針對現(xiàn)有技術(shù)存在的技術(shù)問題,本發(fā)明提供一種實現(xiàn)對計量實驗室全場景感知與檢測數(shù)據(jù)有效監(jiān)管的計量檢定數(shù)據(jù)上鏈方法及系統(tǒng)。
2、為解決上述技術(shù)問題,本發(fā)明提出的技術(shù)方案為:
3、一種計量檢定數(shù)據(jù)上鏈方法,包括步驟:
4、s1、電能表檢定數(shù)據(jù)上鏈數(shù)據(jù)規(guī)劃:針對電能表檢定數(shù)據(jù)在上鏈前對數(shù)據(jù)進(jìn)行預(yù)處理;
5、s2、電能表檢定數(shù)據(jù)上鏈數(shù)據(jù)對象設(shè)計:針對電能表檢定數(shù)據(jù)進(jìn)行分析歸類,制定上鏈數(shù)據(jù)標(biāo)準(zhǔn)以對電能表檢定數(shù)據(jù)進(jìn)行處理,得到符合規(guī)范的標(biāo)準(zhǔn)數(shù)據(jù);
6、s3、電能表檢定數(shù)據(jù)智能合約設(shè)計:分析電能表檢定數(shù)據(jù)上鏈的需求,確定記錄的數(shù)據(jù)類型,設(shè)計智能合約的架構(gòu),規(guī)劃合約的邏輯流程,實現(xiàn)電能表檢定數(shù)據(jù)的智能合約設(shè)計。
7、優(yōu)選地,在步驟s1中,預(yù)處理包括數(shù)據(jù)清洗、數(shù)據(jù)降維和數(shù)據(jù)融合;
8、其中數(shù)據(jù)清洗分為重復(fù)記錄清洗和噪聲數(shù)據(jù)消除兩部分,具體為:
9、重復(fù)記錄清洗采用基本近鄰排序算法,主要包括以下三步:
10、1)生成關(guān)鍵詞:通過抽取數(shù)據(jù)集中相關(guān)屬性的值為每個實例生成一個關(guān)鍵字;
11、2)數(shù)據(jù)排序:按關(guān)鍵字為數(shù)據(jù)集中的數(shù)據(jù)排序,使?jié)撛诘闹貜?fù)記錄調(diào)整到一個鄰近的區(qū)域內(nèi);
12、3)合并:在已排序的數(shù)據(jù)集上依次移動一個固定大小的窗口,數(shù)據(jù)集中每條記錄僅與窗口內(nèi)的記錄進(jìn)行比較;如果窗口的大小是包含m個記錄,則每條新進(jìn)入窗口的記錄都要與先前進(jìn)入窗口的m條記錄進(jìn)行比較,來檢測重復(fù)記錄,然后最先進(jìn)入窗口內(nèi)的記錄滑出窗,最后一條記錄的下一條記錄移入窗口。
13、優(yōu)選地,所述噪聲數(shù)據(jù)消除的方法為等深分箱法,通過把數(shù)據(jù)劃分到相同深度的不同箱內(nèi),具體為:
14、a按箱平均值平滑
15、把箱中的所有值平均,然后使用箱的平均值替代箱中所有數(shù)據(jù);
16、b按箱邊界平滑
17、箱中的最大和最小值被視為箱邊界,箱中的每一個值被最近的箱邊界值替換。
18、優(yōu)選地,在進(jìn)行數(shù)據(jù)降維時,對于數(shù)據(jù)特征中的線性特征,采用主成分分析降維方法,找到數(shù)據(jù)中最主要的元素和結(jié)構(gòu),去除噪聲和冗余,對原有的復(fù)雜數(shù)據(jù)進(jìn)行降維;對于數(shù)據(jù)特征中的非線性特征,采用自編碼器降維;針對降維后的數(shù)據(jù)特征,進(jìn)行基于規(guī)則的特征挖掘,支撐非可逆特征提取;
19、主成分分析降維方法的降維處理的具體流程如下:
20、1)首先計算特征平均值構(gòu)建特征數(shù)據(jù)的協(xié)方差矩陣;
21、2)再通過svd分解求解該協(xié)方差矩陣的特征值以及特征向量;
22、3)求出來的特征值依次從大到小的排列以便于選出主成分的特征值;
23、4)當(dāng)選出了主成分的特征值后,這些特征值所對應(yīng)的特征向量就構(gòu)成了降維后的子空間;
24、采用自編碼器降維的具體過程為:
25、自編碼器結(jié)構(gòu):包括三層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu):輸入層、隱層、輸出層;
26、自編碼器算法流程:
27、a對于給定的無標(biāo)簽數(shù)據(jù),使用無監(jiān)督學(xué)習(xí)方法學(xué)習(xí)特征:對于無類標(biāo)簽的數(shù)據(jù),通過編碼器將輸入數(shù)據(jù)進(jìn)行編碼,然后使用解碼器得到一個輸出信息;如果輸出近似等于輸入數(shù)據(jù),則可以通過調(diào)整編碼和解碼階段的參數(shù),使得重構(gòu)誤差最??;
28、b將編碼器產(chǎn)生的特征作為輸入,逐層訓(xùn)練下面層的網(wǎng)絡(luò);由于第一個訓(xùn)練層得到的編碼是輸入數(shù)據(jù)的復(fù)現(xiàn),所以下面層的訓(xùn)練過程類似第一層;
29、c有監(jiān)督地微調(diào)整個神經(jīng)網(wǎng)絡(luò):在訓(xùn)練完所有層網(wǎng)絡(luò)之后,自編碼器學(xué)習(xí)獲得較好地代表輸入的特征,并且這些特征最優(yōu)地表示原始輸入信號;在自編碼器之后加入一個分類器,然后通過有監(jiān)督訓(xùn)練的方法實現(xiàn)對整個網(wǎng)絡(luò)進(jìn)行微調(diào)。
30、優(yōu)選地,在進(jìn)行數(shù)據(jù)融合時,首先基于特征提取技術(shù),針對非可逆的數(shù)據(jù)特征提取到的數(shù)據(jù),采用自適應(yīng)數(shù)據(jù)融合算法在神經(jīng)元數(shù)據(jù)融合系統(tǒng)上融合數(shù)據(jù),獲取盡可能大的信息量;而后采用基于多元概率推理模型對數(shù)據(jù)進(jìn)行學(xué)習(xí),形成高價值的信息庫支撐。
31、優(yōu)選地,在步驟s2中,根據(jù)電能表檢定數(shù)據(jù)的業(yè)務(wù)分類,將數(shù)據(jù)分為量傳數(shù)據(jù)、質(zhì)檢數(shù)據(jù)、現(xiàn)場數(shù)據(jù);
32、根據(jù)電能表檢定數(shù)據(jù)上鏈共享需求,將數(shù)據(jù)分為基礎(chǔ)類、試驗檢測類數(shù)據(jù);
33、基礎(chǔ)類數(shù)據(jù)包括檢定機構(gòu)、機構(gòu)證書、檢定人員、檢定人員證書、電能表資產(chǎn)、標(biāo)準(zhǔn)設(shè)備資產(chǎn)、計量設(shè)備檢定證書信息、標(biāo)準(zhǔn)設(shè)備檢定/校準(zhǔn)證書、企業(yè)認(rèn)證證書信息;
34、試驗檢測類數(shù)據(jù)包括適應(yīng)性檢數(shù)據(jù)、樣品比對數(shù)據(jù)、軟件比對數(shù)據(jù)、全性能試驗檢測數(shù)據(jù)、抽樣驗收試驗數(shù)據(jù)、全檢驗收試驗數(shù)據(jù)。
35、優(yōu)選地,在步驟s2中,所述上鏈數(shù)據(jù)標(biāo)準(zhǔn)用于為上鏈數(shù)據(jù)提供者提供數(shù)據(jù)技術(shù)規(guī)范,包括數(shù)據(jù)格式和數(shù)據(jù)長度;數(shù)據(jù)標(biāo)準(zhǔn)根據(jù)融合數(shù)據(jù)一數(shù)一源原則,選定該數(shù)據(jù)的標(biāo)準(zhǔn);
36、數(shù)據(jù)標(biāo)準(zhǔn)包括主題定義、信息項、標(biāo)準(zhǔn)代碼三部分,主題定義用于記錄數(shù)據(jù)標(biāo)準(zhǔn)的定義、分類,用于規(guī)范和識別數(shù)據(jù)的主題歸屬;信息項記錄數(shù)據(jù)主題的信息項業(yè)務(wù)屬性和技術(shù)屬性;標(biāo)準(zhǔn)代碼記錄信息項固定碼值的編碼、分類、使用規(guī)則。
37、優(yōu)選地,上鏈的具體過程為:
38、按照固定周期,從省信息內(nèi)網(wǎng)mds中間庫將電能表資產(chǎn)數(shù)據(jù)以增量的方式同步至省信息外網(wǎng)平臺中間庫;
39、數(shù)據(jù)上鏈服務(wù)監(jiān)控中間庫數(shù)據(jù)狀態(tài),將待上鏈的電能表資產(chǎn)數(shù)據(jù)、計量檢定人員數(shù)據(jù)、計量標(biāo)準(zhǔn)裝置數(shù)據(jù)、計量標(biāo)準(zhǔn)器數(shù)據(jù)加密后進(jìn)行封裝,執(zhí)行數(shù)據(jù)上鏈操作;
40、觸發(fā)數(shù)據(jù)校驗智能合約,對上鏈數(shù)據(jù)從完整性、正確性進(jìn)行校驗;
41、執(zhí)行原始數(shù)據(jù)上鏈操作,接收上鏈服務(wù)返回結(jié)果;
42、根據(jù)上鏈服務(wù)返回結(jié)果,更新中間庫電能表資產(chǎn)數(shù)據(jù)上鏈狀態(tài)并記錄區(qū)塊鏈hash,完成數(shù)據(jù)上鏈操作。
43、優(yōu)選地,步驟s3的具體過程為:
44、智能合約由區(qū)塊鏈內(nèi)的多個用戶共同參與制定,用于用戶之間的任何交易行為;協(xié)議中明確了雙方的權(quán)利和義務(wù),權(quán)利和義務(wù)以電子化的方式進(jìn)行編程,代碼中包含會觸發(fā)合約自動執(zhí)行的條件;
45、一旦編碼完成,這份智能合約就被上傳到區(qū)塊鏈網(wǎng)絡(luò)上;
46、智能合約定期檢查是否存在相關(guān)事件和觸發(fā)條件;滿足條件的事件將會推送到待驗證的隊列中;
47、區(qū)塊鏈上的驗證節(jié)點先對該事件進(jìn)行簽名驗證,以確保其有效性;等大多數(shù)驗證節(jié)點對該事件達(dá)成共識后,智能合約將成功執(zhí)行,并通知用戶;
48、成功執(zhí)行的合約將移出區(qū)塊,而未執(zhí)行的合約則繼續(xù)等待下一輪處理,直至成功執(zhí)行。
49、本發(fā)明還公開了一種計量檢定數(shù)據(jù)上鏈系統(tǒng),包括相互連接的存儲器和處理器,所述存儲器上存儲有計算機程序,所述計算機程序在被處理器運行時執(zhí)行如上所述方法的步驟。
50、與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點在于:
51、本發(fā)明規(guī)劃電能表檢定數(shù)據(jù)上鏈信息,針對電能表檢定數(shù)據(jù)在上鏈前對數(shù)據(jù)進(jìn)行清洗、降維、融合,提高數(shù)據(jù)可用性,為上鏈存儲提供數(shù)據(jù)支撐;數(shù)據(jù)清洗用于發(fā)現(xiàn)并糾正數(shù)據(jù)中存儲的錯誤;采用主成分分析降維方法對檢定數(shù)據(jù)進(jìn)行降維,找到數(shù)據(jù)中最主要的元素和結(jié)構(gòu),去除噪聲和冗余;通過數(shù)據(jù)融合,將多源信息數(shù)據(jù)的價值發(fā)揮到最大程度,從而取得對用戶更有利的融合結(jié)果的特性。
52、本發(fā)明通過電能表檢定數(shù)據(jù)的業(yè)務(wù)分類、電能表檢定數(shù)據(jù)上鏈共享需求的研究,針對電能表檢定數(shù)據(jù)進(jìn)行分析歸類,制定上鏈數(shù)據(jù)標(biāo)準(zhǔn)指導(dǎo)上連數(shù)據(jù)提供者對電能表檢定數(shù)據(jù)進(jìn)行處理,為數(shù)據(jù)上鏈提供符合規(guī)范的標(biāo)準(zhǔn)數(shù)據(jù);通過研究智能合約的概念和工作原理,設(shè)計針對電能表檢定數(shù)據(jù)的上鏈智能合約,實現(xiàn)上鏈電能表檢定數(shù)據(jù)的有效性驗證及安全讀取。