專利名稱:基于實(shí)時(shí)歷史庫的機(jī)組運(yùn)行模式數(shù)據(jù)挖掘方法
技術(shù)領(lǐng)域:
本發(fā)明屬于火電運(yùn)行優(yōu)化技術(shù)領(lǐng)域,并且是基于生產(chǎn)過程實(shí)時(shí)歷史數(shù)據(jù)、以提取經(jīng)濟(jì)性和環(huán)保性運(yùn)行模式為目標(biāo)的數(shù)據(jù)挖掘系統(tǒng),適用于燃煤發(fā)電機(jī)組。
背景技術(shù):
當(dāng)前,各燃煤發(fā)電廠面臨著節(jié)能和減排的雙重壓力。通過從大量歷史運(yùn)行數(shù)據(jù)中獲取最優(yōu)運(yùn)行模式為當(dāng)前運(yùn)行提供數(shù)據(jù)支撐,成為提高機(jī)組運(yùn)行質(zhì)量的新思路。目前,由于 運(yùn)行人員的經(jīng)驗(yàn)?zāi)芰Σ煌沟眠\(yùn)行質(zhì)量起伏波動(dòng)較大,通過數(shù)據(jù)挖掘方式提取機(jī)組最優(yōu)運(yùn)行模式,運(yùn)用該最優(yōu)模式數(shù)據(jù)來指導(dǎo)運(yùn)行,將大大提高機(jī)組整體運(yùn)行質(zhì)量。目前尋找機(jī)組最優(yōu)模式算法主要存在以下問題I.傳統(tǒng)優(yōu)化理論與方法的實(shí)現(xiàn)傳統(tǒng)意義上的優(yōu)化理論依賴于建立系統(tǒng)的模型和優(yōu)化算法。復(fù)雜系統(tǒng)建模困難,優(yōu)化過程的計(jì)算成本往往使現(xiàn)實(shí)與理論相去甚遠(yuǎn)。2.人工智能方法的實(shí)現(xiàn)人工智能算法雖然可以有效避免復(fù)雜的數(shù)學(xué)建模,但其往往需要大規(guī)模的計(jì)算,尋優(yōu)過程計(jì)算成本較大依然無法避免。一方面,隨著數(shù)據(jù)挖掘技木深入發(fā)展,使得對(duì)復(fù)雜系統(tǒng)內(nèi)部蘊(yùn)含規(guī)律的探索成為可能。另ー方面,隨著近幾年國內(nèi)數(shù)據(jù)庫技術(shù)的成熟,基于海量數(shù)據(jù)處理的數(shù)據(jù)挖掘、數(shù)據(jù)融合,成為解決眾多實(shí)際問題的有效工具。利用實(shí)時(shí)歷史數(shù)據(jù)庫中存儲(chǔ)的機(jī)組海量運(yùn)行數(shù)據(jù),將會(huì)成為國內(nèi)發(fā)電企業(yè)節(jié)能減排研究的必然趨勢(shì)。
發(fā)明內(nèi)容
為解決現(xiàn)有技術(shù)中存在以上問題,本發(fā)明提供了一種基于實(shí)時(shí)歷史庫的機(jī)組運(yùn)行模式數(shù)據(jù)挖掘方法。本發(fā)明內(nèi)容是在機(jī)組海量運(yùn)行數(shù)據(jù)的基礎(chǔ)上,對(duì)數(shù)據(jù)進(jìn)行橫向和縱向全方位立體挖掘分析,并最終給定當(dāng)前エ況最優(yōu)運(yùn)行參數(shù)。以數(shù)據(jù)之間關(guān)聯(lián)關(guān)系為導(dǎo)向,首先對(duì)數(shù)據(jù)進(jìn)行嚴(yán)格清洗,在清洗的基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行高密度穩(wěn)態(tài)搜索并求其特征值,進(jìn)而對(duì)穩(wěn)態(tài)數(shù)據(jù)進(jìn)行エ況映射分類,再者對(duì)特征數(shù)據(jù)進(jìn)行聚類分析,在聚類分析的基礎(chǔ)上提取蘊(yùn)含其中的模式規(guī)則。決策分析系統(tǒng)在知識(shí)庫的基礎(chǔ)上進(jìn)行決策分析讓電廠專家經(jīng)驗(yàn)參與知識(shí)庫構(gòu)建,最后通過模式尋優(yōu)計(jì)算站實(shí)時(shí)在線搜尋最優(yōu)運(yùn)行模式,并提供相關(guān)控制參數(shù)。首先對(duì)本申請(qǐng)中出現(xiàn)的技術(shù)名詞作以下說明過程數(shù)據(jù)是指發(fā)電廠生產(chǎn)過程中所有測(cè)量設(shè)備測(cè)量到的數(shù)值以及由此為基礎(chǔ)進(jìn)行的二次計(jì)算得到的數(shù)據(jù)的統(tǒng)稱,例如發(fā)電功率為測(cè)量得到的過程數(shù)據(jù),鍋爐效率為二次計(jì)算得到的過程數(shù)據(jù)。穩(wěn)態(tài)時(shí)間段是指滿足穩(wěn)態(tài)搜索約束和穩(wěn)態(tài)波動(dòng)閾值要求的時(shí)間段。臟數(shù)據(jù)閾值是指當(dāng)數(shù)據(jù)的采樣間隔大于平均周期的N倍后則認(rèn)為該部分?jǐn)?shù)據(jù)為臟數(shù)據(jù),其中N的數(shù)值為臟數(shù)據(jù)閾值。
穩(wěn)態(tài)搜索約束是指在同一時(shí)刻的過程數(shù)據(jù)中各變量之間需滿足的邏輯關(guān)系。穩(wěn)態(tài)波動(dòng)閾值是指變量在捜索的時(shí)間段內(nèi)變量變化的平穩(wěn)度,包含設(shè)定區(qū)間帶以及變量數(shù)據(jù)落在該區(qū)間帶內(nèi)的比例。測(cè)點(diǎn)發(fā)電廠傳感器采集到的數(shù)據(jù)稱為該測(cè)點(diǎn)的數(shù)據(jù)。變量變量是測(cè)點(diǎn)的函數(shù)映射,具體表現(xiàn)為若干測(cè)點(diǎn)組成的數(shù)學(xué)公式,變量是數(shù)據(jù)挖掘系統(tǒng)所真正關(guān)注的數(shù)據(jù)。例如某設(shè)備的功率變量y=xl+x2,其中xl、x2為該設(shè)備其中的部分I部分2的功率測(cè)點(diǎn)。特征值是指變量在穩(wěn)態(tài)時(shí)間段內(nèi)的統(tǒng)計(jì)值,包含均值、最大值、最小值、方差、最大值時(shí)間、最小值時(shí)間等。變量分組是指根據(jù)變量的物理屬性不同對(duì)其進(jìn)行分組,物理屬性包含該變量分 屬的設(shè)備以及屬于操作性質(zhì)量、狀態(tài)性質(zhì)量和性能性質(zhì)量等,每組變量有其唯一組號(hào)。規(guī)則鏈條為預(yù)先設(shè)定的由變量分組的組號(hào)組成的有序組號(hào)集合為規(guī)則鏈條。為實(shí)現(xiàn)本發(fā)明,采用如下技術(shù)方案基于實(shí)時(shí)歷史庫的機(jī)組運(yùn)行模式數(shù)據(jù)挖掘方法,其特征在于,所述方法包括以下步驟(I)建立電廠實(shí)時(shí)歷史數(shù)據(jù)庫,實(shí)時(shí)從發(fā)電廠分散控制系統(tǒng)DCS采集生產(chǎn)運(yùn)行中各測(cè)點(diǎn)的過程數(shù)據(jù);(2)對(duì)所述各過程數(shù)據(jù)預(yù)處理,剔除所述過程數(shù)據(jù)中的臟數(shù)據(jù),獲得生產(chǎn)運(yùn)行中各測(cè)點(diǎn)具有代表性的高質(zhì)量過程數(shù)據(jù)根據(jù)所述各測(cè)點(diǎn)的過程數(shù)據(jù)的方差和對(duì)測(cè)點(diǎn)疏密要求程度設(shè)定臟數(shù)據(jù)閾值,清洗過程數(shù)據(jù)采樣間隔大于平均采樣周期與臟數(shù)據(jù)閾值的乘積值的時(shí)間段內(nèi)的采集數(shù)據(jù),得到各測(cè)點(diǎn)清洗后時(shí)間段組,將各個(gè)測(cè)點(diǎn)清洗后得到的時(shí)間段組求交集,該交集中的各測(cè)點(diǎn)的過程數(shù)據(jù)為預(yù)處理后的具有代表性的高質(zhì)量過程數(shù)據(jù);(3)通過穩(wěn)態(tài)捜索,獲取步驟(2)所得到的高質(zhì)量過程數(shù)據(jù)中穩(wěn)態(tài)記錄,并獲得穩(wěn)態(tài)記錄下各變量的特征數(shù)據(jù)在步驟(2)所得到的高質(zhì)量過程數(shù)據(jù)中,捜索各變量均滿足穩(wěn)態(tài)搜索約束和波動(dòng)閾值的所有時(shí)間段,這些時(shí)間段為穩(wěn)態(tài)時(shí)間段,這些時(shí)間段內(nèi)的過程數(shù)據(jù)為穩(wěn)態(tài)記錄,并對(duì)各穩(wěn)態(tài)記錄中的各變量進(jìn)行特征分析;其中,變量為測(cè)點(diǎn)過程數(shù)據(jù)的函數(shù)映射,所述穩(wěn)態(tài)搜索約束是指同一時(shí)刻的各個(gè)變量的過程數(shù)據(jù)之間滿足的一定的邏輯關(guān)系;所述波動(dòng)閾值是指過程數(shù)據(jù)在時(shí)間段內(nèi)變化的平穩(wěn)度;(4)聚類分析,以類內(nèi)差異最小化,類間差異最大化為原則,對(duì)步驟(3)得到的穩(wěn)態(tài)記錄進(jìn)行聚類分析,首先根據(jù)變量的物理屬性對(duì)變量預(yù)先分組,對(duì)每個(gè)穩(wěn)態(tài)記錄下的每個(gè)變量的特征數(shù)據(jù)值進(jìn)行離散化,將單組變量離散化值均相同的穩(wěn)態(tài)記錄記為該單組變量下的同一類別編號(hào),類別編號(hào)相同的穩(wěn)態(tài)記錄聚為該分組變量下的一個(gè)類別,由此將得到各個(gè)穩(wěn)態(tài)記錄下各組變量聚類編號(hào),每個(gè)穩(wěn)態(tài)記錄對(duì)應(yīng)各組變量均有其ー個(gè)聚類編號(hào);(5)提取規(guī)則,在對(duì)穩(wěn)態(tài)記錄進(jìn)行聚類分析的基礎(chǔ)上,根據(jù)預(yù)先設(shè)定要捜索的規(guī)則鏈條所涉及的各變量分組,依次取得每個(gè)穩(wěn)態(tài)記錄下相關(guān)變量分組下的聚類編號(hào),具有相同聚類編號(hào)組合的穩(wěn)態(tài)記錄組合共同構(gòu)成一條規(guī)則,穩(wěn)態(tài)記錄的個(gè)數(shù)即為該條規(guī)則的權(quán)重;將所有規(guī)則涉及的穩(wěn)態(tài)記錄中各變量的特征值進(jìn)行均值合并,得到該規(guī)則中相關(guān)變量的具體數(shù)值,該數(shù)值反應(yīng)歷史經(jīng)驗(yàn)的總結(jié)值,這些規(guī)則中各個(gè)變量的數(shù)值構(gòu)成運(yùn)行模式知識(shí)庫;(6)最優(yōu)模式匹配,模式尋優(yōu)計(jì)算站實(shí)時(shí)跟蹤當(dāng)前機(jī)組的運(yùn)行エ況,根據(jù)當(dāng)前機(jī)組運(yùn)行的エ況測(cè)點(diǎn)和尋優(yōu)策略在運(yùn)行知識(shí)庫中搜尋歷史最優(yōu)運(yùn)行模式,并輸出該最優(yōu)運(yùn)行模式中變量的具體數(shù)值給對(duì)應(yīng)的控制設(shè)備。本發(fā)明可以得到機(jī)組經(jīng)濟(jì)性和環(huán)保性等多目標(biāo)運(yùn)行的知識(shí)庫。隨著挖掘數(shù)據(jù)的不斷積累,實(shí)現(xiàn)運(yùn)行模式庫精確化、全面化、最優(yōu)化。
圖I為本發(fā)明基于實(shí)時(shí)歷史庫的機(jī)組運(yùn)行模式數(shù)據(jù)挖掘方法流程圖;圖2本發(fā)明規(guī)則提取示意圖;圖3數(shù)據(jù)挖掘系統(tǒng)拓?fù)鋱D。
具體實(shí)施例方式下面根據(jù)說明書附圖,結(jié)合優(yōu)選實(shí)施例對(duì)本發(fā)明的技術(shù)方案進(jìn)ー步詳細(xì)說明。圖I為本發(fā)明基于實(shí)時(shí)歷史庫的機(jī)組運(yùn)行模式數(shù)據(jù)挖掘方法流程圖,本發(fā)明公開的基于實(shí)時(shí)歷史庫的機(jī)組運(yùn)行模式數(shù)據(jù)挖掘方法,是在機(jī)組海量運(yùn)行數(shù)據(jù)的基礎(chǔ)上,對(duì)數(shù)據(jù)挖掘分析,并最終給定當(dāng)前エ況最優(yōu)運(yùn)行參數(shù)。以數(shù)據(jù)之間關(guān)聯(lián)關(guān)系為導(dǎo)向,首先對(duì)數(shù)據(jù)進(jìn)行嚴(yán)格清洗,在清洗的基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行高密度穩(wěn)態(tài)搜索并求其特征值,進(jìn)而對(duì)穩(wěn)態(tài)數(shù)據(jù)進(jìn)行エ況映射分類,再者對(duì)特征數(shù)據(jù)進(jìn)行聚類分析,在聚類分析的基礎(chǔ)上提取蘊(yùn)含其中的模式規(guī)則。決策分析系統(tǒng)在知識(shí)庫的基礎(chǔ)上進(jìn)行決策分析讓電廠專家經(jīng)驗(yàn)參與知識(shí)庫構(gòu)建,最后通過模式尋優(yōu)計(jì)算站實(shí)時(shí)在線搜尋最優(yōu)運(yùn)行模式,并提供相關(guān)控制參數(shù)。具體包括以下步驟第一,建立電廠實(shí)時(shí)歷史數(shù)據(jù)庫,實(shí)時(shí)從DCS (發(fā)電廠分散控制系統(tǒng))中采集生產(chǎn)運(yùn)行中各測(cè)點(diǎn)的過程數(shù)據(jù)。所采集的測(cè)點(diǎn)至少包含構(gòu)成數(shù)據(jù)挖掘系統(tǒng)所有變量的測(cè)點(diǎn)。第二,數(shù)據(jù)預(yù)處理。對(duì)所述各過程數(shù)據(jù)預(yù)處理,剔除所述過程數(shù)據(jù)中的臟數(shù)據(jù),獲得生產(chǎn)運(yùn)行中各參數(shù)具有代表性的高質(zhì)量過程數(shù)據(jù)根據(jù)所述各變量的過程數(shù)據(jù)的方差和對(duì)變量疏密要求程度設(shè)定臟數(shù)據(jù)閾值。在工程中我們給出閾值實(shí)驗(yàn)工具,通過實(shí)驗(yàn)可得到變量采樣周期的波動(dòng)程度,如果波動(dòng)程度較大則應(yīng)設(shè)置較大臟數(shù)據(jù)閾值,否則設(shè)置較小臟數(shù)據(jù)閾值,該閾值范圍一般在3到5之間。清洗過程數(shù)據(jù)采樣間隔大于平均采樣周期與臟數(shù)據(jù)閾值的乘積值的時(shí)間段內(nèi)的采集數(shù)據(jù),得到各測(cè)點(diǎn)清洗后時(shí)間段組,將各個(gè)測(cè)點(diǎn)清洗后得到的時(shí)間段組求交集,該交集中的各參數(shù)的過程數(shù)據(jù)為預(yù)處理后的具有代表性的高質(zhì)量過程數(shù)據(jù);第三,穩(wěn)態(tài)記錄搜索。通過穩(wěn)態(tài)搜索約束和波動(dòng)閾值,獲取步驟(2)所得到的高質(zhì)量過程數(shù)據(jù)中滿足分析要求的運(yùn)行穩(wěn)態(tài)記錄,并分析計(jì)算其運(yùn)行特征獲得其特征數(shù)據(jù)其中,所述穩(wěn)態(tài)捜索約束是指同一時(shí)刻的過程數(shù)據(jù)各個(gè)變量之間滿足一定的邏輯關(guān)系;所述波動(dòng)閾值是指過程數(shù)據(jù)在時(shí)間段內(nèi)變化的平穩(wěn)度,波動(dòng)閾值通過查看機(jī)組穩(wěn)定運(yùn)行時(shí)過程數(shù)據(jù)的波動(dòng)程度,針對(duì)波動(dòng)程度較大的變量應(yīng)設(shè)置波動(dòng)閾值較大,反之較??;在步驟(2)所得到的高質(zhì)量過程數(shù)據(jù)中,捜索各變量均滿足穩(wěn)態(tài)搜索約束和波動(dòng)閾值的所有時(shí)間段,這些時(shí)間段我們稱之為穩(wěn)態(tài)記錄,并對(duì)各穩(wěn)態(tài)記錄中的過程數(shù)據(jù)進(jìn)行特征分析;
首先計(jì)算起始時(shí)間段是否滿足穩(wěn)態(tài)約束和波動(dòng)閾值設(shè)定,若滿足則進(jìn)行時(shí)間段膨脹搜索,所述時(shí)間段膨脹搜索即為移動(dòng)當(dāng)前搜索時(shí)間段末端并重新判是否滿足穩(wěn)態(tài)約束和波動(dòng)閾值設(shè)定,直到移動(dòng)時(shí)間段末端不再滿足穩(wěn)態(tài)約束和波動(dòng)閾值設(shè)定條件為止,將膨脹搜索后得到的最長的時(shí)間段保存為穩(wěn)態(tài)記錄;若起始時(shí)間段不滿足穩(wěn)態(tài)約束和波動(dòng)閾值設(shè)定,則進(jìn)行平移搜索,即平移時(shí)間段起點(diǎn)和終點(diǎn)重新計(jì)算搜索條件,直到找到滿足穩(wěn)態(tài)約束和波動(dòng)閾值的時(shí)間段,再進(jìn)入膨脹搜索,循環(huán)往復(fù)直到搜索完所有清洗后時(shí)間段。第四,聚類分析,以類內(nèi)差異最小化,類間差異最大化為原則,對(duì)步驟(3)得到的穩(wěn)態(tài)記錄進(jìn)行聚類分析,首先根據(jù)變量的物理屬性對(duì)變量預(yù)先分組,對(duì)每個(gè)穩(wěn)態(tài)記錄下的每個(gè)變量的特征數(shù)據(jù)值進(jìn)行離散化,將單組變量離散化值均相同的穩(wěn)態(tài)記錄記為該單組變量下的同一類別編號(hào),類別編號(hào)相同的穩(wěn)態(tài)記錄聚為該分組變量下的一個(gè)類別,由此將得到各個(gè)穩(wěn)態(tài)記錄下各組變量聚類編號(hào),每個(gè)穩(wěn)態(tài)記錄對(duì)應(yīng)各組變量均有其一個(gè)聚類編號(hào);例如有兩個(gè)穩(wěn)態(tài)記錄,存在兩個(gè)變量分組,在聚類后每個(gè)穩(wěn)態(tài)記錄均會(huì)標(biāo)記兩個(gè)聚類編號(hào),共產(chǎn)生四個(gè)聚類編號(hào)。若這兩個(gè)穩(wěn)態(tài)記錄對(duì)于其中一組變量的離散化值均相同,則對(duì)應(yīng)該分組的兩個(gè)編號(hào)會(huì)是一樣的;第五,提取規(guī)則。在特征數(shù)據(jù)聚類結(jié)果的基礎(chǔ)上,根據(jù)預(yù)先設(shè)定要搜索的規(guī)則鏈條 所涉及的聚類后的各變量分組,依次取得每個(gè)穩(wěn)態(tài)下相關(guān)變量分組的聚類編號(hào),具有相同聚類編號(hào)組合的穩(wěn)態(tài)記錄共同構(gòu)成一條規(guī)則,穩(wěn)態(tài)記錄的個(gè)數(shù)即為該條規(guī)則的權(quán)重;對(duì)得到的各條規(guī)則進(jìn)行數(shù)據(jù)歸并,得到該規(guī)則相關(guān)變量的具體數(shù)值,該數(shù)值反應(yīng)歷史經(jīng)驗(yàn)的總結(jié)值,這些規(guī)則各個(gè)變量的數(shù)值構(gòu)成運(yùn)行模式知識(shí)庫;圖2為規(guī)則提取示意圖。在工程實(shí)施中首先可對(duì)系統(tǒng)變量按照性能量、狀態(tài)量和操作量進(jìn)行分組。如圖2中三層節(jié)點(diǎn)表示三類變量分組。在聚類后會(huì)將具有相同離散化值組合的穩(wěn)態(tài)進(jìn)行聚類編號(hào),相同的編號(hào)表示具有相同的離散化值組合即具有相同的運(yùn)行特征。規(guī)則提取中構(gòu)成相同規(guī)則的穩(wěn)態(tài)的條數(shù)表示規(guī)則的權(quán)重,表示歷史出現(xiàn)該規(guī)則的次數(shù)。規(guī)則最終以規(guī)則樹方式存儲(chǔ)在數(shù)據(jù)庫中,由規(guī)則末端至規(guī)則前端,依次表示多種操作組合可以使機(jī)組運(yùn)行至某一運(yùn)行狀態(tài),多種運(yùn)行狀態(tài)可以使機(jī)組達(dá)到某一性能。第六,最優(yōu)模式匹配,模式尋優(yōu)計(jì)算站實(shí)時(shí)跟蹤當(dāng)前機(jī)組的運(yùn)行工況,根據(jù)當(dāng)前機(jī)組運(yùn)行的工況測(cè)點(diǎn)和尋優(yōu)策略在運(yùn)行知識(shí)庫中搜尋歷史最優(yōu)運(yùn)行模式,并輸出該最優(yōu)運(yùn)行模式中變量的具體數(shù)值給對(duì)應(yīng)的控制設(shè)備。所述尋優(yōu)策略包含三類歷史出現(xiàn)次數(shù)最多、規(guī)則出現(xiàn)時(shí)間最晚、規(guī)則中和當(dāng)前運(yùn)行參量差異最小。得到匹配規(guī)則后,將該規(guī)則所涉及的變量值輸出,根據(jù)規(guī)則鏈的不同,參數(shù)將輸出給不同的控制設(shè)備。圖3為數(shù)據(jù)挖掘系統(tǒng)拓?fù)鋱D。本發(fā)明系統(tǒng)采用C/S方式實(shí)現(xiàn),配置一臺(tái)接口機(jī),用于接收發(fā)電廠分散控制系統(tǒng)DCS或火電廠廠級(jí)監(jiān)控信息系統(tǒng)SIS數(shù)據(jù)。一臺(tái)數(shù)據(jù)庫服務(wù)器用于運(yùn)行實(shí)時(shí)歷史數(shù)據(jù)庫,用來存儲(chǔ)來自接口機(jī)送來的數(shù)據(jù);一臺(tái)數(shù)據(jù)挖掘服務(wù)器,用于運(yùn)行數(shù)據(jù)挖掘軟件,從實(shí)時(shí)歷史數(shù)據(jù)庫服務(wù)器獲取原始數(shù)據(jù)并挖掘規(guī)則數(shù)據(jù);一臺(tái)知識(shí)庫服務(wù)器,用于存儲(chǔ)挖掘得到的運(yùn)行模式知識(shí)庫;一臺(tái)知識(shí)庫應(yīng)用服務(wù)器,用于運(yùn)行模式?jīng)Q策系統(tǒng)和在線模式尋優(yōu)計(jì)算站,從知識(shí)庫服務(wù)器獲取運(yùn)行模式規(guī)則用于決策系統(tǒng)和尋優(yōu)計(jì)算。一臺(tái)網(wǎng)絡(luò)管理維護(hù)站。
權(quán)利要求
1.基于實(shí)時(shí)歷史庫的機(jī)組運(yùn)行模式數(shù)據(jù)挖掘方法,其特征在于,所述方法包括以下步驟 (1)建立電廠實(shí)時(shí)歷史數(shù)據(jù)庫,實(shí)時(shí)從發(fā)電廠分散控制系統(tǒng)DCS采集生產(chǎn)運(yùn)行中各測(cè)點(diǎn)的過程數(shù)據(jù); (2)對(duì)所述各過程數(shù)據(jù)預(yù)處理,剔除所述過程數(shù)據(jù)中的臟數(shù)據(jù),獲得生產(chǎn)運(yùn)行中各測(cè)點(diǎn)具有代表性的高質(zhì)量過程數(shù)據(jù) 根據(jù)所述各測(cè)點(diǎn)的過程數(shù)據(jù)的方差和對(duì)測(cè)點(diǎn)疏密要求程度設(shè)定臟數(shù)據(jù)閾值,清洗過程數(shù)據(jù)采樣間隔大于平均采樣周期與臟數(shù)據(jù)閾值的乘積值的時(shí)間段內(nèi)的采集數(shù)據(jù),得到各測(cè)點(diǎn)清洗后時(shí)間段組,將各個(gè)測(cè)點(diǎn)清洗后得到的時(shí)間段組求交集,該交集中的各測(cè)點(diǎn)的過程數(shù)據(jù)為預(yù)處理后的具有代表性的高質(zhì)量過程數(shù)據(jù); (3)通過穩(wěn)態(tài)捜索,獲取步驟(2)所得到的高質(zhì)量過程數(shù)據(jù)中穩(wěn)態(tài)記錄,并獲得穩(wěn)態(tài)記錄下各變量的特征數(shù)據(jù) 在步驟(2)所得到的高質(zhì)量過程數(shù)據(jù)中,捜索各變量均滿足穩(wěn)態(tài)搜索約束和波動(dòng)閾值的所有時(shí)間段,這些時(shí)間段為穩(wěn)態(tài)時(shí)間段,這些時(shí)間段內(nèi)的過程數(shù)據(jù)為穩(wěn)態(tài)記錄,并對(duì)各穩(wěn)態(tài)記錄中的各變量進(jìn)行特征分析;其中,變量為測(cè)點(diǎn)過程數(shù)據(jù)的函數(shù)映射,所述穩(wěn)態(tài)搜索約束是指同一時(shí)刻的各個(gè)變量的過程數(shù)據(jù)之間滿足的一定的邏輯關(guān)系;所述波動(dòng)閾值是指過程數(shù)據(jù)在時(shí)間段內(nèi)變化的平穩(wěn)度; (4)聚類分析,以類內(nèi)差異最小化,類間差異最大化為原則,對(duì)步驟(3)得到的穩(wěn)態(tài)記錄進(jìn)行聚類分析,首先根據(jù)變量的物理屬性對(duì)變量預(yù)先分組,對(duì)每個(gè)穩(wěn)態(tài)記錄下的每個(gè)變量的特征數(shù)據(jù)值進(jìn)行離散化,將單組變量離散化值均相同的穩(wěn)態(tài)記錄記為該單組變量下的同一類別編號(hào),類別編號(hào)相同的穩(wěn)態(tài)記錄聚為該分組變量下的一個(gè)類別,由此將得到各個(gè)穩(wěn)態(tài)記錄下各組變量聚類編號(hào),每個(gè)穩(wěn)態(tài)記錄對(duì)應(yīng)各組變量均有其ー個(gè)聚類編號(hào); (5)提取規(guī)則,在對(duì)穩(wěn)態(tài)記錄進(jìn)行聚類分析的基礎(chǔ)上,根據(jù)預(yù)先設(shè)定要捜索的規(guī)則鏈條所涉及的各變量分組,依次取得每個(gè)穩(wěn)態(tài)記錄下相關(guān)變量分組下的聚類編號(hào),具有相同聚類編號(hào)組合的穩(wěn)態(tài)記錄共同構(gòu)成一條規(guī)則,穩(wěn)態(tài)記錄的個(gè)數(shù)即為該條規(guī)則的權(quán)重;將所有規(guī)則涉及的穩(wěn)態(tài)記錄中各變量的特征值進(jìn)行均值合并,得到該規(guī)則中相關(guān)變量的具體數(shù)值,該數(shù)值反應(yīng)歷史經(jīng)驗(yàn)的總結(jié)值,這些規(guī)則中各個(gè)變量的數(shù)值構(gòu)成運(yùn)行模式知識(shí)庫; (6)最優(yōu)模式匹配,模式尋優(yōu)計(jì)算站實(shí)時(shí)跟蹤當(dāng)前機(jī)組的運(yùn)行エ況,根據(jù)當(dāng)前機(jī)組運(yùn)行的エ況測(cè)點(diǎn)和尋優(yōu)策略在運(yùn)行知識(shí)庫中搜尋歷史最優(yōu)運(yùn)行模式,并輸出該最優(yōu)運(yùn)行模式中變量的具體數(shù)值給對(duì)應(yīng)的控制設(shè)備。
2.根據(jù)權(quán)利要求I所述的基于實(shí)時(shí)歷史庫的機(jī)組運(yùn)行模式數(shù)據(jù)挖掘方法,其特征在于 在所述步驟(3)中,首先計(jì)算起始時(shí)間段是否滿足穩(wěn)態(tài)約束和波動(dòng)閾值設(shè)定,若滿足則進(jìn)行時(shí)間段膨脹搜索,所述時(shí)間段膨脹搜索即為移動(dòng)當(dāng)前捜索時(shí)間段末端并重新判是否滿足穩(wěn)態(tài)約束和波動(dòng)閾值設(shè)定,直到移動(dòng)時(shí)間段末端不再滿足穩(wěn)態(tài)約束和波動(dòng)閾值設(shè)定條件為止,將膨脹捜索后得到的最長的時(shí)間段保存為穩(wěn)態(tài)記錄;若起始時(shí)間段不滿足穩(wěn)態(tài)約束和波動(dòng)閾值設(shè)定,則進(jìn)行平移捜索,即平移時(shí)間段起點(diǎn)和終點(diǎn)重新計(jì)算搜索條件,直到找到滿足穩(wěn)態(tài)約束和波動(dòng)閾值的時(shí)間段,再進(jìn)入膨脹搜索,循環(huán)往復(fù)直到搜索完所有清洗后時(shí)間段。
3.根據(jù)權(quán)利要求I或2所述的基于實(shí)時(shí)歷史庫的機(jī)組運(yùn)行模式數(shù)據(jù)挖掘方法,其特征在于 在所述步驟(3)中,對(duì)搜索到的穩(wěn)態(tài)時(shí)間段進(jìn)行特征分析,計(jì)算所有變量在各穩(wěn)態(tài)時(shí)間段內(nèi)過程數(shù)據(jù)的均值、方差、最大值、最小值、最大值時(shí)間和最小值時(shí)間等特征數(shù)據(jù)。
4.根據(jù)權(quán)利要求I所述的基于實(shí)時(shí)歷史庫的機(jī)組運(yùn)行模式數(shù)據(jù)挖掘方法,其特征在于 在步驟(7)中,所述尋優(yōu)策略優(yōu)選為,將運(yùn)行模式知識(shí)庫中歷史上出現(xiàn)次數(shù)最多的運(yùn)行模式作為歷史最優(yōu)運(yùn)行模式。
5.根據(jù)權(quán)利要求I所述的基于實(shí)時(shí)歷史庫的機(jī)組運(yùn)行模式數(shù)據(jù)挖掘方法,其特征在于 在步驟(7)中,所述尋優(yōu)策略優(yōu)選為,將運(yùn)行模式知識(shí)庫中出現(xiàn)時(shí)間最晚的運(yùn)行模式作為歷史最優(yōu)運(yùn)行模式。
6.根據(jù)權(quán)利要求I所述的基于實(shí)時(shí)歷史庫的機(jī)組運(yùn)行模式數(shù)據(jù)挖掘方法,其特征在于 在步驟(7)中,所述尋優(yōu)策略優(yōu)選為,將運(yùn)行模式知識(shí)庫中與當(dāng)前運(yùn)行參數(shù)差異最小的運(yùn)行模式作為歷史最優(yōu)運(yùn)行模式。
全文摘要
本發(fā)明是基于實(shí)時(shí)歷史庫的機(jī)組運(yùn)行模式數(shù)據(jù)挖掘方法。通過對(duì)存儲(chǔ)在實(shí)時(shí)歷史庫中的生產(chǎn)過程數(shù)據(jù)的挖掘分析,得到機(jī)組在各個(gè)運(yùn)行工況下的運(yùn)行模式規(guī)則,并形成全工況模式規(guī)則庫。總體上通過三個(gè)部分完成挖掘,第一數(shù)據(jù)預(yù)處理,得到優(yōu)質(zhì)數(shù)據(jù)并提取運(yùn)行特征。第二部分對(duì)運(yùn)行特征進(jìn)行聚類分析,使相似數(shù)據(jù)進(jìn)行聚集。第三部分在聚類基礎(chǔ)上進(jìn)行規(guī)則提取,并最終得到運(yùn)行模式庫。以該運(yùn)行模式庫為基礎(chǔ),通過模式尋優(yōu)計(jì)算站,可以實(shí)時(shí)獲取當(dāng)前機(jī)組運(yùn)行狀態(tài)下的歷史最優(yōu)運(yùn)行模式,并輸出相關(guān)最優(yōu)控制參數(shù)給運(yùn)行人員或控制系統(tǒng),使得機(jī)組保持歷史中最高質(zhì)量的運(yùn)行狀態(tài)成為可能,從而提高機(jī)組的經(jīng)濟(jì)性和環(huán)保性。
文檔編號(hào)G06F17/30GK102708180SQ20121014167
公開日2012年10月3日 申請(qǐng)日期2012年5月9日 優(yōu)先權(quán)日2012年5月9日
發(fā)明者吉云, 景超, 程睿君, 陳健婷, 黃孝彬 申請(qǐng)人:北京華電天仁電力控制技術(shù)有限公司