基于主元分析和d-s證據(jù)理論的故障診斷方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計(jì)算機(jī)領(lǐng)域,涉及數(shù)學(xué)建模,尤其是一種基于主元分析和D-S證據(jù)理論的故障診斷方法。
【背景技術(shù)】
[0002]隨著人工智能、專家系統(tǒng)和信息融合的研宄不斷深入,必然要遇到如何處理不確定信息的問題?,F(xiàn)代計(jì)算能力的顯著提高可以讓我們對不確定性有更深入的研宄,對復(fù)雜問題的計(jì)算已經(jīng)不是主要問題,關(guān)鍵是如何用數(shù)學(xué)框架(古典概率論)來完整的表示不確定性。對不確定性的兩重性定義如下:
[0003]1、偶然不確定性(Aleatory Uncertainty):這種類型的不確定性主要是由于系統(tǒng)的隨機(jī)性造成的,也稱為隨機(jī)不確定性,不可減少的不確定性,客觀不確定性等。
[0004]2、認(rèn)識(shí)不確定性(Epistemic Uncertainty):這種類型的不確定性主要是由于對系統(tǒng)缺乏一定的認(rèn)識(shí)造成的,是進(jìn)行系統(tǒng)分析時(shí)的產(chǎn)物。也稱為主觀不確定性,可減少的不確定性,認(rèn)識(shí)的不確定性,或者稱為無知。
[0005]對于這兩種類型的不確定性,在傳統(tǒng)上人們用概率論來描述。但是,古典概率論并不能描述認(rèn)知上的不確定性。若用貝葉斯概率來解決認(rèn)知不確定性,則要求分析者知道所有有關(guān)事件發(fā)生概率的相關(guān)知識(shí)。如果沒有這些知識(shí),根據(jù)拉普拉斯決策準(zhǔn)則(又稱不充分理由原則),常采用均勻分布函數(shù),這就是當(dāng)樣本空間的概率分布在不知道的情況下,我們可以認(rèn)為樣本是以等概率事件發(fā)生的。比如引起某系統(tǒng)發(fā)生故障的原因有A、B和C三個(gè)。若認(rèn)為A導(dǎo)致系統(tǒng)發(fā)生故障的概率為0.3,但是沒有任何關(guān)于B和C的可靠性的知識(shí)。根據(jù)拉普拉斯決策準(zhǔn)則,在古典概率論里會(huì)認(rèn)為B和C可能導(dǎo)致系統(tǒng)無法正常工作的概率均為0.35。這是在對關(guān)于B和C毫無相關(guān)知識(shí)的情況下對這兩個(gè)原因的不可靠性的一個(gè)比較準(zhǔn)確的描述。
[0006]在古典概率里的另外一個(gè)假設(shè)就是加法定理,即滿足某個(gè)性質(zhì)的所有概率之和為1這就得到一個(gè)這樣的結(jié)論,如果我們知道了某個(gè)事件可能發(fā)生的概率,比如是0.3,那就相當(dāng)于我們知道該事件不可能發(fā)生的概率,就是1-03 = 0.7。但是這個(gè)結(jié)論往往是不正確的。這就涉及到在主觀信念上對不確定性的建模問題。雖然加法定理和不充分理由原則可能適合于解決偶然不確定性里對于隨機(jī)事件的建模問題,但是在應(yīng)用于知識(shí)和概念上時(shí)還存在一定問題。
[0007]綜上所述,當(dāng)沒有關(guān)于某一事件發(fā)生概率的知識(shí),或者這部分知識(shí)是不確切的,模糊的,或者相互矛盾的,需要研宄不確定性更一般的表示,以解決認(rèn)知不確定性的情況。雖然在概率論里不能解決此類問題,不可能對不確定性賦以一個(gè)確定的概率值,但是我們可以對集合或者區(qū)間進(jìn)行概率賦值,把命題的不確定性問題轉(zhuǎn)化為集合的不確定問題,這是Dempster-Shafer 理論的貢獻(xiàn)。
[0008]主元分析(Principal Components Analysis) [165]又譯為主成份分析,是多元統(tǒng)計(jì)過程控制技術(shù)中最常用的方法之一。它首先采集系統(tǒng)在正常運(yùn)行過程中的各個(gè)變量信號(hào),組成的高維變量空間,在力保數(shù)據(jù)信息丟失最少的原則下進(jìn)行壓縮處理,建立一個(gè)降維的統(tǒng)計(jì)模型:PCA模型,然后提取系統(tǒng)PCA模型輸出數(shù)據(jù)的統(tǒng)計(jì)特征參數(shù),通過分析處理這些統(tǒng)計(jì)特性參數(shù)監(jiān)測并判斷系統(tǒng)的運(yùn)行狀態(tài),可以再采用其它的理論方法(如:多元統(tǒng)計(jì)的其它方法、人工智能理論、神經(jīng)網(wǎng)絡(luò)技術(shù)、信息融合理論等)來診斷具體的故障位置和性質(zhì)。
[0009]主元分析方法的引入最早出現(xiàn)于多元統(tǒng)計(jì)學(xué)領(lǐng)域中[166,167],其核心思想是通過將相關(guān)的一組數(shù)據(jù)集進(jìn)行降維,并盡量保留原來數(shù)據(jù)集的變化信息。降維的實(shí)現(xiàn)主要通過將原變量集轉(zhuǎn)換成一組互不相關(guān)的新變量集(即所謂的潛隱變量),這些新變量按照其方差的大小進(jìn)行排列。如此,新變量集中的前若干個(gè)變量(即所謂的主元)便保留了原始變量的絕大部分變化信息。
[0010]主元分析的過程實(shí)質(zhì)是對原坐標(biāo)系進(jìn)行平移和旋轉(zhuǎn)變換,使得新坐標(biāo)的原點(diǎn)與數(shù)據(jù)集合的重心重合。新坐標(biāo)系的第一軸與數(shù)據(jù)變異的最大方向?qū)?yīng),新坐標(biāo)軸的第二軸與第一軸標(biāo)準(zhǔn)正交,并且與數(shù)據(jù)變異的第二大方向?qū)?yīng)…依此類推。這些新的主軸分別就是PiQ = 1,2,若經(jīng)過舍棄少量信息后,主軸Pi (i = 1,2,…,k,k〈m)能夠有效地表示原始數(shù)據(jù)的變異情況,則原來的m維空間就被降至k維,這就是原樣本集合在新空間投影所生成的新樣本集合,可以近似地表達(dá)原樣本集合。
[0011]由于主元分析技術(shù)將系統(tǒng)所有的測量變量視為一個(gè)整體,對它們進(jìn)行一體化處理,所以各變量之間的相互耦合關(guān)系也被保留在PCA模型中。PCA模型描述了正常工況下各過程變量之間的關(guān)系,這種變量間的內(nèi)在聯(lián)系是由質(zhì)量平衡、能量平衡以及操作限制等各方面的約束形成的。當(dāng)系統(tǒng)運(yùn)行數(shù)據(jù)與主元模型產(chǎn)生較大的偏離時(shí),表現(xiàn)在檢測樣本的得分向量和變量噪聲將超出主元模型中各自空間的正常范圍。在進(jìn)行故障分離時(shí),采用PCA貢獻(xiàn)圖方法,以系統(tǒng)過程變量之間的關(guān)聯(lián)性作為故障診斷的依據(jù)。
[0012]所謂的主元模型,指的是對來自正常穩(wěn)態(tài)工況下的樣本數(shù)據(jù)集合進(jìn)行主元分析后得到的一系列統(tǒng)計(jì)信息,主要包括:變量均值向量U、變量方差矩陣DO、協(xié)方差矩陣COV(X)、主元方差矩陣D λ、負(fù)載矩陣P、主元得分矩陣T以及主元個(gè)數(shù)k等。
[0013]D-S證據(jù)理論方法在故障診斷中,需要合成、處理多各信息源所提供的關(guān)于故障的各種證據(jù),證據(jù)也就是命題信任度的產(chǎn)生方法有很多,但都面臨一個(gè)樣本數(shù)據(jù)維數(shù)的問題,當(dāng)數(shù)據(jù)維數(shù)過大時(shí),會(huì)使證據(jù)的產(chǎn)生異常困難。一般來說,產(chǎn)生證據(jù)的各類算法的復(fù)雜度隨著量測維數(shù)的增大和遞推步數(shù)呈幾何級(jí)數(shù)增加,會(huì)產(chǎn)生組合爆炸的情況,采用分類識(shí)別網(wǎng)絡(luò)時(shí)會(huì)延長網(wǎng)絡(luò)的訓(xùn)練時(shí)間,甚至導(dǎo)致網(wǎng)絡(luò)不收斂。
[0014]基于主元分析法模型的貢獻(xiàn)圖故障診斷方法雖然簡單易行,不需要預(yù)先的過程知識(shí),但它是以系統(tǒng)過程變量之間的關(guān)聯(lián)性作為依據(jù)進(jìn)行故障診斷,無法為過程的故障與變量建立一種一一對應(yīng)的因果關(guān)系,只能顯示出一組與該故障相關(guān)聯(lián)的系統(tǒng)變量,不一定是最后的所辨識(shí)的故障,沒有分離出其本質(zhì),所以故障分離能力較弱,無法進(jìn)行直接的故障診斷,并且當(dāng)變量個(gè)數(shù)較多并且故障常常反映為多個(gè)變量變化時(shí),會(huì)導(dǎo)致較高的誤診率,因此在實(shí)際應(yīng)用中,還需要由工程操作人員根據(jù)經(jīng)驗(yàn)進(jìn)行合理的判斷。
[0015]在故障診斷方法中,主元分析法和D-S證據(jù)理論方法都得到廣泛應(yīng)用,但這兩種方法都有自身的缺點(diǎn)。為何克服上述兩種方法的缺點(diǎn),同時(shí)發(fā)揮各自的優(yōu)點(diǎn),本案將PCA與D-S證據(jù)理論結(jié)合起來進(jìn)行研宄,采用PCA方法對數(shù)據(jù)處理,可以把高維數(shù)據(jù)壓縮成一個(gè)攜帶了原數(shù)據(jù)絕大部分信息的較低維數(shù)的數(shù)據(jù),對來自各個(gè)信息源的低維特征數(shù)據(jù)進(jìn)行關(guān)聯(lián),以降低算法的復(fù)雜度,提高實(shí)時(shí)性,然后利用D-S證據(jù)理論進(jìn)行融合處理,最終分離出故障。
【發(fā)明內(nèi)容】
[0016]本方法針對D-S理論方法在進(jìn)行多個(gè)數(shù)據(jù)源關(guān)聯(lián)時(shí),隨著量測維數(shù)的增大和遞推步數(shù)的增加,會(huì)出現(xiàn)組合爆炸的問題,以及主元分析方法雖然可以在損失最少信息的情況下把原有數(shù)據(jù)壓縮成低維的新數(shù)據(jù),但在故障分離方面能力較弱的缺點(diǎn),提出一種PCA和D-S證據(jù)理論相結(jié)合的故障診斷方法。
[0017]為實(shí)現(xiàn)上述目的本發(fā)明所采用的技術(shù)方案是:
[0018]一種基于主元分析和D-S證據(jù)理論的故障診斷方法,該方法基于PCA與D-S證據(jù)理論相結(jié)合的故障診斷方法,其步驟為:
[0019]⑴采用主元分析法進(jìn)行故障檢測,利用PCA把相關(guān)過程數(shù)據(jù)所組成的高維數(shù)據(jù)空間投影壓縮到低維特征子空間,用少部分獨(dú)立的主元變量來描述多維空間的絕大部分動(dòng)態(tài)信息,把檢測數(shù)據(jù)用主元模型進(jìn)行分析,判斷PCA模型的T2統(tǒng)計(jì)量和Q統(tǒng)計(jì)量是否超限,若有一個(gè)超限,則認(rèn)為發(fā)生故障;
[0020]⑵對于步驟⑴中已發(fā)生的故障,采用PCA方法分析處理正常運(yùn)行數(shù)據(jù)&和各種故障數(shù)據(jù)fi(i = 1,2,…,η),從而得到相應(yīng)的低維特征矩陣TKiQ =0,1,…,η),以此作為訓(xùn)練神經(jīng)網(wǎng)絡(luò),建立分類識(shí)別器;
[0021]⑶將步驟⑵中的正常運(yùn)行數(shù)據(jù)&和各種故障數(shù)據(jù)f i分別用正常主元模型PCAjP故障主元模型PCAiQ = 1,2,…,η)進(jìn)行主元分析,得到各個(gè)主元模型下的低維特征矩陣tkji = 0,1,…,n),然后進(jìn)行網(wǎng)絡(luò)識(shí)別,其結(jié)果作為D-S證據(jù)理論的證據(jù),再進(jìn)行證據(jù)融合處理,按照分離法則最終分離故障。
[0022]而且,步驟⑴中所述的主元模型,指的是對來自正常穩(wěn)態(tài)工況下的樣本數(shù)據(jù)集合進(jìn)行主元分析后得到的一系列統(tǒng)計(jì)信息,主要包括:變量均值向量μ、變量方差矩陣D。、協(xié)方差矩陣COV(X)、主元方差矩陣Dx、負(fù)載矩陣P、主元得分矩陣T以及主元個(gè)數(shù)k等。確定的主元數(shù),其具有一定的主觀性。一般來說當(dāng)前k個(gè)主元的累積貢獻(xiàn)率達(dá)到85%以上的時(shí)候,我們就可以認(rèn)為已求的主元個(gè)數(shù)k可以綜合原數(shù)據(jù)足夠多的信息,可根實(shí)際情況選定。
[0023]而且,步驟⑴中,T2統(tǒng)計(jì)量,即Hotelling T 2統(tǒng)計(jì)量,Q統(tǒng)計(jì)量,即平方預(yù)報(bào)誤差SPE (Squared Predict1n Error)統(tǒng)計(jì)量。
[0024]而且,步驟⑴中主元分析法建立的主元模型是:正常主元模型PCAtl和各類故障主元模型 PCAi (i = 1,2,…,η)。
[0025]而且,步驟⑵中,所述正常運(yùn)行數(shù)據(jù)&是從傳感器網(wǎng)絡(luò)獲得系統(tǒng)正常運(yùn)行數(shù)據(jù),各種故障數(shù)據(jù)A是通過實(shí)驗(yàn)以及歷史運(yùn)行數(shù)據(jù)得到各種典型故障數(shù)據(jù),采用PCA方法分析處理即為將正常運(yùn)行數(shù)據(jù)fo以及各種故障數(shù)據(jù)f 1建立與其相應(yīng)的正常主元模型PCA ^和各類故障主元模型PCAiQ = 1,2,…,η),同時(shí)獲得各個(gè)主元模型下的低維特征向量TKiQ = 0,1,…,η),組成低維特征矩陣ΤΚ。
[0026]而且,步驟⑵中,訓(xùn)練神經(jīng)網(wǎng)絡(luò)是采用徑向基函數(shù)網(wǎng)絡(luò)(RBFNN)對低維特征矩陣TK進(jìn)行信息融合識(shí)別,得到TK = TVTK1-+TKn,TKiG RkXv(i = O, I,…,η)是第i種故障類型特征向量,k是選取的主元個(gè)數(shù),V是變量個(gè)數(shù),以此作為訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò),并建立分類識(shí)別器。
[0027]而且,步驟⑶中,通過步驟⑵中的分類