本發(fā)明屬于旋轉(zhuǎn)機械故障診斷領(lǐng)域,具體涉及一種基于拉普拉斯分值和自適應(yīng)模糊C均值聚類的滾動軸承故障診斷方法。
背景技術(shù):
滾動軸承作為旋轉(zhuǎn)機械的關(guān)鍵零部件,其工作狀態(tài)的好壞將直接影響到整臺機械設(shè)備的工作狀態(tài)。滾動軸承故障是導(dǎo)致旋轉(zhuǎn)機械設(shè)備發(fā)生故障的主要原因之一,嚴(yán)重時甚至可能導(dǎo)致重大財產(chǎn)損失。因此,為了避免由軸承導(dǎo)致的機械故障,減少經(jīng)濟(jì)損失,對軸承進(jìn)行狀態(tài)監(jiān)測及故障診斷從而保證其正常運行非常有必要。
目前,針對滾動軸承故障診斷,最常用的方法是基于振動信號分析。它主要包括三個步驟:數(shù)據(jù)采集與預(yù)處理,特征提取,模式識別。其中,特征選擇和提取是故障診斷的關(guān)鍵,模式識別則是核心。只有選擇合適的特征參量和有效的模式識別方法,才能保證故障診斷的可靠性。
故障可以根據(jù)不同特征來識別,但是不同特征對故障的敏感程度卻不一樣。有些特征與故障密切相關(guān),另一些可能是冗余甚至無關(guān)的特征。因此,在將特征輸入分類器之前,保留對故障敏感度高的特征,剔除對故障敏感度低的特征,有利于減少計算量,避免維數(shù)災(zāi)難,提高分類的準(zhǔn)確性。
拉普拉斯分值利用局部保持能力來衡量特征,通過直接對特征集進(jìn)行學(xué)習(xí)提取數(shù)據(jù)內(nèi)在的信息結(jié)構(gòu),將復(fù)雜的高維特征空間轉(zhuǎn)化為簡單的低維特征空間,在特征空間中選取分值較小的特征,極大程度地保留了故障信號特征集合中內(nèi)含的整體幾何結(jié)構(gòu)信息,從而利于滾動軸承故障判別與診斷。
聚類分析可根據(jù)數(shù)據(jù)間的相似性來實現(xiàn)數(shù)據(jù)區(qū)分。傳統(tǒng)的聚類分析是一種硬劃分,它把每個待識別的對象嚴(yán)格地劃分到某個類中,具有非此即彼的性質(zhì),這種分類的類別界限是分明的。顯然,這種分類不適用于具有模糊性的問題,即那些并沒有嚴(yán)格的屬性的對象,它們在形態(tài)和類屬方面存在著中介性,適合進(jìn)行軟劃分。模糊集理論為這種軟劃分提供了有力的分析工具,這種采用模糊的方法來處理聚類問題稱為模糊聚類分析。模糊C均值聚類(FCM)算法可以有效進(jìn)行聚類分析,但需要事先設(shè)定聚類數(shù),這樣給出的聚類是否合理就需要進(jìn)行有效性驗證。如果聚類數(shù)選取的不合適,會使劃分結(jié)果與數(shù)據(jù)集的真正結(jié)構(gòu)不相符,從而導(dǎo)致分類失敗。因此,只有選擇了正確的聚類數(shù)才能獲得較好的分類結(jié)果。自適應(yīng)模糊C均值聚類算法可以根據(jù)數(shù)據(jù)集自動給出最佳的聚類數(shù),從而準(zhǔn)確實現(xiàn)故障類型劃分。
技術(shù)實現(xiàn)要素:
針對故障軸承振動信號的非平穩(wěn)性及高維特征選擇問題,本發(fā)明公開了一種基于拉普拉斯分值和自適應(yīng)模糊C均值聚類的滾動軸承早期微弱故障診斷方法。
本發(fā)明包括以下步驟:
步驟一、獲取滾動軸承在正常、內(nèi)圈故障、外圈故障以及滾動體故障狀態(tài)下的振動加速度信號,得到時域信號樣本集;
步驟二、計算樣本集中每個樣本的若干個典型時域統(tǒng)計參數(shù),構(gòu)成初始特征集;
步驟三、計算初始特征集中每個特征的拉普拉斯分值,按從小到大排列,選取排在最前的若干個特征組成故障特征矩陣;
具體進(jìn)行如下處理:
步驟3.1:構(gòu)造一個具有m個樣本點的臨近圖G,第i個節(jié)點對應(yīng)xi,第j個節(jié)點對應(yīng)xj;如果xi和xj足夠近,則有邊連接,否則沒有邊連接。
步驟3.2:如果節(jié)點i和j是連通的,則令其中,i,j=1,…,m,其中t是一個合適的常數(shù);否則令Sij=0;
步驟3.3:對于第r個特征,定義
fr=[fr1,fr2,…,frm]T,D=SI,I=[1,…,1]T,L=D-S
D為對角陣,矩陣L稱為圖G的拉普拉斯矩陣,fri表示第i個樣本的第r個特征,I為單元矩陣,fr為各fri的特征元素集合,i=1,…,m;
步驟3.4:對各個特征進(jìn)行去均值化處理,得到去均值化處理后的各fri的特征元素集合
步驟3.5:計算第r個特征的拉普拉斯分值
Lr表示第r個特征的拉普拉斯分值;
步驟四、采用自適應(yīng)模糊C均值聚類方法對故障特征矩陣進(jìn)行聚類分析,獲得最佳聚類數(shù)和聚類中心,聚類數(shù)即樣本集包含的故障類型數(shù);
設(shè)xi表示數(shù)據(jù)集,n表示數(shù)據(jù)集中元素的個數(shù),c表示聚類中心(1<c<n),dij=||xi-vi||表示樣本xj和聚類中心vi的歐氏距離,uij表示第j個樣本到第i個聚類中心的隸屬度,U=[uij]c×n表示關(guān)系矩陣,V=[vij]s×c表示聚類中心矩陣。
總體樣本的中心向量為
下面給出聚類數(shù)c的自適應(yīng)函數(shù)
在不做特殊要求下可取m=2,k表示迭代次數(shù)(取大于或等于1的整數(shù)),具體進(jìn)行如下處理:步驟4.1:給出迭代標(biāo)準(zhǔn)ε=0.001,聚類數(shù)c=2,聚類數(shù)為1的自適應(yīng)函數(shù)L(c)=0,初始分類矩陣V(0),k=0;
步驟4.2:用下面公式計算U(k)
如果存在j,r,使得則令且對i≠r,
步驟4.3:用下面公式計算V(k+1),
比較V(k+1)和V(k),若||V(k+1)-V(k)||≤ε,則停止迭代,否則,置k=k+1,轉(zhuǎn)向步驟4.1;
步驟4.4:計算L(c),在c>2且c<n的情況下,若L(c-1)>L(c-2)且L(c-1)>L(c),則聚類過程結(jié)束,否則,置c=c+1,轉(zhuǎn)向步驟4.1;
步驟五、計算未知樣本和已知樣本集的聚類中心之間的貼近度,根據(jù)貼近度的大小確定未知樣本的故障類型。
本發(fā)明的優(yōu)點與積極效果在于:
(1)計算量小,可有效避免維數(shù)災(zāi)難
基于拉普拉斯分值的特征選擇通過直接對特征集進(jìn)行學(xué)習(xí)提取數(shù)據(jù)內(nèi)在的信息結(jié)構(gòu),將復(fù)雜的高維特征空間轉(zhuǎn)化為簡單的低維特征空間,在特征空間中選取分值較小的特征,極大程度地保留了故障信號特征集合中內(nèi)含的整體幾何結(jié)構(gòu)信息。由于只保留了與故障聯(lián)系密切的少量典型特征,所以使得特征分類時的計算量大大減少,也可有效避免特征數(shù)過高而導(dǎo)致的維數(shù)災(zāi)難。
(2)自適應(yīng)給出最佳分類數(shù),不需人為設(shè)定
傳統(tǒng)的模糊C均值聚類(FCM)算法可以有效進(jìn)行聚類分析,但需要事先設(shè)定聚類數(shù),這樣給出的聚類是否合理就需要進(jìn)行有效性驗證。如果聚類數(shù)選取的不合適,會使劃分結(jié)果與數(shù)據(jù)集的真正結(jié)構(gòu)不相符,從而導(dǎo)致分類失敗。自適應(yīng)模糊C均值聚類算法則不存在此問題,它可以根據(jù)數(shù)據(jù)集自動給出最佳的聚類數(shù),從而準(zhǔn)確實現(xiàn)故障類型劃分。
(3)模式識別方便有效
有了基于拉普拉斯分值選擇的典型特征及自適應(yīng)模糊C均值聚類算法得到的最佳聚類中心,只需根據(jù)未知樣本和已知樣本之間的海明貼近度大小,即可判別未知樣本的故障類型。
附圖說明
圖1是本發(fā)明的滾動軸承故障診斷方法整體步驟流程圖;
圖2是本發(fā)明的FCM算法聚類數(shù)c的自適應(yīng)過程流程圖;
圖3是本發(fā)明實例中故障分類結(jié)果圖。
具體實施方式
本發(fā)明是一種軸承故障診斷算法,下面將結(jié)合附圖,對本發(fā)明作進(jìn)一步的詳細(xì)說明。
以美國凱斯西儲大學(xué)軸承振動數(shù)據(jù)庫的部分實驗數(shù)據(jù)中SKF的6205-2RS深溝球軸承為例。
本發(fā)明公開的滾動軸承故障診斷方法的整體步驟流程圖如圖1所示,具體步驟如下:
1、選取振動信號及獲得初始特征集
針對正常軸承,3種不同程度(0.1778毫米,0.3556毫米,0.5332毫米)的單點內(nèi)圈故障,0.1778毫米的單點外圈故障,0.1778毫米的單點滾動體故障,這6種狀態(tài)進(jìn)行分析,每種狀態(tài)選取7組數(shù)據(jù)(其中5組作為訓(xùn)練樣本,2組作為測試樣本),共42組數(shù)據(jù)。滾動軸承的振動信號是典型的時域信號,其時域統(tǒng)計特征參數(shù)能夠很好地反映振動強度、信號能量、沖擊時域等信息,因此本發(fā)明以9個典型的時域統(tǒng)計特征參數(shù)為例,構(gòu)成初始特集。這9個統(tǒng)計參數(shù)分別為平均值(Xave),有效值(Xrms),最大值(Xmax),峭度(Xkur),標(biāo)準(zhǔn)差(Xstd),偏度(Xske),形狀因子(Sf),峰值因子(Cf),沖擊因子(I),其計算公式分別如下:Xmax=max{x1,x2,…,xn},其中n為采樣點數(shù),x1,x2,…,xn表示n個采樣點。30組訓(xùn)練樣本的9個時域特征參數(shù)如表1所示。
2、利用拉普拉斯分值選擇特征及獲得故障特征矩陣
拉普拉斯分值的基本思想是:利用特征的局部保持能力來衡量特征,在特征空間中選取分值較小的特征,不僅極大地保留了故障信號特征信息,而且將復(fù)雜的高維特征空間轉(zhuǎn)化為簡單的低維特征空間,從而利于滾動軸承故障判別與診斷。
設(shè)Lr表示第r個特征的拉普拉斯分值,fri表示第i個樣本的第r個特征(i=1,…,m),那么特征的拉普拉斯分值計算步驟如下:
(1)構(gòu)造一個具有m個樣本點的臨近圖G,第i個節(jié)點對應(yīng)xi,如果xi和xj足夠近,則有邊連接,否則沒有邊連接。當(dāng)節(jié)點的標(biāo)號已知時,可以在同一標(biāo)號的兩節(jié)點之間連接一條邊。
(2)如果節(jié)點i和j是連通的,則令其中t是一個合適常數(shù);否則令Sij=0。加權(quán)矩陣S稱為圖G的相似矩陣,它用來衡量近鄰樣本點之間的相似性,描述了數(shù)據(jù)空間的固有局部幾何結(jié)構(gòu);S中元素的值越大,表明兩個樣本越相近,越有可能屬于同一類,反之,則越有可能屬于不同類。
(3)對于第r個特征,定義
fr=[fr1,fr2,…,frm]T,D=SI,I=[1,…,1]T,L=D-S
D為對角陣,矩陣L稱為圖G的拉普拉斯矩陣。為了避免發(fā)生某些維度數(shù)據(jù)差異很大而主導(dǎo)近鄰圖的構(gòu)造的現(xiàn)象,對各個特征進(jìn)行去均值化處理,得到
(4)第r個特征的拉普拉斯分值計算如下:
分子越小表示近鄰的樣本在該特征上的差異越小,即該特征的局部信息保持能力越強;分母越大表示樣本在該特征上差異越大,即該特征的區(qū)分能力越強。因此,特征重要性與得分成反比,即得分越低,特征越重要。所以,拉普拉斯分值特征選擇法選取Lr值最小的幾個特征作為特征選擇結(jié)果。
(5)計算30組訓(xùn)練樣本的9個時域特征的拉普拉斯分值,結(jié)果如表2所示。從小到大對這些特征得分進(jìn)行排序,選擇排在前若干個特征作為最終的特征選擇結(jié)果,本發(fā)明以前兩個特征為例,從表2可以看出,選擇的2個特征分別為I和Xmax,將9維特征降到2維,不僅極大地保留了故障特征信息,而且還減少了對特征分類時的計算量,有利于故障判別與診斷。所以,故障特征矩陣就是由30行樣本和2列特征值構(gòu)成的30×2的矩陣。
表1訓(xùn)練樣本的9個時域統(tǒng)計參數(shù)
表2訓(xùn)練樣本的9個時域統(tǒng)計參數(shù)的拉普拉斯分值
3、利用自適應(yīng)模糊C均值聚類對樣本分類
聚類的目的就是將數(shù)據(jù)分類并盡量使不同類的數(shù)據(jù)點距離盡可能的大而同類的數(shù)據(jù)點距離盡可能的小。FCM算法可以有效進(jìn)行聚類分析,但聚類數(shù)需要事先人為給出,這樣給出的聚類是否合理就需要進(jìn)行有效性驗證。
設(shè)xi表示數(shù)據(jù)集,n表示數(shù)據(jù)集中元素的個數(shù),c表示聚類中心(1<c<n),dij=||xj-vi||表示樣本xj和聚類中心vi的歐氏距離,uij表示第j個樣本到第i個聚類中心的隸屬度,U=[uij]c×n表示關(guān)系矩陣,V=[vij]s×c表示聚類中心矩陣。
下面給出聚類數(shù)c的自適應(yīng)函數(shù)。
總體樣本的中心向量為
關(guān)系矩陣U(k)為
聚類中心矩陣V(k+1)為
聚類數(shù)c的自適應(yīng)函數(shù)為
分子表征不同類數(shù)據(jù)點之間的距離,分母表征同類的數(shù)據(jù)點與該類中心之間的距離,因此,L(c)的值越大,說明分類越合理,對應(yīng)L(c)值最大的c為最佳分類值。
在不做特殊要求下可取m=2,k表示迭代次數(shù)(取大于或等于1的整數(shù)),針對上面給出的聚類數(shù)c的自適應(yīng)函數(shù),有下面的FCM算法聚類數(shù)c的自適應(yīng)過程,對應(yīng)流程圖如圖2所示:
(1)給出迭代標(biāo)準(zhǔn)ε=0.001,聚類數(shù)c=2,聚類數(shù)為1的自適應(yīng)函數(shù)L(c)=0,初始分類矩陣V(0),k=0;
(2)計算U(k),如果存在j,r,使得則令且對i≠r,
(3)計算V(k+1),并計較V(k+1)和V(k),若||V(k+1)-V(k)||≤ε,則停止迭代,否則,置k=k+1,轉(zhuǎn)向(1);
(4)計算L(c),在c>2且c<n的情況下,若L(c-1)>L(c-2)且L(c-1)>L(c),則聚類過程結(jié)束,否則,置c=c+1,轉(zhuǎn)向(1);
(5)30×2的故障特征矩陣的自適應(yīng)模糊C均值聚類的結(jié)果如表3,表4及圖3所示。根據(jù)圖3,可以清楚的看到30組樣本被分為6類,并且從表3可以得出最佳聚類數(shù)c=6,樣本中6類故障被正確區(qū)分開。
表3故障特征矩陣的自適應(yīng)模糊C均值聚類的目標(biāo)函數(shù)L(c)
表4訓(xùn)練樣本的自適應(yīng)模糊C均值聚類的聚類中心矩陣
4.利用貼近度實現(xiàn)故障類型識別
模糊診斷中常采用貼近度進(jìn)行模式識別,本發(fā)明以海明貼近度為例,其計算公式如下:
式中A為標(biāo)準(zhǔn)模糊模式,B為待識別模糊對象,k=1,2,…,n。貼近度N(A,B)越大,表明兩個模糊子集越相似,反之則越差。模糊診斷中,首先通過模糊C均值聚類算法對已知故障樣本進(jìn)行聚類得到各聚類中心,然后計算待測故障樣本與聚類中心的貼近度,從而確定待測故障樣本的類別。
訓(xùn)練樣本中6類故障的聚類中心如表4所示,表中N表示正常狀態(tài),B表示0.1778毫米的單點滾動體故障,O表示0.1778毫米的單點外圈故障,I-1,I-2,I-3分別表示0.1778毫米,0.3556毫米,0.5332毫米的單點內(nèi)圈故障。12組待測樣本與已知訓(xùn)練樣本的貼近結(jié)果如表5所示。根據(jù)表5,可以看出已知樣本和未知樣本的最大貼極度達(dá)100%,因此,可以確定該未知樣本的狀態(tài)和該已知樣本的狀態(tài)一致,并得到的結(jié)果與實際相符。
表5待測樣本和已知樣本的海明貼近度及診斷結(jié)果
通過以上滾動軸承故障分類及識別方法的詳細(xì)描述,可見本發(fā)明的基于拉普拉斯分值和自適應(yīng)模糊C均值聚類的滾動軸承故障診斷方法具有明顯的優(yōu)勢:
1、基于拉普拉斯分值的特征選擇在極大程度地保留故障信號特征集合中內(nèi)含的整體幾何結(jié)構(gòu)信息的基礎(chǔ)上,只選擇少量幾個局部信息保持能力強的特征,從而將復(fù)雜的高維特征空間轉(zhuǎn)化為簡單的低維特征空間,極大地縮減了故障分類時的計算量,有利于故障分類與識別。
2、基于自適應(yīng)模糊C均值聚類的故障分類算法克服了傳統(tǒng)的模糊C均值聚類算法需要事先人為設(shè)定聚類數(shù)的缺陷,它可以根據(jù)數(shù)據(jù)集自動給出最佳聚類數(shù),從而準(zhǔn)確實現(xiàn)故障類型劃分。
3、有了基于拉普拉斯分值選擇的典型特征及自適應(yīng)模糊C均值聚類算法得到的最佳聚類中心,只需根據(jù)未知樣本和已知樣本之間的貼近度大小,即可判別未知樣本的故障類型,簡單有效而且精度高。