關于基于不完全信息的軸承故障聚類識別方法論文
引言
谷物聯(lián)合收獲機能夠高效完成農(nóng)作物的收割、脫粒、分離、清選及秸稈處理等一系列任務,是現(xiàn)代農(nóng)業(yè)生產(chǎn)中常見的一種大型自動化設備。其中,軸承部件在該設備的傳動、行走和控制等裝置中被大量地使用,是一類影響設備運行狀態(tài)的重要部件。尤其在脫粒裝置上用到的滾筒軸承,不僅影響脫粒的效果,而且由于在惡劣工況下工作,屬于設備中的易損件。因此,有效監(jiān)測滾筒軸承部件的運行狀態(tài),對聯(lián)合收獲機的正常運行具有重要意義。目前,軸承故障診斷的一個重要方法是通過識別其組成部件( 滾動體、保持架、內(nèi)圈、外圈)之間相互碰撞而產(chǎn)生的特征頻率來完成識別;但在實際監(jiān)測過程中,得到的振動信號中并非總是可以找到對應的特征頻率,而是表現(xiàn)為時有時無的情況。造成這一情況的原因主要有兩方面:①傳感器只能在軸承表面獲取信號,整個聯(lián)合收獲機設備中存在的干擾信號也比較大,使得特征頻率對應的信號時常被淹沒;②軸承中的滾動體在運行過程中容易發(fā)生滑失,使得與其余部件碰撞而產(chǎn)生的特征頻率缺失,使得特征頻率不顯著的信號片段難以被識別,從而影響了整體的診斷效果。
信號中特征頻率顯著的片段實際是可以用來幫助提高整體診斷效果的。因為其對應的故障狀態(tài)易于判別,從而可將它們作為狀態(tài)已知的先驗信息,然后與未知狀態(tài)的信號片段混合,再利用常見的頻域特征來進行識別,這是一種半監(jiān)督的聚類或分類方法,目前已有一些學者進行了相應的探索和研究。畢錦煙等人提出一種半監(jiān)督模糊核聚類算法用于齒輪輕微點蝕故障的檢測。徐超等人則提出一種半監(jiān)督模糊聚類算法用于發(fā)動機磨損故障的檢測。他們均是直接對目標函數(shù)進行改造,但特征空間中各個特征對數(shù)據(jù)識別的作用通常是不一的,不能很好利用距離機制來評價樣本的相似程度。為此,提出了一種基于不完全信息的.聚類方法( Clustering Approachbased on Partial Information,CAPI) 用于軸承故障的識別。該方法在兩方面利用了已知樣本的信息:①利用已知樣本對特征空間進行變換,從而實現(xiàn)距離機制的學習,以便更好地評價各個樣本之間的相似程度;②利用近鄰原則先對已知樣本進行擴充,再將擴充后的已知樣本用于目標函數(shù)的設計。最后,在某型小麥聯(lián)合收獲機滾筒軸承的滾珠輕微損傷故障及滾珠損傷和外圈損傷復合故障的識別中,驗證了所提方法的有效性。
1、基于先驗信息的距離學習方法
將監(jiān)測得到的信號分為若干段,每段信號即對應一個樣本,假設一共有n 個樣,C 類狀態(tài)。其中,第i個類有nil個已知樣本、niu個未知樣本。CAPI 首先對數(shù)據(jù)集X 中的已知樣本進行相關成分分析,得到變換矩陣W,從而將所有樣本取值進行轉(zhuǎn)換,即xnew ,j =Wxj,xj = (xj 1,xj 2,…,xjd),d 為特征總數(shù)。其具體步驟如下:1)計算第i 個類已知樣本的均值vil,則vil = 1nilΣnilj = 1xij(1)2)計算各類已知樣本對應的協(xié)方差矩陣Cor,有Cor = 1CΣCi = 1Σnilj = 1(xij - vil) (xij - vil)T (2)3)計算變換矩陣W,則W = Cor-12(3)變換矩陣是一個將有用特征顯現(xiàn)的過程。它給一些特征賦予大的權重,因為這些特征對類的區(qū)分有重要作用;而在其余特征上樣本取值的變化主要是由于各類內(nèi)部取值波動引起的,對類的區(qū)分并無貢獻,則賦予小的權重。
2、改進的半監(jiān)督聚類算法
改進的半監(jiān)督聚類算法是在轉(zhuǎn)換后的特征空間下進行的,它在目標函數(shù)中融入了已知樣本的約束,還在求解過程中利用粒子群算法克服了K 均值聚類易陷入局部極值的缺點。
2. 1 近鄰擴展策略
近鄰擴展策略是根據(jù)相鄰樣本的狀態(tài)很可能相同的原理設計的。其具體操作步驟為:
1)對于數(shù)據(jù)集Xnew中的每一個已知狀態(tài)的樣本,按照歐式距離的取值找出其k 個近鄰樣本;
2)若近鄰樣本y 本身即為已知樣本,則不做任何操作;
3)否則,若近鄰樣本y 只是一個已知樣本的近鄰,則令其所屬的類標號與已知樣本的類標號相同;
4)若近鄰樣本y 同時是多個已知樣本的近鄰,則計算各個已知樣本與近鄰樣本y 的歐式距離,找出其中最小距離對應的已知樣本,記為x* ,近鄰樣本y 的類標號,即與x* 的類標號相同。通過近鄰擴展策略,使得已知樣本的信息得以盡可能地被發(fā)掘,從而加強已知信息對聚類結(jié)果的影響。
2. 2 目標函數(shù)懲罰機制的設計
由于已知部分樣本的類別標記,本文在設計的目標函數(shù)中引入了懲罰機制。若已知樣本被錯誤的劃為其它類別,則增大目標函數(shù)值,否則不影響函數(shù)取值。又由于近鄰擴展策略中得到的已知樣本具有一定的不可靠性,為了規(guī)避該風險,若擴展所得已知樣本被錯誤劃分時,則依據(jù)k 近鄰的次序給出不同程度的懲罰。設計的目標函數(shù)為J =ΣCi = 1Σnj = 1uij ‖xnew,ij - vi‖2 +ΣCi = 1 Σnj = 1,xnew,ij∈LuijD1(xnew,ij) + (4)ΣCi = 1 Σnj = 1,xnew,ij∈KLuij2 -kD1(xnew,ij)其中,uij取值為1 或0,表示第j 個樣本是否被劃分到第i 個類;vi為第i 個類的中心;L 表示未擴展時已知樣本構(gòu)成的集合;KL 為擴展過程中產(chǎn)生的已知樣本構(gòu)成的集合。當樣本屬于集合L 且被錯誤劃分時,D1(xnew ,ij)取值為1,否則取值為0;當樣本屬于集合UL 時,D1(xnew ,ij)按相同方式取值。其中,k 值表示樣本xnew ,ij在近鄰擴展策略中所對應的近鄰順序。若為最近鄰,則k 值為1,次近鄰則為2,依次增大。
每次迭代后所有樣本的劃分按照歐式距離最近的原則進行,則uij =1 若‖xnew,ij - vi‖2 ≤ ‖xnew,pj - vp‖2,{ p = 1,2,. . . ,C 0(5)其它各類中心向量的更新為vi =Σn j=1uijxnew,ijΣnj = 1uij(6)
2. 3 基于粒子群算法的聚類過程實現(xiàn)利用粒子群算法來優(yōu)化所提目標函數(shù),并采用聚類中心的實數(shù)編碼方式,個體zi = ( zi 1,zi 2,…,zim)。其中,m 為總的編碼長度,取值為m = Cd,即每d 個基因位對應一個類的中心向量,一共有C 個類。個體zi中每個基因位的取值均為0 和1 之間的實數(shù),所以在計算前所有樣本均要歸一化到0,1 范圍內(nèi)。粒子群算法的算子為vect+1ij = wIvectij + c1 r1(z*ij - ztij) + c2 r2(ztgj - ztij)zt+1ij = ztij + vect+1ij(7)其中,vecijt表示個體zi在基因為j 上的速度;t 表示代數(shù);zi* 表示個體zi在其進化歷史中所發(fā)現(xiàn)的目標函數(shù)值最小時所對應的個體;zgt 表示目前種群中已發(fā)現(xiàn)的目標函數(shù)值最小的個體,wI為慣性權重;c1、c2、r1和r2則為權重系數(shù)。此外,為了抑制種群早熟和提高種群的多樣性,本文采用了每間隔一定代數(shù)t0即選擇一定比例的較差個體并重新生成。其具體操作方式為:將種群按照目標函數(shù)取值降序排列,選取前q 個個體,令其每個基因位的取值在0,1 之間隨機生成。
基于上述改進,CAPI 的運行流程為:
1)將正常工況下樣本標記為已知樣本,并找出監(jiān)測信號中特征頻率顯著的樣本,對應到相應故障狀態(tài)中,也標記為已知樣本,而剩余樣本則為未知樣本;
2)利用所有已知樣本進行相關成分分析,從而將所有樣本在特征空間中進行轉(zhuǎn)換;
3)將已知樣本進行近鄰擴展;
4)對擴展后的樣本進行基于粒子群算法的聚類,目標函數(shù)值最小個體對應的即為聚類的最終結(jié)果,根據(jù)未知樣本和擴展所得已知樣本被劃分的聚類標號,即得到它們對應的故障狀態(tài)。
3、實驗結(jié)果與分析
實驗采用雷沃谷神4LZ - 2. 5E 系列自走小麥聯(lián)合收獲機為研究對象,測試其滾筒軸承徑向的振動加速度信號。一共測試了3 種狀態(tài):正常狀態(tài)、滾珠有輕微凹坑的狀態(tài)及外圈和滾珠均有輕微凹坑的狀態(tài)。每種狀態(tài)均得到了60 個樣本,正常狀態(tài)在設備早期使用過程中獲得,全部為已知的樣本;而后兩種狀態(tài)通過包絡譜分析,找出特征頻率顯著的樣本分別有22個和29 個,即為已知樣本,其余則為未知樣本。兩種故障狀態(tài)中未知樣本的時域和頻域圖。這些樣本在時域信號中難以區(qū)分,而在頻域信號中盡管缺乏特征頻率,但其頻譜仍然存在一些不同。所以提出的7 個頻域特征來構(gòu)建相應的特征空間,用以識別未知樣本。這7 個頻域特征具體是平均頻率、波形穿過時域信號平均值的平均頻度、波形的穩(wěn)定系數(shù)、變異系數(shù)、頻域偏斜度、峭度和均方根比。
為了更好地說明所提各項改進的性能,本文設置了3 個對比算法,分別為:
1)先對數(shù)據(jù)進行主成分分析,然后按照貢獻率超過85%的標準構(gòu)建新的投影空間,再對其按照本文所提目標函數(shù)和粒子群方法來進行聚類,該方法稱為PCACA;
2)目標函數(shù)中不加入關于已知樣本的懲罰項,其余保持和CAPI 方法一致,稱為CAPI1;
3)不進行已知樣本的近鄰擴展,其余保持和CAPI方法一致,稱為CAPI2。
本文將所有算法中所需參數(shù)設置為:近鄰擴展策略中的k 值設為1,種群大小為50,一共進化80 代,慣性權重設為0. 79,c1為2,c2為1. 6,r1和r2為0 和1 之間的隨機數(shù),速度vec 的最大和最小值為2. 1 和- 2.1,每隔10 代選取目標函數(shù)值最差的5 個個體重新隨機生成。表1 給出了各種算法將所有樣本進行分類的正確率和虛警率(正常樣本判為故障樣本的比率),以及將未知樣本分類的漏報率(未知故障樣本判別為正常樣本的比率) 和誤報率( 將未知故障樣本的故障類型判別為其它故障類型的比率)。
CAPI 具有最高的正確率,其正確率相比其它3 種算法分別提高了2. 78%、7. 22%和5. 55%。CAPI 還具有最低的虛警率、漏報率及誤報率,其與另外3 種算法相比,虛警率、漏報率和誤報率最多降低了2. 22%、5. 79% 和5. 80%,并且CAPI 所得虛警的樣本個數(shù)為0。CAPI 與PCACA 的對比結(jié)果表明:基于已知樣本信息的特征空間轉(zhuǎn)換方法比無監(jiān)督的PCA 方法更有效力:而CAPI 與CAPI1、CAPI2 的對比結(jié)果說明:本文對目標函數(shù)的改進及提出的近鄰擴展策略對未知樣本的正確識別有顯著的促進作用。
4、結(jié)論
提出了一種針對聯(lián)合收獲機滾筒軸承故障的半監(jiān)督聚類識別方法。其中,在先驗信息的利用中,提出了兩種具體實現(xiàn)方式,分別為用已知樣本對數(shù)據(jù)特征空間進行變換和對目標函數(shù)進行改造,還提出在樣本利用中可借助近鄰概念擴充已知樣本的數(shù)量。所提方法的有效性在小麥聯(lián)合收獲機的軸承故障識別實驗中得以驗證。它們對提高故障識別的正確率,降低虛警率、漏報率和誤報率具有重要作用。同時,實驗結(jié)果表明:基于相關成分分析的特征空間重構(gòu)方法顯著提高了算法的性能,為半監(jiān)督聚類算法中已知信息的利用提供了一條有效的途徑。
【基于不完全信息的軸承故障聚類識別方法論文】相關文章:
連通聚類星識別方法11-12
基于克隆聚類的特征提取與多傳感器故障診斷10-03
軸承的壽命與故障 -管理資料01-01
基于潛在語義標引的文本聚類研究10-07
滾動軸承故障軌邊聲學檢測技術的論文02-04
基于灰色聚類的機場跑道侵入人為風險綜合評價淺析論文02-18
基于ANSYS的彈性軸承設計方法07-29
車用軸承故障檢修4例08-28
基于差空間的MPCA人臉識別方法07-31