2020年8月29日,為期三天的2020工業互聯網大會在云端拉開帷幕。30日晚,因聯科技算法工程師胡翔受邀在“工業互聯網新生代”議題上分享了他在第三屆工業大數據創新競賽上奪冠的經驗,詳細介紹轉子部件脫落故障預測的內容。
以下是演講內容整理。
我是來自西安因聯信息科技有限公司的算法工程師胡翔,今天給大家分享的是2019年第三屆工業大數據創新競賽的賽題內容——轉子部件脫落故障預測,將從以下幾個方面進行闡述:1. 賽題分析;2. 模型驗證與模型優化;3. 總結展望。
2019屆大賽賽題“大型高速旋轉機組轉子部件脫落故障預測”屬于工業領域典型的異常檢測和故障診斷問題。大型高速旋轉機組一旦發生轉子部件脫落問題,將會帶來巨大的經濟損失以及安全隱患。由于大型高速旋轉機組轉子部件脫落故障的早期特征難以捕捉,主辦方希望通過運用大數據的分析方法來識別轉子部件脫落和故障征兆強度。
初賽時組委會提供了5臺機組數據用于訓練,其中包含兩臺故障機組,同時另外提供5臺機組數據用于測試。而決賽則需要識別8臺機組的故障情況,包括兩個預測目標:一是識別哪些機組發生了轉子脫落故障,二是針對存在轉子脫落故障的機組按照故障程度對所有數據進行排序。
在采樣信息提取方面,每個機組提供6到7個測點的數據,包括聯端徑向X、聯端徑向Y等位移測點;同時機組還提供5個不同故障階段即不同故障程度的數據。每個位移測點包含5個字段,如轉子轉動的周數、總采樣點數、波形數組、采樣頻率、轉速等。對每個測點數據進行分析,發現采樣的旋轉周數不變,為32轉,采樣的總樣本量也不變,為1024個點,因此可得出結論是等角度采樣而非等時間采樣,采樣率為32點/轉。
在數據可視化方面,對位移波形進行FFT(Fast Fourier Transformation)變換之后可得階次譜。通過對正常機組和故障機組的階次譜進行分析發現,在轉子脫落故障的不同階段,正常機組的1X轉頻能量無明顯變化,而故障機組隨著故障的不斷加劇,1X轉頻能量不斷增加。
此外,對同一個測點X向和Y向的振動進行合成得到軸心軌跡。分析發現,正常機組的軸心軌跡在不同階段幾乎沒有變化,而故障機組的軸心軌跡隨著故障加劇變化明顯。
經上述分析,我的解題思路主要分為兩點,一是識別轉子部件是否存在脫落,二是識別存在脫落故障機組的征兆強度。第一個問題可歸結為二分類的問題,第二個問題的思路是通過分類概率大小來識別脫落故障的征兆強度。
之所以選擇分類概率大小來識別脫落故障征兆強度,實際上是我通過對比三個不同的解題思路后得出的結論。第一個思路是通過特征融合的方法,形成單一指標指示脫落故障,但這只適合機理簡單的場景,而大賽賽題屬于典型的機理復雜場景;第二個思路是通過回歸的方法,對訓練集數據故障賦予不同的“征兆強度標簽”,但由于賽題提供的數據存在時間上的中斷,并且該數據集的樣本屬于小樣本問題,回歸方法效果不好;第三個思路是通過分類概率大小作為故障征兆強度的指標,該思路最符合此次大賽數據集特點,因此采用第三個思路。
在采樣信息提取方面,每個機組提供6到7個測點的數據,包括聯端徑向X、聯端徑向Y等位移測點;同時機組還提供5個不同故障階段即不同故障程度的數據。每個位移測點包含5個字段,如轉子轉動的周數、總采樣點數、波形數組、采樣頻率、轉速等。對每個測點數據進行分析,發現采樣的旋轉周數不變,為32轉,采樣的總樣本量也不變,為1024個點,因此可得出結論是等角度采樣而非等時間采樣,采樣率為32點/轉。
在特征工程方面,提取時域特征和頻域特征。時域特征包括位移峰峰值,頻域特征包括1X、2X、3X轉頻的幅值,以及1X、2X、3X轉頻能量占比。
在建模數據的選擇上,考慮到最接近故障發生的a組數據與實際故障數據最為相似,因此,以a組數據作為分類正例,而無故障的數據作為分類反例組成訓練數據集進行建模。
在模型驗證方面,選擇LightGBM作為分類算法模型,然后通過五折交叉驗證,同時在這個階段需要保證驗證集的數據來源平衡,最后根據驗證結果優化分類閾值。在預測階段實際上是取每一組數據集預測的最終統計結果作為最終結果。
在模型優化方面,主要從兩個方向出發,一是特征優化和篩選,二是數據清洗。特征篩選包括兩個點,一是特征在故障數據上的單調程度。下圖是1X轉頻能量隨著故障的演變劣化的趨勢圖,從圖中可以看出,1X轉頻能量隨著故障的劣化具有比較好的單調性。二是考慮特征在未知數據即未知工況上的泛化能力。由于無量綱特征不受工況影響,而有量綱特征受工況影響,因此建模過程中我刪除了大部分有量綱特征,強化了模型的泛化能力。
在數據清洗方面,從實際數據分析發現,大機組的轉速存在完全恒定無變化的情況,而從實際業務角度出發,大機組不可能存在轉速完全無波動的情況,因此這部分數據為異常數據,將其進行清洗,不參與建模。
十分開心能獲得第一名的好成績,通過這次競賽經歷,我個人也有一些心得體會和大家分享。一是在分析問題時一定要從實際業務層面出發,業務理解對特征提取和使用具有決定性影響;二是合適的解題思路關系到解決方案的泛化能力;三是數據的預處理在整個過程中是第一步也是至關重要的一步。
此外,我認為在能夠提供連續的故障程度數據的情況下,可嘗試利用回歸方法作為解決方案思路。本次比賽僅考慮了轉子部件脫落這一個故障,但大型高速旋轉機組在現實中往往存在非常多的故障模式,因此在實際過程中需重點分析多故障模式及考慮工況主要是轉速的影響,這些都是非常值得去深入研究的。
以上就是我的分享內容,謝謝大家的聆聽!