本發(fā)明涉及計算機,尤其涉及一種電子器件健康狀態(tài)預(yù)測方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、隨著大數(shù)據(jù)、云計算、5g等技術(shù)的快速發(fā)展,數(shù)據(jù)量呈現(xiàn)爆炸性增長,為此云服務(wù)廠商建立龐大的數(shù)據(jù)中心,為用戶提供高品質(zhì)的服務(wù),而數(shù)據(jù)中心的穩(wěn)定運行成為影響用戶體驗的關(guān)鍵。數(shù)據(jù)中心需要長期運行,對于組成數(shù)據(jù)中心的各電子器件,其物理特性決定了使用時間越長故障的幾率會增加,健康狀態(tài)越差。例如:數(shù)據(jù)中心中,硬盤故障最為常見,若硬盤故障,會造成在硬盤上運行的任務(wù)或系統(tǒng)崩潰,導(dǎo)致服務(wù)中斷,還可能會導(dǎo)致用戶存儲的數(shù)據(jù)丟失。
2、目前,對于電子器件的故障防護機制包括被動式防護和主動式防護,被動式防護是在電子器件發(fā)生故障后采取補救措施,主動式防護通常是通過機器學(xué)習模型預(yù)測電子器件的健康狀態(tài),但對于一種電子器件,也有不同廠家的產(chǎn)品,同一廠家也有不同型號的產(chǎn)品,現(xiàn)有的相關(guān)機器學(xué)習模型未考慮這些產(chǎn)品的差異,即未考慮不同型號的電子器件的運行狀態(tài)數(shù)據(jù)對模型參數(shù)的影響,導(dǎo)致現(xiàn)有的機器學(xué)習模型對電子器件的健康狀態(tài)預(yù)測不準確。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供一種電子器件健康狀態(tài)預(yù)測方法、裝置、電子設(shè)備及存儲介質(zhì),用以解決現(xiàn)有相關(guān)技術(shù)中的機器學(xué)習模型對電子器件的健康狀態(tài)預(yù)測不準確的技術(shù)問題。
2、本發(fā)明提供一種電子器件健康狀態(tài)預(yù)測方法,包括以下步驟。
3、獲取目標電子器件當前的運行狀態(tài)數(shù)據(jù)。
4、將所述運行狀態(tài)數(shù)據(jù)輸入健康狀態(tài)預(yù)測模型,得到所述健康狀態(tài)預(yù)測模型基于所述目標電子器件所屬型號輸出的當前健康狀態(tài)等級。
5、其中,所述健康狀態(tài)預(yù)測模型基于多域?qū)W習機制構(gòu)建,每個域分別對應(yīng)同類電子器件的一種型號,所述健康狀態(tài)預(yù)測模型基于不同型號的同類電子器件的運行狀態(tài)數(shù)據(jù)樣本,以及所述運行狀態(tài)數(shù)據(jù)樣本對應(yīng)的健康狀態(tài)等級標簽訓(xùn)練得到。
6、根據(jù)本發(fā)明提供的一種電子器件健康狀態(tài)預(yù)測方法,所述健康狀態(tài)預(yù)測模型包括:共享全連接神經(jīng)網(wǎng)絡(luò)和n個特定域全連接神經(jīng)網(wǎng)絡(luò),其中,n大于等于2,一個特定域全連接神經(jīng)網(wǎng)絡(luò)對應(yīng)電子器件的一個型號。
7、每個所述特定域全連接神經(jīng)網(wǎng)絡(luò)對應(yīng)型號的權(quán)重由所述共享全連接神經(jīng)網(wǎng)絡(luò)的共享參數(shù)與特定域全連接神經(jīng)網(wǎng)絡(luò)的特定參數(shù)按位相乘得到,所述權(quán)重用于對輸入特定域全連接神經(jīng)網(wǎng)絡(luò)的對應(yīng)型號的輸入特征向量加權(quán)。
8、所述共享參數(shù)用于在訓(xùn)練階段學(xué)習不同型號的同類電子器件的運行狀態(tài)數(shù)據(jù)樣本的共有特征,所述特定參數(shù)用于在訓(xùn)練階段學(xué)習特定型號的同類電子器件的運行狀態(tài)數(shù)據(jù)樣本的特定特征。
9、根據(jù)本發(fā)明提供的一種電子器件健康狀態(tài)預(yù)測方法,所述共享全連接神經(jīng)網(wǎng)絡(luò)和特定域全連接神經(jīng)網(wǎng)絡(luò)均包括多個特征提取層,每個所述特征提取層均包括:歸一化模塊和特征提取模塊。
10、所述歸一化模塊用于按所述目標電子器件所屬型號對應(yīng)的均值和方差對輸入特征向量進行歸一化處理,所述均值和方差是在所述健康狀態(tài)預(yù)測模型推理預(yù)測過程中統(tǒng)計得到。
11、所述特征提取模塊用于對歸一化后的輸入特征向量進行特征提取。
12、根據(jù)本發(fā)明提供的一種電子器件健康狀態(tài)預(yù)測方法,所述歸一化模塊用于按如下公式進行歸一化。
13、。
14、其中, z表示歸一化前的輸入特征向量, z'表示歸一化后的輸入特征向量, e p表示目標電子器件所屬型號 p對應(yīng)的輸入特征向量的均值, var p表示目標電子器件所屬型號 p對應(yīng)的輸入特征向量的方差, γ表示所述歸一化模塊的共享范圍向量, γ p表示所述歸一化模塊對應(yīng)型號 p的特定范圍向量, β表示 γ的共享偏置項向量, β p表示 γ p的特定偏置項向量, ε為常數(shù)。
15、根據(jù)本發(fā)明提供的一種電子器件健康狀態(tài)預(yù)測方法,將所述運行狀態(tài)數(shù)據(jù)輸入健康狀態(tài)預(yù)測模型,得到所述健康狀態(tài)預(yù)測模型基于所述目標電子器件所屬型號輸出的當前健康狀態(tài)等級,包括以下步驟。
16、將所述運行狀態(tài)數(shù)據(jù)輸入健康狀態(tài)預(yù)測模型的共享全連接神經(jīng)網(wǎng)絡(luò),以及與所述目標電子器件所屬型號對應(yīng)的特定域全連接神經(jīng)網(wǎng)絡(luò),分別得到共享全連接神經(jīng)網(wǎng)絡(luò)輸出的第一特征向量和特定域全連接神經(jīng)網(wǎng)絡(luò)輸出的第二特征向量。
17、將所述第一特征向量和第二特征向量按位相乘得到表征所述當前健康狀態(tài)等級的結(jié)果特征向量。
18、根據(jù)本發(fā)明提供的一種電子器件健康狀態(tài)預(yù)測方法,將所述運行狀態(tài)數(shù)據(jù)輸入健康狀態(tài)預(yù)測模型的共享全連接神經(jīng)網(wǎng)絡(luò),以及與所述目標電子器件所屬型號對應(yīng)的特定域全連接神經(jīng)網(wǎng)絡(luò),分別得到共享全連接神經(jīng)網(wǎng)絡(luò)輸出的第一特征向量和特定域全連接神經(jīng)網(wǎng)絡(luò)輸出的第二特征向量,包括以下步驟。
19、將所述運行狀態(tài)數(shù)據(jù)輸入所述共享全連接神經(jīng)網(wǎng)絡(luò),所述共享全連接神經(jīng)網(wǎng)絡(luò)的每一層輸出如下。
20、。
21、確定最后一層的輸出 out為所述第一特征向量,其中, w表示所述共享參數(shù),所述共享參數(shù)為共享全連接神經(jīng)網(wǎng)絡(luò)中特征提取模塊的參數(shù), in表示共享全連接神經(jīng)網(wǎng)絡(luò)中當前層的歸一化模塊的輸出, b表示 w的共享偏置項向量,表示激活函數(shù)。
22、將所述運行狀態(tài)數(shù)據(jù)輸入所述特定域全連接神經(jīng)網(wǎng)絡(luò),所述特定域全連接神經(jīng)網(wǎng)絡(luò)的每一層輸出如下。
23、。
24、確定最后一層的輸出 out p為所述第二特征向量,其中, in p表示型號 p對應(yīng)的特定域全連接神經(jīng)網(wǎng)絡(luò)中當前層的歸一化模塊的輸出。
25、。
26、 w p表示型號 p對應(yīng)的所述特定參數(shù),所述特定參數(shù)為型號 p對應(yīng)的特定域全連接神經(jīng)網(wǎng)絡(luò)中特征提取模塊的參數(shù), b p表示 w p的特定偏置項向量,表示型號 p的權(quán)重,表示的特定偏置項向量,表示向量的按位相乘運算。
27、根據(jù)本發(fā)明提供的一種電子器件健康狀態(tài)預(yù)測方法,將所述運行狀態(tài)數(shù)據(jù)輸入健康狀態(tài)預(yù)測模型之前,還包括以下步驟。
28、獲取所述目標電子器件的型號,對型號編碼得到所述目標電子器件的型號標識碼。
29、將所述運行狀態(tài)數(shù)據(jù)輸入與所述目標電子器件所屬型號對應(yīng)的特定域全連接神經(jīng)網(wǎng)絡(luò),包括:基于所述型號標識碼識別對應(yīng)的特定域全連接神經(jīng)網(wǎng)絡(luò),并將所述運行狀態(tài)數(shù)據(jù)輸入與所述目標電子器件所屬型號對應(yīng)的特定域全連接神經(jīng)網(wǎng)絡(luò)。
30、根據(jù)本發(fā)明提供的一種電子器件健康狀態(tài)預(yù)測方法,所述健康狀態(tài)預(yù)測模型訓(xùn)練過程如下。
31、將所述運行狀態(tài)數(shù)據(jù)樣本輸入初始模型的共享全連接神經(jīng)網(wǎng)絡(luò),得到共享全連接神經(jīng)網(wǎng)絡(luò)輸出的第一預(yù)測結(jié)果。
32、將型號標識碼對應(yīng)運行狀態(tài)數(shù)據(jù)樣本輸入初始模型中與型號標識碼對應(yīng)的特定域全連接神經(jīng)網(wǎng)絡(luò),得到特定域全連接神經(jīng)網(wǎng)絡(luò)輸出的第二預(yù)測結(jié)果。
33、將所述第一預(yù)測結(jié)果和第二預(yù)測結(jié)果按位相乘得到最終預(yù)測結(jié)果。
34、將所述最終預(yù)測結(jié)果與所述健康狀態(tài)等級標簽代入損失函數(shù),在損失函數(shù)未收斂的情況下,執(zhí)行反向傳播,更新所述共享參數(shù)、特定參數(shù)、共享范圍向量和特定范圍向量;在損失函數(shù)收斂的情況下,模型訓(xùn)練完成。
35、根據(jù)本發(fā)明提供的一種電子器件健康狀態(tài)預(yù)測方法,所述健康狀態(tài)預(yù)測模型訓(xùn)練過程如下。
36、將所述運行狀態(tài)數(shù)據(jù)樣本輸入初始模型的共享全連接神經(jīng)網(wǎng)絡(luò),得到共享全連接神經(jīng)網(wǎng)絡(luò)輸出的第一預(yù)測結(jié)果。
37、將型號標識碼對應(yīng)運行狀態(tài)數(shù)據(jù)樣本輸入初始模型中與所述型號標識碼對應(yīng)的特定域全連接神經(jīng)網(wǎng)絡(luò),得到特定域全連接神經(jīng)網(wǎng)絡(luò)輸出的第二預(yù)測結(jié)果。
38、將所述第一預(yù)測結(jié)果和第二預(yù)測結(jié)果按位相乘得到第三預(yù)測結(jié)果。
39、將所述型號標識碼對應(yīng)的特定域全連接神經(jīng)網(wǎng)絡(luò)的中間層輸出的中間特征向量輸入與所述型號標識碼對應(yīng)的輔助神經(jīng)網(wǎng)絡(luò),得到所述輔助神經(jīng)網(wǎng)絡(luò)輸出的第四預(yù)測結(jié)果,所述第四預(yù)測結(jié)果與所述第三預(yù)測結(jié)果維度相等。
40、基于所述第三預(yù)測結(jié)果和第四預(yù)測結(jié)果確定最終預(yù)測結(jié)果。
41、將所述最終預(yù)測結(jié)果與所述健康狀態(tài)等級標簽代入損失函數(shù),在損失函數(shù)未收斂的情況下,執(zhí)行反向傳播,更新所述共享參數(shù)、特定參數(shù)、共享范圍向量、特定范圍向量和輔助神經(jīng)網(wǎng)絡(luò)的模型參數(shù);在損失函數(shù)收斂的情況下,模型訓(xùn)練完成。
42、根據(jù)本發(fā)明提供的一種電子器件健康狀態(tài)預(yù)測方法,基于所述第三預(yù)測結(jié)果和第四預(yù)測結(jié)果確定最終預(yù)測結(jié)果,包括:按如下公式確定所述最終預(yù)測結(jié)果。
43、。
44、其中,表示最終預(yù)測結(jié)果,表示第三預(yù)測結(jié)果,表示第四預(yù)測結(jié)果, softmax表示歸一化函數(shù)。
45、根據(jù)本發(fā)明提供的一種電子器件健康狀態(tài)預(yù)測方法,所述運行狀態(tài)數(shù)據(jù)樣本對應(yīng)的健康狀態(tài)等級標簽按如下方式設(shè)定。
46、以所述運行狀態(tài)數(shù)據(jù)樣本對應(yīng)的故障電子器件發(fā)生故障的時刻為起始時刻,往前確定至少兩個目標時間點,以將起始時刻往前的時間劃分為至少三個時間段。
47、按所述運行狀態(tài)數(shù)據(jù)樣本的采集時刻所在的時間段設(shè)定所述運行狀態(tài)數(shù)據(jù)樣本對應(yīng)的健康狀態(tài)等級標簽。
48、根據(jù)本發(fā)明提供的一種電子器件健康狀態(tài)預(yù)測方法,以所述運行狀態(tài)數(shù)據(jù)樣本對應(yīng)的故障電子器件發(fā)生故障的時刻為起始時刻,往前確定至少兩個目標時間點,包括:對于所述運行狀態(tài)數(shù)據(jù)樣本中各屬性項,采用回歸決策樹模型,以所述起始時刻之前的時間為擬合目標,以平均絕對誤差作為所述回歸決策樹模型的損失函數(shù),擬合出將所述起始時刻之前的時間分隔的至少兩個分隔時間點;選擇平均絕對誤差總和最小的屬性項對應(yīng)的回歸決策樹模型擬合出的分隔時間點作為所述目標時間點。
49、根據(jù)本發(fā)明提供的一種電子器件健康狀態(tài)預(yù)測裝置,包括以下單元。
50、數(shù)據(jù)獲取單元,用于獲取目標電子器件當前的運行狀態(tài)數(shù)據(jù)。
51、模型執(zhí)行單元,用于將所述運行狀態(tài)數(shù)據(jù)輸入健康狀態(tài)預(yù)測模型,得到所述健康狀態(tài)預(yù)測模型基于所述目標電子器件所屬型號輸出的當前健康狀態(tài)等級。
52、其中,所述健康狀態(tài)預(yù)測模型基于多域?qū)W習機制構(gòu)建,每個域分別對應(yīng)同類電子器件的一種型號,所述健康狀態(tài)預(yù)測模型基于不同型號的同類電子器件的運行狀態(tài)數(shù)據(jù)樣本,以及所述運行狀態(tài)數(shù)據(jù)樣本對應(yīng)的健康狀態(tài)等級標簽訓(xùn)練得到。
53、本發(fā)明還提供一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如上述任一種所述的電子器件健康狀態(tài)預(yù)測方法。
54、本發(fā)明還提供一種非暫態(tài)計算機可讀存儲介質(zhì),其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)如上述任一種所述電子器件健康狀態(tài)預(yù)測方法。
55、本發(fā)明提供的電子器件健康狀態(tài)預(yù)測方法、裝置、電子設(shè)備及存儲介質(zhì),通過將所述運行狀態(tài)數(shù)據(jù)輸入健康狀態(tài)預(yù)測模型,得到所述健康狀態(tài)預(yù)測模型基于所述目標電子器件所屬型號輸出的當前健康狀態(tài)等級,而且健康狀態(tài)預(yù)測模型是基于多域?qū)W習機制構(gòu)建的,每個域分別對應(yīng)同類電子器件的一種型號,所述健康狀態(tài)預(yù)測模型基于不同型號的同類電子器件的運行狀態(tài)數(shù)據(jù)樣本,以及所述運行狀態(tài)數(shù)據(jù)樣本對應(yīng)的健康狀態(tài)等級標簽訓(xùn)練得到,由于采用多域?qū)W習機制,該健康狀態(tài)預(yù)測模型在訓(xùn)練時,其模型參數(shù)能夠從不同型號電子器件的運行狀態(tài)數(shù)據(jù)樣本中學(xué)習到共性的知識或特征,以及學(xué)習到不同型號電子器件的運行狀態(tài)數(shù)據(jù)樣本中的特定特征,最終訓(xùn)練好的模型具有更好的泛化能力和對不同型號電子器件的特征表達能力,因此,在預(yù)測時,能夠根據(jù)目標電子器件所屬型號輸出適應(yīng)于該型號目標電子器件的當前健康狀態(tài)等級,使得對健康狀態(tài)的預(yù)測更準確,即對不同型號的同類電子器件都能夠準確預(yù)測其健康狀態(tài)。