一種內(nèi)存告警的優(yōu)化方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機服務(wù)器技術(shù)領(lǐng)域,尤具體地說是一種實用性強、內(nèi)存告警的優(yōu)化方法。
【背景技術(shù)】
[0002]內(nèi)存是服務(wù)器與計算機中必須的設(shè)備,尤其是在服務(wù)器系統(tǒng)中內(nèi)存的可靠性對整體服務(wù)器系統(tǒng)的影響具有至關(guān)重要的決定性,在服務(wù)器系統(tǒng)運行過程中,隨著時間的推移,內(nèi)存的電子電器物理特性下降,會產(chǎn)生內(nèi)存讀寫錯誤,大部分內(nèi)存的讀寫錯誤都是可修復(fù)的,即系統(tǒng)具有自我修復(fù)特性,通過ECC機制可以修正內(nèi)存錯誤,但是如果內(nèi)存條發(fā)生故障,即物理損壞就會出現(xiàn)大量可修復(fù)的內(nèi)存錯誤,影響系統(tǒng)整體性能,最終可能影響系統(tǒng)宕機,給客戶造成不可挽回的損失。
[0003]基于以上所提,內(nèi)存告警機制被提出應(yīng)用到服務(wù)器系統(tǒng)上,即當(dāng)內(nèi)存上有錯誤發(fā)生時,通過日志提醒、點亮故障內(nèi)存燈等方式告知客戶,及時排除隱患。傳統(tǒng)內(nèi)存告警方法,內(nèi)存以rank為單位設(shè)置內(nèi)存錯誤計數(shù)器i,設(shè)置錯誤閾值N,當(dāng)在這個rank上出現(xiàn)一個錯誤后i++,到i等于N時觸發(fā)告警并清零,指示內(nèi)存該rank上發(fā)生內(nèi)存錯誤,該方法存在一定的問題,即系統(tǒng)開機后,隨著系統(tǒng)的不斷運行,難免會產(chǎn)生內(nèi)存錯誤,隨著時間的推移,內(nèi)存錯誤計數(shù)器i終會等于閾值N觸發(fā)告警,但是此時系統(tǒng)運行并沒有問題,這屬于誤告警。
[0004]鑒于存在的問題,本發(fā)明提出一種內(nèi)存告警的優(yōu)化方法,即在傳統(tǒng)方法的基礎(chǔ)上設(shè)置時間計時器t與時間閾值T,只有在規(guī)定時間閾值T內(nèi)達(dá)到錯誤閾值N時才告警,否則不告警。相對傳統(tǒng)方法,本發(fā)明更加優(yōu)化內(nèi)存告警機制,延長內(nèi)存使用周期,提高產(chǎn)品質(zhì)量,具有重要的應(yīng)用價值。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的技術(shù)任務(wù)是針對以上不足之處,提供一種實用性強、內(nèi)存告警的優(yōu)化方法。
[0006]—種內(nèi)存告警的優(yōu)化方法,其具體實現(xiàn)過程為:
設(shè)置步驟,即設(shè)置錯誤閾值N、時間計時器t與時間閾值T ;
告警步驟,即當(dāng)在規(guī)定時間閾值T內(nèi)達(dá)到錯誤閾值N時進(jìn)行告警,否則不告警。
[0007]所述設(shè)置步驟的具體過程為:
內(nèi)存以rank為單位設(shè)置內(nèi)存錯誤計數(shù)器i,設(shè)置錯誤閾值N,當(dāng)在這個rank上出現(xiàn)一個錯誤后i++,到i等于N時觸發(fā)告警并清零,指示內(nèi)存該rank上發(fā)生內(nèi)存錯誤;
在上述步驟的基礎(chǔ)上以rank為單位增加時間計時器t,用來記錄時間,設(shè)置時間閾值
T0
[0008]所述告警步驟的具體過程為:
基于設(shè)置步驟設(shè)置的內(nèi)容,當(dāng)在該rank上有內(nèi)存錯誤發(fā)生時,錯誤計數(shù)器i開始計數(shù),同時時間計時器t開始記錄時間,只有在規(guī)定時間閾值T內(nèi)達(dá)到錯誤閾值N時才告警,錯誤計數(shù)器i與時間計時器t分別清零,重新統(tǒng)計;當(dāng)在規(guī)定時間閾值T內(nèi)達(dá)不到錯誤閾值N時則不告警,同樣錯誤計數(shù)器i與時間計時器t分別清零,重新統(tǒng)計。
[0009]本發(fā)明的一種內(nèi)存告警的優(yōu)化方法,具有以下優(yōu)點:
本發(fā)明的一種內(nèi)存告警的優(yōu)化方法,相對傳統(tǒng)方法,本發(fā)明更加優(yōu)化內(nèi)存告警機制;結(jié)合主板設(shè)計、系統(tǒng)特性以及內(nèi)存品質(zhì)特性的實際測試,選取合適的錯誤閾值N與時間閾值T可以起到延長內(nèi)存使用壽命,提高服務(wù)器系統(tǒng)產(chǎn)品質(zhì)量的作用,該方法在服務(wù)器內(nèi)存告警領(lǐng)域具有非常重要的應(yīng)用價值,實用性強,易于推廣。
【附圖說明】
[0010]附圖1為本發(fā)明的實現(xiàn)流程圖。
【具體實施方式】
[0011]下面結(jié)合附圖和具體實施例對本發(fā)明作進(jìn)一步說明。
[0012]本發(fā)明提供一種內(nèi)存告警的優(yōu)化方法,即在傳統(tǒng)方法的基礎(chǔ)上設(shè)置時間計時器t與時間閾值T,只有在規(guī)定時間閾值T內(nèi)達(dá)到錯誤閾值N時才告警,否則不告警。相對傳統(tǒng)方法,本發(fā)明更加優(yōu)化內(nèi)存告警機制;結(jié)合主板設(shè)計、系統(tǒng)特性以及內(nèi)存品質(zhì)特性的實際測試,選取合適的錯誤閾值N與時間閾值T可以起到延長內(nèi)存使用壽命,提高服務(wù)器系統(tǒng)產(chǎn)品質(zhì)量的作用,該方法在服務(wù)器內(nèi)存告警領(lǐng)域具有非常重要的應(yīng)用價值。
[0013]其具體實現(xiàn)過程為:
設(shè)置步驟,即設(shè)置錯誤閾值N、時間計時器t與時間閾值T ;
告警步驟,即當(dāng)在規(guī)定時間閾值T內(nèi)達(dá)到錯誤閾值N時進(jìn)行告警,否則不告警。
[0014]結(jié)合附圖1,上述步驟的具體實現(xiàn)過程為:
S10:內(nèi)存以rank為單位設(shè)置內(nèi)存錯誤計數(shù)器i,設(shè)置錯誤閾值N,當(dāng)在這個rank上出現(xiàn)一個錯誤后i++,到i等于N時觸發(fā)告警并清零,指示內(nèi)存該rank上發(fā)生內(nèi)存錯誤。
[0015]S11:在S10基礎(chǔ)上以rank為單位增加時間計時器t,用來記錄時間,設(shè)置時間閾值T。
[0016]S12:結(jié)合S10與S11,當(dāng)在該rank上有內(nèi)存錯誤發(fā)生時,錯誤計數(shù)器i開始計數(shù),同時時間計時器t開始記錄時間,只有在規(guī)定時間閾值T內(nèi)達(dá)到錯誤閾值N時才告警,錯誤計數(shù)器i與時間計時器t分別清零,重新統(tǒng)計;如果在規(guī)定時間閾值T內(nèi)達(dá)不到錯誤閾值N則不告警,同樣錯誤計數(shù)器i與時間計時器t分別清零,重新統(tǒng)計。
[0017]上述【具體實施方式】僅是本發(fā)明的具體個案,本發(fā)明的專利保護(hù)范圍包括但不限于上述【具體實施方式】,任何符合本發(fā)明的一種內(nèi)存告警的優(yōu)化方法的權(quán)利要求書的且任何所述技術(shù)領(lǐng)域的普通技術(shù)人員對其所做的適當(dāng)變化或替換,皆應(yīng)落入本發(fā)明的專利保護(hù)范圍。
【主權(quán)項】
1.一種內(nèi)存告警的優(yōu)化方法,其特征在于,其具體實現(xiàn)過程為: 設(shè)置步驟,即設(shè)置錯誤閾值N、時間計時器t與時間閾值T ; 告警步驟,即當(dāng)在規(guī)定時間閾值T內(nèi)達(dá)到錯誤閾值N時進(jìn)行告警,否則不告警。2.根據(jù)權(quán)利要求1所述的一種內(nèi)存告警的優(yōu)化方法,其特征在于,所述設(shè)置步驟的具體過程為: 內(nèi)存以rank為單位設(shè)置內(nèi)存錯誤計數(shù)器i,設(shè)置錯誤閾值N,當(dāng)在這個rank上出現(xiàn)一個錯誤后i++,到i等于N時觸發(fā)告警并清零,指示內(nèi)存該rank上發(fā)生內(nèi)存錯誤; 在上述步驟的基礎(chǔ)上以rank為單位增加時間計時器t,用來記錄時間,設(shè)置時間閾值To3.根據(jù)權(quán)利要求2所述的一種內(nèi)存告警的優(yōu)化方法,其特征在于,所述告警步驟的具體過程為:基于設(shè)置步驟設(shè)置的內(nèi)容,當(dāng)在該rank上有內(nèi)存錯誤發(fā)生時,錯誤計數(shù)器i開始計數(shù),同時時間計時器t開始記錄時間,只有在規(guī)定時間閾值T內(nèi)達(dá)到錯誤閾值N時才告警,錯誤計數(shù)器i與時間計時器t分別清零,重新統(tǒng)計;當(dāng)在規(guī)定時間閾值T內(nèi)達(dá)不到錯誤閾值N時則不告警,同樣錯誤計數(shù)器i與時間計時器t分別清零,重新統(tǒng)計。
【專利摘要】本發(fā)明公開了一種內(nèi)存告警的優(yōu)化方法,其具體實現(xiàn)過程為:設(shè)置步驟,即設(shè)置錯誤閾值N、時間計時器t與時間閾值T;告警步驟,即當(dāng)在規(guī)定時間閾值T內(nèi)達(dá)到錯誤閾值N時進(jìn)行告警,否則不告警。該一種內(nèi)存告警的優(yōu)化方法與現(xiàn)有技術(shù)相比,提高服務(wù)器系統(tǒng)產(chǎn)品質(zhì)量的作用,該方法在服務(wù)器內(nèi)存告警領(lǐng)域具有非常重要的應(yīng)用價值,實用性強,易于推廣。
【IPC分類】G06F11/30
【公開號】CN105426288
【申請?zhí)枴緾N201510759302
【發(fā)明人】李道童, 顏偉, 劉冰
【申請人】浪潮電子信息產(chǎn)業(yè)股份有限公司
【公開日】2016年3月23日
【申請日】2015年11月10日