本發(fā)明涉及存儲設(shè)備技術(shù)領(lǐng)域,具體是一種存儲設(shè)備故障自檢測方法及系統(tǒng),適于對帶有用戶可自行更換的元器件的大型存儲設(shè)備使用,用于在運維人員不介入的情況下,方便用戶直接參照維護操作指導(dǎo)信息對存儲設(shè)備故障進行維護,以降低存儲設(shè)備故障為用戶造成的損失與風(fēng)險,也減少生產(chǎn)廠商的運維投入。
背景技術(shù):
網(wǎng)絡(luò)涉及人們生活的領(lǐng)域越來越多,其對信息安全和網(wǎng)絡(luò)服務(wù)的要求也越來越高,而高可靠性服務(wù)器端的正常運行是重要的前提保障。存儲設(shè)備就是前述高可靠性服務(wù)器端的一個重要部分。
常用大型存儲設(shè)備,通常包括存儲設(shè)備控制器、控制機柜、擴展機柜、擴展控制器、以及磁盤在內(nèi)的用來管理和存儲大量數(shù)據(jù)的硬件設(shè)備,其帶有用戶可更換的元器件,比如其電源、電池、風(fēng)扇(散熱風(fēng)扇)、內(nèi)存條、磁盤等。
當存儲設(shè)備發(fā)生故障時,及時維護故障才能減少對用戶的影響和損失。而目前,當上述存儲設(shè)備發(fā)生故障時,往往是聯(lián)系生產(chǎn)廠商前來維護,而聯(lián)系生產(chǎn)廠商前來維護勢必耽誤時間,不能及時對故障進行處理,在一定程度上也會增加存儲設(shè)備的使用風(fēng)險。此為現(xiàn)有技術(shù)中的不足之處。
本發(fā)明旨在對于某些簡單的故障,如存儲設(shè)備帶有的用戶可更換的元器件、以及參照操作指導(dǎo)說明能夠克服的故障,能在運維人員不介入的情況下,由存儲設(shè)備使用方(用戶)自行進行維護和故障排除。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是,針對現(xiàn)有技術(shù)的不足,提供一種存儲設(shè)備故障自檢測方法及系統(tǒng),用于在運維人員不介入的情況下,方便用戶直接對存儲設(shè)備故障進行維護,進而降低存儲設(shè)備故障為用戶造成的損失與風(fēng)險,也減少生產(chǎn)廠商的運維投入。
為解決上述技術(shù)問題,本發(fā)明提供了一種存儲設(shè)備故障自檢測方法,所述的存儲設(shè)備帶有用戶可更換的元器件;該存儲設(shè)備故障自檢測方法包括:
步驟A、檢測上述存儲設(shè)備帶有的用戶可更換的元器件的工作狀態(tài);
步驟B、基于步驟A中檢測到的上述存儲設(shè)備帶有的用戶可更換的各元器件的工作狀態(tài),分別判定上述存儲設(shè)備帶有的用戶可更換的各元器件是否故障,并在判定上述存儲設(shè)備帶有的用戶可更換的相關(guān)元器件故障時,執(zhí)行步驟C,否則轉(zhuǎn)而執(zhí)行步驟A;
步驟C、分別生成并控制顯示當前故障元器件各自當前所發(fā)生故障的告警信息。
所述存儲設(shè)備帶有的用戶可更換的元器件包括所述存儲設(shè)備的電源、電池、風(fēng)扇、內(nèi)存條和磁盤。
該存儲設(shè)備故障自檢測方法在所述的步驟C之后還包括:
步驟D、實時檢測上述各故障元器件當前的工作狀態(tài),并基于上述當前檢測到的各故障元器件工作狀態(tài),判定上述各故障元器件當前的故障是否消除,若消除則告知用戶。
上述步驟C中分別生成當前故障元器件各自當前所發(fā)生故障的告警信息的方法步驟如下:
s1:分別獲取當前故障元器件各自當前所發(fā)生故障對應(yīng)的錯誤碼;
s2:基于上述步驟s1中獲取到的各錯誤碼,對應(yīng)獲取上述錯誤碼各自對應(yīng)的預(yù)先設(shè)定的相應(yīng)維護操作指導(dǎo)信息;
s3、基于上述步驟s1中獲取到的各錯誤碼,對應(yīng)獲取上述錯誤碼各自對應(yīng)的元器件具體故障信息;
S4、基于上述步驟s1中獲取到的各錯誤碼,對應(yīng)合并步驟s2中獲取的相應(yīng)維護操作指導(dǎo)信息和s3中獲取的相應(yīng)元器件具體故障信息,分別生成上述錯誤碼各自對應(yīng)當前故障元器件所發(fā)生故障的告警信息。
本發(fā)明還提供了一種存儲設(shè)備故障自檢測系統(tǒng),所述的存儲設(shè)備帶有用戶可更換的元器件,該存儲設(shè)備故障自檢測系統(tǒng)包括:
檢測模塊,與上述存儲設(shè)備帶有的用戶可更換的元器件分別相連,用于實時檢測上述存儲設(shè)備帶有的用戶可更換的元器件的工作狀態(tài);
顯示模塊,用于本系統(tǒng)的信息顯示;
控制模塊,連接所述的存儲設(shè)備、檢測模塊和顯示模塊,實時基于上述檢測模塊當前檢測到的上述存儲設(shè)備帶有的用戶可更換的各元器件的工作狀態(tài),判定上述存儲設(shè)備帶有的用戶可更換的各元器件是否故障,并在判定上述存儲設(shè)備帶有的用戶可更換的相關(guān)元器件故障時,分別生成并控制顯示當前故障元器件各自當前所發(fā)生故障的告警信息。
在該所述的存儲設(shè)備故障自檢測系統(tǒng)中,所述存儲設(shè)備帶有的用戶可更換的元器件包括所述存儲設(shè)備的電源、電池、風(fēng)扇、內(nèi)存條和磁盤。
在該所述的存儲設(shè)備故障自檢測系統(tǒng)中,所述的檢測模塊包括故障元器件信息收集單元和故障元器件信息上傳單元;
所述的故障元器件信息收集單元,用于在判定上述存儲設(shè)備帶有的用戶可更換的相關(guān)元器件故障時,獲取與上述當前判定為故障的用戶可更換的元器件的故障相對應(yīng)的錯誤碼;
所述的故障元器件信息上傳單元,用于將上述故障元器件信息收集單元獲取的各錯誤碼分別發(fā)送至所述的控制單元;
所述的控制模塊基于其當前接收到的各錯誤碼,對應(yīng)獲取上述錯誤碼各自對應(yīng)的預(yù)先設(shè)定的相應(yīng)維護操作指導(dǎo)信息,以及對應(yīng)獲取上述錯誤碼各自對應(yīng)的元器件具體故障信息;之后基于該當前獲取到的各錯誤碼,對應(yīng)合并上述獲取的相應(yīng)維護操作指導(dǎo)信息和相應(yīng)元器件具體故障信息,生成上述錯誤碼各自對應(yīng)當前故障元器件所發(fā)生故障的告警信息。
該存儲設(shè)備故障自檢測系統(tǒng)還包括:
查詢模塊,與所述的控制模塊相連,用于查詢所述存儲設(shè)備帶有的用戶可更換的相關(guān)元器件的告警信息。
其中,所述的查詢單元采用一組通過所述的顯示模塊進行顯示的查詢按鈕接口。
進一步地,所述的控制模塊還用于實時檢測上述各故障元器件當前的工作狀態(tài),并基于當前檢測到的各工作狀態(tài),判定上述各故障元器件當前的故障是否消除,若消除則通過顯示模塊告知用戶。
與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點在于:
本發(fā)明通過檢測存儲設(shè)備帶有的用戶可更換的元器件的工作狀態(tài),判定存儲設(shè)備帶有的用戶可更換的各元器件是否故障,并在判定上述存儲設(shè)備帶有的用戶可更換的相關(guān)元器件故障時,分別生成當前故障元器件各自當前所發(fā)生故障的告警信息,并將生成的各告警信息進行顯示,便于及時告知用戶,使用戶在運維人員不介入的情況下,通過上述告警信息的指引,能夠直接對存儲設(shè)備的可更換元器件進行維護,進而降低存儲設(shè)備故障為用戶造成的損失與風(fēng)險,也減少生產(chǎn)廠商的運維投入。
由此可見,本發(fā)明與現(xiàn)有技術(shù)相比,具有突出的實質(zhì)性特點和顯著的進步,其實施的有益效果也是顯而易見的。
附圖說明
圖1為本發(fā)明所述存儲設(shè)備故障自檢測方法的方法流程圖;
圖2為本發(fā)明所述存儲設(shè)備故障自檢測系統(tǒng)的功能結(jié)構(gòu)框圖示意圖。
具體實施方式
為使本發(fā)明的技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖,對本發(fā)明的技術(shù)方案進行清楚、完整地描述。
具體實施方式1:
如圖1所示,本發(fā)明的一種存儲設(shè)備故障自檢測方法,所述的存儲設(shè)備帶有用戶可更換的元器件;該存儲設(shè)備故障自檢測方法包括:
步驟A、檢測上述存儲設(shè)備帶有的用戶可更換的元器件的工作狀態(tài);
步驟B、基于步驟A中檢測到的上述存儲設(shè)備帶有的用戶可更換的各元器件的工作狀態(tài),分別判定上述存儲設(shè)備帶有的用戶可更換的各元器件是否故障,并在判定上述存儲設(shè)備帶有的用戶可更換的相關(guān)元器件故障時,執(zhí)行步驟C,否則轉(zhuǎn)而執(zhí)行步驟A;
步驟C、分別生成并控制顯示當前故障元器件各自當前所發(fā)生故障的告警信息。
所述存儲設(shè)備帶有的用戶可更換的元器件包括所述存儲設(shè)備的電源、電池、風(fēng)扇、內(nèi)存條和磁盤。
進一步地,該存儲設(shè)備故障自檢測方法在上述步驟C之后還包括:
步驟D、實時檢測上述各故障元器件當前的工作狀態(tài),并基于上述當前檢測到的各故障元器件工作狀態(tài),判定上述各故障元器件當前的故障是否消除,若消除則告知用戶。
上述步驟C中分別生成當前故障元器件各自當前所發(fā)生故障的告警信息的方法步驟如下:
s1:分別獲取當前故障元器件各自當前所發(fā)生故障對應(yīng)的錯誤碼;
s2:基于上述步驟s1中獲取到的各錯誤碼,對應(yīng)獲取上述錯誤碼各自對應(yīng)的預(yù)先設(shè)定的相應(yīng)維護操作指導(dǎo)信息;
s3、基于上述步驟s1中獲取到的各錯誤碼,對應(yīng)獲取上述錯誤碼各自對應(yīng)的元器件具體故障信息;
S4、基于上述步驟s1中獲取到的各錯誤碼,對應(yīng)合并步驟s2中獲取的相應(yīng)維護操作指導(dǎo)信息和s3中獲取的相應(yīng)元器件具體故障信息,分別生成上述錯誤碼各自對應(yīng)當前故障元器件所發(fā)生故障的告警信息。
本發(fā)明將相應(yīng)錯誤碼與維護操作指導(dǎo)信息一一對應(yīng),避免了數(shù)據(jù)的冗余存儲,使用方便。
本發(fā)明通過檢測存儲設(shè)備帶有的用戶可更換的元器件的工作狀態(tài),判定存儲設(shè)備帶有的用戶可更換的各元器件是否故障,并在判定上述存儲設(shè)備帶有的用戶可更換的相關(guān)元器件故障時,分別生成并控制顯示當前故障元器件各自當前所發(fā)生故障的告警信息,便于及時且主動地告知用戶,使用戶在運維人員不介入的情況下,通過上述告警信息的指引,能夠直接對存儲設(shè)備的可更換元器件進行維護。
此外,本發(fā)明所述的各告警信息均包括相應(yīng)的預(yù)先設(shè)定的維護操作指導(dǎo)信息,在上述相應(yīng)維護操作指導(dǎo)信息的指導(dǎo)下,用戶能夠更為有針對性地直接對存儲設(shè)備故障進行維護,進而降低了存儲設(shè)備故障為用戶造成的損失與風(fēng)險,也減少了生產(chǎn)廠商的運維投入,較為實用。
如圖2所示,本發(fā)明還提供了一種存儲設(shè)備故障自檢測系統(tǒng),所述的存儲設(shè)備帶有用戶可更換的元器件。其中,本發(fā)明所涉及的各存儲設(shè)備均為大型存儲設(shè)備,包括存儲設(shè)備控制器、控制機柜、擴展機柜、擴展控制器。
該存儲設(shè)備故障自檢測系統(tǒng)包括:
檢測模塊,與上述存儲設(shè)備帶有的用戶可更換的元器件分別相連,用于實時檢測上述存儲設(shè)備帶有的用戶可更換的元器件的工作狀態(tài);
顯示模塊,用于本系統(tǒng)的信息顯示;
控制模塊,連接所述的存儲設(shè)備、檢測模塊和顯示模塊,實時基于上述檢測模塊當前檢測到的上述存儲設(shè)備帶有的用戶可更換的各元器件的工作狀態(tài),判定上述存儲設(shè)備帶有的用戶可更換的各元器件是否故障,并在判定上述存儲設(shè)備帶有的用戶可更換的相關(guān)元器件故障時,分別生成并控制顯示當前故障元器件各自當前所發(fā)生故障的告警信息。
在上述存儲設(shè)備故障自檢測系統(tǒng)中,所述存儲設(shè)備帶有的用戶可更換的元器件包括所述存儲設(shè)備的電源、電池、風(fēng)扇、內(nèi)存條和磁盤。此外,所述的顯示模塊采用UI客戶端進行顯示。
所述的檢測模塊包括故障元器件信息收集單元和故障元器件信息上傳單元;
所述的故障元器件信息收集單元,用于在判定上述存儲設(shè)備帶有的用戶可更換的相關(guān)元器件故障時,獲取與上述當前判定為故障的用戶可更換的元器件的故障相對應(yīng)的錯誤碼;
所述的故障元器件信息上傳單元,用于將上述故障元器件信息收集單元獲取的各錯誤碼分別發(fā)送至所述的控制單元;
所述的控制模塊基于其當前接收到的各錯誤碼,對應(yīng)獲取上述錯誤碼各自對應(yīng)的預(yù)先設(shè)定的相應(yīng)維護操作指導(dǎo)信息,以及對應(yīng)獲取上述錯誤碼各自對應(yīng)的元器件具體故障信息;之后基于該當前獲取到的各錯誤碼,對應(yīng)合并上述獲取的相應(yīng)維護操作指導(dǎo)信息和相應(yīng)元器件具體故障信息,生成上述錯誤碼各自對應(yīng)當前故障元器件所發(fā)生故障的告警信息。
進一步地,上述故障元器件信息收集單元,還用于在判定上述存儲設(shè)備帶有的用戶可更換的相關(guān)元器件故障時,至少獲取以下與上述當前判定為故障的用戶可更換的元器件的位置信息、object-type(如上述電池、電源、內(nèi)存條等),以及對上述當前判定為故障的用戶可更換的元器件對應(yīng)故障的進行描述的故障說明信息。其中,在本實施方式中,上述元器件具體故障信息包括該所述的用戶可更換的元器件的位置信息、object-type(如上述電池、電源、內(nèi)存條等),以及對上述當前判定為故障的用戶可更換的元器件對應(yīng)故障的進行描述的故障說明信息。所述故障元器件信息上傳單元用于將上述故障元器件信息收集單元獲取的各信息分別上傳至所述的控制模塊。
進一步地,該存儲設(shè)備故障自檢測系統(tǒng)還包括:
查詢模塊,與所述的控制模塊相連,用于查詢所述存儲設(shè)備帶有的用戶可更換的相關(guān)元器件的告警信息。使用時,用戶基于其查詢到的告警信息,能夠得知存儲設(shè)備故障的是哪一個元器件、如何進行維護。進一步地,通過所述的維護操作指導(dǎo)信息,能夠告知用戶是進行元器件的更換還是維修,以及如何進行維修。使用方便。
其中,所述的查詢單元采用一組通過所述的顯示模塊進行顯示的查詢按鈕接口。
進一步地,所述的控制模塊還用于實時檢測上述各故障元器件當前的工作狀態(tài),并基于當前檢測到的各工作狀態(tài),判定上述各故障元器件當前的故障是否消除,若消除則通過顯示模塊告知用戶。
綜上,對于本發(fā)明所述的存儲設(shè)備故障自檢測系統(tǒng),其也通過檢測存儲設(shè)備帶有的用戶可更換的元器件的工作狀態(tài),判定存儲設(shè)備帶有的用戶可更換的各元器件是否故障,并在判定上述存儲設(shè)備帶有的用戶可更換的相關(guān)元器件故障時,分別控制生成與顯示與上述各相關(guān)故障元器件當前所發(fā)生故障相對應(yīng)的告警信息,各告警信息分別包括相應(yīng)的預(yù)先設(shè)定的維護操作指導(dǎo)信息,以便及時且主動地告知用戶,使用戶在運維人員不介入的情況下,通過上述相應(yīng)維護操作指導(dǎo)信息的指引,能夠直接對存儲設(shè)備故障進行維護,進而降低了存儲設(shè)備故障為用戶造成的損失與風(fēng)險,也減少了生產(chǎn)廠商的運維投入,較為實用。
以上實施方式僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實施方式對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當理解:其依然可以對前述各實施方式所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施方式技術(shù)方案的范圍。