一種雙活雙控存儲系統(tǒng)的冗余鏈路設(shè)計方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及雙活雙控存儲系統(tǒng)技術(shù)領(lǐng)域,特別是涉及一種雙活雙控存儲系統(tǒng)的冗余鏈路設(shè)計方法及系統(tǒng)。
【背景技術(shù)】
[0002]當今,隨著信息技術(shù)的飛速發(fā)展,存儲系統(tǒng)在IT系統(tǒng)的基石作用更明顯,在多數(shù)存儲系統(tǒng)中,一般存在2個節(jié)點(即兩個控制器),兩個節(jié)點間需要進行冗余交互。
[0003]目前常用的存儲系統(tǒng)是雙活雙控存儲系統(tǒng),其工作模式為雙控雙活工作模式(又被成為Active-Active工作模式),即兩個控制器都處于激活狀態(tài),可并行處理來自應(yīng)用服務(wù)器的I/O請求,一旦某個控制器出現(xiàn)故障或離線,另一個控制器將及時接管其工作,且不影響自己現(xiàn)有的任務(wù)。該工作模式在通過互為冗余備份來確保系統(tǒng)高可靠性的同時,還具有均衡業(yè)務(wù)量、充分利用資源和提升系統(tǒng)性能等諸多優(yōu)點。
[0004]實際應(yīng)用中,雙活雙控存儲系統(tǒng)中兩個控制器之間是通過冗余鏈路實現(xiàn)對控制器信息的冗余備份。其中,控制器信息為雙控冗余所需的必備資源,包含數(shù)據(jù)信息、心跳信息、配置信息等必須共享的信息。
[0005]現(xiàn)有技術(shù)中,雙活雙控存儲系統(tǒng)的冗余鏈路設(shè)計主要有2種:一是單獨的機箱外接鏈路,通過線纜來實現(xiàn)雙節(jié)點的互連,實現(xiàn)數(shù)據(jù)共享鏈路。但此種方式無法實現(xiàn)冗余,且比較容易受到外部環(huán)境的干擾。二是在機箱內(nèi)使用共享背板,實現(xiàn)部分數(shù)據(jù)的共享。但此時無法實現(xiàn)服務(wù)業(yè)務(wù)的共享冗余。
[0006]針對以上問題,亟需一種雙活雙控存儲系統(tǒng)的冗余鏈路設(shè)計方法,以實現(xiàn)多路冗余,保證系統(tǒng)可靠性和業(yè)務(wù)連續(xù)性。
【發(fā)明內(nèi)容】
[0007]有鑒于此,本發(fā)明提供了一種雙活雙控存儲系統(tǒng)的冗余鏈路設(shè)計方法及系統(tǒng),以實現(xiàn)多路冗余,保證系統(tǒng)可靠性和業(yè)務(wù)連續(xù)性的目的。
[0008]為解決上述技術(shù)問題,本發(fā)明提供一種雙活雙控存儲系統(tǒng)的冗余鏈路設(shè)計方法,利用第一心跳鏈路傳輸心跳信息及利用第一數(shù)據(jù)鏈路傳輸數(shù)據(jù)信息,該方法包括:
[0009]監(jiān)測所述第一心跳鏈路和所述第一數(shù)據(jù)鏈路的工作狀態(tài);
[0010]當監(jiān)測到所述第一心跳鏈路發(fā)生故障時,判斷所述第一數(shù)據(jù)鏈路是否發(fā)生故障,當判定所述第一數(shù)據(jù)鏈路未發(fā)生故障時,啟動第二心跳鏈路,并利用所述第二心跳鏈路傳輸所述心跳信息;
[0011]當判定所述第一數(shù)據(jù)鏈路發(fā)生故障時,啟動所述第二心跳鏈路和第二數(shù)據(jù)鏈路,并利用所述第二心跳鏈路傳輸所述心跳信息,利用第二數(shù)據(jù)鏈路傳輸所述數(shù)據(jù)信息。
[0012]上述方法中,優(yōu)選的,在所述監(jiān)測到所述第一心跳鏈路發(fā)生故障之前,還包括:
[0013]當監(jiān)測到所述第一數(shù)據(jù)鏈路發(fā)生故障時,判斷所述第一心跳鏈路是否發(fā)生故障,當判定所述第一心跳鏈路未發(fā)生故障時,啟動第二數(shù)據(jù)鏈路,并利用所述第二數(shù)據(jù)鏈路傳輸所述數(shù)據(jù)信息;
[0014]當判定所述第一心跳鏈路發(fā)生故障時,啟動所述第二心跳鏈路和所述第二數(shù)據(jù)鏈路,并利用所述第二心跳鏈路傳輸所述心跳信息,利用第二數(shù)據(jù)鏈路傳輸所述數(shù)據(jù)信息。
[0015]上述方法中,優(yōu)選的,在所述啟動第二心跳鏈路之后,還包括:
[0016]判斷所述第二心跳鏈路是否啟動成功;
[0017]當判定啟動成功時,恢復(fù)所述雙活雙控存儲系統(tǒng)的應(yīng)用;
[0018]當判定啟動失敗時,啟動高可用鏈路進行鏈路復(fù)位,以恢復(fù)所述雙活雙控存儲系統(tǒng)的應(yīng)用。
[0019]上述方法中,優(yōu)選的,在所述啟動所述第二心跳鏈路和第二數(shù)據(jù)鏈路之后,還包括:
[0020]判斷所述第二心跳鏈路和第二數(shù)據(jù)鏈路是否啟動成功;
[0021]當判定啟動成功時,恢復(fù)所述雙活雙控存儲系統(tǒng)的應(yīng)用;
[0022]當判定啟動失敗時,啟動高可用鏈路進行鏈路復(fù)位,以恢復(fù)所述雙活雙控存儲系統(tǒng)的應(yīng)用。
[0023]上述方法中,優(yōu)選的,在所述啟動高可用鏈路進行鏈路復(fù)位之后,還包括:
[0024]判斷所述高可用鏈路是否復(fù)位成功;
[0025]當判定復(fù)位成功時,恢復(fù)所述雙活雙控存儲系統(tǒng)的應(yīng)用;
[0026]當判定復(fù)位失敗時,發(fā)出錯誤提示警告。
[0027]本發(fā)明還提供了一種雙活雙控存儲系統(tǒng)的冗余鏈路設(shè)計系統(tǒng),包括數(shù)據(jù)傳輸單元,用于利用第一心跳鏈路傳輸心跳信息及利用第一數(shù)據(jù)鏈路傳輸數(shù)據(jù)信息;該系統(tǒng)還包括:
[0028]故障監(jiān)測單元,用于監(jiān)測所述第一心跳鏈路和所述第一數(shù)據(jù)鏈路的工作狀態(tài);
[0029]第一鏈路啟動單元,用于當監(jiān)測到所述第一心跳鏈路發(fā)生故障時,判斷所述第一數(shù)據(jù)鏈路是否發(fā)生故障,當判定所述第一數(shù)據(jù)鏈路未發(fā)生故障時,啟動第二心跳鏈路,并使所述數(shù)據(jù)傳輸單元利用所述第二心跳鏈路傳輸所述心跳信息;
[0030]第二鏈路啟動單元,用于當判定所述第一數(shù)據(jù)鏈路發(fā)生故障時,啟動所述第二心跳鏈路和第二數(shù)據(jù)鏈路,并使所述數(shù)據(jù)傳輸單元利用所述第二心跳鏈路傳輸所述心跳信息及利用第二數(shù)據(jù)鏈路傳輸所述數(shù)據(jù)信息。
[0031]上述系統(tǒng)中,優(yōu)選的,還包括:
[0032]第三鏈路啟動單元,用于當監(jiān)測到所述第一數(shù)據(jù)鏈路發(fā)生故障時,判斷所述第一心跳鏈路是否發(fā)生故障,當判定所述第一心跳鏈路未發(fā)生故障時,啟動第二數(shù)據(jù)鏈路,并利用所述第二數(shù)據(jù)鏈路傳輸所述數(shù)據(jù)信息;
[0033]第四鏈路啟動單元,用于當判定所述第一心跳鏈路發(fā)生故障時,啟動所述第二心跳鏈路和所述第二數(shù)據(jù)鏈路,并利用所述第二心跳鏈路傳輸所述心跳信息,利用第二數(shù)據(jù)鏈路傳輸所述數(shù)據(jù)信息。
[0034]上述系統(tǒng)中,優(yōu)選的,還包括:
[0035]第一判斷單元,用于在所述啟動第二心跳鏈路之后,判斷所述第二心跳鏈路是否啟動成功;
[0036]第一恢復(fù)單元,用于當判定啟動成功時,恢復(fù)所述雙活雙控存儲系統(tǒng)的應(yīng)用;
[0037]第一高可用鏈路啟動單元,用于當判定啟動失敗時,啟動高可用鏈路進行鏈路復(fù)位,以恢復(fù)所述雙活雙控存儲系統(tǒng)的應(yīng)用。
[0038]上述系統(tǒng)中,優(yōu)選的,還包括:
[0039]第二判斷單元,用于在所述啟動所述第二心跳鏈路和第二數(shù)據(jù)鏈路之后,判斷所述第二心跳鏈路和第二數(shù)據(jù)鏈路是否啟動成功;
[0040]第二恢復(fù)單元,用于當判定啟動成功時,恢復(fù)所述雙活雙控存儲系統(tǒng)的應(yīng)用;
[0041]第二高可用鏈路啟動單元,用于當判定啟動失敗時,啟動高可用鏈路進行鏈路復(fù)位,以恢復(fù)所述雙活雙控存儲系統(tǒng)的應(yīng)用。
[0042]上述系統(tǒng)中,優(yōu)選的,還包括:
[0043]第三判斷單元,用于在所述啟動高可用鏈路進行鏈路復(fù)位之后,判斷所述高可用鏈路是否復(fù)位成功;
[0044]第三恢復(fù)單元,用于當判定復(fù)位成功時,恢復(fù)所述雙活雙控存儲系統(tǒng)的應(yīng)用;
[0045]錯誤警告單元,用于當判定復(fù)位失敗時,發(fā)出錯誤提示警告。
[0046]以上本發(fā)明提供的雙活雙控存儲系統(tǒng)的冗余鏈路設(shè)計方法及系統(tǒng)中,存儲系統(tǒng)運行時,優(yōu)先選用第一心跳鏈路傳輸心跳信息及第一數(shù)據(jù)鏈路傳輸數(shù)據(jù)信息,基于此,首先監(jiān)測第一心跳鏈路和第一數(shù)據(jù)鏈路的工作狀態(tài);當監(jiān)測到第一心跳鏈路發(fā)生故障時,判斷第一數(shù)據(jù)鏈路是否發(fā)生故障,當判定第一數(shù)據(jù)鏈路未發(fā)生故障時,啟動第二心跳鏈路,并利用第二心跳鏈路傳輸所述心跳信息;當判定所述第一數(shù)據(jù)鏈路發(fā)生故障時,啟動第二心跳鏈路和第二數(shù)據(jù)鏈路,并利用第二心跳鏈路傳輸心跳信息,利用第二數(shù)據(jù)鏈路傳輸數(shù)據(jù)信息。以上技術(shù)方案可有效防止某些心跳信號線路異常、通信異常等原因而造成的心跳檢測異常,存儲系統(tǒng)中控制器之間的通信線路容錯性能很好,能滿足不同應(yīng)用環(huán)境和網(wǎng)絡(luò)環(huán)境,以此實現(xiàn)了多路冗余,保證了系統(tǒng)可靠性和業(yè)務(wù)連續(xù)性。
【附圖說明】
[0047]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
[0048]圖1為本發(fā)明一種雙活雙控存儲系統(tǒng)的冗余鏈路設(shè)計方法實施