一種配置雙機(jī)資源切換的自動(dòng)化測(cè)試方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種配置雙機(jī)資源切換的自動(dòng)化測(cè)試方法,適用于任何業(yè)務(wù)的雙機(jī)集群,屬于計(jì)算機(jī)存儲(chǔ)技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002]雙機(jī)集群技術(shù)是將一組相互獨(dú)立的計(jì)算機(jī)通過(guò)網(wǎng)絡(luò)整合成一個(gè)單一的計(jì)算機(jī)系統(tǒng)。雙機(jī)集群的一個(gè)特點(diǎn)是:保證存儲(chǔ)配置及數(shù)據(jù)的高可用性,在服務(wù)出現(xiàn)故障時(shí),雙機(jī)集群系統(tǒng)可以自動(dòng)將服務(wù)從故障節(jié)點(diǎn)切換到另一個(gè)備用節(jié)點(diǎn),從而提供不間斷性服務(wù),保證了業(yè)務(wù)的持續(xù)運(yùn)行,同時(shí)提高了系統(tǒng)的可靠性和抗災(zāi)難性。
[0003]雙機(jī)集群系統(tǒng)能達(dá)到資源切換的條件有多種,如斷開(kāi)業(yè)務(wù)網(wǎng)絡(luò)、斷開(kāi)后端存儲(chǔ)線(xiàn)纜、主節(jié)點(diǎn)設(shè)備關(guān)機(jī)等。為了保證雙機(jī)集群系統(tǒng)的高可用性及抗災(zāi)難性,條件觸發(fā)及切換過(guò)程測(cè)試要執(zhí)行成千上萬(wàn)次,然而目前的測(cè)試方法多為手動(dòng)觸發(fā)切換條件,達(dá)到資源切換的目的,且無(wú)法自動(dòng)抓取錯(cuò)誤日志,需要人工手動(dòng)記錄,這樣耗費(fèi)了大量時(shí)間及人力成本。
[0004]綜上所述,手動(dòng)測(cè)試雙機(jī)集群系統(tǒng)既費(fèi)時(shí)又費(fèi)力,且無(wú)法保證測(cè)試結(jié)果的準(zhǔn)確性。
【發(fā)明內(nèi)容】
[0005]本發(fā)明提出一種配置雙機(jī)資源切換的自動(dòng)化測(cè)試方法,思路是通過(guò)自動(dòng)化腳本工具,資源在節(jié)點(diǎn)運(yùn)行正常情況下,自動(dòng)觸發(fā)雙機(jī)集群資源切換條件,使資源切換到另一節(jié)點(diǎn),切換完成后,判斷資源在節(jié)點(diǎn)是否運(yùn)行正常,若資源運(yùn)行正常,則繼續(xù)觸發(fā)雙機(jī)集群資源切換條件,若資源切換出現(xiàn)問(wèn)題,導(dǎo)致資源在節(jié)點(diǎn)運(yùn)行異常,則自動(dòng)抓取系統(tǒng)日志,并終止測(cè)試。
[0006]本發(fā)明的目的是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的:
[0007]步驟一、自動(dòng)配置集群節(jié)點(diǎn)間安全外殼協(xié)議(SSH)免密碼登陸;
[0008]在主節(jié)點(diǎn)生成SSH秘鑰對(duì),將公共秘鑰通過(guò)SCP命令傳到另一節(jié)點(diǎn),再將公共秘鑰追加到授權(quán)的key里面,修改授權(quán)key的權(quán)限。在主節(jié)點(diǎn)進(jìn)行SSH連接測(cè)試,可在主節(jié)點(diǎn)免密碼登陸到另一節(jié)點(diǎn)。
[0009]步驟二、自動(dòng)配置雙機(jī)集群節(jié)點(diǎn),創(chuàng)建雙機(jī)集群資源;
[0010]首先需要驗(yàn)證集群節(jié)點(diǎn)間的系統(tǒng)版本、主機(jī)名、IP地址、用戶(hù)名、密碼、時(shí)間、網(wǎng)絡(luò)端口類(lèi)型及其數(shù)量、單雙機(jī)模式、共享磁盤(pán)屬性,驗(yàn)證通過(guò)后,通過(guò)遠(yuǎn)程過(guò)程調(diào)用協(xié)議RPC腳本命令自動(dòng)創(chuàng)建雙機(jī)集群系統(tǒng);若驗(yàn)證失敗,則自動(dòng)設(shè)置正確的屬性后,重新驗(yàn)證。
[0011 ]在主節(jié)點(diǎn)創(chuàng)建多個(gè)資源或在兩個(gè)節(jié)點(diǎn)分別創(chuàng)建多個(gè)資源,并自動(dòng)添加到雙機(jī)集群系統(tǒng)中。
[0012]步驟三、配置客戶(hù)端訪(fǎng)問(wèn)雙機(jī)集群資源,并正常進(jìn)行1讀寫(xiě);
[0013]步驟四、遍歷觸發(fā)雙機(jī)集群資源切換條件;
[0014]觸發(fā)雙機(jī)集群資源切換條件如下:
[0015](I)資源業(yè)務(wù)前端鏈路故障;
[0016](2)資源業(yè)務(wù)后端存儲(chǔ)鏈路故障;
[00?7] (3)資源所在節(jié)點(diǎn)heartbeat服務(wù)停止;
[0018]任意一種故障導(dǎo)致的資源切換要進(jìn)行千次以上的測(cè)試。
[0019]步驟五、若客戶(hù)端1無(wú)中斷且能查詢(xún)到資源在當(dāng)前節(jié)點(diǎn)上的狀態(tài),則重新執(zhí)行步驟四,否則執(zhí)行步驟六;
[0020]步驟六、測(cè)試終止,保存系統(tǒng)日志信息,保留系統(tǒng)環(huán)境。
[0021]有益效果
[0022]本發(fā)明提出一種配置雙機(jī)資源切換的自動(dòng)化測(cè)試方法,應(yīng)用于雙機(jī)集群存儲(chǔ)設(shè)備中。
[0023]可縮短整個(gè)系統(tǒng)測(cè)試的周期,快速驗(yàn)證系統(tǒng)的穩(wěn)定性,適用于多個(gè)測(cè)試階段,極大的提高了測(cè)試效率,大量節(jié)約了時(shí)間成本;
[0024]也可更好的利用人力資源,將重復(fù)性的測(cè)試自動(dòng)化,測(cè)試技術(shù)人員從重復(fù)繁瑣的工作中解脫出來(lái)投入更多精力設(shè)計(jì)測(cè)試用例,提高測(cè)試人員的積極性,大幅節(jié)約了人力成本;
[0025]測(cè)試過(guò)程出現(xiàn)問(wèn)題時(shí),可自動(dòng)收集系統(tǒng)日志信息,保留最準(zhǔn)確的信息和環(huán)境,便于研發(fā)人員后續(xù)進(jìn)行問(wèn)題解析。
[0026]全程自動(dòng)化測(cè)試,測(cè)試過(guò)程中無(wú)人為干預(yù),提高了測(cè)試結(jié)果的準(zhǔn)確性。
【附圖說(shuō)明】
[0027]圖1本發(fā)明的一種適用于多種雙機(jī)集群資源切換測(cè)試處理流程圖;
[0028]圖2本發(fā)明的一種適用于多種雙機(jī)集群資源切換的測(cè)試拓?fù)浣Y(jié)構(gòu)圖;
[0029]圖3本發(fā)明的一種適用于多種雙機(jī)集群資源切換的觸發(fā)條件示意圖。
【具體實(shí)施方式】
[0030]本發(fā)明提出一種雙機(jī)集群資源切換的自動(dòng)化測(cè)試方法,流程如圖1所示,應(yīng)用于雙機(jī)集群存儲(chǔ)設(shè)備中,圖2為雙機(jī)集群資源切換的測(cè)試拓?fù)鋱D,下面以圖2測(cè)試環(huán)境為例,來(lái)詳細(xì)說(shuō)明本發(fā)明的具體測(cè)試情況。
[0031]根據(jù)步驟一,進(jìn)行SSH免密碼登陸設(shè)置。在節(jié)點(diǎn)HAl使用ssh-keygen命令生成秘鑰對(duì),通過(guò)SCP命令將公共秘鑰拷貝到節(jié)點(diǎn)HA2的/root目錄下,在節(jié)點(diǎn)HA2將公共秘鑰追加到授權(quán)的key里面,S卩authorized_keys文件中,修改該文件的使用權(quán)限為600。在HAl節(jié)點(diǎn)進(jìn)行SSH連接測(cè)試:ssh “HA2節(jié)點(diǎn)ip”,即可免密碼登陸到HA2節(jié)點(diǎn)。
[0032]根據(jù)步驟二,要?jiǎng)?chuàng)建如圖2所示的雙機(jī)集群系統(tǒng),必須保證兩個(gè)節(jié)點(diǎn)的系統(tǒng)版本、主機(jī)名、IP地址、用戶(hù)名、密碼、時(shí)間、網(wǎng)絡(luò)端口類(lèi)型及其數(shù)量、單雙機(jī)模式、共享磁盤(pán)的驗(yàn)證信息一致通過(guò)RPC腳本命令自動(dòng)驗(yàn)證以上信息;
[0033]如圖2所示,集群兩個(gè)節(jié)點(diǎn)互為主備,每個(gè)節(jié)點(diǎn)上各自都有雙機(jī)資源,即搭建了一個(gè)active/active架構(gòu)的雙機(jī)集群環(huán)境,里面有兩套“主/備”結(jié)構(gòu),本實(shí)例中選擇以HAl為主節(jié)點(diǎn)的雙機(jī)架構(gòu)。根據(jù)業(yè)務(wù)類(lèi)型及磁盤(pán)個(gè)數(shù),雙機(jī)集群資源可以創(chuàng)建任意多個(gè)。限于實(shí)際環(huán)境,使用節(jié)點(diǎn)上的所有磁盤(pán)創(chuàng)建3個(gè)資源,S卩3個(gè)存儲(chǔ)池(pool),對(duì)雙機(jī)集群來(lái)說(shuō),資源監(jiān)控單位是存儲(chǔ)池,與業(yè)務(wù)相關(guān)的存儲(chǔ)都是基于存儲(chǔ)池的,所謂的雙機(jī)資源就是指存儲(chǔ)池,存儲(chǔ)池上可以創(chuàng)建dataset (NAS卷)、volume (iscsi卷),本實(shí)例中每個(gè)資源創(chuàng)建一個(gè)NAS卷。
[0034]根據(jù)步驟三,客戶(hù)端通過(guò)虛擬對(duì)外IPI訪(fǎng)問(wèn)節(jié)點(diǎn)存儲(chǔ)池的共享卷,本實(shí)例中,通過(guò)NFS方式使用IPl訪(fǎng)問(wèn)3個(gè)資源中的NAS卷,并使用vdbench工具對(duì)3個(gè)NAS卷同時(shí)進(jìn)行1讀寫(xiě)。
[0035]根據(jù)步驟四,用自動(dòng)化腳本使節(jié)點(diǎn)HAl前端鏈路,如圖3中①所示或后端鏈路故障如圖3中②所示或hear tbeat服務(wù)終止如圖3中③所示來(lái)觸發(fā)雙機(jī)集群資源切換條件,此時(shí)雙機(jī)集群資源從主節(jié)點(diǎn)HAl導(dǎo)出后,導(dǎo)入到備節(jié)點(diǎn)HA2。
[0036]根據(jù)步驟五,通過(guò)SSH免密碼登陸到備節(jié)點(diǎn)可搜索到存儲(chǔ)池資源,存儲(chǔ)池資源切換過(guò)程中1有短暫停頓,資源切換完成后1在短時(shí)間內(nèi)(15s)恢復(fù)可知存儲(chǔ)池在備節(jié)點(diǎn)正常運(yùn)行。主節(jié)點(diǎn)故障恢復(fù)后,即鏈路故障恢復(fù)或heartbeat服務(wù)恢復(fù)即觸發(fā)雙機(jī)集群資源切換條件,則存儲(chǔ)池資源切回主節(jié)點(diǎn)且1不中斷。若資源搜索失敗或資源切換完成后1恢復(fù)失敗,則進(jìn)入步驟六,測(cè)試結(jié)束。
[0037]判斷資源在HAl、HA2節(jié)點(diǎn)運(yùn)行正常通過(guò)如下方法:
[0038](I)客戶(hù)端1無(wú)中斷;
[0039](2)能查詢(xún)到資源在當(dāng)前節(jié)點(diǎn)上的狀態(tài);
[0040]根據(jù)步驟六、測(cè)試中止,自動(dòng)化腳本收集系統(tǒng)log信息后,退出,并保留系統(tǒng)環(huán)境。
【主權(quán)項(xiàng)】
1.一種配置雙機(jī)集群切換的自動(dòng)化測(cè)試方法,其特征在于: 步驟一、自動(dòng)配置集群節(jié)點(diǎn)間安全外殼協(xié)議(SSH)免密碼登陸:在主節(jié)點(diǎn)生成SSH秘鑰對(duì),將公共秘鑰通過(guò)SCP命令傳到另一節(jié)點(diǎn),再將公共秘鑰追加到授權(quán)的key里面,修改授權(quán)key的權(quán)限;在主節(jié)點(diǎn)進(jìn)行SSH連接測(cè)試,可在主節(jié)點(diǎn)免密碼登陸到另一節(jié)點(diǎn); 步驟二、自動(dòng)配置雙機(jī)集群節(jié)點(diǎn),創(chuàng)建雙機(jī)集群資源:首先需要驗(yàn)證集群節(jié)點(diǎn)間的系統(tǒng)版本、主機(jī)名、IP地址、用戶(hù)名、密碼、時(shí)間、網(wǎng)絡(luò)端口類(lèi)型及其數(shù)量、單雙機(jī)模式、共享磁盤(pán)屬性,驗(yàn)證通過(guò)后,通過(guò)遠(yuǎn)程過(guò)程調(diào)用協(xié)議RPC腳本命令自動(dòng)創(chuàng)建雙機(jī)集群系統(tǒng);若驗(yàn)證失敗,則自動(dòng)設(shè)置正確的屬性后,重新驗(yàn)證;在主節(jié)點(diǎn)創(chuàng)建多個(gè)資源或在兩個(gè)節(jié)點(diǎn)分別創(chuàng)建多個(gè)資源,并自動(dòng)添加到雙機(jī)集群系統(tǒng)中; 步驟三、配置客戶(hù)端訪(fǎng)問(wèn)雙機(jī)集群資源,并正常進(jìn)行1讀寫(xiě); 步驟四、遍歷觸發(fā)雙機(jī)集群資源切換條件;觸發(fā)雙機(jī)集群資源切換條件如下: (1)資源業(yè)務(wù)前端鏈路故障; (2)資源業(yè)務(wù)后端存儲(chǔ)鏈路故障; (3)資源所在節(jié)點(diǎn)heartbeat服務(wù)停止; 任意一種故障導(dǎo)致的資源切換要進(jìn)行千次以上的測(cè)試; 步驟五、若客戶(hù)端1無(wú)中斷且能查詢(xún)到資源在當(dāng)前節(jié)點(diǎn)上的狀態(tài),則重新執(zhí)行步驟四,否則執(zhí)行步驟六; 步驟六、測(cè)試終止,保存系統(tǒng)日志信息,保留系統(tǒng)環(huán)境。
【專(zhuān)利摘要】本發(fā)明涉及一種配置雙機(jī)資源切換的自動(dòng)化測(cè)試方法,適用于任何業(yè)務(wù)的雙機(jī)集群,屬于計(jì)算機(jī)存儲(chǔ)技術(shù)領(lǐng)域。本發(fā)明實(shí)現(xiàn)過(guò)程為:自動(dòng)配置集群節(jié)點(diǎn)間安全外殼協(xié)議(SSH)免密碼登陸;自動(dòng)配置雙機(jī)集群節(jié)點(diǎn),創(chuàng)建雙機(jī)集群資源;配置客戶(hù)端訪(fǎng)問(wèn)雙機(jī)集群資源,并正常進(jìn)行IO讀寫(xiě);遍歷觸發(fā)雙機(jī)集群資源切換條件;任意一種故障導(dǎo)致的資源切換要進(jìn)行數(shù)千次以上的測(cè)試。若客戶(hù)端IO無(wú)中斷且能查詢(xún)到資源在當(dāng)前節(jié)點(diǎn)上的狀態(tài),則重新測(cè)試,否則測(cè)試終止,保存系統(tǒng)日志信息,保留系統(tǒng)環(huán)境。通過(guò)本發(fā)明,能夠高效、準(zhǔn)確的執(zhí)行雙機(jī)集群資源切換測(cè)試,且在出現(xiàn)問(wèn)題時(shí),能提供可靠的信息用以分析問(wèn)題所在。
【IPC分類(lèi)】G06F9/38, H04L12/26
【公開(kāi)號(hào)】CN105553783
【申請(qǐng)?zhí)枴緾N201610046098
【發(fā)明人】王道邦, 張恒, 楊凡凡, 周澤湘, 沈晶, 羅華, 李艷國(guó), 潘興旺, 段舒文, 于召鑫, 楊威
【申請(qǐng)人】北京同有飛驥科技股份有限公司
【公開(kāi)日】2016年5月4日
【申請(qǐng)日】2016年1月25日