專(zhuān)利名稱(chēng):檢測(cè)單板的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信領(lǐng)域,特別涉及一種檢測(cè)單板的方法和設(shè)備。
技術(shù)背景在數(shù)據(jù)通信設(shè)備或者類(lèi)似設(shè)備中, 一般都有多個(gè)單板,也稱(chēng)為線(xiàn)路板,或LPU (Line Processing Unit,線(xiàn)路處理模塊)板,在設(shè)備運(yùn)行過(guò)程中,需要通過(guò)外部檢測(cè)確定每個(gè)單板的 健康狀態(tài),確保能及時(shí)發(fā)現(xiàn)單板故障并進(jìn)行故障恢復(fù)?,F(xiàn)有技術(shù)中通過(guò)心跳檢測(cè)的方式進(jìn)行單板的健康檢測(cè),稱(chēng)為心型心跳檢測(cè)模型,單板向 主控板發(fā)送心跳報(bào)文,主控板收到后返回響應(yīng)報(bào)文給單板,主控板在規(guī)定的時(shí)間內(nèi),如果收 到某單板發(fā)來(lái)的心跳報(bào)文,則認(rèn)為該單板為正常的單板,如果收不到某單板發(fā)來(lái)的心跳報(bào)文, 則認(rèn)為該單板故障。在實(shí)現(xiàn)本發(fā)明的過(guò)程中,發(fā)明人發(fā)現(xiàn)上述現(xiàn)有技術(shù)中至少存在以下缺點(diǎn)每個(gè)單板都需要給主控板發(fā)送心跳報(bào)文,主控板給每個(gè)單板返回響應(yīng),即采用一對(duì)一的方式來(lái)進(jìn)行檢測(cè),對(duì)主控板的處理能力要求較高,主控板的壓力較大。當(dāng)單板的數(shù)量增加時(shí), 心跳報(bào)文也會(huì)隨之增多,主控板的處理壓力也會(huì)隨之增大,如果此時(shí)主控板的CPU不能夠做 到心跳報(bào)文的負(fù)載均衡,處理不了單板的心跳報(bào)文,則可能發(fā)生誤判,認(rèn)為單板故障,從而 復(fù)位單板,造成單板業(yè)務(wù)中斷。發(fā)明內(nèi)容為了提高單板檢測(cè)的效率,本發(fā)明實(shí)施例提供了一種檢測(cè)單板的方法和設(shè)備。所述技術(shù)方案如下一種檢測(cè)單板的方法,所述方法包括主控板沿著環(huán)形結(jié)構(gòu)發(fā)送檢測(cè)報(bào)文,所述環(huán)形結(jié)構(gòu)由所述主控板和待檢測(cè)的單板順序排 列形成;收到所述檢測(cè)報(bào)文的單板,沿著所述環(huán)形結(jié)構(gòu)轉(zhuǎn)發(fā)所述檢測(cè)報(bào)文;所述主控板判斷是否在預(yù)設(shè)的故障時(shí)間內(nèi)收到所述檢測(cè)報(bào)文,如果收到,則所述單板正常。一種檢測(cè)單板的設(shè)備,所述設(shè)備包括主控板和單板,所述主控板用于沿著環(huán)形結(jié)構(gòu)發(fā)送檢測(cè)報(bào)文,所述環(huán)形結(jié)構(gòu)由所述主控板和待檢測(cè)的單 板順序排列形成;還用于判斷是否在預(yù)設(shè)的故障時(shí)間內(nèi)收到所述檢測(cè)報(bào)文,如果收到,則判 定所述單板正常。所述單板用于收到所述檢測(cè)報(bào)文后,沿著所述主控板預(yù)設(shè)的環(huán)形結(jié)構(gòu)轉(zhuǎn)發(fā)所述檢測(cè)報(bào)文。 本發(fā)明實(shí)施例提供的技術(shù)方案的有益效果是通過(guò)主控板發(fā)送檢測(cè)報(bào)文并沿著環(huán)形結(jié)構(gòu)經(jīng)單板傳輸,如果在預(yù)設(shè)的故障時(shí)間內(nèi)收到檢 測(cè)報(bào)文,則認(rèn)為單板正常,從而可以檢測(cè)出單板是否發(fā)生故障。采用環(huán)形結(jié)構(gòu),可以分散主控板對(duì)檢測(cè)報(bào)文的壓力,將檢測(cè)報(bào)文分布到各個(gè)單板,充分利用單板的CPU處理能力,與現(xiàn) 有技術(shù)中主控板需要處理每個(gè)單板發(fā)來(lái)的心跳報(bào)文并返回響應(yīng)的方式相比,減輕了主控板的 壓力,提高了檢測(cè)單板的效率。
圖1是本發(fā)明實(shí)施例1提供的檢測(cè)單板的方法流程圖;圖2是本發(fā)明實(shí)施例1提供的環(huán)形結(jié)構(gòu)圖;圖3是本發(fā)明實(shí)施例2提供的檢測(cè)單板的方法流程圖;圖4是本發(fā)明實(shí)施例2提供的環(huán)形結(jié)構(gòu)內(nèi)單板發(fā)送告警信息示意圖;圖5是本發(fā)明實(shí)施例2提供的主控板雙環(huán)發(fā)送心跳報(bào)文示意圖;圖6是本發(fā)明實(shí)施例3提供的檢測(cè)單板的方法流程圖;圖7是本發(fā)明實(shí)施例3提供的包含備用主控板的環(huán)形結(jié)構(gòu)圖;圖8是本發(fā)明實(shí)施例3提供的包含備用主控板的環(huán)形結(jié)構(gòu)內(nèi)單板發(fā)送告警信息示意圖; 圖9是本發(fā)明實(shí)施例3提供的主用主控板發(fā)生故障單板發(fā)送告警信息示意圖; 圖10是本發(fā)明實(shí)施例4提供的檢測(cè)單板的設(shè)備結(jié)構(gòu)圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn) 一步地詳細(xì)描述。 實(shí)施例1參見(jiàn)圖1,本實(shí)施例以主控板和單板組成環(huán)形結(jié)構(gòu)后,主控板發(fā)送檢測(cè)報(bào)文為例進(jìn)行說(shuō)
明,本發(fā)明實(shí)施例提供了一種檢測(cè)單板的方法,具體包括以下步驟步驟101:通信設(shè)備啟動(dòng)后,該通信設(shè)備內(nèi)的主控板構(gòu)建環(huán)形結(jié)構(gòu),并將該環(huán)形結(jié)構(gòu)信 息下發(fā)給環(huán)內(nèi)的所有單板,環(huán)形結(jié)構(gòu)由主控板和待檢測(cè)的單板順序排列形成,單板可以為一 個(gè)或多個(gè)。例如,參見(jiàn)圖2,按照所有單板的插槽號(hào)從小到大的順序排列,LPU1、 LPU2、 LPU3.....LPUn, LPU1與LPUn分別與AMB (Active Main Board,主用主控板)相連,構(gòu)成環(huán)形的結(jié) 構(gòu)。單板的順序也可以為插槽號(hào)從大到小的順序等等。主控板向所有單板下發(fā)結(jié)構(gòu)信息的過(guò)程即握手的過(guò)程,主控板可以記錄結(jié)構(gòu)信息從主控 板出發(fā)經(jīng)環(huán)形結(jié)構(gòu)傳輸后又回到主控板所用的時(shí)間,即握手時(shí)間。在設(shè)置故障時(shí)間時(shí)可以根 據(jù)握手時(shí)間來(lái)設(shè)置。步驟102:主控板沿著上述環(huán)形結(jié)構(gòu)發(fā)送檢測(cè)報(bào)文,檢測(cè)報(bào)文可以為現(xiàn)有技術(shù)中的心跳 報(bào)文,如HELLO報(bào)文等協(xié)議報(bào)文,主控板可以周期性地發(fā)出檢測(cè)報(bào)文,進(jìn)行單板健康檢測(cè)。步驟103:環(huán)形結(jié)構(gòu)內(nèi)的單板收到檢測(cè)報(bào)文后,沿著環(huán)形結(jié)構(gòu)轉(zhuǎn)發(fā)檢測(cè)報(bào)文給相鄰的硬 件,如給相鄰的單板或給相鄰的主控板。環(huán)形結(jié)構(gòu)內(nèi)的每個(gè)單板都沿著環(huán)形結(jié)構(gòu)轉(zhuǎn)發(fā)檢測(cè)報(bào)文,則檢測(cè)報(bào)文會(huì)最終回到主控板。 例如,參見(jiàn)圖2, AMB發(fā)送檢測(cè)報(bào)文,經(jīng)過(guò)LPU1、 LPU2、 ...、 LPUn的轉(zhuǎn)發(fā)后,最后回到 AMB。步驟104:主控板判斷是否在預(yù)設(shè)的故障時(shí)間內(nèi)收到自己發(fā)出的檢測(cè)報(bào)文,如果是,則執(zhí)行步驟105;否則,執(zhí)行步驟106。其中,預(yù)設(shè)的故障時(shí)間可以設(shè)置為大于或等于上述握手時(shí)間,考慮到設(shè)備實(shí)際運(yùn)行過(guò)程 中報(bào)文傳輸會(huì)有延時(shí),因此通常設(shè)置故障時(shí)間大于握手時(shí)間,例如握手時(shí)間為1秒,則預(yù)設(shè)故障時(shí)間為2秒。另外,預(yù)設(shè)的故障時(shí)間大于或等于預(yù)設(shè)的告警時(shí)間,如預(yù)設(shè)告警時(shí)間為1 秒,則故障時(shí)間為2秒或3秒。步驟105:主控板判定環(huán)形結(jié)構(gòu)內(nèi)的所有單板均正常,然后結(jié)束。步驟106:主控板判定環(huán)形結(jié)構(gòu)內(nèi)至少有一個(gè)單板發(fā)生故障,然后結(jié)束。本實(shí)施例中主控板沿著預(yù)設(shè)的環(huán)形結(jié)構(gòu)發(fā)送檢測(cè)報(bào)文,單板沿著環(huán)形結(jié)構(gòu)轉(zhuǎn)發(fā)檢測(cè)報(bào)文-, 主控板如果在預(yù)設(shè)的故障時(shí)間內(nèi)收到檢測(cè)報(bào)文,則認(rèn)為單板正常,從而可以檢測(cè)出單板是否 發(fā)生故障。采用環(huán)形結(jié)構(gòu),可以分散主控板對(duì)檢測(cè)報(bào)文的壓力,將檢測(cè)報(bào)文分布到各個(gè)單板,充分利用單板的CPU處理能力,與現(xiàn)有技術(shù)中主控板需要處理每個(gè)單板發(fā)來(lái)的檢測(cè)報(bào)文并返回響應(yīng)的方式相比,減輕了主控板的壓力,提高了檢測(cè)單板的效率。
實(shí)施例2參見(jiàn)圖3,本實(shí)施例以主控板和單板組成環(huán)形結(jié)構(gòu)后,主控板發(fā)送檢測(cè)報(bào)文且單板根據(jù) 判斷發(fā)出告警信息為例進(jìn)行說(shuō)明,本發(fā)明實(shí)施例提供了一種檢測(cè)單板的方法,具體包括以下 步驟步驟201:通信設(shè)備啟動(dòng)后,該通信設(shè)備內(nèi)的主控板構(gòu)建環(huán)形結(jié)構(gòu),并將該環(huán)形結(jié)構(gòu)信 息下發(fā)給環(huán)內(nèi)的所有單板,環(huán)形結(jié)構(gòu)由主控板和待檢測(cè)的單板順序排列形成,單板可以為一 個(gè)或多個(gè)。主控板向所有單板下發(fā)拓?fù)浣Y(jié)構(gòu)信息的過(guò)程即握手的過(guò)程,主控板可以記錄拓?fù)浣Y(jié)構(gòu)信 息從主控板出發(fā)經(jīng)環(huán)形結(jié)構(gòu)傳輸后又回到主控板所用的時(shí)間,即握手時(shí)間。在設(shè)置故障時(shí)間 時(shí)可以根據(jù)握手時(shí)間來(lái)設(shè)置。步驟202:主控板沿著上述環(huán)形結(jié)構(gòu)發(fā)送檢測(cè)報(bào)文,檢測(cè)報(bào)文可以為心跳報(bào)文,如HELLO報(bào)文等協(xié)議報(bào)文,主控板可以周期性地發(fā)出檢測(cè)報(bào)文,進(jìn)行單板健康檢測(cè)。步驟203:環(huán)形結(jié)構(gòu)內(nèi)的單板判斷是否在預(yù)設(shè)的告警時(shí)間內(nèi)收到檢測(cè)報(bào)文,如果是,則執(zhí)行步驟204;否則,執(zhí)行步驟205。步驟204:該單板沿著環(huán)形結(jié)構(gòu)轉(zhuǎn)發(fā)檢測(cè)報(bào)文給相鄰的硬件,如給相鄰的單板或給相鄰的主控板,然后執(zhí)行步驟206。步驟205:該單板向主控板發(fā)送告警信息,然后執(zhí)行步驟206。例如,參見(jiàn)圖4, AMB給LPU1發(fā)送檢測(cè)報(bào)文后,由于LPU1和LPU2都發(fā)生故障,則 LPU3無(wú)法收到檢測(cè)報(bào)文,因此LPU3給AMB發(fā)送告警信息,同理,LPU4直到LPUn都收 不到檢測(cè)報(bào)文,則這些單板都給AMB發(fā)送告警信息。步驟206:主控板判斷是否在預(yù)設(shè)的故障時(shí)間內(nèi)收到自己發(fā)出的檢測(cè)報(bào)文,如果是,則 執(zhí)行步驟207;否則,執(zhí)行步驟208。其中,預(yù)設(shè)的故障時(shí)間可以設(shè)置為大于或等于上述握手時(shí)間,考慮到設(shè)備實(shí)際運(yùn)行過(guò)程 中報(bào)文傳輸會(huì)有延時(shí),因此通常設(shè)置故障時(shí)間大于握手時(shí)間。步驟207:主控板判定環(huán)形結(jié)構(gòu)內(nèi)的所有單板均正常,然后結(jié)束。步驟208:主控板判定環(huán)形結(jié)構(gòu)內(nèi)有至少有一個(gè)單板發(fā)生故障,然后結(jié)束。主控板判斷出有單板發(fā)生故障后,還可以進(jìn)一步采用心型心跳檢測(cè)模型排查具體是哪個(gè) 單板發(fā)生故障,則步驟208之后還可以包括下面的步驟主控板在預(yù)設(shè)的故障時(shí)間內(nèi)收到告警信息后,分別向環(huán)形結(jié)構(gòu)內(nèi)未發(fā)出告警信息的每個(gè) 單板發(fā)送包含單板標(biāo)識(shí)信息的檢測(cè)報(bào)文;收到包含單板標(biāo)識(shí)信息的檢測(cè)報(bào)文的單板,向主控
板返回響應(yīng)報(bào)文;主控板判定在預(yù)設(shè)的單板故障時(shí)間內(nèi),返回響應(yīng)報(bào)文的單板正常,未返回 響應(yīng)報(bào)文的單板故障。其中,單板標(biāo)識(shí)信息通常為單板號(hào),例如,參見(jiàn)圖4, AMB收到除LPU1 和LPU2之外的所有單板發(fā)來(lái)的告警信息,則AMB給未發(fā)出告警信息的單板LPU1發(fā)送包含 單板號(hào)為1.的檢測(cè)報(bào)文,給未發(fā)出告警信息的單板LPU2發(fā)送包含單板號(hào)為2的檢測(cè)報(bào)文, 進(jìn)行心型心跳檢測(cè),根據(jù)LPU1和LPU2是否返回響應(yīng)報(bào)文來(lái)定位故障,如果LPU2返回響 應(yīng)報(bào)文給AMB,而LPU1沒(méi)有返回響應(yīng)報(bào)文給AMB,貝U AMB判斷出LPU1故障,LPU2正 常。進(jìn)一步地,還可以設(shè)置告警次數(shù),當(dāng)同一單板發(fā)出告警信息的次數(shù)超過(guò)預(yù)設(shè)的告警次數(shù) 后,再發(fā)起心型心跳檢測(cè)。例如,參見(jiàn)圖4,預(yù)設(shè)告警次數(shù)為3,則LPU3向AMB發(fā)出告警 信息的次數(shù)超過(guò)3次時(shí),AMB才發(fā)起心型心跳檢測(cè),具體定位LPU1和LPU2中哪個(gè)單板發(fā)生故障。進(jìn)一步地,主控板在收到告警信息后,可以隔離未發(fā)出告警信息的單板,重新構(gòu)建環(huán)形 結(jié)構(gòu),新環(huán)形結(jié)構(gòu)中包括所有發(fā)出告警信息的單板和主控板,不包括未發(fā)出告警信息的單板, 然后主控板根據(jù)新的拓?fù)浣Y(jié)構(gòu)重新進(jìn)行單板健康檢測(cè)。例如,參見(jiàn)圖4, LPU3至LPUn發(fā)出 告警信息給AMB后,AMB重新構(gòu)建環(huán)形結(jié)構(gòu),包括AMB、 LPU3、 ...、 LPUn。另外,當(dāng)設(shè) 備內(nèi)部出現(xiàn)單板插拔的情況時(shí),主控板可以獲取到設(shè)備內(nèi)部的變化,并重新構(gòu)建環(huán)形結(jié)構(gòu), 將己經(jīng)拔出的單板排除在環(huán)形結(jié)構(gòu)外,生成新的環(huán)形結(jié)構(gòu),并根據(jù)新的環(huán)形結(jié)構(gòu)重新進(jìn)行單 板健康檢測(cè)。為了提高單板的檢測(cè)效率,進(jìn)一步地,還可以采用雙環(huán)檢測(cè)報(bào)文機(jī)制,即步驟102中, 主控板在環(huán)形結(jié)構(gòu)上發(fā)送檢測(cè)報(bào)文時(shí),分別按照順時(shí)針?lè)较蚝湍鏁r(shí)針?lè)较虬l(fā)送檢測(cè)報(bào)文,即 順時(shí)針?lè)较虬l(fā)送一個(gè)檢測(cè)報(bào)文,逆時(shí)針?lè)较虬l(fā)送一個(gè)檢測(cè)報(bào)文,兩個(gè)檢測(cè)報(bào)文在環(huán)形結(jié)構(gòu)上 按相反的方向傳輸。例如,參見(jiàn)圖5, AMB在環(huán)形結(jié)構(gòu)上沿順時(shí)針?lè)较虬l(fā)送檢測(cè)報(bào)文給LPUn, 沿逆時(shí)針?lè)较虬l(fā)送檢測(cè)報(bào)文給LPU1,每個(gè)單板在順時(shí)針?lè)较蛏鲜盏綑z測(cè)報(bào)文后,按照順時(shí)針 方向轉(zhuǎn)發(fā)該檢測(cè)報(bào)文,在逆時(shí)針?lè)较蛏鲜盏綑z測(cè)報(bào)文后,在逆時(shí)針?lè)较蛏限D(zhuǎn)發(fā)該檢測(cè)報(bào)文, 最后AMB會(huì)收到兩個(gè)檢測(cè)報(bào)文。主控板可以判斷在預(yù)設(shè)的故障時(shí)間內(nèi)是否收到自己發(fā)出的 任一個(gè)檢測(cè)報(bào)文,如果收到.,則判定所有單板正常,如果兩個(gè)檢測(cè)報(bào)文都沒(méi)有收到,則判定 有單板發(fā)生故障。另外,如果在故障時(shí)間內(nèi)主控板收到一個(gè)單板由于在順時(shí)針?lè)较蛏衔词盏?檢測(cè)報(bào)文而發(fā)來(lái)的告警信息和另一個(gè)單板由于在逆時(shí)針?lè)较蛏衔词盏綑z測(cè)報(bào)文而發(fā)來(lái)的告警 信息,且這兩個(gè)單板之間僅有一個(gè)第三單板,則可以判定該第三單板故障。例如,參見(jiàn)圖5, 在故障時(shí)間2秒內(nèi),AMB收到LPU1因順時(shí)針?lè)较蛭词盏綑z測(cè)報(bào)文發(fā)來(lái)的告警信息和LPU3因逆時(shí)針?lè)较蛭词盏綑z測(cè)報(bào)文發(fā)來(lái)的告警信息,由環(huán)形結(jié)構(gòu)可知LPU1與LPU3之間僅有一 個(gè)單板LPU2,則AMB判定LPU2發(fā)生故障。本實(shí)施例中主控板沿著預(yù)設(shè)的環(huán)形結(jié)構(gòu)發(fā)送檢測(cè)報(bào)文,單板沿著環(huán)形結(jié)構(gòu)轉(zhuǎn)發(fā)檢測(cè)報(bào)文; 主控板如果在預(yù)設(shè)的故障時(shí)間內(nèi)收到檢測(cè)報(bào)文,則認(rèn)為單板正常,從而可以檢測(cè)出單板是否 發(fā)生故障。采用環(huán)形結(jié)構(gòu),可以分散主控板對(duì)檢測(cè)報(bào)文的壓力,將檢測(cè)報(bào)文分布到各個(gè)單板, 充分利用單板的CPU處理能力,與現(xiàn)有技術(shù)中主控板需要處理每個(gè)單板發(fā)來(lái)的心跳報(bào)文并返 回響應(yīng)的方式相比,減輕了主控板的壓力,提高了檢測(cè)單板的效率。主控板在收到單板告警 信息后發(fā)起心型心跳檢測(cè),可以準(zhǔn)確定位出故障單板,減少了誤判。采用雙環(huán)檢測(cè)報(bào)文檢測(cè) 機(jī)制,極大地提高了單板檢測(cè)的效率,降低了誤判。實(shí)施例3參見(jiàn)圖6,本實(shí)施例以主用主控板、單板和備用主控板組成環(huán)形結(jié)構(gòu)后,主控板發(fā)送檢 測(cè)報(bào)文為例進(jìn)行說(shuō)明,本發(fā)明實(shí)施例提供了一種檢測(cè)單板的方法,具體包括以下步驟步驟301:通信設(shè)備啟動(dòng)后,該通信設(shè)備內(nèi)的主用主控板構(gòu)建環(huán)形結(jié)構(gòu),并將該環(huán)形結(jié) 構(gòu)信息下發(fā)給環(huán)內(nèi)的所有單板,環(huán)形結(jié)構(gòu)包括主用主控板、單板和SMB (Standby Main Board, 備用主控板),備用主控板與主用主控板相連,單板可以為一個(gè)或多個(gè)。其中,環(huán)形結(jié)構(gòu)內(nèi)的所有單板可以按照預(yù)設(shè)的順序排列。例如,參見(jiàn)圖7, AMB與單板LPU1相連,單板按照插槽號(hào)從小到大的順序排列,LPU1、 LPU2、 LPU3.....LPUn, LPUn與SMB相連,SMB與AMB相連,構(gòu)成環(huán)形的結(jié)構(gòu)。主用主控板向所有單板下發(fā)結(jié)構(gòu)信息的過(guò)程即握手的過(guò)程,主用主控板可以記錄結(jié)構(gòu)信 息從主用主控板出發(fā)經(jīng)環(huán)形結(jié)構(gòu)傳輸后又回到主用主控板所用的時(shí)間,即握手時(shí)間。在設(shè)置 故障時(shí)間時(shí)可以根據(jù)握手時(shí)間來(lái)設(shè)置。步驟302:主用主控板沿著上述環(huán)形結(jié)構(gòu)發(fā)送檢測(cè)報(bào)文給單板,檢測(cè)報(bào)文可以為心跳報(bào) 文,如HELLO報(bào)文等協(xié)議報(bào)文,主用主控板可以周期性地發(fā)出檢測(cè)報(bào)文,進(jìn)行單板健康檢步驟303:環(huán)形結(jié)構(gòu)內(nèi)的單板判斷是否在預(yù)設(shè)的告警時(shí)間內(nèi)收到檢測(cè)報(bào)文,如果是,則 執(zhí)行步驟304;否則,執(zhí)行步驟305。步驟304:該單板沿著環(huán)形結(jié)構(gòu)轉(zhuǎn)發(fā)檢測(cè)報(bào)文給相鄰的硬件,如給相鄰的單板或給相鄰 的備用主控板,然后執(zhí)行步驟306。步驟305:該單板分別向主用主控板和備用主控板發(fā)送告警信息,然后執(zhí)行步驟306。例如,參見(jiàn)圖8, AMB給LPU1發(fā)送檢測(cè)報(bào)文后,由于LPU1和LPU2都發(fā)生故障,則,因此LPU3分別給AMB和SMB發(fā)送告警信息,同理,LPU4直到 LPUn都收不到檢測(cè)報(bào)文,則這些單板均分別給AMB和SMB發(fā)送告警信息。步驟306:備用主控板判斷是否收到單板發(fā)來(lái)的告警信息,如果是,則執(zhí)行步驟307;否 則,執(zhí)行步驟309。步驟307:備用主控板判斷發(fā)出告警信息的單板數(shù)目是否大于或等于未發(fā)出告警信息的 單板數(shù)目,如果是,則執(zhí)行步驟308;否則,執(zhí)行步驟310。步驟308:備用主控板認(rèn)為單板發(fā)出告警信息是因?yàn)橹饔弥骺匕灏l(fā)生故障,則發(fā)起主備 倒換,即將自己變成主用主控板,然后結(jié)束。例如,參見(jiàn)圖9, AMB發(fā)生故障,無(wú)法發(fā)出檢測(cè)報(bào)文,所有單板及SMB均收不到檢測(cè) 報(bào)文,則每個(gè)單板都分別給AMB和SMB發(fā)送告警信息,SMB統(tǒng)計(jì)收到的告警信息的數(shù)目, 如果SMB收到的告警信息的數(shù)目(即發(fā)出告警信息的單板數(shù)目)大于或等于未發(fā)出告警信息 的單板數(shù)目,則備用主控板發(fā)起主備倒換,備用主控板變?yōu)橹饔弥骺匕?。?1=10,共有10 個(gè)單板,某一時(shí)刻SMB收到6個(gè)單板發(fā)來(lái)的告警信息,則有4個(gè)單板還未發(fā)出告警信息,此 時(shí)SMB可以判定AMB發(fā)生故障,則發(fā)起主備倒換。步驟309:備用主控板收到單板發(fā)來(lái)的檢測(cè)報(bào)文,則轉(zhuǎn)發(fā)該檢測(cè)報(bào)文給主用主控板,然 后執(zhí)行步驟310。步驟310:主用主控板判斷是否在預(yù)設(shè)的故障時(shí)間內(nèi)收到自己發(fā)出的檢測(cè)報(bào)文,如果是, 則執(zhí)行歩驟31h否則,執(zhí)行步驟312。其中,預(yù)設(shè)的故障時(shí)間可以設(shè)置為大于或等于上述握 手時(shí)間。另外,預(yù)設(shè)的故障時(shí)間大于或等于預(yù)設(shè)的告警時(shí)間。步驟311:主用主控板判定環(huán)形結(jié)構(gòu)內(nèi)的所有單板均正常,然后結(jié)束。 步驟312:主用主控板判定環(huán)形結(jié)構(gòu)內(nèi)至少有一個(gè)單板發(fā)生故障,然后結(jié)束。 在本實(shí)施例中主控板判斷出有單板發(fā)生故障后,還可以進(jìn)一步采用心型心跳檢測(cè)模型排 査具體是哪個(gè)單板發(fā)生故障,進(jìn)一步地,還可以設(shè)置告警次數(shù),當(dāng)同一單板發(fā)出告警信息的次數(shù)超過(guò)預(yù)設(shè)的告警次數(shù)后,再發(fā)起心型心跳檢測(cè)。具體過(guò)程同實(shí)施例2中所述,此處不再 贅述。進(jìn)一步地,主控板在收到告警信息后,可以隔離未發(fā)出告警信息的單板,重新構(gòu)建環(huán)形 結(jié)構(gòu),然后根據(jù)新的拓?fù)浣Y(jié)構(gòu)重新進(jìn)行單板健康檢測(cè)。為了提高單板的檢測(cè)效率,進(jìn)一步地, 還可以采用雙環(huán)檢測(cè)報(bào)文機(jī)制,即主控板在環(huán)形結(jié)構(gòu)上發(fā)送檢測(cè)報(bào)文時(shí),分別按照順時(shí)針和 逆時(shí)針?lè)较虬l(fā)送檢測(cè)報(bào)文。具體過(guò)程同實(shí)施例1中所述,此處不再贅述。本實(shí)施例中主用主控板沿著預(yù)設(shè)的環(huán)形結(jié)構(gòu)發(fā)送檢測(cè)報(bào)文,經(jīng)單板和備用主控板傳輸-, 主用主控板如果在預(yù)設(shè)的故障時(shí)間內(nèi)收到檢測(cè)報(bào)文,則認(rèn)為單板正常,從而可以檢測(cè)出單板 是否發(fā)生故障。采用環(huán)形結(jié)構(gòu),可以分散主用主控板對(duì)檢測(cè)報(bào)文的壓力,將檢測(cè)報(bào)文分布到 各個(gè)單板,充分利用單板的CPU處理能力,與現(xiàn)有技術(shù)中主控板需要處理毎個(gè)單板發(fā)來(lái)的心 跳報(bào)文并返回響應(yīng)的方式相比,減輕了主控板的壓力,提高了檢測(cè)單板的效率。主用主控板 在收到單板告警信息后發(fā)起心型心跳檢測(cè),可以準(zhǔn)確定位出故障單板,減少了誤判。采用雙 環(huán)檢測(cè)報(bào)文檢測(cè)機(jī)制,極大地提高了單板檢測(cè)的效率,降低了誤判。采用備用主控板比較發(fā) 出告警信息的單板數(shù)目與未發(fā)出告警信息的單板數(shù)目,來(lái)判斷是否主用主控板故障,從而能 即使進(jìn)行主備倒換,可以防止主用主控板異常時(shí)出現(xiàn)誤判,保證設(shè)備的正常運(yùn)行。 實(shí)施例4參見(jiàn)圖IO,本發(fā)明實(shí)施例提供了一種檢測(cè)單板的設(shè)備,包括主控板和單板; 主控板用于沿著環(huán)形結(jié)構(gòu)發(fā)送檢測(cè)報(bào)文,環(huán)形結(jié)構(gòu)由主控板和待檢測(cè)的單板順序排列形 成;還用于判斷是否在預(yù)設(shè)的故障時(shí)間內(nèi)收到檢測(cè)報(bào)文,如果收到,則判定待檢測(cè)的單板正常。單板用于收到檢測(cè)報(bào)文后,沿著主控板預(yù)設(shè)的環(huán)形結(jié)構(gòu)轉(zhuǎn)發(fā)檢測(cè)報(bào)文。 進(jìn)一歩地,主控板還包括故障判定模塊,用于當(dāng)在故障時(shí)間內(nèi)未收到檢測(cè)報(bào)文時(shí),判定待檢測(cè)的單板中至少有一 個(gè)單板發(fā)生故障。進(jìn)一步地,單板還包括告警模塊,用于當(dāng)在預(yù)設(shè)的告警時(shí)間內(nèi)未收到檢測(cè)報(bào)文時(shí),向主控板發(fā)送告警信息;故 障時(shí)間大于或等于告警時(shí)間。 進(jìn)一步地,主控板還包括-定位模塊,用于當(dāng)主控板在故障時(shí)間內(nèi)收到告警信息時(shí),分別向環(huán)形結(jié)構(gòu)內(nèi)未發(fā)出告警 信息的每個(gè)單板發(fā)送包含單板標(biāo)識(shí)信息的檢測(cè)報(bào)文;還用于判定在預(yù)設(shè)的單板故障時(shí)間內(nèi), 返回響應(yīng)報(bào)文的單板正常,未返回響應(yīng)報(bào)文的單板故障;相應(yīng)地,單板還包括響應(yīng)模塊,用于在收到定位模塊發(fā)來(lái)的包含單板標(biāo)識(shí)信息的檢測(cè)報(bào)文后,向主控板返回 響應(yīng)報(bào)文。其中,主控板可以同時(shí)包括故障判定模塊和定位模塊,另外,還可以當(dāng)單板包括 告警模塊時(shí),主控板包括定位模塊。進(jìn)一步地,主控板還可以采用雙環(huán)發(fā)送檢測(cè)報(bào)文的機(jī)制,主控板具體包括發(fā)送模塊,用于在環(huán)形結(jié)構(gòu)上分別按照順時(shí)針?lè)较蚝湍鏁r(shí)針?lè)较虬l(fā)送檢測(cè)報(bào)文,環(huán)形結(jié) 構(gòu)由主控板和待檢測(cè)的單板順序排列形成; 檢測(cè)模塊,用于判斷是否在預(yù)設(shè)的故障時(shí)間內(nèi)收到檢測(cè)報(bào)文,如果收到,則判定單板正 常;相應(yīng)地,如果單板為多個(gè)單板,則主控板還包括定位模塊,用于判斷在故障時(shí)間內(nèi)是否收到多個(gè)單板中的一個(gè)單板由于在順時(shí)針?lè)较蛭?收到檢測(cè)報(bào)文而發(fā)來(lái)的告警信息和另一個(gè)單板由于在逆時(shí)針?lè)较蛭词盏綑z測(cè)報(bào)文而發(fā)來(lái)的告 警信息,且該一個(gè)單板和另一個(gè)單板之間僅有一個(gè)第三單板,如果是,則第三單板故障。進(jìn)一步地,上述設(shè)備還包括與主控板相連的備用主控板,且檢測(cè)報(bào)文按照主控板、單板 和備用主控板的順序傳輸;相應(yīng)地,當(dāng)單板在預(yù)設(shè)的告警時(shí)間內(nèi)未收到檢測(cè)報(bào)文向主控板發(fā)送告警信息時(shí),單板還 包括告警模塊,用于當(dāng)在預(yù)設(shè)的告警時(shí)間內(nèi)未收到主控板發(fā)來(lái)的檢測(cè)報(bào)文時(shí),向備用主控板 發(fā)送告警信息;備用主控板還包括倒換模塊,用于根據(jù)收到的告警信息的數(shù)目,判斷出發(fā)出告警信息的單板數(shù)目大于或等 于未發(fā)出告警信息的單板數(shù)目時(shí),發(fā)起主備倒換。本實(shí)施例中主控板沿著預(yù)設(shè)的環(huán)形結(jié)構(gòu)發(fā)送檢測(cè)報(bào)文,單板沿著環(huán)形結(jié)構(gòu)轉(zhuǎn)發(fā)檢測(cè)報(bào)文; 主控板如果在預(yù)設(shè)的故障時(shí)間內(nèi)收到檢測(cè)報(bào)文,則認(rèn)為單板正常,從而可以檢測(cè)出單板是否 發(fā)生故障。采用環(huán)形結(jié)構(gòu),可以分散主用主控板對(duì)檢測(cè)報(bào)文的壓力,將檢測(cè)報(bào)文分布到各個(gè) 單板,充分利用單板的CPU處理能力,與現(xiàn)有技術(shù)中主控板需要處理每個(gè)單板發(fā)來(lái)的心跳報(bào) 文并返回響應(yīng)的方式相比,減輕了主控板的壓力,提高了檢測(cè)單板的效率。主控板在收到單 板告警信息后發(fā)起心型心跳檢測(cè),可以準(zhǔn)確定位出故障單板,減少了誤判。采用雙環(huán)檢測(cè)報(bào) 文檢測(cè)機(jī)制,極大地提高了單板檢測(cè)的效率,降低了誤判。釆用備用主控板比較發(fā)出告警信 息的單板數(shù)目與未發(fā)出告警信息的單板數(shù)目,來(lái)判斷是否主用主控板故障,從而能即使進(jìn)行 主備倒換,可以防止主用主控板異常時(shí)出現(xiàn)誤判,保證設(shè)備的正常運(yùn)行。本發(fā)明實(shí)施例中主控板向未發(fā)出告警信息的所有單板發(fā)起的心型心跳檢測(cè)與現(xiàn)有技術(shù)中 的心型心跳檢測(cè)是有區(qū)別的,本發(fā)明實(shí)施例中是主控板向單板發(fā)送檢測(cè)報(bào)文(包括心跳報(bào)文), 而現(xiàn)有技術(shù)中是單板向主控板發(fā)送心跳報(bào)文。本發(fā)明實(shí)施例可以通過(guò)軟件實(shí)現(xiàn),相應(yīng)的軟件可以存儲(chǔ)到可讀取的存儲(chǔ)介質(zhì)中,例如路 由器的硬盤(pán)和緩存中。以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之 內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種檢測(cè)單板的方法,其特征在于,所述方法包括主控板沿著環(huán)形結(jié)構(gòu)發(fā)送檢測(cè)報(bào)文,所述環(huán)形結(jié)構(gòu)由所述主控板和待檢測(cè)的單板順序排列形成;收到所述檢測(cè)報(bào)文的單板,沿著所述環(huán)形結(jié)構(gòu)轉(zhuǎn)發(fā)所述檢測(cè)報(bào)文;所述主控板判斷是否在預(yù)設(shè)的故障時(shí)間內(nèi)收到所述檢測(cè)報(bào)文,如果收到,則所述單板正常。
2. 根據(jù)權(quán)利要求1所述的檢測(cè)單板的方法,其特征在于,所述方法還包括 如果所述主控板在所述故障時(shí)間內(nèi)未收到所述檢測(cè)報(bào)文,則所述單板中至少有一個(gè)單板發(fā)生故障。
3. 根據(jù)權(quán)利要求2所述的檢測(cè)單板的方法,其特征在于,所述主控板發(fā)出所述檢測(cè)報(bào)文后,還包括當(dāng)所述單板在預(yù)設(shè)的告警時(shí)間內(nèi)未收到所述檢測(cè)報(bào)文時(shí),所述單板向所述主控板發(fā)送告 警信息;所述故障時(shí)間大于或等于所述告警時(shí)間。
4. 根據(jù)權(quán)利要求1至3中任意一項(xiàng)所述的檢測(cè)單板的方法,其特征在于,所述方法還包括如果所述主控板在所述故障時(shí)間內(nèi)收到告警信息,則分別向所述環(huán)形結(jié)構(gòu)內(nèi)未發(fā)出告警信息的每個(gè)單板發(fā)送包含單板標(biāo)識(shí)信息的檢測(cè)報(bào)文;收到所述包含單板標(biāo)識(shí)信息的檢測(cè)報(bào)文的單板,向所述主控板返回響應(yīng)報(bào)文; 所述主控板判定在預(yù)設(shè)的單板故障時(shí)間內(nèi),返回響應(yīng)報(bào)文的單板正常,未返回響應(yīng)報(bào)文的單板故障。
5. 根據(jù)權(quán)利要求1所述的檢測(cè)單板的方法,其特征在于,所述主控板沿著環(huán)形結(jié)構(gòu)發(fā)送 檢測(cè)報(bào)文,具體為主控板在環(huán)形結(jié)構(gòu)上分別按照順時(shí)針?lè)较蚝湍鏁r(shí)針?lè)较虬l(fā)送檢測(cè)報(bào)文。
6. 根據(jù)權(quán)利要求5所述的檢測(cè)單板的方法,其特征在于,當(dāng)所述單板為多個(gè)時(shí),所述方 法還包括所述主控板判斷在所述故障時(shí)間內(nèi)是否收到所述多個(gè)單板中的一個(gè)單板由于在所述順時(shí) 針?lè)较蛭词盏剿鰴z測(cè)報(bào)文而發(fā)來(lái)的告警信息和另一個(gè)單板由于在所述逆時(shí)針?lè)较蛭词盏剿?述檢測(cè)報(bào)文而發(fā)來(lái)的告警信息,且所述一個(gè)單板和另一個(gè)單板之間僅有一個(gè)第三單板,如果 是,則所述第三單板故障。
7. 根據(jù)權(quán)利要求3所述的檢測(cè)單板的方法,其特征在于,所述環(huán)形結(jié)構(gòu)還包括與所述主 控板相連的備用主控板,所述檢測(cè)報(bào)文按照所述主控板、單板和備用主控板的順序傳輸;相應(yīng)地,所述方法還包括當(dāng)所述單板在所述的告警時(shí)間內(nèi)未收到所述檢測(cè)報(bào)文時(shí),所述單板向備用主控板發(fā)送告 警信息,當(dāng)發(fā)出告警信息的單板數(shù)目大于或等于未發(fā)出告警信息的單板數(shù)目時(shí),所述備用主 控板發(fā)起主備倒換。
8. —種檢測(cè)單板的設(shè)備,其特征在于,所述設(shè)備包括主控板和單板, 所述主控板用于沿著環(huán)形結(jié)構(gòu)發(fā)送檢測(cè)報(bào)文,所述環(huán)形結(jié)構(gòu)由所述主控板和待檢測(cè)的單板順序排列形成;還用于判斷是否在預(yù)設(shè)的故障時(shí)間內(nèi)收到所述檢測(cè)報(bào)文,如果收到,則判 定所述單板正常。所述單板用于收到所述檢測(cè)報(bào)文后,沿著所述主控板預(yù)設(shè)的環(huán)形結(jié)構(gòu)轉(zhuǎn)發(fā)所述檢測(cè)報(bào)文。
9. 根據(jù)權(quán)利要求8所述的檢測(cè)單板的設(shè)備,其特征在于,所述主控板還包括-故障判定模塊,用于當(dāng)在所述故障時(shí)間內(nèi)未收到所述檢測(cè)報(bào)文時(shí),判定所述單板中至少有一個(gè)單板發(fā)生故障。
10. 根據(jù)權(quán)利要求9所述的檢測(cè)單板的設(shè)備,其特征在于,所述單板還包括 告警模塊,用于當(dāng)在預(yù)設(shè)的告警時(shí)間內(nèi)未收到所述主控板發(fā)來(lái)的檢測(cè)報(bào)文時(shí),向所述主控板發(fā)送告警信息;所述故障時(shí)間大于或等于所述告警時(shí)間。
11. 根據(jù)權(quán)利要求8至10中任意一項(xiàng)所述的檢測(cè)單板的設(shè)備,其特征在于,所述主控板 還包括定位模塊,用于當(dāng)所述主控板在所述故障時(shí)間內(nèi)收到告警信息時(shí),分別向所述環(huán)形結(jié)構(gòu) 內(nèi)未發(fā)出告警信息的每個(gè)單板發(fā)送包含單板標(biāo)識(shí)信息的檢測(cè)報(bào)文;還用于判定在預(yù)設(shè)的單板 故障時(shí)間內(nèi),返回響應(yīng)報(bào)文的單板正常,未返回響應(yīng)報(bào)文的單板故障;所述單板還包括-響應(yīng)模塊,用于在收到所述定位模塊發(fā)來(lái)的包含單板標(biāo)識(shí)信息的檢測(cè)報(bào)文后,向所述主 控板返回響應(yīng)報(bào)文。
12. 根據(jù)權(quán)利要求8所述的檢測(cè)單板的設(shè)備,其特征在于,所述主控板具體包括 發(fā)送模塊,用于在環(huán)形結(jié)構(gòu)上分別按照順時(shí)針?lè)较蚝湍鏁r(shí)針?lè)较虬l(fā)送檢測(cè)報(bào)文,所述環(huán)形結(jié)構(gòu)由所述主控板和待檢測(cè)的單板順序排列形成;檢測(cè)模塊,用于判斷是否在預(yù)設(shè)的故障時(shí)間內(nèi)收到所述檢測(cè)報(bào)文,如果收到,則判定所 述單板正常。
13. 根據(jù)權(quán)利要求12所述的檢測(cè)單板的設(shè)備,其特征在于,當(dāng)所述單板為多個(gè)時(shí),所述 主控板還包括定位模塊,用于判斷在所述故障時(shí)間內(nèi)是否收到所述多個(gè)單板中的一個(gè)單板由于在所述 順時(shí)針?lè)较蛭词盏剿鰴z測(cè)報(bào)文而發(fā)來(lái)的告警信息和另一個(gè)單板由于在所述逆時(shí)針?lè)较蛭词?到所述檢測(cè)報(bào)文而發(fā)來(lái)的告警信息,且所述一個(gè)單板和另一個(gè)單板之間僅有一個(gè)第三單板, 如果是,則所述第三單板故障。
14. 根據(jù)權(quán)利要求10所述的檢測(cè)單板的設(shè)備,其特征在于,所述設(shè)備還包括與所述主控 板相連的備用主控板,且所述檢測(cè)報(bào)文按照所述主控板、單板和備用主控板的順序傳輸;相應(yīng)地,所述單板還包括告警模塊,用于當(dāng)在所述告警時(shí)間內(nèi)未收到所述主控板發(fā)來(lái)的檢測(cè)報(bào)文時(shí),向所述備用 主控板發(fā)送告警信息;所述備用主控板還包括-倒換模塊,用于根據(jù)收到的告警信息的數(shù)目,判斷出發(fā)出告警信息的單板數(shù)目大于或等 于未發(fā)出告警信息的單板數(shù)目時(shí),發(fā)起主備倒換。
全文摘要
本發(fā)明公開(kāi)了一種檢測(cè)單板的方法和設(shè)備,屬于通信領(lǐng)域。所述方法包括主控板沿著環(huán)形結(jié)構(gòu)發(fā)送檢測(cè)報(bào)文,環(huán)形結(jié)構(gòu)由主控板和待檢測(cè)的單板順序排列形成;收到檢測(cè)報(bào)文的單板,沿著環(huán)形結(jié)構(gòu)轉(zhuǎn)發(fā)檢測(cè)報(bào)文;主控板判斷是否在預(yù)設(shè)的故障時(shí)間內(nèi)收到檢測(cè)報(bào)文,如果收到,則單板正常。所述設(shè)備包括主控板和單板。本發(fā)明可以檢測(cè)出單板是否發(fā)生故障。采用環(huán)形結(jié)構(gòu),可以分散主控板對(duì)檢測(cè)報(bào)文的壓力,將檢測(cè)報(bào)文分布到各個(gè)單板,充分利用單板的CPU處理能力,與現(xiàn)有技術(shù)中主控板需要處理每個(gè)單板發(fā)來(lái)的心跳報(bào)文并返回響應(yīng)的方式相比,減輕了主控板的壓力,提高了檢測(cè)單板的效率。
文檔編號(hào)H04L12/26GK101150458SQ20071016943
公開(kāi)日2008年3月26日 申請(qǐng)日期2007年11月10日 優(yōu)先權(quán)日2007年11月10日
發(fā)明者孫玉芳, 尹向東, 真 曹, 毛曉磊, 鄭明華 申請(qǐng)人:華為技術(shù)有限公司