專利名稱:一種提高網(wǎng)絡可靠性的方法及系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及分組數(shù)據(jù)轉發(fā)技術,尤其涉及一種通過在分組轉發(fā)設備上自動監(jiān)控業(yè)務表項提高網(wǎng)絡可靠性的方法及系統(tǒng)。
背景技術:
在一個分組轉發(fā)網(wǎng)絡中,每個分組在轉發(fā)路徑中的每個轉發(fā)節(jié)點中獨立查找各種轉發(fā)表項,然后根據(jù)查找結果進行分組報文的轉發(fā),經(jīng)過一個個獨立節(jié)點的轉發(fā),達到端到端的轉發(fā)目的。
在當前IP(Internet Protocol,互聯(lián)網(wǎng)協(xié)議)分組網(wǎng)絡中,主要支持的轉發(fā)業(yè)務種類包括IPV4(Internet Protocol Version 4,互連網(wǎng)協(xié)議版本4)單播轉發(fā)、IPV6(Internet Protocol Version 6,互連網(wǎng)協(xié)議版本6)轉發(fā)、IPV4組播轉發(fā)、MPLS(Multi-Protocol Label Switching,多協(xié)議標簽)轉發(fā)和VPN(Virtual Private Network,虛擬私有網(wǎng)絡)業(yè)務轉發(fā)等。
為支持業(yè)務的轉發(fā),需要各種協(xié)議動態(tài)生成的表項支持,如IPV4單播報文的轉發(fā)通常需要各種靜態(tài)配置,或者動態(tài)路由協(xié)議IGP(InteriorGateway Protocol,內(nèi)部網(wǎng)關協(xié)議)、BGP(Border Gateway Protocol,邊界網(wǎng)關協(xié)議)等生成的FIB(Forwarding Information Base,轉發(fā)信息庫)表項,以及二層、三層地址映射的表項,例如ARP(Address Resolution Protocol,地址解析協(xié)議)表項等;IPV4組播的轉發(fā),需要有靜態(tài)配置的組播表項,或者動態(tài)組播協(xié)議生成的組播表項MFIB(Multi-Forwarding InformationBase,組播轉發(fā)信息庫);IPV6轉發(fā)和IPV4基本一致,需要IPV6轉發(fā)表項、IPV6 FIB、以及ND(Neighbor Discovery,鄰居發(fā)現(xiàn))表項;MPLS轉發(fā)需要LSP(Label Switch Path,標簽交換路徑)轉發(fā)表項;而VPN轉發(fā),需要VPN路由表,以及路由標簽映射表項等。
在上述分組轉發(fā)設備中,為各種業(yè)務轉發(fā)所使用的靜態(tài)配置或者各種協(xié)議動態(tài)生成的表項,是各種業(yè)務正常轉發(fā)的基礎。當由于設備配置錯誤、設備故障、或者協(xié)議錯誤導致轉發(fā)表項錯誤時,將導致上層業(yè)務不能正常轉發(fā)。
隨著IP/MPLS技術的普及以及使用范圍的擴大,IP分組轉發(fā)設備上承載越來越多的業(yè)務,不僅包括IP Internet業(yè)務,企業(yè)互連業(yè)務,而且承載電信語音、視頻、IMS、大客戶專線等各種高可靠性業(yè)務。在現(xiàn)有技術中,當出現(xiàn)業(yè)務故障后,需要人工進行業(yè)務故障原因的定位,在大量的網(wǎng)絡設備上,檢索各種表項,從而定位故障業(yè)務所依賴的所有表項是否存在或者有故障。當定位到故障后,再采取對應的操作,例如修改配置、部分或者全部重啟協(xié)議、重啟單板、重啟設備等方法來恢復表項,從而達到恢復業(yè)務的目的。因此,現(xiàn)有技術依賴于人工解決,難度大,效率低,而且成本高,并且網(wǎng)絡故障不能很快恢復,進而降低了網(wǎng)絡的可靠性。
發(fā)明內(nèi)容
本發(fā)明要解決的問題是提供一種提高網(wǎng)絡可靠性的方法及系統(tǒng),以解決現(xiàn)有技術網(wǎng)絡的可靠性低的缺陷。
為了解決上述問題,本發(fā)明提供了一種提高網(wǎng)絡可靠性的方法,包括以下步驟A、監(jiān)測分組轉發(fā)設備使用的表項是否存在,如果存在,則轉步驟B,否則,該表項出現(xiàn)故障,轉步驟C;B、判斷該表項是否符合預先設置的范圍,如果是則正常工作,否則,該表項出現(xiàn)故障,轉步驟C;C、對分組轉發(fā)設備進行恢復操作和/或發(fā)出設備告警信息。
步驟A通過定時輪循被監(jiān)控表項或被監(jiān)控表項自動上報方式實現(xiàn)。
步驟A當使用定時輪循被監(jiān)控表項時,進一步包括A1、分組轉發(fā)設備按預先設置的時間向所監(jiān)控的表項發(fā)送查找請求;A2、所述表項向分組轉發(fā)設備發(fā)送表項狀態(tài)、和/或表項參數(shù)。
步驟A當被監(jiān)控表項自動上報時,所述被監(jiān)控表項實時或定時向分組轉發(fā)設備發(fā)送該表項狀態(tài)、和/或表項參數(shù)。
所述設備告警信息包括出現(xiàn)故障表項的標識。
步驟C根據(jù)出現(xiàn)故障表項的標識進行恢復操作。
所述恢復操作包括協(xié)議復位、業(yè)務單板復位或分組轉發(fā)設備復位。
所述被監(jiān)控表項應用于一臺或者多臺分組轉發(fā)設備上的一種或者多種轉發(fā)。
所述被監(jiān)控的表項是一個端到端的業(yè)務轉發(fā)所需要的各個分組轉發(fā)設備上的多個表項;或是一個或者多個分組轉發(fā)設備上的一個或者多個不相關的表項。
本發(fā)明還提供了一種提高網(wǎng)絡可靠性的系統(tǒng),包括多個分組轉發(fā)設備,在一個或多個分組轉發(fā)設備中進一步包括監(jiān)控單元、表項預設單元和自動恢復單元;所述表項預設單元,用于存儲預先設置的表項參數(shù);所述監(jiān)控單元,用于定時或?qū)崟r檢測表項參數(shù),并通過與預先設置的表項參數(shù)比較,確定表項狀態(tài);所述自動恢復單元,用于根據(jù)表項狀態(tài)觸發(fā)對應的恢復操作和/或發(fā)出告警信息。
與現(xiàn)有技術相比,本發(fā)明具有以下優(yōu)點本發(fā)明在設備轉發(fā)或者處理時依賴的表項錯誤情況下,通過啟用自動監(jiān)控功能,對業(yè)務轉發(fā)依賴的各種表項進行自動監(jiān)控,快速定位網(wǎng)絡故障,加快網(wǎng)絡故障恢復,從而提高網(wǎng)絡的可靠性。
圖1是本發(fā)明提高分組轉發(fā)網(wǎng)絡可靠性的方法流程圖;圖2是本發(fā)明一個具體實施例結構圖;圖3是本發(fā)明另一個具體實施例結構圖。
具體實施例方式
本發(fā)明一種提高網(wǎng)絡可靠性的方法如圖1所示,包括以下步驟
步驟s101,監(jiān)測分組轉發(fā)設備使用的表項是否存在,如果存在,則轉步驟s102,否則,該表項出現(xiàn)故障,轉步驟s103。其中,監(jiān)測可以通過定時輪循被監(jiān)控表項或被監(jiān)控表項自動上報方式實現(xiàn),當使用定時輪循被監(jiān)控表項時,分組轉發(fā)設備按預先設置的時間向所監(jiān)控的表項發(fā)送查找請求,然后,表項向分組轉發(fā)設備發(fā)送表項狀態(tài)、和/或表項參數(shù),其中表項的狀態(tài)為存在或不存在,表項參數(shù)可以為路由地址等;當被監(jiān)控表項自動上報時,被監(jiān)控表項實時或定時向分組轉發(fā)設備發(fā)送該表項狀態(tài)、和/或表項參數(shù)。
步驟s102,判斷該表項是否符合預先設置的范圍,如果是則正常工作,否則,該表項出現(xiàn)故障,分組轉發(fā)設備發(fā)出設備告警信息,該設備告警信息中包括出現(xiàn)故障表項的標識,并轉步驟s103。其中,所述表項的范圍是連續(xù)的,如0.0.0.1到0.0.0.24;或是離散的,如0.0.0.1、0.0.0.5、0.0.0.9等。另外,該表項的范圍可以根據(jù)不同表項的屬性及應用特點預先設定,并存儲于分組轉發(fā)設備中。
步驟s103,對分組轉發(fā)設備進行恢復操作,并可以同時或單獨發(fā)出告警信息。根據(jù)出現(xiàn)故障表項的標識進行恢復操作,所述恢復操作包括協(xié)議復位、業(yè)務單板復位或分組轉發(fā)設備復位。例如,可以根據(jù)不同表項發(fā)生故障分別采取重新配置設備、重新啟動相關協(xié)議、重新啟動相關業(yè)務單板、重新啟動相關設備等方式排除故障。
其中,被監(jiān)控表項可以是應用于一臺或者多臺分組轉發(fā)設備上的一種或者多種轉發(fā)表項;例如FIB、MFIB、路由表、MPLS表項、ARP表項、ND表項、ACL(Access Control List,訪問控制列表)等。被監(jiān)控的表項可以是一個端到端的業(yè)務轉發(fā)所需要的各個分組轉發(fā)設備上的多個表項,也可以是一個或者多個分組轉發(fā)設備上的一個或者多個不相關的表項。
下面結合具體實施例對本發(fā)明進行詳細說明一個具體實施例如圖2所示,包括骨干網(wǎng)和城域網(wǎng),骨干網(wǎng)中包括網(wǎng)絡路由器NR1和NR2,城域網(wǎng)中核心層包括服務路由器SR1和SR2,匯聚層包括用戶路由器CR1、CR2和CR3,其中CR1、CR2、CR3通過雙歸連接到SR1、SR2上,SR1、SR2再通過雙歸連接到骨干網(wǎng)絡。其中SR1、SR2分別具有20萬的全Internet路由,CR1、CR2、CR3只有本城域網(wǎng)內(nèi)的路由,其他的業(yè)務流量則通過缺省路由0.0.0.0/0路由進行引導。在CR1、CR2、CR3上,缺省路由是一條非常重要的路由,Internet流量的80%都通過缺省路由轉發(fā),如果缺省路由丟失,或者缺省路由計算錯誤都會造成業(yè)務的大量丟失。因此,為了提高可靠性,可以在CR1上對0.0.0.0/0路由進行定時監(jiān)控,而且下一跳必須是SR1或者SR2,通過5秒一次的定時器查詢,如果查詢不到0.0.0.0/0缺省路由,或者此缺省路由下一跳不是SR1或者SR2,則立即將IGP協(xié)議重啟,在IGP重啟后,丟失的IGP可以再重新恢復,這樣可以大大提高CR1路由器對業(yè)務支持的可靠性。
另一實施例如圖3所示,路由器組網(wǎng)情況和圖2相同,其中新增了一個大客戶接入路由器CE1,該大客戶路由器的主要接入地址在61.148.1.0/24范圍之內(nèi)。由于該大客戶路由器CE1是整個城域網(wǎng)絡中最重要的客戶之一,業(yè)務流量是在整個城域網(wǎng)中都非常重要,對于返回大客戶流量所依賴的路由在整個網(wǎng)絡中都非常重要,所以需要在整個城域網(wǎng)中的所有路由器上都對該大客戶路由進行監(jiān)控。例如,通過5秒一次的定時輪循,在SR1、SR2、CR1、CR2、CR3等所有路由器上對61.148.1.0/24路由進行監(jiān)控,如果一旦發(fā)現(xiàn)路由丟失,則立即觸發(fā)告警,通知網(wǎng)絡維護人員盡快處理和恢復業(yè)務,進而可以大大提高大客戶業(yè)務的可靠性。在該實施例中表項監(jiān)控功能可以在單個分組轉發(fā)設備中實現(xiàn),也可以通過在網(wǎng)絡中增加一個具有該監(jiān)控功能的設備實現(xiàn)。
本發(fā)明一種提高網(wǎng)絡可靠性的系統(tǒng),該系統(tǒng)中的一個或多個分組轉發(fā)設備具有表項監(jiān)控功能。該些分組轉發(fā)設備包括監(jiān)控單元、表項預設單元和自動恢復單元,表項預設單元存儲預先設置的表項參數(shù);監(jiān)控單元定時或?qū)崟r檢測表項參數(shù),并通過與預先設置的表項參數(shù)比較,確定表項狀態(tài);自動恢復單元根據(jù)表項狀態(tài)觸發(fā)對應的恢復操作。一旦分組轉發(fā)設備由于某些原因?qū)е聵I(yè)務轉發(fā)依賴的表項發(fā)生錯誤后,通過定時監(jiān)控系統(tǒng)很快發(fā)現(xiàn)故障,進行告警或自動對故障進行處理,由于在告警中可以明確的指出哪個表項發(fā)生了故障,所以故障的定位和恢復速度可以大大提高,另外,可以根據(jù)原先設定好的動作對故障自動進行處理,例如重新啟動協(xié)議、重新啟動單板、重新啟動設備等。
以上所述僅是本發(fā)明的優(yōu)選實施方式,應當指出,對于本技術領域的普通技術人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本發(fā)明的保護范圍。
權利要求
1.一種提高網(wǎng)絡可靠性的方法,其特征在于,包括以下步驟A、監(jiān)測分組轉發(fā)設備使用的表項是否存在,如果存在,則轉步驟B,否則,該表項出現(xiàn)故障,轉步驟C;B、判斷該表項是否符合預先設置的范圍,如果是則正常工作,否則,該表項出現(xiàn)故障,轉步驟C;C、對分組轉發(fā)設備進行恢復操作和/或發(fā)出設備告警信息。
2.如權利要求1所述提高網(wǎng)絡可靠性的方法,其特征在于,步驟A通過定時輪循被監(jiān)控表項或被監(jiān)控表項自動上報方式實現(xiàn)。
3.如權利要求2所述提高網(wǎng)絡可靠性的方法,其特征在于,步驟A當使用定時輪循被監(jiān)控表項時,進一步包括A1、分組轉發(fā)設備按預先設置的時間向所監(jiān)控的表項發(fā)送查找請求;A2、所述表項向分組轉發(fā)設備發(fā)送表項狀態(tài)、和/或表項參數(shù)。
4.如權利要求2所述提高網(wǎng)絡可靠性的方法,其特征在于,步驟A當被監(jiān)控表項自動上報時,所述被監(jiān)控表項實時或定時向分組轉發(fā)設備發(fā)送該表項狀態(tài)、和/或表項參數(shù)。
5.如權利要求1所述提高網(wǎng)絡可靠性的方法,其特征在于,所述設備告警信息包括出現(xiàn)故障表項的標識。
6.如權利要求5所述提高網(wǎng)絡可靠性的方法,其特征在于,步驟C根據(jù)出現(xiàn)故障表項的標識進行恢復操作。
7.如權利要求6所述提高網(wǎng)絡可靠性的方法,其特征在于,所述恢復操作包括協(xié)議復位、業(yè)務單板復位或分組轉發(fā)設備復位。
8.如權利要求1至7中任一項所述提高網(wǎng)絡可靠性的方法,其特征在于,所述被監(jiān)控表項應用于一臺或者多臺分組轉發(fā)設備上的一種或者多種轉發(fā)。
9.如權利要求1至7中任一項所述提高網(wǎng)絡可靠性的方法,其特征在于,所述被監(jiān)控的表項是一個端到端的業(yè)務轉發(fā)所需要的各個分組轉發(fā)設備上的多個表項;或是一個或者多個分組轉發(fā)設備上的一個或者多個不相關的表項。
10.一種提高網(wǎng)絡可靠性的系統(tǒng),包括多個分組轉發(fā)設備,其特征在于,在一個或多個分組轉發(fā)設備中進一步包括監(jiān)控單元、表項預設單元和自動恢復單元;所述表項預設單元,用于存儲預先設置的表項參數(shù);所述監(jiān)控單元,用于定時或?qū)崟r檢測表項參數(shù),并通過與預先設置的表項參數(shù)比較,確定表項狀態(tài);所述自動恢復單元,用于根據(jù)表項狀態(tài)觸發(fā)對應的恢復操作和/或發(fā)出告警信息。
全文摘要
本發(fā)明提供了一種提高網(wǎng)絡可靠性的方法,包括以下步驟A.監(jiān)測分組轉發(fā)設備使用的表項是否存在,如果存在,則轉步驟B,否則,該表項出現(xiàn)故障,轉步驟C;B.判斷該表項是否符合預先設置的范圍,如果是,則正常工作,否則,該表項出現(xiàn)故障,轉步驟C;C.對分組轉發(fā)設備進行恢復操作。本發(fā)明還提供了一種提高網(wǎng)絡可靠性的系統(tǒng)。本發(fā)明在分組設備轉發(fā)或者處理時所依賴表項錯誤情況下,通過啟用自動監(jiān)控功能,對業(yè)務轉發(fā)依賴的各種表項進行自動監(jiān)控,快速定位網(wǎng)絡故障,加快網(wǎng)絡故障恢復,從而提高網(wǎng)絡的可靠性。
文檔編號H04L12/56GK101047566SQ200610076458
公開日2007年10月3日 申請日期2006年4月26日 優(yōu)先權日2006年4月26日
發(fā)明者李鑒 申請人:華為技術有限公司