專利名稱:一種實(shí)現(xiàn)快速檢測(cè)的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信鏈路的檢測(cè)技術(shù),特別涉及一種實(shí)現(xiàn)快速檢測(cè)的方法和設(shè)備。
背景技術(shù):
操作維護(hù)管理協(xié)議(Operations,Administration and Maintenance,OAM)是為了在一個(gè)較復(fù)雜的網(wǎng)絡(luò)中,對(duì)網(wǎng)絡(luò)進(jìn)行簡(jiǎn)便、有效的管理而提出的一套標(biāo)準(zhǔn),該標(biāo)準(zhǔn)基于IEEE 802.3ah協(xié)議規(guī)范,主要解決最后一英里網(wǎng)絡(luò)的管理問(wèn)題。
在IEEE 802.3ah OAM的定義中,OAM主要提供了如下幾個(gè)功能OAMDISCOVERY連接建立;鏈路監(jiān)控;遠(yuǎn)程環(huán)路測(cè)試;遠(yuǎn)程MIB變量獲取。
其中,OAM連接建立的工作原理第一OAM實(shí)體與第二OAM實(shí)體建立OAM連接,即OAM DISCOVERY過(guò)程。OAM DISCOVERY連接建立是第一OAM實(shí)體發(fā)現(xiàn)第二OAM實(shí)體并與之建立穩(wěn)定會(huì)話的一種機(jī)制,是OAM連接會(huì)話的第一個(gè)階段。在這個(gè)階段中,通過(guò)OAMPDU雙方互相進(jìn)行OAM實(shí)體的配置、端口能力參數(shù)與標(biāo)識(shí)的交換。第一OAM實(shí)體收到第二OAM實(shí)體的參數(shù)后,決定是否同意建立OAM連接。比如當(dāng)?shù)谝籓AM實(shí)體要求第二OAM實(shí)體具有遠(yuǎn)程環(huán)回功能,而第二OAM實(shí)體卻沒(méi)有這個(gè)能力時(shí),該OAM實(shí)體可以拒絕建立OAM連接。兩端實(shí)體協(xié)商成功后,建立OAM連接關(guān)系。
保持OAM連接。在成功建立OAM連接后,兩端的OAM實(shí)體每秒至少會(huì)發(fā)送一個(gè)INFO OAMPDU,以通告各自的OAM狀態(tài),保持連接。第一OAM實(shí)體接收狀態(tài)機(jī)也會(huì)啟動(dòng)一個(gè)接收定時(shí)器,實(shí)時(shí)監(jiān)控第二OAM實(shí)體的OAM狀態(tài)。如果在OAM連接超時(shí)定時(shí)器超時(shí)前一直沒(méi)有接收到第二OAM實(shí)體發(fā)送的INFO OAMPDU,第一OAM實(shí)體認(rèn)為鏈路出現(xiàn)故障或第二OAM實(shí)體已經(jīng)關(guān)閉OAM協(xié)議,于是斷開(kāi)OAM連接,通知其他協(xié)議進(jìn)行備份鏈路切換,以防止流量中斷。
按照IEEE 802.3ah OAM協(xié)議規(guī)定,鏈路超時(shí)檢測(cè)機(jī)制是通過(guò)每個(gè)端口啟動(dòng)一個(gè)定時(shí)器,如果在指定超時(shí)時(shí)間內(nèi)沒(méi)有收到第二OAM實(shí)體發(fā)送的OAM報(bào)文,第一OAM實(shí)體才會(huì)感知到OAM連接故障。目前,OAM的保持連接報(bào)文發(fā)送間隔是1秒,連接超時(shí)時(shí)間是5倍的報(bào)文發(fā)送間隔,即5秒。如果鏈路出現(xiàn)故障,OAM需要5秒以上的時(shí)間才能夠感知。換句話說(shuō),一旦出現(xiàn)鏈路故障,切換到備份鏈路的時(shí)間至少需要5秒,在這5秒內(nèi)流量是中斷的,這在實(shí)際的組網(wǎng)運(yùn)用中是不可接受的。
與OAM協(xié)議類似,在通信系統(tǒng)中還存在許多其他慢速協(xié)議,如鏈路匯聚控制協(xié)議(LACP)、集群管理協(xié)議、虛擬路由冗余備份協(xié)議等。對(duì)于上面所述的OAM協(xié)議中的問(wèn)題,這些慢速協(xié)議也同樣存在,即對(duì)于鏈路故障感知遲鈍,在鏈路故障或報(bào)文丟失情況下不能夠快速地發(fā)現(xiàn)問(wèn)題,及時(shí)進(jìn)行備份鏈路切換,使得服務(wù)質(zhì)量嚴(yán)重下降。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供一種實(shí)現(xiàn)快速檢測(cè)的方法,能夠?qū)崿F(xiàn)慢速協(xié)議鏈路故障的快速檢測(cè)。
本發(fā)明還提供一種實(shí)現(xiàn)快速檢測(cè)的設(shè)備,能夠?qū)崿F(xiàn)慢速協(xié)議鏈路故障的快速檢測(cè)。
為實(shí)現(xiàn)上述第一個(gè)目的,本發(fā)明采用如下的技術(shù)方案一種實(shí)現(xiàn)快速檢測(cè)的方法,該方法包括a、當(dāng)?shù)谝痪W(wǎng)絡(luò)實(shí)體在沒(méi)有按時(shí)收到第二網(wǎng)絡(luò)實(shí)體的保持連接狀態(tài)的報(bào)文時(shí),向第二網(wǎng)絡(luò)實(shí)體發(fā)送快速探測(cè)報(bào)文;b、若第一網(wǎng)絡(luò)實(shí)體在規(guī)定時(shí)間內(nèi)接收到第二網(wǎng)絡(luò)實(shí)體返回的快速探測(cè)響應(yīng)報(bào)文,則判定鏈路狀態(tài)正常,否則判定鏈路出現(xiàn)故障。
較佳地,步驟a中所述向第二網(wǎng)絡(luò)實(shí)體發(fā)送快速探測(cè)報(bào)文時(shí),可以啟動(dòng)預(yù)先設(shè)置的快速探測(cè)等待超時(shí)定時(shí)器;步驟b中所述規(guī)定時(shí)間可以為快速探測(cè)等待超時(shí)定時(shí)器的定時(shí)時(shí)間;步驟b中判定鏈路狀態(tài)正常后,可以進(jìn)一步包括關(guān)閉快速探測(cè)等待超時(shí)定時(shí)器。
較佳地,步驟a中所述向第二網(wǎng)絡(luò)實(shí)體發(fā)送快速探測(cè)報(bào)文可以為在快速探測(cè)等待超時(shí)定時(shí)器超時(shí)前,第一網(wǎng)絡(luò)實(shí)體向第二網(wǎng)絡(luò)實(shí)體重復(fù)發(fā)送快速探測(cè)報(bào)文。
較佳地,步驟a中啟動(dòng)快速探測(cè)等待超時(shí)定時(shí)器時(shí),可以進(jìn)一步啟動(dòng)快速定時(shí)器;所述向第二網(wǎng)絡(luò)實(shí)體重復(fù)發(fā)送快速探測(cè)報(bào)文可以為第一網(wǎng)絡(luò)實(shí)體按照快速定時(shí)器的設(shè)定,定時(shí)向第二網(wǎng)絡(luò)實(shí)體發(fā)送快速探測(cè)報(bào)文。
較佳地,預(yù)先設(shè)置最大探測(cè)次數(shù),步驟a中所述發(fā)送快速探測(cè)報(bào)文可以為在未收到快速探測(cè)響應(yīng)報(bào)文前,以固定的時(shí)間間隔發(fā)送快速探測(cè)報(bào)文;步驟b中所述第一網(wǎng)絡(luò)實(shí)體在規(guī)定時(shí)間內(nèi)接收到第二網(wǎng)絡(luò)實(shí)體返回的快速探測(cè)響應(yīng)報(bào)文可以為快速探測(cè)報(bào)文的發(fā)送次數(shù)超過(guò)最大探測(cè)次數(shù)前,接收到第二網(wǎng)絡(luò)實(shí)體返回的快速探測(cè)響應(yīng)報(bào)文。
較佳地,所述快速探測(cè)報(bào)文可以為新定義的報(bào)文或修改后的已有報(bào)文。
較佳地,所述快速探測(cè)響應(yīng)報(bào)文可以為新定義的報(bào)文或步驟a中所述保持連接狀態(tài)的報(bào)文。
較佳地,步驟b中判定鏈路狀態(tài)正常后,可以進(jìn)一步包括第一網(wǎng)絡(luò)實(shí)體切換回正常狀態(tài),按照保持連接報(bào)文發(fā)送間隔發(fā)送保持連接狀態(tài)的報(bào)文。
較佳地,步驟b中判定鏈路出現(xiàn)故障后,可以進(jìn)一步包括上報(bào)鏈路故障,上層協(xié)議根據(jù)該鏈路故障判斷是否切換到備份鏈路。
較佳地,步驟a中所述沒(méi)有按時(shí)收到可以為在相比保持連接報(bào)文發(fā)送間隔延長(zhǎng)后的時(shí)間間隔內(nèi)沒(méi)有收到。
為實(shí)現(xiàn)上述第二個(gè)目的,本發(fā)明采用如下的技術(shù)方案一種實(shí)現(xiàn)快速檢測(cè)的設(shè)備,該設(shè)備包括接收模塊和快速探測(cè)模塊;所述接收模塊,用于接收來(lái)自于外部的保持連接狀態(tài)的報(bào)文,并在未按時(shí)接收到該報(bào)文時(shí),通知快速探測(cè)模塊進(jìn)行故障探測(cè);所述快速探測(cè)模塊,用于接收所述接收模塊發(fā)送的通知,并將快速探測(cè)報(bào)文發(fā)送出去,還用于接收外部的快速探測(cè)響應(yīng)報(bào)文,并在規(guī)定時(shí)間內(nèi)接收到該報(bào)文時(shí),判定鏈路狀態(tài)正常,在規(guī)定時(shí)間內(nèi)未接收到快速探測(cè)響應(yīng)報(bào)文時(shí),判定鏈路出現(xiàn)故障。
較佳地,所述快速探測(cè)模塊可以包括探測(cè)報(bào)文收發(fā)模塊、快速探測(cè)等待超時(shí)定時(shí)器和故障判定模塊;所述探測(cè)報(bào)文收發(fā)模塊,用于接收所述接收模塊發(fā)送的通知,并將快速探測(cè)報(bào)文發(fā)送出去,啟動(dòng)所述快速探測(cè)等待超時(shí)定時(shí)器,還用于在所述快速探測(cè)等待超時(shí)定時(shí)器的控制下,接收外部的快速探測(cè)響應(yīng)報(bào)文,在接收到快速探測(cè)響應(yīng)報(bào)文時(shí),通知所述故障判定模塊已收到響應(yīng),并關(guān)閉所述快速探測(cè)等待超時(shí)定時(shí)器,在接收到所述快速探測(cè)等待超時(shí)定時(shí)器發(fā)送的超時(shí)消息后,通知所述故障判定模塊未收到響應(yīng);所述快速探測(cè)等待超時(shí)定時(shí)器,用于接收所述探測(cè)報(bào)文收發(fā)模塊發(fā)送的啟動(dòng)和關(guān)閉信號(hào),控制探測(cè)等待超時(shí)時(shí)間,并在定時(shí)器超時(shí)時(shí),向所述探測(cè)報(bào)文收發(fā)模塊發(fā)送超時(shí)消息;所述故障判定模塊,用于接收所述探測(cè)報(bào)文收發(fā)模塊發(fā)送的通知消息,并對(duì)消息進(jìn)行判斷,若該消息是已收到響應(yīng)的通知,則判定鏈路狀態(tài)正常,若該消息是未收到響應(yīng)的通知,則判定鏈路出現(xiàn)故障。
較佳地,所述探測(cè)報(bào)文收發(fā)模塊可以包括報(bào)文收發(fā)模塊和快速定時(shí)器;所述報(bào)文收發(fā)模塊,用于接收所述接收模塊發(fā)送的通知,并在所述快速定時(shí)器的控制下,定時(shí)將快速探測(cè)報(bào)文發(fā)送出去,啟動(dòng)所述快速探測(cè)等待超時(shí)定時(shí)器,還用于在所述快速探測(cè)等待超時(shí)定時(shí)器的控制下,接收外部的快速探測(cè)響應(yīng)報(bào)文,在接收到快速探測(cè)響應(yīng)報(bào)文時(shí),通知所述故障判定模塊已收到響應(yīng),在接收到所述快速探測(cè)等待超時(shí)定時(shí)器發(fā)送的超時(shí)消息后,通知所述故障判定模塊未收到響應(yīng);所述快速定時(shí)器,用于接收所述報(bào)文收發(fā)模塊發(fā)送的啟動(dòng)信號(hào),控制所述報(bào)文收發(fā)模塊發(fā)送快速探測(cè)報(bào)文的時(shí)間間隔。
較佳地,所述快速探測(cè)模塊可以包括探測(cè)報(bào)文收發(fā)模塊、快速定時(shí)器、探測(cè)次數(shù)計(jì)數(shù)器和故障判定模塊;所述探測(cè)報(bào)文收發(fā)模塊,用于接收所述接收模塊發(fā)送的通知,并在所述快速定時(shí)器的控制下,定時(shí)將快速探測(cè)報(bào)文發(fā)送出去,并在每次發(fā)送快速探測(cè)報(bào)文時(shí)通知所述探測(cè)次數(shù)計(jì)數(shù)器計(jì)數(shù),還用于在所述探測(cè)次數(shù)計(jì)數(shù)器的控制下,接收外部的快速探測(cè)響應(yīng)報(bào)文,在接收到快速探測(cè)響應(yīng)報(bào)文時(shí),通知所述故障判定模塊已收到響應(yīng),在接收到所述計(jì)數(shù)器發(fā)送的停止探測(cè)消息后,通知所述故障判定模塊未收到響應(yīng);所述快速定時(shí)器,用于控制所述探測(cè)報(bào)文收發(fā)模塊發(fā)送快速探測(cè)報(bào)文的時(shí)間間隔;所述探測(cè)次數(shù)計(jì)數(shù)器,用于保存最大探測(cè)次數(shù),接收所述探測(cè)報(bào)文收發(fā)模塊發(fā)送的計(jì)數(shù)信息,并進(jìn)行加1操作,當(dāng)本身的計(jì)數(shù)值等于保存的最大探測(cè)次數(shù)時(shí),向所述探測(cè)報(bào)文收發(fā)模塊發(fā)送停止探測(cè)消息;所述故障判定模塊,用于接收所述探測(cè)報(bào)文收發(fā)模塊發(fā)送的通知消息,并對(duì)消息進(jìn)行判斷,若該消息是已收到響應(yīng)的通知,則判定鏈路狀態(tài)正常,則判定鏈路出現(xiàn)故障。
由上述技術(shù)方案可見(jiàn),本發(fā)明在慢速協(xié)議鏈路的通信過(guò)程中,若第一網(wǎng)絡(luò)實(shí)體在沒(méi)有按時(shí)收到第二網(wǎng)絡(luò)實(shí)體的報(bào)文時(shí),即主動(dòng)向第二網(wǎng)絡(luò)實(shí)體發(fā)送快速探測(cè)報(bào)文,主動(dòng)探測(cè)網(wǎng)絡(luò)鏈路是否出現(xiàn)故障;第二網(wǎng)絡(luò)實(shí)體若接收到快速探測(cè)報(bào)文,則立刻響應(yīng),盡量縮短探測(cè)時(shí)間;若第一網(wǎng)絡(luò)實(shí)體能夠在比連接超時(shí)時(shí)間更短的探測(cè)超時(shí)時(shí)間內(nèi)接收到快速探測(cè)響應(yīng),則表明鏈路正常,第一網(wǎng)絡(luò)實(shí)體切換回正常狀態(tài),按協(xié)議規(guī)定的發(fā)送間隔發(fā)送報(bào)文,否則判定鏈路出現(xiàn)故障。由于探測(cè)超時(shí)時(shí)間要遠(yuǎn)小于連接超時(shí)時(shí)間,因此在鏈路故障或報(bào)文丟失情況下能夠快速的發(fā)現(xiàn)問(wèn)題,及時(shí)進(jìn)行備份鏈路切換,增強(qiáng)網(wǎng)絡(luò)的健壯性,大大提高服務(wù)質(zhì)量。
更進(jìn)一步地,第一網(wǎng)絡(luò)實(shí)體發(fā)送快速探測(cè)報(bào)文時(shí),可以在探測(cè)超時(shí)時(shí)間內(nèi)以一定的頻率重復(fù)發(fā)送,以抵抗網(wǎng)絡(luò)丟包對(duì)快速探測(cè)準(zhǔn)確度的影響,該發(fā)送快速探測(cè)報(bào)文的時(shí)間間隔遠(yuǎn)小于正常發(fā)送保持連接狀態(tài)報(bào)文的發(fā)送間隔,可以間接地縮短判定鏈路正常所需的時(shí)間,有效提高探測(cè)效率,使網(wǎng)絡(luò)實(shí)體盡快切換回正常狀態(tài)。
同時(shí),由于本發(fā)明是在網(wǎng)絡(luò)實(shí)體中增加了快速探測(cè)的狀態(tài),但并未影響正常發(fā)送握手報(bào)文的狀態(tài),因此不會(huì)造成連接不穩(wěn)定、網(wǎng)絡(luò)中協(xié)議報(bào)文泛濫、增加CPU負(fù)擔(dān)等問(wèn)題。
圖1為本發(fā)明的實(shí)現(xiàn)快速檢測(cè)方法的總體流程圖。
圖2為本發(fā)明的實(shí)現(xiàn)快速檢測(cè)設(shè)備的總體結(jié)構(gòu)圖。
圖3為本發(fā)明實(shí)施例一中OAM協(xié)議鏈路的快速檢測(cè)方法流程圖。
圖4為增加快速探測(cè)狀態(tài)機(jī)后OAM狀態(tài)遷移的關(guān)系圖。
圖5為簡(jiǎn)化的OAM狀態(tài)遷移圖。
圖6為本發(fā)明實(shí)施例一中OAM協(xié)議鏈路的快速檢測(cè)設(shè)備。
圖7為本發(fā)明實(shí)施例二中OAM協(xié)議鏈路的快速檢測(cè)設(shè)備。
具體實(shí)施例方式
為使本發(fā)明的目的、技術(shù)手段和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖并舉實(shí)施例,說(shuō)明本發(fā)明的具體實(shí)施方式
。
本發(fā)明的基本思想是當(dāng)?shù)谝痪W(wǎng)絡(luò)實(shí)體在沒(méi)有按時(shí)收到第二網(wǎng)絡(luò)實(shí)體的報(bào)文時(shí),即發(fā)送快速探測(cè)報(bào)文到第二網(wǎng)絡(luò)實(shí)體;第二網(wǎng)絡(luò)實(shí)體在接收到快速探測(cè)報(bào)文時(shí),立刻響應(yīng);若第一網(wǎng)絡(luò)實(shí)體按時(shí)接收到快速探測(cè)響應(yīng)報(bào)文,則判定鏈路正常,否則判定鏈路出現(xiàn)故障。
圖1為本發(fā)明的實(shí)現(xiàn)快速檢測(cè)方法的總體流程圖。如圖1所示,該方法包括步驟101,當(dāng)?shù)谝痪W(wǎng)絡(luò)實(shí)體在沒(méi)有按時(shí)收到第二網(wǎng)絡(luò)實(shí)體的保持連接狀態(tài)的報(bào)文時(shí),發(fā)送快速探測(cè)報(bào)文到第二網(wǎng)絡(luò)實(shí)體。
本步驟中,如果鏈路正常,第二網(wǎng)絡(luò)實(shí)體接收到快速探測(cè)報(bào)文,并立刻返回快速探測(cè)響應(yīng)報(bào)文;如果鏈路故障,第二網(wǎng)絡(luò)實(shí)體無(wú)法接收到快速探測(cè)報(bào)文,也就不會(huì)返回快速探測(cè)響應(yīng)報(bào)文。
步驟102,若第一網(wǎng)絡(luò)實(shí)體在規(guī)定時(shí)間內(nèi)接收到第二網(wǎng)絡(luò)實(shí)體返回的快速探測(cè)響應(yīng)報(bào)文,則判定鏈路狀態(tài)正常,否則判定鏈路出現(xiàn)故障。
圖2為本發(fā)明的實(shí)現(xiàn)快速檢測(cè)設(shè)備的總體結(jié)構(gòu)圖。如圖2所示,該設(shè)備200包括接收模塊220和快速探測(cè)模塊230。
在該設(shè)備200中,接收模塊220,用于接收來(lái)自于外部的保持連接狀態(tài)的報(bào)文,并在未按時(shí)接收到該報(bào)文時(shí),通知快速探測(cè)模塊230進(jìn)行故障探測(cè)。
快速探測(cè)模塊230,用于接收接收模塊220發(fā)送的通知,并將快速探測(cè)報(bào)文發(fā)送出去,還用于接收外部的快速探測(cè)響應(yīng)報(bào)文,并在按時(shí)接收到該報(bào)文時(shí),判定鏈路狀態(tài)正常,在未按時(shí)接收到快速探測(cè)響應(yīng)報(bào)文時(shí),判定鏈路出現(xiàn)故障。
上述設(shè)備200可以是在原有OAM實(shí)體設(shè)備內(nèi)增加的部分,或者,也可以是對(duì)原有OAM實(shí)體設(shè)備進(jìn)行的修改,若是后者,那么在該設(shè)備中,還可以包括發(fā)送模塊210,用于執(zhí)行現(xiàn)有的按照保持連接報(bào)文發(fā)送間隔定時(shí)發(fā)送保持連接狀態(tài)的報(bào)文。
以上是對(duì)本發(fā)明的慢速協(xié)議鏈路的快速檢測(cè)方法和設(shè)備的總體概述,下面舉具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。
在本發(fā)明中,第一網(wǎng)絡(luò)實(shí)體發(fā)送快速探測(cè)報(bào)文,根據(jù)在規(guī)定時(shí)間內(nèi)能否接收到第二網(wǎng)絡(luò)實(shí)體返回的快速探測(cè)響應(yīng)報(bào)文來(lái)判斷鏈路是否出現(xiàn)故障。在此過(guò)程中,規(guī)定時(shí)間的計(jì)時(shí)方式可以有兩種第一,設(shè)定一個(gè)固定的時(shí)間間隔-快速探測(cè)等待超時(shí)時(shí)間為規(guī)定時(shí)間,在該時(shí)間內(nèi)第一網(wǎng)絡(luò)實(shí)體向第二網(wǎng)絡(luò)實(shí)體一次或多次重復(fù)發(fā)送快速探測(cè)報(bào)文,以在該快速探測(cè)等待超時(shí)時(shí)間內(nèi)能否接收到第二網(wǎng)絡(luò)實(shí)體返回的快速探測(cè)響應(yīng)報(bào)文來(lái)判斷鏈路是否出現(xiàn)故障;第二,設(shè)定最大探測(cè)次數(shù)和發(fā)送快速探測(cè)報(bào)文的時(shí)間間隔,以二者的乘積作為規(guī)定時(shí)間,第一網(wǎng)絡(luò)實(shí)體按照設(shè)定的發(fā)送快速探測(cè)報(bào)文的時(shí)間間隔重復(fù)向第二網(wǎng)絡(luò)實(shí)體發(fā)送快速探測(cè)報(bào)文,并對(duì)已發(fā)送報(bào)文次數(shù)進(jìn)行計(jì)數(shù),第一網(wǎng)絡(luò)實(shí)體以能否在已發(fā)送報(bào)文次數(shù)超過(guò)最大探測(cè)次數(shù)前接收到第二網(wǎng)絡(luò)返回的快速探測(cè)報(bào)文,判斷鏈路是否出現(xiàn)故障。
下面分別通過(guò)實(shí)施例一和實(shí)施例二對(duì)這兩種方式進(jìn)行詳細(xì)描述。
本發(fā)明的實(shí)施例以在OAM協(xié)議中進(jìn)行快速檢測(cè)的方法和設(shè)備為例,說(shuō)明本發(fā)明的實(shí)施方式。
實(shí)施例一在本實(shí)施例中,設(shè)定一個(gè)固定的時(shí)間間隔-快速探測(cè)等待超時(shí)時(shí)間為規(guī)定時(shí)間,在該快速探測(cè)等待超時(shí)時(shí)間內(nèi)第一OAM實(shí)體向第二OAM實(shí)體發(fā)送快速探測(cè)報(bào)文。
圖3為本發(fā)明實(shí)施例一中OAM協(xié)議鏈路的快速檢測(cè)方法流程圖。如圖3所示,該方法包括步驟301,OAM連接建立。
本步驟為正常的OAM通信做準(zhǔn)備。包括連接本地連接建立、遠(yuǎn)程連接建立。
步驟302,第一OAM實(shí)體定時(shí)發(fā)送OAM報(bào)文,并啟動(dòng)接收定時(shí)器。
本步驟中,第一OAM實(shí)體發(fā)送報(bào)文的發(fā)送間隔均為1秒。在本發(fā)明中,第一OAM實(shí)體所啟動(dòng)的接收定時(shí)器的定時(shí)時(shí)間可以與現(xiàn)有技術(shù)相同,即為現(xiàn)有的保持連接報(bào)文發(fā)送間隔,1秒;或者,為防止發(fā)送延遲抖動(dòng),一種較佳的方式可以為,將接收定時(shí)器的時(shí)間在保持連接報(bào)文發(fā)送間隔的基礎(chǔ)上適當(dāng)擴(kuò)大了一點(diǎn),本實(shí)施例中取接收定時(shí)器為1100毫秒。
步驟303,第一OAM實(shí)體監(jiān)測(cè)是否在接收定時(shí)器超時(shí)前接收到握手的OAM報(bào)文,若是,則返回步驟302,否則執(zhí)行步驟304及其后續(xù)步驟。
步驟302~303是保持OAM連接的過(guò)程,也即第一OAM實(shí)體在接收定時(shí)器超時(shí)前接收到第二OAM實(shí)體發(fā)送的握手的OAM報(bào)文,則表明鏈路的報(bào)文收發(fā)正常,第一OAM實(shí)體繼續(xù)以1秒的時(shí)間間隔向第二OAM實(shí)體發(fā)送OAM報(bào)文;當(dāng)報(bào)文收發(fā)正常時(shí),始終循環(huán)執(zhí)行步驟302~303。
但是若第一OAM實(shí)體在接收定時(shí)器超時(shí)時(shí)仍未接收到第二OAM實(shí)體發(fā)送的握手的OAM報(bào)文,則表明鏈路可能存在問(wèn)題,立刻開(kāi)始快速檢測(cè),即執(zhí)行步驟304及其后續(xù)步驟。
步驟304,啟動(dòng)快速探測(cè)等待超時(shí)定時(shí)器,向第二OAM實(shí)體發(fā)送快速探測(cè)OAM報(bào)文。
本步驟中,快速探測(cè)等待超時(shí)定時(shí)器用來(lái)控制探測(cè)等待超時(shí)時(shí)間,該超時(shí)時(shí)間遠(yuǎn)小于OAM協(xié)議的連接超時(shí)時(shí)間,在本實(shí)施例中為500毫秒,這樣就可以在等待500毫秒后判定鏈路是否出現(xiàn)故障;發(fā)送的快速檢測(cè)OAM報(bào)文可以是重新定義的報(bào)文格式,或者也可以是對(duì)現(xiàn)有OAM報(bào)文進(jìn)行修改后的報(bào)文格式,如可以將OAM報(bào)文中的擴(kuò)展字段作相應(yīng)的定義,形成快速探測(cè)OAM報(bào)文。
若第二OAM實(shí)體接收到快速探測(cè)的OAM報(bào)文,則立刻響應(yīng)。
步驟305,第一OAM實(shí)體監(jiān)測(cè)是否在快速探測(cè)等待超時(shí)定時(shí)器超時(shí)之前,接收到第二OAM實(shí)體發(fā)送的快速探測(cè)響應(yīng)報(bào)文,若是,則返回步驟302,否則執(zhí)行步驟306及其后續(xù)步驟。
在本步驟中,判斷是否在探測(cè)等待超時(shí)定時(shí)器超時(shí)前接收到第二OAM實(shí)體發(fā)送的快速探測(cè)響應(yīng)報(bào)文,,若是,則判定鏈路狀態(tài)正常,返回步驟302,繼續(xù)以O(shè)AM報(bào)文發(fā)送間隔發(fā)送保持連接狀態(tài)的OAM報(bào)文OAMINFOPDU;否則,判定鏈路出現(xiàn)故障,并上報(bào)故障。
這里的快速探測(cè)響應(yīng)報(bào)文既可以是新定義的報(bào)文,也可以是已有的報(bào)文。本實(shí)施例中,采用保持連接狀態(tài)的OAM報(bào)文作為快速探測(cè)響應(yīng)報(bào)文。即第二OAM實(shí)體在正常的通信狀態(tài)下,以預(yù)設(shè)的發(fā)送間隔發(fā)送保持連接狀態(tài)的OAM報(bào)文,也就是每秒發(fā)送一次,當(dāng)接收到快速探測(cè)報(bào)文后,就立刻發(fā)送保持連接狀態(tài)的OAM報(bào)文,作為對(duì)快速探測(cè)的響應(yīng)。第一OAM實(shí)體在快速探測(cè)等待超時(shí)定時(shí)器超時(shí)前,接收到保持連接狀態(tài)的OAM報(bào)文,即確定鏈路狀態(tài)正常。
步驟306,判定鏈路出現(xiàn)故障。
步驟307,第一OAM實(shí)體上報(bào)故障。
步驟308,第一其他上層協(xié)議實(shí)體根據(jù)上報(bào)的故障判斷是否切換到備份鏈路。
至此,本實(shí)施例中的方法流程結(jié)束。
在上述步驟304中,是向第二OAM實(shí)體發(fā)送一次快速探測(cè)報(bào)文,即等待接收?qǐng)?bào)文。事實(shí)上,在實(shí)際應(yīng)用中,網(wǎng)絡(luò)中存在一定的丟包率,如果該快速探測(cè)報(bào)文丟失,即使OAM鏈路正常,第二OAM實(shí)體也不能及時(shí)返回快速探測(cè)響應(yīng)報(bào)文。因此在步驟304中,可以重復(fù)發(fā)送多個(gè)快速探測(cè)報(bào)文,以減小網(wǎng)絡(luò)中報(bào)文丟失對(duì)于故障檢測(cè)準(zhǔn)確性的影響,具體實(shí)施方式
可以為在發(fā)送快速探測(cè)報(bào)文的同時(shí)啟動(dòng)快速定時(shí)器,該快速定時(shí)器是用來(lái)控制快速探測(cè)OAM報(bào)文的時(shí)間間隔的,該時(shí)間間隔遠(yuǎn)小于正常發(fā)送OAM報(bào)文的發(fā)送間隔,也小于快速探測(cè)等待超時(shí)定時(shí)器,如,可以采用100毫秒。在快速探測(cè)等待超時(shí)定時(shí)器超時(shí)之前,若未收到OAM實(shí)體發(fā)送的快速探測(cè)的響應(yīng)報(bào)文,則一直按照快速定時(shí)器的設(shè)定發(fā)送快速探測(cè)的OAM報(bào)文,如每隔100毫秒發(fā)送一份快速探測(cè)的OAM報(bào)文,直到接收到快速探測(cè)響應(yīng)報(bào)文,即停止發(fā)送;或快速探測(cè)等待超時(shí)定時(shí)器超時(shí),也停止發(fā)送。
通過(guò)上述快速定時(shí)器的控制,在本實(shí)施例中,在快速探測(cè)等待超時(shí)定時(shí)器超時(shí)前,若始終未收到快速探測(cè)響應(yīng)報(bào)文,一共可以發(fā)送5個(gè)快速探測(cè)報(bào)文,能夠大大減小網(wǎng)絡(luò)中的丟包現(xiàn)象對(duì)故障檢測(cè)準(zhǔn)確性的影響。
使用上述方法后能夠?qū)崿F(xiàn)故障的快速診斷,與原先的5秒比較效果明顯。舉例來(lái)說(shuō)如果第二OAM實(shí)體1秒發(fā)一個(gè)消息,這樣第一OAM實(shí)體沒(méi)有接收到探測(cè)消息的平均時(shí)間就是1秒,當(dāng)沒(méi)有響應(yīng)時(shí),第一OAM實(shí)體啟動(dòng)100毫秒的快速定時(shí)器和500毫秒的快速探測(cè)等待超時(shí)定時(shí)器,發(fā)送快速探測(cè)報(bào)文,如果共計(jì)5個(gè)快速探測(cè)報(bào)文都沒(méi)有響應(yīng),則判斷端口故障。這樣總的故障檢測(cè)時(shí)間平均為1.5秒左右。與原來(lái)5秒的故障檢測(cè)時(shí)間相比大大縮短,有效提供了故障檢測(cè)的速度。
在本實(shí)施例中,僅以快速定時(shí)器的時(shí)間間隔為100毫秒,快速探測(cè)等待超時(shí)定時(shí)器的超時(shí)時(shí)間為500毫秒舉例說(shuō)明,當(dāng)然在實(shí)際應(yīng)用中,可以根據(jù)實(shí)際情況,定義不同的時(shí)間作為快速定時(shí)器的報(bào)文發(fā)送間隔及快速探測(cè)等待超時(shí)定時(shí)器的超時(shí)時(shí)間。
應(yīng)用上述方法后,在OAM實(shí)體中,其工作時(shí)所處的狀態(tài)就增加了快速探測(cè)狀態(tài),當(dāng)OAM實(shí)體處于快速探測(cè)狀態(tài)時(shí),即開(kāi)始對(duì)鏈路狀態(tài)進(jìn)行快速檢測(cè)。在實(shí)現(xiàn)方面,可以通過(guò)軟件上的快速探測(cè)狀態(tài)機(jī)來(lái)實(shí)現(xiàn)快速探測(cè)狀態(tài)時(shí)的操作。
圖4為增加快速探測(cè)狀態(tài)機(jī)后OAM狀態(tài)遷移的關(guān)系圖。如圖4所示,OAM實(shí)體的狀態(tài)有OAM連接建立初始狀態(tài)(OAM DISCOVERY INIT)、OAM連接建立本端狀態(tài)(OAM DISCOVERY LOCAL)、OAM連接建立遠(yuǎn)端狀態(tài)(OAM DISCOVERY REMOTE)、OAM連接建立OK狀態(tài)(OAMDISCOVERY OK)和快速探測(cè)狀態(tài)。
其中,OAM DISCOVERY INIT、OAM DISCOVERY LOCAL和OAMDISCOVERY REMOTE是在OAM連接建立過(guò)程中的三種狀態(tài),OAMDISCOVERY OK則是保持連接的過(guò)程,它們都是OAM實(shí)體中原有的狀態(tài),其之間的轉(zhuǎn)移關(guān)系與現(xiàn)有技術(shù)相同,這里就不再贅述。下面以圖3所示方法中的定時(shí)時(shí)間為例,介紹一下增加的快速檢測(cè)狀態(tài)與其它狀態(tài)間的轉(zhuǎn)移關(guān)系。
當(dāng)?shù)谝籓AM實(shí)體處于OAM DISCOVERY OK時(shí),若在1100毫秒接收定時(shí)器超時(shí)時(shí),仍未收到第二OAM實(shí)體發(fā)送的保持連接的OAM報(bào)文,則進(jìn)入快速探測(cè)狀態(tài),每100毫秒發(fā)送1次快速探測(cè)OAM報(bào)文,啟動(dòng)500毫秒快速探測(cè)等待超時(shí)定時(shí)器;若500毫秒定時(shí)器超時(shí)時(shí),仍未接收到第二OAM實(shí)體發(fā)送的快速探測(cè)響應(yīng)報(bào)文,則判定鏈路故障,進(jìn)入OAMDISCOVERY INIT狀態(tài);若在500毫秒定時(shí)器超時(shí)前,接收到快速探測(cè)響應(yīng)報(bào)文,則判定鏈路正常,進(jìn)入OAM DISCOVERY OK狀態(tài)。
圖5即為簡(jiǎn)化的OAM狀態(tài)遷移圖。如圖5所示,其中,接收(Rx)狀態(tài)機(jī)即圖4中建立連接和保持連接過(guò)程中的各種狀態(tài)機(jī)的綜合體,OAM快速探測(cè)狀態(tài)機(jī)與Rx狀態(tài)機(jī)間的轉(zhuǎn)換條件為當(dāng)1100毫秒接收定時(shí)器超時(shí)時(shí),即由Rx狀態(tài)機(jī)轉(zhuǎn)入OAM快速探測(cè)狀態(tài)機(jī),當(dāng)收到快速探測(cè)響應(yīng)報(bào)文時(shí),即由OAM快速探測(cè)狀態(tài)機(jī)轉(zhuǎn)入Rx狀態(tài)機(jī)。其它狀態(tài)機(jī)為OAM實(shí)體可能處于的其它狀態(tài)的綜合體。
由上述圖4和圖5的OAM狀態(tài)遷移關(guān)系可以直觀地看出,本發(fā)明通過(guò)OAM快速探測(cè),在不影響正常協(xié)議報(bào)文收發(fā)節(jié)奏的情況下,實(shí)現(xiàn)了鏈路故障的快速檢測(cè),不會(huì)出現(xiàn)連接不穩(wěn)定、網(wǎng)絡(luò)中協(xié)議報(bào)文泛濫、增加CPU負(fù)擔(dān)等問(wèn)題,是解決慢速協(xié)議故障感知遲緩的一個(gè)有效手段。
上述為本實(shí)施例中提供的一種OAM協(xié)議鏈路的快速故障檢測(cè)方法,能夠?qū)崿F(xiàn)對(duì)鏈路故障的快速檢測(cè)。本實(shí)施例還提供一種OAM協(xié)議鏈路的快速故障檢測(cè)設(shè)備,可以用于實(shí)施上述方法。圖6即為本發(fā)明實(shí)施例一中一種OAM協(xié)議鏈路的快速檢測(cè)設(shè)備。該設(shè)備為圖2所示的快速檢測(cè)設(shè)備的一種具體實(shí)施方式
,并且是在原有OAM實(shí)體設(shè)備的基礎(chǔ)上進(jìn)行修改后的設(shè)備,因此其包括發(fā)送模塊210。如圖6所示,該設(shè)備200包括發(fā)送模塊210、接收模塊220和快速探測(cè)模塊230。在本實(shí)施例中,快速探測(cè)模塊230的具體結(jié)構(gòu)包括探測(cè)報(bào)文收發(fā)模塊231、快速探測(cè)等待超時(shí)定時(shí)器232和故障判定模塊233,而探測(cè)報(bào)文收發(fā)模塊631還包括報(bào)文收發(fā)模塊631a和快速定時(shí)器631b。
在該設(shè)備200中,發(fā)送模塊210,用于按照OAM報(bào)文發(fā)送間隔定時(shí)發(fā)送保持連接狀態(tài)的OAM報(bào)文。接收模塊220,用于接收來(lái)自于外部的保持連接狀態(tài)的OAM報(bào)文,并在未按時(shí)接收到該報(bào)文時(shí),通知快速探測(cè)模塊230進(jìn)行故障探測(cè)。
在快速探測(cè)模塊230中,探測(cè)報(bào)文收發(fā)模塊231的報(bào)文收發(fā)模塊231a,用于接收接收模塊220發(fā)送的通知,并在快速定時(shí)器231b的控制下,定時(shí)將快速探測(cè)OAM報(bào)文發(fā)送出去,啟動(dòng)快速探測(cè)等待超時(shí)定時(shí)器232,還用于在快速探測(cè)等待超時(shí)定時(shí)器232的控制下,接收外部的快速探測(cè)響應(yīng)報(bào)文,在接收到快速探測(cè)響應(yīng)報(bào)文時(shí),通知故障判定模塊233已收到響應(yīng),在接收到快速探測(cè)等待超時(shí)定時(shí)器232發(fā)送的超時(shí)消息后,通知故障判定模塊233未收到響應(yīng)。
探測(cè)報(bào)文收發(fā)模塊231的快速定時(shí)器231b,用于控制報(bào)文收發(fā)模塊231a發(fā)送快速探測(cè)報(bào)文的時(shí)間間隔。
快速探測(cè)等待超時(shí)定時(shí)器232,用于控制探測(cè)等待超時(shí)時(shí)間,并在定時(shí)器超時(shí)時(shí),向探測(cè)報(bào)文收發(fā)模塊231發(fā)送超時(shí)消息。
故障判定模塊233,用于接收探測(cè)報(bào)文收發(fā)模塊231發(fā)送的通知消息,并對(duì)消息進(jìn)行判斷,若是已收到響應(yīng)的通知,則判定鏈路狀態(tài)正常,若是未收到響應(yīng)的通知,則判定鏈路出現(xiàn)故障。
在上述設(shè)備200的結(jié)構(gòu)中,探測(cè)報(bào)文收發(fā)模塊231中發(fā)送快速探測(cè)報(bào)文時(shí),是可以進(jìn)行重復(fù)報(bào)文發(fā)送的,在該模塊中利用快速定時(shí)器231b控制快速探測(cè)報(bào)文的發(fā)送時(shí)間間隔。當(dāng)然,如果在發(fā)送快速探測(cè)報(bào)文時(shí)只發(fā)送一次,可以不包括快速定時(shí)器231b,或者可以采用其它的電路結(jié)構(gòu)控制重復(fù)發(fā)送。
在本實(shí)施例中,對(duì)第一OAM實(shí)體是否在規(guī)定時(shí)間內(nèi)接收到快速探測(cè)響應(yīng)報(bào)文,是將快速探測(cè)等待超時(shí)定時(shí)器設(shè)定的超時(shí)時(shí)間作為規(guī)定時(shí)間,在該定時(shí)器超時(shí)前,接收到快速探測(cè)響應(yīng)報(bào)文則判定鏈路狀態(tài)正常,在該定時(shí)器超時(shí)時(shí),仍未接收到快速探測(cè)響應(yīng)報(bào)文則判定鏈路出現(xiàn)故障。
實(shí)施例二在本實(shí)施例中,第一OAM實(shí)體發(fā)送快速探測(cè)報(bào)文時(shí),以固定的時(shí)間間隔重復(fù)發(fā)送,預(yù)先設(shè)置最大探測(cè)次數(shù),接收快速探測(cè)響應(yīng)報(bào)文的規(guī)定時(shí)間為最大探測(cè)次數(shù)與發(fā)送快速探測(cè)報(bào)文的時(shí)間間隔的乘積。
在本實(shí)施例中,兩端OAM實(shí)體建立連接和保持連接狀態(tài)的過(guò)程與實(shí)施例一相同,這里就不再贅述。假定預(yù)先設(shè)置的最大探測(cè)次數(shù)為5。第一OAM實(shí)體在鏈路可能出現(xiàn)故障時(shí)進(jìn)行快速檢測(cè)的過(guò)程如下當(dāng)?shù)谝籓AM實(shí)體在規(guī)定時(shí)間內(nèi)未接收到第二OAM實(shí)體發(fā)送的握手OAM報(bào)文時(shí),則啟動(dòng)快速定時(shí)器,并按照快速定時(shí)器的設(shè)定,以100毫秒為周期向第二OAM實(shí)體發(fā)送快速探測(cè)報(bào)文,本實(shí)施例中以100毫秒的快速定時(shí)器為例。
在發(fā)送快速探測(cè)報(bào)文時(shí),應(yīng)遵循以下的條件若快速定時(shí)器時(shí)間到,即距離上次發(fā)送快速探測(cè)報(bào)文的時(shí)間達(dá)到100毫秒,第一OAM實(shí)體未接收到第二OAM實(shí)體返回的快速探測(cè)響應(yīng)報(bào)文,則第一OAM實(shí)體發(fā)送快速探測(cè)報(bào)文,且對(duì)快速探測(cè)報(bào)文的已發(fā)送次數(shù)進(jìn)行加1操作;一旦第一OAM實(shí)體接收到快速探測(cè)響應(yīng)報(bào)文,則關(guān)閉快速定時(shí)器,不再發(fā)送快速探測(cè)報(bào)文,并將快速探測(cè)報(bào)文的發(fā)送次數(shù)置0;在發(fā)送快速探測(cè)報(bào)文前,比較快速探測(cè)報(bào)文的已發(fā)送次數(shù)與保存的最大探測(cè)次數(shù),若快速探測(cè)報(bào)文的已發(fā)送次數(shù)小于保存的最大探測(cè)次數(shù),則發(fā)送快速探測(cè)報(bào)文,若快速探測(cè)報(bào)文的已發(fā)送次數(shù)等于保存的最大探測(cè)次數(shù),則關(guān)閉快速定時(shí)器,不再發(fā)送快速探測(cè)報(bào)文,并將快速探測(cè)報(bào)文的發(fā)送次數(shù)置0。
按照上述條件發(fā)送快速探測(cè)報(bào)文,若在快速定時(shí)器關(guān)閉前,接收到第二OAM實(shí)體返回的快速探測(cè)響應(yīng)報(bào)文,則判定OAM鏈路狀態(tài)正常;若在快速定時(shí)器關(guān)閉時(shí),仍未接收到OAM實(shí)體返回的快速探測(cè)響應(yīng)報(bào)文,則判定OAM鏈路出現(xiàn)故障。
對(duì)于鏈路出現(xiàn)故障或判定鏈路狀態(tài)正常后,進(jìn)行的后續(xù)操作與實(shí)施例一中相同,這里就不再贅述。
至此,本實(shí)施例中對(duì)OAM鏈路進(jìn)行快速檢測(cè)的流程結(jié)束。
由上述可以看出,在本實(shí)施例中,從第一次發(fā)送快速探測(cè)報(bào)文到最終判定鏈路出現(xiàn)故障的時(shí)間為100毫秒×5=500毫秒,與實(shí)施例一中的時(shí)間相同??梢?jiàn),本實(shí)施例中利用一個(gè)快速定時(shí)器和計(jì)數(shù)機(jī)制可以同樣達(dá)到利用快速定時(shí)器和快速探測(cè)等待超時(shí)定時(shí)器進(jìn)行計(jì)時(shí)的效果,是另外一種可以實(shí)施的對(duì)接收快速探測(cè)響應(yīng)報(bào)文的規(guī)定時(shí)間進(jìn)行限定的方式。
上述為本實(shí)施例中提供的一種OAM協(xié)議鏈路的快速故障檢測(cè)方法,能夠?qū)崿F(xiàn)對(duì)鏈路故障的快速檢測(cè)。本實(shí)施例還提供一種OAM協(xié)議鏈路的快速故障檢測(cè)設(shè)備,可以用于實(shí)施上述方法。圖7即為本發(fā)明實(shí)施例二中一種OAM協(xié)議鏈路的快速檢測(cè)設(shè)備。該設(shè)備為圖2所示的快速檢測(cè)設(shè)備的一種具體實(shí)施方式
,并且是在原有OAM實(shí)體設(shè)備的基礎(chǔ)上進(jìn)行修改后的設(shè)備,因此其包括發(fā)送模塊210。如圖7所示,該設(shè)備200包括發(fā)送模塊210、接收模塊220和快速探測(cè)模塊230。在本實(shí)施例中,快速探測(cè)模塊230的具體結(jié)構(gòu)包括探測(cè)報(bào)文收發(fā)模塊234、快速定時(shí)器235、探測(cè)次數(shù)計(jì)數(shù)器236和故障判定模塊237。
在該設(shè)備200中,發(fā)送模塊210,用于按照OAM協(xié)議規(guī)定定時(shí)發(fā)送保持連接狀態(tài)的OAM報(bào)文。接收模塊220,用于接收來(lái)自于外部的保持連接狀態(tài)的OAM報(bào)文,并在未按時(shí)接收到該報(bào)文時(shí),通知快速探測(cè)模塊230進(jìn)行故障探測(cè)。
在快速探測(cè)模塊230中,探測(cè)報(bào)文收發(fā)模塊234,用于接收接收模塊220發(fā)送的通知,并在快速定時(shí)器235的控制下,定時(shí)將快速探測(cè)OAM報(bào)文發(fā)送出去,并在每次發(fā)送快速探測(cè)報(bào)文時(shí)通知探測(cè)次數(shù)計(jì)數(shù)器236計(jì)數(shù),還用于在探測(cè)次數(shù)計(jì)數(shù)器236的控制下,接收外部的快速探測(cè)響應(yīng)報(bào)文,在接收到快速探測(cè)響應(yīng)報(bào)文時(shí),通知故障判定模塊236已收到響應(yīng),在接收到探測(cè)次數(shù)計(jì)數(shù)器236發(fā)送的停止探測(cè)消息后,通知故障判定模塊237未收到響應(yīng)。
快速定時(shí)器235,用于控制探測(cè)報(bào)文收發(fā)模塊234發(fā)送快速探測(cè)報(bào)文的時(shí)間間隔。探測(cè)次數(shù)計(jì)數(shù)器236,用于保存最大探測(cè)次數(shù),接收探測(cè)報(bào)文收發(fā)模塊234發(fā)送的計(jì)數(shù)信息,并進(jìn)行加1操作,當(dāng)本身的計(jì)數(shù)值等于保存的最大探測(cè)次數(shù)時(shí),向探測(cè)報(bào)文收發(fā)模塊234發(fā)送停止探測(cè)消息。
故障判定模塊237,用于接收探測(cè)報(bào)文收發(fā)模塊234發(fā)送的通知消息,并對(duì)消息進(jìn)行判斷,若是已收到響應(yīng)的通知,則判定鏈路狀態(tài)正常,若是未收到響應(yīng)的通知,則判定鏈路出現(xiàn)故障。
上述即為本實(shí)施例中提供的OAM協(xié)議鏈路的快速檢測(cè)設(shè)備。
上述兩個(gè)實(shí)施例中設(shè)備的實(shí)施方式均以在原有OAM實(shí)體設(shè)備的基礎(chǔ)上進(jìn)行修改的設(shè)備為例進(jìn)行說(shuō)明,事實(shí)上,如果該設(shè)備的實(shí)施方式是在原有OAM實(shí)體設(shè)備的基礎(chǔ)上增加的設(shè)備,則該設(shè)備中涉及快速探測(cè)的接收模塊和快速探測(cè)模塊的實(shí)施方式均與上述兩個(gè)實(shí)施例中相同,只是在該設(shè)備中不包括發(fā)送模塊。
由上述本實(shí)施例中的方法和設(shè)備實(shí)施方式可以看出,在本實(shí)施例中,對(duì)第一OAM實(shí)體是否在規(guī)定時(shí)間內(nèi)接收到快速探測(cè)響應(yīng)報(bào)文的判斷方式為發(fā)送快速探測(cè)報(bào)文時(shí),以固定的時(shí)間間隔重復(fù)發(fā)送,且預(yù)先設(shè)置最大探測(cè)次數(shù),在發(fā)送快速探測(cè)報(bào)文的次數(shù)超過(guò)預(yù)先設(shè)置的最大探測(cè)次數(shù)時(shí)仍未收到快速探測(cè)響應(yīng)報(bào)文,則判定鏈路出現(xiàn)故障,在發(fā)送快速探測(cè)報(bào)文的次數(shù)未超過(guò)預(yù)先設(shè)置的最大探測(cè)次數(shù)時(shí)接收到快速探測(cè)響應(yīng)報(bào)文,則判定鏈路狀態(tài)正常。
由上述兩個(gè)實(shí)施例可以看出,在鏈路正常狀態(tài)下,以1秒的時(shí)間間隔發(fā)送OAM報(bào)文。當(dāng)在規(guī)定的時(shí)間被未收到第二OAM實(shí)體的握手報(bào)文時(shí),即判定鏈路可能出現(xiàn)故障,于是啟動(dòng)快速檢測(cè)機(jī)制進(jìn)行快速檢測(cè)。向第二OAM實(shí)體發(fā)送快速探測(cè)報(bào)文,要求其快速返回響應(yīng)。若在規(guī)定時(shí)間內(nèi)接收到響應(yīng),則表明鏈路正常;否則判定鏈路出現(xiàn)故障。由于等待快速探測(cè)的超時(shí)時(shí)間要遠(yuǎn)短于連接超時(shí)時(shí)間,因此能夠?qū)︽溌饭收献鞒隹焖倥袛啵瑢?shí)現(xiàn)了故障的快速診斷和處理,能夠大大提高服務(wù)質(zhì)量。
上述實(shí)施例是以在OAM協(xié)議中應(yīng)用本發(fā)明為例說(shuō)明的本發(fā)明的具體實(shí)施方式
。事實(shí)上,對(duì)于其它諸如LACP、集群管理協(xié)議、虛擬路由冗余備份協(xié)議等,同樣可以應(yīng)用本發(fā)明解決故障檢測(cè)遲緩的問(wèn)題。
例如,在LACP協(xié)議中,正常狀態(tài)下,發(fā)送保持連接狀態(tài)的LAC報(bào)文LACPDU,當(dāng)在LACP協(xié)議規(guī)定的定時(shí)時(shí)間內(nèi)接收到握手報(bào)文,即向第二網(wǎng)絡(luò)實(shí)體發(fā)送快速探測(cè)報(bào)文,進(jìn)行鏈路故障檢測(cè)。第二網(wǎng)絡(luò)實(shí)體在接收到快速探測(cè)報(bào)文后,立刻返回快速探測(cè)響應(yīng)報(bào)文,該報(bào)文可以是保持連接狀態(tài)的LACPDU,也可以是其它新定義的報(bào)文格式,只要能夠通知第一網(wǎng)絡(luò)實(shí)體鏈路狀態(tài)正常即可。第一網(wǎng)絡(luò)實(shí)體在發(fā)送快速探測(cè)報(bào)文的同時(shí),啟動(dòng)快速探測(cè)等待超時(shí)定時(shí)器,若在該定時(shí)器超時(shí)前收到快速探測(cè)響應(yīng)報(bào)文,則判定鏈路狀態(tài)正常,切換回正常狀態(tài),以LACP規(guī)定的頻率發(fā)送保持連接狀態(tài)的LACPDU;若在快速探測(cè)等待定時(shí)器超時(shí)時(shí),仍未接收到快速探測(cè)響應(yīng)報(bào)文,則判定鏈路出現(xiàn)故障。當(dāng)然在發(fā)送快速探測(cè)報(bào)文時(shí),也可以以一定的頻率重復(fù)發(fā)送,以減小網(wǎng)絡(luò)中的丟包現(xiàn)象對(duì)故障檢測(cè)準(zhǔn)確性的影響。
可見(jiàn),本發(fā)明對(duì)于慢速協(xié)議中的故障檢測(cè)均可以適用,都可以達(dá)到快速檢測(cè)鏈路故障的目的,且不會(huì)出現(xiàn)影響正常報(bào)文交互節(jié)奏、使得網(wǎng)絡(luò)中報(bào)文泛濫及增加CPU負(fù)擔(dān)等問(wèn)題。
以上僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種實(shí)現(xiàn)快速檢測(cè)的方法,其特征在于,該方法包括a、當(dāng)?shù)谝痪W(wǎng)絡(luò)實(shí)體在沒(méi)有按時(shí)收到第二網(wǎng)絡(luò)實(shí)體的保持連接狀態(tài)的報(bào)文時(shí),向第二網(wǎng)絡(luò)實(shí)體發(fā)送快速探測(cè)報(bào)文;b、若第一網(wǎng)絡(luò)實(shí)體在規(guī)定時(shí)間內(nèi)接收到第二網(wǎng)絡(luò)實(shí)體返回的快速探測(cè)響應(yīng)報(bào)文,則判定鏈路狀態(tài)正常,否則判定鏈路出現(xiàn)故障。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟a中所述向第二網(wǎng)絡(luò)實(shí)體發(fā)送快速探測(cè)報(bào)文時(shí),啟動(dòng)預(yù)先設(shè)置的快速探測(cè)等待超時(shí)定時(shí)器;步驟b中所述規(guī)定時(shí)間為快速探測(cè)等待超時(shí)定時(shí)器的定時(shí)時(shí)間;步驟b中判定鏈路狀態(tài)正常后,進(jìn)一步包括關(guān)閉快速探測(cè)等待超時(shí)定時(shí)器。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,步驟a中所述向第二網(wǎng)絡(luò)實(shí)體發(fā)送快速探測(cè)報(bào)文為在快速探測(cè)等待超時(shí)定時(shí)器超時(shí)前,第一網(wǎng)絡(luò)實(shí)體向第二網(wǎng)絡(luò)實(shí)體重復(fù)發(fā)送快速探測(cè)報(bào)文。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,步驟a中啟動(dòng)快速探測(cè)等待超時(shí)定時(shí)器時(shí),進(jìn)一步啟動(dòng)快速定時(shí)器;所述向第二網(wǎng)絡(luò)實(shí)體重復(fù)發(fā)送快速探測(cè)報(bào)文為第一網(wǎng)絡(luò)實(shí)體按照快速定時(shí)器的設(shè)定,定時(shí)向第二網(wǎng)絡(luò)實(shí)體發(fā)送快速探測(cè)報(bào)文。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,預(yù)先設(shè)置最大探測(cè)次數(shù),步驟a中所述發(fā)送快速探測(cè)報(bào)文為在未收到快速探測(cè)響應(yīng)報(bào)文前,以固定的時(shí)間間隔發(fā)送快速探測(cè)報(bào)文;步驟b中所述第一網(wǎng)絡(luò)實(shí)體在規(guī)定時(shí)間內(nèi)接收到第二網(wǎng)絡(luò)實(shí)體返回的快速探測(cè)響應(yīng)報(bào)文為快速探測(cè)報(bào)文的發(fā)送次數(shù)超過(guò)最大探測(cè)次數(shù)前,接收到第二網(wǎng)絡(luò)實(shí)體返回的快速探測(cè)響應(yīng)報(bào)文。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述快速探測(cè)報(bào)文為新定義的報(bào)文或修改后的已有報(bào)文。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述快速探測(cè)響應(yīng)報(bào)文為新定義的報(bào)文或步驟a中所述保持連接狀態(tài)的報(bào)文。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟b中判定鏈路狀態(tài)正常后,進(jìn)一步包括第一網(wǎng)絡(luò)實(shí)體切換回正常狀態(tài),按照保持連接報(bào)文發(fā)送間隔發(fā)送保持連接狀態(tài)的報(bào)文。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟b中判定鏈路出現(xiàn)故障后,進(jìn)一步包括上報(bào)鏈路故障,上層協(xié)議根據(jù)該鏈路故障判斷是否切換到備份鏈路。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟a中所述沒(méi)有按時(shí)收到為在相比保持連接報(bào)文發(fā)送間隔延長(zhǎng)后的時(shí)間間隔內(nèi)沒(méi)有收到。
11.一種實(shí)現(xiàn)快速檢測(cè)的設(shè)備,其特征在于,該設(shè)備包括接收模塊和快速探測(cè)模塊;所述接收模塊,用于接收來(lái)自于外部的保持連接狀態(tài)的報(bào)文,并在未按時(shí)接收到該報(bào)文時(shí),通知快速探測(cè)模塊進(jìn)行故障探測(cè);所述快速探測(cè)模塊,用于接收所述接收模塊發(fā)送的通知,并將快速探測(cè)報(bào)文發(fā)送出去,還用于接收外部的快速探測(cè)響應(yīng)報(bào)文,并在規(guī)定時(shí)間內(nèi)接收到該報(bào)文時(shí),判定鏈路狀態(tài)正常,在規(guī)定時(shí)間內(nèi)未接收到快速探測(cè)響應(yīng)報(bào)文時(shí),判定鏈路出現(xiàn)故障。
12.根據(jù)權(quán)利要求11所述的設(shè)備,其特征在于,所述快速探測(cè)模塊包括探測(cè)報(bào)文收發(fā)模塊、快速探測(cè)等待超時(shí)定時(shí)器和故障判定模塊;所述探測(cè)報(bào)文收發(fā)模塊,用于接收所述接收模塊發(fā)送的通知,并將快速探測(cè)報(bào)文發(fā)送出去,啟動(dòng)所述快速探測(cè)等待超時(shí)定時(shí)器,還用于在所述快速探測(cè)等待超時(shí)定時(shí)器的控制下,接收外部的快速探測(cè)響應(yīng)報(bào)文,在接收到快速探測(cè)響應(yīng)報(bào)文時(shí),通知所述故障判定模塊已收到響應(yīng),并關(guān)閉所述快速探測(cè)等待超時(shí)定時(shí)器,在接收到所述快速探測(cè)等待超時(shí)定時(shí)器發(fā)送的超時(shí)消息后,通知所述故障判定模塊未收到響應(yīng);所述快速探測(cè)等待超時(shí)定時(shí)器,用于接收所述探測(cè)報(bào)文收發(fā)模塊發(fā)送的啟動(dòng)和關(guān)閉信號(hào),控制探測(cè)等待超時(shí)時(shí)間,并在定時(shí)器超時(shí)時(shí),向所述探測(cè)報(bào)文收發(fā)模塊發(fā)送超時(shí)消息;所述故障判定模塊,用于接收所述探測(cè)報(bào)文收發(fā)模塊發(fā)送的通知消息,并對(duì)消息進(jìn)行判斷,若該消息是已收到響應(yīng)的通知,則判定鏈路狀態(tài)正常,若該消息是未收到響應(yīng)的通知,則判定鏈路出現(xiàn)故障。
13.根據(jù)權(quán)利要求12所述的設(shè)備,其特征在于,所述探測(cè)報(bào)文收發(fā)模塊包括報(bào)文收發(fā)模塊和快速定時(shí)器;所述報(bào)文收發(fā)模塊,用于接收所述接收模塊發(fā)送的通知,并在所述快速定時(shí)器的控制下,定時(shí)將快速探測(cè)報(bào)文發(fā)送出去,啟動(dòng)所述快速探測(cè)等待超時(shí)定時(shí)器,還用于在所述快速探測(cè)等待超時(shí)定時(shí)器的控制下,接收外部的快速探測(cè)響應(yīng)報(bào)文,在接收到快速探測(cè)響應(yīng)報(bào)文時(shí),通知所述故障判定模塊已收到響應(yīng),在接收到所述快速探測(cè)等待超時(shí)定時(shí)器發(fā)送的超時(shí)消息后,通知所述故障判定模塊未收到響應(yīng);所述快速定時(shí)器,用于接收所述報(bào)文收發(fā)模塊發(fā)送的啟動(dòng)信號(hào),控制所述報(bào)文收發(fā)模塊發(fā)送快速探測(cè)報(bào)文的時(shí)間間隔。
14.根據(jù)權(quán)利要求11所述的設(shè)備,其特征在于,所述快速探測(cè)模塊包括探測(cè)報(bào)文收發(fā)模塊、快速定時(shí)器、探測(cè)次數(shù)計(jì)數(shù)器和故障判定模塊;所述探測(cè)報(bào)文收發(fā)模塊,用于接收所述接收模塊發(fā)送的通知,并在所述快速定時(shí)器的控制下,定時(shí)將快速探測(cè)報(bào)文發(fā)送出去,并在每次發(fā)送快速探測(cè)報(bào)文時(shí)通知所述探測(cè)次數(shù)計(jì)數(shù)器計(jì)數(shù),還用于在所述探測(cè)次數(shù)計(jì)數(shù)器的控制下,接收外部的快速探測(cè)響應(yīng)報(bào)文,在接收到快速探測(cè)響應(yīng)報(bào)文時(shí),通知所述故障判定模塊已收到響應(yīng),在接收到所述計(jì)數(shù)器發(fā)送的停止探測(cè)消息后,通知所述故障判定模塊未收到響應(yīng);所述快速定時(shí)器,用于控制所述探測(cè)報(bào)文收發(fā)模塊發(fā)送快速探測(cè)報(bào)文的時(shí)間間隔;所述探測(cè)次數(shù)計(jì)數(shù)器,用于保存最大探測(cè)次數(shù),接收所述探測(cè)報(bào)文收發(fā)模塊發(fā)送的計(jì)數(shù)信息,并進(jìn)行加1操作,當(dāng)本身的計(jì)數(shù)值等于保存的最大探測(cè)次數(shù)時(shí),向所述探測(cè)報(bào)文收發(fā)模塊發(fā)送停止探測(cè)消息;所述故障判定模塊,用于接收所述探測(cè)報(bào)文收發(fā)模塊發(fā)送的通知消息,并對(duì)消息進(jìn)行判斷,若該消息是已收到響應(yīng)的通知,則判定鏈路狀態(tài)正常,若該消息是未收到響應(yīng)的通知,則判定鏈路出現(xiàn)故障。
全文摘要
本發(fā)明公開(kāi)了一種實(shí)現(xiàn)快速檢測(cè)的方法,該方法包括當(dāng)?shù)谝痪W(wǎng)絡(luò)實(shí)體在沒(méi)有按時(shí)收到第二網(wǎng)絡(luò)實(shí)體的保持連接狀態(tài)的報(bào)文時(shí),向第二網(wǎng)絡(luò)實(shí)體發(fā)送快速探測(cè)報(bào)文;若第一網(wǎng)絡(luò)實(shí)體在規(guī)定時(shí)間內(nèi)接收到第二網(wǎng)絡(luò)實(shí)體返回的快速探測(cè)響應(yīng)報(bào)文,則判定鏈路狀態(tài)正常,否則判定鏈路出現(xiàn)故障。應(yīng)用本發(fā)明的方法,在鏈路故障或報(bào)文丟失情況下能夠快速地發(fā)現(xiàn)問(wèn)題,及時(shí)進(jìn)行備份鏈路切換,增強(qiáng)網(wǎng)絡(luò)的健壯性,大大提高服務(wù)質(zhì)量。本發(fā)明還公開(kāi)了一種實(shí)現(xiàn)快速檢測(cè)的設(shè)備,包括接收模塊和快速探測(cè)模塊。
文檔編號(hào)H04L12/24GK1925429SQ20061015971
公開(kāi)日2007年3月7日 申請(qǐng)日期2006年9月30日 優(yōu)先權(quán)日2006年9月30日
發(fā)明者邱元香 申請(qǐng)人:杭州華為三康技術(shù)有限公司