專利名稱:一種對(duì)數(shù)據(jù)通道狀態(tài)進(jìn)行實(shí)時(shí)檢測(cè)的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明屬于通訊領(lǐng)域,涉及分組通訊底層數(shù)據(jù)通道狀態(tài)的實(shí)時(shí)檢測(cè)技術(shù),具體是一種對(duì)數(shù)據(jù)通道狀態(tài)進(jìn)行實(shí)時(shí)在線檢測(cè)的系統(tǒng)和方法,本發(fā)明通過(guò)告警和告警恢復(fù)防止正常數(shù)據(jù)業(yè)務(wù)的中斷,保證數(shù)據(jù)業(yè)務(wù)長(zhǎng)時(shí)間穩(wěn)定的工作。
背景技術(shù):
在現(xiàn)有的移動(dòng)通訊網(wǎng)絡(luò)中提供數(shù)據(jù)業(yè)務(wù)有兩種方式,一種是電路型的數(shù)據(jù)業(yè)務(wù),一種是分組型的數(shù)據(jù)業(yè)務(wù)。
電路型的數(shù)據(jù)業(yè)務(wù)是基于IWF(Inter-working Function,網(wǎng)絡(luò)互聯(lián)功能)來(lái)實(shí)現(xiàn)的,它主要用來(lái)支持第2代手機(jī)用戶使用數(shù)據(jù)業(yè)務(wù),采用普通的語(yǔ)音通道作為數(shù)據(jù)包的傳輸承載,不管用戶是否發(fā)送分組數(shù)據(jù)包,用戶獨(dú)占相應(yīng)空中信道資源和交換機(jī)時(shí)隙。
分組型數(shù)據(jù)業(yè)務(wù)則是采用分組交換設(shè)備來(lái)實(shí)現(xiàn)的,它用于支持2.5代以及以后的第3代手機(jī),用戶使用的數(shù)據(jù)業(yè)務(wù),利用該網(wǎng)絡(luò)可以提供高達(dá)100kbps以上速率的數(shù)據(jù)速率,同時(shí)能提供簡(jiǎn)單IP和移動(dòng)IP兩種方式。
在2.5代網(wǎng)絡(luò)中,分組數(shù)據(jù)業(yè)務(wù)的實(shí)現(xiàn)依賴于以下幾個(gè)設(shè)備媒體網(wǎng)關(guān)、歸屬代理、鑒權(quán)授權(quán)計(jì)費(fèi)中心等。因?yàn)椴捎昧薎P(Internet Protocol,網(wǎng)絡(luò)互連協(xié)議)包承載技術(shù),所以可以實(shí)現(xiàn)按數(shù)據(jù)量計(jì)費(fèi),而且可以實(shí)現(xiàn)多用戶共享信道資源和傳輸帶寬等,采用移動(dòng)IP技術(shù)可以實(shí)現(xiàn)永遠(yuǎn)在線和網(wǎng)絡(luò)安全等。
隨著數(shù)據(jù)用戶的迅速增長(zhǎng),和移動(dòng)數(shù)據(jù)業(yè)務(wù)的快速發(fā)展,移動(dòng)運(yùn)營(yíng)商越來(lái)越感到提高網(wǎng)絡(luò)運(yùn)行維護(hù)水平的重要性。提高網(wǎng)絡(luò)質(zhì)量,優(yōu)化網(wǎng)絡(luò)性能是保證網(wǎng)絡(luò)安全、穩(wěn)定、可靠運(yùn)行的基礎(chǔ),是發(fā)揮分組域數(shù)據(jù)網(wǎng)絡(luò)高速數(shù)據(jù)率優(yōu)勢(shì)的重要保證。
中國(guó)聯(lián)通的CDMA(Code Division Multi Address,碼分多址多路訪問(wèn))2000-1X(第一階段)網(wǎng)絡(luò)通過(guò)原有網(wǎng)絡(luò)基礎(chǔ)上并增加了PCF(Packet Control Function,分組控制功能)、PDSN(Packet Data Service Node,分組數(shù)據(jù)服務(wù)節(jié)點(diǎn))、AAA(Authentication、Authorization、Accounting,鑒權(quán)授權(quán)計(jì)費(fèi))及相關(guān)路由器、防火墻等設(shè)備而構(gòu)成的。他們指定的CDMA2000-1X網(wǎng)絡(luò)運(yùn)行維護(hù)質(zhì)量的指標(biāo)主要包括數(shù)據(jù)用戶的接入成功率、數(shù)據(jù)用戶的掉話率、PCF的注冊(cè)請(qǐng)求成功率、PPP(Point to Point Protocol,點(diǎn)對(duì)點(diǎn)協(xié)議)連接成功率、認(rèn)證請(qǐng)求成功率等。其中最重要的一個(gè)指標(biāo)是分組數(shù)據(jù)的呼叫建立成功率,數(shù)據(jù)用戶的掉話率等。這一關(guān)鍵指標(biāo)貫穿無(wú)線、PCF、PDSN、AAA等設(shè)備,涉及A10/A11(A口協(xié)議)信令接口和PPP、IP協(xié)議,而底層可靠穩(wěn)定的數(shù)據(jù)通道更是提高這一指標(biāo)的根本保證。
為了應(yīng)付日益繁忙的信息流,網(wǎng)絡(luò)設(shè)備的底層硬件架構(gòu)也有了較大的飛躍。當(dāng)速度比較慢時(shí),通用的CPU(Central Processing Unit,中央處理器)完全能夠適應(yīng)對(duì)數(shù)據(jù)的處理,當(dāng)網(wǎng)絡(luò)處理速度較快時(shí)就出現(xiàn)了專門的NP(Network Processor-網(wǎng)絡(luò)處理器)。與通用的處理器的不同之處在于,網(wǎng)絡(luò)處理器是為優(yōu)化包處理而設(shè)計(jì)的,它將包以其到達(dá)的速度(即線速)送到下一個(gè)節(jié)點(diǎn);而通用處理器則要處理范圍很大的各種指令。另外,如果需要新的功能或新的標(biāo)準(zhǔn),網(wǎng)絡(luò)處理器可通過(guò)編程來(lái)實(shí)現(xiàn),以滿足各種各樣的網(wǎng)絡(luò)應(yīng)用,但是網(wǎng)絡(luò)處理器也不是沒(méi)有缺點(diǎn),它對(duì)特定數(shù)據(jù)進(jìn)行單一處理的性能又不是最好。為了實(shí)現(xiàn)既靈活又高速的數(shù)據(jù)處理能力,業(yè)界一般采用以下兩種硬件架構(gòu)1、通用CPU加ASIC(專用集成電路),通用CPU具有較靈活的編程能力,同時(shí)駐留有操作系統(tǒng),可以很便捷的進(jìn)行各種算法的處理,ASIC又對(duì)特定運(yùn)算的處理能力很強(qiáng),二者具有很好的互補(bǔ)性。
2、網(wǎng)絡(luò)處理器加PLD(可編程邏輯器件),網(wǎng)絡(luò)處理器中存在通用的CPU內(nèi)核,具有通用CPU的特點(diǎn),微引擎具有一定的編程能力和數(shù)據(jù)報(bào)文的處理能力,再加上可編程的器件,應(yīng)用起來(lái)非常靈活。
但是無(wú)論哪種架構(gòu),隨著處理能力和靈活性的提升,問(wèn)題也就顯露出來(lái),在大流量進(jìn)行復(fù)雜處理過(guò)程中存在著一定量的誤碼現(xiàn)象,有時(shí)會(huì)引起穩(wěn)定性的下降,甚至出現(xiàn)業(yè)務(wù)中斷或系統(tǒng)崩潰的嚴(yán)重后果。問(wèn)題的原因主要有三點(diǎn)1、由于接口處理的復(fù)雜和硬件本身的兼容性的問(wèn)題,造成系統(tǒng)在高負(fù)荷運(yùn)行的時(shí)候,會(huì)出現(xiàn)異常。
2、現(xiàn)網(wǎng)的報(bào)文比較復(fù)雜,會(huì)有一些特殊報(bào)文在系統(tǒng)設(shè)計(jì)過(guò)程沒(méi)有考慮到,使得系統(tǒng)處理異常,導(dǎo)致通道被阻塞,也是系統(tǒng)的容錯(cuò)性不夠造成的。
3、由于受到器件本身的原因,比如進(jìn)行熱插拔等不當(dāng)?shù)牟僮鲿r(shí),會(huì)造成器件的損傷。
這些由于底層硬件引起的數(shù)據(jù)通道的故障一旦出現(xiàn),就非常難定位,對(duì)于上層應(yīng)用幾乎是束手無(wú)策。而對(duì)于運(yùn)營(yíng)的通訊網(wǎng)絡(luò)來(lái)說(shuō)后果是非常嚴(yán)重的,通常會(huì)引起正常業(yè)務(wù)的中斷,從而帶來(lái)巨大的經(jīng)濟(jì)損失。
從以上可以看出,無(wú)論從運(yùn)營(yíng)商的需求還是硬件架構(gòu)來(lái)看,提高數(shù)據(jù)通道的可靠性,以及可預(yù)見(jiàn)性都具有十分迫切的現(xiàn)實(shí)意義。
針對(duì)運(yùn)營(yíng)商提出的網(wǎng)絡(luò)質(zhì)量的指標(biāo),廠家采取一定的措施來(lái)保證,通常采用相應(yīng)的二次開(kāi)發(fā)的軟件或硬件設(shè)備來(lái)進(jìn)行檢測(cè)。
名稱為“一種ID狀態(tài)信號(hào)線的檢測(cè)方法”的專利申請(qǐng),公開(kāi)號(hào)為CN1614567,
公開(kāi)日為2005年5月11日,是一種基于ID狀態(tài)信號(hào)線的單板狀態(tài)在線檢測(cè)方法,其步驟為讀取功能模塊中ID狀態(tài)信號(hào)線的ID標(biāo)識(shí)狀態(tài)值,進(jìn)行校驗(yàn),由該ID標(biāo)識(shí)狀態(tài)值得出校驗(yàn)線的狀態(tài)值;將該ID標(biāo)識(shí)狀態(tài)值和該校驗(yàn)線的狀態(tài)值按照異或運(yùn)算式計(jì)算,得出結(jié)果值;將該結(jié)果值與校驗(yàn)線狀態(tài)值比較是否一致,從而獲得檢測(cè)結(jié)果。
該方法通過(guò)增加校驗(yàn)線,從而實(shí)現(xiàn)了系統(tǒng)中單板的在線檢測(cè),當(dāng)檢測(cè)異常時(shí),通過(guò)預(yù)先設(shè)定的備用通道實(shí)現(xiàn)故障信息的上報(bào),從而避免了因?yàn)镮D狀態(tài)信號(hào)線出現(xiàn)故障而導(dǎo)致的系統(tǒng)崩潰。
但這種方法的局限性是主要針對(duì)單板由于熱插拔,或器件失效等原因造成的ID狀態(tài)異常的問(wèn)題,不能夠很準(zhǔn)確的定位數(shù)據(jù)通道的異常,當(dāng)ID狀態(tài)正常時(shí)也不能確定數(shù)據(jù)通道完全正常。
雖然有了二次開(kāi)發(fā)的一些檢測(cè)軟件,但是很多方面并不是很有針對(duì)性的解決現(xiàn)網(wǎng)運(yùn)行的數(shù)據(jù)通道的一般性問(wèn)題,而且很多都是在故障已經(jīng)發(fā)生了才檢測(cè)出故障,正常的用戶業(yè)務(wù)已經(jīng)中斷,造成了巨大的經(jīng)濟(jì)損失。
發(fā)明內(nèi)容本發(fā)明的目的是在不影響正常的數(shù)據(jù)業(yè)務(wù),基于業(yè)界已有的兩種架構(gòu),提供一種對(duì)一般數(shù)據(jù)通道進(jìn)行實(shí)時(shí)在線檢測(cè)的系統(tǒng)和方法,本發(fā)明通過(guò)告警、告警恢復(fù),防止正常數(shù)據(jù)業(yè)務(wù)中斷,保證數(shù)據(jù)業(yè)務(wù)長(zhǎng)時(shí)間穩(wěn)定的工作。
本發(fā)明具體是這樣實(shí)現(xiàn)的一種對(duì)數(shù)據(jù)通道狀態(tài)進(jìn)行實(shí)時(shí)檢測(cè)的系統(tǒng),包括業(yè)務(wù)代理模塊,告警模塊,底層數(shù)據(jù)通道,其特征在于所述業(yè)務(wù)代理模塊,設(shè)置檢測(cè)報(bào)文發(fā)送模塊及檢測(cè)報(bào)文回收模塊;所述底層數(shù)據(jù)通道,設(shè)置數(shù)據(jù)轉(zhuǎn)換模塊;所述檢測(cè)報(bào)文發(fā)送模塊及檢測(cè)報(bào)文回收模塊,通過(guò)共享內(nèi)存方式和底層數(shù)據(jù)通道建立統(tǒng)一的接口,檢測(cè)報(bào)文發(fā)送模塊構(gòu)造檢測(cè)報(bào)文,檢測(cè)報(bào)文回收模塊回收檢測(cè)報(bào)文;所述數(shù)據(jù)轉(zhuǎn)換模塊,用于檢測(cè)報(bào)文的解析,通過(guò)建立的接口分揀出檢測(cè)報(bào)文,分別發(fā)送給業(yè)務(wù)代理模塊和底層數(shù)據(jù)通道;
啟動(dòng)限定檢測(cè)報(bào)文是否按時(shí)到達(dá)的超時(shí)定時(shí)器,并初始化設(shè)定告警門限的不可達(dá)計(jì)數(shù)器。
所述數(shù)據(jù)轉(zhuǎn)換模塊進(jìn)一步分為兩個(gè)轉(zhuǎn)換模塊,轉(zhuǎn)換模塊一從發(fā)送模塊接收檢測(cè)報(bào)文并分揀出檢測(cè)報(bào)文,轉(zhuǎn)換模塊二從用戶數(shù)據(jù)報(bào)文中分揀出檢測(cè)報(bào)文來(lái),并回送給檢測(cè)報(bào)文回收模塊。
所述檢測(cè)報(bào)文發(fā)送及回收模塊由網(wǎng)絡(luò)處理器的通用CPU中駐留的業(yè)務(wù)代理模塊來(lái)完成;所述數(shù)據(jù)轉(zhuǎn)換模塊由網(wǎng)絡(luò)處理器中的微引擎來(lái)完成;所述底層數(shù)據(jù)通道由可編程邏輯器件構(gòu)成;所述告警模塊由駐留在系統(tǒng)內(nèi)的代理進(jìn)程和數(shù)據(jù)庫(kù)共同完成。
步驟一,通過(guò)共享內(nèi)存方式和底層數(shù)據(jù)通道建立統(tǒng)一的接口,檢測(cè)報(bào)文發(fā)送模塊構(gòu)造檢測(cè)報(bào)文,檢測(cè)報(bào)文回收模塊回收檢測(cè)報(bào)文;步驟二,數(shù)據(jù)轉(zhuǎn)換模塊解析檢測(cè)報(bào)文,通過(guò)建立的接口分揀出檢測(cè)報(bào)文,分別發(fā)送給業(yè)務(wù)代理模塊和底層數(shù)據(jù)通道;步驟三,啟動(dòng)限定檢測(cè)報(bào)文是否按時(shí)到達(dá)的超時(shí)定時(shí)器,并初始化設(shè)定告警門限的不可達(dá)計(jì)數(shù)器。
所述步驟一和步驟二進(jìn)一步包括如下處理步驟1檢測(cè)報(bào)文發(fā)送模塊構(gòu)造出檢測(cè)報(bào)文發(fā)送給底層數(shù)據(jù)通道;步驟2數(shù)據(jù)轉(zhuǎn)換模塊通過(guò)建立的接口解析出檢測(cè)報(bào)文的類型,送給底層數(shù)據(jù)通道和一般用戶的數(shù)據(jù)報(bào)文一樣處理,出現(xiàn)異常時(shí),檢測(cè)報(bào)文會(huì)被丟棄或遲滯。;步驟3處理完成后數(shù)據(jù)轉(zhuǎn)換模塊再次從用戶數(shù)據(jù)報(bào)文中分揀出檢測(cè)報(bào)文,然后返回給檢測(cè)報(bào)文回收模塊,出現(xiàn)異常情況時(shí),檢測(cè)報(bào)文不能夠正常返回。
所述步驟三中,如果檢測(cè)報(bào)文回收模塊的定時(shí)器超時(shí),不可達(dá)計(jì)數(shù)器值加一,當(dāng)不可達(dá)計(jì)數(shù)器值超過(guò)告警門限時(shí),業(yè)務(wù)代理模塊進(jìn)入告警狀態(tài);如果定時(shí)器不超時(shí),業(yè)務(wù)代理模塊維持初始狀態(tài)。
所述檢測(cè)報(bào)文定義一個(gè)用戶不能訪問(wèn)的ID號(hào),避免影響正常的用戶接入;所述檢測(cè)報(bào)文定義一個(gè)序列號(hào),與檢測(cè)時(shí)間間隔相對(duì)應(yīng),不與時(shí)間間隔內(nèi)對(duì)應(yīng)的序列號(hào)的檢測(cè)報(bào)文被丟棄;所述檢測(cè)報(bào)文發(fā)送的頻率,根據(jù)系統(tǒng)流量和用戶情況確定;對(duì)于前向檢測(cè)和反向檢測(cè),告警和告警恢復(fù)的方式不同,構(gòu)造的檢測(cè)報(bào)文不同。
業(yè)務(wù)代理模塊處于告警狀態(tài)但沒(méi)有發(fā)送告警消息,則發(fā)送告警消息給告警模塊,如果告警消息已經(jīng)發(fā)送則不再發(fā)送。
如果業(yè)務(wù)代理模塊已經(jīng)處于告警狀態(tài),仍然繼續(xù)定時(shí)的發(fā)送檢測(cè)報(bào)文,如果檢測(cè)報(bào)文回收模塊的定時(shí)器不超時(shí),業(yè)務(wù)代理模塊發(fā)送告警恢復(fù)消息通知告警模塊。
如果檢測(cè)報(bào)文回收模塊超時(shí),業(yè)務(wù)代理模塊讀取相應(yīng)底層數(shù)據(jù)通道相關(guān)寄存器的狀態(tài),如果底層數(shù)據(jù)通道的硬件異常,通過(guò)寫(xiě)寄存器或復(fù)位的方式,使系統(tǒng)重新正常運(yùn)行。
通過(guò)以下具體實(shí)施例本發(fā)明的有益效果可歸納為1.提供了實(shí)時(shí)在線檢測(cè)的方法,由業(yè)務(wù)代理模塊主動(dòng)地檢測(cè)底層數(shù)據(jù)通道,實(shí)時(shí)性體現(xiàn)在檢測(cè)過(guò)程是周期性的,所以當(dāng)通道異常時(shí)實(shí)現(xiàn)實(shí)時(shí)告警,如果通道恢復(fù)正常時(shí),能夠?qū)崿F(xiàn)告警的恢復(fù)。
2.專門定義了統(tǒng)一的接口,使底層通道能有效地分揀出檢測(cè)報(bào)文來(lái)。
3.通過(guò)規(guī)定的ID號(hào)作為區(qū)分,利用一個(gè)用戶幾乎不能訪問(wèn)的ID號(hào)來(lái)處理檢測(cè)報(bào)文,這樣可以避免影響正常的用戶接入。另,接口定義的序列號(hào)的檢測(cè)有效的檢測(cè)出了由于檢測(cè)報(bào)文亂序或底層通道遲滯的情況所帶來(lái)的異常。
4.當(dāng)?shù)讓訑?shù)據(jù)通道出現(xiàn)異常時(shí),通過(guò)分析寄存器的狀態(tài)和相應(yīng)統(tǒng)計(jì)數(shù)據(jù),能較準(zhǔn)確的定位出故障的具體原因,并通過(guò)寫(xiě)寄存器的方式進(jìn)行有效的恢復(fù),具有一定的自恢復(fù)能力。
5.由于實(shí)現(xiàn)該方法基本不需要增加額外的硬件,所以實(shí)現(xiàn)簡(jiǎn)單易行。
圖1是本發(fā)明所述數(shù)據(jù)通道檢測(cè)系統(tǒng)各模塊結(jié)構(gòu)圖。
圖2是本發(fā)明所述數(shù)據(jù)通道狀態(tài)檢測(cè)流程圖。
具體實(shí)施方式如圖1所示本發(fā)明系統(tǒng)在原軟件、硬件架構(gòu)的基礎(chǔ)上,進(jìn)一步設(shè)置以下幾個(gè)模塊。
1、檢測(cè)報(bào)文發(fā)送及回收模塊駐留在業(yè)務(wù)代理模塊中,通過(guò)共享內(nèi)存等方式和底層數(shù)據(jù)通道存在統(tǒng)一的接口,其中,發(fā)送模塊,用于構(gòu)造檢測(cè)報(bào)文,回收模塊,用于回收檢測(cè)報(bào)文。
特點(diǎn)是編程比較靈活,同時(shí)駐留有操作系統(tǒng),可以很方便的完成與系統(tǒng)其它模塊的通訊。
2、數(shù)據(jù)轉(zhuǎn)換模塊用于對(duì)檢測(cè)報(bào)文的解析,通過(guò)統(tǒng)一定義的接口分揀出檢測(cè)報(bào)文發(fā)送模塊發(fā)送的檢測(cè)報(bào)文,再通過(guò)硬件接口發(fā)送給底層數(shù)據(jù)通道。該模塊進(jìn)一步分為兩個(gè)轉(zhuǎn)換模塊,轉(zhuǎn)換的作用有所不同,其中,轉(zhuǎn)換模塊1從發(fā)送模塊接收檢測(cè)報(bào)文并分揀出檢測(cè)報(bào)文,轉(zhuǎn)換模塊2從用戶數(shù)據(jù)報(bào)文中分揀出檢測(cè)報(bào)文,并回送給檢測(cè)報(bào)文回收模塊。
特點(diǎn)是數(shù)據(jù)轉(zhuǎn)發(fā)能力強(qiáng),可以進(jìn)行一定的編程。
3、底層數(shù)據(jù)通道用于完成用戶數(shù)據(jù)的處理。
特點(diǎn)是具有高速的數(shù)據(jù)轉(zhuǎn)發(fā)能力,編程不靈活,故障的自診斷,自恢復(fù)能力差,往往是出現(xiàn)問(wèn)題的關(guān)鍵部件。
4、告警模塊負(fù)責(zé)對(duì)故障告警和告警恢復(fù)。
特點(diǎn)只是被動(dòng)的顯示狀態(tài),每個(gè)狀態(tài)都是由它駐留在業(yè)務(wù)代理模塊的消息來(lái)通知的,本身不對(duì)狀態(tài)的真?zhèn)巫髋袛唷?br> 本發(fā)明系統(tǒng)實(shí)時(shí)檢測(cè)數(shù)據(jù)通道的狀態(tài),在通道異常的時(shí)候,發(fā)送告警消息給告警模塊,通道又恢復(fù)正常時(shí),發(fā)告警恢復(fù)消息給告警模塊。
本發(fā)明實(shí)現(xiàn)的具體環(huán)境為檢測(cè)報(bào)文發(fā)送及回收模塊由網(wǎng)絡(luò)處理器的通用CPU中駐留的業(yè)務(wù)代理模塊來(lái)完成;數(shù)據(jù)轉(zhuǎn)換模塊由網(wǎng)絡(luò)處理器中的微引擎來(lái)完成;底層數(shù)據(jù)通道由可編程邏輯器件構(gòu)成;告警模塊由駐留在系統(tǒng)內(nèi)的代理進(jìn)程和數(shù)據(jù)庫(kù)共同完成。
數(shù)據(jù)通道狀態(tài)檢測(cè)及告警具體實(shí)現(xiàn)步驟如下步驟1檢測(cè)報(bào)文發(fā)送模塊構(gòu)造出檢測(cè)報(bào)文發(fā)送給底層數(shù)據(jù)通道,同時(shí)啟動(dòng)超時(shí)定時(shí)器,并初始化不可達(dá)計(jì)數(shù)器,通過(guò)超時(shí)定時(shí)器來(lái)限定檢測(cè)報(bào)文是否按時(shí)到達(dá),通過(guò)不可達(dá)計(jì)數(shù)器來(lái)設(shè)定告警門限。
檢測(cè)報(bào)文發(fā)送的頻率也就是檢測(cè)的力度,需根據(jù)系統(tǒng)流量和用戶的情況作專門的考慮和定義。
步驟2數(shù)據(jù)轉(zhuǎn)換模塊1通過(guò)硬件接口解析出檢測(cè)類型的報(bào)文,送給底層數(shù)據(jù)通道,對(duì)檢測(cè)報(bào)文同一般用戶數(shù)據(jù)報(bào)文一樣處理,這個(gè)通道的其它類型報(bào)文按原來(lái)的方式處理,出現(xiàn)異常時(shí),檢測(cè)報(bào)文會(huì)被丟棄或遲滯。
步驟3數(shù)據(jù)處理完成后轉(zhuǎn)換模塊2再次從用戶數(shù)據(jù)報(bào)文中分揀出檢測(cè)報(bào)文,然后返回給報(bào)文回收模塊,異常情況,檢測(cè)報(bào)文不能夠正常返回。
步驟4檢測(cè)報(bào)文回收模塊的定時(shí)器超時(shí),即有檢測(cè)報(bào)文沒(méi)有在規(guī)定的時(shí)間內(nèi)返回,業(yè)務(wù)代理模塊認(rèn)定底層數(shù)據(jù)通道異常,不可達(dá)計(jì)數(shù)器值加一,當(dāng)不可達(dá)計(jì)數(shù)器值超過(guò)告警門限時(shí)(說(shuō)明檢測(cè)報(bào)文連續(xù)幾次沒(méi)有在規(guī)定的時(shí)間內(nèi)返回),業(yè)務(wù)代理模塊進(jìn)入告警狀態(tài)。如果檢測(cè)報(bào)文在規(guī)定時(shí)間內(nèi)返回,業(yè)務(wù)代理模塊維持初始狀態(tài)。
如果業(yè)務(wù)代理模塊已經(jīng)處于告警狀態(tài),仍然繼續(xù)定時(shí)的發(fā)送檢測(cè)報(bào)文,如果檢測(cè)報(bào)文能夠在規(guī)定的時(shí)間內(nèi)返回,則業(yè)務(wù)代理模塊發(fā)送告警恢復(fù)消息通知告警模塊。
當(dāng)檢測(cè)報(bào)文不能在告警期限內(nèi)到達(dá)時(shí),業(yè)務(wù)代理模塊讀取相應(yīng)的底層通道相關(guān)寄存器的狀態(tài),可以判斷通道的哪個(gè)環(huán)節(jié)出現(xiàn)問(wèn)題,如果底層數(shù)據(jù)通道的硬件異常,則可以通過(guò)寫(xiě)寄存器或復(fù)位的方式,使系統(tǒng)重新正常運(yùn)行。
步驟5業(yè)務(wù)代理模塊處于告警狀態(tài)但沒(méi)有發(fā)送告警消息,則發(fā)送告警消息給告警模塊,如果告警消息已經(jīng)發(fā)送則不再發(fā)送。
以上都是為了使數(shù)據(jù)業(yè)務(wù)不中斷而對(duì)通道狀態(tài)進(jìn)行檢測(cè)的方法,同時(shí)實(shí)現(xiàn)告警和恢復(fù),數(shù)據(jù)業(yè)務(wù)不中斷對(duì)于通訊領(lǐng)域的數(shù)據(jù)業(yè)務(wù)的意義是至關(guān)重要的。
上述步驟涉及檢測(cè)報(bào)文發(fā)送及回收模塊,數(shù)據(jù)轉(zhuǎn)換模塊以及底層數(shù)據(jù)通道等模塊,它們之間的接口,根據(jù)系統(tǒng)的要求做統(tǒng)一的定義,而構(gòu)造的檢測(cè)報(bào)文本身有四個(gè)特點(diǎn)1.根據(jù)接口定義了檢測(cè)報(bào)文的類型,這樣數(shù)據(jù)轉(zhuǎn)換模塊能夠從一般用戶報(bào)文中正確地分揀出檢測(cè)報(bào)文。
2.定義的報(bào)文本身是有效的報(bào)文(所謂有效是指報(bào)文格式與用戶數(shù)據(jù)報(bào)文相同,校驗(yàn)和正確等)。
3.在檢測(cè)報(bào)文的接口里定義的用戶的ID號(hào)是一個(gè)用戶幾乎不能訪問(wèn)的ID號(hào)這樣可以避免影響正常的用戶接入。
4.檢測(cè)報(bào)文接口里定義了一個(gè)序列號(hào),它與檢測(cè)時(shí)間間隔相對(duì)應(yīng),也就是一個(gè)時(shí)間間隔內(nèi)只有收到序列號(hào)與之對(duì)應(yīng)的檢測(cè)報(bào)文,回收模塊才認(rèn)為檢測(cè)報(bào)文正常到達(dá),否則,回收模塊會(huì)將報(bào)文丟棄。這樣可以防止收到的是亂序的報(bào)文或是不同時(shí)間間隔內(nèi)的檢測(cè)報(bào)文,提高了檢測(cè)的準(zhǔn)確性。
如圖2所示,本發(fā)明對(duì)數(shù)據(jù)通道狀態(tài)檢測(cè)的過(guò)程,具體說(shuō)明如下100、檢測(cè)報(bào)文發(fā)送模塊構(gòu)造檢測(cè)報(bào)文發(fā)送給轉(zhuǎn)換模塊1,同時(shí)啟動(dòng)超時(shí)定時(shí)器,定時(shí)器用來(lái)控制檢測(cè)報(bào)文是否按時(shí)到達(dá),同時(shí)清空不可達(dá)計(jì)數(shù)器,這個(gè)計(jì)數(shù)器限定告警門限。
檢測(cè)報(bào)文的特征1、是有效的報(bào)文,所謂有效是指報(bào)文格式與用戶數(shù)據(jù)報(bào)文相同,校驗(yàn)和正確等,例如在CDMA2000網(wǎng)絡(luò)中,是用戶的數(shù)據(jù)報(bào)文,這樣檢測(cè)報(bào)文才能夠在整個(gè)通道內(nèi)和正常的數(shù)據(jù)報(bào)文一樣被處理,這樣的檢測(cè)才是有效的。
2、構(gòu)造的檢測(cè)報(bào)文帶有序列號(hào),檢測(cè)報(bào)文發(fā)送模塊按序列號(hào)發(fā)送檢測(cè)報(bào)文。
101、數(shù)據(jù)轉(zhuǎn)換模塊1解析出檢測(cè)類型的報(bào)文,送給底層數(shù)據(jù)通道。
102、底層數(shù)據(jù)通道對(duì)檢測(cè)報(bào)文同一般用戶報(bào)文按相同的方式處理,通道異常時(shí),檢測(cè)報(bào)文在數(shù)據(jù)通道中會(huì)被丟棄或遲滯。
103、數(shù)據(jù)處理完成后,轉(zhuǎn)換模塊2從用戶數(shù)據(jù)報(bào)文中分揀出檢測(cè)報(bào)文,再回送給回收模塊,通道異常時(shí),檢測(cè)報(bào)文不能正常返回。
104、業(yè)務(wù)代理模塊在定時(shí)器超時(shí)后,將不可達(dá)計(jì)數(shù)器的值加一,如果該值超過(guò)告警門限,則業(yè)務(wù)代理模塊進(jìn)入告警狀態(tài)。
業(yè)務(wù)代理模塊接收到檢測(cè)報(bào)文,會(huì)對(duì)序列號(hào)進(jìn)行校驗(yàn),如果序列號(hào)與所對(duì)應(yīng)的時(shí)間間隔不能對(duì)應(yīng)起來(lái),說(shuō)明,檢測(cè)報(bào)文可能遲后到達(dá)或是出現(xiàn)了亂序的情況,業(yè)務(wù)代理模塊會(huì)將這樣的檢測(cè)報(bào)文丟棄,認(rèn)為數(shù)據(jù)通道出現(xiàn)了異常。如果序列號(hào)校驗(yàn)正確,那么業(yè)務(wù)代理模塊維持初始狀態(tài),不告警。
105、業(yè)務(wù)代理模塊進(jìn)入告警狀態(tài)后,它檢查告警標(biāo)志(00該標(biāo)志用來(lái)表示告警信息是否已經(jīng)發(fā)送),如果沒(méi)有發(fā)告警消息給告警模塊,則發(fā)送告警消息,如果已經(jīng)發(fā)送告警消息,則不再重發(fā),這樣處理可以防止過(guò)多的告警和恢復(fù)消息占用過(guò)多的帶寬資源。
106、業(yè)務(wù)代理模塊已處告警狀態(tài),并且告警消息已經(jīng)發(fā)送,檢測(cè)報(bào)文發(fā)送模塊仍構(gòu)造檢測(cè)報(bào)文,發(fā)送給轉(zhuǎn)換模塊。數(shù)據(jù)通道恢復(fù)正常,檢測(cè)報(bào)文處理完成后按原定接口再返回給回收模塊,收到報(bào)文后,業(yè)務(wù)代理模塊發(fā)告警恢復(fù)消息給告警模塊,如果業(yè)務(wù)代理模塊沒(méi)有處于告警狀態(tài),那么業(yè)務(wù)代理模塊不發(fā)送告警恢復(fù)消息給告警模塊。
發(fā)送的檢測(cè)報(bào)文不同,可分為前向檢測(cè)和反向檢測(cè),告警和告警恢復(fù)的處理方式是相同的,例如,在CDMA2000分組域網(wǎng)絡(luò)中分別構(gòu)造用戶的組幀報(bào)文和解幀報(bào)文。
在步驟100中,構(gòu)造的檢測(cè)報(bào)文不能在告警期限內(nèi)到達(dá)時(shí),處理器讀取相應(yīng)的底層通道的寄存器狀態(tài),可以判斷通道的哪個(gè)環(huán)節(jié)出現(xiàn)了問(wèn)題,以利于進(jìn)一步定位故障,并可以通過(guò)寫(xiě)寄存器和復(fù)位芯片的方式進(jìn)行告警恢復(fù),對(duì)于不能立刻定位的故障,系統(tǒng)還采用單用戶跟蹤的方式或是寫(xiě)日志的方式為進(jìn)一步定位問(wèn)題提供數(shù)據(jù)。
在步驟104中,告警門限值根據(jù)系統(tǒng)流量和檢測(cè)力度等因素設(shè)定。
步驟100至106,涉及檢測(cè)報(bào)文發(fā)送及回收模塊和數(shù)據(jù)轉(zhuǎn)換模塊以及底層數(shù)據(jù)通道之間的接口,在本發(fā)明中,根據(jù)系統(tǒng)的要求作了統(tǒng)一的定義。為了使系統(tǒng)的業(yè)務(wù)不發(fā)生中斷這些接口的定義必須根據(jù)實(shí)際情況,要避免和正常業(yè)務(wù)發(fā)生沖突,底層的通道根據(jù)用戶的ID號(hào)作了區(qū)分,來(lái)處理檢測(cè)報(bào)文,這樣可以避免影響正常的用戶接入。
權(quán)利要求
1.一種對(duì)數(shù)據(jù)通道狀態(tài)進(jìn)行實(shí)時(shí)檢測(cè)的系統(tǒng),包括業(yè)務(wù)代理模塊,告警模塊,底層數(shù)據(jù)通道,其特征在于所述業(yè)務(wù)代理模塊,設(shè)置檢測(cè)報(bào)文發(fā)送模塊及檢測(cè)報(bào)文回收模塊;所述底層數(shù)據(jù)通道,設(shè)置數(shù)據(jù)轉(zhuǎn)換模塊;所述檢測(cè)報(bào)文發(fā)送模塊及檢測(cè)報(bào)文回收模塊,通過(guò)共享內(nèi)存方式和底層數(shù)據(jù)通道建立統(tǒng)一的接口,檢測(cè)報(bào)文發(fā)送模塊構(gòu)造檢測(cè)報(bào)文,檢測(cè)報(bào)文回收模塊回收檢測(cè)報(bào)文;所述數(shù)據(jù)轉(zhuǎn)換模塊,用于檢測(cè)報(bào)文的解析,通過(guò)建立的接口分揀出檢測(cè)報(bào)文,分別發(fā)送給業(yè)務(wù)代理模塊和底層數(shù)據(jù)通道;啟動(dòng)限定檢測(cè)報(bào)文是否按時(shí)到達(dá)的超時(shí)定時(shí)器,并初始化設(shè)定告警門限的不可達(dá)計(jì)數(shù)器。
2.如權(quán)利要求
1所述對(duì)數(shù)據(jù)通道狀態(tài)進(jìn)行實(shí)時(shí)檢測(cè)的系統(tǒng),其特征在于所述數(shù)據(jù)轉(zhuǎn)換模塊進(jìn)一步分為兩個(gè)轉(zhuǎn)換模塊,轉(zhuǎn)換模塊一從發(fā)送模塊接收檢測(cè)報(bào)文并分揀出檢測(cè)報(bào)文,轉(zhuǎn)換模塊二從用戶數(shù)據(jù)報(bào)文中分揀出檢測(cè)報(bào)文來(lái),并回送給檢測(cè)報(bào)文回收模塊。
3.如權(quán)利要求
1或2所述的對(duì)數(shù)據(jù)通道狀態(tài)進(jìn)行實(shí)時(shí)檢測(cè)的系統(tǒng),其特征在于所述檢測(cè)報(bào)文發(fā)送及回收模塊由網(wǎng)絡(luò)處理器的通用CPU中駐留的業(yè)務(wù)代理模塊來(lái)完成;所述數(shù)據(jù)轉(zhuǎn)換模塊由網(wǎng)絡(luò)處理器中的微引擎來(lái)完成;所述底層數(shù)據(jù)通道由可編程邏輯器件構(gòu)成;所述告警模塊由駐留在系統(tǒng)內(nèi)的代理進(jìn)程和數(shù)據(jù)庫(kù)共同完成。
4.一種對(duì)數(shù)據(jù)通道狀態(tài)進(jìn)行實(shí)時(shí)檢測(cè)的方法,其特征在于,包括如下處理步驟步驟一,通過(guò)共享內(nèi)存方式和底層數(shù)據(jù)通道建立統(tǒng)一的接口,檢測(cè)報(bào)文發(fā)送模塊構(gòu)造檢測(cè)報(bào)文,檢測(cè)報(bào)文回收模塊回收檢測(cè)報(bào)文;步驟二,數(shù)據(jù)轉(zhuǎn)換模塊解析檢測(cè)報(bào)文,通過(guò)建立的接口分揀出檢測(cè)報(bào)文,分別發(fā)送給業(yè)務(wù)代理模塊和底層數(shù)據(jù)通道;步驟三,啟動(dòng)限定檢測(cè)報(bào)文是否按時(shí)到達(dá)的超時(shí)定時(shí)器,并初始化設(shè)定告警門限的不可達(dá)計(jì)數(shù)器。
5.如權(quán)利要求
4所述的數(shù)據(jù)通道狀態(tài)進(jìn)行實(shí)時(shí)檢測(cè)的方法,其特征在于,所述步驟一和步驟二進(jìn)一步包括如下處理步驟1檢測(cè)報(bào)文發(fā)送模塊構(gòu)造出檢測(cè)報(bào)文發(fā)送給底層數(shù)據(jù)通道;步驟2數(shù)據(jù)轉(zhuǎn)換模塊通過(guò)建立的接口解析出檢測(cè)報(bào)文的類型,送給底層數(shù)據(jù)通道和一般用戶的數(shù)據(jù)報(bào)文一樣處理,出現(xiàn)異常時(shí),檢測(cè)報(bào)文會(huì)被丟棄或遲滯。;步驟3處理完成后數(shù)據(jù)轉(zhuǎn)換模塊再次從用戶數(shù)據(jù)報(bào)文中分揀出檢測(cè)報(bào)文,然后返回給檢測(cè)報(bào)文回收模塊,出現(xiàn)異常情況時(shí),檢測(cè)報(bào)文不能夠正常返回。
6.如權(quán)利要求
4所述的數(shù)據(jù)通道狀態(tài)進(jìn)行實(shí)時(shí)檢測(cè)的方法,其特征在于所述步驟三中,如果檢測(cè)報(bào)文回收模塊的定時(shí)器超時(shí),不可達(dá)計(jì)數(shù)器值加一,當(dāng)不可達(dá)計(jì)數(shù)器值超過(guò)告警門限時(shí),業(yè)務(wù)代理模塊進(jìn)入告警狀態(tài);如果定時(shí)器不超時(shí),業(yè)務(wù)代理模塊維持初始狀態(tài)。
7.如權(quán)利要求
4所述的對(duì)數(shù)據(jù)通道狀態(tài)進(jìn)行實(shí)時(shí)檢測(cè)方法,其特征在于所述檢測(cè)報(bào)文定義一個(gè)用戶不能訪問(wèn)的ID號(hào),避免影響正常的用戶接入;所述檢測(cè)報(bào)文定義一個(gè)序列號(hào),與檢測(cè)時(shí)間間隔相對(duì)應(yīng),不與時(shí)間間隔內(nèi)對(duì)應(yīng)的序列號(hào)的檢測(cè)報(bào)文被丟棄;所述檢測(cè)報(bào)文發(fā)送的頻率,根據(jù)系統(tǒng)流量和用戶情況確定;對(duì)于前向檢測(cè)和反向檢測(cè),告警和告警恢復(fù)的方式不同,構(gòu)造的檢測(cè)報(bào)文不同。
8.如權(quán)利要求
4所述的對(duì)數(shù)據(jù)通道狀態(tài)進(jìn)行實(shí)時(shí)檢測(cè)方法,其特征在于業(yè)務(wù)代理模塊處于告警狀態(tài)但沒(méi)有發(fā)送告警消息,則發(fā)送告警消息給告警模塊,如果告警消息已經(jīng)發(fā)送則不再發(fā)送。
9.如權(quán)利要求
4所述的對(duì)數(shù)據(jù)通道狀態(tài)進(jìn)行實(shí)時(shí)檢測(cè)方法,其特征在于如果業(yè)務(wù)代理模塊已經(jīng)處于告警狀態(tài),仍然繼續(xù)定時(shí)的發(fā)送檢測(cè)報(bào)文,如果檢測(cè)報(bào)文回收模塊的定時(shí)器不超時(shí),業(yè)務(wù)代理模塊發(fā)送告警恢復(fù)消息通知告警模塊。
10.如權(quán)利要求
4所述的對(duì)數(shù)據(jù)通道狀態(tài)進(jìn)行實(shí)時(shí)檢測(cè)方法,其特征在于如果檢測(cè)報(bào)文回收模塊超時(shí),業(yè)務(wù)代理模塊讀取相應(yīng)底層數(shù)據(jù)通道相關(guān)寄存器的狀態(tài),如果底層數(shù)據(jù)通道的硬件異常,通過(guò)寫(xiě)寄存器或復(fù)位的方式,使系統(tǒng)重新正常運(yùn)行。
專利摘要
本發(fā)明涉及一種對(duì)數(shù)據(jù)通道狀態(tài)進(jìn)行實(shí)時(shí)在線檢測(cè)的系統(tǒng)和方法,所述檢測(cè)報(bào)文發(fā)送及回收模塊,通過(guò)共享內(nèi)存方式和底層數(shù)據(jù)通道建立統(tǒng)一的接口,發(fā)送模塊構(gòu)造檢測(cè)報(bào)文,回收模塊回收檢測(cè)報(bào)文;所述數(shù)據(jù)轉(zhuǎn)換模塊,用于檢測(cè)報(bào)文的解析,通過(guò)建立的接口分揀出檢測(cè)報(bào)文,發(fā)送給底層數(shù)據(jù)通道。當(dāng)通道異常時(shí)實(shí)現(xiàn)實(shí)時(shí)告警,如果通道恢復(fù)正常時(shí),能夠?qū)崿F(xiàn)告警的恢復(fù)。當(dāng)?shù)讓訑?shù)據(jù)通道出現(xiàn)異常時(shí),通過(guò)分析寄存器的狀態(tài)和相應(yīng)統(tǒng)計(jì)數(shù)據(jù),能較準(zhǔn)確的定位出故障的具體原因,并通過(guò)寫(xiě)寄存器的方式進(jìn)行有效的恢復(fù),具有一定的自恢復(fù)能力。
文檔編號(hào)H04L12/26GK1996898SQ200510132659
公開(kāi)日2007年7月11日 申請(qǐng)日期2005年12月28日
發(fā)明者畢鵬飛, 鈕遠(yuǎn), 唐輝 申請(qǐng)人:中興通訊股份有限公司導(dǎo)出引文BiBTeX, EndNote, RefMan