網(wǎng)絡(luò)設(shè)備及用于網(wǎng)絡(luò)設(shè)備的硬件故障診斷方法
【專利摘要】本發(fā)明公開了一種網(wǎng)絡(luò)設(shè)備及用于網(wǎng)絡(luò)設(shè)備的硬件故障診斷方法?;诒景l(fā)明,主板集成主控和轉(zhuǎn)發(fā)功能、并具有CPU和邏輯裝置,其中,主用主板中的邏輯裝置實(shí)時(shí)監(jiān)測(cè)網(wǎng)絡(luò)設(shè)備中各硬件監(jiān)測(cè)點(diǎn)的狀態(tài)、并在監(jiān)測(cè)到位于本板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí)以中斷方式觸發(fā)本板的CPU對(duì)硬件故障的識(shí)別,從而減少本板的CPU的占用率;并且,該邏輯裝置在向本板的CPU上報(bào)中斷時(shí)還會(huì)啟動(dòng)計(jì)時(shí)、并等待從本板的CPU接收響應(yīng),若邏輯裝置由于未接收到響應(yīng)而計(jì)時(shí)超時(shí),則主用主板的邏輯裝置觸發(fā)本板與備用主板之間的主備切換,以在主用主板的CPU由于本板的硬件故障而發(fā)生異常時(shí)替代該CPU將網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)流量及時(shí)切換至備用主板,從而能夠提高網(wǎng)絡(luò)設(shè)備的健壯性。
【專利說明】網(wǎng)絡(luò)設(shè)備及用于網(wǎng)絡(luò)設(shè)備的硬件故障診斷方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)技術(shù),特別涉及一種網(wǎng)絡(luò)設(shè)備、以及一種用于網(wǎng)絡(luò)設(shè)備的硬件故障診斷方法。
【背景技術(shù)】
[0002]網(wǎng)絡(luò)設(shè)備可能出現(xiàn)的故障包括軟件層面的業(yè)務(wù)故障和硬件層面的硬件故障,其中,對(duì)于硬件故障,需要由CPU對(duì)各硬件監(jiān)測(cè)點(diǎn)實(shí)施監(jiān)測(cè),并且,CPU針對(duì)從硬件監(jiān)測(cè)點(diǎn)監(jiān)測(cè)到的硬件故障僅僅會(huì)產(chǎn)生告警,而沒有相應(yīng)的自動(dòng)補(bǔ)救措施。
[0003]可見,現(xiàn)有技術(shù)對(duì)于網(wǎng)絡(luò)設(shè)備的硬件故障的診斷方式會(huì)增加CPU的占用率,并且無法及時(shí)避免由于硬件故障而導(dǎo)致的網(wǎng)絡(luò)設(shè)備轉(zhuǎn)發(fā)能力異常。
【發(fā)明內(nèi)容】
[0004]有鑒于此,本發(fā)明提供了一種網(wǎng)絡(luò)設(shè)備、以及一種用于網(wǎng)絡(luò)設(shè)備的硬件故障診斷方法。
[0005]本發(fā)明提供的一種網(wǎng)絡(luò)設(shè)備,包括
[0006]集成主控和轉(zhuǎn)發(fā)功能的主板、以及提供外部接口的接口板,其中,主板包括主用主板和備用主板,并且,主用主板具有CPU和邏輯裝置;
[0007]主用主板的邏輯裝置實(shí)時(shí)監(jiān)測(cè)網(wǎng)絡(luò)設(shè)備中的各硬件監(jiān)測(cè)點(diǎn)的狀態(tài);
[0008]當(dāng)監(jiān)測(cè)到位于主用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),主用主板的邏輯裝置向本板的CPU上報(bào)第一中斷并啟動(dòng)計(jì)時(shí);
[0009]若主用主板的邏輯裝置在計(jì)時(shí)到達(dá)之前從本板的CPU接收到表示已處理第一中斷的響應(yīng),則主用主板的邏輯裝置停止計(jì)時(shí);
[0010]若主用主板的邏輯裝置計(jì)時(shí)超時(shí),則主用主板的邏輯裝置觸發(fā)本板與備用主板之間的主備切換。
[0011]可選地,當(dāng)主用主板的CPU處理第一中斷時(shí),對(duì)本板的該硬件監(jiān)測(cè)點(diǎn)進(jìn)行診斷測(cè)試;
[0012]若診斷出本板的該硬件監(jiān)測(cè)點(diǎn)導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的CPU觸發(fā)本板與備用主板之間的主備切換。
[0013]可選地,若診斷出本板的該硬件監(jiān)測(cè)點(diǎn)未導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的CPU產(chǎn)生告警。
[0014]可選地,第一中斷為不可屏蔽中斷匪I。
[0015]可選地,當(dāng)監(jiān)測(cè)到位于接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),主用主板的邏輯裝置對(duì)該硬件監(jiān)測(cè)點(diǎn)所在的接口板進(jìn)行診斷測(cè)試;
[0016]若診斷出該接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的邏輯裝置向本板的CPU上報(bào)第二中斷;
[0017]并且,接口板包括主用接口板和備用接口板,主用主板的CPU在識(shí)別出該硬件監(jiān)測(cè)點(diǎn)所在的接口板為主用接口板時(shí),根據(jù)第二中斷觸發(fā)接口板的主備切換。
[0018]可選地,第二中斷為匪I。
[0019]可選地,主用主板的CPU在識(shí)別出該硬件監(jiān)測(cè)點(diǎn)所在的接口板為備用接口板時(shí),根據(jù)第二中斷產(chǎn)生告警;以及,若診斷出該接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常未導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的邏輯裝置向本板的CPU上報(bào)第三中斷,主用主板的CPU根據(jù)第三中斷產(chǎn)生告警。
[0020]可選地,當(dāng)監(jiān)測(cè)到位于備用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),主用主板的邏輯裝置向本板的CPU上報(bào)第四中斷;并且,主用主板的CPU根據(jù)第四中斷產(chǎn)生告警。
[0021 ] 可選地,主用主板的邏輯裝置對(duì)各硬件監(jiān)測(cè)點(diǎn)實(shí)施電壓檢測(cè)。
[0022]可選地,主用主板的邏輯裝置通過對(duì)多個(gè)AD芯片的并行采樣實(shí)施電壓檢測(cè)、并對(duì)每個(gè)AD芯片的多路電壓數(shù)據(jù)實(shí)施輪詢方式的采樣;
[0023]其中,當(dāng)連續(xù)輪詢到任一 AD芯片的任一路電壓數(shù)據(jù)異常時(shí),確定該AD芯片的該路電壓數(shù)據(jù)對(duì)應(yīng)的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常。
[0024]本發(fā)明提供的一種用于網(wǎng)絡(luò)設(shè)備的硬件故障診斷方法,該網(wǎng)絡(luò)設(shè)備包括集成主控和轉(zhuǎn)發(fā)功能的主板、以及提供外部接口的接口板,其中,主板包括主用主板和備用主板,并且,該硬件故障診斷方法在主用主板執(zhí)行的如下步驟:
[0025]實(shí)時(shí)監(jiān)測(cè)網(wǎng)絡(luò)設(shè)備中的各硬件監(jiān)測(cè)點(diǎn)的狀態(tài);
[0026]當(dāng)監(jiān)測(cè)到位于主用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),向本板的CPU上報(bào)第一中斷并啟動(dòng)計(jì)時(shí);
[0027]若在計(jì)時(shí)到達(dá)之前從本板的CPU接收到表示已處理第一中斷的響應(yīng),則停止計(jì)時(shí);
[0028]若計(jì)時(shí)超時(shí),則觸發(fā)本板與備用主板之間的主備切換。
[0029]可選地,當(dāng)主用主板的CPU處理第一中斷時(shí),對(duì)本板的該硬件監(jiān)測(cè)點(diǎn)進(jìn)行診斷測(cè)試;
[0030]若診斷出本板的該硬件監(jiān)測(cè)點(diǎn)導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的CPU觸發(fā)本板與備用主板之間的主備切換。
[0031]可選地,若診斷出本板的該硬件監(jiān)測(cè)點(diǎn)未導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的CPU產(chǎn)生告警。
[0032]可選地,第一中斷為不可屏蔽中斷匪I。
[0033]可選地,該硬件故障診斷方法進(jìn)一步包括在主用主板執(zhí)行的如下步驟:
[0034]當(dāng)監(jiān)測(cè)到位于接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),對(duì)該硬件監(jiān)測(cè)點(diǎn)所在的接口板進(jìn)行診斷測(cè)試;
[0035]若診斷出該接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則向本板的CPU上報(bào)第二中斷;
[0036]并且,接口板包括主用接口板和備用接口板,本板的CPU在識(shí)別出該硬件監(jiān)測(cè)點(diǎn)所在的接口板為主用接口板時(shí),根據(jù)第二中斷觸發(fā)接口板的主備切換。
[0037]可選地,第二中斷為匪I。
[0038]可選地,該硬件故障診斷方法進(jìn)一步包括在主用主板執(zhí)行的如下步驟:
[0039]主用主板的CPU在識(shí)別出該硬件監(jiān)測(cè)點(diǎn)所在的接口板為備用接口板時(shí),根據(jù)第二中斷產(chǎn)生告警;
[0040]以及,若診斷出該接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常未導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的邏輯裝置向本板的CPU上報(bào)第三中斷、以觸發(fā)本板的CPU根據(jù)第三中斷產(chǎn)生告警。
[0041]可選地,該硬件故障診斷方法進(jìn)一步包括在主用主板執(zhí)行的如下步驟:
[0042]當(dāng)監(jiān)測(cè)到位于備用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),主用主板的邏輯裝置向本板的CPU上報(bào)第四中斷、以觸發(fā)本板的CPU根據(jù)第四中斷產(chǎn)生告警。
[0043]可選地,該硬件故障診斷方法對(duì)各硬件監(jiān)測(cè)點(diǎn)實(shí)施電壓檢測(cè)。
[0044]可選地,該硬件故障診斷方法通過對(duì)多個(gè)AD芯片的并行采樣實(shí)施電壓檢測(cè)、并對(duì)每個(gè)AD芯片的多路電壓數(shù)據(jù)實(shí)施輪詢方式的采樣;
[0045]其中,當(dāng)連續(xù)輪詢到任一 AD芯片的任一路電壓數(shù)據(jù)異常時(shí),確定該AD芯片的該路電壓數(shù)據(jù)對(duì)應(yīng)的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常。
[0046]由此可見,基于本發(fā)明,主板集成了主控和轉(zhuǎn)發(fā)功能、并具有CPU和邏輯裝置,其中,主用主板中的邏輯裝置實(shí)時(shí)監(jiān)測(cè)網(wǎng)絡(luò)設(shè)備中的各硬件監(jiān)測(cè)點(diǎn)的狀態(tài)、并在監(jiān)測(cè)到位于本板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí)向本板的CPU上報(bào)第一中斷,因而能夠以中斷方式觸發(fā)本板的CPU對(duì)硬件故障的識(shí)別,從而能夠減少本板的CPU的占用率;并且,主用主板的邏輯裝置在向本板的CPU上報(bào)第一中斷的同時(shí)還會(huì)啟動(dòng)計(jì)時(shí)、并等待從本板的CPU接收表示已處理第一中斷的響應(yīng),若主用主板的邏輯裝置由于未接收到上述響應(yīng)而計(jì)時(shí)超時(shí),則主用主板的邏輯裝置觸發(fā)本板與備用主板之間的主備切換,以在主用主板的CPU由于本板的硬件故障而發(fā)生異常時(shí)替代該CPU將網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)流量及時(shí)切換至備用主板,從而能夠提高網(wǎng)絡(luò)設(shè)備的健壯性。
[0047]進(jìn)一步地,主用主板的CPU在處理第一中斷時(shí)可以通過對(duì)本板狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)進(jìn)行診斷測(cè)試,并在該硬件監(jiān)測(cè)點(diǎn)導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常的診斷結(jié)果時(shí),觸發(fā)本板與備用主板之間的主備切換、以確保網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力得以維持。
[0048]另外,對(duì)于狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)位于接口板的情況,主用主板的邏輯芯片可以通過對(duì)接口板的診斷探測(cè)而對(duì)接口板的硬件故障進(jìn)行預(yù)分類,當(dāng)該接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常屬于導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常的故障類別時(shí),主用主板的邏輯芯片通過向本板的CPU上報(bào)第二中斷能夠使本板的CPU辨別該接口板是否屬于當(dāng)前承擔(dān)轉(zhuǎn)發(fā)流量的主用接口板,若是,則可以由本板的CPU觸發(fā)接口板的主備切換,以確保網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力得以維持。
[0049]另外,對(duì)于主用主板和主用接口板的硬件故障未導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常的情況,以及備用主板和備用接口板發(fā)生硬件故障的情況,都可以由主用主板的CPU通過產(chǎn)生告警而向網(wǎng)管預(yù)警。
【專利附圖】
【附圖說明】
[0050]圖1為本發(fā)明實(shí)施例中的網(wǎng)絡(luò)設(shè)備的示例性結(jié)構(gòu)示意圖;
[0051]圖2為如圖1所示的網(wǎng)絡(luò)設(shè)備中的轉(zhuǎn)發(fā)原理示意圖;
[0052]圖3為如圖1所示的網(wǎng)絡(luò)設(shè)備中的邏輯裝置的優(yōu)選邏輯結(jié)構(gòu)示意圖;
[0053]圖4為如圖1所示的網(wǎng)絡(luò)設(shè)備中的CPU的優(yōu)選軟件架構(gòu)示意圖;
[0054]圖5為本發(fā)明實(shí)施例中用于網(wǎng)絡(luò)設(shè)備的硬件故障診斷方法的示例性流程示意圖;
[0055]圖6為如圖5所示的硬件故障診斷方法的優(yōu)選流程實(shí)例的示意圖;
[0056]圖7為網(wǎng)絡(luò)設(shè)備中的CPU配合如圖6所示流程執(zhí)行的處理流程示意圖。
【具體實(shí)施方式】
[0057]為使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下參照附圖并舉實(shí)施例,對(duì)本發(fā)明進(jìn)一步詳細(xì)說明。
[0058]如圖1所示,本實(shí)施例中的網(wǎng)絡(luò)設(shè)備包括集成主控和轉(zhuǎn)發(fā)功能的主板、以及提供外部接口的接口板,主板包括主用主板和備用主板。
[0059]請(qǐng)?jiān)趨⒁妶D1的同時(shí)結(jié)合圖2,主用主板和備用主板均具有CPU和交換芯片、以支持主控和轉(zhuǎn)發(fā)功能。主用主板和備用主板形成雙轉(zhuǎn)發(fā)架構(gòu),即,出方向的轉(zhuǎn)發(fā)流量由主用主板和備用主板向接口板冗余發(fā)送、并由接口板選擇來自主用主板的轉(zhuǎn)發(fā)流量發(fā)出,入方向的轉(zhuǎn)發(fā)流量由接口板向主用主板和備用主板冗余發(fā)送。并且,接口板也可以包括主用接口板和備用接口板,相應(yīng)地,與主用主板和備用主板之間實(shí)現(xiàn)上述涉及冗余發(fā)送的接口板為主用接口板,而備用接口板則為主用接口板提供冗余備份,即,主用接口板承載網(wǎng)絡(luò)設(shè)備中用于轉(zhuǎn)發(fā)流量的主用鏈路,備用接口板承載網(wǎng)絡(luò)設(shè)備中用于轉(zhuǎn)發(fā)流量的備用鏈路。
[0060]仍參見圖1,在本實(shí)施例的網(wǎng)絡(luò)設(shè)備中,主用主板還具有邏輯裝置、以協(xié)同CPU實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)設(shè)備的硬件故障的診斷??蛇x地,備用主板除了具有支持主控和轉(zhuǎn)發(fā)功能的CPU和交換芯片之外,也可以同樣具有與主用主板相同的邏輯裝置,以便于其在晉升為主用主板之后實(shí)施對(duì)硬件故障的診斷。
[0061]為了實(shí)現(xiàn)對(duì)硬件故障的診斷,首先需要監(jiān)測(cè)到硬件故障。相應(yīng)地,主用主板的邏輯裝置實(shí)時(shí)監(jiān)測(cè)網(wǎng)絡(luò)設(shè)備中的各硬件監(jiān)測(cè)點(diǎn)的狀態(tài)。
[0062]其中,所述的硬件監(jiān)測(cè)點(diǎn)是指硬件電路或硬件元器件的狀態(tài)采集點(diǎn),所述的硬件監(jiān)測(cè)點(diǎn)可以根據(jù)需要而分布在主用主板、備用主板、以及接口板中的任意硬件電路或硬件元器件。而且,各硬件監(jiān)測(cè)點(diǎn)的狀態(tài)可以是例如電壓、電流、時(shí)鐘、或功率等能夠反映硬件狀態(tài)的參數(shù)。
[0063]例如,主用主板、備用主板、以及接口板中作為硬件監(jiān)測(cè)點(diǎn)的硬件電路或硬件元器件都會(huì)匯聚至本板的AD (數(shù)字模擬轉(zhuǎn)換)芯片,相應(yīng)地,主用主板的邏輯裝置通過對(duì)分布在主用主板、備用主板、以及接口板的多個(gè)AD芯片的并行采樣,實(shí)施對(duì)各硬件監(jiān)測(cè)點(diǎn)的電壓監(jiān)測(cè),其中,對(duì)于一個(gè)AD芯片匯聚有多個(gè)硬件監(jiān)測(cè)點(diǎn)的電壓數(shù)據(jù)的情況,主用主板的邏輯裝置可以對(duì)該AD芯片的多路電壓數(shù)據(jù)實(shí)施輪詢方式的采樣。進(jìn)而,為了避免將電壓瞬時(shí)波動(dòng)誤識(shí)別為硬件監(jiān)測(cè)點(diǎn)的電壓狀態(tài)異常,可以在連續(xù)多次輪詢到任一 AD芯片的任一路電壓數(shù)據(jù)異常時(shí),再確定該AD芯片的該路電壓數(shù)據(jù)對(duì)應(yīng)的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常。
[0064]其中,對(duì)于判斷狀態(tài)異常的標(biāo)準(zhǔn),可以由主用主板的CPU在本板初始化時(shí)向本板的邏輯裝置下發(fā)相應(yīng)狀態(tài)的門限值,以供主用主板的邏輯裝置能夠根據(jù)該門限值量化地判斷硬件監(jiān)測(cè)點(diǎn)的狀態(tài)是否發(fā)生異常。
[0065]在如圖1所示的網(wǎng)絡(luò)設(shè)備中,當(dāng)主用主板的邏輯裝置監(jiān)測(cè)到位于主用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),主用主板的邏輯裝置向本板的CPU上報(bào)第一中斷并啟動(dòng)計(jì)時(shí)。其中,主用主板的CPU通過處理第一中斷能夠識(shí)別出本板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常,并可選地進(jìn)行相應(yīng)的診斷處理,并且,主用主板的CPU在開始處理第一中斷時(shí),可以立即向本板的邏輯裝置返回一響應(yīng),以表示該CPU已處理第一中斷。
[0066]相應(yīng)地,若主用主板的邏輯裝置在計(jì)時(shí)到達(dá)之前從本板的CPU接收到表示其已處理第一中斷的響應(yīng),則主用主板的邏輯裝置可以判斷出本板的CPU并未由于本板的硬件故障而發(fā)生異常,因而對(duì)計(jì)時(shí)清零、并停止計(jì)時(shí);
[0067]但若主用主板的邏輯裝置計(jì)時(shí)超時(shí),即,未從本板的CPU接收到表示其已處理第一中斷的響應(yīng),則主用主板的邏輯裝置確定本板的CPU由于本板的硬件故障而發(fā)生異常,因而替代CPU觸發(fā)本板與備用主板之間的主備切換。
[0068]如上可見,由于主用主板中的邏輯裝置能夠?qū)崟r(shí)監(jiān)測(cè)網(wǎng)絡(luò)設(shè)備中的各硬件監(jiān)測(cè)點(diǎn)的狀態(tài)、并在監(jiān)測(cè)到位于本板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí)向本板的CPU上報(bào)第一中斷,因而能夠以中斷方式觸發(fā)本板的CPU對(duì)硬件故障的識(shí)別,從而能夠減少本板的CPU的占用率;
[0069]而且,主用主板的邏輯裝置在向本板的CPU上報(bào)第一中斷的同時(shí)還會(huì)啟動(dòng)計(jì)時(shí)、并等待從本板的CPU接收表示已處理第一中斷的響應(yīng),若主用主板的邏輯裝置由于未接收到上述響應(yīng)而計(jì)時(shí)超時(shí),則主用主板的邏輯裝置能夠觸發(fā)本板與備用主板之間的主備切換,以在主用主板的CPU由于本板的硬件故障而發(fā)生異常時(shí)替代該CPU將網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)流量及時(shí)切換至備用主板,從而能夠提高網(wǎng)絡(luò)設(shè)備的健壯性。
[0070]其中,為了避免CPU由于繁忙而延誤對(duì)第一中斷的處理、并由此導(dǎo)致邏輯裝置發(fā)生誤超時(shí),第一中斷可以選用NMI (Non Maskable Interrupt,不可屏蔽中斷)NMI。
[0071]而且,主用主板的CPU在處理第一中斷時(shí),除了能夠識(shí)別出本板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常之外,還可以進(jìn)一步對(duì)本板發(fā)生狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)進(jìn)行診斷測(cè)試,以判斷本板發(fā)生狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)是否會(huì)導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常。
[0072]例如,假設(shè)主用主板的狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)位于主用主板的主用鏈路端口,SP,主用主板連接主用接口板的端口,則主用主板的CPU可以通過檢測(cè)主用鏈路的物理通道的丟包率來實(shí)現(xiàn)診斷測(cè)試;其中,若物理通道丟包率高于預(yù)定的閾值,即,主用鏈路在主用主板產(chǎn)生失效點(diǎn),則判斷本板的該硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常會(huì)導(dǎo)致網(wǎng)絡(luò)設(shè)備的流量轉(zhuǎn)發(fā)的失效,屬于網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常。
[0073]再例如,假設(shè)主用主板的狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)位于主用主板的備用鏈路端口,即,主用主板連接備用接口板的端口,則主用主板的CPU可以通過鏈路環(huán)回測(cè)試實(shí)現(xiàn)診斷測(cè)試;其中,若鏈路換回測(cè)試失敗,即,備用鏈路在主用主板產(chǎn)生了失效點(diǎn),則判斷本板的該硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常導(dǎo)致網(wǎng)絡(luò)設(shè)備的流量轉(zhuǎn)發(fā)的可靠性降低,屬于網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常。
[0074]對(duì)于其他可能發(fā)生狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn),也可以按照合適的相應(yīng)方式實(shí)施診斷測(cè)試,本文不再--列舉。
[0075]如果主用主板的CPU診斷出本板的狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的CPU確定本板不再適合承擔(dān)網(wǎng)絡(luò)設(shè)備的流量轉(zhuǎn)發(fā),因而觸發(fā)本板與備用主板之間的主備切換,以將本板本板的轉(zhuǎn)發(fā)流量切換至備用主板。
[0076]如果主用主板的CPU診斷出本板的狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)未導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的CPU確定本板仍有能力承擔(dān)網(wǎng)絡(luò)設(shè)備的流量轉(zhuǎn)發(fā)、但存在可能的風(fēng)險(xiǎn),因而向網(wǎng)管產(chǎn)生告警,以實(shí)施對(duì)網(wǎng)絡(luò)設(shè)備轉(zhuǎn)發(fā)能力異常的預(yù)警通告。
[0077]除了位于主用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常的情況,主用主板的邏輯裝置和CPU同樣能夠協(xié)同診斷接口板和備用主板的硬件故障。
[0078]在如圖1所示的網(wǎng)絡(luò)設(shè)備中,當(dāng)主用主板的邏輯裝置監(jiān)測(cè)到位于接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),主用主板的邏輯裝置并不立即向本板的CPU上報(bào)中斷,而是先對(duì)該硬件監(jiān)測(cè)點(diǎn)所在的接口板進(jìn)行診斷測(cè)試,以替代本板的CPU預(yù)判斷接口板的硬件故障是否會(huì)導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常。
[0079]例如,主用主板的邏輯裝置與設(shè)置于接口板的邏輯裝置進(jìn)行數(shù)據(jù)交互,以觸發(fā)接口板的邏輯裝置在接口板進(jìn)行本板監(jiān)測(cè);若通過數(shù)據(jù)交互獲知接口板的檢測(cè)結(jié)果為異常,則診斷該硬件監(jiān)測(cè)點(diǎn)所在的接口板導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常;若通過數(shù)據(jù)交互獲知接口板的檢測(cè)結(jié)果為正常,則診斷該硬件監(jiān)測(cè)點(diǎn)所在的接口板未導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常。其中,對(duì)于在接口板實(shí)現(xiàn)的檢測(cè),可以根據(jù)接口板的實(shí)際元器件類型和布局而采取合適的措施,本文不再一一列舉。
[0080]如果主用主板的邏輯裝置診斷出該接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的邏輯裝置向本板的CPU上報(bào)第二中斷;相應(yīng)地,主用主板的CPU通過處理第二中斷能夠識(shí)別出有接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)發(fā)生異常,但主用主板的CPU需要根據(jù)該硬件監(jiān)測(cè)點(diǎn)所在的接口板是否為主用鏈路所在的主用接口板來決定所要采取的補(bǔ)救措施,即,判斷導(dǎo)致網(wǎng)絡(luò)設(shè)備轉(zhuǎn)發(fā)能力異常的接口板是否為主用接口板。
[0081]當(dāng)主用主板的CPU識(shí)別出該硬件監(jiān)測(cè)點(diǎn)所在的接口板為主用接口板時(shí),根據(jù)第二中斷觸發(fā)接口板的主備切換,即,將轉(zhuǎn)發(fā)流量從導(dǎo)致網(wǎng)絡(luò)設(shè)備轉(zhuǎn)發(fā)能力異常的主用接口板切換到備用接口板。其中,為了能夠針對(duì)接口板所導(dǎo)致的網(wǎng)絡(luò)設(shè)備轉(zhuǎn)發(fā)能力異常而及時(shí)執(zhí)行切換,第二中斷也可以選用匪1。
[0082]而當(dāng)主用主板的CPU識(shí)別出該硬件監(jiān)測(cè)點(diǎn)所在的接口板為備用接口板時(shí),根據(jù)第二中斷產(chǎn)生告警,即,針對(duì)失效的備用接口板進(jìn)行預(yù)警通告。
[0083]如果主用主板的邏輯裝置診斷出該接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常未導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的邏輯裝置向本板的CPU上報(bào)第三中斷;相應(yīng)地,主用主板的CPU通過處理第三中斷能夠識(shí)別出位于接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)發(fā)生異常、但并未導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,因而主用主板的CPU可以不觸發(fā)切換,而是根據(jù)第三中斷產(chǎn)生告警,以提示當(dāng)前承擔(dān)流量轉(zhuǎn)發(fā)的主用鏈路存在失效的風(fēng)險(xiǎn)。
[0084]在如圖1所示的網(wǎng)絡(luò)設(shè)備中,當(dāng)主用主板的邏輯裝置監(jiān)測(cè)到位于備用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),主用主板的邏輯裝置向本板的CPU上報(bào)第四中斷。相應(yīng)地,主用主板的CPU通過處理第四中斷能夠識(shí)別出備用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)發(fā)生異常,由于備用主板的硬件故障并不會(huì)妨礙網(wǎng)絡(luò)設(shè)備的當(dāng)前轉(zhuǎn)發(fā),因而主用主板的CPU可以不觸發(fā)切換,而是根據(jù)第四中斷產(chǎn)生告警,以提示當(dāng)前承擔(dān)流量轉(zhuǎn)發(fā)的備用鏈路失效。
[0085]如圖3所示,上述的邏輯裝置可以包括:
[0086]狀態(tài)采樣器,其通過例如AD芯片等器件連接網(wǎng)絡(luò)設(shè)備中的各硬件監(jiān)測(cè)點(diǎn),并對(duì)網(wǎng)絡(luò)設(shè)備中的各硬件監(jiān)測(cè)點(diǎn)的狀態(tài)進(jìn)行采樣;
[0087]寄存器接口,其通過邏輯訪問總線連接本板的CPU,用于接收本板的CPU寫入的狀態(tài)門限值;
[0088]狀態(tài)監(jiān)測(cè)器,根據(jù)狀態(tài)門限值監(jiān)測(cè)狀態(tài)采樣器得到的各硬件監(jiān)測(cè)點(diǎn)的狀態(tài)是否異常;
[0089]主板故障預(yù)判器,當(dāng)狀態(tài)監(jiān)測(cè)器監(jiān)測(cè)到位于主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),判斷硬件監(jiān)測(cè)點(diǎn)發(fā)生狀態(tài)異常的主板是否為主用主板;若位于主用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常,則觸發(fā)第一中斷發(fā)生器和定時(shí)器;
[0090]第一中斷發(fā)生器,其連接本板(即主用主板)的CPU的中斷管腳,并在被主板故障預(yù)判器觸發(fā)時(shí)向本板的CPU產(chǎn)生第一中斷;
[0091]寄存器接口還用于接收本板的CPU寫入的表示已處理第一中斷的響應(yīng);
[0092]定時(shí)器,在被觸發(fā)時(shí)開始計(jì)時(shí),在寄存器接口寫入響應(yīng)后對(duì)計(jì)時(shí)清零并停止計(jì)時(shí),以及,在計(jì)時(shí)超時(shí)后觸發(fā)主板復(fù)位電路;
[0093]主板復(fù)位電路,其連接本板的CPU的復(fù)位管腳,在被觸發(fā)后將本板CPU的復(fù)位管腳置為有效,以觸發(fā)本板與備用主板之間的主備切換。
[0094]仍參見圖3,上述的邏輯裝置還可以包括:
[0095]接口板故障預(yù)判器,當(dāng)狀態(tài)監(jiān)測(cè)器監(jiān)測(cè)到位于接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),觸發(fā)接口板測(cè)試電路;
[0096]接口板測(cè)試電路,其通過板間互連總線連接接口板,在被觸發(fā)時(shí)對(duì)狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)所在的接口板進(jìn)行診斷測(cè)試,并將對(duì)該接口板的診斷測(cè)試結(jié)果返回給接口板故障預(yù)判器;
[0097]相應(yīng)地,接口板故障預(yù)判器根據(jù)接口板測(cè)試電路返回的診斷測(cè)試結(jié)果,判斷該接口板的狀態(tài)異常的故障監(jiān)測(cè)點(diǎn)是否導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,若是,則觸發(fā)第二中斷發(fā)生器,否則觸發(fā)第三中斷發(fā)生器;
[0098]第二中斷發(fā)生器和第三中斷發(fā)生器均連接本板的CPU的中斷管腳,并分別在被接口板故障預(yù)判器觸發(fā)后向本板的CPU產(chǎn)生第二和第三中斷。
[0099]另外,圖3中示出的主板故障預(yù)判器還可以在判斷出位于備用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),觸發(fā)第四中斷發(fā)生器。并且,第一中斷發(fā)生器連接本板的CPU的中斷管腳,并在被主板故障預(yù)判器觸發(fā)時(shí)向本板的CPU產(chǎn)生第四中斷。
[0100]如圖4所示,對(duì)應(yīng)于邏輯裝置,主用主板的CPU中運(yùn)行軟件架構(gòu)可以包括:
[0101]初始化模塊,在本板初始化時(shí)向本板的邏輯裝置下發(fā)待監(jiān)測(cè)狀態(tài)的門限值;
[0102]第一中斷處理模塊,通過處理第一中斷向本板的邏輯裝置返回響應(yīng),以表示CPU已處理第一中斷;并且,通過處理第一中斷觸發(fā)本板診斷測(cè)試模塊;
[0103]本板診斷測(cè)試模塊,對(duì)本板狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)進(jìn)行例如丟包率分析或環(huán)回測(cè)試等方式的診斷測(cè)試,若根據(jù)診斷測(cè)試的結(jié)果判斷出本板狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則觸發(fā)主板主備倒換模塊,否則觸發(fā)告警通告模塊;
[0104]主板主備倒換模塊,觸發(fā)本板與備用主板之間的主備倒換;
[0105]告警通告模塊,產(chǎn)生告警通告。
[0106]仍參見圖4,主用主板的CPU所運(yùn)行的軟件架構(gòu)中還可以包括:
[0107]第二中斷處理模塊,通過處理第二中斷,判斷導(dǎo)致網(wǎng)絡(luò)設(shè)備轉(zhuǎn)發(fā)能力異常的硬件監(jiān)測(cè)點(diǎn)所在的接口板是否為主用接口板,若是,則觸發(fā)接口板主備倒換模塊,否則觸發(fā)上述的告警通告模塊;
[0108]接口板主備倒換模塊,觸發(fā)主用接口板與備用接口板之間的主備倒換;
[0109]第三中斷處理模塊和第四中斷處理模塊,分別通過處理第三中斷和第四中斷觸發(fā)告警通告模塊。
[0110]以上是對(duì)本實(shí)施例中的網(wǎng)絡(luò)設(shè)備的詳細(xì)說明。除了上述的網(wǎng)絡(luò)設(shè)備之外,本實(shí)施例還提供一種用于該網(wǎng)絡(luò)設(shè)備的硬件故障診斷方法。
[0111]如圖5所示,該硬件故障診斷方法包括在網(wǎng)絡(luò)設(shè)備的主用主板執(zhí)行的如下步驟:
[0112]步驟501,實(shí)時(shí)監(jiān)測(cè)網(wǎng)絡(luò)設(shè)備中的各硬件監(jiān)測(cè)點(diǎn)的狀態(tài);其中,對(duì)于本步驟所實(shí)現(xiàn)的對(duì)各硬件監(jiān)測(cè)點(diǎn)狀態(tài)的方式,可以參照前文網(wǎng)絡(luò)設(shè)備部分的描述,此處不再贅述;
[0113]步驟502,當(dāng)監(jiān)測(cè)到位于主用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),向本板的CPU上報(bào)第一中斷并啟動(dòng)計(jì)時(shí);
[0114]步驟503,判斷在計(jì)時(shí)到達(dá)之前是否從本板的CPU接收到表示已處理第一中斷的響應(yīng);
[0115]步驟504,若在計(jì)時(shí)到達(dá)之前從本板的CPU接收到表示已處理第一中斷的響應(yīng),則停止計(jì)時(shí);
[0116]步驟505,若計(jì)時(shí)超時(shí),則觸發(fā)本板與備用主板之間的主備切換。
[0117]基于上述流程,該硬件故障診斷方法能夠替代主用主板的CPU實(shí)時(shí)監(jiān)測(cè)網(wǎng)絡(luò)設(shè)備中的各硬件監(jiān)測(cè)點(diǎn)的狀態(tài)、并在監(jiān)測(cè)到位于本板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí)向本板的CPU上報(bào)第一中斷,因而能夠以中斷方式觸發(fā)本板的CPU對(duì)硬件故障的識(shí)別,從而能夠減少本板的CPU的占用率;
[0118]而且,該硬件故障診斷方法在向本板的CPU上報(bào)第一中斷的同時(shí)還會(huì)啟動(dòng)計(jì)時(shí)、并等待從本板的CPU接收表示已處理第一中斷的響應(yīng),若由于未接收到上述響應(yīng)而計(jì)時(shí)超時(shí),則觸發(fā)本板與備用主板之間的主備切換,以在主用主板的CPU由于本板的硬件故障而發(fā)生異常時(shí)替代該CPU將網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)流量及時(shí)切換至備用主板,從而能夠提高網(wǎng)絡(luò)設(shè)備的健壯性。
[0119]另外,為了針對(duì)主用主板的硬件監(jiān)測(cè)點(diǎn)發(fā)生的狀態(tài)異常采取相應(yīng)的補(bǔ)救措施,主用主板的CPU在處理第一中斷時(shí)可以對(duì)本板的該硬件監(jiān)測(cè)點(diǎn)進(jìn)行診斷測(cè)試,其中,此處所述的對(duì)主用主板的診斷測(cè)試的方式,可以參照前文網(wǎng)絡(luò)設(shè)備部分的描述;若診斷出本板的該硬件監(jiān)測(cè)點(diǎn)導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的CPU觸發(fā)本板與備用主板之間的主備切換,否則,只需產(chǎn)生告警即可。
[0120]對(duì)于接口板的硬件監(jiān)測(cè)點(diǎn)狀態(tài)異常的情況,本實(shí)施例中的硬件故障診斷方法可以進(jìn)一步包括在主用主板執(zhí)行的如下步驟:
[0121]當(dāng)監(jiān)測(cè)到位于接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),對(duì)該硬件監(jiān)測(cè)點(diǎn)所在的接口板進(jìn)行診斷測(cè)試;其中,此處所述的對(duì)接口板的診斷測(cè)試,可以參照前文網(wǎng)絡(luò)設(shè)備部分的描述;
[0122]若診斷出該接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則向本板的CPU上報(bào)第二中斷;相應(yīng)地,本板的CPU在識(shí)別出該硬件監(jiān)測(cè)點(diǎn)所在的接口板為主用接口板時(shí),根據(jù)第二中斷觸發(fā)接口板的主備切換,但在識(shí)別出該硬件監(jiān)測(cè)點(diǎn)所在的接口板為備用接口板時(shí),只需根據(jù)第二中斷產(chǎn)生告警即可;
[0123]若診斷出該接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常未導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的邏輯裝置向本板的CPU上報(bào)第三中斷、以觸發(fā)本板的CPU根據(jù)第三中斷產(chǎn)生告
m
目O
[0124]對(duì)于備用主板的硬件監(jiān)測(cè)點(diǎn)狀態(tài)異常的情況,本實(shí)施例中的硬件故障診斷方法還可以進(jìn)一步包括在主用主板執(zhí)行的如下步驟:
[0125]當(dāng)監(jiān)測(cè)到位于備用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),主用主板的邏輯裝置向本板的CPU上報(bào)第四中斷、以觸發(fā)本板的CPU根據(jù)第四中斷產(chǎn)生告警。
[0126]如圖6所示,對(duì)于兼顧到主用主板、接口板、以及備用主板的硬件監(jiān)測(cè)點(diǎn)發(fā)生狀態(tài)異常的情況,本實(shí)施例中的硬件故障診斷方法可以優(yōu)選地采用如下流程予以優(yōu)化:
[0127]步驟601,實(shí)時(shí)監(jiān)測(cè)網(wǎng)絡(luò)設(shè)備中的各硬件監(jiān)測(cè)點(diǎn)的狀態(tài);其中,對(duì)于本步驟所實(shí)現(xiàn)的對(duì)各硬件監(jiān)測(cè)點(diǎn)狀態(tài)的方式,可以參照前文網(wǎng)絡(luò)設(shè)備部分的描述,此處不再贅述;
[0128]步驟602,當(dāng)監(jiān)測(cè)到有狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)時(shí),判斷該硬件監(jiān)測(cè)點(diǎn)的位置;
[0129]步驟611,當(dāng)狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)位于主用主板時(shí),向本板的CPU上報(bào)第一中斷并啟動(dòng)計(jì)時(shí);其中,第一中斷為WI;
[0130]步驟612,判斷在計(jì)時(shí)到達(dá)之前是否從本板的CPU接收到表示已處理第一中斷的響應(yīng);
[0131]步驟613,若在計(jì)時(shí)到達(dá)之前從本板的CPU接收到表示已處理第一中斷的響應(yīng),則停止計(jì)時(shí);
[0132]步驟614,若計(jì)時(shí)超時(shí),則觸發(fā)本板與備用主板之間的主備切換;
[0133]步驟621,當(dāng)狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)位于接口板時(shí),對(duì)該硬件監(jiān)測(cè)點(diǎn)所在的接口板進(jìn)行診斷測(cè)試;
[0134]步驟622,若通過對(duì)接口板的診斷測(cè)試判斷出該接口板的狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則向本板的CPU上報(bào)第二中斷;其中,第二中斷為匪I ;
[0135]步驟623,若通過對(duì)接口板的診斷測(cè)試判斷出該接口板的狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)未導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則向本板的CPU上報(bào)第三中斷;
[0136]步驟630,當(dāng)監(jiān)測(cè)到位于備用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),向本板的CPU上報(bào)第四中斷。
[0137]如圖7所示,對(duì)應(yīng)于如圖6所示的流程,主用主板的CPU中可以對(duì)應(yīng)地執(zhí)行如下步驟:
[0138]步驟701,實(shí)時(shí)監(jiān)測(cè)是否存在匪I ;
[0139]步驟702,當(dāng)存在匪I時(shí),識(shí)別該匪I為第一中斷還是第二中斷;
[0140]步驟711,若為表示狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)位于本板的第一中斷,則對(duì)本板的對(duì)應(yīng)硬件監(jiān)測(cè)點(diǎn)進(jìn)行診斷測(cè)試;
[0141]步驟712,若通過診斷測(cè)試判斷出本板的對(duì)應(yīng)硬件監(jiān)測(cè)點(diǎn)導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則觸發(fā)本板與備用主板的主備切換,然后返回步驟701繼續(xù)監(jiān)測(cè)匪I ;
[0142]另外,若通過診斷測(cè)試判斷出本板的對(duì)應(yīng)硬件監(jiān)測(cè)點(diǎn)未導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則通過執(zhí)行步驟704產(chǎn)生告警通告,然后返回步驟701繼續(xù)監(jiān)測(cè)匪I ;
[0143]步驟721,若為表示狀態(tài)異常的硬件監(jiān)測(cè)點(diǎn)位于接口板的第二中斷,則識(shí)別對(duì)應(yīng)的硬件監(jiān)測(cè)點(diǎn)所在的接口板是否為主用接口板;
[0144]步驟722,若對(duì)應(yīng)的硬件監(jiān)測(cè)點(diǎn)所在的接口板為主用接口板,則觸發(fā)該主用接口板與備用接口板之間的主備切換,然后返回步驟701繼續(xù)監(jiān)測(cè)NMI ;
[0145]另外,若對(duì)應(yīng)的硬件監(jiān)測(cè)點(diǎn)所在的接口板為被用接口板,則通過執(zhí)行步驟704產(chǎn)生告警通告,然后返回步驟701繼續(xù)監(jiān)測(cè)匪I ;
[0146]步驟703,當(dāng)不存在上報(bào)的NMI時(shí),判斷是否存在普通中斷,即,是否存在第三或第四中斷,若存在第三或第四中斷,則通過執(zhí)行步驟704產(chǎn)生告警通告。
[0147]另外,若未存在普通中斷,則可以返回步驟701繼續(xù)監(jiān)測(cè)匪I。
[0148]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
【權(quán)利要求】
1.一種網(wǎng)絡(luò)設(shè)備,其特征在于,包括集成主控和轉(zhuǎn)發(fā)功能的主板、以及提供外部接口的接口板,其中,主板包括主用主板和備用主板,并且,主用主板具有CPU和邏輯裝置; 主用主板的邏輯裝置實(shí)時(shí)監(jiān)測(cè)網(wǎng)絡(luò)設(shè)備中的各硬件監(jiān)測(cè)點(diǎn)的狀態(tài); 當(dāng)監(jiān)測(cè)到位于主用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),主用主板的邏輯裝置向本板的CPU上報(bào)第一中斷并啟動(dòng)計(jì)時(shí); 若主用主板的邏輯裝置在計(jì)時(shí)到達(dá)之前從本板的CPU接收到表示已處理第一中斷的響應(yīng),則主用主板的邏輯裝置停止計(jì)時(shí); 若主用主板的邏輯裝置計(jì)時(shí)超時(shí),則主用主板的邏輯裝置觸發(fā)本板與備用主板之間的主備切換。
2.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)設(shè)備,其特征在于,當(dāng)主用主板的CPU處理第一中斷時(shí),對(duì)本板的該硬件監(jiān)測(cè)點(diǎn)進(jìn)行診斷測(cè)試; 若診斷出本板的該硬件監(jiān)測(cè)點(diǎn)導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的CPU觸發(fā)本板與備用主板之間的主備切換。
3.根據(jù)權(quán)利要求2所述的網(wǎng)絡(luò)設(shè)備,其特征在于,若診斷出本板的該硬件監(jiān)測(cè)點(diǎn)未導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的CPU產(chǎn)生告警。
4.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)設(shè)備,其特征在于,第一中斷為不可屏蔽中斷匪I。
5.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)設(shè)備,其特征在于,當(dāng)監(jiān)測(cè)到位于接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),主用主板的邏輯裝置對(duì)該硬件監(jiān)測(cè)點(diǎn)所在的接口板進(jìn)行診斷測(cè)試; 若診斷出該接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的邏輯裝置向本板的CPU上報(bào)第二中斷; 并且,接口板包括主用接口板和備用接口板,主用主板的CPU在識(shí)別出該硬件監(jiān)測(cè)點(diǎn)所在的接口板為主用接口板時(shí),根據(jù)第二中斷觸發(fā)接口板的主備切換。
6.根據(jù)權(quán)利要求5所述的網(wǎng)絡(luò)設(shè)備,其特征在于,第二中斷為匪I。
7.根據(jù)權(quán)利要求5所述的網(wǎng)絡(luò)設(shè)備,其特征在于,主用主板的CPU在識(shí)別出該硬件監(jiān)測(cè)點(diǎn)所在的接口板為備用接口板時(shí),根據(jù)第二中斷產(chǎn)生告警;以及,若診斷出該接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常未導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的邏輯裝置向本板的CPU上報(bào)第三中斷,主用主板的CPU根據(jù)第三中斷產(chǎn)生告警。
8.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)設(shè)備,其特征在于, 當(dāng)監(jiān)測(cè)到位于備用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),主用主板的邏輯裝置向本板的CPU上報(bào)第四中斷;并且,主用主板的CPU根據(jù)第四中斷產(chǎn)生告警。
9.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)設(shè)備,其特征在于,主用主板的邏輯裝置對(duì)各硬件監(jiān)測(cè)點(diǎn)實(shí)施電壓檢測(cè),并且,主用主板的邏輯裝置通過對(duì)多個(gè)AD芯片的并行采樣實(shí)施電壓檢測(cè)、并對(duì)每個(gè)AD芯片的多路電壓數(shù)據(jù)實(shí)施輪詢方式的采樣;其中,當(dāng)連續(xù)輪詢到任一 AD芯片的任一路電壓數(shù)據(jù)異常時(shí),確定該AD芯片的該路電壓數(shù)據(jù)對(duì)應(yīng)的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異堂巾O
10.一種用于網(wǎng)絡(luò)設(shè)備的硬件故障診斷方法,其特征在于,該網(wǎng)絡(luò)設(shè)備包括集成主控和轉(zhuǎn)發(fā)功能的主板、以及提供外部接口的接口板,其中,主板包括主用主板和備用主板,并且,該硬件故障診斷方法在主用主板執(zhí)行的如下步驟: 實(shí)時(shí)監(jiān)測(cè)網(wǎng)絡(luò)設(shè)備中的各硬件監(jiān)測(cè)點(diǎn)的狀態(tài); 當(dāng)監(jiān)測(cè)到位于主用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),向本板的CPU上報(bào)第一中斷并啟動(dòng)計(jì)時(shí); 若在計(jì)時(shí)到達(dá)之前從本板的CPU接收到表示已處理第一中斷的響應(yīng),則停止計(jì)時(shí); 若計(jì)時(shí)超時(shí),則觸發(fā)本板與備用主板之間的主備切換。
11.根據(jù)權(quán)利要求10所述的硬件故障診斷方法,其特征在于,當(dāng)主用主板的CPU處理第一中斷時(shí),對(duì)本板的該硬件監(jiān)測(cè)點(diǎn)進(jìn)行診斷測(cè)試; 若診斷出本板的該硬件監(jiān)測(cè)點(diǎn)導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的CPU觸發(fā)本板與備用主板之間的主備切換。
12.根據(jù)權(quán)利要求11所述的硬件故障診斷方法,其特征在于,若診斷出本板的該硬件監(jiān)測(cè)點(diǎn)未導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的CPU產(chǎn)生告警。
13.根據(jù)權(quán)利要求10所述的硬件故障診斷方法,其特征在于,第一中斷為不可屏蔽中斷匪I。
14.根據(jù)權(quán)利要求10所述的硬件故障診斷方法,其特征在于,該硬件故障診斷方法進(jìn)一步包括在主用主板執(zhí)行的如下步驟: 當(dāng)監(jiān)測(cè)到位于接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),對(duì)該硬件監(jiān)測(cè)點(diǎn)所在的接口板進(jìn)行診斷測(cè)試; 若診斷出該接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則向本板的CPU上報(bào)第二中斷; 并且,接口板包括主用接口板和備用接口板,本板的CPU在識(shí)別出該硬件監(jiān)測(cè)點(diǎn)所在的接口板為主用接口板時(shí),根據(jù)第二中斷觸發(fā)接口板的主備切換。
15.根據(jù)權(quán)利要求14所述的硬件故障診斷方法,其特征在于,第二中斷為匪I。
16.根據(jù)權(quán)利要求14所述的硬件故障診斷方法,其特征在于,該硬件故障診斷方法進(jìn)一步包括在主用主板執(zhí)行的如下步驟: 主用主板的CPU在識(shí)別出該硬件監(jiān)測(cè)點(diǎn)所在的接口板為備用接口板時(shí),根據(jù)第二中斷產(chǎn)生告警; 以及,若診斷出該接口板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常未導(dǎo)致網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力異常,則主用主板的邏輯裝置向本板的CPU上報(bào)第三中斷、以觸發(fā)本板的CPU根據(jù)第三中斷產(chǎn)生生敬口目。
17.根據(jù)權(quán)利要求10所述的硬件故障診斷方法,其特征在于,該硬件故障診斷方法進(jìn)一步包括在主用主板執(zhí)行的如下步驟: 當(dāng)監(jiān)測(cè)到位于備用主板的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常時(shí),主用主板的邏輯裝置向本板的CPU上報(bào)第四中斷、以觸發(fā)本板的CPU根據(jù)第四中斷產(chǎn)生告警。
18.根據(jù)權(quán)利要求10所述的硬件故障診斷方法,其特征在于,該硬件故障診斷方法對(duì)各硬件監(jiān)測(cè)點(diǎn)實(shí)施電壓檢測(cè),并且,該硬件故障診斷方法通過對(duì)多個(gè)AD芯片的并行采樣實(shí)施電壓檢測(cè)、并對(duì)每個(gè)AD芯片的多路電壓數(shù)據(jù)實(shí)施輪詢方式的采樣;其中,當(dāng)連續(xù)輪詢到任一 AD芯片的任一路電壓數(shù)據(jù)異常時(shí),確定該AD芯片的該路電壓數(shù)據(jù)對(duì)應(yīng)的硬件監(jiān)測(cè)點(diǎn)的狀態(tài)異常。
【文檔編號(hào)】H04L12/24GK104283718SQ201410582694
【公開日】2015年1月14日 申請(qǐng)日期:2014年10月27日 優(yōu)先權(quán)日:2014年10月27日
【發(fā)明者】趙志宇 申請(qǐng)人:杭州華三通信技術(shù)有限公司