本發(fā)明屬于機(jī)載網(wǎng)絡(luò)通信技術(shù)領(lǐng)域,涉及一種通信鏈路故障診斷方法。
背景技術(shù):
機(jī)載網(wǎng)絡(luò)通信系統(tǒng)是整個機(jī)載航電系統(tǒng)的關(guān)鍵部件,通信系統(tǒng)故障將導(dǎo)致傳感器反饋數(shù)據(jù)或飛控計(jì)算機(jī)控制指令不能正確可靠傳輸,對飛行器安全及飛行任務(wù)的完成有著至關(guān)重要的影響。為了提高網(wǎng)絡(luò)通信的可靠性,一般采用冗余備份的方法避免單一鏈路存在的可靠性等問題??紤]成本、資源利用率等多方面因素,時間觸發(fā)以太網(wǎng)通信系統(tǒng)一般采用雙余度的交換網(wǎng)結(jié)構(gòu)避免設(shè)備的層層備份。然而,雙余度通信系統(tǒng)一直面臨的一個重要問題是如何有效地進(jìn)行余度表決和故障診斷,即當(dāng)兩個通道存在不一致問題時,如何甄別正確與故障通道。如果處理不當(dāng),雙余度通信系統(tǒng)不僅無法提高系統(tǒng)可靠性,還會導(dǎo)致系統(tǒng)故障和出錯的概率增大,相比于單通道時的網(wǎng)絡(luò)可靠性更差。
技術(shù)實(shí)現(xiàn)要素:
針對上述問題,本發(fā)明的目的在于提供一種簡單實(shí)用、易實(shí)現(xiàn)、可靠性高的故障診斷方法。
基于時間同步狀態(tài)監(jiān)控的時間觸發(fā)以太網(wǎng)故障診斷方法,其特征在于,包含以下步驟:
(1)所述時間觸發(fā)以太網(wǎng)執(zhí)行時間同步算法,完成時間同步過程,形成全局統(tǒng)一的時間基準(zhǔn);
(2)在預(yù)先約定的時刻,所述時間觸發(fā)以太網(wǎng)中所有端節(jié)點(diǎn)和交換機(jī)將其本地時間基準(zhǔn)信息發(fā)送給相鄰的交換機(jī);
(3)所述時間觸發(fā)以太網(wǎng)中所有交換機(jī)對接收到的時間基準(zhǔn)信息進(jìn)行延遲補(bǔ)償和計(jì)算,執(zhí)行時間同步狀態(tài)判定過程,根據(jù)時間偏差大小判定各端口對應(yīng)通信設(shè)備的時間同步狀態(tài)是否正常;
(4)所述時間觸發(fā)以太網(wǎng)中所有交換機(jī)將時間同步狀態(tài)判定結(jié)果封裝至狀態(tài)反饋數(shù)據(jù)幀發(fā)送給各端口對應(yīng)的端節(jié)點(diǎn)或交換機(jī);
(5)所述時間觸發(fā)以太網(wǎng)中所有端節(jié)點(diǎn)和交換機(jī)根據(jù)反饋結(jié)果執(zhí)行通信鏈路運(yùn)行狀態(tài)判定過程,判斷相關(guān)通信鏈路的運(yùn)行狀態(tài)是否正常。
進(jìn)一步的,所述時間基準(zhǔn)信息需在指定的時間窗口內(nèi)到達(dá)其目的交換機(jī),否則視為無效。
進(jìn)一步的,所述時間偏差的計(jì)算依據(jù)是所述時間觸發(fā)以太網(wǎng)通過時間同步過程建立的全局統(tǒng)一的時間基準(zhǔn)。
進(jìn)一步的,所述時間觸發(fā)以太網(wǎng)中所有交換機(jī)對未收到正確時間基準(zhǔn)信息的端口,直接判定其所對應(yīng)通信設(shè)備的時間同步狀態(tài)異常。
進(jìn)一步的,所述狀態(tài)反饋數(shù)據(jù)幀需在指定的時間窗口內(nèi)到達(dá)各端口對應(yīng)的端節(jié)點(diǎn)或交換機(jī),否則視為無效。
進(jìn)一步的,所述時間觸發(fā)以太網(wǎng)中所有端節(jié)點(diǎn)和交換機(jī)對未收到狀態(tài)反饋信息幀或收到異常狀態(tài)反饋的情況,判定相關(guān)通信鏈路的運(yùn)行狀態(tài)異常,僅在收到正常狀態(tài)反饋的情況時,判定相關(guān)通信鏈路的運(yùn)行狀態(tài)為正常。
本發(fā)明在時間信息的傳遞和反饋過程中,可有效驗(yàn)證相鄰?fù)ㄐ殴?jié)點(diǎn)之間物理傳輸鏈路、雙方的數(shù)據(jù)發(fā)送和接收模塊等硬件部分是否正常,以及各通信節(jié)點(diǎn)的時間信息和軟件部分的運(yùn)行狀態(tài),具有簡單實(shí)用、易實(shí)現(xiàn)、可靠性高等優(yōu)點(diǎn)。另外,以時間觸發(fā)以太網(wǎng)建立的全局統(tǒng)一的時間基準(zhǔn)為判定依據(jù),可為雙余度通信系統(tǒng)提供正確的參考信息,用于解決兩個通道狀態(tài)不一致時無法有效判定故障通道的難題。
附圖說明
圖1:本發(fā)明的算法流程圖。
圖2:tte系統(tǒng)示例。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)例對本發(fā)明作進(jìn)一步說明,此處所說明的方案只用來提供對本發(fā)明的進(jìn)一步理解,為
本技術(shù):
的一部分,不構(gòu)成對本發(fā)明方案的限定。
以圖2所示原型系統(tǒng)為例,簡述采用基于時間同步狀態(tài)監(jiān)控的故障診斷方法的實(shí)現(xiàn)過程。圖2中每個節(jié)點(diǎn)有兩個通信通道,分別連接兩個不同的交換機(jī)設(shè)備,構(gòu)成雙余度通信鏈路。本發(fā)明所介紹的故障診斷方法可周期性執(zhí)行,也可由一些條件觸發(fā)執(zhí)行,對于一個具體的診斷過程,其步驟如下:
①時間同步過程:時間觸發(fā)以太網(wǎng)通過一定的時間同步方法,實(shí)現(xiàn)全局網(wǎng)絡(luò)通信節(jié)點(diǎn)之間的時間同步,形成統(tǒng)一的時間基準(zhǔn)。
②發(fā)送時間信息:在預(yù)先約定的時刻,端節(jié)點(diǎn)向其相鄰交換機(jī)發(fā)送自身的本地時間基準(zhǔn)信息,即端節(jié)點(diǎn)n1、n2和n3向交換機(jī)sw1和sw2發(fā)送時間信息,端節(jié)點(diǎn)n4和n5向交換機(jī)sw3和sw4發(fā)送時間信息;相鄰交換機(jī)之間互相交換時間信息,即交換機(jī)sw1和sw2向交換機(jī)sw3和sw4發(fā)送時間信息,同時交換機(jī)sw3和sw4向交換機(jī)sw1和sw2發(fā)送時間信息。交換機(jī)有個指定的接收時間窗口,在接收窗口內(nèi)到達(dá)的時間信息被認(rèn)為是有效信息,可作為后續(xù)條件判定的數(shù)據(jù),在接收時間窗口之外到達(dá)的時間信息均被丟棄。
③時間同步狀態(tài)判定:交換機(jī)根據(jù)各端口接收到的時間信息,對其進(jìn)行傳播延遲補(bǔ)償及校正,消除傳輸延時等因素的影響,然后對各端口校正后的時間基準(zhǔn)進(jìn)行對比,判定各端口對應(yīng)通信設(shè)備的運(yùn)行狀態(tài)是否正常。在指定時間窗口內(nèi),對于未收到時間信息或所收到信息幀無法正確解析的端口,均認(rèn)為對應(yīng)的通信鏈路有故障。對于正確接收的時間信息,利用一定算法對其進(jìn)行狀態(tài)判定。為便于介紹,此處采用簡單的誤差比較法:以交換機(jī)的本地時間基準(zhǔn)為參考,判斷其與相鄰端節(jié)點(diǎn)或交換機(jī)之間的時間偏差,若偏差大于某閾值,則認(rèn)為相關(guān)通信鏈路有問題,若時間偏差在接收范圍內(nèi),則認(rèn)為相關(guān)通信鏈路正常。對于時間同步狀態(tài)判定問題還可采用其他方法和思路以提高性能和可靠性,如:將所有接收到的時間信息放在一起比較,計(jì)算出大部分節(jié)點(diǎn)時間基準(zhǔn)所在的分布區(qū)間,將區(qū)間之外的時間點(diǎn)對應(yīng)的通信鏈路認(rèn)為故障狀態(tài),這樣可消除參考節(jié)點(diǎn)故障時產(chǎn)生的不利影響。
④反饋狀態(tài)判定結(jié)果:交換機(jī)將判定后的狀態(tài)和錯誤類型反饋至各端口對應(yīng)的端節(jié)點(diǎn)或交換機(jī),例如交換機(jī)sw1將其對端節(jié)點(diǎn)n1、n2和n3和相鄰交換機(jī)sw3和sw4的狀態(tài)判定結(jié)果反饋至相應(yīng)端節(jié)點(diǎn)和交換機(jī)。各節(jié)點(diǎn)和交換機(jī)對于反饋信息幀的到達(dá)時間有最遲達(dá)到時間約束,在最遲到達(dá)時間之后收到的反饋信息均丟棄,僅在約定時間點(diǎn)之前到達(dá)的反饋信息可用于后續(xù)故障條件的診斷。
⑤故障條件診斷:各端節(jié)點(diǎn)和交換機(jī)設(shè)備收到狀態(tài)反饋的信息幀后,對相關(guān)通信鏈路的運(yùn)行狀態(tài)進(jìn)行判定和更新。若收到正常的狀態(tài)反饋,則說明數(shù)據(jù)通信的往返鏈路均正常,將其設(shè)為正常狀態(tài),若收到非正常的狀態(tài)反饋和錯誤類型,則進(jìn)行相應(yīng)的處理措施,如:若連續(xù)3次收到錯誤反饋信息幀,則認(rèn)為相應(yīng)通信鏈路故障,啟動故障檢測和隔離措施。
通過上述步驟和方法即可實(shí)現(xiàn)時間觸發(fā)以太網(wǎng)中各通信節(jié)點(diǎn)及鏈路的故障診斷,同時,本發(fā)明還可用于解決雙余度通信系統(tǒng)中無法有效進(jìn)行余度表決的問題。以圖2中節(jié)點(diǎn)n1的兩個通信板卡(通道a和通道b)為例,假設(shè)通道a和通道b收到的數(shù)據(jù)不一致,則無法判定哪個通道出現(xiàn)故障和錯誤。利用上述方法,通道a和通道b分別將自身的時間基準(zhǔn)信息發(fā)送給對應(yīng)的交換機(jī),交換機(jī)以全局統(tǒng)一的時間基準(zhǔn)為參考,根據(jù)時間偏差判定各節(jié)點(diǎn)的運(yùn)行狀態(tài),然后將判定結(jié)果反饋給相應(yīng)的節(jié)點(diǎn)。僅當(dāng)所有通信過程(物理通信鏈路、數(shù)據(jù)收發(fā)模塊、數(shù)據(jù)處理軟件等)均正確時,通道a或通道b才能收到運(yùn)行狀態(tài)正常的反饋信息。因此,兩者之間必然有一個未收到反饋或收到異常狀態(tài)反饋的通道,那么,兩個通道即可根據(jù)各自收到的狀態(tài)反饋信息判斷自身的運(yùn)行狀態(tài),選擇正確的數(shù)據(jù)源。