多跳錯(cuò)誤恢復(fù)的制作方法
【專利摘要】涉及對(duì)使用“墊腳石”交換機(jī)的逐跳分組轉(zhuǎn)發(fā)技術(shù)的使用的方法、裝置和網(wǎng)絡(luò)架構(gòu)。該網(wǎng)絡(luò)架構(gòu)包括使用穿插在非墊腳石交換機(jī)中的墊腳石交換機(jī),非墊腳石交換機(jī)為諸如包括如交換機(jī)、路由器、轉(zhuǎn)發(fā)器等網(wǎng)絡(luò)元件的常規(guī)網(wǎng)絡(luò)交換機(jī)。墊腳石交換機(jī)被配置成以帶有錯(cuò)誤恢復(fù)的逐跳方式將分組作為沿墊腳石交換機(jī)之間的隧穿子路徑的復(fù)用流進(jìn)行路由,這不同于使用任意路徑或沿(一般)較長(zhǎng)的基于流的路徑將分組從源路由至目的地的常規(guī)路由。因此,來(lái)自源端點(diǎn)的分組經(jīng)由連接各對(duì)墊腳石交換機(jī)的多條子路徑路由至目的地端點(diǎn),其中每條子路徑經(jīng)過(guò)一個(gè)或多個(gè)常規(guī)交換機(jī)并且組成逐跳路線中的邏輯跳躍。
【專利說(shuō)明】多跳錯(cuò)誤恢復(fù)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明的領(lǐng)域一般涉及計(jì)算機(jī)聯(lián)網(wǎng),且更具體但不排他地涉及使用帶有錯(cuò)誤恢復(fù)的多跳轉(zhuǎn)發(fā)來(lái)支持增強(qiáng)網(wǎng)絡(luò)性能的網(wǎng)絡(luò)架構(gòu)和網(wǎng)絡(luò)交換機(jī)。
[0002]背景信息
[0003]自從引入微處理器以來(lái),計(jì)算機(jī)系統(tǒng)已變得越來(lái)越快。近似根據(jù)摩爾定律(基于Intel?公司共同創(chuàng)設(shè)者戈登摩爾在1965年預(yù)測(cè)集成電路上晶體管數(shù)目每?jī)赡攴槐兜某霭嫖?,增速已經(jīng)以相當(dāng)均勻的速率急速上升了近三十年。同時(shí),存儲(chǔ)器和非易失性存儲(chǔ)兩者的尺寸已穩(wěn)步增加,從而使得許多當(dāng)今的個(gè)人計(jì)算機(jī)相比僅10-15年以前的超級(jí)計(jì)算機(jī)更加強(qiáng)大。另外,網(wǎng)絡(luò)通信速度同樣也可見巨大增加。
[0004]處理器速度、存儲(chǔ)器、存儲(chǔ)以及網(wǎng)絡(luò)帶寬技術(shù)的增長(zhǎng)造成了對(duì)于具有日益增長(zhǎng)的能力的網(wǎng)絡(luò)的擴(kuò)建和部署。最近,基于云的服務(wù)的引入,如Amazon(例如,亞馬遜彈性計(jì)算云(EC2)以及簡(jiǎn)單存儲(chǔ)服務(wù)(S3))和微軟(例如,Azure和0ffice365)所提供的那些服務(wù),已經(jīng)造成了對(duì)于公共網(wǎng)絡(luò)基礎(chǔ)設(shè)施的附加網(wǎng)絡(luò)擴(kuò)建,并造成了對(duì)大容量數(shù)據(jù)中心的增加部署以支持使用私有網(wǎng)絡(luò)基礎(chǔ)設(shè)施的這些服務(wù)。另外,在不久的將來(lái),新一代(即,4G)移動(dòng)網(wǎng)絡(luò)數(shù)據(jù)服務(wù)預(yù)計(jì)會(huì)顯著地影響陸線網(wǎng)絡(luò)的利用。這些以及其他考慮的結(jié)果是在可預(yù)見的將來(lái),計(jì)算機(jī)網(wǎng)絡(luò)的利用預(yù)期會(huì)繼續(xù)高速增長(zhǎng)。
[0005]圖1描繪了采用經(jīng)由鏈路104通信地耦合至彼此的標(biāo)記為1-36的多個(gè)交換機(jī)102的常規(guī)計(jì)算機(jī)網(wǎng)絡(luò)架構(gòu)100。源計(jì)算機(jī)106經(jīng)由因特網(wǎng)服務(wù)提供商(ISP)網(wǎng)絡(luò)108耦合至交換機(jī)14。在網(wǎng)絡(luò)另一側(cè),包括電子郵件服務(wù)器的目的地計(jì)算機(jī)110經(jīng)由電子郵件服務(wù)提供商(ESP)網(wǎng)絡(luò)112連接至交換機(jī)20。
[0006]每個(gè)交換機(jī)1-35包括路由表或轉(zhuǎn)發(fā)表,其用于基于各種準(zhǔn)則將分組路由/轉(zhuǎn)發(fā)至下一跳,該準(zhǔn)則通常包括目的地地址。在諸如網(wǎng)際協(xié)議(IP)等各種路由協(xié)議下,數(shù)據(jù)被劃分成多個(gè)分組,這些分組沿諸如源計(jì)算機(jī)106和目的地計(jì)算機(jī)110所描繪的源端點(diǎn)與目的地端點(diǎn)之間的路徑路由。一般而言,給定分組經(jīng)過(guò)的分組可以在一定程度上是任意的,這是為何因特網(wǎng)如此穩(wěn)健的部分原因。由于端點(diǎn)之間的分組可沿不同路徑行進(jìn),因此當(dāng)網(wǎng)絡(luò)交換機(jī)停機(jī)或離線時(shí),其他交換機(jī)的路由表被更新以沿不包括該交換機(jī)的路徑路由分組。
[0007]圖1進(jìn)一步示出包括交換機(jī)14、15、22、23、16、17、18和19之間的跳躍的示例性路由路徑。當(dāng)然,后續(xù)分組可沿不同路線路由,取決于正在源計(jì)算機(jī)106與目的地計(jì)算機(jī)110之間傳送的話務(wù)的分類、以及實(shí)時(shí)網(wǎng)絡(luò)工作條件和由各個(gè)網(wǎng)絡(luò)交換機(jī)處置的話務(wù)。
[0008]在計(jì)算機(jī)網(wǎng)絡(luò)中,分組可能由于各種原因而丟失,這些原因包括比特錯(cuò)誤、擁塞、或交換機(jī)故障。當(dāng)分組在源與其目的地之間的路徑上丟失時(shí),其通常需要從源重傳。這具有兩個(gè)問(wèn)題。首先,由于從源到目的地的路徑相當(dāng)長(zhǎng),源要花費(fèi)長(zhǎng)時(shí)間來(lái)發(fā)現(xiàn)分組已丟失。第二,該分組在丟棄之前所作的進(jìn)展浪費(fèi)了帶寬。
[0009]在具有許多比特錯(cuò)誤的有損耗鏈路上,有時(shí)完成逐跳可靠性。這意味著當(dāng)?shù)谝唤粨Q機(jī)SI正向鄰交換機(jī)S2轉(zhuǎn)發(fā)時(shí),SI和S2運(yùn)行可靠協(xié)議,其中SI保持每個(gè)分組直至其被S2確認(rèn)為被成功接收而無(wú)錯(cuò)誤,重傳丟失或丟棄的分組。此類協(xié)議的示例是高級(jí)數(shù)據(jù)鏈路控制(HDLC)或數(shù)字?jǐn)?shù)據(jù)通信消息協(xié)議(DDCMP)。這要求更復(fù)雜和昂貴的交換機(jī),因?yàn)槠湟蟾嗑彌_器供SI保持分組直至接收到來(lái)自S2的確認(rèn)。
[0010]避免由于鏈路上的比特錯(cuò)誤而引起的分組丟失的另一辦法是使用糾錯(cuò)碼,從而倘若沒(méi)有過(guò)多比特錯(cuò)誤則分組可被重構(gòu)。這在額外校驗(yàn)和比特與計(jì)算兩方面具有很多開銷,并且仍有可能存在比糾錯(cuò)碼能處置的更多的錯(cuò)誤。
[0011]網(wǎng)絡(luò)擁塞目前以兩種方式之一來(lái)解決:丟棄分組或在傳入端口上實(shí)現(xiàn)回壓(通常在每服務(wù)類的基礎(chǔ)上)。如前所述,丟棄分組的問(wèn)題在于已朝著目的地行進(jìn)了數(shù)跳的分組必須再次從源重傳,從而帶寬量被浪費(fèi)了。另外,源發(fā)現(xiàn)分組已丟棄的端到端延遲可能較長(zhǎng),這是因?yàn)樾枰獜哪康牡貍鬟_(dá)關(guān)于分組是否已被接收的信息。結(jié)果,源在重發(fā)分組之前將通常采用超時(shí),如果在超時(shí)期滿之前沒(méi)有接收到ACK則重發(fā)分組。
[0012]進(jìn)行傳統(tǒng)方式的回壓(例如,Infiniband或數(shù)據(jù)中心橋接)的問(wèn)題在于擁塞會(huì)延伸;單個(gè)較慢資源(例如,目的地)可使其分組占用交換機(jī)中的所有緩沖器,并且由于交換機(jī)不被允許丟棄那些分組,該交換機(jī)必須拒絕接收(該類的)任何更多分組,即使那些新分組可能并不是朝向擁塞資源行進(jìn)。這進(jìn)而可導(dǎo)致毗鄰交換機(jī)中的緩沖器變滿,等等。
[0013]附圖簡(jiǎn)述
[0014]通過(guò)參考與附圖一起進(jìn)行的下面的詳細(xì)描述,本發(fā)明的前述的方面和許多伴隨的優(yōu)點(diǎn),將變得更加輕松地被理解,其中,在各個(gè)視圖中,相同參考編號(hào)表示相同部件,除非另作說(shuō)明:
[0015]圖1是示出其中多個(gè)交換機(jī)經(jīng)由各種鏈路互連的常規(guī)計(jì)算機(jī)網(wǎng)絡(luò)的網(wǎng)絡(luò)示圖;
[0016]圖2是示出采用穿插在常規(guī)網(wǎng)絡(luò)交換機(jī)元件中的多個(gè)墊腳石(st印ping stone)交換機(jī)的計(jì)算機(jī)網(wǎng)絡(luò)的網(wǎng)絡(luò)示圖;
[0017]圖2a是示出圖2的網(wǎng)絡(luò)示圖僅描繪有墊腳石交換機(jī)、連同各對(duì)墊腳石交換機(jī)之間連接的隧穿虛擬鏈路時(shí)的視圖的網(wǎng)絡(luò)示圖;
[0018]圖2b是示出包括兩個(gè)分層級(jí)別的網(wǎng)絡(luò)架構(gòu)的視圖的網(wǎng)絡(luò)示圖,其示出圖2a的網(wǎng)絡(luò)不圖重置在圖2的網(wǎng)絡(luò)不圖上;
[0019]圖3示出常規(guī)計(jì)算機(jī)網(wǎng)絡(luò)中在源和目的地計(jì)算機(jī)之間的一對(duì)路由路徑;
[0020]圖4示出源和目的地計(jì)算機(jī)之間采用墊腳石交換機(jī)的逐跳路由路徑;
[0021]圖5a示出源和目的地計(jì)算機(jī)之間包括各對(duì)墊腳石交換機(jī)之間的兩條隧穿子路徑的路由路徑;
[0022]圖5b_5d示出在經(jīng)由圖5a的路由路徑中的交換機(jī)轉(zhuǎn)發(fā)分組時(shí)的分組格式和報(bào)頭配置;
[0023]圖6是示出根據(jù)一個(gè)實(shí)施例的在經(jīng)由逐跳技術(shù)轉(zhuǎn)發(fā)分組時(shí)由墊腳石交換機(jī)和常規(guī)交換機(jī)執(zhí)行的操作和邏輯的流程圖;
[0024]圖7a是示出在一對(duì)墊腳石交換機(jī)之間的隧穿子路徑上復(fù)用分組流的示圖;
[0025]圖7b示出與圖7a中的墊腳石交換機(jī)相對(duì)應(yīng)的分組流以及相關(guān)聯(lián)的源和目的地緩沖器;
[0026]圖7c描繪圖7a的墊腳石交換機(jī)之間的隧穿子路徑;
[0027]圖8示出根據(jù)一個(gè)實(shí)施例的墊腳石隧道報(bào)頭;
[0028]圖8a示出根據(jù)一個(gè)實(shí)施例的用于分組拒絕的墊腳石隧道報(bào)頭;
[0029]圖9示出包括多個(gè)被配置為墊腳石交換機(jī)裝置的交換線路卡的示例性交換機(jī);以及
[0030]圖10示出被配置為墊腳石交換機(jī)裝置的示例性交換線路卡。
[0031]詳細(xì)描述
[0032]本文描述了使用帶有錯(cuò)誤恢復(fù)的逐跳轉(zhuǎn)發(fā)來(lái)增強(qiáng)網(wǎng)絡(luò)性能的方法和裝置的實(shí)施例。在以下描述中,闡述了許多具體細(xì)節(jié)以提供對(duì)本發(fā)明的實(shí)施例的透徹理解。然而,相關(guān)領(lǐng)域內(nèi)技術(shù)人員將理解本發(fā)明可省去一個(gè)或多個(gè)特定細(xì)節(jié)而實(shí)現(xiàn),或通過(guò)其它方法、組件、材料等實(shí)現(xiàn)。在其它例子中,公知的結(jié)構(gòu)、材料或操作不被示出或詳細(xì)說(shuō)明以避免對(duì)本發(fā)明某些方面產(chǎn)生混淆。
[0033]說(shuō)明書中對(duì)〃 一個(gè)實(shí)施例"、〃實(shí)施例〃的引用意味著結(jié)合該實(shí)施例所描述的特定特征、結(jié)構(gòu)或特性被包括在本發(fā)明的至少一個(gè)實(shí)施例中。如此,在整個(gè)說(shuō)明書中的不同位置出現(xiàn)短語(yǔ)“在一個(gè)實(shí)施例中”或“在實(shí)施例中”不一定都是指同一個(gè)實(shí)施例。此外,在一個(gè)或多個(gè)實(shí)施例中,特定特征、結(jié)構(gòu)或特性可以以任何合適的方式組合起來(lái)。
[0034]根據(jù)本文所公開的實(shí)施例的一方面,經(jīng)由使用穿插在常規(guī)網(wǎng)絡(luò)交換機(jī)中的“墊腳石”交換機(jī)來(lái)促進(jìn)增強(qiáng)的網(wǎng)絡(luò)性能。墊腳石交換機(jī)被配置成以逐跳方式將分組作為墊腳石交換機(jī)之間的流進(jìn)行轉(zhuǎn)發(fā),這不同于使用任意路徑或沿(一般)較長(zhǎng)的基于流的路徑將分組從源路由至目的地的常規(guī)轉(zhuǎn)發(fā)。(如本文在該詳細(xì)描述中所使用的,沒(méi)有大寫的“hop (跳躍/跳)”對(duì)應(yīng)于該術(shù)語(yǔ)的常規(guī)網(wǎng)絡(luò)使用,而有大寫的“Hop”對(duì)應(yīng)于墊腳石交換機(jī)之間邏輯跳躍)。因此,來(lái)自源端點(diǎn)的分組經(jīng)由多個(gè)墊腳石交換機(jī)路由至目的地端點(diǎn),其中各對(duì)墊腳石之間的流通常經(jīng)過(guò)一個(gè)或多個(gè)常規(guī)交換機(jī)并且構(gòu)成Hop。
[0035]基本概念是具有配置有用于某個(gè)數(shù)目的流的充分資源的一些交換機(jī)(即,墊腳石),從而它們可保持分組并且如果需要?jiǎng)t重傳它們,直至它們被下一個(gè)墊腳石確認(rèn)。并非所有流都需要利用墊腳石服務(wù),并且不使用墊腳石服務(wù)的那些流可根據(jù)傳統(tǒng)聯(lián)網(wǎng)來(lái)處置,即要么通過(guò)盡力型(例如,如果需要?jiǎng)t丟棄,并且如果要求可靠性,則從源或逐跳地重傳)要么通過(guò)連同相同類中的其他流進(jìn)行回壓。
[0036]在一些實(shí)施例中,墊腳石交換機(jī)的配置類似于常規(guī)交換機(jī),除了墊腳石交換機(jī)具有顯著更多的緩沖器資源(以及用于創(chuàng)建和復(fù)用分組流、創(chuàng)建子路徑Hop、以及擴(kuò)充轉(zhuǎn)發(fā)表的附加邏輯,如以下詳述的)。由于采用墊腳石之間的流以使得一對(duì)墊腳石交換機(jī)之間的給定流的分組經(jīng)由包括一個(gè)或多個(gè)中間常規(guī)交換機(jī)的子路徑來(lái)路由,因此這些中間交換機(jī)可用較少緩沖器資源來(lái)實(shí)現(xiàn)。例如,在一些實(shí)施例中,經(jīng)由給定中間交換機(jī)路由的大多數(shù)或所有話務(wù)(從該交換機(jī)的觀點(diǎn)而言)看上去是在兩個(gè)墊腳石之間(即,墊腳石看上去是源和目的地端點(diǎn))。因此,沿流路線的一個(gè)或多個(gè)常規(guī)交換機(jī)必須維持的緩沖器數(shù)目減少(相比于常規(guī)網(wǎng)絡(luò)架構(gòu)),從而減少了丟棄分組的發(fā)生以及在中間交換機(jī)采用回壓的需要。
[0037]圖2示出網(wǎng)絡(luò)200,其示出采用經(jīng)由多條鏈路206通信地鏈接的網(wǎng)絡(luò)交換機(jī)202 (標(biāo)記為1-28)和墊腳石交換機(jī)204 (標(biāo)記為1_5,黑底上的白色數(shù)字)的混合的示例性網(wǎng)絡(luò)架構(gòu)。一般而言,每個(gè)交換機(jī)202可包括常規(guī)網(wǎng)絡(luò)元件,諸如配置成執(zhí)行與圖1的交換機(jī)102所執(zhí)行的類似的常規(guī)路由/轉(zhuǎn)發(fā)操作的交換機(jī)或路由器。除了支持常規(guī)路由/轉(zhuǎn)發(fā)操作以外,每個(gè)墊腳石交換機(jī)204被配置成支持附加路由/轉(zhuǎn)發(fā)操作并且包括附加緩沖器資源(相對(duì)于交換機(jī)202而言)。
[0038]根據(jù)一方面,網(wǎng)絡(luò)200包括具有兩個(gè)分層級(jí)別的網(wǎng)絡(luò),一個(gè)分層級(jí)別由交換機(jī)202和墊腳石交換機(jī)204占用,而另一個(gè)分層級(jí)別僅由墊腳石交換機(jī)204占用。例如,圖2a示出由墊腳石交換機(jī)204占用的較高分層級(jí)別,墊腳石交換機(jī)204經(jīng)由隧穿虛擬鏈路208彼此連接。同時(shí),圖2b示出包括圖2a的墊腳石交換機(jī)204和隧穿虛擬鏈路208重疊在圖2中所示的網(wǎng)絡(luò)200配置之上的分層級(jí)別,注意,墊腳石交換機(jī)可既用作常規(guī)交換機(jī)又用作墊腳石交換機(jī),并且因此墊腳石交換機(jī)占用兩個(gè)分層級(jí)別。
[0039]圖3和4分別示出使用常規(guī)網(wǎng)絡(luò)和采用墊腳石交換機(jī)辦法的網(wǎng)絡(luò)從源端點(diǎn)向目的地端點(diǎn)路由分組的比較。圖3的網(wǎng)絡(luò)IlOa和圖4的網(wǎng)絡(luò)200的所示網(wǎng)絡(luò)部分具有類似交換機(jī)和鏈路配置(不考慮墊腳石方面);在網(wǎng)絡(luò)200下,圖3的常規(guī)交換機(jī)29、30和31分別由墊腳石交換機(jī)SS3、SS4和SS5取代。對(duì)于每個(gè)網(wǎng)絡(luò),分組從源計(jì)算機(jī)S發(fā)送給目的地計(jì)算機(jī)D。(為簡(jiǎn)化起見,源計(jì)算機(jī)S與交換機(jī)29之間以及交換機(jī)19與目的地計(jì)算機(jī)D之間的任何網(wǎng)絡(luò)基礎(chǔ)設(shè)施未示出。)
[0040]假定網(wǎng)絡(luò)IlOa是IP網(wǎng)絡(luò)且實(shí)現(xiàn)TCP(傳輸控制協(xié)議)確認(rèn)分組遞送,在圖3中所示的常規(guī)辦法下,第一分組使用TCP/IP協(xié)議沿包括交換機(jī)29、14、15、16、17、18和19的路徑發(fā)送。如圖所示,交換機(jī)18和19之間的跳躍具有X,指示分組已丟棄或丟失。在TCP/IP下,每個(gè)分組的成功傳輸通過(guò)從目的地向源返回確認(rèn)消息(即ACK分組)來(lái)確認(rèn)。如果在預(yù)定超時(shí)時(shí)段內(nèi)沒(méi)有接收到給定分組的ACK消息,則源計(jì)算機(jī)的網(wǎng)絡(luò)接口和/或網(wǎng)絡(luò)軟件假定該分組已丟棄,并且重傳該分組。重傳的分組可能沿與丟失的分組相同的路徑行進(jìn),或者其可能在不同路徑上行進(jìn)。圖3示出了使用不同路徑的示例,其中丟棄分組的副本沿包括交換機(jī)19、22、30、20、31、28和19的第二路徑(以虛線示出)重發(fā),隨之該第二分組被轉(zhuǎn)發(fā)給目的地計(jì)算機(jī)D。
[0041]作為比較,網(wǎng)絡(luò)架構(gòu)200下在源計(jì)算機(jī)S與目的地計(jì)算機(jī)D之間的分組路由采用墊腳石辦法。更詳細(xì)而言,源計(jì)算機(jī)S與目的地計(jì)算機(jī)D之間的路由路徑包括分別位于墊腳石SS3與SS4之間、以及墊腳石SS4與SS5之間的兩條子路徑400和402。子路徑400包括從墊腳石SS3至交換機(jī)19、隨后至交換機(jī)22、并且至墊腳石SS4的路由路徑。子路徑402包括從墊腳石SS4至交換機(jī)20、隨后至墊腳石SS5的路由路徑。每條子路徑400和402還包括墊腳石端點(diǎn)之間的虛擬隧道。一旦分組抵達(dá)墊腳石SS5,則其沿下一跳轉(zhuǎn)發(fā)至交換機(jī)19,交換機(jī)19隨后將該分組轉(zhuǎn)發(fā)至目的地計(jì)算機(jī)D。
[0042]詳述墊腳石服務(wù)的各個(gè)方面的示例在圖5a、5b和5c中描繪,且由網(wǎng)絡(luò)交換機(jī)實(shí)現(xiàn)的相應(yīng)操作和邏輯在圖6的流程圖600中示出。如圖5a中所示,源計(jì)算機(jī)S與目的地計(jì)算機(jī)D之間的路由路徑500包括耦合在源計(jì)算機(jī)S和交換機(jī)1、交換機(jī)2、墊腳石SS1、交換機(jī)
3、交換機(jī)4、墊腳石SS2、交換機(jī)5、墊腳石SS3、交換機(jī)6、和目的地計(jì)算機(jī)D之間的鏈路。
[0043]參照?qǐng)D5B和流程圖600,傳輸過(guò)程始于從源計(jì)算機(jī)S向交換機(jī)I傳送分組502。如框602中所描繪的,將分組從前一跳或起始點(diǎn)(在此情形中為源計(jì)算機(jī)S,其作為源端點(diǎn)操作)轉(zhuǎn)發(fā)至下一跳(交換機(jī)I)。如分組細(xì)節(jié)中所示,分組502的原始配置包括原始網(wǎng)絡(luò)轉(zhuǎn)發(fā)協(xié)議報(bào)頭504繼之以分組有效載荷506,報(bào)頭504包括原始源地址(即,源計(jì)算機(jī)S的地址)和原始目的地地址(即,目的地計(jì)算機(jī)D的地址)。將理解,該示例中所示的分組格式被一般化以應(yīng)用于多種類型的網(wǎng)絡(luò)協(xié)議,并且實(shí)際分組的配置將遵循用于給定網(wǎng)絡(luò)所采用的任何適用協(xié)議的格式化。作為示例而非限定,原始協(xié)議報(bào)頭可包括IP報(bào)頭、以太網(wǎng)報(bào)頭、Infiniband報(bào)頭等。另外,盡管僅示出單個(gè)報(bào)頭,但原始網(wǎng)絡(luò)協(xié)議報(bào)頭504可包括多個(gè)協(xié)議報(bào)頭(例如,TCP報(bào)頭和IP報(bào)頭)。此外,未示出較低級(jí)報(bào)頭,諸如MAC(媒體接入信道)報(bào)頭,但是應(yīng)注意,聯(lián)網(wǎng)領(lǐng)域的技術(shù)人員將理解此類報(bào)頭的使用。
[0044]在判決框604中,確定當(dāng)前交換機(jī)(交換機(jī)I)是否為墊腳石交換機(jī)。(根據(jù)該示例,該網(wǎng)絡(luò)中的交換機(jī)可以是常規(guī)(即,非墊腳石)交換機(jī)或墊腳石交換機(jī))。由于交換機(jī)I是常規(guī)交換機(jī),因此對(duì)判決框604的回答為“否”,并且流程圖前進(jìn)至框606,其中執(zhí)行常規(guī)轉(zhuǎn)發(fā)操作。如眾所周知的,此舉包括使用適用的查找值(諸如分組分類結(jié)果,例如使用目的地地址過(guò)濾器或?qū)P報(bào)頭的5元組散列)在該交換機(jī)的轉(zhuǎn)發(fā)表中執(zhí)行查找以標(biāo)識(shí)用于沿將到達(dá)目的地地址所標(biāo)識(shí)的端點(diǎn)的路線將該分組轉(zhuǎn)發(fā)給下一跳的端口。另外,如果交換機(jī)I是邊緣交換機(jī),則其可進(jìn)一步配置成對(duì)分組502進(jìn)行分類(未示出分類操作),以使得其被分類到采用墊腳石服務(wù)的話務(wù)類。在一些實(shí)施例中,邊緣交換機(jī)的轉(zhuǎn)發(fā)表包括偏好采用墊腳石服務(wù)的路線的轉(zhuǎn)發(fā)規(guī)則和/或過(guò)濾器。在其他實(shí)施例中,邊緣交換機(jī)可以不知曉墊腳石服務(wù)的存在。
[0045]更詳細(xì)而言,在所示實(shí)施例中,網(wǎng)絡(luò)是所管理網(wǎng)絡(luò),其被配置成通過(guò)對(duì)適用話務(wù)類使用墊腳石交換機(jī)來(lái)促進(jìn)對(duì)所管理流的使用。在此示例中,假定分組502屬于所管理話務(wù)類,并且由交換機(jī)I執(zhí)行的轉(zhuǎn)發(fā)表查找標(biāo)識(shí)出優(yōu)選墊腳石路線可經(jīng)由交換機(jī)2到達(dá)。因此,分組602從經(jīng)由鏈路耦合到交換機(jī)2的交換機(jī)I中的端口轉(zhuǎn)發(fā)出去,并且流程圖邏輯返回框602,導(dǎo)致分組502被轉(zhuǎn)發(fā)給交換機(jī)2。取決于適用的協(xié)議,交換機(jī)I可以或者可以不對(duì)原始分組報(bào)頭504作出一些改變(諸如遞減IP分組的存活時(shí)間(TTL)倒計(jì)數(shù));然而,原始源和目的地地址將保持不變。
[0046]繼續(xù)到分組502抵達(dá)交換機(jī)2,流程圖邏輯再次流經(jīng)判決框604和框606,導(dǎo)致分組502從交換機(jī)2轉(zhuǎn)發(fā)給墊腳石交換機(jī)SSl,并且分組的原始源和目的地地址保持不變,如圖5b的頂部所描繪的。同前,交換機(jī)2的轉(zhuǎn)發(fā)表被配置成經(jīng)由墊腳石轉(zhuǎn)發(fā)對(duì)應(yīng)于某些分類(包括分組502的話務(wù)類)的分組。結(jié)果,耦合至交換機(jī)2與墊腳石SSl之間的鏈路的適用端口在框606中被交換機(jī)2選擇用于轉(zhuǎn)發(fā)該分組。
[0047]此時(shí),分組502在墊腳石交換機(jī)SSl處被接收,并且流程圖邏輯已返回到判決框604。這次,對(duì)該判決框的回答為“是”,且該邏輯前進(jìn)至框608,其中檢查分組報(bào)頭以確定該分組是否已從墊腳石轉(zhuǎn)發(fā),其結(jié)果在判決框610中示出。在一個(gè)實(shí)施例中,確定分組已經(jīng)由墊腳石轉(zhuǎn)發(fā)涉及以下邏輯。首先,確定分組的目的地地址是否對(duì)應(yīng)于墊腳石的地址。如果為“是”,則檢查協(xié)議類型字段(針對(duì)支持原型字段的轉(zhuǎn)發(fā)協(xié)議)以確定協(xié)議類型是否為墊腳石隧道。如果是,則該分組已由墊腳石轉(zhuǎn)發(fā),并且檢查源地址以標(biāo)識(shí)經(jīng)由其接收該分組的虛擬端口。本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到,所有分組將在物理端口上接收和發(fā)出,一些或所有物理端口可取決于它們是否被用于使用墊腳石子路徑來(lái)發(fā)送或接收分組而與虛擬端口相關(guān)聯(lián)。
[0048]返回到判決框610和圖5b中墊腳石SSl處的分組格式描繪,對(duì)判決框610的回答為“否”,并且該邏輯前進(jìn)至框612,其中在墊腳石SS2的轉(zhuǎn)發(fā)表中進(jìn)行查找以確定下一跳,用于沿基于當(dāng)前目的地地址的轉(zhuǎn)發(fā)路徑將該分組轉(zhuǎn)發(fā)給下一跳。在圖5a中所示的示例中,分組沿墊腳石SSl和SS2之間的墊腳石子路徑501轉(zhuǎn)發(fā)。如以上所討論的,墊腳石端口是與墊腳石交換機(jī)上的物理端口相關(guān)聯(lián)的虛擬端口。如判決框614所描繪的,如果分組將經(jīng)由墊腳石子路徑轉(zhuǎn)發(fā)給另一墊腳石,則轉(zhuǎn)發(fā)表查找將標(biāo)識(shí)該分組會(huì)經(jīng)由墊腳石虛擬端口轉(zhuǎn)發(fā),從而導(dǎo)致“是”判決并且該邏輯前進(jìn)至框616。
[0049]經(jīng)由墊腳石子路徑的轉(zhuǎn)發(fā)經(jīng)由使用墊腳石隧道報(bào)頭來(lái)采用可靠協(xié)議,墊腳石隧道報(bào)頭在一個(gè)實(shí)施例中如下生成并格式化。如框616中所不和圖5B中的分組508所描繪的,墊腳石交換機(jī)SSl前置墊腳石隧道報(bào)頭510,包括轉(zhuǎn)發(fā)協(xié)議報(bào)頭511和隧道報(bào)頭信息512。轉(zhuǎn)發(fā)協(xié)議報(bào)頭511包括與正用于在網(wǎng)絡(luò)中轉(zhuǎn)發(fā)該分組的轉(zhuǎn)發(fā)協(xié)議相對(duì)應(yīng)的報(bào)頭。在本示例中,這是IP報(bào)頭,但不限于此。轉(zhuǎn)發(fā)協(xié)議報(bào)頭包括與當(dāng)前墊腳石和下一墊腳石相對(duì)應(yīng)的源和目的地地址,如由墊腳石SSl源地址和墊腳石SS2目的地地址所描繪的。在一些實(shí)施例中,轉(zhuǎn)發(fā)協(xié)議報(bào)頭還包括標(biāo)識(shí)協(xié)議類型為墊腳石(SS)隧道的協(xié)議類型字段。
[0050]隧道報(bào)頭信息512包括具有任選值的多個(gè)字段(S卩,字段值可為空)。在一個(gè)實(shí)施例中,每個(gè)轉(zhuǎn)發(fā)的分組包含隧道流序列號(hào),連同一個(gè)或多個(gè)任選的墊腳石隧道報(bào)頭字段。以下提供關(guān)于隧道流序列號(hào)和其他字段的使用的更多細(xì)節(jié)。在一個(gè)實(shí)施例中,轉(zhuǎn)發(fā)協(xié)議報(bào)頭511包括前置報(bào)頭,而隧道報(bào)頭信息512包括新分組508的有效載荷的一部分,如經(jīng)更新的有效載荷514所描繪的。如圖所示,經(jīng)更新的分組有效載荷514 —般通過(guò)向原始分組502的數(shù)據(jù)內(nèi)容前置隧道報(bào)頭信息512來(lái)生成。
[0051]返回框616,在生成并前置墊腳石隧道報(bào)頭以形成新分組508之后,當(dāng)前墊腳石交換機(jī)(例如,SSD執(zhí)行轉(zhuǎn)發(fā)表查找以確定采用哪個(gè)虛擬端口來(lái)轉(zhuǎn)發(fā)新分組,從而其將到達(dá)對(duì)應(yīng)于下一墊腳石(例如,SS2)的地址的新分組目的地地址。
[0052]在一個(gè)實(shí)施例中,下一跳可根據(jù)指派給該分組的隧穿流來(lái)選擇。如圖5a中所示,墊腳石SSl和SS2之間存在多條可能的子路徑路線。例如,除了所選路線SSl — 3 — 4 — SS2以外,其他可能路線包括 SSl — 7 — 8 — SS2、SS1 — 3 — 8 — SS2、以及 SSl — 9 — 4 — SS2。此外,有可能實(shí)現(xiàn)更長(zhǎng)路線,諸如SSl — 9 — 3 — 4 — SS2、SS1 — 3 — 9 — 4 — SS2等。
[0053]如以下更詳細(xì)地討論的,在一些實(shí)施例中,對(duì)應(yīng)于給定的一對(duì)墊腳石交換機(jī)之間的大多數(shù)或所有分組的流可經(jīng)由單條路徑來(lái)復(fù)用。任選地,對(duì)應(yīng)于不同服務(wù)類的流可在不同路徑上復(fù)用。作為又一選項(xiàng),可基于實(shí)時(shí)話務(wù)條件來(lái)創(chuàng)建或動(dòng)態(tài)地重配置流路徑。
[0054]在一些實(shí)例中,分組可在沒(méi)有先前分類的情況下抵達(dá)第一墊腳石交換機(jī)。在一個(gè)實(shí)施例中,未分類分組由第一墊腳石基于一個(gè)或多個(gè)報(bào)頭字段值進(jìn)行分類。例如,分組可被分類成使用相關(guān)聯(lián)的服務(wù)類級(jí)別、或者作為與分類相關(guān)聯(lián)的流的一部分進(jìn)行轉(zhuǎn)發(fā)。這種分類通??蓱?yīng)用于跨路由路徑中的所有交換機(jī)或僅墊腳石交換機(jī)的轉(zhuǎn)發(fā)操作。另外,還可在各對(duì)墊腳石交換機(jī)之間實(shí)現(xiàn)第二級(jí)分組分類,如以下更詳細(xì)地描述的。例如,分組可分類成各對(duì)墊腳石交換機(jī)之間的(子)流。
[0055]在確定虛擬(輸出)端口之后,該分組隨后根據(jù)框602經(jīng)由與所標(biāo)識(shí)的虛擬端口相關(guān)聯(lián)的物理輸出端口轉(zhuǎn)發(fā)至下一跳(交換機(jī)3)。繼續(xù)到判決框604以及圖5b中關(guān)于交換機(jī)3所示出的分組508配置,判決框604的結(jié)果為“否”,因?yàn)榻粨Q機(jī)3不是墊腳石交換機(jī)。同前,該分組隨后在框606中以常規(guī)方式被轉(zhuǎn)發(fā)。從交換機(jī)3 (以及其他非墊腳石交換機(jī))的觀點(diǎn)而言,分組508看起來(lái)是具有正常轉(zhuǎn)發(fā)協(xié)議報(bào)頭(例如,在該示例中為正常IP報(bào)頭)、具有源地址和目的地地址連同各種其他字段(出于清楚而未示出)的常規(guī)分組。分組508中的其余數(shù)據(jù)(從常規(guī)交換機(jī)的角度而言)看起來(lái)是分組有效載荷,并且因此隧道報(bào)頭信息512被簡(jiǎn)單地忽略。在本示例中,下一跳是交換機(jī)4,其以與交換機(jī)3類似的方式處理分組508,導(dǎo)致分組508被轉(zhuǎn)發(fā)給墊腳石SS2,墊腳石SS2是墊腳石子路徑501的目的地端點(diǎn)。
[0056]返回到判決框604并使分組配置前進(jìn)至圖5c頂部,分組轉(zhuǎn)發(fā)序列的當(dāng)前進(jìn)展現(xiàn)在對(duì)應(yīng)于墊腳石SS2從交換機(jī)4接收分組518。這導(dǎo)致對(duì)判決框604的“是”回答、以及對(duì)判決框610的“是”回答,因?yàn)檗D(zhuǎn)發(fā)協(xié)議報(bào)頭511將墊腳石SS2標(biāo)識(shí)為目的地地址且協(xié)議路線是墊腳石隧道。結(jié)果,該流程圖邏輯前進(jìn)至框618,其中從該分組剝?nèi)|腳石報(bào)頭(S卩,墊腳石報(bào)頭510)。該邏輯隨后前進(jìn)至框612,其中確定用于下一跳的轉(zhuǎn)發(fā)端口。按照與分組抵達(dá)墊腳石SSl時(shí)類似的方式,該分組的轉(zhuǎn)發(fā)路徑的下一部分是經(jīng)由墊腳石子路徑503,如圖5a中所示。該子路徑具有分別對(duì)應(yīng)于墊腳石SS2和SS3的源和目的地端點(diǎn)。
[0057]同前,在框616中,通過(guò)前置墊腳石報(bào)頭518來(lái)形成新分組516,墊腳石報(bào)頭518包括具有對(duì)應(yīng)于墊腳石交換機(jī)SS2和SS3的源和目的地地址的轉(zhuǎn)發(fā)協(xié)議報(bào)頭519、以及隧道報(bào)頭信息520,并且標(biāo)識(shí)用于下一跳(在該實(shí)例中為交換機(jī)5)的虛擬端口。分組516隨后被轉(zhuǎn)發(fā)給交換機(jī)5,交換機(jī)5檢查轉(zhuǎn)發(fā)協(xié)議報(bào)頭519并將其識(shí)別為常規(guī)IP報(bào)頭,導(dǎo)致該分組被轉(zhuǎn)發(fā)給對(duì)應(yīng)于分組516的目的地地址的墊腳石SS3。
[0058]繼續(xù)到圖5d頂部和判決框604,在此階段,由墊腳石SS3接收分組516。同前,墊腳石SS3檢查轉(zhuǎn)發(fā)協(xié)議報(bào)頭519并將分組516標(biāo)識(shí)為經(jīng)由虛擬端口接收自前一墊腳石。結(jié)果,該流程圖邏輯前進(jìn)至框618,其剝?nèi)|腳石隧道報(bào)頭518,留下原始分組502。該邏輯隨后前進(jìn)至框612,以基于該分組的原始目的地地址(或者另行基于考慮該目的地地址的分組分類)執(zhí)行在墊腳石SS3的轉(zhuǎn)發(fā)表中查找下一跳。這次,下一跳不涉及墊腳石子路徑的一部分,并且因此交換石SS3簡(jiǎn)單地以常規(guī)方式經(jīng)由所標(biāo)識(shí)的物理端口轉(zhuǎn)發(fā)原始分組502以到達(dá)交換機(jī)6,如框620中的操作所描繪的。
[0059]此時(shí),原始分組502到達(dá)交換機(jī)6,交換機(jī)6隨后以常規(guī)方式將該分組轉(zhuǎn)發(fā)給目的地計(jì)算機(jī)D,從而完成轉(zhuǎn)發(fā)序列。從目的地計(jì)算機(jī)D的觀點(diǎn)而言,原始分組502已簡(jiǎn)單地以常規(guī)方式轉(zhuǎn)發(fā),并且計(jì)算機(jī)D的聯(lián)網(wǎng)邏輯不知曉或甚至沒(méi)考慮實(shí)際路由路徑包括了一個(gè)或多個(gè)墊腳石子路徑。
[0060]流管理、復(fù)用和隧穿
[0061]根據(jù)一些實(shí)施例的附加方面,提供墊腳石交換機(jī)上的資源以促進(jìn)墊腳石交換機(jī)對(duì)之間的隧穿子路徑上的流管理和話務(wù)復(fù)用。圖7a_7c中示出說(shuō)明針對(duì)墊腳石子路徑實(shí)現(xiàn)的流管理、復(fù)用和隧穿的各方面的示例性配置。圖7a描繪了墊腳石SSl與SS2之間的子路徑,其經(jīng)過(guò)一個(gè)或多個(gè)之間交換機(jī)700,如交換機(jī)I和2所描繪的。墊腳石SSl包括5個(gè)流隊(duì)列緩沖器FQ1-FQ5,并且墊腳石SS2包括6個(gè)流隊(duì)列緩沖器FQ1-FQ6。如圖7b中所示,墊腳石SSl與SS2之間存在數(shù)個(gè)所管理流,其中相應(yīng)的分組被緩沖在所描繪的流隊(duì)列緩沖器中,并且其中線段的寬度被用于表示該流所消耗的相對(duì)帶寬部分。每個(gè)所管理流由線末端的緩沖器標(biāo)識(shí),例如流FQ1-FQ1、FQ1-FQ2、FQ3-FQ3等。還應(yīng)注意,發(fā)送墊腳石上的流隊(duì)列與接收墊腳石上的流隊(duì)列之間不需要1:1關(guān)系。
[0062]如圖7c中所示,墊腳石SSl與SS2之間的各個(gè)流作為單個(gè)流隧穿通過(guò)中間交換機(jī)I和2??扇芜x地,這些流可使用多個(gè)隧道來(lái)傳送,這些隧道各自隧穿一組流。作為又一選項(xiàng),所選流可使用經(jīng)過(guò)其他中間交換機(jī)(未示出)的路線在一對(duì)墊腳石之間隧穿。
[0063]在一個(gè)實(shí)施例中,利用墊腳石的流按以下方式操作。分組使用包含諸如“當(dāng)前墊腳石SS1”、“下一墊腳石SS2”和(那兩個(gè)墊腳石SS1-SS2之間的流的)序列號(hào)之類的信息的報(bào)頭從一個(gè)墊腳石隧穿至另一個(gè)墊腳石,如上所述。可任選地,報(bào)頭可包括該流的流Id和相關(guān)聯(lián)序列號(hào)。在一些實(shí)施例中,每個(gè)墊腳石保持某個(gè)數(shù)目的緩沖器用于流,潛在地具有正使用該墊腳石的服務(wù)的每個(gè)流(S(源)-D(目的地))都具有緩沖器池的粒度。出于簡(jiǎn)化起見,將其描述為每一(S,D)對(duì)都具有單獨(dú)池,但是潛在地?cái)?shù)個(gè)流可一起成塊地進(jìn)入一個(gè)池,其缺點(diǎn)在于如果該池的所有緩沖器都充滿了,則該流的更多分組不能被該墊腳石接受。在一些實(shí)施例中,如果墊腳石不具有用于新流(或新類的流)的資源,則其針對(duì)某個(gè)流(新流,或者基于優(yōu)先級(jí)或某個(gè)其他準(zhǔn)則為現(xiàn)有流)放棄墊腳石服務(wù)。
[0064]墊腳石SS2針對(duì)使用從SSl到SS2的墊腳石服務(wù)的每個(gè)流類保持緩沖器池。I和2之間的中間交換機(jī)不知曉所有流在SSl與SS2之間復(fù)用。中間交換機(jī)可使用任一種傳統(tǒng)技術(shù);它們可丟棄分組(在此情形中,墊腳石服務(wù)將仍是有益的,因?yàn)橹貍鲗?lái)自先前墊腳石而非完全來(lái)自源端點(diǎn)的),或者它們可以對(duì)SS1-SS2流進(jìn)行回壓,這相比于傳統(tǒng)回壓將是有益的,因?yàn)閷⒋嬖诒阋说?非墊腳石)中間交換機(jī)能為墊腳石流保留緩沖器池的少數(shù)足夠的流。
[0065]利用該技術(shù),在SS1-SS2墊腳石鏈路上復(fù)用的較慢流不會(huì)妨礙共享SS1-SS2鏈路的其他流的進(jìn)度。由于墊腳石SSl和SS2具有足夠的緩沖器資源來(lái)保持用于(使用其服務(wù)的)大量流類的緩沖器,因此它們可針對(duì)這些流類中的每一者采用個(gè)體流管理技術(shù)。例如,在一個(gè)實(shí)施例中,實(shí)現(xiàn)基于信用的流控制方案,其中源墊腳石交換機(jī)(例如,SSl)不向目的地墊腳石(例如,SS2)發(fā)送該流類的分組,除非SSl知道SS2處存在用于該流類的緩沖器。在一個(gè)實(shí)施例中,可實(shí)現(xiàn)信用-流方案,其中發(fā)送墊腳石交換機(jī)將對(duì)應(yīng)于給定流的分組樂(lè)觀地轉(zhuǎn)發(fā)給接收墊腳石交換機(jī),接收墊腳石交換機(jī)將該分組緩沖在相應(yīng)的流隊(duì)列中。如果該流隊(duì)列開始變滿,則接收墊腳石交換機(jī)可發(fā)送具有分配流信用準(zhǔn)予的墊腳石報(bào)頭的分組,其實(shí)質(zhì)上是說(shuō)“你(發(fā)送方)被分配再發(fā)送η個(gè)分組,但在我向你發(fā)送另一流信用準(zhǔn)予之前不能發(fā)送更多分組?!绷餍庞脺?zhǔn)予的粒度(即,大小)可因?qū)崿F(xiàn)參數(shù)而變化,諸如流的數(shù)量、話務(wù)量(相對(duì)于轉(zhuǎn)發(fā)吞吐量)、流的動(dòng)態(tài)本質(zhì)等。例如,可作出用于η個(gè)分組的給定流信用準(zhǔn)予(例如,100個(gè)分組、1000個(gè)分組等)。
[0066]圖8示出可用來(lái)支持基于信用的流控制方案和以下描述的其他流控制方案的示例性墊腳石隧道報(bào)頭800。墊腳石報(bào)頭800包括轉(zhuǎn)發(fā)協(xié)議報(bào)頭802、隧道報(bào)頭信息字段804、以及隧道報(bào)頭任選字段806。如以上所討論的,轉(zhuǎn)發(fā)協(xié)議報(bào)頭將對(duì)應(yīng)于用于在給定類型的網(wǎng)絡(luò)中轉(zhuǎn)發(fā)分組的類型的分組報(bào)頭,諸如但不限于用于采用基于IP的轉(zhuǎn)發(fā)的網(wǎng)絡(luò)的IP報(bào)頭。出于簡(jiǎn)化起見,本文未提供個(gè)體類型的轉(zhuǎn)發(fā)協(xié)議報(bào)頭的細(xì)節(jié),因?yàn)檫@些是本領(lǐng)域技術(shù)人員眾所周知的。示例性隧道報(bào)頭信息字段包括隧道流序列號(hào)、任選的流ID和流序列號(hào)、ACK字段位、信用字段位、拒絕字段位、暫停字段位、以及恢復(fù)字段位。這些字段僅僅是示例性的,因?yàn)椴煌瑢?shí)施例可采用不同的、附加的、或更少類型的字段。隧道報(bào)頭任選字段806被用來(lái)描繪按照與其他網(wǎng)絡(luò)協(xié)議所使用的類似的方式將隧道報(bào)頭的一部分分配給一個(gè)或多個(gè)任選字段。可任選地,針對(duì)隧道流信息字段804描繪的一個(gè)或多個(gè)字段可包括擴(kuò)展字段或伴隨字段。例如,在現(xiàn)有的流信用準(zhǔn)予場(chǎng)景中,該準(zhǔn)予的分組數(shù)量可編碼在信用字段中,其中非空值的存在指示分組報(bào)頭與流信用準(zhǔn)予相關(guān)聯(lián)??扇芜x地,信用位可被用于指示隧道報(bào)頭的目的,并且該準(zhǔn)予的分組數(shù)目可被包括在伴隨字段(未示出)中或在對(duì)應(yīng)于隧道報(bào)頭任選字段806的分組部分中。
[0067]作為另一流控制選項(xiàng),墊腳石SSl以循環(huán)方式輪流為每個(gè)流類發(fā)送分組。如果特定流類已超出其在墊腳石SS2處的配額,則SS2拒絕該分組,并且墊腳石SSl將在下一輪重傳它。墊腳石拒絕分組報(bào)頭800a的示例在圖8a中示出。在該實(shí)施例中,拒絕字段位被設(shè)為T(如粗體拒絕所指示的),并且隧道報(bào)頭選項(xiàng)字段被用于列出已被拒絕的分組的序列號(hào)(在該示例中為分組6、14、18和26)。響應(yīng)于發(fā)送墊腳石得到關(guān)于已被拒絕的分組的序列號(hào)的通知,并且將嘗試重發(fā)那些分組。在一個(gè)實(shí)施例中,響應(yīng)于接收到分組已被拒絕的通知,使用新的隧道流序列號(hào)來(lái)重發(fā)該分組。
[0068]作為使用常規(guī)循環(huán)方案的替換方案,可采用加權(quán)循環(huán)方案,其中在每一輪期間,所選流被分配附加分組。例如,消耗較高帶寬和/或具有較大(相對(duì))緩沖器分配的流可每輪被分配多個(gè)分組,而較低帶寬/緩沖器流可被分配單個(gè)分組。當(dāng)然,每輪分配給每個(gè)流的分組數(shù)量可以是某個(gè)數(shù)目m,而非一次分配單個(gè)分組(或m乘以加權(quán)值)。
[0069]作為另一選項(xiàng),可實(shí)現(xiàn)暫停-恢復(fù)方案。在此辦法下,墊腳石SSl輪流(例如,循環(huán)或加權(quán)循環(huán))為每個(gè)流傳送分組,并且如果特定流接近其配額,則SS2為那一個(gè)流發(fā)送“暫?!?,并且SSl將在使用SS1-SS2隧道的其他流之間復(fù)用,直至SS2為SS2暫停了的流發(fā)送“恢復(fù)”。傳達(dá)暫停和恢復(fù)的報(bào)頭可具有與墊腳石隧道報(bào)頭800類似的配置,其中在適用的情況下暫停和恢復(fù)字段位被置位。
[0070]信用或暫停-恢復(fù)辦法的一種替換辦法是采用樂(lè)觀式流管理,其中允許分組被丟棄。例如,針對(duì)給定流的緩沖器利用可能波動(dòng),導(dǎo)致在瞬間峰值負(fù)載的情況下分組被丟棄。在該樂(lè)觀式辦法下,分組被丟棄的頻率或百分比較低,并且因此損失的相關(guān)聯(lián)帶寬相對(duì)較低。該樂(lè)觀式辦法相對(duì)于信用或暫停-恢復(fù)辦法而言還可節(jié)省帶寬,因?yàn)閺哪康牡貕|腳石向源墊腳石發(fā)回的用于促進(jìn)流管理的分組利用可減少。
[0071]采用流復(fù)用和隧穿的逐跳墊腳石服務(wù)的使用在適用話務(wù)條件下提供了顯著的性能優(yōu)勢(shì)。例如,從中間交換機(jī)SI和S2的觀點(diǎn)而言,通過(guò)它們轉(zhuǎn)發(fā)的大部分或所有話務(wù)可被分類為單個(gè)流(即,流SS1-SS2)或少量流(具有不同服務(wù)類的SS1-SS2流)。結(jié)果,并非劃分可用緩沖器資源以支持相當(dāng)大量的流,緩沖器資源可一起匯成池作為單個(gè)緩沖器或幾個(gè)緩沖器。此辦法的益處在于,交換機(jī)可更好地利用其緩沖器資源而不必丟棄分組或?qū)崿F(xiàn)回壓操作來(lái)減少其緩沖器的填充水平。
[0072]結(jié)合前述流管理、復(fù)用、和隧穿辦法,墊腳石可個(gè)體地管理其流,其中在按需基礎(chǔ)上向所選流應(yīng)用回壓以管理通過(guò)中間交換機(jī)的復(fù)用流的分組處理吞吐量。例如,盡管墊腳石SSl和SS2之間的交換機(jī)可能對(duì)SS1-SS2流進(jìn)行流控制,但它們不需要用于每個(gè)復(fù)用流的資源;由SSl來(lái)公平地在復(fù)用流之間共享SS1-SS2隧道的帶寬。如果一個(gè)復(fù)用流較慢,則它不會(huì)妨礙其他復(fù)用流的進(jìn)度;該單個(gè)(S,D)流可由墊腳石SS2回壓并由墊腳石SSl保持。
[0073]一些網(wǎng)絡(luò)協(xié)議共有的特征是分組遞送驗(yàn)證。如以上所討論的,在諸如TCP之類的協(xié)議中,遞送驗(yàn)證是經(jīng)由從目的地端點(diǎn)向源端點(diǎn)發(fā)回的ACK消息來(lái)促成的。同樣如以上所討論的,用于轉(zhuǎn)發(fā)沒(méi)有到達(dá)其目的地的分組的任何帶寬對(duì)于該分組在被丟棄或丟失之前經(jīng)過(guò)的路線部分是有損失的。
[0074]通過(guò)使用墊腳石和隧穿鏈路促成的另一優(yōu)勢(shì)在于與遞送確認(rèn)有關(guān)的性能改善。如同諸如TCP之類的遞送確認(rèn)協(xié)議一樣,如果墊腳石(例如,SSl和SS2)之間的交換機(jī)丟失分組(由于比特錯(cuò)誤或由于擁塞丟失),則該分組由SSl (有效源端點(diǎn))保持并由SSl重傳,直至SS2 (有效目的地端點(diǎn))接受它。
[0075]在一些實(shí)施例中,遞送確認(rèn)是經(jīng)由墊腳石報(bào)頭中包含的信息來(lái)促成的。例如,墊腳石隧道報(bào)頭信息字段804中的ACK字段位可被用來(lái)確認(rèn)對(duì)一個(gè)或多個(gè)分組的遞送,其中在伴隨字段中或在隧道報(bào)頭任選字段806中的字段中提供該分組的序列號(hào)。另外,可通過(guò)使用流ID和流序列號(hào)在流基礎(chǔ)上實(shí)現(xiàn)遞送確認(rèn)。
[0076]在一個(gè)實(shí)施例中,對(duì)復(fù)用流作為整體(例如,墊腳石之間的復(fù)用分組流)采用隧道流序列號(hào)。在此辦法的一個(gè)實(shí)施例中,當(dāng)源墊腳石由于流的分組被拒絕而重傳流的分組時(shí),它將與其首次被傳送時(shí)具有不同的序列號(hào)。例如,假設(shè)墊腳石SSl樂(lè)觀地輪流發(fā)送每個(gè)流的分組,而不知道墊腳石SS2是否將具有緩沖器空間用于該流。SS2發(fā)回ACK,其具有如“序列號(hào)17-37被接收和接受。序列號(hào)38被接收但沒(méi)有緩沖器空間用于該流。序列號(hào)39-51被接收和接受。序列號(hào)52看起來(lái)丟失。序列號(hào)53-57被接收和接受。序列號(hào)58被接收但沒(méi)有緩沖器空間用于該流”之類的信息。當(dāng)對(duì)應(yīng)于序列號(hào)38的分組被重傳時(shí),用于該復(fù)用流的序列號(hào)可前進(jìn)到比如說(shuō)序列號(hào)79,在這種情形中,重傳的分組將具有序列號(hào)79。
[0077]除了前述流控制辦法,可實(shí)現(xiàn)其他流控制技術(shù)。例如,在一個(gè)實(shí)施例中,實(shí)現(xiàn)提前流控制。例如,SS2告知SSl “直至我們之間的序列號(hào)17,我具有3個(gè)分組的空間用于流1、7個(gè)分組的空間用于流2、0個(gè)分組的空間用于流3……”。這種類型的信息可在墊腳石分組的有效載荷中傳達(dá),其中報(bào)頭將標(biāo)識(shí)該分組的目的(例如,提前流控制)。此外,還可實(shí)現(xiàn)混合辦法。例如,在一個(gè)實(shí)施例中,即使SS2沒(méi)有明確說(shuō)存在用于該流的信用、或者如果SS2給SSl的上一個(gè)信用報(bào)告指示它將沒(méi)有緩沖器空間,也允許SSl向SS2發(fā)送。如果SSl是過(guò)度樂(lè)觀,則SS2將拒絕它。但是也有可能的是,在給定從SS2到SSl的信息有延遲的情況下,緩沖器空間可能是可用的。
[0078]如可以容易觀察到的,在與利用由墊腳石執(zhí)行的遞送驗(yàn)證的逐跳辦法相比時(shí),在常規(guī)分組轉(zhuǎn)發(fā)下由于分組丟棄/丟失造成的帶寬損失減少。首先,考慮各對(duì)墊腳石之間的路徑包括隧穿子路徑。如果在墊腳石之間實(shí)現(xiàn)遞送驗(yàn)證機(jī)制,則該路線中將需要重新經(jīng)過(guò)(重發(fā)丟棄或丟失分組)的最長(zhǎng)部分將在一對(duì)墊腳石之間。另外,由于墊腳石具有更大的緩沖器資源,因此分組丟棄的發(fā)生顯著減少。此外,在可由墊腳石實(shí)現(xiàn)的流管理和復(fù)用方案下,墊腳石之間的中間常規(guī)交換機(jī)上的分組/流管理負(fù)擔(dān)也可顯著減少,因?yàn)橹恍枰芾韱蝹€(gè)或少數(shù)流。
[0079]墊腳石交換機(jī)的網(wǎng)絡(luò)拓?fù)浒l(fā)現(xiàn)和配置
[0080]部署采用墊腳石交換機(jī)的網(wǎng)絡(luò)的一方面是墊腳石交換機(jī)的網(wǎng)絡(luò)拓?fù)浒l(fā)現(xiàn)和相關(guān)聯(lián)配置。如以上所討論的,墊腳石交換機(jī)可在網(wǎng)絡(luò)架構(gòu)中的兩個(gè)單獨(dú)分層級(jí)別處實(shí)現(xiàn)一第一級(jí)對(duì)應(yīng)于用作常規(guī)交換機(jī),而第二級(jí)對(duì)應(yīng)于用作墊腳石交換機(jī)。根據(jù)這兩個(gè)級(jí)別處的各方面的實(shí)現(xiàn),可采用各種技術(shù)來(lái)發(fā)現(xiàn)每一級(jí)別處的網(wǎng)絡(luò)拓?fù)洳⑴渲脡|腳石交換機(jī),以使得它知曉每一級(jí)別處的網(wǎng)絡(luò)拓?fù)洹?br>
[0081]在一個(gè)實(shí)施例中,使用常規(guī)技術(shù)(諸如經(jīng)由一個(gè)或多個(gè)廣告方案或使用中央管理器等)來(lái)確定該網(wǎng)絡(luò)在這兩個(gè)分層級(jí)別中的每一級(jí)別處的節(jié)點(diǎn)和鏈路結(jié)構(gòu)。例如,墊腳石交換機(jī)可使用鏈路狀態(tài)路由協(xié)議與對(duì)等交換機(jī)交換配置分組(由此向另一個(gè)交換機(jī)廣告其配置),其中這些交換機(jī)的鏈路和節(jié)點(diǎn)配置信息在該網(wǎng)絡(luò)中傳播。這是常規(guī)交換機(jī)用來(lái)確定網(wǎng)絡(luò)拓?fù)涞募夹g(shù),并且類似技術(shù)可由墊腳石交換機(jī)用來(lái)促成第一級(jí)別處的配置。鏈路狀態(tài)路由協(xié)議技術(shù)可被擴(kuò)展成支持交換第二級(jí)別處的配置信息,由此使得墊腳石交換機(jī)的配置和能力可供其他墊腳石交換機(jī)使用。凈結(jié)果是,墊腳石具有該網(wǎng)絡(luò)架構(gòu)在第一和第二分層級(jí)別中的每一級(jí)別處的“視圖”。
[0082]在一個(gè)實(shí)施例中,墊腳石交換機(jī)基于兩個(gè)分層級(jí)別處的網(wǎng)絡(luò)拓?fù)鋪?lái)構(gòu)建和維護(hù)轉(zhuǎn)發(fā)表。例如,這可使用統(tǒng)一轉(zhuǎn)發(fā)表或針對(duì)每個(gè)級(jí)別的單獨(dú)轉(zhuǎn)發(fā)表來(lái)執(zhí)行。通常情況下,如果實(shí)現(xiàn)為統(tǒng)一轉(zhuǎn)發(fā)表,則兩個(gè)分層級(jí)別的轉(zhuǎn)發(fā)數(shù)據(jù)可以在邏輯上分開。選擇使用哪個(gè)轉(zhuǎn)發(fā)表(或轉(zhuǎn)發(fā)表的部分)將基于是否將對(duì)給定分組使用墊腳石轉(zhuǎn)發(fā)。
[0083]示例性墊腳石交換機(jī)硬件架構(gòu)
[0084]圖9和10分別示出說(shuō)明在墊腳石交換機(jī)的一個(gè)實(shí)施例中采用的組件的交換機(jī)900和交換線路卡1000。交換機(jī)900包括底座902,其中多個(gè)交換線路卡1000安裝在相應(yīng)的槽中。出于簡(jiǎn)化起見,圖10中所示的交換線路卡1000被描繪為具有相同的配置;然而,本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到,在同一交換機(jī)底座中可采用具有不同配置的線路卡。
[0085]如圖10中所示,交換線路卡1000包括主板1002,其上經(jīng)由插孔連接安裝或以其他方式耦合多個(gè)組件,包括一個(gè)或多個(gè)處理器1004和存儲(chǔ)器模塊1006。還示出耦合至主板1002的大容量存儲(chǔ)設(shè)備1008和子板1010。大容量存儲(chǔ)設(shè)備1008通??砂ㄓ脖P驅(qū)動(dòng)器或固態(tài)驅(qū)動(dòng)器。子板1010例示各種類型的板或模塊,其可耦合至主板1002以提供輔助功能,并且是可任選的。主板1002進(jìn)一步包括連接器1012,在交換線路卡安裝在其槽中時(shí),連接器1012耦合至交換機(jī)底座902中的背板(未示出)。背板被配置成使得交換線路卡能與彼此以及與交換機(jī)中的其他設(shè)施通信。交換線路卡1000還包括用于耦合至網(wǎng)絡(luò)鏈路的各種連接器,諸如由RJ-45連接器1014和可任選的連接器1016和1018所描繪的。
[0086]本文所公開的墊腳石交換機(jī)的實(shí)施例所實(shí)現(xiàn)的操作和邏輯通??山?jīng)由指令(諸如軟件和/或固件指令)來(lái)實(shí)現(xiàn)、在處理器1004或交換線路卡1000上的其他處理組件或邏輯中的一者或多者上執(zhí)行。在各種實(shí)施例中,處理器1004可包括通用處理器,包括單核和多核處理器,或者可包括專用處理器,諸如配置成使用流水線架構(gòu)來(lái)促成分組處理的網(wǎng)絡(luò)處理器。
[0087]交換機(jī)900說(shuō)明在大型網(wǎng)絡(luò)中實(shí)現(xiàn)的墊腳石的墊腳石交換機(jī)配置。然而,這不作為限定,因?yàn)榫哂懈?jiǎn)化配置的交換機(jī)裝置可實(shí)現(xiàn)在其他類型的網(wǎng)絡(luò)中,諸如以太網(wǎng)局域網(wǎng)(LAN)和廣域網(wǎng)(WAN)。另外,墊腳石交換機(jī)可實(shí)現(xiàn)在其他類型的網(wǎng)絡(luò)中,包括但不限于Infiniband網(wǎng)絡(luò)、以及采用標(biāo)準(zhǔn)化或?qū)S芯W(wǎng)絡(luò)協(xié)議的存儲(chǔ)網(wǎng)絡(luò)。例如,此類交換機(jī)裝置通常將包括類似于關(guān)于交換線路卡1000所示的組件,交換線路卡1000說(shuō)明墊腳石交換機(jī)裝置的一個(gè)實(shí)施例。因此,獨(dú)立墊腳石交換機(jī)可包括主板,其上可安裝或以其他方式可操作地耦合各種組件,包括一個(gè)或多個(gè)處理器、存儲(chǔ)器、存儲(chǔ)設(shè)備、輸入和輸出端口,其中存儲(chǔ)設(shè)備存儲(chǔ)被配置成由一個(gè)或多個(gè)處理器執(zhí)行以促成墊腳石操作的指令。
[0088]雖然參考特定實(shí)現(xiàn)方式描述了一些實(shí)施例,但根據(jù)一些實(shí)施例,其他實(shí)現(xiàn)方式也是可能的。另外,附圖中所示的和/或本文描述的元件或其它特征的配置和/或順序不需要以所示和所描述的特定方式安排。根據(jù)某些實(shí)施例很多其它配置也是可能的。
[0089]在附圖中示出的每個(gè)系統(tǒng)中,在一些情況下的元件可分別具有相同附圖標(biāo)記或不同的附圖標(biāo)記,以暗示所表示的元件可能不同和/或相似。然而,元件是足夠靈活的以具有不同的實(shí)現(xiàn)并與本文所示或所描述的系統(tǒng)中的部分或全部一起操作。附圖中所示的各元件可以相同或不同。將哪個(gè)稱為第一元件以及將哪個(gè)稱為第二元件是任意的。
[0090]在說(shuō)明書和權(quán)利要求書中,可使用術(shù)語(yǔ)“耦合”和“連接”及其衍生詞。應(yīng)當(dāng)理解,這些術(shù)語(yǔ)并不旨在作為彼此的同義詞。相反,在具體實(shí)施例中,“連接的”用于指示兩個(gè)或更多個(gè)要素彼此直接物理或電接觸?!榜詈系摹笨杀硎緝蓚€(gè)或更多個(gè)元件直接物理或電接觸。然而,“耦合的”也可表示兩個(gè)或更多個(gè)元件并未彼此直接接觸,但是仍然彼此協(xié)作、彼此相互作用。
[0091]實(shí)施例是本發(fā)明的實(shí)現(xiàn)或示例。說(shuō)明書中對(duì)“實(shí)施例”、“一個(gè)實(shí)施例”、“一些實(shí)施例”或“其它實(shí)施例”的引用表示結(jié)合這些實(shí)施例描述的特定特征、結(jié)構(gòu)或特性被包括在本發(fā)明的至少一些實(shí)施例中,而不一定在所有的實(shí)施例中。各處出現(xiàn)的“實(shí)施例”、“一個(gè)實(shí)施例”或“一些實(shí)施例”不一定都指相同的實(shí)施例。
[0092]并非本文中描述和示出的所有組件、特征、結(jié)構(gòu)、特性等等都需要被包括在特定實(shí)施例或多個(gè)實(shí)施例中。例如,如果說(shuō)明書陳述“可”、“可能”、“可以”或“能夠”包括組件、特征、結(jié)構(gòu)或特性,則不一定包括該特定組件、特征、結(jié)構(gòu)或特性。如果說(shuō)明書或權(quán)利要求書提至IJ“一”或“一個(gè)”元件,則這并不意味著僅有一個(gè)該元件。如果說(shuō)明書或權(quán)利要求書引用“附加”元素,則不排除有一個(gè)以上的附加元素。
[0093]如上所討論的,可通過(guò)對(duì)應(yīng)軟件和/或固件組件及應(yīng)用(諸如由網(wǎng)絡(luò)交換機(jī)上的處理器所執(zhí)行的軟件或固件)來(lái)促成本文中實(shí)施例的各方面。因此,本發(fā)明的實(shí)施例可用作或支持在某種形式的處理核(諸如,計(jì)算機(jī)的CPU、多核處理器的一個(gè)或多個(gè)核)上執(zhí)行的軟件程序、軟件模塊、固件和/或分布式軟件,在處理器或核上運(yùn)行或以其它方式在機(jī)器可讀介質(zhì)上或內(nèi)實(shí)現(xiàn)或達(dá)成的虛擬機(jī)。機(jī)器可讀介質(zhì)包括用于存儲(chǔ)或傳送機(jī)器(例如,計(jì)算機(jī))可讀形式的信息的任何機(jī)制。例如,機(jī)器可讀介質(zhì)可包括只讀存儲(chǔ)器(ROM)、隨機(jī)存取存儲(chǔ)器(RAM)、磁盤存儲(chǔ)介質(zhì)、光存儲(chǔ)介質(zhì),以及閃存設(shè)備等。
[0094]以上對(duì)本發(fā)明的所示出實(shí)施例的描述,包括在摘要中所描述的,并非旨在是詳盡的或?qū)⒈景l(fā)明限于所公開的精確形式。盡管為了說(shuō)明目的,本文描述了本發(fā)明的具體實(shí)施例以及示例,但是如相關(guān)領(lǐng)域技術(shù)人員所理解的,各種可能的等效修改也落在本發(fā)明的范圍內(nèi)。
[0095]可以根據(jù)上面的詳細(xì)描述對(duì)本發(fā)明進(jìn)行這些修改。所附權(quán)利要求中所使用的術(shù)語(yǔ)不應(yīng)該被理解為將本發(fā)明限制于說(shuō)明書和附圖中所公開的特定實(shí)施例。相反,本文的范圍完全由所附權(quán)利要求來(lái)確定,權(quán)利要求根據(jù)權(quán)利要求解釋的所建立原則來(lái)解釋。
【權(quán)利要求】
1.一種方法,包括: 在包括第一類型的交換機(jī)的第一交換機(jī)處接收具有原始格式的分組,所述原始格式包括對(duì)應(yīng)于網(wǎng)絡(luò)轉(zhuǎn)發(fā)協(xié)議的原始分組報(bào)頭,所述原始分組報(bào)頭包括用于目的地端點(diǎn)設(shè)備的目的地地址,所述目的地端點(diǎn)設(shè)備通信地耦合至一包括多個(gè)第一類型的交換機(jī)和多個(gè)第二類型的交換機(jī)的網(wǎng)絡(luò); 確定從第一交換機(jī)到所述目的地端點(diǎn)設(shè)備的路線,,所述路線通過(guò)第一交換機(jī)與包括第一類型的交換機(jī)的第二交換機(jī)之間的子路徑來(lái)轉(zhuǎn)發(fā),所述子路徑包括所述第一和第二交換機(jī)之間的包括第二類型的交換機(jī)的至少一個(gè)中間交換機(jī); 向所述原始分組格式前置第二分組報(bào)頭以形成新分組,所述第二分組報(bào)頭包括對(duì)應(yīng)于第一交換機(jī)的地址的源地址和對(duì)應(yīng)于第二交換機(jī)的地址的目的地地址,所述第二分組報(bào)頭具有對(duì)應(yīng)于所述網(wǎng)絡(luò)轉(zhuǎn)發(fā)協(xié)議的格式;以及 經(jīng)由耦合在第一交換機(jī)與沿所述子路徑的第一中間交換機(jī)之間的鏈路從第一交換機(jī)向第一中間交換機(jī)轉(zhuǎn)發(fā)所述新分組, 其中第一類型的交換機(jī)比第二類型的交換機(jī)具有更大的存儲(chǔ)器容量,并且第一類型的交換機(jī)采用促成第一類型的交換機(jī)之間的子路徑的錯(cuò)誤恢復(fù)的可靠協(xié)議。
2.如權(quán)利要求1所述的方法,其特征在于,第二分組報(bào)頭包括隧道報(bào)頭,所述隧道報(bào)頭包括含網(wǎng)絡(luò)轉(zhuǎn)發(fā)協(xié)議報(bào)頭的第一部分和含一個(gè)或多個(gè)報(bào)頭信息字段的第二部分。
3.如權(quán)利要求2所述的方法,其特征在于,所述一個(gè)或多個(gè)報(bào)頭信息字段被包括在所述新分組的分組有效載荷中。
4.如權(quán)利要求1所述的方法,其特征在于,還包括: 在第一交換機(jī)處接收多個(gè)分組; 將所述多個(gè)分組中的分組指派給相關(guān)聯(lián)的分組流,所述相關(guān)聯(lián)的分組流包括多個(gè)流類;以及 將與所述多個(gè)分組流相關(guān)聯(lián)的分組作為經(jīng)由第一和第二交換機(jī)之間的所述子路徑隧穿的復(fù)用流進(jìn)行轉(zhuǎn)發(fā)。
5.如權(quán)利要求4所述的方法,其特征在于,還包括: 在第一交換機(jī)處接收來(lái)自第二交換機(jī)的與分組流相關(guān)聯(lián)的第一分組流信用準(zhǔn)予;將對(duì)應(yīng)于所述分組流信用準(zhǔn)予且與所述分組流相關(guān)聯(lián)的數(shù)個(gè)分組經(jīng)由所述子路徑從第一交換機(jī)轉(zhuǎn)發(fā)給第二交換機(jī);以及 等待直至接收到與所述分組流相關(guān)聯(lián)的第二分組流信用準(zhǔn)予后轉(zhuǎn)發(fā)與所述分組流相關(guān)聯(lián)的附加分組。
6.如權(quán)利要求4所述的方法,其特征在于,還包括: 使用基于循環(huán)的方案從第一交換機(jī)經(jīng)由所述子路徑向第二交換機(jī)發(fā)送分組,其中每個(gè)流類針對(duì)每一輪被分配一時(shí)機(jī); 在第一交換機(jī)處接收來(lái)自第二交換機(jī)的關(guān)于給定流的分組已被拒絕的指示;以及 在所述給定流的后續(xù)時(shí)機(jī)期間重發(fā)被拒絕的分組。
7.如權(quán)利要求4所述的方法,其特征在于,還包括: 使用基于循環(huán)的方案從第一交換機(jī)經(jīng)由所述子路徑向第二交換機(jī)發(fā)送分組,其中每個(gè)流類針對(duì)每一輪被分配一時(shí)機(jī); 在第一交換機(jī)處接收來(lái)自第二交換機(jī)的暫停請(qǐng)求,所述暫停請(qǐng)求用于請(qǐng)求暫停發(fā)送與所述暫停請(qǐng)求中所標(biāo)識(shí)的流相對(duì)應(yīng)的分組;以及 跳過(guò)所述暫停請(qǐng)求中所標(biāo)識(shí)的流的時(shí)機(jī),直至已從第二交換機(jī)接收到對(duì)所述流的恢復(fù)請(qǐng)求。
8.如權(quán)利要求4所述的方法,其特征在于,還包括樂(lè)觀地從第一交換機(jī)經(jīng)由所述隧穿子路徑向第二交換機(jī)轉(zhuǎn)發(fā)分組。
9.如權(quán)利要求4所述的方法,其特征在于,還包括: 接收來(lái)自第二交換機(jī)的對(duì)個(gè)體流類實(shí)施回壓的指示;以及 在第一交換機(jī)處扼制所述個(gè)體流類的傳輸速率。
10.如權(quán)利要求1所述的方法,其特征在于,第一和第二交換機(jī)被配置成促成確認(rèn)分組遞送,所述方法還包括: 從第一交換機(jī)向第二交換機(jī)發(fā)送分組; 引發(fā)超時(shí)時(shí)段,在所述超時(shí)時(shí)段期間未在第一交換機(jī)處接收到指示所述分組已在第二交換機(jī)處被成功接收的ACK分組;以及 從第一交換機(jī)向第二交換機(jī)重發(fā)所述分組, 其中所述ACK分組包括報(bào)頭,所述報(bào)頭包括ACK標(biāo)記。
11.如權(quán)利要求1所述的方法,其特征在于,還包括: 從第一交換機(jī)向第二交換機(jī)發(fā)送分組序列; 在第一交換機(jī)處接收從第二交換機(jī)發(fā)送的單個(gè)分組,所述單個(gè)分組指示所述序列中被第二交換機(jī)拒絕的一個(gè)或多個(gè)分組的序列號(hào);以及 用新序列號(hào)重發(fā)所述序列中被拒絕的所述一個(gè)或多個(gè)分組。
12.如權(quán)利要求1所述的方法,其特征在于,還包括: 在第一交換機(jī)處接收已從第三交換機(jī)沿第二子路徑轉(zhuǎn)發(fā)給第一交換機(jī)的第二分組,所述分組包括被第三交換機(jī)所前置的隧道報(bào)頭,所述第三交換機(jī)包括第一類型的交換機(jī);以及 從第二分組剝?nèi)ニ鏊淼缊?bào)頭。
13.如權(quán)利要求1所述的方法,其特征在于,所述網(wǎng)絡(luò)轉(zhuǎn)發(fā)協(xié)議包括網(wǎng)際協(xié)議。
14.如權(quán)利要求1所述的方法,其特征在于,所述網(wǎng)絡(luò)轉(zhuǎn)發(fā)協(xié)議包括以太網(wǎng)協(xié)議。
15.如權(quán)利要求1所述的方法,其特征在于,所述網(wǎng)絡(luò)轉(zhuǎn)發(fā)協(xié)議包括Infiniband協(xié)議。
16.一種交換機(jī)裝置,被配置成實(shí)現(xiàn)為網(wǎng)絡(luò)中的包括第一類型的交換機(jī)的第一交換機(jī),所述網(wǎng)絡(luò)包括多個(gè)第一類型的交換機(jī),所述多個(gè)第一類型的交換機(jī)穿插在多個(gè)不包括第一類型的交換機(jī)的諸個(gè)中間網(wǎng)絡(luò)元件之間,所述交換機(jī)裝置包括: 主板,具有操作地耦合到它的多個(gè)組件,包括 至少一個(gè)處理器; 存儲(chǔ)器; 多個(gè)輸入和輸出端口 ;以及 其中存儲(chǔ)有指令的至少一個(gè)存儲(chǔ)設(shè)備,所述指令被配置成由所述至少一個(gè)處理器執(zhí)行以使得所述交換機(jī)裝置當(dāng)在所述網(wǎng)絡(luò)中操作時(shí)執(zhí)行操作,包括: 在輸入端口處接收具有包括第一分組報(bào)頭的原始格式的分組,所述第一分組報(bào)頭對(duì)應(yīng)于由所述網(wǎng)絡(luò)采用的網(wǎng)絡(luò)轉(zhuǎn)發(fā)協(xié)議且包括與通信地耦合至所述網(wǎng)絡(luò)的目的地端點(diǎn)設(shè)備相對(duì)應(yīng)的目的地地址; 確定從所述交換機(jī)裝置到所述目的地端點(diǎn)設(shè)備的通過(guò)所述交換機(jī)裝置與包括第一類型的交換機(jī)的第二交換機(jī)之間的子路徑轉(zhuǎn)發(fā)的路線,所述子路徑包括所述交換機(jī)裝置和第二交換機(jī)之間的至少一個(gè)中間網(wǎng)絡(luò)元件; 向所述原始分組格式前置第二分組報(bào)頭以形成新分組,所述第二網(wǎng)絡(luò)協(xié)議分組報(bào)頭包括對(duì)應(yīng)于所述交換機(jī)裝置的地址的源地址,并包括對(duì)應(yīng)于第二交換機(jī)的地址的目的地地址,其中所述第二分組報(bào)頭的格式的至少一部分對(duì)應(yīng)于所述網(wǎng)絡(luò)轉(zhuǎn)發(fā)協(xié)議的分組報(bào)頭;以及 從所述交換機(jī)裝置經(jīng)由輸出端口向沿所述子路徑的第一中間網(wǎng) 絡(luò)元件轉(zhuǎn)發(fā)所述新分組。
17.如權(quán)利要求16所述的交換機(jī)裝置,其特征在于,所述指令在由所述至少一個(gè)處理器執(zhí)行時(shí)被配置成執(zhí)行進(jìn)一步操作,包括: 在一個(gè)或多個(gè)輸入端口處接收多個(gè)分組; 將所述多個(gè)分組中的分組指派給相關(guān)聯(lián)的分組流,所述相關(guān)聯(lián)的分組流包括多個(gè)流類;以及 將與所述多個(gè)分組流相關(guān)聯(lián)的分組作為經(jīng)由所述交換機(jī)裝置和第二交換機(jī)之間的所述子路徑所隧穿的復(fù)用流進(jìn)行轉(zhuǎn)發(fā)。
18.如權(quán)利要求17所述的交換機(jī)裝置,其特征在于,所述指令在由所述至少一個(gè)處理器執(zhí)行時(shí)被配置成執(zhí)行進(jìn)一步操作,包括: 接收來(lái)自第二交換機(jī)的與分組流相關(guān)聯(lián)的第一分組流信用準(zhǔn)予; 將對(duì)應(yīng)于所述分組流信用準(zhǔn)予且與所述分組流相關(guān)聯(lián)的數(shù)個(gè)分組經(jīng)由所述子路徑從所述交換機(jī)裝置轉(zhuǎn)發(fā)給第二交換機(jī);以及 等待直至接收到與所述分組流相關(guān)聯(lián)的第二分組流信用準(zhǔn)予后轉(zhuǎn)發(fā)與所述分組流相關(guān)聯(lián)的附加分組。
19.如權(quán)利要求17所述的交換機(jī)裝置,其特征在于,所述指令在由所述至少一個(gè)處理器執(zhí)行時(shí)被配置成執(zhí)行進(jìn)一步操作,包括: 使用基于循環(huán)的方案經(jīng)由所述子路徑向第二交換機(jī)發(fā)送分組,其中每個(gè)流類針對(duì)每一輪被分配一時(shí)機(jī); 接收來(lái)自第二交換機(jī)的關(guān)于給定分組流的分組已被拒絕的指示;以及 在所述給定分組流的后續(xù)時(shí)機(jī)期間重發(fā)被拒絕的分組。
20.如權(quán)利要求17所述的交換機(jī)裝置,其特征在于,所述指令在由所述至少一個(gè)處理器執(zhí)行時(shí)被配置成執(zhí)行進(jìn)一步操作,包括: 使用基于循環(huán)的方案經(jīng)由所述子路徑向第二交換機(jī)發(fā)送分組,其中每個(gè)流類針對(duì)每一輪被分配一時(shí)機(jī); 接收來(lái)自第二交換機(jī)的暫停請(qǐng)求,所述暫停請(qǐng)求用于請(qǐng)求暫停發(fā)送與所述暫停請(qǐng)求中所標(biāo)識(shí)的流相對(duì)應(yīng)的分組;以及 跳過(guò)所述暫停請(qǐng)求中所標(biāo)識(shí)的分組流的時(shí)機(jī),直至已從第二交換機(jī)接收到對(duì)所述分組流的恢復(fù)請(qǐng)求。
21.如權(quán)利要求17所述的交換機(jī)裝置,其特征在于,所述指令在由所述至少一個(gè)處理器執(zhí)行時(shí)被配置成執(zhí)行進(jìn)一步操作,包括機(jī)樂(lè)觀地從所述交換機(jī)裝置經(jīng)由所述隧穿子路徑向第二交換機(jī)轉(zhuǎn)發(fā)分組。
22.如權(quán)利要求17所述的交換機(jī)裝置,其特征在于,所述指令在由所述至少一個(gè)處理器執(zhí)行時(shí)被配置成執(zhí)行進(jìn)一步操作,包括: 接收來(lái)自第二交換機(jī)的對(duì)個(gè)體流類實(shí)施回壓的指示;以及 在所述交換機(jī)裝置處扼制所述個(gè)體流類的傳輸速率。
23.如權(quán)利要求17所述的交換機(jī)裝置,其特征在于,第二分組報(bào)頭包括隧道報(bào)頭,所述隧道報(bào)頭包括含網(wǎng)絡(luò)轉(zhuǎn)發(fā)協(xié)議報(bào)頭的第一部分以及含一個(gè)或多個(gè)報(bào)頭信息字段的第二部分。
24.如權(quán)利要求23所述的交換機(jī)裝置,其特征在于,所述交換機(jī)裝置和第二交換機(jī)被配置成促成確認(rèn)分組遞送,且其中所述指令在由所述至少一個(gè)處理器執(zhí)行時(shí)被配置成執(zhí)行進(jìn)一步操作,包括: 經(jīng)由所述子路徑向第二交換機(jī)發(fā)送分組; 引發(fā)超時(shí)時(shí)段,在所述超時(shí)時(shí)段期間未在所述交換機(jī)裝置處接收到指示所述分組已在第二交換機(jī)處被成功接收的ACK分組;以及 經(jīng)由所述子路徑向第二交換機(jī)重發(fā)所述分組, 其中所述ACK分組包括隧道報(bào)頭,所述隧道報(bào)頭包括ACK標(biāo)記。
25.如權(quán)利要求17所述的交換機(jī)裝置,其特征在于,所述交換機(jī)裝置和第二交換機(jī)被配置成促成確認(rèn)分組遞送,且其中所述指令在由所述至少一個(gè)處理器執(zhí)行時(shí)被配置成執(zhí)行進(jìn)一步操作,包括: 從所述交換機(jī)裝置向第二交換機(jī)發(fā)送分組序列; 在所述交換機(jī)裝置處接收從第二交換機(jī)發(fā)送的單個(gè)分組,所述單個(gè)分組指示所述序列中被第二交換機(jī)拒絕的一個(gè)或多個(gè)分組的序列號(hào);以及 用新序列號(hào)重發(fā)所述序列中被拒絕的所述一個(gè)或多個(gè)分組。
26.如權(quán)利要求17所述的交換機(jī)裝置,其特征在于,所述指令在由所述至少一個(gè)處理器執(zhí)行時(shí)被配置成執(zhí)行進(jìn)一步操作,包括: 接收第二分組; 確定第二分組已從包括第一類型的交換機(jī)的第三交換機(jī)沿第二子路徑被轉(zhuǎn)發(fā)給所述交換機(jī)裝置,所述分組包括被第三交換機(jī)前置的隧道報(bào)頭;以及 從第二分組剝?nèi)ニ鏊淼缊?bào)頭。
27.—種網(wǎng)絡(luò),包括經(jīng)由多條鏈路互連的多個(gè)網(wǎng)絡(luò)交換機(jī),所述網(wǎng)絡(luò)交換機(jī)包括多個(gè)第一類型的交換機(jī),所述多個(gè)第一類型的交換機(jī)穿插在不是第一類型的交換機(jī)的諸個(gè)交換機(jī)之間,其中第一類型的交換機(jī)被配置成針對(duì)每一跳以帶有錯(cuò)誤恢復(fù)的逐跳方式經(jīng)由沿各對(duì)第一類型的交換機(jī)之間的隧穿子路徑的復(fù)用流來(lái)路由分組,其中所述隧穿子路徑包括經(jīng)過(guò)各對(duì)第一類型的交換機(jī)之間的不包括第一類型的交換機(jī)的一個(gè)或多個(gè)交換機(jī)的路由路徑。
28.如權(quán)利要求27所述的網(wǎng)絡(luò),其特征在于,第一類型的交換機(jī)中的至少一部分被配置成對(duì)沿所選子路徑的所選分組流采用基于信用的流控制,其中對(duì)于基于信用的流,源第一類型的交換機(jī)除非接收到對(duì)流類的流信用準(zhǔn)予否則不向目的地第一類型的交換機(jī)發(fā)送所述流類的分組。
29.如權(quán)利要求27所述的網(wǎng)絡(luò),其特征在于,第一類型的交換機(jī)中的至少一部分被配置成針對(duì)沿第一類型的交換機(jī)之間的子路徑所復(fù)用的一個(gè)或多個(gè)分組流促成暫停-恢復(fù)流管理方案。
30.如權(quán)利要求27所述的網(wǎng)絡(luò),其特征在于,第一類型的交換機(jī)中的至少一部分被配置成使用隧道消息中的確認(rèn)標(biāo)記來(lái)促成從包括第一類型的交換機(jī)的第一交換機(jī)經(jīng)由子路徑發(fā)送給包括第一類型的交換機(jī)的第二交換機(jī)的分組的確認(rèn)遞送。
【文檔編號(hào)】H04W40/12GK104205942SQ201380004571
【公開日】2014年12月10日 申請(qǐng)日期:2013年6月20日 優(yōu)先權(quán)日:2012年11月19日
【發(fā)明者】R·帕爾曼 申請(qǐng)人:英特爾公司