專利名稱:網(wǎng)絡系統(tǒng)的廣播處理方法及網(wǎng)絡系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種在經(jīng)由網(wǎng)絡連接多個節(jié)點的網(wǎng)絡系統(tǒng)中從一節(jié)點到多個其它節(jié)點執(zhí)行廣播的廣播處理方法及網(wǎng)絡系統(tǒng),特別是涉及一種在每一節(jié)點中使用多個網(wǎng)絡適配器來進行有效廣播的網(wǎng)絡系統(tǒng)的廣播處理方法及該網(wǎng)絡系統(tǒng)。
背景技術(shù):
隨著對計算機系統(tǒng)更高速度的需求,提出一種網(wǎng)絡類型計算機系統(tǒng),在該系統(tǒng)中安裝并且經(jīng)由網(wǎng)絡連接包括計算機的多個節(jié)點。例如,在并行計算機領(lǐng)域中,數(shù)據(jù)通過多個節(jié)點并行計算,并且已處理的數(shù)據(jù)經(jīng)由網(wǎng)絡進行交換。如果規(guī)模變大,則這種并行計算機具有成百上千個節(jié)點。
在這種網(wǎng)絡系統(tǒng)中,一個節(jié)點的數(shù)據(jù)經(jīng)由網(wǎng)絡被傳送到多個其它節(jié)點。這種處理稱為“廣播處理”。在這種廣播處理中,有時要傳送大量數(shù)據(jù),所以期望減少傳送處理時間。
圖11和圖12是表示第一現(xiàn)有技術(shù)網(wǎng)絡系統(tǒng)的廣播處理的示意圖。如圖11所示,多個(在此情況下是四個)節(jié)點100、101、102和103經(jīng)由網(wǎng)絡連接,所述網(wǎng)絡沒有示出。這些節(jié)點100、101、102和103中的每一個具有多個(在此情況下是三個)網(wǎng)絡適配器110A、110B和110C,以使得能夠并行傳送。
在這種配置中,如果一節(jié)點100將數(shù)據(jù)廣播到其它三個節(jié)點101、102和103,則從節(jié)點100的網(wǎng)絡適配器110A、110B和110C將所有傳送數(shù)據(jù)并行傳送到每一節(jié)點101、102和103的相應的網(wǎng)絡適配器110A、110B和110C。
例如,如圖12所示,如果將12個數(shù)據(jù)塊D0至D11的傳送數(shù)據(jù)從節(jié)點100傳送到其它三個節(jié)點101、102和103,則12個數(shù)據(jù)塊D0至D11將分別從節(jié)點100的網(wǎng)絡適配器110A傳送到節(jié)點101的網(wǎng)絡適配器110A,從節(jié)點100的網(wǎng)絡適配器110B傳送到節(jié)點102的網(wǎng)絡適配器110B,以及從節(jié)點100的網(wǎng)絡適配器110C傳送到節(jié)點103的網(wǎng)絡適配器110C。
按照這種方式,根據(jù)第一現(xiàn)有技術(shù),通過對具有多個傳送信道(網(wǎng)絡適配器)的每一節(jié)點100、101、102和103進行并行傳送來減少廣播處理所需的時間。
圖13和圖14是示出第二現(xiàn)有技術(shù)網(wǎng)絡系統(tǒng)的廣播處理。根據(jù)這種方法,當在分別具有多個網(wǎng)絡適配器的各節(jié)點中廣播數(shù)據(jù)時,如同圖11,發(fā)送源節(jié)點100分割發(fā)送數(shù)據(jù),并從每一網(wǎng)絡適配器將其傳送。
換句話說,如圖13和圖14所示,發(fā)送源節(jié)點100將發(fā)送數(shù)據(jù)塊D0至D11分割成三部分,并且從節(jié)點100的三個網(wǎng)絡適配器110A、110B和110C將分割的數(shù)據(jù)塊傳送到節(jié)點102的網(wǎng)絡適配器110A、110B和110C,如標記(1)所示。
由于存在保有發(fā)送數(shù)據(jù)的兩個節(jié)點,所以發(fā)送節(jié)點100將分割成三部分的數(shù)據(jù)塊中的每個數(shù)據(jù)塊從節(jié)點100的三個網(wǎng)絡適配器110A、110B和110C發(fā)送到節(jié)點101的網(wǎng)絡適配器110A、110B和110C,如標記(2)所示。同時,節(jié)點102將從節(jié)點100接收的分割后的數(shù)據(jù)塊中的每個數(shù)據(jù)塊從節(jié)點102的三個網(wǎng)絡適配器110A、110B和110C發(fā)送到節(jié)點103的網(wǎng)絡適配器110A、110B和110C,如標記(3)所示。
如果傳送數(shù)據(jù)長度很長,則通常廣播處理時間與網(wǎng)絡傳播的數(shù)據(jù)量成比例,所以對于第一現(xiàn)有技術(shù)而言需要傳送12個塊的處理時間,但是在第二現(xiàn)有技術(shù)中,數(shù)據(jù)塊分割成三部分,并且被傳送兩次,所以需要四個數(shù)據(jù)塊的傳送時間的兩倍,換句話說,處理時間變成僅僅是第一現(xiàn)有技術(shù)的處理時間的8/12=2/3(參見例如日本專利申請H7-244648)。
然而,在第二現(xiàn)有技術(shù)的情況下,為了廣播數(shù)據(jù),在第一傳送中節(jié)點102保有廣播源節(jié)點100的傳送數(shù)據(jù)的副本,并且在第二傳送中,從發(fā)送源和副本目的地的兩個節(jié)點(即,節(jié)點100和102)將全部傳送數(shù)據(jù)傳送到節(jié)點101和103。
所以,在第二現(xiàn)有技術(shù)中,廣播處理時間受到限制,尤其是當數(shù)據(jù)傳送長度很長時,難以減少廣播處理時間。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的一個目的在于提供一種用于減少廣播處理時間的網(wǎng)絡系統(tǒng)的廣播處理方法及網(wǎng)絡系統(tǒng)。
本發(fā)明的另一目的在于提供一種通過減少廣播處理時間來提高并行計算性能的網(wǎng)絡系統(tǒng)的廣播處理方法及網(wǎng)絡系統(tǒng)。
本發(fā)明的再一目的在于提供一種即使在傳送數(shù)據(jù)長度很長的情況下也能夠減少廣播處理時間的網(wǎng)絡系統(tǒng)的廣播處理方法及網(wǎng)絡系統(tǒng)。
為了實現(xiàn)這些目的,本發(fā)明的網(wǎng)絡系統(tǒng)具有三個或更多節(jié)點,每個節(jié)點具有多個網(wǎng)絡適配器;和縱橫交換器,用于連接每個所述節(jié)點的網(wǎng)絡適配器。并且,所述節(jié)點中的一個節(jié)點將待傳送到所述節(jié)點中的多個其它節(jié)點的數(shù)據(jù)分割成多個數(shù)據(jù),并且經(jīng)由不同的網(wǎng)絡適配器將每個分割后數(shù)據(jù)分別傳送到所述多個其它節(jié)點,并且,接收到所述分割后數(shù)據(jù)的所述多個其它節(jié)點中的每個節(jié)點將接收到的所述分割后數(shù)據(jù)經(jīng)由所述網(wǎng)絡適配器傳送到?jīng)]有接收到所述分割后數(shù)據(jù)的其它節(jié)點。
本發(fā)明的廣播處理方法是一種網(wǎng)絡系統(tǒng)的廣播處理方法,用于將數(shù)據(jù)從具有多個網(wǎng)絡適配器的一個節(jié)點廣播到多個其它節(jié)點,所述多個其它節(jié)點中的每個節(jié)點均具有多個網(wǎng)絡適配器,該方法包括如下步驟分割步驟,其中所述一個節(jié)點將待傳送到所述多個其它節(jié)點的數(shù)據(jù)分割成多個數(shù)據(jù);第一傳送步驟,其中將每個分割后數(shù)據(jù)分別經(jīng)由不同的網(wǎng)絡適配器從所述一個節(jié)點傳送到所述多個其它節(jié)點;和第二傳送步驟,其中將接收到的所述分割后數(shù)據(jù)經(jīng)由所述網(wǎng)絡適配器從接收到所述分割后數(shù)據(jù)的所述多個其它節(jié)點中的每個節(jié)點傳送到?jīng)]有接收到所述分割后數(shù)據(jù)的其它節(jié)點。
在本發(fā)明中,優(yōu)選地,所述多個其它節(jié)點中的每個節(jié)點從所述一個節(jié)點接收所述分割后數(shù)據(jù),并且將先前接收到的分割后數(shù)據(jù)經(jīng)由所述網(wǎng)絡適配器傳送到?jīng)]有接收到所述分割后數(shù)據(jù)的其它節(jié)點。
另外,在本發(fā)明中,優(yōu)選地,所述一個節(jié)點將待傳送的數(shù)據(jù)除以一除數(shù)來進行分割,以產(chǎn)生所述分割后數(shù)據(jù),其中該除數(shù)基于所述網(wǎng)絡適配器的數(shù)量而得。
另外,在本發(fā)明中,優(yōu)選地,所述一個節(jié)點將所述分割后數(shù)據(jù)傳送到其數(shù)量與所述網(wǎng)絡適配器數(shù)量相同的所述多個節(jié)點。
另外,在本發(fā)明中,優(yōu)選地,所述一個節(jié)點將數(shù)據(jù)除以一除數(shù)來進行分割,以產(chǎn)生所述分割后數(shù)據(jù),其中該除數(shù)基于網(wǎng)絡適配器的數(shù)量以及傳送次數(shù)而得。
另外,在本發(fā)明中,優(yōu)選地,所述多個其它節(jié)點中的每個節(jié)點將接收到的所述分割后數(shù)據(jù)經(jīng)由為防止各所述網(wǎng)絡適配器重疊使用而在所述多個節(jié)點中預先確定的網(wǎng)絡適配器傳送到?jīng)]有接收到所述分割后數(shù)據(jù)的其它節(jié)點。
另外,在本發(fā)明中,優(yōu)選地,所述多個其它節(jié)點數(shù)量是三個或更多。
另外,在本發(fā)明中,優(yōu)選地,所述網(wǎng)絡適配器中的每個網(wǎng)絡適配器經(jīng)由網(wǎng)絡與所述縱橫交換器連接。
另外,在本發(fā)明中,優(yōu)選地,所述節(jié)點中每個節(jié)點均具有至少一個CPU;存儲器;和所述多個網(wǎng)絡適配器。
另外,在本發(fā)明中,優(yōu)選地,所述多個節(jié)點中的每個節(jié)點均包括用于執(zhí)行并行計算的并行計算機系統(tǒng)。
根據(jù)本發(fā)明,在傳送源的節(jié)點分割待廣播的傳送數(shù)據(jù),并且傳送源節(jié)點將每個分割后數(shù)據(jù)單獨傳送到多個其它節(jié)點,然后,接收到分割后數(shù)據(jù)的節(jié)點將接收到的數(shù)據(jù)傳送到除了傳送源節(jié)點之外的節(jié)點。因此,在第二數(shù)據(jù)傳送中,更多的節(jié)點(網(wǎng)絡適配器)參與到數(shù)據(jù)傳送中,從而能夠?qū)崿F(xiàn)高速的傳送處理,并且可減少在廣播期間的傳送處理時間。
圖1是表示根據(jù)本發(fā)明實施例的網(wǎng)絡系統(tǒng)的框圖;圖2是表示圖1中的節(jié)點的框圖;圖3是表示圖1和圖2中的網(wǎng)絡適配器的框圖;圖4是表示圖1中的發(fā)送幀的格式的示意圖;圖5是表示根據(jù)本發(fā)明第一實施例的廣播處理的示意圖;圖6是表示根據(jù)圖5中第一實施例的數(shù)據(jù)流的示意圖;圖7是表示根據(jù)圖5中第一實施例的傳送源節(jié)點的處理流程圖;
圖8是表示根據(jù)圖5中第一實施例的發(fā)送目的節(jié)點的處理流程圖;圖9是表示根據(jù)本發(fā)明第二實施例的廣播處理的示意圖;圖10是表示根據(jù)本發(fā)明第三實施例的廣播處理的示意圖;圖11是表示根據(jù)第一現(xiàn)有技術(shù)的廣播處理的示意圖;圖12是表示圖11中的數(shù)據(jù)流的示意圖;圖13是表示根據(jù)第二現(xiàn)有技術(shù)的廣播處理的示意圖;和圖14是表示圖13中的數(shù)據(jù)流的示意圖。
具體實施例方式
以下按網(wǎng)絡系統(tǒng)配置、第一實施例、第二實施例、第三實施例和其它實施例的順序來描述本發(fā)明的實施方式,但是本發(fā)明不限于這些實施例。
網(wǎng)絡系統(tǒng)配置圖1是表示本發(fā)明的網(wǎng)絡系統(tǒng)實施例的框圖,圖2是表示圖1中的節(jié)點的框圖,圖3是表示圖1和圖2中的網(wǎng)絡適配器的框圖,以及圖4是表示圖1中的網(wǎng)絡系統(tǒng)的幀格式的示意圖。
如圖1所示,該網(wǎng)絡系統(tǒng)具有多個(在本實施例中是四個)節(jié)點10、11、12和13,以及三個縱橫交換器(圖中的SWA、SWB和SWC)20、21和22。每一節(jié)點10、11、12和13具有三個網(wǎng)絡適配器(圖中的A、B和C)14A、14B和14C。
由于每一節(jié)點10、11、12和13具有三個網(wǎng)絡適配器14A、14B和14C,所以安裝了三個縱橫交換器20、21和22。換句話說,每一節(jié)點10、11、12和13的每一網(wǎng)絡適配器14A、14B和14C與相應的縱橫交換器20、21和22相連。
如圖2所示,上述節(jié)點10(11、12、13)是計算機,其中,CPU 40、存儲器44、IO適配器46和上述網(wǎng)絡適配器14A至14C經(jīng)由系統(tǒng)控制器42相連。根據(jù)節(jié)點所需的處理能力,CPU 40、存儲器44和IO適配器46的數(shù)目可以多于一個。
如圖3所示,在圖1和圖2中的網(wǎng)絡適配器14A(14B、14C)包括主機接口控制電路50,其與系統(tǒng)控制器42相連;發(fā)送控制電路52;網(wǎng)絡接口控制電路54,其與縱橫交換器20、21和22相連;以及接收控制電路56。網(wǎng)絡適配器14A(14B、14C)負責節(jié)點之間的數(shù)據(jù)通信。
當經(jīng)由網(wǎng)絡適配器14A(14B、14C)在節(jié)點之間傳送數(shù)據(jù)時,以圖4所示的幀格式來執(zhí)行通信。圖4所示的幀格式是用于以太網(wǎng)(注冊商標)的幀格式,包括目的地地址、發(fā)送源地址、幀類型(例如,指令類型、數(shù)據(jù)大小)、數(shù)據(jù)和幀校驗和(例如,CRC(循環(huán)冗余碼))。數(shù)據(jù)區(qū)域的數(shù)據(jù)長度(大小)是可變的,并且在必要時將節(jié)點之間待傳送的數(shù)據(jù)分割成多個幀來傳送。
第一實施例圖5是表示本發(fā)明的廣播處理第一實施例的示意圖,圖6是表示圖5中廣播傳送的數(shù)據(jù)流的示意圖,圖7是表示圖5中數(shù)據(jù)傳送源節(jié)點的處理的流程圖,以及圖8是表示數(shù)據(jù)接收源節(jié)點的處理的流程圖。
如圖5所示,節(jié)點10分割發(fā)送塊,并經(jīng)由單獨的網(wǎng)絡適配器14A、14B和14C將分割后的發(fā)送塊傳送到每一節(jié)點11、12和13,如標記(1)所示。然后,接收到數(shù)據(jù)的每一節(jié)點11、12和13將接收到的分割后數(shù)據(jù)傳送到?jīng)]有接收到分割后數(shù)據(jù)的多個節(jié)點,如標記(2)所示。
使用傳送與圖13和圖14中相同的數(shù)據(jù)傳送量的實例,參照圖6來描述這種數(shù)據(jù)傳送。換句話說,將描述當節(jié)點10將12個數(shù)據(jù)塊D0至D11廣播到其它三個節(jié)點11、12和13時的實例。第一節(jié)點10將12個數(shù)據(jù)塊D0至D11分割成四部分。將三部分數(shù)據(jù)塊D0至D2、D3至D5和D6至D8從節(jié)點10的每一網(wǎng)絡適配器14A、14B和14C分別傳送到節(jié)點11、12和13的相應網(wǎng)絡適配器14A、14B和14C。
接收到三個數(shù)據(jù)塊D0至D2的節(jié)點11將接收到的三個數(shù)據(jù)塊D0至D2從兩個網(wǎng)絡適配器14A和14B傳送到?jīng)]有接收到數(shù)據(jù)D0至D2的節(jié)點12和13的網(wǎng)絡適配器14A和14B。
以同樣的方式,接收到三個數(shù)據(jù)塊D3至D5的節(jié)點12將接收到的三個數(shù)據(jù)塊D3至D5從兩個網(wǎng)絡適配器14A和14C傳送到?jīng)]有接收到數(shù)據(jù)D3至D5的節(jié)點11和13的網(wǎng)絡適配器14A和14C。
接收到三個數(shù)據(jù)塊D6至D8的節(jié)點13將接收到的三個數(shù)據(jù)塊D6至D8從網(wǎng)絡適配器14B和14C傳送到?jīng)]有接收到數(shù)據(jù)D6至D8的節(jié)點11和12的網(wǎng)絡適配器14B和14C。
與此同時,節(jié)點10將在第一傳送中沒有傳送的剩余三個數(shù)據(jù)塊D9至D11從三個網(wǎng)絡適配器14A、14B和14C傳送到節(jié)點11、12和13的網(wǎng)絡適配器14A、14B和14C。
以這樣的方式,傳送源節(jié)點10將待廣播的傳送數(shù)據(jù)進行分割,并且將每一分割后的數(shù)據(jù)從節(jié)點10單獨傳送到節(jié)點11、12和13,然后,節(jié)點10將剩余數(shù)據(jù)傳送到每一節(jié)點11、12和13。與此同時,節(jié)點11、12和13將接收到的數(shù)據(jù)傳送到除了節(jié)點10之外的節(jié)點11、12和13。
以這樣的方式,根據(jù)本發(fā)明,在第二數(shù)據(jù)傳送中,更多的節(jié)點(網(wǎng)絡適配器)參與到數(shù)據(jù)傳送中,從而可實現(xiàn)高速的傳送處理,并且可減少在廣播期間的傳送處理時間。
換句話說,根據(jù)上述的第二現(xiàn)有技術(shù),在第一傳送中,將全部數(shù)據(jù)從傳送源節(jié)點100傳送到另一節(jié)點102,并且在第二傳送中,將全部數(shù)據(jù)從具有全部數(shù)據(jù)的兩節(jié)點100和102傳送到其它兩節(jié)點101和103,所以在第二傳送中,六個網(wǎng)絡適配器參與到傳送操作中。
而在本實施例的情況下,在第一傳送中,將分割成四部分的數(shù)據(jù)從傳送源節(jié)點10傳送到其它三個節(jié)點11、12和13,并且在第二傳送中,將必要數(shù)據(jù)從所有節(jié)點10、11、12和13傳送到其它三節(jié)點11、12和13,所以在第二傳送中,九個網(wǎng)絡適配器參與到傳送操作中。如果待傳送的總數(shù)據(jù)量相同,則由于更多網(wǎng)絡適配器傳送數(shù)據(jù),所以本實施例數(shù)據(jù)傳送完成的更快。
換句話說,在第一數(shù)據(jù)傳送中分割數(shù)據(jù),并且將分割后的數(shù)據(jù)單獨傳送到多個節(jié)點,從而更多節(jié)點可參與到第二數(shù)據(jù)傳送中。并且每一節(jié)點將接收到的分割后數(shù)據(jù)傳送到?jīng)]有接收到該數(shù)據(jù)的節(jié)點。
例如,比較第一和第二現(xiàn)有技術(shù)和本發(fā)明實施例之間的針對整個網(wǎng)絡的總傳送量的傳送時間,第一現(xiàn)有技術(shù)是總傳送量×1=1,第二現(xiàn)有技術(shù)是總傳送量÷3×2=2/3,本發(fā)明是總傳送量÷4×2=1/2。因此,在本發(fā)明實施例中,可以以第一現(xiàn)有技術(shù)的時間的1/2來執(zhí)行廣播傳送,以及以第二現(xiàn)有技術(shù)的時間的3/4來執(zhí)行廣播傳送。
在本實施例中,在第二傳送中,選擇發(fā)送網(wǎng)絡適配器和接收網(wǎng)絡適配器的傳送關(guān)聯(lián)以防止網(wǎng)絡適配器的重疊。例如,在第二傳送中,當節(jié)點10與節(jié)點11的網(wǎng)絡適配器14A、節(jié)點12的網(wǎng)絡適配器14B以及節(jié)點13的網(wǎng)絡適配器14C執(zhí)行數(shù)據(jù)傳送時,則節(jié)點11與節(jié)點12的網(wǎng)絡適配器14A和節(jié)點13的網(wǎng)絡適配器14B執(zhí)行數(shù)據(jù)傳送,節(jié)點12與節(jié)點11的網(wǎng)絡適配器14C和節(jié)點13的網(wǎng)絡適配器14A執(zhí)行數(shù)據(jù)傳送,以及節(jié)點13與節(jié)點11的網(wǎng)絡適配器14B和節(jié)點12的網(wǎng)絡適配器14C執(zhí)行數(shù)據(jù)傳送。
這樣,可防止網(wǎng)絡適配器的重疊。
圖7是表示傳送源節(jié)點的處理的流程圖。
(S10)傳送源節(jié)點10的CPU 40將廣播數(shù)據(jù)塊分割成多個傳送塊。如果除數(shù)是傳送目的地節(jié)點的數(shù)目或網(wǎng)絡適配器的數(shù)目,則第二傳送的上述效果可被最大程度地展現(xiàn)。
(S12)然后,傳送源節(jié)點10的CPU 40指示網(wǎng)絡適配器14A、14B和14C將分割后的傳送塊傳送到單獨的節(jié)點11、12和13。由此,節(jié)點10的網(wǎng)絡適配器14A、14B和14C將分割后的傳送塊傳送到節(jié)點11的網(wǎng)絡適配器14A、節(jié)點12的網(wǎng)絡適配器14B和節(jié)點13的網(wǎng)絡適配器14C。
圖8是表示接收源節(jié)點的處理的流程圖。
(S20)當接收到廣播塊時,接收源節(jié)點11、12和13通過幀的幀類型(參見圖4)來識別廣播數(shù)據(jù)。
(S22)接收源節(jié)點11、12和13檢查所述幀的目的地地址和發(fā)送源地址(參見圖4),并決定除此之外的傳送目的地。
(S24)每一接收源節(jié)點11、12和13將接收到的傳送塊傳送到傳送目的地,所述傳送目的地是應該將該傳送塊傳送到的節(jié)點。此時,使用在每一節(jié)點中預先確定的網(wǎng)絡適配器來防止網(wǎng)絡適配器的重疊使用。
以此方式,通過由各節(jié)點10、11、12和13的CPU來分割數(shù)據(jù)以及執(zhí)行傳送處理可容易地減少廣播傳送時間。
第二實施例圖9是表示根據(jù)本發(fā)明第二實施例的廣播處理的示意圖。
在本實施例中,通過重疊在第一實施例中的兩次數(shù)據(jù)傳送以更高的速度來執(zhí)行廣播處理。圖9是當節(jié)點10將10個數(shù)據(jù)的塊D0至D9廣播到其它三個節(jié)點11、12和13時的實例。
首先,節(jié)點10將待廣播的數(shù)據(jù)分割成10塊,D0至D9。將每一數(shù)據(jù)塊D0、D3和D6從節(jié)點10的每一網(wǎng)絡適配器14A、14B和14C傳送到節(jié)點11、12和13的相應網(wǎng)絡適配器14A、14B和14C。
在第二傳送中,將每一數(shù)據(jù)塊D1、D4和D7從節(jié)點10的每一網(wǎng)絡適配器14A、14B和14C傳送到節(jié)點11、12和13的相應網(wǎng)絡適配器14A、14B和14C。
同時,接收到一數(shù)據(jù)塊D0的節(jié)點11將接收到的一數(shù)據(jù)塊D0從兩網(wǎng)絡適配器14A和14B傳送到?jīng)]有接收到數(shù)據(jù)D0的節(jié)點12和13的網(wǎng)絡適配器14A和14B。
以同樣的方式,接收到一數(shù)據(jù)塊D3的節(jié)點12將接收到的一數(shù)據(jù)塊D3從兩網(wǎng)絡適配器14A和14C傳送到?jīng)]有接收到數(shù)據(jù)D3的節(jié)點13和11的網(wǎng)絡適配器14A和14C。
同樣,接收到一數(shù)據(jù)塊D6的節(jié)點13將接收到的一數(shù)據(jù)塊D6從兩個網(wǎng)絡適配器14B和14C傳送到?jīng)]有接收到數(shù)據(jù)D6的節(jié)點11和12的網(wǎng)絡適配器14B和14C。
在第三數(shù)據(jù)傳送中,將每一數(shù)據(jù)塊D2、D5和D8從節(jié)點10的每一網(wǎng)絡適配器14A、14B和14C傳送到節(jié)點11、12和13的相應網(wǎng)絡適配器14A、14B和14C。
同時,在第二傳送中接收到一數(shù)據(jù)塊D1的節(jié)點11將接收到的一數(shù)據(jù)塊D1從網(wǎng)絡適配器14A和14B傳送到?jīng)]有接收到數(shù)據(jù)D1的節(jié)點12和13的網(wǎng)絡適配器14A和14B。
以同樣的方式,接收到一數(shù)據(jù)塊D4的節(jié)點12將接收到的一數(shù)據(jù)塊D4從兩網(wǎng)絡適配器14A和14C傳送到?jīng)]有接收到數(shù)據(jù)D4的節(jié)點13和11的網(wǎng)絡適配器14A和14C。
另外,接收到一數(shù)據(jù)塊D7的節(jié)點13將接收到的一數(shù)據(jù)塊D7從兩個網(wǎng)絡適配器14B和14C傳送到?jīng)]有接收到數(shù)據(jù)D7的節(jié)點11和12的網(wǎng)絡適配器14B和14C。
在第四傳送中,將一數(shù)據(jù)塊D9從節(jié)點10的每一網(wǎng)絡適配器14A、14B和14C傳送到節(jié)點11、12和13的相應的網(wǎng)絡適配器14A、14B和14C。
同時,在第三傳送中接收到一數(shù)據(jù)塊D2的節(jié)點11將接收到的數(shù)據(jù)塊D2從兩網(wǎng)絡適配器14A和14B傳送到?jīng)]有接收到數(shù)據(jù)D2的節(jié)點12和13的網(wǎng)絡適配器14A和14B。
以同樣的方式,接收到一數(shù)據(jù)塊D5的節(jié)點12將接收到的一數(shù)據(jù)塊D5從兩網(wǎng)絡適配器14A和14C傳送到?jīng)]有接收到數(shù)據(jù)D5的節(jié)點13和11的網(wǎng)絡適配器14A和14C。
同樣,接收到一數(shù)據(jù)塊D8的節(jié)點13將接收到的一數(shù)據(jù)塊D8從兩網(wǎng)絡適配器14B和14C傳送沒有接收到數(shù)據(jù)D8的節(jié)點11和12的網(wǎng)絡適配器14B和14C。
以這樣的方式,傳送源節(jié)點10進一步分割待廣播的傳送數(shù)據(jù),從節(jié)點10將每一分割后的數(shù)據(jù)單獨傳送到節(jié)點11、12和13,然后,節(jié)點10在將剩余數(shù)據(jù)進行分割之后傳送到每一節(jié)點11、12和13,并且節(jié)點11、12和13將接收到的數(shù)據(jù)傳送到除了節(jié)點10之外的節(jié)點11、12和13。
在本實例中,傳送數(shù)據(jù)被再次分割,所以需要四次傳送,但是在第一實施例中的傳送時間是總傳送量÷4×2=2/4,其中傳送的次數(shù)是兩次,在第二實施例中,總傳送量÷10×4=4/10。因此,與第一實施例相比第二實施例中用于廣播所需的時間約為其4/5。
第三實施例圖10是表示根據(jù)本發(fā)明第三實施例的廣播處理的示意圖。在本實施例中,在包括節(jié)點0至節(jié)點15的16個節(jié)點的網(wǎng)絡系統(tǒng)中,將數(shù)據(jù)從節(jié)點0廣播到節(jié)點1至15,其中每個節(jié)點具有三個網(wǎng)絡適配器。
首先,以與四個節(jié)點0、4、8、12是目標節(jié)點的第一實施例同樣的方式,節(jié)點0將12個數(shù)據(jù)塊D0至D11分割成四部分。節(jié)點0的每一網(wǎng)絡適配器14A、14B和14C將三個數(shù)據(jù)塊D0至D2、D3至D5以及D6至D8中的每一個傳送到節(jié)點4、8和12的相應網(wǎng)絡適配器14A、14B和14C。
然后,開始第二數(shù)據(jù)傳送,其中,接收到三個數(shù)據(jù)塊D0至D2的節(jié)點4將接收到的三個數(shù)據(jù)塊D0至D2從兩網(wǎng)絡適配器14A和14B傳送到?jīng)]有接收到數(shù)據(jù)D0至D2的節(jié)點8和12的網(wǎng)絡適配器14A和14B。
以同樣的方式,接收到三個數(shù)據(jù)塊D3至D5的節(jié)點8將接收到的三個數(shù)據(jù)塊D3至D5從兩網(wǎng)絡適配器14A和14C傳送到?jīng)]有接收到數(shù)據(jù)D3至D5的節(jié)點4和12的網(wǎng)絡適配器14A和14C。
同樣,接收到三個數(shù)據(jù)塊D6至D8的節(jié)點12將接收到的三個數(shù)據(jù)塊D6至D8從兩網(wǎng)絡適配器14B和14C傳送到?jīng)]有接收到數(shù)據(jù)D6至D8的節(jié)點4和8的網(wǎng)絡適配器14B和14C。
同時,節(jié)點0將在第一傳送中沒有傳送的剩余三個數(shù)據(jù)塊D9至D11從三個網(wǎng)絡適配器14A、14B和14C傳送到節(jié)點4、8和12的網(wǎng)絡適配器14A、14B和14C。
通過這樣,如在第一實施例中所述,四個節(jié)點0、4、8和12保有12個數(shù)據(jù)塊。在第三傳送中,以與第一數(shù)據(jù)傳送同樣的方式,節(jié)點0對節(jié)點1至3執(zhí)行數(shù)據(jù)傳送操作,節(jié)點4對節(jié)點5至7、節(jié)點8對節(jié)點9至11以及節(jié)點12對節(jié)點13至15執(zhí)行數(shù)據(jù)傳送操作。
在第四數(shù)據(jù)傳送中,按節(jié)點0至3、4至7、8至11以及12至15為分組來執(zhí)行與第二數(shù)據(jù)傳送同樣的傳送操作。
以這樣的方式,在一傳送中可廣播的節(jié)點的最大數(shù)與網(wǎng)絡適配器的數(shù)量相同,并且如果節(jié)點數(shù)進一步增加,則以兩步驟、三步驟等執(zhí)行第二數(shù)據(jù)傳送,從而可廣播的節(jié)點數(shù)可以增加。在具有256個節(jié)點的網(wǎng)絡系統(tǒng)的情況下,執(zhí)行8次數(shù)據(jù)傳送。
其它實施例在以上實施例中,用具有四個節(jié)點的網(wǎng)絡系統(tǒng)來描述,但是本發(fā)明可被應用于具有三個或更多節(jié)點的網(wǎng)絡系統(tǒng)。上述的節(jié)點的配置是具有CPU、存儲器等的計算機單元,但是也可使用其它配置。
另外,所述網(wǎng)絡系統(tǒng)描述為并行計算機,但是本發(fā)明還可應用于其它分布式處理系統(tǒng)和通信系統(tǒng)。發(fā)送路徑的格式不限于以太網(wǎng)(注冊商標),而是也可應用其它網(wǎng)絡協(xié)議。
傳送源節(jié)點將待廣播的傳送數(shù)據(jù)進行分割,并且從傳送源節(jié)點將每一分割后的數(shù)據(jù)單獨傳送到多個其它節(jié)點,然后,接收到傳送數(shù)據(jù)的多個其它節(jié)點將接收到的數(shù)據(jù)傳送到除了傳送源節(jié)點之外的節(jié)點。以這樣的方式,在第二數(shù)據(jù)傳送中,更多節(jié)點(網(wǎng)絡適配器)可參與到數(shù)據(jù)傳送中,所以可實現(xiàn)高速傳送處理,并且可減少廣播的傳送處理時間。
權(quán)利要求
1.一種網(wǎng)絡系統(tǒng),包括三個或更多節(jié)點,每個節(jié)點具有多個網(wǎng)絡適配器;和縱橫交換器,用于連接每個所述節(jié)點的網(wǎng)絡適配器,其中,所述節(jié)點中的一個節(jié)點將待傳送到所述節(jié)點中的多個其它節(jié)點的數(shù)據(jù)分割成多個數(shù)據(jù),并且經(jīng)由不同的網(wǎng)絡適配器將每個分割后數(shù)據(jù)分別傳送到所述多個其它節(jié)點,并且,接收到所述分割后數(shù)據(jù)的所述多個其它節(jié)點中的每個節(jié)點將所接收到的所述分割后數(shù)據(jù)經(jīng)由所述網(wǎng)絡適配器傳送到?jīng)]有接收到所述分割后數(shù)據(jù)的其它節(jié)點。
2.根據(jù)權(quán)利要求1所述的網(wǎng)絡系統(tǒng),其中,所述多個其它節(jié)點中的每個節(jié)點從所述一個節(jié)點接收所述分割后數(shù)據(jù),并且將先前接收到的分割后數(shù)據(jù)經(jīng)由所述網(wǎng)絡適配器傳送到?jīng)]有接收到所述分割后數(shù)據(jù)的其它節(jié)點。
3.根據(jù)權(quán)利要求1所述的網(wǎng)絡系統(tǒng),其中,所述一個節(jié)點將待傳送的數(shù)據(jù)除以一除數(shù)來進行分割,以產(chǎn)生所述分割后數(shù)據(jù),其中該除數(shù)基于所述網(wǎng)絡適配器的數(shù)量而得。
4.根據(jù)權(quán)利要求1所述的網(wǎng)絡系統(tǒng),其中,所述一個節(jié)點將所述分割后數(shù)據(jù)傳送到其數(shù)量與所述網(wǎng)絡適配器數(shù)量相同的所述多個節(jié)點。
5.根據(jù)權(quán)利要求2所述的網(wǎng)絡系統(tǒng),其中,所述一個節(jié)點將待傳送的數(shù)據(jù)除以一除數(shù)來進行分割,以產(chǎn)生所述分割后數(shù)據(jù),其中該除數(shù)基于所述網(wǎng)絡適配器的數(shù)量和傳送次數(shù)而得。
6.根據(jù)權(quán)利要求1所述的網(wǎng)絡系統(tǒng),其中,所述多個其它節(jié)點中的每個節(jié)點將接收到的所述分割后數(shù)據(jù)經(jīng)由為防止各所述網(wǎng)絡適配器重疊使用而在所述多個節(jié)點中預先確定的網(wǎng)絡適配器傳送到?jīng)]有接收到所述分割后數(shù)據(jù)的其它節(jié)點。
7.根據(jù)權(quán)利要求1所述的網(wǎng)絡系統(tǒng),其中,所述多個其它節(jié)點的數(shù)量是三個或更多。
8.根據(jù)權(quán)利要求1所述的網(wǎng)絡系統(tǒng),其中,所述網(wǎng)絡適配器中的每個網(wǎng)絡適配器經(jīng)由網(wǎng)絡與所述縱橫交換器連接。
9.根據(jù)權(quán)利要求1所述的網(wǎng)絡系統(tǒng),其中,所述節(jié)點中的每個節(jié)點均包括至少一個CPU;存儲器;和所述多個網(wǎng)絡適配器。
10.根據(jù)權(quán)利要求1所述的網(wǎng)絡系統(tǒng),其中,所述多個節(jié)點中的每個節(jié)點均包括用于執(zhí)行并行計算的并行計算機系統(tǒng)。
11.一種網(wǎng)絡系統(tǒng)的廣播處理方法,用于將數(shù)據(jù)從具有多個網(wǎng)絡適配器的一個節(jié)點廣播到多個其它節(jié)點,所述多個其它節(jié)點中的每個節(jié)點均具有多個網(wǎng)絡適配器,該方法包括如下步驟分割步驟,其中所述一個節(jié)點將待傳送到所述多個其它節(jié)點的數(shù)據(jù)分割成多個數(shù)據(jù);第一傳送步驟,其中將每個分割后數(shù)據(jù)分別經(jīng)由不同的網(wǎng)絡適配器從所述一個節(jié)點傳送到所述多個其它節(jié)點;和第二傳送步驟,其中將接收到的所述分割后數(shù)據(jù)經(jīng)由所述網(wǎng)絡適配器從接收到所述分割后數(shù)據(jù)的所述多個其它節(jié)點中的每個節(jié)點傳送到?jīng)]有接收到所述分割后數(shù)據(jù)的其它節(jié)點。
12.根據(jù)權(quán)利要求11的網(wǎng)絡系統(tǒng)的廣播處理方法,其中,所述第二傳送步驟包括如下步驟所述多個其它節(jié)點中的每個節(jié)點從所述一個節(jié)點接收所述分割后的數(shù)據(jù),并且將先前接收到的分割后數(shù)據(jù)經(jīng)由所述網(wǎng)絡適配器傳送到?jīng)]有接收到所述分割后數(shù)據(jù)的其它節(jié)點。
13.根據(jù)權(quán)利要求11的網(wǎng)絡系統(tǒng)的廣播處理方法,其中,所述分割步驟包括如下步驟將待傳送的數(shù)據(jù)除以一除數(shù)來進行分割,以產(chǎn)生所述分割后數(shù)據(jù),其中該除數(shù)基于所述網(wǎng)絡適配器的數(shù)量而得。
14.根據(jù)權(quán)利要求11的網(wǎng)絡系統(tǒng)的廣播處理方法,所述第一傳送步驟包括如下步驟將所述分割后數(shù)據(jù)傳送到其數(shù)量與所述網(wǎng)絡適配器數(shù)量相同的所述多個節(jié)點。
15.根據(jù)權(quán)利要求12的網(wǎng)絡系統(tǒng)的廣播處理方法,其中,所述分割步驟還包括將所述數(shù)據(jù)除以一除數(shù)來進行分割,以產(chǎn)生所述分割后數(shù)據(jù),其中該除數(shù)基于所述網(wǎng)絡適配器的數(shù)量和傳送次數(shù)而得。
16.根據(jù)權(quán)利要求11的網(wǎng)絡系統(tǒng)的廣播處理方法,其中,所述第二傳送步驟還包括如下步驟將接收到的所述分割后數(shù)據(jù)經(jīng)由為防止各所述網(wǎng)絡適配器重疊使用而在所述多個節(jié)點中預先確定的網(wǎng)絡適配器傳送到?jīng)]有接收到所述分割后數(shù)據(jù)的其它節(jié)點。
17.根據(jù)權(quán)利要求11的網(wǎng)絡系統(tǒng)的廣播處理方法,其中,所述多個其它節(jié)點的數(shù)量是三個或更多。
18.根據(jù)權(quán)利要求11的網(wǎng)絡系統(tǒng)的廣播處理方法,其中,所述網(wǎng)絡適配器中的每個網(wǎng)絡適配器經(jīng)由網(wǎng)絡與所述縱橫交換器連接。
19.根據(jù)權(quán)利要求11的網(wǎng)絡系統(tǒng)的廣播處理方法,其中,所述節(jié)點中的每個節(jié)點均包括至少一個CPU;存儲器;和所述多個網(wǎng)絡適配器。
20.根據(jù)權(quán)利要求11的網(wǎng)絡系統(tǒng)的廣播處理方法,其中,所述第二傳送步驟還包括如下步驟將在所述第一傳送步驟中沒有從所述一個節(jié)點傳送的分割后數(shù)據(jù)中的每個數(shù)據(jù)經(jīng)由不同的網(wǎng)絡適配器分別傳送到所述多個其它節(jié)點。
全文摘要
本發(fā)明提供一種網(wǎng)絡系統(tǒng)的廣播處理方法及網(wǎng)絡系統(tǒng)。一種從一節(jié)點將數(shù)據(jù)廣播到多個其它節(jié)點的網(wǎng)絡系統(tǒng),其可減少用于廣播的時間。傳送源節(jié)點分割待廣播的傳送數(shù)據(jù),并從傳送源節(jié)點的網(wǎng)絡適配器將每個分割后數(shù)據(jù)單獨傳送到其它節(jié)點的網(wǎng)絡適配器,并且其它節(jié)點將接收到的數(shù)據(jù)傳送到除了傳送源節(jié)點之外的其它節(jié)點的網(wǎng)絡適配器。由于在第二數(shù)據(jù)傳送中更多的節(jié)點(網(wǎng)絡適配器)參與到數(shù)據(jù)傳送中,因此能夠?qū)崿F(xiàn)高速的傳送處理,并且可減少在廣播期間的傳送處理時間。
文檔編號H04L12/28GK101039202SQ20061010752
公開日2007年9月19日 申請日期2006年7月20日 優(yōu)先權(quán)日2006年3月14日
發(fā)明者稻垣淳一, 小藪正夫 申請人:富士通株式會社