芯片的使用,GPU卡的數(shù)量則可以增多。
[0056]為了更大程度地擴展GPU卡的數(shù)量,在本發(fā)明一個實施例中,在GPU機箱內(nèi)部,PCIe芯片的個數(shù)可以為多個,并分成兩級設(shè)計,具體可以包括:第一級PCIe芯片和第二級PCIe芯片;
[0057]所述第一級PCIe芯片包括至少一個PCIe芯片,所述第二級PCIe芯片包括至少兩個PCIe芯片;所述第一級PCIe芯片中的每一個PCIe芯片與所述第二級PCIe芯片中的每一個PCIe芯片均相連;所述第二級PCIe芯片中的每一個PCIe芯片還與至少一個GPU卡相連;
[0058]所述第二級PCIe芯片中的每一個PCIe芯片,用于將相連GPU卡發(fā)來的數(shù)據(jù)通過PCIe信號線發(fā)送給相連的第一級PCIe芯片;
[0059]所述第一級PCIe芯片中的每一個PCIe芯片,用于相連的各第二級PCIe芯片發(fā)來的數(shù)據(jù)進行整合,然后向外發(fā)送。
[0060]此種兩級PCIe芯片連接GPU卡的方式,由于可以通過第一級PCIe芯片進行數(shù)據(jù)整合處理,通過第二級PCIe芯片進行GPU卡的數(shù)據(jù)傳輸處理,因此,可以允許在GPU機箱內(nèi)部設(shè)置更多的GPU卡。
[0061]在本發(fā)明一個實施例中,所述第一級PCIe芯片中包括兩個PCIe芯片;所述第二級PCIe芯片中包括四個PCIe芯片。當然,每級PCIe芯片中包括的PCIe芯片的數(shù)量可以根據(jù)需要設(shè)置為其他個數(shù)。
[0062]在本發(fā)明一個實施例中,GPU卡的數(shù)量可以為16。
[0063]在本發(fā)明一個實施例中,所述GPU機箱為4U機箱結(jié)構(gòu)。
[0064]圖2示出了在本發(fā)明一個實施例中4U結(jié)構(gòu)的GPU機箱的一種示意圖。4U結(jié)構(gòu)的GI3U機箱內(nèi)包括兩級PCIe芯片。第一級PCIe芯片中包括2個PCIe芯片即圖中的PCIEX,第二級PCIe芯片中包括4個PCIe芯片即圖中的PCIEX,第二級中每個PCIe芯片即PCIEX通過PCIe信號線連接4個GPU卡。
[0065]在GPU機箱內(nèi)部,任意兩個PCIe芯片之間,以及PCIe芯片與GPU卡之間均可以通過PCIe X 16數(shù)據(jù)鏈路相連,從而提供更高的數(shù)據(jù)傳輸帶寬。當然,在本發(fā)明一些實施例中,PCIeX 16數(shù)據(jù)鏈路也可以替換為其他的數(shù)據(jù)鏈路,比如PCIe X 8數(shù)據(jù)鏈路或者PCIe X 4數(shù)據(jù)鏈路,在此種情況下,則可以在第二級的每個PCIe芯片下掛接更多的GPU卡。
[0066]圖2只是本發(fā)明一個實施例中GPU機箱的結(jié)構(gòu)示意圖。在本發(fā)明的其他實施例中,上述GPU機箱的各種結(jié)構(gòu)和實施例可以根據(jù)需要靈活進行組合。
[0067]在本發(fā)明一個實施例中,由于GPU機箱內(nèi)部可以設(shè)置更多的GPU卡,比如可以設(shè)置16個GPU卡,為了進一步保證GPU機箱內(nèi)的散熱效果,參見圖3,GPU機箱可以進一步包括:位于所述GPU機箱前部的背板301、位于所述GPU機箱后部的背板302以及位于所述GPU機箱后部的風(fēng)扇303 ;其中
[0068]位于后部的背板302為橋狀結(jié)構(gòu),位于后部的背板302的高度高于位于前部的背板301的高度;
[0069]所述GPU機箱包括至少兩個GPU卡304 ;所述至少兩個GPU卡304被分別置放在所述背板301以及第二背板302上;
[0070]所述風(fēng)扇303,用于從所述GPU機箱后部吹風(fēng),以使風(fēng)流動到背板302的GPU卡304,對背板302的GPU卡進行散熱,并且使所述風(fēng)穿過橋狀結(jié)構(gòu)的所述背板302到達背板301,對背板301上的GPU卡304進行散熱。
[0071]參見圖3,由于位于后部的背板302下部有類似“橋洞”的空間,該空間是為了使得后部的風(fēng)扇303吹出的風(fēng),能夠通過該“橋洞”吹到位于前部的背板301處,同時,位于后部的背板302的高度高于位于前部的背板301的高度,此種高度設(shè)計也是為了使得從“橋洞”通過的風(fēng)能夠吹到位于前部的背板301的GPU卡304,從而提高了散熱效果。
[0072]在本發(fā)明一個實施例中,提供了在GPU機箱內(nèi)部設(shè)置16個GPU卡的結(jié)構(gòu),此時,GI3U機箱可以進一步包括:交換板;并且,
[0073]所述交換板與位于GPU前部的第一背板和位于GPU機箱后部的第二背板均相連;
[0074]所述至少一個PCIe芯片被放置在所述交換板上,
[0075]所述GPU卡的數(shù)量為16 ;
[0076]16個GPU卡分為四組,其中兩組位于GPU機箱后部的第二背板上,另外兩組位于GI3U機箱前部的第一背板上;
[0077]所述交換板將第一背板上的兩組GPU卡分隔開,以及將第二背板上的兩組GPU卡分隔開。
[0078]本發(fā)明一個實施例還提出一種PCIe交換裝置,參見圖4,包括:
[0079]至少一個PCIe芯片401以及處理單元402 ;
[0080]每一個所述PCIe芯片401與處理單元402相連,以及與外部至少一個GPU機箱中的PCIe芯片相連;
[0081]所述處理單元402還與外部至少一個GPU機箱中的PCIe芯片相連;
[0082]每一個所述PCIe芯片401,用于接收外部GPU機箱中的PCIe芯片發(fā)來的數(shù)據(jù),并發(fā)送給外部的服務(wù)器;
[0083]所述處理單元402,用于對所述至少一個PCIe芯片401以及外部至少一個GPU機箱中的PCIe芯片進行管理。
[0084]可見,本發(fā)明實施例提出的PCIe交換裝置在服務(wù)器與外設(shè)GPU機箱之間完成了數(shù)據(jù)交換功能,由于PCIe交換裝置能夠連接多個GPU機箱,服務(wù)器則可以與更多的GPU機箱內(nèi)部的GPU卡進行通信,提高了數(shù)據(jù)處理的能力。
[0085]為了更大程度地擴展與服務(wù)器配合使用的GPU卡的數(shù)量,在本發(fā)明一個實施例中,在與GPU機箱相連的PCIe交換裝置內(nèi)部,PCIe芯片的個數(shù)可以為多個,并分成兩層設(shè)計,具體可以包括:包括:第一層PCIe芯片和第二層PCIe芯片;
[0086]所述第一層PCIe芯片包括至少一個PCIe芯片,所述第二層PCIe芯片包括至少兩個PCIe芯片;所述第一層PCIe芯片中的每一個PCIe芯片與所述第二層PCIe芯片中的每一個PCIe芯片均相連;所述第二層PCIe芯片中的每一個PCIe芯片還與外部GPU機箱中的至少一個PCIe芯片相連;
[0087]所述第二層PCIe芯片中的每一個PCIe芯片,用于將外部GPU機箱中的至少一個PCIe芯片發(fā)來的數(shù)據(jù)通過PCIe信號線發(fā)送給第一層PCIe芯片;
[0088]所述第一層PCIe芯片中的每一個PCIe芯片,用于將相連的各第二層PCIe芯片發(fā)來的數(shù)據(jù)進行整合,然后向外發(fā)送。
[0089]此種兩層PCIe芯片作為PCIe交換裝置,以連接下游GPU機箱以及上游服務(wù)器的方式,由于可以通過第一層PCIe芯片進行數(shù)據(jù)整合處理,通過第二層PCIe芯片接收GPU機箱發(fā)來的數(shù)據(jù),因此,可以允許PCIe交換裝置雖然外連數(shù)量眾多的GPU機箱,但是通過數(shù)據(jù)整合后,仍然可以外接一個服務(wù)器。
[0090]在本發(fā)明一個實施例中,所述第一層PCIe芯片中包括兩個PCIe芯片;所述第二層PCIe芯片中包括四個PCIe芯片。當然,每層PCIe芯片中包括的PCIe芯片的數(shù)量可以根據(jù)需要設(shè)置為其他個數(shù)。
[0091]在本發(fā)明一個實施例中,所述PCIe交互裝置為2U機箱結(jié)構(gòu)。
[0092]圖5示出了在本發(fā)明一個實施例中2U結(jié)構(gòu)的PCIe交換裝置的一種示意圖。2U結(jié)構(gòu)的PCIe交換裝置內(nèi)包括作為處理單元的MCPU以及兩層PCIe芯片,第一層PCIe芯片中包括2個PCIe芯片,第二層PCIe芯片中包括4個PCIe芯片,第二層中每個PCIe芯片通過PCIe信號線連接外部的GPU機箱。
[0093]在PCIe交換裝置內(nèi)部,任意兩個PCIe芯片之間,以及PCIe芯片與外部GPU機箱之間均可以通過PCIeX 16數(shù)據(jù)鏈路相連,從而提供更高的數(shù)據(jù)傳輸帶寬。當然,在本發(fā)明一些實施例中,PCIe X 16數(shù)據(jù)鏈路也可以替換為其他的數(shù)據(jù)鏈路,比如PCIe X 8數(shù)據(jù)鏈路或者PCIeX4數(shù)據(jù)鏈路,在此種情況下,則可以在第二層的每個PCIe芯片下掛接更多的GPU卡。
[0094]在本發(fā)明一個實施例中,PCIe交換裝置中的處理單元由于只需要與PCIe芯片傳輸一種管理數(shù)據(jù),因此,處理單元可以通過PCIeX I數(shù)據(jù)鏈路與PCIe交換裝置內(nèi)部的PCIe芯片以及與GPU機箱內(nèi)的PCIe芯片相連,以傳輸管理數(shù)據(jù)。
[0095]本發(fā)明一個實施例還提出一種服務(wù)器系統(tǒng),參見圖6,包括:至少一個服務(wù)器601,至少一個上述任意一種GPU機箱602,以及至少一個上述任意一種PCIe交換裝置603 ;其中,
[0096]每一個所述服務(wù)器601,