專利名稱:帶有g(shù)pu的計(jì)算機(jī)系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本實(shí)用新型涉及計(jì)算才幾系統(tǒng),特別涉及帶有GPU的計(jì)算機(jī)系統(tǒng)。
背景技術(shù):
科學(xué)計(jì)算特別是超級(jí)計(jì)算在當(dāng)今的科學(xué)研究、工程應(yīng)用乃至經(jīng)濟(jì)社會(huì) 管理中發(fā)揮著愈來愈重要的作用。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,高性能計(jì) 算機(jī)的發(fā)展也是日新月異,其峰值計(jì)算能力不斷呈現(xiàn)跨越式發(fā)展的趨勢。 目前主流的高性能計(jì)算機(jī)主要通過基于通用處理器CPU的結(jié)點(diǎn)機(jī)構(gòu)建, 在各個(gè)結(jié)點(diǎn)機(jī)內(nèi),通過提高CPU主頻或增加CPU核的數(shù)目來增強(qiáng)結(jié)點(diǎn)機(jī)
的計(jì)算能力,進(jìn)而提高整個(gè)高性能計(jì)算機(jī)的計(jì)算能力。
在2007年底,隨著圖形加速卡(Graphic Processing Unit, GPU )在傳 統(tǒng)高性能計(jì)算領(lǐng)域中的應(yīng)用,GPU以其較CPU更強(qiáng)大的計(jì)算能力、內(nèi)存 訪問帶寬以及更好的性價(jià)比而受到越來越多的青睞。以NVIDIA公司出品 的專門用于科學(xué)計(jì)算的TeslaC1060 GPU加速卡為例,該GPU加速卡具有 多達(dá)240個(gè)的計(jì)算核心,單精度理論峰值約是933 Gflops,內(nèi)存訪問帶寬 是102 GB/s,而目前比較高端的Intel 3.0GHz的雙核處理器單精度計(jì)算的 理論峰值只能達(dá)到48 Gflops,內(nèi)存訪問帶寬最高也就達(dá)到約10GB/秒,兩 者性能上的差異達(dá)幾十倍甚至上百倍。利用GPU構(gòu)建高性能計(jì)算機(jī)群在 成本上也有很大的降低,如使用CPU構(gòu)建同等性能的計(jì)算機(jī)集群,價(jià)格 至少是GPU加速卡的幾十倍,因此GPU相對(duì)于CPU具有很高的性價(jià)比。 此外,由于占地面積的減小以及耗電的減少,GPU在使用過程中的運(yùn)行成 本也會(huì)比基于CPU的高性能集群系統(tǒng)低很多。使用GPU還能減少對(duì)環(huán)境 的影響,如噪聲和輻射等都會(huì)相應(yīng)降低。
在現(xiàn)有技術(shù)中,已經(jīng)存在一.些利用GPU構(gòu)建的相關(guān)設(shè)備,如NVIDIA 公司推出的S1070系統(tǒng)。該系統(tǒng)在1U (U代表機(jī)架式服務(wù)器的機(jī)箱高度, 1U=44.5 mm )的空間內(nèi)安裝了四塊GPU加速卡,用以實(shí)現(xiàn)計(jì)算才幾的加速運(yùn) 算。但S1070系統(tǒng)并不能獨(dú)立工作,只有將S1070系統(tǒng)通過專用線纜連接到 常見的計(jì)算機(jī)上以后才能在計(jì)算機(jī)控制下進(jìn)行相應(yīng)的工作。
實(shí)用新型內(nèi)容
本實(shí)用新型的目的是提供一種具有強(qiáng)大浮點(diǎn)計(jì)算能力與高性價(jià)比的
帶有GPU部件的計(jì)算機(jī)系統(tǒng)。
為了實(shí)現(xiàn)上述目的,本實(shí)用新型提供了一種計(jì)算機(jī)系統(tǒng),包括CPU 以及安裝有GPU部件的主板;所述主板上包括有一個(gè)或多個(gè)PCI-Express X16插槽,所述插槽之間的距離不小于40毫米,所述GPU部件通過所述 插槽安裝到所述主板上。
上述技術(shù)方案中,所述插槽采用開口方向與主板平面平行的橋接卡。
上述技術(shù)方案中,所述主板包括至少一個(gè)北橋芯片,所述北橋芯片至 少支持36條PCI-Express通道連接。
上述技術(shù)方案中,所述CPU至少有一個(gè)CPU核心對(duì)應(yīng)所述GPU部件 中的一個(gè)GPU核心。
上述技術(shù)方案中,還包括電源,所述電源為大功率電源,所述電源直 才妄與所述GPU部件連接。
上述技術(shù)方案中,所述電源釆用多個(gè)12V的6pin和8pin接口與所述 GPU部件連接。
上述技術(shù)方案中,還包括專用于所述GPU部件的散熱裝置,所述散 熱裝置安裝在正對(duì)所述GPU部件的位置。
上述技術(shù)方案中,所述GPU部件包括顯示卡或圖形加速卡。
本實(shí)用新型還提供了一種超級(jí)計(jì)算機(jī)系統(tǒng),包括多個(gè)通過網(wǎng)絡(luò)互聯(lián)的 所述計(jì)算機(jī)系統(tǒng)。
本實(shí)用新型的優(yōu)點(diǎn)在于
本實(shí)用新型具有很強(qiáng)的浮點(diǎn)計(jì)算能力與高性價(jià)比。
圖1為本實(shí)用新型的計(jì)算機(jī)系統(tǒng)在一個(gè)實(shí)施例中的結(jié)構(gòu)圖; 圖2為本實(shí)用新型的計(jì)算機(jī)系統(tǒng)在另一個(gè)實(shí)施例中的結(jié)構(gòu)圖。
具體實(shí)施方式
以下結(jié)合附圖和具體實(shí)施方式
對(duì)本實(shí)用新型做進(jìn)一步說明。 本實(shí)用新型的帶有GPU的計(jì)算機(jī)系統(tǒng)在現(xiàn)有計(jì)算機(jī)系統(tǒng)的基礎(chǔ)上,添加了 GPU部件,并針對(duì)GPU部件的要求對(duì)現(xiàn)有計(jì)算機(jī)系統(tǒng)加以改進(jìn)。 下面將結(jié)合具體的實(shí)例對(duì)本實(shí)用新型的計(jì)算機(jī)系統(tǒng)的組成做詳細(xì)說明。
本實(shí)用新型的計(jì)算機(jī)系統(tǒng)包括主板、CPU、硬盤、內(nèi)存、電源、顯示 器,還包括有GPU部件。如圖1所示,所述的CPU、 GPU、內(nèi)存都安裝 在所述主板上,而所述硬盤與電源都與主板連接,從而形成計(jì)算機(jī)系統(tǒng)。
現(xiàn)有技術(shù)中的GPU部件可以分為兩類, 一類是高端的顯示卡,如 NVIDIA的Geforce系列的顯示卡以及AMD的Radeon系列的顯示卡;另 一類是專門用于高性能計(jì)算的圖形加速卡,如NVIDIA的Tesla系列的GPU 加速卡和AMD的Firestream系列的GPU加速卡。無論是上述何種類型的 GPU部件,都可應(yīng)用于本實(shí)用新型的計(jì)算^li系統(tǒng)。
GPU部件通常利用主板上現(xiàn)有的PCI-Express X16插槽安裝到主板 上。由于GPU部件中配置了數(shù)量眾多的計(jì)算核心和大容量的高速顯存, 其計(jì)算發(fā)熱量大,需要在GPU部件中配備專門的散熱模塊,因此GPU部 件的體積較現(xiàn)有計(jì)算機(jī)系統(tǒng)中所使用的顯卡的體積更大。以NVIDIA 7〉司 的Geforce GTX295顯示卡為例,該顯示卡的外形尺寸的長、寬、高約是 267 x 37 x 111 mm,其長度大于常見的微型計(jì)算機(jī)主板的長度,而其寬度 也要占據(jù)主板上兩個(gè)插槽的寬度。因此,若直接將現(xiàn)有計(jì)算機(jī)系統(tǒng)中的主 板應(yīng)用于本實(shí)用新型的計(jì)算機(jī)系統(tǒng)中,則這些主板無法滿足GPU部件的 安裝要求。
要將GPU部件安裝到主板上,本實(shí)用新型的計(jì)算機(jī)系統(tǒng)中的主板應(yīng) 當(dāng)滿足以下條件PCI-Express X16插槽間的距離為常見插槽間距的兩倍, 即不小于40mm;主板上PCI-Express XI6插槽的數(shù)量應(yīng)當(dāng)盡可能的多,以 安裝更多的GPU部件,提供更高的性能??紤]到目前主板上的每個(gè)北橋 芯片最多只能支持36條PCI-Express通道連接,如果計(jì)算機(jī)上所配置的 GPU部件超過兩個(gè),則每個(gè)GPU部件實(shí)際利用的PCI-Express 4妄口位寬小 于16個(gè)通道。因此在一種優(yōu)選實(shí)現(xiàn)方式中,如果計(jì)算機(jī)上所配置的GPU 部件超過兩個(gè),可以在主板上再增加一個(gè)北橋芯片,以提高PCI-Express 通道的傳輸帶寬。
將GPU部件安裝到主板上時(shí),可以如圖l所示,將所述GPU部件以 垂直于主板平面的方式插到PCI-Express X16插槽內(nèi)。但采用此種方式安 裝時(shí),由于GPU部件本身的高度接近3U,因而提高了整個(gè)計(jì)算機(jī)系統(tǒng)的 整體高度,使得系統(tǒng)高度達(dá)到3U或4U。計(jì)算機(jī)系統(tǒng)高度的增加,意味著
5在有限安裝體積下所能安裝的計(jì)算機(jī)系統(tǒng)就會(huì)減少,從而降低集成度。例
如, 一般服務(wù)器機(jī)拒的高度為42U,若一臺(tái)計(jì)算機(jī)的高度為4U,則在該服 務(wù)器機(jī)拒內(nèi)最多可以安裝10臺(tái)這樣的計(jì)算機(jī),但若計(jì)算機(jī)的高度能夠減 少到2U,則服務(wù)器機(jī)拒內(nèi)所能安裝的計(jì)算機(jī)可以達(dá)到21臺(tái),可見,同樣 的占地面積,計(jì)算機(jī)系統(tǒng)的高度越小,則服務(wù)器機(jī)拒中所能集成的計(jì)算機(jī) 系統(tǒng)就越多。為了降低計(jì)算機(jī)系統(tǒng)的整體高度,在一種優(yōu)選實(shí)現(xiàn)方式中, 在將GPU部件安裝到主板上時(shí)可采用PCI-Express橋接卡,PCI-Express 橋接卡上的插槽的方向平行于主板平面,因此當(dāng)將GPU部件插入所述插 槽內(nèi)時(shí),如圖2所示,所述GPU部件的方向與主板平面平行,從而使得 整個(gè)計(jì)算機(jī)系統(tǒng)不受到GPU部件本身高度的影響。在將GPU部件水平安 裝后,可將整個(gè)計(jì)算機(jī)系統(tǒng)的高度降低到2U。
在本實(shí)用新型的計(jì)算機(jī)系統(tǒng)內(nèi),計(jì)算機(jī)系統(tǒng)的計(jì)算能力主要由GPU 部件提供,而非CPU。所述CPU在本實(shí)用新型的計(jì)算機(jī)系統(tǒng)內(nèi)主要起到 調(diào)度GPU運(yùn)行的功能。因此,對(duì)計(jì)算機(jī)系統(tǒng)中所采用的CPU的配置要求 不高,只要滿足每個(gè)GPU核心對(duì)應(yīng)有一個(gè)CPU核心即可,而所采用的CPU 的主頻的高低也不會(huì)對(duì)計(jì)算機(jī)系統(tǒng)的性能產(chǎn)生影響。由于當(dāng)前在單臺(tái)計(jì)算 機(jī)上一般最多能安裝4個(gè)GPU部件,因此,為了提升計(jì)算機(jī)的計(jì)算性能, 可以采用包含有雙GPU核心的GPU部件,如帶有雙GPU核心的GPU加 速卡,從而使得單臺(tái)計(jì)算機(jī)上所具有的GPU核心超過四個(gè)。例如,使用 三至四個(gè)包含雙GPU核心的加速卡,如NVIDIA的GTX295或AMD的 HD4870X2。為了與此類GPU部件相適應(yīng),計(jì)算機(jī)系統(tǒng)中可以使用兩個(gè) 四核的CPU,或者可以使用支持超線程的四核CPU來虛擬8個(gè)CPU核心, 如Intel最新平臺(tái)Nehalem的17系列的處理器。
由于本實(shí)用新型中所采用的GPU部件的功率較大,如NVDIA公司的 GeforceGTX295單卡的最大功率達(dá)到289W,與一臺(tái)普通個(gè)人計(jì)算機(jī)的整 機(jī)功率相近,因此,本實(shí)用新型的計(jì)算機(jī)系統(tǒng)無法通過單獨(dú)使用主板上的 PCI-Express來為所述的GPU部件供電,需要為GPU部件提供額外的電能。 在本實(shí)用新型中,可通過計(jì)算機(jī)上的電源直接為GPU部件供電,考慮到 GPU部件上一般提供有一個(gè)或兩個(gè)12V的6PIN或8PIN外界電源接口 , 因此本實(shí)用新型的計(jì)算機(jī)系統(tǒng)中所采用的電源應(yīng)當(dāng)包括有6PIN和8PIN的 接口,且所用電源為大功率電源。所述電源的功率大小與計(jì)算機(jī)系統(tǒng)內(nèi)所 配置的GPU部件的個(gè)數(shù)有關(guān),在一個(gè)實(shí)例中,若計(jì)算機(jī)系統(tǒng)內(nèi)配置有一
6塊GPU部件,則所述電源的功率在650 W左右,若計(jì)算機(jī)系統(tǒng)內(nèi)配置有 兩塊GPU部件,則所述電源的功率在1000 W左右,若計(jì)算才幾系統(tǒng)內(nèi)配置 有三塊GPU部件,則所述電源的功率在1200 W左右,若有四塊GPU部 件,則所述電源的功率在1500 W左右。
本實(shí)用新型的計(jì)算機(jī)系統(tǒng)內(nèi)的GPU部件具有很高的散熱量,因此需 要在計(jì)算機(jī)機(jī)箱內(nèi)為GPU部件配備專門的散熱裝置。在圖1和圖2的示 例中,都在機(jī)箱內(nèi)正對(duì)GPU部件的位置安放一排12V的大流量、高轉(zhuǎn)速 的冷卻風(fēng)扇,直接將冷空氣導(dǎo)入到GPU部件的吸風(fēng)口 ,從而實(shí)現(xiàn)了對(duì)GPU 部件的散熱。所述風(fēng)扇的供電來自主板上的風(fēng)扇電源接口 ,通常GPU部 件內(nèi)都配有溫度探頭,因此可以根據(jù)GPU部件自身的溫度在系統(tǒng)主板的 BIOS里設(shè)置調(diào)控風(fēng)扇供電電流的大小,乂人而根據(jù)GPU部件的溫度自動(dòng)調(diào) 控冷卻風(fēng)扇的轉(zhuǎn)速。
本實(shí)用新型的計(jì)算機(jī)系統(tǒng)既可以工作在Windows操作系統(tǒng)下,也可以 工作在Linux系統(tǒng)下。但在使用GPU部件時(shí),還要配置相應(yīng)的運(yùn)行環(huán)境才 能做高性能的計(jì)算。所述運(yùn)行環(huán)境的配置與GPU部件的生產(chǎn)廠家有關(guān), 不同的GPU部件有不同的運(yùn)行環(huán)境。例如,NVIDIA公司出品的GPU加 速卡,需要采用CUDA (compute unified device architecture)開發(fā)環(huán)境。 AMD公司的GPU力口速卡,需要4吏用Brook+或者CAL( compute abstraction layer)流處理開發(fā)。
本實(shí)用新型的計(jì)算機(jī)系統(tǒng)既可以作為個(gè)人桌邊的具有強(qiáng)大計(jì)算性能的 超級(jí)計(jì)算機(jī)使用,也可以作為超級(jí)計(jì)算系統(tǒng)的結(jié)點(diǎn)機(jī)使用。作為超級(jí)計(jì)算系 統(tǒng)的結(jié)點(diǎn)機(jī)時(shí),可通過主板上集成的以太網(wǎng)卡將多個(gè)計(jì)算機(jī)系統(tǒng)互聯(lián)起來, 從而構(gòu)建百萬億次或千萬億次的超級(jí)計(jì)算系統(tǒng)。特別的,通過集成有 Infiniband網(wǎng)卡的系統(tǒng)主板或在主板上富余的PCI-E插槽中安裝Infiniband網(wǎng) 卡,可以實(shí)現(xiàn)各結(jié)點(diǎn)機(jī)之間基于Infiniband網(wǎng)絡(luò)的高速互聯(lián),獲得更高的通 信帶寬,從而提升超級(jí)計(jì)算系統(tǒng)的性能。如對(duì)于帶有四個(gè)雙槽位間距的 PCI-Express X16插槽的主板,如果作為個(gè)人桌邊的超級(jí)計(jì)算機(jī)或利用集成 的千兆以太網(wǎng)網(wǎng)卡互聯(lián)成超級(jí)計(jì)算系統(tǒng),可以給每個(gè)計(jì)算機(jī)內(nèi)配置四個(gè)GPU 加速卡,而如果要利用Infiniband網(wǎng)絡(luò)以該計(jì)算機(jī)作為結(jié)點(diǎn)機(jī)構(gòu)建超級(jí)計(jì)算 系統(tǒng),則每個(gè)節(jié)點(diǎn)最多只能配置三塊GPU加速卡,留下一個(gè)PCI-Express 插槽安裝Infiniband網(wǎng)卡。
最后所應(yīng)說明的是,以上實(shí)施例僅用以說明本實(shí)用新型的技術(shù)方案而非限制。盡管參照實(shí)施例對(duì)本實(shí)用新型進(jìn)行了詳細(xì)說明,本領(lǐng)域的普通技術(shù)人 員應(yīng)當(dāng)理解,對(duì)本實(shí)用新型的技術(shù)方案進(jìn)行修改或者等同替換,都不脫離本 實(shí)用新型技術(shù)方案的精神和范圍,其均應(yīng)涵蓋在本實(shí)用新型的權(quán)利要求范圍 當(dāng)中。
權(quán)利要求1、一種計(jì)算機(jī)系統(tǒng),其特征在于,包括CPU以及安裝有GPU部件的主板;所述主板上包括有一個(gè)或多個(gè)PCI-Express X16插槽,所述插槽之間的距離不小于40毫米,所述GPU部件通過所述插槽安裝到所述主板上。
2、 根據(jù)權(quán)利要求1所述的計(jì)算機(jī)系統(tǒng),其特征在于,所述插槽采用開口方向與主板平面平行的橋接卡。
3、 根據(jù)權(quán)利要求1所述的計(jì)算機(jī)系統(tǒng),其特征在于,所述主板包括至少一個(gè)北橋芯片,所述北橋芯片至少支持36條PCI-Express通道連接。
4、 根據(jù)權(quán)利要求1所述的計(jì)算機(jī)系統(tǒng),其特征在于,所述CPU至少有一個(gè)CPU核心對(duì)應(yīng)所述GPU部件中的一個(gè)GPU核心。
5、 根據(jù)權(quán)利要求1所述的計(jì)算機(jī)系統(tǒng),其特征在于,還包括電源,所述電源為大功率電源,所述電源直接與所述GPU部件連^^。
6、 根據(jù)權(quán)利要求5所述的計(jì)算機(jī)系統(tǒng),其特征在于,所述電源采用多個(gè)12V的6pin和8pin接口與所述GPU部件連接。
7、 根據(jù)權(quán)利要求1所述的計(jì)算機(jī)系統(tǒng),其特征在于,還包括專用于所述GPU部件的散熱裝置,所述散熱裝置安裝在正對(duì)所述GPU部件的位置。
8、 根據(jù)權(quán)利要求1所述的計(jì)算機(jī)系統(tǒng),其特征在于,所述GPU部件包括顯示卡或圖形加速卡。
9、 一種超級(jí)計(jì)算機(jī)系統(tǒng),其特征在于,包括多個(gè)通過網(wǎng)絡(luò)互聯(lián)的所述權(quán)利要求1-8之一的計(jì)算機(jī)系統(tǒng)。
專利摘要本實(shí)用新型提供一種計(jì)算機(jī)系統(tǒng),包括CPU以及安裝有GPU部件的主板;所述主板上包括有一個(gè)或多個(gè)PCI-Express X16插槽,所述插槽之間的距離不小于40毫米,所述GPU部件通過所述插槽安裝到所述主板上。本實(shí)用新型具有很強(qiáng)的浮點(diǎn)計(jì)算能力與高性價(jià)比。
文檔編號(hào)G06F15/16GK201435029SQ20092010938
公開日2010年3月31日 申請日期2009年6月23日 優(yōu)先權(quán)日2009年6月23日
發(fā)明者何險(xiǎn)峰, 博 李, 李曦鵬, 李靜海, 王小偉, 蔚 葛, 陳飛國 申請人:中國科學(xué)院過程工程研究所