專利名稱::基于改變控制模式進(jìn)行機(jī)群系統(tǒng)能耗管控的方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及機(jī)群系統(tǒng)(cluster)的能耗管控,特別涉及一種采用改變控制模式進(jìn)行機(jī)群系統(tǒng)能耗管控的方法。
背景技術(shù):
:隨著高性能計(jì)算的快速發(fā)展,計(jì)算機(jī)群的快速增長(zhǎng)導(dǎo)致了一個(gè)問題,即大型機(jī)群的能量消耗越來越大,節(jié)能成為了高性能計(jì)算必須考慮的重要問題。如何降低能耗已經(jīng)成為高性能計(jì)算機(jī)設(shè)計(jì)中的一個(gè)重要考慮因素。很多大型機(jī)在設(shè)計(jì)過程中已經(jīng)把如何有效控制系統(tǒng)功耗作為一個(gè)設(shè)計(jì)原則。機(jī)群系統(tǒng)(cluster)是互相連接的多個(gè)獨(dú)立計(jì)算機(jī)的集合,是將一些單機(jī)或工作站通過高速網(wǎng)絡(luò)相互連接。其中每個(gè)結(jié)點(diǎn)都有自己獨(dú)立的存儲(chǔ)器、1/0設(shè)備等。機(jī)群系統(tǒng)提供給用戶的是一個(gè)單一的系統(tǒng),為客戶提供高可靠性的服務(wù)。低功耗技術(shù)研究出現(xiàn)于硬件電路設(shè)計(jì)領(lǐng)域,隨著研究的發(fā)展,在體系結(jié)構(gòu)、編譯器、操作系統(tǒng)及網(wǎng)絡(luò)等各層次展開,涉及領(lǐng)域包括嵌入式系統(tǒng)、桌面系統(tǒng)和服務(wù)器系統(tǒng)等。低功耗管理的硬件從磁盤、人機(jī)交互設(shè)備、網(wǎng)卡等各類外設(shè)到處理器、內(nèi)存和總線等核心部件。目前,低功耗研究大多集中在操作系統(tǒng)層次,針對(duì)單機(jī)降低自身的能耗。對(duì)于大規(guī)模的機(jī)群系統(tǒng)并行計(jì)算這個(gè)層次而言,未見相關(guān)報(bào)道。
發(fā)明內(nèi)容本發(fā)明的目的是提供一種采用改變控制模式進(jìn)行機(jī)群系統(tǒng)能耗管控的方法,該方法通過對(duì)機(jī)群系統(tǒng)進(jìn)行實(shí)時(shí)的觀察,依據(jù)機(jī)群系統(tǒng)中計(jì)算節(jié)點(diǎn)的狀態(tài)以及高性能計(jì)算任務(wù)的特征來改變機(jī)群系統(tǒng)計(jì)算節(jié)點(diǎn)的控制模式,動(dòng)態(tài)調(diào)整機(jī)群系統(tǒng)計(jì)算節(jié)點(diǎn)的狀態(tài),通過管控節(jié)點(diǎn)對(duì)機(jī)群系統(tǒng)中的計(jì)算節(jié)點(diǎn)進(jìn)行計(jì)算任務(wù)運(yùn)行情況下的系統(tǒng)級(jí)的管理和控制,在不影響整體計(jì)算效能的前提下,降低高性能計(jì)算機(jī)的運(yùn)行時(shí)功耗,以達(dá)到高效能、低功耗的目的。該方法是在結(jié)合單機(jī)能耗控制與機(jī)群系統(tǒng)的特點(diǎn)加以策略級(jí)的控制而得到。本發(fā)明是一種基于改變控制模式進(jìn)行機(jī)群系統(tǒng)能耗管控的方法,其能耗管控包括有下列處理步驟步驟一管控節(jié)點(diǎn)通過接口層實(shí)時(shí)查詢計(jì)算節(jié)點(diǎn)的狀態(tài)CO{AN,BN,CN,DN,EN},若計(jì)算節(jié)點(diǎn)為空閑時(shí),則依據(jù)空閑時(shí)間將計(jì)算節(jié)點(diǎn)分別設(shè)置為C,狀態(tài)、D,狀態(tài)或E,狀態(tài);步驟二當(dāng)有計(jì)算任務(wù)時(shí),管控節(jié)點(diǎn)分配計(jì)算任務(wù)的規(guī)則為(A)若有空閑計(jì)算節(jié)點(diǎn)時(shí),則管控節(jié)點(diǎn)分配計(jì)算任務(wù)給該計(jì)算節(jié)點(diǎn),并執(zhí)行步驟(B)若無空閑計(jì)算節(jié)點(diǎn)時(shí),則喚醒處于CN狀態(tài)、D,狀態(tài)或EN狀態(tài)的計(jì)算節(jié)點(diǎn),并分配計(jì)算任務(wù)給該計(jì)算節(jié)點(diǎn),并執(zhí)行步驟三;(C)若計(jì)算節(jié)點(diǎn)都處于A,狀態(tài),則不分配計(jì)算任務(wù);步驟三管控節(jié)點(diǎn)依據(jù)任務(wù)負(fù)載CQ{M,D,T}發(fā)送控制命令CT{IDN,MN}來設(shè)置計(jì)算4節(jié)點(diǎn)運(yùn)行任務(wù)時(shí)的控制模式CM{AM,BM,CM,DM,EM};所述計(jì)算節(jié)點(diǎn)運(yùn)行任務(wù)時(shí)的控制模式CM{AM,BM,CM,DM,EM}中的物理意義為AM表示當(dāng)計(jì)算任務(wù)量固定,并且性能要求大于節(jié)能要求時(shí),使用性能優(yōu)先模式,這是一種自動(dòng)控制模式,不需要額外的設(shè)定;BM表示當(dāng)計(jì)算任務(wù)量固定,并且節(jié)能要求大于性能要求時(shí),使用節(jié)能模式,這也是一種自動(dòng)控制模式,不需要額外的設(shè)定;CM表示當(dāng)計(jì)算任務(wù)量動(dòng)態(tài)變化,變化呈現(xiàn)一定的規(guī)律并且變化次數(shù)不超過設(shè)定的閥值時(shí),選擇使用手動(dòng)模式,在這種模式下可以手動(dòng)控制使用的CPU核的數(shù)量,以及每個(gè)CPU的主頻;DM表示當(dāng)計(jì)算任務(wù)量動(dòng)態(tài)變化,并且變化次數(shù)超過設(shè)定的閥值時(shí),選擇使用半自動(dòng)模式,這是一種半自動(dòng)控制模式,需要使用者設(shè)定主頻變換的計(jì)算任務(wù)量臨界值以及節(jié)能傾向;EM表示當(dāng)處理器沒有任務(wù)時(shí),空閑時(shí)間達(dá)到一定的閥值后,依據(jù)空閑的時(shí)長(zhǎng),設(shè)定機(jī)器進(jìn)入不同的休眠狀態(tài);步驟四當(dāng)計(jì)算節(jié)點(diǎn)收到管控節(jié)點(diǎn)的控制命令CT(IDw,MN}后,并依據(jù)該控制命令CT{IDN,MN}設(shè)置相應(yīng)的控制模式,并執(zhí)行分配的計(jì)算任務(wù)。本發(fā)明的機(jī)群系統(tǒng)能耗管控具有如下優(yōu)點(diǎn)①利用計(jì)算節(jié)點(diǎn)狀態(tài)來進(jìn)行任務(wù)分配,動(dòng)態(tài)調(diào)整機(jī)群系統(tǒng)中運(yùn)行的計(jì)算節(jié)點(diǎn)的數(shù)量,避免改變不必要的計(jì)算節(jié)點(diǎn)的狀態(tài)。②依據(jù)高性能的計(jì)算任務(wù)特征進(jìn)行管控節(jié)點(diǎn)的規(guī)則訂制,在保證機(jī)群系統(tǒng)計(jì)算性能前提下,降低機(jī)群系統(tǒng)的功耗。③低功耗管控加載于管控節(jié)點(diǎn)上,由管控節(jié)點(diǎn)控制機(jī)群系統(tǒng)能耗,控制方便。圖1是機(jī)群系統(tǒng)的低功耗管控層次結(jié)構(gòu)圖。圖2是本發(fā)明用于測(cè)試的機(jī)群系統(tǒng)結(jié)構(gòu)圖。圖3是節(jié)點(diǎn)能耗狀態(tài)轉(zhuǎn)換圖。具體實(shí)施例方式本發(fā)明的一種采用改變控制模式進(jìn)行機(jī)群系統(tǒng)能耗管控的方法,包括有下列處理步驟步驟一管控節(jié)點(diǎn)通過接口層實(shí)時(shí)查詢計(jì)算節(jié)點(diǎn)的狀態(tài)C0{AN,BN,CN,DN,EN},若計(jì)算節(jié)點(diǎn)為空閑時(shí),則依據(jù)空閑時(shí)間將計(jì)算節(jié)點(diǎn)分別設(shè)置為Cw狀態(tài)、D,狀態(tài)或E,狀態(tài)(參見圖3所示)。所述的計(jì)算節(jié)點(diǎn)的狀態(tài)C0{AN,BN,CN,DN,EN}中AN表示計(jì)算節(jié)點(diǎn)處于運(yùn)行狀態(tài),BN表示計(jì)算節(jié)點(diǎn)處于空閑狀態(tài),C,表示計(jì)算節(jié)點(diǎn)處于待機(jī)狀態(tài),D,表示計(jì)算節(jié)點(diǎn)處于掛起到內(nèi)存狀態(tài),E,表示計(jì)算節(jié)點(diǎn)處于掛起到硬盤狀態(tài),N表示任意一個(gè)計(jì)算節(jié)點(diǎn)。在本發(fā)明中,計(jì)算節(jié)點(diǎn)能耗狀態(tài)轉(zhuǎn)換關(guān)系為AN和BN狀態(tài)時(shí),計(jì)算節(jié)點(diǎn)能耗處于最高,即"活躍狀態(tài)";C,狀態(tài)時(shí),計(jì)算節(jié)點(diǎn)只關(guān)閉顯示器,而維持其余部件的供電;DN狀態(tài)時(shí),計(jì)算節(jié)點(diǎn)將CPU運(yùn)行時(shí)環(huán)境保存到RAM存儲(chǔ)器,并將除RAM之外的部件斷電,只供給RAM必要的電量維持?jǐn)?shù)據(jù);E,狀態(tài)時(shí),計(jì)算節(jié)點(diǎn)將CPU運(yùn)行時(shí)環(huán)境和存儲(chǔ)器狀態(tài)保存到本地硬盤,然后關(guān)閉除網(wǎng)卡之外所有部件的供電,只保留網(wǎng)卡供電用于喚醒。圖3中,B,狀態(tài)至C,狀態(tài)所需的等待時(shí)間記為tl,B,狀態(tài)至C,狀態(tài)的空閑時(shí)間記為TB—c,且tl=3minlOmin;C,狀態(tài)至D,狀態(tài)所需的等待時(shí)間記為t2,C,狀態(tài)至D,狀態(tài)的空閑時(shí)間記為—D,且t2=3minlOmin;D,狀態(tài)至E,狀態(tài)所需的等待時(shí)間記為t3,D,狀態(tài)至E,狀態(tài)的空閑時(shí)間記為TD—E,且t3=lOmin30min。若計(jì)算節(jié)點(diǎn)中TB—c>tl時(shí),則計(jì)算節(jié)點(diǎn)轉(zhuǎn)入CN狀態(tài)。若計(jì)算節(jié)點(diǎn)中Tc—D>t2時(shí),則計(jì)算節(jié)點(diǎn)轉(zhuǎn)入D,狀態(tài)。若計(jì)算節(jié)點(diǎn)中TD—E>t3時(shí),則計(jì)算節(jié)點(diǎn)轉(zhuǎn)入E,狀態(tài)。而計(jì)算節(jié)點(diǎn)無論處于何種休眠狀態(tài),節(jié)點(diǎn)一旦分配了新的任務(wù),都轉(zhuǎn)向活躍狀態(tài)。在本發(fā)明中,步驟一利用計(jì)算節(jié)點(diǎn)狀態(tài)來進(jìn)行任務(wù)分配,動(dòng)態(tài)調(diào)整機(jī)群系統(tǒng)中運(yùn)行的計(jì)算節(jié)點(diǎn)的數(shù)量,避免改變不必要的計(jì)算節(jié)點(diǎn)的狀態(tài)。步驟二當(dāng)有計(jì)算任務(wù)時(shí),管控節(jié)點(diǎn)分配計(jì)算任務(wù)的規(guī)則為(A)若有空閑計(jì)算節(jié)點(diǎn)時(shí),則管控節(jié)點(diǎn)分配計(jì)算任務(wù)給該計(jì)算節(jié)點(diǎn),并執(zhí)行步驟(B)若無空閑計(jì)算節(jié)點(diǎn)時(shí),則喚醒處于CN狀態(tài)、D,狀態(tài)或EN狀態(tài)的計(jì)算節(jié)點(diǎn),并分配計(jì)算任務(wù)給該計(jì)算節(jié)點(diǎn),并執(zhí)行步驟三;(C)若計(jì)算節(jié)點(diǎn)都處于AN狀態(tài),則不分配計(jì)算任務(wù)。步驟三管控節(jié)點(diǎn)依據(jù)任務(wù)負(fù)載CQ{M,D,T}發(fā)送控制命令CT{IDN,MN}來設(shè)置計(jì)算節(jié)點(diǎn)運(yùn)行任務(wù)時(shí)的控制模式CM{AM,BM,CM,DM,EM};所述計(jì)算節(jié)點(diǎn)的任務(wù)負(fù)載CQ(M,D,T}中M表示計(jì)算任務(wù)規(guī)模,D表示分配給節(jié)點(diǎn)任務(wù)量的變化頻率,T表示任務(wù)執(zhí)行時(shí)間。所述控制命令CT(ID,,MN}中ID,表示需要設(shè)置的計(jì)算節(jié)點(diǎn),M,表示需要設(shè)置的控制模式CM{AM,BM,CM,DM,EM}中的一種。所述計(jì)算節(jié)點(diǎn)運(yùn)行任務(wù)時(shí)的控制模式CM{AM,BM,CM,DM,EM}中的物理意義為AM表示當(dāng)計(jì)算任務(wù)量固定,并且性能要求大于節(jié)能要求時(shí),使用性能優(yōu)先(performance)模式,這是一種自動(dòng)控制模式,不需要額外的設(shè)定;BM表示當(dāng)計(jì)算任務(wù)量固定,并且節(jié)能要求大于性能要求時(shí),使用節(jié)能(powersave)模式,這也是一種自動(dòng)控制模式,不需要額外的設(shè)定;CM表示當(dāng)計(jì)算任務(wù)量動(dòng)態(tài)變化,變化呈現(xiàn)一定的規(guī)律并且變化次數(shù)不超過設(shè)定的閥值時(shí),選擇使用手動(dòng)(userspace)模式,在這種模式下可以手動(dòng)控制使用的CPU核的數(shù)量,以及每個(gè)CPU的主頻;DM表示當(dāng)計(jì)算任務(wù)量動(dòng)態(tài)變化,并且變化次數(shù)超過設(shè)定的閥值時(shí),選擇使用半自動(dòng)(ondemand)模式,這是一種半自動(dòng)控制模式,需要使用者設(shè)定主頻變換的計(jì)算任務(wù)量臨界值以及節(jié)能傾向;EM表示當(dāng)處理器沒有任務(wù)時(shí),空閑時(shí)間達(dá)到一定的閥值后,依據(jù)空閑的時(shí)長(zhǎng),設(shè)定機(jī)器進(jìn)入不同的休眠狀態(tài)。在本發(fā)明中,依據(jù)步驟二高性能的計(jì)算任務(wù)特征進(jìn)行管控節(jié)點(diǎn)的規(guī)則訂制,在保證機(jī)群系統(tǒng)計(jì)算性能前提下,降低機(jī)群系統(tǒng)的功耗。將步驟二和步驟三有機(jī)關(guān)聯(lián),使得低功耗管控加載于管控節(jié)點(diǎn)上,由管控節(jié)點(diǎn)控制機(jī)群系統(tǒng)能耗,控制方便。步驟四當(dāng)計(jì)算節(jié)點(diǎn)收到管控節(jié)點(diǎn)的控制命令CT(IDw,MN}后,并依據(jù)該控制命令CT{IDN,MN}設(shè)置相應(yīng)的控制模式,并執(zhí)行分配的計(jì)算任務(wù)。在本發(fā)明中,通過管控節(jié)點(diǎn)對(duì)計(jì)算節(jié)點(diǎn)狀態(tài)以及計(jì)算節(jié)點(diǎn)運(yùn)行狀態(tài)控制模式的協(xié)調(diào)管理來降低機(jī)群系統(tǒng)的能耗。本發(fā)明的能耗管控方法,是通過改變機(jī)群系統(tǒng)計(jì)算節(jié)點(diǎn)的狀態(tài)來降低系統(tǒng)能耗。針對(duì)運(yùn)行任務(wù)的特點(diǎn),基于改變機(jī)群系統(tǒng)計(jì)算節(jié)點(diǎn)控制模式的策略,由管控節(jié)點(diǎn)通過接口層提供的接口發(fā)送控制命令給節(jié)點(diǎn)層執(zhí)行,實(shí)現(xiàn)管控節(jié)點(diǎn)對(duì)計(jì)算節(jié)點(diǎn)的狀態(tài)控制;針對(duì)計(jì)算任務(wù)量的特點(diǎn)選擇不同的控制模式,控制計(jì)算節(jié)點(diǎn)的能耗狀態(tài)以及控制空閑的計(jì)算節(jié)點(diǎn)進(jìn)入不同的休眠狀態(tài)。管控層次結(jié)構(gòu)如圖1所示,整個(gè)低功耗管理和控制分為節(jié)點(diǎn)層、接口層和策略層,由三個(gè)層次協(xié)同完成管控目標(biāo)。其中第一個(gè)部分負(fù)責(zé)底層的實(shí)現(xiàn)細(xì)節(jié),后兩個(gè)部分實(shí)現(xiàn)管理策略并對(duì)其他系統(tǒng)軟件提供接口。首先在管控節(jié)點(diǎn)中設(shè)定控制模式CM{AM,BM,CM,DM,EM}。有計(jì)算任務(wù)運(yùn)行情況下通過策略層設(shè)定系統(tǒng)的控制模式。設(shè)定好控制模式后,當(dāng)達(dá)到特定的控制條件時(shí),需要改變節(jié)點(diǎn)的狀態(tài)。管控節(jié)點(diǎn)通過接口層調(diào)用相關(guān)接口,完成對(duì)低功耗控制的啟動(dòng)/關(guān)閉或者對(duì)管理策略進(jìn)行查看/修改以及實(shí)現(xiàn)對(duì)單個(gè)節(jié)點(diǎn)的狀態(tài)進(jìn)行查看/修改。節(jié)點(diǎn)層收至lj接口層的命令后,通過ACPI(AdvancedConfigurationandPowerManagementInterface)提供的控制接口完成單節(jié)點(diǎn)的低功耗控制,其中包括節(jié)點(diǎn)的多睡眠模式及喚醒、節(jié)點(diǎn)電源開/關(guān)、處理器主頻控制等,以及響應(yīng)節(jié)點(diǎn)狀態(tài)查詢/設(shè)置。節(jié)點(diǎn)層由分布在各節(jié)點(diǎn)上的低功耗管理代理構(gòu)成,用于實(shí)現(xiàn)以下功能狀態(tài)查詢(回復(fù)所查詢的本節(jié)點(diǎn)當(dāng)前狀態(tài))與狀態(tài)設(shè)置(設(shè)置本節(jié)點(diǎn)狀態(tài))以及相關(guān)的自動(dòng)監(jiān)測(cè)以實(shí)現(xiàn)管理策略。節(jié)點(diǎn)層具體完成節(jié)點(diǎn)的低功耗控制,包括節(jié)點(diǎn)的多睡眠模式及喚醒、節(jié)點(diǎn)電源開/關(guān)、處理器主頻控制等。具體的控制操作通過ACPI提供的處理器、系統(tǒng)主板及電源的控制接口來實(shí)現(xiàn)。由于系統(tǒng)包含各種異構(gòu)節(jié)點(diǎn),每種節(jié)點(diǎn)的可控制參數(shù)、控制接口各不相同,因此,需要為不同類型的節(jié)點(diǎn)設(shè)計(jì)不同的低功耗管理代理。低功耗管理代理提供遠(yuǎn)程管理接口,使得系統(tǒng)的所有節(jié)點(diǎn)可以按照統(tǒng)一的管理策略進(jìn)行低功耗控制,如是否在處理器空閑時(shí)降低主頻、節(jié)點(diǎn)空閑多長(zhǎng)時(shí)間進(jìn)入睡眠狀態(tài)、是否允許關(guān)閉空閑的1/0部件電源等等。低功耗管理代理同時(shí)提供對(duì)監(jiān)控軟件的接口,使得管理人員可以通過系統(tǒng)監(jiān)控界面了解各節(jié)點(diǎn)的工作主頻等信息。接口層負(fù)責(zé)提供對(duì)管理層的接口以及對(duì)其他系統(tǒng)軟件的接口。對(duì)管理層的接口有啟動(dòng)/關(guān)閉低功耗管控、查看當(dāng)前應(yīng)用的低功耗策略、修改當(dāng)前低功耗策略、查看當(dāng)前各從節(jié)點(diǎn)狀態(tài)和修改單個(gè)從節(jié)點(diǎn)狀態(tài)。策略層可以接口層發(fā)送相關(guān)控制命令通過節(jié)點(diǎn)層的遠(yuǎn)程管理代理對(duì)系統(tǒng)中各節(jié)點(diǎn)低功耗進(jìn)行控制與監(jiān)測(cè),從而完成系統(tǒng)級(jí)低功耗的總體管理和控7制。接口層實(shí)現(xiàn)了一組管理模塊和工具,以實(shí)現(xiàn)相應(yīng)的管理控制與監(jiān)測(cè)功能。該層同時(shí)還提供與其他系統(tǒng)管理軟件的接口,如作業(yè)管理、系統(tǒng)監(jiān)控、系統(tǒng)管理等,以便將低功耗控制與系統(tǒng)的其他控制操作統(tǒng)一在一致的用戶界面下進(jìn)行,并實(shí)現(xiàn)各系統(tǒng)的協(xié)同工作。例如,當(dāng)從作業(yè)管理系統(tǒng)獲知新的計(jì)算任務(wù)到來時(shí),需要自動(dòng)將睡眠節(jié)點(diǎn)喚醒。策略層包含了策略生成模塊與手工控制模塊。其中策略生成模塊制定默認(rèn)的系統(tǒng)統(tǒng)一能耗管理策略,并通過接口層提供的接口交由節(jié)點(diǎn)層執(zhí)行。目前的策略設(shè)定主要針對(duì)兩種情況有計(jì)算任務(wù)運(yùn)行情況與空閑時(shí)間較長(zhǎng)情況。在有計(jì)算任務(wù)運(yùn)行情況下,依據(jù)計(jì)算任務(wù)量的變化,選擇合適的控制模式,調(diào)節(jié)系統(tǒng)的狀態(tài);在空閑時(shí)間較長(zhǎng)的情況下,將機(jī)器休眠到不同休眠狀態(tài)。具體的能耗管理策略包括設(shè)置不同的控制模式,空閑睡眠時(shí)間閾值、計(jì)算任務(wù)量較低時(shí)降低主頻、節(jié)能傾向設(shè)定、休眠空閑節(jié)點(diǎn)與對(duì)空閑節(jié)點(diǎn)派發(fā)任務(wù)時(shí)的喚醒。而手工控制模塊則對(duì)應(yīng)特殊需求,以便可以手動(dòng)控制每個(gè)節(jié)點(diǎn)狀態(tài),通過調(diào)用接口層相應(yīng)接口實(shí)現(xiàn)。在這個(gè)體系結(jié)構(gòu)中,由管理員選擇由策略生成模塊或者手工控制模塊生成管理策略,管理協(xié)調(diào)模塊根據(jù)管理策略與低功耗管理代理模塊進(jìn)行交互,向低功耗代理傳遞控制信息,低功耗管理代理模塊根據(jù)管理模塊傳遞的控制信息控制各節(jié)點(diǎn)的功耗。具有5個(gè)計(jì)算節(jié)點(diǎn)機(jī)群系統(tǒng)的低功耗管控測(cè)試參見圖2所示,該圖為具有1個(gè)管控節(jié)點(diǎn)與5個(gè)計(jì)算節(jié)點(diǎn)構(gòu)成的機(jī)群測(cè)試系統(tǒng)。整個(gè)測(cè)試系統(tǒng)在IBMHS21刀片服務(wù)器上進(jìn)行搭建,測(cè)試過程中使用威格電子GDW1200C型功率儀對(duì)整個(gè)系統(tǒng)的能耗進(jìn)行測(cè)量。測(cè)試系統(tǒng)內(nèi)的所有刀片上采用RedHatEnterpriseLi皿x5.0操作系統(tǒng),并將內(nèi)核升級(jí)至2.6.30版本。同時(shí),為了保證測(cè)試任務(wù)集的有效性,并使用Linpack作為測(cè)試過程的任務(wù)集合。測(cè)試過程中,分別在不同負(fù)載密度下,對(duì)使用低功耗管控時(shí)的功耗和不使用時(shí)的功耗進(jìn)行測(cè)量并加以對(duì)比。針對(duì)集群系統(tǒng)的忙、閑狀態(tài)分別進(jìn)行測(cè)試,并且通過實(shí)驗(yàn)數(shù)據(jù)的對(duì)比,對(duì)比結(jié)果如下表其中忙的狀態(tài)下5個(gè)計(jì)算節(jié)點(diǎn)全部處于運(yùn)行狀態(tài);閑的狀態(tài)下4個(gè)計(jì)算節(jié)點(diǎn)處于運(yùn)行狀態(tài),一個(gè)計(jì)算節(jié)點(diǎn)處于休眠狀態(tài)。<table>tableseeoriginaldocumentpage9</column></row><table>測(cè)試結(jié)果表明當(dāng)機(jī)群系統(tǒng)處于忙的狀態(tài),負(fù)載密度越高,機(jī)群系統(tǒng)越繁忙管控效果越好,而實(shí)際的高性能計(jì)算機(jī)系統(tǒng)運(yùn)行環(huán)境的特點(diǎn)就是龐大的計(jì)算任務(wù)規(guī)模,因此通過測(cè)試結(jié)果可知,低功耗管控在實(shí)際的高性能計(jì)算機(jī)系統(tǒng)中可以得到良好的效果。讓機(jī)群系統(tǒng)中處于空閑的部分計(jì)算節(jié)點(diǎn)進(jìn)入休眠狀態(tài),而計(jì)算節(jié)點(diǎn)在休眠狀態(tài)下的能量消耗幾乎為零,因此應(yīng)用低功耗管控方法進(jìn)行節(jié)能效果更加的明顯。隨著機(jī)群系統(tǒng)規(guī)模的增大,性能下降的比例越來越小,而節(jié)能比例幾乎不變,因此可以預(yù)見在計(jì)算節(jié)點(diǎn)空閑的狀態(tài)下,低功耗管控在實(shí)際的高性能計(jì)算機(jī)系統(tǒng)中同樣可以得到良好的效果。權(quán)利要求一種基于改變控制模式進(jìn)行機(jī)群系統(tǒng)能耗管控的方法,其特征在于所述能耗管控包括有下列處理步驟步驟一管控節(jié)點(diǎn)通過接口層實(shí)時(shí)查詢計(jì)算節(jié)點(diǎn)的狀態(tài)CO{AN,BN,CN,DN,EN},若計(jì)算節(jié)點(diǎn)為空閑時(shí),則依據(jù)空閑時(shí)間將計(jì)算節(jié)點(diǎn)分別設(shè)置為CN狀態(tài)、DN狀態(tài)或EN狀態(tài);所述的計(jì)算節(jié)點(diǎn)狀態(tài)CO{AN,BN,CN,DN,EN}中AN表示計(jì)算節(jié)點(diǎn)處于運(yùn)行狀態(tài),BN表示計(jì)算節(jié)點(diǎn)處于空閑狀態(tài),CN表示計(jì)算節(jié)點(diǎn)處于待機(jī)狀態(tài),DN表示計(jì)算節(jié)點(diǎn)處于掛起到內(nèi)存狀態(tài),EN表示計(jì)算節(jié)點(diǎn)處于掛起到硬盤狀態(tài),N表示任意一個(gè)計(jì)算節(jié)點(diǎn);步驟二當(dāng)有計(jì)算任務(wù)時(shí),管控節(jié)點(diǎn)分配計(jì)算任務(wù)的規(guī)則為(A)若有空閑計(jì)算節(jié)點(diǎn)時(shí),則管控節(jié)點(diǎn)分配計(jì)算任務(wù)給該計(jì)算節(jié)點(diǎn),并執(zhí)行步驟三;(B)若無空閑計(jì)算節(jié)點(diǎn)時(shí),則喚醒處于CN狀態(tài)、DN狀態(tài)或EN狀態(tài)的計(jì)算節(jié)點(diǎn),并分配計(jì)算任務(wù)給該計(jì)算節(jié)點(diǎn),并執(zhí)行步驟三;(C)若計(jì)算節(jié)點(diǎn)都處于AN狀態(tài),則不分配計(jì)算任務(wù);步驟三管控節(jié)點(diǎn)依據(jù)任務(wù)負(fù)載CQ{M,D,T}發(fā)送控制命令CT{IDN,MN}來設(shè)置計(jì)算節(jié)點(diǎn)運(yùn)行任務(wù)時(shí)的控制模式CM{AM,BM,CM,DM,EM};所述的計(jì)算節(jié)點(diǎn)任務(wù)負(fù)載CQ{M,D,T}中M表示計(jì)算任務(wù)規(guī)模,D表示分配給節(jié)點(diǎn)任務(wù)量的變化頻率,T表示任務(wù)執(zhí)行時(shí)間;所述的控制命令CT{IDN,MN}中IDN表示需要設(shè)置的計(jì)算節(jié)點(diǎn),MN表示需要設(shè)置的控制模式CM{AM,BM,CM,DM,EM}中的一種;所述的控制模式CM{AM,BM,CM,DM,EM}中AM表示當(dāng)計(jì)算任務(wù)量固定,并且性能要求大于節(jié)能要求時(shí),使用性能優(yōu)先模式;BM表示當(dāng)計(jì)算任務(wù)量固定,并且節(jié)能要求大于性能要求時(shí),使用節(jié)能模式;CM表示當(dāng)計(jì)算任務(wù)量動(dòng)態(tài)變化,變化次數(shù)不超過設(shè)定閥值時(shí),選擇使用手動(dòng)模式,在這種模式下手動(dòng)控制使用的CPU核的數(shù)量,以及每個(gè)CPU的主頻;DM表示當(dāng)計(jì)算任務(wù)量動(dòng)態(tài)變化,并且變化次數(shù)超過設(shè)定的閥值時(shí),選擇使用半自動(dòng)模式,在這種模式下,需要使用者設(shè)定主頻變換的計(jì)算任務(wù)量臨界值以及節(jié)能傾向;EM表示當(dāng)處理器沒有任務(wù)時(shí),空閑時(shí)間達(dá)到閥值后,依據(jù)空閑的時(shí)長(zhǎng),設(shè)定計(jì)算節(jié)點(diǎn)進(jìn)入不同的休眠狀態(tài);步驟四當(dāng)計(jì)算節(jié)點(diǎn)收到管控節(jié)點(diǎn)的控制命令CT{IDN,MN}后,并依據(jù)該控制命令CT{IDN,MN}設(shè)置相應(yīng)的控制模式,并執(zhí)行分配的計(jì)算任務(wù)。2.根據(jù)權(quán)利要求1所述的基于改變控制模式進(jìn)行機(jī)群系統(tǒng)能耗管控的方法,其特征在于計(jì)算節(jié)點(diǎn)能耗狀態(tài)轉(zhuǎn)換關(guān)系為AN和BN狀態(tài)時(shí),計(jì)算節(jié)點(diǎn)能耗處于最高,即活躍狀態(tài);CN狀態(tài)時(shí),計(jì)算節(jié)點(diǎn)只關(guān)閉顯示器,而維持其余部件的供電;D,狀態(tài)時(shí),計(jì)算節(jié)點(diǎn)將CPU運(yùn)行時(shí)環(huán)境保存到RAM存儲(chǔ)器,并將除RAM之外的部件斷電,只供給RAM必要的電量維持?jǐn)?shù)據(jù);E,狀態(tài)時(shí),計(jì)算節(jié)點(diǎn)將CPU運(yùn)行時(shí)環(huán)境和存儲(chǔ)器狀態(tài)保存到本地硬盤,然后關(guān)閉除網(wǎng)卡之外所有部件的供電,只保留網(wǎng)卡供電用于喚醒;BN狀態(tài)至CN狀態(tài)所需的等待時(shí)間記為11,BN狀態(tài)至CN狀態(tài)的空閑時(shí)間記為TB—c,且tl=3minlOmin;CN狀態(tài)至DN狀態(tài)所需的等待時(shí)間記為t2,CN狀態(tài)至DN狀態(tài)的空閑時(shí)間記為Tc—D,且t2=3minlOmin;Dw狀態(tài)至E,狀態(tài)所需的等待時(shí)間記為t3,Dw狀態(tài)至Ew狀態(tài)的空閑時(shí)間記為TD—e,且t3=10min30min;若計(jì)算節(jié)點(diǎn)中TB—C>tl時(shí),則計(jì)算節(jié)點(diǎn)轉(zhuǎn)入C,狀態(tài);若計(jì)算節(jié)點(diǎn)中—D>t2時(shí),則計(jì)算節(jié)點(diǎn)轉(zhuǎn)入D,狀態(tài);若計(jì)算節(jié)點(diǎn)中TD—E>t3時(shí),則計(jì)算節(jié)點(diǎn)轉(zhuǎn)入E,狀態(tài);而計(jì)算節(jié)點(diǎn)無論處于何種休眠狀態(tài),節(jié)點(diǎn)一旦分配了新的任務(wù),都轉(zhuǎn)向活躍狀態(tài)。全文摘要本發(fā)明公開了一種基于改變控制模式進(jìn)行機(jī)群系統(tǒng)能耗管控的方法,是通過管控節(jié)點(diǎn)對(duì)機(jī)群系統(tǒng)中的計(jì)算節(jié)點(diǎn)進(jìn)行計(jì)算任務(wù)運(yùn)行情況下的系統(tǒng)級(jí)管理和控制,屬于計(jì)算機(jī)機(jī)群系統(tǒng)領(lǐng)域。本發(fā)明的能耗管控方法中管控節(jié)點(diǎn)對(duì)計(jì)算任務(wù)量的變化以及變化的頻率,分別選擇固定、手動(dòng)或者半自動(dòng)的控制模式,通過控制計(jì)算節(jié)點(diǎn)的狀態(tài)來控制能耗;而計(jì)算節(jié)點(diǎn)依據(jù)空閑規(guī)則進(jìn)入不同休眠狀態(tài)來節(jié)省處理器的能耗。本發(fā)明針對(duì)機(jī)群系統(tǒng)的并行計(jì)算,在不大幅降低計(jì)算性能的前提下,為機(jī)群系統(tǒng)很好的降低了能耗,獲得了性能和能耗間的平衡。文檔編號(hào)H04L29/08GK101794169SQ20101012044公開日2010年8月4日申請(qǐng)日期2010年3月8日優(yōu)先權(quán)日2010年3月8日發(fā)明者劉軼,吳名瑜,吳開強(qiáng),張海文,李鈺,錢德沛申請(qǐng)人:北京航空航天大學(xué)