專(zhuān)利名稱(chēng):基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種容錯(cuò)方法,特別涉及一種基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法。
背景技術(shù):
隨著半導(dǎo)體芯片集成能力的提高以及人們對(duì)芯片處理能力要求的提高,如今在單芯片上集成的處理器核數(shù)量已經(jīng)從幾十個(gè)增長(zhǎng)到幾百個(gè)。從目前的趨勢(shì)來(lái)看,該數(shù)字還會(huì)繼續(xù)增加,而且在未來(lái)的芯片中集成的核心數(shù)量將有可能超過(guò)一千個(gè)。對(duì)于這種眾核(manycore,是指單塊芯片上所集成的眾多個(gè)運(yùn)算核心)芯片而言,其片上互連目前多采用片上網(wǎng)絡(luò)(Network-on-Chip,NoC,是一種用于芯片內(nèi)部的片上互連網(wǎng)絡(luò)),而其資源管理多采用層次化的管理結(jié)構(gòu)。在基于片上網(wǎng)絡(luò)的眾核芯片資源管理中,容錯(cuò)管理是一個(gè)非常重要的方面,并已引起廣泛關(guān)注。然而,現(xiàn)有的容錯(cuò)策略都無(wú)法保證整個(gè)芯片具有本質(zhì)上的“頑強(qiáng)性”,即無(wú)法做到“只要還有一個(gè)核心能工作,芯片就會(huì)盡最大努力完成所指定的任務(wù)”。其原因除很難確保核心本身和互連結(jié)構(gòu)等片上單元的“頑強(qiáng)性”之外,還在于現(xiàn)有的管理策略并不具備本質(zhì)上的“頑強(qiáng)性”。這就使得在芯片發(fā)生核心故障時(shí),如果恰好某些重要的管理核心及其冗余核心全都發(fā)生故障,則即使片上剩余的核心數(shù)量再多也無(wú)法維持芯片的繼續(xù)工作,從而導(dǎo)致整塊芯片過(guò)早報(bào)廢。
發(fā)明內(nèi)容
本發(fā)明的目的是為了解決某些重要的管理核心及其冗余核心全都發(fā)生故障,則即使片上剩余的核心數(shù)量再多也無(wú)法維持芯片的繼續(xù)工作,從而導(dǎo)致整塊芯片過(guò)早報(bào)廢的問(wèn)題,本發(fā)明提供一種基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法。本發(fā)明的基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法,所述方法為:所述基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)中包括有多個(gè)核心,所述多個(gè)核心包括各層次的主控核心和冗余核心,所述冗余核心分為固定冗余核心和動(dòng)態(tài)冗余核心,對(duì)芯片的管理結(jié)構(gòu)進(jìn)行分組,對(duì)每個(gè)組采用組內(nèi)相互監(jiān)視的管理方法;對(duì)芯片的所有核心采用自適應(yīng)管理的方法;在每個(gè)組內(nèi)采用選舉的管理方法;對(duì)固定冗余核心采用硬件自喚醒的管理方法,對(duì)動(dòng)態(tài)冗余核心采用軟件自喚醒的管理方法。本發(fā)明的優(yōu)點(diǎn)在于,本發(fā)明通過(guò)對(duì)芯片管理結(jié)構(gòu)進(jìn)行分組,對(duì)每個(gè)組采用組內(nèi)相互監(jiān)視的方法,保證組長(zhǎng)和組員的故障能夠被組內(nèi)剩余無(wú)故障成員發(fā)現(xiàn)。對(duì)芯片的所有核心采用自適應(yīng)管理的方法,使得每個(gè)核心都能夠根據(jù)當(dāng)前自身在管理結(jié)構(gòu)中所處的地位而動(dòng)態(tài)選擇相應(yīng)的管理方法。在每個(gè)組內(nèi)采用選舉的方法,以確保在發(fā)生各種故障時(shí)被破壞的管理結(jié)構(gòu)能夠動(dòng)態(tài)地重建。對(duì)固定冗余核心采用硬件自喚醒的方法,對(duì)動(dòng)態(tài)冗余核心采用軟件自喚醒的方法,保證整個(gè)芯片在發(fā)生極特殊故障情況下依然能夠利用無(wú)故障冗余核心維持工作。本發(fā)明的方法從本質(zhì)上保證了眾核芯片的管理結(jié)構(gòu)能夠根據(jù)芯片核心的損壞情況進(jìn)行自適應(yīng)調(diào)整;并保證了芯片能夠在各種核心故障情況下充分利用片上剩余資源盡力完成應(yīng)用任務(wù);且管理結(jié)構(gòu)的動(dòng)態(tài)重建和調(diào)整完全自主執(zhí)行,無(wú)需用戶干預(yù)。
圖1為本發(fā)明所述的眾核芯片管理結(jié)構(gòu)的原理示意圖。其中Zk內(nèi)的核心表示分為一組,O表示核心。圖2為本發(fā)明具體實(shí)施方式
七所述的硬件自喚醒電路在實(shí)際應(yīng)用于中的原理示意圖,其中一表示鏈路, :1表示固定冗余核心,G表示工作的核心,G表示路由器。圖3為圖2中虛線圈內(nèi)的結(jié)構(gòu)示意圖。
具體實(shí)施例方式具體實(shí) 施方式一:本實(shí)施方式所述的基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法,所述基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)中包括有多個(gè)核心,所述多個(gè)核心包括各層次的主控核心和冗余核心,所述冗余核心分為固定冗余核心和動(dòng)態(tài)冗余核心,對(duì)芯片的管理結(jié)構(gòu)進(jìn)行分組,對(duì)每個(gè)組采用組內(nèi)相互監(jiān)視的管理方法;對(duì)芯片的所有核心采用自適應(yīng)管理的方法;在每個(gè)組內(nèi)采用選舉的管理方法;對(duì)固定冗余核心采用硬件自喚醒的管理方法,對(duì)動(dòng)態(tài)冗余核心采用軟件自喚醒的管理方法。
具體實(shí)施方式
二:結(jié)合圖1說(shuō)明本實(shí)施方式,本實(shí)施方式是對(duì)具體實(shí)施方式
一所述的的基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法進(jìn)一步限定,所述對(duì)芯片的管理結(jié)構(gòu)進(jìn)行分組的方法為:按照不同層次主控核心的管轄區(qū)域?qū)π酒芾斫Y(jié)構(gòu)進(jìn)行分組:每組包括一個(gè)組長(zhǎng)核心和多個(gè)組員核心,所述組長(zhǎng)核心為芯片中某一層次上的主控核心,當(dāng)所述組員核心處于所述芯片管理結(jié)構(gòu)的最下層,則組員核心為計(jì)算核心,否則,組員核心為所述組長(zhǎng)核心下一級(jí)的主控核心;所述芯片管理結(jié)構(gòu)的每一層次上的主控核心還包括冗余核心;所述計(jì)算核心還包括冗余核心;經(jīng)上述分組后獲得的每個(gè)組采用組內(nèi)相互監(jiān)視的管理方法為:每組中所有工作的核心周期性的向該組其他核心發(fā)送自身的心跳數(shù)據(jù)包,該組的所有核心根據(jù)接收到的心跳數(shù)據(jù)包相應(yīng)的監(jiān)視該組的其他核心工作是否正常;所述所有核心還包括冗余核心。本方案中,每個(gè)層次都包含一定數(shù)量的固定冗余核心,并根據(jù)具體情況可能還包含一定數(shù)量的動(dòng)態(tài)冗余核心。除冗余核心以外,片上所有工作核心周期性地向組內(nèi)其他成員(包括冗余核心)發(fā)送自身的心跳數(shù)據(jù)包。在每個(gè)組內(nèi),組長(zhǎng)核心負(fù)責(zé)監(jiān)視組內(nèi)其他成員的心跳數(shù)據(jù)包;同時(shí),組員核心負(fù)責(zé)監(jiān)視組長(zhǎng)和其他組員的心跳數(shù)據(jù)包。圖1中,管理結(jié)構(gòu)包括四個(gè)層次,所述四個(gè)層次包括一級(jí)主控、二級(jí)主控、三級(jí)主控和計(jì)算機(jī)核心,所述一級(jí)主控為最高級(jí)主控。
具體實(shí)施方式
三:本實(shí)施方式是對(duì)具體實(shí)施方式
二所述的的基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法進(jìn)一步限定,所述對(duì)芯片的所有核心采用自適應(yīng)管理的方法為:每組的主控核心的職責(zé)至少包括冗余核心管理和動(dòng)態(tài)分組,所述芯片的所有核心根據(jù)當(dāng)前自身在管理層次中所處的角色而動(dòng)態(tài)選擇相應(yīng)的管理方法。如圖1所示,每個(gè)層次的主控核心都有各自的職責(zé)。
具體實(shí)施方式
四:本實(shí)施方式是對(duì)具體實(shí)施方式
三所述的的基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法進(jìn)一步限定,所述冗余核心管理的方法為:在芯片初始化時(shí),每組所有工作的核心都動(dòng)態(tài)保存著一份當(dāng)前片上剩余冗余核心列表;每當(dāng)有一個(gè)冗余核心被使用,則將所述冗余核心從剩余冗余核心列表中剔除;當(dāng)某工作的核心因負(fù)載過(guò)重而長(zhǎng)時(shí)間溫度過(guò)高時(shí),該組的主控核心根據(jù)剩余冗余核心列表中冗余核心的剩余情況進(jìn)行冗余核心的動(dòng)態(tài)調(diào)整,并在調(diào)整后廣播所述動(dòng)態(tài)調(diào)整,所有工作的核心根據(jù)廣播更新其自身保存的剩余冗余核心列表。
具體實(shí)施方式
五:本實(shí)施方式是對(duì)具體實(shí)施方式
三所述的的基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法進(jìn)一步限定,所述動(dòng)態(tài)分組的方法為:分組后,使每組的主控核心能根據(jù)當(dāng)前該組其他工作的核心的負(fù)載狀況和損壞情況向上一級(jí)的主控核心動(dòng)態(tài)申請(qǐng)空閑核心和申請(qǐng)解散該組;同時(shí),所述主控核心根據(jù)當(dāng)前該組冗余核心的使用情況為下一級(jí)的主控核心動(dòng)態(tài)分配空閑核心和批準(zhǔn)下一級(jí)的主控核心解散其所在組、并收回該組的所有核心。
具體實(shí)施方式
六:本實(shí)施方式是對(duì)具體實(shí)施方式
二所述的的基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法進(jìn)一步限定,所述在每個(gè)組內(nèi)采用選舉的管理方法為:組內(nèi)的所有核心都按選舉方法工作;所述選舉方法為當(dāng)組內(nèi)冗余核心不可用的情況下,需在該組內(nèi)剩余無(wú)故障的核心中選舉產(chǎn)生候選主控核心;在選舉完成之后,所述候選主控核心檢查該組內(nèi)是否還有剩余冗余核心可用,若有,則激活該冗余核心成為該組的主控核心;若否,則將自身提升為主控核心;所述冗余核心可用是指除下述兩種情況以外的所有情況:第一種、芯片的所有冗余核心都已用光;第二種、一級(jí)主控的主控核心發(fā)生故障。所述一級(jí)主控為最高級(jí)主控。一級(jí)主控的主控核心發(fā)生故障時(shí),候選組長(zhǎng)核心檢查該組內(nèi)是否還有剩余冗余核心可用,若有,則激活該冗余核心成為該組的組長(zhǎng)核心;若否,則將自身提升為組長(zhǎng)核心,如圖1中丨表示提升;對(duì)于管理計(jì)算核心的組長(zhǎng)核心,如果該組長(zhǎng)核心發(fā)現(xiàn)該組內(nèi)所有計(jì)算核心都已發(fā)生故障,且已經(jīng)沒(méi)有冗余核心可以替換,則原組長(zhǎng)核心降級(jí)為計(jì)算核心,如圖1中丨表示降級(jí)。
具體實(shí)施方式
七:結(jié)合圖2和圖3說(shuō)明本實(shí)施方式,本實(shí)施方式是對(duì)具體實(shí)施方式
六所述的的基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法進(jìn)一步限定,所述對(duì)固定冗余核心采用硬件自喚醒的管理方法為:每個(gè)固定冗余核心采用硬件自喚醒電路進(jìn)行自喚醒;所述硬件自喚醒電路包括數(shù)據(jù)包譯碼電路、看門(mén)狗電路和超時(shí)喚醒控制電路;硬件自喚醒電路的工作過(guò)程包括如下步驟:當(dāng)芯片正常工作時(shí),數(shù)據(jù)包譯碼電路對(duì)接收的數(shù)據(jù)包進(jìn)行譯碼,若判定譯碼后的數(shù)據(jù)包為來(lái)自組內(nèi)工作的核心發(fā)送的心跳數(shù)據(jù)包,則向超時(shí)喚醒控制電路發(fā)送結(jié)果有效信號(hào);否則,向超時(shí)喚醒控制電路發(fā)送結(jié)果無(wú)效信號(hào);超時(shí)喚醒控制電路根據(jù)數(shù)據(jù)譯碼電路發(fā)送來(lái)的信號(hào)判斷是否復(fù)位看門(mén)狗電路,若在看門(mén)狗電路計(jì)時(shí)的時(shí)間T內(nèi)收到數(shù)據(jù)包譯碼電路發(fā)送的結(jié)果有效信號(hào),則復(fù)位看門(mén)狗電路;若在看門(mén)狗電路計(jì)時(shí)的時(shí)間T內(nèi)沒(méi)有收到數(shù)據(jù)包譯碼電路發(fā)送的結(jié)果有效信號(hào)時(shí),則使能固定冗余核心的電源,將所述固定冗余核心喚醒,所述時(shí)間T設(shè)置為大于N次所述固定冗余核心所在組內(nèi)采用選舉機(jī)制選舉替換的時(shí)間,N為芯片管理結(jié)構(gòu)的層次總數(shù)。如圖3所示,所述硬件自喚醒電路位于路由器和核心之間的網(wǎng)絡(luò)接口(NetworkInterface, NI)中,其輸出用來(lái)控制片上固定冗余核心的電源使能電路。
具體實(shí)施方式
八:本實(shí)施方式是對(duì)具體實(shí)施方式
一所述的的基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法進(jìn)一步限定,對(duì)動(dòng)態(tài)冗余核心采用軟件自喚醒的管理方法為;為每個(gè)動(dòng)態(tài)冗余核心設(shè)置定時(shí)器超時(shí)喚醒,且處于睡眠狀態(tài);當(dāng)動(dòng)態(tài)冗余核心發(fā)生定時(shí)器中斷時(shí),關(guān)閉動(dòng)態(tài)冗余核心的睡眠狀態(tài)并判斷動(dòng)態(tài)冗余核心的睡眠時(shí)間是否已經(jīng)到達(dá)T,若否,則動(dòng)態(tài)冗余核心再次進(jìn)入睡眠狀態(tài),若是,則進(jìn)行歷時(shí)時(shí)間T的監(jiān)聽(tīng),并在時(shí)間T內(nèi)判斷是否收到動(dòng)態(tài)冗余核心所在組內(nèi)的所有工作的核心發(fā)送的心跳數(shù)據(jù)包,若是,則動(dòng)態(tài)冗余核心再次進(jìn)入睡眠狀態(tài),若否,則將所述動(dòng)態(tài)冗余核心激活。本發(fā)明的容錯(cuò)方法,從本質(zhì)上確保眾核芯片的管理結(jié)構(gòu)能夠根據(jù)芯片的具體損壞情況而進(jìn)行自適應(yīng)地調(diào)整,以保證芯片能夠充分利用剩余片上資源盡力完成應(yīng)用任務(wù),即保證在發(fā)生核心故障的情況下達(dá)到芯片服務(wù)時(shí)間的最大化。
權(quán)利要求
1.基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法,其特征在于,所述基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)中包括有多個(gè)核心,所述多個(gè)核心包括各層次的主控核心和冗余核心,所述冗余核心分為固定冗余核心和動(dòng)態(tài)冗余核心,對(duì)芯片的管理結(jié)構(gòu)進(jìn)行分組,對(duì)每個(gè)組采用組內(nèi)相互監(jiān)視的管理方法;對(duì)芯片的所有核心采用自適應(yīng)管理的方法;在每個(gè)組內(nèi)采用選舉的管理方法;對(duì)固定冗余核心采用硬件自喚醒的管理方法,對(duì)動(dòng)態(tài)冗余核心采用軟件自喚醒的管理方法。
2.根據(jù)權(quán)利要求1所述的基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法,其特征在于,所述對(duì)芯片的管理結(jié)構(gòu)進(jìn)行分組的方法為: 按照不同層次主控核心的管轄區(qū)域?qū)π酒芾斫Y(jié)構(gòu)進(jìn)行分組:每組包括一個(gè)組長(zhǎng)核心和多個(gè)組員核心,所述組長(zhǎng)核心為芯片中某一層次上的主控核心,當(dāng)所述組員核心處于所述芯片管理結(jié)構(gòu)的最下層,則組員核心為計(jì)算核心,否則,組員核心為所述組長(zhǎng)核心下一級(jí)的主控核心;所述芯片管理結(jié)構(gòu)的每一層次上的主控核心還包括冗余核心;所述計(jì)算核心還包括冗余核心; 經(jīng)上述分組后獲得的每個(gè)組采用組內(nèi)相互監(jiān)視的管理方法為:每組中所有工作的核心周期性的向該組其他核心發(fā)送自身的心跳數(shù)據(jù)包,該組的所有核心根據(jù)接收到的心跳數(shù)據(jù)包相應(yīng)的監(jiān)視該組的其他核心工作是否正常;所述所有核心還包括冗余核心。
3.根據(jù)權(quán)利要求2所述的基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法,其特征在于,所述對(duì)芯片的所有核心采用自適應(yīng)管理的方法為: 每組的主控核心的職責(zé)至少包括冗余核心管理和動(dòng)態(tài)分組,所述芯片的所有核心根據(jù)當(dāng)前自身在管理層次中所處的角色而動(dòng)態(tài)選擇相應(yīng)的管理方法。
4.根據(jù)權(quán)利要求3所述的基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法,其特征在于,所述冗余核心管理的方 法為: 在芯片初始化時(shí),每組所有工作的核心都動(dòng)態(tài)保存著一份當(dāng)前片上剩余冗余核心列表;每當(dāng)有一個(gè)冗余核心被使用,則將所述冗余核心從剩余冗余核心列表中剔除;當(dāng)某工作的核心因負(fù)載過(guò)重而長(zhǎng)時(shí)間溫度過(guò)高時(shí),該組的主控核心根據(jù)剩余冗余核心列表中冗余核心的剩余情況進(jìn)行冗余核心的動(dòng)態(tài)調(diào)整,并在調(diào)整后廣播所述動(dòng)態(tài)調(diào)整,所有工作的核心根據(jù)廣播更新其自身保存的剩余冗余核心列表。
5.根據(jù)權(quán)利要求3所述的基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法,其特征在于,所述動(dòng)態(tài)分組的方法為:分組后,使每組的主控核心能根據(jù)當(dāng)前該組其他工作的核心的負(fù)載狀況和損壞情況向上一級(jí)的主控核心動(dòng)態(tài)申請(qǐng)空閑核心和申請(qǐng)解散該組;同時(shí),所述主控核心根據(jù)當(dāng)前該組冗余核心的使用情況為下一級(jí)的主控核心動(dòng)態(tài)分配空閑核心和批準(zhǔn)下一級(jí)的主控核心解散其所在組、并收回該組的所有核心。
6.根據(jù)權(quán)利要求2所述的基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法,其特征在于,所述在每個(gè)組內(nèi)采用選舉的管理方法為: 組內(nèi)的所有核心都按選舉方法工作;所述選舉方法為當(dāng)組內(nèi)冗余核心不可用的情況下,需在該組內(nèi)剩余無(wú)故障的核心中選舉產(chǎn)生候選主控核心;在選舉完成之后,所述候選主控核心檢查該組內(nèi)是否還有剩余冗余核心可用,若有,則激活該冗余核心成為該組的主控核心;若否,則將自身提升為主控核心; 所述冗余核心可用是指除下述兩種情況以外的所有情況:第一種、芯片的所有冗余核心都已用光; 第二種、一級(jí)主控的主控核心發(fā)生故障。
7.根據(jù)權(quán)利要求6所述的基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法,其特征在于,所述對(duì)固定冗余核心采用硬件自喚醒的管理方法為: 每個(gè)固定冗余核心采用硬件自喚醒電路進(jìn)行自喚醒; 所述硬件自喚醒電路包括數(shù)據(jù)包譯碼電路、看門(mén)狗電路和超時(shí)喚醒控制電路; 硬件自喚醒電路的工作過(guò)程包括如下步驟: 當(dāng)芯片正常工作時(shí),數(shù)據(jù)包譯碼電路對(duì)接收的數(shù)據(jù)包進(jìn)行譯碼,若判定譯碼后的數(shù)據(jù)包為來(lái)自組內(nèi)工作的核心發(fā)送的心跳數(shù)據(jù)包,則向超時(shí)喚醒控制電路發(fā)送結(jié)果有效信號(hào);否則,向超時(shí)喚醒控制電路發(fā)送結(jié)果無(wú)效信號(hào); 超時(shí)喚醒控制電路根據(jù)數(shù)據(jù)譯碼電路發(fā)送來(lái)的信號(hào)判斷是否復(fù)位看門(mén)狗電路,若在看門(mén)狗電路計(jì)時(shí)的時(shí)間T內(nèi)收到數(shù)據(jù)包譯碼電路發(fā)送的結(jié)果有效信號(hào),則復(fù)位看門(mén)狗電路;若在看門(mén)狗電路計(jì)時(shí)的時(shí)間T內(nèi)沒(méi)有收到數(shù)據(jù)包譯碼電路發(fā)送的結(jié)果有效信號(hào)時(shí),則使能固定冗余核心的電源,將所述固定冗余核心喚醒,所述時(shí)間T設(shè)置為大于N次所述固定冗余核心所在組內(nèi)采用選舉機(jī)制選舉替換的時(shí)間,N為芯片管理結(jié)構(gòu)的層次總數(shù)。
8.根據(jù)權(quán)利要求1所述的基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法,其特征在于,對(duì)動(dòng)態(tài)冗余核心采用軟件自喚醒的管理方法為; 為每個(gè)動(dòng)態(tài)冗余核心設(shè)置定時(shí)器超時(shí)喚醒,且處于睡眠狀態(tài); 當(dāng)動(dòng)態(tài)冗余核心發(fā)生定時(shí)器中斷時(shí),關(guān)閉動(dòng)態(tài)冗余核心的睡眠狀態(tài)并判斷動(dòng)態(tài)冗余核心的睡眠是否已經(jīng)到 達(dá)T,若否,則動(dòng)態(tài)冗余核心再次進(jìn)入睡眠狀態(tài),若是,則進(jìn)行歷時(shí)時(shí)間T的監(jiān)聽(tīng),并在時(shí)間T內(nèi)判斷是否收到動(dòng)態(tài)冗余核心所在組內(nèi)的所有工作的核心發(fā)送的心跳數(shù)據(jù)包,若是,則動(dòng)態(tài)冗余核心再次進(jìn)入睡眠狀態(tài),若否,則將所述動(dòng)態(tài)冗余核心激活。
全文摘要
基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)容錯(cuò)的方法,涉及一種容錯(cuò)方法。為了解決某些重要的管理核心及其冗余核心全都發(fā)生故障,則即使片上剩余的核心數(shù)量再多也無(wú)法維持芯片的繼續(xù)工作,從而導(dǎo)致整塊芯片過(guò)早報(bào)廢的問(wèn)題。所述方法包括基于片上網(wǎng)絡(luò)的眾核芯片管理結(jié)構(gòu)中包括有多個(gè)核心,所述多個(gè)核心包括各層次的主控核心和冗余核心,所述冗余核心分為固定冗余核心和動(dòng)態(tài)冗余核心,對(duì)芯片的管理結(jié)構(gòu)進(jìn)行分組,對(duì)每個(gè)組采用組內(nèi)相互監(jiān)視的管理方法;對(duì)芯片的所有核心采用自適應(yīng)管理的方法;在每個(gè)組內(nèi)采用選舉的管理方法;對(duì)固定冗余核心采用硬件自喚醒的管理方法,對(duì)動(dòng)態(tài)冗余核心采用軟件自喚醒的管理方法。本方法用于對(duì)眾核芯片的管理結(jié)構(gòu)進(jìn)行容錯(cuò)。
文檔編號(hào)G06F11/16GK103197994SQ201310150849
公開(kāi)日2013年7月10日 申請(qǐng)日期2013年4月26日 優(yōu)先權(quán)日2013年4月26日
發(fā)明者王進(jìn)祥, 吳子旭, 付方發(fā), 路禹 申請(qǐng)人:哈爾濱工業(yè)大學(xué)