專利名稱:一種陣列處理器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于半導(dǎo)體芯片技術(shù)領(lǐng)域,具體涉及一種陣列處理器。
背景技術(shù):
陣列處理器(Array Processor)具有強(qiáng)大的計(jì)算能力,高度靈活的可配置性和可 擴(kuò)展性,逐漸成為高性能集成電路的發(fā)展方向。然而由于半導(dǎo)體芯片的制造工藝復(fù)雜,陣列 處理器集成越來(lái)越多的計(jì)算單元,導(dǎo)致生產(chǎn)過(guò)程易產(chǎn)生芯片缺陷,這些缺陷可能會(huì)使芯片 不能正常工作或失效,造成芯片廢棄,大大降低芯片的良率和可靠性,提高芯片生產(chǎn)成本。
由于工藝不穩(wěn)定性,在某些特定環(huán)境下(如高溫或者受到某類射線的干擾),芯片 中某些模塊在運(yùn)行中也會(huì)出現(xiàn)失效的現(xiàn)象,導(dǎo)致芯片整體功能錯(cuò)誤。 現(xiàn)有的陣列處理器容錯(cuò)檢測(cè)技術(shù),大多針對(duì)芯片由于制造工藝問(wèn)題出現(xiàn)的硬失效 情況,即在芯片正常工作之前,通過(guò)容錯(cuò)電路判斷芯片是否出現(xiàn)故障,繼而采取規(guī)避措施提 升芯片良率。但無(wú)法檢測(cè)和糾正正常工作中由于環(huán)境參數(shù)發(fā)生改變導(dǎo)致的芯片失效,無(wú)法 保證陣列處理器在惡劣環(huán)境下的穩(wěn)定工作。
發(fā)明內(nèi)容
本發(fā)明要解決的問(wèn)題是克服現(xiàn)有陣列處理器無(wú)法在正常工作中進(jìn)行故障檢測(cè),提 供一種陣列處理器,實(shí)現(xiàn)了陣列處理器在正常工作中的故障檢測(cè)。 為實(shí)現(xiàn)上述目的,本發(fā)明提供的技術(shù)方案是一種陣列處理器,包括多個(gè)由計(jì)算單 元和通訊單元相連組成的功能單元,所述功能單元之間相連形成網(wǎng)絡(luò),還包括至少一個(gè)故 障檢測(cè)單元,所述故障檢測(cè)單元與其鄰近的功能單元相連接,用于對(duì)功能單元進(jìn)行故障檢 本發(fā)明實(shí)施例中,所述故障檢測(cè)單元包括學(xué)習(xí)模塊、第一存儲(chǔ)器和比較模塊,其 中 學(xué)習(xí)模塊,與所述功能單元相連,用于獲取所述功能單元的參考狀態(tài)值并產(chǎn)生與 該功能單元對(duì)應(yīng)的故障匹配因子; 第一存儲(chǔ)器,與學(xué)習(xí)模塊連接,用于存儲(chǔ)故障匹配因子; 比較模塊,分別與所述功能單元和第一存儲(chǔ)器連接,用于比較所檢測(cè)的功能單元
的狀態(tài)信息與其對(duì)應(yīng)的故障匹配因子的相似度或相反度,判斷功能單元是否出現(xiàn)故障。 本發(fā)明實(shí)施例中,所述陣列處理器還包括一定數(shù)量的閑置功能單元,所述故障檢
測(cè)單元的檢測(cè)結(jié)果輸出端與通訊單元相連,當(dāng)某個(gè)功能單元檢測(cè)為故障時(shí),該功能單元的
通訊單元啟動(dòng)重構(gòu)操作,激活一個(gè)閑置功能單元代替所述故障功能單元。 與現(xiàn)有技術(shù)相比,本發(fā)明通過(guò)在陣列處理器中加入多個(gè)故障檢測(cè)單元,多個(gè)故障
檢測(cè)單元之間互相連接形成檢測(cè)網(wǎng)絡(luò),每個(gè)故障檢測(cè)單元負(fù)責(zé)對(duì)周圍區(qū)域內(nèi)的功能單元進(jìn)
行檢測(cè)檢測(cè),從而實(shí)現(xiàn)正常工作時(shí)對(duì)整個(gè)陣列處理器芯片的故障檢測(cè)功能。 進(jìn)一步的,故障檢測(cè)單元還可以根據(jù)自身狀態(tài)的變化進(jìn)行學(xué)習(xí)并總結(jié)規(guī)則,通過(guò)實(shí)時(shí)比較功能單元的狀態(tài)與規(guī)則得到檢測(cè)結(jié)果,根據(jù)檢測(cè)結(jié)果規(guī)避故障單元,使陣列處理 器具有動(dòng)態(tài)容錯(cuò)能力,保證陣列處理器在工作中出現(xiàn)軟失效時(shí),能通過(guò)實(shí)時(shí)內(nèi)建的故障檢 測(cè)單元進(jìn)行功能糾錯(cuò)和修復(fù),實(shí)施冗余功能單元重構(gòu),從而提高陣列處理器的可靠性,保證 自身任務(wù)的正確執(zhí)行,大大提高了陣列處理器在各種環(huán)境下工作的可靠性,延長(zhǎng)了陣列處 理器的工作壽命。
圖1是本發(fā)明實(shí)施例提供的一種陣列處理器結(jié)構(gòu)示意圖; 圖2是本發(fā)明實(shí)施例提供的一種故障檢測(cè)單元結(jié)構(gòu)示意圖; 圖3是本發(fā)明實(shí)施例提供的一種故障檢測(cè)單元結(jié)構(gòu)示意圖; 圖4是本實(shí)施例提供的一種功能單元接收故障檢測(cè)單元檢測(cè)順序示意圖。
具體實(shí)施例方式
下面通過(guò)具體的實(shí)施例并結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)的描述。 本發(fā)明的基本思想是通過(guò)在陣列處理器中加入多個(gè)故障檢測(cè)單元,多個(gè)故障檢測(cè)
單元之間互相連接形成檢測(cè)網(wǎng)絡(luò),每個(gè)故障檢測(cè)單元負(fù)責(zé)對(duì)周圍區(qū)域內(nèi)的功能單元進(jìn)行檢
測(cè)檢測(cè),從而實(shí)現(xiàn)正常工作時(shí)對(duì)整個(gè)陣列處理器芯片的故障檢測(cè)功能。 請(qǐng)參閱圖1所示,圖1為本發(fā)明實(shí)施例提供的一個(gè)基本的陣列處理器加上故障檢 測(cè)網(wǎng)絡(luò)組成的可容錯(cuò)陣列處理器結(jié)構(gòu)示意圖。其中,陣列處理器網(wǎng)絡(luò)包括若干計(jì)算單元 (Processing Element,PE) 1、通訊單元(本實(shí)施例為路由單元Router或交換單元Switch, R/S) 2、以及連接所述計(jì)算單元1和通訊單元2的互聯(lián)網(wǎng)絡(luò)3。計(jì)算單元1和通訊單元2組 成一個(gè)功能單元。所述功能單元之間通過(guò)互聯(lián)網(wǎng)絡(luò)3網(wǎng)狀連接。計(jì)算單元l用于處理數(shù)據(jù), 通訊單元2用于功能單元之間的通訊,計(jì)算單元1通過(guò)通訊單元2與周圍的計(jì)算單元1進(jìn) 行通訊。本發(fā)明還在陣列處理器中加入故障檢測(cè)單元4,所述故障檢測(cè)單元4與其鄰近的功 能單元相連接,每個(gè)故障檢測(cè)單元4對(duì)其連接的功能單元進(jìn)行故障檢測(cè)。所述故障檢測(cè)單 元4可以位于功能單元中的計(jì)算單元1或通訊單元2中,也可以獨(dú)立于計(jì)算單元1和通訊 單元2,設(shè)置在每個(gè)功能單元之間。 本發(fā)明實(shí)施例中,所述計(jì)算單元1和通訊單元2都是可配置的,通過(guò)配置所述計(jì)算 單元1可以改變各個(gè)計(jì)算單元的具體功能,通過(guò)配置所述通訊單元2可以改變計(jì)算單元1 間的連接結(jié)構(gòu),從而滿足不同的算法要求。 所述故障檢測(cè)單元4之間可復(fù)用陣列中功能單元連線5,也可通過(guò)專用連線6相 互連接,形成故障檢測(cè)網(wǎng)絡(luò)。故障檢測(cè)網(wǎng)絡(luò)和陣列處理器網(wǎng)絡(luò)之間通過(guò)連線5連接起來(lái),實(shí) 現(xiàn)故障檢測(cè)單元4對(duì)陣列功能單元的檢測(cè)。每個(gè)故障檢測(cè)單元4對(duì)其近鄰范圍內(nèi)的功能單 元進(jìn)行故障檢測(cè),其負(fù)責(zé)檢測(cè)的功能單元可以是一個(gè),也可以是鄰近的多個(gè)(本實(shí)施例為4 個(gè))。每個(gè)故障檢測(cè)單元4所作用的區(qū)域可以是相互獨(dú)立的,也可以是重疊的,根據(jù)具體的 設(shè)計(jì)約束、容錯(cuò)能力需求和制造工藝等因素確定。同樣,每個(gè)功能單元可以接受鄰近的一個(gè) 故障檢測(cè)單元4檢測(cè),也可接受鄰近多個(gè)(本實(shí)施例為4個(gè))故障檢測(cè)單元4檢測(cè)。檢測(cè) 的內(nèi)容可以是功能單元工作狀態(tài),也可是功能單元的運(yùn)行結(jié)果,如標(biāo)志位和操作碼等,這些 信息可從功能單元的寄存器或存儲(chǔ)器中讀出。
此外,本發(fā)明陣列處理器的陣列兩側(cè)分別增加一列的閑置功能單元(圖中未示 出)。當(dāng)故障檢測(cè)單元4檢測(cè)出某一功能單元出現(xiàn)故障時(shí),故障的功能單元將相應(yīng)的故障信 號(hào)線置位,與該故障的功能單元相關(guān)的通訊單元2將接收到這個(gè)信號(hào),并由該通訊單元2啟 動(dòng)重構(gòu)操作,激活附近的閑置功能單元代替該故障的功能單元。 請(qǐng)參閱圖2所示,圖2是本實(shí)施例提供的一種故障檢測(cè)單元結(jié)構(gòu)示意圖。所述故 障檢測(cè)單元4包括學(xué)習(xí)模塊41、第一存儲(chǔ)器42、比較模塊43、檢測(cè)網(wǎng)絡(luò)輸入多路器44、功能 單元狀態(tài)信息輸入多路器45、檢測(cè)結(jié)果輸出多路器46、檢測(cè)網(wǎng)絡(luò)輸出多路器47、計(jì)數(shù)器48 和定時(shí)器49。 請(qǐng)參閱圖3所示,本發(fā)明實(shí)施例中,所述學(xué)習(xí)模塊41進(jìn)一步包括第二存儲(chǔ)器411、 隨機(jī)值產(chǎn)生器412和匹配因子選擇模塊413。其中,第二存儲(chǔ)器411與隨機(jī)值產(chǎn)生器412相 連接,用于存儲(chǔ)各個(gè)待測(cè)功能單元的參考狀態(tài)值(例如標(biāo)志位、特征碼)。所述參考狀態(tài)值 會(huì)根據(jù)待測(cè)功能單元輸入的狀態(tài)信息在學(xué)習(xí)時(shí)間范圍內(nèi)進(jìn)行更新。隨機(jī)值產(chǎn)生器412根據(jù) 功能單元的參考狀態(tài)值產(chǎn)生隨機(jī)值作為候選故障匹配因子,匹配因子選擇模塊413通過(guò)執(zhí) 行選擇算法,從候選故障匹配因子中選取較優(yōu)的故障匹配因子作為陣列處理器判斷功能單 元是否故障的判斷條件,然后將選出的故障匹配因子存儲(chǔ)在第一存儲(chǔ)器42中。該模塊可由
狀態(tài)機(jī)實(shí)現(xiàn),也可采用程序控制器的實(shí)現(xiàn)方案;特別的,選擇算法包括但不限于正向選擇算
法、反向選擇算法、克隆選擇算法等借鑒生物免疫學(xué)原理的自學(xué)習(xí)方法。當(dāng)功能單元的狀態(tài)
信息正常時(shí),即故障檢測(cè)單元認(rèn)為狀態(tài)轉(zhuǎn)換是正常的時(shí)候,學(xué)習(xí)模塊41會(huì)根據(jù)當(dāng)前的功能
單元狀態(tài)與原有的參考狀態(tài)值進(jìn)行比較,假設(shè)將當(dāng)前功能單元狀態(tài)值替換掉參考狀態(tài)值中
的一個(gè)可以使得這組參考狀態(tài)值內(nèi)部呈現(xiàn)更大的差異,則進(jìn)行該替換操作,形成新的參考
狀態(tài)值組。同時(shí)學(xué)習(xí)模塊41在新的參考狀態(tài)值基礎(chǔ)上產(chǎn)生更優(yōu)的故障匹配因子。該過(guò)程
實(shí)現(xiàn)了故障檢測(cè)單元的自學(xué)習(xí)和自適應(yīng)。在芯片剛開(kāi)始工作的一段時(shí)間內(nèi),故障檢測(cè)單元
4所寄存的規(guī)則很大程度上反映的是預(yù)設(shè)的規(guī)則,當(dāng)陣列處理器運(yùn)行了一段時(shí)間之后,功能
單元的運(yùn)行狀態(tài)通過(guò)自學(xué)習(xí)機(jī)制對(duì)功能單元狀態(tài)規(guī)則的影響將越來(lái)越大。 所述故障匹配因子由一段二進(jìn)制碼表示,二進(jìn)制碼的內(nèi)容及碼長(zhǎng)可以是預(yù)先設(shè)置
好的,也可以由學(xué)習(xí)模塊41通過(guò)觀察功能單元正常工作一段時(shí)間后總結(jié)得到,也可以從其
他故障檢測(cè)單元4交換得到。 學(xué)習(xí)模塊41的輸入主要有第一存儲(chǔ)器42寄存的故障匹配因子、當(dāng)前功能單元的 狀態(tài)信息和通過(guò)檢測(cè)網(wǎng)絡(luò)傳送過(guò)來(lái)的鄰近故障檢測(cè)單元所存儲(chǔ)的故障匹配因子。
本發(fā)明實(shí)施例中,所述學(xué)習(xí)模塊41產(chǎn)生故障匹配因子的流程是若候選故障匹配 因子與所述參考狀態(tài)值的相似度低于一定閾值(該閾值可由設(shè)計(jì)者自定義),并且第一存 儲(chǔ)器42中故障匹配因子的數(shù)量尚未達(dá)到預(yù)設(shè)上限,則直接將該候選故障匹配因子存入第 一存儲(chǔ)器42中,否則將候選故障匹配因子與存儲(chǔ)器中所檢測(cè)的功能單元對(duì)應(yīng)的故障匹配 因子比較,判斷候選故障匹配因子相似度是否大于相似度最大者,或者相反度是否大于相 反度最大者,如果滿足條件則用該候選故障匹配因子替換存儲(chǔ)器中原有的相似度最大,或 者相反度最大的那個(gè)故障匹配因子,否則放棄該候選故障匹配因子。 本發(fā)明實(shí)施例中,由于每個(gè)故障檢測(cè)單元4對(duì)鄰近4個(gè)功能單元進(jìn)行檢測(cè),所以第
一存儲(chǔ)器42被劃分為四部分,分別記錄四個(gè)功能單元的故障匹配因子。 舉例說(shuō)明,本實(shí)施例中第一存儲(chǔ)器42中最多只能存儲(chǔ)N個(gè)故障匹配因子,那么對(duì)應(yīng)于某個(gè)功能單元就有N/4個(gè)故障匹配因子,故障檢測(cè)單元4在檢測(cè)該功能單元時(shí),將該功 能單元的狀態(tài)信息與N/4個(gè)故障匹配因子比較,在比較時(shí)可以采用一一比較然后統(tǒng)計(jì)分?jǐn)?shù) 的形式判斷功能單元是正常還是故障,或者當(dāng)比較到某個(gè)故障匹配因子判斷功能單元為故 障時(shí)即不用再繼續(xù)進(jìn)行比較的方式。 所述第一存儲(chǔ)器42和第二存儲(chǔ)器411可以是市場(chǎng)上各類存儲(chǔ)介質(zhì)的存儲(chǔ)器,包括 但不限于SRAM (Static RAM)、寄存器等。特別的,本發(fā)明中第一存儲(chǔ)器42和第二存儲(chǔ)器411 可以是同一個(gè)存儲(chǔ)器。 所述比較模塊43接收當(dāng)前功能單元1狀態(tài)信息和第一存儲(chǔ)器42相應(yīng)存儲(chǔ)器段的 故障匹配因子,將當(dāng)前功能單元狀態(tài)按照一定的規(guī)則(例如連續(xù)相同位、海明距離、位間約 束等)與相應(yīng)存儲(chǔ)器段的故障匹配因子進(jìn)行比較。如果功能單元的狀態(tài)信息與故障匹配因 子在一定程度上相似或相反,則認(rèn)為該功能單元出現(xiàn)故障。如果學(xué)習(xí)模塊41采用的是正向 選擇算法,則產(chǎn)生的故障匹配因子表達(dá)的是故障信息,則比較相似程度,如果相似程度大于
一定閥值,則認(rèn)為功能單元故障;如果學(xué)習(xí)模塊41采用的是反向選擇算法,則產(chǎn)生的故障 匹配因子表達(dá)的是正常信息,則比較相反程度,如果相反程度小于一定閥值,則認(rèn)為功能單 元故障。所述閥值由設(shè)計(jì)者根據(jù)實(shí)際經(jīng)驗(yàn)選取恰當(dāng)值。相似或相反程度的確定由比較模塊 43完成。同時(shí),通過(guò)檢測(cè)結(jié)果輸出多路器46發(fā)出信號(hào)通知負(fù)責(zé)實(shí)施重配置的單元(在本實(shí) 施例中為路由單元或交換單元)。 所述計(jì)數(shù)器48與第一存儲(chǔ)器42、功能單元狀態(tài)信息輸入多路器45、和檢測(cè)結(jié)果輸 出多路器46相連接,用于控制第一存儲(chǔ)器42 、功能單元狀態(tài)信息輸入多路器45和檢測(cè)結(jié)果 輸出多路器46。計(jì)數(shù)器48作為選擇信號(hào),使故障檢測(cè)單元4按一定順序輪流檢測(cè)鄰近的四 個(gè)功能單元。 而對(duì)于任何一個(gè)功能單元,在一個(gè)具體實(shí)施例中,按照?qǐng)D4所示,從0到3的順序, 在每個(gè)時(shí)刻都會(huì)有一個(gè)故障檢測(cè)單元對(duì)其進(jìn)行檢測(cè)。即在同一時(shí)間內(nèi),故障檢測(cè)單元4只 對(duì)一個(gè)功能單元進(jìn)行故障檢測(cè)。例如,當(dāng)計(jì)數(shù)器48為3時(shí),故障檢測(cè)單元4檢測(cè)的是其左 下角的功能單元。這時(shí),功能單元狀態(tài)輸入多路器45會(huì)選擇右上角功能單元的狀態(tài)輸入, 使它與存儲(chǔ)器段3所寄存的狀態(tài)規(guī)則相比較,其結(jié)果會(huì)送到檢測(cè)結(jié)果輸出多路器46,而下 一次計(jì)數(shù)器48的值是0時(shí),則對(duì)該故障檢測(cè)單元4的右下角的功能單元進(jìn)行檢測(cè),如此循 環(huán)檢測(cè)。 本發(fā)明實(shí)施例中,由于每個(gè)故障檢測(cè)單元4對(duì)鄰近4個(gè)功能單元進(jìn)行檢測(cè),所以計(jì) 數(shù)器48采用了 0-3計(jì)數(shù)器,檢測(cè)網(wǎng)絡(luò)輸入多路器44、功能單元狀態(tài)信息輸入多路器45、檢 測(cè)結(jié)果輸出多路器46、檢測(cè)網(wǎng)絡(luò)輸出多路器47均采用4-1多路器。 本發(fā)明實(shí)施例中,所述定時(shí)器49與學(xué)習(xí)模塊41相連接,用來(lái)計(jì)時(shí),在一段給定時(shí) 間內(nèi)控制學(xué)習(xí)模塊41對(duì)功能單元自身狀態(tài)進(jìn)行監(jiān)測(cè),通過(guò)自學(xué)習(xí)方法獲得故障匹配因子, 即在系統(tǒng)正常工作一段時(shí)間后,故障檢測(cè)單元4才能有效進(jìn)行故障檢測(cè)。多個(gè)故障檢測(cè)單 元4可以共用一個(gè)定時(shí)器。 本發(fā)明實(shí)施中,如果功能單元檢測(cè)為故障,發(fā)出信號(hào)通知負(fù)責(zé)實(shí)施重配置的單元, 本實(shí)施例中負(fù)責(zé)實(shí)施重配置的單元為路由單元或交換單元。當(dāng)故障檢測(cè)單元4檢測(cè)出某一 功能單元出現(xiàn)故障時(shí),故障的功能單元4將相應(yīng)的故障信號(hào)線置位,與該故障功能單元相 關(guān)的路由單元或交換單元將接收到這個(gè)信號(hào),并由該路由單元或交換單元啟動(dòng)重構(gòu)操作,激活附近的閑置功能單元代替該故障功能單元。 需要說(shuō)明的是,在陣列處理器工作前,本發(fā)明實(shí)施例會(huì)先進(jìn)行算法映射以確定陣
列上各個(gè)功能單元的任務(wù)以及功能單元間的連接關(guān)系。確定了各個(gè)功能單元所負(fù)責(zé)的任務(wù)
后,就可以獲得相應(yīng)功能單元的基本參考狀態(tài)值。完成功能單元的配置或程序加載后,通過(guò)
檢測(cè)網(wǎng)絡(luò)將各個(gè)功能單元的基本參考狀態(tài)值加載到相應(yīng)的檢測(cè)單元的比較模塊中對(duì)應(yīng)于
該功能單元的存儲(chǔ)器段,加載完成后再配置好通訊單元,讓處理器開(kāi)始正常工作。 綜上所述,本發(fā)明提供一種陣列處理器,通過(guò)在陣列處理器中加入多個(gè)故障檢測(cè)
單元,多個(gè)故障檢測(cè)單元之間互相連接形成檢測(cè)網(wǎng)絡(luò),每個(gè)故障檢測(cè)單元負(fù)責(zé)對(duì)周圍區(qū)域
內(nèi)的功能單元進(jìn)行檢測(cè)檢測(cè),從而實(shí)現(xiàn)對(duì)整個(gè)陣列處理器芯片的檢測(cè)功能。 同時(shí),故障檢測(cè)單元還可以根據(jù)自身狀態(tài)的變化進(jìn)行學(xué)習(xí)并總結(jié)規(guī)則,通過(guò)實(shí)時(shí)
比較功能單元的狀態(tài)與規(guī)則得到檢測(cè)結(jié)果,根據(jù)檢測(cè)結(jié)果規(guī)避故障單元,使陣列處理器具
有動(dòng)態(tài)容錯(cuò)能力,保證陣列處理器在工作中出現(xiàn)軟失效時(shí),能通過(guò)實(shí)時(shí)內(nèi)建的故障檢測(cè)單
元進(jìn)行功能糾錯(cuò)和修復(fù),實(shí)施冗余功能單元重構(gòu),提高陣列處理器的可靠性,保證自身任務(wù)
的正確執(zhí)行,大大提高了陣列處理器在各種環(huán)境下工作的可靠性,延長(zhǎng)了陣列處理器的工
作壽命。 以上內(nèi)容是結(jié)合具體的優(yōu)選實(shí)施方式對(duì)本發(fā)明所作的進(jìn)一步詳細(xì)說(shuō)明,不能認(rèn)定 本發(fā)明的具體實(shí)施只局限于這些說(shuō)明。對(duì)于本發(fā)明所屬技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在 不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干簡(jiǎn)單推演或替換,都應(yīng)當(dāng)視為屬于本發(fā)明的 保護(hù)范圍。
權(quán)利要求
一種陣列處理器,包括多個(gè)由計(jì)算單元和通訊單元相連組成的功能單元,所述功能單元之間相連形成網(wǎng)絡(luò),其特征在于,還包括至少一個(gè)故障檢測(cè)單元,所述故障檢測(cè)單元與其鄰近的功能單元相連接,用于對(duì)功能單元進(jìn)行故障檢測(cè)。
2. 根據(jù)權(quán)利要求1所述的陣列處理器,其特征在于,所述故障檢測(cè)單元包括學(xué)習(xí)模塊、 第一存儲(chǔ)器和比較模塊,其中學(xué)習(xí)模塊,與所述功能單元相連,用于獲取所述功能單元的參考狀態(tài)值并產(chǎn)生與該功 能單元對(duì)應(yīng)的故障匹配因子;第一存儲(chǔ)器,與學(xué)習(xí)模塊連接,用于存儲(chǔ)故障匹配因子;比較模塊,分別與所述功能單元和第一存儲(chǔ)器連接,用于比較所檢測(cè)的功能單元的狀 態(tài)信息與其對(duì)應(yīng)的故障匹配因子的相似度或相反度,判斷功能單元是否出現(xiàn)故障。
3. 根據(jù)權(quán)利要求2所述的陣列處理器,其特征在于,所述學(xué)習(xí)模塊包括第二存儲(chǔ)器、隨 機(jī)值產(chǎn)生器以及匹配因子選擇模塊,其中第二存儲(chǔ)器,用于存儲(chǔ)待測(cè)功能單元的參考狀態(tài)值;隨機(jī)值產(chǎn)生器,其一端與第二存儲(chǔ)器連接,用于根據(jù)功能單元的參考狀態(tài)值隨機(jī)產(chǎn)生 故障匹配因子;匹配因子選擇模塊,與隨機(jī)值產(chǎn)生器連接,用于通過(guò)執(zhí)行選擇算法,從候選故障匹配因 子中選取所述故障匹配因子。
4. 根據(jù)權(quán)利要求3所述的陣列處理器,其特征在于,所述匹配因子選擇模塊用于判斷 所述第一存儲(chǔ)器中的故障匹配因子的數(shù)量是否達(dá)到預(yù)設(shè)上限,如果尚未達(dá)到預(yù)設(shè)上限,則 直接將該候選故障匹配因子存入存儲(chǔ)器中;如果已達(dá)到預(yù)設(shè)上限,則將候選故障匹配因子 與第一存儲(chǔ)器中所檢測(cè)的功能單元對(duì)應(yīng)的故障匹配因子比較,判斷候選故障匹配因子相似 度是否大于相似度最大者,或者相反度是否大于相反度最大者,如果滿足條件則用該候選 故障匹配因子替換存儲(chǔ)器中原有的相似度最大,或者相反度最大的那個(gè)故障匹配因子,否 則放棄該候選故障匹配因子。
5. 根據(jù)權(quán)利要求4所述的陣列處理器,其特征在于,當(dāng)故障匹配因子表達(dá)的是故障信 息時(shí),所述比較模塊用于比較功能單元的狀態(tài)信息和故障匹配因子之間的相似程度,如果 相似程度大于一定閥值,則認(rèn)為功能單元故障;當(dāng)故障匹配因子表達(dá)的是正常信息時(shí),所述 比較模塊用于比較功能單元的狀態(tài)信息和故障匹配因子之間的相反程度,如果相反程度小 于一定閥值,則認(rèn)為功能單元故障。
6. 根據(jù)權(quán)利要求2所述的陣列處理器,其特征在于,所述故障檢測(cè)單元用于檢測(cè)多個(gè) 功能單元,所述故障檢測(cè)單元還包括計(jì)數(shù)器、功能單元狀態(tài)信息輸入多路器和檢測(cè)結(jié)果輸 出多路器,其中功能單元狀態(tài)信息輸入多路器的輸入端分別連接多個(gè)功能單元,輸出端連接學(xué)習(xí)模 塊,用于將各功能單元的參考狀態(tài)值輸出到學(xué)習(xí)模塊;檢測(cè)結(jié)果輸出多路器的輸入端連接比較模塊,輸出端輸出故障檢測(cè)單元對(duì)功能單元的 檢測(cè)結(jié)果;計(jì)數(shù)器,分別與第一存儲(chǔ)器、功能狀態(tài)信息輸入多路器和檢測(cè)結(jié)果輸出多路器相連接, 用于控制故障檢測(cè)單元按一定順序?qū)δ軉卧M(jìn)行故障檢測(cè)。
7. 根據(jù)權(quán)利要求2所述的陣列處理器,其特征在于,所述故障檢測(cè)單元還包括檢測(cè)網(wǎng)絡(luò)輸入多路器和檢測(cè)網(wǎng)絡(luò)輸出多路器,檢測(cè)網(wǎng)絡(luò)輸入多路器的輸入端分別和周圍其他故障 檢測(cè)單元連接,輸出端連接本故障檢測(cè)單元的學(xué)習(xí)模塊,用于輸入其他故障檢測(cè)單元的故 障匹配因子;檢測(cè)網(wǎng)絡(luò)輸出多路器的輸入端與本故障檢測(cè)單元的第一存儲(chǔ)器連接,輸出端 分別與周圍其他故障檢測(cè)單元連接,用于輸出故障匹配因子給其他故障檢測(cè)單元。
8. 根據(jù)權(quán)利要求2所述的陣列處理器,其特征在于,所述計(jì)數(shù)器為0-3計(jì)數(shù)器;檢測(cè)網(wǎng) 絡(luò)輸入多路器、功能單元狀態(tài)信息輸入多路器、檢測(cè)結(jié)果輸出多路器、檢測(cè)網(wǎng)絡(luò)輸出多路器 均為4-1多路器;第一存儲(chǔ)器至少劃分為四部分,分別記錄四個(gè)功能單元的故障匹配因子。
9. 根據(jù)權(quán)利要求2所述的陣列處理器,其特征在于,所述陣列處理器還包括定時(shí)器,每 個(gè)定時(shí)器至少跟一個(gè)故障檢測(cè)單元連接,所述定時(shí)器用來(lái)控制故障檢測(cè)單元中的學(xué)習(xí)模塊 在一段給定時(shí)間內(nèi)對(duì)功能單元的狀態(tài)進(jìn)行監(jiān)測(cè),使學(xué)習(xí)模塊通過(guò)自學(xué)習(xí)方法獲得故障匹配 因子。
10. 根據(jù)權(quán)利要求1-9任一項(xiàng)所述的陣列處理器,其特征在于,所述陣列處理器還包括 一定數(shù)量的閑置功能單元,所述故障檢測(cè)單元的檢測(cè)結(jié)果輸出端與通訊單元相連,當(dāng)某個(gè) 功能單元檢測(cè)為故障時(shí),該功能單元的通訊單元啟動(dòng)重構(gòu)操作,激活一個(gè)閑置功能單元代 替所述故障功能單元。
全文摘要
本發(fā)明公開(kāi)了一種陣列處理器,包括多個(gè)由計(jì)算單元和通訊單元相連組成的功能單元,所述功能單元之間相連形成網(wǎng)絡(luò),還包括至少一個(gè)故障檢測(cè)單元,所述故障檢測(cè)單元與其鄰近的功能單元相連接,用于對(duì)功能單元進(jìn)行故障檢測(cè)。本發(fā)明通過(guò)在陣列處理器中加入多個(gè)故障檢測(cè)單元,多個(gè)故障檢測(cè)單元之間互相連接形成檢測(cè)網(wǎng)絡(luò),每個(gè)故障檢測(cè)單元負(fù)責(zé)對(duì)周圍區(qū)域內(nèi)的功能單元進(jìn)行檢測(cè)檢測(cè),從而實(shí)現(xiàn)正常工作時(shí)對(duì)整個(gè)陣列處理器芯片的故障檢測(cè)功能。
文檔編號(hào)G06F15/80GK101706767SQ20091010959
公開(kāi)日2010年5月12日 申請(qǐng)日期2009年8月13日 優(yōu)先權(quán)日2009年8月13日
發(fā)明者葉兆華, 吳澤俊, 戴鵬, 王新安, 雍珊珊 申請(qǐng)人:北京大學(xué)深圳研究生院