專利名稱:一種故障檢測的方法和系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及數(shù)據(jù)采集處理技術領域,特別是涉及一種工藝過程中故障檢測 的方法和系統(tǒng)。
背景技術:
在半導體加工工業(yè)中,隨著加工的技術節(jié)點越來越小,對晶片加工的要求 越來越高,因此各種先進的控制手段逐漸被用在半導體加工工業(yè)。例如先進工
藝控制(Advanced Process Control )方法目前已經(jīng)廣泛應用于300mm晶片加 工廠中。
而各種工藝控制解決方案一般都會包括故障檢測。其中,故障檢測可以利 用各種硬件傳感器實時監(jiān)控的數(shù)據(jù),使用統(tǒng)計等方法對數(shù)據(jù)進行處理,及時發(fā) 現(xiàn)故障,避免后續(xù)晶片的浪費。
為了實現(xiàn)故障檢測,現(xiàn)有技術提出了以下解決方案
方案1
同時監(jiān)控多組工藝過程中的硬件參數(shù),并由結(jié)果分析出現(xiàn)問題的硬件,從 而進行修正。該解決方案首先將一片晶片加工工藝過程的監(jiān)控數(shù)據(jù)進行了統(tǒng)計 分析,計算其平均值、標準偏差等統(tǒng)計量,然后利用這些統(tǒng)計量進行診斷,即 判斷這些統(tǒng)計量的計算結(jié)果是否在控制線內(nèi),如果不在,表明某個^:件發(fā)生了 故障,或工藝發(fā)生了漂移。
但是上述方案是利用對一片晶片加工過程的監(jiān)控數(shù)據(jù)進行處理后,所得到 的一個統(tǒng)計量作為基礎進行計算的,該方法無法采集到設備參數(shù)在實時過程中 發(fā)生的短時間的漂移,有可能丟失實時故障的信息,而隨著目前對工藝結(jié)果要 求越來越高,即使很短暫的故障也會導致晶片上部分單元無法滿足要求,從而 浪費了晶片。并且更重要的是無法得到故障的信息,導致已經(jīng)存在問題的硬件 不能得到及時的維護,造成更多晶片的浪費。
方案2
現(xiàn)有技術的另一解決方案是對設備進行實時數(shù)據(jù)的監(jiān)控,即對一些重要 參數(shù),實時監(jiān)控其數(shù)值,并設立上下控制界限,如果某個參數(shù)超過了控制界限,
4則對這個參數(shù)發(fā)生報警;從而指導設備工程師進行維護。
但目前的方法是人為單獨對每個參數(shù)設置上下控制線,固然可以實現(xiàn)對各 個參數(shù)的單獨報警,但是無法確保相互關聯(lián)的參數(shù),其關聯(lián)性發(fā)生漂移,即雖 然每一個參數(shù)都沒有超出控制線,但其相互的相關性參數(shù)已經(jīng)漂移,即實際上 某個或某些硬件已經(jīng)發(fā)生了問題,但沒有被發(fā)現(xiàn)。
總之,需要本領域技術人員迫切解決的一個技術問題就是如何能夠創(chuàng)新 性的提出一種提高檢測靈敏度的故障檢測解決方案。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術問題是提供一種故障檢測的方法和裝置,能夠提高 故障檢測的靈敏度,并有效的防止誤報警。
為了解決上述問題,本發(fā)明公開了一種故障檢測的方法,可以包括采集 多個參數(shù)的實時數(shù)據(jù);將所述多個參數(shù)變換為至少一個參數(shù)組合,每個參數(shù)組 合中至少包括兩個參數(shù);計算得到針對所述參數(shù)組合的一個指標參數(shù);判斷該 指標參數(shù)是否在闊值范圍內(nèi),如果超過閾值范圍,則確認當前時間點出現(xiàn)故障。
優(yōu)選的,所述的方法還可以包括分析確定在當前故障點,對故障貢獻度 超過閾值的參數(shù)組合;計算得到該參數(shù)組合中對主元貢獻度超過閾值的參數(shù), 確定其為問題參數(shù)。
優(yōu)選的,所述的方法還可以包括分析確定在當前故障點,對故障貢獻度 超過閾值的參數(shù)組合;計算得到該參數(shù)組合中對主元貢獻度超過闊值的參數(shù); 將在不同參數(shù)組合中,對主元貢獻度都超過閾值的參數(shù)確定為問題參數(shù)。
優(yōu)選的,所述的方法還可以包括依據(jù)所述問題參數(shù)確定故障硬件。
優(yōu)選的,所述的方法還可以包括發(fā)出報警和相應提示信息。
優(yōu)選的,所述的方法還可以包括在采集數(shù)據(jù)的開始階段,去除超出閾值 范圍的參數(shù)數(shù)據(jù)。
優(yōu)選的,可以通過以下方式去除超出閾值范圍的參數(shù)數(shù)據(jù)對于各個參數(shù) 實時數(shù)據(jù),判斷其是否超出了基準數(shù)據(jù)的3倍標準偏差,如果超過,則去除。 依據(jù)本發(fā)明的另一優(yōu)選實施例,還公開了一種故障檢測的系統(tǒng),包括 變換單元,用于將所采集的多個參數(shù)的實時數(shù)據(jù)變換為至少一個參數(shù)組 合,每個參數(shù)組合中至少包括兩個參數(shù);指標計算單元,用于計算得到針對所述參數(shù)組合的一個指標參數(shù);
故障判定單元,用于判斷該指標參數(shù)是否在闊偉范圍內(nèi),如果超過閾值范 圍,則確認當前時間點出現(xiàn)故障。
優(yōu)選的,所述的系統(tǒng)還可以包括參數(shù)組合確定單元,用于分析確定在當
前故障點,對故障貢獻度超過閾值的參數(shù)組合;參數(shù)確定單元,用于計算得到
該參數(shù)組合中對主元貢獻度超過閾值的參數(shù),確定其為問題參數(shù)。
優(yōu)選的,所述的系統(tǒng)還可以包括
參數(shù)組合確定單元,用于分析確定在當前故障點,對故障貢獻度超過閾值 的參數(shù)組合;
參數(shù)確定單元,用于計算得到該參數(shù)組合中對主元貢獻度超過閾值的參
數(shù);
問題參數(shù)確定單元,用于將在不同參數(shù)組合中,對主元貢獻度都超過閾值 的參數(shù)確定為問題參數(shù)。
優(yōu)選的,所述的系統(tǒng)還可以包括硬件確定單元,用于依據(jù)所述問題參數(shù) 確定故障硬件。
優(yōu)選的,所述的系統(tǒng)還可以包括報警單元,用于發(fā)出報警和相應提示信
自
優(yōu)選的,所述的系統(tǒng)還可以包括數(shù)據(jù)篩選單元,用于在采集數(shù)據(jù)的開始 階段,去除超出閾值范圍的參數(shù)數(shù)據(jù)。
優(yōu)選的,可以通過以下方式去除超出閾值范圍的參數(shù)數(shù)據(jù)對于各個參數(shù) 實時數(shù)據(jù),判斷其是否超出了基準數(shù)據(jù)的3倍標準偏差,如果超過,則去除。
與現(xiàn)有技術相比,本發(fā)明具有以下優(yōu)點
本發(fā)明結(jié)合多變量分析的方法,對實時的數(shù)據(jù)進行處理;即在進行工藝的 實時過程中,對每一個實時數(shù)據(jù)進行多變量分析,從而確保不會丟失工藝過程 中的瞬間數(shù)據(jù),及時發(fā)現(xiàn)有問題的信息。另外,本發(fā)明使用了多變量的方法進 行監(jiān)控,不僅考慮了每一個參數(shù)的變化,而且考慮了各參數(shù)之間的關聯(lián),可以 提高檢測靈敏度,并有效的防止誤報警。
本發(fā)明提高了故障檢測的準確性和故障檢測的易用性,避免了從大量參數(shù)中挑選需要參數(shù)的過程。并利用多變量分析的方法對數(shù)據(jù)進行分析,判斷發(fā)生 故障的原因,從 指導設備工程師對硬件問題進行解決。
另外,本發(fā)明將工藝過程中的不穩(wěn)定點(如工藝開始階段的不穩(wěn)定點)去 掉,避免了引入數(shù)據(jù)噪音,使數(shù)據(jù)無法和建立模型的數(shù)據(jù)比較,可以減少故障 的誤報。
圖1是本發(fā)明一種故障檢測的方法實施例1的步驟流程圖; 圖2是本發(fā)明一種故障檢測的方法實施例2的步驟流程圖; 圖3是本發(fā)明一種故障檢測的方法實施例3的步驟流程圖; 圖4是本發(fā)明一種以半導體工藝過程為例的方法實施例4的具體步驟流程
圖5是本發(fā)明一個工藝實時判斷情況的示意圖6是對實時數(shù)據(jù)按照本發(fā)明進行處理后的一種結(jié)果示意圖7是對實時數(shù)據(jù)按照現(xiàn)有技術進行處理后的一種結(jié)果示意圖8是本發(fā)明一種故障檢測的系統(tǒng)實施例1的結(jié)構框圖9是本發(fā)明一種故障檢測的系統(tǒng)實施例2的結(jié)構框圖IO是本發(fā)明一種故障檢測的系統(tǒng)實施例3的結(jié)構框圖。
具體實施例方式
為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實施方式
對本發(fā)明作進一步詳細的說明。
本發(fā)明可用于眾多通用或?qū)S玫挠嬎阆到y(tǒng)環(huán)境或配置中。例如個人計算 機、服務器計算機、手持設備或便攜式設備、平板型設備、多處理器系統(tǒng)、基 于微處理器的系統(tǒng)、包括以上任何系統(tǒng)或設備的分布式計算環(huán)境等等。
本發(fā)明可以在由計算機執(zhí)行的計算機可執(zhí)行指令的一般上下文中描述,例 如程序模塊。 一般地,程序模塊包括執(zhí)行特定任務或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的 例程、程序、對象、組件、數(shù)據(jù)結(jié)構等等。也可以在分布式計算環(huán)境中實踐本 發(fā)明,在這些分布式計算環(huán)境中,由通過通信網(wǎng)絡而被連接的遠程處理設備來 執(zhí)行任務。在分布式計算環(huán)境中,程序^^莫塊可以位于包括存儲設備在內(nèi)的本地和遠程計算機存儲介質(zhì)中。
參照圖1,示出了本發(fā)明一種故障檢測的方法實施例1,具體可以包括 步驟IOI、采集多個參數(shù)的實時數(shù)據(jù);
步驟102、將所述多個參數(shù)變換為至少一個參數(shù)組合,每個參數(shù)組合中至 少包括兩個參數(shù);
步驟103、計算得到針對所述參數(shù)組合的一個指標參數(shù);
步驟104、判斷該指標參數(shù)是否在閾值范圍內(nèi),如果超過閾值范圍,則確 認當前時間點出現(xiàn)故障。
在確定出現(xiàn)故障之后,就可以發(fā)出報警和相應的提示信息,以提示設備工 程師進行維護。當然,由于此時并沒有進行更深入的故障分析,因此給出的提 示信息可能比較模糊。
由于在數(shù)據(jù)釆集的開始階段,可能存在一些不穩(wěn)定的數(shù)據(jù)點,為了避免故 障的誤報,需要去除這些不穩(wěn)定點, 一般的可以通過設置閾值范圍來去除這些 不穩(wěn)定點。例如,對于各個參數(shù)實時數(shù)據(jù),判斷其是否超出了基準數(shù)據(jù)的3 倍標準偏差,如果超過,則去除。當然,本發(fā)明也可以采用其他方式去除這些 不穩(wěn)定點,例如,由設備工程師依據(jù)自己的經(jīng)驗手動去除,或者依據(jù)經(jīng)驗針對 特定參數(shù)預設上下限值等等。
對于步驟102, 一般可以通過PCA分析方法將所述多個參數(shù)變換為幾個參 數(shù)組合的形式,每個參數(shù)組合中至少包括兩個參數(shù),典型的參數(shù)組合數(shù)量可以 為3—6組。也可以根據(jù)工程師的經(jīng)驗,將相同類型的參數(shù)數(shù)量減少,獲得所 需的參數(shù)組合。
PCA是Principal component analysis的縮寫,中文翻譯為主元分析。 它是一種對數(shù)據(jù)進行分析的技術,最重要的應用是對原有數(shù)據(jù)進行簡化。正如 它的名字主元分析,這種方法可以有效的找出數(shù)據(jù)中最"主要"的元素和結(jié) 構,去除噪音和冗余,將原有的復雜數(shù)據(jù)降維,揭示隱藏在復雜數(shù)據(jù)背后的簡 單結(jié)構。它的優(yōu)點是簡單,而且無參數(shù)限制,可以方便的應用與各個場合。因 此應用極其廣泛,從神經(jīng)科學到計算機圖形學都有它的用武之地,PCA被譽為應用線形代數(shù)最價值的結(jié)果之一。由于PCA理論比較成熟,并且本領域技術人
員應用該理論無需創(chuàng)造性勞動就可以實現(xiàn)上述變換過程,因此本發(fā)明在此對具 體變換實現(xiàn)過程不再贅述。
對于步驟103,可以通過Hotel ling T2或Q統(tǒng)計等算法計算得到針對所 述參數(shù)組合的一個指標參數(shù)。Hotelling T2或Q統(tǒng)計是本領域常用的兩種數(shù) 學分析工具。其中,Hotelling T2主要原理是判斷待;險測點到建立;f莫型的正 常數(shù)據(jù)點之間的距離是否大于控制限,即如果此距離過大表明超出控制限,即 此待檢測數(shù)據(jù)點出現(xiàn)故障。這種方法主要用來檢測在PCA方法后,那些主元模 型中發(fā)生的波動。Q統(tǒng)計可以檢測那些落在非主元模型的數(shù)據(jù)發(fā)生偏移的現(xiàn) 象,在正常的工藝波動下,測量數(shù)據(jù)在非主元空間內(nèi)的投影較小, 一般是由自 由噪音形成的,但是當發(fā)生故障時,這個投影就會顯著增加,通過判斷投影的 大小,得出故障發(fā)生的情況。Hotelling T2和Q統(tǒng)計的方法是兩種可以相互 補充的方法,應用的范圍不完全相同,也可以組合使用。
對于步驟104,用來判斷該指標參數(shù)是否滿足要求的閣值范圍是事先預置 的,可以由技術人員依據(jù)實際經(jīng)-^i殳定。優(yōu)選的,也可以利用正常工藝過程中 的數(shù)據(jù),采用與前述^f企測步驟相似的方法確定指標參數(shù)的控制限。
具體的,在本發(fā)明的一個優(yōu)選實施例中,首先去除實時數(shù)據(jù)的不穩(wěn)定點, 計算其統(tǒng)計值,例如平均值、標準偏差等。計算全部參數(shù)的協(xié)方差矩陣,并計 算其特征值和特征向量,從大到小排列特征值,并相加,當前n個特征值之和 大于用戶設定的主元覆蓋率時,這前n個特征值對應的特征向量即對應各參數(shù) 的n個組合,得到主元才莫型,就可以進入Hotel 1 ing T2或Q統(tǒng)計進行故障診 斷??刂葡薜倪x擇與客戶對此工藝控制的嚴格程度相關。例如選擇99%的參數(shù) 進行控制限計算時,表明當檢測到故障時,故障點真正發(fā)生故障的概率大于 99%。如果此參數(shù)越大,表明檢測到故障是真正硬件故障的可能性越大,但同 時如果此數(shù)值過大,也會漏掉一些故障點。 一般可以設置為95°/。到99%之間。
參照圖2,示出了本發(fā)明一種故障檢測的方法實施例2,具體可以包括步驟201、采集多個參數(shù)的實時數(shù)據(jù);
步驟202、將所述多個參數(shù)變換為至少一個參數(shù)組令,每個參數(shù)組合中至
少包括兩個參數(shù);
步驟203、計算得到針對所述參數(shù)組合的一個指標參數(shù);
步驟204、判斷該指標參數(shù)是否在閾值范圍內(nèi),如果超過閾值范圍,則確
認當前時間點出現(xiàn)故障;
步驟205、分析確定在當前故障點,對故障貢獻度超過閾值的參數(shù)組合; 步驟206、計算得到該參數(shù)組合中對主元貢獻度超過閾值的參數(shù),確定其
為問題參數(shù)。
在確定問題參數(shù)之后,就可以發(fā)出報警和相應的提示信息,因為一般情況 下,參數(shù)就可以直接指向故障硬件了,因此該問題參數(shù)即可以較好的提示設備 工程師進行維護。
在本發(fā)明的一個優(yōu)選實施例中,在步驟206之后,還可以包括步驟207: 依據(jù)所述問題參數(shù)自動確定故障硬件;進而針對所確定的故障硬件,發(fā)出報警 和相應提示信息。
實施例2相對于實施例1增加了故障分析的過程,以幫助設備工程師迅速 找到出現(xiàn)故障的硬件及其問題之所在。實施例2中的步驟205可能得到一個在 當前故障點上對故障貢獻度超過閾值的參數(shù)組合,也可能得到多個這樣的參數(shù) 組合。進而,步驟206也可能得到一個或者多個問題參數(shù)。
對于步驟205和206的故障分析過程,也可以采用PCA理論。當獲悉當前 故障點時,通過預置的PCA模型,首先分析確定此故障點時在哪個主元方向(參 數(shù)組合)上偏離了控制限;然后進一步通過PCA模型,分析確定在相應的主元 方向上(參數(shù)組合中),哪個參數(shù)對主元貢獻較大,即計算出的主元貢獻值較 大,則可以確定該參數(shù)為可能引起故障的問題參數(shù)。在簡單處理的情況下,當 采用上述過程確定出了多個問題參數(shù)時,可以直接報警,并給出相應的故障硬 件;也可以采用更進一步的分析(實施例3),以進一步降低誤報的幾率。
參照圖3,示出了本發(fā)明一種故障檢測的方法實施例2,具體可以包括 步驟301、采集多個參數(shù)的實時數(shù)據(jù);步驟302、將所述多個參數(shù)變換為至少一個參數(shù)組合,每個參數(shù)組合中至
少包括兩個參數(shù); .
步驟303、計算得到針對所述參數(shù)組合的一個指標參數(shù);
步驟304、判斷該指標參數(shù)是否在閾值范圍內(nèi),如果超過閾值范圍,則確
認當前時間點出現(xiàn)故障;
步驟305、分析確定在當前故障點,對故障貢獻度超過閾值的參數(shù)組合; 步驟306、計算得到該參數(shù)組合中對主元貢獻度超過閾值的參數(shù); 步驟307、將在不同參數(shù)組合中,對主元貢獻度都超過閾值的參數(shù)確定為
問題參數(shù)。
在確定問題參數(shù)之后,就可以發(fā)出報警和相應的提示信息;也可以在由該 問題參數(shù)確定故障硬件之后,再發(fā)出報警和相應提示信息。
實施例3中,對于步驟306所確定的多個參數(shù)并不直接確定為問題參數(shù), 進入報警流程。而是對其進行了更進一步的分析,將在不同參數(shù)組合中,對主 元貢獻度都超過閾值的參數(shù)挑選出來,這些參數(shù)才是準確度較高的問題參數(shù)。 當然,如果步驟306所確定的多個參數(shù)都在一個參數(shù)組合中,則可以直接采用 實施例2中的方法全部確定為問題參數(shù)。
具體的,當在判斷主元時發(fā)現(xiàn)這個故障點在多個主元方向偏離控制限,則 首先確定幾個主元中貢獻較大的參數(shù),然后篩選出在不同主元中貢獻均較大的 參數(shù)確定為導致問題的參數(shù),進而將該參數(shù)所指向的硬件確定故障硬件。
總之,如果使用單變量方法,可能相關的兩個參數(shù)都發(fā)生了漂移,但是并 沒有超出控制限,所以使用單變量方法不會發(fā)出報警。而對于上述實施例l一 3,兩個或者多個參數(shù)的組合會增大漂移量,這時使用多變量分析方法就可以 對其組合量進行檢測,發(fā)現(xiàn)組合量超出控制限,及時發(fā)出報警,從而提高故障 檢測的靈敏度,以適應現(xiàn)代工藝的要求。
下面參照圖4,以半導體工藝過程為例,給出本發(fā)明一個更為詳細的故障 才會測方法實施例4,可以包括以下步驟
步驟401、在半導體設備進行工藝的過程中,實時的進行數(shù)據(jù)采集,例如 選擇數(shù)據(jù)采集頻率為1HZ或0. 5HZ進行實時數(shù)據(jù)采集。步驟402、每一個工藝步驟之間有相應的步驟標識傳送到數(shù)據(jù)處理控制臺
中,如果判斷出此步驟需要進行監(jiān)控,則將實時數(shù)據(jù)逐點實時的傳送到數(shù)據(jù)處
理單元,否則進行步驟408,送到數(shù)據(jù)庫保存。
步驟403、進入數(shù)據(jù)處理單元的數(shù)據(jù)首先去除其不穩(wěn)定點,避免將開始時 不穩(wěn)定的點當成故障點的發(fā)生誤判的現(xiàn)象。
步驟404、按照多變量故障i貪斷的方法,如PCA和Hotelling T2、 Q統(tǒng)計 等方法,計算其針對多變量的處理值。
步驟405、將處理值與原始建立模型的值進行比較,如果這個點大于相應 的模型中對應的點,則此點發(fā)生問題,即出現(xiàn)故障。建立原始模型的數(shù)據(jù)是對 完全正常的工藝進行數(shù)據(jù)的采集并處理得到的正常情況下的值。如果這個點小 于相應模型中對應的點,則表明這個實時的數(shù)據(jù)點正常,進行下一個實時點的 判斷,重復步驟(1)以下的過程。實時的完成需要監(jiān)控的全部數(shù)據(jù)點的判斷。 參照圖5,示出了一個工藝實時判斷情況的示意圖。其中,橫坐標為時間,縱 坐標為Q統(tǒng)計值,虛線501為閾值的模型值曲線,實線502為實時數(shù)據(jù)點的連 線,凸點區(qū)域503為凈全測確定的故障點。
步驟406、通過數(shù)據(jù)處理,計算確定哪個參數(shù)發(fā)生異常,進而確定哪個硬 件對此故障有貢獻。
步驟407、發(fā)出報警和相應的提示,指出異常硬件。
參照圖6,是本發(fā)明一個更具體的實際例子,圖6中橫坐標表示實時數(shù)據(jù) 點數(shù),縱坐標表示控制值;其中,"*"點標識控制限,而菱形實心符號則標識 指標參數(shù)值。圖6示出了對實時數(shù)據(jù)按照本發(fā)明進行處理后的一種結(jié)果示意 圖,具體處理過程是對采集頻率為2HZ的數(shù)據(jù),經(jīng)過PCA, HotellingT2方法 進行故障檢測。圖6中第11個點超出了控制限,發(fā)出報警,經(jīng)過硬件問題查 找,發(fā)現(xiàn)是瞬間打火導致的異常,并且已導致本片晶片上一些位置結(jié)果發(fā)生偏 差。
而如果仍然采用傳統(tǒng)技術,人們難以及時發(fā)現(xiàn)問題。即如果使用一個工藝 步驟過后的統(tǒng)計值進行計算,可能統(tǒng)計值的漂移不會超出控制限,見圖7所示 (圖7中的橫坐標表示晶片的個數(shù),縱坐標表示控制值的平均值),經(jīng)過平均值計算這21個點成為一個平均值點,該點并沒有超出控制限。因此使用傳統(tǒng) 技術在晶片工藝過程進行完后,再進行統(tǒng)計計算,與控制限進行對比,發(fā)現(xiàn)沒 有超出控制限,所以不會報警,從而導致有質(zhì)量問題的晶片存在,并且無法發(fā) 現(xiàn)故障所在。
參照圖8,示出了本發(fā)明一種故障檢測的系統(tǒng)實施例1,具體可以包括 變換單元801,用于將所采集的多個參數(shù)的實時數(shù)據(jù)變換為至少一個參數(shù)
組合,每個參數(shù)組合中至少包括兩個參數(shù);
指標計算單元802,用于計算得到針對所述參數(shù)組合的一個指標參數(shù); 故障判定單元803,用于判斷該指標參數(shù)是否在閾值范圍內(nèi),如果超過閾
值范圍,則確認當前時間點出現(xiàn)故障。
優(yōu)選的,上述系統(tǒng)實施例l還可以包括報警單元804,直接與參數(shù)確定單
元803相連,用于發(fā)出報警和相應提示信息。
參照圖9,示出了本發(fā)明一種故障檢測的系統(tǒng)實施例2,具體可以包括 變換單元901,用于將所采集的多個參數(shù)的實時數(shù)據(jù)變換為至少一個參數(shù)
組合,每個參數(shù)組合中至少包括兩個參數(shù);
指標計算單元902,用于計算得到針對所述參數(shù)組合的一個指標參數(shù); 故障判定單元903,用于判斷該指標參數(shù)是否在閾值范圍內(nèi),如果超過閾
值范圍,則確認當前時間點出現(xiàn)故障;
參數(shù)組合確定單元904,用于分析確定在當前故障點,對故障貢獻度超過
閾值的參數(shù)組合;
參數(shù)確定單元905,用于計算得到該參數(shù)組合中對主元貢獻度超過閾值的
參數(shù),確定其為問題參數(shù)。
優(yōu)選的,上述系統(tǒng)實施例2還可以包括報警單元,直接與參數(shù)確定單元
905相連,用于針對問題參數(shù)發(fā)出報警和相應提示信息。 更優(yōu)選的情況是,上述系統(tǒng)實施例2還可以包括 硬件確定單元906,用于依據(jù)所述問題參數(shù)確定故障硬件。 報警單元907,用于針對所確定的故障硬件發(fā)出報警和相應提示信息。參照圖10,示出了本發(fā)明一種故障檢測的系統(tǒng)實施例3,具體可以包括 變換單元1001,用于將所采集的多個參數(shù)的實時數(shù)據(jù)變換為至少一個參
數(shù)組合,每個參數(shù)組合中至少包括兩個參數(shù);
指標計算單元1002,用于計算得到針對所述參數(shù)組合的一個指標參數(shù); 故障判定單元1003,用于判斷該指標參數(shù)是否在閾值范圍內(nèi),如果超過
閾值范圍,則確認當前時間點出現(xiàn)故障;
參數(shù)組合確定單元1004,用于分析確定在當前故障點,對故障貢獻度超
過閾值的參數(shù)組合;
參數(shù)確定單元1005,用于計算得到該參數(shù)組合中對主元貢獻度超過閾值
的參數(shù);
問題參數(shù)確定單元1006,用于將在不同參數(shù)組合中,對主元貢獻度都超
過閾值的參數(shù)確定為問題參數(shù)。
優(yōu)選的,上述系統(tǒng)實施例3還可以包括報警單元,直接與參數(shù)確定單元
10 0 6相連,用于針對問題參數(shù)發(fā)出報警和相應提示信息。 更優(yōu)選的情況是,上述系統(tǒng)實施例3還可以包括 硬件確定單元1007,用于依據(jù)所述問題參數(shù)確定故障硬件。 報警單元1008,用于針對所確定的故障硬件發(fā)出報警和相應提示信息。
需要說明的是,上述的報警單元,隨著與其他單元連接關系的不同,其報 警的具體信息也可以出現(xiàn)詳細程度的不同。
優(yōu)選的,上述的系統(tǒng)實施例l、 2和3都可以還包括凄t據(jù)篩選單元,用 于在采集數(shù)據(jù)的開始階段,去除超出閾值范圍的參數(shù)數(shù)據(jù)。優(yōu)選的,可以通過 以下方式去除超出閾值范圍的參數(shù)數(shù)據(jù)對于各個參數(shù)實時數(shù)據(jù),判斷其是否 超出了基準數(shù)據(jù)的3倍標準偏差,如果超過,則去除。
本發(fā)明可以使用在與半導體晶片加工相關的各種工藝的故障檢測中,本發(fā) 明也可以應用在與半導體晶片加工無關的其他工藝的故障檢測中。即本發(fā)明并 不限定具體應用的工藝過程或者設備。
本說明書中的各個實施例均采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即 可。對于系統(tǒng)實施例而言,、由于其與方法實施例基本相似,所以描述的比較簡 單,相關之處參見方法實施例的部分說明即可。
以上對本發(fā)明所提供的一種故障檢測的方法和系統(tǒng),進行了詳細介紹,本
明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領域的一般技 術人員,依據(jù)本發(fā)明的思想,在具體實施方式
及應用范圍上均會有改變之處, 綜上所述,本說明書內(nèi)容不應理解為對本發(fā)明的限制。
權利要求
1、一種故障檢測的方法,其特征在于,包括采集多個參數(shù)的實時數(shù)據(jù);將所述多個參數(shù)變換為至少一個參數(shù)組合,每個參數(shù)組合中至少包括兩個參數(shù);計算得到針對所述參數(shù)組合的一個指標參數(shù);判斷該指標參數(shù)是否在閾值范圍內(nèi),如果超過閾值范圍,則確認當前時間點出現(xiàn)故障。
2、 如權利要求l所述的方法,其特征在于,還包括 分析確定在當前故障點,對故障貢獻度超過閾值的參數(shù)組合; 計算得到該參數(shù)組合中對主元貢獻度超過閾值的參數(shù),確定其為問題參數(shù)。
3、 如權利要求l所述的方法,其特征在于,還包括 分析確定在當前故障點,對故障貢獻度超過閾值的參數(shù)組合; 計算得到該參數(shù)組合中對主元貢獻度超過閾值的參數(shù); 將在不同參數(shù)組合中,對主元貢獻度都超過閾值的參數(shù)確定為問題參數(shù)。
4、 如權利要求2或3所述的方法,其特征在于,還包括 依據(jù)所述問題參數(shù)確定故障硬件。
5、 如權利要求l、 2或3所述的方法,其特征在于,還包括 發(fā)出報警和相應提示信息。
6、 如權利要求l所述的方法,其特征在于,還包括 在采集數(shù)據(jù)的開始階段,去除超出閾值范圍的參數(shù)數(shù)據(jù)。
7、 如權利要求6所述的方法,其特征在于,通過以下方式去除超出閾值 范圍的參數(shù)數(shù)據(jù)對于各個參數(shù)實時數(shù)據(jù),判斷其是否超出了基準數(shù)據(jù)的3倍標準偏差,如 果超過,則去除。
8、 一種故障檢測的系統(tǒng),其特征在于,包括變換單元,用于將所采集的多個參數(shù)的實時數(shù)據(jù)變換為至少一個參數(shù)組 合,每個參數(shù)組合中至少包括兩個參數(shù);指標計算單元,用于計算得到針對所述參數(shù)組合的一個指標參數(shù); 故障判g單元,用于判斷該指標參數(shù)是否在閾值范圍內(nèi),如果超過閾值范 圍,則確認當前時間點出現(xiàn)故障。
9、 如權利要求8所述的系統(tǒng),其特征在于,還包括 參數(shù)組合確定單元,用于分析確定在當前故障點,對故障貢獻度超過閾值的參數(shù)組合;參數(shù)確定單元,用于計算得到該參數(shù)組合中對主元貢獻度超過閾值的參 數(shù),確定其為問題參數(shù)。
10、 如權利要求8所述的系統(tǒng),其特征在于,還包括 參數(shù)組合確定單元,用于分析確定在當前故障點,對故障貢獻度超過閾值的參數(shù)組合;參數(shù)確定單元,用于計算得到該參數(shù)組合中對主元貢獻度超過閾值的參數(shù);問題參數(shù)確定單元,用于將在不同參數(shù)組合中,對主元貢獻度都超過閾值 的參數(shù)確定為問題參數(shù)。
11、 如權利要求9或10所述的系統(tǒng),其特征在于,還包括 硬件確定單元,用于依據(jù)所述問題參數(shù)確定故障硬件。
12、 如權利要求8、 9或10所述的系統(tǒng),其特征在于,還包括 報警單元,用于發(fā)出報警和相應提示信息。
13、 如權利要求8所述的系統(tǒng),其特征在于,還包括 數(shù)據(jù)篩選單元,用于在采集數(shù)據(jù)的開始階段,去除超出闊值范圍的參數(shù)數(shù)據(jù)。
14、 如權利要求13所述的系統(tǒng),其特征在于,通過以下方式去除超出閾 值范圍的參數(shù)數(shù)據(jù)對于各個參數(shù)實時數(shù)據(jù),判斷其是否超出了基準數(shù)據(jù)的3倍標準偏差,如 果超過,則去除。
全文摘要
本發(fā)明提供了一種故障檢測的方法和系統(tǒng),所述方法可以包括采集多個參數(shù)的實時數(shù)據(jù);將所述多個參數(shù)變換為至少一個參數(shù)組合,每個參數(shù)組合中至少包括兩個參數(shù);計算得到針對所述參數(shù)組合的一個指標參數(shù);判斷該指標參數(shù)是否在閾值范圍內(nèi),如果超過閾值范圍,則確認當前時間點出現(xiàn)故障。本發(fā)明在進行工藝的實時過程中,對每一個實時數(shù)據(jù)進行多變量分析,從而確保不會丟失工藝過程中的瞬間數(shù)據(jù),及時發(fā)現(xiàn)有問題的信息。另外,本發(fā)明使用了多變量的方法進行監(jiān)控,不僅考慮了每一個參數(shù)的變化,而且考慮了各參數(shù)之間的關聯(lián),可以提高檢測靈敏度,并有效的防止誤報警。
文檔編號G05B19/048GK101470426SQ20071030437
公開日2009年7月1日 申請日期2007年12月27日 優(yōu)先權日2007年12月27日
發(fā)明者卓 陳 申請人:北京北方微電子基地設備工藝研究中心有限責任公司