專利名稱:qPCR基因分型數(shù)據(jù)的可視化工具的制作方法
qPCR基因分型數(shù)據(jù)的可視化工具簡介定量聚合酶鏈式反應(yīng)(qPCR)儀器或循環(huán)儀允許在每一循環(huán)期間收集數(shù)據(jù)。PCR數(shù)據(jù)通常在每一循環(huán)利用qPCR儀器內(nèi)的光學(xué)系統(tǒng)來收集,該光學(xué)系統(tǒng)能夠檢測與被qPCR儀器分析的每一核酸樣品連接的一個或多個標(biāo)記探針發(fā)射的電磁輻射。因此PCR數(shù)據(jù)包括每一循環(huán)或與循環(huán)相關(guān)的每一時間的每一樣品的一個或多個標(biāo)記探針強度值。按照本教導(dǎo)的系統(tǒng)的多種實施方案包括qPCR儀器,以及用于控制和/或監(jiān)測qPCR儀器的處理器或計算機。處理器用于生成和修改發(fā)送到qPCR儀器的實驗參數(shù)和/或監(jiān)測qPCR儀器以及實驗后分析從qPCR儀器接收的PCR數(shù)據(jù)。盡管qPCR系統(tǒng)接收和分析qPCR數(shù)據(jù),但是它們一般僅在終點或PCR實驗結(jié)束后顯示有用的或有差別的信息。另外,盡管qPCR儀器和qPCR系統(tǒng)的處理器能夠通過網(wǎng)絡(luò)通信,但每一 qPCR系統(tǒng)可以包括一個qPCR儀器和一個處理器。最后,盡管高通量實驗流程可能要求同一 PCR實驗在多批樣品上運行,但qPCR系統(tǒng)可能經(jīng)常需要為置于qPCR儀器中的每批樣品輸入實驗參數(shù)。附圖簡述本領(lǐng)域技術(shù)人員會理解,下文描述的附圖僅用于示例目的。這些附圖并不意欲以任何方式限制本教導(dǎo)的范圍。
圖1是示例性的流程圖,示出了用于顯示從qPCR儀器獲得的數(shù)據(jù)的方法,基于此可以實施本教導(dǎo)的實施方案。圖2是舉例說明聚合酶鏈式反應(yīng)(PCR)儀器的方框圖,基于此可以實施本教導(dǎo)的實施方案。圖3是舉例說明計算機系統(tǒng)的方框圖,基于此可以實施本教導(dǎo)的實施方案。圖4是用于聯(lián)網(wǎng)熱循環(huán)儀器的系統(tǒng)的圖解,基于此可以實施本教導(dǎo)的實施方案。圖5是示例性的擴增圖譜,基于此可以實施本教導(dǎo)的實施方案。圖6是終點數(shù)據(jù)的示例性等位基因鑒別圖譜,其中等位基因鑒別是明顯的,基于此可以實施本教導(dǎo)的實施方案。圖7是終點數(shù)據(jù)的示例性等位基因鑒別圖譜,其中等位基因鑒別是不明顯的,基于此可以實施本教導(dǎo)的實施方案。圖8是來自產(chǎn)生圖6數(shù)據(jù)的同一實驗在循環(huán)數(shù)為30時的示例性等位基因鑒別圖譜,基于此可以實施本教導(dǎo)的實施方案。圖9是來自產(chǎn)生圖6數(shù)據(jù)的同一實驗在循環(huán)數(shù)為35時的示例性等位基因鑒別圖譜,基于此可以實施本教導(dǎo)的實施方案。圖10是來自產(chǎn)生圖6數(shù)據(jù)的同一實驗在循環(huán)數(shù)為40時的示例性等位基因鑒別圖譜,基于此可以實施本教導(dǎo)的實施方案。圖11是來自產(chǎn)生圖6數(shù)據(jù)的同一實驗在循環(huán)數(shù)為40時的示例性等位基因鑒別圖譜,顯示了代表來自先前循環(huán)數(shù)的數(shù)據(jù)的軌跡線,基于此可以實施本教導(dǎo)的實施方案。圖12是來自產(chǎn)生圖7數(shù)據(jù)的同一實驗在循環(huán)數(shù)為40時的示例性等位基因鑒別圖譜,顯示了代表來自先前循環(huán)數(shù)的數(shù)據(jù)的軌跡線,基于此可以實施本教導(dǎo)的實施方案。
圖13A-13C顯示了按照本教導(dǎo)的多種實施方案的示例性用戶界面的互動性。圖14A-14C顯示了按照本教導(dǎo)的多種實施方案的示例性用戶界面的互動性。多種實施方案的描述用于qPCR基因分型數(shù)據(jù)的可視化工具的系統(tǒng)和方法的多種實施方案,可以響應(yīng)終端用戶輸入提供給終端用戶基因分型數(shù)據(jù)的動態(tài)顯示。本教導(dǎo)的系統(tǒng)和方法的多種實施方案的互動性允許終端用戶控制大量的信息,這些信息顯示為基于時間的數(shù)據(jù)圖譜,所述數(shù)據(jù)可以以逐步的方式從用戶輸入存取,或者可以作為視頻顯示從用戶輸入存取。在用于qPCR基因分型數(shù)據(jù)的可視化工具的系統(tǒng)和方法的多種實施方案中,樣品表可以與樣品圖譜有關(guān),該樣品表可以具有大量的與表中出現(xiàn)的每一樣品有關(guān)的信息。在本教導(dǎo)的系統(tǒng)和方法的多種實施方案中,終端用戶可以以任何所需的方式選擇出現(xiàn)在樣品表上的一個或多個樣品;每一樣品具有與其相關(guān)的豐富的樣品信息,以及所選的一個或多個樣品可以顯示在基因分型數(shù)據(jù)的圖譜上。因此,通過這種可視化工具,終端用戶可以動態(tài)地理解各種實驗條件對基因分型實驗結(jié)果的影響。這種分析可以提供給終端用戶以下能力例如但不限于檢修有歧義的終點數(shù)據(jù)、作出人工基因分型、提高基因分型分配、優(yōu)化測定和分析條件。圖1是流程圖,描繪了本教導(dǎo)用于顯示和分析來自基因分型樣品數(shù)據(jù)的系統(tǒng)和方法的多種實施方案。如之前討論的,多種方法實施方案可以基于其實施的系統(tǒng)實施方案包括可以通信的qPCR儀器和處理器。這種通信可以包括例如數(shù)據(jù)或控制信息的交換。如本領(lǐng)域普通技術(shù)人員所獲悉的,在熱循環(huán)儀器上進行PCR分析,所述熱循環(huán)儀器具有通過多個熱循環(huán)進行循環(huán)的多種操作方案以便擴增基因靶標(biāo)。在本教導(dǎo)的多種實施方案中,為了擴增而進行的循環(huán)數(shù)可以為約20-40個循環(huán)。對于本教導(dǎo)的多種實施方案,為了擴增而進行的循環(huán)數(shù)可以大于40個循環(huán)。為了擴增基因靶標(biāo),熱循環(huán)儀器可以在與第一熱循環(huán)數(shù)相關(guān)的一定循環(huán)時間內(nèi)進行PCR試驗的第一熱循環(huán)。在基因分型分析的多種實施方案中,兩個或更多個DNA樣品用第一探針和第二探針探測。如圖1的步驟110所示,基于用于數(shù)據(jù)收集的多種操作方案的任一種,處理器可以從qPCR儀器接收第一時間的第一數(shù)據(jù)集,其包括兩個或更多個DNA樣品的每一個在第一時間的第一探針強度和第二探針強度。按照本教導(dǎo)的多種實施方案,以及如在圖1的步驟120所示,基于用于數(shù)據(jù)收集的多種操作方案的任一種,處理器可以從qPCR儀器接收第二時間的第二數(shù)據(jù)集,其包括兩個或更多個DNA樣品的每一個在第二時間的第一探針強度和第二探針強度。按照本教導(dǎo)的多種實施方案,用戶界面可以呈現(xiàn)給終端用戶用于分析在第一時間和第二時間接收的數(shù)據(jù)集的可視化工具。如以前提及的,可以在一批中處理多個樣品,用于基因分型分析,從而產(chǎn)生數(shù)據(jù)-密集性數(shù)據(jù)集。本教導(dǎo)的系統(tǒng)和方法的多種實施方案提供可以輔助終端用戶評價和分析這種數(shù)據(jù)密集性數(shù)據(jù)集的可視化工具的實施方案。如在圖1的步驟140中所示,對于按照本教導(dǎo)的系統(tǒng)和方法的多種實施方案,響應(yīng)來自終端用戶的輸入,處理器可以利用第一數(shù)據(jù)集生成第一探針強度對第二探針強度的第一圖譜。此外,如圖1的步驟145所示,響應(yīng)來自終端用戶的輸入,處理器可以利用第二數(shù)據(jù)集生成第一探針強度作為第二探針強度的函數(shù)的第二圖譜。如圖1的步驟150和155所示,按照本教導(dǎo)的系統(tǒng)和方法的多種實施方案,響應(yīng)來自終端用戶的輸入,處理器可以顯示第一圖譜和第二圖譜。在多種實施方案中,輸入可以是與用戶界面的互動過程從而以逐步方式顯示數(shù)據(jù)。在這種實施方案中,終端用戶可以以任何順序選擇任何數(shù)據(jù)集來顯示。對于多種實施方案,來自終端用戶的輸入可以包括例如點擊或使用圖形用戶界面的任何圖標(biāo),包括但不限于滑動條、滾動條、按鈕、文本框和樣品表的表示。對于多種實施方案,輸入可以是用戶以視頻顯示數(shù)據(jù)的選擇。在如圖1所示的系統(tǒng)和方法的多種實施方案中,處理器可以在PCR實驗運行時間接收數(shù)據(jù)。例如,處理器可以在收集第一數(shù)據(jù)集之后以及在收集第二數(shù)據(jù)集之前接收來自qPCR儀器的第一數(shù)據(jù)集。此外,該操作方案可以延長至整個運行時間以使得,例如處理器可以在收集第二數(shù)據(jù)集之后以及收集隨后的數(shù)據(jù)集之前接收來自qPCR儀器的第二數(shù)據(jù)集。按照本教導(dǎo)的系統(tǒng)和方法的多種實施方案,處理器可以接收在熱循環(huán)結(jié)束后接收來自qPCR儀器的第一數(shù)據(jù)集和第二數(shù)據(jù)集。例如,處理器可以在其已被儲存在計算機可讀介質(zhì)上之后接收第一數(shù)據(jù)集和第二數(shù)據(jù)集。.按照本教導(dǎo)的系統(tǒng)和方法的多種實施方案,如圖1中所示,響應(yīng)用戶輸入,可視化工具可以輔助終端用戶顯示多方面的基因分型數(shù)據(jù)集,由此促進基因分型數(shù)據(jù)的分析。在多種實施方案中,處理器可以顯示展示了第二數(shù)據(jù)集和第一數(shù)據(jù)集間的軌跡線的圖譜。在多種實施方案中,處理器可以在第一圖譜上顯示第一數(shù)據(jù)集的質(zhì)量值以及在第二圖譜上顯示第二數(shù)據(jù)集的質(zhì)量值。按照多種實施方案,用戶界面提供了在樣品表上作的選擇和在基因分型數(shù)據(jù)圖譜上動態(tài)顯示的選擇之間的互動作用。在多種實施方案中,終端用戶從可視化工具的用戶界面所作的選擇可以提供,例如但不限于動態(tài)分析,例如但不限于使得終端用戶能夠檢修有歧義的終點數(shù)據(jù)、作出人工基因分型、利用軌跡線以輔助群集可視化從而提高基因分型分配、優(yōu)化測定條件(即標(biāo)記探針、測定緩沖液等)和優(yōu)化分析條件。按照本教導(dǎo)的方法和系統(tǒng)的多種實施方案可以利用數(shù)據(jù)集,其可以例如但不限于按照圖6所示的圖形表示。這種表示法可以起因于利用具有不同波長的發(fā)射物的兩種染料的分析,所述染料可以與針對生物樣品中基因組座位兩種等位基因之一的每種標(biāo)記探針相關(guān)聯(lián)。在這種雙聯(lián)反應(yīng)中,產(chǎn)生三種可能基因型的每種的離散信號集。在如圖6所示的信號2對信號I的笛卡爾坐標(biāo)系統(tǒng)中,展示在這種圖示法上的每一數(shù)據(jù)點可以在所給的三個離散信號集之一中具有坐標(biāo),例如參考圖6,如對于(信號2,信號2),顯示了數(shù)據(jù)點群集610;對于(信號2,信號I),顯示了數(shù)據(jù)點群集630;以及對于(信號1,信號I),顯示了數(shù)據(jù)點群集620。因此,對于每一數(shù)據(jù)點,多個樣品的離散信號集可以儲存為數(shù)據(jù)集中的數(shù)據(jù)點。這種數(shù)據(jù)集可以儲存在多種計算機可讀介質(zhì)中,并在分析期間進行動態(tài)分析或在分析后進行分析,如隨后更為詳細討論的。一種用于證實基因分型數(shù)據(jù)可視化的方法和系統(tǒng)的實施方案特征的這類測定可以利用TaqMan 試劑,以及可以利用例如但不限于FAM和VIC染料標(biāo)記物,如隨后所討論的。然而,本領(lǐng)域的普通技術(shù)人員會認識到,可以利用包括標(biāo)記探針試劑在內(nèi)的多種測定來產(chǎn)生可按照本教導(dǎo)的方法和系統(tǒng)的多種實施方案進行分析的數(shù)據(jù)。按照多種實施方案,術(shù)語“標(biāo)記探針” 一般指用于擴增反應(yīng)的分子,通常用于定量或qPCR分析,以及終點分析。這種標(biāo)記探針可以用于監(jiān)測靶多核苷酸的擴增。在一些實施方案中,存在于擴增反應(yīng)中的寡核苷酸標(biāo)記探針適用于監(jiān)測作為時間函數(shù)產(chǎn)生的擴增子的量。這種寡核苷酸標(biāo)記探針包括但不限于,本文描述的5’ -核酸外切酶測定TaqMan 標(biāo)記探針(還參見美國專利號5,538,848)、多種莖-環(huán)分子信標(biāo)(參見,例如,美國專利號 6,103,476 和 5,925,517,以及 Tyagi and Kramer, 1996, Nature Biotechnology14:303-308)、無莖或線型信標(biāo)(參見,例如,W099/21881)、PNA分子信標(biāo)(PNA MolecularBeacons ,參見,例如,美國專利號6,355,421和6,593,091)、線型PNA信標(biāo)(參見,例如,Kubista et al.,2001,SPIE 4264:53-58)、非-FRET標(biāo)記探針(參見,例如,美國專利號6,150, 097) ,Sunrise CVAmplifluor ⑧標(biāo)記探針(美國專利號 6,548,250)、莖-環(huán)和雙股 Scorpion 標(biāo)記探針(Solinas et al. , 2001, Nucleic Acids Research 29:E96 和美國專利號6,589,743)、凸環(huán)標(biāo)記探針(美國專利號6,590,091)、偽結(jié)標(biāo)記探針(美國專利號 6,589,250)、環(huán)形標(biāo)(cyclicon)(美國專利號 6,383,752)、MGB Eclipse 探針(EpochBiosciences)、發(fā)夾標(biāo)記探針(美國專利號6,596,490)、肽核酸(PNA)點亮標(biāo)記探針、自組裝納米微粒標(biāo)記探針、以及二茂鐵修飾的標(biāo)記探針,例如在美國專利號6,485,901;Mhlangaet al. , 2001, Methods 25:463-471;Whitcombe et al. , 1999, Nature Biotechnology. 17:804-807;Isacsson et al. , 2000, Molecular Cell Labeling probes. 14:321-328;Svanviket al. ,2000,Anal Biochem. 281:26-35;Wolffs et al. ,2001,Biotechniques766:769-771;Tsourkas et al. , 2002, Nucleic Acids Research. 30:4208-4215;Riccelliet al. , 2002, Nucleic Acids Research30:4088-4093;Zhang et al. , 2002Shangha1. 34:329-332;Maxwell et al. , 2002, J. Am. Chem. Soc. 124:9606-9612;Broudeet al.,2002, Trends Biotechnol.20:249-56;Huang et al.,2002, Chem Res.Toxicol. 15:118-126;和 Yu et al. , 2001, J. Am. Chem. Soc 14:11155-11161 中描述的。標(biāo)記探針還可以包括黑洞淬滅劑(Biosearch)、Iowa Black(IDT)、QSY淬滅劑(MolecularLabeling probes)、以及Dabsyl和Dabcel磺酸鹽/羧酸鹽淬滅劑(Epoch)。標(biāo)記探針還可以包括兩種標(biāo)記探針,其中例如熒光團在一種探針上,以及淬滅劑在另一種探針上,其中兩種標(biāo)記探針一起雜交在靶標(biāo)上淬滅信號,或者其中在靶標(biāo)上雜交通過熒光變化改變信號特征。標(biāo)記探針還可以包括帶有磺酸基而不是羧酸基的熒光素染料的磺酸鹽衍生物、熒光素的亞磷酰胺形式、CY5的亞磷酰胺形式(例如可從Amersham購買)。如本文所用的,術(shù)語“核酸樣品”指存在于按照本教導(dǎo)的生物樣品中的核酸。預(yù)期可以有創(chuàng)性或無創(chuàng)性收集樣品。樣品可以在纖維、織物、香煙、口香糖、粘性材料、土壤或無生命物之上、之中、之內(nèi)、來自這些物質(zhì)或者被發(fā)現(xiàn)與這些物質(zhì)結(jié)合。本文所用的“樣品”以其廣義來使用,指包含核酸的樣品,基因靶標(biāo)或靶多核苷酸可以來源于所述核酸。樣品可以包括細胞、從細胞分離的染色體(例如,分散的中期染色體)、基因組DNA、RNA、cDNA等。樣品可以是動物或植物來源的,包括含有核酸的任何生物體,包括但不限于植物、牲畜、家養(yǎng)寵物和人類樣品,以及可以來自多種來源。這些來源可以包括但不限于全血、毛發(fā)、血液、尿液、組織活檢、淋巴、骨骼、骨髓、牙齒、羊水、毛發(fā)、皮膚、精液、肛門分泌物、陰道分泌物、汗液、唾液、頰拭子、多種環(huán)境樣品(例如農(nóng)業(yè)的水和土壤)、研究樣品、純化樣品和裂解的細胞。應(yīng)認識到,利用本領(lǐng)域已知的多種樣品制備方案的任一種,例如包括利用如機械力、超聲波降解法、限制性內(nèi)切核酸酶裂解這類操作方法、或本領(lǐng)域已知的任何方法,可以將含靶多核苷酸序列的核酸樣品從樣品中分離。如本文所用的術(shù)語“靶多核苷酸”、“基因靶標(biāo)”等在本文可互換使用,指感興趣的特定核酸序列?!鞍袠?biāo)”可以是尋求擴增的多核苷酸序列,并且能夠在其他核酸分子存在的情況下存在或者可以存在于更大核酸分子內(nèi)。靶多核苷酸可以從任何來源獲得,并且能夠包含任何數(shù)量的不同的組成組分。例如,靶標(biāo)可以是核酸(例如DNA或RNA)。靶標(biāo)可以是甲基化的、非甲基化的、或兩者都是。此外,應(yīng)認識到,用于感興趣的特定核酸序列語境下的“靶標(biāo)”還指其替代物(例如擴增產(chǎn)物)以及天然序列。在一些實施方案中,感興趣的特定核酸序列是來自降解源的短DNA分子,諸如可以在例如但不限于法醫(yī)學(xué)樣品中存在。本教導(dǎo)的感興趣的特定核酸序列可以來自上文所述的多種生物體和來源的任一種。如本文所用的,“DNA”指本領(lǐng)域所理解的多種形式的脫氧核糖核酸,諸如基因組DNA、cDNA、分離的核酸分子、載體DNA和染色體DNA?!昂怂帷敝溉魏涡问降腄NA或RNA。分離的核酸分子的實例包括但不限于包含在載體中的重組DNA分子、維持在異源宿主細胞中的重組DNA分子、部分或基本上純化的核酸分子以及合成的DNA分子。一般地,“分離的”核酸沒有在核酸來源的生物體的基因組DNA中天然位于核酸側(cè)翼的序列(即,位于核酸5’和3’端的序列)。而且,“分離的”核酸分子諸如cDNA分子通過重組技術(shù)產(chǎn)生時通?;旧蠜]有其他細胞物質(zhì)或培養(yǎng)基,或者通過化學(xué)方法合成時通?;旧蠜]有化學(xué)前體或其他化學(xué)制品。計算機和儀器系統(tǒng)用于本教導(dǎo)基因分型數(shù)據(jù)分析的系統(tǒng)和方法的多種實施方案可以利用圖2所示的方框圖描繪的計算機系統(tǒng)的多種實施方案。圖2是方框圖,舉例說明了按照多種實施方案可以用于執(zhí)行處理功能的計算機系統(tǒng)200,基于此可以實施本教導(dǎo)的實施方案。計算系統(tǒng)200可以包括一個或多個處理器,諸如處理器204。處理器204可以利用通用或?qū)S锰幚硪嬷T如例如微處理器、控制器或其他控制邏輯單元被應(yīng)用。在該實例中,處理器204與總線202或其他通信媒介連接。此外,應(yīng)認識到,圖2的計算系統(tǒng)200可以體現(xiàn)為多種形式的任何一種,諸如機架式計算機、主機、超級計算機、服務(wù)器、客戶端、臺式電腦、手提電腦、平板電腦、手持式計算裝置(例如PDA、手機、智能手機、掌上電腦等)、集群網(wǎng)格、上網(wǎng)本、嵌入式系統(tǒng)、或者可以滿足或適合給定應(yīng)用或環(huán)境的任何其他類型的專用或通用計算裝置。另外,計算系統(tǒng)200可以包括常規(guī)網(wǎng)絡(luò)系統(tǒng),包括客戶端/服務(wù)器環(huán)境以及一種或多種數(shù)據(jù)庫服務(wù)器、或與LIS/LIMS基礎(chǔ)結(jié)構(gòu)整合。包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)、以及包括無線和/或有線組件的多種常規(guī)網(wǎng)絡(luò)系統(tǒng)是本領(lǐng)域已知的。另外,客戶端/服務(wù)器環(huán)境、數(shù)據(jù)庫服務(wù)器和網(wǎng)絡(luò)在本領(lǐng)域有很好的記載。計算系統(tǒng)200可以包括總線202或其他用于信息通信的通信機構(gòu)、以及與總線202連接用于處理信息的處理器204。計算系統(tǒng)200還包括存儲器206,其可以是與總線202連接的隨機存取存儲器(RAM)或其他動態(tài)存儲器,用于儲存待被處理器204執(zhí)行的指令。存儲器206還可以在待被處理器204執(zhí)行的指令執(zhí)行期間,用于儲存臨時變量或其他中間信息。計算系統(tǒng)200還包括與總線202連接的只讀存儲器(ROM) 208或其他靜態(tài)存儲設(shè)備用于儲存靜態(tài)信息和處理器204的指令。計算系統(tǒng)200還可以包括存儲設(shè)備210,諸如磁盤、光盤、或固態(tài)硬盤(SSD),其被提供與總線202連接用于儲存信息和指令。存儲設(shè)備210可以包括介質(zhì)驅(qū)動器和可移動存儲接口。介質(zhì)驅(qū)動器可以包括驅(qū)動器或支持固定的或可移動存儲介質(zhì)的其他機構(gòu),諸如硬盤驅(qū)動器、軟盤驅(qū)動器、磁帶驅(qū)動器、光盤驅(qū)動器、⑶或DVD驅(qū)動器(R或RW)、閃盤驅(qū)動器或其他可移動或固定的介質(zhì)驅(qū)動器。如這些實例所闡明的,存儲介質(zhì)可以包括計算機可讀存儲介質(zhì),其中已經(jīng)儲存了特定的計算機軟件、指令和/或數(shù)據(jù)。在可選的實施方案中,存儲設(shè)備210可以包括允許計算機程序或其他指令或數(shù)據(jù)加載到計算系統(tǒng)200的其他類似的機構(gòu)。這種機構(gòu)可以包括例如可移動存儲單元和接口諸如程序盒和盒式接口、可移動存儲器(例如閃速存儲器或其他可移動存儲器模塊)和存儲器插槽、以及允許軟件和數(shù)據(jù)從存儲設(shè)備210轉(zhuǎn)移至計算系統(tǒng)200的其他可移動存儲單元和接口。計算系統(tǒng)200還可以包括通信接口 218。通信接口 218可以用于允許軟件和數(shù)據(jù)在計算系統(tǒng)200和外部設(shè)備之間傳輸。通信接口 218的實例可以包括調(diào)制解調(diào)器、網(wǎng)絡(luò)接口(諸如以太網(wǎng)或其他NIC卡)、通信端口 (諸如例如USB端口、RS-232C串行端口 )、PCMCIA插槽和卡、藍牙等。通過通信接口 218傳輸?shù)能浖蛿?shù)據(jù)為信號的形式,其可以是能夠被通信接口 218接收的電、電磁、光學(xué)或其他信號。這些信號可以通過諸如無線介質(zhì)、電線或電纜、光纖、或其他通信介質(zhì)的通道被通信接口 218傳送和接收。通道的一些實例包括電話線、移動電話鏈路、RF鏈路、網(wǎng)絡(luò)接口、局域網(wǎng)或廣域網(wǎng)以及其他通信通道。計算系統(tǒng)200可以通過通信接口 218與顯示器212通信,用于將信息顯示給計算機用戶,所述顯示器諸如陰極射線管(CRT)、液晶顯示器(LCD)以及發(fā)光二極管(LED)顯示器。在多種實施方案中,計算系統(tǒng)200可以通過總線與顯示器連接。包括字母數(shù)字和其他鍵的輸入設(shè)備214與總線202連接用于將信息和命令選擇傳遞給例如處理器204。輸入設(shè)備還可以是配置有接觸式屏幕輸入功能的顯示器,諸如IXD顯示器。另一類用戶輸入設(shè)備是光標(biāo)控制器216,諸如鼠標(biāo)、軌跡球或光標(biāo)方向鍵,用于將方向信息和命令選擇傳遞給處理器204以及用于控制光標(biāo)在顯示器212上的移動。該輸入設(shè)備通常具有在兩個軸(第一軸(例如,X)和第二軸(例如,y))上的兩個自由度,這允許該設(shè)備在平面上指定位置。計算系統(tǒng)200提供數(shù)據(jù)處理以及提供這類數(shù)據(jù)的置信水平。與本教導(dǎo)的實施方案的某些實施一致,計算系統(tǒng)200響應(yīng)執(zhí)行容納在存儲器206內(nèi)的一條或多條指令的一個或多個序列的處理器204,提供數(shù)據(jù)處理和置信值。這種指令可以從諸如存儲設(shè)備210的另一計算機可讀介質(zhì)讀取到存儲器206。存儲器206容納的指令序列的執(zhí)行導(dǎo)致處理器204執(zhí)行本文描述的進程狀態(tài)??蛇x地,硬接線電路可以用于代替軟件指令或與軟件指令組合來實施本教導(dǎo)的實施方案。因此,本教導(dǎo)實施方案的實施不局限于硬件電路和軟件的任何具體的組合。本文所用的術(shù)語“計算機可讀介質(zhì)”和“計算機程序產(chǎn)品”一般指參與提供一條或多條序列或一條或多條指令給處理器204來執(zhí)行的任何介質(zhì)。這種指令一般被稱為“計算機程序代碼”(其可以被歸類為計算機程序形式或其他類別),其被執(zhí)行時能夠使計算系統(tǒng)200運行本發(fā)明的實施方案的特征或功能。這些和其他形式的計算機可讀介質(zhì)可以采用許多形式,包括但不限于非易失性介質(zhì)、易失性介質(zhì)和傳輸介質(zhì)。非易失性介質(zhì)包括例如固態(tài)盤、光盤或磁盤,諸如存儲設(shè)備210。易失性介質(zhì)包括動態(tài)存儲器,諸如存儲器206。傳輸介質(zhì)包括同軸電纜、銅線和光纖,包括與總線202的連通。計算機可讀介質(zhì)的常見形式包括例如軟盤、軟磁盤(flexible disk)、硬盤、磁帶或任何其他的磁性介質(zhì),CD-ROM、任何其他的光學(xué)介質(zhì),打孔卡、紙帶、任何其他的有孔模式的物理介質(zhì),RAM、PROM和EPR0M、FLASH-EPR0M、任何其他存儲芯片或磁片盒,后文描述的載波、或者計算機可以讀取的任何其他介質(zhì)。
多種形式的計算機可讀介質(zhì)可以參與將一條或多條指令的一條或多條序列運載到處理器204執(zhí)行。例如,指令最初可以攜帶在遠程計算機的磁盤上。遠程計算機可以將指令加載到它的動態(tài)存儲器內(nèi),并且利用調(diào)制解調(diào)器通過電話線發(fā)送指令。計算系統(tǒng)200本地的調(diào)制解調(diào)器可以接收電話線上的數(shù)據(jù)并利用紅外發(fā)射器將數(shù)據(jù)轉(zhuǎn)換為紅外信號。與總線202連接的紅外檢測器可以接收紅外信號攜帶的數(shù)據(jù)并將數(shù)據(jù)置于總線202上??偩€202將數(shù)據(jù)運載到存儲器206,處理器204從存儲器206檢索并執(zhí)行指令。由存儲器206接收的指令可以任選地在處理器204執(zhí)行之前或之后儲存在存儲設(shè)備210上。本領(lǐng)域的技術(shù)人員會認識到,根據(jù)需要利用硬件、軟件、固件或其組合可以實施多種實施方案的操作。例如,在軟件、固件或硬接線邏輯單元的控制下,可以利用處理器或其他數(shù)字電路實施一些處理。(如本領(lǐng)域技術(shù)人員所認識到的,本文的術(shù)語“邏輯單元”指固定的硬件、可編程邏輯單元和/或其合適的組合以完成所述的功能)。軟件和固件可以儲存在計算機可讀介質(zhì)上。一些其他的處理可以利用本領(lǐng)域普通技術(shù)人員熟知的模擬電路來實施。另外,存儲器或其他存儲裝置,以及通信組件可以應(yīng)用在本發(fā)明的實施方案中。應(yīng)認識到,出于清楚的目的,上面的說明已經(jīng)結(jié)合不同的功能單元和處理器描述了本發(fā)明的實施方案。然而,顯而易見地,可以使用不同功能單元、處理器或域間的任何適當(dāng)?shù)墓δ芊峙洌幻撾x本發(fā)明。例如,通過單獨的處理器或控制器運行的所示功能可以通過同一處理器或控制器來運行。因此,提及的具體功能單元僅被視為用于提供所述功能的合適元件的參考,而不是表明嚴格的邏輯或物理結(jié)構(gòu)或組織。本教導(dǎo)用于基因分型數(shù)據(jù)分析的方法和系統(tǒng)的多種實施方案可以利用如圖3所示的方框圖中描繪的循環(huán)儀器的多種實施方案。圖3是方框圖,舉例說明了定量聚合酶鏈式反應(yīng)(qPCR)儀器300,基于此可以實施本教導(dǎo)的實施方案。PCR儀器300可以包括加熱蓋330,其置于包含在樣品支持裝置(未顯示)中的多個樣品340之上。在多種實施方案中,樣品支持裝置可以是具有多個樣品區(qū)的玻璃、金屬或塑料載片,該樣品區(qū)在樣品區(qū)和加熱蓋330間具有蓋。樣品支持裝置的一些實例可以包括但不限于,多孔板諸如標(biāo)準的微量滴定96-孔板、384-孔板,每一分析能夠處理數(shù)以千計的樣品的微裝置諸如多種微流體裝置、微卡裝置和微芯片裝置。樣品支持裝置多種實施方案中的樣品區(qū)可以包括凹陷、缺口、小孔、凸脊和其組合,在基質(zhì)表面形成規(guī)則或不規(guī)則陣列的圖案。qPCR儀器的多種實施方案包括樣品模塊350、用于加熱和冷卻的兀件360、熱交換器370、控制系統(tǒng)380和用戶界面390。在本教導(dǎo)中,提及了終點分析。對于專用于進行終點分析的PCR儀器而言,直至熱循環(huán)結(jié)束時才進行檢測。這種PCR儀器通常不包括成像儀310和光學(xué)件320。對于圖3所示的qPCR儀器,在生物樣品分析的運行時間進行檢測。檢測系統(tǒng)可以具有發(fā)射電磁能的照明源(未顯示)、用于接收來自樣品支持裝置中樣品340的電磁能的檢測器或成像儀310、以及用于指引來自每一樣品的電磁能到成像儀310的光學(xué)件320。對于按照本教導(dǎo)的PCR儀器的實施方案,控制系統(tǒng)380可以用于控制檢測系統(tǒng)、加熱蓋和熱模塊組件的功能。終端用戶可以通過用戶界面390接近控制系統(tǒng)380。另外,如圖2所示的計算機系統(tǒng)200可以起到為本教導(dǎo)的多種PCR儀器提供控制功能的作用,以及提供用戶界面功能。此外,圖2的計算機系統(tǒng)可以提供數(shù)據(jù)處理、顯示和報告準備功能。所有這些儀器控制功能可以專用于本地的PCR儀器,或者圖2的計算機系統(tǒng)200可以提供部分或全部控制、分析和報告功能的遠程控制。如以前提及的,本教導(dǎo)的系統(tǒng)和方法的多種實施方案可以具有直接控制熱循環(huán)儀器并與其通信的計算機。本教導(dǎo)用于分析基因分型數(shù)據(jù)的方法和系統(tǒng)的多種實施方案可以利用聯(lián)網(wǎng)熱循環(huán)儀器的多種實施方案,如圖4所示。圖4是用于聯(lián)網(wǎng)qPCR儀器的系統(tǒng)400的圖,基于此可以實施本教導(dǎo)的實施方案。系統(tǒng)400包括網(wǎng)絡(luò)410、兩個或更多個qPCR儀器420以及處理器430。兩個或更多個qPCR儀器420和處理器430通信。該通信可以包括例如數(shù)據(jù)或控制信息的交換。處理器430可以接收來自兩個或更多個qPCR儀器420中每個的標(biāo)記探針強度。換句話說,處理器430能夠基本上在同一時間監(jiān)測來自兩個或更多個qPCR儀器420的兩個或更多個實驗。處理器430和兩個或更多個qPCR儀器420間的通信不局限于PCR探針強度,處理器430可以發(fā)送和接收用于控制兩個或更多個qPCR儀器420的PCR實驗文件以及由兩個或更多個qPCR儀器420生成的任何數(shù)據(jù)。圖4表明系統(tǒng)400提供處理器430和兩個或更多個qPCR儀器420間的一對多的關(guān)系。在多種實施方案中,系統(tǒng)400提供了一個qPCR儀器和兩個或更多個處理器(未顯示)之間的一對多關(guān)系。例如,系統(tǒng)400允許一個qPCR儀器將來自PCR實驗的相同測量的探針強度發(fā)送到兩個或更多個處理器。換句話說,系統(tǒng)400允許一個qPCR儀器被兩個或更多個處理器監(jiān)測。在多種實施方案中,處理器430顯示與網(wǎng)絡(luò)410連接的所有PCR儀器的列表。該列表可以用于例如選擇儀器主動監(jiān)測。該列表可以接著展示當(dāng)前被監(jiān)測的儀器的窗口顯示。在多種實施方案中,在PCR實驗創(chuàng)建期間,該列表還可以用于選擇進行實驗的儀器。處理器430通過創(chuàng)建包括實驗的所有參數(shù)的文件而創(chuàng)建用于兩個或更多個qPCR儀器420中一個或多個的實驗。然后將該文件通過網(wǎng)絡(luò)410發(fā)送到兩個或更多個qPCR儀器420中的一個。例如與網(wǎng)絡(luò)連接的所有PCR儀器的列表是在用于輸入實驗文件信息的屏幕上的下拉式選擇列表。在多種實施方案中,處理器430顯示了它主動監(jiān)測的兩個或多個PCR儀器的列表。該列表可以用于選擇儀器,從該儀器可以獲得關(guān)于PCR實驗的其他狀態(tài)信息。在多種實施方案中,處理器430可以用于創(chuàng)建按序在同一 PCR儀器上運行的兩個或更多個實驗。例如,這兩個或更多個實驗是成批實驗。為包括例如能夠相繼加載兩個或更多個樣品板的機械臂的PCR儀器創(chuàng)建成批實驗。例如,處理器430顯示一個或多個可選擇的參數(shù),其可以用于創(chuàng)建將以成批模式運行的兩個或更多個PCR實驗。可選地,在多種實施方案中,處理器430提供命令行接口,其可以用于創(chuàng)建將以成批模式運行的兩個或更多個PCR實驗。在多種實施方案中,處理器340顯示能夠使數(shù)據(jù)文件從PCR實驗自動輸出的可選擇參數(shù)。一般地,qPCR儀器儲存來自PCR儀器上的實驗的輸出數(shù)據(jù)。然后通過利用處理器諸如處理器430訪問qPCR儀器并索取數(shù)據(jù),來檢索該輸出。在成批處理中,通過指示qPCR儀器在實驗結(jié)束時自動發(fā)送輸出數(shù)據(jù)到處理器430,可以增加通量。例如,可以通過在處理器430創(chuàng)建的實驗文件中置入一個參數(shù),指示qPCR儀器輸出文件。除了索取輸出數(shù)據(jù)文件的輸出,處理器430還可以指定其他參數(shù),其包括但不限于輸出文件的命名約定和輸出數(shù)據(jù)應(yīng)被發(fā)送到的存儲介質(zhì)上的位置。例如,命名約定可以包括將條形碼的板號添加至輸出數(shù)據(jù)文件名。在多種實施方案中,處理器430可以顯示窗口,其中可以指定偏愛的日期、時間和數(shù)據(jù)的數(shù)字間隔模式。在多種實施方案中,處理器430可以顯示允許包括校正信息的文件被選擇用于創(chuàng)建的特定PCR實驗的窗口。在多種實施方案中,處理器430可以顯示基因表達實驗的可選擇的樣品類型列表,可以顯示可選擇的基因靶標(biāo)列表,以及可以將每一選擇的基因靶標(biāo)的循環(huán)閾值標(biāo)繪為樣品類型的函數(shù)作為質(zhì)量控制。盡管結(jié)合網(wǎng)絡(luò)系統(tǒng)的多種實施方案詳述了上文的實施方案,但本領(lǐng)域的普通技術(shù)人員會認識到,本教導(dǎo)可以應(yīng)用于與處理器、存儲器和顯示器通信的單個qPCR儀器。可視化工具qPCR數(shù)據(jù)的動態(tài)顯示如上所述,盡管PCR系統(tǒng)接收和分析數(shù)據(jù),但它們通常僅在終點或PCR實驗結(jié)束后顯示有用或有差別的信息。例如,在基于定量PCR的基因分型中,可以在每一循環(huán)的運行時間動態(tài)獲得兩個等位基因特異性標(biāo)記探針的強度數(shù)據(jù)。一般地,作為擴增圖譜來查看該qPCR數(shù)據(jù)。擴增圖譜顯示了針對具有循環(huán)數(shù)間隔的時間標(biāo)繪的多個樣品的一個等位基因特異性標(biāo)記探針的強度,以方便終端用戶。如循環(huán)儀器領(lǐng)域的普通技術(shù)人員所獲悉的,可以利用多種操作方案從檢測器收集數(shù)據(jù),并且隨著時間采集。然而,擴增圖譜通常不顯示等位基因鑒別程度。傳統(tǒng)上,等位基因鑒別程度已經(jīng)在僅利用終點數(shù)據(jù)的等位基因鑒別圖譜中顯示。例如,等位基因鑒別圖譜顯示針對多個樣品的第二等位基因特異性標(biāo)記探針強度標(biāo)繪的相同多個樣品的第一等位基因特異性標(biāo)記探針的強度。等位基因鑒別圖譜中的等位基因鑒別程度顯示為數(shù)據(jù)群集之間的距離。此外,等位基因鑒別圖譜還可以顯示聚類算法的結(jié)果,其通過標(biāo)記具有分型的等位基因值的群集進行基因型分型。圖5是示例性的擴增圖譜500,基于此可以實施本教導(dǎo)的實施方案。例如,展示在圖5中的強度是等位基因特異性標(biāo)記探針的強度以提供熒光檢測。圖譜500中大量樣品的等位基因特異性標(biāo)記探針的擴增是明顯的。然而,等位基因鑒別程度是不明顯的。圖6是來自生成圖5數(shù)據(jù)的同一實驗的終點數(shù)據(jù)的示例性等位基因鑒別圖譜600,其中等位基因鑒別是明顯的,基于此可以實施本教導(dǎo)的實施方案。圖譜600中的等位基因鑒別程度從數(shù)據(jù)群集610、620和630間的距離看來是明顯的。此外,利用例如基因分型聚類算法,圖譜600所示的數(shù)據(jù)被進行其他處理以使得樣品被明確標(biāo)記為不確定的640、第一等位基因650、第二等位基因660、兩種等位基因670或無模板對照(NTC)680。盡管圖譜600的終點數(shù)據(jù)展示了等位基因鑒別程度,但并非所有終點數(shù)據(jù)都保證能展示類似結(jié)果。圖7是來自不同PCR實驗的終點數(shù)據(jù)的示例性等位基因鑒別圖譜700,其中等位基因鑒別是不明顯的,該實驗利用與用于生成圖5數(shù)據(jù)的樣品相同的樣品,基于該圖可以實施本教導(dǎo)的實施方案。例如,利用不同的測定設(shè)計或不同的樣品制備,可以生成圖7的圖譜700的數(shù)據(jù)以及圖6的圖譜600的數(shù)據(jù)。圖7的圖譜700幾乎沒有顯示等位基因鑒別,幾乎所有樣品值都位于一個大區(qū)域710中。此外,聚類算法將圖譜700中所有數(shù)據(jù)點標(biāo)記為不確定的。按照本教導(dǎo)的多種實施方案,擴增圖譜所示的時間維度(經(jīng)常顯示為循環(huán)數(shù))可以被添加至等位基因鑒別圖譜的等位基因鑒別能力,從而增加諸如在圖6所示的鑒別明顯的結(jié)果的置信度,或者檢驗諸如在圖7所示的那些的不確定的結(jié)果。在對應(yīng)的兩個或更多個時間時的兩個或更多個等位基因鑒別圖譜可以連續(xù)顯示,從而展示作為循環(huán)數(shù)函數(shù)的等位基因鑒別的進展。例如,這兩個或更多個等位基因鑒別圖譜可以在用戶控制下以用戶界面提供的互動過程來顯示,或者作為用戶選擇將基于時間的數(shù)據(jù)顯示為視頻。這兩個或更多個等位基因鑒別圖譜可以在數(shù)據(jù)收集的運行時間動態(tài)顯示,或者在數(shù)據(jù)收集后從儲存的數(shù)據(jù)顯示。圖8-10是對應(yīng)于熱循環(huán)三個不同時間的三個等位基因鑒別圖譜,其展示了作為循環(huán)數(shù)函數(shù)的等位基因鑒別的進展。按照本教導(dǎo)的多種實施方案,一旦數(shù)據(jù)被儲存,它可以在用戶選擇的任何時間被檢驗。在多種實施方案中,時間可以顯示為循環(huán)數(shù)。圖8是按照本教導(dǎo)的多種實施方案的示例性的等位基因鑒別圖譜800,其利用圖6的數(shù)據(jù)生成。在圖8中,顯示了按照本教導(dǎo)的圖形用戶界面,其呈現(xiàn)給用戶通過選擇循環(huán)數(shù)來選擇時間,顯示循環(huán)數(shù)為30。圖譜800顯示了在循環(huán)數(shù)30時,數(shù)據(jù)群集是定義明確的,SP便它們之間的距離是短的。該數(shù)據(jù)的置信度或質(zhì)量值也顯示在圖譜800中。樣品表820提供每一樣品的單元格,其中可以顯示關(guān)于樣品的多個信息,如下文更詳細討論的。例如,在單元格830中,顯示了特定樣品的90%的置信值。例如,樣品表820可以包括所有樣品的置信值(未顯示)。圖譜800還包括空白對照值或無模板對照(NTC)值840。按照多種實施方案,可以通過陰性對照來限定原點。陰性對照可以被稱為無模板對照(NTC),其為不含感興趣的靶基因組座位的樣品。對于基因分型測定的多種實施方案,陰性對照或NTC可以不含寡核苷酸物質(zhì),以及可以包含例如但不限于與被測定的生物樣品等同體積的所有試劑。按照基因分型測定的其他實施方案,NTC可以包含例如但不限于被確認不含被測定的靶基因組座位序列的寡核苷酸樣品。如本領(lǐng)域的普通技術(shù)人員獲悉的,這種NTC樣品仍然可以產(chǎn)生可以被檢測的背景信號。在這方面,一個或多個NTC樣品可以用于限定原點以及基線,從所述原點和基線可以確定發(fā)射三個可能等位基因每個的離散信號集的樣品角度。在多種實施方案中,多個NTC樣品可以用于確定原點和與其關(guān)聯(lián)的基線。如本領(lǐng)域普通技術(shù)人員所獲悉的,可以存在從多個NTC樣品處理數(shù)據(jù)的多種方法以確定原點值,包括但不限于確定多個NTC樣品的平均值、中值和形心。NTC 840用于確認如果不存在樣品則不會發(fā)現(xiàn)強度。置信度或質(zhì)量值還可以被顯示為信息列表的一部分。線850顯示了 90%的置信度或質(zhì)量值列表,以及孔標(biāo)簽、每一等位基因的強度值和基因型分型。例如,可以顯示所有樣品的線(未顯示)。圖9是來自生成圖6數(shù)據(jù)的同一實驗的循環(huán)數(shù)為35的示例性等位基因鑒別圖譜900,基于此可以實施本教導(dǎo)的實施方案。圖譜900表明循環(huán)數(shù)為35時,數(shù)據(jù)群集仍是定義明確的,并且群集間的距離在增加。單元格830所示的樣品的置信值更高。圖10是來自生成圖6數(shù)據(jù)的同一實驗的循環(huán)數(shù)為40的示例性等位基因鑒別圖譜1000,基于此可以實施本教導(dǎo)的實施方案。圖譜1000表明循環(huán)數(shù)為40時,數(shù)據(jù)群集仍是定義明確的,并且群集間的距離甚至增加更多。單元格830所示的樣品的置信值仍更高。圖8-10表明,響應(yīng)來自終端用戶的輸入顯示兩個或更多個等位基因鑒別圖譜可以提供額外的信息,并使多個額外或可選的處理步驟成為可能。例如,圖8-10使用戶相信圖6所示的終點數(shù)據(jù)是正確的。
此外,在整個反應(yīng)進程中顯示的定義明確的群集和高置信值可以表明,圖6和8-10的PCR實驗在低于通常的運行40循環(huán)時可以產(chǎn)生可信的結(jié)果,例如少至30或35個循環(huán)。因此,可以通過將兩個或更多個等位基因鑒別圖譜看作時間函數(shù)來改進和提高基因分型鑒別的某些測定。在多種實施方案中,如果具有高置信度的良好結(jié)果被PCR系統(tǒng)在熱循環(huán)時識別,它可以停止運行并進行基因型分型。該自動步驟可以通過減少基于qPCR數(shù)據(jù)的熱循環(huán)時間增加實驗通量。另外,圖8-10所示的實例包括通過基因分型算法生成的等位基因標(biāo)簽。在多種實施方案中,兩個或更多個等位基因鑒別圖譜可以顯示為時間的函數(shù),并不包括來自基因分型算法的信息。因此,利用本教導(dǎo)的多種實施方案分析數(shù)據(jù)可以提供給終端用戶手動進行基因型分型的能力。例如,通過利用顯示的信息,諸如定義明確的群集、群集間的距離和置信值,可以提供給終端用戶進行基因型分型的充分信息。最后,在一個傳統(tǒng)基因分型工作流程中,在任一熱循環(huán)運行前,利用qPCR儀器讀取每一樣品的等位基因特異性標(biāo)記探針的強度,其常被稱為預(yù)讀取數(shù)據(jù)采集。然后將樣品在PCR儀器上循環(huán)固定循環(huán)數(shù),該PCR儀器不包括讀取樣品的等位基因特異性標(biāo)記探針強度的性能。固定循環(huán)數(shù)之后,將樣品返回到qPCR系統(tǒng),并進行后讀取或終點數(shù)據(jù)采集。在此類工作流程中,可以通過比較后讀取和預(yù)讀取數(shù)據(jù)采集的等位基因鑒別圖譜,進行基因型分型。在多種實施方案中,顯示來自qPCR系統(tǒng)的兩個或更多個等位基因鑒別圖譜可以排除基因分型流程中的后讀取和預(yù)讀取數(shù)據(jù)采集的需要。兩個或更多個等位基因鑒別圖譜可以提供足夠的進行基因型分型的信息。圖8-10顯示了作為循環(huán)數(shù)函數(shù)的等位基因鑒別在三個單獨圖譜的進展。在多種實施方案中,這三個單獨圖譜中提供的信息可以集合顯示在一個圖譜中。例如,圖8-10的數(shù)據(jù)可以繪制在一個等位基因鑒別圖譜上,可以在不同循環(huán)數(shù)值間畫線。這些線可以被稱為軌跡線。圖11是來自生成圖5數(shù)據(jù)的同一實驗的循環(huán)數(shù)為40的示例性等位基因鑒別圖譜1100,其顯示了代表來自先前循環(huán)數(shù)的數(shù)據(jù)的軌跡線1110,基于此可以實施本教導(dǎo)的實施方案。軌跡線1110顯示了等位基因鑒別隨循環(huán)數(shù)的進展。例如,在多種實施方案中,受用戶的控制,可以將軌跡線1110添加至圖譜1000或從圖譜1000去除。圖譜1100中的數(shù)據(jù)以笛卡爾坐標(biāo)顯示。在多種實施方案中,該數(shù)據(jù)可以以極坐標(biāo)繪制。例如,極坐標(biāo)與一些聚類算法更相關(guān)。軌跡線1110會合于在原點1120處的第一循環(huán)數(shù)的數(shù)據(jù)。該會合表明,在熱循環(huán)開始時極少或沒有觀察到強度。傳統(tǒng)地,通過將空白對照或NTC添加到板孔提供了類似的信息。因此,在多種實施方案中,提供早期循環(huán)數(shù)的軌跡線可以取消對空白對照或NTC的需要。取消空白對照或NTC增加樣品在板上的空間,由此增加實驗通量。圖譜1100顯示了來自觀察基因組的一個特定位點的結(jié)果。在多種實施方案中,圖譜1100可以顯示從基因組的兩個或更多個位點的分析產(chǎn)生的數(shù)據(jù)。例如,該數(shù)據(jù)稱為復(fù)用數(shù)據(jù)。例如,來自基因組每一位點的數(shù)據(jù)的軌跡可以具有不同的原點。來自基因組每一位點的數(shù)據(jù)的軌跡還可以具有不同的強度范圍。在數(shù)據(jù)顯示前,對圖8-10中所示的數(shù)據(jù)運行聚類算法。如上所述,取決于每一循環(huán)數(shù)顯示的數(shù)據(jù)的置信度,可以進行基因型分型。類似地,在多種實施方案中,等位基因鑒別圖譜的軌跡可以聚集成組,并且這些組可以用于進行基因型分型。例如,可以利用雜交遞歸匹配(HRM)算法。一般地,聚類算法需要將一定數(shù)目的樣品聚集在一起以能夠進行基因型分型。例如,在單核苷酸多態(tài)性(SNP)基因分型中,給定的測定可以需要24個樣品以便將樣品聚集為兩個純合群和一個雜合群。在多種實施方案中,可以從單個軌跡線進行基因型分型。例如,直線移動而后向右傾斜的軌跡可以稱為第一等位基因純合的,直線移動而后向左傾斜的軌跡可以稱為第二等位基因純合的,以及沒有彎曲的軌跡可以稱為雜合的。這種類型的軌跡模式識別可以取消對數(shù)據(jù)聚類算法的需求。在多種實施方案中,分析等位基因鑒別圖譜的軌跡可以用于援救稀有SNP。帶有稀有SNP時,幾乎所有軌跡都是純合的。因此,樣品值靠近在一起,聚類算法對群集分型沒有基礎(chǔ)。然而,軌跡線顯示所有數(shù)據(jù)點在同一點開始,并且在一個方向移動。因此,可以從軌跡線進行基因型分型。在多種實施方案中,顯示等位基因鑒別進展的圖譜可以用于檢驗不確定的結(jié)果或援救寶貴的樣品。圖7是提供了不確定結(jié)果的終點數(shù)據(jù)的等位基因鑒別圖譜。然而,因為圖6從用于圖5的相同樣品繪制,所以已知對這些樣品進行基因分型是可能的。圖12是來自生成圖6數(shù)據(jù)的同一實驗的循環(huán)數(shù)為40的示例性等位基因鑒別圖譜1200,其顯示了代表來自先前循環(huán)數(shù)的數(shù)據(jù)的軌跡線1210,基于此可以實施本教導(dǎo)的實施方案。軌跡線1210表明三個群集在早期循環(huán)數(shù)時的確是分離的。因此軌跡線1210可以用于檢驗圖7的數(shù)據(jù)。如果圖7的數(shù)據(jù)從寶貴樣品生成,圖12的軌跡線1210可以用于援救這些數(shù)據(jù)。寶貴樣品是提供極小樣品輸入的樣品。例如,寶貴樣品包括來自法醫(yī)學(xué)、幾個細胞或激光捕獲顯微切割術(shù)的樣品。在多種實施方案中,通過允許循環(huán)數(shù)的選擇成為具有允許基因型分型的足夠質(zhì)量的數(shù)據(jù),軌跡線1210用于援救來自寶貴樣品的數(shù)據(jù)。然后將該循環(huán)數(shù)的數(shù)據(jù)用于基因型分型。圖12顯示數(shù)據(jù)群集在熱循環(huán)期間分離,然后接近結(jié)束時再次會合。沒有顯示等位基因鑒別隨著循環(huán)數(shù)的進展,該分離和會合是不明顯的。在多種實施方案中,PCR系統(tǒng)在PCR運行期可以自動監(jiān)測分離和會合。例如,如果發(fā)現(xiàn)從分離到會合的轉(zhuǎn)變,PCR系統(tǒng)可以調(diào)整熱循環(huán)以增加分離。例如,PCR系統(tǒng)可以增加退火溫度。在按照本教導(dǎo)的系統(tǒng)和方法的多種實施方案中,提供基因分型數(shù)據(jù)動態(tài)顯示的用戶界面包括提供樣品表和基因分型數(shù)據(jù)圖譜間互動作用的特征。在多種實施方案中,這種樣品表可以具有與表中出現(xiàn)的每一樣品相關(guān)的大量信息。按照多種實施方案,信息可以涉及與每一樣品有關(guān)的廣泛屬性。在多種實施方案中,這種樣品屬性可以包括但不限于樣品、生物分組、靶標(biāo)、任務(wù)、輸入質(zhì)量、時間、時間單位、樣品來源、處理以及終端用戶的評價。對于多種實施方案,與樣品表中每一樣品有關(guān)的信息可以涉及樣品在qPCR儀器上運行的操作方案。在本教導(dǎo)的系統(tǒng)和方法的多種實施方案中,終端用戶可以以任何希望的方式選擇樣品表上出現(xiàn)的一個樣品或多個樣品;每一樣品具有與其相關(guān)的豐富的樣品信息,以及所選的一個樣品或多個樣品可以在基因分型數(shù)據(jù)圖譜上顯示。按照多種實施方案,終端用戶可以滾動樣品表中輸入的樣品,并且觀察與每一樣品相關(guān)的信息。在這方面,通過這種可視化工具,終端用戶可以動態(tài)地理解多種實驗條件對基因分型實驗結(jié)果的影響。例如,在圖13A-13C中,顯示了在基因分型實驗中分析的多個樣品的數(shù)據(jù)。在圖13A中,三群樣品1310、1320和1330分別代表純合的(2/2)、純合的(1/1)、和雜合的(1/2)樣品群集。本領(lǐng)域的普通技術(shù)人員會認識到,樣品表代表分析多達384個樣品的測定模式,其中每一樣品出現(xiàn)在為行和列以字母數(shù)字命名的單元格中。如可以從樣品表中看到的,有91個分析的樣品(U=未知)、2個無模板對照(N)以及被分析的靶基因的三個陽性對照(1/1,2/2,和1/2)。在圖13B中,終端用戶可以選擇特定的樣品組,并且突出它們用于在圖譜上觀察和分析。在圖13C中,終端用戶可以選擇樣品表上的特定感興趣區(qū),以及相關(guān)的樣品被顯示在圖譜上。在多種實施方案中,終端用戶可以滾動樣品表并觀察與每一樣品有關(guān)的信息(未顯示)。以這種方式,終端用戶可以獲得對影響基因分型結(jié)果的條件的快速分析。按照本教導(dǎo)的系統(tǒng)和方法的多種實施方案,在基因分型測定的整個運行過程中采集的qPCR數(shù)據(jù)集提供了多個樣品中每一樣品隨著時間進程的快照(snap-shot)。在本教導(dǎo)的系統(tǒng)和方法的多種實施方案中,響應(yīng)終端用戶的輸入呈現(xiàn)的可視化工具可以提供基因分型數(shù)據(jù)的逐步顯示,或者它可以提供以視頻運行的顯示。在按照本教導(dǎo)的多種實施方案中,這種可視化工具可以為終端用戶提供作為時間函數(shù)的所有數(shù)據(jù)的動態(tài)回顧,以助于基因分型數(shù)據(jù)的分析。例如,圖14A代表了完成的分析,其中三個數(shù)據(jù)群集1610、1620和1630已被明確分型。然而,群集1615和1625沒有被用于分析基因分型數(shù)據(jù)的算法分型,代表了終點數(shù)據(jù)集中6個未分型的樣品。如圖14B中所示,終端用戶可以選擇時間(為了方便終端用戶,以循環(huán)數(shù)表示)來觀察在早于終點時間的時間時樣品的狀態(tài)。如觀察圖14B所看到的,在循環(huán)數(shù)為34時,樣品集中沒有通過基因分型算法作出可信分型的樣品數(shù)目減少到3個未分型的樣品。最后,在圖14C中,在循環(huán)數(shù)為30時,未分型的樣品數(shù)減少到2個樣品。盡管出于解釋的目的,圖14A-14C以顛倒的時間順序呈現(xiàn),但按照本教導(dǎo)的系統(tǒng)和方法的多種實施方案,終端用戶可以以任何順序選擇多個樣品基因分型測定進程的任何時間段。另外,本領(lǐng)域技術(shù)人員會認識到,盡管這些數(shù)據(jù)通過選擇少于40個循環(huán)表示的時間示例對結(jié)果的改善,但在某些情況下,對于運行更多循環(huán)數(shù)的多個樣品,分析結(jié)果也可以提高。例如,對于稀有或受損樣品中的基因靶標(biāo),終端用戶可以選擇多于40個循環(huán)的操作方案。在這種情況下,利用按照本教導(dǎo)的可視化工具的多種實施方案,可以利用所有的數(shù)據(jù)進行分析。出于舉例和說明的目的,已經(jīng)呈現(xiàn)了本教導(dǎo)的多種實施。它們不是窮舉的,并不將本教導(dǎo)局限于公開的確切形式。相反,正如本領(lǐng)域的技術(shù)人員所認識到的,本教導(dǎo)包括多種替代選擇、變型和等同物。結(jié)合上述教導(dǎo),變型和改變是可能的或者可以從實施本教導(dǎo)中獲得變型和改變。另外,描述的實施包括軟件,但本教導(dǎo)可以以硬件和軟件的組合或以單獨的硬件來實施。本教導(dǎo)可以用面向?qū)ο蟮暮头敲嫦驅(qū)ο蟮某绦蚧到y(tǒng)來實施。此外,在描述多種實施方案中,說明書可能以特定的步驟順序呈現(xiàn)方法和/或過程。然而,只要方法或過程不依賴于本文所列的特定步驟順序,該方法或過程不應(yīng)局限于所述的特定步驟順序。如本領(lǐng)域普通技術(shù)人員認識到的,其他步驟順序是可能的。因此,說明書中所列的特定步驟順序不應(yīng)解釋為對權(quán)利要求的限制。此外,涉及方法和/或過程的權(quán)利要求不應(yīng)局限于以所寫的順序執(zhí)行它們的步驟,并且本領(lǐng)域技術(shù)人員能夠容易地認識至IJ,順序可以變化并仍在多種實施方案的精神和范圍內(nèi)。
權(quán)利要求
1.用于基因分型數(shù)據(jù)可視化工具的計算機可讀存儲介質(zhì),其用處理器可執(zhí)行的指令編碼,所述指令包括 通過處理器接收第一時間的第一數(shù)據(jù)集,其中所述第一數(shù)據(jù)集包含第一探針的第一強度信號和第二探針的第一強度信號; 通過處理器接收第二時間的第二數(shù)據(jù)集,其中所述第二數(shù)據(jù)集包含第一探針的第二強度信號和第二探針的第二強度信號; 用可視化工具呈現(xiàn)給終端用戶,其中所述可視化工具提供選自以下的數(shù)據(jù)的動態(tài)顯示通過處理器從所述第一數(shù)據(jù)集生成第一圖譜,并顯示所述第一圖譜;以及通過處理器從所述第二數(shù)據(jù)集生成第二圖譜,并顯示所述第二圖譜;其中所述數(shù)據(jù)的動態(tài)顯示提供基因分型數(shù)據(jù)的分析。
2.如權(quán)利要求1所述的計算機可讀存儲介質(zhì),其中所述數(shù)據(jù)的動態(tài)顯示的選擇響應(yīng)于終端用戶的輸入。
3.如權(quán)利要求2所述的計算機可讀存儲介質(zhì),其中所述終端用戶的輸入是所述數(shù)據(jù)顯示的逐步選擇。
4.如權(quán)利要求2所述的計算機可讀存儲介質(zhì),其中所述終端用戶的輸入是所述數(shù)據(jù)視頻顯示的選擇。
5.如權(quán)利要求1所述的計算機可讀存儲介質(zhì),其中所述處理器與熱循環(huán)儀器通信。
6.如權(quán)利要求5所述的計算機可讀存儲介質(zhì),其中所述處理器在熱循環(huán)已完成后接收所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)集。
7.如權(quán)利要求5所述的計算機可讀存儲介質(zhì),其中所述處理器在熱循環(huán)期間接收所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)集。
8.如權(quán)利要求1所述的計算機可讀存儲介質(zhì),其中所述顯示包含所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)集間的軌跡線。
9.用于基因分型數(shù)據(jù)的可視化工具的計算機實現(xiàn)方法,所述方法包括 通過處理器接收第一時間的第一數(shù)據(jù)集,其中所述第一數(shù)據(jù)集包含第一探針的第一強度信號和第二探針的第一強度信號; 通過處理器接收第二時間的第二數(shù)據(jù)集,其中所述第二數(shù)據(jù)集包含第一探針的第二強度信號和第二探針的第二強度信號; 在計算機上處理所述數(shù)據(jù)集以分析基因分型數(shù)據(jù),所述處理包括用可視化工具呈現(xiàn)給終端用戶,其中所述可視化工具提供選自以下的數(shù)據(jù)的動態(tài)顯示通過處理器從所述第一數(shù)據(jù)集生成第一圖譜,并顯示所述第一圖譜;以及通過處理器從所述第二數(shù)據(jù)集生成第二圖譜,并顯示所述第二圖譜;其中所述數(shù)據(jù)的動態(tài)顯示提供基因分型數(shù)據(jù)的分析。
10.如權(quán)利要求9所述的計算機實現(xiàn)方法,其中所述數(shù)據(jù)的動態(tài)顯示的選擇響應(yīng)于終端用戶的輸入。
11.如權(quán)利要求10所述的計算機實現(xiàn)方法,其中所述終端用戶的輸入是所述數(shù)據(jù)顯示的逐步選擇。
12.如權(quán)利要求10所述的計算機實現(xiàn)方法,其中所述終端用戶的輸入是所述數(shù)據(jù)視頻顯示的選擇。
13.如權(quán)利要求9所述的計算機實現(xiàn)方法,其中所述處理器與熱循環(huán)儀器通信。
14.如權(quán)利要求13所述的計算機實現(xiàn)方法,其中所述處理器在熱循環(huán)已完成后接收所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)集。
15.如權(quán)利要求13所述的計算機實現(xiàn)方法,其中所述處理器在熱循環(huán)期間接收所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)集。
16.如權(quán)利要求9所述的計算機實現(xiàn)方法,其中所述顯示包含所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)集間的軌跡線。
17.系統(tǒng),其包含 處理器;以及 與所述處理器通信的存儲器,所述存儲器儲存用于以下的指令 通過所述處理器接收第一時間的第一數(shù)據(jù)集,其中所述第一數(shù)據(jù)集包含第一探針的第一強度信號和第二探針的第一強度信號; 通過所述處理器接收第二時間的第二數(shù)據(jù)集,其中所述第二數(shù)據(jù)集包含第一探針的第二強度信號和第二探針的第二強度信號; 用可視化工具呈現(xiàn)給終端用戶,其中所述可視化工具提供選自以下的數(shù)據(jù)的動態(tài)顯示通過所述處理器從所述第一數(shù)據(jù)集生成第一圖譜,并顯示所述第一圖譜;以及通過所述處理器從所述第二數(shù)據(jù)集生成第二圖譜,并顯示所述第二圖譜;其中所述數(shù)據(jù)的動態(tài)顯示提供基因分型數(shù)據(jù)的分析。
18.如權(quán)利要求17所述的系統(tǒng),其中所述數(shù)據(jù)的動態(tài)顯示的選擇響應(yīng)于終端用戶的輸入。
19.如權(quán)利要求18所述的系統(tǒng),其中所述終端用戶的輸入是所述數(shù)據(jù)顯示的逐步選擇。
20.權(quán)利要求18所述的系統(tǒng),其中所述終端用戶的輸入是所述數(shù)據(jù)視頻顯示的選擇。
21.如權(quán)利要求17所述的系統(tǒng),其中所述處理器與熱循環(huán)儀器通信。
22.如權(quán)利要求21所述的系統(tǒng),其中所述處理器在熱循環(huán)已完成后接收所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)集。
23.如權(quán)利要求21所述的系統(tǒng),其中所述處理器在熱循環(huán)期間接收所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)集。
24.如權(quán)利要求21所述的系統(tǒng),其中所述顯示包含所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)集間的軌跡線。
全文摘要
用于顯示從qPCR儀器獲得的數(shù)據(jù)的系統(tǒng)和方法。兩個或更多個樣品的每一個用第一標(biāo)記探針和第二標(biāo)記探針探測。在第一循環(huán)數(shù)時從qPCR儀器接收到第一數(shù)據(jù)集,其包括每一樣品的第一標(biāo)記探針強度和第二標(biāo)記探針強度。在第二循環(huán)數(shù)時接收到第二數(shù)據(jù)集,其包括每一樣品的第一標(biāo)記探針強度和第二標(biāo)記探針強度。利用第一數(shù)據(jù)集,生成第一標(biāo)記探針強度作為第二標(biāo)記探針強度函數(shù)的第一圖譜。利用第二數(shù)據(jù)集生成第一標(biāo)記探針強度作為第二標(biāo)記探針強度函數(shù)的第二圖譜。響應(yīng)用戶定義的輸入,第一圖譜和第二圖譜被顯示從而提供基因分型數(shù)據(jù)的動態(tài)和實時分析。
文檔編號G06F19/26GK103069427SQ201180024260
公開日2013年4月24日 申請日期2011年4月8日 優(yōu)先權(quán)日2010年4月9日
發(fā)明者戈登·亞納威, 陳詠嬋 申請人:生命技術(shù)公司