專利名稱:用于核酸測序驗證、校準(zhǔn)和標(biāo)準(zhǔn)化的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明的教導(dǎo)涉及用于核酸測序儀器和數(shù)據(jù)的驗證、校準(zhǔn)和標(biāo)準(zhǔn)化的核酸序列控制。
背景技術(shù):
在完成人類基因組計劃后,測序產(chǎn)業(yè)的焦點已經(jīng)轉(zhuǎn)移至發(fā)現(xiàn)更高通量和/或更低成本的測序技術(shù),有時稱作下一代測序技術(shù)。在使測序更高通量和/或更低費用時,目的是,使該技術(shù)更易用于測序。這些目的可以通過使用測序平臺和方法來達(dá)到,所述測序平臺和方法提供更大量的非常復(fù)雜的樣品的樣品制備、測序更大數(shù)目的復(fù)雜樣品和/或大量的信息產(chǎn)生和在短時間段內(nèi)的分析。不同的方法(例如,通過合成測序、通過雜交測序和通過連接測序)正在發(fā)展,以滿足這些挑戰(zhàn)。在這些下一代測序技術(shù)中可能發(fā)生的缺點是,額外的系統(tǒng)噪音的產(chǎn)生或每一步的性能變動。在每一步中,該步驟的系統(tǒng)噪音或性能變動可能源自硬件、化學(xué)和軟件中的至少一種。下一代測序技術(shù)和平臺的復(fù)雜性可能需要多種控制,以確保在樣品序列測定中樣品制備的性能的一致性。因而,可能希望具有這樣的控制或方法,其分離或鑒別系統(tǒng)噪音或每一步的變動(例如,差的)性能。噪音或變動的減少,可以改善隨時間產(chǎn)生的數(shù)據(jù)集的標(biāo)準(zhǔn)化,假定產(chǎn)生的大量信息可以被有意義地對比。一種常規(guī)的控制使用從眾所周知的樣品(例如,大腸桿菌菌株)產(chǎn)生的片段文庫, 并對片段文庫進(jìn)行測序方法。但是,天然存在的樣品作為控制的應(yīng)用,可以表現(xiàn)出自身的變動,這是由于樣品的單個鏈內(nèi)的突變。此外,這些常規(guī)的控制的制備,可以導(dǎo)致不同的序列被引入希望的控制序列的單克隆群體內(nèi),由此在控制系統(tǒng)自身內(nèi)產(chǎn)生噪音。因此,在下一代測序領(lǐng)域內(nèi)需要這樣的控制系統(tǒng)和方法,其可以提供系統(tǒng)噪音和/ 或性能降低的不同來源的系統(tǒng)測定和表征。在序列測定中提供一致性的一個希望的方面包括,提供確保在運(yùn)行之間(run-to-run)以及儀器之間(instrument-to-instrument)的儀器性能的控制。此外,可能希望提供這樣的控制技術(shù),其使在測序過程中由化學(xué)和/或文庫構(gòu)建引起的性能變動和/或噪音的檢測的可能性最小化,由此允許這樣的檢測歸因于儀器質(zhì)量。
圖1描述的方框圖表示用于下一代測序的儀器的不同實施方案;圖2示意性描述了根據(jù)本發(fā)明的教導(dǎo)可用于核酸測序的驗證、校準(zhǔn)和標(biāo)準(zhǔn)化的合成控制珠子的一個示例性實施方案;圖3示意性描述了根據(jù)本發(fā)明的教導(dǎo)的合成控制珠子的另一個示例性實施方案;圖4A-4D顯示的一系列圖描繪了根據(jù)本發(fā)明的教導(dǎo)用于制備合成控制珠子的不同實施方案的方法的可控制性質(zhì);圖5的圖顯示了根據(jù)本發(fā)明的教導(dǎo)的示例性實施方案而制備的不同合成控制珠子的模板密度結(jié)果;圖6的圖描繪了制備合成控制珠子的不同實施方案的方法的一個示例性實施方案的再現(xiàn)性;圖7是在用于測序的儀器上使用合成控制珠子產(chǎn)生的錯誤圖;圖8A-8B顯示的2幅圖證實了根據(jù)本發(fā)明的教導(dǎo)的不同示例性實施方案,與使用合成控制珠子產(chǎn)生的原有系統(tǒng)噪音相比,用于測序的儀器的系統(tǒng)噪音促成;且圖9是satay圖,其顯示了合成控制珠子集合的質(zhì)量控制OlC)測序中的4種染料的強(qiáng)度,所述合成控制珠子包含相同數(shù)目的各自IOM個核酸序列。應(yīng)當(dāng)理解,附圖不是按比例繪制,附圖中的物體也不一定按照彼此的關(guān)系的比例繪制。描繪的圖意在澄清和理解本文公開的儀器、系統(tǒng)和方法的不同實施方案。在可能時, 貫穿所有附圖使用相同的索引編號表示相同或類似的部件。
具體實施例方式本文使用的部分標(biāo)題僅用于組織目的,不應(yīng)解釋為以任何方式限制描述的主題。 在本申請中引用的所有文獻(xiàn)和類似的材料,包括但不限于專利專利申請、文章、書、論文和因特網(wǎng)頁,都特別地為任意目的通過引用整體并入。當(dāng)在并入的參考文獻(xiàn)中的術(shù)語的定義顯得不同于在本發(fā)明的教導(dǎo)中提供的定義時,以在本發(fā)明的教導(dǎo)中提供的定義為準(zhǔn)。應(yīng)當(dāng)理解,在本發(fā)明的教導(dǎo)中所討論的溫度、濃度、次數(shù)等之前隱含“約”,使得輕微且非實質(zhì)的偏差在本發(fā)明的教導(dǎo)的范圍內(nèi)。在本申請中,單數(shù)的使用包括復(fù)數(shù),除非另有特別說明。另外,“包含”、“含有”、“包括”的使用不表示限制性的。應(yīng)當(dāng)理解,前面的一般描述和下面的詳細(xì)描述僅僅是示例性的和解釋性的,不是限制本發(fā)明的教導(dǎo)。除非另有定義,與本文所述的本發(fā)明的教導(dǎo)結(jié)合使用的科學(xué)和技術(shù)術(shù)語應(yīng)當(dāng)具有本領(lǐng)域普通技術(shù)人員通常理解的含義。此外,除非上下文另有要求,單數(shù)術(shù)語應(yīng)當(dāng)包括復(fù)數(shù),復(fù)數(shù)術(shù)語應(yīng)當(dāng)包括單數(shù)。通常,與本文所述的細(xì)胞和組織培養(yǎng)、分子生物學(xué)、和蛋白、和寡核苷酸或多核苷酸化學(xué)和雜交中使用的命名法和技術(shù),是本領(lǐng)域眾所周知的且常用的那些。使用標(biāo)準(zhǔn)技術(shù),例如,用于核酸純化和制備、化學(xué)分析、重組核酸和寡核苷酸合成。根據(jù)生產(chǎn)商的說明書或按照本領(lǐng)域通常實現(xiàn)的或如本文所述,進(jìn)行酶反應(yīng)和純化技術(shù)。通常根據(jù)本領(lǐng)域眾所周知的常規(guī)方法,并按照在本說明書中引用和討論的不同的一般的和更具體的參考文獻(xiàn)所述,進(jìn)行本文所述的技術(shù)和操作。參見,例如,Sambrook等人,Molecular Cloning :A Laboratory Manual (第 3 版,Cold Spring Harbor Laboratory Press, Cold Spring Harbor,N. Y. 2000)。使用的命名法和本文所述的實驗操作和技術(shù),是本領(lǐng)域眾所周知且常用的那些。如根據(jù)本文提供的實施方案所使用的,除非另有說明,下面的術(shù)語應(yīng)當(dāng)理解為具有下述含義
短語“下一代測序”表示基于非Sanger的測序技術(shù),其具有增加的通量,例如具有一次產(chǎn)生數(shù)十萬相對小的序列讀數(shù)的能力。下一代測序技術(shù)的一些實例包括、但不限于通過合成測序、通過連接測序和通過雜交測序。一些相對眾所周知的下一代測序方法另外包括由454 Corporation開發(fā)的焦磷酸測序、Solexa系統(tǒng)和由Applied Biosystems (現(xiàn)在的 Life Technologies, Inc.)開發(fā)的SOLiD (通過寡核苷酸連接和檢測的測序)。短語“合成珠子”或“合成控制珠子”表示這樣的珠子,其具有連接到珠子上的合成模板核酸序列的多個拷貝??梢允褂眠B接序列來將合成模板連接到珠子上。短語“片段文庫”表示通過將較大的核酸切割或剪切成較小的片段而產(chǎn)生的核酸片段的集合。片段文庫可以從天然存在的核酸(諸如細(xì)菌核酸)產(chǎn)生。也可以產(chǎn)生包含類似大小的合成核酸序列的文庫,以產(chǎn)生合成片段文庫。短語“配對文庫”表示如下產(chǎn)生的核酸序列的集合通過用內(nèi)部接頭構(gòu)建體循環(huán)核酸片段,然后取出核酸片段的中間部分,以產(chǎn)生包含內(nèi)部接頭的線性核酸鏈,其中來自核酸片段的末端的序列連接到內(nèi)部接頭的任一端。象片段文庫一樣,配對文庫可以從天然存在的核酸序列產(chǎn)生。通過將合成核酸序列連接到內(nèi)部接頭序列的任一端,也可以產(chǎn)生合成的配對文庫。短語“合成核酸序列”及其變體表示設(shè)計的和合成的核酸序列。例如,按照規(guī)則或指南,可以設(shè)計合成核酸序列。例如,可以設(shè)計一組合成核酸序列,使得每個合成核酸序列包含不同的序列,和/或一組合成核酸序列包含設(shè)定長度的序列的每個可能的變體。例如, 一組64個合成核酸序列可以包含3堿基序列的每個可能的組合,或一組IOM個合成核酸序列可以包含5堿基序列的每個可能的組合。短語“控制集合”表示各自具有已知序列的核酸的集合,其中存在多個不同的核酸序列??刂萍峡梢园?,具有與其相連的核酸序列的珠子。核酸序列的來源可以是合成地衍生的核酸序列或天然存在的核酸序列。天然存在的或合成的核酸序列可以提供為,例如,片段文庫或配對文庫或類似的合成文庫。所述核酸序列也可以是其它形式,諸如包含多個插入物和多個內(nèi)部接頭的模板。其它形式的核酸序列可以包括連環(huán)體 (concatenate)0術(shù)語“模板”表示連接到固體支持物(諸如珠子)上的核酸序列。例如,模板序列可以包含連接到固體支持物上的合成核酸序列。模板序列也可以包括來自目標(biāo)樣品的未知核酸序列和/或已知核酸序列。短語“模板密度”表示連接到每個單個固體支持物上的模板序列的數(shù)目。短語“satay圖”表示4_空間圖在2_ 二維平面上的投影。例如,satay圖可以描繪4種不同的染料在2- 二維平面中的強(qiáng)度。本發(fā)明的教導(dǎo)涉及在執(zhí)行核酸測序中用于進(jìn)行質(zhì)量控制的方法和系統(tǒng)的不同示例性實施方案。例如,本發(fā)明的教導(dǎo)預(yù)見到合成控制珠子,其可以用作在測序中使用的儀器和化學(xué)(例如,探針化學(xué))的驗證、校準(zhǔn)和/或標(biāo)準(zhǔn)化的控制。本發(fā)明的教導(dǎo)另外涉及用于驗證、校準(zhǔn)和/或標(biāo)準(zhǔn)化在測序中使用的儀器的方法和系統(tǒng)。本發(fā)明的教導(dǎo)的不同實施方案涉及用于進(jìn)行核酸樣品測序的質(zhì)量控制的系統(tǒng)。所述系統(tǒng)可以包括固體支持物的集合,每個固體支持物具有與其相連的多個核酸序列。所述集合可以包括多組固體支持物,且每個組可以含有具有與其相連的相同核酸序列的固體支持物,其中每個組的核酸序列彼此不同,且其中所述核酸序列被合成地衍生。本發(fā)明的教導(dǎo)的其它示例性實施方案涉及為進(jìn)行核酸樣品測序準(zhǔn)備質(zhì)量控制的方法,所述方法包括產(chǎn)生多個合成核酸序列,其中每個合成核酸序列不同于其它核酸序列,將該合成核酸序列中的每一個連接到在多組固體支持物中的固體支持物上,其中每個組中的固體支持物具有與其相連的相同的合成核酸序列,并將每個組的固體支持物與連接的合成核酸序列相組合,以產(chǎn)生用于進(jìn)行核酸樣品測序的固體支持物的控制集合。本發(fā)明的教導(dǎo)的其它實施方案進(jìn)一步涉及進(jìn)行核酸測序驗證的方法,所述方法包括將固體支持物的集合放置在核酸測序儀器的檢測區(qū)域,所述每個固體支持物具有多個與其相連的合成核酸序列,其中所述固體支持物的集合包含多組固體支持物,組中的每個固體支持物具有與其相連的相同的合成核酸序列,且不同組中的固體支持物具有與其相連的不同的合成核酸序列。所述方法可以另外包括產(chǎn)生焦點地圖(focal map),以鑒別每個固體支持物相對于核酸測序儀器的檢測區(qū)域的位置,并進(jìn)行一個或多個連接循環(huán),以將染料-標(biāo)記的探針序列連接到與固體支持物相連的核酸序列上。所述方法可以另外包括檢測連接到每個核酸序列上的染料-標(biāo)記的探針,測量染料-標(biāo)記的探針的強(qiáng)度,并將測量的強(qiáng)度與閾值對比,以確定儀器是否有效工作。在本文所述的不同實施例和實施方案中,使用雙堿基或二堿基編碼(例如,如在 SOLiD測序中所采用的),針對通過連接測序的系統(tǒng)描述了合成的控制系統(tǒng)和方法。但是, 本領(lǐng)域技術(shù)人員會容易地明白,本文所述的合成珠子和方法可以適用于其它測序系統(tǒng)或檢測技術(shù)。使用合成珠子的合成控制珠子和方法的原理可以適用于其它系統(tǒng)和方法,而不脫離本文所述的本發(fā)明的教導(dǎo)的范圍。用于下一代測序的平臺的不同實施方案可以包括在圖1的方框圖中顯示的組分。 根據(jù)不同的實施方案,儀器100可以包括流體遞送和控制單元110、樣品處理單元120、光學(xué)單元130和數(shù)據(jù)獲取、分析和控制單元140,在美國專利申請
發(fā)明者C·格耶斯塔, D·P·格雷納, H·布羅伊, J·S·齊格爾, J·錢, L·W·瓊斯, M-Y·沈 申請人:生命科技公司