固體支持物上的樣品制備
【專利說明】固體支持物上的樣品制備
[0001]相關(guān)申請
[0002]本申請要求于2013年I月9日提交的美國臨時申請?zhí)?1/750,682的優(yōu)先權(quán),其在此通過引用以其整體并入。
[0003]背景
[0004]存在很多期望從雙鏈DNA(dsDNA)靶分子產(chǎn)生片段化并加標(biāo)簽的DNA分子文庫的方法和應(yīng)用。通常,目的是從大的dsDNA分子產(chǎn)生較小的DNA分子(例如,DNA片段),用于用作DNA測序反應(yīng)中的模板。
[0005]目前用于雙鏈DNA的片段化和加標(biāo)簽用于在下一代測序中使用的很多方法浪費DNA,需要用于片段化的昂貴的設(shè)備,并且片段化、加標(biāo)簽和回收加標(biāo)簽的DNA片段的過程困難、冗長、費力、耗時、低效、昂貴、需要相對大量的樣品核酸。另外,這些方法中的很多產(chǎn)生加標(biāo)簽的DNA片段,所述加標(biāo)簽的DNA片段不完全代表包含于加標(biāo)簽的DNA片段從其產(chǎn)生的樣品核酸中的序列。因此,本領(lǐng)域需要的是提供當(dāng)從靶DNA產(chǎn)生加標(biāo)簽的DNA片段文庫時快速且方便使用的方法,其能容易地應(yīng)用到核酸分析方法,諸如下一代測序和擴增方法。
[0006]概沭
[0007]本文提供了用于固體支持物上的核酸樣品制備的方法和組合物。所述方法和組合物特別地涉及用于使用固定至固體支持物的轉(zhuǎn)座子組合物片段化DNA并使DNA加標(biāo)簽的方法和組合物。本文提供的方法和組合物是有用的,例如,用于產(chǎn)生在下一代測序方法等中使用的加標(biāo)簽的DNA片段文庫。在一些優(yōu)選的實施方案中,本發(fā)明涉及在固體支持物上從來自任何來源的靶DNA制備線性ssDNA片段,用于基因組、亞基因組、轉(zhuǎn)錄組、或宏基因組分析,或RNA表達分析,所述靶DNA包括任何感興趣的dsDNA (包括從RNA制備的雙鏈cDNA)。
[0008]相應(yīng)地,本發(fā)明提供了制備加標(biāo)簽的DNA片段的固定的文庫(immobiIizedlibrary of tagged DNA)的方法,所述方法包括:(a)提供具有轉(zhuǎn)座體復(fù)合物(transposomecomplex)固定于其上的固體支持物,其中轉(zhuǎn)座體復(fù)合物包含結(jié)合至第一多核苷酸的轉(zhuǎn)座酶,所述第一多核苷酸包含(i)3’部分,所述3’部分包含轉(zhuǎn)座子末端序列,和(ii)第一標(biāo)簽,所述第一標(biāo)簽包含第一標(biāo)簽域;和(b)在靶DNA藉以被轉(zhuǎn)座體復(fù)合物片段化,并且第一多核苷酸的3’轉(zhuǎn)座子末端序列藉以轉(zhuǎn)移至片段的至少一條鏈的5’末端的條件下,將靶DNA施加于固體支持物;從而產(chǎn)生雙鏈片段的固定的文庫,其中至少一條鏈?zhǔn)怯玫谝粯?biāo)簽在5’-加標(biāo)簽的。在一些實施方案中,轉(zhuǎn)座體復(fù)合物包含第二多核苷酸,所述第二多核苷酸包含與所述轉(zhuǎn)座子末端序列互補的區(qū)域。所述方法還包括(c)提供溶液中的轉(zhuǎn)座體復(fù)合物,并在靶DNA藉以被溶液中的轉(zhuǎn)座體復(fù)合物片段化的條件下使轉(zhuǎn)座體復(fù)合物與固定的片段接觸;從而獲得具有一個末端在溶液中的固定的核酸片段。在一些實施方案中,溶液中的轉(zhuǎn)座體復(fù)合物可包含第二標(biāo)簽,以使得所述方法產(chǎn)生具有第二標(biāo)簽的固定的核酸片段,所述第二標(biāo)簽在溶液中。第一標(biāo)簽和第二標(biāo)簽可以是不同的或相同的。
[0009]本文還提供了根據(jù)以上方法或其他方法制備的具有加標(biāo)簽的DNA片段的文庫固定于其上的固體支持物。例如,本文提供了具有轉(zhuǎn)座體復(fù)合物固定于其上的固體支持物,其中轉(zhuǎn)座體復(fù)合物包含結(jié)合至第一多核苷酸的轉(zhuǎn)座酶,多核苷酸包含α)3’部分,所述3’部分包含轉(zhuǎn)座子末端序列,和(ii)第一標(biāo)簽,所述第一標(biāo)簽包含第一標(biāo)簽域;
[0010]本文還提供了產(chǎn)生流通池(flowcell)的方法,包括將多個轉(zhuǎn)座體復(fù)合物固定至固體支持物,所述轉(zhuǎn)座體復(fù)合物包含結(jié)合至第一多核苷酸的轉(zhuǎn)座酶,第一多核苷酸包含(i) 3'部分,所述3’部分包含轉(zhuǎn)座子末端序列,和(ii)第一標(biāo)簽,所述第一標(biāo)簽包含第一標(biāo)簽域。
[0011]所述方法還可包括提供具有多個第一多核苷酸固定于其上的固體支持物,以及使固體支持物與轉(zhuǎn)座酶全酶和第二多核苷酸接觸,所述第二多核苷酸包含與轉(zhuǎn)座子末端序列互補的區(qū)域。在所述方法的一些實施方案中,所述固定包括(a)提供具有擴增引物偶聯(lián)至其的固體支持物;(b)使第二多核苷酸與擴增引物之一雜交,所述第二寡核苷酸包含與轉(zhuǎn)座子末端序列互補的區(qū)域,以及與第一標(biāo)簽互補的區(qū)域;(C)使用聚合酶延伸擴增引物以產(chǎn)生包含與第二多核苷酸雜交的第一多核苷酸的雙鏈體,所述第一多核苷酸直接地固定至固體支持物;以及(d)使固體支持物與轉(zhuǎn)座酶全酶接觸,從而在固體支持物上組裝轉(zhuǎn)座體復(fù)合物。
[0012]本文還提供了一種微粒群體,所述微粒群體具有固定至其的轉(zhuǎn)座體復(fù)合物,所述轉(zhuǎn)座體復(fù)合物包含結(jié)合至第一多核苷酸的轉(zhuǎn)座酶和第二多核苷酸;其中第一多核苷酸在其5’末端被固定至微粒的表面并且第二多核苷酸與第一多核苷酸的3’末端雜交;并且其中第一多核苷酸包含:(i)3’部分,所述3’部分包含轉(zhuǎn)座子末端序列,和(ii)第一標(biāo)簽,所述第一標(biāo)簽包含第一標(biāo)簽域。本文還提供了產(chǎn)生加標(biāo)簽的DNA片段的固定的文庫的方法,所述方法包括使靶DNA與以上微粒群體接觸以產(chǎn)生固定的加標(biāo)簽的DNA片段。
[0013]本文還提供了產(chǎn)生加標(biāo)簽的DNA片段文庫的方法,所述加標(biāo)簽的DNA片段文庫用于索引定向的組裝為較長的序列讀段,所述方法包括:提供具有轉(zhuǎn)座體復(fù)合物固定至其的微粒群體,所述轉(zhuǎn)座體復(fù)合物包含結(jié)合至第一多核苷酸的轉(zhuǎn)座酶和第二多核苷酸,所述第一多核苷酸包含與微粒締合的索引域;將靶DNA施加于微粒群體,從而產(chǎn)生用索引域加標(biāo)簽的固定的DNA片段。在以上方法的某些實施方案中,第一多核苷酸在其5’末端被固定至微粒的表面并且第二多核苷酸與第一多核苷酸的3’末端雜交;并且其中第一多核苷酸包含:(i)3’部分,所述3’部分包含轉(zhuǎn)座子末端序列,和(ii)索引域;并且其中微粒群體包括至少多個索引域,并且其中單個微粒上的第一多核苷酸共用相同的索引域。
[0014]本文還提供了用于對多個靶DNA分子測序的方法,所述方法包括:在靶DNA藉以被轉(zhuǎn)座體復(fù)合物片段化的條件下,將多個靶DNA施加至具有轉(zhuǎn)座體復(fù)合物固定至其上的固體支持物上;從而產(chǎn)生雙鏈片段的固定的文庫,其中每個靶DNA的第一部分在所述固體支持物上的第一位置處被附接至所述固體支持物,并且每個靶DNA的第二部分在所述固體支持物上的第二位置處被附接至所述固體支持物;以及繪制所述雙鏈片段的固定的文庫的圖譜以產(chǎn)生由每個靶DNA連接的位置的組;確定靶DNA的所述第一部分和所述第二部分的序列;以及關(guān)聯(lián)所述位置的組以確定第一部分和第二部分的哪些被所述靶DNA連接,并確定革巴DNA分子的序列。
[0015]在本文提供的方法和組合物的一些實施方案中,轉(zhuǎn)座體復(fù)合物以至少103、104、105、16個復(fù)合物每mm 2的密度存在于固體支持物上。在一些實施方案中,轉(zhuǎn)座體復(fù)合物包含超活性轉(zhuǎn)座酶,諸如Tn5轉(zhuǎn)座酶。
[0016]在本文提供的方法和組合物的一些實施方案中,標(biāo)簽域可包含例如用于簇擴增的區(qū)域。在一些實施方案中,標(biāo)簽域可包含用于引發(fā)測序反應(yīng)的區(qū)域。
[0017]在本文提供的方法和組合物的一些實施方案中,固體支持物可包括例如微粒、模式化的表面、孔等。在一些實施方案中,轉(zhuǎn)座體復(fù)合物在固體支持物上隨機地分布。在一些實施方案中,轉(zhuǎn)座體復(fù)合物在模式化的表面上隨機地分布。
[0018]一個或更多個實施方案的細節(jié)在附圖和以下的說明中被描述。其他的特征、目標(biāo)、和優(yōu)勢將由說明書和附圖,以及由權(quán)利要求而明顯。
[0019]附圖簡沐
[0020]圖1a顯示了根據(jù)一個實施方案的一般性概念。圖1b顯示了根據(jù)一個實施方案的一般性概念。
[0021]圖2a是闡述標(biāo)簽化(tagmentat1n)反應(yīng)的示意圖。
[0022]圖2b是重繪得到的橋以闡明得到的橋的性質(zhì)的示意圖。
[0023]圖3a闡述了其中兩種形式的轉(zhuǎn)座體被組裝在流通池的表面上的實施方案。將DNA添加至流通池導(dǎo)致DNA的標(biāo)簽化以及將DNA偶聯(lián)至轉(zhuǎn)座體。在圖3a中還顯示了不同類型的得到的簇:P7:P7、P5:P5和P5:P7簇。3b闡述了其中兩種形式的轉(zhuǎn)座體被組裝在流通池的表面上的實施方案。
[0024]圖4a闡述了另一個實施方案。在圖4a中,只存在一種形式的表面結(jié)合的轉(zhuǎn)座體(例如,P5轉(zhuǎn)座體),得到在每個末端具有相同的標(biāo)簽序列的橋。添加另外的轉(zhuǎn)座體以進一步片段化橋結(jié)構(gòu)并且并入另外的標(biāo)簽序列(P7)。
[0025]圖4b顯示了擴增以產(chǎn)生從每個轉(zhuǎn)座體殘余部分(stump)得到的簇的對,所述簇的對代表了起始的完整的DNA樣品中兩個相鄰的片段(圖4b)。
[0026]圖5a、5b、5c和5(!闡述了用于組裝表面結(jié)合的轉(zhuǎn)座體復(fù)合物的不同的方法。圖5a顯示了這種用于組裝表面結(jié)合的轉(zhuǎn)座體復(fù)合物的方法的一個實施方案。圖5b顯示了在溶液中組裝的轉(zhuǎn)座體復(fù)合物并且固定包括將第一多核苷酸與夾板(splint)寡核苷酸連接的另外的步驟,所述夾板寡核苷酸偶聯(lián)至固體支持物。圖5c顯示了轉(zhuǎn)座體二聚體通過使帶環(huán)的寡核苷酸(looped oligonucleotide)與固定的第一多核苷酸雜交來組裝。圖5d顯示轉(zhuǎn)座體復(fù)合物可被組裝在具有擴增引物固定至其上的標(biāo)準(zhǔn)成對末端流通池上。
[0027]圖6a闡述了用于作為實施例1提出的實驗的設(shè)計。圖6b闡述了用于作為實施例1提出的實驗的設(shè)計。
[0028]圖7闡述了在根據(jù)實施例1中提出的設(shè)計進行的實驗中獲得的代表性數(shù)據(jù)。
[0029]圖8闡述了在根據(jù)實施例1中提出的設(shè)計進行的實驗中獲得的代表性數(shù)據(jù)。
[0030]圖9是根據(jù)一個實施方案組裝珠結(jié)合的轉(zhuǎn)座體并且隨后標(biāo)簽化的圖解。
[0031]圖10是根據(jù)一個實施方案組裝珠結(jié)合的轉(zhuǎn)座體并且隨后標(biāo)簽化的圖解。
[0032]圖11是根據(jù)一個實施方案組裝珠結(jié)合的轉(zhuǎn)座體并且隨后標(biāo)簽化的圖解。
[0033]圖12是根據(jù)一個實施方案組裝珠結(jié)合的轉(zhuǎn)座體并且隨后標(biāo)簽化的圖解。
[0034]圖13是根據(jù)一個實施方案的表面結(jié)合的轉(zhuǎn)座體的圖解。
[0035]圖14是根據(jù)一個實施方案在珠結(jié)合的轉(zhuǎn)座體上進行標(biāo)簽化的圖解。
[0036]圖15是根據(jù)一個實施方案在珠結(jié)合的轉(zhuǎn)座體上進行子片段的標(biāo)簽化和條形碼化的圖解。
[0037]圖16是根據(jù)一個實施方案在珠結(jié)合的轉(zhuǎn)座體上進行子片段的標(biāo)簽化和條形碼化的圖解。
[0038]圖17是如在實施例3中描述的轉(zhuǎn)座體組裝的圖解。
[0039]圖18a是如在實施例3中描述的轉(zhuǎn)座體組裝的圖解。
[0040]圖18b闡述了如在實施例3中描述的利用轉(zhuǎn)座體組裝的結(jié)果。
[0041]碰
[0042]用于測序核酸樣品的現(xiàn)有方案常規(guī)地使用將DNA或RNA轉(zhuǎn)換為模板文庫的樣品制備方法。這些方法可導(dǎo)致DNA樣品的丟失并且通常需要用于片段化的昂貴的設(shè)備。另外,樣品制備方法通常是困難、冗長且低效的。
[0043]在標(biāo)準(zhǔn)樣品制備方法中,每個模板在任一插入物末端含有適體并且通常需要很多步驟以修飾DNA或RNA并純化期望的修飾反應(yīng)產(chǎn)物。在將適合的片段添加至流通池之前,在溶液中進行這些步驟,其中適合的片段通過引物延伸反應(yīng)被偶聯(lián)至表面,所述引物延伸反應(yīng)將雜交的片段拷貝至共價地附接至表面的引物的末端。然后這些‘接種’模板通過若干個循環(huán)的擴增產(chǎn)生拷貝的模板的單克隆簇。
[0044]在溶液中將DNA轉(zhuǎn)化成適體修飾的模板,為形成簇和測序做準(zhǔn)備所需要的步驟的數(shù)目可通過使用轉(zhuǎn)座酶介導(dǎo)的片段化和加標(biāo)簽來最小化。本文被稱作“標(biāo)簽化(tagmentat1n) ”的該方法通常包括DNA通過包含與含有轉(zhuǎn)座子末端序列的適體復(fù)合的轉(zhuǎn)座酶的轉(zhuǎn)座體復(fù)合物的修飾。標(biāo)簽化導(dǎo)致同時的DNA的片段化和適體與雙鏈體片段的兩條鏈的5’末端的連接。純化步驟去除轉(zhuǎn)座酶之后,另外的序列通過PCR被添加至適合的片段的末端。
[0045]基于溶液的標(biāo)簽化具有缺點并且需要若干勞動密集的步驟。另外,在PCR擴增步驟期間可引入偏倚。本文提供的方法和組合物克服了這些缺點并且允許無偏倚樣品制備、簇形成和測序發(fā)生在單固體支持物上,對樣品操作或轉(zhuǎn)移的需求最小。
[0046]本公開內(nèi)容涉及出乎意料的發(fā)現(xiàn),預(yù)偶聯(lián)至流通池的表面的轉(zhuǎn)座體復(fù)合物可在流通池內(nèi)有效地片段化、加標(biāo)簽并固定完整的DNA。在特定的實施方案中,包含轉(zhuǎn)座體適體的一個或更多條鏈經(jīng)由其5’末端被附接至流通池的表面。當(dāng)完整的DNA被泵至流通池上時,標(biāo)簽化反應(yīng)以與在基于溶液的標(biāo)簽化反應(yīng)中發(fā)生的相同方式發(fā)生,但是得到的產(chǎn)物片段通過其末端物理地附接至流通池的表面。轉(zhuǎn)座體適體序列可包含使隨后能夠產(chǎn)生簇并測序的序列。
[0047]本文提供的方法和組合物提供了超過基于溶液的標(biāo)簽化方法的若干優(yōu)勢。例如,純化的、部分純化的或甚至未純化的完整的DNA模板可被直接地上樣至流通池,用于產(chǎn)生簇,而無之前的樣品制備。另外,初始的完整DNA中序列信息的連續(xù)性可通過在流通池表面上并置標(biāo)簽化的(tagmented)片段來物理地保存。作為另外的優(yōu)勢,DNA被物理地連接至流通池的表面,所以在DNA的進一步操作之后反應(yīng)物的純化可通過流通池通道中的流通緩沖液交換來完成。
[0048]固體支持物i:的標(biāo)簽化
[0049]根據(jù)以上,本文提供了制備加標(biāo)簽的DNA片段的固定的文庫的方法。在一些實施方案中,方法可包括:(a)提供具有轉(zhuǎn)座體復(fù)合物固定于其上的固體支持物,其中轉(zhuǎn)座體復(fù)合物包含結(jié)合至第一多核苷酸的轉(zhuǎn)座酶,第一多核苷酸包含α)3’部分,所述3’部分包含轉(zhuǎn)座子末端序列,和(ii)第一標(biāo)簽,所述第一標(biāo)簽包含第一標(biāo)簽域;和(b)在靶DNA藉以被轉(zhuǎn)座體復(fù)合物片段化,并且第一多核苷酸的3’轉(zhuǎn)座子末端序列藉以被轉(zhuǎn)移至片段的至少一條鏈的5’末端的條件下,將靶DNA施于固體支持物;從而產(chǎn)生雙鏈片段的固定的文庫,其中至少一條鏈?zhǔn)怯玫谝粯?biāo)簽在5’ -加標(biāo)簽的。
[0050]如本文使用的,術(shù)語“轉(zhuǎn)座體復(fù)合物”通常地指非共價地結(jié)合至雙鏈核酸的轉(zhuǎn)座酶。例如,復(fù)合物可以是在支持非共價復(fù)合物形成的條件下與雙鏈轉(zhuǎn)座子DNA預(yù)孵育的轉(zhuǎn)座酶。雙鏈轉(zhuǎn)座子DNA可包括但不限于Tn5 DNA、Tn5 DNA的部分、轉(zhuǎn)座子末端成分、轉(zhuǎn)座子末端成分的混合物或能與轉(zhuǎn)座酶諸如超活性Tn5轉(zhuǎn)座酶相互作用的其他雙鏈DNA。
[0051]“轉(zhuǎn)座酶”指能與含有轉(zhuǎn)座子末端的成分(例如,轉(zhuǎn)座子、轉(zhuǎn)座子末端、轉(zhuǎn)座子末端成分)形成功能性復(fù)合物且例如能在體外轉(zhuǎn)座反應(yīng)中催化含轉(zhuǎn)座子末端的成分插入或轉(zhuǎn)座至與其一起孵育的雙鏈靶DNA的酶。如本文提供的轉(zhuǎn)座酶還可包括來自逆轉(zhuǎn)錄轉(zhuǎn)座子和逆轉(zhuǎn)錄病毒的整合酶。轉(zhuǎn)座酶、轉(zhuǎn)座體和轉(zhuǎn)座體復(fù)合物通常地是為本領(lǐng)域技術(shù)人員所熟知的,如由US 2010/0120098的公開內(nèi)容所例證的,通過引用其內(nèi)容全部并入本文。盡管本文描述的很多實施方案涉及Τη5轉(zhuǎn)座酶和/或超活性Τη5轉(zhuǎn)座酶,但是將領(lǐng)會能以足夠的效率將轉(zhuǎn)座子末端插入5’ -標(biāo)簽并片段化靶DNA的任何轉(zhuǎn)座系統(tǒng)為了其意圖的目的可在本發(fā)明中使用。在特定的實施方案中,優(yōu)選的轉(zhuǎn)座系統(tǒng)能以隨機或幾乎隨機的方式將轉(zhuǎn)座子末端插入至5’ -標(biāo)簽并片段化靶DNA。
[0052]術(shù)語“轉(zhuǎn)座子末端”指僅展現(xiàn)核苷酸序列(“轉(zhuǎn)座子末端序列”)的雙鏈核酸DNA,所述核苷酸序列對于與在體外轉(zhuǎn)座反應(yīng)中是功能性的轉(zhuǎn)座酶或整合酶形成復(fù)合物是必要的。在一些實施方案中,轉(zhuǎn)座子末端能與轉(zhuǎn)座反應(yīng)中的轉(zhuǎn)座酶形成功能性的復(fù)合物。作為非限制性實例,轉(zhuǎn)座子末端可包括19-bp外末端(“0E”)轉(zhuǎn)座子末端、內(nèi)末端(“IE”)轉(zhuǎn)座子末端、或被野生型或突變Tn5轉(zhuǎn)座酶識別的“馬賽克(mosaic)末端”(“ME”)轉(zhuǎn)座子末端、或如在US 2010/0120098的公開內(nèi)容中描述的Rl和R2轉(zhuǎn)座子末端,其內(nèi)容通過引用將其全部并入本文。轉(zhuǎn)座子末端可包括適于在體外轉(zhuǎn)座反應(yīng)中與轉(zhuǎn)座酶或整合酶形成功能性復(fù)合物的核酸或核酸類似物。例如,轉(zhuǎn)座子末端可包括DNA、RNA、修飾堿基、非天然堿基、修飾的骨架,并且可在一條或兩條鏈中包含缺口。盡管術(shù)語“DNA”貫穿本公開內(nèi)容與轉(zhuǎn)座子末端的成分相連使用,但是應(yīng)理解任何合適的核酸或核酸類似物可在轉(zhuǎn)座子末端中被使用。
[0053]術(shù)語“轉(zhuǎn)移鏈(transferred strand) ”指兩個轉(zhuǎn)座子末端的轉(zhuǎn)移部分。相似地,術(shù)語“非轉(zhuǎn)移鏈(non-transferred strand) ”指兩個“轉(zhuǎn)座子末端”的非轉(zhuǎn)移部分。轉(zhuǎn)移鏈的3’ -末端在體外轉(zhuǎn)座反應(yīng)中被連接或轉(zhuǎn)移至革El DNA。