專利名稱:通過連接經(jīng)編碼的銜接子進(jìn)行測(cè)序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般地涉及測(cè)定多核苷酸的核苷酸序列的方法,更具體地涉及通過經(jīng)編碼的銜接子的特異性連接鑒定多核苷酸的末端核苷酸的方法。
背景幾乎所有被選擇用于科研和商業(yè)的DNA測(cè)序法都基于由Sanger開創(chuàng)的雙脫氧鏈終止法,如Sanger等,Proc.Natl.Acad.Sci.,745463-5467(1977)。已由幾個(gè)途徑入手改良了此方法,多種形式的此方法已被用于所有商用的DNA測(cè)序儀中,如Hunkapiller等,科學(xué),25459-67(1991)。
鏈終止法需要產(chǎn)生一套或多套經(jīng)標(biāo)記的DNA片段,每套片段具有相同的來源,以已知的堿基終止,然后必需通過大小分離一套或多套片段以得到序列資料。通常通過高分辨率的凝膠電泳來完成大小分離,所述凝膠電泳必需具有區(qū)分大小差異僅為1個(gè)核苷酸的很大的片段的能力。盡管已作了顯著改良,如使用毛細(xì)管陣列進(jìn)行分離和使用了非-凝膠電泳分離介質(zhì),但此技術(shù)仍不能使其自身小型化或大規(guī)模地平行實(shí)施。
已研究出的幾種所謂的“一個(gè)堿基一個(gè)堿基地”或“單個(gè)堿基地”測(cè)序方法可替代基于Sanger法的DNA測(cè)序法,如Cheeseman,美國專利5,302,509;Tsien等,國際申請(qǐng)WO91/06678;Rosenthal等,國際申請(qǐng)WO93/21340;Canard等,基因,1481-6(1994);和Metzker等,核酸研究,224259-4267(1994)。這些方法的特征在于每個(gè)化學(xué)或生物化學(xué)操作循環(huán)測(cè)定一個(gè)核苷酸,而不需要分離步驟,因此,如果它們能按預(yù)想的那樣完成,“一個(gè)堿基一個(gè)堿基地”測(cè)序法保證能對(duì)結(jié)合在微粒或固相陣列上的靶多核苷酸平行地進(jìn)行成千上萬次測(cè)序反應(yīng),如國際專利申請(qǐng)PCT/US95/12678(WO96/12039)。
不幸的是,“一個(gè)堿基一個(gè)堿基地”測(cè)序方案因存在很多問題而未得到廣泛應(yīng)用,所述問題如阻止在完整的測(cè)序操作中測(cè)定超過幾個(gè)核苷酸的任何核苷酸的無效化學(xué)。另外,在需要酶促操作的一個(gè)堿基一個(gè)堿基的測(cè)序法中隨著自動(dòng)化進(jìn)程所用的檢測(cè)設(shè)備會(huì)產(chǎn)生其它的問題。當(dāng)在具有高表面積/體積比率和狹窄的通道尺寸的反應(yīng)室中進(jìn)行一系列酶促步驟時(shí),酶可能會(huì)粘附在表面成分上,使得洗滌和相繼的處理步驟變得非常困難。蛋白質(zhì)的積累也會(huì)影響報(bào)道分子系統(tǒng),尤其是那些利用熒光標(biāo)記物的系統(tǒng),從而使基于這種系統(tǒng)的檢測(cè)結(jié)果的解釋變得困難和麻煩。這些困難和類似的困難顯著阻滯了“一個(gè)堿基一個(gè)堿基地”測(cè)序方案在平行測(cè)序努力中的應(yīng)用。
如果可以利用另一種使利用多種酶的重復(fù)處理循環(huán)最小化或消除的方法來檢測(cè)多核苷酸的末端核苷酸,一個(gè)堿基一個(gè)堿基地測(cè)序技術(shù)尤其在自動(dòng)化系統(tǒng)中會(huì)取得重要進(jìn)展。
發(fā)明概述因此,本發(fā)明的目的是提供不具有目前使用的一個(gè)堿基一個(gè)堿基的測(cè)序方法之缺點(diǎn)的DNA測(cè)序方案。
本發(fā)明的另一目的是提供能平行地或同時(shí)應(yīng)用于同一反應(yīng)管中存在的數(shù)以千計(jì)的DNA片段的DNA測(cè)序法。
本發(fā)明的另一目的是提供能允許用最少的酶促步驟鑒定靶多核苷酸之末端部分的DNA測(cè)序法。
本發(fā)明的另一目的是提供一套經(jīng)編碼的銜接子以鑒定一個(gè)或多個(gè)靶多核苷酸之多個(gè)末端核苷酸的序列。
本發(fā)明通過提供基于一套或更多套經(jīng)編碼的銜接子與靶多核苷酸的末端(或當(dāng)用于平行測(cè)序操作時(shí)為多個(gè)靶多核苷酸的末端)連接的核酸分析方法來達(dá)到這些和其它目的。每個(gè)經(jīng)編碼的銜接子含有突出的鏈和選自最少交叉雜交套寡核苷酸的寡核苷酸標(biāo)記物。連接經(jīng)編碼的銜接子,所述銜接子的突出鏈與靶多核苷酸之互補(bǔ)的突出鏈形成完全匹配的雙螺旋。連接后,通過使經(jīng)標(biāo)記的標(biāo)記物互補(bǔ)物與其在經(jīng)連接的銜接子上的相應(yīng)標(biāo)記物特異性雜交測(cè)定或“解碼”突出鏈中的核苷酸和排列次序。
例如,如果具有4個(gè)核苷酸,即5’-AGGT之突出鏈的經(jīng)編碼的銜接子與靶多核苷酸之互補(bǔ)的突出鏈形成完全匹配的雙螺旋,并且被連接的話,通過選自一套各針對(duì)突出鏈每一種可能的4個(gè)核苷酸序列的256個(gè)這種標(biāo)記物的獨(dú)特的寡核苷酸標(biāo)記物,可鑒定出多核苷酸上的4個(gè)互補(bǔ)的核苷酸3’-TCCA。在僅允許那些與經(jīng)連接的銜接子的寡核苷酸標(biāo)記物形成完全匹配的雙螺旋(或三螺旋)的標(biāo)記物互補(bǔ)物特異性雜交的條件下,將標(biāo)記物互補(bǔ)物用于經(jīng)連接的銜接子。標(biāo)記物互補(bǔ)物可以單獨(dú)使用,或作為一個(gè)或多個(gè)混合物使用,以測(cè)定寡核苷酸標(biāo)記物,從而測(cè)定突出鏈的序列。
下文將更詳細(xì)地解釋,在序列分析中可將經(jīng)編碼的銜接子(i)如Brenner美國專利5,599,675和PCT公布號(hào)WO95/27080所述,作為涉及連接,鑒定和裂解之重復(fù)循環(huán)的處理步驟來鑒定一個(gè)或多個(gè)核苷酸,或(ii)作為“獨(dú)立(stand alone)”的鑒定法,其中將多套經(jīng)編碼的銜接子應(yīng)用于靶多核苷酸以使每套能鑒定靶多核苷酸不同部分的核苷酸序列;即在后一實(shí)施方案中,對(duì)每套銜接子單次連接,隨后進(jìn)行鑒定即可進(jìn)行序列分析。
經(jīng)編碼的銜接子的重要特征是使用了寡核苷酸標(biāo)記物,所述標(biāo)記物是最少交叉雜交套寡核苷酸的成員,例見國際專利申請(qǐng)PCT/US95/12791(WO96/12041)和PCT/US96/09513(WO96/41011)。此套寡核苷酸的序列與相同套的其它每個(gè)成員的序列至少有2個(gè)核苷酸的差異,因此,此套的每個(gè)成員不能與其它任何成員具有少于2個(gè)錯(cuò)配的互補(bǔ)物形成雙螺旋(或三螺旋)。優(yōu)選最少交叉雜交套的每個(gè)成員與其它每個(gè)成員有與特殊應(yīng)用所需套的大小一致的盡可能多的核苷酸有所不同。例如,當(dāng)使用較長(zhǎng)的寡核苷酸標(biāo)記物,如12-至20-聚體以將標(biāo)記物給予經(jīng)編碼的銜接子時(shí),則優(yōu)選最少交叉雜交套的成員之間的差異顯著大于2。優(yōu)選此套的每個(gè)成員與其它每個(gè)成員至少有4個(gè)核苷酸的差異,更優(yōu)選此套的每個(gè)成員與其它每個(gè)成員至少有6個(gè)核苷酸的差異。本文將本發(fā)明的寡核苷酸標(biāo)記物的互補(bǔ)物稱為“標(biāo)記物互補(bǔ)物”。
寡核苷酸標(biāo)記物可以是單鏈,并被設(shè)計(jì)成可通過雙螺旋的形成與單鏈的標(biāo)記物互補(bǔ)物特異性雜交。寡核苷酸標(biāo)記物可以是雙鏈,并被設(shè)計(jì)成可通過三螺旋的形成與單鏈的標(biāo)記物互補(bǔ)物特異性雜交。優(yōu)選經(jīng)編碼的銜接子的寡核苷酸標(biāo)記物是雙鏈,它們的標(biāo)記物互補(bǔ)物是單鏈,以通過三螺旋結(jié)構(gòu)的形成使標(biāo)記物與其互補(bǔ)物發(fā)生特異性雜交。
優(yōu)選本發(fā)明的方法包括下列步驟(a)將經(jīng)編碼的銜接子與多核苷酸的末端連接,所述銜接子具有選自最少交叉雜交套寡核苷酸的寡核苷酸標(biāo)記物和與多核苷酸突出鏈互補(bǔ)的突出鏈;和(b)通過將標(biāo)記物互補(bǔ)物與經(jīng)編碼的銜接子的寡核苷酸標(biāo)記物特異性雜交來鑒定多核苷酸突出鏈中的一個(gè)或多個(gè)核苷酸。
附圖簡(jiǎn)述
圖1A-1E圖示闡明使用經(jīng)編碼的銜接子測(cè)定多個(gè)經(jīng)標(biāo)記的多核苷酸的末端核苷酸序列。
圖2闡明了錨定于固相支持物上的完全相同的多核苷酸的自身連接現(xiàn)象。
圖3A闡明了本發(fā)明優(yōu)選方法中的步驟,所述方法中具有封閉的3’碳的雙鏈銜接子與靶多核苷酸連接。
圖3B闡明了在經(jīng)由連接和裂解分段循環(huán)進(jìn)行DNA測(cè)序的方法中優(yōu)選實(shí)施方案的使用。
圖4闡明了使用本發(fā)明的方法測(cè)定受試多核苷酸之末端核苷酸的資料。
圖5圖解描述了流動(dòng)室和用于觀察荷載有待測(cè)序cDNA分子的平面排列的微粒的檢測(cè)裝置。
定義本文所用術(shù)語“經(jīng)編碼的銜接子”與優(yōu)先權(quán)文本美國專利申請(qǐng)流水號(hào)08/689,587中的術(shù)語“經(jīng)編碼的探針”是同義詞。
本文所用術(shù)語“連接”是指一個(gè)或多個(gè)(通常為2個(gè))寡核苷酸的末端之間共價(jià)鍵的形成。此術(shù)語通常指的是因下列反應(yīng)導(dǎo)致的磷酸二酯鍵的形成寡1(5’)-OP(O-)(=O)O+HO-(3’)寡2-5’→寡1(5’)-OP(O-)(=O)O-(3’)寡2-5’所述反應(yīng)通常由連接酶催化,其中寡1和寡2是兩個(gè)不同的寡核苷酸或是相同寡核苷酸的不同末端。此術(shù)語包含寡核苷酸末端之間磷酸二酯鍵的非酶促形成以及非磷酸二酯共價(jià)鍵,如硫代磷酸酯鍵,二硫鍵等的形成。連接反應(yīng)通常是模板驅(qū)動(dòng)的,其中寡1和寡2的末端通過與模板鏈的特異性雜交而成為并列狀態(tài)。模板驅(qū)動(dòng)連接的特殊例子是具有互補(bǔ)突出鏈的兩個(gè)雙鏈寡核苷酸的連接。
本文有關(guān)寡核苷酸標(biāo)記物所用的“互補(bǔ)物”或“標(biāo)記物互補(bǔ)物”指的是寡核苷酸標(biāo)記物與之特異性雜交以形成完全匹配的雙螺旋或三螺旋的寡核苷酸。在特異性雜交產(chǎn)生三螺旋的實(shí)施方案中,寡核苷酸標(biāo)記物可被選擇為雙鏈或單鏈,因此,當(dāng)形成三螺旋時(shí),術(shù)語“互補(bǔ)物”意味著包含單鏈寡核苷酸標(biāo)記物的雙鏈互補(bǔ)物或雙鏈寡核苷酸標(biāo)記物的單鏈互補(bǔ)物。
本文所用的術(shù)語“寡核苷酸”包括能利用規(guī)則模式的單體與單體間的相互作用,如Watson-Crick型堿基配對(duì),堿基堆積,Hoogsteen或反向Hoogsteen型堿基配對(duì)等與靶多核苷酸特異性結(jié)合的天然或經(jīng)修飾的單體或連鍵的線性寡聚體,如脫氧核糖核苷,核糖核苷,其端基異構(gòu)形式,肽核酸(PNA)等。通常通過磷酸二酯鍵或其類似物連接單體以形成大小范圍為幾個(gè),如3-4個(gè)單體單位至幾十個(gè),如40-60個(gè)單體單位的寡核苷酸。每當(dāng)寡核苷酸由字母順序,如“ATGCCTG”表示時(shí),應(yīng)理解除非另有說明,核苷酸從左至右為5’→3’次序,“A”表示脫氧腺苷,“C”表示脫氧胞苷,“G”表示脫氧鳥苷,而“T”表示胸苷。本發(fā)明的寡核苷酸通常含有4個(gè)天然的核苷酸;然而,它們也可含有非天然的核苷酸類似物。本領(lǐng)域技術(shù)人員清楚地知道當(dāng)使用具有天然或非天然核苷酸的寡核苷酸時(shí),如當(dāng)需要由酶進(jìn)行處理時(shí),通常需要由天然核苷酸組成的寡核苷酸。
與雙螺旋有關(guān)的“完全匹配”指的是組成雙螺旋的多-或寡核苷酸鏈與另一個(gè)鏈形成雙鏈結(jié)構(gòu),以使每條鏈的每一個(gè)核苷酸與另一條鏈的核苷酸進(jìn)行Watson-Crick堿基配對(duì)。此術(shù)語也包括可能會(huì)使用的核苷酸類似物的配對(duì),所述類似物如脫氧肌苷,具有2-氨基嘌呤堿基的核苷等。與三螺旋有關(guān)的“完全匹配”指的是三螺旋由完全匹配的雙螺旋和第三條鏈構(gòu)成,其中第三條鏈中的每一個(gè)核苷酸與完全匹配的雙螺旋的堿基對(duì)進(jìn)行Hoogsteen或反向Hoogsteen連接。與之相反,標(biāo)記物和寡核苷酸之間雙螺旋中的“錯(cuò)配”指的是雙螺旋或三螺旋中的核苷酸對(duì)或三聯(lián)體無法進(jìn)行Watson-Crick和/或Hoogsteen和/或反向Hoogsteen鍵合。
本文所用的“核苷”包括2’-脫氧和2’-羥基形式的天然核苷,例見Kornberg和Baker,DNA復(fù)制,第2版(Freeman,San Francisco,1992)。與核苷有關(guān)的“類似物”包括例如Scheit,核苷酸類似物(JohnWiley,紐約,1980);Uhlman和Peyman,化學(xué)評(píng)論,90543-584(1990)所述的具有經(jīng)修飾的堿基組成成分和/或經(jīng)修飾的糖組成成分的合成核苷等,僅有的先決條件是它們能特異性雜交。這種類似物包括經(jīng)設(shè)計(jì)增強(qiáng)了結(jié)合特性,降低了復(fù)雜度,增加了特異性的合成核苷等。
本文所用的與多核苷酸有關(guān)的“序列測(cè)定”或“測(cè)定核苷酸序列”包括測(cè)定多核苷酸的部分以及完整的序列資料,即此術(shù)語包括靶多核苷酸的序列比較,指紋分析和類似水平的資料,以及靶多核苷酸中核苷,通常為每個(gè)核苷的快速鑒定和排序。此術(shù)語也包括靶多核苷酸內(nèi)4種類型核苷酸中1,2,或3種的鑒定,排序和定位的確定。例如,在一些實(shí)施方案中,通過鑒定靶多核苷酸“CATCGC…”內(nèi)的單一類型的核苷酸,如胞嘧啶的排序和定位,以使其序列被表示為二進(jìn)制的密碼子,如“C-(非C)-(非C)-C-(非C)-C”被表示為“100101”等即可實(shí)現(xiàn)序列測(cè)定。
本文所用的有關(guān)多核苷酸群體的術(shù)語“復(fù)雜度”指的是群體中存在的不同類分子的數(shù)目。
發(fā)明詳述本發(fā)明涉及與一個(gè)或多個(gè)靶多核苷酸之末端特異性雜交的經(jīng)編碼的銜接子的連接。通過“解碼”如此連接的經(jīng)編碼的銜接子的寡核苷酸標(biāo)記物可得到發(fā)生特異性雜交之區(qū)域的有關(guān)序列資料。在本發(fā)明的一個(gè)方面,在交錯(cuò)切割點(diǎn)將多套經(jīng)編碼的銜接子與靶多核苷酸連接,以使經(jīng)編碼的銜接子提供靶多核苷酸多個(gè)部分中每一個(gè)的序列資料。上述部分可以是非連接的,重疊的或鄰接的;然而,優(yōu)選所述部分是鄰接的,它們共同允許鑒定等于各個(gè)部分長(zhǎng)度總和的核苷酸序列。在此方面,僅需單次連接經(jīng)編碼的銜接子,接著可通過“解碼”經(jīng)連接的銜接子的標(biāo)記物來鑒定。在本發(fā)明的另一方面,經(jīng)編碼的銜接子被用作包括連接,鑒定和裂解之重復(fù)循環(huán)的方法中的鑒定步驟,有關(guān)內(nèi)容將在下文中更詳細(xì)地描述。
在后一種實(shí)施方案中,本發(fā)明利用了核酸酶,所述核酸酶的識(shí)別位點(diǎn)與其裂解位點(diǎn)是分開的。優(yōu)選這種核酸酶是II型限制性內(nèi)切核酸酶。使用核酸酶在與經(jīng)編碼的銜接子連接的靶多核苷酸上產(chǎn)生突出鏈。在本發(fā)明給定實(shí)施方案中得到的序列資料的量部分取決于使用了多少這種核酸酶,和通過裂解產(chǎn)生的突出鏈的長(zhǎng)度。
本發(fā)明的重要方面是平行測(cè)定很多靶多核苷酸之序列的能力,在此方面,本發(fā)明的方法包括下列步驟(a)將得自標(biāo)記物所有組成成分的第一多核苷酸標(biāo)記物與多核苷酸群體中的每個(gè)多核苷酸結(jié)合,以使得自所有組成成分的每個(gè)第一寡核苷酸標(biāo)記物選自第一最少交叉雜交套;(b)對(duì)多核苷酸群體進(jìn)行取樣,以使所述群體中基本上所有不同的多核苷酸都結(jié)合有不同的第一寡核苷酸標(biāo)記物;(c)將一個(gè)或多個(gè)經(jīng)編碼的銜接子與所述群體中每個(gè)多核苷酸的末端連接,每個(gè)經(jīng)編碼的銜接子具有選自第二最少交叉雜交套的第二寡核苷酸標(biāo)記物,和與所述群體中多核苷酸突出鏈互補(bǔ)的突出鏈;(d)通過將第一寡核苷酸標(biāo)記物與其各自的互補(bǔ)物特異性雜交,以分選所述群體中的多核苷酸,各自的互補(bǔ)物作為基本上相同的寡核苷酸的均一群體結(jié)合于一個(gè)或多個(gè)固相支持物上的空間上不連續(xù)的區(qū)域內(nèi);和(e)通過使標(biāo)記物互補(bǔ)物與一個(gè)或多個(gè)經(jīng)編碼的銜接子的每個(gè)第二寡核苷酸標(biāo)記物特異性雜交,以鑒定所述多核苷酸突出鏈中的一個(gè)或多個(gè)核苷酸。在此實(shí)施方案中,可在多核苷酸已被第一寡核苷酸標(biāo)記物分選至固相支持物上之前或之后,將一個(gè)或多個(gè)經(jīng)編碼的銜接子與多核苷酸的末端連接。在優(yōu)選的實(shí)施方案中,經(jīng)編碼的銜接子包括II型限制性內(nèi)切核酸酶位點(diǎn),所述位點(diǎn)可使經(jīng)編碼的銜接子從多核苷酸上裂解下來,而經(jīng)序列鑒定之后多核苷酸可被縮短。
根據(jù)優(yōu)選的實(shí)施方案,此方法進(jìn)一步包括連接,鑒定和裂解之重復(fù)循環(huán),以使每個(gè)循環(huán)中可鑒定一個(gè)或多個(gè)核苷酸。優(yōu)選每個(gè)循環(huán)中可鑒定2至6個(gè)核苷酸,并確定它們的次序。
不經(jīng)連接和裂解循環(huán)的序列分析圖1A至1E的實(shí)施方案闡明了本發(fā)明不經(jīng)連接和裂解循環(huán)的序列分析。在此實(shí)施方案中,按下述制備k靶多核苷酸,也見Brenner,國際專利申請(qǐng)PCT/US95/12791(WO96/12041)和PCT/US96/09513(WO96/41011)。即樣品取自與以小“t’s”標(biāo)示的寡核苷酸標(biāo)記物綴合的多核苷酸群體,這些標(biāo)記物有時(shí)指的是分選用的寡核苷酸標(biāo)記物,或“第一”寡核苷酸標(biāo)記物。通過例如聚合酶鏈反應(yīng)(PCR)或克隆擴(kuò)增樣品的標(biāo)記物-多核苷酸綴合物給出圖1A(14)-(18)所示的1至k綴合物群體。優(yōu)選制備與(小“t”)標(biāo)記物相反的綴合物末端以連接一個(gè)或多個(gè)銜接子,每個(gè)這種銜接子都含有核酸酶的識(shí)別位點(diǎn),所述核酸酶的裂解位點(diǎn)與其識(shí)別位點(diǎn)是分開的。在被舉例的實(shí)施方案中,使用了3個(gè)這種銜接子,本文稱之為“裂解銜接子”。所用這種銜接子的數(shù)目取決于幾個(gè)因素,包括所需序列資料的量,具有適當(dāng)作用范圍和裂解特征的II型核酸酶的可得性等等。優(yōu)選使用1至3個(gè)裂解銜接子,銜接子被設(shè)計(jì)成可容納不同的II型核酸酶,所述核酸酶裂解后能產(chǎn)生至少為4個(gè)核苷酸的突出鏈。
如果本發(fā)明的方法被用于cDNA群體的特征測(cè)序,則在連接裂解銜接子之前,可用具有高頻識(shí)別位點(diǎn)的限制性內(nèi)切核酸酶裂解標(biāo)記物-多核苷酸綴合物,所述酶如TaqI,AluI,HinP1I,DpnII,NlaIII等。對(duì)于留下鈍端的酶,如AluI而言,可用T4 DNA聚合酶產(chǎn)生交錯(cuò)切口的末端,例見上述Brenner的國際專利申請(qǐng)PCT/US95/12791和Kuijper等,基因,112147-155(1992)。如果通過用TaqI裂解制備靶多核苷酸,則可使用下列末端來連接cgannnn…-3’tnnnn…-5’因此,可按下述構(gòu)建一例3個(gè)裂解銜接子套(1)NN...NGAAGA cgannnnnnnnnnnnnnnnnnn...-3’NN...NCTTCTGCp t
nnnnnnnnnnnnnnn...-5’(2)NN...NGCAGCA cgannnnnnnnnnnnnnnnnnn...-3’NN...NCGTCGTGCp tnnnn
nnnnnnnnnnn...-5’(3)NN...NGGGA cgannnnnnnnnnnnnnnnnnn...-3’NN...NCCCTGCp tnnnnnnnn
nnnnnnn....-5’其中裂解銜接子(1),(2)和(3)以大寫字母表示,其各自的核酸酶BbsI,BbvI和BsmFI的識(shí)別位點(diǎn)以下劃線表示,5’磷酸以“p”表示。靶多核苷酸的雙劃線部分表示連接和裂解之后突出鏈的位置。在所有情況下,靶多核苷酸只留下4個(gè)核苷酸的5’突出鏈,顯然,使用不同數(shù)目和種類的核酸酶可構(gòu)建很多不同的實(shí)施方案。如Brenner,美國專利5,599,675和WO95/27080中所討論的,優(yōu)選在裂解之前,通過例如甲基化封閉內(nèi)部的BbsI,BbvI和BsmFI位點(diǎn)以防止靶多核苷酸內(nèi)部位點(diǎn)處不必要的裂解。
再回到舉例用的上述實(shí)施方案,裂解銜接子A1,A2和A3以1∶1∶1的濃度比例與k個(gè)靶多核苷酸連接(20),給出圖1B所示的綴合物,以使每個(gè)標(biāo)記物-多核苷酸綴合物群體內(nèi)有大致相等數(shù)目的結(jié)合有A1,A2和A3的綴合物。連接(20)之后,用每個(gè)裂解銜接子的核酸酶相繼裂解靶多核苷酸并與一套經(jīng)編碼的銜接子連接。首先,用裂解銜接子A1的核酸酶裂解(22)靶多核苷酸,然后,將第一套經(jīng)編碼的銜接子與所得的突出鏈連接。裂解導(dǎo)致約1/3各種類型的靶多核苷酸,即t1,t2,…tk可用于連接。優(yōu)選經(jīng)編碼的銜接子可作為一種或多種銜接子的混合物被使用,所述混合物合在一起含有突出鏈每一種可能的序列。選擇反應(yīng)條件以僅連接其突出鏈與靶多核苷酸的突出鏈形成完全匹配的雙螺旋的經(jīng)編碼的銜接子,從而形成經(jīng)編碼的綴合物(28),(30),和(32)(圖1C)。具有下標(biāo)的大寫字母“T’s”表示經(jīng)編碼的銜接子攜有獨(dú)一無二的寡核苷酸標(biāo)記物以用于標(biāo)記。經(jīng)編碼的銜接子攜有的寡核苷酸標(biāo)記物有時(shí)指將標(biāo)記物傳遞給經(jīng)編碼的銜接子的標(biāo)記物,或“第二”寡核苷酸標(biāo)記物。下文將要更詳細(xì)地討論的是,用于分選的單鏈寡核苷酸標(biāo)記物優(yōu)選僅由4種核苷酸中的3種組成,以使如Kuijper等人(見上文)所述的T4 DNA聚合酶“刪除”反應(yīng)可被用于制備靶多核苷酸以荷載于固相支持物上。另一方面,用于傳遞標(biāo)記物的寡核苷酸標(biāo)記物可由所有4種核苷酸組成。
如上所述,經(jīng)編碼的銜接子含有突出鏈(24)和寡核苷酸標(biāo)記物(26),因此,如果t1-多核苷酸綴合物的“A1”裂解產(chǎn)生下列末端5’-…nnnnnnnnn3’-…nnnnnnnnnacct那么寡核苷酸標(biāo)記物T24可具有下列結(jié)構(gòu)(SEQ ID NO1)tggattctagagagagagagagagagag-3’aagatctctctctctctctctctc其中雙鏈部分可以是一套48個(gè)(=12個(gè)核苷酸位置×4種核苷酸)雙鏈20-聚體寡核苷酸標(biāo)記物中的1個(gè),所述標(biāo)記物可與獨(dú)一無二的標(biāo)記物互補(bǔ)物形成完全匹配的三螺旋并與所有其它標(biāo)記物互補(bǔ)物形成具有至少6個(gè)錯(cuò)配的三螺旋。在此例子中,經(jīng)編碼的銜接子可與總數(shù)為768(3×256)的一種或多種混合物中的靶多核苷酸連接。經(jīng)編碼的銜接子也可任選含有上文例子中所示的間隔區(qū),其中4個(gè)核苷酸的序列“ttct”用作突出鏈和寡核苷酸標(biāo)記物之間的間隔。
連接第一套經(jīng)編碼的銜接子(28),(30)和(32)之后,用裂解銜接子A2的核酸酶裂解(34)標(biāo)記物-多核苷酸綴合物,然后,使用第二套經(jīng)編碼的銜接子以形成綴合物(36),(38)和(40)(圖1D),最后,用裂解銜接子A3的核酸酶裂解(42)標(biāo)記物-多核苷酸綴合物,然后,使用第三套經(jīng)編碼的銜接子以形成綴合物(44),(46)和(48)(圖1E),完成了經(jīng)編碼的銜接子的相繼裂解和連接之后,經(jīng)由下文將詳細(xì)描述的,也例見Brenner,PCT/US95/12791或PCT/US96/09513中所述的寡核苷酸標(biāo)記物t1-tk將混合物荷載(50)于一個(gè)或多個(gè)固相支持物上。如果分析的是單個(gè)靶多核苷酸,顯然不需要多個(gè)寡核苷酸標(biāo)記物t1,t2,…tk。在這種實(shí)施方案中,由于不需要分選,可將生物素或類似的組成成分用于錨定多核苷酸-經(jīng)編碼的銜接子綴合物。裂解,連接和荷載于固相支持物之步驟的次序取決于所實(shí)施的具體方案。例如,可首先將標(biāo)記物-多核苷酸綴合物荷載于固相支持物,接著連接裂解銜接子,裂解之,連接經(jīng)編碼的銜接子;或首先連接裂解銜接子,接著荷載,裂解,連接經(jīng)編碼的銜接子;等等。
經(jīng)編碼的銜接子與本發(fā)明靶多核苷酸的末端連接之后,通過在允許經(jīng)編碼的銜接子的寡核苷酸標(biāo)記物及其各自的標(biāo)記物互補(bǔ)物之間形成完全匹配的雙螺旋和/或三螺旋的條件下,將經(jīng)標(biāo)記的標(biāo)記物互補(bǔ)物或單獨(dú)或作為混合物相繼用于固定的靶多核苷酸,即可得到序列資料?;旌衔锏臄?shù)目和復(fù)雜度取決于幾個(gè)因素,包括所用標(biāo)記系統(tǒng)的類型,其序列需被鑒定之部分的長(zhǎng)度,是否使用了復(fù)雜度有所降低的類似物等等。對(duì)于圖1a至1e所示的實(shí)施方案而言,優(yōu)選使用單個(gè)熒光染料標(biāo)記48(=3×16)個(gè)標(biāo)記物互補(bǔ)物中的每一個(gè)。單獨(dú)將標(biāo)記物互補(bǔ)物用于鑒定靶多核苷酸4個(gè)核苷酸部分每一個(gè)的核苷酸(即總數(shù)為48個(gè)核苷酸的12個(gè)位置的每一個(gè)的4個(gè)標(biāo)記物互補(bǔ)物)。顯然,不同長(zhǎng)度的部分可能需要不同數(shù)目的標(biāo)記物互補(bǔ)物,如根據(jù)此實(shí)施方案,5-核苷酸部分可能需要20個(gè)標(biāo)記物互補(bǔ)物,2-核苷酸部分可能需要8個(gè)標(biāo)記物互補(bǔ)物等等。在足夠嚴(yán)緊以致于僅形成完全匹配的雙螺旋的條件下使用標(biāo)記物互補(bǔ)物,測(cè)定得自特異性雜交的標(biāo)記物互補(bǔ)物上的熒光標(biāo)記物的信號(hào),從經(jīng)編碼的標(biāo)記物上洗下標(biāo)記物互補(bǔ)物以使下一個(gè)混合物可以被使用。16個(gè)標(biāo)記物互補(bǔ)物與靶序列的4-聚體部分的下列序列具有一一對(duì)應(yīng)的關(guān)系A(chǔ)NNN NANN NNANNNNACNNN NCNN NNCNNNNCGNNN NGNN NNGNNNNGTNNN NTNN NNTN NNNT其中“N”是核苷酸,A,C,G或T中的任一種,因此,針對(duì)每個(gè)核苷酸位置,每種核苷酸都有可能。此實(shí)施方案中體現(xiàn)出顯著水平的豐余部分(總共使用16個(gè)標(biāo)記物互補(bǔ)物以鑒定4個(gè)核苷酸)以換取核苷酸測(cè)定可靠性的增加。
通過使用4種光譜有區(qū)別的熒光染料可連續(xù)使用4種標(biāo)記物互補(bǔ)物之12種混合物中的每一種,以使染料和核苷酸類型之間有一一對(duì)應(yīng)的關(guān)系。例如,4種標(biāo)記物互補(bǔ)物的混合物可鑒定突出鏈序列“nnxn”中的核苷酸“x”以使如果x=A,可觀察到第一種熒光標(biāo)記物,如果x=C,可觀察到第二種熒光標(biāo)記物,如果x=G,可觀察到第三種熒光標(biāo)記物等等。
在類似于Brenner,國際專利申請(qǐng)PCT/US95/03678(WO95/27080)公開的“多次分段”法的方法中使用上述實(shí)施方案可得到其它的序列資料。在此實(shí)施方案中,本文稱之為“分段銜接子”的第四個(gè)銜接子與裂解銜接子A1,A2和A3一起以例如3∶1∶1∶1的濃度比例與靶多核苷酸的末端連接,因此,大約有一半可利用的末端與分段銜接子連接。分段銜接子包括位于其中的II型核酸酶的識(shí)別位點(diǎn),以使其作用范圍(下文中限定)允許裂解經(jīng)由裂解銜接子A1,A2和A3測(cè)定的序列末端的靶多核苷酸。可與上述套裂解銜接子一起使用的分段銜接子的例子如下所述NN...NCTGGAGA cgannnnnnnnnnnnnnnnnnn...-3’NN...NGACCTCTGCp tnnnnnnnnnnnn
nnnnn...-5’其中,如上所述,核酸酶(此時(shí)為BpMI)的識(shí)別位點(diǎn)為單劃線,裂解位點(diǎn)的核苷酸為雙劃線。被分段銜接子的核酸酶裂解的靶多核苷酸可與另一套裂解銜接子A4,A5和A6連接,所述裂解銜接子可含有與裂解銜接子A1,A2和A3所含相同或不同的核酸酶識(shí)別位點(diǎn)。是否需要擴(kuò)大套的經(jīng)編碼的銜接子取決于信號(hào)測(cè)定裝置中是否能忍受裂解和連接反應(yīng)。如果如上所述需要使與信號(hào)測(cè)定相關(guān)聯(lián)的酶反應(yīng)最小化,則必須使用多余套的經(jīng)編碼的銜接子。即當(dāng)需要超過768個(gè)寡核苷酸標(biāo)記物和標(biāo)記物互補(bǔ)物,6個(gè)裂解反應(yīng)產(chǎn)生各為4個(gè)核苷酸的突出鏈時(shí),會(huì)需要1536個(gè)寡核苷酸標(biāo)記物和標(biāo)記物互補(bǔ)物(64個(gè)標(biāo)記物互補(bǔ)物各24種混合物)。例舉的裂解銜接子A4,A5和A6,具有與A1,A2和A3相同的核酸酶識(shí)別位點(diǎn),可與上述分段銜接子一起使用,具體如下(4)NN...NGAAGACNN nnnnnnnnnnnnnnnnnn...-3’NN...NCTTCTGp nn
nnnnnnnnnnnnnn...-5’(5)NN...NGCAGCACNN nnnnnnnnnnnnnnnnnn...-3’NN...NCGTCGTGp nnnnnn
nnnnnnnnnn...-5’(6)NN...NGGGACNN nnnnnnnnnnnnnnnnnn...-3’NN...NCCCTGp nnnnnnnnnn
nnnnnn...-5’其中裂解位點(diǎn)以雙劃線表示,優(yōu)選裂解銜接子A4,A5和A6以混合物的形式被使用,以體現(xiàn)出每一種可能的2-核苷酸突出鏈。
一旦經(jīng)編碼的銜接子已被連接,即可制備靶多核苷酸以荷載于固相支持物,優(yōu)選荷載于微粒,例見Brenner,國際專利由請(qǐng)PCT/US95/12791(WO96/12041)。簡(jiǎn)單地說,用T4 DNA聚合酶進(jìn)行“刪除”反應(yīng)可使用于分選的寡核苷酸標(biāo)記物變成單鏈,例見Kuijper等(見上文)。在微粒上使單鏈寡核苷酸標(biāo)記物與其標(biāo)記物互補(bǔ)物特異性雜交并連接,然后如Brenner(見上文)所述在儀器中分析被荷載的微粒,所述儀器允許依次傳遞,特異性雜交和將經(jīng)標(biāo)記的標(biāo)記物互補(bǔ)物轉(zhuǎn)移給經(jīng)編碼的銜接子。
在經(jīng)編碼的銜接子僅與靶多核苷酸(或靶多核苷酸群體)連接1次的實(shí)施方案中,根據(jù)本發(fā)明可使用幾種非酶促的模板-驅(qū)動(dòng)的連接方法。這種連接方法包括但不限于Shabarova,Biochimie 701323-1334(1988);Dolinnaya等,核酸研究,163721-3738(1988);Letsinger等,美國專利5,476,930;Gryaznov等,核酸研究,222366-2369(1994);Kang等,核酸研究,232344-2345(1995);Gryaznov等,核酸研究,211403-1408(1993);Gryaznov,美國專利5,571,677等文獻(xiàn)所述。優(yōu)選通過Letsinger等人(見上文)的方法進(jìn)行非酶促的連接。在此方法中,具有3’-溴乙?;┒说慕?jīng)編碼的銜接子與在5’末端具有互補(bǔ)的突出鏈和硫代磷酸基團(tuán)的多核苷酸反應(yīng)。例舉的利用這種化學(xué)的經(jīng)編碼的銜接子具有下列結(jié)構(gòu)BrCH2(=O)CNH-(B)r(B)s(B)q(B)t-3’3’-zB’B’B’B’B’(B)r(B’)s(B’)q-5’其中B和B’是核苷酸及其互補(bǔ)物,z,r,s,q和t如下所述,Br,C,H和N具有其平常的化學(xué)含義。如上文參考文獻(xiàn)所解釋,在模板-驅(qū)動(dòng)的反應(yīng)中,3’-溴乙?;墓押塑账嵩诤畻l件下自發(fā)地與具有5’-硫代磷酸基團(tuán)的寡核苷酸反應(yīng)以形成硫代磷酸乙酰氨基連鍵。按Kang等人(見上文)所述,通過在腺苷-5’-O-(1-硫代三磷酸),即g-S-ATP存在時(shí)用T4激酶處理可使硫代磷酸基團(tuán)易于與靶多核苷酸的5’羥基結(jié)合。
經(jīng)連接和裂解循環(huán)進(jìn)行序列分析經(jīng)編碼的銜接子可用于基于銜接子的DNA測(cè)序法,所述測(cè)序法包括連接,鑒定和裂解的重復(fù)循環(huán),如Brenner,美國專利5,599,675和PCT
發(fā)明者G·阿爾布雷克特, S·布倫納, D·H·勞埃德, R·B·杜布里奇, M·C·帕拉斯 申請(qǐng)人:林克斯治療公司