專利名稱:使用固定的引物直接捕獲、擴(kuò)增及測(cè)序靶標(biāo)dna的制作方法
使用固定的引物直接捕獲、擴(kuò)增及測(cè)序靶標(biāo)DNA交叉引用本專利申請(qǐng)要求2010年9月24日提交的美國(guó)臨時(shí)專利申請(qǐng)序列號(hào)61/386,390以及2011年5月11日提交的美國(guó)臨時(shí)專利申請(qǐng)序列號(hào)61/485,062的優(yōu)先權(quán),這兩份專利全文并入本文中。政府權(quán)利本發(fā)明根據(jù)國(guó)立衛(wèi)生研究院授予的第HG000205號(hào)合同在政府支持下完成。政府享有本發(fā)明的某些權(quán)利。背景在許多測(cè)序方法中,尤其是重測(cè)序方法(S卩,其中對(duì)基因座進(jìn)行重測(cè)序的方法)中,首先捕獲靶標(biāo),然后進(jìn)行測(cè)序。多種靶標(biāo)捕獲方法已由人們開發(fā)并與高通量測(cè)序系統(tǒng)集成。具體地講,使用珠粒或微陣列的基于雜交的測(cè)定法以及使用分子倒置探針或基因組環(huán)化寡核苷酸的基于溶液中的技術(shù)可應(yīng)用于捕獲靶標(biāo)DNA。然后制備經(jīng)捕獲的DNA用于測(cè)序。通常采用復(fù)雜的分子生物學(xué)方案來(lái)制備富集的DNA樣品,并且在某些情況下,測(cè)序文庫(kù)的產(chǎn)生涉及許多酶促反應(yīng)、純化步驟以及通過(guò)凝膠電泳進(jìn)行的大小選擇。用于靶標(biāo)捕獲DNA測(cè)序的樣品制備過(guò)程可能是勞動(dòng)密集型的,而后續(xù)樣品操作會(huì)導(dǎo)致DNA含量的偏差并增加測(cè)序錯(cuò)誤率。發(fā)明概述本文提供用于捕獲和擴(kuò)增核酸片段例如由RNA制備的基因組片段或cDNA的方法。還提供了用于實(shí)踐該方法的試劑盒。在某些實(shí)施方案中,該方法包括:a)獲得包含第一群表面結(jié)合寡核苷酸和第二群表面結(jié)合寡核苷酸的基底,其中第一和第二群表面結(jié)合寡核苷酸的成員不在基底上空間尋址 ;b)將第一群表面結(jié)合寡核苷酸的第一成員雜交到篩選寡核苷酸,該篩選寡核苷酸包含與第一成員雜交的區(qū)域以及包含基因組序列的區(qū)域;c)延伸第一群表面結(jié)合寡核苷酸的第一成員以產(chǎn)生載體結(jié)合篩選引物,該載體結(jié)合篩選引物包含與基因組序列互補(bǔ)的序列;d)將載體結(jié)合篩選引物雜交到包含基因組序列的核酸片段(如基因組片段或cDNA) ;e)延伸載體結(jié)合篩選引物以產(chǎn)生包含例如在基因組中位于基因組序列側(cè)翼的序列的延伸產(chǎn)物;f)在基底上擴(kuò)增延伸產(chǎn)物,例如通過(guò)使用第一和第二群表面結(jié)合寡核苷酸的未延伸成員的橋式PCR,以產(chǎn)生PCR產(chǎn)物。在某些實(shí)施方案中,該方法包括:a)獲得包含第一群表面結(jié)合寡核苷酸和第二群表面結(jié)合寡核苷酸的基底,其中第一和第二群表面結(jié)合寡核苷酸不在基底上空間尋址;b)將第一群表面結(jié)合寡核苷酸的第一成員雜交到篩選寡核苷酸,該篩選寡核苷酸包含與第一成員雜交的區(qū)域以及包含基因組序列的區(qū)域;c)延伸第一群表面結(jié)合寡核苷酸的第一成員以產(chǎn)生載體結(jié)合篩選引物,該載體結(jié)合篩選引物包含與基因組序列互補(bǔ)的序列;d)將載體結(jié)合篩選引物雜交到包含基因組序列的核酸片段;e)延伸載體結(jié)合篩選引物以產(chǎn)生包含例如在基因組中位于基因組序列側(cè)翼的序列的延伸產(chǎn)物;以及f)在基底上擴(kuò)增延伸產(chǎn)物,例如使用橋式PCR,以產(chǎn)生PCR產(chǎn)物。取決于如何實(shí)施方法,可將銜接子在雜交前連接到基因組片段,或在延伸載體結(jié)合篩選引物后連接到延伸產(chǎn)物。遠(yuǎn)側(cè)銜接子可雜交到表面結(jié)合寡核苷酸(其自身可以是通過(guò)第二群表面結(jié)合寡核苷酸的沿模板延伸而產(chǎn)生的延伸產(chǎn)物),從而使得可以發(fā)生橋式PCR0篩選引物還可以包含測(cè)序引物結(jié)合位點(diǎn),該位點(diǎn)可用于對(duì)PCR產(chǎn)物測(cè)序。上述方法通常可用于重測(cè)序方法,其中可利用參考基因座的序列,并需要在多個(gè)測(cè)試樣品中對(duì)相同的基因座重測(cè)序。在該應(yīng)用中,對(duì)篩選寡核苷酸進(jìn)行設(shè)計(jì)以雜交到基底上的寡核苷酸,并對(duì)位于基因座側(cè)翼的區(qū)域重測(cè)序。將基因座捕獲到基底上,然后擴(kuò)增,再進(jìn)行測(cè)序。例如,可從由一個(gè)個(gè)體或多個(gè)個(gè)體(例如,多達(dá)10、50、100、200或1,000或更多個(gè)個(gè)體)制備的樣品中捕獲單個(gè)基因座或多個(gè)不同的基因座(例如,多達(dá)10、50、100、200或1,000或更多個(gè)基因座)。在某些實(shí)施方案中,該方法包括:a)獲得包含第一群表面結(jié)合寡核苷酸和第二群表面結(jié)合寡核苷酸的基底,其中第一和第二群表面結(jié)合寡核苷酸隨機(jī)散布在基底上并且不在空間上尋址;b)將第一群表面結(jié)合寡核苷酸的第一成員雜交到篩選寡核苷酸,該篩選寡核苷酸包含與第一成員雜交的區(qū)域以及包含基因組序列的區(qū)域;c)延伸第一群表面結(jié)合寡核苷酸的第一成員以產(chǎn)生載體結(jié)合篩選引物,該載體結(jié)合篩選引物包含與基因組序列互補(bǔ)的序列;d)將載體結(jié)合篩選引物雜交到包含基因組序列的銜接子連接片段(例如,銜接子連接基因組片段);e)延伸載體結(jié)合篩選引物以產(chǎn)生包含位于基因組序列側(cè)翼(例如在基因組中)的序列以及銜接子連接基因組片段的銜接子序列的產(chǎn)物;以及f)使用橋式PCR進(jìn)行產(chǎn)物的擴(kuò)增以產(chǎn)生PCR產(chǎn)物。在可供選擇的實(shí)施方案中,該方法包括:a)獲得包含第一群表面結(jié)合寡核苷酸和第二群表面結(jié)合寡核苷酸的基底,其中第一和第二群表面結(jié)合寡核苷酸隨機(jī)散布在基底上并且不在空間上尋址;b)將第一群表面結(jié)合寡核苷酸的第一成員雜交到篩選寡核苷酸,該篩選寡核苷酸包含與第一成員雜交的區(qū)域以及包含基因組序列的區(qū)域;c)延伸第一群表面結(jié)合寡核苷酸的第一成員以產(chǎn)生載體結(jié)合篩選引物,該載體結(jié)合篩選引物包含與基因組序列互補(bǔ)的序列;e)延伸載體結(jié)合篩選引物以產(chǎn)生包含位于基因組序列側(cè)翼的序列的產(chǎn)物;f)將雙鏈銜接子連接到產(chǎn)物上以產(chǎn)生銜接子修飾產(chǎn)物;以及g)使用橋式PCR進(jìn)行銜接子修飾產(chǎn)物的擴(kuò)增以產(chǎn)生PCR產(chǎn)物。在特定情況下,該方法可進(jìn)一步包括:1.將基因組片段連接到包含測(cè)序引物的位點(diǎn)和與第二表面結(jié)合寡核苷酸相同的核苷酸序列的銜接子,i1.將銜接子連接的基因組片段雜交到第一群表面結(jié)合寡核苷酸的第一成員,i1.延伸銜接子連接的片段所雜交到的第一群表面結(jié)合寡核苷酸的第一成員;以及iv.將延伸產(chǎn)物的含銜接子的末端雜交到第二載體結(jié)合多核苷酸,從而產(chǎn)生橋并有利于橋式PCR。附圖簡(jiǎn)述以下詳細(xì)說(shuō)明的某些方面在結(jié)合附圖閱讀時(shí)可以得到最好的理解。要強(qiáng)調(diào)的是,根據(jù)慣例,附圖的多個(gè)特征未按比例繪制。相反,為清楚起見,多個(gè)特征的尺寸被任意放大或縮小。附圖中包括以下圖例:
圖1.稱為“OS-Seq”的主題方法的一個(gè)實(shí)施方案的概覽。(a) OS-Seq是與IlluminaNGS平臺(tái)無(wú)縫集成的靶向重測(cè)序方法。本方法需要靶標(biāo)特異性寡核苷酸、測(cè)序文庫(kù)和Illumina簇生成試劑盒。靶標(biāo)捕獲、 處理和測(cè)序在NGS系統(tǒng)上進(jìn)行。源于各引物-探針的數(shù)據(jù)被靶向并為鏈特異性的。此處顯示的是OS-Seq-366的中位覆蓋度特征圖。(b)0S_Seq的處理涉及雜交、DNA聚合酶介導(dǎo)的延伸和DNA變性三個(gè)步驟。第I步:將靶標(biāo)特異性寡核苷酸用于將流通池引物修飾為弓丨物-探針。在11 Iumina測(cè)序系統(tǒng)中,將兩種類型的引物(命名為C和D)固定在雙端流通池。在OS-Seq中,使用寡核苷酸的復(fù)合文庫(kù)將D引物的子集修飾為引物-探針。寡核苷酸具有雜交到D型流通池引物的序列。然后將雜交的寡核苷酸用作DNA聚合酶的模板,并延伸D引物。變性后,將靶標(biāo)特異性引物-探針隨機(jī)固定在流通池上。第2步:使用引物-探針捕獲單銜接子文庫(kù)中的基因組靶標(biāo)。用于Illumina測(cè)序的樣品制備涉及將特定的DNA銜接子添加到基因組DNA片段。這些銜接子包括測(cè)序引物和固定的流通池引物的位點(diǎn)。在OS-Seq中,我們使用修飾的銜接子由基因組DNA制備單銜接子文庫(kù)。在高熱雜交到其互補(bǔ)引物-探針的過(guò)程中捕獲單銜接子文庫(kù)中的靶標(biāo)。將捕獲的單銜接子文庫(kù)片段用作DNA聚合酶的模板,并延伸引物-探針。變性從固定的靶標(biāo)中釋放出模板DNA。第3步:使固定的祀標(biāo)與Illumina測(cè)序相容。在Illumina測(cè)序中,需要使用C和D引物進(jìn)行的固定的測(cè)序文庫(kù)片段的固相擴(kuò)增。在OS-Seq中,在低熱雜交期間,固定的靶標(biāo)的單銜接子尾在流通池表面上雜交到C型引物,其使橋結(jié)構(gòu)穩(wěn)定化。使用DNA聚合酶延伸固定的靶標(biāo)的3’末端和C引物。在變性后,形成兩個(gè)互補(bǔ)的、固定的測(cè)序文庫(kù)片段,它們包含完整的C和D引發(fā)位點(diǎn)并與固相擴(kuò)增相容。在OS-Seq的三個(gè)步驟后,固定的靶標(biāo)在結(jié)構(gòu)上與標(biāo)準(zhǔn)雙端Illumina文庫(kù)相同,然后使用Illumina標(biāo)準(zhǔn)試劑盒和方案進(jìn)行擴(kuò)增和處理。該方法的原理可用在其他測(cè)序平臺(tái)上。(C)本圖顯示了 OS-Seq-366測(cè)定法中沿著KRAS基因的覆蓋度特征圖。相對(duì)于外顯子I起點(diǎn)的堿基位置在X軸上示出,并指明了 KRAS外顯子。(d)在柱和陣列合成的寡核苷酸內(nèi)進(jìn)行的引物-探針產(chǎn)率的均一性評(píng)估。在柱合成的(藍(lán)色,n=366)和 陣列合成的(紅色,n=ll,742)寡核苷酸之間對(duì)捕獲的均一性進(jìn)行了比較。在X軸上,將寡核苷酸按序列捕獲產(chǎn)率分選,在y軸上為歸一化的引物-探針產(chǎn)率。為了計(jì)算歸一化產(chǎn)率,將各寡核苷酸產(chǎn)率除以得自所有寡核苷酸的中位產(chǎn)率。圖2.用于OS-Seq的測(cè)序文庫(kù)制備。將基因組DNA片段化、末端修復(fù)、A加尾、銜接子連接和PCR的一般方案用于制備OS-Seq文庫(kù)。圖3.0S-Seq的設(shè)計(jì)策略。(a)距離外顯子10個(gè)堿基設(shè)置引物-探針,或(b)在大外顯子內(nèi)部每500個(gè)堿基拼接引物-探針。圖4.0S-Seq寡核苷酸的生成。柱合成法產(chǎn)生了大量成熟的101-mer OS-Seq寡核苷酸,其可容易地用在測(cè)定法中。將微陣列合成法用于生成高含量寡核苷酸庫(kù)。使用結(jié)合了另外的序列的引物將前體寡核苷酸擴(kuò)增成寡核苷酸。將尿嘧啶切除用于從OS-seq寡核苷酸的編碼鏈裂解擴(kuò)增弓I物位點(diǎn)。圖5.0S-Seq中寡核苷酸組分的結(jié)構(gòu)。(a)成熟的101-mer OS-Seq寡核苷酸包含靶標(biāo)特異性位點(diǎn)以及編碼引物2和流通池引物‘D’的序列。(b)使用結(jié)合了 OS-Seq寡核苷酸5’末端的尿嘧啶以及另外的活性位點(diǎn)的引物擴(kuò)增微陣列合成的寡核苷酸,以用于測(cè)序。(C)OS-Seq的銜接子包含T懸垂,用于粘端連接到A加尾的基因組片段。此外,索引序列以及流通池引物‘C’位點(diǎn)存在于dsDNA銜接子中。圖6.0S-Seq中遇到的插入物大小分布的說(shuō)明?;蚪MDNA的片段化產(chǎn)生200與2kb之間的片段。測(cè)序文庫(kù)的制備將共同的銜接子添加到片段的末端。PCR擴(kuò)增進(jìn)一步扭曲片段大小分布。靶標(biāo)位點(diǎn)隨機(jī)分布在單銜接子文庫(kù)片段內(nèi)。將文庫(kù)片段固定在流通池上,引物-探針與銜接子之間的距離定義基因組DNA插入物的大小。將橋式PCR應(yīng)用于擴(kuò)增固定的靶標(biāo)DNA (—般來(lái)講,固相PCR優(yōu)先地?cái)U(kuò)增較短的片段)。在簇?cái)U(kuò)增和處理后,使用兩個(gè)位點(diǎn)對(duì)固定的片段測(cè)序。Readl源于基因組DNA,Read2源于合成的引物-探針。Readl用于通過(guò)OS-Seq數(shù)據(jù)評(píng)估基因組DNA序列。圖7.0S-Seq的重現(xiàn)性。(a)0S_Seq的技術(shù)重現(xiàn)性。使用OS-Seq分析了兩個(gè)相同的文庫(kù)。將個(gè)體引物-探針的測(cè)序產(chǎn)率在技術(shù)平行樣之間進(jìn)行比較。(b)OS-Seq的生物學(xué)重現(xiàn)性。使用索引銜接子制備了兩個(gè)不同的基因組DNA文庫(kù)。在同一 OS-Seq實(shí)驗(yàn)中對(duì)文庫(kù)進(jìn)行分析。在圖中,在兩個(gè)獨(dú)立的生物學(xué)平行樣之間對(duì)引物-探針特異性捕獲產(chǎn)率進(jìn)行比較。圖8A-B.GC含量對(duì)靶向產(chǎn)率的影響。為了分析在引物-探針的效率中GC含量的影響,我們測(cè)定了各靶標(biāo)特異性引物-探針序列的GC含量。我們對(duì)失敗(捕獲了 O個(gè)靶標(biāo))的引物-探針進(jìn)行了歸類。將失敗引物-探針的比例在不同的%CG含量類別之間進(jìn)行比較。X軸表示分選的CG類別的百分比,y軸報(bào)告了各GC含量類別內(nèi)失敗引物-探針的比例。圖9A-B.0S-Seq與鳥槍(shotgun)文庫(kù)創(chuàng)建方法的處理流程的比較。定義除非本文另有定義,否則本文所用的所有技術(shù)和科學(xué)術(shù)語(yǔ)都具有與本發(fā)明所屬領(lǐng)域的普通技術(shù)人員通常所理解的相同含義。雖然類似于或等同于本文所述的那些的任何方法和材料也可用于實(shí)踐或檢驗(yàn)本發(fā)明,但將描述優(yōu)選的方法和材料。本文提及的所有專利和出版物,包括此類專利和出版物內(nèi)所公開的所有序列,以引用方式明確并入。數(shù)值范圍包括定義該范圍的數(shù)值的端值。除非另外指明,否則核酸均以5’至3’方向從左向右書寫;氨基酸序列均以氨基至羧基方向從左向右書寫。本文提供的標(biāo)題不限制本發(fā)明的各個(gè)方面或?qū)嵤┓桨?。因此,緊接下文定義的術(shù)語(yǔ)通過(guò)作為整體引用到本說(shuō)明書而更全面地定義。除非另有定義,否則本文所用的所有技術(shù)和科學(xué)術(shù)語(yǔ)具有與本發(fā)明所屬領(lǐng)域的普通技術(shù)人員通常所理解的相同含義。Singleton等,DICTIONARY OF MICROBIOLOGYAND MOLECULAR BIOLOGY,第 2 版,John Wiley and Sons, New York(1994)以及 Hale 和Markham, THE HARPER COLLINS DICTIONARY OF BIOLOGY, Harper Perennial, N.Y.(1991)為技術(shù)人員提供了本文所用的許多術(shù)語(yǔ)的一般含義。另外,為了清楚起見和方便參考,下文將定義某些術(shù)語(yǔ)。如本文所用的術(shù)語(yǔ)“樣品”涉及包含一種或多種所關(guān)注的分析物的材料或材料混合物,通常但不一定為液體形式。本文所用的核酸樣品可以是復(fù)雜樣品,因?yàn)樗鼈儼喾N不同的含有序列的分子。由哺乳動(dòng)物(如,小鼠或人)mRNA制備的片段化基因組DNA和cDNA是復(fù)雜樣品的類型。復(fù)雜樣品可具有多于104、105、106或IO7個(gè)不同的核酸分子。DNA靶標(biāo)可源于任何來(lái)源,諸如基因組DNA、cDNA (來(lái)自RNA)或人工DNA構(gòu)建體。本文可以采用含有核酸(例如由組織培養(yǎng)細(xì)胞制備的基因組DNA)的任何樣品、組織樣品或FPET樣品。術(shù)語(yǔ)“核苷酸”旨在包括那些不僅含有已知的嘌呤 和嘧啶堿基還含有經(jīng)修飾的其他雜環(huán)堿基的部分。此類修飾包括甲基化嘌呤或嘧啶、酰化嘌呤或嘧啶、烷基化核糖或其他雜環(huán)化合物。此外,術(shù)語(yǔ)“核苷酸”包括那些含有半抗原或熒光標(biāo)記以及可以不僅含有常規(guī)核糖和脫氧核糖還含有其他糖的部分。修飾的核苷或核苷酸還可以在糖部分上包含修飾,例如,其中一個(gè)或多個(gè)羥基被鹵素原子或脂族基團(tuán)取代,被官能化為醚、胺等等。術(shù)語(yǔ)“核酸”和“多核苷酸”在本文可互換使用以描述任何長(zhǎng)度的聚合物,例如,大于約2個(gè)堿基,大于約10個(gè)堿基,大于約100個(gè)堿基,大于約500個(gè)堿基,大于約1000個(gè)堿基,多達(dá)約10,000個(gè)或更多個(gè)構(gòu)成核苷酸的堿基,例如脫氧核糖核苷酸或核糖核苷酸,并可通過(guò)酶法或合成方法產(chǎn)生(例如,如美國(guó)專利號(hào)5,948,902以及其中引用的參考文獻(xiàn)中所述的PNA),其可以與兩個(gè)天然存在的核酸類似的序列特異性方式與天然存在的核酸雜交,例如可以參與Watson-Crick堿基配對(duì)相互作用。天然存在的核苷酸包括鳥嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶(分別為G、C、A和T)。如本文所用的術(shù)語(yǔ)“核酸樣品”表示含有核酸的樣品。如本文所用的術(shù)語(yǔ)“靶標(biāo)多核苷酸”是指研究中的所關(guān)注多核苷酸。在某些實(shí)施方案中,靶標(biāo)多核苷酸包含所關(guān)注的和研究中的一個(gè)或多個(gè)序列。如本文所用的術(shù)語(yǔ)“多核苷酸”表示長(zhǎng)度為約2至200個(gè)核苷酸、最多500個(gè)核苷酸的單鏈核苷酸多聚體。寡核苷酸可以是合成的或可以通過(guò)酶法制備,并在一些實(shí)施方案中為30至150個(gè)核苷酸長(zhǎng)。寡核苷酸可包含核糖核苷酸單體(即,可以是寡核糖核苷酸)或脫氧核糖核苷酸單體。寡核苷酸可以例如為10至20、11至30、31至40、41至50、51_60、61至70、71至80、80至100、100至150或150至200個(gè)核苷酸長(zhǎng)。術(shù)語(yǔ)“雜交”是指核酸鏈通過(guò)本領(lǐng)域已知的堿基配對(duì)與互補(bǔ)鏈結(jié)合的過(guò)程。如果兩個(gè)序列在中等至高嚴(yán)格雜交和洗滌條件下彼此特異性雜交,則將核酸視為“可選擇性雜交”到參考核酸序列。中等和高嚴(yán)格雜交條件是已知的(參見例如Ausubel等,Short Protocolsin Molecular Biology,第 3 版,Wiley&Sonsl995 和 Sambrook 等,Molecular Cloning:ALaboratory Manual,第 3 版,2001Cold Spring Harbor, N.Y.) 高嚴(yán)格條件的一個(gè)實(shí)例包括在約42°C下在50%甲酰胺、5X SSC、5X Denhardt溶液、0.5%SDS和100 μ g/ml變性的載體DNA中雜交,然后在室溫下在2X SSC和0.5%SDS中洗滌兩次,再在42°C下在0.1X SSC和0.5%SDS中洗滌兩次。如本文所用的術(shù)語(yǔ)“雙鏈體”或“雙鏈的”描述堿基配對(duì)即雜交到一起的兩個(gè)互補(bǔ)
多核苷酸。如本文所用的術(shù)語(yǔ)“擴(kuò)增”是指使用靶標(biāo)核酸作為模板生成靶標(biāo)核酸的一個(gè)或更多個(gè)拷貝。術(shù)語(yǔ)“確定”、“測(cè)量”、“評(píng)價(jià)”、“評(píng)估”、“測(cè)定”和“分析”在本文可互換使用,以指代
任何形式的測(cè)量,并包括測(cè)定某一要素是否存在。這些術(shù)語(yǔ)包括定量和/或定性測(cè)定。評(píng)估可以是相對(duì)的或絕對(duì)的?!霸u(píng)估...的存在”包括測(cè)定存在的某物的量,以及測(cè)定其是否存在。術(shù)語(yǔ)“使用”具有其常規(guī)含義,并因此表示采用(例如投入服務(wù))某方法或組合物獲得某目的。例如,如果將某程序用于創(chuàng)建文件,則執(zhí)行程序以制作文件,該文件通常為該程序的輸出。在另一個(gè)實(shí)例中,如果使用計(jì)算機(jī)文件,則通常訪問(wèn)、讀取該文件,并將該文件中存儲(chǔ)的信息用于獲得某目的。相似地,如果使用唯一性標(biāo)識(shí)符例如條形碼,則通常讀取該唯一性標(biāo)識(shí)符以識(shí)別例如與該唯一性標(biāo)識(shí)符相關(guān)的物體或文件。如本文所 用,術(shù)語(yǔ)“Tm ”是指寡核苷酸雙鏈體的熔融溫度,在該溫度下,雙鏈體的一半保持雜交,而雙鏈體的另一半則解離成單鏈。寡核苷酸雙鏈體的Tm可以通過(guò)實(shí)驗(yàn)測(cè)定或使用下式預(yù)測(cè):Tm=81.5+16.6 (1gltl[Na+])+0.41 (G+C分?jǐn)?shù))-(60/N),其中N為鏈長(zhǎng)度,[Na+]小于 1M。參見 Sambrook 和 Russell (2001 ;Molecular Cloning:A LaboratoryManual,第 3 版,Cold Spring Harbor Press, Cold Spring Harbor N.Y.,第 10 章)。還存在預(yù)測(cè)寡核苷酸雙鏈體Tm的其他公式,一個(gè)公式對(duì)于給定的條件或一套條件可能更合適或不夠合適。如這里所用的術(shù)語(yǔ)“在溶液中游離的”描述未結(jié)合或系鏈到另一分子的分子,諸如
多核苷酸。如本文所用的術(shù)語(yǔ)“變性”是指將核酸雙鏈體分離成兩條單鏈。如本文所用的術(shù)語(yǔ)“基因組序列”是指在基因組中存在的序列。由于RNA由基因組轉(zhuǎn)錄,因此,該術(shù)語(yǔ)涵蓋存在于生物體核基因組中的序列,以及存在于由這樣的基因組轉(zhuǎn)錄的RNA (如mRNA)的cDNA拷貝中的序列。如本文所用的術(shù)語(yǔ)“基因組片段”是指基因組的區(qū)域,例如動(dòng)物或植物基因組,諸如人、猴、大鼠、魚或昆蟲或植物的基因組?;蚪M片段可以為或可以不為銜接子連接的。基因組片段可以為銜接子連接的(在此情況下,其具有連接到片段一個(gè)或兩個(gè)末端、至少分子5’末端的銜接子),或非銜接子連接的。在某些情況下,用于本文所述的方法的寡核苷酸可使用參考基因組區(qū)域設(shè)計(jì),SP,已知核苷酸序列的基因組區(qū)域,例如,其序列登記在例如NCBI的Genbank數(shù)據(jù)庫(kù)或其他數(shù)據(jù)庫(kù)的染色體區(qū)域。這樣的寡核苷酸可用在使用含有測(cè)試基因組的樣品的測(cè)定法中,其中該測(cè)試基因組含有該寡核苷酸的結(jié)合位點(diǎn)。如本文 所用的術(shù)語(yǔ)“連接”是指將第一 DNA分子的5’末端的末端核苷酸通過(guò)酶催化法接合到第二 DNA分子3’末端的末端核苷酸。術(shù)語(yǔ)“銜接子”是指雙鏈的以及單鏈的分子?!岸鄠€(gè)”包含至少2個(gè)成員。在某些情況下,多個(gè)可具有至少10個(gè)、至少100個(gè)、至少100個(gè)、至少10,000個(gè)、至少100,000個(gè)、至少IO6個(gè)、至少IO7個(gè)、至少IO8或至少IO9個(gè)
或更多個(gè)成員。如果兩個(gè)核酸為“互補(bǔ)的”,則核酸之一的每個(gè)堿基與另一核酸中的對(duì)應(yīng)核苷酸堿基配對(duì)。術(shù)語(yǔ)“互補(bǔ)的”和“完美互補(bǔ)的”在本文同義使用?!耙锝Y(jié)合位點(diǎn)”是指引物在寡核苷酸或其互補(bǔ)鏈中雜交到的位點(diǎn)。如本文所用的術(shù)語(yǔ)“分離”是指兩種元件的物理分離(例如,通過(guò)大小或親和力等)以及使一個(gè)元件降解而留下另一個(gè)完整無(wú)損。如本文所用的術(shù)語(yǔ)“測(cè)序”是指借以獲得對(duì)多核苷酸的至少10個(gè)連續(xù)核苷酸的身份(例如,至少20個(gè)、至少50個(gè)、至少100個(gè)或至少200個(gè)或更多個(gè)連續(xù)核苷酸的身份)的方法。在包含不空間尋址的表面結(jié)合多核苷酸群的基底的背景下,術(shù)語(yǔ)“不空間尋址”是指基底所含的表面含有不同的寡核苷酸分子,它們相對(duì)于彼此無(wú)特定的順序或位置,即,處于隨機(jī)的位置或與彼此隨機(jī)散布。這樣的基底不需要為平坦的,并在某些情況下可以為珠粒的形式。包含空間或光學(xué)尋址的單一寡核苷酸群的基底(例如,微陣列和編碼珠粒等)被排除在本定義之外。包含第一群表面結(jié)合寡核苷酸和第二群表面結(jié)合寡核苷酸的基底,其中第一和第二群表面結(jié)合寡核苷酸不空間尋址,是指包含在整個(gè)基底上隨機(jī)分布的至少兩群不同的寡核苷酸的基底。基底可以例如是平坦的或珠粒的形式。如本文所用的術(shù)語(yǔ)“銜接子連接的”是指已連接到銜接子的核酸。銜接子可以連接到核酸分子的5’末端或3’末端。如本文所用的術(shù)語(yǔ)“延伸”是指通過(guò)使用聚合酶添加核苷酸而延伸引物。如果對(duì)退火形成核酸的引物進(jìn)行延伸,則核酸作為延伸反應(yīng)的模板。術(shù)語(yǔ)“橋式PCR”是指固相聚合酶鏈反應(yīng),其中在反應(yīng)中延伸的引物通過(guò)它們的5’末端被系鏈到基底上。在擴(kuò)增期間,擴(kuò)增子在系鏈的引物之間形成橋。橋式PCR (其也可以稱為“簇PCR”)用于Illumina的Solexa平臺(tái)。橋式PCR和Illumina的Solexa平臺(tái)在許多出版物中有所概述,例如 Gudmundsson 等(Nat.Genet.200941:1122-6),Out 等(Hum.Mutat.200930:1703-12)和 Turner (Nat.Methods20096:315-6),美國(guó)專利 7,115,400,以及專利申請(qǐng)公布 US20080160580 和 US20080286795。如本文所用的術(shù)語(yǔ)“條形碼序列”是指將唯一性核苷酸序列用于在反應(yīng)中鑒定和/或跟蹤多核苷酸的來(lái)源。條形碼序列可位于寡核苷酸的5'末端或3’末端。條形碼序列的大小和組成可以差異巨大;以下參考文獻(xiàn)提供了選擇適用于特定實(shí)施方案的條形碼序列集的指導(dǎo)原則:Brenner,美國(guó)專利號(hào)5, 635, 400 ;Brenner等,Proc.Natl.Acad.Sc1., 97:1665-1670(2000) ;Shoemaker 等,Nature Genetics, 14:450-456(1996) ;Morris等,歐洲專利公布0799897A1 ;Wallace,美國(guó)專利號(hào)5,981,179等。在特定實(shí)施方案中,條形碼序列的長(zhǎng)度范圍可為4至36個(gè)核苷酸、或6至30個(gè)核苷酸或8至20個(gè)核苷酸。其他術(shù)語(yǔ)定義可出現(xiàn)在整個(gè)說(shuō)明書中。發(fā)明詳述主題方法的某些特征結(jié)合圖1進(jìn)行描述,該圖示出了其中在將片段雜交到基底前將銜接子連接到片段的實(shí)施方案。在`可供選擇的實(shí)施方案中,在方案的隨后添加銜接子。該方法通常包括獲得包含至少兩個(gè)不同序列的表面結(jié)合寡核苷酸的基底,所述寡核苷酸在空間上彼此散布。此類基底目前用于Illumina的Solexa測(cè)序技術(shù),并在許多參考文獻(xiàn)中有所描述,例如美國(guó)專利號(hào)7,115,400和專利公布號(hào)US20080160580及US20080286795,它們的此類公開內(nèi)容以引用方式并入。下文所示的一些實(shí)施方案可描述將該方法用于分離基因組的片段。這些實(shí)施方案可容易地適于其他類型的序列,例如cDNA或合成的DNA。在某些實(shí)施方案中,將第一群表面結(jié)合寡核苷酸的第一成員雜交到篩選寡核苷酸,該篩選寡核苷酸包含:a)與第一成員雜交的區(qū)域和另外的區(qū)域、測(cè)序引物位點(diǎn),以及b)包含靶標(biāo)基因組序列的區(qū)域。用于該步驟的篩選寡核苷酸的量可經(jīng)過(guò)優(yōu)化,使得足量的第一群寡核苷酸保持不雜交到篩選寡核苷酸并可用于在方案隨后進(jìn)行的橋式PCR步驟。將第一群表面結(jié)合寡核苷酸的第一成員進(jìn)行延伸,以產(chǎn)生包含載體結(jié)合篩選引物的雙鏈體,該載體結(jié)合篩選引物包含與靶標(biāo)基因組序列互補(bǔ)的序列。通過(guò)變性移除篩選寡核苷酸,留下延伸的載體結(jié)合篩選引物。然后將延伸的載體結(jié)合篩選引物與銜接子連接的基因組片段(其可通過(guò)化學(xué)、物理方式或使用酶使基因組DNA片段化并且然后將銜接子連接到所得片段的末端而制成)雜交,該銜接子連接的基因組片段包含靶標(biāo)基因組序列、位于靶標(biāo)基因組序列側(cè)翼的序列以及位于一條或兩條鏈5’末端的銜接子序列。使載體結(jié)合篩選引物延伸,以得到產(chǎn)物,該產(chǎn)物包含在基因組中位于基因組序列側(cè)翼的序列以及銜接子連接的基因組片段的銜接子序列。
在一些實(shí)施方案中,銜接子連接的基因組片段的銜接子可雜交到第二群表面結(jié)合寡核苷酸。然而,在某些情況下,在擴(kuò)增前,可使第二群表面結(jié)合寡核苷酸雜交到修飾寡核苷酸,該修飾寡核苷酸包含a)與第二成員雜交的區(qū)域,以及包含銜接子序列的區(qū)域。用于該步驟的修飾寡核苷酸的量可經(jīng)過(guò)優(yōu)化,使得足量的產(chǎn)物分子發(fā)生雜交。可使第二群表面結(jié)合寡核苷酸的第二成員延伸,以產(chǎn)生包含載體結(jié)合銜接子引物的雙鏈體,該載體結(jié)合銜接子引物包含與銜接子序列互補(bǔ)的序列。通過(guò)變性移除修飾寡核苷酸,留下載體結(jié)合銜接子引物。然后可通過(guò)橋式PCR擴(kuò)增產(chǎn)物。如圖1b中所示,使產(chǎn)物通過(guò)第一未延伸的表面結(jié)合寡核苷酸以及第二表面結(jié)合寡核苷酸擴(kuò)增,以產(chǎn)生PCR產(chǎn)物。在某些情況下,基因組片段為包含5’末端銜接子的銜接子連接的基因組片段。在這些情況下,第二群表面結(jié)合寡核苷酸的成員雜交到銜接子的互補(bǔ)序列。在可供選擇的實(shí)施方案中,可將銜接子連接到延伸產(chǎn)物上,從而將雜交到第二群表面結(jié)合寡核苷酸的銜接子置于延伸產(chǎn)物的3’末端上。在其他實(shí)施方案中,擴(kuò)增使用以下物質(zhì)完成:a)未延伸的第一群表面結(jié)合寡核苷酸的成員;以及b)通過(guò)以下方式制備的載體結(jié)合引物:1.將第二群表面結(jié)合寡核苷酸的成員雜交到寡核苷酸,該寡核苷酸包含與第二群表面結(jié)合寡核苷酸的成員雜交的區(qū)域以及與銜接子互補(bǔ)的區(qū)域;以及i1.使第二群表面結(jié)合寡核苷酸的成員延伸,以產(chǎn)生雜交到延伸產(chǎn)物5’末端的載體結(jié)合引物。在一些實(shí)施方案中,基因組片段為包含5’末端銜接子的銜接子連接的基因組片段,其中延伸產(chǎn)生在其3’末端包含與銜接子互補(bǔ)的序列的延伸產(chǎn)物,并且其中第二群表面結(jié)合寡核苷酸的成員在橋式PCR期間雜交到與銜接子互補(bǔ)的序列。在該實(shí)施方案中,5’末端銜接子包含在該末端連接到基因組片段的測(cè)序引物的結(jié)合位點(diǎn)。在其他實(shí)施方案中,該方法在步驟e)與f)之間包括將銜接子連接到延伸產(chǎn)物的3’末端上,并且其中在橋式PCR期間將第二群表面結(jié)合寡核苷酸的成員雜交到銜接子。在這些實(shí)施方案中,銜接子包含在該末端連接到基因組片段的測(cè)序引物的結(jié)合位點(diǎn)。在一些實(shí)施方案中,第二群表面結(jié)合寡核苷酸通過(guò)以下方式制備:1.將初始第二群表面結(jié)合寡核苷酸的成員雜交到寡核苷酸,該寡核苷酸包含與第二群表面結(jié)合寡核苷酸的成員雜交的區(qū)域以及與 基因組片段的序列互補(bǔ)的區(qū)域;以及i1.使初始第二群表面結(jié)合寡核苷酸的成員延伸,以產(chǎn)生第二群表面結(jié)合寡核苷酸。在一些實(shí)施方案中,第二群表面結(jié)合寡核苷酸可通過(guò)以下方式制備:將包含與所述核酸片段的序列互補(bǔ)的區(qū)域的寡核苷酸連接到初始第二群表面結(jié)合寡核苷酸,以產(chǎn)生所述第二群表面結(jié)合寡核苷酸。該連接可通過(guò)在進(jìn)行連接的兩個(gè)寡核苷酸之間形成橋的夾板寡核苷酸而促進(jìn)。換句話講,可通過(guò)基于連接的過(guò)程引入修飾寡核苷酸,其中將橋聯(lián)寡核苷酸用于指導(dǎo)原始固體載體寡核苷酸的修飾,以產(chǎn)生載體結(jié)合的銜接子引物。相似地,可使用類似的橋聯(lián)寡核苷酸形成載體結(jié)合的銜接子引物,以產(chǎn)生靶標(biāo)修飾所需的引物延伸。在一些情況下,篩選寡核苷酸包含介于與所述第一成員雜交的所述區(qū)域與包含所述基因組序列的所述區(qū)域之間的測(cè)序引物的結(jié)合位點(diǎn)。在一些實(shí)施方案中,該方法可進(jìn)一步包括對(duì)PCR產(chǎn)物的第一鏈測(cè)序,以獲得位于基因組序列側(cè)翼的序列的核苷酸序列的至少一部分。該方法可進(jìn)一步包括對(duì)PCR產(chǎn)物的第二鏈測(cè)序,以獲得位于基因組序列側(cè)翼的序列的核苷酸序列的至少一部分。在特定實(shí)施方案中,該方法可包括使哺乳動(dòng)物基因組片段化以產(chǎn)生片段化基因組,任選地向片段化基因組添加銜接子,以及將片段化基因組施加到基底上。片段化通過(guò)物理、化學(xué)方式或使用限制性酶完成。例如,片段化通過(guò)聲波或剪切完成。在特定情況下,雜交通過(guò)以下方式完成:從多個(gè)不同的個(gè)體制備多個(gè)片段化基因組,混合多個(gè)片段化基因組以產(chǎn)生庫(kù),將片段化基因組的庫(kù)施加到基底,以及獲得包含位于不同個(gè)體中的基因組序列側(cè)翼的序列的PCR產(chǎn)物。這些實(shí)施方案可進(jìn)一步包括對(duì)PCR產(chǎn)物的至少第一鏈測(cè)序,以獲得位于不同個(gè)體中的基因組序列側(cè)翼的序列的核苷酸序列的至少一部分。在特定方面,在混合前,將不同的銜接子連接到來(lái)自不同個(gè)體的片段化基因組,其中該銜接子包含條形碼序列,該條形碼序列允許在對(duì)PCR產(chǎn)物測(cè)序后鑒定銜接子連接的基因組片段的來(lái)源。在某些實(shí)施方案中,該方法包括:使用包含第一條形碼序列的第一銜接子用銜接子連接來(lái)自第一受試者的片段化基因組DNA以產(chǎn)生第一產(chǎn)物;使用包含第二條形碼序列的第二銜接子用銜接子連接來(lái)自第二受試者的片段化基因組DNA以產(chǎn)生第二產(chǎn)物;將第一和第二產(chǎn)物合并以產(chǎn)生混合模板;以及使用該混合模板執(zhí)行權(quán)利要求1的方法以提供各自包含條形碼序列的第一和第二 PCR產(chǎn)物?;旌夏0逶谝恍┣闆r下可包含來(lái)自至少1,000個(gè)受試者的片段化基因組DNA。在一些實(shí)施方案中,該方法可涉及:1.將基因組片段連接到包含測(cè)序引物的位點(diǎn)和與第二表面結(jié)合寡核苷酸相同的核苷酸序列的銜接子,i1.將銜接子連接的基因組片段雜交到第一群表面結(jié)合寡核苷酸的第一成員,ii1.延伸銜接子連接的片段所雜交到的第一群表面結(jié)合寡核苷酸的第一成員;以及iv.將延伸產(chǎn)物的含銜接子的末端雜交到第二載體結(jié)合多核苷酸,從而產(chǎn)生橋并有利于橋式PCR。本文還提供一種系統(tǒng)。在某些情況下,該系統(tǒng)可以包括:a)包含第一群表面結(jié)合寡核苷酸和第二群表面 結(jié)合寡核苷酸的基底,其中第一和第二群表面結(jié)合寡核苷酸不在基底上空間尋址;b)包含與第一群的第一成員雜交的區(qū)域以及含基因組序列的區(qū)域的篩選寡核苷酸;c)銜接子;以及e)執(zhí)行權(quán)利要求1的方法的說(shuō)明??衫缡褂肐llumina的Solexa平臺(tái)或另一種固相測(cè)序方法對(duì)PCR產(chǎn)物進(jìn)行測(cè)序,以獲得位于靶標(biāo)基因組序列側(cè)翼的序列的核苷酸序列的至少一部分。在特定實(shí)施方案中,該方法可采用允許鑒定位于靶標(biāo)基因組序列側(cè)翼的序列的來(lái)源的條形碼序列。在這些實(shí)施方案中,銜接子連接的基因組片段的銜接子可包含條形碼序列,其允許在對(duì)PCR產(chǎn)物測(cè)序后鑒定銜接子連接的基因組片段的來(lái)源。在特定實(shí)施方案中,該方法包括:使用包含第一條形碼序列的第一銜接子用銜接子連接來(lái)自第一受試者(該受試者可以包括在第一多個(gè)受試者的庫(kù)中)的片段化基因組DNA以產(chǎn)生第一產(chǎn)物;使用包含第二條形碼序列的第二銜接子用銜接子連接來(lái)自第二受試者(該受試者可以包括在第二多個(gè)受試者的庫(kù)中)的片段化基因組DNA以產(chǎn)生第二產(chǎn)物;將第一和第二產(chǎn)物合并以產(chǎn)生混合模板;以及使用該混合模板執(zhí)行上述方法以提供各自包含條形碼序列的第一和第二 PCR產(chǎn)物。在上述方法中,所用的銜接子具有:具有相同序列并雜交到表面結(jié)合寡核苷酸的部分,以及具有不同核苷酸序列的含條形碼序列的部分。本發(fā)明提供擴(kuò)增所選序列的第二方法。該方法的原理與上述方法的原理相似,不同的是:a)雜交到載體結(jié)合篩選引物的基因組片段未連接銜接子;以及b)銜接子在延伸了載體結(jié)合篩選引物之后。銜接子連接后,產(chǎn)物可用于橋式PCR產(chǎn)物,如上所討論。如在上文所述的可供選擇的實(shí)施方案中,擴(kuò)增使用以下物質(zhì)完成:a)第一群表面結(jié)合寡核苷酸的未延伸成員;以及b)通過(guò)以下方式制備的載體結(jié)合引物:1.將第二群表面結(jié)合寡核苷酸的成員雜交到寡核苷酸,該寡核苷酸包含與第二群表面結(jié)合寡核苷酸的成員雜交的區(qū)域以及與銜接子的序列互補(bǔ)的區(qū)域;以及i1.使第二群表面結(jié)合寡核苷酸的成員延伸以產(chǎn)生載體結(jié)合的引物。與上述方法一樣,可對(duì)PCR產(chǎn)物測(cè)序以獲得位于基因組序列側(cè)翼的序列的核苷酸序列的至少一部分。在一個(gè)可供選擇的實(shí)施方案中,基因組片段可連接到不僅包含測(cè)序引物結(jié)合位點(diǎn)還包含與第二群表面結(jié)合寡核苷酸相同的序列的銜接子。如圖所示,當(dāng)將延伸的第一群表面結(jié)合寡核苷酸(其通常在高溫下完成,即,至少90°C )雜交到銜接子連接的片段并延伸時(shí),延伸產(chǎn)物包含雜交到第二群表面結(jié)合寡核苷酸的序列(其通常在較低溫度下完成,例如低于60°C,例如低于55°C ),從而有利于使用第一和第二群表面結(jié)合寡核苷酸擴(kuò)增基因組片段。該方法在圖14中示出。在特定實(shí)施方案中,第一群寡核苷酸相對(duì)于施加到基底的篩選寡核苷酸的量以至少 5 倍、10 倍、20 倍、50 倍、或 100 倍、500 倍、1,000 倍、2000 倍、10,000 倍、50,000 倍摩爾·過(guò)量存在。在一個(gè)實(shí)施方案中,摩爾過(guò)量可在5倍至50,000倍摩爾過(guò)量的范圍內(nèi),例如100倍至5,000倍摩爾過(guò)量。在某些實(shí)施方案中,可將基底與多種不同的篩選寡核苷酸接觸,每一種包含與第一群表面結(jié)合寡核苷酸的成員雜交的區(qū)域(該區(qū)域在不同的篩選寡核苷酸中具有相同的核苷酸序列)以及含基因組序列的區(qū)域。篩選寡核苷酸每一種的基因組序列均不同,從而允許在基底上對(duì)多種基因組區(qū)域進(jìn)行捕獲、擴(kuò)增和測(cè)序。試劑盒本公開還提供用于實(shí)踐如上所述的主題方法的試劑盒。在某些實(shí)施方案中,主題試劑盒可以包含:a)包含第一群表面結(jié)合寡核苷酸和第二群表面結(jié)合寡核苷酸的基底,其中第一和第二群表面結(jié)合寡核苷酸不在基底上空間尋址;以及b)包含與第一群的第一成員雜交的區(qū)域以及含基因組序列的區(qū)域的篩選寡核苷酸。該試劑盒還可以包含上文及下文所述的可用于本方法的其他試劑,例如銜接子、連接酶、雜交緩沖液等。除了上述組分外,該主題試劑盒通常進(jìn)一步包含使用試劑盒的組分實(shí)踐主題方法的說(shuō)明。實(shí)踐主題方法的說(shuō)明通常記錄在合適的記錄介質(zhì)上。例如,該說(shuō)明可印刷在基材上,諸如紙張或塑料等上。因此,該說(shuō)明可作為包裝說(shuō)明書存在于試劑盒中、存在于試劑盒容器或其組件(g卩,與包裝或分包裝相關(guān)的)的標(biāo)簽上等。在其他實(shí)施方案中,該說(shuō)明作為電子存儲(chǔ)數(shù)據(jù)文件存在于合適的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上,例如CD-ROM、磁盤等。在其他實(shí)施方案中,實(shí)際的說(shuō)明不存在于試劑盒中,但提供從遠(yuǎn)程來(lái)源獲得說(shuō)明的方法,例如通過(guò)互聯(lián)網(wǎng)。該實(shí)施方案的實(shí)例為包含web地址的試劑盒,可在該地址查看說(shuō)明和/或可從該地址下載說(shuō)明。與說(shuō)明一樣,獲得說(shuō)明的該方法也記錄在合適的基材上。其他所需的組件將包括相關(guān)的計(jì)算機(jī)程序和/或計(jì)算機(jī)腳本,以對(duì)已安裝在測(cè)序儀上的先前程序進(jìn)行修改。除了說(shuō)明外,試劑盒還可以包含用于測(cè)試試劑盒的一種或多種對(duì)照分析物混合物,例如,兩種或更多種對(duì)照分析物。為了進(jìn)一步說(shuō)明本發(fā)明,給出了以下具體實(shí)施例,應(yīng)當(dāng)理解,提供這些實(shí)施例是為了說(shuō)明本發(fā)明而不應(yīng)被視為是以任何方式限制本發(fā)明的范圍。
2010年9月24日提交的美國(guó)臨時(shí)專利申請(qǐng)序列號(hào)61/386,390以及2011年5月11日提交的美國(guó)臨時(shí)專利申請(qǐng)序列號(hào)61/485,062的公開內(nèi)容(包括所有圖例、實(shí)施例、詳細(xì)說(shuō)明和寡核苷酸序列)全部并入本文中。
實(shí)施例下面將給出執(zhí)行靶向DNA測(cè)序的新方法。該方法基于:在固相載體上對(duì)通用引物苔(IawnKS卩,包含至少兩個(gè)隨機(jī)分布的引物的苔)進(jìn)行修飾以用作靶標(biāo)DNA捕獲裝置,對(duì)捕獲的DNA直接測(cè)序以及無(wú)需對(duì)樣品進(jìn)行大量操作。該方法使得靶標(biāo)DNA捕獲和測(cè)序?qū)嶒?yàn)?zāi)軌蚺c相關(guān)的流體平臺(tái)無(wú)縫集成。該方法使用固相載體上的通用引物苔作為DNA捕獲基底,同時(shí)維持其測(cè)序潛能。該方法可使用未處理的天然DNA作為模板進(jìn)行測(cè)序。使用該方法的測(cè)序不一定依賴于實(shí)驗(yàn)室設(shè)施。此外,在樣品處理中引入的許多偏差得以避免并且相對(duì)于其他方法可在更短的時(shí)間以更低的成本分析明顯更小的樣品。該方法可用于分析單鏈和雙鏈模板。分析單鏈DNA模板的能力可能對(duì)于某些測(cè)序應(yīng)用具有重要意義,這些應(yīng)用使用來(lái)自病理學(xué)歸檔標(biāo)本的福爾馬林固定石蠟包埋樣品。相似地,通過(guò)允許單鏈DNA模板測(cè)序,該方法無(wú)需被設(shè)計(jì)為保護(hù)DNA雙鏈信息的復(fù)雜的核酸提取步驟和昂貴的片段化儀器。相反,樣品可通過(guò)裂解和熱片段化制備,其廉價(jià)而又有效。直接的捕獲測(cè)序測(cè)定法不限于人基因組DNA而是包括其他核酸底物,諸如可對(duì)細(xì)菌和病毒DNA和RNA進(jìn)行分析。也可捕獲轉(zhuǎn)錄組、非編碼RNA和miRNA并進(jìn)行測(cè)序。除了核苷酸序列捕獲和測(cè)序外,還可以研究其他遺傳和表觀遺傳性質(zhì),諸如DNA甲基化、大基因組重排和基因表達(dá)。該方法還可用于從群中選擇合成的DNA。一般來(lái)講,測(cè)序已被視為其中對(duì)DNA樣品進(jìn)行結(jié)構(gòu)修飾以有利于在測(cè)序系統(tǒng)上進(jìn)行分析的過(guò)程。下文所述的方法對(duì)測(cè)序系統(tǒng)進(jìn)行改良并因此無(wú)需修飾及大量制備樣品。通過(guò)使用合成的DNA寡核苷酸對(duì)通用引物苔進(jìn)行官能化,可以直接測(cè)定未處理的樣品的靶基因文庫(kù)。為了減少非特異性捕獲,將提供用于形成橋聯(lián)結(jié)構(gòu)的序列的特定DNA組分按順序帶入,并使引物苔自我修飾。用于所有類型測(cè)序儀的測(cè)序文庫(kù)制備依賴于將特定的雙鏈銜接子序列加入DNA模板。由于捕獲寡核苷酸用作固定在固體載體上的銜接子,因此,用于測(cè)定法的文庫(kù)制備只需添加單個(gè)銜接子。這大大縮短了樣品處理,并且不需要克隆擴(kuò)增也不需要基于凝膠電泳的大小分離。在某些情況下,可將第二銜接子添加到固體載體上的捕獲模板。本發(fā)明的某些實(shí)施方案允許使用原始DNA作為測(cè)序模板。用于執(zhí)行高通量重測(cè)序的多種現(xiàn)行方法涉及捕獲靶標(biāo)DNA并作為單獨(dú)的方法進(jìn)行測(cè)序。這在某些情況下會(huì)導(dǎo)致多種問(wèn)題,包括:i)對(duì)DNA材料的操作需要耗費(fèi)大量的勞力和時(shí)間,ii)因復(fù)雜的實(shí)驗(yàn)方案所致的錯(cuò)誤,iii)因篩選和分子擴(kuò)增過(guò)程產(chǎn)生的偏差,以及iv)需要大量的原料。據(jù)信,下述方法消除了其中許多問(wèn)題的來(lái)源,因?yàn)樵摲椒◣缀醪簧婕跋绕诘臉悠诽幚?,可?shí)現(xiàn)完全自動(dòng)化和高度擴(kuò)展。作為概念驗(yàn)證,對(duì)人基因組中的10個(gè)癌癥基因的所有外顯子測(cè)序,以證實(shí)測(cè)定法可重現(xiàn)并可用于捕獲和測(cè)序基因組的特定區(qū)域。該測(cè)定方法經(jīng)Illumina基因組分析儀加以證實(shí),但應(yīng)當(dāng)注意,該方法廣泛適用于使用固相載體的任何測(cè)序儀。下述方法 (其某些原理在圖1中示出)可用于有效捕獲任何靶標(biāo)DNA序列并允許對(duì)捕獲的基因組片段直接測(cè)序。測(cè)序所用的基因組DNA樣品可通過(guò)簡(jiǎn)單的熱片段化步驟制備,并且整個(gè)測(cè)定法可完全自動(dòng)化并在固體載體上執(zhí)行。捕獲和后續(xù)反應(yīng)可通過(guò)流體系統(tǒng)調(diào)控。另外的實(shí)施方案提供了一種允許制備用于在固體載體上測(cè)序的DNA片段的方法,方式是使用片段化DNA作為模板,并采用流體系統(tǒng)將測(cè)序銜接子添加到捕獲的DNA片段。作為概念驗(yàn)證,將Illumina下一代DNA測(cè)序儀用于開發(fā)這些方法。展示了從使用引物苔修飾和人基因組中的366個(gè)靶點(diǎn)進(jìn)行的集成捕獲和測(cè)序制備反應(yīng)中得到的結(jié)果。除了 25分鐘的熱片段化外,所有步驟都在11 Iumina流通池的固相載體上完成。下述數(shù)據(jù)證實(shí)了測(cè)定法的穩(wěn)健性以及通用引物苔和作為捕獲基底的流體系統(tǒng)的適用性。已鑒定了引物苔修飾的特有參數(shù),它們使得該方法能穩(wěn)健地實(shí)施。除了復(fù)雜的真核基因組外,該方法可應(yīng)用于捕獲微生物和其他生物體的基因組、病毒DNA和RNA、不同來(lái)源的轉(zhuǎn)錄組以及合成的DNA。此外,引入并驗(yàn)證了對(duì)固定在流體系統(tǒng)固體載體上的天然引物苔“編程”以及執(zhí)行特定應(yīng)用的概念。材料和方法基因組DNA樣品.從Coriell Institute獲得NA18507的基因組DNA。從結(jié)直腸癌患者獲得新鮮冷凍組織樣品?;颊卟牧显谥橥庀聫腟tanford Cancer Center獲得,研究得到了 Stanford University School of Medicine的機(jī)構(gòu)審查委員會(huì)(IRB)批準(zhǔn)。制作冷凍組織切片,執(zhí)行蘇木精-伊紅染色,并通過(guò)病理檢查測(cè)定了各樣品的腫瘤組成。分別從細(xì)胞組成為90%腫瘤或完全正常的區(qū)域解剖代表腫瘤和正常組織的樣品。使用E.Z.N.ASQ DNA/RNA蛋白質(zhì)共提取試劑盒(Omega Bio-Tek, Norcross, GA)提取基因組DNA。將DNA制備、陣列雜交和掃描的標(biāo)準(zhǔn)方案用于采用SNP6.0陣列(Affymetrix, Santa Clara, CA)分析樣品。使用Genotyping Console軟件和Birdseed V2算法(Affymetrix)進(jìn)行數(shù)據(jù)分析。與研究的樣品一起分析了十三個(gè)另外的微陣列數(shù)據(jù)集,以便評(píng)估SNP讀出(call)的質(zhì)量。使用0.01的P值閾值對(duì)SNP6.0陣列數(shù)據(jù)過(guò)濾。
靶標(biāo)篩選和電子(in silico) OS-Seq寡核苷酸設(shè)計(jì).將CCDS版本20090902、人基因組版本NCBI37 -hgl9和dbSNP版本ID131用作多態(tài)性參考數(shù)據(jù)集。對(duì)于基因篩選,將GeneRanker注釋數(shù)據(jù)庫(kù)用于按重要性優(yōu)先級(jí)選擇344個(gè)癌基因。為了找到寡核苷酸的靶標(biāo)特異性序列,從CCDS獲取候選基因的外顯子定義。對(duì)于最有祀向性的外顯子(小于500bp),40-mer靶標(biāo)特異性序列為外顯子邊際5’末端外部的10個(gè)堿基(圖3a)。使用個(gè)體引物-探針靶向外顯子的兩條鏈。OS-Seq-366只覆蓋外顯子的側(cè)翼。在OS-Seq-1lk測(cè)定法中,將大于500bp的外顯子通過(guò)拼接靶標(biāo)特異性序列直到覆蓋整個(gè)外顯子區(qū)域而進(jìn)行處理(圖3b)。為了改善OS-Seq-1lk的中祀(on-target)特異性,我們使用了 Repbase來(lái)鑒定和消除革巴向高重復(fù)性序列的寡核苷酸序列。寡核苷酸合成.將兩個(gè)策略應(yīng)用于寡核苷酸合成。對(duì)于0S-Seq-366,我們?cè)O(shè)計(jì)了 366個(gè)101-mer寡核昔酸(圖5a),然后進(jìn)行柱合成(Stanford Genome TechnologyCenter, Stanford, CA)(圖4a)。對(duì)寡核苷酸定量,并以等摩爾濃度混合。對(duì)于OS-Seq-llk,使用原位微陣列合成(LC Sciences, Houston)方法合成11,742個(gè)前體寡核苷酸(圖5b)。
靶標(biāo)特異性寡核苷酸的序列見下表2。
權(quán)利要求
1.一種捕獲和擴(kuò)增所選序列的方法,所述方法包括: a)獲得包含第一群表面結(jié)合寡核苷酸和第二群表面結(jié)合寡核苷酸的基底,其中所述第一和第二群表面結(jié)合寡核苷酸的成員不在所述基底上空間尋址; b)將所述第一群表面結(jié)合寡核苷酸的第一成員雜交到篩選寡核苷酸,所述篩選寡核苷酸包含與所述第一成員雜交的區(qū)域以及包含基因組序列的區(qū)域; c)延伸所述第一群表面結(jié)合寡核苷酸的所述第一成員以產(chǎn)生載體結(jié)合篩選引物,所述載體結(jié)合篩選引物包含與所述基因組序列互補(bǔ)的序列; d)將所述載體結(jié)合篩選引物雜交到包含所述基因組序列的核酸片段; e)延伸所述載體結(jié)合篩選引物以產(chǎn)生包含位于所述基因組序列側(cè)翼的序列的延伸產(chǎn)物; f)使用所述第一和第二群表面結(jié)合寡核苷酸的未延伸成員在所述基底上擴(kuò)增所述延伸產(chǎn)物,以產(chǎn)生PCR產(chǎn)物。
2.根據(jù)權(quán)利要求1所述的方法,其中所述核酸片段為包含5’末端銜接子的銜接子連接基因組片段,其中所述延伸產(chǎn)生在其3’末端包含與所述銜接子互補(bǔ)的序列的延伸產(chǎn)物,并且其中所述第二群所述表面結(jié)合寡核苷酸的成員在所述橋式PCR期間雜交到與所述銜接子互補(bǔ)的所述序列。
3.根據(jù)權(quán)利要求2所述的方法,其中所述5’末端銜接子包含在所述末端連接到所述基因組片段的測(cè)序引物的結(jié)合位點(diǎn)。
4.根據(jù)權(quán)利要求1所述的方法,其中所述方法在步驟e)與f)之間包括將銜接子連接到所述延伸引物的3’末端上,并且其中所述第二群表面結(jié)合寡核苷酸的成員在所述擴(kuò)增期間雜交到所述銜接子。
5.根據(jù)權(quán)利要求4所述的方法,其中所述銜接子包含在所述末端連接到所述核酸片段的測(cè)序引物的結(jié)合位點(diǎn)。
6.根據(jù)權(quán)利要求1所述的方法,其中所述第二群表面結(jié)合寡核苷酸通過(guò)以下方式制備: 1.將初始第二群表面結(jié)合寡核苷酸的成員雜交到一種寡核苷酸,所述寡核苷酸包含與所述第二群表面結(jié)合寡核苷酸的成員雜交的區(qū)域以及與所述核酸片段的序列互補(bǔ)的區(qū)域;以及 ii.延伸所述初始第二群表面結(jié)合寡核苷酸的所述成員以產(chǎn)生所述第二群表面結(jié)合寡核苷酸。
7.根據(jù)權(quán)利要求1所述的方法,其中所述篩選寡核苷酸包含介于與所述第一成員雜交的所述區(qū)域與包含所述基因組序列的所述區(qū)域之間的測(cè)序引物的結(jié)合位點(diǎn)。
8.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括對(duì)所述PCR產(chǎn)物的第一鏈測(cè)序,以獲得位于所述基因組序列側(cè)翼的所述序列的核苷酸序列的至少一部分。
9.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括對(duì)所述PCR產(chǎn)物的第二鏈測(cè)序,以獲得位于所述基因組序列側(cè)翼的所述序列的核苷酸序列的至少一部分。
10.根據(jù)權(quán)利要求1所述的方法,其中所述方法包括使哺乳動(dòng)物基因組片段化以產(chǎn)生片段化基因組,任選地將銜接子添加到所述片段化基因組,并將所述片段化基因組施加到所述基底。
11.根據(jù)權(quán)利要求10所述的方法,其中所述片段化以物理方式、化學(xué)方式或使用限制性酶完成。
12.根據(jù)權(quán)利要求11所述的方法,其中所述片段化通過(guò)聲波或剪切完成。
13.根據(jù)權(quán)利要求10所述的方法,其中所述雜交通過(guò)以下方式完成:從多個(gè)不同的個(gè)體制備多個(gè)片段化基因組,混合所述多個(gè)片段化基因組以產(chǎn)生庫(kù),將片段化基因組的所述庫(kù)施加到所述基底,以及獲得包含位于所述不同個(gè)體中的所述基因組序列側(cè)翼的序列的PCR產(chǎn)物。
14.根據(jù)權(quán)利要求13所述的方法,進(jìn)一步包括對(duì)所述PCR產(chǎn)物的至少第一鏈測(cè)序,以獲得位于所述不同個(gè)體中的所述基因組序列側(cè)翼的所述序列的核苷酸序列的至少一部分。
15.根據(jù)權(quán)利要求13所述的方法,其中,在混合前,將不同的銜接子連接到來(lái)自所述不同個(gè)體的所述片段化基因組,其中 所述銜接子包含條形碼序列,所述條形碼序列允許在對(duì)所述PCR產(chǎn)物測(cè)序后鑒定所述銜接子連接的基因組片段的來(lái)源。
16.根據(jù)權(quán)利要求15所述的方法,其中所述方法包括: 使用包含第一條形碼序列的第一銜接子用銜接子連接來(lái)自第一受試者的片段化基因組DNA以產(chǎn)生第一產(chǎn)物; 使用包含第二條形碼序列的第二銜接子用銜接子連接來(lái)自第二受試者的片段化基因組DNA以產(chǎn)生第二產(chǎn)物; 將所述第一和第二產(chǎn)物合并以產(chǎn)生混合模板;以及 使用所述混合模板執(zhí)行權(quán)利要求1所述的方法以提供各自包含所述條形碼序列的第一和第二 PCR產(chǎn)物。
17.根據(jù)權(quán)利要求16所述的方法,其中所述混合模板包含來(lái)自至少1,000個(gè)受試者的片段化基因組DNA。
18.根據(jù)權(quán)利要求1所述的方法,所述方法包括: 1.將所述核酸片段連接到包含測(cè)序引物的位點(diǎn)以及與所述第二表面結(jié)合寡核苷酸相同的核苷酸序列的銜接子, .將所述銜接子連接片段雜交到所述第一群表面結(jié)合寡核苷酸的第一成員, ii1.延伸所述銜接子連接片段所雜交到的所述第一群表面結(jié)合寡核苷酸的所述第一成員,以及 iv.將所述延伸產(chǎn)物的含所述銜接子的末端雜交到第二載體結(jié)合多核苷酸,從而產(chǎn)生橋并有利于橋式PCR。
19.根據(jù)權(quán)利要求1所述的方法,其中所述第二群表面結(jié)合寡核苷酸通過(guò)以下方式制備:將包含與所述核酸片段的序列互補(bǔ)的區(qū)域的寡核苷酸連接到初始第二群表面結(jié)合寡核苷酸,以產(chǎn)生所述第二群表面結(jié)合寡核苷酸。
20.根據(jù)權(quán)利要求1所述的方法,其中所述擴(kuò)增通過(guò)橋式PCR進(jìn)行。
21.根據(jù)權(quán)利要求1所述的方法,其中所述核酸片段為基因組片段或cDNA。
22.—種系統(tǒng),所述系統(tǒng)包含: a)包含第一群表面結(jié)合寡核苷酸和第二群表面結(jié)合寡核苷酸的基底,其中所述第一和第二群表面結(jié)合寡核苷酸不在所述基底上空間尋址; b)包含與所述第一群的第一成員雜交的區(qū)域以及含基因組序列的區(qū)域的篩選寡核苷酸;c)銜接子;以及e)執(zhí)行權(quán)利要求1所述的方 法的說(shuō)明。
全文摘要
某些實(shí)施方案提供用于捕獲基因組片段的方法。所述方法可以包括獲得包含第一群表面結(jié)合寡核苷酸和第二群表面結(jié)合寡核苷酸的基底;將所述第一群表面結(jié)合寡核苷酸的第一成員雜交到篩選寡核苷酸,所述篩選寡核苷酸包含與所述第一成員雜交的區(qū)域以及包含基因組序列的區(qū)域;延伸所述第一群表面結(jié)合寡核苷酸的所述第一成員以產(chǎn)生載體結(jié)合篩選引物,所述載體結(jié)合篩選引物包含與所述基因組序列互補(bǔ)的序列;將所述載體結(jié)合篩選引物雜交到包含所述基因組序列的核酸片段;延伸所述載體結(jié)合篩選引物以產(chǎn)生包含例如在基因組中位于所述基因組序列側(cè)翼的序列的延伸產(chǎn)物;以及在所述基底上擴(kuò)增所述延伸產(chǎn)物。
文檔編號(hào)C40B40/06GK103228798SQ201180056177
公開日2013年7月31日 申請(qǐng)日期2011年9月21日 優(yōu)先權(quán)日2010年9月24日
發(fā)明者S·梅利坎加斯, J·布恩洛斯特羅, H·P·基 申請(qǐng)人:斯坦福大學(xué)托管董事會(huì)