專利名稱:測(cè)定核苷酸序列信息的方法
技術(shù)領(lǐng)域:
本發(fā)明一般性地涉及檢測(cè)方法,更具體地,涉及檢測(cè)生物分子和對(duì)生物分子測(cè)序的方法。
背景技術(shù):
遺傳信息以組織成染色體的非常長的脫氧核糖核酸(DNA)分子的形式儲(chǔ)存。這些染色體包括形成人類基因組的大約30億個(gè)核苷酸。染色體中的核苷酸序列在決定每一個(gè)體的特征中發(fā)揮巨大作用。許多常見的疾病都至少部分地基于個(gè)體之間的人基因組核苷酸序列中的變異。
人類基因組整個(gè)序列的測(cè)定已經(jīng)為鑒定這些疾病的遺傳依據(jù)提供了基礎(chǔ)。然而,為了鑒定與每一種疾病相聯(lián)系的遺傳變異,仍有大量的實(shí)驗(yàn)工作需要去做。為了鑒定在DNA序列中促發(fā)疾病的特定變化,該實(shí)驗(yàn)要求對(duì)表現(xiàn)有每一種這樣的疾病的個(gè)體或家族的染色體部分進(jìn)行DNA測(cè)序。核糖核酸(RNA)是加工遺傳信息時(shí)所需要的中間分子,它也能被測(cè)序以確定各種疾病的遺傳基礎(chǔ)。
目前的測(cè)序方法要求制得感興趣的模板核酸的許多拷貝,把它們切為相互重疊的片段,并測(cè)序,之后再把相互重疊的DNA序列組合為完整的基因。這個(gè)過程費(fèi)力、昂貴、低效而且耗時(shí)。它也通常需要使用熒光或放射性標(biāo)記,這潛在地引起安全和廢物處理問題。因此,需要改進(jìn)的核酸測(cè)序方法,所述方法比現(xiàn)有方法成本更低,效率更高,更為安全。
要了解導(dǎo)致各種疾病的核苷酸序列變異需要檢測(cè)這些變異的技術(shù)。特別地,檢測(cè)核苷酸序列中的微妙變化的技術(shù)已經(jīng)變得更為重要,這部分地由于在鑒定多態(tài)性,特別是單核苷酸多態(tài)性(SNPS)中取得的最新科學(xué)進(jìn)展。而且,為了將遺傳發(fā)現(xiàn)轉(zhuǎn)化成精確的具有成本效率的遺傳測(cè)試,檢測(cè)核苷酸序列中的微妙變化的方法也已經(jīng)變得更為重要。因此,需要靈敏而簡(jiǎn)單的用于基因型定型(genotyping)的檢測(cè)方法,該方法能夠區(qū)分具有微妙差異的目標(biāo)分子。
現(xiàn)有的檢測(cè)核苷酸變異的方法,需要不同的探針用于區(qū)別目標(biāo)基因的各個(gè)等位基因;或在分析期間將探針用生物化學(xué)的方法修飾。這些方法費(fèi)時(shí)且成本昂貴。因此,需要用于實(shí)施基因型分析的簡(jiǎn)單、靈敏且低成本的方法。
圖1圖示說明了本發(fā)明的方法。
圖2說明了示范性的拉曼活性寡核苷酸探針的結(jié)構(gòu)。
圖3說明了示范性的生物芯片設(shè)計(jì)和使用生物芯片的示范性序列測(cè)定方法。
圖4A-4D提供了一系列的拉曼光譜和相應(yīng)的一系列寡核苷酸探針的寡核苷酸結(jié)構(gòu),這些寡核苷酸探針攜帶有帶正電的增強(qiáng)子或不攜帶增強(qiáng)子。該圖示出了由胺基團(tuán)增強(qiáng)子導(dǎo)致的拉曼發(fā)射強(qiáng)度的增強(qiáng)。
圖5A和5B說明了探針-目標(biāo)復(fù)合物的同步熒光掃描光譜的例子。圖5A圖示說明了包含F(xiàn)RET對(duì)560、570的標(biāo)記寡核苷酸探針510的核苷酸序列和探針位置,并說明了標(biāo)記寡核苷酸探針510與各目標(biāo)核酸520、530、540、550的比對(duì)。圖5B顯示了圖5A中的各雜交對(duì)產(chǎn)生的熒光光譜。
圖6說明了MEMS裝置,其通過使用AC場(chǎng)進(jìn)行探針-目標(biāo)復(fù)合物檢測(cè)。
發(fā)明詳述 本公開的方法部分地基于發(fā)現(xiàn)了將通過雜交的測(cè)序與拉曼光譜術(shù)結(jié)合起來的優(yōu)點(diǎn)。拉曼光譜術(shù)的優(yōu)點(diǎn)在于,大量的拉曼活性信號(hào)分子是已知的(參見例如“Standard Raman Spectra”(Sadtler Research Laboratories);“TRC spectral data.Ramnan”(Thermodynamics Research Center)),并且可以被用于對(duì)雜交測(cè)序探針進(jìn)行標(biāo)記。因?yàn)榭梢灾苽涑龃罅康睦钚孕盘?hào)分子,所以基于各個(gè)分子的信號(hào)特征進(jìn)行測(cè)序便成為可能。此外,本公開的方法部分地基于發(fā)明了新穎的拉曼增強(qiáng)子(enhancer),該拉曼增強(qiáng)子使得檢測(cè)在其他情況下拉曼光譜術(shù)無法檢測(cè)的或產(chǎn)生強(qiáng)度非常低的拉曼發(fā)射的寡核苷酸成為可能。
本發(fā)明提供的核酸測(cè)序方法以及鑒定目標(biāo)核酸位置上的核苷酸發(fā)生(nucleotide occurrence)的方法,可以比傳統(tǒng)測(cè)序方法更快速地實(shí)施,這是因?yàn)樗鼈儼吮葌鹘y(tǒng)方法更少的若干反應(yīng)步驟,以及因?yàn)樗鼈兛梢砸愿叨绕叫械姆绞皆谖⒚谆蚣{米級(jí)水平進(jìn)行。因此,可以在相對(duì)短的時(shí)間里,獲得相對(duì)大量的序列信息。此外,本文中公開的方法成本低,因?yàn)樗鼈兠馊チ税嘿F的試劑,而這些昂貴的試劑用于使用傳統(tǒng)方法進(jìn)行的目標(biāo)分子擴(kuò)增和化學(xué)標(biāo)記。
因此,在一個(gè)實(shí)施方案中,提供了核酸測(cè)序方法,該方法基于在利用雜交反應(yīng)進(jìn)行的測(cè)序中檢測(cè)寡核苷酸探針的拉曼信號(hào)。用拉曼標(biāo)記進(jìn)行標(biāo)記的各個(gè)被捕獲的核酸探針的拉曼信號(hào)被檢測(cè)。被捕獲的探針的序列被用來鑒定被捕獲的探針和互補(bǔ)目標(biāo)核酸的核苷酸序列,它們?nèi)缓筮M(jìn)行比對(duì)(align),并用來獲得核酸序列信息。該方法可以被用于例如大規(guī)模的基因組測(cè)序、檢測(cè)單核苷酸多態(tài)性(SNPs)中的核苷酸發(fā)生、序列比較、基因型定型、疾病關(guān)聯(lián)(disease correlation)和藥物開發(fā)。
在另一實(shí)施方案中,提供了測(cè)定目標(biāo)核酸的核苷酸序列的方法,其包括將核酸或其片段與結(jié)合到基質(zhì)一系列點(diǎn)位置上的一群捕獲寡核苷酸探針接觸,以形成包含單鏈伸出端(overhangs)的探針-目標(biāo)雙鏈體多核苷酸;將探針-目標(biāo)雙鏈體核酸與一群拉曼活性寡核苷酸探針接觸,以允許拉曼活性寡核苷酸探針結(jié)合到單鏈伸出端,其中每一拉曼活性寡核苷酸探針產(chǎn)生不同的拉曼信號(hào),并使用拉曼光譜術(shù)檢測(cè)結(jié)合模板核酸的拉曼活性寡核苷酸探針;從而確定所述目標(biāo)核酸的核苷酸序列。而且,每一被捕獲的拉曼活性寡核苷酸探針的點(diǎn)位置可以被鑒定,并用于確定目標(biāo)核酸的核苷酸序列。
本發(fā)明的這些實(shí)施方案的方法在本文中有時(shí)稱為雜交測(cè)序方法(sequencingby hybridization methods)。如圖1所示,通常有兩類探針被用于本實(shí)施方案的方法,用于探查目標(biāo)核酸分子或其片段10,這兩類探針是a)固定在基質(zhì)20諸如生物芯片上的探針(即捕獲寡核苷酸探針20);和b)拉曼活性寡核苷酸探針40。如在本文中更詳細(xì)描述的,捕獲探針20是具有已知的核苷酸序列的核酸分子。這些探針用標(biāo)準(zhǔn)的化學(xué)方法合成,并且不要求進(jìn)行標(biāo)記。它們通常以它們的5′端或3′端,固定在固體表面30上。標(biāo)準(zhǔn)的化學(xué)交聯(lián)技術(shù)可以被用于探針固定,諸如硫醇-金連接(thiol-gold linkage)或胺-醛連接(amine-aldehyde linkage),參見在本文中更詳細(xì)的描述。
拉曼活性寡核苷酸探針40包括具有已知的核苷酸序列的合成的核酸,并且可選地,包括一個(gè)或多個(gè)拉曼標(biāo)記45或一個(gè)或多個(gè)帶正電荷的增強(qiáng)子。如本文中更加詳細(xì)描述的,拉曼標(biāo)記45是具有可檢測(cè)的和獨(dú)特的拉曼信號(hào)特征的化學(xué)化合物。它們可以共價(jià)地被連接到核酸序列。增強(qiáng)子是刺激寡核苷酸的拉曼活性的化合物或化合物的一部分。
當(dāng)拉曼活性寡核苷酸探針40通過目標(biāo)序列依賴型反應(yīng)捕獲在表面30上時(shí),通過檢測(cè)相應(yīng)的拉曼標(biāo)記的存在來確定拉曼活性寡核苷酸探針的互補(bǔ)序列的存在(圖2)。捕獲步驟是一個(gè)固定過程,其可以通過序列特異性雜交或連接完成。如果目標(biāo)序列的互補(bǔ)并沒有在目標(biāo)核酸上發(fā)生,那么該目標(biāo)核酸以及拉曼活性寡核苷酸探針便不被固定住。
如上所述,本文中提供了一群拉曼活性寡核苷酸探針。每一拉曼活性寡核苷酸探針能夠產(chǎn)生可檢測(cè)的拉曼信號(hào)。這群拉曼活性寡核苷酸探針中至少一些寡核苷酸探針的拉曼信號(hào)可以固有地產(chǎn)生。當(dāng)可檢測(cè)的拉曼信號(hào)從沒有共價(jià)連接有標(biāo)記或帶正電荷的增強(qiáng)子的寡核苷酸檢測(cè)到時(shí),寡核苷酸便是“固有地產(chǎn)生”拉曼信號(hào)。寡核苷酸是否固有地產(chǎn)生拉曼信號(hào),將取決于用于檢測(cè)信號(hào)的拉曼檢測(cè)儀的靈敏性。如在本文實(shí)施例中描述,包括嘌呤殘基,特別是腺苷殘基和腺苷衍生物,諸如8-氮雜-腺嘌呤或二甲基-烯丙基-氨基-腺嘌呤的寡核苷酸更可能固有地產(chǎn)生可檢測(cè)的拉曼信號(hào)。
在一些方面,不固有地產(chǎn)生拉曼信號(hào)或產(chǎn)生微弱的拉曼信號(hào)的寡核苷酸,被共價(jià)地結(jié)合到帶正電荷的增強(qiáng)子。因此,本文公開的是寡核苷酸群,它們中的至少一些被共價(jià)地連接到帶正電荷的增強(qiáng)子。如在本文實(shí)施例中說明的,例如,具有高百分比的嘧啶核苷酸的寡核苷酸可能具有微弱的或檢測(cè)不到的固有拉曼活性。這些寡核苷酸可以共價(jià)地連接到帶正電荷的基團(tuán)上,以產(chǎn)生可檢測(cè)的拉曼信號(hào),或增強(qiáng)由寡核苷酸產(chǎn)生的固有信號(hào),如本文實(shí)施例所示。不受理論限制,認(rèn)為,帶正電荷的基團(tuán)增加了寡核苷酸與SERS表面之間的締合和定向??蛇x擇地,富含嘧啶的寡核苷酸可以完全或部分地雜交到富含腺苷的寡核苷酸上,以獲得增強(qiáng)的拉曼信號(hào)。
例如,含有少于5、4、3、2或1個(gè)嘌呤殘基的寡核苷酸可以共價(jià)地結(jié)合到帶正電荷的增強(qiáng)子或與富含嘌呤或腺苷的寡核苷酸雜交。在其他實(shí)施例中,含有少于5、4、3、2或1個(gè)腺苷殘基的寡核苷酸被共價(jià)地結(jié)合到本發(fā)明帶正電荷的增強(qiáng)子,或與富含嘌呤或腺苷的寡核苷酸雜交。
因此,在另一實(shí)施方案中,提供了檢測(cè)核酸的方法,其包括用光照射核酸,其中所述核酸包括帶正電荷的增強(qiáng)子;和檢測(cè)由被照射的核酸產(chǎn)生的拉曼信號(hào)。在某些方面,帶正電荷的增強(qiáng)子是胺基團(tuán)。在某些方面,在不存在帶正電荷的增強(qiáng)子時(shí),核酸不產(chǎn)生可檢測(cè)到的信號(hào)。在某些方面,核酸由少于5、4、3、2或1個(gè)的嘌呤殘基組成,和/或少于10%、5%或1%的嘌呤殘基組成。在某些方面,核酸不含有嘌呤殘基。
本發(fā)明帶正電荷的增強(qiáng)子包括任何帶正電荷的基團(tuán),其可以被連接到寡核苷酸上,而不會(huì)阻礙寡核苷酸與互補(bǔ)序列的結(jié)合。一般地,含有雜原子(即N、O、S、P)的任何基團(tuán)可以攜帶正電荷。例如,攜帶正電荷的胺變成銨基團(tuán),羥基(-OH)變成水合氫離子,硫醇(-SH)變成SH2+。將這些帶正電荷的增強(qiáng)子部分連接到寡核苷酸上的方法容易獲得。在一個(gè)非限制性實(shí)施例中,增強(qiáng)子可以是攜帶有1、2、3、4、5、6、7、8、9、10、15、20或25個(gè)碳原子的烷基或芳基鏈的伯胺。帶正電荷的基團(tuán)可以連接到含有修飾的堿基或間隔物(spacer)的寡核苷酸上的任何活性基團(tuán)。將間隔物引入到攜帶有活性氨基基團(tuán)的寡核苷酸是商業(yè)上可獲得的(即,Qiagen-Operon)。修飾的堿基可以是含胺堿基,諸如8-氮雜-腺嘌呤、玉米素、激動(dòng)素、N6-苯甲酰腺嘌呤、4 pyridine carboxal doxime、二甲基-烯丙基-氨基-腺嘌呤;修飾的堿基也可以是含硫醇的堿基,諸如4-氨基-6-巰基吡唑并[3,4-d]嘧啶、2巰基-苯并咪唑、8-巰基腺嘌呤、6-巰基嘌呤。通過活性胺基團(tuán)或硫醇基團(tuán)進(jìn)行化學(xué)連接,所有這些堿基都可以進(jìn)一步進(jìn)行修飾,以擁有陽性基團(tuán)。所有化合物都可以從化學(xué)商家(Sigma-Aldrich,St.Louis,MO)獲得。將活性基團(tuán)轉(zhuǎn)化為陽性基團(tuán)的化學(xué)方法是本領(lǐng)域已知的。而且,如在本文實(shí)施例中說明的,帶正電荷的增強(qiáng)子可以連接在寡核苷酸內(nèi)或寡核苷酸的5′或3′端。將被理解的是,帶正電荷的基團(tuán)可以用任何合適的方法連接。
帶正電荷的基團(tuán)可以帶單個(gè)正電荷或帶多個(gè)正電荷。在某些方面,帶正電荷的基因是氨基(或銨)基團(tuán),例如季銨標(biāo)記物(參見例如美國專利6,268,129)。適當(dāng)?shù)?,通過5′-NH2連接或通過將含有脂族NH2基團(tuán)的堿基連接到寡核苷酸的3′端,氨基(或銨)基團(tuán)被加入到合成的寡核苷酸中,其中例如使用末端轉(zhuǎn)移酶或在Sanger鏈終止程序(Sanger chain termination protocol)中直接使用具有脂族NH2基團(tuán)的終止堿基,通過所述NH2基團(tuán),帶正電荷的基團(tuán)可以被加入。然后將帶正電荷的基因(其優(yōu)選是含季銨的化合物)連接到核酸中的脂族-NH2基團(tuán)上。為了方便,含季銨的化合物包括與脂族-NH2基團(tuán)反應(yīng)的羥基琥珀酰亞胺酯。該化合物可以是例如三甲基銨己酰-N-羥基琥珀酰亞胺酯(C5-NHS)。
在某些方面,所述拉曼活性寡核苷酸探針群中的每一個(gè)都包括拉曼標(biāo)記。各種拉曼標(biāo)記是本領(lǐng)域已知的,并可以用于本發(fā)明,只要它們能被連接到寡核苷酸,并且它們不抑制寡核苷酸與互補(bǔ)序列雜交。
可被連接到本文中公開的寡核苷酸探針的拉曼標(biāo)記——在本文中也稱為拉曼信號(hào)分子——的非限制性例子包括TRIT(四甲基羅丹明異硫醇)、NBD(7-硝基苯-2-氧雜-1,3-二唑)、德克薩斯紅染料、鄰苯二甲酸、對(duì)苯二甲酸、間苯二甲酸、甲酚固紫、甲酚藍(lán)紫、亮甲酚藍(lán)、對(duì)氨基苯甲酸、藻紅、生物素、地高辛、5-羧基-4′,5′-二氯-2′,7′-二甲氧基熒光素、TET(6-羧基-2′,4,7,7′-四氯熒光素)、HEX(6-羧基-2′,4,4′,5′,7,7′-六氯熒光素)、Joe(6-羧基-4′,5′-二氯-2′,7′-二甲氧基熒光素)5-羧基-2′,4′,5′,7′-四氯熒光素、5-羧基熒光素、5-羧基羅丹明、Tamra(四甲基羅丹明)、6-羧基羅丹明、Rox(羧基-X-羅丹明)、R6G(羅丹明6G)、酞菁、偶氮甲堿(azomethine)、花菁(例如Cy3、Cy3.5、Cy5)、黃嘌呤、琥珀酰熒光素、N,N-二乙基-4-(5’-偶氮苯并三唑)-苯胺以及氨基吖啶。此外,拉曼活性標(biāo)記包括那些已被鑒定用于基因探針的標(biāo)記(參見Graham等,Chem.Phys.Chem.,2001;Isola等,Anal.Chem.,1998)。在一個(gè)方面,拉曼活性標(biāo)記包括那些在Kneipp等,Chem.Reviews 99,2957(1999)中公開的標(biāo)記。這些和其他拉曼標(biāo)記可以從商業(yè)來源獲得(例如,Molecular Probes,Eugene,OR)。
在某些方面,拉曼活性標(biāo)記包括復(fù)合有機(jī)-無機(jī)納米顆粒(參見美國專利申請(qǐng)?zhí)枺撸?,?003年12月29日提交,名稱為“Composite Organic-InorganicNanoparticles”(本文中稱為COIN納米顆?;颉錍OINs″))。在這些方面,捕獲寡核苷酸探針和拉曼活性寡核苷酸探針的其中之一或兩者與COIN納米顆粒締合,并使用SERS檢測(cè)。
COINs是包括核心和表面的拉曼活性探針構(gòu)建物,其中核心包括包含第一種金屬和拉曼活性有機(jī)化合物的金屬膠體。COIN還可以包括不同于第一種金屬的第二種金屬,其中第二種金屬形成覆蓋納米顆粒表面的層。COINs還可以包括覆蓋該金屬層的有機(jī)層,該有機(jī)層包括探針。對(duì)于該實(shí)施方案,用于連接到SERS活性納米顆粒表面的合適的探針包括但是不限于,抗體、抗原、多核苷酸、寡核苷酸、受體、配體和類似物。然而,對(duì)于這些實(shí)施方案,COIN典型地被連接到寡核苷酸探針上。
用于獲得合適的SERS信號(hào)的金屬在COIN中是固有的,且各種拉曼活性有機(jī)化合物可以被摻入到該顆粒中。事實(shí)上,通過利用含有具有不同結(jié)構(gòu)、混合物和比例的拉曼活性有機(jī)化合物的納米顆粒,可以產(chǎn)生大量獨(dú)特的拉曼信號(hào)特征。因此,本文中描述的利用COINs的方法可以用于同時(shí)測(cè)定一個(gè)以上的,通常多于10個(gè)目標(biāo)核酸的核苷酸序列信息。此外,因?yàn)樵S多COINs可以被摻入到單個(gè)COIN珠納米顆粒,單個(gè)COIN顆粒的SERS信號(hào)比獲自不含有在此描述的納米顆粒的拉曼活性物質(zhì)的SERS信號(hào)強(qiáng)。相比起不利用COINs的拉曼技術(shù),這里的情況導(dǎo)致了增加的靈敏性。
使用標(biāo)準(zhǔn)的金屬膠體化學(xué)方法,容易制備用于本發(fā)明方法的COINs。COINs的制備也利用了金屬吸附有機(jī)化合物的能力。事實(shí)上,因?yàn)槔钚杂袡C(jī)化合物在金屬膠體形成期間被吸附到金屬上,許多拉曼活性有機(jī)化合物可以被摻入到COIN,無需特殊的連接化學(xué)方法。
一般地,用于本發(fā)明方法的COINs按如下方法制備。制備含有下述物質(zhì)的含水溶液合適的金屬陽離子、還原試劑和至少一種合適的拉曼活性有機(jī)化合物。然后將溶液的組分置于將金屬陽離子還原形成中性膠體金屬顆粒的條件中。因?yàn)榻饘倌z體的形成在合適的拉曼活性有機(jī)化合物存在下發(fā)生,在膠體形成期間拉曼活性有機(jī)化合物容易被吸附到金屬上。該簡(jiǎn)單類型的COIN被稱為類型I COIN。類型I COIN通??梢杂媚み^濾分離。此外,具有不同尺寸的COIN可以通過離心富集。
在可選擇的實(shí)施方案中,COINs可以包括不同于第一種金屬的第二種金屬,其中所述第二金屬形成覆蓋于納米顆粒表面的層。為了制備該類型的SERS活性納米顆粒,將類型I COINs置于含有合適的第二金屬陽離子和還原劑的含水溶液中。然后將該溶液的組分置于還原第二金屬陽離子的條件中,以形成覆蓋于納米顆粒表面的金屬層。在某些實(shí)施方案中,第二金屬層包括金屬,諸如銀、金、鉑、鋁和類似物。該類型的COIN稱為類型II COINs。類型II COINs可以用與類型I COINs相同的方式分離和/或富集。典型地,類型I和類型II COINs基本上是球形的,尺寸在約20nm至60nm范圍內(nèi)。相對(duì)于在檢測(cè)期間被用于照射COINs的光的波長,所選擇的納米顆粒尺寸將非常小。
典型地,通過將有機(jī)化合物共價(jià)連接到金屬層的表面,將有機(jī)化合物諸如寡核苷酸連接到類型II COINs中第二金屬的層上。將有機(jī)層共價(jià)連接到金屬層上可以用本領(lǐng)域技術(shù)人員熟知的許多方法完成,諸如例如通過硫醇-金屬鍵。在可選擇的實(shí)施方案中,被連接到金屬層的有機(jī)分子可以被交聯(lián),以形成分子網(wǎng)絡(luò)。
用于本發(fā)明方法的COIN可以包括含有磁性物質(zhì)的核心,磁性物質(zhì)諸如鐵氧化物和類似物。磁性COINs可用常用的磁性顆粒處理系統(tǒng)處理,無需離心。事實(shí)上,磁性可以用作分離連接到磁性COIN顆粒的生物目標(biāo)的手段,所述磁性COIN顆粒用特定的生物探針標(biāo)記。
另一類型的拉曼標(biāo)記是多環(huán)芳香族化合物??梢允褂玫钠渌麡?biāo)記包括氰化物、硫醇、氯、溴、甲基、磷和硫。在某些實(shí)施方式中,碳納米管可用作拉曼標(biāo)記。標(biāo)記在拉曼光譜術(shù)中的應(yīng)用是已知的(例如美國專利5,306,403和6,174,677)。
拉曼活性標(biāo)記可以直接連接到探針,或可以通過各種連接化合物連接。被共價(jià)連接到拉曼標(biāo)記的核苷酸可從標(biāo)準(zhǔn)商業(yè)來源獲得(例如Roche MolecularBiochemicals,IN;Promega,Corp.,Madison,WI;Ambion,Inc.,Austis,TX;AmershanPharmacia Biotech,Piscataway,NJ)。含有活性基團(tuán)的拉曼標(biāo)記可以通過商業(yè)渠道獲得(例如Molecular Probes,Eugene,OR),所述活性基團(tuán)被設(shè)計(jì)成與其他分子諸如核苷酸或氨基酸共價(jià)反應(yīng)。
在某些方面,在用SERS檢測(cè)之前,將拉曼標(biāo)記沉積在SERS基質(zhì)上。將拉曼信號(hào)分子沉積在基質(zhì)上的方法是本領(lǐng)域已知的。檢測(cè)手段或檢測(cè)裝置可以被設(shè)計(jì)為通過拉曼光譜術(shù)檢測(cè)和/或量化核苷酸。用拉曼光譜術(shù)檢測(cè)核苷酸的各種方法為本領(lǐng)域已知。(參見,例如美國專利5,306,403;6,002,471;6,174,677)。然而,在單個(gè)分子水平上進(jìn)行的標(biāo)記或未標(biāo)記的核苷酸的拉曼檢測(cè)先前并沒有展示過。已經(jīng)公開了表面增強(qiáng)拉曼光譜術(shù)(SERS)或表面增強(qiáng)共振拉曼光譜術(shù)(surfaceenhanced resonance Raman spectroscopy,SERRS)的各種變化。在SERS和SERRS中,對(duì)于吸附在粗糙的金屬表面諸如銀、金、鉑、銅或鋁表面上的分子,拉曼檢測(cè)的靈敏度被增強(qiáng)的系數(shù)為106或更多。
檢測(cè)手段或檢測(cè)單元的非限制性的例子在美國專利6,002,471中公開。在該實(shí)施方案中,激發(fā)光束由釹:釔鋁石榴石(Nd:YAG)激光器產(chǎn)生,波長為532nm;或者由鈦:藍(lán)寶石(Ti:sapphire)激光器產(chǎn)生,波長為365nm。可以使用脈沖激光束或連續(xù)激光束。激發(fā)光束通過共聚焦光學(xué)元件和顯微物鏡,并聚焦在反應(yīng)室上。來自核苷酸的拉曼發(fā)射光由顯微物鏡和共聚焦光學(xué)元件收集,然后連到單色儀上進(jìn)行光譜分離。共聚焦光學(xué)元件用于降低背景信號(hào),包括雙色濾片、二次濾片、共聚焦孔、透鏡和平面鏡的組合。標(biāo)準(zhǔn)的全視場(chǎng)光學(xué)元件可以同共聚焦光學(xué)元件一起使用。拉曼發(fā)射信號(hào)由拉曼檢測(cè)器檢測(cè)。檢測(cè)器包括與用于信號(hào)計(jì)數(shù)和數(shù)字化的計(jì)算機(jī)相連接的雪崩光電二極管。在某些實(shí)施方案中,包括銀、金、鉑、銅或鋁的網(wǎng)格可以包含在反應(yīng)室或通道中,以提供增強(qiáng)的信號(hào),這是由于表面增強(qiáng)拉曼或表面增強(qiáng)拉曼共振的緣故??蛇x擇地,可以包括含有拉曼活性金屬的納米顆粒。
檢測(cè)手段或檢測(cè)單元的可供選擇的實(shí)施方式公開在例如美國專利5,306,403中,其包括Spex Model 1403雙柵分光光度計(jì),并配有砷化鎵光電倍增管(RCAModel C31034或Burle Industries Model C3103402),它以單光子計(jì)數(shù)模式運(yùn)作。激發(fā)源是來自SpectraPhysics的514.5nm線氬離子激光器,Model 166和氪離子激光器(Innova 70,Coherent)的647.1nm線。
可選擇的激發(fā)源包括337nm的氮激光器(Laser Science Inc.)和325nm的氦-鎘激光器(Liconox)(美國專利6,174,677)。激發(fā)光束可以用帶通濾波器(Corion)進(jìn)行光譜純化,并可以用6X物鏡(Newport,Model L6X)聚焦到反應(yīng)室??梢杂梦镧R來激發(fā)核苷酸和收集拉曼信號(hào),其中使用全息光束分離器(KaiserOptical Systems,Inc.,Model HB 647-26N18),以產(chǎn)生激發(fā)光束和發(fā)射的拉曼信號(hào)的直角幾何關(guān)系??梢允褂萌⑾莶V波器(Kaiser Optical Systems,Inc.)來減少瑞利散射??蛇x擇的拉曼檢測(cè)器包括ISA HR-320攝譜儀,其裝配有紅增強(qiáng)放大電荷耦合器件(RE-ICCD)檢測(cè)系統(tǒng)(Princeton Instruments)??梢允褂闷渌愋偷臋z測(cè)器,如電荷注入器件、光電二極管陣列或光電晶體管陣列。
本領(lǐng)域已知的任何適當(dāng)形式或構(gòu)造的拉曼光譜術(shù)或相關(guān)技術(shù)都可以用來檢測(cè)核苷酸,包括但不限于常規(guī)拉曼散射、共振拉曼散射(resonance Ramanscattering)、表面增強(qiáng)拉曼散射(surface enhanced Raman scattering)、表面增強(qiáng)共振拉曼散射(surface enhanced resonance Raman scattering)、相干反斯托克斯拉曼光譜術(shù)(CARS)、受激拉曼散射(stimulated Raman scattering)、反拉曼光譜術(shù)(inverseRaman spectroscopy)、受激增益拉曼光譜術(shù)(stimulated gain Raman spectroscopy)、超拉曼散射(hyper-Raman scattering)、分子光學(xué)激光檢測(cè)器(molecular optical laserexaminer,MOLE)或拉曼顯微探針(Raman microprobe)或拉曼顯微鏡(Ramanmicroscopy)或共聚焦拉曼微光譜測(cè)定法(confocal Raman microspectrometry)、三維或掃描拉曼(three-dimensional or scanning Raman)、拉曼飽和光譜術(shù)(Ramansaturation spectroscopy)、時(shí)間分辨共振拉曼(time resolved resonance Raman)、拉曼退耦光譜術(shù)(Raman decoupling spectroscopy)或紫外-拉曼顯微術(shù)(UV-Ramanmicroscopy)。
拉曼標(biāo)記可以在寡核苷酸探針合成之前摻入到核苷酸中。例如,考慮用于在腺嘌呤(A)和鳥嘌呤(G)位置上進(jìn)行共價(jià)連接的內(nèi)部氨基修飾。內(nèi)部連接也可以在胸腺嘧啶(T)位置,使用商業(yè)上可獲得的亞磷酰胺實(shí)施。在一些實(shí)施方案中,在A和G位置具有丙胺連接物的文庫片段可以被用于將信號(hào)分子連接到編碼探針上。內(nèi)部氨烷基尾的引入使得能在合成后連接信號(hào)分子。連接物可以從商家諸如Synthetic Genetics(San Diego,CA)購得。在本發(fā)明的一個(gè)實(shí)施方案中,也可以考慮使用信號(hào)分子的合適的亞磷酰胺衍生物進(jìn)行的自動(dòng)偶聯(lián)。此類信號(hào)分子可以在寡核苷酸合成期間被偶聯(lián)到5′-末端。
一般地,拉曼標(biāo)記將以使信號(hào)分子的空間位阻最小化的方式,共價(jià)連接到探針上,以便有助于編碼的探針結(jié)合到目標(biāo)分子,諸如與核酸雜交??梢允褂觅x予編碼探針一定程度柔性的連接物。同質(zhì)或異質(zhì)雙功能連接物可以從各種商業(yè)來源獲得。
與寡核苷酸堿基的連接點(diǎn)可以隨堿基而變化。盡管可能在任何位置上連接,在某些實(shí)施方案中,發(fā)生連接的位置不涉及到與互補(bǔ)堿基形成的氫鍵。因此,例如,連接可以是連接到嘧啶諸如尿嘧啶、胞嘧啶和胸腺嘧啶的位置5或6上。對(duì)于嘌呤諸如腺嘌呤和鳥嘌呤,連接可以通過位置8進(jìn)行。
使用本實(shí)施方案中提供的方法測(cè)定的目標(biāo)核酸核酸序列的范圍從在目標(biāo)核苷酸位置的單核苷酸發(fā)生至目標(biāo)核酸的完整序列。在某些方面,目標(biāo)位置是單核苷酸多態(tài)性位置。
可選擇地,可以測(cè)定目標(biāo)核酸的目標(biāo)片段的連續(xù)位置上的一系列核苷酸發(fā)生。目標(biāo)片段例如可以小于或等于所述捕獲寡核苷酸探針和拉曼活性寡核苷酸探針的組合長度。例如,如果使用10個(gè)核苷酸的捕獲探針和20個(gè)核苷酸的拉曼活性寡核苷酸探針,那么目標(biāo)片段可以是30個(gè)核苷酸或更少。作為另一非限制性例子,目標(biāo)片段可以小于或等于拉曼活性寡核苷酸探針的長度。因此,例如,如果拉曼活性寡核苷酸探針為10-mer,那么目標(biāo)片段可以是10個(gè)堿基或更少。
在一些方面,測(cè)定整個(gè)目標(biāo)核酸的核苷酸序列。這典型地通過使用本領(lǐng)域已知的方法比對(duì)被檢測(cè)的目標(biāo)序列來完成。目標(biāo)序列例如可以是重疊序列,以加速比對(duì)過程。在一些方面,分別分析目標(biāo)核酸序列的片段,然后將來自這些獨(dú)立的分析的數(shù)據(jù)組合起來,以確定整個(gè)目標(biāo)核酸分子的核苷酸序列。使用已知的方法諸如內(nèi)切核酸酶切割可以獲得目標(biāo)核酸分子的片段。此外,目標(biāo)核酸或其片段作為單鏈核酸典型地被用于雜交測(cè)序方法中,如將被理解的。例如,目標(biāo)核酸分子可以在它與探針接觸之前被變性。
通過拉曼掃描獲得拉曼活性寡核苷酸探針的拉曼信號(hào)特征。例如,可以使用表面增強(qiáng)拉曼光譜術(shù)(SERS)。SERS拉曼掃描通常在微米或納米水平實(shí)施。典型地,記錄下各個(gè)拉曼探針的拉曼光譜。
如上所述,以及如圖2所示,拉曼活性寡核苷酸探針40包括具有已知序列的寡核苷酸探針55,以及可選地,包括序列特異性拉曼標(biāo)記45(在本文中也稱為拉曼標(biāo)簽(tag))或帶正電荷的增強(qiáng)子60。固定化的探針復(fù)合物70在本實(shí)施方案的方法中形成,該復(fù)合物包括捕獲寡核苷酸探針20、結(jié)合的目標(biāo)分子10,和結(jié)合的拉曼活性寡核苷酸探針40。如圖2所示,銀膠體或其他納米顆??梢耘c寡核苷酸和/或拉曼標(biāo)記在存在單價(jià)鹽的條件下聚集,形成由拉曼光譜術(shù)檢測(cè)的銀膠體-拉曼標(biāo)記復(fù)合物80。所述金屬膠體可以預(yù)先制備或原位合成。
拉曼活性探針分子的SERS掃描提供了高度靈敏的檢測(cè)方法。事實(shí)上,已經(jīng)報(bào)道單個(gè)核苷酸可以用SERS檢測(cè)。通過對(duì)核苷酸的化學(xué)修飾,諸如通過連接帶正電荷的增強(qiáng)子,可以獲得更高的拉曼活性。因此,比起傳統(tǒng)方法,需要更少拷貝的目標(biāo)核酸和捕獲寡核苷酸探針用于檢測(cè)。因此,少至1000或更少、500或更少、250或更少、125或更少、100或更少、50或更少、25或更少、20或更少、15或更少、10、9、8、7、6、5、4、3、2或1個(gè)分子的拉曼活性寡核苷酸探針被檢測(cè)。
拉曼特征被翻譯成對(duì)應(yīng)于探針的核酸子序列(sub-sequences)。在某些方面,捕獲寡核苷酸探針的核苷酸序列由它們?cè)诨|(zhì)上的位置決定,而拉曼活性寡核苷酸探針的序列通過拉曼信號(hào)特征確定,在一些實(shí)例中也通過它們?cè)诨|(zhì)上的位置確定。因此,典型地,目標(biāo)核酸或其片段(即子序列)的序列通過捕獲探針序列和拉曼活性寡核苷酸探針序列確定。目標(biāo)分子的完整序列可以通過比對(duì)核酸子序列推斷得到。
鑒定雜交核苷酸來解碼序列信息的方法是本領(lǐng)域已知的。例如,本文所包括的涉及雜交測(cè)序的引用文獻(xiàn)提供了解碼多核苷酸序列信息更為詳細(xì)的方法,所述解碼是基于通過雜交結(jié)果進(jìn)行的測(cè)序。從多份納米顆粒讀取收集到的數(shù)據(jù)被用于確定多核苷酸序列,這基于序列比對(duì)原則(參見例如Laser Gene program(DNAStar,Mountain View,CA)。生物信息公司和政府機(jī)構(gòu)提供了用于數(shù)據(jù)處理以測(cè)定DNA序列的必要工具、服務(wù)和其他相關(guān)的工具。
如上所述,典型地,兩群探針被包括在通過雜交來測(cè)序的方法中,該方法使用了拉曼光譜術(shù),如本文中所公開的。標(biāo)記的寡核苷酸探針群在本文中也稱為“標(biāo)記寡核苷酸文庫”。標(biāo)記寡核苷酸群通常是包括已知的核苷酸序列部分——也稱為探針部分——的雜交探針。寡核苷酸探針群包括捕獲寡核苷酸探針群和拉曼活性寡核苷酸探針群。
在某些方面,探針群尤其是拉曼活性寡核苷酸探針群,包括具有對(duì)應(yīng)于每一種可能的置換的核苷酸序列的寡核苷酸,所述可能置換的長度小于或等于寡核苷酸的長度。典型地,群中的所有核苷酸具有相同的長度。例如,在某些方面,寡核苷酸長度等于或小于250個(gè)核苷酸、200個(gè)核苷酸、100個(gè)核苷酸、50個(gè)核苷酸、25個(gè)核苷酸、20個(gè)核苷酸、15個(gè)核苷酸、10個(gè)核苷酸、9個(gè)核苷酸、8個(gè)核苷酸、7個(gè)核苷酸、6個(gè)核苷酸、5個(gè)核苷酸、4個(gè)核苷酸或3個(gè)核苷酸。例如,但不是限制性的,寡核苷酸長度為2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、200或250個(gè)核苷酸。例如,標(biāo)記的探針群包括在2至50個(gè)核苷酸之間的長度相同的探針,或例如3至25個(gè)核苷酸之間的長度相同的探針。例如,標(biāo)記的寡核苷酸探針群可以包括長度為3個(gè)核苷酸的所有可能的寡核苷酸探針。
在某些方面,標(biāo)記的寡核苷酸群包括至少10、20、30、40、50、100、200、250、500、1000、10,000個(gè)或更多的寡核苷酸。例如,該群可以包括具有相同長度的寡核苷酸的基本上所有或所有可能的核苷酸序列組合,如對(duì)于至少一些雜交測(cè)序反應(yīng)所知道的(參見美國專利5,002,867)。對(duì)于給定的長度,基本上所有可能的核苷酸序列組合包括了足夠的可能核苷酸序列,從而能夠明確地檢測(cè)雜交目標(biāo)核酸。
對(duì)于拉曼活性寡核苷酸群,每一種被標(biāo)記的探針可以產(chǎn)生獨(dú)特的拉曼信號(hào)。用于本文中的獨(dú)特的拉曼信號(hào)是提供拉曼特征的拉曼信號(hào),該拉曼特征可與該群中所使用的其他拉曼標(biāo)記的其他拉曼特征區(qū)分開來。
在一個(gè)實(shí)施方案中,提供了用于檢測(cè)模板核酸中目標(biāo)核苷酸位置上的核苷酸發(fā)生的方法,該方法包括將模板核酸與一個(gè)或多個(gè)捕獲寡核苷酸探針接觸,所述捕獲寡核苷酸探針結(jié)合到目標(biāo)核酸的緊靠目標(biāo)核苷酸位置的5′側(cè),并與兩個(gè)或多個(gè)標(biāo)記的寡核苷酸探針接觸,所述標(biāo)記的寡核苷酸探針結(jié)合到在3′核苷酸處包括目標(biāo)核苷酸位置的目標(biāo)區(qū)域上。這些方面例如對(duì)于測(cè)定單核苷酸多態(tài)性(SNP)位點(diǎn)的核苷酸發(fā)生是有用的。
在某些方面,測(cè)定核苷酸序列的方法還包括可選的連接反應(yīng)。連接反應(yīng)通常涉及捕獲寡核苷酸探針與結(jié)合到目標(biāo)核酸相鄰區(qū)域的拉曼活性寡核苷酸探針的連接。連接相鄰寡核苷酸后,沒有被固定到基質(zhì)上的寡核苷酸可以被除去,例如通過提高溫度或改變反應(yīng)的pH以使核酸變性來完成。沒有直接或者間接地被固定到基質(zhì)上的寡核苷酸可以洗去,固定的寡核苷酸可以用SERS檢測(cè)。連接和洗滌步驟增加了反應(yīng)的特異性。
因此,如圖1所示,捕獲寡核苷酸探針20可以被固定在基質(zhì)30上的各點(diǎn)25(圖1中的A和B)。在包括連接步驟的方面,僅僅當(dāng)目標(biāo)核酸10包括與拉曼活性寡核苷酸探針40和捕獲寡核苷酸探針20兩者互補(bǔ)的目標(biāo)片段時(shí),拉曼活性寡核苷酸探針40才連接到捕獲寡核苷酸探針20。在該方面,基于連接的拉曼探針的拉曼特征和捕獲探針的相應(yīng)位置,核苷酸序列得以確定。
相鄰的標(biāo)記寡核苷酸探針可以用已知的方法連接在一起(參見例如美國專利6,013,456)。引物依賴型連接可以使用長度至少6至8個(gè)堿基的寡核苷酸完成(Kaczorowski和Szybalski,Gene 179189-193,1996;Kotler等,Proc.Natl.Acad.Sci.USA 904241-45,1993)。連接與核酸模板雜交的寡核苷酸探針的方法是本領(lǐng)域已知的(美國專利6,013,456)。相鄰寡核苷酸探針的酶法連接可以利用DNA連接酶,諸如T4、T7或Taq連接酶或大腸桿菌DNA連接酶。酶法連接的方法是已知的(例如Sambrook等,1989)。
本文中提供的核酸測(cè)序方法是利用雜交反應(yīng)的測(cè)序,如本領(lǐng)域所知道的。一個(gè)或多個(gè)具有已知序列的寡核苷酸探針能夠被雜交到目標(biāo)核酸序列。標(biāo)記的寡核苷酸與目標(biāo)的結(jié)合表明在目標(biāo)鏈中存在互補(bǔ)序列。多個(gè)標(biāo)記探針可以同時(shí)與目標(biāo)分子雜交,并同時(shí)檢測(cè)。在可選擇的實(shí)施方案中,結(jié)合的探針可以被鑒定為連接于各個(gè)目標(biāo)分子,或可選擇地,特定目標(biāo)分子的多個(gè)拷貝可以同時(shí)結(jié)合到相互重疊的幾組探針序列上。例如,使用與檢測(cè)模式偶聯(lián)的已知的分子梳技術(shù),可以掃描各個(gè)分子。(參見例如Bensimon等,Phys.Rev.Lett.744754-57,1995;Michalet等,Science 2771518-23,1997;美國專利5,840,862;6,054,327;6,225,055;6,248,5376,265,153;6,303,296和6,344,319)。
不太可能的是,給定的目標(biāo)核酸將雜交到完全覆蓋該目標(biāo)序列的連續(xù)的探針序列。相反,多個(gè)拷貝的目標(biāo)可以雜交于標(biāo)記寡核苷酸庫(pools),從其中的每一個(gè)都可收集到一部分的序列數(shù)據(jù)。使用公眾可獲得的鳥槍法序列編輯程序(shotgunsequence compilation program),所述的各部分的序列可以匯編成完整的目標(biāo)核酸序列。部分的序列也可以由目標(biāo)分子群匯編,所述目標(biāo)分子群可以同時(shí)結(jié)合于標(biāo)記寡核苷酸探針文庫,例如在溶液相中進(jìn)行。
捕獲探針固定于其上的基質(zhì)可以是聚合物、塑料、樹脂、多糖、硅石或硅石基材料、碳、金屬、無機(jī)玻璃、膜。例如,基質(zhì)可以是金屬、玻璃或塑料。在一個(gè)方面,表面是光學(xué)透明的,并具有表面Si-OH官能性,諸如在硅石表面上發(fā)現(xiàn)的那些。
用于連接到表面和比對(duì)分子諸如寡核苷酸探針的方法和設(shè)備是本領(lǐng)域已知的(參見例如Bensimon,等,Phys.Rev.Lett.744754-57,1995;Michalet,等,Science2771518-23,1997;美國專利5,840,862;6,054,327;6,225,055;6,248,537;6,265,153;6,303,296和6,344,319)。表面的非限制性例子包括玻璃、功能化玻璃、陶瓷、塑料、聚苯乙烯、聚丙烯、聚乙烯、聚碳酸酯、PTFE(聚四氟乙烯)、PVP(聚乙烯吡咯烷酮)、鍺、硅、石英、砷化鎵、金、銀、尼龍、硝化纖維或能夠?qū)⒉东@探針連接到表面上的本領(lǐng)域已知的任何其他材料。連接可以利用共價(jià)或非共價(jià)相互作用。盡管在本發(fā)明的某些實(shí)施方案中,表面是載玻片或蓋玻片的形式,但表面的形狀不受限制,表面可以是任何形狀。在本發(fā)明的一些方面,表面是平面的。
核酸固定化在此被典型地使用,以將捕獲探針固定到基質(zhì)上。核酸的固定化可以通過本領(lǐng)域已知的各種方法完成。例如,固定化可以通過這樣的方法完成,即用鏈霉抗生物素蛋白或抗生物素蛋白包覆基質(zhì),接著進(jìn)行生物素化核酸的連接(Holmstrom等,Anal.Biochem.209278-283,1993)。固定化亦可這樣實(shí)現(xiàn),即用聚E-Lys(賴氨酸)包覆硅、玻璃或其他基質(zhì),接著用雙功能交聯(lián)劑共價(jià)連接氨基或巰基修飾的核酸(Running等,BioTechniques 8276-277,1990;Newton等,NucleicAcids Res.211155-62,1993)。通過使用用于交聯(lián)的氨基硅烷,可以將胺基殘基引入到基質(zhì)上。
可以將5′-磷酸化核酸直接共價(jià)連接到化學(xué)修飾的基質(zhì),從而實(shí)現(xiàn)固定化(Rasmussen等,Anal.Biochem.198138-142,1991)。核酸與基質(zhì)之間的共價(jià)鍵通過與水溶性碳二亞胺或其他交聯(lián)劑的縮合而形成。這種方法有助于核酸通過其5′-磷酸進(jìn)行主要的5′-連接。示范性修飾的基質(zhì)將包括玻璃載片或蓋片,其已經(jīng)在酸浴中被處理,從而將SiOH基團(tuán)暴露在玻璃上(美國專利5,840,862)。
要將DNA結(jié)合到玻璃上,通常要先對(duì)玻璃表面進(jìn)行硅烷化,然后用碳二亞胺或戊二醛活化??蛇x擇的方法可以使用諸如3-環(huán)氧丙氧基丙基三甲氧基硅烷(GOP)、乙烯基硅烷或氨丙基三甲氧基硅烷(APTS)的試劑,DNA通過整合到分子的3′或5′端的氨基連接物來聯(lián)接。使用紫外輻射可以將DNA直接結(jié)合到膜基質(zhì)。核酸固定化技術(shù)的其他非限制性實(shí)例公開在美國專利5,610,287、5,776,674和6,225,068。用于核酸結(jié)合的商業(yè)上可獲得的基質(zhì)可獲自諸如Covalink、Costar、Estapor、Bangs和Dynal。本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到,本公開的方法不限于固定核酸,它們也可能用于例如將寡核苷酸編碼探針的一端或兩端連接到基質(zhì)。
用于核酸或其他目標(biāo)分子固定化的基質(zhì)的類型沒有限制。在本發(fā)明的各種實(shí)施方案中,該固定化基質(zhì)可以是磁珠、非磁性珠、平表面或者任何其它構(gòu)型的固體表面,它們可以包括幾乎任何材料??杀皇褂玫幕|(zhì)的非限制性例子包括玻璃、硅石、硅酸鹽、PDMS(聚二甲基硅氧烷)、銀或其它金屬涂覆的表面、硝化纖維、尼龍、活化的石英、活化的玻璃、聚偏二氟乙烯(PVDF)、聚苯乙烯、聚丙烯酰胺,其它聚合物,諸如聚氯乙烯、聚甲基丙烯酸甲酯,以及光聚合物,其含有光活性物質(zhì)如氮賓、卡賓和能與核酸分子形成共價(jià)連接的羰自由基(參見美國專利5,405,766和5,986,076)。
雙功能交聯(lián)劑可以用于本發(fā)明的各種實(shí)施方案中??梢愿鶕?jù)雙功能交聯(lián)劑的功能基團(tuán)特異性,例如氨基、胍基、吲哚或羧基特異性基團(tuán)來劃分它們。其中,涉及自由氨基基團(tuán)的試劑是受歡迎的,因?yàn)樗鼈兛梢酝ㄟ^商業(yè)途徑獲得、易于合成并且其可應(yīng)用的反應(yīng)條件溫和。用于交聯(lián)分子的示范性的方法在美國專利5,603,872和5,401,511中公開。交聯(lián)劑包括戊二醛(GAD)、雙功能環(huán)氧乙烷(OXR)、乙二醇二縮水甘油醚(EGDE)和碳二亞胺如1-乙基-3-(3-二甲基氨丙基)碳二亞胺(EDC)。
在某些方面,用于本文公開的方法的基質(zhì)是生物芯片。圖3提供了生物芯片設(shè)計(jì)和使用本文中提供的生物芯片和方法對(duì)目標(biāo)核酸進(jìn)行序列測(cè)定的方法的例子。該實(shí)施例的生物芯片含有許多探針區(qū)域310。每一探針區(qū)域310(例如“A”或“B”)具有多個(gè)捕獲探針組320(例如,1和2)。在每一捕獲探針組350中的捕獲探針20具有相同的序列。換句話說,在點(diǎn)1A和1B的捕獲探針20具有相同的核苷酸序列,但是位于不同的區(qū)室區(qū)域中。許多拉曼探針組320(例如,″a″和″b″)被制備。
每一拉曼活性寡核苷酸探針組350是不同的拉曼活性寡核苷酸探針40構(gòu)成的庫。每一組具有一個(gè)以上的寡核苷酸,每一寡核苷酸具有獨(dú)特的標(biāo)記。為了制備拉曼活性寡核苷酸探針40,合成具有相同序列的探針分子,并且根據(jù)該實(shí)施例,將獨(dú)特的拉曼標(biāo)記45連接到每一分子55(即,同樣的核苷酸序列具有同樣的拉曼標(biāo)記45)。許多具有不同的核苷酸序列和不同的拉曼標(biāo)記45的拉曼活性寡核苷酸探針40可以匯合成拉曼探針組340。用不同的探針序列55可以形成拉曼探針40的不同的組350。然而,同樣的拉曼標(biāo)記45可以被用于一個(gè)以上的拉曼探針組320。因此,拉曼探針序列55可以用它的組ID和它的拉曼標(biāo)記識(shí)別。當(dāng)多拷貝的目標(biāo)序列10——例如來自未經(jīng)擴(kuò)增的生物樣品——被打碎成為短的重疊的片段時(shí),它們可以雜交到芯片上的捕獲探針20。當(dāng)拉曼探針組350被分別加入到探針區(qū)域310時(shí),拉曼探針40將與目標(biāo)核酸分子10雜交。在連接酶存在下,捕獲探針分子20和拉曼探針分子40可以被連接起來,從而將以目標(biāo)序列依賴型的方式固定拉曼探針分子40。各個(gè)拉曼探針45可以通過SERS掃描被檢測(cè)。最后,目標(biāo)序列被解析。
因此,在某些方面,將第一群拉曼活性寡核苷酸探針40與在一系列點(diǎn)340中的第一點(diǎn)上的探針-目標(biāo)雙鏈體核酸接觸,將第二群拉曼活性寡核苷酸探針40與在一系列點(diǎn)340中的第二點(diǎn)上的探針-目標(biāo)雙鏈體核酸接觸,其中第一群拉曼活性寡核苷酸探針40和第二群拉曼活性寡核苷酸探針40包括至少一個(gè)不同的寡核苷酸探針。而且,第一群拉曼活性寡核苷酸探針40和第二群拉曼活性寡核苷酸探針40包括至少一個(gè)攜帶相同的拉曼標(biāo)記45的拉曼活性寡核苷酸探針40,但是不同的寡核苷酸55結(jié)合于該標(biāo)記45。而且,在某些方面,每一點(diǎn)位置可以包括不同的捕獲寡核苷酸探針20。此外,所述一系列的點(diǎn)位置包括具有相同的捕獲寡核苷酸探針20的點(diǎn)位置,以及具有不同的捕獲寡核苷酸探針20的點(diǎn)位置。
在另一實(shí)施方案中,提供了檢測(cè)系統(tǒng),其包括帶有光源的拉曼光譜儀、與光源發(fā)生光通信的拉曼活性表面,和拉曼活性寡核苷酸探針群,該群包括與帶正電荷的增強(qiáng)子連接的不可檢測(cè)的寡核苷酸,其中,拉曼活性寡核苷酸探針沉積在拉曼活性表面上。如本文中所述,帶正電荷的增強(qiáng)子可以是例如胺基團(tuán)增強(qiáng)子。該系統(tǒng)被用于實(shí)施利用雜交進(jìn)行測(cè)序的方法,其中使用了拉曼標(biāo)記的寡核苷酸探針,如文中所述。
將被理解的是,使用本文中公開的方法產(chǎn)生的測(cè)序數(shù)據(jù)可以被用于生物醫(yī)學(xué)研究和臨床診斷。例如,本文中公開的方法可以被用于產(chǎn)生大規(guī)?;蚪M測(cè)序所需的序列信息、序列比較、基因型定型、疾病關(guān)聯(lián)、藥物開發(fā)、病原體檢測(cè)和遺傳篩選。例如,公開于本文中的方法可以被用于測(cè)定對(duì)象的一級(jí)序列信息,諸如與疾病相關(guān)的單核苷酸多態(tài)性、基因片段或完整基因的序列。因此,所述方法可以被用于診斷疾病或提供預(yù)后信息。
在某些方面,在目標(biāo)分子用本發(fā)明的方法檢測(cè)之前,將目標(biāo)分子從生物樣品中分離出來。例如,生物樣品可以從哺乳動(dòng)物對(duì)象,例如人對(duì)象獲得。事實(shí)上,生物樣品可以是任何生物樣品,特別是含有來自對(duì)象的RNA或DNA的樣品。生物樣品例如是尿、血液、血漿、血清、唾液、精液、大便、痰、腦脊髓液、淚、粘液和類似物。生物樣品可以是組織樣品,其含有例如1至10,000,000;1000至10,000,000;或1,000,000至10,000,000個(gè)體細(xì)胞。樣品不必含有完整的細(xì)胞,只要它含有足夠用于本發(fā)明方法的RNA或DNA就可以,其在一些方面僅僅需要1個(gè)分子的RNA或DNA。根據(jù)生物樣品來自哺乳動(dòng)物對(duì)象的本發(fā)明的方面,生物或組織樣品可以來自任何組織。例如,組織可以通過手術(shù)、組織切片、拭抹、排泄或其他收集方法獲得。
在其他方面,生物樣品含有病原體,例如病毒或細(xì)菌病原體。然而,在某些方面,在模板核酸與探針接觸之前,將模板核酸從生物樣品純化出來。分離的模板核酸可以與反應(yīng)混合物接觸,無需擴(kuò)增。
如本文中所使用,“約”是指在某個(gè)值的百分之十以內(nèi)。例如,“約100”將指在90至110之間的值。
“核酸”包括DNA、RNA(核糖核酸),單鏈、雙鏈或三鏈核酸,和其任何化學(xué)修飾。事實(shí)上,考慮核酸的任何修飾?!昂怂帷睅缀蹩梢允侨魏伍L度的,從2個(gè)或更多個(gè)堿基的寡核苷酸至全長染色體DNA分子。核酸包括但不限于寡核苷酸和多核苷酸。如本文中使用的,“多核苷酸”是包括至少25個(gè)核苷酸的核酸。
多態(tài)性是發(fā)生在群體中的等位基因變異。多態(tài)性可以是存在于一個(gè)位點(diǎn)上的單核苷酸差異,或者可以是一個(gè)或一些核苷酸的插入或缺失。這樣,單核苷酸多態(tài)性(SNP)的特征是在群體中,在基因組諸如人基因組的特定位點(diǎn)上存在的一種或兩種、三種或四種核苷酸發(fā)生(即,腺苷、胞苷、鳥苷或胸苷)。如本文中所示,本文中公開的方法可用于檢測(cè)在SNP位置上的核苷酸發(fā)生,或?qū)τ陔p倍體生物體諸如哺乳動(dòng)物來說檢測(cè)在SNP位置上的兩基因組核苷酸發(fā)生。而且,本文中公開的方法可用于在單個(gè)反應(yīng)中檢測(cè)1個(gè)以上的SNP,例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、50、100或更多個(gè)SNP。
“目標(biāo)”或“分析物”分子是能夠與標(biāo)記的探針結(jié)合的任何分子,包括但是不限于核酸、蛋白質(zhì)、脂類和多糖。在方法中的一些方面,標(biāo)記探針與目標(biāo)分子的結(jié)合可以被用于檢測(cè)目標(biāo)分子在樣品中的存在。
待被用本文中提供的方法測(cè)序的核酸分子可以用本領(lǐng)域已知的任何技術(shù)制備。在本發(fā)明的某些實(shí)施方案中,核酸是天然存在的DNA或RNA分子。事實(shí)上,任何天然存在的核酸都可以用本文中公開的方法測(cè)序,包括但不限于染色體、線粒體和葉綠體DNA和核糖體RNA、轉(zhuǎn)運(yùn)RNA、不均一核RNA和信使RNA。在一些實(shí)施方案中,待被分析的核酸可以以細(xì)胞、組織或器官的粗勻漿或提取物的形式存在。在其他實(shí)施方案中,在分析之前,核酸可以部分地或完全地純化。在可選擇的實(shí)施方案中,待被分析的核酸分子可以通過化學(xué)合成或通過本領(lǐng)域已知的各種核酸擴(kuò)增、復(fù)制和/或合成方法制備。
在一些方面,本發(fā)明的方法分析分離自細(xì)胞的核酸。純化各種形式的細(xì)胞內(nèi)核酸的方法是已知的。(參見例如,Guide to Molecular Cloning Techniques,eds.Berger and Kimmel,Academic Press,New York,NY,1987;Molecular CloningALaboratory Manual,2nd Ed.,eds.Sambrook,F(xiàn)ritsch and Maniatis,Cold Spring HarborPress,Cold Spring Harbor,NY,1989)。在所引用的參考文獻(xiàn)中公開的方法僅僅是示例性的,可以使用本領(lǐng)域已知的任何變通的方法。在對(duì)單鏈DNA(ssDNA)進(jìn)行分析的情況下,可以采用任何已知方法,從雙鏈DNA(dsDNA)制備ssDNA。這些方法可以涉及加熱dsDNA和使鏈分離,或者可以可選地涉及通過已知的擴(kuò)增或復(fù)制方法,從dsDNA制備ssDNA,例如克隆到M13中??梢允褂萌魏芜@樣的已知方法制備ssDNA或ssRNA。
盡管本發(fā)明的某些實(shí)施方案涉及分析天然存在的核酸諸如多核苷酸,事實(shí)上任何類型的核酸都可以使用。例如,用各種擴(kuò)增技術(shù)如聚合酶鏈?zhǔn)椒磻?yīng)(PCR3)擴(kuò)增制得的核酸可以被分析。(見美國專利4,683,195、4,683,202和4,800,159。)作為選擇,待分析的核酸可以用標(biāo)準(zhǔn)載體克隆,標(biāo)準(zhǔn)載體如質(zhì)粒、粘粒、BACs(細(xì)菌人工染色體)或YACs(酵母人工染色體)。(見,例如,Berger and Kimmel,1987;Sambrook et al.,1989。)核酸插入物可以從載體DNA中分離,例如,用合適的限制性內(nèi)切核酸酶切割,然后進(jìn)行瓊脂糖凝膠電泳。核酸插入物的分離方法是本領(lǐng)域已知的。公開的方法不限制待被分析的核酸的來源,任何類型的核酸,包括原核生物的、細(xì)菌的、病毒的、真核生物的、哺乳動(dòng)物和/或人的核酸都可以在要求保護(hù)的主題范圍內(nèi)進(jìn)行分析。
在本發(fā)明的各種實(shí)施方案中,多拷貝的核酸可以通過與標(biāo)記的寡核苷酸探針雜交來分析,如下所述。單個(gè)核酸的制備和多拷貝的形成——例如通過各種擴(kuò)增和/或復(fù)制方法完成——是本領(lǐng)域已知的??蛇x擇地,可以分離單個(gè)克隆,諸如BAC、YAC、質(zhì)粒、病毒或含有單個(gè)核酸插入物的其他載體,并培養(yǎng)之,取出插入片段并純化,用于分析??寺〔@得純化的核酸插入物的方法是本領(lǐng)域已知的。
在本發(fā)明的各種實(shí)施方案中,目標(biāo)核酸與標(biāo)記寡核苷酸群的雜交可以在嚴(yán)緊型條件下實(shí)施,該嚴(yán)緊型條件僅僅允許完全互補(bǔ)的核酸序列之間的雜交。低嚴(yán)緊型條件通常是在0.15M至0.9M NaCl,在20℃至50℃的溫度范圍內(nèi)實(shí)施。高嚴(yán)緊型條件通常是在0.02M至0.15M NaCl,在50℃至70℃的溫度范圍內(nèi)實(shí)施。應(yīng)該理解地是,合適嚴(yán)緊型的溫度和/或離子強(qiáng)度部分地是由寡核苷酸探針的長度、目標(biāo)序列的堿基組成、在雜交混合物中存在的甲酰胺、四甲基氯化銨或其他溶劑來決定。上面提及的范圍是示范性的,并且特定雜交反應(yīng)的合適的嚴(yán)緊型常常通過比較陽性和/或陰性對(duì)照經(jīng)驗(yàn)性地決定。本領(lǐng)域普通技術(shù)人員能夠常規(guī)性地調(diào)整雜交條件,以使得僅僅在精確互補(bǔ)的核酸序列之間發(fā)生嚴(yán)緊型雜交。
不太可能的是,給定的目標(biāo)核酸將雜交到完全覆蓋目標(biāo)序列的連續(xù)的探針序列。相反,多拷貝的目標(biāo)可以雜交于標(biāo)記寡核苷酸的庫,并從其中每一個(gè)收集到部分序列數(shù)據(jù)。使用公眾可獲得的鳥槍序列編輯程序,所述的部分的序列可以匯編成完整的目標(biāo)核酸序列。
在本發(fā)明的某些實(shí)施方案中,當(dāng)仍連接在目標(biāo)分子上時(shí),標(biāo)記的寡核苷酸便被檢測(cè)。假定短的寡核苷酸探針和目標(biāo)核酸之間的結(jié)合相互作用具有相對(duì)較弱的強(qiáng)度,則這樣的方法可能更加合適,其中例如標(biāo)記的探針已經(jīng)用交聯(lián)劑被共價(jià)連接到目標(biāo)分子上。
在本發(fā)明的各種實(shí)施方案中,寡核苷酸探針可以是DNA、RNA或其任何類似物,諸如肽核酸(PNA),其可以被用于鑒定核酸中的特異性互補(bǔ)序列。在本發(fā)明的某些實(shí)施方案中,可以制備一個(gè)或多個(gè)寡核苷酸探針文庫,用于與一個(gè)或多個(gè)核酸分子雜交。例如,可以使用含有所有4096種或約2000種非互補(bǔ)6聚體,或所有16,384種或約8,000種非互補(bǔ)7聚體的一組標(biāo)記寡核苷酸探針。如果非互補(bǔ)的寡核苷酸探針亞組將被使用,可以進(jìn)行一系列雜交和序列分析,并將分析結(jié)果通過計(jì)算方法并入單個(gè)數(shù)據(jù)組。例如,如果僅包括非互補(bǔ)6聚體的文庫被用于雜交和序列分析,則實(shí)施第二雜交和分析,其使用同樣的目標(biāo)核酸分子,該目標(biāo)核酸分子與由第一文庫排除的那些標(biāo)記探針序列雜交。
標(biāo)記的寡核苷酸群的寡核苷酸可以用任何已知的方法制備,諸如通過用Applied Biosystems 381A DNA合成儀(Foster City,CA)或類似的設(shè)備合成??蛇x擇地,寡核苷酸可以從許多商家那里購得(例如Proligo,Boulder,CO;Midland CertifiedReagents,Midland,TX)。在寡核苷酸為化學(xué)合成的實(shí)施方案中,信號(hào)分子諸如拉曼標(biāo)記或帶正電荷的增強(qiáng)子,可以被共價(jià)連接到用于合成的一個(gè)或多個(gè)核苷酸前體上??蛇x擇地,信號(hào)分子可以在寡核苷酸探針合成后被連接。在其他可選擇的實(shí)施方案中,拉曼標(biāo)記的連接可以與寡核苷酸合成同時(shí)進(jìn)行。
在本發(fā)明的某些方面,標(biāo)記的寡核苷酸探針包括肽核酸(PNAs)。PNAs是聚酰胺形式的DNA類似物,具有腺嘌呤、鳥嘌呤、胸腺嘧啶和胞嘧啶的單體單元。PNAs可通過商業(yè)渠道從公司諸如PE Biosystems(Foster City,CA)獲得??蛇x擇地,PNA合成可以用9-芴甲氧羰基(Fmoc)單體激活,并在叔胺N,N-二異丙基乙胺(DIEA)存在下,用O-(7-氮雜苯并三唑)-1,1,3,3,-四甲基脲六氟磷酸鹽(tetramethyluronium hexafluorophosphate)(HATU)偶聯(lián)來進(jìn)行。PNAs可以通過反相高效液相色譜(RP-HPLC)純化,并通過基質(zhì)輔助激光解吸電離-飛行時(shí)間(matrixassisted laser desorption ionization-time of flight)(MALDI-TOF)質(zhì)譜分析來檢驗(yàn)。
本文進(jìn)一步提供的是用于實(shí)施上述方法的試劑盒。該試劑盒包括拉曼活性寡核苷酸探針群,其中一個(gè)或多個(gè)拉曼活性寡核苷酸探針被結(jié)合到帶正電荷的增強(qiáng)子。該試劑盒也可以包括攜帶有結(jié)合的捕獲寡核苷酸探針群的基質(zhì),如本文所論述。在某些實(shí)施方案中,該試劑盒還包括銀膠體或納米顆粒。此外,該試劑盒可以包括拉曼活性表面。
下面的實(shí)施方案是基于發(fā)現(xiàn)了靈敏且簡(jiǎn)單的檢測(cè)方法,該方法能夠區(qū)分具有微妙差異的目標(biāo)分子。該方法對(duì)于生物應(yīng)用是重要的,諸如在基因型定型中的單核苷酸多態(tài)性檢測(cè),如上所述。該方法是有效的,因?yàn)闊o需化學(xué)修飾和冗長的樣品制備技術(shù),并且大量的目標(biāo)可以在單個(gè)裝置中,在短時(shí)間內(nèi)被分析。此外,該方法成本相對(duì)低,這是因?yàn)閮H需要非常少量的樣品和試劑。
不受理論限制,公開的方法部分地基于這樣的構(gòu)思當(dāng)同樣的探針與具有微妙的結(jié)構(gòu)差異的兩目標(biāo)形成復(fù)合體時(shí),在連接到探針上的標(biāo)記中具有構(gòu)象差異,并且這些空間構(gòu)象差異可以被光學(xué)技術(shù)分辨。本文中提供的數(shù)據(jù)表明,使用熒光方法,單個(gè)核酸探針可以檢測(cè)完美匹配和錯(cuò)配目標(biāo)之間的差異。
而且,在某些方面,用于檢測(cè)微妙的結(jié)構(gòu)差異的方法使用拉曼檢測(cè)方法來實(shí)施。這些方面依靠裝這樣的事實(shí),即拉曼檢測(cè)方法比熒光檢測(cè)方法提供了更多的結(jié)構(gòu)信息。而且,SERS拉曼具有單個(gè)分子檢測(cè)靈敏性的潛力。最后,微流體MEMS裝置可以被用于在小的液體腔(cavities)內(nèi)將樣品分離成獨(dú)自的探針-目標(biāo)復(fù)合體,其可以用SERS檢測(cè)。
因此,在另一實(shí)施方案中,提供了檢測(cè)第一特異性結(jié)合對(duì)成員中的目標(biāo)結(jié)構(gòu)的方法,該方法包括將第一結(jié)合對(duì)成員與第二特異性結(jié)合對(duì)成員接觸,其中第二特異性結(jié)合對(duì)成員結(jié)合第一特異性結(jié)合對(duì)成員,并且其中第二特異性結(jié)合對(duì)成員包括第一標(biāo)記和第二標(biāo)記,其中,當(dāng)?shù)谝唤Y(jié)合對(duì)成員結(jié)合到第二結(jié)合對(duì)成員時(shí),以可受到第一結(jié)合對(duì)成員的目標(biāo)結(jié)構(gòu)的影響的方式,第一標(biāo)記能夠影響第二標(biāo)記的光學(xué)信號(hào)。來自第二標(biāo)記的信號(hào)被檢測(cè),并被用于測(cè)定第一結(jié)合對(duì)成員的目標(biāo)結(jié)構(gòu)。
在該實(shí)施方案中,第一特異性結(jié)合對(duì)成員是目標(biāo)分子,第二特異性結(jié)合對(duì)成是探針。探針是特異性識(shí)別并結(jié)合它的配體(即目標(biāo)分子)的分子聚合物(即蛋白質(zhì)、核酸等)。探針分子是特異性結(jié)合對(duì)成員,例如是核酸,諸如寡核苷酸或多核苷酸;蛋白質(zhì)或其肽片段,諸如受體或轉(zhuǎn)錄因子,抗體或抗體片段,例如遺傳工程改造的抗體,單鏈抗體或人源化的抗體;凝集素;底物;抑制劑;激動(dòng)劑;配體;激素;細(xì)胞因子;趨化因子和/或藥物。例如,當(dāng)目標(biāo)分子是蛋白質(zhì)時(shí),探針是蛋白質(zhì)(抗體);當(dāng)目標(biāo)是核酸時(shí),探針通常是核酸諸如寡核苷酸。
如本文中所使用的,術(shù)語“特異性結(jié)合對(duì)成員(specific binding pair member)”指與特異性結(jié)合對(duì)的另一成員特異性結(jié)合或選擇性雜交的分子。特異性結(jié)合對(duì)成員包括,例如,寡核苷酸和與該寡核苷酸選擇性雜交的核酸,或者蛋白和與該蛋白質(zhì)結(jié)合的抗體。如本文中使用的,術(shù)語“選擇性雜交作用”或“選擇性雜交”指在高嚴(yán)緊型生理?xiàng)l件下的雜交。術(shù)語“特異性結(jié)合”或“特異性結(jié)合活性”,當(dāng)涉及抗體時(shí),指抗體和特定表位的相互作用具有至少約1×10-6,一般至少約1×10-7,通常至少約1×10-8,特別地至少約1×10-9或1×10-10或更小的解離常數(shù)。
在相關(guān)的實(shí)施方案中,提供了測(cè)定在目標(biāo)核酸的目標(biāo)核苷酸位置上的核苷酸發(fā)生的方法,該方法包括將目標(biāo)核酸與結(jié)合該目標(biāo)核酸的標(biāo)記寡核苷酸探針接觸,以形成探針-目標(biāo)復(fù)合體,其中標(biāo)記寡核苷酸探針包括第一標(biāo)記和第二標(biāo)記,第一標(biāo)記能夠影響第二標(biāo)記的光學(xué)特性;并檢測(cè)探針-目標(biāo)復(fù)合體的光學(xué)特性。目標(biāo)核苷酸位置上的核苷酸發(fā)生影響第一標(biāo)記和第二標(biāo)記的取向,從而影響第二標(biāo)記的光學(xué)特性。光學(xué)特性為,例如由第二標(biāo)記產(chǎn)生的熒光信號(hào)和拉曼信號(hào)。產(chǎn)生的信號(hào)的特性使得能測(cè)定在目標(biāo)核苷酸位置上的核苷酸發(fā)生。
在某些實(shí)施方案中,在被檢測(cè)之前,將交流電(AC)施于所述探針-目標(biāo)復(fù)合體,以增加在第一探針對(duì)第二探針熒光信號(hào)或拉曼信號(hào)的影響的差異,這取決于目標(biāo)多核苷酸和標(biāo)記探針在目標(biāo)核苷酸位置是否含有互補(bǔ)的核苷酸。施用的AC電壓可以是例如10-100mV,AC頻率為1Hz至1MHz。
熒光信號(hào)和拉曼信號(hào),例如分別是熒光光譜或拉曼光譜。檢測(cè)熒光信號(hào)和拉曼信號(hào)的方法是本領(lǐng)域已知的,其中一些方法在本文中給出。在某些方面,第一標(biāo)記和第二標(biāo)記是FRET對(duì),如在本文中更詳細(xì)論述的。在一個(gè)實(shí)施例中,F(xiàn)RET對(duì)是TAMRA和ROX。
因此,標(biāo)記是連接到探針的光學(xué)上可檢測(cè)的部分。標(biāo)記可以是熒光染料、拉曼標(biāo)記或可以被光學(xué)技術(shù)識(shí)別的任何小分子。上文中提供了拉曼標(biāo)記的例子。
選擇探針的第一標(biāo)記和第二標(biāo)記,以形成包括熒光或拉曼供體和熒光或拉曼受體的供體/受體對(duì),響應(yīng)于對(duì)熒光或拉曼供體的激活,所述供體和受體能夠相互間進(jìn)行熒光共振能量轉(zhuǎn)移或拉曼能量轉(zhuǎn)移,所述激活通過具有預(yù)先確定的波長或波長帶的光來完成。
熒光或拉曼標(biāo)記和與之配對(duì)的標(biāo)記的激發(fā)和發(fā)射光譜決定了它是熒光或拉曼供體還是熒光或拉曼受體。用于FRET的分子的例子包括染料熒光素和熒光素衍生物,諸如5-羧基熒光素(5-FAM)、6-羧基熒光素(6-FAM)、熒光素-5-異硫氰酸酯(FITC)、2′,7′-二甲氧基-4′,5′-二氯-6-羧基-熒光素(JOE);羅丹明和羅丹明衍生物,諸如N,N,N′,N′-四甲基-6-羧基羅丹明(TAMRA)、6-羧基羅丹明(R6G)、四甲基-吲哚碳菁(indocarbocyanine)(Cy3)、四甲基-芐吲碳菁(benzindocarbocyanine)(Cy3.5)、四甲基-吲哚二碳菁(Cy5)、四甲基-吲哚三碳菁(Cy7)、6-羰基-X-羅丹明(ROX);六氯熒光素(HEX)、四氯熒光素TET;R-藻紅蛋白、4-(4′-二甲基氨基苯偶氮基)苯甲酸(DABCYL)和5-(2’-氨乙基)氨基萘基-1-磺酸(EDANS)。表1列出了示范性的供體和受體對(duì),包括各自的最大吸光度(Abs)和發(fā)射(Em)。術(shù)語熒光受體包括熒光淬滅劑。示范性的淬滅劑染料是本領(lǐng)域已知的,例如由Clegg,″Fluorescence resonanceenergy transfer and nucleic acids,″Methods 211353-389(1992)所描述的。
表1示范性的FRET對(duì)
下面的段落中討論的方法可以被用于將拉曼或熒光標(biāo)記連接到寡核苷酸,用于本文中公開的任何實(shí)施方案中。熒光或拉曼標(biāo)記可以被摻入或連接到寡核苷酸探針的5′-端核苷酸、寡核苷酸探針的3′-端核苷酸,以及寡核苷酸探針的非末端或內(nèi)部核苷酸。在圖5的實(shí)施方案中,熒光部分被連接到內(nèi)部核苷酸。
對(duì)于5′-端標(biāo)記的寡核苷酸,通常在合成之前,將熒光或拉曼標(biāo)記(即,部分)連接到寡核苷酸探針的5′-端核苷酸,然后用已知的程序?qū)?biāo)記的核苷酸并入寡核苷酸合成中(例如,Yang and Millar in Methods in Enzymology,Vol.278,第417-444頁,(1997))。
對(duì)于內(nèi)部標(biāo)記,通常在合成期間,使用Amino-Modifier C6 dT(例如來自Glen Research),將氨基修飾的堿基引入到寡核苷酸中。然后在合成后,將該標(biāo)記的活性酯衍生物偶聯(lián)到氨基修飾的堿基。這是有益的,因?yàn)樵噭┲T如花菁-染料標(biāo)記的核苷酸是容易獲得的,并且該標(biāo)記不會(huì)干擾探針的雜交。
將熒光或拉曼標(biāo)記連接到寡核苷酸的可選擇的方法描述于Khanna等,美國專利4,351,760;Marshall;Mechnen等,美國專利5,188,934;Woo等,美國專利5,231,191;和Hobbs,Jr等,美國專利4,997,928中。
在本發(fā)明的該實(shí)施方案的方法中,標(biāo)記的寡核苷酸探針和目標(biāo)核酸在產(chǎn)生雜交復(fù)合體的條件下雜交,在其中,熒光或拉曼供體和熒光或拉曼受體相互之間相隔一距離,以便響應(yīng)于對(duì)熒光或拉曼供體的激活時(shí),它們能夠相互間進(jìn)行熒光共振能量轉(zhuǎn)移或拉曼散射能量轉(zhuǎn)移,所述激活通過具有預(yù)先確定的波長的光來完成。對(duì)熒光或拉曼供體和熒光或拉曼受體的激活和檢測(cè)可以在離散的光波長或波長帶諸如通過濾波器來實(shí)施。
熒光或共振能量轉(zhuǎn)移的效率據(jù)報(bào)道與D×10-6成正比,其中D是供體和受體之間的距離(Forster,Z.Naturforsch A,1949,4321-327)。因此,熒光共振能量轉(zhuǎn)移通常發(fā)生在10-70埃之間的距離,在一些情況下,發(fā)生在30-60埃的距離。在雜交的探針對(duì)雙鏈體中,熒光供體和熒光受體通常相距約5個(gè)堿基對(duì)(bp)至約24bp。當(dāng)熒光受體是淬滅劑時(shí),分開的距離可以更短些。
在某些方面,熒光或拉曼供體和熒光或拉曼受體在寡核苷酸探針上相距8bp-18bp。例如,熒光或拉曼供體和熒光或拉曼受體相距10bp-13bp。
通過檢測(cè)由熒光或拉曼供體、熒光或拉曼受體,或者熒光和拉曼供體和受體兩者(例如比率)發(fā)射的光來進(jìn)行檢測(cè)。在一種實(shí)施方案中,熒光或拉曼供體和熒光或拉曼受體兩者都是熒光團(tuán)。第一熒光團(tuán)用合適波長或波長帶的光激活,所述波長或波長帶是具體熒光團(tuán)的函數(shù)。熒光測(cè)量可以例如使用Wallac 1420Victor2 multilabel counter、Perkin Elmer LS50B發(fā)光分光光度計(jì)或其他合適的儀器完成。在可選擇的方面,熒光供體是熒光團(tuán),熒光受體是淬滅劑,通過測(cè)量熒光團(tuán)的發(fā)射來進(jìn)行檢測(cè)。由標(biāo)記的寡核苷酸探針產(chǎn)生的熒光和/或拉曼光譜是有差別的,這取決于目標(biāo)核酸分子的核苷酸序列。
本發(fā)明可以被用于在一個(gè)或多個(gè)樣品中檢測(cè)一個(gè)以上的目標(biāo)核苷酸位置上的一個(gè)以上的核苷酸發(fā)生。目標(biāo)位置可以位于不同的核酸上,或一個(gè)以上的目標(biāo)位置可以位于一個(gè)特定的核酸上。在一個(gè)實(shí)施方案中,該方法采用一個(gè)以上的寡核苷酸探針對(duì)來實(shí)施,其中至少兩個(gè)探針的供體/受體對(duì)是不同的,并且用于激活所述至少兩個(gè)不同的探針的熒光或拉曼供體的光的波長或波長帶是不同的。因此,在這些方面,使用一群標(biāo)記的探針來測(cè)定一個(gè)或多個(gè)目標(biāo)核苷酸的一系列的核苷酸發(fā)生。因此,這些方面的方法為分析生物樣品中的一系列SNPs提供了強(qiáng)有力的工具。
在另一實(shí)施方案中,第一探針或者第二探針被固定在固體表面上。在該實(shí)施方案中,并不要求至少兩探針對(duì)的供體/受體對(duì)是不同的,以及并不要求用于激活所述至少兩個(gè)不同的探針的熒光或拉曼供體的光波長是不同的。通過探針的空間定位來確定每一目標(biāo)位置上的核苷酸發(fā)生的具體類型(identity)和特異性??蛇x擇地,目標(biāo)核酸被固定或連接在不連續(xù)的位置上,以特異性地檢測(cè)多個(gè)多核苷酸目標(biāo)。對(duì)在目標(biāo)核酸的目標(biāo)位置上的核苷酸發(fā)生的檢測(cè)可以用于各種應(yīng)用,包括例如與單核苷酸多態(tài)性相關(guān)的核苷酸發(fā)生、插入、缺失和多突變的檢測(cè)。
在本發(fā)明的各種實(shí)施方案中,目標(biāo)核酸與標(biāo)記的寡核苷酸探針的雜交可以在各種嚴(yán)緊型條件下實(shí)施。例如,可以進(jìn)行低嚴(yán)緊型雜交。低嚴(yán)緊型雜交通常是在0.15M至0.9M NaCl,在20℃至50℃的溫度范圍內(nèi)實(shí)施。高嚴(yán)緊型雜交通常是在0.02M至0.15M NaCl,在50℃至70℃的溫度范圍內(nèi)實(shí)施。應(yīng)該理解的是,合適嚴(yán)緊型的溫度和/或離子強(qiáng)度部分地是由寡核苷酸探針的長度、目標(biāo)序列的堿基組成、在雜交混合物中存在的甲酰胺、四甲基氯化銨或其他溶劑決定。上述提及的范圍是示范性的,具體雜交反應(yīng)的合適的嚴(yán)緊型常常通過比較陽性和/或陰性對(duì)照由經(jīng)驗(yàn)決定。本領(lǐng)域普通技術(shù)人員能夠常規(guī)性地調(diào)整雜交條件,以使得僅僅在精確互補(bǔ)的核酸序列之間發(fā)生嚴(yán)緊型雜交。
在某些方面,探針-目標(biāo)復(fù)合體單獨(dú)地通過光學(xué)檢測(cè)儀,以讀取由所述探針-目標(biāo)復(fù)合體產(chǎn)生的熒光信號(hào)或拉曼光譜。例如,光學(xué)檢測(cè)儀可以是本文下面公開的MEMS檢測(cè)裝置。使用該裝置,利用微機(jī)電系統(tǒng),例如各個(gè)探針-目標(biāo)復(fù)合體可以單獨(dú)地通過,該微機(jī)電系統(tǒng)具有足夠窄到僅允許一個(gè)探針-目標(biāo)復(fù)合體通過的通道。
圖5提供了使用標(biāo)記的寡核苷酸探針來檢測(cè)目標(biāo)位置上的核苷酸發(fā)生的例子,如在本文實(shí)施例部分中更為詳細(xì)描述的。如圖5A中所示,將熒光標(biāo)記Rox 560和Tamra 570連接到合成的寡核苷酸序列(RTI)510上。標(biāo)記的寡核苷酸探針被用作探針(RTl)510,以檢測(cè)目標(biāo)核酸520(TA)、530(TC)、540(TG)和550(TT)中的單核苷酸差異。這四個(gè)目標(biāo)核酸520、530、540和550僅在對(duì)應(yīng)于結(jié)合到標(biāo)記的寡核苷酸探針510中的TAMRA的核苷酸的核苷酸位置上有差異(在目標(biāo)核酸520、530、540和550中,分別為A、C、G和T)。在離子強(qiáng)度和pH值方面類似于生理鹽水的溶液中,標(biāo)記的寡核苷酸探針510和目標(biāo)核酸520、530、540和550形成探針-目標(biāo)復(fù)合體。
當(dāng)探針分子結(jié)合到目標(biāo)分子時(shí),它們形成雙鏈分子復(fù)合體。當(dāng)堿基配對(duì)完全正確時(shí)(在中間的堿基中沒有錯(cuò)配,如在RTl 510+TA 520中),雙螺旋約每10個(gè)堿基對(duì)旋轉(zhuǎn)一整圈。因?yàn)?個(gè)標(biāo)記的位置相距約3-6nm,當(dāng)它們被適當(dāng)定向和激發(fā)時(shí),可能有共振能量轉(zhuǎn)移。因?yàn)?個(gè)標(biāo)記——也稱為標(biāo)簽部分——之間的能量轉(zhuǎn)移效率(E)取決于距離(r)E=1/r^6,r大于獲得50%效率時(shí)的距離(4-6nm)。在中間堿基(即,作為目標(biāo)核苷酸位置的堿基)中的任何錯(cuò)配能夠微微地改變r(jià)值,但是E值改變明顯。當(dāng)標(biāo)記的RTl寡核苷酸探針510與在目標(biāo)核苷酸位置不包含互補(bǔ)核苷酸的目標(biāo)核酸(即TC530、TG540或TT550)結(jié)合時(shí),這種情況便發(fā)生了。E的變化可以使用光學(xué)方法檢測(cè),并可以用熒光或拉曼光譜分析檢測(cè)。
圖5B顯示了來自熒光分析的數(shù)據(jù),所述熒光分析使用了圖5A的探針-目標(biāo)系統(tǒng)。在同步掃描光譜(δ=30nm)中的差異表明,在這些探針-目標(biāo)復(fù)合體中,Rox和Tamra之間的相對(duì)距離存在差異。這些差異最有可能是由錯(cuò)配的堿基所引起的。
理論上講,當(dāng)使用拉曼散射技術(shù)——包括SERS拉曼時(shí),可以從上述系統(tǒng)獲得更多的信息。拉曼峰的相對(duì)強(qiáng)度可以用作不同序列結(jié)構(gòu)的指示。除了核酸,該方法還可以被運(yùn)用到其他系統(tǒng),只要能獲得合適的標(biāo)記探針。
在另一方面,針對(duì)已知的基因型或已知的分子構(gòu)建出光譜數(shù)據(jù)庫或文庫。例如,針對(duì)在已知的單核苷酸多態(tài)性(SNPs)處的核苷酸發(fā)生,可以產(chǎn)生光譜數(shù)據(jù)庫或文庫。如上所述的針對(duì)目標(biāo)分子產(chǎn)生的拉曼光譜或熒光光譜可以與光譜數(shù)據(jù)庫或文庫進(jìn)行比較,以鑒定目標(biāo)多核苷酸的目標(biāo)核苷酸位置上的核苷酸發(fā)生。
根據(jù)這些方面的方法然后可以被用于例如檢測(cè)生物樣品中SNPs處的核苷酸發(fā)生。生物樣品例如是尿、血液、血漿、血清、唾液、精液、糞便、痰、腦脊髓液、淚、粘液和類似物,如上所述。
因此,本文提供了包括一群標(biāo)記寡核苷酸探針的拉曼光譜譜型的數(shù)據(jù)庫,所述寡核苷酸探針包括第一標(biāo)記和第二標(biāo)記,其中拉曼光譜包括一系列的拉曼光譜組,其中每一組的拉曼光譜由結(jié)合到一系列的目標(biāo)多核苷酸的相同探針序列產(chǎn)生,除了在目標(biāo)位置外,所述目標(biāo)多核苷酸包括相同的核苷酸序列。在某些方面,目標(biāo)位置代表了單核苷酸多態(tài)性(SNP)位置。
在某些方面,探針-目標(biāo)復(fù)合體單獨(dú)地通過光學(xué)檢測(cè)裝置,以讀取由探針-目標(biāo)復(fù)合體產(chǎn)生的熒光信號(hào)或拉曼光譜。使用該裝置,利用微機(jī)電系統(tǒng),例如各個(gè)探針-目標(biāo)復(fù)合體可以單獨(dú)通過,該微機(jī)電系統(tǒng)具有足夠窄到一次僅允許一個(gè)探針-目標(biāo)復(fù)合體通過的通道。
圖6說明了用于單個(gè)探針-目標(biāo)復(fù)合體檢測(cè)的MEMS裝置600。該裝置典型地與本文中公開的方法一起使用,用于用包括第一標(biāo)記(例如FRET供體)和第二標(biāo)記(例如FRET受體565)的標(biāo)記寡核苷酸探針檢測(cè)目標(biāo)核苷酸位置上的核苷酸發(fā)生,其中第一標(biāo)記和第二標(biāo)記565是FRET對(duì)。當(dāng)樣品含有多拷貝的目標(biāo)核酸諸如生物樣品時(shí),將探針加入到樣品中,以形成探針-目標(biāo)復(fù)合體605。這些復(fù)合體605分別通過光學(xué)檢測(cè)儀腔640,并記錄各自的光譜。然后,例如可以在數(shù)據(jù)文庫中搜索該數(shù)據(jù)。利用統(tǒng)計(jì)學(xué)的方法分析信息。例如,該文庫可以包括在使用標(biāo)記的寡核苷酸探針時(shí)針對(duì)目標(biāo)核酸的目標(biāo)位置上的所有已知的核苷酸發(fā)生的光譜。
為了能夠分離單個(gè)復(fù)合體,可以使用MEMS裝置600。讓樣品通過窄的分離通道650,以便在統(tǒng)計(jì)學(xué)上僅一個(gè)復(fù)合體605占據(jù)檢測(cè)儀腔640。為了增強(qiáng)完全雜交的復(fù)合體和具有錯(cuò)配的復(fù)合體之間的差異,使用具有可調(diào)頻率和電壓的AC電源620產(chǎn)生交流(AC)場(chǎng),以誘發(fā)錯(cuò)配復(fù)合體中的構(gòu)象變化,錯(cuò)配復(fù)合體比完全匹配的復(fù)合體相對(duì)更具柔性。利用AC場(chǎng)的這些實(shí)施方案通常在本發(fā)明的利用熒光檢測(cè)方法的方面中實(shí)施。不受理論限制,不同標(biāo)記之間的相對(duì)距離的變化能夠影響復(fù)合體中的電子分布,或改變光敏感標(biāo)記之間的能量轉(zhuǎn)移效率,其可以導(dǎo)致更具可區(qū)分性的信號(hào)。
因此,本發(fā)明提供了用于檢測(cè)目標(biāo)分子的微機(jī)電系統(tǒng)(MEMS)裝置,該裝置包括用于接收樣品的樣品入口,所述樣品包括生物分子和標(biāo)記的結(jié)合對(duì)成員形成的復(fù)合體,而標(biāo)記的結(jié)合對(duì)成員包括第一標(biāo)記和第二標(biāo)記,其中第一標(biāo)記能夠影響第二標(biāo)記的熒光信號(hào)或拉曼光譜,該裝置也包括流體連接于該樣品入口的分離通道650,以及光學(xué)檢測(cè)裝置和光學(xué)檢測(cè)腔640。
檢測(cè)裝置典型地是熒光檢測(cè)裝置或拉曼檢測(cè)裝置,兩者都是本領(lǐng)域熟知的。在某些方面,使用拉曼標(biāo)記,檢測(cè)裝置是拉曼檢測(cè)系統(tǒng)。
在某些方面,當(dāng)利用熒光檢測(cè)裝置并利用熒光標(biāo)記時(shí),該裝置還可以包括電極610和交流電源620。電源620可以被用于將AC電流施用于探針-目標(biāo)復(fù)合體,如本文中所述。因此,交流電源620可以在光學(xué)檢測(cè)腔640中產(chǎn)生交流場(chǎng)。
在某些方面,其中利用的是拉曼檢測(cè)裝置,分離通道足夠窄,以便在統(tǒng)計(jì)學(xué)上一次僅一個(gè)探針-目標(biāo)復(fù)合體占據(jù)檢測(cè)腔。例如,通道可以在0.5至10微米范圍內(nèi),因?yàn)閷?duì)于光學(xué)檢測(cè)來說,激光光斑(laser spot)尺寸在正常情況下大于0.3微米,通常1至5微米。在這些方面,光學(xué)組件進(jìn)一步包括用于拉曼光譜術(shù)的光源,諸如Ar-離子激光。
MEMS是包括機(jī)械元件、傳感器、執(zhí)行器和電子器件的集成系統(tǒng)。所有這些組件通過微加工技術(shù)在普通的芯片上制造,所述芯片為硅基或等同的基質(zhì)(例如,Voldman et al.,Ann.Rev.Biomed.Eng.1401-425,1999)。MEMS的傳感器組件可以被用來測(cè)量機(jī)械、熱、生物、化學(xué)、光學(xué)和/或磁現(xiàn)象,以檢測(cè)標(biāo)記。電子器件可以處理來自傳感器的信息,并控制執(zhí)行器組件,諸如泵、閥、加熱器等,從而控制MEMS的功能。
MEMS的電子組件可以使用集成電路(IC)工藝(如CMOS、Bipolar工藝)制造。它們可以使用在計(jì)算機(jī)芯片制造中已知的光刻蝕和蝕刻方法來成型。微機(jī)械組件可以用相容的“微機(jī)械加工”工藝制造,該工藝選擇性地蝕刻掉部分的硅晶片或加入新的結(jié)構(gòu)層,從而形成機(jī)械和/或機(jī)電組件。
制造MEMS的基本技術(shù)包括,在基質(zhì)上沉積薄膜材料,通過一些石印方法(lithographic method)在膜頂部施加具有一定圖案的掩模,并選擇性地蝕刻該膜。薄膜的厚度可以在幾納米至100納米的范圍內(nèi)。使用的沉積技術(shù)可以包括化學(xué)方法,諸如化學(xué)氣相沉積(CVD)、電解沉積、外延生長和熱氧化,和物理程序,諸如物理氣相沉積(PVD)和鑄造。也可以使用制造納米機(jī)電系統(tǒng)的方法(參見,例如Craighead,Science 2901532-36,2000)。
在一些實(shí)施方案中,儀器和/或檢測(cè)儀可以被連接到各種充滿流體的腔室,諸如微流態(tài)通道或納米通道。設(shè)備的這些組件和其他組件可以形成為單個(gè)單元,例如,芯片(例如半導(dǎo)體芯片)和/或微毛細(xì)管或微流態(tài)芯片的形式。作為選擇,各個(gè)組件可以分別制造并連接在一起。已知用于此類芯片的任何材料都可以用于本公開的設(shè)備,例如硅、二氧化硅、聚二甲基硅氧烷(PDMS)、聚甲基丙烯酸甲酯(PMMA)、塑料、玻璃、石英等。
分批制造芯片的技術(shù)是計(jì)算機(jī)芯片制造和/或微毛細(xì)管芯片制造領(lǐng)域已知的。此類芯片可以用本領(lǐng)域任何已知的方法制造,諸如照相平版法和蝕刻、激光燒蝕、注塑、鑄造、分子束取向生長、浸蘸筆納米平版法、化學(xué)氣相沉積(CVD)加工、電子束或聚焦離子束技術(shù)或印跡技術(shù)。非限定性例子包括常規(guī)模塑;二氧化硅的干法蝕刻;電子束平版印刷。制造納米機(jī)電系統(tǒng)的方法可用于某些實(shí)施方案(參見,例如Craighead,Science 2901532-36,2000)。各種形式的微制造芯片可以從商業(yè)渠道獲得,例如Caliper Technologies Inc.(Mountain View,CA)和ACLARA BioSciences Inc.(Mountain View,CA)。
在某些實(shí)施方案中,設(shè)備的部分或全部可以被選擇為對(duì)用于拉曼光譜術(shù)或熒光檢測(cè)的處于激發(fā)和發(fā)射頻率的電磁輻射是透明的。合適的組件可以由材料諸如玻璃、硅、石英或光學(xué)上清晰的其它任何材料制成。對(duì)于可以暴露于各種分析物諸如核酸、蛋白質(zhì)和類似物的充滿流體的室,暴露于這些分子的表面可以通過涂覆被修飾,以便例如將疏水性表面轉(zhuǎn)化為親水性表面,和/或減少分子吸附到表面。對(duì)普通的芯片材料諸如玻璃、硅、石英和/或PDMS的表面修飾是已知的(如美國專利6,263,286)。此類修飾可以包括例如用可商業(yè)獲得的毛細(xì)涂料(Supelco,Bellafonte,PA)、具有各種功能基團(tuán)(諸如聚環(huán)氧乙烷或丙烯酰胺等)的硅烷進(jìn)行涂覆。
在某些實(shí)施方案中,這樣的MEMS設(shè)備可以被用于制備標(biāo)記的探針,用于將形成的標(biāo)記探針與未被并入的組分分離,從而將標(biāo)記的探針暴露于目標(biāo),和/或檢測(cè)結(jié)合到目標(biāo)的標(biāo)記探針。
本發(fā)明還包括試劑盒,其用于實(shí)施測(cè)定目標(biāo)核酸的目標(biāo)位置上的核苷酸發(fā)生的分析。該試劑盒包括標(biāo)記有第一和第二熒光或拉曼標(biāo)記的第一寡核苷酸探針,如上文所公開。第一探針基本上或完全地與目標(biāo)核酸互補(bǔ)。第一和第二熒光或拉曼標(biāo)記(即供體或受體)是當(dāng)響應(yīng)于用預(yù)先確定的波長或波長帶的光對(duì)供體的激活時(shí),能夠相互間進(jìn)行熒光共振能量轉(zhuǎn)移或拉曼能量轉(zhuǎn)移的供體/受體對(duì)。該試劑盒還可以包括銀膠體或納米顆粒。此外,該試劑盒可以包括拉曼活性表面。
在本發(fā)明的某些實(shí)施方案中,實(shí)施本發(fā)明任何實(shí)施方案的方法的系統(tǒng)可以包括信息處理和控制系統(tǒng)。這些實(shí)施方案并不限制所使用的信息處理系統(tǒng)的類型。此系統(tǒng)可以被用于分析獲自拉曼光譜儀檢測(cè)系統(tǒng)或熒光檢測(cè)系統(tǒng)的數(shù)據(jù)。一個(gè)示例性的信息處理系統(tǒng)可以包含計(jì)算機(jī),其包括用于信息交流的總線和用于信息處理的處理器。在一個(gè)實(shí)施方案中,處理器可以選自Pentium系列處理器,包括但不限于PentiumII系列、PentiumIII系列和Pentium4系列處理器,它們可以從Intel Corp.(Santa Clara,CA)獲得。在本發(fā)明可選的實(shí)施方案中,處理器可以是Celeron、Itanium、X-Scale或Pentium Xeon處理器(Intel Corp.,Santa Clara,CA)。在本發(fā)明的各種其他實(shí)施方案中,處理器可以基于Intel結(jié)構(gòu),如IntelIA-32或IntelIA-64結(jié)構(gòu)。作為選擇,可以使用其他處理器。
計(jì)算機(jī)還可以包括隨機(jī)存取存儲(chǔ)器(RAM)或其他動(dòng)態(tài)存儲(chǔ)裝置、只讀存儲(chǔ)器(ROM)或其他靜態(tài)存儲(chǔ)器,和數(shù)據(jù)存儲(chǔ)裝置諸如磁盤或光盤和它的相應(yīng)的驅(qū)動(dòng)器。信息處理系統(tǒng)還可以包括本領(lǐng)域已知的任何外圍設(shè)備,例如顯示裝置(例如陰極射線管或液晶顯示器)、文字?jǐn)?shù)字輸入裝置(例如鍵盤)、光標(biāo)控制裝置(例如鼠標(biāo)、追蹤球或光標(biāo)方向鍵)和通信裝置(例如用于連接到以太網(wǎng)、令牌網(wǎng)或其他類型的網(wǎng)絡(luò)的調(diào)制解調(diào)器、網(wǎng)絡(luò)接口卡或接口裝置)。
在本發(fā)明特定的實(shí)施方案中,將拉曼光譜儀檢測(cè)系統(tǒng)或熒光檢測(cè)系統(tǒng)連接到信息處理系統(tǒng)。來自拉曼光譜儀或熒光檢測(cè)儀的數(shù)據(jù)可以由處理器處理,并將數(shù)據(jù)儲(chǔ)存在主存儲(chǔ)器中。處理器可以分析來自拉曼光譜儀或熒光檢測(cè)儀的數(shù)據(jù),以鑒定和/或測(cè)定連接到表面的標(biāo)記探針的序列。通過比對(duì)重疊的標(biāo)記探針的序列,計(jì)算機(jī)可以編輯目標(biāo)核酸的序列。
在本發(fā)明的某些實(shí)施方式中,可以使用客戶定制軟件包來分析由檢測(cè)技術(shù)獲得的數(shù)據(jù)。在本發(fā)明的可選實(shí)施方式中,可以使用信息處理系統(tǒng)及公開可利用的軟件包,進(jìn)行數(shù)據(jù)分析??捎糜贒NA序列分析的有用軟件的非限制性例子包括PRISM3 DNA測(cè)序分析軟件(Applied Biosystems,F(xiàn)oster City,CA)、Sequencher3軟件包(Gene Codes,Ann Arbor,MI)和可通過美國國家生物技術(shù)信息機(jī)構(gòu)(NationalBiotechnology Information Facility)獲得的各種軟件包,網(wǎng)址為nbif.org/links/1.4.1.php。
用于標(biāo)記探針的制備、使用和/或檢測(cè)的設(shè)備可以被整合入較大的設(shè)備和/或系統(tǒng)中。在某些實(shí)施方案中,設(shè)備可以包括微-電-機(jī)械系統(tǒng)(MEMS),如上公開。
下述實(shí)施例旨在舉例說明本發(fā)明而不是限制本發(fā)明。
實(shí)施例1通過加入胺基團(tuán)導(dǎo)致的寡核苷酸的拉曼強(qiáng)度增強(qiáng) 該實(shí)施例舉例說明了通過將胺基團(tuán)結(jié)合到寡核苷酸而提供的增加的強(qiáng)度。寡核苷酸由Qiagen-Operon(Alameda CA)專門合成并經(jīng)HPLC純化。使用本領(lǐng)域已知的技術(shù),在寡核苷酸合成期間或之后,將氨基基團(tuán)加入到3′末端、5′末端或者3′末端和5′末端兩者上。使用氬離子激光器產(chǎn)生的514nm光,通過拉曼光譜術(shù)檢測(cè)拉曼信號(hào)。
如圖4A和4C所示,通過將具有6碳烷基鏈的伯氨基基團(tuán)加入到寡核苷酸的末端,由僅僅包括鳥苷重復(fù)和隨后的胸苷重復(fù)的寡核苷酸產(chǎn)生的拉曼光譜的強(qiáng)度被增加。如在圖4B中所示,隨著加入具有6碳烷基鏈的伯氨基基團(tuán),也能看見類似的增強(qiáng)效果,其中鳥苷和胸苷殘基更隨機(jī)地排列于序列中,其中一個(gè)或多個(gè)伯氨基基團(tuán)被結(jié)合到探針寡核苷酸的末端或內(nèi)部。對(duì)于包括嘌呤核苷酸的寡核苷酸,由伯胺引起的增強(qiáng)不那么明顯(圖4D)。因此,該實(shí)施例說明,帶正電荷的增強(qiáng)子增強(qiáng)了包括嘧啶殘基的寡核苷酸的拉曼信號(hào)。
實(shí)施例2使用熒光對(duì)檢測(cè)單核苷酸錯(cuò)配 該實(shí)施例舉例說明了一種方法,其中熒光對(duì)被用于檢測(cè)目標(biāo)核酸和寡核苷酸探針之間的單個(gè)核苷酸錯(cuò)配。使用已知的方法,由Qiagen-Operon合成寡核苷酸,對(duì)其進(jìn)行HPLC純化,并用ROX或TAMRA標(biāo)記。使用LS55(Perkin Elmer)進(jìn)行同步熒光掃描。在離子強(qiáng)度和pH方面類似于生理?xiàng)l件的條件下,進(jìn)行雜交。更具體地,雜交在包括100mM NaCl、10mM Tris HCl和1mM EDTA的雜交反應(yīng)混合物中在22℃進(jìn)行。
圖5提供了使用標(biāo)記的寡核苷酸探針檢測(cè)目標(biāo)位置上的寡核苷酸發(fā)生的例子,如本文中所公開。如圖5A中所示,熒光標(biāo)記Rox 560和Tamra 570被連接到合成的寡核苷酸序列(RTI)510。標(biāo)記的寡核苷酸探針被用作探針(RTI)510,以檢測(cè)目標(biāo)核酸520(TA)、530(TC)、540(TG)和550(TT)中的單核苷酸差異。四個(gè)目標(biāo)核酸520、530、540和550僅在對(duì)應(yīng)于標(biāo)記的寡核苷酸探針510中結(jié)合到TAMRA的核苷酸的核苷酸位置上有差異(在目標(biāo)核酸520、530、540和550中,分別為A、C、G和T)。在離子強(qiáng)度和pH值方面類似于生理鹽水的溶液中,標(biāo)記的寡核苷酸探針510和目標(biāo)核酸520、530、540和550形成探針-目標(biāo)復(fù)合體。
圖5B顯示了來自熒光分析的數(shù)據(jù),所述熒光分析使用了圖5A的探針-目標(biāo)系統(tǒng)。在同步掃描光譜(δ=30nm)中的差異表明,在這些探針-目標(biāo)復(fù)合體中,Rox和Tamra之間的相對(duì)距離存在差異。所述差異最有可能是由錯(cuò)配的堿基引起的。
盡管本發(fā)明已經(jīng)參考上述實(shí)施例而被描述,將被理解的是,對(duì)其所作的修飾和變化包含在本發(fā)明的精神和范圍之內(nèi)。因此,本發(fā)明僅僅由權(quán)利要求書限定。
權(quán)利要求
1.一種測(cè)定目標(biāo)核酸的核苷酸序列的方法,包括a)將該核酸或其片段與一群捕獲寡核苷酸探針接觸,以形成包括單鏈伸出端的探針-目標(biāo)雙鏈體核酸,所述一群捕獲寡核苷酸探針結(jié)合到基質(zhì)的一系列點(diǎn)位置上;b)將所述探針-目標(biāo)雙鏈體核酸與一群拉曼活性寡核苷酸探針接觸,以允許所述拉曼探針與所述單鏈伸出端結(jié)合,其中每一拉曼活性寡核苷酸探針產(chǎn)生獨(dú)特的拉曼特征;c)使用拉曼光譜術(shù)檢測(cè)結(jié)合模板核酸的拉曼活性寡核苷酸探針;和e)鑒定每一個(gè)被捕獲的拉曼活性寡核苷酸探針的點(diǎn)位置,從而測(cè)定所述目標(biāo)核酸的核苷酸序列。
2.權(quán)利要求1的方法,其中每一拉曼活性寡核苷酸探針固有地產(chǎn)生可檢測(cè)到的拉曼信號(hào),或包括具有獨(dú)特光譜的拉曼標(biāo)記或帶正電荷的增強(qiáng)子。
3.權(quán)利要求2的方法,其中至少一個(gè)所述的拉曼活性寡核苷酸包括帶正電荷的增強(qiáng)子。
4.權(quán)利要求3的方法,其中所述帶正電荷的增強(qiáng)子是胺基團(tuán)。
5.權(quán)利要求1的方法,其中至少一個(gè)所述的拉曼活性寡核苷酸包括復(fù)合有機(jī)-無機(jī)納米顆粒。
6.權(quán)利要求1的方法,其中被測(cè)定的核苷酸序列是在目標(biāo)核苷酸位置上的核苷酸發(fā)生。
7.權(quán)利要求6的方法,其中所述目標(biāo)位置是單核苷酸多態(tài)性位置。
8.權(quán)利要求1的方法,其中被測(cè)定的核苷酸序列是目標(biāo)片段的相鄰位置上的一系列核苷酸發(fā)生。
9.權(quán)利要求8的方法,其中所述目標(biāo)片段小于或等于所述捕獲寡核苷酸探針和所述拉曼活性寡核苷酸探針的組合長度。
10.權(quán)利要求8的方法,其中所述目標(biāo)片段小于或等于所述拉曼活性寡核苷酸探針的長度。
11.權(quán)利要求8的方法,其中通過比對(duì)被檢測(cè)的目標(biāo)序列,整個(gè)目標(biāo)核酸的核苷酸序列得以測(cè)定。
12.權(quán)利要求1的方法,還包括將所述捕獲寡核苷酸探針與拉曼活性寡核苷酸探針連接起來,所述拉曼活性寡核苷酸探針結(jié)合到所述目標(biāo)核酸的相鄰片段上。
13.權(quán)利要求1的方法,其中所述目標(biāo)核酸分離自生物來源,并與所述一群捕獲寡核苷酸探針接觸,不進(jìn)行擴(kuò)增。
14.權(quán)利要求13的方法,其中1000或更少數(shù)量的拉曼活性寡核苷酸探針分子被檢測(cè)到。
15.權(quán)利要求1的方法,其中所述基質(zhì)是生物芯片。
16.權(quán)利要求1的方法,其中所述拉曼標(biāo)記使用表面增強(qiáng)拉曼光譜術(shù)(SERS)檢測(cè)。
17.權(quán)利要求1的方法,其中將第一群拉曼活性寡核苷酸探針與在一系列點(diǎn)中的第一點(diǎn)上的所述探針-目標(biāo)雙鏈體核酸接觸,并且將第二群拉曼活性寡核苷酸探針與在所述一系列點(diǎn)中的第二點(diǎn)上的所述探針-目標(biāo)雙鏈體核酸接觸,其中所述第一群拉曼活性寡核苷酸探針和所述第二群拉曼活性寡核苷酸探針包括至少一個(gè)不同的寡核苷酸探針。
18.權(quán)利要求17的方法,其中所述第一群拉曼活性寡核苷酸探針和所述第二群拉曼活性寡核苷酸探針包括至少一個(gè)攜帶有結(jié)合到不同寡核苷酸上的相同拉曼標(biāo)記的拉曼探針。
19.一種檢測(cè)系統(tǒng),包括a)包括光源的拉曼光譜儀;b)拉曼活性表面,其與所述光源發(fā)生光通信;和c)一群拉曼活性寡核苷酸探針,其包括與帶正電荷的增強(qiáng)子關(guān)聯(lián)的不可檢測(cè)的寡核苷酸主架,其中所述拉曼活性寡核苷酸探針沉積到所述拉曼活性表面上。
20.權(quán)利要求19的方法,其中所述帶正電荷的增強(qiáng)子是胺基團(tuán)增強(qiáng)子。
21.權(quán)利要求19的方法,其中所述拉曼活性表面是生物芯片。
22.一種檢測(cè)模板核酸的目標(biāo)核苷酸位置上的核苷酸發(fā)生的方法,包括a)提供結(jié)合目標(biāo)多核苷酸的標(biāo)記的寡核苷酸探針;其中,所述標(biāo)記的寡核苷酸探針包括第一標(biāo)記和第二標(biāo)記,基于所述第一標(biāo)記相對(duì)于所述第二標(biāo)記的定向,所述第一標(biāo)記影響由所述第二標(biāo)記產(chǎn)生的拉曼光譜或熒光信號(hào);b)將所述標(biāo)記的寡核苷酸探針與所述目標(biāo)多核苷酸接觸,以形成探針-目標(biāo)復(fù)合體;和c)檢測(cè)由所述第二標(biāo)記產(chǎn)生的熒光信號(hào)或拉曼光譜,其中在所述目標(biāo)核苷酸位置上的核苷酸發(fā)生影響所述第一標(biāo)記相對(duì)于所述第二標(biāo)記的定向,從而影響由所述第二標(biāo)記產(chǎn)生的所述熒光信號(hào)或拉曼光譜,和允許測(cè)定在所述目標(biāo)核苷酸位置上的核苷酸發(fā)生。
23.權(quán)利要求22的方法,其中熒光信號(hào)被檢測(cè)。
24.權(quán)利要求23的方法,其中所述第一標(biāo)記和所述第二標(biāo)記是FRET對(duì)。
25.權(quán)利要求24的方法,其中一種標(biāo)記是TAMRA,另一種標(biāo)記是ROX。
26.權(quán)利要求22的方法,其中拉曼光譜被檢測(cè)。
27.權(quán)利要求26的方法,還包括將所述被檢測(cè)的拉曼光譜與已知光譜的數(shù)據(jù)庫進(jìn)行比較,從而鑒定在所述目標(biāo)多核苷酸的所述目標(biāo)核苷酸位置上的核苷酸發(fā)生。
28.權(quán)利要求22的方法,其中所述第一標(biāo)記和所述第二標(biāo)記在被標(biāo)記的探針序列上相距約3-6nm。
29.權(quán)利要求22的方法,其中使用一群被標(biāo)記的探針來測(cè)定一個(gè)或多個(gè)目標(biāo)核苷酸的一系列核苷酸發(fā)生。
30.權(quán)利要求29的方法,其中探針-目標(biāo)復(fù)合體單獨(dú)地經(jīng)過光學(xué)檢測(cè)儀,從而讀取由所述探針-目標(biāo)復(fù)合體產(chǎn)生的熒光信號(hào)或拉曼光譜。
31.權(quán)利要求29的方法,其中使用微機(jī)電系統(tǒng)使各個(gè)探針-目標(biāo)復(fù)合體單獨(dú)地經(jīng)過光學(xué)檢測(cè)儀,所述微機(jī)電系統(tǒng)具有足夠窄到僅允許一個(gè)探針-目標(biāo)復(fù)合體經(jīng)過的通道。
32.權(quán)利要求22的方法,其中在檢測(cè)所述探針之前,將交流電(AC)施用于所述探針-目標(biāo)復(fù)合體,從而增加在所述第一探針對(duì)所述第二探針熒光信號(hào)或拉曼光譜的影響中的差異,所述差異取決于所述目標(biāo)多核苷酸和所述標(biāo)記探針在所述目標(biāo)核苷酸位置是否含有互補(bǔ)的核苷酸。
33.一種檢測(cè)核酸的方法,包括a)用光照射所述核酸,其中所述核酸包括帶正電荷的增強(qiáng)子;和b)檢測(cè)由照射的核酸產(chǎn)生的拉曼信號(hào)。
34.權(quán)利要求33的方法,其中所述帶正電荷的增強(qiáng)子是胺基團(tuán)。
35.權(quán)利要求33的方法,其中在沒有所述帶正電荷的增強(qiáng)子的情況下,所述核酸不產(chǎn)生可檢測(cè)到的信號(hào)。
36.權(quán)利要求33的方法,其中所述核酸由嘧啶殘基組成。
全文摘要
本發(fā)明提供了核酸測(cè)序方法,該方法基于對(duì)寡核苷酸探針的拉曼特征的檢測(cè)。檢測(cè)各個(gè)被捕獲的核酸探針的拉曼特征,可選地,所述核酸探針用拉曼標(biāo)記或帶正電荷的增強(qiáng)子標(biāo)記。被捕獲的探針的序列被用于鑒定被捕獲的探針和互補(bǔ)的目標(biāo)核酸的核苷酸序列,它們?nèi)缓蟊槐葘?duì),并被用于獲得核酸序列信息。在另一實(shí)施方案中,提供了測(cè)定目標(biāo)核酸的目標(biāo)核苷酸位置上的核苷酸發(fā)生的方法,其利用目標(biāo)核酸與結(jié)合該目標(biāo)核酸的標(biāo)記寡核苷酸探針的結(jié)合,其中標(biāo)記的寡核苷酸探針包括第一標(biāo)記和第二標(biāo)記,所述第一標(biāo)記能夠影響第一標(biāo)記的光學(xué)特性。
文檔編號(hào)C12Q1/68GK1898398SQ200480038783
公開日2007年1月17日 申請(qǐng)日期2004年12月24日 優(yōu)先權(quán)日2003年12月29日
發(fā)明者X·蘇 申請(qǐng)人:英特爾公司