專利名稱:基因組分布分析:一種檢測復(fù)雜生物樣品中多種類型生物的存在的快速方法
背景技術(shù):
本發(fā)明涉及從復(fù)雜生物樣品如機(jī)體樣品(如血液、尿、痰和糞便)中獲取遺傳信息。在醫(yī)學(xué)上,鑒定所述樣品中的傳染性生物對于感染的最佳治療和保持公共衛(wèi)生是重要的。確定患者是否患有遺傳性疾病和法醫(yī)鑒定也極大依賴于對機(jī)體樣品的遺傳信息的分析。
雖然目前用于診斷傳染因子的程序包括整套復(fù)雜的幾百種測試,但很大一部分傳染性生物常常沒有被檢測出來。例如,在鑒定肺炎患者體內(nèi)的傳染因子的嘗試中,成功率僅約一半,而肺炎是美國由傳染病引起的死亡的最常見的死因。
許多疾病如肺炎、腦膜炎和急性胃腸疾病的特征在于可以由多種傳染因子引起的一組癥狀(“表現(xiàn)(presentation)”)。還不存在掃描所有通常引起這樣的疾病的病原體的單一測試。(我稱這樣的測試為“表現(xiàn)特異性測試”。)目前的程序常常僅測試一種類型致病生物的存在。這中間存在問題,因?yàn)槌31仨殞σ粋€樣品進(jìn)行許多不同的測試,這增加了費(fèi)用、鑒定所需時間以及錯誤的可能性。
另外,許多程序?qū)τ谌粘?yīng)用來說太昂貴。例如,可能需要幾百美元來對一種特定病毒進(jìn)行測試。衛(wèi)生保健提供者必須權(quán)衡這種費(fèi)用,尤其是考慮到鑒定傳染因子可能需要多項(xiàng)測試。
大多數(shù)目前的診斷測試需要培養(yǎng)傳染因子以獲得大量的生物。不幸的是,許多類型的生物無法在醫(yī)院實(shí)驗(yàn)室內(nèi)進(jìn)行常規(guī)培養(yǎng)。大多數(shù)病毒和寄生蟲以及許多細(xì)菌屬于這種類型。對于可以培養(yǎng)的生物,培養(yǎng)可能需要的幾天或甚至幾周,這就浪費(fèi)了寶貴的時間。因此,患有例如細(xì)菌性腦膜炎的患者的生命非常依賴于立即治療,但最佳的治療可能需要由于培養(yǎng)而引起的耗時和威脅生命的延遲。其它傳染因子,如導(dǎo)致肺結(jié)核的細(xì)菌,一般需要幾周以在培養(yǎng)物中生長。在鑒定(以及最佳治療)上的延遲可能導(dǎo)致患有肺結(jié)核的患者將這種高度傳染性的疾病傳染給許多其他人。
目前在醫(yī)院中實(shí)行的診斷測試僅產(chǎn)生在樣品中存在的生物種類的粗略鑒定。在許多情況下,很難將一種致病生物與一種密切相關(guān)的非病原體區(qū)別開來。
此外,為鑒定一種病原體,一個樣品可能需要在幾個不同的實(shí)驗(yàn)室由幾組人員進(jìn)行許多測試,而每一組人員都接受不同類型的專業(yè)訓(xùn)練。配備必要專業(yè)人員所需的費(fèi)用是診斷學(xué)實(shí)驗(yàn)室的預(yù)算的一項(xiàng)主要支出。同時,在不同實(shí)驗(yàn)室之間分配樣品引入了另一個誤差源,另外,如果測試需要病原體存活,那么運(yùn)輸可能成為問題。
因此,需要一種新類型的測試,所述測試是表現(xiàn)特異性的(即全面的)、有效率地檢測來自各種不同類群的大量生物的存在、能夠在相當(dāng)短的時間內(nèi)進(jìn)行(例如幾個小時)、使用單一測試的形式、并導(dǎo)致高分辨率的病原體鑒定。
從生物樣品中獲取精確的遺傳信息可以提供關(guān)于在所述樣品中存在的生物的身份和醫(yī)學(xué)上的相關(guān)屬性的信息。這是因?yàn)橛捎谶M(jìn)化趨異,每一種類型的生物都具有獨(dú)特的基因組DNA序列。DNA序列隨時間的流逝發(fā)生變化的原因包括宇宙射線的沖擊、化學(xué)誘變劑的修飾、正常DNA復(fù)制中的錯誤、遺傳重組引起的重排、以及病毒、質(zhì)粒和轉(zhuǎn)座遺傳因子的入侵。結(jié)果,單個堿基的改變積累,序列區(qū)段缺失,序列區(qū)段插入,并且染色體重排。因此,基因組是保守序列(即對于不同分類單位是共同的序列)以及作為上文枚舉的改變類型的結(jié)果的趨異序列的嵌合體。因此,測試獨(dú)特基因組筆跡(genomic signature)或基因組指紋的方法對于鑒定生物是有用的。
已經(jīng)發(fā)展了多種方法以獲得傳染性生物的DNA指紋。這些方法包括限制性片段長度多態(tài)性(RFLP)分析、擴(kuò)增片段長度多態(tài)性(AFLP)分析、脈沖電場凝膠電泳、任意引物聚合酶鏈?zhǔn)椒磻?yīng)(AR-PCR)、基于重復(fù)序列的PCR、ribotyping和比較性核酸測序。這些方法一般太慢、太昂貴、無可重復(fù)性、并且對技術(shù)過分要求,以致于不能在大多數(shù)診斷環(huán)境中使用。所有上面提到的方法一般要求使用麻煩的凝膠電泳步驟,需要在培養(yǎng)物中培養(yǎng)病原體,需要純化病原體的基因組DNA,以及要求所述樣品不包含多于一種類型的生物(這排除了直接測試復(fù)雜醫(yī)學(xué)樣品的可能性)。最近發(fā)展的依賴樣品與高密度微陣列(microarray)進(jìn)行雜交的高分辨率株鑒定法(Salazar等,Nucleic Acids Res.245056-5057,1996;Troesch等,J.Clin.Microbiol.3749-55,1999;Lashkari等,Proc.Natl.Acad.Sci.U.S.A.9413057-13062,1997)也具有相同的限制(除了對凝膠電泳的需要外)。此外,這些新的雜交方法可能對技術(shù)過分要求,因?yàn)樗鼈円话阋髮⑴c小寡核苷酸的雜交和不同程度的錯配區(qū)分開來?;诟驞NA序列的存在與否的方法將提供更健全(robust)、并因此在臨床上更有用的診斷測定。采用DNA指紋形式的精確的基于遺傳學(xué)的鑒定對于追蹤和控制在地區(qū)和在醫(yī)院中的傳染病爆發(fā)是至關(guān)重要的。在治療上,指紋分析,尤其是當(dāng)能夠以快速、不依賴于培養(yǎng)的測試提供指紋分析時,就能夠通過比目前的實(shí)踐更快地確定給予何種抗生素而挽救生命。
也已經(jīng)發(fā)展了一次測試樣品中幾種不同類型生物的存在的方法。注意到目前這樣的方法一般尚不適用于指紋分析,也就是說,不適用于在一個物種內(nèi)的密切相關(guān)的生物之間進(jìn)行區(qū)分。不需要培養(yǎng)而一次測試幾種生物的存在的方法是多重PCR。多重PCR和其它多重擴(kuò)增方法的一個主要問題在于很難同時擴(kuò)增許多序列(當(dāng)包括更多引物序列時,擴(kuò)增假象(amplification artifact)開始積累)。由于可以使用多重PCR測試的序列數(shù)目的限制,很難建立健全的多重測試,檢測在多種不同類型生物中出現(xiàn)的多種不同序列。因此,應(yīng)用多重PCR同時測試在系統(tǒng)發(fā)生上全異的生物的最好的例子之一僅檢查九個序列,這遠(yuǎn)不足以提供表現(xiàn)特異性的測試(Grondahl等,J.Clin.Microbiol.371-7,1999)。此外,由于可以使用的診斷探針的數(shù)量的限制(僅測試每種類型生物的一種序列),該測試缺乏冗余性(這對于可重復(fù)性是重要的),僅提供傳染因子的粗略鑒定。多重PCR還對于在大多數(shù)醫(yī)學(xué)樣品中存在的抑制劑敏感,需要對技術(shù)過分要求的樣品處理以獲得健全的結(jié)果。
在遺傳上鑒定生物的一種方法涉及測試對于特定類型生物獨(dú)特的序列(或序列組)的存在。這樣的序列稱為標(biāo)識(ID)序列。例如,為檢測人類免疫缺陷病毒的存在,人們測試在該病毒類群的成員中獨(dú)特存在的DNA序列的存在。在另一個例子中,一個大腸埃希氏菌(Escherichia coli)菌株當(dāng)存在于人類胃腸道中時可能是無害的,而另一個大腸埃希氏菌菌株的存在可能是威脅生命的。雖然這樣的菌株非常密切相關(guān),但可以通過檢測在它們的DNA序列中的變異而將它們區(qū)分開來。
為將一種生物與其密切相關(guān)的親緣生物區(qū)分開來,測試在來自每個類群的每個株中以獨(dú)特組合出現(xiàn)的一組DNA序列的成員的存在是有用的。這樣的序列稱為基因組差異序列,已經(jīng)在文獻(xiàn)中描述,如在Straus(“基因組扣除”,在PCR Strategies,Innes等編輯,第220-236頁(Academic Press Inc.,San Diego,1995)),該文獻(xiàn)特此通過引用結(jié)合到本文中?;蚪M差異序列是與一種生物的基因組雜交,但不與另一種不同但密切相關(guān)的生物的基因組雜交的DNA序列。如在Straus(1995,見上文)中所述,例如,可以通過用兩種不同生物的基因組進(jìn)行扣除雜交,制備基因組差異序列。得到的基因組差異序列組成一組核酸序列,該組序列在一種基因組扣除樣品中存在,但在另一組基因組扣除樣品中不存在。例如,在一個大腸埃希氏菌病原株和一個大腸埃希氏菌非病原株的基因組之間進(jìn)行扣除,分離出一組基因組差異序列,該組差異序列中的每一種序列都與所述致病株的核酸雜交,但不與所述非致病株的核酸雜交。
已經(jīng)將多種不同的基因組扣除方法應(yīng)用于成對的相關(guān)株,以分離病原體特異性基因組差異序列(例如,Mahairas等,Journal ofBacteriology 1781274-1282,1996;Tinsley等,Proc.Natl.Acad.Sci.U.S.A.9311109-11114,1996)。已經(jīng)應(yīng)用這樣的序列作為診斷標(biāo)記以鑒定其它密切相關(guān)的株和對所述株進(jìn)行指紋分析(見,例如,Darrasse等,Applied and Environmental Microbiology 60298-306,1994)。簡要地說,應(yīng)用基因組扣除于兩個相關(guān)株的基因組DNA,并分離基因組差異序列。將一組基因組差異序列與來自同一類群的其它株的基因組雜交(每種序列的雜交都在單獨(dú)的雜交反應(yīng)中進(jìn)行)。與所述基因組雜交的基因組差異序列亞組在株與株之間各不相同,并因此構(gòu)成鑒定指紋。雖然已經(jīng)顯示這種方法是鑒定一個生物類群內(nèi)密切相關(guān)的成員的有力方法,但該方法對技術(shù)過分要求、耗時、麻煩,而無法在臨床設(shè)置中執(zhí)行。此外,在這些實(shí)驗(yàn)中的基因組差異序列通常來自單一的病原株,因此僅適用于對單一類群內(nèi)的非常密切相關(guān)的株進(jìn)行分型。因此,現(xiàn)有技術(shù)不能利用基因組差異序列在一個表現(xiàn)特異性測試中同時測試來自不同生物的多種序列。
這對于將一種生物鑒定為更大的生物類群的成員也是有用的。例如,可能重要的是確定下呼吸道感染是否是由于物種百日咳博德特氏菌(Bordetella pertussis)的任一成員引起的。在這種情況下,人們可以通過核酸雜交,測試在該物種的所有菌株中出現(xiàn)、但不在任何其它物種出現(xiàn)的序列的存在。這樣的將一個類群的成員與其它類群的成員區(qū)分開來的ID序列稱為類群特異性序列。
許多最具有醫(yī)學(xué)意義和在診斷上最有用的遺傳變異是單核苷酸多態(tài)性(SNP)。例如,在珠蛋白基因上的單堿基對改變是鐮狀細(xì)胞貧血的原因。結(jié)核分枝桿菌(Mycobacterium tuberculosis)中RNA聚合酶基因的單個堿基對改變是利福平抗性的原因,其中利福平是用于治療肺結(jié)核的最重要的抗生素。已經(jīng)發(fā)展出一次檢測許多SNP的基于雜交的方法,但這些方法一般由于難以區(qū)分完全匹配和包含單個核苷酸錯配的匹配而缺乏健全性(Gingeras等,Genome Res.8435-438,1998;Wan等,Science 2801077-1082,1998)。一些用于辨別SNP的基因型的方法僅測試在單個基因上的突變(Gingeras等,1998,見上文)。其它方法依賴于,不具有可重現(xiàn)性的多重PCR法。因此,需要利用健全的雜交和擴(kuò)增方法學(xué)一次辨別許多SNP的基因型的方法。
因此,為鑒定生物,測試ID序列的存在是有用的,所述ID序列可以包括基因組差異序列和/或類群特異性序列。不用培養(yǎng)醫(yī)學(xué)樣品而測試ID序列需要檢測少量基因組(如100-1000個基因組)的方法。已經(jīng)發(fā)展出依賴于核酸擴(kuò)增的靈敏方法,但一般地說,如同上文關(guān)于多重PCR所描述的,這些方法僅能可靠地一次應(yīng)用于非常少量的序列。因此,已經(jīng)批準(zhǔn)用于臨床使用的基于擴(kuò)增的靈敏方法一次僅測試一種或二種病原體。這些測試比在臨床實(shí)驗(yàn)室中進(jìn)行的標(biāo)準(zhǔn)微生物測試昂貴得多(通常是約100倍)。因此,基于擴(kuò)增的測定的商業(yè)化發(fā)展一直局限于一個小亞組的導(dǎo)致常見和嚴(yán)重的感染、并且不能在培養(yǎng)物中容易地生長的生物(如HIV、結(jié)核分枝桿菌、和沙眼衣原體(Chlamydiatrachomatis))。需要擴(kuò)展這種技術(shù)對于日常診斷的能力和靈敏度。
最后,定量生物樣品中的病原體數(shù)量常常是重要的。例如,用于診斷下呼吸道感染(如肺炎)的樣品常常受到來自上呼吸道的正常共生菌群的污染。許多在上呼吸道無害的物種在破壞呼吸系統(tǒng)的正常防御后可能成為下呼吸道感染的原因,這進(jìn)一步增加了診斷復(fù)雜性。在這種情況下,關(guān)于在下呼吸道樣品中的生物數(shù)量的知識對于區(qū)別上呼吸道污染和下呼吸道感染是重要的。
假如能夠培養(yǎng)所述生物,那么定量分析臨床樣品中的病原體是相對簡單的。然而,許多在醫(yī)學(xué)上重要的生物難以或不可能培養(yǎng)(如大多數(shù)病毒、寄生蟲、衣原體和厭氧性細(xì)菌)。此外,定量培養(yǎng)通常需要幾天,在某些情況下需要一個月以上,如培養(yǎng)引起肺結(jié)核的結(jié)核分枝桿菌。在有限的情況下,通過不需要培養(yǎng)的方法可以獲得定量數(shù)據(jù),例如直接免疫熒光測定。用于定量分析病原體的新的分子生物學(xué)方法,如定量聚合酶鏈?zhǔn)椒磻?yīng)(PCR)已經(jīng)對于監(jiān)測AIDS患者體內(nèi)的病毒水平非常重要。然而,定量擴(kuò)增方法極其難于正確設(shè)計(jì),可能是沒有重復(fù)性的,目前一次僅能應(yīng)用于單個物種。
因此,需要測定生物樣品或臨床樣品中病原體數(shù)量的方法。這樣的方法最好是快速而普遍適用的,即該方法不需要培養(yǎng)并且可以定量在樣品中可能存在的多種類型生物。
總的來說,需要健全而靈敏的鑒定方法,快速而準(zhǔn)確地測試未經(jīng)培養(yǎng)的樣品中大量病原體特異性序列(基因組差異序列和類群特異性序列和單核苷酸多態(tài)性),所述病原體特異性序列是可以引起特定表現(xiàn)(如肺炎)的一組不同傳染因子的鑒別。也需要這樣一種測試以提供關(guān)于該樣品所來自的個體的醫(yī)學(xué)和法醫(yī)信息。
因此,本發(fā)明的一個方面是從可能包含靶核酸分子的生物樣品中獲取遺傳信息的方法,該方法包括(a)提供這樣的核酸分子,即(i)樣品中的靶核酸分子,或(ii)與樣品中靶核酸分子雜交的探針,或(iii)(i)或(ii)的擴(kuò)增產(chǎn)物,或(iv)(i)的基因組代表(genomic representation);(b)通過將(a)的核酸分子與最小基因組起源(genomic derivation)大于5(如大于11)并且包括能夠檢測靶核酸分子的檢測序列的一個檢測集合(ensemble)相接觸或比較,檢測靶核酸分子。該方法還可以包括步驟(c)鑒定在步驟(b)中檢測到的核酸分子。
在優(yōu)選的實(shí)施方案中,步驟(a)的核酸分子在步驟(a)之前并不作為以大小分級的片段固定化在基質(zhì)或固相支持體上;所述擴(kuò)增步驟使用少于四對(如一對)擴(kuò)增序列進(jìn)行,如果靶核酸分子在所述樣品中存在,則將產(chǎn)生擴(kuò)增產(chǎn)物;以及通過原位雜交用所述方法定量在生物樣品中的靶生物。
在下面實(shí)施例2中作為例子展示的該方法的優(yōu)選形式涉及在步驟(a)之前,使所述樣品的核酸分子同時與用于產(chǎn)生上面步驟(a)(ii)的探針的ID探針集合雜交的步驟。
步驟(a)(ii)的探針最好包括(i)能夠與靶核酸分子雜交的第一個區(qū),和(ii)擴(kuò)增序列??梢赃M(jìn)行雜交,以便使步驟(a)中的所有核酸分子都處于液相中,或者使得步驟(a)中的至少一部分核酸分子固定到固相支持體上。此外,至少步驟(a)的一些核酸分子可以包括一個或多個寡核苷酸標(biāo)記。
至少步驟(a)(ii)的一些探針可以包括(i)在與靶核酸分子雜交時可以相互連接的兩種或更多種寡核苷酸,和(ii)擴(kuò)增序列。
在另一實(shí)施方案中,所述核酸探針集合的至少50%的探針能夠與在所述樣品或所述樣品的基因組代表中可能存在的預(yù)定的基因組差異序列雜交。
在一個優(yōu)選的實(shí)施方案中,如上面所述可以與另一寡核苷酸連接的寡核苷酸是SNP探針。至少部分所述SNP探針可以包括標(biāo)記序列,所述標(biāo)記序列能夠與包含標(biāo)記序列集合的檢測集合中的一種標(biāo)記序列雜交。在這些實(shí)施方案中所述檢測集合的最小基因組起源可以是,例如,大于二十(如大于五十)。
在一些優(yōu)選實(shí)施方案中,所述檢測集合的檢測序列作為兩維的點(diǎn)或作為平行帶(strip)在固相支持體上排列。
在另一實(shí)施方案中,通過使用不多于四對的擴(kuò)增序列擴(kuò)增步驟(a)(i)的靶核酸分子,產(chǎn)生步驟(a)(iv)的擴(kuò)增產(chǎn)物,所述擴(kuò)增序列如指導(dǎo)使用Alu特異性引物擴(kuò)增處于Alu重復(fù)序列間的序列的擴(kuò)增序列。在這些實(shí)施方案中,(b)的檢測集合可以包括與在步驟(a)(iv)中可能擴(kuò)增的ID探針相應(yīng)的ID位點(diǎn)。
本發(fā)明可以用于檢測和定量任何類型的生物。例如,在一個優(yōu)選實(shí)施方案中,ID探針集合包括與來自分別屬于不同屬的至少十種不同的病毒、每種病毒至少兩種不同核酸分子雜交的探針。
本發(fā)明可以連同許多類型的生物樣品使用,所述生物樣品包括臨床樣品。在一個實(shí)施例中,所述生物樣品是來自人類胃腸道的樣品,并且使用本發(fā)明的方法所獲得的遺傳信息可以鑒定所述樣品中來自六種或更多種以下生物的核酸分子大腸埃希氏菌、沙門氏菌屬(Salmonella)、志賀氏菌屬(Shigella)、小腸結(jié)腸炎耶爾森氏菌(Yersiniaenterocolitica)、霍亂弧菌(Vibrio cholera)、糞彎曲桿菌(Campylobacterfecalis)、艱難梭菌(Clostridium difficile)、輪狀病毒屬(Rotavirus)、諾沃克病毒(Norwalk virus)、星狀病毒屬(Astrovirus)、腺病毒屬(Adenovirus)、冠狀病毒屬(Coronavirus)、蘭氏賈第鞭毛蟲(Giardialamblia)、溶組織內(nèi)阿米巴(Entamoeba histolytica)、人酵母菌(Blastocystishominis)、隱孢子蟲屬(Cryptosporidium)、Microsporidium、美洲板口線蟲(Necator americanus)、人蛔蟲(Ascaris lumbricoides)、毛首鞭蟲(Trichuris trichiura)、蟯蟲(Enterobius vermicularis)、糞類圓線蟲(Strongyloides stercoralis)、麝后睪吸蟲(Opsthorchis viverrini)、華支睪吸蟲(Clonorchis sinensis)和短膜殼絳蟲(Hymenoplepis nana)。
在另一實(shí)施方案中,所述生物樣品是呼吸道樣品,并且所述遺傳信息可以鑒定來自以下六種或更多種生物的核酸分子白喉棒桿菌(Cornybacterium diphtheriae)、結(jié)核分枝桿菌(Mycobacteriumtuberculosis)、肺炎支原體(Mycoplasma pneumoniae)、沙眼衣原體(Chlamydia trachomatis)、肺炎衣原體(Chlamydia pneumoniae)、百日咳博德特氏菌(Bordetella pertussis)、軍團(tuán)菌(Legionella spp.)、諾卡氏菌(Nocardia spp.)、肺炎鏈球菌(Streptococcus pneumoniae)、流感嗜血菌(Haemophilus influenzae)、鸚鵡熱衣原體(Chlamydia psittaci)、銅綠假單胞菌(Pseudomonas aeruginosa)、金黃色葡萄球菌(Staphylococcusaureus)、莢膜組織胞漿菌(Histoplasma capsulatum)、Coccidoidesimmitis、新型隱球酵母(Cryptococcus neoformans)、皮炎芽生菌(Blastomyces dermatitidis)、卡氏肺囊蟲(Pneumocystis carinii)、呼吸道合胞病毒、腺病毒屬(Adenovirus)、單純皰疹病毒、流感病毒、副流感病毒和鼻病毒屬(Rhinovirus)。
另一種可以根據(jù)本發(fā)明測試的生物樣品是血液樣品,其中鑒定來自至少六種以下生物的核酸分子凝固酶陰性葡萄球菌、金黃色葡萄球菌、Viridans streptococci、腸球菌屬(Enterococcus spp.)、β溶血性鏈球菌、肺炎鏈球菌、埃希氏菌(Escherichia spp.)、克雷伯氏菌(Klebsiellaspp.)、假單胞菌(Pseudomonas spp.)、腸桿菌(Enterbater spp.)、變形蟲(Proteus spp.)、擬桿菌(Bacteroides spp.)、梭菌(Clostridium spp.)、銅綠假單胞菌、棒桿菌(Comybacterium spp.)、瘧原蟲(Plasmodium spp.)、杜氏利什曼原蟲(Leishmania donovani)、弓形蟲(Toxoplasma spp.)、微絲蚴(Microfilariae)、真菌、莢膜組織胞漿菌、Coccidoides immitis、新型隱球酵母、假絲酵母(Candida spp.)、HIV、單純皰疹病毒、丙型肝炎病毒、乙型肝炎病毒、巨細(xì)胞病毒屬(Cytomegalovirus)和EB病毒。
本發(fā)明還可用于鑒定在任何類型生物樣品中的核酸分子,其中所鑒定的核酸分子是以下生物中的六種或更多種的核酸分子柯薩奇病毒A、單純皰疹病毒、圣·路易腦炎病毒、EB病毒、粘液病毒、JC病毒、柯薩奇病毒B、披膜病毒、麻疹病毒、肝炎病毒、副粘病毒、艾可病毒、布尼亞病毒、巨細(xì)胞病毒、水痘-帶狀皰疹病毒、HIV、腮腺炎病毒、馬腦炎病毒、淋巴細(xì)胞性脈絡(luò)叢腦膜炎病毒、狂犬病病毒和BK病毒。
本發(fā)明還包括用于從可能包含靶核酸分子的生物樣品獲取遺傳信息的方法,所述方法包括(a)提供最小基因組起源大于五的核酸探針集合;(b)使所述探針集合同時與所述樣品的核酸分子接觸;(c)檢測在所述探針和所述樣品中任何靶核酸分子間的雜交;和(d)鑒定在步驟(c)中檢測到的核酸分子。
本發(fā)明還包括用于從生物樣品中獲取遺傳信息的試劑盒,所述試劑盒包括(a)多種ID探針和/或SNP探針;和(b)包括與(a)的探針相應(yīng)的檢測序列并且最小基因組起源大于五(如大于十一)的檢測集合。
在優(yōu)選實(shí)施方案中,(a)的探針包括多于十種(如多于五十種或多于兩百五十種)不同的可擴(kuò)增探針;(a)的至少50%的探針包括來自至少三種不同物種的基因組差異序列;(a)的探針包括多于五個家族的可擴(kuò)增探針;并且(a)的探針對于至少兩個不同分類單位、兩個不同物種、兩個不同屬或兩個不同界是特異性的。
在其它優(yōu)選實(shí)施方案中,(a)的探針包括包含以下的探針(i)在與靶核酸分子的ID序列雜交時可以相互連接的兩種或更多種寡核苷酸,和(ii)擴(kuò)增序列。
在其它實(shí)施方案中,(a)的探針和/或(b)的檢測序列物理性附著到固相支持體的不同位點(diǎn)。在這些實(shí)施方案中,檢測集合的檢測序列可以在所述支持物上彼此相鄰定位,其中所述檢測序列檢測(i)分類群的成員(ii)密切相關(guān)的分類群。
本發(fā)明還包括用于從生物樣品中獲取遺傳信息的試劑盒,所述試劑盒包括(a)能夠引發(fā)生物樣品中的靶基因組DNA中由重復(fù)序列(如人類Alu重復(fù)序列)鄰接的DNA序列的擴(kuò)增以產(chǎn)生四探針的多種核酸引物(如Alu特異性引物);和(b)檢測集合,所述檢測集合包括與使用(a)的引物可能擴(kuò)增的ID探針相應(yīng)的檢測序列,所述檢測集合的最小基因組起源大于5(如大于二十)。
本發(fā)明還包括ID探針集合,所述ID探針集合可以使用少于四對擴(kuò)增序列擴(kuò)增,包括多于三個(如多于十個或多于二十五個)ID探針家族以及多于十種(如多于五十種或多于兩百五十種)不同的ID探針。
在優(yōu)選實(shí)施方案中,多于兩個可擴(kuò)增探針家族對于不重疊的分類單位、不同物種、不同屬或不同界具有特異性。至少50%的所述探針可以包括來自至少三個不同物種的基因組差異序列。
在其它優(yōu)選實(shí)施方案中,(a)的探針包括包含以下的探針(i)在與靶核酸分子的ID序列雜交時可以相互連接的兩種或更多種寡核苷酸,和(ii)擴(kuò)增序列。
在其它優(yōu)選實(shí)施方案中,檢測集合中包括的檢測序列在支持物上相互鄰接定位,其中所述檢測序列檢測(i)一個分類群內(nèi)的成員和(ii)密切相關(guān)的分類群。
在本發(fā)明中使用的程序和試劑是通用的,即一組試劑可以用于鑒定許多不同類型的生物。所述測試是快速的,并且可以簡單地加入陽性內(nèi)部對照和陰性內(nèi)部對照。本發(fā)明的方法可以產(chǎn)生高分辨率遺傳指紋,鑒定用常規(guī)方法無法分辨的株。所述方法適合于自動化形式,并且不需大量人員培訓(xùn)就可進(jìn)行。
本發(fā)明具有廣泛的應(yīng)用性,包括對微生物(如細(xì)菌、真菌和原生動物)分型;鑒定高等生物(包括人類)的基因型;以及在流行病學(xué)中,監(jiān)測醫(yī)院和地理遙遠(yuǎn)地區(qū)的傳染病爆發(fā)(infection outbreak)。本發(fā)明的方法還可用于環(huán)境測試、農(nóng)業(yè)(以進(jìn)行家畜育種和分析)以及如在種子產(chǎn)業(yè)中進(jìn)行植物分型。人類法醫(yī)學(xué)代表著本發(fā)明的又一個應(yīng)用。
本發(fā)明的一個關(guān)鍵特征在于其能夠在一次測定中,測試可用于鑒定復(fù)雜生物樣品中的生物的ID序列集合。該組ID序列包含多種區(qū)分一個分類群內(nèi)的成員(如不同的大腸埃希氏菌株)的基因組差異序列,以及在不同分類群(如不同物種或?qū)?之間進(jìn)行區(qū)分的多種類群特異性序列。這樣,每個集合可以包括非常大的一系列不同ID序列,所有這些ID序列都可以在一個快速、不基于凝膠的測定中同時使用。不需要培養(yǎng)樣品的事實(shí)增強(qiáng)了所述測試的快速性。
根據(jù)下面的詳細(xì)描述、附圖和權(quán)利要求書,本發(fā)明的其它方面和好處將變得顯而易見。定義“基因組”是指在一種生物中作為該生物可遺傳遺傳信息的最終來源的核酸分子。對于大多數(shù)生物,基因組主要由染色體DNA組成,但基因組也可以包括質(zhì)粒、線粒體DNA等等。對于一些生物如RNA病毒,基因組由RNA組成。
“核酸”是指DNA、RNA或其它可以包括相似部分的取代的相關(guān)物質(zhì)組合物。例如,核酸可以包括不在DNA或RNA中發(fā)現(xiàn)的堿基,所述堿基包括但不限于DNA中的黃嘌呤、肌苷、尿嘧啶,RNA中的胸腺嘧啶,次黃嘌呤等等。核酸還可以包括磷酸或糖部分的化學(xué)修飾,可以引入所述化學(xué)修飾以改善穩(wěn)定性、對酶降解的抗性、或一些其它有用的特性。
“寡核苷酸”或“寡核苷酸序列”是指長度從6個堿基到150個堿基的核酸。寡核苷酸一般但不一定在體外合成。6個堿基到150個堿基長、并且是更大序列的亞序列的核酸區(qū)段也可稱為寡核苷酸序列。
“靶序列”或“靶核酸序列”是所指設(shè)計(jì)的探針?biāo)獧z測的核酸序列。對于ID探針,靶序列可以是ID序列中的ID位點(diǎn)。對于SNP探針,靶序列可以是單核苷酸多態(tài)性。
“靶生物”或“靶類群”是指診斷測試所設(shè)計(jì)要檢測的一類生物或生物類群(分類單位)。
“雜交”是指由堿基對的氫鍵介導(dǎo)的核酸分子非共價結(jié)合。
“有意義的雜交”是指一種探針分子或多種探針分子與所述探針?biāo)O(shè)計(jì)檢測的核酸序列的雜交,其中所述雜交導(dǎo)致檢測出信號。
“比較雜交條件”是指如國際系統(tǒng)細(xì)菌學(xué)委員會(InternationalCommittee on Systematic Bacteriology)所推薦的,用于將物種相互區(qū)分開的條件(Wayne等,Internat.J.System.Bacteriol.37463-464,1987)。比較雜交條件在本文中是指由Hartford等(Int.J.Syst.Bacteriol.4326-31,1993)使用的條件。
“扣除雜交條件”是指在嚴(yán)格性上等同于如下反應(yīng)的嚴(yán)格性的條件所述反應(yīng)在65℃下,在由10mM EPPS,pH 8.0和1M NaCl組成的緩沖液中進(jìn)行。
“發(fā)現(xiàn)于”、“存在于”、“出現(xiàn)于”、“對應(yīng)于”、“雜交于”或“處于”另一核酸序列、核酸分子、寡核苷酸、探針或基因組的核酸序列、核酸分子、寡核苷酸或探針,是指可以與另一序列、寡核苷酸、探針或基因組形成雜交體的序列、寡核苷酸或探針,并且與由進(jìn)行比較的兩種核酸分子中較短的一種核酸分子與其完全互補(bǔ)物在由10mM EPPS,pH8.0和1M NaCl構(gòu)成的緩沖液中組成的雙鏈DNA片段相比,所述雜交體的解鏈溫度(Tm)比所述雙鏈DNA片段的Tm低20℃(對于大于30bp的序列)、12℃(對于15bp到20bp的序列)或8℃(對于8bp到14bp的序列)。“不存在于”另一核酸序列、核酸分子、寡核苷酸、探針或基因組的核酸序列、核酸分子、寡核苷酸或探針,是指沒有在另一核酸序列、核酸分子、寡核苷酸、探針或基因組中發(fā)現(xiàn)的核酸序列、核酸分子、寡核苷酸或探針。
“ID序列”或“鑒定序列”是指這樣一種核酸序列當(dāng)在基因組或富集的基因組(見下文)中,通過雜交使用如上文定義所述的長度特異性解鏈溫度標(biāo)準(zhǔn)測定所述核酸序列的存在時,所述核酸序列是特定生物或生物類群的診斷性序列。ID序列對應(yīng)于基因組或富集的基因組中長度大于等于30bp、可用于將一種類型生物與另一類型生物區(qū)分開來的序列。例如,當(dāng)重要的是將密切相關(guān)的類群的成員相互區(qū)分開來時,基因組差異序列可以用作ID序列?!邦惾禾禺愋孕蛄小笔强捎糜趯⒁粋€類群的所有成員與其它類群區(qū)分開來的一種類型的ID序列。
“基因組差異序列”是指在一種生物的基因組(或富集的基因組)中發(fā)現(xiàn)、而未在密切相關(guān)的生物的基因組(或富集的基因組)中發(fā)現(xiàn)的核酸序列或核酸序列集合體。通過雜交/扣除技術(shù)、通過使用計(jì)算機(jī)比較基因組序列、或通過多種其它技術(shù)中的任何一種,可以發(fā)現(xiàn)基因組差異序列。比較基因組(或富集基因組)的生物必須是密切相關(guān)的。如果一對生物是同一屬的成員,或者如果它們的基因組滿足下面特定的雜交標(biāo)準(zhǔn)(請注意國際系統(tǒng)細(xì)菌學(xué)委員會推薦使用比較雜交建立相關(guān)性(Wayne等,1987,見上文)),就認(rèn)為它們是“密切相關(guān)的”。假如使用Hartford等(1993,見上文)描述的方法,在比較雜交條件下,一對生物的多于70%的基因組DNA片段(在具有RNA基因組的病毒的情況下,是基因組cDNA片段)可以相互雜交,那么就認(rèn)為它們是“密切相關(guān)的”?;蚪M差異序列的長度大于等于30bp?;蚪M差異序列的一個例子是出現(xiàn)在大腸埃希氏菌O157H7的一個致病株、但不出現(xiàn)在大腸埃希氏菌O157H7的另相應(yīng)病株中的DNA片段。
“類群特異性序列”是指這樣的核酸序列或核酸序列集合體當(dāng)在比較雜交條件下進(jìn)行雜交時,所述核酸序列或核酸序列集合體是一個系統(tǒng)發(fā)生類群中生物的基因組的特征,而不是另一個分類單位或系統(tǒng)發(fā)生類群的基因組的特征。類群特異性序列的長度大于等于30bp。例如,在大腸埃希氏菌O157H7類群的99%以上的分離物中出現(xiàn)、但不在99%以上的沙門氏菌屬分離物中出現(xiàn)的片段是類群特異性序列。相似地,在99%以上的輪狀病毒分離物中出現(xiàn)(如在比較雜交條件下所鑒定)、但不在于99%以上的人免疫缺陷病毒分離物中出現(xiàn)的片段是類群特異性序列。類群特異性序列可以用于鑒定更低水平的分類群,如亞種或通過世代相關(guān)聯(lián)的雜種繁殖群體(如人類)的成員。注意為了診斷目的,類群特異性序列在出現(xiàn)于一個分類群內(nèi),而不出現(xiàn)于相似分類學(xué)水平的姐妹類群(sister group)內(nèi)時最有用。
類群特異性序列的一個例子是在腸沙門氏菌鼠傷寒血清型(Salmonella enterica serotype Typhimurium)的基本所有分離物中發(fā)現(xiàn)、但基本在腸沙門氏菌乙型副傷寒血清型(Salmonella enterica serotypeParatyphi B)的分離物中未發(fā)現(xiàn)的序列(見圖6)。請注意,類群特異性序列也可以是基因組差異序列(也就是說,該組類群特異性序列與該組基因組差異序列重疊)。例如,在所有大腸埃希氏菌O157H7菌株中出現(xiàn)、但在大腸埃希氏菌的非O157H7菌株中未發(fā)現(xiàn)的序列既是基因組差異序列,也是類群特異性序列。
“保守序列”是指這樣的核酸序列或核酸序列集合體按照雜交標(biāo)準(zhǔn),所述核酸序列或核酸序列集合體是跨越同一分類學(xué)水平上多個獨(dú)立分類群的生物的基因組的特征。保守序列的長度大于等于30bp。因此,編碼人類RNA聚合酶的基因的許多片段的序列是保守序列,因?yàn)樗鼈兛梢栽诒容^雜交條件下與黑猩猩基因組雜交。保守序列不可用于區(qū)分帶有所述保守序列的類群的成員。
“ID探針”是指用于與生物樣品中的ID序列雜交的寡核苷酸或一對寡核苷酸或一組寡核苷酸。為進(jìn)行雜交,所述探針寡核苷酸的一部分必須能夠與對應(yīng)的ID序列進(jìn)行堿基配對。所述探針的該部分通常長度在8個堿基到120個堿基之間。ID探針也可以具有其它部分,所述部分包括擴(kuò)增位點(diǎn)(例如,對應(yīng)于用于PCR擴(kuò)增的引物結(jié)合位點(diǎn)的序列)和作為檢測時的標(biāo)記的序列(見下文)。
“基因組差異探針”是指與基因組差異序列對應(yīng)、即與其雜交的ID探針。
“類群特異性探針”是指與基因組差異序列對應(yīng)、即與其雜交的ID探針。
“ID探針位點(diǎn)”或“探針位點(diǎn)”是指ID序列中在序列上對應(yīng)于ID探針的部分。
“ID序列家族”是指可以與一種(非重組)生物的基因組雜交(在比較雜交條件下)的包含2個或更多成員的一組ID序列。在所述家族的ID序列中,至少2種ID序列在它們天然和通常出現(xiàn)的基因組中在圖譜中距離大于3,000堿基。一個ID序列家族可以包括類群特異性序列和基因組差異序列的組合,可以僅包括類群特異性序列,或可以僅包括基因組差異序列。
例如,考慮可用于追蹤傳染性大腸埃希氏菌O157H7的爆發(fā)的ID序列家族。該ID序列家族可以包括所有下面類型的有診斷用途的ID序列物種大腸埃希氏菌的所有成員所共有并且限于該物種所有成員的多種類群特異性序列;僅包含大腸埃希氏菌O157H7菌株的系統(tǒng)發(fā)生類群的所有成員所共有并且限于所述系統(tǒng)發(fā)生類群所有成員的多種類群特異性序列;僅包含大腸埃希氏菌O157H7的系統(tǒng)發(fā)生類群的所有成員所共有并且限于所述系統(tǒng)發(fā)生類群所有成員的多種類群特異性序列,其中所述大腸埃希氏菌O157H7經(jīng)多酶電泳分析發(fā)現(xiàn)具有電泳型3(DEC3類群;Whittam等,Infect.Immun.611619-1629,1993);以及在大腸埃希氏菌O157H7參考菌株DEC3B中存在,但在大腸埃希氏菌O157H7參考菌株DEC4C中不存在的多種基因組差異序列。
請注意,在上面的例子中,所述ID序列家族都可以在比較雜交條件下與一種生物即大腸埃希氏菌O157H7參考菌株DEC3B的基因組雜交。這是表達(dá)方式“ID序列家族”的定義方面。
“寡核苷酸家族”或“探針家族”是指對應(yīng)于ID序列家族的寡核苷酸或探針的集合體。在寡核苷酸或探針家族中的所有寡核苷酸或探針序列對應(yīng)于特定ID序列家族中所有或部分成員的序列。
“多態(tài)性探針”或“單核苷酸多態(tài)性探針”或“SNP探針”是指這樣一組寡核苷酸當(dāng)該組寡核苷酸與基因組雜交時,鄰接一個多態(tài)性位點(diǎn),并且該組寡核苷酸具有在該位點(diǎn)與一段特定的在該位點(diǎn)出現(xiàn)的基因組序列發(fā)生精確堿基配對的序列。當(dāng)一組這樣的寡核苷酸鄰近地與基因組雜交時,只有在靶位點(diǎn)的等位基因或基因型符合所述多態(tài)性探針的寡核苷酸的鄰接序列時,這些寡核苷酸才可以相互連接。SNP探針的結(jié)構(gòu)和應(yīng)用顯示于
圖10。一般地說,合成一組多態(tài)性探針以使其對應(yīng)于特定位點(diǎn)的每個等位基因。多態(tài)性探針可以包含ID探針?biāo)耐瑯硬糠?如擴(kuò)增位點(diǎn)和標(biāo)記)。具有標(biāo)記序列的多態(tài)性探針的集合可用于產(chǎn)生包含差異的富集的基因組樣本,其中所述差異可以通過與包含標(biāo)記集合的檢測集合雜交而檢測出。
多態(tài)性探針或“單核苷酸多態(tài)性探針”或“SNP探針”“家族”的定義與ID序列家族和ID探針家族的定義類似,只是在這種情況下,探針和基因組DNA之間的對應(yīng)性在于成對半邊探針(probe-half)與多態(tài)性基因組位點(diǎn)(如單堿基對多態(tài)性)雜交并且與所述位點(diǎn)精確鄰接的能力,而不是基于針對ID序列使用的雜交標(biāo)準(zhǔn)(見圖10)。為了定義SNP探針家族,僅考慮用每種SNP探針測試的一個等位基因。僅考慮用具有最小等位基因頻率的特定SNP探針測試的SNP等位基因。該等位基因定義為“最罕見的SNP等位基因靶”。“等位基因頻率”是在一個物種的群體中,針對基因組中在特定基因座的特定等位基因定義。等位基因頻率是在群體中,在該基因座的所有等位基因中特定等位基因所占的分?jǐn)?shù)(King,等人,A dictionary of genetics(OxfordUniversity Press,New York,1990)。用于確定等位基因頻率的群體樣本必須包括至少100個(不是純系相關(guān)的(non-clonally related))個體。SNP探針家族是一組SNP探針,該組SNP探針中最罕見的SNP等位基因靶都出現(xiàn)在一個個體的基因組中。
“標(biāo)記”或“標(biāo)記序列”是指可以摻入更大寡核苷酸或探針中的非生物的寡核苷酸序列。標(biāo)記序列可以用作檢測序列。例如,在檢測陣列中的標(biāo)記序列可以用于通過雜交而檢測在所擴(kuò)增的探針中的(互補(bǔ))標(biāo)記序列。當(dāng)不同的診斷序列不能用其它方法通過雜交進(jìn)行區(qū)分時(如SNP探針;見下文),可以使用標(biāo)記序列通過雜交將探針相互區(qū)分開來。
同樣,“標(biāo)記序列家族”或“標(biāo)記家族”是指對應(yīng)于一個探針家族的一組標(biāo)記序列。例如,在下面的實(shí)施例5中,將多態(tài)性探針或SNP探針的集合與人類基因組DNA樣品雜交??梢员贿B接和擴(kuò)增的SNP探針集合的亞組是一個SNP探針家族。由于一個SNP探針家族對應(yīng)于一個人類個體的基因型,因此該家族的定義與ID探針家族相似。所述SNP探針家族包含一個標(biāo)記序列家族(一般構(gòu)建SNP探針時加入識別標(biāo)記序列)。因此,該SNP探針家族與所述標(biāo)記探針家族相應(yīng),并且可以通過與在檢測集合中的相應(yīng)標(biāo)記序列家族雜交而鑒定。
相應(yīng)的序列組是指在各組的元件之間存在一一對應(yīng)。例如,考慮與一個ID序列集合相應(yīng)的ID探針集合。每種ID探針包含位于一種ID序列中的一個ID位點(diǎn),而每種ID序列對應(yīng)于一種ID探針?;蛘?,考慮由與一個多態(tài)性探針集合相應(yīng)的標(biāo)記集合組成的檢測集合。在該檢測集合中的每種標(biāo)記對應(yīng)于在所述多態(tài)性探針集合中一種多態(tài)性探針中的一種標(biāo)記。相似的,一個標(biāo)記序列家族可以與一個多態(tài)性探針家族相應(yīng)。
“最小基因組起源”是指一組序列、探針、寡核苷酸或標(biāo)記可以雜交的不同基因組的最小數(shù)目(或不同基因組代表的最小數(shù)目)。例如,一組ID序列的最小基因組起源等同于由一組ID序列可以構(gòu)建的家族的最小數(shù)目。因此,例如,一組ID序列,該組中每種序列對應(yīng)于一種不同人類基因的一個蛋白編碼區(qū)段,該組ID序列的最小基因組起源是一,因?yàn)檎M序列可以與一個人的基因組雜交。作為另一個例子,考慮由一對類群特異性腺病毒序列和一對類群特異性呼吸道合胞病毒序列組成的一組序列。這樣一組序列的最小基因組起源是2,因?yàn)?個基因組的序列,即腺病毒和呼吸道合胞病毒的序列是在比較雜交條件下足以與所有4種序列雜交的最小基因組數(shù)目。該組4種ID序列組成2個ID序列家族,只要每對病毒ID序列在來源的基因組中被分開大于等于3000bp(見上面“家族”的定義)。
考慮在表1中舉例說明的一個更復(fù)雜的例子也是有幫助的,在該例子中,一組ID序列可以用于測試患有急性胃腸疾病的患者中某些病原體的存在。注意在表1每個格子中的序列組可以與單個個體的基因組DNA雜交。(在表1中有9個這樣的格子。)同時,注意不可能使表1所述9個格子中包含的所有序列與少于9個個體的基因組DNA雜交。因此,表1中ID序列組的最小基因組起源是9。表1.一個最小基因組起源為9的ID序列集合。下表中的每個格子包括一個ID序列“家族”(即可以與一個基因組雜交的一組序列)。
應(yīng)用于SNP探針集合和標(biāo)記序列集合的最小基因組起源的定義如下文所定義。一個SNP探針的集合包括多個SNP探針家族,并且每個SNP探針家族對應(yīng)于一個個體的基因型。然而,與ID序列集合不同,一個SNP探針集合的最小基因組起源一般是一。這是因?yàn)镾NP探針一般可以與任何靶物種的基因組以不多于一個堿基對錯配進(jìn)行雜交。
現(xiàn)在考慮一個人類SNP探針集合,所述SNP探針集合的每種探針都包括一種獨(dú)特的標(biāo)記序列部分。同時,考慮包含與所述SNP探針集合中的標(biāo)記序列相應(yīng)的一個標(biāo)記集合的檢測陣列。所述SNP探針集合的最小基因組起源一般是一,因?yàn)樗谐蓡T都可以與任何特定人類基因組雜交。然而注意與此不同,對應(yīng)的標(biāo)記集合可能具有大的最小基因組起源。為理解這一明顯自相矛盾的說法,認(rèn)識到以下事實(shí)是有幫助的所述SNP探針集合由多個SNP探針家族組成,其中每一個SNP探針家族對應(yīng)于一個個體的基因型。在SNP探針家族中的標(biāo)記序列組是標(biāo)記序列的對應(yīng)家族。在所述檢測陣列中的對應(yīng)標(biāo)記序列家族可以與這樣一個SNP探針家族雜交。然而,在所述標(biāo)記集合中的其它標(biāo)記序列不能與該SNP探針家族雜交。因此,與一個SNP探針集合相應(yīng)的一個標(biāo)記序列集合的最小基因組起源等于所述SNP探針組合中的家族數(shù)目,即使所述SNP探針組合本身的最小基因組起源是1。
最小基因組起源的定義在應(yīng)用于標(biāo)記集合時依賴于下面的定義?;貞涐槍μ囟⊿NP探針的“最罕見SNP等位基因靶”的定義(見上面“SNP探針家族”的定義)。我以相似方式定義“最常見SNP等位基因靶”。因此,對于用特定SNP探針測試的等位基因靶,一個等位基因被確認(rèn)在一個物種內(nèi)是最罕見的,而一個等位基因被確認(rèn)是最普遍的。一種SNP探針的“平均等位基因頻率”定義為最常見的等位基因靶和最罕見的等位基因靶的等位基因頻率的平均值。例如,假如用一種SNP探針可以檢測到的等位基因以0.85、.06和0.002的頻率出現(xiàn),那么平均等位基因頻率就是0.426(即,(0.85+0.002)÷2))?!捌骄任换蝾l率的乘積”(P)定義為在所述SNP集合中所有SNP的等位基因頻率的乘積。因此,例如,考慮一個假設(shè)的測試,其中用SNP探針測試36個人類疾病突變,每個人類疾病突變都以0.001的等位基因頻率出現(xiàn),并且所述每個突變都與一個以0.999的等位基因頻率出現(xiàn)的正常等位基因相關(guān)。對于所述36種SNP中的每一種來說,平均等位基因頻率是0.5(即,(0.001+0.999)÷2))。因此,平均等位基因頻率的乘積(P)是0.536=1.46×10-11。(注意對于實(shí)際的SNP探針集合來說,等位基因頻率和平均等位基因頻率的值將隨著不同探針而各不相同。此外,注意一種SNP探針的等位基因頻率不一定要加到1.0,因?yàn)椴⒉皇撬谐霈F(xiàn)的等位基因都要用SNP探針進(jìn)行測定)。
由于在實(shí)踐中可能難以確定對于一個特定物種的包含一組SNP探針的最小家族數(shù),我以下面方式定義與一個SNP探針集合相應(yīng)的標(biāo)記集合的最小基因組起源。一個標(biāo)記集合的最小基因組起源定義為(10-10)(P)-1,其中P是平均等位基因頻率的乘積。因此,在前面的例子中,對應(yīng)于人類疾病突變SNP探針集合的標(biāo)記集合的最小基因組起源是(10-10)(1.46×10-11)-1=6.9。與此不同,如上文所解釋的,對應(yīng)SNP探針集合的最小基因組起源是一。
我提供下面的例子,幫助理解與一組SNP探針相應(yīng)的一組標(biāo)記的最小基因組起源的定義的生物學(xué)解釋。考慮一個33種標(biāo)記的組,該組標(biāo)記與一組非連接的人類SNP探針相應(yīng),其中每種SNP探針檢測兩個等位基因,這兩個等位基因的等位基因頻率都是0.5。該組標(biāo)記的最小基因組起源是(10-10)(P)-1=(10-10)(0.533)-1=0.85,接近于一。注意最有可能發(fā)現(xiàn)的基因型是在這33個SNP基因座中的每一個都是雜合的個體(在這樣一個基因座上雜合的概率是0.5)。發(fā)現(xiàn)具有最有可能的基因型的個體的概率是0.533=1.2×10-10。預(yù)期這樣一個個體出現(xiàn)的概率稍稍小于在2000年總?cè)丝谥谐霈F(xiàn)一個(約6×109)。
檢測集合可以包含與包括ID探針和SNP探針的探針集合相應(yīng)的檢測序列(即所述檢測集合具有ID位點(diǎn)序列和標(biāo)記序列)。這樣一個集合的最小基因組起源是所述ID位點(diǎn)的最小基因組起源加上所述標(biāo)記序列的最小基因組起源的總和。假如所述標(biāo)記集合覆蓋多于一種的物種,那么所述集合的最小基因組起源是對應(yīng)于每個物種的最小基因組起源的總和。
“ID序列集合”是指對應(yīng)于多個ID序列家族的一組ID序列。也就是說,一個ID序列集合的最小基因組起源大于1。此外,由于每個家族最少包含2種(完全分離的)ID序列,故一個ID序列集合最少具有4個ID序列成員。一個ID序列集合的特征是一種生物的基因組不足以給出與所有個別ID序列的陽性雜交信號。ID序列集合不一定與樣品在物理上分開。而且可以僅僅將這樣一個集合概念化,以方便設(shè)計(jì)ID探針用于構(gòu)建探針集合(見下文)。圖1圖示了在表1中描述的最小基因組起源為9的ID序列集合。
“ID寡核苷酸集合”或“ID探針集合”是指寡核苷酸或探針的集合體,其中每種寡核苷酸或探針對應(yīng)于一個特定ID序列集合中一種ID序列的全部或部分的核苷酸序列。這樣的集合設(shè)計(jì)用于通過雜交,檢測在樣品中存在的對應(yīng)于兩種或更多種不同基因組的核酸序列(見下文)。最好在探針集合中,探針的序列和/或探針在水溶液中的濃度是已知的。
“SNP探針集合”或“單核苷酸多態(tài)性探針集合”或“多態(tài)性探針集合”是指包含多于一個SNP探針家族的一組SNP探針。
“標(biāo)記序列集合”或“標(biāo)記集合”是指與一個探針集合相應(yīng)的一組標(biāo)記序列。也就是說,在一個標(biāo)記序列集合中每種標(biāo)記序列與一個探針集合的一種標(biāo)記序列(或與一種標(biāo)記序列的反向互補(bǔ)物)互補(bǔ)。標(biāo)記序列集合可用于在基因組分布分析中將單核苷酸多態(tài)性基因型(難以通過雜交檢測)轉(zhuǎn)變?yōu)榻∪碾s交基因型(見下面的實(shí)施例5)。
某些物理特性或化學(xué)特性的“集合”是指與核酸序列集合相應(yīng)、涉及所述物理特性或化學(xué)特性的一組值。例如,存在與一個ID探針集合的分子量一一對應(yīng)的一個分子量集合。這樣一個分子量集合可以用作檢測集合或檢測數(shù)列,以確定一個ID探針集合中樣品選擇的亞組的元件的身份??梢酝ㄟ^質(zhì)譜,分析所述探針亞組,并將觀察到的分子量與所述分子量集合(即原始ID探針集合的分子量)比較。
“檢測集合”或“檢測序列的集合”是指稱為“檢測序列”的序列集合體,其中所述序列集合體中的所有序列都對應(yīng)于一個序列、探針、寡核苷酸或標(biāo)記的集合(如一個ID探針集合或SNP探針集合)的所有或部分成員。也就是說,檢測集合與序列集合、探針集合、寡核苷酸集合或標(biāo)記集合相應(yīng)。這樣的集合設(shè)計(jì)用于檢測(通常是通過雜交,但不一定通過雜交)下列集合中在診斷上能提供信息的亞組ID探針集合、ID序列集合、多態(tài)性探針集合或其它包含在診斷上有用序列的基因組代表的集合。如下文所提到的,檢測集合的成分(即檢測序列)可以排列成為二維陣列,以利于診斷探針(如,已經(jīng)與樣品的核酸分子內(nèi)的ID序列雜交的ID探針)的鑒定。或者,所述檢測集合的元件可以與診斷探針在液體中接觸。如下文所提到的,可以在接觸檢測集合之前,擴(kuò)增已經(jīng)與樣品的核酸分子內(nèi)的ID序列雜交的ID探針。
檢測集合也可以是與序列集合、探針集合、寡核苷酸集合或標(biāo)記集合一一對應(yīng)(即與之相應(yīng))的一組物理或化學(xué)特性的值。例如,ID探針集合的成員的分子量表或分子量數(shù)列是一種類型的檢測集合。這樣一個檢測集合可以用于質(zhì)譜分析鑒定ID探針集合的特定亞組??梢允褂觅|(zhì)譜確定臨床樣品所選擇的ID探針家族的分子量。然后將該ID探針家族的分子量與分子量檢測集合(即原始未經(jīng)選擇的ID探針集合的分子量)相比較。用這種方法,鑒定選定的ID探針,這進(jìn)而導(dǎo)致鑒定所述臨床樣品中的基因組?;蛘撸缦旅娴膶?shí)施例3所述,可以通過與一個寡核苷酸檢測集合的雜交檢測探針家族。然后可以通過確定所述寡核苷酸的分子量,并將所述分子量與另一個檢測集合相比較,鑒定所述探針選定的檢測寡核苷酸亞組,所述檢測集合是所述寡核苷酸檢測集合的元件的分子量數(shù)列。
“二維檢測陣列”是指ID序列、ID寡核苷酸、ID探針或檢測序列的集合,所述ID序列、ID寡核苷酸、ID探針或檢測序列已經(jīng)通過非電泳方法排列到基本上兩維的(即平面的)固相支持體上,例如尼龍濾膜或聚賴氨酸包被的玻璃載玻片上。
“基因組分布分析測定”是指本發(fā)明的某些方法。
“基因組分布分析指紋”或“指紋”是指根據(jù)通過基因組分布分析擴(kuò)增和檢測的診斷探針,推測在生物樣品中存在的診斷序列(如ID探針或SNP探針)亞組。
“分類單位”或“系統(tǒng)發(fā)生類群”是指單系群的集體成員,所述單系群是從一種共同祖先生物類型(或者是已知的,或者是假設(shè)的)遺傳下來并且包括所述共同祖先生物類型的生物類型類群。注意為本發(fā)明的目的,分類單位以并不暗示任何分類學(xué)水平的一般意義使用。因此,例如,分類單位在亞種等級上定義,也在屬、綱、門等的等級上定義。
“獨(dú)立分類群”或“獨(dú)立分類單位”是指沒有重疊成員的分類單位。因此,細(xì)菌腸桿菌屬和沙門氏菌屬是獨(dú)立分類單位。然而,腸桿菌屬和由大腸埃希氏菌O157H7病原體組成的分類群不是獨(dú)立的分類單位,因?yàn)樵撝虏【甑乃谐蓡T也都是該屬的成員。
“分類學(xué)等級”是指一個分類單位在系統(tǒng)發(fā)生等級體系中的位置。術(shù)語分離物、生態(tài)型、亞種、物種、屬、科、綱、目、門、界和超界是分類學(xué)等級的例子。
生物的“界“是指下面列舉的其中一種病毒、細(xì)菌、古細(xì)菌、真菌、原生動物、植物和動物。
“獨(dú)特基因組”是指具有與所有其它基因組的核酸序列(除了遺傳上相同的生物的基因組的核酸序列)不同的特定核酸序列的基因組。具有獨(dú)特基因組的不同生物可以是不相關(guān)或密切相關(guān)的。認(rèn)為純系親緣體(clonal relatives)具有相同的獨(dú)特基因組,所述純系親屬如在一個細(xì)菌菌落內(nèi)在遺傳上同源的生物,。
“樣品”是指由其制備核酸并測試特定核酸序列的存在的材料集合體。例如,樣品可以是糞便樣品、尿樣品、血液樣品或痰樣品,或者可以是其它這樣的在醫(yī)院內(nèi)常規(guī)收集的樣品?;蛘?,樣品可以是在培養(yǎng)皿中培養(yǎng)的微生物單個菌落。樣品也可以是人類法醫(yī)學(xué)樣品、食品樣品、環(huán)境樣品或純核酸。
“擴(kuò)增方法學(xué)”或“擴(kuò)增方法”是指用于線性或指數(shù)增加核酸分子拷貝數(shù)的技術(shù)。擴(kuò)增方法的例子包括連接酶鏈?zhǔn)椒磻?yīng)、PCR、依賴于連接的PCR、轉(zhuǎn)錄介導(dǎo)的擴(kuò)增、鏈置換擴(kuò)增、自身支持性序列擴(kuò)增、Qβ-復(fù)制酶介導(dǎo)的擴(kuò)增、滾環(huán)擴(kuò)增等等。
“擴(kuò)增產(chǎn)物”是指應(yīng)用擴(kuò)增方法得到的核酸分子。
“擴(kuò)增位點(diǎn)”或“擴(kuò)增序列”是指在一種擴(kuò)增方法中,介導(dǎo)復(fù)制或復(fù)制需要的核酸分子區(qū)。擴(kuò)增位點(diǎn)對的例子是在PCR反應(yīng)的特異性引發(fā)過程中寡核苷酸引物所結(jié)合的DNA片段或染色體上的位點(diǎn)對。在某些擴(kuò)增方法中使用的針對RNA聚合酶如Qβ-復(fù)制酶或噬菌體T7聚合酶的啟動子序列,構(gòu)成另一種類型的擴(kuò)增位點(diǎn)。
“基因組扣除”是指導(dǎo)致分離基因組差異序列的方法。例如這樣的雜交方法其中“+”DNA基因組差異樣品(見下文)與“-”DNA基因組差異樣品退火,隨后分離出剩余的非退火“+”序列。另外一個例子是使用計(jì)算機(jī)比較兩個序列組,找到在第一個序列組存在但在第二個序列組不存在的序列。假如所述“+”樣品中的一段序列(30個堿基長)不能在扣除雜交條件下與所述“-”樣品雜交,那么就認(rèn)為該段序列在所述“-”樣品中不存在。也就是說,在扣除雜交條件下,該序列不能與所述“-”樣品中的序列形成解鏈溫度(Tm)比所述扣除雜交條件的溫度減5℃要高的的雜交體??梢愿鶕?jù)試驗(yàn)確定雜交,或者可以根據(jù)已知序列預(yù)測雜交。
“基因組差異樣品對”是指用于發(fā)現(xiàn)基因組差異序列、對應(yīng)于基因組DNA或RNA的兩組核酸序列。例如,在基因組扣除實(shí)驗(yàn)中,“+”DNA樣品和“-”DNA樣品是基因組差異樣品。當(dāng)通過計(jì)算機(jī)分析比較兩個基因組時,每個基因組就是一個基因組差異樣品?;蚪M差異樣品可以來自于一種生物或來自于一個生物類群;基因組差異樣品可以包含已擴(kuò)增或未擴(kuò)增的核酸,例如聚合酶鏈?zhǔn)椒磻?yīng)(PCR)擴(kuò)增的DNA;基因組差異樣品可以由已經(jīng)分級分離的核酸,例如大小級分或擴(kuò)增級分組成;基因組差異樣品可以是推導(dǎo)的核酸序列,如來自完全測序或幾乎完全測序的基因組的序列的計(jì)算機(jī)代表;而且基因組差異樣品可以由RNA、DNA或任何其它密切相關(guān)的核酸分子組成。只有在所述“+”樣品中的許多但不是所有序列也在所述“-”樣品中存在時,基因組差異樣品才有意義。
“富集的基因組”、“富集的基因組級分”、“富集的基因組差異樣品”或“基因組代表”是指經(jīng)過一個富集程序的基因組、基因組級分或基因組差異樣品,所述富集程序產(chǎn)生原始基因組或基因組差異樣品的選定部分。為基因組分布分析的目的,富集的基因組具有兩個重要特性(1)它們提供健全的基于雜交的診斷學(xué)(與通過雜交檢測SNP的方法相比),以及(2)通過擴(kuò)增產(chǎn)生的富集的基因組級分是從小樣品(例如法醫(yī)樣品)產(chǎn)生材料的有效途徑。例如,可以通過基因組分布分析,測試通過Alu-PCR產(chǎn)生的在富集的基因組中位于Alu重復(fù)序列之間的大量多態(tài)性序列(見實(shí)施例4),從而鑒定法醫(yī)頭發(fā)樣品的來源。所述基因組富集可以基于大小分級分離、差異擴(kuò)增(如Alu-PCR或SNP探針的差異擴(kuò)增)、或任何其它分級分離方法。表2.基因組代表的例子和它們用于檢測序列的用途
附圖簡述圖1是最小基因組起源為9的ID序列集合的示意性說明。
圖2A是一個系統(tǒng)樹的示意性說明,展示了一個假設(shè)的、但典型的菌株類群的祖先關(guān)系,其中所述菌株類群包括致病菌株(如菌株1)和非致病菌株(如菌株8)。
圖2B是本發(fā)明一種方法的示意性說明,其中使用一個相關(guān)菌株類群內(nèi)兩種生物(如菌株1和菌株8)的基因組扣除,產(chǎn)生可以用于該類群內(nèi)任何菌株(如菌株2-7)的指紋分析的基因組差異序列。
圖2C是本發(fā)明的一種方法的示意性說明,其中通過從幾種生物匯集基因組核酸分子而產(chǎn)生基因組差異序列。例如,匯集幾種病原體的基因組核酸分子可以產(chǎn)生“+”樣品,匯集幾種非病原體的基因組核酸分子可以產(chǎn)生“-”樣品。通過該扣除實(shí)驗(yàn)獲得的基因組差異序列包含至少在一種致病(“+”)菌株中出現(xiàn)但不在任何一種非致病(“-”)菌株中出現(xiàn)的序列。
圖3是一種能夠用于本發(fā)明方法的二元ID探針的示意性說明。在與染色體ID序列雜交后,將左半邊ID探針和右半邊ID探針相互連接。然后使用對應(yīng)于引物位點(diǎn)L和引物位點(diǎn)R的引物擴(kuò)增所述連接產(chǎn)物。隨后通過與包含所述ID探針或標(biāo)記序列的檢測陣列的雜交,鑒定所擴(kuò)增的ID探針產(chǎn)物。
圖4是不同類型檢測陣列的例子的示意性說明。
圖5是本發(fā)明一種方法的示意性說明,在所述方法中,使用樣品對ID探針的選擇,通過基因組分布分析掃描臨床樣品中的多種病原體。在該方法中,將來自樣品的DNA淀積在固相支持體如尼龍濾膜上。隨后使多對半邊探針與結(jié)合的樣品DNA雜交,然后連接正確雜交的探針,將探針從所述濾膜上洗脫下來,擴(kuò)增以在檢測陣列中進(jìn)行檢測。
圖6是用于從腸沙門氏菌獲得基因組差異序列的基因組扣除策略的示意性說明。在該策略中,將腸沙門氏菌的亞種分為兩個亞群,即X群和Y群。進(jìn)行交互扣除,獲得每一群的基因組差異序列。
圖7A是大腸埃希氏菌類群的部分系統(tǒng)樹的示意性說明。病原體標(biāo)為黑色,非病原體標(biāo)為白色。
圖7B是用于獲得大腸埃希氏菌O157H7的基因組差異序列的策略的示意性說明,其中在大腸埃希氏菌O157H7(“+”基因組差異樣品)和非致病菌株(“-”基因組差異樣品)之間進(jìn)行基因組扣除。
圖7C是用于獲得弗氏志賀氏菌(Shigella flexneri)的基因組差異序列的策略的示意性說明,其中在弗氏志賀氏菌(“+”基因組差異樣品)和非致病菌株(“-”基因組差異樣品)之間進(jìn)行基因組扣除。
圖8A是用于滾環(huán)擴(kuò)增的一種ID探針(包含一種帶缺口的環(huán)狀探針和一種缺口探針)的示意性說明。
圖8B是在對連接的滾環(huán)模板進(jìn)行滾環(huán)擴(kuò)增時使用的成對引物(一種生物素化滾環(huán)引物和一種生物素化分支引物)的示意性說明。
圖8C是使用圖8B舉例說明的引物和連接的滾環(huán)模板進(jìn)行高分支滾環(huán)擴(kuò)增(hyperbranched rolling circle amplification)的示意性說明。
圖9A是一對生物素化DNA捕獲探針、一對擴(kuò)增探針以及一種缺口探針的示意性說明,如所指出的,所述每種探針都與一種ID序列雜交。
圖9B是使用一對生物素化引物擴(kuò)增三聯(lián)連接的探針的示意性說明。
圖9C是在一種缺口探針序列和一種用于質(zhì)譜檢測的寡核苷酸之間雜交的示意性說明。
圖10是SNP探針雜交選擇的示意性說明,其中連接和擴(kuò)增依賴于在SNP位點(diǎn)的匹配。
圖11是本發(fā)明三類一般性基因組分布分析方法的共有特征的示意性說明。
發(fā)明詳述基因組分布分析是用于鑒定生物和對生物分型的方法,與現(xiàn)有技術(shù)相比,該方法提供幾個顯著的好處。在醫(yī)學(xué)診斷學(xué)中,該方法可以在臨床診斷設(shè)置中實(shí)施,提供了治療的好處和流行病學(xué)的好處??梢酝瑫r、快速并且靈敏地掃描復(fù)雜生物樣品中大量病原體特異性序列的存在?;蚪M分布分析產(chǎn)生高分辨率的遺傳指紋,使得能夠用該方法區(qū)分非常相似的菌株。這對于在病原體和密切相關(guān)的非病原體之間進(jìn)行區(qū)分、在涉及疾病分別爆發(fā)(separate outbreak)的相似病原體之間進(jìn)行區(qū)分、在相同病原體的抗生素敏感菌株和抗生素抗性菌株之間進(jìn)行區(qū)分是重要的。對于掃描患者體內(nèi)多種遺傳標(biāo)記的應(yīng)用和在遺傳鑒定中的應(yīng)用而言,本發(fā)明掃描許多診斷序列的能力是重要的。
基因組分布分析使得能夠進(jìn)行一種新型的表現(xiàn)特異性測試,檢測患者樣品中全面的致病病原體組。例如,基因組分布分析使得可以為患有呼吸系統(tǒng)癥狀(respiratory symptom)的個體提供快速掃描所有常見呼吸系統(tǒng)病原體存在的單一測試,所述常見呼吸系統(tǒng)病原體包括不同病原體如細(xì)菌、病毒和真菌。
目前用于對生物分型的方法常常涉及培養(yǎng)所述生物,這需要使所述生物生長的時間,需要不同的培養(yǎng)條件,并且在醫(yī)院設(shè)置中對于許多生物(包括一些細(xì)菌、大多數(shù)病毒和真核寄生蟲)可能是不可行的。由于所述新方法不需要培養(yǎng),該方法使得能夠在幾小時內(nèi)獲得結(jié)果(而不是目前方法所需的幾天和有時幾周)。
基因組分布分析的其它好處有該方法需要最少的臨床樣品處理、產(chǎn)生以前未鑒定生物的指紋、簡單地實(shí)現(xiàn)陽性內(nèi)部對照和陰性內(nèi)部對照、不需要凝膠電泳以及該方法適用于自動化的形式。
基因組分布分析將高度平行、基于雜交的篩選與靈敏的核酸擴(kuò)增方法結(jié)合起來,使得能夠在一次測定中鑒定廣泛范圍的生物類型。一次測試可以掃描生物樣品中一類有用的DNA序列多態(tài)性,即ID序列的存在。ID序列是特定類群內(nèi)生物基因組所特有的核酸序列。一次測試也可以同時掃描多種單核苷酸多態(tài)性(SNP),即另外一種類型的基因組變異。此外,基因組分布分析可以在一次測試中檢測ID序列和SNP的混合物。
兩類ID序列可以用于鑒定生物類群特異性序列和基因組差異序列。在相關(guān)生物類群的所有成員中存在的ID序列稱為類群特異性序列。類群特異性序列可用于確定某個類群的成員是否存在于生物樣品中。例如,HIV類群特異性序列的存在指出HIV類群中一種病毒的存在。可以通過基因組數(shù)據(jù)庫的計(jì)算機(jī)比較,或通過用于分離保守序列的分子方法如符合克隆(coincidence cloning),可以分離類群特異性序列。
僅在一個相關(guān)生物類群的某些成員中存在的ID序列稱為基因組差異序列。基因組差異序列組對于獲得生物的高分辨率指紋尤其有用。因此,這種類型的ID序列有利于將一個類群中的一個成員與該類群內(nèi)的另一個成員區(qū)分開來。對生物進(jìn)行指紋分析對于流行病學(xué)、法醫(yī)學(xué)、以及快速確定細(xì)菌是否可能對某種抗生素有抗性是重要的?;蚪M差異序列可以如下制備例如,用兩種不同生物的基因組進(jìn)行扣除雜交程序,或?qū)山M不同生物的匯集的基因組進(jìn)行扣除雜交(見下文)。
基因組分布分析掃描復(fù)雜生物樣品中的ID序列,ID序列是DNA片段,其存在是特定類型生物的指示。兩種類型ID序列可以用于確定一種生物的存在。類群特異性序列是特定分類群中(即在成員通過譜系密切相關(guān)的生物類群中)基本所有生物都共有的。與此不同,基因組差異序列將特定分類群內(nèi)的生物區(qū)分開來。一個基因組差異序列家族有用的診斷屬性在于在一個類群中的密切相關(guān)菌株的基因組中存在該家族成員的獨(dú)特亞組。
基因組分布分析的診斷能力部分是由于它能夠測試ID序列的復(fù)雜混合物,所述ID序列是龐大并且不同組生物類型所特征性擁有的。因此,擴(kuò)展這樣的診斷ID序列組的早前提出的定義是有用的。
ID序列“家族”是可用于鑒定特定生物類群的成員的一組類群特異性序列和/或基因組差異序列。在一個家族內(nèi)ID序列組的定義特性在于所有的成員都能夠與一個“獨(dú)特基因組”雜交(見表1和上文的定義)。例如,一個ID序列家族可以由100個ID序列組成,其中包括80個鑒別大腸埃希氏菌O157H7病原體類群的菌株(來源于菌株DEC3B的菌株除外)的基因組差異序列、18個存在于所有大腸埃希氏菌O157H7菌株中的類群特異性序列、以及2個存在于大腸埃希氏菌所有菌株中的類群特異性序列。注意雖然這些序列可用于專門鑒定大腸埃希氏菌O157H7類群中的病原體,但所有這些序列都可以與一個獨(dú)特基因組,即大腸埃希氏菌O157H7 DEC3B菌株的基因組雜交。
基因組分布分析的獨(dú)特特征是該方法可以用于一次掃描樣品中許多不同家族的存在。由多于一個家族組成的一組ID序列稱為一個ID序列“集合”。一個集合中家族的數(shù)量反映出該集合可以測試的不同生物類群的數(shù)量。一個集合內(nèi)的家族數(shù)量又可以用稱為集合“最小基因組起源”的數(shù)量來準(zhǔn)確定義?!白钚』蚪M起源”是組成該集合的所有序列可以雜交的“獨(dú)特基因組”的最小數(shù)量。例如,基因組分布分析可以用最小基因組起源為5的一個集合同時測試痰樣品中結(jié)核分枝桿菌、軍團(tuán)菌、Coccidoides immitus、流感病毒和呼吸道合胞病毒的存在。因此,基因組分布分析在一次測試中鑒定廣泛范圍生物的能力是該方法掃描樣品中具有大“最小基因組起源”集合的ID序列存在的能力的結(jié)果。
相似的,在非傳染病的應(yīng)用例如人類遺傳篩選和法醫(yī)學(xué)中,可以使用基因組分布分析掃描樣品中單核苷酸多態(tài)性的集合。與ID序列集合的定義相似,SNP集合定義為一組多家族SNP。一個SNP家族就如一個ID序列家族一樣,反映一個個體的基因型。注意ID序列家族根據(jù)成員ID序列與單個個體的基因組雜交的能力來定義,而SNP家族則是根據(jù)與單個生物的基因型的對應(yīng)來定義。
應(yīng)用基因組分布分析進(jìn)行基因型分析(genotyping)的一個好處是可以使用健全的雜交測定來檢測SNP。在一些大規(guī)模SNP基因型分析應(yīng)用中,檢測區(qū)分形成完全配對雙鏈體(perfect duplex)的寡核苷酸雜交體和形成帶有單堿基對錯配的雙鏈體的寡核苷酸雜交體的SNP基因型。與此不同,基因組分布分析可以測試寡核苷酸標(biāo)記序列的存在或不存在,這是一個更容易的工作。為完成這種更健全的雜交測試,可以將獨(dú)特的非生物學(xué)標(biāo)記序列摻入每種SNP探針。因此,這樣的SNP探針集合與標(biāo)記序列集合相應(yīng),并且每個SNP家族與一個標(biāo)記序列家族相應(yīng)。在基因組分布分析測定的檢測步驟中,可以使用由一個標(biāo)記序列集合構(gòu)成的一個檢測集合,檢測一個對應(yīng)于從單個個體分離的基因組DNA樣品的基因型的擴(kuò)增的SNP探針家族(包括對應(yīng)的標(biāo)記序列家族)(見圖3)。
優(yōu)選的基因組分布分析方法通用設(shè)置包括以下步驟步驟1指定一個包括基因組差異序列和類群特異性序列的ID序列集合,其中將在給定測試中探測所述集合。該步驟涉及選擇需要檢測的生物和選擇診斷ID序列的家族。
步驟2設(shè)計(jì)和制備一個對應(yīng)于要在生物樣品中檢測的ID序列集合的探針集合。同時設(shè)計(jì)和制備對照探針。
步驟3設(shè)計(jì)和制備一個對應(yīng)于所述ID探針集合的檢測集合。同時設(shè)計(jì)和制備對應(yīng)于對照探針的對照序列。在一個優(yōu)選的實(shí)施方案中,制備兩維的檢測陣列。
步驟4制備生物樣品。該步驟涉及裂解樣品中的生物,以便所述生物的核酸分子能夠進(jìn)行雜交。例如,處理樣品如大便樣品或呼吸系統(tǒng)樣品,以便來自所述樣品中的生物的核酸分子結(jié)合到固相支持體上。
步驟5從所述ID探針組合中選出與所制備樣品中的基因組序列雜交(結(jié)合)的ID探針。然后通過洗滌除去未雜交、未結(jié)合的探針。
步驟6擴(kuò)增與所述樣品中的基因組序列結(jié)合的ID探針。
步驟7通過所擴(kuò)增的探針序列與檢測集合的雜交,鑒定樣品選定的ID探針。
步驟8通過所述樣品選定的ID探針與所述生物樣品的原位雜交,定量所述生物樣品中的靶生物。
(注意為了簡單化,優(yōu)選通用設(shè)置的步驟根據(jù)使用ID序列的基因組分布分析描述。對于用于使用SNP的基因組分布分析的該方法的修改,見實(shí)施例5)這些步驟的每一個步驟如下更詳細(xì)描述。
步驟1指定一個包括基因組差異序列和類群特異性序列的ID序列集合,其中將在給定測試中探測所述集合。該步驟涉及選擇需要檢測的生物和選擇診斷ID序列的家族。
基因組分布分析的第一個步驟涉及選擇需要檢測的生物類型。例如,對于醫(yī)學(xué)應(yīng)用,可以選擇人類病原體;為檢測食物腐敗,可以選擇導(dǎo)致食物毒性的細(xì)菌;為法醫(yī)學(xué)目的,可以選擇多個人類個體等等。為特定測試選擇的生物可以在它們的遺傳組成上相差極大,例如不同界的成員(即病毒、細(xì)菌、古細(xì)菌、真菌、原生動物、植物和動物);或者,所選擇的生物可以是一個更小的類群如一個種的成員。基因組分布分析的一個重要的應(yīng)用是檢測人類體液樣品中或大便中的病原體,所述人類體液樣品如血液、尿、腦脊液或痰。(本方法對于應(yīng)用于多種其它組織樣品也是重要的。)根據(jù)組織樣品的來源以及患者的癥狀,決定需要鑒定的重要生物類型。例如,可以選擇檢測通常是肺炎的病因的病毒、細(xì)菌和真核寄生蟲。
一旦決定了需要通過基因組分布分析測定鑒定的生物類型,就為該測定選擇一個ID序列集合。由多個ID序列家族組裝所述集合,其中每個ID序列家族都是在所述測定中需要檢測的一種生物類型的診斷性序列。所述ID序列集合不一定在物理上是分離的。當(dāng)然,可以僅僅將這樣一個集合概念化,以利于設(shè)計(jì)用于構(gòu)建探針集合的ID探針(見下文)。
如上文所述,所述ID序列集合包括兩種有用的序列類型基因組差異序列和類群特異性序列。對于任何特定靶生物類型來說,是否包括類群特異性序列、基因組差異序列或二者都包括的選擇取決于與所述特定生物類型相關(guān)的診斷用組織。
當(dāng)重要的是需要知道一個生物類群的任一成員是否存在于樣品中時,類群特異性序列在診斷上是最有用的。例如,如果重要的是需要知道腸沙門氏菌類群的任一成員是否存在于胃腸樣品中,則類群特異性樣品是有幫助的。當(dāng)測試病毒如丙型肝炎病毒時,也可能選擇類群特異性樣品。
與類群特異性樣品不同,當(dāng)需要在一個類群內(nèi)區(qū)分密切相關(guān)的菌株時,基因組差異序列尤其有用。例如,當(dāng)重要的病原體(如大腸埃希氏菌O157H7)與出現(xiàn)在同一組織中的菌株(如共生的大腸埃希氏菌)密切相關(guān)時,就是這種情況。當(dāng)需要傳染因子的指紋時,基因組差異序列也是有價值的。指紋分析或高分辨率菌株鑒定是追蹤和遏制傳染病爆發(fā)(包括基于醫(yī)院的感染)的有力流行病學(xué)工具。在治療上,指紋分析,尤其是在快速、不依賴于培養(yǎng)的測試中的指紋分析,提供了比目前實(shí)踐快得多地確定需要給予何種抗生素的可能救命的機(jī)會。
對于需要在基因組分布分析測定中檢測的每一種生物類型,使用標(biāo)準(zhǔn)方法選擇包含類群特異性序列和/或基因組差異序列的ID序列家族,所述標(biāo)準(zhǔn)方法如在下文和在實(shí)施例中描述的那些方法。假如新分離出的ID序列的序列還是未知的,就通過標(biāo)準(zhǔn)方法測定該序列。然后將對應(yīng)于不同并且可能不相關(guān)的生物類型的各種ID序列家族組織成為一個集合。
然后使用商業(yè)化可得的寡核苷酸合成方法或服務(wù),通過從質(zhì)粒合成重組DNA,或通過用于產(chǎn)生足量純DNA分子的任何其它方法,設(shè)計(jì)并合成對應(yīng)于所選擇的ID序列的探針集合。給定ID序列的探針可以包括一個、兩個或幾個寡核苷酸以及用于檢測的附加部分。至少所述探針的一部分即ID位點(diǎn)設(shè)計(jì)用于與來自測試生物的ID序列核酸分子雜交。
使用基因組扣除分離基因組差異序列?;蚪M差異序列用于將一個菌株與一個密切相關(guān)的菌株區(qū)分開來?;蚪M差異序列家族具有這樣的特性該家族中不同序列亞組存在于不同菌株中。基因組分布分析可以確定在臨床樣品中出現(xiàn)的基因組差異序列家族的亞組。這樣就準(zhǔn)確鑒定了在樣品中存在的一個菌株?;蚪M分布分析優(yōu)于現(xiàn)有測定的一個好處是可以同時調(diào)查許多不同家族,其中每個家族都能夠?qū)σ粋€特定生物類群進(jìn)行指紋分析。
可以通過對致病菌株和相關(guān)的非致病菌株進(jìn)行基因組扣除而分離可用于臨床診斷的基因組差異序列。一些基因組差異序列具有重大的臨床重要性。例如,近年來逐漸了解致病細(xì)菌常常帶有“致病性島(pathogenicity island)”,即包含致病性所需的多個毒性基因的連續(xù)DNA序列段。密切相關(guān)的非致病菌株一般缺乏致病性島。因此,致病性島是有用的基因組差異序列。其它(可能大多數(shù))基因組差異序列沒有臨床重要性,但對于菌株鑒定仍然是非常有價值的。值得注意的是在類群特異性序列和基因組差異序列間的區(qū)別有時是不清楚的。例如,可以將大腸埃希氏菌O157H7致病性島看作基因組差異序列,因?yàn)樗霈F(xiàn)在大腸埃希氏菌的一些菌株中,但不出現(xiàn)在其它菌株中?;蛘撸恍蛄锌梢钥醋魇穷惾禾禺愋孕蛄?,因?yàn)樗霈F(xiàn)在由大腸埃希氏菌O157H7菌株組成的分類單位的所有成員中。不考慮有時出現(xiàn)的不明確性,這些序列是有用的診斷ID序列。
可以通過使用幾種基因組扣除方法中的一種,分離基因組差異序列家族(如Straus,1995,見上文;Diatchenko等,Proc.Natl.Acad.Sci.U.SA.936025-6030,1996;Tinsley等,Proc.Natl.Acad.Sci.U.S.A.9311109-11114,1996)?;蚪M扣除分離在一個菌株(“+”菌株)的基因組中出現(xiàn),但不在相關(guān)菌株(“-”菌株)的基因組中出現(xiàn)的DNA序列。基因組扣除的產(chǎn)物是基因組差異序列家族整個組與所述“+”菌株雜交,沒有一個序列與所述“-”菌株雜交,并且獨(dú)特的亞組與密切相關(guān)的菌株雜交?;蚪M差異序列家族的一個普遍特性是在與用于制造所述基因組差異樣品的菌株(即用于基因組扣除的菌株)密切相關(guān)的菌株的基因組中,所述成員以不同組合出現(xiàn)。該基因組差異序列家族的存在于個別菌株內(nèi)的獨(dú)特亞組構(gòu)成了高分辨率指紋。但是,注意來自基因組扣除的整個基因組差異序列家族可以與一個菌株雜交,即用于制造“+”基因組扣除樣品的菌株。(在使用多于一個菌株制造所述“+”基因組差異樣品的情況下,扣除的產(chǎn)物可以構(gòu)成多于一個家族。)基因組扣除一般使用扣除雜交和親和層析,從“+”和“-”基因組差異樣品中純化基因組差異序列(Straus,1995,見上文)。首先制備來自兩個相關(guān)菌株(“+”菌株和“-”菌株)的基因組DNA。用限制酶切割來自所述“+”菌株的DNA,隨機(jī)剪切來自所述“-”菌株的DNA并用生物素修飾,生物素是親和性標(biāo)記,允許通過與其配體抗生物素蛋白的結(jié)合而隨后除去所述“-”菌株DNA。通過使來自所述“+”菌株和所述“-”菌株的變性DNA片段復(fù)性,完成對基因組差異樣品的富集。復(fù)性后,通過與抗生物蛋白包被的珠粒的結(jié)合,取出生物素化序列以及所有已經(jīng)與所述生物素化序列雜交的序列。然后重復(fù)該扣除過程幾次。在每一個循環(huán)中,來自前一輪扣除的來自所述“+”菌株的未結(jié)合DNA與新鮮的來自所述“-”菌株的生物素化DNA雜交。將來自最后一個循環(huán)的來自所述“+”菌株的未結(jié)合DNA連接到連接物上,并在聚合酶鏈?zhǔn)椒磻?yīng)中通過使用所述連接物的一條鏈作為引物進(jìn)行擴(kuò)增。然后可以克隆所擴(kuò)增的序列。注意進(jìn)行交互扣除(即轉(zhuǎn)換“+”菌株和“-”菌株)產(chǎn)生一組不同的基因組差異序列。這樣的可以用于產(chǎn)生基因組差異序列的扣除方法是重組DNA技術(shù)領(lǐng)域內(nèi)一般技術(shù)人員已知的,并且這樣的方法已經(jīng)廣泛發(fā)表。在下面的實(shí)施例中提供其它細(xì)節(jié)。
基因組扣除的全面評述在圖2中圖解說明。圖2A顯示了具有共同祖先的一個生物類群(“分類單位”)的假設(shè)的系統(tǒng)樹。其中一些生物是病原體,而另一些是非病原體。圖2B圖解說明了用于分離基因組差異序列的一種策略??梢赃x擇一個相關(guān)菌株類群中的兩種生物(如菌株1和菌株8)制備基因組差異序列。病原體菌株1用于制備“+”基因組差異樣品,而非病原體菌株8用于制造“-”基因組差異樣品。所述扣除(圖2B)的產(chǎn)物是出現(xiàn)在菌株1中、但不出現(xiàn)于菌株8中的基因組差異序列。這些基因組差異序列可以用于對該類群內(nèi)的任何菌株(即包括菌株2-7)進(jìn)行指紋分析。使用菌株1和菌株8的基因組扣除(圖2A)可以從菌株1產(chǎn)生數(shù)百種不出現(xiàn)于菌株8中的序列。菌株2具有這些基因組差異序列中的一些,但缺乏其它的基因組差異序列。菌株5攜帶有所述基因組差異序列的一個獨(dú)特亞組,菌株7也一樣,依此類推。重要并且普遍性的發(fā)現(xiàn)是當(dāng)應(yīng)用基因組扣除于一個類群內(nèi)的兩個菌株(圖2中的菌株1和菌株8以及本文描述的實(shí)施例)時,相關(guān)菌株(如菌株2和菌株5)攜帶有所得基因組扣除產(chǎn)物的不同亞組。
如圖2C所舉例說明的,也可以通過從幾種生物匯集基因組核酸而產(chǎn)生基因組差異序列。例如,可以通過匯集幾種病原體而產(chǎn)生“+”樣品,可以通過匯集幾種非病原體而產(chǎn)生“-”樣品(圖2C)。在這種情況下,通過基因組扣除分離的基因組差異序列是在所述“+”基因組差異樣品的至少一種病原體基因組中出現(xiàn)、但不在任何一種所述“-”基因組差異樣品的非病原體基因組中出現(xiàn)的序列。
不用扣除雜交,而可以使用計(jì)算機(jī)和序列比較軟件比較兩種生物或兩組生物的基因組,并因此產(chǎn)生基因組差異序列。例如,當(dāng)靶生物基因組的序列完成或基本完成時,該方法是實(shí)用的。例如,已經(jīng)報道了其序列最近已經(jīng)完成的幽門螺桿菌(Helicobacter pylori)的相關(guān)菌株的基于計(jì)算機(jī)的比較(Alm等,Nature 397176-180,1999)。已經(jīng)公開的分析和公眾可獲得的數(shù)據(jù)提供了對于一種或另一種菌株獨(dú)特的多種基因組差異序列。則這種分析構(gòu)成了一種類型的“虛擬(virtual)”基因組扣除分析,由所述分析確定了基因組差異序列。
分離類群特異性序列。當(dāng)重要的是僅僅確定某個類群的任一成員是否存在于生物樣品中時(與確定來自某個類群的哪種個別菌株不同),在通過基因組分布分析測定評估的ID序列集合中包括類群特異性序列??梢杂枚喾N方法分離類群特異性序列,包括通過基因組扣除和通過分析公共數(shù)據(jù)庫。例如,基因組扣除使用來自作為“+”基因組差異樣品的致病性結(jié)核分枝桿菌菌株的DNA,以及來自作為“-”菌株的非致病性分枝桿菌菌株的DNA,所述基因組扣除產(chǎn)生類群特異性序列,其中包括在所有致病性肺炎分枝桿菌菌株中共有的毒性基因。這些類群特異性序列對于測試引起肺結(jié)核的菌株的存在的是價值的ID序列。作為另一個例子,可以通過在公共數(shù)據(jù)庫如GenBank中掃描病毒基因組DNA序列,篩選在所有單純皰疹病毒的已知分離物中出現(xiàn)、但不在該數(shù)據(jù)庫其它類型病毒中出現(xiàn)的序列,從而分離針對單純皰疹病毒的類群特異性序列。
步驟2設(shè)計(jì)和制備對應(yīng)于要在生物樣品中檢測的ID序列集合的ID探針集合。同時設(shè)計(jì)和制備對照探針。
在基因組分布分析的第二個步驟中,設(shè)計(jì)ID探針集合,以便該集合中的ID探針可以與步驟1中選定用于基因組分布分析的ID序列集合的成員雜交。一個ID探針可以包括單個寡核苷酸,或者在優(yōu)選的實(shí)施方案中,ID探針可以包括兩個或更多個寡核苷酸。ID探針和任何其組成寡核苷酸可以包含一個或多個功能部分。
一種ID探針的一個部分即ID位點(diǎn)對應(yīng)于一種ID序列。在本方法優(yōu)選的實(shí)施方案中,ID探針集合包含多功能ID探針,其中探針序列的第一個部分對應(yīng)于在步驟1中組裝的ID序列集合中的一個序列。因此,如下文所述,一個這樣的ID探針包括對應(yīng)于一個ID序列的一部分的一個序列或一組序列,并且所述ID探針可以與包括所述ID序列在內(nèi)的核酸分子雜交。該部分稱為ID位點(diǎn)。例如,這樣一種ID探針可以包含對應(yīng)于一種基因組差異序列或一種類群特異性序列的ID位點(diǎn)。
對應(yīng)于擴(kuò)增序列的ID探針的部分?;蚪M分布分析的一個重大好處是它能夠一次完成許多序列的健全的無假象擴(kuò)增的能力。通過使用非常少量的擴(kuò)增序列指導(dǎo)大量獨(dú)特ID探針的擴(kuò)增,基因組分布分析測定避免了在多重擴(kuò)增中通常出現(xiàn)的擴(kuò)增假象。為此,所述ID探針的第二個部分(除所述第一個部分外,對應(yīng)于一種ID序列)可以包括一個或多個擴(kuò)增序列。例如,該第二部分可以對應(yīng)于一個或多個引物結(jié)合位點(diǎn),或?qū)?yīng)于核酸聚合酶如Qβ復(fù)制酶的結(jié)合位點(diǎn)。所述擴(kuò)增部分是該集合內(nèi)(包括對照序列)要擴(kuò)增的大多數(shù)或所有探針?biāo)灿械?。因此,可以在同一反?yīng)中有效擴(kuò)增的包括ID探針和對照序列的集合(見下文)的探針組。所述探針可選的第三個部分可以包括用于檢測所擴(kuò)增探針的標(biāo)記序列。標(biāo)記的使用在下面的步驟3中討論。
對照序列。在ID探針集合中可以包括陽性對照和陰性對照。在所述集合中可以包括并不對應(yīng)于實(shí)際基因組中的序列、而對應(yīng)于在樣品制備過程中加入所述樣品中的對照核酸分子的陽性對照序列。在基因組分布分析測定中,檢測到陽性對照序列指示整個測定工作正確。(當(dāng)在樣品中沒有檢測到ID序列時,重要的是知道所述樣品中是否確實(shí)不存在ID序列,或者是否測試由于某種原因失敗。)在所述ID序列探針集合中也可以包括陰性對照序列。這些陰性對照序列并不對應(yīng)于天然出現(xiàn)的序列,并且與陽性對照序列不同,這些陰性對照序列并不加入所述生物樣品中。通過基因組分布分析測定檢測到的陰性對照序列的水平指示出在所述測定中,由于不依賴于ID序列的選擇和ID探針的擴(kuò)增而產(chǎn)生的背景水平。
二元探針(半邊探針)。在一個實(shí)施方案中,一個ID探針由一對寡核苷酸組成,即左半邊ID探針和右半邊ID探針(圖3)。每個左半邊探針和右半邊探針的內(nèi)部部分包括對應(yīng)于一種ID序列的鄰近部分的序列,所述ID序列如基因組差異序列或類群特異性序列。當(dāng)所述半邊探針與變性ID序列雜交時,可以通過核酸連接酶連接各探針部分。如下文所描述的,半邊探針的依賴于樣品的連接導(dǎo)致形成可以擴(kuò)增和檢測的更大分子。
在本實(shí)施方案中,每個半邊探針的外部部分包括一個擴(kuò)增序列,所述擴(kuò)增序列例如對應(yīng)于用于聚合酶鏈?zhǔn)椒磻?yīng)的引物結(jié)合位點(diǎn)的位點(diǎn)。在這樣的ID探針集合中,每個探針具有一個獨(dú)特ID序列和標(biāo)記序列,但具有一對共有的引物結(jié)合位點(diǎn)。假如存在標(biāo)記序列,則該標(biāo)記序列位于其中一個半邊探針的內(nèi)部部分和外部部分之間。
圖3圖解說明了一個實(shí)施方案,該實(shí)施方案使用了半邊探針、依賴于ID序列的連接、標(biāo)記、以及PCR擴(kuò)增與樣品雜交的半邊探針。在這個實(shí)施例中,PCR的左引物與引物位點(diǎn)-L序列相同,而右引物是引物位點(diǎn)-R序列的反向互補(bǔ)物。在該檢測陣列中可以包括四種不同的標(biāo)記序列(tag-R、tag-R’、tag-L和tag-L’)(見下文)。所述四種標(biāo)記序列與兩種互補(bǔ)序列雜交,所述互補(bǔ)序列每一個都包含在所擴(kuò)增的ID探針中的兩種標(biāo)記序列。
ID探針的合成和濃縮。通過標(biāo)準(zhǔn)核酸合成技術(shù)制備ID探針。確定所述ID探針的序列和所述ID探針在水溶液中的濃度。根據(jù)需要,所述ID探針在水溶液中的濃度可以不同。例如,在一個ID探針集合中,每種寡核苷酸可以以等摩爾量存在。在一個可替代的實(shí)施方案中,ID探針存在的量與包含所述對應(yīng)生物的典型生物樣品中其對應(yīng)ID序列的預(yù)期豐度負(fù)相關(guān)。例如,假如一個人同時受到輪狀病毒和寄生性線蟲的胃腸感染,則在大便樣品中的輪狀病毒基因組拷貝數(shù)可能比所述大便樣品中的線蟲基因組拷貝數(shù)更多。因此,使針對輪狀病毒序列的探針以有限量存在是有用的。
步驟3設(shè)計(jì)和制備對應(yīng)于所述ID探針集合的檢測集合。同時設(shè)計(jì)和制備對應(yīng)于對照探針的對照序列。在一個優(yōu)選的實(shí)施方案中,制備二維檢測陣列。
檢測集合的作用是檢測和鑒定通過與生物樣品中的ID序列雜交而選定的ID探針集合亞組。所述檢測集合包含對應(yīng)于在步驟2中組裝的ID探針集合的序列(以及對應(yīng)于對于該測試中不同類型生物的存在是診斷性的ID序列的序列)。換句話說,所述檢測集合與所述ID探針集合相應(yīng)。所述檢測集合中也包括對應(yīng)于所述對照探針的對照序列。
所述檢測集合由可以用于檢測探針-樣品雜交事件的核酸分子組成。所述檢測集合可以包括對應(yīng)于ID序列或所述探針內(nèi)序列標(biāo)記的序列。在基因組分布分析方法的一個實(shí)施方案中,使所述檢測集合的DNA序列變性并固定到固相支持體上,以便所述檢測集合的DNA序列可以與所加入的ID探針雜交。當(dāng)在平面固相支持體上構(gòu)建所述檢測集合時,該檢測集合稱為二維檢測陣列。將所述檢測序列DNA置于所述支持物上的不同位置。將DNA分子以這種方式固定到固相支持體上的方法是基因組學(xué)領(lǐng)域內(nèi)的技術(shù)人員已知的。例如,在實(shí)施例中提到的方法可以用于該目的?;蛘?,可以在液相中進(jìn)行所述樣品選定的ID探針與所述檢測陣列的雜交,如在下面的實(shí)施例3所述。
在陣列設(shè)計(jì)的一個優(yōu)選實(shí)施方案中,對應(yīng)于一個類群或相關(guān)類群的檢測序列在所述陣列上相互相臨排列。這樣,檢測序列家族,即那些對給定類型生物(例如,在大腸埃希氏菌O157H7類群中的病原體)特異性的檢測序列家族就作為一組相鄰點(diǎn)放置在一起。此外,將對應(yīng)于密切相關(guān)家族(例如大腸埃希氏菌O157H7和志賀氏菌屬)的檢測序列家族放置在所述陣列的同一區(qū)。這種組織方便了雜交結(jié)果的讀取。
所述ID探針集合所包括的陽性對照序列和陰性對照序列(見上文)也可以摻入所述檢測集合中。如上文所討論的,也將所述陽性對照序列與所述生物樣品混合,并用于指示所述測定的正確運(yùn)行。所述陽性對照探針序列與所述生物樣品中的靶對照序列雜交,擴(kuò)增所述陽性對照探針序列,然后使所述陽性對照探針序列與所述檢測陣列中的對應(yīng)對照序列雜交。
陰性對照序列是所述測定中不依賴于病原體的背景信號的有用量度(即,盡管在所述生物樣品中不存在對應(yīng)病原體,但仍被擴(kuò)增的ID探針的量的量度)。與陽性對照序列不同,陰性對照序列并不與所述生物樣品混合。這樣,陰性對照序列在所述生物樣品中沒有要雜交的靶序列。所述陰性對照序列與所述生物樣品或樣品基質(zhì)的非特異性結(jié)合,使得這些序列隨后被擴(kuò)增并與所述檢測陣列中的對應(yīng)序列雜交。
構(gòu)建包含一個檢測序列集合的陣列。可以使用各種類型的檢測陣列來檢測診斷序列。圖4圖解說明了用于下文描述的實(shí)施例的檢測陣列的一些設(shè)計(jì)。
已經(jīng)描述了多種用于構(gòu)建核酸分子陣列的方法。用于本發(fā)明的一種優(yōu)選方法是這樣一種方法其中核酸分子以高密度放置在聚賴氨酸處理過的玻璃載玻片上(見,如,Schena等,Science 270467-470,1995)。對應(yīng)于ID序列的檢測序列可以作為克隆DNA(如作為質(zhì)粒載體中的插入片段)、作為擴(kuò)增的DNA(如由克隆序列的擴(kuò)增得到的PCR產(chǎn)物)或作為合成寡核苷酸放置在所述陣列中。
或者,所述檢測集合可以包括一組可尋址的合成寡核苷酸標(biāo)記,而不是ID序列。在這種情況下,所述標(biāo)記對應(yīng)于所述ID探針(如下文所述)或SNP探針(如在實(shí)施例5中所述)中的標(biāo)記元件。所述陣列中的每種可尋址標(biāo)記對應(yīng)于在接受雜交選擇的探針集合中與特定探針序列結(jié)合的標(biāo)記(見下文)。在陣列元件和探針集合之間的一一對應(yīng)關(guān)系使得有可能通過觀察哪些寡核苷酸標(biāo)記陣列元件與混合物中的分子雜交,鑒定所述混合物中的所述ID序列。該方法的好處是可以使用預(yù)制的陣列,因?yàn)榘唤M可尋址標(biāo)記的陣列可以用于不同組探針。例如,用于檢測呼吸系統(tǒng)病原體的一組探針和用于檢測胃腸病原體的一組探針可以使用同一組標(biāo)記。這樣,可以使用一種陣列檢測呼吸系統(tǒng)樣品或胃腸道樣品中的病原體。
或者,所述檢測陣列可以是在液體中與所述樣品或探針雜交的檢測序列組。檢測陣列也可以是診斷產(chǎn)物所比較的一組物理特性,如分子量。
步驟4制備生物樣品。該步驟涉及裂解樣品中的生物,以便所述生物的核酸分子可以用于雜交。例如,處理樣品如大便樣品或呼吸系統(tǒng)樣品,使得來自所述樣品中生物的核酸分子結(jié)合到固相支持體上。
通過下面的樣品制備策略達(dá)到的目標(biāo)是(a)將來自廣泛來源(如培養(yǎng)物、菌落、痰、血液、尿和糞便)的樣品轉(zhuǎn)化成為與所述測定的隨后步驟相匹配的共有形式。裂解生物,并使它們的基因組核酸分子可以用于雜交。
(b)濃縮所述樣品,因此增加所述測定在測試稀形式的生物(如在尿樣品或血液樣品的情況下)時的靈敏度。
(c)通過去除或固定化抑制性物質(zhì),除去或減弱所述樣品中酶抑制劑的效應(yīng)。
可以使用幾種樣品制備方法中的任何一種制備用于本方法中的樣品。樣品制備的一般概念是使核酸分子釋放和變性,以及除去可能干擾隨后步驟的污染蛋白質(zhì)和其它物質(zhì)??梢钥蛇x地用樣品制備方法選擇性保留DNA、RNA或同時保留二者。
在制備前,可以通過標(biāo)準(zhǔn)過濾裝置過濾,濃縮稀的樣品類型如尿樣品。假如樣品來源包含大于目標(biāo)生物的顆粒性物質(zhì),那么在執(zhí)行樣品濃縮步驟前,通過使所述樣品過濾通過孔徑大于目標(biāo)生物的濾膜,從所述樣品中除去所述顆粒。當(dāng)測試微生物時,例如,通過用平均孔徑為20到30微米的膜預(yù)過濾,將微生物與大顆粒分離開來。
或者,可以使用離心步驟將微生物與具有不同大小或密度的材料分離開來。例如,可以通過離心步驟,以導(dǎo)致大顆粒而不是微生物沉積在沉淀中的速度,將大顆粒物質(zhì)與微生物分離開來。如在培養(yǎng)的微生物樣品的情況下,可選地通過離心由液相分離微生物。使用過濾和離心的組合來濃縮和富集懷疑的測試生物。然后進(jìn)一步制備從通過離心處理的樣品回收的沉淀。過濾和離心都有潛在的缺點(diǎn)病毒可能從樣品中丟失。該步驟也可以包括其它富集方法,如親和層析、細(xì)胞分選和基于抗原的富集。
在一個優(yōu)選的實(shí)施方案中,將實(shí)驗(yàn)樣品(通過過濾或離心獲得的,以及有高含量微生物的粗制樣品如糞便樣品)淀積并固定到固相支持體上,所述固相支持體如尼龍濾膜、顆粒性基質(zhì)或珠粒(圖5)。使用固相支持體提供了優(yōu)于其它方法的幾種好處。將樣品DNA固定到固相支持體上并使其變性,準(zhǔn)備與單鏈核酸分子探針雜交。通過固定和洗滌粗制DNA樣品,酶促步驟(如連接和擴(kuò)增)的抑制劑或者被固定到基質(zhì)上,或者從包含結(jié)合DNA的濾膜上洗滌下來。這是一個重要的好處,因?yàn)閷εR床樣品的PCR測試有時由于樣品成分的抑制而缺乏靈敏度。最后,包括內(nèi)部對照以檢測假陰性結(jié)果是簡單的。
優(yōu)選的支持物是尼龍濾膜,尼龍濾膜耐用但柔韌,廣泛用于固定包含核酸分子的樣品以進(jìn)行雜交測定(Church等,Proc.Natl.Acad.Sci.USA 811991-1995,1984)。將粗制樣品如痰樣品或糞便樣品涂抹到固相支持體上,如同目前當(dāng)使用“抗酸涂片”測定(Koneman等,Color Atlasand Textbook of Diagnostic Microbiology(Lippincott-Raven,Philadelphia,1997))來測試痰樣品中的結(jié)核分枝桿菌時的實(shí)踐一樣。相似的,可以將在培養(yǎng)皿的半固體培養(yǎng)基上生長的細(xì)菌或真菌菌落“轉(zhuǎn)移”到尼龍濾膜上,或從培養(yǎng)皿涂抹到濾膜上涂抹到固相支持體上。
在一個優(yōu)選的實(shí)施方案中,隨后使用破開樣品中的細(xì)胞并變性任何雙鏈DNA的程序,將樣品固定到固相支持體上。已經(jīng)發(fā)展了用于破開細(xì)胞的多種方法。這些方法包括機(jī)械破碎和用堿、離液劑、熱以及有機(jī)溶劑處理。本發(fā)明的該步驟可以加入一個或多個這樣的方法以破碎細(xì)胞。一種涉及堿處理以及隨后的中和及洗滌的簡單方法是將樣品中的變性DNA固定到固相支持體上的優(yōu)選方法(Hanahan等,MethodsEnzymol.100333-42,1983;Grunstein等,Proc.Natl.Acad.Sci.USA 723961-3965,1975;Ausubel,1987,見上文)。
假如測定產(chǎn)生了陰性結(jié)果,重要的是知道所述樣品是否確實(shí)不含有來自測試微生物的基因組DNA,或者是否所述測試本身失敗,即該結(jié)果是否是假陰性。由于實(shí)驗(yàn)樣品中阻斷所述測定中一個酶促步驟的抑制劑的存在,可能出現(xiàn)假陰性。
為鑒定假陰性結(jié)果,可以在所述實(shí)驗(yàn)樣品中加入一個或多個陽性對照DNA樣品。所述陽性對照DNA樣品包含不在所測試的生物范圍內(nèi)出現(xiàn)的DNA序列。在所述探針集合中包括對應(yīng)于所述陽性對照DNA樣品的探針。這些探針將在所有的測定中被擴(kuò)增和檢測到,除非一個或多個測定步驟是不成功的。不能檢測到來自陽性對照的信號將由此可以指示假陰性結(jié)果。
圖5圖解說明了樣品制備、雜交-選擇、擴(kuò)增以及檢測所選定的探針。在該實(shí)施方案中,通過將樣品裂解到尼龍濾膜上而制備樣品,以便使所述樣品的核酸分子變性并結(jié)合到所述濾膜上。陽性對照DNA樣品也結(jié)合到所述濾膜上。然后使可連接的半邊探針與結(jié)合的核酸分子雜交。假如一種探針的兩半都結(jié)合到一種ID序列上,則它們被連接起來以產(chǎn)生全長的探針,因?yàn)樵谒鋈L探針的每個末端存在引物結(jié)合位點(diǎn),所以所述全長探針可以用PCR擴(kuò)增。不正確結(jié)合的半邊探針不能通過PCR擴(kuò)增。
步驟5從與所制備樣品中的基因組序列雜交(結(jié)合)的ID探針集合中選擇ID探針。通過洗滌除去未雜交、未結(jié)合的探針。
使所述探針集合與已固定的樣品雜交的目的是選擇對應(yīng)于所述已固定樣品中的基因組DNA、并因此能夠用于鑒定所述基因組DNA的探針,以及將這些雜交探針與非雜交探針分離開來。各種靶生物的基因組DNA與所述ID探針的獨(dú)特亞組雜交。因此,選定的ID探針特定亞組構(gòu)成特定生物的基因組的指紋。所述ID探針雜交步驟設(shè)計(jì)是快速、特異性、并用來測試廣泛范圍的生物。包括陽性對照和陰性對照便利了確定所述雜交是否如所需要地起作用。
在該步驟中,使ID探針集合與變性的核酸樣品雜交。如上所述,雜交可以在水溶液中完成,或者可以用固定化在固相支持體上的核酸分子完成。通過將探針集合與所制備的生物樣品混合,并最好溫育直到至少度過一個Cot1/2時間,進(jìn)行雜交。隨后洗滌、稀釋或用其它方法處理所述探針/樣品混合物,以便從已雜交的探針和所述樣品中分離出未雜交或非特異性雜交的探針分子??梢詫σ央s交的探針進(jìn)行酶處理,如連接或核酸聚合。最后,如下一個步驟所述,從樣品核酸分子中分離已雜交的探針并進(jìn)行擴(kuò)增。
在一個優(yōu)選的實(shí)施方案中,將樣品(包括陽性對照核酸分子)固定到固相支持體上(圖5)。使該樣品與探針集合雜交,所述探針集合包括ID探針和陽性及陰性對照。所述探針由與ID序列的相鄰部分雜交的成對寡核苷酸組成。洗滌已雜交的樣品以除去未結(jié)合的探針,然后用核酸分子連接酶處理已雜交的樣品,連接左半探針和右半探針。最后,從所述樣品中取出連接的左半探針和右半探針,并進(jìn)行擴(kuò)增。下面是該優(yōu)選實(shí)施方案的特定版本的描述。i.將所述ID探針雜交混合物置于所述實(shí)驗(yàn)樣品上,所述實(shí)驗(yàn)樣品固定在固相支持體如玻璃載玻片或尼龍濾膜上。所述優(yōu)選的雜交混合物包括a)一個ID探針集合,其中包括基因組差異序列和/或類群特異性序列探針。在這種情況下,所述ID探針是由兩個可連接半邊探針組成的成對寡核苷酸。在優(yōu)選的體積10-100μl中,每個半探針的優(yōu)選濃度是1-10nM。在優(yōu)選的復(fù)性條件下,該探針濃度導(dǎo)致幾分鐘內(nèi)與所固定的樣品的可接受水平的雜交(Britten等,Meth.Enzym.XXIX363-418,1972)。
b)一對或更多對陽性對照半邊探針,其濃度與所述ID序列的濃度相當(dāng)。這些探針的序列對應(yīng)于固定到固相支持體上的陽性對照DNA(固相支持體上面還結(jié)合了所述生物樣品)。
c)一對或更多對陰性對照半邊探針,其濃度與所述ID序列的濃度相當(dāng)。這些探針序列在已固定的DNA樣品中沒有對應(yīng)物。
d)1M NaCl/10mM EPPS/1mM EDTA,pH8.0。用標(biāo)準(zhǔn)雜交溶液取代也是可接受的(Ausubel,1987,見上文;Church,1984,見上文)。ii用玻璃蓋玻片覆蓋所述雜交混合物,最好用墊片(如CenegatorTM,目錄號#009917,BioWorld Fine ResearchChemicals)將所述玻璃蓋玻片與所述樣品分離開來。iii在約65℃溫育5-30分鐘。iv.洗掉未結(jié)合的探針。這可以通過除去蓋玻片并在嚴(yán)格條件下洗滌所述固定的樣品而完成,使得僅有無錯配或僅少數(shù)錯配而復(fù)性的ID探針保持與固定化的互補(bǔ)基因組DNA結(jié)合。所選擇的條件依賴于幾個因素,包括所述探針中ID序列的長度以及錯配可以接受的程度。
v.連接退火的成對半邊探針。使用T4DNA連接酶(如來自NewEngland Biolabs)連接已經(jīng)退火到所固定的實(shí)驗(yàn)樣品中互補(bǔ)基因組DNA上的相鄰半邊探針。按照廠家的指示進(jìn)行連接。
vi.從所述實(shí)驗(yàn)樣品取出已連接的半邊探針。通過在變性條件下的短暫溫育,從所述樣品中洗脫已經(jīng)退火到所固定的實(shí)驗(yàn)樣品中互補(bǔ)基因組序列的探針。釋放已結(jié)合的探針的優(yōu)選方法是應(yīng)用10mM EPPS/1mM EDTA,蓋上蓋玻片并短暫加熱到100℃。
步驟6擴(kuò)增結(jié)合到樣品中基因組序列的ID探針。
該擴(kuò)增步驟是基因組分布分析測定的高靈敏度的基礎(chǔ)。(然而,并不是在所有的應(yīng)用中都需要擴(kuò)增。)在取出(通過熱變性或化學(xué)變性)任何已經(jīng)與所述生物樣品雜交的ID探針后,使用核酸聚合酶以及核酸分子前體擴(kuò)增所述ID探針。可以使用在所述探針中存在的引物結(jié)合位點(diǎn),用引物驅(qū)動擴(kuò)增。或者,擴(kuò)增可以是由特異性核酸聚合酶(如Qβ復(fù)制酶或T7 RNA聚合酶)結(jié)合到摻入所述探針的特異性結(jié)合位點(diǎn)而驅(qū)動的。可以使用幾種擴(kuò)增方法中的任何一種,包括連接酶鏈?zhǔn)椒磻?yīng)、PCR、依賴于連接的PCR、轉(zhuǎn)錄介導(dǎo)的擴(kuò)增、鏈置換擴(kuò)增、自身支持性序列復(fù)制、滾環(huán)擴(kuò)增等。
可以在擴(kuò)增期間標(biāo)記所述擴(kuò)增產(chǎn)物。例如,可以或者通過使用經(jīng)合成帶有化學(xué)標(biāo)記(如生物素或堿性磷酸酶)或熒光標(biāo)記的引物,或者通過使用標(biāo)記的dNTP前體,標(biāo)記所述擴(kuò)增產(chǎn)物。一種特別有用的方法是使用合成的帶有生物素末端標(biāo)記的引物。
在包括連接的本方法的一個優(yōu)選實(shí)施方案中(圖3和圖5),存在左引物和右引物,這兩種引物對應(yīng)著所述探針寡核苷酸的外部部分。所述左引物與所述左半邊探針的外部部分相同,而所述右引物是所述右半邊探針的外部部分的反向互補(bǔ)物。在反應(yīng)混合物中未連接的半邊探針并不擴(kuò)增到顯著程度。(所述探針對的未連接的左半部分沒有互補(bǔ)的引物,不被擴(kuò)增;所述探針對的未連接的右半部分被線性擴(kuò)增。)步驟7鑒定所述樣品選擇的ID探針使所擴(kuò)增的探針序列與檢測集合雜交。
為產(chǎn)生在所述實(shí)驗(yàn)樣品中存在的基因組的代表性指紋,必須鑒定所述樣品選定的擴(kuò)增的ID探針。通過與由對應(yīng)于(與之相應(yīng))原始未經(jīng)選擇的探針混合物中ID探針的ID序列或ID寡核苷酸或標(biāo)記的集合的雜交,推導(dǎo)所選定ID探針的身份。所述集合中的序列可以對應(yīng)于ID序列的部分或?qū)?yīng)于摻入探針內(nèi)部部分和外部部分之間的標(biāo)記序列。上文的步驟3描述了檢測集合的設(shè)計(jì)和構(gòu)建。
可以使用多種方法中的任何一種進(jìn)行所擴(kuò)增的ID探針的鑒定。在一個實(shí)施方案中,使用擴(kuò)增的ID探針,通過在液體介質(zhì)中雜交而選擇檢測集合的成員。隨后通過使用質(zhì)譜確定分子量,鑒定所選定的檢測集合成員。然后通過與完整檢測序列集合的分子量表相比較,鑒定所選定的序列。在一個優(yōu)選的實(shí)施方案中,通過與二維檢測陣列的雜交,鑒定標(biāo)記的擴(kuò)增ID探針(見上文的步驟3)。使用標(biāo)準(zhǔn)程序雜交和檢測核酸分子(Ausubel等,1987,見上文)。用于鑒定所擴(kuò)增的ID探針的方法在下面的實(shí)施例中進(jìn)一步描述。
步驟8通過樣品選定的ID探針與所述生物樣品的原位雜交,定量所述生物樣品中的靶生物。
定量生物樣品中的靶生物常常是重要的。在醫(yī)藥領(lǐng)域中,例如,關(guān)于人類免疫缺陷病毒在血液中濃度的知識(也稱為病毒載量,或滴度)對于估計(jì)疾病階段以及對治療的反應(yīng)是重要的。當(dāng)在樣品的意外污染和真實(shí)感染之間進(jìn)行區(qū)分時,對樣品中靶生物的數(shù)量的了解也是重要的。
在步驟7中使用的標(biāo)記ID探針可以用于通過使用原位雜交方法,定量所述生物樣品中的靶生物數(shù)量。使一部分經(jīng)標(biāo)記、擴(kuò)增的、樣品所選定的ID探針混合物變性,并用于與已固定的(可選已染色的)生物樣品雜交?;蛘?,可以使用前面步驟檢測到的對于要檢測的生物類型具有特異性的任何類群特異性序列作為探針。對于原位雜交,優(yōu)選使用靈敏并且易于實(shí)施的方法(如Huang等,Modern Pathology 11971-977,1998),所述靈敏的方法如使用催化的報道分子沉積的方法,該方法足以使用單一拷貝序列檢測單一細(xì)胞/病毒。所述固定的樣品可以是在步驟4中使用的同樣的樣品,或者可以通過熟悉本領(lǐng)域的人員已知的其它標(biāo)準(zhǔn)方法制備(如Nuovo等,見上文)。
這些方法在下面的實(shí)施例中描述實(shí)施例1測試胃腸樣品中病原體的存在腸胃炎。腸胃疾病是主要的國際健康問題。每年在兒童中出現(xiàn)約十億病例,導(dǎo)致約五百萬人死亡。該疾病的某些類型在癥狀出現(xiàn)的幾小時內(nèi)可能是致命的。很多種病原體引起胃腸疾病,其中包括細(xì)菌、病毒和原生動物。快速而準(zhǔn)確地鑒定引起胃腸疾病的病原體對于選擇合適的抗微生物療法、鑒定醫(yī)院獲得性感染以及追蹤食物傳染的病原體的爆發(fā)是重要的,其中所述食物傳染的病原體如新出現(xiàn)的病原體大腸埃希氏菌O157H7。
目前診斷胃腸疾病的方法還遠(yuǎn)遠(yuǎn)不夠理想。由于可能的病原體(如病毒病原體、細(xì)菌病原體和寄生病原體)的數(shù)量和范圍,確定感染因子的身份常常是困難、耗時(通常需要至少幾天,有時甚至是幾周)并且昂貴的。在正常消化道中不同微生物的存在加劇了鑒定腸胃炎的病因的難度。測試原生動物感染、病毒感染和細(xì)菌感染,以及檢查樣品中特征性人類細(xì)胞的存在,需要不同的專業(yè)化實(shí)驗(yàn)室設(shè)備。此外,進(jìn)行這些測試必須雇傭高度訓(xùn)練有素的人員。
目標(biāo)和好處。在本實(shí)施例中,我使用單一的基因組分布分析測定來測試來自患有胃腸疾病的患者的樣品中,廣泛范圍胃腸病原體的存在。通過同時并且快速地(如幾小時)測試常見的細(xì)菌病原體、病毒病原體和原生動物病原體,以及測試特征性人類細(xì)胞的存在,本方法提供了優(yōu)于目前實(shí)踐的顯著改進(jìn)。本測試幫助確定合適并且及時的治療。此外,由于基因組分布分析能夠產(chǎn)生高分辨率指紋,因此該方法是用于流行病學(xué)分析的強(qiáng)有力的工具。
注意在本實(shí)施例中描述的用于測試臨床樣品中胃腸病原體的基因組分布分析,對于食品檢驗(yàn)工業(yè)也是有價值的工具。檢驗(yàn)食物中的胃腸病原體對于預(yù)防胃腸疾病是重要的。
本實(shí)施例的總結(jié)。發(fā)展了一種基因組分布分析測定,所述測定在一次測試中,掃描胃腸樣品中一組廣泛的胃腸病原體的存在。我從各種胃腸病原體中分離了一個ID序列集合。對于細(xì)菌病原體和寄生蟲,使用基因組扣除分離基因組差異序列和類群特異性序列。使用計(jì)算機(jī)分析來分離用于鑒定胃腸病毒的類群特異性序列。在給定病原體的DNA中存在的所述ID序列集合的亞組,構(gòu)成了所述病原體的基因組分布分析指紋。通過確定在來自每一胃腸病原體類群的代表性菌株中存在的基因組差異序列亞組,構(gòu)建指紋數(shù)據(jù)庫。通過將臨床樣品中的基因組分布分析指紋與所述指紋數(shù)據(jù)庫相比較,確定所述臨床樣品中病原體的身份。
在本實(shí)施例中使用的方法的總結(jié)。我使用了Straus等(Proc.Natl.Acad.Sci.USA 871889-1893,1990)的基因組扣除方法的改變形式,鑒定引起胃腸疾病的細(xì)菌和寄生蟲的病原體特異性ID序列??梢允褂闷渌蛇x的方法分離基因組差異序列,因此這些方法可以替代下面概述的扣除技術(shù)。對于引起胃腸疾病的病毒,我使用對序列數(shù)據(jù)庫的計(jì)算機(jī)搜索,鑒定了類群特異性序列。通過使ID探針集合與已固定的特定樣品的基因組DNA雜交,鑒定所述樣品中的ID序列。一個ID探針亞組將與所述已固定的基因組DNA雜交,并因此被所述固定的基因組DNA保留下來。使用依賴于連接的PCR策略擴(kuò)增已雜交的ID探針。通過使擴(kuò)增的ID探針與檢測集合雜交,鑒定它們的身份,在這種情況下,所述檢測集合是完整的、未經(jīng)選擇的ID序列組的有序兩維陣列。在所述陣列上可見的雜交信號模式構(gòu)成了基因組分布分析指紋。
從引起胃腸疾病的細(xì)菌中分離基因組差異序列用于從細(xì)菌中分離ID序列的策略。為診斷胃腸疾病,最有用的診斷ID序列是那些在消化道病原體中存在、但在幾百種居住在健康腸中的物種中不存在的ID序列。對于許多細(xì)菌性胃腸病原體來說,可以使用基因組扣除有效地分離這樣的ID序列。如上文所討論的(在詳細(xì)描述部分的步驟2),所使用的基因組扣除策略取決于特定的病原體。本部分舉例說明用于分離代表性胃腸病原體腸沙門氏菌和大腸埃希氏菌的基因組差異序列的兩種不同策略。
從腸沙門氏菌分離基因組差異序列的策略。99%以上的沙門氏菌屬臨床分離物是腸沙門氏菌亞種的成員。腸沙門氏菌的所有菌株都被認(rèn)為是人類病原體。因此,該類群是那些分類單位(生物學(xué)上相關(guān)的類群)的代表對于那些分類單位來說,診斷目標(biāo)是鑒定該類群的任一成員并將該類群的任一成員與該類群的任何其它成員區(qū)分開來。有許多使用現(xiàn)有的菌株分離用于高分辨率鑒定的標(biāo)記的方法;本實(shí)施例使用在圖6中圖解說明的策略。
對于這種方法,將腸沙門氏菌的亞種分為兩個亞群,即X群和Y群。匯集來自每個亞群的代表性成員的DNA,構(gòu)建X群的基因組差異序列和Y群的基因組差異序列。從SARB參考物保藏中心(SARBreference collection)獲得來自每個分支的菌株(Boyd等,J.Gen.Microbiol.1391125-1132,1993)。進(jìn)行使用所述基因組差異樣品的交互扣除。在一次扣除中,使用所述X基因組差異樣品作為“+”樣品,所述Y基因組差異樣品作為“-”樣品。該扣除的產(chǎn)物是在X群的至少一個成員中發(fā)現(xiàn)、但未在Y群的任何成員中發(fā)現(xiàn)的序列。在交互扣除實(shí)驗(yàn)中,使用所述Y基因組差異樣品作為“+”樣品,所述X基因組差異樣品作為“-”樣品。該扣除的產(chǎn)物是在Y群的至少一個成員中發(fā)現(xiàn)、但未在X群的任何成員中發(fā)現(xiàn)的序列。
通過該基因組扣除策略分離的基因組差異序列構(gòu)成一個或多個家族。一般地說,該策略產(chǎn)生多于一個的家族,即一般不是所有的ID序列扣除產(chǎn)物都能與任何單個基因組雜交。因此,對匯集的生物的基因組扣除是從一個相關(guān)生物類群產(chǎn)生多個ID序列家族的有效方法。
從大腸埃希氏菌分離基因組差異序列的策略。圖7A顯示了大腸埃希氏菌類群的部分系統(tǒng)樹。注意該類群中的病原體(黑色)(大腸埃希氏菌O157H7和弗氏志賀氏菌)具有非常密切相關(guān)的非致病性胞親分類單位(sibling taxa)(白色)。對于未在該圖中顯示的大腸埃希氏菌系統(tǒng)樹部分來說,這也是普遍的情況。在健康個體的消化道中多種非致病性或共生性大腸埃希氏菌的存在可能混淆對大腸埃希氏菌致病菌株的診斷。大腸埃希氏菌代表了在人體內(nèi)發(fā)現(xiàn)的包含病原體和非病原體的生物類群。
為分離對這樣的類群進(jìn)行指紋分析的基因組差異序列,應(yīng)用在圖7B和圖7C中描述的策略。匯集來自非致病分類單位(分支)的代表性菌株,用它們的DNA制備“-”基因組差異樣品。匯集來自致病分類單位(分支)的代表性菌株,用它們的DNA制備“+”基因組差異樣品。
基因組扣除的產(chǎn)物是至少在病原體類群的至少一個成員(或者大腸埃希氏菌,或者弗氏志賀氏菌)中發(fā)現(xiàn),但未在所述扣除的任何非致病菌株中發(fā)現(xiàn)的序列。注意該基因組扣除將分離基因組差異序列,其中一些基因組差異序列也是類群特異性序列,因?yàn)樗鼈兂霈F(xiàn)在一個類群(如大腸埃希氏菌O157H7)的所有成員中,但不出現(xiàn)在相關(guān)類群的成員中。出現(xiàn)在致病性大腸埃希氏菌中(但不出現(xiàn)在非致病性大腸埃希氏菌中)的毒性基因(即涉及感染過程的那些基因)屬于這一類產(chǎn)物。
用于本實(shí)驗(yàn)的菌株來自Thomas Whittman博士(Penn.StateUniversiy)提供的ECOR(非致病性)和DEC(致病性)菌株保藏物。
表3.引起急性胃腸疾病的病原體。
引起胃腸疾病的細(xì)菌病原體。表3列出了引起胃腸疾病的常見細(xì)菌類群。由某些這些病原體(包括霍亂弧菌和腸出血性大腸埃希氏菌(如大腸埃希氏菌O157H7))引起的感染甚至在健康個體中都可能是致命的。快速診斷是實(shí)現(xiàn)合適治療和抑制爆發(fā)的關(guān)鍵。為從表3列出的細(xì)菌類群中分離ID序列家族,我使用上文所述應(yīng)用于大腸埃希氏菌和沙門氏菌屬的策略。
制備基因組DNA用于扣除。為制備DNA以制造基因組扣除樣品,將表3所列出的菌株在液體培養(yǎng)基(500ml)中培養(yǎng)直至飽和,并制備基因組DNA(Ausubel等,1987,見上文)。通過上文關(guān)于大腸埃希氏菌和沙門氏菌屬的同樣考慮來選擇“+”菌株和“-”菌株?;旌蟻碜悦總€“+”菌株的DNA(50μg)(此后稱為“+”DNA)。相似地混合來自所述“-”基因組差異樣品菌株的DNA(50μg)(此后稱為“-”DNA)。
制備基因組差異樣品。為制備“-”基因組扣除樣品,如以前所述(Straus,1995,見上文),剪切“-”DNA,使其與乙酸光生物素反應(yīng),然后以2.5mg/ml重懸浮。如下制備“+”基因組扣除樣品用限制酶Sau3A切割“+”DNA(2μg),產(chǎn)生具有粘性末端的片段。用乙醇沉淀后,將所述DNA片段以0.1μg/μl重懸浮于10mMEPPS/1mM EDTA,pH8.0(EE)(Straus,1995,見上文)。
基因組扣除。如以前所述(Straus,1995,見上文)進(jìn)行基因組扣除。為分離病原體特異性DNA片段,使用來自致病菌株的“+”基因組扣除樣品和來自非致病菌株的生物素化“-”基因組扣除樣品進(jìn)行基因組扣除實(shí)驗(yàn)。三個扣除雜交循環(huán)純化了病原體特異性基因組差異序列。
克隆所述基因組差異序列。在將連接物連接到所述基因組差異序列后,使用PCR對它們進(jìn)行擴(kuò)增(Straus,1995,見上文;Straus等,1990,見上文)。然后通過用Sau3A切割,從所擴(kuò)增的基因組差異序列中除去所述連接物。將所述樣品溶于0.3M醋酸鈉(NaOAc),用苯酚/氯仿(1∶1)提取,然后用乙醇沉淀。將部分樣品(20ng)連接到用BamH I消化、去磷酸化的載體pBluescript II KS+(100ng;Stratagene),并將連接后的產(chǎn)物轉(zhuǎn)化進(jìn)大腸埃希氏菌中(Ausubel等,1987,見上文)。
對所述基因組差異產(chǎn)物進(jìn)行測序。使用ABI DNA合成儀,按照生產(chǎn)廠家的建議(Perkin-Elmer),通過循環(huán)測序法,對單個克隆的插入片段進(jìn)行測序。
從引起胃腸疾病的細(xì)菌分離基因組差異序列集合。通過對由表3列出的細(xì)菌類群中的生物制備的基因組差異樣品進(jìn)行如上文所概述的基因組扣除,從通常引起胃腸疾病的不同病原體類群分離基因組差異序列。每次扣除產(chǎn)生一個菌株類群內(nèi)的病原體所特有的大量基因組差異序列。例如,在致病性大腸埃希氏菌菌株和非致病性大腸埃希氏菌菌株之間的一次扣除產(chǎn)生了幾百種基因組差異序列(Juang,“取樣調(diào)查大腸埃希氏菌K1分離物和K2分離物之間的基因組差異(SamplingGenomic Differences Between Escherichia coli K1 and K2 isolates),”Harvard University,1990)。
使用DNA序列數(shù)據(jù)庫的基因組扣除?;蚪M扣除一般意義指掃描整個基因組尋找基因組差異序列,但也可以通過將已經(jīng)完全測序(或近乎完全測序)的基因組的DNA序列與另一基因組(或另外多個基因組)的全部或部分進(jìn)行比較而完成基因組扣除(見,例如,Alm等,1999,見上文)。
制備對應(yīng)于所述基因組差異序列的探針集合和檢測集合用如上文所述通過基因組扣除鑒定的病原體特異性ID序列集合,確定用于基因組分布分析的ID探針的結(jié)構(gòu)。合成兩個ID寡核苷酸集合。一個組成所述ID探針(或半邊ID探針)的集合與生物樣品雜交。連接與實(shí)驗(yàn)樣品中的病原體基因組退火的半邊ID探針,將其擴(kuò)增并進(jìn)行標(biāo)記。另一個ID寡核苷酸集合構(gòu)成一個檢測集合。所述檢測集合中的ID寡核苷酸對應(yīng)于所述ID探針集合中的序列。也就是說,所述檢測集合與所述ID探針集合相應(yīng)。將所述檢測集合寡核苷酸淀積到固相支持體上,構(gòu)成一個可尋址陣列。通過與所述可尋址寡核苷酸陣列的雜交,鑒定與所述臨床樣品中的病原體基因組雜交的已標(biāo)記、擴(kuò)增的探針。
合成對應(yīng)于所述ID序列的ID探針。從計(jì)劃包括在基因組分布分析測定中的每個ID序列、人mRNA(見下文)和對照序列中選出約30個堿基長的序列,該序列稱為ID探針位點(diǎn)。合成對應(yīng)于每種30個堿基ID探針位點(diǎn)的兩個半邊ID探針(圖3)。所述左半邊ID探針包含所述ID探針位點(diǎn)的左邊15個堿基和一個引物位點(diǎn),即引物位點(diǎn)-L(“左”引物位點(diǎn))。所述右半邊ID探針包含所述ID探針位點(diǎn)的右邊15個堿基和一個引物位點(diǎn),即引物位點(diǎn)-R(“右”引物位點(diǎn))。所述引物位點(diǎn)是對應(yīng)于為PCR擴(kuò)增所需要使用的引物類型的擴(kuò)增位點(diǎn)。
所述引物位點(diǎn)-L(“左”引物位點(diǎn))具有序列5’-GACACTCTC-GAGACATCACCGTCC-3’。所述引物位點(diǎn)-R(“右”引物位點(diǎn))具有序列5’-GTTGGTTTAAGGCGCAAGAATT-3’。因此,對于在上面部分鑒定的每種30個堿基序列,合成兩個半邊ID探針一個半邊探針具有序列5’-GACACTCTCGAGACATCACCGTCC-<ID探針位點(diǎn)1-15>-3’,一個半邊探針具有序列5’-<ID探針位點(diǎn)16-30>-GTTGGTTTAAGGCGCAAGAATT-3’。設(shè)計(jì)所述半邊ID探針,使得當(dāng)它們退火到包含所述30bp ID探針位點(diǎn)的模板時相互鄰接。當(dāng)以這種方式退火時,可以連接所述半邊探針,并因此轉(zhuǎn)化為可以用引物L(fēng)(5’-GACACTCTCGAGACATCACCGTCC-3’和引物R(5’-AATTCTTGCGCCTTAAACCAAC-3’)擴(kuò)增的形式,其中所述引物L(fēng)和引物R分別對應(yīng)于所述左引物位點(diǎn)和所述右引物位點(diǎn)。
構(gòu)建用于基因組分布分析的檢測陣列。為檢測哪些半邊探針與臨床樣品雜交,可以通過雜交查詢一個可尋址的ID序列檢測集合。該集合的元件是對應(yīng)于所述ID探針集合中的ID探針位點(diǎn)的合成ID序列寡核苷酸。也就是說,每種檢測寡核苷酸約30個堿基長,并且與通過連接和擴(kuò)增一對半邊ID探針得到的ID探針位點(diǎn)序列的一條鏈互補(bǔ)。
在本實(shí)施例中,我按照DiRisi等(Science 278680-686,1997)的程序,使用一臺帶有打印頭的陣列形成機(jī)器(arraying machine)將每個寡核苷酸點(diǎn)樣(Shalon等,Genome Res.6639-645,1996),構(gòu)建了一個二維檢測陣列。將每種約30個堿基長的寡核苷酸約2.5ng點(diǎn)樣到已經(jīng)用聚L-絲氨酸包被的40片載玻片的每一片上,其中在相鄰寡核苷酸點(diǎn)之間的距離是500μm(Schena等,1995,見上文)。
構(gòu)建指紋的基因組分布分析數(shù)據(jù)庫基因組分布分析通過將患者樣品的基因組分布分析指紋與包含已知生物的指紋的數(shù)據(jù)庫相比較,鑒定所述樣品中的病原體。(一種指紋對應(yīng)于與特定類型生物雜交的ID探針集合的亞組)。構(gòu)建指紋數(shù)據(jù)庫需要從每個靶類群的一組參考菌株獲取基因組分布分析指紋。
最好根據(jù)靶類群所屬的兩個診斷類別考慮構(gòu)建所述數(shù)據(jù)庫。大多數(shù)鑒定計(jì)劃分為兩類(根據(jù)靶類群)簡單測試在一個類群中的成員資格的鑒定計(jì)劃,以及測試在一個類群中的成員資格并且將一個類群中的成員相互區(qū)分的鑒定計(jì)劃。
將主要由類群特異性序列組成的指紋輸入所述指紋數(shù)據(jù)庫。當(dāng)在一個類群中的成員資格是主要的考慮時,我在選定用于鑒定靶生物的ID序列家族中主要包括類群特異性序列。當(dāng)一個類群的一個成員的存在幾乎總是與疾病相關(guān),并且當(dāng)流行病學(xué)信息不具有很大價值時,測試作為該類群的成員的病原體的存在(不用在該類群的成員之間進(jìn)行區(qū)分)常常是最佳的診斷策略。例如,為鑒定危險并且致病力強(qiáng)的胃腸病原體霍亂弧菌,該病原體引起危及生命的疾病霍亂,可以在所述集合中包括大部分由類群特異性序列組成的一個ID序列家族。注意可以通過基因組扣除分離類群特異性序列,在所述基因組扣除中“+”菌株是病原體,“-”菌株是非病原體。這樣的ID序列既是基因組差異序列,也是類群特異性序列。測試可能的類群特異性序列的特異性使每一序列與來自該類群內(nèi)代表性成員的基因組DNA雜交,并使每一序列與廣譜的其它類群的成員雜交(見,例如,美國專利第5,714,321號)。這樣,假如實(shí)驗(yàn)樣品產(chǎn)生由對應(yīng)于類群特異性ID序列的陽性信號組成的基因組分布分析指紋,則指示出在所述樣品中存在靶類群的成員。將這樣的指紋包括在指紋數(shù)據(jù)庫中。
將主要由基因組差異序列組成的指紋輸入所述指紋數(shù)據(jù)庫。對于某些類型生物而言,診斷目標(biāo)可能是鑒定作為一個類群的成員的一個菌株,同時將該菌株與該類群中的其它菌株區(qū)分開來。例如,在追蹤醫(yī)院獲得性感染的爆發(fā)和食物傳染的病原體的爆發(fā)時,這樣的亞菌株鑒定是重要的。這種類型的高分辨率鑒定需要比僅僅鑒定作為靶類群成員的病原體(如在前面的段落描述)更為詳細(xì)的指紋。通過基因組扣除分離的基因組差異序列是用于獲得高分辨率指紋最有用的ID序列。
為從靶類群構(gòu)建指紋數(shù)據(jù)庫,我從該類群代表性的一組參考菌株獲得指紋。為產(chǎn)生指紋,對包含單個參考菌株的基因組的樣品(常常是單個細(xì)菌菌落)應(yīng)用基因組分布分析測定。掃描所述基因組中該靶類群特征性的一個或多個ID序列家族的成員(通常是對應(yīng)于基因組扣除產(chǎn)物的基因組差異序列)的存在。將所獲得的指紋儲存在所述數(shù)據(jù)庫中。根據(jù)所述指紋,使用標(biāo)準(zhǔn)分析建立所述參考菌株的系統(tǒng)發(fā)生關(guān)系(Hillis等,Molecular Systematics(Sinauer Associates,Sunderland,1996))。
構(gòu)建用于對食物傳染的病原體(如大腸埃希氏菌O157H7)進(jìn)行高分辨率指紋分析的數(shù)據(jù)庫是用于追蹤爆發(fā)的重要工具。例如,我通過獲取大腸埃希氏菌和志賀氏菌屬菌菌株的參考保藏物的基因組分布分析指紋,建立了代表大腸埃希氏菌/志賀氏菌屬類群中生物范圍的指紋數(shù)據(jù)庫。從疾病控制中心和美國典型培養(yǎng)物保藏中心可以獲得大量這樣的菌株。使用所述指紋作為特征組,構(gòu)建該類群的系統(tǒng)發(fā)生(相關(guān)性的進(jìn)化樹)。該方法的一個強(qiáng)有力特征是當(dāng)使用在臨床樣品中發(fā)現(xiàn)的相關(guān)病原體的新指紋更新該類群的指紋數(shù)據(jù)庫時,該數(shù)據(jù)庫逐漸變得更加完全。
制備用于使用基因組分布分析測定進(jìn)行指紋分析的細(xì)菌菌菌株。為獲得指紋,我首先將細(xì)菌菌落固定在尼龍濾膜上,并使用簡單和標(biāo)準(zhǔn)的方法(Grunstein等,1975,見上文),使所述菌落的基因組DNA能夠用于雜交。將所述菌落涂布在尼龍濾膜(1cm2)上,使其干燥,然后用0.5M NaOH,1M Tris,pH 8/3M NaCl,1M Tris,pH8順序處理(每種處理5分鐘)。將固定在所述尼龍濾膜上的樣品在1M NaCl中于65℃振蕩下洗滌3次,每次5分鐘,以除去未固定的化學(xué)制劑和顆粒性物質(zhì)。在堿處理前,用特定的酶或化學(xué)制劑預(yù)處理所述涂布的生物,可以增強(qiáng)某些細(xì)菌(和其它生物)的有效裂解。例如,通過用包含磷脂酶和溶菌酶的溶液處理濾膜,幫助裂解革蘭氏陽性細(xì)菌(Graves,L.等(1993),“通用細(xì)菌DNA分離程序,”載于Diagnostic MolecularMicrobiology,Principles and Applications,D.Persing等編輯(Washington,D.C.ASM Press),第617-621頁)。
選擇與一種細(xì)菌菌株的DNA雜交的基因組差異序列亞組。基因組分布分析測定選擇與結(jié)合于尼龍濾膜的基因組DNA雜交的病原體特異性ID探針亞組。相比之下,可以容易地從濾膜上除去在已固定的細(xì)菌DNA中沒有對應(yīng)物的基因組差異探針。在隨后的連接步驟中,任何通過與濾膜或樣品的非特異性相互作用而保持附著于所述濾膜的殘余半邊ID探針將是不可擴(kuò)增的。
在36℃下(或在比在1M NaCl中所有半邊探針的最低Tm低5℃的溫度下),在0.5ml雜交緩沖液(1M NaCl/50mM EPPS/2mM EDTA,pH8)中,使對應(yīng)于來自特定細(xì)菌類群的病原體特異性基因組差異序列的一組半邊探針(每種半邊探針1nM)與所述濾膜雜交。將所述雜交反應(yīng)物溫育30分鐘,然后通過在2ml洗滌緩沖液(1M NaCl/50mM EPPS/2mMEDTA,pH8)中于36℃(或在比在1M NaCl中所有半邊探針的最低Tm低5℃的溫度下)伴隨振蕩的五個洗滌步驟,每個洗滌步驟30秒鐘,除去未結(jié)合的半邊探針。隨后用1ml連接緩沖液(10mM MgCl2/50mMTris-HCl/10mM二硫蘇糖醇/1mMATP/25μg/μl牛血清白蛋白),在30℃下連續(xù)洗滌所述濾膜3次。在連接步驟前,除去所述濾膜上的多余液體。在各步驟之間不能使所述濾膜干燥。
連接與所述細(xì)菌樣品雜交的成對半邊探針。消除由于非特異性結(jié)合的探針分子引起的背景對于基因組分布分析是至關(guān)重要的,尤其是當(dāng)應(yīng)用于臨床樣品時更是如此,因?yàn)槿缭谙旅娴牟糠炙?,在這樣的樣品中檢測未經(jīng)培養(yǎng)的病原體需要高度的靈敏度?;叵肫鹨筮B接鄰近結(jié)合的半邊探針是有效的方法,保證僅有的可以被擴(kuò)增的探針是那些已經(jīng)與所述樣品中的病原體基因組雜交的探針。
通過加入含1,600粘性末端單位(等于25 Weiss單位)的T4 DNA連接酶(New England Biolabs)的200μl連接酶緩沖液(10mM MgCl2/50mM Tris-HCl/10mM二硫蘇糖醇/1mM ATP/25μg/μl牛血清白蛋白),連接與所述固定樣品雜交的半邊探針。使所述連接反應(yīng)在30℃進(jìn)行1小時。
擴(kuò)增與所述細(xì)菌樣品雜交的基因組差異序列。通過加熱,從所述濾膜釋放與所述細(xì)菌樣品中的基因組雜交的成對已連接的半邊探針。然后使用聚合酶鏈?zhǔn)椒磻?yīng)和對應(yīng)于在所述已連接探針分子末端的引物結(jié)合位點(diǎn)的引物,擴(kuò)增所述已連接的半邊探針。
在連接所述半邊探針后,用2ml 10mM EPPS/1mM EDTA,pH8.0洗滌濾膜,從所述濾膜上除去液體,然后在所述濾膜加上500μl 10mMEPPS/1mM EDTA,pH8.0,隨后在100℃溫育5分鐘。在將溶液與濾膜分離開后,加入50μl 3M醋酸鈉和20μg酵母tRNA。通過乙醇沉淀純化核酸將1ml乙醇與所述樣品混合,然后將所述樣品在12,000g離心5分鐘。用100%乙醇洗滌所述核酸沉淀,干燥,并重懸浮于10μl 10mM EPPS/1mM EDTA,pH8.0中。
使用10X PCR緩沖液(Boehringer Mannheim)、200μM每種dNTP(dATP、TTP、dCTP和dGTP)、1μM生物素化寡核苷酸引物L(fēng)(5’-(生物素-dX)GACACTCTCGAGACATCACCGTCC-3’)(Midland CertifiedReagent)、1μM生物素化寡核苷酸引物R(5’-(生物素-dX)AATTCTTGCGCCTTAAACCAAC-3’)和0.1單位/μl Taq聚合酶(Promega),將一半(5μl)包含所洗脫探針的樣品溶于總反應(yīng)體積為50μl的1X PCR緩沖液中。使用如下PCR模式擴(kuò)增所述所洗脫的探針30個循環(huán)(94℃30秒鐘,55℃30秒鐘,72℃1分鐘),然后是72℃10分鐘。
一個菌株的基因組分布分析指紋通過與一個陣列的雜交,鑒定擴(kuò)增的細(xì)菌DNA所選定的探針分子。鑒定通過與所述菌株的固定化DNA雜交而選定的ID探針,建立菌株的指紋。在本實(shí)施例中,我通過使擴(kuò)增的選定ID探針與檢測陣列雜交,鑒定了由細(xì)菌基因組DNA選定的ID探針。該陣列是一個二維的可尋址序列陣列,與用于與所述生物樣品雜交的ID探針集合相應(yīng)。這樣,該集合中的每種ID探針都可以與在該檢測陣列確定位點(diǎn)的DNA序列雜交。通過與所述陣列的雜交,鑒定通過與所述細(xì)菌樣品的結(jié)合而選定的探針。只有選定探針通過與所述陣列上的對應(yīng)點(diǎn)結(jié)合,產(chǎn)生信號(圖5)。
通過在100℃加熱1分鐘,我使得代表與所述細(xì)菌樣品雜交的序列的擴(kuò)增探針變性。將所述已變性的探針加入25ml 2X雜交緩沖液(2M NaCl/100mM EPPS,pH8/10mM EDTA/0.2%十二烷基硫酸鈉)中。將所述探針/雜交混合物置于所述陣列上,用玻璃蓋玻片覆蓋,并在50℃溫育20分鐘(如Schena等,1995(見上文)所述)。通過在2ml洗滌緩沖液(0.4M NaCl/50mM EPPS/2mM EDTA,pH8)中于50℃伴隨振蕩的五個各30秒鐘的洗滌步驟,除去未結(jié)合的探針。
并如已公開的報道所述(DiRisi等,1997,見上文;Schena等,1995,見上文),用激光熒光掃描儀掃描微陣列,并處理和記錄信號。將每個菌株的指紋記錄為1和0的二進(jìn)制字符串,每個數(shù)字代表在微陣列上的一種基因組差異序列。假如在該微陣列的一個位點(diǎn)獲得信號,一個“1”就出現(xiàn)在代表該基因組分布分析指紋的字符串中的對應(yīng)數(shù)字。
使用基因組分布分析指紋和系統(tǒng)發(fā)生分析對類群中的菌株分型。可以使用針對類群中代表性菌株的指紋數(shù)據(jù)庫鑒定未知菌株。如上文所述編制指紋數(shù)據(jù)庫,并如Hillis等(見上文)所述,使用標(biāo)準(zhǔn)方法進(jìn)行所述指紋的系統(tǒng)發(fā)生分析。通過將未知指紋與以系統(tǒng)發(fā)生排序的指紋數(shù)據(jù)庫相比較(使用Hillis等(見上文)所述的方法),確定未知病原體如在患者樣品中未知病原體的身份。
從引起胃腸疾病的寄生蟲分離ID序列引起胃腸疾病的寄生蟲。根據(jù)地理位置、氣候、社會經(jīng)濟(jì)因素和免疫活性,在患者體內(nèi)發(fā)現(xiàn)的腸寄生蟲范圍有所不同。表3列出了北美洲通常在患有胃腸疾病的患者體內(nèi)發(fā)現(xiàn)的原生動物和蠕蟲類群。目前準(zhǔn)確診斷腸寄生蟲的方法按最好來說也是困難的?;蚪M分布分析極大改善了胃腸寄生蟲的檢測。
從引起胃腸疾病的寄生蟲分離ID序列。為分離表3中每一種寄生蟲所獨(dú)有的ID序列組,我使用了在上文概述的針對細(xì)菌病原體的相同策略和方法,只有下面一些小的改動。因?yàn)榧纳x一般與在消化道中通常發(fā)現(xiàn)的生物不相關(guān),所以從來自目的分類單位內(nèi)隔開最遠(yuǎn)的兩個菌株的基因組DNA構(gòu)建基因組差異樣品常常就足夠了。進(jìn)行交互雜交,即每一個菌株在一個扣除中作為“+”菌株,但在另一個扣除中作為“-”菌株。與細(xì)菌扣除的溫育時間相比,增加扣除雜交反應(yīng)的溫育時間對于補(bǔ)償真核生物基因組復(fù)雜性的增加是必要的。我使用的復(fù)性時間是一半單拷貝序列重退火所需時間的四十到五十倍(Straus,1995,見上文)。
構(gòu)建寄生蟲指紋的數(shù)據(jù)庫。如上文關(guān)于細(xì)菌病原體的指紋分析所述,使用寄生蟲ID序列構(gòu)建用于鑒定表3所列出的生物的ID探針家族。也如針對細(xì)菌病原體所述,進(jìn)行對參考菌株的指紋分析和構(gòu)建指紋數(shù)據(jù)庫。
鑒定引起胃腸疾病的病毒的類群特異性序列引起胃腸疾病的病毒。據(jù)認(rèn)為病毒性腸胃炎是美國第二最常見的疾病病因。兒童和免疫妥協(xié)患者尤其易感。診斷病毒引起的胃腸疾病是有問題的,因?yàn)榇蠖鄶?shù)常見因子不能培養(yǎng)并且很少特征鑒定。已經(jīng)發(fā)展出的測試一般非常昂貴。由于可用測試的費(fèi)用、嚴(yán)重并發(fā)癥的不常見性、普通支持性治療、以及缺乏抗病毒治療,一般不進(jìn)行診斷測試。然而,對病毒全面并且不昂貴的測試對流行病學(xué)、對排除其它病因、對排除抗生素的使用以及對指示恰當(dāng)?shù)亟o予新型抗病毒治療是有用的。表3列出了通常引起胃腸疾病的病毒病原體。
鑒定來自引起胃腸疾病的病毒的類群特異性序列。對于引起胃腸疾病的病毒,從已公開的DNA序列數(shù)據(jù)推導(dǎo)出類群特異性序列。在一些情況下,病毒類群特異性序列已經(jīng)在文獻(xiàn)中描述。在其它情況下,在將公共數(shù)據(jù)庫中的病毒基因組序列與所述數(shù)據(jù)庫中其它病毒的序列比較后,從所述病毒基因組序列選出序列。使用標(biāo)準(zhǔn)方法進(jìn)行序列比較(Ausubel等,1987,見上文)。選擇至少30bp長的病毒類群特異性序列作為測試探針的靶。
構(gòu)建病毒指紋的數(shù)據(jù)庫。如上文針對細(xì)菌病原體的指紋分析所述,使用寄生蟲ID序列構(gòu)建用于鑒定表3中的病毒的ID探針家族。除樣品制備外,對參考病毒株的指紋分析和構(gòu)建病毒指紋數(shù)據(jù)庫也如上文針對細(xì)菌病原體所述進(jìn)行。對于包含RNA基因組的病毒,樣品制備必須保證RNA的完整性。我通過高壓滅菌處理濾膜(Allday等,Nucleic Acids Res.1510592,1987)或?qū)V膜放在微波爐中烘烤(Buluwela等,Nucleic Acids Res.17452,1989),使核酸變性,將其固定到濾膜上,并使其可以接觸探針。
用于診斷胃腸疾病的人類序列基因組分布分析測定的一個好處是可以在篩選病原體的同一測試中測定在診斷上有用的人類細(xì)胞類型。例如,在胃腸疾病中,重要的是知道白細(xì)胞和紅細(xì)胞是否在臨床樣品中過高。為測試特定細(xì)胞類型,獲得細(xì)胞類型特異性mRNA的序列(通常得自已公開的報告或遺傳數(shù)據(jù)庫)。表4指出了已知的在某些細(xì)胞類型中表達(dá)并且在診斷胃腸疾病中重要的序列的細(xì)胞類型特異性mRNA。
合成與ID探針類似的探針(即作為帶有擴(kuò)增位點(diǎn)的二元半邊探針),并將所述探針包括在用于接觸所制備的生物樣品的雜交混合物中。對應(yīng)的檢測序列包括在檢測陣列中。
表4.用于對診斷胃腸疾病重要的人類細(xì)胞的探針
可用于評估基因組分布分析測定的內(nèi)部對照序列內(nèi)部對照。在基因組分布分析測定中包括內(nèi)部對照改善了測試結(jié)果的置信度并允許進(jìn)行有效的故障檢查。對照探針、寡核苷酸和檢測序列包含非生物學(xué)序列。
假如技術(shù)起作用的話,陽性對照序列在每個實(shí)驗(yàn)中都給出陽性信號。假如,例如,其中一種試劑不正常作用,將缺乏來自陽性對照的預(yù)期信號。缺乏來自所述陽性對照的信號保證避免了由于技術(shù)失敗引起的假陰性。
包括陰性對照,以監(jiān)測所述探針中不在所述臨床樣品中的序列是否在所述診斷檢測測定中導(dǎo)致信號。設(shè)計(jì)所述基因組分布分析測定,以便只有當(dāng)所述ID探針集合中的ID探針對應(yīng)于所述臨床樣品中的ID序列時,才能在所述檢測陣列上獲得信號。陰性對照的使用與陽性對照相似,只是沒有將對應(yīng)序列與所述臨床樣品一起點(diǎn)樣(即它與所述ID探針集合一起包括在所述雜交混合物中,并且是所述檢測陣列的元件)。這樣,陰性對照序列應(yīng)該不能被所述固定的樣品選擇,并且不能被連接和擴(kuò)增。來自檢測陣列中陰性對照序列的陽性信號,指示選擇ID探針與靶序列的雜交的步驟并未適當(dāng)?shù)剡\(yùn)作。
我在所述測定中包括了另一種對照探針,所述探針允許監(jiān)測連接酶反應(yīng)。該探針不作為半邊探針合成,而是作為以左連接物和右連接物標(biāo)記的連續(xù)序列合成。另外,將該序列與陽性對照探針一樣使用(即將其與所述臨床樣品平行點(diǎn)樣,其包括于所述探針中,并且是所述檢測陣列的元件)。假如所述檢測陣列的陽性對照元件是陰性的,但該檢測陣列的連接酶對照元件是陽性的,那么所述測定中的連接酶步驟是值得懷疑的。
表5.用于基因組分布分析測定的內(nèi)部對照。
鑒定在臨床樣品中存在的病原體制備臨床樣品。為使基因組分布分析在臨床設(shè)置中最有效,優(yōu)選一種用于制備臨床樣品以與半邊探針雜交的簡單方法。為了實(shí)驗(yàn)室工作人員的安全,患者樣品的制備最好也應(yīng)當(dāng)快速中和所述樣品中存在的病原體,并且樣品的制備應(yīng)當(dāng)有效除去隨后酶促反應(yīng)如探針擴(kuò)增的抑制劑。
我使用一種普遍用于制備用于雜交的在生化上復(fù)雜的生物樣品的簡單、通用但有有效的方法(Grunstein等,1975,見上文),固定所述臨床樣品、將核酸分子變性并中和任何病原體。在尼龍濾膜(1cm2)上涂抹胃腸樣品(0.5ml液體糞便樣品、成形的大便樣品、或直腸藥簽樣品),使其干燥,并如上文關(guān)于制備病毒樣品所述進(jìn)行處理。將所述固定在尼龍濾膜上的樣品在65℃下振蕩洗滌幾次,以除去未固定的化學(xué)制劑和顆粒性物質(zhì)。
通過雜交掃描臨床樣品中基因組差異序列的存在。通過使所述ID探針集合、人類診斷序列和對照序列與胃腸樣品雜交,我掃描了所述樣品中廣泛的相關(guān)病原體組。該方法與用于對參考菌株進(jìn)行指紋分析以建立細(xì)菌指紋數(shù)據(jù)庫的方法基本相同(見上文),不同之處在于所述ID探針集合的廣泛組成以及使用臨床樣品(如前面的段落所述制備)作為生物樣品。
獲得臨床樣品的基因組分布分析指紋。根據(jù)如上文針對細(xì)菌所詳細(xì)描述的相同方法(見“構(gòu)建指紋的基因組分布分析數(shù)據(jù)庫”),進(jìn)行連接、擴(kuò)增和指紋顯示(陣列檢測),與該方法的不同之處在于所述陣列包含代表表3指出的所有病原體的檢測集合。所述檢測陣列中的檢測序列對應(yīng)于與所述臨床樣品雜交的所述ID探針集合、人類診斷序列和對照序列。
定量分析所述臨床樣品中的病原體滴度是多少?基因組分布分析測定的一個強(qiáng)有力特征是能夠定量生物樣品中的病原體。一旦已經(jīng)通過指紋鑒定了靶生物,就可以通過與根據(jù)標(biāo)準(zhǔn)方法(如Huang等,Modern Pathology 11971-977,1998)制備的一部分原始生物樣品進(jìn)行原位雜交,定量它們的存在。我使用一種足以檢測單個生物中的核酸序列的單個分子的靈敏但簡單的方法(Huang等,見上文,1998)。該方法與用于與所述檢測陣列雜交的標(biāo)記探針一起使用?;蛘?,可以使用任何所述生物特征性的、可以通過與所述陣列的雜交而檢測的類群特異性探針進(jìn)行原位雜交。實(shí)施例2.檢測呼吸系統(tǒng)樣品中病原體的存在肺炎。肺炎是美國由于傳染病死亡的最常見的死因。該疾病的病因?qū)W依賴于年齡和免疫狀況。病毒引起大部分的兒童肺炎,而細(xì)菌病原體是引起成人肺炎的最常見病原體。在免疫妥協(xié)寄主中引起肺炎的病原體譜變化很大,并且對于癌癥影響免疫系統(tǒng)或保護(hù)性表面(粘膜表面或皮膚)的患者、移植物受體和HIV感染患者有所不同。
為成功治療肺炎,最基本的是快速鑒定病原體。但是,所有確定肺炎病因的診斷努力幾乎有一半不能鑒定病因因子。(這還不包括沒有嘗試鑒定病原體的大部分病例。)引起下呼吸道感染的許多細(xì)菌病原體和所有病毒病原體不能通過常規(guī)微生物培養(yǎng)方法鑒定。例如,鑒定引起肺結(jié)核、百日咳、軍團(tuán)病和支原體引起的肺炎的病原體需要特殊方法?;加邢潞粑栏腥镜幕颊呤褂昧嗣绹幏介_出的75%的抗生素。由于目前的診斷不能鑒定大多數(shù)下呼吸道感染中的病原體,故每年約10億美元浪費(fèi)在無用的抗生素上。因此,對于測試廣泛的下呼吸道病原體組的單次診斷測定有極大的需求。
目的和好處。在本實(shí)施例中,我使用一次基因組分布分析測定,檢測來自表現(xiàn)出下呼吸道疾病癥狀的患者的樣品中呼吸系統(tǒng)病原體的存在。通過同時并快速地(如在幾小時內(nèi))測試常見的細(xì)菌病原體、病毒病原體和原生動物病原體,本方法提供了比目前實(shí)踐顯著的改進(jìn)。所述測試幫助確定合適和及時的治療。此外,由于基因組分布分析測定能產(chǎn)生高分辨率指紋,因此它是用于流行病學(xué)分析的有力工具。
本實(shí)施例概述。在細(xì)菌病原體和寄生蟲的情況下,我使用基因組扣除從各種下呼吸道病原體分離ID序列,或者在病毒的情況下,我使用計(jì)算機(jī)分析分離ID序列。在給定菌株的DNA中存在的基因組差異序列亞組構(gòu)成了其基因組分布分析指紋。通過確定在每個呼吸系統(tǒng)病原體類群的代表株中存在的ID序列亞組,構(gòu)建指紋數(shù)據(jù)庫。通過將臨床樣品的基因組分布分析指紋與指紋數(shù)據(jù)庫相比較,確定所述臨床樣品中的病原體身份。
在本實(shí)施例中使用的方法概述。在本實(shí)施例中,我使用抑制扣除雜交來分離病原體特異性基因組差異序列,而不使用在實(shí)施例1中使用的基因組扣除。如前面實(shí)施例所述,通過使用特定樣品的基因組DNA通過雜交來選擇一組ID探針,鑒定所述樣品中ID序列的身份。隨后使用高分支滾環(huán)擴(kuò)增方法(hRCA)(Lizardi等,Nat.Genet.19225-232,1998),擴(kuò)增所選定的ID探針。通過使用與實(shí)施例1中所述不同的檢測陣列技術(shù),我確定了由所述樣品選定的ID探針的身份。
從引起下呼吸系統(tǒng)疾病的病原體分離ID序列。表6列出了一些引起下呼吸道感染的常見病原體。使用得自Clontech的抑制扣除雜交試劑盒(Diatchenko等,Proc.Natl.Acad.Sci.USA 936025-6030,1996),根據(jù)廠家推薦的方法,從非病毒(即細(xì)菌和真菌)病原體分離ID序列。如實(shí)施例1中一樣,選擇用于從不同類群分離ID序列的扣除計(jì)劃(如,選擇使用匯集的基因組差異樣品或者單菌株基因組差異樣品)。如實(shí)施例1中所述,表6中列出的特定類群的“+”基因組差異樣品由來自該類群的一種或多種代表性病原體的DNA組成,而“-”菌株由來自一種或多種密切相關(guān)的非致病性生物的DNA組成。(對于所有已知代表都是病原體的類群,所述“+”和“-”樣品包括來自致病菌株亞類群的匯集的DNA。)對通過基因組扣除分離的基因組差異序列進(jìn)行測序,以準(zhǔn)備用于合成滾環(huán)擴(kuò)增探針和引物(見下文)。
對于引起下呼吸道疾病的病毒,從已公開的DNA序列數(shù)據(jù)推導(dǎo)出類群特異性序列。合成對應(yīng)于在一個病毒類群內(nèi)保守、但未在其它病毒類群中發(fā)現(xiàn)的序列的ID探針。我通過將可能的類群特異性序列與病毒序列數(shù)據(jù)庫(如Genbank)相比較,選出符合所述比較標(biāo)準(zhǔn)的序列。
表6.引起下呼吸道疾病的病原體。
可用于判斷呼吸系統(tǒng)樣品質(zhì)量的組織特異性序列。眾所周知呼吸系統(tǒng)樣品的質(zhì)量不均一。方便并且非侵襲性收集的痰樣品常常由于受到上呼吸道生物的污染而被丟棄。已經(jīng)根據(jù)顯微鏡觀察到的扁平上皮細(xì)胞與多形核白細(xì)胞的比例,發(fā)展出判斷樣本質(zhì)量的系統(tǒng)。在我的呼吸系統(tǒng)測定中,我包括了一種基于內(nèi)部雜交的測試,以根據(jù)這兩種細(xì)胞類型的相對豐度判斷下呼吸道樣品的質(zhì)量。通過測試來自多形核白細(xì)胞的細(xì)胞類型特異性轉(zhuǎn)錄物(編碼蛋白LCA和CD45)和來自扁平上皮細(xì)胞的細(xì)胞類型特異性轉(zhuǎn)錄物(編碼蛋白spr 1)的轉(zhuǎn)錄物相對水平,完成這一工作。
使用用于構(gòu)建對應(yīng)于ID序列的ID探針的同樣方法,合成具有對應(yīng)于所述組織特異性序列的探針位點(diǎn)的組織特異性序列探針,不同之處在于從GenBank數(shù)據(jù)庫獲得所述序列。這些探針與所述ID探針集合一起包括在所述雜交混合物中,并且這些探針包括在所述檢測陣列上。
還包括用于定量所述組織特異性mRNA的代表的對照序列。所述對照序列是以不同量加入所述生物樣品中的一系列獨(dú)特非生物的RNA序列。在所述雜交混合物和檢測陣列中包括對應(yīng)的探針和檢測序列。通過在具有已知數(shù)量的扁平上皮細(xì)胞和多形核白細(xì)胞的樣品上進(jìn)行所述測定,完成這些定量對照的校準(zhǔn)。
用于滾環(huán)擴(kuò)增的ID探針和引物。對于所述呼吸系統(tǒng)基因組分布分析測定中的每一ID序列,合成一對ID探針(圖8A)和一對引物(圖8B)。ID探針和引物基于Lizardi等(1998,見上文)的缺口寡核苷酸方法的那些探針和引物。然而,所述缺口ID探針(約15個堿基)和所述帶有缺口的環(huán)狀I(lǐng)D探針(約15個堿基)對應(yīng)于一個ID序列。同時,在本實(shí)施例中,我使用5’生物素化引物以用于滾環(huán)擴(kuò)增(圖8C)。相似地,合成對應(yīng)于實(shí)施例1中所述的實(shí)驗(yàn)對照序列的ID探針和對應(yīng)于組織特異性RNA的ID探針。
構(gòu)建用于基因組分布分析測定的兩維檢測陣列。為確定哪些ID探針與樣品雜交,我使擴(kuò)增的選定ID探針與一個檢測陣列(包含一個檢測序列的集合的可尋址陣列)雜交。該陣列的元件包括對應(yīng)于滾環(huán)擴(kuò)增探針對的缺口探針部分的寡核苷酸和對應(yīng)于實(shí)驗(yàn)對照序列的寡核苷酸。在本實(shí)施例中,我使用光刻法,如以前所述構(gòu)建微陣列(Chee等,Science 274610-614,1996;Lockhart等,Nat.Biotech.141675-1680,1996)。
對呼吸系統(tǒng)病原體進(jìn)行指紋分析為鑒定引起下呼吸道感染的病原體,我將臨床樣品的基因組分布分析指紋與來自以前特征鑒定的生物的指紋數(shù)據(jù)庫相比較。如在涉及胃腸基因組分布分析測定的實(shí)施例1中一樣,我首先從來自每個病原體類群的參考菌株的基因組分布分析指紋組裝了指紋數(shù)據(jù)庫。然后將臨床樣品的指紋與該數(shù)據(jù)庫相比較,確定所述樣品中病原體的身份。
獲得參考菌株的指紋并組裝數(shù)據(jù)庫。樣品制備、與所述ID序列集合的雜交以及洗滌步驟與實(shí)施例1中描述的那些步驟相同,不同之處在于所述ID探針集合的組成和結(jié)構(gòu)。當(dāng)與已固定的樣品中的DNA退火的成對帶缺口環(huán)狀I(lǐng)D探針和缺口ID探針相互連接時,就產(chǎn)生了用于高分支滾環(huán)擴(kuò)增(HRCA)的模板。如圖8圖解并如以前所述(Lizardi等,1998,見上文),進(jìn)行連接和HRCA。如以前所述(Lockhart等,1996,見上文)完成與微陣列的雜交、用鏈霉抗生物素-藻紅蛋白染色、以及掃描。從所述微陣列數(shù)據(jù)獲得指紋,并使用實(shí)施例1中所述的方法,組裝和分析由每一呼吸系統(tǒng)病原體類群獲得的指紋數(shù)據(jù)庫。
鑒定在臨床樣品中存在的病原體。使用實(shí)施例1中所述的方法,將各種類型和質(zhì)量的呼吸系統(tǒng)樣品(如痰樣品、支氣管肺泡灌洗樣品和支氣管刷緣樣品)加樣并固定到尼龍濾膜上。如實(shí)施例1一樣,對臨床樣品以及參考菌株進(jìn)行指紋分析,不同之處在于所述雜交反應(yīng)中包括來自表6中所有呼吸系統(tǒng)病原體類群的ID探針。通過將獲得的指紋與參考菌株的指紋數(shù)據(jù)庫中的指紋相比較,鑒定在臨床樣品中存在的病原體。實(shí)施例3-測試血液樣品中的病原體血流感染。心血管系統(tǒng)的致病性侵襲是最嚴(yán)重的傳染病之一。在美國每年發(fā)生的約200,000例血流感染中,20%到50%是致命的。尤其危險的是免疫妥協(xié)患者、太幼小的兒童和太老的老人、患有皮膚或軟組織感染和帶有傷口的患者、以及侵入性醫(yī)療程序的接受者。所有主要病原體類型都可以感染血流,其中包括細(xì)菌、病毒、真菌和寄生蟲??焖勹b定血流感染中的病原體對于制定合適的(可能是救命的)治療是至關(guān)重要的。
目前的方法一般是病原體特異性的。因此,確定感染來源可能需要許多測試和大量費(fèi)用。存在對于快速確定廣泛范圍常見血流病原體的身份的單次測試的需求。
目標(biāo)和好處。在本實(shí)施例中,我使用單次基因組分布分析測定來測試在臨床樣品中廣泛范圍的血流病原體的存在。通過同時并且快速地(如在幾小時內(nèi))測試常見細(xì)菌病原體、病毒病原體和原生動物病原體,本方法提供了比目前實(shí)踐顯著的改進(jìn)。該測試的快速性使得其對于快速診斷血流病原體以及制定合適和及時治療的關(guān)鍵任務(wù)特別有用。此外,由于基因組分布分析測定能夠產(chǎn)生高分辨率指紋,因此它是進(jìn)行流行病學(xué)分析的強(qiáng)有力工具。
本實(shí)施例概述。我使用基因組扣除(細(xì)菌病原體和寄生蟲)或計(jì)算機(jī)分析(病毒)從各種血流病原體分離ID序列。在給定株的DNA中存在的ID序列亞組構(gòu)成該株的基因組分布分析指紋。通過確定在每個血流病原體類群的代表株中存在的ID序列亞組,構(gòu)建指紋數(shù)據(jù)庫。通過將臨床血流樣品的基因組分布分析指紋與指紋數(shù)據(jù)庫相比較,確定該臨床樣品中病原體的身份。
在本實(shí)施例中使用的方法的概述。在本實(shí)施例中,我使用Tinsley等(Proc.Natl.Acad.Sci.USA 9311109-11114,1996)的改良的表現(xiàn)度差異分析(representational difference analysis)基因組扣除方法,分離病原體特異性ID序列,而不是在以前實(shí)施例中使用的方法。如前面實(shí)施例所述,通過使用特定樣品中的基因組DNA通過雜交選擇一組ID探針,確定在所述樣品中的ID序列的身份。然而,在本實(shí)施例中,通過液相雜交-捕獲方法,分離所選定的探針。同時,在本實(shí)施例中,我使用質(zhì)譜法鑒定所選定的擴(kuò)增ID探針,而不是使用前面實(shí)施例中所述的微陣列方法。
從引起血流感染的病原體分離ID序列。表7列出了一些引起血流感染的常見病原體。使用Tinsley等(1996,見上文)所改良的表現(xiàn)度差異分離方法,從所述非病毒(即細(xì)菌、真菌和寄生蟲)病原體分離ID序列。如在實(shí)施例1中所述,針對表7中列出的特定類群的“+”基因組差異樣品由來自該類群的代表性病原體的DNA組成,而“-”基因組差異樣品由來自密切相關(guān)的非致病性生物的DNA組成。(對于其中所有已知代表都是病原體的類群,所述“+”和“-”樣品包括由致病菌株亞類群匯集的DNA。)對于引起血流感染的病毒,如在前面的實(shí)施例所述,從已公開的DNA序列數(shù)據(jù)推導(dǎo)出ID序列。
表7.引起血流感染的病原體。
用于捕獲ID序列的ID探針、擴(kuò)增和質(zhì)譜檢測。對于所述血流基因組分布分析測定中的每個ID序列,合成一對DNA捕獲ID探針、兩種擴(kuò)增ID探針、一種缺口ID探針和一種質(zhì)譜檢測寡核苷酸(圖9A-9C)。每種捕獲ID探針具有兩個部分一個生物素化臂(約10個堿基長)和對應(yīng)于一種ID序列的一部分的一個臂(約15堿基長)。所述左擴(kuò)增探針和右擴(kuò)增探針也具有兩個部分一個部分包含對應(yīng)于擴(kuò)增探針的序列(約20堿基長),一個部分與一種ID序列互補(bǔ)(約15個堿基長)。合成在5’末端生物素化的引物,以便可以擴(kuò)增已連接的三聯(lián)探針(圖9B)并進(jìn)行親和純化。所述缺口ID探針(約20個堿基長)與一種ID序列互補(bǔ),并且當(dāng)所述缺口ID探針退火至對應(yīng)的ID探針時,它與所述左擴(kuò)增ID探針和所述右擴(kuò)增ID探針相鄰。與實(shí)施例1中描述的那些方法相似地合成陽性對照探針和陰性對照探針并使用它們,不同之處在于本實(shí)施例中的樣品溶液包括實(shí)施例1中與所述濾膜結(jié)合的陽性對照探針。
為確定哪些ID探針與樣品雜交,我使擴(kuò)增的選定ID探針與對應(yīng)于需要測定的ID探針集合的質(zhì)譜檢測寡核苷酸雜交。每種質(zhì)譜檢測寡核苷酸約8-15個核苷酸長(質(zhì)譜獲得小寡核苷酸的非常高分辨率的區(qū)別),并且每種質(zhì)譜檢測寡核苷酸與一種探針的缺口探針部分互補(bǔ)(圖9C)。在該集合中的各種質(zhì)譜檢測寡核苷酸應(yīng)當(dāng)都具有獨(dú)特的分子量,以便可以通過質(zhì)譜鑒定它們的身份。為增強(qiáng)具有相似分子量的寡核苷酸間的分子量區(qū)別,在某些情況下,包括化學(xué)修飾的寡核苷酸是有用的。具有各種各樣的化學(xué)修飾以及具有最少改變的復(fù)性特征的寡核苷酸是商業(yè)化可得的。
對血流病原體進(jìn)行指紋分析如前面實(shí)施例所述,為鑒定引起血流感染的病原體,我將臨床樣品的基因組分布分析指紋與來自以前特征鑒定的生物的指紋數(shù)據(jù)庫相比較。如以前所述,我首先從來自表7列出的每個血流病原體類群的參考菌株的基因組分布分析指紋組裝指紋數(shù)據(jù)庫。然后將臨床血液樣品的指紋與該數(shù)據(jù)庫相比較,確定在所述樣品中任何病原體的身份。
捕獲和擴(kuò)增與參考菌株的DNA雜交的ID探針。在本實(shí)施例中,我使用液相雜交-捕獲方法(Hsuih等,J.Clin.Microbiol.34501-507,1996)來親和純化在一個參考菌株的核酸分子中存在的病原體特異性ID序列。通過在5M硫氰酸胍中溫育(在90℃5分鐘,然后在65℃10分鐘)并短時間渦旋混合,裂解生物并使該生物的核酸分子可以用于雜交。根據(jù)要檢測的生物,可以如下修改所述程序,例如,包括在更高溫度的熱處理、酶處理(如用溶菌酶、幾丁質(zhì)酶或磷脂酶)、用去垢劑(如CTAB或SDS)處理或有機(jī)提取(如用苯酚或氯仿)。然后我根據(jù)Hsuih等(1996,見上文)的方法,進(jìn)行用探針(捕獲探針、擴(kuò)增探針和缺口探針)的雜交、親和純化、連接和擴(kuò)增所述三聯(lián)連接的擴(kuò)增/缺口探針(圖9B)(Hsuih等,1996,見上文)。
純化對應(yīng)于擴(kuò)增的ID探針的質(zhì)譜檢測寡核苷酸。擴(kuò)增的探針對應(yīng)于所述參考菌株中病原體特異性的ID序列。對于這些序列的基于質(zhì)譜的鑒定,我使用生物素化的擴(kuò)增產(chǎn)物來親和純化對應(yīng)的質(zhì)譜檢測寡核苷酸(圖9C)。使擴(kuò)增反應(yīng)物(50μl)溶于10mM EDTA,并與在10mMEPPS,pH8.0/1mM EDTA中包含10ng每種質(zhì)譜檢測寡核苷酸的10μl溶液混合,然后在100℃變性2分鐘。在加入15μl 5M NaCl并在30℃溫育15分鐘后,加入30μl鏈霉抗生物素包被的順磁珠(Promega),并如以前所述進(jìn)行親和層析(Hsuih等,1996,見上文)。所述珠用500μl10mM EPPS,pH8.0/1mM EDTA洗3次。通過在100μl 10mM EPPS,pH 8.0/1mM EDTA中加熱所述溶液到50℃(或比在1M NaCl中所述檢測寡核苷酸的最高Tm高10℃),回收親和純化的質(zhì)譜檢測寡核苷酸。從所述磁珠取出包含所述質(zhì)譜檢測寡核苷酸的上清液,而用磁鐵將所述磁珠保留在管中。
構(gòu)建一個病原體類群的指紋數(shù)據(jù)庫使用質(zhì)譜來鑒定所選定的質(zhì)譜檢測寡核苷酸。制各樣品并且使用儀器(PerSeptive Biosystems)和以前描述的方法(Roskey等,Proc.Natl.Acad.Sci.USA 934724-4729,1996),通過基質(zhì)輔助激光解吸電離飛行時間質(zhì)譜(延遲提取)(MALDI-TOF(DE))制備和分析樣品。將親和純化的寡核苷酸的質(zhì)量與以前確定的整個質(zhì)譜檢測寡核苷酸集合的元件的質(zhì)量相比較。這樣,鑒定了選定的質(zhì)譜檢測寡核苷酸,該選定的質(zhì)譜檢測寡核苷酸進(jìn)而又指出在受測試的參考菌株中ID序列的身份。
在所述參考菌株中存在的ID序列亞組構(gòu)成其基因組分布分析指紋。收集在表7列出的每個類群中參考菌株的指紋數(shù)據(jù)庫。
鑒定在血液樣品中存在的病原體。如上文針對參考菌株所述,裂解血液樣品并進(jìn)行指紋分析,不同之處在于所述雜交反應(yīng)中包括來自表7所有血流病原體類群的ID探針。通過將所獲得的指紋與那些參考菌株的指紋數(shù)據(jù)庫中的指紋相比較,鑒定在血液樣品中存在的病原體。實(shí)施例4.使用基因組分布分析測定的法醫(yī)學(xué)鑒定法醫(yī)學(xué)鑒定的概述。鑒定細(xì)胞樣品的來源是現(xiàn)代法醫(yī)分析的一個重要方面。法醫(yī)學(xué)樣品的遺傳鑒定需要擴(kuò)增常常僅以微觀量可得的細(xì)胞材料中的DNA,并將所述DNA與其他個體的DNA相比較。目前遺傳鑒定的方法一般要求分析型凝膠電泳,該步驟極其消耗時間,并且在技術(shù)上對于許多法醫(yī)學(xué)實(shí)驗(yàn)室是不合適的。本實(shí)施例提供了使用基因組分布分析進(jìn)行法醫(yī)學(xué)鑒定的快速、簡單并且健全的方法。
本實(shí)施例概述。我使用富集的基因組差異樣品,分離了可用于鑒定人類法醫(yī)學(xué)樣品的來源的ID序列集合。在本實(shí)施例中,所述富集的基因組樣品是經(jīng)擴(kuò)增的人類基因組亞組,根據(jù)擴(kuò)增過程的本質(zhì),所述人類基因組亞組包含一些可重現(xiàn)地從某些個體的基因組中擴(kuò)增、但不從其他個體的基因組擴(kuò)增的序列。這些差異擴(kuò)增的序列構(gòu)成基因組差異序列它們在一個富集的基因組差異樣品中存在,但不在另一個富集的基因組差異樣品中存在。在來自某一個體的DNA中存在的這樣的序列集合的亞組構(gòu)成一個基因組分布分析指紋。通過將所述樣品指紋與其他個體的樣品指紋相比較,獲得所述樣品來源的身份。
在本實(shí)施例中使用的方法的概述。本實(shí)施例與前面的實(shí)施例在幾個方面有所不同。通過選擇性擴(kuò)增人類基因組DNA,構(gòu)建用于獲得人類ID序列集合的富集的基因組差異樣品。本實(shí)施例使用Alu-PCR選擇性擴(kuò)增人類DNA,但也可以使用其它方法進(jìn)行選擇性擴(kuò)增,如用于擴(kuò)增根據(jù)大小分級分離的DNA的AFLP方法(Lisitsyn等,Mol.Gen.Microbiol.Virus.326-29,1993;Rosenberg等,Proc.Natl.Acad.Sci.USA 916113-6117,1994),或在實(shí)施例5中描述的方法。進(jìn)行多次基因組扣除以產(chǎn)生多個人類ID序列家族。用對應(yīng)于基因組扣除產(chǎn)物的檢測序列構(gòu)建一個檢測陣列。為鑒定人類法醫(yī)學(xué)樣品,使用選擇性擴(kuò)增(在這種情況下是Alu-PCR)來擴(kuò)增樣品DNA。得到的人類基因組DNA在所述樣品中的“代表”由標(biāo)記的擴(kuò)增產(chǎn)物組成。通過與所述檢測陣列雜交,測試所述產(chǎn)物中特征性ID序列的存在。不同人類個體的基因組將產(chǎn)生不同的基因組分布分析指紋。
使用Alu-PCR選擇性擴(kuò)增人類DNA。Alu-PCR方法擴(kuò)增在Alu重復(fù)序列之間的DNA,所述Alu重復(fù)序列頻繁出現(xiàn)于人類基因組中(平均每幾千個堿基一個)。由于Alu重復(fù)序列具有多態(tài)性,一些擴(kuò)增的片段存在于一個人體內(nèi),而不存在于另一個人體內(nèi)(Stoneking等,GenomeRes.71061-1071,1997;Zietkiewicz等,Proc.Natl.Acad.Sci.USA 898448-8451,1992)。
通過標(biāo)準(zhǔn)方法(Ausubel等,1987,見上文)純化用于制備基因組扣除樣品的人類基因組DNA。如以前所詳述(Lincoln等,“法醫(yī)DNA分布分析方法,”載于Methods in Molecular Biology(Humana Press,Totowa,New Jersey)1998),通過應(yīng)用適于該樣品類型的方法,制備法醫(yī)學(xué)樣品以進(jìn)行擴(kuò)增。使用Zietkiewicz等(1992,見上文)的方法,進(jìn)行Alu-PCR反應(yīng),改動之處在于PCR擴(kuò)增用作“+”基因組差異樣品的DNA,并且使用5’-末端生物素化的寡核苷酸引物,對法醫(yī)學(xué)樣品進(jìn)行PCR擴(kuò)增。
分離ID序列并構(gòu)建檢測集合陣列。通過基因組扣除(Straus等,1990,見上文),分離上文所述的通過富集的基因組差異序列定義的一個人類ID序列家族。如上所述,使用來自個體的樣品或通過匯集來自幾個個體的Alu-PCR產(chǎn)物,制備富集的基因組差異樣品(所述樣品可以根據(jù)遺傳和/或地區(qū)標(biāo)準(zhǔn)分組)。對所述基因組差異序列進(jìn)行克隆、測序、并如以前所述擴(kuò)增(Rosenberg等,1994,見上文;Straus等,1990,見上文)。為構(gòu)建所述檢測集合陣列,使用Maier等(J.Biotechnol.35191-203,1994)的基于機(jī)器人的方法,將擴(kuò)增的扣除產(chǎn)品,即基因組差異序列在尼龍膜上排成陣列。
對法醫(yī)學(xué)樣品進(jìn)行指紋分析。通過以前描述的方法(Lincoln,1998,見上文),制備法醫(yī)學(xué)樣品以進(jìn)行指紋分析。通過使法醫(yī)學(xué)樣品的生物素化Alu-PCR擴(kuò)增產(chǎn)物與所述檢測集合陣列雜交,獲得所述法醫(yī)學(xué)樣品中人類DNA的指紋。在通常少于1ml的體積中,在65℃進(jìn)行所述雜交反應(yīng)(1M NaCl/50mM EPPS/2mM EDTA,pH8)30分鐘。通過在65℃的2ml洗滌緩沖液(50mM NaCl/50mM EPPS/2mM EDTA,pH8)中五個30秒鐘洗滌步驟(伴隨振蕩),除去未結(jié)合的擴(kuò)增產(chǎn)物。使用Phototope-Star檢測系統(tǒng)(New England Biolabs),根據(jù)廠家的建議,使所述指紋(雜交模式)顯現(xiàn)。實(shí)施例5.掃描樣品中的多種人類遺傳標(biāo)記現(xiàn)代醫(yī)學(xué)遺傳學(xué)和藥物基因組學(xué)(pharmacogenomics)的一個重要目標(biāo)是快速獲得患者的基因組分布。遺傳標(biāo)記可以作為疾病(如乳腺癌和亨廷頓舞蹈病)的早期警報,或可以指示患者可能對哪種藥療法有利地反應(yīng)。本實(shí)施例展示了在一個快速的基于雜交的測試中,使用基因組分布分析測定來調(diào)查大量人類遺傳標(biāo)記的基因型。
本實(shí)施例概述。在本實(shí)施例中,同時調(diào)查一個人類基因組在多個多態(tài)位點(diǎn)的基因型。如在前三個實(shí)施例中所述,使一個探針(在這種情況下是SNP探針)集合與基因組DNA雜交。如以前所述,所述探針集合的選擇性擴(kuò)增產(chǎn)生了該集合的一個診斷信息亞組。然后通過與檢測陣列的雜交,鑒定所擴(kuò)增亞組的成員。在本實(shí)施例中,與以前的實(shí)施例不同,根據(jù)在樣品基因組中存在的特定SNP等位基因,選擇性連接半邊SNP探針,從而完成選擇性擴(kuò)增。使用SNP探針進(jìn)行基因組分型的方法圖解于圖10。
合成多態(tài)性探針集合和檢測集合。在本實(shí)施例中,使用已知的人類DNA多態(tài)性設(shè)計(jì)多態(tài)性探針。當(dāng)所述多態(tài)性探針退火于包含等位基因的一個版本的基因組DNA時,可以連接所述多態(tài)性探針,但當(dāng)基因組包含所述基因的不同版本時,就不能連接所述多態(tài)性探針。等位基因特異性SNP探針連接的使用圖解于圖10。所靶向的DNA多態(tài)性可以是對應(yīng)于用于對人類基因組進(jìn)行作圖的標(biāo)記的單核苷酸多態(tài)性(SNP)(如,Landegren等,Genome Res.8769-776,1998)或?qū)?yīng)于具有醫(yī)學(xué)重要性的突變的單核苷酸多態(tài)性(如引起遺傳病鐮狀細(xì)胞貧血的單堿基對突變)。在所述測定中也可以包括任何其它類型的核酸序列多態(tài)性(包括插入、缺失和重排)。
一旦選擇了所述DNA多態(tài)性,則可以基本如實(shí)施例1中制造ID探針一樣合成多態(tài)性探針。SNP探針的優(yōu)選設(shè)計(jì)利用T4 DNA連接酶的能力以鑒別在要連接的3’末端的單堿基對錯配。然而,在本實(shí)施例中,設(shè)計(jì)所述半邊多態(tài)性探針,以便成對的探針在所述DNA多態(tài)性位點(diǎn)鄰接。一般合成對應(yīng)于每個靶DNA多態(tài)性的兩種多態(tài)性探針一種探針檢測在所述多態(tài)性位點(diǎn)的一種基因型,而另一種探針檢測另一種可能的基因型。對于出現(xiàn)幾種基因型的基因座,合成另外的多態(tài)性探針。
因此,對于每個要進(jìn)行基因組分型的SNP,SNP探針包含幾種半邊探針。一種半邊探針(圖10中的右半邊探針)是不變的。在所述測定中也包括了左半邊SNP探針的幾種版本。每個版本在所述基因組SNP位點(diǎn)具有對應(yīng)于所述等位基因的不同3’末端核苷酸。只有在所述3’位點(diǎn)與所述基因組等位基因匹配的左半邊探針才被連接并隨后擴(kuò)增。如前面的實(shí)施例,可以通過在擴(kuò)增反應(yīng)中使用生物素化引物而標(biāo)記擴(kuò)增產(chǎn)物。
因?yàn)槊糠N獨(dú)特的左半邊探針都具有一種獨(dú)特的標(biāo)記(見圖10),所以有可能通過使所述標(biāo)記的擴(kuò)增SNP探針與包含標(biāo)記集合的檢測陣列雜交,檢測哪些等位基因已經(jīng)被連接并成功地擴(kuò)增,其中所述標(biāo)記集合對應(yīng)于SNP探針原始集合。也就是說,所述陣列中的每一種標(biāo)記對應(yīng)于所述原始SNP探針集合中其中一種左半邊SNP探針中的標(biāo)記(或其互補(bǔ)物)。
如實(shí)施例1構(gòu)建所述檢測陣列,不同之處在于,在這種情況下,所述陣列的元件是對應(yīng)于所述多態(tài)性探針集合的標(biāo)記序列。
選擇性擴(kuò)增人類DNA多態(tài)性并進(jìn)行指紋分析。如實(shí)施例4制備包含人類DNA的樣品。假如使用純化的DNA,就簡單地將其點(diǎn)樣在0.5M NaOH中的尼龍濾膜上,使其風(fēng)干,并用紫外光使其交聯(lián)到濾膜上(使用來自Stratagene的Stratalinker儀器,按照廠家的說明書)。注意對于法醫(yī)學(xué)樣品,預(yù)擴(kuò)增DNA樣品,即制備基因組代表可能是有用的。例如,可以使用實(shí)施例4中描述的Alu-PCR方法,從單個人類毛囊擴(kuò)增DNA。當(dāng)使用代表作為樣品測試SNP多態(tài)性時,設(shè)計(jì)所述SNP探針,使其對應(yīng)于從所有樣品擴(kuò)增的區(qū)段中的多態(tài)性。(注意這與前面的實(shí)施例不同,在前面的實(shí)施例中在診斷上有用的序列是差異擴(kuò)增的序列,即ID探針)。
如實(shí)施例1所述(關(guān)于該實(shí)施例的ID探針),使所述多態(tài)性探針集合與所述樣品雜交、洗滌、連接、擴(kuò)增、標(biāo)記、與檢測陣列雜交、并使指紋顯現(xiàn)。與所述檢測陣列的雜交模式指出了通過所述多態(tài)性探針集合的調(diào)查,在所述樣品的基因組DNA中在每個多態(tài)性位點(diǎn)呈現(xiàn)的等位基因。實(shí)施例6.掃描腦脊液樣品中的大量病毒本實(shí)施例概述。中樞神經(jīng)系統(tǒng)(CNS)的感染被認(rèn)為是醫(yī)療急癥??焖僭\斷傳染因子對于最佳的治療效果是至關(guān)重要的。診斷病毒感染尤其存在問題,并且常常是昂貴的。本實(shí)施例描述的方法可以用于同時測試腦脊液(CSF)樣品中各種類型病毒的存在。通過用ID探針集合進(jìn)行液相雜交捕獲,然后擴(kuò)增樣品選定的ID探針,選定在CSF樣品中的病毒特異性ID序列。使用所擴(kuò)增的ID探針探測檢測集合陣列,以確定存在哪些病毒(假如存在的話)。本實(shí)施例描述了針對CSF中的病毒的測試,但采用合適的樣品制備,可以對其它類型樣品進(jìn)行類似測試,所述樣品包括血液樣品和固體組織樣品。
組裝病毒特異性ID序列、探針和引物。選擇對于表8列出的病毒表中每個病毒類群特異性的類群特異性序列。在某些情況下,文獻(xiàn)中已經(jīng)描述了病毒特異性ID序列。在其它情況下,在將公共數(shù)據(jù)庫中的病毒基因組序列與該數(shù)據(jù)庫中的其他病毒相比較,選定序列。使用標(biāo)準(zhǔn)方法進(jìn)行序列比較(Ausubel等,1987,見上文)。選擇至少30個堿基長的病毒特異性序列,并如實(shí)施例3(血流病原體測定)所述,如圖9A-9C所示,合成對應(yīng)的ID探針集合和引物集合。然而,我合成了與所述缺口探針互補(bǔ)的更長的(約20個堿基)檢測集合寡核苷酸,而不是圖9C所示的小質(zhì)譜檢測寡核苷酸。如實(shí)施例2所述,通過光刻法構(gòu)建檢測集合陣列。如實(shí)施例3所述合成和使用陽性對照探針和陰性對照探針。
表8.引起CNS感染的病毒
掃描樣品尋找所述病毒組的成員。如實(shí)施例3所述制備CSF樣品、與探針集合雜交、通過磁力分離純化靶序列、連接所選定的探針、以及擴(kuò)增。然后如實(shí)施例4所述,使所述生物素化的擴(kuò)增產(chǎn)物與所述病毒檢測集合陣列雜交并使其顯現(xiàn)。
其它實(shí)施方案包括在下面的權(quán)利要求書中。
權(quán)利要求
1.一種從可能含有靶核酸分子的生物樣品獲取遺傳信息的方法,所述方法包括下列步驟a)提供下列核酸分子(i)在所述樣品中的靶核酸分子,或(ii)與所述樣品中的靶核酸分子雜交的探針,或(iii)(i)或(ii)的擴(kuò)增產(chǎn)物,或(iv)(i)的基因組代表;然后b)通過將(a)的核酸分子與最小基因組起源大于5的檢測集合相接觸或比較,檢測靶核酸分子,其中所述檢測集合包括能夠檢測靶核酸分子的檢測序列。
2.權(quán)利要求1的方法,所述方法還包括步驟(c)鑒定在步驟(b)檢測到的核酸分子。
3.權(quán)利要求1的方法,其中所述檢測集合的最小基因組起源大于11。
4.權(quán)利要求1的方法,其中步驟(a)的核酸分子并不作為根據(jù)大小分級分離的片段固定化到基質(zhì)或固相支持體上。
5.權(quán)利要求1的方法,所述方法還包括下列步驟假如在所述樣品中存在靶核酸分子,就使用少于四對的擴(kuò)增序列來產(chǎn)生擴(kuò)增產(chǎn)物。
6.權(quán)利要求5的方法,其中使用一對擴(kuò)增序列進(jìn)行擴(kuò)增。
7.權(quán)利要求1的方法,其中使用所述方法通過原位雜交來定量所述生物樣品中的靶生物。
8.權(quán)利要求1的方法,其中在步驟(a)之前,使所述樣品的核酸分子與一個ID探針集合同時雜交以產(chǎn)生步驟(a)(ii)的探針。
9.權(quán)利要求1的方法,其中步驟(a)(ii)的探針包括(i)能夠與靶核酸分子雜交的第一個區(qū),和(ii)擴(kuò)增序列。
10.權(quán)利要求1的方法,其中將所述樣品的所述核酸分子固定到固相支持體上。
11.權(quán)利要求1的方法,其中步驟(a)的所述核酸分子處于液相中。
12.權(quán)利要求1的方法,其中步驟(a)的至少一些核酸分子包含一種或多種寡核苷酸標(biāo)記。
13.權(quán)利要求1的方法,其中步驟(a)(ii)的至少一些探針包含(i)當(dāng)與靶核酸分子雜交時可以相互連接的兩種或更多種寡核苷酸,和(ii)擴(kuò)增序列。
14.權(quán)利要求1的方法,其中所述檢測集合的所述檢測序列在固相支持體上作為以兩維的點(diǎn)排列或作為平行帶排列。
15.權(quán)利要求8的方法,其中所述ID探針集合包括探針,所述探針與來自至少十種不同病毒的每一種的至少兩種不同核酸分子雜交,其中所述病毒的每一種都屬于不同的屬。
16.權(quán)利要求1的方法,其中所述生物樣品是胃腸道樣品,并且所述遺傳信息是對所述樣品中來自6種或更多種以下生物的核酸分子的鑒定大腸埃希氏菌(Escherichia coli)、沙門氏菌屬(Salmonella)、志賀氏菌屬(Shigella)、小腸結(jié)腸炎耶爾森氏菌(Yersiniaenterocolitica)、霍亂弧菌(Vibrio cholera)、糞彎曲桿菌(Campylobacterfecalis)、艱難梭菌(Clostridium difficile)、輪狀病毒屬(Rotavirus)、諾沃克病毒(Norwalk virus)、星狀病毒屬(Astrovirus)、腺病毒屬(Adenovirus)、冠狀病毒屬(Coronavirus)、蘭氏賈第鞭毛蟲(Giardialamblia)、溶組織內(nèi)阿米巴(Entamoeba histolytica)、人酵母菌(Blastocystis hominis)、隱孢子蟲屬(Cryptosporidium)、Microsporidium、美洲板口線蟲(Necator americanus)、人蛔蟲(Ascaris lumbricoides)、毛首鞭蟲(Trichuris trichiura)、蟯蟲(Enterobius vermicularis)、糞類圓線蟲(Strongyloides stercoralis)、麝后睪吸蟲(Opsthorchis viverrini)、華支睪吸蟲(Clonorchis sinensis)和短膜殼絳蟲(Hymenoplepis nana)。
17.權(quán)利要求1的方法,其中所述生物樣品是呼吸道樣品,并且所述遺傳信息是對所述樣品中來自6種或更多種以下生物的核酸分子的鑒定白喉棒桿菌(Cornybacterium diphtheriae)、結(jié)核分枝桿菌(Mycobacterium tuberculosis)、肺炎支原體(Mycoplasmapneumoniae)、沙眼衣原體(Chlamydia trachomatis)、肺炎衣原體(Chlamydia pneumoniae)、百日咳博德特氏菌(Bordetella pertussis)、軍團(tuán)菌(Legionella spp.)、諾卡氏菌(Nocardia spp.)、肺炎鏈球菌(Streptococcus pneumoniae)、流感嗜血菌(Haemophilus influenzae)、鸚鵡熱衣原體(Chlamydia psittaci)、銅綠假單胞菌(Pseudomonasaeruginosa)、金黃色葡萄球菌(Staphylococcus aureus)、莢膜組織胞漿菌(Histoplasma capsulatum)、Coccidoides immitis、新型隱球酵母(Cryptococcus neoformans)、皮炎芽生菌(Blastomyces dermatitidis)、卡氏肺囊蟲(Pneumocystis carinii)、呼吸道合胞病毒、腺病毒屬、單純皰疹病毒、流感病毒、副流感病毒和鼻病毒屬(Rhinovirus)。
18.權(quán)利要求1的方法,其中所述生物樣品是血液樣品,并且所述遺傳信息是對所述樣品中來自6種或更多種以下生物的核酸分子的鑒定凝固酶陰性葡萄球菌、金黃色葡萄球菌、Viridansstreptococci、腸球菌(Enterococcus spp.)、β溶血性鏈球菌、肺炎鏈球菌、埃希氏菌(Escherichia spp.)、克雷伯氏菌(Klebsiella spp.)、假單胞菌(Pseudomonas spp.)、腸桿菌(Enterbater spp.)、變形蟲(Proteus spp.)、擬桿菌(Bacteroides spp.)、梭菌(Clostridium spp.)、銅綠假單胞菌、棒桿菌(Cornybacterium spp.)、瘧原蟲(Plasmodium spp.)、杜氏利什曼原蟲(Leishmania donovani)、弓形蟲(Toxoplasma spp.)、微絲蚴(Microfilariae)、真菌、莢膜組織胞漿菌、Coccidoides immitis、新型隱球酵母、假絲酵母(Candida spp.)、HIV、單純皰疹病毒、丙型肝炎病毒、乙型肝炎病毒、巨細(xì)胞病毒屬(Cytomegalovirus)和EB病毒。
19.權(quán)利要求1的方法,其中所述遺傳信息是對所述樣品中來自6種或更多種以下生物的核酸分子的鑒定柯薩奇病毒A、單純皰疹病毒、圣·路易腦炎病毒、EB病毒、粘液病毒、JC病毒、柯薩奇病毒B、披膜病毒、麻疹病毒、肝炎病毒、副粘病毒、艾可病毒、布尼亞病毒、巨細(xì)胞病毒、水痘-帶狀皰疹病毒、HIV、腮腺炎病毒、馬腦炎病毒、淋巴細(xì)胞性脈絡(luò)叢腦膜炎病毒、狂犬病病毒和BK病毒。
20.權(quán)利要求8的方法,其中至少50%的組成所述核酸探針集合的探針能夠與可能存在于所述樣品中或存在于所述樣品的基因組代表中的預(yù)先確定的基因組差異序列雜交。
21.一種用于從生物樣品獲取遺傳信息的試劑盒,所述試劑盒包含a)多種ID探針和/或SNP探針;和b)一個包含與(a)的探針相應(yīng)的檢測序列的檢測集合,其中所述檢測集合的最小基因組起源大于五。
22.權(quán)利要求21的試劑盒,其中(a)包含多于十種的不同的可擴(kuò)增探針。
23.權(quán)利要求22的試劑盒,其中(a)包含多于五十種的不同的可擴(kuò)增探針。
24.權(quán)利要求23的試劑盒,其中(a)包含多于二百五十種的不同的可擴(kuò)增探針。
25.權(quán)利要求21的試劑盒,其中所述檢測集合的最小基因組起源大于11。
26.權(quán)利要求21的試劑盒,其中(a)包含多于五個的可擴(kuò)增探針家族。
27.權(quán)利要求21的試劑盒,其中(a)的探針對于至少兩個不同的分類單位具有特異性。
28.權(quán)利要求27的試劑盒,其中(a)的探針對于至少兩個不同的物種具有特異性。
29.權(quán)利要求27的試劑盒,其中(a)的探針對于至少兩個不同的屬具有特異性。
30.權(quán)利要求27的試劑盒,其中(a)的探針對于至少兩個不同的界具有特異性。
31.權(quán)利要求21的試劑盒,其中(a)的探針包括包含以下的探針(i)當(dāng)與靶核酸分子的ID序列雜交時可以相互連接的兩種或更多種寡核苷酸,和(ii)擴(kuò)增序列。
32.權(quán)利要求21的試劑盒,其中(a)的探針和/或(b)的檢測序列物理結(jié)合于固相支持體上的不同位置。
33.權(quán)利要求21的試劑盒,其中至少50%的(a)的探針包含來自至少三個不同物種的基因組差異序列。
34.權(quán)利要求32的試劑盒,其中檢測(i)一個分類群的成員和(ii)密切相關(guān)的分類群的所述檢測集合所包含的檢測序列在所述支持物上相互鄰近定位。
35.一個ID探針集合,所述ID探針集合可以使用少于四對的擴(kuò)增序列擴(kuò)增,并且包含多于三個的ID探針家族和多于十種的不同的ID探針。
36.權(quán)利要求35的集合,所述集合包含多于五十種的不同的可擴(kuò)增ID探針。
37.權(quán)利要求36的集合,所述集合包含多于兩百五十種的不同的可擴(kuò)增ID探針。
38.權(quán)利要求35的集合,所述集合包含多于十個的可擴(kuò)增ID探針家族。
39.權(quán)利要求35的集合,所述集合包含多于二十五個的可擴(kuò)增ID探針家族。
40.權(quán)利要求35的集合,其中所述可擴(kuò)增探針家族中多于兩個的家族對于非重疊的分類單位具有特異性。
41.權(quán)利要求35的集合,其中所述可擴(kuò)增探針家族中多于兩個的家族對于不同物種具有特異性。
42.權(quán)利要求35的集合,其中所述可擴(kuò)增探針家族中多于兩個的家族對于不同屬具有特異性。
43.權(quán)利要求35的集合,其中所述可擴(kuò)增探針家族中多于兩個的家族對于不同界具有特異性。
44.權(quán)利要求35的集合,其中(a)的探針包括包含以下的探針(i)當(dāng)與靶核酸分子的ID序列雜交時可以相互連接的兩種或更多種寡核苷酸,和(ii)擴(kuò)增序列。
45.權(quán)利要求35的集合,其中至少50%的所述探針包含來自三個不同物種的基因組差異序列。
46.權(quán)利要求35的試劑盒,其中檢測(i)一個分類群的成員和(ii)密切相關(guān)的分類群的所述檢測集合所包含的檢測序列在支持物上相互鄰近定位。
47.一種從可能含有靶核酸分子的生物樣品獲得遺傳信息的方法,所述方法包括下列步驟a)提供最小基因組起源大于五的核酸探針集合;b)使所述探針集合同時與所述樣品的核酸分子接觸;c)檢測在所述探針和所述樣品的任何靶核酸分子之間的雜交;以及d)鑒定在步驟(c)中檢測到的核酸分子。
48.權(quán)利要求13的方法,其中所述可以連接的寡核苷酸是SNP探針。
49.權(quán)利要求48的方法,其中至少某些所述SNP探針包含可以與檢測集合中標(biāo)記序列雜交的標(biāo)記序列,其中所述檢測集合包含與所述SNP探針相應(yīng)的標(biāo)記序列集合。
50.權(quán)利要求48的方法,其中所述檢測集合的最小基因組起源大于20。
51.權(quán)利要求50的方法,其中所述檢測集合的最小基因組變異大于50。
52.權(quán)利要求1的方法,其中通過使用不多于四對的擴(kuò)增序列來擴(kuò)增步驟(a)(i)的靶核酸分子,產(chǎn)生步驟(a)(iv)的擴(kuò)增產(chǎn)物。
53.權(quán)利要求52的方法,其中所述擴(kuò)增序列指導(dǎo)使用Alu特異性引物的對位于Alu重復(fù)序列之間的序列的擴(kuò)增。
54.權(quán)利要求52的方法,其中(b)的檢測集合包含與可能在步驟(a)(iv)中擴(kuò)增的ID探針相應(yīng)的ID位點(diǎn)。
55.一種用于從生物樣品中獲取遺傳信息的試劑盒,所述試劑盒包括a)多種核酸引物,所述核酸引物能夠在生物樣品中引發(fā)靶基因組DNA中與重復(fù)序列鄰接的DNA序列的擴(kuò)增,產(chǎn)生ID探針;以及b)一個包含檢測序列的檢測集合,所述檢測與使用(a)的引物可能擴(kuò)增出的ID探針相應(yīng),其中所述檢測集合的最小基因組起源大于五。
56.權(quán)利要求55的試劑盒,其中所述檢測集合的最小基因組起源大于20。
57.權(quán)利要求55的試劑盒,其中所述重復(fù)序列是人Alu重復(fù)序列,并且所述引物是Alu特異性引物。
全文摘要
本發(fā)明提供了稱為基因組分布分析的一種方法,該方法同時掃描復(fù)雜的生物樣品中多種不同類型生物特征性的核酸序列(包括基因組差異序列、類群特異性序列和DNA多態(tài)性)的存在。本發(fā)明還包括用于本發(fā)明的方法中的探針、檢測集合和相關(guān)分子。
文檔編號G01N33/53GK1370242SQ00811616
公開日2002年9月18日 申請日期2000年6月15日 優(yōu)先權(quán)日1999年6月15日
發(fā)明者D·斯特勞斯 申請人:基因描繪系統(tǒng)有限公司