專利名稱:測定核酸堿基序列的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種可用于基因工程領(lǐng)域的測定核酸的核苷酸序列的方法。
背景技術(shù):
目前,分析核酸的核苷酸序列的主流方法是鏈終止法,其中通過采用平板型或毛細(xì)管型凝膠電泳來進(jìn)行分析。在該方法中一次可以分析的核苷酸序列的長度由于所使用的聚合酶和電泳設(shè)備的改進(jìn)而得到增加。然而,可以分析的長度通常僅約500個堿基對,最多1000個堿基對或稍少。因此,為了測定已經(jīng)克隆到傳統(tǒng)載體(質(zhì)粒、噬菌體、粘粒等)的長于數(shù)千個堿基對的DNA片段的核苷酸序列,人們需要使用引物步查法、亞克隆法和缺失克隆構(gòu)建法之一或其組合。
例如,如果使用引物步查法測定已經(jīng)克隆到質(zhì)粒載體中的長度為5000個堿基對的DNA片段的核苷酸序列,則首先使用具有所述載體上的核苷酸序列的引物從已克隆DNA片段的一個末端測定核苷酸序列。然后根據(jù)新獲得的核苷酸序列信息設(shè)計并合成另一種引物,以測定先前測定的核苷酸序列區(qū)域之外的一個區(qū)域的核苷酸序列。通過重復(fù)上述步驟數(shù)次,可以測定已克隆片段的完整的核苷酸序列。然而,由于引物步查法要求在核苷酸序列測定的每個步驟設(shè)計并合成一種引物,因此需要許多時間和費用。
如果用亞克隆法分析這樣一種DNA片段的核苷酸序列,則首先用不同的限制性酶消化質(zhì)粒DNA,以便根據(jù)所述消化所產(chǎn)生的DNA片段的長度制備已克隆DNA片段的限制性圖譜。將通過用根據(jù)限制性圖譜選擇的限制性酶消化所獲得的DNA片段,亞克隆到噬菌體或質(zhì)粒載體中。然后,用具有所述載體上的序列的一種引物測定核苷酸序列。由于亞克隆法需要復(fù)雜的步驟,包括制備限制性圖譜和后續(xù)的亞克隆,所以需要很大的工作量和許多時間。另外,適合于亞克隆的限制性酶識別位點需要一致地分布在原始已克隆DNA片段上,以便有效地按照該方法測定所述DNA片段的核苷酸序列。
缺失克隆構(gòu)建法是Yanisch-Perron等開發(fā)的一種核苷酸序列測定法,如Gene,33103-119(1985)中所述,在該方法中,通過從作為基點的已克隆片段一端連續(xù)縮短該片段,制備一系列克隆。按照該方法,與引物步查法和亞克隆法相關(guān)的問題得到部分解決。具體地說,缺失克隆構(gòu)建法不需要在核苷酸序列測定的每個步驟設(shè)計并合成引物(這是按照引物步查法所需要的)或者制備限制性圖譜并且根據(jù)限制性圖譜進(jìn)行亞克隆(這是按照亞克隆法所需要的)。然而,缺失克隆構(gòu)建法需要相當(dāng)多的基因工程技術(shù),因為為了按照該方法制備具有連續(xù)縮短的DNA片段的一系列克隆,需要用兩種限制性酶即外切核酸酶III、外切核酸酶VII、Klenow片段DNA聚合酶和DNA連接酶按照這種順序,在適合于相應(yīng)酶的條件順序處理具有已克隆DNA片段的質(zhì)粒。此外,在最終的順序處理之前,還必需通過進(jìn)行初步實驗測定已克隆DNA片段對外切核酸酶III的反應(yīng)性(缺失的傾向),因為反應(yīng)性隨已克隆DNA片段的核苷酸序列而變化。
分析通過PCR隨機(jī)擴(kuò)增片段的核苷酸序列的方法包括Telenius等的簡并寡核苷酸引物PCR(DOP-PCR)法(Genomics,13718-725(1992))和Wong等的標(biāo)志隨機(jī)六聚體擴(kuò)增(TRHA)法(Nucleic Acids Research,24(19)3778-3783(1996))。在每種方法中,都使用含有隨機(jī)序列的多種引物的混合物進(jìn)行PCR,分離多重擴(kuò)增的序列梯條帶并逐個純化,然后進(jìn)行測序。因此,這些方法的步驟是復(fù)雜的。
如上所述,目前用于分析核酸的核苷酸序列的所有方法都有問題。因此,需要一種快速低成本的分析核酸的核苷酸序列的方法,以分析基因組。
發(fā)明目的本發(fā)明的主要目的是提供一種測定核酸的核苷酸序列的方法,其中無需復(fù)雜的步驟而制備一系列長度從模板核酸上的一個基點連續(xù)縮短的擴(kuò)增DNA片段,并且分析所述DNA片段的核苷酸序列。
發(fā)明概要作為深入研究的結(jié)果,本發(fā)明人已經(jīng)發(fā)現(xiàn),通過組合用一種模板特異性引物和從具有已確定核苷酸序列的多種引物構(gòu)成的引物庫中選擇的一種引物進(jìn)行PCR,可以制備一系列從模板DNA上的一個基點改變長度的擴(kuò)增DNA片段。本發(fā)明人已經(jīng)證明,通過測定所述系列的擴(kuò)增DNA片段中各個DNA片段的核苷酸序列,可以分析原始DNA片段的完整的核苷酸序列,因而本發(fā)明得以完成。
本發(fā)明的第一方面涉及一種測定核酸的核苷酸序列的方法,所述方法包括(1)在分別具有一個標(biāo)志序列的至少兩種引物的每一種引物、一種模板核酸特異性引物和DNA聚合酶存在下,擴(kuò)增模板核酸,其中具有標(biāo)志序列的引物在5’端一側(cè)具有標(biāo)志序列,而在3’端一側(cè)具有一個三個或三個以上核苷酸的已確定的核苷酸序列;并且(2)對在上述步驟(1)中擴(kuò)增的片段進(jìn)行直接測序。
按照第一方面,可以使用具有通式所示結(jié)構(gòu)的引物作為具有標(biāo)志序列的引物通式5’-標(biāo)志序列-Sa-3’其中“S”代表選自G、A、T和C的一種核苷酸或者兩種或兩種以上核苷酸的混合物,而“a”代表3或3以上的整數(shù),條件是“Sa”中的至少三個S代表選自G、A、T和C的一種核苷酸。
按照第一方面,可以使用選自表1-5中所列引物的一種引物作為具有標(biāo)志序列的引物。
按照第一方面,模板核酸的擴(kuò)增例如使用聚合酶鏈?zhǔn)椒磻?yīng)(PCR)進(jìn)行??梢詢?yōu)選使用pol I型DNA聚合酶、α型DNA聚合酶或非pol I非α型DNA聚合酶或者DNA聚合酶的混合物作為PCR中的DNA聚合酶,并且所述DNA聚合酶可以選自Taq DNA聚合酶、Pfu DNA聚合酶、Ex-Taq DNA聚合酶、LA-Taq DNA聚合酶、Z-Taq DNA聚合酶、Tth DNA聚合酶、KOD DNA聚合酶和KOD dash DNA聚合酶。
第一方面的方法還可以包括選擇一種產(chǎn)生基本為單一條帶的PCR擴(kuò)增片段的反應(yīng)。該方法還可以包括選擇一個基本為單一條帶的PCR擴(kuò)增片段。
第一方面可以直接在樣品上進(jìn)行,或者在從樣品制備模板核酸后進(jìn)行??梢詢?yōu)選使用質(zhì)粒、噬菌體、粘粒、BAC或YAC文庫、或者基因組DNA或cDNA形式的模板核酸。
本發(fā)明的第二方面涉及一種用于第一方面的測定核酸的核苷酸序列的方法的引物庫,所述引物庫含有至少兩種引物,每種引物都在5’端一側(cè)具有一個標(biāo)志序列,而在3’端一側(cè)具有一個三個或三個以上核苷酸的已確定的核苷酸序列。
可以優(yōu)選使用具有通式所示結(jié)構(gòu)的引物作為第二方面的引物庫中具有標(biāo)志序列的引物通式5’-標(biāo)志序列-Sa-3’其中“S”代表選自G、A、T和C的一種核苷酸或者兩種或兩種以上核苷酸的混合物,而“a”代表3或3以上的整數(shù),條件是“Sa”中的至少三個S代表選自G、A、T和C的一種核苷酸。
按照第二方面,引物中的標(biāo)志序列可以含有測序用引物的一種序列。
本發(fā)明的第三方面涉及一種用于測定核酸的核苷酸序列的組合物,所述組合物含有第二方面的引物庫。
第三方面的組合物還可以含有一種DNA聚合酶??梢允褂胮ol I型DNA聚合酶、α型DNA聚合酶或非pol I非α型DNA聚合酶、或者DNA聚合酶的混合物作為所述DNA聚合酶。例如可以優(yōu)選使用TaqDNA聚合酶、Ex-Taq DNA聚合酶、LA-Taq DNA聚合酶、Z-Taq DNA聚合酶、KOD DNA聚合酶或KOD dash DNA聚合酶。
本發(fā)明的第四方面涉及一種用于第一方面的測定核酸的核苷酸序列的方法的試劑盒,所述試劑盒含有第二方面的引物庫。
第四方面的試劑盒還可以含有DNA聚合酶和供所述DNA聚合酶用的緩沖液。
第四方面的試劑盒可以為包裝形式,并且?guī)в兄笇?dǎo)第二方面的引物庫和上述DNA聚合酶使用的說明。引物庫中分別具有一個標(biāo)志序列的各種引物可以分配在預(yù)定的位置。
本發(fā)明的第五方面涉及一種制品,所述制品由包裝材料和裝入包裝材料中的用于測定核酸的核苷酸序列的試劑構(gòu)成,其中所述試劑含有一個引物庫和/或一種DNA聚合酶,并且其中所述試劑可以用于測定核苷酸序列的說明示于貼在包裝材料上的標(biāo)簽或者包裝材料所附的說明中。
發(fā)明詳述以下參考使用聚合酶鏈?zhǔn)椒磻?yīng)(PCR)擴(kuò)增模板核酸的案例描述本發(fā)明。然而,按照本發(fā)明使用的擴(kuò)增法并不限于PCR。可以使用在DNA聚合酶存在下可以用來特異性擴(kuò)增模板核酸中兩種引物所限定區(qū)域的任何方法。這類方法的例子包括ICAN法(WO 00/56877)、SDA法(日本專利第2087497號)和RCA法(美國專利第5854035號)。
當(dāng)在本文中使用時,引物是指含有脫氧核糖核苷酸或者核糖核苷酸例如腺苷酸(A)、鳥苷酸(G)、胞苷酸(C)或胸苷酸(T)的寡核苷酸。脫氧核糖核苷酸可以包含未經(jīng)修飾或經(jīng)修飾的脫氧核糖核苷酸,只要它可以用于PCR。
當(dāng)在本文中使用時,3’端一側(cè)是指從核酸諸如引物中心至3’末端的部分。同樣,5’端一側(cè)是指從核酸中心至5’末端的部分。
當(dāng)在本文中使用時,標(biāo)志序列是指在引物庫中所含有的各種引物中共同的核苷酸序列、或者在引物庫中的引物之間不同的核苷酸序列,并且所述標(biāo)志序列位于所述引物的5’端一側(cè)或者位于從引物的中心至3’末端的部分中。雖然并不打算限制本發(fā)明,但所述標(biāo)志序列可以含有供鏈終止法用的測序引物退火所至的序列、或者限制性內(nèi)切核酸酶的識別位點。優(yōu)選選擇使所述標(biāo)志序列難以退火至模板核酸的核苷酸序列。然而,并不打算限制本發(fā)明,因為可能難以根據(jù)模板DNA的序列來選擇這樣一種核苷酸序列。
在下文,將詳細(xì)描述本發(fā)明。
(1)本發(fā)明的引物庫本發(fā)明的引物庫是一個引物文庫,每種引物在5’末端具有一個標(biāo)志序列,并且能夠退火至任何的核苷酸序列上。選自引物庫的引物的3’端一側(cè)的序列對于PCR中從所述引物延伸DNA鏈非常重要。另外,它對于PCR時特異性擴(kuò)增從而選擇幾乎不退火至所述標(biāo)志序列的模板上的核苷酸序列非常有效。在本發(fā)明方法中使用的引物庫中所含有的引物具有與模板核酸中的任何核苷酸序列基本互補(bǔ)的核苷酸序列,能夠從其3’末端延伸DNA鏈。即使所述引物3’端一側(cè)的所述核苷酸序列與模板DNA不完全互補(bǔ),DNA鏈也可以延伸。通常優(yōu)選設(shè)計引物,使得庫中的引物可以退火至幾乎均一分布在模板核酸上具有任何核苷酸序列的部分上。當(dāng)用于本文時,“基本互補(bǔ)的核苷酸序列”是指能夠在所用的反應(yīng)條件下退火至作為模板的DNA上的核苷酸序列。例如,可以依照“Labo Manual PCR”(Takara Shuzo出版,第13-16頁,1996)設(shè)計這樣一種引物?;蛘撸梢允褂檬惺鄣挠糜谠O(shè)計引物的軟件,諸如OLIGOTMPrimer Analysis軟件(Takara Shuzo)。
雖然并不打算限制本發(fā)明,但本發(fā)明方法中使用的寡核苷酸引物的長度優(yōu)選為約15個核苷酸至約100個核苷酸,更優(yōu)選約18個核苷酸至約40個核苷酸。所述引物的核苷酸序列優(yōu)選與模板核酸基本互補(bǔ),使得它在所用的反應(yīng)條件下退火至模板核酸上。
雖然并不打算限制本發(fā)明,但是例如可以使用具有以下通式所示結(jié)構(gòu)的寡核苷酸作為依照本發(fā)明的引物通式5’-標(biāo)志序列-Sa-3’其中“S”代表選自G、A、T和C的一種核苷酸或者兩種或兩種以上核苷酸的混合物,而“a”代表3或3以上的整數(shù),條件是“Sa”中的至少三個S代表選自G、A、T和C的一種核苷酸。
例如,將優(yōu)選具有10個或10個以上核苷酸、更優(yōu)選15個或15個以上核苷酸的核苷酸序列置于引物的5’端一側(cè)作為標(biāo)志序列。雖然關(guān)于標(biāo)志序列的序列并沒有具體的限制,但是它最好不形成二級結(jié)構(gòu)或二聚體結(jié)構(gòu)。特別優(yōu)選與模板核酸的核苷酸序列不互補(bǔ)的序列。如果作為模板的核酸的核苷酸序列信息可得到,則可以參考所述信息設(shè)計標(biāo)志序列。例如,標(biāo)志序列可以選自一組大約50種的序列,每種序列由在模板核酸中以最低頻率存在的6個核苷酸組成。雖然并不打算限制本發(fā)明,但是例如當(dāng)要分析來自大腸桿菌(Escherichia coli)、屬于熱球菌屬(Pyrococcus)的細(xì)菌或者屬于芽孢桿菌屬(Bacillus)的細(xì)菌的核苷酸序列時,可以選擇一種具體的核苷酸序列GGCACGATTCGATAACG(SEQ ID NO1)作為標(biāo)志序列。
引物3’端一側(cè)的已確定核苷酸序列(其中每種核苷酸僅由選自四種核苷酸中的一種核苷酸組成的序列)由至少3個核苷酸組成,優(yōu)選由7個或7個以上的核苷酸組成,因為它需要退火至模板核酸上。一個隨機(jī)組合的部分N(G、A、T和C的混合物)可以包括在已確定核苷酸序列中,例如位于3’端一側(cè)、位于5’端一側(cè)或者位于內(nèi)部部分中,雖然對于其位置并沒有具體的限制。所述隨機(jī)核苷酸序列優(yōu)選具有0-5個核苷酸。引物庫中引物的已確定核苷酸序列的核苷酸可以固定為A、G、C或T。例如,就每種由7個核苷酸組成的已確定核苷酸序列而言,從3’末端起的第一個核苷酸和第七個核苷酸可以固定為A、G、C和T中之一。所述核苷酸序列的GC含量優(yōu)選為50%-70%。例如,在具有7個核苷酸的已確定核苷酸序列中,4個或5個核苷酸可以為G或C。在這種情況下,優(yōu)選確定所述核苷酸序列,使得所述引物假設(shè)其本身沒有二級結(jié)構(gòu)或者不形成引物二聚體。
通過制備對于退火至引物中具有3個或3個以上核苷酸、更優(yōu)選7個或7個以上核苷酸的已確定核苷酸序列的模板上的特異性序列,可以在后續(xù)PCR中有效產(chǎn)生單一條帶。所述引物可以含有一個隨機(jī)核苷酸序列的部分。特別是,重要的是在所述引物中包括一個標(biāo)志序列。
按照本發(fā)明,具有以上通式所示結(jié)構(gòu)和已確定核苷酸序列的引物庫,可以用來在后續(xù)PCR中產(chǎn)生基本為單一條帶的擴(kuò)增片段和獲得不同長度的擴(kuò)增片段。然后,通過分析擴(kuò)增片段的核苷酸序列,可以確定模板核酸的完整核苷酸序列。
其中對模板特異性的核苷酸序列具有7個核苷酸的引物庫例證了本發(fā)明引物庫的一個實施方案。雖然并不打算限制本發(fā)明,但其實例包括實施例1中所述的引物庫I-III。實例如下引物庫I、IV或VI,其中每種引物在其模板特異性核苷酸序列的5’端一側(cè)含有一個隨機(jī)核苷酸序列;引物庫II,其中每種引物在3’端一側(cè)含有一個隨機(jī)核苷酸序列;以及在引物中無隨機(jī)核苷酸序列的部分的引物庫III或引物庫V。
例如,在模板特異性核苷酸序列具有7個核苷酸的情況下,優(yōu)選引物中已確定核苷酸序列的7個核苷酸中的6個或6個以上的核苷酸退火至模板核酸上,以供特異性退火用。雖然并不打算限制本發(fā)明,但例如如果已確定核苷酸序列位于3’端一側(cè),則位于所述已確定序列3’末端的具有6個核苷酸的序列的變異特別重要,并且優(yōu)選6個核苷酸中的2個或2個以上的核苷酸在庫中引物中是不同的。
通過用模板特異性引物和本發(fā)明引物庫中引物的組合進(jìn)行PCR,可以在總反應(yīng)物的至少10%中獲得不同大小的單一條帶的擴(kuò)增片段。通過對擴(kuò)增片段直接測序,可以確定目標(biāo)核酸的完整核苷酸序列。
可以例如用Applied Biosystems Inc.(ABI)的394型DNA合成儀,依照亞磷酰胺法合成本發(fā)明的引物庫,使得所述引物具有已確定核苷酸序列的部分-標(biāo)志序列和隨機(jī)核苷酸序列?;蛘?,可以使用包括磷酸三酯法、H-膦酸酯法和硫代膦酸酯法在內(nèi)的任何方法來合成引物庫。
(2)本發(fā)明的測定核苷酸序列的方法通過用得自以上(1)中所述庫中的引物和一種模板特異性引物的組合進(jìn)行PCR,并且測定所得擴(kuò)增片段的核苷酸序列,實施本發(fā)明的方法。
依照本發(fā)明的方法,可以使用pol I型DNA聚合酶、α型DNA聚合酶或非pol I非α型DNA聚合酶、或者DNA聚合酶的混合物作為PCR的DNA聚合酶。雖然并不打算限制本發(fā)明,但是例如可以優(yōu)選使用Taq DNA聚合酶(pol I型)或KOD DNA聚合酶或Pfu DNA聚合酶(α型)。另外,可以使用DNA聚合酶的混合物作為DNA聚合酶。例如,可以優(yōu)選使用具有3’→5’外切活性的DNA聚合酶和無3’→5’外切活性的DNA聚合酶的組合,所述無3’→5’外切活性的DNA聚合酶例如TaKaRa ExTaq DNA聚合酶、TaKaRa LA-Taq DNA聚合酶、TaKaRaZ-Taq DNA聚合酶或KOD dash DNA聚合酶。此外,在本發(fā)明的所述方法中,可以優(yōu)選使用WO 99/54455中所述的具有3’→5’外切活性的DNA聚合酶或者無3’→5’外切活性的DNA聚合酶的組合。
PCR等所用的dNTP(dATP、dCTP、dGTP和dTTP的混合物)可以優(yōu)選作為在所述方法中用作延伸反應(yīng)中底物的三磷酸核苷酸。dNTP可以含有dNTP類似物例如7-脫氮-dGTP等,只要它作為所用DNA聚合酶的底物。
通過組合使用作為模板的核酸、來自以上(1)中所述庫的引物和模板特異性引物進(jìn)行PCR,可以在本發(fā)明的所述方法中獲得從作為基點的模板特異性引物開始的不同長度的擴(kuò)增片段。然后,通過對擴(kuò)增片段進(jìn)行測序,可以分析模板核酸的完整核苷酸序列。
依照本發(fā)明的所述方法,作為模板的核酸可以是一種生物體的基因組。通過物理方法或者通過用限制性酶消化切割基因組所獲得的片段、或者插入了這種片段的質(zhì)粒、噬菌體、噬菌粒、粘粒、BAC或YAC載體,可以優(yōu)選用作模板核酸。另一方面,它可以是通過逆轉(zhuǎn)錄反應(yīng)獲得的cDNA。
在本發(fā)明的所述方法中用作模板的核酸(DNA或RNA)可以從可能含有所述核酸的任何樣品中制備或者分離?;蛘?,這樣一種樣品可以直接用于依照本發(fā)明的核酸擴(kuò)增反應(yīng)中??赡芎兴龊怂岬臉悠返膶嵗ǖ幌抻诘米陨矬w的樣品,例如全血、血清、血沉棕黃層、尿、糞便、腦脊液、精液、唾液、組織(例如癌組織或者淋巴結(jié))和細(xì)胞培養(yǎng)物(例如哺乳動物細(xì)胞培養(yǎng)物或者細(xì)菌細(xì)胞培養(yǎng)物);含有核酸的樣品,例如類病毒、病毒、細(xì)菌、真菌、酵母、植物和動物;懷疑污染或感染微生物如病毒或細(xì)菌的樣品(例如食品或生物制劑);和可能含有生物體的樣品,例如土壤和廢水。所述樣品可以是含有通過如上所述依照已知方法加工樣品所獲得的核酸的制劑。在本發(fā)明中可以使用的制劑的實例包括細(xì)胞破壞的產(chǎn)物或者通過所述產(chǎn)物分級分離所獲得的樣品、所述樣品中的核酸、或者其中特定核酸分子例如mRNA被富集的樣品。此外,可以優(yōu)選使用通過已知方法擴(kuò)增樣品中所含有的一種核酸所獲得的核酸,例如DNA或RNA。
通過使用例如但不限于用去垢劑、超聲處理、振蕩/用玻璃珠攪拌或者弗氏壓碎器裂解,可以從如上所述的材料制備含核酸的制劑。在某些情況下,最好進(jìn)一步加工所述制劑,以純化所述核酸(例如在存在內(nèi)源核酸酶的情況下)。在這種情況下,通過已知方法例酚抽提、色譜、離子交換、凝膠電泳或者密度梯度離心,純化所述核酸。
本發(fā)明的所述方法可以包括根據(jù)作為模板的核酸的來源選擇待使用的引物庫。
當(dāng)需要使用具有衍生于RNA的序列的核酸作為模板時,本發(fā)明的所述方法可以用通過用所述RNA作為模板的逆轉(zhuǎn)錄反應(yīng)合成的cDNA作為模板來進(jìn)行??梢灾苽湓谀孓D(zhuǎn)錄反應(yīng)中使用的其引物的任何RNA,都可以應(yīng)用于本發(fā)明的所述方法中,包括樣品中的總RNA、RNA分子如mRNA、tRNA和rRNA以及特定的RNA分子種類。
在逆轉(zhuǎn)錄反應(yīng)中,可以使用在所用的反應(yīng)條件下退火至作為模板的RNA上的任何引物。所述引物可以是具有與作為模板的特定RNA互補(bǔ)的核苷酸序列的引物(特異性引物)、寡聚dT(脫氧胸腺嘧啶)引物和具有隨機(jī)序列的引物(隨機(jī)引物)。就特異性退火而言,用于逆轉(zhuǎn)錄的所述引物的長度優(yōu)選為6個或6個以上的核苷酸、更優(yōu)選9個或9個以上的核苷酸。就寡核苷酸合成而言,長度優(yōu)選為100個或100個以下的核苷酸、更優(yōu)選30個或30個以下的核苷酸。
具有用RNA作為模板合成cDNA的活性的任何酶都可以用于逆轉(zhuǎn)錄反應(yīng)中。其實例包括來源于各種來源的逆轉(zhuǎn)錄酶,例如禽類成髓細(xì)胞瘤病毒衍生逆轉(zhuǎn)錄酶(AMV RTase)、莫洛尼鼠類白血病病毒衍生逆轉(zhuǎn)錄酶(MMLV RTase)和勞斯相關(guān)病毒2逆轉(zhuǎn)錄酶(RAV-2 RTase)。另外,可以使用也具有逆轉(zhuǎn)錄活性的DNA聚合酶。對于本發(fā)明,優(yōu)選在高溫下具有逆轉(zhuǎn)錄活性的酶如得自棲熱菌屬(Thermus)細(xì)菌的DNA聚合酶(例如Tth(嗜熱棲熱菌(Thermus thermophilus)DNA聚合酶)和得自芽孢桿菌屬嗜熱菌的DNA聚合酶。雖然并不打算限制本發(fā)明,但例如優(yōu)選得自芽孢桿菌屬嗜熱菌的DNA聚合酶如得自B.st(嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus))的DNA聚合酶(Bst DNA聚合酶)和得自Bca(熱堅芽孢桿菌(Bacillus cardotenax)的DNA聚合酶。例如,Bca DNA聚合酶并不需要錳離子來進(jìn)行逆轉(zhuǎn)錄反應(yīng)。此外,它可以合成cDNA,同時抑制在高溫條件下作為模板的RNA形成二級結(jié)構(gòu)。天然存在的上述酶和具有逆轉(zhuǎn)錄酶活性的上述酶的變異體都可以使用,只要它們具有所述活性。
依照本發(fā)明的所述方法,可以例如用由三個步驟組成的反應(yīng)進(jìn)行PCR。所述三個步驟是解鏈(變性)即雙鏈DNA成為單鏈DNA的步驟、引物退火至所述單鏈DNA上的步驟以及從引物合成(延伸)互補(bǔ)鏈以便擴(kuò)增目標(biāo)DNA區(qū)的步驟?;蛘?,它可以用名為“穿梭PCR”(“PCR housaizensen”(PCR法的最新進(jìn)展),Tanpakushitsu Kakusan Kouso,Bessatsu,(Protein,Nucleic Acid and Enzyme,Supplement),41(5)425-428(1996))的反應(yīng)進(jìn)行,其中所述三個步驟的兩個步驟即引物退火步驟和延伸步驟在同一溫度下進(jìn)行。另外,依照本發(fā)明所述方法的PCR條件可以是用于WO 00/14218中所述高速PCR法的條件。所述反應(yīng)混合物可以含有一種酸性物質(zhì)或者陽離子復(fù)合物,如WO 99/54455中所述。
如上所述通過PCR獲得的擴(kuò)增DNA片段的核苷酸序列,可以通過使所述DNA片段經(jīng)過適當(dāng)?shù)牟襟E以測定DNA的核苷酸序列如鏈終止法來測定。通過綜合分析各個PCR擴(kuò)增片段的同樣測定的核苷酸序列,可以確定作為模板的核酸中一個廣泛區(qū)域的核苷酸序列。
依照本發(fā)明的方法,PCR產(chǎn)物可以在使其經(jīng)過適當(dāng)?shù)募兓椒ㄈ缬糜诩兓疨CR產(chǎn)物的分子篩(例如Microcon-100)純化后進(jìn)行測序。
在使用本發(fā)明方法、分析大腸桿菌基因組的一個示例性核苷酸序列分析中,用含有分別具有標(biāo)志序列的92種引物的本發(fā)明引物庫,在92個反應(yīng)的22個反應(yīng)中,獲得單一條帶的PCR擴(kuò)增產(chǎn)物。通過對擴(kuò)增片段進(jìn)行直接測序,可以確定約4,000bp或更大的核苷酸序列。在激烈熱球菌(Pyrococcus furiosus)的情況下,在92個反應(yīng)的18個反應(yīng)中獲得單一條帶的PCR擴(kuò)增片段,并且可以在約5,000bp或更大的區(qū)域內(nèi)測定核苷酸序列。在熱堅芽孢桿菌基因組的情況下,通過混合以不同方向插入了得自基因組的DNA片段的質(zhì)粒,在92個反應(yīng)的20個反應(yīng)(兩個方向的總和)中獲得單一條帶的PCR擴(kuò)增產(chǎn)物,并且在約2,000bp或更大的區(qū)域中可以以兩個方向測定核苷酸序列。
如上所述通過PCR擴(kuò)增的DNA片段在其末端具有一個衍生于選自引物庫的引物的標(biāo)志序列。因此,擴(kuò)增DNA片段的核苷酸序列可以通過用與標(biāo)志序列相同的核苷酸序列的引物來測定。
按照本發(fā)明,可以通過直接測序,測定核苷酸序列。當(dāng)用于本文中時,直接測序是指無需將核酸克隆到載體中,而采用擴(kuò)增核酸片段作為模板來測定所述核酸的核苷酸序列。直接測序依照用通過擴(kuò)增法(例如PCR)獲得的片段作為模板并使用具有與所述片段互補(bǔ)的序列的引物(例如具有與標(biāo)志序列相同的核苷酸序列的引物)測定核苷酸序列的常規(guī)方法(例如雙脫氧法)來進(jìn)行。
對如上所述在PCR中獲得的完整的擴(kuò)增片段進(jìn)行測序反應(yīng)。對于產(chǎn)生基本為單一條帶的PCR擴(kuò)增片段的反應(yīng)而言,測定所述PCR擴(kuò)增片段的核苷酸序列,即使在所述反應(yīng)中觀察到由于由引物組成的擴(kuò)增片段所致的本底。當(dāng)用于本文中時,基本為單一條帶的擴(kuò)增片段是指為單一條帶而使得能夠在后續(xù)序列分析中分析其核苷酸序列的擴(kuò)增片段。在本發(fā)明的方法中,可以優(yōu)選使用可以用來獲得基本為單一條帶的擴(kuò)增片段的任何核酸擴(kuò)增法。其實例包括但不限于PCR、ICAN、SDA或RCA。原始模板核酸的完整核苷酸序列可以通過綜合分析所述結(jié)果來確定??赡軠y定模板核酸的核苷酸序的一部是不可能的,例如因為各區(qū)域的PCR擴(kuò)增不均一。在這種情況下,對所述區(qū)域再次實施本發(fā)明的方法或者聯(lián)合使用一種已知方法如使用根據(jù)所獲得的核苷酸序列信息等新合成的引物來測定所述區(qū)域的核苷酸序列是十分自然的。
可以使用市售的測序儀例如Mega BACE 11000(AmershamPharmacia Biotech)、一種市售的測序試劑盒例如BcaBESTTMDideoxySequencing Kit(Takara Shuzo)等來進(jìn)行核苷酸序列測定。
在一個優(yōu)選實施方案中,雖然并不打算限制本發(fā)明,但對PCR擴(kuò)增產(chǎn)物進(jìn)行瓊脂糖凝膠電泳等,以分析擴(kuò)增產(chǎn)物,選擇產(chǎn)生基本為單一條帶的擴(kuò)增片段的反應(yīng)和產(chǎn)生對于本發(fā)明的核苷酸序列測定方法而言適當(dāng)長度的產(chǎn)物的反應(yīng),然后對所述反應(yīng)產(chǎn)物進(jìn)行測序。通過包括上述步驟,可以減少待測序的擴(kuò)增片段數(shù)目,以減少核苷酸序列測定所需的費用。此外,如果選擇產(chǎn)生基本為單一條帶的反應(yīng),則目標(biāo)擴(kuò)增片段的分子(摩爾)數(shù)足夠大于其它擴(kuò)增片段的數(shù)目。結(jié)果,即使用標(biāo)志序列進(jìn)行測序反應(yīng),也可以獲得具有很低噪音的可靠序列數(shù)據(jù)。重要的是在將擴(kuò)增片段量轉(zhuǎn)換為分子數(shù)后估計擴(kuò)增片段的量,以便選擇產(chǎn)生基本為單一條帶的擴(kuò)增片段的反應(yīng)。雖然并不打算限制本發(fā)明,但是例如可以有效使用Agilent 2100 Bioanalyzer(Takara Shuzo)的電泳設(shè)備。使用這種設(shè)備,可以測定擴(kuò)增片段的量和分子量,并且在根據(jù)測定值轉(zhuǎn)換為分子數(shù)后可以表述所述片段的量。從序列測定的經(jīng)濟(jì)效率的角度來看,重要的是選擇產(chǎn)生具有適當(dāng)長度的產(chǎn)物的反應(yīng),以便獲得盡可能均一分布而且在待測定的核苷酸序列的整個區(qū)域幾乎不重疊的核苷酸序列數(shù)據(jù)。通過用計算機(jī)使上述兩個選擇步驟自動化構(gòu)建一種系統(tǒng),可以大大降低核苷酸序列測定所需的工作量和時間。
此外,如果當(dāng)分析擴(kuò)增產(chǎn)物時觀測到多種擴(kuò)增片段,則可以按照已知方法分離一種擴(kuò)增片段(例如豐度最高的擴(kuò)增片段)進(jìn)行測序。
在某些情況下,當(dāng)使用庫中所有引物和一種對一個已知序列特異性的引物進(jìn)行PCR時,可以在所有反應(yīng)中都產(chǎn)生一種對應(yīng)于僅用所述特異性引物擴(kuò)增所得的產(chǎn)物大小的條帶。由于這樣一種擴(kuò)增片段不含標(biāo)志序列,故此即使目標(biāo)擴(kuò)增片段污染諸如本底的片段,也可以測定核苷酸序列。然而,由于所述僅用所述特異性引物擴(kuò)增降低了目標(biāo)核酸的擴(kuò)增效率,所以最好設(shè)計引物序列,使得不發(fā)生這種擴(kuò)增。雖然并不打算限制本發(fā)明,并且它取決于模板序列,所以一般優(yōu)選引物的3’末端富含AT。
本發(fā)明方法中所用的引物庫是一種含有上述(1)中所述引物的庫。聯(lián)合使用每種所述引物和一種對模板核酸中的已知序列特異性的引物,獨立地進(jìn)行PCR。雖然并不打算限制本發(fā)明,但如果庫中引物的已確定核苷酸序列具有7個核苷酸,則這樣一種序列以1/47(=16384)的平均頻率出現(xiàn),條件是所述序列中的核苷酸分布完全均一。假若如此,則100種引物中7個核苷酸的已確定核苷酸序列中的一種序列以約160種核苷酸之一的平均頻率出現(xiàn)。因而,通過用這100種引物獨立地進(jìn)行PCR,獲得相互之間長度平均相差160個核苷酸的擴(kuò)增片段。其中,用具有與標(biāo)志序列相同的核苷酸序列或者在標(biāo)志序列中所含有的核苷酸序列的測序用引物,對基本為單一條帶的PCR產(chǎn)物進(jìn)行測序反應(yīng)。分析如此獲得的核苷酸序列數(shù)據(jù)。從而一次可以分析數(shù)千堿基的序列,而無需等待隨后獲得的序列數(shù)據(jù)。
(3)含有本發(fā)明引物庫的試劑盒本發(fā)明提供用于使用上述(1)中所述引物庫進(jìn)行以上(2)中所述的測定核酸的核苷酸序列的方法的試劑盒。在一個實施方案中,所述試劑盒為包裝形式,并且?guī)в斜景l(fā)明引物庫的具體說明和使用所述庫進(jìn)行PCR的說明。對于本發(fā)明的方法,可以優(yōu)選使用含有本發(fā)明引物庫、DNA聚合酶和供所述聚合酶用的緩沖液的試劑盒。另一方面,可以依照說明選擇并且隨后使用本發(fā)明的引物庫、市售的DNA聚合酶和PCR用的試劑。就使用RNA作為模板的情況而言,所述試劑盒可以含有逆轉(zhuǎn)錄反應(yīng)用的試劑??梢詮陌凑找陨?2)中所述的本發(fā)明所用的DNA聚合酶中選擇DNA聚合酶。可以使用市售的PCR用的試劑作為PCR的試劑,可以使用實施例中所述的緩沖液。此外,所述試劑盒可以含有核苷酸序列測定用的試劑,例如測序用的引物或聚合酶。
說明本發(fā)明的核苷酸序列測定方法的說明提供了有關(guān)本發(fā)明核苷酸序列測定方法的信息、使用所述試劑盒的方法、建議的引物庫的具體說明、建議的反應(yīng)條件等的第三個部分(party)。所述說明包括描述上述內(nèi)容的印刷物例如小冊子或者散頁形式的說明手冊、貼在試劑盒上的標(biāo)簽以及含所述試劑盒的包裝表面上的說明。所述說明也包括通過電子媒介例如因特網(wǎng)公開或提供的信息。
(4)本發(fā)明的組合物本發(fā)明提供用于上述測定核酸的核苷酸序列的方法的組合物。一種示例性的組合物含有上述(1)中所述的引物庫和以上(2)中所述的DNA聚合酶。所述組合物還可以含有緩沖成分、鎂鹽、dNTP或如進(jìn)行PCR用的組分的類似物質(zhì)。此外,所述組合物可以含有以上(2)中所述的酸性或陽離子復(fù)合物。
通過使用本發(fā)明的引物庫,提供一種快速低成本測定核酸的核苷酸序列的方法。由于所述方法組合使用含有大約100種引物的引物庫和一種特異性引物來進(jìn)行,所以對于分析大量和許多種類的基因組是有用的。此外,本發(fā)明的方法可用于分析大量和多種基因組,也因為可以用比常規(guī)鳥槍測序法所需步驟更少的測序步驟來測定目標(biāo)核酸的核苷酸序列。
引物庫I的結(jié)構(gòu)和由SSSSSSS所示的已確定核苷酸序列示于表1中。
表15’-標(biāo)志序列-NN-SSSSSSS-3’(I)(NG、A、T和C的混合物;SSSSSSS代表以下所示的一種核苷酸序列)No.Nt seq No. Nt seq No. Nt seq No. Nt seq No. Nt seq1 GAAACGG21 GCAAACG41GCTACGG 61 GGGCAAG 81 GTGAGCG2 GAAAGCG22 GCAACGG42GCTCACG 62 GGGCTTG 82 GTGCCAG3 GAAAGGG23 GCAAGCG43GCTCCAG 63 GGGTACG 83 GTGCTTG4 GAACACG24 GCACACG44GCTTGCG 64 GGTAACG 84 GTGGACG5 GAACGGG25 GCACCAG45GCTTGGG 65 GGTACGG 85 GTGGCAG6 GAAGACG26 GCAGACG46GGACACG 66 GGTAGCG 86 GTGTACG7 GAAGCGG27 GCAGCAG47GGACCAG 67 GTAACGG 87 GTTAGCG8 GACACGG28 GCATGGG48GGAGACG 68 GTAAGCG 88 GTTCACG9 GACAGGG29 GCCAAAG49GGAGCAG 69 GTACACG 89 GTTCCAG10 GACCACG30 GCCACAG50GGCAAAG 70 GTAGACG 90 GTTGACG11 GACCCAG31 GCCATTG51GGCAACG 71 GTAGCGG 91 GTTTGCG12 GACGCAG32 GCCCAAG52GGCACAG 72 GTCAACG 92 GCTTGAG13 GAGAGGG33 GCCCTTG53GGCATTG 73 GTCACGG14 GAGCAAG34 GCCTACG54GGCCAAG 74 GTCAGCG15 GAGCACG35 GCCTCAG55GGCCTTG 75 GTCCAAG16 GAGCCAG36 GCCTTTG56GGCTAAG 76 GTCCACG17 GAGCTTG37 GCGCAAG57GGCTACG 77 GTCCCAG18 GATACGG38 GCGCTTG58GGCTCAG 78 GTCCTTG19 GATTGCG39 GCGGACG59GGCTTTG 79 GTCTGCG20 GATTGGG40 GCGTAAG60GGGACAG 80 GTGACGGNt seq核苷酸序列。
表1顯示了通式I所示引物的3’末端的7個核苷酸的已確定核苷酸序列??紤]Tm值、引物的二級結(jié)構(gòu)和引物形成二聚體的概率,從47(=16384)種核苷酸序列中選擇出用于所述引物的92種已確定核苷酸序列。
(2)引物庫II的構(gòu)建合成多種分別含有SEQ ID NO2的核苷酸序列GGCACGATTCGATAAC作為標(biāo)志序列的引物。換句話說,合成通式(II)所示的引物庫II5’-標(biāo)志序列-SSSSSSS-NN-3’ (II)(NG、A、T和C的混合物;S選自G、A、T或C的一種已確定的核苷酸)。
引物庫II的結(jié)構(gòu)和由SSSSSSS所示的已確定核苷酸序列示于表2中。
表25’-標(biāo)志序列-SSSSSSS-NN-3’(II)(NG、A、T和C的混合物;SSSSSSS代表以下所示的一種核苷酸序列)No.Nt seq No. Nt seq No. Nt seq No. Nt seq No. Nt seq1 GAAACGG21 GCAAACG41GCTACGG 61 GGGCAAG 81 GTGAGCG2 GAAAGCG22 GCAACGG42GCTCACG 62 GGGCTTG 82 GTGCCAG3 GAAAGGG23 GCAAGCG43GCTCCAG 63 GGGTACG 83 GTGCTTG4 GAACACG24 GCACACG44GCTTGCG 64 GGTAACG 84 GTGGACG5 GAACGGG25 GCACCAG45GCTTGGG 65 GGTACGG 85 GTGGCAG6 GAAGACG26 GCAGACG46GGACACG 66 GGTAGCG 86 GTGTACG7 GAAGCGG27 GCAGCAG47GGACCAG 67 GTAACGG 87 GTTAGCG8 GACACGG28 GCATGGG48GGAGACG 68 GTAAGCG 88 GTTCACG9 GACAGGG29 GCCAAAG49GGAGCAG 69 GTACACG 89 GTTCCAG10 GACCACG30 GCCACAG50GGCAAAG 70 GTAGACG 90 GTTGACG11 GACCCAG31 GCCATTG51GGCAACG 71 GTAGCGG 91 GTTTGCG12 GACGCAG32 GCCCAAG 52GGCACAG 72 GTCAACG 92 GCTTGAG13 GAGAGGG33 GCCCTTG53GGCATTG 73 GTCACGG14 GAGCAAG34 GCCTACG54GGCCAAG 74 GTCAGCG15 GAGCACG35 GCCTCAG55GGCCTTG 75 GTCCAAG16 GAGCCAG36 GCCTTTG56GGCTAAG 76 GTCCACG17 GAGCTTG37 GCGCAAG57GGCTACG 77 GTCCCAG18 GATACGG38 GCGCTTG58GGCTCAG 78 GTCCTTG19 GATTGCG39 GCGGACG59GGCTTTG 79 GTCTGCG20 GATTGGG40 GCGTAAG60GGGACAG 80 GTGACGGNt seq核苷酸序列。
表2顯示了通式II所示引物的3’末端的第三個至第九個核苷酸的已確定核苷酸序列。考慮Tm值、引物的二級結(jié)構(gòu)和引物形成二聚體的概率,從47(=16384)種核苷酸序列中選擇出用于所述引物的92種已確定核苷酸序列。
(3)引物庫III的構(gòu)建合成多種分別含有SEQ ID NO2的核苷酸序列GGCACGATTCGATAAC作為標(biāo)志序列的引物。換句話說,合成通式(III)所示的引物庫III5’-標(biāo)志序列-SSSSSSS-3’(III)(S選自G、A、T或C的一種已確定的核苷酸)。
引物庫III的結(jié)構(gòu)和由SSSSSSS所示的已確定核苷酸序列示于表3中。
表35’-標(biāo)志序列-SSSSSSS-3’(III)(SSSSSSS代表以下所示的一種核苷酸序列)No.Nt seq No. Nt seq No. Nt seq No. Nt seq No. Nt seq1 GAAACGG21 GCAAACG41GCTACGG 61 GGGCAAG 81 GTGAGCG2 GAAAGCG22 GCAACGG42GCTCACG 62 GGGCTTG 82 GTGCCAG3 GAAAGGG23 GCAAGCG43GCTCCAG 63 GGGTACG 83 GTGCTTG4 GAACACG24 GCACACG44GCTTGCG 64 GGTAACG 84 GTGGACG5 GAACGGG25 GCACCAG45GCTTGGG 65 GGTACGG 85 GTGGCAG6 GAAGACG26 GCAGACG46GGACACG 66 GGTAGCG 86 GTGTACG7 GAAGCGG27 GCAGCAG47GGACCAG 67 GTAACGG 87 GTTAGCG8 GACACGG28 GCATGGG48GGAGACG 68 GTAAGCG 88 GTTCACG9 GACAGGG29 GCCAAAG49GGAGCAG 69 GTACACG 89 GTTCCAG10 GACCACG30 GCCACAG50GGCAAAG 70 GTAGACG 90 GTTGACG11 GACCCAG31 GCCATTG51GGCAACG 71 GTAGCGG 91 GTTTGCG12 GACGCAG32 GCCCAAG52GGCACAG 72 GTCAACG 92 GCTTGAG13 GAGAGGG33 GCCCTTG53GGCATTG 73 GTCACGG14 GAGCAAG34 GCCTACG54GGCCAAG 74 GTCAGCG15 GAGCACG35 GCCTCAG55GGCCTTG 75 GTCCAAG16 GAGCCAG36 GCCTTTG56GGCTAAG 76 GTCCACG17 GAGCTTG37 GCGCAAG57GGCTACG 77 GTCCCAG18 GATACGG38 GCGCTTG58GGCTCAG 78 GTCCTTG19 GATTGCG39 GCGGACG59GGCTTTG 79 GTCTGCG20 GATTGGG40 GCGTAAG60GGGACAG 80 GTGACGGNt seq核苷酸序列。
表3顯示了通式III所示引物的3’末端的7個核苷酸的已確定核苷酸序列。考慮Tm值、引物的二級結(jié)構(gòu)和引物形成二聚體的概率,從47(=16384)種核苷酸序列中選擇出用于所述引物的92種已確定核苷酸序列。
(4)引物庫IV的構(gòu)建合成多種分別含有SEQ ID NO3的核苷酸序列CAGGAAACAGCTATGAC作為標(biāo)志序列的引物。換句話說,合成通式(IV)所示的引物庫IV5’-標(biāo)志序列-NNN-SSSSSS-3’(IV)(NG、A、T和C的混合物;S選自G、A、T或C的一種已確定的核苷酸)。
引物庫IV的結(jié)構(gòu)和由SSSSSS所示的已確定核苷酸序列示于表4中。
表45’-標(biāo)志序列-NNN-SSSSSS-3’(IV)(NG、A、T和C的混合物;SSSSSS代表以下所示的一種核苷酸序列)No. Nt seqNo. Nt seqNo. Nt seqNo. Nt seq1TGACGG21TCGAAA41GCGATA61AGCGAT2GCGAGC22CGAAAG42CTGCTA62CGCTAC3CGACGG23AGACGG43CGGTGC63CGATTT4CGGTGG24ACGAAC44ATTTGC64GCGAGT5GGACGG25CGTCCT45CGAAAT65GCAAAG6GTACGC26GAACGC46ACAAGC66GCGTTA7TCCGTC27GGCAAT47CCGAGC67CCGTCT8ACACGG28CGCTCA48CACCGA68TGCGTC9CGGATG29CCGTAT49CGACAT69CGCATT10 CGTGGA30CATCGG50TCAAGC70CCGTTT11 ACACCG31TTACGG51TATCCC71CGTGGT12 GACGGA32CGCATA52GCAAAC72GTGCTT13 AAGCCA33TGACGC53GGGAGT73TCACGC14 CACGCA34GAACGG54CCCTTA74GATCGG15 GCACGC35TATGGA55TATCGC75CGCATC16 TAACGC36CGGTTT56TGGTTA76ATGGTT17 CCGATG37TGGCAG57ATGCAA77AACGCA18 CGTCGG38TCATGC58ATCGCT19 CGGTAC39CGACCC59GCACGG20 ATTGCC40GCGAGA60TATGGCNt seq核苷酸序列。
表4顯示了通式IV所示引物的3’末端的6個核苷酸的已確定核苷酸序列??紤]Tm值、引物的二級結(jié)構(gòu)和引物形成二聚體的概率,從46(=4096)種核苷酸序列中選擇出用于所述引物的77種已確定核苷酸序列。
(5)引物庫V的構(gòu)建合成多種分別含有SEQ ID NO3的核苷酸序列CAGGAAACAGCTATGAC作為標(biāo)志序列的引物。換句話說,合成通式(V)所示的引物庫V5’-標(biāo)志序列-SSS-3’(V)(S選自G、A、T或C的一種已確定的核苷酸)。
引物庫V的結(jié)構(gòu)和由SSS所示的已確定核苷酸序列示于表5中。
表55’-標(biāo)志序列-SSS-3’(V)(SSS代表以下所示的一種核苷酸序列)No. Nt seq No. Nt seq No. Nt seq No Nt seq1AAA 21CCA41GGA 61TAA2AAC 22CCC42GGC 62TTC3AAG 23CCG43GGG 63TTG4AAT 24CCT44GGT 64TTT5ACA 25CGT45GTA6ACC 26CGC46GTC7ACG 27CGG47GTG8ACT 28CGT48GTT9AGA 29CTA49TAA10 AGC 30CTC50TAC11 AGG 31CTG51TAG12 AGT 32CTT52TAT13 ATA 33GAA53TCA14 ATC 34GAC54TCC15 ATG 35GAG55TCG16 ATT 36GAT56TCT17 CAA 37GCA57TGA18 CAC 38GCC58TGC19 CAG 39GCG59TGG20 CAT 40GCT60TGTNt seq核苷酸序列。
表5顯示了通式V所示引物的3’末端的3個核苷酸的核苷酸序列。選擇43(=64)種核苷酸序列用于所述引物。實施例2(1)檢查一種測定克隆到質(zhì)粒中的大腸桿菌基因的核苷酸序列的方法。如下制備質(zhì)粒克隆。簡而言之,用得自大腸桿菌JM109(TakaraShuzo)的基因組DNA作為模板并使用分別具有SEQ ID NO4和SEQID NO5的核苷酸序列的引物Eco-1和E6sph進(jìn)行PCR。用TaKaRTaBlunting Kit(平端化試劑盒)(Takara Shuzo)將所得的約6.1kbp的PCR擴(kuò)增片段平端化,用限制性酶SphI(Takara Shuzo)消化并且在SmaI和SphI位點之間與質(zhì)粒pUC119(Takara Shuzo)連接,獲得質(zhì)粒pUCE6。
(2)用質(zhì)粒pUCE6作為模板,使用具有載體特異性的核苷酸序列的引物M13-引物RV(Takara Shuzo)和在實施例1中制備的分別含有92種引物的引物庫I-III中的每種引物進(jìn)行PCR。制備25μl的PCR反應(yīng)混合物,所述反應(yīng)混合物含有20mM tris-乙酸鹽(pH 8.5)、50mM乙酸鉀、3mM乙酸鎂、0.01% BSA、dNTP各300μM、100pg質(zhì)粒pUCE6、0.625單位TaKaRa ExTaq DNA聚合酶(Takara Shuzo)。用Gene AmpPCR系統(tǒng)9600(Perkin Elmer),將所述反應(yīng)混合物進(jìn)行30個循環(huán)的PCR,每個循環(huán)由98℃0秒、38℃0秒和72℃90秒構(gòu)成。然后,用2μl每種反應(yīng)混合物進(jìn)行瓊脂糖凝膠電泳,用溴化乙錠染色后觀察擴(kuò)增DNA片段。
使用引物庫I,在92個反應(yīng)的22個反應(yīng)中,獲得大小在300bp至5600bp之間變動的單一條帶的PCR擴(kuò)增片段。用Microcon-100(Takara Shuzo)從擴(kuò)增片段中除去引物和從反應(yīng)混合物中除去鹽,并依照常規(guī)方法,用具有SEQ ID NO2(標(biāo)志序列)的核苷酸序列的測序引物進(jìn)行直接測序。結(jié)果,可以測定插入到質(zhì)粒pUCE6的所述DNA片段中的4378個核苷酸的序列。使用引物庫II,在92個反應(yīng)的21個反應(yīng)中,獲得大小在300bp至4700bp之間變動的單一PCR擴(kuò)增DNA片段。對擴(kuò)增片段進(jìn)行直接測序,可以測定4601個核苷酸的序列。使用引物庫III,在92個反應(yīng)的24個反應(yīng)中,獲得大小在1000bp至6000bp之間變動的單一條帶的PCR擴(kuò)增DNA片段。對擴(kuò)增片段進(jìn)行直接測序,也可以如上所述用其它引物庫測定模板核酸的核苷酸序列。
(3)也檢查市售ExTaq緩沖液在PCR中的應(yīng)用。PCR用的反應(yīng)混合物的組成與以上(2)中所述的組成相同,只是使用TaKaRa Ex-TaqDNA聚合酶(Takara Shuzo)的緩沖液和dNTP各200μM。用Gene AmpPCR系統(tǒng)9600(Perkin Elmer),將所述反應(yīng)混合物進(jìn)行30個循環(huán)的PCR,每個循環(huán)由98℃0秒、38℃0秒和72℃3分鐘構(gòu)成。然后,用2μl每種反應(yīng)混合物進(jìn)行瓊脂糖凝膠電泳,用溴化乙錠染色后觀察擴(kuò)增DNA片段。結(jié)果,對于各個引物庫獲得了與以上(2)中所述結(jié)果相似的結(jié)果。
(4)檢查本發(fā)明方法中引物的退火模式。就引物庫I而言,在92個反應(yīng)的22個反應(yīng)中,獲得單一條帶的PCR產(chǎn)物,然后可以測定模板核酸的核苷酸序列。在12個反應(yīng)中,引物中所述7個核苷酸的已確定核苷酸序列與模板核酸完全匹配。在所述22個反應(yīng)的10個反應(yīng)中,退火涉及一個核苷酸的錯配。在所述10個反應(yīng)的5個反應(yīng)中擴(kuò)增了一個相同的區(qū),在所述10個反應(yīng)的2個反應(yīng)中擴(kuò)增了另一個相同的區(qū)。
就引物庫II而言,在92個反應(yīng)的21個反應(yīng)中,獲得單一條帶的PCR產(chǎn)物,然后可以測定模板核酸的核苷酸序列。在9個反應(yīng)中,引物中所述7個核苷酸的已確定核苷酸序列與模板核酸完全匹配。在所述92個反應(yīng)的10個反應(yīng)中,退火涉及一個核苷酸的錯配。在所述92個反應(yīng)的2個反應(yīng)中,退火涉及兩個核苷酸的錯配。
(2)用質(zhì)粒pTVPfu8.5作為模板,使用具有載體特異性核苷酸序列的引物MR1(SEQ ID NO8)和在實施例1中制備的引物庫I的92種引物中的每一種引物進(jìn)行PCR。制備100μl的PCR反應(yīng)混合物,所述反應(yīng)混合物含有20mM tris-乙酸鹽(pH 8.5)、50mM乙酸鉀、3mM乙酸鎂、0.01% BSA、dNTP各300μM、200pg質(zhì)粒pTVPfu8.5、2.5單位TaKaRa ExTaq DNA聚合酶。用Gene Amp PCR系統(tǒng)9600,將所述反應(yīng)混合物進(jìn)行30個循環(huán)的PCR,每個循環(huán)由98℃10秒、38℃10秒和72℃2分鐘構(gòu)成。然后,用2μl每種反應(yīng)混合物進(jìn)行瓊脂糖凝膠電泳,用溴化乙錠染色后觀察擴(kuò)增DNA片段。
在92個反應(yīng)的18個反應(yīng)中,獲得大小在1300bp至8400bp之間變動的單一PCR擴(kuò)增片段。用Microcon-100(Takara Shuzo)從擴(kuò)增片段中除去引物和從反應(yīng)混合物中除去鹽,并依照常規(guī)方法,用具有SEQID NO2(標(biāo)志序列)的核苷酸序列的測序引物進(jìn)行直接測序。結(jié)果,可以測定插入到質(zhì)粒pTVPfu8.5的所述DNA片段中的5622個核苷酸的序列。
(3)也檢查市售ExTaq緩沖液在PCR中的應(yīng)用。PCR用的反應(yīng)混合物的組成與以上(2)中所述的組成相同,只是使用TaKaRa Ex-TaqDNA聚合酶(Takara Shuzo)的緩沖液和dNTP各200μM。用Gene AmpPCR系統(tǒng)9600,將所述反應(yīng)混合物進(jìn)行30個循環(huán)的PCR,每個循環(huán)由98℃10秒、38℃10秒和72℃4分鐘構(gòu)成。然后,用2μl每種反應(yīng)混合物進(jìn)行瓊脂糖凝膠電泳,用溴化乙錠染色后觀察擴(kuò)增DNA片段。結(jié)果,對于所述引物庫獲得了與以上(2)中所述結(jié)果相似的結(jié)果。
(4)檢查本發(fā)明方法中引物的退火模式。就引物庫I而言,在92個反應(yīng)的19個反應(yīng)中,獲得單一條帶的PCR產(chǎn)物,然后可以測定模板核酸的核苷酸序列。在4個反應(yīng)中,引物中所述7個核苷酸的已確定核苷酸序列與模板核酸完全匹配。在所述92個反應(yīng)的9個、1個和1個反應(yīng)中,退火分別涉及一個核苷酸、兩個核苷酸和三個核苷酸的錯配。在退火時有一個核苷酸錯配的2個反應(yīng)中,觀察到退火至同一序列上。
(2)用質(zhì)粒pUCBcaF2.7和pUCBcaR2.7的混合物作為模板,使用具有載體特異性核苷酸序列的引物M13-引物RV和在實施例I中制備的引物庫I的92種引物中的每一種引物進(jìn)行PCR。制備100μl的PCR反應(yīng)混合物,所述反應(yīng)混合物含有20mM tris-乙酸鹽(pH 8.5)、50mM乙酸鉀、3mM乙酸鎂、0.01% BSA、dNTP各300μM、200pg質(zhì)粒pUCBcaF2.7和pUCBcaR2.7的混合物、2.5單位TaKaRa ExTaq DNA聚合酶。用Gene Amp PCR系統(tǒng)9600,將所述反應(yīng)混合物進(jìn)行30個循環(huán)的PCR,每個循環(huán)由98℃10秒、38℃10秒和72℃2分鐘構(gòu)成。然后,用2μl每種反應(yīng)混合物進(jìn)行瓊脂糖凝膠電泳,用溴化乙錠染色后觀察擴(kuò)增DNA片段。
在92個反應(yīng)的19個反應(yīng)中,獲得大小在650bp至2800bp之間變動的單一PCR擴(kuò)增片段。用Microcon-100從擴(kuò)增片段中除去引物和從反應(yīng)混合物中除去鹽,并依照常規(guī)方法,用具有SEQ ID NO2(標(biāo)志序列)的核苷酸序列的測序引物進(jìn)行直接測序。結(jié)果,可以測定以兩個方向插入到所述質(zhì)粒的所述DNA片段中的2254個核苷酸的序列。
(3)也檢查市售ExTaq緩沖液在PCR中的應(yīng)用。PCR用的反應(yīng)混合物的組成與以上(2)中所述的組成相同,只是使用TaKaRa Ex-TaqDNA聚合酶(Takara Shuzo)的緩沖液和dNTP各200μM。用Gene AmpPCR系統(tǒng)9600,將所述反應(yīng)混合物進(jìn)行30個循環(huán)的PCR,每個循環(huán)由98℃10秒、38℃10秒和72℃4分鐘構(gòu)成。然后,用2μl每種反應(yīng)混合物進(jìn)行瓊脂糖凝膠電泳,用溴化乙錠染色后觀察擴(kuò)增DNA片段。結(jié)果,對于所述引物庫獲得了與以上(2)中所述結(jié)果相似的結(jié)果。
(4)檢查本發(fā)明方法中引物的退火模式。就引物庫I而言,在92個反應(yīng)的19個反應(yīng)中,獲得單一條帶的PCR產(chǎn)物,然后可以測定模板核酸的核苷酸序列。在6個反應(yīng)中,引物中所述7個核苷酸的已確定核苷酸序列與模板核酸完全匹配。在8個和2個反應(yīng)中,退火分別涉及一個核苷酸和兩個核苷酸的錯配。
證實了即使所述7個核苷酸的已確定核苷酸序列與模板核酸不完全匹配,也可以依照本發(fā)明的方法,進(jìn)行產(chǎn)生單一條帶的PCR擴(kuò)增和測序。研究所述引物的所述7個核苷酸中與模板不互補(bǔ)的核苷酸的位置。對于可以成功測序的有錯配退火的43個反應(yīng)中,反應(yīng)數(shù)和所述7個核苷酸中錯配的位置(在括號中顯示)如下5(3’末端);3(從3’末端起的第二個);2(從3’末端起的第三個);6(從3’末端起的第四個);6(從3’末端起的第五個);5(從3’末端起的第六個);和16(從3’末端起的第七個)。在許多情況下,即使從3’末端起的第七個核苷酸錯配,也可以進(jìn)行PCR擴(kuò)增和測序。因此,表明庫中每種引物從3’末端起的第七位的變異可能不是必需的。另一方面,在5個反應(yīng)中即使錯配位于3’末端,也可以獲得單一條帶的擴(kuò)增產(chǎn)物和可以進(jìn)行測序。錯配的類型示于表6中。
表6位置 錯配位置(從3’末端起)3’末端G-T=4 G-A=1第二個 G-T=1 T-T=1 C-A=1第三個 C-T=1T-T=1第四個 G-T=1C-T=3T-T=1 G-A=1第五個 G-T=1C-T=1 G-G=1G-A=1 A-A=1C-A=1第六個 G-T=1C-T=1 G-G=1G-A=1 A-A=1第七個 G-T=11 G-G=1G-A=4總計 G-T=19 C-T=6T-T=3 G-G=3G-A=8 A-A=2C-A=2如表6中所示,許多錯配對都包含T。因此,證實T傾向于以比其它核苷酸更高的頻率引起錯配。
(2)用粘粒491作為模板,使用具有所述插入片段特異性核苷酸序列的引物Pfu30F1(SEQ ID NO9)以及在實施例1中制備的得自引物庫I的92種引物、得自引物庫II的92種引物、得自引物庫IV的77種引物和得自引物庫V的64種引物中的每一種引物進(jìn)行PCR。制備100μl的PCR反應(yīng)混合物,所述反應(yīng)混合物含有20mM tris-乙酸鹽(pH8.5)、50mM乙酸鉀、3mM乙酸鎂、0.01%BSA、dNTP各300μM、500pg粘粒491、2.5單位TaKaRa ExTaq DNA聚合酶。用Gene AmpPCR系統(tǒng)9600,使所述反應(yīng)混合物經(jīng)于94℃熱變性3分鐘,然后進(jìn)行30個循環(huán)的PCR,每個循環(huán)由98℃ 10秒、38℃ 10秒和72℃ 40秒構(gòu)成。然后,用2μl每種反應(yīng)混合物進(jìn)行瓊脂糖凝膠電泳,用溴化乙錠染色后觀察擴(kuò)增DNA片段。
在使用引物庫I的92個反應(yīng)的22個反應(yīng)中,獲得大小在400bp至6000bp之間變動的單一PCR擴(kuò)增片段。用Microcon-100從擴(kuò)增片段中除去引物和從反應(yīng)混合物中除去鹽,并依照常規(guī)方法,用具有SEQID NO2(標(biāo)志序列)的核苷酸序列的測序引物進(jìn)行直接測序。結(jié)果,可以測定插入到粘粒491的所述DNA片段中的約1746個核苷酸的序列。在使用引物庫II的92個反應(yīng)的20個反應(yīng)中,獲得大小在500bp至4000bp之間變動的單一PCR擴(kuò)增片段。如上所述純化擴(kuò)增片段,然后進(jìn)行直接測序。結(jié)果,可以測定插入到粘粒491的所述DNA片段中的2045個核苷酸的序列。在使用引物庫IV的77個反應(yīng)的17個反應(yīng)中,獲得大小在1100bp至4000bp之間變動的單一PCR擴(kuò)增片段。如上所述純化擴(kuò)增片段,然后用具有SEQ ID NO3的核苷酸序列的測序引物2進(jìn)行直接測序。結(jié)果,可以測定插入到粘粒491的所述DNA片段中的2614個核苷酸的序列。在使用引物庫V的64個反應(yīng)的23個反應(yīng)中,獲得大小在500bp至2900bp之間變動的單一PCR擴(kuò)增片段。如上所述純化擴(kuò)增片段,然后用具有SEQ ID NO3的核苷酸序列的測序引物2進(jìn)行直接測序。結(jié)果,用引物庫V也可以測定插入到粘粒491的所述DNA片段的核苷酸序列。
(3)也檢查市售ExTaq緩沖液在PCR中的應(yīng)用。PCR用的反應(yīng)混合物的組成與以上(2)中所述的組成相同,只是使用TaKaRa Ex-TaqDNA聚合酶(Takara Shuzo)的緩沖液和dNTP各200μM。用Gene AmpPCR系統(tǒng)9600,將所述反應(yīng)混合物進(jìn)行30個循環(huán)的PCR,每個循環(huán)由98℃10秒、38℃10秒和72℃2分鐘構(gòu)成。然后,用2μl每種反應(yīng)混合物進(jìn)行瓊脂糖凝膠電泳,用溴化乙錠染色后觀察擴(kuò)增DNA片段。結(jié)果,對于所述相應(yīng)的引物庫獲得了與以上(2)中所述結(jié)果相似的結(jié)果。
(2)用基因組DNA作為模板,使用具有SEQ ID NO9的核苷酸序列的引物Pfu30F1和在實施例1中制備的引物庫I的92種引物中的所述24種引物(表1中的No 49-72)中的每一種引物進(jìn)行PCR。制備100μl的PCR反應(yīng)混合物,所述反應(yīng)混合物含有20mM tris-乙酸鹽(pH 8.5)、50mM乙酸鉀、3mM乙酸鎂、0.01% BSA、dNTP各300μM、10ng得自激烈熱球菌的基因組DNA、2.5單位TaKaRa ExTaq DNA聚合酶。用Gene Amp PCR系統(tǒng)9600,使所述反應(yīng)混合物經(jīng)于94℃熱變性3分鐘,然后進(jìn)行40個循環(huán)的PCR,每個循環(huán)由98℃10秒、50℃10秒和72℃40秒構(gòu)成。然后,用2μl每種反應(yīng)混合物進(jìn)行瓊脂糖凝膠電泳,用溴化乙錠染色后觀察擴(kuò)增DNA片段。
在使用引物庫I的24個反應(yīng)的8個反應(yīng)中,獲得大小在400bp至4000bp之間變動的單一PCR擴(kuò)增片段。用Microcon-100從擴(kuò)增片段中除去引物和從反應(yīng)混合物中除去鹽,并依照常規(guī)方法,用具有SEQID NO2(標(biāo)志序列)的核苷酸序列的測序引物進(jìn)行直接測序。結(jié)果,可以測定所述基因組DNA中約1000個核苷酸的序列,證實了本發(fā)明的測定核酸的核苷酸序列的方法的有效性。
(3)也檢查市售ExTaq緩沖液在PCR中的應(yīng)用。PCR用的反應(yīng)混合物的組成與以上(2)中所述的組成相同,只是使用TaKaRa Ex-TaqDNA聚合酶(Takara Shuzo)的緩沖液和dNTP各200μM。用Gene AmpPCR系統(tǒng)9600,使所述反應(yīng)混合物經(jīng)于94℃熱變性3分鐘,然后進(jìn)行40個循環(huán)的PCR,每個循環(huán)由98℃10秒、50℃10秒和72℃2分鐘構(gòu)成。然后,用2μl每種反應(yīng)混合物進(jìn)行瓊脂糖凝膠電泳,用溴化乙錠染色后觀察擴(kuò)增DNA片段。結(jié)果,對于所述引物庫獲得了與以上(2)中所述結(jié)果相似的結(jié)果。實施例8Thermococcus litoralis RNA酶HII基因和速生熱球菌(Thermococcusceler)RNA酶HII基因的克隆(1)基因組DNA的制備從11ml培養(yǎng)物中收集Thermococcus litoralis(購自德意志微生物和細(xì)胞保藏中心(Deutsche Sammlung von Mikroorganismen undZellkulturen GmbH;DSM5473)或速生熱球菌(購自德意志微生物和細(xì)胞保藏中心;DSM2476)的細(xì)胞。將細(xì)胞獨立地懸浮于500μl的25%蔗糖和50mM tris-HCl(pH 8.0)中。向其中加入100μl 0.5M EDTA和50μl10mg/ml氯化溶菌酶(Nacalai Tesque)的水溶液。讓混合物于20℃反應(yīng)1小時。反應(yīng)后,向反應(yīng)混合物中加入4ml含有150mM NaCl、1mMEDTA和20mM tris-HCl(pH 8.0)的混合物、50μl 20mg/ml蛋白酶K(Takara Shuzo)和250μl 10%十二烷基硫酸鈉水溶液。讓混合物于37℃溫育1小時。反應(yīng)后,混合物經(jīng)過苯酚-氯仿抽提和乙醇沉淀、風(fēng)干,然后溶于100μl TE中,獲得基因組DNA溶液。
(2)RNA酶HII基因中間部分的克隆根據(jù)各種熱穩(wěn)定RNA酶HII的氨基酸序列中保守的部分,合成寡核苷酸RN-F1(SEQ ID NO10)和RN-R0(SEQ ID NO11)。
用5μl在實施例8-(1)中制備的得自Thermococcus litoralis或速生熱球菌的基因組DNA溶液作為模板,用RN-F1和RN-R0各100pmol作為引物,在100μl的體積中進(jìn)行PCR。用TaKaRa Taq(Takara Shuzo)作為DNA聚合酶,按照所附的方案進(jìn)行PCR。如下進(jìn)行PCR50個循環(huán),每個循環(huán)由94℃30秒、45℃30秒和72℃1分鐘構(gòu)成。反應(yīng)后,用Microcon-100(Takara Shuzo)從反應(yīng)混合物中除去引物,并且濃縮反應(yīng)混合物。
(3)RNA酶HII基因上游和下游部分的克隆測定在實施例8-(2)中獲得的約0.5kb的得自Thermococcuslitoralis的片段TliF1R0和得自速生熱球菌的片段TceF1R0的核苷酸序列。根據(jù)所測定的核苷酸序列,合成用于克隆TliF1R0上游的部分的特異性寡核苷酸TliRN-1(SEQ ID NO12)和用于克隆TliF1R0下游的部分的特異性寡核苷酸TliRN-2(SEQ ID NO13)。此外,根據(jù)所測定的核苷酸序列,合成用于克隆TceF1R0上游的部分的特異性寡核苷酸TceRN-1(SEQ ID NO14)和用于克隆TceF1R0下游的部分的特異性寡核苷酸TceRN-2(SEQ ID NO15)。另外,合成了表7中所示的48種引物。表7中的標(biāo)志序列示于SEQ ID NO16中。
表75’-標(biāo)志序列-NN-SSSSSSS-3’(VI)(NG、A、T和C的混合物;SSSSSSS代表以下所示的核苷酸序列)No 核苷酸序列No核苷酸序列No核苷酸序列1 ggagcag 19gtaacgg 37gcgcaag2 ggcaaag 20gtaagcg 38gcgcttg3 ggcaacg 21gtacacg 39gcggacg4 ggcacag 22gtagacg 40gcgtaag5 ggcattg 23gtagcgg 41gctacgg6 ggccaag 24gtcaacg 42gctcacg7 ggccttg 25gcaccag 43gctccag8 ggctaag 26gcagacg 44gcttgcg9 ggctacg 27gcagcag 45gcttggg10 ggctcag 28gcatggg 46ggacacg11 ggctttg 29gccaaag 47ggaccag12 gggacag 30gccacag 48ggagacg13 gggcaag 31gccattg14 gggcttg 32gcccaag15 gggtacg 33gcccttg16 ggtaacg 34gcctacg17 ggtacgg 35gcctcag18 ggtagcg 36gcctttg在含有在實施例8-(1)中制備的作為模板的1μl基因組DNA溶液、20pmol TliRN-1或20pmol TliRN-2與20pmol表1中所列的48種引物中的每一種引物的組合、或者20pmol TceRN-1或20pmolTceRN-2與20pmol表1中所列的48種引物中的每一種引物的組合、20mM tris-乙酸鹽(pH 8.5)、50mM乙酸鉀、3mM乙酸鎂、0.01%BSA、dNTP各30μM和2.5單位TaKaRa Ex Taq DNA聚合酶(Takara Shuzo)的反應(yīng)混合物中,進(jìn)行PCR。如下進(jìn)行PCR于94℃保溫3分鐘;然后進(jìn)行40個循環(huán),每個循環(huán)由98℃10秒、50℃10秒和72℃40秒構(gòu)成。用每種PCR產(chǎn)物各1份進(jìn)行瓊脂糖凝膠電泳。用Microcon-100(Takara Shuzo)從產(chǎn)生單個條帶的反應(yīng)混合物中除去引物,并且濃縮反應(yīng)混合物。對濃縮物直接測序,以篩選含有所述RNA酶HII上游部分或下游部分的片段。結(jié)果,對于Thermococcus litoralis,表明一個約450bp的PCR擴(kuò)增片段TliN7含有RNA酶HII基因的上游部分,一個約600bp的PCR擴(kuò)增片段TliC25和一個約400bp的PCR擴(kuò)增片段TliC26分別含有RNA酶HII基因的下游部分。對于速生熱球菌,表明一個約450bp的PCR擴(kuò)增片段TceN24含有RNA酶HII基因的上游部分,一個約400bp的PCR擴(kuò)增片段TceC29含有RNA酶HII基因的下游部分。
(4)完整RNA酶HII基因的克隆含有TliF1R0的基因以及上游部分和下游部分的核苷酸序列示于SEQ ID NO17中。從所述核苷酸序列導(dǎo)出的RNA酶HII的氨基酸序列示于SEQ ID NO18中。根據(jù)所述核苷酸序列,合成引物TliNde(SEQID NO19)和TliBam(SEQ ID NO20)。
含有TceF1R0的基因以及上游部分和下游部分的核苷酸序列示于SEQ ID NO21中。從所述核苷酸序列導(dǎo)出的RNA酶HII的氨基酸序列示于SEQ ID NO22中。根據(jù)所述核苷酸序列,合成引物TceNde(SEQID NO23)和TceBam(SEQ ID NO24)。
用實施例8-(1)中獲得的1μl Thermococcus litoralis基因組DNA溶液作為模板,用TliNde和TliBam各20pmol作為引物,在100μl體積中進(jìn)行PCR。用Ex Taq DNA聚合酶(Takara Shuzo)作為DNA聚合酶,按照所附的方案進(jìn)行PCR。如下進(jìn)行PCR94℃30秒、55℃30秒和72℃1分鐘,進(jìn)行40個循環(huán)。約0.7kb的擴(kuò)增DNA片段用NdeI和BamHI(都得自Takara Shuzo)消化。然后通過將所得的DNA片段分別加入到質(zhì)粒載體pTV119Nd(一種其中pTV119N的NcoI位點被轉(zhuǎn)變?yōu)镹deI位點的質(zhì)粒)或pET3a(Novagen)的NdeI位點和BamHI位點之間,構(gòu)建質(zhì)粒pTLI223Nd和pTLI204。
此外,用1μl Thermococcus litoralis基因組DNA溶液作為模板,用TceNde和TceBam各20pmol作為引物,在100μl體積中進(jìn)行PCR。用Pyrobest DNA聚合酶(Takara Shuzo)作為DNA聚合酶,按照所附的方案進(jìn)行PCR。如下進(jìn)行PCR94℃30秒、55℃30秒和72℃1分鐘,進(jìn)行40個循環(huán)。約0.7kb的擴(kuò)增DNA片段用NdeI和BamHI(都得自Takara Shuzo)消化。然后通過將所得的DNA片段分別加入到質(zhì)粒載體pTV119Nd(一種其中pTV119N的NcoI位點被轉(zhuǎn)變?yōu)镹deI位點的質(zhì)粒)或pET3a(Novagen)的NdeI位點和BamHI位點之間,構(gòu)建質(zhì)粒pTCE265Nd和pTCE207。
(5)含RNA酶HII基因的DNA片段的核苷酸序列的測定按照雙脫氧法,測定在實施例8-(2)中獲得的插入到pTLI223Nd、pTLI204、pTCE265Nd和pTCE207中的所述DNA片段的核苷酸序列。
所測定的核苷酸序列的分析表明,存在推定編碼RNA酶HII的可讀框。pTLI204中所述可讀框的核苷酸序列示于SEQ ID NO25中。從所述核苷酸序列導(dǎo)出的RNA酶HII的氨基酸序列示于SEQ ID NO26中。在pTLI204中所述可讀框的核苷酸序列中位置484的“T”在pTLI223Nd中所述可讀框的核苷酸序列中被“C”所取代。在所述氨基酸序列中,位置162的苯丙氨酸被亮氨酸所取代。
pTCE207中所述可讀框的核苷酸序列示于SEQ ID NO27中。從所述核苷酸序列導(dǎo)出的RNA酶HII的氨基酸序列示于SEQ ID NO28中。在pTCE207中所述可讀框的核苷酸序列中位置14的“A”在pTCE265Nd中所述可讀框的核苷酸序列中被“G”所取代。另外,在pTCE207中所述可讀框的核苷酸序列中位置693-696的核苷酸在pTCE265Nd中缺失。在所述氨基酸序列中,位置5的谷氨酸被甘氨酸所取代,并且位置231的苯丙氨酸缺失。
(6)RNA酶HII基因的表達(dá)將用pTLI223Nd或pTCE265Nd轉(zhuǎn)化的大腸桿菌JM109接種到含有100μg/ml氨芐青霉素和1mM IPTG的10ml LB培養(yǎng)基中,于37℃振蕩培養(yǎng)過夜。培養(yǎng)后,將經(jīng)離心收集的細(xì)胞懸浮于196μl緩沖液A中,進(jìn)行超聲處理。將通過超聲處理懸浮液以12,000rpm離心10分鐘而獲得的上清液于70℃加熱10分鐘。然后再次以12,000rpm離心10分鐘,以收集上清液,作為熱處理上清液。同樣,將用pTLI204或pTCE207轉(zhuǎn)化的大腸桿菌HMS174(DE3)接種到含有100μg/ml氨芐青霉素的10ml LB培養(yǎng)基中,于37℃振蕩培養(yǎng)過夜。培養(yǎng)后,按照上述方法加工經(jīng)離心收集的細(xì)胞,獲得熱處理上清液。
測定熱處理上清液的酶活性。結(jié)果,觀察到所有轉(zhuǎn)化體的RNA酶H活性。因此,證實了所述多肽的所述活性,盡管在核苷酸序列或氨基酸序列中有取代。如上所述,證明按照本發(fā)明的方法,可以直接從基因組方便而快速地克隆目標(biāo)基因,而無需構(gòu)建文庫。
工業(yè)應(yīng)用性本發(fā)明提供一種快速而低成本的測定核酸的核苷酸序列的方法,其中對通過用一種模板特異性引物和具有已確定核苷酸序列的引物進(jìn)行PCR獲得的PCR產(chǎn)物進(jìn)行測序。
序列表的獨立文本SEQ ID NO1人工設(shè)計的寡核苷酸。
SEQ ID NO2人工設(shè)計的寡核苷酸。
SEQ ID NO3人工設(shè)計的寡核苷酸。
SEQ ID NO4人工設(shè)計的寡核苷酸。
SEQ ID NO5人工設(shè)計的寡核苷酸。
SEQ ID NO6人工設(shè)計的寡核苷酸。
SEQ ID NO7人工設(shè)計的寡核苷酸。
SEQ ID NO8人工設(shè)計的寡核苷酸。
SEQ ID NO9人工設(shè)計的寡核苷酸。
SEQ ID NO10PCR引物RN-F1,用于從Thermococcus litoralis中克隆編碼具有RNA酶HII活性的多肽的基因。
SEQ ID NO11PCR引物RN-R0,用于從Thermococcus litoralis中克隆編碼具有RNA酶HII活性的多肽的基因。
SEQ ID NO12PCR引物TliRN-1,用于從Thermococcus litoralis中克隆編碼具有RNA酶HII活性的多肽的基因。
SEQ ID NO13PCR引物TliRN-2,用于從Thermococcus litoralis中克隆編碼具有RNA酶HII活性的多肽的基因。
SEQ ID NO14PCR引物TceRN-1,用于從速生熱球菌中克隆編碼具有RNA酶HII活性的多肽的基因。
SEQ ID NO15PCR引物TceRN-2,用于從速生熱球菌中克隆編碼具有RNA酶HII活性的多肽的基因。
SEQ ID NO16設(shè)計的作為標(biāo)志序列的寡核苷酸。
SEQ ID NO19PCR引物TliNde,用于從Thermococcus litoralis中擴(kuò)增編碼具有RNA酶HII活性的多肽的基因。
SEQ ID NO20PCR引物TliBam,用于從Thermococcus litoralis中擴(kuò)增編碼具有RNA酶HIII活性的多肽的基因。
SEQ ID NO23PCR引物TceNde,用于從速生熱球菌中擴(kuò)增編碼具有RNA酶HII活性的多肽的基因。
SEQ ID NO24PCR引物TceBam,用于從速生熱球菌中擴(kuò)增編碼具有RNA酶HIII活性的多肽的基因。序列表<110>寶酒造株式會社(Takara Shuzo Co.,Ltd.)<120>測定核酸的核苷酸序列的方法<130>662848<150>JP 2000-331513<151>2000-10-30<160>28<210>1<211>17<212>DNA<213>人工序列<220><223>人工設(shè)計的寡核苷酸<400>1ggcacgattc gataacg 17<210>2<211>16<212>DNA<213>人工序列<220><223>人工設(shè)計的寡核苷酸<400>2ggcacgattc gataac16<210>3<211>17<212>DNA<213>人工序列<220><223>人工設(shè)計的寡核苷酸<400>3caggaaacag ctatgac 17<210>4<211>37<212>DNA<213>人工序列<220><223>人工設(shè)計的寡核苷酸<400>4ggtggcgcga tgcaaatgca atcttcgttg ccccaac 37<210>5<211>30<212>DNA<213>人工序列<220><223>E6 sph引物<400>5tggccttcga gcgatgcatg ctcactgcca 30<210>6<211>35<212>DNA<213>人工序列<220><223>人工設(shè)計的寡核苷酸<400>6tttccaatgg agggttctag atgaacgaag gtgaa35<210>7<211>33<212>DNA<213>人工序列<220><223>人工設(shè)計的寡核苷酸<400>7cgacatagtg aggtgtctag acggaaagaa_gga33<210>8<211>30<212>DNA<213>人工序列<220><223>人工設(shè)計的寡核苷酸<400>8tttacacttt atgcttccgg ctcgtatgtt30<210>9<211>30<212>DNA<213>人工序列<220><223>人工設(shè)計的寡核苷酸<400>9ccttatctat gatctccttc tttccgtctg30<210>10<211>23<212>DNA<213>人工序列<220><223>PCR引物RN-F1,用于從Thermococcus litoralis中克隆編碼具有RNA酶HII活性的多肽的基因<400>10ggcattgatg aggctggnar rgg 23<210>11<211>23<212>DNA<213>人工序列<220><223>PCR引物RN-RO,用于從Thermococcus litoralis中克隆編碼具有RNA酶HII活性的多肽的基因<400>11gtccttggat cgctgggrta ncc 23<210>12<211>24<212>DNA<213>人工序列<220><223>PCR引物TliRN-1,用于從Thermococcus litoralis中克隆編碼具有RNA酶HII活性的多肽的基因<400>12tagctttttt gaatctttga ctcc 24<210>13<211>24<212>DNA<213>人工序列<220><223>PCR引物TliRN-2,用于從Thermococcus litoralis中克隆編碼具有RNA酶HII活性的多肽的基因<400>13ctgctgcatc aatactagct aaag 24<210>14<211>24<212>DNA<213>人工序列<220><223>PCR引物TceRN-1,用于從速生熱球菌(Thermococcus celer)中克隆編碼具有RNA酶HII活性的多肽的基因<400>14tctctgagct tcggaacgtt cttc 24<210>15<211>24<212>DNA<213>人工序列<220><223>PCR引物TceRN-2,用于從速生熱球菌(Thermococcus celer)中克隆編碼具有RNA酶HII活性的多肽的基因<400>15acccgtgaca gggcgataga aaag 24<210>16<211>17<212>DNA<213>人工序列<220><223>設(shè)計的作為標(biāo)志序列的寡核苷酸<400>16ggcacgattc gataacg 17<210>17<211>675<212>DNA<213>Thermococcus litoralis<400>17atgaagctgg gaggaataga tgaagccggc aggggaccag ttataggccc tcttgtaatt 60gcagcggttg ttgtcgatga atcccgtatg caggagcttg aagctttggg agtcaaagat 120tcaaaaaagc taacaccaaa aagaagagaa gagctatttg aggagattgt gcaaatagtt 180gatgaccacg ttatcattca gctttcccca gaggagatag acggcagaga tggtacaatg 240aacgagcttg aaattgaaaa ctttgccaaa gcgttgaact cccttaaagt taagccggat 300gtgctctaca tagatgcggc cgatgtcaag gaaaagcgct ttggcgacat tataggtgaa 360agactttcct tctctccaaa gataatcgcc gaacataagg cagattcaaa gtacattcca 420gtggctgctg catcaatact agctaaagtt acccgtgaca gggcaataga gaagctcaag 480gagctttatg gggagatagg ctcaggatat ccaagtgatc caaatacaag gaggtttctg 540gaggagtatt acaaggctca tggggaattc cccccaatag tgaggaaaag ctggaagacc 600cttagaaaga tagaagaaaa actaaaagct aaaaagactc agcccactat cttggacttc 660ttaaaaaagc cttaa 675<210>18<211>224<212>PRT<213>Thermococcus litoralis<400>18Met Lys Leu Gly Gly Ile Asp Glu Ala Gly Arg Gly Pro Val Ile1 5 10 15Gly Pro Leu Val Ile Ala Ala Val Val Val Asp Glu Ser Arg Met20 25 30Gln Glu Leu Glu Ala Leu Gly Val Lys Asp Ser Lys Lys Leu Thr35 40 45Pro Lys Arg Arg Glu Glu Leu Phe Glu Glu Ile Val Gln Ile Val50 55 60Asp Asp His Val Ile Ile Gln Leu Ser Pro Glu Glu Ile Asp Gly65 70 75Arg Asp Gly Thr Met Asn Glu Leu Glu Ile Glu Asn Phe Ala Lys80 85 90Ala Leu Asn Ser Leu Lys Val Lys Pro Asp Val Leu Tyr Ile Asp95 100 105Ala Ala Asp Val Lys Glu Lys Arg Phe Gly Asp Ile Ile Gly Glu110 115 120Arg Leu Ser Phe Ser Pro Lys Ile Ile Ala Glu His Lys Ala Asp125 130 135Ser Lys Tyr Ile Pro Val Ala Ala Ala Ser Ile Leu Ala Lys Val140 145 150Thr Arg Asp Arg Ala Ile Glu Lys Leu Lys Glu Leu Tyr Gly Glu155 160 165Ile Gly Ser Gly Tyr Pro Ser Asp Pro Asn Thr Arg Arg Phe Leu170 175 180Glu Glu Tyr Tyr Lys Ala His Gly Glu Phe Pro Pro Ile Val Arg185 190 195Lys Ser Trp Lys Thr Leu Arg Lys Ile Glu Glu Lys Leu Lys Ala200 205 210Lys Lys Thr Gln Pro Thr Ile Leu Asp Phe Leu Lys Lys Pro215 220<210>19<211>39<212>DNA<213>人工序列<220><223>PCR引物TliNde,用于從Thermococcus litoralis中擴(kuò)增編碼具有RNA酶HII活性的多肽的基因<400>19gaggaggtag gcatatgaag ctgggaggaa tagatgaag 39<210>20<211>39<212>DNA<213>人工序列<220><223>PCR引物TliBam,用于從Thermococcus litoralis中擴(kuò)增編碼具有RNA酶HIII活性的多肽的基因<400>20aaaggaaacc ttcggatcca ttaaggcttt tttaagaag 39<210>21<211>702<212>DNA<213>速生熱球菌(Thermococcus celer)<400>21ttgaagctcg caggaataga cgaggctgga aggggccccg taatcggccc gatggtcatc 60gcggccgtcg tcctcgatga gaagaacgtt ccgaagctca gagatctcgg cgtcagggac 120tcgaaaaagc tgaccccaaa gaggagggag agattattta acgacataat taaacttttg 180gatgattatg taattcttga attatggccg gaggagatag actcccgcgg cgggacgctt 240aacgagctcg aggtggagag gttcgtggag gccctcaact cgcttaaggt gaagcccgac 300gtcgtttaca tagacgcggc ggacgtgaag gagggccgct ttggcgagga gataaaggaa 360aggttgaact tcgaggcgaa gattgtctca gagcacaggg cggacgataa gtttttaccg 420gtgtcctctg cctcgatact ggcgaaggtg acccgtgaca gggcgataga aaagctcaag 480gagaagtacg gcgagatcgg gagcggctac ccgagcgacc caaggacgag ggagttcctc 540gagaactact acagacaaca cggcgagttc ccgcccgtag tccggcgaag ctggaagacg 600ctgagaaaga tagaggaaaa gctgaggaaa gaggccgggt caaaaaaccc ggagaattca 660aaggaaaagg gacagacgag cctggacgta tttttgaggt ag 702<210>22<211>233<212>PRT<213>速生熱球菌(Thermococcus celer)<400>22Leu Lys Leu Ala Gly Ile Asp Glu Ala Gly Arg Gly Pro Val Ile1 5 10 15Gly Pro Met Val Ile Ala Ala Val Val Leu Asp Glu Lys Asn Val20 25 30Pro Lys Leu Arg Asp Leu Gly Val Arg Asp Ser Lys Lys Leu Thr35 40 45Pro Lys Arg Arg Glu Arg Leu Phe Asn Asp Ile Ile Lys Leu Leu50 55 60Asp Asp Tyr Val Ile Leu Glu Leu Trp Pro Glu Glu Ile Asp Ser65 70 75Arg Gly Gly Thr Leu Asn Glu Leu Glu Val Glu Arg Phe Val Glu80 85 90Ala Leu Asn Ser Leu Lys Val Lys Pro Asp Val Val Tyr Ile Asp95 100 105Ala Ala Asp Val Lys Glu Gly Arg Phe Gly Glu GIu Ile Lys Glu110 115 120Arg Leu Asn Phe Glu Ala Lys Ile Val Ser Glu His Arg Ala Asp125 130 135Asp Lys Phe Leu Pro Val Ser Ser Ala Ser Ile Leu Ala Lys Val140 145 150Thr Arg Asp Arg Ala Ile Glu Lys Leu Lys Glu Lys Tyr Gly Glu155 160 165Ile Gly Ser Gly Tyr Pro Ser Asp Pro Arg Thr Arg Glu Phe Leu170 175 180Glu Asn Tyr Tyr Arg Gln His Gly Glu Phe Pro Pro Val Val Arg185 190 195Arg Ser Trp Lys Thr Leu Arg Lys Ile Glu Glu Lys Leu Arg Lys200 205 210Glu Ala Gly Ser Lys Asn Pro Glu Asn Ser Lys Glu Lys Gly Gln215 220 225Thr Ser Leu Asp Val Phe Leu Arg230<210>23<211>39<212>DNA<213>人工序列<220><223>PCR引物TceNde,用于從速生熱球菌(Thermococcus celer)中擴(kuò)增編碼具有RNA酶HII活性的多肽的基因<400>23cagggggtga gcatatgaag ctcgcaggaa tagacgagg 39<210>24<211>39<212>DNA<213>人工序列<220><223>PCR引物TceBam,用于從速生熱球菌(Thermococcus celer)中擴(kuò)增編碼具有RNA酶HIII活性的多肽的基因<400>24tgaacccgcg taggatccta cctcaaaaat acgtccagg 39<210>25<211>675<212>DNA<213>Thermococcus litoralis<400>25atgaagctgg gaggaataga tgaagccggc aggggaccag ttataggccc tcttgtaatt 60gcagcggttg ttgtcgatga atcccgtatg caggagcttg aagctttggg agtcaaagat 120tcaaaaaagc taacaccaaa aagaagagaa gagctatttg aggagattgt gcaaatagtt 180gatgaccacg ttatcattca gctttcccca gaggagatag acggcagaga tggtacaatg 240aacgagcttg aaattgaaaa ctttgccaaa gcgttgaact cccttaaagt taagccggat 300gtgctctaca tagatgcggc cgatgtcaag gaaaagcgct ttggcgacat tataggtgaa 360agactttcct tctctccaaa gataatcgcc gaacataagg cagattcaaa gtacattcca 420gtggctgctg catcaatact agctaaagtt acccgtgaca gggcaataga gaagctcaag 480gagttttatg gggagatagg ctcaggatat ccaagtgatc caattacaag gaggtttctg 540gaggagtatt acaaggctca tggggaattc cccccaatag tgaggaaaag ctggaagacc 600cttagaaaga tagaagaaaa actaaaagct aaaaagactc agcccactat cttggacttc 660ttaaaaaagc cttaa 675<210>26<211>224<212>PRT<213>Thermococcus litoralis<400>26Met Lys Leu Gly Gly Ile Asp Glu Ala Gly Arg Gly Pro Val Ile1 5 10 15Gly Pro Leu Val Ile Ala Ala Val Val Val Asp Glu Ser Arg Met20 25 30Gln Glu Leu Glu Ala Leu Gly Val Lys Asp Ser Lys Lys Leu Thr35 40 45Pro Lys Arg Arg Glu Glu Leu Phe Glu Glu Ile Val Gln Ile Val50 55 60Asp Asp His Val Ile Ile Gln Leu Ser Pro Glu Glu Ile Asp Gly65 70 75Arg Asp Gly Thr Met Asn Glu Leu Glu Ile Glu Asn Phe Ala Lys80 85 90Ala Leu Asn Ser Leu Lys Val Lys Pro Asp Val Leu Tyr Ile Asp95 100 105Ala Ala Asp Val Lys Glu Lys Arg Phe Gly Asp Ile Ile Gly Glu110 115 120Arg Leu Ser Phe Ser Pro Lys Ile Ile Ala Glu His Lys Ala Asp125 130 135Ser Lys Tyr Ile Pro Val Ala Ala Ala Ser Ile Leu Ala Lys Val140 145 150Thr Arg Asp Arg Ala Ile Glu Lys Leu Lys Glu Phe Tyr Gly Glu155 160 165Ile Gly Ser Gly Tyr Pro Ser Asp Pro Ile Thr Arg Arg Phe Leu170 175 180Glu Glu Tyr Tyr Lys Ala His Gly Glu Phe Pro Pro Ile Val Arg185 190 195Lys Ser Trp Lys Thr Leu Arg Lys Ile Glu Glu Lys Leu Lys Ala200 205 210Lys Lys Thr Gln Pro Thr Ile Leu Asp Phe Leu Lys Lys Pro215 220<210>27<211>702<212>DNA<213>速生熱球菌(Thermococcus celer)<400>27atgaagctcg cagaaataga cgaggctgga aggggccccg taatcggccc gatggtcatc 60gcggccgtcg tcctcgatga gaagaacgtt ccgaagctca gagatctcgg cgtcagggac 120tcgaaaaagc tgaccccaaa gaggagggag agattattta acgacataat taaacttttg 180gatgattatg taattcttga attatggccg gaggagatag actcccgcgg cgggacgctt 240aacgagctcg aggtggagag gttcgtggag gccctcaact cgcttaaggt gaagcccgac 300gtcgtttaca tagacgcggc ggacgtgaag gagggccgct ttggcgagga gataaaggaa 360aggttgaact tcgaggcgaa gattgtctca gagcacaggg cggacgataa gtttttaccg 420gtgtcctctg cctcgatact ggcgaaggtg acccgtgaca gggcgataga aaagctcaag 480gagaagtacg gcgagatcgg gagcggctac ccgagcgacc caaggacgag ggagttcctc 540gagaactact acagacaaca cggcgagttc ccgcccgtag tccggcgaag ctggaagacg 600ctgagaaaga tagaggaaaa gctgaggaaa gaggccgggt caaaaaaccc ggagaattca 660aaggaaaagg gacagacgag cctggacgta tttttgaggt ag 702<210>28<211>233<212>PRT<213>速生熱球菌(Thermococcus celer)<400>28Met Lys Leu Ala Glu Ile Asp Glu Ala Gly Arg Gly Pro Val Ile1 5 10 15Gly Pro Met Val Ile Ala Ala Val Val Leu Asp Glu Lys Asn Val20 25 30Pro Lys Leu Arg Asp Leu Gly Val Arg Asp Ser Lys Lys Leu Thr
35 40 45Pro Lys Arg Arg Glu Arg Leu Phe Asn Asp Ile Ile Lys Leu Leu50 55 60Asp Asp Tyr Val Ile Leu Glu Leu Trp Pro Glu Glu Ile Asp Ser65 70 75Arg Gly Gly Thr Leu Asn Glu Leu Glu Val Glu Arg Phe Val Glu80 85 90Ala Leu Asn Ser Leu Lys Val Lys Pro Asp Val Val Tyr Ile Asp95 100 105Ala Ala Asp Val Lys Glu Gly Arg Phe Gly Glu Glu Ile Lys Glu110 115 120Arg Leu Asn Phe Glu Ala Lys Ile Val Ser Glu His Arg Ala Asp125 130 135Asp Lys Phe Leu Pro Val Ser Ser Ala Ser Ile Leu Ala Lys Val140 145 150Thr Arg Asp Arg Ala Ile Glu Lys Leu Lys Glu Lys Tyr Gly Glu155 160 165Ile Gly Ser Gly Tyr Pro Ser Asp Pro Arg Thr Arg Glu Phe Leu170 175 180Glu Asn Tyr Tyr Arg Gln His Gly Glu Phe Pro Pro Val Val Arg185 190 195Arg Ser Trp Lys Thr Leu Arg Lys Ile Glu Glu Lys Leu Arg Lys200 205 210Glu Ala Gly Ser Lys Asn Pro Glu Asn Ser Lys Glu Lys Gly Gln215 220 225Thr Ser Leu Asp Val Phe Leu Arg230
權(quán)利要求
1.一種測定核酸的核苷酸序列的方法,所述方法包括(1)在分別具有一個標(biāo)志序列的至少兩種引物的每一種引物、一種模板核酸特異性引物和DNA聚合酶存在下,擴(kuò)增所述模板核酸,其中所述具有標(biāo)志序列的引物在5’端一側(cè)具有所述標(biāo)志序列,而在3’端一側(cè)具有一個三個或三個以上核苷酸的已確定的核苷酸序列;并且(2)對在以上步驟(1)中擴(kuò)增的片段進(jìn)行直接測序。
2.權(quán)利要求1的方法,其中所述具有標(biāo)志序列的引物具有以下通式所示的結(jié)構(gòu)通式5’-標(biāo)志序列-Sa-3’其中“S”代表選自G、A、T和C的一種核苷酸或者兩種或兩種以上核苷酸的混合物,而“a”代表3或3以上的整數(shù),條件是“Sa”中的至少三個S代表選自G、A、T和C的一種核苷酸。
3.權(quán)利要求1的方法,其中所述具有標(biāo)志序列的引物選自表1-5中所列的引物。
4.權(quán)利要求1的方法,其中所述模板核酸的擴(kuò)增使用聚合酶鏈?zhǔn)椒磻?yīng)(PCR)進(jìn)行。
5.權(quán)利要求1的方法,所述方法還包括選擇具有標(biāo)志序列、在所述模板核酸擴(kuò)增時產(chǎn)生基本為單一條帶的擴(kuò)增片段的引物庫。
6.權(quán)利要求1的方法,所述方法還包括純化基本為單一條帶的擴(kuò)增片段。
7.權(quán)利要求4的方法,其中在所述PCR中使用pol I型DNA聚合酶、α型DNA聚合酶或非pol I非α型DNA聚合酶或者DNA聚合酶的混合物。
8.權(quán)利要求1的方法,其中所述DNA聚合酶選自Taq DNA聚合酶、Pfu DNA聚合酶、Ex-Taq DNA聚合酶、LA-Taq DNA聚合酶、Z-Taq DNA聚合酶、Tth DNA聚合酶、KOD DNA聚合酶和KOD dashDNA聚合酶。
9.權(quán)利要求1的方法,所述方法在從樣品制備所述模板核酸后進(jìn)行。
10.權(quán)利要求9的方法,其中所述模板核酸以質(zhì)粒、噬菌體、噬菌粒、粘粒、BAC或YAC文庫、或者基因組DNA或cDNA形式提供。
11.一種供測定核酸的核苷酸序列的方法使用的引物庫,所述引物庫含有至少兩種分別具有一個標(biāo)志序列的引物,其中所述具有標(biāo)志序列的引物在5’端一側(cè)具有所述標(biāo)志序列,而在3’端一側(cè)具有一個三個或三個以上核苷酸的已確定的核苷酸序列,并且其中所述測定核酸的核苷酸序列的方法包括(1)在分別具有一個標(biāo)志序列的至少兩種引物的每一種引物、一種模板核酸特異性引物和DNA聚合酶存在下,擴(kuò)增所述模板核酸,其中所述具有標(biāo)志序列的引物在5’端一側(cè)具有所述標(biāo)志序列,而在3’端一側(cè)具有一個三個或三個以上核苷酸的已確定的核苷酸序列;并且(2)對在以上步驟(1)中擴(kuò)增的片段進(jìn)行直接測序。
12.權(quán)利要求11的引物庫,其中所述具有標(biāo)志序列的引物具有以下通式所示的結(jié)構(gòu)通式5’-標(biāo)志序列-Sa-3’其中“S”代表選自G、A、T和C的一種核苷酸或者兩種或兩種以上核苷酸的混合物,而“a”代表3或3以上的整數(shù),條件是“Sa”中的至少三個S代表選自G、A、T和C的一種核苷酸。
13.權(quán)利要求11的引物庫,其中所述具有標(biāo)志序列的引物中的所述標(biāo)志序列含有一個測序用引物的序列。
14.一種用于測定核酸的核苷酸序列的組合物,所述組合物含有一個供測定核酸的核苷酸序列的方法使用的引物庫,其中所述引物庫含有至少兩種分別具有一個標(biāo)志序列的引物,其中所述具有標(biāo)志序列的引物在5’端一側(cè)具有所述標(biāo)志序列,而在3’端一側(cè)具有一個三個或三個以上核苷酸的已確定的核苷酸序列,并且其中所述測定核酸的核苷酸序列的方法包括(1)在分別具有一個標(biāo)志序列的至少兩種引物的每一種引物、一種模板核酸特異性引物和DNA聚合酶存在下,擴(kuò)增所述模板核酸,其中所述具有標(biāo)志序列的引物在5’端一側(cè)具有所述標(biāo)志序列,而在3’端一側(cè)具有一個三個或三個以上核苷酸的已確定的核苷酸序列;并且(2)對在以上步驟(1)中擴(kuò)增的片段進(jìn)行直接測序。
15.權(quán)利要求14的組合物,所述組合物還含有DNA聚合酶。
16.權(quán)利要求15的組合物,其中所述DNA聚合酶為pol I型DNA聚合酶、α型DNA聚合酶或非pol I非α型DNA聚合酶或者DNA聚合酶的混合物。
17.權(quán)利要求16的組合物,其中所述DNA聚合酶選自Taq DNA聚合酶、Ex-Taq DNA聚合酶、LA-Taq DNA聚合酶、Z-Taq DNA聚合酶、Tth DNA聚合酶、KOD DNA聚合酶和KOD dash DNA聚合酶。
18.一種供測定核酸的核苷酸序列的方法使用的試劑盒,所述試劑盒含有一個引物庫,其中所述引物庫含有至少兩種分別具有一個標(biāo)志序列的引物,其中所述具有標(biāo)志序列的引物在5’端一側(cè)具有所述標(biāo)志序列,而在3’端一側(cè)具有一個三個或三個以上核苷酸的已確定的核苷酸序列,并且其中所述測定核酸的核苷酸序列的方法包括(1)在分別具有一個標(biāo)志序列的至少兩種引物的每一種引物、一種模板核酸特異性引物和DNA聚合酶存在下,擴(kuò)增所述模板核酸,其中所述具有標(biāo)志序列的引物在5’端一側(cè)具有所述標(biāo)志序列,而在3’端一側(cè)具有一個三個或三個以上核苷酸的已確定的核苷酸序列;并且(2)對在以上步驟(1)中擴(kuò)增的片段進(jìn)行直接測序。
19.權(quán)利要求18的試劑盒,所述試劑盒還含有DNA聚合酶和供所述DNA聚合酶用的緩沖液。
20.一種供測定核酸的核苷酸序列的方法使用的試劑盒,所述試劑盒為包裝形式并且?guī)в兄笇?dǎo)引物庫和DNA聚合酶使用的說明,其中所述引物庫含有至少兩種分別具有一個標(biāo)志序列的引物,其中所述具有標(biāo)志序列的引物在5’端一側(cè)具有所述標(biāo)志序列,而在3’端一側(cè)具有一個三個或三個以上核苷酸的已確定的核苷酸序列,并且其中所述測定核酸的核苷酸序列的方法包括(1)在分別具有一個標(biāo)志序列的至少兩種引物的每一種引物、一種模板核酸特異性引物和DNA聚合酶存在下,擴(kuò)增所述模板核酸,其中所述具有標(biāo)志序列的引物在5’端一側(cè)具有所述標(biāo)志序列,而在3’端一側(cè)具有一個三個或三個以上核苷酸的已確定的核苷酸序列;并且(2)對在以上步驟(1)中擴(kuò)增的片段進(jìn)行直接測序。
21.權(quán)利要求18或20的試劑盒,其中所述引物庫中所述分別具有標(biāo)志序列的各種所述引物分配在預(yù)定的位置上。
22.一種制品,所述制品由包裝材料和裝入所述包裝材料中的用于測定核酸的核苷酸序列的試劑構(gòu)成,其中所述試劑含有一個引物庫和/或一種DNA聚合酶,并且其中關(guān)于所述試劑可以用于測定核苷酸序列的說明示于貼在所述包裝材料上的標(biāo)簽或者所述包裝材料所附的說明中。
全文摘要
本發(fā)明涉及一種測定核酸的堿基序列的方法,其特征在于包括下述步驟在分別具有一個標(biāo)志序列的至少兩種引物、一種模板核酸特異性引物和DNA聚合酶存在下,擴(kuò)增所述模板核酸,其中所述具有標(biāo)志序列的引物分別在其5’末端一側(cè)具有所述標(biāo)志序列,而在3’末端一側(cè)具有一個由三個或三個以上核苷酸構(gòu)成的特定堿基序列;并且對在上述步驟中獲得的擴(kuò)增片段進(jìn)行直接測序。
文檔編號C12Q1/68GK1483082SQ01821389
公開日2004年3月17日 申請日期2001年10月30日 優(yōu)先權(quán)日2000年10月30日
發(fā)明者上森隆司, 山下裕兄, 外園成和, 佐藤好美, 向井博之, 淺田起代藏, 加藤郁之進(jìn), 之, 之進(jìn), 代藏, 兄, 和, 美 申請人:寶生物工程株式會社