国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基因鑒定特征(gis)分析的方法

      文檔序號(hào):426560閱讀:828來(lái)源:國(guó)知局
      專利名稱:基因鑒定特征(gis)分析的方法
      技術(shù)領(lǐng)域
      本發(fā)明總的涉及基因和轉(zhuǎn)錄表達(dá)的領(lǐng)域,具體地涉及通過(guò)對(duì)應(yīng)于轉(zhuǎn)錄本內(nèi)限定區(qū)的基因特征鑒定(GIS)連續(xù)分析大量轉(zhuǎn)錄本的方法。
      背景技術(shù)
      人基因組計(jì)劃最重要的目標(biāo)之一是提供人和模式生物體基因組的完整基因序列表?;虻耐暾蚪M注釋依賴于通過(guò)實(shí)驗(yàn)和計(jì)算機(jī)方法的全面轉(zhuǎn)錄本組(transcriptome)分析?;驈念^開始的預(yù)測(cè)必需通過(guò)實(shí)驗(yàn)數(shù)據(jù)來(lái)確認(rèn)。理想的解決方法是克隆全長(zhǎng)轉(zhuǎn)錄本并將其全部測(cè)序。該方法最近已經(jīng)獲得公認(rèn)(Strausberg,R.L.,等,1999,Science,286455-457)并已經(jīng)獲得了進(jìn)展(Jongeneel C V.,等,2003,ProcNatl Acad Sci USA.100,4702-4705)。然而,由于在生物體生命周期的不同發(fā)育階段中表達(dá)的轉(zhuǎn)錄本的復(fù)雜性和無(wú)限體積,所有不同轉(zhuǎn)錄本組的全部測(cè)序分析仍然是不現(xiàn)實(shí)的。
      為了避免這樣的困境,已經(jīng)發(fā)展了獲得表示全部轉(zhuǎn)錄本的部分序列的cDNA標(biāo)簽策略,并在過(guò)去十年中廣泛用于測(cè)定基因和表征轉(zhuǎn)錄本組。
      表達(dá)序列標(biāo)簽(EST)方法中,從5’和/或3’端將cDNA克隆測(cè)序(Adams,M.,等,1991,Science,252,1651-1656)。每個(gè)EST序列讀取將產(chǎn)生每個(gè)轉(zhuǎn)錄本平均500bp的標(biāo)簽。相同或重疊ESTs的數(shù)量將表明基因表達(dá)活性的相對(duì)水平。盡管EST在鑒定基因中是有效的,但是標(biāo)簽轉(zhuǎn)錄本組中的每個(gè)轉(zhuǎn)錄本是禁止性昂貴的。實(shí)際上,通常從數(shù)百萬(wàn)得到轉(zhuǎn)錄本克隆的cDNA文庫(kù)中獲得10,000或更少EST后就停止測(cè)序。
      為了提高測(cè)序和計(jì)數(shù)大量轉(zhuǎn)錄本的效率,基于轉(zhuǎn)錄本的短特征序列(14-20bp)對(duì)表示該基因是足夠特異性的事實(shí),發(fā)展了基因表達(dá)的連續(xù)分析(SAGE)(Velculescu,V.E.等,1995,Science,270,484-487;SahaS等,2002,Nature Biotechnology,20,508-12;US6,498,013;US6,383,743)和最近的大量平行特征測(cè)序(MPSS)技術(shù)(Mao C.,等,2000,Proc NatlAcad Sci USA,97,1665-1670;Brenner S,等,2000,Nature Biotechnology,18,630-634)。
      用實(shí)驗(yàn)方法,從cDNA提取短標(biāo)簽,每個(gè)轉(zhuǎn)錄本一個(gè)標(biāo)簽。這樣的短標(biāo)簽可以得到有效測(cè)序,通過(guò)級(jí)聯(lián)策略(對(duì)于SAGE)或?qū)τ贛PSS通過(guò)基于雜交的方法。例如,SAGE中,將多個(gè)標(biāo)簽連接成長(zhǎng)的DNA片段并克隆用于測(cè)序。每個(gè)SAGE序列讀出通??梢燥@示20-30個(gè)SAGE標(biāo)簽。低于10,000個(gè)讀數(shù)的合適SAGE測(cè)序工作將相當(dāng)大的覆蓋(重疊)轉(zhuǎn)錄本組。通過(guò)簡(jiǎn)單計(jì)數(shù)SAGE標(biāo)簽的數(shù)字頻率來(lái)測(cè)量轉(zhuǎn)錄本豐度。
      由于公眾數(shù)據(jù)庫(kù)中許多匯編的基因組序列的可獲得性,將短標(biāo)簽策略用于轉(zhuǎn)錄本組表征變成通用的(Jongeneel等,2003,Proc.Natl.Acad.Sci.USA 1004702-4705)。理論上,約20bp的短DNA標(biāo)簽可以特異性地作圖于復(fù)雜哺乳動(dòng)物基因組中的單個(gè)位置并唯一地代表整個(gè)轉(zhuǎn)錄本組范圍內(nèi)的轉(zhuǎn)錄本。然而,實(shí)際上,仍然存在大量在基因組中具有多個(gè)位置的“不確定的”SAGE標(biāo)簽(14-21bp)和MPSS標(biāo)簽(17bp),并被許多基因共享。受到可以切割長(zhǎng)于21bp的II型限制酶有效性的限制,目前SAGE方法沒(méi)有產(chǎn)生任何更長(zhǎng)的標(biāo)簽來(lái)提高特異性。
      此外,SAGE和MPSS方法在基因中間每個(gè)轉(zhuǎn)錄本只產(chǎn)生了單個(gè)特征。就轉(zhuǎn)錄本中標(biāo)簽的“內(nèi)在”性質(zhì)而言,這些方法只提供了有限的標(biāo)簽信息。
      因此,盡管它們?cè)跍y(cè)序效率中的用途,因其特異性的缺乏和隨后的不確定性如SAGE或MPSS方法的利用受到嚴(yán)重地破壞。
      本領(lǐng)域中存在對(duì)更有效方法的需要,該方法保持了測(cè)序效率,同時(shí)提高了標(biāo)簽策略對(duì)轉(zhuǎn)錄本組表征和幫助基因組注釋的用途。

      發(fā)明內(nèi)容
      通過(guò)提供每個(gè)核酸分子兩個(gè)標(biāo)簽(雙標(biāo)簽),本發(fā)明解決了上述的問(wèn)題,因此提高了標(biāo)簽表示核酸分子(例如基因)的特異性。從相同核酸分子的5’和3’端提取兩個(gè)標(biāo)簽,因此雙標(biāo)簽是更多信息的來(lái)反映核酸分子的結(jié)構(gòu)。決定性地,本發(fā)明提供了將相同核酸分子的5’和3’標(biāo)簽連接成單個(gè)雙標(biāo)簽單體的方法。因此,可以通過(guò)簡(jiǎn)單的測(cè)序分析容易地鑒定出表示核酸分子的5’和3’標(biāo)簽對(duì)。本發(fā)明可以用于鑒定新的基因、用于測(cè)量轉(zhuǎn)錄本組中的轉(zhuǎn)錄本豐度、用于注釋基因組序列,同時(shí)提高了測(cè)序效率。
      特別地,本發(fā)明提供了包括至少一個(gè)雙標(biāo)簽的分離寡核苷酸,其中雙標(biāo)簽包括兩個(gè)連接的第一個(gè)和第二個(gè)序列標(biāo)簽,其中第一個(gè)標(biāo)簽包括核酸分子的5’端序列和第二個(gè)標(biāo)簽包括3’端序列。
      本發(fā)明的寡核苷酸,進(jìn)一步包括雙標(biāo)簽兩側(cè)的至少兩個(gè)連接物,其中每個(gè)連接物包括至少一個(gè)限制位點(diǎn)。特別地,每個(gè)連接物至少包括標(biāo)簽近端的第一個(gè)限制位點(diǎn),其是不對(duì)稱限制位點(diǎn)(例如,歸巢(homing)限制內(nèi)切酶限制位點(diǎn),和II型限制位點(diǎn))和至少第二個(gè)限制位點(diǎn)。作為第二個(gè)或更多的限制位點(diǎn),可以使用本領(lǐng)域已知的任何限制位點(diǎn)。例如,BamHI。此外,可以使用不同于第一個(gè)限制位點(diǎn)的任何不對(duì)稱限制位點(diǎn)。然而,對(duì)于該酶的限制位點(diǎn),必需不存在于插入雙標(biāo)簽后的載體主鏈中。
      核酸分子可以是基因的全長(zhǎng)序列或其片段。例如,RNA、mRNA、基因組DNA、全長(zhǎng)cDNA或cDNA。
      雙標(biāo)簽的核苷酸數(shù)量可以改變。根據(jù)一實(shí)施方案,在至少一個(gè)限制酶存在下,通過(guò)拼接核酸分子的5’端和3’端獲得,且通過(guò)所用的限制酶來(lái)決定序列標(biāo)簽的大小。因此,雙標(biāo)簽的核苷酸數(shù)量根據(jù)所用的限制酶而改變。
      當(dāng)使用MmeI時(shí),該酶識(shí)別存在于想要縮減(reduce)的核酸分子兩側(cè)的兩個(gè)連接物中每個(gè)中的序列,但是在核酸分子內(nèi)切割形成包括19-21個(gè)核苷酸的標(biāo)簽。通過(guò)平端化并連接將兩個(gè)這樣的標(biāo)簽另外處理來(lái)形成包括34-38個(gè)核苷酸的雙標(biāo)簽。因此通過(guò)將相同核酸分子的5’端和3’端拼接在一起來(lái)獲得雙標(biāo)簽。
      本發(fā)明的雙標(biāo)簽可以是任何大小的,優(yōu)選12-60bp。
      寡核苷酸可以包括雙標(biāo)簽的串連體,例如,1至1000個(gè)雙標(biāo)簽。
      本發(fā)明還提供了含有本發(fā)明寡核苷酸的載體。特別地,載體包括至少一個(gè)核酸分子和核酸分子兩側(cè)的至少兩個(gè)連接物,其中每個(gè)連接物至少包括第一個(gè)限制位點(diǎn),其是不對(duì)稱限制位點(diǎn)(例如,不對(duì)稱限制位點(diǎn)是歸巢內(nèi)切酶限制位點(diǎn),或II型識(shí)別位點(diǎn))和至少第二個(gè)限制位點(diǎn)(例如,Bam HI),且載體的主鏈不包括不對(duì)稱限制位點(diǎn)和第二個(gè)或更多的限制位點(diǎn)。優(yōu)選的不對(duì)稱限制位點(diǎn)是II型限制位點(diǎn)MmeI。
      本發(fā)明還提供了具有SEQ ID NO18中所示序列的載體。
      本發(fā)明進(jìn)一步提供了cDNA文庫(kù),其中每個(gè)cDNA克隆包括至少一個(gè)本發(fā)明的寡核苷酸。
      根據(jù)另一方面,本發(fā)明還提供了制備包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸的方法,包括產(chǎn)生至少一個(gè)核酸分子;分離核酸分子或其片段的5’端和3’端;連接5’端和3’端產(chǎn)生至少一個(gè)雙標(biāo)簽。
      特別地,提供了制備包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸的方法,包括產(chǎn)生至少一個(gè)兩側(cè)有兩個(gè)連接物的核酸分子;分離核酸分子的5’端和3’端;連接5‘端和3’端產(chǎn)生至少一個(gè)寡核苷酸,該寡核苷酸包括至少一個(gè)兩側(cè)有兩個(gè)連接物的雙標(biāo)簽。
      希望以雙標(biāo)簽形式得到縮減的核酸分子可以是完整的核酸分子或核酸分子內(nèi)的一部分。
      核酸分子可以對(duì)應(yīng)于全長(zhǎng)基因或其片段。
      該方法可以進(jìn)一步包括測(cè)定至少一個(gè)雙標(biāo)簽的核苷酸序列來(lái)檢測(cè)基因表達(dá)的步驟。
      根據(jù)再一方面,本發(fā)明的方法可以進(jìn)一步包括步驟測(cè)定至少一個(gè)雙標(biāo)簽的序列;和將雙標(biāo)簽的核苷酸序列與包括基因組序列的數(shù)據(jù)庫(kù)相比較,借此鑒定匹配的5’和3’端序列。
      根據(jù)特定的實(shí)施方案,本發(fā)明提供了一種方法,包括產(chǎn)生至少一個(gè)兩側(cè)有兩個(gè)連接物的核酸分子,優(yōu)選全長(zhǎng)cDNA,,其中每個(gè)連接物包括至少一個(gè)限制位點(diǎn);通過(guò)加入至少一個(gè)識(shí)別限制位點(diǎn)的限制酶而拼接核酸分子的5’端和3’端來(lái)產(chǎn)生至少一個(gè)雙標(biāo)簽。
      優(yōu)選,每個(gè)連接物至少包括第一個(gè)限制位點(diǎn),其是不對(duì)稱限制位點(diǎn),和第二個(gè)限制位點(diǎn)。第二個(gè)限制位點(diǎn)也可以是不對(duì)稱限制位點(diǎn),其可以與第一個(gè)限制位點(diǎn)相同或不同。
      作為限制酶,可以使用任何有用的酶。例如,識(shí)別兩個(gè)不對(duì)稱識(shí)別位點(diǎn)的限制酶。
      不對(duì)稱位點(diǎn)可以是1)限制歸巢內(nèi)切酶可識(shí)別的歸巢內(nèi)切酶不對(duì)稱限制位點(diǎn)序列或ii)II型限制酶可識(shí)別的限制內(nèi)切酶不對(duì)稱切割位點(diǎn)序列。
      II型限制酶識(shí)別不對(duì)稱DNA序列并在固定位置(切割位點(diǎn))切割兩條DNA鏈,固定位置通常離識(shí)別位點(diǎn)數(shù)個(gè)堿基對(duì)。這些酶切割外部識(shí)別序列。
      根據(jù)特定實(shí)施方案,使用MmeI(與T4DNA聚合酶和T4DNA連接酶一起)進(jìn)行拼接步驟,并產(chǎn)生了兩側(cè)有兩個(gè)連接物的34-38核苷酸的雙標(biāo)簽,。
      根據(jù)再一方面,本發(fā)明任何實(shí)施方案的雙標(biāo)簽可以連接其他的雙標(biāo)簽來(lái)產(chǎn)生雙標(biāo)簽的串連體。例如,1至1000個(gè)雙標(biāo)簽。
      根據(jù)再一方面,提供了基因組作圖的方法,包括制備包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸,該雙標(biāo)簽包括兩個(gè)連接的第一個(gè)和第二個(gè)序列標(biāo)簽,其中第一個(gè)標(biāo)簽包括核酸分子的5’端序列,第二個(gè)標(biāo)簽包括3’端序列,核酸分子對(duì)應(yīng)于全長(zhǎng)基因或其片段;將至少一個(gè)雙標(biāo)簽的兩個(gè)標(biāo)簽中的每個(gè)作圖于基因組上;確定基因組圖譜上相應(yīng)基因的結(jié)構(gòu)區(qū)。
      根據(jù)再一方面,本發(fā)明提供了發(fā)現(xiàn)基因的方法,包括制備包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸,該雙標(biāo)簽包括兩個(gè)連接的第一個(gè)和第二個(gè)序列標(biāo)簽,其中第一個(gè)標(biāo)簽包括核酸分子的5’端,第二個(gè)標(biāo)簽包括3’端序列,核酸分子對(duì)應(yīng)全長(zhǎng)基因或其片段;將所獲得的至少一個(gè)雙標(biāo)簽與基因組圖譜和/或基因數(shù)據(jù)庫(kù)相比較;如果雙標(biāo)簽的5’和3’端標(biāo)簽與基因組序列相匹配,但在基因庫(kù)中不是已知的,那么所檢測(cè)的雙標(biāo)簽可能代表在給定基因組中的新基因。
      這樣的雙標(biāo)簽可以直接指導(dǎo)收集對(duì)應(yīng)于新鑒定基因的全長(zhǎng)核酸分子的方法。
      本發(fā)明另一方面是,獲得新的全長(zhǎng)cDNA和/或其他感興趣基因的方法,包括從全長(zhǎng)cDNA文庫(kù),制備包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸,該雙標(biāo)簽包括兩個(gè)連接的第一個(gè)和第二個(gè)序列標(biāo)簽,其中第一個(gè)標(biāo)簽包括全長(zhǎng)cDNA文庫(kù)的5’端序列,和第二個(gè)標(biāo)簽包括3’端序列,將所獲得的雙標(biāo)簽測(cè)序,優(yōu)選大量所獲得的雙標(biāo)簽;測(cè)定感興趣的雙標(biāo)簽(例如,基于生物的方面);從親本全長(zhǎng)cDNA文庫(kù)回收對(duì)應(yīng)于感興趣雙標(biāo)簽的全長(zhǎng)cDNA。
      此外,本發(fā)明還提供了定量基因轉(zhuǎn)錄活性的方法,包括從全長(zhǎng)cDNA文庫(kù),制備包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸,該雙標(biāo)簽包括兩個(gè)連接的第一個(gè)和第二個(gè)序列標(biāo)簽,其中第一個(gè)標(biāo)簽包括全長(zhǎng)cDNA的5’端序列,第二個(gè)標(biāo)簽包括3’端序列,將所獲得的寡核苷酸雙標(biāo)簽測(cè)序,優(yōu)選大量所獲得的雙標(biāo)簽;測(cè)定對(duì)應(yīng)于基因轉(zhuǎn)錄活性的所測(cè)序的雙標(biāo)簽頻率。


      圖1顯示了GIS分析實(shí)驗(yàn)流程圖(細(xì)菌轉(zhuǎn)化方法)。圖中,大寫或小寫字母的字母N、B、M、S各自表示限制酶Not I、Bam HI、Mme I和Sal I的限制(識(shí)別)位點(diǎn)。文字“Me”表示新合成的第一鏈cDNA的甲基化。
      圖2顯示了GIS分析實(shí)驗(yàn)流程圖(基于PCR的方法)。圖中,大寫或小寫字母的字母N、B、M、S各自表示限制酶Not I、Bam HI、Mme I和Sal I的限制(識(shí)別)位點(diǎn)。文字“Me”表示新合成的第一鏈cDNA的甲基化。
      圖3顯示了將轉(zhuǎn)錄本組作圖于基因組的GIS應(yīng)用。
      圖4是凝膠電泳圖,顯示了原始全長(zhǎng)cDNA克隆混合物的MmeI消化。泳道1原始超螺旋的質(zhì)粒制備物。泳道21kb DNA階梯。泳道3MmeI消化產(chǎn)物。箭頭顯示了所有的線性化標(biāo)簽質(zhì)粒的位置。
      圖5是涉及GIS雙標(biāo)簽制備的凝膠電泳圖。用BamHI消化GIS雙標(biāo)簽文庫(kù)的質(zhì)粒DNA。使用10%聚丙稀酰胺凝膠從載體分離和純化50bp的雙標(biāo)簽片段。泳道1DNA大小標(biāo)簽。泳道2-850bpGIS雙標(biāo)簽的形成。
      圖6是涉及通過(guò)PCR制備GIS雙標(biāo)簽的電泳凝膠。用BamHI消化GIS全長(zhǎng)cDNA文庫(kù)產(chǎn)生的含有雙標(biāo)簽的PCR片段。在10%的聚丙稀酰胺凝膠中從連接物臂中分離并純化50bp的雙標(biāo)簽片段。泳道1DNA大小標(biāo)簽。泳道2-1550bp GIS雙標(biāo)簽的大規(guī)模制備。
      圖7顯示了pGIS 1載體構(gòu)建體。
      圖8顯示了商業(yè)pZErO-1載體構(gòu)建體(Invitrogen)。顯示了多個(gè)測(cè)序/PCR引物結(jié)合位點(diǎn)(PMR003、PMR004、PMR011和PMR012)的位置。
      圖9顯示了在使用PCR的GIS文庫(kù)的多克隆上進(jìn)行的QC(質(zhì)量檢測(cè))典型實(shí)例。泳道1用作負(fù)對(duì)照的pZErO-1載體。M1kb+DNA階梯。泳道2-25隨機(jī)挑選的克隆。
      圖10顯示了pGIS1的雙鏈核苷酸序列。限制位點(diǎn)Not I和Sal I之間的片段是在克隆過(guò)程中除去的填充片段。其粗體和斜體字是突出顯示的。單鏈核酸序列還作為SEQ ID NO18記載。表示填充片段的部分位于核苷酸15至704之間(包括此兩個(gè)的核苷酸)。
      具體實(shí)施例方式
      本發(fā)明提供了基因鑒定特征(GIS)和GIS分析方法,其可以用于,例如,為了鑒定轉(zhuǎn)錄本表達(dá)的全部模式(轉(zhuǎn)錄本組)用于大量轉(zhuǎn)錄本的快速分析,用于選擇和/或構(gòu)建cDNA和全長(zhǎng)cDNA、標(biāo)簽測(cè)序、發(fā)現(xiàn)基因、基因組作圖和注釋??偟膩?lái)說(shuō),根據(jù)本發(fā)明的GIS和GIS分析方法極大地有助于通過(guò)實(shí)驗(yàn)方法來(lái)收集基因信息。
      對(duì)于本發(fā)明的目的,GIS意思是雙標(biāo)簽(也稱為GIS雙標(biāo)簽)或含有至少一個(gè)雙標(biāo)簽的寡核苷酸,其中雙標(biāo)簽包括期望得到縮減、“縮短“或代表的核酸分子的5’端(或5’端片段)和3’端(或3’端片段)。
      雙標(biāo)簽比其來(lái)源的或其代表的原始核酸分子短。優(yōu)選,雙標(biāo)簽必需比原始核酸分子短得多?!翱s短“的結(jié)果是,雙標(biāo)簽基本上包括原始核酸分子的5’端片段(也稱為5’標(biāo)簽)和3’端片段(也稱為3’標(biāo)簽)。因此,原始核酸分子在5’標(biāo)簽和3’標(biāo)簽之間和之內(nèi)的部分沒(méi)有包括于雙標(biāo)簽中。根據(jù)本發(fā)明的雙標(biāo)簽保留了原始核酸分子的最多信息特征,即,核酸的起點(diǎn)和終點(diǎn)的特征。因此通過(guò)將GIS標(biāo)簽作圖于基因組序列在表征轉(zhuǎn)錄本組和確定基因結(jié)構(gòu)中比SAGE或MPSS方法更有特異性和更精確。
      因此,本發(fā)明提供了包括至少一個(gè)雙標(biāo)簽的分離寡核苷酸,其中雙標(biāo)簽包括兩個(gè)連接的第一個(gè)和第二個(gè)序列標(biāo)簽,其中第一個(gè)標(biāo)簽包括核酸分子或其片段的5’端序列,第二個(gè)標(biāo)簽包括3’端序列。
      本發(fā)明的寡核苷酸可以進(jìn)一步包括雙標(biāo)簽兩側(cè)的兩個(gè)連接物,其中每個(gè)連接物包括至少一個(gè)限制位點(diǎn)(參見圖1和圖2)。特別地,每個(gè)連接物至少包括第一個(gè)限制位點(diǎn),其是不對(duì)稱限制位點(diǎn),和至少第二個(gè)鄰近的限制位點(diǎn)。因此,每個(gè)連接物中存在的限制位點(diǎn)數(shù)目可以是兩個(gè)或更多。不對(duì)稱限制位點(diǎn)是核苷酸序列,其中切割位點(diǎn)通常區(qū)別于識(shí)別位點(diǎn)。不對(duì)稱限制位點(diǎn)的實(shí)例是歸巢內(nèi)切酶不對(duì)稱限制位點(diǎn),和II型(和II類)限制位點(diǎn)。以下記載了可能的不對(duì)稱限制位點(diǎn)和對(duì)應(yīng)的識(shí)別這樣不對(duì)稱位點(diǎn)的限制酶的列表。例如,II型限制酶識(shí)別不對(duì)稱DNA序列(識(shí)別位點(diǎn))并在固定位置(切割位點(diǎn))切割兩條DNA鏈,固定位置通常離識(shí)別位點(diǎn)幾個(gè)堿基對(duì)。因此,這些酶外部切割識(shí)別序列。第二個(gè)和更多限制位點(diǎn)的實(shí)例是BamHI。這第二個(gè)限制位點(diǎn)是用于隨后分離然后可以連接在一起形成串連體的雙標(biāo)簽集合的目的。
      想要將其縮減(縮短)的原始核酸分子可以是任何性質(zhì)的、任何修飾的或任何合成的核酸分子。還可以是任何大小的。核酸分子可以是基因(全長(zhǎng)基因)或其片段。核酸可以是RNA、mRNA、基因組DNA、全長(zhǎng)cDNA或cDNA或其片段。
      雙標(biāo)簽還可以是全部化學(xué)合成的,通過(guò)包括雙標(biāo)簽想要代表的核酸分子的5’端和3’端。
      想要縮減的分子還可以是核酸分子內(nèi)的部分或片段。因此,可以使用識(shí)別想要縮減片段兩側(cè)的限制位點(diǎn)的限制酶。在制備核酸分子例如cDNA或全長(zhǎng)cDNA的過(guò)程中,可以將所需的限制位點(diǎn)放在合適的位置。
      根據(jù)特定方面,期望得到縮減的核酸是全長(zhǎng)cDNA??梢愿鶕?jù)本領(lǐng)域已知的任何方法來(lái)制備全長(zhǎng)cDNA。例如參見,帽子捕獲方法,例如,Carninci等,1996,Genomics,Vol.37,327-336;US 6,143,528;Edery等,1995,Mol.Cell.Biol.,Vol.15,No.6,3363-3371。
      本領(lǐng)域技術(shù)人員將知道其他捕獲系統(tǒng),例如,可以使用那些基于生物素/鏈霉抗生物素、地高辛/抗地高辛的用于分離全長(zhǎng)cDNA。
      可以根據(jù)本領(lǐng)域已知的任何技術(shù)來(lái)制備雙標(biāo)簽。例如,通過(guò)任何化學(xué)反應(yīng)切割原始核酸分子并連接所獲得的5’和3’端來(lái)形成雙標(biāo)簽。
      想要將其縮減的核酸分子,優(yōu)選包括分子兩側(cè)的兩個(gè)連接物而制得的,可以插入載體中。特定實(shí)施方案中,每個(gè)連接物包括至少一個(gè)限制位點(diǎn),優(yōu)選包括至少第一個(gè)限制位點(diǎn),其包括不對(duì)稱限制位點(diǎn),和第二限制位點(diǎn)。因此,所用的載體中,重要的是載體的主鏈不包括存在于連接物中的限制位點(diǎn)。
      因此,制得核酸分子的文庫(kù)(例如,全長(zhǎng)cDNA的文庫(kù))。
      優(yōu)選,通過(guò)使用識(shí)別待縮減核酸分子兩側(cè)的限制位點(diǎn)的限制酶,將核酸分子拼接成雙標(biāo)簽或包括雙標(biāo)簽的寡核苷酸。因此,將識(shí)別位點(diǎn)放置于期望縮減的核酸分子或其片段的5’端上游和3’端下游(優(yōu)選放入連接物中)。因此,通過(guò)拼接獲得的寡核苷酸包括雙標(biāo)簽兩側(cè)的兩個(gè)連接物。每個(gè)連接物包括至少一個(gè)限制位點(diǎn)。優(yōu)選,包括至少第一個(gè)限制位點(diǎn),其是不對(duì)稱位點(diǎn)(例如,II型限制位點(diǎn),如MmeI),和至少第二個(gè)限制位點(diǎn)(可以使用任何已知的限制位點(diǎn),例如BamHI)。
      形成雙標(biāo)簽的5’標(biāo)簽和3’標(biāo)簽可以具有相同或不同的大小。優(yōu)選,它們具有相同數(shù)目的核苷酸。
      雙標(biāo)簽可以是任何大小的,但是對(duì)于衍生其的親本序列的大小需要是有意義的和有利的。通過(guò)基因組復(fù)雜性來(lái)決定標(biāo)簽或雙標(biāo)簽的優(yōu)選大小。對(duì)于細(xì)菌基因組,約8bp至約16bp的標(biāo)簽就足夠了,而對(duì)于復(fù)雜的基因組如人基因組,可以考慮16-20bp(或者換句話說(shuō),32-40bp的雙標(biāo)簽)。通常,雙標(biāo)簽的大小為約12-60bp。
      對(duì)于本發(fā)明應(yīng)用的目的,術(shù)語(yǔ)5’末端、5’端和5’標(biāo)簽相互之間是等同的并可以交替使用。同樣,術(shù)語(yǔ)3’末端、3’端和3’標(biāo)簽相互之間是等同的并可以交替使用。在想要縮減或代表的原始核酸分子或核酸分子內(nèi)的一部分中,5’端和3’端各自代表離分子末端部分最接近的和離分子中間部分最遠(yuǎn)的片段或部分。
      根據(jù)一方面,包括于雙標(biāo)簽中的5’標(biāo)簽和3’標(biāo)簽是通過(guò)各自最接近想要縮減或代表的核酸分子或其部分的5’端和3’端的限制酶切割的分子片段。因此,通過(guò)所用的限制酶來(lái)決定雙標(biāo)簽的大小。因此,本發(fā)明涉及包括至少一個(gè)雙標(biāo)簽的寡核苷酸,其中在至少一個(gè)限制酶存在下,通過(guò)拼接核酸分子的5’端和3’端來(lái)獲得雙標(biāo)簽,該限制酶識(shí)別核酸分子兩側(cè)的限制位點(diǎn)。因此,通過(guò)所用的限制酶來(lái)決定序列標(biāo)簽的大小。
      當(dāng)制備核酸分子例如全長(zhǎng)cDNA時(shí),在想要縮減或代表的片段的5’端和3’端兩側(cè)的插入所需限制位點(diǎn)。通過(guò)在5’端和3’端兩側(cè)插入所需限制位點(diǎn)來(lái)構(gòu)建全長(zhǎng)cDNA的實(shí)例顯示于圖1和圖2中。然后制得全長(zhǎng)cDNA文庫(kù),接著隨后制得GIS雙標(biāo)簽文庫(kù)。
      例如,對(duì)于制備根據(jù)本發(fā)明雙標(biāo)簽的目的,可以使用識(shí)別不對(duì)稱限制位點(diǎn)的限制酶。尤其是II型酶,例如MmeI。
      例如,可以引入不對(duì)稱位點(diǎn),用于本發(fā)明目的的不對(duì)稱位點(diǎn)序列是i)通過(guò)限制歸巢內(nèi)切酶識(shí)別的兩個(gè)歸巢內(nèi)切酶不對(duì)稱限制(識(shí)別)位點(diǎn)序列或ii)通過(guò)II型限制酶識(shí)別的限制內(nèi)切酶不對(duì)稱切割位點(diǎn)序列。
      歸巢內(nèi)切酶有出售并描述于New England Biolabs,Inc.中;不對(duì)稱位點(diǎn)序列的描述還可以在New England Biolabs Catalog中獲得。這些歸巢內(nèi)切酶不對(duì)稱限制(識(shí)別)位點(diǎn)序列可以為18至39bp。然而,本發(fā)明中的限制位點(diǎn)序列不受限于那些序列和這些大小。優(yōu)選,能夠切割不對(duì)稱位點(diǎn)序列的限制歸巢內(nèi)切酶選自I-CeuI、PI-SceI、PI-PspI或I-SceI的。然而上述的列舉不是窮舉。本領(lǐng)域已知的其他歸巢內(nèi)切酶和將來(lái)發(fā)現(xiàn)的那些包括于本發(fā)明的范圍內(nèi)。
      II型限制酶的實(shí)例包括AarI、AceIII、AloI、BaeI、Bbr7I、BbvI、BbvII、BccI、Bce83I、BceAI、BcefI、BcgI、BciVI、BfiI、BinI、BpII、BsaXI、BscAI、BseMII、BseRI、BsgI、BsmI、BsmAI、BsmFI、Bsp24I、BspCNI、BspMI、BsrI、BsrDI、BstF5I、BtgZI、BtsI、CjeI、CjePI、EciI、Eco31I、Eco57I、Eco57MI、Esp3I、FaII、FauI、FokI、GsuI、HaeIV、HgaI、Hin4I、HphI、HpyAV、Ksp632I、MboII、MlyI、MmeI、MnII、PleI、PpiI、Psrl、RleAI、SapI、SfaNI、SspD5I、Sth132I、StsI、TaqII、TspDTI、TspGWI、TspRI和Tth111II(目錄位于Rebase Enzymes的網(wǎng)點(diǎn)http://rebase.neb.com/cgi-bin/outsidelist;還參見Szybalski,W.,1985,Gene,40169)。然而上述的列舉不是窮舉。本領(lǐng)域已知的其他II型酶和將來(lái)發(fā)現(xiàn)的那些包括于本發(fā)明的范圍內(nèi)。
      幾種II類限制酶的識(shí)別位點(diǎn)和切割位點(diǎn)的實(shí)例是(括號(hào)內(nèi)的是識(shí)別位點(diǎn)和切割位點(diǎn))BbvI(GCAGC 8/12)、HgaI(GACGC 5/10)、BsmFI(GGGAC 10/14)、SfaNI(GCATC 5/9)和BspI(ACCTGC 4/8)。
      為了形成雙標(biāo)簽的所聯(lián)體,可以將本發(fā)明的雙標(biāo)簽方便地連接或結(jié)合。因此,本發(fā)明涉及包括1至1000個(gè)雙標(biāo)簽的寡核苷酸,特別地1至200個(gè),更特別地8至20個(gè)雙標(biāo)簽。當(dāng)雙標(biāo)簽是串連體的時(shí)候,將獲得更多的信息,因?yàn)楣押塑账帷⑤d體或克隆包括更多雙標(biāo)簽。因此,雙標(biāo)簽的連接使得可以通過(guò)將單個(gè)載體或克隆中的多個(gè)雙標(biāo)簽測(cè)序以連續(xù)方式來(lái)有效分析核酸分子,如全長(zhǎng)cDNA。
      可以在連接之前或之后,將寡核苷酸、雙標(biāo)簽或雙標(biāo)簽的串連體插入載體中。
      根據(jù)一方面,將包括雙標(biāo)簽的寡核苷酸擴(kuò)增。例如,通過(guò)使用PCR或任何其他已知的擴(kuò)增方法。因此,使用對(duì)應(yīng)于載體內(nèi)特定片段的合適PCR引物。這樣的片段在包括雙標(biāo)簽和連接物的寡核苷酸的兩側(cè)??梢栽谶B接反應(yīng)(自環(huán)化)時(shí)直接進(jìn)行PCR來(lái)獲得短的(例如200bp)PCR產(chǎn)物(參見圖2中的PCR方法)。然后使用識(shí)別至少第二個(gè)限制位點(diǎn)(連接物內(nèi))的酶來(lái)切割這些含有所需GIS雙標(biāo)簽的PCR產(chǎn)物來(lái)產(chǎn)生所需的短的粘性雙標(biāo)簽。作為識(shí)別第二個(gè)和更多限制位點(diǎn)的限制酶,例如可以使用BamHI,并產(chǎn)生50bp的粘性雙標(biāo)簽。該擴(kuò)增步驟的優(yōu)勢(shì)是產(chǎn)生了GIS雙標(biāo)簽而避免了產(chǎn)生GIS雙標(biāo)簽文庫(kù)擴(kuò)增的需要,其可以通過(guò)不轉(zhuǎn)化自環(huán)化標(biāo)簽的質(zhì)粒來(lái)避免。然后從載體切除(該實(shí)施例中,通過(guò)用BamHI消化)擴(kuò)增的寡核苷酸并連接于長(zhǎng)鏈DNA或RNA中,用于隨后的克隆和序列分析(參見圖1和圖2)。
      作為特定方面,本發(fā)明公開了cDNA文庫(kù),其中寡核苷酸包括至少一個(gè)雙標(biāo)簽,且其中雙標(biāo)簽包括34-38個(gè)核苷酸且是通過(guò)拼接全長(zhǎng)cDNA或其片段的5’端核苷酸和3’端核苷酸而獲得的。
      根據(jù)本發(fā)明的雙標(biāo)簽文庫(kù)代表包括原始核酸分子文庫(kù)的。例如,當(dāng)包括核酸分子的文庫(kù)是全長(zhǎng)cDNA文庫(kù)時(shí),雙標(biāo)簽文庫(kù)代表全長(zhǎng)雙標(biāo)簽文庫(kù)的。每個(gè)雙標(biāo)簽克隆包括足夠的表征特定全長(zhǎng)克隆的信息。更重要的,本發(fā)明的雙標(biāo)簽包括原始全長(zhǎng)cDNA的5’端和3’端。因此,雙標(biāo)簽代表全長(zhǎng)cDNA結(jié)構(gòu)的。
      因此,足以將雙標(biāo)簽文庫(kù)的雙標(biāo)簽克隆測(cè)序并分析。在發(fā)現(xiàn)感興趣雙標(biāo)簽的情況中,可以從全長(zhǎng)cDNA文庫(kù)選擇并制備相應(yīng)的全長(zhǎng)cDNA,例如通過(guò)PCR或通過(guò)RT-PCR直接從目標(biāo)RNA樣品制得。
      本發(fā)明提供了制備包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸的方法,包括產(chǎn)生至少一個(gè)核酸分子;分離核酸分子或其片段的5’端和3’端;連接5’端和3’端來(lái)形成至少一個(gè)雙標(biāo)簽。
      特別地,本發(fā)明提供了制備包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸的方法,包括產(chǎn)生至少一個(gè)核酸分子,兩側(cè)有兩個(gè)連接物;分離核酸分子的5’端和3’端;和連接5’端和3’端來(lái)產(chǎn)生至少一個(gè)寡核苷酸,該寡核苷酸包括至少一個(gè)兩側(cè)有連接物的雙標(biāo)簽。
      該方法進(jìn)一步包括將寡核苷酸插入載體中的步驟,該寡核苷酸包括至少一個(gè)兩側(cè)有兩個(gè)連接物的雙標(biāo)簽。
      想要縮短和代表的核酸分子可以是RNA、mRNA、基因組DNA、全長(zhǎng)cDNA或cDNA。
      核酸分子可以是基因的全長(zhǎng)序列或其片段。
      本發(fā)明的方法進(jìn)一步包括測(cè)定至少一個(gè)雙標(biāo)簽的核苷酸序列來(lái)檢測(cè)基因表達(dá)的步驟。
      該方法可以進(jìn)一步包括步驟測(cè)定至少一個(gè)雙標(biāo)簽的序列;和將雙標(biāo)簽的序列與包括基因組序列的數(shù)據(jù)庫(kù)相比較,借此鑒定匹配的5’和3’端序列。
      更特別地,本發(fā)明涉及一種方法,包括
      產(chǎn)生至少一個(gè)兩側(cè)有兩個(gè)連接物的核酸分子,例如,全長(zhǎng)cDNA,其中每個(gè)連接物包括至少一個(gè)限制位點(diǎn)通過(guò)加入至少一個(gè)識(shí)別限制(識(shí)別)位點(diǎn)的限制酶拼接核酸分子或其片段的5’端和3’端來(lái)產(chǎn)生至少一個(gè)雙標(biāo)簽。
      可以使用本領(lǐng)域已知的任何限制(識(shí)別)位點(diǎn)。識(shí)別核酸分子內(nèi)至少一個(gè)限制位點(diǎn)的限制酶以及可以使用的酶是本領(lǐng)域技術(shù)人員清楚的(參見,例如,Current Protocols in Molecular Biology,Vol.2,1995,編輯Ausubel等,Greene Publish.Assco.&amp; Wiley Interscience,Unit3.1.15;New England Biolabs Catalog,1995)。
      例如,限制位點(diǎn)可以是不對(duì)稱限制(識(shí)別)位點(diǎn)。
      不對(duì)稱限制位點(diǎn)是i)限制歸巢內(nèi)切酶識(shí)別的歸巢內(nèi)切酶不對(duì)稱限制位點(diǎn)序列和ii)II型限制酶識(shí)別的限制內(nèi)切酶不對(duì)稱切割位點(diǎn)序列。
      II型限制酶選自AarI、AceIII、AloI、BaeI、Bbr7I、BbvI、BbvII、BccI、Bce83I、BceAI、BcefI、BcgI、BciVI、BfiI、BinI、BpII、BsaXI、BscAI、BseMII、BseRI、BsgI、BsmI、BsmAI、BsmFI、Bsp24I、BspCNI、BspMI、BsrI、BsrDI、BstF5I、BtgZI、BtsI、CjeI、CjePI、EciI、Eco31I、Eco57I、Eco57MI、Esp3I、FaII、FauI、FokI、GsuI、HaeIV、HgaI、Hin4I、HphI、HpyAV、Ksp632I、MboII、MlyI、MmeI、MnII、PleI、PpiI、Psrl、RleAI、SapI、SfaNI、SspD5I、Sth132I、StsI、TaqII、TspDTI、TspGWI、TspRI和Tth111II(參見位于Rebase Enzymes網(wǎng)點(diǎn)http://rebase.neb.com/cgi-bin/outsidelist的目錄;還參見Szybalski,W.,1985,Gene,40169)。然而上述的列舉不是窮舉。本領(lǐng)域已知的其他II型酶和后來(lái)發(fā)現(xiàn)的那些包括于本發(fā)明的范圍內(nèi)。
      識(shí)別歸巢內(nèi)切酶不對(duì)稱位點(diǎn)的酶選自I-CeuI、PI-SceI、PI-PspI和I-SceI。然而上述的列舉不是窮舉。本領(lǐng)域已知的其他歸巢內(nèi)切酶和后來(lái)發(fā)現(xiàn)的那些包括于本發(fā)明的范圍內(nèi)。
      根據(jù)本發(fā)明特別優(yōu)選的標(biāo)簽酶是切割其識(shí)別位點(diǎn)3’的20/18核苷酸以形成3’懸垂端的酶,如MmeI。
      還可以使用人造限制內(nèi)切酶??梢酝ㄟ^(guò)蛋白質(zhì)工程制得這些內(nèi)切酶。例如,通過(guò)插入來(lái)工程化內(nèi)切酶FokI,使其在DNA底物的兩個(gè)鏈上離其識(shí)別位點(diǎn)更遠(yuǎn)一個(gè)核苷酸來(lái)切割。參見Li和Chandrasegaran,Proc.Nat.Acad.Sciences USA 902764-8,1993??梢詫⑦@樣的技術(shù)應(yīng)用至制備具有所需識(shí)別序列和所需識(shí)別位點(diǎn)至切割位點(diǎn)距離的限制內(nèi)切酶。
      該方法進(jìn)一步包括產(chǎn)生雙標(biāo)簽的串連體。該串連體通常為約1至約1000個(gè)雙標(biāo)簽,尤其是1至200個(gè)雙標(biāo)簽,更特別地8至20個(gè)雙標(biāo)簽。盡管這些是優(yōu)選的串連體,將認(rèn)識(shí)到可以連接的雙標(biāo)簽數(shù)目取決于單個(gè)標(biāo)簽的長(zhǎng)度,且是本領(lǐng)域技術(shù)人員容易決定的而不需要過(guò)度的實(shí)驗(yàn)。串連體形成后,將多個(gè)標(biāo)簽克隆進(jìn)載體中用于序列分析,或通過(guò)本領(lǐng)域技術(shù)人員已知的方法可以不需要克隆而將雙標(biāo)簽或串連體直接測(cè)序。
      通過(guò)標(biāo)準(zhǔn)方法將存在于特定克隆中的雙標(biāo)簽測(cè)序(參見,例如,Current Protocols in Molecular Biology,上文,Unit 7),人工或使用自動(dòng)化方法。
      如上所述,該方法包括將包括至少一個(gè)雙標(biāo)簽的寡核苷酸引入載體中。
      術(shù)語(yǔ)載體或重組載體,指的是本領(lǐng)域通過(guò)插入或引入雙標(biāo)簽遺傳序列操作的已知質(zhì)粒、病毒或其他載體。這樣的載體含有有助于有效轉(zhuǎn)錄的啟動(dòng)子序列。載體通常含有復(fù)制起點(diǎn)、啟動(dòng)子以及使得轉(zhuǎn)化細(xì)胞可以表型選擇的特定基因。適用于本發(fā)明的載體包括例如,pBlueScript(Stratagene,La Jolla,CA);pBC、pZErO-1(Invitrogen,Carlsbad,CA)(參見圖8)和pGEM3z(Promega,Madison,WI)或其修飾的載體以及本領(lǐng)域技術(shù)人員已知的其他相似載體。作為特定的實(shí)施方案,pGEM3z載體已經(jīng)得到了修飾,并稱為pGIS1(還參見圖7和10)。pGEM載體也已經(jīng)公開于US 4,766,072中,在此引入作為參考。
      為了產(chǎn)生親本核酸分子,例如全長(zhǎng)文庫(kù)和GIS雙標(biāo)簽文庫(kù),使用合適的載體。因此,本發(fā)明范圍內(nèi)的合適載體是插入親本核酸分子后載體主鏈不包括與親本核酸分子或雙標(biāo)簽兩側(cè)連接物中所含相同限制位點(diǎn)的那些。優(yōu)選,本發(fā)明提供了主鏈(不是親本核酸分子插入過(guò)程中除去的填充片段)不包括連接物中所含的不對(duì)稱限制位點(diǎn)和第二個(gè)或更多的限制位點(diǎn)的載體。特別地,載體不包括連接物中所含的至少不對(duì)稱II限制位點(diǎn)(例如,II型限制位點(diǎn))和至少第二個(gè)或更多的限制位點(diǎn)。更優(yōu)選,載體主鏈(不是親本核酸分子插入過(guò)程中除去的填充片段)不包括MmeI和BamHI。
      這樣填充片段外的任何片段中不包括MmeI的實(shí)例是圖7和圖10中所示的載體pGIS1。pGIS1中,通過(guò)突變來(lái)刪除MmeI識(shí)別位點(diǎn)。序列顯示于圖10和SEQ ID NO18中。圖10中,位點(diǎn)Not I和Sal I之間的填充片段是突出顯示的。本發(fā)明還涉及包括根據(jù)本發(fā)明任何實(shí)施方案的寡核苷酸的pGIS載體。
      還可以將本發(fā)明的寡核苷酸、雙標(biāo)簽或串連體連接入載體中,用于測(cè)序。
      可以將其中克隆了雙標(biāo)簽的載體轉(zhuǎn)移至合適的宿主細(xì)胞中。宿主細(xì)胞是其中載體可以繁殖及表達(dá)其DNA的細(xì)胞。術(shù)語(yǔ)還包括主體宿主細(xì)胞的任何后代。理解由于復(fù)制過(guò)程中存在突變,所有后代可以與親本細(xì)胞不同。然而,當(dāng)使用術(shù)語(yǔ)宿主細(xì)胞時(shí)包括這樣的后代。穩(wěn)定的轉(zhuǎn)移方法,意思是將外源DNA連續(xù)維持于宿主中,是本領(lǐng)域已知的。
      可以通過(guò)如本領(lǐng)域技術(shù)人員公知的常規(guī)技術(shù)來(lái)進(jìn)行含有雙標(biāo)簽的載體轉(zhuǎn)化宿主細(xì)胞。當(dāng)宿主細(xì)胞是原核的時(shí)候,如E.coli,能夠攝入DNA的感受態(tài)細(xì)胞可以使用本領(lǐng)域公知程序,從指數(shù)生長(zhǎng)期后收集細(xì)胞并通過(guò)隨后的CaCl2方法處理而制得?;蛘撸褂肕gCl2或RbCl。還可以通過(guò)電穿孔或其他本領(lǐng)域常用的方法來(lái)進(jìn)行轉(zhuǎn)化。
      該實(shí)施方案顯示于圖1和圖2中。根據(jù)該實(shí)施方案,本發(fā)明的方法包括產(chǎn)生至少一個(gè)核酸分子,該核酸分子包括兩側(cè)有兩個(gè)連接物的全長(zhǎng)cDNA分子;在全長(zhǎng)cDNA5’端和3’端的兩側(cè)每個(gè)連接物包括MmeI限制(識(shí)別)位點(diǎn)和另一個(gè)限制位點(diǎn),其可以是BanHI。
      拼接全長(zhǎng)cDNA的5’端和3’端來(lái)產(chǎn)生至少一個(gè)雙標(biāo)簽,包括用形成3’懸垂標(biāo)簽?zāi)┒说腗meI切割全長(zhǎng)cDNA,并將兩個(gè)5’和3’端標(biāo)簽連接來(lái)產(chǎn)生雙標(biāo)簽。
      如圖1和圖2中所示,使用限制酶可以留下包括由幾個(gè)核苷酸構(gòu)成的短懸垂端(也稱為粘性末端或粘著末端)的5’和3’雙鏈末端。特別地,通過(guò)使用MmeI,產(chǎn)生的5’和3’端包括每個(gè)20bp的雙鏈和作為3’懸垂端的兩個(gè)核苷酸。接著將兩個(gè)標(biāo)簽截成平端并分子內(nèi)自連接來(lái)產(chǎn)生含有親本轉(zhuǎn)錄本5’端18bp特征序列和另一3’端18bp特征序列的標(biāo)簽質(zhì)粒。然而,MmeI切割的核苷酸數(shù)目是可變的。因此,使用MmeI獲得的雙標(biāo)簽可以是34-38bp。
      已經(jīng)用于制備全長(zhǎng)cDNA文庫(kù)的載體是pGIS1。如上所述,pGIS1在其主鏈不含有MmeI限制位點(diǎn),而不是NotI和SalI之間的填充片段中,該填充片段在隨后在文庫(kù)產(chǎn)生過(guò)程中被除去。
      從GIS雙標(biāo)簽文庫(kù)切除包括兩側(cè)有連接物的雙標(biāo)簽的寡核苷酸并連接到其他包括雙標(biāo)簽和連接物的寡核苷酸來(lái)形成雙標(biāo)簽的串連體。然后將雙標(biāo)簽的串連體克隆至載體中用于測(cè)序分析的。
      從GIS雙標(biāo)簽文庫(kù)中切除寡核苷酸之前,可以從連接(自環(huán)化)反應(yīng)混合物直接擴(kuò)增,例如通過(guò)使用合適引物的PCR。然后將回收的包括雙標(biāo)簽和連接物的擴(kuò)增的寡核苷酸連接到另一包括雙標(biāo)簽和連接物的寡核苷酸來(lái)形成雙標(biāo)簽的串連體。然后將雙標(biāo)簽的串連體克隆至載體中用于測(cè)序分析的。
      該方法可以進(jìn)一步包括步驟測(cè)定雙標(biāo)簽的核苷酸序列;檢測(cè)基因表達(dá);和/或?qū)⑺鶞y(cè)定的核苷酸序列與包括基因組序列的數(shù)據(jù)庫(kù)相比較,借此鑒定匹配的5’和3’端序列。
      特別地,至少一個(gè)雙標(biāo)簽包括36個(gè)寡核苷酸,且第一個(gè)和第二個(gè)序列標(biāo)簽每個(gè)包括18個(gè)核苷酸。
      如上所述,根據(jù)本發(fā)明的雙標(biāo)簽包括想要縮減和代表的核酸分子的“特征“(由5’和3’端構(gòu)成)??梢詫⑦@樣文庫(kù)的雙標(biāo)簽,優(yōu)選cDNA雙標(biāo)簽,連接并測(cè)序。雙標(biāo)簽中轉(zhuǎn)錄本的匹配5’和3’特征序列(標(biāo)簽)描繪了轉(zhuǎn)錄本的起點(diǎn)和終點(diǎn)??梢栽跀?shù)據(jù)分析過(guò)程中將雙標(biāo)簽分裂成兩個(gè)標(biāo)簽并在裝配有基因組序列的染色體上合理距離內(nèi)的特定片段中頭-對(duì)-頭作圖。這兩個(gè)標(biāo)簽之間的DNA序列是預(yù)測(cè)基因的包括外顯子和內(nèi)含子全部結(jié)構(gòu)內(nèi)容。
      使用本發(fā)明雙標(biāo)簽的基因組作圖概述顯示于圖3中。
      合適的測(cè)序運(yùn)行可以產(chǎn)生足夠的數(shù)據(jù)來(lái)表征轉(zhuǎn)錄本組,不僅通過(guò)測(cè)定轉(zhuǎn)錄本豐度的水平而且通過(guò)使用揭示的5’和3’片段來(lái)限定轉(zhuǎn)錄本的結(jié)構(gòu)。這導(dǎo)致比EST測(cè)序有效約高于20倍。
      因?yàn)殡p標(biāo)簽的標(biāo)簽可以與任何基因組例如人基因組序列匹配,然后可以基于匹配的基因組序列來(lái)設(shè)計(jì)PCR和RT-PCR引物。
      因此,本發(fā)明的再一方面涉及基因組作圖的方法,包括制備包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸,該雙標(biāo)簽包括兩個(gè)連接的第一個(gè)和第二個(gè)序列標(biāo)簽,其中第一個(gè)標(biāo)簽包括核酸分子的5’端序列,第二個(gè)標(biāo)簽包括3’端序列,核酸分子對(duì)應(yīng)于全長(zhǎng)基因或其片段;將至少一個(gè)雙標(biāo)簽的兩個(gè)標(biāo)簽的每個(gè)作圖于基因組上;限定基因組圖譜上相應(yīng)基因的結(jié)構(gòu)片段。
      此外,本發(fā)明的一方面還提供了發(fā)現(xiàn)基因的方法,包括制備包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸,該雙標(biāo)簽包括兩個(gè)連接的第一個(gè)和第二個(gè)序列標(biāo)簽,其中第一個(gè)標(biāo)簽包括核酸分子的5’端序列,第二個(gè)標(biāo)簽包括3’端序列,核酸分子對(duì)應(yīng)于全長(zhǎng)基因或其片段;將所獲得的至少一個(gè)雙標(biāo)簽與基因組圖譜和/或基因數(shù)據(jù)庫(kù)相比較;檢測(cè)基因組圖譜上與5’和3’端標(biāo)簽匹配,但同時(shí)檢測(cè)一個(gè)或多個(gè)在已知基因數(shù)據(jù)庫(kù)中沒(méi)有匹配的。
      該方法進(jìn)一步包括收集對(duì)應(yīng)于新發(fā)現(xiàn)基因的全長(zhǎng)核酸分子的步驟。
      本發(fā)明還提供了收集全長(zhǎng)cDNA的方法,包括從全長(zhǎng)cDNA文庫(kù)制備包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸,該雙標(biāo)簽包括兩個(gè)連接的第一個(gè)和第二個(gè)序列標(biāo)簽,其中第一個(gè)標(biāo)簽包括全長(zhǎng)cDNA的5’端序列和第二個(gè)標(biāo)簽包括3’端序列;將所獲得的寡核苷酸雙標(biāo)簽測(cè)序;測(cè)定感興趣的雙標(biāo)簽;和從全長(zhǎng)cDNA文庫(kù)收集對(duì)應(yīng)于感興趣雙標(biāo)簽的全長(zhǎng)cDNA。
      本發(fā)明還提供了定量基因轉(zhuǎn)錄活性的方法,包括從全長(zhǎng)cDNA文庫(kù)制備包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸,該雙標(biāo)簽包括兩個(gè)連接的第一個(gè)和第二個(gè)序列標(biāo)簽,其中第一個(gè)標(biāo)簽包括全長(zhǎng)cDNA的5’端序列,和第二個(gè)標(biāo)簽包括3’端序列;將所獲得的寡核苷酸雙標(biāo)簽測(cè)序;測(cè)定對(duì)應(yīng)于基因轉(zhuǎn)錄活性的所測(cè)序的雙標(biāo)簽頻率。
      目前已經(jīng)概括地描述了本發(fā)明,通過(guò)參考以下通過(guò)說(shuō)明性方式提供而不是來(lái)限制本發(fā)明的實(shí)施例,將更容易理解本發(fā)明。
      實(shí)施例以下列出了實(shí)施例中所用的用于cDNA合成的GIS寡核苷酸、一般的50bp粘性雙標(biāo)簽的結(jié)構(gòu)、用于構(gòu)建載體pGIS1的引物和ds-DNA連接物。
      用于cDNA合成的GIS分析寡聚物-GsuI-寡dT引物5’-GAGCTCCTTCTGGAGTTTTTTTTTTTTTTTTVN-3’(SEQ IDNO1)-NotI/BamHI/MmeI(N)6引物銜接物(上部)5’-AATTCGCGGCCGCTTGGATCCGACNNNNNN(SEQ IDNO2)-NotI/BamHI/MmeI(N)引物銜接物(底部)5’-p-GTCGGATCCAAGCGGCCGCG-3’(SEQ ID NO3)-NotI/BamHI/MmeI(N)5引物銜接物(上部)5’-AATTCGCGGCCGCTTGGATCCGACGNNNNN(SEQ IDNO4)-MmeI/BamHI/SalI連接物(上部)5’-TCGACCCAGGATCCAACTT-3’(SEQ ID NO5)-MmeI/BamHI/SalI連接物(底部)5’-p-GTTGGATCCTGGG-3’(SEQ ID NO6)-PMR0035’-GTAAAACGACGGCCAGT-3’(SEQ ID NO7)-PMR0045’-GGAAACAGCTATGACCATG-3’(SEQ ID NO8)-PMR0065’-TAATACGACTCACTATAGGG-3’(SEQ ID NO9)
      -PMR00115’-GATGTGCTGCAAGGCGATTAAG-3’(SEQ ID NO10)-PMR00125’-AGCGGATAACAATTTCACACAGG-3’(SEQ ID NO11)一般的50bp粘性雙標(biāo)簽的結(jié)構(gòu)5’-GATCCGACXXXXXXXXXXXXXXXXXXNNNNNNNNNNNNNNNNAAGTTG(SEQ ID NO12)GCTGXXXXXXXXXXXXXXXXXXNNNNNNNNNNNNNNNNTTCAACCTAG-5’(SEQ ID NO13)其中X和N可以是A、C、G或T的任一個(gè)。
      用于構(gòu)建載體pGIS1的引物Mme_mut15’-p-CGCTCTCCTGTACCGACCCTGCCGCTTAC-3’(SEQID NO14)Mme_mut25’-p-AACTATCGTCTTGAGACCAACCCGGTAAG-3’(SEQID NO15)ds-DNA連接物5’-AATTCTCGAGCGGCCGCGATATCG-3’(SEQ ID NO16)3’-GAGCTCGCCGGCGCTATAGCTTAA-p-5’(SEQ ID NO17)pGIS1序列pGIS1的序列(SEQ ID NO18)顯示于圖10中。
      實(shí)施例1方法根據(jù)以下cDNA文庫(kù)構(gòu)建和分析的模塊進(jìn)行GIS雙標(biāo)簽分析的實(shí)驗(yàn)程序(1)全長(zhǎng)cDNA文庫(kù),其在每個(gè)cDNA插入片段兩端的兩側(cè)引入MmeI位點(diǎn);(2)GIS雙標(biāo)簽文庫(kù),其中每個(gè)克隆含有轉(zhuǎn)錄單體的5’18bp特征和3’18bp特征;(3)用于連接的GIS雙標(biāo)簽克隆的GIS文庫(kù);
      (4)GIS測(cè)序分析。
      1.對(duì)于每個(gè)cDNA插入片段加入MmeI位點(diǎn)的GIS全長(zhǎng)cDNA文庫(kù),這部分程序的大綱如下從高質(zhì)量mRNA開始,用GsuI-寡dT引物(SEQ ID NO1)合成第一個(gè)cDNA。
      通過(guò)基于生物素化的帽子捕獲方法將第一鏈cNDA/RNA雜交體進(jìn)行全長(zhǎng)富集過(guò)程??梢允褂帽绢I(lǐng)域已知的任何帽子捕獲方法,例如,Caminci等,1996,Genomics,Vol.37,327-336;US 6,143,528;Edery等,1995,Mol.Cell.Biol.,Vol.15,No.6,3363-3371)。
      富集的全長(zhǎng)第一鏈cDNA是第二個(gè)cDNA合成的模板,用含有MmeI、BamHI和NotI位點(diǎn)的連接物-引物合成(NotI/BamHI/MmeI-(N)5和-(N)6,SEQ ID NO2-4)。
      形成雙鏈cDNA后,通過(guò)GsuI限制酶切除cDNA多-A/T尾。GsuI是離其識(shí)別位點(diǎn)16bp切割DNA的另一種II型內(nèi)切酶。在GsuI切割端,將含有MmeI、BamHI位點(diǎn)和SalI粘性末端的連接物連接到cDNA(SEQID NO5-7)。
      NotI消化后,將全長(zhǎng)cDNA插入到載體pGIS1的多銜接物的NotI和SalI位點(diǎn)之間。載體pGIS1(參見圖7和10)是從pGEM3z(Promega)修飾得到的。
      1-1.mRNA制備使用Trizol試劑(Invitrogen)從鼠胚胎干細(xì)胞系E14制備總mRNA。然而,還可以使用任何標(biāo)準(zhǔn)方法(如Sambrook J.和Russell D.W.,2001,Molecular Cloning,Cold Spring Harbor Laboratory Press中所述的那些)。
      根據(jù)標(biāo)準(zhǔn)技術(shù)(例如,Sambrook和Russell,2001,如上)通過(guò)寡dT磁珠純化mRNA(polyARNA)?;蛘撸鶕?jù)標(biāo)準(zhǔn)技術(shù)(例如,Sambrook和Russell,2001,如上)通過(guò)親和柱進(jìn)行純化。
      1-2.第一鏈cDNA合成和全長(zhǎng)選擇該步驟中,使用GsuI-寡dT引物合成第一個(gè)cDNA。然后,通過(guò)基于生物素化的帽子捕獲方法將第一鏈cDNA/RNA雜交體進(jìn)行全長(zhǎng)富集。
      GsuI-寡dT引物5’-GAGCTCCTTCTGGAGTTTTTTTTTTTTTTTTVN-3’(SEQ IDNO1)將以下的混合GsuI-寡dT引物(7μg/μl)2μlpolyA RNA(20μg) 18μl將所獲得的溶液加熱至65℃10分鐘和37℃1分鐘。
      然后,在微離心機(jī)中旋轉(zhuǎn)管子并加入以下物質(zhì)2X GC-I緩沖液(Takara) 75μlRNA酶抑制劑(Promega)1μl10mM dNTP(具有甲基-dCTP)4μl飽和海藻糖 10μl4.9M山梨糖醇26μlSuperscriptII逆轉(zhuǎn)錄酶(Invitrogen) 15μl將所獲得的溶液在37℃孵育10分鐘,42℃30分鐘,50℃20分鐘和55℃20分鐘。加入2μl蛋白酶K(20mg/ml)。將所獲得的溶液在45℃孵育15分鐘,接著苯酚/氯仿提取和異丙醇沉淀(根據(jù)標(biāo)準(zhǔn)技術(shù),例如,Sambrook和Russell,2001,如上)。
      將RNA/cDNA異源雙鏈體重懸浮于44.5μl的ddH2O中。加入3μlpH4.5的1.1M NaOAc和2.5μl的100mM NaIO4來(lái)氧化mRNA的二醇結(jié)構(gòu)。將50μl反應(yīng)溶液在黑暗中冰上孵育45分鐘,接著加入0.5μl的10%SDS、11μl的5M NaCl和61μL的異丙醇來(lái)沉淀RNA/DNA。將沉淀的RNA/DNA重懸浮于50μl的ddH2O中。加入5μL的1M NaOAc(pH6.1)、5μL的10%(w/v)SDS和150μL的10mM長(zhǎng)臂生物素酰肼來(lái)生物素化RNA。將反應(yīng)在黑暗中室溫孵育過(guò)夜。通過(guò)加入5μL的5M NaCl、75μL的1M無(wú)RNA酶的NaOAc(pH6.1)和750μL的100%EtOH或200μL的100%異丙醇來(lái)沉淀生物素化的RNA/DNA。在-80℃孵育30分鐘,在14krpm 4℃旋轉(zhuǎn)30分鐘。
      用70%(v/v)EtOH/30%DEPC處理的ddH2O(DEPC是焦碳酸二乙酯,是RNA酶抑制劑)洗滌沉淀,并在4℃14krpm進(jìn)行離心10分鐘。小心移去提取物液體。然后,將沉淀空氣干燥,并重懸浮于400μL的DEPC-ddH2O中。然后加入50μL的10×RNA酶緩沖液和25單位RNA酶/μg起始mRNA。將所獲得的溶液在37℃孵育30分鐘。加入10μL 10mg/mL的酵母tRNA(Ambion)和150μL 5M的NaCl來(lái)停止反應(yīng)。
      在生物素化RNA-DNA異源雙鏈體時(shí),如下制備鏈霉抗生物素Dynabeads將400μL M-280鏈霉抗生物素珠子(Dynal)移吸入無(wú)RNA酶的Eppendorf管中,將珠子放置于磁鐵上,保持停留至少30分鐘,然后除去上清液。將珠子重懸浮于400μL 1×結(jié)合緩沖液(2M NaCl,50mM EDTA,pH8.0)中。將管子放置于磁鐵上,等待至少30分鐘,然后除去上清液。重復(fù)兩次1×結(jié)合緩沖液洗滌。將珠子重懸浮于400μL1×結(jié)合緩沖液和100μg酵母tRNA中,然后在4℃孵育30分鐘,偶爾攪拌。將管子放置于磁鐵臺(tái)上,等待至少30秒鐘,除去上清液。用1×結(jié)合緩沖液洗滌珠子3次。將珠子和RNA/DNA異源雙鏈混合(目前總體積為660μL,且結(jié)合條件是1M NaCl)。將混合物在室溫旋轉(zhuǎn)30分鐘。
      將管子放置于磁鐵臺(tái)上,等待至少30秒鐘,除去上清液(上清液作為“未結(jié)合”保存)。
      用400μL 1×結(jié)合緩沖液洗滌珠子兩次。用400μL 0.4%(w/v)SDS加50μg/mL酵母tRNA洗滌。用400μL 1×洗滌緩沖劑(10mM Tris-HClpH7.5,0.2mM EDTA,10mM NaCl&amp; 20%(v/v)甘油,40μg/mL酵母tRNA)洗滌。用400μL 50μg/mL酵母tRNA洗滌。對(duì)于所有的洗滌,將管子放置于磁鐵臺(tái)上,等待至少30秒鐘,除去上清液。
      通過(guò)RNA的堿性水解釋放第一鏈cDNA。加入以下的50μL 50mMNaOH和5mM EDTA(pH 8.0)。將管子在65℃旋轉(zhuǎn)10分鐘。將管子放置于磁鐵臺(tái)上,并將上清液轉(zhuǎn)移至另一含有50μL 1M Tris-Cl(pH7.5)的管中。再重復(fù)裂解程序2次。上清液的終體積為300μL(含有第一鏈cDNA)。
      通過(guò)苯酚/氯仿提取來(lái)提取cDNA并通過(guò)1mL乙醇和糖原來(lái)沉淀。將cDNA重懸浮于5μL LoTE(0.1×)中。LoTE是低鹽Tris-EDTA緩沖液(3mM Tris-HCl pH7.5和0.2mM EDTA pH7.5)。
      1-3.第二鏈cDNA合成將以下反應(yīng)物加入冰上每個(gè)對(duì)應(yīng)管中。
      LoTE中的cDNA 5μL銜接物(N5)1.6μg銜接物(N6)0.4μgSoln II(Takara連接試劑盒) 10μLSoln I(Takara連接試劑盒) 20μL銜接物(N6)是NotI/BamHI/MmeI(N)6引物銜接物(上部)5’-AATTCGCGGCCGCTTGGATCCGACNNNNNN(SEQ IDNO2)NotI/BamHI/MmeI(N)引物銜接物(底部)5’-p-GTCGGATCCAAGCGGCCGCG-3’(SEQ ID NO3)銜接物(N5)是NotI/BamHI/MmeI(N)5引物銜接物(上部)5’-AATTCGCGGCCGCTTGGATCCGACGNNNNN(SEQ IDNO4)NotI/BamHI/MmeI(N)引物銜接物(底部)是如上所示的序列(SEQID NO3)將cDNA和銜接物的混合物在16℃孵育過(guò)夜。并加入以下的ddH2O20μL10×ExTaq緩沖液(Takara)8μL2.5mM dNTP 8μLExTaq聚合酶(Takara)4μL將混合物在熱循環(huán)儀中預(yù)熱,65℃,5分鐘,68℃,30分鐘,72℃,10分鐘,接著苯酚/氯仿提取,并用糖原乙醇沉淀,然后重懸浮于85μl ddH2O中。
      1-4.通過(guò)GsuI消化除去polyA尾將以下的反應(yīng)物加入管中。
      cDNA 85μLGsuI(Fermentas) 5μL10×緩沖劑B(Fermentas)10μL將混合物在30℃孵育2小時(shí),接著苯酚/氯仿提取和乙醇沉淀。將沉淀重懸浮于10μl ddH2O中,并進(jìn)行以下的3’連接物連接反應(yīng)。
      1-5.加入具有MmeI和BamHI和SalI位點(diǎn)的3’連接物將以下的成分加入含有10μl樣品的管子中。該10μl樣品是雙鏈全長(zhǎng)cDNA,其具有被GsuI消化除去的poly(A)尾。
      5×連接緩沖液 10μLGsuI SalI連接物(0.4μg/μL)25μL(GsuI SalI連接物是MmeI/BamHI/SalI連接物)T4 DNA連接酶(5單位/μl)(Invitrogen)5μL-MmeI/BamHI/SalI連接物(上部)5’-TCGACCCAGGATCCAACTT-3’(SEQ ID NO5)-MmeI/BamHI/SalI連接物(底部)5’-GTTGGATCCTGGG-p-3’(SEQ ID NO6)將反應(yīng)在16℃孵育過(guò)夜,接著苯酚/氯仿提取和乙醇沉淀,并將沉淀重懸浮于41μl的dH2O中。
      1-6.NotI消化和cDNA大小分級(jí)分離在冰上依次將以下的加入NEB緩沖液3 5μLNotI(10單位/μl)(NEB) 4μL
      將所獲得的溶液在37℃孵育1-2小時(shí)。
      制得cDNA大小分級(jí)分離柱(Invitrogen說(shuō)明書如下打開柱子(首先底部)并使其完全排干;用800μL T10E0.1N25緩沖液洗滌5次,每次使柱子完全排書)。將DNA樣品裝載于柱子上。將流出物收集于Eppendorf管中(級(jí)分1)。加入100μL T10E0.1N25。將流出物收集于Eppendorf管中(級(jí)分2)。加入另100μL T10E0.1N25緩沖液。收集流出物,每個(gè)預(yù)先編號(hào)的Eppendorf管一滴(從級(jí)分3開始,每滴約30-40μL)。
      無(wú)論何時(shí)柱子干了,加入另100μL T10E0.1N25緩沖液。
      收集到第20滴(根據(jù)Invitrogen方法)。將每個(gè)級(jí)分3μL在瓊脂糖凝膠上電泳來(lái)觀察每個(gè)級(jí)分中的cDNA大小。集合的級(jí)分顯示cDNA≥1.0kbp(通常達(dá)2-3kbp)。集合的樣品保持無(wú)雜質(zhì)(使用在輕微酸化的100%EtOH中浸泡至少30分,用ddH2O漂洗5次的管子,并保存樣品。這就是必需連接的)。
      如果僅使用一個(gè)級(jí)分,將其沉淀并根據(jù)凝膠的外部特征而使用其的一半到全部。
      此時(shí),cDNA片段在5’側(cè)具有NotI粘性端和在3’側(cè)具有SalI粘性端,并可克隆到載體中。
      1-7.用線性化質(zhì)粒pGIS1連接cDNA1-7-1通過(guò)NotI和SalI消化制得克隆載體pGIS1。pGIS1的載體序列顯示于圖7和9中。
      pGIS1克降載體構(gòu)建(I)pGEM3z位點(diǎn)特異性突變來(lái)形成無(wú)MmeI載體載體pGIS1源自pGEM3z(Promega)。pGEM3z原始含有兩個(gè)MmeI識(shí)別位點(diǎn),其通過(guò)定點(diǎn)突變敲除。使用QuikChange Multi試劑盒(Stratagene),和突變引物Mme_mut15’-p-CGCTCTCCTGTACCGACCCTGCCGCTTAC-3’(SEQ ID NO14)Mme_mut25’-p-AACTATCGTCTTGAGACCAACCCGGTAAG-3’(SEQ ID NO15)(II)多銜接物片段的修飾通過(guò)在現(xiàn)有EcoRI位點(diǎn)簡(jiǎn)單插入ds-DNA連接物來(lái)修飾多銜接物片段。因此引入的其他識(shí)別位點(diǎn)是XhoI、NotI和EcoRV(在插入填充片段時(shí)刪除EcoRV(參見以下的))。
      ds-DNA連接物5’-AATTCTCGAGCGGCCGCGATATCG-3’(SEQ ID NO16)3’-GAGCTCGCCGGCGCTATAGCTTAA-p-5’(SEQ ID NO17)(III)填充片段插入在修飾載體的NotI和SalI位點(diǎn)之間插入約690bp的片段(參見圖10中的載體序列)。這有助于產(chǎn)生NotI/SalI雙消化的載體,因?yàn)樵谀z純化過(guò)程中可以清楚觀察填充片段并切除。
      將線性化的質(zhì)粒凝膠純化。
      1-7-2過(guò)夜將cDNA連接到pGIS1載體并根據(jù)標(biāo)準(zhǔn)技術(shù)(參見Sambrook和Russel,2001,如上)通過(guò)電穿孔將構(gòu)建體轉(zhuǎn)移進(jìn)電轉(zhuǎn)化感受態(tài)電轉(zhuǎn)化感受態(tài)的E.coli TOP10細(xì)胞中。
      1-8.文庫(kù)QC(QC=質(zhì)量檢測(cè))將1-100μL連續(xù)稀釋的轉(zhuǎn)化體涂布于抗生素選擇的LB瓊脂平板上。將克隆孵育過(guò)夜并計(jì)數(shù)來(lái)測(cè)定文庫(kù)滴定度。
      挑選24至96個(gè)克隆(任意數(shù)量)并通過(guò)直接克隆PCR和瓊脂糖凝膠電泳來(lái)測(cè)定插入片段的大小(根據(jù)標(biāo)準(zhǔn)技術(shù),例如,Sambrook和Russel,2001,參見上文)。計(jì)算cDNA插入片段的百分比和平均的插入片段大小。
      在這階段,根據(jù)標(biāo)準(zhǔn)方法(Sambrook和Russel,2001,參見上文)可以作為連接反應(yīng)物或作為E.coli細(xì)胞中的轉(zhuǎn)錄體來(lái)存儲(chǔ)GIS全長(zhǎng)cDNA文庫(kù)。
      實(shí)施例22.GIS雙標(biāo)簽文庫(kù)從步驟1-1至1-8制得的cDNA克隆含有5’端的MmeI位點(diǎn)(TCCGAC)和反方向3’端的另一MmeI位點(diǎn)(TCCAAC)。注意到這兩個(gè)MmeI限制位點(diǎn)是可被MmeI識(shí)別的兩個(gè)異構(gòu)體(TCCRAC 20/18,其中R=(A/G))。在此序列的差異對(duì)此后的方向識(shí)別是有用的。MmeI限制酶從其5’和3’端切割這些克隆20bp成cDNA片段。因此,盡管消化的cDNA大小不同,載體加所有克隆的每端20bp cDNA特征標(biāo)簽將是不變的大小,可以在瓊脂糖凝膠電泳中容易地識(shí)別,并可以從不需要的cDNA片段中容易地純化。
      凝膠純化的載體加標(biāo)簽然后可以自連接來(lái)獲得含有5’和3’GIS特征標(biāo)簽的“標(biāo)簽質(zhì)粒”。
      2-1.質(zhì)粒制備通過(guò)將合適數(shù)量的克隆涂布于大的(22×22cm)瓊脂平板(Genetix)來(lái)擴(kuò)增GIS全長(zhǎng)cDNA文庫(kù)一次。通過(guò)估算的轉(zhuǎn)錄本組大小來(lái)決定所需的克隆數(shù)量。37℃孵育過(guò)夜后,收集所得到的細(xì)菌克隆并通過(guò)3000g離心30分鐘來(lái)沉淀。使用Qiagen HiSpeed Plasmid Maxi試劑盒進(jìn)行質(zhì)粒DNA的制備。通過(guò)瓊脂糖凝膠電泳和限制消化測(cè)定所獲得的DNA質(zhì)量。處理約300,000個(gè)克隆來(lái)產(chǎn)生至少1mg的質(zhì)粒DNA。
      2-2.MmeI消化按照制造商的條件(NEB)使用MmeI消化約10μg質(zhì)粒DNA,確保所用酶單位數(shù)量通常低于4倍過(guò)量來(lái)防止甲基化誘導(dǎo)抑制。消化在37℃進(jìn)行2-6小時(shí)。
      在瓊脂糖凝膠上測(cè)定等分的消化反應(yīng)物容易觀察到對(duì)應(yīng)于含有GIS特征標(biāo)簽線性化載體的約2800bp大小的強(qiáng)條帶,還具有源自從原始質(zhì)粒cDNA切除的大量片段(參見圖4)。
      2-3.線性載體-GIS雙標(biāo)簽純化在0.7%瓊脂糖上將消化反應(yīng)物電泳,切除2800bp載體-GIS標(biāo)簽條帶并使用Qiagen瓊脂糖凝膠提取試劑盒來(lái)純化。
      2-4.載體-GIS雙標(biāo)簽自連接來(lái)產(chǎn)生“標(biāo)簽質(zhì)?!盡meI消化在5’和3’特征標(biāo)簽上形成2bp懸垂物。使用T4 DNA聚合酶(Promega)除去這些(磨光),留下后面的18bp標(biāo)簽(0.5-2.0μg)DNA50μL10×Y+/TANGO緩沖液(Fermentas) 6.0μL0.1M DTT 0.3μLT4 DNA聚合酶 5單位/μg10mM dNTP 0.6μLddH2O至60.0μL在37℃孵育5分鐘,然后在75℃滅活10分鐘。
      然后將純化的、平截的DNA乙醇沉淀并以約20ng/μl的濃度重懸浮。如下進(jìn)行自連接(分子內(nèi)再環(huán)化)約350ng DNA15.0μL連接溶液I(Tskara連接試劑盒2) 15.0μL在16℃孵育2小時(shí)至過(guò)夜。
      2-5.雙特征標(biāo)簽(雙標(biāo)簽)的形成該步驟的目標(biāo)是以定量代表衍生標(biāo)簽質(zhì)粒的原始cDNA文庫(kù)的形式獲得GIS雙特征標(biāo)簽。
      一般的50bp粘性雙標(biāo)簽的結(jié)構(gòu)5’-GATCCGACXXXXXXXXXXXXXXXXXXNNNNNNNNNNNNNNNNAAGTTG(SEQ ID NO12)GCTGXXXXXXXXXXXXXXXXXXNNNNNNNNNNNNNNNNTTCAACCTAG-5’(SEQ ID NO13)其中X和N可以是A、C、G或T的任一個(gè)。
      我們使用兩個(gè)方法達(dá)到此目的(i)細(xì)菌轉(zhuǎn)化、標(biāo)簽質(zhì)粒純化和限制消化來(lái)釋放50bp粘性雙標(biāo)簽;(ii)連接反應(yīng)的直接PCR接著將PCR產(chǎn)物限制消化來(lái)釋放50bp粘性雙標(biāo)簽。
      2-5-1轉(zhuǎn)化和繁殖;制備標(biāo)簽質(zhì)粒(參見圖1)通過(guò)電穿孔將1μl連接反應(yīng)物(2-4部分)轉(zhuǎn)化每50μl電轉(zhuǎn)化感受態(tài)電轉(zhuǎn)化感受態(tài)TOP10細(xì)胞(Invitrogen)。在1ml SOC培養(yǎng)基中37℃復(fù)壯1小時(shí),然后涂布于幾個(gè)稀釋度于LB瓊脂+氨芐青霉素上,用于QC和滴定。
      QC(質(zhì)量檢測(cè))從幾個(gè)克隆制得質(zhì)粒DNA并用BamHI消化來(lái)測(cè)試標(biāo)簽質(zhì)粒釋放50bp粘性雙標(biāo)簽。
      然后通過(guò)將剩余的培養(yǎng)物涂布于大瓊脂糖平板上來(lái)擴(kuò)大該處理,并使用Qiagen HiSpeed Plasmid Maxi試劑盒來(lái)進(jìn)行最大量制備(maxiprep)。
      例如,處理約5,000個(gè)克隆來(lái)產(chǎn)生至少40μg的標(biāo)簽質(zhì)粒DNA。
      然后將該質(zhì)粒DNA BamHI-消化來(lái)產(chǎn)生50bp粘性雙標(biāo)簽(作為實(shí)施例的結(jié)果參見圖5)。
      2-5-2基于PCR的粘性雙標(biāo)簽的提取(參加圖2)在連接反應(yīng)中進(jìn)行PCR,使用結(jié)合雙標(biāo)簽兩側(cè)載體序列的引物PMR003和PMR004。
      PMR0035’-GTAAAACGACGGCCAGT-3’(SEQ ID NO7)PMR0045’-GGAAACAGCTATGACCATG-3’(SEQ ID NO8)通過(guò)進(jìn)行連續(xù)稀釋來(lái)經(jīng)驗(yàn)性地決定起始原料的含量并選擇形成約200bp無(wú)雜質(zhì)的、特定PCR產(chǎn)物的條件(例如1∶200)稀釋的連接反應(yīng)物5.0μL10×HiFi緩沖液 2.0μL10mM dNTP 0.4μLPMR003(100ng/μL) 1.0μLPMR004(100ng/μL) 1.0μLEppendorf TripleMaster聚合酶0.2μLdH2O 10.4μL
      (HiFi緩沖液是與Eppendorf TripleMaster酶一起提供的反應(yīng)緩沖液)熱循環(huán)條件步驟195℃×2分鐘步驟295℃×30秒步驟355℃×1分鐘步驟472℃×30秒回到步驟2,重復(fù)步驟(2-4)24×步驟572℃×4分鐘16℃保持在1.5%瓊脂糖凝膠上分析PCR產(chǎn)物。
      對(duì)于負(fù)對(duì)照,使用(i)無(wú)模板,和(ii)沒(méi)有連接酶進(jìn)行PCR反應(yīng)。為了獲得足夠的用于隨后的50bp粘性雙標(biāo)簽生產(chǎn)的200bp PCR產(chǎn)物,擴(kuò)大反應(yīng)使用96-孔PCR平板進(jìn)行96個(gè)PCR反應(yīng);這產(chǎn)生了約50μg 200bp雙標(biāo)簽。然后合并單個(gè)PCR的反應(yīng)物并在Bam HI消化產(chǎn)生50bp粘性雙標(biāo)簽之前乙醇沉淀(作為實(shí)施例的結(jié)果參見圖6)。
      3.GIS文庫(kù)3-1.標(biāo)簽質(zhì)粒制備僅將這應(yīng)用至基于細(xì)菌轉(zhuǎn)化的方法(參見2-5-1部分)3-2.BamHI消化和GIS標(biāo)簽純化3-2-1標(biāo)簽質(zhì)粒的BamHI消化(2-5-1部分)釋放50bp粘性雙標(biāo)簽DNA(標(biāo)簽質(zhì)粒)40μg10×單一的BamHI緩沖液100μL100×BSA 10μLBamHI(20U/μL,NEB) 10μLdH2O 至1mL任意選擇40μg DNA(標(biāo)簽質(zhì)粒)進(jìn)行評(píng)估。
      為了更有效消化等分成10×100μl并在37℃孵育4小時(shí)。
      消化后,將它們?cè)?5℃滅活15分鐘,然后進(jìn)行苯酚-氯仿提取和乙醇沉淀。然后,沉淀含有50bp粘性雙標(biāo)簽,將BamHI消化后的剩余切割產(chǎn)物重懸浮于LoTE緩沖液中用于凝膠純化。
      3-2-2通過(guò)PCR得到的200bp雙標(biāo)簽(2-5-2部分)的BamHI消化來(lái)釋放50bp粘性雙標(biāo)簽DNA(PCR產(chǎn)物) 40μg10×單一BamHI緩沖液100μL100×BSA 10μLBamHI(20U/μL,NEB)10μLdH2O 至1mL任意選擇40μg DNA(標(biāo)簽質(zhì)粒)進(jìn)行評(píng)估。
      為了更有效的消化等分成10×100μl并在37℃孵育4小時(shí)。
      消化后,將它們?cè)?5℃滅活15分鐘,然后進(jìn)行苯酚-氯仿提取和乙醇沉淀。然后,沉淀含有50bp粘性雙標(biāo)簽,將BamHI消化后剩余的切割產(chǎn)物重懸浮于LoTE緩沖液中用于凝膠純化。
      3-3 50bp粘性雙標(biāo)簽的凝膠純化將根據(jù)3-2-1和3-2-2兩個(gè)部分BamHI消化的DNA在大的(HoeferRuby 600,15×15cm,1.5mm厚)10%聚丙稀酰胺凝膠上分離。在200V進(jìn)行電泳約2小時(shí)直至溴苯酚藍(lán)條帶(標(biāo)準(zhǔn)蹤跡染料)幾乎到達(dá)凝膠的底部。在觀察和切除50bp粘性雙標(biāo)簽之前將凝膠在SYBR綠I(Molecular Probes,Inc.)中染色30分鐘。
      在這階段,適宜的是每個(gè)泳道裝載不多于5μg,或發(fā)生熒光淬滅。
      切除50bp粘性雙標(biāo)簽并收集入0.6ml的已經(jīng)在底部用21G針刺穿的微離心管中(每管2個(gè)凝膠片)。將該刺穿的管子放置于1.7ml微離心管內(nèi),并在12Kg,4℃離心2-5分鐘。因此來(lái)破碎凝膠片并收集于1.7ml的管中。
      每個(gè)管中加入150μl LoTE∶NH4OAc(125∶25)并在4℃放置過(guò)夜來(lái)洗脫。第二天,使用微旋轉(zhuǎn)過(guò)濾部件(SpinX,Costar)收集洗脫物,并進(jìn)行乙醇沉淀來(lái)提取純化的50bp雙標(biāo)簽,將其重懸浮于LoTE中。從70μg 200bp雙標(biāo)簽開始,我們期望提取數(shù)百ng的50bp雙標(biāo)簽。
      3-4.雙標(biāo)簽串連和凝膠純化需要一定的優(yōu)化(連接時(shí)間、起始原料的量)來(lái)確保500bp雙標(biāo)簽的串連形成約300bp至>1000bp的彌散產(chǎn)物。建議以下的條件作為起始點(diǎn)50bp粘性雙標(biāo)簽105-500ng5×緩沖液(PEG;BRL) 2.0μLT4 DNA連接酶(5U/μL) 1.0μLdH2O至10μL在16℃孵育1小時(shí)。
      加入裝載緩沖液并將整個(gè)樣品在65℃加熱15分鐘。將樣品裝載于單孔8%聚丙稀酰胺迷你凝膠中并在200V電泳約1小時(shí),或直至溴苯酚藍(lán)離底部約2cm。
      作為2或更多部分,例如200-500bp;500-1000bp;>1000bp可將彌散連接產(chǎn)物切除。
      如3-3部分詳述的進(jìn)行凝膠片的DNA洗脫。用苯酚-氯仿提取洗脫物,然后乙醇沉淀。將DNA沉淀重懸浮于6μl LoTE中。
      3-5.串連體的克隆用10單位的BamHI在37℃消化2μg pZErO-1質(zhì)粒DNA(Invitrogen)(圖8)3小時(shí)來(lái)制得克隆載體(圖8顯示了測(cè)序/PCR引物結(jié)合位點(diǎn))。用苯酚-氯仿提取消化的DNA并乙醇沉淀,然后以33ng/μl的濃度重懸浮于LoTE中。如下進(jìn)行連接反應(yīng)串連體DNA6.0μLBamHI/pZErO-11.0μL5×連接酶緩沖液 2.0μLT4 DNA連接酶(5U/μL) 1.0μL在16℃孵育過(guò)夜。
      還平行地進(jìn)行了載體自連接作為對(duì)照。
      在電穿孔之前將連接產(chǎn)物純化。苯酚-氯仿提取后接著乙醇沉淀;在重懸浮于12μl TE(0.1×)之前,用75%乙醇將沉淀洗滌3次。用1μl該DNA轉(zhuǎn)化50μl電轉(zhuǎn)化感受態(tài)TOP10細(xì)菌細(xì)胞。收集后(還參見2-5-1部分),將50μl涂布于小的瓊脂平板上(含有低鹽LB瓊脂(Lennox L)加Zeocin(50μg/ml)和IPTG(50μg/ml))并在37℃孵育過(guò)夜。作為背景對(duì)照,將已經(jīng)用上述自連接反應(yīng)的載體相似轉(zhuǎn)化的細(xì)菌涂布于平板。(當(dāng)使用TOP10細(xì)胞時(shí),IPTG是任意的,但可以降低背景)。
      3-6.GIS文庫(kù)QC(質(zhì)量檢測(cè))第二天,挑選10-30個(gè)克隆用PCR檢測(cè)插入片段的大小。對(duì)于每個(gè)反應(yīng),挑選單個(gè)克隆放入含有以下的PCR管中10×HiFi緩沖液2.0μL10mM dNTP 0.4μLPMR003(100ng/μl) 1.0μLPMR004(100ng/μl) 1.0μLEppendorf TripleMaster聚合酶 0.2μLdH2O 11.4μL熱循環(huán)條件步驟195℃×2分鐘步驟295℃×30秒步驟355℃×1分鐘步驟472℃×30秒回到步驟2,重復(fù)步驟(2-4)24×步驟572℃×4分鐘16℃保持在1%瓊脂糖凝膠上觀察PCR產(chǎn)物。典型的結(jié)果顯示于圖9中。
      在不存在任何克隆的插入片段下,引物對(duì)PMR003/PMR004(SEQID NO7/SEQ ID NO8)形成了約220bp的條帶。如果如此產(chǎn)生的文庫(kù)質(zhì)量顯示良好,在制備用于測(cè)序分析的DNA中可以將剩余的轉(zhuǎn)化混合物涂布于(3-5部分)大的瓊脂平板上。
      引物對(duì)PMR003/PMR004對(duì)于檢測(cè)文庫(kù)的質(zhì)量也是適宜的,但是對(duì)于實(shí)際制備用于測(cè)序的PCR模板,優(yōu)選引物對(duì)PMR012/PMR003(SEQ ID NO11/SEQ ID NO7)(參見4-2部分)。
      PMR0125’-AGCGGATAACAATTTCACACAGG-3(SEQ ID NO11)。
      4.GIS標(biāo)簽的測(cè)序分析4-1.文庫(kù)涂布和克隆挑選將轉(zhuǎn)化的TOP10(Invitrogen)細(xì)菌細(xì)胞涂布于22×22cm的瓊脂平板上,菌落密度低于每個(gè)平板3,000個(gè)。挑選單個(gè)克隆并在384-孔平板中用LB加Zeocin 37℃培養(yǎng)過(guò)夜(參見上述的3.5部分)。重復(fù)384-孔平板的多個(gè)拷貝并保存于-80℃。
      4-2.模板制備將384-孔平板中的細(xì)菌培養(yǎng)物接種于預(yù)混的PCR混合物中。使用引物對(duì)PMR012/PMR003進(jìn)行PCR。
      在不存在任何串連體插入片段下,該引物對(duì)產(chǎn)生245bp的條帶。盡管如此,這套引物是優(yōu)選的,因?yàn)槠湓试S使用測(cè)序引物對(duì)PMR004(M13反向;離BamHI位點(diǎn)68bp)和PMR006(SEQ ID NO9)(M13正向;離BamHI位點(diǎn)87bp)。
      PMR0065’-TAATACGACTCACTATAGGG-3’(SEQ ID NO9)4-3.測(cè)序使用測(cè)序引物PMR004和PMR006在兩個(gè)方向?qū)CR模板測(cè)序。
      應(yīng)用根據(jù)本發(fā)明任一實(shí)施方案的GIS分析方法是發(fā)現(xiàn)全部基因的平臺(tái)。其將全長(zhǎng)cDNA文庫(kù)構(gòu)建、cDNA標(biāo)簽測(cè)序、基因組作圖和注釋結(jié)合成來(lái)自相同起始原料的一個(gè)操作。例如,為了研究人干細(xì)胞中基因的表達(dá),我們用干細(xì)胞mRNA開始,構(gòu)建干細(xì)胞GIS全長(zhǎng)cDNA文庫(kù),然后構(gòu)建GIS文庫(kù)。我們只需要將GIS文庫(kù)的50,000個(gè)克隆測(cè)序來(lái)揭示超過(guò)百萬(wàn)個(gè)的轉(zhuǎn)錄本。這樣深的取樣允許我們捕獲人干細(xì)胞轉(zhuǎn)錄本組中表達(dá)的接近全部的單一轉(zhuǎn)錄本。每個(gè)GIS雙標(biāo)簽可以特異性地作圖于基因組并因此來(lái)確定染色體上相應(yīng)基因的結(jié)構(gòu)片段。大多數(shù)GIS雙標(biāo)簽作圖于染色體上已知基因的并且GIS雙標(biāo)簽的計(jì)數(shù)提供了表達(dá)活性的測(cè)量。一些GIS雙標(biāo)簽可以作圖于基因組的沙漠(“無(wú)基因”)區(qū),其可以提示在干細(xì)胞轉(zhuǎn)錄本組中鑒定表達(dá)的新基因的。這樣,通過(guò)這整個(gè)轉(zhuǎn)錄本組-至-整個(gè)基因組的方法進(jìn)一步確定了基因的基因組注釋。基于GIS雙標(biāo)簽的序列,這些推定的新基因可以容易地從原始GIS全長(zhǎng)cDNA文庫(kù)得到克隆。
      我們不僅將該GIS基因發(fā)現(xiàn)系統(tǒng)運(yùn)用至人干細(xì)胞,而且還運(yùn)用至所有其他生物系統(tǒng),如人和模式生物體的細(xì)胞、組織和器官的發(fā)育。
      序列表&lt;110&gt;新加坡科技研究局&lt;120&gt;基因鑒定特征(GIS)分析的方法&lt;130&gt;FP2371&lt;150&gt;US 10/664,234&lt;151&gt;2003-09-17&lt;160&gt;18&lt;170&gt;PatentIn version 3.2&lt;210&gt;1&lt;211&gt;33&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;GsuI-寡 dT引物&lt;220&gt;
      &lt;221&gt;混合—特征&lt;222&gt;(32)..(32)&lt;223&gt;核苷V是&lt;220&gt;
      &lt;221&gt;混合—特征(misc-feature)&lt;222&gt;(32)..(32)&lt;223&gt;核苷V是g,c或a&lt;220&gt;
      &lt;221&gt;混合—特征&lt;222&gt;(33)..(33)&lt;223&gt;n是a、c、g或t&lt;400&gt;1gagctccttc tggagttttt tttttttttt tvn&lt;210&gt;2&lt;211&gt;30&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;NotI/BamHI/MmeI(N)6引物連接物(top)&lt;220&gt;
      &lt;221&gt;混合—特征&lt;222&gt;(25)..(30)&lt;223&gt;n是a、c、g或t
      &lt;400&gt;2aattcgcggc cgcttggatc cgacnnnnnn&lt;210&gt;3&lt;211&gt;20&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;NotI/BamHI/MmeI(N)引物連接物(底部)&lt;400&gt;3gtcggatcca agcggccgcg&lt;210&gt;4&lt;211&gt;30&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;NotI/BamHI/MmeI(N)5引物連接物(上部)&lt;220&gt;
      &lt;221&gt;混合-特征&lt;222&gt;(26)..(30)&lt;223&gt;n是a、c、g或t&lt;400&gt;4aattcgcggc cgcttggatc cgacgnnnnn&lt;210&gt;5&lt;211&gt;19&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;MmeI/BamHI/SalI連接物(上部)&lt;400&gt;5tcgacccagg atccaactt&lt;210&gt;6&lt;211&gt;13&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;MmeI/BamHI/SalI連接物(下部)&lt;400&gt;6
      gttggatcct ggg&lt;210&gt;7&lt;211&gt;17&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;引物PMR003&lt;400&gt;7gtaaaacgac ggccagt&lt;210&gt;8&lt;211&gt;19&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;引物PMR004&lt;400&gt;8ggaaacagct atgaccatg&lt;210&gt;9&lt;211&gt;20&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;引物PMR006&lt;400&gt;9taatacgact cactataggg&lt;210&gt;10&lt;211&gt;22&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;引物PMR011&lt;400&gt;10gatgtgctgc aaggcgatta ag&lt;210&gt;11&lt;211&gt;23&lt;212&gt;DNA&lt;213&gt;人工序列
      &lt;220&gt;
      &lt;223&gt;引物PMR012&lt;400&gt;11agcggataac aatttcacac agg&lt;210&gt;12&lt;211&gt;48&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;一般50bp粘性雙標(biāo)簽的上鏈&lt;220&gt;
      &lt;221&gt;混合—特征&lt;222&gt;(9)..(42)&lt;223&gt;n是a、c、g或t&lt;400&gt;12gatccgacnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnaagttg&lt;210&gt;13&lt;211&gt;48&lt;212&gt;DNA&lt;213&gt;混合—特征&lt;220&gt;
      &lt;223&gt;一般50bp粘性雙標(biāo)簽的下鏈&lt;220&gt;
      &lt;221&gt;混合—持征&lt;222&gt;(5)..(38)&lt;223&gt;n是a、c、g或t&lt;400&gt;13gctgnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnntt caacctag&lt;210&gt;14&lt;211&gt;29&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于載體pGISI構(gòu)建的引物Mme-mut2&lt;400&gt;14cgctctcctg taccgaccct gccgcttac&lt;210&gt;15
      &lt;211&gt;29&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;用于載體pGISI構(gòu)建的引物Mme-mut2&lt;223&gt;
      &lt;400&gt;15aactatcgtc ttgagaccaa cccggtaag&lt;210&gt;16&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;ds DNA連接物的上鏈&lt;400&gt;16aattctcgag cggccgcgat atcg&lt;210&gt;17&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;ds DNA連接物的下鏈&lt;400&gt;17gagctcgccg gcgctatagc ttaa&lt;210&gt;18&lt;211&gt;3404&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;pGIS1序列&lt;220&gt;
      &lt;221&gt;混合—特征&lt;222&gt;(15)..(704)&lt;223&gt;15-704代表包括MmeI和BamHI的在克隆中除去的填充片段&lt;400&gt;18gggcgaattc tcgagcggcc gcggatccga cgagagcgcc tgcgtacggc tcgccgcggtggctggcgct acttcggagg agcccgacgc ggcgcggtcg tttttataca ttcccgcgcggaggcaacgg aagggcgggg cgcctcgtga ttaggccgcg gaggtcacag gctctgttgt
      catgaaggtg aaaattaaat gttggaatgg tgtggccact tggctctggg tagccaatga240tgagaactgc ggcatctgca ggatggcgtt taatggctgc tgtccagact gtaaggtgcc300tggtgatgac tgccccctcg tgtggggaca gtgctcccac tgcttccaca tgcactgcat360cctcaagtgg ctgaatgcgc agcaggtgca gcagcactgc cccatgtgtc gccaggagtg420gaagttcaaa gagtgaagcc cgtgccgtgc cacttccctc tcctgtgctg tgccaggctc480agccccttcc ctccctcccc tcccccagat acagcacccc aagtcccctc cacacagcac540agtggtgccc agagatctcg gtctgtgccg gggacaagga tgctttctgt ttggctggga600caaggttgaa aggagctttg ctgactgttt tgttttccca tcacattgac actttattca660ataagtaaaa ctcattacag ttccaagtcg gatcctgggt cgacctgcag gcatgcaagc720ttgagtattc tatagtgtca cctaaatagc ttggcgtaat catggtcata gctgtttcct780gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag cataaagtgt840aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc900gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg960agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 1020gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 1080gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 1140cgtaaaaagg ccgcgttgct ggcgtttttc gataggctcc gcccccctga cgagcatcac 1200aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 1260tttccccctg gaagctccct cgtgcgctct cctgtaccga ccctgccgct taccggatac 1320ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 1380ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 1440cccgaccgct gcgccttatc cggtaactat cgtcttgaga ccaacccggt aagacacgac 1500ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 1560gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 1620atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 1680aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 1740aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 1800gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 1860
      cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct1920gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca1980tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct2040ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca2100ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc2160atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg2220cgcaacgttg ttggcattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct2280tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa2340aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta2400tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc2460ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg2520agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa2580gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg2640agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc2700accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg2760gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat2820cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata2880ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac cattattatc2940atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtctcgc gcgtttcggt3000gatgacggtg aaaacctctg acacatgcag ctcccggaga cggtcacagc ttgtctgtaa3060gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg3120ggctggctta actatgcggc atcagagcag attgtactga gagtgcacca tatgcggtgt3180gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgccattc gccattcagg3240ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagctggcg3300aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga3360cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tata 340權(quán)利要求
      1.包括至少一個(gè)雙標(biāo)簽的分離寡核苷酸,其中該雙標(biāo)簽包括兩個(gè)連接的第一個(gè)和第二個(gè)序列標(biāo)簽,其中第一個(gè)標(biāo)簽包括核酸分子或其片段的5’端序列,第二個(gè)標(biāo)簽包括3’端序列。
      2.根據(jù)權(quán)利要求1的寡核苷酸,進(jìn)一步包括雙標(biāo)簽兩側(cè)的兩個(gè)連接物,其中每個(gè)連接物包括至少一個(gè)限制位點(diǎn)。
      3.根據(jù)權(quán)利要求2的寡核苷酸,其中每個(gè)連接物包括至少第一個(gè)限制位點(diǎn),其是不對(duì)稱限制位點(diǎn),和至少第二個(gè)限制位點(diǎn)。
      4.根據(jù)權(quán)利要求3的寡核苷酸,其中不對(duì)稱限制位點(diǎn)是II型限制位點(diǎn)。
      5.根據(jù)根據(jù)權(quán)利要求1-4的寡核苷酸,其中核酸分子是基因的全長(zhǎng)序列或其片段。
      6.根據(jù)權(quán)利要求1-5的寡核苷酸,其中核酸是RNA、mRNA、基因組DNA、全長(zhǎng)cDNA或cDNA。
      7.根據(jù)權(quán)利要求1-6的寡核苷酸,其中在至少一個(gè)限制酶存在下通過(guò)拼接5’端和3’端來(lái)獲得雙標(biāo)簽,并通過(guò)所用的限制酶來(lái)決定序列標(biāo)簽的大小。
      8.根據(jù)權(quán)利要求7的寡核苷酸,其中限制酶是II型限制酶。
      9.根據(jù)權(quán)利要求8的寡核苷酸,其中II型限制酶選自AarI、AceIII、AloI、BaeI、Bbr7I、BbvI、BbvII、BccI、Bce83I、BceAI、BcefI、BcgI、BciVI、BfiI、BinI、BpII、BsaXI、BscAI、BseMII、BseRI、BsgI、BsmI、BsmAI、BsmFI、Bsp24I、BspCNI、BspMI、BsrI、BsrDI、BstF5I、BtgZI、BtsI、CjeI、CjePI、EciI、Eco31I、Eco57I、Eco57MI、Esp3I、FaII、FauI、FokI、GsuI、HaeIV、HgaI、Hin4I、HphI、HpyAV、Ksp632I、MboII、MlyI、MmeI、MnII、PleI、PpiI、Psrl、RleAI、SapI、SfaNI、SspD5I、Sthl32I、StsI、TaqII、TspDTI、TspGWI、TspRI或Tth111II。
      10.權(quán)利要求7的寡核苷酸,其中限制酶選自I-CeuI、PI-SceI、PI-PspI或I-SceI。
      11.根據(jù)權(quán)利要求1-10的寡核苷酸,其中雙標(biāo)簽大小為12-60bp。
      12.根據(jù)權(quán)利要求1-11的寡核苷酸,其中雙標(biāo)簽包括34-38個(gè)核苷酸,且通過(guò)使用限制酶MmeI來(lái)決定每個(gè)標(biāo)簽的大小。
      13.根據(jù)權(quán)利要求1-12的寡核苷酸,其中第一個(gè)和第二個(gè)標(biāo)簽具有相同或不同數(shù)目的核苷酸。
      14.根據(jù)權(quán)利要求1-13的寡核苷酸,其中寡核苷酸包括1至1000個(gè)雙標(biāo)簽。
      15.根據(jù)包括權(quán)利要求1-14寡核苷酸的載體。
      16.根據(jù)權(quán)利要求15的載體,其中載體的主鏈不包括不對(duì)稱限制位點(diǎn)和第二個(gè)限制位點(diǎn)。
      17.根據(jù)權(quán)利要求16的載體,其中不對(duì)稱限制位點(diǎn)是II型限制位點(diǎn)或歸巢內(nèi)切酶不對(duì)稱限制位點(diǎn)。
      18.包括至少一個(gè)核酸分子和核酸分子兩側(cè)的兩個(gè)連接物的載體,其中每個(gè)連接物包括至少第一個(gè)限制位點(diǎn),其是不對(duì)稱限制位點(diǎn),和至少第二個(gè)限制位點(diǎn),且載體的主鏈不包括不對(duì)稱限制位點(diǎn)和第二個(gè)限制位點(diǎn)。
      19.根據(jù)權(quán)利要求18的載體,其中不對(duì)稱限制位點(diǎn)是II型限制位點(diǎn)或歸巢內(nèi)切酶不對(duì)稱限制位點(diǎn)。
      20.根據(jù)權(quán)利要求18-19的載體,其中II型限制位點(diǎn)是MmeI。
      21.具有SEQ ID NO18所示序列的載體。
      22.根據(jù)權(quán)利要求21的載體,包括權(quán)利要求1-14的寡核苷酸。
      23.cDNA文庫(kù),其中文庫(kù)的每個(gè)cDNA克隆包括至少一個(gè)權(quán)利要求1-14中所限定的寡核苷酸。
      24.根據(jù)權(quán)利要求23的cDNA文庫(kù),其中至少一個(gè)寡核苷酸包括1-1000個(gè)雙標(biāo)簽。
      25.包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸的制備方法,包括產(chǎn)生至少一個(gè)核酸分子;分離核酸分子或其片段的5’端和3’端;連接5’端和3’端來(lái)形成至少一個(gè)雙標(biāo)簽。
      26.根據(jù)權(quán)利要求25的方法,其中至少一個(gè)核酸分子兩側(cè)有兩個(gè)連接物。
      27.根據(jù)權(quán)利要求25-26的方法,進(jìn)一步包括形成雙標(biāo)簽串連體的步驟。
      28.根據(jù)權(quán)利要求25-27的方法,其中存在1-1000個(gè)雙標(biāo)簽。
      29.根據(jù)權(quán)利要求26-28的方法,其中將寡核苷酸插入載體中,該寡核苷酸包括至少一個(gè)兩側(cè)有連接物的雙標(biāo)簽。
      30.根據(jù)權(quán)利要求25-29的方法,其中核酸分子是RNA、mRNA、基因組DNA、全長(zhǎng)cDNA或cDNA。
      31.根據(jù)權(quán)利要求25-30的方法,進(jìn)一步包括測(cè)定至少一個(gè)雙標(biāo)簽的核酸序列來(lái)檢測(cè)基因表達(dá)的步驟。
      32.根據(jù)權(quán)利要求25-31的方法,進(jìn)一步包括步驟測(cè)定至少一個(gè)雙標(biāo)簽的序列;將雙標(biāo)簽的核苷酸序列與包括基因組序列的數(shù)據(jù)庫(kù)相比較,由此鑒定與5’和3’端匹配的序列。
      33.根據(jù)權(quán)利要求26的方法,包括產(chǎn)生至少一個(gè)兩側(cè)有兩個(gè)連接物的核酸分子,其中每個(gè)連接物包括至少一個(gè)限制位點(diǎn);拼接分子的5’端和3’端來(lái)產(chǎn)生至少一個(gè)雙標(biāo)簽,包括加入至少一個(gè)識(shí)別限制位點(diǎn)的限制酶。
      34.根據(jù)權(quán)利要求33的方法,其中限制位點(diǎn)是不對(duì)稱限制位點(diǎn)。
      35.根據(jù)權(quán)利要求34的方法,其中不對(duì)稱限制位點(diǎn)是II型限制酶識(shí)別的限制內(nèi)切酶不對(duì)稱切割位點(diǎn)序列,且其中II型限制酶選自AarI、AceIII、AloI、BaeI、Bbr7I、BbvI、BbvII、BccI、Bce83I、BceAI、BcefI、BcgI、BciVI、BfiI、BinI、BpII、BsaXI、BscAI、BseMII、BseRI、BsgI、BsmI、BsmAI、BsmFI、Bsp24I、BspCNI、BspMI、BsrI、BsrDI、BstF5I、BtgZI、BtsI、CjeI、CjePI、EciI、Eco31I、Eco57I、Eco57MI、Esp3I、FaII、FauI、FokI、GsuI、HaeIV、HgaI、Hin4I、HphI、HpyAV、Ksp632I、MboII、MlyI、MmeI、MnII、PleI、PpiI、Psrl、RleAI、SapI、SfaNI、SspD5I、Sth132I、StsI、TaqII、TspDTI、TspGWI、TspRI或Tth111II。
      36.根據(jù)權(quán)利要求34的方法,其中不對(duì)稱限制位點(diǎn)是歸巢內(nèi)切酶不對(duì)稱限制位點(diǎn)序列,且其中識(shí)別歸巢內(nèi)切酶不對(duì)稱限制位點(diǎn)的酶選自I-CeuI、PI-SceI、PI-PspI和I-SceI。
      37.根據(jù)權(quán)利要求33的方法,包括產(chǎn)生至少一個(gè)全長(zhǎng)cDNA分子,該分子包括全長(zhǎng)cDNA5’端和3’端兩側(cè)的兩個(gè)連接物,其中每個(gè)連接物包括至少一個(gè)限制位點(diǎn),其是MmeI限制位點(diǎn);拼接全長(zhǎng)cDNA的5’端和3’端來(lái)產(chǎn)生包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸,包括用形成3’懸垂標(biāo)簽?zāi)┒说腗meI切割全長(zhǎng)cDNA,并連接兩個(gè)5’和3’端的標(biāo)簽來(lái)產(chǎn)生雙標(biāo)簽。
      38.根據(jù)權(quán)利要求25-37的方法,其中至少一個(gè)雙標(biāo)簽包括35-39個(gè)寡核苷酸。
      39.基因組作圖的方法,包括制備包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸,該雙標(biāo)簽包括兩個(gè)連接的第一個(gè)和第二個(gè)序列標(biāo)簽,其中第一個(gè)標(biāo)簽包括核酸分子的5’端序列,第二個(gè)標(biāo)簽包括3’端序列,核酸分子對(duì)應(yīng)于全長(zhǎng)基因或其片段;將至少一個(gè)雙標(biāo)簽的兩個(gè)標(biāo)簽中的每個(gè)作圖于基因組上;確定基因組圖譜上對(duì)應(yīng)基因的結(jié)構(gòu)區(qū)。
      40.發(fā)現(xiàn)基因的方法,包括制備包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸,該雙標(biāo)簽包括兩個(gè)連接的第一個(gè)和第二個(gè)序列標(biāo)簽,其中第一個(gè)標(biāo)簽包括核酸分子的5’端序列,第二個(gè)標(biāo)簽包括3’端序列,核酸分子對(duì)應(yīng)于全長(zhǎng)基因或其片段;將所獲得的至少一個(gè)雙標(biāo)簽與基因組圖譜和/或基因數(shù)據(jù)庫(kù)相比較;檢測(cè)與基因組圖譜上匹配的,并同時(shí)檢測(cè)與一個(gè)或多個(gè)基因數(shù)據(jù)庫(kù)中未匹配的5’和3’端標(biāo)簽;
      41.根據(jù)權(quán)利要求40的方法,進(jìn)一步包括回收對(duì)應(yīng)于新發(fā)現(xiàn)基因的全長(zhǎng)核酸分子。
      42.根據(jù)回收全長(zhǎng)cDNA的方法,包括從全長(zhǎng)cDNA文庫(kù)制得包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸,該雙標(biāo)簽包括兩個(gè)連接的第一個(gè)和第二個(gè)序列標(biāo)簽,其中第一個(gè)標(biāo)簽包括全長(zhǎng)cDNA的5’端序列,第二標(biāo)簽包括3’端序列;將所獲得的寡核苷酸雙標(biāo)簽測(cè)序;測(cè)定感興趣的雙標(biāo)簽;從全長(zhǎng)cDNA文庫(kù)回收對(duì)應(yīng)于感興趣雙標(biāo)簽的全長(zhǎng)cDNA。
      43.定量基因轉(zhuǎn)錄活性的方法,包括從全長(zhǎng)cDNA文庫(kù)制得包括至少一個(gè)雙標(biāo)簽的至少一個(gè)寡核苷酸,該雙標(biāo)簽包括兩個(gè)連接的第一個(gè)和第二個(gè)序列標(biāo)簽,其中第一個(gè)標(biāo)簽包括全長(zhǎng)cDNA的5’端序列,第二標(biāo)簽包括3’端序列;將所獲得的寡核苷酸雙標(biāo)簽測(cè)序;測(cè)定對(duì)應(yīng)于基因轉(zhuǎn)錄活性的所測(cè)序雙標(biāo)簽的頻率。
      全文摘要
      包括至少一個(gè)雙標(biāo)簽的分離寡核苷酸,其中該雙標(biāo)簽包括兩個(gè)連接的第一個(gè)和第二個(gè)序列標(biāo)簽,其中第一個(gè)標(biāo)簽包括核酸分子或其片段的5’端序列,第二標(biāo)簽包括3’端序列。該雙標(biāo)簽分析可用于發(fā)現(xiàn)基因和基因組作圖。
      文檔編號(hào)C12N15/00GK1849401SQ200480026324
      公開日2006年10月18日 申請(qǐng)日期2004年9月16日 優(yōu)先權(quán)日2003年9月17日
      發(fā)明者阮一駿, 黃偉鵬, 衛(wèi)嘉玲 申請(qǐng)人:新加坡科技研究局
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1