基于3T-seq全基因組范圍分析APA的方法
【專利摘要】本發(fā)明涉及一種檢測RNA?PAS(Poly?A?Site)的方法,提供了一種基于3T-seq全基因組范圍分析APA的方法,包括含有oligo?dT的磁珠制備,即將5'端生物素修飾的oligo?dT引物與帶鏈霉親和素的磁珠混合結(jié)合;用所述磁珠與總RNA混合,篩選含有Poly?A的RNA;逆轉(zhuǎn)錄,雙鏈cDNA第二鏈合成,雙鏈cDNA斷裂;移除Poly?A結(jié)構(gòu);末端修飾后連接測序接頭;文庫回收。該方法減少了RNA水平操作,在DNA水平移除Poly?A序列,消除Poly結(jié)構(gòu)對測序的影響;選擇雙鏈DNA斷裂酶處理,在不影響文庫質(zhì)量的基礎(chǔ)上在DNA水平斷裂;簡化實驗流程,降低實驗難度和造價,使其應(yīng)用范圍更廣。
【專利說明】基于3T-seq全基因組范圍分析APA的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種檢測RNA PAS (Poly A Site)的方法,尤其涉及一種基于3T_seq (TT-mRNA Terminal Sequencing)技術(shù)在全基因組范圍內(nèi)分析 APA(AlternativePolyadenylation)的方法。
【背景技術(shù)】
[0002]在人類基因組中,有一半以上的基因存在多個聚腺苷酸化位點(PAS,Poly ASite)。在前體mRNA成熟過程中,通過改變前體mRNA的切割位點和聚腺苷酸化位點(PAS)而從一個編碼區(qū)產(chǎn)生帶有不同長度的3’非編碼區(qū)(3’UTR)的成熟mRNA,這種情況稱為選擇性聚腺苷酸化(APA, Alternative Polyadenylation)。APA在調(diào)控細胞增殖、分化、轉(zhuǎn)運和發(fā)育以及疾病發(fā)生如腫瘤發(fā)生發(fā)展等生理和病理過程都發(fā)揮了至關(guān)重要的作用。
[0003]在全基因組范圍內(nèi)研究APA變化的現(xiàn)有技術(shù)有多種,但原理都相近。其中兩種最具有代表性方法為 SAPAS (Sequencing APA Sites)和 3P_Seq (Poly(A)PositionProfiling by sequencing)。文獻記載的 SAPAS 方法(Fu Y, Sun Y, Li Y, Li J, RaoX,Chen C, Xu A.Differential genome-wide profiling of tandem3’UTRs amonghuman breast cancer and normal cells by high-throughput sequencing.GenomeRes.2011,21(5):741-747.),其實驗原理如下:將RNA直接加熱斷裂后,用含有oligodT的引物逆轉(zhuǎn)錄出第一鏈cDNA,鏈置換的方法合成雙鏈cDNA。然后用突變的ο I i godT (TTTTCTTTTTTCTTTTTT )與測序接頭連接作為PCR引物擴增,擴增出的產(chǎn)物中則不含有poly A結(jié)構(gòu),以此避免poly A結(jié)構(gòu)對測序質(zhì)量的影響。文獻中記載的3P_Seq方法(Jan CH, Friedman RC, Ruby JG, Bartel DP.Formation, regulation and evolution ofCaenorhabditis elegans3' UTRs.Nature, 2011, 469 (7328):97-101.),其實驗原理圖如下:用oligo dT將含有poly A序列的RNA篩選出后,3’端加上一個帶Biotin修飾的RNA接頭,然后經(jīng)過RNase Tl斷裂RNA后用含有鏈霉親和素的磁珠篩選含有poly A的片段,再用只含有dTTP的逆轉(zhuǎn)錄體系將poly A結(jié)構(gòu)逆轉(zhuǎn)錄成雜合雙鏈,利用RNase H的特性水解polyA結(jié)構(gòu),將含有APA位點的片段從磁珠上釋放下來,兩端加上RNA接頭后合成雙鏈cDNA,進行PCR擴增后即為可用于測序的文庫。
[0004]現(xiàn)有技術(shù)中SAPAS法不能徹底消除polyA未切除對測序的影響,3P_Seq法中RNA水平操作繁雜,經(jīng)過多步的RNA連接和酶切,對RNA的損傷和損失也較大,不適用于少量樣品文庫的構(gòu)建。且此方法難度較大、成本較高。另外,操作過程中斷裂方式存在局限性,即3P-Seq法中RNase Tl酶切斷裂和SAPAS法中RNA直接加熱斷裂的方法不能做到既能不損傷RNA同時又能隨機斷裂。
【發(fā)明內(nèi)容】
[0005]有鑒于現(xiàn)有技術(shù)不能徹底消除Poly結(jié)構(gòu)對測序的影響、因操作繁雜引起的RNA損傷和損失、斷裂方式的局限的缺陷,本發(fā)明旨在提供一種基于3T-seq (TT-mRNA TerminalSequencing)全基因組范圍分析APA的方法,以盡可能減少RNA水平操作,在DNA水平移除Poly A序列,消除Poly結(jié)構(gòu)對測序的影響;盡可能簡化實驗流程,降低步驟繁瑣引起的損失,同時降低實驗難度和造價,使其應(yīng)用范圍更廣;選擇合適的斷裂方法,盡量做到在不影響文庫質(zhì)量的基礎(chǔ)上在DNA水平斷裂。
[0006]本發(fā)明采用以下技術(shù)方案解決上述問題:
[0007]提供一種基于3T-seq全基因組范圍分析APA的方法,包括:(I)含有oligo dT的磁珠制備;(2)用所述磁珠與總RNA混合,篩選含有Poly A的RNA ; (3)逆轉(zhuǎn)錄,雙鏈cDNA第二鏈合成,雙鏈cDNA斷裂;(4)在DNA水平移除Poly A結(jié)構(gòu);(5)末端修飾后連接測序接頭;(6)文庫回收及擴增。
[0008]進一步地,oligo dT引物5’端含有Gsu I酶切位點,用以后續(xù)移除Poly A結(jié)構(gòu)。Gsu I酶可以移除識別位點下游14-16個堿基,使文庫分子留下AA的粘性末端。
[0009]進一步地,oligo dT引物的5’端含有Gsu I的酶切位點的保護序列。優(yōu)選地,保護序列的堿基數(shù)為9個。[0010]進一步地,oligo dT引物的5’端用生物素修飾,用以與帶鏈霉親和素的磁珠連接。
[0011]進一步地,oligodT 引物序列為 5’ -GAGCTAGTTCTGGAGTTTTTTTTTTTTTTTTTTVN-3’。其中,V代表A、C或G,N代表A、T、C或T。oligo dT引物的3’端一共含有18個Tj^lGsuI酶切和末端修飾后,文庫分子余下2個T作為標記用于測序結(jié)果的篩選。采用3T_Seq技術(shù)構(gòu)建胃癌細胞系的APA文庫,經(jīng)過Illumina測序,共得到30million reads的數(shù)據(jù),采用2個T篩選數(shù)據(jù)發(fā)現(xiàn)92.8%的reads被篩出并成功比對到RNA3’端。因此認為2個T在后期數(shù)據(jù)篩選有效測序結(jié)果完全足夠。增加T的個數(shù)來可以提高篩選效率,根據(jù)目前Illumina測序的水平估算,若不超過5個T則不會對測序質(zhì)量產(chǎn)生很大的影響。因此本方法適用于2-5個T作為篩選標簽的應(yīng)用。
[0012]進一步地,所述逆轉(zhuǎn)錄使用未甲基化的dATP、dGTP、dTTP和甲基化的dCTP,以封閉基因序列中的Gsu I酶切位點。
[0013]進一步地,在所述雙鏈cDNA第二鏈的合成中,使用未甲基化的dCTP、dATP、dGTP和dUTP,通過RNase H、E.coli DNA聚合酶、E.coli DNA連接酶的作用進行合成。dUTP代替dTTP合成第二鏈cDNA,目的是在后續(xù)進行文庫PCR時加入USER酶裂解掉第二條鏈,使測序文庫具有鏈特異性。
[0014]進一步地,雙鏈cDNA的斷裂使用雙鏈DNA斷裂酶處理、DNase I處理或超聲斷裂。優(yōu)選地,采用雙鏈DNA斷裂酶處理。優(yōu)選地,雙鏈cDNA的斷裂后,片段大小在200-400bp,經(jīng)洗滌后留在所述磁珠上的片段為目的片段。
[0015]進一步地,所述移除Poly A結(jié)構(gòu)為:利用Gsu I酶進行酶切,釋放連接在所述磁珠上的目的片段。
[0016]進一步地,本發(fā)明的方法適用于起始總RNA量為10ug-100ug。
[0017]3T_Seq (TT-mRNA Terminal Sequencing)技術(shù)是用于在全基因組范圍內(nèi)研究APA變化的技術(shù)。該技術(shù)的原理圖1所示,首先需要構(gòu)建一種特殊的含有oligo dT的磁珠,用這種磁珠篩選含有poly A的RNA,然后在磁珠上逆轉(zhuǎn)錄合成第一鏈cDNA,逆轉(zhuǎn)錄體系中用甲基化的dCTP替代正常的dCTP,隨后使用dCTP、dATP、dGTP、dUTP合成雙鏈cDNA。經(jīng)過斷裂后磁珠上留下的即為含有APA位點的片段,再經(jīng)過Gsu I酶切除去poly A結(jié)構(gòu),將目的片段從磁珠上釋放下來,兩端經(jīng)過修飾后添加Illumina測序接頭,經(jīng)過片段大小篩選后PCR擴增,即得到可用于Illumina 二代測序的文庫。
[0018]本發(fā)明的有益效果為:
[0019]1.構(gòu)建了特殊的含有oligo dT的磁珠,該磁珠既能篩選含有poly A結(jié)構(gòu)的RNA,同時含有酶切位點可以移除文庫中的poly A結(jié)構(gòu)。而普通的商業(yè)oligo dT磁珠只能用于篩選含有poly A的RNA。本發(fā)明的磁珠具有以下特點:(l)oligo dT引物的5’端添加生物素修飾,用于連接帶有鏈霉親和素的磁珠。(2)oligo dT序列的5’端加上一個Gsu I的酶切識別位點以及9個堿基的保護序列,用于poly A結(jié)構(gòu)的移除。(3)磁珠上結(jié)合的oligodT經(jīng)Gsu I酶酶切后,其3’端保留2-5個T,能用于后期數(shù)據(jù)處理時數(shù)據(jù)的篩選。
[0020]2.斷裂方式的選擇:為了減少對RNA的損傷,本發(fā)明選擇在DNA階段斷裂,DNA水平斷裂與現(xiàn)有斷裂方式相比減少了對RNA的損傷,提高了產(chǎn)率。雙鏈cDNA合成后,使用NEB公司的雙鏈cDNA斷裂酶將雙鏈cDNA斷裂成200_400bp的片段,經(jīng)過磁珠篩選后,掛在磁珠上的片段即為靠近RNA3’端且含有Poly A位點的片段。
[0021]3.移除Poly A結(jié)構(gòu)的策略:為了方便操作和降低實驗難度,本發(fā)明選擇在DNA水平移除Poly A結(jié)構(gòu),提高測序質(zhì)量,使APA的鑒定更加準確。在逆轉(zhuǎn)錄時,我們在oligo dT的5’端引入了 Gsu I的酶切識別位點,Gsu I是一種第三型限制性內(nèi)切酶,在識別位點的下游16個堿基的位置切割形成兩個堿基的粘性末端,而且具有甲基化封閉敏感特性。當識別位點(CTGGAG)中的堿基C被甲基化時,該識別位點被封閉,無法被Gsu I識別。由于PolyA結(jié)構(gòu)移除的同時也將文庫片段從磁珠上釋放下來,為了防止移除Poly結(jié)構(gòu)時文庫片段上也含有這個酶切位點而造成APA位點的假陽性,我們在逆轉(zhuǎn)錄的時候使用甲基化的dCTP替代正常的dCTP,而在第二鏈cDNA合成的時候換回正常的dCTP,這樣就可以在保證ο I i go dT中的Gsu I酶切位點完好而其他識別位點被甲基化封閉,避免了假陽性結(jié)果的產(chǎn)生。
[0022]4.TT標簽用于篩選數(shù)據(jù)精確定位APA位點。我們設(shè)計用于反轉(zhuǎn)的引物中含有18個T。Gsu I移除Poly A時切去14個A,2個A的粘性末端在末端修飾時被切除,所以真正留在文庫片段上的2個T用以標記文庫片段的APA位點。
【專利附圖】
【附圖說明】
[0023]圖1本發(fā)明的3T_Seq技術(shù)的實驗原理圖。
【具體實施方式】
[0024]【具體實施方式】中使用的緩沖液成分如下:
[0025] 配制緩沖液所需的試劑貯存母液(可從商業(yè)公司購置,也可購買相關(guān)試劑自行配制):
[0026]
【權(quán)利要求】
1.一種基于3T-seq全基因組范圍分析APA的方法,其特征在于,包括:(1)含有01180dT引物的磁珠的制備;(2)用所述磁珠與總RNA混合,篩選含有Poly A的RNA ; (3)逆轉(zhuǎn)錄,雙鏈cDNA第二鏈合成,雙鏈cDNA斷裂;(4)在DNA水平移除Poly A結(jié)構(gòu);(5)末端修飾后連接測序接頭;(6)文庫回收及擴增。
2.根據(jù)權(quán)利要求1所述的一種基于3T-Seq全基因組范圍分析APA的方法,其特征在于,所述oligo dT引物5’端含有Gsu I酶切位點,用以后續(xù)移除Poly A結(jié)構(gòu)。
3.根據(jù)權(quán)利要求2所述的一種基于3T-Seq全基因組范圍分析APA的方法,其特征在于,所述oligo dT引物的5’端含有Gsu I的酶切位點的保護序列。
4.根據(jù)權(quán)利要求1所述的一種基于3T-Seq全基因組范圍分析APA的方法,其特征在于,所述oligo dT引物的5’端用生物素修飾,用以與帶鏈霉親和素的磁珠連接。
5.根據(jù)權(quán)利要求1所述的一種基于3T-Seq全基因組范圍分析APA的方法,其特征在于,所述 oligo dT 引物序列為 5’ -GAGCTAGTTCTGGAGTTTTTTTTTTTTTTTTTTVN-3’。
6.根據(jù)權(quán)利要求2所述的一種基于3T-Seq全基因組范圍分析APA的方法,其特征在于,所述逆轉(zhuǎn)錄使用未甲基化的dATP、dGTP、dTTP和甲基化的dCTP,以封閉基因序列中的Gsu I酶切位點。
7.根據(jù)權(quán)利要求2所述的一種基于3T-Seq全基因組范圍分析APA的方法,其特征在于,在所述雙鏈cDNA第二鏈合成中,使用未甲基化的dCTP、dATP、dGTP和dUTP,通過RNaseH、E.coli DNA聚合酶、E.coli DNA連接酶的作用進行合成。
8.根據(jù)權(quán)利要求1所述的一種基于3T-Seq全基因組范圍分析APA的方法,其特征在于,所述雙鏈cDNA的斷裂,使用雙鏈DNA斷裂酶處理、DNase I處理或超聲斷裂。
9.根據(jù)權(quán)利要求2所述的一種基于3T-Seq全基因組范圍分析APA的方法,其特征在于,所述移除Poly A結(jié)構(gòu)為:利用Gsu I酶進行酶切,釋放連接在所述磁珠上的目的片段。
10.根據(jù)權(quán)利要求1所述的一種基于3T-seq全基因組范圍分析APA的方法,其特征在于,適用于起始總RNA量為10ug-100ug。
【文檔編號】C12Q1/68GK103911449SQ201410138517
【公開日】2014年7月9日 申請日期:2014年4月8日 優(yōu)先權(quán)日:2014年4月8日
【發(fā)明者】趙小東, 邵志峰, 康亞妮, 賴登攀, 吳俊
申請人:上海交通大學(xué)