用于數(shù)字基因表達譜的標簽及其使用方法

文檔序號：3365806閱讀：365來源：國知局

專利名稱：用于數(shù)字基因表達譜的標簽及其使用方法
技術(shù)領(lǐng)域：
本發(fā)明涉及核酸測序技術(shù)領(lǐng)域，特別是數(shù)字基因表達譜技術(shù)領(lǐng)域。另外，本發(fā)明還涉及標簽及其使用方法，以及利用標簽技術(shù)構(gòu)建數(shù)字基因表達譜文庫的方法。本發(fā)明的方法特別適用于第二代測序技術(shù)，尤其是SOlexa測序技術(shù)。
背景技術(shù)：
數(shù)字基因表達譜(DigitalGene Expression Profiling，DGE)利用新一代高通量測序技術(shù)和高性能計算分析技術(shù)，能夠全面、經(jīng)濟、快速地檢測某一物種特定組織在特定狀態(tài)下的基因表達情況。數(shù)字基因表達譜已被廣泛應用于基礎(chǔ)科學研究、醫(yī)學研究和藥物研發(fā)等領(lǐng)域。利用高通量測序能夠得到數(shù)百萬個基因的特異標簽，而數(shù)字的序列信號可以準確、特異地反映對應基因的真實表達情況。這種技術(shù)甚至可以精確地檢測低至一兩個拷貝的稀有轉(zhuǎn)錄本，并精確定量高達十萬個拷貝的轉(zhuǎn)錄本的表達量變化。由于序列無需事先設(shè)計，DGE數(shù)據(jù)具有極佳的實時性，DGE可以檢測到許多未曾注釋的基因和基因組部位，為新基因的發(fā)現(xiàn)提供了良好的線索。這一技術(shù)進步允許科學家更加全面、準確地把握全基因組的基因表達情況。目前illumina公司的Solexa測序平臺提供的DGE文庫制備方法有兩種，分別為方法一 [1]和方法二 [2]。方法一，首先從總RNA樣品中分離mRNA，將mRNA反轉(zhuǎn)錄成cDNA，通過NlaIII酶酶切cDNA鏈，產(chǎn)生特異性的粘性末端。連接反應過程中GEX接頭1 (也稱為 GEX Adapter 1)與帶有粘性末端的目的片段進行連接。隨后通過限制性內(nèi)切酶MmeI酶切目的片段，該內(nèi)切酶識別TCCRAC(N)2tl，切成3’末端序列為兩個隨機堿基的粘性末端，然后與GEX接頭2 (也稱為GEX adapted)進行連接反應。目的片段連接GEX接頭2之后，通過特定的PCR引物對目的片段進行擴增，最后通過切膠回收目的片段文庫，如

圖1(A)。方法二，首先從總RNA樣品中分離mRNA，將mRNA反轉(zhuǎn)錄成cDNA，通過DpnII酶酶切cDNA鏈，產(chǎn)生特異性的粘性末端。連接反應過程中GEX接頭1與帶有粘性末端的目的片段進行連接。隨后通過限制性內(nèi)切酶MmeI酶切目的片段，該內(nèi)切酶識別TCCRAC(N)2q，切成3’末端序列為兩個隨機堿基的粘性末端，然后與GEX接頭2進行連接反應。目的片段連接GEX接頭2之后，通過特定的PCR引物對目的片段進行擴增，最后通過切膠回收目的片段文庫，如圖1 (B)。方法一和方法二這兩種文庫制備的方法不同之處兩種不同的建庫方法使用了不同的限制性內(nèi)切酶NlaIII和DpnII，這兩種酶識別的剪切位點不一樣NlaIII酶切位點為5，-CATG-3，，DpnII酶切位點為5，-GATC-3’，酶切產(chǎn)生的目的片段的5，末端序列不同，所以需要它們的GEX接頭1序列不同，最后構(gòu)建所得文庫所使用的測序引物也不一樣。這兩種文庫制備的方法存在著一些缺陷，即只能對單個文庫樣品進行Solexa Single End (illumina)測序，不能將DGE文庫樣品混合測序。因為隨著solexa測序通量的增加，1 個測序泳道(也稱為lane)所產(chǎn)出的數(shù)據(jù)遠遠大于目的片段所需求的數(shù)據(jù)，如果所構(gòu)建的文庫樣品不能進行混合測序，將在一定程度上“浪費測序資源”和影響到測序通量。

發(fā)明內(nèi)容
使用同樣的RNA樣品構(gòu)建DGE文庫，如果數(shù)據(jù)產(chǎn)出存在偏向性的問題，將會導致數(shù)據(jù)結(jié)果不可信，不能真實的反映樣品的相關(guān)信息，同時也將導致實驗結(jié)果重復性低。本發(fā)明基于目前illumina公司的solexa測序平臺提供的DGE文庫制備方法[1，2]，將一段特定長度的核苷酸序列(即標簽，也稱為index)嵌入接頭(也稱為adapter)中，同時考慮PCR引物的擴增效率和數(shù)據(jù)產(chǎn)出的偏向性因素，篩選出合適的標簽及含該標簽序列的接頭，并將該接頭用于混合樣品測序，確保數(shù)據(jù)的準確性和可重復性。標簽設(shè)計首先需要考慮標簽序列之間的序列差異程度和堿基識別率。在標簽混合量少于12個樣品的情況下，必須考慮到混合后的標簽上的每個堿基位點的GT含量。因為 solexa測序過程中，堿基G和T的激發(fā)熒光一樣，堿基A和C的激發(fā)光是一樣的，因此必須考慮堿基“GT”含量與堿基“AC”含量的“平衡”，最后考慮數(shù)據(jù)產(chǎn)出的準確性和可重復性。在設(shè)計標簽的過程中，本發(fā)明充分考慮到以上幾個因素，同時避免了標簽序列出現(xiàn)3或3個以上連續(xù)的堿基的出現(xiàn)，這樣可以降低序列在合成過程中或測序過程中的錯誤率。標簽序列本身嵌入接頭中，也要盡可能的避免出現(xiàn)發(fā)夾結(jié)構(gòu)或與測序引物及其反向互補序列相同的現(xiàn)象。在本發(fā)明的一個具體實施方式
中，將特定長度的核苷酸序列嵌入已有DGE文庫的的3，接頭(GEX adapter 2)的5，末端中形成GEX標簽接頭2，使用不同的GEX標簽接頭 2進行連接反應，構(gòu)建DGE標簽文庫。如圖2所示，首先從總RNA樣品中分離mRNA，將mRNA 反轉(zhuǎn)錄成cDNA，通過限制性內(nèi)切酶NlaIII酶切cDNA鏈，產(chǎn)生特異性的粘性末端。連接反應過程中，將GEX接頭1與帶有粘性末端的目的片段進行連接。隨后通過限制性內(nèi)切酶MmeI 酶切目的片段，該內(nèi)切酶識別TCCRAC(N)2tl，切成3’末端序列為兩個隨機堿基的粘性末端，然后與GEX標簽接頭2進行連接反應。目的片段連接GEX標簽接頭2之后，通過特定的PCR 引物對目的片段進行擴增，最后通過切膠回收目的片段文庫?；谀壳癷llumina公司的solexa測序平臺提供的DGE文庫制備方法，本發(fā)明針對DGE樣品建庫方法，設(shè)計了獨特的標簽序列，通過接頭將標簽嵌入DGE文庫的3’接頭中，成功的建立了數(shù)字基因表達譜標簽文庫(DGE標簽文庫，DGE index library)的建庫方法，適合任何真核生物RNA樣品的DGE標簽文庫構(gòu)建，并成功用于solexa測序，不僅增大了 DGE 樣品的測序通量，而且降低了 solexa針對DGE測序的費用。本發(fā)明基于目前illumina公司提供的Solexa Single End測序平臺，設(shè)計一段長度為IObp的特定標簽序列，將標簽序列嵌入接頭序列中。考慮到GEX標簽接頭2的連接效率，優(yōu)化并篩選出12條GEX標簽接頭，這些標簽之間的差異在5個堿基以上，當標簽的10 個堿基中的任意1個堿基出現(xiàn)測序錯誤或合成錯誤，都不影響到標簽的最終識別。表1為優(yōu)化篩選出來的12條標簽(indexl-12)序列，及其對應的GEX標簽接頭2 序列(Gex IndexN adapter2 F 禾口 Gex IndexN adapter2 R, N = 1-12)信息。這些標簽及其GEX標簽接頭2可以應用于任何DGE標簽文庫的構(gòu)建。這些標簽應用于DGE樣品的文庫構(gòu)建并通過solexa測序的方法，目前尚未有報道。表IDGE標簽序列及GEX標簽接頭2序列，其中每一個GEX標簽接頭2由有義序列 Gex indexN adapter2 F 禾口反義序列 Gex indexN adapter2 R 經(jīng)退火形成。
權(quán)利要求
1.一組標簽，所述一組標簽包括如下或由如下組成表1所示12個標簽與其相差1個堿基的標簽中的至少2個，或至少3個，或至少4個，或至少5個，至少6個，或至少7個，或至少8個，或至少9個，或至少10個，或至少11個，或全部12個，所述一組標簽優(yōu)選地至少包括表1所示的12個標簽中的Indexl和IndeX2，或IndeX3 禾口 Index4,或 Index5 禾口 Index6,或 Index7 禾口 Index8,或 Index9 禾口 IndexlO,或 Indexll 禾口 Indexl2,或者他們?nèi)魏蝺蓚€或多個的組合。
2.權(quán)利要求1所述的標簽，其中所述相差1個堿基包括對表1所示12個標簽的序列中 1個堿基的取代、添加或缺失。
3.權(quán)利要求1或2所述的標簽用于數(shù)字基因表達譜標簽文庫構(gòu)建并測序的用途，其中所述標簽包含在GEX接頭2的5’末端中，從而構(gòu)成各自相對應的GEX標簽接頭2，其用作數(shù)字基因表達譜標簽文庫的3’接頭。
4.權(quán)利要求3所述的用途，所述標簽包含在GEX接頭2的5’末端中，包括標簽通過或不通過連接子與GEX接頭1的5’末端相連，或者插入GEX接頭2的5’末端中，優(yōu)選的是不通過連接子與GEX接頭1的5’末端相連。
5.使用權(quán)利要求1或2所述的標簽構(gòu)建的數(shù)字基因表達譜標簽文庫。
6.包含權(quán)利要求1所述的標簽的一組GEX標簽接頭2，其在5’末端包含權(quán)利要求1所述的標簽，并且優(yōu)選地用作數(shù)字基因表達譜標簽文庫3’接頭，所述一組GEX標簽接頭2包括如下或由如下組成表1所示12個GEX標簽接頭2或與其中包含的標簽序列相差1個堿基的接頭中的至少2個，或至少3個，或至少4個，或至少5個，至少6個，或至少7個，或至少8個，或至少9個，或至少10個，或至少11個，或全部12個，所述一組GEX標簽接頭2優(yōu)選地至少包括表2所示的12個GEX標簽接頭2中的Gex Indexl adapter2 F/R 禾口 Gex Index2 adapter2 F/R,或 Gex Index3 adapter2 F/R 禾口 Gex Index4 adapter2 F/R,或Gex Index5 adapter2 F/R 禾口 Gex Index6 adapter2 F/R,或Gex Index7 adapter2 F/R 禾口 Gex Index8 adapter2 F/R,或 Gex Index9 adapter2 F/R 禾口 Gex IndexlO adapter2 F/R,或 Gex Indexll adapter2 F/R 禾口 Gex Indexl2 adapter2 F/R,或者他們?nèi)魏蝺蓚€或多個的組合。
7.權(quán)利要求6所述的GEX標簽接頭2，其中所述相差1個堿基包括對標簽序列中1個堿基的取代、添加或缺失。
8.權(quán)利要求6或7所述的GEX標簽接頭2用于數(shù)字基因表達譜標簽文庫構(gòu)建并測序的用途，所述GEX標簽接頭2用作數(shù)字基因表達譜標簽文庫的3’接頭。
9.使用權(quán)利要求6或7所述的GEX標簽接頭2構(gòu)建的數(shù)字基因表達譜標簽文庫，其中所述GEX標簽接頭2用作數(shù)字基因表達譜標簽文庫的3’接頭。
10.一種構(gòu)建數(shù)字基因表達譜標簽文庫并測序的方法，所述方法的特征在于使用不同的選自表1的GEX標簽接頭2與其中包含的標簽序列相差1個堿基的接頭用作數(shù)字基因表達譜標簽文庫的3’接頭，構(gòu)建數(shù)字基因表達譜標簽文庫。
11.權(quán)利要求10所述的方法，其包括1)提供η個總RNA樣品，η為整數(shù)且1 彡12，優(yōu)選地彡12，所述RNA樣品來自任何真核生物RNA樣品，包括但不限于水稻、小鼠和人的RNA樣品，從總RNA樣品中分離 mRNA,將mRNA反轉(zhuǎn)錄成cDNA ；2)添加GEX接頭1通過5，限制性內(nèi)切酶酶切cDNA片段產(chǎn)生帶有5，粘性末端的cDNA 片段，所述5’限制性內(nèi)切酶包括但不限于NlaIII和DpnII，然后通過連接反應將GEX接頭 1與帶有5’粘性末端的cDNA片段進行連接；3)添加GEX標簽接頭2通過3’限制性內(nèi)切酶酶切上述步驟2)所得的cDNA片段產(chǎn)生帶有3’粘性末端的cDNA片段，所述限制性內(nèi)切酶包括但不限于Mmel，然后通過連接反應將 GEX標簽接頭2與帶有3’粘性末端的cDNA片段進行連接；4)通過PCR對目的片段進行擴增，最后通過回收目的片段文庫；5)混合當η> 1時，將各樣品的PCR擴增產(chǎn)物混合在一起；當η = 1時，直接進行步驟6)；6)測序?qū)⒏鳂悠返腜CR擴增產(chǎn)物利用Solexa測序技術(shù)進行測序。
12.權(quán)利要求11所述的方法，其中所述GEX標簽接頭1包括如接頭當所述5，限制性內(nèi)切酶是DpnII時，GEX標簽接頭1是Gex Adapter IA 5 ‘ P-GATCGTCGGACTGTAGAACTCTGAAC5' ACAGGTTCAGAGTTCTACAGTCCGAC ；和當所述5，限制性內(nèi)切酶是NlaII時，GEX標簽接頭1是Gex Adapter IB 5 ‘ P-TCGGACTGTAGAACTCTGAAC 5 ‘ ACAGGTTCAGAGTTCTACAGTCCGACATG。
13.權(quán)利要求11所述的方法，其中所述GEX標簽接頭2包括表1所示12個GEX標簽接頭2或與其中包含的標簽序列相差1個堿基的接頭中的至少2個，或至少3個，或至少4 個，或至少5個，至少6個，或至少7個，或至少8個，或至少9個，或至少10個，或至少11 個，或全部12個，所述一組GEX標簽接頭2優(yōu)選地至少包括表2所示的12個GEX標簽接頭2中的Gex Indexl adapter2 F/R 禾口 Gex Index2 adapter2 F/R,或 Gex Index3 adapter2 F/R 禾口 Gex Index4 adapter2 F/R,或Gex Index5 adapter2 F/R 禾口 Gex Index6 adapter2 F/R,或Gex Index7 adapter2 F/R 禾口 Gex Index8 adapter2 F/R,或 Gex Index9 adapter2 F/R 禾口 Gex IndexlO adapter2 F/R,或 Gex Indexll adapter2 F/R 禾口 Gex Indexl2 adapter2 F/R,或者他們?nèi)魏蝺蓚€或多個的組合。
14.權(quán)利要求10或13所述的方法，其中所述相差1個堿基包括標簽序列中1個堿基的取代、添加或缺失。
15.權(quán)利要求11所述的方法，其中步驟4)中的PCR使用如下PCR引物當所述5’限制性內(nèi)切酶是DpnII時，PCR引物是Gex PCR Primer 1 5 ‘ CAAGCAGAAGACGGCATACGA，禾Π Gex PCR Primer 2A·5 ‘ AATGATACGGCGACCACCGACAGGTTCAGAGTTCTACAGTCCGA ；以及當所述5’限制性內(nèi)切酶是NlaIII時，PCR引物是Gex PCR Primer 1·5 ‘ CAAGCAGAAGACGGCATACGA，禾ΠGex PCR Primer 2B5' AATGATACGGCGACCACCGACAGGTTCAGAGTTCTACAGTCCGA。
16.權(quán)利要求11所述的方法，其中利用Solexa測序技術(shù)進行測序中使用的測序引物包括當所述5，限制性內(nèi)切酶是NlaIII時，使用測序引物為Gex Sequencing PrimerlA 5' C GACAGGTTCAGAGTTCTACAGTCCGACGATC ；當所述5’限制性內(nèi)切酶是DpnII時，使用測序引物為 Gex Sequencing PrimerlB 5' CCGACAGGTTCAGAGTTCTACAGTCCGACATG。
17.通過權(quán)利要求10或11所述的方法構(gòu)建的數(shù)字基因表達譜標簽文庫。
全文摘要
本發(fā)明基于目前illumina公司提供的Solexa Single End測序平臺，針對數(shù)字基因表達譜文庫(DGE)樣品建庫方法，設(shè)計了獨特的標簽序列(index1-12)，通過接頭將標簽嵌DGE文庫的3’接頭中，成功的建立了數(shù)字基因表達譜標簽文庫(DGE標簽文庫)的建庫方法，適合任何真核生物RNA樣品的DGE標簽文庫構(gòu)建，并成功用于solexa測序，不僅增大了DGE樣品的測序通量，而且降低了solexa針對DGE測序的費用。
文檔編號C40B50/06GK102409044SQ201010299248
公開日2012年4月11日申請日期2010年9月21日優(yōu)先權(quán)日2010年9月21日
發(fā)明者于競, 張艷艷, 田方, 章文蔚, 龔梅花申請人:深圳華大基因研究院, 深圳華大基因科技有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：章文蔚;張艷艷;田方;于競;龔梅花
技術(shù)所有人：深圳華大基因科技有限公司;深圳華大基因研究院
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：功能高分子材料，污水處理，電化學合成
2、趙老師：1.?金屬材料表面改性技術(shù) 2.?超硬陶瓷材料制備與表面硬化 3.?規(guī)整納米材料制備及應用研究
3、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
4、王老師：1.精密/超精密加工技術(shù) 2.超聲波特種加工 3.超聲/電火花復合加工 4.超聲/激光復合加工 5.復合能量材料表面改性 6.航空航天特種裝備研發(fā)
5、郝老師：1.?先進材料制備 2.?環(huán)境及能源材料的制備及表征 3.?功能涂層的設(shè)計及制備 4.?金屬基復合材料制備
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

基因表達序列標簽相關(guān)技術(shù)

基因標簽相關(guān)技術(shù)

基因表達式相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

用于數(shù)字基因表達譜的標簽及其使用方法