專利名稱:一種基于接頭連接的DNA PCR-Free標(biāo)簽文庫構(gòu)建方法
技術(shù)領(lǐng)域:
本發(fā)明涉及核酸測序技術(shù)領(lǐng)域,特別是基于接頭連接的DNA PCR-Free標(biāo)簽文庫技 術(shù)領(lǐng)域。另外,本發(fā)明還涉及標(biāo)簽技術(shù),以及實現(xiàn)多個樣品在同一反應(yīng)體系中進(jìn)行文庫構(gòu)建 的方法。本發(fā)明的方法特別適用于第二代測序技術(shù),尤其是solexa測序技術(shù)。
背景技術(shù):
Illumina公司提供的Solexa DNA測序平臺,可在一個反應(yīng)中同時加入四種帶熒 光標(biāo)記的核苷酸,采用邊合成邊測序(Sequencing By Synthesis, SBS),具有所需樣品量 少,高通量,高精確性,擁有簡單易操作的自動化平臺和功能強(qiáng)大等特點[1-4]。文庫構(gòu)建首 先需要將目的片段進(jìn)行末端修復(fù),在目的片段的3’末端連接“A”堿基,將3’末端帶有“A” 堿基的目的片段與DNA接頭(也稱為adapter)連接,通過PCR反應(yīng)將目的片段進(jìn)行擴(kuò)增, 最后回收含有DNA接頭的目的片段文庫,見
圖1。含有DNA接頭的目的片段文庫與測序芯片 上面的DNA接頭進(jìn)行雜交,通過橋式PCR進(jìn)行擴(kuò)增后,最后邊合成邊測序。在每個循環(huán)過程 里,熒光標(biāo)記的核苷和聚合酶被加入到單分子陣列中。互補的核苷和核苷酸片斷的第一個 堿基配對,通過酶加入到引物上。多余的核苷被移走。這樣每個單鏈DNA分子通過互補堿 基的配對被延伸,針對每種堿基的特定波長的激光激發(fā)結(jié)合上的核苷的標(biāo)記,這個標(biāo)記會 釋放出熒光,最后收集到的熒光信號來翻譯成堿基序列。目前這種DNA建庫方法可以根據(jù) 需求運用于各種研究領(lǐng)域,如基因組的De Novo測序,基因組重測序、轉(zhuǎn)錄組測序和表觀基 因組測序等?;谏鲜鼋◣旆椒╥llumina公司也推出了 DNA標(biāo)簽(也稱為index)建庫方法, 如圖2所示。在DNA標(biāo)簽建庫流程中,PCR過程使用了 3條PCR標(biāo)簽引物,通過PCR導(dǎo)入 標(biāo)簽來構(gòu)建DNA標(biāo)簽文庫[5]。專利申請W02005068656A1和W02008093098A2中公開了一 種使用標(biāo)簽序列標(biāo)記核酸樣品的來源從而可以將樣品進(jìn)行混合測序的方法,可以通過PCR 的過程將特定的核苷酸序列(即,標(biāo)簽序列)通過PCR導(dǎo)入到文庫中,PCR標(biāo)簽引物序列見 表1。這些帶有標(biāo)簽的文庫可以根據(jù)需求進(jìn)行任意混合,然后通過solexa測序儀器進(jìn)行測 序,最后將數(shù)據(jù)按標(biāo)簽標(biāo)簽序列進(jìn)行分類。但是illumina公司提供的標(biāo)簽文庫制備的方法存在著一些缺陷第一、目前 illumina公司只提供12個長度為6bp的標(biāo)簽序列,標(biāo)簽的數(shù)量較少,隨著solexa測序通 量的增加,不能對大量樣本進(jìn)行混合測序?qū)⑹且粋€巨大的缺陷;第二、目前illumina公司 提供的標(biāo)簽建庫方法是通過PCR反應(yīng)將標(biāo)簽序列導(dǎo)入到目的片段文庫中,需要3條PCR引 物對目的片段進(jìn)行擴(kuò)增(兩條公用引物和一條PCR標(biāo)簽引物,如表1),而且PCR擴(kuò)增效率不 高。第三、illumina公司提供的標(biāo)簽建庫方法中接頭不包含標(biāo)簽序列,每一個標(biāo)簽文庫需 要通過一個PCR反應(yīng)來導(dǎo)入標(biāo)簽序列,然后針對每一個標(biāo)簽文庫都需要切膠回收,將切膠 回收后的標(biāo)簽?zāi)康钠挝膸祀S后進(jìn)行混合,這樣不僅費時費力,而且費用也較高。因此,對標(biāo)簽的序列及標(biāo)簽引入方法進(jìn)行優(yōu)化和改進(jìn),使標(biāo)簽引入的效率提高,擴(kuò) 大標(biāo)簽序列的數(shù)量,才能滿足高通量的建庫的要求,以適應(yīng)測序通量不斷提高的現(xiàn)狀,使測序儀器的產(chǎn)能充分利用,降低測序的成本。表1 illumina公司提供的標(biāo)簽序列及相對應(yīng)的PCR標(biāo)簽引物序列
公用PCR引物1GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT公用PCR引物2AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGA CGCTCTTCCGATCTIndexlATCACGindexl PCR 引物CAAGCAGAAGACGGCATACGAGATCGTGATGTGACTGGAGTTCIndex2CGATGTindex2PCR 引物CAAGCAGAAGACGGCATACGAGATACATCGGTGACTGGAGTTCIndex3TTAGGCindex3 PCR 引物CAAGCAGAAGACGGCATACGAGATGCCTAAGTGACTGGAGTTCIndex4TGACCAindex4 PCR 引物CAAGCAGAAGACGGCATACGAGATTGGTCAGTGACTGGAGTTCIndex5ACAGTGindex5 PCR 引物CAAGCAGAAGACGGCATACGAGATCACTGTGTGACTGGAGTTCIndex6GCCAATindex6 PCR 引物CAAGCAGAAGACGGCATACGAGATATTGGCGTGACTGGAGTTCIndex7CAGATCindex7 PCR 引物CAAGCAGAAGACGGCATACGAGATGATCTGGTGACTGGAGTTCIndexSACTTGAindex8 PCR 引物CAAGCAGAAGACGGCATACGAGATTCAAGTGTGACTGGAGTTCIndex9GATCAGindex9PCR·引物CAAGCAGAAGACGGCATACGAGATCTGATCGTGACTGGAGTTCIndexlOTAGCTTindexlO PCR 引物CAAGCAGAAGACGGCATACGAGATAAGCTAGTGACTGGAGTTCIndexllGGCTACindexl IPCR 引物CAAGCAGAAGACGGCATACGAGATGTAGCCGTGACTGGAGTTCIndexl2CTTGTAindexl2 PCR 引物CAAGCAGAAGACGGCATACGAGATTACAAGGTGACTGGAGTTC
發(fā)明內(nèi)容
鑒于目前illumina公司的solexa測序平臺提供的DNA標(biāo)簽文庫制備方法的不 足,本發(fā)明改良了 DNA標(biāo)簽文庫的制備方法,通過連接DNA PCR-Free標(biāo)簽接頭來導(dǎo)入標(biāo)簽 序列,不需要經(jīng)過PCR反應(yīng)便可成功的構(gòu)建DNA標(biāo)簽文庫,并應(yīng)用于solexa DNA測序。通過測試含標(biāo)簽序列的DNA PCR-Free標(biāo)簽接頭的連接效率和標(biāo)簽核酸序列的識 別率,優(yōu)化并篩選出161條長度為8bp的DNA標(biāo)簽序列(如表2,8bp的DNA標(biāo)簽序列)及 DNA PCR-Free標(biāo)簽接頭序列。這些長度為8bp的標(biāo)簽之間的差異在4個堿基,即至少4個堿基序列不同。當(dāng)標(biāo) 簽的8個堿基中的任意一個堿基出現(xiàn)測序錯誤或合成錯誤,都不影響到標(biāo)簽的最終識別?;谀壳癷llumina公司的solexa測序平臺提供的DNA標(biāo)簽文庫制備方法,本發(fā)明改良了標(biāo)簽序列,分別設(shè)計了長度為8bp獨特的標(biāo)簽序列,將標(biāo)簽嵌入DNA接頭中,可以 分別本發(fā)明設(shè)計的161個DNAPCR-Free標(biāo)簽接頭用于構(gòu)建標(biāo)簽文庫的方法,不僅能提高了 DNA標(biāo)簽文庫的制備的效率,增大了 DNA樣品的測序通量,也能提高標(biāo)簽的識別率,極大的 降低了單個樣品的solexa測序費用。標(biāo)簽設(shè)計首先需要考慮標(biāo)簽序列之間的可識別性和識別率的問題,然后需要考慮 標(biāo)簽序列混合之后的每個位點的GT與AC堿基含量的平衡問題,最后考慮數(shù)據(jù)產(chǎn)出的可重 復(fù)性和準(zhǔn)確性。在設(shè)計標(biāo)簽的過程中,本發(fā)明充分考慮到以上幾個因素,同時避免了標(biāo)簽的 核酸序列出現(xiàn)3或3個以上連續(xù)的堿基,這樣可以降低序列在合成過程中或測序過程中的 錯誤率。同時盡量避免標(biāo)簽引物接頭自身形成發(fā)夾結(jié)構(gòu),提高DNA標(biāo)簽接頭的連接效率。本發(fā)明對illumina提供的DNA接頭序列進(jìn)行優(yōu)化,將標(biāo)簽設(shè)計為長度為8bp的特 定序列,通過含有所述標(biāo)簽序列的DNA PCR-Free標(biāo)簽接頭的連接將標(biāo)簽序列導(dǎo)入目的文庫 中。這樣將建庫方法優(yōu)化以后,不需要通過PCR反應(yīng)來構(gòu)建DNA標(biāo)簽文庫。目前為止,通過 這些DNA PCR-Free標(biāo)簽接頭導(dǎo)入標(biāo)簽的建庫方法及標(biāo)簽序列,并沒有相關(guān)的報道。如圖3 所示為illumina公司的DNA標(biāo)簽建庫流程圖,圖4為優(yōu)化后基于接頭連接的DNA PCR-Free 標(biāo)簽文庫構(gòu)建方法實驗流程圖。表2長度為8bp的DNA標(biāo)簽序列(DNA Index-Ι)及PCR-Free標(biāo)簽序列(PCR-Free Index-Ν),PCR-Free Index-N與 DNA PCR-Free 接頭 1. O 等摩爾退火后形成PCR-Free 標(biāo)簽接 頭。退火條件為DNA PCR-Free接頭1. O與PCR-Free Index-N等摩爾量混合后,95°C IOmin ; 700C IOmin ;65°C IOmin ;60°C IOmin ;55°C IOmin ;50°C IOmin ;4°C ⑴。升溫至 95°C后,所有 降溫速度控制為每秒0. 1°C緩慢降溫,讓兩條序列結(jié)合在一起形成Y型結(jié)構(gòu)的PCR-Free標(biāo) 簽接頭。
DNA PCR-Free 接 頭1.0AATGA TACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTT CCGATCTDNA Index-ICATTGCTTPCR-Free Index-I5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACCATTGCTTATCTC GTATGCCGTCTTCTGCTTGDNA Index-2TTCGGATTPCR-Free Index-25-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACTTCGGATTATCTC GTATGCCGTCTTCTGCTTG
6DNA Index-3TCATCATTPCR-Free Index-35-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACTCATCATTATCTC GTATGCCGTCTTCTGCTTGDNA Index-4GCTCCTGTPCR-Free Index-45-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACGCTCCTGTATCTC GTATGCCGTCTTCTGCTTGDNA Index-5AGCTCGGTPCR-Free Index-55-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACAGCTCGGTATCTC GTATGCCGTCTTCTGCTTGDNA Index-6CAACAGGTPCR-Free Index-65-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACCAACAGGTATCT CGTATGCCGTCTTCTGCTTGDNA Index-7TTCAAGGTPCR-Free Index-75-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACTTCAAGGTATCTC GTATGCCGTCTTCTGCTTGDNA Index-8CCTAACGTPCR-Free Index-85-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACCCTAACGTATCTC GTATGCCGTCTTCTGCTTGDNA Index-9CACGTAGTPCR-Free Index-95-Phos/GATCGGAAGAGCACACGTCTGAACTCC.AGTCACCACGTAGTATCTC GTATGCCGTCTTCTGCTTGDNA Index-10GTAAGAGTPCR-Free Index-105-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACGTAAGAGTATCT CGTATGCCGTCTTCTGCTTGDNA Index-IlTACCTTCTPCR-Free Index-Il5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACTACCTTCTATCTC GTATGCCGTCTTCTGCTTGDNA Index-12AAGTCTCTPCR-Free Index-125-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACAAGTCTCTATCTC GTATGCCGTCTTCTGCTTGDNA Index-13AGAGATCTPCR-Free Index-135-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACAGAGATCTATCT CGTATGCCGTCTTCTGCTTGDNA Index-14CCAGCGCTPCR-Free Index-145-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACCCAGCGCTATCTC GTATGCCGTCTTCTGCTTGDNA Index-15ATGAACCTPCR-Free Index-155-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACATGAACCTATCTC GTATGCCGTCTTCTGCTTGDNA Index-16ACCAGACTPCR-Free Index-165-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACACCAGACTATCT CGTATGCCGTCTTCTGCTTGDNA Index-17CTATAACTPCR-Free Index-175-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACCTATAACTATCTC
權(quán)利要求
一組DNA標(biāo)簽,所述DNA標(biāo)簽包括如下或由如下組成表2所示的161個DNA標(biāo)簽或與之相差1個堿基的DNA標(biāo)簽中的至少10個,或至少20個,或至少30個,或至少40個,至少50個,或至少60個,或至少70個,或至少80個,或90個,或至少100個,或至少110個,或至少120個,或至少130個,或至少140個,或至少150個,或全部161個,所述DNA標(biāo)簽優(yōu)選地至少包括表2所示的161個DNA標(biāo)簽的DNA Index1~DNA Index10,或DNA Index11~DNA Index20,或DNA Index21~DNA Index30,或DNA Index31~DNA Index40,或DNA Index41~DNA Index50,或DNA Index51~DNA Index60,或DNA Index61~DNA Index70,或DNA Index71~DNA Index80,或DNA Index81~DNA Index90,或DNA Index91~DNA Index100,或DNA Index101~DNA Index110,或DNA Index111~DNA Index120,或DNA Index121~DNA Index130,或DNA Index131~DNA Index140,或DNA Index141~DNA Index150,或DNA Index151~DNA Index161,或者他們?nèi)魏蝺蓚€或多個的組合。
2.權(quán)利要求1所述的DNA標(biāo)簽,其中所述的相差1個堿基包括標(biāo)簽中1個堿基的取代、 添加或刪除。
3.權(quán)利要求1或2所述的DNA標(biāo)簽用于構(gòu)建DNA標(biāo)簽文庫,優(yōu)選的DNAPCR-Free標(biāo)簽 文庫的用途,其中DNA標(biāo)簽文庫的DNA標(biāo)簽接頭包含所述DNA標(biāo)簽,從而構(gòu)成各自相對應(yīng)的 DNA標(biāo)簽接頭,所述DNA標(biāo)簽接頭優(yōu)選地用作DNA PCR-Free標(biāo)簽文庫的DNA PCR-Free接 頭。
4.權(quán)利要求3所述的用途,其中所述DNA標(biāo)簽插入DNAPCR-Free標(biāo)簽接頭中,或通過 或不通過連接子連接在DNA接頭的3,末端,優(yōu)選地插入DNA PCR-Free標(biāo)簽接頭中。
5.通過權(quán)利要求1或2所述的DNA標(biāo)簽構(gòu)建的DNA標(biāo)簽文庫,優(yōu)選的DNAPCR-Free標(biāo) 簽文庫。
6.含有權(quán)利要求1或2所述的DNA標(biāo)簽的一組DNAPCR-Free標(biāo)簽接頭,其中所述DNA PCR-Free標(biāo)簽接頭優(yōu)選地用作DNA PCR-Free標(biāo)簽文庫的接頭,所述一組DNA PCR-Free標(biāo) 簽接頭由DNA PCR-Free接頭1. 0和PCR-Free標(biāo)簽序列組成,所述PCR-Free標(biāo)簽序列包括 如下或由如下組成表2所示161個PCR-Free標(biāo)簽序列或與其所包含的DNA標(biāo)簽序列相差 1個堿基的PCR-Free標(biāo)簽序列中的至少10個,或至少20個,或至少30個,或至少40個,至 少50個,或至少60個,或至少70個,或至少80個,或90個,或至少100個,或至少110個, 或至少120個,或至少130個,或至少140個,或至少150個,或全部161個,所述PCR-Free標(biāo)簽序列優(yōu)選地至少包括表2所示的161個PCR-Free標(biāo)簽序列中的 PCR-Free Index-I PCR-Free Index-10,或PCR-Free Index-Il PCR-Free Index-20,或 PCR-Free Index-21 PCR-Free Index-30,或 PCR-Free Index-31 PCR-Free Index-40, 或 PCR-Free Index-41 PCR-Free Index-50,或 PCR-Free Index-51 PCR-Free Index-60,或 PCR-Free Index-61 PCR-Free Index-70,或 PCR-Free Index-71 PCR-Free Index-80,或 PCR-Free Index-81 PCR-Free Index-90,或 PCR-Free Index-91 PCR-Free Index-100,或 PCR-Free Index-IOl PCR-Free Index-I10, 或 PCR-Free Index-Ill PCR-Free Index-120,或 PCR-Free Index-121 PCR-Free Index-130,或 PCR-Free Index-131 PCR-Free Index-140,或 PCR-Free Index-141 PCR-Free Index-150,或 PCR-Free Index-151 PCR-Free Index-161,或者他們?nèi)魏蝺蓚€或多個的組合。
7.權(quán)利要求6所述的DNA PCR-Free標(biāo)簽接頭,其中所述的相差1個堿基包括標(biāo)簽中1 個堿基的取代、添加或刪除。
8.權(quán)利要求6或7所述的DNA PCR-Free標(biāo)簽接頭用于構(gòu)建DNA標(biāo)簽文庫,優(yōu)選的DNA PCR-Free標(biāo)簽文庫的用途。
9.通過權(quán)利要求6或7所述的DNAPCR-Free標(biāo)簽接頭構(gòu)建的DNA標(biāo)簽文庫,優(yōu)選的 DNA PCR-Free標(biāo)簽文庫。
10.一種DNA標(biāo)簽文庫的構(gòu)建方法,所述方法的特征在于使用包含標(biāo)簽的DNA PCR-Free接頭來構(gòu)建DNA標(biāo)簽文庫,優(yōu)選的DNA PCR-Free標(biāo)簽文庫,其中所述方法不包括 PCR步驟。
11.權(quán)利要求10所述的方法,其包括1)DNA模板準(zhǔn)備,提供η個DNA樣品,η為整數(shù)且1彡η彡161的整數(shù),優(yōu)選地η為整數(shù) 且2彡η彡161,所述DNA樣品來自所有真核和原核DNA樣品,包括但不限于人DNA樣品; 優(yōu)選地所述DNA模板長度為250bp ;2)末端修復(fù);3)DNA片段3,末端加“A”堿基;5)連接DNA標(biāo)簽接頭,其中對DNA片段使用不同的標(biāo)簽接頭,每一個標(biāo)簽接頭連接到 DNA片段的兩端。
12.權(quán)利要求10或11所述的方法,其中所述DNA標(biāo)簽接頭是如權(quán)利要求6或7所述的 DNA PCR-Free標(biāo)簽接頭。
13.通過權(quán)利要求10或11所述的方法構(gòu)建的DNA標(biāo)簽文庫,優(yōu)選的DNAPCR-Free標(biāo) 簽文庫。
全文摘要
本發(fā)明設(shè)計了長度為8bp獨特的161個標(biāo)簽序列,并將標(biāo)簽嵌入DNA接頭中從而形成DNA PCR-Free標(biāo)簽接頭。本發(fā)明還提供了通過連接DNA PCR-Free標(biāo)簽接頭來導(dǎo)入標(biāo)簽序列,不需要經(jīng)過PCR反應(yīng)而成功構(gòu)建DNA標(biāo)簽文庫,并應(yīng)用于solexa DNA測序。這樣將建庫方法優(yōu)化以后,不需要通過PCR反應(yīng)來構(gòu)建DNA標(biāo)簽文庫。
文檔編號C40B50/06GK101967476SQ20101029926
公開日2011年2月9日 申請日期2010年9月21日 優(yōu)先權(quán)日2010年9月21日
發(fā)明者于競, 周妍, 張艷艷, 田方, 章文蔚, 陳海燕, 龔梅花 申請人:深圳華大基因科技有限公司;深圳華大基因研究院