專利名稱:甲基化高通量檢測方法
技術(shù)領(lǐng)域:
本發(fā)明涉及高通量基因組甲基化DNA檢測領(lǐng)域,特別是提供了一種結(jié)合序列捕獲和重亞硫酸鹽(bisulfite)測序的方法。另外,本發(fā)明還涉及外顯子組測序和基于重亞硫酸鹽轉(zhuǎn)換的甲基化分析測序技術(shù)領(lǐng)域。本發(fā)明還涉及甲基化標(biāo)簽(Index)接頭技術(shù),可以實現(xiàn)在一個芯片上同時進行幾個樣品的捕獲。本發(fā)明的方法特別適用于第二代測序技術(shù),尤其是solexa測序技術(shù)。
背景技術(shù):
DNA甲基化是表觀遺傳學(xué)研究領(lǐng)域最為熱點的方向之一,也正逐漸成為哺乳動物發(fā)育和癌癥等多種疾病的表觀遺傳學(xué)標(biāo)記。DNA甲基化不僅對染色質(zhì)結(jié)構(gòu)修飾,基因組穩(wěn)定性具有重要作用,而且在真核生物中,DNA甲基化參與多種生物學(xué)過程,如胚胎發(fā)育,基因組印記,X染色體失活,基因表達的調(diào)節(jié)與沉默,逆轉(zhuǎn)錄轉(zhuǎn)座子的沉默以及哺乳動物腫瘤等多 種疾病的發(fā)生(Brena RM et al. 2006 ;Egger G et al. 2004 ;Gu H et al. 2010)。DNA 甲基化生物標(biāo)記為多種疾病的早期評估包括對高危險個體的檢測評估,提供大量參考信息。目前,外顯子組測序和基于重亞硫酸鹽轉(zhuǎn)換的甲基化分析測序均已成熟。以Illumina Solexa、AB SOLiD和Roche 454為代表的第二代測序技術(shù)在近幾年得到快速發(fā)展,成為基因組學(xué)研究的重要工具。第二代測序技術(shù)最大的特點是高通量,其可對數(shù)以億計的DNA片段同時進行測序,目前一臺高通量測序儀一次可產(chǎn)生高達300Gb的數(shù)據(jù),相當(dāng)于將一個人的全基因組測序100次,高通量測序是通過超聲波或其他方法將基因組打斷成一系列的小片段,并在小片段的兩側(cè)加上接頭(adaptor),然后通過接頭引物進行橋式PCR或乳液PCR(emulsion PCR)擴增形成測序的基本單位,再根據(jù)接頭上的部分序列設(shè)計公共測序引物,對基因組DNA進行測序。當(dāng)前研究DNA甲基化的方法主要有基于PCR的甲基化分析方法、基于限制性內(nèi)切酶的甲基化分析方法、基于重亞硫酸鹽的甲基化分析方法和柱層析法等。重亞硫酸鹽處理結(jié)合高通量測序是研究甲基化最常用也是最準確的方法,重亞硫酸鹽測序法(bisulfite genomics sequencing)是利用重亞硫酸鹽將基因組DNA中的未甲基化的胞嘧啶(C)修飾為尿嘧啶(U),甲基化的胞嘧啶(C)保持不變,在PCR擴增中,尿嘧啶(U)將變成胸腺嘧啶(T),因此甲基化位點就成為一個普通的C/T單堿基多態(tài)性位點,其中等位基因胞嘧啶(C)的頻率即為基因甲基化的程度,該方法具有數(shù)據(jù)量大,成本高的缺點。結(jié)合高通量測序的還有甲基化DNA免疫共沉淀(Methylated DNA Immunoprecipitation,MeDIP)和甲基化CpG結(jié)合域(methyl-CpG binding domain,MBD)柱層析法,它們雖然能很好的對富含甲基化區(qū)域進行富集,但是覆蓋度相對均一,缺乏針對性。序列捕獲技術(shù)是一種對基因組特定區(qū)域進行選擇性富集的技術(shù),其通過合適的方法將感興趣的區(qū)域從基因組中分離出來,然后再對該目標(biāo)區(qū)域進行測序,這對于低成本地有針對性的基因組學(xué)研究有非常重要的意義。最近研究發(fā)現(xiàn)(BrenetF et al. 2011 ;Harder A et al. 2010 ;Suzuki MM etal. 2008):外顯子甲基化密度比之前認識到和期望的更為普遍,而第一個外顯子和第一個內(nèi)含子甲基化分布跟下游的外顯子和內(nèi)含子甲基化分布差異較大,大多下游區(qū)域甲基化的程度跟基因表達并非密切相關(guān)??傊?,轉(zhuǎn)錄起始位點周圍甲基化,第一個外顯子區(qū)域甲基化與基因沉默的關(guān)系比上游啟動子區(qū)域甲基化與之得關(guān)系更為密切。分析外顯子甲基化對基因表達的研究有重大意義?,F(xiàn)有研究大多是將基因組重亞硫酸鹽處理后,根據(jù)c —T轉(zhuǎn)換,設(shè)計特定的目標(biāo)區(qū)域的探針,捕獲靶區(qū)域甲基化的片段。這種方法在序列捕獲之前將基因組進行重亞硫酸鹽處理,增加了探針設(shè)計的難度及降低序列捕獲的效率、目的區(qū)域的覆蓋度,從而限制了應(yīng)用的廣泛性。
發(fā)明內(nèi)容
針對上述基于重亞硫酸鹽的甲基化研究方法中存在的問題,本發(fā)明提出了一種結(jié)合序列捕獲和重亞硫酸鹽測序的方法,該方法能夠通過一次序列捕獲試驗對幾個樣品中的目標(biāo)區(qū)域進行捕獲,能準確有效地分析目標(biāo)區(qū)域甲基化狀態(tài),降低探針設(shè)計的難度,增加操作及應(yīng)用的可行性,使得對全基因組內(nèi)感興趣的目標(biāo)序列和區(qū)域進行高通量高精度的甲基化檢測成為現(xiàn)實,并且該方法還具有針對性強以及節(jié)約成本和時間的特點。本發(fā)明涉及的目的區(qū)域是外顯子區(qū)域,將外顯子組捕獲與重亞硫酸鹽測序相結(jié) 合,以此來檢測人類全基因組外顯子組的甲基化分布情況,這對研究發(fā)現(xiàn)外顯子對基因表達調(diào)控的作用具有廣泛的應(yīng)用價值。該技術(shù)主要流程先將基因組DNA隨機打斷,加上特定接頭后用液相雜交方法進行序列捕獲,捕獲下來的DNA內(nèi)加入外源DNA然后再進行重亞硫酸鹽處理,對處理好的DNA進行PCR擴增,TA克隆檢測重亞硫酸鹽處理效果,然后對文庫進行定量檢測及用新一代測序儀進行高通量測序,最后進行特異性區(qū)域范圍內(nèi)高精度的甲基化狀況分析。該技術(shù)方案主要由以下五部分組成序列捕獲探針的選擇、文庫制備、序列捕獲、重亞硫酸鹽處理、上機測序及數(shù)據(jù)分析。+序列捕獲探針的選擇本技術(shù)方案中探針設(shè)計簡單,可以基于目前液相或者固相芯片雜交技術(shù)設(shè)計探針,探針長度可以從60mer-120mer不等。如選擇探針SureSelect Human All Exon 38Mkit (Agilent),該探針覆蓋了人全外顯子區(qū)域及部分miRNA區(qū)域,與基因組目的區(qū)域內(nèi)其中一條鏈互補,平均長度為120mer。+文庫制備步驟一樣品基因組DNA以及外源基因組DNA的片段化起始目的研究材料和作為外源基因組DNA的材料可以為任意物種(例如人,植物,昆蟲)的基因組DNA,利用物理或化學(xué)方法如超聲波片段化方法將基因組DNA打斷為200-300bp的片段。外源基因組DNA優(yōu)選地選擇沒有甲基化修飾的XDNA,其作用是在重亞硫酸鹽處理時與樣品一起高效共處理,對微量的DNA片段起到保護作用,最大限度的降低重亞硫酸鹽對微量DNA的破壞。取沒有蛋白、RNA等污染的完整基因組DNA約5 Ug以及作為外源基因組的X DNA,通過超聲片段化方法將基因組DNA打斷為大小200-300bp的片段。步驟二基因組DNA的末端修飾隨機打斷后的DNA回收純化后,通過T4DNA聚合酶(T4DNAPolymerase) ,Klenow片段(Klenow Fragment)和T4聚核苷酸激酶(T4Polynucleotide Kinase)等酶的作用進行末端修復(fù),形成平末端的DNA片段。然后利用Klenow片段(Klenow Frgment) (3,-5’exo_)聚合酶及dATP在補平的序列的3’末端加上“A”堿基。步驟三PEI (Paired-end Index)甲基化接頭(Adapter),也稱為雙末端標(biāo)簽甲基化接頭的連接3’末端加上“A”堿基的序列在T4DNA連接酶(T4DNA Ligase)的作用下與特殊設(shè)計且甲基化修飾的接頭(C位點甲基化修飾)進行連接,純化回收,如用MiniElutePCR Purification Kit(Qiagen)回收純化反應(yīng)體系中的DNA后,對其進行定量,如采用Qubit (Invitrogen)方法等。+序列捕獲取500_1000ng連接產(chǎn)物文庫進行液相或固相雜交,如采用Agilent液相雜交平臺或Nimblegen固相或液相雜交平臺進行,在雜交體系中同時加入接頭封閉序列待雜交完畢后,通過變性等方法收集捕獲的序列并純化,得到與雜交探針區(qū)域互補的DNA分子。 +重亞硫酸鹽處理將捕獲下來的DNA加入200ng片段化了的入DNA,然后一起用重亞硫酸鹽處理,如利用EZ DNA Methylation-Gold Kit (ZYMO)使非甲基化胞嘧啶轉(zhuǎn)換為尿嘧啶。步驟四PCR擴增及文庫切膠純化以重亞硫酸鹽轉(zhuǎn)換后的DNA為模板,加入PCR引物序列,用針對重亞硫酸鹽轉(zhuǎn)換后的DNA的熱啟動taq酶進行PCR擴增(可用常規(guī)的r_taq或其它聚合酶擴增),擴增產(chǎn)物可用例如如下三種方法進行純化,分別為磁珠純化、純化柱純化、2%的瓊脂糖膠電泳純化。純化回收的產(chǎn)物進行QPCR定量,然后待上機測序。+上機測序及數(shù)據(jù)分析將捕獲的序列經(jīng)過重亞硫酸鹽處理后在第二代測序平臺,例如在Solexa測序平臺上采用邊合成邊測序的方法進行序列測定。為了將來源于不同樣本制備的DNA文庫在測序后區(qū)分開來,6bp或Sbp的標(biāo)簽序列通過接頭或者PCR引物引入到片段的一側(cè),這樣可以方便將不同文庫直接混合后上機測序。分析數(shù)據(jù)時參考的序列為hgl8(已知的全基因組序列)測序所得的原始數(shù)據(jù)的分析流程參考LI Y et al. , Nature (2008) (Jffang, et al.,(2008). The DNA Methylome of Human Peripheral Blood Mononuclear Cells. Nature,456:60.),在實際應(yīng)用中,參考數(shù)據(jù)的選擇會隨著所研究的基因組來源不同而不同,基本分析過程包括以下主要步驟將測序得到的數(shù)據(jù)正鏈的C全部轉(zhuǎn)化成T,互補鏈的G全部轉(zhuǎn)化成 A,使用 SOAP 程序(Li R, Li Y.,Kristiansen K. & Wang, J. (2008). SOAP shortoligonucleotide alignment program. Bioinformatics, 24 :713-714.)分別 I匕對至 IjC 全部轉(zhuǎn)化為T,G全部轉(zhuǎn)化為A的hgl8參考基因組上,其中允許有兩個堿基的錯配。然后統(tǒng)計比對在目標(biāo)區(qū)域唯一位置的讀段(reads),并用這些比對上參考序列的讀段,以D^th > 4作為過濾參數(shù)進行過濾,將通過過濾后的位點的甲基化信息作為實際測到的甲基化信息,并以之為基礎(chǔ)進行后續(xù)的比對信息分析。與常規(guī)研究報道的重亞硫酸鹽處理基因組后再進行序列捕獲的測序方法不同,在本發(fā)明中,首先進行特定區(qū)域的序列捕獲,之后再用亞硫酸鹽處理。因此,在序列捕獲的過程中樣品的甲基化的狀態(tài)并沒發(fā)生變化,設(shè)計捕獲探針時就不需要考慮目的區(qū)域甲基化水平對序列捕獲效率的影響??梢圆东@所有目標(biāo)區(qū)域驗證其甲基化情況,而不必事先考慮甲基化分布再來設(shè)計芯片,獲得的數(shù)據(jù)更真實和充分。本發(fā)明可使序列捕獲中的探針設(shè)計方法較為簡單,且捕獲效率高,進而能夠就全面而準確地分析基因組甲基化水平。本技術(shù)方案中探針設(shè)計簡單,可以基于目前液相或者固相芯片雜交技術(shù)設(shè)計探針,探針長度可以從6 0-120mer不等。本技術(shù)在文庫構(gòu)建時,在序列捕獲前進行甲基化標(biāo)簽(Index)接頭的連接,這樣可將幾個樣品混合后同時進行序列捕獲,大大節(jié)省了成本,從而實現(xiàn)大樣本量的高通量甲基化水平檢測。
具體實施例方式下面將結(jié)合實施例對本發(fā)明的實施方案進行詳細描述,但是本領(lǐng)域技術(shù)人員將會理解,下列實施例僅用于說明本發(fā)明,而不應(yīng)視為限定本發(fā)明的范圍。本發(fā)明一方面提供了一種甲基化高通量檢測方法,其包括以下步驟序列捕獲探針的選擇、文庫制備、序列捕獲、重亞硫酸鹽處理、上機測序及數(shù)據(jù)分析,其中序列捕獲和重亞硫酸鹽處理在文庫制備的接頭連接步驟和PCR擴增及文庫切膠純化步驟之間進行。在本發(fā)明的一個具體實施方式
中,甲基化高通量檢測方法中的所述探針可以是用于液相或者固相芯片雜交的探針,優(yōu)選地所述探針的長度是60mer-120mer,更優(yōu)選地所述探針的平均長度為120mer。在本發(fā)明的一個具體實施方式
中,甲基化高通量檢測方法中的所述文庫制備步驟包括甲基化標(biāo)簽接頭的連接。在本發(fā)明的一個具體實施方式
中,甲基化高通量檢測方法中在序列捕獲前進行如下文庫制備步驟步驟一樣品基因組DNA以及外源基因組DNA的片段化樣品基因組DNA和作為外源基因組DNA可以是任意物種,包括但不限于人、植物、昆蟲的基因組DNA ;利用物理或化學(xué)方法,優(yōu)選的超聲波片段化方法將優(yōu)選的5 y g基因組DNA進行隨機打斷,優(yōu)選地打斷為200-300bp的片段;優(yōu)選地外源基因組DNA是沒有甲基化修飾的ADNA ;步驟二基因組DNA的末端修飾隨機打斷后的DNA回收純化后,通過優(yōu)選的T4DNA聚合酶、Klenow片段和T4聚核苷酸激酶酶的作用進行末端修復(fù),形成平末端的DNA片段;然后優(yōu)選地利用Klenow片段(3’ -5’ exo-)聚合酶及dATP在補平的序列的3’末端加上“A”堿基;步驟三PEI甲基化接頭的連接3’末端加上“A”堿基的序列在連接酶,優(yōu)選的T4DNA連接酶的作用下與甲基化修飾,優(yōu)選的C位點甲基化修飾的接頭進行連接,純化回收,對其進行定量。在本發(fā)明的一個具體實施方式
中,甲基化高通量檢測方法中所述PEI甲基化接頭包括PE Index_ 甲基化 adapter I Phos/TCAAGTAGATCGGAAGAGCACACGTCTGMCTCCAGTCAC (SEQ ID NO : I,所有 C位點甲基化修飾),和
PE Index_ 甲基化 adapter 2 TACACTCTTTCCCTACACGACGCTCTTCCGATCTACTTGAT (SEQ ID NO :2)。在本發(fā)明中可以改變上述接頭序列中下劃線部分的堿基,從而產(chǎn)生更多的、不同的標(biāo)簽引物,用于多種不同的樣品。在本發(fā)明的一個具體實施方式
中,甲基化高通量檢測方法中的序列捕獲步驟包括將文庫制備步驟中的連接產(chǎn)物文庫在固相或液相雜交平臺,優(yōu)選是液相雜交平臺進行雜交,其中優(yōu)選地使用500-1000ng連接產(chǎn)物文庫雜交,在雜交體系中同時加入接頭封閉序列;待雜交完畢后,通過變性等方法收集捕獲的序列并純化,得到與雜交探針區(qū)域互補的DNA分子,其中優(yōu)選地是對外顯子組進行捕獲。在本發(fā)明的一個具體實施方式
中,甲基化高通量檢測方法中的序列捕獲步驟中使用的接頭封閉序列是PEI甲基化接頭的連接步驟中所使用PEI甲基化接頭的互補序列,并 且選自PE Index_ 甲基化 adapter I Phos/TCAAGTAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC(SEQ ID NO :1),或PE Index_ 甲基化 adapter 2:TACACTCTTTCCCTACACGACGCTCTTCCGATCTACTTGAT(SEQ ID NO :2)的互補序列,其中所述接頭的所有C位點均經(jīng)甲基化修飾。在本發(fā)明的一個具體實施方式
中,甲基化高通量檢測方法中的重亞硫酸鹽處理步驟包括將序列捕獲步驟中得到的DNA片段化外源基因組DNA,一起用重亞硫酸鹽進行處理,并且外源基因組DNA優(yōu)選地是200ng經(jīng)片段化的\ DNA。本發(fā)明進一步提供了一種甲基化高通量檢測方法,其中在重亞硫酸鹽處理后進行如下文庫制備中的PCR擴增及文庫切膠純化的步驟以重亞硫酸鹽轉(zhuǎn)換后的DNA為模板,加入PCR引物序列進行PCR擴增,其中所使用的聚合酶包括針對重亞硫酸鹽轉(zhuǎn)換后的DNA的熱啟動taq酶、常規(guī)的r_taq或其它聚合酶擴增,優(yōu)選的是針對重亞硫酸鹽轉(zhuǎn)換后的DNA的熱啟動taq酶;對擴增產(chǎn)物進行純化,純化方法包括但不限于磁珠純化、純化柱純化、2%的瓊脂糖膠電泳純化;純化回收的產(chǎn)物進行QPCR定量,然后待上機測序。在本發(fā)明的一個具體實施方式
中,PCR擴增步驟進一步包括將優(yōu)選的6bp或8bp的標(biāo)簽序列通過接頭或者PCR引物引入到DNA片段的一側(cè)。在本發(fā)明的一個具體實施方式
中,在甲基化高通量檢測方法中根PCR擴增中使用的PCR引物序列包括Pl公用引物AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO 3),Indexl 引物CAAGCAGAAGACGGCATACGAGATCTTGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT(SEQID NO :4),和Index 2 引物CMGCAGAAGAC GGCATAC GAGATTCAAGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT (SEQID NO 5)。其中可以改變上述PCR引物中下劃線部分的堿基,從而產(chǎn)生更多的、不同的標(biāo)簽引物,用于多種不同的樣品。在本發(fā)明的一個具體實施方式
中,甲基化高通量檢測方法中的上機測序及數(shù)據(jù)分析包括將重亞硫酸鹽處理步驟得到的序列在測序平臺,優(yōu)選第二代測序平臺,更優(yōu)選的Solexa測序平臺上進行測序,并進行數(shù)據(jù)分析比較。本發(fā)明另一方面提供了根據(jù)本發(fā)明的甲基化高通量檢測方法構(gòu)建的測序文庫。本發(fā)明另一方面提供了根據(jù)本發(fā)明的甲基化高通量檢測方法構(gòu)建的測序文庫用于甲基化高通量測序的用途。進一步的,根據(jù)本發(fā)明的甲基化高通量檢測方法適用于外顯子組測序,進一步優(yōu) 選地用于檢測人類全基因組外顯子組的甲基化分布情況。
圖I :MDC PCR 2100 檢測結(jié)果。圖2 YH PCR 2100 檢測結(jié)果。圖3 :YH和MDC在每條染色體上的覆蓋度分布。其中紅色柱YH表示YH全血基因組DNA,綠色柱mDC(Mature dendritic cells)表示成熟的樹突狀細胞DNA,橫坐標(biāo)(chromosome)表不染色體號,縱坐標(biāo)(coverage of ech chromosome)表不測序覆蓋度。圖4 :YH和MDC在每條染色體上深度分布。其中綠色柱YH表示YH全血基因組DNA,紅色柱mDC表示成熟的樹突狀細胞DNA,橫坐標(biāo)(chromosome)表示染色體號,縱坐標(biāo)(depthof ech chromosome)表不測序深度。圖5 YH MDC捕獲片段在基因上的分布。圖6 :MDC捕獲下來目標(biāo)區(qū)域與全基因組重亞硫酸鹽數(shù)據(jù)比較。橫坐標(biāo)和縱坐標(biāo)分別表示目標(biāo)捕獲得出來的甲基化率(methylation rate in target region)和全基因組測序的甲基化率。Pearson Correlation表示皮爾遜相關(guān)系數(shù)。圖7 :YH捕獲下來目標(biāo)區(qū)域與全基因組重亞硫酸鹽數(shù)據(jù)比較。橫坐標(biāo)和縱坐標(biāo)分別表示目標(biāo)捕獲得出來的甲基化率(methylation rate in target region)和全基因組測序的甲基化率。Pearson Correlation表示皮爾遜相關(guān)系數(shù)。實施例主要實驗儀器列表
權(quán)利要求
1.一種甲基化高通量檢測方法,其包括以下步驟序列捕獲探針的選擇、文庫制備、序列捕獲、重亞硫酸鹽處理、上機測序及數(shù)據(jù)分析,其特征在于序列捕獲和重亞硫酸鹽處理在文庫制備的接頭連接步驟和PCR擴增及文庫切膠純化步驟之間進行。
2.根據(jù)權(quán)利要求I的方法,其中所述探針可以是用于液相或者固相芯片雜交的探針,優(yōu)選地所述探針的長度是60mer-120mer,更優(yōu)選地所述探針的平均長度為120mer。
3.根據(jù)權(quán)利要求I的方法,其中所述文庫制備步驟包括甲基化標(biāo)簽接頭的連接,特別是PEI甲基化接頭的連接。
4.根據(jù)權(quán)利要求I的方法,其中在序列捕獲前進行如下文庫制備步驟 步驟一樣品基因組DNA以及外源基因組DNA的片段化 樣品基因組DNA和作為外源基因組DNA可以是任意物種,包括但不限于人、植物、昆蟲的基因組DNA ;利用物理或化學(xué)方法,優(yōu)選的超聲波片段化方法將優(yōu)選的5μ g基因組DNA進行隨機打斷,優(yōu)選地打斷為200-300bp的片段;優(yōu)選地外源基因組DNA是沒有甲基化修飾的 λ DNA ; 步驟二基因組DNA的末端修飾 隨機打斷后的DNA回收純化后,通過優(yōu)選的T4DNA聚合酶、Klenow片段和Τ4聚核苷酸激酶酶的作用進行末端修復(fù),形成平末端的DNA片段;然后優(yōu)選地利用Klenow片段(3’ -5’ exo-)聚合酶及dATP在補平的序列的3’末端加上“A”堿基; 步驟三PEI甲基化接頭的連接 3’末端加上“A”堿基的序列在連接酶,優(yōu)選的T4DNA連接酶的作用下與甲基化修飾,優(yōu)選的C位點甲基化修飾的接頭進行連接,純化回收,對其進行定量。
5.根據(jù)權(quán)利要求4的方法,其中所述PEI甲基化接頭包括PE Index_ 甲基化 adapter I Phos/TCAAGTAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC,和PE Index_ 甲基化 adapter 2 TACACTCTTTCCCTACACGACGCTCTTCCGATCTACTTGAT,其中所沭接頭的所有 C 位點均經(jīng)甲基化修飾。
6.根據(jù)權(quán)利要求I的方法,其中序列捕獲步驟包括將文庫制備步驟中的連接產(chǎn)物文庫在固相或液相雜交平臺,優(yōu)選是液相雜交平臺進行雜交,其中優(yōu)選地使用500-1000ng連接產(chǎn)物文庫雜交,在雜交體系中同時加入接頭封閉序列;待雜交完畢后,通過變性等方法收集捕獲的序列并純化,得到與雜交探針區(qū)域互補的DNA分子,其中優(yōu)選地是對外顯子組進行捕獲。
7.根據(jù)權(quán)利要求6的方法,其中接頭封閉序列是PEI甲基化接頭的連接步驟中所使用PEI甲基化接頭的互補序列,并且選自PE Index_ 甲基化 adapter I Phos/TCAAGTAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC,或PE Index_ 甲基化 adapter 2 TACACTCTTTCCCTACACGACGCTCTTCCGATCTACTTGAT 的互補序列,其中所述接頭的所有 C位點均經(jīng)甲基化修飾。
8.根據(jù)權(quán)利要求I的方法,其中重亞硫酸鹽處理步驟包括將序列捕獲步驟中得到的DNA與片段化外源基因組DNA,一起用重亞硫酸鹽進行處理,并且外源基因組DNA優(yōu)選地是200ng經(jīng)片段化的ADNA。
9.根據(jù)權(quán)利要求I的方法,其中在重亞硫酸鹽處理后進行如下文庫制備中的PCR擴增及文庫切膠純化步驟 以重亞硫酸鹽轉(zhuǎn)換后的DNA為模板,加入PCR引物序列進行PCR擴增,其中所使用的聚合酶包括針對重亞硫酸鹽轉(zhuǎn)換后的DNA的熱啟動taq酶、常規(guī)的r_taq或其它聚合酶擴增,優(yōu)選的是針對重亞硫酸鹽轉(zhuǎn)換后的DNA的熱啟動taq酶; 對擴增產(chǎn)物進行純化,純化方法包括但不限于磁珠純化、純化柱純化、2%的瓊脂糖膠電泳純化;純化回收的產(chǎn)物進行QPCR定量,然后待上機測序。
10.根據(jù)權(quán)利要求9的方法,其中進一步包括將優(yōu)選的6bp或8bp的標(biāo)簽序列通過接頭或者PCR引物引入到DNA片段的一側(cè)。
11.根據(jù)權(quán)利要求9的方法,其中PCR引物序列包括 Pl公用引物AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT, Indexl 引物CAAGCAGAAGACGGCATACGAGATCTTGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,和 Index 2 引物CAAGCAGAAGACGGCATACGAGATTCAAGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTo
12.根據(jù)權(quán)利要求I的方法,其中上機測序及數(shù)據(jù)分析包括將重亞硫酸鹽處理步驟得到的序列在測序平臺,優(yōu)選第二代測序平臺,更優(yōu)選的Solexa測序平臺上進行測序,并進行數(shù)據(jù)分析比較。
13.根據(jù)權(quán)利要求1-12中任一項的方法構(gòu)建的測序文庫。
14.根據(jù)權(quán)利要求12的測序文庫用于甲基化高通量測序的用途。
15.根據(jù)權(quán)利要求1-12中任一項的方法,適用于外顯子組測序,進一步優(yōu)選地用于檢測人類全基因組外顯子組的甲基化分布情況。
全文摘要
本發(fā)明提供一種甲基化高通量檢測方法,特別提供了一種結(jié)合序列捕獲和重亞硫酸鹽測序的方法,該方法能夠同時準確有效地分析幾個樣品中的目標(biāo)區(qū)域甲基化狀態(tài),降低探針設(shè)計的難度,增加操作及應(yīng)用的可行性,使得對全基因組內(nèi)感興趣的目標(biāo)序列和區(qū)域進行高通量高精度的甲基化檢測成為現(xiàn)實,并且該方法還具有針對性強以及節(jié)約成本和時間的特點。
文檔編號C40B50/06GK102796808SQ201110133858
公開日2012年11月28日 申請日期2011年5月23日 優(yōu)先權(quán)日2011年5月23日
發(fā)明者羅慧娟, 吉冠玉, 蔣慧, 吳明枝, 孫繼華, 吳仁花, 王君文, 高飛 申請人:深圳華大基因科技有限公司, 深圳華大基因研究院