一種用于擴(kuò)增子測(cè)序的建庫(kù)方法
【專利摘要】本發(fā)明涉及高通量測(cè)序【技術(shù)領(lǐng)域】,公開(kāi)了一種用于擴(kuò)增子測(cè)序的建庫(kù)方法,包括以下步驟:(1)PCR擴(kuò)增富集目標(biāo)區(qū)域:對(duì)待測(cè)樣品基因組DNA,針對(duì)目標(biāo)區(qū)域設(shè)計(jì)引物序列,引物序列在正向引物和反向引物的5’端設(shè)有隨機(jī)堿基序列和接頭序列,進(jìn)行PCR擴(kuò)增,回收PCR產(chǎn)物;(2)PCR擴(kuò)增引入測(cè)序接頭:將上步所得的PCR產(chǎn)物進(jìn)行混樣,設(shè)計(jì)引物序列,引物序列包含與上步中的接頭序列互補(bǔ)的序列,對(duì)混樣進(jìn)行PCR擴(kuò)增,回收PCR產(chǎn)物,即得到用于擴(kuò)增子測(cè)序的DNA文庫(kù)。本發(fā)明的建庫(kù)方法不但降低了擴(kuò)增子測(cè)序的建庫(kù)時(shí)間和成本,還能夠降低對(duì)測(cè)序結(jié)果進(jìn)行生物信息學(xué)分析錯(cuò)誤的發(fā)生,提高分析結(jié)果的準(zhǔn)確性和真實(shí)性。
【專利說(shuō)明】一種用于擴(kuò)增子測(cè)序的建庫(kù)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及分子生物學(xué)【技術(shù)領(lǐng)域】,特別涉及一種用于擴(kuò)增子測(cè)序的快速建庫(kù)方 法。
【背景技術(shù)】
[0002] 隨著高通量測(cè)序技術(shù)的發(fā)展,測(cè)序成本的降低,使測(cè)序技術(shù)逐漸成為基礎(chǔ)生物學(xué) 研究和醫(yī)學(xué)檢測(cè)的常規(guī)實(shí)驗(yàn)方法。從人類基因組計(jì)劃構(gòu)建了第一個(gè)基因組圖譜開(kāi)始,新一 代測(cè)序技術(shù)通過(guò)全基因組測(cè)序構(gòu)建了大量常規(guī)物種的基因組圖譜,也促進(jìn)了測(cè)序技術(shù)的高 速發(fā)展。但全基因組測(cè)序結(jié)構(gòu)復(fù)雜,數(shù)據(jù)量大,周期長(zhǎng),費(fèi)用高,限制了它的發(fā)展。
[0003] 同時(shí),有的研究者只對(duì)特定的基因組區(qū)域感興趣,這時(shí)就只需對(duì)相應(yīng)區(qū)域進(jìn)行測(cè) 序研究,不需要對(duì)全基因組進(jìn)行測(cè)序。擴(kuò)增子測(cè)序(Amplicon Sequencing)就是只對(duì)目標(biāo)區(qū) 域進(jìn)行測(cè)序研究的一項(xiàng)測(cè)序方法。通過(guò)設(shè)計(jì)感興趣的基因組區(qū)域的引物,進(jìn)行PCR擴(kuò)增,對(duì) 目標(biāo)區(qū)域進(jìn)行富集,然后針對(duì)特定長(zhǎng)度的PCR產(chǎn)物或者捕獲的片段進(jìn)行建庫(kù),高通量測(cè)序, 分析序列中的變異。擴(kuò)增子測(cè)序能根據(jù)研究者目的,針對(duì)目標(biāo)區(qū)域進(jìn)行高覆蓋度的測(cè)序,還 可以檢測(cè)到低頻突變。采用擴(kuò)增子測(cè)序,研究者可以對(duì)基因組中感興趣的關(guān)鍵區(qū)域進(jìn)行重 點(diǎn)研究。這種高針對(duì)性的方法可以高效的發(fā)現(xiàn),驗(yàn)證和篩選關(guān)注區(qū)域的基因組變異。相比 全基因組測(cè)序,擴(kuò)增子測(cè)序?qū)δ繕?biāo)區(qū)域有更準(zhǔn)確快速的研究,適用于大量樣本的特定基因 組區(qū)域研究。
[0004] 目前的擴(kuò)增子測(cè)序都是通過(guò)常規(guī)的建庫(kù)方法,在通過(guò)PCR擴(kuò)增富集到目標(biāo)區(qū)域 后,進(jìn)行混樣,然后進(jìn)行末端修復(fù)和加 A,再加接頭,純化樣品,跑膠回收目的條帶,然后PCR 擴(kuò)增,最后再跑膠回收主帶,該種常規(guī)的建庫(kù)方法步驟繁瑣,浪費(fèi)時(shí)間,工作量大,不利于大 量樣品的測(cè)序建庫(kù)。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于提供一種適用于擴(kuò)增子測(cè)序的快速建庫(kù)方法,以簡(jiǎn)化擴(kuò)增子測(cè) 序中建庫(kù)步驟的操作過(guò)程,降低擴(kuò)增子測(cè)序建庫(kù)的時(shí)間和成本,同時(shí)保證不影響測(cè)序質(zhì)量。
[0006] 本發(fā)明所提供的用于擴(kuò)增子測(cè)序的建庫(kù)方法包括以下步驟:
[0007] (l)PCR擴(kuò)增富集目標(biāo)區(qū)域:對(duì)待測(cè)樣品基因組DNA,針對(duì)目標(biāo)區(qū)域設(shè)計(jì)引物序列, 該引物序列在正向引物和反向引物的5'端設(shè)有隨機(jī)堿基序列和接頭序列,進(jìn)行PCR擴(kuò)增, 回收PCR產(chǎn)物;
[0008] (2)PCR擴(kuò)增引入測(cè)序接頭:將步驟⑴所得到的PCR產(chǎn)物進(jìn)行混樣,設(shè)計(jì)引物序 列,該引物序列包含與步驟(1)中的接頭序列互補(bǔ)的序列,對(duì)混樣進(jìn)行PCR擴(kuò)增,回收PCR 產(chǎn)物,即得到用于擴(kuò)增子測(cè)序的DNA文庫(kù)。
[0009] 本發(fā)明的用于擴(kuò)增子測(cè)序的建庫(kù)方法,在步驟(1)之前還包括提取待測(cè)樣品基因 組DNA的步驟,該提取步驟可采用本領(lǐng)域內(nèi)常規(guī)方法進(jìn)行,例如使用Omega公司的SOIL DNA KIT進(jìn)行提?。淮送?,在步驟(2)之后還包括測(cè)序并對(duì)測(cè)序數(shù)據(jù)進(jìn)行生物信息學(xué)分析的步 驟,本發(fā)明建庫(kù)后的上機(jī)測(cè)序可以通過(guò)一代測(cè)序平臺(tái)進(jìn)行,也可通過(guò)高通量測(cè)序平臺(tái)進(jìn)行, 例如ABI公司的3730XL測(cè)序平臺(tái)或Illumina公司的miseq測(cè)序平臺(tái)等。進(jìn)行生物信息學(xué) 分析的步驟主要是指通過(guò)質(zhì)控和barcode得到優(yōu)化數(shù)據(jù),然后聚OTU,物種注釋,α多樣性 分析(稀釋曲線、shannon曲線、物種累積曲線;chao、simpson等多樣性指數(shù)),β多樣性 分析(pea、pcoa聚類;系統(tǒng)進(jìn)化樹(shù),物種分布、顯著性差異、環(huán)境因子梯度分析、各種分組比 較等)。
[0010] 本發(fā)明所提供的用于擴(kuò)增子測(cè)序的建庫(kù)方法的流程圖如附圖1所示。
[0011] 具體來(lái)說(shuō),本發(fā)明的步驟(1)進(jìn)行了第一次PCR擴(kuò)增,以完成富集目標(biāo)區(qū)域的操 作。在針對(duì)測(cè)序目標(biāo)區(qū)域進(jìn)行引物設(shè)計(jì)時(shí):引物總長(zhǎng)度<59bp,退火溫度55°C?75°C。在 正向引物和反向引物的5'端設(shè)有隨機(jī)堿基序列和接頭序列,其中隨機(jī)堿基的個(gè)數(shù)可設(shè)計(jì)為 1?10個(gè),在本發(fā)明的【具體實(shí)施方式】部分采用的是1?5個(gè)隨機(jī)堿基的方案。接頭序列是 與測(cè)序儀相配套的序列,例如illumina的"Y"字型的序列。隨機(jī)堿基序列和接頭序列的設(shè) 計(jì)主要達(dá)到以下三個(gè)方面的目的:(1)引入?yún)^(qū)分樣本標(biāo)簽;(2)引入去除嵌合體序列標(biāo)簽; (3)引入測(cè)序接頭,方便測(cè)序。最后,回收PCR產(chǎn)物時(shí)可采用凝膠電泳法切膠回收目的條帶。
[0012] 本發(fā)明的步驟(2)進(jìn)行了第二次PCR擴(kuò)增,以完成引入測(cè)序接頭、建成文庫(kù)的操 作。首先,在將上述第一次PCR的產(chǎn)物進(jìn)行混樣后,還包括磁珠純化的步驟,采用磁珠純化 比一般的過(guò)柱純化速度快,可節(jié)省實(shí)驗(yàn)時(shí)間。例采用Agencourt AMPure XP進(jìn)行。磁珠純化 步驟之后,進(jìn)行設(shè)計(jì)第二次PCR引物序列和對(duì)混樣進(jìn)行擴(kuò)增的步驟。在第二次PCR的引物 序列中,在正向引物的5'端帶有P5序列;在反向引物的5'端帶有Index序列和P7序列, 這樣的引物設(shè)計(jì)為區(qū)分每一個(gè)文庫(kù)引入文庫(kù)標(biāo)簽。在擴(kuò)增完成之后,進(jìn)行PCR產(chǎn)物的回收, 回收PCR產(chǎn)物時(shí)采用磁珠法或凝膠電泳法,即得到用于擴(kuò)增子測(cè)序的DNA文庫(kù)。
[0013] 本發(fā)明還提供以上述方法所構(gòu)建的用于擴(kuò)增子測(cè)序的DNA文庫(kù)。
[0014] 本發(fā)明采用了兩步法建庫(kù)的方法構(gòu)建擴(kuò)增子測(cè)序文庫(kù),與現(xiàn)有技術(shù)相比,具有如 下兩方面的優(yōu)點(diǎn):
[0015] 首先,目前現(xiàn)有技術(shù)中所采用的擴(kuò)增子測(cè)序的建庫(kù)方法和普通的全基因組測(cè)序的 建庫(kù)方法類似,不但增加了建庫(kù)時(shí)間和成本,還增加了引入突變的可能。本發(fā)明的快速建庫(kù) 方法將PCR擴(kuò)增富集到目標(biāo)區(qū)域后的常規(guī)建庫(kù)方法改為一次PCR,然后用磁珠法純化PCR產(chǎn) 物,即可得到測(cè)序文庫(kù)。相比現(xiàn)有技術(shù)方案,本發(fā)明的整個(gè)建庫(kù)過(guò)程只用了兩次PCR,步驟簡(jiǎn) 單,方便操作,使得擴(kuò)增子建庫(kù)的時(shí)間由原來(lái)的3?4小時(shí),縮短到0. 5小時(shí),同時(shí)免去了建 庫(kù)試劑盒的成本,大大降低了擴(kuò)增子測(cè)序建庫(kù)的時(shí)間和成本,提高了效率;且避開(kāi)了常規(guī)建 庫(kù)中繁瑣的步驟可能引入的突變,與常規(guī)建庫(kù)相比兩步法建庫(kù)不會(huì)影響測(cè)序質(zhì)量,其測(cè)序 質(zhì)量更加準(zhǔn)確精確。
[0016] 其次,在現(xiàn)有的擴(kuò)增子測(cè)序建庫(kù)過(guò)程中,由于PCR的擴(kuò)增反應(yīng),不可避免地形成了 嵌合體,使得在進(jìn)行生物信息學(xué)分析時(shí),在不能識(shí)別嵌合體的情況下,使得得到的UTR數(shù)據(jù) 中含有嵌合體的數(shù)據(jù)。采用本發(fā)明的兩步法建庫(kù),在第一次PCR擴(kuò)增時(shí)引入的特異序列為 嵌合體的識(shí)別提供了標(biāo)簽,在進(jìn)行生物信息學(xué)分析時(shí),通過(guò)簡(jiǎn)化擴(kuò)增子測(cè)序建庫(kù)方法中使 用的標(biāo)簽,可以識(shí)別出引入接頭的PCR擴(kuò)增過(guò)程中產(chǎn)生的嵌合體,排除了由于建庫(kù)實(shí)驗(yàn)的 PCR擴(kuò)增過(guò)程產(chǎn)生的嵌合體對(duì)真實(shí)數(shù)據(jù)結(jié)果的影響,提高生物信息學(xué)分析的結(jié)果的準(zhǔn)確性, 與現(xiàn)有的建庫(kù)方法相比,本發(fā)明得到的數(shù)據(jù)能夠降低生物信息學(xué)分析錯(cuò)誤的發(fā)生,更加真 實(shí)地反應(yīng)出樣品的實(shí)際情況,提高了生物信息學(xué)分析結(jié)果的準(zhǔn)確性和真實(shí)性。
【專利附圖】
【附圖說(shuō)明】
[0017] 圖1是本發(fā)明的用于擴(kuò)增子測(cè)序的建庫(kù)方法流程圖;
[0018] 圖2是【具體實(shí)施方式】中PCR擴(kuò)增富集目標(biāo)區(qū)域步驟的樣品電泳圖;
[0019] 圖3是【具體實(shí)施方式】中PCR擴(kuò)增引入測(cè)序接頭步驟的樣品電泳圖;
[0020] 圖4是以本發(fā)明方法所構(gòu)建的文庫(kù)進(jìn)行測(cè)序的結(jié)果圖;
[0021] 圖5是以傳統(tǒng)建庫(kù)方法所構(gòu)建的文庫(kù)進(jìn)行測(cè)序的結(jié)果圖;
[0022] 圖6是以本發(fā)明的建庫(kù)方法所得文庫(kù)的測(cè)序結(jié)果構(gòu)建的進(jìn)化樹(shù);
[0023] 圖7是以傳統(tǒng)建庫(kù)方法所得文庫(kù)的測(cè)序結(jié)果構(gòu)建的進(jìn)化樹(shù)。
【具體實(shí)施方式】
[0024] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明的各實(shí) 施方式進(jìn)行詳細(xì)的闡述。然而,本領(lǐng)域的普通技術(shù)人員可以理解,在本發(fā)明各實(shí)施方式中, 為了使讀者更好地理解本申請(qǐng)而提出了許多技術(shù)細(xì)節(jié)。但是,即使沒(méi)有這些技術(shù)細(xì)節(jié)和基 于以下各實(shí)施方式的種種變化和修改,也可以實(shí)現(xiàn)本申請(qǐng)各權(quán)利要求所要求保護(hù)的技術(shù)方 案。
[0025] 實(shí)施例1
[0026] 首先按照常規(guī)方法使用Omega公司的SOIL DNA KIT,提取10個(gè)樣品的土壤基因組 DNA,步驟略。
[0027] -、PCR擴(kuò)增富集目標(biāo)區(qū)域(PCR-1):
[0028] i.引物設(shè)計(jì)
[0029] 1)測(cè)序區(qū)域?yàn)镹F-NR ;
[0030] 2)在引物NF和NR的5'端設(shè)計(jì)獨(dú)特的堿基(N代表堿基序列)、Adapter序列;
[0031] 3)具體引物序列信息見(jiàn)表1 :
[0032] 正向引物 NF :SEQ ID No 1 ;
[0033] 反向引物 NR :SEQ ID No 2。
[0034] 表1 PCR-1擴(kuò)增引物序列
[0035]
【權(quán)利要求】
1. 一種用于擴(kuò)增子測(cè)序的建庫(kù)方法,其特征在于,包括以下步驟: (1) PCR擴(kuò)增富集目標(biāo)區(qū)域:對(duì)待測(cè)樣品基因組DNA,針對(duì)目標(biāo)區(qū)域設(shè)計(jì)引物序列,所述 引物序列在正向引物和反向引物的5'端設(shè)有隨機(jī)堿基序列和接頭序列,進(jìn)行PCR擴(kuò)增,回 收PCR產(chǎn)物; (2) PCR擴(kuò)增引入測(cè)序接頭:將步驟(1)所得到的PCR產(chǎn)物進(jìn)行混樣,設(shè)計(jì)引物序列,所 述引物序列包含與步驟(1)中的接頭序列互補(bǔ)的序列,對(duì)混樣進(jìn)行PCR擴(kuò)增,回收PCR產(chǎn) 物,即得到用于擴(kuò)增子測(cè)序的DNA文庫(kù)。
2. 根據(jù)權(quán)利要求1所述的用于擴(kuò)增子測(cè)序的建庫(kù)方法,其特征在于,在所述步驟(2)之 后還包括測(cè)序并對(duì)測(cè)序數(shù)據(jù)進(jìn)行生物信息學(xué)分析的步驟。
3. 根據(jù)權(quán)利要求1所述的用于擴(kuò)增子測(cè)序的建庫(kù)方法,其特征在于,在所述步驟(1)之 前還包括提取待測(cè)樣品基因組DNA的步驟。
4. 根據(jù)權(quán)利要求1所述的用于擴(kuò)增子測(cè)序的建庫(kù)方法,其特征在于,步驟(1)中回收 PCR產(chǎn)物時(shí)采用凝膠電泳法切膠回收目的條帶。
5. 根據(jù)權(quán)利要求1所述的用于擴(kuò)增子測(cè)序的建庫(kù)方法,其特征在于,步驟(2)中在將 PCR產(chǎn)物進(jìn)行混樣后還包括磁珠純化的步驟。
6. 根據(jù)權(quán)利要求1所述的用于擴(kuò)增子測(cè)序的建庫(kù)方法,其特征在于,步驟(2)中的引物 序列中,在正向引物的5'端帶有P5序列;在反向引物的5'端帶有Index序列和P7序列。
7. 根據(jù)權(quán)利要求1所述的用于擴(kuò)增子測(cè)序的建庫(kù)方法,其特征在于,步驟(2)中回收 PCR產(chǎn)物時(shí)采用磁珠法或凝膠電泳法。
8. 根據(jù)權(quán)利要求2所述的用于擴(kuò)增子測(cè)序的建庫(kù)方法,其特征在于,所述測(cè)序步驟通 過(guò)一代測(cè)序平臺(tái)或高通量測(cè)序平臺(tái)進(jìn)行。
9. 一種用于擴(kuò)增子測(cè)序的DNA文庫(kù),其根據(jù)權(quán)利要求1至8任一項(xiàng)所述的方法構(gòu)建得 到。
【文檔編號(hào)】C40B50/06GK104153004SQ201410391037
【公開(kāi)日】2014年11月19日 申請(qǐng)日期:2014年8月11日 優(yōu)先權(quán)日:2014年8月11日
【發(fā)明者】林芹, 于丹, 李勝彬, 陳華, 陶曄, 曾亮 申請(qǐng)人:上海美吉生物醫(yī)藥科技有限公司