擴(kuò)增子文庫及其構(gòu)建方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及高通量測序領(lǐng)域,具體而言,涉及一種擴(kuò)增子文庫及其構(gòu)建方法。
【背景技術(shù)】
[0002] 生命體遺傳信息的快速獲得對于生命科學(xué)的研宄有著十分重要的意義。第一代 測序儀對電泳分離技術(shù)的依賴,使其難以進(jìn)一步提高分析的速度和并行化程度,也難以 通過微型化降低測序成本。經(jīng)過不斷的技術(shù)開發(fā)和改進(jìn),21世紀(jì)初,以Roche 454技術(shù)、 illumina公司的Genome Analyzer技術(shù)和ABI公司的Solid技術(shù)為標(biāo)記的第二代測序技 術(shù)誕生了。第二代技術(shù)大大降低了測序成本,還大幅度提高了測序速度并保持了高準(zhǔn)確 性。其中,illumina公司的第一臺測序儀于2006年問世,之后開發(fā)出來一系列的測序儀,如 Hiseq2000、Hiseq2500、Miseq、Hiseq X等,在準(zhǔn)確性、通量、成本和速度方面表現(xiàn)更優(yōu)秀,而 使其成為全球使用量最大的第二代測序儀。在第二代測序平臺不斷完善的同時,以對單分 子DNA進(jìn)行非PCR測序?yàn)橹饕卣鞯牡谌鷾y序技術(shù)也初顯端倪,但由于其關(guān)鍵技術(shù)問題 尚待解決,目前還未得到廣泛應(yīng)用。
[0003] 環(huán)境中微生物的群落結(jié)構(gòu)和多樣性是微生物生態(tài)學(xué)的研宄熱點(diǎn)。微生物多樣性的 研宄涉及農(nóng)業(yè)、土壤、林業(yè)、海洋、礦井、人體醫(yī)學(xué)等諸多領(lǐng)域。傳統(tǒng)研宄手段存在實(shí)驗(yàn)操作 費(fèi)時費(fèi)力、不可培養(yǎng)性、無法檢測痕量微生物、無法探索未知等的局限性。第二代高通量測 序技術(shù)(尤其是illumina Miseq高通量測序技術(shù))的成熟和普及,使我們能夠?qū)Νh(huán)境微生 物進(jìn)行深度測序,靈敏地檢測環(huán)境樣品在細(xì)菌、真菌、古菌分類方面物種之間的差異,精確 指導(dǎo)不同環(huán)境微生物的構(gòu)成。
[0004] 擴(kuò)增子測序是對特定長度的PCR產(chǎn)物或者捕獲的片段進(jìn)行測序,不僅包括16S rDNA測序,還包括18S rDNA測序、ITS測序及功能基因檢測等。采用illumina MiSeq第二 代高通量測序平臺對來源于不同環(huán)境樣本進(jìn)行16S/18S/ITS某個高變區(qū)域深度測序,能靈 敏地探測出環(huán)境微生物群落結(jié)構(gòu)隨外界環(huán)境的變化而發(fā)生的極其微弱的變化,對于我們研 宄微生物與環(huán)境的關(guān)系,環(huán)境治理和微生物資源的利用有著重要的理論和現(xiàn)實(shí)意義。
[0005] 16S rDNA是編碼細(xì)菌核糖體小亞基的DNA序列,分子大小約1540bp,由9個可變 區(qū)和10個保守區(qū)交叉排列組成。保守區(qū)能反映物種間親緣關(guān)系,可變區(qū)在不同菌種間存在 差異。根據(jù)保守區(qū)序列設(shè)計引物,將可變區(qū)擴(kuò)增出來進(jìn)行測序,通過測序數(shù)據(jù)與相應(yīng)數(shù)據(jù)庫 的比對,即可確定微生物在進(jìn)化樹中的位置,從而鑒定樣本中可能存在的微生物種類。研宄 表明,V4靶基因區(qū)域(約300bp)對微生物進(jìn)行分類較為準(zhǔn)確。
[0006] 基于illumina測序平臺的16S V4區(qū)擴(kuò)增子樣本的建庫方法目前主要有三種。第 一種方法為使用較早且廣泛的PCR擴(kuò)增建庫法,即在建庫過程中包含PCR擴(kuò)增步驟。首先 把混合產(chǎn)物切膠純化;然后依次進(jìn)行末端修復(fù),加"A",加 Pair-end接頭(在序列兩端引入 illumina測序引物序列)并純化;最后以混合樣品為t旲板進(jìn)彳丁 PCR擴(kuò)增反應(yīng)(引入完整的 illumina接頭序列、index序列以及測序引物序列),再次純化后,即可完成文庫構(gòu)建。
[0007] 第二種方法為illumina官方推薦的一步擴(kuò)增法,即通過一步PCR完成建庫過程。 該方法使用包含16S V4區(qū)上游保守序列以及illumina P5端接頭序列作為上游引物,16S V4區(qū)下游保守序列、index序列以及illumina P7端接頭序列作為下游引物進(jìn)行PCR擴(kuò)增, 產(chǎn)物混池后即可完成建庫。
[0008] 第三種方法為Truseq PCR-free建庫法,即完全應(yīng)用Truseq PCR-free試劑盒構(gòu) 建文庫。首先把混合產(chǎn)物切膠純化;然后依次進(jìn)行末端修復(fù),加"A",加 PCR - free接頭 (連接完整的illumina接頭序列、index序列以及測序引物序列);最后磁珠純化后,即可 完成文庫構(gòu)建。
[0009] 上述構(gòu)建方法中,對攜帶標(biāo)簽序列的PCR擴(kuò)增產(chǎn)物進(jìn)行純化和定量的方法主要有 兩種。第一種方法是在PCR擴(kuò)增后,采用PCR產(chǎn)物回收試劑盒純化,利用分光光度計定量, 然后等摩爾量混合;第二種方法是在PCR擴(kuò)增后,把PCR產(chǎn)物單獨(dú)切膠回收和Qubit定量, 然后等摩爾量混合。
[0010] 其中,第一種純化定量的均一化方法無法除去PCR產(chǎn)物中的引物二聚體,影響分 光光度計對目標(biāo)片段的準(zhǔn)確定量,使樣本間無法真正地等摩爾量混合,而使測序數(shù)據(jù)的均 一性較差,加測樣本比例較高,項(xiàng)目周期無法保證;第二種純化定量的均一化方法,膠回收 效率較低,導(dǎo)致PCR產(chǎn)物損失較多,使建庫起始量無法保證在正常范圍內(nèi),進(jìn)而影響建庫成 功率。同時操作繁瑣,試劑成本較高。
[0011] 然而,在采用上述PCR擴(kuò)增建庫方法對如16S rDNA或者ITS等文庫進(jìn)行構(gòu)建時, 由于16S rDNA或者ITS等在擴(kuò)增過程中使用的是混合模板,而且這些模板之間序列的相 似性很高,所以基因組總DNA在16S rDNA擴(kuò)增時容易出現(xiàn)錯誤,產(chǎn)生一些在環(huán)境中原本并 不存在的"16S rDNA"序列。其中chimeria(嵌合體)和heteroduplex(異源雙鏈)對文 庫的構(gòu)建影響較大。嵌合體是在PCR的過程中來自不同微生物的16S rDNA發(fā)生共擴(kuò)增造 成的,當(dāng)以微生物A的16S rDNA為模板進(jìn)行擴(kuò)增時,有可能由于延伸不完全,產(chǎn)生微生物A 不完全的16SrDNA單鏈分子,而在下一輪PCR擴(kuò)增時,它就可能與另一種序列相近的微生物 B的16S rDNA分子退火,并自身作為引物以微生物B的16S rDNA分子為模板延伸,產(chǎn)生一 個一部分來自于微生物A而另一部分來自于微生物B的嵌合體16S rDNA分子,這就叫做嵌 合體。這種原始樣品中并不存在的嵌合體分子,會使我們過高估計環(huán)境中微生物的多樣性。 異源雙鏈?zhǔn)窃赑CR反應(yīng)進(jìn)入平臺期以后,由于引物和模板之間的比例急劇降低,造成引物 與模板之間退火的機(jī)率減小,而序列相近的模板之間退火的機(jī)率增加,這些序列相近的16S rDNA分子之間退火就形成了異源雙鏈。信息分析表明,這種建庫方法使樣本間的生物學(xué)聚 類不合理(有文庫趨同的現(xiàn)象),同一樣本的技術(shù)重復(fù)性差。
[0012] 而在采用一步擴(kuò)增建庫法對上述樣本進(jìn)行建庫時,在上機(jī)測序時,不能使用 illumina Miseq相配套的試劑進(jìn)行測序,需要自定義測序引物,即單獨(dú)合成16S V4區(qū)上游 保守序列作為P5端測序引物,16S V4區(qū)下游保守序列引物作為P7端測序引物,16S V4區(qū) 下游保守序列的反向序列作為index的測序引物,同時需要合成特制的Phix文庫。一步擴(kuò) 增文庫上機(jī)測序時,只能和相同可變區(qū)的擴(kuò)增子文庫混為一個運(yùn)行通道(run),這樣不僅影 響排機(jī)測序靈活性,而且無法保證測序質(zhì)量。
[0013] Truseq PCR-free建庫法可以直接使用Illumina Miseq相配套的試劑進(jìn)行測 序,且樣本間生物學(xué)聚類合理,同一樣本的重復(fù)性好,但是試劑成本較高(TruSeq DNA PCR-Free Sample Preparation Kit),需要攻克其技術(shù)壁皇。
[0014] 因此,如何提供一種操作簡單、成本低且得到的不同樣本間的測序數(shù)據(jù)均一性好 的擴(kuò)增子文庫構(gòu)建方法成了一個亟待解決的技術(shù)問題。
【發(fā)明內(nèi)容】
[0015] 本發(fā)明的主要目的在于提供一種擴(kuò)增子文庫及其構(gòu)建方法,以提高所構(gòu)建文庫在 測