一種快速構建單細胞dna測序文庫的方法和試劑盒的制作方法
【技術領域】
[0001] 本發(fā)明涉及用于構建單細胞DNA測序文庫的方法和試劑盒,更具體的,本發(fā)明涉 及用于構建高通量測序的單細胞DNA測序文庫的方法和試劑盒。
【背景技術】
[0002] 隨著人類基因組計劃的完成,Sanger測序已進入廣大科研人員的研究中。但是科 技的不斷革新使得這種雙脫氧核苷酸終止的測序模式愈發(fā)不能滿足測序的需求,于是新的 高通量測序(也稱第二代測序)模式應運而生。這種測序技術使得測序費用更低,測序通量 更高,測序時間更短。高通量測序技術的核心思想是邊合成邊測序,即通過捕捉新合成的末 端的標記來確定DNA的序列?,F有的技術平臺主要包括Roche/454FLX、IllUmina/Hiseq、 Miseq、NextSeq和LifeTechnologies/SOLIDsystem、PGM、Proton等。到目前為止,HiSeq 2000每個run可以達到6個人基因組30X覆蓋的測序通量,約600G/run數據,在測序時間 上HiSeq2500可以達到平均每8分鐘讀取一個堿基的速度。而且隨著第二代測序技術的成 熟,將其應用于臨床的研究迅猛發(fā)展。
[0003] 隨著測序技術的發(fā)展,測序成本的降低,基因組測序技術已成為一種常規(guī)技術。以 往的基因組測序或者轉錄組測序都是基于多細胞的水平進行的,然而這種的測序模式忽略 了細胞間的異質性,以及忽略了細胞間異質性所導致的基因表達、細胞行為、藥物反應的差 異。近期針對腫瘤發(fā)病人群中循環(huán)腫瘤細胞的研究也成為一熱點。腫瘤圖譜的繪制,對于 研究腫瘤的進化,包括腫瘤的轉移不同發(fā)病時間段腫瘤的特異性,以及腫瘤擴散都有極為 關鍵的意義。此外,單細胞研究在早期胚胎發(fā)育過程尤其是植入前胚胎的篩選有非常大的 臨床指導意義?;趩渭毎谂R床研究中的迫切性,對單細胞基因組的測序也愈發(fā)重要。
[0004] 目前針對單細胞DNA測序文庫構建主要是通過全基因組擴增(WholeGenome Amplificati〇n,WGA)的方式使得基因組DNA大量復制,復制后的基因組DNA能夠達到微克 級量,足量的經過擴增后的基因組DNA再通過文庫制備流程進行基因組DNA文庫制備。目前 市場上關于WGA擴增方式主要有兩種:第一種為鏈置換方式,該擴增方式主要是采用phi29 酶恒溫擴增,從而實現對基因組DNA的鏈置換方式的擴增;第二種為通過聚合酶作用實現 的兩部擴增法,該擴增方式通過兩次PCR實現對基因組DNA的擴增。擴增后的基因組DNA 可以通過多種方式來構建測序文庫(見圖1)。比較經典的有兩種方式:第一種為比較基礎 的基因組DNA文庫制備方法,此方法中基因組DNA經過超聲或者酶切打斷,打斷后的DNA進 行末端修復,加A,加接頭,最后通過PCR得到所需的上機測序文庫;第二種是通過轉座酶的 方式將基因組DNA打斷的同時加入接頭,最后通過PCR得到所需的上機測序文庫。目前市 場所推出的針對單細胞測序文庫構建的試劑盒也是基于以上方案設計,首先單細胞基因組 DNA經過WGA擴增的過程,擴增后的基因組DNA再進行常規(guī)的測序文庫構建。以上所述單 細胞DNA測序文庫構建方法和試劑盒主要存在兩方面的缺陷:首先,從WGA到建庫的流程復 雜,所需時間也較長,至少兩天的時間才能完成整個流程,不適合大規(guī)模的生產應用;其次, WGA擴增所引入的PCR堿基偏好性較大,從而導致整個基因組的覆蓋度和均一性較差。因 此,迫切需要一種新的方法和試劑盒來改善目前單細胞DNA測序文庫構建的結果。
【發(fā)明內容】
[0005] 鑒于目前單細胞DNA測序文庫構建過程中所遇到的問題,本發(fā)明人發(fā)現了新的更 加簡化、更加快速、更加均一的單細胞DNA測序文庫的構建方法,其可適用于多種第二代測 序平臺,包括但不限于如R〇che/454FLX、Illumina/Hiseq、Miseq和LifeTechnologies/ SOLIDsystem、PGM、Proton等測序平臺。
[0006] 本發(fā)明是基于以下的事實:本發(fā)明人發(fā)現,單細胞經過細胞裂解后,釋放基因組 DNA,基因組DNA經過預擴增和二次擴增后即可得到可以上機測序的文庫。本發(fā)明中只包含 細胞裂解、預擴增和二次擴增三步反應,并且三步反應完全可以在一個體系中完成,中間無 需有轉管或者純化的步驟。依據本發(fā)明,單細胞DNA測序可以得到有效的測序結果,并且可 以用于多種的信息分析。
[0007] 因此,本發(fā)明的第一個方面是提供一種用于構建單細胞DNA測序文庫的方法,其 特征在于,包括:
[0008] 裂解細胞,釋放基因組DNA;
[0009]將基因組DNA進行預擴增;
[0010] 將預擴增之后的基因組DNA進行二次擴增,以獲得所述單細胞DNA測序文庫。
[0011] 根據本發(fā)明的方法,所述將基因組DNA進行預擴增的酶為熱穩(wěn)定的聚合酶,可 以是一種,也可以是兩種或者兩種以上的組合。包含但不局限于以下的一種或者幾種:LA-Taq,rTaq,Phusion,DeepVent,DeepVent(exo-),Gold360,PlatinumTaq,KAPA2G Robust.
[0012] 根據本發(fā)明的方法,所述將基因組DNA進行預擴增的引物為一段特殊設計的引 物。該引物從5'端開始有三部分主要結構:第一部分為通用區(qū)域,此區(qū)域在不同測序平臺 中序列不同,長度為1至70個堿基,優(yōu)選的為10-50個堿基,更優(yōu)選的為10-30個堿基。本 通用區(qū)域為最終文庫結構的一部分,在二次擴增時生成能直接用于測序的文庫。此外,該通 用區(qū)域在一次擴增過程中使生成的產物自身形成類似發(fā)卡的結構,不再繼續(xù)被擴增,使預 擴增實現線性擴增,使最終結果基因組覆蓋更均勻。第二部分為簡并堿基區(qū)域,該區(qū)域只包 含兩種不互補的堿基,A和C,或A和G,或T和C,或T和G,長度為2-20個堿基,優(yōu)選的為 5-15個堿基,更優(yōu)選的為5-10個堿基。該設計避免了預擴增過程中引物的交叉雜交或自 雜交,以實現預擴增的均一性。第三部分為隨機簡并堿基區(qū)域,其中每個堿基可以是A、T、 C、或G,并且在最后三個隨機簡并堿基之間加入兩個硫代修飾,長度為1-8個堿基(詳見圖 4),優(yōu)選的,其長度為2-6個堿基;最優(yōu)選的,其長度為3或4個堿基。本發(fā)明中特殊的簡并 堿基區(qū)域的設計提高了產物在基因組上的覆蓋度。
[0013] 根據一個特別優(yōu)選的實施方式,該預擴增引物序列為
[0014] 5' GCTCTTCCGATCTRRRRRRRRRRN*N*N3'
[0015] 5'GCTCTTCCGATCTMMMMMMMMMMN*N*N3,
[0016] 5, GCTCTTCCGATCTYYYYYYYYYYN*N*N3'
[0017] 5' GCTCTTCCGATCTKKKKKKKKKKN*N*N3'
[0018] 其中R代表A或G堿基,M代表A或C堿基,Y代表C或T堿基,K代表G或T堿 基。N代表隨機簡并堿基A/T/C/G,*代表硫代修飾。
[0019] 硫代修飾為在寡聚核苷酸合成時將連接兩個單核苷酸之間的磷酸二酯鍵中的一 個氧換成硫,加入硫代修飾后堿基不容易被核酸外切酶切掉,從而可以增加引物的特異性, 防止擴增過程中引物二聚體的出現。
[0020] 根據本發(fā)明的方法,所述將基因組DNA進行二次擴增的酶為熱穩(wěn)定的聚合酶,可 以是一種,也可以是兩種或者兩種以上的組合。包含但不局限于以下的一種或者幾種: LA-Taq,rTaq,Phusion,DeepVent,DeepVent(exo-),Gold360,PlatinumTaq,KAPA2G Robust。
[0021] 根據本發(fā)明的方法,所述將基因組DNA進行二次擴增的引物由兩部分組成。從DNA 5'端開始,第一部分為外延伸區(qū),該區(qū)域含有可以和上機測序通用雜交引物相結合的區(qū)域, 第二部分為引物匹配區(qū),該區(qū)域含有可以和預擴增引物雜交區(qū)域。在不同的實施方案中,外 延伸區(qū)可以含有barcode序列,用于區(qū)分不同的樣本或者給樣本引入特殊的特征標記。所 述barcode序列可以由ATCG四種堿基隨意組合,堿基長度可以不固定。
[0022] 根據一個特別優(yōu)選的實施方式,該二次擴增引物序列為:
[0023]primer1 :5 'AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGAT
[0024]indexprimer:5'CAAGCAGAAGACGGCATACGAGATATGCTTGTGACTGGAGTTCAGACGTGTGCT CTTCCGATCT3'
[0025] 其中indexprimer中下劃線部分堿基代表barcode序列。
[0026] 根據本發(fā)明的方法,所述將細胞裂解的酶為ProteinaseK,或者Protease,或者二 者的組合。
[0027] 在一種實施方式中,本發(fā)明所述裂解的細胞為單細胞或者多細胞。
[0028] 在另一種實施方式中,本發(fā)明所述起始樣本為DNA,包括但不限于基因組DNA,線 粒體DNA,長片段PCR產物,或者長片段染色質免疫共沉淀DNA。
[0029] 在又一種實施方式中,本發(fā)明所述起始樣本為RNA反轉錄產物cDNA。
[0030] 本發(fā)明的第二個方面提供了一種用于構建單細胞DNA測序文庫的試劑盒,該試劑 盒包含:1.將細胞進行裂解的裂解緩沖液和裂解酶;2.用于預擴增的引物、緩沖液和DNA 聚合酶;3.用于二次擴增的引物、緩沖液和DNA聚合酶。
[0031] 根據本發(fā)明的試劑盒,所述將基因組DNA進行預擴增的酶為熱穩(wěn)定的聚合酶,可 以是一種,也可以是兩種或者兩種以上的組合。包含但不局限于以下的一種或者幾種: LA-Taq,rTaq,Phusion,DeepVent,DeepVent(exo-),Gold360,PlatinumTaq,KAPA2G Robust.
[0032] 根據本發(fā)明的試劑盒,所述將基因組DNA進行預擴增的引物為一段特殊設計的引 物。該引物從5'端開始有三部分主要結構:第一部分為通用區(qū)域,此區(qū)域在不同測序平臺 中序列不同,其長度為1至70個堿基,優(yōu)選的為10-50個堿基,更優(yōu)選的為10-30個堿基。 第二部分為簡并堿基區(qū)域,該區(qū)域只包含兩種不互補的堿基,A和C,或A和G,或T和C,或 T和G,長度為2-20個堿基,優(yōu)選的為5-15個堿基,更優(yōu)選的為5-10個堿基。第三部分為 隨機簡并堿基區(qū)域,其中每個堿基可以是A、T、C、或G,并且在最后三個隨機簡并堿基之間 加入兩個硫代修飾(詳見圖4)。其長度為1-8個堿基,優(yōu)選的,其長度為2-6個堿基;最優(yōu) 選的,其長度為3或4個堿基。
[0033] 根據一個特別優(yōu)選的實施方式,該預擴增的引物序列為
[0034] 5' GCTCTTCCGATCTRRRRRRRRRRN*N*N3'
[0035]5'GCTCTTCCGATCTMMMMMMMMMMN*N*N3,
[0036] 5' GCTCTTCCGATCTYYYYYYYYYYN*N*N3'
[0037] 5' GCTCTTCCGATCTKKKKKKKKKKN*N*N3'
[0038] 其中R代表A或G堿基,M代表A或C堿基,Y代表C或T堿基,K代表G或T堿 基。N代表隨機簡并堿基A/T/C/G,*代表硫代修飾。