探針及其用圖
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及生物技術(shù)領(lǐng)域,尤其是目標(biāo)基因高通量測序技術(shù)領(lǐng)域。具體地,本發(fā) 明涉及探針及其用途,更具體地,本發(fā)明涉及--組探轉(zhuǎn)、構(gòu)建高通量測序文庫的方法、確定 待測樣本阿X;基因編碼區(qū)核酸序列的方法、構(gòu)建高通量測序文庫的裝置W及擁定待測樣本 FLG基因編碼區(qū)核酸序列的系統(tǒng)。
【背景技術(shù)】
[0002] 尋嘗型魚鱗?。↖chthyosis vulgaris)是-----'種常染色體顯性遺傳病,該疾病的發(fā) 病率為1:250-1:1000。主耍輸床癥狀包括皮膚損害呈"魚鱗"或"蛇皮"狀,毛囊角乾丘疹, 毛孔呈點狀,手紋和腳紋多、深、亂。與該疾病精關(guān)的基因是位于lq2i. 3的編碼絲聚蛋白 (Filaggrin)的円X;基因,該基因是表皮分化末麗編碼結(jié)掏蛋白的基因簇的一部分。FLG基 因全長12. 7 - 14. 7化,包含3個外癥子巧xon) ,Exonl (巧bp)是非編媽序列,Exon2(巧9bp) 包含起始編碼序列,Exoii3 (12-14陸)包括N末端和編碼絲聚蛋白的iO-12個長度達Ik的重 復(fù)序列。目it,F(xiàn)LG基因檢測方法主要是迸行長P邸,然后對長PCR產(chǎn)物迸行巢式擴增,得到 特異性的目的序列后,結(jié)合sanger測序解讀FLG序列。然而,送段序列不僅組合復(fù)雜,還具 有個體特異性,使羯該方援時常會出現(xiàn)未得到特異性序列或測序失敗,實驗過程攝不穩(wěn)定, 導(dǎo)致不能徹底解讀FLG。另:邦,第一代測序儀同時測序的樣本數(shù)少,畳需耍先經(jīng)過PCR過程, 工作量大,通量小,檢出率不到30%。
[000幻因而,目前的FLG基因檢測方法仍有待改進。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)詞題之一。為此,本發(fā)明的一個目的 在于提出一種能夠廣效檢測特異性序列、徹底解讀円X;基因,且實驗過程穩(wěn)定、工作量小, 通量大的FLG基因檢測方法。
[0005] 需耍說明的是,本發(fā)明是基于發(fā)明入的T列工作而完成的:
[0006] 發(fā)明人利羯目標(biāo)區(qū)域捕獲技術(shù),使用特異的外顯子補獲芯片捉入FLG基因迸行高 通量測序。該技術(shù)的基本原理是使用一套寡核巧酸探針來捕獲基因組上的目標(biāo)序列,然后 使用通用引物對送些搞獲到的序列迸行PCR擴增,再對送些擴增產(chǎn)物迸行高通量測序,從 而識別日NA樣品中的堿基序列,通過生物信息分析方法捉測序所得序列信息迸行分析,從 而找到目標(biāo)序列的變異信息,包括單核巧酸變異,插入/缺失,重復(fù)等,該方法兩大幅提高 円石基因的檢出率,約為83 %。
[0007] 迸而,根據(jù)本發(fā)明的一個方面,本發(fā)明提供了一組探針。根據(jù)本發(fā)明的實施例,所 述一組探針特異'註識別FLG基因編碼區(qū)的至少一部分,且所述探針滿足選自下列條粹的至 少之一:
[0008] (1)所述探針的長度為巧bp ;
[000引 城所述探鐘特異性識魏阿怎基因編媽區(qū)上游IObp至下游IObp么間的序歹ij;
[0010] 城特異性識蔚j GC含量高于0. 6及低于0. 3的區(qū)域的探針,乘數(shù)大于2 ;
[0011] (4)所述探針與目標(biāo)序列的烙解溫度為60--10攝氏度,優(yōu)選80攝氏度;
[0012] 減所述探鐘不包舊發(fā)夾結(jié)構(gòu);
[0013] ㈱所述探針與參考基因組上的至多2個位點匹配;
[0014] (7)所述探針選擇時的窗口滑動大小為!0bp。
[0015] 發(fā)明人假奇蛙發(fā)現(xiàn),本發(fā)明的-一組探針,對其特異性識別的FLG基因編碼區(qū)的至 少--詔分的捕獲特異性好、靈敏度和覆蓋度非常高,能夠有效用于迸行FLG基因編碼區(qū)的 捕獲檢測。稷據(jù)本發(fā)明的實施例,刮用本發(fā)明的一紐探軒能夠灌確育效地補獲探針轉(zhuǎn)異性 識別的目標(biāo)序列-------------FLG基因編與區(qū)的至少一講分,從而能夠有效構(gòu)建獲得目標(biāo)序列的核 酸測序文庫,迸一步,將該核酸測序文庫用于高通量測序,能夠有效確定円.G基因編碼區(qū)的 至少一部分的序列信息,并且目標(biāo)序列的測序深度高,數(shù)據(jù)利羯率高,迸而能夠?qū)崿F(xiàn)對阿X; 基因的檢測。此外,利馬上述方法構(gòu)建高通量測序文庫,并迸而用于FLG基因檢測,特異性 好、靈敏度和覆蓋度高,可重復(fù)性好,從而能夠成功解讀松G基因,發(fā)現(xiàn)突變,且該方法實驗 過程穩(wěn)定、成本低、操作簡單、.衛(wèi)作量小、易推廣。
[0016] 根據(jù)本發(fā)明的另一方面,本發(fā)明提供了一種構(gòu)建高通量測序文庫的方法。根據(jù)本 發(fā)明的實施例,該方法包括F步驟;將基因組DNA片段化,W便獲得DNA片段;將所述DNA 片段迸行末端修復(fù),巧便獲得經(jīng)過末端修復(fù)的DNA片段;在所述經(jīng)過末端修復(fù)的DNA片段的 3'末端添加堿基A,W便獲得具有粘性末端A的MA片段;蔣所述具有粘性末端A的DNA片 段與接頭相連,W便獲得連接產(chǎn)物;利用前面所述的一組探鐘對所述連接產(chǎn)物迸行篩選,W 便獲得肖的片段,所述旨的片段構(gòu)成所述高通量測序文庫。
[0017] 根據(jù)本發(fā)明的實旌例,本發(fā)明所采用的一組探轉(zhuǎn)捉其特異性識別的FLG基因編與 區(qū)的至少一部分的捕獲特異性好、靈敏度和覆蓋度非常高,能夠有效用于進行FLG基因編 碼區(qū)的捕獲檢測。迸而,利用本發(fā)明的方援能夠準(zhǔn)確有效地捕獲探轉(zhuǎn)特異性識別的目標(biāo)序 列--FLG基因編碼區(qū)的至少一部分,構(gòu)建旨標(biāo)序列的核酸測序文庫,遙而將該核酸測序文 悚用十局通黨測斤后,能夠有效滿巧FLG基因編碼梭的至少一帯;分的序列倍息,并且目柄; 序列的測序深度高,數(shù)據(jù)利用率高,進而能夠?qū)崿F(xiàn)超F(xiàn)LG基因的檢測。此外,利用本發(fā)明的 方法構(gòu)建高通量測序文庫,遙而用于FLG基因檢測,特異性好、靈敏度和覆蓋度高,可重復(fù) 性好,從而能夠成功解讀FLG基因,發(fā)現(xiàn)突變,且該方法實驗過程穩(wěn)定、成本低、操作簡單、 工作量小、易推廣。
[0018] 根據(jù)本發(fā)明的又-一方畫,本發(fā)明提供了一種確定待測樣本FLG基因編碼區(qū)核酸序 列釣方法。根據(jù)本發(fā)明的實施例,該方法包括W下步驟;稷據(jù)前面所述的構(gòu)建高通量測序文 庫的方法,構(gòu)建特測樣本的高通量測序文庫,所述高通量測序文庫包含F(xiàn)LG基因編碼區(qū)核 酸序列;犧所述待測#本的高通量測序文庫迸行測序,W便獲得測序結(jié)果;茲及基于所述 汲賠結(jié)果,確定所述特測樣本FLG基因編碼區(qū)的核酸序列。
[001引發(fā)明人發(fā)現(xiàn),本發(fā)明所采用的一組探鐘對其特異性識別的FLG基因編碼區(qū)的至少 ----部分的捕獲轉(zhuǎn)異性好、靈敏度和覆蓋度非常高,能夠育效用于FLG基因編碼區(qū)的搞獲檢 巧ij。迸而,利羯本發(fā)明的方法能夠準(zhǔn)確有效地捕獲探針特異性識別的目標(biāo)序列-------------FLG基因 編碼區(qū)的至少一部分,構(gòu)建目標(biāo)序列的核酸測序文庫,并迸行高通量測序,從而能夠有效確 定FLG基因編碼區(qū)釣至少一郭分的序列信息,并畳目標(biāo)序列釣測序深度高,數(shù)據(jù)利羯率高, 迸而能壌實現(xiàn)對FLG基因的檢測。此外,利用本發(fā)明的方法構(gòu)建高通量測序文庫,并滿定待 測樣本FLG基因編碼區(qū)核酸序列,轉(zhuǎn)異性好、靈敏度和覆蓋度廣,巧重復(fù)性好,結(jié)果推確可 靠,從而能夠成功解讀FLG基因,發(fā)現(xiàn)突變,且該方法實驗過程穩(wěn)定、成本低、操作筒單、工 作量小、易推廣。
[0020] 根據(jù)本發(fā)明的再一方面,本發(fā)明提供了一種構(gòu)建高通量測序文庫的裝置。根據(jù)本 發(fā)明的實施例,該裝置包括:片段化單元,所述片段化單元羯于將基因組MA片段化,W便 獲得日NA片段;末端修復(fù)單元,所述末端修復(fù)單元與所述片段化單元指連,用于將所述DNA 片段迸行末端修復(fù),W便獲得經(jīng)過末端修復(fù)的DNA片段;堿基A添加單元,所述堿基A添加 單元與所述末端修復(fù)單元相連,用于在所述經(jīng)過末端修復(fù)的DNA片段的3'末端添加堿基A, W便獲得具有粘性末端A的MA片段;接頭連接單元,所述接頭連接單元羯于蔣所述具有粘 性末端A的DNA片段與接頭相連,W便獲得連接產(chǎn)物;化及篩選率元,所述篩選阜元與所述 接頭連接單元相連,并設(shè)置有前面所述的一組探針,屬于利用所述一組探針對所述連接產(chǎn) 物進行歸選,W便獲得目的片段,所述目的片段構(gòu)成所述高通量測序文庫。
[0021] 根據(jù)本發(fā)明的實施例,本發(fā)明所采用的一組探轉(zhuǎn)捉其特異性識郭的円石基因編碼 區(qū)的至少一部分的搞獲特異性好、靈敏度和覆蓋度非常高,能夠有效用于遙行FLG基因編 碼區(qū)的顯獲檢測。進而,利用本發(fā)明的裝置能夠準(zhǔn)確有效地捕獲探轉(zhuǎn)特異性識別的肖棟序 列-----------FLG基因編與區(qū)的至少一部分,并構(gòu)建目標(biāo)序列的核酸測序文庫,迸而蔣該核酸測序 文庫用于高通量測序后,能夠有效確定FLG基因編媽區(qū)的至少一轟分的序列信息,并豆目 標(biāo)序列的測序深度高,數(shù)據(jù)利羯率高,迸而能夠有效實現(xiàn)對FLG基因的檢測。賠外,利用本 發(fā)明的裝置構(gòu)建高通量測序文庫,迸而用于FLG基因檢測,轉(zhuǎn)異性好、靈敏度和覆蓋度高, 可重復(fù)性好,從而能壌成功解讀FLG基因,發(fā)現(xiàn)突變,且該裝置結(jié)構(gòu)簡單,適用的實驗過程 穩(wěn)定、生產(chǎn)成本低、操作簡單、易推廣。
[0曰創(chuàng)根據(jù)本發(fā)明的另一方面,本發(fā)明還提供了…-種確定待測樣本阿怎基因編碼區(qū)核酸 序列的系統(tǒng)。根據(jù)本發(fā)明的實施例,該系統(tǒng)包括;文庫構(gòu)建裝置,所述文庫構(gòu)建裝置為前面 所述的構(gòu)建高通量測序文庫的裝置,用于構(gòu)建特測樣本的高通量測序文庫,所述高通量測 序文庫包含F(xiàn)LG基因編碼區(qū)核酸序列:測序裝置,所述測序裝置與所述文庫構(gòu)建裝置相連, 用于對所述待測樣本的高通量測序文庫迸行測序,W便獲得測序結(jié)果;W及分析裝置,所述 分析裝置與所述測序裝置相連,屬于基于所述測序結(jié)果,確定所述待測樣本FLG基因編碼 區(qū)的核酸序列。 的0巧]發(fā)明人發(fā)現(xiàn),本發(fā)明所采用的--組探針對其特異性識割的円X;基因編碼區(qū)的至少 --郭分的捕獲特異性好、靈敏度和覆蓋度非常高,能夠有效用于FLG基因編媽區(qū)的搞獲檢 巧ij。迸而,利屬本發(fā)明的系統(tǒng)能夠準(zhǔn)確有效地補獲探針特異性識副的目標(biāo)序列--FLG基因 編碼區(qū)的至少一部分,構(gòu)建目標(biāo)序列的核酸測序文庫,并迸行高通量測序,從而能夠畜效擁I 定化G基因編碼區(qū)的至少--部分的序列信息,并畳目標(biāo)序列的測序深度高,數(shù)據(jù)利羯率廣, 迸而能夠?qū)崿F(xiàn)對FLG基因的檢測。此外,利用本發(fā)明的系統(tǒng)構(gòu)建高通量測序文摩,并擁定待 測樣本FLG基因編碼區(qū)核酸序列,轉(zhuǎn)異性好、靈敏度和覆蓋度高,巧重復(fù)性好,結(jié)果灌確可 需,從耐能夠成巧鮮讀FLG蟲因,發(fā)現(xiàn)炎變,瓦該系統(tǒng)結(jié)構(gòu)簡畢,饋用的實驗過程據(jù)巧、生產(chǎn) 成本低、操作簡單、易推廣。
[0024] 本發(fā)明的附加方面和優(yōu)點蔣在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實踐了解到。
【附圖說明】
[002引本發(fā)明的上述和/或附加的方面和優(yōu)點從結(jié)合T面附圖對實施例的搖述中將變 得明顯和容易理解,其中;
[0026] 國1顯示了根據(jù)本發(fā)明一個實施例,本發(fā)明的構(gòu)建高通量測序文庫的裝置的結(jié)構(gòu) 示意圖;
[0027] 圖2顯示了稷據(jù)本發(fā)明一個實施例,本發(fā)明的確定待測樣本FLG基因編碼區(qū)核駿 序列的.巧統(tǒng)的結(jié)構(gòu)可;意圖;
[0028] 圖3顯示了根據(jù)本發(fā)明--個實施例,插入片段的大小和分布情況;
[002引圖4顯示了根據(jù)本發(fā)明一個實施例,測序數(shù)據(jù)亂質(zhì)量分布圖;
[0030] 圖5顯示了根據(jù)本發(fā)明一個實施例,單個堿基的平巧測序錯誤率評估結(jié)果圖; [003U 圖6顯示了根據(jù)本發(fā)明一個實施例,樣本的GC含量分布情況;
[0032] 國7顯示了根據(jù)本發(fā)明--個實施例,較差的reads的拭:(AT)含量分布情況;
[0033] 圖8顯示了根據(jù)本發(fā)明一個實施例,信息分析結(jié)果報告文件截取圖;
[0034] 圖9顯示了根據(jù)本發(fā)明一個實施例,肖標(biāo)基因 FLG的各個CDS的深度、覆蓋度的緩 計結(jié)果; 防035] 圖10顯示了根據(jù)本發(fā)明一個實施例,樣本的阜堿基深度複松分布圖;
[0036] 圖11顯示了 1畏據(jù)本發(fā)明一個實施例,經(jīng)生物信息分析后樣本FLG部分?jǐn)?shù)據(jù)截圖; 賄巧圖12墨示了根據(jù)本發(fā)明一個實施例,數(shù)據(jù)解讀的流程示意圖;
[0038] 圖13顯示了很據(jù)本發(fā)明一個實施例,突變檢測的結(jié)果;
[0039] 國14顯示了根據(jù)本發(fā)