明--個(gè)實(shí)施例,F(xiàn)LG基因 C. 538:泌〉T突變的正鏈Reads比對(duì) 結(jié)果;
[0040] 圖15顯示了根據(jù)本發(fā)明--個(gè)實(shí)施例,F(xiàn)LG基因 C,332idelA突變的正鏈Reads比 對(duì)結(jié)果邊及
[OOW 圖16顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例,超待額鮮本進(jìn)行円_怎基因檢測(cè)的方法的流程 示意圖。
【具體實(shí)施方式】 的042] 下面詳細(xì)描述本發(fā)明的實(shí)施例。下面描述的實(shí)施例是示例性的,僅用于解禪本發(fā) 明,而不能理解為對(duì)本發(fā)明的限制。
[0043] 探轉(zhuǎn)
[0044] 根據(jù)本發(fā)明的一個(gè)方面,本發(fā)明提供了一組探針。根據(jù)本發(fā)明的實(shí)施例,所述一 組探針特異性識(shí)強(qiáng)FLG基因編碼區(qū)的至少--部分,且所述探轉(zhuǎn)滿足選自下列條件的至少之
[0045] (1)所述探針的長度為75bp ;
[0046] (2)所述探針特異性識(shí)別FLG基因編碼區(qū)上游IObp至下游IObp之間的序列;
[0047] 做特異性識(shí)郭GC含量高于0. 6及低于0. 3的區(qū)域的探針,乘數(shù)大于2 ;
[0曰蝴 (4)所述探針與目標(biāo)序歹ij的烙解溫度為60-10攝氏度,優(yōu)選80攝氏度;
[0049] 城所述探針不包含發(fā)夾結(jié)構(gòu); 防050] 傲所述探針與參考基因組±的至多2個(gè)位點(diǎn)匹配;
[0051] (巧所述探鐘選擇時(shí)的窗口滑動(dòng)大小為lObp。
[0052] 根據(jù)本發(fā)明的實(shí)施例,本發(fā)明的一組探轉(zhuǎn)具有沈Q ID NO: 1-1095所示的核酸序 列,具體如下表所示:
[0076] 根據(jù)本發(fā)明的一些實(shí)施例,所述--紐探計(jì)游離于溶液。根據(jù)本發(fā)明的另一些實(shí)施 例,所述---組探鐘結(jié)合于固枯基質(zhì)上,形成芯片。
[0077] 根據(jù)本發(fā)明的實(shí)施例,所述參考基因組為所述待測(cè)樣本來源物種的參考基因組序 歹[],優(yōu)選人參考基因組,例如hg巧。 的〇巧]發(fā)明人假奇蛙發(fā)現(xiàn),本發(fā)明的-一組探針,對(duì)其特異性識(shí)別的FLG基因編碼區(qū)的至 少--詔分的捕獲特異性好、靈敏度和覆蓋度非常高,能夠有效用于迸行FLG基因編碼區(qū)的 捕獲檢測(cè)。稷據(jù)本發(fā)明的實(shí)施例,刮用本發(fā)明的一紐探軒能夠灌確育效地補(bǔ)獲探針轉(zhuǎn)異性 識(shí)別的目標(biāo)序列-------------FLG基因編與區(qū)的至少一講分,從而能夠有效構(gòu)建獲得目標(biāo)序列的核 酸測(cè)序文庫,迸一步,將該核酸測(cè)序文庫用于高通量測(cè)序,能夠有效確定円.G基因編碼區(qū)的 至少一部分的序列信息,并且目標(biāo)序列的測(cè)序深度高,數(shù)據(jù)利羯率高,迸而能夠?qū)崿F(xiàn)對(duì)阿X; 基因的檢測(cè)?;?,利駕上述方法構(gòu)建高通量測(cè)序文庫,并迸而用于FLG基因檢測(cè),特異性 好、靈敏度和覆蓋度高,可重復(fù)性好,從而能夠成功解讀円.G基因,發(fā)現(xiàn)突變,且該方法實(shí)驗(yàn) 過程穩(wěn)定、成本低、操作簡(jiǎn)阜、工作量小、易推廣。 賄巧]探軒的用途
[0080] 如豁所述,本發(fā)明的一紐探針,捉其特異性識(shí)規(guī)的FLG基因編碼區(qū)的至少一部分 的捕獲特異性好、靈敏度和覆蓋度非常高,能夠有效用于迸行FLG基因編碼區(qū)的捕獲檢測(cè)。 由此,本發(fā)明還提供了上述一組探針在FLG基因編碼區(qū)的捕獲檢測(cè)中亂臂途。
[0081] 迸而,根據(jù)本發(fā)明的另一方面,本發(fā)明提供了一種構(gòu)建高通量測(cè)序文庫的方法。根 據(jù)本發(fā)明的實(shí)旌例,該方法包括W下步驟;
[00軸首先,將基因組DNA片段化,W便獲得DNA片段。根據(jù)本發(fā)明的實(shí)施例,進(jìn)--步包 括從樣本中提敢基因組DNA的步驟,優(yōu)選所述樣本來源于喃乳動(dòng)物,更優(yōu)選所述嚼乳動(dòng)物 為人巧小鼠的至少--種,優(yōu)選所述基因組DNA為入類全血基因組DNA。稷據(jù)本發(fā)明的一些實(shí) 旌例,利用covaris.-S2打斷儀蔣基因組DNA片段化。根據(jù)本發(fā)明的具體示例,所述D齡片 段的長度為約200-巧化P。
[0083] 其次,蔣所述DNA片段遙行末端修復(fù),W便獲得經(jīng)過末端修復(fù)的DNA片段。稷據(jù)本 發(fā)明的實(shí)施例,在將所述DNA片段迸行末場(chǎng)修復(fù)前,迸一步包括純化DNA片段的步驟。根據(jù) 本發(fā)明的實(shí)施例,將所述DM片段迸行末端修復(fù)是利駕Klenow片段、T4DNA聚合酶和T4多 核巧酸激酶迸行的,其中,所述!Uenow片段具有5' 3'聚合酶活性和3' 5'聚合酶活 性,但缺少5' - 3'舞切酶活性。由此,末端修復(fù)效果好,有利于后續(xù)步驟的迸行。
[0084] 再次,在所述經(jīng)過末端修復(fù)的DNA片段的3'末端添加堿基A,W便獲得具有粘性末 端A的DNA片段。根據(jù)本發(fā)明的實(shí)施例,將所述經(jīng)過末端修復(fù)的DNA片段的3'末端添加堿 基A是利用Klenow(3' --5' exo--)迸行的。由此,反應(yīng)效果好,有鴉于后續(xù)步驟的迸行。 [0曰巧]接著,蔣所述具有粘性末端A的DNA片段與接頭相連,化便獲得連接產(chǎn)物。稷據(jù)本 發(fā)明的實(shí)施例,蔣所述具有粘性末端A的DNA片段與接頭相連是利用T4DNA連接酶進(jìn)行的。 由化,連接效果好,有利于后續(xù)步驟的迸行。
[0086] 然后,詞用前面所述的一組探針揖所述連接產(chǎn)物迸行篩選,W便獲得目的片段,所 述目的片段構(gòu)成所述高通量測(cè)序文庫。稷據(jù)本發(fā)明的實(shí)施例,所述高通量測(cè)序文庫適于利 用高通量測(cè)序技術(shù)優(yōu)選Hiseq2000測(cè)序平臺(tái)遙行測(cè)序。稷據(jù)本發(fā)明的另一些實(shí)施例,利用 固相芯片雜交搞獲技術(shù)迸行所述篩選。直蛙,篩選效果好,畜利于后續(xù)步驟的進(jìn)行。
[0087] 發(fā)明人發(fā)現(xiàn),本發(fā)明所采用的--組探針對(duì)其特異性識(shí)割的円X;基因編碼區(qū)的至少 --郭分的捕獲特異性好、靈敏度和覆蓋度非常高,能夠有效用于迸行FLG基因編碼區(qū)的捕 獲檢測(cè)。迸而,剎用本發(fā)明的方法能夠耀確有效地捕獲探針特異性識(shí)別的旨標(biāo)序列--化G 基因編碼區(qū)的至少一部分,鉤建目標(biāo)序列的核酸測(cè)序文庫,迸而蔣該核酸測(cè)序文庫羯于高 通量測(cè)序后,能夠有效確定FLG基因編媽區(qū)的至少一轟分的序列信息,并且目標(biāo)序列的測(cè) 序深度高,數(shù)據(jù)利用率高,迸而能夠?qū)崿F(xiàn)對(duì)FLG基因的檢測(cè)。此解,利用本發(fā)明的方法構(gòu)建 高通量測(cè)序文庫,迸而用于FLG基因檢測(cè),特異性好、靈敏度和覆蓋度高,可重復(fù)性好,從而 能壌成功解讀FLG基因,發(fā)現(xiàn)突變(例如拷貝數(shù)變異(CNV)和單核巧酸多態(tài)性(SNP)),且該 方法實(shí)驗(yàn)過程穩(wěn)定、成本低、操作簡(jiǎn)單、.衛(wèi)作量小、易推廣。
[0088] 根據(jù)本發(fā)明的又一方面,本發(fā)明提供了一種痛定特測(cè)樣本FLG基因編碼區(qū)核酸序 列的方法。根據(jù)本發(fā)明的實(shí)施例,該方法包括化下步驟; 防089] 首先,根據(jù)前面所述的構(gòu)建高通量測(cè)序文庫的方法,構(gòu)建特測(cè)樣本的高通量測(cè)序 文庫,所述高通量測(cè)序文庫包含F(xiàn)LG基因編碼區(qū)核酸序列。
[0090] 接著,捉所述待測(cè)樣本的高通量測(cè)序文庫遙行測(cè)序,便獲得測(cè)序結(jié)果。根據(jù)本發(fā) 明的實(shí)施例,利羯高通量測(cè)序技術(shù)優(yōu)選HiseqSOOO測(cè)序平臺(tái)迸行所述測(cè)序。由化,測(cè)序通量 高,結(jié)果準(zhǔn)確可靠。
[0091] 然后,基于所述測(cè)序結(jié)果,確定所述待測(cè)樣本FLG基因編碼區(qū)的核酸序巧j。稷據(jù)本 發(fā)明的實(shí)施例,進(jìn)一步包括:將所述待測(cè)樣本FLG基因編碼區(qū)的核酸序列與參考基因組序 列迸行比對(duì),W便擁!定所述待測(cè)樣本FLG基因編碼區(qū)是否存在突變,并獲得變異信息。根據(jù) 本發(fā)明的實(shí)施例,所述參考基因組為所述待測(cè)樣本來源物種的參考基因組序列,優(yōu)選入?yún)?考基因紐,例如hgl9。 賄92] 發(fā)明人發(fā)現(xiàn),本發(fā)明所采屬的一組探針對(duì)其特異性識(shí)副的FLG基因編碼區(qū)的至少 一部分的搞獲轄異性好、靈敏度和覆蓋度非常高,能夠畜效用于FLG基因編與區(qū)的捕獲檢 巧i]。迸而,利羯本發(fā)明的方法能夠準(zhǔn)確有效地捕獲探針特異性識(shí)割的目標(biāo)序列------円沿基 因編碼區(qū)的至少一轟分,構(gòu)建目標(biāo)序列的核酸測(cè)序文庫,并迸行高通量測(cè)序,從而能夠有效 確定FLG基因編碼區(qū)的至少一部分的序列信息,并豆肖棟序列的測(cè)序深度高,數(shù)據(jù)利用率 高,迸而能夠?qū)崿F(xiàn)犧FLG基因的檢測(cè)?;?,利駕本發(fā)明的方法構(gòu)建高通量測(cè)序文庫,并確 定待測(cè)樣本円.G基因編碼區(qū)核酸序列,特異性好、靈敏度和覆蓋度高,可重復(fù)性好,結(jié)果準(zhǔn) 確商靠,從而能夠成功解讀FLG基因,發(fā)現(xiàn)突變(例如拷貝數(shù)變異炬NV)和單核昔酸多態(tài)性 (SNP)),畳該方法實(shí)驗(yàn)過程穩(wěn)定、成本低、操作筒單、工作量小、易推廣。
[0093] 需要說明的是,針對(duì)多個(gè)待測(cè)#本,巧茲分別構(gòu)建每一個(gè)特測(cè)樣本的高通量測(cè)序 文庫,并在每個(gè)測(cè)序文庫中均引入標(biāo)簽序列,使得各測(cè)序文庫的標(biāo)簽序列相互不同,迸而, 蔣各測(cè)序文摩混合后迸行高通量測(cè)序,并基于各標(biāo)簽序列超測(cè)序結(jié)果遙行區(qū)分。由此,能夠 有效實(shí)現(xiàn)同時(shí)對(duì)多個(gè)待測(cè)樣本進(jìn)行FLG基因編碼區(qū)序列檢測(cè)。
[0094] 根據(jù)本發(fā)明的再一方面,本發(fā)明提供了一種構(gòu)建高通量測(cè)序文庫的裝置。根據(jù)本 發(fā)明的實(shí)施例,參照?qǐng)D1,該裝置1000包括;片段健單元100、末端修復(fù)單元200、堿基A添 加單元300、接頭連接阜元400和篩選單元500。 賄財(cái)根據(jù)本發(fā)明的實(shí)施例,所述片段化單元100用于將基因紐DNA片段化,便獲得 DNA片段。根據(jù)本發(fā)明的實(shí)施例,迸一步包括基因紐DNA提戟單元,所述基因組DNA提取單 元與所述片段化單元100相連,用于從樣本中提取基因紐DNA,優(yōu)選所述樣本來源于哺乳動(dòng) 物,更優(yōu)選所述哺載動(dòng)物為人和小鼠的至少一種,優(yōu)選所述基因紐DNA為入類全血基因組 DNA。根據(jù)本發(fā)明的實(shí)施例,所述片段化單元100為covaris-S2巧斷儀。根據(jù)本發(fā)明的實(shí) 施例,所述日NA片段的長度為約200-2日加 P。
[0096] 根據(jù)本發(fā)明的實(shí)施例,所述末端修復(fù)單元200與所述片段化單元100相連,用于將 所述DNA片段迸行末端修復(fù),巧便獲得經(jīng)過末端修復(fù)的DM片段。根據(jù)本發(fā)明釣實(shí)施例,遙 ---步包括純化單元,所述純化單元與所述片段化單元100和所述末端修復(fù)單元200相連,用 于在蔣所述DM片段迸行末端修復(fù)前,犧所述DNA片段迸行純健。根據(jù)本發(fā)明的實(shí)施例,將 所述DNA片段迸行末端修復(fù)是利用Kleno邱片段、T4DNA聚合酶和T4多核巧酸激酶迸行的, 其中,所述Klenow片段具有5' 一 3'聚合酶活性和3> - 5>聚合酶活性,但缺少5' - 3' 外切酶活性。由化,末端修復(fù)效果好,有利于后續(xù)步驟的迸行。 防097] 根據(jù)本發(fā)明的實(shí)施例,所述堿基A添加單元300與所述末端修復(fù)阜元200相連,用 于在所述經(jīng)過末端修復(fù)的DM片段的3'末端添加堿基A,巧便獲得具有粘性末端A的DM 片段。根據(jù)本發(fā)明的實(shí)施例,將所述經(jīng)過末端修復(fù)的日NA片段的3'末端添加堿基A是刮用 f(lenow(3' -5' exo-)迸行的。由此,反應(yīng)效果化畜利于后續(xù)步驟的迸行。 的098] 根據(jù)本發(fā)明的實(shí)旌例,所述接頭連接單元400羯于將所述具有粘性末端A的DMA 片段與接頭相連,化便獲得連接產(chǎn)物。根據(jù)本發(fā)明釣實(shí)施例,將所述具有黏性末端A的DNA 片段與接頭相連是利用T4DNA連接酶迸行的。由此,連接效果婷,有利于后續(xù)步驟的迸行。
[0099] 根據(jù)本發(fā)明的實(shí)施例,所述歸選單元500與所述接頭連接單元400相連,并設(shè)置有 前面所述的一紐探針,用于利用所述一組探計(jì)對(duì)所述連接產(chǎn)物迸行婦選,巧便獲得目的片 段,所述目的片段構(gòu)成所述高通量測(cè)序文庫。根據(jù)本發(fā)明的實(shí)施例,所述高通量測(cè)序文庫適 于利用高通量測(cè)序技術(shù)優(yōu)選Hiseq2000測(cè)序平臺(tái)迸行測(cè)序,根據(jù)本發(fā)明的實(shí)施例,所述髓 選阜元500適于刮用固精芯片雜交捕獲技術(shù)迸行所述雜交捕獲。由此,篩選效果好,有詞于 后續(xù)步驟的迸行。
[0100] 根據(jù)本發(fā)明的