本發(fā)明屬于基因測(cè)序領(lǐng)域以及生物信息領(lǐng)域,具體涉及一種針對(duì)細(xì)胞基因組上的目的序列及其鄰近序列的靶向dna測(cè)序方法,該方法所使用的用于測(cè)定細(xì)胞中目標(biāo)基因序列及其鄰近序列的試劑盒,以及該試劑盒的應(yīng)用。
背景技術(shù):
1、將外源基因插入到宿主基因組中以建立穩(wěn)定表達(dá)該外源基因的細(xì)胞株時(shí),外源基因以隨機(jī)的方式整合至基因組,這種整合方式帶來的風(fēng)險(xiǎn)之一是外源基因有可能整合到宿主的原癌基因或者抑癌基因上,帶來成瘤性風(fēng)險(xiǎn)。因此需要對(duì)整合有外源基因序列的細(xì)胞株進(jìn)行整合安全性評(píng)估。而對(duì)外源基因進(jìn)行高效且精確的靶向測(cè)序,可以幫助確定外源基因插入的位置和整合情況,幫助研究人員評(píng)估整合的安全性并監(jiān)測(cè)可能的遺傳變化。
2、隨著高通量測(cè)序方法的進(jìn)步,靶向測(cè)序允許通過較低的測(cè)序成本對(duì)樣本進(jìn)行較深的測(cè)序,這使得靶向測(cè)序方法成為檢測(cè)重組細(xì)胞中外源基因的理想方法?!鞍袠?biāo)富集”策略的選擇是決定靶向測(cè)序結(jié)果的關(guān)鍵,即從dna樣本中選擇性地捕獲/或選擇性地?cái)U(kuò)增目的基因組區(qū)域。對(duì)于目的基因鄰近序列的檢測(cè)來說,由于外源基因在細(xì)胞基因組上的插入事件是隨機(jī)的,因此無(wú)法通過常規(guī)的pcr擴(kuò)增富集該外源序列所在的基因組位置的序列。
3、在以往的研究中,通常使用線性擴(kuò)增介導(dǎo)的pcr(linear?amplification-mediatedpcr,lam-pcr)結(jié)合高通量測(cè)序的方法富集并檢測(cè)外源序列的整合位點(diǎn),但該方法依賴線性擴(kuò)增,且擴(kuò)增輪數(shù)多,擴(kuò)增時(shí)間長(zhǎng),容易引起錯(cuò)誤。另一類探針法通過與靶標(biāo)序列互補(bǔ)配對(duì)的核酸探針富集靶序列,但該方法所能檢測(cè)到的與目的基因鄰近的序列較短,且探針捕獲的靈敏度無(wú)法達(dá)到引物擴(kuò)增靈敏度的水平。
技術(shù)實(shí)現(xiàn)思路
1、為了解決現(xiàn)有技術(shù)中靶向測(cè)序存在的測(cè)序深度不夠以及準(zhǔn)確度不高的問題,本發(fā)明建立了一種高靈敏度的用于測(cè)定細(xì)胞中目標(biāo)序列及其鄰近序列的方法。與其他靶向測(cè)序方法相比,本發(fā)明提供的方法不僅可以測(cè)定目標(biāo)基因的序列及其鄰近的未知序列,還可準(zhǔn)確判斷外源的目標(biāo)基因在宿主基因組上的插入位置以及整合位點(diǎn),具有靈敏度高、測(cè)序偏倚小、操作便捷、實(shí)驗(yàn)周期短且成本較低的特點(diǎn)。
2、本發(fā)明采用的技術(shù)方案是:用于測(cè)定細(xì)胞中目標(biāo)基因序列及其鄰近序列的方法,包括如下步驟:
3、s1.打斷gdna并在片段兩端連接環(huán)化接頭,得到片段化gdna;
4、s2.對(duì)s1所得的片段化gdna進(jìn)行環(huán)化,得到環(huán)化gdna;
5、s3.對(duì)s2所得的環(huán)化gdna進(jìn)行反向pcr,富集目標(biāo)基因序列及其鄰近序列,得到富集dna片段;
6、s4.對(duì)s3所得的富集dna片段進(jìn)行文庫(kù)構(gòu)建并測(cè)序,得到測(cè)序數(shù)據(jù);
7、s5對(duì)s4所得的測(cè)序數(shù)據(jù)進(jìn)行生物信息分析,得到分析結(jié)果;所述分析結(jié)果包括目標(biāo)基因的序列信息、位置信息、整合位點(diǎn),以及目標(biāo)基因鄰近序列的序列信息。
8、在本發(fā)明提供的方法中,對(duì)帶有環(huán)化接頭的片段化gdna進(jìn)行環(huán)化,再使用與目標(biāo)基因序列雜交的引物反向擴(kuò)增,可在已知很少的目標(biāo)基因序列的情況下(通常僅需200-300bp的序列信息),富集并檢測(cè)得到目標(biāo)基因片段及其鄰近的數(shù)kb內(nèi)的未知序列信息。進(jìn)一步地,本發(fā)明通過在片段化gdna兩端引入環(huán)化接頭這一特異性核苷酸序列作為斷點(diǎn)標(biāo)記,可用以區(qū)分真正位于基因組上的整合位點(diǎn)和人為引入的斷裂位點(diǎn),保證了數(shù)據(jù)的真實(shí)性,從而準(zhǔn)確鑒定得到目標(biāo)基因在宿主基因組上的整合位點(diǎn)。特別地,實(shí)驗(yàn)發(fā)現(xiàn),使用包埋了環(huán)化接頭的轉(zhuǎn)座子酶(tn5),才能保證最大比例的片段化gdna兩端帶上環(huán)化接頭這一特異性序列,從而保證后續(xù)生物信息分析過程中高效區(qū)分真正的整合位點(diǎn)與人工引入的斷點(diǎn)。若采用其他方法對(duì)基因組dna打斷,如采用內(nèi)切酶、超聲、cas酶等打斷方式,再另外連接環(huán)化接頭,則其連接效率無(wú)法滿足實(shí)驗(yàn)要求,則在后續(xù)分析中無(wú)法準(zhǔn)確區(qū)分真正的整合位點(diǎn)與人工引入的斷裂位點(diǎn)。
9、在技術(shù)效果上,與普通pcr擴(kuò)增測(cè)序相比,本發(fā)明提供的方法可以檢測(cè)目的基因鄰近未知序列的信息;與lam-pcr相比,該方法大大減少了擴(kuò)增輪數(shù),減少pcr引起的錯(cuò)誤率;與探針捕獲測(cè)序法相比,該方法能將檢測(cè)范圍提高至靶標(biāo)核苷酸周圍10kb的大小,且無(wú)需目的基因的全部序列信息即可檢測(cè)目的基因全長(zhǎng),減少了大范圍探針雜交引起的測(cè)序偏倚。因此,該方法與現(xiàn)有技術(shù)相比,具有靈敏度高、測(cè)序偏倚小、操作便捷、實(shí)驗(yàn)周期短且成本較低的特點(diǎn)。
10、具體地,步驟s1包括:使用包埋環(huán)化接頭的轉(zhuǎn)座子酶打斷gdna并在片段兩端連接環(huán)化接頭,得到片段化gdna,對(duì)片段化gdna進(jìn)行磁珠純化。在該步驟中,使用包埋環(huán)化接頭的轉(zhuǎn)座子酶一步完成了基因組dna片段化與結(jié)合環(huán)化接頭的操作,節(jié)約了操作步驟,并保證了最大比例的片段化gdna兩端都帶上環(huán)化接頭,從而有利于后續(xù)生物信息分析過程中對(duì)目標(biāo)基因整合位點(diǎn)與人工引入斷點(diǎn)的準(zhǔn)確區(qū)分。
11、更具體地,所述片段化gdna的長(zhǎng)度不小于1000bp??梢岳斫獾氖牵琯dna理想的打斷長(zhǎng)度一般不小于1000bp,技術(shù)人員可根據(jù)希望測(cè)得的目標(biāo)序列長(zhǎng)度適當(dāng)延長(zhǎng)所述的打斷長(zhǎng)度。同樣可以理解的是,當(dāng)片段化gdna的長(zhǎng)度小于1000bp時(shí),該片段化gdna仍然可用于執(zhí)行后續(xù)步驟。
12、更具體地,所述的包埋環(huán)化接頭的轉(zhuǎn)座子酶優(yōu)選為tte?mix(vazyme,td501)。
13、更具體地,s1中,所述的打斷反應(yīng)體系優(yōu)選為:gdna2?ul,5×ttbl(vazyme,td501)10ul,tte?mix(vazyme,td501)2ul,nuclease-free?water?36ul。所述的打斷反應(yīng)程序優(yōu)選為:55℃10min,4℃forever??梢岳斫獾氖牵夹g(shù)人員可根據(jù)實(shí)際反應(yīng)需求調(diào)整打斷反應(yīng)程序中部分時(shí)間。
14、具體地,步驟s2包括:
15、s2-1.使用t4?pnk對(duì)s1所得的片段化gdna進(jìn)行末端磷酸化,對(duì)磷酸化產(chǎn)物進(jìn)行磁珠純化,得到磷酸化后的片段化gdna;
16、s2-2.使用t4?dnaligase環(huán)化s2-1磷酸化后的片段化gdna,對(duì)環(huán)化產(chǎn)物進(jìn)行磁珠純化,得到環(huán)化gdna。
17、為進(jìn)一步提高s3中環(huán)化效率,在優(yōu)選的實(shí)施例中,首先對(duì)片段化gdna進(jìn)行了末端磷酸化,再對(duì)其進(jìn)行環(huán)化,從而有效提高環(huán)化效率,促進(jìn)后續(xù)反向pcr等步驟的執(zhí)行。
18、具體地,步驟s2還包括:預(yù)處理步驟,所述預(yù)處理步驟(記為s2-0)包括:對(duì)s1所得的片段化gdna進(jìn)行末端補(bǔ)平和/或擴(kuò)增;
19、在預(yù)處理步驟中,若步驟s1中獲得的片段化gdna具有平末端,則具有平末端的片段化gdna可直接用于步驟s2的執(zhí)行;若步驟s1中獲得的片段化gdna不具有平末端,則對(duì)其進(jìn)行末端補(bǔ)平,再將補(bǔ)平后的片段化gdna用于步驟s2的執(zhí)行。更具體地,s2-0中,所述對(duì)s1所得的片段化gdna進(jìn)行末端補(bǔ)平的方法包括:使用dna聚合酶以及與s1中環(huán)化接頭雜交的引物對(duì)s1所得的片段化gdna進(jìn)行末端補(bǔ)平,對(duì)補(bǔ)平產(chǎn)物進(jìn)行磁珠純化,得到補(bǔ)平后的片段化gdna。對(duì)所得的片段化gdna依次進(jìn)行末端磷酸化、環(huán)化,得到環(huán)化gdna。其中,所述的dna聚合酶優(yōu)選為phire熱啟動(dòng)iidna聚合酶。所述的補(bǔ)平體系優(yōu)選為:片段化gdna20?ul,5×phire?buffer?10ul,phire熱啟動(dòng)iidna聚合酶1ul,10mm?dntp?1ul,nuclease-free?water18ul。所述的補(bǔ)平程序優(yōu)選為:72℃?5min。技術(shù)人員可根據(jù)實(shí)際反應(yīng)需求適當(dāng)調(diào)整補(bǔ)平程序的時(shí)長(zhǎng)??梢岳斫獾氖牵谝恍?shí)施例中,s2-0中還可使用klenow酶或t4?dna聚合酶等方法對(duì)s1所得的片段化gdna進(jìn)行末端補(bǔ)平。
20、在預(yù)處理步驟中,為提高片段化gdna的總量,強(qiáng)化實(shí)驗(yàn)靈敏度,也可對(duì)步驟s1中獲得的片段化gdna進(jìn)行擴(kuò)增,且擴(kuò)增的同時(shí)還可起到末端補(bǔ)平的效果。更具體地,s2-0中,所述對(duì)s1所得的片段化gdna進(jìn)行擴(kuò)增的方法包括:使用dna聚合酶以及與s1中環(huán)化接頭雜交的引物對(duì)s1所得的片段化gdna進(jìn)行擴(kuò)增,對(duì)擴(kuò)增產(chǎn)物進(jìn)行磁珠純化,得到擴(kuò)增后的片段化gdna。對(duì)所得的片段化gdna依次進(jìn)行末端磷酸化、環(huán)化,得到環(huán)化gdna。其中,所述的dna聚合酶優(yōu)選為phire熱啟動(dòng)iidna聚合酶;所述的與s1中環(huán)化接頭雜交的引物優(yōu)選為primern617(vazyme?td203),primer?n833(vazyme?td203)。所述的擴(kuò)增體系優(yōu)選為:片段化gdna20?ul,5×phire?buffer?10ul,phire熱啟動(dòng)iidna聚合酶1ul,10mm?dntp?1ul,primern617(vazyme?td203)9ul,primern833(vazyme?td203)9ul。所述的擴(kuò)增程序優(yōu)選為:98℃?1min;98℃?10sec,60℃?30sec,72℃?2min?for?8cycles;72℃?3min;4℃forever??梢岳斫獾氖?,技術(shù)人員可根據(jù)實(shí)際反應(yīng)需求調(diào)整擴(kuò)增程序中部分時(shí)間或循環(huán)數(shù)。
21、在預(yù)處理步驟中,為更高效地對(duì)s1所得的片段化gdna進(jìn)行末端補(bǔ)平,并同時(shí)提高片段化gdna的總量,強(qiáng)化實(shí)驗(yàn)靈敏度,可在一個(gè)反應(yīng)體系內(nèi)一步完成片段化gdna的末端補(bǔ)平以及擴(kuò)增。更具體地,s2-0中,所述對(duì)s1所得的片段化gdna進(jìn)行末端補(bǔ)平和擴(kuò)增的方法包括:使用dna聚合酶以及與s1中環(huán)化接頭雜交的引物對(duì)s1所得的片段化gdna進(jìn)行預(yù)處理,對(duì)預(yù)處理產(chǎn)物進(jìn)行磁珠純化,得到擴(kuò)增后的片段化gdna;對(duì)s2-0所得的預(yù)處理后的片段化gdna依次進(jìn)行末端磷酸化、環(huán)化,得到環(huán)化gdna。其中,所述的dna聚合酶優(yōu)選為phire熱啟動(dòng)iidna聚合酶;所述的與s1中環(huán)化接頭雜交的引物優(yōu)選為primer?n617(vazyme?td203),primern833(vazyme?td203)。所述的預(yù)處理體系優(yōu)選為:片段化gdna?20ul,5×phirebuffer?10ul,phire熱啟動(dòng)iidna聚合酶1ul,10mm?dntp?1ul,primer?n617(vazyme?td203)9ul,primern833(vazyme?td203)9ul。所述的預(yù)處理程序優(yōu)選為:72℃5min;98℃?1min;98℃?10sec,60℃?30sec,72℃?2min?for?8cycles;72℃?3min;4℃?forever。在該預(yù)處理程序中,首先采用72℃?5min程序?qū)ζ位痝dna進(jìn)行末端補(bǔ)平,再執(zhí)行后續(xù)程序?qū)δ┒搜a(bǔ)平后的片段化gdna進(jìn)行擴(kuò)增??梢岳斫獾氖牵夹g(shù)人員可根據(jù)實(shí)際反應(yīng)需求調(diào)整預(yù)處理程序中部分時(shí)間或循環(huán)數(shù)。
22、具體地,步驟s2還包括:后處理步驟,所述后處理步驟(記為s2-3)包括:使用外切酶降解s2所得的環(huán)化gdna中殘余的線性dna片段。
23、在后處理步驟s2-3中,技術(shù)人員可以選擇性地使用外切酶,如exonuclease?v,以降解獲得的環(huán)化gdna中殘余的線性dna,獲得更為純凈的環(huán)化dna。更具體地,s2-3中,所述的降解反應(yīng)體系優(yōu)選為:10×nebuffer45?ul,10mmatp?5ul,1ul?exonucleasev(neb)1ul。所述的降解反應(yīng)程序優(yōu)選為:37℃30min;70℃30min??梢岳斫獾氖牵夹g(shù)人員可根據(jù)實(shí)際反應(yīng)需求調(diào)整降解反應(yīng)程序中部分時(shí)間。
24、具體地,步驟s3包括:使用dna聚合酶以及與目標(biāo)基因序列雜交的引物對(duì)s2所得的環(huán)化gdna進(jìn)行反向pcr,對(duì)反向pcr產(chǎn)物進(jìn)行磁珠純化,得到富集dna片段。所述反向pcr的反應(yīng)體系優(yōu)選為:環(huán)化gdna?36ul,5×phire?reaction?buffer?10ul,10mm-dntp?1ul,polyphire?enzyme?1ul,10um-primer-f?1ul,10um-primer-r?1ul;所述反向pcr的反應(yīng)程序優(yōu)選為:98℃45sec;98℃10sec,60℃30sec,72℃2min?for?30cycles;72℃3min??梢岳斫獾氖?,技術(shù)人員可根據(jù)實(shí)際反應(yīng)需求調(diào)整反向pcr反應(yīng)程序中部分時(shí)間或循環(huán)數(shù)。
25、具體地,步驟s5包括:
26、s5-1.對(duì)測(cè)序數(shù)據(jù)進(jìn)行質(zhì)量控制,得到過濾reads;
27、s5-2.將過濾reads分別比對(duì)到宿主基因組以及目標(biāo)基因參考序列,得到比對(duì)結(jié)果;所述比對(duì)結(jié)果包括目標(biāo)基因的序列信息、位置信息,以及目標(biāo)基因鄰近序列的序列信息;
28、s5-3.根據(jù)s5-2所得的比對(duì)結(jié)果對(duì)過濾reads進(jìn)行篩選,獲得斷裂reads;所述斷裂reads具有比對(duì)到宿主基因組的宿主端序列以及比對(duì)到目標(biāo)基因參考序列的靶標(biāo)端序列;
29、s5-4.對(duì)s5-3所得的斷裂reads分別在宿主基因組和目標(biāo)基因參考序列上的斷裂位點(diǎn)進(jìn)行統(tǒng)計(jì),獲得斷裂位點(diǎn)信息;
30、s5-5.根據(jù)s5-4所得的斷裂位點(diǎn)信息對(duì)s5-3所得的斷裂reads進(jìn)行篩選,去除分隔reads,獲得有效reads;所述分隔reads還具有環(huán)化接頭,且分隔reads的宿主端序列以及靶標(biāo)端序列被環(huán)化接頭分隔;
31、s5-6.對(duì)s5-5所得的有效reads的斷裂位點(diǎn)信息進(jìn)行統(tǒng)計(jì),獲得具有同一斷裂位點(diǎn)的有效reads的數(shù)量并作為每個(gè)斷裂位點(diǎn)的支持量,將支持量超過設(shè)定閾值的斷裂位點(diǎn)確定為目標(biāo)基因的整合位點(diǎn)。
32、更具體地,s5-1包括:使用fastp對(duì)測(cè)序數(shù)據(jù)進(jìn)行質(zhì)量控制,得到過濾reads。其中,所述的質(zhì)量控制是指去除測(cè)序數(shù)據(jù)中的測(cè)序接頭、低質(zhì)量reads、n含量大于設(shè)定n%閾值的reads、序列長(zhǎng)度超過設(shè)定長(zhǎng)度閾值的reads。一般通過reads的phred質(zhì)量值對(duì)低質(zhì)量reads進(jìn)行判定。
33、更具體地,s5-2包括:使用burrows-wheeler?transform,將過濾reads比對(duì)到宿主基因組以及目標(biāo)基因參考序列,獲得比對(duì)bam文件作為比對(duì)結(jié)果。
34、更具體地,s5-3包括:使用samtools,根據(jù)s5-2所得的比對(duì)結(jié)果,對(duì)過濾reads進(jìn)行篩選,獲得斷裂reads。將篩選得到的同時(shí)比對(duì)到目標(biāo)基因參考序列和宿主基因組的過濾reads作為斷裂reads??梢岳斫獾氖牵瑓⒖紙D1s3中所示例的含有目標(biāo)基因序列及其鄰近序列的富集dna片段,所述的斷裂reads應(yīng)同時(shí)具有宿主端序列、靶標(biāo)端序列。且部分?jǐn)嗔裷eads還會(huì)含有環(huán)化接頭,而環(huán)化接頭可位于宿主端序列中間(參考圖1s3中前三條富集dna片段),或靶標(biāo)端序列中間,或宿主端序列與靶標(biāo)端序列之間(參考圖1s3中最后一條富集dna片段)。
35、更具體地,s5-4包括:使用r軟件,對(duì)s5-3所得的斷裂reads分別在宿主基因組和目標(biāo)基因參考序列上的斷裂位點(diǎn)進(jìn)行統(tǒng)計(jì),獲得斷裂位點(diǎn)信息;所述的斷裂位點(diǎn)包括:斷裂reads的宿主端序列比對(duì)至宿主基因組上其兩端斷點(diǎn)、斷裂reads的靶標(biāo)端序列比對(duì)至目標(biāo)基因參考序列上其兩端斷點(diǎn)。
36、更具體地,s5-5包括:使用r軟件,根據(jù)s5-4所得的斷裂位點(diǎn)信息對(duì)s5-3所得的斷裂reads進(jìn)行篩選,去除分隔reads,獲得有效reads。將篩選得到的環(huán)化接頭位于宿主端序列與靶標(biāo)端序列之間的斷裂reads(參考圖1s3中最后一條富集dna片段)作為分隔reads??梢岳斫獾氖?,所述分隔reads具有宿主端序列、靶標(biāo)端序列以及環(huán)化接頭,且宿主端序列以及靶標(biāo)端序列被環(huán)化接頭分隔。因此,所述分隔reads的至少一個(gè)斷裂位點(diǎn)緊貼所述的環(huán)化接頭序列,從而影響后續(xù)真正整合位點(diǎn)的判定,故在此步驟將所述的分隔reads從斷裂reads中去除,保留下的斷裂reads作為有效reads,用于s5-6中整合位點(diǎn)判定。
37、更具體地,s5-6包括:對(duì)s5-5所得的有效reads的斷裂位點(diǎn)信息進(jìn)行統(tǒng)計(jì),獲得具有同一斷裂位點(diǎn)的有效reads的數(shù)量并作為每個(gè)斷裂位點(diǎn)的支持量,將支持量超過100條有效reads的斷裂位點(diǎn)確定為目標(biāo)基因的整合位點(diǎn)??梢岳斫獾氖牵瑂5-6首先統(tǒng)計(jì)有效reads所支持的整合位點(diǎn):在一個(gè)具體實(shí)施例中,有101條有效reads具有同一斷裂位點(diǎn),則該斷裂位點(diǎn)的支持量為101條有效reads;隨后對(duì)目標(biāo)基因的整合位點(diǎn)進(jìn)行判定,判定條件為:若某一斷裂位點(diǎn)的支持量超過100條有效reads,則該斷裂位點(diǎn)確定為目標(biāo)基因的整合位點(diǎn)。即,在該實(shí)施例中,大于100條有效reads所支持的整合位點(diǎn)為高可信度整合位點(diǎn),而上述支持量為101條有效reads的斷裂位點(diǎn)滿足判定條件,可判定為目標(biāo)基因的整合位點(diǎn)。同樣可以理解的是,技術(shù)人員可以根據(jù)實(shí)際情況,對(duì)支持量設(shè)定合適的閾值,如上述的100條有效reads,或50條有效reads,或150條有效reads,或200條有效reads。
38、具體地,所述方法還包括:根據(jù)s5所得的分析結(jié)果,鑒定目標(biāo)基因覆蓋范圍內(nèi)的突變信息;所述突變信息包括snp、indel、sv中的任意一種。由于s5獲得的分析結(jié)果包括目標(biāo)基因的序列信息以及目標(biāo)基因鄰近序列的序列信息,因此,技術(shù)人員可根據(jù)上述分析結(jié)果鑒定目標(biāo)基因覆蓋范圍內(nèi)的突變信息。
39、具體地,所述方法還包括:根據(jù)s5所得的分析結(jié)果,對(duì)目標(biāo)基因的整合位點(diǎn)進(jìn)行注釋分析;所述注釋分析的內(nèi)容包括整合位點(diǎn)在基因組上的分布情況、整合位點(diǎn)是否位于基因元件區(qū)域。對(duì)整合位點(diǎn)在基因組上的分布情況進(jìn)行分析,判斷該整合位點(diǎn)是否位于原癌基因/抑癌基因附近,從而可對(duì)重組細(xì)胞的安全性進(jìn)行評(píng)估。對(duì)整合位點(diǎn)是否位于基因元件區(qū)域進(jìn)行分析,從而可判斷該整合位點(diǎn)是否位于啟動(dòng)子、外顯子、內(nèi)含子、utr等關(guān)鍵區(qū)域,從而可對(duì)重組細(xì)胞的遺傳穩(wěn)定性進(jìn)行評(píng)估。
40、本發(fā)明還提供了一種用于測(cè)定細(xì)胞中目標(biāo)基因序列及其鄰近序列的試劑盒,包括上述方法中所使用的用于得到片段化gdna的打斷試劑組、用于得到環(huán)化gdna的環(huán)化試劑組、用于得到富集dna片段的反向pcr試劑組、用于文庫(kù)構(gòu)建的建庫(kù)試劑組;所述打斷試劑組具有包埋環(huán)化接頭的tn5轉(zhuǎn)座子;所述環(huán)化試劑組具有pcr試劑、末端磷酸化試劑、環(huán)化試劑;所述pcr試劑包括dna聚合酶、與測(cè)序接頭雜交的引物;所述反向pcr試劑組具有dna聚合酶、與目標(biāo)基因序列雜交的引物;所述建庫(kù)試劑組匹配illumina測(cè)序平臺(tái)。所述試劑盒被用于測(cè)定細(xì)胞中目標(biāo)基因序列及其鄰近序列時(shí),執(zhí)行上述方法中的步驟s1~s4,構(gòu)建得到的文庫(kù),使用illumina平臺(tái)對(duì)構(gòu)建的文庫(kù)進(jìn)行測(cè)序;對(duì)所得的測(cè)序數(shù)據(jù)進(jìn)行生物信息分析,得到分析結(jié)果;所述分析結(jié)果包括目標(biāo)基因的序列信息、位置信息、整合位點(diǎn),以及目標(biāo)基因鄰近序列的序列信息。
41、本發(fā)明還提供了上述的試劑盒在檢測(cè)重組細(xì)胞基因組遺傳穩(wěn)定性中的應(yīng)用,所述檢測(cè)的內(nèi)容包括:外源基因整合位點(diǎn)、平均拷貝數(shù)定量、外源基因完整性。所述試劑盒被用于檢測(cè)重組細(xì)胞基因組遺傳穩(wěn)定性時(shí),執(zhí)行上述方法中的步驟s1~s4,構(gòu)建得到的文庫(kù),使用illumina平臺(tái)對(duì)構(gòu)建的文庫(kù)進(jìn)行測(cè)序;對(duì)所得的測(cè)序數(shù)據(jù)進(jìn)行生物信息分析,得到分析結(jié)果;所述分析結(jié)果包括目標(biāo)基因的序列信息、位置信息、整合位點(diǎn),以及目標(biāo)基因鄰近序列的序列信息;根據(jù)所述的分析結(jié)果,鑒定得到外源基因整合位點(diǎn)、平均拷貝數(shù)定量、外源基因完整性。
42、本發(fā)明還提供了上述的試劑盒在對(duì)通過隨機(jī)整合方式建立的細(xì)胞株進(jìn)行安全性評(píng)估中的應(yīng)用,所述評(píng)估的內(nèi)容包括:外源基因整合位點(diǎn)、外源基因整合位點(diǎn)注釋分析、外源基因完整性。其中,所述的隨機(jī)整合例如可以是通過慢病毒隨機(jī)整合。所述試劑盒被用于對(duì)通過隨機(jī)整合方式建立的細(xì)胞株進(jìn)行安全性評(píng)估時(shí),執(zhí)行上述方法中的步驟s1~s4,構(gòu)建得到的文庫(kù),使用illumina平臺(tái)對(duì)構(gòu)建的文庫(kù)進(jìn)行測(cè)序;對(duì)所得的測(cè)序數(shù)據(jù)進(jìn)行生物信息分析,得到分析結(jié)果;所述分析結(jié)果包括目標(biāo)基因的序列信息、位置信息、整合位點(diǎn),以及目標(biāo)基因鄰近序列的序列信息;根據(jù)所述的分析結(jié)果,鑒定得到外源基因整合位點(diǎn)、外源基因整合位點(diǎn)注釋分析、外源基因完整性。所述的外源基因整合位點(diǎn)注釋分析可以包括整合位點(diǎn)在宿主基因組上的分布情況、整合位點(diǎn)是否位于基因元件區(qū)域。對(duì)整合位點(diǎn)在宿主基因組上的分布情況進(jìn)行分析,判斷該整合位點(diǎn)是否位于原癌基因/抑癌基因附近,從而可對(duì)重組細(xì)胞的安全性進(jìn)行評(píng)估。對(duì)整合位點(diǎn)是否位于基因元件區(qū)域進(jìn)行分析,從而可判斷該整合位點(diǎn)是否位于啟動(dòng)子、外顯子、內(nèi)含子、utr等關(guān)鍵區(qū)域,從而可對(duì)重組細(xì)胞的遺傳穩(wěn)定性進(jìn)行評(píng)估。
43、本發(fā)明的有益效果:
44、本發(fā)明建立了一種高靈敏度的用于測(cè)定細(xì)胞中目標(biāo)基因序列及其鄰近序列的檢測(cè)方法。與其他靶向測(cè)序方法相比,本發(fā)明提供的方法不僅可以測(cè)定目標(biāo)基因的序列及其鄰近的未知序列,還可準(zhǔn)確判斷外源的目標(biāo)基因在宿主基因組上的插入位置以及整合位點(diǎn),具有靈敏度高、測(cè)序偏倚小、操作便捷、實(shí)驗(yàn)周期短且成本較低的特點(diǎn)。該方法在檢測(cè)重組細(xì)胞基因組遺傳穩(wěn)定性、對(duì)通過隨機(jī)整合方式建立的細(xì)胞株進(jìn)行安全性評(píng)估中,具有廣闊的應(yīng)用前景。