專(zhuān)利名稱::循環(huán)“連接-延伸”基因組測(cè)序法的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及基因測(cè)序技術(shù),尤其是一種循環(huán)"連接一延伸"基因組測(cè)序法,屬于生物醫(yī)學(xué)
技術(shù)領(lǐng)域:
。
背景技術(shù):
:現(xiàn)有基因測(cè)序技術(shù)有以下幾種1、焦磷酸測(cè)序法(Pyrosequencing)焦磷酸測(cè)序(Pyrosequencing)技術(shù)是新一代DNA序列分析技術(shù),該技術(shù)無(wú)須進(jìn)行電泳,DNA片段也無(wú)須熒光標(biāo)記,操作極為簡(jiǎn)便。Pyrosequencing技術(shù)是由4種酶催化的同一反應(yīng)體系中的酶級(jí)聯(lián)化學(xué)發(fā)光反應(yīng),在每一輪測(cè)序反應(yīng)中,只加入一種dNTP,若該dNTP與模板配對(duì),聚合酶就可以將其摻入到引物鏈中并釋放出等摩爾數(shù)的焦磷酸基團(tuán)(PPi)。PPi可最終轉(zhuǎn)化為可見(jiàn)光信號(hào),并由PyrogramTM轉(zhuǎn)化為一個(gè)峰值。每個(gè)峰值的高度與反應(yīng)中摻入的核苷酸數(shù)目成正比。然后加入下一種dNTP,繼續(xù)DNA鏈的合成。它可以快速、準(zhǔn)確地測(cè)定一段較短的目標(biāo)片段。Pyrosequecing技術(shù)操作簡(jiǎn)單,結(jié)果準(zhǔn)確可靠,可應(yīng)用于SNP位點(diǎn)檢測(cè)、等位基因頻率測(cè)定、細(xì)菌和病毒分型等領(lǐng)域。但是,與此同時(shí),焦磷酸測(cè)序技術(shù)可以檢測(cè)核苷,但是會(huì)出錯(cuò),因?yàn)檫@項(xiàng)技術(shù)很難區(qū)分單一堿基和一串類(lèi)似的相鄰堿基之間的不同,其運(yùn)用具有一定的局限性。2、Solexa測(cè)序技術(shù)將基因組DNA打成幾百個(gè)堿基(或更短)的小片斷,在片斷的兩個(gè)末端加上接頭,利用專(zhuān)利的芯片:其芯片表面連接有一層單鏈引物,DNA片斷成單鏈后通過(guò)芯片表面的引物堿基互補(bǔ)被一端"固定"在芯片上,引物擴(kuò)增使得單鏈DNA成為雙鏈,該雙鏈變性后成為單鏈,其一端"固定"在芯片上,另外一端隨機(jī)和附近的另外一個(gè)引物互補(bǔ),被"固定"住,形成"橋"。這樣的反應(yīng)在上千萬(wàn)DNA單分子上發(fā)生,形成的單鏈橋以周?chē)囊餅閿U(kuò)增引物,在芯片表面進(jìn)行擴(kuò)增,形成雙鏈。雙鏈經(jīng)變性成單鏈,再次形成橋,成為下一輪擴(kuò)增的模板繼續(xù)擴(kuò)增,經(jīng)過(guò)30輪擴(kuò)增,每個(gè)單分子得到了1000倍擴(kuò)增,成為單克隆"DNA簇群"。"DNA簇群"在GenomeAnalyzer綜合分析儀上進(jìn)行序列分析。序列合成反應(yīng)體系包括有引物、DNA聚合酶、4種標(biāo)記了不同熒光的核苷酸,每個(gè)核苷酸的堿基被保護(hù)基團(tuán)封閉。每次反應(yīng)摻入一個(gè)核苷酸,該核苷酸類(lèi)別可通過(guò)標(biāo)記熒光進(jìn)行識(shí)別,經(jīng)過(guò)掃描,讀取該次反應(yīng)顏色后,位于堿基末端的保護(hù)基團(tuán)被除去,繼續(xù)下一輪反應(yīng),如此反復(fù),得出片段的精確序列。該技術(shù)讀長(zhǎng)為30-35個(gè)核苷酸。3.SOLiD測(cè)序技術(shù)S0LiD測(cè)序技術(shù)中首先將DNA經(jīng)物理方法處理成幾百堿基左右的片段,兩端與接頭相連接,與Adaptor相連的DNA片段和固定有與接頭序列互補(bǔ)序列的磁珠混合后,進(jìn)行EmulsionPCR。PCR擴(kuò)增結(jié)束后,將變性DNA單鏈與磁珠移至載玻片上。連接法測(cè)序測(cè)序引物與接頭可以互補(bǔ)雜交,其5'端可與和鄰近序列互補(bǔ)的寡核苷酸相連。八聚體寡核苷酸可競(jìng)爭(zhēng)性與引物相連接(該寡聚體的第四位和第五位為熒光標(biāo)記位點(diǎn))。當(dāng)其標(biāo)記顏色被讀取后,即將連接上的寡核苷酸在第五位和第六位之間切斷,以移除標(biāo)記,進(jìn)行下一輪反應(yīng),依此循環(huán)。在第一輪反應(yīng)中,可以得到確定的堿基位點(diǎn)為4、5、9、10、14、15位堿基等。重復(fù)該反應(yīng)過(guò)程,偏移一位堿基,使用較第一輪少一個(gè)堿基的引物進(jìn)行反應(yīng),可以確定的堿基位點(diǎn)包括3、4、8、9、13、14等,如此往復(fù),直至偏移至引物的第一個(gè)堿基(即待測(cè)序列0位點(diǎn)堿基)。由于該位點(diǎn)堿基已知,可通過(guò)讀取的熒光顏色得知位點(diǎn)1的堿基類(lèi)型,然后,又以位點(diǎn)1堿基熒光顏色推知位點(diǎn)2的堿基類(lèi)型,依此類(lèi)推,直至整個(gè)序列讀序完成。此技術(shù)目前的讀長(zhǎng)為30至35個(gè)堿基。SOLiDSystemOverview的測(cè)序原理及其特點(diǎn)目前市場(chǎng)上有四種高通量測(cè)序儀,分別是Solexa,454(GS-FLX),SOLiD和Polonator。根據(jù)測(cè)序原理,它們可以被分為兩大類(lèi)使用合成法測(cè)序(SequencingbySynthesis)的Solexa和454,及使用連接法測(cè)序(SequencingbyLigation)的Polonator和S0LiD。這些高通量測(cè)序儀的共同點(diǎn)是不需要大腸桿菌系統(tǒng)進(jìn)行DNA模板擴(kuò)增,且測(cè)序所得序列較短其中的454序列最長(zhǎng),為200300個(gè)堿基,其余三種序列都只有幾十個(gè)堿基。測(cè)序原理及序列長(zhǎng)度的差異決定了各種高通量測(cè)序儀具有不同的應(yīng)用領(lǐng)域。實(shí)驗(yàn)室引進(jìn)的SOLiD(SequencingbyOligonucleotideLigationandDetection)是ABI(A卯liedBiosystems)公司生產(chǎn)的高通量測(cè)序儀。目前這臺(tái)SOLiD運(yùn)行穩(wěn)定,SOLiD實(shí)驗(yàn)及數(shù)據(jù)分析小組也可以為大家提供專(zhuān)業(yè)的技術(shù)服務(wù)。所以接下來(lái)的關(guān)鍵是如何把SOLiD測(cè)序儀應(yīng)用到符合其技術(shù)特點(diǎn)的科研項(xiàng)目中。SOLiD關(guān)鍵技術(shù)及其原理SOLiD使用連接法測(cè)序獲得基于"雙堿基編碼原理"的SOLiD顏色編碼序列,隨后的數(shù)據(jù)分析比較原始顏色序列與轉(zhuǎn)換成顏色編碼的reference序列,把SOLiD顏色序列定位到reference上,同時(shí)校正測(cè)序錯(cuò)誤,并可結(jié)合原始顏色序列的質(zhì)量信息發(fā)現(xiàn)潛在SNP位點(diǎn)。SOLiD文庫(kù)構(gòu)建使用SOLiD測(cè)序時(shí),可根據(jù)實(shí)際需要,制備片段文庫(kù)(fragmentlibrary)或末端配對(duì)文庫(kù)(mate-pairedlibrary)。簡(jiǎn)單地說(shuō),制備片段文庫(kù)就是在短DNA片段(60110bp)兩端加上SOLiD接頭(P1、P2ad即ter)。油包水PCR文庫(kù)制備得到大量末端帶Pl、P2adapter但內(nèi)部插入序列不同的DNA雙鏈模板。和普通PCR—樣,油包水PCR也是在水溶液進(jìn)行反應(yīng),該水相含PCR所需試劑,DNA模板及可分別與Pl、P2adapter結(jié)合的P1、P2PCR引物。油包水PCR最大的特點(diǎn)是可以形成數(shù)目龐大的獨(dú)立反應(yīng)空間以進(jìn)行DNA擴(kuò)增。SOLiD測(cè)序把小水滴體積及水相中DNA模板和磁珠的個(gè)數(shù)比等重要參數(shù)進(jìn)行了技術(shù)優(yōu)化和流程固定,盡可能提高"優(yōu)質(zhì)小水滴"(水滴中只含一個(gè)DNA模板一個(gè)P1磁珠)的數(shù)量,為后續(xù)SOLiD測(cè)序提供只含有一種DNA模板擴(kuò)增產(chǎn)物的高質(zhì)量PI磁珠。含DNA模板P1磁珠的固定S0LiD測(cè)序反應(yīng)在SOLiD玻片表面進(jìn)行。含有DNA模板的Pl磁珠共價(jià)結(jié)合在S0LiD玻片表面。磁珠是SOLiD測(cè)序的最小單元。每個(gè)磁珠SOLiD測(cè)序后形成一條序列。S0LiD雙堿基編碼原理及測(cè)序流程S0LiD"雙堿基編碼原理"實(shí)質(zhì)上是闡明了熒光探針的顏色類(lèi)型與探針編碼區(qū)堿基對(duì)的對(duì)應(yīng)關(guān)系。S0LiD連接反應(yīng)的底物是8堿基單鏈熒光探針混合物。連接反應(yīng)中,這些探針按照堿基互補(bǔ)規(guī)則與單鏈DNA模板鏈配對(duì)。探針5'末端可分別標(biāo)記熒光染料;探針3'端15位為隨機(jī)堿基,可以是"A,T,C,G"四種堿基中的任何一種堿基,其中第l、2位構(gòu)成的堿基對(duì)是表征探針染料類(lèi)型的編碼區(qū),"雙堿基編碼矩陣"規(guī)定了該編碼區(qū)16種堿基對(duì)和4種探針顏色的對(duì)應(yīng)關(guān)系,而35位的"n"表示隨機(jī)堿基,68位的"z"指的是可以和任何堿基配對(duì)的特殊堿基,由上可知,S0LiD連接反應(yīng)底物中共有45種底物探針。單向SOLiD測(cè)序包括五輪測(cè)序反應(yīng),每輪測(cè)序反應(yīng)含有多次連接反應(yīng)(一般情況下,片段文庫(kù)是7次,mate-paired文庫(kù)是5次,所以片段文庫(kù)共有35個(gè)連接反應(yīng),而末端配對(duì)文庫(kù)共有25次連接反應(yīng))。每輪測(cè)序反應(yīng)的第一次連接反應(yīng)由與Pl引物區(qū)域互補(bǔ)的"連接引物"介導(dǎo)。這五種連接引物長(zhǎng)度相同,但在Pl引物區(qū)域的位置相差一個(gè)堿基(分別用n,n-l,n-2,n-3,n-4表示),都含有5'端磷酸,所以可以介導(dǎo)連接反應(yīng)的進(jìn)行?,F(xiàn)以圖5所示一個(gè)磁珠上發(fā)生的SOLiD測(cè)序反應(yīng)為例進(jìn)行說(shuō)明。數(shù)據(jù)分析原理SOLiD測(cè)序完成后,獲得了由顏色編碼組成的SOLiD原始序列。理論上來(lái)說(shuō),按照"雙堿基編碼矩陣",只要知道所測(cè)DNA序列中任何一個(gè)位置的堿基類(lèi)型,就可以將SOLiD原始顏色序列"解碼"成堿基序列。但由于雙堿基編碼規(guī)則中雙堿基與顏色信息的兼并特性(一種顏色對(duì)應(yīng)4種堿基對(duì)),前面堿基的顏色編碼直接影響緊跟其后堿基的解碼,所以一個(gè)錯(cuò)誤顏色編碼就會(huì)引起"連鎖解碼錯(cuò)誤",改變錯(cuò)誤顏色編碼之后的所有堿基。和所有其它測(cè)序儀一樣,測(cè)序錯(cuò)誤在所難免,關(guān)鍵是對(duì)測(cè)序錯(cuò)誤的評(píng)價(jià)和后續(xù)處理。為避免"連鎖解碼錯(cuò)誤"的發(fā)生,SOLiD數(shù)據(jù)分析軟件不直接將SOLiD原始顏色序列解碼成堿基序列,而是依靠reference序列進(jìn)行后續(xù)數(shù)據(jù)分析。SOLiD序列分析軟件首先根據(jù)"雙堿基編碼矩陣"把reference堿基序列轉(zhuǎn)換成顏色編碼序列,然后與SOLiD原始顏色序列進(jìn)行比較,來(lái)獲得SOLiD原始顏色序列在reference的位置,及兩者的匹配性信息。Reference轉(zhuǎn)換而成的顏色編碼序列和SOLiD原始序列的不完全匹配主要有兩種情況"單顏色不匹配"和"兩連續(xù)顏色不匹配"。由于每個(gè)堿基都被獨(dú)立地檢測(cè)兩次,且SNP位點(diǎn)將改變連續(xù)的兩個(gè)顏色編碼,所以一般情況下SOLiD將單顏色不匹配處理成測(cè)序錯(cuò)誤,這樣一來(lái),SOLiD分析軟件就完成了該測(cè)序錯(cuò)誤的自動(dòng)校正;而連續(xù)兩顏色不匹配也可能是連續(xù)的兩次測(cè)序錯(cuò)誤,SOLiD分析軟件將綜合考慮該位置顏色序列的一致性及質(zhì)量值來(lái)判斷該位點(diǎn)是否為SNP。SOLiD技術(shù)可對(duì)具有reference基因組序列的物種進(jìn)行重測(cè)序,鑒定SNP,indel及基因組結(jié)構(gòu)變化;對(duì)含有全基因組序列且轉(zhuǎn)錄本注釋較好的物種開(kāi)展轉(zhuǎn)錄組學(xué)研究,解析細(xì)胞轉(zhuǎn)錄產(chǎn)物的數(shù)量變化及其結(jié)構(gòu)信息。但SOLiD測(cè)序所得序列的長(zhǎng)度只有幾十個(gè)堿基,數(shù)據(jù)分析過(guò)程依賴reference序列,目前尚沒(méi)有基于S0LiD原始顏色序列的從頭拼接(denovoassembly)軟件,這些不足之處大大限制了SOLiD技術(shù)在新物種測(cè)序領(lǐng)域的應(yīng)用。SOLiD測(cè)序儀內(nèi)在技術(shù)特點(diǎn)決定其并不適合每個(gè)測(cè)序項(xiàng)目。要根據(jù)實(shí)際情況(物種基因組研究現(xiàn)狀和測(cè)序通量要求等)理性判斷。目前完成一個(gè)哺乳動(dòng)物全基因組的測(cè)序大約需要上千萬(wàn)美元。大幅度降低DNA測(cè)序成本將會(huì)給生命科學(xué)和醫(yī)學(xué)的研究方式帶來(lái)革命性的變化??焖俚统杀救祟?lèi)全基因組測(cè)序技術(shù)正在全世界范圍內(nèi)高速發(fā)展,已經(jīng)成為國(guó)際上一個(gè)競(jìng)爭(zhēng)十分激烈的研究領(lǐng)域。由于目前的DNA測(cè)序方法均應(yīng)用PCR產(chǎn)物作為測(cè)序模板,因此很難實(shí)現(xiàn)人類(lèi)全基因組的高覆蓋度再測(cè)序,而且測(cè)序成本還很高。為了實(shí)現(xiàn)高通量,低成本快速的DNA檢測(cè)方案,使得全基因組DNA測(cè)序成本能夠被一般人能接受,為以后充分開(kāi)發(fā)利用DNA序列信息為人類(lèi)進(jìn)行疾病診斷與預(yù)防,實(shí)現(xiàn)個(gè)性化的醫(yī)療方案,以及藥物開(kāi)發(fā),生物工程等領(lǐng)域的具體研究具有重要而深遠(yuǎn)的意義,應(yīng)該說(shuō)上述的幾種方法都具有很高的應(yīng)用價(jià)值,但都存在許多不足。
發(fā)明內(nèi)容本發(fā)明目的是克服現(xiàn)有技術(shù)之不足,提供一種新的高通量測(cè)序策略,即循環(huán)"連接-延伸"DNA測(cè)序方法,其技術(shù)方案如下循環(huán)"連接-延伸"DNA測(cè)序方法,基于SOLiD測(cè)序技術(shù)的連接法測(cè)序原理,其特征在于采用一條測(cè)序引物連接一段通用寡核苷酸后,通過(guò)延伸一個(gè)堿基檢測(cè)DNA模板對(duì)應(yīng)位置的堿基信息,然后將標(biāo)記物從測(cè)序引物連接的寡核苷酸中某個(gè)位置切割,按照同樣的方法再連接相同的寡核苷酸后延伸一個(gè)標(biāo)記單體,依次可以測(cè)定DNA模板上若干間隔位置的堿基信息;將上一完成若干間隔位置堿基序列測(cè)定的測(cè)序引物通過(guò)變性或消化法清除,更換新測(cè)序引物,同樣按照"連接-延伸"法測(cè)定DNA模板上其它若干間隔位置的堿基信息;循環(huán)更換測(cè)序引物,最后將這些測(cè)序引物確定的間隔位置堿基信息組合得到DNA模板某個(gè)片段全部堿基的排列信息,實(shí)現(xiàn)DNA序列檢測(cè)。測(cè)序步驟包括(1)通用引物與模板鏈的其起始片段連接,探針混合物與模板反應(yīng),第4、第5位上恰與模板鏈互補(bǔ)配對(duì)的探針與模板結(jié)合,誘發(fā)熒光顯色;(2)用現(xiàn)有化學(xué)的方法從探針第5位點(diǎn)后的切割位點(diǎn)切去末三位堿基;(3)接著,從模板的第6位堿基開(kāi)始,與探針混合物進(jìn)行反應(yīng),重復(fù)以上步驟,得到第4位開(kāi)始之后每間隔5位,與第5位開(kāi)始之后每間隔5位所形成的相鄰兩個(gè)堿基(如9,10,14,15,19,20位)的顏色信息;(4)循環(huán)進(jìn)行以上步驟,直至得到序列中所有滿足(3)中條件的相鄰堿基顏色信息;(5)將上一引物通過(guò)消化法清除,新的通用引物向前移動(dòng)一位,探針的連接位置也就向前移動(dòng)了一位,相同的方法我們們可以得到模板鏈第3、第4位的相鄰堿基顏色信息;(6)促滅熒光,重復(fù)相同的步驟,即可得到該序列的3,4位;8,9位;13,14位等兩兩位點(diǎn)顏色信息;(7)將通用引物依次向前移動(dòng),循環(huán)實(shí)驗(yàn)即可得到模板上所有相鄰位點(diǎn)的顏色信息;(8)在已知模板序列第一個(gè)堿基的情況下,依據(jù)所用SOLiD儀器識(shí)別的的四色標(biāo)記矩陣即可推斷出全序列的信息?;蚪M是由A,T,C,G四種堿基組成的,將四種堿基兩兩分別組合,依據(jù)已定義四色定義矩陣,就可以將一條序列的所有相鄰的堿基用顏色定義出來(lái),測(cè)序時(shí)就用相應(yīng)顏色的熒光標(biāo)記探針。我們采用的探針長(zhǎng)度為八個(gè)堿基,第4、第5兩個(gè)堿基為特異結(jié)合位點(diǎn),當(dāng)這兩個(gè)位置上的堿基恰與模板鏈相應(yīng)位置上的堿基互補(bǔ)配對(duì)時(shí),連在探針尾部的熒光便會(huì)發(fā)光。本發(fā)明的優(yōu)點(diǎn)及顯著效果1)基因組DNA片段化和環(huán)化,以環(huán)狀DNA為模板,采用滾環(huán)擴(kuò)增技術(shù),制備多拷貝的單分子DNA測(cè)序模板陣列,構(gòu)建全基因組的多拷貝單分子微陣列測(cè)序模板芯片。該創(chuàng)新DNA測(cè)序思路是該新型人類(lèi)全基因組測(cè)序技術(shù)的核心;2)堿基逐步加入的在片延伸測(cè)序方法,使測(cè)序變?yōu)橐粋€(gè)連續(xù)的過(guò)程;3)用光學(xué)方法從芯片上所有DNA測(cè)序模板分子上讀取堿基延伸的信息;5整合所有序列的信息,進(jìn)行拼接和在基因組上的定位,最終完成對(duì)人類(lèi)全基因組DNA序列的再測(cè)定。4)本發(fā)明方法可以在保證準(zhǔn)確率的前提之下,使得高通量并行測(cè)序成為可能,為快速自動(dòng)化測(cè)序提供可能,從而有可能通過(guò)自動(dòng)化儀器實(shí)現(xiàn)測(cè)序工作,具有很大的應(yīng)用前景。圖1是本發(fā)明堿基編碼原理圖2是本發(fā)明探針結(jié)構(gòu)圖3-9是本發(fā)明測(cè)序步驟對(duì)應(yīng)圖示;圖10是本發(fā)明實(shí)驗(yàn)結(jié)果分析;圖11、12是本發(fā)明測(cè)序方法及原理示意圖13是本發(fā)明連接時(shí)間的確定的結(jié)果;圖14是本發(fā)明切割反應(yīng)時(shí)間與切割連接效率關(guān)系的測(cè)定。具體實(shí)施例方式下面結(jié)合附圖及實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明。參看圖l,基因組是由A,T,C,G四種堿基組成的,將四種堿基兩兩分別組合,我們們?nèi)藶槎x以下這樣的四色定義矩陣,這樣我們們就可以將一條序列的所有相鄰的堿基用顏色定義出來(lái),測(cè)序時(shí)就用相應(yīng)顏色的熒光標(biāo)記探針。參看圖2,特異性探針長(zhǎng)度為八個(gè)堿基,第四、第五兩個(gè)堿基為特異結(jié)合位點(diǎn),當(dāng)這兩個(gè)位置上的堿基恰與模板鏈相應(yīng)位置上的堿基互補(bǔ)配對(duì)時(shí),連在探針尾部的熒光便會(huì)發(fā)光。參看圖3,是測(cè)序步驟(1)通用引物與模板鏈的其起始片段連接,探針混合物與模板反應(yīng),第四、第五位上恰與模板鏈互補(bǔ)配對(duì)的探針與模板結(jié)合,誘發(fā)熒光顯色。參看圖4,是測(cè)序步驟(2)用化學(xué)的方法從探針第五位點(diǎn)后的切割位點(diǎn)切去末三位堿基。參看圖5,是測(cè)序步驟(3)從模板的第六位堿基開(kāi)始,與探針混合物進(jìn)行反應(yīng),重7復(fù)以上步驟,得到第九、第十位等等的相鄰堿基顏色信息。參看圖6,是測(cè)序步驟(4)循環(huán)進(jìn)行以上步驟,直至得到第九、第十位,第14、15位等等兩兩相鄰堿基顏色信息。參看圖7,是測(cè)序步驟(5)將上一引物通過(guò)消化法清除,新的通用引物向前移動(dòng)一位,探針的連接位置也就向前移動(dòng)了一位,相同的方法我們們可以得到模板鏈第三、第四位的相鄰堿基顏色信息。參看圖8,是測(cè)序步驟(6)促滅熒光,重復(fù)相同的步驟,即可得到該序列的3,4位;8,9位;13,14位等兩兩位點(diǎn)顏色信息。參看圖9,是測(cè)序步驟(7)將通用引物依次向前移動(dòng),循環(huán)實(shí)驗(yàn)即可得到模板上所有相鄰位點(diǎn)的顏色信息。參看圖IO,實(shí)驗(yàn)結(jié)果中,第4,8,12,16,20位堿基分別由標(biāo)記堿基C,C,C,A,A給出信號(hào),因此模板上對(duì)應(yīng)的堿基分別為G,G,G,T,T。參看圖ll,循環(huán)"連接-延伸"DNA測(cè)序方法采用一條測(cè)序引物連接一段通用寡核苷酸后,通過(guò)延伸一個(gè)堿基檢測(cè)DNA模板對(duì)應(yīng)位置的堿基信息,然后將標(biāo)記物從測(cè)序引物連接的寡核苷酸中某個(gè)位置切割,按照同樣的方法再連接相同的寡核苷酸后延伸一個(gè)標(biāo)記單體,依次可以測(cè)定DNA模板上若干間隔位置的堿基信息。將上一完成若干間隔位置堿基序列測(cè)定的測(cè)序引物通過(guò)變性或消化法清除,更換新測(cè)序引物,同樣按照"連接-延伸"法測(cè)定DNA模板上其它若干間隔位置的堿基信息;循環(huán)更換測(cè)序引物,最后將這些測(cè)序引物確定的間隔位置堿基信息組合得到DNA模板某個(gè)片段全部堿基的排列信息,實(shí)現(xiàn)DNA序列檢測(cè)(見(jiàn)圖12)。圖ll、12結(jié)合圖注說(shuō)明如下未知序列的DNA模板1通過(guò)5'固定到固相載體2上,并用測(cè)序引物3與DNA模板完成雜交反應(yīng)如a);在DNA模板知道下,通過(guò)連接酶的作用將8個(gè)堿基的通用寡核苷酸序列4與測(cè)序引物3完成連接反應(yīng)如b);然后加入四種標(biāo)記單體5(ddATP標(biāo)記單體5-1、ddGTP標(biāo)記單體5-2、ddCTP標(biāo)記單體5-3、ddTTP標(biāo)記單體5-4,四種單體標(biāo)記不同顏料)完成延伸反應(yīng)如c);掃描確定對(duì)應(yīng)模板第一個(gè)堿基的信息,使用適當(dāng)?shù)幕瘜W(xué)試劑將離標(biāo)記物從末端第二個(gè)堿基處進(jìn)行切割反應(yīng)如d);依次按照"連接-延伸"的方法實(shí)現(xiàn)DNA模板上若干間隔位置的堿基信息。按照?qǐng)D1的方法采用測(cè)序引物P1將DNA模板上第9、16、23、30、……、等位置上的堿基信息確定。然后將測(cè)序引物P1從DNA模板中清除變性(消化)反應(yīng)a),再采用測(cè)序引物P2將DNA模板上第8、15、22、29、……、等位置上的堿基信息確定,依次更換測(cè)序引物將DNA模板上其它若干間隔位置的堿基信息確定,其中P8,P9引物不需要進(jìn)行連接反應(yīng),只需要進(jìn)行一步延伸反應(yīng)確定一個(gè)堿基的信息。最后將這些堿基信息全部組合得到DNA模板某個(gè)片段全部堿基的排列信息實(shí)現(xiàn)DNA序列。測(cè)序化學(xué)方法和實(shí)驗(yàn)條件1.堿基測(cè)定的特異性采用固定人工合成的寡核苷酸序列作為DNA測(cè)序模板,通過(guò)兩組雙色標(biāo)記單體的方式進(jìn)行單個(gè)堿基的檢測(cè)。實(shí)驗(yàn)結(jié)果表明該方法單個(gè)堿基的檢測(cè)具有高的特異性(只有標(biāo)記堿基G給出了信號(hào),說(shuō)明DNA模板上對(duì)應(yīng)得堿基為C)(參見(jiàn)圖13)。圖注在固定合成DNA模板的兩個(gè)區(qū)域分別用雙色標(biāo)記單體(a:A-Cy5+G-Cy3;b:C_Cy5/T-Cy3)進(jìn)行堿基檢測(cè)的結(jié)果。2.連接時(shí)間的確定(參見(jiàn)圖13)連接20分鐘后熒光強(qiáng)度增加量已經(jīng)很少,20分鐘是最佳連接時(shí)間。3.連接次數(shù)的確定<table>tableseeoriginaldocumentpage9</column></row><table>連接效率60%時(shí),連接l、2、3、4次中未連接所占比例(0.4;0.16;0.064;0.026)連接效率60°/。時(shí),連接l、2、3、4次中未連接所占比例(0.4;0.16;0.064;0.026)4.切割反應(yīng)時(shí)間與切割連接效率關(guān)系(參見(jiàn)圖14)由圖可知,隨著切割時(shí)間的越長(zhǎng),切割效率越高,當(dāng)切割時(shí)間達(dá)到15分鐘后,切割效率變化不大,故選擇15分鐘作為切割反應(yīng)時(shí)間。5.切割條件對(duì)待測(cè)摸板的影響對(duì)摸板的影響考察l:64個(gè)點(diǎn)雜交-連接-酶切(18h,中間加酶l次),變性,熒光引物雜交對(duì)比實(shí)驗(yàn)64個(gè)點(diǎn)雜交-連接-不酶切(18h處理),變性,熒光引物雜交總平均值之比(酶切/不酶切)[(20433/38713=0.52);(最小值/最大值=0.35)]6.結(jié)果驗(yàn)證使用循環(huán)"連接一延伸"測(cè)序法測(cè)得前5個(gè)堿基測(cè)定的結(jié)果,如下加入的標(biāo)記物ATCG正確率(%)(700掃描)_第4個(gè)堿基00482350100第8個(gè)堿基1516214525543169083第12個(gè)堿基1225149517682121582第16個(gè)堿基16839399210281424848_第20個(gè)堿基126515783313064974權(quán)利要求1、循環(huán)“連接——延伸”基因組測(cè)序法,基于SOLiD測(cè)序技術(shù)的連接法測(cè)序原理,其特征在于采用一條測(cè)序引物連接一段通用寡核苷酸后,通過(guò)延伸一個(gè)堿基檢測(cè)DNA模板對(duì)應(yīng)位置的堿基信息,然后將標(biāo)記物從測(cè)序引物連接的寡核苷酸中引物末端位置切割,按照同樣的方法再連接相同的寡核苷酸后延伸一個(gè)標(biāo)記單體,依次可以測(cè)定DNA模板上若干間隔位置的堿基信息;將上一完成若干間隔位置堿基序列測(cè)定的測(cè)序引物通過(guò)變性或消化法清除,更換新測(cè)序引物,同樣按照“連接-延伸”法測(cè)定DNA模板上其它若干間隔位置的堿基信息;循環(huán)更換測(cè)序引物,最后將這些測(cè)序引物確定的間隔位置堿基信息組合得到DNA模板某個(gè)片段全部堿基的排列信息,實(shí)現(xiàn)DNA序列檢測(cè)。2、根據(jù)權(quán)利要求1所述的循環(huán)"連接——延伸"基因組測(cè)序法,其特征在于包括以下步驟(1)通用引物與模板鏈的其起始片段連接,探針混合物與模板反應(yīng),第4、第5位上與模板鏈互補(bǔ)配對(duì)的探針與模板結(jié)合,誘發(fā)熒光顯色;(2)用現(xiàn)有化學(xué)的方法從探針第5位點(diǎn)后的切割位點(diǎn)切去末三位堿基;(3)接著,從模板的第6位堿基開(kāi)始,與探針混合物進(jìn)行反應(yīng),重復(fù)以上步驟,得到第4位開(kāi)始之后每間隔5位,與第5位開(kāi)始之后每間隔5位所形成的相鄰兩個(gè)堿基,如9,10,14,15,19,20位的顏色信息;(4)循環(huán)進(jìn)行以上步驟,直至得到序列中所有滿足(3)中條件的相鄰堿基顏色信息;(5)將上一引物通過(guò)消化法清除,新的通用引物向前移動(dòng)一位,探針的連接位置也就向前移動(dòng)了一位,相同的方法我們們可以得到模板鏈第3、第4位的相鄰堿基顏色信息;(6)促滅熒光,重復(fù)相同的步驟,即可得到該序列的3,4位;8,9位;13,14位等兩兩位點(diǎn)顏色信息;(7)將通用引物依次向前移動(dòng),循環(huán)實(shí)驗(yàn)即可得到模板上所有相鄰位點(diǎn)的顏色信息;(8)在已知模板序列第一個(gè)堿基的情況下,依據(jù)SOLiD儀器識(shí)別的四色標(biāo)記矩陣即可推斷出全序列的信息。全文摘要循環(huán)“連接-延伸”DNA測(cè)序方法,基于SOLiD測(cè)序技術(shù)的連接法測(cè)序原理,采用一條測(cè)序引物連接一段通用寡核苷酸后,通過(guò)延伸一個(gè)堿基檢測(cè)DNA模板對(duì)應(yīng)位置的堿基信息,然后將標(biāo)記物從測(cè)序引物連接的寡核苷酸中某個(gè)位置切割,按照同樣的方法再連接相同的寡核苷酸后延伸一個(gè)標(biāo)記單體,依次可以測(cè)定DNA模板上若干間隔位置的堿基信息;將上一完成若干間隔位置堿基序列測(cè)定的測(cè)序引物通過(guò)變性或消化法清除,更換新測(cè)序引物,同樣按照“連接-延伸”法測(cè)定DNA模板上其它若干間隔位置的堿基信息;循環(huán)更換測(cè)序引物,最后將這些測(cè)序引物確定的間隔位置堿基信息組合得到DNA模板某個(gè)片段全部堿基的排列信息,實(shí)現(xiàn)DNA序列檢測(cè)。文檔編號(hào)C12Q1/68GK101633961SQ20091018443公開(kāi)日2010年1月27日申請(qǐng)日期2009年8月14日優(yōu)先權(quán)日2009年8月14日發(fā)明者峰孫,旻潘,薛易旻,露金,陸祖宏申請(qǐng)人:東南大學(xué)