對轉(zhuǎn)基因邊界的高通量分析的制作方法
【專利摘要】本發(fā)明是鑒定在已知DNA序列側(cè)翼的未知DNA序列的方法。本發(fā)明改善了測定在已知DNA序列側(cè)翼的未知DNA序列的準(zhǔn)確性、靈敏性、和再現(xiàn)性。此要求保護的方法可以作為高通量方法配置以快速且有效鑒定在轉(zhuǎn)基因側(cè)翼的植物基因組染色體序列??梢允褂脤@些未知序列的進一步分析來表征轉(zhuǎn)基因插入位點,從而鑒定源自轉(zhuǎn)基因整合的重排、插入和缺失。另外,可以使用對染色體側(cè)翼序列的分析來鑒定轉(zhuǎn)基因在染色體上的位置。
【專利說明】對轉(zhuǎn)基因邊界的高通量分析
發(fā)明領(lǐng)域
[0001] 一般而言,本發(fā)明涉及植物分子生物學(xué)和生物化學(xué)領(lǐng)域。本發(fā)明關(guān)注用于分析轉(zhuǎn)基因邊界及測定在轉(zhuǎn)基因側(cè)翼的染色體序列的改良的聚合酶鏈?zhǔn)椒磻?yīng)(PCR)方法。
[0002]發(fā)明背景
[0003]測定與插入轉(zhuǎn)基因相鄰的染色體側(cè)翼序列和基因組位置在技術(shù)上是挑戰(zhàn)性的。已經(jīng)開發(fā)出多種方法來克服鑒定在已知DNA序列側(cè)翼的未知DNA序列的限制。然而,這些用于鑒定在已知轉(zhuǎn)基因側(cè)翼的基因組染色體序列的傳統(tǒng)PCR方法諸如LM-PCR(又稱為基因組步移(Genome Walking))和其它方法(包括:反向PCR(1-PCR)、熱不對稱交錯PCR(TAIL-PCR)、錨式 PCR(a-PCR)和隨機引發(fā)(randomly primed)PCR(rm-PCR))由于制備過程中的DNA損失而受到低檢測靈敏性(需要大量模板DNA)或低特異性阻礙。
[0004]聚合酶鏈?zhǔn)椒磻?yīng)(PCR)是一種通常采用的分子生物學(xué)方法。該方法如下實施:使雙鏈模板DNA變性,將寡核苷酸引物與DNA模板退火,并經(jīng)由DNA聚合酶延伸DNA鏈。寡核苷酸引物設(shè)計為與DNA的相反鏈退火,并且定位為使得由DNA聚合酶生成的DNA鏈充當(dāng)另一引物的模板鏈。重復(fù)每個循環(huán),導(dǎo)致DNA片段的指數(shù)擴增。(Mullis等,美國專利N0.4,683,195,4,683,202,及4,800,159)。本領(lǐng)域技術(shù)人員使用PCR對于擴增和分離DNA片段以進行后續(xù)分析是基本的。
[0005]經(jīng)由聚合酶鏈?zhǔn)椒磻?yīng)(PCR)分離和分析DNA模板要求側(cè)翼DNA序列的知識。不幸的是,此要求限制對已知DNA序列區(qū)域的PCR擴增。使用PCR方法鑒定轉(zhuǎn)基因位置在基因組內(nèi)的位置受到轉(zhuǎn)基因?qū)ι矬w基因組內(nèi)未知染色體位置的隨機插入阻礙。鑒定與已知DNA序列相鄰定位的未知DNA序列的方法對于鑒定生物體染色體內(nèi)的轉(zhuǎn)基因位置是必要的。另外,可以使用此類方法鑒定新穎的基因序列,從而鑒定新性狀,測定已經(jīng)插入生物體的基因組中的轉(zhuǎn)座子或病毒序列的基因組位置,或者鑒定經(jīng)由插入誘變插入基因組中的多核苷酸序列的染色體位置。
[0006]已經(jīng)開發(fā)出多種方法來克服在已知DNA序列側(cè)翼的未知DNA序列的限制。連接介導(dǎo)的PCR(LM PCR)方法(其中生成基因組文庫,并將銜接頭與DNA片段退火以進行 PCR 擴增)以 GENOME WALKER UNIVERSAL KITTM (參見美國專利 N0.5,565,340,及美國專利N0.5,759,822)銷售。常用的另一種方法是反向PCR反應(yīng)(參見Silver andKeerikatte (1989),J.Virol.,63:1924-1928),其中將DNA用限制酶消化,并自身連接,生成連續(xù)環(huán)。使用結(jié)合已知序列的寡核苷酸引物的PCR擴增導(dǎo)致未知側(cè)翼序列的擴增和闡明。不幸的是,這些方法是效率低的且費時的。這些和其它傳統(tǒng)PCR法(包括熱不對稱交錯PCR[TAIL-PCR]、錨式PCR[a_PCR]和隨機引發(fā)PCR[rm_PCR])由于制備過程中的DNA損失而受到低檢測靈敏性(需要大量模板DNA)或低特異性阻礙。
[0007]可以通過純化含有已知的和未知的DNA序列兩者的染色體DNA片段來改善檢測靈敏性的方法的開發(fā)可以產(chǎn)生用于檢測和表征與已知DNA序列相鄰定位的未知DNA區(qū)的靈敏方法。線性擴增介導(dǎo)的聚合酶鏈?zhǔn)椒磻?yīng)(LAMPCR)方法的開發(fā)實現(xiàn)這些目的。參見美國專利No6,514,706。LAM PCR法特別適合于擴增和分析其序列僅部分已知的DNA片段。[0008]可以通過純化含有已知的和未知的DNA序列兩者的染色體DNA片段來改善檢測靈敏性的方法的開發(fā)可以產(chǎn)生用于檢測和表征與已知DNA序列相鄰定位的未知DNA區(qū)的靈敏方法。LAM PCR法的開發(fā)實現(xiàn)這些目的。LAMPCR是一種用于分析與已知DNA序列相鄰定位的未知染色體側(cè)翼序列的改良PCR方法??梢允褂肔AM PCR法來將在已知DNA或RNA區(qū)側(cè)翼的未知DNA或RNA序列鑒定和/或測序。
[0009]LAM PCR方法由下列步驟組成。使用染色體DNA作為模板和結(jié)合染色體DNA內(nèi)的已知DNA序列的寡核苷酸引物實施引物延伸反應(yīng)。寡核苷酸引物與長末端重復(fù)(LTR)序列(其是逆轉(zhuǎn)錄病毒特征性序列)互補,并將其在寡核苷酸引物末端用生物素標(biāo)記。將線性PCR的單鏈DNA產(chǎn)物結(jié)合到具有固定化的鏈霉抗生物素蛋白的磁珠。此步驟用以分離含有源自染色體的已知LTR序列和未知序列的單鏈擴增DNA片段。通過合成互補鏈將單鏈DNA轉(zhuǎn)化成雙鏈DNA。用識別序列并在該序列處切割雙鏈DNA的限制酶切割雙鏈DNA。將稱作接頭盒的雙鏈DNA與末端連接。使用如此獲得的連接產(chǎn)物作為模板以及與LTR互補的引物和與接頭盒互補的引物進行后續(xù)的PCR反應(yīng)。擴增DNA片段,其含有LTR和與LTR相鄰的染色體DNA側(cè)翼序列。因此,可以測定先前未知的逆轉(zhuǎn)錄病毒整合位點。
[0010]目前認(rèn)為LAM PCR法是一種用于分析與已知DNA序列相鄰的未知DNA序列的有效系統(tǒng)。本領(lǐng)域中已經(jīng)描述了對LAM PCR法的修改和改善。參見美國專利申請US2007/0037139 及 Harkey 等,(2007) Stem Cells Dev.,June; 16 (3): 381-392。
[0011]在美國專利申請US2007/0037139中修改LAM PCR法以改善具有在多個位點處整合的逆轉(zhuǎn)錄病毒的生物學(xué)樣品的檢測。傳統(tǒng)LAM PCR法的反應(yīng)條件產(chǎn)生的結(jié)果沒有反應(yīng)樣品細(xì)胞群中存在的克隆的實際狀態(tài)。開發(fā)一種修改,其中在不偏向自特定克隆擴增的片段的情況下PCR擴增更多的整合片段。對LAM PCR法的修改容許研究人員測定群體中具有整合基因的細(xì)胞的程度以及測定群體中特定細(xì)胞的比率。
[0012]另外,Harkey等(2007)描述了一種經(jīng)優(yōu)化的、多臂、高通量LAM PCR法修改,其中檢測能力在窮盡取樣的情況下改善90%。修改的方案促進總集合大小的準(zhǔn)確評估,如此提供用于產(chǎn)生載體整合的優(yōu)選基因組位置的較大插入位點數(shù)據(jù)的快速的、成本有效的辦法。
[0013]本發(fā)明描述了一種進一步重要的修改,并且解決幾種傳統(tǒng)的LAM-PCR問題,其通過消除如下的步驟實現(xiàn):生成雙鏈DNA片段,然后消化雙鏈DNA片段,并使雙鏈DNA片段變性。
[0014]發(fā)明概述
[0015]本發(fā)明提供了一種用于在分離的植物DNA中尋找與已知的多核苷酸序列相鄰的未知多核苷酸序列的方法,其包括用一種或多種合適的限制酶消化含有部分或整個的所述已知多核苷酸序列和相鄰的未知多核苷酸序列的所述分離的植物DNA以生成多個經(jīng)消化的多核苷酸限制性片段;使用寡核苷酸引物序列合成所述經(jīng)消化的多核苷酸限制性片段的互補鏈,所述寡核苷酸引物序列具有與所述寡核苷酸引物序列的5’端結(jié)合的附接化學(xué);通過將所述附接化學(xué)與合適的分離基質(zhì)結(jié)合,然后使所述互補鏈變性從所述經(jīng)消化的多核苷酸限制性片段分離所述互補鏈;將單鏈銜接頭與結(jié)合到所述分離基質(zhì)的分離的互補鏈連接以生成連接的分離的互補鏈;使用第一 PCR引物和第二 PCR引物對所述連接的分離的互補鏈實施第一 PCR擴增以生成第一 PCR擴增子,所述第一 PCR引物設(shè)計為結(jié)合已知的多核苷酸序列,所述第二 PCR引物設(shè)計為結(jié)合所述單鏈銜接頭;對所述第一 PCR擴增子實施第二PCR擴增以生成第二 PCR擴增子,其中所述第二 PCR擴增擴增所述第一 PCR擴增子的內(nèi)部序列;并對所述第二 PCR擴增子測序以確認(rèn)所述未知多核苷酸序列的序列。
[0016]本文中公開的本發(fā)明的一個實施方案是用于分離和鑒定轉(zhuǎn)基因邊界序列的方法。本發(fā)明的一個實施方案是容易可適用于高通量應(yīng)用以測定轉(zhuǎn)基因拷貝數(shù)和基因組插入位點的染色體位置的方法。另外,本發(fā)明可以用于在一個反應(yīng)內(nèi)同時檢測多個插入位點。本發(fā)明公開了在檢測在已知多核苷酸片段側(cè)翼的未知多核苷酸片段方面具有改善的靈敏性和特異性的方法。此外,本發(fā)明可以配置以檢測與任何靶序列相鄰定位的未知DNA序列,所述靶序列包括病毒序列和通過轉(zhuǎn)座子誘變或經(jīng)由T鏈整合產(chǎn)生的誘變創(chuàng)建的插入誘變位點。
[0017]本發(fā)明的一個實施方案部分涉及使用此類側(cè)翼、接合、和插入物序列的轉(zhuǎn)基因事件鑒定。依照本發(fā)明,使用跨越插入轉(zhuǎn)基因DNA及其邊界的擴增子的修改的PCR分析和DNA測序分析法可以用于檢測或鑒定源自專有轉(zhuǎn)基因植物系的商業(yè)化轉(zhuǎn)基因植物品種或品系。
[0018]本發(fā)明的轉(zhuǎn)基因邊界和相鄰染色體側(cè)翼序列可以診斷轉(zhuǎn)基因事件?;谶@些序列,可以通過分析染色體側(cè)翼和轉(zhuǎn)基因序列在不同植物基因型中鑒定轉(zhuǎn)基因植物系。如此,本發(fā)明的一個實施方案描述了可以用于鑒定轉(zhuǎn)基因植物系的方法。
[0019]本發(fā)明的染色體側(cè)翼序列與植物育種結(jié)合特別可用于為了在后代中賦予一種或多種額外的感興趣性狀,在將包含感興趣事件的親本植物與另一種植物系雜交后,測定哪些后代植物包含給定的事件。本發(fā)明的一個實施方案是測定染色體側(cè)翼/接合序列以有益于育種程序及質(zhì)量控制,尤其是對于商業(yè)化的轉(zhuǎn)基因植物系。
[0020]此外,染色體側(cè)翼序列的鑒定可以用于特異性鑒定每個轉(zhuǎn)基因插入物的基因組位置。可以使用此信息開發(fā)對每個事件特異性的分子標(biāo)志物系統(tǒng)。這些分子標(biāo)志物系統(tǒng)可以用于加速的育種策略及建 立連鎖數(shù)據(jù)。本發(fā)明的一個實施方案是分子標(biāo)志物系統(tǒng)。
[0021]更進一步,可以使用染色體側(cè)翼序列信息來研究和表征轉(zhuǎn)基因整合過程、基因組整合位點特征、事件分選、轉(zhuǎn)基因及其側(cè)翼序列的穩(wěn)定性、和基因表達(dá)(尤其涉及基因沉默、轉(zhuǎn)基因甲基化樣式、位置效應(yīng)、和潛在的表達(dá)相關(guān)元件諸如MARS (基質(zhì)附著區(qū)),等等)。
[0022]可以使用本發(fā)明的方法來獲得并確認(rèn)來自轉(zhuǎn)基因生物體的未知多核苷酸的序列。在本發(fā)明的任何方法中,樣品可以是基因組DNA,而轉(zhuǎn)基因生物體可以是轉(zhuǎn)基因植物。通過本發(fā)明的任何方法分析的轉(zhuǎn)基因植物可以下組植物:大麥、玉米、燕麥、高粱、草地草(turfgrass)、甘鹿、小麥、苜猜、香蕉、花莖甘藍(lán)(broccoli)、豆、甘藍(lán)(cabbage)、蕓苔(canola)、胡蘿卜、木薯、花椰菜(cauliflower)、療菜(celery)、柑橘(citrus)、棉、葫蘆、桉樹、亞麻、大蒜、葡萄、洋蔥、萵苣、豌豆、花生、胡椒、馬鈴薯、楊樹(poplar)、松(pine)、黑麥、稻、向日葵、紅花(safflower)、大豆、草莓、甜菜、甘薯(sweet potato)、煙草、番爺、觀賞植物、灌木、堅果、黍(millet)、和牧草(pasture grass)。
[0023]可以使用本發(fā)明的方法來獲得并確認(rèn)來自非轉(zhuǎn)基因生物體的未知多核苷酸的序列。在本發(fā)明的任何方法中,樣品可以是基因組DNA,而非轉(zhuǎn)基因生物體可以是植物。通過本發(fā)明的任何方法分析的植物可以下組植物:大麥、玉米、燕麥、高粱、草地草(turf grass)、甘鹿、小麥、苜猜、香蕉、花莖甘藍(lán)(broccoli)、豆、甘藍(lán)(cabbage)、蕓苔(canola)、胡蘿卜、木薯、花椰菜(cauliflower)、療菜(celery)、柑橘(citrus)、棉、葫蘆、桉樹、亞麻、大蒜、葡萄、洋蔥、萵苣、豌豆、花生、胡椒、馬鈴薯、楊樹(poplar)、松(pine)、黑麥、稻、向日葵、紅花(safflower)、大豆、草莓、甜菜、甘薯(sweet potato)、煙草、番爺、觀賞植物、灌木、堅果、黍(millet)、和牧草(pasture grass)。在本發(fā)明的任何方法中,與已知多核苷酸序列相鄰的未知多核苷酸序列可以是農(nóng)藝學(xué)目的的天然多核苷酸。
[0024]序列簡述
[0025]SEQ ID NO:1描述了 5’生物素化的引物,標(biāo)記為4468-3PA01_2Btn。
[0026]SEQ ID NO:2描述了 5’磷酸化的銜接頭,標(biāo)記為ZC-Adp-Ol。
[0027]SEQ ID NO:3 描述了標(biāo)記為 PAT-1nvPriF 的引物。
[0028]SEQ ID NO:4 描述了標(biāo)記為 Zn_Adt_PCR_01 的引物。
[0029]如本文中使用的,術(shù)語“包括”、“包括”、“具有”、“含有”或其任何其它變型意圖是非排他的或開口的。例如,包含一批要素的組合物、混合物、過程、方法、物品、或裝置不必僅限于那些要素,而是可以包含其它沒有明確列出或所述組合物、混合物、過程、方法、物品、或裝置固有的其它要素。此外,除非明確相反敘述,“或”指包含的或而非排他的或。例如,下列任一項滿足條件A或B:A是正確的(或存在的)且B是錯誤的(或不存在的),A是錯誤的(或不存在的)且B是正確的(或存在的),以及A和B兩者是正確的(或存在的)。
[0030]還有,在本發(fā)明的要素或組分前的不定冠詞“一個”和“一種”就例子的數(shù)目,即要素或組分的出現(xiàn)而言是非限制性的。因此,“一個”或“一種”應(yīng)當(dāng)解讀為包括一個/種或至少一個/種,并且要素或組分的單數(shù)詞語形式還包括復(fù)數(shù)的,除非數(shù)字明顯意味著是單數(shù)的。
[0031]術(shù)語“核酸”、“多核苷酸”、“多核苷酸序列”和“核苷酸序列”用于指核苷酸(A、C、T、U、G,等等或天然存在的或人工的核苷酸類似物)的聚合物,例如DNA或RNA,或其表示,例如字符串,等等,這取決于相關(guān)背景。術(shù)語“核酸”和“多核苷酸”在本文中可互換使用;這些術(shù)語提及DNA、RNA、或本發(fā)明的其它新穎的核酸分子使用,除非上下文另有敘述或明顯矛盾??梢詮娜魏我?guī)定的核苷酸序列確定給定的多核苷酸或互補多核苷酸。核酸可以為單或雙鏈形式。
[0032]術(shù)語“分離的”指如下的材料,諸如核酸或蛋白質(zhì),其⑴基本上或?qū)嵸|(zhì)性不含通常伴隨其天然存在環(huán)境中找到的材料或與該材料相互作用的組分,或者(2)若材料在其天然環(huán)境中,則該材料已經(jīng)通過對組成的有意人為干預(yù)而改變和/或置于細(xì)胞中與該材料天然位置不同的位置處。
[0033]術(shù)語“植物”包括植物和植物部分,包括但不限于植物細(xì)胞和植物組織,諸如葉、莖、根、花、花粉、和種子。一般地,可以在本發(fā)明中使用的植物類別與適合于誘變的高等和低等植物類別,包括被子植物(單子葉和雙子葉植物)、裸子植物、蕨類和多細(xì)胞藻類一樣寬。
[0034]術(shù)語“啟動子”通常指指導(dǎo)結(jié)構(gòu)基因轉(zhuǎn)錄以生成RNA的DNA序列。通常,啟動子位于基因上游500個堿基對、在轉(zhuǎn)錄起始位點附近的區(qū)域中。若啟動子是誘導(dǎo)型啟動子,則轉(zhuǎn)錄速率響應(yīng)外源或內(nèi)源誘導(dǎo)劑而升高或降低。比較而言,若啟動子是組成性啟動子,則轉(zhuǎn)錄速率在較小程度上受到誘導(dǎo)劑調(diào)節(jié)。
[0035]術(shù)語“轉(zhuǎn)基因植物”指源自經(jīng)轉(zhuǎn)化的植物細(xì)胞或原生質(zhì)體的植物或其后代,其中植物DNA含有最初不存在于其天然的、非轉(zhuǎn)基因植物中的導(dǎo)入的外源DNA分子。
[0036]如本文中使用的,術(shù)語“載體”指可以為了轉(zhuǎn)化,即將異源DNA導(dǎo)入宿主細(xì)胞中使用的任何重組多核苷酸構(gòu)建體。[0037]術(shù)語“互補鏈”描述了核酸序列或分子,其中一個分子中的每個堿基與另一條鏈中的其互補堿基配對,以形成穩(wěn)定的螺旋雙鏈分子。個別鏈稱作互補鏈。
[0038]術(shù)語“寡核苷酸引物”是與要擴增的5’或3’的核苷酸序列互補的長度為約10至約50個核苷酸的線性寡核苷酸的序列??梢允褂靡粚押塑账嵋飦頂U增多核苷酸序列,其中引物之一與要擴增的多核苷酸片段5’的核苷酸序列互補,而該對的另一種引物與位于要擴增的多核苷酸片段3’的核苷酸序列互補。本領(lǐng)域技術(shù)人員理解一對寡核苷酸引物意味著與核酸相反鏈互補且在要擴增的多核苷酸序列側(cè)翼的兩個寡核苷酸。
[0039]術(shù)語“銜接頭”描述了一種可以在平端或粘端與多核苷酸分子連接的短的寡核苷酸多核苷酸段。銜接頭可以含有多核苷酸片段內(nèi)的限制酶識別位點。銜接頭的大小可以從長度約10變化至約150個核苷酸。銜接頭可以是單鏈或雙鏈的。
[0040]術(shù)語“連接的分離的互補鏈”指包含經(jīng)由連接反應(yīng)與含有部分或整個的已知多核苷酸序列和相鄰的未知多核苷酸序列的第二 DNA片段連接的銜接頭的多核苷酸片段?!斑B接的分離的互補鏈”側(cè)翼有一端的銜接頭和另一端的已知多核苷酸序列。
[0041] 連接反應(yīng)通過一般稱為連接酶的酶完成,所述連接酶催化DNA中相鄰的3’ -OH和5’ -P端之間的磷酸二酯鍵的形成。
[0042]可以通過本領(lǐng)域中已知的方法實現(xiàn)植物DNA的分離。一般地,植物DNA的分離導(dǎo)致獲得純化的植物DNA,其不含脂質(zhì)、蛋白質(zhì)和其它細(xì)胞碎片。優(yōu)選的植物DNA分離方法包括:裂解、加熱、醇沉淀、鹽沉淀、有機提取、固相提取、硅膠膜提取、CsCl提取純化、和其任何組合。更優(yōu)選的植物DNA分離方法是以DNeasy試劑盒(Qiagen, Valencia, CA)銷售的娃膠膜技術(shù)或溴化十六烷基三甲銨(CTAB)DNA分離方案。
[0043]限制酶消化,又稱為限制性內(nèi)切核酸酶消化在使用酶核酸酶切割多核苷酸序列時實施。存在有本領(lǐng)域技術(shù)人員可用的許多限制酶。如在WWW.neb.com/nebecomm/tech_reference/restriction_enzymes/overview.asp描述的,使用四種分類來表征限制酶。基于亞基組成、切割位置、序列特異性和輔因子要求做出這些分類。
[0044]I型酶在離識別/結(jié)合序列一段距離(遠(yuǎn)離大于1,OOObp)的位置處隨機切割DNA。I型酶結(jié)合的識別位點是不對稱的。因此,這些酶不用于基因克隆,因為這些酶不生成離散的限制性片段或獨特的凝膠顯帶樣式。I型酶是多功能性的,并且構(gòu)成I型限制酶的不同亞基負(fù)責(zé)不同活性(即,亞基HsdR編碼限制,亞基HsdM編碼DNA的甲基化,而亞基HsdS編碼識別序列的特異性)。
[0045]II型酶在位于識別序列的緊密接近性內(nèi)的位置處消化DNA。這些酶發(fā)揮二聚體功能,其中亞基結(jié)合有義鏈,而亞基的第二個拷貝在回文順序處結(jié)合反義鏈,所述回文順序的長度通常是4-8個核苷酸。結(jié)合DNA的II型二聚體可以是結(jié)合對稱DNA序列的同二聚體,或結(jié)合不對稱DNA序列的異二聚體。所述酶可以識別連續(xù)序列或不連續(xù)序列。II型酶是商品化的,并且通常用于DNA分析和基因克隆。這些酶的普遍使用是生成并且可以在瓊脂糖凝膠上解析的獨特限制性片段的結(jié)果。
[0046]II型酶是在氨基酸序列相似性方面高度趨異的無關(guān)蛋白質(zhì)的集合。II型酶已經(jīng)分成亞類,其使用字母后綴標(biāo)記。IIB型限制酶是含有超過一個亞基的多聚體。這些酶切割識別序列的兩側(cè),由此導(dǎo)致識別序列的除去。IIE型和IIF型限制酶在與其識別序列的兩個拷貝相互作用后切割DNA。IIG型限制酶由單個亞基構(gòu)成。該酶的N端部分擁有DNA切割域和DNA修飾域。該酶的C端部分擁有DNA序列結(jié)合域。這些酶在其識別序列外部切割。IIM型限制酶識別并切割甲基化的DNA。IIS型限制酶發(fā)揮二聚體功能,并且在非回文不對稱識別位點外部的位置處切割DNA。這些酶由兩個獨特的域構(gòu)成,一個用于DNA結(jié)合,而另一個用于DNA切割。
[0047]III型酶是組合限制和修飾酶。這些酶識別兩個分開的非回文序列,并且在其識別序列外部切割。III型酶需要同一 DNA分子內(nèi)相反取向的兩個識別序列來實現(xiàn)切割。
[0048]IV型酶識別甲基化的DNA。例子包括大腸桿菌(E.coli)的McrBC和Mrr系統(tǒng)。
[0049]用于切割多核苷酸的其它方法是本領(lǐng)域中已知的,并且可以替換用限制酶消化多核苷酸使用,即下組任一項:裂解、序列特異性切割劑、非序列特異性切割劑、超聲處理、剪切壓(shear-stress)、French壓、UV福射、電離福射、和DNA酶。在上文所描述的限制酶外,可以使用歸巢內(nèi)切核酸酶或Flap內(nèi)切核酸酶或這些酶的任何組合來消化分離的DNA。用于消化分離的植物DNA的優(yōu)選方法是使用II型限制酶,已知該II型限制酶在轉(zhuǎn)化入植物中的轉(zhuǎn)基因序列外部切割。另一種用于消化分離的植物DNA的優(yōu)選方法是使用II型限制酶,已知該II型限制酶在緊密接近轉(zhuǎn)基因序列末端的位點處切割。
[0050]使用引物延伸反應(yīng)來生成含有已知多核苷酸序列和未知相鄰多核苷酸序列的DNA或RNA鏈。引物延伸方法導(dǎo)致含有未知多核苷酸序列的DNA或RNA的互補鏈的生成。DNA或RNA的互補鏈由聚合酶生成,所述聚合酶在與已經(jīng)結(jié)合DNA或RNA的已知模板鏈的寡核苷酸引物復(fù)合后沿著DNA或RNA模板鏈延伸。寡核苷酸引物設(shè)計為特異性結(jié)合DNA或RNA模板鏈內(nèi)的已知DNA或RNA序列。許多類型的用于延伸反應(yīng)的聚合酶是商品化的;T4聚合酶、TAQ聚合酶、PFU聚合酶、或逆轉(zhuǎn)錄酶是常用的聚合酶的幾種非限制性例子。每種聚合酶具有特殊的緩沖液要求,并且對于最佳的反應(yīng)條件,于特定溫度發(fā)揮功能。優(yōu)選的引物延伸反應(yīng)是使用以Platinum Taq試劑盒銷售的TAQ聚合酶。
[0051]使用附接于分離 基質(zhì)諸如基于磁珠的系統(tǒng)的附接化學(xué)來分離通過引物延伸反應(yīng)生成的單鏈DNA??梢越?jīng)由鏈霉抗生物素蛋白-生物素相互作用從基因組DNA純化通過引物擴增反應(yīng)生成的DNA鏈。生物素化廣泛用于實現(xiàn)生物分子的分離、分開、濃縮及進一步的下游加工和分析(例如記載于美國專利N0.5,948,624,美國專利N0.5,972,693,及美國專利N0.5,512,439的方法)。存在有多種靶向不同官能團,如伯胺、氫硫基、羧基、碳水化合物、酪氨酸和組氨酸側(cè)鏈及花青素(cyianidine)和胞嘧啶堿基的商品化生物素化試劑。使用用生物素(或等同物,例如洋地黃毒苷)功能化的短的、序列特異性寡核苷酸引物和磁珠從基因組分開特定的DNA序列以供后續(xù)分析具有多種用途。使用基于珠的方法的分離容許富集特定序列的DNA群,容許實施如下的后續(xù)分析,其不能在存在DNA的整個基因組互補物的情況中完成。此類基于珠的方法適合于高通量自動化。
[0052]雖然生物素-鏈霉抗生物素蛋白相互作用是描述得最好的結(jié)合對,但是彼此具有強親和力的其它分子是已知的??梢约{入寡核苷酸引物中的附接化學(xué)包括:ACRYDITETM,SP一種基于丙烯酸亞磷酰胺的附接化學(xué),所述丙烯酸亞磷酰胺可以以5’ -修飾添加到寡核苷酸,并且與經(jīng)硫醇修飾的表面起共價反應(yīng);炔修飾,其與經(jīng)疊氮化物標(biāo)記的官能團起反應(yīng)以經(jīng)由疊氮化物炔Huisgen環(huán)加成反應(yīng)(又稱為Click反應(yīng))形成穩(wěn)定的鍵;和硫醇修飾,其可以以針對相應(yīng)的配體或表面(諸如金表面)的高親和力偶聯(lián)及相互作用。這些分子可以用于純化或富集DNA序列。其中,引物用第一分子標(biāo)記,并且第二分子結(jié)合到可以固定化第一分子的基質(zhì)(例如,磁珠)??梢酝ㄟ^在柱上運行DNA分離自用第一分子標(biāo)記的引物生成的DNA鏈,所述柱含有用第二分子標(biāo)記的固定化基質(zhì)(例如磁珠)。由于針對第二分子的親和力,分離含有用第一分子標(biāo)記的引物的擴增DNA序列。優(yōu)選的附接化學(xué)包括丙烯酸-硫醇相互作用、炔-疊氮化物相互作用、和硫醇-配體相互作用。更優(yōu)選的附接化學(xué)是鏈霉抗生物素蛋白-生物素相互作用。
[0053]如本文中所使用的,術(shù)語分離基質(zhì)指可以附接有任何種類的分子的表面。優(yōu)選地,分離基質(zhì)是不溶性材料,其可以附接于分子,從而所述分子可以容易地與反應(yīng)中的其它成分分開。優(yōu)選的反應(yīng)基質(zhì)可以包括但不限于濾器、層析樹脂、珠、磁性顆粒、或包含玻璃、塑料、金屬、一種或多種聚合物及其組合的組合物。更優(yōu)選的分離基質(zhì)是基于磁珠的系統(tǒng)。
[0054]可以經(jīng)由單鏈連接酶將銜接頭與固定化的單鏈DNA連接。傳統(tǒng)上,商品化的連接酶僅可用于連接雙鏈DNA片段。最近,已經(jīng)顯示了可以使用RNA連接酶連接單鏈DNA片段(Zhang and Chiang(1995)Nucleic Acids Research, 24(5) ;990-991)。優(yōu)選的單鏈連接酶是商品化的,并且以 CIRCLIGASE?(Epicentre Biotechnologies, Madison, WI)、T4RNA 連接酶 I 和 T4RNA 連接酶 2(New England Biolabs, Ipswich, MA)、和單鏈 DNA 連接酶(Wako Chemicals, Richmond, VA)銷售。更優(yōu)選的單鏈DNA連接酶是來自EpicentreBiotechnologies (Madison, WI)的熱穩(wěn)定性 RNA 連接酶(TRL)。
[0055]如由Brautigma等,2010描述的,可以使用DNA序列分析測定分離的且擴增的片段的核苷酸序列??梢詫U增片段分離并亞克隆入載體中,并使用鏈終止劑方法(又稱為Sanger測序)或染料終止劑測序來測序。另外,可以用下一代測序(Next GenerationSequencing)對擴增子測序。NGS技術(shù)不需要亞克隆步驟,并且可以在單一反應(yīng)中完成多次測序閱讀。三種NGS平臺是商品化的,即來自454Life Sciences?Roche的基因組測序儀FLX、來自Solexa的Illumina基因組分析儀和Applied Biosystems的SOLiD (首字母簡略詞代表:“通過寡聚物連接和檢測的測序”)。另外,存在有兩種目前開發(fā)中的單一分子測序方法。這些包括來自Helicos B ioscience的真正單分子測序(true Single MoleculeSequencing, tSMS)和來自 Pacific Biosciences 的單分子實時測序(SMRT)。
[0056]由454Life Sciences/Roche銷售的基因組測序儀FLX是一種長閱讀NGS,其使用乳劑PCR和焦磷酸測序(pyrosequencing)來產(chǎn)生測序閱讀??梢允褂?00_800bp的DNA片段或含有3-20kbp片段的文庫。反應(yīng)每次運行可以產(chǎn)生超過100萬個約250至400個堿基的閱讀,總產(chǎn)量是250至400兆堿基。此技術(shù)產(chǎn)生最長的閱讀,但是每次運行的總序列輸出與其它NGS技術(shù)相比較低。
[0057]由Solexa銷售的Illumina基因組分析儀是一種短閱讀NGS,其使用通過用經(jīng)突光染料標(biāo)記的可逆終止劑核苷酸的合成辦法的測序,并且基于固相橋式PCR??梢允褂煤卸嘀罥Okb的DNA片段的成對末端測序文庫的構(gòu)建。反應(yīng)產(chǎn)生超過I億個長度為35-76個堿基的短閱讀。此數(shù)據(jù)每次運行可以產(chǎn)生3-6千兆堿基。
[0058]由Applied Biosystems銷售的通過寡聚物連接和檢測的測序(SOLiD)系統(tǒng)是一種短閱讀技術(shù)。此NGS技術(shù)使用長度長至IOkbp的片段化雙鏈DNA。該系統(tǒng)使用通過連接經(jīng)染料標(biāo)記的寡核苷酸引物的測序和乳劑PCR來產(chǎn)生10億個短閱讀,其導(dǎo)致每次運行多至30千兆堿基的總序列輸出。
[0059]Helicos Bioscience 的 tSMS和 Pacif ic Biosciences 的 SMRT應(yīng)用不同辦法,其使用單一DNA分子進行序列反應(yīng)。tSMS Helic0s系統(tǒng)產(chǎn)生多至8億個短閱讀,其每次運行產(chǎn)生21千兆堿基。使用經(jīng)突光染料標(biāo)記的虛終止劑核苷酸(virtual terminator nucleotide)完成這些反應(yīng),其稱為“通過合成測序”的方法。
[0060]由Pacific Biosciences銷售的SMRT下一代測序系統(tǒng)使用通過合成的實時測序。此技術(shù)由于不限可逆終止劑限制而可以產(chǎn)生長度長至IOOObp的閱讀。使用此技術(shù)每天可
以產(chǎn)生與二倍體人類基因組的一倍覆蓋等同的原始閱讀通量。
[0061]以下實施例描述了開發(fā)用于分離和鑒定轉(zhuǎn)基因插入物的基因組側(cè)翼序列的方法。另外,該方法可以用于對轉(zhuǎn)基因事件測定轉(zhuǎn)基因拷貝數(shù)和轉(zhuǎn)基因的基因組位置。
[0062]本發(fā)明的實施方案在以下實施例中進一步限定。應(yīng)當(dāng)理解,這些實施例僅作為例示給出。通過上述討論和這些實施例,本領(lǐng)域技術(shù)人員可以確定本發(fā)明的本質(zhì)特征,并且在不背離其精神和范圍的前提下,可以對本發(fā)明的實施方案做出各種改變和修改以使其適合于各種用途和條件。如此,在本文中顯示和描述的那些實施方案外,本發(fā)明的實施方案的各種修改從前述說明書看對于本領(lǐng)域技術(shù)人員會是顯而易見的。此類修改也意圖落入所附權(quán)利要求書的范圍內(nèi)。本文中所列的每篇參考文獻的公開內(nèi)容通過提及完整并入本文。
[0063]實施例1
[0064]經(jīng)由Biorad 基因槍使用質(zhì)粒轉(zhuǎn)化玉蜀黍(Zea mays)栽培種H1-ΙΙ植物組織,所述質(zhì)粒含有感興趣基因表達(dá)盒和選擇標(biāo)志物基因表達(dá)盒。(Production oftransgenic maize from bombarded Type 11 callus: effect of gold particlesize and callus morphology on transformation efficiency.1n Vitro Cell.Dev.Biol-Plant.36:21-29)。修改方案:優(yōu)化培養(yǎng)基組分、選擇劑和時機以改善轉(zhuǎn)化方法的效率。使用質(zhì)粒的經(jīng)Fsp I線性化的片段進行轉(zhuǎn)化。所得的轉(zhuǎn)化生成轉(zhuǎn)基因玉米植物,其含有與植物選擇標(biāo)志物基因表達(dá)盒連接的感興趣基因表達(dá)盒。
[0065]實施例2
[0066]從三種不同玉米事件(3)_001、(3)_008、和(3)-009及未轉(zhuǎn)化的玉米對照分離基因組DNA。采用幾種方法來分離gDNA,諸如DNeasy試劑盒(Qiagen, Valencia, CA)或傳統(tǒng)的 CTAB DNA 分離方案。使用 Nanodrop (Thermo Scientif ic, Wilmington, DE)測定 DNA濃度。用TaqI限制酶消化總共250ng gDNA。使用MinElute Reaction Cleanup試劑盒(Qiagen, Valencia, CA)進一步純化消化反應(yīng)。
[0067]實施例3
[0068]使用分離的且純化的gDNA完成引物延伸反應(yīng)。雙重生物素標(biāo)記的引物由Integrated DNA Technologies Inc.(Coralville, IA)合成,并且用于反應(yīng)(SEQ IDNO:1 (4468-3PA01-2Btn) 5’ _\ 雙重生物素 \-GGACAGAGCCACAAACACCACAAGA_3’)。使用Platinum Taq試劑盒(Invitrogen, Carlsbad, CA)經(jīng)由引物延伸來合成DNA鏈。在管中混合下列試劑:2 μ L, IOX Patinum TAQ 緩沖液;1.25 μ L, 50mM MgCl2 ;0.8 μ L, IOmMdNTP ;0.1 μ L, 10 μ M4468-3PA01-2Btn ;0.1 μ L Patinum TAQ; 14.75 μ L H2O ; I μ L gDNA。使用以下反應(yīng)條件完成擴增:1)94° C3分鐘;2)98° ClO秒;3)63° Cl分鐘;4)72° C5分鐘;5)重復(fù)步驟2-415分鐘;6)72° C3分鐘;7)4° C保持。實施例4
[0069]用2.5 μ L Dynabeads Μ_280 鏈霉抗生物素蛋白磁珠(Invitrogen, Carlsbad, CA)完成捕捉反應(yīng)。將珠在磁體上用PBST緩沖液(磷酸鹽緩沖鹽水和TWeen20)清洗一次并用PBS緩沖液(磷酸鹽緩沖鹽水)清洗兩次。在從磁體除去上清液后,將20 μ L PBS添加到珠,并將珠混合并重懸。將此溶液以1:1濃度添加到單一引物延伸反應(yīng),將20 μ L珠與20 μ L引物延伸反應(yīng)混合。將所得的溶液于室溫在溫和移液的情況下溫育I小時。然后,將珠在磁體上用PBST清洗兩次,用PBS清洗兩次,并用H2O清洗一次。從珠除去所有清洗溶液。
[0070]實施例5
[0071]將單鏈銜接頭與捕獲的來自事件(3)-001,(3)-008,和(3)-009的單鏈靶g(shù)DNA連接。用來自Epicentre Technologies (Madison, WI)的熱穩(wěn)定性RNA連接酶(TRL)連接單鏈銜接頭(SEQ ID NO: 2 (ZC-Adp-Ol) 5’ -/5Phos/ATTGGATTCTCTGACGGTCGGACGC/36_FAM/-3’ )(其在Integrated DNA Technologies (Coralville, IA)合成)。使用以下反應(yīng)來連接銜接頭與單鏈 DNA:0.125 μ LlOOuM ZC-Adp-Ol; 5.0 μ L50%PEG8000 (H2O 中的 W/V) ;1.0μ L DMSO ;和1.875 μ L H2O0將混合物混合,并在熱循環(huán)儀中于94° C變性5分鐘,然后冷卻至室溫。然后,將I μ LlOX TRL緩沖液、0.5 μ LlmM ATP、和0.5 μ L TRL添加并混合入溶液中。將所得的溶液添加到來自捕捉反應(yīng)的清洗過的珠,并在熱循環(huán)儀上于60° C溫育I小時,然后于4° C溫育。將珠在磁體上用0.1X TE緩沖液清洗幾次,并且從珠除去所有液體。
[0072]實施例6
[0073]使用Takara LA TAQ HS PCR 試劑盒(Millipore, Billerica, Ma)完成 PCR 反應(yīng)。使用下列引物來擴增事件和側(cè)翼序列:轉(zhuǎn)基因特異性引物SEQ ID NO: 3 (PAT-1nvPriF)5’ -CGCTTACGATTGGACAGTTGAGAGTACTG-3’ )和銜接頭引物 SEQ ID NO: 4 (Zn_Adt_PCR_01)5’-GTCCGACCGTCAGAGAATCCAAT-3’)。在 PCR 反應(yīng)中使用下列試劑:5 μ L, 10X LA TAQ HS緩沖液;8yL,2.5mM dNTP, I μ L, 10 μ M轉(zhuǎn)基因特異性引物;I μ L,10 μ M銜接頭特異性引物;0.5yL LA Taq HS聚合酶;和34.5yL,H20。將混合物添加到來自連接反應(yīng)的清洗過的珠,并使用表1中的下列條件 擴增。
[0074]表1:
[0075]PCR擴增條件
I個循環(huán) 94°C,2分鐘
2個循環(huán) 98 0C, IO秒
66 °C, I分鐘
__68 °C, 5分鐘
[0076]28個循環(huán) 98 °C, IO秒
64 0C, 30秒
__68 °C,2.5 分鐘
I個循環(huán) 72 0C, 4分鐘
I個猶環(huán) 4 °C, op_
[0077]實施例7
[0078]將大于約850bp的大小的所得PCR產(chǎn)物克隆入質(zhì)粒pCR2.1 (Invitrogen, Carlsbad, CA)中。將克隆分離,并且pCR2.1質(zhì)粒確認(rèn)為含有PCR擴增子。使用M13正向和M13反向引物對載體測序。預(yù)期測序結(jié)果含有在自質(zhì)粒存在的遺傳元件外的玉米3’基因組側(cè)翼序列的核苷酸序列。使用上文所描述的技術(shù)將來自事件(3)-001克隆#4, (3)-008克隆#10, (3)-008克隆#13,和(3)-009的3,轉(zhuǎn)基因插入物和玉米基因組側(cè)翼序列分離并鑒定。
[0079]基因組插入的表征指示事件(3)-001含有多個拷貝的轉(zhuǎn)基因。在此事件中鑒定幾種獨特的插入物。事件(3)-001克隆#4擁有獨特的側(cè)翼序列,另外,分離重排的第二和第三插入物的側(cè)翼序列(數(shù)據(jù)未公開)。獨特的側(cè)翼區(qū)指示插入玉蜀黍基因組的獨特位置中的三個拷貝的轉(zhuǎn)基因。
[0080]事件(3) -008含有兩個拷貝的轉(zhuǎn)基因。事件(3) -008克隆#10和(3) -008克隆#13的側(cè)翼序列是獨特的且不相似的,由此指示插入玉蜀黍基因組的獨特位置中的兩個拷貝的
轉(zhuǎn)基因。
[0081]事件(3)-009僅含有一個拷貝的轉(zhuǎn)基因。使用分離的側(cè)翼區(qū)來鑒定玉蜀黍基因組內(nèi)的轉(zhuǎn)基因插入物的染色體位置。
[0082]將鑒定的玉米基因組側(cè)翼序列針對玉米基因組測序聯(lián)盟(The MaizeGenome Sequencing Consortium),玉蜀黍 B73 基因組數(shù)據(jù)庫(Arizona GenomicsInstitute, University of Arizona)進行BLAST以鑒定轉(zhuǎn)基因插入物的染色體位置。將事件(3)-008克隆#13的側(cè)翼序列定位至染色體#5。將事件(3)-009的側(cè)翼序列定位至染色體#3。
【權(quán)利要求】
1.一種用于在分離的DNA中尋找與已知的多核苷酸序列相鄰的未知多核苷酸序列的方法,其包括: a)用一種或多種合適的限制酶消化含有部分或整個的所述已知多核苷酸序列和相鄰的未知多核苷酸序列的所述分離的DNA以生成多個經(jīng)消化的多核苷酸限制性片段; b)使用寡核苷酸引物序列合成所述經(jīng)消化的多核苷酸限制性片段的互補鏈,所述寡核苷酸引物序列具有與所述寡核苷酸引物序列的5’端結(jié)合的附接化學(xué); c)通過將所述附接化學(xué)與合適的分離基質(zhì)結(jié)合,然后使所述互補鏈變性從所述經(jīng)消化的多核苷酸限制性片段分離所述互補鏈; d)將單鏈銜接頭與結(jié)合到所述分離基質(zhì)的分離的互補鏈連接以生成連接的分離的互補鏈; e)使用第一PCR引物和第二 PCR引物對所述連接的分離的互補鏈實施第一 PCR擴增以生成第一 PCR擴增子,所述第一 PCR引物設(shè)計為結(jié)合已知的多核苷酸序列,所述第二 PCR引物設(shè)計為結(jié)合所述單鏈銜接頭; f)對所述第一PCR擴增子實施第二PCR擴增以生成第二PCR擴增子,其中所述第二PCR擴增擴增所述第一 PCR擴增子的內(nèi)部序列;并 g)對所述第二PCR擴增子測序以確認(rèn)所述未知多核苷酸序列的序列。
2.權(quán)利要求1的方法,其中所述分離的DNA是植物基因組DNA。
3.權(quán)利要求1的方法,其中所述未知多核苷酸序列是轉(zhuǎn)基因邊界序列。
4.權(quán)利要求1的方法,其 中所述未知多核苷酸序列是在已知多核苷酸序列側(cè)翼的染色體序列。
5.權(quán)利要求1的方法,其中所述未知多核苷酸序列是編碼性狀的天然基因序列。
6.權(quán)利要求1的方法,其中所述已知多核苷酸序列是已知多核苷酸病毒序列。
7.權(quán)利要求1的方法,其中所述已知多核苷酸序列是已知多核苷酸轉(zhuǎn)基因序列。
8.權(quán)利要求1的方法,其中所述已知多核苷酸序列是已知多核苷酸轉(zhuǎn)座子序列。
9.權(quán)利要求1的方法,其中所述已知多核苷酸序列是編碼性狀的基因序列。
10.權(quán)利要求1的方法,其中使用所述方法鑒定經(jīng)由插入誘變插入分離的植物DNA中的已知多核苷酸序列的染色體位置。
11.權(quán)利要求10的方法,其中所述插入誘變選自下組:轉(zhuǎn)座子誘變、或T鏈整合誘變。
12.權(quán)利要求1的方法,其中使用所述方法表征由在已知多核苷酸序列側(cè)翼的染色體序列組成的未知多核苷酸序列。
13.權(quán)利要求12的方法,其中對轉(zhuǎn)基因插入位點的所述表征鑒定由在由染色體序列組成的所述未知多核苷酸序列內(nèi)的重排、插入、缺失、或倒位組成的多核苷酸序列。
14.權(quán)利要求1的方法,其中使用所述方法測定轉(zhuǎn)基因拷貝數(shù)。
15.權(quán)利要求1的方法,其中使用所述方法鑒定轉(zhuǎn)基因植物系。
16.權(quán)利要求1的方法,其中使用所述方法開發(fā)分子標(biāo)志物系統(tǒng)。
17.權(quán)利要求17的分子標(biāo)志物系統(tǒng),其用于加速育種策略。
【文檔編號】C12P19/34GK103476950SQ201280015927
【公開日】2013年12月25日 申請日期:2012年3月30日 優(yōu)先權(quán)日:2011年4月5日
【發(fā)明者】曹澤暉, S.諾瓦克, 周寧 申請人:陶氏益農(nóng)公司