国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      模塊式dna結(jié)合結(jié)構(gòu)域及使用方法

      文檔序號:476210閱讀:6387來源:國知局
      模塊式dna結(jié)合結(jié)構(gòu)域及使用方法
      【專利摘要】本發(fā)明涉及模塊式DNA結(jié)合結(jié)構(gòu)域及使用方法并涉及通過多肽選擇性識別DNA序列中堿基對的方法,特異性識別DNA序列中一個或多個堿基對的修飾多肽,被修飾而使它可以被多肽特異性識別的DNA,所述多肽和DNA在特異性DNA靶向中的用途,以及調(diào)節(jié)靶基因在細(xì)胞中表達的方法。
      【專利說明】模塊式DNA結(jié)合結(jié)構(gòu)域及使用方法
      【【技術(shù)領(lǐng)域】】
      [0001]本發(fā)明涉及通過多肽選擇性識別靶DNA序列中堿基對的方法,特異性識別DNA序列中一個或多個堿基對的修飾多肽,被修飾而使它可以被多肽特異性識別的DNA,所述多肽和DNA在特異性DNA靶向中的用途,以及調(diào)節(jié)靶基因在細(xì)胞中表達的方法。
      【【背景技術(shù)】】
      [0002]黃單胞菌屬(Xanthomonas)的植物病原細(xì)菌導(dǎo)致許多重要農(nóng)作物的嚴(yán)重疾病。所述細(xì)菌通過III型分泌系統(tǒng)將一批效應(yīng)子轉(zhuǎn)移至植物細(xì)胞,所述效應(yīng)子包括大轉(zhuǎn)錄激活子樣(TAL) /AvrBs3樣效應(yīng)子家族的成員(Kay&Bonas (2009) Curr.0pin.Microbiol.12:37-43, White & Yang(2009)Plant Physiol, do1:10.1104/pp.1109.139360 ;Schornack 等(2006) J.Plant Physiol.163:256-272)。TAL 效應(yīng)子是黃單胞菌屬的主要致病因子,含有串聯(lián)重復(fù)序列的中央結(jié)構(gòu)域、核定位信號(NLS)和激活結(jié)構(gòu)域(AD),并用作植物細(xì)胞的轉(zhuǎn)錄因子(Kay等(2007) Science318:648-651 ; Riimer等(2007)Science318:645-648 ;Gu 等(2005)Nature435, 1122-1125 ;Fig.la)。該效應(yīng)子家族的類型成員,來自野油菜黃單胞菌辣椒斑點病菌(Xanthomonas campestrispv.vesicatoria)的AvrBs3,含有17.5個重復(fù)序列并誘導(dǎo)包括Bs3抗性基因的UPA在辣椒植物中表達(被 AvrBs3 上調(diào))(Kay 等(2007) Science318:648-651 ;R6mer等(2007)Science318:645-648 ;Marois 等(2002)Mol.Plant-Microbe Interact.15:637-646)。TAL效應(yīng)子中重復(fù)序列的數(shù)目和順序決定其具體活性(Herbers等(1992)Nature356:172-174)。顯示重復(fù)序列對于AvrBs3的DNA結(jié)合是必要的,并且構(gòu)成新型的DNA結(jié)合結(jié)構(gòu)域(Kay等(2007) Science318:648-651)。該結(jié)構(gòu)域如何接觸DNA以及什么決定特異性還是未知的。
      [0003]選擇性基因表達通過蛋白轉(zhuǎn)錄因子與基因調(diào)控區(qū)內(nèi)特定核苷酸序列的相互作用來介導(dǎo)。DNA結(jié)合蛋白結(jié)構(gòu)域能夠區(qū)別不同DNA序列的方式在理解諸如分化和發(fā)育中控制基因表達的關(guān)鍵過程中是重要問題。
      [0004]特別設(shè)計和產(chǎn)生識別預(yù)期DNA靶的DNA結(jié)合結(jié)構(gòu)域的能力在生物技術(shù)中是非常期望的。這種能力可用于開發(fā)具有在靶DNA結(jié)合時調(diào)芐基因表達的能力的定制轉(zhuǎn)錄因子。實例包括通過設(shè)計對預(yù)期靶DNA序列特異性的定制鋅指DNA結(jié)合蛋白而完成的大量工作(Choo 等(1994)Nature372:645 ;Pomerantz 等,(1995)Science267:93-96 ;Liu 等,Proc.Natl.Acad.Sc1.USA94:5525-5530 (1997) ;Guan 等(2002) Proc.Natl.Acad.Sc1.USA99:13296-13301 ;美國專利號 7, 273,923 ;美國專利號 7,220,719)。而且,含有設(shè)計DNA結(jié)合結(jié)構(gòu)域的多肽可用于通過加入DNA修飾結(jié)構(gòu)域來修飾實際靶DNA序列,所述DNA修飾結(jié)構(gòu)域例如多肽內(nèi)的核酸酶催化結(jié)構(gòu)域。此類實例包括與非特異性核酸酶結(jié)構(gòu)域結(jié)合的大范圍核酸酶/歸巢內(nèi)切酶DNA識別位點的DNA結(jié)合結(jié)構(gòu)域(參見美國專利申請2007/0141038),修飾的大范圍核酸酶DNA識別位點和/或來自相同或不同大范圍核酸酶的核酸酶結(jié)構(gòu)域(參見美國專利申請公布20090271881),和與具有核酸酶活性的結(jié)構(gòu)域組合的鋅指結(jié)構(gòu)域,通常來自IIS型限制內(nèi)切酶,例如FokI (Bibikova等(2003)Science300:764 ;Urnov 等(2005)Nature435, 646 ;Skukla,等(2009)Nature459, 437-441 ;Townsend 等(2009) Nature459:442445 ;Kim 等(1996)Proc.NatlAcad.Sci USA93:1156-1160 ;美國專利號7,163,824)。目前用于鑒定定制鋅指DNA結(jié)合結(jié)構(gòu)域的方法采用基于組合選擇的方法,利用大的隨機文庫(通常大小>108)以產(chǎn)生具有預(yù)期 DNA 特異性的多指結(jié)構(gòu)域(Greisman&Pabo (1997) Science275:657-661 ;Hurt 等(2003)Proc Natl Acad Sci USA100:12271-12276 ;Isalan等(2001)Nat Biotechnoll9:656_660。此類方法是耗費時間的,有技術(shù)要求的,并且可能非常昂貴。用于工程化DNA結(jié)合多肽的簡單的識別代碼的鑒定將代表超過目前用于設(shè)計識別預(yù)期核苷酸靶的DNA結(jié)合結(jié)構(gòu)域的方法的顯著進步。
      [0005]【發(fā)明概述】
      [0006]本發(fā)明提供了一種制備選擇性識別DNA序列中堿基對的多肽的方法,所述方法包括合成包含重復(fù)序列結(jié)構(gòu)域的多肽,其中所述重復(fù)序列結(jié)構(gòu)域包含至少一個衍生自轉(zhuǎn)錄激活子樣(TAL)效應(yīng)子的重復(fù)序列單元,其中所述重復(fù)序列單元包含決定所述DNA序列中堿基對的識別的高變區(qū),其中所述重復(fù)序列單元負(fù)責(zé)所述DNA序列中一個堿基對的識別。本發(fā)明的這些多肽包含本發(fā)明的重復(fù)序列單元,并且能夠通過模塊化方法構(gòu)建,通過在靶載體中預(yù)裝配重復(fù)序列單元,所述靶載體可以隨后被裝配成最終目的載體。本發(fā)明提供了由該方法制備的多肽以及編碼所述多肽的DNA序列和包含這種DNA序列的宿主生物和細(xì)胞。
      [0007]本發(fā)明提供了通過多肽選擇性識別靶DNA序列中堿基對的方法,其中所述多肽包含至少一個包含重復(fù)序列單元的重復(fù)序列結(jié)構(gòu)域,其中所述重復(fù)序列單元各自包含決定所述靶DNA序列中堿基對的識別的高變區(qū)。
      [0008]更具體說,本發(fā)明人已經(jīng)確定了 DNA結(jié)合多肽中負(fù)責(zé)選擇性識別靶DNA序列中堿基對的那些氨基酸。通過闡明識別代碼,已經(jīng)確定了通過多肽中選定氨基酸識別靶DNA序列中特定堿基對的一般原理。本發(fā)明發(fā)現(xiàn),作為重復(fù)序列單元陣列的一部分的不同長度的不同類型的重復(fù)序列單元具有識別一個確定/特定堿基對的能力。在每一個形成重復(fù)序列結(jié)構(gòu)域的重復(fù)序列單元中,高變區(qū)負(fù)責(zé)靶DNA序列中堿基對的特異性識別。
      [0009]因此,本發(fā)明不僅提供了通過包含至少一個包含重復(fù)序列單元的重復(fù)序列結(jié)構(gòu)域的多肽選擇性識別靶DNA序列中堿基對的方法,還提供了其中可以產(chǎn)生被多肽中的重復(fù)序列結(jié)構(gòu)域選擇性識別的靶DNA序列的方法。
      [0010]本發(fā)明還提供了用于構(gòu)建識別特定DNA序列的多肽的方法。本發(fā)明的這些多肽包含本發(fā)明的重復(fù)序列單元,并且可以通過模塊化方法構(gòu)建,通過在靶載體中預(yù)裝配重復(fù)序列單元,所述靶載體可以隨后被裝配成最終目的載體。
      [0011]本發(fā)明還提供了用于靶向調(diào)芐基因表達的方法,通過構(gòu)建對關(guān)注的靶DNA序列特異性的模塊式重復(fù)序列單元,通過添加所述重復(fù)序列單元來修飾多肽以使所述多肽能夠立刻識別所述靶DNA,將所述修飾的多肽引入原核或真核細(xì)胞并使之表達以使所述修飾的多肽能夠識別所述靶DNA序列,并借助這種識別來調(diào)節(jié)所述靶基因在所述細(xì)胞中的表達。
      [0012]本發(fā)明還提供了用于靶向修飾靶DNA序列的方法,通過構(gòu)建包含至少一個識別所述靶DNA序列的本發(fā)明重復(fù)序列結(jié)構(gòu)域的多肽,并且所述多肽還含有能夠修飾所述靶DNA(例如,通過供體靶序列的位點特異性重組、限制酶切或整合)的功能結(jié)構(gòu)域,從而在復(fù)雜基因組中實現(xiàn)靶向DNA修飾。
      [0013]本發(fā)明還提供包含至少一個包含重復(fù)序列單元的重復(fù)序列結(jié)構(gòu)域的修飾多肽的制備,其中所述重復(fù)序列單元的每一個中的高變區(qū)決定靶DNA序列中堿基對的選擇性識別。
      [0014]在本發(fā)明進一步實施方案中,提供了編碼如上所述含有重復(fù)序列結(jié)構(gòu)域的多肽的DNA。
      [0015]在本發(fā)明更進一步實施方案中,提供了被修飾以包含位于靶DNA序列中的一個或多個堿基對的DNA,使得所述堿基對的每一個可以被包含具有相應(yīng)重復(fù)序列單元的重復(fù)序列結(jié)構(gòu)域的多肽特異性識別,每個重復(fù)序列單元包含決定所述DNA中相應(yīng)堿基對的識別的聞變區(qū)。
      [0016]在本發(fā)明更進一步實施方案中,提供了那些多肽和DNA的用途。還提供了經(jīng)本發(fā)明的分離的核酸分子轉(zhuǎn)化的植物、植物部分、種子、植物細(xì)胞和其他非人宿主細(xì)胞和由本發(fā)明編碼序列編碼的蛋白或多肽。而且,本文描述的多肽和DNA可以被引入動物和人細(xì)胞以及其他生物,例如真菌或植物。
      [0017]總結(jié),本發(fā)明關(guān)注通過多肽選擇性識別靶DNA序列中堿基對的方法,其中所述多肽包含至少一個包含重復(fù)序列單元的重復(fù)序列結(jié)構(gòu)域,其中每個重復(fù)序列單元含有決定所述靶DNA序列中堿基對的識別的高變區(qū),其中連續(xù)的重復(fù)序列單元對應(yīng)于所述靶DNA序列中連續(xù)的堿基對。
      【【專利附圖】

      【附圖說明】】
      [0018]【圖1】TAL效應(yīng)子的DNA-靶特異性的模型
      [0019](A)TAL效應(yīng)子含有中央串聯(lián)重復(fù)序列單元(紅色)、核定位信號(NLS)和激活結(jié)構(gòu)域(AD)。AvrBs3的第一重復(fù)序列的氨基酸序列。高變氨基酸12和13有灰色陰影。
      [0020](B) 17.5AvrBs3重復(fù)序列單元的位置12和13的高變氨基酸與UPA-框共有序列
      [21]比對。
      [0021](C) TAL效應(yīng)子的重復(fù)序列單元和誘導(dǎo)基因的啟動子中預(yù)測的靶序列被人工比對。對應(yīng)于每個重復(fù)序列中高變氨基酸的上部DNA鏈中的核苷酸根據(jù)以下八個效應(yīng)子和實驗確定的靶基因的組合來計數(shù):AvrBs3/Bs3,UPA10, UPA12, UPA14, UPA19, UPA20, UPA21, UPA23, UPA25, AvrBs3Δrepl6/Bs3-E, AvrBs3Δrepl09/Bs3, AvrHahl/Bs3, AvrXa27/Xa27, PthXol/Xal3, PthXo6/0sTFXl, PthXo7/0sTFIIA y I (參見圖 5)。占優(yōu)勢的組合(n>4)有灰色陰影。星號表示氨基酸13在該重復(fù)序列類型中缺失。
      [0022](D)重復(fù)序列類型基于高變氨基酸12和13的DNA靶特異性代碼(R = A/G ;N =A/C/G/T)(在該研究中實驗證實)。
      [0023]【圖2】Hax2、Hax3和Hax4的革巴DNA序列
      [0024](A)Hax2、Hax3和Hax4重復(fù)序列單元的氨基酸12和13和預(yù)測的靶DNA特異性(Hax-框)ο
      [0025](B)Hax-框在最小Bs4啟動子之前被克隆入⑶S報告載體。
      [0026](C)Hax效應(yīng)子對Hax-框的特定誘導(dǎo)性。⑶S報告構(gòu)建體經(jīng)農(nóng)桿菌(A.tumefaciens)分別與35S-驅(qū)動的hax2、hax3、hax4和空T-DNA(-)共遞送入本塞姆氏煙草(N.benthamiana)(誤差棒指不 SD ;n = 3 個樣品;4_MU, 4-甲基-傘形酮).35S::uidA(+)用作對照。葉盤用X-Gluc (5-溴-4-氯-3-吲哚基-β -D-葡糖苷酸)染色。
      [0027]【圖3】重復(fù)序列類型的DNA堿基對識別特異性
      [0028](A)Hax4-和ArtX-框-衍生物在最小Bs4啟動子之前被克隆入⑶S報告載體。
      [0029](B) NG-、HD_、N1-和NS-重復(fù)序列單元的特異性。Hax4_框衍生物的Hax4_誘導(dǎo)性在重復(fù)序列類型靶堿基中完全變化(灰色背景)
      [0030](C)NN-重復(fù)序列單元的特異性。人工效應(yīng)子ArtXl和預(yù)測的靶DNA序列。ArtXl框衍生物的ArtXl-誘導(dǎo)性在NN-重復(fù)序列靶堿基中完全變化(灰色背景)。
      [0031 ] (D)人工效應(yīng)子ArtX2和ArtX3和衍生的DNA靶序列。
      [0032](E)人工效應(yīng)子對ArtX-框的特定誘導(dǎo)性。
      [0033](A) - (E)⑶S報告構(gòu)建體經(jīng)農(nóng)桿菌分別與35S-驅(qū)動的hax4、artXl、artX2或artX3和空T-DNA(-) —起共遞送入本塞姆氏煙草。35S::uidA(+)用作對照。葉盤用X-Gluc染色。關(guān)于定量數(shù)據(jù),參見圖11。
      [0034]【圖4】最小數(shù)目的重復(fù)序列單元是轉(zhuǎn)錄激活所需的。
      [0035](A)具有不同數(shù)目(0.5-15.5)的HD-重復(fù)序列單元的人工ArtHD效應(yīng)子(共計
      1.5至16.5重復(fù)序列 單元)。
      [0036](B)由TA和17C組成的ArtHD靶框在最小Bs4啟動子之前被克隆入⑶S報告載體。
      [0037](C)通過具有不同數(shù)目的重復(fù)序列單元的ArtHD效應(yīng)子的啟動子激活。35S-驅(qū)動的效應(yīng)子基因或空T-DNA (-)經(jīng)農(nóng)桿菌與GUS-報告構(gòu)建體一起共遞送入本塞姆氏煙草(誤差棒指示SD ;n = 3個樣品;4-MU)。35S::uidA(+)用作對照。葉盤用X-Gluc染色。
      [0038]【圖5】誘導(dǎo)基因的啟動子中DNA靶序列與TAL效應(yīng)子重復(fù)序列單元的高變氨基酸12和13的比對。
      [0039](A)AvrBs3> AvrBs3 Δrepl6> AvrBs3 Δrepl09 和 AvrHahl 的重復(fù)序列單兀與辣椒ECW-30R Bs3基因(訪問:EU078684)的啟動子中UPA-框比對。AvrBs3Ar印16和AvrBs3 Λ r印109是AvrBs3的缺失衍生物,其中分別缺失重復(fù)序列單元11-14和重復(fù)序列單兀 12-14。AvrBs3、AvrBs3 Δ repl09 和 AvrHahl 而非 AvrBs3 Δ repl6 在 ECW-30R 植物中誘導(dǎo)HR。
      [0040](B) AvrBs3> AvrBs3 Δ repl6、AvrBs3 Δ repl09 和 AvrHahl 的重復(fù)序列單兀與辣椒ECff Bs3-E基因(訪問:EU078683)的啟動子中UPA-框比對。AvrBs3 Λ r印16而非AvrBs3、AvrBs3 Δ repl09或AvrHahl在辣椒ECW植物中誘導(dǎo)HR。
      [0041 ] (C) AvrXa27的重復(fù)序列單元與稻米Xa27基因的啟動子中推定靶序列比對。Xa27 (訪問:AY986492)由稻米栽培品種IRBB27中的AvrXa27誘導(dǎo),導(dǎo)致稻米栽培品種IR24中的HR而非xa27(訪問:AY986491)。
      [0042](D)PthXol的重復(fù)序列單元與稻米Xal3/0s8N3基因的啟動子中推定靶序列比對。Xal3 (訪問:DQ421396)由稻米栽培品種IR24中的PthXol誘導(dǎo),導(dǎo)致稻米栽培品種IRBB13中的敏感性而非xal3(訪問:DQ421394)。
      [0043](E)PthXo6的重復(fù)序列單元與稻米OsTFXl基因(訪問:AK108319)的啟動子中推定靶序列比對。OsTFXl由稻米栽培品種IR24中的PthXo6誘導(dǎo)。[0044](F)PthXo7的重復(fù)序列單元與稻米OsTFIIA Y I基因(CB097192)的啟動子中推定靶序列比對。OsTFIIA Y I由稻米栽培品種IR24中的PthXo7誘導(dǎo)。
      [0045](A)-(F)DNA序列上方的數(shù)字指示距編碼區(qū)中第一個ATG的核苷酸距離。不符合我們預(yù)期的靶特異性的重復(fù)序列/堿基組合(氨基酸12/13:NI = A ;HD = C ;NG = T ;NS =A/C/G/T ;NN = A/G ;IG = T)以紅色顯示。具有未知靶DNA特異性的重復(fù)序列單元以綠色顯不O
      [0046]【圖6 】AvrBs3 Arep 16 保護的 DNA 區(qū)比 AvrBs3 短 4bp。
      [0047]AvrBs3和AvrBs3 Δ rep 16的DNA酶I足跡分析概述(參見圖7,8)。
      [0048](A)分別由AvrBs3和AvrBs3 Δ repl6保護的Bs3 (上)和Bs3_E (中)啟動子序列。DNA酶I足跡揭示了 AvrBs3保護的Bs3啟動子的有義鏈37個核苷酸和反義鏈36個核苷酸,和AvrBs3 Δ repl6保護的Bs3_E啟動子的有義鏈30核苷酸和反義鏈32核苷酸。UPA-框和預(yù)測的 AvrBs3 Δ repl6_ 框加下劃線。AvrBs3 和 AvrBs3 Δ repl6 保護的 UPA20-ubm_rl6 (下部)啟動子序列。UPA20-ubmrl6啟動子是具有2bp取代(GA至CT,粗斜體)的UPA20啟動子衍生物,所述取代導(dǎo)致被AvrBs3和AvrBs3 Δ repl6兩者識別。DNA酶I足跡揭示,有義鏈35個核苷酸和反義鏈34個核苷酸被AvrBs3保護(UPA-框加下劃線),有義鏈31個核苷酸和反義鏈32個核苷酸被AvrBs3 Δ repl6保護(AvrBs3 Δ repl6_框加下劃線)。綠色(AvrBs3)或紅色(AvrBs3 Δ repl6)陰影的DNA區(qū)分別指在每個實驗中由AvrBs3和AvrBs3 Δ repl6保護的核心足跡,甚至具有低蛋白量(等摩爾的DNA和蛋白二聚體)?;疑幱暗腄NA區(qū)指在所有4個實驗中在所有蛋白濃度下不受給定蛋白保護的核苷酸。請注意,AvrBs3-和AvrBs3 Δ repl6-保護區(qū)的5'端是相同的。垂直虛線指示AvrBs3_和AvrBs3 Δ repl6_保護的啟動子區(qū)的:V端之間的差異,確證我們的模型一個重復(fù)序列與DNA中一個堿基對接觸。
      [0049](B) UPA20-ubm_rl6 啟動子中 AvrBs3 和 AvrBs3 Δ repl6 DNA 序列與 AvrBs3 和AvrBs3Ar印16重復(fù)序列區(qū)(位置12和13的高變氨基酸)的比對。不符合我們預(yù)測的靶特異性的重復(fù)序列/堿基組合(氨基酸12/13:NI = A ;HD = C ;NG = T ;NS = A/C/G/T)以紅色顯示。
      [0050]【圖7】分別由AvrBs3和AvrBs3Δ repl6保護的Bs3和Bs3_E啟動子序列。
      [0051]顯示了代表性的DNA酶I足跡實驗。Bs3啟動子序列上的AvrBs3DNA酶I足跡(A,上/有義DNA鏈;B,下/反義DNA鏈)。Bs3_E啟動子序列上的AvrBs3 Δ r印16DNA酶I足跡(C,上,有義DNA鏈;D,下,反義DNA鏈)。
      [0052](A)-(D)(上)突光標(biāo)記的PCR產(chǎn)物分別與5x摩爾過量(針對蛋白二聚體計算)的His6::AvrBs3、His6::AvrBs3 Δ rep 16和BSA鮮育,用DNA酶I處理,并在毛細(xì)管測序儀上分析。電泳圖y軸顯示對應(yīng)于PCR產(chǎn)物的5’-6-FAM-標(biāo)記的有義鏈(a,c)或5’-HEX-標(biāo)記的反義鏈(b,d)的相對熒光強度,以任意刻度。分別與His6::AVrBs3(綠色)或把86:^¥池83八1*印16(紅色)和854(黑色,陰性對照)的反應(yīng)痕跡被疊加。與陰性對照相比,分別在AvrBs3或AvrBs3 Arepl6存在下的峰高減少對應(yīng)于保護。保護區(qū)由綠色(AvrBs3)或紅色(AvrBs3 Arepl6)垂直線指示。(中)DNA序列的電泳圖。具有數(shù)字的橙色峰對應(yīng)于DNA核苷酸大小標(biāo)準(zhǔn)。DNA序列中預(yù)測的效應(yīng)子靶框加下劃線。覆蓋的核苷酸由綠色(AvrBs3)或紅色(AvrBs3 Δ repl6)框標(biāo)記。下面的數(shù)字指分別在AvrBs3 (a, b)或AvrBs3Arepl6(c, d)存在下相對于轉(zhuǎn)錄起始(+1)的核苷酸位置。(下)用于DNA酶I足跡的DNA PCR產(chǎn)物,分別從Bs3(a,b)或Bs3_E(c,d)啟動子擴增。單DNA鏈上的保護區(qū)由灰色框指示。下面的數(shù)字指分別在AvrBs3 (a, b)或AvrBs3 Δ repl6 (c, d)存在下相對于轉(zhuǎn)錄起始(+1)的核苷酸位置。實驗被重復(fù)三次,具有相似結(jié)果。
      [0053]【圖8】AvrBs3 和 AvrBs3Arepl6 保護的 UPA20-ubm_rl6 啟動子序列。
      [0054]代表性DNA酶I足跡實驗。UPA20-ubm-rl6啟動子序列上的AvrBs3和AvrBs3 Δ r印16DNA酶I足跡(A),上,有義DNA鏈;⑶下,反義DNA鏈。(上)熒光標(biāo)記的PCR產(chǎn)物分別與5x摩爾過量的His6::AvrBs3、His6::AvrBs3 Δ repl6和BSA(針對蛋白二聚體計算)孵育,用DNA酶I處理,并在毛細(xì)管測序儀上分析。電泳圖y軸顯示對應(yīng)于PCR產(chǎn)物的5’-6-FAM-標(biāo)記的有義鏈(a)或5’-HEX-標(biāo)記的反義鏈(b)的相對熒光強度,以任意刻度。與His6::AvrBs3 (綠色)、His6:: AvrBs3 Δ repl6 (紅色)和陰性對照BSA (黑色)的反應(yīng)痕跡被疊加。與陰性對照相比在AvrBs3或AvrBs3 Arepl6存在下的峰高減少對應(yīng)于保護。保護區(qū)由綠色(AvrBs3)和紅色(AvrBs3 Δrepl6)垂直線指示。(中)DNA序列的電泳圖。具有數(shù)字的橙色峰對應(yīng)于DNA核苷酸大小標(biāo)準(zhǔn)。AvrBs3覆蓋的核苷酸由綠色線和綠色框(UPA框加下劃線)標(biāo)記,AvrBs3Arepl6覆蓋的核苷酸由紅色線和紅色框(AvrBs3 Δ repl6_框加下劃線)標(biāo)記。UPA20-ubm_rl6突變(GA至CT)以斜體指示。(下)用于DNA酶I足跡的DNA PCR產(chǎn)物,從UPA20-ubm-rl6啟動子擴增。單DNA鏈上的保護區(qū)由灰色框指示。下面的數(shù)字指在AvrBs3存在下相對于UPA20野生型啟動子轉(zhuǎn)錄起始(+1)的核苷酸位置。實驗被重復(fù)三次,具有相似結(jié)果。
      [0055]【圖9】⑶S報告構(gòu)建體報告構(gòu)建體.[0056]靶DNA序列(TAL效應(yīng)子-框)被插入最小番茄Bs4啟動子(41) (pBs4 ;-50至+25)序列的5’,并通 過GATEWAY重組轉(zhuǎn)移入農(nóng)桿菌T-DNA載體pGWB330,構(gòu)建融合至無啟動子UidAW -葡糖醛酸酶,OTS)基因.attBl, attB2 ;GATEWAY重組位點。
      [0057]【圖10】Hax3中推定重復(fù)序列O的識別特異性.[0058](A) Hax3-重復(fù)序列單元的氨基酸12和13,和在對應(yīng)于重復(fù)序列O的位置中有變更的四個可能的祀Hax3-框。
      [0059](B)靶框在最小番茄Bs4啟動子之前被克隆入⑶S報告載體。
      [0060](C)經(jīng)由農(nóng)桿菌與⑶S報告構(gòu)建體共遞送入本塞姆氏煙草葉細(xì)胞的與35S-驅(qū)動的hax3或空T-DNA(-)的⑶S活性(4-MU,4-甲基-傘形酮;n = 3 ;誤差棒指示SD)。為了定量分析,葉盤用X-Gluc染色。實驗進行兩次,具有相似結(jié)果。
      [0061]【圖11】重復(fù)序列類型的DNA堿基對識別特異性.[0062]Hax4_和ArtX-框-衍生物在最小Bs4啟動子之前被克隆入⑶S報告載體。定量數(shù)據(jù)見圖3。
      [0063](A) NG-、HD_、N1-和NS-重復(fù)序列單元的特異性。Hax4_框衍生物的Hax4_誘導(dǎo)性在重復(fù)序列類型靶堿基中完全變化。
      [0064](B)NN-重復(fù)序列單元的特異性。ArtXl框衍生物的ArtXl-誘導(dǎo)性在NN-重復(fù)序列靶堿基中完全變化。
      [0065](C)人工效應(yīng)子ArtXl、ArtX2和ArtX3分別對ArtX-框的特定誘導(dǎo)性。
      [0066](A)-(C)⑶S報告構(gòu)建體經(jīng)農(nóng)桿菌分別與35S-驅(qū)動的hax4、artXl、artX2、artX3基因(灰色棒)和空T-DNA (a,b,白色棒;c,-) 一起共遞送入本塞姆氏煙草葉細(xì)胞(η = 3 ;誤差棒指示SD)。35S::uidA(+)用作對照。實驗進行三次,具有相似結(jié)果。
      [0067]【圖12】預(yù)測的AvrXalO的靶DNA序列.[0068](A)AvrXalO-重復(fù)序列單元的氨基酸12和13和具有預(yù)測的NN類型重復(fù)序列-特異性A或G的兩個可能的靶框。
      [0069](B)AvrXalO靶框在最小Bs4啟動子之前被克隆入⑶S報告載體。
      [0070](C)經(jīng)由農(nóng)桿菌與⑶S報告構(gòu)建體一起共遞送入本塞姆氏煙草葉細(xì)胞的35S-驅(qū)動的avrXalO,hax3 (特異性對照)或空T_DNA(_)的⑶S分析。35S::uidA(+)用作組成型對照(η = 3 ;誤差棒指示SD)。為了定量分析,葉盤用X-Gluc染色。實驗進行三次,具有相似結(jié)果。
      [0071]【圖13】Hax2中重復(fù)序列類型IG的識別特異性.[0072](A)Hax2重復(fù)序列單元的氨基酸12和13,和重復(fù)序列類型IG的四個可能的靶Hax 2 _ 框 ο
      [0073](B)Hax2靶框在最小番茄Bs4啟動子之前被克隆入⑶S報告載體。
      [0074](C)經(jīng)由農(nóng)桿菌與⑶S報告構(gòu)建體一起共遞送入本塞姆氏煙草葉細(xì)胞的35S啟動子-驅(qū)動的hax2或空T-DNA(-)的⑶S分析。35S::uidA(+)用作組成型對照(η = 3 ;誤差棒指示SD)。為了定量分析,葉盤用X-Gluc染色。實驗進行三次,具有相似結(jié)果。 [0075]【圖14】Hax2誘導(dǎo)擬南芥(A.thaliana)中PAPl的表達.[0076](A)擬南芥的葉被接種農(nóng)桿菌株,遞送分別用于hax2、hax3和hax4的35S-驅(qū)動表達的T-DNA構(gòu)建體。hax2而非hax3和hax4的表達誘導(dǎo)紫色素沉積,指示花色素苷生成。在接種后7天照相。
      [0077](B)轉(zhuǎn)基因擬南芥系攜帶在乙醇誘導(dǎo)型啟動子控制下的hax2。隔離T2群的植物用10%乙醇噴霧以誘導(dǎo)轉(zhuǎn)基因的表達。僅hax2_轉(zhuǎn)基因植物累積花色素苷。在處理后6天照相。
      [0078](C)在用10%乙醇噴霧之前㈠和之后24小時⑴用來自三個獨立擬南芥系的hax2-轉(zhuǎn)基因植物的cDNA對hax2 (29個循環(huán))、PAP1 (32個循環(huán))和延長因子Tu (EF-Tu, 32個循環(huán))進行半定量RT-PCR。
      [0079](D) Hax2重復(fù)序列單元的氨基酸12和13和Hax2的靶DNA序列。
      [0080](E)來自擬南芥Col-O的PAPl的啟動子含有不完善的Hax2_框。與預(yù)測Hax2_框的錯配以紅色顯示。指示了推定的TATA-框、天然轉(zhuǎn)錄起始位點(+1)和PAPl編碼序列的
      第一密碼子。
      [0081 ]【圖15】表1.TAL效應(yīng)子的預(yù)測的DNA靶序列
      [0082]該表顯示TAL效應(yīng)子的重復(fù)序列,和使用的來自重復(fù)序列單元的氨基酸12和13的預(yù)測的DNA靶序列。
      [0083]注釋顯示:
      [0084](A)Xcv,野油菜黃單胞菌辣椒斑點病菌;Xg,加德納黃單胞菌屬(Xanthomonasgardneri) ;Xca,野油菜黃單胞菌假辣根病菌(Xanthomonas campestris pv.armoraciae);Xoo,水稻黃單胞菌水稻病菌(Xanthomonas oryzae pv.0ryzae) ;Xac,地經(jīng)草黃單胞菌柑橘病菌(Xanthomonas axonopodis pv.citri) ;Xau,柑橘黃單胞菌來樣病菌(Xanthomonas citri pv.aurantifolii) ;Xcm,野油菜黃單胞菌錦葵病菌(Xanthomonascampestris pv.malvacearum) ;Xam,地經(jīng)草黃單胞菌木暮病菌(Xanthomonas axonopodispv.manihotis) ;Xoc,水稻黃單胞菌棲稻病菌(Xanthomonas oryzae pv.0ryzicola)。
      [0085](B)星號㈩指示氨基酸13缺失
      [0086](C)從重復(fù)序列單元氨基酸序列12和13推導(dǎo)靶DNA特異性。由于推定重復(fù)序列O的特異性,在5’端添加胸腺嘧啶核苷酸。雙鏈DNA的上(有義)鏈的序列以模糊代碼給出(R = A/G ;N = A/C/G/T ;.=未知特異性)
      [0087]【圖16】 AvrBs3、Hax2、Hax3、Hax4 的蛋白序列
      [0088]對于每個蛋白序列,顯示了 N端、C端以及單個重復(fù)序列。
      [0089]【圖17】效應(yīng)子ARTBs4誘導(dǎo)最小Bs4啟動子的表達
      [0090](A)Hax4重復(fù)序列單元的氨基酸12和13和預(yù)測的靶DNA特異性(Hax4框)。Hax4 (mut)框與Hax4框相比含有四個堿基對更換。
      [0091](B)人工效應(yīng)子ARTBs4重復(fù)序列單元的氨基酸12和13和預(yù)測的靶DNA特異性(ARTBs4 框)。
      [0092](C)Hax4框在最小Bs4啟動子之前被克隆入⑶S報告載體。ARTBs4框天然存在于最小Bs4啟動子中。
      [0093](D)Hax4和ARTBs4分別對Hax4和ARTBs4框的特定誘導(dǎo)性。⑶S報告構(gòu)建體經(jīng)由根癌農(nóng)桿菌(Agrobacterium tumefaciens)分別與35S-驅(qū)動的hax4 (灰色棒)、ARTBs4 (白色棒)和空T-DNA (ev,黑色棒)一起共遞送入本塞姆氏煙草(誤差棒指示SD)。4-MU, 4-甲基-傘形酮。35S::uidA(⑶S,灰色棒)用作對照。葉盤用X-Gluc (5-溴-4-氯-3-吲哚基-β-D-葡糖苷酸)染色。
      [0094]【圖18】重復(fù)序列結(jié)構(gòu)域和效應(yīng)子的“金門(Goldengate)”克隆圖解
      [0095](A)由個體重復(fù)序列單元(或其他蛋白結(jié)構(gòu)域)組成的結(jié)構(gòu)單元用側(cè)翼II型限制酶靶位點(例如BsaI)亞克隆,產(chǎn)生特定突出端。匹配突出端用相同字母指示(A至0)。不同的重復(fù)序列類型被克隆為每個位置的結(jié)構(gòu)單元(例如重復(fù)序列1、重復(fù)序列2、等等)。重復(fù)序列特異性是:NI = A, HD = C,NG = T, NN = G或A。
      [0096](B)通過使用“金門”克隆(限制酶切-連接)連接匹配突出端,將結(jié)構(gòu)單元裝配成靶載體。一般而言,得到的裝配產(chǎn)物不含有任何用于克隆的靶位點。
      [0097]【圖19】經(jīng)由金門克隆產(chǎn)生設(shè)計效應(yīng)子的替代方法
      [0098]圖19A-D描繪了下文實施例3公開方法中描述的各種載體,并提供了所述方法的示意圖。
      [0099]【序列表】
      [0100]附圖中所列核苷酸和氨基酸序列和序列表使用核苷酸堿基的標(biāo)準(zhǔn)字母縮寫和氨基酸的單字母代碼來顯示。核苷酸序列遵循標(biāo)準(zhǔn)約定,開始于序列5’端,向前(即,每條線中從左到右)至3’端。僅顯示了每個核酸序列的一條鏈,但要理解互補鏈通過對所示鏈的任何提及而被包括。氨基酸序列遵循標(biāo)準(zhǔn)約定,開始于序列的氨基端并向前(即,每條線中從左到右)至羧基端。
      [0101]【發(fā)明詳述】
      [0102]現(xiàn)在將在下文參考附圖更全面描述本發(fā)明,其中顯示了本發(fā)明的一些但非全部實施方案。實際上,這些發(fā)明可以許多不同形式實施,并且不應(yīng)解釋為限于本文提出的實施方案;而是,提供這些實施方案,使得本公開將滿足適用的法律要求。同樣的數(shù)字在通篇指同樣的元件。
      [0103]這些發(fā)明所屬領(lǐng)域技術(shù)人員將知道本文提出的本發(fā)明的許多修飾和其他實施方案,具有在之前描述和相關(guān)附圖中提出的教導(dǎo)益處。因此,要理解,本發(fā)明不限于所公開的具體實施方案,并且修飾和其他實施方案預(yù)期包括在所附權(quán)利要求范圍內(nèi)。盡管本文采用了特定術(shù)語,但是它們僅以通常和描述性含義使用,而不是為限制目的。
      [0104]本公開通篇使用的許多術(shù)語在下文定義。
      [0105]術(shù)語“重復(fù)序列結(jié)構(gòu)域”用來描述來自TAL效應(yīng)子的DNA識別結(jié)構(gòu)域或其人工形式,使用所公開的方法制備,由模塊式重復(fù)序列單元組成,當(dāng)存在于多肽中時賦予靶DNA特異性。由重復(fù)序列單元構(gòu)成的重復(fù)序列結(jié)構(gòu)域可以被添加至其中需要DNA序列靶向的任何多肽,并且不限于在TAL效應(yīng)子中使用。
      [0106]術(shù)語“重復(fù)序列單元”用來描述來自TAL效應(yīng)子的重復(fù)序列結(jié)構(gòu)域的模塊式部分或其人工形式,含有決定靶DNA序列中堿基對識別的一個氨基酸或兩個相鄰氨基酸。重復(fù)序列單元結(jié)合在一起識別確定的靶DNA序列并構(gòu)成重復(fù)序列結(jié)構(gòu)域。重復(fù)序列單元可以被添加至其中需要DNA序列靶向的任何多肽,并且不限于在TAL效應(yīng)子中使用。
      [0107]術(shù)語“識別代碼”用來描述重復(fù)序列單元的位置12和13的氨基酸與靶DNA序列中相應(yīng)的DNA堿基對之間的關(guān)系,這樣的氨基酸賦予如下識別:HD識別C/G ;NI識別A/T ;NG識別T/A ;NS識別C/G或A/T 或T/A或G/C ;NN識別G/C或A/T ;IG識別T/A ;N識別C/G ;HG識別C/G或T/A ;H識別T/A ;和NK識別G/C。
      [0108]本文使用的“效應(yīng)子”(或“效應(yīng)蛋白”或“效應(yīng)多肽”)指構(gòu)建體或其編碼多肽產(chǎn)物,其中所述多肽能夠識別靶DNA序列。效應(yīng)蛋白包括由1.5或更多重復(fù)序列單元組成的重復(fù)序列結(jié)構(gòu)域,并且還可以包括一個或多個功能結(jié)構(gòu)域,例如調(diào)控結(jié)構(gòu)域。在本發(fā)明優(yōu)選實施方案中,“效應(yīng)子”還能夠發(fā)揮效應(yīng),例如調(diào)控基因表達。盡管本發(fā)明不依賴于特定生物機制,但認(rèn)為識別靶DNA序列的本發(fā)明蛋白或多肽結(jié)合所述靶DNA序列。
      [0109]術(shù)語“天然存在的”用來描述可以不同于人工制備的天然存在的對象。例如,在可以從自然來源分離的生物(包括病毒)中存在的并且未在實驗室經(jīng)人有意修飾的多肽或多核苷酸序列是天然存在的。通常,術(shù)語天然存在的指在野生型個體中存在的對象,例如對于物種來說是典型的。
      [0110]術(shù)語基因的“調(diào)節(jié)表達”、“抑制表達”和“激活表達”指本發(fā)明多肽激活或抑制基因轉(zhuǎn)錄的能力。激活包括防止后續(xù)的轉(zhuǎn)錄抑制(即,防止基因表達的阻抑),抑制包括防止后續(xù)的轉(zhuǎn)錄激活(即,防止基因激活)。調(diào)節(jié)可以通過測定直接或間接受靶基因表達影響的任何參數(shù)來測定。此類參數(shù)包括例如RNA或蛋白水平的變化、蛋白活性的改變、產(chǎn)物水平的改變、下游基因表達的改變、報告基因轉(zhuǎn)錄的改變(熒光素酶、CAT、β -半乳糖苷酶、GFP (參見例如 Mistili&Spector (1997)Nature Biotechnologyl5:961-964);信號轉(zhuǎn)導(dǎo)的改變、憐酸化和去磷酸化、受體-配體相互作用、第二信使?jié)舛?例如cGMP、cAMP、IP3和Ca2+)、細(xì)胞生長、新血管形成,在體外、體內(nèi)和離體。此類功能效應(yīng)可以通過本領(lǐng)域技術(shù)人員已知的任何方式測量,例如測量RNA或蛋白水平、測量RNA穩(wěn)定性、鑒定下游或報告基因表達,例如通過化學(xué)發(fā)光、熒光、量熱反應(yīng)、抗體結(jié)合、可誘導(dǎo)標(biāo)志物、配體結(jié)合測定;細(xì)胞內(nèi)第二信使例如cGMP和三磷酸肌醇(IP3)的改變;細(xì)胞內(nèi)鈣水平;細(xì)胞因子釋放,等等。
      [0111]“調(diào)控結(jié)構(gòu)域”指具有轉(zhuǎn)錄調(diào)控活性的蛋白或蛋白子序列。通常,調(diào)控結(jié)構(gòu)域與本發(fā)明多肽共價或非共價連接以調(diào)節(jié)轉(zhuǎn)錄。可選地,本發(fā)明多肽可以無調(diào)控結(jié)構(gòu)域而單獨作用,或者與多個調(diào)控結(jié)構(gòu)域一起作用來調(diào)節(jié)轉(zhuǎn)錄??梢詮闹蝎@得調(diào)控結(jié)構(gòu)域的轉(zhuǎn)錄因子多肽包括參與調(diào)控和基礎(chǔ)轉(zhuǎn)錄的那些。這種多肽包括轉(zhuǎn)錄因子、其效應(yīng)結(jié)構(gòu)域、輔激活子、沉默子、細(xì)胞核激素受體(參見例如Goodrich等(1996)Cell84:82530,關(guān)于參與轉(zhuǎn)錄的蛋白和核酸元件的綜述;轉(zhuǎn)錄因子大體綜述于Barnes&Adcock(1995)Clin.Exp.Allergy25Suppl.2:469 和 Roeder (1996)Methods Enzymo1.273:16571)。關(guān)于轉(zhuǎn)錄因子的數(shù)據(jù)庫是已知的(參見例如Science (1995) 269: 630)。細(xì)胞核激素受體轉(zhuǎn)錄因子描述于例如 Rosen 等(1995) J.Med.Chem.38:485574。轉(zhuǎn)錄因子的 C/ΕΒΡ 家族綜述于 Wedel 等(1995)Immunobiologyl93:17185。介導(dǎo)細(xì)胞核激素受體對轉(zhuǎn)錄調(diào)節(jié)的輔激活子和輔阻遏物綜述于例如 Meier (1996)Eur.J.Endocrinol.134 (2): 1589 ;Kaiser 等(1996) Trends Biochem.Sc1.21:3425 ;和Utley等(1998)Nature394:498502)。參與血細(xì)胞生成調(diào)控的GATA轉(zhuǎn)錄因子描述于例如 Simon(1995)Nat.Genet.11:911 ;ffeiss 等(1995)Exp.Hemato1.23:99-107。TATA 框結(jié)合蛋白(TBP)及其相關(guān) TAF 多肽(它包括 TAF30、TAF55、TAF80、TAFl 10、TAF150和 TAF250)描述于 Goodrich&Tjian(1994)Curr.0pin.Cell Biol.6:4039 和 Hurley (1996)Curr.0pin.Struct.Biol.6:6975。轉(zhuǎn)錄因子的 STAT 家族例如綜述于 Barahmand-Pour等(1996)Curr.Top.Microbiol.1mmunol.211:1218。疾病涉及的轉(zhuǎn)錄因子綜述于 Aso 等(1996) J.Clin.1nvest.97:15619。修飾參與基因調(diào)控的多肽的激酶、磷酸酶和其他蛋白也用作本發(fā)明多肽的調(diào)控結(jié)構(gòu)域。這種修飾劑通常參與開啟或關(guān)閉由例如激素介導(dǎo)的轉(zhuǎn)錄。參與轉(zhuǎn)錄調(diào)控的激酶綜述于Davis (1995)Mol.Reprod.Dev.42:45967, Jackson等(1993)Adv.Second Messenger Phosphoprotein Res.28:27986 和 Boulikas(1995)Crit.Rev.Eukaryot.Gene Expr.5:177,而憐酸酶綜述于例如 Schonthal&Semin (1995) Cancer Biol.6:23948。細(xì)胞核酪氨酸激酶描述于Wang(1994)Trends Biochem.Sc1.19:3736。有用的結(jié)構(gòu)域還可以獲自癌基因的基因產(chǎn)物(例如myc、jun、fos、myb、max、mad、rel、ets、bcl、myb、mos家族成員)及其相關(guān)因子和修飾劑。癌基因描述于例如Cooper, Oncogenes, 2nded., The Jones and Bartlett Series in Biology, Boston, Mass., Jones and BartlettPublishers, 1995。Ets 轉(zhuǎn)錄因子綜述于 Waslylk 等(1993) Eur.J.Biochem.211:718 和Crepieux 等(1994) Crit.Rev.0ncog.5:61538。Myc 癌基因綜述于例如 Ryan 等(1996)Biochem.J.314:71321。Jun 和 fos 轉(zhuǎn)錄因子描述于例如 The Fos and Jun Families ofTranscription Factors, Angel&Herrlich, eds.(1994)。Max 癌基因綜述于 Hurlin 等 ColdSpring Harb.Symp.Quant.Biol.59:10916。Myb 基因家族綜述于 Kane1-1shii 等(1996)Curr.Top.Microbiol.1mmunol.211:8998。mos 家族綜述于 Yew 等(1993) Curr.0pin.Genet.Dev.3:1925。本發(fā)明多肽可以包括獲自DNA修復(fù)酶及其相關(guān)因子和修飾劑的調(diào)控結(jié)構(gòu)域。DNA 修復(fù)酶綜述于例如 Vos (1992)Curr.0pin.Cell Biol.4:38595 ;Sancar (1995)Ann.Rev.Genet.29:69105 ;Lehmann(1995)Genet.Eng.17:119 ;和 Wood(1996)Ann.Rev.Biochem.65:13567。DNA重排酶及其相關(guān)因子和修飾劑也可用作調(diào)控結(jié)構(gòu)域(參見例如Gangloff 等(1994)Experientia50:2619 ;Sadowski (1993)FASEB J.7:7607)。
      [0112]類似地,調(diào)控結(jié)構(gòu)域可以源自DNA修飾酶(例如,DNA甲基轉(zhuǎn)移酶、拓?fù)洚悩?gòu)酶、解旋酶、連接酶、激酶、磷酸酶、聚合酶)及其相關(guān)因子和修飾劑。解旋酶綜述于Matson等(1994) Bioessaysl6:1322,甲基轉(zhuǎn)移酶描述于 Cheng (1995) Curr.0pin.Struct.Biol.5:410。染色質(zhì)相關(guān)蛋白及其修飾劑(例如,激酶、乙?;D(zhuǎn)移酶和脫乙酰酶),例如組蛋白脫乙酰酶(Wolffe Science272:3712(1996))也可用作添加至選擇效應(yīng)子的結(jié)構(gòu)域。在一個優(yōu)選實施方案中,調(diào)控結(jié)構(gòu)域是用作轉(zhuǎn)錄阻遏物的DNA甲基轉(zhuǎn)移酶(參見例如Vanden Wyngaert 等 FEBS Lett.426:283289 (1998) ;Flynn 等 J.Mol.Biol.279:101116 (1998);Okano 等 Nucleic Acids Res.26:25362540 (1998);和 Zardo&Caiafa,J.Biol.Chem.273:1651716520(1998))。在另一優(yōu)選實施方案中,內(nèi)切核酸酶例如Fokl用作轉(zhuǎn)錄阻遏物,它經(jīng)由基因切割而作用(參見例如W095/09233 ;和PCT/US94/01201)??刂迫旧|(zhì)和DNA結(jié)構(gòu)、運動和定位的因子及其相關(guān)因子和修飾劑;源自微生物(例如原核生物、真核生物和病毒)的因子和與它們相關(guān)或修飾它們的因子也可用于獲得嵌合蛋白。在一個實施方案中,重組酶和整合酶用作調(diào)控結(jié)構(gòu)域。在一個實施方案中,組蛋白乙?;D(zhuǎn)移酶用作轉(zhuǎn)錄激活子(參見例如Jin&Scotto (1998)Mol.Cell.Biol.18:43774384 ;Wolffe(1996)Science272:371372 ;Taunton 等 Science272:408411(1996);和 Hassig 等PNAS95:35193524(1998))。在另一實施方案中,組蛋白脫乙酰酶用作轉(zhuǎn)錄阻遏物(參見例如,Jin&Scotto(1998)Mol.Cell.Biol.18:43774384 ;Syntichaki&Thireos(1998)J.Biol.Chem.273:2441424419 ;Sakaguchi 等(1998)Genes Dev.12:28312841 ;和 Martinez 等(1998)J.Biol.Chem.273:2378123785)。
      [0113]本文使用的“基因”指包含編碼序列的核酸分子或其部分,任選地含有內(nèi)含子和調(diào)控編碼序列表達和轉(zhuǎn)錄物未翻譯部分轉(zhuǎn)錄的控制區(qū)。因此,術(shù)語“基因”除了編碼區(qū)外還包括調(diào)控序列,例如啟動子、增強 子、5’未翻譯區(qū)、3’未翻譯區(qū)、終止信號、聚腺苷?;瘏^(qū)等?;虻恼{(diào)控序列可以位于編碼區(qū)鄰近、之內(nèi)或遠離。
      [0114]本文使用的“靶基因”指其表達受本發(fā)明多肽調(diào)節(jié)的基因。
      [0115]本文使用的“植物”指植物界的各種光合真核多細(xì)胞生物的任何一種,特征生成胚,含有葉綠體,具有纖維素細(xì)胞壁,并缺乏移動力。本文使用的“植物”包括處于任何發(fā)育階段的任何植物或植物部分,包括種子、懸浮培養(yǎng)物、胚、分生組織區(qū)、愈傷組織、葉、根、枝、配子體、孢子體、花粉、小孢子及其后代。還包括切屑和細(xì)胞或阻止培養(yǎng)物。與本發(fā)明結(jié)合使用時,術(shù)語“植物組織”包括但不限于完整植物、植物細(xì)胞、植物器官,例如葉、莖、根、分生組織、植物種子、原生質(zhì)體、愈傷組織、細(xì)胞培養(yǎng)物和被組織成結(jié)構(gòu)和/或功能單元的任何植物細(xì)胞組。
      [0116]本文使用的“調(diào)節(jié)植物細(xì)胞中靶基因表達”指在植物細(xì)胞中單獨或與其他轉(zhuǎn)錄和/或翻譯調(diào)控因子一起使用本發(fā)明多肽或編碼這種多肽的核酸來增加(激活)或減少(抑制)植物細(xì)胞中靶基因的表達。
      [0117]本文使用的“靶DNA序列”指需要被蛋白識別的雙鏈DNA的一部分。在一個實施方案中,“靶DNA序列”是可以通過改變其表達程度而達到預(yù)期表型結(jié)果的基因的轉(zhuǎn)錄控制元件的全部或部分。轉(zhuǎn)錄控制元件包括正向和負(fù)向控制元件,例如啟動子、增強子、其他應(yīng)答元件,例如類固醇應(yīng)答元件、熱休克應(yīng)答元件、金屬應(yīng)答元件、阻遏物結(jié)合位點、操作子和/或沉默子。轉(zhuǎn)錄控制元件可以是病毒的、真核的或原核的。“靶DNA序列”還包括可以結(jié)合蛋白并從而調(diào)節(jié)、通常防止轉(zhuǎn)錄的下游或上游序列。[0118]本文使用的術(shù)語“DNA”或“DNA序列”不是要將本發(fā)明限制為包含DNA的多核苷酸分子。本領(lǐng)域普通技術(shù)人員將知道,本發(fā)明方法和組合物涵蓋由脫氧核糖核苷酸(即,DNA)、核糖核苷酸(即,RNA)或核糖核苷酸與脫氧核糖核苷酸組合所組成的多核苷酸分子。這種脫氧核糖核苷酸和核糖核苷酸包括天然存在的分子和合成類似物,包括但不限于核苷酸類似物或修飾的骨架殘基或鍵合,它們是合成的、天然存在的和非天然存在的,它們具有與參考核酸相似的結(jié)合性質(zhì),并且它們以與參考核苷酸類似的方式代謝。這種類似物的實例包括但不限于硫代磷酸酯、氨基膦酸酯、甲基膦酸酯、手性甲基膦酸酯、2-0-甲基核糖核苷酸、肽核酸(PNA)。本發(fā)明的多核苷酸分子還涵蓋所有形式的多核苷酸分子,包括但不限于單鏈形式、雙鏈形式、發(fā)夾結(jié)構(gòu)、莖環(huán)結(jié)構(gòu)等。而且,本領(lǐng)域普通技術(shù)人員理解,本文公開的DNA序列還涵蓋示例核苷酸序列的互補體。
      [0119]本文使用的“特異性結(jié)合靶DNA序列”意思是本發(fā)明多肽與指定靶DNA序列的結(jié)合親和力統(tǒng)計學(xué)上高于相同多肽與大體相當(dāng)?shù)前蠨NA序列的結(jié)合親和力。它還指本發(fā)明重復(fù)序列結(jié)構(gòu)域與指定靶DNA序列結(jié)合比其與非靶DNA序列的結(jié)合具有可檢測的更大程度,例如高于背景至少1.5倍,并且基本排除非靶DNA序列。本發(fā)明多肽對每種DNA序列的Kd可以被比較以評估多肽與特定靶DNA序列的結(jié)合特異性。
      [0120]本文使用的“靶基因內(nèi)的靶DNA序列”指靶DNA序列和靶基因之間的功能關(guān)系,因為本發(fā)明多肽對靶DNA序列的識別將調(diào)節(jié)靶基因的表達。靶DNA序列可以物理上位于靶基因邊界內(nèi)的任何地方,例如5’端、編碼區(qū)、3’端、cDNA編碼區(qū)外的上游和下游區(qū)、或增強子或其他調(diào)控區(qū)內(nèi),并且可以與靶基因鄰近或遠離。
      [0121 ] 本文使用的“內(nèi)源的”指與靶基因或?qū)⒅氲乃拗骷?xì)胞天然相關(guān)的核酸或蛋白序列。
      [0122]本文使用的“外源的”指與靶基因或?qū)⒅氲乃拗骷?xì)胞非天然相關(guān)的核酸或蛋白序列,包括天然存在的核酸例如DNA序列的非天然存在的多拷貝,或者位于非天然存在的基因組位置的天然存在的核酸序列。
      [0123]本文使用的“遺傳修飾的植物(或轉(zhuǎn)基因植物)”指在其基因組內(nèi)包含外源多核苷酸的植物。一般且優(yōu)選地,外源多核苷酸穩(wěn)定整合在基因組內(nèi),使得多核苷酸被傳遞到連續(xù)代。外源多核苷酸可以單獨或作為重組表達盒的部分被整合入基因組。“轉(zhuǎn)基因”在本文用來包括任何細(xì)胞、細(xì)胞系、愈傷組織、植物部分或植物,其基因型已經(jīng)通過外源核酸的存在而被改變,包括開始被如此改變的那些轉(zhuǎn)基因,以及通過有性雜交或無性繁殖從最初轉(zhuǎn)基因產(chǎn)生的那些。本文使用的術(shù)語“轉(zhuǎn)基因”不涵蓋通過常規(guī)植物育種方法或通過天然發(fā)生的事件例如隨機異體受精、非重組病毒感染、非重組細(xì)菌轉(zhuǎn)化、非重組轉(zhuǎn)座或自發(fā)突變的基因組改變(染色體或染色體外的)。
      [0124]本文使用的“最小啟動子”或大致相似術(shù)語指在缺乏上游激活時無活性或具有大大降低的啟動子活性的啟動子元件、特別是TATA元件。在適合的轉(zhuǎn)錄因子存在下,最小啟動子發(fā)揮功能以允許轉(zhuǎn)錄。
      [0125]本文使用的“阻遏 蛋白”或“阻遏物”指結(jié)合DNA的操作子或RNA以分別防止轉(zhuǎn)錄或翻譯的蛋白。
      [0126]本文使用的“阻遏”指通過阻遏蛋白與DNA或mRNA上特定位點的結(jié)合而抑制轉(zhuǎn)錄或翻譯。優(yōu)選地,阻遏包括轉(zhuǎn)錄或翻譯水平至少1.5倍、更優(yōu)選至少2倍和甚至更優(yōu)選至少5倍的顯著改變。
      [0127]本文使用的“激活蛋白”或“激活子”指結(jié)合DNA的操作子或RNA以分別增強轉(zhuǎn)錄或翻譯的蛋白。
      [0128]本文使用的“激活”指通過激活蛋白與DNA或mRNA上特定位點的結(jié)合而增強轉(zhuǎn)錄或翻譯。優(yōu)選地,激活包括轉(zhuǎn)錄或翻譯水平至少1.5倍、更優(yōu)選至少2倍和甚至更優(yōu)選至少5倍的顯著改變。
      [0129]本文使用的分子的“衍生物”或“類似物”指衍生自分子的部分或分子的修飾形式。
      [0130]本文使用的“衍生自轉(zhuǎn)錄激活子樣(TAL)效應(yīng)子的重復(fù)序列單元”指來自TAL效應(yīng)子或一個或多個TAL效應(yīng)子的修飾或人工形式的重復(fù)序列單元,由本文公開的任何方法制備。
      [0131]在下文中,本發(fā)明特別參考經(jīng)由III型分泌系統(tǒng)轉(zhuǎn)移入植入細(xì)胞的轉(zhuǎn)錄激活子樣(TAL)效應(yīng)子家族來描述。該效應(yīng)子家族的類型成員是AvrBs3。因此,TAL效應(yīng)子家族還稱為AvrBs3樣蛋白家族。兩種措辭被同義使用并可以互換。AvrBs3樣家族的非限制形式如下:AvrBs4和Hax子家族Hax2、Hax3和Hax4的成員以及BrglI。AvrBs3和其家族其他成員的特征在于它們對靶基因的啟動子區(qū)中特定DNA序列的結(jié)合能力并誘導(dǎo)這些基因的表達。它們具有保守的結(jié)構(gòu)特征,使它們能夠用作植物基因的轉(zhuǎn)錄激活子。AvrBs3樣家族和同源效應(yīng)子通常在其C端區(qū)具有核定位序列(NLS)和轉(zhuǎn)錄激活結(jié)構(gòu)域(AD)。中央?yún)^(qū)含有通常34或35個氨基酸的重復(fù)序列單元。所述重復(fù)序列單元幾乎相同,但在某些位置不同,并且目前已經(jīng)發(fā)現(xiàn)這些位置如何決定蛋白的核苷酸序列結(jié)合特異性。
      [0132]對于AvrBs3顯示,重復(fù)序列單元負(fù)責(zé)結(jié)合DNA。AvrBs3和AvrBs3家族可能的其他成員的DNA結(jié)合特異性似乎由蛋白的中央重復(fù)序列結(jié)構(gòu)域介導(dǎo)。該重復(fù)序列結(jié)構(gòu)域在AvrBs3中由17.5重復(fù)序列單元組成,而在同源蛋白中包含1.5至33.5重復(fù)序列單元,它們通常各自為34個氨基酸。還顯示了其他重復(fù)序列單元長度(例如30、33、35、39、40、42氨基酸)。重復(fù)序列結(jié)構(gòu)域中最后一個重復(fù)序列通常僅是19或20個氨基酸長度的半個重復(fù)序列。個體重復(fù)序列單元一般不是相同的。除了這些位置12和13是高變的以外,它們在某些可變氨基酸位置不同,而位置4、11、24和32高頻率變化,但比12和13頻率低(在其他位置也發(fā)生變化,但頻率更低)。來自黃單胞菌屬的不同AvrBs3樣蛋白的比較揭示了 80-97%的總體序列同一性,具有限于重復(fù)序列結(jié)構(gòu)域的大部分差異。例如,AvrBs3和AvrBs3樣家族成員AvrBs4唯獨在其重復(fù)序列結(jié)構(gòu)域區(qū)不同,除了對于AvrBs3來說AvrBs4的C端中有四個氨基酸缺失。
      [0133]圖16顯示了 AvrBs3的氨基酸序列以及Hax-子家族成員的氨基酸序列。對于本發(fā)明特別重要的是重復(fù)序列單元,它們除了在位置12和13的高變氨基酸和位置4和24的可變氨基酸之外是相同。因此,這些蛋白的每個重復(fù)序列單元被單獨給出。
      [0134]如上所述,已經(jīng)描述了重復(fù)序列結(jié)構(gòu)域內(nèi)的重復(fù)序列單元決定AvrBs3家族的III型效應(yīng)蛋白的識別或結(jié)合能力和特異性。然而,潛在原理在本發(fā)明之前是未知的。
      [0135]本發(fā)明人已經(jīng)發(fā)現(xiàn),重復(fù)序列結(jié)構(gòu)域內(nèi)的一個重復(fù)序列單元負(fù)責(zé)識別靶DNA序列中的一個特定DNA堿基對。然而,該發(fā)現(xiàn)僅是本發(fā)明的一個部分。本發(fā)明人還發(fā)現(xiàn),重復(fù)序列結(jié)構(gòu)域的每個重復(fù)序列單元內(nèi)的高變區(qū)負(fù)責(zé)識別靶DNA序列中的一個特定DNA堿基對。在重復(fù)序列單元內(nèi),高變區(qū)(對應(yīng)于氨基酸位置12和13)通常負(fù)責(zé)該識別特異性。因此,這些氨基酸中的每個變化反映了靶DNA識別和優(yōu)選還有識別能力的相應(yīng)變化。
      [0136]本文使用的“高變區(qū)”預(yù)期表示本發(fā)明重復(fù)序列單元中位置12和13或等同位置。要理解,本發(fā)明位置12和13對應(yīng)于本文公開的AvrBs3和其他TAL效應(yīng)子的全長重復(fù)序列單元中的位置12和13。還要理解,“等同位置”預(yù)期是在本發(fā)明重復(fù)序列單元中分別對應(yīng)于位置12和13的位置。通過將任何重復(fù)序列單元與AvrBs3的全長重復(fù)序列單元比對,可以容易確定這種等同位置。
      [0137]因此,還首次顯示,DNA結(jié)合蛋白的重復(fù)序列結(jié)構(gòu)域中一個重復(fù)序列單元識別靶DNA中的一個堿基對,并且通常在重復(fù)序列單元的高變區(qū)內(nèi)的重復(fù)序列單元中一個氨基酸或兩個氨基酸殘基決定靶DNA中那個堿基對被識別。基于該發(fā)現(xiàn),本領(lǐng)域技術(shù)人員將能夠特異性靶向關(guān)注的靶DNA序列中的靶堿基對,通過修飾重復(fù)序列結(jié)構(gòu)域的其重復(fù)序列單元內(nèi)的多肽以特異性靶向預(yù)期靶DNA序列中的靶堿基對?;谠摪l(fā)現(xiàn),本發(fā)明人已經(jīng)鑒定了不同重復(fù)序列類型的DNA靶特異性的識別代碼,并且能夠預(yù)測幾種TAL效應(yīng)子的靶DNA序列,這可以試驗證實。這還將促進由TAL效應(yīng)子調(diào)控的宿主基因的鑒定。識別靶DNA中線性堿基序列的重復(fù)序列單元的線性陣列是新型DNA-蛋白相互作用。本發(fā)明鑒定的用于高特異性靶向DNA的重復(fù)序列結(jié)構(gòu)域和識別代碼的模塊式結(jié)構(gòu)允許有效設(shè)計用于多種【技術(shù)領(lǐng)域】的特異性DNA結(jié)合結(jié)構(gòu)域。
      [0138]在本發(fā)明的一個實施方案中,重復(fù)序列結(jié)構(gòu)域包括在轉(zhuǎn)錄因子中,例如在植物中活性的轉(zhuǎn)錄因子,特別優(yōu)選在III型效應(yīng)蛋白中,例如在AvrBs3樣家族的效應(yīng)子中。然而,在揭示了一方面在重復(fù)序列結(jié)構(gòu)域中的重復(fù)序列單元和另一方面靶DNA中堿基序列之間的關(guān)聯(lián)之后,重復(fù)序列結(jié)構(gòu)域的模塊式結(jié)構(gòu)可用于將用于靶向特定靶DNA序列的任何蛋白中。通過將包含重復(fù)序列單元的重復(fù)序列結(jié)構(gòu)域引入多肽,其中重復(fù)序列單元被修飾以使每個重復(fù)序列單元包含一個高變區(qū)并且其中所述高變區(qū)決定靶DNA序列中堿基對的識別,大量蛋白對預(yù)定靶D NA序列的識別是可行的。
      [0139]因為已經(jīng)發(fā)現(xiàn)重復(fù)序列結(jié)構(gòu)域內(nèi)一個重復(fù)序列單元負(fù)責(zé)特異性識別DNA中的一個堿基對,幾個重復(fù)序列單元可以彼此組合,其中每個重復(fù)序列單元包含負(fù)責(zé)每個重復(fù)序列單兀識別祀DNA序列中特定喊基的聞變區(qū)。
      [0140]特異性修飾DNA序列以獲得特定氨基酸的指定代碼的技術(shù)是本領(lǐng)域已知的。
      [0141]誘變和多核苷酸改變的方法已經(jīng)被廣泛描述。參見例如Kunkel (1985)Proc.Natl.Acad.Sc1.USA82:488-492 ;Kunkel 等(1987)Methods in Enzymol.154:367-382 ;美國專利號 4,873,192 ;Walker and Gaastra, eds.(1983)Techniques in MolecularBiology (MacMillan Publishing Company, New York)和其中引用的參考文獻。所有這些出版物在本文通過引用并入。
      [0142]下述實施例提供了用于構(gòu)建新重復(fù)序列單元病測試人工構(gòu)建的重復(fù)序列單元特異性識別靶DNA序列中堿基對的特異性結(jié)合活性的方法。
      [0143]重復(fù)序列結(jié)構(gòu)域中使用的重復(fù)序列單元的數(shù)目可以由本領(lǐng)域技術(shù)人員通過常規(guī)實驗來確定。一般,至少1.5個重復(fù)序列單元被認(rèn)為是最小的,盡管通常使用至少約8個重復(fù)序列單元。重復(fù)序列單元不必是完整的重復(fù)序列單元,因為可以使用一般大小的重復(fù)序列單元。而且,本文描述的方法和多肽不依賴于具有特定數(shù)目的重復(fù)序列單元的重復(fù)序列結(jié)構(gòu)域。因此,本發(fā)明多肽可以包含例如1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、11、11.5、12、12.5、13、13.5、14、14.5、15、15.5、16、16.5、17、17.5、18、
      18.5、19、19.5、20、20.5、21、21.5、22、22.5、23、23.5、24、24.5、25、25.5、26、26.5、27、27.5、28,28.5、29、29.5、30、30.5、31、31.5、32、32.5、33、33.5、34、34.5、35、35.5、36、36.5、37、
      37.5、38、38.5、39、39.5、40、40.5、41、41.5、42、42.5、43、43.5、44、44.5、46、46.5、47、47.5、
      48,48.5、49、49.5,50,50.5或更多重復(fù)序列單元。通常,AvrBs3含有17.5個重復(fù)序列單元并且誘導(dǎo)UPA(由AvrBs3上調(diào))基因的表達。重復(fù)序列單元的數(shù)目和順序?qū)Q定相應(yīng)活性和DNA識別特異性。作為進一步實例,AvrBs3家族成員Hax2包括21.5個重復(fù)序列單元,Hax3包括11.5個重復(fù)序列單元,而Hax4包括14.5個重復(fù)序列單元。優(yōu)選地,本發(fā)明多肽包含約8至約39個重復(fù)序列單元。更優(yōu)選地,本發(fā)明多肽包含約11.5至約33.5重復(fù)序列單元。
      [0144]具有34個氨基酸的重復(fù)序列的典型共有序列(單字母代碼)顯示如下:
      [0145]LTPEQVVAIASNGGGKQALETVQRLLPVLCQAHG
      [0146]具有35個氨基酸的重復(fù)序列單元的其他共有序列(單字母代碼)顯示如下:
      [0147]LTPEQVVAIASNGGGKQALETVQRLLPVLCQAPHD
      [0148]可用于本發(fā)明一個實施方案的重復(fù)序列單元與上述共有序列具有至少35%、40%、50%、60%、70%、75%、80%、85%、90%或95%的同一性。在優(yōu)選實施方案中,使用AvrBs3、Hax2> Hax3和Hax4的重復(fù)序列和AvrBs3家族的其他成員。這些成員的重復(fù)序列單元序列在圖16中顯示。這些重復(fù)序列單元序列可以通過更換一個或多個氨基酸來修飾。修飾的重復(fù)序列單元序列與AvrBs3家族序列的最初成員的最初重復(fù)序列具有至少35%、40%、50%、60%、70%、75%、80%、85%、90%或95%的同一性。在優(yōu)選實施方案中,位置12和13的氨基酸被改變。在其他實施方案中,位置4、11、24和32的氨基酸被改變。優(yōu)選地,每個重復(fù)序列的氨基酸數(shù)目在20-45氨基酸范圍內(nèi),更進一步,每個重復(fù)序列單元32-40氨基酸、還進一步32-39氨基酸并且進一步任選32、34、35或39個氨基酸。
      [0149]具體說,重復(fù)序列單元中的高變區(qū)決定靶DNA序列中一個堿基對的特異性識別。更具體地,本發(fā)明人發(fā)現(xiàn)重復(fù)序列單元中位置12和13存在的氨基酸與靶DNA序列中堿基對之間的下述識別特異性關(guān)聯(lián):
      [0150]?HD 識別 C/G
      [0151].ΝΙ 識別 A/T
      [0152]籲NG 識別 Τ/Α
      [0153].NS 識別 C/G 或 Α/Τ 或 Τ/Α 或 G/C
      [0154].ΝΝ 識別 G/C 或 Α/Τ
      [0155]?IG 識別 Τ/Α
      [0156].N 識別 C/G 或 T/A
      [0157]籲HG 識別 T/A
      [0158].Η 識別 T/A
      [0159].ΝΚ 識別 G/C。
      [0160]必須注意,氨基酸以單字母代碼表示。核苷酸作為堿基對給出,其中第一堿基位于上鏈,第二堿基位于下鏈;例如C/G表示C位于上鏈,G位于下鏈。
      [0161] 分別就單氨基酸N和H而言,當(dāng)通過多氨基酸序列比對與其他重復(fù)序列單元比較時,AvrBs3的氨基酸13從重復(fù)序列單元缺失。
      [0162]在本發(fā)明的一個實施方案中,AvrBs3樣蛋白的N端結(jié)構(gòu)域賦予所述重復(fù)序列的識別特異性的T,5’的識別特異性。
      [0163]在本發(fā)明特別優(yōu)選的實施方案中,使用蛋白家族AvrBs3的重復(fù)序列單元。該蛋白家族成員的實例已經(jīng)在上文指出。特別是,所述蛋白家族的成員與AvrBs3的氨基酸序列、特別是AvrBs3的重復(fù)序列單元的氨基酸序列具有至少95%、至少90%、至少80%、至少85%、至少70%、至少75%、至少60%、至少50%、至少40%或至少35%的氨基酸同源性??紤]到這點,重復(fù)序列單元的高變區(qū)可以通過AvrBs3家族成員之間的氨基酸比較來推導(dǎo)。在特別優(yōu)選的實施方案中,氨基酸在AvrBs3的重復(fù)序列單元的位置12和13。然而,可變區(qū)還可以位于不同的氨基酸位置??勺兾恢玫膶嵗前被岢蓡T4、11、24和32。在本發(fā)明進一步實施方案中,負(fù)責(zé)特異性識別DNA序列中堿基對的氨基酸位于通常在AvrBs3家族成員之間不變化的位置或位于可變但非高變的位置。
      [0164]總結(jié),本發(fā)明人發(fā)現(xiàn)重復(fù)序列單元決定DNA序列上一個堿基對的識別,并且重復(fù)序列單元內(nèi)的高變區(qū)決定相應(yīng)重復(fù)序列單元的識別特異性。因此,重復(fù)序列單元的序列與靶DNA序列中堿基對的特定線性順序相關(guān)聯(lián)。本發(fā)明人發(fā)現(xiàn)關(guān)于AvrBs3的這種關(guān)聯(lián)并且就代表數(shù)目的AvrBs3樣蛋白家族成員證實了這點。就AvrBs3樣家族成員來說,34或其他氨基酸長度的重復(fù)序列單元中位置12和13的氨基酸殘基與AvrBs3樣蛋白的確定的結(jié)合特異性相關(guān)聯(lián)。該核心原理的發(fā)現(xiàn)提供了有力的工具來定制具有其同源靶DNA模板的多肽,用于許多應(yīng)用,包括但不限于調(diào)芐基因表達和靶向基因組工程。 [0165]在本發(fā)明中,可以設(shè)計包含具有重復(fù)序列單元的重復(fù)序列結(jié)構(gòu)域的多肽,其中重復(fù)序列單元中包含決定靶DNA序列中堿基對的識別的高變區(qū)。在本發(fā)明的一個實施方案中,每個重復(fù)序列單元包含決定靶DNA序列中一個堿基對的識別的高變區(qū)。在進一步的實施方案中,重復(fù)序列結(jié)構(gòu)域中包含I或2個不特異性識別靶DNA序列中堿基對的重復(fù)序列單元??紤]到由發(fā)明人發(fā)現(xiàn)的識別代碼,重復(fù)序列單元的模塊式排列是可行的,其中每個重復(fù)序列單元負(fù)責(zé)特異性識別靶DNA序列中一個堿基對。因此,重復(fù)序列單元的序列對應(yīng)于靶DNA序列中的堿基對的序列,使得I個重復(fù)序列單元匹配一個堿基對。
      [0166]只要靶DNA序列是已知的并且需要被蛋白識別,本領(lǐng)域技術(shù)人員能夠特別構(gòu)建模塊式系列的重復(fù)序列單元,包括特異性識別氨基酸序列,并將這些重復(fù)序列單元以適當(dāng)順序裝配成多肽,以實現(xiàn)對預(yù)期靶DNA序列的識別和結(jié)合。任何多肽可以通過與本發(fā)明的模塊式重復(fù)序列單元DNA結(jié)合結(jié)構(gòu)域組合來修飾。此類實例包括是轉(zhuǎn)錄激活子和阻遏蛋白、抗性介導(dǎo)蛋白、核酸酶、拓?fù)洚悩?gòu)酶、連接酶、整合酶、重組酶、解離酶、甲基化酶、乙?;D(zhuǎn)移酶、去甲基化酶、脫乙酰酶的多肽,和能夠修飾DNA、RNA或蛋白的任何其他多肽。
      [0167]本發(fā)明的模塊式重復(fù)序列單元DNA結(jié)合結(jié)構(gòu)域能夠與細(xì)胞區(qū)室定位信號例如核定位信號組合以在任何其他調(diào)控區(qū)發(fā)揮功能,包括但不限于轉(zhuǎn)錄調(diào)控區(qū)和翻譯終止區(qū)。
      [0168]在本發(fā)明的進一步實施方案中,這些模塊化設(shè)計的重復(fù)序列單元與能夠在通過重復(fù)序列結(jié)構(gòu)域的結(jié)合而靠近DNA時切割DNA的內(nèi)切核酸酶結(jié)構(gòu)域組合。已知這種內(nèi)切核酸酶斷裂刺激真核生物中同源重組率,所述真核生物包括真菌、植物和動物。由于位點特異性內(nèi)切核酸酶斷裂而刺激特定位點同源重組的能力允許回收已經(jīng)在所述特定位點以比沒有進行位點特異性斷裂時的可能頻率高得多的頻率整合DNA序列的轉(zhuǎn)化細(xì)胞。此外,內(nèi)切核酸酶斷裂,例如由重復(fù)序列結(jié)構(gòu)域和內(nèi)切核酸酶結(jié)構(gòu)域形成的多肽導(dǎo)致的那些,有時通過細(xì)胞DNA代謝機制以改變斷裂位點序列的方式來修復(fù),例如通過在斷裂位點導(dǎo)致與未改變序列相比的短插入或缺失。這些序列改變可以導(dǎo)致基因或蛋白功能的失活,例如通過改變蛋白編碼序列以制備非功能蛋白,修飾剪接位點而使基因轉(zhuǎn)錄物被不正確地切割,制備非功能轉(zhuǎn)錄物,改變基因啟動子序列而使它不再能適當(dāng)轉(zhuǎn)錄,等等。
      [0169]使用位點特異性內(nèi)切核酸酶斷裂DNA可以增加斷裂區(qū)中同源重組率。在一些實施方案中,F(xiàn)ok I (海床黃桿菌(Flavobacterium okeanokoites))內(nèi)切核酸酶可以作為效應(yīng)子用于誘導(dǎo)DNA斷裂。Fok I內(nèi)切核酸酶結(jié)構(gòu)域獨立地于DNA結(jié)合結(jié)構(gòu)域而起作用,并切割通常作為二聚體的雙鏈 DNA(Li 等(1992)Proc.Natl.Acad.Sc1.U.S.A89(10):4275-4279,和 Kim 等(1996) Proc.Natl.Acad.Sc1.U.S.A93 (3): 1156-1160;其公開內(nèi)容在此通過引用整體并入)。單鏈FokI 二聚體也已經(jīng)被開發(fā)并也可被使用(Mino等(2009)J.Biotechnol.140:156-161)。可以構(gòu)建含有用于識別預(yù)期靶DNA序列的重復(fù)序列結(jié)構(gòu)域和誘導(dǎo)在靶DNA序列或其附近DNA斷裂的FokI內(nèi)切核酸酶結(jié)構(gòu)域的效應(yīng)子,類似于之前米用鋒指核酸酶進行的工作(Townsend 等(2009)Nature459:442-445 ;Shukla 等(2009)Nature459, 437-441,其全部在此通過引用整體并入)。此類效應(yīng)子的使用能夠產(chǎn)生基因組中的靶向改變,包括添加、缺失和其他修飾,類似于針對鋅指核酸酶報道的那些用途,參見Bibikova 等(2003) Science300, 764 ;Urnov 等(2005) Nature435, 646 ;Wright 等(2005) ThePlant Journal44:693-705 ;和美國專利號7,163,824和7,001, 768,其全部在此通過引用整體并入。
      [0170]FokI內(nèi)切核酸酶結(jié)構(gòu)域可以通過PCR從根據(jù)標(biāo)準(zhǔn)方法制備的海洋細(xì)菌海床黃桿菌(ATCC)的基因組DNA克隆。FokI內(nèi)切核酸酶的序列可獲自Pubmed(登記號M28828和登記號J04623,其公開內(nèi)容在此通過引用整體并入)。
      [0171]來自釀酒酵 母的1-Sce I內(nèi)切核酸酶已經(jīng)用于產(chǎn)生增加同源重組率的DNA斷裂。1-Sce I是由線粒體內(nèi)含子編碼的內(nèi)切核酸酶,它具有18bp識別序列,因此在給定DNA內(nèi)、甚至在大基因組內(nèi)非常低的識別位點頻率(Thierry等(1991)Nucleic AcidsRes.19(1):189-190 ;其公開內(nèi)容在此通過引用整體并入)。1-Sce I識別的切割位點的低頻率使它適合用于增強同源重組。關(guān)于使用1-Sce I誘導(dǎo)所述DNA斷裂的其他描述可以參見美國專利申請20090305402,其在此通過引用整體并入。
      [0172]1-Sce I的識別位點已經(jīng)被引入許多不同系統(tǒng)。該位點用I_Sce I的隨后切割增加了已經(jīng)引入該位點的位置的同源重組。已經(jīng)使用被引入爪蟾卵染色體外DNA、小鼠基因組和煙草植物白花丹葉煙草(Nicotiana plumbaginifolia)基因組DNA的1-SceI位點獲得提高的同源重組頻率。參見例如Segal等(1995) Proc.Natl.Acad.Sc1.U.S.A.92(3):806-810 ;ChouIika 等(1995)Mol.Cell Biol.15(4):1968-1973 ;和 Puchta等(1993)Nucleic Acids Res.21 (22):5034-5040 ;其公開內(nèi)容在此通過引用整體并入。要理解,與異源DNA結(jié)合結(jié)構(gòu)域一起起作用的任何其他內(nèi)切核酸酶結(jié)構(gòu)域可用作效應(yīng)子,并且1-Sce I內(nèi)切核酸酶是一個這樣的非限制性實例。具有DNA識別和結(jié)合結(jié)構(gòu)域的內(nèi)切核酸酶例如1-Sce I的使用限制在于:如果識別位點不是預(yù)期位置已經(jīng)存在的,則識別位點必須在使用所述內(nèi)切核酸酶來提高該位點同源重組之前通過同源重組標(biāo)準(zhǔn)方法引入預(yù)期位置。已經(jīng)報道了能夠設(shè)計和合成識別新的靶DNA序列的新型內(nèi)切核酸酶的方法,例如通過修飾已知的內(nèi)切核酸酶或制備一種或多種此類內(nèi)切核酸酶的嵌合形式,從而有助于產(chǎn)生此類工程化內(nèi)切核酸酶結(jié)構(gòu)域以切割關(guān)注的內(nèi)源性靶DNA序列(Chevalier等(2002)Molecular Celll0:895_905 ;W02007/060495 ;W02009/095793 ;Fajardo_Sanchez等(2008)Nucleic Acids Res.36:2163-2173,兩者在此通過引用整體并入)。照這樣,可以預(yù)見此類內(nèi)切核酸酶結(jié)構(gòu)域可以被類似地工程化,以使DNA結(jié)合活性變得非功能性但是保持DNA切割功能活性,并利用所述類似工程化的內(nèi)切核酸酶切割結(jié)構(gòu)域作為效應(yīng)子來誘導(dǎo)與使用上述FokI類似的DNA斷裂。在這種應(yīng)用中,靶DNA序列識別優(yōu)選由效應(yīng)子的重復(fù)序列結(jié)構(gòu)域來提供,但是DNA切割將通過工程化內(nèi)切核酸酶結(jié)構(gòu)域來實現(xiàn)。
      [0173]如上提到的,效應(yīng)子包括對預(yù)期特定靶序列特異性識別的重復(fù)序列結(jié)構(gòu)域。在優(yōu)選實施方案中,效應(yīng)子特異性結(jié)合內(nèi)源性染色體DNA序列。特定的核酸序列或更優(yōu)選特定的內(nèi)源性染色體序列可以是其中希望增強同源重組的核酸區(qū)中的任何序列。例如,核酸區(qū)可以是含有其中需要引入突變例如點突變或缺失的基因的區(qū)域,或者需要引入賦予預(yù)期表型的基因的區(qū)域。
      [0174]進一步的實施方案涉及產(chǎn)生其中已經(jīng)引入所需添加的修飾植物的方法。該方法可以包括:獲得包括需要引入修飾的內(nèi)源性靶DNA序列的植物細(xì)胞;用效應(yīng)子在所述內(nèi)源性靶DNA序列內(nèi)產(chǎn)生雙鏈切割,所述效應(yīng)子包括結(jié)合內(nèi)源性靶DNA序列的重復(fù)序列結(jié)構(gòu)域和內(nèi)切核酸酶結(jié)構(gòu)域;在允許外源性核酸和內(nèi)源性靶DNA序列之間發(fā)生同源重組的條件下將外源性核酸引入植物細(xì)胞,所述外源性核酸包括與至少一部分內(nèi)源性靶DNA同源的序列;和從其中已經(jīng)發(fā)生同源重組的植物細(xì)胞產(chǎn)生植物。其他實施方案涉及根據(jù)上文和這里所述方法制備的遺傳修飾的細(xì)胞和植物。應(yīng)該注意,靶DNA序列可以是人工的或天然存在的。要理解,此類方法可使用本領(lǐng)域已知的技術(shù)和方法用于任何生物(此類非限制性生物包括動物、人、真菌、卵菌綱細(xì)菌和病毒)并在此類生物中用于此類目的。
      [0175]在本發(fā)明進一步的實施方案中,這些模塊化設(shè)計的重復(fù)序列結(jié)構(gòu)域與負(fù)責(zé)調(diào)解或控制例如植物基因、動物基因、真菌基因、卵菌基因、病毒基因或人基因的基因表達的一個或多個結(jié)構(gòu)域組合。通過產(chǎn)生含有鋅指結(jié)構(gòu)域的DNA結(jié)合多肽來調(diào)芐基因表達的方法是本領(lǐng)域已知的(美國專利號 7,285,416,7,521,241,7,361,635,7,273,923,7,262,054,7,220,719,7,070,934,7,013,219,6,979,539,6,933,113,6,824,978,其每一個在此通過引用整體并入)。例如,這些AvrBs3樣家族效應(yīng)子被修飾以結(jié)合特定祀DNA序列。此類多肽可以例如是轉(zhuǎn)錄激活子或轉(zhuǎn)錄的阻遏蛋白,它們通過本發(fā)明方法修飾以特異性結(jié)合啟動子的基因控制區(qū)或關(guān)注基因的其他調(diào)控區(qū),以激活、阻遏或以其他方式調(diào)節(jié)所述基因的轉(zhuǎn)錄。
      [0176]在本發(fā)明更進一步實施方案中,靶DNA序列被修飾以被非天然存在的重復(fù)序列結(jié)構(gòu)域或修飾的重復(fù)序列結(jié)構(gòu)域特異性識別。作為一個實例,AvrBs3樣家族成員的靶DNA序列可以被插入啟動子以產(chǎn)生新型可控制的啟動子,它可以通過相應(yīng)AvrBs3效應(yīng)子誘導(dǎo)。第二可誘導(dǎo)系統(tǒng)可以使用反式激活子和靶基因來構(gòu)建,其中反式激活子是多肽,其中所述多肽包含至少一個包含結(jié)合所述靶基因并誘導(dǎo)表達的本發(fā)明重復(fù)序列單元的重復(fù)序列結(jié)構(gòu)域。反式激活子和靶基因可以被引入一個細(xì)胞系,但也可以存在于不同細(xì)胞系并在稍后被漸滲。在進一步實施方案 中,疾病抗性植物可以通過在基因之前插入含有本發(fā)明多肽的重復(fù)序列結(jié)構(gòu)域的靶DNA序列來構(gòu)建,所述基因表達之后通過激活抗性介導(dǎo)基因而導(dǎo)致植物的防御反應(yīng)。[0177]在進一步實施方案中,定制DNA結(jié)合多肽可以通過重排重復(fù)序列單元類型來構(gòu)建,由此允許產(chǎn)生具有新型靶DAN結(jié)合特異性的重復(fù)序列結(jié)構(gòu)域。個體重復(fù)序列單元在DNA水平上幾乎相同,排除經(jīng)典克隆策略。本發(fā)明提供了裝配具有本發(fā)明重復(fù)序列結(jié)構(gòu)域的定制多肽的快速且廉價策略。為了提高此類多肽的克隆通用性,設(shè)計了兩步裝配方法。該方法用于裝配具有新型重復(fù)序列類型的多肽以研究其靶DNA識別和結(jié)合特異性。
      [0178]概括地,任何DNA序列可以被修飾以實現(xiàn)含有本發(fā)明多肽的重復(fù)序列結(jié)構(gòu)域的結(jié)合,通過將堿基對引入基因或基因控制元件的任何DNA區(qū)或特定區(qū)以特異性靶向具有包含重復(fù)序列單元的重復(fù)序列結(jié)構(gòu)域的多肽,所述重復(fù)序列單元將結(jié)合所述修飾的DNA序列以促進彼此的特異性識別和結(jié)合。
      [0179]本發(fā)明人已經(jīng)證明,真實的模塊式DNA識別且優(yōu)選結(jié)合多肽可被有效產(chǎn)生,其中所述多肽的結(jié)合基序是包含重復(fù)序列單元的重復(fù)序列結(jié)構(gòu)域,所述重復(fù)序列單元根據(jù)其對特定堿基對組合的識別能力來選擇。因此,本領(lǐng)域普通技術(shù)人員完全有能力設(shè)計能夠結(jié)合任何預(yù)期靶DNA序列的多肽,僅通過考慮靶DNA中存在的堿基對序列并以適當(dāng)順序組合作為具有與之結(jié)合的必要特征的結(jié)合基序的重復(fù)序列單元。靶DNA的已知序列長度越大,可包括在多肽中的模塊式重復(fù)序列單元的數(shù)目越大。例如,如果已知序列僅9個堿基長,則9個如上定義的重復(fù)序列單元可包括在多肽中。如果已知序列是27個堿基長,則達27個重復(fù)序列單元可包括在多肽中。靶DNA序列越長,其在基因組中其他位置DNA的任何其他給定部分中出現(xiàn)的概率越低。
      [0180]而且,被選擇包含在多肽中的那些重復(fù)序列單元可以被人工修飾以修飾其結(jié)合特征。可選地(或附加地),重復(fù)序列單元的長度和氨基酸序列可以改變,只要不影響其結(jié)合特征。
      [0181]一般而言,優(yōu)選地選擇對靶DNA序列具有高親和力和高特異性的那些重復(fù)序列單
      J Li ο
      [0182]如本文所述,效應(yīng)子可以被設(shè)計為識別任何適合的靶位點,以調(diào)控所選的任何內(nèi)源性基因的表達。適合調(diào)控的內(nèi)源性基因的實例包括VEGF、CCR5、ER.a.、Her2/Neu、Tat、Rev,HBV C、S、X和P、LDL-R、PEPCK、CYP7、血纖蛋白原、ApoB、Apo E、Apo (a)、腎素、NF-.κ.B、1-.k.B、TNF_.a.、FAS配體、淀粉樣蛋白前體蛋白、心房利鈉因子、ob-瘦蛋白、ucp-1、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-12、G-CSF, GM-CSF, Epo、PDGF、PAF、p53、Rb、胎兒血紅蛋白、營養(yǎng)不良蛋白、富養(yǎng)蛋白(eutrophin)、⑶NF、NGF、IGF-1、VEGF受體fit和flk、拓?fù)洚悩?gòu)酶、端麗末端轉(zhuǎn)移酶、bcl-2、細(xì)胞周期蛋白、制管張素、IGF、ICAM-1、STATS、c-myc、c-myb、TH、PT1-1、聚半乳糖醛酸酶、EPSP合酶、FAD2_1、A -12脫飽和酶、Λ _9脫飽和酶、Δ -15脫飽和酶、乙酰輔酶A羧化酶、?;?ACP-硫酯酶、ADP-葡萄糖焦磷酸化酶、淀粉合酶、纖維素合酶、蔗糖合酶、衰老相關(guān)基因、重金屬螯合劑、脂肪酸過氧化氫裂合酶、病毒基因、原蟲基因、真菌基因和細(xì)菌基因。一般而言,適合被調(diào)節(jié)的基因包括細(xì)胞因子、淋巴因子、生長因子、促有絲分裂因子、趨化因子、癌活性因子(onco-active factors)、受體、鉀通道、G蛋白、信號轉(zhuǎn)導(dǎo)分子、疾病抗性基因和其他疾病相關(guān)基因。
      [0183]另一方面,提供了調(diào)節(jié)靶基因在細(xì)胞中表達的方法。細(xì)胞可以優(yōu)選是植物細(xì)胞、人細(xì)胞、動物細(xì)胞、真菌細(xì)胞或任何其他活細(xì)胞。細(xì)胞含有多肽,其中所述多肽包含至少一個含有重復(fù)序列單元的重復(fù)序列結(jié)構(gòu)域,并且這些重復(fù)序列單元含有高變區(qū),并且每個重復(fù)序列單元負(fù)責(zé)識別所述靶DNA序列中一個堿基對。所述多肽作為編碼所述多肽的NDA被引入,或者所述多肽本身通過本領(lǐng)域已知的方法被引入。不論如何引入,多肽應(yīng)該包括至少一個特異性識別且優(yōu)選結(jié)合堿基對的靶DNA序列并且調(diào)節(jié)靶基因表達的重復(fù)序列結(jié)構(gòu)域。在優(yōu)選實施方案中,所有重復(fù)序列單兀含有決定祀DNA序列中喊基對的識別的聞變區(qū)。
      [0184]可以連接至本發(fā)明效應(yīng)子以促進效應(yīng)子攝取入細(xì)胞的肽序列的實例包括但不限于:HIV的tat蛋白的11氨基酸肽;對應(yīng)于pl6蛋白的氨基酸84-103的20殘基肽序列(參見Fahraeus等(1996) Current Biology6:84);控制觸角的基因的60-氨基酸長同源結(jié)構(gòu)域的第三螺旋(Derossi 等(1994) J.Biol.Chem.269:10444);信號肽的 h 區(qū),例如 Kaposi成纖維細(xì)胞生長因子(K-FGF) h區(qū);或來自HSV的VP22轉(zhuǎn)位結(jié)構(gòu)域(Elliot&0’ Hare (1997)Cell88:223233)。提供增強的細(xì)胞攝取的其他適合的化學(xué)部分也可以與效應(yīng)子化學(xué)連接。
      [0185]毒素分子還具有跨細(xì)胞膜運輸多肽的能力。經(jīng)常,此類分子包含至少兩個部分(所謂的“二元毒素”):轉(zhuǎn)位或結(jié)合結(jié)構(gòu)域或多肽和單獨毒素結(jié)構(gòu)域或多肽。通常,轉(zhuǎn)位結(jié)構(gòu)域或多肽結(jié)合細(xì)胞受體,然后毒素被運輸入細(xì)胞。幾種細(xì)菌毒素已經(jīng)被用于嘗試遞送作為內(nèi)部或氨基末端融合體的多肽至細(xì)胞質(zhì),所述細(xì)菌毒素包括梭狀芽胞桿菌產(chǎn)氣莢膜桿菌iota毒素、白喉毒素(DT)、假單胞菌外毒素A(PE)、百日咳毒素(PT)、炭疽桿菌毒素和百日咳腺苷酸環(huán)化酶(CYA) (Arora等(1993) J.Biol.Chem.268:33343341 ;PerelIe 等(1993)Infect.1mmun.61:51475156(1993) ;Stenmark 等(1991)J.CellBiol.113:10251032(1991) ;Donnelly 等(1993)Proc.Natl.Acad.Sc1.USA90:35303534 ;Carbonetti 等(1995)Abstr.Annu.Meet.Am.Soc.Microbiol.95:295 ;Sebo 等(1995)Infect.1mmun.63:38513857 ;Klimpel 等(1992)Proc.Natl.Acad.Sc1.USA89:1027710281 ;和 Novak 等(1992)J.Biol.Chem.267:1718617193)。
      [0186]效應(yīng)子也可以被引入動物細(xì)胞,優(yōu)選哺乳動物細(xì)胞,經(jīng)由脂質(zhì)體和脂質(zhì)體衍生物,例如免疫脂質(zhì)體。術(shù)語“ 脂質(zhì)體”指包含一個或多個包封水相的同心有序脂質(zhì)雙層的載體。在該效應(yīng)子情況下,水相通常含有被遞送至細(xì)胞的化合物。脂質(zhì)體與質(zhì)膜融合,從而釋放效應(yīng)子進入胞質(zhì)??蛇x地,脂質(zhì)體在運輸載體中被細(xì)胞吞噬或攝取。一旦進入核內(nèi)體或吞噬體,脂質(zhì)體降解或與運輸載體的膜融合并釋放其內(nèi)含物。
      [0187]本發(fā)明特別涉及植物和農(nóng)業(yè)【技術(shù)領(lǐng)域】。一方面,本發(fā)明涉及調(diào)節(jié)靶基因在植物細(xì)胞中表達的方法,所述方法包括提供具有根據(jù)本發(fā)明修飾的多肽的植物細(xì)胞,所述多肽能夠特異性識別靶基因內(nèi)的靶核苷酸序列或其互補鏈,并允許所述多肽識別并特異性結(jié)合所述靶核苷酸序列,從而調(diào)節(jié)所述靶基因在所述靶植物細(xì)胞中的表達。
      [0188]可以通過本領(lǐng)域已知的任何適當(dāng)方法將多肽提供至植物細(xì)胞。例如,蛋白可以被外源添加至植物細(xì)胞,并且植物細(xì)胞被保持在使得多肽被引入植物細(xì)胞、結(jié)合靶核苷酸序列并調(diào)節(jié)靶基因在植物細(xì)胞中表達的條件下??蛇x地,編碼多肽的核苷酸序列例如DNA或RNA可以在植物細(xì)胞中表達,并且植物細(xì)胞被保持在使得表達的多肽結(jié)合靶核苷酸序列并調(diào)節(jié)靶基因在植物細(xì)胞中表達的條件下。
      [0189]調(diào)節(jié)靶基因在植物細(xì)胞中表達的優(yōu)選方法包括如下步驟:a)提供具有根據(jù)本發(fā)明修飾的多肽的表達系統(tǒng)的植物細(xì)胞,所述多肽能夠特異性識別并優(yōu)選結(jié)合靶基因的表達控制元件、優(yōu)選啟動子中的靶核苷酸序列或其互補鏈;和《在其中所述多肽被產(chǎn)生并結(jié)合至所述靶核苷酸序列的條件下培養(yǎng)所述植物細(xì)胞,從而調(diào)節(jié)所述靶基因在所述植物細(xì)胞中的表達。
      [0190]任何靶核苷酸序列可以通過本發(fā)明方法調(diào)節(jié)。例如,靶核苷酸序列對于靶基因而言可以是內(nèi)源的或外源的。在本發(fā)明的實施方案中,靶核苷酸序列可以存在于活細(xì)胞中或在體外存在。在具體實施方案中,靶核苷酸序列對于植物而言是內(nèi)源的。靶核苷酸序列可以位于與靶基因相關(guān)的任何適當(dāng)位置。例如,靶核苷酸序列可以在靶基因編碼區(qū)的上游或下游??蛇x地,靶核苷酸序列在靶基因的編碼區(qū)內(nèi)。優(yōu)選地,靶核苷酸序列是基因的啟動子。
      [0191]任何靶基因可以通過本發(fā)明方法調(diào)節(jié)。例如,靶基因可以編碼影響肽、蛋白、寡核苷酸、核酸、微生物、寡糖、碳水化合物、脂質(zhì)或小分子的生物合成、修飾、細(xì)胞運輸、代謝和降解的產(chǎn)物。而且,效應(yīng)子可用于根據(jù)性狀來工程改造植物,所述性狀例如增加的疾病抗性、結(jié)構(gòu)和貯存多糖、風(fēng)味、蛋白和脂肪酸的修飾、果實成熟、產(chǎn)量、顏色、營養(yǎng)特征、提高的
      存能力等。
      [0192]因此,本發(fā)明提供了改變關(guān)注的基因在靶細(xì)胞中表達的方法,包括:測定(如果必要)關(guān)注基因的結(jié)構(gòu)區(qū)和/或調(diào)控區(qū)的DNA序列的至少一部分;設(shè)計包括根據(jù)本發(fā)明修飾的重復(fù)序列單元的多肽以識別已知序列的DNA的特定堿基對,并導(dǎo)致所修飾的多肽存在于靶細(xì)胞中(優(yōu)選在其細(xì)胞核中)。(顯然,如果已經(jīng)知道DNA序列,則不需要測定)。
      [0193]調(diào)控區(qū)可以距離關(guān)注基因的結(jié)構(gòu)區(qū)很遠(例如遠端增強子序列或相似的)。
      [0194]此外,多肽可以有利地包括來自其他蛋白的功能結(jié)構(gòu)域(例如來自限制內(nèi)切核酸酶、重組酶、復(fù)制酶、整合 酶等的催化結(jié)構(gòu)域)或甚至“合成”效應(yīng)子結(jié)構(gòu)域。多肽還可以包括激活或加工信號,例如核 定位信號。這在靶向多肽至細(xì)胞核來說是特別有用的,以增強多肽與細(xì)胞核內(nèi)靶(例如基因組DNA)的結(jié)合。
      [0195]由于知道多肽表達的DNA被遞送至細(xì)胞,修飾的多肽可以在細(xì)胞中原位合成。促進DNA遞送的方法是本領(lǐng)域技術(shù)人員公知的,并且包括例如重組病毒載體(例如,逆轉(zhuǎn)錄病毒、腺病毒)、脂質(zhì)體等??蛇x地,修飾的多肽可以在細(xì)胞外制備,然后遞送至其中。遞送可以通過將多肽加入脂質(zhì)體等來促進,或者通過將多肽連接至靶向部分(例如抗體或激素分子的結(jié)合部分、膜過渡結(jié)構(gòu)域、或真菌或卵菌效應(yīng)子的轉(zhuǎn)位結(jié)構(gòu)域、或細(xì)菌毒素的經(jīng)典A-B家族的細(xì)胞結(jié)合B結(jié)構(gòu)域)來促進。實際上,本發(fā)明修飾蛋白在控制基因表達中的一個顯著優(yōu)點是無載體遞送蛋白至靶細(xì)胞。
      [0196]據(jù)本發(fā)明人所知,之前從未說明含有能夠特異性識別靶DNA序列中堿基對的修飾重復(fù)序列單元的多肽的設(shè)計及其在基因表達調(diào)節(jié)中的成功使用(如本文所述)。因此,本文公開的本發(fā)明的突破提供了超越在植物中使用的可能性。在本發(fā)明的一個實施方案中,效應(yīng)子多肽被設(shè)計為治療性和/或預(yù)防性用于調(diào)控疾病相關(guān)基因的表達。例如,所述多肽可以用于抑制外源基因(例如細(xì)菌或病毒病原體的基因)在人、其他動物或植物中的表達,或修飾突變宿主基因(例如癌基因)的表達。
      [0197]因此,本發(fā)明還提供了能夠抑制疾病相關(guān)基因表達的效應(yīng)多肽。通常,所述多肽不是天然存在的多肽,但是會被特別設(shè)計為抑制疾病相關(guān)基因的表達。方便地,效應(yīng)多肽將通過本發(fā)明的任何方法來設(shè)計。
      [0198]本發(fā)明還涉及基因組工程領(lǐng)域。效應(yīng)多肽可以根據(jù)本發(fā)明產(chǎn)生為靶向基因組中特定的DNA序列。所述多肽可以被修飾以含有指導(dǎo)靶DNA序列修飾(例如靶序列的位點特異性重組或整合)的活性。該方法實現(xiàn)了復(fù)雜基因組中的靶向DNA修飾。[0199]在本發(fā)明更進一步的實施方案中,提供了被修飾以包括至少一個包含重復(fù)序列單元的重復(fù)序列結(jié)構(gòu)域的多肽,所述重復(fù)序列單元具有用于決定DNA序列中堿基對的選擇性識別的高變區(qū)。
      [0200]在優(yōu)選實施方案中,多肽在所述重復(fù)序列單元包括從下述組選擇的高變區(qū)以決定下述堿基對之一的識別:
      [0201]?識別 CA^AHD
      [0202]?識別 A/T 的 NI
      [0203]?識別 T/A 的 NG
      [0204].識別 C/G 或 A/T 或 T/A 或 G/C 的 NS
      [0205]?識別 G/C 或 A/T 的 NN
      [0206]?識別 T/A 的 IG
      [0207]?識別 C/G 或 T/A 的 HG
      [0208]?識別 T/A 的 HG
      [0209]?識別 T/A 的 H
      [0210]?識別 G/C 的 NK
      [0211]本發(fā)明還包括編碼前述多肽任何一個的DNA。
      [0212]在更進一步的實施方案中,提供了被修飾為包括位于靶DNA序列中的堿基對而使得所述堿基對可以被包括至少一個包含重復(fù)序列單元的重復(fù)序列結(jié)構(gòu)域的多肽特異性識別的DNA,所述重復(fù)序列單元具有決定所述DNA中所述堿基對的識別的高變區(qū)。在一個任選實施方案中,所述堿基對位于基因表達控制序列。由于重復(fù)序列結(jié)構(gòu)域的模塊式裝配,堿基對序列可以被所述重復(fù)序列結(jié)構(gòu)域特異性靶向。
      [0213]在本發(fā)明的一個可選實施方案中,所述DNA被選自以下組的堿基對修飾以接受被下述高變區(qū)之一選擇性且確定的識別:
      [0214]?供HD識別的C/G
      [0215]?供NI識別的A/T
      [0216]?供NG識別的T/A
      [0217]?供NS識別的CT或A/T或T/A或G/C
      [0218].供NN識別的G/C或A/T
      [0219]?供IG識別的T/A
      [0220]?供N識別的C/G或T/A
      [0221]?供HG識別的T/A
      [0222]?供H識別的T/A
      [0223].供NK識別的G/C
      [0224]而本發(fā)明另一方面提供了通過將之結(jié)合根據(jù)本發(fā)明的多肽來修飾樣品混合物中存在的關(guān)注的核酸序列的方法,包括使樣品混合物與對關(guān)注的序列的至少一部分具有親和力的所述多肽接觸,以允許所述多肽識別并優(yōu)選特異性結(jié)合關(guān)注的序列。
      [0225]本文使用的術(shù)語“修飾”預(yù)期表示序列被考慮僅通過結(jié)合多肽而被修飾。這不是要表明核苷酸序列被改變,盡管這種改變(和其他)可以保證隨后多肽與關(guān)注核酸的結(jié)合。方便地,核酸序列是DNA。[0226]關(guān)注的核酸的修飾(在結(jié)合被修飾以含有模塊式重復(fù)序列單元的多肽的意義上)可以許多方法的任何一種(例如,凝膠遷移率變動分析,標(biāo)記多肽的使用-標(biāo)記可以包括放射性標(biāo)記、熒光標(biāo)記、酶標(biāo)記或生物素/鏈霉親和素標(biāo)記)來檢測。
      [0227]關(guān)注的核酸序列的修飾(及其檢測)可以是需要的所有(例如,在疾病診斷中)。然而希望進行樣品的進一步加工。方便地,多肽(和與之特異性結(jié)合的核酸序列)與樣品的其余部分分離。有利地,多肽-DNA復(fù)合物被結(jié)合至固相支持體,以促進這種分離。例如,多肽可以存在于丙烯酰胺或瓊脂糖凝膠基質(zhì),或更優(yōu)選地固定在膜表面上或微量滴定板的孔中。
      [0228]在本發(fā)明的一個實施方案中,所述包含重復(fù)序列單元的重復(fù)序列結(jié)構(gòu)域被插入細(xì)菌、病毒、真菌、卵菌、人、動物或植物多肽以實現(xiàn)靶向識別并優(yōu)選地結(jié)合DNA序列中一個或多個指定的堿基對,并任選地其中所述重復(fù)序列單元取自AvrBs3樣蛋白家族的重復(fù)序列結(jié)構(gòu)域,其還任選地被修飾以獲得預(yù)選的對DNA序列中一個或多個堿基對的特異性結(jié)合活性。
      [0229]本發(fā)明涵蓋分離的或基本上純化的多肽或蛋白組合物。“分離的”或“純化的”多核苷酸或蛋白或其生物活性部分基本上或?qū)嵸|(zhì)上不含正常伴隨其天然存在環(huán)境中存在的多核苷酸或蛋白或與之相互作用的組分。因此,分離的或純化的多核苷酸或蛋白當(dāng)通過重組技術(shù)制備時基本上不含其他細(xì)胞材料或培養(yǎng)基,或者當(dāng)化學(xué)合成時基本上不含化學(xué)前體或其他化學(xué)物。最佳地,“分離的”多核苷酸不含正常在衍生多核苷酸的生物的基因組DNA中多核苷酸側(cè)翼(即,位于多核苷酸的5’和3’端的序列)的序列(最佳地蛋白編碼序列)。例如,在各種實施方案中,分離的多核苷酸可以含有正常在衍生多核苷酸的細(xì)胞的基因組DNA中多核苷酸側(cè)翼的小于約5kb、4kb、3kb、2kb、lkb、0.5kb或0.1kb的核苷酸序列?;旧喜缓?xì)胞材 料的蛋白包括具有小于約30%、20%、10%、5%或1% (以干重計)污染蛋白的蛋白制品。當(dāng)本發(fā)明蛋白或其生物活性部分被重組制備時,最佳培養(yǎng)基表現(xiàn)小于約30%、
      或1% (以干重計)的化學(xué)前體或非關(guān)注蛋白化學(xué)物。
      [0230]本發(fā)明還涵蓋所公開的DNA序列和由其編碼的蛋白的片段和變體?!捌巍币鉃镈NA序列的一部分和由其編碼的氨基酸序列和蛋白的一部分。包含編碼序列的DNA序列的片段可以編碼保留天然蛋白的生物活性和由此對本文所述靶DNA序列的DNA識別或結(jié)合活性的蛋白片段??蛇x地,用作雜交探針的DNA序列的片段一般不編碼保留生物活性或不保留啟動子活性的蛋白。因此,DNA序列的片段可以是至少約20個核苷酸、約50個核苷酸、約100個核苷酸和最多全長的本發(fā)明多核苷酸。
      [0231]“變體”預(yù)期表示基本相似的序列。對于DNA序列,變體包括在5’和/或3’端具有缺失(即,截短);在天然多核苷酸的一個或多個內(nèi)部位點的一個或多個核苷酸的缺失和/或添加;和/或在天然多核苷酸的一個或多個位點的一個或多個核苷酸的取代的DNA序列。如本文使用的,“天然’DNA序列或多肽分別包括天然存在的DNA序列或氨基酸序列。對于DNA序列,保守變體包括因為遺傳密碼的簡并性而編碼本發(fā)明多肽之一的氨基酸序列的那些序列。變體DNA序列還包括合成衍生的DNA序列,例如通過使用定點誘變產(chǎn)生但依然編碼本發(fā)明蛋白的那些。一般而言,本發(fā)明特定DNA序列的變體將與該特定多核苷酸具有至少約 70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^;更大序列同一性,通過序列比對程序和本文其他地方描述的參數(shù)來測定。[0232]本發(fā)明特定DNA序列(即,參考DNA序列)的變體還可以通過比較變體DNA序列編碼的多肽與參考DNA序列編碼的多肽之間的百分比序列同一性來評價。任何兩個多肽之間的百分比序列同一性可以使用序列比對程序和本文其他地方描述的參數(shù)來計算。當(dāng)通過比較任何給定的一對本發(fā)明多核苷酸編碼的兩個多肽所共享的百分比序列同一性來評價任何給定的一對本發(fā)明多核苷酸時,兩個編碼多肽之間的百分比序列同一性是至少約70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或更大序列同一'I"生。
      [0233]“變體”蛋白預(yù)期表示通過在天然蛋白N端和/或C端缺失(所謂的截短)一個或多個氨基酸;在天然蛋白的一個或多個內(nèi)部位點缺失和/添加一個或多個氨基酸;或在天然蛋白的一個或多個位點取代一個或多個氨基酸而從天然蛋白衍生的蛋白。本發(fā)明涵蓋的變體蛋白是生物活性的,即,它們依然具有本文所述天然蛋白的預(yù)期生物活性。此類變體可以源自例如遺傳多態(tài)性或人工操作。本發(fā)明蛋白的生物活性變體與天然蛋白的氨基酸序列具有至少約 70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99 %或更大序列同一性,通過序列比對程序和本文其他地方描述的參數(shù)來測定。本發(fā)明蛋白的生物活性變體可以與該蛋白相差僅1-15個氨基酸殘基、僅1-10個例如6-10個氨基酸殘基、僅5個氨基酸殘基、僅4、3、2或甚至I個氨基酸殘基。
      [0234]本發(fā)明蛋白可以各種方式改變,包括氨基酸取代、缺失、截短和插入。此類操作的方法是本領(lǐng)域公知的。例如,蛋白的氨基酸序列變體和片段可以通過DNA突變來制備。用于誘變和多核苷酸改變的方法是本領(lǐng)域公知的。參見,例如Kunkel (1985)Proc.Natl.Acad.Sc1.USA82:488-492 ;Kunkel 等(1987)Methods in Enzymol.154:367-382 ;美國專利號 4,873,192 ;ffalker and Gaastra, eds.(1983)Techniques in MolecularBiology (MacMillan Publishing Company, New York)和其中引用的參考文獻。有關(guān)不影響關(guān)注蛋白生物活性的適當(dāng)氨基酸取代的指導(dǎo)可參見Dayhoff等(1978)Atlas of ProteinSequence and Structure (Natl.Biomed.Res.Found., Washington, D.C.)的模型,在此通過引用并入。保守取代,例如用具有相似性質(zhì)的另一氨基酸交換一個氨基酸可能是最佳的。
      [0235]本文涵蓋的蛋白序列的缺失、插入和取代不預(yù)期產(chǎn)生蛋白特征的根本改變。然而,當(dāng)難以預(yù)測在此之前取代、缺失或插入的確切影響時,本領(lǐng)域技術(shù)人員將理解,所述影響會通過本文其他地方所述的或本領(lǐng)域已知的常規(guī)篩選測定來評價。
      [0236]變體DNA序列和蛋白也涵蓋從誘變和重組基因程序例如DNA改組衍生的序列和蛋白。所述DNA改組是本領(lǐng)域已知的。參見例如Stemmer (1994)Proc.Natl.Acad.Sc1.USA91:10747-10751 ;Stemmer(1994)Nature370:389-391 ;Crameri 等(1997)NatureBiotech.15:436-438 ;Moore 等(1997)J.Mol.Biol.272:336-347 ;Zhang 等(1997)Proc.Natl.Acad.Sc1.USA94:4504-4509 ;Crameri 等(1998)Nature391:288-291 ;和美國專利號5,605,793 和 5,837,458。
      [0237]在PCR方法中,寡核苷酸引物可以被設(shè)計用于PCR反應(yīng)以從任何關(guān)注生物提取的cDNA或基因組DNA擴增相應(yīng)的DNA序列。設(shè)計PCR弓丨物和PCR克隆的方法是本領(lǐng)域公知的,并且公開于 Sambrook 等(1989)Molecular Cloning:A Laboratory Manual (2d ed., ColdSpring Harbor Laboratory Press, Plainview, New York)。還參見 Innis 等,eds.(1990)PCR Protocols:A Guide to Methods and Applications(Academic Press, New York);Innis and Gelfand, eds.(1995)PCR Strategies(Academic Press, New York);和 Innisand Gelfand, eds.(1999) PCR Methods Manual (Academic Press, New York)。已知的 PCR方法包括但不限于使用成對引物、嵌套引物、單特異性引物、簡并引物、基因特異性引物、載體特異性引物、部分錯配引物等的方法。
      [0238]在雜交技術(shù)中,已知多核苷酸的全部或部分用作與來自所選生物的克隆的基因組DNA片段或cDNA片段群體(B卩,基因組或cDNA文庫)中存在的其他相應(yīng)多核苷酸選擇性雜交的探針。雜交探針可以是基因組DNA片段、cDNA片段、RNA片段或其他寡核苷酸,并且可以用可檢測基團標(biāo)記,所述可檢測基團例如32P或任何其他可檢測標(biāo)志物。因此,例如,雜交探針可以通過基于本發(fā)明的DNA序列來標(biāo)記合成寡核苷酸而制備。用于制備用于雜交和用于構(gòu)建cDNA和基因組文庫的探針的方法是本領(lǐng)域公知的并且公開于Sambrook等(1989)Molecular Cloning:A Laboratory Manual(2d ed., Cold Spring Harbor LaboratoryPress, Plainview, New York)。
      [0239]此類序列的雜交可以在嚴(yán)格條件下進行。“嚴(yán)格條件”或“嚴(yán)格雜交條件”是探針將以比其他序列可檢測更大的程度雜交其靶序列(例如,至少2倍超過背景)的預(yù)期條件。嚴(yán)格條件是序列依賴性的并且將在不同環(huán)境中不同。通過控制雜交和/或洗滌條件的嚴(yán)格性,與探針100%互補的靶序列可以被鑒定(同源探測)??蛇x地,嚴(yán)格條件可以被調(diào)整以允許序列中的一些錯配,使得更低的相似性程度被檢測(異源探測)。一般,探針長度小于約1000個核苷酸,最佳長度小于500個核苷酸。
      [0240]通常,嚴(yán)格條件是其中鹽濃度在pH7.0至8.3下小于約1.5M Na離子、通常約0.01至1.0M Na離子濃度(或其他鹽)并且溫度對于短探針(例如10至50個核苷酸)為至少約30°C和對于長探 針(例如大于50個核苷酸)為至少約60°C的那些條件。嚴(yán)格條件還可以通過添加去穩(wěn)定劑例如甲酰胺來獲得。示例性低嚴(yán)格條件包括用30至35%甲酰胺、IMNaClU % SDS (十二烷基硫酸鈉)的緩沖溶液在37°C雜交,并用IX至2X SSC(20X SSC =
      3.0M NaCl/0.3M檸檬酸三鈉)在50至55°C洗滌。示例性中等嚴(yán)格條件包括在40至45%甲酰胺、1.0M NaClU % SDS中在37°C下雜交,并在0.5X至IX SSC中55至60°C下洗滌。示例性高嚴(yán)格條件包括在50%甲酰胺、IM NaClU% SDS中37°C下雜交,并在0.1X SSC中60至65°C下洗滌。任選地,洗滌緩沖液可以包含約0.1%至約1% SDS。雜交持續(xù)時間一般小于約24小時,通常約4至約12小時。洗滌持續(xù)時間將是至少足以達到平衡的時間。
      [0241]特異性通常是雜交后洗滌的函數(shù),關(guān)鍵因素是離子強度和最終洗滌溶液的溫度。對于 DNA-DNA 雜交體,T111 可以根據(jù) Meinkoth 和 Wahl (1984) Anal.Biochem.138:267-284 的方程=Tm = 81.5 0C +16.6 (log Μ) +0.41(% GC) _0.61 ( % 形式)-500/L 來估計;其中 M 是單價陽離子的摩爾濃度,% GC是DNA中鳥嘌呤核苷和胞嘧啶核苷酸的百分比,%形式是雜交溶液中甲酰胺的百分比,并且L是雜交體的堿基對長度。Tm是50%互補靶序列與優(yōu)選匹配探針雜交的溫度(確定的離子強度和PH下)。Tm因每I %錯配而降低約1°C ;因此,Tm、雜交和/或洗滌條件可以被調(diào)節(jié)以雜交預(yù)期同一性的序列。例如,如果尋找具有≥90%同一性的序列,^可以降低10°C。一般而言,在確定的離子強度和pH下,嚴(yán)格條件被選擇為特定序列及其互補體的熱熔點(Tm)之下約5°C。然而,高嚴(yán)格條件可以利用在熱熔點(Tm)之下1、2、3或4°C下雜交和/或洗滌;中嚴(yán)格條件可以利用在熱熔點(Tm)之下6、7、8、9或10°C下雜交和/或洗滌;低嚴(yán)格條件可以利用在熱熔點(Tm)之下11、12、13、14、15或20°C下雜交和/或洗滌。使用方程、雜交和洗滌組合物和預(yù)期Tm,普通技術(shù)人員將理解,雜交和/或洗滌溶液的嚴(yán)格性的變化被固有地描述。如果預(yù)期錯配程度導(dǎo)致小于45°C (水溶液)或32°C (甲酰胺溶液)的Tm,增加SSC濃度以便可以使用更高的溫度是最佳的。對核酸雜交的全面指導(dǎo)參見Tijssen(1993)Laboratory Techniques inBiochemistry and Molecular Biology—Hybridization with Nucleic Acid Probes, PartI, Chapter2(Elsevier,New York);和 Ausubel 等,eds.(1995)Current Protocols inMolecular Biology, Chapter2 (Greene Publishing and ffiley-1nterscience, New York)。參見 Sambrook 等(1989)Molecular Cloning:A Laboratory Manual (2ded., Cold SpringHarbor Laboratory Press,Plainview, New York)。
      [0242]認(rèn)為本發(fā)明DNA序列和蛋白涵蓋多核苷酸分子和蛋白,包含與本文公開的DNA序列或氨基酸序列足夠同一性的核苷酸或氨基酸序列。本文使用的術(shù)語“足夠同一性”指含有含有足夠或最小數(shù)目的與第二氨基酸或核苷酸序列相同或等同(例如,具有相似側(cè)鏈)的氨基酸殘基或核苷酸的第一氨基酸或核苷酸序列,使得第一氨基酸或核苷酸序列與第二氨基酸或核苷酸序列具有共同的結(jié)構(gòu)域和/或共同的功能活性。例如,含有具有至少約70%同一性、優(yōu)選75%同一性、更優(yōu)選85%、90%、95%、96%、97%、98%或99%同一性的共同結(jié)構(gòu)域的氨基酸或核苷酸序列在本文定義為足夠同一性的。
      [0243]為了測定兩個氨基酸序列或兩個核酸的百分比同一性,為最佳比較目的來比對序列。兩個序列之間的百分比同一性是序列共有的相同位置數(shù)目的函數(shù)(即,百分比同一性=相同位置數(shù)目/位置總數(shù)(例如,重疊位置)x100)。在一個實施方案中,兩個序列是相同長度的。兩個序列之間的百分比同一性可以使用類似于下文描述的那些技術(shù),允許或不允許空位。在計算百分比同一性時,通常技術(shù)確切匹配。
      [0244]兩個序列之間百分比同一性的確定可以使用數(shù)學(xué)算法來實現(xiàn)。用于比較兩個序列的數(shù)學(xué)算法的非限制性實例是Karlin和Altschul (1990) Proc.Natl.Acad.Sc1.USA87:2264 的算法,在 Karlin 和 Altschul (1993) Proc.Natl.Acad.Sc1.USA90:5873-5877中修改。這種算法被整合入 Altschul 等(1990) J.Mol.Biol.215:403 的 NBLAST 和 XBLAST程序。BLAST核苷酸檢索可以用NBLAST程序來進行,評分=100,字長=12,以獲得與本發(fā)明多核苷酸分子同源的核苷酸序列。BLAST蛋白檢索可以用XBLAST程序進行,評分=50,字長=3,以獲得與本發(fā)明蛋白分子同源的氨基酸序列。為了獲得比較目的的空位比對,可利用Altschul 等(1997)Nucleic Acids Res.25:3389 所述的空位 BLAST??蛇x地,PS1-Blast 可用于進行檢測分子間遠緣關(guān)系的迭代檢索。參見Altschul等(1997),同上。當(dāng)使用BLAST、空位BLAST和PS1-Blast程序時,可以使用各自程序(例如XBLAST和NBLAST)的缺省參數(shù)。參見http://www.ncb1.nlm.nih.gov。用于序列比較的數(shù)學(xué)算法的非限制性實例是Myers和Miller (1988) CAB10S4:11-17的算法。這種算法被整合入ALIGN程序(版本2.0),它是GCG序列比對軟件包的一部分。當(dāng)利用ALIGN程序比較氨基酸序列時,可以使用PAM120權(quán)重殘基表、空位長度罰分12和空位罰分4。比對還可以通過檢查人工進行。
      [0245] 除非另外說明,本文提供的序列同一性/相似性值指使用全長的本發(fā)明序列并使用借助算法 Clustal KNucleic Acid Research, 22 (22): 4673-4680,1994)的多重比對獲得的值,使用軟件包 Clustal W(Nucleic Acid Research, 22 (22): 4673-4680,1994)中包括的程序AlignX或其等同程序,使用缺省參數(shù)?!暗韧绦颉笔穷A(yù)期的任何序列比對程序,對于任何兩個所涉及的序列,所述程序產(chǎn)生的比對與使用缺省參數(shù)的CLUSTALW(版本1.83)(可獲自 European Bioinformatics Institute website:http://www.eb1.ac.uk/Tools/clustalw/index, html)產(chǎn)生的相應(yīng)比對相比具有相同的核苷酸或氨基酸殘基匹配和相同的百分比序列同一性。
      [0246]本發(fā)明DNA序列可以提供在表達盒中以在任何原核或真核細(xì)胞和/或關(guān)注生物中表達,包括但不限于細(xì)菌、真菌、藻類、植物和動物。這些盒將包括與本發(fā)明DNA序列可操作連接的5’和3’調(diào)控序列?!翱刹僮鬟B接”預(yù)期表示兩個或多個元件之間的功能性鍵合。例如,關(guān)注的多核苷酸或基因和調(diào)控序列(即,啟動子)之間的可操作連接是允許關(guān)注的多核苷酸表達的功能性連接??刹僮鬟B接的元件可以是連續(xù)的或非連續(xù)的。當(dāng)用于指兩個蛋白編碼區(qū)的結(jié)合時,可操作連接預(yù)期編碼區(qū)在相同閱讀框內(nèi)。盒可以還含有待共轉(zhuǎn)化入生物的至少一個附加基因??蛇x地,附加基因可以提供在多表達盒上。此類表達盒與用于插入在調(diào)控區(qū)的轉(zhuǎn)錄調(diào)控下的DNA序列的多個限制位點和/或重組位點一起提供。表達盒可以額外含有選擇性標(biāo)記基因。
      [0247]表達盒將以5’-3’轉(zhuǎn)錄方向包括植物或其他生物或非人宿主細(xì)胞中功能性的轉(zhuǎn)錄和翻譯起始區(qū)(即,啟動子)、本發(fā)明的DNA序列和轉(zhuǎn)錄和翻譯終止區(qū)(即,終止區(qū))。調(diào)控區(qū)(即,啟動子、轉(zhuǎn)錄調(diào)控區(qū)和翻譯終止區(qū))和/或本發(fā)明DNA序列對于宿主細(xì)胞和彼此來說可以是天然的/類似的??蛇x地,調(diào)控區(qū)和/或本發(fā)明的DNA序列對于宿主細(xì)胞或彼此來說可以是異源的。如本文使用的,關(guān)于序列的“異源的”是起源于外來物種的序列,或者如果起源于相同物種則是通過有意的人為介入而在組成和/或基因組座位上與其天然形式明顯不同的序列。例如,可操作連接至異源多核苷酸的啟動子來自不同于該多核苷酸起源的物種的物種,或者如果來自相同/類似物種則明顯不同于其最初形式和/或基因組座位,或者啟動子不是可操作連接的多核苷酸的天然啟動子。如本文使用的,嵌合基因包括與編碼序列異源的轉(zhuǎn)錄起始區(qū)可操作連接的編碼序列。
      [0248]終止區(qū)對于轉(zhuǎn)錄起始區(qū)可以是天然的,對于可操作連接的關(guān)注DNA序列可以是天然的,對于宿主可以是天然的,或者可以衍生自另一來源(即,外來的或異源的)對啟動子、關(guān)注的DNA序列、植物宿主或其任意組合。用于植物的適宜終止區(qū)可獲自農(nóng)桿菌的Ti質(zhì)粒,例如章魚氨酸合酶和胭脂氨酸合酶終止區(qū)。還參見Guerineau等(1991)Mol.Gen.Genet.262:141-144 ;Proudfoot(1991)Cell64:671-674 ;Sanfacon 等(1991)Genes Dev.5:141-149 ;Mogen 等(1990)Plant Cel12:1261-1272 ;Munroe 等(1990)Gene91:151-158 ;Ballas等(1989)Nucleic Acids Res.17:7891-7903 ;和 Joshi 等(1987)Nucleic Acids Res.15:9627-9639。
      [0249]適當(dāng)時,多核苷酸可以被優(yōu)化以增加在轉(zhuǎn)化生物中的表達。即,多核苷酸可以使用宿主偏好的密碼子來合成以提高表達。參見例如Campbell和Gowri (1990)PlantPhysiol.92:1-11,關(guān)于宿主偏好密碼子使用的討論。用于合成宿主偏好基因、特別是植物偏好基因的方法是本領(lǐng)域可獲得的。參見例如美國專利號5,380,831和5,436,391,和Murray 等(1989)Nucleic Acids Res.17:477-498,在此通過引用并入。
      [0250]已知其他氨基酸修飾增強在細(xì)胞宿主中的基因表達。這些包括編碼假聚腺苷酸化信號、外顯子-內(nèi)含子剪接位點信號、轉(zhuǎn)座子樣重復(fù)序列和其他此類完全鑒定序列的序列的消除不利于基因表達。序列的G-C含量可以被調(diào)節(jié)至給定細(xì)胞宿主的平均水平,參考在宿主細(xì)胞中表達的已知基因來計算。當(dāng)可能時,序列被修飾以避免預(yù)測的發(fā)夾結(jié)構(gòu)二級mRNA結(jié)構(gòu)。
      [0251]表達盒還可以含有5’前導(dǎo)序列。此類前導(dǎo)序列可以作用以增強翻譯。翻譯前導(dǎo)序列是本領(lǐng)域已知的并且包括:小RNA病毒前導(dǎo)序列,例如EMCV前導(dǎo)序列(腦心肌炎 5’ 非編碼區(qū))(Elroy-Stein 等(1989) Proc.Natl.Acad.Sc1.USA86:6126-6130);馬鈴薯Y病毒組前導(dǎo)序列,例如TEV前導(dǎo)序列(煙草蝕刻病毒)(GalIie等(1995)Genel65 (2):233-238)、MDMV前導(dǎo)序列(玉米矮花葉病毒)(Virologyl54:9_20)和人免疫球蛋白重鏈結(jié)合蛋白(BiP) (Macejak等(1991)Nature353:90_94);來自苜?;ㄈ~病毒外殼蛋白 mRNA 的未翻譯的前導(dǎo)序列(AMV RNA4) (Jobling 等(1987)Nature325:622-625);煙草花葉病毒前導(dǎo)序列(TMV) (Gallie 等(1989), Molecular Biology of RNA, ed.Cech (Liss, New York),pp.237-256);和玉米萎黃病毒前導(dǎo)序列(MCMV) (Lommel 等(1991)Virology81:382-385)。還參見 Della-Cioppa 等(1987)Plant Physiol.84:965-968。
      [0252]在制備表達盒時,各種DNA片段可以被操縱,以提供適當(dāng)方向并且適當(dāng)時在正確閱讀框內(nèi)的DNA序列。為此目的,適體或連接體可以被用來連接DNA片段,或者其他操縱可以被包括以提供適宜的限制位點、去除多余DNA、去除限制位點等。為此目的,體外誘變、弓丨物修復(fù)、限制、退火、再取代例如轉(zhuǎn)換和顛換可以被包括。
      [0253]許多啟動子可用于實施本發(fā)明。啟動子可以根據(jù)關(guān)注的宿主和預(yù)期結(jié)果來選擇。核酸可以與組成型、組織偏好的或用于在植物中表達的其他啟動子組合。此類組成型啟動子包括例如核心CaMV35S啟動子(Odell等(1985)Nature313:810-812);水稻肌動蛋白(McElroy 等(1990)Plant Cell2:163-171);遍在蛋白(Christensen 等(1989)Plant Mol.Biol.12:619-632 和 Christensen 等(1992)Plant Mol.Biol.18:675-689) ;pEMU(Last 等(1991)Theor.Appl.Genet.81:581-588) ;MAS(Velten 等(1984)EMBO J.3:2723-2730) ;ALS啟動子(美國專利號5,659,026)等。其他組成型啟動子包括例如美國專利號5,608,149 ;5,608,144 ;5,604,121 ;5,569,597 ;5,466,785 ;5,399,680 ;5,268,463 ;5,608,142 ;和6,177,611。
      [0254]組織偏好啟動子可用于旨在特定宿主組織中增強的表達。用于植物的此類組織偏好啟動子包括但不限于葉偏好啟動子、根偏好啟動子、種子偏好啟動子和莖偏好啟動子。組織偏好啟動子包括 Yamamoto 等(1997)Plant J.12 (2): 255-265 ;Kawamata 等(1997)Plant Cell Physiol.38(7):792-803 ;Hansen 等(1997)Mol.Gen Genet.254(3):337-343 ;Russel I 等(1997) Transgenic Res.6 (2):157-168 ;Rinehart 等(1996)PlantPhysiol.112 (3):1331-1341 ;Van Camp 等(1996)Plant Physiol.112(2):525-535 ;Canevascini 等(1996)Plant Physiol.112(2):513-524 ;Yamamoto 等(1994)Plant CellPhysiol.35(5):773-778 ;Lam(1994)Results Prob1.Cell Differ.20:181-196 ;Orozco等(1993)Plant Mol Biol.23(6):1129-1138 ;Matsuoka 等(1993)Proc Natl.Acad.Sc1.USA90 (20):9586-9590 ;和 Guevara-Garcia 等(1993) Plant J.4(3): 495-505。如果必要,此類啟動子可以被修飾以減弱表達。
      [0255] 一般,從可誘導(dǎo)啟動子、特別是從病原體誘導(dǎo)啟動子表達基因?qū)⑹怯幸娴摹4祟悊幼影▉碜钥梢栽诒徊≡w感染后被誘導(dǎo)的致病相關(guān)蛋白(PR蛋白)的那些,例如PR蛋白、SAR蛋白、β-1,3-葡聚糖酶、幾丁質(zhì)酶等。參見例如Redolfi等(1983)Neth.J.PlantPathol.89:245-254 ;Uknes 等(1992)Plant Cell4:645_656 ;和 Van Loon(1985)PlantMol.Virol.4:111-116。還參見W099/43819,在此通過引用并入。
      [0256]關(guān)注的是位置在病原體感染部位或附近表達的啟動子。參見例如Marineau等(1987)Plant Mol.Biol.9:335-342 ;Matton 等(1989)Molecular Plant-MicrobeInteractions〗:325-331 ;Somsisch 等(1986)Proc.Natl.Acad.Sc1.USA83:2427-2430 ;Somsisch 等(1988) Mol.Gen.Genet.2: 93-98 ;和 Yang (1996) Proc.Natl.Acad.Sc1.USA93:14972-14977。還參見 Chen 等(1996) Plant J.10:955-966 ;Zhang 等(1994) Proc.Natl.Acad.Sc1.USA91:2507-2511 ;ffarner 等(1993)Plant J.3:191-201 ;Siebertz 等(1989)Plant Celll:961-968 ;美國專利號5,750,386 (線蟲可誘導(dǎo)的);和其中引用的參考文獻。特別關(guān)注的是玉米PRms基因的可誘導(dǎo)啟動子,玉米PRms基因的表達由病原體串珠鍵刀菌(Fusarium moniIiforme)誘導(dǎo)(參見例如 Cordero 等(1992)Physiol.Mol.PlantPath.41:189-200)。
      [0257]化學(xué)調(diào)節(jié)的啟動子可用于調(diào)芐基因在植物中的表達,通過應(yīng)用外源化學(xué)調(diào)節(jié)劑。根據(jù)對象,啟動子可以是化學(xué)誘導(dǎo)啟動子(其中化學(xué)物的應(yīng)用誘導(dǎo)基因表達)或化學(xué)阻遏啟動子(其中化學(xué)物的應(yīng)用阻遏基因表達)?;瘜W(xué)誘導(dǎo)啟動子是本領(lǐng)域已知的并且包括但不限于通過苯磺酰胺除草劑安全劑激活的玉米In2-2啟動子、通過用作出現(xiàn)前除草劑的疏水親電化合物激活的玉米GST啟動子、和通過水楊酸激活的煙草PR-1a啟動子。其他關(guān)注的化學(xué)調(diào)控啟動子包括類固醇應(yīng)答性啟動子(參見例如糖皮質(zhì)激素誘導(dǎo)啟動子Schena 等(1991)Proc.Natl.Acad.Sc1.USA88:10421-10425 和 McNellis 等(1998)PlantJ.14(2):247-257)和四環(huán)素誘導(dǎo)和四環(huán)素阻遏啟動子(參見例如Gatz等(1991)Mol.Gen.Genet.227:229-237,和美國專利號5,814,618和5,789,156),在此通過引用并入。
      [0258]表達盒還可以包含用于選擇轉(zhuǎn)化細(xì)胞的選擇性標(biāo)記基因。選擇性標(biāo)記基因用于選擇轉(zhuǎn)化的細(xì)胞或組織。標(biāo)記基因包括編碼抗生素抗性的基因,例如編碼新霉素磷酸轉(zhuǎn)移酶II (NEO)和潮霉素磷酸轉(zhuǎn)移酶(HPT)的那些,以及賦予對除草化合物例如草胺磷、溴苯腈、咪唑啉酮和2,4-二氯苯氧基醋酸酯(2,4-D)抗性的基因。其他選擇性標(biāo)記包括表型標(biāo)記,例如半乳糖苷酶和熒光蛋白例如綠色熒光蛋白(GFP) (Su等(2004)BiotechnolBioeng85:610-9和Fetter等(2004)Plant Celll6:215_28)、青色熒光蛋白(CYP) (Bolte等(2004) J.Cell Sciencell7:943_54 和 Kato 等(2002)Plant Physioll29:913_42)、和黃色熒光蛋白(來自 Evrogen 的 PhiYFP?,參見 Bolte 等(2004) J.Cell Sciencell7:943_54)。關(guān)于其他選擇性標(biāo)記,大體參見 Yarranton (1992) Curr.0pin.Biotech.3:506-511 ;Christopherson 等(1992)Proc.Natl.Acad.Sc1.USA89:6314-6318 ;Yao 等(1992)Cell71:63-72 ;Reznikoff(1992)Mol.Microbiol.6:2419-2422 ;Barkley 等(1980),TheOperon, pp.177-220 ;Hu 等(1987)Cell48:555-566 ;Brown 等(1987)Cell49:603-612 ;Figge 等(1988)Cell52:713-722 ;Deuschle 等(1989)Proc.Natl.Acad.Ac1.USA86:5400-5404 ;Fuerst 等(1989)Proc.Natl.Acad.Sc1.USA86:2549-2553 ;Deuschle等(1990)Science248:480-483 ;Gossen (1993)Ph.D.Thesis, University of Heidelberg ;Reines 等(1993)Proc.Natl.Acad.Sc1.USA90:1917-1921 ;Labow 等(1990)Mol.Cell.Biol.10:3343-3356 ;Zambretti 等(1992)Proc.Natl.Acad.Sc1.USA89:3952-3956 ;Baim等(1991)Proc.Natl.Acad.Sc1.USA88:5072-5076 ;ffyborski 等(1991)Nucleic AcidsRes.19:4647-4653 ;Hillenand-ffissman(1989)Topics Mol.Struc.Biol.10:143-162 ;Degenkolb 等(1991)Antimicrob.Agents Chemother.35:1591-1595 ;Kleinschnidt等(1988)Biochemistry27:1094-1104 ;Bonin(1993)Ph.D.Thesis, University ofHeidelberg ;Gossen 等(1992)Proc.Natl.Acad.Sc1.USA89:5547-5551 ;01iva 等(1992)Antimicrob.Agents Chemother.36:913-919 ;Hlavka等(1985) Handbook of ExperimentalPharmacology, Vol.78(Springer-Veriag, Berlin) ;Gill等(1988)Nature334:721-724? 此類公開在此通過引用并入。
      [0259]上述選擇性標(biāo)記基因列表不意味著是限制性的。任何選擇性標(biāo)記基因可用于本發(fā)明。
      [0260]許多植物轉(zhuǎn)化載體和用于轉(zhuǎn)化植物的方法是可獲得的。參見例如An,G.等(1986)Plant Pysiol., 81:301-305 ;Fry, J.,等(1987)Plant Cell Rep.6:321-325 ;Block, M.(1988)Theor.Appl Genet.76:767-774 ;Hinchee,等(1990)Stadler.Genet.Symp.203212.203-212 ;Cousins,等(1991)Aust.J.Plant Physiol.18:481-494 ;Chee, P.P.and Slightom, J.L.(1992) Gene.118: 255-260 ;Christou,等(1992) Trends.Biotechnol.10:239-246 ;D' Halluin,等(1992)Bio/Technol.10:309-314 ;Dhir,等(1992)Plant Physiol.99:81-88 ;Casas 等(1993)Proc.Nat.Acad Sc1.USA90:11212-11216 ;Christou1P.(1993) In Vitro Cell.Dev.Biol.-Plant ;29P: 119-124 ;Davies,等(1993)Plant Cell Rep.12:180-183 ;Dong,J.A.and Mchughen, A.(1993)Plant Sc1.91:139-148 ;Franklin, C.1.and Trieu, T.N.(1993)Plant.Physiol.102:167 ;Golovkin,等(1993)PlantSc1.90:41-52 ;Guo Chin Sc1.Bull.38:2072-2078 ;Asano,等(1994)Plant Cell Rep.13 ;Ayeres N.M.and Park, ff.D.(1994) Crit.Rev.Plant.Sc1.13:219-239 ;Barcelo,等(1994)Plant.J.5:583-592 ;Becker,等(1994)Plant.J.5:299-307 ;Borkowska 等(1994)Acta.Physiol Plant.16:225-230 ;Christou,P.(1994)Agr0.Food.1nd.Hi Tech.5:17-27 ;Eapen等(1994)Plant Cell Rep.13:582-586 ;Hartman,等(1994)Bio_Technologyl2:919923 ;Ritala,等(1994)Plant.Mol.Biol.24:317-325 ;和 Wan, Y.C.and Lemaux, P.G.(1994)Plant Physiol.104:3748。
      [0261]本發(fā)明方法包括將包含DNA序列的多核苷酸構(gòu)建體引入宿主細(xì)胞。“引入”是要以使得構(gòu)建體進入宿主細(xì)胞內(nèi)部的方式給植物提供多核苷酸構(gòu)建體。本發(fā)明方法不依賴于將多核苷酸構(gòu)建體引入宿主細(xì)胞的特定方法,只要多核苷酸構(gòu)建體進入宿主的一個細(xì)胞內(nèi)部。用于將多核苷酸構(gòu)建體引入細(xì)菌、植物、真菌和動物的方法是本領(lǐng)域已知的,包括但不限于穩(wěn)定轉(zhuǎn)化方法、瞬時轉(zhuǎn)化方法和病毒介導(dǎo)的方法。
      [0262]“穩(wěn)定轉(zhuǎn)化”預(yù)期被引入植物的多核苷酸構(gòu)建體整合入宿主基因組并能夠由其后代遺傳。“瞬時轉(zhuǎn)化”預(yù)期被引入宿主的多核苷酸構(gòu)建體不整合入宿主的基因組。
      [0263]對于植物和植物細(xì)胞的轉(zhuǎn)化,本發(fā)明DNA序列使用標(biāo)準(zhǔn)技術(shù)插入本領(lǐng)域已知的適合在關(guān)注的宿主細(xì)胞或生物中表達DNA序列的任何載體。載體的選擇取決于優(yōu)選的轉(zhuǎn)化技術(shù)和要轉(zhuǎn)化的靶宿主物種。
      [0264]用于構(gòu)建表達盒和將外來核酸引入植物的方法是本領(lǐng)域公知的,并且已經(jīng)在之前描述。例如,外來DNA可以使用腫瘤誘導(dǎo)(Ti)質(zhì)粒載體被引入植物。用于外來DNA遞送的其他方法包括使用PEG介導(dǎo)的原生質(zhì)體轉(zhuǎn)化、電穿孔、顯微注射須晶(microinjectionwhiskers)和用于直接DNA攝取的生物彈道術(shù)或微粒轟擊。此類方法是本領(lǐng)域已知的(Vasil 等的美國專利號 5,405,765 ;Bilang 等(1991)GenelOO:247-250 ;Scheid等,(1991)Mol.Gen.Genet.,228:104-112 ;Guerche等,(1987)Plant Science52:111-116 ;Neuhause 等,(1987)Theor.Appl Genet.75:30-36 ;Klein 等,(1987)Nature327:70-73 ;Howell 等,(1980)Science208:1265 ;Horsch 等,(1985)Science227:1229-1231 ;DeBlock 等,(1989)Plant Physiology91:694-701 ;Methods for Plant MolecularBiology (ffeissbach and ffeissbach, eds.) Academic Press, Inc.(1988)以及 Methods inPlant Molecular Biology (Schuler and Zielinski, eds.) Academic Press, Inc.(1989)。轉(zhuǎn)化方法取決于待轉(zhuǎn)化的植物細(xì)胞、使用的載體穩(wěn)定性、基因產(chǎn)物的表達水平和其他參數(shù)。
      [0265]本發(fā)明DNA序列可以通過使植物與病毒或病毒核酸接觸而被引入植物。一般而言,此類方法包括將本發(fā)明多核苷酸構(gòu)建體整合入病毒DNA或RNA分子。要理解,本發(fā)明蛋白可以最初作為病毒多蛋白的一部分而合成,它稍后可以通過在體內(nèi)或體外蛋白水解來加工以產(chǎn)生所需的重組蛋白。而且,要理解,本發(fā)明啟動子還涵蓋用于由病毒RNA聚合酶轉(zhuǎn)錄的啟動子。用于將多核苷酸構(gòu)建體引入植物并在其中表達所編碼蛋白的方法涉及病毒DNA或RNA分子,在本領(lǐng)域中是已知的。參見例如美國專利號5,889,191,5,889,190,5,866,785,5,589,367和5,316,931 ;在此通過引用并入。
      [0266]在具體實施方案中,本發(fā)明DNA序列可以使用許多瞬時轉(zhuǎn)化方法被提供給植物。此類瞬時轉(zhuǎn)化方法包括但不限于將蛋白或變體和其片段直接引入植物,或者將編碼蛋白的轉(zhuǎn)錄物引入植物。此類方法包括例如顯微注射或粒子轟擊。參見例如Crossway等(1986)Mol Gen.Genet.202:179-185 ;Nomura 等(1986)Plant Sc1.44:53-58 ;Hepler等(1994)Proc.Natl.Acad.Sc1.91:2176-2180 和 Hush 等(1994)TheJournal of CellSciencel07:775-784,其全部在此通過引用并入??蛇x地,多核苷酸可以使用本領(lǐng)域已知的技術(shù)被瞬時轉(zhuǎn)染入植物。此類技術(shù)包括下文所描述的根癌農(nóng)桿菌介導(dǎo)的瞬時表達。
      [0267]已經(jīng)被轉(zhuǎn)化的細(xì)胞可以根據(jù)常規(guī)方式培養(yǎng)成植物。參見例如McCormick等(1986)Plant Cell R印orts5:81_84。這些植物然后被培養(yǎng)并與相同轉(zhuǎn)化株或不同株授粉,鑒定組成型表達預(yù)期表型特征的得到的雜交體。兩代或更多代可以被培養(yǎng)以保證預(yù)期表型特征的表達被穩(wěn)定維持并遺傳,然后收獲種子以保證已經(jīng)實現(xiàn)了預(yù)期表型特征的表達。以這種方式,本發(fā)明提供了具有穩(wěn)定整合入其基因組的本發(fā)明多核苷酸構(gòu)建體、例如本發(fā)明表達盒的轉(zhuǎn)化的種子(還稱為“轉(zhuǎn)基因種子”)。
      [0268]本發(fā)明可用于轉(zhuǎn)化任何植物物種,包括但不限于單子葉植物和雙子葉植物。特別關(guān)注的植物包括但不限于提供關(guān)注種子的谷類植物、油種子植物、豆科植物和擬南芥。關(guān)注的種子包括谷類種子,例如玉米、小麥、大麥、稻谷、高粱、黑麥等。油種子植物包括棉花、黃豆、紅花、向日葵、蕓苔、玉米、苜蓿、棕櫚、椰子等。豆科植物包括豆類和豌豆。大豆包括瓜爾豆、槐豆、胡蘆巴、黃豆、四季豆、豇豆、綠豆、利馬豆、蠶豆、扁豆、鷹嘴豆等。
      [0269]本文使用的術(shù)語植物包括植物細(xì)胞、植物原生質(zhì)體、可以再生植物的植物細(xì)胞組織培養(yǎng)物、植物愈傷組織、植物叢和在植物或植物部分中完整的植物細(xì)胞,所述植物部分例如胚、花粉、胚珠、種子、葉、花、枝、果實、根、根尖、花粉囊等。再生植物的后代、變體和突變體也包括在本發(fā)明范圍內(nèi),條件是這些部分包含引入的多核苷酸。
      [0270] 本發(fā)明還涵蓋將本發(fā)明DNA序列引入非植物宿主細(xì)胞,包括但不限于細(xì)菌細(xì)胞、酵母細(xì)胞、其他真菌細(xì)胞、人細(xì)胞和其他動物細(xì)胞。此外,本發(fā)明涵蓋通過穩(wěn)定和瞬時轉(zhuǎn)化方法將DNA序列引入動物和其他生物。
      [0271]如本文討論的,本發(fā)明DNA序列可以在這些真核系統(tǒng)中表達。異源多核苷酸在酵母中的合成是公知的(Sherman 等(1982)Methods in Yeast Genetics, Cold SpringHarbor Laboratory)。用于產(chǎn)生真核蛋白的兩種普遍采用的酵母是釀酒酵母和畢赤酵母。用于在釀酒酵母和畢赤酵母中表達的載體、品系和方案是本領(lǐng)域已知的并且可獲自商業(yè)供應(yīng)商(例如Invitrogen)。適合的載體通常具有表達控制序列,例如啟動子,包括3-磷酸甘油酸激酶或醇氧化酶,和所需的復(fù)制起點、終止序列等。
      [0272]本發(fā)明序列還可以連接至各種表達載體,用于轉(zhuǎn)染哺乳動物或昆蟲起源的細(xì)胞培養(yǎng)物。用于產(chǎn)生肽的示例性細(xì)胞培養(yǎng)物是哺乳動物細(xì)胞。能夠表達完整蛋白的許多適合的宿主細(xì)胞系已經(jīng)在本領(lǐng)域開發(fā),并且包括HEK293、BHK21和CHO細(xì)胞系。這些細(xì)胞的表達載體可以包括表達控制序列,例如復(fù)制起點、啟動子(例如,CMV啟動子、HSV tk啟動子或Pgk(磷酸甘油酸酯激酶)啟動子)、增強子(Queen等(1986) Immunol.Rev.89:49)和必要的加工信息位點,例如核糖體結(jié)合位點、RNA剪接位點、聚腺苷酸化位點(例如SV40大T Agpoly A添加位點)和轉(zhuǎn)錄終止子序列。用于產(chǎn)生本發(fā)明蛋白的其他動物細(xì)胞可獲自例如美國典型培養(yǎng)物保藏中心。
      [0273]用于在昆蟲細(xì)胞中表達本發(fā)明蛋白的適當(dāng)載體通常源自SF9桿狀病毒。適合的昆蟲細(xì)胞系包括蚊幼蟲、蠶、粘蟲、蛾和果蠅細(xì)胞系,例如Schneider細(xì)胞系(參見,Schneider(1987)J.Embyol.Exp.Morpho1.27:353-365)。
      [0274]與酵母一樣,當(dāng)采用高等動物或植物宿主細(xì)胞時,聚腺苷酸化或轉(zhuǎn)錄終止子序列通常被整合入載體。終止子序列的實例是來自牛生長激素基因的聚腺苷酸化序列。還可以包括用于轉(zhuǎn)錄物的準(zhǔn)確剪接的序列。剪接序列的實例是來自SV40的VPl內(nèi)含子(Sprague等(1983) J.Virol.45:773-781)。此外,在宿主細(xì)胞中控制復(fù)制的基因序列可以被整合入載體,例如存在于牛乳頭瘤病毒型載體中的那些(Saveria-Campo (1985)DNA Cloning Vol.1Ia Practical Approach, D.M.Glover, Ed., IRL Press, Arlington, Va., pp.213-238)。
      [0275]動物和低等真核(例如酵母)宿主細(xì)胞對于各種方式的轉(zhuǎn)染處于感受態(tài)或被賦予感受態(tài)。這些包括:磷酸?丐沉淀、受體細(xì)胞與含有DNA的細(xì)菌原生質(zhì)體的融合、用含有DNA的脂質(zhì)體處理受體細(xì)胞、DEAE糊精、電穿孔、生物彈道術(shù)和將DNA直接顯微注射入細(xì)胞。轉(zhuǎn)染的細(xì)胞通過本領(lǐng)域公知的方式培養(yǎng)(Kuchler(1997)Biochemical Methods in CellCulture and Virology, Dowden, Hutchinson and Ross, Inc.)。
      [0276]原核生物最常由大腸桿菌的各種菌株代表;但是其他微生物菌株也可用于本發(fā)明方法。在本文確定包括用于轉(zhuǎn)錄起始的與操作子以及核糖體結(jié)合序列可操作連接的啟動子的常用原核生物控制序列包括諸如β內(nèi)酰胺酶(青霉素酶)和乳糖(Iac)啟動子系統(tǒng)的常用啟動子(Goeddel 等(1980) Nucleic Acids Res.8:4057)和 λ 衍生 P L 啟動子和 N-基因核糖體結(jié)合位點(Shimatake等(1981) Nature292:128)。在大腸桿菌中轉(zhuǎn)染的DNA載體中加入選擇標(biāo)記也是有用的。此類標(biāo)記的實例包括賦予對氨芐西林、四環(huán)素或氯霉素抗性的基因。
      [0277]載體被選擇允許引入適當(dāng)?shù)乃拗骷?xì)胞。細(xì)菌載體通常是質(zhì)粒或噬菌體起源的。適當(dāng)?shù)募?xì)菌細(xì)胞用噬菌體載體粒子感染,或者用裸噬菌體載體DNA轉(zhuǎn)染。如果使用質(zhì)粒載體,細(xì)菌細(xì)胞用質(zhì)粒載體DNA轉(zhuǎn)染。用于表達本發(fā)明蛋白的表達系統(tǒng)可使用芽孢桿菌(Bacillus sp.)和沙門氏菌(Salmonella)獲得(Palva 等(1983)Gene22:229-235);Mosbach 等(1983)Nature302:543-545)。
      [0278]就融合蛋白而言,“可操作連接”預(yù)期表示兩個或多個元件或結(jié)構(gòu)域之間的功能性連接。認(rèn)為一個或多個氨基酸的連接體可以插入兩個或多個元件的每一個之間以保持兩個或多個元件的預(yù)期功能。
      [0279]在本發(fā)明的一個實施方案中,融合蛋白包含可操作連接至至少一個蛋白或其部分或結(jié)構(gòu)域的本發(fā)明的重復(fù)序列結(jié)構(gòu)域。在本發(fā)明的某些實施方案中,蛋白或其部分或結(jié)構(gòu)域包括能夠修飾DNA或RNA的蛋白或其功能部分或結(jié)構(gòu)域。在其他實施方案中,蛋白或其功能部分或結(jié)構(gòu)域能夠起轉(zhuǎn)錄激活子或轉(zhuǎn)錄阻遏物的功能。優(yōu)選的蛋白包括但不限于轉(zhuǎn)錄激活子、轉(zhuǎn)錄阻遏物、抗性介導(dǎo)蛋白、核酸酶、拓?fù)洚悩?gòu)酶、連接酶、整合酶、重組酶、解離酶、甲基化酶、乙?;D(zhuǎn)移酶、去甲基化酶和脫乙酰酶。
      [0280]提供以下實施例,作為示例說明而非限制。
      【實施例】
      [0281]【實施例1:TAL效應(yīng)子的DNA特異性基礎(chǔ)的鑒定】
      [0282]AvrBs3直接結(jié)合誘導(dǎo)靶基因中啟動子元件UPA-框(Kay等(2007)Science318, 648-651 ; Romer 等(2007) Science318:645-648)的事實促使我們考
      察DNA序列特異性的基礎(chǔ)。每個重復(fù)序列區(qū)一般由34個氨基酸組成,并且重鏈重復(fù)序列單元幾乎是相同的;然而,氨基酸12和13是高變的(Schornack等(2006) J.PlantPhysiol.163:256-272 ;圖1A)。AvrBs3的大部分C端重復(fù)序列僅在其前20個氨基酸顯示與其他重復(fù)序列單元的序列相似性,并因此被稱為半個重復(fù)序列。重復(fù)序列單元可以根據(jù)其高變的第12和13氨基酸被分類成不同的重復(fù)序列類型(圖1B)。因為UPA-框的大小(18 (20)/19 (21) bp)幾乎對應(yīng)于AvrBs3中重復(fù)序列單元的數(shù)目(17.5),我們考慮了 AvrBs3的一個重復(fù)序列單元與一個特定DNA堿基對接觸的可能性。當(dāng)AvrBs3的重復(fù)序列類型(每個重復(fù)序列的氨基酸12和13)被投射到UPA框中時,變得明顯的是,某些重復(fù)序列類型與靶DNA中特定堿基對相關(guān)。例如,HD和NI重復(fù)序列單元分別對C和A具有強的偏好(圖1B)。為了簡單,我們僅指定上(有義)DNA鏈中的堿基。我們的識別特異性模型得到如下事實的支持:缺乏四個重復(fù)序列單元(Λ 11-14;圖5Α,Β)的AvrBs3重復(fù)序列缺失衍生物AvrBs3Arepl6識別較短且不同的祀DNA序列(圖5至8)。基于AvrBs3_誘導(dǎo)的辣椒基因的UPA-框的序列比較和突變分析,AvrBs3的靶DNA框顯示比AvrBs3中重復(fù)序列單元數(shù)目長lbp。此外,T在剛好在第一重復(fù)序列的預(yù)測的識別特異性之前的UPA框的5’端是保守的(圖1)。有趣的是,在第一重復(fù)序列之前的蛋白區(qū)和重復(fù)區(qū)的二級結(jié)構(gòu)預(yù)測顯示相似性,盡管缺乏氨基酸序列保守。這表明其他重復(fù)序列,稱為重復(fù)序列O (圖1B)。
      [0283] 為了進一步證實和擴展我們的模型(圖1B),我們根據(jù)其重復(fù)序列單元序列預(yù)測了黃單胞菌屬TAL效應(yīng)子的未知的靶DNA序列,并且檢查了已知TAL靶基因及其等位基因的啟動子中推定結(jié)合位點的存在。我們鑒定了符合響應(yīng)于相應(yīng)TAL效應(yīng)子而被誘導(dǎo)的等位基因的啟動子中預(yù)測的特異性的序列,但沒有在非誘導(dǎo)的等位基因中(圖5C-F)。這些框的存在表明,誘導(dǎo)基因是相應(yīng)的TAL效應(yīng)子的直接靶?;诎蠨NA序列中不同重復(fù)序列類型的DNA堿基頻率,使用八個TAL效應(yīng)子,我們推導(dǎo)了某些重復(fù)序列類型的DNA靶特異性的代碼(圖1C,D ;圖5)。
      [0284]為了實驗驗證我們的模型,我們預(yù)測了來自十字花科病原體野油菜黃單胞菌假辣根病菌的TAL效應(yīng)子Hax2 (21.5重復(fù)序列單元)、Hax3 (11.5重復(fù)序列單元)和Hax4 (14.5重復(fù)序列單元)的靶DNA序列(22)。首先,我們得到Hax3和Hax4的靶DNA框,因為它們唯獨含有AvrBs3中存在的重復(fù)序列類型(氨基酸12/13:NI,HD,NG,NS ;圖1A,圖2A),其DNA結(jié)合和基因激活已經(jīng)被實驗顯示。Hax3和Hax4靶框被放在最小(-55至+25)番茄Bs4啟動子之前,其具有很弱的基礎(chǔ)活性(Schornack等(2005)Mol.Plant-MicrobeInteract.18:1215-1225 ;圖2B ;圖9),驅(qū)動無啟動子的uidA( β -葡糖醛酸酶,⑶S)報告基因。為了瞬時表達研究,我們使用農(nóng)桿菌介導(dǎo)的T-DNA遞送將報告構(gòu)建體與花椰菜花葉病毒35S-啟動子驅(qū)動的效應(yīng)子基因hax3和hax4 —起轉(zhuǎn)染入本塞姆氏煙草葉。定性和定量GUS分析說明,含有Hax3-或Hax4_框的啟動子在相應(yīng)效應(yīng)子存在下被有利且特異性地誘導(dǎo)(圖2C)。同樣,我們提出了在預(yù)測的Hax3的靶DNA序列中的第一核苷酸(T)的重要性,并產(chǎn)生了在5’端具有A、C、G或T的四個不同Hax3-框(圖10A,B)。本塞姆氏煙草中hax3和報告構(gòu)建體的共表達說明,僅僅含有5’ T的Hax3_框的啟動子在Hax3存在下被強誘導(dǎo),而其他導(dǎo)致較弱的激活(圖10C)。這表明,位置O促進了 Hax3和可能其他TAL效應(yīng)子的啟動子激活特異性。為了解一些重復(fù)序列類型賦予更寬特異性,即識別超過一個堿基的可能性,我們重排列Hax4-框(圖3A,B)。瞬時GUS分析顯示,Hax4中的NI_、HD_和NG-重復(fù)序列單元分別非常幫助識別堿基A、C和T,而NS-重復(fù)序列單元識別所有四個堿基(圖3B ;圖11)。因為幾個TAL效應(yīng)子含有NN-重復(fù)序列單元(圖5和圖15,表1),我們產(chǎn)生了具有NN-重復(fù)序列單元的人工TAL效應(yīng)子ArtXl,并且使用我們的代碼推導(dǎo)了相應(yīng)的DNA識別序列(圖3C)。ArtXl-框衍生物的分析說明,NN-重復(fù)序列單元識別A和G兩者,偏好G (圖3C)。該結(jié)果證實我們對在對應(yīng)于NN-重復(fù)序列單元的位置含有A或G的稻谷中天然AvrXa27-框的預(yù)測(圖5C)。此外,我們推導(dǎo)了在AvrXalO中對應(yīng)于NN-重復(fù)序列單元的位置具有A或G的兩個 可能的AvrXalO-框。兩個報告構(gòu)建體被AvrXalO有效誘導(dǎo)(圖12)??傊@些數(shù)據(jù)強烈表明,一些重復(fù)序列類型識別特定的堿基對,而其他更靈活。
      [0285]例外的TAL效應(yīng)子是Hax2,因為它每個重復(fù)序列含有35個氨基酸,而不是通常的34 個氨基酸的重復(fù)序列單兀(Kay 等(2005)Mol.Plant-Microbe Interact.18:838-848)。此外,Hax2在其第二重復(fù)序列中含有稀有氨基酸組合(氨基酸12/13:1G ;圖2A)。我們改變Hax2_框的相應(yīng)的第三個堿基,并且使用瞬時測定來分析效應(yīng)子Hax2對報告基因的激活。這顯示,IG重復(fù)序列賦予對T的特異性(圖13)。Hax2-框僅導(dǎo)致啟動子被Hax2激活,而不被Hax3或Hax4激活(圖2C)。這說明,35個氨基酸的重復(fù)序列單元作用類似于34個氨基酸的重復(fù)序列單元。這得到如下事實的支持:含有35個氨基酸的重復(fù)序列單元的TAL效應(yīng)子 AvrHahl 誘導(dǎo) Bs3_ 介導(dǎo)的抗性(Schornack 等(2008) New Phytol.179:546-556)。AvrHahl的重復(fù)序列類型與Bs3啟動子中的UPA-框匹配(圖5A, B)。
      [0286]有趣的是,hax2在擬南芥中的表達導(dǎo)致紫色的葉,表明花色素苷的累積(圖14A, B) ο為了鑒定Hax2革巴基因,我們使用模式檢索(Patmatch, TAIR ;www.arabidopsis.0rg)用變性的Hax2-框序列分析了擬南芥基因組的啟動子區(qū)。推定的Hax2靶基因之一編碼控制花色素苷生物合成的MYB轉(zhuǎn)錄因子PAPl (AtlG56650) (Borevitz等(2000)PlantCelll2:2383-2394)。PAPl的轉(zhuǎn)錄水平的半定量分析說明,PAPl的表達受Hax2的強誘導(dǎo)(圖14C)。PAPl啟動子區(qū)的視覺檢查揭示了次佳Hax2-框的存在(圖14D,E)?;赥AL效應(yīng)子重復(fù)序列類型的代碼(圖1D)和上述數(shù)據(jù),我們預(yù)測了其他TAL效應(yīng)子的推定靶DNA序列,其中一些TAL效應(yīng)子是重要的致病因子(圖15,表1)。
      [0287]因為TAL效應(yīng)子的重復(fù)序列數(shù)目范圍從1.5至28.5,關(guān)鍵問題是具有少數(shù)重復(fù)序列單元的效應(yīng)子是否能夠激活基因表達。因此,我們測試了重復(fù)序列單元的數(shù)目如何影響基因表達。為此,我們構(gòu)建了含有Hax3的N-和C-端區(qū)和具有0.5至15.5HD-重復(fù)序列單元(對C特異性)的重復(fù)序列結(jié)構(gòu)域的人工效應(yīng)子。出于技術(shù)原因,所有情況下的第一重復(fù)序列是NI (對A特異性)。相應(yīng)的靶DNA框由之前是TA的17C-殘基組成(圖4A,B)。使用Bs4-啟動子GUS-分析在本塞姆氏煙草中測量人工效應(yīng)子對啟動子的激活。雖然基因誘導(dǎo)需要至少6.5個重復(fù)序列單元,但10.5或更多重復(fù)序列單元導(dǎo)致強的報告基因激活(圖4C)。這些數(shù)據(jù)說明,重復(fù)序列單元的最小數(shù)目是識別人工靶DNA-框和激活基因表達所必需的。結(jié)果還表明,具有更少重復(fù)序列數(shù)的效應(yīng)子大大無活性。我們已經(jīng)顯示,TAL效應(yīng)子的重復(fù)序列區(qū)具有對應(yīng)于連續(xù)靶DNA序列的連續(xù)性質(zhì)。因此,產(chǎn)生具有新型DNA結(jié)合特異性的效應(yīng)子是可行的。產(chǎn)生了三個人工效應(yīng)子(ArtXl,ArtX2,ArtX3),每個具有隨機裝配的 12.5個重復(fù)序列單元(圖3C,D),并測試了含有預(yù)測的靶DNA序列的Bs4啟動子-報告子融合體的誘導(dǎo)。所有三個人工效應(yīng)子僅在相應(yīng)的靶DNA-框存在下強力且特異性地誘導(dǎo)了GUS報告子(圖3E;圖11)。我們關(guān)于其中重復(fù)序列單元經(jīng)由每個重復(fù)序列的氨基酸12和13接觸DNA中一個堿基對的TAL效應(yīng)子的識別特異性的模型實現(xiàn)了預(yù)測TAL效應(yīng)子結(jié)合特異性和鑒定植物靶基因。由于TAL效應(yīng)子是主要的致病因子,植物靶基因的知識將大大增強我們對黃胞桿菌引起的植物疾病發(fā)展的理解。此外,我們成功設(shè)計了具有特異性DNA結(jié)合結(jié)構(gòu)域的用作轉(zhuǎn)錄因子的人工效應(yīng)子。之前,含有隨機排列的鋅指單元的鋅指轉(zhuǎn)錄因子已經(jīng)被工程改造以結(jié)合特定的靶DNA序列。
      [0288]類似地,TAL效應(yīng)子具有可以容易被重排的線性DNA結(jié)合特異性。我們注意到,TAL效應(yīng)子中重復(fù)區(qū)的假定的右手超螺旋結(jié)構(gòu)直接表明與遺傳材料的右手螺旋相互作用的可能機制。確定與靶DNA復(fù)合的TAL效應(yīng)子的新型DNA結(jié)合結(jié)構(gòu)域的結(jié)構(gòu)將是重要的。
      [0289]以下參數(shù)描述了本發(fā)明的其他實施方案:
      [0290]【(I)天然存在的AvrBs3同源蛋白的DNA結(jié)合特異性的預(yù)測和抗性植物的產(chǎn)生】
      [0291]AvrBs3家族的天然存在的效應(yīng)子的重復(fù)序列結(jié)構(gòu)域的重復(fù)序列單元編碼相應(yīng)的DNA結(jié)合特異性。這些識別序列可以用識別代碼預(yù)測。
      [0292]如果相應(yīng)的AvrBs3樣效應(yīng)子被轉(zhuǎn)位入植物細(xì)胞(例如在細(xì)菌感染期間),在轉(zhuǎn)基因植物的基因之前人工插入預(yù)測的識別序列導(dǎo)致基因表達。
      [0293]如果識別序列在其表達導(dǎo)致防御反應(yīng)的基因(例如抗性介導(dǎo)基因)之前插入,這種構(gòu)建的轉(zhuǎn)基因植物對轉(zhuǎn)位相應(yīng)效應(yīng)子的植物致病細(xì)菌的感染是抗性的。
      [0294]【⑵其表達由AvrBs3家族的特定效應(yīng)子誘導(dǎo)的植物基因的鑒定】
      [0295]植物基因啟動子區(qū)中AvrBs3家族的相應(yīng)效應(yīng)子的DNA靶序列的預(yù)測指示這些基因的表達可由效應(yīng)子誘導(dǎo)。使用根據(jù)本發(fā)明的方法,可能預(yù)測可誘導(dǎo)的植物基因。預(yù)測在測序基因組中是特別直接的。
      [0296]【(3)其他效應(yīng)子在表達系統(tǒng)中作為轉(zhuǎn)錄激活子的用途】[0297]類似于Hax3和Hax4的用途,AvrBs3家族其他成員的預(yù)測的DNA結(jié)合序列可以被插入啟動子以產(chǎn)生可被相應(yīng)效應(yīng)子誘導(dǎo)的新的可控啟動子。
      [0298]【(4)第二可誘導(dǎo)系統(tǒng)的構(gòu)建】
      [0299]兩個構(gòu)建體被引入植物。第一個是其表達在可誘導(dǎo)啟動子控制下的hax3基因。第二個是在啟動子中含有Hax3_框的靶基因。hax3的表達的誘導(dǎo)導(dǎo)致Hax3蛋白的產(chǎn)生,然后Hax3蛋白誘導(dǎo)靶基因的表達。所描述的二組分構(gòu)建導(dǎo)致兩倍表達開關(guān),允許靶基因的可變表達。反式激活子和靶基因還可以首先存在于不同植物系,并可以隨意漸滲。與此類似,可以使用Hax4和相應(yīng)的Hax4-框。該系統(tǒng)還可以用于AvrBs3家族其他成員或人工衍生物和預(yù)測的DNA靶序列。系統(tǒng)功能性可已經(jīng)被證實。構(gòu)建了轉(zhuǎn)基因擬南芥植物,含有在其天然啟動子控制下的可誘導(dǎo)的avrBs3基因以及Bs3基因,其表達可以由AvrBs3誘導(dǎo)。avrBs3表達的誘導(dǎo)導(dǎo)致Bs3的表達并因此導(dǎo)致細(xì)胞死亡。參見W02009/042753,在此通過引用并入。
      [0300]【(5)疾病抗性植物的構(gòu)建】
      [0301]如果AvrBs3類似效應(yīng)子的DNA靶序列在其表達導(dǎo)致植物防御反應(yīng)的基因(抗性介導(dǎo)基因)之前插入,相應(yīng)的構(gòu)建的轉(zhuǎn)基因植物將對植物致病生物的感染抗性,這使得該效應(yīng)子是可用的。這種抗性介導(dǎo)基因可以例如導(dǎo)致預(yù)防生物/病原體擴散的局部細(xì)胞死亡,或誘導(dǎo)植物細(xì)胞的基礎(chǔ)或系統(tǒng)抗性。
      [0302]【(6)用于檢測特定DNA序列和誘導(dǎo)下述基因轉(zhuǎn)錄的重復(fù)序列結(jié)構(gòu)域的產(chǎn)生】
      [0303]中央重復(fù)序列結(jié)構(gòu)域的模塊式結(jié)構(gòu)能夠?qū)崿F(xiàn)確定的DNA結(jié)合特異性的靶向構(gòu)建,借此實現(xiàn)選定植物基因轉(zhuǎn)錄的誘導(dǎo)。DNA結(jié)合特異性可以在靶基因之前人工插入,使得產(chǎn)生新型效應(yīng)子-DNA-框變體以可誘導(dǎo)表達靶基因。而且,可以構(gòu)建識別生物中天然存在的DNA序列的重復(fù)序列結(jié)構(gòu)域。該方法的優(yōu)點在于,如果本發(fā)明的相應(yīng)效應(yīng)子存在于該生物的細(xì)胞中,則非轉(zhuǎn)基因生物中任何基因的表達可以被誘導(dǎo)。
      [0304]效應(yīng)子的引入可以不同方式進行:
      [0305](I)經(jīng)由細(xì)菌使用蛋白運輸系統(tǒng)(例如III型分泌系統(tǒng))轉(zhuǎn)移;
      [0306](2)使用人工AvrBs3蛋白的細(xì)胞轟擊;
      [0307](3)導(dǎo)致效應(yīng)子產(chǎn)生的DNA區(qū)段經(jīng)由漸滲、農(nóng)桿菌、病毒載體或細(xì)胞轟擊的轉(zhuǎn)移;或
      [0308](4)導(dǎo)致效應(yīng)子蛋白被靶細(xì)胞攝取的其他方法
      [0309]AvrBs3家族的效應(yīng)子的中央重復(fù)序列結(jié)構(gòu)域是新型的DNA結(jié)合結(jié)構(gòu)域(Kay等,2007)。目前,單個重復(fù)序列單元的特異性的譯碼允許該區(qū)域DNA結(jié)合特異性的靶向適應(yīng)。DNA結(jié)合區(qū)可以被翻譯融合至其他功能結(jié)構(gòu)域以產(chǎn)生序列特異性效應(yīng)。下文給出了此類蛋白融合體的四個實例。
      [0310]【(7)活生物細(xì)胞中基因的可誘導(dǎo)表達的轉(zhuǎn)錄激活子的構(gòu)建】
      [0311]AvrBs3樣家族的效應(yīng)子誘導(dǎo)植物細(xì)胞中的基因表達。為此,蛋白C端是必要的,它含有轉(zhuǎn)錄激活結(jié)構(gòu)域和介導(dǎo)蛋白進入植物細(xì)胞核的核定位序列。AvrBs3同源蛋白的C端可以被修飾,使得它介導(dǎo)基因在真菌、動物或人系統(tǒng)中的表達。由此,可以構(gòu)建在人、其他動物或真菌中用作轉(zhuǎn)錄激活子的效應(yīng)子。因此,根據(jù)本發(fā)明的方法可以不但應(yīng)用于植物,而且應(yīng)用于其他活生物。
      [0312]【(8)作為轉(zhuǎn)錄阻遏物的效應(yīng)子的用途】[0313]重復(fù)序列結(jié)構(gòu)域的DNA結(jié)合特異性可以與蛋白融合體中其他結(jié)構(gòu)域一起使用,以構(gòu)建用作特異性阻遏物的效應(yīng)子。這些效應(yīng)子表現(xiàn)出通過使它們結(jié)合靶基因的啟動子的方式產(chǎn)生的DNA結(jié)合特異性。與是轉(zhuǎn)錄激活子的TAL效應(yīng)子相反,這些效應(yīng)子被構(gòu)建為阻斷靶基因的表達。類似經(jīng)典阻遏物,預(yù)期這些效應(yīng)子通過其對靶DNA序列的識別或結(jié)合而覆蓋啟動子序列,并使它們難以被其他方式控制靶基因表達的因子所接近。可選地或附加地,重復(fù)序列結(jié)構(gòu)域可以融合至轉(zhuǎn)錄抑制結(jié)構(gòu)域,例如EAR基序(Ohta等PlantCelll3:1959-1968(2001))。
      [0314]【(9)重復(fù)序列結(jié)構(gòu)域用于標(biāo)記和分離特定序列的用途】
      [0315]重復(fù)序列結(jié)構(gòu)域識別特定靶DNA序列的能力可與其他結(jié)構(gòu)域一起用于標(biāo)記特定DNA序列。在C末端,GFP( “綠色熒光蛋白”)可用于例如融合至檢測所需DNA序列的人工重復(fù)序列結(jié)構(gòu)域。該融合蛋白在體內(nèi)和體外結(jié)合相應(yīng)的DNA序列。該序列在染色體上的位置可以使用融合的GFP蛋白定位。以類似方式,能夠?qū)崿F(xiàn)蛋白定位(例如通過FISH)的其他蛋白結(jié)構(gòu)域可融合至將蛋白靶向細(xì)胞基因組中相應(yīng)DNA序列的特定人工重復(fù)序列結(jié)構(gòu)域。此外,本發(fā)明重復(fù)序列結(jié)構(gòu)域的DNA識別特異性可用于分離特定的DNA序列。為此,AvrBs3樣蛋白可固定至基質(zhì)并與含有匹配序列的相應(yīng)DNA分子相互作用。因此,特定DNA序列可從DNA分子的混合物分離。
      [0316]【(10)重復(fù)序列結(jié)構(gòu)域用于內(nèi)切核酸酶切割DNA的用途】
      [0317]重復(fù)序列結(jié)構(gòu)域的DNA識別特異性可以融合至適合的限制內(nèi)切核酸酶以特異性切割DNA。因此,重復(fù)序列結(jié)構(gòu)域的序列特異性結(jié)合導(dǎo)致融合蛋白定位至幾個特定序列,使得內(nèi)切核酸酶在預(yù)期位置特異性切割DNA。通過識別靶DNA序列,非特異性核酸酶例如FokI可以被改變?yōu)樘禺愋詢?nèi)切核酸酶,類似于用鋅指核酸酶進行的工作。例如,兩個效應(yīng)子DNA靶位點之間的最佳距離將被確定為支持兩個FokI結(jié)構(gòu)域二聚化所需的。這將通過分析其中兩個DNA結(jié)合位點被不同大小的間隔序列分開的構(gòu)建體的集合來實現(xiàn)。使用該方法能夠確定允許核酸酶介導(dǎo)的DNA切割發(fā)生和靶向不同DNA序列的其他效應(yīng)子核酸酶的功能分析的距離。在可選方法中,采用了新開發(fā)的單鏈FokI 二聚體(Mino等(2009)JBiotechnoll40:156-161)。在該方法中,兩個FokI催化結(jié)構(gòu)域被轉(zhuǎn)錄融合至本發(fā)明的單個重復(fù)序列結(jié)構(gòu)域。因此,相應(yīng)核酸酶的功能性不再依賴于位于兩個不同蛋白的兩個FokI結(jié)構(gòu)域的分子間二聚化。該類型的構(gòu)建體已經(jīng)成功用于基于鋅指的DNA結(jié)合基序的環(huán)境中。而且,這些方法能夠?qū)崿F(xiàn)在復(fù)合DNA分子中僅幾個位置的非常特異性的切割。這些方法還可以用于在體內(nèi)引入雙鏈斷裂并在這些位置選擇性整合供體DNA。這些方法還可以用于特異性插入轉(zhuǎn)基因。
      [0318]【(11)具有定制重復(fù)序列順序的重復(fù)序列結(jié)構(gòu)域的構(gòu)建】
      [0319] 由于重復(fù)序列結(jié)構(gòu)域的個體重復(fù)序列單元之間的高度相似性,如上所述的定制DNA結(jié)合多肽的構(gòu)建可能不是通過涉及傳統(tǒng)克隆方法的方法可行的。如在本實施例中詳述的,具有符合關(guān)注啟動子例如Bs4啟動子中預(yù)期DNA序列的重復(fù)序列單元順序的重復(fù)序列結(jié)構(gòu)域(圖17B,C)基于本發(fā)明的識別代碼來確定。特定11.5重復(fù)序列單元順序的產(chǎn)生使用“金門”克隆來完成(Engler等(2008)PLoS 0NE3:e3647)。作為結(jié)構(gòu)單元,我們亞克隆了Hax3的N端和C端以及類似于11.5重復(fù)序列單元的12個體重復(fù)序列單元。每個結(jié)構(gòu)單元含有個體側(cè)翼BsaI位點(圖18),允許片段有序裝配成定制效應(yīng)多肽。效應(yīng)子(ARTBs4)由總共14個片段正確裝配成BsaI相容性二元載體,允許定制效應(yīng)多肽作為N末端標(biāo)記GFP融合體在植物細(xì)胞中農(nóng)桿菌介導(dǎo)的表達(圖18)。
      [0320]【(12)效應(yīng)子作為病毒阻遏物的用途】
      [0321]重復(fù)序列結(jié)構(gòu)域的核苷酸結(jié)合特異性可用于設(shè)計破壞細(xì)胞中病毒復(fù)制的效應(yīng)子。這些效應(yīng)子將表現(xiàn)出針對病毒復(fù)制起點核苷酸序列和對病毒功能重要的其他序列的核苷酸結(jié)合特異性。不需要其他蛋白結(jié)構(gòu)域融合至這些重復(fù)序列結(jié)構(gòu)域蛋白以阻斷病毒功能。它們通過覆蓋復(fù)制起點或其他關(guān)鍵序列(包括啟動子、增強子、長末端重復(fù)序列單元和內(nèi)部核糖體進入位點),通過結(jié)合它們并使它們不為參與病毒復(fù)制和功能的宿主或病毒因子(包括病毒編碼的RNA依賴性RNA聚合酶、核衣殼蛋白和整合酶)接近而類似于經(jīng)典阻遏物起作用。這種策略已經(jīng)成功用于鋅指蛋白(Sera(2005)J.Vir.79:2614-2619 ;Takenaka等
      (2007)Nucl Acids Symposium Series51:429-430)。
      [0322]總結(jié)起來,本發(fā)明還涵蓋用于本發(fā)明任何方法的分離的核酸分子,包含穩(wěn)定整合入其基因組的異源多核苷酸并且包含優(yōu)選可操作連接至啟動子元件和/或可操作連接至關(guān)注基因的上述核苷酸分子的轉(zhuǎn)化植物。轉(zhuǎn)化的植物優(yōu)選是單子葉植物或雙子葉植物。本發(fā)明還涵蓋轉(zhuǎn)化植物的種子。本發(fā)明涵蓋用本發(fā)明多核苷酸或本發(fā)明多肽的任何一個轉(zhuǎn)化的人和非人宿主細(xì)胞。與本發(fā)明多核苷酸和多肽任何一個組合使用的啟動子優(yōu)選是組織特異性啟動子、化學(xué)可誘導(dǎo)性啟動子和病原體可誘導(dǎo)的啟動子。 [0323]雖然本發(fā)明可用于動物和植物系統(tǒng),但一個優(yōu)選的人選實施方案涉及植物系統(tǒng)的使用。術(shù)語植物包括植物細(xì)胞、植物原生質(zhì)體、可再生植物的植物細(xì)胞組織培養(yǎng)物、植物愈傷組織、植物叢和在植物或植物部分中完整的植物細(xì)胞,所述植物部分例如胚、花粉、胚珠、種子、葉、花、枝、果實、根、根尖、花粉囊等。再生植物的后代、變體和突變體也包括在本發(fā)明范圍內(nèi),條件是這些部分包含引入的多核苷酸。
      [0324]【材料和方法】
      [0325]【菌株和生長條件】大腸桿菌在溶源性肉湯(LB)中37°C培養(yǎng),根癌農(nóng)桿菌GV3101在添加了適當(dāng)抗生素的酵母提取肉湯(YEB)中30°C培養(yǎng)。
      [0326]【植物材料和接種】本塞姆氏煙草植物在溫室中生長(日夜溫度分別為23°C和190C ),16h光照和40至60%濕度。5至7周大的植物的成熟葉被接種農(nóng)桿菌,使用之前描述的無針注射器(SI)。接種的植物被轉(zhuǎn)移至Percival生長室(Percival Scientific), 16h光照,22°C和18°C夜間溫度。
      [0327]【人工效應(yīng)子的構(gòu)建】具有修飾的重復(fù)序列區(qū)的效應(yīng)子的構(gòu)建是基于Esp3I (Fermentas)限制片段的連接。Esp3I在其識別序列外切割并且通常每個重復(fù)序列一次。為了構(gòu)建用于產(chǎn)生本發(fā)明效應(yīng)子的GATEWAY(Invitrogen)-相容的ENTRY-載體,hax3的N端和C端通過PCR擴增,使用校閱聚合酶(HotStar HiFidelity Polymerase Kit ;Qiagen),組合SOE (重疊擴展剪接)-PCR,并插入pCR8/GW/T0P0,得到具有1.5重復(fù)序列單元的hax3衍生物(pC3SE26 ;第一重復(fù)序列=NI ;后半個重復(fù)序列=NG)。在起始密碼子之前的Ibp移碼通過定點誘變插入,以允許框內(nèi)N端融合,使用GATEWAY重組(Invitrogen),得到PC3SEIF。單個重復(fù)序列單元從TAL效應(yīng)子擴增,使用結(jié)合大多數(shù)重復(fù)序列單元的正向引物和重復(fù)序列特異性反向引物。兩個引物誘導(dǎo)了天然存在的Esp3I位點。為了避免擴增超過一個重復(fù)序列,模板DNA在PCR反應(yīng)之前用Esp3I消化。PCR產(chǎn)物用Esp3I消化并克隆Λ Esp3I消化的pC3SE26,產(chǎn)生具有2.5重復(fù)序列單元的Hax3衍生物,其中單個重復(fù)序列可用Esp3I切除(HD-重復(fù)序列=Hax3的重復(fù)序列5 ;N1-重復(fù)序列=Hax3的重復(fù)序列11 ;NG-重復(fù)序列=Hax4的重復(fù)序列4 ;NN-重復(fù)序列=Hax4的重復(fù)序列4的G13N突變體)。ArtHD效應(yīng)子骨架構(gòu)建體由Hax3的N端和C端組成,具有被突變成HD-重復(fù)序列的后半個重復(fù)序列。得到的構(gòu)建體被Esp3I限制酶切并脫去磷酸。編碼重復(fù)序列單元的DNA片段用Esp3I從含有單個HD-重復(fù)序列的pC3SE26衍生物切除,并經(jīng)由瓊脂糖凝膠純化。連接使用載體的摩爾過量插入物進行以促進連環(huán)體連接,并轉(zhuǎn)化入大腸桿菌。重復(fù)序列單元在重組質(zhì)粒中的數(shù)目使用StuI和HincII來測定。具有重復(fù)序列類型的隨機組合的ArtXl-3效應(yīng)子通過從克隆的單個N1-、HD-、NN-和NG-重復(fù)序列單元(分別對A、C、G/A和T特異性)分離編碼如上所述重復(fù)序列單元的DNA片段而產(chǎn)生。片段各自以等摩爾量加入與載體PC3SEIF的連環(huán)體連接反應(yīng)。選擇含有12.5重復(fù)序列單元的本發(fā)明效應(yīng)子的質(zhì)粒用于隨后分析。通過GATEWAY-重組(Invitrogen)將效應(yīng)子克隆入pGWB6(S2)以表達N端GFP-效應(yīng)子融合體。在請求時可獲得寡核苷酸序列。所有構(gòu)建體被測序。
      [0328]【⑶S報告構(gòu)建體】最小Bs4啟動子通過PCR擴增并插入在5’端具有靶DNA框的pENTR/D-TOPO(Invitrogen) (S3 ;圖S5)。啟動子衍生物被克隆入含有無啟動子的uidA基因的 pGWB3 (S2)。
      [0329]【hax2_轉(zhuǎn)基因擬南芥的構(gòu)建】hax2在來自構(gòu)巢曲霉(Aspergillus nidulans)的可誘導(dǎo)alcA啟動子控制下被克隆入含有35S-驅(qū)動的alcR乙醇依賴性調(diào)控基因和nptll選擇標(biāo)記的二兀 T-DNA 載體 binSRNACatN(Zeneca Agrochemicals)的 GATEWAY-相容的衍生物。AlcR驅(qū)動alcA啟動子(S4)的乙醇依賴性誘導(dǎo)。含有這些基因的T-DNA經(jīng)由農(nóng)桿菌被轉(zhuǎn)化入擬南芥Col-Ο,使用花浸接種(S5)。選擇轉(zhuǎn)化子為無菌培養(yǎng)基上的卡那霉素抗性植物。
      [0330]【人工效應(yīng) 子ARTBs4的構(gòu)建】“金門”克隆(Engler等(2008)PLoS0NE3:e3647)被用于裝配具有11.5特別排序重復(fù)序列單元的效應(yīng)子。Hax3的N端和C端和類似11.5重復(fù)序列單元的12個體重復(fù)序列單元被亞克隆。每個結(jié)構(gòu)單元含有個體側(cè)翼BsaI位點,允許片段有序裝配成人工效應(yīng)子。為了靶向裝配具有任何所需重復(fù)序列組成的效應(yīng)子,擴增重復(fù)序列單元的所有結(jié)構(gòu)單元。為了允許DNA中四個天然堿基(A、C、G和T)任何一個的靶特異性,根據(jù)每個重復(fù)序列單元的氨基酸12和13選擇四個不同的重復(fù)序列類型。四個重復(fù)序列類型及其特異性為:NI = A ;HD = C ;NG = T,NN = G或A。為了產(chǎn)生普遍適用的裝配試劑盒,對應(yīng)于四個重復(fù)序列單元類型的每一個的四個單元用針對12個重復(fù)序列位置每一個的側(cè)翼BsaI位點來克隆。48個結(jié)構(gòu)單元的總和類似于文庫,可用于裝配具有四個重復(fù)序列單元類型任意組成的11.5重復(fù)序列單元的效應(yīng)子。
      [0331]【β-葡糖醛酸酶(OTS)分析】關(guān)于瞬時⑶S分析,遞送效應(yīng)子構(gòu)建體的農(nóng)桿菌株和⑶S報告構(gòu)建體1:1混合,并以0.8的0D_接種入本塞姆氏煙草葉。兩個葉盤(0.9cm直徑)在侵潤后(dpi) 2天取樣,并如前所述使用4-甲基-傘形酮酰-β -D-葡糖苷酸(MUG)來測定定量GUS活性(SI)。使用Bradford測定(BioRad)定量蛋白。數(shù)據(jù)對應(yīng)于來自不同植物的三個重復(fù)樣品。關(guān)于定性⑶S分析,葉片侵潤后2天取樣,在X-Gluc (5-溴-4-氯-3-吲哚基-β-D-葡糖苷酸)染色溶液(S3)中孵育,乙醇中脫色,并干燥。實驗被進行至少兩次,具有相似結(jié)果。[0332]【hax2、hax3和hax4的表達】hax2、hax3和hax4在組成型花椰菜花葉病毒35S啟動子控制下在植物中表達,使用PAGH2、pAGH3和pAGH4 (S6)。
      [0333]【DNA酶I足跡】DNA酶I足跡如所述進行(S7),具有下述修改:Bs3和Bs3_E啟動子DNA的熒光標(biāo)記的PCR產(chǎn)物分別使用質(zhì)粒pCRBluntll-TOPO::FPBs3 (-211至+108 的 Bs3 啟動子片段)和 pCRBluntl1-TOPO::FPBs3_E (-224 至 +108 的 Bs3_E 啟動子片段)作為模板和Phusion DNA聚合酶(Finnzymes)來產(chǎn)生。UPA20-ubm-rl6啟動子DNA的熒光標(biāo)記產(chǎn)物使用質(zhì)粒pCRBluntll-TOPO::FPU20-ubm_rl6 (含有ubm-rl6突變的_213to+86的UPA20啟動子片段(S7)作為模板和Phusion DNA聚合酶(Finnzymes)來產(chǎn)生。質(zhì)粒 pCRBluntl1-TOPO::FPBs3、pCRBluntl1-TOPO::FPBs3_E 和pCRBluntll-TOPO::FPU20-ubm-r 16 使用 Thermo Sequenase Dye Primer Manual CycleSequencing Kit (USB)根據(jù)生產(chǎn)商說明來測序。使用內(nèi)部Gene Scan_500LIZ SizeStandard (Applied Biosystems)來測定 DNA 片段大小。
      [0334]【實施例2:結(jié)合G核苷酸的TAL重復(fù)序列單元的鑒定】
      [0335]TAL效應(yīng)子的DNA結(jié)合結(jié)構(gòu)域包括隨機排列的34氨基酸重復(fù)序列單元。重復(fù)序列單元的氨基酸序列是大部分保守的,除了確定DNA靶特異性的在位置12和13兩個相鄰的高度可變殘基(HVR) (Boch 等(2009) Science326:1509-1512 ;Moscou&Bogdanove (2009)Science326:1501)o功能分析鑒定了優(yōu)先結(jié)合A (NI)、C (HD)、T (NG,IG)或相等結(jié)合G和 A(NN)的 HVR (Boch 等(2009) Science326:1509-1512)。生物信息分析揭示了在給定啟動子-TAL效應(yīng)子相互作用中特異性匹配G的HVR (Moscou & Bogdanove (2009)Science326:1501)o然而,該分析基于單個(HN&NA)或兩個(NK)相互作用位點。在我們的觀點中,相互作用位點太低以致于不能對HVR特異性產(chǎn)生可靠結(jié)果。然而,這些HVR可以被認(rèn)為是可以介導(dǎo)對G特異性結(jié)合的適合候選物。 [0336]為了澄清具有未知特異性的HVR的靶特異性,我們利用Bs3啟動子中AvrBs3和框之間的公認(rèn)相互作用。使用定點誘變,我們通過NK取代第5和第6重復(fù)序列單元中的HVR NI,得到AvrBs3-NK5/6。在野生型Bs3啟動子中,第5和第6重復(fù)序列的NI殘基都匹配A核苷酸。使用定點誘變,我們通過兩個C、G和T核苷酸取代Bs3啟動子中的兩個A核苷酸。野生型Bs3啟動子和三個啟動子突變體融合至UidA報告基因并通過與野生型AvrBs3或AvrBs3-NK5/6組合的在本塞姆氏煙草葉中的根癌農(nóng)桿菌瞬時表達來測試。GUS分析揭示,AvrBs3-NK5/6僅與“GG”Bs3啟動子突變體組合時激活⑶S報告子,而AvrBs3僅激活Bs3野生型啟動子構(gòu)建體。
      [0337]我們的分析表明,NK對特異性結(jié)合G,并因此提供產(chǎn)生更特異性重復(fù)序列陣列以及特異性靶向G富集靶序列的選擇。
      [0338]【實施例3:經(jīng)由金門克隆產(chǎn)生設(shè)計效應(yīng)子的方法】
      [0339]TAL效應(yīng)子的DNA結(jié)合結(jié)構(gòu)域包括隨機排列的34氨基酸重復(fù)序列單元(REF)。重復(fù)序列單元的氨基酸序列是大部分保守的,除了確定DNA靶特異性的在位置12和13的兩個相鄰的高度可變殘基(HVR) (Boch等(2009) Science326:1509-1512 ;Moscou&Bogdanove (2009) Science326:1501)。不同的HVR繼續(xù)以不同的特異性水平結(jié)合個體A、C、G或T核苷酸。重要的是,統(tǒng)計學(xué)分析表明,隨機排列的重復(fù)序列單元不干擾相鄰單元的特異性(Moscou & Bogdanove (2009) Science326:1501)。因此,具有預(yù)定特異性的重復(fù)序列單元的模塊式裝配可能提供產(chǎn)生具有預(yù)期DNA特異性的DNA識別模塊的有效方式。
      [0340]然而,由于事實上重復(fù)序列單元是幾乎相同的,編碼所需重復(fù)序列結(jié)構(gòu)域的DNA構(gòu)建體的產(chǎn)生是有難度的。過去,我們已經(jīng)使用化學(xué)合成來產(chǎn)生編碼具有預(yù)期HVR組成的
      17.5重復(fù)序列單元的效應(yīng)基因。為了使重復(fù)序列單元在DNA水平上的差異最小化,我們利用了遺傳密碼的簡并性。與相應(yīng)的TAL效應(yīng)子野生型基因相反,17.5重復(fù)序列單元編碼DNA序列的密碼子優(yōu)化序列是可PCR擴增的,并且可進行基于PCR的誘變。我們的發(fā)現(xiàn)還證明,效應(yīng)子重復(fù)序列結(jié)構(gòu)域的化學(xué)合成一般是可行的。然而,化學(xué)合成不允許快速且成本有效地產(chǎn)生具有預(yù)期HVR組成的多個效應(yīng)子。而且,該方法最可能不允許產(chǎn)生具有20或更多重復(fù)序列單元的重復(fù)序列結(jié)構(gòu)域。
      [0341]最近報道的“金門克隆”提供了產(chǎn)生預(yù)期組成的重復(fù)序列單元的可選方法。該策略是基于IIS型限制酶的使用,它在其識別序列外切割。我們使用產(chǎn)生4-bp粘性末端的IIS型酶Bsal。由于識別和切割位點在IIS型酶中是獨立的事實,我們原則上可以通過BsaI限制酶切產(chǎn)生256(44)個不同粘性末端,提供多片段連接的基礎(chǔ)。適當(dāng)設(shè)計切割位點,通過IIS型限制酶切割的兩個或多個片段可以被連接成缺少最初限制位點的產(chǎn)物(Engler等
      (2008)PLoS 0NE3:e3647 ;Engler 等(2009)PLoS 0NE4:e5553)。
      [0342]然而在實踐中,該方法存在兩個限制。由于在一些反應(yīng)中的外切核酸酶活性,單鏈突出DNA粘性末端從四個堿基減少到三個堿基,實際上使相容的粘性末端數(shù)目僅為16 (24)。其次,連接反應(yīng)的效率隨插入序列的大數(shù)目而急劇下降,插入序列的大數(shù)目是產(chǎn)生具有通常存在于天然存在的功能性TAL效應(yīng)子中的17.5重復(fù)序列單元的效應(yīng)子所需的。為了克服這些限制,我們設(shè)計了兩階段連接過程,該過程允許20、30、40或更多重復(fù)序列單元的效應(yīng)子的有效產(chǎn)生。
      [0343]我“重復(fù)陣列構(gòu)建試劑盒”的基礎(chǔ)是一組“插入質(zhì)粒”,它含有個體重復(fù)序列單元(每個質(zhì)粒一個重復(fù)序列單元)、含有由10重復(fù)序列單元集合組成的重復(fù)序列結(jié)構(gòu)域的“中間載體”、和含有TAL效應(yīng)子的N端和C端非重復(fù)序列區(qū)的一個“受體載體”。所有重復(fù)序列單元以使BsaI限制位點在插入質(zhì)粒中的插入序列兩側(cè)的方式被設(shè)計。
      [0344]為了簡化多片段連接的擴增,我們用大寫字母定義重復(fù)序列單元基因的不同末端(代替粘性末端的序列突出端),并且指明其方向(重復(fù)序列單元的N端或C端),N或C在方括號中(例如A[C])。含有第一重復(fù)序列單元基因的插入質(zhì)粒以使BsaI處理產(chǎn)生A[N]和B[C]末端的方式設(shè)計。第二重復(fù)序列單元基因在BsaI切割后具有B[N]和C[C]末端,而具有第三重復(fù)序列單元的插入質(zhì)粒的BsaI切割導(dǎo)致C[N]和D[C]末端,依此類推。因為僅相容末端可以被融合,第一重復(fù)序列單元基因的B[C]末端將特異性融合至第二重復(fù)序列單元基因的B[N]末端。類似地,第二重復(fù)序列單元的C[C]末端將特異性連接至第三重復(fù)序列單?;虻腃[N]末端,等等。
      [0345] BsaI消化釋放具有4_bp粘性突出的重復(fù)序列單元,僅與設(shè)計的相鄰重復(fù)序列單元相容。BsaI識別位點本身保留在切割的插入質(zhì)粒載體中,并且釋放的插入序列沒有BsaI識別位點。在切割-連接反應(yīng)(切割和連接同時進行)中,重復(fù)序列單元以突出端規(guī)定的順序連接在一起。由于BsaI和連接酶的同時作用,避免了重復(fù)序列單元復(fù)制入插入供體載體,因為這恢復(fù)BsaI識別位點。相反,預(yù)期連接產(chǎn)物缺乏BsaI識別位點。該實驗設(shè)計使該克隆程序聞度有效。[0346]為了產(chǎn)生被設(shè)計為識別特定堿基序列的效應(yīng)子,為每個重復(fù)序列單元位置制成四個變體。這些變體是具有特定核苷酸識別特異性的個體重復(fù)序列單元(例如,用于識別C堿基的位置12和13的HD殘基,用于識別A的NI,等等)。每個位置的變體用針對每個重復(fù)序列單元的適當(dāng)粘性末端制成,例如針對重復(fù)序列單元I的A[N]和B[C]末端,使得存在針對重復(fù)序列單元I的四個可能的插入質(zhì)粒,基于所需的DNA識別來選擇。對于重復(fù)序列單元2有四個變體,對于每個重復(fù)序列位置具有不同的核苷酸識別特異性和B[N]和C[C]末
      端坐坐』而?寸寸ο
      [0347]連接分兩個階段進行。在第一階段,10重復(fù)序列單元被組合成中間載體。10重復(fù)序列單元的不同集合可以在中間載體中組合。中間載體I含有重復(fù)序列單元1-10,中間載體2含有重復(fù)序列單元11-20,等等。在第二階段,單獨裝配的10重復(fù)序列單元被組合入受體載體。受體載體還含有效應(yīng)子的N端和C端重復(fù)序列區(qū),使得包括10、20、30、40或其他多個10重復(fù)序列單元的完整效應(yīng)子在最終構(gòu)建體中裝配。中間載體在插入序列中具有BsaI位點,用于引入10重復(fù)序列單元片段,還在側(cè)翼載體序列中具有側(cè)翼BpiI位點。BpiI是具有不同于BsaI的識別位點的另一 IIS型酶。使用Bsal,10重復(fù)序列單元首先被裝配成“中間載體”,然后使用Bpil,裝配的10聚體作為一個片段釋放。該片段在BpiI切割-連接酶反應(yīng)中與受體載體連接,受體載體含有在TAL效應(yīng)子的N端和C端非重復(fù)序列區(qū)之間的BpiI位點。在這種情況下,僅2-4個插入序列被連接入受體載體。這允許使每次連接是高度特異性的,并且容易裝配40和更多重復(fù)序列單元。
      [0348]其中重復(fù)序列單元陣列被最終克隆的受體載體代表GATEWAY Entry克隆,因此允許效應(yīng)子基于重組轉(zhuǎn)移入任何預(yù)期表達構(gòu)建體。目前,受體載體被設(shè)計為產(chǎn)生TAL型轉(zhuǎn)錄因子。然而,通過很少修飾,受體載體還允許重復(fù)序列融合至FokI內(nèi)切核酸酶或其他所需功能結(jié)構(gòu)域。
      [0349]該方法的示意圖提供于圖19A-D。
      [0350]【實施例4:靶DNA特異性核酸酶的產(chǎn)生和測試】
      [0351]包含識別靶DNA序列和FokI核酸酶(“TAL-型核酸酶”)的本發(fā)明重復(fù)序列結(jié)構(gòu)域的融合蛋白通過本文公開和本領(lǐng)域已知的任何方法所描述的產(chǎn)生。通過與相應(yīng)靶DNA孵育來測試融合蛋白的核酸酶活性。重復(fù)序列結(jié)構(gòu)域DNA靶位點被克隆入質(zhì)粒載體(例如,bluescript)的多克隆位點。作為陰性對照,使用不含有TAL核酸酶靶位點或具有突變的克隆靶位點的“空載體”。在用TAL-型核酸酶處理DNA底物之前,載體通過用適合的標(biāo)準(zhǔn)內(nèi)切核酸酶處理來線性化,所述標(biāo)準(zhǔn)內(nèi)切核酸酶切割載體骨架。該線性化載體與體外產(chǎn)生的重復(fù)序列結(jié)構(gòu)域-FokI核酸酶融合蛋白孵育,通過瓊脂糖凝膠電泳分析產(chǎn)物。凝膠電泳中兩個DNA片段的檢測指示特定核酸酶介導(dǎo)的切割。相反,不含有被重復(fù)序列結(jié)構(gòu)域識別的靶位點的陰性對照不受重復(fù)序列結(jié)構(gòu)域-FokI核酸酶融合蛋白處理的影響。用于體外基因表達和蛋白合成的DNA驅(qū)動的無細(xì)胞系統(tǒng)被用來產(chǎn)生重復(fù)序列結(jié)構(gòu)域-FokI核酸酶融合蛋白(例如,T7高收率蛋白表達系統(tǒng);Promega)。為了使用這種系統(tǒng),重復(fù)序列結(jié)構(gòu)域-FokI核酸酶融合蛋白核苷酸序列在T7RNA聚合酶之前被克隆。經(jīng)由體外轉(zhuǎn)錄和翻譯產(chǎn)生的此類融合蛋白不經(jīng)進一步純化而用于DNA切割分析。
      [0352]冠詞“一個(a)”和“一個(an)”在本文指一個或多于一個(即,至少一個)的冠詞語法賓語。作為例子,“一個元件”指一個或多個元件。[0353]說明書通篇的詞語“包含”或變化形式例如“包括”或“含有”將被理解為表示加入所描述的元件、整數(shù)或步驟、或元件、整數(shù)或步驟的組,但不排除任何其他元件、整數(shù)或部分、或元件、整數(shù)或步驟的組。
      [0354]說明書中提到的所有出版物和專利申請指示本發(fā)明所屬領(lǐng)域技術(shù)人員的水平。所有出版物和專利申請在此通過引用并入,如同每個單獨出版物或?qū)@暾垎h明確且單獨地表明通過引用并入。此外,下述專利申請的每一個在此通過引用整體并入:2009年I月12日提交的 DE102009004659.3,和 2009 年 7 月 13 日提交的 US61/225, 043。
      [0355]盡管出于理解清楚的目的而通過示例說明和實施例在一些細(xì)節(jié)描述了前述發(fā)明,但顯然,可以在所附 權(quán)利要求的范圍內(nèi)進行某些改變和調(diào)整。
      【權(quán)利要求】
      1.一種制備選擇性識別靶DNA序列中至少一個堿基對的多肽的方法,所述方法包括合成包含重復(fù)序列結(jié)構(gòu)域的多肽,其中所述重復(fù)序列結(jié)構(gòu)域包含至少一個衍生自轉(zhuǎn)錄激活子樣(TAL)效應(yīng)子的重復(fù)序列單元,其中所述重復(fù)序列單元包含決定所述靶DNA序列中堿基對的識別的高變區(qū),其中所述重復(fù)序列單元負(fù)責(zé)所述DNA序列中一個堿基對的識別,并且其中所述高變區(qū)包含選自由以下組成的組的成員: (a)用于識別C/G的HD; (b)用于識別A/T的NI; (c)用于識別T/A的NG; (d)用于識別C/G或A/T或T/A或G/C的NS; (e)用于識別G/C或A/T的NN; (f)用于識別T/A的IG; (g)用于識別C/G的N; (h)用于識別C/G或T/A的HG; ⑴用于識別T/A的H ;和 (j)用于識別G/C的NK。
      2.權(quán)利要求1所述的方法,其中所述高變區(qū)對應(yīng)于所述重復(fù)序列單元中的氨基酸12和13。
      3.權(quán)利要求1或2所述的方法,其中所述重復(fù)序列結(jié)構(gòu)域包含1.5至40.5個重復(fù)序列單元。
      4.權(quán)利要求1或2所述的方法,其中所述重復(fù)序列結(jié)構(gòu)域包含11.5至33.5個重復(fù)序列單元。
      5.權(quán)利要求1-4任一項所述的方法,其中所述多肽還包含至少一個可操作連接至所述重復(fù)序列結(jié)構(gòu)域的附加結(jié)構(gòu)域。
      6.權(quán)利要求5所述的方法,其中所述附加結(jié)構(gòu)域包括細(xì)菌、病毒、真菌、卵菌、人、動物、植物或人工蛋白或其部分。
      7.權(quán)利要求6所述的方法,其中所述附加結(jié)構(gòu)域包括能夠修飾DNA或RNA的蛋白或其功能性部分或結(jié)構(gòu)域。
      8.權(quán)利要求6所述的方法,其中所述附加結(jié)構(gòu)域包括選自由以下組成的組的蛋白或其功能性部分或結(jié)構(gòu)域:轉(zhuǎn)錄激活子、轉(zhuǎn)錄阻遏物、抗性介導(dǎo)蛋白、核酸酶、拓?fù)洚悩?gòu)酶、連接酶、整合酶、重組酶、解離酶、甲基化酶、乙?;D(zhuǎn)移酶、去甲基化酶和脫乙酰酶。
      9.權(quán)利要求1-8任一項所述的方法,其中所述多肽的重復(fù)序列結(jié)構(gòu)域通過表達編碼所述多肽的DNA序列而被合成,并且其中所述編碼所述多肽的DNA序列通過在一個或多個靶載體中預(yù)裝配所述重復(fù)序列單元而被裝配,所述靶載體可以隨后被裝配成包含所述編碼所述多妝的DNA序列的最終載體。
      10.權(quán)利要求1-9任一項所述的方法,其中所述重復(fù)序列單元包含30至40個氨基酸。
      【文檔編號】C12N15/63GK103992393SQ201410199018
      【公開日】2014年8月20日 申請日期:2010年1月12日 優(yōu)先權(quán)日:2009年1月12日
      【發(fā)明者】烏拉·博納斯, 延斯·博赫, 塞巴斯蒂安·朔爾納克, 托馬斯·拉艾 申請人:烏拉·博納斯, 延斯·博赫, 塞巴斯蒂安·朔爾納克, 托馬斯·拉艾
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1