国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      多物種多核苷酸控制序列的制作方法

      文檔序號:580648閱讀:393來源:國知局
      專利名稱:多物種多核苷酸控制序列的制作方法
      技術領域
      本發(fā)明涉及能夠在若干工業(yè)相關物種中驅動基因表達的新穎的核酸序列。
      背景技術
      為了優(yōu)化多種感興趣的化合物的生產,重組DNA技術提供了非常相關的工具箱 (toolbox) 0這些工具允許以可能進行多種改變的方式高效修飾基因組DNA。所述工具包 括同源基因的過表達、異源基因的過表達、同源基因的缺失、通向不想要的副產物的代謝 通路的阻斷、代謝通路的轉換。盡管相當高效,但是所有這些方法中均存在一個共同的缺 陷它們使用物種特異性的調節(jié)系統(tǒng)。如果想測試由某基因編碼的酶的特性,最通常在一 個物種——實驗室最偏好的物種中完成。如果這樣的基因得自不同的供體物種,常常需 要密碼子優(yōu)化來允許所述酶在新的宿主中表達(見例如Sinclair & Choy. 2002. ftx)tein Expr Purif.沈96-105)。隨著合成DNA的成本越來越低,對已知基因而言這變成可行的 途徑,但是平均成本仍在每個基因1000美元左右(假設平均基因長度為1. 5-2. Okb)。然 而,存在這一途徑仍然沒用的情況(i)基因序列未知時,即在宏基因組篩選(metagenomic screening)項目中;(ii)蛋白質需要供體特異性陪伴分子(chaperones)或輔助酶如P450 酶時;(iii)DNA、RNA中間產物和/或酶對新宿主有毒時;(iv)酶的折疊對于活性而言是必 需的,但是新宿主不可能進行折疊;(ν)想要制備許多已知酶時,合成DNA的總體成本又會 變得非常高,即1000個合成基因花費1百萬美元。提高成功概率而不提高合成DNA的一種解決方案是在若干不同的物種中測試酶 表達,這提高了每種酶至少在所述宿主之一中成功表達的概率。然而目前技術水平的工具 僅允許物種特異性表達盒。對每種宿主而言使用物種特異性啟動子,并且當想要在多種生 物中評價相同的酶時這導致過多的克隆工作。新技術可能使得后一問題的負擔更??;通過使用有效的現(xiàn)代重組系統(tǒng)(例如 Invitrogen的Gateway系統(tǒng)),應當相對容易地將感興趣的基因從一種質粒轉移至均具有 物種特異性啟動子系統(tǒng)的大范圍多種質粒中。然而在實踐中這仍然涉及大量實驗室程序, 特別是想要測試數(shù)百到數(shù)千個感興趣的基因時。隨著許多基因組序列的迅速可用以及對 具有最適動力學的新穎酶的工業(yè)生物催化的持續(xù)需要,能夠測試數(shù)百到數(shù)千個感興趣的基 因是至關重要的。另外,如(Gateway的技術在啟動子和感興趣的基因之間插入一串核苷酸 O0_30bp),這能夠嚴重妨礙所述基因的轉錄和/或翻譯。因此,對允許在多種不同宿主中評價和/或應用酶的新穎、低成本和高通量的技 術存在需要?!N解決方案可以是能夠在大范圍物種中發(fā)揮功能的啟動子。通過使用這類系 統(tǒng)能夠制造一種表達盒(或一種宏基因組文庫),將其轉移至大范圍的物種中并測試所述 酶的活性。易于使用的例子是(a)高效的酶篩選,即在啟動子后克隆感興趣的基因;首先 在E. coli中測試,然后轉移至多種工業(yè)宿主以分離最佳表達宿主,并直接觀察所述酶在 后者工業(yè)細胞環(huán)境中如何發(fā)揮功能;(b)功能基因組學。隨著全基因組序列的可用性,對 高通量基因功能研究存在遞增的需要。這些用途均依賴于兩個至關重要的步驟勞動力(workhorse)(如生產敲除盒的Ε. coli)中有效克隆的步驟,和引入宿主細胞。然而,由于跨 物種的屏障,兩種物種使用不同的選擇標記物;常用的選擇標記物盒將是非常便利的。給出的兩種例子均只有在啟動子系統(tǒng)能夠在大范圍宿主中發(fā)揮功能時成功。然 而,物種之間,例如真核生物和原核生物之間的啟動子機構之間似乎存在一些至關重要的 差異。后一組最通常依賴于所謂的-10/-35序列和轉錄起點,而前一組盡管具有大量變化, 但是具有對功能性TATA-盒的最小要求。但是在這兩組內也存在許多差異。在真核生物組 中,可能存在或不存在其它序列,如所謂的CAAT-盒、GC-盒和Kozak-序列。這在例如真菌 和哺乳動物啟動子序列之間造成大量差異。例如E. coli是非?!半S便的”物種;其對不同 的啟動子結構和啟動子與基因之間變化的距離具有非常不嚴格的接受度,使其成為成為廣 受喜愛的篩選勞動力。但是物種如Bacillus要嚴格得多,而Mi^ptomyces寬泛的代謝多 樣性可能涉及極度廣泛的啟動子結構,使得不可能在這一組中選取共有(和可預測)的特 征。因此,每種物種具有其自身特異性的,有時是特有的調節(jié)系統(tǒng)。這些基本元素通常決定 了啟動子下游的基因是否實際上被轉錄或阻抑,取決于細胞從環(huán)境獲得的真實信息。因此, 在實踐中啟動子中可能存在不被一種宿主中任何細胞機器識別的序列,而在另一宿主中這 些序列可能是非常強和不想要的轉錄調節(jié)的基礎。在文獻中存在在兩種或三種不同物種中發(fā)揮功能的啟動子系統(tǒng)的例子,但是這 局限于極少且相關的物種。例如,Asturias et al.,1990,F(xiàn)EMS Microbiol Lett 56: 65-68,Alvarez et al,1994,FEMS Microbiol Lett. 115 :119-124 和 Patek et al. ,2003, J Biotechnol 104 :325-334描述了僅在原核生物中有活性的啟動子。Hamer et al., 2001, Proc Natl Acad Sci USA 98 :5110-5115公開了在一種真核生物和一種原核生物如 Magneportha grisea和E. coli中有活性的啟動子。因此在大部分情況下,例子僅限于原核 生物、僅限于兩種物種(即實驗室“勞動力”和最終宿主)或僅限于非常特異性的經分離的 啟動子區(qū)域,或者需要特定的培養(yǎng)條件。一些經改造的啟動子通過融合制造簡單地將真核 生物和原核生物啟動子背靠背地克隆,因此保持它們特有的供體特異性調節(jié)系統(tǒng),所述系 統(tǒng)在其它宿主中可能具有負面影響。還報道了非相容性的例子,甚至是原核生物之間的非相容性。例子可見E. COli和 Brevicompactum(Azza et al.,1994,F(xiàn)EMS Microbial Lett 122 :129-136),S. Iividans和 E. coli (Asturias et al.,1990)。這顯示即便在相關的原核生物綱內仍然存在差異,例如 在革蘭氏陽性和革蘭氏陰性的原核生物之間。因此,盡管多物種啟動子的例子是已知的,但是不能獲得在大范圍具有工業(yè)相關 性的物種中發(fā)揮功能(即在多種原核生物和多種真核生物中有活性)的啟動子,盡管這是 高度期望的。另外,在將這類啟動子與選擇標記物組合的特定應用中,文獻中的實施例僅用 于顯性(即抗生素)選擇標記物,但是對于(a)非抗生素標記物和(b)能夠進行正向和反 向選擇(即針對標記物基因存在或不存在的選擇)的標記物存在持續(xù)增長的需要,以允許 在感興趣的基因被穩(wěn)定整合進宿主基因組中后有效地去除標記物。發(fā)明詳述本說明書和權利要求書中使用的若干術語如下文定義。術語“感興趣的基因”或“基因”在本文中被定義為編碼多肽的多核苷酸序列,無 論所述DNA序列是cDNA、基因組DNA或是合成DNA序列,所述多核苷酸序列可含有一個或多個內含子。術語“具有啟動子活性的多核苷酸序列”在本文中被定義為驅動下游感興趣的基 因轉錄的多核苷酸序列。術語“選擇標記物基因”(或可選擇的標記物基因)在本文中被定義為編碼下述多 肽的感興趣的基因,所述多肽為含有所述基因的細胞提供了表型,使得所述表型允許對含 有所述選擇標記物基因的細胞進行陽性或陰性選擇。選擇標記物基因可被用于在經轉化和 未經轉化的細胞之間區(qū)分,或可被用于鑒定經歷過重組或其它類遺傳修飾的細胞。“乙酰胺酶”在本文中被定義為能夠催化乙酰胺水解成為乙酸和銨,和/或能夠催 化相關的酰胺化合物如丙烯酰胺水解的酶?!癮mdS基因”在本文中被定義為下述感興趣的基因,其優(yōu)選地可得自微生物起源 或者通過合成DNA獲得,并且編碼屬于上文定義的乙酰胺酶的多肽。優(yōu)選地,amdS基因與 本領域已知的一種或多種絲狀真菌amdS基因,即來自A. nidulans、A. oryzae、A. niger、 P. chrysogenum的amdS基因或來自S. cerevisiae的amdS樣基因顯示序列相似性。amdS 基因優(yōu)選地編碼約500到600個氨基酸的蛋白質。因此amdS基因通常包含在約2. Okb的 DNA片段中?;蚪MamdS基因中內含子的存在能夠將所述長度提高至例如約2. 5kb或更 多?!癮mdS基因”是“選擇標記物基因”的一個例子?!癰le基因”在本文中被定義為下述感興趣的基因,其優(yōu)選地可從微生物起源或通 過合成DNA獲得,并且編碼屬于博來霉素(bleomycin)或腐草霉素結合蛋白質的多肽,所 述多肽提供了針對這些毒性分子的抗性。優(yōu)選地,ble基因顯示與一種或多種本領域已知 的 ble 基因,艮口來自轉座子 Tn5、Streptomyces verticillus、Staphylococcus aureus 或 Streptoalloteichus hindustanus的ble基因的序列相似性。ble基因優(yōu)選地編碼約100 到150個氨基酸的蛋白質。因此ble基因通常包含在約0.41Λ的DNA片段中?!癰le基因” 是“選擇標記物基因”的一個例子。術語“Gateway重組”或“Gateway反應”在本文中被用于表示hvitrogen的 Gateway 重組克隆技術。術語“STABY克隆”或“STABY反應”在本文中被用于表示Eurogentec的STABy 克隆技術。本發(fā)明的多核苷酸序列本發(fā)明在第一方面中提供了通式T-T-G-A-C-W-N(o)-Y1-A-Y2-A-A-T-H1-H2-N(ρ)-S1I2-W-K1-K2-N(Q)-H3-M1-M2-H4-A-T-G (式 I)的多核苷酸序列,其中N是核苷酸A、C、G和T中的任何,N(O)長度為16、17或18個核苷酸;N(ρ)長度 為21,22或23個核苷酸;N(q)長度為2、3、4、5或6個核苷酸;并且N(o)、N(ρ)和N(q)中 每個個體N相同或不同;W是核苷酸A和T中的任何;Y是核苷酸C和T中的任何,并且Y1和t相同或不同;H是核苷酸A、C和T中的任何,并且H^ H2、H3和H4相同或不同;S是核苷酸G和C中的任何,并且S1和&相同或不同;K是核苷酸G和T中的任何,并且K1和K2相同或不同;
      M是核苷酸A和C中的任何,并且M1和M2相同或不同;N (ο)的AG含量低于50 %N(O)的A含量低于35%N(ο)中每個6核苷酸串中的AG含量低于66%N (ρ)的AG含量低于60 %Ν(ρ)中每個6核苷酸串中的AG含量低于83%N (ο)和N (ρ)不含有兩個連續(xù)的GN (q)的G含量低于50 %。本發(fā)明的這些多核苷酸序列具有最大的優(yōu)點當存在于多核苷酸控制序列例如啟 動子中時,所述控制序列會在大范圍工業(yè)相關物種中,在原核生物和真核生物二者中指導 表達。另外,與選擇標記物基因組合應用時,可以在實驗室宿主中進行可選擇的克隆(例如 在E. coli中制造缺失構建體),并使用與最終宿主中相同的構建體。最后,對編碼能夠進行 正向和反向兩種選擇(即針對所述酶的存在和不存在來選擇)的酶如乙酰胺酶的基因(例 如Aspergillus nidulans amdS基因)而言,本發(fā)明的多核苷酸控制序列提供了非常有效 的選擇標記物盒,所述選擇標記物盒可以在大范圍工業(yè)相關物種中使用。在一個實施方案中,本發(fā)明的多核苷酸序列具有式I,其中N是核苷酸A、C、G和T中的任何,N(0)長度可以為16、17或18個核苷酸;N(ρ)長 度可以為21、22或23個核苷酸;N(q)長度可以為2、3、4、5或6個核苷酸;并且N(o)、N(p) 和N(q)中每個個體N相同或不同;W是核苷酸A和T中的任何;Y是核苷酸C和T中的任何,并且Y1和t相同或不同;H是核苷酸A、C和T中的任何,并且H^ H2、H3和H4相同或不同;S是核苷酸G和C中的任何,并且S1和&相同或不同;K是核苷酸G和T中的任何,并且K1和K2相同或不同;M是核苷酸A和C中的任何,并且M1和M2相同或不同;N (ο)的 AG 含量低于 40 % ;N (ο)的A含量低于25 % ;N(ο)中每個6核苷酸串中的AG含量低于50% ;Ν(ρ)的 AG 含量低于 5O % ;Ν(ρ)中每個6核苷酸串中的AG含量低于70% ;N (ο)和N (ρ)不含有兩個連續(xù)的G ;N (q)的G含量低于50 %。在另一實施方案中,本發(fā)明的多核苷酸序列具有式I,其中N是核苷酸A、C、G和T中的任何,N(0)長度可以為16、17或18個核苷酸;N(ρ)長 度可以為21、22或23個核苷酸;N(q)長度可以為2、3、4、5或6個核苷酸;并且N(o)、N(p) 和N(q)中每個個體N相同或不同;W是核苷酸A和T中的任何;Y是核苷酸C和T中的任何,并且Y1和t相同或不同;H是核苷酸A、C和T中的任何,并且H^ H2、H3和H4相同或不同;
      7
      S是核苷酸G和C中的任何,并且S1和&相同或不同;K是核苷酸G和T中的任何,并且K1和K2相同或不同;M是核苷酸A和C中的任何,并且M1和M2相同或不同;N (ο)的 AG 含量低于 25 % ;N(ο)中每個6核苷酸串中的AG含量低于50% ;N (ρ)的 AG 含量低于 25 % ;Ν(ρ)中每個6核苷酸串中的AG含量低于50% ;N (ο)和N (ρ)不含有兩個連續(xù)的G ;N (q)的G含量低于50 %。還在另一個實施方案中,本發(fā)明的多核苷酸序列具有式I,其中N是核苷酸A、C、G和T中的任何,N(0)長度可以為16、17或18個核苷酸;N(ρ)長 度可以為21、22或23個核苷酸;N(q)長度可以為2、3或4個核苷酸;并且N(o)、N(ρ)和 N(q)中每個個體N相同或不同;W是核苷酸A和T中的任何;Y是核苷酸C和T中的任何,并且Y1和t相同或不同;H是核苷酸A、C和T中的任何,并且H^ H2、H3和H4相同或不同;S是核苷酸G和C中的任何,并且S1和&相同或不同;K是核苷酸G和T中的任何,并且K1和K2相同或不同;M是核苷酸A和C中的任何,并且M1和M2相同或不同;N (ο)的 AG 含量低于 50 % ;N (ο)的A含量低于35 % ;N(ο)中每個6核苷酸串中的AG含量低于66% ;N (ρ)的 AG 含量低于 6O % ;Ν(ρ)中每個6核苷酸串中的AG含量低于83% ;N (ο)和N (ρ)不含有兩個連續(xù)的G ;N (q)的G含量低于50 %。還在另一個實施方案中,本發(fā)明的多核苷酸序列具有式I,其中N是核苷酸A、C、G和T中的任何,N(O)長度為16、17或18個核苷酸;N(ρ)長度 為21,22或23個核苷酸;N(q)長度為2、3或4個核苷酸;并且N(o)、N(ρ)和N(q)中每個 個體N相同或不同;W是核苷酸A和T中的任何;Y是核苷酸C和T中的任何,并且Y1和t相同或不同;H是核苷酸A、C和T中的任何,并且H^ H2、H3和H4相同或不同;S是核苷酸G和C中的任何,并且S1和&相同或不同;K是核苷酸G和T中的任何,并且K1和K2相同或不同;M是核苷酸A和C中的任何,并且M1和M2相同或不同;N (ο)的 AG 含量低于 25 % ;N(ο)中每個6核苷酸串中的AG含量低于50% ;N (ρ)的 AG 含量低于 25 % ;
      N(p)中每個6核苷酸串中的AG含量低于50% ;N (ο)和N (ρ)不含有兩個連續(xù)的G ;N (q)的G含量低于50 %。優(yōu)選地,本發(fā)明的多核苷酸序列具有式I,其中N是核苷酸A、C、G和T中的任何,N(O)長度為17個核苷酸;N(ρ)長度為23個核 苷酸;N(q)長度可以為3或4個核苷酸;并且N(o)、N(p)和N(q)中每個個體N相同或不 同;W是核苷酸A和T中的任何;Y是核苷酸C和T中的任何,并且Y1和1相同或不同;!1是核苷酸々、(和11中的任何,并且!11、!12、!13和!14相同或不同;S是核苷酸G和C中的任何,并且S1和&相同或不同;K是核苷酸G和T中的任何,并且K1和K2相同或不同;M是核苷酸A和C中的任何,并且M1和M2相同或不同;N(O)的 AG 含量低于 50% ;N(O)的A含量低于35% ;N(ο)中每個6核苷酸串中的AG含量低于66% ;Ν(ρ)的 AG 含量低于 60% ;Ν(ρ)中每個6核苷酸串中的AG含量低于83% ;N (ο)和N (ρ)不含有兩個連續(xù)的G ;N (q)的G含量低于50 %。更優(yōu)選地,本發(fā)明的多核苷酸序列具有式I,其中N是核苷酸A、C、G和T中的任何,N(O)長度為17個核苷酸;N(ρ)長度為23個核 苷酸;N(q)長度為3或4個核苷酸;并且N(o)、N(p)和N(q)中每個個體N相同或不同;W是核苷酸A和T中的任何;Y是核苷酸C和T中的任何,并且Y1和1相同或不同;!1是核苷酸々、(和11中的任何,并且!11、!12、!13和!14相同或不同;S是核苷酸G和C中的任何,并且S1和&相同或不同;K是核苷酸G和T中的任何,并且K1和K2相同或不同;M是核苷酸A和C中的任何,并且虬和M2相同或不同;N (ο)的 AG 含量低于 50 % ;N(O)的A含量低于35% ;N(ο)中每個6核苷酸串中的AG含量低于66% ;N (ρ)的 AG 含量低于 6O % ;Ν(ρ)中每個6核苷酸串中的AG含量低于83% ;N (ο)和N (ρ)不含有兩個連續(xù)的G ;N (q)的G含量低于50 % ;沒有精確匹配SYGGRG的6核苷酸串,其中R可以是核苷酸A和G中的任何。在一個優(yōu)選的實施方案中,本發(fā)明的多核苷酸序列選自由SEQ ID No. 1至51、76
      9和77組成的組。更優(yōu)選地,所述多核苷酸序列選自由SEQ IDNo. 46-51,76和77組成的組。 最優(yōu)選地,本發(fā)明的多核苷酸序列具有SEQ ID No. 48所示的序列。具有與本發(fā)明多核苷 酸序列基本同源的序列的多核苷酸也包括在本發(fā)明中。具有與本發(fā)明的多核苷酸序列“基 本同源”的多核苷酸序列的多核苷酸序列被定義為具有下述多核苷酸序列的多核苷酸,所 述多核苷酸序列與本發(fā)明的多核苷酸序列具有至少30%、優(yōu)選地至少35%,更優(yōu)選地至少 40 %,至少45 %,至少50 %,或至少55 %的同一性程度。仍然更優(yōu)選至少60 %,至少65 %, 至少70 %,至少75 %,至少80 %,至少85 %或至少90 %的同一性程度。甚至仍然更優(yōu)選至 少95 %,至少96 %,或至少97 %的同一性程度。最優(yōu)選至少98 %或至少99 %的同一性程 度,其中所述基本同源的多核苷酸序列展示啟動子活性?;就吹亩嗪塑账嵝蛄锌砂ǘ鄳B(tài)性,所述多態(tài)性可存在于來自不同種群的細 胞中,或者由于天然等位基因變異或株系內變異而存在于種群內?;就吹亩嗪塑账嵝?列也可源自天然來源,或者可以是人工設計及合成的。就本發(fā)明的目的而言,兩條多核苷酸序列之間的同一性程度是指兩條序列之 間相同的核苷酸的百分比。同一性程度使用Altschul et al. 1990. J. Mol. Biol. 215 403-410 中描述的 BLAST 算法測定。公眾可以通過 NationalCenter for Biotechnology Information (http //www, ncbi. nlm. nih. gov/)獲得用于進行 BLAST 分析的軟件。BLAST 算法參數(shù)W、T和X決定了比對的靈敏度和速度。BLAST算法使用以下作為默認值11的 字長(W)、BL0SUM62 評分矩陣(見 Henikoff & Henikoff. 1989. Proc. Natl. Acad. Sci. USA 89 :10915),50的比對⑶,10的預期(E)、M = 5、N = -4并且兩條鏈均比較。優(yōu)選地,使 用用于比較短DNA片段的特定軟件完成比較;例如使用可通過Hie European Molecular Biology Open Software Suite 網站(通過 http: //emboss, bioinformatics. nl/)獲得的 禾呈序Fuzznucο與本發(fā)明的多核苷酸序列相關并且通過小核苷酸串的插入、添加和/或缺失獲得 的多核苷酸序列也是本發(fā)明的部分。這類插入、添加和/或缺失的長度可以變化,例如為從 1-1000個核苷酸,優(yōu)選地1-100個核苷酸,更優(yōu)選地1-20個核苷酸,進一步更優(yōu)選地1-10 個核苷酸,仍然更優(yōu)選地1-6個核苷酸且最優(yōu)選地1-3個核苷酸,但是仍然導致具有啟動 子活性的具有生物活性的多核苷酸序列。特定多核苷酸序列的功能性部分也是本發(fā)明的 部分。這類功能性部分可以從本發(fā)明多核苷酸序列的任一端縮短例如1-50個核苷酸,優(yōu)選 地1-30個核苷酸,更優(yōu)選地1-25個核苷酸,進一步更優(yōu)選地1-20個核苷酸,仍然更優(yōu)選地 1-15個核苷酸,仍然更優(yōu)選地1-10個核苷酸,最優(yōu)選地1-5個核苷酸。在一個實施方案中,本發(fā)明的多核苷酸序列是更長的多核苷酸構建體如多核苷酸 控制序列的部分,其中例如添加了 5’延伸或例如3’延伸。這些將在下文中討論。本發(fā)明一個特定的實施方案描述了具有“改進的功能性”的多核苷酸控制序列。 “改進的功能性”覆蓋了大范圍典型的啟動子方面。這些包括但不限于反式或順式作用轉 錄因子識別的序列;穩(wěn)定化元件;染色質重塑元件;富含AT的元件。這類元件可以有目的 地引入(通過定向克隆,與其它啟動子或合成DNA設計融合)或隨機引入(通過誘變、易錯 PCR和/或定向進化),之后進行適當?shù)暮Y選實驗來分離具有“改進的功能性”的多核苷酸 控制序列。尤其有用的是活性啟動子變體的全合成文庫。本發(fā)明的多核苷酸或核酸序列可以是經分離的基因組、cDNA、RNA、半合成、合成來源的多核苷酸或其任何組合。術語“經分離的多核苷酸或核酸序列”在本文中使用時表示 基本不含其它核酸序列的多核苷酸或核酸序列,例如通過瓊脂糖電泳測定為至少約20%純 凈,優(yōu)選地至少約40%純凈,更優(yōu)選地至少約60%純凈,進一步更優(yōu)選地至少約80%純凈, 最優(yōu)選地至少約90%純凈。例如,可通過遺傳工程中使用的標準克隆步驟獲得經分離的核 酸序列,從而將核酸序列從其天然位點再定位于其會被再生產的不同位點。根據(jù)本發(fā)明的多核苷酸控制序列和核酸構建體在另一方面中,本發(fā)明提供了包含本發(fā)明的多核苷酸序列或多核苷酸構建體的多 核苷酸控制序列。術語“控制序列^E本文中被定義為包括對多肽的表達來說必需的或有利 的所有組件?!氨磉_”應當被理解為包括涉及多肽生產的任何步驟,其可包括轉錄、轉錄后修 飾、翻譯、翻譯后修飾、融合、多聚化、成熟和分泌。根據(jù)本發(fā)明的多核苷酸控制序列對編碼 多肽的核酸序列而言可以是內源的(native)或外源的(foreign)??刂菩蛄械睦影ǎ?但不限于啟動子序列、前導序列、最適翻譯起始序列(如Kozak, 1991,J. Biol. Chem. 266 19867-19870中所述)、分泌信號序列、原肽序列、多聚腺苷酸化序列、轉錄終止子。在一個優(yōu)選的實施方案中,本發(fā)明的控制序列是核酸構建體的部分。根據(jù)本發(fā)明 的核酸構建體含有與本發(fā)明的多核苷酸控制序列可操作地連接的感興趣的基因,所述多核 苷酸控制序列指導所述感興趣的基因編碼的多肽在合適的(表達)宿主中表達。當核酸構建體含有編碼序列在具體宿主生物中表達所需的所有控制序列時,術語 “核酸構建體”與術語“表達載體”或“表達盒”同義。表達載體可以是可便利地進行重組DNA 步驟并可導致編碼多肽的核酸序列的表達的任何載體(例如質粒或病毒)。對載體的選擇 應典型地取決于載體與要引入載體的細胞的相容性。載體可以是線性的或閉合環(huán)狀質粒。載體可以是自主復制的載體,即作為染色體外實體存在的載體,其復制不依賴于 染色體的復制,例如質粒、染色體外元件、小染色體或人工染色體?;蛘撸d體可以是下述載體,當其被引入細胞時整合進基因組中,并與其中整合了 所述載體的染色體一起復制。整合型克隆載體可以隨機或在預先確定的靶基因座上整合進 宿主細胞的染色體中。在本發(fā)明的一個優(yōu)選的實施方案中,整合型克隆載體包含與宿主細 胞基因組中預先確定的靶基因座中的DNA序列同源的DNA片段,用于將克隆載體的整合靶 向該預先確定的基因座上。為了促進定向整合,克隆載體優(yōu)選地在轉化宿主細胞前被線性 化。優(yōu)選地進行線性化使得克隆載體的至少一端(但是優(yōu)選任一端)側翼是與靶基因座同 源的序列。靶基因座側翼的同源序列的長度優(yōu)選地至少0. 11Λ,進一步優(yōu)選地至少0. 2kb, 還更優(yōu)選地至少0. 51Λ,進一步更優(yōu)選地至少11Λ,進一步優(yōu)選地至少0. 21Λ,更優(yōu)選地至少 0. 51Λ,進一步更優(yōu)選地至少11Λ,最優(yōu)選地至少21Λ。術語“可操作地連接”在本文中被定義為下述構型,其中控制序列被適當?shù)刂糜谂c 感興趣的基因序列的編碼序列相關的位置,使得控制序列能指導多肽的生產。本領域技術 人員應當明白轉錄和翻譯終止信號不總是非常確定的,并且不需要被特異性地添加至感興 趣的基因序列,盡管特異性添加能夠提高多肽生產的總體效率。多核苷酸控制序列優(yōu)選地 含有本發(fā)明的多核苷酸序列的部分或全部。多核苷酸控制序列可以是任何核酸序列,所述 核酸序列在包括突變體、截短和雜種啟動子的細胞中顯示轉錄調節(jié)活性,并且可以得自任 何來源,包括但不限于基因組DNA、合成DNA、拷貝DNA。多核苷酸控制序列對細胞或感興趣 的基因而言可以是同源或異源的。
      控制序列還可以包括合適的轉錄終止子序列,這是被多種宿主細胞識別為終止轉 錄的序列。終止子序列與編碼多肽的感興趣的基因的3’末端可操作地連接。在細胞中有 功能的任何終止子都可用于本發(fā)明中??刂菩蛄幸部梢园ê线m的信號序列,這是對細胞內運輸而言重要的被翻譯區(qū)。 信號序列與編碼多肽的感興趣基因的5’端可操作地連接。在多種宿主細胞中有功能的任 何信號序列都可用于本發(fā)明中??刂菩蛄羞€可以包括合適的切割序列,這是對翻譯后修飾而言重要的被翻譯區(qū)。 取決于活性模式,信號序列與編碼多肽的感興趣的基因的5’或3’端可操作地連接。在多 種宿主細胞中或體外有功能的任何信號序列都可用于本發(fā)明中??刂菩蛄羞€可以包括合適的標簽序列,這是對體外純化而言重要的被翻譯區(qū)。標 簽序列與編碼多肽的感興趣的基因的5’或3’可操作地連接。或者,標簽序列可以被插入 多肽序列內。在多種宿主細胞中有功能的任何標簽序列都可用于本發(fā)明中。控制序列也可以包括多聚腺苷酸化序列——與感興趣的基因的3’端可操作地連 接,并且在轉錄后被宿主細胞識別為對經轉錄的mRNA添加多聚腺苷殘基的信號。在細胞中 有功能的任何多聚腺苷酸化序列都可用于本發(fā)明中。本發(fā)明的多核苷酸控制序列在至少三種不同的物種中驅動表達。優(yōu)選地,它們在 至少四種不同的物種中驅動表達。更優(yōu)選地,本發(fā)明的多核苷酸控制序列在至少五種不同 的物種中驅動表達。進一步更優(yōu)選地,本發(fā)明的多核苷酸控制序列在至少六種不同的物種 中驅動表達。仍然更優(yōu)選地,本發(fā)明的多核苷酸控制序列在至少八種不同的物種中驅動表 達。最優(yōu)選地,本發(fā)明的多核苷酸控制序列在至少十種不同的物種中驅動表達。優(yōu)選的多核苷酸控制序列是在以下組中的至少三種中驅動多肽表達的多核苷酸 控制序列哺乳動物、植物、藻類、真菌、酵母、革蘭氏陽性細菌、革蘭氏陰性細菌或古細菌。 更優(yōu)選地是在四種或更多這些組中驅動表達的多核苷酸序列。進一步更優(yōu)選地是在五種或 更多這些組中驅動表達的多核苷酸序列。仍然更優(yōu)選地是在六種或更多這些組中驅動表達 的多核苷酸序列。最優(yōu)選地是在所有七組中驅動表達的多核苷酸序列。在另一個優(yōu)選的實施方案中,根據(jù)本發(fā)明的多核苷酸控制序列指導多肽在以 下屬中的至少四禾中中表達 Escherichia、Streptomyces、Bacillus、Gluconobacter Λ Pseudomonas、Clostridium、Saccharomyces、Kluyveromyces、Pichia、Penicillium、 Aspergi1Ius、Mortiere11a、Chrysosporium、Acremonium、Trichoderma、Cricetulus、Homo0根據(jù)本發(fā)明的核酸構建體中具體的感興趣的基因根據(jù)本發(fā)明的核酸構建體中感興趣的基因可以是編碼相關多肽的任何基因。在一個實施方案中,感興趣的基因是選擇標記物基因。優(yōu)選地使用以下的選擇標 記物基因中的一個或多個ble、nptll、bla、amdS、URA3、TRPl、LEU2和pyrG,包括所述已知 基因的所有基本同源和有功能的類似變體,包括合成和密碼子適應的變體。更優(yōu)選地,感興 趣的基因是ble基因或乙酰胺酶基因。ble基因是一種非常便利的選擇標記物基因,因為所 述基因較小,乙酰胺酶基因的優(yōu)點是可能進行正向以及反向選擇。這表示除了使用乙酰胺 作為唯一碳源或氮源針對amdS基因的存在進行的正選擇以外,還使用氟乙酰胺針對amdS 基因的存在進行反選擇(counter selection);(見例如WO 97/06261) 在一個實施方案中,感興趣的基因是Aspergillus nidulans amdS基因,但是編碼
      12具有類似酶活性的任何其它基因會是合適的。這不僅限于與A. nidulans amdS的序列“基 本同源”的氨基酸序列,而且包括“功能類似物”。在本文上下文中,“功能類似物”被定義為具有下述氨基酸序列的多肽,所述氨基 酸序列具有水解乙酰胺或氟乙酰胺的能力。能夠水解類似物質如丙烯酰胺、己二酰二胺或 甲酰胺的多肽也應該被認為包括在該定義中?!盎就吹摹北欢x為具有下述氨基酸序列 的多肽,所述氨基酸序列與特定的氨基酸序列具有至少30%、更優(yōu)選地至少40%、更優(yōu)選 地至少50%、仍然更優(yōu)選地至少60%、仍然優(yōu)選地至少70%、仍然更優(yōu)選地至少80%、仍然 更優(yōu)選地至少90%、仍然更優(yōu)選地至少95%和最優(yōu)選地至少99%的同一性程度,該基本同 源的肽展示乙酰胺酶活性并且提供了在氟乙酰胺上的反向選擇?;就吹亩嚯目砂ǘ?態(tài)現(xiàn)象,其可能由于天然的等位變異或菌株內變異而存在于來自不同種群的細胞或種群內 的細胞中?;就吹亩嚯倪€可源于除特定氨基酸和/或DNA序列起源的物種以外的物種, 或可由人工設計和合成的DNA序列編碼。與特定的DNA序列相關并通過遺傳密碼子的簡并 獲得的DNA序列也是本發(fā)明的部分。同源物也可包括全長序列的生物活性片段。當然,本發(fā) 明的范圍不限于實施例中使用的特定選擇標記物基因。本領域技術人員應當理解,原則上 可以使用任何選擇標記物基因,包括但不限于顯性、隱性、抗生素、代謝和熒光標記物基因。在另一實施方案中,感興趣的基因是編碼代謝酶、轉錄因子、細胞周期蛋白、蛋白 酶、纖維素酶或抗體的基因。還在另一實施方案中,感興趣的基因是編碼藥物蛋白質或者涉及藥物生產的酶的 基因。本發(fā)明的多核苷酸序列或控制序列可與感興趣的基因融合。這在轉染實驗中尤其 便利。在一個實施方案中,本發(fā)明的多核苷酸控制序列與選擇標記物基因融合。選擇標 記物基因可以是任何選擇標記物基因,但是優(yōu)選地是amdS基因或ble基因。用于獲得根據(jù)本發(fā)明的多核苷酸或多核苷酸控制序列的方法還在另一方面中,本發(fā)明提供了獲得本發(fā)明的多核苷酸序列的方法。根據(jù)本發(fā)明 的多核苷酸序列可以得自任何物種。本發(fā)明的多核苷酸可以通過雜交獲得。對應于本發(fā)明多核苷酸的變體(例如天然 等位基因變體)和同源物的核酸分子可以基于它們與本文公開的核酸的同源性,使用本文 公開的核酸或其合適片段作為雜交探針,根據(jù)標準雜交技術,優(yōu)選地在高嚴格度雜交條件 下獲得?;蛘呖梢酝ㄟ^可以獲得的基因組數(shù)據(jù)庫應用芯片篩選。雜交反應的“嚴格度”可容易地由本領域常規(guī)技術人員測定。雜交反應嚴格度的其 它細節(jié)禾口角軍釋見 Ausubel et al. 1995. Current Protocols in Molecular Biology, Wiley Interscience Publishers。可以通過例如篩選所述微生物的基因組文庫來分離核酸序列。一旦使用例如源 于SEQ ID NO 1或51的探針檢測到編碼具有本發(fā)明活性的多肽的核酸序列,則可以通過 利用本領域常規(guī)技術人員已知的技術來分離或克隆所述序列(見Sambrook et al. 1989, Molecular Cloning,A Laboratory Manual,2d edition,Cold Spring Harbor,New York)。也可以如下實現(xiàn)從這類(基因組)DNA中克隆本發(fā)明的核酸序列例如使用基于聚 合酶鏈式反應(PCR)的方法或對表達文庫的抗體篩選來檢測具有共享結構特征的被克隆^DNAyHfS (JAL Innis et al. 1990. PCR :A Guide to Methods and Application,Academic Press, New York.)。本文提供的序列信息不應被狹義地認為需要包括被錯誤識別的堿基。本文公開的 特定序列可被容易地用于分離完整的多核苷酸或核酸序列,這隨后可被容易地用于進一步 的序列分析,從而鑒定測序錯誤。除非另有說明,使用自動化DNA測序儀測定本文中通過對DNA分子測序所測定的 所有核苷酸序列,并且通過翻譯如上測定的DNA序列預測本文中測定的DNA分子編碼的所 有多肽的氨基酸序列。因此,如本領域所已知的,對通過該途徑測定的任何DNA序列而言, 本文中測定的任何核苷酸序列可含有錯誤。通過自動化測定的核苷酸序列與被測序的DNA 分子的真實核苷酸序列典型地至少約90%相同,更典型地至少與95%到至少約99. 9%相 同。可通過其它途徑(包括本領域公知的手動DNA測序方法)更精確地測定真實的序列。 還如本領域已知的,與真實序列相比,被測定的核苷酸序列中的單個插入或缺失會引起核 苷酸序列翻譯中的移碼,從而由被測定的核苷酸序列編碼的預測氨基酸序列與被測序的核 苷酸分子實際編碼的氨基酸序列會從這樣的插入或缺失點開始完全不同。本領域技術人員 能夠鑒定這些被錯誤識別的堿基,并知道如何糾正這類錯誤。在一個實施方案中,以下述方式通過計算機來設計本發(fā)明的合適的多核苷酸序 列,所述方式使得它們具有某一長度并且與合適的控制序列組合。這類多核苷酸序列可以 合成制造并克隆在任何感興趣的基因前。在一個優(yōu)選的實施方案中,多核苷酸序列可以來自在某些物種中高水平表達(特 征是具有至少0.5% (w/w)的總細胞mRNA的mRNA濃度)的天然基因。在另一優(yōu)選的實施 方案中,啟動子可以來自中度水平表達(特征是具有至少0.01%直到0.5% (w/w)的總細 胞mRNA的mRNA濃度)的天然基因。在另一個優(yōu)選的實施方案中,啟動子可以來自低水平 表達(特征是低于0. 01 % (w/w)總細胞mRNA的mRNA濃度)的天然基因。在一個進一步更優(yōu)選的實施方案中,使用微陣列數(shù)據(jù)來選擇基因,從而選擇具有 某轉錄水平和調節(jié)的這些基因的多核苷酸控制序列。藉此,可以將基因表達盒改造為最適 合其要發(fā)揮功能的條件?;蛘呖梢栽诳蛇x擇標記物基因例如抗生素抗性基因如ble基因前克隆隨機DNA 片段,所述抗生素抗性基因編碼提供針對化合物如硫酸博來霉素(zeocin)、博來霉素 (bleomycin)和腐草霉素(phleomycin)的抗性。這是在若干物種(真菌、酵母、細菌)中 使用的選擇標記物基因,盡管具有物種特異性的啟動子。使用選擇性生長條件可以容易地 選擇活性多核苷酸控制序列,因為這會促進在以下述濃度含有硫酸博來霉素(或腐草霉素 或博來霉素或任何合適的替代性化合物)上的生長,所述濃度使其能夠抑制親本細胞或具 有非功能性啟動子的細胞的生長。這些DNA片段可源于任何來源,即不同的物種,經PCR擴 增,合成等等。通過多種方法獲得的本發(fā)明的多核苷酸序列可以被用作多核苷酸控制序列并在 若干物種中測試。這可以同時進行,但是在使用高數(shù)量和良好的選擇體系時,這優(yōu)選地以系 列模式完成。在第一物種中選擇本發(fā)明的活性多核苷酸控制序列后,可以分離DNA并用于 轉染第二物種。使用正確的選擇壓力時,僅會獲得第一被選啟動子的子集,但是這些會驅動 第一和第二物種中的轉錄。所述步驟能夠繼續(xù),直至分離出在所有被選宿主中驅動表達的本發(fā)明的多核苷酸控制序列為止。根據(jù)本發(fā)明的宿主細胞在第一方面中,本發(fā)明涉及包含根據(jù)本發(fā)明的多核苷酸序列、多核苷酸構建體、多 核苷酸控制序列、表達盒或載體并且適用于生產感興趣的化合物的宿主細胞。宿主可以是 作為原核生物或真核生物的任何宿主。優(yōu)選地,宿主是E. coli、B. subtilis.S. cerevisiae 或P. chrysogenum。在一個優(yōu)選的實施方案中,針對定向整合優(yōu)化宿主;合適的宿主的例子 是本領域公知的,例如來自W005/095624,所述文獻通過弓|用并入本文。宿主細胞可以被用于生產合適的感興趣的化合物,包括例如多肽、抗體或初級或 次級代謝產物,如藥物化合物。本發(fā)明的多核苷酸序列的用途還在本發(fā)明的另一方面,在克隆反應、限制性酶消化、重組反應、分子生物學試劑 盒和試劑、酶促篩選、生物催化反應、生物化學反應或發(fā)酵工藝中,使用根據(jù)本發(fā)明的多核 苷酸序列、多核苷酸構建體、多核苷酸控制序列、表達盒或載體,通稱為本發(fā)明的多核苷酸 分子。本發(fā)明的多核苷酸分子和宿主細胞可有利地在用于體外或體內克隆實驗的方法 中使用。由與選擇標記物基因融合的多核苷酸控制序列組成的表達盒的組合具有許多優(yōu) 點。其顯著增強經典的限制性酶和連接克隆的成功率,增強單片段和多片段Gateway重組 反應的成功率,使得能夠進行有效的多片段STABY克隆反應。本發(fā)明的范圍不限于實施例中所述的特定克隆方法,而是也包括其它克隆(商 業(yè))方法如 TOPO 克隆、RED/ET 重組、In Fusion 克隆和 Yeast Recombination 克隆。本發(fā)明的多核苷酸控制序列與選擇標記物基因之間的融合構建體尤其適用于構 建感興趣的基因的過表達或缺失構建體。例如,使用與最終宿主中靶基因真實缺失中要 使用的相同的選擇標記物基因表達盒,通過所謂的雙交換方法(Rothstein. 1983. Meth. Enzymol. 101 =202-211)可以容易地在合適的實驗室勞動力如E. coli中創(chuàng)建基因缺失(細 節(jié)見實施例13)。優(yōu)點是已經能夠在E. coli中選擇正確的構建體,使得能夠得到更快的通 量和更高的成功率。如果選擇標記物基因表達盒被直接重復或重組位點如LOX位點或類似 物(見 http://en.wikipedia.org/wiki/Cre-Lox recombination)包圍,則可能在獲得正 確整合時迅速去除選擇標記物基因表達盒。用于這一目的的高度優(yōu)選的選擇標記物基因是 編碼下述多肽的雙相選擇標記物基因,例如乙酰胺酶基因,所述多肽使得能夠進行正向以 及反向選擇。用于這類正向和反向選擇的優(yōu)選的方法描述于W097/06261中,所述文獻通過 引用并入本文。優(yōu)選的乙酰胺酶基因是具有改進的選擇特性的乙酰胺酶基因。這些是本領 域已知的,例如來自W02007/118836,所述文獻通過引用并入本文。優(yōu)選地使用改進的選擇 性培養(yǎng)基,因為如果存在背景的話這會顯著降低任何背景。還在本發(fā)明的另一方面中,在用于篩選新酶活性的方法中使用了本發(fā)明的多核苷 酸控制序列或核酸盒。在驅動多肽在多種宿主中表達的方法中,特定的感興趣的基因可以被克隆至處于 本發(fā)明多核苷酸序列、多核苷酸控制序列或核酸盒的控制下。因為一些多肽在一些宿主中 不被正確表達,所以不必須針對每個宿主優(yōu)化表達盒而是僅生產能夠在多種宿主中測試的 一種表達盒是有利的。感興趣的基因的數(shù)量和來源根據(jù)定義是不受限制的。其可以是能夠PCR擴增或通過合成DNA獲得的已知基因(如1-1000個基因)的選擇;其可以是宏基因組 文庫(由10. 000-10. 000. 000個未知的多核苷酸序列組成);其可以是來自單個基因的變 體文庫(例如通過易錯PCR、定向進化或基因改組獲得的200-20. 000個變體);其可以是非 轉錄基因的文庫(盡管經測序的基因組的許多基因在所研究的條件下不轉錄,但是它們仍 然可具有高度有趣的酶活性,從而將它們置于功能性啟動子之后會使其能夠被篩選)。例如,可以從處于第一或第二方面的多核苷酸控制下的多種來源中克隆1000個 蛋白酶基因。為了提高被成功表達的基因的百分比從而允許適當?shù)暮Y選過程,可以轉化所 述文庫,針對蛋白酶選擇合適的宿主即B. subtilis、Ε. coli、S. cerevisiae和A.niger,并 且所述啟動子會驅動所有1000個基因在所有這些物種中轉錄。在一個特定的實施方案中,篩選針對細胞內多肽。在另一個特定的實施方案中,篩選針對分泌型多肽。對要被分泌的多肽而言,控 制序列也可以包括信號肽編碼區(qū),所述信號肽編碼區(qū)編碼與多肽的氨基端連接的氨基酸序 列,所述氨基酸序列可以指導被編碼的多肽進入細胞的分泌通路?;蚓幋a序列的5’端可 固有地含有按照翻譯讀碼框與編碼區(qū)的區(qū)段天然連接的信號肽編碼區(qū),所述信號肽編碼區(qū) 編碼分泌型多肽?;蛘?,基因的5’端可含有對編碼序列而言外源的信號肽編碼區(qū)。在基因 通常不含有信號肽編碼區(qū)時,外源信號肽編碼區(qū)可以是需要的?;蛘?,外源信號肽編碼區(qū)可 簡單地代替天然信號肽基因,從而獲得增強的多肽分泌。附圖概述

      圖1展示了從Penicillium chrysogenum pcbC啟動子中去除葡萄糖阻抑的效果。 (A)pcbC啟動子的相關的756個堿基。推定的creA位點加有下劃線,下劃線下是用大寫標 注的堿基對改變(分別從EcoRI改變?yōu)镸imI位點)。用于克隆的相關引入的限制性位點 (NdeI和ClaI)也在原始序列下標注。ATG以大寫和粗體標注。另外,標注了 ATG之前引入 的HpaI位點。(B)對來自帶有野生型啟動子構建體的菌株的樣品進行的rtPCR ; (C)對來 自帶有creA突變體啟動子構建體的菌株的樣品進行的rtPCR。圖例G=葡萄糖;L=乳糖圖2展示了真菌啟動子和細菌啟動子插入物的相關部分。(AM.nidulans gpdA啟 動子的3,部分,其中在ATG之前插入CAT核苷酸,獲得NdeI位點。(B)B. subtilis PE4啟 動子的關鍵部分,其中細菌共有元件加有下劃線。(C)P. chrysogenum pcbC creAIII啟動 子的3’部分,其中在ATG之前插入CAT核苷酸,獲得NdeI位點。垂直線闡述了為了獲得真 菌-細菌融合啟動子而插入的序列。圖3展示了能夠在原核生物中驅動表達的經修飾的真菌啟動子的相關部分。(A) B. subtilis PE4啟動子的關鍵部分,其中細菌共有元件加有下劃線。(B)三種PpcbC變體 的相關部分野生型(WT)和經修飾的(INS和EXC),其中包括的細菌元件加有下劃線,相對 于WT序列的所有修飾為大寫。(C)三種PgpdA變體的相對部分野生型(WT)和經修飾的 (INS和EXC),其中包括的細菌元件加有下劃線,相對于WT序列的所有修飾為大寫。圖4展示了 PgpdA-INS和PgpdA_E)(C啟動子在E. coli中發(fā)揮功能。(A)展示了 E. coli細胞在含有硫酸博來霉素的瓊脂平板上的生長。(B)圖例Pwt = WT gpdA啟動子, Pins = gpdA-INS 啟動子,Pexc = gpdA-EXC 啟動子,neg = “空”E. coli 細胞。圖5展示了式I共有序列后的Penicillium chrysogenum多核苷酸控制序列,Pcl2gl4840啟動子。(A)Wt =野生型多核苷酸控制序列,關鍵元件加有下劃線;⑶1 = Pcl2gl4840的變體多核苷酸控制序列,其中插入CAT創(chuàng)建NdeI位點;CD2 = Pcl2gl4840的 變體多核苷酸控制序列,其中引入了額外的核糖體結合位點(加有下劃線)。引用的堿基對 為大寫。(B)展示了帶有驅動ble基因轉錄的CDl或CD2多核苷酸控制序列任一的E. coli 細胞在含有硫酸博來霉素的瓊脂平板上的生長。圖6展示了帶有pAnamdScA (空心符號)或pUC19(實心符號)的RV308的生長曲 線。方塊(A和D) = 2xYT ;三角(B) = AFM+氯化銨;圓形(C和E) = AFM+乙酰胺。圖 7 展示了用 pBHA-3310amdS 轉化后 Bacillus subtilis 1A747 的生長。(A) PBHA12-DEST的質粒圖譜。(B)pBHA-3310amdS的質粒圖譜。(C)在無氮源(平板1,見圖 D)、乙酰胺(平板2,見圖D)、谷氨酰胺(平板3,見圖D)、谷氨酰胺+乙酰胺(平板4,見圖 D)上對轉化體再劃線。(D)圖C中平板的圖例。圖 8 展示了用 pYDEST-33IOamdS 和 pYDEST-33IlamdS 轉化的 Saccharomyces cerevisiae CEN. PK113-5D ( Δ ura3)的生長。圖例 H20,用水轉化的 CEN. PK113-5D ;3310,用 pYDEST-33IOamdS 轉化的 CEN. PK113-5D ;3310,用pYDEST-3311amdS 轉化的 CEN. PK113-5D。
      實施例一般方法除非另有說明,在實施例中按照文獻(Sambrook et al.,1989,Molecular cloning :a laboratory manual,,,CSHL press,Cold Spring Harbour,NY)中所述使用標準 分子技術。比較實施例1Streptomyces griseus saf 啟動子在 Escherichia coli 中沒有功能為了測試細菌saf啟動子作為可能的一般啟動子的有用性,作為控制ble基因表 達的合成DNA (Codon Devices, Cambridge, MA, USA)生產序列,所述序列編碼介導針對硫酸 博來霉素、博來霉素和腐草霉素的抗性的蛋白質。將SEQ ID N0. 52克隆在pUC19的EcoRI 和BamHI位點中,轉染至E. coli菌株DH5a (Invitrogen)中,并在hYT+100 μ g/ml氨節(jié)西 林中,在存在作為載體主鏈一部分的bla基因時選擇。將氨芐西林抗性克隆在hYT+20 μ g/ml硫酸博來霉素和hYT+100 μ g/ml氨芐西 林(對照)上再劃線。僅在氨芐西林平板上生長是可見的,顯示與Asturias et al. , 1990 的報道相反,saf啟動子在具有ble基因的E. coli中沒有功能,因此不適用于我們的目的。比較實施例2真菌gpdA和pcbC啟動子在hcherichia coli中沒有功能為了測試真菌gpdA和pcbC啟動子作為可能的一般啟動子的有用性,作為控制ble 基因表達的合成DNA(Codon Devices, Cambridge, MA, USA)生產序列,所述序列編碼介導針 對硫酸博來霉素、博來霉素和腐草霉素的抗性的蛋白質。制備Penicillium chrysogenum pcbC啟動子的葡萄糖阻抑不敏感變體Penicillium chrysogenum的pcbC基因是強表達的基因,但是遭受葡萄糖阻抑 (Gutierrez et al. , Microbiology 1999,145:317-324)??梢酝ㄟ^缺失一個或多個 creA 位點來缺失阻抑。因此構建第一啟動子變體,其中缺失了三個推定的creA位點(細節(jié)見圖1A)。為此首先制造對照報告子構建體PEGPT12。其中編碼綠色熒光蛋白的eGFP基因處 于pcbC啟動子的控制下。為此在標準擴增程序中,使用校正酶(HiFi聚合酶,Boehringer Mannheim),從質粒 pEGFP-Cl (Clontech)中使用 SEQ ID NO 53 和 54 的寡核苷酸 PCR 擴 增eGFP基因。在30個PCR循環(huán)后立即向反應混合物中添加1個單位的AmpliTaq聚合酶 (PerkinElmer),并在 37°C下孵育 30 分鐘。這在 pCR2. 1T0P0 Τ/Α 載體(Invitrogen)中引 入了用于有效克隆的3’ -腺嘌呤。通過測序驗證正確的序列。將eGFP克隆進pCR2. 1中, 得到質粒PEGFP7。pcbC基因的啟動子(SEQ ID NO 65)和終止子區(qū)域在使用寡核苷酸SEQ ID NO 55加56擴增得到810bp的片段,使用寡核苷酸SEQID NO 57加58擴增時得到807bp 的片段。二者均如上文所述被擴增并克隆進PCR2. 1T0P0 T/A載體中。藉此引入了若干限 制性位點,以便于進一步的克隆步驟=NarI, HpaI, EcoRV和ClaI (在ATG附近)和NotI, ClaI, SalI和)(baI (在終止子區(qū)域中)。啟動子片段作為NarI-ClaI片段被分離,并被克 隆在終止子克隆的ClaI位點中。用ClaI消化得到的啟動子終止子盒以確保eGFP ORF(作 為ClaI-NarI片段被分離)的連接,得到最終質粒pEGPT12,其中eGFP位于P. chrysogenum pcbC啟動子的控制下。得到的eGFP表達盒可以作為2. 61Λ NotI片段從pEGPT12中分離, 用于轉化 Penicillium chrysogenum。為了缺失第一個creA位點,進行融合PCR。首先進行兩個單獨的PCR反應,來擴 增啟動子的左側和右側部分,在最上游的推定的creA結合位點的位點處引入EcoRI位點 (GAATTC)(見圖1A)。這使用寡核苷酸SEQ ID NO 55加59 (擴增creA位點上游的啟動子 的部分)和使用寡核苷酸SEQ ID NO 60加56 (擴增creA位點下游的啟動子的部分)完 成。將所述片段在瓊脂糖凝膠上分離,從凝膠中提取OliaQuick Extraction kit,Qiagen) 并一起用作使用寡核苷酸SEQ ID NO 55加56的融合PCR反應的模板。將該片段克隆在 PCR2. 1T0P0 Τ/Α中,在序列驗證后分離NdeI-ClaI片段,并用于代替pEGPT12的WT啟動子, 得到帶有位于PpcbC-creAI啟動子(SEQ ID NO 66)控制下的eGFP。為了缺失第二和第三個推定的creA位點,首先使用PpcbC-creAI作為模板進行兩 個單獨的PCR反應,來擴增啟動子的左側和右側部分,在與ATG最接近的兩個推定的creA 結合位點的位點處引入MunI位點(CAATTG)。這使用寡核苷酸SEQ ID NO 55加61 (擴增第 2和第3個creA位點上游的啟動子的部分)和使用寡核苷酸SEQ ID NO 62加56 (擴增第 2和第3個creA位點下游的啟動子的部分)完成。將兩個片段單獨地克隆在pCR2. 1T0P0 Τ/Α中,并且在序列驗證后均通過NdeI-MunI (5,部分)和MunI-ClaI (3,部分)分離。與 經NdeI-ClaI消化的pEGPT12連接后,獲得了所有三個creA位點均已缺失的最終質粒帶 有位于PpcbC-creAIII啟動子(SEQ ID NO 67)控制下的eGFP的質粒。通過NotI消化從質粒主鏈中分離WT和Δ creAIII啟動子變體eGFP表達構建體 二者,并用于轉化P. chrysogenum。涉及將DNA轉移至Penicillium chrysogenum原生質 體的技術是本領域公知的,并且描述于許多參考文獻中,所述參考文獻包括Finkelstein and Ball (eds. ), Biotechnology offilamentous fungi, technology and products, Butterworth-Heinemann(1992) ;Bennett and Lasure(eds.)More Gene Manipulations in fungi,Academic Press (1991) ;Turner,在 Piihler(ed),Biotechnology, 2nd completely revised edition,VHC(1992)中。Ca-PEG介導的原生質體轉化如EP 635,574中所述使 用。來自pHEW-Al的amdS表達構建體(描述于W004/106347中)被用于共轉化。將
      18PpcbC-WT-EGFP 和 PpcbC- Δ creAI II-EGFP 轉化至 P. chrysogenum (使用 0. 25 μ g 的 amdS 表 達構建體)。在含有乙酰胺作為唯一氮源的培養(yǎng)基上選擇轉化體。為了保證獲得穩(wěn)定的轉 化體,在新鮮的乙酰胺平板上對第一輪陽性菌落進行菌落純化,隨后轉移至非選擇性豐富 培養(yǎng)基(rich media) (YEPD)以誘導孢子形成。之后在乙酰胺培養(yǎng)基上再次測試所有菌落。使用穩(wěn)定的amdS轉化體的孢子接種液體培養(yǎng)基。所述培養(yǎng)基之一基本與De Laat et al. (US 2002/0039758)所述相同。在另一培養(yǎng)基中,用葡萄糖代替所有乳糖作為唯一 碳源。(25 !和^Orpm下)生長4天后采樣。使用StrataPr印Total RNA MicroPrep Kit (Stratagene)從約106個細胞中分離總RNA。使用十分之一的總RNA進行寡聚_dT指 導的 cDNA 合成(Thermoscript RT-PCR,Life ^Technologies),所述 cDNA 被用作使用特異 性寡核苷酸 SEQ ID NO 63 禾口 64 的 PCR(SuperTaq by Enzyme Technologies, UK)的 30 個 循環(huán)的模板。通過比較圖IB和IC可以看出,creA位點的缺失完全消除了 pcbC啟動子的 葡萄糖阻抑。在hcherichia coli中測試真菌gpdA和pcbC啟動子的功能性針對在E. coli中驅動表達,測試如上文述Penicillium chrysogenum的pcbC啟 動子(pcbC AcreAIII, SEQ ID NO 67)和 Aspergillus nidulans 的 gpdA 啟動子的葡萄糖 阻抑不敏感的變體。然而,為了進一步克隆的便利,在pcbC啟動子的葡萄糖阻抑不敏感的 變體中,省略HpaI位點,并在ATG前直接引入NdeI位點。兩種構建體均在ble基因前合 成制造(DNA2. 0,Menlo Park, CA 94025,USA)并帶有真菌終止子序列。通過(Gateway反應 (手冊見:www. invitrogen. com)將SEQ ID NO 68和70的兩條多核苷酸(啟動子_ble基 因-終止子)克隆在hvitrogen的pD0NR221載體中,并在卡那霉素選擇后獲得正確的克 隆(分別為 P33O5We 和 p3309ble)。將卡那霉素抗性克隆在hYT+20 μ g/ml硫酸博來霉素和hYT+50 μ g/ml卡那霉 素(對照)上再劃線。僅在卡那霉素平板上生長是可見的,顯示Hamer et al. (2001,Proc Natl Acad Sci USA 98:5110-5115)的觀察結果不是普遍適用的,所述觀察結果描述了帶 有hph基因(針對潮霉素C的抗性)的真菌啟動子trpC在E. coli中的用途。我們的結果 表明文獻中的例子對描述的案例而言是非常特異性的,并且所述方法不是普遍適用的。為了驗證在真菌中的功能,如上文所述將兩種ble表達盒均轉化至 P. chrysogenum原生質體中,并在含有50 μ g/ml腐草霉素的瓊脂平板(YEPD+1. OM蔗糖)上 涂布。因為兩種實驗均得到腐草霉素抗性轉化體,顯然合成的性質沒有改變它們作為真菌 啟動子發(fā)揮功能。比較實施例3真菌-細菌融合啟動子在hcherichia coli中沒有活性在設計在真核生物和原核生物中均有活性的啟動子的下一個嘗試中,適用融合方 法。在所述方法中,原核生物啟動子被插入完整的真核生物啟動子和真核生物起始密碼子 ATG之間。我們使用兩種廣泛使用的強真菌啟動子,即Penicillium chrysogenum的pcbC 啟云力子禾口 Aspergillus nidulans的gpdA啟云力子。在融合方法中測試了如實施例2中制備的Penicillium chrysogenum pcbC啟動 子的葡萄糖阻抑不敏感的變體(pcbC AcreAIII,SEQ ID NO 67)和 Aspergillus nidulans 的gpdA啟動子。
      19
      選擇 Bacillus subtilis 的 PE4 啟動子(Stewart et al.,1998,Virology 246 329-340)作為具有原核生物啟動子的所有已知共有元件的強原核生物啟動子。將含有所有 必需啟動子元件的所述啟動子最后84個堿基插入真菌啟動子和ATG起始密碼子之間(細 節(jié)見圖2)。兩種構建體均在ble基因前合成制造(DNA2. 0,Menlo Park5CA 94025,USA)并 帶有真菌終止子序列。通過Gateway反應(手冊見www. invitrogen. com)將SEQ ID NO 69和71的兩條多核苷酸(啟動子-ble基因-終止子)克隆在hvitrogen的pD0NR221載 體中,并在卡那霉素選擇后獲得正確的克隆(分別為p3308ble和p3312ble)。將卡那霉素抗性克隆在hYT+20 μ g/ml硫酸博來霉素和hYT+50 μ g/ml卡那霉 素(對照)上再劃線。僅在卡那霉素平板上生長是可見的,顯示應用于真菌啟動子如pcbC 和gpdA(SEQ ID NO 69和71)時,簡單地融合真核生物和原核生物啟動子不會得到功能性 E. coli啟動子。為了驗證在真菌中的功能,如實施例2中所述將兩種ble表達盒均轉化至 P. chrysogenum原生質體中,并在含有50 μ g/ml腐草霉素的瓊脂平板(YEPD+1. OM蔗糖)上 涂布。因為兩種實驗均得到腐草霉素抗性轉化體,顯然合成的性質沒有改變它們作為真菌 啟動子發(fā)揮功能。另外,細菌啟動子的插入沒有破壞真菌啟動子的活性。實施例4細菌序列在真菌啟動子中的多位點插入驅動在hcherichia coli中的高效基因 表達在尋找在真核生物和原核生物中均有活性的啟動子的又一次嘗試中,將Bacillus subtilis的PE4啟動子Gtewart et al.,1998)最后84個堿基對中的共有序列插入 Penicillium chrysogenum(SEQ ID NO 67)的葡萄糖阻抑不敏感的pcbC啟動子中和 Aspergillus的gpdA啟動子(SEQ ID NO 70)中的若干位置處。這得到分別包埋于多核苷 酸控制序列SEQ ID No 72和74中的多核苷酸序列SEQ ID NO 46和48。所有構建體均在 ble基因前合成制造(DNA2.0,Menlo Park, CA 94025,USA),之后帶有真菌終止子(分別得 到質粒p3306ble和p3310ble)。在一些情況下細菌序列在插入位點處代替真菌序列。這 得到分別嵌于多核苷酸控制序列SEQ ID No 73和75中的多核苷酸序列SEQ ID No 47和 49 (即序列交換分別得到質粒p3307ble和p3311ble)。通過Gateway反應(手冊見:www. invitroRen. com)將多核苷酸克隆進 Invitrogen的pD0NR221載體中,并在卡那霉素選擇后獲得正確的克隆。將卡那霉素抗性 克隆在hYT+20 μ g/ml硫酸博來霉素和hYT+50 μ g/ml卡那霉素(對照)上再劃線。使用 未改造的真菌啟動子作為對照(見實施例2,p33(^ble和p3309ble,SED ID NO 68和70)。 在具有源自兩種真菌啟動子的變體的兩種選擇平板上均可看到良好的生長(見例如圖4), 與之相反,未經修飾的真菌啟動子僅在卡那霉素平板上適當?shù)厣L。測序顯示只有啟動子中包含以下共有序列的克隆獲得了陽性的結果(圖3和SEQ ID NO. 1 到 45)T-T-G-A-C-W-N (o) -Y1-A-Y2-A-A-T-H1-H2-N (ρ) -S1-S2-W-K1-K2-N (q) -H3-M1-M2-H4-A -T-G,(式 I)其中,N可以是核苷酸A、C、G和T中的任何,N(ο)在16和18個核苷酸長度之間;N(ρ)
      20在21和23個核苷酸長度之間;N(q)在2和6個核苷酸長度之間,所有的N可以相同或不 同; W可以是核苷酸A和T中的任何,并且所有的W可以相同或不同;Y可以是核苷酸C和T中的任何,并且所有的Y可以相同或不同;H可以是核苷酸A、C和T中的任何,并且所有的H可以相同或不同;S可以是核苷酸G和C中的任何,并且所有的S可以相同或不同;K可以是核苷酸G和T中的任何,并且所有的K可以相同或不同;M可以是核苷酸A和C中的任何,并且所有的M可以相同或不同;N (ο)的AG含量低于50 %N(O)的A含量低于35%N(ο)中每個6核苷酸串中的AG含量低于66%N (ρ)的AG含量低于60 %Ν(ρ)中每個6核苷酸串中的AG含量低于83%N(ο)和Ν(ρ)不含有兩個連續(xù)的G。N(q)的G含量低于50%。為了驗證在真菌中的功能,如實施例2中所述將在E. coli中活性轉錄的多種 ble表達盒轉化至P. chrysogenum原生質體中,并在含有50 μ g/ml腐草霉素的瓊脂平板 (YEPD+1.0M蔗糖)上涂布。所有實驗均得到腐草霉素抗性轉化體,顯然合成的性質沒有改 變它們作為真菌啟動子發(fā)揮功能。另外,細菌啟動子的插入沒有破壞真菌啟動子的活性。因此,我們驚訝地發(fā)現(xiàn)在真核生物和原核生物中均為活性啟動子的若干多核苷酸 控制序列。親本啟動子來自于不同的真菌起源并具有不同的代謝通路(即分別為初級代謝 和次級代謝),顯示通常使用的真菌啟動子可被改造為在E. coli中發(fā)揮功能。實施例5真菌留醇轉甲基酶樣啟動子在E. coli中驅動表達為了驗證共有序列的普遍適用性,針對下述啟動子區(qū)域篩選Aspergillus niger 和Penicillium chrysogenum的基因組序列,所述啟動子區(qū)域在實施例4中共有序列之后 并且可以在E. coli中使用。例如,鑒定了一種Penici 11 ium chrysogenum啟動子,所述啟動子在標準生長條件 下被活性轉錄(通過Affymetrix MicroArrays驗證)并且跟隨在共有序列后(見圖5A)。 啟動子位于與Candida albicans的甾醇轉甲基酶ERG6具有強相似性的基因前。兩種構 建體在ble基因前合成制造(DNA2. 0,Menlo Park, CA 94025,USA)并且之后是終止序列。 一種合成構建體在啟動子序列中含有一種修飾起始密碼子前的CAT,用于引入NdeI位點 (包埋于多核苷酸控制序列SEQ ID NO 76中的多核苷酸序列SEQ ID NO 50)。其它合成構 建體除了所述CAT以外還在啟動子序列中含有第二修飾插入的核糖體結合位點(RBS ;包 埋于多核苷酸控制序列SEQ ID NO 77中的多核苷酸序列SEQ ID NO 51)。SEQ ID NO 76 和77的兩種多核苷酸序列被克隆在PU19的EcoRI和BamHI位點之間,并且在氨芐西林選 擇后獲得正確的克隆。將氨芐西林抗性克隆在hYT+20 μ g/ml硫酸博來霉素和hYT+100 μ g/ml氨芐西 林(對照)上再劃線。硫酸博來霉素上兩種構建體的生長均是可見的(圖5B),證明共有序 列后的多核苷酸控制序列在真菌和E. coli中均有活性。
      該多核苷酸控制序列僅僅是一個例子;因為能夠獲得多種基因組序列,所以能夠 使用芯片篩選來迅速鑒定基本上同源的多核苷酸控制序列并在合適的物種中對它們進行 測試。實施例6在hcherichia coli中使用amdS基因和的乙酰胺選擇因為編碼乙酰胺酶的amdS基因(例如Aspergillus nidulans amdS基因)是酵母 和真菌中一種有用的可選擇標記物基因,可以針對其存在或不存在容易地選擇轉化體,所 以如果這樣的標記物能夠在原核生物中發(fā)揮作用會是非常有用的,因為它們常常不能夠在 乙酰胺上生長(見例如下文的結果)并且所述基因不是一般代謝的一部分。為此,從分離自 實施例 2 的 amdS positive Penicillium轉化體的mRNA 中 PCR擴增 Aspergillus nidulans amdS 基因的 cDNA。使用 StrataPr印 Total RNA MicroPrep Kit(Stratagene)從約 106 個 細胞中分離總RNA。使用十分之一的總RNA進行寡聚-dT指導的cDNA合成(Thermoscript RT-PCR,Life ^Technologies),所述cDNA被用作使用特異性寡核苷酸SEQ ID NO 78和79的 PCR(使用校正酶)的30個循環(huán)的模板。在30個PCR循環(huán)后立即向反應混合物中添加1個 單位的AmpliTaq聚合酶(PerkinElmer),并在37°C下孵育30分鐘。這在pCR2. 1T0P0 Τ/Α 載體(Invitrogen)中引入了用于有效克隆的3’-腺嘌呤。通過測序驗證正確的序列。之后 將NdeI-NsiI片段再克隆進質粒pISEWAn (W004/106347)中的相同位點中。接著將在E. coli 中不驅動正確表達(見實施例3)的真菌PpcbC啟動子替換為市售質粒中存在的介導氨芐 西林抗性的bla基因的啟動子。為此使用特異性寡核苷酸SEQ ID NO 80和81從質粒主鏈 PCR擴增啟動子。克隆在pCR2. 1T0P0 Τ/Α載體(Invitrogen)中之后,分離EcoRI-NdeI片段 并用于替換為PpcbC,得到pAnamdScA(即處于bla啟動子控制下的Aspergillus nidulans amdS基因)。將構建體轉化至RV308 (ATCC31608),并在hYT+100 μ g/ml氨芐西林上獲得 轉化體。將PUC19轉化至相同的菌株作為對照。將轉化體接種于液體豐富培養(yǎng)基OxYT) 或液體礦物質培養(yǎng)基(AFM :50mM K2HPO4,4mM 檸檬酸,ImMMgSO4, 3mM FeCl3, ImM MnCl2, ImM CaCl2,2g/l蔗糖,含有20mMNH4Cl或lg/1乙酰胺任一作為氮源)中,并在25!和^Orpm下 培養(yǎng)。從圖6中可以看出,帶有pAnamdScA的RV308可以容易地在乙酰胺上生長;甚至比在 銨上更好。能夠獲得這些結果以后,嘗試了在乙酰胺上直接選擇。用pAnamdScA電穿孔后, 在Iml AFM+lg/Ι乙酰胺中再生RV308,并在25°C下孵育1小時,隨后涂布在AFM+lg/Ι乙酰 胺瓊脂平板上。3天后出現(xiàn)菌落,并將7個菌落在^^1+100 μ g/ml氨芐西林上再劃線。從 這些平板中將所述菌落接種于液體AFM+乙酰胺中,并在25°C和^Orpm下培養(yǎng)2天后分離 質粒。所有質粒的限制性消化模式與PAnamdScA精確匹配,這表明在乙酰胺上對E. coli中 的真菌amdS基因進行直接選擇是可能的。實施例7合成的多核苷酸控制序列在hcherichia coli中驅動高效的乙酰胺選擇如實施例6中所示,處于典型的原核生物啟動子控制下的amdS基因可以被用于 在E. coli中選擇容易生長的轉化體。如果使用amdS基因的基于乙酰胺的選擇能夠與顯示 在真菌和E. coli 二者中均發(fā)揮功能的經修飾的合成多核苷酸控制序列組合在一起發(fā)揮作 用,會是極為有用的(見實施例4)。在這種情況下,具有正向和反向兩種選擇(分別在乙 酰胺和氟乙酰胺上)的相同表達盒可在多種物種中使用,減少了克隆步驟,同時從多個物
      22種切換到多個物種。為此通過NdeI-NsiI消化從質粒p3310ble和p3311ble (見實施例4) 中去除ble基因,并用作為pAnamdScA的NdeI-NsiI片段被分離的amdS的cDNA代替(見 實施例6),分別得到p3310amdS和p3311amdS。將轉化混合物(通過將連接混合物轉化至 RV308)直接涂布在AFM+lg/Ι乙酰胺上。25°C三天后在瓊脂平板上獲得菌落,而在對照平板 上無菌落出現(xiàn)。因此,令人驚訝地,本發(fā)明的多核苷酸控制序列與選擇標記物基因如amdS的組合 提供了非常有效的選擇標記物盒,所述選擇標記物盒可在大范圍的工業(yè)相關物種中使用。實施例8合成的多核苷酸控制序列在Penicillium chrysogenum中驅動高效的基因表達為了測試實施例3和4的合成多核苷酸控制序列是否在真菌中驅動轉錄,將所 有構建體(p3305ble、p3306ble、p3307ble、p3308ble、p3309ble、p3310ble、p3311ble 和 p3312ble)轉化至 Penicillium chrysogenum 原生質體。涉及將 DNA 轉移至 Penicillium chrysogenum原生質體的技術是本領域公知的,并且描述于許多參考文獻中,所述參 考文獻包括 Finkelstein and Ball (eds. ), Biotechnology of filamentous fungi, technology and products, Butterworth-Heinemann(1992) ;Bennett and Lasure(eds.) More Gene Manipulations in fungi, Academic Press (1991) ;Turner, in :Piihler (ed), Biotechnology, 2nd completely revised edition,VHC (1992)。Ca-PEG 介導的原生質體轉 化如EP 635,574中所述使用。將1 μ g每種質粒轉化至P. chrysogenum,并在含有1. OM蔗 糖和50 μ g/ml腐草霉素的0. 5xYEPD上選擇轉化體。使用每個構建體可以獲得許多轉化體 (20到1000個之間),而在用水轉化后沒有獲得腐草霉素抗性菌落。因此,在E. coli中有 活性的合成多核苷酸控制序列在P. chrysogenum中也有活性。實施例9合成多核苷酸控制序列在Bacillus subtilis中驅動高效的基因表達為了測試實施例3和4的合成多核苷酸控制序列是否在桿菌(bacilli)中驅動 轉錄,通過(Gateway反應將所選擇的構建體(p3310amdS和p3311amdS,見實施例7)轉移至 Bacillus 載體(pBHA12_DEST)。通過在 pBHA12 載體(W02008/000632)中插入 attRl-cat/ ccdB-attR2 盒獲得 pBHA12-DEST。為 了獲得 pBHA12_DEST,使用 SEQ ID NO 82 禾口 83 的寡 核苷酸,從 pDEST15anvitrogen)中 PCR 擴增 attRl-cat/ccdB_attR2 盒,并在 BpiI 消化后 克隆進pNHA12的BamHI-NotI位點中,得到pBHA12_DEST。培養(yǎng)在Gateway反應后獲得的 TOPlO(Invitrogen)的氨芐西林抗性菌落,分離質粒并通過限制性分析驗證。對兩種克隆而 言均獲得Bacillus-變體載體(分別稱作pBHA_3310amdS和pBHA_33IlamdS)。將兩種質粒 轉化至JM110,來分離可用于B. subtilis轉化的dam-甲基酶陰性DNA。選擇 B.subtilis 1A747(Bacillus Genetic Stock Center, The Ohio State University, Columbus, Ohio 43210USA)作為轉化實驗的宿主菌株?;九囵B(yǎng)基是不含有 N源或含有谷氨酰胺(0. 2% )和/或乙酰胺(0. )的BFA-N。BFA-N (每升)含有K2SO4, 11. 5mM ;K2HPO4 · 5H20,62mM ;KH2PO4,44mM ;檸檬酸鈉· 7H20,3. 4mM ;硫酸鎂· 7H20,0. 8mM ; 葡萄糖,4g ;FeCl3,4mg ;MnSO4,0. 2mg ;CaCl2, 5. 5mg ;ZnCl2,1. 7mg ;CuCl2 · 2H20,0. 43mg ; CoCl2 ·6Η20,0· 6mg ;Na2MoO4 ·2Η20,0· 6mg。在乙酰胺版本的培養(yǎng)基上,B. subtilis 1A747 不 能生長(見圖 7)。將 1 μ g 的 pBHA-3310amdS 和 pBHA_3311amdS 轉化至 B. subtilislA747。在含有12. 5 μ g/ml卡那霉素的LB平板上選擇轉化體17個轉化體帶有pBHA-3310amdS, 190個轉化體帶有pBHA-33IlamdS。將17個pBHA-3310amdS轉化體在不含有N源,或含有 谷氨酰胺(0. 2% )或乙酰胺(0. )或谷氨酰胺(0. 2% )與乙酰胺(0. )的BFA-N瓊 脂平板上再劃線。從圖7中可以看出,帶有pBHA-3310amdS的B. subtilis 1A747能夠在乙 酰胺上非常良好地生長,而B. subtilis 1A747則不能夠。對pBHA-33IlamdS而言獲得了類 似的結果,雖然生長速率更加緩慢。接著嘗試了轉化后直接進行乙酰胺選擇。這僅適用于同時進行的卡那霉素選擇。總而言之,測試的所有啟動子非常令人驚訝地在B. subtilis中沒有功能。因此, 在革蘭氏陰性物種如E. coli和真菌如P. chrysogenum中有活性的合成的多核苷酸控制序 列在革蘭氏陽性物種如B. subtilis中也有活性。實施例10合成的多核苷酸控制序列在Saccharomyces cerevisiae中驅動高效的基因表達為了測試實施例3和4的合成多核苷酸控制序列是否在酵母中驅動轉錄,通過 Gateway 反應將所選擇的構建體(p3305ble、p3306ble、p3307ble、p3309ble、p3310ble、 p3311ble、p3310amdS 和 p331 IamdS ;見實施例 3、4 和 7)轉移至酵母載體(pYES_DEST52)。 培養(yǎng)氨芐西林抗性菌落,分離質粒并通過限制性消化來驗證。對所有克隆而言獲得酵母變 體載體(分別為 pYDEST-33(^ble、pYDEST-3306ble, pYDEST_3310ble、pYDEST_3311ble、 ρYDEST-33IOamdS和 pYDEST_3311amdS)。將Saccharomyces cerevisiae CEN. PK113-5D ( Δ ura3)在液體 YEPD 中、30 °C 和 280rpm下預培養(yǎng)過夜。將培養(yǎng)物10倍稀釋至0. 4的OD6tltl (約IxlO6個細胞/ml)。使用 Genotech的hst-Yeast轉化試劑盒使得細胞成為感受態(tài)。離心20ml培養(yǎng)物;將沉淀物用 20ml洗滌緩沖液洗滌,最后重懸于2ml感受態(tài)緩沖液中。向50 μ 1所述細胞懸浮液中添加 5μ 1 DNA( 1 μ g)或水,和500 μ 1轉化溶液。在30°C下孵育45分鐘后涂布用于在礦物 質培養(yǎng)基上選擇的細胞,同時向其它混合物中添加Iml YEPD進行3小時的延長孵育,來誘 導ble基因的表達,之后涂布在腐草霉素平板上(細節(jié)見表1)。令人驚訝地,如可從表1中看到的,帶有ble基因的所有質粒導致產生了腐草霉素 抗性的酵母菌落,帶有amdS基因的所有質粒導致產生了消耗乙酰胺的酵母菌落(也見圖 8),其中表達由合成的多核苷酸控制序列驅動。作為對照,使用來自MM選擇平板的菌落制 造稀釋液,所述稀釋液被點涂在腐草霉素或乙酰胺選擇性平板上。在所有情況下,證實了直 接選擇的結果。表 1. Saccharomyces cerevisiae 轉化的細節(jié)
      權利要求
      1.通式T-T-G-A-C-W-N (ο) -Y1-A-Y2-A-A-T-H1-H2-N (p) -S1-S2-W-K1-K2-N (q) -H3-M1-M2-H4-A-T-G(式I)的多核苷酸序列, 其中N是核苷酸A、C、G和T中的任何,N(O)長度為16、17或18個核苷酸;N(p)長度為21、 22或23個核苷酸;N(q)長度為2、3、4、5或6個核苷酸;并且N(o)、N(p)和N(q)中每個個 體N相同或不同;W是核苷酸A和T中的任何;Y是核苷酸C和T中的任何,并且Y1和\相同或不同;H是核苷酸A、C和T中的任何,并且Hp H2、H3和H4相同或不同;S是核苷酸G和C中的任何,并且S1和&相同或不同;K是核苷酸G和T中的任何,并且K1和K2相同或不同;M是核苷酸A和C中的任何,并且M1和M2相同或不同;N(o)的AG含量低于50%N(o)的A含量低于35%N(o)中每個6核苷酸串中的AG含量低于66%N(p)的AG含量低于60%N(p)中每個6核苷酸串中的AG含量低于83%N (ο)和Ν(ρ)不含有兩個連續(xù)的GN(q)的G含量低于50%,所述序列存在于多核苷酸控制序列中時允許所述多核苷酸控制序列在大范圍工業(yè)相 關的原核生物和真核生物中指導多肽的表達。
      2.根據(jù)權利要求1所述的多核苷酸,其中N(O)長度為17個核苷酸;N(ρ)長度為23個 核苷酸;N(q)長度為3或4個核苷酸。
      3.根據(jù)權利要求1或2所述的多核苷酸,所述多核苷酸選自SEQIDN0.46至51構成的組。
      4.包含根據(jù)權利要求1-3中任一項所述的多核苷酸序列的多核苷酸構建體。
      5.在下組中的至少三個中指導多肽表達的多核苷酸控制序列哺乳動物、植物、藻類、 真菌、酵母、革蘭氏陽性細菌、革蘭氏陰性細菌或古細菌。
      6.在下述的屬中的至少四個中指導多肽表達的多核苷酸控制序列Escherichia、 Streptomyces、Bacillus、GluconobacterΛ Pseudomonas、Clostridium、Saccharomyces、 Kluyveromyces、Pichia、Penicillium、Aspergillus、Mortierella、Chrysosporium、 Acremonium、Trichoderma、Cricetulus、Homo0
      7.多核苷酸控制序列,其包含根據(jù)權利要求1-3中任一項所述的多核苷酸序列或根據(jù) 權利要求4的多核苷酸構建體。
      8.表達盒,其包含根據(jù)權利要求1-3中任一項所述的多核苷酸序列或根據(jù)權利要求5-7中任一項所述的多核苷酸控制序列。
      9.載體,其包含根據(jù)權利要求1-3中任一項所述的多核苷酸序列、根據(jù)權利要求4所述 的多核苷酸構建體、根據(jù)權利要求5-7中任一項所述的多核苷酸控制序列或根據(jù)權利要求 8所述的表達盒。
      10.宿主細胞,其包含根據(jù)權利要求1-3中任一項所述的多核苷酸序列、根據(jù)權利要求 4所述的多核苷酸構建體、根據(jù)權利要求5-7中任一項所述的多核苷酸控制序列、根據(jù)權利 要求8所述的表達盒或根據(jù)權利要求9所述的載體。
      11.根據(jù)權利要求1-3中任一項所述的多核苷酸序列、根據(jù)權利要求4所述的多核苷酸 構建體、根據(jù)權利要求5-7中任一項所述的多核苷酸控制序列、根據(jù)權利要求8所述的表達 盒或根據(jù)權利要求9所述的載體或根據(jù)權利要求10所述的宿主細胞在克隆反應、限制性酶 消化、重組反應、分子生物學試劑盒和試劑、酶篩選、生物催化反應、生物化學反應或發(fā)酵工 藝中的用途。
      12.根據(jù)權利要求10的宿主細胞用于生產多肽、初級代謝產物或次級代謝產物、抗體 或藥物的用途。
      13.生產多肽、初級代謝產物或次級代謝產物、抗體或藥物的方法,所述方法通過在克 隆宿主中克隆感興趣的基因并在生產宿主中生產多肽、初級代謝產物或次級代謝產物、抗 體或藥物來進行,所述方法包括在克隆宿主和生產宿主二者中均使用相同的多核苷酸控制 序列。
      14.根據(jù)權利要求13所述的方法,其中所述多核苷酸控制序列是根據(jù)權利要求5所述 的控制序列或根據(jù)權利要求9所述的載體。
      15.根據(jù)權利要求13或14所述的方法,其中所述生產宿主是與所述克隆宿主不同的物種。
      16.根據(jù)權利要求13-15中任一項的方法,其中所述感興趣的基因編碼多肽、抗體的部 分、涉及初級代謝產物或次級代謝產物或藥物生產的一種或多種酶。
      17.克隆根據(jù)權利要求1-3中任一項所述的多核苷酸序列或根據(jù)權利要求5-7中任一 項所述多核苷酸控制序列的方法,所述方法包括(a)在根據(jù)本發(fā)明的載體上,在可選擇標記物基因前克隆多核苷酸序列;(b)用來自步驟(a)的所述載體轉染第一物種;(c)針對所述可選擇標記物基因的活性轉錄進行選擇后獲得克隆;(d)從這些克隆中分離DNA;(e)用經分離的DNA轉染另一物種,其中步驟(c)到(e)最少重復2次。
      全文摘要
      本發(fā)明涉及使得多核苷酸控制序列(例如啟動子)能夠在大范圍工業(yè)相關的物種(原核生物以及真核生物兩者)中指導表達的多核苷酸序列。本發(fā)明的多核苷酸序列與選擇標記物基因組合應用時,可在實驗室宿主中進行可選擇的克隆,并在最終宿主中使用相同的構建體。
      文檔編號C12N15/74GK102066563SQ200980122194
      公開日2011年5月18日 申請日期2009年6月11日 優(yōu)先權日2008年6月11日
      發(fā)明者德恩 馬可·亞歷山大·伯格·范 申請人:帝斯曼知識產權資產管理有限公司
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1