国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      多核苷酸文庫的重組酶介導的整合的制作方法

      文檔序號:11109474閱讀:1560來源:國知局
      多核苷酸文庫的重組酶介導的整合的制造方法與工藝

      本申請包括計算機可讀形式的序列表,將其通過引用結合在此。

      發(fā)明領域

      本發(fā)明涉及用于使用位點特異性重組酶將感興趣的多核苷酸文庫整合到絲狀真菌宿主細胞的染色體中的方法,包括宿主細胞和多核苷酸構建體的多核苷酸文庫表達系統(tǒng),連同包含多核苷酸文庫的所得絲狀真菌宿主細胞及其培養(yǎng)物以生產多肽。

      發(fā)明背景

      已經發(fā)現(xiàn)大量的天然存在的有機體產生有用的多肽產物,例如酶,希望酶的大規(guī)模生產用于研究和商業(yè)目的。

      已經描述了宿主細胞的構建,其中,一個高表達染色體基因被替換為位點特異性重組酶的識別序列,以通過使用重組酶識別所述序列(EP 1 405 908 A1;ProBioGen AG)允許將單一產物編碼多核苷酸后續(xù)插入該位點。

      已經披露通過利用自由可逆的位點特異性重組系統(tǒng)在基因組的已知位置插入DNA。這些可逆系統(tǒng)包括以下項:來自細菌噬菌體P1的Cre-lox系統(tǒng);釀酒酵母的FLP-FRT系統(tǒng);魯氏結合酵母(Zygosaccharonzyces rouxii)的R-RS系統(tǒng);來自細菌噬菌體Mu的改良的Gin-gix系統(tǒng);來自枯草芽孢桿菌質粒的β-重組酶-six系統(tǒng)和來自細菌轉座子Tn1000的Δ-γ-res系統(tǒng)。Cre、FLP、R、Gin、β-重組酶和γ-Δ是重組酶,并且lox、FRT、RS、gix、six和res是各自的重組位點(賽杜斯路(Sadowslu)1993年,美國實驗生物學會聯(lián)合會會志(FASEB J.)7:750-67;奧(Ow)和梅德貝里(Medberry)1995年,植物科學評論(Crit.Rev.Plant Sci.)14:239-261作了綜述)。

      以上位點特異性重組系統(tǒng)的共同之處在于單一多肽重組酶催化相同或幾乎相同的序列的兩個識別位點之間的重組的屬性。

      當克隆和篩選編碼真菌宿主細胞中的感興趣的多肽的多核苷酸時,尤其是當篩選編碼真菌宿主細胞分泌的感興趣的多肽的變體的多核苷酸文庫以改進特性時,希望真菌宿主細胞以可比較的水平表達多核苷酸,這樣使得它們的特性可以被直接測定,而不必首先進行歸一化步驟。這個問題通過使用包括真菌復制起始序列(例如,熟知的AMA1序列)的克隆和表達載體已被解決,例如,在EP 1124949中。

      發(fā)明概述

      我們在此提供快速并且位點特異性將編碼感興趣的多肽的多核苷酸文庫插入絲狀真菌宿主的染色體中的有效方式,由于所插入的基因在每個轉化和選擇的宿主細胞的精確相同的基因組位置的僅一個單獨的拷貝中的存在,從而實現(xiàn)轉化體中高度一致的表達水平。

      所得選擇轉化的細胞甚至可以直接用于以對應于初步篩選的那些的改進的高級表達水平生產編碼選擇的多肽。

      因此,在第一方面,本發(fā)明涉及用于使用位點特異性重組酶將感興趣的多核苷酸文庫整合到絲狀真菌宿主細胞的染色體中的方法,所述方法包括以下步驟:

      a)提供絲狀真菌宿主細胞,它按以下順序在其染色體中包含:

      i)該重組酶的第一識別序列或在整合位點的5’或3’的區(qū)域;

      ii)第一選擇標記;

      iii)該重組酶的第二識別序列;以及任選地

      iv)非功能部分第二選擇標記;

      b)用核酸構建體轉化所述宿主細胞,該核酸構建體按以下順序包含:

      i)該重組酶的第一識別序列或在整合位點的5’或3’的區(qū)域;

      ii)感興趣的多核苷酸文庫;

      iii)第二選擇標記或非功能部分第二選擇標記,如果步驟(a)(iv)的相應但任選的非功能第二選擇標記被包括在宿主細胞染色體中的話;和

      iv)該重組酶的第二識別序列;

      c)在所述宿主細胞中表達編碼該位點特異性重組酶的基因;和

      d)選擇轉化的宿主細胞,該宿主細胞表達該第二選擇標記,而不是該第一選擇標記,

      其中這一感興趣的多核苷酸文庫是通過該重組酶位點特異性地以正確的方向整合到該宿主細胞的染色體中,由此,從該染色體切離該第一可選擇標記,并且由此任何非功能部分第二可選擇標記被重組,以形成該染色體中的功能第二選擇標記。

      在第二方面,本發(fā)明涉及多核苷酸文庫表達系統(tǒng),包括:

      a)絲狀真菌宿主細胞,它按以下順序在其染色體中包含:

      i)位點特異性重組酶的第一識別序列或在整合位點的5’或3’的區(qū)域;

      ii)第一選擇標記;

      iii)該重組酶的第二識別序列;以及任選地

      iv)非功能部分第二選擇標記;和

      b)核酸構建體,該核酸構建體按順序在以下元件中包含:

      i)該重組酶的第一識別序列或在整合位點的5’或3’的區(qū)域;

      ii)感興趣的多核苷酸文庫;

      iii)第二選擇標記或非功能部分第二選擇標記,如果步驟(a)(iv)的任選的非功能第二選擇標記被包括在宿主細胞染色體中的話;和

      iv)該重組酶的第二識別序列,和

      c)編碼位點特異性重組酶的基因包括在絲狀真菌宿主細胞中;優(yōu)選地在染色體中,在第二核酸構建體中,或在步驟(b)中列出的元件之外的核酸構建體中;

      其中,當用這一個或多個核酸構建體轉化宿主細胞時,感興趣的多核苷酸文庫是通過重組酶位點特異性地以正確的方向整合到宿主細胞的染色體中,由此,從染色體切離第一可選擇標記,并由此第二選擇標記也被整合并且表達或任何非功能部分第二可選擇標記被重組,以形成表達的染色體中的功能第二選擇標記。

      在第三方面,本發(fā)明涉及所得絲狀真菌宿主細胞,它按以下順序在其染色體中包含:

      i)位點特異性重組酶的第一識別序列或在整合位點的5’或3’的區(qū)域;

      ii)感興趣的多核苷酸文庫;和

      iii)選擇標記和該重組酶的第二識別序列;抑或

      iv)第一部分選擇標記,該重組酶的第二識別序列和第二部分選擇標記,

      其中該宿主細胞表達該多核苷酸文庫和選擇標記。

      在最后方面,本發(fā)明涉及產生感興趣的多肽的方法,該方法包括以下步驟:

      a)在有利于產生由多核苷酸文庫編碼的多肽的條件下,培養(yǎng)第三方面的絲狀真菌宿主細胞,并且;任選地

      b)回收該多肽。

      附圖簡要說明

      圖1示出載體p002的示意圖。

      圖2示出載體pFRT-GIAMG的示意圖。

      圖3示出載體p007的示意圖。

      圖4示出載體pFRT-BsAMG的示意圖。

      圖5示出載體pDAu571的示意圖。

      圖6示出載體pDAu703的示意圖。

      圖7示出以下項的示意圖:

      -頂端部分:在米曲霉宿主菌株DAu716中的染色體的amy2區(qū)域,其中兩個FRT-位點已被插入;

      -中間部分:線性化的載體pDAu724;和

      -底部部分:通過各自的FRT-位點之間的雙同源重組的pDAu724的FLP介導的整合后,米曲霉宿主菌株DAu716中的染色體的amy2區(qū)域。

      圖8示出載體pDLHD0075的示意圖。

      圖9示出質粒pJfyS156的限制性圖譜。

      圖10示出pQM43的限制性圖譜。

      圖11示出pQM45的限制性圖譜。

      定義

      胞嘧啶脫氨酶:胞嘧啶脫氨酶(EC 3.5.4.1)催化胞嘧啶和5-氟胞嘧啶(5FC)的脫氨以分別形成尿嘧啶和有毒5-氟尿嘧啶(5FU)。當包含胞嘧啶脫氨酶的遺傳修飾過的細胞與5FC組合時,它被轉化為有毒5FU,因此胞嘧啶脫氨酶編碼基因潛在地是有效的陰性選擇標記。也已示出,嘧啶從頭(de novo)合成途徑中的抑制劑可以用于創(chuàng)造如下條件,在該條件下細胞依賴于通過胞嘧啶脫氨酶進行的嘧啶補充物到尿嘧啶的轉化。因此,只有表達胞嘧啶脫氨酶基因的細胞可以在陽性選擇介質中被解救,該陽性選擇介質包括嘧啶從頭合成抑制劑連同肌苷和胞嘧啶(參見魏(Wei)和休伯(Huber),1996,生物化學雜志(J Biol Chem)271(7):3812的圖1)。抑制劑優(yōu)選N-(磷酸乙酰)-L-天冬氨酸(PALA),它抑制天冬氨酸氨基甲酰轉移酶。如果需要的話,胞嘧啶脫氨酶的活性可以通過基因測定進行定量(弗雷德里科(Frederico)L.A.等人,1990,生物化學(Biochemistry)29:2532-2537)。

      等位基因變體:術語“等位基因變體”意指占用同一染色體基因座的一種基因的兩個或更多個替代形式中的任一者。等位基因變異由突變天然產生,并且可以導致群體內多態(tài)性?;蛲蛔兛梢允浅聊?在所編碼的多肽中沒有改變)或可編碼具有改變的氨基酸序列的多肽。多肽的等位基因變體是由基因的等位基因變體編碼的多肽。

      催化結構域:術語“催化結構域”意思指酶的包含該酶的催化機器的區(qū)域。

      cDNA:術語“cDNA”意指可以通過從得自真核或原核細胞的成熟的、剪接的mRNA分子進行反轉錄而制備的DNA分子。cDNA缺乏可以存在于對應基因組DNA中的內含子序列。早先的初始RNA轉錄本是mRNA的前體,其在呈現(xiàn)為成熟的剪接的mRNA之前要經一系列的步驟進行加工,包括剪接。

      編碼序列:術語“編碼序列”意指直接指定一個多肽的氨基酸序列的多核苷酸。編碼序列的邊界一般由開放閱讀框架決定,該開放閱讀框架從起始密碼子(如ATG、GTG或TTG)開始并且以終止密碼子(如TAA、TAG或TGA)結束。編碼序列可以是基因組DNA、cDNA、合成DNA或其組合。

      控制序列:術語“控制序列”意指對于表達編碼本發(fā)明的成熟多肽的多核苷酸所必需的核酸序列。每個控制序列對于編碼該多肽的多核苷酸來說可以是天然的(即,來自相同基因)或外源的(即,來自不同基因),或相對于彼此是天然的或外源的。這些調控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉錄終止子。至少,控制序列包括啟動子,以及轉錄和翻譯終止信號。出于引入有利于將這些控制序列與編碼多肽的多核苷酸的編碼區(qū)連接的特異性限制酶切位點的目的,這些控制序列可以提供有多個接頭。

      表達:術語“表達”包括涉及多肽產生的任何步驟,包括但不限于,轉錄、轉錄后修飾、翻譯、翻譯后修飾、以及分泌。

      表達載體:術語“表達載體”意直鏈性或環(huán)狀DNA分子,該分子包含編碼多肽的多核苷酸并且該多核苷酸可操作地與提供用于其表達的控制序列連接。

      片段:術語“片段”是指從成熟多肽或結構域的氨基和/或羧基末端缺失一個或多個(例如,若干個)氨基酸的一種多肽或一個催化或結合結構域;其中該片段已經保留其催化或結合活性。

      宿主細胞:術語“宿主細胞”意指易于用包括本發(fā)明的一種多核苷酸的一種核酸構建體或表達載體進行轉化、轉染、轉導等的任何細胞類型。術語“宿主細胞”涵蓋由于復制期間發(fā)生的突變而與親本細胞不同的親本細胞的任何后代。

      改進的特性:術語“改進的特性”意指與變體相關的與親本相比得到改進的特征。在本發(fā)明中,改進的特性是相對于親本,變體的增加的表達產量。

      增加的表達產量:術語“增加的表達產量”意指相對于在相同的培養(yǎng)條件下,培養(yǎng)每升表達親本基因的相同的宿主細胞產生的分泌的活性酶的量(g),來自培養(yǎng)每升表達變體基因的宿主細胞的培養(yǎng)基的分泌的酶的更高量(g)。在一方面,與親本酶相比,變體具有至少1.05、至少1.10、至少1.20、至少1.30、至少1.40、至少1.50、至少1.60、至少1.70、至少1.80、至少1.90、至少2、至少2.25、至少2.50、至少2.75、至少3.00、至少3.25、至少3.50、至少3.75、至少4、至少4.25、至少4.50、至少4.75、至少5、至少6、至少7、至少8、至少9、或至少10倍的增加的表達產量。

      分離的:術語“分離的”意指處于非天然存在的形式或環(huán)境中的物質。分離的物質的非限制性實例包括(1)任何非天然發(fā)生的物質,(2)包括但不限于任何酶、變體、核酸、蛋白質、肽或輔因子的任何物質,該物質至少部分地從與其本質相關的一種或多種或所有天然發(fā)生的成分中去除;(3)相對于天然發(fā)現(xiàn)的物質通過人工修飾的任何物質;或(4)通過相對于與其天然相關的其他組分,增加物質的量而修飾的任何物質(例如宿主細胞中的重組產生;編碼該物質的基因的多個拷貝;以及比與編碼該物質的基因天然相關聯(lián)的啟動子更強的啟動子的使用)而修飾的任何物質。

      成熟多肽:術語“成熟多肽”意指在翻譯和任何翻譯后修飾如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后處于其最終形式的多肽。本領域已知,宿主細胞可以產生由同一多核苷酸表達的兩種或更多種不同成熟多肽(即,具有不同C-末端和/或N-末端氨基酸)的混合物。本領域還已知,不同的宿主細胞不同地加工多肽,并且因此一個表達多核苷酸的宿主細胞當與另一個表達相同多核苷酸的宿主細胞相比時可以產生不同的成熟多肽(例如,具有不同的C-末端和/或N-末端氨基酸)。

      成熟多肽編碼序列:術語“成熟多肽編碼序列”意指編碼具有催化或結合活性的成熟多肽的多核苷酸。

      核酸構建體:術語“核酸構建體”意指單鏈-或雙-鏈的核酸分子,該核酸分子是從天然存在的基因中分離的,或以本來不存在于自然界中的方式被修飾成包含核酸的區(qū)段,或是合成的,該核酸分子包括一個或多個控制序列。

      可操作地連接:術語“可操作地連接”意指如下的構造,其中,控制序列相對于多核苷酸的編碼序列安置在適當位置,從而使得該控制序列指導該編碼序列的表達。

      序列一致性:用參數“序列一致性”來描述兩個氨基酸序列之間或兩個核苷酸序列之間的相關性。

      出于本發(fā)明的目的,使用如在EMBOSS包(EMBOSS:歐洲分子生物學開放軟件套件(The European Molecular Biology Open Software Suite),賴斯(Rice)等人,2000,遺傳學趨勢(Trends Genet.)16:276-277)(優(yōu)選5.0.0版或更新版本)的尼德爾(Needle)程序中所實施的尼德爾曼-翁施(Needleman-Wunsch)算法(尼德爾曼(Needleman)和翁施(Wunsch),1970,分子生物學雜志(J.Mol.Biol.)48:443-453)來確定兩個氨基酸序列之間的序列一致性。所使用的參數是空位開放罰分10、空位延伸罰分0.5,和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩陣。將標記為“最長同一性”的Needle輸出(使用-nobrief選項獲得)用作百分比同一性并且是如下計算的:

      (一致的殘基X 100)/(比對長度-比對中的空位總數)

      出于本發(fā)明的目的,使用如在EMBOSS包(EMBOSS:歐洲分子生物學開放軟件套件,賴斯等人,2000,同上)(優(yōu)選5.0.0版或更新版本)的尼德爾程序中所實施的尼德爾曼-翁施算法(尼德爾曼和翁施,1970,同上)來確定兩個脫氧核糖核苷酸序列之間的序列一致性。所使用的參數是空位開放罰分10,空位延伸罰分0.5,以及EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩陣。將標記為“最長同一性”的Needle輸出(使用-nobrief選項獲得)用作百分比同一性并且是如下計算的:

      (一致的脫氧核糖核苷酸X 100)/(比對長度-比對中的空位總數)

      子序列:術語“子序列”是指具有從成熟多肽編碼序列的5’和/或3’端缺失的一個或多個(例如,若干個)核苷酸的多核苷酸;其中該子序列編碼具有催化或結合活性的片段。

      變體:術語“變體”意指在一個或多個(例如,若干個)位置處包括改變(即,取代、插入和/或缺失)的具有催化或結合活性的一個多肽。取代意指用一個不同氨基酸置換占用一個位置的氨基酸;缺失意指去除占據一個位置的氨基酸;并且插入意指在鄰接并且緊隨占據位置的氨基酸之后添加氨基酸。保守取代的實例是在下組的范圍內:堿性氨基酸(精氨酸、賴氨酸及組氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、極性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、異亮氨酸及纈氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、絲氨酸、蘇氨酸及蛋氨酸)。通常不改變比活性的氨基酸置換是本領域已知的并且例如由H.諾伊拉特(H.Neurath)和R.L.希爾(R.L.Hill),1979,在蛋白質(The Proteins),學術出版社(Academic Press),紐約(New York)中進行描述。常見取代是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、以及Asp/Gly??商娲兀被嶙兓沁@樣一種性質,使得多肽的理化性質被改變。例如,氨基酸改變可以改進多肽的熱穩(wěn)定性、改變底物特異性、改變最適pH等??梢愿鶕绢I域已知的方法,如定點誘變或丙氨酸掃描誘變鑒定多肽中的必需氨基酸(康寧漢(Cunningham)和韋爾斯(Wells),1989,科學(Science)244:1081-1085)。在后一項技術中,在該分子中的每個殘基處引入單個丙氨酸突變,并且對所得突變體分子的活性進行測試以鑒定對于該分子的活性至關重要的氨基酸殘基。還參見希爾頓(Hilton)等人,1996,生物化學雜志(J.Biol.Chem.)271:4699-4708。也可結合假定接觸位點氨基酸的突變,如通過以下技術例如核磁共振、結晶學、電子衍射、或光親和標記進行確定的對結構進行物理學分析,從而確定酶的活性位點或其他生物學相互作用。參見,例如德·沃斯(de Vos)等人,1992,科學(Science)255:306-312;史密斯(Smith)等人,1992,分子生物學雜志(J.Mol.Biol.)224:899-904;沃達維爾(Wlodaver)等人,1992,歐洲生物化學學會聯(lián)盟通訊(FEBS Lett.)309:59-64。還可以從與相關多肽的比對推斷鑒定必需氨基酸??梢宰龀鰡蝹€或多個氨基酸取代、缺失和/或插入并且使用誘變、重組和/或改組的已知方法進行測試,隨后進行相關篩選程序,如由里德哈爾-奧爾森(Reidhaar-Olson)和薩奧爾(Sauer),1988,科學(Science)241:53-57;博維(Bowie)和薩奧爾,1989,美國科學院院刊(Proc.Natl.Acad.Sci.USA)86:2152-2156;WO 95/17413;或WO 95/22625所披露的那些??梢允褂玫钠渌椒òㄒ族ePCR、噬菌體展示(例如,羅曼(Lowman)等人,1991,生物化學(Biochemistry)30:10832-10837;美國專利號5,223,409;WO 92/06204)和區(qū)域定向誘變(德比舍爾(Derbyshire)等人,1986,基因(Gene)46:145;內爾(Ner)等人,1988,DNA 7:127)。

      誘變/改組方法可以與高通量自動化篩選方法組合以檢測由宿主細胞表達的克隆的誘變多肽的活性(奈斯(Ness)等人,1999,自然生物技術(Nature Biotechnology)17:893-896)。編碼活性多肽的誘變的DNA分子可以回收自宿主細胞,并且使用本領域的標準方法對其進行迅速測序。這些方法允許迅速確定多肽中單個氨基酸殘基的重要性。

      發(fā)明詳述

      本發(fā)明涉及用于使用位點特異性重組酶將感興趣的多核苷酸文庫整合到絲狀真菌宿主細胞的染色體中的方法,包括宿主細胞和多核苷酸構建體的多核苷酸文庫表達系統(tǒng),連同包含多核苷酸文庫的所得絲狀真菌宿主細胞及其培養(yǎng)物以生產多肽。

      在本發(fā)明的一個優(yōu)選實施例中,多核苷酸文庫是包含編碼感興趣的多肽的變體的多核苷酸的基因文庫;優(yōu)選地,這一感興趣的多肽是一種酶;更優(yōu)選地,這一感興趣的多肽是一種水解酶、異構酶、連接酶、裂解酶、氧化還原酶或轉移酶,例如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、幾丁質酶、角質酶、環(huán)糊精糖基轉移酶、脫氧核糖核酸酶、內切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、轉化酶、漆酶、脂肪酶、甘露糖苷酶、變聚糖酶(mutanase)、氧化酶、果膠分解酶、過氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶、木聚糖酶、或β-木糖苷酶。

      在另一個優(yōu)選實施例中,多核苷酸文庫包含控制序列的文庫,例如,啟動子,前導肽區(qū),分泌信號或終止子的文庫。

      優(yōu)選的是,本發(fā)明的絲狀真菌宿主細胞是枝頂孢霉屬、曲霉屬、短梗霉屬、煙管霉屬(Bjerkandera)、擬臘菌屬、金孢子菌屬、鬼傘屬、革蓋菌屬(Coriolus)、隱球菌屬、線黑粉菌科(Filibasidium)、鐮孢屬、腐質霉屬、梨孢菌屬、毛霉屬、毀絲霉屬、新美鞭菌屬、鏈孢菌屬、擬青霉屬、青霉屬、平革菌屬、射脈菌屬(Phlebia)、瘤胃壺菌屬、側耳屬(Pleurotus)、裂褶菌屬、籃狀菌屬、嗜熱子囊菌屬、梭孢殼屬、彎頸霉屬、栓菌屬(Trametes)或木霉屬細胞;優(yōu)選地,該宿主細胞是泡盛曲霉、臭曲霉、煙曲霉、日本曲霉、構巢曲霉、黑曲霉、米曲霉、黑刺煙管菌(Bjerkandera adusta)、干擬蠟菌(Ceriporiopsis aneirina)、卡內基擬蠟菌(Ceriporiopsis caregiea)、淺黃擬蠟孔菌(Ceriporiopsis gilvescens)、潘諾希塔擬蠟菌(Ceriporiopsis pannocinta)、環(huán)帶擬蠟菌(Ceriporiopsis rivulosa)、微紅擬蠟菌(Ceriporiopsis subrufa)、蟲擬蠟菌(Ceriporiopsis subvermispora)、狹邊金孢子菌(Chrysosporium inops)、嗜角質金孢子菌、盧克諾文思金孢子菌(Chrysosporium lucknowense)、糞狀金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、熱帶金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰蓋鬼傘(Coprinus cinereus)、毛革蓋菌(Coriolus hirsutus)、桿孢狀鐮孢、谷類鐮孢、庫威鐮孢、大刀鐮孢、禾谷鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢、鑲片鐮孢、特異腐質霉、柔毛腐質霉、米黑毛霉、嗜熱毀絲霉、粗糙鏈孢菌、產紫青霉、黃孢平革菌(Phanerochaete chrysosporium)、射脈菌(Phlebia radiata)、刺芹側耳(Pleurotus eryngii)、土生梭孢殼霉、長域毛栓菌(Trametes villosa)、變色栓菌(Trametes versicolor)、哈茨木霉、康寧木霉、長枝木霉、里氏木霉、或綠色木霉細胞。

      在本發(fā)明的一個優(yōu)選實施例中,位點特異性重組酶是釀酒酵母2μm翻轉酶FLP,噬菌體TP901-1整合酶,細菌噬菌體P1CRE整合酶,細菌XerC重組酶,細菌XerD重組酶,λ噬菌體整合酶或HP1整合酶;優(yōu)選地,該位點特異性重組酶是釀酒酵母2μm翻轉酶FLP。

      兩個獨立的策略可以應用于確保在宿主細胞的染色體中的染色體整合發(fā)生在正確的方向。如果使用相同的第一和第二識別序列,則該整合有可能在兩個方向發(fā)生,但是第二選擇標記可以被定制,這樣使得僅正確整合的片段導致第二選擇標記的表達。另一方面,使用不同的第一和第二識別序列也是一個選項,例如FRT-F和FRT-F3,為了確保該片段被整合在一個特定的方向。本發(fā)明的一個方面涉及使用體內同源重組,該體內同源重組在轉化到宿主細胞的核酸構建體的區(qū)域,以及在與位點特異性重組酶識別序列組合的染色體中預期整合位點的5’或3’區(qū)域之間,以確保感興趣的多核苷酸文庫是經由與受重組酶影響的位點特異性重組組合的體內同源重組,以特定方向整合到染色體中。

      因此,優(yōu)選的是,重組酶的第一和第二識別序列是相同的或不同的;優(yōu)選地,該重組酶的第一和第二識別序列是不同的,以影響在宿主細胞染色體中這一感興趣的多核苷酸文庫的定向整合。優(yōu)選地,重組酶的第一和第二識別序列是釀酒酵母2μm翻轉酶FLP的不同的識別序列,以影響在宿主細胞染色體中感興趣的多核苷酸文庫的定向整合;優(yōu)選地,該重組酶的第一和第二識別序列分別是FRT-F(SEQ ID NO:27)和FRT-F3(SEQ ID NO:28),或反之亦然。

      另一方面,還優(yōu)選地是,一個非功能部分第二選擇標記被包括在步驟(a)中第一方面的宿主細胞中,并且另一個非功能部分第二選擇標記被包括在步驟(b)中第一方面的核酸構建體中,其中當感興趣的多核苷酸文庫經由其識別序列通過重組酶位點特異性地以正確的方向整合到宿主細胞的染色體中時,部分第二選擇標記被重組以形成功能第二選擇標記;優(yōu)選地,一個非功能部分第二選擇標記包含編碼選擇標記的多核苷酸的啟動子和任選地一個或多個完整5’外顯子,并且另一個非功能部分第二選擇標記包含選擇標記的剩余編碼序列。

      在本發(fā)明的第二方面的優(yōu)選實施例中,一個非功能部分第二選擇標記被包括在宿主細胞中并且另一非功能部分第二選擇標記被包括在核酸構建體中,其中當感興趣的多核苷酸文庫經由其識別序列通過重組酶位點特異性地以正確的方向整合到宿主細胞的染色體中時,部分第二選擇標記被重組以形成功能第二選擇標記;優(yōu)選地,一個非功能部分第二選擇標記包含編碼選擇標記的多核苷酸的啟動子和任選地一個或多個完整5’外顯子,并且其中另一個非功能部分第二選擇標記包含選擇標記的剩余編碼序列。

      在第二方面的優(yōu)選實施例中,絲狀真菌宿主細胞被轉化。

      在第三方面的優(yōu)選實施例中,重組酶的第一和第二識別序列是相同的或不同的;優(yōu)選地,該重組酶的第一和第二識別序列是不同的。

      在第三方面的另一個優(yōu)選實施例中,重組酶的第一和第二識序列是釀酒酵母的2μm翻轉酶FLP的不同的識別序列;優(yōu)選地,該重組酶的第一和第二識別序列分別是FRT-F(SEQ ID NO:27)和FRT-F3(SEQ ID NO:28),或反之亦然。

      在另一個優(yōu)選實施例中,在整合位點的5’或3’的區(qū)域,即,整合位點的側翼5’或3’,與第二識別序列一起使用,以影響在整合位點的感興趣的多核苷酸文庫的定向整合。

      在第三方面的一個最后優(yōu)選實施例中,重組酶的第二識別序列位于將第一部分選擇標記與第二部分選擇標記分開的內含子中,如在圖7中所概述。

      具有酶活性的多肽的來源

      本發(fā)明的具有酶活性的多肽可以從任何屬的微生物中獲得。出于本發(fā)明的目的,如在此結合給定的來源使用的術語“從…中獲得”應意指由多核苷酸編碼的多肽是由該來源或者由其中已經插入來自該來源的多核苷酸的菌株產生的。在一方面,從給定來源中獲得的多肽被分泌到細胞外。

      該多肽可以是細菌多肽。例如,該多肽可以是革蘭氏陽性細菌多肽,如具有[酶]活性的芽孢桿菌屬(Bacillus)、梭菌屬(Clostridium)、腸球菌屬(Enterococcus)、土芽孢桿菌屬(Geobacillus)、乳桿菌屬(Lactobacillus)、乳球菌屬(Lactococcus)、海洋芽孢桿菌屬(Oceanobacillus)、葡萄球菌屬(Staphylococcus)、鏈球菌屬(Streptococcus)或鏈霉菌屬(Streptomyces)多肽;或革蘭氏陰性細菌多肽,如彎曲桿菌屬(Campylobacter)、大腸桿菌(E.coli)、黃桿菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)、螺桿菌屬(Helicobacter)、泥桿菌屬(Ilyobacter)、奈瑟氏菌屬(Neisseria)、假單胞菌屬(Pseudomonas)、沙門氏菌屬(Salmonella)或脲原體屬(Ureaplasma)多肽。

      在一方面,該多肽是嗜堿芽孢桿菌(Bacillus alkalophilus)、解淀粉芽孢桿菌(Bacillus amyloliquefaciens)、短芽孢桿菌(Bacillus brevis)、環(huán)狀芽孢桿菌(Bacillus circulans)、克勞氏芽孢桿菌(Bacillus clausii)、凝結芽孢桿菌(Bacillus coagulans)、堅硬芽孢桿菌(Bacillus firmus)、燦爛芽孢桿菌(Bacillus lautus)、遲緩芽孢桿菌(Bacillus lentus)、地衣芽孢桿菌(Bacillus licheniformis)、巨大芽孢桿菌(Bacillus megaterium)、短小芽孢桿菌(Bacillus pumilus)、嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus)、枯草芽孢桿菌(Bacillus subtilis)、或蘇云金芽孢桿菌(Bacillus thuringiensis)多肽。

      在另一方面,該多肽是似馬鏈球菌(Streptococcus equisimilis)、釀膿鏈球菌(Streptococcus pyogenes)、乳房鏈球菌(Streptococcus uberis)、或馬鏈球菌獸瘟亞種(Streptococcus equi subsp.Zooepidemicus)多肽。

      在另一方面,該多肽是不產色鏈霉菌(Streptomyces achromogenes)、除蟲鏈霉菌(Streptomyces avermitilis)、天藍鏈霉菌(Streptomyces coelicolor)、灰色鏈霉菌(Streptomyces griseus)、或淺青紫鏈霉菌(Streptomyces lividans)多肽。

      該多肽可以是一種真菌多肽。例如,該多肽可以是酵母多肽,如假絲酵母屬、克魯弗酵母屬、畢赤酵母屬、酵母屬、裂殖酵母、或耶氏酵母屬多肽;或絲狀真菌多肽,例如枝頂孢霉屬(Acremonium)、傘菌屬(Agaricus)、鏈格孢屬(Alternaria)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、葡萄座腔菌屬(Botryospaeria)、擬蠟菌屬(Ceriporiopsis)、毛喙殼屬(Chaetomidium)、金孢子菌屬(Chrysosporium)、麥角菌屬(Claviceps)、旋孢腔菌屬(Cochliobolus)、鬼傘屬(Coprinopsis)、乳白蟻屬(Coptotermes)、棒囊殼屬(Corynascus)、隱叢赤殼菌屬(Cryphonectria)、隱球菌屬(Cryptococcus)、色二孢屬(Diplodia)、黑耳屬(Exidia)、線黑粉酵母屬(Filibasidium)、鐮孢屬(Fusarium)、赤霉屬(Gibberella)、全鞭毛蟲屬(Holomastigotoides)、腐質霉屬(Humicola)、耙齒菌屬(Irpex)、香菇屬(Lentinula)、小腔球菌屬(Leptospaeria)、梨孢菌屬(Magnaporthe)、黑果菌屬(Melanocarpus)、亞灰樹花菌屬(Meripilus)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、新美鞭菌屬(Neocallimastix)、鏈孢菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉菌屬(Penicillium)、平革菌屬(Phanerochaete)、瘤胃壺菌屬(Piromyces)、Poitrasia、假黑盤菌屬(Pseudoplectania)、假披發(fā)蟲屬(Pseudotrichonympha)、根毛霉菌屬(Rhizomucor)、裂褶菌屬(Schizophyllum)、柱頂孢屬(Scytalidium)、籃狀菌屬(Talaromyces)、嗜熱子囊菌屬(Thermoascus)、梭孢殼霉屬(Thielavia)、彎頸霉屬(Tolypocladium)、木霉屬(Trichoderma)、長毛盤菌屬(Trichophaea)、輪枝孢屬(Verticillium)、小包腳菇屬(Volvariella)、或炭角菌屬(Xylaria)多肽。

      在另一方面,該多肽是卡氏酵母(Saccharomyces carlsbergensis)、釀酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克魯弗酵母(Saccharomyces kluyveri)、諾地酶母(Saccharomyces norbensis)、或卵形酵母(Saccharomyces oviformis)多肽。

      在另一方面,該多肽是解纖維枝頂孢霉(Acremonium cellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、煙曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、構巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、狹邊金孢子菌(Chrysosporium inops)、嗜角質金孢子菌(Chrysosporium keratinophilum)、盧克諾文思金孢子菌(Chrysosporium lucknowense)、糞狀金孢子菌(Chrysosporium merdarium)、氈金孢子菌(Chrysosporium pannicola)、昆士蘭金孢子菌(Chrysosporium queenslandicum)、熱帶金孢子菌(Chrysosporium tropicum)、帶紋金孢子菌(Chrysosporium zonatum)、桿孢狀鐮孢(Fusarium bactridioides)、禾谷鐮孢(Fusarium cerealis)、庫威鐮孢(Fusarium crookwellense)、黃色鐮孢菌(Fusarium culmorum)、禾谷鐮孢菌(Fusarium graminearum)、禾赤鐮孢(Fusarium graminum)、異孢鐮孢(Fusarium heterosporum)、合歡木鐮孢(Fusarium negundi)、尖孢鐮孢菌(Fusarium oxysporum)、多枝鐮孢(Fusarium reticulatum)、粉紅鐮孢菌(Fusarium roseum)、接骨木鐮孢(Fusarium sambucinum)、膚色鐮孢(Fusarium sarcochroum)、擬枝孢鐮孢菌(Fusarium sporotrichioides)、硫色鐮孢菌(Fusarium sulphureum)、圓鐮孢(Fusarium torulosum)、擬絲孢鐮孢菌(Fusarium trichothecioides)、鑲片鐮孢菌(Fusarium venenatum)、灰腐質霉(Humicola grisea)、特異腐質霉(Humicola insolens)、疏棉狀腐質霉(Humicola lanuginosa)、白囊耙齒菌(Irpex lacteus)、米黑毛霉(Mucor miehei)、嗜熱毀絲霉(Myceliophthora thermophila)、粗糙脈孢菌(Neurospora crassa)、繩狀青霉菌(Penicillium funiculosum)、產紫青霉(Penicillium purpurogenum)、黃孢原毛平革菌(Phanerochaete chrysosporium)、無色梭孢殼(Thielavia achromatica)、成層梭孢殼菌(Thielavia albomyces)、白毛梭孢殼(Thielavia albopilosa)、澳洲梭孢殼(Thielavia australeinsis)、糞梭孢殼(Thielavia fimeti)、小孢梭孢殼(Thielavia microspora)、卵孢梭孢殼(Thielavia ovispora)、秘魯梭孢殼(Thielavia peruviana)、毛梭孢殼(Thielavia setosa)、瘤孢梭孢殼(Thielavia spededonium)、耐熱梭孢殼(Thielavia subthermophila)、土生梭孢殼(Thielavia terrestris)、哈茨木霉(Trichoderma harzianum)、康寧木霉(Trichoderma koningii)、長枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)、或綠色木霉(Trichoderma viride)多肽。

      將理解的是,對于以上提到的物種而言,本發(fā)明涵蓋完全狀態(tài)和不完全狀態(tài)(perfect and imperfect states)二者、以及其他分類學等效物,例如無性型,而不管它們已知的物種名稱是什么。本領域普通技術人員將容易地識別適當等效物的身份。

      這些物種的菌株可以容易地在許多培養(yǎng)物保藏中心為公眾所獲得,如美國典型培養(yǎng)物保藏中心(ATCC)、德國微生物菌種保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH,DSMZ)、荷蘭菌種保藏中心(Centraalbureau Voor Schimmelcultures,CBS)以及美國農業(yè)研究服務專利培養(yǎng)物保藏中心北方地區(qū)研究中心(NRRL)。

      可以使用以上提到的探針從其他來源,包括從自然界(例如,土壤、堆肥、水等等)分離的微生物或直接從自然材料(例如,土壤、堆肥、水等等)獲得的DNA樣品鑒定和獲得該多肽。用于從自然生活環(huán)境中直接分離微生物和DNA的技術是本領域熟知的。然后可以通過類似地篩選另一微生物的基因組DNA或cDNA文庫或混合的DNA樣品來獲得編碼該多肽的多核苷酸。一旦已經用探針檢測到編碼多肽的多核苷酸,則可以通過利用本領域普通技術人員所知的技術分離或克隆多核苷酸(參見,例如薩姆布魯克(Sambrook)等人,1989,上文)。

      核酸構建體

      本發(fā)明還涉及包含與一個或多個控制序列可操作地連接的本發(fā)明多核苷酸的核酸構建體,其中所述控制序列指導編碼序列在適合的宿主細胞中在與所述控制序列相容的條件下的表達。

      可以用許多方式操作所述多核苷酸以便于多肽的表達。取決于表達載體,在多核苷酸插入載體之前對其進行操縱可以是令人希望的或必需的。用于利用重組DNA方法修飾多核苷酸的技術是本領域熟知的。

      該控制序列可以是啟動子,即,被宿主細胞識別以對編碼本發(fā)明的多肽的多核苷酸進行表達的多核苷酸。啟動子包含介導多肽表達的轉錄控制序列。啟動子可以是在宿主細胞中顯示轉錄活性的任何多核苷酸,包括突變、截短和雜合啟動子,并且可以從編碼與宿主細胞同源或異源的胞外或胞內多肽的基因中獲得。

      在絲狀真菌宿主細胞中,用于指導本發(fā)明的核酸構建體的轉錄的適合啟動子的實例是獲得自以下各項的基因的啟動子:構巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩(wěn)定性α-淀粉酶、黑曲霉或泡盛曲霉葡萄糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構酶、尖鐮孢胰蛋白酶–樣蛋白酶(WO 96/00787)、鑲片鐮孢菌淀粉葡糖苷酶(WO 00/56900)、鑲片鐮孢菌Daria(達莉亞)(WO 00/56900)、鑲片鐮孢菌Quinn(奎恩)(WO 00/56900)、米黑根毛霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內切葡聚糖酶I、里氏木霉內切葡聚糖酶II、里氏木霉內切葡聚糖酶III、里氏木霉內切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻譯延伸因子,連同NA2-tpi啟動子(來自編碼中性α-淀粉酶的曲霉屬基因的修飾的啟動子,其中已經用來自編碼丙糖磷酸異構酶的曲霉屬基因的未翻譯的前導子替換未翻譯的前導子;非限制性實例包括來自編碼中性α-淀粉酶的黑曲霉基因的修飾的啟動子,其中已經用來自編碼丙糖磷酸異構酶的構巢曲霉或米曲霉基因的未翻譯的前導子替換未翻譯的前導子);及其突變型、截短型及雜合型啟動子。其他啟動子在美國專利號6,011,147中描述。

      控制序列還可以是由宿主細胞識別以終止轉錄的轉錄終止子。該終止子可操作地連接到編碼該多肽的多核苷酸的3’-末端。在該宿主細胞中起作用的任何終止子都可以用于本發(fā)明中。

      用于絲狀真菌宿主細胞的優(yōu)選終止子是從以下各項的基因獲得:構巢曲霉乙酰胺酶、構巢曲霉鄰氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖鐮孢胰蛋白酶樣蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內切葡聚糖酶I、里氏木霉內切葡聚糖酶II、里氏木霉內切葡聚糖酶III、里氏木霉內切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻譯延長因子。

      該控制序列還可以是在啟動子下游并且在基因編碼序列上游的mRNA穩(wěn)定子區(qū)域,它增加該基因的表達。

      該控制序列還可以是前導子,一種對宿主細胞翻譯很重要的非翻譯mRNA區(qū)域。該前導子可操作地連接到編碼該多肽的多核苷酸的5’-末端。可以使用在宿主細胞中起作用的任何前導子。

      用于絲狀真菌宿主細胞的優(yōu)選前導序列是從米曲霉TAKA淀粉酶和構巢曲霉丙糖磷酸異構酶的基因獲得。

      控制序列還可以是聚腺苷酸化序列,可操作地連接至該多核苷酸的3’-末端并且當轉錄時由宿主細胞識別為將聚腺苷酸殘基添加至所轉錄的mRNA的信號的序列。可以使用在宿主細胞中起作用的任何聚腺苷酸化序列。

      用于絲狀真菌宿主細胞的優(yōu)選聚腺苷酸化序列是從以下各項的基因中獲得的:構巢曲霉鄰氨基苯甲酸合成酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖鐮孢胰蛋白酶樣蛋白酶。

      控制序列也可以是編碼信號肽的信號肽編碼區(qū),其中所述信號肽與多肽的N-末端連接并且指導多肽進入細胞的分泌途徑。多核苷酸的編碼序列的5’-末端可以內在地包含在翻譯閱讀框中與編碼多肽的編碼序列的區(qū)段天然連接的信號肽編碼序列。可替代地,編碼序列的5’-末端可以包含相對于編碼序列為外來的信號肽編碼序列。在編碼序列不天然地包含信號肽編碼序列的情況下,可能需要外來信號肽編碼序列??商娲?,外來信號肽編碼序列可以單純地替代天然信號肽編碼序列以便增強多肽的分泌。然而,可以使用指導已表達多肽進入宿主細胞的分泌途徑的任何信號肽編碼序列。

      用于絲狀真菌宿主細胞的有效信號肽編碼序列是從黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特異腐質霉纖維素酶、特異腐質霉內切葡聚糖酶V、柔毛腐質霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶的基因獲得的信號肽編碼序列。

      控制序列也可以是編碼位于多肽N-末端處的前肽的前肽編碼序列。生成的多肽被稱為前體酶(proenzyme)或多肽原(或在一些情況下被稱為酶原(zymogen))。多肽原通常是無活性的并且可以通過催化切割或自身催化切割來自多肽原的前肽而轉化為活性多肽??梢詮目莶菅挎邨U菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、嗜熱毀絲霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶、特異腐質霉角質酶和釀酒酵母α-因子的基因獲得前肽或前肽原編碼序列。

      在信號肽和前肽序列兩者都在的情況下,將前肽序列緊鄰多肽的N-末端定位并且將信號肽序列緊鄰前肽序列的N-末端定位。

      也可能令人希望的是添加調節(jié)序列,所述調節(jié)序列調節(jié)相對于宿主細胞的生長的多肽的表達。調節(jié)序列的實例是使得基因的表達響應于化學或物理刺激(包括調節(jié)化合物的存在)而開啟或關閉的那些。在絲狀真菌中,可以使用黑曲霉葡糖淀粉酶啟動子、米曲霉TAKAα-淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子、里氏木霉纖維二糖水解酶I啟動子以及里氏木霉纖維二糖水解酶II啟動子。調節(jié)序列的其它實例是那些允許基因擴增的序列。在真核系統(tǒng)中,這些調控序列包括在甲氨蝶呤存在下被擴增的二氫葉酸還原酶基因以及用重金屬擴增的金屬硫蛋白基因。在這些情況中,編碼多肽的多核苷酸將與調控序列可操作地連接。

      多核苷酸構建體

      本發(fā)明還涉及包括本發(fā)明的多核苷酸、啟動子、以及轉錄和翻譯終止信號的重組多核苷酸構建體或表達載體。不同的核苷酸和控制序列可以連接在一起以產生一個重組表達載體,這一重組表達載體可以包括一個或多個便利的限制酶切位點以允許在這些位點處插入或取代編碼該變體的多核苷酸。可替代地,該多核苷酸可以通過將該多核苷酸或包括該多核苷酸的核酸構建體插入用于表達的適當載體中來表達。在產生該表達載體時,該編碼序列位于該載體中,這樣使得該編碼序列與該供表達的適當控制序列可操作地連接。

      重組表達載體可以是任何載體(例如,質?;虿《?,其能夠方便地進行重組DNA程序,并且能夠引起多核苷酸的表達。載體的選擇將典型地取決于該載體與有待引入該載體的宿主細胞的相容性。該載體可以是一種線性的或閉合的環(huán)狀質粒。

      載體可以是自主復制載體,即,作為染色體外實體存在的載體,其復制獨立于染色體復制,例如,質粒、染色體外元件、微染色體或人工染色體。該載體可包含任何用以保證自我復制的要素。可替代地,該載體可以是這樣載體,當它被引入該宿主細胞中時,被整合到基因組中并且與其中已整合了它的一個或多個染色體一起復制。此外,可以使用單一載體或質粒或兩個或更多個載體或質粒(這些載體或質粒共同包含待引入到宿主細胞的基因組中的總DNA)或轉座子。

      該載體優(yōu)選包含一個或多個允許方便地選擇轉化細胞、轉染細胞、轉導細胞等細胞的選擇性標記。選擇性標記是這樣一種基因,該基因的產物提供了殺生物劑抗性或病毒抗性、重金屬抗性、營養(yǎng)缺陷型的原養(yǎng)型等。

      用于在絲狀真菌宿主細胞中使用的選擇性標記包括但不限于,adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鳥氨酸氨甲酰基轉移酶)、bar(草丁膦乙酰轉移酶)、hph(潮霉素磷酸轉移酶)、niaD(硝酸還原酶)、pyrG(乳清酸核苷-5’-磷酸脫羧酶)、sC(硫酸腺苷基轉移酶)、以及trpC(鄰氨基苯甲酸合酶),連同其等效物。優(yōu)選地用于曲霉細胞中的是構巢曲霉或米曲霉amdS和pyrG基因以及吸水鏈霉菌bar基因。在木霉屬細胞中優(yōu)選使用的是adeA、adeB、amdS、hph以及pyrG基因。

      選擇性標記可以是如在WO 2010/039889中描述的雙選擇性標記系統(tǒng)。在一方面中,雙選擇性標記是hph-tk雙選擇性標記系統(tǒng)。

      載體優(yōu)選包含允許載體整合到宿主細胞的基因組中或載體在細胞中獨立于基因組自主復制的一個或多個元件。

      對于整合到該宿主細胞基因組中,該載體可以依靠編碼該多肽的多核苷酸序列或者用于通過同源或非同源重組整合到該基因組中的該載體的任何其他元件??商娲?,該載體可以包含用于指導通過同源重組而整合到宿主細胞基因組中的一個或多個染色體中的一個或多個精確位置的另外的多核苷酸。為了增加在精確位置整合的可能性,這些整合元件應包含足夠數量的核酸,例如100至10,000個堿基對、400至10,000個堿基對、以及800至10,000個堿基對,這些堿基對與對應的靶序列具有高度的序列一致性以提高同源重組的可能性。這些整合元件可以是與宿主細胞的基因組內的靶序列同源的任何序列。此外,這些整合元件可以是非編碼多核苷酸或編碼多核苷酸。另一個方面,該載體可以通過非同源重組整合到宿主細胞的基因組中。

      對于自主復制,載體可以進一步包含使該載體能夠在所討論的宿主細胞中自主復制的復制起點。復制起點可以是在細胞中起作用的介導自主復制的任何質粒復制子。術語“復制起點(origin of replication)”或“質粒復制子(plasmid replicator)”意指使得質粒或載體可在體內復制的多核苷酸。

      在絲狀真菌細胞中有用的復制起點的實例是AMA1和ANS1(格姆斯(Gems)等人,1991,基因(Gene)98:61-67;卡倫(Cullen)等人,1987,核酸研究(Nucleic Acids Res.)15:9163-9175;WO 00/24883)。AMA1基因的分離和包括該基因的質?;蜉d體的構建可以根據披露于WO 00/24883中的方法完成。

      可以將本發(fā)明的多核苷酸的多于一個拷貝插入宿主細胞中以增加多肽的產生。通過將序列的至少一個另外的拷貝整合到宿主細胞基因組中或者通過包含與該多核苷酸一起的可擴增的選擇性標記基因可以獲得多核苷酸的增加的拷貝數目,其中通過在適當的選擇性試劑的存在下培養(yǎng)細胞可以選擇包含選擇性標記基因的經擴增的拷貝的細胞、以及由此該多核苷酸的另外的拷貝。

      用于連接以上所描述的元件以構建本發(fā)明的重組表達載體的程序是本領域的普通技術人員熟知的(參見,例如,薩姆布魯克(Sambrook)等人,1989,同上)。

      宿主細胞

      本發(fā)明還涉及重組宿主細胞,這些宿主細胞包含可操作地連接到一個或多個控制序列的本發(fā)明的多核苷酸,這些控制序列指導本發(fā)明的多肽的產生。將包含多核苷酸的構建體或載體引入宿主細胞中,從而該構建體或載體被維持為染色體整合體。

      術語“宿主細胞”涵蓋由于復制期間發(fā)生的突變與親本細胞不同的親本細胞的任何后代。宿主細胞的選擇在很大程度上取決于編碼該多肽的基因及其來源。

      宿主細胞可以是真菌細胞。如在此所用的“真菌”包括子囊菌門(Ascomycota)、擔子菌門(Basidiomycota)、壺菌門(Chytridiomycota)和接合菌門(Zygomycota)以及卵菌門(Oomycota)和所有有絲分裂孢子真菌(如霍克斯沃思(Hawksworth)等人定義,引自:安斯沃斯(Ainsworth)和比斯比(Bisby)的真菌大詞典(Dictionary of The Fungi),第8版,1995,國際CAB,大學出版社(University Press),劍橋(Cambridge),英國)。

      真菌宿主細胞可以是絲狀真菌細胞?!敖z狀真菌”包括真菌門(Eumycota)和卵菌門(Oomycota)亞類的所有絲狀形式(如霍克斯沃思等人,1995,上文定義)。絲狀真菌通常的特征在于由幾丁質、纖維素、葡聚糖、殼聚糖、甘露聚糖、以及其他復雜多糖構成的菌絲體壁。營養(yǎng)生長是通過菌絲延伸,而碳分解代謝是專性需氧的。

      絲狀真菌宿主細胞可以是枝頂孢霉屬細胞、曲霉屬細胞、金擔子菌屬細胞、煙管菌屬(Bjerkandera)細胞、擬蠟菌屬細胞、金孢屬細胞、鬼傘屬細胞、革蓋菌屬(Coriolus)細胞、隱球菌屬細胞、絨黑粉類酵母細胞、鐮刀菌屬細胞、腐質霉屬細胞、巨座殼屬細胞、毛霉屬細胞、毀絲霉屬細胞、新美鞭菌屬細胞、脈孢菌屬細胞、擬青霉屬細胞、青霉屬細胞、平革菌屬細胞、射脈菌屬(Phlebia)細胞、梨囊鞭菌屬細胞、側耳屬細胞、裂褶菌屬細胞、藍狀菌屬細胞、嗜熱子囊菌細胞、梭孢殼屬細胞、彎頸霉屬細胞、栓菌屬(Trametes)細胞或木霉屬細胞。

      例如,絲狀真菌宿主細胞可以是泡盛曲霉、臭曲霉、煙曲霉、日本曲霉、構巢曲霉、黑曲霉、米曲霉、黑刺煙管菌(Bjerkandera adusta)、干擬蠟菌(Ceriporiopsis aneirina)、卡內基擬蠟菌(Ceriporiopsis caregiea)、淺黃擬蠟孔菌(Ceriporiopsis gilvescens)、潘諾希塔擬蠟菌(Ceriporiopsis pannocinta)、環(huán)帶擬蠟菌(Ceriporiopsis rivulosa)、微紅擬蠟菌(Ceriporiopsis subrufa)、蟲擬蠟菌(Ceriporiopsis subvermispora)、狹邊金孢子菌(Chrysosporium inops)、嗜角質金孢子菌、盧克諾文思金孢子菌(Chrysosporium lucknowense)、糞狀金孢子菌(Chrysosporium merdarium)、租金孢子菌、昆士蘭金孢子菌(Chrysosporium queenslandicum)、熱帶金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰蓋鬼傘(Coprinus cinereus)、毛革蓋菌(Coriolus hirsutus)、桿孢狀鐮孢、谷類鐮孢、庫威鐮孢、大刀鐮孢、禾谷鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢、鑲片鐮孢、特異腐質霉、柔毛腐質霉、米黑毛霉、嗜熱毀絲霉、粗糙鏈孢菌、產紫青霉、黃孢平革菌(Phanerochaete chrysosporium)、射脈菌(Phlebia radiata)、刺芹側耳(Pleurotus eryngii)、土生梭孢殼霉、長域毛栓菌(Trametes villosa)、變色栓菌(Trametes versicolor)、哈茨木霉、康寧木霉、長枝木霉、里氏木霉、或綠色木霉細胞。

      可以通過涉及原生質體形成、原生質體轉化、以及以本身已知的方式進行細胞壁再生的過程來轉化真菌細胞。用于轉化曲霉屬和木霉屬宿主細胞的適合程序在EP 238023和約爾頓(Yelton)等人,1984,美國國家科學院院刊(Proc.Natl.Acad.Sci.USA)81:1470-1474以及科里蒂森(Christensen)等人,1988,生物/技術(Bio/Technology)6:1419-1422中描述。用于轉化鐮刀菌屬物種的適合方法在馬拉迪耶(Malardier)等人,1989,基因(Gene)78:147-156和WO 96/00787中描述。

      生產方法

      本發(fā)明還涉及產生感興趣的多肽的方法,包括以下步驟:a)在有益于產生多核苷酸文庫編碼的多肽的條件下培養(yǎng)第三方面的絲狀真菌宿主細胞,并且;任選地,b)回收該多肽。

      這些宿主細胞是在適合于使用本領域中已知的方法產生該多肽的一種營養(yǎng)培養(yǎng)基中培養(yǎng)的。例如,可以通過在適合的培養(yǎng)基中和在允許表達和/或分離該多肽的條件下,進行搖瓶培養(yǎng),或者在實驗室或工業(yè)發(fā)酵罐中進行小規(guī)模或大規(guī)模發(fā)酵(包括連續(xù)、分批、分批補料、或固態(tài)發(fā)酵)來培養(yǎng)細胞。該培養(yǎng)是使用本領域中已知的程序,在一種適合營養(yǎng)培養(yǎng)基中發(fā)生,該培養(yǎng)基包括碳和氮來源及無機鹽。適合的培養(yǎng)基可從商業(yè)供應商獲得或可以根據公開的組成(例如,在美國典型培養(yǎng)物保藏中心的目錄中)制備。如果多肽分泌到該營養(yǎng)培養(yǎng)基中,那么可直接從培養(yǎng)基中回收多肽。如果多肽不被分泌,那么其可從細胞裂解液中進行回收。

      可以使用特異性針對這些多肽的本領域已知的方法來檢測該多肽。這些檢測方法包括但不限于,特異性抗體的使用、酶產物的形成或酶底物的消失。例如,可以使用酶測定來確定該多肽的活性。

      可以使用本領域已知的方法來回收多肽。例如,該多肽可以通過常規(guī)程序,包括但不限于,收集、離心、過濾、提取、噴霧干燥、蒸發(fā)或沉淀,從該營養(yǎng)培養(yǎng)基回收。在一方面,回收包含該多肽的發(fā)酵液。

      可以通過本領域已知的多種方法純化多肽,所述方法包括但不限于色譜(例如,離子交換色譜法、親和色譜法、疏水色譜法、聚焦色譜法和大小排阻色譜法)、電泳方法(例如,制備性等電聚焦)、差異性溶解(例如,硫酸銨沉淀)、SDS-PAGE或提取(參見,例如,蛋白質純化(Protein Purification),編者詹森(Janson)和賴登(Ryden),VCH出版公司,紐約,1989),以便獲得基本上純的多肽。

      在替代性方面,不回收多肽,而是使用表達該多肽的本發(fā)明宿主細胞作為多肽的來源。

      通過以下實例進一步對本發(fā)明進行描述,但不應將其理解為對本發(fā)明范圍的限制。

      實例

      分子克隆技術描述于薩姆布魯克(Sambrook),J.,弗里奇(Fritsch),E.F.,馬尼亞蒂斯(Maniatis),T.30(1989)分子克隆實驗手冊(Molecular cloning:a laboratory manual)(第2版)冷泉港實驗室(Cold Spring Harbor Laboratory),冷泉港(Cold Spring Harbor),紐約。

      用于DNA操作的酶(例如限制性內切核酸酶,連接酶等)從新英格蘭生物學實驗室有限公司(New England Biolabs,Inc.)獲得,并可根據制造商的說明書使用。

      培養(yǎng)基和試劑

      除非另外說明,使用以下培養(yǎng)基質和試劑;用于緩沖液和底物的化學品是分析等級的商品:

      -Cove:342.3g/L蔗糖、20ml/L COVE鹽溶液、10mM乙酰胺、30g/L諾布爾(noble)瓊脂。

      -Cove頂層瓊脂:342.3g/L蔗糖、20ml/L COVE鹽溶液、10mM乙酰胺、10g/L低熔點瓊脂糖。

      -Cove-N平板由以下構成:30g蔗糖、20ml Cove鹽溶液、3g NaNO3和30g諾布爾瓊脂,并且水補足至1升。

      -COVE鹽溶液由以下構成:26g KCl、26g MgSO4·7H2O、76g KH2PO4和50ml Cove痕量金屬,并且水補足至1升。

      -用于COVE的痕量金屬溶液由以下構成:0.04g NaB4O7 10H2O、0.4g的CuSO4 5H2O、1.2g的FeSO4 7H2O、1.0g MnSO4H2O、0.8g中性淀粉酶II MoO22H2O和10.0g ZnSO4 7H2O,并且水補足至1升。

      -1/4YPM由以下構成:2.5g酵母提取物、5g蛋白胨和5g麥芽糖(pH4.5),并且水補足至1升。

      -STC緩沖液由以下構成:0.8M山梨糖醇、25mM Tris(pH 8)、和25mM CaCl2,并且水補足至1升。

      -STPC緩沖液由以下構成:在STC緩沖液中的40%PEG4000。

      -MLC由以下構成:40g葡萄糖、50g大豆粉、4g/檸檬酸(pH5.0),并且水補足至1升。

      -纖維素酶誘導培養(yǎng)基(CIM)由以下構成:20g的纖維素、10g的玉米漿固體、1.45g的(NH4)2SO4、2.08g的KH2PO4、0.28g的CaCl2、0.42g的MgSO4·7H2O、0.42ml的木霉痕量金屬溶液、1-2滴消泡劑、并且去離子水補足至1升;pH調節(jié)至6.0。

      -COVE平板由以下各項構成:342.3g的蔗糖、20ml的COVE鹽溶液、10ml的1M乙酰胺、10ml的1.5M CsCl、25g的諾布爾瓊脂(Difco)、并且去離子水補足至1升。

      -COVE鹽溶液由以下構成:26g的KCl、26g的MgSO4·7H2O、76g的KH2PO4、50ml的COVE痕量金屬溶液、并且去離子水補足至1升。

      -COVE痕量金屬溶液由以下構成:0.04g的NaB4O7·10H2O、0.4g的CuSO4·5H2O、1.2g的FeSO4·7H2O、0.7g的MnSO4·H2O、0.8g的Na2MoO2·2H2O、10g的ZnSO4·7H2O、并且去離子水補足至1升。

      -LB+Amp培養(yǎng)基由以下各項構成:10g的胰蛋白胨、5g的酵母提取物、5g的NaCl、并且去離子水補足至1升。在高壓滅菌之后,添加在水中的1ml的100mg/ml的氨芐青霉素溶液。

      -PDA平板由以下各項構成:39g的馬鈴薯右旋糖瓊脂(Difco),并且去離子水補足至1升。

      -PEG緩沖液由以下構成:500g的聚乙二醇4000(PEG 4000)、10mM CaCl2、10mM Tris-HCl pH 7.5,并且去離子水補足至1升;過濾除菌。

      -SOC培養(yǎng)基由以下構成:0.5g的NaCl、5g的酵母提取物、20g的胰蛋白胨、10ml的250mM KCl、并且去離子水補足至1升。

      -STC由以下構成:1M山梨醇、10mM CaCl2、以及10mM Tris-HCl,pH 7.5,過濾除菌。

      -TAE緩沖液由以下各項構成:4.84g的Tris堿、1.14ml的冰醋酸、2ml的0.5M EDTA(pH 8)、并且去離子水補足至1升。

      -木霉基本培養(yǎng)基(TrMM)平板(用于亞培養(yǎng))由以下構成:30g蔗糖、20ml COVE鹽溶液、0.6g的CaCl2.2H2O、6g的(NH4)2SO4、25g的諾布爾瓊脂、并且去離子水補足至1升。

      -木霉痕量金屬溶液由以下構成:216g的FeCl3·6H2O、58g的ZnSO4·7H2O、27g的MnSO4·H2O、10g的CuSO4·5H2O、2.4g的H3BO3、336g的檸檬酸、并且去離子水補足至1升。

      -YP培養(yǎng)基由以下各項構成:10g的酵母提取物、20g的細菌蛋白胨、并且去離子水補足至1升。

      -2XYT加氨比西林平板由以下各項構成:16g的胰蛋白胨、10g的酵母提取物、5g的氯化鈉、15g的細菌用瓊脂(Bacto agar)并且去離子水補足至1升。在高壓蒸汽處理的培養(yǎng)基回火到55℃后,添加1ml的100mg/ml的氨比西林。

      采購的材料和菌株

      使用大腸桿菌DH5-α(東洋公司(Toyobo))用于質粒構建和擴增。使用凱杰質粒試劑盒(Qiagen Plasmid Kit)(凱杰公司)來回收擴增的質粒。使用DNA連接試劑盒(寶生物公司(TAKARA))或T4DNA連接酶(寶靈曼公司(BOEHRINGER MANNHEIM))來進行連接。QIAQUICKTM凝膠提取試劑盒(凱杰公司)被用于純化PCR片段并從瓊脂糖凝膠中提取DNA片段。

      克隆試劑盒和大腸桿菌細胞(Fusion-Blue)被用于構建pDAu571表達載體連同pDAu703。PCR擴增使用高保真DNA聚合酶進行。

      表達宿主菌株黑曲霉NN059095通過諾維信分離并且是從土壤中分離的黑曲霉NN049184的衍生物。NN059095經遺傳修飾以破壞淀粉葡糖苷酶活性的表達。

      里氏木霉菌株981-O-8(D4)是里氏木霉RutC30(ATCC 56765;蒙特尼考特(Montenecourt)和伊夫利(Eveleigh),1979,化學進展叢書(Adv.Chem.Ser.)181:289-301的一種誘變菌株。

      里氏木霉菌株AgJg115-104-7B1(WO 2011/075677)是里氏木霉菌株981-O-8(D4)的ku70-衍生物。

      曲霉的轉化

      曲霉屬物種的轉化可使用用于酵母轉化的一般熟知的方法實現(xiàn)。將黑曲霉宿主菌株接種至100ml的補充有10mM尿苷的YPG培養(yǎng)基上,并且在32℃下在80rpm下孵育16hr。將球粒進行收集并且用0.6M KCl洗滌,并且將其再懸浮于包含商業(yè)葡聚糖酶產品(GLUCANEXTM,諾維信公司(Novozymes A/S),鮑斯韋(Bagsvaerd),丹麥)的20ml 0.6M KCl(終濃度為20mg/ml)中。將懸浮液在32℃下伴隨振蕩(80rpm)孵育直到形成原生質體,并且然后用STC緩沖液洗滌兩次。將這些原生質體用血細胞計數器計數,并且在STC:STPC:DMSO的8:2:0.1溶液中再懸浮并且調整至2.5x 107個原生質體/ml的終濃度。

      將大約4pg的質粒DNA添加至100pl的原生質體懸浮液中,輕輕混合,并且冰上孵育30分鐘。添加1ml的SPTC,并且將原生質體懸浮液在37℃下孵育20分鐘。在添加10ml的50℃Cove頂層瓊脂糖之后,將反應液傾例于Cove瓊脂平板上,并且將平板于32℃下孵育5天。

      PCR擴增

      5x PCR緩沖液(包含MgCl2)20μl

      2.5mM dNTP混合物10μl

      正向引物(100pM)1μl

      反向引物(100pM)1μl

      擴展高保真聚合酶(羅氏公司(Roche))1μl

      模板DNA(50-100ng/pl)1μl

      蒸餾水補足至100μl

      PCR條件:

      1.94℃,2min

      2.94℃,0.5min

      3.55℃,0.5min

      4.72℃,1-2min

      2-4.30個循環(huán)

      5.72℃,10min

      用于酶產生的MTP培養(yǎng):

      將曲霉文庫的孢子接種于96深孔板的0.5-1ml的1/4YPM培養(yǎng)基中,并在600rpm,30℃下培養(yǎng)2-3天。

      Southern雜交

      將所選擇的轉化體的菌絲體從在100ml YPG培養(yǎng)基中的過夜培養(yǎng)物中收獲,用蒸餾水沖洗,干燥并且冷凍在-80℃下。將研磨的菌絲體用蛋白酶K和RNA酶A在65℃下孵育1小時。將基因組DNA通過苯酚/CHCl3萃取兩次進行回收,隨后進行EtOH沉淀并且在蒸餾水中再懸浮。

      遵循制造商的說明書,使用PCR DIG探針合成試劑盒(羅氏應用科學公司(Roche Applied Science),印第安納州,印第安納波利斯(Indianapolis,IN))合成非放射性探針。根據制造商的說明書,使用QIAQUICKTM凝膠提取試劑盒(凱杰公司,巴倫西亞,加利福尼亞州)將DIG標記的探針進行凝膠純化。

      將5微克的基因組DNA用適當的限制性內切酶完全消化16小時(40μl總體積、4U酶/μl DNA)并且在0.8%瓊脂糖凝膠上運行。將該DNA在凝膠中通過用0.2M HCl處理進行片段化、變性(0.5M NaOH,1.5M NaCl)并且進行中和(1M Tris,pH 7.5;1.5M NaCl)用于隨后在20X SSC中轉移到海邦(Hybond)N+膜(安瑪西亞公司(Amersham))上。將該DNA進行UV交聯(lián)到該膜上并且在42℃下在20ml DIG Easy Hyb(羅氏診斷產品有限公司(Roche Diagnostics Corporation),曼海姆,德國)中預雜交1小時。

      將變性的探針直接添加至DIG Easy Hyb緩沖液中并且在42℃下進行過夜雜交。在雜交后洗滌(在2X SSC中、室溫、5分鐘洗滌兩次;并且在0.1X SSC中、68℃洗滌兩次,各15min),根據制造商的方案,使用DIG檢測系統(tǒng)和CPD-Star(羅氏公司)進行化學發(fā)光檢測。DIG-標記的DNA分子量標記II(羅氏公司)被用于標準標記。

      實例1.用于采用無啟動子的選擇標記將酶編碼基因文庫插入到基因組中的黑曲霉宿主/載體系統(tǒng)

      分兩個步驟構建包含插入其基因組中的酶編碼多核苷酸文庫的黑曲霉,通過先整合由p002表示的質粒(SEQ ID NO:1中提供的完整DNA序列,并在圖1中示出其示意圖),該質粒包括(按以下順序):

      a)黑曲霉酸性α-淀粉酶編碼基因的5’基因組側翼區(qū);

      b)可操作地與FLP編碼重組酶編碼基因和米曲霉硝酸還原酶基因終止子連接的構巢曲霉木聚糖酶基因啟動子;

      c)曲霉中性淀粉酶基因啟動子,

      d)第一重組酶識別序列:

      5’ttgaagttcctattccgagttcctattctctagaaagtataggaacttc(SEQ ID NO:2),

      e)可操作地與一個潮霉素B抗性標記基因和amdS終止子連接的amdS啟動子;

      f)第二重組酶識別序列

      5’ttgaagttcctattccgagttcctattcttcaaatagtataggaacttca(SEQ ID NO:3),

      g)不具有啟動子但具有終止子的乙酰胺酶(amdS)編碼基因;以及最后地

      h)黑曲霉酸性α-淀粉酶編碼基因的3’基因組側翼區(qū)。

      P002質粒轉化到黑曲霉菌株1007-8(WO 121600093中披露)中,隨后是潮霉素B選擇。獲得的轉化體通過Southern印跡分析證實具有正確地整合的預期的基因組序列。選擇陽性轉化體,并且原生質體從菌株制成。

      在第二步驟中,表達載體pFRT-GlAMG是基于pUC19載體構建的;pFRT-GIAMG的完整DNA序列在SEQ ID NO:4中提供并且示意圖在圖2示出。載體包括(按以下順序):

      a)重組酶識別序列,

      b)來自密粘褶菌的葡糖淀粉酶基因(SEQ ID NO:5中的DNA;SEQ ID NO:6中的氨基酸序列)可操作地與黑曲霉葡糖淀粉酶終止子連接;

      c)米曲霉翻譯延伸因子1(TEF1)啟動子,以在整合后,驅動在宿主細胞的基因組中的基因組無啟動子選擇標記的表達,由此也確保正確定向的整合;和

      d)重組酶識別序列。

      1μg的質粒轉化到原生質體中,以在Cove基礎平板上產生200-300菌落(科夫D.J.(Cove D.J.)1966.生物化學與生物物理學學報(Biochem.Biophys.cta)113:51-56),這些平板補充有1.0M的蔗糖作為碳源和1%木糖。菌落接種到包含0.1%支鏈淀粉的czapec-DOX平板通過碘染色(0.15%I2/1.5%KI)來確認葡糖淀粉酶活性。選擇一個陽性轉化體并且表示為黑曲霉1007-002-44-11。

      實例2.采用無啟動子部分選擇標記的黑曲霉宿主/載體系統(tǒng)

      質粒p007(圖3;SEQ ID NO:7),如下構建:用SpeI-FRTF3-amdS和amdS-F-探針的一個引物對,并以質粒p002作為模板以擴增amdS(4.0kbp)的SpeI位點識別序列C末端的DNA區(qū)來產生第一PCR片段。擴增的PCR產物然后通過SpeI和PacI消化。

      引物SpeI-FRTF3-amdS(81mer;SEQ ID NO:8):

      5’tggcgtagactagttgaagttcctattccgagtcctattcttcaaatagtataggaacttcatcagggagatgtaacaac

      引物amdS-F-探針(22mer;SEQ ID NO:9):

      5’ctatggagtcaccacatttccc

      包括重組酶識別序列和與酶編碼基因可操作地連接的中性淀粉酶啟動子的DNA片段(1.0kbp),是通過用PacI和BgIII的質粒p002的雙重消化制備的。

      包含可操作地與潮霉素抗性編碼基因和amdS終止子連接的amdS啟動子的DNA片段(3.0kbp)是通過用BgIII和SpeI的p002的雙重消化制備的。

      這三個DNA片段連接在一起,并轉化到大腸桿菌DH5α中。所得質粒命名為p007。

      p007質粒包含可操作地與FLP重組酶基因連接的啟動子和終止子、另外的NA2啟動子、具有FRTs之間的啟動子和終止子的潮霉素基因,和缺乏N-末端序列及其第一個內含子的一半的部分amdS選擇標記基因,所有兩側是兩個酸性α-淀粉酶側翼基因組區(qū)域。

      質粒p007轉化到黑曲霉菌株1007-8(WO 121600093中披露)中,隨后是潮霉素B選擇。獲得的轉化體通過Southern印跡分析證實具有正確的整合的序列。

      表達載體,pFRT-BsAMG(圖4;SEQ ID NO:10),是基于pUC19載體構建的,它包括(按以下順序):

      a)重組酶識別序列,

      b)來自Byssocorticium的葡糖淀粉酶基因(SEQ ID NO:11中示出的DNA序列,SEQ ID NO:12中編碼的氨基酸序列)或一個突變的葡糖淀粉酶編碼基因,連同黑曲霉葡糖淀粉酶終止子,

      c)米曲霉TEF1啟動子(旨在驅動在受體宿主細胞的基因組中的選擇標記的表達)可操作地與部分N-末端乙酰胺酶amdS基因連接;和

      d)重組酶識別序列。

      該載體是通過將SEQ ID NO:13中示出的部分乙酰胺酶基因插入到TEF1啟動子(Ptef1)和第二識別序列之間,并且將來自粘褶菌屬的葡糖淀粉酶基因交換為Byssocorticium葡糖淀粉酶基因。

      在作為模板的pFRT-BsAMG上使用M13M4和M13RV引物進行PCR,并且擴增包含第一重組酶識別序列的4kb的片段、來自Byssocorticium的葡糖淀粉酶基因(或突變的葡糖淀粉酶基因)、黑曲霉葡糖淀粉酶終止子、TEF1啟動子、部分N末端乙酰胺酶基因和第二重組酶識別序列。

      引物M13RV(SEQ ID NO:14):caggaaacagctatgac

      引物M13M4(SEQ ID NO:15):gttttcccagtcacgac

      pFRT-BsAMG和PCR片段均被轉化并在Cove基礎平板上和1%木糖培養(yǎng)。菌落接種到包含0.1%支鏈淀粉的czapec-dox平板通過碘染色(0.15%I2/1.5%KI)來確認葡糖淀粉酶活性。

      實例3.黑曲霉中的單拷貝定點基因插入

      使用In-Fusion克隆的質粒文庫構建(Clontech公司)

      40ng的pFRT-GlAMG表達載體被限制性內切酶XhoI和BsiW1消化,以切除存在的AMG編碼基因。用2個引物對進行兩個PCR,正向簡并引物和與表達載體具有多于15bp的重疊的引物,和M13 M4和與簡并引物具有15bp重疊的反向引物,使用pFRT-GIAMG載體作為模板:

      融合載體R中的引物(SEQ ID NO:16):tatgcgttatcgtacgcac

      引物M13 M4(SEQ ID NO:17):gttttcccagtcacgac

      用于BsAMG文庫的引物對如下所示:

      引物M49X F(27mer;SEQ ID NO:18):gtcaacccggactacnnktacacatgg

      引物M49X R(18mer;SEQ ID NO:19):gtagtccgggttgacttg

      消化的載體和PCR片段與In-Fusion混合物混合,轉化到大腸桿菌DH5α中。合并獲得的大腸桿菌轉化體并提取質粒用于文庫構建。

      PCR文庫構建

      用兩個引物對,簡并引物,和SOE-MR R和SOE-M4F,和簡并引物的配對反向引物,使用pFRT表達載體作為模板進行第一PCR。

      用引物對,SOE-F和SOE-R,以及來自第一PCR的PCR片段進行第二SOE PCR。回收所得4kb片段作為PCR片段文庫用于曲霉文庫構建。

      引物SOE-M4F(SEQ ID NO:20):5’gtactatctggcattggtacgttttcccagtcacgac

      引物SOE-MR R(SEQ ID NO:21):5’tggttatgatttcggcgatgcaggaaacagctatgac

      引物SOE-F(SEQ ID NO:22):5’gtactatctggcattggtac

      引物SOE-R(SEQ ID NO:23):5’tggttatgatttcggcgatg

      1μg的每種質粒或PCR片段文庫轉化到黑曲霉1007-002-44-11宿主菌株中。轉化體在包含COVE-N甘氨酸瓊脂(100μl/孔)的96孔MTP中分離,并在32℃下培養(yǎng)1周以具備足夠的孢子形成。添加100μl/孔的0.01%吐溫20至每個孔中,并且孢子懸浮液接種在包含YPG 96孔MTP中,并在30℃下伴隨振蕩培養(yǎng)3天。然后篩選文庫。

      來自曲霉克隆的DNA分離

      通過如下描述的直接菌落PCR擴增方法或通過使用引物對“插入解救F”和“R”在分離染色體DNA上的PCR擴增曲霉菌株的插入DNA。

      引物插入解救F(SEQ ID NO:24):5’aatctcagaacaccaatatc

      引物插入解救F(SEQ ID NO:25):5’aacactatgcgttatcgtac

      菌落PCR如下進行:添加Conidias至1,5ml管,添加500μl的TE-緩沖液并簡單混合。該管內容物在水中稀釋10-20倍,并且將1μl的稀釋的混合物用作模板用于PCR。擴增的DNA通過瓊脂糖凝膠電泳和QIAquick凝膠提取試劑盒(凱杰公司)純化,并且然后測序來檢查構建的文庫的質量。該文庫是正確的。

      實例4米曲霉宿主/載體系統(tǒng)

      米曲霉菌株JaL1394(在WO 2012/160093中披露)在此實例中被用作宿主菌株。我們已經構建了由pDAu571表示的整合表達載體(圖5;SEQ ID NO:26),用于使用FLP/FRT系統(tǒng),位點特異性重組到米曲霉JaL1394的染色體中。

      載體pDAu571是由三部分構成(部分-I,部分-II,部分-III;圖5):

      部分-I是由兩個短FRT(翻轉酶識別目標)位點限定。在FRT位點之間發(fā)現(xiàn)以下元件:

      ●具有可以使用獨特的限制性酶切位點BamHI,XhoI,替換為任何基因或感興趣的多核苷酸文庫(GOI)的“填充序列”的表達盒。

      ●構巢曲霉的pyrG選擇標記,用來因為它們在沒有補充尿苷的基本培養(yǎng)基上生長的能力選擇轉化的宿主細胞;pyrG標記可操作地與其天然啟動子和黑曲霉葡糖淀粉酶基因(Tamg)(SEQ ID NO:26的位置4057-5918)的終止子連接。

      質粒的這一部分經由宿主和載體中的各自FRT位點之間的FLP輔助的重組被整合到宿主有機體的染色體中。當評估基因文庫時,有利地確保載體的部分-I以相同的方向被整合到所有轉化體中。這減少了來自側翼區(qū)(例如,來自通讀)基因表達的任何變化。在染色體中FRT-F和FRT-F3位點的序列和確保染色體中整合部分的正確的方向的載體之間存在小差異。宿主染色體和載體中的FRT-F3位點將通過FLP翻轉酶彼此重組,并且FRT-F位點也將如此。

      FRT-F(SEQ ID NO:26的位置1-49):

      5’-ttgaagttcctattccgagttcctattctctagaaagtataggaacttc(SEQ ID NO:27)

      FRT-F3(SEQ ID NO:26的位置5925-5974):

      5’-ttgaagttcctattccgagttcctattcttcaaatagtataggaacttca(SEQ ID NO:28)

      表達盒包含人工NA2TPI啟動子,該啟動子構建自融合至構巢曲霉磷酸丙糖異構酶的非翻譯前導序列的黑曲霉中性淀粉酶II啟動子(SEQ ID NO:26的位置73-814)。

      此外,表達盒包含所謂的“填充序列”,它在這種情況下是編碼來自大豆的脂氧合酶I的基因(SEQ ID NO:22的位置824-3343)。如已經提到的,載體中填充序列可以使用兩個獨特限制酶位點BamHI,XhoI被替換為感興趣的任何其他基因。

      最后,表達盒包含黑曲霉葡糖淀粉酶基因的終止子(SEQ ID NO:26的位置3358-4048)。

      pDau571載體的部分-II是翻轉酶編碼基因(sFLP)的合成版本(SEQ ID NO:26的位置4875-6143(反向鏈))。翻轉酶基因表達通過米曲霉翻譯延伸因子1α啟動子(pTEF1)(SEQ ID NO:26的位置7759-8447(反向鏈))連同米曲霉硝酸還原酶終止子(TniaD))(SEQ ID NO:26的位置5991-6478(反向鏈))來控制。

      對于在大腸桿菌中質粒的增殖,pDau571載體的部分-III是必需的,并且包括大腸桿菌β-內酰胺酶(ampR)可選擇標記和源自熟知的pUC質粒的大腸桿菌復制起點(SEQ ID NO:26的位置8448-11101)。

      質粒pDAu571(其中填充序列由所感興趣的多核苷酸文庫替換)被轉化到菌株Jal1394的原生質體中,如下:

      100μl原生質體與10μl小量制備質粒DNA(未消化或線性化)或跨越pDAu571的部分-I和部分-II的PCR產物和300μl 60%的PEG在室溫下孵育20min;然后添加5ml Topagar(+10mM NaNO3),并將整個轉化混合物平鋪在蔗糖/10mM NaNO3平板上。37℃下孵育平板,直到可以發(fā)現(xiàn)孢子。為了純化單一轉化體,菌落再次復制到新蔗糖/10mM NaNO3平板上,并在37℃下孵育,直到孢子發(fā)育。

      獲得的轉化體可以通過使用位于表達盒側翼兩側的amy2基因座內的診斷引物的PCR來驗證表達盒的amy2基因座的正確整合,該表達盒包括FRT位點和位于表達盒內的基因特異性引物。

      實例5.分裂標記米曲霉的宿主/載體系統(tǒng)的構建

      先前實例提供了用于進入適合的絲狀真菌宿主細胞的翻轉酶介導的位點特異性重組和整合的表達載體。通過使用不同的重組酶識別序列確保整合表達盒的染色體中的正確的方向。

      確保正確的方向的另一方式是采用分裂選擇標記,其中標記的一個非功能部分存在于宿主染色體中,并且標記的另一非功能部分是在進來的載體上。然后只有正確定向的整合生成功能第二選擇標記。該分裂標記原理在此實例中說明;在此第二選擇標記被定向在一個方向上,但它剛好也可以已經按其他方式被定向。

      曲霉原生質體轉化和重組細胞的選擇所必需的培養(yǎng)基和溶液:

      痕量金屬

      鹽溶液

      COVE培養(yǎng)基

      20ml鹽溶液

      20g瓊脂

      218g山梨醇

      H2O補足1l

      高壓滅菌并且然后添加:

      50ml 20%葡萄糖

      10ml1M尿素。

      Cove-N-甘氨酸斜面

      蔗糖培養(yǎng)基

      20ml鹽溶液。

      342g蔗糖。

      H2O補足1l

      高壓滅菌并且然后添加:

      10mM硝酸鈉

      ST 0.6M山梨醇

      100mM Tris/HCl pH 7.0

      STC 1.2M山梨醇

      10mM CaCl2

      10mM Tris/HCl pH7.5。

      PEG 60%(W/V)PEG 4000(BDH)(6g PEG+~5ml無菌水,置于60℃-65℃)

      10mM CaCl2(50μl的2M CaCl2)

      10mM Tris/HCl pH 7.5。(100μl的1M的Tris)

      蔗糖瓊脂平板

      10g瓊脂

      10ml鹽溶液

      1M蔗糖補足至500ml

      高壓滅菌器滅菌

      乙酰胺平板

      10ml鹽溶液

      10g瓊脂

      1M蔗糖補足至500ml1。

      高壓滅菌。

      冷卻至大約65℃,添加10mM乙酰胺和15mM CsCl。

      對于500毫升,Triton X-100 50μl(僅在復制平板中)

      在米曲霉DAu716的amy2基因座的FRT位點的引入

      質粒pJAl1258(在WO 12160097A1中描述)被改良生成由pDAu703表示的質粒。質粒pDAu703按順序包含以下元件(圖6;SEQ ID NO:29):

      ●amy2-3’側翼區(qū)(490bp);SEQ ID NO:29的位置449-938;

      ●pyrG啟動子可操作地與包含pyrG CDS的5’端(第一外顯子及其第一內含子的5’端)的部分的pyrG基因連接;

      ●FRT-F3位點(50bp);SEQ ID NO:29的位置1452-1501;

      ●黑曲霉AMG終止子(Tamg)可操作地與amdS編碼基因,SEQ ID NO:29的位置1511-2200連接;

      ●構巢曲霉乙酰胺酶基因(amdS),SEQ ID NO:29的位置2232-4131;

      ●強磷酸丙糖異構酶啟動子(Ptpi)可操作地與Amds編碼基因連接;這允許在乙酰胺和ClCs上生長,即使按照預期基因組中僅存在AmdS選擇盒的一個拷貝,如果質粒pDAU703被整合到位于FRT位點的amy2基因座的一個拷貝中。SEQ ID NO:29的位置4140-4894;

      ●FRT-F位點(49bp);SEQ ID NO:29的位置4903-4951;

      ●amy2-5’側翼區(qū)(1114bp);SEQ ID NO:29的位置4964-6077;

      ●質粒的其余部分是由對于維持質粒作為細菌宿主細胞大腸桿菌中的復制質粒所必需的一部分DNA(大腸桿菌復制起點和氨芐青霉素抗性盒)構成。

      質粒DNA pDAu703用NotI限制性內切酶消化,以從質粒的現(xiàn)在不相干大腸桿菌部分分離包含整合盒的DNA。

      將線性化質粒pDAu703使用描述的標準程序(例如在WO 98/01470中)轉化進入米曲霉菌株Jal1338的原生質體(在WO 12160097 A1中披露),但是因為該菌株是的pyrG負型,需要補充10mM尿苷至培養(yǎng)基,因此其在沒有尿苷下不能生長。在AmdS選擇平板上選擇轉化體

      所得重組宿主菌株已經具有兩個FRT位點連同分裂pyrG標記(第一外顯子和天然內含子的一部分)的5’端,該標記通過同源重組在amy2基因座與其自己的整合的啟動子可操作地連接,如在圖7中的頂部小圖中所示。在amy2基因座上的正確整合通過Southern印跡分析使用退火到amy2的3’端的探針檢查(圖7)。FRT盒的整合分別在EcoRI和XhoI消化物中的5114bp和2637bp處產生雜交信號(未示出)。該模式與Jal1338宿主不同,其中該amy2基因座不被破壞。選擇正確的菌株并用米曲霉DAu716表示(圖7,上圖)。

      用攜帶脂肪酶編碼基因的pDAU724載體的DAu716的轉化

      這個實例展示了FRT/FLP重組和分裂pyrG標記可以如何被用于有效地使表達盒的單拷貝插入以高頻存在于米曲霉中。我們使用來自綿毛嗜熱絲孢菌的脂肪酶基因(例如在WO 2008008950中披露)作為報告基因來測量在轉化的宿主中產生的脂肪酶的水平。

      像在先前實例中,構建表達載體,這樣使得其一部分可以使用翻轉酶作為位點特異性重組介質,在FRT-位點被整合到宿主細胞的染色體中。要被整合到基因組中的質粒的一部分攜帶可操作地與NA2/TPi啟動子和黑曲霉AMG基因的終止子連接的脂肪酶基因。為了能夠選擇經由FRT位點已經成功整合表達盒的重組細胞,pyrG選擇標記的剩余部分也被包括在FRT位點之間。啟動子和第一外顯子存在于DAu716宿主中并且pyrG標記的剩余部分存在于進來的質粒上。當位點特異性重組時,pyrG標記將被重構為完整基因(其中其第一內含子內的FRT序列,將當然,從mRNA拼接出)并且重組細胞將能夠表達PyrG和生長在NaNO3作為單一氮源的平板上。

      質粒pDAU724(圖7,中間;SEQ ID NO:30)由以下組成:

      要被整合到曲霉屬宿主細胞的基因組DNA中的的部分-I,并且它由具有有表達盒的兩個FRT位點和分裂pyrG標記的一部分組成;

      將不被整合到宿主細胞的基因組中的部分-II,并且它包含F(xiàn)LP酶表達盒連同大腸桿菌選擇標記和復制起點。

      菌株DAu716生長在Cove-N-甘氨酸介質的斜面上直至可以看見孢子。

      將10-20毫升的蔗糖培養(yǎng)基或YPD培養(yǎng)基添加至該斜面,并且通過漩渦振蕩斜面懸浮孢子。孢子懸浮液轉移到包含100ml蔗糖培養(yǎng)基和10mM硝酸鈉(或其它氮源)的聚碳酸酯搖瓶(500毫升)中。在30℃下孵育燒瓶24hr(200rpm)。

      通過神奇濾布(miracloth)過濾收集菌絲體,并且使用200ml 0.6M MgSO4洗滌。從菌絲體吸出剩余液體,例如使用塑料移液器。

      1-2g的菌絲體被轉移到小的(100ml)聚碳酸酯燒瓶中,瓶中包含:

      75-150mg Glucanex

      10ml 1.2M MgSO4

      100ul 1M NaH2PO4pH 5.8

      并且懸浮菌絲體,添加1ml的12mg/ml的BSA(無菌過濾的)

      在37℃孵育懸浮液1/2-2hr,并且經常通過顯微術監(jiān)測原生質體形成。

      將原生質體懸浮液通過神奇濾布(miracloth)過濾到25毫升離心管中,并且將懸浮液用5ml ST(小心不要與下層混合)覆蓋。將所得原生質體,通過離心(2500rpm/1350g,15min,緩慢加速)分帶?;厥赵|體的界面帶,并且轉移到新鮮的管中。

      用兩體積的STC稀釋原生質體,隨后離心(2500rpm/1350g,5min)。然后用5ml STC洗滌原生質體兩次(使用再懸浮和離心),并且然后在STC中再懸浮至大約5x107個原生質體/ml的濃度。

      對于每次轉化,將正在轉化的DNA添加至例如14ml管的底部,并且添加100μl的原生質體。添加300μl的PEG,并且將該管用手輕輕混合。孵育20分鐘(室溫)后,在50℃的溫度下添加6ml頂層瓊脂,并立即將該懸浮液倒在具有10mM的NaNO3的選擇性蔗糖瓊脂平板上。

      將平板在37℃孵育,直至轉化體清晰可見并且開始形成孢子。20個轉化體復制到具有Triton的新選擇平板上,以分離菌落,可以通過發(fā)酵,Southern印跡分析或酶活性測定進一步分析這些菌落。

      確認染色體中存在的amdS標記已經通過在包含CsCl(內源乙酰胺酶的抑制劑)和作為唯一氮源的乙酰胺的平板上將轉化體劃線,在轉化體中被引進的脂肪酶基因替換。正確的轉化體不應該能夠在這些平板上生長。我們測試了20個重組細胞,這些重組細胞是pDAu724的轉化成DAu716后獲得的,并與親本宿主菌株DAu716相比,僅觀察到輕微的生長表型,其中AmdS選擇標記仍然存在。

      證實所有20個轉化體均包含正確插入在FRT位點的脂肪酶表達盒的一個插入的拷貝。

      將20個轉化體接種至3ml YPD在10ml 24深孔板(沃特曼(Whatman)公司)中,用Airpore膠帶(Quiagen公司)密封,并且在200rpm的攪拌下30攝氏度孵育4天。收集上清液用于進一步分析(脂肪酶測定和SDS-PAGE),并收集菌絲體用于基因組提取和Southern分析。

      20個轉化體在脂肪酶測定中示出可比較脂肪酶活性,連同在SDS-PAGE凝膠上示出可比較脂肪酶蛋白水平。此外,Southern印跡證實,所有20個轉化體僅具有正確地整合到染色體中的預期單一脂肪酶基因拷貝。

      實例6:野生型紅豆(Vigna angularis)木葡聚糖內糖基轉移酶16(VaXET16)的克隆,用于在米曲霉篩選菌株中表達

      在此密碼子優(yōu)化野生型紅豆(Vigna angularis)木葡聚糖內糖基轉移酶16(VaXET16)cDNA通過酵母重組克隆克隆到米曲霉Flp/FRT穿梭載體pDAu571(圖5)中,生成載體pDLHD0075(圖8)。

      表達載體pDLHD0075被構建為包含大腸桿菌pUC復制起點、大腸桿菌β-內酰胺酶(ampR)可選擇標記、URA3酵母可選擇標記、酵母2微米復制起點、NA2-tpi啟動子、密碼子優(yōu)化飛VaXET16開放閱讀框(cDNA序列為SEQ ID NO:31并且氨基酸序列為SEQ ID NO:32)、黑曲霉葡糖淀粉酶終止子、構巢曲霉pyrG選擇標記、米曲霉TEF1啟動子和米曲霉NIAD終止子之間的釀酒酵母2μm翻轉酶ORF、和釀酒酵母2μm翻轉酶識別目標FRT-F和FRT-F3。

      質粒pDLHD0075通過使用酵母重組克隆合并四個DNA片段生成:片段1包含翻轉酶表達盒,F(xiàn)RT-F3,和來自pDAU571的AMG終止子,以及與片段4和2同源的側翼序列。片段2包含大腸桿菌pUC復制起點、大腸桿菌β-內酰胺酶(ampR)選擇標記、URA3酵母選擇標記、來自pDLHD0044的酵母2微米復制原點、和與片段1和3同源的側翼序列。片段3包含所述NA2-tpi啟動子、來自pDLHD0044的VaXET16密碼子優(yōu)化基因、和與片段2和4同源的側翼序列。片段4包含黑曲霉淀粉葡萄糖苷酶終止子序列(AMG終止子)和作為來自pDAU571的可選擇標記的構巢曲霉乳清苷-5’-磷酸脫羧酶基因(pyrG),以及與片段3和1同源的側翼序列。

      使用以下所示的引物615726(正義)和引物615728(反義)擴增片段1。這些引物被設計成包含分別與片段4和2同源的序列的側翼區(qū)(小寫),用于PCR片段之間的無連接克隆。

      引物615726(正義):

      accgggaggaaggctggaaaGCTTACGAGAAAAGAGTTGGACTTTGAGGG(SEQ ID NO:33)

      引物615728(反義):

      tgagcgaggaagcggAAGAGCGCCCAATACGCAAACCGCC(SEQ ID NO:34)

      片段1在反應中通過PCR來擴增,該反應由10ng的pDAU571、0.5μl的DNA聚合酶、20pmol的引物615726、20pmol的引物615728、1μl的10mM dNTP、10μl的5XHF緩沖液、和35.5μl的水構成。該反應在熱循環(huán)儀中孵育,程序為1個循環(huán),在98℃下持續(xù)30秒;以及30個循環(huán),每個循環(huán)在98℃下持續(xù)10秒,在60℃下持續(xù)10秒,以及在72℃下持續(xù)120秒。將所得3.3kb PCR產物(片段1)用1μl的Dpn I進行處理,以去除質粒模板DNA。直接添加Dpn I至PCR反應管中,充分混合,并且在37℃下孵育60分鐘。

      使用以下所示的引物615729(正義)和引物615731(反義)擴增片段2。這些引物被設計成包含分別與片段1和3同源的序列的側翼區(qū)(小寫),用于PCR片段之間的無連接克隆。

      引物615729(正義):

      tgcgtattgggcgctcttCCGCTTCCTCGCTCACTGACTC(SEQ ID NO:35)

      引物615731(反義):

      tatactttctagagaataggaactcggaataggaacttcaaGGAACAACACTCAACCCTATCTCGGTC(SEQ ID NO:36)

      片段2在反應中通過PCR來擴增,該反應由10ng的pDLHD0044、0.5μl的DNA聚合酶、20pmol的引物615729、20pmol的引物615731、1μl的10mM dNTP、10μl的5XHF緩沖液、和35.5μl的水構成。該反應在熱循環(huán)儀中孵育,程序為1個循環(huán),在98℃下持續(xù)30秒;以及30個循環(huán),每個循環(huán)在98℃下持續(xù)10秒,在60℃下持續(xù)10秒,以及在72℃下持續(xù)120秒。將所得4.2kb PCR產物(片段2)用1μl的Dpn I進行處理,以去除質粒模板DNA。直接添加Dpn I至PCR反應管中,充分混合,并且在37℃下孵育60分鐘。

      使用以下所示的引物615730(正義)和引物615611(反義)擴增片段3。這些引物被設計成包含分別與片段2和4同源的序列的側翼區(qū)(小寫),用于PCR片段之間的無連接克隆。

      引物615730(正義):

      tccgagttcctattctctagaaagtataggaacttcGCATTTATCAGGGTTATTGTCTCATGAGCGG(SEQ ID NO:37)

      引物615611(反義):

      tctagatctcgagtcaGATGTCCCTATCGCGTGTACACTCG(SEQ ID NO:38)

      片段3在反應中通過PCR來擴增,該反應由10ng的pDLHD0044、0.5μl的DNA聚合酶、20pmol的引物615730、20pmol的引物615611、1μl的10mM dNTP、10μl的5XHF緩沖液、和35.5μl的水構成。該反應在熱循環(huán)儀中孵育,程序為1個循環(huán),在98℃下持續(xù)30秒;以及30個循環(huán),每個循環(huán)在98℃下持續(xù)10秒,在60℃下持續(xù)10秒,以及在72℃下持續(xù)120秒。將所得1.7kb PCR產物(片段3)用1μl的Dpn I進行處理,以去除質粒模板DNA。直接添加Dpn I至PCR反應管中,充分混合,并且在37℃下孵育60分鐘。

      使用以下所示的引物615610(正義)和引物615727(反義)擴增片段4。這些引物被設計成包含分別與片段3和1同源的序列的側翼區(qū)(小寫),用于PCR片段之間的無連接克隆。

      引物615610(正義):

      acacgcgatagggacatcTGACTCGAGATCTAGAGGGTGACTGAC(SEQ ID NO:39)

      引物615727(反義):

      aactcttttctcgtaagcTTTCCAGCCTTCCTCCCGGTAC(SEQ ID NO:40)

      片段4在反應中通過PCR來擴增,該反應由10ng的pDAU571、0.5μl的DNA聚合酶、20pmol的引物615610、20pmol的引物615727、1μl的10mM dNTP、10μl的5XHF緩沖液、和35.5μl的水構成。該反應在熱循環(huán)儀中孵育,程序為1個循環(huán),在98℃下持續(xù)30秒;以及30個循環(huán),每個循環(huán)在98℃下持續(xù)10秒,在60℃下持續(xù)10秒,以及在72℃下持續(xù)120秒。將所得1.9kb PCR產物(片段4)用1μl的Dpn I進行處理,以去除質粒模板DNA。直接添加Dpn I至PCR反應管中,充分混合,并且在37℃下孵育60分鐘。

      使用基于酵母同源性的重組克隆,使用以下程序來合并四個PCR片段。將PCR片段的每種的10μl等分試樣與來自鮭魚睪丸的100μg的單鏈脫氧核糖核酸(西格瑪奧德里奇,圣路易斯,密蘇里州,美國)、100μl的菌株YNG318的感受態(tài)酵母細胞(釀酒酵母ATCC 208973)、和600μl的PLATE緩沖液(西格瑪奧德里奇,圣路易斯,密蘇里州,美國)合并,并且混合。將反應在30℃下以200rpm振蕩孵育30分鐘。然后將該反應在42℃下在沒有振蕩的情況下繼續(xù)15分鐘。將這些細胞通過在5,000x g下離心1分鐘進行沉淀,并且棄去上清液。將細胞球粒懸浮于200μl的高壓蒸汽處理的水中,并且分在兩個包含合成的所定義的培養(yǎng)基缺少尿苷的瓊脂平板,并且在30℃下孵育3天。將這些酵母菌落使用1ml的高壓蒸汽處理的水從平板中分離。將這些細胞通過在13,000x g下離心30秒進行沉淀,并且將100μl等分試樣的玻璃珠添加到該管中。將細胞和珠混合物懸浮在250μl的P1緩沖液(凱杰公司,巴倫西亞,加利福尼亞州,美國)中,并且然后渦旋1分鐘來裂解這些細胞。使用旋轉迷你制備型試劑盒純化質粒DNA。根據制造商的說明書,然后將3μl等分試樣的質粒DNA轉化到大腸桿菌ONE TOP10電轉化感受態(tài)細胞中。將50μl的轉化細胞散布于每ml補充有100μg氨比西林的2XYT平板上,并且在37℃下孵育過夜。將轉化體各自挑入每ml補充有100μg的氨比西林的3ml的LB培養(yǎng)基中,并且在37℃下在250rpm的振蕩下生長過夜。使用旋轉迷你制備型試劑盒從菌落中純化質粒DNA。將使用3130XL遺傳分析儀的DNA測序用來確認指定為質粒pDLHD0075的最終質粒中三個片段中的每個的存在(圖8)。

      實例7:在米曲霉篩選菌株JaL1394中按單拷貝的野生型紅豆(Vigna angularis)木葡聚糖內糖基轉移酶16(VaXET16)表達的確認

      米曲霉JaL1394(在WO 2012/160093中披露)用包含密碼子優(yōu)化VaXET16基因的質粒pDLHD0075轉化。

      將來自米曲霉JaL1394的大約107孢子的接種于500ml搖瓶中的補充有10mM尿苷的100ml的YP+2%葡萄糖培養(yǎng)基中,并且在28℃和110rpm下孵育過夜。將10ml的過夜培養(yǎng)物在125ml無菌真空濾器中過濾,并且將菌絲用50ml的0.7M KCl-20mM CaCl2洗滌兩次。將剩余液體通過真空過濾去除,留下墊在濾器上。將菌絲體再懸浮于10ml的0.7M KCl-20mM CaCl2中,并且轉移到無菌125ml搖瓶中,該搖瓶包含20mg的200G(諾維信瑞士股份公司(Novozymes Switzerland AG),Neumatt,瑞士)/ml和0.2mg的幾丁質酶(西格瑪奧德里奇,圣路易斯,密蘇里州,美國)/ml(在10ml的0.7M KCl-20mM CaCl2中)。將該混合物在37℃和100rpm下孵育30-90分鐘,直到從菌絲體中產生原生質體。將該原生質體混合物通過襯有(Calbiochem公司,圣迭哥,加利福尼亞州,美國)的無菌漏斗進行過濾,到無菌50毫升塑料離心管中,以去除菌絲體碎片。將在上的碎片徹底地用10ml的0.7M KCl-20mM CaCl2進行洗滌并且在2500rpm下,在20℃-23℃下,離心10分鐘。去除該上清液,并且將原生質體球粒再懸浮于20ml的1M山梨醇-10mM CaCl2-10mM Tris-HCl(pH 6.5)中。將該步驟重復兩次,并且將最終的原生質體球粒再懸浮于1M山梨醇-10mM CaCl2-10mM Tris-HCl(pH 6.5)中,以獲得2x107/ml的最終原生質體濃度。

      原生質體通過添加兩μg的pDLHD0075至無菌12ml塑料離心管的底部轉化。將一百μl的原生質體添加至管中,隨后添加在10mM CaCl2-10mM Tris-HCl(pH 6.5)中的300μl的60%PEG-4000。將該管用手輕輕混合,并且在37℃下孵育30分鐘。將添加五ml的1M山梨糖醇-10mM CaCl2-10mM Tris-HCl(pH 6.5)添加到該轉化中,并且將該混合物轉移到150mm基本培養(yǎng)基瓊脂平板上。將轉化板在37℃下孵育直到轉化體出現(xiàn)。

      挑出單個轉化體到新基本培養(yǎng)基瓊脂平板,并且在37℃下培養(yǎng)4天,直到轉化體形成孢子。新鮮孢子轉移到48孔深孔板,這些板包含2ml的YP+2%麥芽糊精培養(yǎng)基,覆蓋有可透氣密封件,并且在沒有振蕩下在28℃下生長4天。在4天生長后,將每個轉化體的培養(yǎng)基針對木葡聚糖內糖基轉移酶活性并且針對木葡聚糖內糖基轉移酶表達通過如下所概述的SDS-PAGE來測定。

      活性測定展示,轉化體產生活性木葡聚糖內糖基轉移酶。

      碘比色法測定來確定木葡聚糖內糖基轉移酶活性

      木葡聚糖內糖基轉移酶活性使用由布洛瓦(Sulova)等人,1995,分析生物化學(Analytical Biochechemistry)229:80-85中描述的碘比色測定的修改版本進行測定。對于每個反應,5μl的羅望子木葡聚糖(麥格酶公司,布雷,英國)(5mg/ml在水中)與20μl的木葡聚糖低聚物(麥格酶公司,布雷,英國)(5mg/ml在水中)、10μl的400mM檸檬酸鈉pH5.5合并,并且分散到96孔板中。反應通過添加5μl的液體培養(yǎng)液至每個孔中啟動,并且在37℃孵育板10分鐘。反應通過添加200μl的由14%(w/v)Na2SO4、0.2%KI、0.1M HCl和0.5%I2構成的溶液猝滅,并且在黑暗中孵育30分鐘,然后在 M5分光光度計(Molecular Devices公司,桑尼維爾,加利福尼亞州,美國)中在620nm測量吸光度。

      使用8%-16%無染色SDS-PAGE凝膠(伯樂實驗室有限公司,赫拉克勒斯,加利福尼亞州,美國)進行SDS-PAGE,并且使用以下設置,將該凝膠用無染色成像儀(伯樂實驗室有限公司,赫拉克勒斯,加利福尼亞州,美國)成像:5分鐘活化,自動成像曝光(強帶),高亮飽和像素=ON,顏色=考馬斯酸性染料,和帶檢測、分子量分析和報告禁用。SDS-PAGE揭示了大約32kDa的野生型VaXET16帶。

      實例8:紅豆(Vigna angularis)木葡聚糖內糖基轉移酶16(VaXET16)的改進的表達變體的構建和鑒定

      VaXET16基因突變體文庫通過位點飽和誘變構建。VaXET16基因的突變體文庫(文庫的每個片段包括突變VaXET16基因+構巢曲霉乳清苷-5’-磷酸脫羧酶pyrG選擇標記與FRT-F和FRT-F3翻轉酶識別靶序列)與包括米曲霉TEF1啟動子和米曲霉NIAD基因終止子之間的釀酒酵母2μm翻轉酶ORF的pDLHD0095載體一起轉化到如先前實例中所述的米曲霉JaL1394的原生質體中。37℃下在基本培養(yǎng)基瓊脂平板上原生質體恢復4天后,挑出單個菌落至包含2ml的YP+2%麥芽糖糊精培養(yǎng)基的48孔深孔板中,覆蓋有透氣密封,并且在沒有振蕩下在28℃下生長4天。在液體培養(yǎng)基生長4天后,如在先前實例中所述測定木葡聚糖內糖基轉移酶活性,并且更高活性變體被打分為表達命中。

      孢子純化單個突變體菌株,并且再次培養(yǎng)以產生新鮮培養(yǎng)液,用于使用密碼子優(yōu)化基因,相對于表達野生型VaXET16米曲霉JaL1394菌株進行再次測試。如在先前實例中所述,通過SDS-PAGE分析培養(yǎng)液,用于增加木葡聚糖內糖基轉移酶蛋白產物的生產。

      十一個表征的變體在來自48孔深孔板培養(yǎng)的4天培養(yǎng)液中,優(yōu)于親本基因的表達產量的相對改進在下表1中示出。相同的培養(yǎng)液的SDS-PAGE分析展示所有變體的優(yōu)于野生型VaXET的增加強度的VaXET帶,這與在活性測定中觀察到的相對改進很好地相關。野生型VaXET及其變體的SDS-PAGE帶為32kDa,除包含N175S突變的變體由于另外的糖基化具有大約37kDa的帶。

      表1.

      實例9:米曲霉中紅豆(Vigna angularis)木葡聚糖內糖基轉移酶16變體(VaXET16)基因的改進的表達的發(fā)酵規(guī)模確認

      發(fā)酵工藝被用來相對于野生型VaXET16,表達VaXET16變體、A40G+I53A+N175S和A40G+F183I。

      搖瓶培養(yǎng)基由以下構成:50g的蔗糖、10g的KH2PO4、0.5g的CaCl2、2g的MgSO4·7H2O、2g的K2SO4、2g的尿素、10g的酵母提取物、2g的檸檬酸、0.5ml的痕量金屬溶液、以及去離子水補足至1升。痕量金屬溶液由以下構成:13.8g的FeSO4·7H2O、14.3g的ZnSO4·7H2O、8.5g的MnSO4·H2O、2.5g的CuSO4·5H2O、3g的檸檬酸、以及去離子水補足至1升。

      將一百ml的搖瓶培養(yǎng)基添加至500ml搖瓶。用來自固體平板培養(yǎng)的兩個塞接種搖瓶,并且在軌道搖床上以200rpm在34℃孵育24小時。將50ml的燒瓶培養(yǎng)液用于接種3升發(fā)酵容器。

      每升分批發(fā)酵培養(yǎng)基(Fermentation batch medium)由以下構成:10g的酵母提取物、24g的蔗糖、5g的(NH4)2SO4、2g的KH2PO4、0.5g的CaCl2·2H2O、2g的MgSO4.7H2O、1g的檸檬酸、2g的K2SO4、0.5ml的止泡劑、和0.5ml的痕量金屬溶液。每升痕量金屬溶液由以下構成:13.8g的FeSO4·7H2O、14.3g的ZnSO4·7H2O、8.5g的MnSO4·H2O、2.5g的CuSO4·5H2O,和3g的檸檬酸。發(fā)酵補料培養(yǎng)基(fermentation feed medium)由麥芽糖構成。

      將總計1.8升的發(fā)酵分批培養(yǎng)基添加到三升玻璃套發(fā)酵器中。發(fā)酵補料培養(yǎng)基以0到4.4g/l/hr的速度給予。將發(fā)酵容器維持在34℃的溫度,pH控制在6.1+/-0.1的設定點。將空氣以l vvm的速率添加到容器中,且且用以1100到1300rpm旋轉的Rushton葉輪攪拌。在發(fā)酵運行的第3、4、5、6和7天取樣,并且在3000x g離心以去除生物質。將上清液過濾滅菌,并且在5℃至10℃儲存。

      可以通過以下概述的熒光偏振測定并且通過SDS-PAGE分析(參見上文),相對于野生型密碼子優(yōu)化基因,確定VaXET16變體表達水平。

      針對木葡聚糖內糖基轉移活性的熒光偏振測定

      根據由周(Zhou)等人,2006,生物催化與生物轉化(Biocatalysis and Biotransformation)24:107-120所描述的程序,通過木葡聚糖低聚物的還原端的還原氨化,隨后在100mM碳酸氫鈉(pH 9.0)在室溫下將XGO的氨基基團結合到熒光素異硫氰酸酯異構體I(西格瑪奧德里奇(Sigma Aldrich),圣路易斯,密蘇里州,美國)24小時,來產生熒光素異硫氰酸酯標記的木葡聚糖低聚物(FITC-XGO)。將結合反應產物在真空中濃縮干燥,溶解于0.5ml的去離子水,并且通過硅膠層析進行純化,該硅膠層析用從100:0:0.04至70:30:1梯度的乙腈:水:乙酸作為流動相進行洗脫。通過蒸發(fā)該緩沖液、溶解于D2O(西格瑪奧德里奇,圣路易斯,密蘇里州,美國),并且使用Varian400MHz MercuryVx(安捷倫(Agilent),圣克拉拉,加利福尼亞州,美國)通過1H NMR分析來確認純度和產物同一性。在-20℃下在黑暗中,儲存干燥的FITC-XGO,并且在解凍過程中干燥。

      一mg的FITC-XGO與在200μl反應中的每ml的20mM檸檬酸鈉pH 5.0的1mg的羅望子木葡聚糖(麥格酶公司,布雷,英國)和18mg的VaXET16一起孵育至少30分鐘。合并樣品混合物并且通過添加冰冷的乙醇至80%(v/v)的終濃度進行沉淀,并且在4℃下孵育過夜。沉淀的熒光素異硫氰酸標記木葡聚糖(FITC-XG)通過使用LEGENDTM RT加離心機(賽默飛世爾科技公司(Thermo Scientific),沃爾瑟姆,馬薩諸塞州,美國)在3000rpm離心,傾析乙醇進行回收,并且在室溫下干燥24小時。將FITC-XG溶解在最小體積的去離子水中直到溶解并儲存在-20℃。將冷凍的FITC-XG解凍并且凍干過夜。將凍干粉末溶解在500μl的去離子水中并且通過在488nm的吸光度定量。

      按以下方式制備大規(guī)模批次的FITC-XG。在去離子水中制備每ml溶液7.9mg的FITC-XGO。徹底混合四十ml的10mg的羅望子木葡聚糖(麥格酶公司,布雷,英國)/ml的去離子水、452ml的7.9mg的FITC-XGO/ml的去離子水、2ml的400mM檸檬酸鈉(pH 5.5)、和1.2ml的1.4mg的VaXET16/ml的20mM檸檬酸鈉(pH 5.5),并且在室溫下孵育過夜。在過夜孵育后,通過添加冰冷的乙醇至終體積110ml來沉淀FITC-XG,徹底混合,并且在4℃下整夜孵育。用水洗滌沉淀的FITC-XG,并且然后轉移到圓底燒瓶(Erlenmeyer bulb)中。通過使用EZ-2Elite蒸發(fā)器(SP Scientific/Genevac公司,斯通里奇,紐約,美國)蒸發(fā)4小時來去除殘余的水和乙醇。將干燥的樣品溶解于水中,并且用去離子水將體積調整到48ml,以產生,在所希望的100kDa的平均分子量下,5mg/ml的最終FITC-XG濃度。

      使用以下測定來評估木葡聚糖內糖基轉移活性。如以上描述的制備200μl的反應,該反應包含1mg的羅望子木葡聚糖/ml、0.01mg/ml FITC-XGO,并且將10μl的適當稀釋的XET在25℃下在不透明96孔微量滴定板中的20mM檸檬酸鈉(pH 5.5)中孵育10分鐘。在這個時間段,以頂級閱讀方向,用490nm的激發(fā)波長、520nm的發(fā)射波長、激發(fā)路徑中495截止濾波器、高精度(100次讀取)、和中光電倍增管的靈敏度,使用 M5酶標儀(分子器件公司(Molecular Devices),森尼維耳市,加利福尼亞州,美國)連續(xù)監(jiān)測熒光偏振。將熒光XGO以XET依賴性摻入非熒光XG中導致隨著時間增加熒光偏振。使用偏振時間進程曲線的線性區(qū)域的斜率來確定該活性。

      相對于野生型VaXET16,對于兩個變體的7天培養(yǎng)液,優(yōu)于親本基因,產量相對改進在下表2中示出。按比野生型VaXET16 3.1X更大的量產生變體A40G+I53A+N175S,而按比野生型VaXET16 1.2X更大的量產生變體A40G+F183I。相同的培養(yǎng)液的SDS-PAGE分析示出兩個變體的優(yōu)于野生型VaXET的增加強度的VaXET帶這與在活性測定中觀察到的相對改進很好地相關。在第3,4,5,6,和7天所取的樣品的SDS-PAGE分析示出VaXET的增加的生產,并且各變體日益增強,其中在第7天最強。

      表2.

      在此描述并且要求保護的本發(fā)明不局限于在此披露的特定方面的范圍,因為這些方面旨在作為本發(fā)明若干方面的說明。預期任何等效方面都處于本發(fā)明的范圍內。實際上,除在此所示和描述的那些之外,本發(fā)明的不同修改對于本領域普通技術人員而言從前述描述將變得清楚。這樣的修改也旨在落入所附權利要求的范圍內。在有沖突的情況下,以包括定義的本披露為準。

      實例10:里氏木霉原生質體產生與轉化

      使用基于賓替拉(Penttila)等人,1987,基因(Gene)61:155-164的以下方案進行原生質體制備與轉化。將里氏木霉菌株在25ml的補充有2%(w/v)葡萄糖和10mM尿苷的YP培養(yǎng)基中在27℃下、伴隨著以90rpm進行的輕輕攪拌培養(yǎng)17小時。將菌絲體通過使用真空驅動一次性過濾系統(tǒng)(密理博公司(Millipore))過濾來收集,并且用去離子水洗滌兩次,并且用1.2M山梨醇洗滌兩次。通過在20ml的每ml包含15mg的200G(諾維信公司,鮑斯韋,丹麥(Novozymes A/S,Bagsvaerd,Denmark))和每ml包含0.36單位的殼多糖酶(西格瑪化學有限公司(Sigma Chemical Co.)的1.2M山梨醇中在34℃下伴隨著以90rpm的進行的輕輕振蕩來懸浮經洗滌的菌絲體,持續(xù)15-25分鐘,從而產生原生質體。將原生質體通過在400x g下離心7分鐘來收集,并用冷的1.2M山梨醇洗滌兩次。將原生質體使用血球計數器來計數,并再懸浮于STC中至1x108個原生質體/ml的終濃度。

      將大約1-10μg的DNA添加至100μl的原生質體溶液中并且輕輕混合。然后添加PEG緩沖液(250μl),并且混合轉化反應,并且在34℃下孵育30分鐘。然后添加STC(3ml)到該轉化反應并且混合。然后將轉化反應物散布到COVE平板上用于amdS選擇。將這些平板在28℃下孵育6-11天。

      對于需要潮霉素選擇的轉化,在STC中的反應混合物散布到補充有1M的蔗糖的PDA平板上。在28℃下孵育16小時后,將20ml的、每ml補充有35μg的潮霉素B的覆層PDA培養(yǎng)基添加至各平板。將這些平板在28℃下孵育4-7天。

      實例11:來自里氏木霉菌株的基因組DNA提取

      使這些里氏木霉菌株在補充有在250ml帶擋板的搖瓶中的2%葡萄糖(w/v)的50ml的YP培養(yǎng)基中在28℃下伴隨著以200rpm的攪拌生長2天。使用漏斗襯里的(EMD化學品公司(EMD Chemicals Inc.))收集來自各培養(yǎng)的菌絲體,擠壓干燥,并在液氮下冷凍。將冷凍的菌絲體轉移到預冷的研缽和研杵。每個菌絲制劑磨成細粉,并且用液氮保持冷凍。將總共1-2克的粉末轉移到50ml管中,并且使用植物Maxi試劑盒(凱杰公司)從研磨菌絲粉末中提取基因組DNA。將預熱至65℃的五ml的緩沖液AP1(凱杰公司)添加到50ml管中,隨后添加10μl的RNA酶A 100mg/ml原液(凱杰公司),并且在65℃孵育2-3小時。添加共1.8ml AP2緩沖液(凱杰公司),并將管在冰上孵育5分鐘,隨后用LEGENDTMRT吊桶式離心機(賽默飛世爾科技公司(Thermo Fisher Scientific Inc.))在3000-5000X g離心5分鐘。將上清液轉移到置于50毫升收集管中的QIAShredderTM大核酸純化柱(凱杰公司),并且在室溫下(15℃-25℃)在3000-5000x g下甩平式轉子中離心5分鐘。在收集管中的流過液體被轉移到新50ml管中,同時不干擾沉淀。1.5mL體積的緩沖液AP3/E(凱杰公司)添加到澄清的裂解液中,并且通過渦旋振蕩立即混合。包括可能已經形成的任何沉淀的樣品(最多15毫升),吸移到置于50毫升收集管中的大核酸純化柱(凱杰公司)中,并且在室溫下(15℃-25℃)在3000-5000x g下甩平式轉子中離心5分鐘。棄去流過液體。十二ml的緩沖液AW(凱杰公司)添加至大核酸純化柱,并在3000-5000x g離心10分鐘,以干燥該膜。棄去流過液體和收集管。大核酸純化柱轉移到新50ml管中。通過添加預熱至65℃的1-1.5ml的試劑盒提供的緩沖液AE直接洗脫DNA到大核酸純化柱膜上,在室溫下(15℃-25℃)孵育5分鐘,并且然后在3000-5000X g離心5分鐘?;蚪MDNA的濃度和純度通過在260nm和280nm測量吸光度確定。

      實例12:轉化體的Southern印跡分析

      用選擇的一種或多種限制性內切酶消化來自每個轉化體的兩μg的基因組DNA。這些消化提交至在TAE緩沖液中的0.7%-0.8%瓊脂糖凝膠電泳,并且使用(GE醫(yī)療集團生命科學部(GE Healthcare Life Sciences))印跡至 N+印跡膜(GE醫(yī)療集團生命科學部(GE Healthcare Life Sciences))或超負荷膜(施萊歇&許爾生物科技公司(Schleicher&Schuell BioScience))持續(xù)大約1-2小時。該膜與地高辛標記基因特異性或位點特異性探針雜交,這些探針是通過使用PCR DIG探針合成試劑盒(羅氏應用科學公司)的PCR合成。

      將該探頭煮沸持續(xù)5分鐘,在冰上冷卻持續(xù)2分鐘,并添加至10ml的DIG Easy Hyb中以產生該雜交溶液。雜交在DIG Easy Hyb緩沖液中在42℃下進行15-17小時。然后將該膜用2X SSC加上0.1%SDS在室溫下洗滌5分鐘,隨后在65℃下用0.5X SSC加上0.1%SDS洗滌兩次,每次15分鐘。在1X封閉液(羅氏應用科學公司)洗滌至少一小時,洗滌一次后,將膜用50ml包含3.75U的抗洋地黃毒苷-AP Fab片段(羅氏應用科學公司)的封閉液孵育10分鐘,隨后在1X洗滌液(羅氏應用科學公司)中洗滌兩次。即用試劑(二鈉2-氯-5-(4-甲氧基螺(1,2-二氧雜環(huán)丁烷-3,2’-(5’-氯)三環(huán)[3.3.1.13,7]癸烷}-4-基)-1-苯基磷酸酯;羅氏應用科學公司)然后被施加至膜,并且通過放射自顯影方法檢測探針-靶雜交體。

      實例13:FLP/FRT整合質粒pJfyS148B的構建

      FRT-F3位點首先使用 II XL定點誘變試劑盒(安捷倫科技),用以下所示的誘變插入引物被插入到質粒pSMai155(WO 05/074647)中。

      正向引物:

      5'-

      CGAATTCTGCATTGAAGTTCCTATTCCGAGTTCCTATTCTTCAAATAGTATAGGAACTTCAGATATCCATCACACTGGCG-3'(SEQ ID NO:41)

      反向引物:

      5'-

      GCCAGTGTGATGGATATCTGAAGTTCCTATACTATTTGAAGAATAGGAACTCGGAATAGGAACTTCAATGCAGAATTCGC-3’(SEQ ID NO:42)

      誘變PCR包含10ng的pSMai155、200μM dNTP、125ng的每個引物、1X反應緩沖液(安捷倫科技)、3μl的試劑(安捷倫科技)以及2.5單位的Pfu超高保真DNA聚合酶(安捷倫科技),最終體積為50μl。PCR在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)1分鐘;18個循環(huán),每個循環(huán)在95℃下持續(xù)50秒,在60℃下持續(xù)50秒,以及在68℃下持續(xù)40秒;以及1個循環(huán),在68℃下持續(xù)7分鐘。添加一μl的試劑盒提供的Dpn I,并且在37℃下孵育1小時。兩μl的Dpn I處理后的反應添加至14ml管中45μl的試劑盒提供的XL10-Gold超活性大腸桿菌細胞(安捷倫科技),并且在冰上孵育30分鐘。將該管在42℃下孵育30秒,此后添加0.5ml的SOC培養(yǎng)基。然后在37℃下伴隨200rpm攪拌,將該管孵育1小時,此后將250μl各自涂板至2X 150mm 2XYT+氨芐西林平板上并在37℃孵育過夜。將大腸桿菌轉化體接種到在14ml管中的3ml的LB+Amp培養(yǎng)基中,并且在37℃下孵育過夜,伴隨在200rpm的攪拌。使用9600(凱杰公司)分離質粒DNA。插入通過DNA測序來確認。一個轉化體被鑒定為包含對應于FRT-F3位點的希望的序列插入,并且該質粒指定為pJfyS148A。

      然后將FRT-F序列使用優(yōu)越PCR克隆試劑盒(克羅泰克實驗有限公司(Clontech Laboratories,Inc.))插入到質粒pJfyS148A中。FRT-F位點首先使用以下所示的引物,通過PCR,從質粒pRika147(WO2012/120093)擴增。

      正向引物:

      5'-

      ATATCCATCACACTGGCGGCCGCTCAACTCTCTCCTCTAGGTTGAAGTTCCTATTCCGAGTTC-3’(SEQ ID NO:43)

      反向引物:

      5'-

      AGGATGCATGCTCGAGCATGCACTAGCTAGTTGAAGTTCCTATAC-3’

      (SEQ ID NO:44)

      該PCR由以下各項構成:20ng的pRika147、200μM dNTP、0.4μM引物、1X反應緩沖液(賽默飛世爾科技公司)、以及2單位的高保真DNA聚合酶(賽默飛世爾科技公司),最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)2分鐘;30個循環(huán),每個循環(huán)在95℃下持續(xù)25秒,在50℃下持續(xù)25秒,以及在72℃下持續(xù)40秒;以及1個循環(huán),在72℃下持續(xù)7分鐘。將完成的PCR提交至在TAE緩沖液中的2%瓊脂糖凝膠電泳,其中從凝膠切離0.1kb片段,并且使用凝膠提取試劑盒(凱杰公司)提取瓊脂糖。簡言之,將3體積的試劑盒-提供的緩沖液QG添加至該凝膠切片并在50℃下溶解持續(xù)大約10分鐘。通過轉移到該柱并且在13,000rpm下離心持續(xù)1分鐘,將溶解的凝膠切片施用于試劑盒-提供的旋轉柱。將該柱用750μl的試劑盒-提供的緩沖液PE洗滌并再次離心。用10μl的試劑盒-提供的緩沖液EB洗脫DNA。

      將0.1kb PCR產物使用優(yōu)越PCR克隆試劑盒插入到Sal I-消化的pJfyS148A中。該反應由以下各項構成:在10μl反應體積中1X反應緩沖液、125ng的pJfyS147A、20ng的FRT-F PCR產物、和1μl的酶。將該反應在50℃下孵育15分鐘。然后通過添加至包含這些感受態(tài)細胞的單次使用管中并且將這些細胞在冰上孵育5分鐘,添加40μl的Te至該反應,并且2μl被轉化到ONE TOP10大腸桿菌化學感受態(tài)細胞(英杰公司)。將該試管在42℃下培養(yǎng),持續(xù)30秒之后,添加250μl的SOC培養(yǎng)基。然后在37℃下伴隨200rpm攪拌,將該管孵育1小時,并且將250μl轉移到150mm 2XYT+氨芐西林平板上并且在37℃孵育過夜。將大腸桿菌轉化體接種到在14ml管中的3ml的LB+Amp培養(yǎng)基中,并且在37℃下孵育過夜,伴隨在200rpm的攪拌。使用9600(凱杰公司)分離來自大腸桿菌轉化體的質粒DNA。插入通過DNA測序來確認。一個轉化體被鑒定為包含沒有PCR錯誤的插入,并且該質粒指定為pJfyS148B。

      實例14:質粒pJfyS156的構建

      構建質粒pJfyS156,cbh2基因啟動子和翻轉酶基因使用以下所示基因特異性引物進行PCR擴增,并且插入到質粒pJfyS148B中。

      翻轉酶

      正向引物:

      5'-CACCCTCTGTGTATTGCACCATGCCCCAGTTCGATATCCTCTGCA-3'(SEQ ID NO:45)

      反向引物:

      5'-AAACTCTAGGATGCATGCAAGTGAGGCTATTGCCTATCAGCTC-3'(SEQ ID NO:46)

      cbh2基因啟動子

      正向引物:

      5'-CATCACACTGGCGGCCGCGAATTCTAGGCTAGGTATGC-3'(SEQ ID NO:47)

      反向引物:

      5'-GGTGCAATACACAGAGGGTG-3'(SEQ ID NO:48)

      該PCR由以下各項構成:對于翻轉酶PCR,20ng的模板pRiKa147,或對于cbh2啟動子PCR,150ng的里氏木霉981-O-8基因組DNA、200μM dNTPs、0.4μM引物、1X反應緩沖液、和2單位的高保真DNA聚合酶,最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)2分鐘;30個循環(huán),每個循環(huán)在95℃下持續(xù)30秒,在57℃下持續(xù)30秒,以及在72℃下持續(xù)2分鐘;以及1個循環(huán),在72℃下持續(xù)7分鐘。完成的PCR被提交至在TAE緩沖液中的1%瓊脂糖凝膠電泳,其中從凝膠切離1.2和0.6kb帶,分別對應于釀酒酵母翻轉酶基因的編碼區(qū)和NIAD終止子以及cbh2基因啟動子,并且使用提取II試劑盒(Macherey-Nagel有限公司,美國賓夕法尼亞州伯利恒(Bethlehem,PA,USA))提取瓊脂糖。將三體積的試劑盒提供的NT緩沖液添加至該凝膠切片上,并將該樣品在50℃下加熱10分鐘。將全部溶液轉移到試劑盒提供的離心柱。將該柱在13,000rpm下離心持續(xù)1分鐘并且用試劑盒-提供的洗滌緩沖液NT3進行洗滌并再離心。將DNA用30μl的試劑盒-提供的洗脫NE緩沖液進行洗脫并且在13,000rpm下離心持續(xù)1分鐘。

      cbh2基因啟動子和翻轉酶編碼序列使用優(yōu)越PCR克隆試劑盒以單一步驟被插入到Xho I位線性化pJfyS148B中。該反應物由以下構成:在10μl反應體積中1X反應緩沖液、180ng的Xho I-位線性化pJfyS148B、100ng 0.6kb的cbh2啟動子PCR產物、240ng的1.2kb的翻轉酶PCR產物、和1μl酶。該反應在37℃下孵育15分鐘,并且接著在50℃下持續(xù)15分鐘。根據實例14,然后添加40μl的TE至該反應,并且2μl被轉化到ONE TOP10大腸桿菌化學感受態(tài)細胞中。將大腸桿菌轉化體接種到在14ml管中的3ml的LB+Amp培養(yǎng)基中,并且在37℃下孵育過夜,伴隨在200rpm的攪拌。使用9600分離質粒DNA。插入通過DNA測序來確認。一個轉化體被鑒定為包含沒有PCR錯誤的插入,并且該質粒指定為pJfyS155。

      使用以下所示的引物,通過PCR,從pEJG107(WO 05/047499)擴增煙曲霉β-葡糖苷酶基因。

      正向引物:

      5'-ACCGCGGACTGCGCACCATGAGATTCGGTTGGCTCGAGG-3'(SEQ ID NO:49)

      反向引物:

      5'-TTCGCCACGGAGCTTACTAGTAGACACGGGGCAGAGGC-3'(SEQ ID NO:50)

      該PCR由以下各項構成:20ng的pEJG107、200μM dNTP、0.4μM引物、1X反應緩沖液、以及2單位的高保真DNA聚合酶,最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)2分鐘;25個循環(huán),每個循環(huán)在95℃下持續(xù)30秒,在57℃下持續(xù)30秒,以及在72℃下持續(xù)2分鐘;以及1個循環(huán),在72℃下持續(xù)7分鐘。將完成的PCR提交至在TAE緩沖液中的1%瓊脂糖電泳,其中從凝膠切離3kb帶并且使用凝膠提取試劑盒提取瓊脂糖(實例13)。

      將煙曲霉β-葡糖苷酶PCR產物使用優(yōu)越PCR克隆試劑盒被插入到Nco I/Pac I消化的pJfyS155中。該反應由以下各項構成:在10μl反應體積中150ng的Nco I/Pac I消化pJfyS155、100ng的煙曲霉β-葡萄糖苷酶PCR產物、1X優(yōu)越緩沖液、和1μl的酶。該反應在37℃下孵育15分鐘,并且接著在50℃下持續(xù)15分鐘。根據實例13,然后添加40μl的TE至該反應,并且2μl被轉化到ONE TOP10大腸桿菌化學感受態(tài)細胞中。使用9600分離來自大腸桿菌轉化體的質粒DNA。插入通過DNA測序來確認。一個轉化體被鑒定為包含沒有PCR錯誤的插入,并且該質粒指定為pJfyS156(圖9)。

      實例15:質粒pDM313的構建

      包含hpt標記的一部分、FRT-F3位點和里氏木霉gpdA啟動子的一部分的0.38kb PCR片段使用以下所示的引物從pJfyS156擴增。

      正向引物:

      5’-CGTGTTTCTTCCCATTCGCATGCGACCTCGTGGTCATTGAC-3’(SEQ ID NO:51)

      反向引物:

      5’-

      GCTTTGACGTTACATTGACGTACTTATAAGCGGCCGCCAGTGTGATGGA-3’(SEQ ID NO:52)

      該PCR由以下構成:50皮摩爾的各引物、100ng的pJfyS156的DNA、1X的PHUSIONTM高保真熱啟動DNA聚合酶緩沖液(賽默飛世爾科技公司)、1μl的10mM dNTPs的共混物,和1個單位的PHUSIONTM高保真熱啟動DNA聚合酶(賽默飛世爾科技公司),最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在98℃下持續(xù)2分鐘;34個循環(huán),每個循環(huán)在98℃下持續(xù)15秒,在59℃下持續(xù)30秒,以及在72℃下持續(xù)1分鐘;以及1個循環(huán),在72℃下持續(xù)10分鐘。

      包含里氏木霉gpdA啟動子的1.0kbPCR片段使用以下所示的引物,從里氏木霉RutC30基因組DNA擴增。

      正向引物:

      5’-

      TCCATCACACTGGCGGCCGCTTATAAGTACGTCAATGTAACGTCAAAGC-3’(SEQ ID NO:53)

      反向引物:

      5’-

      TGCAGAGGATATCGAACTGGGGCATTTTGTATCTGCGAATTGAGCTTG-3’(SEQ ID NO:54)

      該PCR由以下構成:50皮摩爾的各引物、100ng的里氏木霉RutC30基因組DNA、1X的PHUSIONTM高保真熱啟動DNA聚合酶緩沖液、1μl的10mM dNTPs的共混物,和1個單位的PHUSIONTM高保真熱啟動DNA聚合酶,最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在98℃下持續(xù)2分鐘;34個循環(huán),每個循環(huán)在98℃下持續(xù)15秒,在59℃下持續(xù)30秒,以及在72℃下持續(xù)1分鐘;以及1個循環(huán),在72℃下持續(xù)10分鐘。

      包含釀酒酵母翻轉酶基因的編碼區(qū)和niaD終止子的1.8kb PCR片段使用以下所示的引物從質粒pJfyS156擴增。

      正向引物:

      5’-

      CAAGCTCAATTCGCAGATACAAAATGCCCCAGTTCGATATCCTCTGCA-3’(SEQ ID NO:55)

      反向引物:

      5’-GCTGTTTAAACTCTAGGATGCATGCAAGTGAGGCTATTGCC-3’(SEQ ID NO:56)

      該PCR由以下構成:50皮摩爾的各引物、100ng的pJfyS156 DNA、1X的PHUSIONTM高保真熱啟動DNA聚合酶緩沖液、1μl的10mM dNTPs的共混物,和1個單位的PHUSIONTM高保真熱啟動DNA聚合酶,最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在98℃下持續(xù)2分鐘;34個循環(huán),每個循環(huán)在98℃下持續(xù)15秒,在59℃下持續(xù)30秒,以及在72℃下持續(xù)1分鐘;以及1個循環(huán),在72℃下持續(xù)10分鐘。

      上述三個完成的PCR通過在TAE緩沖液中的0.8%瓊脂糖凝膠電泳進行分析,其中0.38kb,1.0kb,和1.8kb的片段被確認。在原始反應中的PCR片段被用作如下描述的SOE PCR的模板。

      0.38kb和1.0kb PCR片段使用如下所示的引物,通過SOE PCR被連接。

      正向引物:

      5’-CGTGTTTCTTCCCATTCGCATGCGACCTCGTGGTCATTGAC-3’(SEQ ID NO:57)

      反向引物:

      5’-

      TGCAGAGGATATCGAACTGGGGCATTTTGTATCTGCGAATTGAGCTTG-3’(SEQ ID NO:58)

      該PCR由以下構成:50皮摩爾的各引物、0.3μl的0.38kb片段PCR、0.6μl的1.0kb片段PCR、1X的PHUSIONTM高保真熱啟動DNA聚合酶緩沖液、1μl的10mM dNTPs的共混物,和1個單位的PHUSIONTM高保真熱啟動DNA聚合酶,最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在98℃下持續(xù)2分鐘;34個循環(huán),每個循環(huán)在98℃下持續(xù)15秒,60℃下持續(xù)30秒,以及在72℃下持續(xù)1.5分鐘;以及1個循環(huán),在72℃下持續(xù)10分鐘。進行五個SOE PCR并且合并反應。1.36kb SOE PCR片段和包含翻轉酶編碼序列和niaD終止子的1.8kb PCR片段通過在TAE緩沖液中的0.8%瓊脂糖凝膠電泳被分離,其中從凝膠切離1.36kb片段和1.8kb片段,并且使用的提取II試劑盒提取(實例14)。

      十七μg的pJfyS156DNA用SphI消化并且通過在TAE緩沖液中的0.8%瓊脂糖凝膠電泳被純化,其中從凝膠切離大約8.7kb片段,并且使用的提取II試劑盒提取(實例14)。

      1.36 kb SOE PCR片段和包含翻轉酶編碼序列和niaD終止子的1.8 kb PCR片段,使用 HD克隆試劑盒被插入SPH I消化的pJfyS156中。該反應由以下各項構成:在10μl反應體積中116ng的Sph I消化的pJfyS156、57ng的1.36 kb SOE PCR片段、69ng的1.8kb PCR片段、和2μl的具有酶的緩沖液。將該反應在50℃下孵育15分鐘并且然后在冰上冷卻。添加TE的40μl等分試樣。根據實例13,兩μl的反應轉化到ONE TOP10大腸桿菌化學感受態(tài)細胞中。使用9600,將質粒DNA從轉化體中分離。通過用Nsi I的限制性內切酶消化篩選轉化體,這產生2.1kb,2.6kb,和7kb片段。一個克隆的DNA測序證實構建體包含沒有PCR錯誤的正確插入。該構建體指定為pDM313。

      實例16:質粒pQM43的構建

      通過FRT-F位點,構建質粒pQM43,用于將在其5’側翼是FRT-F位點的非功能amdS片段(指定為“非功能amdS片段3”)靶向至里氏木霉cbh1基因座。在該構建體中,F(xiàn)RT-F位點(49bp)添加至如以下描述的大約1kb非功能amdS片段的第一內含子內。包含里氏木霉cbh1 5’側翼區(qū)和FRT-F片段的大約400bp片段使用如下所示的引物1208187和1208194從里氏木霉RutC30基因組DNA擴增。使用如下所示的引物1208195和1208196,從pAllo1(WO 04/111228)擴增側翼是FRT-F位點的非功能amdS片段3。

      引物1208187:

      5’-GATTGAGTTGAAACTGCCTAAGATCTCG-3’(SEQ ID NO:59)

      引物1208194:

      5’-

      CTATACTTTCTAGAGAATAGGAACTCGGAATAGGAACTTCAAGGTGCGCAGTCCGCGGTTGAC-3’(SEQ ID NO:60)

      引物1208195:

      5’-

      CTATTCCGAGTTCCTATTCTCTAGAAAGTATAGGAACTTCGGCGTTGTTACATCTCCCTGAG-3’(SEQ ID NO:61)

      引物1208196:

      5’-GCGTCAGGCTTTCGCCACGTCTACGCCAGGACCGAGCAAG-3’(SEQ ID NO:62)

      第一PCR由以下各項構成:100ng的里氏木霉RutC30基因組DNA、1μl的10mM的dNTPs、1μM引物、1X的高保真反應緩沖液(賽默飛世爾科技公司)、和1單位的熱啟動高保真DNA聚合酶(賽默飛世爾科技公司),最終體積為50μl。第二PCR由以下各項構成:100ng的pAllo1、1μl的10mM的dNTPs、1μM的引物、1X的高保真反應緩沖液,和1單位的熱啟動高保真DNA聚合酶,最終體積為50μl。兩個反應均在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)2分鐘;35個循環(huán),每個循環(huán)在95℃下持續(xù)15秒,在60℃下持續(xù)30秒,以及在72℃下持續(xù)1分15秒;以及1個循環(huán),在72℃下持續(xù)10分鐘。PCR產物通過在TAE緩沖液中的0.7%瓊脂糖凝膠電泳被分離,其中從凝膠切離大約400kb和1kb片段,并且使用提取II試劑盒提取(實例14)。

      第三PCR由以下各項構成:100ng的400bp和1kb純化的PCR產物,1μl的10mM的dNTPs、1X的高保真反應緩沖液,和1單位的熱啟動高保真DNA聚合酶,最終體積為48μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)2分鐘;和5個循環(huán),每個循環(huán)在95℃下持續(xù)15秒,在60℃下持續(xù)30秒,以及在72℃下持續(xù)2分鐘。然后按1μM的終濃度添加引物1208187和1208196,并且繼續(xù)30個循環(huán),每個循環(huán)在95℃下持續(xù)15秒,在60℃下持續(xù)30秒,以及在72℃下持續(xù)2分鐘;以及1個循環(huán),在72℃下持續(xù)10分鐘。如以上所述,PCR產物通過在TAE緩沖液中的0.7%瓊脂糖凝膠電泳被分離,其中從凝膠切離大約1.4kb的片段,并且使用提取II試劑盒提取。

      將1.4kb PCR產物使用IN-FUSIONTM HD克隆試劑盒(克羅泰克實驗有限公司(Clontech Laboratories,Inc.))插入到大約9.3kb BgIII/Pac I消化的pJfyS139(WO 2013/028927)中。該反應由以下各項構成:在10μl反應體積中1X IN-FUSIONTM HD酶預混物(克羅泰克實驗有限公司(Clontech Laboratories,Inc.))、200ng的BgIII/Pac I消化的pJfyS139、和61ng的1.4kb PCR產物。將該反應在50℃下孵育15分鐘。根據實例13,孵育期后,1μl等分試樣被轉移到ONE TOP10化學感受態(tài)細胞。使用9600,將質粒DNA從轉化體中分離。插入通過DNA測序來確認。一個轉化體被鑒定為包含沒有PCR錯誤的插入,并且該質粒指定為pQM43(圖10)。

      實例17:里氏木霉菌株AgJg115-104-7B1的原生質體產生和轉化,用來缺失里氏木霉42kDa天冬氨酸蛋白酶,從而產生里氏木霉AgJg115-118-1H1

      根據實例10,進行里氏木霉菌株AgJg115-104-7B1的原生質體制備和轉化。

      將九十六μg的轉化質粒pAgJg118(WO 2011/075677)用Pme I消化,并且通過在TAE緩沖液中的1%瓊脂糖凝膠電泳被純化,其中從凝膠切離DNA帶,并且使用凝膠提取試劑盒(凱杰公司)提取。簡言之,將3體積的試劑盒-提供的緩沖液QG添加至該凝膠切片并在50℃下溶解持續(xù)大約10分鐘。將溶解的凝膠切片轉移到旋轉柱,并且在13,000rpm下離心持續(xù)1分鐘。將該柱用750μl的試劑盒-提供的緩沖液PE洗滌并然后重復該離心。用25μl的試劑盒-提供的緩沖液EB洗脫DNA。將大約1μl的所得純化的DNA片段添加至100μl的原生質體溶液,用于如以上描述的潮霉素選擇轉化。將七個轉化體傳代培養(yǎng)到新PDA平板上以產生孢子。

      里氏木霉菌株AgJg115-104-7B1的轉化體通過真菌孢子PCR篩選pAgJg118缺失載體在42kDa的天冬氨酸蛋白酶基因座的存在。將來自每個轉化體的少量孢子懸浮于20μl的稀釋緩沖液(植物直接PCR試劑盒,賽默飛世爾科技公司(Thermo Fisher Scientific))中。將該孢子懸浮液用作PCR中的模板,來篩選天冬氨酸蛋白酶缺失。每個反應由以下各項構成:在20μl反應中0.5μl的孢子懸浮液、50pmol的引物069134(如下所示)、50pmol的引物067947(如下所示)、10μl的2X植物PCR緩沖液(植物直接PCR試劑盒)、以及0.4μl的熱啟動II DNA聚合酶(植物直接PCR試劑盒)。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在98℃下持續(xù)5分鐘;40個循環(huán),每個循環(huán)在98℃下持續(xù)5秒,在58℃下持續(xù)5秒,以及在72℃下持續(xù)2分20秒;1個循環(huán),在72℃下持續(xù)2分鐘;以及10℃保持。引物069134位于5’側翼區(qū)上游并且引物067947位于大腸桿菌潮霉素磷酸轉移酶(hpt)基因編碼區(qū)域的起始部位。如果將缺失載體整合到天冬氨酸蛋白酶基因座,該擴增的PCR片段將長2.4kb。指定為里氏木霉AgJg115-118-1的一個轉化體被鑒定為具有缺失的天冬氨酸蛋白酶基因。

      引物069134(正向):

      5’-CGCAATCTATCGAATAGCAG-3’(SEQ ID NO:63)

      引物067947(反向):

      5’-CTACATCGAAGCTGAAAGCACGAGA-3’(SEQ ID NO:64)

      缺失構建體pAgJg118包含大腸桿菌潮霉素磷酸轉移酶(hpt)基因和側翼是直接重復的單純皰疹病毒胸苷激酶(tk)基因。插入直接重復以促進hpt和tk可選擇的標記的固化并且產生42kDa天冬氨酸蛋白酶的完全缺失。

      將來自里氏木霉AgJg115-118-1的孢子散布到木霉屬基本培養(yǎng)基平板上,這些平板包包含1μM 5-氟-2’-脫氧尿苷(Fd U)并且在28℃下孵育。在PDA板上將九個分離株傳代培養(yǎng)并且在28℃下孵育。以如上所述的相似的方式,然后通過真菌孢子PCR篩選這些分離株以檢查是否不存在hpt和tk標記。該PCR篩選由以下各項構成:在20μl反應中0.5μl的孢子懸浮液、50pmol的引物069134、50pmol的引物1200593、10μl的2X植物PCR緩沖液、以及0.4μl的熱啟動II DNA聚合酶。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在98℃下持續(xù)5分鐘;40個循環(huán),每個循環(huán)在98℃下持續(xù)5秒,在58℃下持續(xù)5秒,以及在72℃下持續(xù)1分45秒;1個循環(huán),在72℃下持續(xù)1分鐘;以及10℃保持。引物069134位于5’側翼區(qū)的上游,并且引物067947位于3’側翼區(qū)的下游。如果該天冬氨酸蛋白酶編碼序列被缺失,并且hpt和tk標記被環(huán)出,那么擴增的PCR片段將長3.6kb。

      里氏木霉AgJg115-118-1分離株的基因組DNA如實例11中所述制備,并且如實例12中所述通過Southern印跡分析來分析,以確認42kDa的天冬氨酸蛋白酶的缺失。如實例12所述,對于Southern印跡分析,用10單位的Nco I在30μl反應體積中消化2μg的每個基因組DNA,并且經受在TAE緩沖液中的0.7%瓊脂糖電泳,并且轉移到超負荷膜。

      將該膜與500bp地高辛標記的里氏木霉C 42kDa天冬氨酸蛋白酶探針雜交,其中使用如下所示的引物通過PCR,通過摻入地高辛-11-dUTP合成該探針。

      引物069860(正義):

      5’-CTTCTATCTTGGGATGCTTCACGATACGTGA-3’(SEQ ID NO:65)

      引物069861(反義):

      5’-CGCGCCCTTGAATATCGGAGAAGGT-3’(SEQ ID NO:66)

      該PCR由以下各項構成:5μl的10X Taq緩沖液(紐英倫生物技術有限公司)、2.5μl的PCR DIG標記的混合物(羅氏應用科學公司)、5ng的pAgJg118、10pmol每種引物、2.5μl的10mM dNTP、5單位的Taq DNA聚合酶(紐英倫生物技術有限公司)、以及36.5μl的水。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)2分鐘;30個循環(huán),每個循環(huán)在95℃下持續(xù)30秒,在56℃下持續(xù)30秒,以及在72℃下持續(xù)40秒;1個循環(huán),在72℃下持續(xù)15分鐘;以及4℃保持。如以上所述,該探針通過在TAE緩沖液中的1%瓊脂糖凝膠電泳被純化,從凝膠切離,并且使用凝膠提取試劑盒提取。

      Southern印跡分析對初級轉化體里氏木霉AgJg115-118-1H1的鑒定為:包含該替換并且缺乏hpt/tk標記。

      實例18:里氏木霉菌株QMJi057的構建,用于將側翼是FRT-F位點的非功能amdS片段3靶向至里氏木霉cbh1基因座

      用1-5μg的Pme I消化的pQM43轉化里氏木霉AgJg115-118-1H1(實例17),用來在cbh1基因座插入在在其5’側翼是FRT-F位點的非功能amdS片段3。獲得二十六個轉化體并且將每一個挑出并且轉移到PDA平板,并且在30℃下孵育7天。轉化體在2ml的CIM中培養(yǎng),并且在30℃下伴隨250rpm攪拌孵育3天并。來自每個培養(yǎng)的上清液經受使用8%-16%TGX無污凝膠(伯樂實驗室有限公司)和PRECISION蛋白未染色標準(伯樂實驗室有限公司)的SDS-PAGE。由于在cbh1基因座pQM43的成功靶向整合有效破壞了cbh1基因,目測分析SDS-PAGE凝膠的CBH1蛋白從蛋白質組的損失。里氏木霉QMJi057-5被鑒定為不產生CBHI蛋白并且被選擇用于基因組DNA提取和Southern印跡分析,以確認在里氏木霉cbh1基因座的包含F(xiàn)RT-F位點的非功能amdS片段3的整合。根據實例11中所述的程序從轉化體中分離基因組DNA。

      基因組DNA用Nhe I消化,用于用地高辛標記的里氏木霉cbh1 3’探針的根據實例12的Southern印跡分析,和使用PCR DIG探針合成試劑盒(羅氏應用科學公司)和如下所示的引物,通過PCR合成該探針。

      引物0610249:

      5’-GAGAACACAGTGAGACCATAGC-3’(SEQ ID NO:67)

      引物0610250:

      5’-TCTCAACCCAATCAGCAACATG-3’(SEQ ID NO:68)

      DIG探針合成PCR由以下各項構成:大約100pg的作為模板的用于制造pQM21(WO 2013/028912)的包含里氏木霉cbh1 3’側翼區(qū)的PCR片段、1μM引物、5μl的PCR DIG合成混合物(羅氏應用科學公司),具有MgCl2的1X PCR緩沖液(羅氏應用科學公司),和0.75μl的酶混合物(羅氏應用科學公司),最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)2分鐘;10個循環(huán),每個循環(huán)在95℃下持續(xù)30秒,在60℃下持續(xù)30秒,以及在72℃下持續(xù)40秒;20個循環(huán),每個循環(huán)在95℃下持續(xù)30秒,在60℃下持續(xù)30秒,以及在72℃下持續(xù)40秒,加上對于每個后續(xù)循環(huán)另外的20秒;以及1個循環(huán),在72℃下持續(xù)7分鐘。PCR產物通過在TAE緩沖液中的1%瓊脂糖凝膠電泳被分離,其中從凝膠切離720bp帶,并且使用提取II試劑盒提取(實例14)。

      轉化體QMJi057-5通過Southern印跡分析確認包含在cbh1基因座的在其5’側翼是FRT-F位點的非功能amdS片段3,這導致了由里氏木霉cbh1 3’探針識別的在大約7.1kb的雜交信號。

      實例19:在菌株QMJi057-5中,在里氏木霉cbh1基因座的位點特異性整合

      包含黑曲霉甘露糖苷酶的編碼序列的大約3Kb DNA片段(DNA序列為SEQ ID NO:69并且氨基酸序列為SEQ ID NO:70)從黑曲霉Bo-1衍生物菌株CKle47用引物0614762和0614763擴增,并且克隆至Nco I和Pac I消化的pMJ09(US 8318458B2;大約7.2kb),生成質粒pQM27(SEQ ID NO:71)。在pQM27中的黑曲霉甘露糖苷酶表達盒隨后是功能amdS標記。

      包含黑曲霉甘露表達盒、非功能amdS片段4和FRT-F位點的大約6.7kbDNA片段從pQM27用引物1201956和1201606擴增。該PCR由以下各項構成:100ng的pQM27、200μM dNTP、0.4μM引物、1X反應緩沖液、以及1單位的高保真DNA聚合酶,最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在98℃下持續(xù)2分鐘;35個循環(huán),每個循環(huán)在98℃下持續(xù)15秒,在60℃下持續(xù)30秒,以及在72℃下持續(xù)3.5分鐘;以及1個循環(huán),在72℃下持續(xù)10分鐘。6.7kb PCR產物通過在TAE中的0.7%瓊脂糖凝膠電泳被分離,從凝膠切離,并且使用提取II試劑盒提取(實例14)。

      純化的6.7kb的PCR產物被用作模板,使用引物1201956和1201957擴增包含F(xiàn)RT-F位點的片段。所得包含F(xiàn)RT-F位點的PCR片段通過TAE中的0.7%瓊脂糖凝膠電泳你分離,并且然后從凝膠切離,并且使用提取II試劑盒提取(實例14)。

      引物1210956:

      5’-

      TGATTACGAATTGTTTAAACGGATCCGAATGTAGGATTGTTATCCG-3’(SEQ ID NO:72)

      引物1201606:

      5’-

      GAAGTTCCTATACTTTCTAGAGAATAGGAACTCGGAATAGGAACTTCAACCTTATGGGACTATCAAGCTGAC-3’(SEQ ID NO:73)

      引物1210957:

      5’-

      GTTACATTGACGTACTTATAAGAAGTTCCTATACTTTCTAGAGAATAGGA-3’(SEQ ID NO:74)

      純化的包含F(xiàn)RT-F位點的PCR片段使用IN-FUSIONTMHD克隆試劑盒插入到XbaⅠ和Psi I消化的pDM313(大約5.4Kb)。該反應由以下各項構成:在15μl反應體積中1X IN-FUSIONTMHD酶預混物、323ng的Xba I/Psi I消化的pDM313,以及200ng的6.7kb包含F(xiàn)RT-F位點的PCR產物。將該反應在50℃下孵育15分鐘。培養(yǎng)期后,通過添加至包含感受態(tài)細胞的管中,并且在冰上孵育細胞30分鐘,2μl等分試樣被轉化到50μl的StellarTM大腸桿菌化學感受態(tài)細胞(克羅泰克實驗有限公司(Clontech Laboratories,Inc.))中。將該試管在42℃下培養(yǎng),持續(xù)45秒之后,添加450μl的SOC培養(yǎng)基。然后在37℃下伴隨250rpm攪拌,將該管孵育1小時。50μl和150μl的體積被轉移到兩個150mm2XYT加氨芐青霉素平板。將這些平板在37℃下孵育過夜。使用9600分離質粒DNA,并且測序。一個轉化體被鑒定為包含沒有PCR錯誤的插入,并且該質粒指定為pQM45(圖11)。

      質粒pQM45被用Pme I消化,并且用來測試在菌株QMJi057-5中里氏木霉cbh1基因座的位點特異性整合。根據實例10,PME I消化的pQM45被轉化到里氏木霉菌株QMJi057-5的原生質體中,并且將轉化反應散布在COVE平板上,并且在30℃下孵育7-10天。所有的轉化生成COVE平板上可見轉化體,這表明插入FRT-F位點至amdS基因的第一內含子允許功能amdS標記的重組和在目標位點的整合。

      根據在實例11中所述的程序從六個轉化體中分離基因組DNA。基因組DN用EcoR I消化,用于用358bp的地高辛標記的里氏木霉cbh15’探針的根據實例12的Southern印跡分析(參見下文),該探針使用PCR DIG探針合成試劑盒,通過PCR,通過地高辛-11-dUTP的摻入合成。

      所有六個轉化體的Southern印跡分析生成在由里氏木霉cbh15’探針識別的在大約4.2kb的雜交信號,表明在cbh1基因座的正確整合。

      里氏木霉CBH15’探針序列:

      5’-TAGGGTCGGCAACGGCAAAAAAGCACGTGGCTCACCGAAAAGCAAGATGTTTGCGATCTAACATCCAGGAACCTGGATACATCCATCATCACGCACGACCACTTTGATCTGCTGTAAACTCGTATTCGCCCTAAACCGAAGTGCGTGGTAAATCTACACGTGGGCCCCTTTCGGTATACTGCGTGTGTCTTCTCTAGGTGCCATTCTTTTCCCTTCCTCTAGTGTTGAATTGTTTGTGTTGGAGTCCGAGCTGTAACTACCTCTGAATCTCTGGAGAATGGTGGACTAACGACTACCGTGCACCTGCATCATGTATATAATAGTGATCCTGAGAAGGGGGGTTTGGAGCAATGTGGG-3’(SEQ ID NO:75)

      實例20:質粒pQM37,pQM38和pQM39(具有在amdS內含子中的FRT-F3位點的功能amdS標記的)的構建

      構建質粒pQM37,pQM38和pQM39,以測試插入FRT-F3片段至amdS基因的3個內含子中的一個后的對amdS功能的影響。如下所示的引物被設計成使用 II XL定點突變試劑盒引入FRT-F3片段至質粒pAllo1中的amdS基因中的3個內含子的每一個中。引物1205503和1205504被用來構建質粒pQM37,其中FRT-F3位點被插入到amdS基因的內含子1中。引物1205505和1205506被用來構建質粒pQM38,其中FRT-F3位點被插入到amdS基因的內含子2中。引物1205507和1205508被用來構建pQM39,其中FRT-F3位點被插入到amdS基因的內含子3中。

      引物1205503:

      5’-

      GGGAGATGTAACAACGCCTTGAAGTTCCTATTCCGAGTTCCTATTCTTCAAATAGTATAGGAACTTCAACCTTATGGGACTATCAAG-3’(SEQ ID NO:76)

      引物1205504:

      5’-

      CTTGATAGTCCCATAAGGTTGAAGTTCCTATACTATTTGAAGAATAGGAACTCGGAATAGGAACTTCAAGGCGTTGTTACATCTCCC-3’(SEQ ID NO:77)

      引物1205505:

      5’-

      GCCCCTAAGTCGTTAGATGTTTGAAGTTCCTATTCCGAGTTCCTATTCTTCAAATAGTATAGGAACTTCACCCTTTTTGTCAGC-3’(SEQ ID NO:78)

      引物1205506:

      5’-

      GCTGACAAAAAGGGTGAAGTTCCTATACTATTTGAAGAATAGGAACTCGGAATAGGAACTTCAAACATCTAACGACTTAGGGGC-3’(SEQ ID NO:79)

      引物1205507:

      5’-

      CTATACCAGGCCTCCACTTGAAGTTCCTATTCCGAGTTCCTATTCTTCAAATAGTATAGGAACTTCATGTCCTCCTTTCTTGC-3’(SEQ ID NO:80)

      引物1205508:

      5’-

      GCAAGAAAGGAGGACATGAAGTTCCTATACTATTTGAAGAATAGGAACTCGGAATAG GAACTTCAAGTGGAGGCCTGGTATAG-3’(SEQ ID NO:81)

      這些PCR由以下各項構成:10ng的pAllo1、1μl的10mM dNTPs、1X反應緩沖液、125ng的每個引物、1μl的試劑、和2.5單位的PfuUltraTM HF DNA聚合酶(安捷倫科技),最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)1分鐘;和18個循環(huán),每個循環(huán)在95℃下持續(xù)50秒,在60℃下持續(xù)50秒,以及在68℃下持續(xù)7分鐘;以及1個循環(huán),在68℃下持續(xù)7分鐘。10個單位的Dpn I被添加到各反應,并且在37℃下孵育一小時。2μl的每個Dpn I處理的反應被轉化到XL10-Gold高效感受態(tài)大腸桿菌細胞中。將轉化反應散布在2XYT加氨芐青霉素平板上。挑出每個轉化約4-6個菌落并在3ml的LB加氨芐青霉素培養(yǎng)基在37℃下,伴隨250rpm攪拌培養(yǎng)15-17小時。使用旋轉迷你制備型試劑盒從每個菌落提取質粒DNA,并且提交用于DNA測序。包含插入到amdS基因的內含子1的FRT-F3位點的一個轉化體被指定為pQM37。包含插入到amdS基因的內含子2的FRT-F3位點的一個轉化體被指定為pQM38。包含插入到amdS基因的內含子3的FRT-F3位點的一個轉化體被指定為pQM39。

      約30-40μg的每個pAllo1,pQM37,pQM38、和pQM39用EcoR I和Pac I消化。消化的DNA使用提取II試劑盒被純化(實施例14)。根據實例10,pAllo1,pQM37,pQM38、和pQM39的純化線性DNA片段各自轉化到里氏木霉RutC30原生質體中。將轉化反應物散布在COVE平板上,并且在28℃下孵育7-10天。所有的轉化生成COVE平板上可見轉化體,表明amdS可以被用作具有插入到三個amdS內含子中任一個的FRT-F3位點的功能選擇標記。

      序列表

      <110> 諾維信公司(Novozymes A/S)

      <120> 多核苷酸文庫的重組酶介導的整合

      <130> NZ 12719-WO-PCT

      <160> 81

      <170> PatentIn版本3.5

      <210> 1

      <211> 16935

      <212> DNA

      <213> 人工序列

      <220>

      <223> 質粒 p002

      <220>

      <221> 尚未歸類的特征

      <222> (11869)..(11869)

      <223> n is a, c, g, or t

      <400> 1

      ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 60

      taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 120

      tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 180

      ttacgccaag ctcgaaatta accctcacta aagggaacaa aagctggagc tccaccgcgg 240

      caacaggcag aatatcttcc gaattcaatc gactgcgcga tgcaagttgg ctagcaacgg 300

      cgtacacctt gggattatgc gctgctcaac cgatggtcag ctatcaaaca aaatttggga 360

      agatcgggct atactgacgg tgacattata gtacggcaag ctgagtgaca tctacggtcg 420

      caagccactg cttctttggg catatgtttt ctttggcgtg ggatgcatta tcaggtagat 480

      actccctttt tcttatacgc tggtttgctg gttcgtgctg acagctgttt ccctagcggt 540

      attggtcgag acatggcgac tgtcatattg gggcgtgcaa tcagcggaat tgggggtgct 600

      ggaacaatgg cgatgggctc tatcattatc acaggtaggc tagcagctta tcaggttgaa 660

      agaactgtca ctgaacatag gcagatattg ttcctcgtcg agatgttgcc cattggcggg 720

      cgtacatcaa tatcgcgatg actctgggtc gtagcgcagg aggcccaatc ggcggatggc 780

      taaccgatac aatcggatgg agatggtatg ctttgcgcct ttgtgaccgc ttctctcact 840

      aaattgtggc caaggtcgtt tattatccaa ggccccttag ccgctgtggc agctctgttg 900

      gtgatatgga agctcaaact cgccaatcca gtcactgaga agagcatccg ccgtgtcgac 960

      tttctcggaa cattcctcct ggccgtcggt attgttacaa tcaccgttat catggaccaa 1020

      gcagggcagt ccttcgcatg ggcatcattg tcaacagcaa tccttgcaac tctcagtcta 1080

      tcagcattcg tcgccttcgt ccttgttgaa ctctacgtag cccctgaacc gattttcgaa 1140

      cttcgcatgt tgcggaagcc gaatgtgacg cccagttacc tgatcggatc gctgcagatc 1200

      accgcccaag ttggaatgat gttctccgtg ccgttatatt ttcaggtgac atcgaaagcc 1260

      tctgccaccg tagctggagg gcatctggtt cctgcagtga tcggaaacac gcttggcggc 1320

      ttaatcgcgg gagcctttat ccgtcgcacc ggccaattca aggtcctctt gatccttgcc 1380

      ggtctcgttg cgtccgtcgc ctatctactc ctcatccttc gctggaacgg tcatactgga 1440

      ttctgggagt ccttgtacat tattcccggt ggtatgggta ctggtttctg ctctgcagct 1500

      gcttttgtca gtatgacggc gtttttgatg ccgcaggaag tggccatggc aacaggaggt 1560

      tacttcctat tattcagctt cgccatgacg gccggtgtca ctgtcactaa cagtctgctg 1620

      gggacggttt tcaagcgcca gatggaacag cacctgacgg gtccaggagc caagaaggtt 1680

      ggtatccccg caccttttct gcgtcactta ctaacgagta tatgaagatc atcgagcgcg 1740

      cgctgtccga caccagctat atcaacggtt tgcagggtca tgtccgggat gtagtggtaa 1800

      aaggatatgt gactggtctc cgctacactt actgtaagtc gtttgaatca tgcatccacc 1860

      gtccacctta ttaacttggt gccagtattt tccctcattc tttcgctcct tggatcggtc 1920

      ctcgcttgga ctgtacgaaa acaccaacta tgaggaacca gcacggcagc tgatagtatc 1980

      cgaaagctgc aaattgcttc atcgaggctg gcattcgata gaagaaagaa ctatagacaa 2040

      ctagtcttac aatatgacaa ttctctttga ttaataaatg aaaataacac ttgtgtcagc 2100

      ctaatagccg agtggcgggc atctctggcg gcctcccgag cagcgtggat ctggaagtgc 2160

      gttgatcatt attccccgaa aatgtagtac ccagtaagtg gtctagcggt ggctatggta 2220

      ggacatctat gcctaagctg gagttctcat tgaacgtgta ccggccgatt gccctaaact 2280

      ctgattgaga gccggaaacc tcatctacct gatgctcagg ggccatccaa tagcttccga 2340

      tagcattaca gacagatgga ctcgtcttgg cccacgggtc tagaacagtc gccggaactg 2400

      cctctatttg aaacggagct gaaccatgat acttaagcgt gccaagcggc gccgtttccc 2460

      actggaacaa ggagcaatag aattctgcag agattcttca ttcaggctat tcagcaattc 2520

      ggtttgtgga gcggatcggg gtccactggg tttagtctgg ggtttttctt tgcccgcatg 2580

      ggctctagca catgcacagc ttgcagttgc tgctacgcta tctgggaaaa cgaatggcta 2640

      ttcaggagtt tataaccaaa agagccggaa acaggctgat tgccctctca cggggagacg 2700

      ttgtacttct gatccagagg ctattaaccg gacactacct ataaaggagg tagcattcct 2760

      ttctgtccgg ctcccagatt ccaacaaccc aactgacagg ggatccacca tgccccagtt 2820

      cgatatcctc tgcaagaccc cccccaaggt cctcgtccgc cagttcgtcg agcgcttcga 2880

      gcgcccctcc ggcgagaaga tcgccctctg cgccgccgag ctcacctacc tctgctggat 2940

      gatcacccat aacggcaccg ccatcaagcg cgccaccttc atgtcctaca acaccatcat 3000

      ctccaactcc ctctccttcg atatcgtcaa caagtccctc cagttcaagt acaagaccca 3060

      gaaggccacc atcctggagg cctccctcaa gaagctcatc cccgcctggg agttcaccat 3120

      catcccctac tacggccaga agcatcagtc cgatatcacc gatatcgtct cctccctcca 3180

      gctccagttc gagtcctccg aggaggccga taagggcaac tcccattcca agaagatgct 3240

      caaggccctc ctctccgagg gcgagtccat ctgggagatc accgagaaga tcctcaactc 3300

      cttcgagtac acctcccgct tcaccaagac caagaccctc taccagttcc tcttcctcgc 3360

      caccttcatc aactgcggcc gcttctccga tatcaagaac gtcgatccca agtccttcaa 3420

      gctcgtccag aacaagtacc tcggcgtcat catccagtgc ctcgtcaccg agaccaagac 3480

      ctccgtctcc cgccatatct acttcttctc cgcccgcggc cgcatcgatc ccctcgtcta 3540

      cctcgatgag ttcctccgca actccgagcc cgtcctcaag cgcgtcaacc gcaccggcaa 3600

      ctcctcctcc aacaagcagg agtaccagct cctcaaggat aacctcgtcc gctcctacaa 3660

      caaggccctc aagaagaacg ccccctactc catcttcgcc atcaagaacg gccccaagtc 3720

      ccatatcggc cgccatctca tgacctcctt cctctccatg aagggcctca ccgagctcac 3780

      caacgtcgtc ggcaactggt ccgataagcg cgcctccgcc gtcgcccgca ccacctacac 3840

      ccatcagatc accgccatcc ccgatcatta cttcgcacta gtctcccgct actacgccta 3900

      cgatcccatc tccaaggaga tgatcgccct caaggatgag accaacccca tcgaggagtg 3960

      gcagcatatc gagcagctca agggctccgc cgagggctcc atccgctacc ccgcctggaa 4020

      cggcatcatc tcccaggagg tcctcgatta cctctcctcc tacatcaacc gccgcatctg 4080

      agtcgagatt atccaaggga atgacttaat gagtatgtaa gacatgggtc ataacggcgt 4140

      tcgaaacata tacagggtta tgtttgggaa tagcacacga ataataacgt taataggtac 4200

      caaagtcctt gatacattag cacggtagaa aaagaataat acaacgagct gggaatattc 4260

      tttaatataa aactccaaga agagctggtg cggtggagct tgttttcgac tctcagtaat 4320

      atttcctcat atccaagcgc gctaggaggt ggtcgaatac acatgtaggc gcttctctgg 4380

      atgcaaaagt cgtgccggac ctgccgaaag actttgaaga tgcgttcacg ccatctaagt 4440

      tgcgtagata attcacaaaa agggatgttt gtttccggaa tgtagcaaag agctgatagg 4500

      caatagcctc actttcgtgg cgcacgccgc tcgttccatc catcctcgac aatggagcaa 4560

      atgtcaaaat cgtaccgaaa atactttgct agcccgttaa attgccgtcg tcagccgtta 4620

      aattaccgat taatcccgat aaatttccga gatctccgtt aaattgccgt tcgcagccgt 4680

      taaattaccg gggacgaccg ataaatttcc gcgatgaatt catggtgttt tgatcatttt 4740

      aaatttttat atggcgggtg gtgggcaact cgcttgcgcg ggcaactcgc ttaccgatta 4800

      cgttagggct gatatttacg taaaaatcgt caagggatgc aagaccaaac cgttaaattt 4860

      ccggagtcaa cagcatccaa gcccaagtcc ttcacggaga aaccccagcg tccacatcac 4920

      gagcgaagga ccacctctag gcatcggacg caccatccaa ttagaagcag caaagcgaaa 4980

      cagcccaaga aaaaggtcgg cccgtcggcc ttttctgcaa cgctgatcac gggcagcgat 5040

      ccaaccaaca ccctccagag tgactagggg cggaaattta tcgggattaa tttccactca 5100

      accacaaatc acagtcgtcc ccggtaattt aacggctgca gacggcaatt taacggcttc 5160

      tgcgaatcgc ttggattccc cgcccctggc cgtagagctt aaagtatgtc ccttgtcgat 5220

      gcgatgtatc acaacatata aatactggca agggatgcca tgcttggagc aacaatctca 5280

      gaacaccaat atcaattcat ctcgagtctg aactcagaca acacaaattc ttcaaaattg 5340

      aggatttagt cttgatcttg aagttcctat tccgagttcc tattctctag aaagtatagg 5400

      aacttcttaa ttaacctagc cgttattact ctaccgcaag gcaacaacca gctcacccct 5460

      gaggcacggg taccatgggt tgagtggtat ggggccatcc agagtcacct gtggcagcat 5520

      gagactgcac tcgaagcagc catcaaccca gccaatattc tgggctttcc atccttagat 5580

      cacatttgag atataaccca tttggtgaga gacacttgtg ccgttatacg tgtctagact 5640

      ggaaacgcaa ccctgaaggg attcttcctt tgagagatgg aagcgtgtca tatctcttcg 5700

      gttctacggc aggttttttt ctgctctttc gtagcatggc atggtcactt cagcgcttat 5760

      ttacagttgc tggtattgat ttcttgtgca aattgctatc tgacacttat taggtcgagc 5820

      tattcctttg ccctcggacg agtgctgggg cgtcggtttc cactatcggc gagtacttct 5880

      acacagccat cggtccagac ggccgcgctt ctgcgggcga tttgtgtacg cccgacagtc 5940

      ccggctccgg atcggacgat tgcgtcgcat cgaccctgcg cccaagctgc atcatcgaaa 6000

      ttgccgtcaa ccaagctctg atagagttgg tcaagaccaa tgcggagcat atacgcccgg 6060

      agccgcggcg atcctgcaag ctccggatgc ctccgctcga agtagcgcgt ctgctgctcc 6120

      atacaagcca accacggcct ccagaagaag atgttggcga cctcgtattg ggaatccccg 6180

      aacatcgcct cgctccagtc aatgaccgct gttatgcggc cattgtccgt caggacattg 6240

      ttggagccga aatccgcgtg cacgaggtgc cggacttcgg ggcagtcctc ggcccaaagc 6300

      atcagctcat cgagagcctg cgcgacggac gcactgacgg tgtcgtccat cacagtttgc 6360

      cagtgataca catggggatc agcaatcgcg catatgaaat cacgccatgt agtgtattga 6420

      ccgattcctt gcggtccgaa tgggccgaac ccgctcgtct ggctaagatc ggccgcagcg 6480

      atcgcatcca tggcctccgc gaccggctgc agaacagcgg gcagttcggt ttcaggcagg 6540

      tcttgcaacg tgacaccctg tgcacggcgg gagatgcaat aggtcaggct ctcgctgaat 6600

      tccccaatgt caagcacttc cggaatcggg agcgcggccg atgcaaagtg ccgataaaca 6660

      taacgatctt tgtagaaacc atcggcgcag ctatttaccc gcaggacata tccacgccct 6720

      cctacatcga agctgaaagc acgagattct tcgccctccg agagctgcat caggtcggag 6780

      acgctgtcga acttttcgat cagaaacttc tcgacagacg tcgcggtgag ttcaggcgac 6840

      attgctgagg tgtaggatcg atccgtttaa actctgtgtt agcttatagt caggatgttg 6900

      gctcgacgag tgtaaactgg gagttggcat gagggttatg taggcttctt tagccccgca 6960

      tccccctcat tctcctcatt gatcccgggg gagcggatgg tgttgataag agactaatta 7020

      tagggtttag ctggtgccta gctggtgatt ggctggcttc gccgaatttt acgggccaag 7080

      ggaagctgca gaaccgcggc actggtaaac ggtaattaag ctatcagccc catgctaacg 7140

      agtttaaatt acgtgtattg ctgataaaca ccaacagagc tttactgaaa gatgggagtc 7200

      acggtgtggc ttccccactg cgattattgc acaagcagcg agggcgaact tgactgtcgt 7260

      cgctgagcag cctgcagtca aacatacata tatatcaacc gcgaagacgt ctggccttgt 7320

      agaacacgac gctccctagc aacacctgcc gtgtcagcct ctacggttgt tacttgcatt 7380

      caggatgctc tccagcgggc gagctattca aaatattcaa agcaggtatc tcgtattgcc 7440

      aggattcagc tgaagcaaca ggtgccaagg aaatctgcgt cggttctcat ctgggcttgc 7500

      tcggtcctgg cgtagactag tgcatgcttg aagttcctat tccgagttcc tattcttcaa 7560

      atagtatagg aacttcaacc atgcctcaat cctgggaaga actggccgct gataagcgcg 7620

      cccgcctcgc aaaaaccatc cctgatgaat ggaaagtcca gacgctgcct gcggaagaca 7680

      gcgttattga tttcccaaag aaatcgggta tcctttcaga ggccgaactg aagatcacag 7740

      aggcctccgc tgcagatctt gtgtccaagc tggcggccgg agagttgacc tcggcggaag 7800

      ttacgctagc attctgtaaa cgggcagtaa tcgcccagca gttagtaggg tcccctctac 7860

      ctctcaggga gatgtaacaa cgccacctta tgggactatc aagctgacgc tggcttctgt 7920

      gcagacaaac tgcgcccacg agttcttccc tgacgccgct ctcgcgcagg caagggaact 7980

      cgatgaatac tacgcaaagc acaagagacc cgttggtcca ctccatggcc tccccatctc 8040

      tctcaaagac cagcttcgag tcaaggtaca ccgttgcccc taagtcgtta gatgtccctt 8100

      tttgtcagct aacatatgcc accagggcta cgaaacatca atgggctaca tctcatggct 8160

      aaacaagtac gacgaagggg actcggttct gacaaccatg ctccgcaaag ccggtgccgt 8220

      cttctacgtc aagacctctg tcccgcagac cctgatggtc tgcgagacag tcaacaacat 8280

      catcgggcgc accgtcaacc cacgcaacaa gaactggtcg tgcggcggca gttctggtgg 8340

      tgagggtgcg atcgttggga ttcgtggtgg cgtcatcggt gtaggaacgg atatcggtgg 8400

      ctcgattcga gtgccggccg cgttcaactt cctgtacggt ctaaggccga gtcatgggcg 8460

      gctgccgtat gcaaagatgg cgaacagcat ggagggtcag gagacggtgc acagcgttgt 8520

      cgggccgatt acgcactctg ttgagggtga gtccttcgcc tcttccttct tttcctgctc 8580

      tataccaggc ctccactgtc ctcctttctt gctttttata ctatatacga gaccggcagt 8640

      cactgatgaa gtatgttaga cctccgcctc ttcaccaaat ccgtcctcgg tcaggagcca 8700

      tggaaatacg actccaaggt catccccatg ccctggcgcc agtccgagtc ggacattatt 8760

      gcctccaaga tcaagaacgg cgggctcaat atcggctact acaacttcga cggcaatgtc 8820

      cttccacacc ctcctatcct gcgcggcgtg gaaaccaccg tcgccgcact cgccaaagcc 8880

      ggtcacaccg tgaccccgtg gacgccatac aagcacgatt tcggccacga tctcatctcc 8940

      catatctacg cggctgacgg cagcgccgac gtaatgcgcg atatcagtgc atccggcgag 9000

      ccggcgattc caaatatcaa agacctactg aacccgaaca tcaaagctgt taacatgaac 9060

      gagctctggg acacgcatct ccagaagtgg aattaccaga tggagtacct tgagaaatgg 9120

      cgggaggctg aagaaaaggc cgggaaggaa ctggacgcca tcatcgcgcc gattacgcct 9180

      accgctgcgg tacggcatga ccagttccgg tactatgggt atgcctctgt gatcaacctg 9240

      ctggatttca cgagcgtggt tgttccggtt acctttgcgg ataagaacat cgataagaag 9300

      aatgagagtt tcaaggcggt tagtgagctt gatgccctcg tgcaggaaga gtatgatccg 9360

      gaggcgtacc atggggcacc ggttgcagtg caggttatcg gacggagact cagtgaagag 9420

      aggacgttgg cgattgcaga ggaagtgggg aagttgctgg gaaatgtggt gactccatag 9480

      gtaagctccg tggcgaaagc ctgacgcacc ggtagattct tggtgagccc gtatcatgac 9540

      ggcggcggga gctacatggc cccgggtgat ttattttttt tgtatctact tctgaccctt 9600

      ttcaaatata cggtcaactc atctttcact ggagatgcgg cctgcttggt attgcgatgt 9660

      tgtcagcttg gcaaattgtg gctttcgaaa acacaaaacg attccttagt agccatgcat 9720

      tttaagataa cggaatagaa gaaagaggaa attaaaaaaa aaaaaaaaac aaacatcccg 9780

      ttcataaccc gtagaatcgc cgctcttcgt gtatcccagt accacggcaa aggtatttca 9840

      tgatcgttca atgttgatat tgttcccgcc agtatggctc cacccccatc tccgcgaatc 9900

      tcctcttctc gaacgcggta gtggcgcgcc aattggtaat gacccatagg gagacaaaca 9960

      gcataatagc aacagtggaa attagtggcg caataattga gaacacagtg agaccatagc 10020

      tggcggcctg gaaagcactg ttggagacca acttgtccgt tgcgaggcca acttgcattg 10080

      tctagagaat gcaatcataa cagaaagtac agccagcgct gtgtcataaa gaagtccagt 10140

      tgggaaacga aagactagaa tcaaactaaa agtaatccgg ccgatatggc ttcacgtgcg 10200

      aagtctcgcc ttgaggggac attgtccttg caggtgattg accattgcgt tcatatggcg 10260

      cgatgtttgg tagtgtgggt gtagccggtg acctcacgga aggactaaag gccacatacc 10320

      cttctgagtg cctcttctct tcgtggtcgg aactctcgaa tgggtttttg acagttgcac 10380

      tcgtttggtt gtggtcattt gaaggtctgc gttcggtctt ctgttcgcgc aggcgagctg 10440

      actgagggat tgaaagctgc atagccatcg ttggcatgcg ttaattcgcc aaagctcagc 10500

      ggcgaaacag gcctgacctc taatccatgc atctgctctg cactcgattg ttcgtggtgt 10560

      ccttgcgaag aaagagaagc cttggactcg gatgactttc tggacgaggt ggtaggatca 10620

      tcatgattgt aatgagactg tagcacatca tgcgaatcat tcgacacacg gtgtctgccc 10680

      aagttgacgt cagcatcggt atgcatttcg gtatggtcct catggttctc agcatgtccc 10740

      tccagagggg actcatttcc agcggaagga ttataagcaa cataattgtc atgtggctgc 10800

      gacctttcgt gagactccga gtttgatctc actgtggact catgggcgat atgcggctca 10860

      tcatgatctt cgaatggaga gaaatggttg aagtcggagg acacgggtga tttagcagca 10920

      gggttgaatg caacatagcc agtctcgcgc tcttcatgtg agctatatga gtcatgtggc 10980

      ctgtcatggt ccagaggctc cggatgctca tggctagatt catcgtgtgc cgaaatcgcg 11040

      tcactagcaa agggcgaggt tgacacattg gctgcaggac tgaacgccac ataaccactc 11100

      tcaggctctt catgtgagtt ataggagctg tgcggcatat catagtcctg aggttcacga 11160

      tgctcatggc tggattcatc gtgtgccgaa atagcgtgac tagcaaaagg cgagggcgaa 11220

      gcattggttg ccggactgaa cgccacatag ccgtccccat tggctgaact gactggtgac 11280

      aacgtcctac ccatggcgtc ggccgggcca gcggcttggt gagagtgaag accattagaa 11340

      gtagctggac tgaacgatcg cagcgggtat tcgttttctt gagctggata aggggctgcg 11400

      ccatgctggc tgaaaggtga gaatgttcgg ggtgctgctc tatcaccagg gaaggcagac 11460

      gctggagtca aagaacgagt gttggatcaa ttgccggact gtatgaacgg aaaggagtgc 11520

      tgattgttta aatggcccgt agccttcgct aggacctcgt gattcgggga ccgttggccc 11580

      atacccagga gctggtgtaa aattggaacg cgacacgggt gtttggttgc gcagaatttg 11640

      cggtgccggc gaggcgtgat caatctggct gtaacctggg cctggggtgt agtttgagac 11700

      aggtgtttgt gttcgtggca tttgtggcgc tggcgacgct ctgtcagtcg gcccatatcc 11760

      aggcgccgaa ggtgtgggcg taaacccttg ccgtgattta attaagaatt ctcctgtagg 11820

      cttgagagtt caaggaagaa acagtgcaat tatctttgcg aacccaggng ctggtgacgg 11880

      aattttcata gtcaagctat cagagtaaag aagaggagca tgtcaaagta caattagaga 11940

      caaatatata gtcgcgtgga gccaagagcg gattcctcag tctcgtaggt ctcttgacga 12000

      ccgttgatct gcttgatctc gtctcccgaa aatgaaaata gactctgcta agctattctt 12060

      ctgcttcgcc ggagcctgaa gggcgtacta gggttgcgag gtccaatgca ttaatgcatt 12120

      gcagatgagc tgtatctgga agaggtaaac ccgaaacgcg ttttattctt gttgacatgg 12180

      agctattaaa tcactagaag gcactctttg ctgcttggac aaatgaacgt atcttatcga 12240

      gatcctgaac accatttgtc tcaactccgg agctgacatc gacaccaacg atcttatatc 12300

      cagattcgtc aagctgtttg atgatttcag taacgttaag tggatcgatc cggatagcgc 12360

      gggttccttc cggtattgtc tccttccgtg tttcagttag cctcccccat ctcccgggca 12420

      aacgtgcgcg ccaggtcgca tatcgtcggt atggagccgg gggtggtgac gtgggtctgg 12480

      accatcccgg aggtaagttg cagcagggcg tcccggcagc cggcgggcga ttggtcgtaa 12540

      tccaggataa agacgtgcat ggaacggagg cgtttggcca agacgtccaa ggcccaggca 12600

      aacacgttat acaggtcgcc gttgggggcc agcaactcgg ggccccgaaa cagggtaaat 12660

      aacgtgtccc cgatatgggg tcgtgggccc gcgttgctct ggggctcggc accctggggc 12720

      ggcacggccg tccccgaaag ctgtccccag tcctcccgcc acgacccgcc gcactgcaga 12780

      taccgcaccg tattggcaag tagcccgtaa acgcggcgaa tcgcagccag catagccagg 12840

      tccagccgct cgccggggcg ctggcgtttg gccaggcggt cgatgtgtct gtcctccgga 12900

      agggccccaa gcacgatgtt ggtgccgggc aaggtcggcg ggatgagggc cacgaacgcc 12960

      agcacggcct ggggggtcat gctgcccata aggtaccgcg cggccgggta gcacaggagg 13020

      gcggcgatgg gatggcggtc gaagatgagg gtgagggccg ggggcggggc atgtgagctc 13080

      ccagcctccc ccccgatatg aggagccaga acggcgtcgg tcacggcata aggcatgccc 13140

      attgttatct gggcgcttgt cattaccacc gccgcgtccc cggccgatat ctcaccctgg 13200

      tcgaggcggt gttgtgtggt gtagatgttc gcgattgtct cggaagcccc cagcacccgc 13260

      cagtaagtca tcggctcggg tacgtagacg atatcgtcgc gcgaacccag ggccaccagc 13320

      agttgcgtgg tggtggtttt ccccatcccg tggggaccgt ctatataaac ccgcagtagc 13380

      gtgggcattt tctgctccgg gcggacttcc gtggcttctt gctgccggcg agggcgcaac 13440

      gccgtacgtc ggttgctatg gccgcgagaa cgcgcagcct ggtcgaacgc agacgcgtgt 13500

      tgatggccgg ggtacgaagc catacgcgct tctacaaggc gctggccgaa gaggtgcggg 13560

      agtttcacgc caccaagatc gatctacagc tggtggggag agcaggaaaa tatggcaaca 13620

      aatgttggac tgacgcaacg accttgtcaa ccccgccgac acaccgggcg gacagacggg 13680

      gcaaagctgc ctaccaggga ctgagggacc tcagcaggtc gagtgcagag caccggatgg 13740

      gtcgactgcc agcttgtgtt cccggtctgc gccgctggcc agctcctgag cggcctttcc 13800

      ggtttcatac accgggcaaa gcaggagagg cacgatattt ggacgcccta cagatgccgg 13860

      atgggccaat tagggagctt acgcgccggg tactcgctct acctacttcg gagaaggtac 13920

      tatctcgtga atcttttacc agatcggaag caattggact tctgtaccta ggttaatggc 13980

      atgctatttc gccgacggct atacacccct ggcttcacat tctccttcgc ttactgccgg 14040

      tgattcgatg aagctccata ttctccgatg atgcaataga ttcttggtca acgaggggca 14100

      caccagcctt tccacttcgg ggcggagggg cggccggtcc cggattaata atcatccact 14160

      gcacctcaga gccgccagag ctgtctggcg cagtggccgt tattactcag cccttctctc 14220

      tgcgtccgtc cgtctctccg catgccagaa agagtcaccg gtcactgtac agagctcaag 14280

      cttcgattaa ctcgaggggg ggcccggtac ccaattcgcc ctatagtgag tcgtattaca 14340

      attcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt acccaactta 14400

      atcgccttgc agcacatccc cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg 14460

      atcgcccttc ccaacagttg cgcagcctga atggcgaatg gaaattgtaa gcgttaatat 14520

      tttgttaaaa ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga 14580

      aatcggcaaa atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc 14640

      agtttggaac aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac 14700

      cgtctatcag ggcgatggcc cactacgtga accatcaccc taatcaagtt ttttggggtc 14760

      gaggtgccgt aaagcactaa atcggaaccc taaagggagc ccccgattta gagcttgacg 14820

      gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag cgggcgctag 14880

      ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc 14940

      gccgctacag ggcgcgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg 15000

      tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat 15060

      gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat 15120

      tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt 15180

      aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag 15240

      cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa 15300

      agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg 15360

      ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct 15420

      tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac 15480

      tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca 15540

      caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat 15600

      accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact 15660

      attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc 15720

      ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga 15780

      taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg 15840

      taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg 15900

      aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca 15960

      agtttactca tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta 16020

      ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca 16080

      ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg 16140

      cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga 16200

      tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa 16260

      tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc 16320

      tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg 16380

      tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac 16440

      ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct 16500

      acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc 16560

      ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg 16620

      gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg 16680

      ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct 16740

      ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga 16800

      taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg 16860

      cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc 16920

      gcgttggccg attca 16935

      <210> 2

      <211> 49

      <212> DNA

      <213> 人工序列

      <220>

      <223> FLP 重組酶識別序列

      <400> 2

      ttgaagttcc tattccgagt tcctattctc tagaaagtat aggaacttc 49

      <210> 3

      <211> 50

      <212> DNA

      <213> 人工序列

      <220>

      <223> FLP 重組酶識別序列

      <400> 3

      ttgaagttcc tattccgagt tcctattctt caaatagtat aggaacttca 50

      <210> 4

      <211> 6055

      <212> DNA

      <213> 人工序列

      <220>

      <223> 載體 pFRT-GIAMG

      <400> 4

      tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

      cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

      ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

      accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

      attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

      tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

      tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cttgaagttc ctattccgag 420

      ttcctattct ctagaaagta taggaacttc ctcgagacca tgtaccgctt ccttgtctgt 480

      gctctcgggc ttctggggac agtcctcgct cagtcagtcg acagttatgt cggcagcgaa 540

      ggccccatag caaaggccgg cgtccttgcc aacattgggc cgaacggctc aaaggcctct 600

      ggtgcagccg ccggcgtggt ggtggctagc cccagcaagt cggatcccga ctattggtac 660

      acttggacgc gtgactcgtc actcgttttc aagtctctca ttgatcagta caccactggt 720

      atcgacagca cgagttcgtt gaggtctctg atagacagtt tcgttattgc cgaggccaac 780

      attcagcagg tctctaatcc cagcggcact cttactaccg gcggcttggg agagccaaaa 840

      ttcaatgtcg atgaaactgc attcaccggt gcatggggtc gaccccagcg cgacggacct 900

      gcgctccgtg cgactgcttt gatcacctac ggtaactggc tcttgtcaaa cgggaacacg 960

      acctgggtta ccagtacgct gtggccgatc atccagaacg atctcaacta cgtcgttcag 1020

      tactggaacc agaccacctt cgacctctgg gaagaagtga actcttcctc gttcttcacc 1080

      actgcagtgc agcaccgtgc cttgcgcgaa ggcgcagcat tcgctaccaa gatcggtcag 1140

      acctcctcgg tcagcagcta cacaacccaa gcggcgaatc tactttgctt tttgcagtct 1200

      tactggaacc ccacttccgg atatatcacc gctaacactg gcggtggtcg gtccggcaag 1260

      gacgccaaca ccctcttggc atccatccac acttacgacc ccagcgcggg ctgcgatgcc 1320

      acgaccttcc agccctgctc cgacaaagcc ctctcgaatc tgaaggttta cgtcgactcc 1380

      ttccgttctg tctactccat caacagcggt attgcctcta acgccgctgt cgccactggt 1440

      cgctacccgg aagacagcta ccagggcggg aacccatggt acctcactac gttcgccgtc 1500

      gccgagcagc tctatgacgc cctcaatgtc tgggctgctc agggctccct caatgtcacc 1560

      tccatctccc tccccttctt ccagcagttc tcctctagtg tcactgccgg cacttacgct 1620

      tcgagctcca ccacttacac gactctgacc tccgccatta agagcttcgc ggatggattc 1680

      gtcgctatca acgcccagta cacgccgtcc aacggtggcc tcgctgagca gttcagcagg 1740

      agcaacggcg ctcccgtcag cgctgttgat ttgacatgga gctatgcatc tgcattgacc 1800

      gcgtttgaag cgaggaataa tactcagttc gccggctggg gcgcggtagg tttgactgtg 1860

      ccgacctcgt gctccagcaa cagtggtgga ggcggaggat cgactgtcgc cgtgacgttc 1920

      aacgtgaacg cccaaacggt ttggggcgaa aacatctaca tcactggctc ggttgacgct 1980

      ctgagtaact ggtctcccga caacgccctc ttgctctcgt ctgccaacta cccgacctgg 2040

      agcattaccg tgaatttacc cgcgagcact gccattcagt ataagtatat ccgcaagaac 2100

      aacggagctg tcacctggga atccgatccc aacaacagca taactactcc agccagcggc 2160

      tccgtgaccg agaatgacac ttggcgttaa ttaattaata ataaataacg gattgtgtcc 2220

      gtaatcacac gtgcccgtgg tgcgtacgat aacgcatagt gtttttccct ccacttaaat 2280

      cgaagggttg tgtcttggat cgcgcgggtc aaatgtatat ggttcatata catccgcagg 2340

      cacgtaataa agcgaggggt tcgaatcccc ccgttacccc cggtaggggc ccagatccgg 2400

      gtgactgaca cctggcggta gacaatcaat ccatttcgct atagttaaag gatggggatg 2460

      agggcaattg gttatatgat catgtatgta gtgggtgtgc ataatagtag tgaaatggaa 2520

      gccaagtcat gtgattgtaa tcgaccgacg gaattgagga tatccggaaa tacagacacc 2580

      gtgaaagcca tggtctttcc ttcgtgtaga agaccagaca gacagtccct gatttaccct 2640

      tgcacaaagc actagaaaat tagcattcca tccttctctg cttgctctgc tgatatcact 2700

      gtcattcaat gcatagccat gagctcatct tagatccaag cacgtaattc catagccgag 2760

      gtccacagtg gagcagcaac attccccatc attgctttcc ccaggggcct cccaacgact 2820

      aaatcaagag tatatctcta ccgtccaata gatcgtcttc gcttcaaaat ctttgacaat 2880

      tccaagaggg tccccatcca tcaaacccag ttcaataata gccgagatgc atggtggagt 2940

      caattaggca gtattgctgg aatgtcgggg ccagttggcc cggtggtcat tggccgcctg 3000

      tgatgccatc tgccactaaa tccgatcatt gatccaccgc ccacgaggcg cgtctttgct 3060

      ttttgcgcgg cgtccaggtt caactctctc cactagtcta gcggggttca aatgcaaaca 3120

      agtacaacac gcagcaaacg aagcagccca ccactgcgtt gatgcccagt ttgactgtcc 3180

      gaaatccacc ggaaaggtgg aaacatacta tgtaacaatc agagggaaga aaaaattttt 3240

      atcgacgagg caggatagtg actgatggtg gggtcatggt cgggtctccg agcgaaagag 3300

      aaccaaggaa acaagatcaa cgaggttggt gtacccaaaa ggccgcagca acaagagtca 3360

      tcgcccaaaa gtcaacagtc tggaagagac tccgccgtgc agattctgcg tcggtcccgc 3420

      acatgcgtgg tgggggcatt acccctccat gtccaatgat aagggcggcg gtcgagggct 3480

      taagcccgcc cactaattcg ccttctcgct tgcccctcca tataaggatt ccccctcctt 3540

      cccctcccac aacttttttc cttctttctc tcttcgtccg catcagtacg tatatctttc 3600

      ccccatacct cctttcctac tcttcttcca ttcattcaac tcttctcctt actgacatct 3660

      gttttgctca gtacctctac gcgatcagcc gtagtatctg agcaagcttc tctacagaat 3720

      ctttctagta tcttacaaag aactacaaag ttcgcaccat tgaagttcct attccgagtt 3780

      cctattcttc aaatagtata ggaacttcag catgcaagct tggcgtaatc atggtcatag 3840

      ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 3900

      ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 3960

      tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 4020

      cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 4080

      ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 4140

      ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 4200

      gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 4260

      gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 4320

      taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 4380

      accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 4440

      tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 4500

      cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 4560

      agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 4620

      gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 4680

      gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 4740

      tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 4800

      acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 4860

      cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 4920

      acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 4980

      acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 5040

      tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 5100

      ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 5160

      ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 5220

      tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 5280

      aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt 5340

      ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 5400

      ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 5460

      gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 5520

      gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 5580

      cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga 5640

      actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 5700

      ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 5760

      tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 5820

      ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 5880

      agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 5940

      aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc 6000

      attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtc 6055

      <210> 5

      <211> 1731

      <212> DNA

      <213> 密粘褶菌

      <400> 5

      atgtaccgct tccttgtctg tgctctcggg cttctgggga cagtcctcgc tcagtcagtc 60

      gacagttatg tcggcagcga aggccccata gcaaaggccg gcgtccttgc caacattggg 120

      ccgaacggct caaaggcctc tggtgcagcc gccggcgtgg tggtggctag ccccagcaag 180

      tcggatcccg actattggta cacttggacg cgtgactcgt cactcgtttt caagtctctc 240

      attgatcagt acaccactgg tatcgacagc acgagttcgt tgaggtctct gatagacagt 300

      ttcgttattg ccgaggccaa cattcagcag gtctctaatc ccagcggcac tcttactacc 360

      ggcggcttgg gagagccaaa attcaatgtc gatgaaactg cattcaccgg tgcatggggt 420

      cgaccccagc gcgacggacc tgcgctccgt gcgactgctt tgatcaccta cggtaactgg 480

      ctcttgtcaa acgggaacac gacctgggtt accagtacgc tgtggccgat catccagaac 540

      gatctcaact acgtcgttca gtactggaac cagaccacct tcgacctctg ggaagaagtg 600

      aactcttcct cgttcttcac cactgcagtg cagcaccgtg ccttgcgcga aggcgcagca 660

      ttcgctacca agatcggtca gacctcctcg gtcagcagct acacaaccca agcggcgaat 720

      ctactttgct ttttgcagtc ttactggaac cccacttccg gatatatcac cgctaacact 780

      ggcggtggtc ggtccggcaa ggacgccaac accctcttgg catccatcca cacttacgac 840

      cccagcgcgg gctgcgatgc cacgaccttc cagccctgct ccgacaaagc cctctcgaat 900

      ctgaaggttt acgtcgactc cttccgttct gtctactcca tcaacagcgg tattgcctct 960

      aacgccgctg tcgccactgg tcgctacccg gaagacagct accagggcgg gaacccatgg 1020

      tacctcacta cgttcgccgt cgccgagcag ctctatgacg ccctcaatgt ctgggctgct 1080

      cagggctccc tcaatgtcac ctccatctcc ctccccttct tccagcagtt ctcctctagt 1140

      gtcactgccg gcacttacgc ttcgagctcc accacttaca cgactctgac ctccgccatt 1200

      aagagcttcg cggatggatt cgtcgctatc aacgcccagt acacgccgtc caacggtggc 1260

      ctcgctgagc agttcagcag gagcaacggc gctcccgtca gcgctgttga tttgacatgg 1320

      agctatgcat ctgcattgac cgcgtttgaa gcgaggaata atactcagtt cgccggctgg 1380

      ggcgcggtag gtttgactgt gccgacctcg tgctccagca acagtggtgg aggcggagga 1440

      tcgactgtcg ccgtgacgtt caacgtgaac gcccaaacgg tttggggcga aaacatctac 1500

      atcactggct cggttgacgc tctgagtaac tggtctcccg acaacgccct cttgctctcg 1560

      tctgccaact acccgacctg gagcattacc gtgaatttac ccgcgagcac tgccattcag 1620

      tataagtata tccgcaagaa caacggagct gtcacctggg aatccgatcc caacaacagc 1680

      ataactactc cagccagcgg ctccgtgacc gagaatgaca cttggcgtta a 1731

      <210> 6

      <211> 576

      <212> PRT

      <213> 密粘褶菌

      <400> 6

      Met Tyr Arg Phe Leu Val Cys Ala Leu Gly Leu Leu Gly Thr Val Leu

      1 5 10 15

      Ala Gln Ser Val Asp Ser Tyr Val Gly Ser Glu Gly Pro Ile Ala Lys

      20 25 30

      Ala Gly Val Leu Ala Asn Ile Gly Pro Asn Gly Ser Lys Ala Ser Gly

      35 40 45

      Ala Ala Ala Gly Val Val Val Ala Ser Pro Ser Lys Ser Asp Pro Asp

      50 55 60

      Tyr Trp Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ser Leu

      65 70 75 80

      Ile Asp Gln Tyr Thr Thr Gly Ile Asp Ser Thr Ser Ser Leu Arg Ser

      85 90 95

      Leu Ile Asp Ser Phe Val Ile Ala Glu Ala Asn Ile Gln Gln Val Ser

      100 105 110

      Asn Pro Ser Gly Thr Leu Thr Thr Gly Gly Leu Gly Glu Pro Lys Phe

      115 120 125

      Asn Val Asp Glu Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg

      130 135 140

      Asp Gly Pro Ala Leu Arg Ala Thr Ala Leu Ile Thr Tyr Gly Asn Trp

      145 150 155 160

      Leu Leu Ser Asn Gly Asn Thr Thr Trp Val Thr Ser Thr Leu Trp Pro

      165 170 175

      Ile Ile Gln Asn Asp Leu Asn Tyr Val Val Gln Tyr Trp Asn Gln Thr

      180 185 190

      Thr Phe Asp Leu Trp Glu Glu Val Asn Ser Ser Ser Phe Phe Thr Thr

      195 200 205

      Ala Val Gln His Arg Ala Leu Arg Glu Gly Ala Ala Phe Ala Thr Lys

      210 215 220

      Ile Gly Gln Thr Ser Ser Val Ser Ser Tyr Thr Thr Gln Ala Ala Asn

      225 230 235 240

      Leu Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Thr Ser Gly Tyr Ile

      245 250 255

      Thr Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Leu

      260 265 270

      Leu Ala Ser Ile His Thr Tyr Asp Pro Ser Ala Gly Cys Asp Ala Thr

      275 280 285

      Thr Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr

      290 295 300

      Val Asp Ser Phe Arg Ser Val Tyr Ser Ile Asn Ser Gly Ile Ala Ser

      305 310 315 320

      Asn Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Gln Gly

      325 330 335

      Gly Asn Pro Trp Tyr Leu Thr Thr Phe Ala Val Ala Glu Gln Leu Tyr

      340 345 350

      Asp Ala Leu Asn Val Trp Ala Ala Gln Gly Ser Leu Asn Val Thr Ser

      355 360 365

      Ile Ser Leu Pro Phe Phe Gln Gln Phe Ser Ser Ser Val Thr Ala Gly

      370 375 380

      Thr Tyr Ala Ser Ser Ser Thr Thr Tyr Thr Thr Leu Thr Ser Ala Ile

      385 390 395 400

      Lys Ser Phe Ala Asp Gly Phe Val Ala Ile Asn Ala Gln Tyr Thr Pro

      405 410 415

      Ser Asn Gly Gly Leu Ala Glu Gln Phe Ser Arg Ser Asn Gly Ala Pro

      420 425 430

      Val Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr Ala

      435 440 445

      Phe Glu Ala Arg Asn Asn Thr Gln Phe Ala Gly Trp Gly Ala Val Gly

      450 455 460

      Leu Thr Val Pro Thr Ser Cys Ser Ser Asn Ser Gly Gly Gly Gly Gly

      465 470 475 480

      Ser Thr Val Ala Val Thr Phe Asn Val Asn Ala Gln Thr Val Trp Gly

      485 490 495

      Glu Asn Ile Tyr Ile Thr Gly Ser Val Asp Ala Leu Ser Asn Trp Ser

      500 505 510

      Pro Asp Asn Ala Leu Leu Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser

      515 520 525

      Ile Thr Val Asn Leu Pro Ala Ser Thr Ala Ile Gln Tyr Lys Tyr Ile

      530 535 540

      Arg Lys Asn Asn Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser

      545 550 555 560

      Ile Thr Thr Pro Ala Ser Gly Ser Val Thr Glu Asn Asp Thr Trp Arg

      565 570 575

      <210> 7

      <211> 16642

      <212> DNA

      <213> 人工序列

      <220>

      <223> 質粒 p007

      <220>

      <221> 尚未歸類的特征

      <222> (11576)..(11576)

      <223> n is a, c, g, or t

      <400> 7

      ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 60

      taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 120

      tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 180

      ttacgccaag ctcgaaatta accctcacta aagggaacaa aagctggagc tccaccgcgg 240

      caacaggcag aatatcttcc gaattcaatc gactgcgcga tgcaagttgg ctagcaacgg 300

      cgtacacctt gggattatgc gctgctcaac cgatggtcag ctatcaaaca aaatttggga 360

      agatcgggct atactgacgg tgacattata gtacggcaag ctgagtgaca tctacggtcg 420

      caagccactg cttctttggg catatgtttt ctttggcgtg ggatgcatta tcaggtagat 480

      actccctttt tcttatacgc tggtttgctg gttcgtgctg acagctgttt ccctagcggt 540

      attggtcgag acatggcgac tgtcatattg gggcgtgcaa tcagcggaat tgggggtgct 600

      ggaacaatgg cgatgggctc tatcattatc acaggtaggc tagcagctta tcaggttgaa 660

      agaactgtca ctgaacatag gcagatattg ttcctcgtcg agatgttgcc cattggcggg 720

      cgtacatcaa tatcgcgatg actctgggtc gtagcgcagg aggcccaatc ggcggatggc 780

      taaccgatac aatcggatgg agatggtatg ctttgcgcct ttgtgaccgc ttctctcact 840

      aaattgtggc caaggtcgtt tattatccaa ggccccttag ccgctgtggc agctctgttg 900

      gtgatatgga agctcaaact cgccaatcca gtcactgaga agagcatccg ccgtgtcgac 960

      tttctcggaa cattcctcct ggccgtcggt attgttacaa tcaccgttat catggaccaa 1020

      gcagggcagt ccttcgcatg ggcatcattg tcaacagcaa tccttgcaac tctcagtcta 1080

      tcagcattcg tcgccttcgt ccttgttgaa ctctacgtag cccctgaacc gattttcgaa 1140

      cttcgcatgt tgcggaagcc gaatgtgacg cccagttacc tgatcggatc gctgcagatc 1200

      accgcccaag ttggaatgat gttctccgtg ccgttatatt ttcaggtgac atcgaaagcc 1260

      tctgccaccg tagctggagg gcatctggtt cctgcagtga tcggaaacac gcttggcggc 1320

      ttaatcgcgg gagcctttat ccgtcgcacc ggccaattca aggtcctctt gatccttgcc 1380

      ggtctcgttg cgtccgtcgc ctatctactc ctcatccttc gctggaacgg tcatactgga 1440

      ttctgggagt ccttgtacat tattcccggt ggtatgggta ctggtttctg ctctgcagct 1500

      gcttttgtca gtatgacggc gtttttgatg ccgcaggaag tggccatggc aacaggaggt 1560

      tacttcctat tattcagctt cgccatgacg gccggtgtca ctgtcactaa cagtctgctg 1620

      gggacggttt tcaagcgcca gatggaacag cacctgacgg gtccaggagc caagaaggtt 1680

      ggtatccccg caccttttct gcgtcactta ctaacgagta tatgaagatc atcgagcgcg 1740

      cgctgtccga caccagctat atcaacggtt tgcagggtca tgtccgggat gtagtggtaa 1800

      aaggatatgt gactggtctc cgctacactt actgtaagtc gtttgaatca tgcatccacc 1860

      gtccacctta ttaacttggt gccagtattt tccctcattc tttcgctcct tggatcggtc 1920

      ctcgcttgga ctgtacgaaa acaccaacta tgaggaacca gcacggcagc tgatagtatc 1980

      cgaaagctgc aaattgcttc atcgaggctg gcattcgata gaagaaagaa ctatagacaa 2040

      ctagtcttac aatatgacaa ttctctttga ttaataaatg aaaataacac ttgtgtcagc 2100

      ctaatagccg agtggcgggc atctctggcg gcctcccgag cagcgtggat ctggaagtgc 2160

      gttgatcatt attccccgaa aatgtagtac ccagtaagtg gtctagcggt ggctatggta 2220

      ggacatctat gcctaagctg gagttctcat tgaacgtgta ccggccgatt gccctaaact 2280

      ctgattgaga gccggaaacc tcatctacct gatgctcagg ggccatccaa tagcttccga 2340

      tagcattaca gacagatgga ctcgtcttgg cccacgggtc tagaacagtc gccggaactg 2400

      cctctatttg aaacggagct gaaccatgat acttaagcgt gccaagcggc gccgtttccc 2460

      actggaacaa ggagcaatag aattctgcag agattcttca ttcaggctat tcagcaattc 2520

      ggtttgtgga gcggatcggg gtccactggg tttagtctgg ggtttttctt tgcccgcatg 2580

      ggctctagca catgcacagc ttgcagttgc tgctacgcta tctgggaaaa cgaatggcta 2640

      ttcaggagtt tataaccaaa agagccggaa acaggctgat tgccctctca cggggagacg 2700

      ttgtacttct gatccagagg ctattaaccg gacactacct ataaaggagg tagcattcct 2760

      ttctgtccgg ctcccagatt ccaacaaccc aactgacagg ggatccacca tgccccagtt 2820

      cgatatcctc tgcaagaccc cccccaaggt cctcgtccgc cagttcgtcg agcgcttcga 2880

      gcgcccctcc ggcgagaaga tcgccctctg cgccgccgag ctcacctacc tctgctggat 2940

      gatcacccat aacggcaccg ccatcaagcg cgccaccttc atgtcctaca acaccatcat 3000

      ctccaactcc ctctccttcg atatcgtcaa caagtccctc cagttcaagt acaagaccca 3060

      gaaggccacc atcctggagg cctccctcaa gaagctcatc cccgcctggg agttcaccat 3120

      catcccctac tacggccaga agcatcagtc cgatatcacc gatatcgtct cctccctcca 3180

      gctccagttc gagtcctccg aggaggccga taagggcaac tcccattcca agaagatgct 3240

      caaggccctc ctctccgagg gcgagtccat ctgggagatc accgagaaga tcctcaactc 3300

      cttcgagtac acctcccgct tcaccaagac caagaccctc taccagttcc tcttcctcgc 3360

      caccttcatc aactgcggcc gcttctccga tatcaagaac gtcgatccca agtccttcaa 3420

      gctcgtccag aacaagtacc tcggcgtcat catccagtgc ctcgtcaccg agaccaagac 3480

      ctccgtctcc cgccatatct acttcttctc cgcccgcggc cgcatcgatc ccctcgtcta 3540

      cctcgatgag ttcctccgca actccgagcc cgtcctcaag cgcgtcaacc gcaccggcaa 3600

      ctcctcctcc aacaagcagg agtaccagct cctcaaggat aacctcgtcc gctcctacaa 3660

      caaggccctc aagaagaacg ccccctactc catcttcgcc atcaagaacg gccccaagtc 3720

      ccatatcggc cgccatctca tgacctcctt cctctccatg aagggcctca ccgagctcac 3780

      caacgtcgtc ggcaactggt ccgataagcg cgcctccgcc gtcgcccgca ccacctacac 3840

      ccatcagatc accgccatcc ccgatcatta cttcgcacta gtctcccgct actacgccta 3900

      cgatcccatc tccaaggaga tgatcgccct caaggatgag accaacccca tcgaggagtg 3960

      gcagcatatc gagcagctca agggctccgc cgagggctcc atccgctacc ccgcctggaa 4020

      cggcatcatc tcccaggagg tcctcgatta cctctcctcc tacatcaacc gccgcatctg 4080

      agtcgagatt atccaaggga atgacttaat gagtatgtaa gacatgggtc ataacggcgt 4140

      tcgaaacata tacagggtta tgtttgggaa tagcacacga ataataacgt taataggtac 4200

      caaagtcctt gatacattag cacggtagaa aaagaataat acaacgagct gggaatattc 4260

      tttaatataa aactccaaga agagctggtg cggtggagct tgttttcgac tctcagtaat 4320

      atttcctcat atccaagcgc gctaggaggt ggtcgaatac acatgtaggc gcttctctgg 4380

      atgcaaaagt cgtgccggac ctgccgaaag actttgaaga tgcgttcacg ccatctaagt 4440

      tgcgtagata attcacaaaa agggatgttt gtttccggaa tgtagcaaag agctgatagg 4500

      caatagcctc actttcgtgg cgcacgccgc tcgttccatc catcctcgac aatggagcaa 4560

      atgtcaaaat cgtaccgaaa atactttgct agcccgttaa attgccgtcg tcagccgtta 4620

      aattaccgat taatcccgat aaatttccga gatctccgtt aaattgccgt tcgcagccgt 4680

      taaattaccg gggacgaccg ataaatttcc gcgatgaatt catggtgttt tgatcatttt 4740

      aaatttttat atggcgggtg gtgggcaact cgcttgcgcg ggcaactcgc ttaccgatta 4800

      cgttagggct gatatttacg taaaaatcgt caagggatgc aagaccaaac cgttaaattt 4860

      ccggagtcaa cagcatccaa gcccaagtcc ttcacggaga aaccccagcg tccacatcac 4920

      gagcgaagga ccacctctag gcatcggacg caccatccaa ttagaagcag caaagcgaaa 4980

      cagcccaaga aaaaggtcgg cccgtcggcc ttttctgcaa cgctgatcac gggcagcgat 5040

      ccaaccaaca ccctccagag tgactagggg cggaaattta tcgggattaa tttccactca 5100

      accacaaatc acagtcgtcc ccggtaattt aacggctgca gacggcaatt taacggcttc 5160

      tgcgaatcgc ttggattccc cgcccctggc cgtagagctt aaagtatgtc ccttgtcgat 5220

      gcgatgtatc acaacatata aatactggca agggatgcca tgcttggagc aacaatctca 5280

      gaacaccaat atcaattcat ctcgagtctg aactcagaca acacaaattc ttcaaaattg 5340

      aggatttagt cttgatcttg aagttcctat tccgagttcc tattctctag aaagtatagg 5400

      aacttcttaa ttaacctagc cgttattact ctaccgcaag gcaacaacca gctcacccct 5460

      gaggcacggg taccatgggt tgagtggtat ggggccatcc agagtcacct gtggcagcat 5520

      gagactgcac tcgaagcagc catcaaccca gccaatattc tgggctttcc atccttagat 5580

      cacatttgag atataaccca tttggtgaga gacacttgtg ccgttatacg tgtctagact 5640

      ggaaacgcaa ccctgaaggg attcttcctt tgagagatgg aagcgtgtca tatctcttcg 5700

      gttctacggc aggttttttt ctgctctttc gtagcatggc atggtcactt cagcgcttat 5760

      ttacagttgc tggtattgat ttcttgtgca aattgctatc tgacacttat taggtcgagc 5820

      tattcctttg ccctcggacg agtgctgggg cgtcggtttc cactatcggc gagtacttct 5880

      acacagccat cggtccagac ggccgcgctt ctgcgggcga tttgtgtacg cccgacagtc 5940

      ccggctccgg atcggacgat tgcgtcgcat cgaccctgcg cccaagctgc atcatcgaaa 6000

      ttgccgtcaa ccaagctctg atagagttgg tcaagaccaa tgcggagcat atacgcccgg 6060

      agccgcggcg atcctgcaag ctccggatgc ctccgctcga agtagcgcgt ctgctgctcc 6120

      atacaagcca accacggcct ccagaagaag atgttggcga cctcgtattg ggaatccccg 6180

      aacatcgcct cgctccagtc aatgaccgct gttatgcggc cattgtccgt caggacattg 6240

      ttggagccga aatccgcgtg cacgaggtgc cggacttcgg ggcagtcctc ggcccaaagc 6300

      atcagctcat cgagagcctg cgcgacggac gcactgacgg tgtcgtccat cacagtttgc 6360

      cagtgataca catggggatc agcaatcgcg catatgaaat cacgccatgt agtgtattga 6420

      ccgattcctt gcggtccgaa tgggccgaac ccgctcgtct ggctaagatc ggccgcagcg 6480

      atcgcatcca tggcctccgc gaccggctgc agaacagcgg gcagttcggt ttcaggcagg 6540

      tcttgcaacg tgacaccctg tgcacggcgg gagatgcaat aggtcaggct ctcgctgaat 6600

      tccccaatgt caagcacttc cggaatcggg agcgcggccg atgcaaagtg ccgataaaca 6660

      taacgatctt tgtagaaacc atcggcgcag ctatttaccc gcaggacata tccacgccct 6720

      cctacatcga agctgaaagc acgagattct tcgccctccg agagctgcat caggtcggag 6780

      acgctgtcga acttttcgat cagaaacttc tcgacagacg tcgcggtgag ttcaggcgac 6840

      attgctgagg tgtaggatcg atccgtttaa actctgtgtt agcttatagt caggatgttg 6900

      gctcgacgag tgtaaactgg gagttggcat gagggttatg taggcttctt tagccccgca 6960

      tccccctcat tctcctcatt gatcccgggg gagcggatgg tgttgataag agactaatta 7020

      tagggtttag ctggtgccta gctggtgatt ggctggcttc gccgaatttt acgggccaag 7080

      ggaagctgca gaaccgcggc actggtaaac ggtaattaag ctatcagccc catgctaacg 7140

      agtttaaatt acgtgtattg ctgataaaca ccaacagagc tttactgaaa gatgggagtc 7200

      acggtgtggc ttccccactg cgattattgc acaagcagcg agggcgaact tgactgtcgt 7260

      cgctgagcag cctgcagtca aacatacata tatatcaacc gcgaagacgt ctggccttgt 7320

      agaacacgac gctccctagc aacacctgcc gtgtcagcct ctacggttgt tacttgcatt 7380

      caggatgctc tccagcgggc gagctattca aaatattcaa agcaggtatc tcgtattgcc 7440

      aggattcagc tgaagcaaca ggtgccaagg aaatctgcgt cggttctcat ctgggcttgc 7500

      tcggtcctgg cgtagactag ttgaagttcc tattccgagt tcctattctt caaatagtat 7560

      aggaacttca tcagggagat gtaacaacgc caccttatgg gactatcaag ctgacgctgg 7620

      cttctgtgca gacaaactgc gcccacgagt tcttccctga cgccgctctc gcgcaggcaa 7680

      gggaactcga tgaatactac gcaaagcaca agagacccgt tggtccactc catggcctcc 7740

      ccatctctct caaagaccag cttcgagtca aggtacaccg ttgcccctaa gtcgttagat 7800

      gtcccttttt gtcagctaac atatgccacc agggctacga aacatcaatg ggctacatct 7860

      catggctaaa caagtacgac gaaggggact cggttctgac aaccatgctc cgcaaagccg 7920

      gtgccgtctt ctacgtcaag acctctgtcc cgcagaccct gatggtctgc gagacagtca 7980

      acaacatcat cgggcgcacc gtcaacccac gcaacaagaa ctggtcgtgc ggcggcagtt 8040

      ctggtggtga gggtgcgatc gttgggattc gtggtggcgt catcggtgta ggaacggata 8100

      tcggtggctc gattcgagtg ccggccgcgt tcaacttcct gtacggtcta aggccgagtc 8160

      atgggcggct gccgtatgca aagatggcga acagcatgga gggtcaggag acggtgcaca 8220

      gcgttgtcgg gccgattacg cactctgttg agggtgagtc cttcgcctct tccttctttt 8280

      cctgctctat accaggcctc cactgtcctc ctttcttgct ttttatacta tatacgagac 8340

      cggcagtcac tgatgaagta tgttagacct ccgcctcttc accaaatccg tcctcggtca 8400

      ggagccatgg aaatacgact ccaaggtcat ccccatgccc tggcgccagt ccgagtcgga 8460

      cattattgcc tccaagatca agaacggcgg gctcaatatc ggctactaca acttcgacgg 8520

      caatgtcctt ccacaccctc ctatcctgcg cggcgtggaa accaccgtcg ccgcactcgc 8580

      caaagccggt cacaccgtga ccccgtggac gccatacaag cacgatttcg gccacgatct 8640

      catctcccat atctacgcgg ctgacggcag cgccgacgta atgcgcgata tcagtgcatc 8700

      cggcgagccg gcgattccaa atatcaaaga cctactgaac ccgaacatca aagctgttaa 8760

      catgaacgag ctctgggaca cgcatctcca gaagtggaat taccagatgg agtaccttga 8820

      gaaatggcgg gaggctgaag aaaaggccgg gaaggaactg gacgccatca tcgcgccgat 8880

      tacgcctacc gctgcggtac ggcatgacca gttccggtac tatgggtatg cctctgtgat 8940

      caacctgctg gatttcacga gcgtggttgt tccggttacc tttgcggata agaacatcga 9000

      taagaagaat gagagtttca aggcggttag tgagcttgat gccctcgtgc aggaagagta 9060

      tgatccggag gcgtaccatg gggcaccggt tgcagtgcag gttatcggac ggagactcag 9120

      tgaagagagg acgttggcga ttgcagagga agtggggaag ttgctgggaa atgtggtgac 9180

      tccataggta agctccgtgg cgaaagcctg acgcaccggt agattcttgg tgagcccgta 9240

      tcatgacggc ggcgggagct acatggcccc gggtgattta ttttttttgt atctacttct 9300

      gacccttttc aaatatacgg tcaactcatc tttcactgga gatgcggcct gcttggtatt 9360

      gcgatgttgt cagcttggca aattgtggct ttcgaaaaca caaaacgatt ccttagtagc 9420

      catgcatttt aagataacgg aatagaagaa agaggaaatt aaaaaaaaaa aaaaaacaaa 9480

      catcccgttc ataacccgta gaatcgccgc tcttcgtgta tcccagtacc acggcaaagg 9540

      tatttcatga tcgttcaatg ttgatattgt tcccgccagt atggctccac ccccatctcc 9600

      gcgaatctcc tcttctcgaa cgcggtagtg gcgcgccaat tggtaatgac ccatagggag 9660

      acaaacagca taatagcaac agtggaaatt agtggcgcaa taattgagaa cacagtgaga 9720

      ccatagctgg cggcctggaa agcactgttg gagaccaact tgtccgttgc gaggccaact 9780

      tgcattgtct agagaatgca atcataacag aaagtacagc cagcgctgtg tcataaagaa 9840

      gtccagttgg gaaacgaaag actagaatca aactaaaagt aatccggccg atatggcttc 9900

      acgtgcgaag tctcgccttg aggggacatt gtccttgcag gtgattgacc attgcgttca 9960

      tatggcgcga tgtttggtag tgtgggtgta gccggtgacc tcacggaagg actaaaggcc 10020

      acataccctt ctgagtgcct cttctcttcg tggtcggaac tctcgaatgg gtttttgaca 10080

      gttgcactcg tttggttgtg gtcatttgaa ggtctgcgtt cggtcttctg ttcgcgcagg 10140

      cgagctgact gagggattga aagctgcata gccatcgttg gcatgcgtta attcgccaaa 10200

      gctcagcggc gaaacaggcc tgacctctaa tccatgcatc tgctctgcac tcgattgttc 10260

      gtggtgtcct tgcgaagaaa gagaagcctt ggactcggat gactttctgg acgaggtggt 10320

      aggatcatca tgattgtaat gagactgtag cacatcatgc gaatcattcg acacacggtg 10380

      tctgcccaag ttgacgtcag catcggtatg catttcggta tggtcctcat ggttctcagc 10440

      atgtccctcc agaggggact catttccagc ggaaggatta taagcaacat aattgtcatg 10500

      tggctgcgac ctttcgtgag actccgagtt tgatctcact gtggactcat gggcgatatg 10560

      cggctcatca tgatcttcga atggagagaa atggttgaag tcggaggaca cgggtgattt 10620

      agcagcaggg ttgaatgcaa catagccagt ctcgcgctct tcatgtgagc tatatgagtc 10680

      atgtggcctg tcatggtcca gaggctccgg atgctcatgg ctagattcat cgtgtgccga 10740

      aatcgcgtca ctagcaaagg gcgaggttga cacattggct gcaggactga acgccacata 10800

      accactctca ggctcttcat gtgagttata ggagctgtgc ggcatatcat agtcctgagg 10860

      ttcacgatgc tcatggctgg attcatcgtg tgccgaaata gcgtgactag caaaaggcga 10920

      gggcgaagca ttggttgccg gactgaacgc cacatagccg tccccattgg ctgaactgac 10980

      tggtgacaac gtcctaccca tggcgtcggc cgggccagcg gcttggtgag agtgaagacc 11040

      attagaagta gctggactga acgatcgcag cgggtattcg ttttcttgag ctggataagg 11100

      ggctgcgcca tgctggctga aaggtgagaa tgttcggggt gctgctctat caccagggaa 11160

      ggcagacgct ggagtcaaag aacgagtgtt ggatcaattg ccggactgta tgaacggaaa 11220

      ggagtgctga ttgtttaaat ggcccgtagc cttcgctagg acctcgtgat tcggggaccg 11280

      ttggcccata cccaggagct ggtgtaaaat tggaacgcga cacgggtgtt tggttgcgca 11340

      gaatttgcgg tgccggcgag gcgtgatcaa tctggctgta acctgggcct ggggtgtagt 11400

      ttgagacagg tgtttgtgtt cgtggcattt gtggcgctgg cgacgctctg tcagtcggcc 11460

      catatccagg cgccgaaggt gtgggcgtaa acccttgccg tgatttaatt aagaattctc 11520

      ctgtaggctt gagagttcaa ggaagaaaca gtgcaattat ctttgcgaac ccaggngctg 11580

      gtgacggaat tttcatagtc aagctatcag agtaaagaag aggagcatgt caaagtacaa 11640

      ttagagacaa atatatagtc gcgtggagcc aagagcggat tcctcagtct cgtaggtctc 11700

      ttgacgaccg ttgatctgct tgatctcgtc tcccgaaaat gaaaatagac tctgctaagc 11760

      tattcttctg cttcgccgga gcctgaaggg cgtactaggg ttgcgaggtc caatgcatta 11820

      atgcattgca gatgagctgt atctggaaga ggtaaacccg aaacgcgttt tattcttgtt 11880

      gacatggagc tattaaatca ctagaaggca ctctttgctg cttggacaaa tgaacgtatc 11940

      ttatcgagat cctgaacacc atttgtctca actccggagc tgacatcgac accaacgatc 12000

      ttatatccag attcgtcaag ctgtttgatg atttcagtaa cgttaagtgg atcgatccgg 12060

      atagcgcggg ttccttccgg tattgtctcc ttccgtgttt cagttagcct cccccatctc 12120

      ccgggcaaac gtgcgcgcca ggtcgcatat cgtcggtatg gagccggggg tggtgacgtg 12180

      ggtctggacc atcccggagg taagttgcag cagggcgtcc cggcagccgg cgggcgattg 12240

      gtcgtaatcc aggataaaga cgtgcatgga acggaggcgt ttggccaaga cgtccaaggc 12300

      ccaggcaaac acgttataca ggtcgccgtt gggggccagc aactcggggc cccgaaacag 12360

      ggtaaataac gtgtccccga tatggggtcg tgggcccgcg ttgctctggg gctcggcacc 12420

      ctggggcggc acggccgtcc ccgaaagctg tccccagtcc tcccgccacg acccgccgca 12480

      ctgcagatac cgcaccgtat tggcaagtag cccgtaaacg cggcgaatcg cagccagcat 12540

      agccaggtcc agccgctcgc cggggcgctg gcgtttggcc aggcggtcga tgtgtctgtc 12600

      ctccggaagg gccccaagca cgatgttggt gccgggcaag gtcggcggga tgagggccac 12660

      gaacgccagc acggcctggg gggtcatgct gcccataagg taccgcgcgg ccgggtagca 12720

      caggagggcg gcgatgggat ggcggtcgaa gatgagggtg agggccgggg gcggggcatg 12780

      tgagctccca gcctcccccc cgatatgagg agccagaacg gcgtcggtca cggcataagg 12840

      catgcccatt gttatctggg cgcttgtcat taccaccgcc gcgtccccgg ccgatatctc 12900

      accctggtcg aggcggtgtt gtgtggtgta gatgttcgcg attgtctcgg aagcccccag 12960

      cacccgccag taagtcatcg gctcgggtac gtagacgata tcgtcgcgcg aacccagggc 13020

      caccagcagt tgcgtggtgg tggttttccc catcccgtgg ggaccgtcta tataaacccg 13080

      cagtagcgtg ggcattttct gctccgggcg gacttccgtg gcttcttgct gccggcgagg 13140

      gcgcaacgcc gtacgtcggt tgctatggcc gcgagaacgc gcagcctggt cgaacgcaga 13200

      cgcgtgttga tggccggggt acgaagccat acgcgcttct acaaggcgct ggccgaagag 13260

      gtgcgggagt ttcacgccac caagatcgat ctacagctgg tggggagagc aggaaaatat 13320

      ggcaacaaat gttggactga cgcaacgacc ttgtcaaccc cgccgacaca ccgggcggac 13380

      agacggggca aagctgccta ccagggactg agggacctca gcaggtcgag tgcagagcac 13440

      cggatgggtc gactgccagc ttgtgttccc ggtctgcgcc gctggccagc tcctgagcgg 13500

      cctttccggt ttcatacacc gggcaaagca ggagaggcac gatatttgga cgccctacag 13560

      atgccggatg ggccaattag ggagcttacg cgccgggtac tcgctctacc tacttcggag 13620

      aaggtactat ctcgtgaatc ttttaccaga tcggaagcaa ttggacttct gtacctaggt 13680

      taatggcatg ctatttcgcc gacggctata cacccctggc ttcacattct ccttcgctta 13740

      ctgccggtga ttcgatgaag ctccatattc tccgatgatg caatagattc ttggtcaacg 13800

      aggggcacac cagcctttcc acttcggggc ggaggggcgg ccggtcccgg attaataatc 13860

      atccactgca cctcagagcc gccagagctg tctggcgcag tggccgttat tactcagccc 13920

      ttctctctgc gtccgtccgt ctctccgcat gccagaaaga gtcaccggtc actgtacaga 13980

      gctcaagctt cgattaactc gagggggggc ccggtaccca attcgcccta tagtgagtcg 14040

      tattacaatt cactggccgt cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc 14100

      caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag cgaagaggcc 14160

      cgcaccgatc gcccttccca acagttgcgc agcctgaatg gcgaatggaa attgtaagcg 14220

      ttaatatttt gttaaaattc gcgttaaatt tttgttaaat cagctcattt tttaaccaat 14280

      aggccgaaat cggcaaaatc ccttataaat caaaagaata gaccgagata gggttgagtg 14340

      ttgttccagt ttggaacaag agtccactat taaagaacgt ggactccaac gtcaaagggc 14400

      gaaaaaccgt ctatcagggc gatggcccac tacgtgaacc atcaccctaa tcaagttttt 14460

      tggggtcgag gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc cgatttagag 14520

      cttgacgggg aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg 14580

      gcgctagggc gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc 14640

      ttaatgcgcc gctacagggc gcgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 14700

      ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 14760

      gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 14820

      cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 14880

      tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 14940

      tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 15000

      cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 15060

      tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 15120

      agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 15180

      ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 15240

      ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 15300

      aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 15360

      gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 15420

      tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 15480

      ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 15540

      cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 15600

      atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 15660

      cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 15720

      ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 15780

      cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 15840

      ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 15900

      tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 15960

      taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 16020

      caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 16080

      agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 16140

      gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 16200

      gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 16260

      ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 16320

      acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 16380

      tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 16440

      ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt 16500

      ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga 16560

      ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cccaatacgc aaaccgcctc 16620

      tccccgcgcg ttggccgatt ca 16642

      <210> 8

      <211> 80

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 SpeI-FRTF3-amdS

      <400> 8

      tggcgtagac tagttgaagt tcctattccg agtcctattc ttcaaatagt ataggaactt 60

      catcagggag atgtaacaac 80

      <210> 9

      <211> 22

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 amdS-F-探針

      <400> 9

      ctatggagtc accacatttc cc 22

      <210> 10

      <211> 6330

      <212> DNA

      <213> 人工序列

      <220>

      <223> 載體 pFRT-BsAMG

      <400> 10

      tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

      cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

      ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

      accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

      attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

      tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

      tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cttgaagttc ctattccgag 420

      ttcctattct ctagaaagta taggaacttc ctcgagacca tgtacttcgc tcgccttctc 480

      tccggactct ctctcatcac ctctgcggtt ctcgcccaga ccgttgactc ctatgtcagc 540

      actgagggcc ccatcgcgaa ggcgggcctc cttgcgaaca ttggtcccag tggttccaaa 600

      tccaacggtg cccatgctgg agttgtcgtc gctagcccta gccaagtcaa cccggactac 660

      atgtacacat gggtccgcga ctcttccctc gtgttcaagg tcctcgtcga ccagctcgct 720

      tccggccagg acacctctgt ccgtagcctg atcgatgcat tcgtcgcagc ggagtcggcg 780

      atgcagcaca cccccaaccc cagtggtgac atcaacactg gtggtcttgc tgagcccaag 840

      ttcaacatcg acaccaccgc cttcactggc gcatggggcc gcccgcagcg agatggccct 900

      gctctccgtt ctaccaccgt catcaactac gccaactacc tccttgctaa tggcaacacc 960

      actgcttggg tggtggccaa cctctggccc atgatcaagc tcgacttgga ctacatccag 1020

      aacaactgga accagtctac cttcgacctg tgggaggagc tcaactcctc gtccttcttc 1080

      accaccgctg ttcagcaccg tgctctccgc gagggtatta ctctcggcgc gaagctctcg 1140

      aagactgccg ataccgccaa ctatggcacc caggccggca acatcctttg cttcctccag 1200

      tcatactgga accctaccgc caactacgtg acctccaaca ccggtggtgg acgctccggc 1260

      aaggactcca actccgtcct tacttccatc cacactttcg accccgatgc cggatgtgat 1320

      gctaccacct tccagccctg ctccgacaag gccctgtcca acctcaaggt ttacgtcgac 1380

      tcgttccgct ccatctgggc catcaacgct ggcgctgctg ccaccgctcc cgtcgctgtc 1440

      ggccgctacc ccgaggacac ttactacaac ggtaacccct ggtacctctc tactttcgcc 1500

      gtcgccgagc agctctacga tgccatcatc gtctggaaca agcagggatc catccaggtc 1560

      accagccttt cccttccctt cttccagcag ttcatctcga ccctcaagac cggcacgtac 1620

      acccagagct ccacccagtt ccagaccctc gtccctgcca tcaaggcctg ggctgacggc 1680

      ttcgtcgcca tcaaccagaa gtacactcct cctaacggtg gtctcggtga acagtacgac 1740

      aaggtctctg gcgaccctgt cagcgctgtt gaccttacct ggtcgtatgc ttccgctctc 1800

      accgtcttca acgctcgtgc cggaaactac tcccccggct ggggtgccaa gggcctgacc 1860

      gtcccggcag tctgccagcc caacgctggc cctcaagtcc aggtgacgtt caaggttcag 1920

      gccacgacgg tctacggcga gaacatttac ctcactggtg ctaacccagc tctgtcgaac 1980

      tggtcgcccg acaccgccct cgccatgtct gctgctaact accctacctg gtctgtcaca 2040

      gtcaccctcc cggcgaacag cgtcatccag tacaagtaca tcaggaagaa caacggcgcc 2100

      gtcacctggg agtctgaccc caacaaccag gtcaccatcc cagcgagcgg cacctacacc 2160

      gtcaacgata actggcggta attaattaat aataaataac ggattgtgtc cgtaatcaca 2220

      cgtgcccgtg gtgcgtacga taacgcatag tgtttttccc tccacttaaa tcgaagggtt 2280

      gtgtcttgga tcgcgcgggt caaatgtata tggttcatat acatccgcag gcacgtaata 2340

      aagcgagggg ttcgaatccc cccgttaccc ccggtagggg cccagatccg ggtgactgac 2400

      acctggcggt agacaatcaa tccatttcgc tatagttaaa ggatggggat gagggcaatt 2460

      ggttatatga tcatgtatgt agtgggtgtg cataatagta gtgaaatgga agccaagtca 2520

      tgtgattgta atcgaccgac ggaattgagg atatccggaa atacagacac cgtgaaagcc 2580

      atggtctttc cttcgtgtag aagaccagac agacagtccc tgatttaccc ttgcacaaag 2640

      cactagaaaa ttagcattcc atccttctct gcttgctctg ctgatatcac tgtcattcaa 2700

      tgcatagcca tgagctcatc ttagatccaa gcacgtaatt ccatagccga ggtccacagt 2760

      ggagcagcaa cattccccat cattgctttc cccaggggcc tcccaacgac taaatcaaga 2820

      gtatatctct accgtccaat agatcgtctt cgcttcaaaa tctttgacaa ttccaagagg 2880

      gtccccatcc atcaaaccca gttcaataat agccgagatg catggtggag tcaattaggc 2940

      agtattgctg gaatgtcggg gccagttggc ccggtggtca ttggccgcct gtgatgccat 3000

      ctgccactaa atccgatcat tgatccaccg cccacgaggc gcgtctttgc tttttgcgcg 3060

      gcgtccaggt tcaactctct ccactagtct agcggggttc aaatgcaaac aagtacaaca 3120

      cgcagcaaac gaagcagccc accactgcgt tgatgcccag tttgactgtc cgaaatccac 3180

      cggaaaggtg gaaacatact atgtaacaat cagagggaag aaaaaatttt tatcgacgag 3240

      gcaggatagt gactgatggt ggggtcatgg tcgggtctcc gagcgaaaga gaaccaagga 3300

      aacaagatca acgaggttgg tgtacccaaa aggccgcagc aacaagagtc atcgcccaaa 3360

      agtcaacagt ctggaagaga ctccgccgtg cagattctgc gtcggtcccg cacatgcgtg 3420

      gtgggggcat tacccctcca tgtccaatga taagggcggc ggtcgagggc ttaagcccgc 3480

      ccactaattc gccttctcgc ttgcccctcc atataaggat tccccctcct tcccctccca 3540

      caactttttt ccttctttct ctcttcgtcc gcatcagtac gtatatcttt cccccatacc 3600

      tcctttccta ctcttcttcc attcattcaa ctcttctcct tactgacatc tgttttgctc 3660

      agtacctcta cgcgatcagc cgtagtatct gagcaagctt ctctacagaa tctttctagt 3720

      atcttacaaa gaactacaaa gttcgcacca atgcctcaat cctgggaaga actggccgct 3780

      gataagcgcg cccgcctcgc aaaaaccatc cctgatgaat ggaaagtcca gacgctgcct 3840

      gcggaagaca gcgttattga tttcccaaag aaatcgggta tcctttcaga ggccgaactg 3900

      aagatcacag aggcctccgc tgcagatctt gtgtccaagc tggcggccgg agagttgacc 3960

      tcggcggaag ttacgctagc attctgtaaa cgggcagtaa tcgcccagca gttagtaggg 4020

      tcccctctac ctcttgaagt tcctattccg agttcctatt cttcaaatag tataggaact 4080

      tcacgcatgc aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 4140

      cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4200

      aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4260

      acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4320

      ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4380

      gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4440

      caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4500

      tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4560

      gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4620

      ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4680

      cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 4740

      tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 4800

      tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 4860

      cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 4920

      agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 4980

      agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5040

      gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5100

      aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5160

      ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5220

      gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5280

      taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5340

      tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5400

      tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5460

      gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5520

      gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5580

      ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5640

      cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 5700

      tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 5760

      cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 5820

      agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 5880

      cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 5940

      aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6000

      aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6060

      gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6120

      gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6180

      tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6240

      ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 6300

      aaaataggcg tatcacgagg ccctttcgtc 6330

      <210> 11

      <211> 1722

      <212> DNA

      <213> Byssocorticium

      <400> 11

      atgtacttcg ctcgccttct ctccggactc tctctcatca cctctgcggt tctcgcccag 60

      accgttgact cctatgtcag cactgagggc cccatcgcga aggcgggcct ccttgcgaac 120

      attggtccca gtggttccaa atccaacggt gcccatgctg gagttgtcgt cgctagccct 180

      agccaagtca acccggacta catgtacaca tgggtccgcg actcttccct cgtgttcaag 240

      gtcctcgtcg accagctcgc ttccggccag gacacctctg tccgtagcct gatcgatgca 300

      ttcgtcgcag cggagtcggc gatgcagcac acccccaacc ccagtggtga catcaacact 360

      ggtggtcttg ctgagcccaa gttcaacatc gacaccaccg ccttcactgg cgcatggggc 420

      cgcccgcagc gagatggccc tgctctccgt tctaccaccg tcatcaacta cgccaactac 480

      ctccttgcta atggcaacac cactgcttgg gtggtggcca acctctggcc catgatcaag 540

      ctcgacttgg actacatcca gaacaactgg aaccagtcta ccttcgacct gtgggaggag 600

      ctcaactcct cgtccttctt caccaccgct gttcagcacc gtgctctccg cgagggtatt 660

      actctcggcg cgaagctctc gaagactgcc gataccgcca actatggcac ccaggccggc 720

      aacatccttt gcttcctcca gtcatactgg aaccctaccg ccaactacgt gacctccaac 780

      accggtggtg gacgctccgg caaggactcc aactccgtcc ttacttccat ccacactttc 840

      gaccccgatg ccggatgtga tgctaccacc ttccagccct gctccgacaa ggccctgtcc 900

      aacctcaagg tttacgtcga ctcgttccgc tccatctggg ccatcaacgc tggcgctgct 960

      gccaccgctc ccgtcgctgt cggccgctac cccgaggaca cttactacaa cggtaacccc 1020

      tggtacctct ctactttcgc cgtcgccgag cagctctacg atgccatcat cgtctggaac 1080

      aagcagggat ccatccaggt caccagcctt tcccttccct tcttccagca gttcatctcg 1140

      accctcaaga ccggcacgta cacccagagc tccacccagt tccagaccct cgtccctgcc 1200

      atcaaggcct gggctgacgg cttcgtcgcc atcaaccaga agtacactcc tcctaacggt 1260

      ggtctcggtg aacagtacga caaggtctct ggcgaccctg tcagcgctgt tgaccttacc 1320

      tggtcgtatg cttccgctct caccgtcttc aacgctcgtg ccggaaacta ctcccccggc 1380

      tggggtgcca agggcctgac cgtcccggca gtctgccagc ccaacgctgg ccctcaagtc 1440

      caggtgacgt tcaaggttca ggccacgacg gtctacggcg agaacattta cctcactggt 1500

      gctaacccag ctctgtcgaa ctggtcgccc gacaccgccc tcgccatgtc tgctgctaac 1560

      taccctacct ggtctgtcac agtcaccctc ccggcgaaca gcgtcatcca gtacaagtac 1620

      atcaggaaga acaacggcgc cgtcacctgg gagtctgacc ccaacaacca ggtcaccatc 1680

      ccagcgagcg gcacctacac cgtcaacgat aactggcggt aa 1722

      <210> 12

      <211> 573

      <212> PRT

      <213> Byssocorticium

      <400> 12

      Met Tyr Phe Ala Arg Leu Leu Ser Gly Leu Ser Leu Ile Thr Ser Ala

      1 5 10 15

      Val Leu Ala Gln Thr Val Asp Ser Tyr Val Ser Thr Glu Gly Pro Ile

      20 25 30

      Ala Lys Ala Gly Leu Leu Ala Asn Ile Gly Pro Ser Gly Ser Lys Ser

      35 40 45

      Asn Gly Ala His Ala Gly Val Val Val Ala Ser Pro Ser Gln Val Asn

      50 55 60

      Pro Asp Tyr Met Tyr Thr Trp Val Arg Asp Ser Ser Leu Val Phe Lys

      65 70 75 80

      Val Leu Val Asp Gln Leu Ala Ser Gly Gln Asp Thr Ser Val Arg Ser

      85 90 95

      Leu Ile Asp Ala Phe Val Ala Ala Glu Ser Ala Met Gln His Thr Pro

      100 105 110

      Asn Pro Ser Gly Asp Ile Asn Thr Gly Gly Leu Ala Glu Pro Lys Phe

      115 120 125

      Asn Ile Asp Thr Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg

      130 135 140

      Asp Gly Pro Ala Leu Arg Ser Thr Thr Val Ile Asn Tyr Ala Asn Tyr

      145 150 155 160

      Leu Leu Ala Asn Gly Asn Thr Thr Ala Trp Val Val Ala Asn Leu Trp

      165 170 175

      Pro Met Ile Lys Leu Asp Leu Asp Tyr Ile Gln Asn Asn Trp Asn Gln

      180 185 190

      Ser Thr Phe Asp Leu Trp Glu Glu Leu Asn Ser Ser Ser Phe Phe Thr

      195 200 205

      Thr Ala Val Gln His Arg Ala Leu Arg Glu Gly Ile Thr Leu Gly Ala

      210 215 220

      Lys Leu Ser Lys Thr Ala Asp Thr Ala Asn Tyr Gly Thr Gln Ala Gly

      225 230 235 240

      Asn Ile Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Thr Ala Asn Tyr

      245 250 255

      Val Thr Ser Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ser Asn Ser

      260 265 270

      Val Leu Thr Ser Ile His Thr Phe Asp Pro Asp Ala Gly Cys Asp Ala

      275 280 285

      Thr Thr Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val

      290 295 300

      Tyr Val Asp Ser Phe Arg Ser Ile Trp Ala Ile Asn Ala Gly Ala Ala

      305 310 315 320

      Ala Thr Ala Pro Val Ala Val Gly Arg Tyr Pro Glu Asp Thr Tyr Tyr

      325 330 335

      Asn Gly Asn Pro Trp Tyr Leu Ser Thr Phe Ala Val Ala Glu Gln Leu

      340 345 350

      Tyr Asp Ala Ile Ile Val Trp Asn Lys Gln Gly Ser Ile Gln Val Thr

      355 360 365

      Ser Leu Ser Leu Pro Phe Phe Gln Gln Phe Ile Ser Thr Leu Lys Thr

      370 375 380

      Gly Thr Tyr Thr Gln Ser Ser Thr Gln Phe Gln Thr Leu Val Pro Ala

      385 390 395 400

      Ile Lys Ala Trp Ala Asp Gly Phe Val Ala Ile Asn Gln Lys Tyr Thr

      405 410 415

      Pro Pro Asn Gly Gly Leu Gly Glu Gln Tyr Asp Lys Val Ser Gly Asp

      420 425 430

      Pro Val Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr

      435 440 445

      Val Phe Asn Ala Arg Ala Gly Asn Tyr Ser Pro Gly Trp Gly Ala Lys

      450 455 460

      Gly Leu Thr Val Pro Ala Val Cys Gln Pro Asn Ala Gly Pro Gln Val

      465 470 475 480

      Gln Val Thr Phe Lys Val Gln Ala Thr Thr Val Tyr Gly Glu Asn Ile

      485 490 495

      Tyr Leu Thr Gly Ala Asn Pro Ala Leu Ser Asn Trp Ser Pro Asp Thr

      500 505 510

      Ala Leu Ala Met Ser Ala Ala Asn Tyr Pro Thr Trp Ser Val Thr Val

      515 520 525

      Thr Leu Pro Ala Asn Ser Val Ile Gln Tyr Lys Tyr Ile Arg Lys Asn

      530 535 540

      Asn Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Gln Val Thr Ile

      545 550 555 560

      Pro Ala Ser Gly Thr Tyr Thr Val Asn Asp Asn Trp Arg

      565 570

      <210> 13

      <211> 283

      <212> DNA

      <213> 構巢曲霉

      <400> 13

      atgcctcaat cctgggaaga actggccgct gataagcgcg cccgcctcgc aaaaaccatc 60

      cctgatgaat ggaaagtcca gacgctgcct gcggaagaca gcgttattga tttcccaaag 120

      aaatcgggta tcctttcaga ggccgaactg aagatcacag aggcctccgc tgcagatctt 180

      gtgtccaagc tggcggccgg agagttgacc tcggtggaag ttacgctagc attctgtaaa 240

      cgggcagcaa tcgcccagca gttagtaggg tcccctctac ctc 283

      <210> 14

      <211> 17

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 M13 RV

      <400> 14

      caggaaacag ctatgac 17

      <210> 15

      <211> 17

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 M13 M4

      <400> 15

      gttttcccag tcacgac 17

      <210> 16

      <211> 19

      <212> DNA

      <213> 人工序列

      <220>

      <223> 在融合載體R中的引物

      <400> 16

      tatgcgttat cgtacgcac 19

      <210> 17

      <211> 17

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 M13 M4

      <400> 17

      gttttcccag tcacgac 17

      <210> 18

      <211> 27

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 M49X F

      <220>

      <221> 尚未歸類的特征

      <222> (16)..(17)

      <223> n is a, c, g, or t

      <400> 18

      gtcaacccgg actacnnkta cacatgg 27

      <210> 19

      <211> 18

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 M49X R

      <400> 19

      gtagtccggg ttgacttg 18

      <210> 20

      <211> 37

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 SOE-M4 F

      <400> 20

      gtactatctg gcattggtac gttttcccag tcacgac 37

      <210> 21

      <211> 37

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 SOE-MR R

      <400> 21

      tggttatgat ttcggcgatg caggaaacag ctatgac 37

      <210> 22

      <211> 20

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 SOE-F

      <400> 22

      gtactatctg gcattggtac 20

      <210> 23

      <211> 20

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 SOE-R

      <400> 23

      tggttatgat ttcggcgatg 20

      <210> 24

      <211> 20

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物插入物解救F

      <400> 24

      aatctcagaa caccaatatc 20

      <210> 25

      <211> 20

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物插入物解救R

      <400> 25

      aacactatgc gttatcgtac 20

      <210> 26

      <211> 11101

      <212> DNA

      <213> 人工序列

      <220>

      <223> 載體 pDAu571

      <400> 26

      ttgaagttcc tattccgagt tcctattctc tagaaagtat aggaacttca gtacccgggt 60

      ataagctagc ttccgttaaa ttgccgtcgt cagccgttaa attaccgatt aatcccgata 120

      aatttccgag atctccgtta aattgccgtt cgcagccgtt aaattaccgg ggacgaccga 180

      taaatttccg cgatgaattc atggtgtttt gatcatttta aatttttata tggcgggtgg 240

      tgggcaactc gcttgcgcgg gcaactcgct taccgattac gttagggctg atatttacgt 300

      aaaaatcgtc aagggatgca agaccaaacc gttaaatttc cggagtcaac agcatccaag 360

      cccaagtcct tcacggagaa accccagcgt ccacatcacg agcgaaggac cacctctagg 420

      catcggacgc accatccaat tagaagcagc aaagcgaaac agcccaagaa aaaggtcggc 480

      ccgtcggcct tttctgcaac gctgatcacg ggcagcgatc caaccaacac cctccagagt 540

      gactaggggc ggaaatttat cgggattaat ttccactcaa ccacaaatca cagtcgtccc 600

      cggtaattta acggctgcag acggcaattt aacggcttct gcgaatcgct tggattcccc 660

      gcccctggcc gtagagctta aagtatgtcc cttgtcgatg cgatgtatca caacatataa 720

      atactggcaa gggatgccat gcttggagtt tccaactcaa tttacctcta tccacacttc 780

      tcttccttcc tcaatcctct atatacacaa ctggggatcc accatgttct cggcaggcca 840

      caagattaag ggtacagtcg tcctcatgcc taaaaacgag ttggaagtga accccgatgg 900

      ctccgcagtc gataacctca acgcattcct cggacgttcg gtgtcgctcc agctcatctc 960

      cgcgaccaaa gccgacgccc acggtaaggg aaaggtgggc aaggacacgt tcttggaagg 1020

      tatcaacact tcgctcccta ccttgggagc aggagagtcc gcattcaaca ttcacttcga 1080

      gtgggacggt tcgatgggca ttcccggagc gttctatatc aagaactata tgcaggtgga 1140

      gttcttcttg aagtccttga ccttggaggc aatctcgaac cagggtacca tccgtttcgt 1200

      gtgtaactcg tgggtctaca acaccaagct ctacaaatcc gtgcggatct tcttcgcgaa 1260

      ccacacttac gtcccttcgg agacacctgc ccctttggtg tcgtaccgcg aggaggaatt 1320

      gaagtccctc cgtggtaacg gtactggaga aaggaaggag tatgatagga tctacgacta 1380

      cgacgtctat aacgatttgg gtaaccccga caaatcggaa aagttggcac gtcctgtgtt 1440

      gggaggctcc tccaccttcc cctaccctcg acgcggccgc acgggacgcg gtcccactgt 1500

      caccgatccg aacacagaga agcagggcga agtcttctac gtgcccaggg acgaaaacct 1560

      cggccacttg aagtcgaagg atgcattgga gattggaacc aagtccctct cccagatcgt 1620

      ccagcctgca ttcgaatcgg cgttcgattt gaaatcgacg cccatcgagt tccactcgtt 1680

      ccaggacgtc catgacttgt atgaaggtgg tatcaaattg cctcgggacg tcatctccac 1740

      cattatcccc ctccccgtga tcaaggaatt gtaccgcacc gacggccagc atattctcaa 1800

      attcccccag ccgcacgtcg tccaggtctc gcagtccgca tggatgacag atgaggaatt 1860

      cgcgagggaa atgattgcag gtgtcaaccc gtgtgtcatc cgaggcttgg aggagttccc 1920

      tcctaagtcc aacctcgatc ctgccatcta tggagaccag tcctccaaga ttacagccga 1980

      ttccctcgat ctcgacggtt atactatgga tgaagcactc ggttccaggc gattgttcat 2040

      gctcgattat catgatatct tcatgcccta tgtgcgccag atcaaccagt tgaactcggc 2100

      aaaaacatat gcaacgagga cgatcctctt cctccgagaa gacggcacac tcaagcctgt 2160

      ggcaatcgag ctctcgctcc cccattccgc aggcgatctc tccgcagccg tgtcgcaggt 2220

      ggtgttgcct gcaaaagaag gagtggagtc gaccatctgg ctcttggcca aagcatatgt 2280

      gattgtgaac gattcctgtt atcaccagct catgtcgcat tggctcaaca ctcacgcggc 2340

      aatggaaccc ttcgtgatcg ccacgcaccg gcacctctcg gtgctccacc cgatctacaa 2400

      gctcctcact ccccactacc gtaacaacat gaacattaac gccttggcac ggcagtcgtt 2460

      gatcaacgcg aacggcatca ttgagacaac gttcctcccc tccaagtact ccgtcgaaat 2520

      gtcgtccgca gtctacaaaa actgggtctt caccgaccag gcgttgcctg ccgacttgat 2580

      caaacgaggc gtcgcaatca aagatccctc cactcctcat ggcgtccgcc tcttgatcga 2640

      ggactacccc tacgcagcgg acggattgga aatctgggca gccatcaaga cctgggtgca 2700

      ggaatacgtc cctttgtact atgcgaggga cgatgatgtc aaaaacgact cggaactcca 2760

      gcattggtgg aaggaggcag tggaaaaggg ccatggagat ctcaaggata aaccctggtg 2820

      gcctaagctc cagaccttgg aggacctcgt cgaagtgtgt ttgatcatta tctggatcgc 2880

      atccgcgttg catgcagccg tgaacttcgg acagtatccc tatggaggcc tcatcatgaa 2940

      ccgtcccacc gcatccagga ggctcctccc cgaaaaagga acacccgaat acgaagaaat 3000

      gatcaacaac cacgaaaagg catacctccg gaccatcact tccaaactcc cgaccttgat 3060

      ctcgctctcc gtgatcgaga ttttgtcgac acatgcgtcg gacgaggtct atttgggtca 3120

      gcgggataac ccgcactgga catccgattc caaggccctc caggcgttcc agaagttcgg 3180

      caacaagctc aaggagatcg aggagaaact cgtgaggcgg aacaacgacc cttccctcca 3240

      gggaaaccgg ttgggacctg tccagctccc gtatacgttg ctctacccct cctcggaaga 3300

      aggcctcact ttcaggggta tccccaactc gatttccatc tgactcgaga tctagagggt 3360

      gactgacacc tggcggtaga caatcaatcc atttcgctat agttaaagga tggggatgag 3420

      ggcaattggt tatatgatca tgtatgtagt gggtgtgcat aatagtagtg aaatggaagc 3480

      caagtcatgt gattgtaatc gaccgacgga attgaggata tccggaaata cagacaccgt 3540

      gaaagccatg gtctttcctt cgtgtagaag accagacaga cagtccctga tttacccttg 3600

      cacaaagcac tagaaaatta gcattccatc cttctctgct tgctctgctg atatcactgt 3660

      cattcaatgc atagccatga gctcatctta gatccaagca cgtaattcca tagccgaggt 3720

      ccacagtgga gcagcaacat tccccatcat tgctttcccc aggggcctcc caacgactaa 3780

      atcaagagta tatctctacc gtccaataga tcgtcttcgc ttcaaaatct ttgacaattc 3840

      caagagggtc cccatccatc aaacccagtt caataatagc cgagatgcat ggtggagtca 3900

      attaggcagt attgctggaa tgtcggggcc agttggccgg gtggtcattg gccgcctgtg 3960

      atgccatctg ccactaaatc cgatcattga tccaccgccc acgaggcgcg tctttgcttt 4020

      ttgcgcggcg tccaggttca actctctctt aattaaatag cgacaagccg aacggcaccg 4080

      gcaggtacaa tggttcgctg tacttgcttg cgcaagcggg tctttgggga ttgagcgcat 4140

      ttggtgttgc aaaggatttg atgtaaatgt agtcgacatc ttagcacaga ggggagagtt 4200

      gataaaatgt ggtctgtttg aatgatagtc gggttcgtga cctatattcg tgatagtgga 4260

      gataggtctg cgcctatctt atcgggccgg agcaaaaatt ccaccgcagc ggggtgagtt 4320

      ttcgttatac agccatccca cttccagctt caaattgtca gtttaatcca gcccaattca 4380

      atcattggag aaccggtttt atgtcttcga agtcccacct cccctacgca attcgcgcaa 4440

      ccaaccatcc caacccttta acatctaaac tcttctccat cgccgaggag aagaaaacca 4500

      acgtcaccgt ctccgcagac gttactactt ccgccgagct cctcgatctt gctgaccgcc 4560

      taggccccta tatcgcagtt ctgaaaaccc acatcgacat cctcaccgat ctcaccccgt 4620

      cgaccctttc ctcgctccaa tccctcgcga caaagcacaa cttcctcatc tttgaggacc 4680

      gcaagttcat cgacatcggc aacaccgtgc aaaagcagta ccacggtggc gctctccgca 4740

      tctccgaatg ggcacacatc atcaactgcg ccatcctgcc gggcgaaggg atcgtcgagg 4800

      ccctcgcaca gacaaccaag tctcctgact ttaaagacgc gaatcaacga ggtctcctga 4860

      ttcttgccga gatgacgagt aagggatctc ttgcgacagg ggagtacacg gcacgctcgg 4920

      ttgagtacgc gcggaagtat aaggggtttg tgatgggatt cgtgagtaca agggcgttga 4980

      gtgaggtgct gcccgaacag aaagaggaga gcgaggattt tgtcgtcttt acgactgggg 5040

      tgaatctgtc ggataagggg gataagctgg ggcagcagta tcagacacct gggtcggcgg 5100

      ttgggcgagg tgcggacttt atcattgcgg gtaggggcat ctataaggcg gacgatccag 5160

      tcgaggcggt tcagaggtac cgggaggaag gctggaaagc ttacgagaaa agagttggac 5220

      tttgagggtg actgacacct ggcggtagac aatcaatcca tttcgctata gttaaaggat 5280

      ggggatgagg gcaattggtt atatgatcat gtatgtagtg ggtgtgcata atagtagtga 5340

      aatggaagcc aagtcatgtg attgtaatcg accgacggaa ttgaggatat ccggaaatac 5400

      agacaccgtg aaagccatgg tctttccttc gtgtagaaga ccagacagac agtccctgat 5460

      ttacccttgc acaaagcact agaaaattag cattccatcc ttctctgctt gctctgctga 5520

      tatcactgtc attcaatgca tagccatgag ctcatcttag atccaagcac gtaattccat 5580

      agccgaggtc cacagtggag cagcaacatt ccccatcatt gctttcccca ggggcctccc 5640

      aacgactaaa tcaagagtat atctctaccg tccaatagat cgtcttcgct tcaaaatctt 5700

      tgacaattcc aagagggtcc ccatccatca aacccagttc aataatagcc gagatgcatg 5760

      gtggagtcaa ttaggcagta ttgctggaat gtcggggcca gttggccggg tggtcattgg 5820

      ccgcctgtga tgccatctgc cactaaatcc gatcattgat ccaccgccca cgaggcgcgt 5880

      ctttgctttt tgcgcggcgt ccaggttcaa ctctctcctc taggttgaag ttcctattcc 5940

      gagttcctat tcttcaaata gtataggaac ttcaactagc tagtgcatgc gtacgatttt 6000

      gacatttgct ccattgtcga ggatggatgg aacgagcggc gtgcgccacg aaagtgaggc 6060

      tattgcctat cagctctttg ctacattccg gaaacaaaca tccctttttg tgaattatct 6120

      acgcaactta gatggcgtga acgcatcttc aaagtctttc ggcaggtccg gcacgacttt 6180

      tgcatccaga gaagcgccta catgtgtatt cgaccacctc ctagcgcgct tggatatgag 6240

      gaaatattac tgagagtcga aaacaagctc caccgcacca gctcttcttg gagttttata 6300

      ttaaagaata ttcccagctc gttgtattat tctttttcta ccgtgctaat gtatcaagga 6360

      ctttggtacc tattaacgtt attattcgtg tgctattccc aaacataacc ctgtatatgt 6420

      ttcgaacgcc gttatgaccc atgtcttaca tactcattaa gtcattccct tggataatct 6480

      cgactcagat gcggcggttg atgtaggagg agaggtaatc gaggacctcc tgggagatga 6540

      tgccgttcca ggcggggtag cggatggagc cctcggcgga gcccttgagc tgctcgatat 6600

      gctgccactc ctcgatgggg ttggtctcat ccttgagggc gatcatctcc ttggagatgg 6660

      gatcgtaggc gtagtagcgg gagactagtg cgaagtaatg atcggggatg gcggtgatct 6720

      gatgggtgta ggtggtgcgg gcgacggcgg aggcgcgctt atcggaccag ttgccgacga 6780

      cgttggtgag ctcggtgagg cccttcatgg agaggaagga ggtcatgaga tggcggccga 6840

      tatgggactt ggggccgttc ttgatggcga agatggagta gggggcgttc ttcttgaggg 6900

      ccttgttgta ggagcggacg aggttatcct tgaggagctg gtactcctgc ttgttggagg 6960

      aggagttgcc ggtgcggttg acgcgcttga ggacgggctc ggagttgcgg aggaactcat 7020

      cgaggtagac gaggggatcg atgcggccgc gggcggagaa gaagtagata tggcgggaga 7080

      cggaggtctt ggtctcggtg acgaggcact ggatgatgac gccgaggtac ttgttctgga 7140

      cgagcttgaa ggacttggga tcgacgttct tgatatcgga gaagcggccg cagttgatga 7200

      aggtggcgag gaagaggaac tggtagaggg tcttggtctt ggtgaagcgg gaggtgtact 7260

      cgaaggagtt gaggatcttc tcggtgatct cccagatgga ctcgccctcg gagaggaggg 7320

      ccttgagcat cttcttggaa tgggagttgc ccttatcggc ctcctcggag gactcgaact 7380

      ggagctggag ggaggagacg atatcggtga tatcggactg atgcttctgg ccgtagtagg 7440

      ggatgatggt gaactcccag gcggggatga gcttcttgag ggaggcctcc aggatggtgg 7500

      ccttctgggt cttgtacttg aactggaggg acttgttgac gatatcgaag gagagggagt 7560

      tggagatgat ggtgttgtag gacatgaagg tggcgcgctt gatggcggtg ccgttatggg 7620

      tgatcatcca gcagaggtag gtgagctcgg cggcgcagag ggcgatcttc tcgccggagg 7680

      ggcgctcgaa gcgctcgacg aactggcgga cgaggacctt ggggggggtc ttgcagagga 7740

      tatcgaactg gggcatggtg ctcagatact acggctgatc gcgtagaggt actgagcaaa 7800

      acagatgtca gtaaggagaa gagttgaatg aatggaagaa gagtaggaaa ggaggtatgg 7860

      gggaaagata tacgtactga tgcggacgaa gagagaaaga aggaaaaaag ttgtgggagg 7920

      ggaaggaggg ggaatcctta tatggagggg caagcgagaa ggcgaattag tgggcgggct 7980

      taagccctcg accgccgccc ttatcattgg acatggaggg gtaatgcccc caccacgcat 8040

      gtgcgggacc gacgcagaat ctgcacggcg gagtctcttc cagactgttg acttttgggc 8100

      gatgactctt gttgctgcgg ccttttgggt acaccaacct cgttgatctt gtttccttgg 8160

      ttctctttcg ctcggagacc cgaccatgac cccaccatca gtcactatcc tgcctcgtcg 8220

      ataaaaattt tttcttccct ctgattgtta catagtatgt ttccaccttt ccggtggatt 8280

      tcggacagtc aaactgggca tcaacgcagt ggtgggctgc ttcgtttgct gcgtgttgta 8340

      cttgtttgca tttgaacccc gcggtcgttc gagtccttaa ttggtccgct cccggtcaac 8400

      acccaagcag ctgtggcccg gccgagtggc gcctgtctgg tccacagtaa gcttggcgta 8460

      atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 8520

      acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 8580

      aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 8640

      atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 8700

      gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 8760

      ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 8820

      aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 8880

      ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 8940

      aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 9000

      gaccctgccg cttaccggat acctgtccgc ctttttccct tcgggaagcg tggcgctttc 9060

      tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 9120

      tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 9180

      gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 9240

      cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 9300

      cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 9360

      agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 9420

      caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 9480

      ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 9540

      aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 9600

      tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 9660

      agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 9720

      gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 9780

      accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 9840

      tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 9900

      tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 9960

      acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 10020

      atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 10080

      aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 10140

      tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 10200

      agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 10260

      gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 10320

      ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 10380

      atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 10440

      tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 10500

      tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 10560

      tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 10620

      cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 10680

      ctttcgtctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga 10740

      gacggtcaca gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc 10800

      agcgggtgtt ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact 10860

      gagagtgcac catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat 10920

      caggcgccat tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc 10980

      ttcgctatta cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac 11040

      gccagggttt tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac 11100

      c 11101

      <210> 27

      <211> 49

      <212> DNA

      <213> 人工序列

      <220>

      <223> FRT-F

      <400> 27

      ttgaagttcc tattccgagt tcctattctc tagaaagtat aggaacttc 49

      <210> 28

      <211> 50

      <212> DNA

      <213> 人工序列

      <220>

      <223> FRT-F3

      <400> 28

      ttgaagttcc tattccgagt tcctattctt caaatagtat aggaacttca 50

      <210> 29

      <211> 8299

      <212> DNA

      <213> 人工序列

      <220>

      <223> 質粒 pDAu703

      <400> 29

      taggcgtatc acgaggccct ttcgtctcgc gcgtttcggt gatgacggtg aaaacctctg 60

      acacatgcag ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca 120

      agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggctggctta actatgcggc 180

      atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt 240

      aaggagaaaa taccgcatca ggcgccattc gccattcagg ctgcgcaact gttgggaagg 300

      gcgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag 360

      gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag 420

      tgaattggcc tccatggccg cggccgcgct ttgctaaaac tttggttgat ggaaggtatc 480

      tggcgataaa ctccgacgac gtctagaagc aacaatctta tgcaaacgct cattggttct 540

      tttcgaccgc aacatccatc atgaaactgg tattttgtct gtgtcagcag tctagaaccc 600

      cttgccgggt attttagcat ttcatttttc tataaaaagg taccagcatg tatggatcgt 660

      atcttccgta ccgtggttat taaatcccag cagaggccga taggcttaag aagtgaacat 720

      ggcatggtta aggaagaagc cattactgag tatatatggc tagaataatc gctgggaaag 780

      atttatgctt ccaagaggcg taggacggta taccatacag tacggtattt atgaacaatt 840

      cgataatacc actccccaaa gcgggagata ggacacccgc ctcaggcacc aaccaccccc 900

      tttttcaact gtcagtggtg cacgtttcca tcgagcataa gcttggtacc ctaaggatag 960

      gccctaatct tatctacatg tgactgcatc gatgtgtttg gtcaaaatga ggcatgtggc 1020

      tcaccccaca ggcggagaaa cgtgtggcta gtgcatgaca gtcccctcca tagattcaat 1080

      ttaatttttc gcggcaattg tcgtgcagtt tgtatctaca tttcattcca tatatcaaga 1140

      gttagtagtt ggacatcctg attattttgt ctaattactg aaaactcgaa gtactaacct 1200

      actaataagc cagtttcaac cactaagtgc tcatttatac aatatttgca gaaccccgcg 1260

      ctacccctcc atcgccaaca tgtcttccaa gtcgcaattg acctacagcg cacgcgctag 1320

      caagcacccc aatgcgctcg taaagaagct cttcgaggtt gccgaggcca agaaaaccaa 1380

      tgtcaccgtt tccgccgacg tgacaaccac caaagagctg ctggatttgg ctgaccgtat 1440

      gcgcaccggg gttgaagttc ctattccgag ttcctattct tcaaatagta taggaacttc 1500

      attaattaaa ggagagagtt gaacctggac gccgcgcaaa aagcaaagac gcgcctcgtg 1560

      ggcggtggat caatgatcgg atttagtggc agatggcatc acaggcggcc aatgaccacc 1620

      gggccaactg gccccgacat tccagcaata ctgcctaatt gactccacca tgcatctcgg 1680

      ctattattga actgggtttg atggatgggg accctcttgg aattgtcaaa gattttgaag 1740

      cgaagacgat ctattggacg gtagagatat actcttgatt tagtcgttgg gaggcccctg 1800

      gggaaagcaa tgatggggaa tgttgctgct ccactgtgga cctcggctat ggaattacgt 1860

      gcttggatct aagatgagct catggctatg cattgaatga cagtgatatc agcagagcaa 1920

      gcagagaagg atggaatgct aattttctag tgctttgtgc aagggtaaat cagggactgt 1980

      ctgtctggtc ttctacacga aggaaagacc atggctttca cggtgtctgt atttccggat 2040

      atcctcaatt ccgtcggtcg attacaatca catgacttgg cttccatttc actactatta 2100

      tgcacaccca ctacatacat gatcatataa ccaattgccc tcatccccat cctttaacta 2160

      tagcgaaatg gattgattgt ctaccgccag gtgtcagtca ccctctagat ctcgagctcg 2220

      ctagagtcga cctatggagt caccacattt cccagcaact tccccacttc ctctgcaatc 2280

      gccaacgtcc tctcttcact gagtctccgt ccgataacct gcactgcaac cggtgcccca 2340

      tggtacgcct ccggatcata ctcttcctgc acgagggcat caagctcact aaccgccttg 2400

      aaactctcat tcttcttatc gatgttctta tccgcaaagg taaccggaac aaccacgctc 2460

      gtgaaatcca gcaggttgat cacagaggca tacccatagt accggaactg gtcatgccgt 2520

      accgcagcgg taggcgtaat cggcgcgatg atggcgtcca gttccttccc ggccttttct 2580

      tcagcctccc gccatttctc aaggtactcc atctggtaat tccacttctg gagatgcgtg 2640

      tcccagagct cgttcatgtt aacagctttg atgttcgggt tcagtaggtc tttgatattt 2700

      ggaatcgccg gctcgccgga tgcactgata tcgcgcatta cgtcggcgct gccgtcagcc 2760

      gcgtagatat gggagatgag atcgtggccg aaatcgtgct tgtatggcgt ccacggggtc 2820

      acggtgtgac cggctttggc gagtgcggcg acggtggttt ccacgccgcg caggatagga 2880

      gggtgtggaa ggacattgcc gtcgaagttg tagtagccga tattgagccc gccgttcttg 2940

      atcttggagg caataatgtc cgactcggac tggcgccagg gcatggggat gaccttggag 3000

      tcgtatttcc atggctcctg accgaggacg gatttggtga agaggcggag gtctaacata 3060

      cttcatcagt gactgccggt ctcgtatata gtataaaaag caagaaagga ggacagtgga 3120

      ggcctggtat agagcaggaa aagaaggaag aggcgaagga ctcaccctca acagagtgcg 3180

      taatcggccc gacaacgctg tgcaccgtct cctgaccctc catgctgttc gccatctttg 3240

      catacggcag ccgcccatga ctcggcctta gaccgtacag gaagttgaac gcggccggca 3300

      ctcgaatcga gccaccgata tccgttccta caccgatgac gccaccacga atcccaacga 3360

      tcgcaccctc accaccagaa ctgccgccgc acgaccagtt cttgttgcgt gggttgacgg 3420

      tgcgcccgat gatgttgttg actgtctcgc agaccatcag ggtctgcggg acagaggtct 3480

      tgacgtagaa gacggcaccg gctttgcgga gcatggttgt cagaaccgag tccccttcgt 3540

      cgtacttgtt tagccatgag atgtagccca ttgatgtttc gtagccctgg tggcatatgt 3600

      tagctgacaa aaagggacat ctaacgactt aggggcaacg gtgtaccttg actcgaagct 3660

      ggtctttgag agagatgggg aggccatgga gtggaccaac gggtctcttg tgctttgcgt 3720

      agtattcatc gagttccctt gcctgcgcga gagcggcgtc agggaagaac tcgtgggcgc 3780

      agtttgtctg cacagaagcc agcgtcagct tgatagtccc ataaggtggc gttgttacat 3840

      ctccctgaga ggtagagggg accctactaa ctgctgggcg attgctgccc gtttacagaa 3900

      tgctagcgta acttccaccg aggtcaactc tccggccgcc agcttggaca caagatctgc 3960

      agcggaggcc tctgtgatct tcagttcggc ctctgaaagg atcaccgatt tctttgggaa 4020

      atcaataacg ctgtcttccg caggcagcgt ctggactttc cattcatcag ggatggtttt 4080

      tgcgaggcgg gcgcgcttat cagcggccag ttcttcccag gattgaggca tgtgcatgca 4140

      atgtgtgttt atgtggaagt aagatacgac gagtttgatt gagaaaagac agggtgattg 4200

      tcaagttcag tatggaagaa agagtagaag aagatcagac gacagggaag agcgatgaca 4260

      taaaaggtgg aagacggaag aaaaacgaac caaatcaatc ccactctatg gcgggggttg 4320

      gactgcctga ggccggcact ggtggggctt atcgataagt tctcgtcacc ggatgcaatg 4380

      cgctgtcaac tgctgacttg gccctgaaca tcctgtcctc tacagatcca tactatacaa 4440

      tgatcccagt tatagtgcgg taaggtgcat atcatatctc attctcatga ctcattcgac 4500

      ttttttttag agaaagtaca tacgtggaac atacactaaa cgcaacaggt cgcgacaaca 4560

      ctggtataca aaacggtccc cggtgaatga cgttattagt gtctatcccc cactcacacc 4620

      cgaaaagaat aatagaaact aacagaaaaa gcggcccgag gataagagga acattcaaac 4680

      agaaggggaa tcataaaaac cgaaaaatgc aaggaaaaga gaactcaaat caataatttt 4740

      cataatactg tcgagagtaa tacggaccag cgtctctcag ggacatgcgt cggcgcaagg 4800

      catcatccaa tctctcatct aacacatcca gcattcgtgt tcgatagtct aactgcttct 4860

      ctcggcgctc aagtcttgct tcccgatcat cgagttaatt aagaagttcc tatactttct 4920

      agagaatagg aactcggaat aggaacttca aggtaccgag ctctatcctc aataccctat 4980

      tttccacgat tccattgtca tatccaattc cgttttcttt tcttgttttc ccctcatcca 5040

      atcccgtcca tcatttactc ctttttcttg tgaatgcaag tggcactaag aaatccaacc 5100

      cccagacaaa ttttcctact caggaacaca aaaacctcgt ttctgctccc ttctcgtact 5160

      tcattcctat cgtctcggaa tttcctcaac aaccctttcc gactttgcga cagcgtcgcg 5220

      attccagact tatgtgttct cgttcctact gtcgttacca gtctatttat tccgaaacct 5280

      ctgatcgctg aatttcacac acaacacccc cccgttgatg ctggtggaga atccgtagcg 5340

      tcaagagttg aattcactcc atgttgtaac gaagtccacg aattgagacg attgatgatt 5400

      acaaccccgc gatcgcctat cgacgattcg acgagatgcc attctcatcc tcctcatcct 5460

      cctccacccc cgaggtgtct accaccccgc tcgcagatta cttctggatc gcaggtgtcg 5520

      atggcgcgga aatcttagag actttccaaa gactcggcga cgaatacagg gcaaacagtg 5580

      ccaccgctcc tggccccgct cttgcggaca cgatcgagga agatgcggac gcggaggagg 5640

      cacacgaccc ccgtctggac tccctctctc gacccaattc catggctggg ggccgcaatt 5700

      ccttccagcg gttctcaatg cgctcaggag actccagtga gtccagtggg aatggtacca 5760

      gcagcaaccg gagcagtctg accatcaagg gtaatcagtc gcccagaggg tcgtcgtttc 5820

      tagaagattt cgactttgac aaggccctgt tcaagtttgc aaacgagcgg gagtcgttcc 5880

      tgtcggatct gagtctcagt gccggagcaa tcactcccac ctcccgtcct aggtccaggt 5940

      tacgtacaca gaagattgtc tccgaggaaa gtccctccca gccatccagc ttgcttcgat 6000

      caggcattgg tagtgtgcgg cgtcatatgg cattcagaga catgaatagt atgaaacggc 6060

      agccgtcagt tgctcgtcgc ggccgcagct tggcgtaatc atggtcatag ctgtttcctg 6120

      tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 6180

      aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 6240

      ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 6300

      gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 6360

      tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 6420

      aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 6480

      gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 6540

      aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 6600

      ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 6660

      tgtccgcctt tttcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 6720

      tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 6780

      ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 6840

      tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 6900

      ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 6960

      tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 7020

      aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 7080

      aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 7140

      aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 7200

      ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 7260

      acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 7320

      ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 7380

      gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 7440

      taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 7500

      tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 7560

      gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 7620

      cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 7680

      aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 7740

      cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 7800

      tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 7860

      gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 7920

      tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 7980

      gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 8040

      ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 8100

      cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 8160

      agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 8220

      gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 8280

      tgacattaac ctataaaaa 8299

      <210> 30

      <211> 8614

      <212> DNA

      <213> 人工序列

      <220>

      <223> 質粒 pDAU724

      <400> 30

      gaattcgagc tcggtacctt gaagttccta ttccgagttc ctattctcta gaaagtatag 60

      gaacttcagt acccgggtat aagctagctt ccgttaaatt gccgtcgtca gccgttaaat 120

      taccgattaa tcccgataaa tttccgagat ctccgttaaa ttgccgttcg cagccgttaa 180

      attaccgggg acgaccgata aatttccgcg atgaattcat ggtgttttga tcattttaaa 240

      tttttatatg gcgggtggtg ggcaactcgc ttgcgcgggc aactcgctta ccgattacgt 300

      tagggctgat atttacgtaa aaatcgtcaa gggatgcaag accaaaccgt taaatttccg 360

      gagtcaacag catccaagcc caagtccttc acggagaaac cccagcgtcc acatcacgag 420

      cgaaggacca cctctaggca tcggacgcac catccaatta gaagcagcaa agcgaaacag 480

      cccaagaaaa aggtcggccc gtcggccttt tctgcaacgc tgatcacggg cagcgatcca 540

      accaacaccc tccagagtga ctaggggcgg aaatttatcg ggattaattt ccactcaacc 600

      acaaatcaca gtcgtccccg gtaatttaac ggctgcagac ggcaatttaa cggcttctgc 660

      gaatcgcttg gattccccgc ccctggccgt agagcttaaa gtatgtccct tgtcgatgcg 720

      atgtatcaca acatataaat actggcaagg gatgccatgc ttggagtttc caactcaatt 780

      tacctctatc cacacttctc ttccttcctc aatcctctat atacacaact ggggatccac 840

      catgaggagc tcccttgtgc tgttctttgt ctctgcgtgg acggccttgg ccagtcctat 900

      tcgtcgagag gtctcgcagg atctgtttaa ccagttcaat ctctttgcac agtattctgc 960

      agccgcatac tgcggaaaaa acaatgatgc cccagctggt acaaacatta cgtgcacggg 1020

      aaatgcctgc cccgaggtag agaaggcgga tgcaacgttt ctctactcgt ttgaagactc 1080

      tggagtgggc gatgtcaccg gcttccttgc tctcgacaac acgaacaaat tgatcgtcct 1140

      ctctttccgt ggctctcgtt ccatagagaa ctggatcggg aatcttaact tcgacttgaa 1200

      agaaataaat gacatttgct ccggctgcag gggacatgac ggcttcactt cgtcctggag 1260

      gtctgtagcc gatacgttaa ggcagaaggt ggaggatgct gtgagggagc atcccgacta 1320

      tcgcgtggtg tttaccggac atagcttggg tggtgcattg gcaactgttg ccggagcaga 1380

      cctgcgtgga aatgggtatg atatcgacgt gttttcatat ggcgcccccc gagtcggaaa 1440

      cagggctttt gcagaattcc tgaccgtaca gaccggcgga acactctacc gcattaccca 1500

      caccaatgat attgtcccta gactcccgcc gcgcgaattc ggttacagcc attctagccc 1560

      agagtactgg atcaaatctg gaacccttgt ccccgtcacc cgaaacgata tcgtgaagat 1620

      agaaggcatc gatgccaccg gcggcaataa ccagcctaac attccggata tccctgcgca 1680

      cctatggtac ttcgggttaa ttgggacatg tctttagtgg ccggcgcggc tgggtcgact 1740

      ctagcgagct cgagatctag agggtgactg acacctggcg gtagacaatc aatccatttc 1800

      gctatagtta aaggatgggg atgagggcaa ttggttatat gatcatgtat gtagtgggtg 1860

      tgcataatag tagtgaaatg gaagccaagt catgtgattg taatcgaccg acggaattga 1920

      ggatatccgg aaatacagac accgtgaaag ccatggtctt tccttcgtgt agaagaccag 1980

      acagacagtc cctgatttac ccttgcacaa agcactagaa aattagcatt ccatccttct 2040

      ctgcttgctc tgctgatatc actgtcattc aatgcatagc catgagctca tcttagatcc 2100

      aagcacgtaa ttccatagcc gaggtccaca gtggagcagc aacattcccc atcattgctt 2160

      tccccagggg cctcccaacg actaaatcaa gagtatatct ctaccgtcca atagatcgtc 2220

      ttcgcttcaa aatctttgac aattccaaga gggtccccat ccatcaaacc cagttcaata 2280

      atagccgaga tgcatggtgg agtcaattag gcagtattgc tggaatgtcg gggccagttg 2340

      gccgggtggt cattggccgc ctgtgatgcc atctgccact aaatccgatc attgatccac 2400

      cgcccacgag gcgcgtcttt gctttttgcg cggcgtccag gttcaactct ctcttaatta 2460

      atgtacatta gtgatacccc actctaagaa aatagaccaa tctccagctg caccttcaga 2520

      cactccggta caaattctcg tctatgttgg agattgttgt gactttgaaa catgaccctt 2580

      gaccctgatt ttgaatttgt ccatatatcg aggcaggtgt cttattcgta cggagagggt 2640

      atctgtcgta gacacatagt agtagtcatt tcgagtgctg aatttataaa tcgcatcata 2700

      cttgcgacat actgccataa aaggagtacg tatccaccac tacttattgc gcaccaacac 2760

      gcttcaggta tgcatcccat ccctccttct ggtactgctt cgccgcctcc acgggatcag 2820

      gagcagcata aattccacgg ccagcaataa taaagtcggc accgcgtcca acagccgact 2880

      caggagtttg gtactgctgt cccagcttgt cacccttcga ggagaggttg acacctgtcg 2940

      tgaagacgac aaaatcttcc tcctccgaag gcgagctaac ttcagactga acctcgccaa 3000

      ggtgacgtgt cgagacgaat cccatcacaa acttcttata cttccgagca tagtcaacag 3060

      aagaagtagt atattgaccg gtagccaaag atcccttgga ggtcatctcc gcaaggatca 3120

      aaaggcccct ctcggagccg taggggaagt cctcggccga agcagtctgg gccagagcct 3180

      cgacgatacc ctcaccgggc agaatactgc agttgatgat gtgggcccac tcagagatac 3240

      gcagagtgcc gccatggtac tgcttttgga ctgtgtttcc gatatcgatg aacttgcgat 3300

      cttcgaagat gaggaaattg tgcttctctg caagggcctt cagaccggtg atggtttctt 3360

      cgctgaaatc ggagaggata tcgatgtgag ttttgatcac ggcaatgtac ggaccgagtc 3420

      ctgttatata atccaccatt aaccattact agatcacatg taagtggcat tgaagttcct 3480

      atactatttg aagaatagga actcggaata ggaacttcaa cgtacgattt tgacatttgc 3540

      tccattgtcg aggatggatg gaacgagcgg cgtgcgccac gaaagtgagg ctattgccta 3600

      tcagctcttt gctacattcc ggaaacaaac atcccttttt gtgaattatc tacgcaactt 3660

      agatggcgtg aacgcatctt caaagtcttt cggcaggtcc ggcacgactt ttgcatccag 3720

      agaagcgcct acatgtgtat tcgaccacct cctagcgcgc ttggatatga ggaaatatta 3780

      ctgagagtcg aaaacaagct ccaccgcacc agctcttctt ggagttttat attaaagaat 3840

      attcccagct cgttgtatta ttctttttct accgtgctaa tgtatcaagg actttggtac 3900

      ctattaacgt tattattcgt gtgctattcc caaacataac cctgtatatg tttcgaacgc 3960

      cgttatgacc catgtcttac atactcatta agtcattccc ttggataatc tcgactcaga 4020

      tgcggcggtt gatgtaggag gagaggtaat cgaggacctc ctgggagatg atgccgttcc 4080

      aggcggggta gcggatggag ccctcggcgg agcccttgag ctgctcgata tgctgccact 4140

      cctcgatggg gttggtctca tccttgaggg cgatcatctc cttggagatg ggatcgtagg 4200

      cgtagtagcg ggagactagt gcgaagtaat gatcggggat ggcggtgatc tgatgggtgt 4260

      aggtggtgcg ggcgacggcg gaggcgcgct tatcggacca gttgccgacg acgttggtga 4320

      gctcggtgag gcccttcatg gagaggaagg aggtcatgag atggcggccg atatgggact 4380

      tggggccgtt cttgatggcg aagatggagt agggggcgtt cttcttgagg gccttgttgt 4440

      aggagcggac gaggttatcc ttgaggagct ggtactcctg cttgttggag gaggagttgc 4500

      cggtgcggtt gacgcgcttg aggacgggct cggagttgcg gaggaactca tcgaggtaga 4560

      cgaggggatc gatgcggccg cgggcggaga agaagtagat atggcgggag acggaggtct 4620

      tggtctcggt gacgaggcac tggatgatga cgccgaggta cttgttctgg acgagcttga 4680

      aggacttggg atcgacgttc ttgatatcgg agaagcggcc gcagttgatg aaggtggcga 4740

      ggaagaggaa ctggtagagg gtcttggtct tggtgaagcg ggaggtgtac tcgaaggagt 4800

      tgaggatctt ctcggtgatc tcccagatgg actcgccctc ggagaggagg gccttgagca 4860

      tcttcttgga atgggagttg cccttatcgg cctcctcgga ggactcgaac tggagctgga 4920

      gggaggagac gatatcggtg atatcggact gatgcttctg gccgtagtag gggatgatgg 4980

      tgaactccca ggcggggatg agcttcttga gggaggcctc caggatggtg gccttctggg 5040

      tcttgtactt gaactggagg gacttgttga cgatatcgaa ggagagggag ttggagatga 5100

      tggtgttgta ggacatgaag gtggcgcgct tgatggcggt gccgttatgg gtgatcatcc 5160

      agcagaggta ggtgagctcg gcggcgcaga gggcgatctt ctcgccggag gggcgctcga 5220

      agcgctcgac gaactggcgg acgaggacct tggggggggt cttgcagagg atatcgaact 5280

      ggggcatggt gctcagatac tacggctgat cgcgtagagg tactgagcaa aacagatgtc 5340

      agtaaggaga agagttgaat gaatggaaga agagtaggaa aggaggtatg ggggaaagat 5400

      atacgtactg atgcggacga agagagaaag aaggaaaaaa gttgtgggag gggaaggagg 5460

      gggaatcctt atatggaggg gcaagcgaga aggcgaatta gtgggcgggc ttaagccctc 5520

      gaccgccgcc cttatcattg gacatggagg ggtaatgccc ccaccacgca tgtgcgggac 5580

      cgacgcagaa tctgcacggc ggagtctctt ccagactgtt gacttttggg cgatgactct 5640

      tgttgctgcg gccttttggg tacaccaacc tcgttgatct tgtttccttg gttctctttc 5700

      gctcggagac ccgaccatga ccccaccatc agtcactatc ctgcctcgtc gataaaaatt 5760

      ttttcttccc tctgattgtt acatagtatg tttccacctt tccggtggat ttcggacagt 5820

      caaactgggc atcaacgcag tggtgggctg cttcgtttgc tgcgtgttgt acttgtttgc 5880

      atttgaaccc cgcggtcgtt cgagtcctta attggtccgc tcccggtcaa cacccaagca 5940

      gctgtggccc ggccgagtgg cgcctgtctg gtccacagta agcttggcgt aatcatggtc 6000

      atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 6060

      aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 6120

      gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg 6180

      ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga 6240

      ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 6300

      acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 6360

      aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 6420

      tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 6480

      aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 6540

      gcttaccgga tacctgtccg cctttttccc ttcgggaagc gtggcgcttt ctcatagctc 6600

      acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 6660

      accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 6720

      ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 6780

      gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 6840

      aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 6900

      ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 6960

      gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 7020

      cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 7080

      cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 7140

      gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 7200

      tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 7260

      gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 7320

      agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 7380

      tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 7440

      agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 7500

      gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 7560

      catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 7620

      ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 7680

      atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 7740

      tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 7800

      cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 7860

      cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 7920

      atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 7980

      aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 8040

      ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 8100

      aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga 8160

      aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct 8220

      cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg agacggtcac 8280

      agcttgtctg taagcggatg ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt 8340

      tggcgggtgt cggggctggc ttaactatgc ggcatcagag cagattgtac tgagagtgca 8400

      ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca tcaggcgcca 8460

      ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 8520

      acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 8580

      ttcccagtca cgacgttgta aaacgacggc cagt 8614

      <210> 31

      <211> 876

      <212> DNA

      <213> 人工序列

      <220>

      <223> 密碼子優(yōu)化的 VaXET16 開放閱讀框

      <400> 31

      atgggctcgt ccctctggac ttgtttgatc ctcctctcct tggcatcggc atccttcgca 60

      gcgaaccctc gaactccgat cgatgtgcct ttcggacgga actacgtgcc gacatgggca 120

      ttcgaccaca ttaagtattt gaacggaggc tcggagatcc agttgcatct cgacaagtac 180

      accggcactg gtttccagtc gaagggctcc tacttgttcg gacatttctc catgtacatc 240

      aaattggtgc ctggtgactc ggcaggaact gtcaccgcat tctacctctc gtcgacaaac 300

      gcagagcatg acgaaatcga cttcgagttc ctcggcaaca ggacaggaca gccgtacatc 360

      ctccagacca acgtcttcac aggaggcaaa ggtgatcggg aacagcggat ctacttgtgg 420

      ttcgatccca caacccagta ccataggtac tcggtgctct ggaacatgta tcagatcgtc 480

      ttctacgtcg acgattatcc gatccgagtg ttcaagaact ccaacgactt gggcgtcaaa 540

      ttccccttca accagcccat gaagatttac aactcgttgt ggaacgccga cgattgggca 600

      accaggggtg gtctcgagaa gacagattgg tcgaaagcac ctttcatcgc gtcgtacaag 660

      ggtttccaca tcgacggatg tgaagcctcc gtgaacgcca agttctgtga cacccagggc 720

      aaacgatggt gggatcagcc ggaattccgg gatttggatg cagcccagtg gcagaagctc 780

      gcgtgggtca ggaacaagta caccatctat aactactgta ccgatcggaa acgatattcg 840

      caggtgcctc ccgagtgtac acgcgatagg gacatc 876

      <210> 32

      <211> 292

      <212> PRT

      <213> 豇豆屬

      <400> 32

      Met Gly Ser Ser Leu Trp Thr Cys Leu Ile Leu Leu Ser Leu Ala Ser

      1 5 10 15

      Ala Ser Phe Ala Ala Asn Pro Arg Thr Pro Ile Asp Val Pro Phe Gly

      20 25 30

      Arg Asn Tyr Val Pro Thr Trp Ala Phe Asp His Ile Lys Tyr Leu Asn

      35 40 45

      Gly Gly Ser Glu Ile Gln Leu His Leu Asp Lys Tyr Thr Gly Thr Gly

      50 55 60

      Phe Gln Ser Lys Gly Ser Tyr Leu Phe Gly His Phe Ser Met Tyr Ile

      65 70 75 80

      Lys Leu Val Pro Gly Asp Ser Ala Gly Thr Val Thr Ala Phe Tyr Leu

      85 90 95

      Ser Ser Thr Asn Ala Glu His Asp Glu Ile Asp Phe Glu Phe Leu Gly

      100 105 110

      Asn Arg Thr Gly Gln Pro Tyr Ile Leu Gln Thr Asn Val Phe Thr Gly

      115 120 125

      Gly Lys Gly Asp Arg Glu Gln Arg Ile Tyr Leu Trp Phe Asp Pro Thr

      130 135 140

      Thr Gln Tyr His Arg Tyr Ser Val Leu Trp Asn Met Tyr Gln Ile Val

      145 150 155 160

      Phe Tyr Val Asp Asp Tyr Pro Ile Arg Val Phe Lys Asn Ser Asn Asp

      165 170 175

      Leu Gly Val Lys Phe Pro Phe Asn Gln Pro Met Lys Ile Tyr Asn Ser

      180 185 190

      Leu Trp Asn Ala Asp Asp Trp Ala Thr Arg Gly Gly Leu Glu Lys Thr

      195 200 205

      Asp Trp Ser Lys Ala Pro Phe Ile Ala Ser Tyr Lys Gly Phe His Ile

      210 215 220

      Asp Gly Cys Glu Ala Ser Val Asn Ala Lys Phe Cys Asp Thr Gln Gly

      225 230 235 240

      Lys Arg Trp Trp Asp Gln Pro Glu Phe Arg Asp Leu Asp Ala Ala Gln

      245 250 255

      Trp Gln Lys Leu Ala Trp Val Arg Asn Lys Tyr Thr Ile Tyr Asn Tyr

      260 265 270

      Cys Thr Asp Arg Lys Arg Tyr Ser Gln Val Pro Pro Glu Cys Thr Arg

      275 280 285

      Asp Arg Asp Ile

      290

      <210> 33

      <211> 50

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 615726 (正義)

      <400> 33

      accgggagga aggctggaaa gcttacgaga aaagagttgg actttgaggg 50

      <210> 34

      <211> 40

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 615728 (反義)

      <400> 34

      tgagcgagga agcggaagag cgcccaatac gcaaaccgcc 40

      <210> 35

      <211> 40

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 615729 (正義)

      <400> 35

      tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 40

      <210> 36

      <211> 68

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 615731 (反義)

      <400> 36

      tatactttct agagaatagg aactcggaat aggaacttca aggaacaaca ctcaacccta 60

      tctcggtc 68

      <210> 37

      <211> 67

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 615730 (正義)

      <400> 37

      tccgagttcc tattctctag aaagtatagg aacttcgcat ttatcagggt tattgtctca 60

      tgagcgg 67

      <210> 38

      <211> 41

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 615611 (反義)

      <400> 38

      tctagatctc gagtcagatg tccctatcgc gtgtacactc g 41

      <210> 39

      <211> 45

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 615610 (正義)

      <400> 39

      acacgcgata gggacatctg actcgagatc tagagggtga ctgac 45

      <210> 40

      <211> 40

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 615727 (反義)

      <400> 40

      aactcttttc tcgtaagctt tccagccttc ctcccggtac 40

      <210> 41

      <211> 80

      <212> DNA

      <213> 人工序列

      <220>

      <223> 正向引物

      <400> 41

      cgaattctgc attgaagttc ctattccgag ttcctattct tcaaatagta taggaacttc 60

      agatatccat cacactggcg 80

      <210> 42

      <211> 80

      <212> DNA

      <213> 人工序列

      <220>

      <223> 反向引物

      <400> 42

      gccagtgtga tggatatctg aagttcctat actatttgaa gaataggaac tcggaatagg 60

      aacttcaatg cagaattcgc 80

      <210> 43

      <211> 63

      <212> DNA

      <213> 人工序列

      <220>

      <223> 正向引物

      <400> 43

      atatccatca cactggcggc cgctcaactc tctcctctag gttgaagttc ctattccgag 60

      ttc 63

      <210> 44

      <211> 45

      <212> DNA

      <213> 人工序列

      <220>

      <223> 反向引物

      <400> 44

      aggatgcatg ctcgagcatg cactagctag ttgaagttcc tatac 45

      <210> 45

      <211> 45

      <212> DNA

      <213> 人工序列

      <220>

      <223> 正向引物

      <400> 45

      caccctctgt gtattgcacc atgccccagt tcgatatcct ctgca 45

      <210> 46

      <211> 43

      <212> DNA

      <213> 人工序列

      <220>

      <223> 反向引物

      <400> 46

      aaactctagg atgcatgcaa gtgaggctat tgcctatcag ctc 43

      <210> 47

      <211> 38

      <212> DNA

      <213> 人工序列

      <220>

      <223> 正向引物

      <400> 47

      catcacactg gcggccgcga attctaggct aggtatgc 38

      <210> 48

      <211> 20

      <212> DNA

      <213> 人工序列

      <220>

      <223> 反向引物

      <400> 48

      ggtgcaatac acagagggtg 20

      <210> 49

      <211> 39

      <212> DNA

      <213> 人工序列

      <220>

      <223> 正向引物

      <400> 49

      accgcggact gcgcaccatg agattcggtt ggctcgagg 39

      <210> 50

      <211> 38

      <212> DNA

      <213> 人工序列

      <220>

      <223> 反向引物

      <400> 50

      ttcgccacgg agcttactag tagacacggg gcagaggc 38

      <210> 51

      <211> 41

      <212> DNA

      <213> 人工序列

      <220>

      <223> 正向引物

      <400> 51

      cgtgtttctt cccattcgca tgcgacctcg tggtcattga c 41

      <210> 52

      <211> 49

      <212> DNA

      <213> 人工序列

      <220>

      <223> 反向引物

      <400> 52

      gctttgacgt tacattgacg tacttataag cggccgccag tgtgatgga 49

      <210> 53

      <211> 49

      <212> DNA

      <213> 人工序列

      <220>

      <223> 正向引物

      <400> 53

      tccatcacac tggcggccgc ttataagtac gtcaatgtaa cgtcaaagc 49

      <210> 54

      <211> 48

      <212> DNA

      <213> 人工序列

      <220>

      <223> 反向引物

      <400> 54

      tgcagaggat atcgaactgg ggcattttgt atctgcgaat tgagcttg 48

      <210> 55

      <211> 48

      <212> DNA

      <213> 人工序列

      <220>

      <223> 正向引物

      <400> 55

      caagctcaat tcgcagatac aaaatgcccc agttcgatat cctctgca 48

      <210> 56

      <211> 41

      <212> DNA

      <213> 人工序列

      <220>

      <223> 反向引物

      <400> 56

      gctgtttaaa ctctaggatg catgcaagtg aggctattgc c 41

      <210> 57

      <211> 41

      <212> DNA

      <213> 人工序列

      <220>

      <223> 正向引物

      <400> 57

      cgtgtttctt cccattcgca tgcgacctcg tggtcattga c 41

      <210> 58

      <211> 48

      <212> DNA

      <213> 人工序列

      <220>

      <223> 反向引物

      <400> 58

      tgcagaggat atcgaactgg ggcattttgt atctgcgaat tgagcttg 48

      <210> 59

      <211> 28

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 1208187

      <400> 59

      gattgagttg aaactgccta agatctcg 28

      <210> 60

      <211> 63

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 1208194

      <400> 60

      ctatactttc tagagaatag gaactcggaa taggaacttc aaggtgcgca gtccgcggtt 60

      gac 63

      <210> 61

      <211> 62

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 1208195

      <400> 61

      ctattccgag ttcctattct ctagaaagta taggaacttc ggcgttgtta catctccctg 60

      ag 62

      <210> 62

      <211> 40

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 1208196

      <400> 62

      gcgtcaggct ttcgccacgt ctacgccagg accgagcaag 40

      <210> 63

      <211> 20

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 069134

      <400> 63

      cgcaatctat cgaatagcag 20

      <210> 64

      <211> 25

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 067947

      <400> 64

      ctacatcgaa gctgaaagca cgaga 25

      <210> 65

      <211> 31

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 069860

      <400> 65

      cttctatctt gggatgcttc acgatacgtg a 31

      <210> 66

      <211> 25

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 069861

      <400> 66

      cgcgcccttg aatatcggag aaggt 25

      <210> 67

      <211> 22

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 0610249

      <400> 67

      gagaacacag tgagaccata gc 22

      <210> 68

      <211> 22

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 0610250

      <400> 68

      tctcaaccca atcagcaaca tg 22

      <210> 69

      <211> 3021

      <212> DNA

      <213> 黑曲霉

      <400> 69

      atgcgccaca gcatcggatt ggcagcggcc ctactggcac caaccctacc tgtagcgttg 60

      ggtcaatata ttcgagactt aagcaccgag aaatggactc tcagtagtcg agccttgaat 120

      cggacagtac ctgctcaatt tccatcgcag gttcacttag atctactaag ggccggagtg 180

      attggtgagt actatttgga agtcaagtcc tgtgagtata caaccgctaa cagcctcaat 240

      agatgatccg taagtgactt catctgccat ggatgagaat tgaatcgcac taaatattgc 300

      tggagatacc atggtttgaa cgatttcaat cttcgctgga tcgctgctgc caactggact 360

      tataccagtc aacccatcaa aggcctgtga gtcgctgtga agtttgtgca atgtcgttcg 420

      acaatactaa gaaccaatag cctggacaat tacgactcaa cttggctcgt gtttgacgga 480

      ctggacactt tcgcaacaat ctcattctgt gggcagcaaa tcgcatccac ggacaatcag 540

      tttcgccagt atgcgttcga tgtatccacc gcactagggt cctgcaaagg agatcctgtt 600

      ctgagcatca actttggaag cgcaccgaat attgttgatg ctatcgcaca ggactctaat 660

      tcgcaaagta agtttcagag gtgggggact gccgaagttg ttacatgcta attgtatata 720

      gaatggcccg atgacgtcca actcacctac gagtacccaa atcggtggtt tatgcgcaaa 780

      gaacaatcgg acttcggatg ggattggggt ccagcatttg cccctgcagg tccatggaag 840

      cctgcatata ttgttcagct agacaagaaa gaaagtgtct atgtcctgaa cacggatttg 900

      gatatatacc gaaagggcca aattaactac cttccgccag accagagcca accttgggtc 960

      gtcaacgcta gcattgacat tttgggtcca ctacctacca aaccaaccat gtcgattgaa 1020

      gtgcgcgata ctcattctgg cacgattctt acttcgcgga ctctgaacaa tgtcagtgtg 1080

      gctggtaatg ccataactgg tgtcaccgtt ctcgacgggc tgaccccgaa actgtggtgg 1140

      ccgcaaggcc tcggtgatca gaacctctac aatgtttcta tcactgtcca aagtagagga 1200

      aaccagaccg tggccagtgt gaacaaacgg acgggcttcc gcaccatttt tctcaaccag 1260

      cgcaacatta ctgaagcaca gcgtgcgcaa ggaatcgccc ctggagcaaa ctggcacttt 1320

      gaagtcaacg gtcatgagtt ctacgcaaaa ggatcgaacc ttatcccacc agacagtttc 1380

      tggacccgtg ttacagaaga gaagatgtca cggctattcg atgcagtggt cgttggaaac 1440

      cagaatatgc tccgtgtctg gtcctccggc gcgtacctgc atgactacat ctatgatctg 1500

      gccgatgaaa agggcattct cttatggagc gagttcgagt tcagtgacgc tttatatccc 1560

      tccgacgacg ctttcctcga gaacgttgct gctgagatag tatacaatgt tcgacgagtg 1620

      aaccaccatc cctccttggc tctatgggct ggcggaaatg aaatcgaatc cttgatgctc 1680

      ccacgtgtca aagatgcagc cccatcttca tattcctact atgtgggcga gtatgagaag 1740

      atgtacatta gcctcttctt gcctctggtc tacgagaaca cgcgttccat ctcatactcc 1800

      cccagcagca caaccgaagg ctacctgtac attgaccttt ctgcccctgt cccaatggct 1860

      gaacgttacg acaacactac ctccggctca tactacggcg atacagacca ctacgactac 1920

      gacactagcg tggcgtttga ctacggttcc tatccggtag gccgctttgc caacgaattc 1980

      ggcttccaca gcatgcccag cctccagaca tggcaacaag ctgtcgacac tgaggatctt 2040

      tacttcaaca gcagcgtcgt catgctgcgc aaccaccacg atcccgcagg tggtctcatg 2100

      acggacaact acgcgaactc ggccactggc atgggcgaaa tgaccatggg cgtggtaagc 2160

      tactatccga taccgagtaa atccgaccac atctccaact tcagcgcctg gtgccatgcc 2220

      acccagctct ttcaggcaga catgtacaaa agtcagatcc agttctaccg tcgtggaagt 2280

      ggcatgcccg agcgccagct tggctccttg tattggcagc tcgaagatat ctggcaagcg 2340

      ccatcatggg caggcattga gtacggtggt agatggaagg tccttcacca cgttatgaga 2400

      gatatctatc agcctgttat tgtttcacct ttttggaact atactaccgg ctcgttggat 2460

      gtctatgtta cttccgatct gtggagccct gcagcaggta ctgtcgactt gacctggttg 2520

      gacctgtccg gccgccctat tgcgggtaac gcgggcacgc caaaatctgt tccctttacc 2580

      gtgggaggtc tcaacagcac tcgcatctat gggacgaatg tttcttctct gggcttgccg 2640

      gatactaaag atgctgttct gatcctctcg ctctcggctc acggccgtct tccgaactca 2700

      gaccggacca ccaacttgac tcatgagaat tacgctacgc tttcttggcc caaggatttg 2760

      aagattgttg acccgggact taagatagga cacagctcaa agaagacaac cgttacggtg 2820

      gaagctacat ccggtgtttc attgtacacc tggctcgact acccagaggg tgtggtggga 2880

      tactttgaag agaatgcctt cgtcttagca ccaggcgaga agaaagagat tagttttact 2940

      gttctagagg acactactga cggggcttgg gtccgtaaca tcaccgtcca gagtctctgg 3000

      gaccaaaagg ttcgcggttg a 3021

      <210> 70

      <211> 931

      <212> PRT

      <213> 黑曲霉

      <400> 70

      Met Arg His Ser Ile Gly Leu Ala Ala Ala Leu Leu Ala Pro Thr Leu

      1 5 10 15

      Pro Val Ala Leu Gly Gln Tyr Ile Arg Asp Leu Ser Thr Glu Lys Trp

      20 25 30

      Thr Leu Ser Ser Arg Ala Leu Asn Arg Thr Val Pro Ala Gln Phe Pro

      35 40 45

      Ser Gln Val His Leu Asp Leu Leu Arg Ala Gly Val Ile Gly Glu Tyr

      50 55 60

      His Gly Leu Asn Asp Phe Asn Leu Arg Trp Ile Ala Ala Ala Asn Trp

      65 70 75 80

      Thr Tyr Thr Ser Gln Pro Ile Lys Gly Leu Leu Asp Asn Tyr Asp Ser

      85 90 95

      Thr Trp Leu Val Phe Asp Gly Leu Asp Thr Phe Ala Thr Ile Ser Phe

      100 105 110

      Cys Gly Gln Gln Ile Ala Ser Thr Asp Asn Gln Phe Arg Gln Tyr Ala

      115 120 125

      Phe Asp Val Ser Thr Ala Leu Gly Ser Cys Lys Gly Asp Pro Val Leu

      130 135 140

      Ser Ile Asn Phe Gly Ser Ala Pro Asn Ile Val Asp Ala Ile Ala Gln

      145 150 155 160

      Asp Ser Asn Ser Gln Lys Trp Pro Asp Asp Val Gln Leu Thr Tyr Glu

      165 170 175

      Tyr Pro Asn Arg Trp Phe Met Arg Lys Glu Gln Ser Asp Phe Gly Trp

      180 185 190

      Asp Trp Gly Pro Ala Phe Ala Pro Ala Gly Pro Trp Lys Pro Ala Tyr

      195 200 205

      Ile Val Gln Leu Asp Lys Lys Glu Ser Val Tyr Val Leu Asn Thr Asp

      210 215 220

      Leu Asp Ile Tyr Arg Lys Gly Gln Ile Asn Tyr Leu Pro Pro Asp Gln

      225 230 235 240

      Ser Gln Pro Trp Val Val Asn Ala Ser Ile Asp Ile Leu Gly Pro Leu

      245 250 255

      Pro Thr Lys Pro Thr Met Ser Ile Glu Val Arg Asp Thr His Ser Gly

      260 265 270

      Thr Ile Leu Thr Ser Arg Thr Leu Asn Asn Val Ser Val Ala Gly Asn

      275 280 285

      Ala Ile Thr Gly Val Thr Val Leu Asp Gly Leu Thr Pro Lys Leu Trp

      290 295 300

      Trp Pro Gln Gly Leu Gly Asp Gln Asn Leu Tyr Asn Val Ser Ile Thr

      305 310 315 320

      Val Gln Ser Arg Gly Asn Gln Thr Val Ala Ser Val Asn Lys Arg Thr

      325 330 335

      Gly Phe Arg Thr Ile Phe Leu Asn Gln Arg Asn Ile Thr Glu Ala Gln

      340 345 350

      Arg Ala Gln Gly Ile Ala Pro Gly Ala Asn Trp His Phe Glu Val Asn

      355 360 365

      Gly His Glu Phe Tyr Ala Lys Gly Ser Asn Leu Ile Pro Pro Asp Ser

      370 375 380

      Phe Trp Thr Arg Val Thr Glu Glu Lys Met Ser Arg Leu Phe Asp Ala

      385 390 395 400

      Val Val Val Gly Asn Gln Asn Met Leu Arg Val Trp Ser Ser Gly Ala

      405 410 415

      Tyr Leu His Asp Tyr Ile Tyr Asp Leu Ala Asp Glu Lys Gly Ile Leu

      420 425 430

      Leu Trp Ser Glu Phe Glu Phe Ser Asp Ala Leu Tyr Pro Ser Asp Asp

      435 440 445

      Ala Phe Leu Glu Asn Val Ala Ala Glu Ile Val Tyr Asn Val Arg Arg

      450 455 460

      Val Asn His His Pro Ser Leu Ala Leu Trp Ala Gly Gly Asn Glu Ile

      465 470 475 480

      Glu Ser Leu Met Leu Pro Arg Val Lys Asp Ala Ala Pro Ser Ser Tyr

      485 490 495

      Ser Tyr Tyr Val Gly Glu Tyr Glu Lys Met Tyr Ile Ser Leu Phe Leu

      500 505 510

      Pro Leu Val Tyr Glu Asn Thr Arg Ser Ile Ser Tyr Ser Pro Ser Ser

      515 520 525

      Thr Thr Glu Gly Tyr Leu Tyr Ile Asp Leu Ser Ala Pro Val Pro Met

      530 535 540

      Ala Glu Arg Tyr Asp Asn Thr Thr Ser Gly Ser Tyr Tyr Gly Asp Thr

      545 550 555 560

      Asp His Tyr Asp Tyr Asp Thr Ser Val Ala Phe Asp Tyr Gly Ser Tyr

      565 570 575

      Pro Val Gly Arg Phe Ala Asn Glu Phe Gly Phe His Ser Met Pro Ser

      580 585 590

      Leu Gln Thr Trp Gln Gln Ala Val Asp Thr Glu Asp Leu Tyr Phe Asn

      595 600 605

      Ser Ser Val Val Met Leu Arg Asn His His Asp Pro Ala Gly Gly Leu

      610 615 620

      Met Thr Asp Asn Tyr Ala Asn Ser Ala Thr Gly Met Gly Glu Met Thr

      625 630 635 640

      Met Gly Val Val Ser Tyr Tyr Pro Ile Pro Ser Lys Ser Asp His Ile

      645 650 655

      Ser Asn Phe Ser Ala Trp Cys His Ala Thr Gln Leu Phe Gln Ala Asp

      660 665 670

      Met Tyr Lys Ser Gln Ile Gln Phe Tyr Arg Arg Gly Ser Gly Met Pro

      675 680 685

      Glu Arg Gln Leu Gly Ser Leu Tyr Trp Gln Leu Glu Asp Ile Trp Gln

      690 695 700

      Ala Pro Ser Trp Ala Gly Ile Glu Tyr Gly Gly Arg Trp Lys Val Leu

      705 710 715 720

      His His Val Met Arg Asp Ile Tyr Gln Pro Val Ile Val Ser Pro Phe

      725 730 735

      Trp Asn Tyr Thr Thr Gly Ser Leu Asp Val Tyr Val Thr Ser Asp Leu

      740 745 750

      Trp Ser Pro Ala Ala Gly Thr Val Asp Leu Thr Trp Leu Asp Leu Ser

      755 760 765

      Gly Arg Pro Ile Ala Gly Asn Ala Gly Thr Pro Lys Ser Val Pro Phe

      770 775 780

      Thr Val Gly Gly Leu Asn Ser Thr Arg Ile Tyr Gly Thr Asn Val Ser

      785 790 795 800

      Ser Leu Gly Leu Pro Asp Thr Lys Asp Ala Val Leu Ile Leu Ser Leu

      805 810 815

      Ser Ala His Gly Arg Leu Pro Asn Ser Asp Arg Thr Thr Asn Leu Thr

      820 825 830

      His Glu Asn Tyr Ala Thr Leu Ser Trp Pro Lys Asp Leu Lys Ile Val

      835 840 845

      Asp Pro Gly Leu Lys Ile Gly His Ser Ser Lys Lys Thr Thr Val Thr

      850 855 860

      Val Glu Ala Thr Ser Gly Val Ser Leu Tyr Thr Trp Leu Asp Tyr Pro

      865 870 875 880

      Glu Gly Val Val Gly Tyr Phe Glu Glu Asn Ala Phe Val Leu Ala Pro

      885 890 895

      Gly Glu Lys Lys Glu Ile Ser Phe Thr Val Leu Glu Asp Thr Thr Asp

      900 905 910

      Gly Ala Trp Val Arg Asn Ile Thr Val Gln Ser Leu Trp Asp Gln Lys

      915 920 925

      Val Arg Gly

      930

      <210> 71

      <211> 10207

      <212> DNA

      <213> 人工序列

      <220>

      <223> 質粒 pQM27

      <400> 71

      gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc agctggcacg 60

      acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg agttagctca 120

      ctcattaggc accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg 180

      tgagcggata acaatttcac acaggaaaca gctatgacca tgattacgaa ttgtttaaac 240

      gtcgaccgaa tgtaggattg ttatccgaac tctgctcgta gaggcatgtt gtgaatctgt 300

      gtcgggcagg acacgcctcg aaggttcacg gcaagggaaa ccaccgatag cagtgtctag 360

      tagcaacctg taaagccgca atgcagcatc actggaaaat acaaaccaat ggctaaaagt 420

      acataagtta atgcctaaag aagtcatata ccagcggcta ataattgtac aatcaagtgg 480

      ctaaacgtac cgtaatttgc caacggcttg tggggttgca gaagcaacgg caaagcccca 540

      cttccccacg tttgtttctt cactcagtcc aatctcagct ggtgatcccc caattgggtc 600

      gcttgtttgt tccggtgaag tgaaagaaga cagaggtaag aatgtctgac tcggagcgtt 660

      ttgcatacaa ccaagggcag tgatggaaga cagtgaaatg ttgacattca aggagtattt 720

      agccagggat gcttgagtgt atcgtgtaag gaggtttgtc tgccgatacg acgaatactg 780

      tatagtcact tctgatgaag tggtccatat tgaaatgtaa gtcggcactg aacaggcaaa 840

      agattgagtt gaaactgcct aagatctcgg gccctcgggc cttcggcctt tgggtgtaca 900

      tgtttgtgct ccgggcaaat gcaaagtgtg gtaggatcga acacactgct gcctttacca 960

      agcagctgag ggtatgtgat aggcaaatgt tcaggggcca ctgcatggtt tcgaatagaa 1020

      agagaagctt agccaagaac aatagccgat aaagatagcc tcattaaacg gaatgagcta 1080

      gtaggcaaag tcagcgaatg tgtatatata aaggttcgag gtccgtgcct ccctcatgct 1140

      ctccccatct actcatcaac tcagatcctc caggagactt gtacaccatc ttttgaggca 1200

      cagaaaccca atagtcaacc gcggactgcg caccatgcgc cacagcatcg gattggcagc 1260

      ggccctactg gcaccaaccc tacctgtagc gttgggtcaa tatattcgag acttaagcac 1320

      cgagaaatgg actctcagta gtcgagcctt gaatcggaca gtacctgctc aatttccatc 1380

      gcaggttcac ttagatctac taagggccgg agtgattggt gagtactatt tggaagtcaa 1440

      gtcctgtgag tatacaaccg ctaacagcct caatagatga tccgtaagtg acttcatctg 1500

      ccatggatga gaattgaatc gcactaaata ttgctggaga taccatggtt tgaacgattt 1560

      caatcttcgc tggatcgctg ctgccaactg gacttatacc agtcaaccca tcaaaggcct 1620

      gtgagtcgct gtgaagtttg tgcaatgtcg ttcgacaata ctaagaacca atagcctgga 1680

      caattacgac tcaacttggc tcgtgtttga cggactggac actttcgcaa caatctcatt 1740

      ctgtgggcag caaatcgcat ccacggacaa tcagtttcgc cagtatgcgt tcgatgtatc 1800

      caccgcacta gggtcctgca aaggagatcc tgttctgagc atcaactttg gaagcgcacc 1860

      gaatattgtt gatgctatcg cacaggactc taattcgcaa agtaagtttc agaggtgggg 1920

      gactgccgaa gttgttacat gctaattgta tatagaatgg cccgatgacg tccaactcac 1980

      ctacgagtac ccaaatcggt ggtttatgcg caaagaacaa tcggacttcg gatgggattg 2040

      gggtccagca tttgcccctg caggtccatg gaagcctgca tatattgttc agctagacaa 2100

      gaaagaaagt gtctatgtcc tgaacacgga tttggatata taccgaaagg gccaaattaa 2160

      ctaccttccg ccagaccaga gccaaccttg ggtcgtcaac gctagcattg acattttggg 2220

      tccactacct accaaaccaa ccatgtcgat tgaagtgcgc gatactcatt ctggcacgat 2280

      tcttacttcg cggactctga acaatgtcag tgtggctggt aatgccataa ctggtgtcac 2340

      cgttctcgac gggctgaccc cgaaactgtg gtggccgcaa ggcctcggtg atcagaacct 2400

      ctacaatgtt tctatcactg tccaaagtag aggaaaccag accgtggcca gtgtgaacaa 2460

      acggacgggc ttccgcacca tttttctcaa ccagcgcaac attactgaag cacagcgtgc 2520

      gcaaggaatc gcccctggag caaactggca ctttgaagtc aacggtcatg agttctacgc 2580

      aaaaggatcg aaccttatcc caccagacag tttctggacc cgtgttacag aagagaagat 2640

      gtcacggcta ttcgatgcag tggtcgttgg aaaccagaat atgctccgtg tctggtcctc 2700

      cggcgcgtac ctgcatgact acatctatga tctggccgat gaaaagggca ttctcttatg 2760

      gagcgagttc gagttcagtg acgctttata tccctccgac gacgctttcc tcgagaacgt 2820

      tgctgctgag atagtataca atgttcgacg agtgaaccac catccctcct tggctctatg 2880

      ggctggcgga aatgaaatcg aatccttgat gctcccacgt gtcaaagatg cagccccatc 2940

      ttcatattcc tactatgtgg gcgagtatga gaagatgtac attagcctct tcttgcctct 3000

      ggtctacgag aacacgcgtt ccatctcata ctcccccagc agcacaaccg aaggctacct 3060

      gtacattgac ctttctgccc ctgtcccaat ggctgaacgt tacgacaaca ctacctccgg 3120

      ctcatactac ggcgatacag accactacga ctacgacact agcgtggcgt ttgactacgg 3180

      ttcctatccg gtaggccgct ttgccaacga attcggcttc cacagcatgc ccagcctcca 3240

      gacatggcaa caagctgtcg acactgagga tctttacttc aacagcagcg tcgtcatgct 3300

      gcgcaaccac cacgatcccg caggtggtct catgacggac aactacgcga actcggccac 3360

      tggcatgggc gaaatgacca tgggcgtggt aagctactat ccgataccga gtaaatccga 3420

      ccacatctcc aacttcagcg cctggtgcca tgccacccag ctctttcagg cagacatgta 3480

      caaaagtcag atccagttct accgtcgtgg aagtggcatg cccgagcgcc agcttggctc 3540

      cttgtattgg cagctcgaag atatctggca agcgccatca tgggcaggca ttgagtacgg 3600

      tggtagatgg aaggtccttc accacgttat gagagatatc tatcagcctg ttattgtttc 3660

      acctttttgg aactatacta ccggctcgtt ggatgtctat gttacttccg atctgtggag 3720

      ccctgcagca ggtactgtcg acttgacctg gttggacctg tccggccgcc ctattgcggg 3780

      taacgcgggc acgccaaaat ctgttccctt taccgtggga ggtctcaaca gcactcgcat 3840

      ctatgggacg aatgtttctt ctctgggctt gccggatact aaagatgctg ttctgatcct 3900

      ctcgctctcg gctcacggcc gtcttccgaa ctcagaccgg accaccaact tgactcatga 3960

      gaattacgct acgctttctt ggcccaagga tttgaagatt gttgacccgg gacttaagat 4020

      aggacacagc tcaaagaaga caaccgttac ggtggaagct acatccggtg tttcattgta 4080

      cacctggctc gactacccag agggtgtggt gggatacttt gaagagaatg ccttcgtctt 4140

      agcaccaggc gagaagaaag agattagttt tactgttcta gaggacacta ctgacggggc 4200

      ttgggtccgt aacatcaccg tccagagtct ctgggaccaa aaggttcgcg gttgattaat 4260

      taagctccgt ggcgaaagcc tgacgcaccg gtagattctt ggtgagcccg tatcatgacg 4320

      gcggcgggag ctacatggcc ccgggtgatt tatttttttt gtatctactt ctgacccttt 4380

      tcaaatatac ggtcaactca tctttcactg gagatgcggc ctgcttggta ttgcgatgtt 4440

      gtcagcttgg caaattgtgg ctttcgaaaa cacaaaacga ttccttagta gccatgcatt 4500

      ttaagataac ggaatagaag aaagaggaaa ttaaaaaaaa aaaaaaaaca aacatcccgt 4560

      tcataacccg tagaatcgcc gctcttcgtg tatcccagta ccacggcaaa ggtatttcat 4620

      gatcgttcaa tgttgatatt gttcccgcca gtatggctcc acccccatct ccgcgaatct 4680

      cctcttctcg aacgcggtag tggcgcgcca attggtaatg acccataggg agacgaatta 4740

      actagaggtg actgacacct ggcggtagac aatcaatcca tttcgctata gttaaaggat 4800

      ggggatgagg gcaattggtt atatgatcat gtatgtagtg ggtgtgcata atagtagtga 4860

      aatggaagcc aagtcatgtg attgtaatcg accgacggaa ttgaggatat ccggaaatac 4920

      agacaccgtg aaagccatgc tctttccttc gtgtagaaga ccagacagac agtccctgat 4980

      ttacccttgc acaaagcact agaaaattag cattccatcc ttctctgctt gctctgctga 5040

      tatcactgtc attcaatgca tctggaaacg caaccctgaa gggattcttc ctttgagaga 5100

      tggaagcgtg tcatatctct tcggttctac ggcaggtttt tttctgctct ttcgtagcat 5160

      ggcatggtca cttcagcgct tatttacagt tgctggtatt gatttcttgt gcaaattgct 5220

      atctgacact tattagctat ggagtcacca catttcccag caacttcccc acttcctctg 5280

      caatcgccaa cgtcctctct tcactgagtc tccgtccgat aacctgcact gcaaccggtg 5340

      ccccatgata cgcctccgga tcatactctt cctgcacgag ggcatcaagc tcactaaccg 5400

      ccttgaaact ctcattcttc ttatcgatgt tcttatccgc aaaggtaacc ggaacaacca 5460

      cgctcgtgaa atccagcagg ttgatcacag aggcataccc atagtaccgg aactggtcat 5520

      gccgtaccgc agcggtaggc gtaatcggcg cgatgatggc gtccagttcc ttcccggcct 5580

      tttcttcagc ctcccgccat ttctcaaggt actccatctg gtaattccac ttctggagat 5640

      gcgtgtccca gagctcgttc atgttaacag ctttgatgtt cgggttcagt aggtctttga 5700

      tatttggagt cgccggctcg ccggatgcac tgatatcgcg cattacgtcg gcgctgccgt 5760

      cagccgcgta gatatgggag atgagatcgt ggccgaaatc gtgcttgtat ggcgtccacg 5820

      gggtcacggt gtgaccggct ttggcgagtg cggcgacggt ggtttccacg ccgcgcagga 5880

      taggagggtg tggaaggaca ttgccgtcga agttgtagta gccgatattg agcccgccgt 5940

      tcttgatctt ggaggcaata atgtccgact cggactggcg ccagggcatg gggatgacct 6000

      tggagtcgta tttccaaggc tcctgaccga ggacggattt ggtgaagagg cggaggtcta 6060

      acatacttca tcagtgactg ccggtctcgt atatagtata aaaagcaaga aaggaggaca 6120

      gtggaggcct ggtatagagc aggaaaagaa ggaagaggcg aaggactcac cctcaacaga 6180

      gtgcgtaatc ggcccgacaa cgctgtgcac cgtctcctga ccctccatgc tgttcgccat 6240

      ctttgcatac ggcagccgcc catgactcgg ccttagaccg tacaggaagt tgaacgcggc 6300

      cggcactcga atcgagccac cgatatccgt tcctacaccg atgacgccac cacgaatccc 6360

      aacgatcgca ccctcaccac cagaactgcc gccgcacgac cagttcttgt tgcgtgggtt 6420

      gacggtgcgc ccgatgatgt tgttgactgt ctcgcagacc atcagggtct gcgggacaga 6480

      ggtcttgacg tagaagacgg caccggcttt gcggagcatg gttgtcagaa ccgagtcccc 6540

      ttcgtcgtac ttgtttagcc atgagatgta gcccattgat gtttcgtagc cctggtggca 6600

      tatgttagct gacaaaaagg gacatctaac gacttagggg caacggtgta ccttgactcg 6660

      aagctggtct ttgagagaga tggggaggcc atgaagtgga ccaacgggtc tcttgtgctt 6720

      tgcgtagtat tcatcgagtt cccttgcctg cgcgagagcg gcgtcaggga agaactcgtg 6780

      ggcgcagttt gtctgcacag aagccagcgt cagcttgata gtcccataag gtggcgttgt 6840

      tacatctccc tgagaggtag aggggaccct actaactgct gggcgattgc tgcccgttta 6900

      cagaatgcta gcgtaacttc caccgaggtc aactctccgg ccgccagctt ggacacaaga 6960

      tctgcagcgg aggcctctgt gatcttcagt tcggcctctg aaaggatccc cgatttcttt 7020

      gggaaatcaa taacgctgtc ttccgcaggc agcgtctgga ctttccattc atcagggatg 7080

      gtttttgcga ggcgggcgcg cttatcagcg gccagttctt cccaggattg aggcattctg 7140

      tgttagctta tagtcaggat gttggctcga cgagtgtaaa ctgggagttg gcatgagggt 7200

      tatgtaggct tctttagccc cgcatccccc tcattctcct cattgatccc gggggagcgg 7260

      atggtgttga taagagacta attatagggt ttagctggtg cctagctggt gattggctgg 7320

      cttcgccgaa ttttacgggc caaggaaagc tgcagaaccg cggcactggt aaacggtaat 7380

      taagctatca gccccatgct aacgagttta aattacgtgt attgctgata aacaccaaca 7440

      gagctttact gaaagatggg agtcacggtg tggcttcccc actgcgatta ttgcacaagc 7500

      agcgagggcg aacttgactg tcgtcgctga gcagcctgca gtcaaacata catatatatc 7560

      aaccgcgaag acgtctggcc ttgtagaaca cgacgctccc tagcaacacc tgccgtgtca 7620

      gcctctacgg ttgttacttg cattcaggat gctctccagc gggcgagcta ttcaaaatat 7680

      tcaaagcagg tatctcgtat tgccaggatt cagctgaagc aacaggtgcc aaggaaatct 7740

      gcgtcggttc tcatctgggc ttgctcggtc ctggcgtaga atgcatccta gagtttaaac 7800

      agcttggcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa 7860

      cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc 7920

      accgatcgcc cttcccaaca gttgcgcagc ctgaacggcg aatggcgcct gatgcggtat 7980

      tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct cagtacaatc 8040

      tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgcgccc 8100

      tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 8160

      tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg 8220

      atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac gtcaggtggc 8280

      acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat 8340

      atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 8400

      agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 8460

      cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 8520

      gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga gagttttcgc 8580

      cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta 8640

      tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac 8700

      ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa 8760

      ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg 8820

      atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc 8880

      cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg 8940

      atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta 9000

      gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg 9060

      cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 9120

      tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 9180

      tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 9240

      gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 9300

      gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 9360

      atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 9420

      atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 9480

      aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 9540

      aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt gtagccgtag 9600

      ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 9660

      ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 9720

      tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 9780

      ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 9840

      acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 9900

      gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 9960

      cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 10020

      aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 10080

      atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga 10140

      gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg 10200

      gaagagc 10207

      <210> 72

      <211> 46

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 1210956

      <400> 72

      tgattacgaa ttgtttaaac ggatccgaat gtaggattgt tatccg 46

      <210> 73

      <211> 72

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 1201606

      <400> 73

      gaagttccta tactttctag agaataggaa ctcggaatag gaacttcaac cttatgggac 60

      tatcaagctg ac 72

      <210> 74

      <211> 50

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 1210957

      <400> 74

      gttacattga cgtacttata agaagttcct atactttcta gagaatagga 50

      <210> 75

      <211> 357

      <212> DNA

      <213> 人工序列

      <220>

      <223> 里氏木霉cbh1 5' 探針序列

      <400> 75

      tagggtcggc aacggcaaaa aagcacgtgg ctcaccgaaa agcaagatgt ttgcgatcta 60

      acatccagga acctggatac atccatcatc acgcacgacc actttgatct gctgtaaact 120

      cgtattcgcc ctaaaccgaa gtgcgtggta aatctacacg tgggcccctt tcggtatact 180

      gcgtgtgtct tctctaggtg ccattctttt cccttcctct agtgttgaat tgtttgtgtt 240

      ggagtccgag ctgtaactac ctctgaatct ctggagaatg gtggactaac gactaccgtg 300

      cacctgcatc atgtatataa tagtgatcct gagaaggggg gtttggagca atgtggg 357

      <210> 76

      <211> 87

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 1205503

      <400> 76

      gggagatgta acaacgcctt gaagttccta ttccgagttc ctattcttca aatagtatag 60

      gaacttcaac cttatgggac tatcaag 87

      <210> 77

      <211> 87

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 1205504

      <400> 77

      cttgatagtc ccataaggtt gaagttccta tactatttga agaataggaa ctcggaatag 60

      gaacttcaag gcgttgttac atctccc 87

      <210> 78

      <211> 84

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 1205505

      <400> 78

      gcccctaagt cgttagatgt ttgaagttcc tattccgagt tcctattctt caaatagtat 60

      aggaacttca ccctttttgt cagc 84

      <210> 79

      <211> 84

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 1205506

      <400> 79

      gctgacaaaa agggtgaagt tcctatacta tttgaagaat aggaactcgg aataggaact 60

      tcaaacatct aacgacttag gggc 84

      <210> 80

      <211> 83

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 1205507

      <400> 80

      ctataccagg cctccacttg aagttcctat tccgagttcc tattcttcaa atagtatagg 60

      aacttcatgt cctcctttct tgc 83

      <210> 81

      <211> 83

      <212> DNA

      <213> 人工序列

      <220>

      <223> 引物 1205508

      <400> 81

      gcaagaaagg aggacatgaa gttcctatac tatttgaaga ataggaactc ggaataggaa 60

      cttcaagtgg aggcctggta tag 83

      當前第1頁1 2 3 
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1