本申請包括計算機可讀形式的序列表,將其通過引用結合在此。
發(fā)明領域
本發(fā)明涉及用于使用位點特異性重組酶將感興趣的多核苷酸文庫整合到絲狀真菌宿主細胞的染色體中的方法,包括宿主細胞和多核苷酸構建體的多核苷酸文庫表達系統(tǒng),連同包含多核苷酸文庫的所得絲狀真菌宿主細胞及其培養(yǎng)物以生產多肽。
發(fā)明背景
已經發(fā)現(xiàn)大量的天然存在的有機體產生有用的多肽產物,例如酶,希望酶的大規(guī)模生產用于研究和商業(yè)目的。
已經描述了宿主細胞的構建,其中,一個高表達染色體基因被替換為位點特異性重組酶的識別序列,以通過使用重組酶識別所述序列(EP 1 405 908 A1;ProBioGen AG)允許將單一產物編碼多核苷酸后續(xù)插入該位點。
已經披露通過利用自由可逆的位點特異性重組系統(tǒng)在基因組的已知位置插入DNA。這些可逆系統(tǒng)包括以下項:來自細菌噬菌體P1的Cre-lox系統(tǒng);釀酒酵母的FLP-FRT系統(tǒng);魯氏結合酵母(Zygosaccharonzyces rouxii)的R-RS系統(tǒng);來自細菌噬菌體Mu的改良的Gin-gix系統(tǒng);來自枯草芽孢桿菌質粒的β-重組酶-six系統(tǒng)和來自細菌轉座子Tn1000的Δ-γ-res系統(tǒng)。Cre、FLP、R、Gin、β-重組酶和γ-Δ是重組酶,并且lox、FRT、RS、gix、six和res是各自的重組位點(賽杜斯路(Sadowslu)1993年,美國實驗生物學會聯(lián)合會會志(FASEB J.)7:750-67;奧(Ow)和梅德貝里(Medberry)1995年,植物科學評論(Crit.Rev.Plant Sci.)14:239-261作了綜述)。
以上位點特異性重組系統(tǒng)的共同之處在于單一多肽重組酶催化相同或幾乎相同的序列的兩個識別位點之間的重組的屬性。
當克隆和篩選編碼真菌宿主細胞中的感興趣的多肽的多核苷酸時,尤其是當篩選編碼真菌宿主細胞分泌的感興趣的多肽的變體的多核苷酸文庫以改進特性時,希望真菌宿主細胞以可比較的水平表達多核苷酸,這樣使得它們的特性可以被直接測定,而不必首先進行歸一化步驟。這個問題通過使用包括真菌復制起始序列(例如,熟知的AMA1序列)的克隆和表達載體已被解決,例如,在EP 1124949中。
發(fā)明概述
我們在此提供快速并且位點特異性將編碼感興趣的多肽的多核苷酸文庫插入絲狀真菌宿主的染色體中的有效方式,由于所插入的基因在每個轉化和選擇的宿主細胞的精確相同的基因組位置的僅一個單獨的拷貝中的存在,從而實現(xiàn)轉化體中高度一致的表達水平。
所得選擇轉化的細胞甚至可以直接用于以對應于初步篩選的那些的改進的高級表達水平生產編碼選擇的多肽。
因此,在第一方面,本發(fā)明涉及用于使用位點特異性重組酶將感興趣的多核苷酸文庫整合到絲狀真菌宿主細胞的染色體中的方法,所述方法包括以下步驟:
a)提供絲狀真菌宿主細胞,它按以下順序在其染色體中包含:
i)該重組酶的第一識別序列或在整合位點的5’或3’的區(qū)域;
ii)第一選擇標記;
iii)該重組酶的第二識別序列;以及任選地
iv)非功能部分第二選擇標記;
b)用核酸構建體轉化所述宿主細胞,該核酸構建體按以下順序包含:
i)該重組酶的第一識別序列或在整合位點的5’或3’的區(qū)域;
ii)感興趣的多核苷酸文庫;
iii)第二選擇標記或非功能部分第二選擇標記,如果步驟(a)(iv)的相應但任選的非功能第二選擇標記被包括在宿主細胞染色體中的話;和
iv)該重組酶的第二識別序列;
c)在所述宿主細胞中表達編碼該位點特異性重組酶的基因;和
d)選擇轉化的宿主細胞,該宿主細胞表達該第二選擇標記,而不是該第一選擇標記,
其中這一感興趣的多核苷酸文庫是通過該重組酶位點特異性地以正確的方向整合到該宿主細胞的染色體中,由此,從該染色體切離該第一可選擇標記,并且由此任何非功能部分第二可選擇標記被重組,以形成該染色體中的功能第二選擇標記。
在第二方面,本發(fā)明涉及多核苷酸文庫表達系統(tǒng),包括:
a)絲狀真菌宿主細胞,它按以下順序在其染色體中包含:
i)位點特異性重組酶的第一識別序列或在整合位點的5’或3’的區(qū)域;
ii)第一選擇標記;
iii)該重組酶的第二識別序列;以及任選地
iv)非功能部分第二選擇標記;和
b)核酸構建體,該核酸構建體按順序在以下元件中包含:
i)該重組酶的第一識別序列或在整合位點的5’或3’的區(qū)域;
ii)感興趣的多核苷酸文庫;
iii)第二選擇標記或非功能部分第二選擇標記,如果步驟(a)(iv)的任選的非功能第二選擇標記被包括在宿主細胞染色體中的話;和
iv)該重組酶的第二識別序列,和
c)編碼位點特異性重組酶的基因包括在絲狀真菌宿主細胞中;優(yōu)選地在染色體中,在第二核酸構建體中,或在步驟(b)中列出的元件之外的核酸構建體中;
其中,當用這一個或多個核酸構建體轉化宿主細胞時,感興趣的多核苷酸文庫是通過重組酶位點特異性地以正確的方向整合到宿主細胞的染色體中,由此,從染色體切離第一可選擇標記,并由此第二選擇標記也被整合并且表達或任何非功能部分第二可選擇標記被重組,以形成表達的染色體中的功能第二選擇標記。
在第三方面,本發(fā)明涉及所得絲狀真菌宿主細胞,它按以下順序在其染色體中包含:
i)位點特異性重組酶的第一識別序列或在整合位點的5’或3’的區(qū)域;
ii)感興趣的多核苷酸文庫;和
iii)選擇標記和該重組酶的第二識別序列;抑或
iv)第一部分選擇標記,該重組酶的第二識別序列和第二部分選擇標記,
其中該宿主細胞表達該多核苷酸文庫和選擇標記。
在最后方面,本發(fā)明涉及產生感興趣的多肽的方法,該方法包括以下步驟:
a)在有利于產生由多核苷酸文庫編碼的多肽的條件下,培養(yǎng)第三方面的絲狀真菌宿主細胞,并且;任選地
b)回收該多肽。
附圖簡要說明
圖1示出載體p002的示意圖。
圖2示出載體pFRT-GIAMG的示意圖。
圖3示出載體p007的示意圖。
圖4示出載體pFRT-BsAMG的示意圖。
圖5示出載體pDAu571的示意圖。
圖6示出載體pDAu703的示意圖。
圖7示出以下項的示意圖:
-頂端部分:在米曲霉宿主菌株DAu716中的染色體的amy2區(qū)域,其中兩個FRT-位點已被插入;
-中間部分:線性化的載體pDAu724;和
-底部部分:通過各自的FRT-位點之間的雙同源重組的pDAu724的FLP介導的整合后,米曲霉宿主菌株DAu716中的染色體的amy2區(qū)域。
圖8示出載體pDLHD0075的示意圖。
圖9示出質粒pJfyS156的限制性圖譜。
圖10示出pQM43的限制性圖譜。
圖11示出pQM45的限制性圖譜。
定義
胞嘧啶脫氨酶:胞嘧啶脫氨酶(EC 3.5.4.1)催化胞嘧啶和5-氟胞嘧啶(5FC)的脫氨以分別形成尿嘧啶和有毒5-氟尿嘧啶(5FU)。當包含胞嘧啶脫氨酶的遺傳修飾過的細胞與5FC組合時,它被轉化為有毒5FU,因此胞嘧啶脫氨酶編碼基因潛在地是有效的陰性選擇標記。也已示出,嘧啶從頭(de novo)合成途徑中的抑制劑可以用于創(chuàng)造如下條件,在該條件下細胞依賴于通過胞嘧啶脫氨酶進行的嘧啶補充物到尿嘧啶的轉化。因此,只有表達胞嘧啶脫氨酶基因的細胞可以在陽性選擇介質中被解救,該陽性選擇介質包括嘧啶從頭合成抑制劑連同肌苷和胞嘧啶(參見魏(Wei)和休伯(Huber),1996,生物化學雜志(J Biol Chem)271(7):3812的圖1)。抑制劑優(yōu)選N-(磷酸乙酰)-L-天冬氨酸(PALA),它抑制天冬氨酸氨基甲酰轉移酶。如果需要的話,胞嘧啶脫氨酶的活性可以通過基因測定進行定量(弗雷德里科(Frederico)L.A.等人,1990,生物化學(Biochemistry)29:2532-2537)。
等位基因變體:術語“等位基因變體”意指占用同一染色體基因座的一種基因的兩個或更多個替代形式中的任一者。等位基因變異由突變天然產生,并且可以導致群體內多態(tài)性?;蛲蛔兛梢允浅聊?在所編碼的多肽中沒有改變)或可編碼具有改變的氨基酸序列的多肽。多肽的等位基因變體是由基因的等位基因變體編碼的多肽。
催化結構域:術語“催化結構域”意思指酶的包含該酶的催化機器的區(qū)域。
cDNA:術語“cDNA”意指可以通過從得自真核或原核細胞的成熟的、剪接的mRNA分子進行反轉錄而制備的DNA分子。cDNA缺乏可以存在于對應基因組DNA中的內含子序列。早先的初始RNA轉錄本是mRNA的前體,其在呈現(xiàn)為成熟的剪接的mRNA之前要經一系列的步驟進行加工,包括剪接。
編碼序列:術語“編碼序列”意指直接指定一個多肽的氨基酸序列的多核苷酸。編碼序列的邊界一般由開放閱讀框架決定,該開放閱讀框架從起始密碼子(如ATG、GTG或TTG)開始并且以終止密碼子(如TAA、TAG或TGA)結束。編碼序列可以是基因組DNA、cDNA、合成DNA或其組合。
控制序列:術語“控制序列”意指對于表達編碼本發(fā)明的成熟多肽的多核苷酸所必需的核酸序列。每個控制序列對于編碼該多肽的多核苷酸來說可以是天然的(即,來自相同基因)或外源的(即,來自不同基因),或相對于彼此是天然的或外源的。這些調控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉錄終止子。至少,控制序列包括啟動子,以及轉錄和翻譯終止信號。出于引入有利于將這些控制序列與編碼多肽的多核苷酸的編碼區(qū)連接的特異性限制酶切位點的目的,這些控制序列可以提供有多個接頭。
表達:術語“表達”包括涉及多肽產生的任何步驟,包括但不限于,轉錄、轉錄后修飾、翻譯、翻譯后修飾、以及分泌。
表達載體:術語“表達載體”意直鏈性或環(huán)狀DNA分子,該分子包含編碼多肽的多核苷酸并且該多核苷酸可操作地與提供用于其表達的控制序列連接。
片段:術語“片段”是指從成熟多肽或結構域的氨基和/或羧基末端缺失一個或多個(例如,若干個)氨基酸的一種多肽或一個催化或結合結構域;其中該片段已經保留其催化或結合活性。
宿主細胞:術語“宿主細胞”意指易于用包括本發(fā)明的一種多核苷酸的一種核酸構建體或表達載體進行轉化、轉染、轉導等的任何細胞類型。術語“宿主細胞”涵蓋由于復制期間發(fā)生的突變而與親本細胞不同的親本細胞的任何后代。
改進的特性:術語“改進的特性”意指與變體相關的與親本相比得到改進的特征。在本發(fā)明中,改進的特性是相對于親本,變體的增加的表達產量。
增加的表達產量:術語“增加的表達產量”意指相對于在相同的培養(yǎng)條件下,培養(yǎng)每升表達親本基因的相同的宿主細胞產生的分泌的活性酶的量(g),來自培養(yǎng)每升表達變體基因的宿主細胞的培養(yǎng)基的分泌的酶的更高量(g)。在一方面,與親本酶相比,變體具有至少1.05、至少1.10、至少1.20、至少1.30、至少1.40、至少1.50、至少1.60、至少1.70、至少1.80、至少1.90、至少2、至少2.25、至少2.50、至少2.75、至少3.00、至少3.25、至少3.50、至少3.75、至少4、至少4.25、至少4.50、至少4.75、至少5、至少6、至少7、至少8、至少9、或至少10倍的增加的表達產量。
分離的:術語“分離的”意指處于非天然存在的形式或環(huán)境中的物質。分離的物質的非限制性實例包括(1)任何非天然發(fā)生的物質,(2)包括但不限于任何酶、變體、核酸、蛋白質、肽或輔因子的任何物質,該物質至少部分地從與其本質相關的一種或多種或所有天然發(fā)生的成分中去除;(3)相對于天然發(fā)現(xiàn)的物質通過人工修飾的任何物質;或(4)通過相對于與其天然相關的其他組分,增加物質的量而修飾的任何物質(例如宿主細胞中的重組產生;編碼該物質的基因的多個拷貝;以及比與編碼該物質的基因天然相關聯(lián)的啟動子更強的啟動子的使用)而修飾的任何物質。
成熟多肽:術語“成熟多肽”意指在翻譯和任何翻譯后修飾如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后處于其最終形式的多肽。本領域已知,宿主細胞可以產生由同一多核苷酸表達的兩種或更多種不同成熟多肽(即,具有不同C-末端和/或N-末端氨基酸)的混合物。本領域還已知,不同的宿主細胞不同地加工多肽,并且因此一個表達多核苷酸的宿主細胞當與另一個表達相同多核苷酸的宿主細胞相比時可以產生不同的成熟多肽(例如,具有不同的C-末端和/或N-末端氨基酸)。
成熟多肽編碼序列:術語“成熟多肽編碼序列”意指編碼具有催化或結合活性的成熟多肽的多核苷酸。
核酸構建體:術語“核酸構建體”意指單鏈-或雙-鏈的核酸分子,該核酸分子是從天然存在的基因中分離的,或以本來不存在于自然界中的方式被修飾成包含核酸的區(qū)段,或是合成的,該核酸分子包括一個或多個控制序列。
可操作地連接:術語“可操作地連接”意指如下的構造,其中,控制序列相對于多核苷酸的編碼序列安置在適當位置,從而使得該控制序列指導該編碼序列的表達。
序列一致性:用參數“序列一致性”來描述兩個氨基酸序列之間或兩個核苷酸序列之間的相關性。
出于本發(fā)明的目的,使用如在EMBOSS包(EMBOSS:歐洲分子生物學開放軟件套件(The European Molecular Biology Open Software Suite),賴斯(Rice)等人,2000,遺傳學趨勢(Trends Genet.)16:276-277)(優(yōu)選5.0.0版或更新版本)的尼德爾(Needle)程序中所實施的尼德爾曼-翁施(Needleman-Wunsch)算法(尼德爾曼(Needleman)和翁施(Wunsch),1970,分子生物學雜志(J.Mol.Biol.)48:443-453)來確定兩個氨基酸序列之間的序列一致性。所使用的參數是空位開放罰分10、空位延伸罰分0.5,和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩陣。將標記為“最長同一性”的Needle輸出(使用-nobrief選項獲得)用作百分比同一性并且是如下計算的:
(一致的殘基X 100)/(比對長度-比對中的空位總數)
出于本發(fā)明的目的,使用如在EMBOSS包(EMBOSS:歐洲分子生物學開放軟件套件,賴斯等人,2000,同上)(優(yōu)選5.0.0版或更新版本)的尼德爾程序中所實施的尼德爾曼-翁施算法(尼德爾曼和翁施,1970,同上)來確定兩個脫氧核糖核苷酸序列之間的序列一致性。所使用的參數是空位開放罰分10,空位延伸罰分0.5,以及EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩陣。將標記為“最長同一性”的Needle輸出(使用-nobrief選項獲得)用作百分比同一性并且是如下計算的:
(一致的脫氧核糖核苷酸X 100)/(比對長度-比對中的空位總數)
子序列:術語“子序列”是指具有從成熟多肽編碼序列的5’和/或3’端缺失的一個或多個(例如,若干個)核苷酸的多核苷酸;其中該子序列編碼具有催化或結合活性的片段。
變體:術語“變體”意指在一個或多個(例如,若干個)位置處包括改變(即,取代、插入和/或缺失)的具有催化或結合活性的一個多肽。取代意指用一個不同氨基酸置換占用一個位置的氨基酸;缺失意指去除占據一個位置的氨基酸;并且插入意指在鄰接并且緊隨占據位置的氨基酸之后添加氨基酸。保守取代的實例是在下組的范圍內:堿性氨基酸(精氨酸、賴氨酸及組氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、極性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、異亮氨酸及纈氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、絲氨酸、蘇氨酸及蛋氨酸)。通常不改變比活性的氨基酸置換是本領域已知的并且例如由H.諾伊拉特(H.Neurath)和R.L.希爾(R.L.Hill),1979,在蛋白質(The Proteins),學術出版社(Academic Press),紐約(New York)中進行描述。常見取代是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、以及Asp/Gly??商娲兀被嶙兓沁@樣一種性質,使得多肽的理化性質被改變。例如,氨基酸改變可以改進多肽的熱穩(wěn)定性、改變底物特異性、改變最適pH等??梢愿鶕绢I域已知的方法,如定點誘變或丙氨酸掃描誘變鑒定多肽中的必需氨基酸(康寧漢(Cunningham)和韋爾斯(Wells),1989,科學(Science)244:1081-1085)。在后一項技術中,在該分子中的每個殘基處引入單個丙氨酸突變,并且對所得突變體分子的活性進行測試以鑒定對于該分子的活性至關重要的氨基酸殘基。還參見希爾頓(Hilton)等人,1996,生物化學雜志(J.Biol.Chem.)271:4699-4708。也可結合假定接觸位點氨基酸的突變,如通過以下技術例如核磁共振、結晶學、電子衍射、或光親和標記進行確定的對結構進行物理學分析,從而確定酶的活性位點或其他生物學相互作用。參見,例如德·沃斯(de Vos)等人,1992,科學(Science)255:306-312;史密斯(Smith)等人,1992,分子生物學雜志(J.Mol.Biol.)224:899-904;沃達維爾(Wlodaver)等人,1992,歐洲生物化學學會聯(lián)盟通訊(FEBS Lett.)309:59-64。還可以從與相關多肽的比對推斷鑒定必需氨基酸??梢宰龀鰡蝹€或多個氨基酸取代、缺失和/或插入并且使用誘變、重組和/或改組的已知方法進行測試,隨后進行相關篩選程序,如由里德哈爾-奧爾森(Reidhaar-Olson)和薩奧爾(Sauer),1988,科學(Science)241:53-57;博維(Bowie)和薩奧爾,1989,美國科學院院刊(Proc.Natl.Acad.Sci.USA)86:2152-2156;WO 95/17413;或WO 95/22625所披露的那些??梢允褂玫钠渌椒òㄒ族ePCR、噬菌體展示(例如,羅曼(Lowman)等人,1991,生物化學(Biochemistry)30:10832-10837;美國專利號5,223,409;WO 92/06204)和區(qū)域定向誘變(德比舍爾(Derbyshire)等人,1986,基因(Gene)46:145;內爾(Ner)等人,1988,DNA 7:127)。
誘變/改組方法可以與高通量自動化篩選方法組合以檢測由宿主細胞表達的克隆的誘變多肽的活性(奈斯(Ness)等人,1999,自然生物技術(Nature Biotechnology)17:893-896)。編碼活性多肽的誘變的DNA分子可以回收自宿主細胞,并且使用本領域的標準方法對其進行迅速測序。這些方法允許迅速確定多肽中單個氨基酸殘基的重要性。
發(fā)明詳述
本發(fā)明涉及用于使用位點特異性重組酶將感興趣的多核苷酸文庫整合到絲狀真菌宿主細胞的染色體中的方法,包括宿主細胞和多核苷酸構建體的多核苷酸文庫表達系統(tǒng),連同包含多核苷酸文庫的所得絲狀真菌宿主細胞及其培養(yǎng)物以生產多肽。
在本發(fā)明的一個優(yōu)選實施例中,多核苷酸文庫是包含編碼感興趣的多肽的變體的多核苷酸的基因文庫;優(yōu)選地,這一感興趣的多肽是一種酶;更優(yōu)選地,這一感興趣的多肽是一種水解酶、異構酶、連接酶、裂解酶、氧化還原酶或轉移酶,例如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、幾丁質酶、角質酶、環(huán)糊精糖基轉移酶、脫氧核糖核酸酶、內切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、轉化酶、漆酶、脂肪酶、甘露糖苷酶、變聚糖酶(mutanase)、氧化酶、果膠分解酶、過氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶、木聚糖酶、或β-木糖苷酶。
在另一個優(yōu)選實施例中,多核苷酸文庫包含控制序列的文庫,例如,啟動子,前導肽區(qū),分泌信號或終止子的文庫。
優(yōu)選的是,本發(fā)明的絲狀真菌宿主細胞是枝頂孢霉屬、曲霉屬、短梗霉屬、煙管霉屬(Bjerkandera)、擬臘菌屬、金孢子菌屬、鬼傘屬、革蓋菌屬(Coriolus)、隱球菌屬、線黑粉菌科(Filibasidium)、鐮孢屬、腐質霉屬、梨孢菌屬、毛霉屬、毀絲霉屬、新美鞭菌屬、鏈孢菌屬、擬青霉屬、青霉屬、平革菌屬、射脈菌屬(Phlebia)、瘤胃壺菌屬、側耳屬(Pleurotus)、裂褶菌屬、籃狀菌屬、嗜熱子囊菌屬、梭孢殼屬、彎頸霉屬、栓菌屬(Trametes)或木霉屬細胞;優(yōu)選地,該宿主細胞是泡盛曲霉、臭曲霉、煙曲霉、日本曲霉、構巢曲霉、黑曲霉、米曲霉、黑刺煙管菌(Bjerkandera adusta)、干擬蠟菌(Ceriporiopsis aneirina)、卡內基擬蠟菌(Ceriporiopsis caregiea)、淺黃擬蠟孔菌(Ceriporiopsis gilvescens)、潘諾希塔擬蠟菌(Ceriporiopsis pannocinta)、環(huán)帶擬蠟菌(Ceriporiopsis rivulosa)、微紅擬蠟菌(Ceriporiopsis subrufa)、蟲擬蠟菌(Ceriporiopsis subvermispora)、狹邊金孢子菌(Chrysosporium inops)、嗜角質金孢子菌、盧克諾文思金孢子菌(Chrysosporium lucknowense)、糞狀金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、熱帶金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰蓋鬼傘(Coprinus cinereus)、毛革蓋菌(Coriolus hirsutus)、桿孢狀鐮孢、谷類鐮孢、庫威鐮孢、大刀鐮孢、禾谷鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢、鑲片鐮孢、特異腐質霉、柔毛腐質霉、米黑毛霉、嗜熱毀絲霉、粗糙鏈孢菌、產紫青霉、黃孢平革菌(Phanerochaete chrysosporium)、射脈菌(Phlebia radiata)、刺芹側耳(Pleurotus eryngii)、土生梭孢殼霉、長域毛栓菌(Trametes villosa)、變色栓菌(Trametes versicolor)、哈茨木霉、康寧木霉、長枝木霉、里氏木霉、或綠色木霉細胞。
在本發(fā)明的一個優(yōu)選實施例中,位點特異性重組酶是釀酒酵母2μm翻轉酶FLP,噬菌體TP901-1整合酶,細菌噬菌體P1CRE整合酶,細菌XerC重組酶,細菌XerD重組酶,λ噬菌體整合酶或HP1整合酶;優(yōu)選地,該位點特異性重組酶是釀酒酵母2μm翻轉酶FLP。
兩個獨立的策略可以應用于確保在宿主細胞的染色體中的染色體整合發(fā)生在正確的方向。如果使用相同的第一和第二識別序列,則該整合有可能在兩個方向發(fā)生,但是第二選擇標記可以被定制,這樣使得僅正確整合的片段導致第二選擇標記的表達。另一方面,使用不同的第一和第二識別序列也是一個選項,例如FRT-F和FRT-F3,為了確保該片段被整合在一個特定的方向。本發(fā)明的一個方面涉及使用體內同源重組,該體內同源重組在轉化到宿主細胞的核酸構建體的區(qū)域,以及在與位點特異性重組酶識別序列組合的染色體中預期整合位點的5’或3’區(qū)域之間,以確保感興趣的多核苷酸文庫是經由與受重組酶影響的位點特異性重組組合的體內同源重組,以特定方向整合到染色體中。
因此,優(yōu)選的是,重組酶的第一和第二識別序列是相同的或不同的;優(yōu)選地,該重組酶的第一和第二識別序列是不同的,以影響在宿主細胞染色體中這一感興趣的多核苷酸文庫的定向整合。優(yōu)選地,重組酶的第一和第二識別序列是釀酒酵母2μm翻轉酶FLP的不同的識別序列,以影響在宿主細胞染色體中感興趣的多核苷酸文庫的定向整合;優(yōu)選地,該重組酶的第一和第二識別序列分別是FRT-F(SEQ ID NO:27)和FRT-F3(SEQ ID NO:28),或反之亦然。
另一方面,還優(yōu)選地是,一個非功能部分第二選擇標記被包括在步驟(a)中第一方面的宿主細胞中,并且另一個非功能部分第二選擇標記被包括在步驟(b)中第一方面的核酸構建體中,其中當感興趣的多核苷酸文庫經由其識別序列通過重組酶位點特異性地以正確的方向整合到宿主細胞的染色體中時,部分第二選擇標記被重組以形成功能第二選擇標記;優(yōu)選地,一個非功能部分第二選擇標記包含編碼選擇標記的多核苷酸的啟動子和任選地一個或多個完整5’外顯子,并且另一個非功能部分第二選擇標記包含選擇標記的剩余編碼序列。
在本發(fā)明的第二方面的優(yōu)選實施例中,一個非功能部分第二選擇標記被包括在宿主細胞中并且另一非功能部分第二選擇標記被包括在核酸構建體中,其中當感興趣的多核苷酸文庫經由其識別序列通過重組酶位點特異性地以正確的方向整合到宿主細胞的染色體中時,部分第二選擇標記被重組以形成功能第二選擇標記;優(yōu)選地,一個非功能部分第二選擇標記包含編碼選擇標記的多核苷酸的啟動子和任選地一個或多個完整5’外顯子,并且其中另一個非功能部分第二選擇標記包含選擇標記的剩余編碼序列。
在第二方面的優(yōu)選實施例中,絲狀真菌宿主細胞被轉化。
在第三方面的優(yōu)選實施例中,重組酶的第一和第二識別序列是相同的或不同的;優(yōu)選地,該重組酶的第一和第二識別序列是不同的。
在第三方面的另一個優(yōu)選實施例中,重組酶的第一和第二識序列是釀酒酵母的2μm翻轉酶FLP的不同的識別序列;優(yōu)選地,該重組酶的第一和第二識別序列分別是FRT-F(SEQ ID NO:27)和FRT-F3(SEQ ID NO:28),或反之亦然。
在另一個優(yōu)選實施例中,在整合位點的5’或3’的區(qū)域,即,整合位點的側翼5’或3’,與第二識別序列一起使用,以影響在整合位點的感興趣的多核苷酸文庫的定向整合。
在第三方面的一個最后優(yōu)選實施例中,重組酶的第二識別序列位于將第一部分選擇標記與第二部分選擇標記分開的內含子中,如在圖7中所概述。
具有酶活性的多肽的來源
本發(fā)明的具有酶活性的多肽可以從任何屬的微生物中獲得。出于本發(fā)明的目的,如在此結合給定的來源使用的術語“從…中獲得”應意指由多核苷酸編碼的多肽是由該來源或者由其中已經插入來自該來源的多核苷酸的菌株產生的。在一方面,從給定來源中獲得的多肽被分泌到細胞外。
該多肽可以是細菌多肽。例如,該多肽可以是革蘭氏陽性細菌多肽,如具有[酶]活性的芽孢桿菌屬(Bacillus)、梭菌屬(Clostridium)、腸球菌屬(Enterococcus)、土芽孢桿菌屬(Geobacillus)、乳桿菌屬(Lactobacillus)、乳球菌屬(Lactococcus)、海洋芽孢桿菌屬(Oceanobacillus)、葡萄球菌屬(Staphylococcus)、鏈球菌屬(Streptococcus)或鏈霉菌屬(Streptomyces)多肽;或革蘭氏陰性細菌多肽,如彎曲桿菌屬(Campylobacter)、大腸桿菌(E.coli)、黃桿菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)、螺桿菌屬(Helicobacter)、泥桿菌屬(Ilyobacter)、奈瑟氏菌屬(Neisseria)、假單胞菌屬(Pseudomonas)、沙門氏菌屬(Salmonella)或脲原體屬(Ureaplasma)多肽。
在一方面,該多肽是嗜堿芽孢桿菌(Bacillus alkalophilus)、解淀粉芽孢桿菌(Bacillus amyloliquefaciens)、短芽孢桿菌(Bacillus brevis)、環(huán)狀芽孢桿菌(Bacillus circulans)、克勞氏芽孢桿菌(Bacillus clausii)、凝結芽孢桿菌(Bacillus coagulans)、堅硬芽孢桿菌(Bacillus firmus)、燦爛芽孢桿菌(Bacillus lautus)、遲緩芽孢桿菌(Bacillus lentus)、地衣芽孢桿菌(Bacillus licheniformis)、巨大芽孢桿菌(Bacillus megaterium)、短小芽孢桿菌(Bacillus pumilus)、嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus)、枯草芽孢桿菌(Bacillus subtilis)、或蘇云金芽孢桿菌(Bacillus thuringiensis)多肽。
在另一方面,該多肽是似馬鏈球菌(Streptococcus equisimilis)、釀膿鏈球菌(Streptococcus pyogenes)、乳房鏈球菌(Streptococcus uberis)、或馬鏈球菌獸瘟亞種(Streptococcus equi subsp.Zooepidemicus)多肽。
在另一方面,該多肽是不產色鏈霉菌(Streptomyces achromogenes)、除蟲鏈霉菌(Streptomyces avermitilis)、天藍鏈霉菌(Streptomyces coelicolor)、灰色鏈霉菌(Streptomyces griseus)、或淺青紫鏈霉菌(Streptomyces lividans)多肽。
該多肽可以是一種真菌多肽。例如,該多肽可以是酵母多肽,如假絲酵母屬、克魯弗酵母屬、畢赤酵母屬、酵母屬、裂殖酵母、或耶氏酵母屬多肽;或絲狀真菌多肽,例如枝頂孢霉屬(Acremonium)、傘菌屬(Agaricus)、鏈格孢屬(Alternaria)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、葡萄座腔菌屬(Botryospaeria)、擬蠟菌屬(Ceriporiopsis)、毛喙殼屬(Chaetomidium)、金孢子菌屬(Chrysosporium)、麥角菌屬(Claviceps)、旋孢腔菌屬(Cochliobolus)、鬼傘屬(Coprinopsis)、乳白蟻屬(Coptotermes)、棒囊殼屬(Corynascus)、隱叢赤殼菌屬(Cryphonectria)、隱球菌屬(Cryptococcus)、色二孢屬(Diplodia)、黑耳屬(Exidia)、線黑粉酵母屬(Filibasidium)、鐮孢屬(Fusarium)、赤霉屬(Gibberella)、全鞭毛蟲屬(Holomastigotoides)、腐質霉屬(Humicola)、耙齒菌屬(Irpex)、香菇屬(Lentinula)、小腔球菌屬(Leptospaeria)、梨孢菌屬(Magnaporthe)、黑果菌屬(Melanocarpus)、亞灰樹花菌屬(Meripilus)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、新美鞭菌屬(Neocallimastix)、鏈孢菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉菌屬(Penicillium)、平革菌屬(Phanerochaete)、瘤胃壺菌屬(Piromyces)、Poitrasia、假黑盤菌屬(Pseudoplectania)、假披發(fā)蟲屬(Pseudotrichonympha)、根毛霉菌屬(Rhizomucor)、裂褶菌屬(Schizophyllum)、柱頂孢屬(Scytalidium)、籃狀菌屬(Talaromyces)、嗜熱子囊菌屬(Thermoascus)、梭孢殼霉屬(Thielavia)、彎頸霉屬(Tolypocladium)、木霉屬(Trichoderma)、長毛盤菌屬(Trichophaea)、輪枝孢屬(Verticillium)、小包腳菇屬(Volvariella)、或炭角菌屬(Xylaria)多肽。
在另一方面,該多肽是卡氏酵母(Saccharomyces carlsbergensis)、釀酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克魯弗酵母(Saccharomyces kluyveri)、諾地酶母(Saccharomyces norbensis)、或卵形酵母(Saccharomyces oviformis)多肽。
在另一方面,該多肽是解纖維枝頂孢霉(Acremonium cellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、煙曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、構巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、狹邊金孢子菌(Chrysosporium inops)、嗜角質金孢子菌(Chrysosporium keratinophilum)、盧克諾文思金孢子菌(Chrysosporium lucknowense)、糞狀金孢子菌(Chrysosporium merdarium)、氈金孢子菌(Chrysosporium pannicola)、昆士蘭金孢子菌(Chrysosporium queenslandicum)、熱帶金孢子菌(Chrysosporium tropicum)、帶紋金孢子菌(Chrysosporium zonatum)、桿孢狀鐮孢(Fusarium bactridioides)、禾谷鐮孢(Fusarium cerealis)、庫威鐮孢(Fusarium crookwellense)、黃色鐮孢菌(Fusarium culmorum)、禾谷鐮孢菌(Fusarium graminearum)、禾赤鐮孢(Fusarium graminum)、異孢鐮孢(Fusarium heterosporum)、合歡木鐮孢(Fusarium negundi)、尖孢鐮孢菌(Fusarium oxysporum)、多枝鐮孢(Fusarium reticulatum)、粉紅鐮孢菌(Fusarium roseum)、接骨木鐮孢(Fusarium sambucinum)、膚色鐮孢(Fusarium sarcochroum)、擬枝孢鐮孢菌(Fusarium sporotrichioides)、硫色鐮孢菌(Fusarium sulphureum)、圓鐮孢(Fusarium torulosum)、擬絲孢鐮孢菌(Fusarium trichothecioides)、鑲片鐮孢菌(Fusarium venenatum)、灰腐質霉(Humicola grisea)、特異腐質霉(Humicola insolens)、疏棉狀腐質霉(Humicola lanuginosa)、白囊耙齒菌(Irpex lacteus)、米黑毛霉(Mucor miehei)、嗜熱毀絲霉(Myceliophthora thermophila)、粗糙脈孢菌(Neurospora crassa)、繩狀青霉菌(Penicillium funiculosum)、產紫青霉(Penicillium purpurogenum)、黃孢原毛平革菌(Phanerochaete chrysosporium)、無色梭孢殼(Thielavia achromatica)、成層梭孢殼菌(Thielavia albomyces)、白毛梭孢殼(Thielavia albopilosa)、澳洲梭孢殼(Thielavia australeinsis)、糞梭孢殼(Thielavia fimeti)、小孢梭孢殼(Thielavia microspora)、卵孢梭孢殼(Thielavia ovispora)、秘魯梭孢殼(Thielavia peruviana)、毛梭孢殼(Thielavia setosa)、瘤孢梭孢殼(Thielavia spededonium)、耐熱梭孢殼(Thielavia subthermophila)、土生梭孢殼(Thielavia terrestris)、哈茨木霉(Trichoderma harzianum)、康寧木霉(Trichoderma koningii)、長枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)、或綠色木霉(Trichoderma viride)多肽。
將理解的是,對于以上提到的物種而言,本發(fā)明涵蓋完全狀態(tài)和不完全狀態(tài)(perfect and imperfect states)二者、以及其他分類學等效物,例如無性型,而不管它們已知的物種名稱是什么。本領域普通技術人員將容易地識別適當等效物的身份。
這些物種的菌株可以容易地在許多培養(yǎng)物保藏中心為公眾所獲得,如美國典型培養(yǎng)物保藏中心(ATCC)、德國微生物菌種保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH,DSMZ)、荷蘭菌種保藏中心(Centraalbureau Voor Schimmelcultures,CBS)以及美國農業(yè)研究服務專利培養(yǎng)物保藏中心北方地區(qū)研究中心(NRRL)。
可以使用以上提到的探針從其他來源,包括從自然界(例如,土壤、堆肥、水等等)分離的微生物或直接從自然材料(例如,土壤、堆肥、水等等)獲得的DNA樣品鑒定和獲得該多肽。用于從自然生活環(huán)境中直接分離微生物和DNA的技術是本領域熟知的。然后可以通過類似地篩選另一微生物的基因組DNA或cDNA文庫或混合的DNA樣品來獲得編碼該多肽的多核苷酸。一旦已經用探針檢測到編碼多肽的多核苷酸,則可以通過利用本領域普通技術人員所知的技術分離或克隆多核苷酸(參見,例如薩姆布魯克(Sambrook)等人,1989,上文)。
核酸構建體
本發(fā)明還涉及包含與一個或多個控制序列可操作地連接的本發(fā)明多核苷酸的核酸構建體,其中所述控制序列指導編碼序列在適合的宿主細胞中在與所述控制序列相容的條件下的表達。
可以用許多方式操作所述多核苷酸以便于多肽的表達。取決于表達載體,在多核苷酸插入載體之前對其進行操縱可以是令人希望的或必需的。用于利用重組DNA方法修飾多核苷酸的技術是本領域熟知的。
該控制序列可以是啟動子,即,被宿主細胞識別以對編碼本發(fā)明的多肽的多核苷酸進行表達的多核苷酸。啟動子包含介導多肽表達的轉錄控制序列。啟動子可以是在宿主細胞中顯示轉錄活性的任何多核苷酸,包括突變、截短和雜合啟動子,并且可以從編碼與宿主細胞同源或異源的胞外或胞內多肽的基因中獲得。
在絲狀真菌宿主細胞中,用于指導本發(fā)明的核酸構建體的轉錄的適合啟動子的實例是獲得自以下各項的基因的啟動子:構巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩(wěn)定性α-淀粉酶、黑曲霉或泡盛曲霉葡萄糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構酶、尖鐮孢胰蛋白酶–樣蛋白酶(WO 96/00787)、鑲片鐮孢菌淀粉葡糖苷酶(WO 00/56900)、鑲片鐮孢菌Daria(達莉亞)(WO 00/56900)、鑲片鐮孢菌Quinn(奎恩)(WO 00/56900)、米黑根毛霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內切葡聚糖酶I、里氏木霉內切葡聚糖酶II、里氏木霉內切葡聚糖酶III、里氏木霉內切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻譯延伸因子,連同NA2-tpi啟動子(來自編碼中性α-淀粉酶的曲霉屬基因的修飾的啟動子,其中已經用來自編碼丙糖磷酸異構酶的曲霉屬基因的未翻譯的前導子替換未翻譯的前導子;非限制性實例包括來自編碼中性α-淀粉酶的黑曲霉基因的修飾的啟動子,其中已經用來自編碼丙糖磷酸異構酶的構巢曲霉或米曲霉基因的未翻譯的前導子替換未翻譯的前導子);及其突變型、截短型及雜合型啟動子。其他啟動子在美國專利號6,011,147中描述。
控制序列還可以是由宿主細胞識別以終止轉錄的轉錄終止子。該終止子可操作地連接到編碼該多肽的多核苷酸的3’-末端。在該宿主細胞中起作用的任何終止子都可以用于本發(fā)明中。
用于絲狀真菌宿主細胞的優(yōu)選終止子是從以下各項的基因獲得:構巢曲霉乙酰胺酶、構巢曲霉鄰氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖鐮孢胰蛋白酶樣蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內切葡聚糖酶I、里氏木霉內切葡聚糖酶II、里氏木霉內切葡聚糖酶III、里氏木霉內切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻譯延長因子。
該控制序列還可以是在啟動子下游并且在基因編碼序列上游的mRNA穩(wěn)定子區(qū)域,它增加該基因的表達。
該控制序列還可以是前導子,一種對宿主細胞翻譯很重要的非翻譯mRNA區(qū)域。該前導子可操作地連接到編碼該多肽的多核苷酸的5’-末端。可以使用在宿主細胞中起作用的任何前導子。
用于絲狀真菌宿主細胞的優(yōu)選前導序列是從米曲霉TAKA淀粉酶和構巢曲霉丙糖磷酸異構酶的基因獲得。
控制序列還可以是聚腺苷酸化序列,可操作地連接至該多核苷酸的3’-末端并且當轉錄時由宿主細胞識別為將聚腺苷酸殘基添加至所轉錄的mRNA的信號的序列。可以使用在宿主細胞中起作用的任何聚腺苷酸化序列。
用于絲狀真菌宿主細胞的優(yōu)選聚腺苷酸化序列是從以下各項的基因中獲得的:構巢曲霉鄰氨基苯甲酸合成酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖鐮孢胰蛋白酶樣蛋白酶。
控制序列也可以是編碼信號肽的信號肽編碼區(qū),其中所述信號肽與多肽的N-末端連接并且指導多肽進入細胞的分泌途徑。多核苷酸的編碼序列的5’-末端可以內在地包含在翻譯閱讀框中與編碼多肽的編碼序列的區(qū)段天然連接的信號肽編碼序列。可替代地,編碼序列的5’-末端可以包含相對于編碼序列為外來的信號肽編碼序列。在編碼序列不天然地包含信號肽編碼序列的情況下,可能需要外來信號肽編碼序列??商娲?,外來信號肽編碼序列可以單純地替代天然信號肽編碼序列以便增強多肽的分泌。然而,可以使用指導已表達多肽進入宿主細胞的分泌途徑的任何信號肽編碼序列。
用于絲狀真菌宿主細胞的有效信號肽編碼序列是從黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特異腐質霉纖維素酶、特異腐質霉內切葡聚糖酶V、柔毛腐質霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶的基因獲得的信號肽編碼序列。
控制序列也可以是編碼位于多肽N-末端處的前肽的前肽編碼序列。生成的多肽被稱為前體酶(proenzyme)或多肽原(或在一些情況下被稱為酶原(zymogen))。多肽原通常是無活性的并且可以通過催化切割或自身催化切割來自多肽原的前肽而轉化為活性多肽??梢詮目莶菅挎邨U菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、嗜熱毀絲霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶、特異腐質霉角質酶和釀酒酵母α-因子的基因獲得前肽或前肽原編碼序列。
在信號肽和前肽序列兩者都在的情況下,將前肽序列緊鄰多肽的N-末端定位并且將信號肽序列緊鄰前肽序列的N-末端定位。
也可能令人希望的是添加調節(jié)序列,所述調節(jié)序列調節(jié)相對于宿主細胞的生長的多肽的表達。調節(jié)序列的實例是使得基因的表達響應于化學或物理刺激(包括調節(jié)化合物的存在)而開啟或關閉的那些。在絲狀真菌中,可以使用黑曲霉葡糖淀粉酶啟動子、米曲霉TAKAα-淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子、里氏木霉纖維二糖水解酶I啟動子以及里氏木霉纖維二糖水解酶II啟動子。調節(jié)序列的其它實例是那些允許基因擴增的序列。在真核系統(tǒng)中,這些調控序列包括在甲氨蝶呤存在下被擴增的二氫葉酸還原酶基因以及用重金屬擴增的金屬硫蛋白基因。在這些情況中,編碼多肽的多核苷酸將與調控序列可操作地連接。
多核苷酸構建體
本發(fā)明還涉及包括本發(fā)明的多核苷酸、啟動子、以及轉錄和翻譯終止信號的重組多核苷酸構建體或表達載體。不同的核苷酸和控制序列可以連接在一起以產生一個重組表達載體,這一重組表達載體可以包括一個或多個便利的限制酶切位點以允許在這些位點處插入或取代編碼該變體的多核苷酸。可替代地,該多核苷酸可以通過將該多核苷酸或包括該多核苷酸的核酸構建體插入用于表達的適當載體中來表達。在產生該表達載體時,該編碼序列位于該載體中,這樣使得該編碼序列與該供表達的適當控制序列可操作地連接。
重組表達載體可以是任何載體(例如,質?;虿《?,其能夠方便地進行重組DNA程序,并且能夠引起多核苷酸的表達。載體的選擇將典型地取決于該載體與有待引入該載體的宿主細胞的相容性。該載體可以是一種線性的或閉合的環(huán)狀質粒。
載體可以是自主復制載體,即,作為染色體外實體存在的載體,其復制獨立于染色體復制,例如,質粒、染色體外元件、微染色體或人工染色體。該載體可包含任何用以保證自我復制的要素。可替代地,該載體可以是這樣載體,當它被引入該宿主細胞中時,被整合到基因組中并且與其中已整合了它的一個或多個染色體一起復制。此外,可以使用單一載體或質粒或兩個或更多個載體或質粒(這些載體或質粒共同包含待引入到宿主細胞的基因組中的總DNA)或轉座子。
該載體優(yōu)選包含一個或多個允許方便地選擇轉化細胞、轉染細胞、轉導細胞等細胞的選擇性標記。選擇性標記是這樣一種基因,該基因的產物提供了殺生物劑抗性或病毒抗性、重金屬抗性、營養(yǎng)缺陷型的原養(yǎng)型等。
用于在絲狀真菌宿主細胞中使用的選擇性標記包括但不限于,adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鳥氨酸氨甲酰基轉移酶)、bar(草丁膦乙酰轉移酶)、hph(潮霉素磷酸轉移酶)、niaD(硝酸還原酶)、pyrG(乳清酸核苷-5’-磷酸脫羧酶)、sC(硫酸腺苷基轉移酶)、以及trpC(鄰氨基苯甲酸合酶),連同其等效物。優(yōu)選地用于曲霉細胞中的是構巢曲霉或米曲霉amdS和pyrG基因以及吸水鏈霉菌bar基因。在木霉屬細胞中優(yōu)選使用的是adeA、adeB、amdS、hph以及pyrG基因。
選擇性標記可以是如在WO 2010/039889中描述的雙選擇性標記系統(tǒng)。在一方面中,雙選擇性標記是hph-tk雙選擇性標記系統(tǒng)。
載體優(yōu)選包含允許載體整合到宿主細胞的基因組中或載體在細胞中獨立于基因組自主復制的一個或多個元件。
對于整合到該宿主細胞基因組中,該載體可以依靠編碼該多肽的多核苷酸序列或者用于通過同源或非同源重組整合到該基因組中的該載體的任何其他元件??商娲?,該載體可以包含用于指導通過同源重組而整合到宿主細胞基因組中的一個或多個染色體中的一個或多個精確位置的另外的多核苷酸。為了增加在精確位置整合的可能性,這些整合元件應包含足夠數量的核酸,例如100至10,000個堿基對、400至10,000個堿基對、以及800至10,000個堿基對,這些堿基對與對應的靶序列具有高度的序列一致性以提高同源重組的可能性。這些整合元件可以是與宿主細胞的基因組內的靶序列同源的任何序列。此外,這些整合元件可以是非編碼多核苷酸或編碼多核苷酸。另一個方面,該載體可以通過非同源重組整合到宿主細胞的基因組中。
對于自主復制,載體可以進一步包含使該載體能夠在所討論的宿主細胞中自主復制的復制起點。復制起點可以是在細胞中起作用的介導自主復制的任何質粒復制子。術語“復制起點(origin of replication)”或“質粒復制子(plasmid replicator)”意指使得質粒或載體可在體內復制的多核苷酸。
在絲狀真菌細胞中有用的復制起點的實例是AMA1和ANS1(格姆斯(Gems)等人,1991,基因(Gene)98:61-67;卡倫(Cullen)等人,1987,核酸研究(Nucleic Acids Res.)15:9163-9175;WO 00/24883)。AMA1基因的分離和包括該基因的質?;蜉d體的構建可以根據披露于WO 00/24883中的方法完成。
可以將本發(fā)明的多核苷酸的多于一個拷貝插入宿主細胞中以增加多肽的產生。通過將序列的至少一個另外的拷貝整合到宿主細胞基因組中或者通過包含與該多核苷酸一起的可擴增的選擇性標記基因可以獲得多核苷酸的增加的拷貝數目,其中通過在適當的選擇性試劑的存在下培養(yǎng)細胞可以選擇包含選擇性標記基因的經擴增的拷貝的細胞、以及由此該多核苷酸的另外的拷貝。
用于連接以上所描述的元件以構建本發(fā)明的重組表達載體的程序是本領域的普通技術人員熟知的(參見,例如,薩姆布魯克(Sambrook)等人,1989,同上)。
宿主細胞
本發(fā)明還涉及重組宿主細胞,這些宿主細胞包含可操作地連接到一個或多個控制序列的本發(fā)明的多核苷酸,這些控制序列指導本發(fā)明的多肽的產生。將包含多核苷酸的構建體或載體引入宿主細胞中,從而該構建體或載體被維持為染色體整合體。
術語“宿主細胞”涵蓋由于復制期間發(fā)生的突變與親本細胞不同的親本細胞的任何后代。宿主細胞的選擇在很大程度上取決于編碼該多肽的基因及其來源。
宿主細胞可以是真菌細胞。如在此所用的“真菌”包括子囊菌門(Ascomycota)、擔子菌門(Basidiomycota)、壺菌門(Chytridiomycota)和接合菌門(Zygomycota)以及卵菌門(Oomycota)和所有有絲分裂孢子真菌(如霍克斯沃思(Hawksworth)等人定義,引自:安斯沃斯(Ainsworth)和比斯比(Bisby)的真菌大詞典(Dictionary of The Fungi),第8版,1995,國際CAB,大學出版社(University Press),劍橋(Cambridge),英國)。
真菌宿主細胞可以是絲狀真菌細胞?!敖z狀真菌”包括真菌門(Eumycota)和卵菌門(Oomycota)亞類的所有絲狀形式(如霍克斯沃思等人,1995,上文定義)。絲狀真菌通常的特征在于由幾丁質、纖維素、葡聚糖、殼聚糖、甘露聚糖、以及其他復雜多糖構成的菌絲體壁。營養(yǎng)生長是通過菌絲延伸,而碳分解代謝是專性需氧的。
絲狀真菌宿主細胞可以是枝頂孢霉屬細胞、曲霉屬細胞、金擔子菌屬細胞、煙管菌屬(Bjerkandera)細胞、擬蠟菌屬細胞、金孢屬細胞、鬼傘屬細胞、革蓋菌屬(Coriolus)細胞、隱球菌屬細胞、絨黑粉類酵母細胞、鐮刀菌屬細胞、腐質霉屬細胞、巨座殼屬細胞、毛霉屬細胞、毀絲霉屬細胞、新美鞭菌屬細胞、脈孢菌屬細胞、擬青霉屬細胞、青霉屬細胞、平革菌屬細胞、射脈菌屬(Phlebia)細胞、梨囊鞭菌屬細胞、側耳屬細胞、裂褶菌屬細胞、藍狀菌屬細胞、嗜熱子囊菌細胞、梭孢殼屬細胞、彎頸霉屬細胞、栓菌屬(Trametes)細胞或木霉屬細胞。
例如,絲狀真菌宿主細胞可以是泡盛曲霉、臭曲霉、煙曲霉、日本曲霉、構巢曲霉、黑曲霉、米曲霉、黑刺煙管菌(Bjerkandera adusta)、干擬蠟菌(Ceriporiopsis aneirina)、卡內基擬蠟菌(Ceriporiopsis caregiea)、淺黃擬蠟孔菌(Ceriporiopsis gilvescens)、潘諾希塔擬蠟菌(Ceriporiopsis pannocinta)、環(huán)帶擬蠟菌(Ceriporiopsis rivulosa)、微紅擬蠟菌(Ceriporiopsis subrufa)、蟲擬蠟菌(Ceriporiopsis subvermispora)、狹邊金孢子菌(Chrysosporium inops)、嗜角質金孢子菌、盧克諾文思金孢子菌(Chrysosporium lucknowense)、糞狀金孢子菌(Chrysosporium merdarium)、租金孢子菌、昆士蘭金孢子菌(Chrysosporium queenslandicum)、熱帶金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰蓋鬼傘(Coprinus cinereus)、毛革蓋菌(Coriolus hirsutus)、桿孢狀鐮孢、谷類鐮孢、庫威鐮孢、大刀鐮孢、禾谷鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢、鑲片鐮孢、特異腐質霉、柔毛腐質霉、米黑毛霉、嗜熱毀絲霉、粗糙鏈孢菌、產紫青霉、黃孢平革菌(Phanerochaete chrysosporium)、射脈菌(Phlebia radiata)、刺芹側耳(Pleurotus eryngii)、土生梭孢殼霉、長域毛栓菌(Trametes villosa)、變色栓菌(Trametes versicolor)、哈茨木霉、康寧木霉、長枝木霉、里氏木霉、或綠色木霉細胞。
可以通過涉及原生質體形成、原生質體轉化、以及以本身已知的方式進行細胞壁再生的過程來轉化真菌細胞。用于轉化曲霉屬和木霉屬宿主細胞的適合程序在EP 238023和約爾頓(Yelton)等人,1984,美國國家科學院院刊(Proc.Natl.Acad.Sci.USA)81:1470-1474以及科里蒂森(Christensen)等人,1988,生物/技術(Bio/Technology)6:1419-1422中描述。用于轉化鐮刀菌屬物種的適合方法在馬拉迪耶(Malardier)等人,1989,基因(Gene)78:147-156和WO 96/00787中描述。
生產方法
本發(fā)明還涉及產生感興趣的多肽的方法,包括以下步驟:a)在有益于產生多核苷酸文庫編碼的多肽的條件下培養(yǎng)第三方面的絲狀真菌宿主細胞,并且;任選地,b)回收該多肽。
這些宿主細胞是在適合于使用本領域中已知的方法產生該多肽的一種營養(yǎng)培養(yǎng)基中培養(yǎng)的。例如,可以通過在適合的培養(yǎng)基中和在允許表達和/或分離該多肽的條件下,進行搖瓶培養(yǎng),或者在實驗室或工業(yè)發(fā)酵罐中進行小規(guī)模或大規(guī)模發(fā)酵(包括連續(xù)、分批、分批補料、或固態(tài)發(fā)酵)來培養(yǎng)細胞。該培養(yǎng)是使用本領域中已知的程序,在一種適合營養(yǎng)培養(yǎng)基中發(fā)生,該培養(yǎng)基包括碳和氮來源及無機鹽。適合的培養(yǎng)基可從商業(yè)供應商獲得或可以根據公開的組成(例如,在美國典型培養(yǎng)物保藏中心的目錄中)制備。如果多肽分泌到該營養(yǎng)培養(yǎng)基中,那么可直接從培養(yǎng)基中回收多肽。如果多肽不被分泌,那么其可從細胞裂解液中進行回收。
可以使用特異性針對這些多肽的本領域已知的方法來檢測該多肽。這些檢測方法包括但不限于,特異性抗體的使用、酶產物的形成或酶底物的消失。例如,可以使用酶測定來確定該多肽的活性。
可以使用本領域已知的方法來回收多肽。例如,該多肽可以通過常規(guī)程序,包括但不限于,收集、離心、過濾、提取、噴霧干燥、蒸發(fā)或沉淀,從該營養(yǎng)培養(yǎng)基回收。在一方面,回收包含該多肽的發(fā)酵液。
可以通過本領域已知的多種方法純化多肽,所述方法包括但不限于色譜(例如,離子交換色譜法、親和色譜法、疏水色譜法、聚焦色譜法和大小排阻色譜法)、電泳方法(例如,制備性等電聚焦)、差異性溶解(例如,硫酸銨沉淀)、SDS-PAGE或提取(參見,例如,蛋白質純化(Protein Purification),編者詹森(Janson)和賴登(Ryden),VCH出版公司,紐約,1989),以便獲得基本上純的多肽。
在替代性方面,不回收多肽,而是使用表達該多肽的本發(fā)明宿主細胞作為多肽的來源。
通過以下實例進一步對本發(fā)明進行描述,但不應將其理解為對本發(fā)明范圍的限制。
實例
分子克隆技術描述于薩姆布魯克(Sambrook),J.,弗里奇(Fritsch),E.F.,馬尼亞蒂斯(Maniatis),T.30(1989)分子克隆實驗手冊(Molecular cloning:a laboratory manual)(第2版)冷泉港實驗室(Cold Spring Harbor Laboratory),冷泉港(Cold Spring Harbor),紐約。
用于DNA操作的酶(例如限制性內切核酸酶,連接酶等)從新英格蘭生物學實驗室有限公司(New England Biolabs,Inc.)獲得,并可根據制造商的說明書使用。
培養(yǎng)基和試劑
除非另外說明,使用以下培養(yǎng)基質和試劑;用于緩沖液和底物的化學品是分析等級的商品:
-Cove:342.3g/L蔗糖、20ml/L COVE鹽溶液、10mM乙酰胺、30g/L諾布爾(noble)瓊脂。
-Cove頂層瓊脂:342.3g/L蔗糖、20ml/L COVE鹽溶液、10mM乙酰胺、10g/L低熔點瓊脂糖。
-Cove-N平板由以下構成:30g蔗糖、20ml Cove鹽溶液、3g NaNO3和30g諾布爾瓊脂,并且水補足至1升。
-COVE鹽溶液由以下構成:26g KCl、26g MgSO4·7H2O、76g KH2PO4和50ml Cove痕量金屬,并且水補足至1升。
-用于COVE的痕量金屬溶液由以下構成:0.04g NaB4O7 10H2O、0.4g的CuSO4 5H2O、1.2g的FeSO4 7H2O、1.0g MnSO4H2O、0.8g中性淀粉酶II MoO22H2O和10.0g ZnSO4 7H2O,并且水補足至1升。
-1/4YPM由以下構成:2.5g酵母提取物、5g蛋白胨和5g麥芽糖(pH4.5),并且水補足至1升。
-STC緩沖液由以下構成:0.8M山梨糖醇、25mM Tris(pH 8)、和25mM CaCl2,并且水補足至1升。
-STPC緩沖液由以下構成:在STC緩沖液中的40%PEG4000。
-MLC由以下構成:40g葡萄糖、50g大豆粉、4g/檸檬酸(pH5.0),并且水補足至1升。
-纖維素酶誘導培養(yǎng)基(CIM)由以下構成:20g的纖維素、10g的玉米漿固體、1.45g的(NH4)2SO4、2.08g的KH2PO4、0.28g的CaCl2、0.42g的MgSO4·7H2O、0.42ml的木霉痕量金屬溶液、1-2滴消泡劑、并且去離子水補足至1升;pH調節(jié)至6.0。
-COVE平板由以下各項構成:342.3g的蔗糖、20ml的COVE鹽溶液、10ml的1M乙酰胺、10ml的1.5M CsCl、25g的諾布爾瓊脂(Difco)、并且去離子水補足至1升。
-COVE鹽溶液由以下構成:26g的KCl、26g的MgSO4·7H2O、76g的KH2PO4、50ml的COVE痕量金屬溶液、并且去離子水補足至1升。
-COVE痕量金屬溶液由以下構成:0.04g的NaB4O7·10H2O、0.4g的CuSO4·5H2O、1.2g的FeSO4·7H2O、0.7g的MnSO4·H2O、0.8g的Na2MoO2·2H2O、10g的ZnSO4·7H2O、并且去離子水補足至1升。
-LB+Amp培養(yǎng)基由以下各項構成:10g的胰蛋白胨、5g的酵母提取物、5g的NaCl、并且去離子水補足至1升。在高壓滅菌之后,添加在水中的1ml的100mg/ml的氨芐青霉素溶液。
-PDA平板由以下各項構成:39g的馬鈴薯右旋糖瓊脂(Difco),并且去離子水補足至1升。
-PEG緩沖液由以下構成:500g的聚乙二醇4000(PEG 4000)、10mM CaCl2、10mM Tris-HCl pH 7.5,并且去離子水補足至1升;過濾除菌。
-SOC培養(yǎng)基由以下構成:0.5g的NaCl、5g的酵母提取物、20g的胰蛋白胨、10ml的250mM KCl、并且去離子水補足至1升。
-STC由以下構成:1M山梨醇、10mM CaCl2、以及10mM Tris-HCl,pH 7.5,過濾除菌。
-TAE緩沖液由以下各項構成:4.84g的Tris堿、1.14ml的冰醋酸、2ml的0.5M EDTA(pH 8)、并且去離子水補足至1升。
-木霉基本培養(yǎng)基(TrMM)平板(用于亞培養(yǎng))由以下構成:30g蔗糖、20ml COVE鹽溶液、0.6g的CaCl2.2H2O、6g的(NH4)2SO4、25g的諾布爾瓊脂、并且去離子水補足至1升。
-木霉痕量金屬溶液由以下構成:216g的FeCl3·6H2O、58g的ZnSO4·7H2O、27g的MnSO4·H2O、10g的CuSO4·5H2O、2.4g的H3BO3、336g的檸檬酸、并且去離子水補足至1升。
-YP培養(yǎng)基由以下各項構成:10g的酵母提取物、20g的細菌蛋白胨、并且去離子水補足至1升。
-2XYT加氨比西林平板由以下各項構成:16g的胰蛋白胨、10g的酵母提取物、5g的氯化鈉、15g的細菌用瓊脂(Bacto agar)并且去離子水補足至1升。在高壓蒸汽處理的培養(yǎng)基回火到55℃后,添加1ml的100mg/ml的氨比西林。
采購的材料和菌株
使用大腸桿菌DH5-α(東洋公司(Toyobo))用于質粒構建和擴增。使用凱杰質粒試劑盒(Qiagen Plasmid Kit)(凱杰公司)來回收擴增的質粒。使用DNA連接試劑盒(寶生物公司(TAKARA))或T4DNA連接酶(寶靈曼公司(BOEHRINGER MANNHEIM))來進行連接。QIAQUICKTM凝膠提取試劑盒(凱杰公司)被用于純化PCR片段并從瓊脂糖凝膠中提取DNA片段。
克隆試劑盒和大腸桿菌細胞(Fusion-Blue)被用于構建pDAu571表達載體連同pDAu703。PCR擴增使用高保真DNA聚合酶進行。
表達宿主菌株黑曲霉NN059095通過諾維信分離并且是從土壤中分離的黑曲霉NN049184的衍生物。NN059095經遺傳修飾以破壞淀粉葡糖苷酶活性的表達。
里氏木霉菌株981-O-8(D4)是里氏木霉RutC30(ATCC 56765;蒙特尼考特(Montenecourt)和伊夫利(Eveleigh),1979,化學進展叢書(Adv.Chem.Ser.)181:289-301的一種誘變菌株。
里氏木霉菌株AgJg115-104-7B1(WO 2011/075677)是里氏木霉菌株981-O-8(D4)的ku70-衍生物。
曲霉的轉化
曲霉屬物種的轉化可使用用于酵母轉化的一般熟知的方法實現(xiàn)。將黑曲霉宿主菌株接種至100ml的補充有10mM尿苷的YPG培養(yǎng)基上,并且在32℃下在80rpm下孵育16hr。將球粒進行收集并且用0.6M KCl洗滌,并且將其再懸浮于包含商業(yè)葡聚糖酶產品(GLUCANEXTM,諾維信公司(Novozymes A/S),鮑斯韋(Bagsvaerd),丹麥)的20ml 0.6M KCl(終濃度為20mg/ml)中。將懸浮液在32℃下伴隨振蕩(80rpm)孵育直到形成原生質體,并且然后用STC緩沖液洗滌兩次。將這些原生質體用血細胞計數器計數,并且在STC:STPC:DMSO的8:2:0.1溶液中再懸浮并且調整至2.5x 107個原生質體/ml的終濃度。
將大約4pg的質粒DNA添加至100pl的原生質體懸浮液中,輕輕混合,并且冰上孵育30分鐘。添加1ml的SPTC,并且將原生質體懸浮液在37℃下孵育20分鐘。在添加10ml的50℃Cove頂層瓊脂糖之后,將反應液傾例于Cove瓊脂平板上,并且將平板于32℃下孵育5天。
PCR擴增
5x PCR緩沖液(包含MgCl2)20μl
2.5mM dNTP混合物10μl
正向引物(100pM)1μl
反向引物(100pM)1μl
擴展高保真聚合酶(羅氏公司(Roche))1μl
模板DNA(50-100ng/pl)1μl
蒸餾水補足至100μl
PCR條件:
1.94℃,2min
2.94℃,0.5min
3.55℃,0.5min
4.72℃,1-2min
2-4.30個循環(huán)
5.72℃,10min
用于酶產生的MTP培養(yǎng):
將曲霉文庫的孢子接種于96深孔板的0.5-1ml的1/4YPM培養(yǎng)基中,并在600rpm,30℃下培養(yǎng)2-3天。
Southern雜交
將所選擇的轉化體的菌絲體從在100ml YPG培養(yǎng)基中的過夜培養(yǎng)物中收獲,用蒸餾水沖洗,干燥并且冷凍在-80℃下。將研磨的菌絲體用蛋白酶K和RNA酶A在65℃下孵育1小時。將基因組DNA通過苯酚/CHCl3萃取兩次進行回收,隨后進行EtOH沉淀并且在蒸餾水中再懸浮。
遵循制造商的說明書,使用PCR DIG探針合成試劑盒(羅氏應用科學公司(Roche Applied Science),印第安納州,印第安納波利斯(Indianapolis,IN))合成非放射性探針。根據制造商的說明書,使用QIAQUICKTM凝膠提取試劑盒(凱杰公司,巴倫西亞,加利福尼亞州)將DIG標記的探針進行凝膠純化。
將5微克的基因組DNA用適當的限制性內切酶完全消化16小時(40μl總體積、4U酶/μl DNA)并且在0.8%瓊脂糖凝膠上運行。將該DNA在凝膠中通過用0.2M HCl處理進行片段化、變性(0.5M NaOH,1.5M NaCl)并且進行中和(1M Tris,pH 7.5;1.5M NaCl)用于隨后在20X SSC中轉移到海邦(Hybond)N+膜(安瑪西亞公司(Amersham))上。將該DNA進行UV交聯(lián)到該膜上并且在42℃下在20ml DIG Easy Hyb(羅氏診斷產品有限公司(Roche Diagnostics Corporation),曼海姆,德國)中預雜交1小時。
將變性的探針直接添加至DIG Easy Hyb緩沖液中并且在42℃下進行過夜雜交。在雜交后洗滌(在2X SSC中、室溫、5分鐘洗滌兩次;并且在0.1X SSC中、68℃洗滌兩次,各15min),根據制造商的方案,使用DIG檢測系統(tǒng)和CPD-Star(羅氏公司)進行化學發(fā)光檢測。DIG-標記的DNA分子量標記II(羅氏公司)被用于標準標記。
實例1.用于采用無啟動子的選擇標記將酶編碼基因文庫插入到基因組中的黑曲霉宿主/載體系統(tǒng)
分兩個步驟構建包含插入其基因組中的酶編碼多核苷酸文庫的黑曲霉,通過先整合由p002表示的質粒(SEQ ID NO:1中提供的完整DNA序列,并在圖1中示出其示意圖),該質粒包括(按以下順序):
a)黑曲霉酸性α-淀粉酶編碼基因的5’基因組側翼區(qū);
b)可操作地與FLP編碼重組酶編碼基因和米曲霉硝酸還原酶基因終止子連接的構巢曲霉木聚糖酶基因啟動子;
c)曲霉中性淀粉酶基因啟動子,
d)第一重組酶識別序列:
5’ttgaagttcctattccgagttcctattctctagaaagtataggaacttc(SEQ ID NO:2),
e)可操作地與一個潮霉素B抗性標記基因和amdS終止子連接的amdS啟動子;
f)第二重組酶識別序列
5’ttgaagttcctattccgagttcctattcttcaaatagtataggaacttca(SEQ ID NO:3),
g)不具有啟動子但具有終止子的乙酰胺酶(amdS)編碼基因;以及最后地
h)黑曲霉酸性α-淀粉酶編碼基因的3’基因組側翼區(qū)。
P002質粒轉化到黑曲霉菌株1007-8(WO 121600093中披露)中,隨后是潮霉素B選擇。獲得的轉化體通過Southern印跡分析證實具有正確地整合的預期的基因組序列。選擇陽性轉化體,并且原生質體從菌株制成。
在第二步驟中,表達載體pFRT-GlAMG是基于pUC19載體構建的;pFRT-GIAMG的完整DNA序列在SEQ ID NO:4中提供并且示意圖在圖2示出。載體包括(按以下順序):
a)重組酶識別序列,
b)來自密粘褶菌的葡糖淀粉酶基因(SEQ ID NO:5中的DNA;SEQ ID NO:6中的氨基酸序列)可操作地與黑曲霉葡糖淀粉酶終止子連接;
c)米曲霉翻譯延伸因子1(TEF1)啟動子,以在整合后,驅動在宿主細胞的基因組中的基因組無啟動子選擇標記的表達,由此也確保正確定向的整合;和
d)重組酶識別序列。
1μg的質粒轉化到原生質體中,以在Cove基礎平板上產生200-300菌落(科夫D.J.(Cove D.J.)1966.生物化學與生物物理學學報(Biochem.Biophys.cta)113:51-56),這些平板補充有1.0M的蔗糖作為碳源和1%木糖。菌落接種到包含0.1%支鏈淀粉的czapec-DOX平板通過碘染色(0.15%I2/1.5%KI)來確認葡糖淀粉酶活性。選擇一個陽性轉化體并且表示為黑曲霉1007-002-44-11。
實例2.采用無啟動子部分選擇標記的黑曲霉宿主/載體系統(tǒng)
質粒p007(圖3;SEQ ID NO:7),如下構建:用SpeI-FRTF3-amdS和amdS-F-探針的一個引物對,并以質粒p002作為模板以擴增amdS(4.0kbp)的SpeI位點識別序列C末端的DNA區(qū)來產生第一PCR片段。擴增的PCR產物然后通過SpeI和PacI消化。
引物SpeI-FRTF3-amdS(81mer;SEQ ID NO:8):
5’tggcgtagactagttgaagttcctattccgagtcctattcttcaaatagtataggaacttcatcagggagatgtaacaac
引物amdS-F-探針(22mer;SEQ ID NO:9):
5’ctatggagtcaccacatttccc
包括重組酶識別序列和與酶編碼基因可操作地連接的中性淀粉酶啟動子的DNA片段(1.0kbp),是通過用PacI和BgIII的質粒p002的雙重消化制備的。
包含可操作地與潮霉素抗性編碼基因和amdS終止子連接的amdS啟動子的DNA片段(3.0kbp)是通過用BgIII和SpeI的p002的雙重消化制備的。
這三個DNA片段連接在一起,并轉化到大腸桿菌DH5α中。所得質粒命名為p007。
p007質粒包含可操作地與FLP重組酶基因連接的啟動子和終止子、另外的NA2啟動子、具有FRTs之間的啟動子和終止子的潮霉素基因,和缺乏N-末端序列及其第一個內含子的一半的部分amdS選擇標記基因,所有兩側是兩個酸性α-淀粉酶側翼基因組區(qū)域。
質粒p007轉化到黑曲霉菌株1007-8(WO 121600093中披露)中,隨后是潮霉素B選擇。獲得的轉化體通過Southern印跡分析證實具有正確的整合的序列。
表達載體,pFRT-BsAMG(圖4;SEQ ID NO:10),是基于pUC19載體構建的,它包括(按以下順序):
a)重組酶識別序列,
b)來自Byssocorticium的葡糖淀粉酶基因(SEQ ID NO:11中示出的DNA序列,SEQ ID NO:12中編碼的氨基酸序列)或一個突變的葡糖淀粉酶編碼基因,連同黑曲霉葡糖淀粉酶終止子,
c)米曲霉TEF1啟動子(旨在驅動在受體宿主細胞的基因組中的選擇標記的表達)可操作地與部分N-末端乙酰胺酶amdS基因連接;和
d)重組酶識別序列。
該載體是通過將SEQ ID NO:13中示出的部分乙酰胺酶基因插入到TEF1啟動子(Ptef1)和第二識別序列之間,并且將來自粘褶菌屬的葡糖淀粉酶基因交換為Byssocorticium葡糖淀粉酶基因。
在作為模板的pFRT-BsAMG上使用M13M4和M13RV引物進行PCR,并且擴增包含第一重組酶識別序列的4kb的片段、來自Byssocorticium的葡糖淀粉酶基因(或突變的葡糖淀粉酶基因)、黑曲霉葡糖淀粉酶終止子、TEF1啟動子、部分N末端乙酰胺酶基因和第二重組酶識別序列。
引物M13RV(SEQ ID NO:14):caggaaacagctatgac
引物M13M4(SEQ ID NO:15):gttttcccagtcacgac
pFRT-BsAMG和PCR片段均被轉化并在Cove基礎平板上和1%木糖培養(yǎng)。菌落接種到包含0.1%支鏈淀粉的czapec-dox平板通過碘染色(0.15%I2/1.5%KI)來確認葡糖淀粉酶活性。
實例3.黑曲霉中的單拷貝定點基因插入
使用In-Fusion克隆的質粒文庫構建(Clontech公司)
40ng的pFRT-GlAMG表達載體被限制性內切酶XhoI和BsiW1消化,以切除存在的AMG編碼基因。用2個引物對進行兩個PCR,正向簡并引物和與表達載體具有多于15bp的重疊的引物,和M13 M4和與簡并引物具有15bp重疊的反向引物,使用pFRT-GIAMG載體作為模板:
融合載體R中的引物(SEQ ID NO:16):tatgcgttatcgtacgcac
引物M13 M4(SEQ ID NO:17):gttttcccagtcacgac
用于BsAMG文庫的引物對如下所示:
引物M49X F(27mer;SEQ ID NO:18):gtcaacccggactacnnktacacatgg
引物M49X R(18mer;SEQ ID NO:19):gtagtccgggttgacttg
消化的載體和PCR片段與In-Fusion混合物混合,轉化到大腸桿菌DH5α中。合并獲得的大腸桿菌轉化體并提取質粒用于文庫構建。
PCR文庫構建
用兩個引物對,簡并引物,和SOE-MR R和SOE-M4F,和簡并引物的配對反向引物,使用pFRT表達載體作為模板進行第一PCR。
用引物對,SOE-F和SOE-R,以及來自第一PCR的PCR片段進行第二SOE PCR。回收所得4kb片段作為PCR片段文庫用于曲霉文庫構建。
引物SOE-M4F(SEQ ID NO:20):5’gtactatctggcattggtacgttttcccagtcacgac
引物SOE-MR R(SEQ ID NO:21):5’tggttatgatttcggcgatgcaggaaacagctatgac
引物SOE-F(SEQ ID NO:22):5’gtactatctggcattggtac
引物SOE-R(SEQ ID NO:23):5’tggttatgatttcggcgatg
1μg的每種質粒或PCR片段文庫轉化到黑曲霉1007-002-44-11宿主菌株中。轉化體在包含COVE-N甘氨酸瓊脂(100μl/孔)的96孔MTP中分離,并在32℃下培養(yǎng)1周以具備足夠的孢子形成。添加100μl/孔的0.01%吐溫20至每個孔中,并且孢子懸浮液接種在包含YPG 96孔MTP中,并在30℃下伴隨振蕩培養(yǎng)3天。然后篩選文庫。
來自曲霉克隆的DNA分離
通過如下描述的直接菌落PCR擴增方法或通過使用引物對“插入解救F”和“R”在分離染色體DNA上的PCR擴增曲霉菌株的插入DNA。
引物插入解救F(SEQ ID NO:24):5’aatctcagaacaccaatatc
引物插入解救F(SEQ ID NO:25):5’aacactatgcgttatcgtac
菌落PCR如下進行:添加Conidias至1,5ml管,添加500μl的TE-緩沖液并簡單混合。該管內容物在水中稀釋10-20倍,并且將1μl的稀釋的混合物用作模板用于PCR。擴增的DNA通過瓊脂糖凝膠電泳和QIAquick凝膠提取試劑盒(凱杰公司)純化,并且然后測序來檢查構建的文庫的質量。該文庫是正確的。
實例4米曲霉宿主/載體系統(tǒng)
米曲霉菌株JaL1394(在WO 2012/160093中披露)在此實例中被用作宿主菌株。我們已經構建了由pDAu571表示的整合表達載體(圖5;SEQ ID NO:26),用于使用FLP/FRT系統(tǒng),位點特異性重組到米曲霉JaL1394的染色體中。
載體pDAu571是由三部分構成(部分-I,部分-II,部分-III;圖5):
部分-I是由兩個短FRT(翻轉酶識別目標)位點限定。在FRT位點之間發(fā)現(xiàn)以下元件:
●具有可以使用獨特的限制性酶切位點BamHI,XhoI,替換為任何基因或感興趣的多核苷酸文庫(GOI)的“填充序列”的表達盒。
●構巢曲霉的pyrG選擇標記,用來因為它們在沒有補充尿苷的基本培養(yǎng)基上生長的能力選擇轉化的宿主細胞;pyrG標記可操作地與其天然啟動子和黑曲霉葡糖淀粉酶基因(Tamg)(SEQ ID NO:26的位置4057-5918)的終止子連接。
質粒的這一部分經由宿主和載體中的各自FRT位點之間的FLP輔助的重組被整合到宿主有機體的染色體中。當評估基因文庫時,有利地確保載體的部分-I以相同的方向被整合到所有轉化體中。這減少了來自側翼區(qū)(例如,來自通讀)基因表達的任何變化。在染色體中FRT-F和FRT-F3位點的序列和確保染色體中整合部分的正確的方向的載體之間存在小差異。宿主染色體和載體中的FRT-F3位點將通過FLP翻轉酶彼此重組,并且FRT-F位點也將如此。
FRT-F(SEQ ID NO:26的位置1-49):
5’-ttgaagttcctattccgagttcctattctctagaaagtataggaacttc(SEQ ID NO:27)
FRT-F3(SEQ ID NO:26的位置5925-5974):
5’-ttgaagttcctattccgagttcctattcttcaaatagtataggaacttca(SEQ ID NO:28)
表達盒包含人工NA2TPI啟動子,該啟動子構建自融合至構巢曲霉磷酸丙糖異構酶的非翻譯前導序列的黑曲霉中性淀粉酶II啟動子(SEQ ID NO:26的位置73-814)。
此外,表達盒包含所謂的“填充序列”,它在這種情況下是編碼來自大豆的脂氧合酶I的基因(SEQ ID NO:22的位置824-3343)。如已經提到的,載體中填充序列可以使用兩個獨特限制酶位點BamHI,XhoI被替換為感興趣的任何其他基因。
最后,表達盒包含黑曲霉葡糖淀粉酶基因的終止子(SEQ ID NO:26的位置3358-4048)。
pDau571載體的部分-II是翻轉酶編碼基因(sFLP)的合成版本(SEQ ID NO:26的位置4875-6143(反向鏈))。翻轉酶基因表達通過米曲霉翻譯延伸因子1α啟動子(pTEF1)(SEQ ID NO:26的位置7759-8447(反向鏈))連同米曲霉硝酸還原酶終止子(TniaD))(SEQ ID NO:26的位置5991-6478(反向鏈))來控制。
對于在大腸桿菌中質粒的增殖,pDau571載體的部分-III是必需的,并且包括大腸桿菌β-內酰胺酶(ampR)可選擇標記和源自熟知的pUC質粒的大腸桿菌復制起點(SEQ ID NO:26的位置8448-11101)。
質粒pDAu571(其中填充序列由所感興趣的多核苷酸文庫替換)被轉化到菌株Jal1394的原生質體中,如下:
100μl原生質體與10μl小量制備質粒DNA(未消化或線性化)或跨越pDAu571的部分-I和部分-II的PCR產物和300μl 60%的PEG在室溫下孵育20min;然后添加5ml Topagar(+10mM NaNO3),并將整個轉化混合物平鋪在蔗糖/10mM NaNO3平板上。37℃下孵育平板,直到可以發(fā)現(xiàn)孢子。為了純化單一轉化體,菌落再次復制到新蔗糖/10mM NaNO3平板上,并在37℃下孵育,直到孢子發(fā)育。
獲得的轉化體可以通過使用位于表達盒側翼兩側的amy2基因座內的診斷引物的PCR來驗證表達盒的amy2基因座的正確整合,該表達盒包括FRT位點和位于表達盒內的基因特異性引物。
實例5.分裂標記米曲霉的宿主/載體系統(tǒng)的構建
先前實例提供了用于進入適合的絲狀真菌宿主細胞的翻轉酶介導的位點特異性重組和整合的表達載體。通過使用不同的重組酶識別序列確保整合表達盒的染色體中的正確的方向。
確保正確的方向的另一方式是采用分裂選擇標記,其中標記的一個非功能部分存在于宿主染色體中,并且標記的另一非功能部分是在進來的載體上。然后只有正確定向的整合生成功能第二選擇標記。該分裂標記原理在此實例中說明;在此第二選擇標記被定向在一個方向上,但它剛好也可以已經按其他方式被定向。
曲霉原生質體轉化和重組細胞的選擇所必需的培養(yǎng)基和溶液:
痕量金屬
鹽溶液
COVE培養(yǎng)基
20ml鹽溶液
20g瓊脂
218g山梨醇
H2O補足1l
高壓滅菌并且然后添加:
50ml 20%葡萄糖
10ml1M尿素。
Cove-N-甘氨酸斜面
蔗糖培養(yǎng)基
20ml鹽溶液。
342g蔗糖。
H2O補足1l
高壓滅菌并且然后添加:
10mM硝酸鈉
ST 0.6M山梨醇
100mM Tris/HCl pH 7.0
STC 1.2M山梨醇
10mM CaCl2
10mM Tris/HCl pH7.5。
PEG 60%(W/V)PEG 4000(BDH)(6g PEG+~5ml無菌水,置于60℃-65℃)
10mM CaCl2(50μl的2M CaCl2)
10mM Tris/HCl pH 7.5。(100μl的1M的Tris)
蔗糖瓊脂平板
10g瓊脂
10ml鹽溶液
1M蔗糖補足至500ml
高壓滅菌器滅菌
乙酰胺平板
10ml鹽溶液
10g瓊脂
1M蔗糖補足至500ml1。
高壓滅菌。
冷卻至大約65℃,添加10mM乙酰胺和15mM CsCl。
對于500毫升,Triton X-100 50μl(僅在復制平板中)
在米曲霉DAu716的amy2基因座的FRT位點的引入
質粒pJAl1258(在WO 12160097A1中描述)被改良生成由pDAu703表示的質粒。質粒pDAu703按順序包含以下元件(圖6;SEQ ID NO:29):
●amy2-3’側翼區(qū)(490bp);SEQ ID NO:29的位置449-938;
●pyrG啟動子可操作地與包含pyrG CDS的5’端(第一外顯子及其第一內含子的5’端)的部分的pyrG基因連接;
●FRT-F3位點(50bp);SEQ ID NO:29的位置1452-1501;
●黑曲霉AMG終止子(Tamg)可操作地與amdS編碼基因,SEQ ID NO:29的位置1511-2200連接;
●構巢曲霉乙酰胺酶基因(amdS),SEQ ID NO:29的位置2232-4131;
●強磷酸丙糖異構酶啟動子(Ptpi)可操作地與Amds編碼基因連接;這允許在乙酰胺和ClCs上生長,即使按照預期基因組中僅存在AmdS選擇盒的一個拷貝,如果質粒pDAU703被整合到位于FRT位點的amy2基因座的一個拷貝中。SEQ ID NO:29的位置4140-4894;
●FRT-F位點(49bp);SEQ ID NO:29的位置4903-4951;
●amy2-5’側翼區(qū)(1114bp);SEQ ID NO:29的位置4964-6077;
●質粒的其余部分是由對于維持質粒作為細菌宿主細胞大腸桿菌中的復制質粒所必需的一部分DNA(大腸桿菌復制起點和氨芐青霉素抗性盒)構成。
質粒DNA pDAu703用NotI限制性內切酶消化,以從質粒的現(xiàn)在不相干大腸桿菌部分分離包含整合盒的DNA。
將線性化質粒pDAu703使用描述的標準程序(例如在WO 98/01470中)轉化進入米曲霉菌株Jal1338的原生質體(在WO 12160097 A1中披露),但是因為該菌株是的pyrG負型,需要補充10mM尿苷至培養(yǎng)基,因此其在沒有尿苷下不能生長。在AmdS選擇平板上選擇轉化體
所得重組宿主菌株已經具有兩個FRT位點連同分裂pyrG標記(第一外顯子和天然內含子的一部分)的5’端,該標記通過同源重組在amy2基因座與其自己的整合的啟動子可操作地連接,如在圖7中的頂部小圖中所示。在amy2基因座上的正確整合通過Southern印跡分析使用退火到amy2的3’端的探針檢查(圖7)。FRT盒的整合分別在EcoRI和XhoI消化物中的5114bp和2637bp處產生雜交信號(未示出)。該模式與Jal1338宿主不同,其中該amy2基因座不被破壞。選擇正確的菌株并用米曲霉DAu716表示(圖7,上圖)。
用攜帶脂肪酶編碼基因的pDAU724載體的DAu716的轉化
這個實例展示了FRT/FLP重組和分裂pyrG標記可以如何被用于有效地使表達盒的單拷貝插入以高頻存在于米曲霉中。我們使用來自綿毛嗜熱絲孢菌的脂肪酶基因(例如在WO 2008008950中披露)作為報告基因來測量在轉化的宿主中產生的脂肪酶的水平。
像在先前實例中,構建表達載體,這樣使得其一部分可以使用翻轉酶作為位點特異性重組介質,在FRT-位點被整合到宿主細胞的染色體中。要被整合到基因組中的質粒的一部分攜帶可操作地與NA2/TPi啟動子和黑曲霉AMG基因的終止子連接的脂肪酶基因。為了能夠選擇經由FRT位點已經成功整合表達盒的重組細胞,pyrG選擇標記的剩余部分也被包括在FRT位點之間。啟動子和第一外顯子存在于DAu716宿主中并且pyrG標記的剩余部分存在于進來的質粒上。當位點特異性重組時,pyrG標記將被重構為完整基因(其中其第一內含子內的FRT序列,將當然,從mRNA拼接出)并且重組細胞將能夠表達PyrG和生長在NaNO3作為單一氮源的平板上。
質粒pDAU724(圖7,中間;SEQ ID NO:30)由以下組成:
要被整合到曲霉屬宿主細胞的基因組DNA中的的部分-I,并且它由具有有表達盒的兩個FRT位點和分裂pyrG標記的一部分組成;
將不被整合到宿主細胞的基因組中的部分-II,并且它包含F(xiàn)LP酶表達盒連同大腸桿菌選擇標記和復制起點。
菌株DAu716生長在Cove-N-甘氨酸介質的斜面上直至可以看見孢子。
將10-20毫升的蔗糖培養(yǎng)基或YPD培養(yǎng)基添加至該斜面,并且通過漩渦振蕩斜面懸浮孢子。孢子懸浮液轉移到包含100ml蔗糖培養(yǎng)基和10mM硝酸鈉(或其它氮源)的聚碳酸酯搖瓶(500毫升)中。在30℃下孵育燒瓶24hr(200rpm)。
通過神奇濾布(miracloth)過濾收集菌絲體,并且使用200ml 0.6M MgSO4洗滌。從菌絲體吸出剩余液體,例如使用塑料移液器。
1-2g的菌絲體被轉移到小的(100ml)聚碳酸酯燒瓶中,瓶中包含:
75-150mg Glucanex
10ml 1.2M MgSO4
100ul 1M NaH2PO4pH 5.8
并且懸浮菌絲體,添加1ml的12mg/ml的BSA(無菌過濾的)
在37℃孵育懸浮液1/2-2hr,并且經常通過顯微術監(jiān)測原生質體形成。
將原生質體懸浮液通過神奇濾布(miracloth)過濾到25毫升離心管中,并且將懸浮液用5ml ST(小心不要與下層混合)覆蓋。將所得原生質體,通過離心(2500rpm/1350g,15min,緩慢加速)分帶?;厥赵|體的界面帶,并且轉移到新鮮的管中。
用兩體積的STC稀釋原生質體,隨后離心(2500rpm/1350g,5min)。然后用5ml STC洗滌原生質體兩次(使用再懸浮和離心),并且然后在STC中再懸浮至大約5x107個原生質體/ml的濃度。
對于每次轉化,將正在轉化的DNA添加至例如14ml管的底部,并且添加100μl的原生質體。添加300μl的PEG,并且將該管用手輕輕混合。孵育20分鐘(室溫)后,在50℃的溫度下添加6ml頂層瓊脂,并立即將該懸浮液倒在具有10mM的NaNO3的選擇性蔗糖瓊脂平板上。
將平板在37℃孵育,直至轉化體清晰可見并且開始形成孢子。20個轉化體復制到具有Triton的新選擇平板上,以分離菌落,可以通過發(fā)酵,Southern印跡分析或酶活性測定進一步分析這些菌落。
確認染色體中存在的amdS標記已經通過在包含CsCl(內源乙酰胺酶的抑制劑)和作為唯一氮源的乙酰胺的平板上將轉化體劃線,在轉化體中被引進的脂肪酶基因替換。正確的轉化體不應該能夠在這些平板上生長。我們測試了20個重組細胞,這些重組細胞是pDAu724的轉化成DAu716后獲得的,并與親本宿主菌株DAu716相比,僅觀察到輕微的生長表型,其中AmdS選擇標記仍然存在。
證實所有20個轉化體均包含正確插入在FRT位點的脂肪酶表達盒的一個插入的拷貝。
將20個轉化體接種至3ml YPD在10ml 24深孔板(沃特曼(Whatman)公司)中,用Airpore膠帶(Quiagen公司)密封,并且在200rpm的攪拌下30攝氏度孵育4天。收集上清液用于進一步分析(脂肪酶測定和SDS-PAGE),并收集菌絲體用于基因組提取和Southern分析。
20個轉化體在脂肪酶測定中示出可比較脂肪酶活性,連同在SDS-PAGE凝膠上示出可比較脂肪酶蛋白水平。此外,Southern印跡證實,所有20個轉化體僅具有正確地整合到染色體中的預期單一脂肪酶基因拷貝。
實例6:野生型紅豆(Vigna angularis)木葡聚糖內糖基轉移酶16(VaXET16)的克隆,用于在米曲霉篩選菌株中表達
在此密碼子優(yōu)化野生型紅豆(Vigna angularis)木葡聚糖內糖基轉移酶16(VaXET16)cDNA通過酵母重組克隆克隆到米曲霉Flp/FRT穿梭載體pDAu571(圖5)中,生成載體pDLHD0075(圖8)。
表達載體pDLHD0075被構建為包含大腸桿菌pUC復制起點、大腸桿菌β-內酰胺酶(ampR)可選擇標記、URA3酵母可選擇標記、酵母2微米復制起點、NA2-tpi啟動子、密碼子優(yōu)化飛VaXET16開放閱讀框(cDNA序列為SEQ ID NO:31并且氨基酸序列為SEQ ID NO:32)、黑曲霉葡糖淀粉酶終止子、構巢曲霉pyrG選擇標記、米曲霉TEF1啟動子和米曲霉NIAD終止子之間的釀酒酵母2μm翻轉酶ORF、和釀酒酵母2μm翻轉酶識別目標FRT-F和FRT-F3。
質粒pDLHD0075通過使用酵母重組克隆合并四個DNA片段生成:片段1包含翻轉酶表達盒,F(xiàn)RT-F3,和來自pDAU571的AMG終止子,以及與片段4和2同源的側翼序列。片段2包含大腸桿菌pUC復制起點、大腸桿菌β-內酰胺酶(ampR)選擇標記、URA3酵母選擇標記、來自pDLHD0044的酵母2微米復制原點、和與片段1和3同源的側翼序列。片段3包含所述NA2-tpi啟動子、來自pDLHD0044的VaXET16密碼子優(yōu)化基因、和與片段2和4同源的側翼序列。片段4包含黑曲霉淀粉葡萄糖苷酶終止子序列(AMG終止子)和作為來自pDAU571的可選擇標記的構巢曲霉乳清苷-5’-磷酸脫羧酶基因(pyrG),以及與片段3和1同源的側翼序列。
使用以下所示的引物615726(正義)和引物615728(反義)擴增片段1。這些引物被設計成包含分別與片段4和2同源的序列的側翼區(qū)(小寫),用于PCR片段之間的無連接克隆。
引物615726(正義):
accgggaggaaggctggaaaGCTTACGAGAAAAGAGTTGGACTTTGAGGG(SEQ ID NO:33)
引物615728(反義):
tgagcgaggaagcggAAGAGCGCCCAATACGCAAACCGCC(SEQ ID NO:34)
片段1在反應中通過PCR來擴增,該反應由10ng的pDAU571、0.5μl的DNA聚合酶、20pmol的引物615726、20pmol的引物615728、1μl的10mM dNTP、10μl的5XHF緩沖液、和35.5μl的水構成。該反應在熱循環(huán)儀中孵育,程序為1個循環(huán),在98℃下持續(xù)30秒;以及30個循環(huán),每個循環(huán)在98℃下持續(xù)10秒,在60℃下持續(xù)10秒,以及在72℃下持續(xù)120秒。將所得3.3kb PCR產物(片段1)用1μl的Dpn I進行處理,以去除質粒模板DNA。直接添加Dpn I至PCR反應管中,充分混合,并且在37℃下孵育60分鐘。
使用以下所示的引物615729(正義)和引物615731(反義)擴增片段2。這些引物被設計成包含分別與片段1和3同源的序列的側翼區(qū)(小寫),用于PCR片段之間的無連接克隆。
引物615729(正義):
tgcgtattgggcgctcttCCGCTTCCTCGCTCACTGACTC(SEQ ID NO:35)
引物615731(反義):
tatactttctagagaataggaactcggaataggaacttcaaGGAACAACACTCAACCCTATCTCGGTC(SEQ ID NO:36)
片段2在反應中通過PCR來擴增,該反應由10ng的pDLHD0044、0.5μl的DNA聚合酶、20pmol的引物615729、20pmol的引物615731、1μl的10mM dNTP、10μl的5XHF緩沖液、和35.5μl的水構成。該反應在熱循環(huán)儀中孵育,程序為1個循環(huán),在98℃下持續(xù)30秒;以及30個循環(huán),每個循環(huán)在98℃下持續(xù)10秒,在60℃下持續(xù)10秒,以及在72℃下持續(xù)120秒。將所得4.2kb PCR產物(片段2)用1μl的Dpn I進行處理,以去除質粒模板DNA。直接添加Dpn I至PCR反應管中,充分混合,并且在37℃下孵育60分鐘。
使用以下所示的引物615730(正義)和引物615611(反義)擴增片段3。這些引物被設計成包含分別與片段2和4同源的序列的側翼區(qū)(小寫),用于PCR片段之間的無連接克隆。
引物615730(正義):
tccgagttcctattctctagaaagtataggaacttcGCATTTATCAGGGTTATTGTCTCATGAGCGG(SEQ ID NO:37)
引物615611(反義):
tctagatctcgagtcaGATGTCCCTATCGCGTGTACACTCG(SEQ ID NO:38)
片段3在反應中通過PCR來擴增,該反應由10ng的pDLHD0044、0.5μl的DNA聚合酶、20pmol的引物615730、20pmol的引物615611、1μl的10mM dNTP、10μl的5XHF緩沖液、和35.5μl的水構成。該反應在熱循環(huán)儀中孵育,程序為1個循環(huán),在98℃下持續(xù)30秒;以及30個循環(huán),每個循環(huán)在98℃下持續(xù)10秒,在60℃下持續(xù)10秒,以及在72℃下持續(xù)120秒。將所得1.7kb PCR產物(片段3)用1μl的Dpn I進行處理,以去除質粒模板DNA。直接添加Dpn I至PCR反應管中,充分混合,并且在37℃下孵育60分鐘。
使用以下所示的引物615610(正義)和引物615727(反義)擴增片段4。這些引物被設計成包含分別與片段3和1同源的序列的側翼區(qū)(小寫),用于PCR片段之間的無連接克隆。
引物615610(正義):
acacgcgatagggacatcTGACTCGAGATCTAGAGGGTGACTGAC(SEQ ID NO:39)
引物615727(反義):
aactcttttctcgtaagcTTTCCAGCCTTCCTCCCGGTAC(SEQ ID NO:40)
片段4在反應中通過PCR來擴增,該反應由10ng的pDAU571、0.5μl的DNA聚合酶、20pmol的引物615610、20pmol的引物615727、1μl的10mM dNTP、10μl的5XHF緩沖液、和35.5μl的水構成。該反應在熱循環(huán)儀中孵育,程序為1個循環(huán),在98℃下持續(xù)30秒;以及30個循環(huán),每個循環(huán)在98℃下持續(xù)10秒,在60℃下持續(xù)10秒,以及在72℃下持續(xù)120秒。將所得1.9kb PCR產物(片段4)用1μl的Dpn I進行處理,以去除質粒模板DNA。直接添加Dpn I至PCR反應管中,充分混合,并且在37℃下孵育60分鐘。
使用基于酵母同源性的重組克隆,使用以下程序來合并四個PCR片段。將PCR片段的每種的10μl等分試樣與來自鮭魚睪丸的100μg的單鏈脫氧核糖核酸(西格瑪奧德里奇,圣路易斯,密蘇里州,美國)、100μl的菌株YNG318的感受態(tài)酵母細胞(釀酒酵母ATCC 208973)、和600μl的PLATE緩沖液(西格瑪奧德里奇,圣路易斯,密蘇里州,美國)合并,并且混合。將反應在30℃下以200rpm振蕩孵育30分鐘。然后將該反應在42℃下在沒有振蕩的情況下繼續(xù)15分鐘。將這些細胞通過在5,000x g下離心1分鐘進行沉淀,并且棄去上清液。將細胞球粒懸浮于200μl的高壓蒸汽處理的水中,并且分在兩個包含合成的所定義的培養(yǎng)基缺少尿苷的瓊脂平板,并且在30℃下孵育3天。將這些酵母菌落使用1ml的高壓蒸汽處理的水從平板中分離。將這些細胞通過在13,000x g下離心30秒進行沉淀,并且將100μl等分試樣的玻璃珠添加到該管中。將細胞和珠混合物懸浮在250μl的P1緩沖液(凱杰公司,巴倫西亞,加利福尼亞州,美國)中,并且然后渦旋1分鐘來裂解這些細胞。使用旋轉迷你制備型試劑盒純化質粒DNA。根據制造商的說明書,然后將3μl等分試樣的質粒DNA轉化到大腸桿菌ONE TOP10電轉化感受態(tài)細胞中。將50μl的轉化細胞散布于每ml補充有100μg氨比西林的2XYT平板上,并且在37℃下孵育過夜。將轉化體各自挑入每ml補充有100μg的氨比西林的3ml的LB培養(yǎng)基中,并且在37℃下在250rpm的振蕩下生長過夜。使用旋轉迷你制備型試劑盒從菌落中純化質粒DNA。將使用3130XL遺傳分析儀的DNA測序用來確認指定為質粒pDLHD0075的最終質粒中三個片段中的每個的存在(圖8)。
實例7:在米曲霉篩選菌株JaL1394中按單拷貝的野生型紅豆(Vigna angularis)木葡聚糖內糖基轉移酶16(VaXET16)表達的確認
米曲霉JaL1394(在WO 2012/160093中披露)用包含密碼子優(yōu)化VaXET16基因的質粒pDLHD0075轉化。
將來自米曲霉JaL1394的大約107孢子的接種于500ml搖瓶中的補充有10mM尿苷的100ml的YP+2%葡萄糖培養(yǎng)基中,并且在28℃和110rpm下孵育過夜。將10ml的過夜培養(yǎng)物在125ml無菌真空濾器中過濾,并且將菌絲用50ml的0.7M KCl-20mM CaCl2洗滌兩次。將剩余液體通過真空過濾去除,留下墊在濾器上。將菌絲體再懸浮于10ml的0.7M KCl-20mM CaCl2中,并且轉移到無菌125ml搖瓶中,該搖瓶包含20mg的200G(諾維信瑞士股份公司(Novozymes Switzerland AG),Neumatt,瑞士)/ml和0.2mg的幾丁質酶(西格瑪奧德里奇,圣路易斯,密蘇里州,美國)/ml(在10ml的0.7M KCl-20mM CaCl2中)。將該混合物在37℃和100rpm下孵育30-90分鐘,直到從菌絲體中產生原生質體。將該原生質體混合物通過襯有(Calbiochem公司,圣迭哥,加利福尼亞州,美國)的無菌漏斗進行過濾,到無菌50毫升塑料離心管中,以去除菌絲體碎片。將在上的碎片徹底地用10ml的0.7M KCl-20mM CaCl2進行洗滌并且在2500rpm下,在20℃-23℃下,離心10分鐘。去除該上清液,并且將原生質體球粒再懸浮于20ml的1M山梨醇-10mM CaCl2-10mM Tris-HCl(pH 6.5)中。將該步驟重復兩次,并且將最終的原生質體球粒再懸浮于1M山梨醇-10mM CaCl2-10mM Tris-HCl(pH 6.5)中,以獲得2x107/ml的最終原生質體濃度。
原生質體通過添加兩μg的pDLHD0075至無菌12ml塑料離心管的底部轉化。將一百μl的原生質體添加至管中,隨后添加在10mM CaCl2-10mM Tris-HCl(pH 6.5)中的300μl的60%PEG-4000。將該管用手輕輕混合,并且在37℃下孵育30分鐘。將添加五ml的1M山梨糖醇-10mM CaCl2-10mM Tris-HCl(pH 6.5)添加到該轉化中,并且將該混合物轉移到150mm基本培養(yǎng)基瓊脂平板上。將轉化板在37℃下孵育直到轉化體出現(xiàn)。
挑出單個轉化體到新基本培養(yǎng)基瓊脂平板,并且在37℃下培養(yǎng)4天,直到轉化體形成孢子。新鮮孢子轉移到48孔深孔板,這些板包含2ml的YP+2%麥芽糊精培養(yǎng)基,覆蓋有可透氣密封件,并且在沒有振蕩下在28℃下生長4天。在4天生長后,將每個轉化體的培養(yǎng)基針對木葡聚糖內糖基轉移酶活性并且針對木葡聚糖內糖基轉移酶表達通過如下所概述的SDS-PAGE來測定。
活性測定展示,轉化體產生活性木葡聚糖內糖基轉移酶。
碘比色法測定來確定木葡聚糖內糖基轉移酶活性
木葡聚糖內糖基轉移酶活性使用由布洛瓦(Sulova)等人,1995,分析生物化學(Analytical Biochechemistry)229:80-85中描述的碘比色測定的修改版本進行測定。對于每個反應,5μl的羅望子木葡聚糖(麥格酶公司,布雷,英國)(5mg/ml在水中)與20μl的木葡聚糖低聚物(麥格酶公司,布雷,英國)(5mg/ml在水中)、10μl的400mM檸檬酸鈉pH5.5合并,并且分散到96孔板中。反應通過添加5μl的液體培養(yǎng)液至每個孔中啟動,并且在37℃孵育板10分鐘。反應通過添加200μl的由14%(w/v)Na2SO4、0.2%KI、0.1M HCl和0.5%I2構成的溶液猝滅,并且在黑暗中孵育30分鐘,然后在 M5分光光度計(Molecular Devices公司,桑尼維爾,加利福尼亞州,美國)中在620nm測量吸光度。
使用8%-16%無染色SDS-PAGE凝膠(伯樂實驗室有限公司,赫拉克勒斯,加利福尼亞州,美國)進行SDS-PAGE,并且使用以下設置,將該凝膠用無染色成像儀(伯樂實驗室有限公司,赫拉克勒斯,加利福尼亞州,美國)成像:5分鐘活化,自動成像曝光(強帶),高亮飽和像素=ON,顏色=考馬斯酸性染料,和帶檢測、分子量分析和報告禁用。SDS-PAGE揭示了大約32kDa的野生型VaXET16帶。
實例8:紅豆(Vigna angularis)木葡聚糖內糖基轉移酶16(VaXET16)的改進的表達變體的構建和鑒定
VaXET16基因突變體文庫通過位點飽和誘變構建。VaXET16基因的突變體文庫(文庫的每個片段包括突變VaXET16基因+構巢曲霉乳清苷-5’-磷酸脫羧酶pyrG選擇標記與FRT-F和FRT-F3翻轉酶識別靶序列)與包括米曲霉TEF1啟動子和米曲霉NIAD基因終止子之間的釀酒酵母2μm翻轉酶ORF的pDLHD0095載體一起轉化到如先前實例中所述的米曲霉JaL1394的原生質體中。37℃下在基本培養(yǎng)基瓊脂平板上原生質體恢復4天后,挑出單個菌落至包含2ml的YP+2%麥芽糖糊精培養(yǎng)基的48孔深孔板中,覆蓋有透氣密封,并且在沒有振蕩下在28℃下生長4天。在液體培養(yǎng)基生長4天后,如在先前實例中所述測定木葡聚糖內糖基轉移酶活性,并且更高活性變體被打分為表達命中。
孢子純化單個突變體菌株,并且再次培養(yǎng)以產生新鮮培養(yǎng)液,用于使用密碼子優(yōu)化基因,相對于表達野生型VaXET16米曲霉JaL1394菌株進行再次測試。如在先前實例中所述,通過SDS-PAGE分析培養(yǎng)液,用于增加木葡聚糖內糖基轉移酶蛋白產物的生產。
十一個表征的變體在來自48孔深孔板培養(yǎng)的4天培養(yǎng)液中,優(yōu)于親本基因的表達產量的相對改進在下表1中示出。相同的培養(yǎng)液的SDS-PAGE分析展示所有變體的優(yōu)于野生型VaXET的增加強度的VaXET帶,這與在活性測定中觀察到的相對改進很好地相關。野生型VaXET及其變體的SDS-PAGE帶為32kDa,除包含N175S突變的變體由于另外的糖基化具有大約37kDa的帶。
表1.
實例9:米曲霉中紅豆(Vigna angularis)木葡聚糖內糖基轉移酶16變體(VaXET16)基因的改進的表達的發(fā)酵規(guī)模確認
發(fā)酵工藝被用來相對于野生型VaXET16,表達VaXET16變體、A40G+I53A+N175S和A40G+F183I。
搖瓶培養(yǎng)基由以下構成:50g的蔗糖、10g的KH2PO4、0.5g的CaCl2、2g的MgSO4·7H2O、2g的K2SO4、2g的尿素、10g的酵母提取物、2g的檸檬酸、0.5ml的痕量金屬溶液、以及去離子水補足至1升。痕量金屬溶液由以下構成:13.8g的FeSO4·7H2O、14.3g的ZnSO4·7H2O、8.5g的MnSO4·H2O、2.5g的CuSO4·5H2O、3g的檸檬酸、以及去離子水補足至1升。
將一百ml的搖瓶培養(yǎng)基添加至500ml搖瓶。用來自固體平板培養(yǎng)的兩個塞接種搖瓶,并且在軌道搖床上以200rpm在34℃孵育24小時。將50ml的燒瓶培養(yǎng)液用于接種3升發(fā)酵容器。
每升分批發(fā)酵培養(yǎng)基(Fermentation batch medium)由以下構成:10g的酵母提取物、24g的蔗糖、5g的(NH4)2SO4、2g的KH2PO4、0.5g的CaCl2·2H2O、2g的MgSO4.7H2O、1g的檸檬酸、2g的K2SO4、0.5ml的止泡劑、和0.5ml的痕量金屬溶液。每升痕量金屬溶液由以下構成:13.8g的FeSO4·7H2O、14.3g的ZnSO4·7H2O、8.5g的MnSO4·H2O、2.5g的CuSO4·5H2O,和3g的檸檬酸。發(fā)酵補料培養(yǎng)基(fermentation feed medium)由麥芽糖構成。
將總計1.8升的發(fā)酵分批培養(yǎng)基添加到三升玻璃套發(fā)酵器中。發(fā)酵補料培養(yǎng)基以0到4.4g/l/hr的速度給予。將發(fā)酵容器維持在34℃的溫度,pH控制在6.1+/-0.1的設定點。將空氣以l vvm的速率添加到容器中,且且用以1100到1300rpm旋轉的Rushton葉輪攪拌。在發(fā)酵運行的第3、4、5、6和7天取樣,并且在3000x g離心以去除生物質。將上清液過濾滅菌,并且在5℃至10℃儲存。
可以通過以下概述的熒光偏振測定并且通過SDS-PAGE分析(參見上文),相對于野生型密碼子優(yōu)化基因,確定VaXET16變體表達水平。
針對木葡聚糖內糖基轉移活性的熒光偏振測定
根據由周(Zhou)等人,2006,生物催化與生物轉化(Biocatalysis and Biotransformation)24:107-120所描述的程序,通過木葡聚糖低聚物的還原端的還原氨化,隨后在100mM碳酸氫鈉(pH 9.0)在室溫下將XGO的氨基基團結合到熒光素異硫氰酸酯異構體I(西格瑪奧德里奇(Sigma Aldrich),圣路易斯,密蘇里州,美國)24小時,來產生熒光素異硫氰酸酯標記的木葡聚糖低聚物(FITC-XGO)。將結合反應產物在真空中濃縮干燥,溶解于0.5ml的去離子水,并且通過硅膠層析進行純化,該硅膠層析用從100:0:0.04至70:30:1梯度的乙腈:水:乙酸作為流動相進行洗脫。通過蒸發(fā)該緩沖液、溶解于D2O(西格瑪奧德里奇,圣路易斯,密蘇里州,美國),并且使用Varian400MHz MercuryVx(安捷倫(Agilent),圣克拉拉,加利福尼亞州,美國)通過1H NMR分析來確認純度和產物同一性。在-20℃下在黑暗中,儲存干燥的FITC-XGO,并且在解凍過程中干燥。
一mg的FITC-XGO與在200μl反應中的每ml的20mM檸檬酸鈉pH 5.0的1mg的羅望子木葡聚糖(麥格酶公司,布雷,英國)和18mg的VaXET16一起孵育至少30分鐘。合并樣品混合物并且通過添加冰冷的乙醇至80%(v/v)的終濃度進行沉淀,并且在4℃下孵育過夜。沉淀的熒光素異硫氰酸標記木葡聚糖(FITC-XG)通過使用LEGENDTM RT加離心機(賽默飛世爾科技公司(Thermo Scientific),沃爾瑟姆,馬薩諸塞州,美國)在3000rpm離心,傾析乙醇進行回收,并且在室溫下干燥24小時。將FITC-XG溶解在最小體積的去離子水中直到溶解并儲存在-20℃。將冷凍的FITC-XG解凍并且凍干過夜。將凍干粉末溶解在500μl的去離子水中并且通過在488nm的吸光度定量。
按以下方式制備大規(guī)模批次的FITC-XG。在去離子水中制備每ml溶液7.9mg的FITC-XGO。徹底混合四十ml的10mg的羅望子木葡聚糖(麥格酶公司,布雷,英國)/ml的去離子水、452ml的7.9mg的FITC-XGO/ml的去離子水、2ml的400mM檸檬酸鈉(pH 5.5)、和1.2ml的1.4mg的VaXET16/ml的20mM檸檬酸鈉(pH 5.5),并且在室溫下孵育過夜。在過夜孵育后,通過添加冰冷的乙醇至終體積110ml來沉淀FITC-XG,徹底混合,并且在4℃下整夜孵育。用水洗滌沉淀的FITC-XG,并且然后轉移到圓底燒瓶(Erlenmeyer bulb)中。通過使用EZ-2Elite蒸發(fā)器(SP Scientific/Genevac公司,斯通里奇,紐約,美國)蒸發(fā)4小時來去除殘余的水和乙醇。將干燥的樣品溶解于水中,并且用去離子水將體積調整到48ml,以產生,在所希望的100kDa的平均分子量下,5mg/ml的最終FITC-XG濃度。
使用以下測定來評估木葡聚糖內糖基轉移活性。如以上描述的制備200μl的反應,該反應包含1mg的羅望子木葡聚糖/ml、0.01mg/ml FITC-XGO,并且將10μl的適當稀釋的XET在25℃下在不透明96孔微量滴定板中的20mM檸檬酸鈉(pH 5.5)中孵育10分鐘。在這個時間段,以頂級閱讀方向,用490nm的激發(fā)波長、520nm的發(fā)射波長、激發(fā)路徑中495截止濾波器、高精度(100次讀取)、和中光電倍增管的靈敏度,使用 M5酶標儀(分子器件公司(Molecular Devices),森尼維耳市,加利福尼亞州,美國)連續(xù)監(jiān)測熒光偏振。將熒光XGO以XET依賴性摻入非熒光XG中導致隨著時間增加熒光偏振。使用偏振時間進程曲線的線性區(qū)域的斜率來確定該活性。
相對于野生型VaXET16,對于兩個變體的7天培養(yǎng)液,優(yōu)于親本基因,產量相對改進在下表2中示出。按比野生型VaXET16 3.1X更大的量產生變體A40G+I53A+N175S,而按比野生型VaXET16 1.2X更大的量產生變體A40G+F183I。相同的培養(yǎng)液的SDS-PAGE分析示出兩個變體的優(yōu)于野生型VaXET的增加強度的VaXET帶這與在活性測定中觀察到的相對改進很好地相關。在第3,4,5,6,和7天所取的樣品的SDS-PAGE分析示出VaXET的增加的生產,并且各變體日益增強,其中在第7天最強。
表2.
在此描述并且要求保護的本發(fā)明不局限于在此披露的特定方面的范圍,因為這些方面旨在作為本發(fā)明若干方面的說明。預期任何等效方面都處于本發(fā)明的范圍內。實際上,除在此所示和描述的那些之外,本發(fā)明的不同修改對于本領域普通技術人員而言從前述描述將變得清楚。這樣的修改也旨在落入所附權利要求的范圍內。在有沖突的情況下,以包括定義的本披露為準。
實例10:里氏木霉原生質體產生與轉化
使用基于賓替拉(Penttila)等人,1987,基因(Gene)61:155-164的以下方案進行原生質體制備與轉化。將里氏木霉菌株在25ml的補充有2%(w/v)葡萄糖和10mM尿苷的YP培養(yǎng)基中在27℃下、伴隨著以90rpm進行的輕輕攪拌培養(yǎng)17小時。將菌絲體通過使用真空驅動一次性過濾系統(tǒng)(密理博公司(Millipore))過濾來收集,并且用去離子水洗滌兩次,并且用1.2M山梨醇洗滌兩次。通過在20ml的每ml包含15mg的200G(諾維信公司,鮑斯韋,丹麥(Novozymes A/S,Bagsvaerd,Denmark))和每ml包含0.36單位的殼多糖酶(西格瑪化學有限公司(Sigma Chemical Co.)的1.2M山梨醇中在34℃下伴隨著以90rpm的進行的輕輕振蕩來懸浮經洗滌的菌絲體,持續(xù)15-25分鐘,從而產生原生質體。將原生質體通過在400x g下離心7分鐘來收集,并用冷的1.2M山梨醇洗滌兩次。將原生質體使用血球計數器來計數,并再懸浮于STC中至1x108個原生質體/ml的終濃度。
將大約1-10μg的DNA添加至100μl的原生質體溶液中并且輕輕混合。然后添加PEG緩沖液(250μl),并且混合轉化反應,并且在34℃下孵育30分鐘。然后添加STC(3ml)到該轉化反應并且混合。然后將轉化反應物散布到COVE平板上用于amdS選擇。將這些平板在28℃下孵育6-11天。
對于需要潮霉素選擇的轉化,在STC中的反應混合物散布到補充有1M的蔗糖的PDA平板上。在28℃下孵育16小時后,將20ml的、每ml補充有35μg的潮霉素B的覆層PDA培養(yǎng)基添加至各平板。將這些平板在28℃下孵育4-7天。
實例11:來自里氏木霉菌株的基因組DNA提取
使這些里氏木霉菌株在補充有在250ml帶擋板的搖瓶中的2%葡萄糖(w/v)的50ml的YP培養(yǎng)基中在28℃下伴隨著以200rpm的攪拌生長2天。使用漏斗襯里的(EMD化學品公司(EMD Chemicals Inc.))收集來自各培養(yǎng)的菌絲體,擠壓干燥,并在液氮下冷凍。將冷凍的菌絲體轉移到預冷的研缽和研杵。每個菌絲制劑磨成細粉,并且用液氮保持冷凍。將總共1-2克的粉末轉移到50ml管中,并且使用植物Maxi試劑盒(凱杰公司)從研磨菌絲粉末中提取基因組DNA。將預熱至65℃的五ml的緩沖液AP1(凱杰公司)添加到50ml管中,隨后添加10μl的RNA酶A 100mg/ml原液(凱杰公司),并且在65℃孵育2-3小時。添加共1.8ml AP2緩沖液(凱杰公司),并將管在冰上孵育5分鐘,隨后用LEGENDTMRT吊桶式離心機(賽默飛世爾科技公司(Thermo Fisher Scientific Inc.))在3000-5000X g離心5分鐘。將上清液轉移到置于50毫升收集管中的QIAShredderTM大核酸純化柱(凱杰公司),并且在室溫下(15℃-25℃)在3000-5000x g下甩平式轉子中離心5分鐘。在收集管中的流過液體被轉移到新50ml管中,同時不干擾沉淀。1.5mL體積的緩沖液AP3/E(凱杰公司)添加到澄清的裂解液中,并且通過渦旋振蕩立即混合。包括可能已經形成的任何沉淀的樣品(最多15毫升),吸移到置于50毫升收集管中的大核酸純化柱(凱杰公司)中,并且在室溫下(15℃-25℃)在3000-5000x g下甩平式轉子中離心5分鐘。棄去流過液體。十二ml的緩沖液AW(凱杰公司)添加至大核酸純化柱,并在3000-5000x g離心10分鐘,以干燥該膜。棄去流過液體和收集管。大核酸純化柱轉移到新50ml管中。通過添加預熱至65℃的1-1.5ml的試劑盒提供的緩沖液AE直接洗脫DNA到大核酸純化柱膜上,在室溫下(15℃-25℃)孵育5分鐘,并且然后在3000-5000X g離心5分鐘?;蚪MDNA的濃度和純度通過在260nm和280nm測量吸光度確定。
實例12:轉化體的Southern印跡分析
用選擇的一種或多種限制性內切酶消化來自每個轉化體的兩μg的基因組DNA。這些消化提交至在TAE緩沖液中的0.7%-0.8%瓊脂糖凝膠電泳,并且使用(GE醫(yī)療集團生命科學部(GE Healthcare Life Sciences))印跡至 N+印跡膜(GE醫(yī)療集團生命科學部(GE Healthcare Life Sciences))或超負荷膜(施萊歇&許爾生物科技公司(Schleicher&Schuell BioScience))持續(xù)大約1-2小時。該膜與地高辛標記基因特異性或位點特異性探針雜交,這些探針是通過使用PCR DIG探針合成試劑盒(羅氏應用科學公司)的PCR合成。
將該探頭煮沸持續(xù)5分鐘,在冰上冷卻持續(xù)2分鐘,并添加至10ml的DIG Easy Hyb中以產生該雜交溶液。雜交在DIG Easy Hyb緩沖液中在42℃下進行15-17小時。然后將該膜用2X SSC加上0.1%SDS在室溫下洗滌5分鐘,隨后在65℃下用0.5X SSC加上0.1%SDS洗滌兩次,每次15分鐘。在1X封閉液(羅氏應用科學公司)洗滌至少一小時,洗滌一次后,將膜用50ml包含3.75U的抗洋地黃毒苷-AP Fab片段(羅氏應用科學公司)的封閉液孵育10分鐘,隨后在1X洗滌液(羅氏應用科學公司)中洗滌兩次。即用試劑(二鈉2-氯-5-(4-甲氧基螺(1,2-二氧雜環(huán)丁烷-3,2’-(5’-氯)三環(huán)[3.3.1.13,7]癸烷}-4-基)-1-苯基磷酸酯;羅氏應用科學公司)然后被施加至膜,并且通過放射自顯影方法檢測探針-靶雜交體。
實例13:FLP/FRT整合質粒pJfyS148B的構建
FRT-F3位點首先使用 II XL定點誘變試劑盒(安捷倫科技),用以下所示的誘變插入引物被插入到質粒pSMai155(WO 05/074647)中。
正向引物:
5'-
CGAATTCTGCATTGAAGTTCCTATTCCGAGTTCCTATTCTTCAAATAGTATAGGAACTTCAGATATCCATCACACTGGCG-3'(SEQ ID NO:41)
反向引物:
5'-
GCCAGTGTGATGGATATCTGAAGTTCCTATACTATTTGAAGAATAGGAACTCGGAATAGGAACTTCAATGCAGAATTCGC-3’(SEQ ID NO:42)
誘變PCR包含10ng的pSMai155、200μM dNTP、125ng的每個引物、1X反應緩沖液(安捷倫科技)、3μl的試劑(安捷倫科技)以及2.5單位的Pfu超高保真DNA聚合酶(安捷倫科技),最終體積為50μl。PCR在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)1分鐘;18個循環(huán),每個循環(huán)在95℃下持續(xù)50秒,在60℃下持續(xù)50秒,以及在68℃下持續(xù)40秒;以及1個循環(huán),在68℃下持續(xù)7分鐘。添加一μl的試劑盒提供的Dpn I,并且在37℃下孵育1小時。兩μl的Dpn I處理后的反應添加至14ml管中45μl的試劑盒提供的XL10-Gold超活性大腸桿菌細胞(安捷倫科技),并且在冰上孵育30分鐘。將該管在42℃下孵育30秒,此后添加0.5ml的SOC培養(yǎng)基。然后在37℃下伴隨200rpm攪拌,將該管孵育1小時,此后將250μl各自涂板至2X 150mm 2XYT+氨芐西林平板上并在37℃孵育過夜。將大腸桿菌轉化體接種到在14ml管中的3ml的LB+Amp培養(yǎng)基中,并且在37℃下孵育過夜,伴隨在200rpm的攪拌。使用9600(凱杰公司)分離質粒DNA。插入通過DNA測序來確認。一個轉化體被鑒定為包含對應于FRT-F3位點的希望的序列插入,并且該質粒指定為pJfyS148A。
然后將FRT-F序列使用優(yōu)越PCR克隆試劑盒(克羅泰克實驗有限公司(Clontech Laboratories,Inc.))插入到質粒pJfyS148A中。FRT-F位點首先使用以下所示的引物,通過PCR,從質粒pRika147(WO2012/120093)擴增。
正向引物:
5'-
ATATCCATCACACTGGCGGCCGCTCAACTCTCTCCTCTAGGTTGAAGTTCCTATTCCGAGTTC-3’(SEQ ID NO:43)
反向引物:
5'-
AGGATGCATGCTCGAGCATGCACTAGCTAGTTGAAGTTCCTATAC-3’
(SEQ ID NO:44)
該PCR由以下各項構成:20ng的pRika147、200μM dNTP、0.4μM引物、1X反應緩沖液(賽默飛世爾科技公司)、以及2單位的高保真DNA聚合酶(賽默飛世爾科技公司),最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)2分鐘;30個循環(huán),每個循環(huán)在95℃下持續(xù)25秒,在50℃下持續(xù)25秒,以及在72℃下持續(xù)40秒;以及1個循環(huán),在72℃下持續(xù)7分鐘。將完成的PCR提交至在TAE緩沖液中的2%瓊脂糖凝膠電泳,其中從凝膠切離0.1kb片段,并且使用凝膠提取試劑盒(凱杰公司)提取瓊脂糖。簡言之,將3體積的試劑盒-提供的緩沖液QG添加至該凝膠切片并在50℃下溶解持續(xù)大約10分鐘。通過轉移到該柱并且在13,000rpm下離心持續(xù)1分鐘,將溶解的凝膠切片施用于試劑盒-提供的旋轉柱。將該柱用750μl的試劑盒-提供的緩沖液PE洗滌并再次離心。用10μl的試劑盒-提供的緩沖液EB洗脫DNA。
將0.1kb PCR產物使用優(yōu)越PCR克隆試劑盒插入到Sal I-消化的pJfyS148A中。該反應由以下各項構成:在10μl反應體積中1X反應緩沖液、125ng的pJfyS147A、20ng的FRT-F PCR產物、和1μl的酶。將該反應在50℃下孵育15分鐘。然后通過添加至包含這些感受態(tài)細胞的單次使用管中并且將這些細胞在冰上孵育5分鐘,添加40μl的Te至該反應,并且2μl被轉化到ONE TOP10大腸桿菌化學感受態(tài)細胞(英杰公司)。將該試管在42℃下培養(yǎng),持續(xù)30秒之后,添加250μl的SOC培養(yǎng)基。然后在37℃下伴隨200rpm攪拌,將該管孵育1小時,并且將250μl轉移到150mm 2XYT+氨芐西林平板上并且在37℃孵育過夜。將大腸桿菌轉化體接種到在14ml管中的3ml的LB+Amp培養(yǎng)基中,并且在37℃下孵育過夜,伴隨在200rpm的攪拌。使用9600(凱杰公司)分離來自大腸桿菌轉化體的質粒DNA。插入通過DNA測序來確認。一個轉化體被鑒定為包含沒有PCR錯誤的插入,并且該質粒指定為pJfyS148B。
實例14:質粒pJfyS156的構建
構建質粒pJfyS156,cbh2基因啟動子和翻轉酶基因使用以下所示基因特異性引物進行PCR擴增,并且插入到質粒pJfyS148B中。
翻轉酶
正向引物:
5'-CACCCTCTGTGTATTGCACCATGCCCCAGTTCGATATCCTCTGCA-3'(SEQ ID NO:45)
反向引物:
5'-AAACTCTAGGATGCATGCAAGTGAGGCTATTGCCTATCAGCTC-3'(SEQ ID NO:46)
cbh2基因啟動子
正向引物:
5'-CATCACACTGGCGGCCGCGAATTCTAGGCTAGGTATGC-3'(SEQ ID NO:47)
反向引物:
5'-GGTGCAATACACAGAGGGTG-3'(SEQ ID NO:48)
該PCR由以下各項構成:對于翻轉酶PCR,20ng的模板pRiKa147,或對于cbh2啟動子PCR,150ng的里氏木霉981-O-8基因組DNA、200μM dNTPs、0.4μM引物、1X反應緩沖液、和2單位的高保真DNA聚合酶,最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)2分鐘;30個循環(huán),每個循環(huán)在95℃下持續(xù)30秒,在57℃下持續(xù)30秒,以及在72℃下持續(xù)2分鐘;以及1個循環(huán),在72℃下持續(xù)7分鐘。完成的PCR被提交至在TAE緩沖液中的1%瓊脂糖凝膠電泳,其中從凝膠切離1.2和0.6kb帶,分別對應于釀酒酵母翻轉酶基因的編碼區(qū)和NIAD終止子以及cbh2基因啟動子,并且使用提取II試劑盒(Macherey-Nagel有限公司,美國賓夕法尼亞州伯利恒(Bethlehem,PA,USA))提取瓊脂糖。將三體積的試劑盒提供的NT緩沖液添加至該凝膠切片上,并將該樣品在50℃下加熱10分鐘。將全部溶液轉移到試劑盒提供的離心柱。將該柱在13,000rpm下離心持續(xù)1分鐘并且用試劑盒-提供的洗滌緩沖液NT3進行洗滌并再離心。將DNA用30μl的試劑盒-提供的洗脫NE緩沖液進行洗脫并且在13,000rpm下離心持續(xù)1分鐘。
cbh2基因啟動子和翻轉酶編碼序列使用優(yōu)越PCR克隆試劑盒以單一步驟被插入到Xho I位線性化pJfyS148B中。該反應物由以下構成:在10μl反應體積中1X反應緩沖液、180ng的Xho I-位線性化pJfyS148B、100ng 0.6kb的cbh2啟動子PCR產物、240ng的1.2kb的翻轉酶PCR產物、和1μl酶。該反應在37℃下孵育15分鐘,并且接著在50℃下持續(xù)15分鐘。根據實例14,然后添加40μl的TE至該反應,并且2μl被轉化到ONE TOP10大腸桿菌化學感受態(tài)細胞中。將大腸桿菌轉化體接種到在14ml管中的3ml的LB+Amp培養(yǎng)基中,并且在37℃下孵育過夜,伴隨在200rpm的攪拌。使用9600分離質粒DNA。插入通過DNA測序來確認。一個轉化體被鑒定為包含沒有PCR錯誤的插入,并且該質粒指定為pJfyS155。
使用以下所示的引物,通過PCR,從pEJG107(WO 05/047499)擴增煙曲霉β-葡糖苷酶基因。
正向引物:
5'-ACCGCGGACTGCGCACCATGAGATTCGGTTGGCTCGAGG-3'(SEQ ID NO:49)
反向引物:
5'-TTCGCCACGGAGCTTACTAGTAGACACGGGGCAGAGGC-3'(SEQ ID NO:50)
該PCR由以下各項構成:20ng的pEJG107、200μM dNTP、0.4μM引物、1X反應緩沖液、以及2單位的高保真DNA聚合酶,最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)2分鐘;25個循環(huán),每個循環(huán)在95℃下持續(xù)30秒,在57℃下持續(xù)30秒,以及在72℃下持續(xù)2分鐘;以及1個循環(huán),在72℃下持續(xù)7分鐘。將完成的PCR提交至在TAE緩沖液中的1%瓊脂糖電泳,其中從凝膠切離3kb帶并且使用凝膠提取試劑盒提取瓊脂糖(實例13)。
將煙曲霉β-葡糖苷酶PCR產物使用優(yōu)越PCR克隆試劑盒被插入到Nco I/Pac I消化的pJfyS155中。該反應由以下各項構成:在10μl反應體積中150ng的Nco I/Pac I消化pJfyS155、100ng的煙曲霉β-葡萄糖苷酶PCR產物、1X優(yōu)越緩沖液、和1μl的酶。該反應在37℃下孵育15分鐘,并且接著在50℃下持續(xù)15分鐘。根據實例13,然后添加40μl的TE至該反應,并且2μl被轉化到ONE TOP10大腸桿菌化學感受態(tài)細胞中。使用9600分離來自大腸桿菌轉化體的質粒DNA。插入通過DNA測序來確認。一個轉化體被鑒定為包含沒有PCR錯誤的插入,并且該質粒指定為pJfyS156(圖9)。
實例15:質粒pDM313的構建
包含hpt標記的一部分、FRT-F3位點和里氏木霉gpdA啟動子的一部分的0.38kb PCR片段使用以下所示的引物從pJfyS156擴增。
正向引物:
5’-CGTGTTTCTTCCCATTCGCATGCGACCTCGTGGTCATTGAC-3’(SEQ ID NO:51)
反向引物:
5’-
GCTTTGACGTTACATTGACGTACTTATAAGCGGCCGCCAGTGTGATGGA-3’(SEQ ID NO:52)
該PCR由以下構成:50皮摩爾的各引物、100ng的pJfyS156的DNA、1X的PHUSIONTM高保真熱啟動DNA聚合酶緩沖液(賽默飛世爾科技公司)、1μl的10mM dNTPs的共混物,和1個單位的PHUSIONTM高保真熱啟動DNA聚合酶(賽默飛世爾科技公司),最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在98℃下持續(xù)2分鐘;34個循環(huán),每個循環(huán)在98℃下持續(xù)15秒,在59℃下持續(xù)30秒,以及在72℃下持續(xù)1分鐘;以及1個循環(huán),在72℃下持續(xù)10分鐘。
包含里氏木霉gpdA啟動子的1.0kbPCR片段使用以下所示的引物,從里氏木霉RutC30基因組DNA擴增。
正向引物:
5’-
TCCATCACACTGGCGGCCGCTTATAAGTACGTCAATGTAACGTCAAAGC-3’(SEQ ID NO:53)
反向引物:
5’-
TGCAGAGGATATCGAACTGGGGCATTTTGTATCTGCGAATTGAGCTTG-3’(SEQ ID NO:54)
該PCR由以下構成:50皮摩爾的各引物、100ng的里氏木霉RutC30基因組DNA、1X的PHUSIONTM高保真熱啟動DNA聚合酶緩沖液、1μl的10mM dNTPs的共混物,和1個單位的PHUSIONTM高保真熱啟動DNA聚合酶,最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在98℃下持續(xù)2分鐘;34個循環(huán),每個循環(huán)在98℃下持續(xù)15秒,在59℃下持續(xù)30秒,以及在72℃下持續(xù)1分鐘;以及1個循環(huán),在72℃下持續(xù)10分鐘。
包含釀酒酵母翻轉酶基因的編碼區(qū)和niaD終止子的1.8kb PCR片段使用以下所示的引物從質粒pJfyS156擴增。
正向引物:
5’-
CAAGCTCAATTCGCAGATACAAAATGCCCCAGTTCGATATCCTCTGCA-3’(SEQ ID NO:55)
反向引物:
5’-GCTGTTTAAACTCTAGGATGCATGCAAGTGAGGCTATTGCC-3’(SEQ ID NO:56)
該PCR由以下構成:50皮摩爾的各引物、100ng的pJfyS156 DNA、1X的PHUSIONTM高保真熱啟動DNA聚合酶緩沖液、1μl的10mM dNTPs的共混物,和1個單位的PHUSIONTM高保真熱啟動DNA聚合酶,最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在98℃下持續(xù)2分鐘;34個循環(huán),每個循環(huán)在98℃下持續(xù)15秒,在59℃下持續(xù)30秒,以及在72℃下持續(xù)1分鐘;以及1個循環(huán),在72℃下持續(xù)10分鐘。
上述三個完成的PCR通過在TAE緩沖液中的0.8%瓊脂糖凝膠電泳進行分析,其中0.38kb,1.0kb,和1.8kb的片段被確認。在原始反應中的PCR片段被用作如下描述的SOE PCR的模板。
0.38kb和1.0kb PCR片段使用如下所示的引物,通過SOE PCR被連接。
正向引物:
5’-CGTGTTTCTTCCCATTCGCATGCGACCTCGTGGTCATTGAC-3’(SEQ ID NO:57)
反向引物:
5’-
TGCAGAGGATATCGAACTGGGGCATTTTGTATCTGCGAATTGAGCTTG-3’(SEQ ID NO:58)
該PCR由以下構成:50皮摩爾的各引物、0.3μl的0.38kb片段PCR、0.6μl的1.0kb片段PCR、1X的PHUSIONTM高保真熱啟動DNA聚合酶緩沖液、1μl的10mM dNTPs的共混物,和1個單位的PHUSIONTM高保真熱啟動DNA聚合酶,最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在98℃下持續(xù)2分鐘;34個循環(huán),每個循環(huán)在98℃下持續(xù)15秒,60℃下持續(xù)30秒,以及在72℃下持續(xù)1.5分鐘;以及1個循環(huán),在72℃下持續(xù)10分鐘。進行五個SOE PCR并且合并反應。1.36kb SOE PCR片段和包含翻轉酶編碼序列和niaD終止子的1.8kb PCR片段通過在TAE緩沖液中的0.8%瓊脂糖凝膠電泳被分離,其中從凝膠切離1.36kb片段和1.8kb片段,并且使用的提取II試劑盒提取(實例14)。
十七μg的pJfyS156DNA用SphI消化并且通過在TAE緩沖液中的0.8%瓊脂糖凝膠電泳被純化,其中從凝膠切離大約8.7kb片段,并且使用的提取II試劑盒提取(實例14)。
1.36 kb SOE PCR片段和包含翻轉酶編碼序列和niaD終止子的1.8 kb PCR片段,使用 HD克隆試劑盒被插入SPH I消化的pJfyS156中。該反應由以下各項構成:在10μl反應體積中116ng的Sph I消化的pJfyS156、57ng的1.36 kb SOE PCR片段、69ng的1.8kb PCR片段、和2μl的具有酶的緩沖液。將該反應在50℃下孵育15分鐘并且然后在冰上冷卻。添加TE的40μl等分試樣。根據實例13,兩μl的反應轉化到ONE TOP10大腸桿菌化學感受態(tài)細胞中。使用9600,將質粒DNA從轉化體中分離。通過用Nsi I的限制性內切酶消化篩選轉化體,這產生2.1kb,2.6kb,和7kb片段。一個克隆的DNA測序證實構建體包含沒有PCR錯誤的正確插入。該構建體指定為pDM313。
實例16:質粒pQM43的構建
通過FRT-F位點,構建質粒pQM43,用于將在其5’側翼是FRT-F位點的非功能amdS片段(指定為“非功能amdS片段3”)靶向至里氏木霉cbh1基因座。在該構建體中,F(xiàn)RT-F位點(49bp)添加至如以下描述的大約1kb非功能amdS片段的第一內含子內。包含里氏木霉cbh1 5’側翼區(qū)和FRT-F片段的大約400bp片段使用如下所示的引物1208187和1208194從里氏木霉RutC30基因組DNA擴增。使用如下所示的引物1208195和1208196,從pAllo1(WO 04/111228)擴增側翼是FRT-F位點的非功能amdS片段3。
引物1208187:
5’-GATTGAGTTGAAACTGCCTAAGATCTCG-3’(SEQ ID NO:59)
引物1208194:
5’-
CTATACTTTCTAGAGAATAGGAACTCGGAATAGGAACTTCAAGGTGCGCAGTCCGCGGTTGAC-3’(SEQ ID NO:60)
引物1208195:
5’-
CTATTCCGAGTTCCTATTCTCTAGAAAGTATAGGAACTTCGGCGTTGTTACATCTCCCTGAG-3’(SEQ ID NO:61)
引物1208196:
5’-GCGTCAGGCTTTCGCCACGTCTACGCCAGGACCGAGCAAG-3’(SEQ ID NO:62)
第一PCR由以下各項構成:100ng的里氏木霉RutC30基因組DNA、1μl的10mM的dNTPs、1μM引物、1X的高保真反應緩沖液(賽默飛世爾科技公司)、和1單位的熱啟動高保真DNA聚合酶(賽默飛世爾科技公司),最終體積為50μl。第二PCR由以下各項構成:100ng的pAllo1、1μl的10mM的dNTPs、1μM的引物、1X的高保真反應緩沖液,和1單位的熱啟動高保真DNA聚合酶,最終體積為50μl。兩個反應均在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)2分鐘;35個循環(huán),每個循環(huán)在95℃下持續(xù)15秒,在60℃下持續(xù)30秒,以及在72℃下持續(xù)1分15秒;以及1個循環(huán),在72℃下持續(xù)10分鐘。PCR產物通過在TAE緩沖液中的0.7%瓊脂糖凝膠電泳被分離,其中從凝膠切離大約400kb和1kb片段,并且使用提取II試劑盒提取(實例14)。
第三PCR由以下各項構成:100ng的400bp和1kb純化的PCR產物,1μl的10mM的dNTPs、1X的高保真反應緩沖液,和1單位的熱啟動高保真DNA聚合酶,最終體積為48μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)2分鐘;和5個循環(huán),每個循環(huán)在95℃下持續(xù)15秒,在60℃下持續(xù)30秒,以及在72℃下持續(xù)2分鐘。然后按1μM的終濃度添加引物1208187和1208196,并且繼續(xù)30個循環(huán),每個循環(huán)在95℃下持續(xù)15秒,在60℃下持續(xù)30秒,以及在72℃下持續(xù)2分鐘;以及1個循環(huán),在72℃下持續(xù)10分鐘。如以上所述,PCR產物通過在TAE緩沖液中的0.7%瓊脂糖凝膠電泳被分離,其中從凝膠切離大約1.4kb的片段,并且使用提取II試劑盒提取。
將1.4kb PCR產物使用IN-FUSIONTM HD克隆試劑盒(克羅泰克實驗有限公司(Clontech Laboratories,Inc.))插入到大約9.3kb BgIII/Pac I消化的pJfyS139(WO 2013/028927)中。該反應由以下各項構成:在10μl反應體積中1X IN-FUSIONTM HD酶預混物(克羅泰克實驗有限公司(Clontech Laboratories,Inc.))、200ng的BgIII/Pac I消化的pJfyS139、和61ng的1.4kb PCR產物。將該反應在50℃下孵育15分鐘。根據實例13,孵育期后,1μl等分試樣被轉移到ONE TOP10化學感受態(tài)細胞。使用9600,將質粒DNA從轉化體中分離。插入通過DNA測序來確認。一個轉化體被鑒定為包含沒有PCR錯誤的插入,并且該質粒指定為pQM43(圖10)。
實例17:里氏木霉菌株AgJg115-104-7B1的原生質體產生和轉化,用來缺失里氏木霉42kDa天冬氨酸蛋白酶,從而產生里氏木霉AgJg115-118-1H1
根據實例10,進行里氏木霉菌株AgJg115-104-7B1的原生質體制備和轉化。
將九十六μg的轉化質粒pAgJg118(WO 2011/075677)用Pme I消化,并且通過在TAE緩沖液中的1%瓊脂糖凝膠電泳被純化,其中從凝膠切離DNA帶,并且使用凝膠提取試劑盒(凱杰公司)提取。簡言之,將3體積的試劑盒-提供的緩沖液QG添加至該凝膠切片并在50℃下溶解持續(xù)大約10分鐘。將溶解的凝膠切片轉移到旋轉柱,并且在13,000rpm下離心持續(xù)1分鐘。將該柱用750μl的試劑盒-提供的緩沖液PE洗滌并然后重復該離心。用25μl的試劑盒-提供的緩沖液EB洗脫DNA。將大約1μl的所得純化的DNA片段添加至100μl的原生質體溶液,用于如以上描述的潮霉素選擇轉化。將七個轉化體傳代培養(yǎng)到新PDA平板上以產生孢子。
里氏木霉菌株AgJg115-104-7B1的轉化體通過真菌孢子PCR篩選pAgJg118缺失載體在42kDa的天冬氨酸蛋白酶基因座的存在。將來自每個轉化體的少量孢子懸浮于20μl的稀釋緩沖液(植物直接PCR試劑盒,賽默飛世爾科技公司(Thermo Fisher Scientific))中。將該孢子懸浮液用作PCR中的模板,來篩選天冬氨酸蛋白酶缺失。每個反應由以下各項構成:在20μl反應中0.5μl的孢子懸浮液、50pmol的引物069134(如下所示)、50pmol的引物067947(如下所示)、10μl的2X植物PCR緩沖液(植物直接PCR試劑盒)、以及0.4μl的熱啟動II DNA聚合酶(植物直接PCR試劑盒)。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在98℃下持續(xù)5分鐘;40個循環(huán),每個循環(huán)在98℃下持續(xù)5秒,在58℃下持續(xù)5秒,以及在72℃下持續(xù)2分20秒;1個循環(huán),在72℃下持續(xù)2分鐘;以及10℃保持。引物069134位于5’側翼區(qū)上游并且引物067947位于大腸桿菌潮霉素磷酸轉移酶(hpt)基因編碼區(qū)域的起始部位。如果將缺失載體整合到天冬氨酸蛋白酶基因座,該擴增的PCR片段將長2.4kb。指定為里氏木霉AgJg115-118-1的一個轉化體被鑒定為具有缺失的天冬氨酸蛋白酶基因。
引物069134(正向):
5’-CGCAATCTATCGAATAGCAG-3’(SEQ ID NO:63)
引物067947(反向):
5’-CTACATCGAAGCTGAAAGCACGAGA-3’(SEQ ID NO:64)
缺失構建體pAgJg118包含大腸桿菌潮霉素磷酸轉移酶(hpt)基因和側翼是直接重復的單純皰疹病毒胸苷激酶(tk)基因。插入直接重復以促進hpt和tk可選擇的標記的固化并且產生42kDa天冬氨酸蛋白酶的完全缺失。
將來自里氏木霉AgJg115-118-1的孢子散布到木霉屬基本培養(yǎng)基平板上,這些平板包包含1μM 5-氟-2’-脫氧尿苷(Fd U)并且在28℃下孵育。在PDA板上將九個分離株傳代培養(yǎng)并且在28℃下孵育。以如上所述的相似的方式,然后通過真菌孢子PCR篩選這些分離株以檢查是否不存在hpt和tk標記。該PCR篩選由以下各項構成:在20μl反應中0.5μl的孢子懸浮液、50pmol的引物069134、50pmol的引物1200593、10μl的2X植物PCR緩沖液、以及0.4μl的熱啟動II DNA聚合酶。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在98℃下持續(xù)5分鐘;40個循環(huán),每個循環(huán)在98℃下持續(xù)5秒,在58℃下持續(xù)5秒,以及在72℃下持續(xù)1分45秒;1個循環(huán),在72℃下持續(xù)1分鐘;以及10℃保持。引物069134位于5’側翼區(qū)的上游,并且引物067947位于3’側翼區(qū)的下游。如果該天冬氨酸蛋白酶編碼序列被缺失,并且hpt和tk標記被環(huán)出,那么擴增的PCR片段將長3.6kb。
里氏木霉AgJg115-118-1分離株的基因組DNA如實例11中所述制備,并且如實例12中所述通過Southern印跡分析來分析,以確認42kDa的天冬氨酸蛋白酶的缺失。如實例12所述,對于Southern印跡分析,用10單位的Nco I在30μl反應體積中消化2μg的每個基因組DNA,并且經受在TAE緩沖液中的0.7%瓊脂糖電泳,并且轉移到超負荷膜。
將該膜與500bp地高辛標記的里氏木霉C 42kDa天冬氨酸蛋白酶探針雜交,其中使用如下所示的引物通過PCR,通過摻入地高辛-11-dUTP合成該探針。
引物069860(正義):
5’-CTTCTATCTTGGGATGCTTCACGATACGTGA-3’(SEQ ID NO:65)
引物069861(反義):
5’-CGCGCCCTTGAATATCGGAGAAGGT-3’(SEQ ID NO:66)
該PCR由以下各項構成:5μl的10X Taq緩沖液(紐英倫生物技術有限公司)、2.5μl的PCR DIG標記的混合物(羅氏應用科學公司)、5ng的pAgJg118、10pmol每種引物、2.5μl的10mM dNTP、5單位的Taq DNA聚合酶(紐英倫生物技術有限公司)、以及36.5μl的水。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)2分鐘;30個循環(huán),每個循環(huán)在95℃下持續(xù)30秒,在56℃下持續(xù)30秒,以及在72℃下持續(xù)40秒;1個循環(huán),在72℃下持續(xù)15分鐘;以及4℃保持。如以上所述,該探針通過在TAE緩沖液中的1%瓊脂糖凝膠電泳被純化,從凝膠切離,并且使用凝膠提取試劑盒提取。
Southern印跡分析對初級轉化體里氏木霉AgJg115-118-1H1的鑒定為:包含該替換并且缺乏hpt/tk標記。
實例18:里氏木霉菌株QMJi057的構建,用于將側翼是FRT-F位點的非功能amdS片段3靶向至里氏木霉cbh1基因座
用1-5μg的Pme I消化的pQM43轉化里氏木霉AgJg115-118-1H1(實例17),用來在cbh1基因座插入在在其5’側翼是FRT-F位點的非功能amdS片段3。獲得二十六個轉化體并且將每一個挑出并且轉移到PDA平板,并且在30℃下孵育7天。轉化體在2ml的CIM中培養(yǎng),并且在30℃下伴隨250rpm攪拌孵育3天并。來自每個培養(yǎng)的上清液經受使用8%-16%TGX無污凝膠(伯樂實驗室有限公司)和PRECISION蛋白未染色標準(伯樂實驗室有限公司)的SDS-PAGE。由于在cbh1基因座pQM43的成功靶向整合有效破壞了cbh1基因,目測分析SDS-PAGE凝膠的CBH1蛋白從蛋白質組的損失。里氏木霉QMJi057-5被鑒定為不產生CBHI蛋白并且被選擇用于基因組DNA提取和Southern印跡分析,以確認在里氏木霉cbh1基因座的包含F(xiàn)RT-F位點的非功能amdS片段3的整合。根據實例11中所述的程序從轉化體中分離基因組DNA。
基因組DNA用Nhe I消化,用于用地高辛標記的里氏木霉cbh1 3’探針的根據實例12的Southern印跡分析,和使用PCR DIG探針合成試劑盒(羅氏應用科學公司)和如下所示的引物,通過PCR合成該探針。
引物0610249:
5’-GAGAACACAGTGAGACCATAGC-3’(SEQ ID NO:67)
引物0610250:
5’-TCTCAACCCAATCAGCAACATG-3’(SEQ ID NO:68)
DIG探針合成PCR由以下各項構成:大約100pg的作為模板的用于制造pQM21(WO 2013/028912)的包含里氏木霉cbh1 3’側翼區(qū)的PCR片段、1μM引物、5μl的PCR DIG合成混合物(羅氏應用科學公司),具有MgCl2的1X PCR緩沖液(羅氏應用科學公司),和0.75μl的酶混合物(羅氏應用科學公司),最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)2分鐘;10個循環(huán),每個循環(huán)在95℃下持續(xù)30秒,在60℃下持續(xù)30秒,以及在72℃下持續(xù)40秒;20個循環(huán),每個循環(huán)在95℃下持續(xù)30秒,在60℃下持續(xù)30秒,以及在72℃下持續(xù)40秒,加上對于每個后續(xù)循環(huán)另外的20秒;以及1個循環(huán),在72℃下持續(xù)7分鐘。PCR產物通過在TAE緩沖液中的1%瓊脂糖凝膠電泳被分離,其中從凝膠切離720bp帶,并且使用提取II試劑盒提取(實例14)。
轉化體QMJi057-5通過Southern印跡分析確認包含在cbh1基因座的在其5’側翼是FRT-F位點的非功能amdS片段3,這導致了由里氏木霉cbh1 3’探針識別的在大約7.1kb的雜交信號。
實例19:在菌株QMJi057-5中,在里氏木霉cbh1基因座的位點特異性整合
包含黑曲霉甘露糖苷酶的編碼序列的大約3Kb DNA片段(DNA序列為SEQ ID NO:69并且氨基酸序列為SEQ ID NO:70)從黑曲霉Bo-1衍生物菌株CKle47用引物0614762和0614763擴增,并且克隆至Nco I和Pac I消化的pMJ09(US 8318458B2;大約7.2kb),生成質粒pQM27(SEQ ID NO:71)。在pQM27中的黑曲霉甘露糖苷酶表達盒隨后是功能amdS標記。
包含黑曲霉甘露表達盒、非功能amdS片段4和FRT-F位點的大約6.7kbDNA片段從pQM27用引物1201956和1201606擴增。該PCR由以下各項構成:100ng的pQM27、200μM dNTP、0.4μM引物、1X反應緩沖液、以及1單位的高保真DNA聚合酶,最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在98℃下持續(xù)2分鐘;35個循環(huán),每個循環(huán)在98℃下持續(xù)15秒,在60℃下持續(xù)30秒,以及在72℃下持續(xù)3.5分鐘;以及1個循環(huán),在72℃下持續(xù)10分鐘。6.7kb PCR產物通過在TAE中的0.7%瓊脂糖凝膠電泳被分離,從凝膠切離,并且使用提取II試劑盒提取(實例14)。
純化的6.7kb的PCR產物被用作模板,使用引物1201956和1201957擴增包含F(xiàn)RT-F位點的片段。所得包含F(xiàn)RT-F位點的PCR片段通過TAE中的0.7%瓊脂糖凝膠電泳你分離,并且然后從凝膠切離,并且使用提取II試劑盒提取(實例14)。
引物1210956:
5’-
TGATTACGAATTGTTTAAACGGATCCGAATGTAGGATTGTTATCCG-3’(SEQ ID NO:72)
引物1201606:
5’-
GAAGTTCCTATACTTTCTAGAGAATAGGAACTCGGAATAGGAACTTCAACCTTATGGGACTATCAAGCTGAC-3’(SEQ ID NO:73)
引物1210957:
5’-
GTTACATTGACGTACTTATAAGAAGTTCCTATACTTTCTAGAGAATAGGA-3’(SEQ ID NO:74)
純化的包含F(xiàn)RT-F位點的PCR片段使用IN-FUSIONTMHD克隆試劑盒插入到XbaⅠ和Psi I消化的pDM313(大約5.4Kb)。該反應由以下各項構成:在15μl反應體積中1X IN-FUSIONTMHD酶預混物、323ng的Xba I/Psi I消化的pDM313,以及200ng的6.7kb包含F(xiàn)RT-F位點的PCR產物。將該反應在50℃下孵育15分鐘。培養(yǎng)期后,通過添加至包含感受態(tài)細胞的管中,并且在冰上孵育細胞30分鐘,2μl等分試樣被轉化到50μl的StellarTM大腸桿菌化學感受態(tài)細胞(克羅泰克實驗有限公司(Clontech Laboratories,Inc.))中。將該試管在42℃下培養(yǎng),持續(xù)45秒之后,添加450μl的SOC培養(yǎng)基。然后在37℃下伴隨250rpm攪拌,將該管孵育1小時。50μl和150μl的體積被轉移到兩個150mm2XYT加氨芐青霉素平板。將這些平板在37℃下孵育過夜。使用9600分離質粒DNA,并且測序。一個轉化體被鑒定為包含沒有PCR錯誤的插入,并且該質粒指定為pQM45(圖11)。
質粒pQM45被用Pme I消化,并且用來測試在菌株QMJi057-5中里氏木霉cbh1基因座的位點特異性整合。根據實例10,PME I消化的pQM45被轉化到里氏木霉菌株QMJi057-5的原生質體中,并且將轉化反應散布在COVE平板上,并且在30℃下孵育7-10天。所有的轉化生成COVE平板上可見轉化體,這表明插入FRT-F位點至amdS基因的第一內含子允許功能amdS標記的重組和在目標位點的整合。
根據在實例11中所述的程序從六個轉化體中分離基因組DNA。基因組DN用EcoR I消化,用于用358bp的地高辛標記的里氏木霉cbh15’探針的根據實例12的Southern印跡分析(參見下文),該探針使用PCR DIG探針合成試劑盒,通過PCR,通過地高辛-11-dUTP的摻入合成。
所有六個轉化體的Southern印跡分析生成在由里氏木霉cbh15’探針識別的在大約4.2kb的雜交信號,表明在cbh1基因座的正確整合。
里氏木霉CBH15’探針序列:
5’-TAGGGTCGGCAACGGCAAAAAAGCACGTGGCTCACCGAAAAGCAAGATGTTTGCGATCTAACATCCAGGAACCTGGATACATCCATCATCACGCACGACCACTTTGATCTGCTGTAAACTCGTATTCGCCCTAAACCGAAGTGCGTGGTAAATCTACACGTGGGCCCCTTTCGGTATACTGCGTGTGTCTTCTCTAGGTGCCATTCTTTTCCCTTCCTCTAGTGTTGAATTGTTTGTGTTGGAGTCCGAGCTGTAACTACCTCTGAATCTCTGGAGAATGGTGGACTAACGACTACCGTGCACCTGCATCATGTATATAATAGTGATCCTGAGAAGGGGGGTTTGGAGCAATGTGGG-3’(SEQ ID NO:75)
實例20:質粒pQM37,pQM38和pQM39(具有在amdS內含子中的FRT-F3位點的功能amdS標記的)的構建
構建質粒pQM37,pQM38和pQM39,以測試插入FRT-F3片段至amdS基因的3個內含子中的一個后的對amdS功能的影響。如下所示的引物被設計成使用 II XL定點突變試劑盒引入FRT-F3片段至質粒pAllo1中的amdS基因中的3個內含子的每一個中。引物1205503和1205504被用來構建質粒pQM37,其中FRT-F3位點被插入到amdS基因的內含子1中。引物1205505和1205506被用來構建質粒pQM38,其中FRT-F3位點被插入到amdS基因的內含子2中。引物1205507和1205508被用來構建pQM39,其中FRT-F3位點被插入到amdS基因的內含子3中。
引物1205503:
5’-
GGGAGATGTAACAACGCCTTGAAGTTCCTATTCCGAGTTCCTATTCTTCAAATAGTATAGGAACTTCAACCTTATGGGACTATCAAG-3’(SEQ ID NO:76)
引物1205504:
5’-
CTTGATAGTCCCATAAGGTTGAAGTTCCTATACTATTTGAAGAATAGGAACTCGGAATAGGAACTTCAAGGCGTTGTTACATCTCCC-3’(SEQ ID NO:77)
引物1205505:
5’-
GCCCCTAAGTCGTTAGATGTTTGAAGTTCCTATTCCGAGTTCCTATTCTTCAAATAGTATAGGAACTTCACCCTTTTTGTCAGC-3’(SEQ ID NO:78)
引物1205506:
5’-
GCTGACAAAAAGGGTGAAGTTCCTATACTATTTGAAGAATAGGAACTCGGAATAGGAACTTCAAACATCTAACGACTTAGGGGC-3’(SEQ ID NO:79)
引物1205507:
5’-
CTATACCAGGCCTCCACTTGAAGTTCCTATTCCGAGTTCCTATTCTTCAAATAGTATAGGAACTTCATGTCCTCCTTTCTTGC-3’(SEQ ID NO:80)
引物1205508:
5’-
GCAAGAAAGGAGGACATGAAGTTCCTATACTATTTGAAGAATAGGAACTCGGAATAG GAACTTCAAGTGGAGGCCTGGTATAG-3’(SEQ ID NO:81)
這些PCR由以下各項構成:10ng的pAllo1、1μl的10mM dNTPs、1X反應緩沖液、125ng的每個引物、1μl的試劑、和2.5單位的PfuUltraTM HF DNA聚合酶(安捷倫科技),最終體積為50μl。反應在熱循環(huán)儀中進行,程序為1個循環(huán),在95℃下持續(xù)1分鐘;和18個循環(huán),每個循環(huán)在95℃下持續(xù)50秒,在60℃下持續(xù)50秒,以及在68℃下持續(xù)7分鐘;以及1個循環(huán),在68℃下持續(xù)7分鐘。10個單位的Dpn I被添加到各反應,并且在37℃下孵育一小時。2μl的每個Dpn I處理的反應被轉化到XL10-Gold高效感受態(tài)大腸桿菌細胞中。將轉化反應散布在2XYT加氨芐青霉素平板上。挑出每個轉化約4-6個菌落并在3ml的LB加氨芐青霉素培養(yǎng)基在37℃下,伴隨250rpm攪拌培養(yǎng)15-17小時。使用旋轉迷你制備型試劑盒從每個菌落提取質粒DNA,并且提交用于DNA測序。包含插入到amdS基因的內含子1的FRT-F3位點的一個轉化體被指定為pQM37。包含插入到amdS基因的內含子2的FRT-F3位點的一個轉化體被指定為pQM38。包含插入到amdS基因的內含子3的FRT-F3位點的一個轉化體被指定為pQM39。
約30-40μg的每個pAllo1,pQM37,pQM38、和pQM39用EcoR I和Pac I消化。消化的DNA使用提取II試劑盒被純化(實施例14)。根據實例10,pAllo1,pQM37,pQM38、和pQM39的純化線性DNA片段各自轉化到里氏木霉RutC30原生質體中。將轉化反應物散布在COVE平板上,并且在28℃下孵育7-10天。所有的轉化生成COVE平板上可見轉化體,表明amdS可以被用作具有插入到三個amdS內含子中任一個的FRT-F3位點的功能選擇標記。
序列表
<110> 諾維信公司(Novozymes A/S)
<120> 多核苷酸文庫的重組酶介導的整合
<130> NZ 12719-WO-PCT
<160> 81
<170> PatentIn版本3.5
<210> 1
<211> 16935
<212> DNA
<213> 人工序列
<220>
<223> 質粒 p002
<220>
<221> 尚未歸類的特征
<222> (11869)..(11869)
<223> n is a, c, g, or t
<400> 1
ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 60
taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 120
tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 180
ttacgccaag ctcgaaatta accctcacta aagggaacaa aagctggagc tccaccgcgg 240
caacaggcag aatatcttcc gaattcaatc gactgcgcga tgcaagttgg ctagcaacgg 300
cgtacacctt gggattatgc gctgctcaac cgatggtcag ctatcaaaca aaatttggga 360
agatcgggct atactgacgg tgacattata gtacggcaag ctgagtgaca tctacggtcg 420
caagccactg cttctttggg catatgtttt ctttggcgtg ggatgcatta tcaggtagat 480
actccctttt tcttatacgc tggtttgctg gttcgtgctg acagctgttt ccctagcggt 540
attggtcgag acatggcgac tgtcatattg gggcgtgcaa tcagcggaat tgggggtgct 600
ggaacaatgg cgatgggctc tatcattatc acaggtaggc tagcagctta tcaggttgaa 660
agaactgtca ctgaacatag gcagatattg ttcctcgtcg agatgttgcc cattggcggg 720
cgtacatcaa tatcgcgatg actctgggtc gtagcgcagg aggcccaatc ggcggatggc 780
taaccgatac aatcggatgg agatggtatg ctttgcgcct ttgtgaccgc ttctctcact 840
aaattgtggc caaggtcgtt tattatccaa ggccccttag ccgctgtggc agctctgttg 900
gtgatatgga agctcaaact cgccaatcca gtcactgaga agagcatccg ccgtgtcgac 960
tttctcggaa cattcctcct ggccgtcggt attgttacaa tcaccgttat catggaccaa 1020
gcagggcagt ccttcgcatg ggcatcattg tcaacagcaa tccttgcaac tctcagtcta 1080
tcagcattcg tcgccttcgt ccttgttgaa ctctacgtag cccctgaacc gattttcgaa 1140
cttcgcatgt tgcggaagcc gaatgtgacg cccagttacc tgatcggatc gctgcagatc 1200
accgcccaag ttggaatgat gttctccgtg ccgttatatt ttcaggtgac atcgaaagcc 1260
tctgccaccg tagctggagg gcatctggtt cctgcagtga tcggaaacac gcttggcggc 1320
ttaatcgcgg gagcctttat ccgtcgcacc ggccaattca aggtcctctt gatccttgcc 1380
ggtctcgttg cgtccgtcgc ctatctactc ctcatccttc gctggaacgg tcatactgga 1440
ttctgggagt ccttgtacat tattcccggt ggtatgggta ctggtttctg ctctgcagct 1500
gcttttgtca gtatgacggc gtttttgatg ccgcaggaag tggccatggc aacaggaggt 1560
tacttcctat tattcagctt cgccatgacg gccggtgtca ctgtcactaa cagtctgctg 1620
gggacggttt tcaagcgcca gatggaacag cacctgacgg gtccaggagc caagaaggtt 1680
ggtatccccg caccttttct gcgtcactta ctaacgagta tatgaagatc atcgagcgcg 1740
cgctgtccga caccagctat atcaacggtt tgcagggtca tgtccgggat gtagtggtaa 1800
aaggatatgt gactggtctc cgctacactt actgtaagtc gtttgaatca tgcatccacc 1860
gtccacctta ttaacttggt gccagtattt tccctcattc tttcgctcct tggatcggtc 1920
ctcgcttgga ctgtacgaaa acaccaacta tgaggaacca gcacggcagc tgatagtatc 1980
cgaaagctgc aaattgcttc atcgaggctg gcattcgata gaagaaagaa ctatagacaa 2040
ctagtcttac aatatgacaa ttctctttga ttaataaatg aaaataacac ttgtgtcagc 2100
ctaatagccg agtggcgggc atctctggcg gcctcccgag cagcgtggat ctggaagtgc 2160
gttgatcatt attccccgaa aatgtagtac ccagtaagtg gtctagcggt ggctatggta 2220
ggacatctat gcctaagctg gagttctcat tgaacgtgta ccggccgatt gccctaaact 2280
ctgattgaga gccggaaacc tcatctacct gatgctcagg ggccatccaa tagcttccga 2340
tagcattaca gacagatgga ctcgtcttgg cccacgggtc tagaacagtc gccggaactg 2400
cctctatttg aaacggagct gaaccatgat acttaagcgt gccaagcggc gccgtttccc 2460
actggaacaa ggagcaatag aattctgcag agattcttca ttcaggctat tcagcaattc 2520
ggtttgtgga gcggatcggg gtccactggg tttagtctgg ggtttttctt tgcccgcatg 2580
ggctctagca catgcacagc ttgcagttgc tgctacgcta tctgggaaaa cgaatggcta 2640
ttcaggagtt tataaccaaa agagccggaa acaggctgat tgccctctca cggggagacg 2700
ttgtacttct gatccagagg ctattaaccg gacactacct ataaaggagg tagcattcct 2760
ttctgtccgg ctcccagatt ccaacaaccc aactgacagg ggatccacca tgccccagtt 2820
cgatatcctc tgcaagaccc cccccaaggt cctcgtccgc cagttcgtcg agcgcttcga 2880
gcgcccctcc ggcgagaaga tcgccctctg cgccgccgag ctcacctacc tctgctggat 2940
gatcacccat aacggcaccg ccatcaagcg cgccaccttc atgtcctaca acaccatcat 3000
ctccaactcc ctctccttcg atatcgtcaa caagtccctc cagttcaagt acaagaccca 3060
gaaggccacc atcctggagg cctccctcaa gaagctcatc cccgcctggg agttcaccat 3120
catcccctac tacggccaga agcatcagtc cgatatcacc gatatcgtct cctccctcca 3180
gctccagttc gagtcctccg aggaggccga taagggcaac tcccattcca agaagatgct 3240
caaggccctc ctctccgagg gcgagtccat ctgggagatc accgagaaga tcctcaactc 3300
cttcgagtac acctcccgct tcaccaagac caagaccctc taccagttcc tcttcctcgc 3360
caccttcatc aactgcggcc gcttctccga tatcaagaac gtcgatccca agtccttcaa 3420
gctcgtccag aacaagtacc tcggcgtcat catccagtgc ctcgtcaccg agaccaagac 3480
ctccgtctcc cgccatatct acttcttctc cgcccgcggc cgcatcgatc ccctcgtcta 3540
cctcgatgag ttcctccgca actccgagcc cgtcctcaag cgcgtcaacc gcaccggcaa 3600
ctcctcctcc aacaagcagg agtaccagct cctcaaggat aacctcgtcc gctcctacaa 3660
caaggccctc aagaagaacg ccccctactc catcttcgcc atcaagaacg gccccaagtc 3720
ccatatcggc cgccatctca tgacctcctt cctctccatg aagggcctca ccgagctcac 3780
caacgtcgtc ggcaactggt ccgataagcg cgcctccgcc gtcgcccgca ccacctacac 3840
ccatcagatc accgccatcc ccgatcatta cttcgcacta gtctcccgct actacgccta 3900
cgatcccatc tccaaggaga tgatcgccct caaggatgag accaacccca tcgaggagtg 3960
gcagcatatc gagcagctca agggctccgc cgagggctcc atccgctacc ccgcctggaa 4020
cggcatcatc tcccaggagg tcctcgatta cctctcctcc tacatcaacc gccgcatctg 4080
agtcgagatt atccaaggga atgacttaat gagtatgtaa gacatgggtc ataacggcgt 4140
tcgaaacata tacagggtta tgtttgggaa tagcacacga ataataacgt taataggtac 4200
caaagtcctt gatacattag cacggtagaa aaagaataat acaacgagct gggaatattc 4260
tttaatataa aactccaaga agagctggtg cggtggagct tgttttcgac tctcagtaat 4320
atttcctcat atccaagcgc gctaggaggt ggtcgaatac acatgtaggc gcttctctgg 4380
atgcaaaagt cgtgccggac ctgccgaaag actttgaaga tgcgttcacg ccatctaagt 4440
tgcgtagata attcacaaaa agggatgttt gtttccggaa tgtagcaaag agctgatagg 4500
caatagcctc actttcgtgg cgcacgccgc tcgttccatc catcctcgac aatggagcaa 4560
atgtcaaaat cgtaccgaaa atactttgct agcccgttaa attgccgtcg tcagccgtta 4620
aattaccgat taatcccgat aaatttccga gatctccgtt aaattgccgt tcgcagccgt 4680
taaattaccg gggacgaccg ataaatttcc gcgatgaatt catggtgttt tgatcatttt 4740
aaatttttat atggcgggtg gtgggcaact cgcttgcgcg ggcaactcgc ttaccgatta 4800
cgttagggct gatatttacg taaaaatcgt caagggatgc aagaccaaac cgttaaattt 4860
ccggagtcaa cagcatccaa gcccaagtcc ttcacggaga aaccccagcg tccacatcac 4920
gagcgaagga ccacctctag gcatcggacg caccatccaa ttagaagcag caaagcgaaa 4980
cagcccaaga aaaaggtcgg cccgtcggcc ttttctgcaa cgctgatcac gggcagcgat 5040
ccaaccaaca ccctccagag tgactagggg cggaaattta tcgggattaa tttccactca 5100
accacaaatc acagtcgtcc ccggtaattt aacggctgca gacggcaatt taacggcttc 5160
tgcgaatcgc ttggattccc cgcccctggc cgtagagctt aaagtatgtc ccttgtcgat 5220
gcgatgtatc acaacatata aatactggca agggatgcca tgcttggagc aacaatctca 5280
gaacaccaat atcaattcat ctcgagtctg aactcagaca acacaaattc ttcaaaattg 5340
aggatttagt cttgatcttg aagttcctat tccgagttcc tattctctag aaagtatagg 5400
aacttcttaa ttaacctagc cgttattact ctaccgcaag gcaacaacca gctcacccct 5460
gaggcacggg taccatgggt tgagtggtat ggggccatcc agagtcacct gtggcagcat 5520
gagactgcac tcgaagcagc catcaaccca gccaatattc tgggctttcc atccttagat 5580
cacatttgag atataaccca tttggtgaga gacacttgtg ccgttatacg tgtctagact 5640
ggaaacgcaa ccctgaaggg attcttcctt tgagagatgg aagcgtgtca tatctcttcg 5700
gttctacggc aggttttttt ctgctctttc gtagcatggc atggtcactt cagcgcttat 5760
ttacagttgc tggtattgat ttcttgtgca aattgctatc tgacacttat taggtcgagc 5820
tattcctttg ccctcggacg agtgctgggg cgtcggtttc cactatcggc gagtacttct 5880
acacagccat cggtccagac ggccgcgctt ctgcgggcga tttgtgtacg cccgacagtc 5940
ccggctccgg atcggacgat tgcgtcgcat cgaccctgcg cccaagctgc atcatcgaaa 6000
ttgccgtcaa ccaagctctg atagagttgg tcaagaccaa tgcggagcat atacgcccgg 6060
agccgcggcg atcctgcaag ctccggatgc ctccgctcga agtagcgcgt ctgctgctcc 6120
atacaagcca accacggcct ccagaagaag atgttggcga cctcgtattg ggaatccccg 6180
aacatcgcct cgctccagtc aatgaccgct gttatgcggc cattgtccgt caggacattg 6240
ttggagccga aatccgcgtg cacgaggtgc cggacttcgg ggcagtcctc ggcccaaagc 6300
atcagctcat cgagagcctg cgcgacggac gcactgacgg tgtcgtccat cacagtttgc 6360
cagtgataca catggggatc agcaatcgcg catatgaaat cacgccatgt agtgtattga 6420
ccgattcctt gcggtccgaa tgggccgaac ccgctcgtct ggctaagatc ggccgcagcg 6480
atcgcatcca tggcctccgc gaccggctgc agaacagcgg gcagttcggt ttcaggcagg 6540
tcttgcaacg tgacaccctg tgcacggcgg gagatgcaat aggtcaggct ctcgctgaat 6600
tccccaatgt caagcacttc cggaatcggg agcgcggccg atgcaaagtg ccgataaaca 6660
taacgatctt tgtagaaacc atcggcgcag ctatttaccc gcaggacata tccacgccct 6720
cctacatcga agctgaaagc acgagattct tcgccctccg agagctgcat caggtcggag 6780
acgctgtcga acttttcgat cagaaacttc tcgacagacg tcgcggtgag ttcaggcgac 6840
attgctgagg tgtaggatcg atccgtttaa actctgtgtt agcttatagt caggatgttg 6900
gctcgacgag tgtaaactgg gagttggcat gagggttatg taggcttctt tagccccgca 6960
tccccctcat tctcctcatt gatcccgggg gagcggatgg tgttgataag agactaatta 7020
tagggtttag ctggtgccta gctggtgatt ggctggcttc gccgaatttt acgggccaag 7080
ggaagctgca gaaccgcggc actggtaaac ggtaattaag ctatcagccc catgctaacg 7140
agtttaaatt acgtgtattg ctgataaaca ccaacagagc tttactgaaa gatgggagtc 7200
acggtgtggc ttccccactg cgattattgc acaagcagcg agggcgaact tgactgtcgt 7260
cgctgagcag cctgcagtca aacatacata tatatcaacc gcgaagacgt ctggccttgt 7320
agaacacgac gctccctagc aacacctgcc gtgtcagcct ctacggttgt tacttgcatt 7380
caggatgctc tccagcgggc gagctattca aaatattcaa agcaggtatc tcgtattgcc 7440
aggattcagc tgaagcaaca ggtgccaagg aaatctgcgt cggttctcat ctgggcttgc 7500
tcggtcctgg cgtagactag tgcatgcttg aagttcctat tccgagttcc tattcttcaa 7560
atagtatagg aacttcaacc atgcctcaat cctgggaaga actggccgct gataagcgcg 7620
cccgcctcgc aaaaaccatc cctgatgaat ggaaagtcca gacgctgcct gcggaagaca 7680
gcgttattga tttcccaaag aaatcgggta tcctttcaga ggccgaactg aagatcacag 7740
aggcctccgc tgcagatctt gtgtccaagc tggcggccgg agagttgacc tcggcggaag 7800
ttacgctagc attctgtaaa cgggcagtaa tcgcccagca gttagtaggg tcccctctac 7860
ctctcaggga gatgtaacaa cgccacctta tgggactatc aagctgacgc tggcttctgt 7920
gcagacaaac tgcgcccacg agttcttccc tgacgccgct ctcgcgcagg caagggaact 7980
cgatgaatac tacgcaaagc acaagagacc cgttggtcca ctccatggcc tccccatctc 8040
tctcaaagac cagcttcgag tcaaggtaca ccgttgcccc taagtcgtta gatgtccctt 8100
tttgtcagct aacatatgcc accagggcta cgaaacatca atgggctaca tctcatggct 8160
aaacaagtac gacgaagggg actcggttct gacaaccatg ctccgcaaag ccggtgccgt 8220
cttctacgtc aagacctctg tcccgcagac cctgatggtc tgcgagacag tcaacaacat 8280
catcgggcgc accgtcaacc cacgcaacaa gaactggtcg tgcggcggca gttctggtgg 8340
tgagggtgcg atcgttggga ttcgtggtgg cgtcatcggt gtaggaacgg atatcggtgg 8400
ctcgattcga gtgccggccg cgttcaactt cctgtacggt ctaaggccga gtcatgggcg 8460
gctgccgtat gcaaagatgg cgaacagcat ggagggtcag gagacggtgc acagcgttgt 8520
cgggccgatt acgcactctg ttgagggtga gtccttcgcc tcttccttct tttcctgctc 8580
tataccaggc ctccactgtc ctcctttctt gctttttata ctatatacga gaccggcagt 8640
cactgatgaa gtatgttaga cctccgcctc ttcaccaaat ccgtcctcgg tcaggagcca 8700
tggaaatacg actccaaggt catccccatg ccctggcgcc agtccgagtc ggacattatt 8760
gcctccaaga tcaagaacgg cgggctcaat atcggctact acaacttcga cggcaatgtc 8820
cttccacacc ctcctatcct gcgcggcgtg gaaaccaccg tcgccgcact cgccaaagcc 8880
ggtcacaccg tgaccccgtg gacgccatac aagcacgatt tcggccacga tctcatctcc 8940
catatctacg cggctgacgg cagcgccgac gtaatgcgcg atatcagtgc atccggcgag 9000
ccggcgattc caaatatcaa agacctactg aacccgaaca tcaaagctgt taacatgaac 9060
gagctctggg acacgcatct ccagaagtgg aattaccaga tggagtacct tgagaaatgg 9120
cgggaggctg aagaaaaggc cgggaaggaa ctggacgcca tcatcgcgcc gattacgcct 9180
accgctgcgg tacggcatga ccagttccgg tactatgggt atgcctctgt gatcaacctg 9240
ctggatttca cgagcgtggt tgttccggtt acctttgcgg ataagaacat cgataagaag 9300
aatgagagtt tcaaggcggt tagtgagctt gatgccctcg tgcaggaaga gtatgatccg 9360
gaggcgtacc atggggcacc ggttgcagtg caggttatcg gacggagact cagtgaagag 9420
aggacgttgg cgattgcaga ggaagtgggg aagttgctgg gaaatgtggt gactccatag 9480
gtaagctccg tggcgaaagc ctgacgcacc ggtagattct tggtgagccc gtatcatgac 9540
ggcggcggga gctacatggc cccgggtgat ttattttttt tgtatctact tctgaccctt 9600
ttcaaatata cggtcaactc atctttcact ggagatgcgg cctgcttggt attgcgatgt 9660
tgtcagcttg gcaaattgtg gctttcgaaa acacaaaacg attccttagt agccatgcat 9720
tttaagataa cggaatagaa gaaagaggaa attaaaaaaa aaaaaaaaac aaacatcccg 9780
ttcataaccc gtagaatcgc cgctcttcgt gtatcccagt accacggcaa aggtatttca 9840
tgatcgttca atgttgatat tgttcccgcc agtatggctc cacccccatc tccgcgaatc 9900
tcctcttctc gaacgcggta gtggcgcgcc aattggtaat gacccatagg gagacaaaca 9960
gcataatagc aacagtggaa attagtggcg caataattga gaacacagtg agaccatagc 10020
tggcggcctg gaaagcactg ttggagacca acttgtccgt tgcgaggcca acttgcattg 10080
tctagagaat gcaatcataa cagaaagtac agccagcgct gtgtcataaa gaagtccagt 10140
tgggaaacga aagactagaa tcaaactaaa agtaatccgg ccgatatggc ttcacgtgcg 10200
aagtctcgcc ttgaggggac attgtccttg caggtgattg accattgcgt tcatatggcg 10260
cgatgtttgg tagtgtgggt gtagccggtg acctcacgga aggactaaag gccacatacc 10320
cttctgagtg cctcttctct tcgtggtcgg aactctcgaa tgggtttttg acagttgcac 10380
tcgtttggtt gtggtcattt gaaggtctgc gttcggtctt ctgttcgcgc aggcgagctg 10440
actgagggat tgaaagctgc atagccatcg ttggcatgcg ttaattcgcc aaagctcagc 10500
ggcgaaacag gcctgacctc taatccatgc atctgctctg cactcgattg ttcgtggtgt 10560
ccttgcgaag aaagagaagc cttggactcg gatgactttc tggacgaggt ggtaggatca 10620
tcatgattgt aatgagactg tagcacatca tgcgaatcat tcgacacacg gtgtctgccc 10680
aagttgacgt cagcatcggt atgcatttcg gtatggtcct catggttctc agcatgtccc 10740
tccagagggg actcatttcc agcggaagga ttataagcaa cataattgtc atgtggctgc 10800
gacctttcgt gagactccga gtttgatctc actgtggact catgggcgat atgcggctca 10860
tcatgatctt cgaatggaga gaaatggttg aagtcggagg acacgggtga tttagcagca 10920
gggttgaatg caacatagcc agtctcgcgc tcttcatgtg agctatatga gtcatgtggc 10980
ctgtcatggt ccagaggctc cggatgctca tggctagatt catcgtgtgc cgaaatcgcg 11040
tcactagcaa agggcgaggt tgacacattg gctgcaggac tgaacgccac ataaccactc 11100
tcaggctctt catgtgagtt ataggagctg tgcggcatat catagtcctg aggttcacga 11160
tgctcatggc tggattcatc gtgtgccgaa atagcgtgac tagcaaaagg cgagggcgaa 11220
gcattggttg ccggactgaa cgccacatag ccgtccccat tggctgaact gactggtgac 11280
aacgtcctac ccatggcgtc ggccgggcca gcggcttggt gagagtgaag accattagaa 11340
gtagctggac tgaacgatcg cagcgggtat tcgttttctt gagctggata aggggctgcg 11400
ccatgctggc tgaaaggtga gaatgttcgg ggtgctgctc tatcaccagg gaaggcagac 11460
gctggagtca aagaacgagt gttggatcaa ttgccggact gtatgaacgg aaaggagtgc 11520
tgattgttta aatggcccgt agccttcgct aggacctcgt gattcgggga ccgttggccc 11580
atacccagga gctggtgtaa aattggaacg cgacacgggt gtttggttgc gcagaatttg 11640
cggtgccggc gaggcgtgat caatctggct gtaacctggg cctggggtgt agtttgagac 11700
aggtgtttgt gttcgtggca tttgtggcgc tggcgacgct ctgtcagtcg gcccatatcc 11760
aggcgccgaa ggtgtgggcg taaacccttg ccgtgattta attaagaatt ctcctgtagg 11820
cttgagagtt caaggaagaa acagtgcaat tatctttgcg aacccaggng ctggtgacgg 11880
aattttcata gtcaagctat cagagtaaag aagaggagca tgtcaaagta caattagaga 11940
caaatatata gtcgcgtgga gccaagagcg gattcctcag tctcgtaggt ctcttgacga 12000
ccgttgatct gcttgatctc gtctcccgaa aatgaaaata gactctgcta agctattctt 12060
ctgcttcgcc ggagcctgaa gggcgtacta gggttgcgag gtccaatgca ttaatgcatt 12120
gcagatgagc tgtatctgga agaggtaaac ccgaaacgcg ttttattctt gttgacatgg 12180
agctattaaa tcactagaag gcactctttg ctgcttggac aaatgaacgt atcttatcga 12240
gatcctgaac accatttgtc tcaactccgg agctgacatc gacaccaacg atcttatatc 12300
cagattcgtc aagctgtttg atgatttcag taacgttaag tggatcgatc cggatagcgc 12360
gggttccttc cggtattgtc tccttccgtg tttcagttag cctcccccat ctcccgggca 12420
aacgtgcgcg ccaggtcgca tatcgtcggt atggagccgg gggtggtgac gtgggtctgg 12480
accatcccgg aggtaagttg cagcagggcg tcccggcagc cggcgggcga ttggtcgtaa 12540
tccaggataa agacgtgcat ggaacggagg cgtttggcca agacgtccaa ggcccaggca 12600
aacacgttat acaggtcgcc gttgggggcc agcaactcgg ggccccgaaa cagggtaaat 12660
aacgtgtccc cgatatgggg tcgtgggccc gcgttgctct ggggctcggc accctggggc 12720
ggcacggccg tccccgaaag ctgtccccag tcctcccgcc acgacccgcc gcactgcaga 12780
taccgcaccg tattggcaag tagcccgtaa acgcggcgaa tcgcagccag catagccagg 12840
tccagccgct cgccggggcg ctggcgtttg gccaggcggt cgatgtgtct gtcctccgga 12900
agggccccaa gcacgatgtt ggtgccgggc aaggtcggcg ggatgagggc cacgaacgcc 12960
agcacggcct ggggggtcat gctgcccata aggtaccgcg cggccgggta gcacaggagg 13020
gcggcgatgg gatggcggtc gaagatgagg gtgagggccg ggggcggggc atgtgagctc 13080
ccagcctccc ccccgatatg aggagccaga acggcgtcgg tcacggcata aggcatgccc 13140
attgttatct gggcgcttgt cattaccacc gccgcgtccc cggccgatat ctcaccctgg 13200
tcgaggcggt gttgtgtggt gtagatgttc gcgattgtct cggaagcccc cagcacccgc 13260
cagtaagtca tcggctcggg tacgtagacg atatcgtcgc gcgaacccag ggccaccagc 13320
agttgcgtgg tggtggtttt ccccatcccg tggggaccgt ctatataaac ccgcagtagc 13380
gtgggcattt tctgctccgg gcggacttcc gtggcttctt gctgccggcg agggcgcaac 13440
gccgtacgtc ggttgctatg gccgcgagaa cgcgcagcct ggtcgaacgc agacgcgtgt 13500
tgatggccgg ggtacgaagc catacgcgct tctacaaggc gctggccgaa gaggtgcggg 13560
agtttcacgc caccaagatc gatctacagc tggtggggag agcaggaaaa tatggcaaca 13620
aatgttggac tgacgcaacg accttgtcaa ccccgccgac acaccgggcg gacagacggg 13680
gcaaagctgc ctaccaggga ctgagggacc tcagcaggtc gagtgcagag caccggatgg 13740
gtcgactgcc agcttgtgtt cccggtctgc gccgctggcc agctcctgag cggcctttcc 13800
ggtttcatac accgggcaaa gcaggagagg cacgatattt ggacgcccta cagatgccgg 13860
atgggccaat tagggagctt acgcgccggg tactcgctct acctacttcg gagaaggtac 13920
tatctcgtga atcttttacc agatcggaag caattggact tctgtaccta ggttaatggc 13980
atgctatttc gccgacggct atacacccct ggcttcacat tctccttcgc ttactgccgg 14040
tgattcgatg aagctccata ttctccgatg atgcaataga ttcttggtca acgaggggca 14100
caccagcctt tccacttcgg ggcggagggg cggccggtcc cggattaata atcatccact 14160
gcacctcaga gccgccagag ctgtctggcg cagtggccgt tattactcag cccttctctc 14220
tgcgtccgtc cgtctctccg catgccagaa agagtcaccg gtcactgtac agagctcaag 14280
cttcgattaa ctcgaggggg ggcccggtac ccaattcgcc ctatagtgag tcgtattaca 14340
attcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt acccaactta 14400
atcgccttgc agcacatccc cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg 14460
atcgcccttc ccaacagttg cgcagcctga atggcgaatg gaaattgtaa gcgttaatat 14520
tttgttaaaa ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga 14580
aatcggcaaa atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc 14640
agtttggaac aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac 14700
cgtctatcag ggcgatggcc cactacgtga accatcaccc taatcaagtt ttttggggtc 14760
gaggtgccgt aaagcactaa atcggaaccc taaagggagc ccccgattta gagcttgacg 14820
gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag cgggcgctag 14880
ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc 14940
gccgctacag ggcgcgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg 15000
tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat 15060
gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat 15120
tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt 15180
aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag 15240
cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa 15300
agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg 15360
ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct 15420
tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac 15480
tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca 15540
caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat 15600
accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact 15660
attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc 15720
ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga 15780
taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg 15840
taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg 15900
aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca 15960
agtttactca tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta 16020
ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca 16080
ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg 16140
cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga 16200
tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa 16260
tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc 16320
tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg 16380
tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac 16440
ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct 16500
acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc 16560
ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg 16620
gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg 16680
ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct 16740
ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga 16800
taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg 16860
cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc 16920
gcgttggccg attca 16935
<210> 2
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> FLP 重組酶識別序列
<400> 2
ttgaagttcc tattccgagt tcctattctc tagaaagtat aggaacttc 49
<210> 3
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> FLP 重組酶識別序列
<400> 3
ttgaagttcc tattccgagt tcctattctt caaatagtat aggaacttca 50
<210> 4
<211> 6055
<212> DNA
<213> 人工序列
<220>
<223> 載體 pFRT-GIAMG
<400> 4
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cttgaagttc ctattccgag 420
ttcctattct ctagaaagta taggaacttc ctcgagacca tgtaccgctt ccttgtctgt 480
gctctcgggc ttctggggac agtcctcgct cagtcagtcg acagttatgt cggcagcgaa 540
ggccccatag caaaggccgg cgtccttgcc aacattgggc cgaacggctc aaaggcctct 600
ggtgcagccg ccggcgtggt ggtggctagc cccagcaagt cggatcccga ctattggtac 660
acttggacgc gtgactcgtc actcgttttc aagtctctca ttgatcagta caccactggt 720
atcgacagca cgagttcgtt gaggtctctg atagacagtt tcgttattgc cgaggccaac 780
attcagcagg tctctaatcc cagcggcact cttactaccg gcggcttggg agagccaaaa 840
ttcaatgtcg atgaaactgc attcaccggt gcatggggtc gaccccagcg cgacggacct 900
gcgctccgtg cgactgcttt gatcacctac ggtaactggc tcttgtcaaa cgggaacacg 960
acctgggtta ccagtacgct gtggccgatc atccagaacg atctcaacta cgtcgttcag 1020
tactggaacc agaccacctt cgacctctgg gaagaagtga actcttcctc gttcttcacc 1080
actgcagtgc agcaccgtgc cttgcgcgaa ggcgcagcat tcgctaccaa gatcggtcag 1140
acctcctcgg tcagcagcta cacaacccaa gcggcgaatc tactttgctt tttgcagtct 1200
tactggaacc ccacttccgg atatatcacc gctaacactg gcggtggtcg gtccggcaag 1260
gacgccaaca ccctcttggc atccatccac acttacgacc ccagcgcggg ctgcgatgcc 1320
acgaccttcc agccctgctc cgacaaagcc ctctcgaatc tgaaggttta cgtcgactcc 1380
ttccgttctg tctactccat caacagcggt attgcctcta acgccgctgt cgccactggt 1440
cgctacccgg aagacagcta ccagggcggg aacccatggt acctcactac gttcgccgtc 1500
gccgagcagc tctatgacgc cctcaatgtc tgggctgctc agggctccct caatgtcacc 1560
tccatctccc tccccttctt ccagcagttc tcctctagtg tcactgccgg cacttacgct 1620
tcgagctcca ccacttacac gactctgacc tccgccatta agagcttcgc ggatggattc 1680
gtcgctatca acgcccagta cacgccgtcc aacggtggcc tcgctgagca gttcagcagg 1740
agcaacggcg ctcccgtcag cgctgttgat ttgacatgga gctatgcatc tgcattgacc 1800
gcgtttgaag cgaggaataa tactcagttc gccggctggg gcgcggtagg tttgactgtg 1860
ccgacctcgt gctccagcaa cagtggtgga ggcggaggat cgactgtcgc cgtgacgttc 1920
aacgtgaacg cccaaacggt ttggggcgaa aacatctaca tcactggctc ggttgacgct 1980
ctgagtaact ggtctcccga caacgccctc ttgctctcgt ctgccaacta cccgacctgg 2040
agcattaccg tgaatttacc cgcgagcact gccattcagt ataagtatat ccgcaagaac 2100
aacggagctg tcacctggga atccgatccc aacaacagca taactactcc agccagcggc 2160
tccgtgaccg agaatgacac ttggcgttaa ttaattaata ataaataacg gattgtgtcc 2220
gtaatcacac gtgcccgtgg tgcgtacgat aacgcatagt gtttttccct ccacttaaat 2280
cgaagggttg tgtcttggat cgcgcgggtc aaatgtatat ggttcatata catccgcagg 2340
cacgtaataa agcgaggggt tcgaatcccc ccgttacccc cggtaggggc ccagatccgg 2400
gtgactgaca cctggcggta gacaatcaat ccatttcgct atagttaaag gatggggatg 2460
agggcaattg gttatatgat catgtatgta gtgggtgtgc ataatagtag tgaaatggaa 2520
gccaagtcat gtgattgtaa tcgaccgacg gaattgagga tatccggaaa tacagacacc 2580
gtgaaagcca tggtctttcc ttcgtgtaga agaccagaca gacagtccct gatttaccct 2640
tgcacaaagc actagaaaat tagcattcca tccttctctg cttgctctgc tgatatcact 2700
gtcattcaat gcatagccat gagctcatct tagatccaag cacgtaattc catagccgag 2760
gtccacagtg gagcagcaac attccccatc attgctttcc ccaggggcct cccaacgact 2820
aaatcaagag tatatctcta ccgtccaata gatcgtcttc gcttcaaaat ctttgacaat 2880
tccaagaggg tccccatcca tcaaacccag ttcaataata gccgagatgc atggtggagt 2940
caattaggca gtattgctgg aatgtcgggg ccagttggcc cggtggtcat tggccgcctg 3000
tgatgccatc tgccactaaa tccgatcatt gatccaccgc ccacgaggcg cgtctttgct 3060
ttttgcgcgg cgtccaggtt caactctctc cactagtcta gcggggttca aatgcaaaca 3120
agtacaacac gcagcaaacg aagcagccca ccactgcgtt gatgcccagt ttgactgtcc 3180
gaaatccacc ggaaaggtgg aaacatacta tgtaacaatc agagggaaga aaaaattttt 3240
atcgacgagg caggatagtg actgatggtg gggtcatggt cgggtctccg agcgaaagag 3300
aaccaaggaa acaagatcaa cgaggttggt gtacccaaaa ggccgcagca acaagagtca 3360
tcgcccaaaa gtcaacagtc tggaagagac tccgccgtgc agattctgcg tcggtcccgc 3420
acatgcgtgg tgggggcatt acccctccat gtccaatgat aagggcggcg gtcgagggct 3480
taagcccgcc cactaattcg ccttctcgct tgcccctcca tataaggatt ccccctcctt 3540
cccctcccac aacttttttc cttctttctc tcttcgtccg catcagtacg tatatctttc 3600
ccccatacct cctttcctac tcttcttcca ttcattcaac tcttctcctt actgacatct 3660
gttttgctca gtacctctac gcgatcagcc gtagtatctg agcaagcttc tctacagaat 3720
ctttctagta tcttacaaag aactacaaag ttcgcaccat tgaagttcct attccgagtt 3780
cctattcttc aaatagtata ggaacttcag catgcaagct tggcgtaatc atggtcatag 3840
ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 3900
ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 3960
tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 4020
cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 4080
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 4140
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 4200
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 4260
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 4320
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 4380
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 4440
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 4500
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 4560
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 4620
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 4680
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 4740
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 4800
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 4860
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 4920
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 4980
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 5040
tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 5100
ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 5160
ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 5220
tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 5280
aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt 5340
ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 5400
ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 5460
gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 5520
gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 5580
cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga 5640
actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 5700
ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 5760
tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 5820
ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 5880
agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 5940
aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc 6000
attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtc 6055
<210> 5
<211> 1731
<212> DNA
<213> 密粘褶菌
<400> 5
atgtaccgct tccttgtctg tgctctcggg cttctgggga cagtcctcgc tcagtcagtc 60
gacagttatg tcggcagcga aggccccata gcaaaggccg gcgtccttgc caacattggg 120
ccgaacggct caaaggcctc tggtgcagcc gccggcgtgg tggtggctag ccccagcaag 180
tcggatcccg actattggta cacttggacg cgtgactcgt cactcgtttt caagtctctc 240
attgatcagt acaccactgg tatcgacagc acgagttcgt tgaggtctct gatagacagt 300
ttcgttattg ccgaggccaa cattcagcag gtctctaatc ccagcggcac tcttactacc 360
ggcggcttgg gagagccaaa attcaatgtc gatgaaactg cattcaccgg tgcatggggt 420
cgaccccagc gcgacggacc tgcgctccgt gcgactgctt tgatcaccta cggtaactgg 480
ctcttgtcaa acgggaacac gacctgggtt accagtacgc tgtggccgat catccagaac 540
gatctcaact acgtcgttca gtactggaac cagaccacct tcgacctctg ggaagaagtg 600
aactcttcct cgttcttcac cactgcagtg cagcaccgtg ccttgcgcga aggcgcagca 660
ttcgctacca agatcggtca gacctcctcg gtcagcagct acacaaccca agcggcgaat 720
ctactttgct ttttgcagtc ttactggaac cccacttccg gatatatcac cgctaacact 780
ggcggtggtc ggtccggcaa ggacgccaac accctcttgg catccatcca cacttacgac 840
cccagcgcgg gctgcgatgc cacgaccttc cagccctgct ccgacaaagc cctctcgaat 900
ctgaaggttt acgtcgactc cttccgttct gtctactcca tcaacagcgg tattgcctct 960
aacgccgctg tcgccactgg tcgctacccg gaagacagct accagggcgg gaacccatgg 1020
tacctcacta cgttcgccgt cgccgagcag ctctatgacg ccctcaatgt ctgggctgct 1080
cagggctccc tcaatgtcac ctccatctcc ctccccttct tccagcagtt ctcctctagt 1140
gtcactgccg gcacttacgc ttcgagctcc accacttaca cgactctgac ctccgccatt 1200
aagagcttcg cggatggatt cgtcgctatc aacgcccagt acacgccgtc caacggtggc 1260
ctcgctgagc agttcagcag gagcaacggc gctcccgtca gcgctgttga tttgacatgg 1320
agctatgcat ctgcattgac cgcgtttgaa gcgaggaata atactcagtt cgccggctgg 1380
ggcgcggtag gtttgactgt gccgacctcg tgctccagca acagtggtgg aggcggagga 1440
tcgactgtcg ccgtgacgtt caacgtgaac gcccaaacgg tttggggcga aaacatctac 1500
atcactggct cggttgacgc tctgagtaac tggtctcccg acaacgccct cttgctctcg 1560
tctgccaact acccgacctg gagcattacc gtgaatttac ccgcgagcac tgccattcag 1620
tataagtata tccgcaagaa caacggagct gtcacctggg aatccgatcc caacaacagc 1680
ataactactc cagccagcgg ctccgtgacc gagaatgaca cttggcgtta a 1731
<210> 6
<211> 576
<212> PRT
<213> 密粘褶菌
<400> 6
Met Tyr Arg Phe Leu Val Cys Ala Leu Gly Leu Leu Gly Thr Val Leu
1 5 10 15
Ala Gln Ser Val Asp Ser Tyr Val Gly Ser Glu Gly Pro Ile Ala Lys
20 25 30
Ala Gly Val Leu Ala Asn Ile Gly Pro Asn Gly Ser Lys Ala Ser Gly
35 40 45
Ala Ala Ala Gly Val Val Val Ala Ser Pro Ser Lys Ser Asp Pro Asp
50 55 60
Tyr Trp Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ser Leu
65 70 75 80
Ile Asp Gln Tyr Thr Thr Gly Ile Asp Ser Thr Ser Ser Leu Arg Ser
85 90 95
Leu Ile Asp Ser Phe Val Ile Ala Glu Ala Asn Ile Gln Gln Val Ser
100 105 110
Asn Pro Ser Gly Thr Leu Thr Thr Gly Gly Leu Gly Glu Pro Lys Phe
115 120 125
Asn Val Asp Glu Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg
130 135 140
Asp Gly Pro Ala Leu Arg Ala Thr Ala Leu Ile Thr Tyr Gly Asn Trp
145 150 155 160
Leu Leu Ser Asn Gly Asn Thr Thr Trp Val Thr Ser Thr Leu Trp Pro
165 170 175
Ile Ile Gln Asn Asp Leu Asn Tyr Val Val Gln Tyr Trp Asn Gln Thr
180 185 190
Thr Phe Asp Leu Trp Glu Glu Val Asn Ser Ser Ser Phe Phe Thr Thr
195 200 205
Ala Val Gln His Arg Ala Leu Arg Glu Gly Ala Ala Phe Ala Thr Lys
210 215 220
Ile Gly Gln Thr Ser Ser Val Ser Ser Tyr Thr Thr Gln Ala Ala Asn
225 230 235 240
Leu Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Thr Ser Gly Tyr Ile
245 250 255
Thr Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Leu
260 265 270
Leu Ala Ser Ile His Thr Tyr Asp Pro Ser Ala Gly Cys Asp Ala Thr
275 280 285
Thr Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr
290 295 300
Val Asp Ser Phe Arg Ser Val Tyr Ser Ile Asn Ser Gly Ile Ala Ser
305 310 315 320
Asn Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Gln Gly
325 330 335
Gly Asn Pro Trp Tyr Leu Thr Thr Phe Ala Val Ala Glu Gln Leu Tyr
340 345 350
Asp Ala Leu Asn Val Trp Ala Ala Gln Gly Ser Leu Asn Val Thr Ser
355 360 365
Ile Ser Leu Pro Phe Phe Gln Gln Phe Ser Ser Ser Val Thr Ala Gly
370 375 380
Thr Tyr Ala Ser Ser Ser Thr Thr Tyr Thr Thr Leu Thr Ser Ala Ile
385 390 395 400
Lys Ser Phe Ala Asp Gly Phe Val Ala Ile Asn Ala Gln Tyr Thr Pro
405 410 415
Ser Asn Gly Gly Leu Ala Glu Gln Phe Ser Arg Ser Asn Gly Ala Pro
420 425 430
Val Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr Ala
435 440 445
Phe Glu Ala Arg Asn Asn Thr Gln Phe Ala Gly Trp Gly Ala Val Gly
450 455 460
Leu Thr Val Pro Thr Ser Cys Ser Ser Asn Ser Gly Gly Gly Gly Gly
465 470 475 480
Ser Thr Val Ala Val Thr Phe Asn Val Asn Ala Gln Thr Val Trp Gly
485 490 495
Glu Asn Ile Tyr Ile Thr Gly Ser Val Asp Ala Leu Ser Asn Trp Ser
500 505 510
Pro Asp Asn Ala Leu Leu Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser
515 520 525
Ile Thr Val Asn Leu Pro Ala Ser Thr Ala Ile Gln Tyr Lys Tyr Ile
530 535 540
Arg Lys Asn Asn Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser
545 550 555 560
Ile Thr Thr Pro Ala Ser Gly Ser Val Thr Glu Asn Asp Thr Trp Arg
565 570 575
<210> 7
<211> 16642
<212> DNA
<213> 人工序列
<220>
<223> 質粒 p007
<220>
<221> 尚未歸類的特征
<222> (11576)..(11576)
<223> n is a, c, g, or t
<400> 7
ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 60
taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 120
tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 180
ttacgccaag ctcgaaatta accctcacta aagggaacaa aagctggagc tccaccgcgg 240
caacaggcag aatatcttcc gaattcaatc gactgcgcga tgcaagttgg ctagcaacgg 300
cgtacacctt gggattatgc gctgctcaac cgatggtcag ctatcaaaca aaatttggga 360
agatcgggct atactgacgg tgacattata gtacggcaag ctgagtgaca tctacggtcg 420
caagccactg cttctttggg catatgtttt ctttggcgtg ggatgcatta tcaggtagat 480
actccctttt tcttatacgc tggtttgctg gttcgtgctg acagctgttt ccctagcggt 540
attggtcgag acatggcgac tgtcatattg gggcgtgcaa tcagcggaat tgggggtgct 600
ggaacaatgg cgatgggctc tatcattatc acaggtaggc tagcagctta tcaggttgaa 660
agaactgtca ctgaacatag gcagatattg ttcctcgtcg agatgttgcc cattggcggg 720
cgtacatcaa tatcgcgatg actctgggtc gtagcgcagg aggcccaatc ggcggatggc 780
taaccgatac aatcggatgg agatggtatg ctttgcgcct ttgtgaccgc ttctctcact 840
aaattgtggc caaggtcgtt tattatccaa ggccccttag ccgctgtggc agctctgttg 900
gtgatatgga agctcaaact cgccaatcca gtcactgaga agagcatccg ccgtgtcgac 960
tttctcggaa cattcctcct ggccgtcggt attgttacaa tcaccgttat catggaccaa 1020
gcagggcagt ccttcgcatg ggcatcattg tcaacagcaa tccttgcaac tctcagtcta 1080
tcagcattcg tcgccttcgt ccttgttgaa ctctacgtag cccctgaacc gattttcgaa 1140
cttcgcatgt tgcggaagcc gaatgtgacg cccagttacc tgatcggatc gctgcagatc 1200
accgcccaag ttggaatgat gttctccgtg ccgttatatt ttcaggtgac atcgaaagcc 1260
tctgccaccg tagctggagg gcatctggtt cctgcagtga tcggaaacac gcttggcggc 1320
ttaatcgcgg gagcctttat ccgtcgcacc ggccaattca aggtcctctt gatccttgcc 1380
ggtctcgttg cgtccgtcgc ctatctactc ctcatccttc gctggaacgg tcatactgga 1440
ttctgggagt ccttgtacat tattcccggt ggtatgggta ctggtttctg ctctgcagct 1500
gcttttgtca gtatgacggc gtttttgatg ccgcaggaag tggccatggc aacaggaggt 1560
tacttcctat tattcagctt cgccatgacg gccggtgtca ctgtcactaa cagtctgctg 1620
gggacggttt tcaagcgcca gatggaacag cacctgacgg gtccaggagc caagaaggtt 1680
ggtatccccg caccttttct gcgtcactta ctaacgagta tatgaagatc atcgagcgcg 1740
cgctgtccga caccagctat atcaacggtt tgcagggtca tgtccgggat gtagtggtaa 1800
aaggatatgt gactggtctc cgctacactt actgtaagtc gtttgaatca tgcatccacc 1860
gtccacctta ttaacttggt gccagtattt tccctcattc tttcgctcct tggatcggtc 1920
ctcgcttgga ctgtacgaaa acaccaacta tgaggaacca gcacggcagc tgatagtatc 1980
cgaaagctgc aaattgcttc atcgaggctg gcattcgata gaagaaagaa ctatagacaa 2040
ctagtcttac aatatgacaa ttctctttga ttaataaatg aaaataacac ttgtgtcagc 2100
ctaatagccg agtggcgggc atctctggcg gcctcccgag cagcgtggat ctggaagtgc 2160
gttgatcatt attccccgaa aatgtagtac ccagtaagtg gtctagcggt ggctatggta 2220
ggacatctat gcctaagctg gagttctcat tgaacgtgta ccggccgatt gccctaaact 2280
ctgattgaga gccggaaacc tcatctacct gatgctcagg ggccatccaa tagcttccga 2340
tagcattaca gacagatgga ctcgtcttgg cccacgggtc tagaacagtc gccggaactg 2400
cctctatttg aaacggagct gaaccatgat acttaagcgt gccaagcggc gccgtttccc 2460
actggaacaa ggagcaatag aattctgcag agattcttca ttcaggctat tcagcaattc 2520
ggtttgtgga gcggatcggg gtccactggg tttagtctgg ggtttttctt tgcccgcatg 2580
ggctctagca catgcacagc ttgcagttgc tgctacgcta tctgggaaaa cgaatggcta 2640
ttcaggagtt tataaccaaa agagccggaa acaggctgat tgccctctca cggggagacg 2700
ttgtacttct gatccagagg ctattaaccg gacactacct ataaaggagg tagcattcct 2760
ttctgtccgg ctcccagatt ccaacaaccc aactgacagg ggatccacca tgccccagtt 2820
cgatatcctc tgcaagaccc cccccaaggt cctcgtccgc cagttcgtcg agcgcttcga 2880
gcgcccctcc ggcgagaaga tcgccctctg cgccgccgag ctcacctacc tctgctggat 2940
gatcacccat aacggcaccg ccatcaagcg cgccaccttc atgtcctaca acaccatcat 3000
ctccaactcc ctctccttcg atatcgtcaa caagtccctc cagttcaagt acaagaccca 3060
gaaggccacc atcctggagg cctccctcaa gaagctcatc cccgcctggg agttcaccat 3120
catcccctac tacggccaga agcatcagtc cgatatcacc gatatcgtct cctccctcca 3180
gctccagttc gagtcctccg aggaggccga taagggcaac tcccattcca agaagatgct 3240
caaggccctc ctctccgagg gcgagtccat ctgggagatc accgagaaga tcctcaactc 3300
cttcgagtac acctcccgct tcaccaagac caagaccctc taccagttcc tcttcctcgc 3360
caccttcatc aactgcggcc gcttctccga tatcaagaac gtcgatccca agtccttcaa 3420
gctcgtccag aacaagtacc tcggcgtcat catccagtgc ctcgtcaccg agaccaagac 3480
ctccgtctcc cgccatatct acttcttctc cgcccgcggc cgcatcgatc ccctcgtcta 3540
cctcgatgag ttcctccgca actccgagcc cgtcctcaag cgcgtcaacc gcaccggcaa 3600
ctcctcctcc aacaagcagg agtaccagct cctcaaggat aacctcgtcc gctcctacaa 3660
caaggccctc aagaagaacg ccccctactc catcttcgcc atcaagaacg gccccaagtc 3720
ccatatcggc cgccatctca tgacctcctt cctctccatg aagggcctca ccgagctcac 3780
caacgtcgtc ggcaactggt ccgataagcg cgcctccgcc gtcgcccgca ccacctacac 3840
ccatcagatc accgccatcc ccgatcatta cttcgcacta gtctcccgct actacgccta 3900
cgatcccatc tccaaggaga tgatcgccct caaggatgag accaacccca tcgaggagtg 3960
gcagcatatc gagcagctca agggctccgc cgagggctcc atccgctacc ccgcctggaa 4020
cggcatcatc tcccaggagg tcctcgatta cctctcctcc tacatcaacc gccgcatctg 4080
agtcgagatt atccaaggga atgacttaat gagtatgtaa gacatgggtc ataacggcgt 4140
tcgaaacata tacagggtta tgtttgggaa tagcacacga ataataacgt taataggtac 4200
caaagtcctt gatacattag cacggtagaa aaagaataat acaacgagct gggaatattc 4260
tttaatataa aactccaaga agagctggtg cggtggagct tgttttcgac tctcagtaat 4320
atttcctcat atccaagcgc gctaggaggt ggtcgaatac acatgtaggc gcttctctgg 4380
atgcaaaagt cgtgccggac ctgccgaaag actttgaaga tgcgttcacg ccatctaagt 4440
tgcgtagata attcacaaaa agggatgttt gtttccggaa tgtagcaaag agctgatagg 4500
caatagcctc actttcgtgg cgcacgccgc tcgttccatc catcctcgac aatggagcaa 4560
atgtcaaaat cgtaccgaaa atactttgct agcccgttaa attgccgtcg tcagccgtta 4620
aattaccgat taatcccgat aaatttccga gatctccgtt aaattgccgt tcgcagccgt 4680
taaattaccg gggacgaccg ataaatttcc gcgatgaatt catggtgttt tgatcatttt 4740
aaatttttat atggcgggtg gtgggcaact cgcttgcgcg ggcaactcgc ttaccgatta 4800
cgttagggct gatatttacg taaaaatcgt caagggatgc aagaccaaac cgttaaattt 4860
ccggagtcaa cagcatccaa gcccaagtcc ttcacggaga aaccccagcg tccacatcac 4920
gagcgaagga ccacctctag gcatcggacg caccatccaa ttagaagcag caaagcgaaa 4980
cagcccaaga aaaaggtcgg cccgtcggcc ttttctgcaa cgctgatcac gggcagcgat 5040
ccaaccaaca ccctccagag tgactagggg cggaaattta tcgggattaa tttccactca 5100
accacaaatc acagtcgtcc ccggtaattt aacggctgca gacggcaatt taacggcttc 5160
tgcgaatcgc ttggattccc cgcccctggc cgtagagctt aaagtatgtc ccttgtcgat 5220
gcgatgtatc acaacatata aatactggca agggatgcca tgcttggagc aacaatctca 5280
gaacaccaat atcaattcat ctcgagtctg aactcagaca acacaaattc ttcaaaattg 5340
aggatttagt cttgatcttg aagttcctat tccgagttcc tattctctag aaagtatagg 5400
aacttcttaa ttaacctagc cgttattact ctaccgcaag gcaacaacca gctcacccct 5460
gaggcacggg taccatgggt tgagtggtat ggggccatcc agagtcacct gtggcagcat 5520
gagactgcac tcgaagcagc catcaaccca gccaatattc tgggctttcc atccttagat 5580
cacatttgag atataaccca tttggtgaga gacacttgtg ccgttatacg tgtctagact 5640
ggaaacgcaa ccctgaaggg attcttcctt tgagagatgg aagcgtgtca tatctcttcg 5700
gttctacggc aggttttttt ctgctctttc gtagcatggc atggtcactt cagcgcttat 5760
ttacagttgc tggtattgat ttcttgtgca aattgctatc tgacacttat taggtcgagc 5820
tattcctttg ccctcggacg agtgctgggg cgtcggtttc cactatcggc gagtacttct 5880
acacagccat cggtccagac ggccgcgctt ctgcgggcga tttgtgtacg cccgacagtc 5940
ccggctccgg atcggacgat tgcgtcgcat cgaccctgcg cccaagctgc atcatcgaaa 6000
ttgccgtcaa ccaagctctg atagagttgg tcaagaccaa tgcggagcat atacgcccgg 6060
agccgcggcg atcctgcaag ctccggatgc ctccgctcga agtagcgcgt ctgctgctcc 6120
atacaagcca accacggcct ccagaagaag atgttggcga cctcgtattg ggaatccccg 6180
aacatcgcct cgctccagtc aatgaccgct gttatgcggc cattgtccgt caggacattg 6240
ttggagccga aatccgcgtg cacgaggtgc cggacttcgg ggcagtcctc ggcccaaagc 6300
atcagctcat cgagagcctg cgcgacggac gcactgacgg tgtcgtccat cacagtttgc 6360
cagtgataca catggggatc agcaatcgcg catatgaaat cacgccatgt agtgtattga 6420
ccgattcctt gcggtccgaa tgggccgaac ccgctcgtct ggctaagatc ggccgcagcg 6480
atcgcatcca tggcctccgc gaccggctgc agaacagcgg gcagttcggt ttcaggcagg 6540
tcttgcaacg tgacaccctg tgcacggcgg gagatgcaat aggtcaggct ctcgctgaat 6600
tccccaatgt caagcacttc cggaatcggg agcgcggccg atgcaaagtg ccgataaaca 6660
taacgatctt tgtagaaacc atcggcgcag ctatttaccc gcaggacata tccacgccct 6720
cctacatcga agctgaaagc acgagattct tcgccctccg agagctgcat caggtcggag 6780
acgctgtcga acttttcgat cagaaacttc tcgacagacg tcgcggtgag ttcaggcgac 6840
attgctgagg tgtaggatcg atccgtttaa actctgtgtt agcttatagt caggatgttg 6900
gctcgacgag tgtaaactgg gagttggcat gagggttatg taggcttctt tagccccgca 6960
tccccctcat tctcctcatt gatcccgggg gagcggatgg tgttgataag agactaatta 7020
tagggtttag ctggtgccta gctggtgatt ggctggcttc gccgaatttt acgggccaag 7080
ggaagctgca gaaccgcggc actggtaaac ggtaattaag ctatcagccc catgctaacg 7140
agtttaaatt acgtgtattg ctgataaaca ccaacagagc tttactgaaa gatgggagtc 7200
acggtgtggc ttccccactg cgattattgc acaagcagcg agggcgaact tgactgtcgt 7260
cgctgagcag cctgcagtca aacatacata tatatcaacc gcgaagacgt ctggccttgt 7320
agaacacgac gctccctagc aacacctgcc gtgtcagcct ctacggttgt tacttgcatt 7380
caggatgctc tccagcgggc gagctattca aaatattcaa agcaggtatc tcgtattgcc 7440
aggattcagc tgaagcaaca ggtgccaagg aaatctgcgt cggttctcat ctgggcttgc 7500
tcggtcctgg cgtagactag ttgaagttcc tattccgagt tcctattctt caaatagtat 7560
aggaacttca tcagggagat gtaacaacgc caccttatgg gactatcaag ctgacgctgg 7620
cttctgtgca gacaaactgc gcccacgagt tcttccctga cgccgctctc gcgcaggcaa 7680
gggaactcga tgaatactac gcaaagcaca agagacccgt tggtccactc catggcctcc 7740
ccatctctct caaagaccag cttcgagtca aggtacaccg ttgcccctaa gtcgttagat 7800
gtcccttttt gtcagctaac atatgccacc agggctacga aacatcaatg ggctacatct 7860
catggctaaa caagtacgac gaaggggact cggttctgac aaccatgctc cgcaaagccg 7920
gtgccgtctt ctacgtcaag acctctgtcc cgcagaccct gatggtctgc gagacagtca 7980
acaacatcat cgggcgcacc gtcaacccac gcaacaagaa ctggtcgtgc ggcggcagtt 8040
ctggtggtga gggtgcgatc gttgggattc gtggtggcgt catcggtgta ggaacggata 8100
tcggtggctc gattcgagtg ccggccgcgt tcaacttcct gtacggtcta aggccgagtc 8160
atgggcggct gccgtatgca aagatggcga acagcatgga gggtcaggag acggtgcaca 8220
gcgttgtcgg gccgattacg cactctgttg agggtgagtc cttcgcctct tccttctttt 8280
cctgctctat accaggcctc cactgtcctc ctttcttgct ttttatacta tatacgagac 8340
cggcagtcac tgatgaagta tgttagacct ccgcctcttc accaaatccg tcctcggtca 8400
ggagccatgg aaatacgact ccaaggtcat ccccatgccc tggcgccagt ccgagtcgga 8460
cattattgcc tccaagatca agaacggcgg gctcaatatc ggctactaca acttcgacgg 8520
caatgtcctt ccacaccctc ctatcctgcg cggcgtggaa accaccgtcg ccgcactcgc 8580
caaagccggt cacaccgtga ccccgtggac gccatacaag cacgatttcg gccacgatct 8640
catctcccat atctacgcgg ctgacggcag cgccgacgta atgcgcgata tcagtgcatc 8700
cggcgagccg gcgattccaa atatcaaaga cctactgaac ccgaacatca aagctgttaa 8760
catgaacgag ctctgggaca cgcatctcca gaagtggaat taccagatgg agtaccttga 8820
gaaatggcgg gaggctgaag aaaaggccgg gaaggaactg gacgccatca tcgcgccgat 8880
tacgcctacc gctgcggtac ggcatgacca gttccggtac tatgggtatg cctctgtgat 8940
caacctgctg gatttcacga gcgtggttgt tccggttacc tttgcggata agaacatcga 9000
taagaagaat gagagtttca aggcggttag tgagcttgat gccctcgtgc aggaagagta 9060
tgatccggag gcgtaccatg gggcaccggt tgcagtgcag gttatcggac ggagactcag 9120
tgaagagagg acgttggcga ttgcagagga agtggggaag ttgctgggaa atgtggtgac 9180
tccataggta agctccgtgg cgaaagcctg acgcaccggt agattcttgg tgagcccgta 9240
tcatgacggc ggcgggagct acatggcccc gggtgattta ttttttttgt atctacttct 9300
gacccttttc aaatatacgg tcaactcatc tttcactgga gatgcggcct gcttggtatt 9360
gcgatgttgt cagcttggca aattgtggct ttcgaaaaca caaaacgatt ccttagtagc 9420
catgcatttt aagataacgg aatagaagaa agaggaaatt aaaaaaaaaa aaaaaacaaa 9480
catcccgttc ataacccgta gaatcgccgc tcttcgtgta tcccagtacc acggcaaagg 9540
tatttcatga tcgttcaatg ttgatattgt tcccgccagt atggctccac ccccatctcc 9600
gcgaatctcc tcttctcgaa cgcggtagtg gcgcgccaat tggtaatgac ccatagggag 9660
acaaacagca taatagcaac agtggaaatt agtggcgcaa taattgagaa cacagtgaga 9720
ccatagctgg cggcctggaa agcactgttg gagaccaact tgtccgttgc gaggccaact 9780
tgcattgtct agagaatgca atcataacag aaagtacagc cagcgctgtg tcataaagaa 9840
gtccagttgg gaaacgaaag actagaatca aactaaaagt aatccggccg atatggcttc 9900
acgtgcgaag tctcgccttg aggggacatt gtccttgcag gtgattgacc attgcgttca 9960
tatggcgcga tgtttggtag tgtgggtgta gccggtgacc tcacggaagg actaaaggcc 10020
acataccctt ctgagtgcct cttctcttcg tggtcggaac tctcgaatgg gtttttgaca 10080
gttgcactcg tttggttgtg gtcatttgaa ggtctgcgtt cggtcttctg ttcgcgcagg 10140
cgagctgact gagggattga aagctgcata gccatcgttg gcatgcgtta attcgccaaa 10200
gctcagcggc gaaacaggcc tgacctctaa tccatgcatc tgctctgcac tcgattgttc 10260
gtggtgtcct tgcgaagaaa gagaagcctt ggactcggat gactttctgg acgaggtggt 10320
aggatcatca tgattgtaat gagactgtag cacatcatgc gaatcattcg acacacggtg 10380
tctgcccaag ttgacgtcag catcggtatg catttcggta tggtcctcat ggttctcagc 10440
atgtccctcc agaggggact catttccagc ggaaggatta taagcaacat aattgtcatg 10500
tggctgcgac ctttcgtgag actccgagtt tgatctcact gtggactcat gggcgatatg 10560
cggctcatca tgatcttcga atggagagaa atggttgaag tcggaggaca cgggtgattt 10620
agcagcaggg ttgaatgcaa catagccagt ctcgcgctct tcatgtgagc tatatgagtc 10680
atgtggcctg tcatggtcca gaggctccgg atgctcatgg ctagattcat cgtgtgccga 10740
aatcgcgtca ctagcaaagg gcgaggttga cacattggct gcaggactga acgccacata 10800
accactctca ggctcttcat gtgagttata ggagctgtgc ggcatatcat agtcctgagg 10860
ttcacgatgc tcatggctgg attcatcgtg tgccgaaata gcgtgactag caaaaggcga 10920
gggcgaagca ttggttgccg gactgaacgc cacatagccg tccccattgg ctgaactgac 10980
tggtgacaac gtcctaccca tggcgtcggc cgggccagcg gcttggtgag agtgaagacc 11040
attagaagta gctggactga acgatcgcag cgggtattcg ttttcttgag ctggataagg 11100
ggctgcgcca tgctggctga aaggtgagaa tgttcggggt gctgctctat caccagggaa 11160
ggcagacgct ggagtcaaag aacgagtgtt ggatcaattg ccggactgta tgaacggaaa 11220
ggagtgctga ttgtttaaat ggcccgtagc cttcgctagg acctcgtgat tcggggaccg 11280
ttggcccata cccaggagct ggtgtaaaat tggaacgcga cacgggtgtt tggttgcgca 11340
gaatttgcgg tgccggcgag gcgtgatcaa tctggctgta acctgggcct ggggtgtagt 11400
ttgagacagg tgtttgtgtt cgtggcattt gtggcgctgg cgacgctctg tcagtcggcc 11460
catatccagg cgccgaaggt gtgggcgtaa acccttgccg tgatttaatt aagaattctc 11520
ctgtaggctt gagagttcaa ggaagaaaca gtgcaattat ctttgcgaac ccaggngctg 11580
gtgacggaat tttcatagtc aagctatcag agtaaagaag aggagcatgt caaagtacaa 11640
ttagagacaa atatatagtc gcgtggagcc aagagcggat tcctcagtct cgtaggtctc 11700
ttgacgaccg ttgatctgct tgatctcgtc tcccgaaaat gaaaatagac tctgctaagc 11760
tattcttctg cttcgccgga gcctgaaggg cgtactaggg ttgcgaggtc caatgcatta 11820
atgcattgca gatgagctgt atctggaaga ggtaaacccg aaacgcgttt tattcttgtt 11880
gacatggagc tattaaatca ctagaaggca ctctttgctg cttggacaaa tgaacgtatc 11940
ttatcgagat cctgaacacc atttgtctca actccggagc tgacatcgac accaacgatc 12000
ttatatccag attcgtcaag ctgtttgatg atttcagtaa cgttaagtgg atcgatccgg 12060
atagcgcggg ttccttccgg tattgtctcc ttccgtgttt cagttagcct cccccatctc 12120
ccgggcaaac gtgcgcgcca ggtcgcatat cgtcggtatg gagccggggg tggtgacgtg 12180
ggtctggacc atcccggagg taagttgcag cagggcgtcc cggcagccgg cgggcgattg 12240
gtcgtaatcc aggataaaga cgtgcatgga acggaggcgt ttggccaaga cgtccaaggc 12300
ccaggcaaac acgttataca ggtcgccgtt gggggccagc aactcggggc cccgaaacag 12360
ggtaaataac gtgtccccga tatggggtcg tgggcccgcg ttgctctggg gctcggcacc 12420
ctggggcggc acggccgtcc ccgaaagctg tccccagtcc tcccgccacg acccgccgca 12480
ctgcagatac cgcaccgtat tggcaagtag cccgtaaacg cggcgaatcg cagccagcat 12540
agccaggtcc agccgctcgc cggggcgctg gcgtttggcc aggcggtcga tgtgtctgtc 12600
ctccggaagg gccccaagca cgatgttggt gccgggcaag gtcggcggga tgagggccac 12660
gaacgccagc acggcctggg gggtcatgct gcccataagg taccgcgcgg ccgggtagca 12720
caggagggcg gcgatgggat ggcggtcgaa gatgagggtg agggccgggg gcggggcatg 12780
tgagctccca gcctcccccc cgatatgagg agccagaacg gcgtcggtca cggcataagg 12840
catgcccatt gttatctggg cgcttgtcat taccaccgcc gcgtccccgg ccgatatctc 12900
accctggtcg aggcggtgtt gtgtggtgta gatgttcgcg attgtctcgg aagcccccag 12960
cacccgccag taagtcatcg gctcgggtac gtagacgata tcgtcgcgcg aacccagggc 13020
caccagcagt tgcgtggtgg tggttttccc catcccgtgg ggaccgtcta tataaacccg 13080
cagtagcgtg ggcattttct gctccgggcg gacttccgtg gcttcttgct gccggcgagg 13140
gcgcaacgcc gtacgtcggt tgctatggcc gcgagaacgc gcagcctggt cgaacgcaga 13200
cgcgtgttga tggccggggt acgaagccat acgcgcttct acaaggcgct ggccgaagag 13260
gtgcgggagt ttcacgccac caagatcgat ctacagctgg tggggagagc aggaaaatat 13320
ggcaacaaat gttggactga cgcaacgacc ttgtcaaccc cgccgacaca ccgggcggac 13380
agacggggca aagctgccta ccagggactg agggacctca gcaggtcgag tgcagagcac 13440
cggatgggtc gactgccagc ttgtgttccc ggtctgcgcc gctggccagc tcctgagcgg 13500
cctttccggt ttcatacacc gggcaaagca ggagaggcac gatatttgga cgccctacag 13560
atgccggatg ggccaattag ggagcttacg cgccgggtac tcgctctacc tacttcggag 13620
aaggtactat ctcgtgaatc ttttaccaga tcggaagcaa ttggacttct gtacctaggt 13680
taatggcatg ctatttcgcc gacggctata cacccctggc ttcacattct ccttcgctta 13740
ctgccggtga ttcgatgaag ctccatattc tccgatgatg caatagattc ttggtcaacg 13800
aggggcacac cagcctttcc acttcggggc ggaggggcgg ccggtcccgg attaataatc 13860
atccactgca cctcagagcc gccagagctg tctggcgcag tggccgttat tactcagccc 13920
ttctctctgc gtccgtccgt ctctccgcat gccagaaaga gtcaccggtc actgtacaga 13980
gctcaagctt cgattaactc gagggggggc ccggtaccca attcgcccta tagtgagtcg 14040
tattacaatt cactggccgt cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc 14100
caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag cgaagaggcc 14160
cgcaccgatc gcccttccca acagttgcgc agcctgaatg gcgaatggaa attgtaagcg 14220
ttaatatttt gttaaaattc gcgttaaatt tttgttaaat cagctcattt tttaaccaat 14280
aggccgaaat cggcaaaatc ccttataaat caaaagaata gaccgagata gggttgagtg 14340
ttgttccagt ttggaacaag agtccactat taaagaacgt ggactccaac gtcaaagggc 14400
gaaaaaccgt ctatcagggc gatggcccac tacgtgaacc atcaccctaa tcaagttttt 14460
tggggtcgag gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc cgatttagag 14520
cttgacgggg aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg 14580
gcgctagggc gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc 14640
ttaatgcgcc gctacagggc gcgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 14700
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 14760
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 14820
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 14880
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 14940
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 15000
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 15060
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 15120
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 15180
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 15240
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 15300
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 15360
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 15420
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 15480
ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 15540
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 15600
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 15660
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 15720
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 15780
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 15840
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 15900
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 15960
taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 16020
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 16080
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 16140
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 16200
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 16260
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 16320
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 16380
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 16440
ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt 16500
ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga 16560
ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cccaatacgc aaaccgcctc 16620
tccccgcgcg ttggccgatt ca 16642
<210> 8
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 引物 SpeI-FRTF3-amdS
<400> 8
tggcgtagac tagttgaagt tcctattccg agtcctattc ttcaaatagt ataggaactt 60
catcagggag atgtaacaac 80
<210> 9
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物 amdS-F-探針
<400> 9
ctatggagtc accacatttc cc 22
<210> 10
<211> 6330
<212> DNA
<213> 人工序列
<220>
<223> 載體 pFRT-BsAMG
<400> 10
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cttgaagttc ctattccgag 420
ttcctattct ctagaaagta taggaacttc ctcgagacca tgtacttcgc tcgccttctc 480
tccggactct ctctcatcac ctctgcggtt ctcgcccaga ccgttgactc ctatgtcagc 540
actgagggcc ccatcgcgaa ggcgggcctc cttgcgaaca ttggtcccag tggttccaaa 600
tccaacggtg cccatgctgg agttgtcgtc gctagcccta gccaagtcaa cccggactac 660
atgtacacat gggtccgcga ctcttccctc gtgttcaagg tcctcgtcga ccagctcgct 720
tccggccagg acacctctgt ccgtagcctg atcgatgcat tcgtcgcagc ggagtcggcg 780
atgcagcaca cccccaaccc cagtggtgac atcaacactg gtggtcttgc tgagcccaag 840
ttcaacatcg acaccaccgc cttcactggc gcatggggcc gcccgcagcg agatggccct 900
gctctccgtt ctaccaccgt catcaactac gccaactacc tccttgctaa tggcaacacc 960
actgcttggg tggtggccaa cctctggccc atgatcaagc tcgacttgga ctacatccag 1020
aacaactgga accagtctac cttcgacctg tgggaggagc tcaactcctc gtccttcttc 1080
accaccgctg ttcagcaccg tgctctccgc gagggtatta ctctcggcgc gaagctctcg 1140
aagactgccg ataccgccaa ctatggcacc caggccggca acatcctttg cttcctccag 1200
tcatactgga accctaccgc caactacgtg acctccaaca ccggtggtgg acgctccggc 1260
aaggactcca actccgtcct tacttccatc cacactttcg accccgatgc cggatgtgat 1320
gctaccacct tccagccctg ctccgacaag gccctgtcca acctcaaggt ttacgtcgac 1380
tcgttccgct ccatctgggc catcaacgct ggcgctgctg ccaccgctcc cgtcgctgtc 1440
ggccgctacc ccgaggacac ttactacaac ggtaacccct ggtacctctc tactttcgcc 1500
gtcgccgagc agctctacga tgccatcatc gtctggaaca agcagggatc catccaggtc 1560
accagccttt cccttccctt cttccagcag ttcatctcga ccctcaagac cggcacgtac 1620
acccagagct ccacccagtt ccagaccctc gtccctgcca tcaaggcctg ggctgacggc 1680
ttcgtcgcca tcaaccagaa gtacactcct cctaacggtg gtctcggtga acagtacgac 1740
aaggtctctg gcgaccctgt cagcgctgtt gaccttacct ggtcgtatgc ttccgctctc 1800
accgtcttca acgctcgtgc cggaaactac tcccccggct ggggtgccaa gggcctgacc 1860
gtcccggcag tctgccagcc caacgctggc cctcaagtcc aggtgacgtt caaggttcag 1920
gccacgacgg tctacggcga gaacatttac ctcactggtg ctaacccagc tctgtcgaac 1980
tggtcgcccg acaccgccct cgccatgtct gctgctaact accctacctg gtctgtcaca 2040
gtcaccctcc cggcgaacag cgtcatccag tacaagtaca tcaggaagaa caacggcgcc 2100
gtcacctggg agtctgaccc caacaaccag gtcaccatcc cagcgagcgg cacctacacc 2160
gtcaacgata actggcggta attaattaat aataaataac ggattgtgtc cgtaatcaca 2220
cgtgcccgtg gtgcgtacga taacgcatag tgtttttccc tccacttaaa tcgaagggtt 2280
gtgtcttgga tcgcgcgggt caaatgtata tggttcatat acatccgcag gcacgtaata 2340
aagcgagggg ttcgaatccc cccgttaccc ccggtagggg cccagatccg ggtgactgac 2400
acctggcggt agacaatcaa tccatttcgc tatagttaaa ggatggggat gagggcaatt 2460
ggttatatga tcatgtatgt agtgggtgtg cataatagta gtgaaatgga agccaagtca 2520
tgtgattgta atcgaccgac ggaattgagg atatccggaa atacagacac cgtgaaagcc 2580
atggtctttc cttcgtgtag aagaccagac agacagtccc tgatttaccc ttgcacaaag 2640
cactagaaaa ttagcattcc atccttctct gcttgctctg ctgatatcac tgtcattcaa 2700
tgcatagcca tgagctcatc ttagatccaa gcacgtaatt ccatagccga ggtccacagt 2760
ggagcagcaa cattccccat cattgctttc cccaggggcc tcccaacgac taaatcaaga 2820
gtatatctct accgtccaat agatcgtctt cgcttcaaaa tctttgacaa ttccaagagg 2880
gtccccatcc atcaaaccca gttcaataat agccgagatg catggtggag tcaattaggc 2940
agtattgctg gaatgtcggg gccagttggc ccggtggtca ttggccgcct gtgatgccat 3000
ctgccactaa atccgatcat tgatccaccg cccacgaggc gcgtctttgc tttttgcgcg 3060
gcgtccaggt tcaactctct ccactagtct agcggggttc aaatgcaaac aagtacaaca 3120
cgcagcaaac gaagcagccc accactgcgt tgatgcccag tttgactgtc cgaaatccac 3180
cggaaaggtg gaaacatact atgtaacaat cagagggaag aaaaaatttt tatcgacgag 3240
gcaggatagt gactgatggt ggggtcatgg tcgggtctcc gagcgaaaga gaaccaagga 3300
aacaagatca acgaggttgg tgtacccaaa aggccgcagc aacaagagtc atcgcccaaa 3360
agtcaacagt ctggaagaga ctccgccgtg cagattctgc gtcggtcccg cacatgcgtg 3420
gtgggggcat tacccctcca tgtccaatga taagggcggc ggtcgagggc ttaagcccgc 3480
ccactaattc gccttctcgc ttgcccctcc atataaggat tccccctcct tcccctccca 3540
caactttttt ccttctttct ctcttcgtcc gcatcagtac gtatatcttt cccccatacc 3600
tcctttccta ctcttcttcc attcattcaa ctcttctcct tactgacatc tgttttgctc 3660
agtacctcta cgcgatcagc cgtagtatct gagcaagctt ctctacagaa tctttctagt 3720
atcttacaaa gaactacaaa gttcgcacca atgcctcaat cctgggaaga actggccgct 3780
gataagcgcg cccgcctcgc aaaaaccatc cctgatgaat ggaaagtcca gacgctgcct 3840
gcggaagaca gcgttattga tttcccaaag aaatcgggta tcctttcaga ggccgaactg 3900
aagatcacag aggcctccgc tgcagatctt gtgtccaagc tggcggccgg agagttgacc 3960
tcggcggaag ttacgctagc attctgtaaa cgggcagtaa tcgcccagca gttagtaggg 4020
tcccctctac ctcttgaagt tcctattccg agttcctatt cttcaaatag tataggaact 4080
tcacgcatgc aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 4140
cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4200
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4260
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4320
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4380
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4440
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4500
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4560
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4620
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4680
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 4740
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 4800
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 4860
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 4920
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 4980
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5040
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5100
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5160
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5220
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5280
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5340
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5400
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5460
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5520
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5580
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5640
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 5700
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 5760
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 5820
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 5880
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 5940
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6000
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6060
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6120
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6240
ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 6300
aaaataggcg tatcacgagg ccctttcgtc 6330
<210> 11
<211> 1722
<212> DNA
<213> Byssocorticium
<400> 11
atgtacttcg ctcgccttct ctccggactc tctctcatca cctctgcggt tctcgcccag 60
accgttgact cctatgtcag cactgagggc cccatcgcga aggcgggcct ccttgcgaac 120
attggtccca gtggttccaa atccaacggt gcccatgctg gagttgtcgt cgctagccct 180
agccaagtca acccggacta catgtacaca tgggtccgcg actcttccct cgtgttcaag 240
gtcctcgtcg accagctcgc ttccggccag gacacctctg tccgtagcct gatcgatgca 300
ttcgtcgcag cggagtcggc gatgcagcac acccccaacc ccagtggtga catcaacact 360
ggtggtcttg ctgagcccaa gttcaacatc gacaccaccg ccttcactgg cgcatggggc 420
cgcccgcagc gagatggccc tgctctccgt tctaccaccg tcatcaacta cgccaactac 480
ctccttgcta atggcaacac cactgcttgg gtggtggcca acctctggcc catgatcaag 540
ctcgacttgg actacatcca gaacaactgg aaccagtcta ccttcgacct gtgggaggag 600
ctcaactcct cgtccttctt caccaccgct gttcagcacc gtgctctccg cgagggtatt 660
actctcggcg cgaagctctc gaagactgcc gataccgcca actatggcac ccaggccggc 720
aacatccttt gcttcctcca gtcatactgg aaccctaccg ccaactacgt gacctccaac 780
accggtggtg gacgctccgg caaggactcc aactccgtcc ttacttccat ccacactttc 840
gaccccgatg ccggatgtga tgctaccacc ttccagccct gctccgacaa ggccctgtcc 900
aacctcaagg tttacgtcga ctcgttccgc tccatctggg ccatcaacgc tggcgctgct 960
gccaccgctc ccgtcgctgt cggccgctac cccgaggaca cttactacaa cggtaacccc 1020
tggtacctct ctactttcgc cgtcgccgag cagctctacg atgccatcat cgtctggaac 1080
aagcagggat ccatccaggt caccagcctt tcccttccct tcttccagca gttcatctcg 1140
accctcaaga ccggcacgta cacccagagc tccacccagt tccagaccct cgtccctgcc 1200
atcaaggcct gggctgacgg cttcgtcgcc atcaaccaga agtacactcc tcctaacggt 1260
ggtctcggtg aacagtacga caaggtctct ggcgaccctg tcagcgctgt tgaccttacc 1320
tggtcgtatg cttccgctct caccgtcttc aacgctcgtg ccggaaacta ctcccccggc 1380
tggggtgcca agggcctgac cgtcccggca gtctgccagc ccaacgctgg ccctcaagtc 1440
caggtgacgt tcaaggttca ggccacgacg gtctacggcg agaacattta cctcactggt 1500
gctaacccag ctctgtcgaa ctggtcgccc gacaccgccc tcgccatgtc tgctgctaac 1560
taccctacct ggtctgtcac agtcaccctc ccggcgaaca gcgtcatcca gtacaagtac 1620
atcaggaaga acaacggcgc cgtcacctgg gagtctgacc ccaacaacca ggtcaccatc 1680
ccagcgagcg gcacctacac cgtcaacgat aactggcggt aa 1722
<210> 12
<211> 573
<212> PRT
<213> Byssocorticium
<400> 12
Met Tyr Phe Ala Arg Leu Leu Ser Gly Leu Ser Leu Ile Thr Ser Ala
1 5 10 15
Val Leu Ala Gln Thr Val Asp Ser Tyr Val Ser Thr Glu Gly Pro Ile
20 25 30
Ala Lys Ala Gly Leu Leu Ala Asn Ile Gly Pro Ser Gly Ser Lys Ser
35 40 45
Asn Gly Ala His Ala Gly Val Val Val Ala Ser Pro Ser Gln Val Asn
50 55 60
Pro Asp Tyr Met Tyr Thr Trp Val Arg Asp Ser Ser Leu Val Phe Lys
65 70 75 80
Val Leu Val Asp Gln Leu Ala Ser Gly Gln Asp Thr Ser Val Arg Ser
85 90 95
Leu Ile Asp Ala Phe Val Ala Ala Glu Ser Ala Met Gln His Thr Pro
100 105 110
Asn Pro Ser Gly Asp Ile Asn Thr Gly Gly Leu Ala Glu Pro Lys Phe
115 120 125
Asn Ile Asp Thr Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg
130 135 140
Asp Gly Pro Ala Leu Arg Ser Thr Thr Val Ile Asn Tyr Ala Asn Tyr
145 150 155 160
Leu Leu Ala Asn Gly Asn Thr Thr Ala Trp Val Val Ala Asn Leu Trp
165 170 175
Pro Met Ile Lys Leu Asp Leu Asp Tyr Ile Gln Asn Asn Trp Asn Gln
180 185 190
Ser Thr Phe Asp Leu Trp Glu Glu Leu Asn Ser Ser Ser Phe Phe Thr
195 200 205
Thr Ala Val Gln His Arg Ala Leu Arg Glu Gly Ile Thr Leu Gly Ala
210 215 220
Lys Leu Ser Lys Thr Ala Asp Thr Ala Asn Tyr Gly Thr Gln Ala Gly
225 230 235 240
Asn Ile Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Thr Ala Asn Tyr
245 250 255
Val Thr Ser Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ser Asn Ser
260 265 270
Val Leu Thr Ser Ile His Thr Phe Asp Pro Asp Ala Gly Cys Asp Ala
275 280 285
Thr Thr Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val
290 295 300
Tyr Val Asp Ser Phe Arg Ser Ile Trp Ala Ile Asn Ala Gly Ala Ala
305 310 315 320
Ala Thr Ala Pro Val Ala Val Gly Arg Tyr Pro Glu Asp Thr Tyr Tyr
325 330 335
Asn Gly Asn Pro Trp Tyr Leu Ser Thr Phe Ala Val Ala Glu Gln Leu
340 345 350
Tyr Asp Ala Ile Ile Val Trp Asn Lys Gln Gly Ser Ile Gln Val Thr
355 360 365
Ser Leu Ser Leu Pro Phe Phe Gln Gln Phe Ile Ser Thr Leu Lys Thr
370 375 380
Gly Thr Tyr Thr Gln Ser Ser Thr Gln Phe Gln Thr Leu Val Pro Ala
385 390 395 400
Ile Lys Ala Trp Ala Asp Gly Phe Val Ala Ile Asn Gln Lys Tyr Thr
405 410 415
Pro Pro Asn Gly Gly Leu Gly Glu Gln Tyr Asp Lys Val Ser Gly Asp
420 425 430
Pro Val Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr
435 440 445
Val Phe Asn Ala Arg Ala Gly Asn Tyr Ser Pro Gly Trp Gly Ala Lys
450 455 460
Gly Leu Thr Val Pro Ala Val Cys Gln Pro Asn Ala Gly Pro Gln Val
465 470 475 480
Gln Val Thr Phe Lys Val Gln Ala Thr Thr Val Tyr Gly Glu Asn Ile
485 490 495
Tyr Leu Thr Gly Ala Asn Pro Ala Leu Ser Asn Trp Ser Pro Asp Thr
500 505 510
Ala Leu Ala Met Ser Ala Ala Asn Tyr Pro Thr Trp Ser Val Thr Val
515 520 525
Thr Leu Pro Ala Asn Ser Val Ile Gln Tyr Lys Tyr Ile Arg Lys Asn
530 535 540
Asn Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Gln Val Thr Ile
545 550 555 560
Pro Ala Ser Gly Thr Tyr Thr Val Asn Asp Asn Trp Arg
565 570
<210> 13
<211> 283
<212> DNA
<213> 構巢曲霉
<400> 13
atgcctcaat cctgggaaga actggccgct gataagcgcg cccgcctcgc aaaaaccatc 60
cctgatgaat ggaaagtcca gacgctgcct gcggaagaca gcgttattga tttcccaaag 120
aaatcgggta tcctttcaga ggccgaactg aagatcacag aggcctccgc tgcagatctt 180
gtgtccaagc tggcggccgg agagttgacc tcggtggaag ttacgctagc attctgtaaa 240
cgggcagcaa tcgcccagca gttagtaggg tcccctctac ctc 283
<210> 14
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 引物 M13 RV
<400> 14
caggaaacag ctatgac 17
<210> 15
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 引物 M13 M4
<400> 15
gttttcccag tcacgac 17
<210> 16
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 在融合載體R中的引物
<400> 16
tatgcgttat cgtacgcac 19
<210> 17
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 引物 M13 M4
<400> 17
gttttcccag tcacgac 17
<210> 18
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物 M49X F
<220>
<221> 尚未歸類的特征
<222> (16)..(17)
<223> n is a, c, g, or t
<400> 18
gtcaacccgg actacnnkta cacatgg 27
<210> 19
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物 M49X R
<400> 19
gtagtccggg ttgacttg 18
<210> 20
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物 SOE-M4 F
<400> 20
gtactatctg gcattggtac gttttcccag tcacgac 37
<210> 21
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物 SOE-MR R
<400> 21
tggttatgat ttcggcgatg caggaaacag ctatgac 37
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物 SOE-F
<400> 22
gtactatctg gcattggtac 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物 SOE-R
<400> 23
tggttatgat ttcggcgatg 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物插入物解救F
<400> 24
aatctcagaa caccaatatc 20
<210> 25
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物插入物解救R
<400> 25
aacactatgc gttatcgtac 20
<210> 26
<211> 11101
<212> DNA
<213> 人工序列
<220>
<223> 載體 pDAu571
<400> 26
ttgaagttcc tattccgagt tcctattctc tagaaagtat aggaacttca gtacccgggt 60
ataagctagc ttccgttaaa ttgccgtcgt cagccgttaa attaccgatt aatcccgata 120
aatttccgag atctccgtta aattgccgtt cgcagccgtt aaattaccgg ggacgaccga 180
taaatttccg cgatgaattc atggtgtttt gatcatttta aatttttata tggcgggtgg 240
tgggcaactc gcttgcgcgg gcaactcgct taccgattac gttagggctg atatttacgt 300
aaaaatcgtc aagggatgca agaccaaacc gttaaatttc cggagtcaac agcatccaag 360
cccaagtcct tcacggagaa accccagcgt ccacatcacg agcgaaggac cacctctagg 420
catcggacgc accatccaat tagaagcagc aaagcgaaac agcccaagaa aaaggtcggc 480
ccgtcggcct tttctgcaac gctgatcacg ggcagcgatc caaccaacac cctccagagt 540
gactaggggc ggaaatttat cgggattaat ttccactcaa ccacaaatca cagtcgtccc 600
cggtaattta acggctgcag acggcaattt aacggcttct gcgaatcgct tggattcccc 660
gcccctggcc gtagagctta aagtatgtcc cttgtcgatg cgatgtatca caacatataa 720
atactggcaa gggatgccat gcttggagtt tccaactcaa tttacctcta tccacacttc 780
tcttccttcc tcaatcctct atatacacaa ctggggatcc accatgttct cggcaggcca 840
caagattaag ggtacagtcg tcctcatgcc taaaaacgag ttggaagtga accccgatgg 900
ctccgcagtc gataacctca acgcattcct cggacgttcg gtgtcgctcc agctcatctc 960
cgcgaccaaa gccgacgccc acggtaaggg aaaggtgggc aaggacacgt tcttggaagg 1020
tatcaacact tcgctcccta ccttgggagc aggagagtcc gcattcaaca ttcacttcga 1080
gtgggacggt tcgatgggca ttcccggagc gttctatatc aagaactata tgcaggtgga 1140
gttcttcttg aagtccttga ccttggaggc aatctcgaac cagggtacca tccgtttcgt 1200
gtgtaactcg tgggtctaca acaccaagct ctacaaatcc gtgcggatct tcttcgcgaa 1260
ccacacttac gtcccttcgg agacacctgc ccctttggtg tcgtaccgcg aggaggaatt 1320
gaagtccctc cgtggtaacg gtactggaga aaggaaggag tatgatagga tctacgacta 1380
cgacgtctat aacgatttgg gtaaccccga caaatcggaa aagttggcac gtcctgtgtt 1440
gggaggctcc tccaccttcc cctaccctcg acgcggccgc acgggacgcg gtcccactgt 1500
caccgatccg aacacagaga agcagggcga agtcttctac gtgcccaggg acgaaaacct 1560
cggccacttg aagtcgaagg atgcattgga gattggaacc aagtccctct cccagatcgt 1620
ccagcctgca ttcgaatcgg cgttcgattt gaaatcgacg cccatcgagt tccactcgtt 1680
ccaggacgtc catgacttgt atgaaggtgg tatcaaattg cctcgggacg tcatctccac 1740
cattatcccc ctccccgtga tcaaggaatt gtaccgcacc gacggccagc atattctcaa 1800
attcccccag ccgcacgtcg tccaggtctc gcagtccgca tggatgacag atgaggaatt 1860
cgcgagggaa atgattgcag gtgtcaaccc gtgtgtcatc cgaggcttgg aggagttccc 1920
tcctaagtcc aacctcgatc ctgccatcta tggagaccag tcctccaaga ttacagccga 1980
ttccctcgat ctcgacggtt atactatgga tgaagcactc ggttccaggc gattgttcat 2040
gctcgattat catgatatct tcatgcccta tgtgcgccag atcaaccagt tgaactcggc 2100
aaaaacatat gcaacgagga cgatcctctt cctccgagaa gacggcacac tcaagcctgt 2160
ggcaatcgag ctctcgctcc cccattccgc aggcgatctc tccgcagccg tgtcgcaggt 2220
ggtgttgcct gcaaaagaag gagtggagtc gaccatctgg ctcttggcca aagcatatgt 2280
gattgtgaac gattcctgtt atcaccagct catgtcgcat tggctcaaca ctcacgcggc 2340
aatggaaccc ttcgtgatcg ccacgcaccg gcacctctcg gtgctccacc cgatctacaa 2400
gctcctcact ccccactacc gtaacaacat gaacattaac gccttggcac ggcagtcgtt 2460
gatcaacgcg aacggcatca ttgagacaac gttcctcccc tccaagtact ccgtcgaaat 2520
gtcgtccgca gtctacaaaa actgggtctt caccgaccag gcgttgcctg ccgacttgat 2580
caaacgaggc gtcgcaatca aagatccctc cactcctcat ggcgtccgcc tcttgatcga 2640
ggactacccc tacgcagcgg acggattgga aatctgggca gccatcaaga cctgggtgca 2700
ggaatacgtc cctttgtact atgcgaggga cgatgatgtc aaaaacgact cggaactcca 2760
gcattggtgg aaggaggcag tggaaaaggg ccatggagat ctcaaggata aaccctggtg 2820
gcctaagctc cagaccttgg aggacctcgt cgaagtgtgt ttgatcatta tctggatcgc 2880
atccgcgttg catgcagccg tgaacttcgg acagtatccc tatggaggcc tcatcatgaa 2940
ccgtcccacc gcatccagga ggctcctccc cgaaaaagga acacccgaat acgaagaaat 3000
gatcaacaac cacgaaaagg catacctccg gaccatcact tccaaactcc cgaccttgat 3060
ctcgctctcc gtgatcgaga ttttgtcgac acatgcgtcg gacgaggtct atttgggtca 3120
gcgggataac ccgcactgga catccgattc caaggccctc caggcgttcc agaagttcgg 3180
caacaagctc aaggagatcg aggagaaact cgtgaggcgg aacaacgacc cttccctcca 3240
gggaaaccgg ttgggacctg tccagctccc gtatacgttg ctctacccct cctcggaaga 3300
aggcctcact ttcaggggta tccccaactc gatttccatc tgactcgaga tctagagggt 3360
gactgacacc tggcggtaga caatcaatcc atttcgctat agttaaagga tggggatgag 3420
ggcaattggt tatatgatca tgtatgtagt gggtgtgcat aatagtagtg aaatggaagc 3480
caagtcatgt gattgtaatc gaccgacgga attgaggata tccggaaata cagacaccgt 3540
gaaagccatg gtctttcctt cgtgtagaag accagacaga cagtccctga tttacccttg 3600
cacaaagcac tagaaaatta gcattccatc cttctctgct tgctctgctg atatcactgt 3660
cattcaatgc atagccatga gctcatctta gatccaagca cgtaattcca tagccgaggt 3720
ccacagtgga gcagcaacat tccccatcat tgctttcccc aggggcctcc caacgactaa 3780
atcaagagta tatctctacc gtccaataga tcgtcttcgc ttcaaaatct ttgacaattc 3840
caagagggtc cccatccatc aaacccagtt caataatagc cgagatgcat ggtggagtca 3900
attaggcagt attgctggaa tgtcggggcc agttggccgg gtggtcattg gccgcctgtg 3960
atgccatctg ccactaaatc cgatcattga tccaccgccc acgaggcgcg tctttgcttt 4020
ttgcgcggcg tccaggttca actctctctt aattaaatag cgacaagccg aacggcaccg 4080
gcaggtacaa tggttcgctg tacttgcttg cgcaagcggg tctttgggga ttgagcgcat 4140
ttggtgttgc aaaggatttg atgtaaatgt agtcgacatc ttagcacaga ggggagagtt 4200
gataaaatgt ggtctgtttg aatgatagtc gggttcgtga cctatattcg tgatagtgga 4260
gataggtctg cgcctatctt atcgggccgg agcaaaaatt ccaccgcagc ggggtgagtt 4320
ttcgttatac agccatccca cttccagctt caaattgtca gtttaatcca gcccaattca 4380
atcattggag aaccggtttt atgtcttcga agtcccacct cccctacgca attcgcgcaa 4440
ccaaccatcc caacccttta acatctaaac tcttctccat cgccgaggag aagaaaacca 4500
acgtcaccgt ctccgcagac gttactactt ccgccgagct cctcgatctt gctgaccgcc 4560
taggccccta tatcgcagtt ctgaaaaccc acatcgacat cctcaccgat ctcaccccgt 4620
cgaccctttc ctcgctccaa tccctcgcga caaagcacaa cttcctcatc tttgaggacc 4680
gcaagttcat cgacatcggc aacaccgtgc aaaagcagta ccacggtggc gctctccgca 4740
tctccgaatg ggcacacatc atcaactgcg ccatcctgcc gggcgaaggg atcgtcgagg 4800
ccctcgcaca gacaaccaag tctcctgact ttaaagacgc gaatcaacga ggtctcctga 4860
ttcttgccga gatgacgagt aagggatctc ttgcgacagg ggagtacacg gcacgctcgg 4920
ttgagtacgc gcggaagtat aaggggtttg tgatgggatt cgtgagtaca agggcgttga 4980
gtgaggtgct gcccgaacag aaagaggaga gcgaggattt tgtcgtcttt acgactgggg 5040
tgaatctgtc ggataagggg gataagctgg ggcagcagta tcagacacct gggtcggcgg 5100
ttgggcgagg tgcggacttt atcattgcgg gtaggggcat ctataaggcg gacgatccag 5160
tcgaggcggt tcagaggtac cgggaggaag gctggaaagc ttacgagaaa agagttggac 5220
tttgagggtg actgacacct ggcggtagac aatcaatcca tttcgctata gttaaaggat 5280
ggggatgagg gcaattggtt atatgatcat gtatgtagtg ggtgtgcata atagtagtga 5340
aatggaagcc aagtcatgtg attgtaatcg accgacggaa ttgaggatat ccggaaatac 5400
agacaccgtg aaagccatgg tctttccttc gtgtagaaga ccagacagac agtccctgat 5460
ttacccttgc acaaagcact agaaaattag cattccatcc ttctctgctt gctctgctga 5520
tatcactgtc attcaatgca tagccatgag ctcatcttag atccaagcac gtaattccat 5580
agccgaggtc cacagtggag cagcaacatt ccccatcatt gctttcccca ggggcctccc 5640
aacgactaaa tcaagagtat atctctaccg tccaatagat cgtcttcgct tcaaaatctt 5700
tgacaattcc aagagggtcc ccatccatca aacccagttc aataatagcc gagatgcatg 5760
gtggagtcaa ttaggcagta ttgctggaat gtcggggcca gttggccggg tggtcattgg 5820
ccgcctgtga tgccatctgc cactaaatcc gatcattgat ccaccgccca cgaggcgcgt 5880
ctttgctttt tgcgcggcgt ccaggttcaa ctctctcctc taggttgaag ttcctattcc 5940
gagttcctat tcttcaaata gtataggaac ttcaactagc tagtgcatgc gtacgatttt 6000
gacatttgct ccattgtcga ggatggatgg aacgagcggc gtgcgccacg aaagtgaggc 6060
tattgcctat cagctctttg ctacattccg gaaacaaaca tccctttttg tgaattatct 6120
acgcaactta gatggcgtga acgcatcttc aaagtctttc ggcaggtccg gcacgacttt 6180
tgcatccaga gaagcgccta catgtgtatt cgaccacctc ctagcgcgct tggatatgag 6240
gaaatattac tgagagtcga aaacaagctc caccgcacca gctcttcttg gagttttata 6300
ttaaagaata ttcccagctc gttgtattat tctttttcta ccgtgctaat gtatcaagga 6360
ctttggtacc tattaacgtt attattcgtg tgctattccc aaacataacc ctgtatatgt 6420
ttcgaacgcc gttatgaccc atgtcttaca tactcattaa gtcattccct tggataatct 6480
cgactcagat gcggcggttg atgtaggagg agaggtaatc gaggacctcc tgggagatga 6540
tgccgttcca ggcggggtag cggatggagc cctcggcgga gcccttgagc tgctcgatat 6600
gctgccactc ctcgatgggg ttggtctcat ccttgagggc gatcatctcc ttggagatgg 6660
gatcgtaggc gtagtagcgg gagactagtg cgaagtaatg atcggggatg gcggtgatct 6720
gatgggtgta ggtggtgcgg gcgacggcgg aggcgcgctt atcggaccag ttgccgacga 6780
cgttggtgag ctcggtgagg cccttcatgg agaggaagga ggtcatgaga tggcggccga 6840
tatgggactt ggggccgttc ttgatggcga agatggagta gggggcgttc ttcttgaggg 6900
ccttgttgta ggagcggacg aggttatcct tgaggagctg gtactcctgc ttgttggagg 6960
aggagttgcc ggtgcggttg acgcgcttga ggacgggctc ggagttgcgg aggaactcat 7020
cgaggtagac gaggggatcg atgcggccgc gggcggagaa gaagtagata tggcgggaga 7080
cggaggtctt ggtctcggtg acgaggcact ggatgatgac gccgaggtac ttgttctgga 7140
cgagcttgaa ggacttggga tcgacgttct tgatatcgga gaagcggccg cagttgatga 7200
aggtggcgag gaagaggaac tggtagaggg tcttggtctt ggtgaagcgg gaggtgtact 7260
cgaaggagtt gaggatcttc tcggtgatct cccagatgga ctcgccctcg gagaggaggg 7320
ccttgagcat cttcttggaa tgggagttgc ccttatcggc ctcctcggag gactcgaact 7380
ggagctggag ggaggagacg atatcggtga tatcggactg atgcttctgg ccgtagtagg 7440
ggatgatggt gaactcccag gcggggatga gcttcttgag ggaggcctcc aggatggtgg 7500
ccttctgggt cttgtacttg aactggaggg acttgttgac gatatcgaag gagagggagt 7560
tggagatgat ggtgttgtag gacatgaagg tggcgcgctt gatggcggtg ccgttatggg 7620
tgatcatcca gcagaggtag gtgagctcgg cggcgcagag ggcgatcttc tcgccggagg 7680
ggcgctcgaa gcgctcgacg aactggcgga cgaggacctt ggggggggtc ttgcagagga 7740
tatcgaactg gggcatggtg ctcagatact acggctgatc gcgtagaggt actgagcaaa 7800
acagatgtca gtaaggagaa gagttgaatg aatggaagaa gagtaggaaa ggaggtatgg 7860
gggaaagata tacgtactga tgcggacgaa gagagaaaga aggaaaaaag ttgtgggagg 7920
ggaaggaggg ggaatcctta tatggagggg caagcgagaa ggcgaattag tgggcgggct 7980
taagccctcg accgccgccc ttatcattgg acatggaggg gtaatgcccc caccacgcat 8040
gtgcgggacc gacgcagaat ctgcacggcg gagtctcttc cagactgttg acttttgggc 8100
gatgactctt gttgctgcgg ccttttgggt acaccaacct cgttgatctt gtttccttgg 8160
ttctctttcg ctcggagacc cgaccatgac cccaccatca gtcactatcc tgcctcgtcg 8220
ataaaaattt tttcttccct ctgattgtta catagtatgt ttccaccttt ccggtggatt 8280
tcggacagtc aaactgggca tcaacgcagt ggtgggctgc ttcgtttgct gcgtgttgta 8340
cttgtttgca tttgaacccc gcggtcgttc gagtccttaa ttggtccgct cccggtcaac 8400
acccaagcag ctgtggcccg gccgagtggc gcctgtctgg tccacagtaa gcttggcgta 8460
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 8520
acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 8580
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 8640
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 8700
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 8760
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 8820
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 8880
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 8940
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 9000
gaccctgccg cttaccggat acctgtccgc ctttttccct tcgggaagcg tggcgctttc 9060
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 9120
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 9180
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 9240
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 9300
cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 9360
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 9420
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 9480
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 9540
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 9600
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 9660
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 9720
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 9780
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 9840
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 9900
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 9960
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 10020
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 10080
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 10140
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 10200
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 10260
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 10320
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 10380
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 10440
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 10500
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 10560
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 10620
cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 10680
ctttcgtctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga 10740
gacggtcaca gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc 10800
agcgggtgtt ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact 10860
gagagtgcac catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat 10920
caggcgccat tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc 10980
ttcgctatta cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac 11040
gccagggttt tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac 11100
c 11101
<210> 27
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> FRT-F
<400> 27
ttgaagttcc tattccgagt tcctattctc tagaaagtat aggaacttc 49
<210> 28
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> FRT-F3
<400> 28
ttgaagttcc tattccgagt tcctattctt caaatagtat aggaacttca 50
<210> 29
<211> 8299
<212> DNA
<213> 人工序列
<220>
<223> 質粒 pDAu703
<400> 29
taggcgtatc acgaggccct ttcgtctcgc gcgtttcggt gatgacggtg aaaacctctg 60
acacatgcag ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca 120
agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggctggctta actatgcggc 180
atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt 240
aaggagaaaa taccgcatca ggcgccattc gccattcagg ctgcgcaact gttgggaagg 300
gcgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag 360
gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag 420
tgaattggcc tccatggccg cggccgcgct ttgctaaaac tttggttgat ggaaggtatc 480
tggcgataaa ctccgacgac gtctagaagc aacaatctta tgcaaacgct cattggttct 540
tttcgaccgc aacatccatc atgaaactgg tattttgtct gtgtcagcag tctagaaccc 600
cttgccgggt attttagcat ttcatttttc tataaaaagg taccagcatg tatggatcgt 660
atcttccgta ccgtggttat taaatcccag cagaggccga taggcttaag aagtgaacat 720
ggcatggtta aggaagaagc cattactgag tatatatggc tagaataatc gctgggaaag 780
atttatgctt ccaagaggcg taggacggta taccatacag tacggtattt atgaacaatt 840
cgataatacc actccccaaa gcgggagata ggacacccgc ctcaggcacc aaccaccccc 900
tttttcaact gtcagtggtg cacgtttcca tcgagcataa gcttggtacc ctaaggatag 960
gccctaatct tatctacatg tgactgcatc gatgtgtttg gtcaaaatga ggcatgtggc 1020
tcaccccaca ggcggagaaa cgtgtggcta gtgcatgaca gtcccctcca tagattcaat 1080
ttaatttttc gcggcaattg tcgtgcagtt tgtatctaca tttcattcca tatatcaaga 1140
gttagtagtt ggacatcctg attattttgt ctaattactg aaaactcgaa gtactaacct 1200
actaataagc cagtttcaac cactaagtgc tcatttatac aatatttgca gaaccccgcg 1260
ctacccctcc atcgccaaca tgtcttccaa gtcgcaattg acctacagcg cacgcgctag 1320
caagcacccc aatgcgctcg taaagaagct cttcgaggtt gccgaggcca agaaaaccaa 1380
tgtcaccgtt tccgccgacg tgacaaccac caaagagctg ctggatttgg ctgaccgtat 1440
gcgcaccggg gttgaagttc ctattccgag ttcctattct tcaaatagta taggaacttc 1500
attaattaaa ggagagagtt gaacctggac gccgcgcaaa aagcaaagac gcgcctcgtg 1560
ggcggtggat caatgatcgg atttagtggc agatggcatc acaggcggcc aatgaccacc 1620
gggccaactg gccccgacat tccagcaata ctgcctaatt gactccacca tgcatctcgg 1680
ctattattga actgggtttg atggatgggg accctcttgg aattgtcaaa gattttgaag 1740
cgaagacgat ctattggacg gtagagatat actcttgatt tagtcgttgg gaggcccctg 1800
gggaaagcaa tgatggggaa tgttgctgct ccactgtgga cctcggctat ggaattacgt 1860
gcttggatct aagatgagct catggctatg cattgaatga cagtgatatc agcagagcaa 1920
gcagagaagg atggaatgct aattttctag tgctttgtgc aagggtaaat cagggactgt 1980
ctgtctggtc ttctacacga aggaaagacc atggctttca cggtgtctgt atttccggat 2040
atcctcaatt ccgtcggtcg attacaatca catgacttgg cttccatttc actactatta 2100
tgcacaccca ctacatacat gatcatataa ccaattgccc tcatccccat cctttaacta 2160
tagcgaaatg gattgattgt ctaccgccag gtgtcagtca ccctctagat ctcgagctcg 2220
ctagagtcga cctatggagt caccacattt cccagcaact tccccacttc ctctgcaatc 2280
gccaacgtcc tctcttcact gagtctccgt ccgataacct gcactgcaac cggtgcccca 2340
tggtacgcct ccggatcata ctcttcctgc acgagggcat caagctcact aaccgccttg 2400
aaactctcat tcttcttatc gatgttctta tccgcaaagg taaccggaac aaccacgctc 2460
gtgaaatcca gcaggttgat cacagaggca tacccatagt accggaactg gtcatgccgt 2520
accgcagcgg taggcgtaat cggcgcgatg atggcgtcca gttccttccc ggccttttct 2580
tcagcctccc gccatttctc aaggtactcc atctggtaat tccacttctg gagatgcgtg 2640
tcccagagct cgttcatgtt aacagctttg atgttcgggt tcagtaggtc tttgatattt 2700
ggaatcgccg gctcgccgga tgcactgata tcgcgcatta cgtcggcgct gccgtcagcc 2760
gcgtagatat gggagatgag atcgtggccg aaatcgtgct tgtatggcgt ccacggggtc 2820
acggtgtgac cggctttggc gagtgcggcg acggtggttt ccacgccgcg caggatagga 2880
gggtgtggaa ggacattgcc gtcgaagttg tagtagccga tattgagccc gccgttcttg 2940
atcttggagg caataatgtc cgactcggac tggcgccagg gcatggggat gaccttggag 3000
tcgtatttcc atggctcctg accgaggacg gatttggtga agaggcggag gtctaacata 3060
cttcatcagt gactgccggt ctcgtatata gtataaaaag caagaaagga ggacagtgga 3120
ggcctggtat agagcaggaa aagaaggaag aggcgaagga ctcaccctca acagagtgcg 3180
taatcggccc gacaacgctg tgcaccgtct cctgaccctc catgctgttc gccatctttg 3240
catacggcag ccgcccatga ctcggcctta gaccgtacag gaagttgaac gcggccggca 3300
ctcgaatcga gccaccgata tccgttccta caccgatgac gccaccacga atcccaacga 3360
tcgcaccctc accaccagaa ctgccgccgc acgaccagtt cttgttgcgt gggttgacgg 3420
tgcgcccgat gatgttgttg actgtctcgc agaccatcag ggtctgcggg acagaggtct 3480
tgacgtagaa gacggcaccg gctttgcgga gcatggttgt cagaaccgag tccccttcgt 3540
cgtacttgtt tagccatgag atgtagccca ttgatgtttc gtagccctgg tggcatatgt 3600
tagctgacaa aaagggacat ctaacgactt aggggcaacg gtgtaccttg actcgaagct 3660
ggtctttgag agagatgggg aggccatgga gtggaccaac gggtctcttg tgctttgcgt 3720
agtattcatc gagttccctt gcctgcgcga gagcggcgtc agggaagaac tcgtgggcgc 3780
agtttgtctg cacagaagcc agcgtcagct tgatagtccc ataaggtggc gttgttacat 3840
ctccctgaga ggtagagggg accctactaa ctgctgggcg attgctgccc gtttacagaa 3900
tgctagcgta acttccaccg aggtcaactc tccggccgcc agcttggaca caagatctgc 3960
agcggaggcc tctgtgatct tcagttcggc ctctgaaagg atcaccgatt tctttgggaa 4020
atcaataacg ctgtcttccg caggcagcgt ctggactttc cattcatcag ggatggtttt 4080
tgcgaggcgg gcgcgcttat cagcggccag ttcttcccag gattgaggca tgtgcatgca 4140
atgtgtgttt atgtggaagt aagatacgac gagtttgatt gagaaaagac agggtgattg 4200
tcaagttcag tatggaagaa agagtagaag aagatcagac gacagggaag agcgatgaca 4260
taaaaggtgg aagacggaag aaaaacgaac caaatcaatc ccactctatg gcgggggttg 4320
gactgcctga ggccggcact ggtggggctt atcgataagt tctcgtcacc ggatgcaatg 4380
cgctgtcaac tgctgacttg gccctgaaca tcctgtcctc tacagatcca tactatacaa 4440
tgatcccagt tatagtgcgg taaggtgcat atcatatctc attctcatga ctcattcgac 4500
ttttttttag agaaagtaca tacgtggaac atacactaaa cgcaacaggt cgcgacaaca 4560
ctggtataca aaacggtccc cggtgaatga cgttattagt gtctatcccc cactcacacc 4620
cgaaaagaat aatagaaact aacagaaaaa gcggcccgag gataagagga acattcaaac 4680
agaaggggaa tcataaaaac cgaaaaatgc aaggaaaaga gaactcaaat caataatttt 4740
cataatactg tcgagagtaa tacggaccag cgtctctcag ggacatgcgt cggcgcaagg 4800
catcatccaa tctctcatct aacacatcca gcattcgtgt tcgatagtct aactgcttct 4860
ctcggcgctc aagtcttgct tcccgatcat cgagttaatt aagaagttcc tatactttct 4920
agagaatagg aactcggaat aggaacttca aggtaccgag ctctatcctc aataccctat 4980
tttccacgat tccattgtca tatccaattc cgttttcttt tcttgttttc ccctcatcca 5040
atcccgtcca tcatttactc ctttttcttg tgaatgcaag tggcactaag aaatccaacc 5100
cccagacaaa ttttcctact caggaacaca aaaacctcgt ttctgctccc ttctcgtact 5160
tcattcctat cgtctcggaa tttcctcaac aaccctttcc gactttgcga cagcgtcgcg 5220
attccagact tatgtgttct cgttcctact gtcgttacca gtctatttat tccgaaacct 5280
ctgatcgctg aatttcacac acaacacccc cccgttgatg ctggtggaga atccgtagcg 5340
tcaagagttg aattcactcc atgttgtaac gaagtccacg aattgagacg attgatgatt 5400
acaaccccgc gatcgcctat cgacgattcg acgagatgcc attctcatcc tcctcatcct 5460
cctccacccc cgaggtgtct accaccccgc tcgcagatta cttctggatc gcaggtgtcg 5520
atggcgcgga aatcttagag actttccaaa gactcggcga cgaatacagg gcaaacagtg 5580
ccaccgctcc tggccccgct cttgcggaca cgatcgagga agatgcggac gcggaggagg 5640
cacacgaccc ccgtctggac tccctctctc gacccaattc catggctggg ggccgcaatt 5700
ccttccagcg gttctcaatg cgctcaggag actccagtga gtccagtggg aatggtacca 5760
gcagcaaccg gagcagtctg accatcaagg gtaatcagtc gcccagaggg tcgtcgtttc 5820
tagaagattt cgactttgac aaggccctgt tcaagtttgc aaacgagcgg gagtcgttcc 5880
tgtcggatct gagtctcagt gccggagcaa tcactcccac ctcccgtcct aggtccaggt 5940
tacgtacaca gaagattgtc tccgaggaaa gtccctccca gccatccagc ttgcttcgat 6000
caggcattgg tagtgtgcgg cgtcatatgg cattcagaga catgaatagt atgaaacggc 6060
agccgtcagt tgctcgtcgc ggccgcagct tggcgtaatc atggtcatag ctgtttcctg 6120
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 6180
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 6240
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 6300
gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 6360
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 6420
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 6480
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 6540
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 6600
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 6660
tgtccgcctt tttcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 6720
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 6780
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 6840
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 6900
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 6960
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 7020
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 7080
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 7140
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 7200
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 7260
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 7320
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 7380
gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 7440
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 7500
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 7560
gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 7620
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 7680
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 7740
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 7800
tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 7860
gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 7920
tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 7980
gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 8040
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 8100
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 8160
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 8220
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 8280
tgacattaac ctataaaaa 8299
<210> 30
<211> 8614
<212> DNA
<213> 人工序列
<220>
<223> 質粒 pDAU724
<400> 30
gaattcgagc tcggtacctt gaagttccta ttccgagttc ctattctcta gaaagtatag 60
gaacttcagt acccgggtat aagctagctt ccgttaaatt gccgtcgtca gccgttaaat 120
taccgattaa tcccgataaa tttccgagat ctccgttaaa ttgccgttcg cagccgttaa 180
attaccgggg acgaccgata aatttccgcg atgaattcat ggtgttttga tcattttaaa 240
tttttatatg gcgggtggtg ggcaactcgc ttgcgcgggc aactcgctta ccgattacgt 300
tagggctgat atttacgtaa aaatcgtcaa gggatgcaag accaaaccgt taaatttccg 360
gagtcaacag catccaagcc caagtccttc acggagaaac cccagcgtcc acatcacgag 420
cgaaggacca cctctaggca tcggacgcac catccaatta gaagcagcaa agcgaaacag 480
cccaagaaaa aggtcggccc gtcggccttt tctgcaacgc tgatcacggg cagcgatcca 540
accaacaccc tccagagtga ctaggggcgg aaatttatcg ggattaattt ccactcaacc 600
acaaatcaca gtcgtccccg gtaatttaac ggctgcagac ggcaatttaa cggcttctgc 660
gaatcgcttg gattccccgc ccctggccgt agagcttaaa gtatgtccct tgtcgatgcg 720
atgtatcaca acatataaat actggcaagg gatgccatgc ttggagtttc caactcaatt 780
tacctctatc cacacttctc ttccttcctc aatcctctat atacacaact ggggatccac 840
catgaggagc tcccttgtgc tgttctttgt ctctgcgtgg acggccttgg ccagtcctat 900
tcgtcgagag gtctcgcagg atctgtttaa ccagttcaat ctctttgcac agtattctgc 960
agccgcatac tgcggaaaaa acaatgatgc cccagctggt acaaacatta cgtgcacggg 1020
aaatgcctgc cccgaggtag agaaggcgga tgcaacgttt ctctactcgt ttgaagactc 1080
tggagtgggc gatgtcaccg gcttccttgc tctcgacaac acgaacaaat tgatcgtcct 1140
ctctttccgt ggctctcgtt ccatagagaa ctggatcggg aatcttaact tcgacttgaa 1200
agaaataaat gacatttgct ccggctgcag gggacatgac ggcttcactt cgtcctggag 1260
gtctgtagcc gatacgttaa ggcagaaggt ggaggatgct gtgagggagc atcccgacta 1320
tcgcgtggtg tttaccggac atagcttggg tggtgcattg gcaactgttg ccggagcaga 1380
cctgcgtgga aatgggtatg atatcgacgt gttttcatat ggcgcccccc gagtcggaaa 1440
cagggctttt gcagaattcc tgaccgtaca gaccggcgga acactctacc gcattaccca 1500
caccaatgat attgtcccta gactcccgcc gcgcgaattc ggttacagcc attctagccc 1560
agagtactgg atcaaatctg gaacccttgt ccccgtcacc cgaaacgata tcgtgaagat 1620
agaaggcatc gatgccaccg gcggcaataa ccagcctaac attccggata tccctgcgca 1680
cctatggtac ttcgggttaa ttgggacatg tctttagtgg ccggcgcggc tgggtcgact 1740
ctagcgagct cgagatctag agggtgactg acacctggcg gtagacaatc aatccatttc 1800
gctatagtta aaggatgggg atgagggcaa ttggttatat gatcatgtat gtagtgggtg 1860
tgcataatag tagtgaaatg gaagccaagt catgtgattg taatcgaccg acggaattga 1920
ggatatccgg aaatacagac accgtgaaag ccatggtctt tccttcgtgt agaagaccag 1980
acagacagtc cctgatttac ccttgcacaa agcactagaa aattagcatt ccatccttct 2040
ctgcttgctc tgctgatatc actgtcattc aatgcatagc catgagctca tcttagatcc 2100
aagcacgtaa ttccatagcc gaggtccaca gtggagcagc aacattcccc atcattgctt 2160
tccccagggg cctcccaacg actaaatcaa gagtatatct ctaccgtcca atagatcgtc 2220
ttcgcttcaa aatctttgac aattccaaga gggtccccat ccatcaaacc cagttcaata 2280
atagccgaga tgcatggtgg agtcaattag gcagtattgc tggaatgtcg gggccagttg 2340
gccgggtggt cattggccgc ctgtgatgcc atctgccact aaatccgatc attgatccac 2400
cgcccacgag gcgcgtcttt gctttttgcg cggcgtccag gttcaactct ctcttaatta 2460
atgtacatta gtgatacccc actctaagaa aatagaccaa tctccagctg caccttcaga 2520
cactccggta caaattctcg tctatgttgg agattgttgt gactttgaaa catgaccctt 2580
gaccctgatt ttgaatttgt ccatatatcg aggcaggtgt cttattcgta cggagagggt 2640
atctgtcgta gacacatagt agtagtcatt tcgagtgctg aatttataaa tcgcatcata 2700
cttgcgacat actgccataa aaggagtacg tatccaccac tacttattgc gcaccaacac 2760
gcttcaggta tgcatcccat ccctccttct ggtactgctt cgccgcctcc acgggatcag 2820
gagcagcata aattccacgg ccagcaataa taaagtcggc accgcgtcca acagccgact 2880
caggagtttg gtactgctgt cccagcttgt cacccttcga ggagaggttg acacctgtcg 2940
tgaagacgac aaaatcttcc tcctccgaag gcgagctaac ttcagactga acctcgccaa 3000
ggtgacgtgt cgagacgaat cccatcacaa acttcttata cttccgagca tagtcaacag 3060
aagaagtagt atattgaccg gtagccaaag atcccttgga ggtcatctcc gcaaggatca 3120
aaaggcccct ctcggagccg taggggaagt cctcggccga agcagtctgg gccagagcct 3180
cgacgatacc ctcaccgggc agaatactgc agttgatgat gtgggcccac tcagagatac 3240
gcagagtgcc gccatggtac tgcttttgga ctgtgtttcc gatatcgatg aacttgcgat 3300
cttcgaagat gaggaaattg tgcttctctg caagggcctt cagaccggtg atggtttctt 3360
cgctgaaatc ggagaggata tcgatgtgag ttttgatcac ggcaatgtac ggaccgagtc 3420
ctgttatata atccaccatt aaccattact agatcacatg taagtggcat tgaagttcct 3480
atactatttg aagaatagga actcggaata ggaacttcaa cgtacgattt tgacatttgc 3540
tccattgtcg aggatggatg gaacgagcgg cgtgcgccac gaaagtgagg ctattgccta 3600
tcagctcttt gctacattcc ggaaacaaac atcccttttt gtgaattatc tacgcaactt 3660
agatggcgtg aacgcatctt caaagtcttt cggcaggtcc ggcacgactt ttgcatccag 3720
agaagcgcct acatgtgtat tcgaccacct cctagcgcgc ttggatatga ggaaatatta 3780
ctgagagtcg aaaacaagct ccaccgcacc agctcttctt ggagttttat attaaagaat 3840
attcccagct cgttgtatta ttctttttct accgtgctaa tgtatcaagg actttggtac 3900
ctattaacgt tattattcgt gtgctattcc caaacataac cctgtatatg tttcgaacgc 3960
cgttatgacc catgtcttac atactcatta agtcattccc ttggataatc tcgactcaga 4020
tgcggcggtt gatgtaggag gagaggtaat cgaggacctc ctgggagatg atgccgttcc 4080
aggcggggta gcggatggag ccctcggcgg agcccttgag ctgctcgata tgctgccact 4140
cctcgatggg gttggtctca tccttgaggg cgatcatctc cttggagatg ggatcgtagg 4200
cgtagtagcg ggagactagt gcgaagtaat gatcggggat ggcggtgatc tgatgggtgt 4260
aggtggtgcg ggcgacggcg gaggcgcgct tatcggacca gttgccgacg acgttggtga 4320
gctcggtgag gcccttcatg gagaggaagg aggtcatgag atggcggccg atatgggact 4380
tggggccgtt cttgatggcg aagatggagt agggggcgtt cttcttgagg gccttgttgt 4440
aggagcggac gaggttatcc ttgaggagct ggtactcctg cttgttggag gaggagttgc 4500
cggtgcggtt gacgcgcttg aggacgggct cggagttgcg gaggaactca tcgaggtaga 4560
cgaggggatc gatgcggccg cgggcggaga agaagtagat atggcgggag acggaggtct 4620
tggtctcggt gacgaggcac tggatgatga cgccgaggta cttgttctgg acgagcttga 4680
aggacttggg atcgacgttc ttgatatcgg agaagcggcc gcagttgatg aaggtggcga 4740
ggaagaggaa ctggtagagg gtcttggtct tggtgaagcg ggaggtgtac tcgaaggagt 4800
tgaggatctt ctcggtgatc tcccagatgg actcgccctc ggagaggagg gccttgagca 4860
tcttcttgga atgggagttg cccttatcgg cctcctcgga ggactcgaac tggagctgga 4920
gggaggagac gatatcggtg atatcggact gatgcttctg gccgtagtag gggatgatgg 4980
tgaactccca ggcggggatg agcttcttga gggaggcctc caggatggtg gccttctggg 5040
tcttgtactt gaactggagg gacttgttga cgatatcgaa ggagagggag ttggagatga 5100
tggtgttgta ggacatgaag gtggcgcgct tgatggcggt gccgttatgg gtgatcatcc 5160
agcagaggta ggtgagctcg gcggcgcaga gggcgatctt ctcgccggag gggcgctcga 5220
agcgctcgac gaactggcgg acgaggacct tggggggggt cttgcagagg atatcgaact 5280
ggggcatggt gctcagatac tacggctgat cgcgtagagg tactgagcaa aacagatgtc 5340
agtaaggaga agagttgaat gaatggaaga agagtaggaa aggaggtatg ggggaaagat 5400
atacgtactg atgcggacga agagagaaag aaggaaaaaa gttgtgggag gggaaggagg 5460
gggaatcctt atatggaggg gcaagcgaga aggcgaatta gtgggcgggc ttaagccctc 5520
gaccgccgcc cttatcattg gacatggagg ggtaatgccc ccaccacgca tgtgcgggac 5580
cgacgcagaa tctgcacggc ggagtctctt ccagactgtt gacttttggg cgatgactct 5640
tgttgctgcg gccttttggg tacaccaacc tcgttgatct tgtttccttg gttctctttc 5700
gctcggagac ccgaccatga ccccaccatc agtcactatc ctgcctcgtc gataaaaatt 5760
ttttcttccc tctgattgtt acatagtatg tttccacctt tccggtggat ttcggacagt 5820
caaactgggc atcaacgcag tggtgggctg cttcgtttgc tgcgtgttgt acttgtttgc 5880
atttgaaccc cgcggtcgtt cgagtcctta attggtccgc tcccggtcaa cacccaagca 5940
gctgtggccc ggccgagtgg cgcctgtctg gtccacagta agcttggcgt aatcatggtc 6000
atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 6060
aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 6120
gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg 6180
ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga 6240
ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 6300
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 6360
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 6420
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 6480
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 6540
gcttaccgga tacctgtccg cctttttccc ttcgggaagc gtggcgcttt ctcatagctc 6600
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 6660
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 6720
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 6780
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 6840
aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 6900
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 6960
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 7020
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 7080
cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 7140
gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 7200
tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 7260
gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 7320
agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 7380
tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 7440
agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 7500
gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 7560
catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 7620
ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 7680
atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 7740
tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 7800
cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 7860
cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 7920
atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 7980
aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 8040
ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 8100
aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga 8160
aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct 8220
cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg agacggtcac 8280
agcttgtctg taagcggatg ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt 8340
tggcgggtgt cggggctggc ttaactatgc ggcatcagag cagattgtac tgagagtgca 8400
ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca tcaggcgcca 8460
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 8520
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 8580
ttcccagtca cgacgttgta aaacgacggc cagt 8614
<210> 31
<211> 876
<212> DNA
<213> 人工序列
<220>
<223> 密碼子優(yōu)化的 VaXET16 開放閱讀框
<400> 31
atgggctcgt ccctctggac ttgtttgatc ctcctctcct tggcatcggc atccttcgca 60
gcgaaccctc gaactccgat cgatgtgcct ttcggacgga actacgtgcc gacatgggca 120
ttcgaccaca ttaagtattt gaacggaggc tcggagatcc agttgcatct cgacaagtac 180
accggcactg gtttccagtc gaagggctcc tacttgttcg gacatttctc catgtacatc 240
aaattggtgc ctggtgactc ggcaggaact gtcaccgcat tctacctctc gtcgacaaac 300
gcagagcatg acgaaatcga cttcgagttc ctcggcaaca ggacaggaca gccgtacatc 360
ctccagacca acgtcttcac aggaggcaaa ggtgatcggg aacagcggat ctacttgtgg 420
ttcgatccca caacccagta ccataggtac tcggtgctct ggaacatgta tcagatcgtc 480
ttctacgtcg acgattatcc gatccgagtg ttcaagaact ccaacgactt gggcgtcaaa 540
ttccccttca accagcccat gaagatttac aactcgttgt ggaacgccga cgattgggca 600
accaggggtg gtctcgagaa gacagattgg tcgaaagcac ctttcatcgc gtcgtacaag 660
ggtttccaca tcgacggatg tgaagcctcc gtgaacgcca agttctgtga cacccagggc 720
aaacgatggt gggatcagcc ggaattccgg gatttggatg cagcccagtg gcagaagctc 780
gcgtgggtca ggaacaagta caccatctat aactactgta ccgatcggaa acgatattcg 840
caggtgcctc ccgagtgtac acgcgatagg gacatc 876
<210> 32
<211> 292
<212> PRT
<213> 豇豆屬
<400> 32
Met Gly Ser Ser Leu Trp Thr Cys Leu Ile Leu Leu Ser Leu Ala Ser
1 5 10 15
Ala Ser Phe Ala Ala Asn Pro Arg Thr Pro Ile Asp Val Pro Phe Gly
20 25 30
Arg Asn Tyr Val Pro Thr Trp Ala Phe Asp His Ile Lys Tyr Leu Asn
35 40 45
Gly Gly Ser Glu Ile Gln Leu His Leu Asp Lys Tyr Thr Gly Thr Gly
50 55 60
Phe Gln Ser Lys Gly Ser Tyr Leu Phe Gly His Phe Ser Met Tyr Ile
65 70 75 80
Lys Leu Val Pro Gly Asp Ser Ala Gly Thr Val Thr Ala Phe Tyr Leu
85 90 95
Ser Ser Thr Asn Ala Glu His Asp Glu Ile Asp Phe Glu Phe Leu Gly
100 105 110
Asn Arg Thr Gly Gln Pro Tyr Ile Leu Gln Thr Asn Val Phe Thr Gly
115 120 125
Gly Lys Gly Asp Arg Glu Gln Arg Ile Tyr Leu Trp Phe Asp Pro Thr
130 135 140
Thr Gln Tyr His Arg Tyr Ser Val Leu Trp Asn Met Tyr Gln Ile Val
145 150 155 160
Phe Tyr Val Asp Asp Tyr Pro Ile Arg Val Phe Lys Asn Ser Asn Asp
165 170 175
Leu Gly Val Lys Phe Pro Phe Asn Gln Pro Met Lys Ile Tyr Asn Ser
180 185 190
Leu Trp Asn Ala Asp Asp Trp Ala Thr Arg Gly Gly Leu Glu Lys Thr
195 200 205
Asp Trp Ser Lys Ala Pro Phe Ile Ala Ser Tyr Lys Gly Phe His Ile
210 215 220
Asp Gly Cys Glu Ala Ser Val Asn Ala Lys Phe Cys Asp Thr Gln Gly
225 230 235 240
Lys Arg Trp Trp Asp Gln Pro Glu Phe Arg Asp Leu Asp Ala Ala Gln
245 250 255
Trp Gln Lys Leu Ala Trp Val Arg Asn Lys Tyr Thr Ile Tyr Asn Tyr
260 265 270
Cys Thr Asp Arg Lys Arg Tyr Ser Gln Val Pro Pro Glu Cys Thr Arg
275 280 285
Asp Arg Asp Ile
290
<210> 33
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物 615726 (正義)
<400> 33
accgggagga aggctggaaa gcttacgaga aaagagttgg actttgaggg 50
<210> 34
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物 615728 (反義)
<400> 34
tgagcgagga agcggaagag cgcccaatac gcaaaccgcc 40
<210> 35
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物 615729 (正義)
<400> 35
tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 40
<210> 36
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 引物 615731 (反義)
<400> 36
tatactttct agagaatagg aactcggaat aggaacttca aggaacaaca ctcaacccta 60
tctcggtc 68
<210> 37
<211> 67
<212> DNA
<213> 人工序列
<220>
<223> 引物 615730 (正義)
<400> 37
tccgagttcc tattctctag aaagtatagg aacttcgcat ttatcagggt tattgtctca 60
tgagcgg 67
<210> 38
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物 615611 (反義)
<400> 38
tctagatctc gagtcagatg tccctatcgc gtgtacactc g 41
<210> 39
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 引物 615610 (正義)
<400> 39
acacgcgata gggacatctg actcgagatc tagagggtga ctgac 45
<210> 40
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物 615727 (反義)
<400> 40
aactcttttc tcgtaagctt tccagccttc ctcccggtac 40
<210> 41
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 41
cgaattctgc attgaagttc ctattccgag ttcctattct tcaaatagta taggaacttc 60
agatatccat cacactggcg 80
<210> 42
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 42
gccagtgtga tggatatctg aagttcctat actatttgaa gaataggaac tcggaatagg 60
aacttcaatg cagaattcgc 80
<210> 43
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 43
atatccatca cactggcggc cgctcaactc tctcctctag gttgaagttc ctattccgag 60
ttc 63
<210> 44
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 44
aggatgcatg ctcgagcatg cactagctag ttgaagttcc tatac 45
<210> 45
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 45
caccctctgt gtattgcacc atgccccagt tcgatatcct ctgca 45
<210> 46
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 46
aaactctagg atgcatgcaa gtgaggctat tgcctatcag ctc 43
<210> 47
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 47
catcacactg gcggccgcga attctaggct aggtatgc 38
<210> 48
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 48
ggtgcaatac acagagggtg 20
<210> 49
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 49
accgcggact gcgcaccatg agattcggtt ggctcgagg 39
<210> 50
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 50
ttcgccacgg agcttactag tagacacggg gcagaggc 38
<210> 51
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 51
cgtgtttctt cccattcgca tgcgacctcg tggtcattga c 41
<210> 52
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 52
gctttgacgt tacattgacg tacttataag cggccgccag tgtgatgga 49
<210> 53
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 53
tccatcacac tggcggccgc ttataagtac gtcaatgtaa cgtcaaagc 49
<210> 54
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 54
tgcagaggat atcgaactgg ggcattttgt atctgcgaat tgagcttg 48
<210> 55
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 55
caagctcaat tcgcagatac aaaatgcccc agttcgatat cctctgca 48
<210> 56
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 56
gctgtttaaa ctctaggatg catgcaagtg aggctattgc c 41
<210> 57
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 57
cgtgtttctt cccattcgca tgcgacctcg tggtcattga c 41
<210> 58
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 58
tgcagaggat atcgaactgg ggcattttgt atctgcgaat tgagcttg 48
<210> 59
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物 1208187
<400> 59
gattgagttg aaactgccta agatctcg 28
<210> 60
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 引物 1208194
<400> 60
ctatactttc tagagaatag gaactcggaa taggaacttc aaggtgcgca gtccgcggtt 60
gac 63
<210> 61
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 引物 1208195
<400> 61
ctattccgag ttcctattct ctagaaagta taggaacttc ggcgttgtta catctccctg 60
ag 62
<210> 62
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物 1208196
<400> 62
gcgtcaggct ttcgccacgt ctacgccagg accgagcaag 40
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物 069134
<400> 63
cgcaatctat cgaatagcag 20
<210> 64
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物 067947
<400> 64
ctacatcgaa gctgaaagca cgaga 25
<210> 65
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物 069860
<400> 65
cttctatctt gggatgcttc acgatacgtg a 31
<210> 66
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物 069861
<400> 66
cgcgcccttg aatatcggag aaggt 25
<210> 67
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物 0610249
<400> 67
gagaacacag tgagaccata gc 22
<210> 68
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物 0610250
<400> 68
tctcaaccca atcagcaaca tg 22
<210> 69
<211> 3021
<212> DNA
<213> 黑曲霉
<400> 69
atgcgccaca gcatcggatt ggcagcggcc ctactggcac caaccctacc tgtagcgttg 60
ggtcaatata ttcgagactt aagcaccgag aaatggactc tcagtagtcg agccttgaat 120
cggacagtac ctgctcaatt tccatcgcag gttcacttag atctactaag ggccggagtg 180
attggtgagt actatttgga agtcaagtcc tgtgagtata caaccgctaa cagcctcaat 240
agatgatccg taagtgactt catctgccat ggatgagaat tgaatcgcac taaatattgc 300
tggagatacc atggtttgaa cgatttcaat cttcgctgga tcgctgctgc caactggact 360
tataccagtc aacccatcaa aggcctgtga gtcgctgtga agtttgtgca atgtcgttcg 420
acaatactaa gaaccaatag cctggacaat tacgactcaa cttggctcgt gtttgacgga 480
ctggacactt tcgcaacaat ctcattctgt gggcagcaaa tcgcatccac ggacaatcag 540
tttcgccagt atgcgttcga tgtatccacc gcactagggt cctgcaaagg agatcctgtt 600
ctgagcatca actttggaag cgcaccgaat attgttgatg ctatcgcaca ggactctaat 660
tcgcaaagta agtttcagag gtgggggact gccgaagttg ttacatgcta attgtatata 720
gaatggcccg atgacgtcca actcacctac gagtacccaa atcggtggtt tatgcgcaaa 780
gaacaatcgg acttcggatg ggattggggt ccagcatttg cccctgcagg tccatggaag 840
cctgcatata ttgttcagct agacaagaaa gaaagtgtct atgtcctgaa cacggatttg 900
gatatatacc gaaagggcca aattaactac cttccgccag accagagcca accttgggtc 960
gtcaacgcta gcattgacat tttgggtcca ctacctacca aaccaaccat gtcgattgaa 1020
gtgcgcgata ctcattctgg cacgattctt acttcgcgga ctctgaacaa tgtcagtgtg 1080
gctggtaatg ccataactgg tgtcaccgtt ctcgacgggc tgaccccgaa actgtggtgg 1140
ccgcaaggcc tcggtgatca gaacctctac aatgtttcta tcactgtcca aagtagagga 1200
aaccagaccg tggccagtgt gaacaaacgg acgggcttcc gcaccatttt tctcaaccag 1260
cgcaacatta ctgaagcaca gcgtgcgcaa ggaatcgccc ctggagcaaa ctggcacttt 1320
gaagtcaacg gtcatgagtt ctacgcaaaa ggatcgaacc ttatcccacc agacagtttc 1380
tggacccgtg ttacagaaga gaagatgtca cggctattcg atgcagtggt cgttggaaac 1440
cagaatatgc tccgtgtctg gtcctccggc gcgtacctgc atgactacat ctatgatctg 1500
gccgatgaaa agggcattct cttatggagc gagttcgagt tcagtgacgc tttatatccc 1560
tccgacgacg ctttcctcga gaacgttgct gctgagatag tatacaatgt tcgacgagtg 1620
aaccaccatc cctccttggc tctatgggct ggcggaaatg aaatcgaatc cttgatgctc 1680
ccacgtgtca aagatgcagc cccatcttca tattcctact atgtgggcga gtatgagaag 1740
atgtacatta gcctcttctt gcctctggtc tacgagaaca cgcgttccat ctcatactcc 1800
cccagcagca caaccgaagg ctacctgtac attgaccttt ctgcccctgt cccaatggct 1860
gaacgttacg acaacactac ctccggctca tactacggcg atacagacca ctacgactac 1920
gacactagcg tggcgtttga ctacggttcc tatccggtag gccgctttgc caacgaattc 1980
ggcttccaca gcatgcccag cctccagaca tggcaacaag ctgtcgacac tgaggatctt 2040
tacttcaaca gcagcgtcgt catgctgcgc aaccaccacg atcccgcagg tggtctcatg 2100
acggacaact acgcgaactc ggccactggc atgggcgaaa tgaccatggg cgtggtaagc 2160
tactatccga taccgagtaa atccgaccac atctccaact tcagcgcctg gtgccatgcc 2220
acccagctct ttcaggcaga catgtacaaa agtcagatcc agttctaccg tcgtggaagt 2280
ggcatgcccg agcgccagct tggctccttg tattggcagc tcgaagatat ctggcaagcg 2340
ccatcatggg caggcattga gtacggtggt agatggaagg tccttcacca cgttatgaga 2400
gatatctatc agcctgttat tgtttcacct ttttggaact atactaccgg ctcgttggat 2460
gtctatgtta cttccgatct gtggagccct gcagcaggta ctgtcgactt gacctggttg 2520
gacctgtccg gccgccctat tgcgggtaac gcgggcacgc caaaatctgt tccctttacc 2580
gtgggaggtc tcaacagcac tcgcatctat gggacgaatg tttcttctct gggcttgccg 2640
gatactaaag atgctgttct gatcctctcg ctctcggctc acggccgtct tccgaactca 2700
gaccggacca ccaacttgac tcatgagaat tacgctacgc tttcttggcc caaggatttg 2760
aagattgttg acccgggact taagatagga cacagctcaa agaagacaac cgttacggtg 2820
gaagctacat ccggtgtttc attgtacacc tggctcgact acccagaggg tgtggtggga 2880
tactttgaag agaatgcctt cgtcttagca ccaggcgaga agaaagagat tagttttact 2940
gttctagagg acactactga cggggcttgg gtccgtaaca tcaccgtcca gagtctctgg 3000
gaccaaaagg ttcgcggttg a 3021
<210> 70
<211> 931
<212> PRT
<213> 黑曲霉
<400> 70
Met Arg His Ser Ile Gly Leu Ala Ala Ala Leu Leu Ala Pro Thr Leu
1 5 10 15
Pro Val Ala Leu Gly Gln Tyr Ile Arg Asp Leu Ser Thr Glu Lys Trp
20 25 30
Thr Leu Ser Ser Arg Ala Leu Asn Arg Thr Val Pro Ala Gln Phe Pro
35 40 45
Ser Gln Val His Leu Asp Leu Leu Arg Ala Gly Val Ile Gly Glu Tyr
50 55 60
His Gly Leu Asn Asp Phe Asn Leu Arg Trp Ile Ala Ala Ala Asn Trp
65 70 75 80
Thr Tyr Thr Ser Gln Pro Ile Lys Gly Leu Leu Asp Asn Tyr Asp Ser
85 90 95
Thr Trp Leu Val Phe Asp Gly Leu Asp Thr Phe Ala Thr Ile Ser Phe
100 105 110
Cys Gly Gln Gln Ile Ala Ser Thr Asp Asn Gln Phe Arg Gln Tyr Ala
115 120 125
Phe Asp Val Ser Thr Ala Leu Gly Ser Cys Lys Gly Asp Pro Val Leu
130 135 140
Ser Ile Asn Phe Gly Ser Ala Pro Asn Ile Val Asp Ala Ile Ala Gln
145 150 155 160
Asp Ser Asn Ser Gln Lys Trp Pro Asp Asp Val Gln Leu Thr Tyr Glu
165 170 175
Tyr Pro Asn Arg Trp Phe Met Arg Lys Glu Gln Ser Asp Phe Gly Trp
180 185 190
Asp Trp Gly Pro Ala Phe Ala Pro Ala Gly Pro Trp Lys Pro Ala Tyr
195 200 205
Ile Val Gln Leu Asp Lys Lys Glu Ser Val Tyr Val Leu Asn Thr Asp
210 215 220
Leu Asp Ile Tyr Arg Lys Gly Gln Ile Asn Tyr Leu Pro Pro Asp Gln
225 230 235 240
Ser Gln Pro Trp Val Val Asn Ala Ser Ile Asp Ile Leu Gly Pro Leu
245 250 255
Pro Thr Lys Pro Thr Met Ser Ile Glu Val Arg Asp Thr His Ser Gly
260 265 270
Thr Ile Leu Thr Ser Arg Thr Leu Asn Asn Val Ser Val Ala Gly Asn
275 280 285
Ala Ile Thr Gly Val Thr Val Leu Asp Gly Leu Thr Pro Lys Leu Trp
290 295 300
Trp Pro Gln Gly Leu Gly Asp Gln Asn Leu Tyr Asn Val Ser Ile Thr
305 310 315 320
Val Gln Ser Arg Gly Asn Gln Thr Val Ala Ser Val Asn Lys Arg Thr
325 330 335
Gly Phe Arg Thr Ile Phe Leu Asn Gln Arg Asn Ile Thr Glu Ala Gln
340 345 350
Arg Ala Gln Gly Ile Ala Pro Gly Ala Asn Trp His Phe Glu Val Asn
355 360 365
Gly His Glu Phe Tyr Ala Lys Gly Ser Asn Leu Ile Pro Pro Asp Ser
370 375 380
Phe Trp Thr Arg Val Thr Glu Glu Lys Met Ser Arg Leu Phe Asp Ala
385 390 395 400
Val Val Val Gly Asn Gln Asn Met Leu Arg Val Trp Ser Ser Gly Ala
405 410 415
Tyr Leu His Asp Tyr Ile Tyr Asp Leu Ala Asp Glu Lys Gly Ile Leu
420 425 430
Leu Trp Ser Glu Phe Glu Phe Ser Asp Ala Leu Tyr Pro Ser Asp Asp
435 440 445
Ala Phe Leu Glu Asn Val Ala Ala Glu Ile Val Tyr Asn Val Arg Arg
450 455 460
Val Asn His His Pro Ser Leu Ala Leu Trp Ala Gly Gly Asn Glu Ile
465 470 475 480
Glu Ser Leu Met Leu Pro Arg Val Lys Asp Ala Ala Pro Ser Ser Tyr
485 490 495
Ser Tyr Tyr Val Gly Glu Tyr Glu Lys Met Tyr Ile Ser Leu Phe Leu
500 505 510
Pro Leu Val Tyr Glu Asn Thr Arg Ser Ile Ser Tyr Ser Pro Ser Ser
515 520 525
Thr Thr Glu Gly Tyr Leu Tyr Ile Asp Leu Ser Ala Pro Val Pro Met
530 535 540
Ala Glu Arg Tyr Asp Asn Thr Thr Ser Gly Ser Tyr Tyr Gly Asp Thr
545 550 555 560
Asp His Tyr Asp Tyr Asp Thr Ser Val Ala Phe Asp Tyr Gly Ser Tyr
565 570 575
Pro Val Gly Arg Phe Ala Asn Glu Phe Gly Phe His Ser Met Pro Ser
580 585 590
Leu Gln Thr Trp Gln Gln Ala Val Asp Thr Glu Asp Leu Tyr Phe Asn
595 600 605
Ser Ser Val Val Met Leu Arg Asn His His Asp Pro Ala Gly Gly Leu
610 615 620
Met Thr Asp Asn Tyr Ala Asn Ser Ala Thr Gly Met Gly Glu Met Thr
625 630 635 640
Met Gly Val Val Ser Tyr Tyr Pro Ile Pro Ser Lys Ser Asp His Ile
645 650 655
Ser Asn Phe Ser Ala Trp Cys His Ala Thr Gln Leu Phe Gln Ala Asp
660 665 670
Met Tyr Lys Ser Gln Ile Gln Phe Tyr Arg Arg Gly Ser Gly Met Pro
675 680 685
Glu Arg Gln Leu Gly Ser Leu Tyr Trp Gln Leu Glu Asp Ile Trp Gln
690 695 700
Ala Pro Ser Trp Ala Gly Ile Glu Tyr Gly Gly Arg Trp Lys Val Leu
705 710 715 720
His His Val Met Arg Asp Ile Tyr Gln Pro Val Ile Val Ser Pro Phe
725 730 735
Trp Asn Tyr Thr Thr Gly Ser Leu Asp Val Tyr Val Thr Ser Asp Leu
740 745 750
Trp Ser Pro Ala Ala Gly Thr Val Asp Leu Thr Trp Leu Asp Leu Ser
755 760 765
Gly Arg Pro Ile Ala Gly Asn Ala Gly Thr Pro Lys Ser Val Pro Phe
770 775 780
Thr Val Gly Gly Leu Asn Ser Thr Arg Ile Tyr Gly Thr Asn Val Ser
785 790 795 800
Ser Leu Gly Leu Pro Asp Thr Lys Asp Ala Val Leu Ile Leu Ser Leu
805 810 815
Ser Ala His Gly Arg Leu Pro Asn Ser Asp Arg Thr Thr Asn Leu Thr
820 825 830
His Glu Asn Tyr Ala Thr Leu Ser Trp Pro Lys Asp Leu Lys Ile Val
835 840 845
Asp Pro Gly Leu Lys Ile Gly His Ser Ser Lys Lys Thr Thr Val Thr
850 855 860
Val Glu Ala Thr Ser Gly Val Ser Leu Tyr Thr Trp Leu Asp Tyr Pro
865 870 875 880
Glu Gly Val Val Gly Tyr Phe Glu Glu Asn Ala Phe Val Leu Ala Pro
885 890 895
Gly Glu Lys Lys Glu Ile Ser Phe Thr Val Leu Glu Asp Thr Thr Asp
900 905 910
Gly Ala Trp Val Arg Asn Ile Thr Val Gln Ser Leu Trp Asp Gln Lys
915 920 925
Val Arg Gly
930
<210> 71
<211> 10207
<212> DNA
<213> 人工序列
<220>
<223> 質粒 pQM27
<400> 71
gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc agctggcacg 60
acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg agttagctca 120
ctcattaggc accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg 180
tgagcggata acaatttcac acaggaaaca gctatgacca tgattacgaa ttgtttaaac 240
gtcgaccgaa tgtaggattg ttatccgaac tctgctcgta gaggcatgtt gtgaatctgt 300
gtcgggcagg acacgcctcg aaggttcacg gcaagggaaa ccaccgatag cagtgtctag 360
tagcaacctg taaagccgca atgcagcatc actggaaaat acaaaccaat ggctaaaagt 420
acataagtta atgcctaaag aagtcatata ccagcggcta ataattgtac aatcaagtgg 480
ctaaacgtac cgtaatttgc caacggcttg tggggttgca gaagcaacgg caaagcccca 540
cttccccacg tttgtttctt cactcagtcc aatctcagct ggtgatcccc caattgggtc 600
gcttgtttgt tccggtgaag tgaaagaaga cagaggtaag aatgtctgac tcggagcgtt 660
ttgcatacaa ccaagggcag tgatggaaga cagtgaaatg ttgacattca aggagtattt 720
agccagggat gcttgagtgt atcgtgtaag gaggtttgtc tgccgatacg acgaatactg 780
tatagtcact tctgatgaag tggtccatat tgaaatgtaa gtcggcactg aacaggcaaa 840
agattgagtt gaaactgcct aagatctcgg gccctcgggc cttcggcctt tgggtgtaca 900
tgtttgtgct ccgggcaaat gcaaagtgtg gtaggatcga acacactgct gcctttacca 960
agcagctgag ggtatgtgat aggcaaatgt tcaggggcca ctgcatggtt tcgaatagaa 1020
agagaagctt agccaagaac aatagccgat aaagatagcc tcattaaacg gaatgagcta 1080
gtaggcaaag tcagcgaatg tgtatatata aaggttcgag gtccgtgcct ccctcatgct 1140
ctccccatct actcatcaac tcagatcctc caggagactt gtacaccatc ttttgaggca 1200
cagaaaccca atagtcaacc gcggactgcg caccatgcgc cacagcatcg gattggcagc 1260
ggccctactg gcaccaaccc tacctgtagc gttgggtcaa tatattcgag acttaagcac 1320
cgagaaatgg actctcagta gtcgagcctt gaatcggaca gtacctgctc aatttccatc 1380
gcaggttcac ttagatctac taagggccgg agtgattggt gagtactatt tggaagtcaa 1440
gtcctgtgag tatacaaccg ctaacagcct caatagatga tccgtaagtg acttcatctg 1500
ccatggatga gaattgaatc gcactaaata ttgctggaga taccatggtt tgaacgattt 1560
caatcttcgc tggatcgctg ctgccaactg gacttatacc agtcaaccca tcaaaggcct 1620
gtgagtcgct gtgaagtttg tgcaatgtcg ttcgacaata ctaagaacca atagcctgga 1680
caattacgac tcaacttggc tcgtgtttga cggactggac actttcgcaa caatctcatt 1740
ctgtgggcag caaatcgcat ccacggacaa tcagtttcgc cagtatgcgt tcgatgtatc 1800
caccgcacta gggtcctgca aaggagatcc tgttctgagc atcaactttg gaagcgcacc 1860
gaatattgtt gatgctatcg cacaggactc taattcgcaa agtaagtttc agaggtgggg 1920
gactgccgaa gttgttacat gctaattgta tatagaatgg cccgatgacg tccaactcac 1980
ctacgagtac ccaaatcggt ggtttatgcg caaagaacaa tcggacttcg gatgggattg 2040
gggtccagca tttgcccctg caggtccatg gaagcctgca tatattgttc agctagacaa 2100
gaaagaaagt gtctatgtcc tgaacacgga tttggatata taccgaaagg gccaaattaa 2160
ctaccttccg ccagaccaga gccaaccttg ggtcgtcaac gctagcattg acattttggg 2220
tccactacct accaaaccaa ccatgtcgat tgaagtgcgc gatactcatt ctggcacgat 2280
tcttacttcg cggactctga acaatgtcag tgtggctggt aatgccataa ctggtgtcac 2340
cgttctcgac gggctgaccc cgaaactgtg gtggccgcaa ggcctcggtg atcagaacct 2400
ctacaatgtt tctatcactg tccaaagtag aggaaaccag accgtggcca gtgtgaacaa 2460
acggacgggc ttccgcacca tttttctcaa ccagcgcaac attactgaag cacagcgtgc 2520
gcaaggaatc gcccctggag caaactggca ctttgaagtc aacggtcatg agttctacgc 2580
aaaaggatcg aaccttatcc caccagacag tttctggacc cgtgttacag aagagaagat 2640
gtcacggcta ttcgatgcag tggtcgttgg aaaccagaat atgctccgtg tctggtcctc 2700
cggcgcgtac ctgcatgact acatctatga tctggccgat gaaaagggca ttctcttatg 2760
gagcgagttc gagttcagtg acgctttata tccctccgac gacgctttcc tcgagaacgt 2820
tgctgctgag atagtataca atgttcgacg agtgaaccac catccctcct tggctctatg 2880
ggctggcgga aatgaaatcg aatccttgat gctcccacgt gtcaaagatg cagccccatc 2940
ttcatattcc tactatgtgg gcgagtatga gaagatgtac attagcctct tcttgcctct 3000
ggtctacgag aacacgcgtt ccatctcata ctcccccagc agcacaaccg aaggctacct 3060
gtacattgac ctttctgccc ctgtcccaat ggctgaacgt tacgacaaca ctacctccgg 3120
ctcatactac ggcgatacag accactacga ctacgacact agcgtggcgt ttgactacgg 3180
ttcctatccg gtaggccgct ttgccaacga attcggcttc cacagcatgc ccagcctcca 3240
gacatggcaa caagctgtcg acactgagga tctttacttc aacagcagcg tcgtcatgct 3300
gcgcaaccac cacgatcccg caggtggtct catgacggac aactacgcga actcggccac 3360
tggcatgggc gaaatgacca tgggcgtggt aagctactat ccgataccga gtaaatccga 3420
ccacatctcc aacttcagcg cctggtgcca tgccacccag ctctttcagg cagacatgta 3480
caaaagtcag atccagttct accgtcgtgg aagtggcatg cccgagcgcc agcttggctc 3540
cttgtattgg cagctcgaag atatctggca agcgccatca tgggcaggca ttgagtacgg 3600
tggtagatgg aaggtccttc accacgttat gagagatatc tatcagcctg ttattgtttc 3660
acctttttgg aactatacta ccggctcgtt ggatgtctat gttacttccg atctgtggag 3720
ccctgcagca ggtactgtcg acttgacctg gttggacctg tccggccgcc ctattgcggg 3780
taacgcgggc acgccaaaat ctgttccctt taccgtggga ggtctcaaca gcactcgcat 3840
ctatgggacg aatgtttctt ctctgggctt gccggatact aaagatgctg ttctgatcct 3900
ctcgctctcg gctcacggcc gtcttccgaa ctcagaccgg accaccaact tgactcatga 3960
gaattacgct acgctttctt ggcccaagga tttgaagatt gttgacccgg gacttaagat 4020
aggacacagc tcaaagaaga caaccgttac ggtggaagct acatccggtg tttcattgta 4080
cacctggctc gactacccag agggtgtggt gggatacttt gaagagaatg ccttcgtctt 4140
agcaccaggc gagaagaaag agattagttt tactgttcta gaggacacta ctgacggggc 4200
ttgggtccgt aacatcaccg tccagagtct ctgggaccaa aaggttcgcg gttgattaat 4260
taagctccgt ggcgaaagcc tgacgcaccg gtagattctt ggtgagcccg tatcatgacg 4320
gcggcgggag ctacatggcc ccgggtgatt tatttttttt gtatctactt ctgacccttt 4380
tcaaatatac ggtcaactca tctttcactg gagatgcggc ctgcttggta ttgcgatgtt 4440
gtcagcttgg caaattgtgg ctttcgaaaa cacaaaacga ttccttagta gccatgcatt 4500
ttaagataac ggaatagaag aaagaggaaa ttaaaaaaaa aaaaaaaaca aacatcccgt 4560
tcataacccg tagaatcgcc gctcttcgtg tatcccagta ccacggcaaa ggtatttcat 4620
gatcgttcaa tgttgatatt gttcccgcca gtatggctcc acccccatct ccgcgaatct 4680
cctcttctcg aacgcggtag tggcgcgcca attggtaatg acccataggg agacgaatta 4740
actagaggtg actgacacct ggcggtagac aatcaatcca tttcgctata gttaaaggat 4800
ggggatgagg gcaattggtt atatgatcat gtatgtagtg ggtgtgcata atagtagtga 4860
aatggaagcc aagtcatgtg attgtaatcg accgacggaa ttgaggatat ccggaaatac 4920
agacaccgtg aaagccatgc tctttccttc gtgtagaaga ccagacagac agtccctgat 4980
ttacccttgc acaaagcact agaaaattag cattccatcc ttctctgctt gctctgctga 5040
tatcactgtc attcaatgca tctggaaacg caaccctgaa gggattcttc ctttgagaga 5100
tggaagcgtg tcatatctct tcggttctac ggcaggtttt tttctgctct ttcgtagcat 5160
ggcatggtca cttcagcgct tatttacagt tgctggtatt gatttcttgt gcaaattgct 5220
atctgacact tattagctat ggagtcacca catttcccag caacttcccc acttcctctg 5280
caatcgccaa cgtcctctct tcactgagtc tccgtccgat aacctgcact gcaaccggtg 5340
ccccatgata cgcctccgga tcatactctt cctgcacgag ggcatcaagc tcactaaccg 5400
ccttgaaact ctcattcttc ttatcgatgt tcttatccgc aaaggtaacc ggaacaacca 5460
cgctcgtgaa atccagcagg ttgatcacag aggcataccc atagtaccgg aactggtcat 5520
gccgtaccgc agcggtaggc gtaatcggcg cgatgatggc gtccagttcc ttcccggcct 5580
tttcttcagc ctcccgccat ttctcaaggt actccatctg gtaattccac ttctggagat 5640
gcgtgtccca gagctcgttc atgttaacag ctttgatgtt cgggttcagt aggtctttga 5700
tatttggagt cgccggctcg ccggatgcac tgatatcgcg cattacgtcg gcgctgccgt 5760
cagccgcgta gatatgggag atgagatcgt ggccgaaatc gtgcttgtat ggcgtccacg 5820
gggtcacggt gtgaccggct ttggcgagtg cggcgacggt ggtttccacg ccgcgcagga 5880
taggagggtg tggaaggaca ttgccgtcga agttgtagta gccgatattg agcccgccgt 5940
tcttgatctt ggaggcaata atgtccgact cggactggcg ccagggcatg gggatgacct 6000
tggagtcgta tttccaaggc tcctgaccga ggacggattt ggtgaagagg cggaggtcta 6060
acatacttca tcagtgactg ccggtctcgt atatagtata aaaagcaaga aaggaggaca 6120
gtggaggcct ggtatagagc aggaaaagaa ggaagaggcg aaggactcac cctcaacaga 6180
gtgcgtaatc ggcccgacaa cgctgtgcac cgtctcctga ccctccatgc tgttcgccat 6240
ctttgcatac ggcagccgcc catgactcgg ccttagaccg tacaggaagt tgaacgcggc 6300
cggcactcga atcgagccac cgatatccgt tcctacaccg atgacgccac cacgaatccc 6360
aacgatcgca ccctcaccac cagaactgcc gccgcacgac cagttcttgt tgcgtgggtt 6420
gacggtgcgc ccgatgatgt tgttgactgt ctcgcagacc atcagggtct gcgggacaga 6480
ggtcttgacg tagaagacgg caccggcttt gcggagcatg gttgtcagaa ccgagtcccc 6540
ttcgtcgtac ttgtttagcc atgagatgta gcccattgat gtttcgtagc cctggtggca 6600
tatgttagct gacaaaaagg gacatctaac gacttagggg caacggtgta ccttgactcg 6660
aagctggtct ttgagagaga tggggaggcc atgaagtgga ccaacgggtc tcttgtgctt 6720
tgcgtagtat tcatcgagtt cccttgcctg cgcgagagcg gcgtcaggga agaactcgtg 6780
ggcgcagttt gtctgcacag aagccagcgt cagcttgata gtcccataag gtggcgttgt 6840
tacatctccc tgagaggtag aggggaccct actaactgct gggcgattgc tgcccgttta 6900
cagaatgcta gcgtaacttc caccgaggtc aactctccgg ccgccagctt ggacacaaga 6960
tctgcagcgg aggcctctgt gatcttcagt tcggcctctg aaaggatccc cgatttcttt 7020
gggaaatcaa taacgctgtc ttccgcaggc agcgtctgga ctttccattc atcagggatg 7080
gtttttgcga ggcgggcgcg cttatcagcg gccagttctt cccaggattg aggcattctg 7140
tgttagctta tagtcaggat gttggctcga cgagtgtaaa ctgggagttg gcatgagggt 7200
tatgtaggct tctttagccc cgcatccccc tcattctcct cattgatccc gggggagcgg 7260
atggtgttga taagagacta attatagggt ttagctggtg cctagctggt gattggctgg 7320
cttcgccgaa ttttacgggc caaggaaagc tgcagaaccg cggcactggt aaacggtaat 7380
taagctatca gccccatgct aacgagttta aattacgtgt attgctgata aacaccaaca 7440
gagctttact gaaagatggg agtcacggtg tggcttcccc actgcgatta ttgcacaagc 7500
agcgagggcg aacttgactg tcgtcgctga gcagcctgca gtcaaacata catatatatc 7560
aaccgcgaag acgtctggcc ttgtagaaca cgacgctccc tagcaacacc tgccgtgtca 7620
gcctctacgg ttgttacttg cattcaggat gctctccagc gggcgagcta ttcaaaatat 7680
tcaaagcagg tatctcgtat tgccaggatt cagctgaagc aacaggtgcc aaggaaatct 7740
gcgtcggttc tcatctgggc ttgctcggtc ctggcgtaga atgcatccta gagtttaaac 7800
agcttggcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa 7860
cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc 7920
accgatcgcc cttcccaaca gttgcgcagc ctgaacggcg aatggcgcct gatgcggtat 7980
tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct cagtacaatc 8040
tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgcgccc 8100
tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 8160
tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg 8220
atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac gtcaggtggc 8280
acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat 8340
atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 8400
agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 8460
cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 8520
gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga gagttttcgc 8580
cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta 8640
tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac 8700
ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa 8760
ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg 8820
atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc 8880
cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg 8940
atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta 9000
gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg 9060
cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 9120
tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 9180
tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 9240
gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 9300
gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 9360
atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 9420
atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 9480
aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 9540
aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt gtagccgtag 9600
ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 9660
ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 9720
tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 9780
ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 9840
acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 9900
gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 9960
cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 10020
aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 10080
atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga 10140
gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg 10200
gaagagc 10207
<210> 72
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 引物 1210956
<400> 72
tgattacgaa ttgtttaaac ggatccgaat gtaggattgt tatccg 46
<210> 73
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 引物 1201606
<400> 73
gaagttccta tactttctag agaataggaa ctcggaatag gaacttcaac cttatgggac 60
tatcaagctg ac 72
<210> 74
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物 1210957
<400> 74
gttacattga cgtacttata agaagttcct atactttcta gagaatagga 50
<210> 75
<211> 357
<212> DNA
<213> 人工序列
<220>
<223> 里氏木霉cbh1 5' 探針序列
<400> 75
tagggtcggc aacggcaaaa aagcacgtgg ctcaccgaaa agcaagatgt ttgcgatcta 60
acatccagga acctggatac atccatcatc acgcacgacc actttgatct gctgtaaact 120
cgtattcgcc ctaaaccgaa gtgcgtggta aatctacacg tgggcccctt tcggtatact 180
gcgtgtgtct tctctaggtg ccattctttt cccttcctct agtgttgaat tgtttgtgtt 240
ggagtccgag ctgtaactac ctctgaatct ctggagaatg gtggactaac gactaccgtg 300
cacctgcatc atgtatataa tagtgatcct gagaaggggg gtttggagca atgtggg 357
<210> 76
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 引物 1205503
<400> 76
gggagatgta acaacgcctt gaagttccta ttccgagttc ctattcttca aatagtatag 60
gaacttcaac cttatgggac tatcaag 87
<210> 77
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 引物 1205504
<400> 77
cttgatagtc ccataaggtt gaagttccta tactatttga agaataggaa ctcggaatag 60
gaacttcaag gcgttgttac atctccc 87
<210> 78
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> 引物 1205505
<400> 78
gcccctaagt cgttagatgt ttgaagttcc tattccgagt tcctattctt caaatagtat 60
aggaacttca ccctttttgt cagc 84
<210> 79
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> 引物 1205506
<400> 79
gctgacaaaa agggtgaagt tcctatacta tttgaagaat aggaactcgg aataggaact 60
tcaaacatct aacgacttag gggc 84
<210> 80
<211> 83
<212> DNA
<213> 人工序列
<220>
<223> 引物 1205507
<400> 80
ctataccagg cctccacttg aagttcctat tccgagttcc tattcttcaa atagtatagg 60
aacttcatgt cctcctttct tgc 83
<210> 81
<211> 83
<212> DNA
<213> 人工序列
<220>
<223> 引物 1205508
<400> 81
gcaagaaagg aggacatgaa gttcctatac tatttgaaga ataggaactc ggaataggaa 60
cttcaagtgg aggcctggta tag 83