国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      在宿主細胞中表達克隆的改進方法

      文檔序號:431882閱讀:608來源:國知局
      專利名稱:在宿主細胞中表達克隆的改進方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及高度適合用于下述方法的啟動子,所述方法通過表達克隆鑒定編碼目的蛋白質(zhì)的DNA序列。

      背景技術(shù)
      已知數(shù)量遞增的基于表達克隆的篩選方法。這類方法先前被成功地用于在例如Bacillus(比較US 4,469,791、WO2005/38024)和E.coli(例如WO 95/18219和WO 95/34662)中鑒定原核基因產(chǎn)物。WO2005/38024描述篩選分泌蛋白質(zhì)的重組Bacillus細胞的方法。然而,該方法缺乏高通量自動化檢測技術(shù)。酵母也被用作用于表達克隆真核基因的宿主細胞。Strasser等(Eur.J.Biochem.(1989)184699-706)報導(dǎo)了通過在酵母Saccharomyces cerevisiae中表達克隆真菌基因組DNA來鑒定真菌α-淀粉酶。類似地,WO 93/11249報導(dǎo)了通過在S.cerevisiae中表達克隆真菌cDNA來鑒定真菌纖維素酶。最近,描述了在絲狀真菌中的表達克隆(WO99/32617)。
      在所有這些方法中,在可分離分泌具有目的特性蛋白質(zhì)的轉(zhuǎn)化體之前,不得不篩選大量轉(zhuǎn)化體。因此存在對下述表達克隆方法的需要,所述方法可最優(yōu)化檢測編碼被分泌蛋白質(zhì)的DNA序列的機會。
      附圖簡述

      圖1.描述了pPhtrA-gfp-amyE。該分泌報告子載體包含與GFP可操作連接的B.subtilis htrA啟動子。該載體對pPhtrB-gfp-amyE是有代表性的。
      圖2.用于分泌-脅迫的B.subtilis報告子菌株的結(jié)構(gòu)。htr啟動子與GFP基因融合,最終產(chǎn)生質(zhì)粒pPhtrA-gfp-amyE和pPhtrB-gfp-amyE。產(chǎn)生的質(zhì)粒通過相應(yīng)htr基因座中的單交換重組整合進Bacillus宿主細胞染色體中,得到VT210A和VT210B細胞。Cmr代表氯霉素抗性基因。
      圖3.描述了pUBnpr-2,其包含來自Bacillus amyloliquefaciens的中性蛋白酶基因npr(Genbank登錄號K 02497) 圖4.描述了pUBBAG,其包含來自Bacillus amyloliquefaciens的β-葡聚糖酶基因bag(Genbank登錄號M 15674)。
      圖5.描述了使用熒光激活細胞分選術(shù)(Fluorescence Activated CellSorting)對用質(zhì)粒pUB110(空對照載體)或質(zhì)粒pKTH10(編碼Bacillusamyloliquefaciens的α-淀粉酶基因amyQ)轉(zhuǎn)化的Bacillus subtilis VT210A細胞的分析。y軸描述所觀察到的事件數(shù)量,x軸描述相對熒光。在圖A中,描述了對用空載體pUB110轉(zhuǎn)化的Bacillus subtilis VT210A細胞的分析。在圖B中,描述了對用amyQ載體pKTH10轉(zhuǎn)化的Bacillus subtilisVT210A細胞的分析。在圖C中,描述了對用1∶20比例的pUB110和pKTH10轉(zhuǎn)化的Bacillus subtilis VT210A細胞混合種群的分析。在圖D中,描述了對用pUB110和pKTH10二者轉(zhuǎn)化的Bacillus subtilis VT210A細胞混合種群的細胞分選;細胞分選限制由垂直虛線指示。顯示高于所述限制的細胞被分選出來。
      圖6.描述了對用質(zhì)粒pUB110(空對照載體)或質(zhì)粒pKTH10(編碼Bacillus amyloliquefaciens的α-淀粉酶基因amyQ)轉(zhuǎn)化的Bacillus subtilisVT210A細胞混合種群的分析。分析通過熒光激活細胞掃描(FluorescenceActivated Cell Scanning)進行。y軸描述所觀察到的事件數(shù)量,x軸描述相對熒光。
      圖7.描述了用于在A.niger中表達綠色熒光蛋白(GFP,Chalfie,M et al.,Science(1994)263(5148)802-805)的pGBFINGFP-2載體。所述FIN載體的主鏈特征先前描述于WO 99/32617中。
      圖8.描述了用于在A.niger中表達植酸酶(PHY)(與WO99/32617中所述FytA相同的植酸酶基因PHY)的pGBFIN-32載體。
      圖9.描述了其中大部分植酸酶基因和整個葡萄糖淀粉酶啟動子被去除的pGBFIN-40載體,該載體用作構(gòu)建A.niger WT載體菌株的孔對照載體。
      圖10.描述了為確認分泌誘導(dǎo)的啟動子身份而進行的Northern印跡分析。
      圖11.描述了用于在A.niger中基因表達的載體。該載體在構(gòu)建分泌誘導(dǎo)的A.niger報告子構(gòu)建體中用作主鏈。
      圖12.描述了pGBFINGFPBLE-1克隆載體。該分泌誘導(dǎo)型報告子構(gòu)建體包含與本發(fā)明分泌誘導(dǎo)型啟動子1可操作連接的GFP-BLE報告子融合基因。該構(gòu)建體對于pGBFINGFPBLE-2、pGBFINGFPBLE-3、pGBFINGFPBLE-4和pGBFINGFPBLE-5是代表性的。
      圖13.描述了pGBTOPSEL-1,該載體用作構(gòu)建最終分泌誘導(dǎo)型報告子質(zhì)粒的主鏈。所述載體的主鏈特征先前描述于WO 99/32617。
      圖14.描述了最終分泌報告子構(gòu)建體pGBTOPGFPBLE-1。該分泌誘導(dǎo)的報告子載體包含與本發(fā)明分泌誘導(dǎo)型啟動子1可操作連接的GFP-BLE報告子構(gòu)建體。該載體對pGBTOPGFPBLE-2、pGBTOPGFPBLE-3、pGBTOPGFPBLE-4和pGBTOPGFPBLE-5是代表性的。
      圖15.描述了含有下述報告子構(gòu)建體的A.niger共轉(zhuǎn)化體腐草霉素抗性的差異,所述報告子構(gòu)建體帶有與編碼細胞內(nèi)蛋白質(zhì)(由黑點表示)或細胞外蛋白質(zhì)(由黑方塊表示)的文庫構(gòu)建體結(jié)合的分泌誘導(dǎo)型啟動子P4。
      圖16.描述了含有下述報告子構(gòu)建體的A.niger共轉(zhuǎn)化體腐草霉素抗性的差異,所述報告子構(gòu)建體帶有與編碼細胞內(nèi)蛋白質(zhì)(由黑點表示)或細胞外蛋白質(zhì)(由黑方塊表示)的文庫構(gòu)建體結(jié)合的分泌誘導(dǎo)型啟動子P5。
      圖17.描述了E-PAGETM凝膠,其中各圖代表包含下述報告子構(gòu)建體的經(jīng)共轉(zhuǎn)化的A.niger克隆,所述報告子構(gòu)建體帶有與編碼細胞外蛋白質(zhì)的文庫構(gòu)建體結(jié)合的分泌誘導(dǎo)型啟動子P1。M代表E-PAGE

      預(yù)染標準(Invitrogen,U.K.)。
      圖18.描述了E-PAGETM凝膠,其中各圖代表包含下述報告子構(gòu)建體的經(jīng)共轉(zhuǎn)化的A.niger克隆,所述報告子構(gòu)建體帶有與編碼細胞外蛋白質(zhì)的文庫構(gòu)建體結(jié)合的分泌誘導(dǎo)型啟動子P3。M代表E-PAGE

      預(yù)染標準(Invitrogen,U.K.)。


      發(fā)明內(nèi)容
      啟動子DNA序列 根據(jù)本發(fā)明的第一方面,提供了啟動子DNA序列,例如 (a)以下列表所示的DNA序列SEQ ID NO1、SEQ ID NO2、SEQID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ IDNO24, (b)能夠與(a)的DNA序列雜交的DNA序列, (c)與(a)的DNA序列至少50%同源的DNA序列, (d)(a)到(c)的DNA序列中任何一種的變體,或 (e)(a)到(d)的DNA序列中任何一種的亞序列。
      根據(jù)一種優(yōu)選的實施方案,本發(fā)明的啟動子序列為這樣的一種啟動子DNA序列,例如 (a)以下列表所示的一種DNA序列SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ IDNO24, (b)能夠與(a)的DNA序列雜交的DNA序列, (c)與(a)的DNA序列至少50%同源的一個DNA序列, (d)(a)到(c)的DNA序列中任何一種的一個變體,或 (e)(a)到(d)的DNA序列中任何一種的一個亞序列。
      在本申請上下文中,啟動子DNA序列為下述DNA序列,當該啟動子DNA序列與該編碼序列可操作連接時,所述DNA序列能夠控制編碼序列的表達。術(shù)語“可操作連接”在本文定義為一種構(gòu)型,其中啟動子DNA序列適當?shù)刂糜谂c編碼序列相關(guān)的位置,使得所述啟動子DNA序列指導(dǎo)由所述編碼序列編碼的多肽的產(chǎn)生。
      術(shù)語“編碼序列”在本文定義為被轉(zhuǎn)錄為下述mRNA的核酸序列,所述mRNA置于適當調(diào)控序列調(diào)控之下時被翻譯為多肽。編碼序列的邊界通常由ATG起始密碼子(其通常為mRNA5’末端開放讀碼框的起點)和轉(zhuǎn)錄終止序列(在mRNA 3’末端開放讀碼框的緊下游)確定。編碼序列可包括但不僅限于基因組DNA、cDNA、半合成的、合成的和重組的核酸序列。優(yōu)選地,啟動子DNA序列被定義為位于其連接的編碼序列上游的DNA序列,并定義為能夠調(diào)控該編碼序列的表達。
      更具體地,術(shù)語“啟動子”在本文定義為下述DNA序列,所述DNA序列結(jié)合RNA聚合酶,并指導(dǎo)聚合酶到達編碼多肽的編碼序列正確的下游轉(zhuǎn)錄起始位點以起始轉(zhuǎn)錄。RNA聚合酶能有效催化與編碼區(qū)適當DNA鏈互補的信使RNA的裝配。術(shù)語“啟動子”還應(yīng)被理解為包括用于轉(zhuǎn)錄為mRNA后翻譯的5’非編碼區(qū)(啟動子和翻譯起點之間)、順式作用轉(zhuǎn)錄調(diào)控元件如增強子,和其它能夠與轉(zhuǎn)錄因子相互作用的核苷酸序列。
      在一種優(yōu)選的實施方案中,本發(fā)明的啟動子DNA序列為來自以下的DNA序列SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ IDNO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24。
      根據(jù)另一優(yōu)選的實施方案,本發(fā)明的啟動子DNA序列為能夠與以下列表所示的DNA序列雜交并仍保持啟動子活性的DNA序列SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQID NO23或SEQ ID NO24。
      啟動子活性優(yōu)選通過測量作為編碼序列表達結(jié)果產(chǎn)生的蛋白質(zhì)濃度來確定,所述編碼序列與啟動子可操作連接?;蛘邌幼踊钚酝ㄟ^測量由編碼序列編碼的蛋白質(zhì)的酶活性確定,所述編碼序列與啟動子可操作連接。根據(jù)優(yōu)選的實施方案,啟動子活性(及其強度)通過測量lacZ報告子基因表達來確定(In Luo,Gene 163(1995)127-131或Perkins and Youngman(1986)Proc Natl Acad Sci USA 83140;或Vagner et al.(1998)Microbiology1443097中)。根據(jù)另一優(yōu)選的實施方案,通過使用綠色熒光蛋白作為編碼序列確定啟動子活性(In Microbiology.1999 Mar;145(Pt 3)729-34.Santerre Henriksen AL,Even S,Muller C,Punt PJ,van den Hondel CA,NielsenJ.Study)。在細菌細胞中,GFP和其它熒光蛋白已廣泛用于表達和(動態(tài))蛋白質(zhì)定位研究(在Southward and Surette(2002)MoI.Microbiol.451191中綜述)。另外,可通過測量在啟動子調(diào)控下產(chǎn)生的轉(zhuǎn)錄物mRNA水平確定啟動子活性??衫缤ㄟ^Northern印跡、GeneChipsTM(Affymetrix)或斑點陣列技術(shù)或定量(實時)PCR測量mRNA水平(J.Sambrook,E.F.Fritsch,and T.Maniatis,2001,Molecular Cloning,A Laboratory Manual,3dedition,Cold Spring Harbor,N.Y.)。最優(yōu)選地,通過使用Northern印跡的mRNA分析確定啟動子活性。
      優(yōu)選地,本發(fā)明的(經(jīng)分離的)啟動子DNA序列在非常低嚴格度條件下,更優(yōu)選低嚴格度條件下,更優(yōu)選中嚴格度條件下,更優(yōu)選中-高嚴格度條件下,甚至更優(yōu)選高嚴格度條件下和最優(yōu)選非常高嚴格度條件下與下述核酸探針雜交,所述核酸探針在相同條件下與 (i)SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ IDNO22、SEQ ID NO23或SEQ ID NO24,或 (ii)(i)的亞序列,或 (iii)(i)、(ii)的互補鏈雜交。
      術(shù)語互補鏈為本領(lǐng)域技術(shù)人員已知,并描述于(J.Sambrook,E.F.Fritsch,and T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,2dedition,Cold Spring Harbor,N.Y.)。SEQ ID NO1、SEQ ID NO2、SEQ IDNO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的亞序列可在20個核苷酸和編碼區(qū)上游SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ IDNO24的相應(yīng)全序列(SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的相應(yīng)編碼區(qū)分別在SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28和SEQ ID NO29中給出)之間的范圍。
      SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQID NO22、SEQ ID NO23或SEQ ID NO24的核酸序列及其亞序列(如前一段中所定義)可用于設(shè)計核酸探針,以從不同屬或種的菌株中根據(jù)本領(lǐng)域公知方法鑒定和克隆DNA啟動子。具體地,這類探針可用于與目的屬或種的基因組或cDNA根據(jù)標準Southern印跡方法雜交,從而從其中鑒定和分離相應(yīng)的基因。這類探針可顯著短于整個序列,但是應(yīng)有至少15個,優(yōu)選至少25個和更優(yōu)選至少35個核苷酸長。另外,這類探針可用于通過PCR擴增DNA啟動子。也可使用更長的探針??墒褂肈NA、RNA和肽核酸(PNA)探針。典型地,標記探針用于檢測相應(yīng)基因(例如用@32P、@33P、@3H、@35S、生物素或抗生物素蛋白或熒光標記物)。本發(fā)明包括這類探針。
      因此從這類其它生物中制備的基因組DNA或cDNA可用于篩選下述DNA,所述DNA與上文所述探針雜交并編碼多肽。來自這類其它生物的基因組DNA或其它DNA可通過瓊脂糖或聚丙烯酰胺凝膠電泳或其它分離技術(shù)分離。來自文庫或經(jīng)分離的DNA的DNA可轉(zhuǎn)移至并固定在硝酸纖維素或其它合適的載體材料上。為了鑒定與SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ IDNO24或其亞序列同源的克隆或DNA序列,載體材料可用于Southern印跡。就本發(fā)明的目的而言,雜交是指DNA序列在非常低到非常高嚴格度條件下與下述經(jīng)標記的核酸探針雜交,所述探針對應(yīng)于SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ IDNO23或SEQ ID NO24中所示DNA序列,對應(yīng)于所述DNA序列的互補鏈,或?qū)?yīng)于所述DNA序列的亞序列。在這些條件下與核酸探針雜交的分子使用例如X射線膠片檢測。也可使用其它雜交技術(shù),例如使用用于檢測的熒光和玻片和/或DNA微陣列作為支持。DNA微陣列雜交檢測的一個實例在FEMS Yeast Res.2003 Dec;4(3)259-69(Daran-Lapujade P,Daran JM,Kotter P,Petit T,Piper MD,Pronk JT.″Comparative genotyping of theSaccharomyces cerevisiae laboratory strains S288C and CEN.PK1 13-7D usingoligonucleotide microarrays″)中給出。另外,PNA微陣列用于雜交的用途描述于Nucleic Acids Res.2003 Oct 1;31(19)e119(Brandt O,F(xiàn)eldner J,Stephan A,Schroder M,Schnolzer M,Arlinghaus HF,Hoheisel JD,Jacob A.PNA microarrays for hybridisation of unlabelled DNA samples.)。
      在一種優(yōu)選的實施方案中,核酸或DNA探針為SEQ ID NO1、SEQID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的DNA序列。在另一實施方案中,核酸探針為具有SEQID NO1的核苷酸100到150的DNA序列或具有SEQ ID NO2的核苷酸170到220的DNA序列。
      在另一優(yōu)選的實施方案中,核酸探針為具有以下的DNA序列 -SEQ ID NO20的核苷酸996到2797、SEQ ID NO21的核苷酸996到3561、SEQ ID NO22的核苷酸997到3536、SEQ ID NO23的核苷酸1034到3175或SEQ ID NO24的核苷酸1080到4054,更優(yōu)選 -SEQ ID NO20的核苷酸1496到2497、SEQ ID NO21的核苷酸1496到3261、SEQ ID NO22的核苷酸1497到3236、SEQ ID NO23的核苷酸1534到2875或SEQ ID NO24的核苷酸1580到3754,甚至更優(yōu)選 -SEQ ID NO20的核苷酸1896到2197、SEQ ID NO21的核苷酸1896到2861、SEQ ID NO22的核苷酸1897到2936、SEQ ID NO23的核苷酸1934到2575或SEQ ID NO24的核苷酸1980到3454,和最優(yōu)選 -SEQ ID NO20的核苷酸1996到2100、SEQ ID NO21的核苷酸1996到2300、SEQ ID NO22的核苷酸1997到2400、SEQ ID NO23的核苷酸2034到2100或SEQ ID NO24的核苷酸2080到2800。
      根據(jù)另一優(yōu)選的實施方案,探針為位于編碼序列上游的SEQ IDNO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的DNA序列的一部分。SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的相應(yīng)的編碼區(qū)分別在SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28和SEQ ID NO29中給出。
      對于至少100個核苷酸長度的長探針而言,非常低到非常高嚴格度條件被定義為依照標準Southern印跡程序,在42℃下5倍SSPE、0.3%SDS、200毫克/ml經(jīng)剪切且變性的鮭精DNA和甲酰胺中預(yù)雜交和雜交,所述甲酰胺對于非常低和低嚴格度而言為25%,對于中和中-高嚴格度而言為35%或?qū)τ诟吆头浅8邍栏穸榷詾?0%。對于至少100個核苷酸長度的長探針而言,最后用2倍SSC、0.2%SDS,在至少45℃(非常低嚴格度),更優(yōu)選至少50℃(低嚴格度),更優(yōu)選至少55℃(中嚴格度),更優(yōu)選至少60℃(中-高嚴格度),進一步更優(yōu)選至少65℃(高嚴格度)和最優(yōu)選至少70℃(非常高嚴格度)下對載體材料洗滌三次,每次15分鐘。
      對于約15個核苷酸到約70個核苷酸長度的短探針而言,嚴格度條件定義為在比使用Bolton and McCarthy(1962,Proceedings of the NationalAcademy of Sciences USA 481390)算法計算的Tm低5℃到10℃下,在0.9M NaCl、0.09 M Tris-HCl pH 7.6、6 mM EDTA、0.5%NP-40、1倍Denhardfs溶液、1mM焦磷酸鈉、1mM磷酸二氫鈉、0.1mM ATP和0.2mg/ml酵母RNA中依照標準Southern印跡程序預(yù)雜交、雜交和雜交后洗滌。對于約15個核苷酸到約70個核苷酸長度的短探針而言,在6倍SCC加上0.1%SDS中15分鐘對載體材料洗滌一次,并使用6倍SSC在低于所計算的Tm 5℃到10℃下洗滌兩次,每次15分鐘。
      根據(jù)另一優(yōu)選的實施方案,首先用來自SEQ ID NO 1、SEQ IDNO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的本發(fā)明的啟動子DNA序列克隆與其可操作連接的天然基因、編碼序列或其部分。這可從SEQ ID NO 1、SEQ ID NO2、SEQ IDNO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24或先前定義的其亞序列開始來完成,其中使用該序列作為探針。將所述探針與給定宿主的cDNA或基因組文庫雜交,所述宿主為Bacillus、Aspergillus niger或本申請文本中定義的任何其它宿主。一旦天然基因或其部分被克隆,可隨后使用其自身作為探針,通過本文所述雜交實驗克隆來自其它真菌的它的同源基因。在本發(fā)明上下文中,同源基因是指與天然基因至少50%同源的基因。優(yōu)選地,同源基因與天然基因至少55%同源,更優(yōu)選至少60%,更優(yōu)選至少65%,更優(yōu)選至少70%,進一步更優(yōu)選至少75%,優(yōu)選至少約80%,更優(yōu)選約90%,進一步更優(yōu)選約95%和最優(yōu)選約97%。
      同源基因編碼序列上游的序列為本發(fā)明包含的啟動子?;蛘?,可通過使用SEQ ID NO 25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28或SEQ ID NO29或如前定義的其亞序列,用例如如本文所述的比對或BLAST算法搜索基因組數(shù)據(jù)庫來鑒定與本發(fā)明啟動子可操作連接的天然基因、編碼序列或其部分的序列。隨后可使用該經(jīng)鑒定的序列來鑒定本申請中定義的任何其它真菌宿主中的直向同源基因或同源基因。經(jīng)鑒定的直向同源基因或同源基因編碼序列上游的序列為本發(fā)明所包括的啟動子。
      根據(jù)另一優(yōu)選的實施方案,本發(fā)明的啟動子DNA序列為來自SEQ IDNO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24并仍然具有較前定義的啟動子活性的(經(jīng)分離的)DNA序列。
      根據(jù)另一優(yōu)選的實施方案,本發(fā)明的啟動子DNA序列為分別來自SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ IDNO22、SEQ ID NO23或SEQ ID NO24的(經(jīng)分離的)DNA序列,其與位于各自編碼區(qū)(SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQID NO28或SEQ ID NO29)上游的各自相應(yīng)的DNA序列SEQ IDNO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的至少部分至少50%同源。優(yōu)選地,所述DNA序列與位于各自相應(yīng)編碼區(qū)上游的SEQ ID NO 15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的至少部分至少55%同源,更優(yōu)選至少60%,更優(yōu)選至少65%,更優(yōu)選至少70%,進一步更優(yōu)選至少75%,優(yōu)選約80%,更優(yōu)選約90%,進一步更優(yōu)選約95%,最優(yōu)選約97%同源。
      就本發(fā)明目的而言,優(yōu)選通過Wilbur-Lipman方法(Wilbur andLipman,1983,Proceedings of the National Academy of Science USA 80726-730)使用LASERGENE.TM.MEGALIGN.TM.軟件(DNASTAR,Inc.,Madison,Wis.)用同一性表格和以下多重比對參數(shù)確定兩個核酸序列之間的同源性程度缺口懲罰為10和缺口長度懲罰為10。配對比對參數(shù)為Ktuple=3、缺口懲罰=3和窗口=20。
      根據(jù)另一優(yōu)選的實施方案,本發(fā)明的啟動子DNA序列來自下述(經(jīng)分離的)DNA序列,所述分離的DNA序列為位于各自相應(yīng)編碼區(qū)上游的SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ IDNO17、SEQ ID NO18或SEQ ID NO19或SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ IDNO19的部分的變體。術(shù)語“變體啟動子”在本文被定義為具有下述核苷酸序列的啟動子,所述核苷酸序列包含母體啟動子的一個或多個核苷酸的取代、缺失和/或插入,其中所述變體啟動子具有大于或小于相應(yīng)母體啟動子的啟動子活性。術(shù)語“變體啟動子”還應(yīng)包括天然變體和使用本領(lǐng)域公知方法(例如經(jīng)典誘變、定向誘變和DNA改組(shuffling))體外產(chǎn)生的變體。變體啟動子可具有一個或多個突變。各突變?yōu)楹塑账岬莫毩⑷〈⑷笔Ш?或插入。向啟動子中引入核苷酸取代、缺失和/或核苷酸可使用任何本領(lǐng)域已知方法(例如經(jīng)典誘變、定向誘變或DNA改組)完成。特別有用的為下述方法,所述方法利用帶有目的插入的超螺旋的雙鏈DNA載體和含有所需突變的兩個合成引物。各自與載體相反鏈互補的寡核苷酸引物通過Pfu DNA聚合酶的手段在溫度循環(huán)中延伸。摻入引物后,產(chǎn)生含有交錯切口的經(jīng)突變的質(zhì)粒。溫度循環(huán)之后,用Dpn1處理產(chǎn)物以消化親代DNA模板并選擇含有突變的經(jīng)合成的DNA,所述Dpn1對經(jīng)甲基化的和經(jīng)半甲基化的DNA特異。也可使用本領(lǐng)域已知的其它方法。其它方法的實例為QuickChangeTM定點誘變試劑盒(Stratagene Cloning Systems,La JoIIa,CA)、改變的位點

      II體外誘變體系(The Altered

      in vitroMutagenesis Systems)(Promega Corporation)或通過使用如Gene.1989 Apr15;77(1)51-9.(Ho SN,Hunt HD,Horton RM,Pullen JK,Pease LR″Site-directed mutagenesis by overlap extension using the polymerase chain reaction″)所述PCR或使用如Molecular BiologyCurrent Innovations and Future Trends.(Eds.A.M.Griffin and H.G.Griffin.ISBN 1-898486-01-8 1995 HorizonScientific Press,PO Box 1,Wymondham,Norfolk,U.K.)所述PCR的重疊延伸。根據(jù)優(yōu)選的實施方案,變體啟動子為與最初來自SEQ ID NO1、SEQID NO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的啟動子序列相比,具有至少一個經(jīng)修飾的調(diào)節(jié)位點的啟動子。這類調(diào)節(jié)位點可以整體被去除或如上文所解釋被特異突變。從而調(diào)節(jié)這類啟動子變體使得例如其不再被葡萄糖誘導(dǎo)。這類啟動子變體和如何獲得它們的技術(shù)的實例描述于EP 673 429B或WO 94/04673。
      啟動子變體可以是等位變體。等位變體是指占據(jù)相同染色體位點的基因的兩種或更多可選擇的形式中的任何。等位變體通過突變天然發(fā)生,并可由種群中的多態(tài)性引起??赏ㄟ^包含步驟(a)和(b)的以下方法獲得變體啟動子(a)在非常低、低、中、中-高、高或非常高嚴格度條件下將DNA與 (i)SEQ ID NO 1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19,或 (ii)(i)的亞序列,或 (iii)(i)、(ii)的互補鏈雜交,和 (b)從所述DNA序列中分離變體啟動子。嚴格度和洗滌條件如本文定義。
      本發(fā)明的啟動子可以是下述啟動子,所述啟動子的序列可用接頭提供,所述接頭用于引入特異限制性位點的目的,所述限制性位點便于連接啟動子序列和編碼多肽的核酸序列編碼區(qū)。
      在另一優(yōu)選的實施方案中,啟動子DNA序列來自SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ IDNO18或SEQ ID NO19的亞序列。在本文上下文中亞序列優(yōu)選被定義為位于先前定義的各相應(yīng)編碼序列上游的SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ IDNO19的部分。
      亞序列優(yōu)選含有至少約50個核苷酸,或優(yōu)選至少約100個核苷酸,更優(yōu)選至少約200個核苷酸,甚至更優(yōu)選至少約230個核苷酸,甚至更優(yōu)選至少約250個核苷酸和最優(yōu)選至少約290個核苷酸。
      根據(jù)另一優(yōu)選的實施方案,亞序列與前述句子定義的亞序列區(qū)別在于一個或多個來自5’和/或3’端的核苷酸被缺失,所述DNA序列仍具有早先定義的啟動子活性。
      在另一優(yōu)選的實施方案中,啟動子亞序列為來自翻譯起點和/或來自轉(zhuǎn)錄起點的“經(jīng)修剪的(trimmed)”亞序列。修剪啟動子并對其功能性分析的實例描述于Gene.1994 Aug 5;145(2)179-87the effect of multiple copiesof the upstream region on expression of the Aspergillus niger glucoamylase-encoding gene.Verdoes JC,Punt PJ,Stouthamer AH,van den Hondel CA). 本文所提供的序列信息不應(yīng)狹義地解釋為要求包括錯誤鑒定的堿基。本文所公開的特異序列可被容易地使用,并最終進行進一步的序列分析從而鑒定測序錯誤,以從絲狀真菌(特別是Aspergillus niger)中分離最初的DNA序列。
      除非另有說明,所有通過測序本文DNA分子確定的核苷酸序列都是使用自動DNA測序儀確定的。因此,如本領(lǐng)域已知,對于通過該自動途徑確定的任何DNA序列而言,本文確定的任何核苷酸序列可能含有一些錯誤。通過自動化確定的核苷酸序列通常與經(jīng)測序DNA分子的實際核苷酸序列至少約90%相同,更典型地至少約95%相同到至少約99.9%相同??赏ㄟ^其它手段更為精確地確定實際序列,包括本領(lǐng)域公知的手工DNA測序方法。
      本領(lǐng)域技術(shù)人員能夠鑒定這類被錯誤鑒定的堿基,并知道如何改正這類錯誤。
      功能性核酸等同物可典型地含有不改變其涉及的生物學(xué)功能的突變。術(shù)語“功能性等同物”還包括A.niger DNA序列的直向同源物。A.nigerDNA序列的直向同源物為能夠從其它菌株或物種中分離,并具有類似或相同生物學(xué)活性的DNA序列。
      還可通過使用“序列比較算法”確定同源(類似或同一)序列??衫缤ㄟ^Smith & Waterman,Adv.Appl.Math.2482(1981)的局部同源性算法、通過Needleman & Wunsch,J.MoI.Biol.48443(1970)的同源性比對算法、通過Pearson & Lipman,Proc.Nat′l Acad.Sci.USA 852444(1988)的搜索相似性算法、通過這些算法的計算機實現(xiàn)(GAP,BESTFIT,F(xiàn)ASTA,andTFASTA in the Wisconsin Genetics Software Package,Genetics ComputerGroup,575 Science Dr.,Madison,Wl)或通過目測進行用于查詢序列的最佳比對。適用于確定序列相似性的算法的實例為BLAST算法,其描述于Altschul,et al.,J.MoI.Biol.215403-410(1990)。或者,其它程序可用于本文較早描述的序列比對。用于進行BLAST分析的軟件通過National Centerfor Biotechnology Information(http://www.ncbi.nlm.nih.gov/)可公開獲得。該算法涉及首先通過鑒定查詢序列中W長度的短字詞鑒定高分序列對(HSP),所述短字在與數(shù)據(jù)庫序列中相同長度的字相比時,匹配或滿足一些正值閾分值T。這些最初的相鄰字擊中(word hits)被用作為尋找含有它們的更長HSP的起點。字擊中在兩個方向上沿兩條被比較序列中的各條延伸,直至積累的比對評分可以提高。當累積的比對評分從達到的最大值減少數(shù)量X時;累積的比對評分降為零或低于零時;或到達任一序列末端時,字擊中的延伸停止。BLAST算法參數(shù)W、T和X確定比對的敏感性和速度。BLAST程序使用11的字長(W)、50的BLOSUM62評分矩陣(參閱Henikoff & Henikoff,Proc.Natl.Acad.Sci.USA 8910915(1989))比對(B)、10的期望值(E)、M=5、N=-4和雙鏈比較作為默認值。然后BLAST算法進行兩條序列間相似性的統(tǒng)計分析(參閱例如Karlin &Altschul,Proc.Nat′l.Acad.Sci.USA 905873-5787(1993))。由BLAST算法提供的一種相似性測量為最小和概率(P(N)),其提供了對兩個核苷酸或氨基酸序列間偶然發(fā)生匹配的可能性的指示。例如,如果在測試氨基酸序列與蛋白質(zhì)(如蛋白酶)氨基酸序列的比較中最小和可能性為小于約0.1,更優(yōu)選小于約0.01和最優(yōu)選小于約0.001時,認為氨基酸序列與蛋白質(zhì)(如蛋白酶)相似。
      優(yōu)選地,變體啟動子的相似性為與具有SEQ ID NO1、SEQ IDNO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的DNA序列之一至少40%同源。更優(yōu)選地,相似性為與具有SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ IDNO17、SEQ ID NO18或SEQ ID NO19的DNA序列至少50%,更優(yōu)選至少60%,更優(yōu)選至少70%,更優(yōu)選至少80%,更優(yōu)選至少90%和更優(yōu)選至少95%或至少98%同源。
      除天然存在的啟動子序列等位變體外,技術(shù)人員知道可通過突變將改變引入來自SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ IDNO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的啟動子序列中,而本質(zhì)上不改變其啟動子功能。
      本發(fā)明的啟動子序列可得自任何屬的微生物。就本發(fā)明的目的而言,在本文中與給定來源結(jié)合使用術(shù)語“得自”應(yīng)指多肽由所述來源制造或由來插入了自所述來源的基因的細胞制造。優(yōu)選微生物為原核生物。優(yōu)選的原核生物為Bacillus和E.coli。優(yōu)選的Bacilli為Bacillus subtilis、Bacillusamyloliquefaciens、Bacillus licheniformis、Bacillus alcalophilus、Bacillusclausii、Bacillus brevis、Bacillus circulans、Bacillus firmus、Bacilluspumilis、Bacillus stearothermophilus、Bacillus megaterium、Bacilluslentus或Bacillus thuringiensis。
      或者,啟動子序列得自真核生物,優(yōu)選真菌來源,并更優(yōu)選來自酵母菌株,如Candida、Hansenula、Kluyveromyces、Pichia、Saccharomyces、Schizosaccharomyces或Yarrowia菌株;或更優(yōu)選地,來自絲狀真菌菌株,如Acremonium、Aspergillus、Aureobasidium、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mucor、Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Schizophyllum、Talaromyces、Thermoascus、Thielavia、Tolypocladium或Trichoderma菌株。
      在優(yōu)選的實施方案中,啟動子序列得自Saccharomycescarlsbergensis、Saccharomyces cerevisiae、Saccharomyces diastaticus、Saccharomyces douglasii、Saccharomyces kluyveri、Saccharomycesnorbensis、Saccharomyces oviformis、Saccharomyces bayanus、Saccharomyces bayanus,var.uvarum或Saccharomyces pastorianus菌株。
      在另一優(yōu)選的實施方案中,啟動子序列得自Aspergillus aculeatus、Aspergillus awamori、Aspergillus foetidus、Aspergillus japonicus、A.nidulans、A.niger優(yōu)選A.niger CBS 513.88、A.sojae、Aspergillus oryzae(A.oryzae)、Humicola insolens、Humicola lanuginosa、Mucor miehei、Myceliophthora thermophila、Neurospora crassa、Penicilliumpurpurogenum、Trichoderma harzianum、Trichoderma koningii、Trichoderma longibrachiatum、Trichoderma reesei或Trichoderma viride菌株。
      在另一優(yōu)選的實施方案中,啟動子序列得自Fusarium bactridioides、Fusarium cerealis、Fusarium crookwellense、Fusarium culmorum、Fusariumgraminearum、Fusarium graminum、Fusarium heterosporum Fusariumnegundi、Fusarium oxysporum、Fusarium reticulatum、Fusarium roseum、Fusarium sambucinum、Fusarium sarcochroum、Fusarium sporotrichioides、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides、Fusarium venenatum菌株。
      應(yīng)當理解對于上述物種而言,本發(fā)明包括完美和不完美的狀態(tài),和其它分類學(xué)等價物(例如無性型),而無論其被已知的物種名如何。本領(lǐng)域技術(shù)人員會容易地識別合適等價物的性質(zhì)。公眾可以在大量培養(yǎng)物收集中容易地得到這些物種的菌株,所述培養(yǎng)物收集如美國模式培養(yǎng)物保藏單位(ATCC)、Deutsche Sammlung von Mikroorganismen und ZellkulturenGmbH(DSM)、Centraalbureau Voor Schimmelcultures(CBS)和AgriculturalResearch Service Patent Culture Collection,Northern Regional Research Center(NRRL)。
      此外,可使用上述探針從其它來源中鑒定或獲得根據(jù)本發(fā)明的啟動子序列,所述其它來源包括從自然(例如土壤、堆肥、水等)中分離的微生物。用于從天然生境中分離微生物的技術(shù)為本領(lǐng)域公知。然后可類似地篩選另一微生物的基因組DNA文庫得到核酸序列。一旦用探針檢測到了編碼啟動子的核酸序列,則可通過使用本領(lǐng)域常規(guī)技術(shù)人員已知地技術(shù)分離或克隆該序列(參閱例如Sambrook et al.,1989,上文)。
      在本發(fā)明中,啟動子DNA序列還可以是雜交啟動子,其包含一個或多個本發(fā)明啟動子的部分;本發(fā)明啟動子的部分和另一已知啟動子的部分(如一個啟動子的前導(dǎo)序列和來自另一啟動子的轉(zhuǎn)錄起始位點);或本發(fā)明一個或多個啟動子的部分和一個或多個其它啟動子的部分。其它啟動子可以是在所選的宿主細胞中顯示轉(zhuǎn)錄活性的任何啟動子序列,包括變體的、截短的和雜交啟動子,并可得自編碼與所述宿主細胞同源或異源的細胞外或細胞內(nèi)多肽的基因。其它啟動子序列對于編碼多肽的核酸序列來說可以是同源或異源的,并可對細胞來說是同源或異源的。
      作為一種優(yōu)選的實施方案,經(jīng)鑒定的啟動子的重要調(diào)節(jié)亞序列可與其它“基本”啟動子融合以增強它們的啟動子活性(例如描述于MolMicrobiol.1994May;12(3)479-90.Regulation of the xylanase-encoding xlnAgene of Aspergillus tubigensis.de Graaff LH,van den Broeck HC,van OoijenAJ,Visser J.) 適用于用本發(fā)明啟動子構(gòu)建雜交啟動子的其它啟動子的其它實例包括得自下述基因的啟動子A.oryzae TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、A.niger中性α-淀粉酶、A.niger酸穩(wěn)定α-淀粉酶、A.niger或Aspergillus awamori葡萄糖淀粉酶(glaA)、A.niger gpdA、A.niger葡萄糖氧化酶goxC、Rhizomucor miehei脂酶、A.oryzae堿性蛋白酶、A.oryzae磷酸丙糖異構(gòu)酶、A.nidulans乙酰胺酶和Fusarium oxysporum胰蛋白酶樣蛋白酶(WO 96/00787)以及NA2-tpi啟動子(來自A.niger中性α-淀粉酶基因的啟動子和A.oryzae磷酸丙糖異構(gòu)酶的雜種)、Saccharomycescerevisiae烯醇化酶(ENO-1)、Saccharomyces cerevisiae半乳糖激酶(GAL1)、Saccharomyces cerevisiae醇脫氫酶/甘油醛-3-磷酸鹽脫氫酶(ADH2/GAP)和Saccharomyces cerevisiae 3-磷酸甘油酸酯激酶,及其突變體、截短的啟動子和雜交啟動子。適用于酵母宿主細胞的其它啟動子由Romanos et al.,1992,Yeast 8423-488描述。其它用于細菌細胞的有用啟動子為以下基因的啟動子B.subtilis堿性蛋白酶(apr)、B.subtilis中性蛋白酶(npr)、B.amyloliquefaciens α-淀粉酶(amyQ)、B.amyloliquefaciens堿性蛋白酶(apr)和B.amyloliquefaciens中性蛋白酶(npr)。
      在本發(fā)明中,啟動子DNA序列還可以是“串聯(lián)啟動子”?!按?lián)啟動子”在本文中被定義為兩個或更多啟動子序列,其各與編碼序列可操作連接并介導(dǎo)編碼序列到mRNA的轉(zhuǎn)錄。
      串聯(lián)啟動子包含兩個或更多本發(fā)明的啟動子,或者一個或多個本發(fā)明的啟動子和一個或多個其它已知啟動子,如上舉例適用于構(gòu)建雜交啟動子的那些。串聯(lián)啟動子的兩個或更多啟動子序列可同時啟動核酸序列的轉(zhuǎn)錄?;蛘叽?lián)啟動子的一個或多個啟動子序列可在細胞生長的不同階段、或在真菌宿主的情況下時在菌絲體形態(tài)學(xué)上不同的部分、或在成孢子的細菌(如bacilli)中孢子發(fā)育中不同的細胞區(qū)室內(nèi)啟動核酸序列的轉(zhuǎn)錄。
      在本發(fā)明中,啟動子可編碼序列和/或?qū)λ拗骷毎梢允峭庠吹?。本發(fā)明的變體、雜交或串聯(lián)啟動子應(yīng)被理解為對編碼多肽的DNA序列外源,即使野生型的啟動子對編碼序列或?qū)λ拗骷毎莾?nèi)源的。
      本發(fā)明的變體、雜交或串聯(lián)啟動子具有為來自SEQ ID NO1、SEQ IDNO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24和早先定義的任何啟動子的至少約20%,優(yōu)選至少約40%,更優(yōu)選至少約60%,更優(yōu)選至少約80%,更優(yōu)選至少約90%,更優(yōu)選至少約100%,進一步更優(yōu)選至少約200%,最優(yōu)選至少約300%,和進一步最優(yōu)選至少約400%的啟動子活性。啟動子活性優(yōu)選如先前所述來確定。最優(yōu)選啟動子活性使用Norhtern印跡通過mRNA分析確定。
      DNA構(gòu)建體 根據(jù)第二個方面,本發(fā)明提供下述DNA構(gòu)建體,所述構(gòu)建體包含與賦予可選擇性狀的報告基因可操作連接的如上部分所述的本發(fā)明啟動子DNA序列。報告基因可以是對合適宿主賦予可選擇性狀的任何基因。優(yōu)選報告基因為選擇性標記基因。
      “DNA構(gòu)建體”在本文中被定義為單鏈或雙鏈的核酸分子,其分離自天然存在的基因,或其經(jīng)修飾而含有以天然不存在的方式組合和并置的核酸片段。
      當DNA構(gòu)建體含有編碼序列和編碼序列表達所需的全部調(diào)控序列時,術(shù)語“DNA構(gòu)建體”與術(shù)語“表達盒”同義。在本申請上下文中,術(shù)語“DNA構(gòu)建體”與術(shù)語“經(jīng)分離的DNA構(gòu)建體”可互換使用,其中兩個術(shù)語理解為同義。
      DNA構(gòu)建體可包含選擇性標記基因,其允許容易選擇經(jīng)轉(zhuǎn)化的宿主細胞。DNA構(gòu)建體包含兩個選擇性標記基因時,技術(shù)人員會理解這兩個選擇性標記基因不相同與本發(fā)明啟動子連接的第一個選擇性標記基因用于本發(fā)明的篩選方法中,DNA構(gòu)建體中存在的第二個選擇性標記基因允許經(jīng)轉(zhuǎn)化的宿主細胞的標準選擇。
      報告基因與本發(fā)明的啟動子DNA序列可操作連接,從而在給定的宿主細胞中所述報告基因能夠在啟動子DNA序列調(diào)控下表達。由報告子基因編碼的多肽對宿主細胞和/或?qū)幼覦NA序列可以是同源或異源的。
      在本文上下文中“一個”是指“至少一個”。因此DNA構(gòu)建體包含至少一個報告基因。宿主可與至少兩個DNA構(gòu)建體共轉(zhuǎn)化,其中一個包含選擇性標記而另一個包含與報告基因連接的本發(fā)明啟動子?;蛘吒鶕?jù)更優(yōu)選的實施方案,DNA構(gòu)建體中包含的報告基因為包含至少一部分一個報告基因和至少一部分第二個報告基因的雜交報告基因,其中第一個和第二個報告基因的編碼序列按讀碼框彼此配對,且其中所述雜交報告基因與本發(fā)明啟動子可操作連接。第一個和/或第二個報告基因可以是賦予合適宿主可選擇性狀的任何基因。用于真菌的優(yōu)選雜交報告基因包括Streptoalloteichus hindustanis(Drocourt et al.,NAR,1990)的GFP基因和腐草霉素抗性基因(BLE)。
      選擇性標記或可選擇標記為下述基因,所述基因的產(chǎn)生提供抗微生物劑或病毒抗性、對重金屬的抗性、對營養(yǎng)缺陷型的原養(yǎng)型等。用于原核宿主細胞的合適可選擇標記包括但不僅限于卡那霉素、新霉素、紅霉素和其它MLS型標記物(大環(huán)內(nèi)酯-林肯酰胺-蜜柑霉素B)、氯霉素、氨芐西林、四環(huán)素、鏈霉素和壯觀霉素。用于酵母的合適標記物為ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在絲狀真菌宿主細胞中使用的可選擇標記物包括但不僅限于amdS(乙酰胺酶)、argB(鳥氨酸氨甲基轉(zhuǎn)移酶)、bar(膦絲菌素乙酰轉(zhuǎn)移酶)、hygB(潮霉素磷酸轉(zhuǎn)移酶)、niaD(硝酸鹽還原酶)、pyrG(乳清苷-5′-磷酸脫羧酶)、sC(硫酸腺嘌呤基轉(zhuǎn)移酶)、trpC(鄰氨基苯甲酸合酶)及其等效物。也可使用提供針對例如腐草霉素、潮霉素B或G418抗性的標記。優(yōu)選用于Aspergillus細胞的為A.nidulans或A.oryzae的amdS和pyrG基因和Streptomyces hygroscopicus的bar基因。amdS標記基因優(yōu)選應(yīng)用EP 635574B或WO 97/06261中所述技術(shù)使用。優(yōu)選的選擇性標記基因為與A.nidulans gpdA啟動子融合的A.nidulans amdS編碼序列(EP635 574B)。也可使用來自其它絲狀真菌的amdS基因(WO 97/06261)。
      根據(jù)另一優(yōu)選的實施方案,報告基因編碼用于如上所述的原核、酵母和/或絲狀真菌細胞的可選擇標記物?;蛘邎蟾婊蚓幋a如下的報告子蛋白β-半乳糖苷酶、β-葡萄糖苷酸酶、水母發(fā)光蛋白、綠色熒光蛋白(GFP)及其變體(紅色、氰基、黃色熒光蛋白)、螢光素酶、lux、血紅素、β-內(nèi)酰胺酶或堿性磷酸酶。更優(yōu)選地,報告基因為或包含編碼熒光報告子蛋白的基因,所述熒光報告子蛋白例如但不僅限于GFP、YFP和CFP(分別為綠色、黃色和氰基熒光蛋白質(zhì))。轉(zhuǎn)化體將顯示熒光并可使用光電管分選技術(shù)(FACS,熒光活化的細胞分選)從非表達克隆中分離。該方法的一個重要優(yōu)點為不需要將轉(zhuǎn)化混合物涂布平板(其顯著的提高了篩選方法的通量),并且陽性克隆可直接排列為MTP形式用于進一步的自動化處理。或者報告基因編碼(跨)膜蛋白或細胞壁蛋白,抗體可出現(xiàn)在其上??墒褂么偶毎诌x技術(shù)(

      ,Magnetic cell sorting,www.miltenyibiotec.com)從非表達轉(zhuǎn)化體中分離顯示所述膜蛋白的轉(zhuǎn)化體。
      調(diào)控元件 DNA構(gòu)建體除啟動子DNA序列外可進一步包含一種或多種調(diào)控序列,其在宿主細胞中在與調(diào)控序列相容的條件下指導(dǎo)報告基因的表達。表達應(yīng)被理解為包括多肽產(chǎn)生中涉及的任何步驟,其包括但不僅限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾和分泌。一個或多個調(diào)控序列對編碼序列或宿主來說可以是內(nèi)源的?;蛘呖梢杂靡粋€或多個對核酸序列外源的調(diào)控序列代替一個或多個調(diào)控序列,用于改善編碼序列在宿主細胞中的表達。
      術(shù)語“調(diào)控序列”在本文中被定義為包括編碼序列(如報告基因)表達必需或有利的所有組件,包括本發(fā)明的啟動子。各調(diào)控序列對編碼多肽的編碼序列來說可以是內(nèi)源的或外源的。這類調(diào)控序列包括但不僅限于前導(dǎo)序列、最佳翻譯起始序列(如Kozak,1991,J.Biol.Chem.26619867-19870中所述)、多腺苷酸化序列、前肽序列、信號肽序列、上游激活序列、本發(fā)明的啟動子(包括其的變體、片段和雜交和串聯(lián)啟動子)和轉(zhuǎn)錄終止子。調(diào)控序列最少包括轉(zhuǎn)錄和翻譯終止信號和本發(fā)明啟動子(部分)。調(diào)控序列可以與用于引入特異限制性位點目的的接頭一起提供,所述限制性位點便于連接調(diào)控序列與編碼多肽的編碼序列(如報告基因)的編碼區(qū)。
      調(diào)控序列可以是合適的轉(zhuǎn)錄終止子序列,即被宿主細胞識別終止轉(zhuǎn)錄的序列。終止子序列與編碼多肽的編碼序列3’末端可操作連接。任何在所選宿主細胞中有功能的終止子可用于本發(fā)明。
      技術(shù)人員會理解序列的5’端和3’端根據(jù)各編碼序列定義。對于給定的終止子序列和給定的編碼序列而言,技術(shù)人員會知道如何將它們可操作連接在一起。
      用于絲狀真菌宿主細胞的優(yōu)選終止子得自A.oryzae TAKA淀粉酶、A.niger葡萄糖淀粉酶、A.nidulans鄰氨基苯甲酸合酶、A.niger α-葡萄糖苷酶、trpC基因和Fusarium oxysporum胰蛋白酶樣蛋白酶基因。
      用于酵母宿主細胞的優(yōu)選終止子得自以下基因Saccharomycescerevisiae烯醇化酶、Saccharomyces cerevisiae細胞色素C(CYC1)和Saccharomyces cerevisiae甘油醛-3-磷酸鹽脫氫酶。用于酵母宿主細胞的其它有用終止子由Romanos et al,1992,上文描述。調(diào)控序列還可為合適的前導(dǎo)序列,即mRNA的非翻譯區(qū),其對宿主細胞翻譯是重要的。前導(dǎo)序列與編碼多肽的核酸序列5’末端可操作地連接。在所選宿主細胞中有功能的任何前導(dǎo)序列可用于本發(fā)明。
      用于絲狀真菌宿主細胞的優(yōu)選前導(dǎo)序列得自A.oryzae TAKA淀粉酶、A.nidulans磷酸丙糖異構(gòu)酶和A.niger葡萄糖淀粉酶基因。
      用于酵母宿主細胞的合適前導(dǎo)序列來自Saccharomyces cerevisiae烯醇化酶(ENO-1)、Saccharomyces cerevisiae 3-磷酸甘油酸酯激酶、Saccharomyces cerevisiaeα-因子和Saccharomyces cerevisiae醇脫氫酶和甘油醛-3-磷酸酯脫氫酶(ADH2/GAP)基因。
      調(diào)控序列還可以是聚腺苷酸化序列,所述序列與核酸序列3’末端可操作連接。用于絲狀真菌宿主細胞的優(yōu)選的聚腺苷酸化序列得自A.oryzaeTAKA淀粉酶、A.niger葡萄糖淀粉酶、A.nidulans鄰氨基苯甲酸合酶、Fusarium oxysporum胰蛋白酶樣蛋白酶和A.nidulans α-葡萄糖苷酶。
      用于酵母宿主細胞的有用聚腺苷酸化序列由Guo and Sherman,1995,Molecular Cellular Biology 155983-5990描述。
      還可期望添加調(diào)節(jié)序列,其允許多肽表達的調(diào)節(jié)與宿主細胞的生長相關(guān)。調(diào)節(jié)體系的實例為響應(yīng)化學(xué)或物理刺激(包括調(diào)節(jié)化合物的存在)引起基因的表達被打開或關(guān)閉的那些。原核體系中的調(diào)節(jié)體系包括E.coli的lac和trp操縱子體系,和B.subtilis的spac、xyl、sacB和citM體系(在Meima et al.(2004)Expression Systems in Bacillus.In″Protein ExpressionTechnologies.Current status and future trends″(F.Baneyx,ed.),HorizonBioscience,Wymondham,Norfolk,UK,pp.199-252中綜述)。在桿菌中中適用于調(diào)控表達的其它啟動子為在營養(yǎng)饑餓條件下被誘導(dǎo)的啟動子,如分別位于磷酸鹽和氮調(diào)控下的Pho調(diào)節(jié)子和TnrA/GlnR體系。在酵母中可使用ADH2體系或GAL1體系。在絲狀真菌中,可使用如US 5,503,991中所述的TAKA α-淀粉酶啟動子、A.niger葡萄糖淀粉酶啟動子、A.oryzae葡萄糖淀粉酶啟動子、A.tubingensis木聚糖內(nèi)切酶(xlnA)啟動子、A.niger硝酸鹽還原酶(niaD)啟動子、Trichoderma reesei纖維二糖水解酶啟動子和A.nidulans醇和醛脫氫酶(分別為alcA和aldA)作為調(diào)節(jié)序列。調(diào)節(jié)序列的其它實例為允許基因擴增的調(diào)節(jié)序列。在真核體系中,這些調(diào)節(jié)序列包括二氫葉酸還原酶基因(其在存在甲氨喋呤時被擴增)和金屬硫蛋白基因(其在有重金屬時被擴增)。在這些情況下,編碼多肽的核酸序列應(yīng)與調(diào)節(jié)序列可操作地連接。
      本發(fā)明啟動子DNA序列中的內(nèi)源調(diào)節(jié)序列可以被去除,例如去除creA結(jié)合位點(如早先在EP 673 429B中所述的碳分解代謝物阻遏)、改變pacC和areA(用于pH和氮調(diào)節(jié))。在B.subtilis中,碳代謝物阻遏(CCR)涉及CcpA蛋白質(zhì)與cre元件的結(jié)合。cre元件與木糖誘導(dǎo)型的xyl啟動子組合用于開發(fā)表達體系,所述表達體系允許雙重調(diào)控目的基因(Bhavsar et al.(2001)Appl Environ Microbiol67403)。
      優(yōu)選地,DNA構(gòu)建體包含本發(fā)明的啟動子DNA序列、與所述啟動子DNA序列可操作連接的編碼序列和翻譯調(diào)控序列,如 -選自以下序列列表的依照5’到3’方向的一種翻譯終止序列TAAG、TAGA和TAAA,優(yōu)選TAAA,和/或 -選自以下序列列表的依照5’到3’方向的一種翻譯起始編碼序列GCTACCCCC;GCTACCTCC;GCTACCCTC;GCTACCTTC;GCTCCCCCC;GCTCCCTCC;GCTCCCCTC;GCTCCCTTC;GCTGCCCCC;GCTGCCTCC;GCTGCCCTC;GCTGCCTTC;GCTTCCCCC;GCTTCCTCC;GCTTCCCTC;和GCTTCCTTC,優(yōu)選GCT TCC TTC和/或 -選自以下序列列表的一種轉(zhuǎn)錄起始序列5′-mwChkyCAAA-3′、5′-mwChkyCACA-3′或5′-mwChkyCAAG-3′,其中采用針對核苷酸的不確定編碼m(A/C);w(A/T);y(C/T);k(G/T);h(A/C/T),優(yōu)選5′-CACCGTCAAA-3′或5′-CGCAGTCAAG-3′。
      在本發(fā)明上下文中,術(shù)語“翻譯起始編碼序列”被定義為DNA編碼序列開放讀碼框的起始子或起始密碼子緊鄰上游的九個核苷酸。起始子或起始密碼子編碼AA甲硫氨酸。起始密碼子典型地為ATG,但是也可以是任何功能性起始密碼子如GTG。
      在本發(fā)明上下文中,術(shù)語“翻譯終止序列”被定義為從開放讀碼框或核苷酸編碼序列3’端翻譯終止密碼子開始的,并依照5’到3’方向的三個或四個核苷酸。
      在本發(fā)明上下文中,術(shù)語“翻譯起始序列”被定義為編碼多肽的DNA序列開放讀碼框起始子或起始密碼子緊鄰下游的十個核苷酸。起始子或起始密碼子編碼甲硫氨酸這種氨基酸。起始密碼子典型為ATG,但是也可以是任何功能性起始密碼子,如GTG。本領(lǐng)域公知在RNA中尿嘧啶U代替脫氧核苷酸胸腺嘧啶T。
      用于原核生物的優(yōu)選調(diào)控序列已在EP 284 126A中描述。
      本發(fā)明還涉及重組表達載體,其包含與報告基因可操作連接的本發(fā)明啟動子和轉(zhuǎn)錄和翻譯起始和終止信號。上述多種報告基因和調(diào)控序列可以結(jié)合在一起,產(chǎn)生下述重組表達載體,所述重組表達載體可包括一個或多個便利的限制性位點,所述限制性位點允許在這類位點處插入或取代啟動子和/或報告基因?;蛘呖赏ㄟ^例如Gene.1989 Apr 15;77(1)51-9.Ho SN,Hunt HD,Horton RM,Pullen JK,Pease LR″Site-directed mutagenesis byoverlap extension using the polymerase chain reaction″中所述的使用PCR的序列重疊延伸(SOE-PCR),或通過使用GatewayTM克隆體系(Invitrogen)克隆完成編碼序列和啟動子的融合。
      重組表達載體可以是能夠轉(zhuǎn)化宿主細胞的任何載體。對載體的選擇典型地會取決于載體與其被引入的宿主細胞間的相容性。載體可以是線性或閉環(huán)質(zhì)粒。載體可以是整合的或自主復(fù)制的載體。
      載體可以是自主復(fù)制載體(即作為染色體外實體存在時其復(fù)制不依賴于染色體復(fù)制)例如質(zhì)粒、染色體外因子、微型染色體或人工染色體。自主復(fù)制載體可包含確保自主復(fù)制的任何手段。載體可以是引入宿主細胞時被整合進基因組,并與其被整合進的染色體一起復(fù)制的載體。另外,可以使用包含要引入宿主細胞基因組中全部DNA或轉(zhuǎn)座子的單個載體或質(zhì)?;騼蓚€或更多的載體或質(zhì)粒,或轉(zhuǎn)座子。自主維持克隆載體的一個實例為包含AMA1-序列的克隆載體。AMA1為從A.nidulans分離的6.0kb基因組DNA片段,其能夠在Aspergillus中自主維持(參閱例如Aleksenko andClutterbuck(1997),F(xiàn)ungal Genet.Biol.21373-397)。適用于在革蘭氏陽性細菌如B.subtilis和B.amyloliquefaciens中表達的自主復(fù)制載體的實例為葡萄球菌載體pUB110(McKenzie et al.(1986)Plasmid 1593)和內(nèi)源B.subtilis質(zhì)粒pTA1015、pTA1040和pTA1060和來自它們的載體(例如pHB201;Bron et al.(1998)J Biotechnol 643)。
      本發(fā)明的載體優(yōu)選含有下述元件,所述元件允許載體穩(wěn)定整合進宿主細胞基因組或允許載體在細胞中獨立于基因組自主復(fù)制。
      就整合進宿主細胞基因組而言,載體可依賴于啟動子序列和/或報告基因序列或載體的任何其它元件,用于通過同源重組或非同源重組將載體穩(wěn)定整合進基因組?;蛘咻d體可含有用于指導(dǎo)通過同源重組整合進宿主細胞基因組的額外的核酸序列。所述額外的核酸序列使得載體能夠在染色體中精確的靶位點整合進宿主細胞基因組。為了提高精確位點整合的可能性,整合元件應(yīng)優(yōu)選含有足夠數(shù)量的核酸,例如20到50個,優(yōu)選55到95個,優(yōu)選100到1,500個堿基對,優(yōu)選400到1,500個堿基對,更優(yōu)選800到1,500個堿基對并最優(yōu)選至少2kb,所述核酸與宿主細胞基因組中預(yù)先確定的靶基因座的DNA序列同源。整合元件可以是與宿主細胞基因組中靶序列同源的任何序列。另外,整合元件可以是非編碼或編碼核酸序列。為了促進靶向的整合,克隆載體優(yōu)選在轉(zhuǎn)化宿主細胞之前線性化。線性化優(yōu)選以下述方式進行克隆載體的至少一端(但是優(yōu)選兩端)側(cè)翼為與靶位點同源的序列。
      優(yōu)選地,表達載體中與靶位點同源的整合元件來自高度表達的基因座,即它們來自能夠在真菌宿主細胞中高水平表達的基因。能夠有高表達水平的基因(即高表達的基因)在本文中定義為下述基因,所述基因的mRNA可占據(jù)總細胞mRNA的至少0.5%(w/w)(例如在經(jīng)誘導(dǎo)的條件下),或者,所述基因的基因產(chǎn)物可占據(jù)總細胞蛋白質(zhì)的至少1%(w/w),或在經(jīng)分泌的基因產(chǎn)物情況下,所述基因的基因產(chǎn)物可分泌至至少0.1g/l的水平(如EP 357127B1中所述)。大量優(yōu)選的高表達真菌基因以實例的方式給出淀粉酶、葡萄糖淀粉酶、醇脫氫酶、木聚糖酶、磷酸甘油醛脫氫酶或來自Aspergilli或Trichoderma的纖維二糖水解酶基因。用于這些目的的最優(yōu)選的高表達基因為葡萄糖淀粉酶基因,優(yōu)選A.niger葡萄糖淀粉酶基因、A.oryzae TAKA-淀粉酶基因、A.nidulans gpdA基因、SEQ IDNO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28和SEQ ID NO29基因座,優(yōu)選SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ IDNO28和SEQ ID NO29的A.niger基因座或Trichoderma reesei纖維二糖水解酶基因。
      或者,載體可以通過非同源重組整合進宿主細胞基因組。
      或者,和/或與上述實施方案組合,可在本發(fā)明步驟(e)中針對制造(優(yōu)選分泌)目的蛋白質(zhì)對細胞進行生產(chǎn)(篩選)后,從宿主細胞中缺失下述DNA構(gòu)建體,所述DNA構(gòu)建體包含與本發(fā)明啟動子可操作連接的報告基因。步驟(e)稍后描述。這使得宿主細胞能夠直接用于制造目的蛋白質(zhì),而所述宿主細胞不包含報告基因和/或可選擇標記基因。為了能夠缺失本發(fā)明的DNA構(gòu)建體,DNA構(gòu)建體優(yōu)選包含報告基因和DNA重復(fù)之間的雙向可選擇標記。DNA重復(fù)允許通過內(nèi)染色體同源重組缺失DNA構(gòu)建體。該方法與EP 0635574所述的″MARKER-GENE FREE″方法類似。
      對自主復(fù)制而言,載體可以還包含允許載體在所述宿主細胞中自主復(fù)制的復(fù)制起點。用于酵母宿主細胞的復(fù)制起點實例為2微米復(fù)制起點、ARS1、ARS4、ARS1和CEN3的組合,和ARS4和CEN6的組合。復(fù)制起點可以是具有下述突變的復(fù)制起點,所述突變使宿主細胞中復(fù)制起點的功能對于溫度敏感(參閱例如Ehrlich,1978,Proceedings of the NationalAcademy of Sciences USA 751433)。
      可將多于一個拷貝的本發(fā)明DNA構(gòu)建體插入宿主細胞中。這可通過優(yōu)選將數(shù)拷貝DNA序列整合進其基因組中,更優(yōu)選通過將DNA序列的整合靶向高表達基因座(優(yōu)選葡萄糖淀粉酶基因座或SEQ ID NO25、SEQID NO26、SEQ ID NO27、SEQ ID NO28和SEQ ID NO29的基因座)中完成?;蛘哌@可通過在核酸序列中包含可擴增的可選擇標記基因,使細胞含有經(jīng)擴增的拷貝的可選擇標記基因,并從而可通過例如在存在適當可選擇劑時培養(yǎng)細胞用于選擇額外拷貝的核酸序列。為了進一步提高要過表達的DNA序列的拷貝數(shù),可使用如WO98/46772中所述的基因轉(zhuǎn)換技術(shù)。
      用于連接上述元件以構(gòu)建本發(fā)明重組表達載體的方法為本領(lǐng)域技術(shù)人員公知(參閱例如Sambrook et al.,1989,上文)。
      宿主細胞 本發(fā)明還涉及用上一部分定義的DNA構(gòu)建體轉(zhuǎn)化的重組宿主細胞,所述DNA構(gòu)建體包含與報告基因可操作連接的本發(fā)明的啟動子DNA序列。優(yōu)選地,經(jīng)轉(zhuǎn)化的宿主細胞還包含包含下述DNA序列的額外的DNA構(gòu)建體,所述DNA序列包含來自下述生物DNA文庫的編碼序列,所述生物可能能夠制造一種或多種具有目的特性的蛋白質(zhì)。
      這類細胞可有利地用于下一部分中描述的表達克隆方法中。包含與報告基因可操作連接的本發(fā)明啟動子DNA序列的表達載體被引入宿主細胞。再用包含下述DNA序列的DNA構(gòu)建體或表達載體轉(zhuǎn)化宿主細胞,所述DNA序列包含來自DNA文庫的編碼序列。如先前所述,DNA構(gòu)建體或表達載體均作為染色體整合體或作為自我復(fù)制染色體外載體。宿主細胞的選擇在很大程度上取決于其中制造了DNA文庫的生物和/或取決于所使用的啟動子DNA序列的來源。
      宿主細胞可以是任何微生物。優(yōu)選地,宿主細胞與制備DNA文庫的宿主細胞相同,和/或與如說明書中早先定義的本發(fā)明啟動子來源的宿主細胞為相同生物。根據(jù)一種優(yōu)選的實施方案,宿主細胞為原核生物或真核生物。根據(jù)一種更優(yōu)選的實施方案,適用于本發(fā)明方法的宿主細胞為原核生物,更優(yōu)選地,在啟動子部分定義為啟動子來源的原核生物。更優(yōu)選地,原核宿主細胞為Bacillus宿主細胞,優(yōu)選地,Bacillus Subtilis、Bacilluslicheniformis和/或Bacillus amyloliquefaciens種。
      根據(jù)另一更優(yōu)選的實施方案,適用于本發(fā)明方法的宿主細胞為真菌。
      宿主細胞可以是野生型絲狀真菌宿主細胞或變體、突變體或經(jīng)遺傳修飾的絲狀真菌宿主細胞。在本發(fā)明優(yōu)選的實施方案中,宿主細胞為蛋白酶缺陷或蛋白酶負型菌株。這可以是稱為“alp”的堿性蛋白酶基因被缺失的蛋白酶缺陷菌株Aspergillus oryzae JaL 125(描述于WO 97/35956或EP429490)或公開于WO 96/14404中的A.niger三肽基氨基肽酶(TRAP)缺陷菌株。另外,根據(jù)本發(fā)明也考慮WO 01/68864中描述的轉(zhuǎn)錄激活子(prtT)產(chǎn)生減少的宿主細胞。另一特別考慮的宿主菌株為Aspergillus oryzaeBECh2,其中出現(xiàn)在親本菌株IF04177中的三個TAKA淀粉酶基因被滅活。另外,兩個蛋白酶(堿性蛋白酶和中性金屬蛋白酶11)通過基因破壞被破壞。通過突變破壞了形成代謝產(chǎn)物環(huán)并偶氮酸和曲酸的能力。BECh2描述于WO 00/39322并來自JaL228(描述于WO 98/12300),所述JaL228也是US 5,766,912中公開為A1560的IF04177的突變體。
      任選地,絲狀真菌宿主細胞與野生型細胞相比包含提高的解折疊蛋白應(yīng)答(UPR)以增強目的多肽的生產(chǎn)能力。UPR可通過US2004/0186070A1和/或US2001/0034045A1和/或WO01/72783A2和/或WO2005/123763中描述的技術(shù)提高。更具體地,HAC1和/或IRE1和/或PTC2的蛋白質(zhì)水平被調(diào)節(jié),和/或SEC61蛋白質(zhì)被設(shè)計從而獲得具有提高的UPR的宿主細胞。
      或者,或與提高的UPR一起,宿主細胞可通常被遺傳修飾以獲得下述表型,所述表型與野生型細胞相比顯示更低的蛋白酶表達和/或蛋白酶分泌,從而增強目的多肽的制造能力。這類表型可通過缺失和/或修飾和/或滅活蛋白酶表達的轉(zhuǎn)錄調(diào)節(jié)子獲得。這類轉(zhuǎn)錄調(diào)節(jié)子為例如prtT。通過調(diào)節(jié)prtT降低蛋白酶的表達可通過US2004/0191864A1和EP2005/055145中所述技術(shù)進行。
      或者,或與提高的UPR和/或顯示更低蛋白酶表達和/或蛋白酶分泌的表型一起,宿主細胞顯示草酸鹽缺陷表型,從而增強目的多肽的制造量。草酸鹽缺陷表型可通過WO2004/070022A2和WO2000/50576中描述的技術(shù)獲得。
      或者,或與提高的UPR和/或顯示更低蛋白酶表達和/或蛋白酶分泌和/或草酸鹽缺陷的表型一起,宿主細胞顯示與野生型細胞相比表型差異的組合,從而提高目的多肽的制造量。這些差異可包括,但不僅限于降低的葡萄糖淀粉酶和/或中性α-淀粉酶A和/或中性α-淀粉酶B、α-1、6轉(zhuǎn)葡萄糖基酶、蛋白酶和草酸水解酶的表達。所述由宿主細胞顯示的表型差異可根據(jù)US2004/0191864A1中所述技術(shù)通過遺傳修飾獲得。
      或者,或與上述表型組合,核酸構(gòu)建體通過同源重組靶向整合進入宿主細胞基因組(即整合進預(yù)先確定的靶位點)的效率優(yōu)選通過宿主細胞的增強的同源重組能力提高。細胞的這類表型優(yōu)選涉及WO2005/095624中描述的缺陷hdfA或hdfB基因。WO2005/095624公開了獲得具有提高的靶向整合能力的絲狀真菌細胞的優(yōu)選方法。
      更優(yōu)選地,本發(fā)明的宿主細胞選自以下列表Bacillus、酵母和絲狀真菌,優(yōu)選Aspergillus、Penicillium或Trichoderma種。進一步更優(yōu)選Aspergillus宿主細胞為Aspergillus niger或Aspergillus sojae或Aspergillusoryzae種。
      本發(fā)明還涉及重組的宿主細胞,所述宿主細胞包含多于一個本發(fā)明的啟動子DNA序列,各啟動子與一個報告基因可操作連接。這類宿主細胞可有利地用于下一部分種所述的表達克隆方法中??赏ㄟ^多種方法轉(zhuǎn)化細菌細胞,包括化學(xué)誘導(dǎo)的感受態(tài)(例如CaCl2)或電穿孔(Sambrook et al.(1989)″Molecular Cloninga laboratory manual″,Cold Spring HarborLaboratories,Cold Spring Harbor,New York)、原生質(zhì)體轉(zhuǎn)化(Chang andCohen(1979)Mol Gen Genet 168111)以及,在一些Bacillus種的情況下為天然感受態(tài)(Spizizen(1958)Proc Natl Acad Sci USA 441072)??赏ㄟ^下述方法轉(zhuǎn)化真菌細胞,所述方法涉及原生質(zhì)體形成、原生質(zhì)體轉(zhuǎn)化和以本身已知的方式再生細胞壁。用于轉(zhuǎn)化Aspergillus宿主細胞的合適方法描述于EP 238 023和Yelton et al.,1984,Proceedings of the National Academyof Sciences USA 811470-1474。使用Agrobacterium tumefaciens轉(zhuǎn)化Aspergillus和其它絲狀真菌宿主細胞的合適方法描述于例如Nat Biotechnol.1998 Sep;16(9)839-42.Erratum inNat Biotechnol 1998 Nov;16(11)1074.Agrobacterium tumefaciens-mediated transformation of filamentous fungi,deGroot MJ,Bundock P,Hooykaas PJ,Beijersbergen AG.Unilever ResearchLaboratory Vlaardingen,The Netherlands。用于轉(zhuǎn)化Fusarium種的合適方法描述于Malardier et al.,1989,Gene 78147-156和WO 96/00787。可使用Becker and Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide toYeast Genetics and Molecular Biology,Methods in Enzymology,Volume 194,pp 182-187,Academic Press,Inc.,New York;lto et al.,1983,Journal ofBacteriology 153163;和Hinnen et al.,1978,Proceedings of the NationalAcademy of Sciences USA 751920中描述的方法轉(zhuǎn)化酵母。原核生物的轉(zhuǎn)化可如EP 284 126A中所述進行。
      表達克隆方法 根據(jù)另一方面,本發(fā)明提供用于在宿主細胞中分離包含下述DNA序列的DNA序列的方法,所述DNA序列編碼目的蛋白質(zhì),所述方法包含步驟 (a)制備第一DNA構(gòu)建體,其包含與賦予可選擇性狀的報告基因可操作連接的啟動子DNA序列;當所述DNA構(gòu)建體存在于宿主細胞中和當宿主細胞產(chǎn)生目的蛋白質(zhì)(優(yōu)選地,被分泌的目的蛋白質(zhì))時,所述啟動子DNA序列被誘導(dǎo); (b)制備第二DNA構(gòu)建體,其包含包含下述DNA序列的DNA序列,所述DNA序列編碼來自下述生物DNA文庫的目的蛋白質(zhì),所述生物被懷疑能夠制造一種或多種目的蛋白質(zhì); (c)用(a)和(b)中制備的兩種DNA構(gòu)建體轉(zhuǎn)化宿主細胞; (d)在有助于制造DNA文庫中存在的目的蛋白質(zhì)的條件下,培養(yǎng)(c)中獲得的所有經(jīng)轉(zhuǎn)化的宿主細胞;和 (e)通過分析在(d)中制造的蛋白質(zhì),篩選制造目的蛋白質(zhì)的經(jīng)轉(zhuǎn)化的宿主細胞。
      步驟(a) 制備第一DNA構(gòu)建體,其包含與賦予可選擇性狀的報告基因可操作連接的啟動子DNA序列;當所述DNA構(gòu)建體存在于宿主細胞中和當宿主細胞產(chǎn)生目的蛋白質(zhì)(優(yōu)選地,被分泌的目的蛋白質(zhì))時,所述啟動子DNA序列被誘導(dǎo)。
      第一DNA構(gòu)建體中存在的啟動子為當宿主細胞產(chǎn)生目的蛋白質(zhì)(優(yōu)選被分泌當目的蛋白質(zhì))時被誘導(dǎo)的啟動子。
      在本發(fā)明中,術(shù)語“被誘導(dǎo)的”定義為在相同培養(yǎng)條件下,與相應(yīng)對照宿主細胞不(過量)產(chǎn)生目的蛋白質(zhì)時的啟動子活性相比,當宿主細胞(過量)產(chǎn)生(優(yōu)選分泌)目的蛋白質(zhì)時,本發(fā)明啟動子的啟動子活性提高。優(yōu)選地,當宿主細胞中(過量)產(chǎn)生(優(yōu)選分泌)目的蛋白質(zhì)時,與相同培養(yǎng)條件下其中不(過量)產(chǎn)生目的蛋白質(zhì)的相應(yīng)對照宿主細胞相比,啟動子活性提高至少約1.5倍,更優(yōu)選至少約兩倍,更優(yōu)選至少約三倍,更優(yōu)選至少約四倍,更優(yōu)選至少約五倍,進一步更優(yōu)選至少約六倍,進一步更優(yōu)選至少約八倍,進一步更優(yōu)選至少約十倍,進一步更優(yōu)選至少約二十倍,進一步更優(yōu)選至少約50倍,以及最優(yōu)選至少約100倍。更優(yōu)選地,啟動子活性提高是無限的,即當不(過量)產(chǎn)生目的蛋白質(zhì)時,未檢測到啟動子活性或啟動子是無活性的,而當(過量)產(chǎn)生目的蛋白質(zhì)時,啟動子被誘導(dǎo)。優(yōu)選如前所述確定啟動子活性。最優(yōu)選使用Northern印跡通過mRNA分析確定啟動子活性。
      可通過將制造目的蛋白質(zhì)的細胞的基因表達譜與不制造所述蛋白質(zhì)的對照菌株的基因表達譜比較,鑒定這類啟動子。優(yōu)選地,這類表達譜使用確立的DNA微陣列分析比較?;蛘呖墒褂眉夹g(shù)人員已知的其它方法(如Northern印跡或定量PCR分析)比較表達譜。比較表達譜的最優(yōu)選的方法如下進行首先通過DNA微陣列分析比較表達譜,然后通過Northern印跡隨后確證微陣列結(jié)果。根據(jù)優(yōu)選的實施方案,啟動子為啟動子部分描述的本發(fā)明的啟動子DNA序列。
      根據(jù)另一優(yōu)選的實施方案,當宿主細胞為Bacillus細胞時,啟動子來自下列基因組DNA序列htrA(SEQ ID NO1)或htrB(SEQ ID NO2)。優(yōu)選啟動子DNA序列來自位于起始密碼子上游的這些基因組DNA序列之一的非編碼部分,或為位于上游的所述基因組序列的部分。更優(yōu)選所使用的啟動子為SEQ ID NO1或SEQ ID NO2的DNA序列。
      根據(jù)另一優(yōu)選的實施方案,當宿主細胞為絲狀真菌細胞時,啟動子來自下列基因組DNA序列SEQ ID NO20、SEQ NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24。優(yōu)選地,啟動子DNA序列來自位于起始密碼子上游的這些基因組DNA序列之一的非編碼部分,或為位于上游的所述基因組序列的部分。更優(yōu)選地,所使用的啟動子為SEQ IDNO15、SEQ NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的DNA序列或其衍生物。
      步驟(a)中制備的第一DNA構(gòu)建體已經(jīng)在相應(yīng)的“DNA構(gòu)建體”部分中描述,優(yōu)選地,其包含如“DNA構(gòu)建體”部分所述賦予可選擇性狀的報告基因。
      步驟(b) 步驟(b)中制備的DNA構(gòu)建體包含包含下述DNA序列的DNA序列,所述DNA序列編碼來自下述生物DNA文庫的目的蛋白質(zhì),所述生物被懷疑能夠制造一種或多種目的蛋白質(zhì);可能制造一種或多種目的蛋白質(zhì)的生物為原核生物或真核生物。優(yōu)選的原核生物和真核生物的實例早先已在說明書中與本發(fā)明啟動子的來源一起定義。根據(jù)另一優(yōu)選的實施方案,該生物為Bacillus,更優(yōu)選地,在啟動子部分定義的Bacillus物種。根據(jù)另一優(yōu)選的實施方案,該生物為真核生物,更優(yōu)選為真菌,其中最優(yōu)選絲狀真菌。
      在步驟(b)中制備的DNA構(gòu)建體,優(yōu)選包含如“DNA構(gòu)建體”和“調(diào)控元件”部分中定義的調(diào)節(jié)序列。
      在根據(jù)本發(fā)明的方法中,來自可能制造一種或多種目的蛋白質(zhì)的DNA片段文庫可以是基因組文庫或cDNA文庫。然而,在真核供體的情況下,優(yōu)選使用cDNA文庫以避免真菌宿主生物中啟動子或剪接信號識別的問題。優(yōu)選從分離自來源生物的mRNA中制備cDNA文庫,所述來源生物在有助于目的蛋白質(zhì)表達的條件下生長。
      如果存在在宿主細胞表達蛋白質(zhì)后可用于檢測所述蛋白質(zhì)的測定法,那么根據(jù)本發(fā)明的方法可應(yīng)用于分離編碼任何目的蛋白質(zhì)或多肽的DNA序列。
      步驟(c) 要用兩種DNA構(gòu)建體轉(zhuǎn)化的宿主細胞的身份已描述于“宿主細胞”部分中。轉(zhuǎn)化方法已在相同部分中描述。根據(jù)一個實施方案,用(a)和(b)中制備的構(gòu)建體同時轉(zhuǎn)化宿主細胞?;蛘?,并根據(jù)另一實施方案,先用步驟(a)制備的DNA構(gòu)建體轉(zhuǎn)化宿主細胞,然后用用步驟(b)制備的DNA構(gòu)建體轉(zhuǎn)化宿主細胞。
      根據(jù)優(yōu)選的實施方案,宿主細胞為原核生物,優(yōu)選Bacillus細胞,更優(yōu)選為Bacillus subtilis,進一步更優(yōu)選為htrA基因缺陷的Bacillus subtilis(其中htrA基因的至少部分編碼區(qū)被缺失和/或取代和/或其中htrA基因的編碼區(qū)仍然存在于所述Bacillus細胞的基因組中),最優(yōu)選使用Bacillussubtilis BV2003(Hyyrylainen et al.(2001)MoI Microbiol 411159)。
      或者,或與先前優(yōu)選的實施方案結(jié)合,宿主細胞為Bacillus細胞,且報告基因編碼如DNA構(gòu)建體部分定義的熒光報告蛋白,最優(yōu)選GFP。
      或者,或與先前優(yōu)選的實施方案結(jié)合,當宿主細胞為Bacillus細胞時,啟動子來自以下列表所述基因組DNA序列htrA(SEQ ID NO1)或htrB(SEQ ID NO2)。優(yōu)選地,啟動子DNA序列來自位于起始密碼子上游的這兩個基因組DNA序列之一的非編碼部分,或為位于上游的所述序列的部分。更優(yōu)選地,所使用的啟動子為來自SEQ ID NO1或SEQ ID NO2的啟動子。根據(jù)最優(yōu)選的實施方案,所使用的啟動子和所使用的報告基因為與SEQ ID NO1可操作連接的GFP,或與SEQ ID NO2可操作連接的GFP。
      根據(jù)另一優(yōu)選的實施方案,所述生物為真核生物,更優(yōu)選真菌,其中最優(yōu)選絲狀真菌。優(yōu)選絲狀真菌為Aspergillus、Penicillium或Trichoderma種。進一步更優(yōu)選Aspergillus宿主細胞為Aspergillus niger或Aspergillussojae或Aspergillus oryzae種。最優(yōu)選的宿主細胞為A.niger,優(yōu)選CBS513.88或其衍生物。
      或者,或與先前優(yōu)選的實施方案結(jié)合,宿主細胞為絲狀真菌細胞,報告基因編碼如DNA構(gòu)建體部分所定義的熒光報告蛋白,最優(yōu)選GFP?;蛘邎蟾婊蚓幋a可選擇標記。更優(yōu)選地,報告基因為熒光蛋白和可選擇標記物的雜交報告基因。最優(yōu)選雜交報告基因包含GFP和Streptoalloteichushindustanis的腐草霉素抗性基因(BLE)(Drocourt etal.,NAR,1990)。
      或者,或與先前優(yōu)選的實施方案結(jié)合,當宿主細胞為絲狀真菌細胞時,啟動子來自以下列表中存在的基因組DNA序列SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24。優(yōu)選啟動子序列來自位于起始密碼子上游的所列基因組DNA序列之一的非編碼部分,或為位于上游的部分所述序列。更優(yōu)選地,所使用的啟動子為實施例3到7中所使用的啟動子之一,并來自SEQ ID NO20、SEQ IDNO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24。根據(jù)最優(yōu)選的實施方案,所使用的啟動子和所用的雜交報告基因為與啟動子SEQ ID NO15可操作連接的GFP-BLE(SEQ ID NO61)、與啟動子SEQ ID NO16可操作連接的GFP-BLE、與SEQ ID NO17可操作連接的GFP-BLE、與啟動子SEQ ID NO18可操作連接的GFP-BLE或與啟動子SEQ ID NO19可操作連接的GFP-BLE。
      步驟(d) 用兩種DNA構(gòu)建體轉(zhuǎn)化宿主細胞后,在有助于制造DNA文庫中存在的目的蛋白質(zhì)的條件下,培養(yǎng)所有獲得的經(jīng)轉(zhuǎn)化的宿主細胞。根據(jù)檢測目的蛋白質(zhì)所需的測試法,將經(jīng)轉(zhuǎn)化的克隆傳代并儲存為固體培養(yǎng)基(例如瓊脂平板)上或液體培養(yǎng)基中的菌落,由此在微孔滴定板的孔中培養(yǎng)、儲存和/或測試個體文庫克隆。
      技術(shù)人員會理解通常對本領(lǐng)域已知克隆方法的適應(yīng)可同樣應(yīng)用于本發(fā)明的方法中。所述適應(yīng)包括但不僅限于例如篩選文庫克隆池、篩選相同文庫得到大量不同的目的蛋白質(zhì),以及再篩選、再分離和再克隆陽性克隆以確保更精確的結(jié)果。
      技術(shù)人員可獲得多種方法用于從篩選方法中鑒定為經(jīng)轉(zhuǎn)化的宿主細胞中分離編碼目的蛋白質(zhì)的DNA序列,和用于隨后分析所分離的DNA序列。
      步驟(e) 在步驟(d)之后,通過分析制造的蛋白質(zhì)篩選經(jīng)轉(zhuǎn)化的宿主細胞用于制造目的蛋白質(zhì),優(yōu)選地,分泌目的蛋白質(zhì)。在步驟(e)中,通過監(jiān)測由第一DNA構(gòu)建體中存在的啟動子DNA序列誘導(dǎo)的依賴于制造(優(yōu)選依賴于分泌)的報告子表達,篩選制造(優(yōu)選分泌)目的蛋白質(zhì)的經(jīng)轉(zhuǎn)化的宿主細胞。
      根據(jù)優(yōu)選的實施方案,當宿主細胞為Bacillus細胞時,優(yōu)選使用基于熒光的細胞分析測定法(例如熒光激活的細胞掃描、熒光激活的細胞分選(FACS)或熒光分析)進行篩選,以鑒定制造(優(yōu)選分泌)目的蛋白質(zhì)的經(jīng)轉(zhuǎn)化的宿主細胞,所述篩選通過監(jiān)測由第一DNA構(gòu)建體中存在的啟動子DNA序列誘導(dǎo)的依賴于制造(優(yōu)選地,依賴于分泌)的報告子表達。更優(yōu)選宿主細胞為包含第一DNA構(gòu)建體的Bacillus細胞,所述DNA構(gòu)建體包含如SEQ ID NO1或其衍生物或SEQ ID NO2或其衍生物的啟動子,所述DNA構(gòu)建體還包含編碼熒光報告子的報告基因,并且篩選使用基于熒光的細胞分析測定法進行。進一步更優(yōu)選地,宿主細胞為Bacillus且第一DNA構(gòu)建體包含 -與GFP可操作連接的啟動子DNA序列SEQ ID NO1或其衍生物,或 -與GFP可操作連接的啟動子DNA序列SEQ ID NO2或其衍生物 且篩選使用FACS進行?;蛘撸蚺c先前的實施方案結(jié)合,篩選可使用例如比色測定法或使用選擇性培養(yǎng)條件進行。技術(shù)人員會理解,根據(jù)所使用的報告基因,選擇性培養(yǎng)條件是但不僅限于殺生物劑的使用、抗生素的使用、至少一種營養(yǎng)、原養(yǎng)型。
      根據(jù)另一優(yōu)選的實施方案,當宿主細胞為絲狀真菌細胞時,優(yōu)選通過在選擇性培養(yǎng)條件下進行篩選,以鑒定制造(優(yōu)選分泌)目的蛋白質(zhì)的經(jīng)轉(zhuǎn)化的宿主細胞,所述篩選通過監(jiān)測由本發(fā)明第一DNA構(gòu)建體中存在的啟動子DNA序列誘導(dǎo)的依賴于制造(優(yōu)選依賴于分泌)的報告子表達。技術(shù)人員會理解基于所使用的報告基因,可相應(yīng)選擇選擇性培養(yǎng)條件。選擇性培養(yǎng)條件的實例是但不僅限于使用殺生物劑、使用抗生素、至少一種營養(yǎng)、原養(yǎng)型?;蛘?,或與先前實施方案結(jié)合,篩選可使用比色、熒光的(如FACS)或基于酶活性的測定法進行。根據(jù)更優(yōu)選的實施方案,宿主細胞為包含本發(fā)明第一DNA構(gòu)建體的絲狀真菌細胞,且篩選使用選擇性培養(yǎng)條件進行。更優(yōu)選地,宿主細胞為包含本發(fā)明第一DNA構(gòu)建體的絲狀真菌細胞時,所述DNA構(gòu)建體包含選自下列的啟動子SEQ IDNO15或其衍生物、SEQ ID NO16或其衍生物、SEQ ID NO17或其衍生物、SEQ ID NO18或其衍生物、SEQ ID NO19或其衍生物,所述DNA構(gòu)建體還包含編碼可選擇標記的報告基因,且篩選使用選擇性培養(yǎng)條件進行。進一步更優(yōu)選地,宿主細胞為包含本發(fā)明第一DNA構(gòu)建體的絲狀真菌細胞,所述DNA構(gòu)建體包含選自下列的啟動子SEQ ID NO15或其衍生物、SEQ ID NO16或其衍生物、SEQ ID NO17或其衍生物、SEQ IDNO18或其衍生物、SEQ ID NO19或其衍生物,所述DNA構(gòu)建體還包含雜交報告基因如SEQ ID NO61,且篩選使用選擇性培養(yǎng)條件進行。
      根據(jù)另一更優(yōu)選的實施方案,宿主細胞為包含本發(fā)明第一DNA構(gòu)建體的A.niger細胞,且篩選使用選擇性培養(yǎng)條件進行。更優(yōu)選地,宿主細胞為包含本發(fā)明第一DNA構(gòu)建體的A.niger細胞,所述DNA構(gòu)建體包含選自下列的啟動子SEQ ID NO15或其衍生物、SEQ ID NO16或其衍生物、SEQ ID NO17或其衍生物、SEQ ID NO18或其衍生物、SEQ IDNO19或其衍生物,所述DNA構(gòu)建體還包含編碼可選擇標記的報告子基因,且篩選使用選擇性培養(yǎng)條件進行。進一步更優(yōu)選地,宿主細胞為包含本發(fā)明第一DNA構(gòu)建體的A.niger細胞,所述DNA構(gòu)建體包含選自下列的啟動子SEQ ID NO15或其衍生物、SEQ ID NO16或其衍生物、SEQID NO17或其衍生物、SEQ ID NO18或其衍生物、SEQ ID NO19或其衍生物,所述DNA構(gòu)建體還包含雜交報告基因如SEQ ID NO61,且篩選使用選擇性培養(yǎng)條件進行。進一步更優(yōu)選地,宿主細胞為A.niger細胞且第一DNA構(gòu)建體包含 -與啟動子SEQ ID NO15可操作連接的雜交報告基因GFP-BLE(SEQID NO61),或 -與啟動子SEQ ID NO16或其衍生物可操作連接的GFP-BLE,或 -與啟動子SEQ ID NO17或其衍生物可操作連接的GFP-BLE,或 -與啟動子SEQ ID NO18或其衍生物可操作連接的GFP-BLE,或 -與啟動子SEQ ID NO19或其衍生物可操作連接的GFP-BLE,且篩選使用包含抗生素(優(yōu)選腐草霉素)作為選擇劑的選擇性培養(yǎng)條件進行。
      通過如上所述本發(fā)明的篩選方法分離的DNA序列用于制造目的蛋白質(zhì)或改善目的蛋白質(zhì)的制造,所述目的蛋白質(zhì)由DNA序列編碼。有利地,在上述篩選方法中分離的經(jīng)轉(zhuǎn)化的宿主細胞直接用于制造目的蛋白質(zhì)的方法中,所述方法通過在有助于制造(優(yōu)選分泌)目的蛋白質(zhì)的條件下培養(yǎng)經(jīng)轉(zhuǎn)化的宿主細胞并可選地回收蛋白質(zhì)。
      根據(jù)一種優(yōu)選的實施方案,宿主細胞能夠直接用于制造目的蛋白質(zhì),所述宿主細胞不包含報告基因和/或可選擇標記基因。因此,在細胞已被篩選用于制造(優(yōu)選分泌)目的蛋白質(zhì)后,從宿主細胞中缺失包含與本發(fā)明啟動子可操作連接的報告基因的DNA構(gòu)建體。為了能夠缺失本發(fā)明的DNA構(gòu)建體,所述DNA構(gòu)建體優(yōu)選在DNA重復(fù)之間包含報告基因和雙向可選擇標記基因。DNA重復(fù)允許通過內(nèi)染色體同源重組缺失DNA構(gòu)建體。該方法與EP 0 635 574B1所述的″MARKER-GENE FREE″方法類似。
      在本發(fā)明篩選方法中分離的最初經(jīng)轉(zhuǎn)化的宿主細胞通常會具有足夠用于篩選目的,但是可為經(jīng)濟制造目的顯著改善的表達水平。為此,將DNA序列插入表達載體中,其隨后用于轉(zhuǎn)化合適的宿主細胞。在該表達載體中,DNA序列與適當?shù)谋磉_信號(如啟動子、可選的信號序列和終止子)可操作連接,如“DNA構(gòu)建體”和“調(diào)控元件”部分中所定義,所述表達信號能夠指導(dǎo)蛋白質(zhì)在宿主生物中的表達。用于制造蛋白質(zhì)的合適宿主細胞可以是原核或真核細胞,優(yōu)選真細菌、酵母或絲狀真菌。優(yōu)選的細菌宿主細胞選自如啟動子部分定義的Bacillus屬。根據(jù)另一優(yōu)選的實施方案,宿主細胞為已在“宿主細胞”部分中定義的酵母或絲狀真菌。優(yōu)選的酵母宿主細胞選自Saccharomyces、Kluyveromyces、Yarrowia、Pichia和Hansenula屬。優(yōu)選的絲狀真菌宿主細胞選自在上文列為用于篩選方法的優(yōu)選宿主細胞的相同屬。更優(yōu)選地,絲狀真菌為Aspergillus、Penicillium或Trichoderma種。進一步更優(yōu)選地,Aspergillus宿主細胞為Aspergillusniger或Aspergillus sojae或Aspergillus oryzae種。最優(yōu)選的宿主細胞為A.niger,優(yōu)選CBS513.88或其衍生物。
      通過技術(shù)人員可獲得的多種流程中的任何流程,用表達載體轉(zhuǎn)化合適的宿主細胞。然后將經(jīng)轉(zhuǎn)化的宿主細胞用于下述方法,所述方法通過在有助于表達編碼蛋白質(zhì)的DNA序列的條件下培養(yǎng)經(jīng)轉(zhuǎn)化的宿主細胞來制造目的蛋白質(zhì),并可選地回收蛋白質(zhì)。
      優(yōu)選目的蛋白質(zhì)為酶。
      因此,本發(fā)明涉及本發(fā)明啟動子在表達克隆方法中的用途。
      本發(fā)明還涉及本發(fā)明啟動子的其它用途。優(yōu)選地,本發(fā)明啟動子可DNA構(gòu)建體或表達載體(均在前一部分中定義)中與任何編碼序列可操作連接。這類DNA構(gòu)建體或表達載體可被引入在“宿主細胞”部分中定義的任何宿主細胞中,并用于表達給定的有價值化合物。這類有價值化合物的實例為,但不僅限于代謝物或多肽。優(yōu)選地,與本發(fā)明啟動子可操作連接的編碼序列編碼有價值的化合物?;蛘撸⒏鶕?jù)本發(fā)明另一優(yōu)選的實施方案,與本發(fā)明啟動子可操作連接的編碼序列涉及有價值化合物的制造。
      或者,并根據(jù)本發(fā)明啟動子另一優(yōu)選的用途,本發(fā)明的啟動子被整合進滅活或取代構(gòu)建體中,轉(zhuǎn)化進給定宿主細胞中,并用于滅活或取代靶基因。
      本發(fā)明由以下實施例進一步說明。
      實施例 材料和方法 一般程序 標準分子克隆技術(shù),如DNA分離、凝膠電泳、核酸的限制性酶修飾、Northern分析、E.coli轉(zhuǎn)化等,如Sambrook et al.(2001)″MolecularCloninga laboratory manual,3d edition″,Cold Spring Harbor Laboratories,Cold Spring Harbor,New York and lnnis et al.(1990)″PCR protocols,a guideto methods and applications″Academic Press,San Diego所述進行。合成的寡脫氧核苷酸得自Invitrogen(Breda,The Netherlands)。室溫為20℃±2℃。
      Aspergillus niger轉(zhuǎn)化 A.niger轉(zhuǎn)化根據(jù)Tilburn,J.et al.(1983)Gene 26,205-221和Kelly,J.&Hynes,M.(1985)EMBO J.,4,475-479所述方法進行,其中采用以下改變 使孢子發(fā)芽并在置于300rpm搖床中的搖瓶中Aspergillus最小培養(yǎng)基(100ml)中在30℃下培養(yǎng)16小時。每升Aspergillus最小培養(yǎng)基含有6gNaNO3、0.52g KCl、1.52g KH2PO4、1.12ml 4M KOH、0.52gMgSO4.7H2O、10g葡萄糖、1g酪蛋白氨基酸、22mg ZnSO4.7H2O、11mg H3BO3、5mg FeSO4.7H2O、1.7mg CoCl2.6H2O、1.6mg CuSO4.5H2O、5mg MnCl2.2H2O、1.5mg Na2MoO4.2H2O、50mg EDTA、2mg核黃素、2mg硫胺-HCl、2mg煙酰胺、1mg吡哆醇-HCL、0.2mg panthotenic acid、4g生物素、10ml青霉素(5000IU/ml)鏈霉素(5000UG/ml)溶液(Gibco)。
      -用Novozym 234TM(Novo Industries)代替解螺旋酶用于制備原生質(zhì)體; -形成原生質(zhì)體后(60-90分鐘),加入KC緩沖液(0.8M KCl、9.5mM檸檬酸,pH 6.2)至45ml的終體積,在浮桶式轉(zhuǎn)頭離心機中在4℃下3000rpm將原生質(zhì)體懸浮液離心10分鐘。原生質(zhì)體重懸于20ml KC緩沖液中并隨后加入25ml STC緩沖液(1.2M山梨糖、10mM Tris-HCI pH7.5,50mM CaCl2)。在浮桶式轉(zhuǎn)頭離心機中在4℃下3000rpm將原生質(zhì)體懸浮液離心10分鐘,在STC緩沖液中洗滌并在STC緩沖液中重懸為10E8原生質(zhì)體/ml的濃度; -向200微升原生質(zhì)體懸浮液中加入溶解在10微升TE緩沖液(10mMTris-HCI pH 7.5,0.1mM EDTA)和100微升PEG溶液(20%PEG 4000(Merck),0.8M山梨醇,10mM Tris-HCl pH 7.5,50mM CaCl2)中的DNA片段; -在室溫下將DNA-原生質(zhì)體懸浮液孵育10分鐘后,緩慢加入1.5mlPEG溶液(60%PEG 4000(Merck),10mM Tris-HCl pH 7.5,50mM CaCl2)并重復(fù)混勻管。在室溫下孵育20分鐘后,用5ml 1.2M山梨醇稀釋懸浮液,顛倒混勻并在室溫下4000rpm離心10分鐘。將原生質(zhì)體柔和地重懸于1ml 1.2M山梨醇中并涂布在固體選擇性培養(yǎng)基上,所述培養(yǎng)基由不含核黃素、硫胺-HCl、煙酰胺、吡哆醇、panthotenic acid、生物素、酪蛋白氨基酸和葡萄糖的Aspergillus最小培養(yǎng)基組成。對乙酰胺選擇而言,培養(yǎng)基含有10mM乙酰胺作為唯一氮源和1M蔗糖作為滲壓劑和C源?;蛘邔⒃|(zhì)體涂布于添加有1-50微克/ml腐草霉素和1M蔗糖作為滲壓劑的PDA(馬鈴薯葡萄糖瓊脂,Oxoid)上。使用20%瓊脂(瓊脂No.1,OxoidL1 1)固化再生平板。在30℃下孵育6-10天后,將轉(zhuǎn)化體的分生孢子轉(zhuǎn)移至由含2%葡萄糖和1.5%瓊脂糖(Invitrogen)的Aspergillus選擇性培養(yǎng)基(在乙酰胺選擇的情況下含有乙酰胺作為唯一氮源,或在腐草霉素選擇情況下為添加了1-50微克/ml腐草霉素的PDA)上,并在30℃下孵育5-10天。分離單個轉(zhuǎn)化體,并重復(fù)一次該選擇性純化步驟,藉此儲存經(jīng)純化的轉(zhuǎn)化體。
      Aspergillus niger微量滴定板發(fā)酵和取樣 為了獲得A.niger的孢子,將菌絲體轉(zhuǎn)移至根據(jù)供應(yīng)商說明制備的填充有150微升固體PDA培養(yǎng)基(馬鈴薯葡萄糖瓊脂,Oxoid)的微量滴定板上。在30℃(靜止)生長3-7天后形成孢子。然后向各孔中添加100微升液體發(fā)酵培養(yǎng)基(70g/l葡萄糖.H2O、25g/l蛋白胨(來自酪蛋白)、12.5g/l酵母提取物(Difco)、2g/l K2SO4、1g/l KH2PO4、0.5g/lMgSO4.7H2O、0.03g/l ZnCL2、0.02g/l CaCL2、9mg/l MnSO4-H2O、3mg/lFeSO4.7H2O,用4N H2SO4調(diào)至pH 5.6)。上下吸打液體培養(yǎng)基20次以分離培養(yǎng)基中的孢子。將接種過的發(fā)酵培養(yǎng)基轉(zhuǎn)移至另一微量滴定板并在34℃、550rpm和80%濕度下在軌道微量滴定板搖床(Infors HT)上孵育6天。在第6天收集上清液并用于檢測所分泌的蛋白質(zhì)。
      質(zhì)譜法分析 將上清液通過離心力在Ultracel濾板(Millipore,Billerica,MA,USA)上超濾。超濾根據(jù)制造商提供的流程進行。向經(jīng)超濾的上清液中添加10微升200mM的碳酸氫銨,pH7.8(Riedel-de Haen AG,Seelze,Germany)和1微升250微克每ml的胰蛋白酶(Worthington,Lakewood,NJ,USA)。將上清液在37℃消化3小時。經(jīng)消化的上清液以1∶1的比例與10毫克每ml的經(jīng)再結(jié)晶的α-氰-4-羥基苯丙烯酸(?CHCA)(Laser Bio Labs,Sophia-AntipolisCedex,F(xiàn)rance)溶液混合;從這些混合物中將1微升點在MALDI靶標上。在vMALDI LTQ質(zhì)譜儀(Thermo electron,Orlando,F(xiàn)L,USA)上用MALDIMS和MALDI MS/MS分析被點的樣品。
      所獲得的MS/MS譜被轉(zhuǎn)化為肽序列,與在預(yù)先推定的FASTA蛋白質(zhì)數(shù)據(jù)庫中可獲得的蛋白質(zhì)序列比較,以鑒定個體酶。
      RNA分離 收集在培養(yǎng)皿中20ml液體選擇性再生培養(yǎng)基(6g/l NaNO3,0.52g/lKCl,1.52g/l KH2PO4,0.25g/l KOH,0.52g/l MgSO4.7H2O,22mg/lZnSO4.7H2O,11mg/l H3BO3,5mg/l FeSO4.7H2O,1.7mg/l CoCl2.6H2O,1.6mg/l CuSO4.5H2O,5mg/l MnCl2.2H2O,1.5mg/l Na2MoO4.2H2O,50mg/lEDTA,341g/l蔗糖,10ml青霉素(5000lU/ml)鏈霉素(5000UG/ml)溶液(Gibco))上形成的Aspergillus niger菌絲體,用軟化水洗滌并在紙巾之間擠壓去除多余的水。立刻將菌絲體在液氮中冷凍,并用研缽和研杵研磨成精細的粉末。將產(chǎn)生的粉末轉(zhuǎn)移至無菌的50ml管中并稱量,藉此對酶1-1.2g被研磨的菌絲體加入10ml TRIzol試劑(Invitrogen)(每管最多25ml)。立刻通過充分混合(渦旋1分鐘)增溶菌絲體粉末,然后室溫孵育5分鐘并隨機攪拌。添加0.2(最初TRIzol)體積的氯仿(從而對每10ml最初使用的TRIzol添加2ml氯仿),渦旋并在室溫下放置10分鐘。然后將混合物在4℃,6000g離心30分鐘。將上部水相轉(zhuǎn)移至新管中并通過添加0.5(最初TRIzol)體積的100%異丙醇(從而每10ml最初使用的TRIzol添加5ml異丙醇)沉淀總RNA。在室溫下沉淀10分鐘后,通過在6000g離心30分鐘回收RNA。去除上清液后,將RNA沉淀塊用一倍(原始TRIzol)體積的70%乙醇洗滌。去除乙醇后,將RNA沉淀塊晾干。干燥的RNA沉淀塊溶于3ml GTS(100mM Tris-Cl,pH 7.5,4M硫氰酸胍,0.5%十二烷基肌氨酸鈉)緩沖液。根據(jù)供應(yīng)商手冊使用Rneasy Maxi試劑盒(Qiagen)額外純化RNA。使用10微升RNA溶液確定核酸的量和濃度。
      Aspergillus niger菌株 A.niger WT-1該A.niger菌株為包含編碼葡萄糖淀粉酶(glaA)、真菌淀粉酶和酸性淀粉酶的基因缺失的CBS513.88。A.niger WT-1使用如EP 0635574B1所述的″MARKER-GENE FREE″途徑構(gòu)建。該專利中廣泛描述了如何缺失CBS 513.88基因組中的glaA特異DNA序列。第一個步驟得到了MARKER-GENE FREE?glaA重組A.niger CBS 513.88菌株,其最終完全不具有任何外源DNA序列。然后通過EP 0 635 574B1中所述方法從A.niger WT-1基因組中缺失編碼真菌淀粉酶和酸性淀粉酶的基因。
      如圖7到9和11到14所描繪的用于克隆目的構(gòu)建體的載體含有先前在WO 99/32617中描述的主鏈特征。
      A.niger WT-GFP該A.niger菌株通過用圖7所描述的表達載體pGBFINGFP-2轉(zhuǎn)化A.niger WT-1獲得,所述載體含有由葡萄糖淀粉酶啟動子驅(qū)動的編碼公知綠色熒光蛋白(GFP)的基因(Chalfie,M et al.,Science(1994)263(5148)802-805)。在選擇性培養(yǎng)基上純化后,基于PCR分析選擇單拷貝整合體。
      A.niger WT-PHY該A.niger菌株通過用圖8所描述的表達載體pGBFIN-32轉(zhuǎn)化A.niger WT-1獲得,所述載體包含由葡萄糖淀粉酶啟動子驅(qū)動的植酸酶基因PHY(與先前在WO 99/32617中描述的FytA相同)。在選擇性培養(yǎng)基上純化后,基于PCR分析選擇單拷貝整合體。
      A.niger WT-PHY-2該A.niger菌株通過用圖8所描述的表達載體pGBFIN-32轉(zhuǎn)化A.niger WT-1獲得,所述載體包含由葡萄糖淀粉酶啟動子驅(qū)動的植酸酶基因PHY(與先前在WO 99/32617中描述的FytA相同)。在選擇性培養(yǎng)基上純化后,基于PCR分析選擇單拷貝整合體。
      A.niger WT-載體該A.niger菌株通過用圖9所描述的空對照載體pGBFIN-40轉(zhuǎn)化A.niger WT-1菌株獲得??諏φ蛰d體pGBFIN-40通過Xhol消化圖8中所描述的pGBFIN-32并將最大片段重新連接,從而去除葡萄糖淀粉酶啟動子和植酸酶基因PHY的5’部分構(gòu)建。通過PCR分析選擇單拷貝整合體。
      實施例1構(gòu)建Bacillus報告質(zhì)粒和報告菌株 1.1構(gòu)建報告質(zhì)粒pPhtrA-gfp-amyE和pPhtrB-gfp-amyE 首先,如下構(gòu)建報告質(zhì)粒pPhtrA-gfp-amyE。使用pSG1151(P.J.Lewisand A.L.Marston,1999;GFP vectors for controlled expression and duallabelling of protein fusions in Bacillus subtilis,Gene 227,101.)作為模板DNA,用以下引物RN-lacZ-rv(SEQ ID NO3),GTGAGCGGATAACAATTTCACACAGG;和 gfp-terminator-rv,(SEQ IDNO4)GTGGCTCAGCTTTTTTAAGGAAGGGAGGCTCTCACCTCCCTTCCCTTTATTTGTAGAGC TCATCCATGCC,通過PCR擴增編碼最佳化版本GFP——gfpmut-1的基因(P.Cormack,R.H.Valdivia,and S.Falkow,1996;FACS-optimized mutants of the green fluorescent protein(GFP),Gene 173,33.),其中所述引物分別得到gfpmut-1上游和下游的KpnI和Bpu1101I位點(黑體)。使用KpnI和Bpu1101I位點將913bp PCR產(chǎn)物連接在下述pDL中,得到pGFP-amyE,所述pDL包含用于位點特異重組的amyE基因座的同源側(cè)翼區(qū)(G.Yuan and S.L.Wong,1995;Regulation of groEexpression in Bacillus subtilisthe involvement of the sigma A-like promoterand the roles of the inverted repeat sequence(CIRCE),J.Bacteriol.177,5427)。使用B.subtilis 168(Bacillus Genetic Stock Center ID1 A1)的染色體DNA作為模板DNA,通過PCR擴增htrA的啟動子(PhtrA)(SEQ ID NO1)。所使用的引物為分別引入KpnI和HindIII位點(黑體)的PhtrA-fw,(SEQ ID NO5)CGTGAGGTACCGGCTTCTGTTTCTGCC;和Phtr-rv,(SEQ ID NO6)CATCACGAAGCTTATCCATCATGTTCACTCCG。用Kpn1和Hind3消化后,將531bp PCR產(chǎn)物連接進pGFP-amyE中g(shù)fp基因上游,得到報告質(zhì)粒pPhtrA-gfp-amyE。該質(zhì)粒的圖譜描繪于圖1中。質(zhì)粒pPhtrB-gfp-AmyE以如上所述類似的方法構(gòu)建。用于擴增htrB啟動子(PhtrB)(SEQ ID NO 2)的引物為PhtrB-fw(SEQ ID NO 7)GACCGGTACCTCAGGATCTTTCGCC和PhtrA-rv(SEQ ID NO 8)GGCCATCAAGCTTATAATCCATGTTCTTACACTCC。
      1.2構(gòu)建Bacillus報告菌株VT210A和VT210B 將得到的質(zhì)粒pPhtrA-gfp-amyE和pPhtrB-gfp-amyE引入DaprE、DnprE雙突變體B.subtilis DB104中(F.Kawamura and R.H.Doi,1984;Construction of a Bacillus subtilis double mutant deficient in extra cellularalkaline and neutral proteases,J.Bacteriol.160,442)。通過對染色體DNA的PCR檢查氯霉素抗性轉(zhuǎn)化體通過amyE基因座上雙交換的位點特異性整合。為了降低HtrA對PhtrA的負反饋調(diào)節(jié)(D.Noone,A.Howell,R.Collery,and K.M.Devine,2001;YkdA and YvtA,HtrA-like serine proteases in Bacillussubtilis,engage in negative auto regulation and reciprocal cross-regulation ofykdA and yvtA gene expression,J.Bacteriol.183,654),用B.subtilisBV2003的染色體DNA轉(zhuǎn)化新菌株,所述B.subtilis BV2003具有通過pMutin2整合被破壞的htrA基因(H.L.Hyyrylainen,A.Bolhuis,E.Darmon,L.Muukkonen,P.Koski,M.Vitikainen,M.Sarvas,Z.Pragai,S.Bron,J.M.van Dij1,and V.P.Kontinen,2001;A novel two-component regulatory system in Bacillussubtilis for the survival of severe secretion stress,Mol.Microbiol.41,1159)。選擇紅霉素抗性的轉(zhuǎn)化體并通過對染色體DNA的PCR檢查htrA破壞。獲得的菌株命名為VT200A和VT200B。
      為了提高VT200A菌株的轉(zhuǎn)化效率,設(shè)計了BsuMR破壞構(gòu)建體。BsuMR體系通過由三個基因ydiR、ydiS和ydiA組成的操縱子形成,其中各基因?qū)suMR功能是必須的(P.J.Lewis and A.L.Marston,1999;GFPvectors for controlled expression and dual labeling of protein fusions in Bacillussubtilis,Gene 227,101)。使用以下引物和B.subtilis染色體DNA作為模板擴增756bp的ydiR區(qū)——側(cè)翼區(qū)1(flr1)flrBsul F,(SEQ ID NO 9)GAAAGATTGTTTCAGAAGCC;和flrBsuR,(SEQ ID NO10)ACAGCGTTGGGATCCAAGCCCTTCCATTTTGGACATTTGG。使用pDG1726(A.M.Guerout-Fleury,K.Shazand,N.Frandsen,and P.Stragier,1995;Antibiotic-resistance cassettes for Bacillus subtilis,Gene 167,335)作為模板DNA和以下引物擴增壯觀霉素抗性標記specBsu-F,(SEQ ID NO11)GGGCTTGGATCCCAACGCTGTCGACGTTGTAAAACGACGG;和specBsu-R,(SEQ ID NO12)CGCATAGCTTTCCGGTCGCCGCAGCTATGACCATGATTACGC。1319bp PCR產(chǎn)物和flrBsu1片段用于第二輪PCR,其中由引物flrBsu1-R和specBsu-F(黑體)引入的其同源末端重組后,兩個片段作為一個模板作用。使用引物flrBsu1-F和specBsu-R獲得2075bp PCR片段flr1-specr,其被亞克隆進pCR-XL-TOPO(Invitrogen)中得到pCT-XL-TOPO-flr1-spec。覆蓋ydiS(編碼DNA內(nèi)切核酸酶)的3’末端和相鄰ydjA(未知功能)大部分的739bp區(qū)域——側(cè)翼區(qū)2,使用引物flrBsu2-F,(SEQ ID NO 13)GATGATTCGTCTTTTTGTAGTG;和引物flrBsu2-R,(SEQ ID NO 14)CGATCAACATATGTGTTCACG和B.subtilis的染色體DNA作為模板擴增。將PCR產(chǎn)物克隆進pCR-XL-TOPO中得到pCR-XL-TOPO-flr2。利用pCR-XL-TOPO載體的多克隆位點,使用XhoI和NsiI將flr1-specr從pCR-XL-TOPO-flr1上限制性酶切下并連接進用XhoI和Pstl(與NsiI匹配)消化的pCR-XL-TOPO-flr2中。這引起構(gòu)建體pTOPO-flr1-specr-flr2的刪除,其被引入菌株VT200A。通過對染色體DNA的PCR檢查壯觀霉素抗性轉(zhuǎn)化體的ydiS缺失。獲得的最終報告菌株稱為VT210A和VT210B并用于進一步的實驗,構(gòu)建這些菌株的一般性概括描繪于圖2中。
      1.3構(gòu)建表達載體pUBnpr2和pUBBAG 質(zhì)粒pUB110的構(gòu)建及其序列之前已被描述過(McKenzie T.,HoshinoT.,and Sueoka,N.1986.The nucleotide sequence of pUB110;some salientfeatures in relation to replication and its regulation.Plasmid 1593-103)。將Bacillus amyloliquefaciens a-淀粉酶基因amyQ(Genbank登錄號J 01542)克隆進pUB110,得到如先前所述的質(zhì)粒pKTH10(Palva,I.1982.Molecularcloning of the alpha-amylase gene of Bacillus amyloliquefaciens and itsexpression in B.subtilis.Gene 1981-87)。
      將均來自Bacillus amyloliquefaciens的中性蛋白酶基因npr(Genbank登錄號K 02497)和β-葡聚糖酶基因bag(Genbank登錄號M15674)克隆進載體pUB110的過程實質(zhì)上根據(jù)用于克隆amyQ的方法進行,得到如圖3和圖4所描繪的質(zhì)粒pUBnpr2和pUBBAG。
      1.4將表達構(gòu)建體pKTHIO、pUBnpr2和pUBBAG轉(zhuǎn)化進Bacillus報告菌株VT210A中 Bacillus subtilis菌株VT210A的轉(zhuǎn)化實際上如先前所述利用該生物的天然感受態(tài)進行(Anagnostopoulos,C.and Spizizen,J.1961.Requirements fortransformation in Bacillus subtilis.J.Bacteriology 81741-746)。DNA孵育后,將細胞涂布于2 x TY瓊脂上,其含有0.1%淀粉和作為轉(zhuǎn)化選擇劑的抗生素卡那霉素(20μg/ml)。將板在37℃孵育過夜。當轉(zhuǎn)化涉及質(zhì)粒pKTH10時,用魯戈溶液(lugol solution)覆蓋菌落以檢測分泌淀粉酶的細胞。
      實施例2通過熒光激活的細胞測定法分析分泌脅迫的細胞 2.1通過熒光激活的細胞分選選擇分泌脅迫的細胞 以1∶20的比例使用質(zhì)粒pUB110(空對照載體)和pKTH10(編碼Bacillus amyloliquefaciens a-淀粉酶基因amyQ)共轉(zhuǎn)化Bacillus subtilis菌株VT210A。將一部分細胞涂布于選擇性TY瓊脂平板上,向另一部分中添加含卡那霉素的2 x TY培養(yǎng)基,并將細胞孵育過夜。同樣用與共轉(zhuǎn)化相同的操作轉(zhuǎn)化分離的質(zhì)粒。第二天,在FACS型流式細胞儀(Mo-FIo ofDakocytomation)上由熟練操作者GFP熒光分析培養(yǎng)物。使用80mWatt和488nm的藍色激光。典型的FACS實驗包含對20.000個事件(細胞)的分析。首先單獨分析(圖5A和5B)和作為混合(圖5C)分析VT210A,pUB110(無分泌脅迫)和VT210A,pKTH10(由于過量生產(chǎn)α-淀粉酶AmyQ的分泌脅迫)細胞的熒光信號。在這些結(jié)果的基礎(chǔ)上手動設(shè)置細胞分界限(圖5D中的虛線),使得顯示高于細胞分選界限的GFP熒光的細胞被分選。將共轉(zhuǎn)化培養(yǎng)物應(yīng)用于流式細胞儀并在管中收集被分選的細胞。為了驗證經(jīng)分選的熒光群體已經(jīng)富集了分泌α-淀粉酶的細胞,將被收集的細胞的不同稀釋液涂布在含淀粉的選擇性瓊脂上。對未經(jīng)FACS分選的最初的過夜輸入培養(yǎng)物進行相同處理。培養(yǎng)后用魯戈溶液覆蓋菌落,使α-淀粉酶活性引起的鹵素形成顯影。圖表1所示,約90%的經(jīng)分選的細胞的確分泌α-淀粉酶,而輸入培養(yǎng)物中僅0.5%-0.7%的細胞分泌α-淀粉酶。該結(jié)果清除地說明了有力的本發(fā)明選擇工具,其通過使用正常細胞和分泌脅迫細胞之間的熒光信號辨別來分離分泌蛋白質(zhì)的細胞。

      表1流式細胞術(shù)后富集形成amy+菌落的單位。
      2.2通過熒光細胞掃描選擇分泌脅迫的細胞 將質(zhì)粒pUB110(空對照載體)和pKTH10(編碼Bacillusamyloliquefaciens a-淀粉酶基因amyQ)單獨地轉(zhuǎn)化進Bacillus subtilis菌株VT210B中。將一部分細胞涂布于選擇性TY瓊脂平板上,向另一部分中添加含卡那霉素的2 x TY培養(yǎng)基,并將細胞孵育過夜。在流式細胞儀(Coulter Epics XL-MCL,Beckman Coulter)上由熟練操作者分析培養(yǎng)物。典型的實驗包含20.000事件(細胞)的分析。使用FITC濾器并將光電倍增管電壓設(shè)為700和800伏特之間檢測熒光信號。正常細胞和受到分泌脅迫的細胞間的熒光信號差異描繪于圖6中。
      2.3使用熒光計選擇分泌脅迫的VT21OA細胞 經(jīng)轉(zhuǎn)化的報告菌株細胞在存在卡那霉素的2 x TY培養(yǎng)基中孵育并在37℃過夜培養(yǎng)。用于轉(zhuǎn)化質(zhì)粒pUB110、pKTH10、pUBnpr2和pUBBAG的DNA數(shù)量相等。生長至穩(wěn)定期后,將四種轉(zhuǎn)化的培養(yǎng)細胞以96孔微量滴定板的形式等體積分為8份。孔在熒光計中分析熒光(MolecularDevices,type Spectra MAX Gemini)。刺激在490nm,發(fā)射在510nm和截斷在495nm。表2說明通過清晰顯著(P two-tail<0.05)的熒光信號差異而將非脅迫的細胞(pUB110)從脅迫的細胞(pKTH10、pUBnpr2和pUBBAG)中區(qū)別出來。
      表2.假定不等方差的t檢驗。給定空宿主細胞(pUB110)對分泌脅迫(pKTH10、pUBnpr2、pUBBAG)細胞的P值。
      比值表達了脅迫細胞的平均熒光值(n=8)對空宿主細胞的平均熒光值(n=8)。
      實施例3基因組廣泛表達分析A.niger以鑒定分泌誘導(dǎo)的啟動子 進行基因組廣泛表達分析以鑒定在A.niger WT-PHY中高度表達,并在A.niger WT-GFP,A.niger WT-載體和A.niger WT-1中不顯示或顯示較低表達的啟動子序列。為了模擬將來的應(yīng)用實驗,獲得A.niger WT-1,A.niger WT-GFP,A.niger WT-PHY和A.niger WT-vector菌株的原生質(zhì)體。在A.niger WT-GFP,A.niger WT-PHY and A.niger WT-載體情況下將20ml數(shù)量補充有50mg/l phleomycin(Invitrogen)的液體選擇性再生培養(yǎng)基在培養(yǎng)皿中與100微升10E7/ml原生質(zhì)體孵育。在30℃(靜止)生長3天的周期后,在液體培養(yǎng)基表面形成菌絲體小片,將其用于總RNA分離。在Affymetrix A.niger GeneChipsTM上的cDNA合成、cDNA標記和雜交根據(jù)供應(yīng)商流程進行。隨后的表達分析得到5個下述基因,所述基因在A.niger WT-PHY菌株中的表達水平為在A.niger WT-1,A.niger WT-GFP和A.niger WT-載體中基底表達水平的至少8.5倍。為了確認所述發(fā)現(xiàn),進行Northern印跡分析。
      實施例4Northern分析 為了確認Affymetrix A.niger GeneChipsTM實驗的結(jié)果,進行Northern印跡分析。為此從A.niger菌株WT-1、WT-GFP、WT-FYT和WT-載體中分離總RNA。將RNA變性,在1%瓊脂糖凝膠上通過凝膠電泳分離,并根據(jù)制造商說明通過毛細管印跡轉(zhuǎn)移至尼龍膜(Hybond-N+,AmershamBiosciences)上。在GS Gene LinkerTM(BioRad,C3 setting,150mJoule)上將RNA紫外交聯(lián)在尼龍膜上。用于產(chǎn)生32P-標記的DNA探針的DNA使用A.niger WT-1的基因組DNA作為模板并使用表3所列引物(SEQ ID NO′s 50到59)通過PCR分離。根據(jù)供應(yīng)商說明(RadPrime DNA Labeling System,Invitrogen)將Northern印跡與隨機引物32P-標記的DNA探針雜交,所述探針代表了分泌誘導(dǎo)的基因(SEQ ID NO′s 20到24)。Northern分析到結(jié)果顯示在圖10中。Northern印跡的雜交模式證實了通過表達分析AffymetrixA.niger GeneChipsTM數(shù)據(jù)獲得的數(shù)據(jù);分泌誘導(dǎo)的基因在A.niger菌株WT-1、WT-GFP、WT-載體中低表達并在A.niger WT-PHY中高表達。
      表3用于分離用于經(jīng)32P-標記探針的DNA的引物。
      實施例5克隆GFP-BLE分泌誘導(dǎo)的報告構(gòu)建體 通過PCR構(gòu)建GFP(綠色熒光蛋白(Chalfie,M et al.,Science(1994)263(5148)802-805)和腐草霉素結(jié)合蛋白(BLE,存在于先前在WO99/32617中描述的pGBFIN-14中)的融合。使用SEQ ID NO62和SEQ ID NO63的引物組通過PCR擴增GFP片段。使用引物組SEQ ID NO64和SEQ IDNO65和pGBFIN-14作為模板通過PCR擴增BLE片段。獲得的重疊PCR片段用于使用引物SEQ ID NO62和SEQ ID NO65的融合PCR中,得到PCR融合產(chǎn)物GFP-BLE(SEQ ID NO61)。用限制性酶PacI和AscI消化GFP-BLE融合物并與經(jīng)PacI、AscI線性化的克隆載體pGBFIN-2(描述于WO99/32617和EP98/08577)連接,從而將GFP-BLE融合物置于葡萄糖淀粉酶啟動子的調(diào)控下,得到的載體pGBFINBLE-2描繪于圖11中。
      使用來自A.niger WT-1的基因組DNA作為模板和表4所示引物通過PCR分離分泌誘導(dǎo)的基因的啟動子序列。
      表4用于擴增相應(yīng)啟動子的引物概述 用限制性酶XhoI和PacI消化得到的PCR片段(SEQ ID NO′s35到39),并連接進用XhoI、PacI線性化的圖11所描述的克隆載體pGBFINBLE-2中,從而去除PgpdA-amdS并用各自的分泌誘導(dǎo)啟動子Pind代替葡萄糖淀粉酶啟動子,得到pGBFINGFPBLE-1到5。pGBFINGFPBLE-1描繪于圖12中,并代表pGBFINGFPBLE-2到5。通過XhoI和FseI消化pGBFINGFPBLE-1并隨后與XhoI、FseI線性化的圖13所描繪的A.niger表達載體pGBTOPSEL-1連接來分離各誘導(dǎo)型啟動子與GFP-BLE的融合構(gòu)建體。得到的分泌報告構(gòu)建體pGBTOPGFPBLE-1到5含有位于各分泌誘導(dǎo)型啟動子P1、P2、P3、P4、P5調(diào)控下的GFP-BLE融合物。在圖14中,pGBTOPGFPBLE-1作為pGBTOPGFPBLE-1到5的代表被描繪。在實施例6和7中使用這些載體轉(zhuǎn)化A.niger WT-1。
      實施例6過表達細胞外蛋白質(zhì)賦予表達GFP-BLE報告構(gòu)建體的A.niger腐草霉素抗性 根據(jù)材料和方法中描述的步驟進行分泌報告構(gòu)建體pGBTOPGFPBLE-1到5到A.niger WT-PHY-2中的轉(zhuǎn)化,所述A.niger WT-PHY-2過表達經(jīng)分泌的蛋白質(zhì)植酸酶。在補充有多種數(shù)量腐草霉素(0、5、10、15、20、25、30、35、40、45、50微克每毫升)作為選擇劑的選擇性再生平板上選擇轉(zhuǎn)化體。所有5個報告構(gòu)建體能夠在含腐草霉素的平板上正選擇,而負對照WT-PHY-2野生型不能在含腐草霉素的任何平板上生長。分泌報告構(gòu)建體pGBTOPGFPBLE-1到5能夠在分別有50、35、50、35、25微克每毫升腐草霉素上成長。從而說明這些構(gòu)建體的分泌誘導(dǎo)型啟動子是有功能的,并且轉(zhuǎn)化后在腐草霉素上的正選擇是可能的。
      實施例7cDNA文庫和GFP-BLE報告構(gòu)建體共轉(zhuǎn)化后選擇表達細胞外蛋白質(zhì)的A.niger克隆 使用分泌報告構(gòu)建體pGBTOPGFPBLE-1到5與經(jīng)定義的A.nigercDNA文庫組合共轉(zhuǎn)化Aspergillus niger WT-1,所述cDNA文庫編碼50個細胞外蛋白質(zhì)和50個細胞內(nèi)蛋白質(zhì)。通過菌落PCR確認共轉(zhuǎn)化事件。含分泌報告構(gòu)建體與表達文庫構(gòu)建體組合的共轉(zhuǎn)化體的孢子在補充有不同數(shù)量腐草霉素(0、5、25、50、100、175微克每毫升)的選擇性平板上生長。證明了含有分泌報告構(gòu)建體與編碼細胞外蛋白質(zhì)的文庫構(gòu)建體組合的共轉(zhuǎn)化體與含有分泌報告構(gòu)建體與編碼細胞內(nèi)蛋白質(zhì)的文庫構(gòu)建體組合的轉(zhuǎn)化體相比,腐草霉素抗性的平均提高。代表分泌敏感性啟動子P4和P5的這些結(jié)果的圖片在圖15和圖16中顯示。這些結(jié)果說明達到了至少多至20倍的腐草霉素抗性提高。
      證明了下述共轉(zhuǎn)化體制造的細胞外蛋白質(zhì)的多樣性,所述共轉(zhuǎn)化體含有包含啟動子P1或P3的分泌報告構(gòu)建體與編碼細胞外蛋白質(zhì)的文庫構(gòu)建體的組合。共轉(zhuǎn)化體在微量滴定板上個體生長,并在第6天將這些培養(yǎng)物的上清液通過E-PAGETM High-Throughput Pre-Cast Gel System(Invitrogen)和質(zhì)譜法(MALDI MS/MS)進行蛋白質(zhì)分析。
      E-PAGETM 96,6%Gels(Invitrogen)含有用于蛋白質(zhì)分離的微量滴定板格式的96個樣品區(qū)和8個標記物區(qū)。根據(jù)供應(yīng)商手冊將上清液和標記物(E-PAGETM

      預(yù)染標準(Invitrogen))上樣在凝膠上。將凝膠電泳后,根據(jù)供應(yīng)商手冊將SimplyBlueTM Safestain(Invitrogen)用于染色。E-PAGETM凝膠的掃描圖通過Invitrogen提供的E-editor程序編輯,所述程序?qū)⒌鞍踪|(zhì)樣品排列為微量滴定板格式。由具有分泌敏感啟動子P1和P3的共轉(zhuǎn)化體制造的細胞外蛋白質(zhì)展示在圖17和18中,并在表5中概述。這些結(jié)果說明,至多70%的經(jīng)分析的腐草霉素抗性菌落分泌通過E-PAGE可檢測數(shù)量的蛋白質(zhì)。根據(jù)凝膠上觀察到的蛋白質(zhì)片段的大小,評估用給定文庫轉(zhuǎn)化的菌落的多樣性。這些結(jié)果說明根據(jù)E-PAGE分析可觀察到至多35%的多樣性。
      質(zhì)譜結(jié)果描繪于表5中。至多58%的被分析為腐草霉素抗性的菌落分泌通過質(zhì)譜可檢測數(shù)量的蛋白質(zhì)。根據(jù)所檢測的肽序列的同一性評估多樣性。這些結(jié)果說明使用質(zhì)譜可觀察到至多100%的多樣性。

      表5E-PAGE和質(zhì)譜結(jié)果概述。用于分析的測定法在第一列中描述;第二列鑒定了分泌敏感的啟動子-報告子構(gòu)建體;第三列描述了由測量法分析的轉(zhuǎn)化體的數(shù)量;第四列和第五列說明了對蛋白質(zhì)分泌評分為正的菌落數(shù)量和各自的陽性百分比;第六列和第七列說明了分泌不同蛋白質(zhì)的菌落數(shù)量和各自的多樣性百分比。

      與被保藏的微生物相關(guān)的說明
      (PCT Rule 13bis)
      序列表
      <110>帝斯曼知識產(chǎn)權(quán)資產(chǎn)管理有限公司
      <120>在宿主細胞中表達克隆的改進方法
      <130>24403WO
      <160>65
      <170>XML to WIPO ST.25Converter-http://www.biomax.de/
      <210>1
      <211>168
      <212>DNA
      <213>Bacillus subtilis
      <400>1
      CGACTCAGTC CTTTCATATA CAATATGAAG TGTACCGTTT TCCGCACTTT TTCACAATTT60
      CCCATAATCT TTTCATTTTT ATCCCACAGT TTTTGTTTAT GATAAACTCA AGTCATAAAC120
      CTATCAATAT AAATAGACAT GTGAAAATAG AGAAACGGAG TGAACATG 168
      <210>2
      <211>277
      <212>DNA
      <213>Bacillus subtilis
      <400>2
      GGCTCTTCAC ATCCTTTCAA CGTCATTATA AACTAGTTTT AACATACGGC AGGCAATTTT60
      CATAATTTCA CATATTCTTT TCATTTTTAT CCCACAATGT TTGTTTATGA TATGGTTAAG120
      GGAAGAAAGG AAGAGAAAAA GAGCGAGGAA GATGTAGGAT GATCAAACAT ATTCTATTTT180
      GGTGCTTTGC TTTTCTCCTC ATTATTGGGA CAATTGAACT TGTACATGCG ATGAATATGT240
      AACGATAAAT GAATAACCGT TAAAGGAGTG TAAGAAC 277
      <210>3
      <211>26
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>3
      GTGAGCGGAT AACAATTTCA CACAGG26
      <210>4
      <211>70
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>4
      GTGGCTCAGC TTTTTTAAGG AAGGGAGGCT CTCACCTCCC TTCCCTTTAT TTGTAGAGCT60
      CATCCATGCC 70
      <210>5
      <211>27
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>5
      CGTGAGGTAC CGGCTTCTGT TTCTGCC 27
      <210>6
      <211>32
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>6
      CATCACGAAG CTTATCCATC ATGTTCACTC CG32
      <210>7
      <211>25
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>7
      GACCGGTACC TCAGGATCTT TCGCC25
      <210>8
      <211>35
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>8
      GGCCATCAAG CTTATAATCC ATGTTCTTAC ACTCC 35
      <210>9
      <211>20
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>9
      GAAAGATTGT TTCAGAAGC 20
      <210>10
      <211>40
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>10
      ACAGCGTTGG GATCCAAGCC CTTCCATTTT GGACATTTGG 40
      <210>11
      <211>40
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>11
      GGGCTTGGAT CCCAACGCTG TCGACGTTGT AAAACGACGG 40
      <210>12
      <211>42
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>12
      CGCATAGCTT TCCGGTCGCC GCAGCTATGA CCATGATTAC GC42
      <210>13
      <211>22
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>13
      GATGATTCGT CTTTTTGTAG TG 22
      <210>14
      <211>21
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>14
      CGATCAACAT ATGTGTTCAC G21
      <210>15
      <211>1050
      <212>DNA
      <213>Aspergillus niger
      <400>15
      ATAATGTAGG CGACAAAGTA GCCGGGCATG CGACCGGAGG ACTCGGTCAG AGGCACGAAT60
      ATGAGAGGCC AGAACGCCGC ACCCATGTTC CAAGATGTTG TGGCCCAGTA AAGGTTAGGA120
      AATGGGGTGT TTTGAACGTG GAATCGTTCT TCCATCCAGT TGTTGCCGGA GCCGTAGGAA180
      CCGGCCGGGA TACCAGTGAG GATGGAACTA TACCTATTAG CACTGCCATC TTCGAGAACA240
      AGGCTAAGAC ATACATGAAA CAAACGGTGA CCGTGAGAAG CCATTTATAA GAGGTGCTCC300
      AATTGAACCT GAATATGTTA AAACTAGTAT ACTAGCAACT GCATGCTTGA CGTACGGATT360
      GTCCGGGTCA TCCTTGCCGT TCCAGGTATG GATCTCAAGG TCCTCCCTGT CACGCAGATC420
      ATTGTGGCTG ACTACCCCGA CATGGGGGTC CCGGCGAAAG AACGACCGCA CCCTGCAACG480
      TCACTTAGTG GCTGTCTGAC AGGGATTGAT TGGCAATGAT TGGCAGACTA ACCGTCCCAG540
      AAACGAATCA TCGAACTCAT TGGTGTGCAC TGTGCTAGCG CGGCGCAGCG ACGGGCGTGG600
      CTCCTCGGCA GGGGTGGACA TGACTTTCTC TGTGTAGATT CCTTGCAAGG TATCTGCTTG660
      ACAGATGCAG AGATGATGTT GAGTAAAATA GGGTGCAGAG ACCCTGCAGA ACCTGCATCG720
      GCCGGCGGCG ACATGTCGTC ATGACCGACC CGGGCCGAGC GGAATTAATG AAACTCGGAA780
      CAGCCAGGGG AATCCGACGC TTTGAGTGGC CAATCCATGT CTATCCACAT CTGCATTGAA840
      GTGGATGAAA GGTGGAGGAG GGCTGGTTGC CAAATTCTGT TAGGGCTTGG AATGTAAGCA900
      ACCGGTTTCG GTCATGACAT CATCACAGCG ATGACTTCAT CACTCTCGGA CGAGCATATA960
      TAGTTGTGCC TGTCGTCGTA TCTCAACAAA CATCAACAAC AACAACAATC ATCTACTGCA1020
      TTTACCAAAC TCATCTCTAC CTCAATCAAC 1050
      <210>16
      <211>1032
      <212>DNA
      <213>Aspergillus niger
      <400>16
      TTCTCACAAG CAAATCCGAG AAACGCAATT GACCATATGT CCTTAGTATG AGGGCTAGCA60
      GGAATACTTG TTTGTCGATG CATACCGACT AATAAAAATG GTTCTTCTTT TTCGCGCAGG120
      GATTTGGTTT TTCATTTTTC ATTTTTCATA TTTTATGTTA TTTTATTTTA TTTTTTTGTT180
      TTATTTTATT TTATTTTTTT TTTTTAAATA AGACTGGGTG TTTTCGTCTC CCACCCCTGC240
      TGAGGAACTG TTTGATATAC AGAAGCCTGA GATACTTGAG ATTATGTGAC AAAGAAATTG300
      TAAACCTGAA TGTGACTAAG GCAGAAGAGA GCAGGTGAGG CCACACAATA CTGTACACCC360
      ACTTCCGATC GTCATCGAAA TGAGCGTTGT GGGTACTGGA ACGACAAACC ATAGATCGGA420
      TCTGCATCCG AATAGGCTTT ACTTTGTACA TTGGTAGGAG TTTGAATGTT TGAAGATCCG480
      GCAGATGATC ACCTGCTGCA GGGAATAATT TGAAACCTGT CCGTCTGCTT TGACCCAATT540
      GACGAGGTAC GTGATTTGAT GCTACCCAAG CAGTATGAAT GCGACGGAGG TGGCTATCCT600
      TACCTTGTCA TATGCAACTC ATAACGGGTA GTCCCCATGG AGCCACGGCT ATTTATTTCT660
      AAGGGCCAAC AGTGAAAGAT TGTGAGATCG TATACCTCCT GGGTATGACG CAACCAGGGT720
      GAGCACTGGC ATTGCTCCAA TCCATATGGT GGAGGTATGT CTCCGAGACC ATGACGCATG780
      TAGACCCTGA CCTGTCCCTG ATCCAGGGAT CTGGTTTGTC ACTTGGCGTA TTTTAATTAA840
      CTGCGGGTCA GGGTCTTGCC GTCCAGACCC AATGGATGAA TTGCCTGCGT GGCCCTGCAG900
      TTCCAGCGAT CGGCACGGCA CGGCTATGAC GTCGGTGGGT GTTCCGTTTG ATATTTAACC960
      ATAGAAGACA GCCTTGTTAT GCTGGTTCCT GCCGCAAAAT AAAGGTCTAT CCTTACCACG1020
      TTAAGTGTCA AA1032
      <210>17
      <211>1035
      <212>DNA
      <213>Aspergillus niger
      <400>17
      TGGTGCCTGT GAACGAGGTC ACCACTGATA AATTGTCTGG ATCCGTAACG TCTGTATCAG60
      TGGATGGTAC TGAAAAGTTC CAAAGATTGA GGGCAGCATA TGTAGCACAT GGTGGTAGCT120
      CTAAGTGGTT CGAAACTTCG ATGAATGGGC GTGATATACA GGGGGGTAGC ACCTGTATAG180
      TTGATGTCAG CGAAGGCACG GGCCATGCAG TGATAGACAA GAAAAGAGGG ATTGAATAAA240
      AGACTCGATT CTGAAGGGGA GTAATACATC TTTCGGCTTC TCACCACCCC AGATGTAGGC300
      GTGTGTAAGG TAAGCAAGCA CAACATATGC TCTCCGCCAC TCAGGTTCCC CCTTCAACTT360
      CTTCGTAGAG AGTATACCCA GGTCATCGAC AGACCTCCTG ATAGTACCAG ACTGAATCAG420
      GCCAGGCAAG TCCTGAGCGA TTTCCTCCCA CGGGGAATAG TAAGGGTCTT CCAATCTCCG480
      TACGGGAGGA ACTTCCGGGA GGAACCCGTT CTGGAGGGAG ACACCGTACG CAACAAGTGA540
      AATGTCTTGT GTATAAAGCA TGATAATATA TGCACTTCAG TAGACAACTT GATATTCAAG600
      CCTCCTTGAA ATGATCCTCA TGCAGGTAAG AGTAGATCCA AGTGTTTATA TTGTATTCCC660
      AAGGAGGGAC GGAAGAAAAC CGGATCCAGA GGGCTCGAGA TAGGGCCACC TGCATGAGCA720
      AAGACGGGTC ATTTCCCGTT TCACAACGAC CATTCTCAGG CAGAAAGGCA GTGGATTAGC780
      GGAAAACTTA GCAACCATCC GGATTTCTGG AGTGGATGCT TTGTTATCTC ACTTCCGGCA840
      ACACGGATGG TGAGGCGGAA GCGGAACGGT ATCCGGATCC GGAGGGAGGG ACAAACCGAA900
      GTGCCTTGTG TCACACGCCG GTCCATATAT AAATGTTAAT TGGTGACGGT CAGCGGATTG960
      TTTCTGGTGT TCATCCATTT TTTCTTGATA TCCTGGACCC AGTTATTGCA CTTTAATTAC1020
      TATCCAAAAT CCACA 1035
      <210>18
      <211>1071
      <212>DNA
      <213>Aspergillus niger
      <400>18
      GTCCACACTC TAATTGGGAT GAGCATTGCC TTTCAGGAAC TTGACTTTTT GTGGTTGCAT60
      CTTTTGTTGC CTTACCCACG CAGGCTTCGT TTATGAGATA GCGATTTCAG GCCTCAAATT120
      GCTGTCATCA CTTCCGGCCC CAAACTCGTG GGCGGTGCCC GCCCATCGCT GGCAAGAAGC180
      ACAGACTAAC GCCTTACTTC GCCTAGTTGC ACACGATGCA TCAAGACTTC CTCCTATTTC240
      ACAACGACCA GCTCCTTGCC ATTTGTTGTT TCGAATGCCC CCTTCCCCGT GCCTTGCATT300
      TCTAATTCCC ATCTATACCC TTTTGCGCTC TCACGCCCGC CTGACTATCA ATTTTTCTGC360
      CAGCATAACC CTGCGTGCAG AGCGGTTGAC AGCAGGCTTG CTAAGAGTCT TCGTCTAGAA420
      GAACTGTCTG GGTGGATTCC TTTTCGGATT AACTTTTGCT ATTTTAAAAG CTGATTGCAC480
      TACGGAGTAC ACCCGCAATC TGATTCTCAC TGATACTCCA ATTAAAGGCC ACTAATTGCT540
      GACATTTGTA ACATATTTGC GTTTGCTTTC CGGTTGAAAT TGGCGGCTTT GTGCTTTCGA600
      TCGCTAGCAG TCTCTGTGCA TGTACAACTG ATCGGCTATT CAGTCCTATT CGGAAGCGGC660
      ACTGAGAGGC GGAGACAAGC CACAGATACG ACGAGTCTGA TTTTGAGACG GGCGCATCCA720
      ACGAAAGCCT GCGATTGCAA TTGAAGATCT CAATTGGGGG ACTGACAACC TAATACCTAA780
      ACATATCGAG GATTAGGCGC CAACACGAGC ATGGGAAGCT TTGGTGCATG CGACGGCTGA840
      TCCATTTCTA ACAACCGTTT TGCGCGCGCG TCCGAGGTAA GGCTCCCGAT CCCTTGGCGC900
      TTTGCATGTT TCACTCCGAT GCATCTACTG TTTATATGAG TGCGGTGGGC AAGCTGTGCC960
      CACCGACTGA GCATTCTCAA CCGGCCCAAT GCTGTGGGAT CGATCCTCCC CTCCAAAGTT1020
      GTCGCTCGGT TACACTTGAT CGGAGCTTGT TCTGTTATAC ACCAAACCAT C 1071
      <210>19
      <211>1116
      <212>DNA
      <213>Aspergillus niger
      <400>19
      GCCTTTGGAG AATGTAATAT CCCTTGATCA CCCCAGACTC ACATCCAGAT TCTGACTGAC60
      CTCGTGCATA GCCATATTTA ACTTGGTCCC TGATGATCAA AACAGTACAT GGAACTGGGG120
      CCGAACATTT CCCTAGCCAA AGGAGCATCA GGGATTCAAC GTGATCAGTA CAGCCTTGTA180
      GCTCGCTGAA ACTGCCCTGG AGCCAAGCCA AAGCCTAGAC AGCAAGGTGC ATGGGCGAGC240
      TTTGCGAGGA TTTAGTTGTT ATTTAGTATG CCAAGATTAA GCCACGCAGA ATGGCTTATG300
      GCCATAGTAG CAACAACGGC CACGGAACGT TCTTCCATGT GGTATGGGGA AAGCCGCCGG360
      ATATTTGGGG AGGGCGTGAT TGTTCCGGTG GCTATCTTTC CGGTGGAGAT AACGGCGGTG420
      GACCATCAAA ACTCCTCAGC CCGGATTGCT CGGACTCCGC ATCGTCAAGT ATCGGTTTCA480
      TGACAGCCAT TCGACTACTT AGAAGACACA AATAGCTATC CAACTTACCC GGACCTTTGA540
      TAATAATTTT CAGCAGATCT GTCGATCTCA GAGACAATAA TGCCACCGTT CTGTGTGGAA600
      GGCACTGCGC CGTGGTTTAA CAATAATAAA ACTCCAAATT GCCCAAAAGC TAGAGCGAAG660
      GAAAGTCGAG AAGCCCAGTC TAGACTGGCG GGCTGATCGT CCGGTTCACA ACCTGATTGA720
      CAAATCATCT GTGACCCTCG ATGTTCCGCG GCGTTGAGCG GGTGAGAATG TGGATCCTAG780
      TGGGGAAGAC CCAATTGCCG CCGGAAAAGG TGAGCTTGTG CTGCACATGT CCGGTGGCTC840
      AATTCAGGGC CATGCCAGGA CATTGCTCTT CAAAGGGATG CGATTGCTAT TCCCTATTTA900
      CTTCTTTAAC CCGCTGACGG GCCTGTCTGG ACCGAGAATT CTTGGTCAAG TTTCAGTGGA960
      GCGATCCAGG AAAGAACATC CGATATGGAC AGTTGCCCTC GATCTCAGGT CTGTAGTCGT1020
      GTGACACAGA GGCCTCTACT CGCTTGCCTT GCATGTCGGA GCTCAAAGGT GCGATGTGAA1080
      TTAACACGAG GAGCGACTGT CTGTCGCAGA TGCAAC 1116
      <210>20
      <211>3191
      <212>DNA
      <213>Aspergillus niger
      <400>20
      GGAGTTACGT CCCAGAGATG CTGCGGACAA TGCCGATGCG GCATACTTCT CATACGCATC60
      CGTCAAGTAA TTCACAACAG CCATGTAGAT ACTGTAGATG CCAATACCGG TAGCCCCGAT120
      GCCGAGGGTC GGGACAATCC AAGGCACAGA AGGAAAACTG GCCCAACCAT ACCAGAACAG180
      CCCGCCTGCG AACAGCAAGC TGCCAATGAT ACTAGTATAC AGACGGGCCT CCGGGATGGG240
      TTTCCCGGGC TTCTCTTTGT TGCGTTTCGC CGACCGCAAA TACAGCATAT CCTGAAGAGG300
      ATTGACGAGA GTACCGATTA GAGCACCCAC GGAGATGGCC AATTGAATGC ACCCAGTTTG360
      CAAAGTATTC ATGCCGTAGT TGGTGGAGAA GGTCTGAACG ACACTGCTGA AGAAGAGATA420
      CAGGATACCC CAGGCGAAAG AGATCCAGAG GGTGAAGAAG GCAACGACGG GCTCGGTGAG480
      GAGCATTCGT GTGGGCCGTT CGAAGGAGAT CTGCATCAGA CGCCAGACGC TGGTGTTGTC540
      TAGCTCGGCT TCGGCGTAGA TGGGGCGCTG CTTTTCTTTG CGGAGCTTCT TGGCCCGACG600
      GGTGAGGATC ACGTCCGCGC GGGTTTCGTA CAGGATGAAC CAGAAGATGG GTAGGAGCCC660
      TGTTAGATAG ATAATTTGGA TGTAGAAGAT CCAGCGCCAC GGGGCGGTTT TGTGGATGGC720
      TACGATGGCG GATCCGATGA ATGGGCCCAG GGCAATTCCA ACCACACTGG TAAAACCGAA780
      GAGCGACATA GGGAGACTCC TCGCTTTGTC ACCATACCAG ACATCACTGA TGCTACCGCC840
      GACGATGTTG ATCGATACGG AGGACGCACC ACCACCGAAG AAACGCGTCA CTACGAGAGT900
      AGCGTAGTTT TGGGCGAAGG CGGAGGGGAA TAGCGAGATG ATGAGAATAA TGTAGGCGAC960
      AAAGTAGCCG GGCATGCGAC CGGAGGACTC GGTCAGAGGC ACGAATATGA GAGGCCAGAA1020
      CGCCGCACCC ATGTTCCAAG ATGTTGTGGC CCAGTAAAGG TTAGGAAATG GGGTGTTTTG1080
      AACGTGGAAT CGTTCTTCCA TCCAGTTGTT GCCGGAGCCG TAGGAACCGG CCGGGATACC1140
      AGTGAGGATG GAACTATACC TATTAGCACT GCCATCTTCG AGAACAAGGC TAAGACATAC1200
      ATGAAACAAA CGGTGACCGT GAGAAGCCAT TTATAAGAGG TGCTCCAATT GAACCTGAAT1260
      ATGTTAAAAC TAGTATACTA GCAACTGCAT GCTTGACGTA CGGATTGTCC GGGTCATCCT1320
      TGCCGTTCCA GGTATGGATC TCAAGGTCCT CCCTGTCACG CAGATCATTG TGGCTGACTA1380
      CCCCGACATG GGGGTCCCGG CGAAAGAACG ACCGCACCCT GCAACGTCAC TTAGTGGCTG1440
      TCTGACAGGG ATTGATTGGC AATGATTGGC AGACTAACCG TCCCAGAAAC GAATCATCGA1500
      ACTCATTGGT GTGCACTGTG CTAGCGCGGC GCAGCGACGG GCGTGGCTCC TCGGCAGGGG1560
      TGGACATGAC TTTCTCTGTG TAGATTCCTT GCAAGGTATC TGCTTGACAG ATGCAGAGAT1620
      GATGTTGAGT AAAATAGGGT GCAGAGACCC TGCAGAACCT GCATCGGCCG GCGGCGACAT1680
      GTCGTCATGA CCGACCCGGG CCGAGCGGAA TTAATGAAAC TCGGAACAGC CAGGGGAATC1740
      CGACGCTTTG AGTGGCCAAT CCATGTCTAT CCACATCTGC ATTGAAGTGG ATGAAAGGTG1800
      GAGGAGGGCT GGTTGCCAAA TTCTGTTAGG GCTTGGAATG TAAGCAACCG GTTTCGGTCA1860
      TGACATCATC ACAGCGATGA CTTCATCACT CTCGGACGAG CATATATAGT TGTGCCTGTC1920
      GTCGTATCTC AACAAACATC AACAACAACA ACAATCATCT ACTGCATTTA CCAAACTCAT1980
      CTCTACCTCA ATCAACATGC CTATCTCCAT TCCCTCCGCC TCCAGCGTCC ACGACCTCTT2040
      CAGCCTGAAG GGCAAGGTCG TCGTTATCAC CGGCGCTTCC GGCCCTCGCG GCATGGGCAT2100
      TGAAGCCGCG CGTGGCTGCG CCGAAATGGG CGCCAACATC GCCCTCACCT ACTCCTCTCG2160
      TCCTCAGGGT GGTGAGAAGA ACGCCGAAGA ACTTCGCAAC ACCTACGGCG TCAAGGCCAA2220
      GGCCTACCAG TGCAACGTGG GCGACTGGAA CAGCGTCAAG AAGCTCGTGG ACGACGTGCT2280
      GGCCGAGTTT GGCCAGATTG ACGCCTTCAT TGCCAACGCT GGCAAGACAG CCAGCAGTGG2340
      TATCCTGGAT GGTTCCGTTG AGGACTGGGA AGAGGTCATC CAGACAGACC TGACGGGTAC2400
      CTTCCACTGC GCCAAGGCGG TGGGCCCGCA CTTCAAGCAG CGCGGAACGG GCAGCTTCAT2460
      CATCACCTCC AGCATGTCGG GTCACATTGC CAACTTCCCG CAGGAGCAGA CGTCGTACAA2520
      CGTTGCCAAG GCAGGCTGCA TCCATATGGC CCGGTCATTG GCCAACGAGT GGAGGGACTT2580
      TGCCCGCGTG AACAGCATCT CCCCGGGTTA CATCGACACG GGGCTGTCGG ACTTTGTGGA2640
      TAAGAAGACT CAGGATCTGT GGATGTCGAT GATCCCCATG GGACGCAACG GTGATGCCAA2700
      GGAGCTGAAG GGTGCATATG TCTATCTCGC CAGTGATGCC AGCACATACA CGACGGGTGC2760
      CGATTTGGTC ATTGACGGAG GATACACCGT GCGGTAAATT ATCATCCGCG GTCGGATAGA2820
      AAATAATGTT TATGACATGT ATGTAATGAA TATGAATGTT CAACAATAGT CTTCAATTCT2880
      TCACTTGCTA GTATCCTGAG TATCTTGTCG TATAGCTCAA CAACCTGGCA TGGCCGGGCG2940
      CGCAGTGTAG CTCTCCCAAG TCTATGGATA CAACTTGCGT CAGTGTGGAT CTTTGGCTCA3000
      GATTCGGAGG GGCAGTGGGG TAAACAAGAA CACGCAGCCA CTCTCGGCTT TGCGGATCCC3060
      CACGGAACGC CAGTCAACCC TGAAGATTCA GTCCGGGCCT GGGCTCGGAC TGATTTGGTG3120
      AGGGGATTCT GCATCCGTCC AAACCTTATC ATCGTTGGTG AGACGGACTC CGGACAGCCA3180
      GGAGCCTTAT T 3191
      <210>21
      <211>4031
      <212>DNA
      <213>Aspergillus niger
      <400>21
      GGGGTCAAAG GACACAATGT CGAAATAGCG AGATTGCTGT GCATCATCGG GGCTGTCTAC60
      AGTCCGCTGG ATTTCTTTCC CTCGGTTAAG TATTTCCTGC ACGCCGGACC CGCCAGGGCC120
      ACCTGTATTC CTAGTAAGCG ACCGTGGTGG GGTGACAGAA TGGTGGCGGT GGTGGCATTG180
      CTGCCTATAC CTGGGTTCAC GATTATGGAG CCACCGTAAC GCTCGTCGGC AGGATCTACC240
      TGTGCAGGCA GTTTTATGAC GGCCAGGGCA GCCGTTTTAT TTTCAATGGC ACTAGCTGAC300
      CAGTCTAGGG GAACTTCGAG ACGTGCACAT AGATAGTCCT GGTAGCAGGG GATGAAATTT360
      AGTGCTGAGC CTGGCGCAGT CTGGTAGGAG CGGGTTAGAC TGTGAGAAAT TATAATAGGG420
      CGGATGAGAT CAGTACGCTA CTCCAGGAGA AGTCCCCGGC TTGCACCGCA GACGGCATCA480
      TGGGTTGGTG TCGCAGGGAG GAGGGTGAGT TGAGTAAGAG AGAATTAATG AAAAGGATGG540
      AGTAGCCGAC CATATAAGTA CTGGATGAAG TGAGCGAGTT AGCGTCAGCC ACGACGGGCT600
      GACATGCATG ATCGGGGCAC CGCCGGCAAC CGATACAGCC TCAGCTCGAC GGGAAAACGT660
      GGTTACCTGG ACTTAGAAGA TGATAATACA ATGAAAAGAT AGCGTAGATT GCCATAAATA720
      CGCCACAATC TATTTATTAG GCAACAATCA AGTAAGAGCA GATTTGGCGA CTCATAGTAG780
      TCCCCATGGA GGGGCGCGAT GGTTTTCTTC GCCGAAATAA TCGCTTAATG CCTCTAACGA840
      AGATCTCAGA ACCTCCAAAC TGTAGTATTC TTCTCACAAG CAAATCCGAG AAACGCAATT900
      GACCATATGT CCTTAGTATG AGGGCTAGCA GGAATACTTG TTTGTCGATG CATACCGACT960
      AATAAAAATG GTTCTTCTTT TTCGCGCAGG GATTTGGTTT TTCATTTTTC ATTTTTCATA1020
      TTTTATGTTA TTTTATTTTA TTTTTTTGTT TTATTTTATT TTATTTTTTT TTTTTAAATA1080
      AGACTGGGTG TTTTCGTCTC CCACCCCTGC TGAGGAACTG TTTGATATAC AGAAGCCTGA 1140
      GATACTTGAG ATTATGTGAC AAAGAAATTG TAAACCTGAA TGTGACTAAG GCAGAAGAGA1200
      GCAGGTGAGG CCACACAATA CTGTACACCC ACTTCCGATC GTCATCGAAA TGAGCGTTGT1260
      GGGTACTGGA ACGACAAACC ATAGATCGGA TCTGCATCCG AATAGGCTTT ACTTTGTACA1320
      TTGGTAGGAG TTTGAATGTT TGAAGATCCG GCAGATGATC ACCTGCTGCA GGGAATAATT1380
      TGAAACCTGT CCGTCTGCTT TGACCCAATT GACGAGGTAC GTGATTTGAT GCTACCCAAG1440
      CAGTATGAAT GCGACGGAGG TGGCTATCCT TACCTTGTCA TATGCAACTC ATAACGGGTA1500
      GTCCCCATGG AGCCACGGCT ATTTATTTCT AAGGGCCAAC AGTGAAAGAT TGTGAGATCG1560
      TATACCTCCT GGGTATGACG CAACCAGGGT GAGCACTGGC ATTGCTCCAA TCCATATGGT1620
      GGAGGTATGT CTCCGAGACC ATGACGCATG TAGACCCTGA CCTGTCCCTG ATCCAGGGAT1680
      CTGGTTTGTC ACTTGGCGTA TTTTAATTAA CTGCGGGTCA GGGTCTTGCC GTCCAGACCC1740
      AATGGATGAA TTGCCTGCGT GGCCCTGCAG TTCCAGCGAT CGGCACGGCA CGGCTATGAC1800
      GTCGGTGGGT GTTCCGTTTG ATATTTAACC ATAGAAGACA GCCTTGTTAT GCTGGTTCCT1860
      GCCGCAAAAT AAAGGTCTAT CCTTACCACG TTAAGTGTCA AAATGAGTGG GGTAAGCTTT1920
      GCCCGTCAGG CCTTACTCCA GGCTGCTCTT CTTTCGATTG TCTCCGCAAT CCCGGCGCCC1980
      ACGGCCTTCG TCAACAATGT CGCTCCGCCC GAGCCCATCA TCACCCCTTC GCCGGTTCAA2040
      CATCGACCTT CTCGAGTCGC TGGTCGAAAC ATTCTGAGTG ACGTCGATTC TGATATTAAC2100
      AGCATCCTTT CTGGCCTTGG ATCCGACCTA CCCTCCTGGG TCGCATCGGG TGTGCCCAAC2160
      TACTTCCAGG GTTTCCCTAC TGGGGATGCA GTGGTGAGCT CCTTGGGCTT GAACAGCGCT2220
      GAGTTGGCAG CCTTGCCCAC CAATGTCTTG AATATCGACC CATATGCCAA CTGGACTAGC2280
      TCTGGCTGGA ACGTTCGCTT CCACGGAAAC GTCTACAAGC AGCCCAACAC CTCCATCTCC2340
      GACCTCAATG ATTTGGCTGA TGTTTTCCTC GGCAATACAA GCATCTCCGA CCTTTCCGAA2400
      TCCGAGCAGA AACAGGCTCG GAATTTAACA GCGGAAATAT TAGTGGTCCA GCAAGCTCAC2460
      GTCGCCGTAA ACACAATCCA CCTGGAGCCT GCACCGAGTC AGGGATCCAG CGGACAGTCA2520
      GGCGGCGGTG GATCCTCTAA TACCACTGGC GGCACCCAAG ACCTCACTCT GCCCTACAAC2580
      ACTACAGTTG AAGGCGATTT TGACACTTTC GTACCGATTA GCAGCAATGG CTTGACGGCA2640
      GGTAATGAAA CTTCGGCGAT ACAACGGCTT AACGTCCATG TGGAGGGCGC GACAATAGGA2700
      AACAGTACTG CCTATCTCGT ACCTCCGACC GGGCTCACTG TCGTTTCGGA CATCGATGAT2760
      ATCCTACGCG TCACCAAAAT CTATGAACCA GAGCAAGGTT TACTCAACTC ATTTGCGCGC2820
      CCCTTCAGGC CGTGGGAGAA TATGCCGGAC ATCTATCGCA ACTGGTCGAT CAGTCTCCCC2880
      AACCTGCACT TTCACTACCT AGTAAGTCTG CTAGATGTCC CTGATTGCAT TGTTGCTGCA2940
      TACTCACCAC TACACTACAG ACGACGACCC CCGAACAAGT CACCAGGAAC TACATGCAAT3000
      TCATCTACGA CAACTACCCC GGTGGATCTT TCGACACCCG TCCCCTCAAC TTTAGCGACG3060
      TTTCCGCCAC CTTGTCGATC CGGAAATTCC TCCTGCAAAA GGTCTTCGAG ACCTTTCCGC3120
      AGCGCAAGTT CATCCTCATC GCCGACACCA GCAACAGCGA CGTCATGCGT GACTATCCTG3180
      AAATGGCGAC CGACTTCCCT GGTCAAGTGC AATGTATTTT TCTCCGGAAC ACCAGCGCCA3240
      CCGACTCAGG GGACAAATTC CCATACGATA CCTCTGGGTT TAAGAAGCTC AATCAGTCAA3300
      ACTACATGTT CTTCTTGCAT CCCGATGACT TGACGAATCT AGACATCGCG AATGGCCAGT3360
      GTTACAACAC ATCCATTCCG CAGAATTTAA CGTTTAGTTA TCAGGGTTTG CCATTGGGGC3420
      TGGGTGATGA ACCCACAGCT GTCAATGGGT CTGCCAATCA TACTGCTGAG TCGGCGGCCG3480
      GTTTGTCGGT AAAGGGTGGG ACTGATATGC AGGGTTTGAT CTTTCTGTTC ACCCTGGTTA3540
      CGGCCTATTC CATTTTCTTG TAAATATCAG TTACGATGTA TGAGAGATAA CGACTTTGAT3600
      ATACTCACGG CTCAATTTAC GTTCCAAAAC CGAATACAGC GGATATCTAT GCTCGATGCA3660
      AGGACTACCA CTATGTTACA CTACTAAGGG TTTATCTACT ATGGGAAATA TTAGTGCTTG3720
      GTTTGTTACA GCTCACTCGA GCTTGCGTTA CTAACCACTT TTATCGGTCC ATGGATCCAC3780
      CGCCCAACGC AGTTATCCCA GGAGGTGGCC GCAATGGCCA GTCAAGTCAA TTAAATCTCC3840
      TCTGCTAGGA ATTGCATGGG TTTTGACAGA CAGAACTCGG GGAAAGTATC GATATTCAAT3900
      GATCTGACGG TGGCTCCGAA ATTCGCTAGG CTAGCCCTTC ATCACTAGTA ATATTAGTTG3960
      TCCAACTTTC GCGCTTTACA CTTTCCATAG CAAACCCCCA ATTCCCAGCC AAATCCTCAT4020
      ATCCTCTAGG A 4031
      <210>22
      <211>3771
      <212>DNA
      <213>Aspergillus niger
      <400>22
      GCTTCTATGG TATCAAGGGT CGCGTAGCCA AAAGTTTAAC TGCATCGCTG CGGTATTAGT60
      CGGTGTAGCT GGCTGCAGCT TTCGTTGTGT CCCTGGTCTG TTTAAGAAAC GGTATCAGAT120
      CTGTCCCGCC CGTCCCCCTG ACACCGGCAT TGAGTTTCTC ATGAGAATTG TCCACTATTG180
      TCGACGTTGT TGTGGCTAGG TTTGTTCTCG AAGATACTTG GTTTGGCGGC GGAGTCCTTG240
      CAGCCATGAT GATGTATCGA GTCACCATCC GCACATGCTT ATCGCGAAAT CCCCCAAGTG300
      ACATAACCGC CATGTTATAT GCATCCCTCA AAGCAGATCC GGGCTTGTGA CTTAATACAT360
      AGGATCTCAC ATTAGACGTG CGGAGCATCA TTTCCAAGAA GCGTCGGTGA GGGCCTGGCA420
      TGTAGTTTCG CATGTTCTTG AATATACAGT CAGTATCGAC ATTGCTTTGT CTGGATAACT480
      CCTCGAAGAT CAGTCCTTAC CTGCATAAAA CCAGTCATGA CTTGAGGATT CGACTTGCCG540
      TGAGGCTTGG TCTCCCCAGT GGCCGAATGT TCCACACCCA AGAAAATGTC GAAGGCTTGG600
      ATCAGAGAAC TTTGAGCATT GCTACCACCA CTGTATTGAT GCCATTCGCC TCGTCCTTCC660
      CCAACATCAT AGAATACGCC GTTTGGCAGC CCGGCCGATG CCATGTTCTT GCTGCCGGCT720
      AGGTATGGAC GTAATTGATG GTAAAAGACG GGCGGCGCAC ACTTTTCATA CATGCGTTCC780
      AAGAGGTCAC CGAGTTCCTT GAGACCATAA TTGAGCTGCT CCAGACGAGA AATAACACGC840
      TGGCTATCAT CAACATTAGC TGCATGCATA GCATCCAGCA TTAGCTCGAT GAGCTGTGCT900
      CCCTTGGCCT CGATAGCGAC GGAGAGGACG AAAAACCATT CTTCGTCTTT GGTGCCTGTG960
      AACGAGGTCA CCACTGATAA ATTGTCTGGA TCCGTAACGT CTGTATCAGT GGATGGTACT1020
      GAAAAGTTCC AAAGATTGAG GGCAGCATAT GTAGCACATG GTGGTAGCTC TAAGTGGTTC1080
      GAAACTTCGA TGAATGGGCG TGATATACAG GGGGGTAGCA CCTGTATAGT TGATGTCAGC1140
      GAAGGCACGG GCCATGCAGT GATAGACAAG AAAAGAGGGA TTGAATAAAA GACTCGATTC1200
      TGAAGGGGAG TAATACATCT TTCGGCTTCT CACCACCCCA GATGTAGGCG TGTGTAAGGT1260
      AAGCAAGCAC AACATATGCT CTCCGCCACT CAGGTTCCCC CTTCAACTTC TTCGTAGAGA1320
      GTATACCCAG GTCATCGACA GACCTCCTGA TAGTACCAGA CTGAATCAGG CCAGGCAAGT1380
      CCTGAGCGAT TTCCTCCCAC GGGGAATAGT AAGGGTCTTC CAATCTCCGT ACGGGAGGAA1440
      CTTCCGGGAG GAACCCGTTC TGGAGGGAGA CACCGTACGC AACAAGTGAA ATGTCTTGTG1500
      TATAAAGCAT GATAATATAT GCACTTCAGT AGACAACTTG ATATTCAAGC CTCCTTGAAA1560
      TGATCCTCAT GCAGGTAAGA GTAGATCCAA GTGTTTATAT TGTATTCCCA AGGAGGGACG1620
      GAAGAAAACC GGATCCAGAG GGCTCGAGAT AGGGCCACCT GCATGAGCAA AGACGGGTCA1680
      TTTCCCGTTT CACAACGACC ATTCTCAGGC AGAAAGGCAG TGGATTAGCG GAAAACTTAG1740
      CAACCATCCG GATTTCTGGA GTGGATGCTT TGTTATCTCA CTTCCGGCAA CACGGATGGT1800
      GAGGCGGAAG CGGAACGGTA TCCGGATCCG GAGGGAGGGA CAAACCGAAG TGCCTTGTGT1860
      CACACGCCGG TCCATATATA AATGTTAATT GGTGACGGTC AGCGGATTGT TTCTGGTGTT1920
      CATCCATTTT TTCTTGATAT CCTGGACCCA GTTATTGCAC TTTAATTACT ATCCAAAATC1980
      CACAATGTCG AAGTCGAATG GCGTCAGCCT GGCATTCCCC GCCGAAGCAG CGACAAAGGA2040
      ATATGCAGCA TCTCTAGACT CTTCTGATAG ACTTGCTGCA TTTCGGGAGA AGTTCATCGT2100
      CCCATCGAAA GCAAATATTG CTTCCAAAAA GCTAGCAAAG CCTGGTGGGT TCCATCCTGG2160
      CAACTGTAGA CCTCGTCACT AATGTCACAG GCCTTTCGCC CGAGTCATGC ATTTACTTCT2220
      GCGGTAACTC ACTTGGCATT CAACCCAAGG CCACAGCAAA GTACTTAGAA GCACAGTTGG2280
      ACACTTGGTC ATCTATTGGA GTTGGCGGCC ACTTCACTGA TCTTGAGGGC TCACCCTTGA2340
      AGCAATGGCA GCTGCTCTCA GAGCAAGCAG CTGATTCAAT GAGCAAGATT GTGGGAGCAA2400
      AGCCAGAAGA AGTCGCAGCG ATGGGAACAC TTACAACGAA CCTTCATCTT CTGCTGGCTA2460
      GTTTCTATAA ACCGACTCAA ACAAAGCACA AGATCTTGAT GGATTGGAAG GCTTTCCCAA2520
      GTGATCACGT AAGTTCGAAA GAAGCTGCCT TCTGCTATCA CGGCACTGAC GATTATATAG2580
      TACGCTATCG AATCTCATAT TGCCTGGCAT GACCTGGATC CTAAGGAGTC TATGGTGCTC2640
      ATCGGTCCAG ATGAAGGCGA ATACGAGATA TCCACCCAGA AGATTTTCTC TTATATCGAC2700
      AAGCATGCTG ATGAGGCTGC TATGATTCTT CTTCCTGGTA TTCAATATTA TACTGGGCAA2760
      CTGTTCGATA TCCAGAAAAT TACAAAATAT GCCCATTCGC GCAACATGGT TGTTGGCTGG2820
      GATCTGGCCC ATGCGTTCGC TAATGTTGAG CTAAAGCTGC ATGATTGGAA CGTTGATTTT2880
      GCAGCATGGT GCACATATAA GTACGGAAAC GCCGGTCCTG GAGCAATGGG GGGGCTTTTC2940
      GTGCATGAAC AACACGGAGA GGTCGATTAC AGCGCGGGAG AAGATGCACC CAAATTCCGC3000
      CATCGTCTGA CCGGGTGGTA TGGTGGCGAT CGATCGGTAA GATTCAAGAT GGACAACAGT3060
      ATGTGTGCAC TTGGCTATAG AACAATTTTG TGGGCTAGTA AGCTGATACG ATTGATAACC3120
      AGAGTTCAAA CCTATTCCTG GGGCAGGAGG ATTTCAGATA TCAAATCCTT CGGCCATCGA3180
      CCTTGCGTGT CTTTGTGCCG CTTTATCGGT GTTTGATGAG ACGTCAATGG CAGATCTTCG3240
      CAGAAAATCA TTGAAGCTAA CAGCATACCT TGAGTTCCTT TTGCTCAGGG ATTATGAAGA3300
      AGAATCTAGG CCATTCAGCA TTATCACGCC CAAGGACCCC GAGGCGAGAG GCGCACAACT3360
      GAGTCTATTG CTCAAGCCTG GTCTATTACA GAATGTTGCA CAGAAGTTGC AAGAAGCAGG3420
      AATAGTCTGC GATAAACGGG AGCCGGGTGT TGTGCGTGTC GCTCCGGTTC CTTTGTACAA3480
      CAGCTTCAGC GAGGTTTGGA CATTTGTGAA GATCTTCAAG GATGCACTGC AGCAGTGATG3540
      GGTCTCACTA GATCATTTGG TCAGGACTGA GACCAGATTT GTCAAGTTCG CTCCGATGAA3600
      TGATTTTTTA GATAGATACC AAATTATTTG ATTCTTAGAT TTGTTGAAGC TCTCACTGCG3660
      ACATGGTCCA CAGCCACTGT GCAAAAGCAA ATAACTGAAG TAGGAACTCT ATGATAGACC3720
      CGTACTGTTG AGGTTATAGA TTTCCAAAGC CGTTCCTTGG ATCACCACTT C 3771
      <210>23
      <211>3562
      <212>DNA
      <213>Aspergillus niger
      <400>23
      CCTGTGCTTG TGGTATGACA GAGCCACTGA TATCATCTCC TCTCATCTCC AGTTGTAATC60
      GGAATTGATC GAGGGGGCCA ATCTTCCACA CAGCCCCATG GAAGACGCAC AGATGCTTTC120
      GATGCCACGC TGGCAGACGG CCGCCAACTG TCATCGTCCA GTGCTGCCGC CATTCCCATG180
      CAAAAGCCAA CGCTAAGAAG CGCGCGGGCG CCGAGTTTCC ACGCTTGCAG CTTAGTTCAG240
      CGACCCAGCT CAGTGGCGGC TCGCTCATGC ATAGAAAGAT GGGTTTGGAC CCGCGCTGGG300
      CCTTTCATCT GCAACACTGC TCGCAGACCA TGTGTGACTT TTGGCTGCAA AAAAAAAGAG360
      GCTGGCGACA GCTGATCCAC TGTGCTATTC CTATCTCATC CTCCCCGGCT GGATCGAAAG420
      CTGCACGGCA GGGGAAATCA ACAGTTGGGC TCTGACACGT ATCGAGCTAA CTGATGCGCT480
      GTCCTTCCGC CTAATGCCTA CTAAGTCTTA GGGACGGGAC CATCATCCAA CATGCCACCT540
      TGTCCTTCGT AATTCCTTTT TGATCTCGGT GATGGTGGCC ACCCAGGAAA TGACGTTCCT600
      CACCTTGGCT GCAATTGGTG CCCGATGTCT CATCTCCGCT CAGAACGGCG GCGAGGGCAG660
      AATAAAAATT GACGGGCACA GCAGGAACTA ATCAAACATA CCGGCGGTCT TCTAAATGAT720
      CGTATCTCCC GGAATACTCC CTCTTTCTAC AGAAGCGGGG ATCCATTCGC CCTATATGTA780
      TAGTGGAGCT TTGCCGCACT GATTCGCACG GCATTATACC TCCGCACTGC CGTGCCTTCA840
      TCCACTTGAT TGTGGCCAGG GAAATATCAA CGGGGCAGAT AACTTGCCCT TGCATCATTA900
      TTGCTCCGCA CATTCATTCA TTATCGCTCT GATCCCACAT CCTCACGCAG CTGCGACCGG960
      AGTGTCCACA CTCTAATTGG GATGAGCATT GCCTTTCAGG AACTTGACTT TTTGTGGTTG1020
      CATCTTTTGT TGCCTTACCC ACGCAGGCTT CGTTTATGAG ATAGCGATTT CAGGCCTCAA1080
      ATTGCTGTCA TCACTTCCGG CCCCAAACTC GTGGGCGGTG CCCGCCCATC GCTGGCAAGA1140
      AGCACAGACT AACGCCTTAC TTCGCCTAGT TGCACACGAT GCATCAAGAC TTCCTCCTAT1200
      TTCACAACGA CCAGCTCCTT GCCATTTGTT GTTTCGAATG CCCCCTTCCC CGTGCCTTGC1260
      ATTTCTAATT CCCATCTATA CCCTTTTGCG CTCTCACGCC CGCCTGACTA TCAATTTTTC1320
      TGCCAGCATA ACCCTGCGTG CAGAGCGGTT GACAGCAGGC TTGCTAAGAG TCTTCGTCTA1380
      GAAGAACTGT CTGGGTGGAT TCCTTTTCGG ATTAACTTTT GCTATTTTAA AAGCTGATTG1440
      CACTACGGAG TACACCCGCA ATCTGATTCT CACTGATACT CCAATTAAAG GCCACTAATT1500
      GCTGACATTT GTAACATATT TGCGTTTGCT TTCCGGTTGA AATTGGCGGC TTTGTGCTTT1560
      CGATCGCTAG CAGTCTCTGT GCATGTACAA CTGATCGGCT ATTCAGTCCT ATTCGGAAGC1620
      GGCACTGAGA GGCGGAGACA AGCCACAGAT ACGACGAGTC TGATTTTGAG ACGGGCGCAT1680
      CCAACGAAAG CCTGCGATTG CAATTGAAGA TCTCAATTGG GGGACTGACA ACCTAATACC1740
      TAAACATATC GAGGATTAGG CGCCAACACG AGCATGGGAA GCTTTGGTGC ATGCGACGGC1800
      TGATCCATTT CTAACAACCG TTTTGCGCGC GCGTCCGAGG TAAGGCTCCC GATCCCTTGG1860
      CGCTTTGCAT GTTTCACTCC GATGCATCTA CTGTTTATAT GAGTGCGGTG GGCAAGCTGT1920
      GCCCACCGAC TGAGCATTCT CAACCGGCCC AATGCTGTGG GATCGATCCT CCCCTCCAAA1980
      GTTGTCGCTC GGTTACACTT GATCGGAGCT TGTTCTGTTA TACACCAAAC CATCATGGAT2040
      GTGACTAATT TGGCTGTCGA TTGTCCCGTT ATAGAGACCG GTTCCCTTGC TTTGTGGATG2100
      GCTTCCTCCG AAGTGGACCA GAAGGCCTTG GGCAACTTTG CGGCCATAAC GGGCCTCGAG2160
      AACCCGTTCC TGTCCGCGAT GCTGTACAAG ATTCTGGGGT TGTCTGTTAT GTTATCGAAG2220
      AAACTCCTCC GTGCACGACG ATTGCGGCGC CTAGACCCCA CCCGAGAGAC TAAATCGCTT2280
      CATCTTTATT ACCATATCAT CTGGCTTTCG CGTGAGGGTC TTCTGATATT AGAGGAGTTC2340
      GTCCTGCCAC TGGTTGAGGG ATTTATGGAA CTCAAAATTT TAGCTTACAA GCTGCGCGCC2400
      TCCTTTTACC ATATATTCGT CCTATTTCAG AACCAGCCTG CTGTCCACTC GCCGGGTATC2460
      GTTAGTCTGC CGAGTAGTAC ACCTTTATCC AACGGCGTGA CAGAAGCGGA GTCACCATCC2520
      AAGGATTCCA ATTTGAGATT TTCATTTCAG CTGAAGCCCG ACACGATAAC GGTTTCCGGG2580
      AAGCCCAGTT CCGCCTCGGA TAGTGCGCCA CGAGGCAAGG TTACGCAGGC ACCCCCGGGC2640
      TTTGCGCCGG TTCAACCGCC CAAGTCGAAC TCGGCGTTTC TCCTCCCTGC TCTCGATTAT2700
      ACCCCTACAG CTACCGCATG CTTCAATCAT GCCGCCCTCT TGGCAGATCA ATTCCTCCCG2760
      GGGTCGCACC CGCTCCGTCT GTCCATCAAG CTTGAATTTG CCGCCTACCT CTACGATTGC2820
      CTACATGACG CTCATGCCTG TCGACGGTTG GCCAAGCAAG CCATTGCCGA TGTGTACAAT2880
      GCGCAAGAGG GCATGGACGA CGAGAGCTTC GAGGATGCAG CTGAGATTGT GGGTATTTTG2940
      GGCAAGATGG TGAAGCGGGG AAGGAACACA AGCAGTGCTG GAAATAGCAC CACGGCTGTG3000
      AAAACGCCCC AGGAGGAGCG AAGTGAGGGC AGTCGAACAC CATCCTCTCA GACAACGTTG3060
      AAAAGGCCGG CGCGAGTGCC GAAAAGCACC TCCTCACCGG CGCGCGCGAC CAAGCCGACG3120
      ACTAGCGAGG GGATGTCCCC CGCTGTGCCC GACCCCACCA TGATGAATCC CATATGATGC3180
      CTTTCCCTAC GACCTGTATA TGCTTCTTCT TGGAACTATG GAGTCGCGCA TGAGCGCTTG3240
      GCCTGTGACT TCTACTTGAC TTGCACCTGT CTGTATCATC TCGGTAACGG AGTTGCGGCG3300
      ATAGACTGGA ATTGGGCATC AGCTTGCGGG GAGCTGTGGA ATGAGCGATT AAGCGCGACA3360
      AAAACTTGAG GTGGAAGGGA CAGACCAGCC AATTTGTGAT GGTGACTGTA GATAGATAGA3420
      TGTGTGCAAT ACAAAGTATG TTGTTGATGT CATGCACCCC ACTTGTGTAT GCTTGTCTGG3480
      ACAATGGACC TACACTTAGT CGCAACAACT GTATGTCTCA AGCCAATGGC CATGGGGCAG3540
      GATGGATCGA TGGATCTCTT GT 3562
      <210>24
      <211>4361
      <212>DNA
      <213>Aspergillus niger
      <400>24
      CGACGGACTA ACGTCGCGCG CCCCATTTCA CGTCTTGAAG ACAGATGTGT ATGCGATTGC60
      TCGCGAAATT CTCATCCGAT TCCGTCGGCT TGACCTGACA TCTGGAATAG ACGAACAGGA120
      CTTGGAAGCT ATCATTCGTA TTACCGAAGA GTCCAACGTA CTTCTCACTG ACTGGTGGAA180
      GTCCGTCCCG AAACTGTATG ACTTCGATTA CTGGAAAGCA GACGGTCGAT GGGAAATGAT240
      TGAAGGCCAG CTGCAAAGGC TTCCCTCCGA AGCAAGGCAA CAGGTGGAGA CAATATATCT300
      ACAGGCTGCT GTTCTCCAGT TGACGTACGA CGGCATGGTC ATCCAAGCAA ATAGACCACT360
      GTTGGAGCGA AGAATCAACA GGCTAACATC TTCGCGGGCG ATCGTGGATG CGATGCATAG420
      GGCGCTTGAC CGAGCCACTG CTGCTGCTCT CCGCATATCC CGTGTTCCAG TTCACAAGCT480
      GAAAAATCAT TTTGCTATAG CAGTCGTATC GATGCAAGAG TTCACTGCTG GTGTGATTCT540
      CTGTATACCT CCCACGGTGA AGCCTTTAAC GGCCACCGCT CATGAGGCGA AGGACGGGGT600
      GGTAAGAATA ATACGCGCCA GTCGAAGTCT CAAGAGCCAC GATCGAATAG CAAGGCAAAC660
      TGAACAACTT CTGACGGAAC TACTCAAAGT TACCACCCAA CGCGAGATAA CGCACGCCTT720
      GGCCGATAAT CTCGACACCA ATTTCCCCTC CGATACGCGG CTAACAGGCT CCGTTGTTGC780
      CGGCGCCTCA AGTGACTCCT TGGGTGCAGG ACGCTCCAGG CCAGTTCCCG GATCCGCAGC840
      GCAGGCAGTT GTAGATCCTA TCCAAGGAGC CTGGGACTCA GAATTCAATG CCCTCCCTGC900
      CGTAACGGGA CCTTATGATT TCCTCCCTGC TCAAGCCTTT CAACAGCTGG ACGATACATT960
      TGGTGCCTTT GGAGAATGTA ATATCCCTTG ATCACCCCAG ACTCACATCC AGATTCTGAC1020
      TGACCTCGTG CATAGCCATA TTTAACTTGG TCCCTGATGA TCAAAACAGT ACATGGAACT1080
      GGGGCCGAAC ATTTCCCTAG CCAAAGGAGC ATCAGGGATT CAACGTGATC AGTACAGCCT1140
      TGTAGCTCGC TGAAACTGCC CTGGAGCCAA GCCAAAGCCT AGACAGCAAG GTGCATGGGC1200
      GAGCTTTGCG AGGATTTAGT TGTTATTTAG TATGCCAAGA TTAAGCCACG CAGAATGGCT1260
      TATGGCCATA GTAGCAACAA CGGCCACGGA ACGTTCTTCC ATGTGGTATG GGGAAAGCCG1320
      CCGGATATTT GGGGAGGGCG TGATTGTTCC GGTGGCTATC TTTCCGGTGG AGATAACGGC1380
      GGTGGACCAT CAAAACTCCT CAGCCCGGAT TGCTCGGACT CCGCATCGTC AAGTATCGGT1440
      TTCATGACAG CCATTCGACT ACTTAGAAGA CACAAATAGC TATCCAACTT ACCCGGACCT1500
      TTGATAATAA TTTTCAGCAG ATCTGTCGAT CTCAGAGACA ATAATGCCAC CGTTCTGTGT1560
      GGAAGGCACT GCGCCGTGGT TTAACAATAA TAAAACTCCA AATTGCCCAA AAGCTAGAGC1620
      GAAGGAAAGT CGAGAAGCCC AGTCTAGACT GGCGGGCTGA TCGTCCGGTT CACAACCTGA1680
      TTGACAAATC ATCTGTGACC CTCGATGTTC CGCGGCGTTG AGCGGGTGAG AATGTGGATC1740
      CTAGTGGGGA AGACCCAATT GCCGCCGGAA AAGGTGAGCT TGTGCTGCAC ATGTCCGGTG1800
      GCTCAATTCA GGGCCATGCC AGGACATTGC TCTTCAAAGG GATGCGATTG CTATTCCCTA1860
      TTTACTTCTT TAACCCGCTG ACGGGCCTGT CTGGACCGAG AATTCTTGGT CAAGTTTCAG1920
      TGGAGCGATC CAGGAAAGAA CATCCGATAT GGACAGTTGC CCTCGATCTC AGGTCTGTAG1980
      TCGTGTGACA CAGAGGCCTC TACTCGCTTG CCTTGCATGT CGGAGCTCAA AGGTGCGATG2040
      TGAATTAACA CGAGGAGCGA CTGTCTGTCG CAGATGCAAC ATGAGAAATT TGGAGTGTGT2100
      CTACACAAAA TCACGAAGGT ATCCCTCGTC TATCTTTCCG TGTGTATTAT TAGCCGAGAG2160
      TCACGCAATG CTCTTTGTAT ACAATGAAAT AATGTTGGAG CTAGAGAATG ATTTCTGATA2220
      GTTATATGTT ACAGGACACT CAGGAGGTCG TCAACTAGTC CGAACACGGC GTCCTCTCCT2280
      GACACTAATG CCTCATCTTC GCCATGCTCG GACTCTAGTG GGACCCATGC TGGCATTTCC2340
      ATTCCCCACT CAGATAGTCC CGCCAGTGTG GACGAATGTG GGAACAACGG CCTTTTCGAC2400
      GGGGGTAGGT AATATGTCAT GCTTACCTGC GACACTCACT CACCATTCTT CTAGAATCTC2460
      TAACTCAATT ATTGGTCTCT GGGAGCAAAG CCATATCAGG CCAACCACAT ATCGCCATTA2520
      AGCCACATGT TCTGTCTACC TATCCCCTTG ACAACCTCCT CTCAGACATT GAGGGACTCC2580
      TCGAGCAGCC AGTCTCTCAT TTGGCTCAAA GCAAGGAAGA TCTAACAAAA CCGGACCGGA2640
      TGTTTCGAAC TCGCCTTCCA GCGGTCTCAG GTGAGGACAA TGAGTATCTG CTAAGGAAAG2700
      GAGCTCTGCT GCTCTTGCCA CCAGCCTTGC GCAACGAACT ATTGGCGGCA TATGTCAACT2760
      ACGTCCATCC GCTATTACCG ATTCTTGATC TTGGAGACTT TCTCTCACAA ATCATTGTTG2820
      GAGATGATGC TCAATTCAAG TCACCACTAT TATACCAAGC TGTCATGTTC GCGGGCAGTA2880
      TTTTTGCTCA GCGAGACGGC ACAGACGAAC CTGAACAGCT AACGAGGGCT TTATTTGAAC2940
      GTACAAAGGT TAGTAATGGT TACAATTAGA CATATCTTAG ATATACTGAG CGATTTCCAG3000
      GTTCTATACG AGTTTGAATC CGAATCATGT GCCTACACTC AAATTCAAGC TCTCTTATTG3060
      ATGACTCTCT GGCATGGAGA TATGTCACGC CACAAAGGCC CGTCTTACTG GCTTGACGTC3120
      GCCTTCTCCA CTGCGGAAAG AATTGGCCTA CTCCATGATG AAGACTGGCC ATGCGATAGC3180
      CGTTCCTTCC GATCCGCTAT GTGGTGTTGC CTTTACGTAC GTGATCGAAC AATCTCGCTT3240
      GGGTCTCGTC GGCCTCCACG GATGCCAGTC AACAAATATC CGGACTCAAT TCTCCATCTT3300
      ATGAGCGACG CACCTCGGGA ATATGACGAA ATAATTCTTG AGAGTCTAGG TAGCGCTTCT3360
      CTGATGCTTA CAAGCACTTA CCAAGAACAA TCGACCATGC TCTTCAAGGA ACTTGTCAAA3420
      CTCTCCTACT GCGTCGGGGC AATCTTAGAT TATCTATACG AAGGGGCCTG GGTCCGAATA3480
      CCAACACGTC GCAGCAGCTT TTATTCACTC GCCCCTAAAT GCAGCATCTC GCCATCCATC3540
      AGACCAAGCT GTGAGAAACT ACTTTACTCT TGGATTCAAT TCCTCCCTCT CAACGCAGTC3600
      TACCATCCGC CACAGTTGCC CGCCGATGCG GAAGGGGAGT CAGCCGAAAC AGTCTTCCTT3660
      GTCCACAAAG CCTTCCTTTA CTTGCTGTAC CTAGCCTCCA TGGCAGTCAT ATACCGCACA3720
      GGCACTCATA GCCAACAAAC CAGCACGGCA ACTCCGAACA TGGAAGGTCT ACGGGCATCG3780
      ACGTCACAAA TAAAAAAGGT CCTTGCGGAG CTGCAGGGCA TGGGACTGCT TCAGTTCCTT3840
      CCAGGGGCAT CAGTCACTAT CCTGATGTTC GCTGTGGAGG CTAGTCTGTT GGATCTCCAG3900
      GGCTCGGATA CCATGGTCCG AAGGCAGGCT ATGTCAAATC TATATGCCTG TGAGGAGGCT3960
      GCGTTACACT TGATGCAGGC TTATCCTACG GCTGAGATGG CGGTATTGAA GACTAGGACA4020
      GCCCGTGCAA ACCTTCTTGG GTTGGTTGAG ACATGAAGAC CAATCATGGA AGCTCTGCTT4080
      CCATCAAAGC ATTGTGTCTT TGCTTAATGA ATGAATGGAT TATGAGCGTT TCGCAACCTT4140
      CTTTAATGCA GCTACATAAT AGAGCATAAA CAGAGGCCCG GAAATATATA ATTTGGCTAA4200
      GAACCCGGTT GCAAGCAGGC AAGTCACGAG GTGCAGAACA TACCATCAAG TTTATAGATT4260
      ATTGTAGGGG ATATCCTCAA CAATATCTTA CTTCCACCAT TACGTACTGA AGATCGAGGT4320
      TATCGGGGAC CATGCTGTCG TGTCAATAGG TACGACTCGT T4361
      <210>25
      <211>801
      <212>DNA
      <213>Aspergillus niger
      <220>
      <221>CDS
      <222>(1)..(801)
      <400>5
      atg cct atc tcc att ccc tcc gcc tcc agc gtc cac gac ctc ttc agc48
      Met Pro Ile Ser Ile Pro Ser Ala Ser Ser Val His Asp Leu Phe Ser
      1 5 10 15
      ctg aag ggc aag gtc gtc gtt atc acc ggc gct tcc ggc cct cgc ggc96
      Leu Lys Gly Lys Val Val Val Ile Thr Gly Ala Ser Gly Pro Arg Gly
      20 25 30
      atg ggc att gaa gcc gcg cgt ggc tgc gcc gaa atg ggc gcc aac atc144
      Met Gly Ile Glu Ala Ala Arg Gly Cys Ala Glu Met Gly Ala Asn Ile
      35 40 45
      gcc ctc acc tac tcc tct cgt cct cag ggt ggt gag aag aac gcc gaa192
      Ala Leu Thr Tyr Ser Ser Arg Pro Gln Gly Gly Glu Lys Asn Ala Glu
      50 55 60
      gaa ctt cgc aac acc tac ggc gtc aag gcc aag gcc tac cag tgc aac240
      Glu Leu Arg Asn Thr Tyr Gly Val Lys Ala Lys Ala Tyr Gln Cys Asn
      65 70 75 80
      gtg ggc gac tgg aac agc gtc aag aag ctc gtg gac gac gtg ctg gcc288
      Val Gly Asp Trp Asn Ser Val Lys Lys Leu Val Asp Asp Val Leu Ala
      85 90 95
      gag ttt ggc cag att gac gcc ttc att gcc aac gct ggc aag aca gcc336
      Glu Phe Gly Gln Ile Asp Ala Phe Ile Ala Asn Ala Gly Lys Thr Ala
      100 105 110
      agc agt ggt atc ctg gat ggt tcc gtt gag gac tgg gaa gag gtc atc384
      Ser Ser Gly Ile Leu Asp Gly Ser Val Glu Asp Trp Glu Glu Val Ile
      115 120 125
      cag aca gac ctg acg ggt acc ttc cac tgc gcc aag gcg gtg ggc ccg432
      Gln Thr Asp Leu Thr Gly Thr Phe His Cys Ala Lys Ala Val Gly Pro
      130 135 140
      cac ttc aag cag cgc gga acg ggc agc ttc atc atc acc tcc agc atg480
      His Phe Lys Gln Arg Gly Thr Gly Ser Phe Ile Ile Thr Ser Ser Met
      145 150 155 160
      tcg ggt cac att gcc aac ttc ccg cag gag cag acg tcg tac aac gtt528
      Ser Gly His Ile Ala Asn Phe Pro Gln Glu Gln Thr Ser Tyr Asn Val
      165 170 175
      gcc aag gca ggc tgc atc cat atg gcc cgg tca ttg gcc aac gag tgg576
      Ala Lys Ala Gly Cys Ile His Met Ala Arg Ser Leu Ala Asn Glu Trp
      180 185 190
      agg gac ttt gcc cgc gtg aac agc atc tcc ccg ggt tac atc gac acg624
      Arg Asp Phe Ala Arg Val Asn Ser Ile Ser Pro Gly Tyr Ile Asp Thr
      195 200 205
      ggg ctg tcg gac ttt gtg gat aag aag act cag gat ctg tgg atg tcg672
      Gly Leu Ser Asp Phe Val Asp Lys Lys Thr Gln Asp Leu Trp Met Ser
      210 215 220
      atg atc ccc atg gga cgc aac ggt gat gcc aag gag ctg aag ggt gca720
      Met Ile Pro Met Gly Arg Asn Gly Asp Ala Lys Glu Leu Lys Gly Ala
      225 230 235 240
      tat gtc tat ctc gcc agt gat gcc agc aca tac acg acg ggt gcc gat768
      Tyr Val Tyr Leu Ala Ser Asp Ala Ser Thr Tyr Thr Thr Gly Ala Asp
      245 250 255
      ttg gtc att gac gga gga tac acc gtg cgg taa801
      Leu Val Ile Asp Gly Gly Tyr Thr Val Arg
      260 265
      <210>26
      <211>1602
      <212>DNA
      <213>Aspergillus niger
      <220>
      <221>CDS
      <222>(1)..(1602)
      <400>26
      atg agt ggg gta agc ttt gcc cgt cag gcc tta ctc cag gct gct ctt48
      Met Ser Gly Val Ser Phe Ala Arg Gln Ala Leu Leu Gln Ala Ala Leu
      1 5 10 15
      ctt tcg att gtc tcc gca atc ccg gcg ccc acg gcc ttc gtc aac aat96
      Leu Ser Ile Val Ser Ala Ile Pro Ala Pro Thr Ala Phe Val Asn Asn
      20 25 30
      gtc gct ccg ccc gag ccc atc atc acc cct tcg ccg gtt caa cat cga144
      Val Ala Pro Pro Glu Pro Ile Ile Thr Pro Ser Pro Val Gln His Arg
      35 40 45
      cct tct cga gtc gct ggt cga aac att ctg agt gac gtc gat tct gat192
      Pro Ser Arg Val Ala Gly Arg Asn Ile Leu Ser Asp Val Asp Ser Asp
      50 55 60
      att aac agc atc ctt tct ggc ctt gga tcc gac cta ccc tcc tgg gtc240
      Ile Asn Ser Ile Leu Ser Gly Leu Gly Ser Asp Leu Pro Ser Trp Val
      65 70 75 80
      gca tcg ggt gtg ccc aac tac ttc cag ggt ttc cct act ggg gat gca288
      Ala Ser Gly Val Pro Asn Tyr Phe Gln Gly Phe Pro Thr Gly Asp Ala
      85 90 95
      gtg gtg agc tcc ttg ggc ttg aac agc gct gag ttg gca gcc ttg ccc336
      Val Val Ser Ser Leu Gly Leu Asn Ser Ala Glu Leu Ala Ala Leu Pro
      100 105 110
      acc aat gtc ttg aat atc gac cca tat gcc aac tgg act agc tct ggc384
      Thr Asn Val Leu Asn Ile Asp Pro Tyr Ala Asn Trp Thr Ser Ser Gly
      115 120 125
      tgg aac gtt cgc ttc cac gga aac gtc tac aag cag ccc aac acc tcc432
      Trp Asn Val Arg Phe His Gly Asn Val Tyr Lys Gln Pro Asn Thr Ser
      130 135 140
      atc tcc gac ctc aat gat ttg gct gat gtt ttc ctc ggc aat aca agc480
      Ile Ser Asp Leu Asn Asp Leu Ala Asp Val Phe Leu Gly Asn Thr Ser
      145 150 155 160
      atc tcc gac ctt tcc gaa tcc gag cag aaa cag gct cgg aat tta aca528
      Ile Ser Asp Leu Ser Glu Ser Glu Gln Lys Gln Ala Arg Asn Leu Thr
      165 170 175
      gcg gaa ata tta gtg gtc cag caa gct cac gtc gcc gta aac aca atc576
      Ala Glu Ile Leu Val Val Gln Gln Ala His Val Ala Val Asn Thr Ile
      180 185 190
      cac ctg gag cct gca ccg agt cag gga tcc agc gga cag tca ggc ggc624
      His Leu Glu Pro Ala Pro Ser Gln Gly Ser Ser Gly Gln Ser Gly Gly
      195 200 205
      ggt gga tcc tct aat acc act ggc ggc acc caa gac ctc act ctg ccc672
      Gly Gly Ser Ser Asn Thr Thr Gly Gly Thr Gln Asp Leu Thr Leu Pro
      210 215 220
      tac aac act aca gtt gaa ggc gat ttt gac act ttc gta ccg att agc720
      Tyr Asn Thr Thr Val Glu Gly Asp Phe Asp Thr Phe Val Pro Ile Ser
      225 230 235 240
      agc aat ggc ttg acg gca ggt aat gaa act tcg gcg ata caa cgg ctt768
      Ser Asn Gly Leu Thr Ala Gly Asn Glu Thr Ser Ala Ile Gln Arg Leu
      245 250 255
      aac gtc cat gtg gag ggc gcg aca ata gga aac agt act gcc tat ctc816
      Asn Val His Val Glu Gly Ala Thr Ile Gly Asn Ser Thr Ala Tyr Leu
      260 265 270
      gta cct ccg acc ggg ctc act gtc gtt tcg gac atc gat gat atc cta864
      Val Pro Pro Thr Gly Leu Thr Val Val Ser Asp Ile Asp Asp Ile Leu
      275 280 285
      cgc gtc acc aaa atc tat gaa cca gag caa ggt tta ctc aac tca ttt912
      Arg Val Thr Lys Ile Tyr Glu Pro Glu Gln Gly Leu Leu Asn Ser Phe
      290 295 300
      gcg cgc ccc ttc agg ccg tgg gag aat atg ccg gac atc tat cgc aac960
      Ala Arg Pro Phe Arg Pro Trp Glu Asn Met Pro Asp Ile Tyr Arg Asn
      305 310 315 320
      tgg tcg atc agt ctc ccc aac ctg cac ttt cac tac cta acg acg acc1008
      Trp Ser Ile Ser Leu Pro Asn Leu His Phe His Tyr Leu Thr Thr Thr
      325 330 335
      ccc gaa caa gtc acc agg aac tac atg caa ttc atc tac gac aac tac1056
      Pro Glu Gln Val Thr Arg Asn Tyr Met Gln Phe Ile Tyr Asp Asn Tyr
      340 345 350
      ccc ggt gga tct ttc gac acc cgt ccc ctc aac ttt agc gac gtt tcc1104
      Pro Gly Gly Ser Phe Asp Thr Arg Pro Leu Asn Phe Ser Asp Val Ser
      355 360 365
      gcc acc ttg tcg atc cgg aaa ttc ctc ctg caa aag gtc ttc gag acc1152
      Ala Thr Leu Ser Ile Arg Lys Phe Leu Leu Gln Lys Val Phe Glu Thr
      370 375 380
      ttt ccg cag cgc aag ttc atc ctc atc gcc gac acc agc aac agc gac1200
      Phe Pro Gln Arg Lys Phe Ile Leu Ile Ala Asp Thr Ser Asn Ser Asp
      385 390 395 400
      gtc atg cgt gac tat cct gaa atg gcg acc gac ttc cct ggt caa gtg1248
      Val Met Arg Asp Tyr Pro Glu Met Ala Thr Asp Phe Pro Gly Gln Val
      405 410 415
      caa tgt att ttt ctc cgg aac acc agc gcc acc gac tca ggg gac aaa1296
      Gln Cys Ile Phe Leu Arg Asn Thr Ser Ala Thr Asp Ser Gly Asp Lys
      420 425 430
      ttc cca tac gat acc tct ggg ttt aag aag ctc aat cag tca aac tac1344
      Phe Pro Tyr Asp Thr Ser Gly Phe Lys Lys Leu Asn Gln Ser Asn Tyr
      435 440 445
      atg ttc ttc ttg cat ccc gat gac ttg acg aat cta gac atc gcg aat1392
      Met Phe Phe Leu His Pro Asp Asp Leu Thr Asn Leu Asp Ile Ala Asn
      450 455 460
      ggc cag tgt tac aac aca tcc att ccg cag aat tta acg ttt agt tat1440
      GLy Gln Cys Tyr Asn Thr Ser Ile Pro Gln Asn Leu Thr Phe Ser Tyr
      465 470 475 480
      cag ggt ttg cca ttg ggg ctg ggt gat gaa ccc aca gct gtc aat ggg1488
      Gln Gly Leu Pro Leu Gly Leu Gly Asp Glu Pro Thr Ala Val Asn Gly
      485 490 495
      tct gcc aat cat act gct gag tcg gcg gcc ggt ttg tcg gta aag ggt1536
      Ser Ala Asn His Thr Ala Glu Ser Ala Ala Gly Leu Ser Val Lys Gly
      500 505 510
      ggg act gat atg cag ggt ttg atc ttt ctg ttc acc ctg gtt acg gcc 1584
      Gly Thr Asp Met Gln Gly Leu Ile Phe Leu Phe Thr Leu Val Thr Ala
      515 520 525
      tat tcc att ttc ttg taa 1602
      Tyr Ser Ile Phe Leu
      530
      <210>27
      <211>1392
      <212>DNA
      <213>Aspergillus niger
      <220>
      <221>CDS
      <222>(1)..(1392)
      <400>27
      atg tcg aag tcg aat ggc gtc agc ctg gca ttc ccc gcc gaa gca gcg48
      Met Ser Lys Ser Asn Gly Val Ser Leu Ala Phe Pro Ala Glu Ala Ala
      1 5 10 15
      aca aag gaa tat gca gca tct cta gac tct tct gat aga ctt gct gca96
      Thr Lys Glu Tyr Ala Ala Ser Leu Asp Ser Ser Asp Arg Leu Ala Ala
      20 25 30
      ttt cgg gag aag ttc atc gtc cca tcg aaa gca aat att gct tcc aaa144
      Phe Arg Glu Lys Phe Ile Val Pro Ser Lys Ala Asn Ile Ala Ser Lys
      35 40 45
      aag cta gca aag cct ggc ctt tcg ccc gag tca tgc att tac ttc tgc192
      Lys Leu Ala Lys Pro Gly Leu Ser Pro Glu Ser Cys Ile Tyr Phe Cys
      50 55 60
      ggt aac tca ctt ggc att caa ccc aag gcc aca gca aag tac tta gaa240
      Gly Asn Ser Leu Gly Ile Gln Pro Lys Ala Thr Ala Lys Tyr Leu Glu
      65 70 75 80
      gca cag ttg gac act tgg tca tct att gga gtt ggc ggc cac ttc act288
      Ala Gln Leu Asp Thr Trp Ser Ser Ile Gly Val Gly Gly His Phe Thr
      85 90 95
      gat ctt gag ggc tca ccc ttg aag caa tgg cag ctg ctc tca gag caa336
      Asp Leu Glu Gly Ser Pro Leu Lys Gln Trp Gln Leu Leu Ser Glu Gln
      100 105 110
      gca gct gat tca atg agc aag att gtg gga gca aag cca gaa gaa gtc384
      Ala Ala Asp Ser Met Ser Lys Ile Val Gly Ala Lys Pro Glu Glu Val
      115 120 125
      gca gcg atg gga aca ctt aca acg aac ctt cat ctt ctg ctg gct agt432
      Ala Ala Met Gly Thr Leu Thr Thr Asn Leu His Leu Leu Leu Ala Ser
      130 135 140
      ttc tat aaa ccg act caa aca aag cac aag atc ttg atg gat tgg aag480
      Phe Tyr Lys Pro Thr Gln Thr Lys His Lys Ile Leu Met Asp Trp Lys
      145 150 155 160
      gct ttc cca agt gat cac tac gct atc gaa tct cat att gcc tgg cat528
      Ala Phe Pro Ser Asp His Tyr Ala Ile Glu Ser His Ile Ala Trp His
      165 170 175
      gac ctg gat cct aag gag tct atg gtg ctc atc ggt cca gat gaa ggc576
      Asp Leu Asp Pro Lys Glu Ser Met Val Leu Ile Gly Pro Asp Glu Gly
      180 185 190
      gaa tac gag ata tcc acc cag aag att ttc tct tat atc gac aag cat624
      Glu Tyr Glu Ile Ser Thr Gln Lys Ile Phe Ser Tyr Ile Asp Lys His
      195 200 205
      gct gat gag gct gct atg att ctt ctt cct ggt att caa tat tat act672
      Ala Asp Glu Ala Ala Met Ile Leu Leu Pro Gly Ile Gln Tyr Tyr Thr
      210 215 220
      ggg caa ctg ttc gat atc cag aaa att aca aaa tat gcc cat tcg cgc720
      Gly Gln Leu Phe Asp Ile Gln Lys Ile Thr Lys Tyr Ala His Ser Arg
      225 230 235 240
      aac atg gtt gtt ggc tgg gat ctg gcc cat gcg ttc gct aat gtt gag768
      Asn Met Val Val Gly Trp Asp Leu Ala His Ala Phe Ala Asn Val Glu
      245 250 255
      cta aag ctg cat gat tgg aac gtt gat ttt gca gca tgg tgc aca tat816
      Leu Lys Leu His Asp Trp Asn Val Asp Phe Ala Ala Trp Cys Thr Tyr
      260 265 270
      aag tac gga aac gcc ggt cct gga gca atg ggg ggg ctt ttc gtg cat864
      Lys Tyr Gly Asn Ala Gly Pro Gly Ala Met Gly Gly Leu Phe Val His
      275 280 285
      gaa caa cac gga gag gtc gat tac agc gcg gga gaa gat gca ccc aaa912
      Glu Gln His Gly Glu Val Asp Tyr Ser Ala Gly Glu Asp Ala Pro Lys
      290 295 300
      ttc cgc cat cgt ctg acc ggg tgg tat ggt ggc gat cga tcg gta aga960
      Phe Arg His Arg Leu Thr Gly Trp Tyr Gly Gly Asp Arg Ser Val Arg
      305 310 315 320
      ttc aag atg gac aac aag ttc aaa cct att cct ggg gca gga gga ttt1008
      Phe Lys Met Asp Asn Lys Phe Lys Pro Ile Pro Gly Ala Gly Gly Phe
      325 330 335
      cag ata tca aat cct tcg gcc atc gac ctt gcg tgt ctt tgt gcc gct1056
      Gln Ile Ser Asn Pro Ser Ala Ile Asp Leu Ala Cys Leu Cys Ala Ala
      340 345 350
      tta tcg gtg ttt gat gag acg tca atg gca gat ctt cgc aga aaa tca1104
      Leu Ser Val Phe Asp Glu Thr Ser Met Ala Asp Leu Arg Arg Lys Ser
      355 360 365
      ttg aag cta aca gca tac ctt gag ttc ctt ttg ctc agg gat tat gaa1152
      Leu Lys Leu Thr Ala Tyr Leu Glu Phe Leu Leu Leu Arg Asp Tyr Glu
      370 375 380
      gaa gaa tct agg cca ttc agc att atc acg ccc aag gac ccc gag gcg1200
      Glu Glu Ser Arg Pro Phe Ser Ile Ile Thr Pro Lys Asp Pro Glu Ala
      385 390 395 400
      aga ggc gca caa ctg agt cta ttg ctc aag cct ggt cta tta cag aat1248
      Arg Gly Ala Gln Leu Ser Leu Leu Leu Lys Pro Gly Leu Leu Gln Asn
      405 410 415
      gtt gca cag aag ttg caa gaa gca gga ata gtc tgc gat aaa cgg gag1296
      Val Ala Gln Lys Leu Gln Glu Ala Gly Ile Val Cys Asp Lys Arg Glu
      420 425 430
      ccg ggt gtt gtg cgt gtc gct ccg gtt cct ttg tac aac agc ttc agc1344
      Pro Gly Val Val Arg Val Ala Pro Val Pro Leu Tyr Asn Ser Phe Ser
      435 440 445
      gag gtt tgg aca ttt gtg aag atc ttc aag gat gca ctg cag cag tga1392
      Glu Val Trp Thr Phe Val Lys Ile Phe Lys Asp Ala Leu Gln Gln
      450 455 460
      <210>28
      <211>1143
      <212>DNA
      <213>Aspergillus niger
      <220>
      <221>CDS
      <222>(1)..(1143)
      <400>28
      atg gat gtg act aat ttg gct gtc gat tgt ccc gtt ata gag acc ggt48
      Met Asp Val Thr Asn Leu Ala Val Asp Cys Pro Val Ile Glu Thr Gly
      1 5 10 15
      tcc ctt gct ttg tgg atg gct tcc tcc gaa gtg gac cag aag gcc ttg96
      Ser Leu Ala Leu Trp Met Ala Ser Ser Glu Val Asp Gln Lys Ala Leu
      20 25 30
      ggc aac ttt gcg gcc ata acg ggc ctc gag aac ccg ttc ctg tcc gcg144
      Gly Asn Phe Ala Ala Ile Thr Gly Leu Glu Asn Pro Phe Leu Ser Ala
      35 40 45
      atg ctg tac aag att ctg ggg ttg tct gtt atg tta tcg aag aaa ctc192
      Met Leu Tyr Lys Ile Leu Gly Leu Ser Val Met Leu Ser Lys Lys Leu
      50 55 60
      ctc cgt gca cga cga ttg cgg cgc cta gac ccc acc cga gag act aaa240
      Leu Arg Ala Arg Arg Leu Arg Arg Leu Asp Pro Thr Arg Glu Thr Lys
      65 70 75 80
      tcg ctt cat ctt tat tac cat atc atc tgg ctt tcg cgt gag ggt ctt288
      Ser Leu His Leu Tyr Tyr His Ile Ile Trp Leu Ser Arg Glu Gly Leu
      85 90 95
      ctg ata tta gag gag ttc gtc ctg cca ctg gtt gag gga ttt atg gaa336
      Leu Ile Leu Glu Glu Phe Val Leu Pro Leu Val Glu Gly Phe Met Glu
      100 105 110
      ctc aaa att tta gct tac aag ctg cgc gcc tcc ttt tac cat ata ttc384
      Leu Lys Ile Leu Ala Tyr Lys Leu Arg Ala Ser Phe Tyr His Ile Phe
      115 120 125
      gtc cta ttt cag aac cag cct gct gtc cac tcg ccg ggt atc gtt agt432
      Val Leu Phe Gln Asn Gln Pro Ala Val His Ser Pro Gly Ile Val Ser
      130 135 140
      ctg ccg agt agt aca cct tta tcc aac ggc gtg aca gaa gcg gag tca480
      Leu Pro Ser Ser Thr Pro Leu Ser Asn Gly Val Thr Glu Ala Glu Ser
      145 150 155 160
      cca tcc aag gat tcc aat ttg aga ttt tca ttt cag ctg aag ccc gac528
      Pro Ser Lys Asp Ser Asn Leu Arg Phe Ser Phe Gln Leu Lys Pro Asp
      165 170 175
      acg ata acg gtt tcc ggg aag ccc agt tcc gcc tcg gat agt gcg cca576
      Thr Ile Thr Val Ser Gly Lys Pro Ser Ser Ala Ser Asp Ser Ala Pro
      180 185 190
      cga ggc aag gtt acg cag gca ccc ccg ggc ttt gcg ccg gtt caa ccg624
      Arg Gly Lys Val Thr Gln Ala Pro Pro Gly Phe Ala Pro Val Gln Pro
      195 200 205
      ccc aag tcg aac tcg gcg ttt ctc ctc cct gct ctc gat tat acc cct672
      Pro Lys Ser Asn Ser Ala Phe Leu Leu Pro Ala Leu Asp Tyr Thr Pro
      210 215 220
      aca gct acc gca tgc ttc aat cat gcc gcc ctc ttg gca gat caa ttc720
      Thr Ala Thr Ala Cys Phe Asn His Ala Ala Leu Leu Ala Asp Gln Phe
      225 230 235 240
      ctc ccg ggg tcg cac ccg ctc cgt ctg tcc atc aag ctt gaa ttt gcc768
      Leu Pro Gly Ser His Pro Leu Arg Leu Ser Ile Lys Leu Glu Phe Ala
      245 250 255
      gcc tac ctc tac gat tgc cta cat gac gct cat gcc tgt cga cgg ttg816
      Ala Tyr Leu Tyr Asp Cys Leu His Asp Ala His Ala Cys Arg Arg Leu
      260 265 270
      gcc aag caa gcc att gcc gat gtg tac aat gcg caa gag ggc atg gac864
      Ala Lys Gln Ala Ile Ala Asp Val Tyr Asn Ala Gln Glu Gly Met Asp
      275 280 285
      gac gag agc ttc gag gat gca gct gag att gtg ggt att ttg ggc aag912
      Asp Glu Ser Phe Glu Asp Ala Ala Glu Ile Val Gly Ile Leu Gly Lys
      290 295 300
      atg gtg aag cgg gga agg aac aca agc agt gct gga aat agc acc acg960
      Met Val Lys Arg Gly Arg Asn Thr Ser Ser Ala Gly Asn Ser Thr Thr
      305 310 315 320
      gct gtg aaa acg ccc cag gag gag cga agt gag ggc agt cga aca cca1008
      Ala Val Lys Thr Pro Gln Glu Glu Arg Ser Glu Gly Ser Arg Thr Pro
      325 330 335
      tcc tct cag aca acg ttg aaa agg ccg gcg cga gtg ccg aaa agc acc1056
      Ser Ser Gln Thr Thr Leu Lys Arg Pro Ala Arg Val Pro Lys Ser Thr
      340 345 350
      tcc tca ccg gcg cgc gcg acc aag ccg acg act agc gag ggg atg tcc1104
      Ser Ser Pro Ala Arg Ala Thr Lys Pro Thr Thr Ser Glu Gly Met Ser
      355 360 365
      ccc gct gtg ccc gac ccc acc atg atg aat ccc ata tga1143
      Pro Ala Val Pro Asp Pro Thr Met Met Asn Pro Ile
      370 375 380
      <210>29
      <211>1779
      <212>DNA
      <213>Aspergillus niger
      <220>
      <221>CDS
      <222>(1)..(1779)
      <400>29
      atg aga aat ttg gag tgt gtc tac aca aaa tca cga agg tat ccc tcg48
      Met Arg Asn Leu Glu Cys Val Tyr Thr Lys Ser Arg Arg Tyr Pro Ser
      1 5 10 15
      tct atc ttt ccg aca ctc agg agg tcg tca act agt ccg aac acg gcg96
      Ser Ile Phe Pro Thr Leu Arg Arg Ser Ser Thr Ser Pro Asn Thr Ala
      20 25 30
      tcc tct cct gac act aat gcc tca tct tcg cca tgc tcg gac tct agt144
      Ser Ser Pro Asp Thr Asn Ala Ser Ser Ser Pro Cys Ser Asp Ser Ser
      35 40 45
      ggg acc cat gct ggc att tcc att ccc cac tca gat agt ccc gcc agt192
      Gly Thr His Ala Gly Ile Ser Ile Pro His Ser Asp Ser Pro Ala Ser
      50 55 60
      gtg gac gaa tgt ggg aac aac ggc ctt ttc gac ggg gaa tct cta act240
      Val Asp Glu Cys Gly Asn Asn Gly Leu Phe Asp Gly Glu Ser Leu Thr
      65 70 75 80
      caa tta ttg gtc tct ggg agc aaa gcc ata tca ggc caa cca cat atc288
      Gln Leu Leu Val Ser Gly Ser Lys Ala Ile Ser Gly Gln Pro His Ile
      85 90 95
      gcc att aag cca cat gtt ctg tct acc tat ccc ctt gac aac ctc ctc336
      Ala Ile Lys Pro His Val Leu Ser Thr Tyr Pro Leu Asp Asn Leu Leu
      100 105 110
      tca gac att gag gga ctc ctc gag cag cca gtc tct cat ttg gct caa384
      Ser Asp Ile Glu Gly Leu Leu Glu Gln Pro Val Ser His Leu Ala Gln
      115 120 125
      agc aag gaa gat cta aca aaa ccg gac cgg atg ttt cga act cgc ctt432
      Ser Lys Glu Asp Leu Thr Lys Pro Asp Arg Met Phe Arg Thr Arg Leu
      130 135 140
      cca gcg gtc tca ggt gag gac aat gag tat ctg cta agg aaa gga gct480
      Pro Ala Val Ser Gly Glu Asp Asn Glu Tyr Leu Leu Arg Lys Gly Ala
      145 150 155 160
      ctg ctg ctc ttg cca cca gcc ttg cgc aac gaa cta ttg gcg gca tat528
      Leu Leu Leu Leu Pro Pro Ala Leu Arg Asn Glu Leu Leu Ala Ala Tyr
      165 170 175
      gtc aac tac gtc cat ccg cta tta ccg att ctt gat ctt gga gac ttt576
      Val Asn Tyr Val His Pro Leu Leu Pro Ile Leu Asp Leu Gly Asp Phe
      180 185 190
      ctc tca caa atc att gtt gga gat gat gct caa ttc aag tca cca cta624
      Leu Ser Gln Ile Ile Val Gly Asp Asp Ala Gln Phe Lys Ser Pro Leu
      195 200 205
      tta tac caa gct gtc atg ttc gcg ggc agt att ttt gct cag cga gac672
      Leu Tyr Gln Ala Val Met Phe Ala Gly Ser Ile Phe Ala Gln Arg Asp
      210 215 220
      ggc aca gac gaa cct gaa cag cta acg agg gct tta ttt gaa cgt aca720
      Gly Thr Asp Glu Pro Glu Gln Leu Thr Arg Ala Leu Phe Glu Arg Thr
      225 230 235 240
      aag gtt cta tac gag ttt gaa tcc gaa tca tgt gcc tac act caa att768
      Lys Val Leu Tyr Glu Phe Glu Ser Glu Ser Cys Ala Tyr Thr Gln Ile
      245 250 255
      caa gct ctc tta ttg atg act ctc tgg cat gga gat atg tca cgc cac816
      Gln Ala Leu Leu Leu Met Thr Leu Trp His Gly Asp Met Ser Arg His
      260 265 270
      aaa ggc ccg tct tac tgg ctt gac gtc gcc ttc tcc act gcg gaa aga864
      Lys Gly Pro Ser Tyr Trp Leu Asp Val Ala Phe Ser Thr Ala Glu Arg
      275 280 285
      att ggc cta ctc cat gat gaa gac tgg cca tgc gat agc cgt tcc ttc912
      Ile Gly Leu Leu His Asp Glu Asp Trp Pro Cys Asp Ser Arg Ser Phe
      290 295 300
      cga tcc gct atg tgg tgt tgc ctt tac gta cgt gat cga aca atc tcg960
      Arg Ser Ala Met Trp Cys Cys Leu Tyr Val Arg Asp Arg Thr Ile Ser
      305 310 315 320
      ctt ggg tct cgt cgg cct cca cgg atg cca gtc aac aaa tat ccg gac1008
      Leu Gly Ser Arg Arg Pro Pro Arg Met Pro Val Asn Lys Tyr Pro Asp
      325 330 335
      tca att ctc cat ctt atg agc gac gca cct cgg gaa tat gac gaa ata1056
      Ser Ile Leu His Leu Met Ser Asp Ala Pro Arg Glu Tyr Asp Glu Ile
      340 345 350
      att ctt gag agt cta ggt agc gct tct ctg atg ctt aca agc act tac1104
      Ile Leu Glu Ser Leu Gly Ser Ala Ser Leu Met Leu Thr Ser Thr Tyr
      355 360 365
      caa gaa caa tcg acc atg ctc ttc aag gaa ctt gtc aaa ctc tcc tac1152
      Gln Glu Gln Ser Thr Met Leu Phe Lys Glu Leu Val Lys Leu Ser Tyr
      370 375 380
      tgc gtc ggg gca atc tta gat tat cta tac gaa ggg gcc tgg gtc cga1200
      Cys Val Gly Ala Ile Leu Asp Tyr Leu Tyr Glu Gly Ala Trp Val Arg
      385 390 395 400
      ata cca aca cgt cgc agc agc ttt tat tca ctc gcc cct aaa tgc agc1248
      Ile Pro Thr Arg Arg Ser Ser Phe Tyr Ser Leu Ala Pro Lys Cys Ser
      405 410 415
      atc tcg cca tcc atc aga cca agc tgt gag aaa cta ctt tac tct tgg1296
      Ile Ser Pro Ser Ile Arg Pro Ser Cys Glu Lys Leu Leu Tyr Ser Trp
      420 425 430
      att caa ttc ctc cct ctc aac gca gtc tac cat ccg cca cag ttg ccc1344
      Ile Gln Phe Leu Pro Leu Asn Ala Val Tyr His Pro Pro Gln Leu Pro
      435 440 445
      gcc gat gcg gaa ggg gag tca gcc gaa aca gtc ttc ctt gtc cac aaa1392
      Ala Asp Ala Glu Gly Glu Ser Ala Glu Thr Val Phe Leu Val His Lys
      450 455 460
      gcc ttc ctt tac ttg ctg tac cta gcc tcc atg gca gtc ata tac cgc1440
      Ala Phe Leu Tyr Leu Leu Tyr Leu Ala Ser Met Ala Val Ile Tyr Arg
      465 470 475 480
      aca ggc act cat agc caa caa acc agc acg gca act ccg aac atg gaa1488
      Thr Gly Thr His Ser Gln Gln Thr Ser Thr Ala Thr Pro Asn Met Glu
      485 490 495
      ggt cta cgg gca tcg acg tca caa ata aaa aag gtc ctt gcg gag ctg1536
      Gly Leu Arg Ala Ser Thr Ser Gln Ile Lys Lys Val Leu Ala Glu Leu
      500 505 510
      cag ggc atg gga ctg ctt cag ttc ctt cca ggg gca tca gtc act atc1584
      Gln Gly Met Gly Leu Leu Gln Phe Leu Pro Gly Ala Ser Val Thr Ile
      515 520 525
      ctg atg ttc gct gtg gag gct agt ctg ttg gat ctc cag ggc tcg gat1632
      Leu Met Phe Ala Val Glu Ala Ser Leu Leu Asp Leu Gln Gly Ser Asp
      530 535 540
      acc atg gtc cga agg cag gct atg tca aat cta tat gcc tgt gag gag1680
      Thr Met Val Arg Arg Gln Ala Met Ser Asn Leu Tyr Ala Cys Glu Glu
      545 550 555 560
      gct gcg tta cac ttg atg cag gct tat cct acg gct gag atg gcg gta1728
      Ala Ala Leu His Leu Met Gln Ala Tyr Pro Thr Ala Glu Met Ala Val
      565 570 575
      ttg aag act agg aca gcc cgt gca aac ctt ctt ggg ttg gtt gag aca1776
      Leu Lys Thr Arg Thr Ala Arg Ala Asn Leu Leu Gly Leu Val Glu Thr
      580 585 590
      tga1779
      <210>30
      <211>266
      <212>PRT
      <213>Aspergillus niger
      <400>30
      Met Pro Ile Ser Ile Pro Ser Ala Ser Ser Val His Asp Leu Phe Ser
      1 5 10 15
      Leu Lys Gly Lys Val Val Val Ile Thr Gly Ala Ser Gly Pro Arg Gly
      20 25 30
      Met Gly Ile Glu Ala Ala Arg Gly Cys Ala Glu Met Gly Ala Asn Ile
      35 40 45
      Ala Leu Thr Tyr Ser Ser Arg Pro Gln Gly Gly Glu Lys Asn Ala Glu
      50 55 60
      Glu Leu Arg Asn Thr Tyr Gly Val Lys Ala Lys Ala Tyr Gln Cys Asn
      65 70 75 80
      Val Gly Asp Trp Asn Ser Val Lys Lys Leu Val Asp Asp Val Leu Ala
      85 90 95
      Glu Phe Gly Gln Ile Asp Ala Phe Ile Ala Asn Ala Gly Lys Thr Ala
      100 105 110
      Ser Ser Gly Ile Leu Asp Gly Ser Val Glu Asp Trp Glu Glu Val Ile
      115 120 125
      Gln Thr Asp Leu Thr Gly Thr Phe His Cys Ala Lys Ala Val Gly Pro
      130 135 140
      His Phe Lys Gln Arg Gly Thr Gly Ser Phe Ile Ile Thr Ser Ser Met
      145 150 155 160
      Ser Gly His Ile Ala Asn Phe Pro Gln Glu Gln Thr Ser Tyr Asn Val
      165 170 175
      Ala Lys Ala Gly Cys Ile His Met Ala Arg Ser Leu Ala Asn Glu Trp
      180 185 190
      Arg Asp Phe Ala Arg Val Asn Ser Ile Ser Pro Gly Tyr Ile Asp Thr
      195 200 205
      Gly Leu Ser Asp Phe Val Asp Lys Lys Thr Gln Asp Leu Trp Met Ser
      210 215 220
      Met Ile Pro Met Gly Arg Asn Gly Asp Ala Lys Glu Leu Lys Gly Ala
      225 230 235 240
      Tyr Val Tyr Leu Ala Ser Asp Ala Ser Thr Tyr Thr Thr Gly Ala Asp
      245 250 255
      Leu Val Ile Asp Gly Gly Tyr Thr Val Arg
      260 265
      <210>31
      <211>533
      <212>PRT
      <213>Aspergillus niger
      <400>31
      Met Ser Gly Val Ser Phe Ala Arg Gln Ala Leu Leu Gln Ala Ala Leu
      1 5 10 15
      Leu Ser Ile Val Ser Ala Ile Pro Ala Pro Thr Ala Phe Val Asn Asn
      20 25 30
      Val Ala Pro Pro Glu Pro Ile Ile Thr Pro Ser Pro Val Gln His Arg
      35 40 45
      Pro Ser Arg Val Ala Gly Arg Asn Ile Leu Ser Asp Val Asp Ser Asp
      50 55 60
      Ile Asn Ser Ile Leu Ser Gly Leu Gly Ser Asp Leu Pro Ser Trp Val
      65 70 75 80
      Ala Ser Gly Val Pro Asn Tyr Phe Gln Gly Phe Pro Thr Gly Asp Ala
      85 90 95
      Val Val Ser Ser Leu Gly Leu Asn Ser Ala Glu Leu Ala Ala Leu Pro
      100 105 110
      Thr Asn Val Leu Asn Ile Asp Pro Tyr Ala Asn Trp Thr Ser Ser Gly
      115 120 125
      Trp Asn Val Arg Phe His Gly Asn Val Tyr Lys Gln Pro Asn Thr Ser
      130 135 140
      Ile Ser Asp Leu Asn Asp Leu Ala Asp Val Phe Leu Gly Asn Thr Ser
      145 150 155 160
      Ile Ser Asp Leu Ser Glu Ser Glu Gln Lys Gln Ala Arg Asn Leu Thr
      165 170 175
      Ala Glu Ile Leu Val Val Gln Gln Ala His Val Ala Val Asn Thr Ile
      180 185 190
      His Leu Glu Pro Ala Pro Ser Gln Gly Ser Ser Gly Gln Ser Gly Gly
      195 200 205
      Gly Gly Ser Ser Asn Thr Thr Gly Gly Thr Gln Asp Leu Thr Leu Pro
      210 215 220
      Tyr Asn Thr Thr Val Glu Gly Asp Phe Asp Thr Phe Val Pro Ile Ser
      225 230 235 240
      Ser Asn Gly Leu Thr Ala Gly Asn Glu Thr Ser Ala Ile Gln Arg Leu
      245 250 255
      Asn Val His Val Glu Gly Ala Thr Ile Gly Asn Ser Thr Ala Tyr Leu
      260 265 270
      Val Pro Pro Thr Gly Leu Thr Val Val Ser Asp Ile Asp Asp Ile Leu
      275 280 285
      Arg Val Thr Lys Ile Tyr Glu Pro Glu Gln Gly Leu Leu Asn Ser Phe
      290 295 300
      Ala Arg Pro Phe Arg Pro Trp Glu Asn Met Pro Asp Ile Tyr Arg Asn
      305 310 315 320
      Trp Ser Ile Ser Leu Pro Asn Leu His Phe His Tyr Leu Thr Thr Thr
      325 330 335
      Pro Glu Gln Val Thr Arg Asn Tyr Met Gln Phe Ile Tyr Asp Asn Tyr
      340 345 350
      Pro Gly Gly Ser Phe Asp Thr Arg Pro Leu Asn Phe Ser Asp Val Ser
      355 360 365
      Ala Thr Leu Ser Ile Arg Lys Phe Leu Leu Gln Lys Val Phe Glu Thr
      370 375 380
      Phe Pro Gln Arg Lys Phe Ile Leu Ile Ala Asp Thr Ser Asn Ser Asp
      385 390 395 400
      Val Met Arg Asp Tyr Pro Glu Met Ala Thr Asp Phe Pro Gly Gln Val
      405 410 415
      Gln Cys Ile Phe Leu Arg Asn Thr Ser Ala Thr Asp Ser Gly Asp Lys
      420 425 430
      Phe Pro Tyr Asp Thr Ser Gly Phe Lys Lys Leu Asn Gln Ser Asn Tyr
      435 440 445
      Met Phe Phe Leu His Pro Asp Asp Leu Thr Asn Leu Asp Ile Ala Asn
      450 455 460
      Gly Gln Cys Tyr Asn Thr Ser Ile Pro Gln Asn Leu Thr Phe Ser Tyr
      465 470 475 480
      Gln Gly Leu Pro Leu Gly Leu Gly Asp Glu Pro Thr Ala Val Asn Gly
      485 490 495
      Ser Ala Asn His Thr Ala Glu Ser Ala Ala Gly Leu Ser Val Lys Gly
      500 505 510
      Gly Thr Asp Met Gln Gly Leu Ile Phe Leu Phe Thr Leu Val Thr Ala
      515 520 525
      Tyr Ser Ile Phe Leu
      530
      <210>32
      <211>463
      <212>PRT
      <213>Aspergillus niger
      <400>32
      Met Ser Lys Ser Asn Gly Val Ser Leu Ala Phe Pro Ala Glu Ala Ala
      1 5 10 15
      Thr Lys Glu Tyr Ala Ala Ser Leu Asp Ser Ser Asp Arg Leu Ala Ala
      20 25 30
      Phe Arg Glu Lys Phe Ile Val Pro Ser Lys Ala Asn Ile Ala Ser Lys
      35 40 45
      Lys Leu Ala Lys Pro Gly Leu Ser Pro Glu Ser Cys Ile Tyr Phe Cys
      50 55 60
      Gly Asn Ser Leu Gly Ile Gln Pro Lys Ala Thr Ala Lys Tyr Leu Glu
      65 70 75 80
      Ala Gln Leu Asp Thr Trp Ser Ser Ile Gly Val Gly Gly His Phe Thr
      85 90 95
      Asp Leu Glu Gly Ser Pro Leu Lys Gln Trp Gln Leu Leu Ser Glu Gln
      100 105 110
      Ala Ala Asp Ser Met Ser Lys Ile Val Gly Ala Lys Pro Glu Glu Val
      115 120 125
      Ala Ala Met Gly Thr Leu Thr Thr Asn Leu His Leu Leu Leu Ala Ser
      130 135 140
      Phe Tyr Lys Pro Thr Gln Thr Lys His Lys Ile Leu Met Asp Trp Lys
      145 150 155 160
      Ala Phe Pro Ser Asp His Tyr Ala Ile Glu Ser His Ile Ala Trp His
      165 170 175
      Asp Leu Asp Pro Lys Glu Ser Met Val Leu Ile Gly Pro Asp Glu Gly
      180 185 190
      Glu Tyr Glu Ile Ser Thr Gln Lys Ile Phe Ser Tyr Ile Asp Lys His
      195 200 205
      Ala Asp Glu Ala Ala Met Ile Leu Leu Pro Gly Ile Gln Tyr Tyr Thr
      210 215 220
      Gly Gln Leu Phe Asp Ile Gln Lys Ile Thr Lys Tyr Ala His Ser Arg
      225 230 235 240
      Asn Met Val Val Gly Trp Asp Leu Ala His Ala Phe Ala Asn Val Glu
      245 250 255
      Leu Lys Leu His Asp Trp Asn Val Asp Phe Ala Ala Trp Cys Thr Tyr
      260 265 270
      Lys Tyr Gly Asn Ala Gly Pro Gly Ala Met Gly Gly Leu Phe Val His
      275 280 285
      Glu Gln His Gly Glu Val Asp Tyr Ser Ala Gly Glu Asp Ala Pro Lys
      290 295 300
      Phe Arg His Arg Leu Thr Gly Trp Tyr Gly Gly Asp Arg Ser Val Arg
      305 310 315 320
      Phe Lys Met Asp Asn Lys Phe Lys Pro Ile Pro Gly Ala Gly Gly Phe
      325 330 335
      Gln Ile Ser Asn Pro Ser Ala Ile Asp Leu Ala Cys Leu Cys Ala Ala
      340 345 350
      Leu Ser Val Phe Asp Glu Thr Ser Met Ala Asp Leu Arg Arg Lys Ser
      355 360 365
      Leu Lys Leu Thr Ala Tyr Leu Glu Phe Leu Leu Leu Arg Asp Tyr Glu
      370 375 380
      Glu Glu Ser Arg Pro Phe Ser Ile Ile Thr Pro Lys Asp Pro Glu Ala
      385 390 395 400
      Arg Gly Ala Gln Leu Ser Leu Leu Leu Lys Pro Gly Leu Leu Gln Asn
      405 410 415
      Val Ala Gln Lys Leu Gln Glu Ala Gly Ile Val Cys Asp Lys Arg Glu
      420 425 430
      Pro Gly Val Val Arg Val Ala Pro Val Pro Leu Tyr Asn Ser Phe Ser
      435 440 445
      Glu Val Trp Thr Phe Val Lys Ile Phe Lys Asp Ala Leu Gln Gln
      450 455 460
      <210>33
      <211>380
      <212>PRT
      <213>Aspergillus niger
      <400>33
      Met Asp Val Thr Asn Leu Ala Val Asp Cys Pro Val Ile Glu Thr Gly
      1 5 10 15
      Ser Leu Ala Leu Trp Met Ala Ser Ser Glu Val Asp Gln Lys Ala Leu
      20 25 30
      Gly Asn Phe Ala Ala Ile Thr Gly Leu Glu Asn Pro Phe Leu Ser Ala
      35 40 45
      Met Leu Tyr Lys Ile Leu Gly Leu Ser Val Met Leu Ser Lys Lys Leu
      50 55 60
      Leu Arg Ala Arg Arg Leu Arg Arg Leu Asp Pro Thr Arg Glu Thr Lys
      65 70 75 80
      Ser Leu His Leu Tyr Tyr His Ile Ile Trp Leu Ser Arg Glu Gly Leu
      85 90 95
      Leu Ile Leu Glu Glu Phe Val Leu Pro Leu Val Glu Gly Phe Met Glu
      100 105 110
      Leu Lys Ile Leu Ala Tyr Lys Leu Arg Ala Ser Phe Tyr His Ile Phe
      115 120 125
      Val Leu Phe Gln Asn Gln Pro Ala Val His Ser Pro Gly Ile Val Ser
      130 135 140
      Leu Pro Ser Ser Thr Pro Leu Ser Asn Gly Val Thr Glu Ala Glu Ser
      145 150 155 160
      Pro Ser Lys Asp Ser Asn Leu Arg Phe Ser Phe Gln Leu Lys Pro Asp
      165 170 175
      Thr Ile Thr Val Ser Gly Lys Pro Ser Ser Ala Ser Asp Ser Ala Pro
      180 185 190
      Arg Gly Lys Val Thr Gln Ala Pro Pro Gly Phe Ala Pro Val Gln Pro
      195 200 205
      Pro Lys Ser Asn Ser Ala Phe Leu Leu Pro Ala Leu Asp Tyr Thr Pro
      210 215 220
      Thr Ala Thr Ala Cys Phe Asn His Ala Ala Leu Leu Ala Asp Gln Phe
      225 230 235 240
      Leu Pro Gly Ser His Pro Leu Arg Leu Ser Ile Lys Leu Glu Phe Ala
      245 250 255
      Ala Tyr Leu Tyr Asp Cys Leu His Asp Ala His Ala Cys Arg Arg Leu
      260 265 270
      Ala Lys Gln Ala Ile Ala Asp Val Tyr Asn Ala Gln Glu Gly Met Asp
      275 280 285
      Asp Glu Ser Phe Glu Asp Ala Ala Glu Ile Val Gly Ile Leu Gly Lys
      290 295 300
      Met Val Lys Arg Gly Arg Asn Thr Ser Ser Ala Gly Asn Ser Thr Thr
      305 310 315 320
      Ala Val Lys Thr Pro Gln Glu Glu Arg Ser Glu Gly Ser Arg Thr Pro
      325 330 335
      Ser Ser Gln Thr Thr Leu Lys Arg Pro Ala Arg Val Pro Lys Ser Thr
      340 345 350
      Ser Ser Pro Ala Arg Ala Thr Lys Pro Thr Thr Ser Glu Gly Met Ser
      355 360 365
      Pro Ala Val Pro Asp Pro Thr Met Met Asn Pro Ile
      370 375 380
      <210>34
      <211>592
      <212>PRT
      <213>Aspergillus niger
      <400>34
      Met Arg Asn Leu Glu Cys Val Tyr Thr Lys Ser Arg Arg Tyr Pro Ser
      1 5 10 15
      Ser Ile Phe Pro Thr Leu Arg Arg Ser Ser Thr Ser Pro Asn Thr Ala
      20 25 30
      Ser Ser Pro Asp Thr Asn Ala Ser Ser Ser Pro Cys Ser Asp Ser Ser
      35 40 45
      Gly Thr His Ala Gly Ile Ser Ile Pro His Ser Asp Ser Pro Ala Ser
      50 55 60
      Val Asp Glu Cys Gly Asn Asn Gly Leu Phe Asp Gly Glu Ser Leu Thr
      65 70 75 80
      Gln Leu Leu Val Ser Gly Ser Lys Ala Ile Ser Gly Gln Pro His Ile
      85 90 95
      Ala Ile Lys Pro His Val Leu Ser Thr Tyr Pro Leu Asp Asn Leu Leu
      100 105 110
      Ser Asp Ile Glu Gly Leu Leu Glu Gln Pro Val Ser His Leu Ala Gln
      115 120 125
      Ser Lys Glu Asp Leu Thr Lys Pro Asp Arg Met Phe Arg Thr Arg Leu
      130 135 140
      Pro Ala Val Ser Gly Glu Asp Asn Glu Tyr Leu Leu Arg Lys Gly Ala
      145 150 155 160
      Leu Leu Leu Leu Pro Pro Ala Leu Arg Asn Glu Leu Leu Ala Ala Tyr
      165 170 175
      Val Asn Tyr Val His Pro Leu Leu Pro Ile Leu Asp Leu Gly Asp Phe
      180 185 190
      Leu Ser Gln Ile Ile Val Gly Asp Asp Ala Gln Phe Lys Ser Pro Leu
      195 200 205
      Leu Tyr Gln Ala Val Met Phe Ala Gly Ser Ile Phe Ala Gln Arg Asp
      210 215 220
      Gly Thr Asp Glu Pro Glu Gln Leu Thr Arg Ala Leu Phe Glu Arg Thr
      225 230 235 240
      Lys Val Leu Tyr Glu Phe Glu Ser Glu Ser Cys Ala Tyr Thr Gln Ile
      245 250 255
      Gln Ala Leu Leu Leu Met Thr Leu Trp His Gly Asp Met Ser Arg His
      260 265 270
      Lys Gly Pro Ser Tyr Trp Leu Asp Val Ala Phe Ser Thr Ala Glu Arg
      275 280 285
      Ile Gly Leu Leu His Asp Glu Asp Trp Pro Cys Asp Ser Arg Ser Phe
      290 295 300
      Arg Ser Ala Met Trp Cys Cys Leu Tyr Val Arg Asp Arg Thr Ile Ser
      305 310 315 320
      Leu Gly Ser Arg Arg Pro Pro Arg Met Pro Val Asn Lys Tyr Pro Asp
      325 330 335
      Ser Ile Leu His Leu Met Ser Asp Ala Pro Arg Glu Tyr Asp Glu Ile
      340 345 350
      Ile Leu Glu Ser Leu Gly Ser Ala Ser Leu Met Leu Thr Ser Thr Tyr
      355 360 365
      Gln Glu Gln Ser Thr Met Leu Phe Lys Glu Leu Val Lys Leu Ser Tyr
      370 375 380
      Cys Val Gly Ala Ile Leu Asp Tyr Leu Tyr Glu Gly Ala Trp Val Arg
      385 390 395 400
      Ile Pro Thr Arg Arg Ser Ser Phe Tyr Ser Leu Ala Pro Lys Cys Ser
      405 410 415
      Ile Ser Pro Ser Ile Arg Pro Ser Cys Glu Lys Leu Leu Tyr Ser Trp
      420 425 430
      Ile Gln Phe Leu Pro Leu Asn Ala Val Tyr His Pro Pro Gln Leu Pro
      435 440 445
      Ala Asp Ala Glu Gly Glu Ser Ala Glu Thr Val Phe Leu Val His Lys
      450 455 460
      Ala Phe Leu Tyr Leu Leu Tyr Leu Ala Ser Met Ala Val Ile Tyr Arg
      465 470 475 480
      Thr Gly Thr His Ser Gln Gln Thr Ser Thr Ala Thr Pro Asn Met Glu
      485 490 495
      Gly Leu Arg Ala Ser Thr Ser Gln Ile Lys Lys Val Leu Ala Glu Leu
      500 505 510
      Gln Gly Met Gly Leu Leu Gln Phe Leu Pro Gly Ala Ser Val Thr Ile
      515 520 525
      Leu Met Phe Ala Val Glu Ala Ser Leu Leu Asp Leu Gln Gly Ser Asp
      530 535 540
      Thr Met Val Arg Arg Gln Ala Met Ser Asn Leu Tyr Ala Cys Glu Glu
      545 550 555 560
      Ala Ala Leu His Leu Met Gln Ala Tyr Pro Thr Ala Glu Met Ala Val
      565 570 575
      Leu Lys Thr Arg Thr Ala Arg Ala Asn Leu Leu Gly Leu Val Glu Thr
      580 585 590
      <210>35
      <211>1076
      <212>DNA
      <213>人工序列
      <220>
      <221>引物結(jié)合
      <222>(1)..(35)
      <220>
      <221>啟動子
      <222>(13)..(1062)
      <220>
      <221>引物結(jié)合
      <222>(1037)..(1076)
      <400>35
      ACTTCACTCG AGATAATGTA GGCGACAAAG TAGCCGGGCA TGCGACCGGA GGACTCGGTC60
      AGAGGCACGA ATATGAGAGG CCAGAACGCC GCACCCATGT TCCAAGATGT TGTGGCCCAG120
      TAAAGGTTAG GAAATGGGGT GTTTTGAACG TGGAATCGTT CTTCCATCCA GTTGTTGCCG180
      GAGCCGTAGG AACCGGCCGG GATACCAGTG AGGATGGAAC TATACCTATT AGCACTGCCA240
      TCTTCGAGAA CAAGGCTAAG ACATACATGA AACAAACGGT GACCGTGAGA AGCCATTTAT300
      AAGAGGTGCT CCAATTGAAC CTGAATATGT TAAAACTAGT ATACTAGCAA CTGCATGCTT360
      GACGTACGGA TTGTCCGGGT CATCCTTGCC GTTCCAGGTA TGGATCTCAA GGTCCTCCCT420
      GTCACGCAGA TCATTGTGGC TGACTACCCC GACATGGGGG TCCCGGCGAA AGAACGACCG480
      CACCCTGCAA CGTCACTTAG TGGCTGTCTG ACAGGGATTG ATTGGCAATG ATTGGCAGAC540
      TAACCGTCCC AGAAACGAAT CATCGAACTC ATTGGTGTGC ACTGTGCTAG CGCGGCGCAG600
      CGACGGGCGT GGCTCCTCGG CAGGGGTGGA CATGACTTTC TCTGTGTAGA TTCCTTGCAA660
      GGTATCTGCT TGACAGATGC AGAGATGATG TTGAGTAAAA TAGGGTGCAG AGACCCTGCA720
      GAACCTGCAT CGGCCGGCGG CGACATGTCG TCATGACCGA CCCGGGCCGA GCGGAATTAA780
      TGAAACTCGG AACAGCCAGG GGAATCCGAC GCTTTGAGTG GCCAATCCAT GTCTATCCAC840
      ATCTGCATTG AAGTGGATGA AAGGTGGAGG AGGGCTGGTT GCCAAATTCT GTTAGGGCTT900
      GGAATGTAAG CAACCGGTTT CGGTCATGAC ATCATCACAG CGATGACTTC ATCACTCTCG960
      GACGAGCATA TATAGTTGTG CCTGTCGTCG TATCTCAACA AACATCAACA ACAACAACAA1020
      TCATCTACTG CATTTACCAA ACTCATCTCT ACCTCAATCA ACTTAATTAA TGAAGT1076
      <210>36
      <211>1057
      <212>DNA
      <213>人工序列
      <220>
      <221>引物結(jié)合
      <222>(1)..(33)
      <220>
      <221>啟動子
      <222>(13)..(1043)
      <220>
      <221>引物結(jié)合
      <222>(1022)..(1057)
      <400>36
      ACTTCACTCG AGTTCTCACA AGCAAATCCG AGAAACGCAA TTGACCATAT GTCCTTAGTA60
      TGAGGGCTAG CAGGAATACT TGTTTGTCGA TGCATACCGA CTAATAAAAA TGGTTCTTCT120
      TTTTCGCGCA GGGATTTGGT TTTTCATTTT TCATTTTTCA TATTTTATGT TATTTTATTT180
      TATTTTTTTG TTTTATTTTA TTTTATTTTT TTTTTTTAAA TAAGACTGGG TGTTTTCGTC240
      TCCCACCCCT GCTGAGGAAC TGTTTGATAT ACAGAAGCCT GAGATACTTG AGATTATGTG300
      ACAAAGAAAT TGTAAACCTG AATGTGACTA AGGCAGAAGA GAGCAGGTGA GGCCACACAA360
      TACTGTACAC CCACTTCCGA TCGTCATCGA AATGAGCGTT GTGGGTACTG GAACGACAAA420
      CCATAGATCG GATCTGCATC CGAATAGGCT TTACTTTGTA CATTGGTAGG AGTTTGAATG480
      TTTGAAGATC CGGCAGATGA TCACCTGCTG CAGGGAATAA TTTGAAACCT GTCCGTCTGC540
      TTTGACCCAA TTGACGAGGT ACGTGATTTG ATGCTACCCA AGCAGTATGA ATGCGACGGA600
      GGTGGCTATC CTTACCTTGT CATATGCAAC TCATAACGGG TAGTCCCCAT GGAGCCACGG660
      CTATTTATTT CTAAGGGCCA ACAGTGAAAG ATTGTGAGAT CGTATACCTC CTGGGTATGA720
      CGCAACCAGG GTGAGCACTG GCATTGCTCC AATCCATATG GTGGAGGTAT GTCTCCGAGA780
      CCATGACGCA TGTAGACCCT GACCTGTCCC TGATCCAGGG ATCTGGTTTG TCACTTGGCG840
      TATTTTAATT AACTGCGGGT CAGGGTCTTG CCGTCCAGAC CCAATGGATG AATTGCCTGC900
      GTGGCCCTGC AGTTCCAGCG ATCGGCACGG CACGGCTATG ACGTCGGTGG GTGTTCCGTT960
      TGATATTTAA CCATAGAAGA CAGCCTTGTT ATGCTGGTTC CTGCCGCAAA ATAAAGGTCT1020
      ATCCTTACCA CGTTAAGTGT CAAATTAATT AAGAAGT 1057
      <210>37
      <211>1061
      <212>DNA
      <213>人工序列
      <220>
      <221>引物結(jié)合
      <222>(1)..(33)
      <220>
      <221>啟動子
      <222>(13)..(1047)
      <220>
      <221>引物結(jié)合
      <222>(1023)..(1061)
      <400>37
      ATCCTACTCG AGTGGTGCCT GTGAACGAGG TCACCACTGA TAAATTGTCT GGATCCGTAA60
      CGTCTGTATC AGTGGATGGT ACTGAAAAGT TCCAAAGATT GAGGGCAGCA TATGTAGCAC120
      ATGGTGGTAG CTCTAAGTGG TTCGAAACTT CGATGAATGG GCGTGATATA CAGGGGGGTA180
      GCACCTGTAT AGTTGATGTC AGCGAAGGCA CGGGCCATGC AGTGATAGAC AAGAAAAGAG240
      GGATTGAATA AAAGACTCGA TTCTGAAGGG GAGTAATACA TCTTTCGGCT TCTCACCACC300
      CCAGATGTAG GCGTGTGTAA GGTAAGCAAG CACAACATAT GCTCTCCGCC ACTCAGGTTC360
      CCCCTTCAAC TTCTTCGTAG AGAGTATACC CAGGTCATCG ACAGACCTCC TGATAGTACC420
      AGACTGAATC AGGCCAGGCA AGTCCTGAGC GATTTCCTCC CACGGGGAAT AGTAAGGGTC480
      TTCCAATCTC CGTACGGGAG GAACTTCCGG GAGGAACCCG TTCTGGAGGG AGACACCGTA540
      CGCAACAAGT GAAATGTCTT GTGTATAAAG CATGATAATA TATGCACTTC AGTAGACAAC600
      TTGATATTCA AGCCTCCTTG AAATGATCCT CATGCAGGTA AGAGTAGATC CAAGTGTTTA660
      TATTGTATTC CCAAGGAGGG ACGGAAGAAA ACCGGATCCA GAGGGCTCGA GATAGGGCCA720
      CCTGCATGAG CAAAGACGGG TCATTTCCCG TTTCACAACG ACCATTCTCA GGCAGAAAGG780
      CAGTGGATTA GCGGAAAACT TAGCAACCAT CCGGATTTCT GGAGTGGATG CTTTGTTATC840
      TCACTTCCGG CAACACGGAT GGTGAGGCGG AAGCGGAACG GTATCCGGAT CCGGAGGGAG900
      GGACAAACCG AAGTGCCTTG TGTCACACGC CGGTCCATAT ATAAATGTTA ATTGGTGACG960
      GTCAGCGGAT TGTTTCTGGT GTTCATCCAT TTTTTCTTGA TATCCTGGAC CCAGTTATTG1020
      CACTTTAATT ACTATCCAAA ATCCACATTA ATTAATGAAG T1061
      <210>38
      <211>1097
      <212>DNA
      <213>人工序列
      <220>
      <221>引物結(jié)合
      <222>(1)..(34)
      <220>
      <221>啟動子
      <222>(13)..(1083)
      <220>
      <221>引物結(jié)合
      <222>(1060)..(1097)
      <400>38
      ACTTCACTCG AGGTCCACAC TCTAATTGGG ATGAGCATTG CCTTTCAGGA ACTTGACTTT60
      TTGTGGTTGC ATCTTTTGTT GCCTTACCCA CGCAGGCTTC GTTTATGAGA TAGCGATTTC120
      AGGCCTCAAA TTGCTGTCAT CACTTCCGGC CCCAAACTCG TGGGCGGTGC CCGCCCATCG180
      CTGGCAAGAA GCACAGACTA ACGCCTTACT TCGCCTAGTT GCACACGATG CATCAAGACT240
      TCCTCCTATT TCACAACGAC CAGCTCCTTG CCATTTGTTG TTTCGAATGC CCCCTTCCCC300
      GTGCCTTGCA TTTCTAATTC CCATCTATAC CCTTTTGCGC TCTCACGCCC GCCTGACTAT360
      CAATTTTTCT GCCAGCATAA CCCTGCGTGC AGAGCGGTTG ACAGCAGGCT TGCTAAGAGT420
      CTTCGTCTAG AAGAACTGTC TGGGTGGATT CCTTTTCGGA TTAACTTTTG CTATTTTAAA480
      AGCTGATTGC ACTACGGAGT ACACCCGCAA TCTGATTCTC ACTGATACTC CAATTAAAGG540
      CCACTAATTG CTGACATTTG TAACATATTT GCGTTTGCTT TCCGGTTGAA ATTGGCGGCT600
      TTGTGCTTTC GATCGCTAGC AGTCTCTGTG CATGTACAAC TGATCGGCTA TTCAGTCCTA660
      TTCGGAAGCG GCACTGAGAG GCGGAGACAA GCCACAGATA CGACGAGTCT GATTTTGAGA720
      CGGGCGCATC CAACGAAAGC CTGCGATTGC AATTGAAGAT CTCAATTGGG GGACTGACAA780
      CCTAATACCT AAACATATCG AGGATTAGGC GCCAACACGA GCATGGGAAG CTTTGGTGCA840
      TGCGACGGCT GATCCATTTC TAACAACCGT TTTGCGCGCG CGTCCGAGGT AAGGCTCCCG900
      ATCCCTTGGC GCTTTGCATG TTTCACTCCG ATGCATCTAC TGTTTATATG AGTGCGGTGG960
      GCAAGCTGTG CCCACCGACT GAGCATTCTC AACCGGCCCA ATGCTGTGGG ATCGATCCTC1020
      CCCTCCAAAG TTGTCGCTCG GTTACACTTG ATCGGAGCTT GTTCTGTTAT ACACCAAACC1080
      ATCTTAATTA ATAGGAT 1097
      <210>39
      <211>1142
      <212>DNA
      <213>人工序列
      <220>
      <221>引物結(jié)合
      <222>(1)..(35)
      <220>
      <221>啟動子
      <222>(13)..(1128)
      <220>
      <221>引物結(jié)合
      <222>(1118)..(1142)
      <400>39
      ATCCTACTCG AGGCCTTTGG AGAATGTAAT ATCCCTTGAT CACCCCAGAC TCACATCCAG60
      ATTCTGACTG ACCTCGTGCA TAGCCATATT TAACTTGGTC CCTGATGATC AAAACAGTAC120
      ATGGAACTGG GGCCGAACAT TTCCCTAGCC AAAGGAGCAT CAGGGATTCA ACGTGATCAG180
      TACAGCCTTG TAGCTCGCTG AAACTGCCCT GGAGCCAAGC CAAAGCCTAG ACAGCAAGGT240
      GCATGGGCGA GCTTTGCGAG GATTTAGTTG TTATTTAGTA TGCCAAGATT AAGCCACGCA300
      GAATGGCTTA TGGCCATAGT AGCAACAACG GCCACGGAAC GTTCTTCCAT GTGGTATGGG360
      GAAAGCCGCC GGATATTTGG GGAGGGCGTG ATTGTTCCGG TGGCTATCTT TCCGGTGGAG420
      ATAACGGCGG TGGACCATCA AAACTCCTCA GCCCGGATTG CTCGGACTCC GCATCGTCAA480
      GTATCGGTTTC ATGACAGCC ATTCGACTAC TTAGAAGACA CAAATAGCTA TCCAACTTAC540
      CCGGACCTTTG ATAATAATT TTCAGCAGAT CTGTCGATCT CAGAGACAAT AATGCCACCG600
      TTCTGTGTGGA AGGCACTGC GCCGTGGTTT AACAATAATA AAACTCCAAA TTGCCCAAAA660
      GCTAGAGCGAA GGAAAGTCG AGAAGCCCAG TCTAGACTGG CGGGCTGATC GTCCGGTTCA720
      CAACCTGATTG ACAAATCAT CTGTGACCCT CGATGTTCCG CGGCGTTGAG CGGGTGAGAA780
      TGTGGATCCTA GTGGGGAAG ACCCAATTGC CGCCGGAAAA GGTGAGCTTG TGCTGCACAT840
      GTCCGGTGGCT CAATTCAGG GCCATGCCAG GACATTGCTC TTCAAAGGGA TGCGATTGCT900
      ATTCCCTATTT ACTTCTTTA ACCCGCTGAC GGGCCTGTCT GGACCGAGAA TTCTTGGTCA960
      AGTTTCAGTGG AGCGATCCA GGAAAGAACA TCCGATATGG ACAGTTGCCC TCGATCTCAG1020
      GTCTGTAGTCG TGTGACACA GAGGCCTCTA CTCGCTTGCC TTGCATGTCG GAGCTCAAAG1080
      GTGCGATGTGA ATTAACACG AGGAGCGACT GTCTGTCGCA GATGCAACTT AATTAATAGG1140
      AT 1142
      <210>40
      <211>39
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>40
      ACTTCATTAA TTAAGTTGAT TGAGGTAGAG ATGAGTTTG39
      <210>41
      <211>35
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>4I
      ACTTCACTCG AGATAATGTA GGCGACAAAG TAGCC 35
      <210>42
      <211>36
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>42
      ACTTCATTAA TTAATTTGAC ACTTAACGTG GTAAGG 36
      <210>43
      <211>33
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>43
      ACTTCACTCG AGTTCTCACA AGCAAATCCG AGA33
      <210>44
      <211>33
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>44
      ATCCTACTCG AGTGGTGCCT GTGAACGAGG TCA33
      <210>45
      <211>39
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>45
      ACTTCATTAA TTAATGTGGA TTTTGGATAG TAATTAAAG39
      <210>46
      <211>38
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>46
      ATCCTATTAA TTAAGATGGT TTGGTGTATA ACAGAACA 38
      <210>47
      <211>34
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>47
      ACTTCACTCG AGGTCCACAC TCTAATTGGG ATGA34
      <210>48
      <211>35
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>48
      ATCCTATTAA TTAAGTTGCA TCTGCGACAG ACAGT 35
      <210>49
      <211>35
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>49
      ACTTCACTCG AGGCCTTTGG AGAATGTAAT ATCCC35
      <210>50
      <211>20
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>50
      CAACACCTAC GGCGTCAAGG 20
      <210>51
      <211>20
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>51
      TAACCCGGGG AGATGCTGTT20
      <210>52
      <211>20
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>52
      CGATCCGGAA ATTCCTCCTG 20
      <210>53
      <211>19
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>53
      GCCGCCGACT CAGCAGTAT 19
      <210>54
      <211>20
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>54
      GTGCATGAAC AACACGGAGA 20
      <210>55
      <211>20
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>55
      ACTCAGTTGT GCGCCTCTCG20
      <210>56
      <211>20
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>56
      GTCGAACTCG GCGTTTCTCC20
      <210>57
      <211>20
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>57
      CCGGTGAGGA GGTGCTTTTC20
      <210>58
      <211>20
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>58
      AGCATCTCGC CATCCATCAG20
      <210>59
      <211>20
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>59
      GCCTTCGGAC CATGGTATCC20
      <210>60
      <400>60
      000
      <210>61
      <211>1226
      <212>DNA
      <213>人工序列
      <220>
      <221>基因
      <222>(23)..(739)
      <223>GFP
      <220>
      <221>基因
      <222>(740)..(1212)
      <223>BLE
      <400>61
      GTCCTGTTAA TTAACCTTCA CCATGGTGAG CAAGGGCGAG GAGCTGTTCA CCGGGGTGGT60
      GCCCATCCTG GTCGAGCTGG ACGGCGACGT AAACGGCCAC AAGTTCAGCG TGTCCGGCGA120
      GGGCGAGGGC GATGCCACCT ACGGCAAGCT GACCCTGAAG TTCATCTGCA CCACCGGCAA180
      GCTGCCCGTG CCCTGGCCCA CCCTCGTGAC CACCCTGACC TACGGCGTGC AGTGCTTCAG240
      CCGCTACCCC GACCACATGA AGCAGCACGA CTTCTTCAAG TCCGCCATGC CCGAAGGCTA300
      CGTCCAGGAG CGCACCATCT TCTTCAAGGA CGACGGCAAC TACAAGACCC GCGCCGAGGT360
      GAAGTTCGAG GGCGACACCC TGGTGAACCG CATCGAGCTG AAGGGCATCG ACTTCAAGGA420
      GGACGGCAAC ATCCTGGGGC ACAAGCTGGA GTACAACTAC AACAGCCACA ACGTCTATAT480
      CATGGCCGAC AAGCAGAAGA ACGGCATCAA GGTGAACTTC AAGATCCGCC ACAACATCGA540
      GGACGGCAGC GTGCAGCTCG CCGACCACTA CCAGCAGAAC ACCCCCATCG GCGACGGCCC600
      CGTGCTGCTG CCCGACAACC ACTACCTGAG CACCCAGTCC GCCCTGAGCA AAGACCCCAA660
      CGAGAAGCGC GATCACATGG TCCTGCTGGA GTTCGTGACC GCCGCCGGGA TCACTCTCGG720
      CATGGACGAG CTGTACAAGG CCAAGTTGAC CAGTGCCGTT CCGGTGCTCA CCGCGCGCGA780
      CGTCGCCGGA GCGGTCGAGT TCTGGACCGA CCGGCTCGGG TTCTCCCGGG ACTTCGTGGA840
      GGACGACTTC GCCGGTGTGG TCCGGGACGA CGTGACCCTG TTCATCAGCG CGGTCCAGGA900
      CCAGGTGGTG CCGGACAACA CCCTGGCCTG GGTGTGGGTG CGCGGCCTGG ACGAGCTGTA960
      CGCCGAGTGG TCGGAGGTCG TGTCCACGAA CTTCCGGGAC GCCTCCGGGC CGGCCATGAC1020
      CGAGATCGGC GAGCAGCCGT GGGGGCGGGA GTTCGCCCTG CGCGACCCGG CCGGCAACTG1080
      CGTGCACTTC GTGGCCGAGG AGCAGGACTA AAGGCGCGCC TGAAGT 1226
      <210>62
      <211>37
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>62
      GTCCTGTTAA TTAACCTTCA CCATGGTGAG CAAGGGC37
      <210>63
      <211>36
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>63
      GCACTGGTCA ACTTGGCCTT GTACAGCTCG TCCATG36
      <210>64
      <211>36
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>64
      CATGGACGAG CTGTACAAGG CCAAGTTGAC CAGTGC36
      <210>65
      <211>35
      <212>DNA
      <213>人工序列
      <220>
      <223>引物
      <400>65
      ACTTCAGGCG CGCCTTTAGT CCTGCTCCTC GGCCA3權(quán)利要求
      1.啟動子DNA序列,例如
      (a)以下列表所示的DNA序列SEQ ID NO1、SEQ ID NO2、SEQID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ IDNO24,
      (b)能夠與(a)的DNA序列雜交的DNA序列,
      (c)與(a)的DNA序列至少50%同源的DNA序列,
      (d)(a)到(c)中任何DNA序列的變體,或
      (e)(a)到(d)中任何DNA序列的亞序列。
      2.DNA構(gòu)建體,其包含與報告基因可操作連接的如權(quán)利要求1所述的啟動子DNA,所述報告基因賦予可選擇性狀,優(yōu)選地,選擇性標記基因。
      3.包含如權(quán)利要求2所述的DNA構(gòu)建體的表達載體,其中所述DNA構(gòu)建體包含下述DNA片段,所述DNA片段與宿主細胞基因組中預(yù)先確定的靶基因座DNA序列同源,優(yōu)選所述預(yù)先確定的靶基因座包含高表達的基因。
      4.包含如權(quán)利要求2所述的DNA構(gòu)建體的表達載體,其中所述DNA構(gòu)建體能夠在宿主細胞中自主維持,優(yōu)選地,所述DNA構(gòu)建體包含AMA1序列。
      5.宿主細胞,其包含如權(quán)利要求2所述DNA構(gòu)建體,或包含如權(quán)利要求3或4所述的表達載體。
      6.如權(quán)利要求5所述的宿主細胞,其還包含包含下述DNA序列的DNA構(gòu)建體,所述DNA序列包含來自下述DNA文庫的編碼序列,所述DNA文庫來自被懷疑能夠產(chǎn)生一種或多種目的蛋白質(zhì)的生物。
      7.如權(quán)利要求5或6所述的宿主細胞,其中所述宿主細胞為原核生物或真核生物。
      8.如權(quán)利要求7所述的宿主細胞,其中所述宿主細胞選自以下列表Bacillus、酵母或絲狀真菌,優(yōu)選地,Aspergillus、Penicillium或Trichoderma種。
      9.如權(quán)利要求8所述的宿主細胞,其中Aspergillus為Aspergillus niger或Aspergillus sojae或Aspergillus oryzae種。
      10.用于分離下述DNA序列的方法,所述DNA序列包含在宿主細胞中編碼目的蛋白質(zhì)的DNA序列,所述方法包含如下步驟
      (a)制備第一DNA構(gòu)建體,其包含與賦予可選擇性狀的報告基因可操作連接的啟動子DNA序列;當所述DNA構(gòu)建體存在于宿主細胞中和當所述宿主細胞產(chǎn)生目的蛋白質(zhì),優(yōu)選被分泌的目的蛋白質(zhì)時,所述啟動子DNA序列被誘導(dǎo);
      (b)制備第二DNA構(gòu)建體,其包含包含下述DNA序列的DNA序列,所述DNA序列編碼來自下述生物DNA文庫的目的蛋白質(zhì),所述生物被懷疑能夠制造一種或多種目的蛋白質(zhì);
      (c)用(a)和(b)中制備的兩種DNA構(gòu)建體轉(zhuǎn)化宿主細胞;
      (d)在有助于產(chǎn)生所述DNA文庫中存在的目的蛋白質(zhì)的條件下,培養(yǎng)(c)中獲得的所有經(jīng)轉(zhuǎn)化的宿主細胞;和
      (e)通過分析在(d)中產(chǎn)生的蛋白質(zhì),篩選產(chǎn)生目的蛋白質(zhì)的經(jīng)轉(zhuǎn)化的宿主細胞。
      11.如權(quán)利要求10所述的方法,其中首先用步驟(a)中制備的DNA構(gòu)建體轉(zhuǎn)化所述宿主細胞,然后用步驟(b)中制備的DNA構(gòu)建體轉(zhuǎn)化所述宿主細胞。
      12.如權(quán)利要求10或11所述的方法,其中步驟(a)中使用的所述啟動子為權(quán)利要求1的啟動子。
      13.如權(quán)利要求10到12任一項所述的方法,其中所述被懷疑能夠產(chǎn)生目的蛋白質(zhì)的生物為真核生物或原核生物。
      14.如權(quán)利要求10到13任一項所述的方法,其中所述目的蛋白質(zhì)為酶。
      全文摘要
      帝斯曼知識產(chǎn)權(quán)資產(chǎn)管理有限公司B.V.24403WO,在宿主細胞中表達克隆的改進方法,本發(fā)明涉及高度適用于經(jīng)改進的表達克隆方法中的啟動子DNA序列和利用該啟動子的經(jīng)改進的表達克隆方法,所述經(jīng)改進的表達克隆方法用于分離下述DNA序列,所述DNA序列包含在宿主細胞中編碼目的蛋白質(zhì)的DNA序列。所述經(jīng)分離的DNA序列適用于制造目的蛋白質(zhì)的方法。
      文檔編號C12N15/09GK101163790SQ200680008683
      公開日2008年4月16日 申請日期2006年3月20日 優(yōu)先權(quán)日2005年3月18日
      發(fā)明者羅埃爾弗·伯恩哈德·梅瑪, 蒂鮑特·喬斯·維恩策爾, 科尼利斯·瑪麗亞·雅各布斯·沙吉, 約翰尼斯·翰德里克·德溫德, 奧斯卡·保羅·柯伊伯斯, 魯特格爾·簡·洛爾延范, 馬若蘭·科納拉·迪克, 布倫達·沃恩克 申請人:帝斯曼知識產(chǎn)權(quán)資產(chǎn)管理有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1