專利名稱:編碼黑曲霉羧肽酶的基因的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及編碼真菌液泡蛋白酶的基因。特別是本發(fā)明涉及絲狀子囊菌類或半知菌類真菌,例如曲霉屬的羧肽酶基因。
真菌液泡是含有許多水解酶,包括數(shù)種蛋白酶的酸性器官,并且基本上等同于哺乳動(dòng)物的溶酶體。已經(jīng)鑒定并表征了特別是酵母的一種或多種真菌的水解酶;這些包括蛋白酶A(PEPA或PrA),蛋白酶B(PrB)或氨肽酶(APE),二肽基氨肽酶B(DPAPB),羧肽酶Y(CPY)和羧肽酶S(CPS)。大多數(shù)液泡水解酶是作為非活性前體而合成的糖蛋白。事實(shí)上,除APE外,上述所有提到的蛋白酶都有導(dǎo)致過(guò)渡通過(guò)分泌途徑的信號(hào)肽。在晚期高爾基體中,液泡蛋白與分泌蛋白分開(kāi),然后最終輸送到液泡中。除信號(hào)肽外,大多數(shù)液泡蛋白還含有輸送到液泡后被裂解以產(chǎn)生成熟活性酶的原肽。已經(jīng)證實(shí)在原肽中存在PrA和CPY對(duì)于以液泡為靶所需的氨基酸信息(Johnson et al.,Cell 48875-885,1987;Rothman etal.,PNAS USA 833248-3252,1989;Valls et al.,Cell 48887-897;Valls et al.J.Cell Biol.111361-368,1987)。對(duì)于CPY,已經(jīng)表明有四個(gè)氨基酸殘基(QRPL)對(duì)于定位于液泡是必需的(Valls etal.J.Cell Biol.111361-368,1990)。一旦輸送到液泡后,蛋白酶A(pep4)裂解CPY和PrB的原肽以便激活蛋白酶(Ammerer et al.,Mol.Cell.Biol.62490-2499,1986;Woolford et al.,Mol.Cell.Biol.62500-2510)。
在啤酒酵母中,已鑒定了錯(cuò)定位或錯(cuò)分類液泡蛋白的三類突變體(Bankaitis et al.,PNAS USA 839075-9079,1986;Robinson et al.,Mol.Cell.Biol.,84936-4948,1988;Rothman et al.,EMBOJ.82057-2065,1989;Rothman and Steven,Cell 471041-1051,1986)。這些突變體被稱為vps或液泡蛋白分類突變體。利用一種選擇來(lái)分離數(shù)個(gè)這樣的突變體,所述選擇是基于觀察到質(zhì)粒上的高拷貝液泡蛋白酶的過(guò)表達(dá)會(huì)導(dǎo)致分泌液泡蛋白酶(Steven etal.,J.Cell Biol.,1021551-1557,1986Rothman et al,PNAS USA833248-3241,1986)。這表明在晚期高爾基體中可能有飽和分類機(jī)制。
在啤酒酵母中,還表明,缺失PEP4,CPY和PrB的菌株由于所需產(chǎn)物蛋白水解的減少生產(chǎn)較高水平的異源蛋白質(zhì)。因此,由于生產(chǎn)所研究的液泡蛋白酶的真菌被用于重組生產(chǎn)異源蛋白,因而從商業(yè)角度看,所述液泡蛋白酶是很重要的。在發(fā)酵中這些蛋白酶的存在是很令人頭痛的,因?yàn)樗鼈冞€可以降解所需的蛋白質(zhì),從而明顯降低生產(chǎn)率。通過(guò)破碎或缺失編碼其的基因可以有利于消除任何已有蛋白質(zhì)的功能;但是,這樣做首先要鑒定并分離在所需宿主中的相應(yīng)的基因。如上所述,從各種酵母菌株中只鑒定了很少的所述基因;然而,在絲狀子囊菌或半知菌中編碼液泡蛋白酶的基因很少有人知道。例如,已經(jīng)分離了編碼另兩種黑曲霉液泡蛋白酶的PEPC(Frederich et al.,Gene 12557-64,1993)和PEPE(Jarai et al.,Gene145171-178,1994)基因。PEPC編碼蛋白酶B(PrB)同系物,PEPE編碼蛋白酶A的同系物。也已經(jīng)克隆了編碼PrA同系物的Neutospora Crassa的PEP4基因(Bowman,17th funga;Genetics Conference,1993)。本文首次描述了來(lái)自絲狀子囊菌或半知菌的編碼液泡CPY的基因。
本發(fā)明涉及含有編碼絲狀子囊菌或半知菌羧肽酶Y的核酸構(gòu)建體,以及重組生產(chǎn)由其編碼的蛋白質(zhì)。如本文所用的,“核酸構(gòu)建體”指任何cDNA,基因組DNA,合成的DNA或RNA源的核酸分子。術(shù)語(yǔ)“構(gòu)建體”指核酸片段,所述核酸片段可以是單鏈或雙鏈的,可以從天然基因中完全或部分地被分離,或可以被修飾以含有以在自然界不存在的方式組合且并置的DNA片段。所述構(gòu)建體還可以含有其他核酸片段。在優(yōu)選的實(shí)施方案中,所述序列編碼曲霉屬的羧肽酶。本發(fā)明還提供了生產(chǎn)不產(chǎn)生羧肽酶的絲狀子囊菌或半知菌細(xì)胞的方法,包括破碎或缺失羧肽酶基因以防止功能酶的表達(dá),或通過(guò)利用物理或化學(xué)處理的經(jīng)典誘變以產(chǎn)生其生產(chǎn)CPY能力降低或沒(méi)有了的細(xì)胞。另外,本發(fā)明還包含不能生產(chǎn)功能羧肽酶或以相對(duì)于野生型菌株生產(chǎn)的量而言,生產(chǎn)減少量的羧肽酶的絲狀子囊菌或半知菌。所述生物提供了改進(jìn)重組蛋白質(zhì)生產(chǎn)方法的基礎(chǔ),其中用編碼所述蛋白質(zhì)的核酸構(gòu)建體轉(zhuǎn)化羧肽酶缺陷型微生物,然后在表達(dá)所述蛋白質(zhì)的條件下培養(yǎng)。
附圖描述
圖1表示黑曲霉Bo-1基因組CPY克隆的DNA序列及其翻譯。圖2表示黑曲霉SFAG2 CPYcDNA的DNA序列及其翻譯。標(biāo)明了信號(hào)肽酶裂解的預(yù)期的位點(diǎn)以及成熟CPY的N-末端。圖3說(shuō)明了在破壞CPY中所用的構(gòu)建體。
利用啤酒酵母CPY,微紫青霉羧肽酶S1(Svedsen etal.,F(xiàn)EBS33339-43,1993,和麥芽羧肽酶-MIII(Sorensen et al.,Carlsberg res.Commun.54193-202,1993),通過(guò)設(shè)計(jì)一系列的簡(jiǎn)并寡核苷酸來(lái)開(kāi)始嘗試分離曲霉屬羧肽酶Y。下文實(shí)施例中提供了所述寡核苷酸序列。在利用黑曲霉菌株Bo-1基因組DNA為模板的PCR反應(yīng)中,用這些序列以各種組合為引物。其中的兩個(gè)反應(yīng)(用引物1-1和2-1;以及1-2和2-2)產(chǎn)生了一個(gè)1100bp的擴(kuò)增產(chǎn)物,將其亞克隆并測(cè)序,但是沒(méi)有亞克隆與鑒定為所需基因的CPY明顯同源。然后進(jìn)行了用引物3-1,3-2,4-1,4-2,2-1和2-2的其他PCR反應(yīng)。在其中的兩個(gè)反應(yīng)中(用引物4-1和2-1;以及4-2和2-1)得到了一個(gè)600bp的擴(kuò)增產(chǎn)物。將該產(chǎn)物亞克隆,并將11個(gè)亞克隆測(cè)序;其中的9個(gè)亞克隆是一致的,而且與其他來(lái)源的羧肽酶Y基因同源。用一個(gè)亞克隆中的插入片段探測(cè)黑曲霉基因組DNA;用Bamh I,Hind III,和SAlI消化產(chǎn)物觀察到有一個(gè)帶的雜交,表明在黑曲霉中存在單個(gè)CPY基因。于65℃,在1.5×SSPE,1.0%SDS,0.5%脫脂牛奶和200μg/ml鮭精子DNA中進(jìn)行雜交。
制備在EMBL4中的黑曲霉基因組DNA庫(kù),然后用PCRCPY-衍生的基因片段(32P-標(biāo)記的)檢測(cè),以便分離全長(zhǎng)基因。在約28,000個(gè)噬菌體中,撿出11個(gè)陽(yáng)性的;將其中的9個(gè)在純化后再用探針雜交。大多數(shù)這些克隆共有的5.5HindIII片段被鑒定為黑曲霉CPY基因。將該片段亞克隆并測(cè)序;在圖1中提供了含有CPY編碼區(qū)和預(yù)期的氨基酸序列的片段的序列。
隨后,再篩選來(lái)自不同黑曲霉菌株的cDNA庫(kù)。從該庫(kù)中還鑒定至少一個(gè)全長(zhǎng)克隆。將該克隆測(cè)序并在圖2中描述了所述序列。預(yù)期均有兩個(gè)557個(gè)氨基酸長(zhǎng)的CPY前體序列。以與來(lái)自啤酒酵母的同源基因的比較為基礎(chǔ),來(lái)自黑曲霉的CPY似乎有一個(gè)137或138個(gè)氨基酸的前-原肽。所述基因含有一個(gè)61個(gè)堿基對(duì)的內(nèi)含子。兩個(gè)黑曲霉序列的比較表明,在氨基酸序列方面有些不同,這可能反映了所述基因組的和cDNA克隆是分離自不同的菌株。與啤酒酵母和C.albican的相應(yīng)的CPY基因的比較表明分別有65%和66%的一致性。
本發(fā)明并不限于使用圖1和2所公開(kāi)的序列。首先,本發(fā)明還包括生產(chǎn)與圖1或2中描述的氨基酸序列相同的,但是因遺傳密碼簡(jiǎn)并性而不同的核苷酸序列。另外,因相同種的兩個(gè)菌株而得到不同的氨基酸序列說(shuō)明在一個(gè)種內(nèi)的序列上的變異是可以容忍的,而且利用本文描述的技術(shù),可以很容易鑒定所述的變異體。因此在本文中提到“黑曲霉”時(shí),應(yīng)理解包括所有所述的變異體。具體地說(shuō),本發(fā)明還包括任何變異體核苷酸序列,及由其編碼的蛋白質(zhì),其中所述蛋白質(zhì)保留了與圖1或2中所示的氨基酸序列至少約80%,優(yōu)選約85%,最佳為至少約90-95%的同源性,而且在性質(zhì)上保留了本文所述序列的活性。在上述定義的目錄中有用的變異體包括例如,已完成的保守氨基酸取代,所述取代并未顯著影響所述蛋白質(zhì)的活性。所謂保守取代指相同類型的氨基酸可以由該類型的其他氨基酸取代。例如,可以交換非極性的脂肪族殘基Ala,Val,Leu,和Ile,堿性殘基Lys和Arg,或酸性殘基Asp和Glu。相似地,Ser和Thr彼此可以進(jìn)行保守取代,Asn和Gln也可以。
另外,分離的基因提供了從其他絲狀子囊菌或半知菌,例如曲霉種,如米曲霉,臭曲霉,日本曲霉,棘孢曲霉,或構(gòu)巢曲霉中分離同源基因的方法。其他非曲霉絲狀子囊菌包括鐮孢屬,例如,禾谷鐮孢,尖孢鐮孢,茄病鐮孢大刀鐮孢(或相應(yīng)的teleomorphs)粗糙鏈孢霉,Trichoderma reesei,Tviridae,T.harzianum T.longibranchiatum,微紫青霉,點(diǎn)青霉,產(chǎn)黃青霉,沙門(mén)氏柏干酪青霉,婁格法兒特氏青霉,Humicola insolen,灰色腐質(zhì)霉thermoidea變種,H.lanuginosa,Scytalidium thermophilumyceliophthora thermophila,和Thielavia terrestris。在Southern雜交中可以用所述基因或以其為基礎(chǔ)的寡核苷酸作探針,以分離這些其他種中的同源基因。具體地說(shuō),用所述探針在低或高嚴(yán)謹(jǐn)條件下(例如,在42℃,5×SSPE,0.3%SDS,200μg/ml剪切并變性的鮭精DNA,分別為50,35或25%用于高,中和低嚴(yán)謹(jǐn)條件下預(yù)雜交和雜交)與所需種的基因組或cDNA進(jìn)行雜交,標(biāo)準(zhǔn)的Southerm印跡方法后,以鑒定并分離其中相應(yīng)的CPY基因。用本文所述的簡(jiǎn)并探針及來(lái)自絲狀真菌的基因組DNA或第一條鏈cDNA的PCR也可以得到CPY特異性產(chǎn)物,然后可以用其作為探針克隆相應(yīng)的基因組或cDNA。
本發(fā)明基因在產(chǎn)生絲狀子囊菌,例如曲霉的羧肽酶-缺陷型突變體時(shí)特別有用??梢杂煤芏喾椒ㄟ_(dá)到該目的。在一種方法中,如下文進(jìn)一步描述的,將一個(gè)選擇性標(biāo)記克隆到CPY基因個(gè)中部。用限制酶將破壞的片段從母本質(zhì)粒中釋放出。用所述線性化的DNA片段轉(zhuǎn)化所選的宿主細(xì)胞。在所述的宿主細(xì)胞中,同源末端與宿主染色體配對(duì),同源重組產(chǎn)生了染色體基因替代。與真菌細(xì)胞宿主可一起使用的可選擇標(biāo)記包括amdS,pyrG;argB,niaD,sC,和hygB。另外,用兩種可選擇標(biāo)記可以使用兩步法。在所述的一種方法中,用在CPY配對(duì)內(nèi)切割一次以便在轉(zhuǎn)化過(guò)程中靶整合到CPY座位的限制酶消化含有截?cái)嗟腃PY基因和可選擇標(biāo)記基因的質(zhì)粒。然后在選擇丟失可選擇標(biāo)記的培養(yǎng)基上使轉(zhuǎn)化體生長(zhǎng),例如若標(biāo)記為pyrG時(shí),培養(yǎng)基可含有5-fluorootic acid。在野生型CPY和導(dǎo)入的截?cái)嗟腃PY基因之間重組時(shí),常常發(fā)生可選擇標(biāo)記的丟失。與約50%的所得菌株應(yīng)只有截?cái)嗟腃PY基因,而另外50%只含有野生型基因。在Rothstein,Meth.Enzymol.194,281-301,1991中描述了所述方法。
所產(chǎn)生的CPY缺陷型突變體在表達(dá)異源蛋白質(zhì)時(shí),是特別有用的。在本發(fā)明中,“異源蛋白質(zhì)”指在所述宿主中天然不存在的蛋白質(zhì),對(duì)天然序列已經(jīng)進(jìn)行了修飾的天然蛋白質(zhì),或用重組DNA技術(shù)修飾宿主后,其表達(dá)在數(shù)量上發(fā)生了變化的天然蛋白質(zhì)。該術(shù)語(yǔ)還包括其突變體的表達(dá)使用了宿主中天然沒(méi)有的遺傳成分或使用了經(jīng)加工后,以在宿主中不常見(jiàn)的方式發(fā)揮作用的天然成分的天然蛋白質(zhì)。
正如已經(jīng)提到的,由所選擇的宿主細(xì)胞而進(jìn)行的蛋白酶生產(chǎn)可以在其被回收前通過(guò)降解產(chǎn)物而嚴(yán)格限制了所需蛋白質(zhì)的產(chǎn)率。因此由宿主生產(chǎn)的CPY的消除或量的減少實(shí)質(zhì)上提高了所需蛋白質(zhì)的產(chǎn)率,而且可以提供商業(yè)上可行的用于重組蛋白質(zhì)生產(chǎn)的商業(yè)上通常不使用的宿主細(xì)胞。在優(yōu)選的實(shí)施方案中,CPY缺陷型細(xì)胞生產(chǎn)至少25%,優(yōu)選至少50%弱,且最佳為至少70%弱的CPY,與相應(yīng)的野生型相比,最多可喪失全部的CPY功能。
可以用本發(fā)明的突變體真菌細(xì)胞以與野生型菌株相同的方法用于重組蛋白質(zhì)的生產(chǎn)。本領(lǐng)域?qū)I(yè)人員很容易從本文所述的具體實(shí)施方案中認(rèn)識(shí)各種途徑的變化,所述實(shí)施方案根據(jù)上述菌株而對(duì)方法加以改進(jìn)。用表達(dá)載體可以表達(dá)活性形式的所需基因。有用的表達(dá)載體含有可以使所述載體穩(wěn)定整合到宿主細(xì)胞的基因組中或使載體在宿主細(xì)胞基因組外獨(dú)立自主復(fù)制的元件,以及優(yōu)選的一種或多種可以很容易地篩選轉(zhuǎn)化的宿主細(xì)胞的表型標(biāo)記。所述表達(dá)載體還可以包括編碼啟動(dòng)子的序列,核糖體結(jié)合位點(diǎn),翻譯起始密碼子和,可選擇的阻遏物基因或激活物基因。為了在控制序列的指導(dǎo)下表達(dá),根據(jù)本發(fā)明所用的基因優(yōu)選的在適當(dāng)?shù)拈喿x框中與所述的控制序列可操作相連。
表達(dá)載體可以是任何可方便地利用重組DNA技術(shù)的載體,而且載體的選擇通常取決于其所導(dǎo)入的宿主細(xì)胞。在本發(fā)明優(yōu)選的實(shí)施方案中,宿主細(xì)胞是曲霉屬的菌株。因此載體可以是自主復(fù)制載體,即可以作為染色體外個(gè)體而存在的載體,其復(fù)制獨(dú)立于染色體復(fù)制,例如質(zhì)粒或一種染色體外元件,小染色體,或人工染色體。另外,所述載體可以是當(dāng)其導(dǎo)入宿主細(xì)胞中時(shí),可整合到宿主細(xì)胞染色體并與其所整合上的染色體一起復(fù)制的載體。
在所述載體中,所需基因的序列應(yīng)與適宜的啟動(dòng)子序列可操作相連。所述啟動(dòng)子可以是在所選的宿主細(xì)胞中有轉(zhuǎn)錄活性的任何DNA序列,并且可以得自編碼與宿主細(xì)胞同源或異源的基因。為了在真菌宿主中轉(zhuǎn)錄,有用的啟動(dòng)子的例子是得自編碼米曲霉TAKA淀粉酶,Rhizomucor miehei天冬氨酸蛋白酶,黑曲霉中性α-淀粉酶,黑曲霉酸穩(wěn)定的α-淀粉酶,黑曲霉或泡盛葡糖淀粉酶(glaA),Rhizomucor miehei脂酶,米曲霉堿性蛋白酶,米曲霉丙糖磷酸異構(gòu)酶或構(gòu)巢曲霉乙酰胺酶基因的啟動(dòng)子。優(yōu)選的是TAKA-淀粉酶和glaA啟動(dòng)子。
本發(fā)明的表達(dá)載體還可以含有適宜的轉(zhuǎn)錄終止子,和在真核細(xì)胞中與編碼異源基因序列的DNA序列可操作相連的多聚腺苷酸序列。終止和多聚腺苷酸序列適宜的可從與啟動(dòng)子相同的來(lái)源得到。所述載體還可以含有能夠使載體在所研究的宿主細(xì)胞中復(fù)制的DNA序列。所述序列的實(shí)例是質(zhì)粒pUC19,pACYC177,pUB110,pE194,pAMB1和pIJ702的復(fù)制起點(diǎn)。
所述載體還可以含有選擇性標(biāo)記,例如其產(chǎn)物補(bǔ)充宿主細(xì)胞中的缺陷的基因,或賦予抗生素抗性,例如氨芐青霉素,卡那霉素,氯霉素或四環(huán)素抗性的基因。曲霉選擇標(biāo)記的實(shí)例包括amdS,PYrGmargB,niaD sC,和hygB,產(chǎn)生hygromycin抗性的標(biāo)記。在曲霉宿主細(xì)胞中優(yōu)選使用構(gòu)巢曲霉或米曲霉的amdS和pyrG。此外,例如按WO 91/17243中的描述通過(guò)共轉(zhuǎn)化來(lái)完成選擇。
通常優(yōu)選的是表達(dá)后得到細(xì)胞外產(chǎn)物。因此所述蛋白質(zhì)含有可以將表達(dá)的蛋白質(zhì)分泌到培養(yǎng)基中的前區(qū)。如果需要,所述前區(qū)可以是本發(fā)明蛋白質(zhì)的天然的,或經(jīng)編碼相應(yīng)前區(qū)的DNA序列一般取代而用不同前區(qū)或信號(hào)序列取代的。例如,所述前區(qū)可以得自曲霉種的葡糖淀粉酶或淀粉酶基因,桿菌種的淀粉酶基因,Rhizomucor miehei的脂酶或蛋白酶基因,啤酒酵母α-因子的基因或牛前原凝乳酶基因。當(dāng)宿主是真菌細(xì)胞時(shí),特別優(yōu)選的是米曲霉TAKA淀粉酶,黑曲霉中性淀粉酶,桿菌NCIB 11837的maltogenic淀粉酶,嗜熱脂肪芽孢桿菌α-淀粉酶或地衣形芽孢桿菌蛋白酶的前區(qū)。一種有效的信號(hào)序列是米曲霉TAKA淀粉酶信號(hào),Rhizomucor miehei天冬氨酸蛋白酶信號(hào)和Rhizomucormiehei脂酶信號(hào)。
分別用于連接本發(fā)明的DNA構(gòu)建體,啟動(dòng)子,終止子和其他成分然后將其插入含有復(fù)制所需的信息的適宜的載體中的方法,是本領(lǐng)域?qū)I(yè)人員熟知的(參見(jiàn)例如,Sambrook et al.,MolecularCloning,1989)。
可以用CPY缺陷型突變體表達(dá)任何所需的原核或真核蛋白質(zhì),而且優(yōu)選用于表達(dá)真核蛋白質(zhì)。這些細(xì)胞特別有用的是適用于表達(dá)過(guò)氧化氫酶,漆酶,酚氧化酶,氧化酶,氧化還原酶,纖維素酶,木聚糖酶,過(guò)氧化物酶,脂酶,水解酶,酯酶,角質(zhì)酶(cutinase)蛋白酶和其他蛋白水解酶,氨肽酶,羧肽酶,植酸酶,裂解酶,果膠酶和其他果膠水解(pectinolytic)酶,淀粉酶,葡糖淀粉酶,半乳糖苷酶,半乳糖苷酶,α-葡糖苷酶,β-葡糖苷酶,甘露糖苷酶,異構(gòu)酶,蔗糖酶,轉(zhuǎn)移酶,核糖核酸酶,幾丁質(zhì)酶和脫氧核糖核酸酶。本領(lǐng)域?qū)I(yè)人員應(yīng)該理解,術(shù)語(yǔ)“真菌酶”不僅包括天然真菌,而且包括經(jīng)氨基酸取代,缺失,加入或?yàn)樘岣咂浠钚?,熱穩(wěn)定性,pH耐受性等而修飾過(guò)的真菌酶。也可以用所述突變體表達(dá)藥物學(xué)上的異源蛋白質(zhì),例如激素,生長(zhǎng)因子,受體等。
將用下列實(shí)施例對(duì)本發(fā)明作進(jìn)一步的說(shuō)明。實(shí)施例I.分離黑曲霉CPY基因A.材料和方法i.菌株在下文描述的方法中使用了下列生物材料。E.coli K802(ek4-(nrca),mcr B,hsdR2,galD2,GalT22,WupE44,metB1;E.coliSOLP(E14-(mcrA)(mcrCB-hsdSMR-mrr)171,sbcC,recB,recJ,uvrC,umuDTn5(kanr),lacgryS96,relA1,thi-1,endA1,λR[F’proAB lacIqZΔM15]Su-,E.coliJM101supE,thi-1,Δ(lac-proAB),[F’traD36,proAB,lacIqZΔM15],E.coli XL-1 Blue rec A1,endA1,gyr A96,thi-1,hsdR17,supE44,relA1,lac[F’proAB lacIqZΔM15,Tn10(tetR)],黑曲霉Bo-1,黑曲霉SFAG-2。
ii.PCR擴(kuò)增用標(biāo)準(zhǔn)技術(shù)在45℃退火來(lái)進(jìn)行PCR。用黑曲霉Bo-1基因組DNA作為模板,用下列簡(jiǎn)并寡核苷酸。引物 1-1(94-282)-GGIGGICCIGGITGYTC引物 1-2(94-283)-GGIGGICCIGGITGYAG引物 2-1(94-284)-CCIAGCCARTTRCADAT引物 2-2(94-285)-CCYAACCARTTRCADAT引物 3-1(94-331)-GTIGGITTYTCITAYTCIGG引物 3-2(94-332)-GTIGGITTYAGYTAYAGYGG引物 4-1(94-329)-GARTCITAYGCIGGICAYTA引物 2-1(94-284)-GARAGYTAYGCIGGICAYTA在上述引物中I代表肌苷,Y代表C或T,R代表A或G,D代表A,G或T。iii.亞克隆PCR產(chǎn)物按制造商的說(shuō)明,用TA Cloning試劑盒(Invitrogen)將PCR產(chǎn)物亞克隆以進(jìn)行測(cè)序。iv.從λZap II體內(nèi)切割通過(guò)在大腸桿菌SOLR中傳代,然后按照Strategene提供的方法,可從CPY cDNAλZap克隆獲得含有在pBluescript SK載體中攜帶了cDNA插入子的質(zhì)粒。v.DNA測(cè)序用熒光標(biāo)記的核苷酸,利用聚合酶循環(huán)測(cè)序確定核苷酸測(cè)序。在Applied Biosystems自動(dòng)DNA測(cè)序儀(Model 363 A,1.20版)上電泳測(cè)序反應(yīng)產(chǎn)物。使用下列CPY特異性引物,再使用M13反向(-48)和M13(-20)前向引物(Sanger et al.,J.Mol.Biol.143163-178)94-376TCGCTGCCAGTCTATGATTGA94-377ACATCAACCGCAACTTCCTCT94-378TTGCCAATGAGAACGGACTGC94-379CGCACTTACCACGGACATCAT94-503CAAGCATCCTCAAACTATCGT94-504GAGACGCATGAAGGTGAAGTT94-505GCCGTCCCTCCCTTCCAGCAG94-506GTGCCGACGGGTTCTCCAAGC94-507GCAGCGAGGAAGAGCGTTGTC94-510GGGTCATTCTCGGGGTCATTG94-511GACCCCGAGAATGACCCTGTT94-512GTAGGGCTTCATCCAGTCACC94-513TCTCACCGTTCTCACCAGTAA94-514TCCCTCCCCAAGAAGCACAAC94-528AGCGTCTGGGTTACTGGTGAG94-529AAGATCGGCCAGGTCAAGTCC94-530GAGACGGTGGTAGGGCTTCAT94-531AACGTCGGTTACTCTTACAGC94-532GTGGTCGGGGCGGCGGTTGTG94-533TGTTTGAAGAAGAGGGTAAGC94-575CGCTGCTACTTGATTTTTCTA94-576CTCAGCGCCAACAGCCTCAAT94-577ACCTGCAGTCCGTTCTTATTG94-634TGCGATCGATTCATTCTCATC94-635GGAGTAACCGACATTGACAGG94-536CCTGTCAATGTCGGTTACTCC94-637GTCCCATGGCAACTTCACCTT94-646CTTCTCACCGTTCTCACCAGT94-647CGAGACTCGAAGAACCCTAAGB.結(jié)果用黑曲霉Bo-1基因組DNA為模板,,使用各種組合的CPY特異性簡(jiǎn)并寡核苷酸,引物1-1,1-2,2-1和2-2(圖1)完成PCR反應(yīng)。所有的反應(yīng)均以一個(gè)循環(huán)為95℃5分鐘,45℃1分鐘和72℃2分鐘,接著進(jìn)行25個(gè)下一循環(huán),即95℃1分鐘,45℃1分鐘和72℃2分鐘。在瓊脂糖凝膠上將反應(yīng)物小樣(10μl)電泳,在兩個(gè)反應(yīng)中,一個(gè)使用引物1-2和2-1,另一個(gè)使用引物1-2和2-2,約1100bp的擴(kuò)增產(chǎn)物占大部分。使用假設(shè)在那兒的這些寡核苷酸組合而預(yù)期的產(chǎn)物的大小在900bp的基因內(nèi)沒(méi)有內(nèi)含子,使用前向和反向引物將1100bp的擴(kuò)增產(chǎn)物亞克隆并測(cè)序。7個(gè)亞克隆被測(cè)序,但是,沒(méi)有一個(gè)與CPY密碼子同源。
使用與上述相同的條件,完成使用各種引物組合3-1,3-2,4-1,4-2,2-1和2-2的PCR。在瓊脂糖凝膠上電泳小樣,在兩個(gè)反應(yīng)中,一個(gè)使用引物4-1和2-1,另一個(gè)使用引物4-2和2-1,約600bp的擴(kuò)增產(chǎn)物占大部分。根據(jù)與其它羧肽酶的同源性而預(yù)測(cè)的該擴(kuò)增產(chǎn)物的大少為600bp。將600bp的擴(kuò)增產(chǎn)物亞克隆,用前向和反向引物確定11個(gè)亞克隆的DNA序列。11個(gè)克隆中的9個(gè)以與啤酒酵母有69%的一致性為基礎(chǔ),為黑曲霉CPY的密碼子。。所有9個(gè)均彼此相同,說(shuō)明在黑曲霉中只有一個(gè)羧肽酶基因。將含有600bp黑曲霉CPY PCR產(chǎn)物的亞克隆稱為pDSY17。
用pDSY17的插入子探測(cè)黑曲霉Bo-1基因組DNA的Southerm印跡。用Gibco-BRL的缺口-翻譯試劑盒放射性標(biāo)記探針。所用的雜交條件為于60℃,在1.5×SSPE,1%SDS和0.5%脫脂牛奶和200μg/ml鮭精DNA。于65℃用0.2×SSC,1%SDS和0.1%焦磷酸鈉將印跡洗滌兩次,每次15分鐘。在BamHI,HindIII和SalI的消化產(chǎn)物中,約10,5.5和7kb的單帶分別與CPY探針雜交。
為了分離CPY的全長(zhǎng)基因,用PCR-產(chǎn)生的CPY基因片段(用Gibco-BRL的缺口-翻譯試劑盒標(biāo)記的),探測(cè)含有約26,000個(gè)重組體的黑曲霉Bo-1的EMBL4中的基因組庫(kù)。將約28,000個(gè)噬菌斑放在濾器上并檢測(cè)。從這些平皿中撿出11個(gè)陽(yáng)性的。純化后,9個(gè)一級(jí)克隆仍與CPY探針雜交。從9個(gè)克隆中分離DNA,進(jìn)行限制酶消化以對(duì)其進(jìn)行表征。從限制圖譜看,9個(gè)中有7個(gè)是相同的。其他兩個(gè)克隆是特有的。從克隆的Southern產(chǎn)物,確定9個(gè)中的8個(gè)含有與CPY探針雜交的約5.5kb的相同HindIII片段。不含有相同HindIII片段的克隆含有較大(>12kb)的與CPY探針雜交的HindIII片段。亞克隆共有的HindIII片段以進(jìn)行DNA測(cè)序?;蚪MDNA序列和推測(cè)的氨基酸序列示于圖1。
再篩選黑曲霉SFAG-2的λZAPII(Stratagene)中的cDNA庫(kù)。將42,000個(gè)噬菌斑放到濾器上,然后用上述的CPY探針檢測(cè),在嚴(yán)格的上述條件下,112個(gè)這樣的噬菌斑進(jìn)行了雜交。撿出開(kāi)始的20個(gè),然后進(jìn)行再篩選,純化后,18個(gè)仍與CPY探針雜交。從4個(gè)陽(yáng)性克隆中,用配有λZAP試劑盒的體內(nèi)切割方法分離DNA。用EcoRI消化獲救的質(zhì)粒,然后在瓊脂糖凝膠上電泳以確定插入片段的大小。兩個(gè)克隆(2-1和3-2)似乎有足夠大的插入片段,可含有全長(zhǎng)CPY的cDNA,而且各含有約1700和250bp的兩個(gè)EcoRI片段。預(yù)計(jì)的全長(zhǎng)cDNA的大小約為1600bp。另兩個(gè)cDNA克隆(2-2和2-4)含有較小的插入片段,但是,它們均含有250bp的EcoRI片段。確定了克隆3-2和2-2的部分DNA序列,3-2含有全長(zhǎng)cDNA,而克隆2-2在5’末端被截?cái)嗉s200bp。
確定了兩個(gè)鏈的完整cDNA序列(圖2)。認(rèn)為cDNA編碼557個(gè)氨基酸長(zhǎng)的CPY前體。到目前為止,cDNA和基因組克隆之間的大多數(shù)核苷酸差異均處于擺動(dòng)范圍內(nèi),這點(diǎn)不令人驚奇,因?yàn)樗鼈兪莵?lái)自兩個(gè)不同的黑曲霉菌株。以啤酒酵母的CPY排列為基礎(chǔ),黑曲霉CPY看起來(lái)含有信號(hào)肽和前肽,成熟CPY蛋白質(zhì)為419或420個(gè)氨基酸長(zhǎng)。黑曲霉CPY與啤酒酵母和C.albicans的CPY(Mukhtar et al.,Gene 121173-177,1992)分別有約65%和66%的一致性。II制備CPY缺陷型突變體為了產(chǎn)生缺失了CPY的黑曲霉菌株,制備其中米曲霉pyrG基因插入到CPY編碼區(qū)中的構(gòu)建體(圖3)。將含有幾乎完整CPY基因和約6kb基因下游的約6.5kb HindIII片段亞克隆到pKS+(Stratagene)衍生物中,其中破壞了PstI位點(diǎn)。用PstI消化所得的重組體,以便從CPY編碼區(qū)缺失815 bp的片段,加入T4 DNA聚合酶和所有4種dNTP而補(bǔ)平因PstI消化而產(chǎn)生的懸末端。將所得的平整末端載體與通過(guò)用Hind III消化,然后用Klenow片段填平而得到的約3.8kb平整末端的片段相連。用Hind III消化其中含有pyrG插入片段的最終構(gòu)建體,以得到用于轉(zhuǎn)化黑曲霉pyrG菌株的線性片段,在基本培養(yǎng)基上生長(zhǎng)進(jìn)行篩選。用Southern印跡篩選轉(zhuǎn)化體以確定那些菌株含有破壞的CPY基因。用Western印跡分析轉(zhuǎn)化體以尋找在細(xì)胞內(nèi)丟失的CPY。一旦鑒定了一個(gè)菌株含有破壞了的CPY,就可以確定對(duì)異源蛋白質(zhì)的影響。生物材料的保藏已于1994年9月13日將下列生物材料保藏在AgriculturalResearch Service Culture Collection(NRRL)1815 North UniversityStreet,Peoria,Illinois 61604。細(xì)胞系 保藏號(hào)含有pDSY23的 NRRL B-21326E.coli(EMCC#0120)
序列表(1)一般資料(i)申請(qǐng)人(A)名稱Novo Nordisk Biotech,Inc.
(B)街道1445 Drew Avenue(C)城市Davis(D)州California(E)國(guó)家US(F)郵編95616-4880(G)電話(916)757-8100(H)電傳(916)758-0317(ii)發(fā)明題目編碼黑曲霉羧肽酶的基因(iii)序列數(shù)目4(iv)相關(guān)地址(A)收件人Novo Nordisk of North America,Inc.
(B)街道405 Lexington Avenue,Suite 6400(C)城市New York(D)州New York(E)國(guó)家U.S.A.
(F)郵編10174-6401(v)計(jì)算機(jī)可讀形式(A)介質(zhì)類型軟盤(pán)
(B)計(jì)算機(jī)IBM PC(C)操作系統(tǒng)PC-DOS/MS-DOS(D)軟件PatentIn Release #1.0,Version #1.25(EPO)(vi)目前的申請(qǐng)資料(A)申請(qǐng)?zhí)朥S(B)申請(qǐng)日19-9月-1995(C)分類號(hào)(vii)在先申請(qǐng)資料(A)申請(qǐng)?zhí)朥S 08/309,341(B)申請(qǐng)日20-9月-1994(viii)代理人/代理資料(A)姓名Lowney,Karen A.
(B)登記號(hào)31,274(C)文件號(hào)4247.204-WO(ix)通訊資料(A)電話212 867 0123(B)電傳212 867 0298(2)SEQ ID NO1的資料(i)序列特征(A)長(zhǎng)度2068個(gè)堿基對(duì)(B)類型核酸(C)鏈型雙鏈
(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型基因組DNA(vi)來(lái)源(A)生物黑曲霉(ix)特征(A)名稱/關(guān)鍵詞內(nèi)含子(B)位置572...632(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置連接(571..633)(xi)序列描述SEQ ID NO1TCCTCTGCCT ACTCATCCCA TCACCATCTC AATTCATACC GCCCCCGTGG GGTTTCAGCA60CCA ATG AGA GTC CTT CCA GCT GCT ATG CTG GTT GGA GCG GCC ACG GCG 108Met Arg Val Leu Pro Ala Ala Met Leu Val Gly Ala Ala Thr Ala1 5 10 15GCC GTT CCT CCC TTC CAG CAG GTC CTT GGA GGT AAC GGT GCC AAG CAC 156Ala Val Pro Pro Phe Gln Gln Val Leu Gly Gly Asn Gly Ala Lys His20 25 30GGT GCC GAC CAT GCG GCC GAG GTC CCT GCG GAT CAC AGT GCC GAC GGG 204Gly Ala Asp His Ala Ala Glu Val Pro Ala Asp His Ser Ala Asp Gly35 40 45TTC TCC AAG CCG CTG CAC GCA TTC CAG GAG GAG CTG AAG TCT CTC TCT 252Phe Ser Lys Pro Leu His Ala Phe Gln Glu Glu Leu Lys Ser Leu Ser50 55 60GAC GAG GCT CGT AAG CTT TGG GAT GAG GTG GCC AGC TTC TTC CCG GAG 300Asp Glu Ala Arg Lys Leu Trp Asp Glu Val Ala Ser Phe Phe Pro Glu65 70 75AGC ATG GAT CAG AAC CCT CTC TTT TCC CTC CCC AAG AAG CAC AAC CGC 348Ser Met Asp Gln Asn Pro Leu Phe Ser Leu Pro Lys Lys His Asn Arg80 85 90 95CGT CCC GAC TCG CAC TGG GAC CAC ATC GTC CGC GGC TCC GAC GTT CAG 396Arg Pro Asp Ser His Trp Asp His Ile Val Arg Gly Ser Asp Val Gln100 105 110AGC GTC TGG GTC ACT GGT GAG AAC GGT GAG AAG GAG CGC GAG GTC GAT 444Ser Val Trp Val Thr Gly Glu Asn Gly Glu Lys Glu Arg Glu Val Asp115 120 125GGC AAG CTG GAA GCC TAT GAT CTC AGG GTC AAG AAG ACC GAT CCT GGC 492Gly Lys Leu Glu Ala Tyr Asp Leu Arg Val Lys Lys Thr Asp Pro Gly130 135 140TCT CTT GGC ATC GAC CCC GGC GTG AAG CAG TAC ACC GGT TAT CTC GAT 540Ser Leu Gly Ile Asp Pro Gly Val Lys Gln Tyr Thr Gly Tyr Leu Asp145 150 155GAC AAC GAG AAT GAT AAG CAT TTG TTC TAC GTAAGCACAC CTTGGTTCAA 590Asp Asn Glu Asn Asp Lys His Leu Phe Tyr160 165GATCACGCTT TTTATATGCT CTGGATATCT AACGCAACTT AG TGG TTC TTC GAG 644Trp Phe Phe Glu170TCT CGC AAT GAC CCC GAG AAT GAT CCC GTT GTT CTG TGG CTG AAC GGT 692Ser Arg Asn Asp Pro Glu Asn Asp Pro Val Val Leu Trp Leu Asn Gly175 180 185GGC CCT GGG TGC TCT TCC CTC ACC GGT CTC TTC ATG GAG CTT GGC CCT 740Gly Pro Gly Cys Ser Ser Leu Thr Gly Leu Phe Met Glu Leu Gly Pro190 195 200 205AGC AGC ATC AAC AAG AAG ATC CAG CCG GTC TAC AAT GAC TAC GCT TGG 788Ser Ser Ile Asn Lys Lys Ile Gln Pro Val Tyr Asn Asp Tyr Ala Trp210 215 220AAC TCC AAC GCG TCC GTG ATC TTC CTT GAC CAG CCT GTC AAT GTC GGT 836Asn Ser Asn Ala Ser Val Ile Phe Leu Asp Gln Pro Val Asn Val Gly225 230 235TAC TCC TAC AGT AAC TCT GCT GTC AGC GAC ACG GTC GCT GCT GGC AAG 884Tyr Ser Tyr Ser Asn Ser Ala Val Ser Asp Thr Val Ala Ala Gly Lys240 245 250GAC GTC TAT GCC TTG CTT ACC CTC TTC TTC AAA CAA TTC CCC GAG TAT 932Asp Val Tyr Ala Leu Leu Thr Leu Phe Phe Lys Gln Phe Pro Glu Tyr255 260 265GCT AAG CAG GAC TTC CAC ATT GCC GGT GAA TCT TAT GCT GGT CAC TAT 980Ala Lys Gln Asp Phe His Ile Ala Gly Glu Ser Tyr Ala Gly His Tyr270 275 280 285ATC CCC GTC TTC GCT TCG GAG ATC CTG TCT CAC AAG AAG CGC AAC ATC1028Ile Pro Val Phe Ala Ser Glu Ile Leu Ser His Lys Lys Arg Asn Ile290 295 300AAC CTG CAG TCC GTT CTC ATT GGC AAC GGT CTC ACC GAC GGA TAC ACC1076Asn Leu Gln Ser Val Leu Ile Gly Asn Gly Leu Thr Asp Gly Tyr Thr305 310 315CAG TAC GAG TAC TAC CGT CCC ATG GCC TGC GGT GAC GGC GGT TAC CCA1124Gln Tyr Glu Tyr Tyr Arg Pro Met Ala Cys Gly Asp Gly Gly Tyr Pro320 325 330GCT GTC TTG GAC GAG AGC TCC TGC CAG TCC ATG GAC AAC GCT CTT CCT1172Ala Val Leu Asp Glu Ser Ser Cys Gln Ser Met Asp Asn Ala Leu Pro335 340 345CGC TGC CAG TCT ATG ATT GAG TCT TGC TAC AGT TCC GAG AGC GCT TGG1220Arg Cys Gln Ser Met Ile Glu Ser Cys Tyr Ser Ser Glu Ser Ala Trp350 355 360 365GTT TGT GTC CCG GCC TCC ATC TAC TGT AAC AAC GCC CTC CTT GCC CCT1268Val Cys Val Pro Ala Ser Ile Tyr Cys Asn Asn Ala Leu Leu Ala Pro370 375 380TAC CAG CGC ACT GGG CAG AAC GTC TAT GAT GTC CGT GGT AAG TGC GAG1316Tyr Gln Arg Thr Gly Gln Asn Val Tyr Asp Val Arg Gly Lys Cys Glu385 390 395GAT AGC TCT AAC CTT TGC TAC TCG GCT ATG GGC TAC GTC AGC GAC TAC1364Asp Ser Ser Asn Leu Cys Tyr Ser Ala Met Gly Tyr Val Ser Asp Tyr400 405 410CTG AAC AAG CCC GAA GTC ATC GAG GCT GTT GGC GCT GAG GTC AAC GGC1412Leu Asn Lys Pro Glu Val Ile Glu Ala Val Gly Ala Glu Val Asn Gly415 420 425TAC GAC TCG TGC AAC TTT GAC ATC AAC CGC AAC TTC CTC TTC CAC GGT1460Tyr Asp Ser Cys Asn Phe Asp Ile Asn Arg Asn Phe Leu Phe His Gly430 435 440 445GAC TGG ATG AAG CCC TAC CAC CGC CTC GTT CCG GGA CTC CTG GAG CAG1508Asp Trp Met Lys Pro Tyr His Arg Leu Val Pro Gly Leu Leu Glu Gln450 455 460ATC CCT GTC TTG ATC TAT GCC GGT GAT GCT GAT TTC ATT TGC AAC TGG1556Ile Pro Val Leu Ile Tyr Ala Gly Asp Ala Asp Phe Ile Cys Asn Trp465 470 475CTG GGC AAC AAG GCC TGG ACT GAA GCC CTG GAG TGG CCC GGA CAG GCT1604Leu Gly Asn Lys Ala Trp Thr Glu Ala Leu Glu Trp Pro Gly Gln Ala480 485 490GAA TAT GCC TCC GCT GAG CTG GAG GAT CTG GTC ATT GTC GAC AAT GAG1652Glu Tyr Ala Ser Ala Glu Leu Glu Asp Leu Val Ile Val Asp Asn Glu495 500 505CAC ACG GGC AAG AAG ATT GGC CAG GTT AAG TCC CAT GGC AAC TTC ACC1700His Thr Gly Lys Lys Ile Gly Gln Val Lys Ser His Gly Asn Phe Thr510 515 520 525TTC ATG CGT CTC TAT GGT GGT GGC CAC ATG GTC CCG ATG GAC CAG CCC1748Phe Met Arg Leu Tyr Gly Gly Gly His Met Val Pro Met Asp Gln Pro530 535 540GAG TCG AGT CTC GAG TTC TTC AAC CGC TGG TTG GGA GGT GAA TGG TTC1796Glu Ser Ser Leu Glu Phe Phe Asn Arg Trp Leu Gly Gly Glu Trp Phe545 550 555TAA AGACGTGCTA CCACCGCATA TAGACTTTCT GGTCATTTCG GTGACACTGC 1849AGATATGTTT CTTAACGATA GTTTGAGCAT GCTTGTCAAT GCCCACTAGT CCCGATCCTT 1909ATATGTTGCA TGGTATCTAT GAGTTTTGTC ACTATAGTGC ATTATACATG TGTACTTCGT 1969ATGAGAATGA ATCGATCGCA TTTACACGCA TATAAATAGT ACCCACCTCC GCCTGGACAT 2029GAATTAGGCC CGGCCAGTCG TTTACATACA GTGCTAGAA 2068(2)SEQ ID NO2的資料(i)序列特征(A)長(zhǎng)度557個(gè)氨基酸(B)類型氨基酸(C)鏈型單鏈
(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(vi)來(lái)源(A)生物黑曲霉(xi)序列描述SEQ ID NO2Met Arg Val Leu Pro Ala Ala Met Leu Val Gly Ala Ala Thr Ala Ala1 5 10 15Val Pro Pro Phe Gln Gln Val Leu Gly Gly Asn Gly Ala Lys His Gly20 25 30Ala Asp His Ala Ala Glu Val Pro Ala Asp His Ser Ala Asp Gly Phe35 40 45Ser Lys Pro Leu His Ala Phe Gln Glu Glu Leu Lys Ser Leu Ser Asp50 55 60Glu Ala Arg Lys Leu Trp Asp Glu Val Ala Ser Phe Phe Pro Glu Ser65 70 75 80Met Asp Gln Asn Pro Leu Phe Ser Leu Pro Lys Lys His Asn Arg Arg85 90 95Pro Asp Ser His Trp Asp His Ile Val Arg Gly Ser Asp Val Gln Ser100 105 110Val Trp Val Thr Gly Glu Asn Gly Glu Lys Glu Arg Glu Val Asp Gly115 120 125Lys Leu Glu Ala Tyr Asp Leu Arg Val Lys Lys Thr Asp Pro Gly Ser130 135 140Leu Gly Ile Asp Pro Gly Val Lys Gln Tyr Thr Gly Tyr Leu Asp Asp145 150 155 160Asn Glu Asn Asp Lys His Leu Phe Tyr Trp Phe Phe Glu Ser Arg Asn165 170 175Asp Pro Glu Asn Asp Pro Val Val Leu Trp Leu Asn Gly Gly Pro Gly180 185 190Cys Ser Ser Leu Thr Gly Leu Phe Met Glu Leu Gly Pro Ser Ser Ile195 200 205Asn Lys Lys Ile Gln Pro Val Tyr Asn Asp Tyr Ala Trp Asn Ser Asn210 215 220Ala Ser Val Ile Phe Leu Asp Gln Pro Val Asn Val Gly Tyr Ser Tyr225 230 235 240Ser Asn Ser Ala Val Ser Asp Thr Val Ala Ala Gly Lys Asp Val Tyr245 250 255Ala Leu Leu Thr Leu Phe Phe Lys Gln Phe Pro Glu Tyr Ala Lys Gln260 265 270Asp Phe His Ile Ala Gly Glu Ser Tyr Ala Gly His Tyr Ile Pro Val275 280 285Phe Ala Ser Glu Ile Leu Ser His Lys Lys Arg Asn Ile Asn Leu Gln290 295 300Ser Val Leu Ile Gly Asn Gly Leu Thr Asp Gly Tyr Thr Gln Tyr Glu305 310 315 320Tyr Tyr Arg Pro Met Ala Cys Gly Asp Gly Gly Tyr Pro Ala Val Leu325 330 335Asp Glu Ser Ser Cys Gln Ser Met Asp Asn Ala Leu Pro Arg Cys Gln340 345 350Ser Met Ile Glu Ser Cys Tyr Ser Ser Glu Ser Ala Trp Val Cys Val355 360 365Pro Ala Ser Ile Tyr Cys Asn Asn Ala Leu Leu Ala Pro Tyr Gln Arg370 375 380Thr Gly Gln Asn Val Tyr Asp Val Arg Gly Lys Cys Glu Asp Ser Ser385 390 395 400Asn Leu Cys Tyr Ser Ala Met Gly Tyr Val Ser Asp Tyr Leu Asn Lys405 410 415Pro Glu Val Ile Glu Ala Val Gly Ala Glu Val Asn Gly Tyr Asp Ser420 425 430Cys Asn Phe Asp Ile Asn Arg Asn Phe Leu Phe His Gly Asp Trp Met435 440 445Lys Pro Tyr His Arg Leu Val Pro Gly Leu Leu Glu Gln Ile Pro Val450 455 460Leu Ile Tyr Ala Gly Asp Ala Asp Phe Ile Cys Asn Trp Leu Gly Asn465 470 475 480Lys Ala Trp Thr Glu Ala Leu Glu Trp Pro Gly Gln Ala Glu Tyr Ala485 490 495Ser Ala Glu Leu Glu Asp Leu Val Ile Val Asp Asn Glu His Thr Gly500 505 510Lys Lys Ile Gly Gln Val Lys Ser His Gly Asn Phe Thr Phe Met Arg515 520 525Leu Tyr Gly Gly Gly His Met Val Pro Met Asp Gln Pro Glu Ser Ser530 535 540Leu Glu Phe Phe Asn Arg Trp Leu Gly Gly Glu Trp Phe545 550 555(2)SEQ ID NO3的資料(i)序列特征(A)長(zhǎng)度2002個(gè)堿基對(duì)(B)類型核酸(C)鏈型雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性
(ii)分子類型cDNA(vi)來(lái)源(A)生物黑曲霉(ix)特征(A)名稱/關(guān)鍵詞內(nèi)含子(B)位置349...411(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置連接(348..412)(xi)序列描述SEQ ID NO3GCGGCCGCTG CTACTTGCTT TTTCTAATTT GATACTTTTG TGTCCGTACC GTACCTTCCA 60GACCGCAAGG TACCCATCCT CTACCTACTC ATCCCATCAT CATCTCGATT TCATACCAAC 120CCCGTTGGGT TTCAACACA ATG AGA GTT CTT CCA GCT GCT ATG CTG GTT GGA 172Met Arg Val Leu Pro Ala Ala Met Leu Val Gly1 5 10GCG GGC ACT GCG GCC GTC CCT CCC TTC CAG CAG GTC CTT GGA GGT AAC 220Ala Gly Thr Ala Ala Val Pro Pro Phe Gln Gln Val Leu Gly Gly Asn15 20 25GGT GCC AAG CAC GGT GCC GAC CAT GCG GCC GAG GTC CCT GCG GAT CAC 268Gly Ala Lys His Gly Ala Asp His Ala Ala Glu Val Pro Ala Asp His30 35 40AGT GCC GAC GGG TTC TCC AAG CCG CTG CAC GCA TTC CAG GAG GAG CTG 316Ser Ala Asp Gly Phe Ser Lys Pro Leu His Ala Phe Gln Glu Glu Leu45 50 55AAG TCT CTC TCT GAT GAG GCT CGT AAG CTC TGG GAT GAG GTT GCT AGC 364Lys Ser Leu Ser Asp Glu Ala Arg Lys Leu Trp Asp Glu Val Ala Ser60 65 70 75TTC TTC CCG GAG AGC ATG GAT CAG AAC CCT CTC TTC TCC CTC CCC AAG 412Phe Phe Pro Glu Ser Met Asp Gln Asn Pro Leu Phe Ser Leu Pro Lys80 85 90AAG CAC AAC CGC CGC CCC GAC CAC CAC TGG GAC CAC ATC GTC CGC GGC 460Lys His Asn Arg Arg Pro Asp His His Trp Asp His Ile Val Arg Gly95 100 105TCC GAC GTT CAG AGC GTC TGG GTT ACT GGT GAG AAC GGT GAG AAG GAG 508Ser Asp Val Gln Ser Val Trp Val Thr Gly Glu Asn Gly Glu Lys Glu110 115 120CGT GAG GTC GAT GGC AAG CTG GAA GCC TAT GAT CTC AGG GTC AAG AAG556Arg Glu Val Asp Gly Lys Leu Glu Ala Tyr Asp Leu Arg Val Lys Lys125 130 135ACC GAT CCT AGC TCT CTT GGC ATC GAC CCT GGC GTA AAG CAG TAC ACC604Thr Asp Pro Ser Ser Leu Gly Ile Asp Pro Gly Val Lys Gln Tyr Thr140 145 150 155GGT TAT CTC GAT GAC AAC GAG AAC GAC AAG CAT CTG TTC TAC TGG TTC652Gly Tyr Leu Asp Asp Asn Glu Asn Asp Lys His Leu Phe Tyr Trp Phe160 165 170TTC GAG TCT CGC AAT GAC CCC GAG AAT GAC CCT GTT GTT CTG TGG CTG700Phe Glu Ser Arg Asn Asp Pro Glu Asn Asp Pro Val Val Leu Trp Leu175 180 185AAC GGT GGC CCT GGA TGC TCT TCC CTC ACC GGT CTT TTC ATG GAG CTC748Asn Gly Gly Pro Gly Cys Ser Ser Leu Thr Gly Leu Phe Met Glu Leu190 195 200GGC CCT AGC AGC ATC AAC AAG AAG ATC CAG CCG GTC TAC AAC GAC TAC796Gly Pro Ser Ser Ile Asn Lys Lys Ile Gln Pro Val Tyr Asn Asp Tyr205 210 215GCT TGG AAC TCC AAC GCG TCC GTG ATC TTC CTT GAC CAG CCT GTC AAC844Ala Trp Asn Ser Asn Ala Ser Val Ile Phe Leu Asp Gln Pro Val Asn220 225 230 235GTC GGT TAC TCT TAC AGC AAC TCT GCT GTC AGC GAC ACC GTT GCT GCT892Val Gly Tyr Ser Tyr Ser Asn Ser Ala Val Ser Asp Thr Val Ala Ala240 245250GGC AAG GAC GTC TAT GCC TTG CTT ACC CTC TTC TTC AAA CAA TTC CCC940Gly Lys Asp Val Tyr Ala Leu Leu Thr Leu Phe Phe Lys Gln Phe Pro255 260 265GAG TAT GCC AAG CAG GAC TTC CAC ATT GCC GGT GAA TCC TAT GCT GGT988Glu Tyr Ala Lys Gln Asp Phe His Ile Ala Gly Glu Ser Tyr Ala Gly270 275 280CAC TAT ATC CCC GTC TTT GCT TCG GAG ATT TTG TCT CAC AAG AAG CGC 1036His Tyr Ile Pro Val Phe Ala Ser Glu Ile Leu Ser His Lys Lys Arg285 290 295AAC ATC AAC CTG CAG TCC GTT CTT ATT GGC AAC GGT CTC ACC GAC GGT 1084Asn Ile Asn Leu Gln Ser Val Leu Ile Gly Asn Gly Leu Thr Asp Gly300 305 310 315CTC ACT CAG TAC GAG TAC TAC CGT CCC ATG GCC TGT GGT GAC GGT GGT 1132Leu Thr Gln Tyr Glu Tyr Tyr Arg Pro Met Ala Cys Gly Asp Gly Gly320 325 330TAC CCA GCT GTC TTG GAC GAG GGC TCC TGC CAG GCC ATG GAC AAC GCC 1180Tyr Pro Ala Val Leu Asp Glu Gly Ser Cys Gln Ala Met Asp Asn Ala335 340 345CTT CCT CGC TGC CAG TCT ATG ATT GAG TCT TGC TAT AGT TCC GAG AGC 1228Leu Pro Arg Cys Gln Ser Met Ile Glu Ser Cys Tyr Ser Ser Glu Ser350 355 360GCT TGG GTT TGT GTC CCG GCC TCC ATC TAC TGT AAC AAC GCC CTC CTT 1276Ala Trp Val Cys Val Pro Ala Ser Ile Tyr Cys Asn Asn Ala Leu Leu365 370 375GCC CCT TAC CAG CGC ACC GGA CAG AAC GTC TAC GAT GTT CGT GGT AAG 1324Ala Pro Tyr Gln Arg Thr Gly Gln Asn Val Tyr Asp Val Arg Gly Lys380 385 390 395TGC GAG GAT AGC TCC AAC CTC TGC TAC TCG GCC ATG GGC TAC GTC AGC 1372Cys Glu Asp Ser Ser Asn Leu Cys Tyr Ser Ala Met Gly Tyr Val Ser400 405 410GAC TAC CTG AAC AAG ACC GAG GTC ATT GAG GCT GTT GGC GCT GAG GTC 1420Asp Tyr Leu Asn Lys Thr Glu Val Ile Glu Ala Val Gly Ala Glu Val415 420 425AAC GGC TAC GAC TCG TGC AAC TTT GAC ATC AAC CGC AAC TTC CTC TTC 1468Asn Gly Tyr Asp Ser Cys Asn Phe Asp Ile Asn Arg Asn Phe Leu Phe430 435 440CAC GGT GAC TGG ATG AAG CCC TAC CAC CGT CTC GTT CCG GGA CTC CTG 1516His Gly Asp Trp Met Lys Pro Tyr His Arg Leu Val Pro Gly Leu Leu445 450 455GAG CAG ATC CCT GTC CTG ATC TAC GCT GGT GAC GCC GAT TTC ATC TGC 1564Glu Gln Ile Pro Val Leu Ile Tyr Ala Gly Asp Ala Asp Phe Ile Cys460 465 470 475AAC TGG CTG GGC AAC AAG GCC TGG ACT GAA GCC CTT GAG TGG CCC GGA 1612Asn Trp Leu Gly Asn Lys Ala Trp Thr Glu Ala Leu Glu Trp Pro Gly480 485 490CAG GCT GAA TAT GCC TCC GCT AAG CTG GAG GAC CTG GTC GTG GTC GAG 1660Gln Ala Glu Tyr Ala Ser Ala Lys Leu Glu Asp Leu Val Val Val Glu495 500 505AAT GAG CAC AAG GGC AAG AAG ATC GGC CAG GTC AAG TCC CAT GGC AAC 1708Asn Glu His Lys Gly Lys Lys Ile Gly Gln Val Lys Ser His Gly Asn510 515 520TTC ACC TTC ATG CGT CTC TAT GGC GGT GGC CAC ATG GTC CCG ATG GAC 1756Phe Thr Phe Met Arg Leu Tyr Gly Gly Gly His Met Val Pro Met Asp525 530 535CAA CCC GAG TCG AGT CTT GAA TTC TTC AAC CGC TGG TTG GGA GGT GAA 1804Gln Pro Glu Ser Ser Leu Glu Phe Phe Asn Arg Trp Leu Gly Gly Glu540 545 550 555TGG TTT TAA AGACGTGCTA TCACCGCATA TAGACTTTCC GGTCATTTCG GTGACACTGC1863Trp PheAGATATGTTT CTTAACGATA GTTTGAGGAT GCTTGTCAAT GCCCACTAAT CCCGAGCCTT 1923ATGTTACATG GTATCTATGA GTTTGTCATT ATAGTGCATT ATGCATTTGT ACTCCGTACG 1983AGAATGAATC AGCGGCCGC 2002(2)SEQ ID NO4的資料(i)序列特征(A)長(zhǎng)度557個(gè)氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)
(vi)來(lái)源(A)生物黑曲霉(xi)序列描述SEQ ID NO4Met Arg Val Leu Pro Ala Ala Met Leu Val Gly Ala Gly Thr Ala Ala1 5 10 15Val Pro Pro Phe Gln Gln Val Leu Gly Gly Asn Gly Ala Lys His Gly20 25 30Ala Asp His Ala Ala Glu Val Pro Ala Asp His Ser Ala Asp Gly Phe35 40 45Ser Lys Pro Leu His Ala Phe Gln Glu Glu Leu Lys Ser Leu Ser Asp50 55 60Glu Ala Arg Lys Leu Trp Asp Glu Val Ala Ser Phe Phe Pro Glu Ser65 70 75 80Met Asp Gln Asn Pro Leu Phe Ser Leu Pro Lys Lys His Asn Arg Arg85 90 95Pro Asp His His Trp Asp His Ile Val Arg Gly Ser Asp Val Gln Ser100 105 110Val Trp Val Thr Gly Glu Asn Gly Glu Lys Glu Arg Glu Val Asp Gly115 120 125Lys Leu Glu Ala Tyr Asp Leu Arg Val Lys Lys Thr Asp Pro Ser Ser130 135 140Leu Gly Ile Asp Pro Gly Val Lys Gln Tyr Thr Gly Tyr Leu Asp Asp145 150 155 160Asn Glu Asn Asp Lys His Leu Phe Tyr Trp Phe Phe Glu Ser Arg Asn165 170 175Asp Pro Glu Asn Asp Pro Val Val Leu Trp Leu Asn Gly Gly Pro Gly180 185 190Cys Ser Ser Leu Thr Gly Leu Phe Met Glu Leu Gly Pro Ser Ser Ile195 200 205Asn Lys Lys Ile Gln Pro Val Tyr Asn Asp Tyr Ala Trp Asn Ser Asn210 215 220Ala Ser Val Ile Phe Leu Asp Gln Pro Val Asn Val Gly Tyr Ser Tyr225 230 235 240Ser Asn Ser Ala Val Ser Asp Thr Val Ala Ala Gly Lys Asp Val Tyr245 250 255Ala Leu Leu Thr Leu Phe Phe Lys Gln Phe Pro Glu Tyr Ala Lys Gln260 265 270Asp Phe His Ile Ala Gly Glu Ser Tyr Ala Gly His Tyr Ile Pro Val275 280 285Phe Ala Ser Glu Ile Leu Ser His Lys Lys Arg Asn Ile Asn Leu Gln290 295 300Ser Val Leu Ile Gly Asn Gly Leu Thr Asp Gly Leu Thr Gln Tyr Glu305 310 315 320Tyr Tyr Arg Pro Met Ala Cys Gly Asp Gly Gly Tyr Pro Ala Val Leu325330 335Asp Glu G1y Ser Cys Gln Ala Met Asp Asn Ala Leu Pro Arg Cys Gln340 345 350Ser Met Ile Glu Ser Cys Tyr Ser Ser Glu Ser Ala Trp Val Cys Val355 360 365Pro Ala Ser Ile Tyr Cys Asn Asn Ala Leu Leu Ala Pro Tyr Gln Arg370 375 380Thr Gly Gln Asn Val Tyr Asp Val Arg Gly Lys Cys Glu Asp Ser Ser385 390 395 400Asn Leu Cys Tyr Ser Ala Met Gly Tyr Val Ser Asp Tyr Leu Asn Lys405 410 415Thr Glu Val Ile Glu Ala Val Gly Ala Glu Val Asn Gly Tyr Asp Ser420 425 430Cys Asn Phe Asp Ile Asn Arg Asn Phe Leu Phe His Gly Asp Trp Met435 440 445Lys Pro Tyr His Arg Leu Val Pro Gly Leu Leu Glu Gln Ile Pro Val450 455 460Leu Ile Tyr Ala Gly Asp Ala Asp Phe Ile Cys Asn Trp Leu Gly Asn465 470 475 480Lys Ala Trp Thr Glu Ala Leu Glu Trp Pro Gly Gln Ala Glu Tyr Ala485 490 495Ser Ala Lys Leu Glu Asp Leu Val Val Val Glu Asn Glu His Lys Gly500 505 510Lys Lys Ile Gly Gln Val Lys Ser His Gly Asn Phe Thr Phe Met Arg515 520 525Leu Tyr Gly Gly Gly His Met Val Pro Met Asp Gln Pro Glu Ser Ser530 535 540Leu Glu Phe Phe Asn Arg Trp Leu Gly Gly Glu Trp Phe545 550 55權(quán)利要求
1含有編碼絲狀子囊菌或半知菌羧肽酶Y的核酸序列的核酸構(gòu)建體。
2權(quán)利要求1的構(gòu)建體,其中子囊菌或半知菌選自漆酶,鐮孢屬,青霉菌,腐質(zhì)霉屬,木霉屬,Scytalidium,毀絲霉屬或草根霉屬。
3權(quán)利要求1的構(gòu)建體,其中所述羧肽酶Y是黑曲霉羧肽酶。
4權(quán)利要求1的構(gòu)建體,其中所述核酸序列是圖1中描述的核酸序列,或編碼與圖1所述的氨基酸序列有至少70%一致性的蛋白質(zhì)的同系物。
5權(quán)利要求1的構(gòu)建體,其中所述核酸序列是圖2中描述的核酸序列,或編碼與圖2所述的氨基酸序列有至少70%一致性的蛋白質(zhì)的同系物。
6權(quán)利要求1的構(gòu)建體,其中將選擇性標(biāo)記插入羧肽酶序列中。
7權(quán)利要求6的構(gòu)建體,其中選擇性標(biāo)記是amdS,pyrG,argB,niaD,sC,或hygB。
8突變絲狀子囊菌細(xì)胞,它在相同條件下生產(chǎn)比野生型細(xì)胞少至少25%的羧肽酶。
9權(quán)利要求8的細(xì)胞,它生產(chǎn)比野生型細(xì)胞少至少50%的羧肽酶。
10權(quán)利要求8的細(xì)胞,它生產(chǎn)比野生型細(xì)胞少至少70%的羧肽酶。
11權(quán)利要求8的細(xì)胞,它選自曲霉屬,鐮孢屬,青霉菌屬,腐質(zhì)霉屬,木霉屬,Scytalidium,毀絲霉屬或草根霉屬。
12權(quán)利要求8的細(xì)胞,它是黑曲霉。
13突變子囊菌或半知菌細(xì)胞,它生產(chǎn)比野生型細(xì)胞少至少25%的羧肽酶,所述細(xì)胞含有編碼異源蛋白質(zhì)的核酸序列。
14含有編碼絲狀子囊菌或半知菌羧肽酶的核酸序列,且該序列中插入了選擇性標(biāo)記基因的核酸構(gòu)建體的突變絲狀子囊菌或半知菌細(xì)胞。
14一種突變絲狀子囊菌或半知菌細(xì)胞,它含有一核酸構(gòu)建物,該構(gòu)建物含有編碼非功能性絲狀子囊菌或半知菌羧肽酶的核酸序列。
15產(chǎn)生非羧肽酶的絲狀子囊菌或半知菌細(xì)胞的生產(chǎn)方法,包括破壞或缺失羧肽酶基因,由此得到基本上不產(chǎn)生羧肽酶的細(xì)胞。
16重組生產(chǎn)所需蛋白質(zhì)的方法,包括在表達(dá)所述蛋白質(zhì)的條件下,培養(yǎng)在相同條件下生產(chǎn)比相應(yīng)野生型細(xì)胞少至少25%羧肽酶且含有編碼所述蛋白質(zhì)的核酸序列的的突變絲狀子囊菌或半知菌細(xì)胞,并從培養(yǎng)液物中回收所需蛋白質(zhì)。
全文摘要
本發(fā)明涉及編碼子囊菌或半知菌羧肽酶Y基因的基因,以及經(jīng)過(guò)修飾而產(chǎn)生減少量的羧肽酶的宿主細(xì)胞。
文檔編號(hào)C12N9/48GK1137293SQ95191058
公開(kāi)日1996年12月4日 申請(qǐng)日期1995年9月19日 優(yōu)先權(quán)日1994年9月20日
發(fā)明者D·S·亞夫爾, S·A·索姆普森 申請(qǐng)人:諾沃諾爾迪斯克生物技術(shù)有限公司