經(jīng)修飾的蛋白酶的制作方法
【專利摘要】本發(fā)明涉及經(jīng)修飾的多核苷酸,其編碼經(jīng)修飾的蛋白酶,本發(fā)明還涉及改變微生物中蛋白酶生產(chǎn)的方法。具體地,本發(fā)明涉及改變蛋白酶在微生物(例如芽孢桿菌種)中的表達的方法。本發(fā)明公開了經(jīng)修飾的多核苷酸、載體、經(jīng)修飾的多肽和增強蛋白酶生產(chǎn)的方法。
【專利說明】經(jīng)修飾的蛋白酶
[0001]本申請是申請日為2008年3月12日、發(fā)明名稱為“經(jīng)修飾的蛋白酶”的中國專利申請200880007877.6 (國際申請?zhí)朠CT/US2008/003291)的分案申請。
發(fā)明領(lǐng)域
[0002]本發(fā)明提供了編碼經(jīng)修飾的蛋白酶的經(jīng)修飾的多核苷酸以及改變微生物中蛋白酶生產(chǎn)的方法。具體地,本發(fā)明涉及改變蛋白酶在微生物(例如芽孢桿菌種)中的表達的方法。本發(fā)明公開了經(jīng)修飾的多核苷酸、載體、經(jīng)修飾的多肽和增強蛋白酶生產(chǎn)的方法。
【背景技術(shù)】 [0003]微生物,例如是芽孢桿菌屬成員的革蘭氏陽性微生物,已被用于大規(guī)模的工業(yè)發(fā)酵,這部分是因為它們能將其發(fā)酵產(chǎn)物分進其培養(yǎng)基。分泌的蛋白穿過細胞膜和細胞壁被輸出,隨后再釋放進外部培養(yǎng)基。多肽分泌進周質(zhì)空間或其培養(yǎng)基依賴于多個參數(shù),在工業(yè)發(fā)酵中需要對它們詳加考慮。
[0004]事實上,異源多肽的分泌是工業(yè)界廣泛使用的技術(shù)。典型地,用編碼待表達且待分泌的目的異源多肽的核酸轉(zhuǎn)化細胞,以生產(chǎn)大量的想要的多肽。該技術(shù)已用于生產(chǎn)大量的多肽。已可通過對編碼想要的蛋白質(zhì)的多核苷酸進行遺傳操作,來控制想要的多肽的表達和分泌。雖然蛋白質(zhì)生產(chǎn)方法已有若干進展,但是本領(lǐng)域中仍需要提供細胞外蛋白質(zhì)分泌的有效方法。
[0005]發(fā)明概述
[0006]本發(fā)明涉及經(jīng)修飾的多核苷酸,其編碼經(jīng)修飾的蛋白酶,本發(fā)明還涉及改變微生物中蛋白酶生產(chǎn)的方法。特別地,本發(fā)明涉及改變蛋白酶在微生物(例如芽孢桿菌種)中的生產(chǎn)的方法。本發(fā)明公開了經(jīng)修飾的多核苷酸、載體、經(jīng)修飾的多肽和增強蛋白酶生產(chǎn)的方法。
[0007]本發(fā)明涉及經(jīng)過遺傳操作以增強經(jīng)修飾蛋白質(zhì)生產(chǎn)的多核苷酸、多肽和細胞。特別地,本發(fā)明涉及具有引入其中的外源核酸序列的革蘭氏陽性微生物以及在此類宿主細胞(例如芽孢桿菌屬的成員)中生產(chǎn)蛋白質(zhì)的方法。更具體地,本發(fā)明涉及蛋白酶的生產(chǎn)以及經(jīng)過遺傳操作從而具有改變的生產(chǎn)表達的蛋白質(zhì)的能力的細胞。特別地,本發(fā)明提供了微生物對蛋白酶的增強的生產(chǎn)。
[0008]在一些實施方式中,本發(fā)明提供了分離的經(jīng)修飾的多核苷酸,其編碼經(jīng)修飾的全長蛋白酶,其中,多核苷酸序列中編碼全長前體蛋白酶的前區(qū)域(pro region)的部分包含編碼選自下述位置的至少一處氨基酸位置上的取代的突變,所述位置等同于SEQ ID N0:5、13和244的氨基酸位置28-108和109。在一些實施方式中,經(jīng)修飾的全長蛋白酶是絲氨酸蛋白酶,其中,多核苷酸序列中編碼全長前體蛋白酶的前區(qū)域的部分包含編碼選自下述位置的至少一處氨基酸位置上的取代的突變,所述位置等同于SEQ ID NO: 5、13和244的氨基酸位置28-108和109。在其他實施方式中,全長蛋白酶是源于野生型或變體前體堿性絲氨酸蛋白酶的堿性絲氨酸蛋白酶,其中,多核苷酸序列中編碼全長前體蛋白酶的前區(qū)域的部分包含編碼選自下述位置的至少一處氨基酸位置上的取代的突變,所述位置等同于SEQ IDN0:5、13和244的氨基酸位置28-108和109。在其它一些實施方式中,全長蛋白酶是源于野生型或變體前體堿性絲氨酸蛋白酶(其是克勞氏芽孢桿菌(B.Clausii)或緩慢葡萄球菌(S.1entus)堿性絲氨酸蛋白酶)的堿性絲氨酸蛋白酶,其中,多核苷酸序列中編碼全長前體蛋白酶的前區(qū)域的部分包含編碼選自下述位置的至少一處氨基酸位置上的取代的突變,所述位置等同于SEQ ID NO: 5、13和244的氨基酸位置28-108和109。在一些實施方式中,經(jīng)分離的經(jīng)修飾的多核苷酸包含SEQ ID NOS: 1、9或240所示的多核苷酸序列。
[0009]在一些實施方式中,本發(fā)明提供了經(jīng)分離的經(jīng)修飾的多核苷酸,其編碼經(jīng)修飾的全長蛋白酶,其中,多核苷酸序列中編碼全長前體蛋白酶的前區(qū)域的部分包含編碼選自下述位置的至少一處氨基酸位置上的取代的突變,所述位置等同于SEQ ID N0:5、13和244的氨基酸位置28-108和109,其中,所述至少一處取代是在選自SEQ ID NO:5、13或244的E33、E43、A44、E47、V49、E57、A59、E63、E70、E74、E84 和 E88 的一處氨基酸位置進行的。在其它一些實施方式中,E33的氨基酸取代選自E33D、E331、E33S、E33N、E33K、E33H、E33Q和E33R。在其它一些實施方式中,E57的氨基酸取代選自E57F、E57W、E57K、E57R、E57D、E57M、E57C、E57Q、E57S、E57H 和 E57N。
[0010]在一些實施方式中,本發(fā)明提供了經(jīng)分離的經(jīng)修飾的多核苷酸,其包含已被突變?yōu)榫幋a選自下述位置的至少一處氨基酸位置上的取代的前體前序列,所述位置等同于SEQID NO: 5、13或244的氨基酸位置28-108和109。在另外一些實施方式中,經(jīng)分離的經(jīng)修飾的多核苷酸還包含編碼包含成熟區(qū)域的全長蛋白酶的多核苷酸,其中,編碼蛋白酶成熟區(qū)域的多核苷酸與SEQ ID N0S:8、16或247有至少大約70%同一性。
[0011]在一些實施方式中,本發(fā)明提供了包含經(jīng)修飾的多核苷酸的至少一種載體,所述多核苷酸編碼經(jīng)修飾的全長蛋白酶,其中,多核苷酸序列中編碼全長前體蛋白酶的前區(qū)域的部分包含編碼選自下述位置的至少一處氨基酸位置上的取代的突變,所述位置等同于SEQ ID NO: 5、13和244的氨基酸位置28-108和109,或者,提供了包含經(jīng)分離的經(jīng)修飾的多核苷酸的至少一種載體,所述多核苷酸包含已被突變?yōu)榫幋a選自下述位置的至少一處氨基酸位置上的取代的前體前序列,所述位置等同于SEQ ID NO:5、13或244的氨基酸位置28-108 和 109。
[0012]在其它一些實施方式中,本發(fā)明提供了經(jīng)包含本發(fā)明的經(jīng)修飾的多核苷酸的載體轉(zhuǎn)化的宿主相比。在一些優(yōu)選的實施方式中,經(jīng)轉(zhuǎn)化的宿主細胞是微生物。例如,在一些實施方式中,本發(fā)明提供了下述宿主細胞,所述宿主細胞經(jīng)包含經(jīng)修飾的下述多核苷酸的至少一種載體轉(zhuǎn)化,所述多核苷酸編碼經(jīng)修飾的全長蛋白酶,其中,多核苷酸序列中編碼全長前體蛋白酶的前區(qū)域的部分包含編碼選自下述位置的至少一處氨基酸位置上的取代的突變,所述位置等同于SEQ ID NO: 5、13和244的氨基酸位置28-108和109,或者,所述宿主細胞經(jīng)分離的經(jīng)修飾的下述多核苷酸轉(zhuǎn)化,所述多核苷酸包含已被突變?yōu)榫幋a選自下述位置的至少一處氨基酸位置上的取代的前體前序列,所述位置等同于SEQ ID N0:5、13或244的氨基酸位置28-108和1·09。在一些實施方式中,經(jīng)本發(fā)明的多核苷酸轉(zhuǎn)化的宿主細胞是選自芽抱桿菌屬(Bacillus sp).、鏈霉菌屬(Streptomyces sp.)、埃希氏菌屬(Escherichiasp.)和曲霉屬(Aspergillus sp.)構(gòu)成的組的微生物。在一些其它實施方式中,宿主細胞是枯草芽孢桿菌(B.subti I is)。[0013]在一些實施方式中,本發(fā)明提供了通過本發(fā)明的經(jīng)轉(zhuǎn)化的宿主細胞生產(chǎn)的蛋白酶。[0014]本發(fā)明還提供了在微生物中生產(chǎn)異源蛋白酶的方法,其中所述方法包含下述步驟:(a)在合適的條件下培養(yǎng)芽孢桿菌宿主細胞,其中,所述芽孢桿菌宿主細胞包含經(jīng)修飾的多核苷酸,所述多核苷酸編碼經(jīng)修飾的蛋白酶;以及(b)通過所述微生物來生產(chǎn)蛋白酶。在一些實施方式中,通過芽孢桿菌宿主生產(chǎn)的蛋白酶被回收。本文提供的經(jīng)修飾的多核苷酸中任何一種都可用于本發(fā)明的方法。
[0015]在一些實施方式中,本發(fā)明提供了在微生物中生產(chǎn)異源堿性絲氨酸蛋白酶的方法,其中,所述方法包括下述步驟:(a)在合適的條件下培養(yǎng)芽孢桿菌宿主細胞,其中,所述芽孢桿菌宿主細胞包含經(jīng)修飾的多核苷酸,所述多核苷酸編碼經(jīng)修飾的蛋白酶;以及(b)通過所述微生物來生產(chǎn)蛋白酶。本發(fā)明還提供了在微生物中生產(chǎn)異源蛋白酶的下述方法,其中,所述方法包括下述步驟:(a)在合適的條件下培養(yǎng)芽孢桿菌宿主細胞,其中,所述芽孢桿菌宿主細胞包含經(jīng)修飾的多核苷酸,所述多核苷酸編碼經(jīng)修飾的蛋白酶,所述經(jīng)修飾的蛋白酶包含與SEQ ID N0S:8、16或247有至少大約70%同一性的成熟區(qū)域;以及(b)通過所述微生物來生產(chǎn)蛋白酶。在一些實施方式中,芽孢桿菌宿主生產(chǎn)的蛋白質(zhì)被回收。
[0016]在一些實施方式中,本發(fā)明提供了在微生物中生產(chǎn)異源蛋白酶的下述方法,其中,所述方法包括下述步驟:(a)在合適的條件下培養(yǎng)芽孢桿菌宿主細胞,其中,所述芽孢桿菌宿主細胞包含經(jīng)修飾的多核苷酸,所述多核苷酸編碼經(jīng)修飾的蛋白酶,所述經(jīng)修飾的蛋白酶包含下述前區(qū)域,所述前區(qū)域包含編碼選自下述位置的至少一處氨基酸位置上的取代的突變,所述位置等同于SEQ ID NO: 5、13或244的氨基酸位置28-108和109;以及(b)通過所述微生物來生產(chǎn)蛋白酶。在其它一些實施方式中,所述至少一處氨基酸取代選自E33D、E331、E33S、E33N、E33K、E33H、E33Q、E33R、E57F、E57W、E57K、E57R、E57D、E57M、E57C、E57Q、E57S、E57H 和 E57N。
[0017]本發(fā)明還提供了在微生物中生產(chǎn)是克勞氏芽孢桿菌或遲緩芽孢桿菌(B.1entus)蛋白酶的異源蛋白酶的方法,其中,所述方法包括下述步驟:(a)在合適的條件下培養(yǎng)芽孢桿菌宿主細胞,其中,所述芽孢桿菌宿主細胞包含經(jīng)修飾的多核苷酸,所述多核苷酸編碼經(jīng)修飾的蛋白酶;以及(b )通過所述微生物來生產(chǎn)蛋白酶。
[0018]本發(fā)明還提供了在微生物中生產(chǎn)異源蛋白酶的下述方法,其中,所述方法包括下述步驟:(a)在合適的條件下培養(yǎng)選自地衣芽孢桿菌(B.licheniformis)、遲緩芽孢桿菌、枯草芽孢桿菌(B.subtilis)、解淀粉芽孢桿菌(B.Amyloliquefaciens)、短芽孢桿菌(B.brevis)、嗜熱脂肪桿菌(B.stearothermophilus)、克勞氏芽孢桿菌、嗜堿芽孢桿菌(B.alkalophilus)、耐鹽芽抱桿菌(B.halodurans)、凝固芽抱桿菌(B.coagulans)、環(huán)狀芽孢桿菌(B.circulans)、短小芽孢桿菌(B.pumilus)和蘇云金芽孢桿菌(B.thuringiensis)的芽孢桿菌宿主細胞,其中,所述芽孢桿菌宿主細胞包含經(jīng)修飾的多核苷酸,所述多核苷酸編碼經(jīng)修飾的蛋白酶;以及(b)通過所述微生物來生產(chǎn)蛋白酶。在一些實施方式中,所述宿主細胞是枯草芽孢桿菌宿主細胞。
[0019]本發(fā)明還提供了在微生物中生產(chǎn)異源蛋白的下述方法,其中,所述方法包括下述步驟:(a)在合適的條件下培養(yǎng)芽孢桿菌宿主細胞,其中,所述芽孢桿菌宿主細胞包含經(jīng)修飾的多核苷酸,所述多核苷酸編碼經(jīng)修飾的蛋白酶;以及(b)通過所述微生物來生產(chǎn)蛋白酶,并且,其中,所述異源蛋白酶展示出至少I的生產(chǎn)比例。
[0020]附圖簡述
[0021]圖1A顯示了來自克勞氏芽孢桿菌的野生型蛋白酶的全長多核苷酸序列(SEQ IDNO:1)。該序列中編碼蛋白酶的前區(qū)域的部分以粗體字母顯示。
[0022]圖1B、C和D顯示了多核苷酸序列(SEQ ID NO: 2、3和4),它們分別編碼SEQ IDN0:5的全長克勞氏芽孢桿菌蛋白酶的信號肽(SEQ ID N0:6)、前區(qū)域(SEQ ID N0:7)和成熟形式(SEQ ID N0:8)。
[0023]圖2A顯示了來自克勞氏芽孢桿菌的野生型蛋白酶的全長多肽序列(SEQ IDN0:5)。該序列中編碼蛋白酶的前區(qū)域的部分以粗體字母顯示。
[0024]圖2B、C和D顯示了分別編碼SEQ ID NO: 5的全長克勞氏芽孢桿菌蛋白酶的信號肽(SEQ ID N0:6)、前區(qū)域(SEQ ID NO:7)和成熟形式(SEQ ID N0:8)的多肽序列。
[0025]圖3A顯示了來自克勞氏芽孢桿菌的變體蛋白酶V049的全長多核苷酸序列(SEQID N0:9)。該序列中編碼蛋白酶的前區(qū)域的部分以粗體字母顯示。
[0026]圖3B、C和D顯示了多核苷酸序列(SEQ ID NO: 10、11和12),它們分別編碼SEQID NO: 13的全長變體克勞氏芽孢桿菌蛋白酶的信號肽(SEQ ID NO: 14)、前區(qū)域(SEQ IDNO: 15)和成熟形式(SEQ ID NO: 16)。
[0027]圖4A顯示了來自克勞氏芽孢桿菌的變體蛋白酶V049的全長多肽序列(SEQ IDNO: 13)。該序列中編碼蛋白酶的前區(qū)域的部分以粗體字母顯示。
[0028]圖4B、C和D顯示了分別編碼SEQ ID NO: 13的全長變體克勞氏芽孢桿菌蛋白酶的信號肽(SEQ ID NO: 14)、前區(qū)域(SEQ ID NO: 15)和成熟形式(SEQ ID NO: 16)的多肽序列。
[0029]圖5顯示了對SEQ ID NO: 5的克勞氏芽孢桿菌野生型絲氨酸蛋白酶、SEQ ID NO: 13的克勞氏芽孢桿菌變體絲氨酸蛋白酶和SEQ ID NO: 244的遲緩芽孢桿菌絲氨酸蛋白酶的氨基酸序列的比對。氨基酸的區(qū)別被下劃線示出。
[0030]圖6提供了包含SEQ ID NO:9的變體絲氨酸蛋白酶的pXX_049質(zhì)粒載體的圖譜。
[0031]圖7A-D顯示了用于本發(fā)明的pXX-049質(zhì)粒載體的多核苷酸序列(SEQ ID NO: 17)。
[0032]圖8A顯示了來自遲緩芽孢桿菌的蛋白酶的全長多核苷酸序列(SEQ ID N0:240)。該序列中編碼蛋白酶的前區(qū)域的部分以粗體字母顯示。
[0033]圖8B、C和D顯示了多核苷酸序列(SEQ ID NO:241、242和243),它們分別編碼SEQ ID N0:244的遲緩芽孢桿菌前體蛋白酶的信號肽(SEQ ID N0:245)、前區(qū)域(SEQ IDNO: 246)和成熟形式(SEQ ID NO: 247)。
[0034]圖9A顯示了來自克勞氏芽孢桿菌的變體蛋白酶GG36的全長多肽序列(SEQ IDN0:244)。該序列中編碼蛋白酶的前區(qū)域的部分以粗體字母顯示。
[0035]圖9B、C和D顯示了分別編碼SEQ ID NO: 244的全長遲緩芽孢桿菌蛋白酶的信號肽(SEQ ID N0:245)、前區(qū)域(SEQ ID NO:246)和成熟形式(SEQ ID NO:247)的多肽序列。
[0036]發(fā)明描述
[0037]本發(fā)明涉及經(jīng)修飾的多核苷酸,其編碼經(jīng)修飾的蛋白酶,本發(fā)明還涉及改變微生物中蛋白酶生產(chǎn)的方法?!ぬ貏e地,本發(fā)明涉及改變蛋白酶在微生物(例如芽孢桿菌的種)中的表達的方法。本發(fā)明公開了經(jīng)修飾的多核苷酸、載體、經(jīng)修飾的多肽和增強蛋白酶生產(chǎn)的方法。[0038]本發(fā)明提供了經(jīng)修飾的多核苷酸,其編碼具有經(jīng)突變的前區(qū)域的蛋白酶,本發(fā)明還提供了所述經(jīng)修飾的多核苷酸編碼的經(jīng)修飾的蛋白酶以及用于生產(chǎn)它們的方法。經(jīng)修飾的蛋白酶多核苷酸適于在微生物中表達經(jīng)修飾的蛋白酶以及以比相應前體蛋白酶更高的水平對成熟形式進行加工。產(chǎn)生的蛋白酶可用于對適用于多種工業(yè)(包括但不限于:清潔、動物飼料和紡織品加工工業(yè))的酶的工業(yè)生產(chǎn)。本發(fā)明還提供了生產(chǎn)這些酶的手段。在一些優(yōu)選的實施方式中,本發(fā)明的蛋白酶是純的或相對純的形式。
[0039]除非另有指明,本發(fā)明的實踐涉及分子生物學、微生物學、蛋白質(zhì)純化、蛋白質(zhì)工程、蛋白質(zhì)和DNA測序以及重組DNA領(lǐng)域通常所用的常規(guī)技術(shù),它們在本領(lǐng)域技術(shù)范圍內(nèi)。此類技術(shù)是本領(lǐng)域技術(shù)人員已知的,它們被描述于大量的教材和參考文獻中(見,例如 Sambrook et al.,"Molecular Cloning:A Laboratory Manual〃,Second Edition (ColdSpring Harbor), [1989]和 Ausubel et al.,"Current Protocols in MolecularBiology"[1987])。本文中(包括上文和下文中)提到的所有專利、專利申請、文章和出版物都通過引用明確并入本文。
[0040]除非另有指明,本文使用的所有技術(shù)和科學術(shù)語都具有與本發(fā)明所屬領(lǐng)域的普通技術(shù)人員通常的理解相同的含義。例如,Singleton and Sainsbury, Dictionary ofMicrobiology and Molecular Biology, 2d Ed., John Wiley and Sons, NY(1994);和Haleand Markham, The Harper Collins Dictionary of Biology, Harper Perennial, NY(1991)為本領(lǐng)域技術(shù)人員提供了本發(fā)明所用的很多術(shù)語的一般性詞典解釋。雖然與本文的描述相似或等同的任何方法和材料都可用于本發(fā)明的實施,但本文描述了優(yōu)選的方法和材料。因此,通過參考說明書整體能更完整地理解下文即將定義的術(shù)語。此外,在本文中使用時,除非上下文另有清楚指示,單數(shù)術(shù)語“一個/種”和“這個/種”(“a”、“an”和“the”)也包括復數(shù)指代。數(shù)值范圍包括界定該范圍的數(shù)字。除非另有指明,分別地,核酸是按照5’至3’的方向從左到右書寫的;氨基酸是按照氨基到羧基的方向從左到右書寫的。應當理解,本發(fā)明并不限于所述的特定的方法、方案和試劑,它們可根據(jù)本領(lǐng)域技術(shù)人員使用它們的背景而有所改變。
[0041]此外,本文提供的標題并非是對本發(fā)明的多個方面或?qū)嵤┓绞降南拗?,它們可參照說明書整體而得到。因此,通過參考說明書整體能更完整地理解下文即將定義的術(shù)語。但是,為了協(xié)助理解本發(fā)明,下文定義了多個術(shù)語。
[0042]定義
[0043]“經(jīng)修飾的蛋白酶”是具有下述氨基酸序列的全長蛋白酶,所述氨基酸序列源于全長“前體蛋白酶”的氨基酸序列。前體蛋白酶也可被稱為“未經(jīng)修飾的蛋白酶”。經(jīng)修飾的蛋白酶在前區(qū)域與其前體蛋白酶有所不同。前體蛋白酶可以是天然存在的,即野生型的蛋白酶,或者其可以是變體蛋白酶。野生型或變體蛋白酶的前區(qū)域經(jīng)過修飾,以產(chǎn)生經(jīng)修飾的蛋白酶。經(jīng)修飾的蛋白酶的氨基酸序列被認為是通過對前體氨基酸序列的前區(qū)域中一個或多個氨基酸的取代、缺失或插入而“源于”所述前體蛋白酶氨基酸序列。在一些優(yōu)選的實施方式中,前體蛋白酶的前區(qū)域的一個或多個氨基酸被取代,以產(chǎn)生經(jīng)修飾的蛋白酶。此類修飾是對編碼前體蛋白酶氨基酸序列的“前體DNA序列”的修飾,而非對前體蛋白酶本身進行的操作。本文中,經(jīng)修飾的蛋白酶包括在前體蛋白酶的前區(qū)域的任何一處氨基酸殘基處用19種天然存在的氨基酸中的任何一種進行的取代。在本文上下文中,“經(jīng)修飾的”和“前體”蛋白酶都是包含信號肽、前區(qū)域和成熟區(qū)域的全長蛋白酶。編碼經(jīng)修飾的序列的多核苷酸被稱為“經(jīng)修飾的多核苷酸”,編碼前體蛋白酶的多核苷酸被稱為“前體多核苷酸”。“前體多肽”和“前體多核苷酸”可分別互換地稱作“未經(jīng)修飾的前體多肽”或“未經(jīng)修飾的前體多核
苷酸”。
[0044]“天然存在的”或“野生型”指具有與自然界中所發(fā)現(xiàn)的相同的未經(jīng)修飾的氨基酸序列的蛋白酶或編碼所述蛋白酶的多核苷酸。天然存在的酶包括天然的酶,即在特定微生物中天然表達或發(fā)現(xiàn)的那些酶。野生型的或天然存在的序列指變體所源自的序列。野生型序列可編碼同源或異源蛋白質(zhì)。
[0045]在本文中使用時,“變體”指通過在C-末端和N-末端中任一或兩者添加一個或多個氨基酸,在氨基酸中的一個或多個不同位點取代一個或多個氨基酸,在蛋白質(zhì)的任一末端或兩個末端或氨基酸序列的一個或多個位點缺失一個或多個氨基酸,和/或在氨基酸序列的一個或多個位點插入一個或多個氨基酸,而與其相應野生型蛋白質(zhì)有所不同的前體蛋白質(zhì)。本發(fā)明上下文中,通過克勞氏芽孢桿菌蛋白酶V049 (SEQ ID NO: 13)來示例變體蛋白質(zhì),其是天然存在的蛋白質(zhì)Maxacal (SEQ ID N0:5)的變體。變體的前體蛋白可以是野生型或變體蛋白。
[0046]在本文中使用時,“等同于”指蛋白質(zhì)或肽的列舉的位置上的殘基或者與蛋白質(zhì)或肽的列舉殘基類似、同源或相應的殘基。
[0047]在提到蛋白酶時,術(shù)語“生產(chǎn)”包括對全長蛋白酶的兩個加工步驟,包括:1.除去信號肽,這已知在蛋白質(zhì)分泌期間發(fā)生,和2.除去前區(qū)域,這產(chǎn)生了酶的活性成熟形式,并且已知在成熟過程期間發(fā)生(Wang et al., Biochemistry37:3165-3171 (1998) ;Power etal.,Proc Natl Acad Sci USA83:3096-3100(1986))。
[0048]在提到成熟蛋白酶時,術(shù)語“經(jīng)加工的”指全長蛋白質(zhì)(例如蛋白酶)所經(jīng)歷以成為活性成熟酶的成熟過程。
[0049]術(shù)語“活性比例”和“生產(chǎn)比例”可互換使用,用于表示從經(jīng)修飾的蛋白酶加工的成熟蛋白酶的酶促活性與從未經(jīng)修飾的蛋白酶加工的成熟蛋白酶的酶促活性之比。
[0050]術(shù)語“全長蛋白質(zhì)”在本文中表示基因的一級基因產(chǎn)物,其包含信號肽、前序列和成熟序列。
[0051]術(shù)語“信號序列”或“信號肽”指可參與蛋白質(zhì)的成熟或前體形式分泌的核苷酸和/或氨基酸的任何序列。信號序列的該定義是功能性定義,其意欲包括參與實現(xiàn)蛋白質(zhì)分泌的蛋白質(zhì)基因N-末端部分編碼的所有那些氨基酸序列。
[0052]術(shù)語“前序列”或“前區(qū)域”是信號序列和成熟序列之間的氨基酸序列,其對于蛋白酶的分泌/生產(chǎn)來說是必要的。將前序列切割掉將產(chǎn)生成熟活性蛋白酶。舉例而言,本發(fā)明的蛋白酶的前區(qū)域至少包括與SEQ ID N0:5、13或244的28-111位殘基相同的氨基酸序列。
[0053]術(shù)語“成熟形式”或“成熟區(qū)域”指蛋白質(zhì)的最終功能性部分。舉例而言,本發(fā)明的蛋白酶的成熟形式至少包括與SEQ ID NO:5、13或244的112-380位殘基相同的氨基酸序列。在本文上下文中,“成熟形式”“加工自”全長蛋白酶,其中,對全長蛋白酶的加工包括除去信號妝和除去如區(qū)域。
·[0054]在本文中使用時,術(shù)語“異源蛋白”指不在宿主細胞中天然存在的蛋白質(zhì)或多肽。相似地,“異源多核苷酸”指不在宿主細胞中天然存在的多核苷酸。
[0055]在本文中使用時,“同源蛋白”指在細胞中是天然的或天然存在的蛋白質(zhì)或多肽。相似地,“同源多核苷酸”指在細胞中是天然的或天然存在的多核苷酸。
[0056]在本文中使用時,術(shù)語“啟動子”指指導下游基因轉(zhuǎn)錄的核酸序列。在一些優(yōu)選的實施方式中,啟動子適合于其中將要表達靶基因的宿主細胞。啟動子與其它轉(zhuǎn)錄和翻譯調(diào)控核酸序列(也稱為“控制序列”)一起,是表達給定基因所必需的。通常,轉(zhuǎn)錄和翻譯調(diào)控序列包括但不限于:啟動子序列、核糖體結(jié)合位點、轉(zhuǎn)錄起始和終止序列、翻譯起始和終止序列以及增強子或活化序列。
[0057]當核酸相對另一核酸序列以功能性關(guān)系放置時,其被稱為“有效連接的”。例如,如果啟動子或增強子能影響編碼序列的轉(zhuǎn)錄,它們就是與編碼序列有效連接的;或者,如果核糖體結(jié)合位點被放置為能協(xié)助翻譯,它就是與編碼序列有效連接的。通常,“有效連接的”指相連的DNA序列是毗鄰的。
[0058]在本文中使用時,術(shù)語“蛋白酶”和“蛋白水解活性”指展示出能水解肽或具有肽鍵的底物的能力的蛋白質(zhì)或肽。已有很多公知方法用于測量蛋白質(zhì)水解活性(Kalisz,"Microbial Proteinases, 〃In:Fiechter(ed.).Advances in BiochemicalEngineering/Biotechnology, [1988])。例如,可通過比較檢驗(分析產(chǎn)生的蛋白酶水解商業(yè)底物的能力)來確定蛋白水解活性??捎糜诖祟惖鞍酌富虻鞍姿饣钚苑治鲋械氖纠缘孜锇ǖ幌抻?二甲基酪蛋白(Sigma C-9801)、牛膠原蛋白(Sigma C-9879)、牛彈性蛋白(Sigma E-1625)和牛角蛋白(ICN Biomedical902111)。利用這些底物的比色檢驗是本領(lǐng)域公知的(見,例如,W099/34011和美國專利號6,376,450,它們都通過引用并入本文)。AAPF 檢驗(見,例如 Del Mar et al.,Anal.Biochem.,99:316_320[1979])也可用于測定成熟蛋白酶的生產(chǎn)。該檢驗測量該酶水解可溶的合成底物一琥珀酰丙氨酸-丙氨酸-脯氨酸-苯丙氨酸-對硝基苯胺(sAAPF-pNA)時釋放對硝基苯胺的速率。在分光光度計上于410nm測量從水解反應產(chǎn)生黃色的速率,其與活性酶濃度成比例。
[0059]在本文中使用時,“芽孢桿菌屬”包括本領(lǐng)域技術(shù)人員已知的“芽孢桿菌”屬中的所有種,其包括但不限于,枯草芽孢桿菌、地衣芽孢桿菌、遲緩芽孢桿菌、短芽孢桿菌、嗜熱脂肪桿菌、嗜堿芽孢桿菌、解淀粉芽孢桿菌、克勞氏芽孢桿菌、耐鹽芽孢桿菌、巨大芽孢桿菌(B.megaterium)、凝固芽孢桿菌、環(huán)狀芽孢桿菌、燦爛芽孢桿菌(B.1autus)和蘇云金芽孢桿菌。應當認識到,芽孢桿菌屬還將繼續(xù)經(jīng)歷分類重構(gòu)。因此,該屬包括已經(jīng)被重新分類的物種,這包括但不限于嗜熱脂肪桿菌等生物,其現(xiàn)在被稱為“Geobacillusstearothermophilus”。存在氧時產(chǎn)生抗性內(nèi)生孢子被認為是芽孢桿菌屬的界定特征,雖然該特征也適用于近來命名的脂環(huán)酸桿菌屬(Alicyclobacillus)、雙芽孢桿菌屬(Amphibacillus)、AneurinibaciIIus> Anoxybacillus、Brevibacillus、Filobacillus、Gracilibacillus、Halobacillus、類芽抱桿菌屬(Paenibacillus)、Salibacillus、熱桿菌屬(Thermobacillus)、Ureibacillus 和 Virgibacillus。
[0060]術(shù)語“多核苷酸”和“核酸”在本文中可互換使用,它們指任何長度的核苷酸聚合形式。這些術(shù)語包括但不限于,單鏈DNA、雙鏈DNA、基因組DNA、cDNA或包含嘌呤和嘧啶堿基或其它天然的、經(jīng)化學修飾的、經(jīng)生化修飾的、非天然的或衍生的核苷酸堿基的聚合物。多核苷酸的非限制性例子包括基因、基因片段、染色體片段、ESTs、外顯子、內(nèi)含子、mRNA、tRNA、rRNA、核糖體、cDNA、重組多核苷酸、帶分支的多核苷酸、質(zhì)粒、載體、任何序列的經(jīng)分離DNA、任何序列的經(jīng)分離RNA、核酸探針和引物。
[0061]在本文中使用時,術(shù)語“DNA構(gòu)建體”和“轉(zhuǎn)化DNA”可互換使用,以表示用于將序列引入宿主細胞或生物的DNA。DNA可通過PCR或本領(lǐng)域技術(shù)人員已知的任何其它合適技術(shù)體外產(chǎn)生。在一些特別優(yōu)選的實施方式中,DNA構(gòu)建體包含目的序列(例如,經(jīng)修飾的序列)。在一些實施方式中,所述序列與另外的元件,例如,控制元件(例如啟動子等)有效連接。在一些實施方式中,DNA構(gòu)建體包含與宿主細胞染色體同源的序列。在其它一些實施方式中,DNA構(gòu)建體包含非同源序列。一旦DNA構(gòu)建體被體外裝配,其即可用于突變宿主細胞染色體的區(qū)域(即,用異源序列代替內(nèi)源序列)。
[0062]在本文中使用時,術(shù)語“載體”指設計來向一種或多種細胞類型中引入核酸的多核苷酸構(gòu)建體。載體包括克隆載體、表達載體、穿梭載體和質(zhì)粒。在一些實施方式中,多核苷酸構(gòu)建體包含編碼全長蛋白酶的DNA序列(例如,經(jīng)修飾的蛋白酶或未經(jīng)修飾的前體蛋白酶)。
[0063]在本文中使用時,術(shù)語“質(zhì)?!敝赣米鳛榭寺≥d體的環(huán)狀雙鏈(ds ) DNA構(gòu)建體,其在一些真核生物或原核生物中形成染色體外的自主復制遺傳元件,或整合進宿主染色體。
[0064]在本文中使用時,在向細胞中引入核酸序列的上下文中,術(shù)語“引入”表示適用于將核酸序列轉(zhuǎn)入細胞的任何方法。用于引入的此類方法包括但不限于原生質(zhì)體融合、轉(zhuǎn)染、轉(zhuǎn)化、接合和轉(zhuǎn)導(見,例如,F(xiàn)errari et al.,"Genetics, "in Hardwood etal, (eds.), Bacillus.Plenum Publishing Corp., pages57-72, [1989])。
[0065]在本文中使用時,術(shù)語“經(jīng)轉(zhuǎn)化的”和“穩(wěn)定轉(zhuǎn)化的”指這樣的細胞,它們具有整合進其基因組中的或作為保持了至少兩代的游離型質(zhì)體存在的非天然(異源)多核苷酸序列。
[0066]本發(fā)明提供了經(jīng)分離的經(jīng)修飾的編碼氨基酸序列的多核苷酸,其編碼經(jīng)修飾的蛋白酶。通過對前體蛋白酶的多核苷酸序列加以突變,獲得經(jīng)修飾的蛋白酶。具體地,對編碼前體蛋白酶的前區(qū)域的多核苷酸序列進行一處或多處突變,以提供本發(fā)明的經(jīng)修飾的多核苷酸。
[0067]發(fā)明詳述
[0068]本發(fā)明涉及經(jīng)修飾的多核苷酸,其編碼經(jīng)修飾的蛋白酶,本發(fā)明還涉及改變微生物中蛋白酶生產(chǎn)的方法。特別地,本發(fā)明涉及改變蛋白酶在微生物(例如芽孢桿菌屬的種)中的表達的方法。本發(fā)明公開了經(jīng)修飾的多核苷酸、載體、經(jīng)修飾的多肽和增強蛋白酶生產(chǎn)的方法。
[0069]在一些實施方式中,本發(fā)明提供了編碼經(jīng)修飾的蛋白酶的經(jīng)修飾的多核苷酸,所述經(jīng)修飾的蛋白酶源于動物、植物或微生物來源的野生型或變體前體蛋白酶。編碼源于微生物的前體蛋白酶的多核苷酸是優(yōu)選的,其包含編碼野生型前體蛋白酶和變體前體蛋白酶(源于野生型形式)的多核苷酸。在一些實施方式中,本發(fā)明的經(jīng)修飾的多核苷酸源于編碼微生物來源的前體蛋白酶的多核苷酸。本發(fā)明還包括源于編碼蛋白工程化的前體的多核苷酸的、編碼經(jīng)修飾蛋白酶的多核苷酸。編碼絲氨酸蛋白酶的多核苷酸是優(yōu)選的前體蛋白酶多核苷酸,其中堿性微生物蛋白酶多核苷酸是特別優(yōu)選的。絲氨酸蛋白酶是催化其中在活性位點有關(guān)鍵絲氨酸殘基的肽鍵水解的酶。絲氨酸蛋白酶具有大約25,000至30,000范圍內(nèi)的分子量(見Priest, Bacteriol.Rev.,41:711-753 [1977])。在一些優(yōu)選的實施方式中,編碼枯草桿菌蛋白酶(subtilisin)和枯草桿菌蛋白酶變體的多核苷酸是優(yōu)選的前體絲氨酸蛋白酶多核苷酸。在一些實施方式中,本發(fā)明包括編碼經(jīng)修飾的蛋白酶的下述多核苷酸,它們源于微生物,例如地衣芽孢桿菌、枯草芽孢桿菌、解淀粉芽孢桿菌、克勞氏芽孢桿菌、遲緩芽孢桿菌和耐鹽芽孢桿菌的多核苷酸。編碼枯草桿菌蛋白酶的多種芽孢桿菌多核苷酸已被鑒定和測序,例如,枯草桿菌蛋白酶168、枯草桿菌蛋白酶BPN’、枯草桿菌蛋白酶Carlsberg、枯草桿菌蛋白酶DY、枯草桿菌蛋白酶147和枯草桿菌蛋白酶309 (見,例如EP414279B ;W089/06279 和 Stahl et al., J.Bacteriol.,159:811-818[1984],它們每篇都通過引用整體并入本文)。在本發(fā)明的一些實施方式中,突變體(例如變體)蛋白酶多核苷酸作為編碼本發(fā)明的經(jīng)修飾的蛋白酶所源自的蛋白質(zhì)的前體多核苷酸。多篇參考文獻提供了變體蛋白酶的例子(見,例如,W099/20770 ;W099/20726 ;W099/20769 ;W089/06279 ;RE34, 606 ;美國專利號4,914,031 ;美國專利號4,980,288 ;美國專利號5,208,158 ;美國專利號5,310,675 ;美國專利號5,336,611 ;美國專利號5,399,283 ;美國專利號5,441,882 ;美國專利號5,482,849 ;美國專利號5,631,217 ;美國專利號5,665,587 ;美國專利號5,700, 676 ;美國專利號5,741,694 ;美國專利號5,858,757 ;美國專利號5,880,080 ;美國專利號6,197,567和美國專利號6,218,165 ;它們每篇都通過引用整體并入本文)。在其它一些實施方式中,本發(fā)明所包括的多核苷酸包括:源于編碼可商業(yè)獲得的蛋白酶的多核苷酸的經(jīng)修飾的多核苷酸。例如,可商業(yè)獲得的蛋白酶包括但不限于:ALCALASE?、SAVINASE?、PRIMASE?、DURALASE?、ESPERASE? 和 KANNASE? (Novo Nordisk AJS),MAXATASE?、MAXACAL?、MAXAPEM?、PROPERASE?、PURAFECT? 和 PURAFECT OXP? (GenencorInternational Inc.)。在一些實施方式中,本發(fā)明包括源于編碼來自克勞氏芽孢桿菌的前體蛋白酶的多核苷酸的經(jīng)修飾的多核苷酸。在其它一些實施方式中,本發(fā)明包括源于編碼來自遲緩芽孢桿菌的前體蛋白酶的多核苷酸的經(jīng)修飾的多核苷酸。
[0070]在一些實施方式中,本發(fā)明的經(jīng)修飾的全長多核苷酸包含編碼已突變的前體蛋白酶前區(qū)域的序列。編碼任何合適的前體蛋白酶的前區(qū)域的多核苷酸序列可用于產(chǎn)生本發(fā)明的一種或多種經(jīng)修飾的多核苷酸。在一些優(yōu)選的實施方式中,前體多核苷酸序列的編碼前區(qū)域的部分被突變,以編碼位于下述位置的一處或多處氨基酸取代,所述位置等同于SEQID N0:5、13或244的1-109位。在一些實施方式中,經(jīng)修飾的前體多核苷酸編碼前區(qū)域中位于下述位置的至少一處氨基酸取代,所述位置等同于SEQ ID N0:5、13或244的E33、E43、A44、E47、V49、E57、A59、E63、E70、E74、E84和E88。在一些實施方式中,編碼等同于 E33 的位置處的氨基酸的多核苷酸序列被突變?yōu)榫幋a取代E33D、E331、E33S、E33N、E33K、E33H、E33Q或E33R中的至少一種。在一些其它實施方式中,編碼等同于E57的位置處的氨基酸的多核苷酸序列被突變?yōu)榫幋a取代E57F、E57W、E57K、E57R、E57D、E57M、E57C、E57Q、E57S、E57H 和 / 或 E57N 之一。
[0071]在一些實施方式中,前體克勞氏芽孢桿菌蛋白酶多核苷酸(例如SEQ ID NO:1)編碼野生型蛋白酶(MAXACAL? ;SEQ ID NO:5)。
[0072](SEQ ID NO:1)
[0073]ATGAAGAAACCGTTGGGGAAAATTGTCGCAAGCACCGCACTACTCATTTCTGTTGCTTTTAGTTCATCGATCGCATCGGCTGCTGAAGA·AGCAAAAGAAAAATATTTAATTGGCTTTAATGAGCAGGAAGCTGTCAGTGAGTTTGTAGAACAAGTAGAGGCAAATGACGAGGTCGCCATTCTCTCTGAGGAAGAGGAAGTCGAAATTGAATTGCTTCATGAATTTGAAACGATTCCTGTTTTATCCGTTGAGTTAAGCCCAGAAGATGTGGACGCGCTTGAACTCGATCCAGCGATTTCTTATATTGAAGAGGATGCAGAAGTAACGACAATGGCGCAATCAGTGCCATGGGGAATTAGCCGTGTGCAAGCCCCAGC
TGCCCATAACCGTGGATTGACAGGTTCTGGTGTAAAAGTTGCTGTCCTCGATACAGGTATTTCCACTCATCCAGACT
TAAATATTCGTGGTGGCGCTAGCTTTGTACCAGGGGAACCATCCACTCAAGATGGGAATGGGCATGGCACGCATGTG
GCTGGGACGATTGCTGCTTTAAACAATTCGATTGGCGTTCTTGGCGTAGCACCGAACGCGGAACTATACGCTGTTAA
AGTATTAGGGGCGAGCGGTTCAGGTTCGGTCAGCTCGATTGCCCAAGGATTGGAATGGGCAGGGAACAATGGCATGC
ACGTTGCTAATTTGAGTTTAGGAAGCCCTTCGCCAAGTGCCACACTTGAGCAAGCTGTTAATAGCGCGACTTCTAGA
GGCGTTCTTGTTGTAGCGGCATCTGGGAATTCAGGTGCAGGCTCAATCAGCTATCCGGCCCGTTATGCGAACGCAAT
GGCAGTCGGAGCTACTGACCAAAACAACAACCGCGCCAGCTTTTCACAGTATGGCGCAGGGCTTGACATTGTCGCAC
CAGGTGTAAACGTGCAGAGCACATACCCAGGTTCAACGTATGCCAGCTTAAACGGTACATCGATGGCTACTCCTCAT
GTTGCAGGTGCAGCAGCCCTTGTTAAACAAAAGAACCCATCTTGGTCCAATGTACAAATCCGCAATCATCTAAAGAA
TACGGCAACGAGCTTAGGAAGCACGAACTTGTATGGAAGCGGACTTGTCAATGCAGAAGCGGCAACACGCTAA
[0074](SEQ ID NO:5)
[0075]MKKPLGKIVASTALLISVAFSSSIASAAEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTMRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR
[0076]在其它一些實施方式中,前體克勞氏芽孢桿菌蛋白酶多核苷酸(例如SEQ ID NO:9)編碼變體蛋白酶(例如,SEQ ID NO:13)
[0077](SEQ ID NO: 13)
[0078]VRSKKLWIVASTALLISVAFSSSIASAAEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR
[0079]在其它實施方式中,前體蛋白酶多核苷酸是遲緩芽孢桿菌的多核苷酸(例如SEQID NO:240),其編碼 SEQ ID NO:244 的蛋白酶 GG36。
[0080] (SEQ ID NO:240)
[0081]GTGAGAAGCAAAAAATTGTGGATCGTCGCGTCGACCGCACTACTCATTTCTGTTGCTTTTAGTTCATCGATCGCATCGGCTGCTGAAGAAGCAAAAGAAAAATATTTAATTGGCTTTAATGAGCAGGAAGCTGTCAGTGAGTTTGTAGAACAAGTAGAGGCAAATGACGAGGTCGCCATTCTCTCTGAGGAAGAGGAAGTCGAAATTGAATTGCTTCATGAATTTGAAACGATTCCTGTTTTATCCGTTGAGTTAAGCCCAGAAGATGTGGACGCGCTTGAACTCGATCCAGCGATTTCTTATATTGAAGAGGATGCAGAAGTAACGACAATGGCGCAATCAGTGCCATGGGGAATTAGCCGTGTGCAAGCCCCAGCTGCCCATAACCGTGGATTGACAGGTTCTGGTGTAAAAGTTGCTGTCCTCGATACAGGTATTTCCACTCATCCAGACTTAAATATTCGTGGTGGCGCTAGCTTTGTACCAGGGGAACCATCCACTCAAGATGGGAATGGGCATGGCACGCATGTGGCCGGGACGATTGCTGCTCTAAACAATTCGATTGGCGTTCTTGGCGTAGCGCCGAGCGCGGAACTATACGCTGTTAAAGTATTAGGGGCGAGCGGTTCAGGCTCGGTCAGCTCGATTGCCCAAGGATTGGAATGGGCAGGGAACAATGGCATGCACGTTGCTAATTTGAGTTTAGGAAGCCCTTCGCCAAGTGCCACACTTGAGCAAGCTGTTAATAGCGCGACTTCTAGAGGCGTTCTTGTTGTAGCGGCATCTGGAAATTCAGGTGCAGGCTCAATCAGCTATCCGGCCCGTTATGCGAACGCAAT
GGCAGTCGGAGCTACTGACCAAAACAACAACCGCGCCAGCTTTTCACAGTATGGCGCAGGGCTTGACATTGTCGCAC CAGGTGTAAACGTGCAGAGCACATACCCAGGTTCAACGTATGCCAGCTTAAACGGTACATCGATGGCTACTCCTCAT
GTTGCAGGTGCAGCAGCCCTTGTTAAACAAAAGAACCCATCTTGGTCCAATGTACAAATCCGCAATCATCTAAAGAA
TACGGCAACGAGCTTAGGAAGCACGAACTTGTATGGAAGCGGACTTGTCAATGCAGAAGCTGCAACTCGT
[0082](SEQ ID NO:244)
[0083]MRSKKLWIVASTALLISVAFSSSIASAAEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPSAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR
[0084]在一些實施方式中,本發(fā)明提供了源于SEQ ID NO:9的全長前體多核苷酸的經(jīng)修飾的全長多核苷酸。
[0085](SEQ ID NO:9)
[0086]GTGAGAAGCAAAAAATTGTGGATCGTCGCGTCGACCGCACTACTCATTTCTGTTGCTTTTAGTTCATCGATCGCATCGGCTGCTGAAGAAGCAAAAGAAAAATATTTAATTGGCTTTAATGAGCAGGAAGCTGTCAGTGAGTTTGTAGAACAAGTAGAGGCAAATGACGAGGTCGCCATTCTCTCTGAGGAAGAGGAAGTCGAAATTGAATTGCTTCATGAATTTGAAACGATTCCTGTTTTATCCGTTGAGTTAAGCCCAGAAGATGTGGACGCGCTTGAACTCGATCCAGCGATTTCTTATATTGAAGAGGATGCAGAAGTAACGACAATGGCGCAATCGGTACCATGGGGAATTAGCCGTGTGCAAGCCCCAGCTGCCCATAACCGTGGATTGACAGGTTCTGGTGTAAAAGTTGCTGTCCTCGATACAGGTATTTCCACTCATCCAGACTTAAATATTCGTGGTGGCGCTAGCTTTGTACCAGGGGAACCATCCACTCAAGATGGGAATGGGCATGGCACGCATGTGGCTGGGACGATTGCTGCTTTAAACAATTCGATTGGCGTTCTTGGCGTAGCACCGAACGCGGAACTATACGCTGTTAAAGTATTAGGGGCGAGCGGTTCAGGTTCGGTCAGCTCGATTGCCCAAGGATTGGAATGGGCAGGGAACAATGTTATGCACGTTGCTAATTTGAGTTTAGGACTGCAGGCACCAAGTGCCACACTTGAGCAAGCTGTTAATAGCGCGACTTCTAGAGGCGTTCTTGTTGTAGCGGCATCTGGGAATTCAGGTGCAGGCTCAATCAGCTATCCGGCCCGTTATGCGAACGCAATGGCAGTCGGAGCTACTGACCAAAACAACAACCGCGCCAGCTTTTCACAGTATGGCGCAGGGCTTGACATTGTCGCACCAGGTGTAAACGTGCAGAGCACATACCCAGGTTCAACGTATGCCAGCTTAAACGGTACATCGATGGCTACTCCTCATGTTGCAGGTGCAGCAGCCCTTGTTAAACAAAAGAACCCATCTTGGTCCAATGTACAAATCCGCAATCATCTAAAGAATACGGCAACGAGCTTAGGAAGCACGAACTTGTATGGAAGCGGACTTGTCAATGCAGAAGCGGCAACACGTTAA
[0087]SEQ ID NO:9的多核苷酸序列包含序列(SEQ ID NO:10),當其表達時,被用來編碼信號序列肽(SEQ ID NO: 14),其跨越SEQ ID NO:13的1_27位氨基酸;N_末端前序列(SEQID NO: 11),其編碼前區(qū)域序列(SEQ ID NO: 15),其跨越SEQ ID NO: 13的28-111位氨基酸殘基;以及成熟的絲氨酸蛋白酶序列(SEQ ID N0:12),其編碼SEQ ID NO: 13的112-380位氨基酸殘基(即,SEQ ID N0:16)。編碼SEQ ID NO:13的蛋白酶的信號肽的前8個氨基酸的多核苷酸序列是編碼枯草芽孢桿菌AprE蛋白酶的前8個氨基酸的序列。
[0088](SEQIDN0:10)
[0089]GTGAGAAGCAAAAAATTGTGGATCGTCGCGTCGACCGCACTACTCATTTCTGTTGCTTTTAGTTCATCGATCGCATCGGCT[0090](SEQ ID NO:15)
[0091]AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTM
[0092](SEQ ID NO:14)
[0093]VRSKKLWIVASTALLISVAFSSSIASA
[0094](SEQ ID NO:11)
[0095]GCTGAAGAAGCAAAAGAAAAATATTTAATTGGCTTTAATGAGCAGGAAGCTGTCAGTGAGTTTGTAGAACAAGTAGAGGCAAATGACGAGGTCGCCATTCTCTCTGAGGAAGAGGAAGTCGAAATTGAATTGCTTCATGAATTTGAAACGATTCCTGTTTTATCCGTTGAGTTAAGCCCAGAAGATGTGGACGCGCTTGAACTCGATCCAGCGATTTCTTATATTGAAGAGGATGCAGAAGTAACGACAATG
[0096](SEQ ID NO:12)
[0097]GCGCAATCGGTACCATGGGGAATTAGCCGTGTGCAAGCCCCAGCTGCCCATAACCGTGGATTGACAGGTTCTGGTGTAAAAGTTGCTGTCCTCGATACAGGTATTTCCACTCATCCAGACTTAAATATTCGTGGTGGCGCTAGCTTTGTACCAGGGGAACCATCCACTCAAGATGGGAATGGGCATGGCACGCATGTGGCTGGGACGATTGCTGCTTTAAACAATTCGATTGGCGTTCTTGGCGTAGCACCGAACGCGGAACTATACGCTGTTAAAGTATTAGGGGCGAGCGGTTCAGGTTCGGTCAGCTCGATTGCCCAAGGATTGGAATGGGCAGGGAACAATGTTATGCACGTTGCTAATTTGAGTTTAGGACTGCAGGCACCAAGTGCCACACTTGAGCAAGCTGTTAATAGCGCGACTTCTAGAGGCGTTCTTGTTGTAGCGGCATCTGGGAATTCAGGTGCAGGCTCAATCAGCTATCCGGCCCGTTATGCGAACGCAATGGCAGTCGGAGCTACTGACCAAAACAACAACCGCGCCAGCTTTTCACAGTATGGCGCAGGGCTTGACATTGTCGCACCAGGTGTAAACGTGCAGAGCACATACCCAGGTTCAACGTATGCCAGCTTAAACGGTACATCGATGGCTACTCCTCATGTTGCAGGTGCAGCAGCCCTTGTTAAACAAAAGAACCCATCTTGGTCCAATGTACAAATCCGCAATCATCTAAAGAATACGGCAACGAGCTTAGGAAGCACGAACTTGTATGGAAGCGGACTTGTCAATGCAGAAGCGGCAACACGTTAA
[0098](SEQ ID NO:16)
[0099]AQSVPffGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASPVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPNAELYAVKVLGASGSGSVSS1AQGLEWAGNNVMHVANLSLGLQAPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSWSNVQ1RNHLKNTATSLGSTNLYGSGLVNAEAATR
[0100]在其它一些實施方式中,本發(fā)明提供了源于SEQ ID NO:1的野生型全長前體多核苷酸的經(jīng)修飾的全長多核苷酸。SEQ ID NO:1的多核苷酸包含:序列SEQ ID NO:2,當表達時,其用于編碼信號序列肽(SEQ ID NO:6),其編碼SEQ ID NO:5的1_27位氨基酸;N-末端前序列(SEQ ID NO:3),其編碼SEQ ID NO:5的28-111位氨基酸殘基(即,SEQ ID NO:7)和野生型成熟絲氨酸蛋白酶序列(SEQ ID NO:4),其編碼SEQ ID NO: 5的112-380位氨基酸殘基(即,SEQ ID NO:8)。
[0101](SEQ ID NO:2)
[0102]ATGAAGAAACCGTTGGGGAAAATTGTCGCAAGCACCGCACTACTCATTTCTGTTGCTTTTAGTTCATCGATCGCATCGGCT
[0103](SEQ ID NO:6)
[0104]MKKPLGKIVASTALLISVAFSSSIASA·[0105](SEQ ID NO:3)[0106]GCTGAAGAAGCAAAAGAAAAATATTTAATTGGCTTTAATGAGCAGGAAGCTGTCAGTGAGTTTGTAGAACAAGTAGAGGCAAATGACGAGGTCGCCATTCTCTCTGAGGAAGAGGAAGTCGAAATTGAATTGCTTCATGAATTTGAAACGATTCCTGTTTTATCCGTTGAGTTAAGCCCAGAAGATGTGGACGCGCTTGAACTCGATCCAGCGATTTCTTATATTGAAGAGGATGCAGAAGTAACGACAATG
[0107](SEQ ID NO:7)
[0108]AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTM
[0109](SEQ ID NO:4)
[0110]GCGCAATCAGTGCCATGGGGAATTAGCCGTGTGCAAGCCCCAGCTGCCCATAACCGTGGATTGACAGGTTCTGGTGTAAAAGTTGCTGTCCTCGATACAGGTATTTCCACTCATCCAGACTTAAATATTCGTGGTGGCGCTAGCTTTGTACCAGGGGAACCATCCACTCAAGATGGGAATGGGCATGGCACGCATGTGGCTGGGACGATTGCTGCTTTAAACAATTCGATTGGCGTTCTTGGCGTAGCACCGAACGCGGAACTATACGCTGTTAAAGTATTAGGGGCGAGCGGTTCAGGTTCGGTCAGCTCGATTGCCCAAGGATTGGAATGGGCAGGGAACAATGGCATGCACGTTGCTAATTTGAGTTTAGGAAGCCCTTCGCCAAGTGCCACACTTGAGCAAGCTGTTAATAGCGCGACTTCTAGAGGCGTTCTTGTTGTAGCGGCATCTGGGAATTCAGGTGCAGGCTCAATCAGCTATCCGGCCCGTTATGCGAACGCAATGGCAGTCGGAGCTACTGACCAAAACAACAACCGCGCCAGCTTTTCACAGTATGGCGCAGGGCTTGACATTGTCGCACCAGGTGTAAACGTGCAGAGCACATACCCAGGTTCAACGTATGCCAGCTTAAACGGTACATCGATGGCTACTCCTCATGTTGCAGGTGCAGCAGCCCTTGTTAAACAAAAGAACCCATCTTGGTCCAATGTACAAATCCGCAATCATCTAAAGAATACGGCAACGAGCTTAGGAAGCACGAACTTGTATGGAAGCGGACTTGTCAATGCAGAAGCGGCAACACGCTAA
[0111](SEQ ID NO:8)
[0112]RVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR
[0113]在其它一些實施方式中,本發(fā)明提供了源于SEQ ID NO:240的變體全長前體多核苷酸的經(jīng)修飾的全長多核苷酸。SEQ ID NO:240的多核苷酸包含:SEQ ID NO:241的序列,當表達時,其用于編碼信號序列肽(SEQ ID NO:245),編碼SEQ ID NO:244的1_27位氨基酸;N-末端前序列(SEQ ID NO:242),其編碼SEQ ID NO:244的28-111位氨基酸殘基(SP,SEQ ID NO:246);和野生型成熟絲氨酸蛋白酶序列(SEQ ID NO:243),其編碼SEQ ID NO:244的112-380位氨基酸殘基(即,SEQ ID NO:247)。編碼SEQ ID NO:244的前體蛋白酶的信號肽的前8個氨基酸的多核苷酸序列是編碼枯草芽孢桿菌AprE蛋白酶的前8個氨基酸的序列。前體GG36的前蛋白和成熟部分由GG36野生型序列編碼。
[0114](SEQ ID NO:241) [0115]GTGAGAAGCAAAAAATTGTGGATCGTCGCGTCGACCGCACTACTCATTTCTGTTGCTTTTAGTTCATCGATCGCATCGGCT
[0116](SEQ ID NO:245)MRSKKLWIVASTALLISVAFSSSIASA
[0117](SEQ ID NO:242)
[0118]GCTGAAGAAGCAAAAGAAAAATATTTAATTGGCTTTAATGAGCAGGAAGCTGTCAGTGAGTTTGTAGAACAAGTAGAGGCAAATGACGAGGTCGCCATTCTCTCTGAGGAAGAGGAAGTCGAAATTGAATTGCTTCATGAATTTGA
【權(quán)利要求】
1.分離的經(jīng)修飾的多核苷酸,其編碼經(jīng)修飾的全長蛋白酶,其中所述經(jīng)修飾的全長蛋白酶選自 SEQ ID NO: 13 并且包含選自 E57F、E57W、E57K、E57R、E57D、E57M、E57C、E57Q、E57S、E57H、E57N和E57G之一的突變,其中所述突變導致所述經(jīng)修飾的全長蛋白酶與前體蛋白酶相比具有增強的生產(chǎn)活性。
2.權(quán)利要求1的分離的經(jīng)修飾的多核苷酸,其中所述經(jīng)修飾的全長蛋白酶是絲氨酸蛋白酶。
3.權(quán)利要求1的分離的經(jīng)修飾的多核苷酸,其中所述經(jīng)修飾的全長蛋白酶是源于野生型或變體前體堿性絲氨酸蛋白酶的堿性絲氨酸蛋白酶。
4.權(quán)利要求1的分離的經(jīng)修飾的多核苷酸,其中所述前體堿性絲氨酸蛋白酶是克勞氏芽孢桿菌或遲緩芽孢桿菌堿性絲氨酸蛋白酶。
5.包含權(quán)利要求1一 4任一項的經(jīng)修飾的多核苷酸的載體。
6.用權(quán)利要求5的載體轉(zhuǎn)化的宿主細胞。
7.權(quán)利要求6的宿主細胞,其中所述宿主細胞是微生物。
8.權(quán)利要求6的宿主細胞,其中所述宿主細胞是選自芽孢桿菌屬、鏈霉菌屬、埃希氏菌屬和曲霉屬的微生物。
9.權(quán)利要求6-8任一項的宿主細胞,其中所述宿主細胞是枯草芽孢桿菌細胞。
10.權(quán)利要求6-8任一項的宿主細胞產(chǎn)生的蛋白酶。
11.在微生物中產(chǎn)生異源蛋白酶的方法,所述方法包括步驟:` (a)在合適的條件下培養(yǎng)芽孢桿菌宿主細胞,其中,所述芽孢桿菌宿主細胞包含編碼經(jīng)修飾蛋白酶的經(jīng)修飾的多核苷酸;以及 (b)允許所述微生物產(chǎn)生所述蛋白酶, 其中所述經(jīng)修飾的全長蛋白酶選自SEQ ID NO: 13并且包含選自E57F、E57W、E57K、E57R、E57D、E57M、E57C、E57Q、E57S、E57H、E57N 和 E57G 之一的突變。
12.權(quán)利要求11的方法,其中回收所述芽孢桿菌宿主產(chǎn)生的所述異源蛋白酶。
13.權(quán)利要求11的方法,其中所述蛋白酶是堿性絲氨酸蛋白酶。
14.權(quán)利要求11-13任一項的方法,其中所述宿主細胞選自地衣芽孢桿菌、遲緩芽孢桿菌、枯草芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、嗜熱脂肪桿菌、克勞氏芽孢桿菌、嗜堿芽孢桿菌、耐鹽芽孢桿菌、凝固芽孢桿菌、環(huán)狀芽孢桿菌、短小芽孢桿菌和蘇云金芽孢桿菌。
15.權(quán)利要求11-13任一項的方法,其中所述異源蛋白酶是克勞氏芽孢桿菌或遲緩芽孢桿菌蛋白酶。
16.權(quán)利要求11-13任一項的方法,其中所述異源蛋白酶顯示出至少為I的生產(chǎn)比例,其中生產(chǎn)比例表示從經(jīng)修飾的蛋白酶加工的成熟蛋白酶的酶促活性與從未經(jīng)修飾的蛋白酶加工的成熟蛋白酶的酶促活性之比。
【文檔編號】C12N15/75GK103667323SQ201310559596
【公開日】2014年3月26日 申請日期:2008年3月12日 優(yōu)先權(quán)日:2007年3月12日
【發(fā)明者】D·A·埃斯特爾, E·費拉里 申請人:丹尼斯科美國公司