專利名稱:Fr-008聚酮抗生素生物合成相關(guān)的基因簇的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種聚酮抗生素及其生物合成基因,特別是一種鏈霉菌FR-008 中多烯聚酮合酶基因簇,屬于生物技術(shù)基因領(lǐng)域。
背景技術(shù):
抗生素是由微生物、植物和動(dòng)物等產(chǎn)生的,能夠在很低濃度下就可以殺死或抑 制其它生物生長的次級(jí)代謝產(chǎn)物。如微生物所產(chǎn)生的青霉素、作為抗癌藥物的紫杉醇 (taxol)等??股赝ㄟ^干擾靶細(xì)胞的一個(gè)或多個(gè)生理代謝過程而發(fā)揮作用。聚酮是一類 自然產(chǎn)物,很多聚酮類抗生素已應(yīng)用于醫(yī)用,獸用及農(nóng)用,包括紅霉素(抗菌),制霉菌 素(抗真菌),阿維菌素(抗寄生的),納巴霉素(免疫抑制劑)和道諾紅菌素(抗腫瘤)。 革蘭氏陽性菌鏈霉菌是聚酮抗生素的主要產(chǎn)生菌。聚酮的合成與脂肪酸的合成類似,都 是經(jīng)由聚酮合酶介導(dǎo)的簡單羧酸單位的縮合過程,而且與聚酮抗生素合成相關(guān)的合成基 因,調(diào)節(jié)基因及抗性基因在細(xì)菌基因組中往往緊密連鎖,成簇排列。負(fù)責(zé)紅霉素大環(huán)內(nèi) 酯形成的DEBS聚酮合酶是第一例被發(fā)現(xiàn)具有模塊結(jié)構(gòu)。隨著越來越多大環(huán)內(nèi)酯聚酮的 分離與鑒定,它的模塊化核心概念始終沒有發(fā)生改變。I型聚酮合酶的模塊結(jié)構(gòu)包括重復(fù) 的酮基合成酶結(jié)構(gòu)域(KS),?;D(zhuǎn)移酶結(jié)構(gòu)域(AT),?;d體蛋白結(jié)構(gòu)域(ACP)(也可 能包含酮基還原酶結(jié)構(gòu)域(KR),脫氫酶結(jié)構(gòu)域(DH),烯酰還原酶結(jié)構(gòu)域(ER)),每個(gè) 模塊負(fù)責(zé)聚酮鏈延伸的一次反應(yīng),它們決定著加入的延伸單位的還原步驟。此外,還需 要硫酯酶(TE)結(jié)構(gòu)域的作用催化聚酮鏈的環(huán)化與釋放。最后,還要經(jīng)過糖基化、羥基 化、甲基化和酰基化等修飾步驟。例如免疫抑制劑FK506通過抑制T細(xì)胞激活與生長所 需的信號(hào)傳導(dǎo)途徑來阻礙免疫應(yīng)答。FK506被用來防止移植排拒反應(yīng)。并被用于某些自 動(dòng)免疫疾病的治療。在結(jié)構(gòu)上,F(xiàn)K506也是一個(gè)大環(huán)內(nèi)酯,可由一些鏈霉菌產(chǎn)生。聚酮生物合成PKS的模塊結(jié)構(gòu)組成具有一定的可塑性,使得人們能夠通過改變 模塊的數(shù)目、延伸模塊的特異性或結(jié)構(gòu)域的插入或失活等基因工程操作獲得新的聚酮衍 生物。天然大環(huán)內(nèi)酯抗生素多樣性的一個(gè)重要資源是中心配基特定位點(diǎn)上所結(jié)合的糖 基。這些糖基組分被發(fā)現(xiàn)幾乎均與抗生素和其細(xì)胞內(nèi)作用對(duì)象之間分子識(shí)別有關(guān)。許 多天然存在的生物活性代謝物攜帶有不尋常的糖基,作為生物活性分子識(shí)別的要素。近 來,對(duì)于糖苷轉(zhuǎn)移酶及其它糖基合成基因的深入了解越來越多地被用來產(chǎn)生新型糖基雜 合的抗生素。糖苷轉(zhuǎn)移酶對(duì)底物的一定適應(yīng)性使糖苷轉(zhuǎn)移酶成為組合生物合成的引人注 目的工具。氨基海藻糖基團(tuán)存在于很多大環(huán)內(nèi)酯抗生素分子中,大部分多烯抗生素分子攜帶這種特殊的氨基海藻糖基團(tuán)。預(yù)測(cè)的氨基海藻糖合成途徑包括來自主代謝中的 GDP-甘露糖在GDP-甘露糖脫水酶的作用下轉(zhuǎn)化為GDP-4-酮基-6-脫氧-D-甘露糖, 然后異構(gòu)化為GDP-3-酮基-6-脫氧-D-甘露糖,最后通過GDP-酮糖轉(zhuǎn)氨酶的轉(zhuǎn)氨作用 形成GDP-氨基海藻糖。其中異構(gòu)化可能并不需要酶的參與。天然抗生素的另一個(gè)重要特點(diǎn)是已合成好的中心配基特定位點(diǎn)上可經(jīng)過氧化酶 的后修飾而獲得很大范圍的結(jié)構(gòu)特征。這些氧化酶介導(dǎo)的后修飾包括羧基化,羥基化, 環(huán)氧化等。大多數(shù)情況下這些后修飾步驟導(dǎo)致產(chǎn)生藥效團(tuán)特性。因而這些后修飾氧化 酶基因具有很大的化學(xué)和藥理學(xué)重要性。在組合生物合成中,這些后修飾的氧化酶基因 扮演著重要的角色??紤]到聚酮化合物后修飾蛋白在生物活性及結(jié)構(gòu)多樣性方面的重要 作用,更加廣泛的后修飾氧化酶基因可以得到應(yīng)用并擴(kuò)大可應(yīng)用后修飾酶的工具箱。近 來,對(duì)于后修飾氧化酶基因的深入了解越來越多地被用來產(chǎn)生新型的雜合的抗生素。后 修飾氧化酶基因?qū)Φ孜锏囊欢ㄟm應(yīng)性也使其成為組合生物合成的引人注目的工具。聚酮細(xì)胞色素P450單氧化酶催化前體聚酮位點(diǎn)特異性氧化而得到最終的大環(huán)內(nèi) 酯抗生素,包括紅霉素,泰樂菌素,竹桃霉素,阿維菌素等。這些聚酮細(xì)胞色素P450單 氧化酶的作用底物以及在相同底物的作用位點(diǎn)都有很大的不同。底物結(jié)構(gòu)的微小變化就 會(huì)給這些氧化酶作用活性造成很大影響。另一方面,一直以來,提高產(chǎn)量是抗生素工業(yè)生產(chǎn)致力于解決的優(yōu)先問題。然 而,傳統(tǒng)的通過改善發(fā)酵條件,或通過化學(xué)誘變篩選產(chǎn)量提高的抗生素產(chǎn)生菌越來越受 到限制,并且很容易達(dá)到飽和。隨著生物技術(shù)的發(fā)展特別是基因工程的飛速發(fā)展,提供 了通過改造抗生素產(chǎn)生菌中相關(guān)基因而大幅度提高抗生素產(chǎn)量的途徑。這其中增加正調(diào) 節(jié)基因拷貝數(shù)或打斷負(fù)調(diào)節(jié)基因是最重要的途徑之一。多烯大環(huán)內(nèi)酯是一類在大環(huán)內(nèi)酯中包含3-8個(gè)連續(xù)雙鍵的聚酮化合物。多烯抗 生素通過與真核細(xì)胞膜的固醇相互作用形成通道而引起小分子的丟失而導(dǎo)致細(xì)胞死亡。多烯大環(huán)內(nèi)酯類抗生素兩性霉素B是結(jié)核鏈霉菌產(chǎn)生的一種在醫(yī)藥上具有重要 用途的抗真菌抗生素。兩性霉素B對(duì)真菌細(xì)胞膜中數(shù)量最大的固醇麥角固醇具有很大的 親和性,從而對(duì)真菌細(xì)胞具有選擇性的毒性。然而它也會(huì)與哺乳動(dòng)物細(xì)胞膜中的膽固醇 發(fā)生作用而具有毒性,尤其是腎毒性。盡管如此,兩性霉素B仍然是人類嚴(yán)重系統(tǒng)性真 菌感染最重要的抗生素。兩性霉素B還可使培養(yǎng)細(xì)胞免受艾滋病毒(HIV)的感染。多 烯大環(huán)內(nèi)酯類抗生素制霉菌素也是人類真菌感染重要的醫(yī)用抗生素。殺念菌素D是由灰 色鏈霉菌IMRU3570產(chǎn)生的一種芳香七烯大環(huán)內(nèi)酯抗生素。它對(duì)念珠菌有很強(qiáng)的抑制活 性。
發(fā)明內(nèi)容
本發(fā)明根據(jù)背景技術(shù)中存在的不足和需要解決的技術(shù)問題,提供一種FR-008聚 酮抗生素生物合成相關(guān)的基因簇,其產(chǎn)生的一種多烯聚酮抗生素FR-008具有抗真菌活性 和對(duì)蚊子幼蟲的高毒性,而且可以防止前列腺腫大以及可以防止陰道滴蟲感染和念珠菌 陰道炎。本發(fā)明提供一種鏈霉菌FR-008中多烯聚酮FR-008生物合成基因簇,即包含 fscA, fscB, fscC, fscD, fscE, fscF, fscTI, fscTII, fscRI, fscRII, fscRIII, fscRIV,fscP, fscFE, fscTE, fscMI, fscMII, fscMIII, fscO, pabAB, pabC 這一系列共 21 個(gè)基
因及其DNA序列,即序列1,并提供了這些基因及其DNA序列所編碼FR-008生物合成 酶的氨基酸序列,即序列2-22 ;包括包含序列1中堿基20,927-26,158的基因fscA,包含 序列1中堿基60,860-28,983的基因fscC,包含序列1中堿基77,587-60,962的基因fscB, 包含序列1中堿基84,132-77,983的基因fscF,包含序列1中堿基107,485-84,170的基因 fscE,包含序列1中堿基136,148-107,496的基因fscD的核苷酸序列,編碼了聚酮合酶; 包括包含序列1中堿基26,333-27,340的基因fscTI,包含序列1中堿基27,561-28,280的 基因fscTII,包含序列1中堿基3,818-3,150的基因fscRI,包含序列1中堿基7,205-4,377 的基因fscRII,包含序列1中堿基10,320-7,210的基因fscRIII,包含序列1中堿基 13,315-10,298的基因fscRIV,包含序列1中堿基16,106-17,287的基因fscP,包含序列1中 堿基17,334-17,528的基因fscFE,包含序列1中堿基17,556-18,413的基因fscTE,包含序 列1中堿基13,522-14,898的基因fscMI,包含序列1中堿基14,953-16,011的基因fscMII, 包含序歹Ij 1中堿基137,766-136,558的基因fscMIII,包含序列1中堿基1,950-574的基因 fscO,包含序歹Ij 1中堿基18,610-20,781的基因pabAB,包含序列1中堿基3,037-2,264的 基因pabC的核苷酸序列,編碼了 ABC轉(zhuǎn)運(yùn)蛋白,調(diào)節(jié)蛋白,細(xì)胞色素P450單氧化酶, 鐵氧化還原蛋白,II型硫脂酶,糖基合成酶,糖苷轉(zhuǎn)移酶,依賴FAD的單氧化酶,對(duì)氨 基苯甲酸合成酶。共有負(fù)責(zé)FR-008生物合成的6個(gè)聚酮合酶基因,4個(gè)調(diào)節(jié)基因,2個(gè) 轉(zhuǎn)運(yùn)基因,2個(gè)對(duì)氨基苯甲酸合成基因,2個(gè)糖基合成酶,1個(gè)糖苷轉(zhuǎn)移酶基因和4個(gè)修飾 基因獲得確認(rèn),并提供這些基因所編碼酶的氨基酸序列。本發(fā)明是根據(jù)如下技術(shù)方案實(shí)現(xiàn)的,本發(fā)明提供了一種來自于鏈霉菌FR-008中 編碼了聚酮合酶,ABC轉(zhuǎn)運(yùn)蛋白,調(diào)節(jié)蛋白,細(xì)胞色素P450單氧化酶,鐵氧化還原蛋 白,II型硫脂酶,糖基合成酶,糖苷轉(zhuǎn)移酶,依賴FAD的單氧化酶,對(duì)氨基苯甲酸合成 酶的抗生素FR-008基因簇,并提供了這些核苷酸序列所編碼FR-008生物合成酶的氨基 酸序列,也就是說這些酶由序列2-22提供的氨基酸序列來定義,這些核苷酸序列是分別 選自于序歹Ij 1 中包括 fscA(20,927-26,158),fscC(60,860-28,983),fscB(77,587-60,962), fscF (84,132-77,983),fscE (107,485-84,1 70),fscD (1 36,148-107,496), fscTI (26,333-27,340),fscTII (27,561-28,280),fscRI (3,818-3,150), fscRII (7,205-4,377),fscRIII (10,320-7,2 10),fscRIV (1 3,3 1 5-10,298), fscP (16,106-17,287),fscFE (1 7,334-1 7,528),fscTE (1 7,556-1 8,4 1 3), fscMI(13,522-14,898),fscMII (14,953-16,011),fscMIII (137,766-136,558), fscO(1,950-574), pabAB(18,610-20,781), pabC(3,037-2,264)的一系列基因序列。包括包含序列1中堿基20,927-26,158的基因fscA,包含序列1中堿基 60,860-28,983的基因fscC,包含序列1中堿基77,587-60,962的基因fscB,包含序列1中 堿基84,132-77,983的基因fscF,包含序列1中堿基107,485-84,170的基因fscE,包含序 列1中堿基136,148-107,496的基因fscD的聚酮合酶基因編碼了包含有聚酮合酶模塊的酮 基合成酶結(jié)構(gòu)域即KS結(jié)構(gòu)域,?;D(zhuǎn)移酶結(jié)構(gòu)域即AT結(jié)構(gòu)域,?;d體蛋白結(jié)構(gòu)域即 ACP結(jié)構(gòu)域,也可能包含酮基還原酶結(jié)構(gòu)域即KR結(jié)構(gòu)域,脫氫酶結(jié)構(gòu)域即DH結(jié)構(gòu)域, 烯酰還原酶結(jié)構(gòu)域即ER結(jié)構(gòu)域的聚酮合酶。由序列2-22定義的FR-008生物合成酶對(duì)應(yīng)于FR-008生物合成的每一個(gè)合成步
5驟和后修飾過程以及調(diào)節(jié),轉(zhuǎn)運(yùn),矯正過程。本發(fā)明還提供了編碼包括ATP依賴性羧酸輔酶A連接酶(CoL),ACPL, KSl, ATI, ACPl的FR-008聚酮合酶結(jié)構(gòu)域的DNA分子的核苷酸序列,這些結(jié)構(gòu)域 分別通過序列 2 中氨基酸 51-465,581-647,661-1,094,1,202-1,509,1,596-1,662 來描 述,命名為fscA基因的核苷酸序列選自于序列1中的包括20,927-26,158的一系列堿基。本發(fā)明還提供了編碼包括KS10,AT10, DH10, KRlO, ACP10, KS9,AT9, DH9, KR9, ACP9, KS8, AT8, DH8, KR8, ACP8, KS7, AT7, DH7, KR7, ACP7, KS6, AT6, DH6, KR6, ACP6, KS5, AT5, DH5, KR5, ACP5 的 FR-008 聚酮合酶 結(jié)構(gòu)域的DNA分子的核苷酸序列,這些結(jié)構(gòu)域分別通過序列3中氨基酸8,808-9,221 ; 9,330-9,627 ; 9,680-9,867 ; 10,183-10,366 ; 10,469-10,536 ; 6,966-7,383 ; 7,490-7,792 ; 7,845-8,029 ; 8,331-8,514 ; 8,618-8,685 ; 5,253-5,675 ; 5,775-6,074 ; 6,127-6,310 ; 6,590-6,773 ; 6,874-6,941 ; 3,529-3,954 ; 4,059-4,356 ; 4,407-4,595 ; 4,884-5,063 ; 5,163-5,230 ; 1,787-2,212 ; 2,318-2,617 ; 2,670-2,859 ; 3,155-3,338 ; 3,438-3,505 ; 34-460 ; 576-875 ; 928-1,112 ; 1,417-1,596 ; 1,696-1,763 來描述,命名為 fscC 基因的核 苷酸序列選自于序列1中的包括60,860-28,983的一系列堿基。本發(fā)明還提供了編碼包括KS4,AT4,DH4, KR4,ACP4, KS3,AT3,DH3, ER3,KR3,ACP3, KS2,AT2,KR2,ACP2 的 FR-008 聚酮合酶結(jié)構(gòu)域的 DNA 分
子的核苷酸序列,這些結(jié)構(gòu)域分別通過序列4中氨基酸3,703-4,103 ; 4,247-4,550 ; 4,600-4,722 ; 5,103-5,286 ; 5,389-5,456 ; 1,597-2,023 ; 2,139-2,442 ; 2,494-2,684 ; 2,970-3,322 ; 3,325-3,508 ; 3,610—3,677 ; 33-460 ; 571-874 ; 1,224-1,406 ; 1,508-1,574 來描述,命名為fscB基因的核苷酸序列選自于序列1中的包括77,587-60,962的一系列堿基。本發(fā)明還提供了編碼包括KS21,AT21,DH21, KR21,ACP21, TE21 的 FR-008聚酮合酶結(jié)構(gòu)域的DNA分子的核苷酸序列,這些結(jié)構(gòu)域分別通過序列5中氨基酸 33-456 ; 545-851 ; 903-1,083; 1,378-1,561; 1,668-1,735; 1,814-2,018 來描述,命名為 fscF基因的核苷酸序列選自于序列1中的包括84,132-77,983的一系列堿基。本發(fā)明還提供了編碼包括KS20,AT20, DH20, ER20, KR20, ACP20, KS19, AT19, KR19, ACP19, KS18, AT18, DH18, ERl8, KRl8, ACP18, KS17, AT17,DH17, ERl7, KRl7, ACP17的FR-008聚酮合酶結(jié)構(gòu)域的DNA分子的核苷酸 序列,這些結(jié)構(gòu)域分別通過序列6中氨基酸5,642-6,069 ; 6,158-6,463 ; 6,515-6,693 ; 7,017-7,322 ; 7,330-7,512 ; 7,615-7,682 ; 4,117-4,544 ; 4,633-4,936 ; 5,263-5,445 ; 5,552-5,619 ; 2,071-2,498 ; 2,590-2,896 ; 2,948-3,127 ; 3,428-3,733 ; 3,741-3,924 ; 4,025-4,092 ; 34-460 ; 548-850 ; 902-1,081 ; 1,384-1,689 ; 1,697-1,880 ; 1,982-2,049 來 描述,命名為fscE基因的核苷酸序列選自于序列1中的包括107,485-84,170的一系列堿 基。本發(fā)明還提供了編碼包括KS16,AT16,KRl6, ACP16, KS15,AT15, KRl5, ACP15, KS14, AT14, KR14, ACP14, KS13, AT13, KRl3, ACP13, KS12, AT12, KRl2, ACP12, KS11, ATI 1, DHl 1, KRl 1, ACPll 的 FR-008 聚酮合酶結(jié)
構(gòu)域的DNA分子的核苷酸序列,這些結(jié)構(gòu)域分別通過序列7中氨基酸7,935-8,352 ;8,464-8,767 ; 9,099-9,280 ; 9,387-9,452 ; 6,425-6,845 ; 6,935-7,241 ; 7,559-7,725 ; 7,838-7,898 ; 4,872-5,297 ; 5,408-5,720 ; 6,049-6,225 ; 6,331-6,398 ; 3,342-3,765 ; 3,872-4,170 ; 4,499-4,676 ; 4,782-4,849 ; 1,788-2,209 ; 2,313-2,621 ; 2,972-3,150 ; 3,254-3,314 ; 38-452; 563-864; 921-1,105; 1,410-1,592; 1,694-1,760 來描述,命名為 fscD基因的核苷酸序列選自于序列1中的包括136,148-107,496的一系列堿基。本發(fā)明還提供了編碼2個(gè)ABC轉(zhuǎn)運(yùn)蛋白的基因的核苷酸序列,這兩個(gè)ABC轉(zhuǎn)運(yùn) 蛋白分別由序列8和序列9的氨基酸序列組成,命名為fscTI,fscTII基因的核苷酸序列選 自于序列1中包括26,333-27,340,27,561-28,280的一系列堿基。本發(fā)明還提供了編碼4個(gè)調(diào)節(jié)蛋白的基因的核苷酸序列,這4個(gè)調(diào)節(jié)蛋白分別由 序列10,11,12,13的氨基酸序列組成,命名為fscRI,fscRII, fscRIII, fscRIV基因的 核苷酸序列選自于序列 1 中包括 3,818-3,150,7,205-4,377,10,320-7,210,13,315-10,298 的一系列堿基。本發(fā)明還提供了編碼一個(gè)細(xì)胞色素P450單氧化酶的基因的核苷酸序列,這個(gè)細(xì) 胞色素P450單氧化酶由序列14的氨基酸序列組成,命名為fscP基因的核苷酸序列選自于 序列1中包括16,106-17,287的一系列堿基。本發(fā)明還提供了編碼一個(gè)鐵氧化還原蛋白的基因的核苷酸序列,這個(gè)鐵氧化還 原蛋白由序列15的氨基酸序列組成,命名為fscFE基因的核苷酸序列選自于序列1中包 括17,334-17,528的一系列堿基。本發(fā)明還提供了編碼一個(gè)II型硫脂酶的基因的核苷酸序列,這個(gè)II型硫脂酶 由序列16的氨基酸序列組成,命名為fscTE基因的核苷酸序列選自于序列1中包括 17,556-18,413的一系列堿基。本發(fā)明還提供了編碼2個(gè)糖基合成酶和1個(gè)糖苷轉(zhuǎn)移酶的基因的核苷酸序列,糖 苷轉(zhuǎn)移酶由序列17的氨基酸序列組成,2個(gè)糖基合成酶(GDP-酮糖轉(zhuǎn)氨酶和GDP-甘露 糖脫水酶)分別由序列18和序列19的氨基酸序列組成,命名為fscMI,fscMII,fscMIII 基因的核苷酸序列選自于序列1中包括13,522-14,898,14,953-16,011,137,766-136,558 的一系列堿基。本發(fā)明還提供了編碼一個(gè)依賴FAD的單氧化酶的基因的核苷酸序列,這個(gè)依賴 FAD的單氧化酶蛋白由序列20的氨基酸序列組成,命名為fscO基因的核苷酸序列選自于 序列1中包括1,950-574的一系列堿基。本發(fā)明還提供了編碼2個(gè)對(duì)氨基苯甲酸合成酶的基因的核苷酸序列,這兩個(gè)對(duì) 氨基苯甲酸合成酶分別由序列21和22的氨基酸序列組成,命名為pabAB和pabC基因的 核苷酸序列選自于序列1中包括18,610-20,781,3,037-2,264的一系列堿基。本發(fā)明還提供了從至少攜帶有部分序列1重組載體中,或從微生物文庫中,或 從微生物染色體DNA中分離FR-008生物合成基因的途徑。本發(fā)明還提供了以至少來自于序列1聚酮合酶序列中的一個(gè)片段與來自于其它 聚酮合酶基因簇的聚酮序列來構(gòu)建重組載體以獲得新型聚酮的途徑。本發(fā)明還提供了在基因工程微生物體中提高FR-008或其衍生抗生素產(chǎn)量的途徑。本發(fā)明還提供了簡化FR-008的有效組分的途徑。
本發(fā)明還提供了得到至少包含部分序列1中DNA序列的重組DNA載體的途徑。本發(fā)明還提供了產(chǎn)生被至少包含部分序列1中DNA序列的重組DNA載體轉(zhuǎn)化進(jìn) 入的宿主細(xì)胞的途徑,此宿主細(xì)胞所產(chǎn)生的聚酮為FR-008或FR-008的結(jié)構(gòu)類似物。本發(fā)明還提供了產(chǎn)生被至少包含部分序列1中DNA序列的重組DNA載體轉(zhuǎn)化進(jìn) 入的宿主細(xì)胞的途徑,此宿主細(xì)胞所產(chǎn)生的FR-008或FR-008的結(jié)構(gòu)類似物產(chǎn)量得到提 高或所產(chǎn)生的抗生素或某種代謝產(chǎn)物產(chǎn)量得到提高。本發(fā)明還提供了產(chǎn)生在基因組中有FR-008生物合成基因被打斷,缺失或加倍的 微生物體的途徑,至少其中之一的基因包含有序列1中的核苷酸序列。本發(fā)明還提供了產(chǎn)生在基因組中有FR-008生物合成基因被改造的微生物體的途徑。本發(fā)明還提供了產(chǎn)生在基因組中有FR-008生物合成酶中聚酮合酶結(jié)構(gòu)域之一或 至少其中之一被缺失或加倍或改造的微生物體的途徑。序列1的互補(bǔ)序列可依據(jù)DNA堿基互補(bǔ)原則隨時(shí)得到。序列1的核苷酸序列 或部分核苷酸序列可以通過聚合酶鏈?zhǔn)椒磻?yīng)(PCR)或用合適的酶切相應(yīng)的DNA或使用其 它合適的技術(shù)隨時(shí)得到。包含發(fā)明所提供序列或多個(gè)序列的DNA片段或基因可隨時(shí)得 到。通過本發(fā)明所提供的核苷酸序列或部分核苷酸序列,可利用聚合酶鏈?zhǔn)椒磻?yīng)(PCR) 的方法或包含本發(fā)明序列的DNA作為探針進(jìn)行Southern雜交的方法,從其它生物體得到 與FR-008生物合成基因相似的基因。本發(fā)明提供的核苷酸片段可用來從鏈霉菌FR-008或其它菌種中分離具生物活性 的結(jié)構(gòu)域。例如,聚酮合酶結(jié)構(gòu)域和修飾基因的生物活性位點(diǎn)可以通過聚合酶鏈?zhǔn)椒磻?yīng) (PCR),酶切位點(diǎn)或其它合適的技術(shù)得到。本發(fā)明提供的核苷酸序列或多個(gè)序列可以與載體序列融合而得到重組序列和相 應(yīng)的DNA分子。包含本發(fā)明所提供核苷酸序列或至少部分序列的克隆基因或DNA片段可以通過 打斷FR-008生物合成的一個(gè)或幾個(gè)合成步驟而得到新的FR-008衍生物。包含本發(fā)明所提供核苷酸序列或至少部分序列的克隆基因或DNA片段可以通過 打斷FR-008生物合成的一個(gè)或幾個(gè)修飾步驟而得到新的FR-008衍生物。包含DNA片段或基因可以用來提高FR-008或其衍生物的產(chǎn)量。例如,轉(zhuǎn)入更 多拷貝的正調(diào)節(jié)基因或打斷負(fù)調(diào)節(jié)基因。包含本發(fā)明所提供核苷酸序列或至少部分序列的克隆DNA可用來從鏈霉菌 FR-008基因組文庫中定位更多的文庫質(zhì)粒。這些文庫質(zhì)粒至少包含有本發(fā)明中的部分序 列,也包含有鏈霉菌FR-008基因組中以前鄰近區(qū)域未克隆的DNA。本發(fā)明所提供的核苷酸序列可以被修飾或突變。這些途徑包括插入或置換,聚 合酶鏈?zhǔn)椒磻?yīng),錯(cuò)誤介導(dǎo)聚合酶鏈?zhǔn)椒磻?yīng),位點(diǎn)特異性突變,不同序列的重新連接,或 通過紫外線或化學(xué)試劑。本發(fā)明所提供的核苷酸序列可以通過序列的不同部分或其它來源的同源序列進(jìn) 行直接進(jìn)化(DNA shuffling)。通過缺失或失活來自于相同或不同聚酮合酶系統(tǒng)的一個(gè)或多個(gè)聚酮合酶結(jié)構(gòu) 域,模塊或基因,或增加一個(gè)或多個(gè)聚酮合酶結(jié)構(gòu)域,模塊或基因而產(chǎn)生新的聚酮化合物。包含本發(fā)明的序列或至少部分序列的克隆基因可以通過合適的表達(dá)系統(tǒng)在外源宿主 中表達(dá)以得到修飾的聚酮合酶或更高的生物活性或更高的產(chǎn)量。這些外源宿主包括鏈霉 菌,大腸桿菌,芽孢桿菌,酵母,植物和動(dòng)物等。包含本發(fā)明的核苷酸序列或至少部分序列的片段或結(jié)構(gòu)域或模塊或聚酮合酶基 因可以用來構(gòu)建聚酮合酶庫或聚酮合酶衍生庫或組合庫。包含本發(fā)明的核苷酸序列或至少部分序列的修飾基因,調(diào)節(jié)基因,轉(zhuǎn)運(yùn)基因或 糖基合成和轉(zhuǎn)移酶基因可以用來構(gòu)建衍生庫或組合庫。FR-008生物合成修飾基因,調(diào)節(jié)基因,轉(zhuǎn)運(yùn)基因或糖基合成和轉(zhuǎn)移酶基因的核 苷酸序列提供了通過缺失或改造這些修飾基因,調(diào)節(jié)基因,轉(zhuǎn)運(yùn)基因或糖基合成和轉(zhuǎn)移 酶基因而得到FR-008結(jié)構(gòu)衍生物或FR-008及其衍生物產(chǎn)量提高的途徑。含有本發(fā)明的核苷酸序列或至少部分序列的一個(gè)片段或幾個(gè)片段可以克隆到改 造后的細(xì)菌人工染色體(BAC)或酵母人工染色體(YAC)或柯斯載體(Cosmid)或表達(dá)載 體或其它類型的載體,以應(yīng)合適的需要。含有本發(fā)明的核苷酸序列或至少部分序列的基因或基因簇可以在異源宿主中表 達(dá)并通過DNA芯片技術(shù)了解它們?cè)谒拗鞔x鏈中的角色。包含本發(fā)明的氨基酸序列或至少部分序列(序列2-22)的多肽可能在去除或替代 某個(gè)或某些氨基酸之后仍有生物活性甚至有新的生物學(xué)活性,或者提高了產(chǎn)量或優(yōu)化蛋 白動(dòng)力學(xué)特征或其它致力于得到的性質(zhì)。通過合適的技術(shù)缺失,連接本發(fā)明中的氨基酸序列可以得到新的蛋白或酶,進(jìn) 而產(chǎn)生新的聚酮或相關(guān)連的產(chǎn)物。本發(fā)明具有實(shí)質(zhì)性特點(diǎn)和顯著的進(jìn)步,本發(fā)明所提供的基因序列可用于產(chǎn)生預(yù) 期的基因工程抗生素或雜合抗生素或用于提高抗生素或基因工程抗生素的產(chǎn)量。本發(fā) 明所提供的氨基酸序列可以用來分離需要的蛋白質(zhì)并可以用于抗體制備。本發(fā)明所提供 的氨基酸序列提供了預(yù)測(cè)聚酮合酶三維結(jié)構(gòu)的可能,進(jìn)而為改造或改善蛋白活性提供依 據(jù)。本發(fā)明所提供的基因及其所編碼的蛋白質(zhì)蛋白質(zhì),相應(yīng)的抗體或多核苷可以用來查 找和發(fā)展可用于醫(yī)藥,工業(yè),農(nóng)業(yè)的化合物或蛋白。
以下通過附圖對(duì)本發(fā)明進(jìn)一步描述圖1為用來測(cè)序覆蓋整個(gè)FR-008基因簇的文庫柯斯質(zhì)粒和亞克隆圖2為負(fù)責(zé)FR-008生物合成的整個(gè)FR-008基因簇的結(jié)構(gòu)。包括結(jié)構(gòu)基因,修 飾基因,調(diào)節(jié)基因,矯正基因及轉(zhuǎn)運(yùn)基因等,負(fù)責(zé)FR-008的生物合成及調(diào)節(jié)和外運(yùn)。圖3為FR-008化學(xué)結(jié)構(gòu)示意圖。編號(hào)為Cl’ -C6’的為氨基海藻糖基團(tuán)。羧 基化發(fā)生在C-18位,羥基化發(fā)生在C-9位。Rl代表羥基或酮基,R2代表羥基或H原 子。圖4為調(diào)節(jié)基因突變株基因置換發(fā)生的雜交證明。A為基因置換發(fā)生的示意圖; B為基因突變株的雜交證明。HJ-1,HJ-2, HJ-3與1.5kb雜交的陽性帶(4.3kb)比野生 型的陽性帶(1.5kb)大2.8kb,因?yàn)镠J-1,HJ-2, HJ-3的染色體中阿泊拉霉素/紅霉素 抗性基因置換了調(diào)節(jié)基因。
圖5為調(diào)節(jié)基因突變株生物活性測(cè)定。左右下方3個(gè)突變株均不再產(chǎn)生抑菌圈。 正上方為野生型對(duì)照。圖6為負(fù)責(zé)FR-008分子中雙鍵和糖基附著的酮基還原酶結(jié)構(gòu)域(KR)控制立體 構(gòu)型特定氨基酸附近的氨基酸的比較。KR8,KR9和KR12的這個(gè)特定氨基酸由天冬氨 酸分別變?yōu)楦拾彼?G),天冬酰氨(N)和丙氨酸(A)。
具體實(shí)施例方式如圖1和圖2所示,本發(fā)明序列列表中序列描述序列1為包括21個(gè)開放讀碼框架的138,203bp的核苷酸序列,它們是負(fù)責(zé) FR-008 生物合成的基因 fscA,fscB, fscC, fscD, fscE, fscF, fscTI, fscTII, fscRI, fscRII, fscRIII, fscRIV, fscP, fscFE, fscTE, fscMI, fscMII, fscMIII, fscO, pabAB 禾口 pabCo序列2為fscA基因(序列1中核苷酸20,927-26,158)編碼的I型聚酮合酶(FscA)
的氨基酸序列。序列3為fscC基因(序列1中核苷酸60,860-28,983)編碼的I型聚酮合酶(FscC)
的氨基酸序列。序列4為fscB基因(序列1中核苷酸77,587-60,962)編碼的I型聚酮合酶(FscB)
的氨基酸序列。序列5為fscF基因(序列1中核苷酸84,132-77,983)編碼的I型聚酮合酶(FscF)
的氨基酸序列。序列6為fscE基因(序列1中核苷酸107,485-84,170)編碼的I型聚酮合酶(FscE)
的氨基酸序列。序列7為fscD基因(序列1中核苷酸136,148-107,496)編碼的I型聚酮合酶 (FscD)的氨基酸序列。序列8為fscTI基因(序列1中核苷酸26,333-27,340)編碼的ABC轉(zhuǎn)運(yùn)蛋白 (FscTI)的氨基酸序列。序列9為fscTII基因(序列1中核苷酸27,561-28,280)編碼的ABC轉(zhuǎn)運(yùn)蛋白 (FscTII)的氨基酸序列。序列10為fscRI基因(序列1中核苷酸3,818-3,150)編碼的調(diào)節(jié)蛋白(FscRI)的
氨基酸序列。序列11為fscRII基因(序列1中核苷酸7,205-4,377)編碼的調(diào)節(jié)蛋白(FscRII)
的氨基酸序列。序列12為fscRIII基因(序列1中核苷酸10,320-7,210)編碼的調(diào)節(jié)蛋白(FscRIII)
的氨基酸序列。序列13為fscRIV基因(序列1中核苷酸13,315-10,298)編碼的調(diào)節(jié)蛋白 (FscRIV)的氨基酸序列。序列14為fscP基因(序列1中核苷酸16,106-17,287)編碼的細(xì)胞色素P450單氧 化酶(FscP)的氨基酸序列。序列15為fscFE基因(序列1中核苷酸17,334-17,528)編碼的鐵氧化還原蛋白(FscFE)的氨基酸序列。序列16為fscTE基因(序列1中核苷酸17,556-18,413)編碼的II型硫脂酶 (FscTE)的氨基酸序列。序列17為fscMI基因(序列1中核苷酸13,522-14,898)編碼的糖苷轉(zhuǎn)移酶 (FscMI)的氨基酸序列。序列18為fscMII基因(序列1中核苷酸14,953-16,011)編碼的GDP-酮糖氨基 轉(zhuǎn)移酶(糖基合成酶)(FscMII)的氨基酸序列。序歹Ij 19為fscMIII基因(序歹丨J 1中核苷酸137,766-136,558)編碼的GDP-甘露 糖_4,6-脫水酶(糖基合成酶)(FscMIII)的氨基酸序列。序列20為fscO基因(序列1中核苷酸1,950-574)編碼的依賴FAD的單氧化酶 (FscO)的氨基酸序列。序列21為pabAB基因(序列1中核苷酸18,610-20,781)編碼的4_氨基_4_脫 氧Chorismate合成酶(對(duì)氨基苯甲酸合成酶)(PabAB)的氨基酸序列。序列22為pabC基因(序列1中核苷酸3,037-2,264)編碼的4_氨基_4_脫氧 Chorismate合成酶(對(duì)氨基苯甲酸合成酶)(PabC)的氨基酸序列。以下進(jìn)一步對(duì)本發(fā)明詳細(xì)描述由于FR-008有抗真菌活性,對(duì)蚊子幼蟲有高毒性和可以防止前列腺腫大以及 可以防止陰道滴蟲感染和念珠菌陰道炎以及在其它工業(yè),農(nóng)業(yè),醫(yī)藥上所具有的應(yīng)用潛 能,本發(fā)明分離了負(fù)責(zé)FR-008生物合成的基因簇,覆蓋整個(gè)基因簇的五個(gè)柯斯質(zhì)粒, pHZ145, pHZ137, pHZ220, pHZ194和pJTUl連同一個(gè)亞克隆質(zhì)粒pJTU6被用來測(cè) 序,pJTU6攜帶了 pHZ141的5.2kb和7.5kb BamHI片段,但是7.5kb對(duì)5.2kb片段的方向 與pHZ141或者說染色體中是相反的,pHZ145,pHZ137, pHZ194和pJTUlO的載體為 pHZ132, pHZ220 的載體為 pIJ653,pJTU6 的載體為 pBluescriptll SK(+)。測(cè)序獲得138,203bp的連續(xù)核苷酸序列。在全部21個(gè)開放讀碼框架中有6個(gè)I 型聚酮合酶基因(fscA-fscF)。序列分析是使用FramePlot 2.3.2軟件和美國國家生物信息 中心的Conserved Domain Database search及其提供的世界范圍的Blast引擎。fscA-fscF編 碼的氨基酸序列通過與已經(jīng)得到充分了解的一些I型聚酮合酶的氨基酸序列進(jìn)行比較從而 得出這些多肽的功能特征(詳見圖1)。聚酮合酶基因序列序列1中的20,927-26,158和28,983-136,148堿基是負(fù)責(zé)FR-008內(nèi)酯環(huán)合成的聚 酮合成酶基因的序列,F(xiàn)R-008基因簇中共有6個(gè)聚酮合酶基因,在fscA和fscC之間有 一段編碼兩個(gè)ABC轉(zhuǎn)運(yùn)子的核苷酸序列。FR-008基因簇中各聚酮合酶基因的核苷酸序 列與相應(yīng)的氨基酸序列,如表1所示表 1
權(quán)利要求
1.一種導(dǎo)致鏈霉菌FR-008中缺乏對(duì)氨基苯甲酸的基因,其特征在于,所述基因如 pabAB所示,該基因的缺失導(dǎo)致鏈霉菌FR-008中缺乏對(duì)氨基苯甲酸。
2.一種導(dǎo)致鏈霉菌FR-008中缺乏FR-008抗生素抗菌活性的基因簇,其特征在于, 所述基因簇如fscA、fscB、fscC、fscF以及fscRI所示,該基因簇的缺失導(dǎo)致鏈霉菌 FR-008中缺乏FR-008抗生素抗菌活性。
3.—種導(dǎo)致鏈霉菌FR-008中缺乏FR-008抗生素的基因簇,其特征在于,所述基因 簇如fscRII、fscRIII以及fscRIV所示,該基因簇的缺失導(dǎo)致鏈霉菌FR-008中缺乏FR-008 抗生素。
4.一種導(dǎo)致鏈霉菌FR-008中缺乏FR-008抗生素抗菌活性的基因簇,其特征在于, 所述基因簇如 fscTI、fscTII、fscP、fscFE、fscTE、fscMI、fscMII、pabC、fscD、fscE、 fscO以及fscMIII所示,該基因簇的缺失導(dǎo)致鏈霉菌FR-008中缺乏FR-008抗生素抗菌活性。
全文摘要
一種鏈霉菌FR-008中負(fù)責(zé)FR-008聚酮合成的基因簇,屬于基因技術(shù)領(lǐng)域,包含fscA、fscB、fscC、fscD、fscE、fscF、fscTI、fscTII、fscRI、fscRII、fscRIII、fscRIV、fscP、fscFE、fscTE、fscMI、fscMII、fscMIII、fscO、pabAB、pabC這一系列共21個(gè)基因及其DNA序列,即序列1,并提供了這些基因及其DNA序列所編碼FR-008生物合成酶的氨基酸序列,即序列2-22。本發(fā)明所提供的基因及其所編碼的蛋白質(zhì)可以用來查找和發(fā)展可用于醫(yī)藥,工業(yè),農(nóng)業(yè)的化合物或蛋白。
文檔編號(hào)C12N15/52GK102021187SQ20101050140
公開日2011年4月20日 申請(qǐng)日期2003年10月23日 優(yōu)先權(quán)日2003年10月23日
發(fā)明者周秀芬, 李商玉, 鄧子新, 鄭克俊, 陳實(shí) 申請(qǐng)人:上海交通大學(xué), 韓國高等科學(xué)技術(shù)學(xué)院