專利名稱::多氧霉素生物合成基因簇及其應(yīng)用的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及的是一種基因工程
技術(shù)領(lǐng)域:
的生物合成基因,特別是一種作為核苷類抗生素的多氧霉素生物合成基因簇及其應(yīng)用。
背景技術(shù):
:多氧霉素(polyoxin,POL)由于其對農(nóng)作物、果蔬及一些經(jīng)濟(jì)植物真菌病害有良好的防治作用,加之其對環(huán)境友好,低毒易降解的特性,所以自上世紀(jì)六十年代由日本首先創(chuàng)制成功以來,便在農(nóng)業(yè)生產(chǎn)上得到大規(guī)模的推廣應(yīng)用,迄今為止,多氧霉素仍是我國乃至世界上使用最廣泛且未產(chǎn)生耐藥性的農(nóng)用抗生素之一。多氧霉素由可可鏈霉菌阿蘇變種,為Suzuki于1965年首次發(fā)現(xiàn)。之后,Isono等對其進(jìn)行進(jìn)一步研究,分離鑒定所有組分并對其化學(xué)結(jié)構(gòu)進(jìn)行了闡明;研究顯示多氧霉素由結(jié)構(gòu)相關(guān)的十三個組分(polyoxinA-M)組成,其中多氧霉素A為主要組分。多氧霉素的化學(xué)結(jié)構(gòu)由核苷骨架及兩個后修飾的氨基酸組成,由于其化學(xué)結(jié)構(gòu)與真菌細(xì)胞壁中幾丁質(zhì)的合成單元N—乙酰葡萄糖酰氨的結(jié)構(gòu)相似,所以多氧霉素是幾丁質(zhì)合成酶的強(qiáng)烈競爭性抑制劑,故而展示出高效的廣譜抗真菌活性。關(guān)于多氧霉素的生物合成研究一直停留在同位素前體喂養(yǎng)的水平,Isono等根據(jù)同位素前體喂養(yǎng)的結(jié)果推測多氧霉素結(jié)構(gòu)中兩個后修飾的氨基酸(聚后酸,氨甲酰多氧草氨酸)的合成前體分別為L-異亮氨酸與L-谷氨酸。聚肟酸(polyoximicacid)部分的合成推測如下L一異亮氨酸先經(jīng)過脫氫,再經(jīng)過一系列的中間催化,最后環(huán)化形成聚肟酸。關(guān)于有氨甲酰多氧草氨酸(carbamoylpolyoxamicacid)部分的合成推測如下L一谷氨酸經(jīng)過催化生成谷氨酸半醛,然后經(jīng)過后續(xù)的還原、氨甲?;把趸?,最終形成氨甲酰多氧草氨酸。關(guān)于核苷骨架的生物合成,Isono等推測如下磷酸烯醇式丙酮酸(PEP)加載到尿苷(uridine)的C'-5上形成中間產(chǎn)物,然后氧化消除脫去末端的2個碳原子,最后通過轉(zhuǎn)氨反應(yīng)形成多氧霉素的核心骨架-尿嘧啶氨基己糖醛酸。盡管如此,多氧霉素生物合成的分子機(jī)理迄今仍未闡明,其菌種選育研究仍停留在傳統(tǒng)水平。多氧霉素的生物活性與其結(jié)構(gòu)密切相關(guān),隨著多氧霉素整個生物合成基因簇的克隆與功能分析,可以從分子水平上闡明多氧霉素獨(dú)特的生物合成機(jī)理,進(jìn)而可以實(shí)現(xiàn)多氧霉素結(jié)構(gòu)的定向改造以及利用組合生物合成手段創(chuàng)制生物活性更高的多氧霉素衍生物。隨著基因功能與酶學(xué)機(jī)制的深入闡明,將會實(shí)現(xiàn)多氧霉素產(chǎn)生菌理性化分子育種,發(fā)酵工藝的定向優(yōu)化,從而實(shí)現(xiàn)多氧霉素效價的提高。
發(fā)明內(nèi)容本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的不足,提供一種源于可可鏈霉菌阿蘇變種中作為核苷類抗生素一多氧霉素生物合成基因簇及其應(yīng)用。本發(fā)明利用多氧霉素生物合成基因簇用于多氧霉素的高產(chǎn)菌株或有效組分高產(chǎn)菌株的分子育種。所提供的基因及其所編碼的蛋白質(zhì),也可以用來査找和發(fā)展可用于醫(yī)藥,工業(yè),農(nóng)業(yè)的化合物或蛋白。本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的不足,本發(fā)明提供的多氧霉素生物合成基因簇包含20個基因,具體為(1)負(fù)責(zé)多氧霉素生物合成的結(jié)構(gòu)基因polA,polB,polC,polD,polG,polH,poll,polJ,polK,polL,po.lM,polN,po10,polP,即共13個基因;(2)負(fù)責(zé)多氧霉素生物合成的調(diào)節(jié)基因,即polR,polY,共2個基因;(3)膜蛋白相關(guān)基因polQl,polQ2,即共2個基因;(4)功能未知基因,polE,polF,polL,共3個基因;共20個基因及其DNA序列或互補(bǔ)序列,即序列1,并提供了這些基因所編碼蛋白的氨基酸序列,即序列2-29;包括包含序列1中堿基12838-14175的基因polA,包含序列1中堿基11999-12772的基因polB,包含序列1中堿基29476-28862的基因polC,包含序列1中堿基28857-28210的基因polD,包含序列1中堿基28187-27075的基因polE,包含序列1中堿基27023-26196的基因polF,包括包含序列1中堿基26166-24874的基因polG,包含序列1中堿基24881-23472的基因polH,包含序列1中堿基23475-22333的基因poll,包含序列1中堿基22336-21515的基因polj,包含序列1中堿基21528-20887的基因polK,包含序列1中堿基20830-20099的基因polL,包含序列1中堿基20041-19274的基因polM,包含序列1中堿基19281-18775的基因polN,包含序列1中堿基18778-17057的基因po10,包含序列1中堿基17060-16218的基因polP,包含序列1中堿基11103-10537的基因polQl,包含序列1中堿基12359-11100的基因polQ2,包含序列1中堿基32787-36122的基因polR,包含序列1中堿基32569-29681的基因polY,共有負(fù)責(zé)編碼多氧霉素生物合成的13個結(jié)構(gòu)基因,2個調(diào)控基因,2個膜蛋白相關(guān)基因及3個功能未知的基因得到確認(rèn)并提供這些基因所編碼蛋白的氨基酸序列。本發(fā)明提供了一種來自于可可鏈霉素阿蘇亞種中編碼了多氧霉素生物合成的結(jié)構(gòu)基因,調(diào)節(jié)基因,膜蛋白相關(guān)基因及功能未知蛋白基因并提供了這些核苷酸序列所編碼多氧霉素合成酶的氨基酸序列,也就是說這些酶由序列2-21提供的氨基酸序列來定義,這些核苷酸序列是分別選自于序列1中包括polA(12838-14175),polB(11999-12772),polC(29476-28862),polDpolE(28187-27075),polH(24881-23472),polj(22336-21515)polN(19281-18775),polQl(16052-14793),(32787-36122),polY(32569-29681)。本發(fā)明還提供了編碼尿苷-5'-單磷酸烯醇式丙酮酸轉(zhuǎn)移酶核苷酸序列,由序列2中的氨基酸序列組成,命名為polA,其基因核苷酸序列位于序列1中第12838-14175堿基處。本發(fā)明還提供了編碼胸苷酸合成酶核苷酸序列,由序列3中的氨基酸序列組成,命名為polB,其基因核苷酸序列位于序列l(wèi)中第11999-12772堿基處。本發(fā)明還提供了編碼羥化酶核苷酸序列,由序列4中的氨基酸序列組成,命名為polC,其基因核苷酸序列位于序列1中第29476-28862堿基處。(28857-28210),(26166-24874),(20830-20099),(20041-19274),(17060—16218)polF(27023-26196),poll(23475-22333),,polK(21528-20887),po10(18778-17057),polQ2(14796-14230),polGpolLpolMpolPpolR本發(fā)明還提供了編碼另一個羥化酶的核苷酸序列,由序列5中的氨基酸序列組成,命名為polD,其基因核苷酸序列位于序列1中第28857-28210堿基處.本發(fā)明還提供了編碼功能未知蛋白的核苷酸序列,由序列6中的氨基酸序列組成,命名為polE,其基因核苷酸序列位于序列l(wèi)中第28187-27075堿基處.本發(fā)明還提供了編碼功能未知蛋白的核苷酸序列,由序列7中的氨基酸序列組成,命名為polF,其基因核苷酸序列位于序列1中第27023-26196堿基處。本發(fā)明還提供了編碼羧化酶核苷酸序列,由序列8中的氨基酸序列組成,命名為polG,其基因核苷酸序列位于序列1中第26166-24874堿基處。本發(fā)明還提供了編碼典型S-腺苷酰-L-甲硫氨酸蛋白核苷酸序列,由序列9中的氨基酸序列組成,命名為polH,其基因核苷酸序列位于序列1中第24881-23472堿基處。本發(fā)明還提供了編碼氨基轉(zhuǎn)移酶的核苷酸序列,由序列10中的氨基酸序列組成,命名為poll,其基因核苷酸序列位于序列l(wèi)中第23475-22333堿基處。本發(fā)明還提供了編碼磷酸化酶的核苷酸序列,由序列11中的氨基酸序列組成,命名為polj,其基因核苷酸序列位于序列1中第22336-21515堿基處。本發(fā)明還提供了編碼典型羥化酶的核苷酸序列,由序列12中的氨基酸序列組成,命名為polK,其基因核苷酸序列位于序列l(wèi)中第21528-20887堿基處。本發(fā)明還提供了編碼功能未知蛋白的核苷酸序列,由序列13中的氨基酸序列組成,命名為polL,其基因核苷酸序列位于序列1中第20830-20099堿基處。本發(fā)明還提供了編碼短鏈脫氫酶的核苷酸序列,由序列14中的氨基酸序列組成,命名為polM,其基因核苷酸序列位于序列l(wèi)中第20041-19274堿基處。本發(fā)明還提供了編碼氨基酸N—?;D(zhuǎn)移酶的核苷酸序列,由序列15中的氨基酸序列組成,命名為polN,其基因核苷酸序列位于序列1中第19281-18775堿基處。本發(fā)明還提供了氨甲酰轉(zhuǎn)移酶的核苷酸序列,由序列16中的氨基酸序列組成,命名為po10,其基因核苷酸序列位于序列l(wèi)中第18778-17057堿基處。本發(fā)明還提供了編碼酰基谷氨酸激酶的核苷酸序列,由序列17中的氨基酸序列組成,命名為polP,其基因核苷酸序列位于序列1中第20830-20099堿基處。本發(fā)明還提供了編碼膜蛋白的核苷酸序列,由序列18中的氨基酸序列組成,命名為polQl,其基因核苷酸序列位于序列1中第16052-14793堿基處。本發(fā)明還提供了編碼腺苷酸激酶的核苷酸序列,由序列19中的氨基酸序列組成,命名為polQ2,其基因核苷酸序列位于序列1中第14796-14230堿基處。本發(fā)明還提供了編碼途徑專一性調(diào)控蛋白的核苷酸序列,由序列20中的氮基酸序列組成,命名為polR,其基因核苷酸序列位于序列1中第32787-36122堿基處。本發(fā)明還提供了編碼調(diào)控蛋白的核苷酸序列,由序列21中的氨基酸序列組成,命名為polY,其基因核苷酸序列位于序列1中第32569-29681堿基處。序列1的互補(bǔ)序列可依據(jù)DNA堿基互補(bǔ)原則隨時得到,序列1的核苷酸序列或部分核苷酸序列可以通過聚合酶鏈?zhǔn)椒磻?yīng)(PCR)或用限制性內(nèi)切酶酶切DNA得到。本發(fā)明所提供的核苷酸序列或部分核苷酸序列,可利用聚合酶鏈?zhǔn)椒磻?yīng)(PCR)的方法或包含本發(fā)明序列的DNA作為探針進(jìn)行Southern雜交的方法從其他微生物中得到多氧霉素生物合成基因的同源基因。本發(fā)明還提供了從至少攜帶有部分序列1重組載體中,或從微生物文庫中,或從微生物基因組DNA中分離多氧霉素生物合成基因的途徑。本發(fā)明還提供了在基因工程微生物體中提高多氧霉素或其衍生抗生素產(chǎn)量的途徑。本發(fā)明還提供了簡化多氧霉素的有效組分的途徑。本發(fā)明還提供了得到至少包含部分序列1中DNA序列的重組DNA載體的途徑。本發(fā)明還提供了產(chǎn)生被至少包含部分序列1中DNA序列的重組DNA載體轉(zhuǎn)化進(jìn)入的宿主細(xì)胞的途徑,賦予此宿主細(xì)胞產(chǎn)生多氧霉素。本發(fā)明還提供了產(chǎn)生被至少包含部分序列1中DNA序列的重組DNA載體轉(zhuǎn)化進(jìn)入的宿主細(xì)胞的途徑,此宿主細(xì)胞所產(chǎn)生的多氧霉素產(chǎn)量得到提高或所產(chǎn)生的抗生素或某種代謝產(chǎn)物產(chǎn)量得到提高。本發(fā)明還提供了產(chǎn)生在基因組中有多氧霉素生物合成基因被打斷,缺失或加倍的微生物體的途徑,至少其中之一的基因包含有序列l(wèi)中的核苷酸序列。本發(fā)明還提供了產(chǎn)生在基因組中有多氧霉素生物合成基因被改造的微生物體的途徑。本發(fā)明還提供了產(chǎn)生在基因組中有多氧霉素生物合成基因之一或至少其中之一被缺失或加倍或改造的微生物體的途徑。本發(fā)明提供的核苷酸序列或多個序列可以與載體序列融合而得到重組序列和相應(yīng)的DNA分子。包含本發(fā)明所提供核苷酸序列或至少部分序列的克隆基因或DNA片段可以通過打斷多氧霉素生物合成的一個或幾個合成步驟而得到新的多氧霉素衍生物。包含本發(fā)明所提供核苷酸序列或至少部分序列的克隆基因或DNA片段可以通過打斷多氧霉素生物合成的一個或幾個修飾步驟而得到新的多氧霉素衍生物。包含DNA片段或基因可以用來提高多氧霉素或其衍生物的產(chǎn)量。例如,轉(zhuǎn)入更多拷貝的正調(diào)節(jié)基因或打斷負(fù)調(diào)節(jié)基因。包含本發(fā)明所提供核苷酸序列或至少部分序列的克隆DNA可用來從鏈霉菌多氧霉素基因組文庫中定位更多的文庫粘粒。這些文庫質(zhì)粒至少包含有本發(fā)明中的部分序列,也包含有鏈霉菌多氧霉素基因組中以前鄰近區(qū)域未克隆的DNA。本發(fā)明所提供的核苷酸序列可以被修飾或突變。這些途徑包括插入或置換,聚合酶鏈?zhǔn)椒磻?yīng),錯誤介導(dǎo)聚合酶鏈?zhǔn)椒磻?yīng),位點(diǎn)特異性突變,或與其它來源的同源序列進(jìn)行直接進(jìn)化(DNAshuffling)等。包含本發(fā)明的序列或至少部分序列的克隆基因可以通過合適的表達(dá)系統(tǒng)在外源宿主中表達(dá)以得到修飾的酶或更高的生物活性或更高的產(chǎn)量。這些外源宿主包括鏈霉菌,大腸桿菌,芽孢桿菌,酵母,植物和動物細(xì)胞等。多氧霉素生物合成修飾基因,調(diào)節(jié)基因,膜蛋白相關(guān)基因的核苷酸序列提供了通過缺失或改造這些修飾基因,調(diào)節(jié)基因,轉(zhuǎn)運(yùn)基因而得到多氧霉素結(jié)構(gòu)衍生物或多氧霉素及其衍生物產(chǎn)量提高的途徑。包含本發(fā)明的氨基酸序列或至少部分序列(序列2-21)的多肽可能在去除或替代某個或某些氨基酸之后仍有生物活性甚至有新的生物學(xué)活性,或者提高了產(chǎn)量或優(yōu)化蛋白動力學(xué)特征或其它致力于得到的性質(zhì)。本發(fā)明包含的氨基酸序列或基因序列可以通過轉(zhuǎn)化、轉(zhuǎn)導(dǎo)、接合轉(zhuǎn)移等方式轉(zhuǎn)入到其他與核苷類抗生素產(chǎn)生菌中,從而產(chǎn)生該抗生素的衍生物。本發(fā)明所提供的包含多氧霉素生物合成相關(guān)的所有基因和蛋白信息,有助于闡明與理解多氧霉素及相關(guān)核苷類抗生素家族生物合成的分子機(jī)理,從而為進(jìn)一步利用基因工程手段改造提供理論基礎(chǔ)與材料。本發(fā)明所提供的基因及其所編碼的蛋白質(zhì),也可以用來查找和發(fā)展可用于醫(yī)藥,工業(yè),農(nóng)業(yè)的化合物或蛋白。圖1多氧霉素(polyoxin,P0L)的化學(xué)結(jié)構(gòu)。圖中POL—A:polyoxinA,POL—H:polyoxinH,POL—K:polyoxinK。圖2多氧霉素生物合成基因簇的結(jié)構(gòu)組成與限制性內(nèi)切酶譜。(A)9個重疊的粘粒代表了可可鏈霉菌基因組75kb的DNA區(qū)域,probel-2表示探針部分;(B)多氧霉素生物合成基因簇的結(jié)構(gòu)組成。圖3polA基因的中斷與回補(bǔ)。(A)構(gòu)建polA中斷突變株的過程示意圖。(B)polA突變株的PCR鑒定,M:DNAmarker;1:Str印tomycescacaoivar.asoensis野生型,2—4polA中斷突變株。(C)polA中斷突變株的生物測定,指示菌皮狀絲孢酵母(Trichosporoncuta畫m),(1—3):polA中斷突變株,(4):Streptomyces野生型,(5):多氧霉素標(biāo)準(zhǔn)品。。(D)polA中斷突變株的HPLC檢測,ST:多氧霉素標(biāo)準(zhǔn)品,WT:Str印tomycescacaoivar.asoensis野生型,CY1:polA的中斷突變株。(E)polA中斷突變株的回補(bǔ);a:polA中斷突變株,b:polA中斷突變株含有質(zhì)粒pJTU695作為負(fù)對照,c:polA中斷突變株被polA回補(bǔ);polA中斷突變株被polA的同源基因nik0所回補(bǔ)。圖4PolA蛋白的SDS-PAGE的分析及PolA催化合成產(chǎn)物的鑒定。(A)PolA蛋白的SDS-PAGE分析;1:蛋白質(zhì)分子量標(biāo)準(zhǔn),2:純化的NikO蛋白,3:純化的PolA蛋白,3:含有polA基因的大腸桿菌BL21(DE3)/plysE的可溶性蛋白(IPTG誘導(dǎo)),4:含有polA基因的大腸桿菌BL21(DE3)/plysE的可溶性蛋白(IPTG未誘導(dǎo)),5:含有polA基因的大腸桿菌BL21(DE3)/plysE的總蛋白(IPTG誘導(dǎo))。(B)PolA催化的反應(yīng),PEP:磷酸烯醇式丙酮酸。(C)HPLC分析PolA催化合成的化合物;I:UMP(尿苷-5,-單磷酸)為負(fù)對照;II:NikO催化合成的產(chǎn)物(3'-EUMP:3,-烯醇式UMP)為正對照;III:PolA催化合成的產(chǎn)物。(D)PolA催化產(chǎn)物的一級質(zhì)譜與二級質(zhì)譜分析。圖5MkO催化產(chǎn)物的MS(質(zhì)譜)檢測。圖6可可鏈霉菌阿蘇變種發(fā)酵產(chǎn)物的MS(質(zhì)譜)檢測。圖7推斷的多氧霉素生物合成途徑。具體實(shí)施例方式以下是結(jié)合圖l一圖7對本發(fā)明的實(shí)施例作詳細(xì)說明本實(shí)施例在以本發(fā)明技術(shù)方案為前提下進(jìn)行實(shí)施,給出了詳細(xì)的實(shí)施方式和過程,但本發(fā)明的保護(hù)范圍不限于下述的實(shí)施例。1.多氧霉素生物合成基因簇的克隆、分析如圖1所示,多氧霉素是重要的核苷類農(nóng)用抗生素,多氧霉素屬于核苷類抗生素,與其結(jié)構(gòu)相類似的抗生素尼可霉素(nikkomycin)的生物合成基因簇已被克隆,逐步的深入研究基本闡明了尼可霉素的生物合成途徑。由于尼可霉素和多氧霉素?fù)碛邢嗤暮诵慕Y(jié)構(gòu),所以推測二者的核心結(jié)構(gòu)的合成途徑相同,現(xiàn)研究證實(shí)nikO負(fù)責(zé)尼可霉素核心結(jié)構(gòu)合成的起始步驟。根據(jù)nikO的核苷酸序列設(shè)計一對引物(5'-TCCACGGTTCGCTCTACCTG-3'和5'-AGGGCTGGCTGTCGCTGM-3'),成功從多氧霉素的產(chǎn)生菌Str印tomycesaureochromogenes中擴(kuò)增一條預(yù)期大小的特異性產(chǎn)物,序列分析表明二者編碼的氨基酸序列的同源性達(dá)到64%。根據(jù)從Str印tomycesaureochromgenes中擴(kuò)增的DNA產(chǎn)物的序列出發(fā),設(shè)計引物(5'-GTCCGGTGCGCCATGTCCT-3和'-GGTGGGCCGTGATCGAGTC-3,)成功從可可鏈霉菌阿蘇亞種和Str印tomycesaureochromogenes同時擴(kuò)增到預(yù)期大小的DNA片斷,序列分析表明二者的核苷酸序列同源性達(dá)到99%。根據(jù)此引物出發(fā),利用PCR技術(shù)從可可鏈霉菌阿蘇變種中克隆出陽性克隆。進(jìn)一步的基因中斷實(shí)驗(yàn)表明,目標(biāo)基因(polA)的中斷突變株完全喪失多氧霉素的產(chǎn)生能力(圖4)。通過染色體步移(chromosomewalking)獲得了9個相互重疊的粘粒覆蓋了染色體上約75kb的區(qū)域(圖2A),DNA測許了染色體上46,066bp連續(xù)區(qū)域,GC含量為72.58%。生物信息學(xué)分析包含了39個開放讀碼框(圖2B)。2.polA的中斷與回補(bǔ)polA是本發(fā)明用作探針的基因,其同源基因?yàn)閚ik0,通過構(gòu)建polA基因的中斷載體,導(dǎo)入到可可鏈霉菌阿蘇變種中對polA基因進(jìn)行中斷,研究發(fā)現(xiàn)polA突變株喪失多氧霉素產(chǎn)生能力,說明polA與多氧霉素的生物合成有關(guān)。分別用polA和nik0回補(bǔ)polA中斷突變株,發(fā)現(xiàn)二者皆能使polA突變株恢復(fù)多氧霉素的產(chǎn)生能力(圖3)。說明polA與nikO的功能相同,同時也說明多氧霉素與尼可霉素的核心結(jié)構(gòu)具有相同的合成途徑。由于aac(3)IV(阿泊拉霉素抗性基因)基因插入到polA內(nèi)部,所以可可鏈霉菌阿蘇變種給出0.76kb的PCR擴(kuò)增片斷,而突變株由于aac(3)IV的插入所以擴(kuò)增出2.2拷貝的片斷(圖3B)。由于aac(3)IV基因插入到polA的內(nèi)部所形成的CY1突變株喪失對指示菌的抑制作用,說明,CY1突變株喪失多氧霉素的產(chǎn)生能力(圖3C),從而說明polA與多氧霉素的生物合成直接相關(guān)。HPLC檢測說明,多氧霉素A標(biāo)準(zhǔn)品和野生型能在30分鐘左右的產(chǎn)生多氧霉素的特征性峰,而CY1突變株則沒有(圖3D),從而進(jìn)一步證實(shí)polA與多氧霉素的生物合成直接相關(guān)。當(dāng)將polA互補(bǔ)到CY1突變株中,則能使其恢復(fù)對指示菌皮狀絲孢酵母的生物活性,毫無疑問的證明polA與多氧霉素的生物合成直接相關(guān)。3.PolA蛋白的功能確定將nik0和polA分別克隆到大腸桿菌表達(dá)載體pET28a上,然后轉(zhuǎn)化到大腸桿菌BL21(DE3)/plysE中。體外研究表明,與NikO蛋白的功能一樣,PolA也能催化尿苷-5'-單磷酸(UMP)和磷酸烯醇式丙酮酸(PEP)生成3'-EUMP(3'-烯醇式UMP)(圖5和圖6)。從而從生化角度證實(shí)PolA和Nik0擁有同樣的功能,同時從另一側(cè)面闡明UMP不是PolA的唯一底物。4.多氧霉素生物合成基因簇邊界的確定根據(jù)基因編碼蛋白的功能分析,多氧霉素的生物合成基因簇被確定為從基因polB到polR,涵蓋了染色體上25kb的區(qū)域,包涵20個開放讀碼框。通過基因中斷實(shí)驗(yàn)進(jìn)一步確認(rèn)了多氧霉素生物合成基因簇的邊界。中斷orf-5,orf-4,發(fā)現(xiàn)不會影響多氧霉素的生物合成,同時中斷orf-3和orf-2后,多氧霉素的生物合成也未受到影響。根據(jù)生物信息學(xué)分析orf所編碼的蛋白與多氧霉素的生物合成無關(guān),從而說明,orfl為多氧霉素生物合成基因簇的左邊界。同時中斷orf3和orf4對多氧霉素的生物合成絲毫沒有影響,中斷orfl也沒有影響,而根據(jù)生物信息學(xué)分析polR多氧霉素生物合成的調(diào)節(jié)基因,所以orfl被確定為多氧霉素生物合成的右邊界。5.多氧霉素的生物合成途徑(A)核心結(jié)構(gòu)的合成(圖7),polA編碼尿苷-5,-單磷酸烯醇式丙酮酸轉(zhuǎn)移酶催化合成3'-烯醇式丙酮酰尿苷-5,-單磷酸(3'-enolpyruvy1-UMP,3,-EUMP),然后在polJ編碼的磷酸化酶的作用下發(fā)生5,脫磷酸并且烯醇式丙酮酸基團(tuán)轉(zhuǎn)到5'位上,接著在polH編碼的典型S—腺苷酰一L一甲硫氨酸蛋白的作用下發(fā)生環(huán)化,最后在polD、poll和polK編碼的羥化酶、羥化酶及氨基轉(zhuǎn)移酶的相繼作用下發(fā)生氧化消除和轉(zhuǎn)氨反應(yīng)最終形成多氧霉素的核心結(jié)構(gòu)。尿苷-5,-單磷酸(Uridine-5'-monophosphate,UMP)同時也可被polB編碼的胸苷酸催化形成5'-甲基-尿苷-5,-單磷酸,接著甲基被氧化形成羥甲基和羧基。尿苷-5,-單磷酸和甲基化、羥甲基化及羧基化尿苷-5,-單磷酸皆能被相關(guān)的酶所催化形成5'位置相對應(yīng)被修飾的多氧霉素核心結(jié)構(gòu)。如圖7所示,可以進(jìn)一步推斷的多氧霉素生物合成途徑。(B)聚肟酸(Polyoximicacid,P0IA)的生物合成,polF編碼的鉬蛋白氧化還原酶的作用下,L一異亮氨酸被氧化脫氫,然后在polC編碼的羥化酶的作用下3位甲基被羥化,接著在polE編碼的功能未確定的蛋白的作用下發(fā)生環(huán)化生成聚肟酸。(C)氨甲酰聚多氧草氨酸(Carbamoylpolyoxamicacid,CPOAA)的生物合成,polN編碼的氨基酸-N-酰基轉(zhuǎn)移酶的作用下,L-谷氨酸被N—乙?;?,然后在poiP編碼的N—?;劝彼峒っ傅淖饔孟掳l(fā)生C5位發(fā)生磷酸化,接著在polM編碼的短鏈脫氫酶的作用下發(fā)生C5位去磷酸化并還原成羥基,然后再在polN編碼的氨基酸-N-?;D(zhuǎn)移酶的催化作用下去乙酰化形成a—氨基一5—羥基戊酸(a-amino-5-hydroxylvalericacid,AHV);,polO編碼的氨甲酰轉(zhuǎn)移酶催化此化合物生成a—氨基一S—氨甲酰戊酸(a-amino-5-carbamoylhydroxyvalericacid,ACV)。最后可能在polL編碼的未知功能蛋白的作用下發(fā)生發(fā)生羥化形成氨甲酰多氧草氨酸。(4)核心結(jié)構(gòu)、聚肟氨酸及氨甲酰多氧草氨酸組裝,在polG編碼的羧化酶的作用下核心結(jié)構(gòu)、聚肟氨酸及氨甲酰多氧草氨酸最后組裝合成多氧霉素。以下是進(jìn)一步提供實(shí)施實(shí)例,這些實(shí)例有助于理解本發(fā)明實(shí)施例1多氧霉素產(chǎn)生菌可可鏈霉菌阿蘇變種基因組DNA的提取接種20u120%甘油保存的可可鏈霉菌阿蘇變種孢子至5ml的TSB(Oxide胰胨豆湯粉30g,蒸餾水1000ml)中,置于3(TC搖床培養(yǎng)36小時,離心收集菌體待用,用500u1溶菌酶溶液重新懸浮50mg菌絲體,在37'C溫育約30min,或溫育至細(xì)胞成為半透明狀。加入500y12%SDS,混合振蕩約lmin直到溶液的粘度顯著下降,37。C溫育20min,然后加入25n1中性苯酚/氯仿,混合振蕩均勻后,12000r/min離心5min,移取上清液,棄去白色中間層。用中性苯酚/氯仿重復(fù)二次抽提直至看不見(或非常少)中間層為止,最后加入0.1倍體積的3M醋酸鈉(pH自然),混合后加入1倍體積的異丙醇(或2.2倍體積的無水乙醇),再次混合后在室溫下放置5min(或者在-2(TC放置30min),12000r/min離心,棄去上清液,用70%乙醇洗滌DNA沉淀兩次,最后棄去所有上清液,待乙醇揮發(fā)后,溶解于一定量TE緩沖液中。實(shí)施例2多氧霉素產(chǎn)生菌可可鏈霉菌阿蘇變種的接合轉(zhuǎn)移系統(tǒng)的建立收集生長于SFM培養(yǎng)基(黃豆粉20g,甘露醇20g,瓊脂粉20g自來水1000ml)可可鏈霉菌阿蘇變種的新鮮孢子備用。含有oriT的目標(biāo)質(zhì)粒必須在輔助質(zhì)粒pUZ8002的協(xié)助下,才能通過接合轉(zhuǎn)移導(dǎo)入到受體鏈霉菌細(xì)胞中。先將待轉(zhuǎn)移到可可鏈霉菌阿蘇變種中的質(zhì)粒轉(zhuǎn)化大腸桿菌ET12567/pUZ8002,然后培養(yǎng)含目標(biāo)質(zhì)粒的大腸桿菌ET12567/pUZ8002,12h后收集菌體,用新鮮LB培養(yǎng)基洗滌菌體2次備用。作為受體的鏈霉菌孢子需經(jīng)熱激和預(yù)萌發(fā)處理。將鏈霉菌孢子重新懸浮于5ml0.05MpH8.0的TES緩沖液中,在45。C水浴中熱激10min,冷卻至室溫后加入等體積2X孢子預(yù)萌發(fā)培養(yǎng)基(Difco酵母膏10%,Difco酪蛋白氨基酸1%,CaCl20.OIM(需配制5M的原液,分開滅菌后加到酵母膏酪蛋白氨基酸溶液中)預(yù)萌發(fā)2h-3h(不同鏈霉菌所需時間不同),離心收集孢子并重新懸浮于適量的LB中,在混合器上振蕩打散孢子,按108:108與大腸桿菌細(xì)胞等量混合,16h-20h后用lml無菌水含適量抗生素和萘啶酮酸(用來抑制大腸桿菌的生長)來覆蓋,置30。C培養(yǎng)數(shù)天后即可看到接合子。實(shí)施例3多氧霉素產(chǎn)生菌可可鏈霉菌阿蘇變種基因組文庫的構(gòu)建與篩選含有多cos位點(diǎn)的大腸桿菌一鏈霉菌穿梭載體pOJ446被選擇構(gòu)建可可鏈霉菌阿蘇變種的基因組文庫。pOJ446先用Hpal徹底酶切,然后用磷酸化酶去磷酸化,再BamHI切形成兩臂備用?;蚪MDNA被一系列稀釋的SauAI部分酶切,然后選擇合適的SauAI濃度梯度。利用脈沖場電泳分離部分酶切的基因組DNA(電壓,6v/cm;角度120度;工作時間12小時,設(shè)置溫度,14°C)(回收36—40kb大小的目標(biāo)DNA,然后用熱敏性的磷酸化酶進(jìn)行去磷酸化,再將磷酸化酶加熱失活(7(TC,5min)目標(biāo)基因組DNA和載體的分子比10:1左右配制進(jìn)行連接包裝,然后轉(zhuǎn)染感受態(tài)的E.coliEPI300-TlB細(xì)胞。利用PCR(聚合酶鏈?zhǔn)椒磻?yīng))來篩選基因組文庫,首先將每個96孔板的克隆混合培養(yǎng),提混合粘粒作為模板然后進(jìn)行PCR反應(yīng),先將陽性信號定位于每個96孔板,同樣的方法接著定位于排,最后定位于點(diǎn)。實(shí)施例4多氧霉素的發(fā)酵、分離純化及分析鑒定將20X甘油保存的孢子接種到TSB培養(yǎng)基中,培養(yǎng)24小時,按照2%的接種量接種于發(fā)酵培養(yǎng)基(大豆粉20g,玉米粉20g,葡萄糖10g,酵母膏10g,CaC034g,KH2P042g,Nacl2g,水1000ml)中發(fā)酵7天。然后用草酸調(diào)pH值至2—3左右,過Dowex50WX8(H+)樹脂,用0.2MNH3H20洗脫。洗脫液旋轉(zhuǎn)蒸發(fā)濃縮后,過0.22ym的過濾器,用于HPLC分析或LC/MS分析。HPLC的分離條件為,流動相A:每升含有l(wèi)OmM庚烷磺酸鈉鹽和2ml的乙酸,流動相B:每升含有l(wèi)OmM庚烷磺酸鈉鹽和2ml的乙酸,檢測波長263nm,30min內(nèi),流動相A從90%梯度降至55%,流動相B相應(yīng)從10%升至45%。色譜柱為Agilent250X46mmC18SB色譜柱,流速0.5ml/min。程序設(shè)置如下<table>complextableseeoriginaldocumentpage16</column></row><table>實(shí)施例5基因中斷突變株的構(gòu)建將構(gòu)建的中斷載體通過接合轉(zhuǎn)移的方式轉(zhuǎn)至可可鏈霉菌阿蘇變種中,將生長出來的接合子在添加阿泊拉霉素(apramycin)的SFM平板上抗性驗(yàn)證,驗(yàn)證正確后,在未添加阿泊拉霉素的SFM平板上擴(kuò)大松弛培養(yǎng),待孢子生長豐滿后(約7天),收集孢子,然后在添加相應(yīng)抗生素的SFM平板上梯度稀釋每平板約50—100個單菌落,挑選菌落分別在含阿泊拉抗生素的SFM平板和含硫鏈絲菌素的SFM平板上擴(kuò)大培養(yǎng),選擇在鏈絲菌素平板上未長但在阿泊拉平板上生長良好的菌落,轉(zhuǎn)接到TSB培養(yǎng)基中提取總DNA,進(jìn)行PCR驗(yàn)證正確后,突變株進(jìn)行發(fā)酵培養(yǎng)。本發(fā)明涉及的序列及記號分列如下:<110>上海交通大學(xué)〈120〉多氧霉素生物合成基因簇及其應(yīng)用<130>invention〈160〉21〈170>Patentlnversion3.3<210〉1〈211〉46066<212>DNA<213〉可可鏈霉菌阿蘇變種<400>1tcgagagggaaccgggccgcgaaccggtcgccgatacggaagatggcgttgaccgtgccc60ggcccggcgatgttcctgaccggcaggctccgccactcgggaaactgctgctcc3ccaac120acgcgcaccgtctcaggggacaccgtcagctggttggcgtgcatcttcatg鄧gg犯gca180tccgcaccccgatcttcggccgcaatccatttgtgccgcgcggctgcgag卿gggcsgg240gggtttcggccagtcgttctggacgggctgagcgagcatctggttcgcctcgcgccgacg300g柳gctgctctaccaggtcctttagttcaatgttcacgttttcatcacgctttcatcag360atcggccctcgaaaagttccggccatgcgtcgcgccccttacggtcgtctagcgccaact420gatctttgggggacacatgtcgtacaaccagccgccgtccgtccagccgcccttcgccgg480gcccatggccgggcagggtggcaagcccgggtgggcgcggaagcggatcgtcgttccggc540cgcgatcctcgtcttcttcgtgggsgtcgggatcggctcctccggcaacggcggccagga600g犯ggtcgctgccggcagcgacgtcaggcctcagcccacggtcaccgtcacgaagaccgc660cgaggcgcagacggcc卿gacg卿gcggcgagcaggcgagtgacagcaagcccgtcac720cgacgaggccaagaaggcggccgttcccgacttcgtccggagtccgccca780ggacaaagcgc卿aggtcggcttctEicaagctcacctcgcatgacgcgctcggccggga840ccggatgcaggcattcgaccggeiactggaetggtgtgcagccagaacgtgaaggccggcgt900cgtcaagtccacggacacggaactggacttcggcgcggtg卿ctggcggagacttgccc960ggcg犯ggacg犯gcgccgccgaaggcgcagggcggc犯gatgcctgccttcgccggcaa1020gtcggtgaaggcggcacgtgccgcgctcgactccggtacctcgatcaccgtgcaggacgc1080cctcccggacgaccgctggatcctggtggagtcgaactggaaggtgtgcacgcagagccc1140gtccgcgggtgcgtcgctgaccgggcagcccgtcgagttcaccgccgtcaagttcgagga1200gtcctgcccgtagccgttcgtacggggcgatggcccctgtcccggcaggtgcagccgccg1260cgggacggctggaccgcgtctgtcgccgtgggcgtcgtctgccgcacgatgggggcactg1320tccggtacgagacgaccgattgccctggaggggccgtgagacgtccgcacacccgcctgc1380cgatgttcaccgcggtcgtgacagcggtgctggccctgctgttcgg犯ccggtacgggcg1440ccacggccctccaggtgcccacgatccgcgggggcaccgtgctgtacgcggccacgggcg1500cgcagtgcgtcgtcggcttcaacgcggtgaacggggtcaaccactacgccgtgatgaccg1560gccactgttccggcacccacgccaccacgtggtacgcggacgcggcccgcaccgtgccgg1620tcggtgtcaccgcgggcgcttcctacccgatcgacgactacggcgtggtccgctacacca1680ccggcgcgctgatcctccccggagacatcgcgttgggcgggggtgcctaccaggacatca1740ccggggccgcg犯cccgEicgatcgggcggtccgtctgccacgtcggacggaccagcggcg1800tccactgcgggacggtgaccgcggtcaacgtcacggtcaactacgccgacggcacggtct1860acggcctgttccgctccaccgcgtgctcggaagccggtgacatcggggcgcctgcctact1920ccgggccgacggccctcgggttcgcggtgggttcgtcgggcaactgctcgtccggtggcg1980tcacctactaccagcccgtcgcggaggtcctctcggtcttcggcctgacgctgtactgac2040cgtcccgacacgaccggccgcccccgacgcgctcgcgggtggtcgtccgtggacggccac2100gccggcgggggcgacgtgagccgcgtcagggcgtgggaccggcgaggtcgacccgattgt2160gcatcacgtcgaggtggtgacggtcccggtgaggcacgtggtcgtcccgacccgggaggc2220tgaagaccgcgcagacgtcgtgctcgcagcccgccgcgtccagggccgccagcaggccct2280cgcgcagcacggcggcctcggacgattccgagtcgggcaggacg柳gaggggagtttca2340cggtcgggccgggccacfitcggggagcggggtcggacaccgcgttccctccgga犯atgg2400ccctttcgtcccgggtccgttcatgcatgatgagcggatgaaccacaatgaccagcgctt2460ccacgtcatcgtgctgtcgaacttcgcgagaggcttcgacaagtacgcctacgcctacgg2520caaggcggggattccggagagcaccttccccgaccgtttccatctgctgacccgtgccga2580actgggcataggcatcggcaaggcgcggcgactgctggaccggctggccatcgcgggcga2640ccgcctgctggtgctggaaaccaccgtggatcccgaccggctcgtgcccaacgtggcgac2700cggtctcggcacggagctgcacgaggaccgtatccggctgtcggcgatccacgaactcga2760cggggacggagacgagttcactctgcgccccctgagcctgcacacggcggcacaccgtcgggtcctgccggtcgcgtccgcctgccaggcgatctccagcgaccaggcgcccgcccgggtgcgcgcccgtgcggcgggtgccgagcgtgccataccgttcgaacagcaggtgagactggtcgtcctgatcaccaacgcgcacaccctggccctcgccgcactgagcgccgcgggactgagcgacgacgtcaacgagcggctgatgatgctctggcgcgcgg肌cgcgaccggtggccggggcacggcggcgtcgccgacgcggccggggtcggcgtcgaggaggtctgcttc犯ggagctcttcgaccgcgccgccaacgtctggagccgccgcttcgccgaggagcacggcttcgaaccctaccagggcacctgggacgggcgcccgctgctctgggagcgcgccaacggcatcgcccgttacgcctccctggaggaccgggccagcgattcgaggagttccaggcgttccggcagcgggccgccgagaccaacctgtaccgggcgctcatgaacacggtgcaccggtgcgatctcgccgaggagtggtccggccgtgcgatggtctgcttccggcaactgcacgccgaaaaggcgcggtacttcgaactggcccgcgccgcgggcctgccggtcctgcccggttcaccggcggaccacagcaggccgctgggccgctacctgtccgacgaggcatcgccgcgccgccgcctgctgatcgcccccggaacccggcgcctgctggacaccaagggatggctgtggccgcgcacgttcggctgggccgaggcgttccgggcggatccgccggaccaccgtcgaggacgcgatggcggcctc2820ctacgccgacacgacaccgcgctcggtgtc2880ccggtgctctttctgcttctcctcggcgtc2940cccgtgggacgcggtcggccactggctgga3000ggtgatcaccggcggcggggagcccacgct3060gtccgcgtgctcggcggccttcccgaaggt3120gaaaggcgagcacgccgaccgtgccgaccg3180cgtgctggccgtttcccgccaccaccagga3240gcgcacgccggtggcctccgtcgtcgacac3300actgcggatgaggctgatctgcgtgctcca3360cgccgcgtacctttcctgggccgcggccct3420ctacgtgtcgaccagcacggagtcgctcta3480ggagcaccaggtgccgctggccgtcgtcac3540ggcgagccgtctgccctggggcgcgccggt3600gcgcgtcgccgcctacaccgagcccagtct3660cagctggaacgtcatggccgacggccgctg3720gatcgtggcggaaggcgcgccggcatgaac3780csigctctgcgcctcctcggccctgctcgac3840gccgcgctgcgaccggaacaaccggccgag3900cgcgcctggctgcggcgctacgcactgcct3960cgaggggtccggcacgggctcgccgtggtg4020ttgtggctgcccggcgatgtgtacccggtc4080gagccggcgtcctaccccacgctgccggta4140cggcccgagtatctgctgctcgccaacccg4200gacgagtgcaccgcggtgatctcgtggctg4260gacagcgtctacgacctcggcgccccgttc4320ggtcgcgccgtcctgctgcactcggtcacc4380atcgttgtcctggatcctgcgcagaccgca4440acgcccgcccaactgcgcctcgccgaccgt4500ctgctgaccggacacggtgaggtgccccggcagatcgtcgacgacctggcggcacgcgcc4560gagcggctcttcgaccggttgccggacgacgtgctcacggcgatccccgcggcgagccgg4620acctgccccggcaactacttcttcccggtcgggatcccggcggagacgctccggcgcgac4680tacggcgtgctcgccatcccggtcggtgtgttcggggacagcgcctggcccggctccgtc4740ctgaccagcctcggatgacgtcaggccaggcgcaggtcgatccaggggac;ggtgtcgccg4800tcgcgcagcagataccgctcgagctccacgaagccgtgccggccggcgaagcgcagcccg4860tcctggttggaggccagcaccacggtctcgatcacctgggcgtccagcgcacgggcctgg4920cccagggcgcgttcgtacagccgggtgccgaggccgcggcggcggtgttcgggcaggacg4980cgggcgatgaccgtggccgtggcgccgttgtcctcggtgggcgggcgtacggtggtgcag5040ccgatcaggacgtcgccgaggtgggcgacctccatacggttgcggccggtgcgggcacgg5100acgtcgtcgagtgacagcacgtcgccggggatgatcaggttgtggacgtgctgccagtcg5160tggatcgaggcgtcgtcgtccacctcttggatgcg犯ggtcggtcaccggcccagccaac5220agctgcccgctgtcgtccgtcaaacgcaattgccggaggaatcggtgcagttcagcccgc5280accgggagcgtcagcggctcccgtcggggcgcggccgtcggggcgtggcgcggagtacgt5340ggggcggccggtgggggagtgctagcgtcgccccatgcctgaactgatcgcacccgcggc5400ccggcttcggtcctcgtggctcgccgcgtgcgcggagtggcctcccggtgcccatcagga5460cgggacgggtctgcgcctggctcccgagggcgatctgcgcgaccccgacgtgttccgcac5520ctgggtcgagcgactgcgccggcagtcggaccggtcggtcgccgtgggagagggccgcgt5580ccacgccacccactggtggatcgtggaggacgacagctatctcggggccatcgatgtgcg5640gcactacctgaacgccctgctgctcgacgtcggcgggcacatcggttacagcgtccgccc5700ttccgcccgcaggcggggactggcgacctgggccctcggcgcggtgcttccgcgggcccg5760tgcgctcggtctggaccgggtcctcgtcacctgcgacgacgacaacaccggttccgcacg5820cagcatcgagcgcaacggcggcgtcctggaggacgtccgcgctgccggctccggcctcaa5880gaggcggtactggatcgacctgtagg犯gggtg犯ccgccgtccccgcccgcgtcgcacc5940gcgctccgtgcgcgttccctggccagctccctgaggtaggcccgtgcgtccacctggatc6000gtgtgccggggcgaggccacgtaacggcgggccgtccgggcccggtgggcgcggatctcg6060gcgagcatcccgtcccgcccgggcagggcgcaccggccctgcaacaggtcggcgacccag6120tgggactgggcctgcgccagcggcatgatcgcaccgagcggctggacgaggccgatgaag6180tacaggccgggacggtcgggggagacgacccggtggtagagaccgggatcgttgccgctc6240acgtcgatcacctcgtcgtcgaggaacgggatcgtgtcgatgtcctccacactgccgtcgcggggcacgggtttcaccgtgatgtcgccgatcgtgggatgggcggcgaggacgcggtgtcgaccgcggctgagccgcagcagcaggtgccgggccagccaggagtgggtgaggtggtccatgtgcgcgccccggcgcatggcc鄉(xiāng)aacgcgatgtcgcacgccgagttgccgatgccctcggggctgcggtagtggtgcgagtggatcatctccggctcgggccaacgcggtttccaatagacccccgtctcgagggcgccggtgtcgccgtccgggacgacccgcaccacctcggtgtgctcgacgaacgcgtcgaagtagcgggcttcgtccgccatcgggaatccggcgtactccgagcggtaggccgacgactgtccgttgtcggagcccaactcgaagcagtcgtaggcgatgatcccggaagaaccggccccgatcacacaccccggtcatgtccccggtcgatcacaggctagccccgttcaacaaccatgtgcgccaagcatgaccgggcggtcacatgaccgcccggtcctgggaccggctgtcaccggcccgccg卿cggcacccacggctactccacgggcagcctcaagggctcactgttccagtacttctccgggcagacgtccctgcgcgtctacgcccacatcggcgacttccgcacctacctcgtcgacgcacagccgctcgagcgcggggtgacggccgctgacgccgtccgggcgccggtgaacgccgtgcgcgccgtcgccaccggggacctgcgcaacctcctcgtgttcctgccccacctcgcgctaacgcgatgtcgtaccccgtgcagcagatg6300tcgaacgccacctgggtggcgtcgatccgg6360tggccgagccgggagagcaggtcgtcggag6420tcgggttcgggcaggccgtagtccgccagc6480aggccgcggtcctgcacggccagcggcatt6540gtgggcctgccgaacaggtacttcggcagg6600gtttgtcgggagacgcgggagacctccacc6660aggacgaggacgcgccggtcggcgaagggt6720cgggtgcccgcg犯ccctgcgacgccgggg6780tgatggccgttggccaccaggacggcgtcg6840cggtggcgggaggtgaccgtccacctgtcc6900cggaacctgatcgaggggcgcagcccgaag6960atgtgggcgtgccccggatacaccggacag7020atgatctgacgtgaggtgttgatgtggagc7080ttgaggtagcgccagttgccgcccacctgc7140cccctgtcggcgagaacctggcaggcggct7200acgttccgcacgccggcctccttgtgacca7260ggacggcccgccgcgcgctgtcaatgcatg7320ccgttgacatcagtggacggccgctccacc7380acacggaggagcgcccatgcccacgcccac7440gcgtgtactcgtcgcggccatggacgagtt7500gaacgtcatcgcccgcgaggccggtgtcgc7560caagctcgatctcttcgcctacgtcgccga7620gcagccgtggctggacggctacgacgagtc7680gctggaggcgtggctcgactacttcgccgg7740caccaacatggagatggaccccgcggtccg7800ctacctggccggactgcggcccctgctgga7860ggacgccgacctcgacgcgctgctgtcgat7920cctgccgcacctgtccggcggcgacggccc7980<sequence>complexsequenceseeoriginaldocumentpage22</sequence>ccggccgtcccgaccaccgccccgggcgccgcgccatgaccgtctacccggatgagcccttctggctcgtgccgcgcgcggaacttcccctcggcggccgcggcctggtcgctgcggcctactacgacgagctgctgagcgccgtgctcgtcaccgacatctgggtcgacagcgaggccttccccaaggagatggccaccttcgaggtccagaccggcgaagggacactcgccaccgcccgtccgccgctggcctaccggctcgcacagttccgcagccgcgccaccctgcgaccggcgcgactcgccgcgctcgtgcgccgcgcgcccctccgcttcggcggctgaacgtcccgcgcgcgtgcgcaccgcccgcgccacgctcaccgcctcacgcagcgcccgcgccacggttgcggcgccgcgaagccgccgcaccggtcccctcgtcgcggtggggcccgtccgccccg犯ccggaccaggaatcactgctcctcctcacggaaaagccatgaccgcggtgctgctgaccgcggcagcccaccccgcctcgccgacggtccgggcgatcgcctacaccgacctgaccgtgtcggccgacccgggcacgacggccggggcgaacgcgcccttcgggcacggcttcttccaggccatcacctcctggggcgtgatcaccgtcgcccccaccgcgttcgccgacgacctcaacgcggctcgcggctcacgcttcgcggaccgggtcgacatgggcggcggcgcggccctggtcgccgccgccctcgccgccgccgagaccaacccgtcggccgtccagtacgtcggcggcagcgccgactagatgtacgacgcc犯gccgtcacacacccctgcgcctccccccacctcacggaacggac9780ggcatcttgccggacagatgtacgtgtccc9840ccgtcgcgcccggcacccgccccttccggt9900gggtcgtctacgagaacgacagcgtcctgc9960tccgcgacggcgcacgtctccgcgtctgca10020ccatggccggcggccgcgccctgtggggca10080ggcgggcgcacggcgcctccttcgtcgcga10140gcttcaccgcccggggccgcctgcccggcc10200ccctcgacggccggctcaagaccacccggg10260gagccgaatggaccgtgcccgacgacagcc10320ttctcagcctcaccctgcgcgacttcaccc10380ccccggcggacggccacggcggcccgtcga10440tctcgcaccgcccgcgccacgctcaccgcg10500ctcgcgccaccgcgccccccgaccgctcgg10560caccgccccgggctcccacgcaagcccgca10620gacgccccgcccctcacggagacgtaccac10680gtgatctcgtgttccgtacactcctgcggt10740ccgccctcaccctcgcaccgggcgccgagg10800cggacccctccaccgccggatcgttccccg10860cgggccgctcgtacagcgcgcgcgtctggt10920ccgtcgccgccggcgcccatcccggcctcg10980cccagtacgagagcctgctcaagcactacg11040agtcccagggcggcctgttccccagtcatt11100tgacctggctcaccacgcagaacaccacca11160ccgggaaactcgccctctccgggcactcga11220gccgcaacccggccgtcaagtccgtcacca11280ccgtcgccgcctccgccaccctgggcattc11340ccatcgccggtgtcgccgccaaccagcaga11400agctgcgggtcatcaccggcggcttccact11460gcgggttcgaggacagctccggcatcggctagctga犯ctgacctacggcgtcacgacctcctccctctacgaccaggtgtggggctccgccgccaagccctgaccggtcccgccgaccgacgcccagcacgcctgcgggcggccacgtgcggcgaccggctccacacccgaccccgcatcccgccgcacgccccggcccggacgaccgcgcgtggcaacagcgtgcgggc肌ggacccgcggcctcatcagcaatggtcggcttcggcagacggagttccccgcggccgctgccaccgcaccccggatcgagctgcgcagcgacatcactctcgccgtcgtcaaggcggctcgggtgtcgtacgacggcggttcgacgcgcggactgatccccttcgagcacaactccatgacgttcctcctcatgcgccaccggacctggtccttcaacgccgcgttctacgtgcccgacgccacccgctaccggtacgtcggcggcagcaccgacgaggcctacgaggtcgccttcgaggagtaccagatcgcgcgcctggtgctccccgtctcgacgcgggcgctcatgcacttcctcagcctgcgccacccccagcgggagatcgagatggtcgccatgccggtcacccacgaggcgttcaccgccgtccccttccccagggggccggacctgccctcgaagtcaacggtggcaagcggatcgcctccctggtcacgtcggcagccgccgctgtctgcccggacatcgtggagacggacgtgctcgcgcggtacgccgagggcaccctgaccctcccggccgacctcgtcagttcgatccacggccgcctgggatccgtccatctgcccgccagcgcgacagcggcaccgtcacccgcgccgtcc11520cctggctgctccacacgctcggagccgaca11580ccgcccagaacctgcccggcgtcgtgtact11640gtgacggcggcccgccgaccgccgcactcc11700aaccccgtggccgcccgcactcctttgccc11760cggatctcccacgcccgtgacctcgcacga11820accggagcctccttgcaaggtctacggcga11880gcaggaaggcggccccacactcgtcggcat11940tgcggggccggcggagagtgggtaggacat12000ggacgccggccgcgtcggggtcatgg兆tc12060cgtcgagctcgtcgacagcagcgcgagcga12120caccgccggtgaagacgccaacgacgagct12180ccgctacctcatgcgcagccgtcacggcag12240ggtacgcgctccgatcttcaccgtgcgcca12300cgaggagagcgcccggtaccgcgaggtcgg12360actgctgcgccaggagggcaagcccggcga12420ccaccagcaggtggtccggtccgccacccg12480gcggctgctggacagcggcatcgcgcggga12540ctacagcgtgctgtacgccacctgcaacgc12600cacccaccggcccgacgcggcctacgtctc12660cgaacagatggagacggcctgggcgaagct12720cttcggccgcgtcagcccgtgacgcggcct12780ggtccccgtcccctcctggaggactttgtg12840ggatcggtccgcacctccggtttcaagcac12900gcggcggacgccgacgtggtcctcgacaac12960tcacgcgtcttcacgacactcggcggccgc13020aacggctccgggatcgagcacaacgtgctc13080tccctctacctcgtgcccggtctggtggcc13140ggcggctgccgcatcggcgagggccccaag13200ggacgtccggtgcgccatgtcctggacgtcatggaacgcttcggcgcgaccggcgggacgaccgccgagggcggactgaaggtcagggccgcacggctgacgggctgtgagatcgacctgctcgactacacccgcaaccgggcgctcatgagcggtccgctctacgggggagccacc犯gaccgccctgctcaccgccgcggcggccgaaggcgtcaccaccttgcaccacctctatcccaagccggacgtcgtcgcgctcatcgacgtcaccggcccggagaccctggtcatccgcggccgctacaccctgccgccggacctgatcgaggtgggcgacgggccggtgcacatcacgggcgcacccgagttcgacgtgctgcgccggatggtcacggcccacccggccgaacggcccctgggcgtgttcagcgacagccagcccttcttcacgctcatcagcgaggccgtgtgggagcacctcggcatggacgccgtccaggacgactaccaccggacgggccaggacctcacggcgaccgccgcgctcgcggtgccgggacggaccgtgtaccgcgacatcgtgggcgacctgcggtcgccggccgccggctgagagggcccgtcagcgcacacgccgtcacgcgcgggaaccgtcgtgccagcgcctggcctgcgcggccgtccgcaggaaccaggcggcggtctcggcccgtcgcgtgtggcgggggg卿acagcagcgcgcgccagcgcagcagcacgcgcgagagcgacctgcgcaggtccagccagacgaacagctgcgtcctgtactgggcgtcgcagacccaggcctccgactccgctctgcgcgaccagtgcgggccgtggccgagccgctgtg卿gggctgcggcgaggatcaggatcctgcgcgggtctgcgggctccgcggtacgagggcggtcagcgcggccgtcaggacggcgttgcccgcggtgagcagg犯gctgcgggagctgggcaccgacatgacgtggagcggcatcggcgcgctgcgccgggacgtcgtcgtcacctggatctgcgcggccgtgacccccggcatggaccgggcggtggcggcgctgggcgtggtgaccgaccacgaggcggactcggctcccgtcgaggtcctcgccgcctcccgggcgctgatggccgggtgggccgagggggcgcgctacggctacgtcccgggtctgaccgccgcgctgagggtcgacggcgtcaggaccccggacctgcgggcggccgcggtgctgctgctgctgcgcaacacgcaccacctcgaccgcggactgggcgcggacgtcaccccggcggccgactgtgtggcaggcccgcgaacgggcctgccaggtgcggcccgcgggcggcsigcg犯cgcagacggaccacgggaacgtcgggatgccgggcgccgtgccgggaccaggcccagcgcaccggggtctcggtgttgtcgtgccacagggggcggatcacccggtgcatcaccgtgtgccggggggccgccagcaggtcgccgacgatccagtgcgcggtgaaccgggccacgtcgtcggtgaagtacagggcgtccatctcgatgtgggggatcgaggtcttcccggcgccggatatgccggcggtcatgcgggggtgtctccttcaccgcgtgccgcgccgagcgcgacgagcgtcagccacgcgcccacggcgggggcgagcacggcggcggcaccccaggccagctggaaggtcgcgctggcgttggccaggacggtcatcacgggtgcggcggctcccaggaccacgggaacggcccacagcaggaaggcgacggcgaagaccaggcagtgccctccgaagcggcgcaccgcctgcttcatgagcgcggccgcgggcagccaggacggtagcatcaccgtgaggctgtccgtcatcagc柳卿gggcggtcggcgagggtgcggcgccgggacgcggccggggcgccggtgcggcgggcggcgaggaaggtcgccccgttcagccagaggagcgcggcgctcaggacggcggccagtagcatgttctgggtggcgaggacgggcagggccggggtgttcgccgtccagaacaggcgcatgagctggcccacggacgtgatcagcggattgctgagctggacgagcgggagggcgcccccggtcagcaggccgatcaggccgcccgcgatgtgctgcgcgcgggtgaagaagatcagcgcgtcggcgaacagcgccgccaggtaccaccgctgtcccggccgggtggaggcgaggtgcccgaccggtggccggcgcggaggaggtggcgtccgttgcgagccgggcgggacgccgcgggttcttggcggtgccggtcatgggctcacctgctcgcggaccgcgtgggggatgcgtccgcgcaccgcctggctgcacgcctggaccttgagcgcgtccgcctcggccgccgtcagccgggggtagaggcccgccacgtcggtgagcagcagcgccgccgcggcgaggtcggcgttgacggcgatgctgg柳cgaccgggaccaggccgtccacgtcgacgatgtcgccgacgaggccgtagcggcccttgtactcctcgggcgccgcc15000aacagggcatccgccacggcgccggccacc15060cccggcgtcagccggccggcgggcgccagc15120gcgagccgcagcggacgcagcgccgagccg15180tgggcgagcagcagcgccacggaactggtg15240ccgtgcaggacgtcgagggccaccagcggc15300gcgaacgccagctgtgtcaggcacagcagg15360caggccggacccgtcgccttcggtgccggc15420ggcacgcgcacgcccagcatcagcagggcc15480gcgatcagatggaggcggccggggtgctgg15540ccggcgcccgtcatccagcccgcggtgcgc15600agtccgtccttgccgacgacctgttcgagg15660tcgcacgccgcgagcacggcggccagggcg15720tagaccaggaagacggcgccgcgcagcacg15780cagcggtcgaccagcgtgccggcgaggggg15840gtgagcgccgcgcccgtcacgtccagcggt15900gccaggggcgtccacaggccgttgccgacc15960cgtcgggcgtgggggcggtgtgcgggcggg16020acggtggcgtcc卿gggtcggtggtg犯g16080gtccgcggagtgcgctgtgccccgggcggg16140gtacggcgccccgtctacggtgtgtcatga16200gtggtgccggtgcgccgtccggtgagcagg16260tcggcgatccgtgccgtcgccaccccggcc16320gggatcattccgccggtcagccggggcagc16380tcgagcacctcgccccggtccggctgcccg16440agcagggtgtccgcgcgcagggccgccgcg16500ttgcggacgccgctgccgtcggcggagcgc16560gcgtccagcagcgtccgcagcagccggtcg16620aggtcgacccgctgcccgccgtggaacacc16680tgccggtcggcggccgtg犯ggtgcgggcgtcctcgccggtgaggccgacggccagccggcgctcccggttgagcaggccgaccagccggcgttgcacctggccggacaggaccatgcggacgacctccatggtgggcggggtggtgaccctgagcccgtgccggaagaccggctggatgccgagccgctccagatgggtgtcgatctgcgggccgccgccgtggacgacgacgacccgtgttccggcgtcggccagctcggcgacgtcctcggcgaaggtgcggccggcgtcgccctcgtcgaggacggagccgccgcacttgatcagcacggtccggcccgcgaggggccgtgcgggtgctgccggtgcggtgctcacccggtggccgcgccgccgcgctggtagaggacgccctcgctccagacccggtcgaccttgccccaggccatggccgaggcggcgtccgggaagaagccgctgccgttgaggttggcgctggtgttgcacagcaccgggactccgctcacacggtggtaggcggtgaggatgtcggagagcagcgcgtcgtcgtccggactcacggtctgaaggcgtgccgtgccgtccaggtgcacgaccgcggggatccgtgaggtccagccgggccgtacggcgtggtcgtacagcatgtgggggtcgggcgtgcccgggtcgaagatctccggtgcctcctcgacgaggcagatgggtgcgacggggcggtagtactcacggcccttgacctggttgagggtctccttcatggcggcgtcggtggccgcggcgaggatgctgcggccgcccagggcgcgggggcccagttcggcccgtccgtgcagcaccacgaccggctcctgcccggtgtgcagcacccgggcgagttcgtcgggcgagcaggggcgggcggtccagccctgcggtgtcccggtggtgggggtcagcgccgggcccagccgggtgtgccactccagcgcggggacggcgttccggccgccgatcgcgccgagcacggccgcgccgatcgcggatcccgcgtcgttggggaagggcgggacccacatccgccgtaccaggggcagggcgcgcagcgcgctgttccacttgatgttcagcgcgcaaccgcccgcgaagcacaggttccacgggccgtcgcccttccaggcccggatcctcgcgtccagccgttcgaggagcaggttctggaggaactcgtgcacgctggccaggacgtcctcgtcggacacggcg肌gggctgcacctgttcgcgtacggcgcgg犯gaagtcgtgcagcggcggcatggagggctcg犯gaggctgccg卿cctccgacggtccgggagtgctccgcggccgccggggacgcctcgttctcgtagtggtcgtggaagaccgaggccagtacctcgagcaccgcttcgctgggcttgcccagggcgatgtacgccatcagcttcccggcgaccgacaggtcgtcgacgttggcggactgacggtcccggcggaacgggccgaagtgatggccggcggtggcgtaggtgtgaccgatcagggggaagagggatccgccgttctccacgccggcctcggggtccacccagtacaggcgcgggaacatgccgccgtcccagacgagcacg犯ggcgggttcgccgcgccgcgcg肌ctcgctggtgcagtaggtgctcagcacgtgtcccgcggcgtgcgtgtggctggtgtacgggtaggggacgccgcgggggaggtccgcgattcgcggccgtgtccgtcctccatggtcgtcgacgcgttcagctgcgccggtacgtgctggggtggccgccaggccggcctccggtcgtccccgcaggtagtcgggcgacgaagtacgacgacggcatgatctccgtcggcgaccctggtcgccagctgacccgcgaacgccttagccgatgtttggtgtgcagccgactgcacgggggcagtgccgcceiccgccggcgcggcgcgcggccgaacgtgccccacacatggggtccaccgtcccggcggtacccggcgcgggttgcagcgcgacaccttgccgagaggtgcgatctcggtgcgggaggaagcggcatgccgagcc3gCCgggtC3ccgatccggtggctcgg卿tcctcacgcagatcatgttggtcgtccggggtcgtagcgcgacgccggtgggtcgccgcggacgatgtgacagtccgctccgggccgaaagggaagatgcgggcagcaccggcgaccgcggcccgacgacctcatgcaatgtagctcatctcgacggtgaaggtgccggacaccgacggacgcagcaggt18480cggtacgggccgacgacgagttccagcggctgtccgcggt18540ctctcgtcgccgtcccagccgtcgacgacgaaggcgtcga18600tgctcggcgaggatcgtgggcacgatgcccaggtcgccga18660ttggcgagtttctccatctccacgctcaggacgaggcgcc18720gcaccgtcgtgagtcagtttcaggccacaggtgatcatga18780gcggggtgaaggcggggggcgcggtgcgcggggcgacggg18840cgcggcccggggggagcaggtcggcccatacggcgggcat18900tgaagccgtgccggacgaaccaccggccgctgtgtttgga18960agccgcccagggcggccagggcgtccgcgcgctccaccat19020cttggcggtcggcggcgacgcagaggttgtacagcagcag19080ggccgacgcaaccgatgacgcgcgagtcgtgcacggcggt19140tgcggaactgcgtaccgctgcgggcgacgagcaggtcgtc19200gccgggcgatgccgggtgcgtccgtggccagcgccgggcg19260tggcgccgggcgaagccgagcccgaacggctggtcggtgg19320acgttgacgtgcgggggccgcgacaggcaccacaggacgg19380gacagcgggctcactccgtcgtagaggcggtcggcccgct19440acgagggcgaactcggtgcgggccatgccgggcgcgacgc19500ccctccaggtcggtgcgcatgctcaggctgagctggtgca19560tacacgttgccgcccgcgtaggggtaacgcgccgcgatgg19620ccgcgtccgccggcgatgagccgggggagcagcagcgtcg19680acgttggtgtcgaccatcctgcgccagtcgtccaccttcg19740ccgctggagaggcccgcgttgttgaccaggcccaccaccg19800tcgtcgagcgcgcgttccagcgcgtccaggtccgtcacgt19860cggcccggcccttccccgtcggcgagttccgccagccggt19920atcaccgtgtgcccttgcgcggcgagccggcgcgcggtga19980gccccggagaccacgacggtccccagttcctgactgctca20040cgtcatctgtgcgtgccctgctgccgggtgacggcatgtc20100agcagcatgtcgcgggtgccctcgcccagcgagggatcgg20160cgaccgagacgtccgcgaccccgtgccggacgcgggggtcgtcgccgaagaaggagtcga20220ggcagtcggtgaagaccttctcggtgatcagctcgtgctccggtgtgtacacgctggtcc20280tgccgccgctgatgttgtgccggttgaccatgtgcaggctgacgtaggtgcagccgtcgc20340ggtggacgccctcgggggtgggccgcccctgcgcgtcgtcgcgggcgacgatgcgcacgc20400agtgcacctgcacggcccactgctccacctcgggcagcggcaggcggccgacgttgaagt20460cgatgagcgcggtcaggaaggcgccctcgcggacctcgtcggtcagctcctcgtacttgc20520gccactgtccgccggcgaaggcgttgttctcgacggtctggaagtagcccgggttgtcgg20580cgaccagcagttcaccggtggcggggcgccaggtgtagcgggtgtgccgccggtagcggt20640agttgcccccgtccggcaggtacgggtcggccggcaggtcgtcgtaggaggccgcgaggg20700tcttgaggctgtcctggagggcggcgggtacccgcatgtcgctgccggggaccatggaga20760agccggtgcggacgaggtctccggtgatgtcggccgggctggacagggcggccgtgggtc20820gggtgagcacgggaggttcctttcttccgccgagaggcgggctgttccgtggcgggctgg20880ggtcggtcaggtgcgggcgaagtggacgagcagcgcccgccggtcgtcggggcagccctc20940ggacaccggggggacgccgtgccaggagtcgtcggagcgaaccagcaccaccgacgtgcc21000gagcagcggcaggacccgccgggcgacgtccttcatgtccggcccgcgcagcacgtgcag21060gtcgccctgccactcgctgcgccaggtgtcgttgaagtagaagagatgggtgaccgcctt21120gtcggggcggtcggtgtgcggctggatccagcagccgctggagtaccgcgtcatgcgggc21180ctcgacggt'gcagccgtccaggtcggcgccggtcagctcgacgagggcgtcccggtagtc21240gtcggaggtcacctcgtcgaccagcaggcgccaggcctcgggcagggtgtccacggcctc21300gcggtgctgccggccctcgctcacgagggtccggttgtgcatcaggtagtgcttgccccg21360gccgcttcccggccgccgttcgctgcgcacgaacccgtcggcggcgaacccgtcgttcag21420cgtgcgcgccgtgtcgtcgtcgcgg卿gagctcgggacgaccgcgtagtggtaggggtc21480cttctcgagccgcgcgtcgcgcagggcctgaaggtcaatcagcgtcatgtcgttctctcc21540tcggggcgtggtgctcgaagacccgccgcaccgcccgcagccgggtcttcggggacagcc21600cgtgctgccgctccaggtagcgggcgacgctctcgtgttcgtcctcgatgccggtgatca21660ggctgcgcatcgtccaagcgggggacgcggtacggatctggagctcctccagggaccctt21720cgtaggaccactgggggcgcgggtcctgcggccccagcgcccggtaggcgcggccggtga21780ggctgtagtcgcccgccacggccgccagccgtaccccgaggccgcgcagggtcagcgcgc21840tgaccacccccgtgcggtccttgccgaccgtgcagcagacgtagacggggtcctggtccg21900gctcggccagcaggccgatgatctccacggccaccggggcggcgagggtcagcatcgagc21960ggtagttgaacaggtaggcgctgggcggcgggcggcgcacaccgcggatgcgggacatgt22020tcccgcccacgggccggcgcaggagccgggcgcgcatgccggccggtccgtcctcgatgc22080cctgctcgaaggcggtgcgcaggtcgacgacggtgcggatgcccaggtcgtccagcgcgg22140gcgccgtgagcggggagggggccggcccccggtagagcacgccggaccgcagccgcgcgc22200cgtccgggccgggcagcccggcgctgtcgcggacgttgggcaggccgggcagcgcgacgg22260tgcgcgagccacgggtgggacgggccgccgccgcgggagttcgctcggcggggtgtcggc22320gggctccggtggtcaccgtgccaccgcctgttcgcgccgcagcagcaggtcggtgacgcg22380gtccgcggtgctccggtcggtgaccccgatgcgcaccgcggccgggctgtcgggggtgct22440gggcacggcgcgcacgacgtagccgtgcgcgtggaggtgggccgccgcgtccgccgcctc22500gcgcggcgaggcgacctgccaggtggcgaagttgccgccgcccgggagggcacgccagcc22560gggcagcgcctcttcgacaccgcgggagaagtgttccctgacctcgcggacccccgccca22620gatctcctcgaacaggggctgctcgcgcagacaggcccgcaggagggcgacggcggtgcc22680ggacaccggcccctccgggtcgaggtcgagcaggggccggacggtgtccgggtgcgagct22740gagcacggcgatgcgggcgccggacaggccgaagcacttggagaaggtgttcacccgcac22800cacatggggcgggtgggggcgcccggtcagcgtcccgatctccttctccccgccttcggt22860gaaggcgaggtaggcggtgtcgaggacgagcaggctgccgtggtcggcgacagcgcgggc22920gagagactccagctccgcccgggcgtggacctggccggtgaagctgtgcggctgggtgac22980cacgacgaaggcgggcggaccgccgcgcagccgggcggccaggtcggcgaggg柳accg23040gccggtgccggggtcgggcggcacctggtcgagccggcacccggcgatccgcgcgaattt23100ctgccagccctcgtagttcgggtggtgcaggacgatgcgccgggctcggggaaaggcccg23160caccagcagccccaggcccgggtcgctgcccgcggtcagcaccagcccgtccgggtccgc23220gtccaggtggtcggcgatctcggcgtagacgtcgcgcagcaccgggtaggtcaggacctc23280cagggggtcc卿ccggcgagcgtgcgccggtgcaggtccgcggcgcgcgcgtcgagcag23340accgctgctcttgaggttgacctcgccgggccggcgggtgcgacggctgcggtagcggcc23400gctgctctcgacccggaagggggacggcgctcccgcctgcgcgggctcctcctcgcgcgg23460cgggtacgcactcacgatgcccccagcagcaccgggtcgccgtccgcgccggccgcgcgg23520gcggggatccgctcga卿cggcggtcacgtcgggctgcgggccgaagaccacttcgtag23580gcatcccgcagctgggccgggtccaggtcgtgggtaccgggcacgaacagctgccggttg23640aaggcggccatctcctcgtccgacaggtcggggcgggccgcctcccagggcgcgtagacg23700gtgggacgggcccgcccgccgagcgcctggacggtcgcgatggtgtgccgcaccccctcc23760acgctggtgcccggcagtcccacgatcacgaagcagttcagctcgatgccggcctgcgcg23820caccagccggcgagattctccaggtcctgctgcgacttgtgcttggagcggggcagggcg23880ccgtggccgtgcgggtcgagggtctccagaccgacgctgatccggacgcagcccgcccgg23940cccatggcccgcacgaggtcctcgtccaggtggtgcatcgtcgtcgcgcacttccagggg24000aagcgtgccccgtcggcggtgagccgttcgcacaggtccatggtccagcggcggtccagg24060gtgaacgtgggcgcgtag犯ggcgacgtactcgaaggacgcggtgcggaaggactgttcg24120atgtactcgacggtccgctccacggtgagccggcgttccttgcggccgaagatggggtgg24180acctcgcagtacgagcagccgatggggcagccgcgggcggccgggacgacgagttcgcgg24240cgctgcgggatgccgcagaacttgttggcgtcgtcgtggtagagctcgtcgtagcgctgg24300taggggatctcgtccggggtcggcaggtaccactcctgcgcgggcagcacggcgcccggc24360gaggacggcgcgtgccagctgccgtcggcgtgccgc鄉(xiāng)tgcacgcccggcgccgtgacg24420gtctcgccgtcgaagaaccgcagggccgccaggaccgcggcctcgaagtcgccgttctcg24480gcgacggcgtcgatgtcgagctgctggaagaacagcgggttgacgccgctcaggcggccg24540aaggtgacgatcggggtcccggggctcagtgcccgggcgtagctgacgaagcgccgcagg24600ccgtcgatgccgtcgaagtcgttcatgacggcgatggcgtcgtagcgctgctggaagagg24660tcgttgccgatgtccttccaggtccggcgcagcacggtggcgtccaggacggtgacctcg24720ctgtccggcagcgcggtgcgcaggtgaccggccacctggtagagggcgaggtggtggccc24780gcgttgaagtagctgaggatctgcgggggccacacgaccaggatgcgcgaccccggtgcg24840鄉(xiāng)gcggccgcccggccggcgggcgtgacgtgctcagacatggagggccctttcgcgggt24900gtccgggcggacacggtggacggacttgaagcggtcgggcacgggattgcgcctgtcctg24960ccagacgacggcggattcccaccaggtctcgacggcgaggagttcggccgcggtgtcggg25020tccggtcagcgagacgacgatctcggcgacggacgagccgagggaggtggcggggtcgta25080gtggcgcccctcctcaccggtcgcggtgtacaagagggtctgcggcagggggcttcgccg25140cggcaggtggcgcagcaccccgtgggcggaagggaaacgcgcgtagccctggcgtcgtcc25200ggtcggacggatcgtcacctggtcgctgcgcccggcctggccgagcaggctcgcgccgtg25260cagatggacgccgagggtgtcctcgtgcgtctcgaccatgcgtgatccgcctgcccggca25320ggcggtctcgcagacgacgagccggtcgtccggggtgtggaagaactcgacctggaaggc25380gcagacgccgggcacggccggcatggtggccaccaccttggccgcggtgtcgcgcagccg25440ggcggacatcgggtcctcgtccggcatcatgccactcatcccgggggcgtcgtacgccac25500ggagaaccagtcggagtagggctggtaggacggttgggccaggaggatccgcccgtcccg25560catcaggccgttgatgtggtagaagtcaccctccacccaggcctcggcgaggtcgggtgc25620ggcggtgcggcccgccgcccagtcgtcggtg犯cgccgtcagcgcgtcgccgtcccacag25680caccctggtgccgttcgaaccgcctgacaggcggctcttgacgaccagcgggaatcccgc25740ctcgtccgcgaaggcgtccaggtcggcgggcgaggccagccggcgcatcggggcgaccgg25800gatgccggcctcggtgagcaggctcttcatcgtgtacttgtcgcggtacgcggtggcgca25860ggccacgtcctggccgggcagaccgaggcgctcgcgcagcgtagcggcgggcagcacctc25920gcgctccccggtggacagcacgcgccgcacgccgaagcgccggcacagggcgaccaggtc25980ctcctccagcccgggccggtcgaggctgctcacgaggtgcagatggcggaagccgcgcgc26040gagctcggggaaggcgctggtacccagtccgctgcgcgtgctgaccacgatcagctcctg26100ccgggcctgcgggaaccactccggcacgcggtgcaggatcggcttgttgttcaggaggag26160aaacacggaagttcctttcgcctgcgggggccgcttcaggcgtggccgtcgcgcagtgcc26220tgtgcgtacgtctccagggcggcggaccagtgggcggcgtactcacggaccgcggtgagg26280aactcctcggcctgctcccggtccgccaccagtcgcgtcatgccggtgtcctcgtcgctg26340acctgggccgcgtgcatggtctcggccttgatgtgggagtccacccaggcgaggtcgtcg26400cggccggcgaacagggtggtcccgggtacctcgaccttggcgtacagacgacggaagccg26460acggcgatgtccagggcgatgtcctccaccacgcgcaactgcaccgccgcgcccagcgga26520tgggtggccagccggtccatggagtccagcaggccggtgacggcgcgggggagtaccgcc26580gccgactgccggtcctcctcggcgacatgggcggcgacgggcttcaggacggtgtcctcc26640caccagacgtagtggatgccggccgggccgcgcggagccacctcgcggaaagcgggcgcc26700gcgttgtccaggtcgtcgccgatgacctggtagacggtctgg犯ggcggccagcagctcg26760tggtcgggggcgtcctggccctggaagcggcgggccatgacgccc卿ccgg卿gcgtc26820gtgaacatgaacgccttggtcatggcacgccaccggtgggcgatggcgagcgcggcttcg26880ggggtgacgctctcggccttgcgggcctcgccgaagaaggcgttgtcggcccgccgcagc26940cgtgcggcgtcgatctccttccccacgcgcgcgtcgaggtcttgttgttccgcggcggac27000agggccaaagcgttcacggtcacacactccaaaggggacggggccggggcgggccggacc27060ggcggtgccgccggtcagacgcccaggcgctccttgacgtcggcgaagaaggcgatgtgc27120<sequence>complexsequenceseeoriginaldocumentpage33</sequence>gtcagctccttctttcgggcatcgagtagcccagtgcgagggtgagcagagaaccggggg28920cgtcctgggcgacgggcgagsccgagtgccaggaggcgtccgaggggacgacggtgt卿28980ggctgcccggtaccggcagcaccgetgcgggcgggggcgtccctgtcgggcgactcccaca29040ggtcgtaggtgcctccgccgttctcgggccagtgctcgctcaggacgaggacggcgttca29100tcgcccggtcgggtttgccgcggtgcacgttccggtagtcaccggggtcgcgcagcgaca29160cgttgacctccagcgccgcgccctcgaggtccactccggtgcgggaggscagccaggtgc29220gg卿gagtcctgtacgacctcgtcgagcagttcggcccaggccgggggcagcttctcgg29280ccttcggtgtgtgacgcccgtcctgatgcaccgtcatgagccagagccggtagtgcttgt29340cg犯ctccggcgcctctttcaccgcgcggatgaactcgctcatggccggcggttcggcgt29400tgagccggcggaggtcctcggcgtcgatcaggtggsgtccggtgtggtgcacatgtggtt29460ccgcgtgggtgaccacctgggcgctggctcgtatcaaggtcgcctcgctggagtcggggc29520ccggtgcgcggtccgtgggccgcggggacggggcgccaccggcggtcgcccggtggtgat29580ccagagtctgcgccgggtgccttgccgatctctcgcccgaccgctggccgactccttgcg29640ggggtccttgcggccgcccttgcagctcgcgcccggggcgtcagcgcgggtggtgcgggg29700tgtcctccagccgcgcgcgtgcctgcttcgcctccgggtgtcccatgtcgtcgaggatcc29760ggacggcctggcgccacacgaggaccgcggtgatgtgcgctccccgggcctcgtgggtgt29820ctcccaggtgcaggagggtgtcggcctggaggtagcggtcgttcatgtgccggtacaggc29880cgagcgcccgccggtagcagtccagggcctccgga/tggtgcc亡caggtggtggtgggcga29940gcccgaggctgtcccacgcggccgcctcgccgttgacgtcgccgatggcccggtgcagcg30000agaccgcccggtcgcaccaggtgatcgcgcgttcgtggtcgccgaggaggatgtgggtcc30060agccggtctcgttg鄧gscgacggcctggccgccgaggttgcggatgccccggtacagcg30120ccagggcatgctcgtagtggcgcagggcctcggtgtgccggccccgggcgttggcgsggs30180aggccatctgacggcgggtccgggcctgtcccgcggcgtcgccggcctcggtgaacaggg30240tcagggcacgccggag,cgcgtcggcccggtcgtcctcgc卿ggcgtccccaggcga30300agcccagcgcccggcaggcctgtgcctcccgcaccgggtccttcagcgagatggccgcct30360ccagggccgtccgctggacggctgtctggtcctgccatctgccctgccggtcgaggtgca30420gttccagtgcctgggccagcagccacgcgtgctgcgggaagcccctgcgctgtgcgtacg30480gcacggcggacagcaggaccggcagctcgcggtcgagccacgccatggcctcctgccgtc30540ccccgatcggttcgggtgcgacgcccggtgcggcctcgggttcgagcggggcctcgatgc30600ggttcggtatgagcgcctcggcggccgcgtgccgtacggcgagctgccgggtgtcctcgtggaccttcagcaggtcgtgg犯ggcgaacccgccgttcagggtggccagcagcgccctgaccgcggcggcggcggagatgtccgggcccgccgcctgcgggcccacactgcggcaggaccggtcctcgcccgcgaagccgtcgaggctgtaggccaggggcaggtcgggctgggtcgcggggagccgtccgcacaggtcgatgatctcgtcaccgcccacgcggccggcgaggacttcgctgatcggccgtgccccgtgggtggcgaccacgaccaggcacgaggaactgcccggcatcatgtccagcaggatcaggatccgcttgccggagtcggtgtcggggggcaggtccctggcgggcacctccgccgcgggcacggcggactcgcgctgaccgtccgggaaccggtgggcgaggctgccgacgcccggcatcccgtcgatggcgccgtcgtcgagagcgtccagcagctcggtgaacgtgcacagatcgggcggcagttgggtcggctgccggggcggcaggtcggtgccggagagtgtctgcacatcgtgcagcagacgggcgccgccgacctggacggcg卿cgggcgcgcagccggccggtggcggccagcgcctggaccagcagcgcggcggcgctctggagcagtggcacgaggtcggctccctcgcgcagcacggcgaggtggccgcgtaactcctgcgggacgcccgcctgggtgaacagctcggcggcggcctcgggctgcgcgagttcgcggaaccgcagcagatagccgccgacgcggcgcaccag犯gccggcacgcggtgtgcaggcagtggtcgagCEigcc30660cctccagttcgcggctctgttcgagggcgt30720gctggggacccg肌cgggccagcaggtggg30780cccggcgggccggcagggcggcgagactgg30840ggtgcagggcg卿agcctgagcagccgtg30900aggagaacacggtgcgcaggtcggtgtagc30960cgcggtcgtcgaggagcgcggcggctacgg31020catgggccgcgacgatggccagggccaggg31080cgacggccgcgggctccgcggcggtgcgct31140gtgactcctcgcggctgagcaggcccaggg31200ggccgcgcagctgggtgcggctggtgatga31260ggggccgcacgtgctcggagtcgagggcgt31320ccaggagactgcggtagagggcgacccgtg31380gcacgccgagggcggtcaggaacgagcgca31440tcacgtcgaacgcgcgtaagttgacgtaca31500ggtgcgccacgtgcacggccagggtcgtct31560tgatcaccaccgaggcggccgccggccggc31620ggcgggcgagttcggtgcggcgccccacga31680gccgcacagcgggggcgctctccggcgcgt31740gcggtcggccgtcgtcggtaccgtcggggg31800ggacggcgctgagttccggcccgggctcga31860tcgtgtcgtacagggcgagcgcctcggcct31920gacggacgtgcagggactcgtccagagggt31980gcatccgctcgggtgctccggtggcgagca32040ggtgttcgctgtcgaccgcgaagaacgccg32100ccgcggcctccccgcgccacaacgacagtg32160tgtcgccgccggcccgggcggcgcgggcac32220cgagggtgccggcgtcgacgtcgatggcgt32280cgggagcgcgcggcgccaggtggggttcca32340gcagcttgcgcagattgccgacatgccggtggacgatgttcgccgcgctgctgggcgccc32400cggcgggccacagggcgtccacgatcctggacaggctcacgggctgtccggcctcgagca32460ggagcagggccagcaccgcccgctgcttgggcggccccgggggcagttccgcaccgtccc32520gccagatcctgatgggtcccaggaccccgaaggcgatgtgtcgatccatgtcttcccaca32580agcccggccctgcggccgacgaaactgaaatgcgctgatcagagtgtatgtggcaggctc32640tccggcaggccgtggccgccaagtggagggagacgttccttggcttgttctcaccgtcag32700tgcaacgtcactctttccgcacaggggcatgtgtagcctgctcgccgcacgtactgagcg32760agtggaaggcatatgcaccaggcatgatgtatgcaacggaagtacaccagccccggactc32820tgacggcggacctctcactcgaagcatttggcgtgatgacggcacggcggggcagcgagc32880cggtgcacctcggacctccgaggcaccgggcggtcctcgggctgctgatgctgcgcctcg32940gacaggtggtccgcgtcgaccagctcgtcgacgagttatggggcgacaaaccgccgcgcc33000ggccccacgccaccctccagacctacatgtctcatcttcgacgggccctgacgtcgggtc33060acggcaaggacgccggggtggctcccctgcactaccgggcgcccggatacgtcctcgcgc33120tggatccgcaggccatcgacgtgtgccggttcgacg鄧atggtctcccgcggacaacagc33180acgccgccgagggccggttcggtgaggcgcgcgaggcgctcgactccgcgctgcacctgt33240ggcgggccgaccccttcctggatctcacgtcctacgagccgctggccgaggagagcgcac33300gcctccagcacctgcgcacggcggccgtgacgatccgcgccgaggccctgctcgccctcg33360gcgacgcgcggaccacggtggagtccctgcggcgcgaggtgatccgcttcccctcggacg33420aacgcatcgtggccgccctgatgaccggcctgtaccggctcggccagcagaccgaggcgc33480tccgcctgtacgaacgtacgcgcacgcagctgtcggaggagctgggcgtggcaccgggcg33540acgacctgcggcgcgtccatctggccatcctgcggcacgaactgggcggcgccgcaccgg33600ccgggcagcgggccgaggtgcgggcccggccggaccgcgagccccggagcgaggagagcc33660gtccgccggccgacgccgtccacggccgcgccgccgaccccgcgacgaccggcaccggac33720ccggcgggcacaccggcgcgcggcctgtggacgacgccgccgggtccggcaggaccccgg33780cccacgcgtcgccgcttccgctcttcg犯gggcgcgaacacgccctggcctcgctgcgcc33840gctccatcacggccgccctggagggcagcggacatctcaccgcggtcgtgggtcaggccg33900gggtgggcaagaccgaactgctggcccaggccacggcgcacgccgccggatgggtcgccg33960gaacccgggtggtccgggtgagctgccggaccgcggagggcatgccggcctgctgggtgt34020ggcagcaggcgctgcggatgctcggcggccccgacgcgctgccgggcgacaatgcgcccc34080ggctctgtccggaccctacggtgacaacgctgtcagactcaccggagggagcggacgccg34140accgccgggagcagacccagcagcgcttcctggcccacgacgccctgagtgaaacgattc34200tgcgccacgcggacgacgctcccctcctgctcgtcctcgagaacgtgcacctggcggacc34260gccccacgctcgacgtcctcgcactgctcagcgacggcacacagggccgcgcggtgagcg34320tggtga/tcagcgtccgggagtccggtgtgggagccggagccgaacccgacggcccgctcc34380aggagttgctggccgactcccgcacggacgtcgtccacctcgacgacctgtccgaggaac34440aggtccagaccctcctcgcggcccagggcgggcccggcccggccacgcccgtggtgcgcg34500gactctacgaacgcagcggcgggaacccctacctgctcggccagctactggcacacgcgg34560gtggtgcccgctccctgcacgccgcgcgcgcggcacgccaggtcctcaccgagatcccca34620ccggcgtgtccagcatgctgcgccgccgtctggccggactggccccggaggtcctgcgcg34680tgctcaggggatgcgcggtactcgggaccgaggccgacctgaccctgctgaccaccgtgc34740tcggcgacaccacccccggcgtccgcgccgtggaggaggcgctgcgcaccggtctgctgc34800gccgcgaccacgatcacgcccgcaccctggtgttccgctacggcctggtacgcgacgtac34860tgctcgccgagatgagcgaccaggagcgttccgacctgcacgcctgggcggtggacgtgc34920tcggccgccaggccgacggccaccccgcggcggcctcgcgcctggcgcaccacgcctggc34980aggcctcgctgaccctgcccccggaccaggtgctgccgtacctcgtgcgggccggcgagc35040aggccgccctggagagccggtacgaccgcgcgcagacctggttccggcgcgcccacgcgc35100tgctcacctccggcccctcggcgagcggtgcggccgcgcaggcgctgcaactgcgcaagc35160gcatcctccagatcgccaccgtcacccgcggatacggcgaccgggaggtcgtggccgagt35220cccagcgggtgctgagcatgtcacccgccgcggtccaggagccggcactggtgttctccc35280agtgcatcgcccaactggtcaccggacaccgggaggagagcgcccgccgcgcccatcagc35340tgcgcgtcatggcgcagaacggcgacgcgcccgaagcccgcctgcacgaacggctcgccc35400acggcatcctgcacctgcccgaccgcaccgccgaggcgctggccgccctgacggaggccg35460agcagacggccgggaacctctccgccgcccggctccggcagctcgcgcaccacacccagc35520acgacccccgattcctggccatgaaccaccggaccctcgctctgtcgctgctcggcgccc35580aggacgacgcgctcgccctggcccaggaactcctggcgctcaccggctgcgagggcacac35640cggtcgaccgggccagcgcccactactcccacgcgctggtcgccgccctcgccgaggacg35700ccgacgccaccgcctcctccgccgccgagggcctgcgcatcgccgacgcgcacggcctgc35760tgcactgggcggccctgctcaaggtctgccgcggctgggcgcagcaccggctcgggacac35820ctggcgcactcgacgccctcaaagcggccgtgaccgacctgagcgtccgccacctgcgga35880tccgcctcccgctgcacctggggctgctggcacacgcccagtacgacgcgggcgccgtcg35940aggccgcccgggcgaccctgcggcgggcggcccgggagatcagggccgcgggcgaggacg36000cctacctcagccccgacctgcccttcaaccggctgccgcgcctccagccgccgctgccgc36060cccgcgggtgcagcgatccgacggagcatctggccggcctgcccaggcgttccggccact36120gaccggtccaggccgctgacgagtcccggctcgcgacaagccccgtcctcccacgagccc36180cgatgccggacggcttcggccgcgtcccgccggccacccccacccgtacgccgtgtcccc36240ccgcgtg犯aggcccggtccccgatgaccaccccccacccccatggccccgacgacgccg36300cgacggccgcgcccgtcgtgtccgccggaggcaccgccgcgacggccgagcccgccgtgc36360cgagcgcgcccaggagcgaaccgccgttgtgggcgctgcaccgcgaactgctcggcacca36420cgatccgcaccgacctcacccatgccttccgtcccggtcaaccgcacgccgccgccttcc36480ccgacgaacggcgcgagacgctcatggccacggcacgcggcgacgcctgcgacctgaatc36540tctacacgttcgtcggccagtggggcacccacgtcgacccgccgtcccacttcgtgaccg36600gcgcccgcacgctggacgagatccccgtcgacgagatgatccttccgctggtggtcctcg36660acatcagcgaccgggtggccgccgaccccgacgccgtaccgaccctggacgacgtacggg36720cgtgggaggcccgc肌cggccgtgtccccgcggggtcgttcgtcgcgctgcgcaccgact36780ggagccgccgctggcccgacgcggcggcgatggcgaaccgggacgccgacggcgtgagcc36840actgccccgggtggtcggccgaggtgctgcgccacctgatcgaggaggcccacgtcaccg36900cgatcggccacgagcaggccgacaccgaccccggcaccgccgcctcggcgggcgacttcg36960gcctggaacggtacgtcctggagcgcgaccgctggcagatcgagctgatggccggtctcc37020accgggtcccggaagcgggcgccctgatcgtggcgacctggccccggccgcagggcggat37080cgggcttccccgcccgggtgttcagcctgcaccgggcgccctgagcgggggacaccgccc37140cggaacgaggcggccggcggtcaccttggccggcggcggcctctgcaccggcggtcccac37200acggtcgggcggtcctggccagggaccgctcgggaccgctcggg犯ggcaggggatcgcc37260gggcgtcgctcgtgccgggatccgacgggacgtggccggcgtccgtggtcgtcctgcggc37320tcagggggccagttccgcgcggcgcgaagcctccggacccggtacggaggaggtgtcgtc37380cacccggtgccgcagctccgccgagacgtccaccaccccgtccacgccttgacacagccg37440tatgacgaccgggacgagcgacttgcgctccacacggcccttcagcgacacccgcccgtc37500gacgacccgtacggtgaccgcccccggcatgatcccgagcgtgcgcaggagcacctcacc37560cgagatctcctcccggacggcgctgtcgctccgcaggaagacccggagcagatcggccct37620gctgatcaggccgaccagtcgtccggcctcgtcgaccaccggcagccgtttgacgcggtg37680acgctccatgacctgggcggcttccaccgccgtccactgcggtccggccgtcaccgcggg37740gctgtgcatcagccccgcagctgtcgtcgcctccgccttcgcacggtcggcgggcccggg37800atgcaggacgggcaacaggcccgccggatccaactgggcggcttccttgcgcagcaggtc37860cgcctcggagaccacgcccatgacgcgttcctcgtcgttcacgaccggcacggcggtgat37920gtcgtgctcggcgagcagcttggcgatctccttgaagccggtgtcccggtgcaccttcac37980gaccgacgtggtcatgaggtcgctcacggtccggtgccgcatggctcccgcctccctggg38040tcgcgtgcgttcctgcttccactgtccgcccggtcggcgtgaaccgcatgggccgaacgg38100accccgtacggcggcgtgcgtcacgcggccga犯gagggaggctggacggagagcggacg38160gacgccggcgcgcgtccggcagtcggcagacctcctggagcccgtgatggaagccgcacg38220caaggccgggcgtaggacacggccggtggcaccggcggtgaggagcgggctgtctcacgg38280gtccgagtgatgcgcaccggtgcggaccggccggccggtgcggtgaagggcgcggcggtc38340gacgacgcctcttccgctcttgtcgctgccgccccggcacgacagctcgccgctgccgac38400gtctacgctgcgctggacacctcacggcgtggtctcgcgccggcacaggcagcgaagagg38460cttcaggagtacgggccgaacgaactgccgcggacgcgacgccgtgccgtgtggcgggac38520gtggcgacgcagttcacggatctcttcgccgtggtcctgctggtcgcctgcgcgatcacc38580ttcctggcctacggactacagcagccccgtgacgcgggcactcttcagctggcggtggcc38640atcctcgccgtcgtcgtgctgaacgccgccatcggtttcgcccaggagtactcggcggag38700cgcaccgcacaggccctggcggcgatggtgccgcacgcctgccgggtgctgcggggcggg38760gagcgactggaggtgcccgcccgggacctggtgcccggggacgtggtggtgctgg鄧gcc38820ggggacgccgtgtcggcggactgccgtgtcgtcgaggcgcacgaactgaccgtcgacaac38880gcgccgttgaccggtgagagcaaccccgtggggcgcaccgccgaaccggtgcctgccggg38940cccgcgctggetggcccgcaacggcatcttcatgggtacggacgtggtcgccggctccggg39000cgggccgtggtggtggccacgggggcgtcgaccgagttcgggcggatctaccggctggcg39060gccgccgcgccacggcagaagaccccgctccagcaccaggtggccgtcatggcacgtcgg39120gtggcgggggcggcactggcgatcggcgcgctgatgttcgtcgtccggctccccaccggc39180gagtccgtcctgccctccttcgtgttcgcgctgggggtgatggtggcactggtgccggaa39240gggctgcccgccaccttgtcggtgtccctggcgatcggcgtacggcggatggcgcgccgg39300<sequence>complexsequenceseeoriginaldocumentpage40</sequence>ggtttcggtgtcgccctcatggccgcgatccacaccgccgcgctcgacgcagccgactggctgctcgcggacgagatccgcaaggcgtgggccccacggtgaaagtgatcgtcgtcgggttgctcgcctcggaaggccaccacgtcgaagggttgcccgacagcccccggatccgcttcctgcggtccgccgggatcgagcacgcggacggcaacatcgtcagcgcgcgcaccgcgaagggcatctacgatccgcggcgcgccgacatctgcgtccgctggacggtccatcagctccaccaactcagcttcggcaacggagagaccctgctcggccggcggctggccgagttcgatgtgggcgcgggccgctccctgatccccggccacgcctttgccgtcgccgccgccgcgctcggcag犯cgtg犯cgtcctcatcgccggcgcgggctccgccgcccgcaacgacgtcaccctcatcg犯ggccgcgtcccggtgcggctggtggcgcactccggcgtcctgaccgccgacctcgtcctcgtcatcagcctcctcgccaaacggcacaacgacgccgacaacgcctggctgttcgactccgccaccccgctgatctccctgatcgacctgctgcggctcagcaaggcgggcgtcgacaggacggcgggccgcgccctgggcgacgtcatcgtccgtgacggacagccgaccgtgcccgcactcctcctcgtgtcccacacggtgacagctcccggcggcctgtcgtccgggccgcccgggcacctggcctttcctgacgcgccctccctgcgtgaagtgcagccgcaggacggtgtcgagttgtccgggggccaggccgccgtgtgagctacctgcctccgttccaggccgtgttc40980gcggtcctcaccgccctcggcaccctgccc41040ctgcgtcgacgcgacgcccgtcggaaggga41100gcggacgggtgggcaccgccctcgccgccg41160tcgtcgaccggcgccccgaggccgtccggc41220acgagggcaacggcttcagccgcgccgtcc41280ccttcgtcgccgtcaccgccggcgacaaca41340agacctatcgcgtgccgatcgtcctcgccc41400accgcgacctcggcatctccaccatcgcca41460ggatgctgctgcaccgccacctcagccccg41520tcgtccgctcggaggtgcccggctatctcg41580acggtgagatccgcgtcgtcgaagtcaccc41640gcacgccggcgcgggcgggtgacctgatca41700gactgcgcggtttcctcgacaaggagctgg41760acgcctcggcacccagatcgcccaggtcct41820cgacaccgatgacgcccgccttgccgagct41880gggcgacgcctgcgaacccgccctcctgga41940catcgccaccaccggcgaggacgaggacaa42000gttcgcggtgccccgcgtagccgcccgcgt42060cgaacgatggggcgtcgacgtcgccgtccc42120ggaggccaccggtgccaccgacaccgtcgc42180ggtcgtcgaaacggtcatcacagagcagtc42240cgtgctgcctccgggcacggtcgtcgccac42300cgaaccgaccgagcgactgcgccccggcga42360cgag犯cgagatccacgcagcgttccagtg42420cgccgctttcgcacgccgtccccgtggtcc42480atggagcgagggagaagtagttctcctcct42540cgaggccgtagaggcaggatcgcaggtcgt42600cgtgggccagttcgaggtgggtggcgatgc42660<formula>complexformulaseeoriginaldocumentpage42</formula>cgggtccttgagaacggggtagccccactcgtcgagatcgatcagctcggggagcagttc44460gccgcacaggccttgcccggtgcaggcgatgcggtcgacgcgcagggtcctgtggttcgg44520ggtcatcgccaggtgtccggtgctgtggcgggcggcacggggatccgtggcggccggtgg44580gccgcgggac兆gcgccgcgggcg兆gtggcggtcgacgtcgtcggcg犯ggcgctcagg44640gcggaagcggccaagcgggcggcaccgtccgggtggcggcaggcacctcggtccggcagc44700聊ccggtccgtcggcgcaggcgggacagcagctccgggtggctctgcccggcggccagc44760gcggcg犯gtcctcggccacggccggcagcccgtaacggcacgggccgcactggcgggcg44820ctctgggcccccELggaacgcgeLgtatccgagccgtctcgaggagcccgcaggccgagcgg44880gg卿cgcgatcagcacgcccgcgcccggtgcggcgcccagcggagcgaggtcgcggcgg44940gtgaggggtgtgtgcaggtcctccgcgggcagccaggtgccggcgaagccgccgaccagg45000agggcccgcacgggttccgtggtgtccccggcacggccgagagccgtgtcgagcgggatg45060ccgagcggtacttcccccacaccgggagcggtgactgccccggagacggtgatcatcatg45120gtgccgggttcgtccggcgtgccggcccgcctg肌ccagtccggtccgtggcgggcgatg45180agggccaggtgggcgagggtctccgcgttgtggacgagggtggggcgtcgggcgacgccg45240cgttcgtggctgtgcggagggttgccccgcggtcgggccgggccgccgtcgagccagcgc45300accaatgaggtcgactcgctggagacgtagccgtgcggcagggcgtgcagtcggatccgg45360acggggtcgaggcgggcgctccgccgctcctccacggcgttgccgagacggcgctgctgg45420gcggtgcgggtccggggaaggcacacatggacggtgtccgccccgacctggaccgccgcg45480aggacggcgccgtcgaggacc柳tgaggtgccacggcgatgaggaactggtccttgcgg45540ctggcgggttcgctctccatggcgttgacgacgaccacgggccggccgcgaccggccgcc45600acgctgcgcatcttccgggccgtcgggaacccggcaccaccgcgtccggtgagaccggcc45660gcttcgacggcgtccaccagcgacccccgcgcgtcggtggtcctgcggagtgcttcccgg45720tgccgcaggtgatcgcccagggtggccggtcgcccggtggcccgccagtccgccagcagc45780cgggccgtgtacccgtccggtccgggcgtgggcggtgcgggtgtg犯ggacgcaLgtcgag45840gagttcaccgtccgcccccgatcaggagtgccgccgtggcggctcggtgggaccagccgg45900gctgaagcggcccggcggccaggaacgcggtgagcaccaccggtacggcggacgcggtca45960cggcagccgccaggcgcccggccacccgccccggaccggccttcgccaggcgccaccaca46020cggcggtcaccacgcaggccaggcacgcggcgtagagccacagctg46066<210>2<211>445<212>PRT<213>可可鏈霉菌阿蘇變種<400>2MetLeu1SerGlyGluValPheLysHis20AlaAspAlaAspValValAsnGlyGlyLys5SerLeuValArglieAlaGlySerVal10ThrSerAlaAlaAlaAla2530AsnCysProAsplieValGluThrArgThr15ValAlaAspVal50AlaGlu65LeuProLeuAsp354045LeuSerArgValPheThrThrLeuGlyGlyArgAlaArgTyrGlyThrLeu5560LeuAsnGlySerGlylieGluHisAsnThr7075AlaAsp丄euValSerSerlieHisGlySerLeuTyrHis8590ProGlyLeuValAlaArgLeuGlySerValHisLeuProLeu95SerVal80ValGly100GlyCysArglieGlyGluLeuAsp130GlyGly145LeuLeu115ValGlyPro120Ala105110LysGlyArgProValArgHisVal125MetGluArgPheGlyAlaThrGlyGlyThrThrAlaGlu135140ArgLeuThrGlyCysGlulieLeuLysValAlaAlaArg150155AspTyrThrArgAsnArgAlaLeuMetSerGlyProLeuAsp160Tyr165170175GlyGlyAlaThrLysThrAlaLeuLeuThrAlaAlaAlaAlaGluGly180185190ValThrThrLeuHisHisLeuTyrProLysProAspValValAlaLeu195200205lieAspValLeuArgGluLeuGlyThrAspMetThrTrpThrGlyPro210215220GluThrLeuVallieArgGlySerGlylieGlyAlaLeuArgArgAsp230ProProAspLeulie225ValArgTyrThrLeu245CysAlaAlaVal260GlyMetAspArg275ArgArgMetGlyValVal290HisProAlaGlu305ArgGlyValPhe235GluValVal250ThrValGlyAspGlyProValHislie265AlaValAlaAlaLeuAlaProGlu240ThrTrplie255ThrGlyPro270AspValLeuAlaLeuAlaProGluPhe280285AspHisGluAlaAspSerValThrAlaArgThr295ProLeuAlaProVal310AspSerGinProAsp300ValLeuGlu315PheAlaLeuSerAspSerGinProPhe325330TrpAlaGluGlyAlaThrLeulieSerGluAlaValTrp340345TyrGlyTyrValProGlyLeuThrAlaLeuGlyMet355360AspAspTyrAlaLeuArgValAspGlyValArg370375GlyGinAspLeuThrAlaThrAspLeuArgAlaAlaAla385390395Thr380AlaAlaAlaSer320MetAlaGly335GluHisArg350AspAlaValGin365ProHisArgThrValLeuLeu400<sequence>complexsequenceseeoriginaldocumentpage46</sequence>GluSerAlaArgTyrArgGluValGlyAlaAlaPheTyrValProAsp115120125AlaThrArgLeuLeuArgGinGluGlyLysProGlyAspTyrArgTyr130135140ValGlyGlySerThrA印AspHisGinGinValValArgSerAlaThr145150155160ArgAlaTyrGluValAlaPheGluGluTyrGinArgLeuLeuAspSer165170175GlylieAlaArgGlulieAlaArgLeuValLeuProValSerThrTyr180185190AsnAlaArgAlaLeuMetHisPheLeu200205AspAlaAlaTyrValSerHisProGin220GluGinMetGluThrAlaTrpAlaLys235240AlaPheThrAlaPheGlyArgValSer250255SerValSerLeu210ArgGlu225LeuMetLeuTyrAlaThrCys195ArgThrHisArgPro215lieGluMetValAla230ProValThrHisGlu245Pro<210>4〈211〉204〈212>PRT<213>可可鏈霉菌阿蘇變種<400>4MetValThrHisAlaGluProHisValHisHisThrGlyLeuHisLeu151015lieAspAlaGluAspLeuArgArgLeuAsnAlaGluProProAlaMet202530SerGluPhelieArgAlaValLysGluAlaProGluPheAspLysHis354045TyrArgLeuTrpLeuMetThrValHisGinAspGlyArgHisThrPro505560LysAlaGluLysLeuProProAlaTrpAlaGluLeuLeuAspGluVal707580ArgThrTrpLeuSerSerArgThrGlyValAsp909565ValGinAspSerLeuGluGlyAla100AspTyrArgAsnVal115ValLeuValLeuSer130AspLeuTrpGluSer145ProValProGlyHisSerValSer180LeuAlaLeuGlyTyr195Phe85AlaUuGluValAsnValAsn105LysProHisArgGly120GluHisTrpProGlu135ProAspArgAspAla150LeuTyrThrSer165ProValAlaGinSerMetPro200ValAsp185GluVal170AlaArgSerLeuArgAspProGly110AspArgAlaMetAsnAla125AsnGlyGlyGlyThrTyr140ProAlaArgSerValLeu155160ProSerAspAlaSerTip175ProGlySerLeuLeuThr190ArgSer<210>5<211>215<212>PRT<213〉可可鏈霉菌阿蘇變種<400>5MetLeuArgLys1LeuHisLeuAla20TyrAlaThrAla35AspThrProValLeuHisValAspAlaProPheThr51015GinGlyLeuLeuThrLysAspValValSerAspLeu2530ProValAsnArgThrAlaAlalieSerArgValAsp4045HisGluLysGinTyrLysMetAsnLeuPheTyrLeuMetVal5560AlaSerGlyGluLeuProAlaValTrpProGlu50AsnAsnGinArgSerArgAlaSerGlyGluLeuProAlaValTrpArg65707580SerLeuLeuAspAspLeuAlaGlyValGluPheThrAspTrpLeuSer859095GluSerThrGlylieAspLeuHisGlyLeuSerGinAsplieGlyValGly100TyrThrHisValAspGlyGlyLeuSerGinAsplie105110lieSerValHisLysAspLysAlaHisValAspGlyAspPhelieSerValHisLys115120125AlalieThrAlalieLeuTyrLeuAsnProGluTrpProThr135GluValAspLys130AsnAlaGlyGlyGluPhe145150AspHisValPheArgLeuProProArgProGlyGinLeuLeuPro140HisPheSerGlyAspProAspAsp155160GlyGinLeuLeuAlaPheArgLeuProProArgProGlyGinLeuLeuAla165170175ProProThrAspLysSerTrpHisAlaValSerArgValAspSerGly180185190GluGlulieThrArgLeuThrValGinLeuGluTyrTrpPheGluHis195200205ValAspArgTyrSerThrAsp210215<210>6〈211〉370<212>PRT<213〉可可鏈霉菌阿蘇變種<400>6MetAspAspMetAsnProValPhe15ArglieGlyAspArgThrSerLeu20LeuAlaAspArgLeuGluArgSer3540ThrArgAlaLeuAlaAlaAspLeuArgVal5055GluAlaThrLysGluHislieAsnSerLeu65Phe70SerLeuPheAspAlaSerTyr85LeuThrTyrGluThrLeuProThrAlaSerAsn115100ThrLeuProValAsn120AlaGluValAspArgLeuArgArg1015ArgAspProGinPheLeuLysGlu2530ProAlaLeuSerGluArgProI]e45PheArgProGlyGinVal60ArgArgAspAsnAspVal7580PheProSerLeuSerLeuAspTyr9095AspProHisLeuAlaGluArgTyr105110lieThrGlyAlaSerGluGlyPhe125<sequence>complexsequenceseeoriginaldocumentpage51</sequence>355360365GlyVal370〈210>7<211>275<212〉PRT<213>可可鏈霉菌阿蘇變種<400〉7MetThrValAsnAla15AspAlaArgValGly20AspAsnAlaPhePhe35GluAlaAlaLeuAla50PheMetPheThrThr65GinGlyGinA印Ala85ValTyrGinVallie100ArgGluValAlaPro52LeuAlaLeuSerAlaAlaGluGinGinAspLeu1015LysGlulieAspAlaAlaArgLeuArgArgAla2530ArgLysAlaGluSerValThrProGlyGluAla40lieAlaHisArgTrp55LeuSerGlyLeuGly70ProAspHisAlaGluSer45ArgAlaMetThrLysAla60ValMetAlaArgArgPhe7580LeuAlaAlaPheGinThrGluLeuLeuAlaAlaPheGin9095GlyAspAspLeuAspAsnAlaAlaProAlaPhe105110ArgGlyProAlaGlylieHisTyrValTrpTrp115120125GluAspThrValLeuLysProValAlaAlaHisValAlaGluGluAsp130135140ArgGinSerAlaAlaValLeuProArgAlaValThrGlyLeuLeuAsp145150155160SerMetAspArgLeuAlaThrHisProLeuGlyAlaAlaValGinLeu165170175ArgValValGluAsplieAlaLeuAsplieAlaValGlyPheArgArg180185190LeuTyrAlaLysValGluValProGlyThrThrLeuPheAlaGlyArg195200205AspAspLeuAlaTrpValAspSerHislieLysAlaGluThrMetHis210215220AlaAlaGinValSerAspGluAspThrGlyMetThrArgLeuValAla225230235240AspArgGluGinAlaGluGluPheLeuThrAlaValArgGluTyrAla245250255AlaHisTrpSerAlaAlaLeuGluThrTyrAlaGinAlaLeuArgAsp260265270GlyHisAla275<210>8<211>430<212>PRT〈213〉可可鏈霉菌阿蘇變種<400>8<formula>complexformulaseeoriginaldocumentpage54</formula>LeuAlaGinProSerTyrGinProTyrSerAspTrpPheSerValAla210215220TyrAspAlaProGlyMetSerGlyMetMetProAspGluAspProMet225230235240SerAlaArgLeuArgAspThrAlaAlaLysValValAlaThrMetPro245250255AlaValProGlyValCysAlaPheGinValGluPhePheHisThrPro260265270AspAspArgLeuValValCysGluThrAlaCysArgAlaGlyGlySer280GluThrHisGluAspThrLeuGly295LeuLeuGlyGinAlaGlyArgSerArgMet290AlaSer305275ValGin310GinGlyTyr285ValHisLeu300GinValThrHisGlyProThrGlyArgArg325ValLeuArgHisLeuProArgArg340ThrGlyGluGluAsp315PheProSerAlaTyrThrAla355SerSerValAlaGlulieValValSerLeuGly360lieGlySerSerValAlaGlu370375AlaAlaGluLeuLeuAlaValGluThrThr385ValTrpGinLeu390ArgAsnProlieArg320AlaArgPheProSerAlaHisGly330335SerProLeuProGinThrLeuLeu345350ArgHisTyrAspProAlaThrSer365LeuThrGlyProAsp380TrpGluSerAspArg405HisArgValArgProAspThrArg420ValPro410GluArg425Trp395AspArgPheLysAlaVal400SerVal415AlaLeuHisVal43055〈210>9<211〉469<212>PRT〈213>可可鏈霉菌阿蘇變種<400>9MetSerGluHisValThrProAlaGlyArgAlaAlaAlaUuAlaPro151015GlySerArglieLeuValValTrpProProGinlieLeuSerTyrPhe202530AsnAlaGlyHisHisLeuAlaLeuTyrGinValAlaGlyHisLeuArg354045ThrAlaLeuProAspSerGluValThrValLeuAspAlaThrValLeu505560ArgArgThrTrpLysAsplieGlyAsnAspLeuPheGinGinArgTyr65707580AspAlalieAlaValMetAsnAspPheAspGlylieAspGlyLeuArg859095ArgPheValSerTyrAlaArgAlaLeuSerProGlyThrProlieVal100105110ThrPheGlyArgLeuSerGlyValAsnProLeuPhePheGinGinLeu115120125AsplieAspAlaValAlaGluAsnGlyAspPheGluAlaAlaValLeu130135140AlaAlaLeuArgPhePheAspGlyGluThrValThrAlaProGlyVal145150155160HisLeuArgHisAlaAspGlySerTrpHisAlaProSerSerProGly165170175AlaValLeuProAlaGinGluTrpTyrLeuProThrProAspGlulie180185190ProTyrGinArgTyrAspGluLeuTyrHisAspAspAlaAsnLysPhe195200205CysGlylieProGinArgArgGluLeuValValProAlaAlaArgGly210215220CysProlieGlyCysSerTyrCysGluValHisProliePhe225230LysGluArgArgLeuThrValGlu245SerPheArgThrAlaSerPheGlu260PheThrLeuAspArgArgTrpThr275280GlyAlaArgPheProTrp235ArgThrValGluTyr250AlaPheTyrlieGlyArg240GluGin255ProThrTyrValAlaPheTyrAla265270MetAspLeuCysGluArgLeuThr285LysCysAlaThrThrMetHisHisAlaAspGlyAlaArgPheProTrpLysCysAlaThr290295300LeuAspGluAspLeuValArgAlaMetGlyArgAlaGlyCys305310lieSerValGlyLeuGluThrLeuAspPro330GinAsp345LeuAsnArg315HisGlyHisGlyValGlyLeu325ProArgSerLysHisLysSerGinGinAspI>euGluAsn340TrpCysAlaGinAlaGlylieGlu355360GlyThrSerValGluGlyValArgHisValArg320AlaLeu335LeuAlaGly350CysPheVallieValGly365lieAlaThrValLeuProGlyThrSerValGlu370375GinAlaLeuGlyGlyArgAlaArgProThrValTyrAlaPro385390395Thr380TyrTrpGlu400<sequence>complexsequenceseeoriginaldocumentpage58</sequence><210>10〈211>380<212>PRT<213>可可鏈霉菌阿蘇變種<400>10<sequence>complexsequenceseeoriginaldocumentpage58</sequence>AlaAspHisl>euAspAlaAspProAspGlyLeuValLeuThrAlaGly859095SerAspProGlyLeuGlyLeuLeuValArgAlaPheProArgAlaArg100105110ArglieValLeuHisHisProAsnTyrGluGlyTrpGinLysPheAla115120125ArglieAlaGlyCysArgLeuAspGinValProProAspProGlyThr130135GlyArgPheSerLeuAlaAsp150ValValValThrGinPro140145ProAlaPheLeuAlaAlaArgLeuArgGlyGlyPro155160SerPheThrGlyGinVal165GluLeuGluSerLeu185ThrAla200LeuThrHis170AlaArgAlaHisAlaArgAla180LeuValLeuAspThrAlaTyrLeuAlaGlySerLeu195GlyGluLysGlulieGlyThrLeuThrGly210215ValValArgValAsnThrPheSerLysCys225230ArglieAlaValLeuSer_L6U245AspLeuAspProGluGlyProSerHisProAsp250GlyArgPro220PheGly235ThrVal175ValAlaAspHis190PheThrGluGly205HisProProHisLeuPro260LeuArgGluGinProLeuPheGluGluValSer265ProLeu280PheSerSerGlyAla240ArgProLeuLeu255ThrAlaValAlaLeuLeu270TrpAlaGlyArgAlaCysLeuArgGluGinProLeuPheGluGlulie275280285ValArgGluValArgGluHisPheSerArgGlyValGluGluAlaLeu290295300ProGlyTrpArgAlaLeuProGlyGlyGlyAsnPheAlaThrTrpGin305310315320ValAlaSerProArgGluAlaAlaAspAlaAlaAlaHisLeuHisAla325330335HisGlyTyrValValArgAlaValProSerThrProAspSerProAla340345350AlaValArglieGlyValThrAspArgSerThrAlaAspArgValThr355360365AspLeuLeuLeuArgArgGluGinAlaValAlaArg370375380<210>11<211>273<212>PRT<213>可可鏈霉菌阿蘇變種〈400〉11MetThrThrGlyAlaArgArgHisPro15AlaAlaArgProThrArgGlyPro20ArgAspSerAlaSerArg25GlyLeu40ArgGlyProAsnVal35LeuArgSerGlyValLeuTyr5055AlaProAlaLeuAspAspLeuGlylie6570ThrAlaPheGluGinGlylieGluAspAlaGluArgThrProAlaAla1015ThrValAlaLeuProGlyLeu30ProGlyProAspGlyAlaArg45ProAlaProSerProLeuThr60ArgThrValValAspLeuArg7580GlyProAlaGlyMetArgAla<sequence>complexsequenceseeoriginaldocumentpage61</sequence><212>PRT<213>可可鏈霉菌阿蘇變種〈400>12MetThrLeulie1AspProTyrHisAsp5TyrLeuGinAlaLeuArgAspAlaArgLeu10SerSerPheArgAspAlaValValThrAlaSerGlu50AsnArg65ThrLeuAspTyr20ArgThr35ArgArgPro25LeuAsnAspGlyPheAlaAlaAspProThrLeuValProGluAla85AlaGlySer55SerGlu70TrpArg40GlyArgGlyLysGlyArgLeuLeuLeuValGluArgAsp100CysThrValGluAlaArgMet115HisThrGinHis75ValAsp90ThrGlyHis60Arg30GlyPhe45TyrLeuGluLys15AspAspValArgMetHisGluAlaValGluValThrSer95AspAsp80AspGlyGinPro130PheAsn145ArgGlyGlyThrAspArgPro135AspThrTrpArgSerGluTrp150LysAspValAlal,euThrGlyAlaAspLeu105110ThrArgTyrSerSerGlyCysTrplie120125AspLysAlaValThrHisLeuPheTyrProAspSerVal180Met165ValLeuValArgSer185GinGly155ArgArg170AspAspThr140AspLeuHisValValLeuProSerTrpHis190Leu175GlyLeu160LeuValProProValSerGluGlyCysProAspAspArgArgAlaLeuLeuVal195200205HisPheAlaArgThr210〈210〉13<211>243〈212>PRT<213>可可鏈霉菌阿蘇變種<400>13MetLeuThrArgPro15GlyAspLeuValArg20ArgValProAlaAla35TyrAspAspLeuPro50ArgTyrArgArgHis65LeuLeuValAlaAsp85AlaPheAlaGlyGly100ValArgGluGlyAla11563ThrAlaAlaLeuSer10ThrGlyPheSerMet25LeuGinAspSerLeu40AlaAspProTyrLeu55ThrArgTyrThrTrp70AsnProGlyTyrPhe90GinTrpArgLysTyr105PheLeuThrAlaLeu120SerProAlaAsplieThr15ValProGlySerAspMet30LysThrLeuAlaAlaSer45ProAspGlyGlyAsnTyr60ArgProAlaThrGlyGlu7580GinThrValGluAsnAsn95GluGluLeuThrAspGlu110lieA印PheAsnValGly125ArgLeuProLeuProGlu130ValArglieValAlaArg145150GlyValHisArgA印Gly165ArgHisAsnlieSerGly180GluLeulieThrGluLys195GlyAspAspProArgVal210AspProSerLeuGlyGlu225230AspProMet<210>14<211>255<212>PRT<213>可可鏈霉菌阿蘇變種<400>14MetSerSerGinGluLeuGlyThrValValValSerGlyAlaSerSer151015GlyPheGlyArgValThrAlaArgArgLeuAlaAlaGinGlyHisThr20253064ValGluGinTrpAlaValGinValHisCys135140AspAspAlaGinGlyArgProThrProGlu155160CysThrTyrValSerLeuHisMetValAsn170175GlyArgThrSerValTyrThrProGluHis185190ValPheThrAspCysLeuAspSerPhePhe200205ArgHisGlyValAlaAspValSerValAla215220GlyThrArgAspMetLeuLeuMetSerTyr235240VallieAlaValAlaArgArgAlaAspArgLeuAlaGluLeuAlaAsp354045GlyGluGlyProGlyArgValUuProAlaValAlaAspValThrAsp505560LeuAspAlaLeuGluArgAlaLeuAspGluHisLeuProHisCysPro65707580ProVelIValGlyLeuValAsnAsnAlaGlyLeuSerSerGlyPheGly859095ProValGinSerAlaLysValAspAspTrpArgArgMetValAspThr100105110AsnValSerGlyLeuLeuHisThrThrThrLeuLeuLeuProArgLeu115120125lieAlaGlyGlyArgGlyHislieValAsnlie130135TyrProTyrAlaGlyGlyArg145ValHisGinValArgValGlySerlieAlaAla140AlaThrLysLeuGlyTyrAlaGlyGlyAsnValTyrAla150155LeuSerLeuSerMetArgThrAspLeuGluGly165170SerCysValAlaProGlyMetAlaArgThrGlu180185190TyrAspGlyAspGinGluArgAlaAspArgLeuTyrAspAlaPhe160ThrGly175PheAlaValArg195ValSerProLeuSerProAspAspValAlaAspAlaValLeuTrp210LeuSerCys225ProThrAspPro215HisGin200AspValAsnValAsn235PheAlaAspArg205AspAla220MetlieArgProPro230GinProPheGlyLeuGlyPheAlaArgArgGlulieMet240HisAla245250255<210>15〈211>168〈212>PRT<213>可可鏈霉菌阿蘇變種<400>15MetArgGluAspValValValArgProAlaLeuAlaThrAspAlaPro151015GlylieAlaArgLeuSerGluProPheValAlaAspAspSerGluArgI20AlaArgSerGlyThrGinPheArgAsnArglieGly35HisAspSerArgProPheValAlaAspAspLeuLeuVal2530ArgAsnArglieGlyAspTyrLeuThr4045lieGlyCysValGlyLeuThrArgLeuAlaValHisAspSerArgVallieGlyCysValGly505560GlyAspAspLeuLeuLeuTyrAsnLeuCysValAlaAla657075GlyLeuGlylieGlyGlyArgMetValGluArgAlaA印Gly85AlaLeuGlyGlyCysArgPhe100ArgTrpPheValArgHisGly115ValTrpAlaAspGlu90AlaAlaSerLysLeuLeu105PheThrArgThrGluPro120125LeuProProGlyArgGlySerHisLeuAspArgGin80AlaLeuAla95HisSerGly110GinHisMetProAlaValTrpAlaAspLeuLeuProProGlyArg130135140TyrArgArgProValAlaProArgThrAlaProProAlaPheThrPro145150155160ProArg'GlnGlyAlaGluArgSer165<210>16<211>573<212>PRT<213>可可鏈霉菌阿蘇變種<400>16MetlieThrCysGlyLeuLysLeuThrHisAspGlyAlaValAlaLeu151015ValAspAspArgArgLeuValLeuSerValGluMetGluLysLeuAla202530AsnAsnProArgTyrSerAlalieGlyAspLeuGlylieValProThr354045lieLeuAlaGluHisGlyTyrArgMetGluAspValAspAlaPheVal505560ValAspGlyTrpAspGlyAspGluSerGlyThrValAspThrAlaAsp65707580ArgGlyGinProLeuGluLeuValValGlyProTyrArgGluSerArg859095ThrSerProAspLeuLeuArgProSerValSerGlyThrPheThrVal100105110AspGlyValProTyrProTyrThrSerHisThrHisAlaAlaGlyHis115120125ValLeuSerThrTyrCysThrSerGluPheAlaArgArgGlyGluPro130135AlaPheValLeuValTrpAspGlyGlyMet145150ValAspProGluAlaGlyValGluAsnGly165170lieGlyHisThrTyrAlaThrAlaGlyHis140180ArgAspArgGinSerAlaAsnVal195200LeuMetAlaTyrlieAlaLeuGlyLysPro210215ValLeuAlaSerValPheHisAspHis225230AlaAlaAlaGluHisSerArgThrVal245GluProSerMetProProLeuHis260GinValGinProPheAlaValSer275280HisGluPheLeuGinAsnLeuLeu290295ArgAlaTrpLysGlyAspGlyProTrp305310CysAlaLeuAsnlieLysTrpAsnSer325ValArgArgMetTrpValProPro340lieGlyAlaAlaValLeuGlyAla355360PheProArgLeuTyrTrp155160GlySerLeuPheProLeu175HisPheGlyProPheArg185190AspAspLeuSerValAlaGlyLys205SerGluAlaValLeuGlu220TyrGluAsnGluAlaSerPro235240GlyGlyPheGlySerLeuPhe250255PhePheArgAlaValArgGlu270GluAspValLeuAlaSerVal285GluArgLeuAspAlaArglie300AsnLeuCysPheAlaGlyGly315320AlaLeuArgAlaLeuProLeu330335ProAsnAspAlaGlySerAla350GlyGlyArgAsnAlaValPro365Asp265AspLeuPhe345lie<sequence>complexsequenceseeoriginaldocumentpage69</sequence><213>可可鏈霉菌阿蘇變種<400>17MetSerThrAlaProAlaAlaProAlaArgProLeuAlaGlyArgThr151015ValLeulieLysCysGlyGlySerValLeuAspGluGlyAspAlaGly202530ArgThrPheAlaGluAspValAlaGluLeuAlaAspAlaGlyThrArg354045ValValValValHisGlyGlyGlyProGinlieA印ThrHisLeuGlu505560ArgLeuGlylieGinProValPheArgHisGlyLeuArgValThrThr65707580ProProThrMetGluValValArgMetValLeuSerGlyGinValGin859095ArgArgLeuValGlyLeuLeuAsnArgGluArgArgLeuAlaValGly100105110LeuThrGlyGluAspAlaArgThrPheThrAlaAlaAspArgGinVal115120125PheHisGlyGlyGinArgValAspLeuGlyLeuValGlyAsplieVal130135140AspValAspAspArgLeuLeuArgThrLeuLeuAspAlaGlyLeuVal145150155160ProValValSerSerlieAlaArgSerAlaAspGlySerGlyValArg165170175AsnValAsnAlaAspLeuAlaAlaAlaAlaLeuAlaAlaAlaLeuArg180185190AlaAspThrLeuLeuLeuLeuThrAspValAlaGlyLeuTyrProGly195200205GinProAspArgGlyGluValLeuAspArgLeuThrAlaAlaGluAla210215220AspAlaLeuLeuProArgLeuThrGlyGlyMetlieProLysValGin225230235240AlaCysSerGinAlaValArgAlaGlyValAlaThrAlaArglieAla245250255AspGlyArglieProHisAlaValArgGluHisLeuLeuThrGlyArg260265270ArgThrGlyThrThrValSerPro275280<210>18<211>419〈212〉PRT<213>可可鏈霉菌阿蘇變種〈400〉18MetHisLeuAlaSerThr15ProHisAlaArgArgTrp20GlyAsnGlyLeuTrpThr35GinHislieProLeuAsp50ArgProGlyGinArgProProAlaHisArg1015TyrLeuAlaAlaLeuPheAlaAspAlaVal2530ProLeuAlaUuliePhePheThrArgAla4045ValThrGlyAlaAlaLeuThrAlaGlyGly5560LeulieGlyLeuLeuThrGlyPro丄euAlaGlyThrLeuValAspArg65707580TrpGlyAlaLeuProLeuValGinLeuSerAsnValLeuArgGlyAla859095ValPheLeuValTyrProLeulieThrSerValGlyGinLeulieAla100105110LeuAlaAlaValLeuAlaAlaCysGluArgLeuPheTrpThrAlaAsnThrPro130LeuAla145GlyLeu115AlaLeuGluGinThr120ValGlyLysAspVal135LeuArgThrGinAsnMet150AlaAlaValLeuSerAlaAla165LeuHisLeulieAlaTrpLeu180LeuGlyValArgValProArgArgLeuLeuMet195AlaSerArgProAlaPro210LeuAla225AlaLeuAsnGly185ValPro200AlaThrGlyPro125GlyLeuLeuProVal140AlaGlyTrpMetThrGlyAla155160LeuLeuGinHisProGlyArg170175AlaThrPheLeuAlaAlaAlaAspLys215LeuLeuLeuMetArgProPhe230ThrAspSerLeuThrVal245AspValLeuHisGlyPro260AlaLeuLeuLeuAlaGinLysGinSerTrpLeu265ValAlaLeuLeuLeuAlaGin275280GlyGlyHisGlySerAlaLeuArgProLeuArgPheLeuAla190ThrGlyAlaProAla205AlaTrpArgArgThr220CysLeuThrGinLeuAlaPhe235240MetLeuProLeuValAlaLeu250255ProAlaAlaAlaLeulieThrSerSerAlaAlaLeu270AlaValArgArgPhe285LeuAlaCysLeuVal290295PheAlaValAlaPheLeuLeuLeu305310GlyTrpAlaValProValValLeu325AlaAspAlaLeuPheAlaProVal340AlaProGluGluTyrLysGly355TrpGlyAlaAlaAlaValLeu370375ThrAlaGlyAsnAlaValLeu385390AlaThrAlaAlaLeuThrAla405ThrProAla300AlaProAlaGlyArgLeuThrPro315320GlyAlaAlaValAlaGlyAlaVal330335MetThrValLeuAlaAsnAlaAla345350TyrSerAlaThrPheGinLeuAla365ProAlaValGlyAlaPheUuLeu380LeuThrLeuValAlaLeuGlyAla395400LeuValProArgArgGlyGluGlyAsp410415Arg360AlaTrp<210>19<211>188<212〉PRT<213>可可鏈霉菌阿蘇變種<400>19MetThrGluProAlaAspProArgArglieLeulieAlaGlylieSer151015GlyAlaGlyLysThrSerLeuAlaAlaAlaLeuSerGinArgUuGly20lieProHislie35ArgArgAlaGlu50AlaTrpValCys65AlaAlaArgThrValMetHisArgVal100ArgProLeuTrpHisAsp115SerProArgHisProVal130ArgAlaGluThrAla145ValArgLeuArg25GluMetAspAlaLeuTyrHisGly40PheThrAspAspValAlaArgPhe5560AspAlaGinTyrHisTrplieVal7075GinLeuPheValTrpLeuAspLeu85lieArgArgLeu90LeuSerArgValSer105AsnThrGluThrTrpArg120ArgTrpAlaTrpSerArg135140TrpPheAlaArgHisProAla150AlaAlaGinAlaProProAlaGly180Thr165ArgThrHisAspHis155Arg30ProHisTrpSer45ThrAlaSerGluGlyAspLeuLeu80ProArgHisThr95LeuLeuArg110AlaI>euLeuPhe125HisGlyThrArgAspGly185Arg170SerArgAlaValProVal160TrpLeuArgSerLeu175〈210>20<211>1111<212>PRT<213>可可鏈霉菌阿蘇變種<400>20MetTyrAlaThrGluValHisGinProArgThrLeuThrAlaAspLeu151015SerLeuGluAlaPheGlyValMetThrAlaArgArgGlySerGluPro202530ValHisLeuGlyProProArgHisArgAlaValLeuGlyLeuLeuMet35LeuArgLeuGlyGinVal50TrpGlyAspLysProPro4045ValArgValAspGinLeuValAspGluLeu5560ArgArgProHisAlaThrLeu75AlaUuThrSerGlyHisGlyTyrSer90ProGlyTyrValGinThrTyr80AspAla95AlaLeuLysVal6570MetSerHisLeuArgArg85GlyValAlaPi;oLeuHis100AspProGinAlalieAsp115GlyGinGinHisAlaAla130LeuAspSerAlaLeuHisLeuTrpArgAlaAspProPheLeuAspLeu145150155160ThrSerTyrGluProLeuAlaGluGluSerAlaArgLeuGinHisLeu165170175ArgThrAlaAlaValThrlieArgAlaGluAlaLeuLeuAlaLeuGly180185190ThrThrValGluSerLeuArgArgGluVallieArgPhe200AlaAlaArgAlaProGlyTyrValLeu105110CysArgPheAspGluMetValSerArg120125GluGlyArgPheGlyGluAlaArgGluAla135140LeuTrpArgAlaAspProPheLeuAspAlaArg195ProSerAspGluArglie210Val215Val205LeuMetThrGlyLeuTyrArg220<formula>complexformulaseeoriginaldocumentpage76</formula>450455460AspAlaLeuSerGluThrlieLeuArgHisAlaAspAspAlaProLeu465470475480LeuLeuValLeuGluAsnValHisLeuAlaAspArgProThrLeuAsp485490495ValLeuAlaLeuLeuSerAspGlyThrGinGlyArgAlaValSerVal500VallieSerValArgGluSer515LeuGinGluGlyPro530LeuAspAspLeuSerGluGluGinValGin545GlyGlyProGly505510GlyValGlyAlaGlyAlaGluProAsp520525AlaAspSerArgThrAspValValHisPro565SerGlyGlyAsnProTyrLeuLeuLeuLeuAlaAspSerArgThr535540GluGluGinValGinThrLeuLeuAla550555AlaThrProValValArgGlyLeuTyrVal570GinLeuLeuAlaAlaGin560GluArg575AlaGlyAsnProTyrLeuLeuGlyGinLeuLeuAlaHis580585590GlyAlaArgSerLeuHisAlaAlaArgAlaAlaArgGinValLeuThrArg595GlulieProThrGly610LeuAlaProGluVal625ThrGluAlaAspAlaArgAlaAlaArgGin600605ValSerSerMetLeuArgArgArgLeuAlaGly615620LeuArgValLeuArgGlyCysAlaVal630635ThrLeuLeuThrThrValLeuGlyAspLeuThrLeuLeuThrThr645650ProGlyValArgAlaValGluGluAlaLeuArgThrGly660665ArgAspHisAspHisAlaArgThrLeuValPheArgHis675Thr680LeuGly640ThrThr655LeuLeuArg670TyrGlyLeuVal685ArgAspValLeuLeuAlaGluMetSerAspGinGluArgSerAspLeu690695700HisAlaTrpAlaValAspValLeuGlyArgGinAlaAspGlyHisPro705710715720AlaAlaAlaSerArgLeuAlaHisHisAlaTrpGinAlaSerLeuThr725730735LeuProProAspGinValLeuProTyrLeuValArgAlaGlyGluGin740745750AlaAlaLeuGluSerArgTyrAspArgAlaGinThrTrpPheArgArg755760765AlaHisAlaLeuLeuThrSerGlyProSerAlaSerGlyAlaAlaAla770775780GinAlaLeuGinLeuArgLysArglieLeuGinlieAlaThrValThr785790795800ArgGlyTyrGlyAspArgGluValValAlaGluSerGinArgValLeu805810815SerMetSerProAlaAlaValGinGluProAlaLeuValPheSerGin820825830CyslieAlaGinLeuValThrGlyHisArgGluGluSerAlaArgArg835840845AlaHisGinLeuArgValMetAlaGinAsnGlyAspAlaProGluAla850855860ArgLeuHisGluArgLeuAlaHisGlylieLeuHisLeuProAspArg865870875880ThrAlaGluAlaLeuAlaAlaLeuThrGluAlaGluGinThrAlaGly885890895AsnLeuSerAlaAlaArgLeuArgGinLeuAlaHisHisThrGinHisAspProArg915LeuGlyAla930LeuThrGly945SerHisAla900PheLeuAlaMet905910GinAspAspAla935CysGluGlyThr950LeuValAlaAla965SerSerAlaAlaGluGlyLeu980HisTrpAlaAlaLeuLeuLys995LeuGlyThrProGly1010AspLeuSerValArg1025Leu1040Arg1055Glu1070Arg1085ThrGluHisLeuAla1100AlaLeu1015HisLeu1030AlaGin1045ArgArg1060LeuSer1075ProLeu1090GlyLeu1105AsnHisArgThrLeuAlaLeuSerLeu920925LeuAlaLeuAlaGinGluLeuLeuAla940ProValAspArgAlaSerAlaHisTyr955960LeuAlaGluAspAlaAspAlaThrAla970975ArglieAlaAspAlaHisGlyLeuLeu985990ValCysArgGlyTrpAlaGinHisArg10001005AspAlaLeuLysAlaAlaValThr1020ArglieArgLeuProLeuHisLeu1035Ala1050lie1065Phe1080Cys1095ProArgArgSerGlyHis1110GlyLeuLeuAlaHisAlaGinTyrAspAlaGlyAlaValGluAlaAlaArgAlaThrLeuArgArgAlaAlaArgGlulieArgAlaAlaGlyGluAspAlaTyrLeuSerProAspLeuProPheAsnArgLeuProArgLeuGinProProLeuProProArgGlyCysSerAspPro79〈210〉21<211>962<212>PRT〈213>可可鏈霉菌阿蘇變種〈柳>21MetAspArgHis1ArgAspGlyAlaLeuAlaLeu35lieVal50lieVal65LeuAlalieAlaPheGlyValLeu510GluLeuProProGlyPro2025LeuLeuLeuGluAlaGly40AspAlaLeuTrpProAlaGlyAlaPro55GlyAsnGlyProlieArgProLysGinlieTrp15AlaValArg30GinProValSerLeuSerArg45SerHisArgHisVal——7075ProArgAlaProGlyArgLeuL,euValSer60LeuArgLysLeuLeuGluAlaAlaAsnArgArgValLeu8590TyrAlalieAspValAspAlaGlyThrLeuAspLeuLeuProHis80GlyGly95PheArg100105GluLeuAlaGinArgAlaArgAlaAlaAlaAla130AlaAla145AlaVal115AlaAlaGlyValArgAla120Arg110ArgAlaGlyGlyAspThrGlu125GluLeuPheThrGinAlaLeuSerLeuTrpArgGlyGlu135140LeuArgGlyHisProAlaGinGluPro150155AspSerGluHisLeuAlaValLeuArgGluGlyAla165170PhePhe160AspLeu175ValLeuAlaThrGlyAlaProGluArgMetLeuProLeuLeuGinSer180185190AlaAlaAlaLeuHisProLeuAspGluSerLeuHisValArgLeuVal195200205GinAlaLeuAlaAlaThrGlyArgGinAlaGluAlaLeuAlaLeuTyr210215220AspThrMetArgAlaArgLeuAlaValGinValGly225230235ProGluLeuSerAlaValArgAlaArgLeuLeuHis245ValLeu250ProProAspGlyThrAspAspGlyArgProLeuSerGlyProProArg275ProProAspGlyThr260GinHisAlaProArg265SerAlaProAlaGluProGly240AspValGinThr255AspLeuThr270ArgProThrGluSerAlaProAlaVal280285ThrPheValGlyArgArgThrGluLeuGinLeuProProAspLeuCysThrPheValGlyArg290295300AlaArgLeuThrGluLeuLeuAspAlaLeuAspAspGlyArg305310AlaAlaSerValVallieSerAsp315AlalieAspGlyMetProGlyValVallieSerAlalieAsp325330LysThrThrLeuAlaValHisValAlaHisArgLeuAla340345GinLeuTyrValAsnLeuArgAlaPheProAspGly355ValProAlaProAla320ValGly335HisArgPhe350ValSerGluAlaGlu375AspLeu390LeuAlaAsnLeuArgAlaPheAsp360365ValLeuArgSerPheLeuThrAlaLeuSerAla370GlyValProAlaArgAspLeuProProAsp385LeuTyrArgSerLeuLeuAlaGlyLysArglieLeulieLeuThr395liePhe380AspSerArgValAla400LeuAsp405410415AsnAlaLeuAspSerGluHisVal420SerCysLeuValVallieThrSer435AlaThrHis450GluSerArg465AlaGluPro440GlyAlaArgProlie455GluValLeuAlaGly470ValAspGluAlaAla艦Leu500AlaSerValAlaArgProLeuMetProGlySerSer425430ArgThrGinLeuArgGlyLeuVal445ThrLeuGlyLeuLeuSerArgGlu460ArgValGlyGlyGluArgThrAla475AspLeuCysGly480lielieAspLeuCysGlyArgLeu490495ProLeuAlaLeuAlalieValAlaAlaHisAlaAlaThrGinProAsp505510AlaLeuLeuAspAspArgAspSerLeuProLeuAlaSerValAlaAla515520LeuAspGlyPheAlaGlyGluAspArgTyr530535PheSerTrpSerCysArgSerValGlyPro545550ArgLeuLeuAlaLeuHisProGlyLeu565AlaSerLeuAlaAlaLeuProAlaArgArgValArgAlaAla580GlyAlaHisLeuProAsp570ArgArg585AlaArgLeuAspAsp525ThrAspLeuArgThrVal540GinAlaAla555lieSerAlaArgAlaThrLeuAsnGlyAlaHisLeuLeu595600AlaPheHisAspLeuLeuLysValHisAla610615LeuGluAspGluAspThrArgGinLeuAla625630LeuLeu560AlaAla575LeuLeuAla590SerGlyProGinArgPhe605LeuGluGinSerArgGlu620ValArgArgLeuLeuAsp635640HisCysLeuHisThrAlaTyrAlaAlaAlaGluAlaLeulieProAsn645650655ArglieGluAlaProLeuGluProGluAlaAlaProGlyValAlaPro660665670GluProlieGlyGlyArgGinGluAlaMetAlaTrpLeuAspArgGlu675680685LeuProValLeuLeuSerAlaValProTyrAlaGinArgArgGlyPhe710GinAsp690695ProGinHisAlaTrpLeuLeu705ArgGinGlyArgTrp725GluAlaAlalieSer740ArgAlaLeuGlyPhe755AspAlaPheLeuArg770AlaAlaGlyGinAla785AlaArgGlyArgHis805AlaLeuTyrArgGlylieArgAsn820AsnGluThrGlyTrp835lieThrTrpCysAspArgAla850855ValAsnGlyGluAlaAlaAla700AlaGinAlaLeuGluLeuHis715GinThrAlaValGinArgThr730LeuLysAspProValArg745AlaTrpGlyArgLeuCys760LeuThrLeuPheLeuAsp720AlaLeu735AlaCysGluAlaGin750GluAspAspArgAla765ThrGluAlaGlyAsp780AlaPheLeuArgAla775ArgThrArgArgGinMetAlaPheLeuAlaAsn790795800ThrGluAlaLeuArgHisTyrGluHisAlaLeu810815GlyGlyGinAlaValValLeuLeu825ThrHislieLeuLeuGly840ValSerLeuHisTrpAspSerLeuGinAlaVal830AspHisGluArgAla845ArgAlalieGlyAsp860GlyLeuAlaHisHis<sequence>complexsequenceseeoriginaldocumentpage84</sequence>權(quán)利要求1.一種多氧霉素生物合成基因簇,其特征在于,編碼多氧霉素生物合成所涉及的20個基因,具體為(1)負(fù)責(zé)多氧霉素生物合成的結(jié)構(gòu)基因polA,polB,polC,polD,polE,polF,polG,polH,polI,polJ,polK,polL,polM,polN,polO,polP,即共13個基因polA位于基因簇的核苷酸序列第12838-14175堿基處,長度1338堿基對編尿苷-5’-單磷酸烯醇式丙酮酸轉(zhuǎn)移酶,445個氨基酸;polB位于基因簇的核苷酸序列第11999-12772堿基處,長度774堿基對,編碼胸苷酸合成酶,257個氨基酸;polC位于基因簇的核苷酸序列第29476-28862堿基處,長度615堿基對編碼羥化酶,204個氨基酸;polD位于基因簇的核苷酸序列第28857-28210堿基處,長度648堿基對編碼羥化酶,215個氨基酸;polG位于基因簇的核苷酸序列第26166-24874堿基處,長度1293堿基對編碼羧化酶,430個氨基酸;polH位于基因簇的核苷酸序列第24881-23472堿基處,長度1410堿基對編碼典型S-腺苷酰-L-甲硫氨酸蛋白,469個氨基酸;polI位于基因簇的核苷酸序列第23475-22333堿基處,長度1143堿基對編碼氨基轉(zhuǎn)移酶,380個氨基酸;polJ位于基因簇的核苷酸序列第22336-21515堿基處,長度822堿基對編碼磷酸化酶,273個氨基酸;polK位于基因簇的核苷酸序列第21528-20887堿基處,長度642堿基對編碼羥化酶,213個氨基酸;polM位于基因簇的核苷酸序列第20041-19274堿基處,長度732堿基對編碼短鏈脫氫酶,243個氨基酸;polN位于基因簇的核苷酸序列第19281-18775堿基處,長度507堿基對編碼氨基酸N-?;D(zhuǎn)移酶,168個氨基酸;polO位于基因簇的核苷酸序列第18778-17057堿基處,長度1722堿基對編碼氨甲酰轉(zhuǎn)移酶,573個氨基酸;polP位于基因簇的核苷酸序列第17060-16218堿基處,長度843堿基對編碼酰基谷氨酸激酶,280個氨基酸;(2)負(fù)責(zé)多氧霉素生物合成的調(diào)節(jié)基因,即polR,polY共3個基因polR位于基因簇的核苷酸序列第32787-36122堿基處,長度3336堿基對編碼調(diào)控蛋白,1111個氨基酸;polY位于基因簇的核苷酸序列第32569-29681堿基處,長度2889堿基對編碼途徑專一性調(diào)控蛋白,962個氨基酸;(3)負(fù)責(zé)轉(zhuǎn)運(yùn)的基因polQ1,polQ2,即共2個基因polQ1位于基因簇的核苷酸序列第16052-14793堿基處,長度567堿基對編碼膜蛋白;polQ2位于基因簇的核苷酸序列第14796-14230堿基處,長度1260堿基對編碼腺苷酸激酶,419個氨基酸;(4)功能未知基因,polE,polL共2個基因polE位于基因簇的核苷酸序列第28187-27075堿基處,長度1113堿基對編碼膽固醇氧化酶,370個氨基酸;polF位于基因簇的核苷酸序列第27023-26196堿基處,長度828堿基對編碼氧化還原酶,275個氨基酸polL位于基因簇的核苷酸序列第20830-20099堿基處,長度732堿基對編碼膽固醇氧化酶,243個氨基酸。2.根據(jù)權(quán)利要求1所述的多氧霉素生物合成基因簇,其特征是,利用多氧霉素生物合成基因簇用于多氧霉素的高產(chǎn)菌株或有效組分高產(chǎn)菌株的分子育種。全文摘要本發(fā)明涉及的是一種基因工程
技術(shù)領(lǐng)域:
多氧霉素生物合成基因簇及其應(yīng)用。編碼多氧霉素生物合成所涉及的20個基因,具體為(1)負(fù)責(zé)多氧霉素生物合成的結(jié)構(gòu)共13個基因;(2)負(fù)責(zé)多氧霉素生物合成的polR,polY共3個調(diào)節(jié)基因;(3)負(fù)責(zé)轉(zhuǎn)運(yùn)的基因polQ1,polQ2,即共2個基因;(4)功能未知基因,polE,polL共2個基因。利用多氧霉素生物合成基因簇用于多氧霉素的高產(chǎn)菌株或有效組分高產(chǎn)菌株的分子育種。本發(fā)明所提供的基因及其所編碼的蛋白質(zhì),也可以用來查找和發(fā)展可用于醫(yī)藥,工業(yè),農(nóng)業(yè)的化合物或蛋白。文檔編號C12N15/31GK101195828SQ20071017189公開日2008年6月11日申請日期2007年12月6日優(yōu)先權(quán)日2007年12月6日發(fā)明者周秀芬,由德林,白林泉,賀新義,鄧子新,陳文青申請人:上海交通大學(xué)