專利名稱:依尼奧小單孢菌西索霉素生物合成基因簇的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于抗生素合成領(lǐng)域,具體涉及一種依尼奧小單孢菌西索霉素生物合成基因簇。
背景技術(shù):
微生物是生物制藥的重要源泉,放線菌位居首位。用依尼奧小單孢菌生產(chǎn)西索霉素已有報(bào)道,但是產(chǎn)量較低。抗生素產(chǎn)生菌的生物合成基因幾乎總是與其抗性基因相連鎖,從研究抗性基因入手有望從根本上提高小單孢菌生物合成抗生素的能力;借助抗性基因,可以方便地克隆相關(guān)抗生素生物合成基因簇。我國(guó)在小單孢菌基因克隆方面的研究少見(jiàn)報(bào)道,并且國(guó)內(nèi)外未見(jiàn)報(bào)道西索霉素生物合成基因簇。
發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)上述問(wèn)題,提供一種依尼奧小單孢菌西索霉素生物合成基因簇,該基因簇揭示了生物合成西索霉素的相關(guān)DNA序列,對(duì)應(yīng)的開(kāi)放性閱讀框,基因排列順序和可能的基因功能。
本發(fā)明的依尼奧小單孢菌西索霉素生物合成基因簇,其堿基序列如序列表中SEQ ID NO.1所示。其基因簇的分子量(37.739/1.575)*106≈23.96*106;幾何結(jié)構(gòu)DNA如附圖所示。
本發(fā)明的顯著優(yōu)點(diǎn)為本發(fā)明首次從依尼奧小單孢菌Ts388中克隆到西索霉素生物合成基因,這些基因可用于研究西索霉素的生物合成機(jī)制,基因的功能,基因的組織和生物合成的基因調(diào)控等;對(duì)這些基因進(jìn)行改良,有可能得到高產(chǎn)的優(yōu)良菌種,用于工業(yè)化生產(chǎn),產(chǎn)生豐厚的利潤(rùn);利用這些基因進(jìn)行重新組織,或利用這些基因與其它基因進(jìn)行重組,有可能構(gòu)建出新的生理活性物質(zhì)或新藥物,最終獲得新化合物,產(chǎn)生巨大的經(jīng)濟(jì)效益和社會(huì)效益。
附圖為西索霉素生物合成基因簇的相關(guān)DNA序列圖。
具體實(shí)施例方式
該西索霉素生物合成基因簇的來(lái)源為依尼奧小單孢菌Ts388。
該西索霉素生物合成基因簇總長(zhǎng)約37739p,包括多個(gè)orf和2個(gè)rRNA(rRNA1和rRNA2)。該西索霉素生物合成基因簇的DNA序列涉及到西索米星的生物合成的相關(guān)酶。估計(jì)有28個(gè)左右orf,其中sisT,sisU,sisV,srmO,sisW,sisX,sisY,sisZ,srmA,sisA,sisB,sisC,sisD,sisE,sisF,sisL,SCD2,SCD3已經(jīng)確定。
該西索霉素生物合成基因簇的制備步驟為1材料和方法1.1材料(1)菌種與質(zhì)粒伊紐小單孢菌(M.inyoensis)Ts388由本研究室保存;E.coli BL21(DE3)、E.coliDH5α和質(zhì)粒pUC18均由上海來(lái)益生物藥物研發(fā)中心提供。表達(dá)載體pET-30a購(gòu)自Novagen公司。
(2)培養(yǎng)基LB培養(yǎng)基,根據(jù)需要添加氨芐青霉素(終濃度100μg/mL);用于伊紐小單孢菌TS388生長(zhǎng)的培養(yǎng)基見(jiàn)以下文獻(xiàn)。使用的抗生素及濃度為氨芐青霉素100μg/mL,卡那霉素50μg/mL。其它常用化學(xué)藥品及試劑購(gòu)自上海生物工程公司和華美公司。
(3)主要試劑所有的工具酶購(gòu)自TaKaRa公司;氨芐青霉素(Amp)為華美生物工程公司產(chǎn)品;瓊脂糖為Pharmacia產(chǎn)品;PCR引物由上海生物工程公司合成;DNA序列由TaKaRa公司測(cè)定。
1.2基因的克隆及其測(cè)序伊紐小單孢菌TS388染色體DNA的提取見(jiàn)以下文獻(xiàn);質(zhì)粒DNA采用堿裂解法提取,DNA酶切、連接等均按產(chǎn)品說(shuō)明書進(jìn)行;采用CaCl2方法制備感受態(tài)細(xì)胞,在含有抗生素的選擇性培養(yǎng)基上篩選陽(yáng)性轉(zhuǎn)化子。DNA采用試劑盒回收(購(gòu)自TaKaRa公司)。
從GenBank中選擇與伊紐小單孢菌親緣關(guān)系比較接近的、產(chǎn)慶大霉素的棘孢小單孢菌(M.echinospora)慶大霉素生物合成基因簇(AY524043)作為引物設(shè)計(jì)的參考模板,設(shè)計(jì)引物。PCR循環(huán)條件為94℃預(yù)變性5min;94℃變性1min,59℃復(fù)性1min,72℃延伸2min,循環(huán)30次;最后72℃保溫10min。PCR產(chǎn)物經(jīng)瓊脂糖凝膠電泳回收,經(jīng)相應(yīng)的限制性酶切割,開(kāi)與受同樣酶雙酶切的pUC18載體進(jìn)行連接,然后轉(zhuǎn)化大腸桿菌DH5α感受態(tài)細(xì)胞,構(gòu)建含擴(kuò)增片段的亞克隆子,經(jīng)藍(lán)白斑篩選,得到了陽(yáng)性克隆子,送TaKaRa公司測(cè)序,所得序列應(yīng)用vector NTI 9.1和Blast軟件進(jìn)行序列比對(duì)和結(jié)構(gòu)預(yù)測(cè)。
本發(fā)明的西索霉素生物合成基因簇的制備工藝、步驟、條件、收集、純化步驟和鑒定方法已經(jīng)公開(kāi)發(fā)表于以下文獻(xiàn)中[1]洪文榮,許向前,朱春寶,陳代杰,朱寶泉。依紐小單胞菌2-脫氧蟹肌醇合成酶基因的克隆與表達(dá)。復(fù)旦學(xué)報(bào),2006,45(3).283-287。
洪文榮,朱春寶,陳代杰,朱寶泉。紫蘇霉素抗性基因srml的克隆及其特性研究復(fù)旦學(xué)報(bào),2005,44(4)549-554。
洪文榮,陳代杰,朱寶泉。依尼奧小單孢菌抗性基因sisR的克隆研究,生物工程學(xué)報(bào),2005,21(1),149~153。
本發(fā)明的西索霉素生物合成基因簇的DNA序列由TaKaRa公司檢測(cè),應(yīng)用vector NTI 9.1和Blast軟件進(jìn)行序列比對(duì)和結(jié)構(gòu)功能預(yù)測(cè)。
基因功能預(yù)測(cè)經(jīng)DNA序列及其蛋白質(zhì)序列比對(duì)分析,與已知同類功能基因的同源性達(dá)90%以上,則初步推測(cè)其功能相似。以srmA抗性基因的功能預(yù)測(cè)為例,闡述如下sis-srmA為來(lái)自伊紐小單孢菌(Micromonosporainyoensis)Ts388的srmA基因;gen-grmA為來(lái)自產(chǎn)慶大霉素的棘孢小單孢菌(Micromonospora echinospora)的grmA基因srmA與grmA的DNA比對(duì)結(jié)果1 60gen-grmA-orf (1)ATGACGACATCTGCGCCTGAGGACCGTATCGACCAGGTCGAGCAGGCCATCACCAAGAGCsis-srmA-orf (1)ATGACGACATCTACGGGCGACGACCGTATCGACCAGATTCAGCAGGCCATCACCAAGAGCConsensus (1)ATGACGACATCT CG GA GACCGTATCGACCAG T AGCAGGCCATCACCAAGAGC61 120gen-grmA-orf (61)CGGCGCTACCAGACGGTGGCCCCGGCCACCGTGCGGCGCCTGGCCCGGGCTGCCCTCGTCsis-srmA-orf (61)CGGCGCTACCAGACGGTGGCCCCGGCCACCGTGCGTCGCCTGGCCCGGGCCGCCCTGGTCConsensus (61)CGGCGCTACCAGACGGTGGCCCCGGCCACCGTGCG CGCCTGGCCCGGGC GCCCT GTC121 180gen-grmA-orf (121)GCCGCGCGGGGCGACGTGCCGGACGCGGTGAAGCGCACCAAGCGCGGGCTGCATGAGATCsis-srmA-orf (121)GCCTCGCGGGGGGACGTGCCGGACGCGGTGAAGCGCACGAAGCGCGGGCTGCACGAGATCConsensus (121)GCC CGCGGGG GACGTGCCGGACGCGGTGAAGCGCAC AAGCGCGGGCTGCA GAGATC181 240gen-grmA-orf (181)TACGGGGCCTTCCTGCCGCCCAGCCCGCCCAACTACGCAGCGTTGCTGCGGCAGCTCGACsis-srmA-orf (181)TACGGCGCCTTTCTGCCGCCCAGTGCGCCTAACTACACAGCGTTGCTGCGGCACCTCGACConsensus (181)TACGG GCCTT CTGCCGCCCAG CGCC AACTAC CAGCGTTGCTGCGGCA CTCGAC241 300gen-grmA-orf (241)TCCGCTGTGGACGCCGGTGACGACGAGGCGGTCCGGGCGGCTCTGCGCCGCGCGATGTCAsis-srmA-orf (241)GCCGCAGTGGAGGCCGGTGACGACGAGGCGGTCCGTTCGTCCCTGTCTCGCGCGATGTCGConsensus (241) CCGC GTGGA GCCGGTGACGACGAGGCGGTCCG CG C CTG CGCGCGATGTC301 360gen-grmA-orf (301)GTGCATGTGTCCACTCGTGAGCGATTGCCGCACCTGGCGGAGTTCTACCAGGAGATCTTCsis-srmA-orf (301)GTGCACATGTCCACCCGAGAGCGGCTGCCGCACCTCGACGAGTTCTACCGGGAGATCTTCConsensus (301)GTGCA TGTCCAC CG GAGCG TGCCGCACCT G GAGTTCTACC GGAGATCTTC361 420gen-grmA-orf (361)CGTCACGTGCCCCAGCCCAACACGCTGCGTGACCTCGCCTGTGGCCTCAATCCGCTGGCCsis-srmA-orf (361)CGTCACGTGCCACGGCCGAACACGTTGCGTGACCTGGCGTGTGGCCTCAACCCGCTGGCCConsensus (361)CGTCACGTGCC C GCC AACACG TGCGTGACCT GC TGTGGCCTCAA CCGCTGGCC421 480
gen-grmA-orf (421)GCTCCCTGGATGGGCCTGTCGGACCAGACCGTCTACGTCGCCTCCGACATCGACGCCCGGsis-srmA-orf (421)GTGCCCTGGATGGGCCTGTCCGACGAGACCGTCTACGTCGCCTCCGACATCGACGCCCGCConsensus (421)G CCCTGGATGGGCCTGTC GAC AGACCGTCTACGTCGCCTCCGACATCGACGCCCG481 540gen-grmA-orf (481)CTGATCGGCTTCGTGGACGCCGCCCTGACGAGGCTGGGCGTCGCGCACCGTACGAGCGTGsis-srmA-orf (481)CTGATGGACTTCGTGGGCGCTGCCCTGACGAGGCTGGGGGTGGCGTACCGTACGAGCGTGConsensus (481)CTGAT G CTTCGTGG CGC GCCCTGACGAGGCTGGG GT GCG ACCGTACGAGCGTG541 600gen-grmA-orf (541)GTCGACCTCCTCGAGGACCGCCTTGACGAGCCGACCGACGTCACGCTATTGCTGAAGACGsis-srmA-orf (541)GTCGACCTCCTTGAGGCCCGCCTTGACGAGCCGGCCGACGTCACGCTATTGCTGAAGACGConsensus (541)GTCGACCTCCT GAGG CCGCCTTGACGAGCCG CCGACGTCACGCTATTGCTGAAGACG601 660gen-grmA-orf (601)CTGCCCTGTCTGGAGACTCAGCGACGAGGCTCCGGCTGGGAAGTGATTGACATTGTCAACsis-srmA-orf (601)CTCCCCTGTCTGGAGACTCAGCAACGAGGCTCCGGCTGGGAAGTGATTGACATTGTCAACConsensus (601)CT CCCTGTCTGGAGACTCAGC ACGAGGCTCCGGCTGGGAAGTGATTGACATTGTCAAC661 720gen-grmA-orf (661)TCGCCGATTATCGTGGTAACCTTCCCGACCAAGTCTCTCGGTCAGCGATCGAAGGGGATGsis-srmA-orf (661)TCGCCGATTATCGTGGTAACCTTCCCGACCAAGTCTCTCGGTCAGCGATCGAAGGGGATGConsensus (661)TCGCCGATTATCGTGGTAACCTTCCCGACCAAGTCTCTCGGTCAGCGATCGAAGGGGATG721 780gen-grmA-orf (721)TTTCAGAACTATTCACAAAGTTTTGAGTCCCAGGCCAGAGAACGGTCGTGCCGAATTCAGsis-srmA-orf (721)TTTCAGAACTATTCACAGAGTTTTGAGTCCCAGGCTAGCGAACGATCGTGCCGCATTCAGConsensus (721)TTTCAGAACTATTCACA AGTTTTGAGTCCCAGGC AG GAACG TCGTGCCG ATTCAG781 825gen-grmA-orf (781)CGACTGGAGATCGGCAACGAGCTGATTTACGTCATTCAGAAATAGsis-srmA-orf (781)CGACTGGAGATCGGCAACGAGCTGATTTACGTTATTCACAAATAGConsensus (781)CGACTGGAGATCGGCAACGAGCTGATTTACGT ATTCA AAATAGorf的DNA同源性達(dá)91.0%;ArmA與GrmA的aa比對(duì)結(jié)果1 60gen-grmA-aa(1)MTTSAPEDRIDQVEQAITKSRRYQTVAPATVRRLARAALVAARGDVPDAVKRTKRGLHEIsis-srmA-aa(1)MTTSTGDDRIDQIQQAITKSRRYQTVAPATVRRLARAALVASRGDVPDAVKRTKRGLHEIConsensus (1)MTTS DDRIDQI QAITKSRRYQTVAPATVRRLARAALVAARGDVPDAVKRTKRGLHEI61 120gen-grmA-aa (61)YGAFLPPSPPNYAALLRQLDSAVDAGDDEAVRAALRRAMSVHVSTRERLPHLAEFYQEIFsis-srmA-aa (61)YGAFLPPSAPNYTALLRHLDAAVEAGDDEAVRSSLSRAMSVHMSTRERLPHLDEFYREIFConsensus (61)YGAFLPPS PNY ALLR LDAAVDAGDDEAVRAAL RAMSVHMSTRERLPHL EFY EIF121 180gen-grmA-aa (121)RHVPQPNTLRDLACGLNPLAAPWMGLSDQTVYVASDIDARLIGFVDAALTRLGVAHRTSVsis-srmA-aa (121)RHVPRPNTLRDLACGLNPLAVPWMGLSDETVYVASDIDARLMDFVGAALTRLGVAYRTSVConsensus (121)RHVP PNTLRDLACGLNPLA PWMGLSD TVYVASDIDARLI FV AALTRLGVAHRTSV181 240gen-grmA-aa (181)VDLLEDRLDEPTDVTLLLKTLPCLETQRRGSGWEVIDIVNSPIIVVTFPTKSLGQRSKGMsis-srmA-aa (181)VDLLEARLDEPADVTLLLKTLPCLETQQRGSGWEVIDIVNSPIIVVTFPTKSLGQRSKGMConsensus (181)VDLLE RLDEP DVTLLLKTLPCLETQ RGSGWEVIDIVNSPIIVVTFPTKSLGQRSKGM
241 275gen-grmA-aa (241)FQNYSQSFESQARERSCRIQRLEIGNELIYVIQK-sis-srmA-aa (241)FQNYSQSFESQASERSCRIQRLEIGNELIYVIHK-Consensus (241)FQNYSQSFESQA ERSCRIQRLEIGNELIYVI K同源性達(dá)92.7%。
經(jīng)DNA序列和蛋白質(zhì)序列比對(duì),其同源性達(dá)90%以上。推斷其功能與grmA相似,以下功能檢測(cè)證明了這一推測(cè)的可行性。
功能檢測(cè)(srmA對(duì)西索霉素的抗性能力)從伊紐小單孢菌(Micromonospora inyoensis)Ts388擴(kuò)增到包含紫蘇霉素抗性基因srmA的DNA序列(844bp),并將其克隆到pUC19/18載體上。srmA基因是依靠它自身的啟動(dòng)子激活(ATG上游19bp序列),在E.coli DH5α中表達(dá),并不受LacZ啟動(dòng)子的控制。其開(kāi)放性閱讀框長(zhǎng)822bp,編碼含274aa的多肽鏈。預(yù)測(cè)的SrmA蛋白序列與GrmA(來(lái)自棘孢小單孢菌)的同源性依次為92.7%,其DNA序列的同源性為91.0%。srmA與grmA抗性基因具有相同的核糖體結(jié)合位點(diǎn)GGAGG。
srm A基因抗性范圍和抗性能力。對(duì)紫蘇霉素類及其它一些具代表性的抗生素的抗性測(cè)驗(yàn),如四環(huán)類抗生素的金霉素(Chlortetracycline),喹諾酮類的環(huán)丙沙星(Ciprofloxacin)以及亞胺青霉烯(Imipenem)等。抗性檢測(cè)結(jié)果見(jiàn)表1。
表1srm A基因的抗性范圍和抗性能力
表1的抗性檢測(cè)結(jié)果表明,srm A基因僅對(duì)紫蘇霉素類抗生素的抗性負(fù)責(zé),功能檢測(cè)結(jié)果與推測(cè)相一致。
核苷酸序列表<110>福州大學(xué)<120>依尼奧小單孢菌西索霉素生物合成基因簇<160>1<210>1<211>37739<212>DNA<213>依尼奧小單孢菌(Micromonospora inyoensis)Ts388<220>
<223>該西索霉素生物合成基因簇總長(zhǎng)37739p,包括多個(gè)orf和2個(gè)rRNA(rRNA1和rRNA2)。
<400>1actcggatgc ttcacccccg gcacgacgct cccctaccca tccacacacc tgcaccagac 60atcaaggcct ggcgaagtaa aaatgtgaat gccacagctt cggcggtgtg cttgagcccc 120gctacattgt cggcgcggaa ccacttgacc agtgagctat tacgcactct ttaaagggtg 180gctgcttcta agccaacctc ctggttgtct atgcgacccc acatcctttt ccacttagca 240cacgcttagg ggccttagct ggtgatctgg gctgtttccc tctcgactac gaagcttatc 300ccccgcagtc tcactgccgc gctctcactt accggcattc ggagtttggc tgatttcggt 360aagcttgtgg gccccctaga ccatccagtg ctctacctcc ggcaagaaac acgcgacgct 420gcacctaaat gcatttcggg gagaaccagc tatcacggag tttgattggc ctttcacccc 480taaccacagg tcatccccca acttttcaac gttggtgggt tcggccctcc acgcggtctt 540acccgcgctt cagcctgccc atggctagat cactccgctt cgggtctaga gcatgcgact 600aaaaacgccc tattcagact cgctttcgct acggctcccc cacacgggtt aacctcgcca 660catgccacta actcgcaggc tcattcttca aaaggcacgc cgtcaccccg caaggctccg 720acggattgta ggcgaacggt ttcaggtact atttcactcc cctcccgggg tacttttcac 780cattccctca cggtacttgt ccgctatcgg tcaccaggaa gtatttaggc ttaccaggtg 840gtcctggcag attcacggca gatttcagga gtccgccgct actcgggaac acccacagaa 900ggtcagcaac tttcacctac cggactctca ccgcctacgg tcagcctttc cagactgttc 960ggctagccac tgactttata actcctcgaa cacgtgtcag catgttcagc agggtcccac 1020aaccccgacc acgcaacccc tgacaggtat cacacgcagc cggtttagcc tcaatccgct 1080ttcgctcgcc actactcacg gaatcactat ttgttttctc ttcctacggg tactgagatg 1140tttcacttcc ccgcgttccc cccatacacc ctatgtgttc aggtgcaggt gacatcacat 1200gactgatgcc aggtttcccc attcggacac cctgggatca cagcttggtt gacagctccc 1260ccaggcctat cgcggcctcc cacgtccttc atcggctcct ggtgccaagg catccaccgt 1320tcgcccttga caacttgacc acaaagatgc tcgcgtccac tgtgcaattc tcaaccaacg 1380accaacccac aacccaccac atcccacacc taaacccaca cggatccggt ttgcgagacc 1440aggtcatgcc tggcagtaat cacctagaag aaccaaccac cacgggttgt tccttcagga 1500cccaacaggg tgccatccgc ccctccccag ccgcaccaca acccccgttc caccaccccc 1560gaagagatgc gtactagaag attccggccg ttgccaggga aaaactcacc agtgtctccg 1620ccatcgagca ccccgacccg acattcgcag gtcgcgggct ccttaccacc cttcggtgga 1680aggtgctcct tagaaaggag gtgatccagc cgcaccttcc ggtacggcta ccttgttacg 1740acttcgtccc aatcgccagc cccaccttcg acggctccct ccacaagggt tgggccaccg 1800gcttcgggtg ttgccgactt tcgtgacgtg acgggcggtg tgtacaaggc ccgggaacgt 1860attcaccgca gcgttgctga tctgcgatta ctagcgactc cgacttcacg gggtcgagtt 1920gcagaccccg atccgaactg agaccggctt tttgggattc gctccacctc acggtatcgc 1980agcccattgt accggccatt gtagcatgcg tgaagccctg gacataaggg gcatgatgac 2040ttgacgtcat ccccaccttc ctccgagttg accccggcag tcttcgatga gtccccgcca 2100
tagcgcgctg gcaacatcga acgagggttg cgctcgttgc gggacttaac ccaacatctc 2160acgacacgag ctgacgacag ccatgcacca cctgtgaccg cccccgaagg acccgacatc 2220tctgccggtt ttgcggccat gtcaaaccca ggtaaggttc ttcgcgttgc atcgaattaa 2280tccgcatgct ccgccgcttg tgcgggcccc cgtcaattcc tttgagtttt agccttgcgg 2340ccgtactccc caggcggggc gcttaatgcg ttagctgcgg cacagagaac cggagaggct 2400ccccacacct agcgcccaac gtttacagcg tggactacca gggtatctaa tcctgttcgc 2460tccccacgct ttcgctcctc ggcgtcagta tcggcccaga gacccgcctt cgccaccggt 2520gttcctcctg atatctgcgc atttcaccgc tacaccagga attccagtct cccctaccga 2580actctagcct gcccgtatcg actgcaggcc cgcagttgag ctgcgggttt tcacagtcga 2640cgcgacaagc cgcctacgag ctctttacgc ccaataaatc cggacaacgc tcgcgcccta 2700cgtcttaccg cggctgctgg cacgtagttg gccggcgctt cttctgcagg taccgtcact 2760tacgcttcgt ccctgctgaa agaggtttac aacccgaagg ccgtcatccc tcacgcggcg 2820tcgctgcatc aggcttccgc ccattgtgca atattcccca ctgctgcctc ccgtaggagt 2880ctgggccgtg tctcagtccc agtgtggccg gtcgccctct caggccggct acccgtcgtc 2940gccttggtag gccatcaccc caccaacaag ctgataggcc gcgagcccat cccaggccga 3000aaaactttcc accaacgatc atgcgatcga cggtcctatt cggtattagc cccggtttcc 3060cggggttatc ccaaagccta ggacaggttg ctcacgtgtt actcacccgt tcgccgctcg 3120agtaccccga agggcctttc cgctcgactt gcatgtgtta agcacgccgc cagcgttcgt 3180cctgagccag gatcaaactc tccaacaaaa acttgttgaa caatcgtccc ggcaacaaaa 3240gtgttgccaa aggaatccca accaaccaga cacaccgaag catgcccagc cagtccgggg 3330tataaatcat aattggcact ggcttatcaa gcaccctgtt gagttctcaa agaaaaacca 3360cacaccatcc ggaaccctca ccaggcgcca tccggggcaa tccgttccca ctcccgccgc 3420tctcgcgccg ggcacttcta ctacgttacc tcaccgtttc cgccgtgtca aaccgtgtgt 3480cccggtctgt cgtgcttggt acggtttggc tccgctgacc gcaggcagcg gcgaaccgct 3540gcgctttgct catcggattc ggcaggccgg ccgctgcggt ctcccgctcg ctcgcccggt 3600gccctgccgg tcgtgaacct tacccggccg gttccgcccc gccaaatcga cccctcggtc 3660gatccggtgg agcaccaccc ggatcccgat gccggaggag tgaacccctc ctgcctcgta 3720ccgcccggct tcggactccc aggtgctttg ccctgtttcg tccgttccgc gctggcagag 3780agaaagttac gcgtccgagg gtttgaacgt caaatcgggg gggtagcggc ccgcgtcaca 3840tcgtcgatgt ctggctatac cgcctggtca gaccggctgc gggcacgccg ctgggcgagc 3900acgccccgga cacccagcac gccgaccgcc gtaccgatgg tcagggacgc ggcgatcagc 3960agcgcgtgga tccagagaaa gccggtaccg ccaccctcgc cgaccgtccc ggtcgaccag 4020gacctcgggt cgttccagat cgcgaccgcg aacctcggcc agatcgccca ggtccagccc 4080ccgacaccga caaggaagag cgcccagcca cgtgacagca ccatggccgc cgagtatgcc 4140agcgccgtgg acgcgtcgac cctgttcagg gcatcgcgcc tcggccggcg gggttaccgt 4200ggacccgtgg tccggacgag caacctcccg gcggcgggcg tcgagctgag cgacgacctg 4260cccgccggtg ccgcgcccta tccggcgtcg accaggtccg gagacgggcg tgaccgcctc 4320ctggacgtcc ttcgtgcccg tgggctccgg ttccgcgacg gcgcgcgatg gcaaccggct 4380cgctgagccc ctgctgatca ccgaccggga cgttccgtcc cgcgtcgacg cgcgcccgcg 4440aaacccccac ccgtacgaca cgagaggcgt accaccatgt ccgctgcacg gatgctcacc 4500ggcgaccgcc cgaccgggcg gctgcacctc ggccactacg tgggcagcat cgccaaccgg 4560gttcggttgc accagcgcta cgagagcttc ttcatcatcg ccgacctgca catgctcacc 4620acgaggaaca cccgcgagga catctcccgg gtcgccggca acgcccggga gatggtcctc 4680gacatcctgg ccgccggagt cgagccggac cgggccacgt tctacctcca gtccgccgtc 4740cccgaggtcg gcgacctgaa cacgctcttc cagaacctgg tcagcgtgcc gaggttggag 4800cgggtcccgt cgctgaagga gatggcccgg gccgccggca aggaggagat gccgtacggg 4860
ctgctcggct atcccgtcct ccaggcggcg gacatcctct gcgtccgggc cgacgtcgtg 4920ccggtgggcc gggacaacgc cgcgcacgtg gaggtgaccc gggaggtggc ccgccggttc 4980aaccacctct acggggaggt gctccccgta ccggagatga tccacgcgga gacgccgacg 5040ctggtcggca cggacggccg cgccaagatg agcaagagtc tcggcaacgc catcgcgctc 5100gccgacgagc cggcggtggt gcggcgcaag gtgctgggga tgtacaccga cccgaagcgg 5160gtccgggccg acgtgccggg caccgtcgcc gggaacccgg tcttcgtcta ccacgacgtg 5220ttcaacccgg accgggccga ggtcgacgag ctgaaggagc gctaccaggc cggtcgggtc 5280ggcgacgtcg aggtcaagga gcggctcgcg gcggcgctca accggttcct cgacccgatg 5340cgggagcgcc gggccggttt cgcggccgaa cgtggcctcg tcgaccagct gatcgccgac 5400ggcaccgaac ggacccggga ggaggtccgg cgcaccctgg ccgaggtgcg tcgggcgatg 5460gggctgaccg gcgcgtacca gcagatccgc cgccgggccg agcgggcccg gggcagggcg 5520ggcacgccgg ccgccgtgag cacgagccgc gcctgaggag cggcccgccg gggcacgtat 5580cctggagaat ccgtctgccc gctgccgagg agctgcgacc tgatgacctc cgcggatcct 5640gccgccccgg cgggccccac gctggacacc gcccacgggt cggtcgtcct gcccaccttc 5700ctgcccgacg gcacccgggc ctcggtccgg gcggtcgaca ccctcgacct gtcgacggtg 5760gggatcgagg cggtgatggt caacgcgatg cacctggccc agcgtcccgg gttgcagacc 5820atcaagcggg ccggcggact ccaccgcttc atggcctggg acggcgtgat cgtctccgac 5880tcgggcggct tccaggtcct ctccctgctc cgcaagcagg gcaagaaggg gtcgatccgg 5940gccagcgggg tgaccttcca ggagtcaccg agcgcgaaga agatcgtgct gaccccggag 6000aaggtcatcg agtggcagtt cgggctccgc tcggacgtgg tggtcgccct cgacgactgc 6060accggcccgg aggactcccc ggccgagcag ctcgcctcga ccgagcggac gattcgctgg 6120ttccggcagg cccggcaggc gtacgacctc cagtgccggc agcgccggat ggccgagccg 6180ccgctgctgg tcggggtggt gcagggcggc accgacccgg aactgcgtca gcgctgcgtc 6240gacgccctcg ttgagtccgg cgcgcagggg ttcgggttcg ggggctggcc gctcagcgcc 6300gagggtgagc tggagcgcga gatgttcgct ctgctcgccc ggatcacccc gcaggacgcg 6360ccgttgttcg ccctgggggt cggccggccc gagcacctgg tctccctctg cgagctggac 6420atgcgttggg tcttcgactg cacgatcccg acccgggacg cccggcacgg ccggctctac 6480gcgttcgtgc cggagatcgc cgaccggctg ctcaccccgg accggagctt ctaccagaac 6540gtctacatcc tggacgagga gaactcccgc aaggacgagc cgatctgcgc gacctgtgac 6600tgcccgacct gccggcggta cagccgcagc tacctgcacc acctcttccg ggtgaaggac 6660ggtctggcgg accggctcgc caccctgcac aacctgcgct tctacacccg gttgctggag 6720atgatccggg ccgggcggat ggcccagccg ggcctgcgcg agccggcccg gctcgggtga 6780ccggccggtg acgtcgaccc cgccgggcct ggtgccggcc ggtgaaccgg caccggccac 6840ccggccggag ccggagtcgg ccatcctgcc ggagccggcc gcggccgtgc cgtcgccgcc 6900gccggagtca cccgccgtgc agaaggtgat cgcccggctc accgccgcgg ccaagtaccg 6960tgacgtgcac ccggagaccg tcgccgacct ggtccggcgg gagggtcggg ccaccgggga 7020cgccgccgag ctggaacggc gggtccgggc ccggctgcac aaggtcgccg ccctgcacct 7080gctcaccgcc cggccggcgg cgctgcgcaa ggcgctggac cgggccgacc tcgacgaccc 7140gcagtcccgg cgggactggt gccggcaggt gctggccggg cacttctcca ccgccgaacg 7200cctgcccgac ctggacacct tctacccgac cctgttcggg ctggtgccgc caccggagac 7260ggtggccgac atcgcgtgcg cgctgaaccc gttcaccctg ccctggatgc gggaggtgag 7320cgacgcccgc tacgtgggct acgacttcaa cgcgacgttc gtggcgctgg gcaacgcgtt 7380tttggcccgg acctacccgg agagcgagat ccggcacgag gaggtgctca ccgacggtca 7440ccaggtgagc gcggacctgg cgctgctgct caagacgtac cactgcatgg agggacgccg 7500gcccggcgcg gggctggcgc tggtcgaccg gctggcgtgc tggcacgtgg tggtgtcgtt 7560ccccacccgg gccatgaacg gccgggcggc ggtcttcgtg ccgcgccacg tcgaggaact 7620
ggccgagttg gcccgcgacc ggggttggcg ctggtcgcgg gccactctgc cgtcggagga 7680cctggtggcg atcgacaagg ggtgaccgcc ggggtgcctc agtcctccca gaggcgctcg 7740acgatcgcgg tggtctcctc ccgggtacgc ggccggtcgg ccagaccgtc catcgccccc 7800caggcgctgg cgtaccagga ctcctcggtg agttcgcggc cggtgaagag gccggcgagc 7860gtggcggcca cctggtcgat ccgtccgcac gcgtcctcga ccacctcgtc ggtgaacgcc 7920gtcgaggggg tctggttgtc gccctcgaag aagagcagcc cctcgtccgc cgcggcggcg 7980tggaaggcgt cctgcacctc gtcgtcggcg cagacgaact ggaagaggtt gccgttgccg 8040gcgaggtcga tcgggacgcc ggcgccgacg aacgccgcgc gggtgtgggc gatgaaccgg 8100tcacccgcgg cccggatggc ctgctgcggc tgtccggtcg ccatccgccg cagggtggtg 8160gtcgcggcgg cgagcgcggt cggctcgaag tacgaggtga acgaaacgtc ctccagcgcg 8220gcgagcaggt gggcgtcccc gcccaccgcc gcgaccgggg agccgttggc caggcacttc 8280gccacgatcc agacggccgg gtcgagcagg tgggtggaga gcccggcccg gtagcggagg 8340ccgaccttga cctcgtcggc gatgaccggg acgtccgcct ccttcgtcag ccgggtgaac 8400tcggtgtacc agcgctcgcc gaggtgcatg tggtccgggg agacgaccac cgcggccacc 8460tgctccgggc ggctgagcca ctcggcgagc acgtcgaggt cgaagaggaa ctcgacgacg 8520ccgtgctggt tgggggcgaa gggctcgtcg cagtgccaca tcgggtcgta cccgtggtag 8580ccggagctga ggatgatcga ccgttcccgg gcgtcccgga cggcgcaggt caccgagcgc 8640agggcggcgg tgccggtgcg gtagagaccg accacgtcgc cgccgcacac ctcctgcaac 8700tggccgagca gggagtcgag caccgggctc caggcggtgc ccaccccgga gcggccccgg 8760gcggcgcggg cgatcgcctc ggcgacctcc tcgtcaccgt gaccgaggat gaccgagcca 8820cgggcgttgt cgaagtcgat ccaccgccgg ccgtccgggt cggtcaggta cgcgcccgat 8880ccctcgatga agacccgggg acgtccgtcg gcgtcccggg ggcaggtggg ttcctgggcc 8940agcagcttgc cggcgccgat gtcgatggtc atgcactccg ctcgattcac tctgttccga 9000caggtgggga ggagaggtcg ggttcgatac cgaactcccg gcgcagcagc tggtgggcca 9060tccgcagggc gagggactgg atggtgaggg tggggttgac gccgcccggg tagggcatga 9120cgccgccgtc gaccaccatc aggttgatca ggccgtgcac ccgcccgtcc gggtcagtga 9180ccgaggtccg ggggttggtg ccggcgcggc aggtgccgtg caggtgggtg ctgcccatcc 9240agaagtacga cgattcgcgc caggtcagct cacagccggc ggcccgcagg atctccacgg 9300cccgccgctg gaggtactcc aggcgggccc ggtcccaggg gtggggcgag tagtccatga 9360ccacgtccgg caggccgaac cggtcgacgc cccggccgag ggtcacccgg ttgtcggccc 9420cgggctggtc gggcaccagg cactcgaggc ggatgatctg ctcgtcgggg cgcagccgga 9480gggactcctc cggttgggac tcgatgatca gcccaccgag gccgccgggc gcgtcgtcgg 9540cggtgtagta gtcggtgatc gcggcggtgg agaaggggcc gggaccggtg acccggtcct 9600cgcgcgaggt cgtcggcacg tcggtccgcc ggtagccctg gacgtacccg ctcatcttga 9660agcacaggcc ccggccgacc atgtcgtggc cgttgcccag gccctgtggg ctcaggtcgt 9720cggtggagcg cagcagcagg gcggcgctct ggatggcgtt gccggcgacg accacgtggc 9780gggcccggat gacgtgccgg ttgccgttgt ccacccggac gcactcgacc ccgtcgacgc 9840tggtggcgtc ccggcggagc agccgtacgg ccttcaggcc ggcgaagagg cgcagtccgg 9900ccttgcgcgc cgggtcgagg aagacggtga ccgcgtcacc cttggctccc cggtcgcacc 9960ggttggagat gcacgggcgc ttcccggcgc acgccagccg cccctggtag ggctcggagg 10020cgatggccag cggggtcggg aagggattca ggccgaggga ccgggccgcg gccgcgatca 10080ccgcgccctc cgcagtggtc tcgaccggcg gcatcgggta cgcggggtcg ctcggcaggc 10140tcgggtcgtg cccgccaccg gcgatgccga gcgccgactc caccagcgcg tagtaggggt 10200cgatctcctc caccgtccac ggccagcgca gcggcaggtc ggagcggccc agccgggcct 10260cggcgtcgaa gtcgaccggg cggtagcgga aggccgcgcc gccgaagaag accgttcctc 10320caccgacgtt gcaggtggac caggggttgc cgctcttctc ccagacgccg ctgtcctgac 10380
ggatccaggc ggtctcggcg atcgtctcga cgtcgtcgta gctcacccag ggatccacga 10440agggtccctg ttcgacgacc acgacgtcga gaccggcacg ttgcagggcc cacgcggtga 10500tcgcaccgga ggcgccgctg ccgatcacac agacgtcggc gacacgggcg gtgtcgtcgg 10560cggtcggctc cgggccgtac cgcagccggg ccgtgacgtc ctcgtgaccg gtactgaggc 10620cggcgaaaac gctgatgaga acctcccggg ttgggcctgc gtgccggccg gccgcttggg 10680gtcccgacgg gaccgaccgg tcactggggt tggccgtgcg ggggtgcgcc gacggtcacg 10740ggctcggccc gcagcgcgtc ggggggttgc cggacggtga gcacctggcc ggtggtcccg 10800tgccggcggg cggccgtgac ggcccaggcc accagccggg cggcggccga ggtgtcgtcg 10860ggtgcctccg ggccgcccat gtcggtgggg atccagcccg gatcgaccgc gttgacgacg 10920atgtcctgtt cgcgcagggc gacggccagg ttgacggtca tgatgttcag cgcggccttg 10980gacatccggt agccggtcgc ctccccgtcg gcggtggccg gatcggcgtc gtccgcggtc 11040acgttgacca cggcggcccc gcccgccgcc cgcagcaggg ggagcacggc ccgggtcacc 11100agcagggggc cgacggcgtt gacggtgagc agctcgtgga cggcctcggc ggtcacgctc 11160tccaggtcgg cgtcgcgttc gtcgaggaag accccggcgt tgttgaccag accggcgagg 11220cgcccgccgg tgtggtcggc gaccaggtcg gccgcggccg cgatgctcgg cggagaggtc 11280acgtccaggg gtacgtggac ggcccggccg ccccggcggc gcagcgccgt ggcggccgcc 11340gcaccccgcc ggtcgtcgcg gcacccgagc aggacggacc agccggcgtc ggccaggagg 11400gtcgcggtgg ccaggccgag gccccggttt ccaccggtca ccaggacgtg acctccggcc 11460ggcgtggtgt ccgggctcgc cggggcggtg ttcatactcc gctgcccggt cacttcccgc 11520tcgccgcccc ggccccggtg agggcggcgc ggtagcagtc cagcatccgg tcccgggtgg 11580cggcgacgtc gaaggtgctg gcggtgctgg tctgcgcggc gtggatctgg gcgaccaccg 11640catcccggtc ggccagcaca cgccggacga cctcggcgag tccgcgcacg tcgccgggct 11700cggtgagcag gtcggggcag gccgagccga tggtgctgcg cagtcctccg accgcgtagg 11760cggcaaccgg ggtgcccgcc atgatcgctt cgatcgcgct gccgccgagt tcctcgtgga 11820tcgagggcat gaccagggtg tccaccaggg cgagcgcggc cggcacctgg tcgtgcggca 11880ggaagccggt gaccacgaac tggtgggcgc ggccaatctc ggcgatctcc ttctccatcc 11940gctcccgctg cgggccgtcc ccgacgacga ggaaggtcgg ggagaggtcg tccaggagtt 12000cggccagtcg gagcaggtcc ggccagcctt tctcgtgggc gacccggccg atgtacccga 12060tcagggggcg gcggccggtc aggccgtacc gctgggcgaa cgccgtcgtc tcggcctccg 12120tcgccagggt gatgtcgacc gcgtccgggt tgaccacgat ggcggaccgg tccaggccgg 12180tcgcggcgct caccacgtcg gcggtccggg cggtcagggt ggtgacccgg gtggcggagc 12240gcagcgcctg ccgttccgcc tgcgtgacga ggcggtgtgc catggcgtcc accgtcgaca 12300tgggctggta gacggagagc cgggaacagt gcagggtgag cacgtacggc acgcccagga 12360tccgggcggc gatccgaccc gcgaccagcg gccagatctg accgtcggcg tgcacgtgga 12420cgaggtcggg ccgccagtcg ccgcgacgca gccggaggca ctcccggatg gttccgatca 12480gccacgcctg acccaacccg accaggccgg tgatctcgga gcggatttgg ggcagggaca 12540tccgggcgat gcggacggtc aaccccggct cgatctgctt cgtcggcggc aggccgggaa 12600agcccagggt cagcacgagc tggtcgacgc ccgccctggc caggctgcgg gacaacgcca 12660ggatctgcac ctgcataccg cccaccggat cgaactcggc cggccagtgg tcgacgtagt 12720cgtggtggaa gaagggagtc aaccgaagta cacgcacgac gccatccgat tctcccggaa 12780gagtggcgaa aagctatttg tgaataacgt aaatcagctc gttgccgatc tccagtcgct 12840gaatgcggca cgatcgttcg ctagcctggg actcaaaact ctgtgaatag ttctgaaaca 12900tccccttcga tcgctgaccg agagacttgg tcgggaaggt taccacgata atcggcgagt 12960tgacaatgtc aatcacttcc cagccggagc ctcgttgctg agtctccaga caggggagcg 13020tcttcagcaa tagcgtgacg tcggccggct cgtcaaggcg ggcctcaagg aggtcgacca 13080cgctcgtacg gtacgccacc cccagcctcg tcagggcagc gcccacgaag tccatcaggc 13140
gggcgtcgat gtcggaggcg acgtagacgg tctcgtcgga caggcccatc cagggcacgg 13200ccagcgggtt gaggccacac gccaggtcac gcaacgtgtt cggccgtggc acgtgacgga 13260agatctcccg gtagaactcg tcgaggtgcg gcagccgctc tcgggtggac atgtgcaccg 13320acatcgcgcg agacagggac gaacggaccg cctcgtcgtc accggcctcc actgcggcgt 13380cgaggtgccg cagcaacgct gtgtagttag gcgcactggg cggcagaaag gcgccgtaga 13440tctcgtgcag cccgcgcttc gtgcgcttca ccgcgtccgg cacgtccccc cgcgaggcga 13500ccagggcggc ccgggccagg cgacgcacgg tggccggggc caccgtctgg tagcgccggc 13560tcttggtgat ggcctgctga atctggtcga tacggtcgtc gcccgtagat gtcgtcatcg 13620agtcctccga agaatcctga accggtagcg aagcggaaat attccccgcc gatacaccgg 13680cccgcatacc aagagctatt ggtctgtcta ctgtgggttg ttgctggggc attacggggt 13740aaatctggag cacccgcgac cggtaccggg cagcgtccat attggtcgcc gtgtcccgca 13800agcccggctt ggccggtttt tgcacgtcga cactggtgat tgcgtctggc atacttggcc 13860gagcccgcga tctaccggtt gccgcagtct ggcctgggaa ggacgtgaaa gtgacccttc 13920ttgctgtcaa tggtggttcc ccgatacgtt cgcagcagtg gccgttgtgg cccgctcctg 13980cgcccggcgc cctcgacgca ctgaatgagg ttctccattc cggtcgctgg gccatcagcg 14040ggccatacca ggggaagcag agcttcgagc gacgattcgc ggcggcattc gccgagttcc 14100acgggatcgg gcactgcgtg ccgacctcca gcgggacggc cagcctcatg gtcgcgctcg 14160aggcgtgcgg ggtcggtgcc ggtgacgagg ttatcatccc gggcctgacc tgggtcgcca 14220acgcatccac cgtcaccggg gtcaacgcgg tccccgtccc ggtcgacgtg gacccgcgga 14280ccctctgcct cgacccggcg gccgtcgagc gggcgatcac ttcgcggacc gcagccatcg 14340tcgtggtcca cctctactcc gccgtggcgg acctggacgc gttgaccgcg atcgccgagc 14400ggcacggcat cccgctgatc gaggactgcg cgcaggcgca cggcgcgcgc taccgcgacc 14460gtcgggtggg taccttcggc gccttcggca ccttcagcat gcagcacagc aaggtgctca 14520ccagcggcga gggcggtgcc gtcatcaccg gggaccccgt actctcccgc cgggccgagc 14580acctgcgggc ggacggccgc acctacacgc cggacgagcc cgccgtcggg gagatggagc 14640tggcccagac cgcggagctg atgggcagca accggtgcct gtcggagttc caggcggcgc 14700tcctgctcgg ccagctcgaa ctgctcgacg agcagaacga gcggcggcgg gccaacgcgg 14760ccctgctcga cgagggtctc ggcgcgatcg gcatccagcc ccaggtctcc tcgcccggca 14820ccaccgagcg cacctactac gagtgggccg gtcggatctc cgacgacgag atcgggcaga 14880tcggcgtcga gcggatcgcc ccggcggtcg ccgccgagct ctccggcgcg gccatctacg 14940ccagctaccc cccgatgaac cacaaccggc tctaccggcc cgccacccgg tcgcggttca 15000acggcgtccc gggactcgac ctgaccggcc actcgctgcc ggtcgccgag gacgccggtc 15060aacgggtcgt cacgatccac cactcggcgc tgctgggcga cgagtcggac atgaaggaca 15120tcgtccgcgc cttcgagaag gtgttcacga atcaccgaga actgcgcggc tgaccaccag 15180ggccggacgg ggaggctccc cattgacccc ggccccggca gttgcgatcg ggagccccga 15240ccccgaggct cccgttggga agggccccat ccaagggttg taaggacccg tgacgaaggg 15300taagcgtatg gaggtcgaga tacgcctggg cgcggttcgg tatccgttcc ggctcggcac 15360cgattgtctc ggtgccatcg tggaggacct ggtcgcgatg tcggccagtc gactcctgat 15420cgtctgcgac agcaacaccg gtccactgtt cggcgcggaa ctggtcgaac gtctctcccc 15480acgggttccg gcgaacctgc tcatccaccg agccggtgag ccgtacaagg atctccaggc 15540cgtcagcacg ctggccgagt cggcgctcca gctcggcgcg gaccgcgcct cggtggtggt 15600cgccgtcggt ggtggcgtga tcggcaacat cgcggggttg atggccgcac tgctcttccg 15660cgggatccgt ctcgtccacg tcccgacgtc gctcatcgcg atgtccgact cggtcctctc 15720cctcaagcag gcggtcaacg ccagcgtggg caagaacctg gtcggcacgt tctacgcgcc 15780ggagtccgtc ctggccgaca ccgccatgct gcggagcctg ccgttccggg agacggtctc 15840cggtctctgc gaggtcgtca agaactcgct ggccatccgg cccagcatga tcgagatgct 15900
ccggacgtcg ctgcggcagg acggctgcta cgacgacgag accatgtacc agatcatctc 15960ggagagcatc ctggcgaagg cctcggtgac cgaggacgac atgcacgagt gccgcgccgg 16020cctcgtgctg gagtacggcc acacggtcgg gcacgccatc gagtacaccg cctccggtgg 16080gctctcccac ggccaggcga tcggcctcgg catggtggtg gccgccgagg tgtcccgccg 16140gctgggtcac ctcgacgacc gggccgtcgc actgcaccgg gagctgctga cccgggcggg 16200cgcgatggtg accatccccg aggaggtcga ccttgacgag gtgatgcacc ggttgcggtt 16260cgacaacaag cgcggctacc tcagcgaccc ggccgagagc agcgcgatgg tcctcctcgg 16320tggactgggc cagccactgt ggcaggacgg ccgtccactg gtctccgtcc cgatggccct 16380ggtcggcgag gtcatcaacg agatcgcctg cccggagatg ccgaacttcg agctggtggc 16440agcggctcag ggcgagcggg tgccggacac ggtgggtgct gccgatggtt gagcgtctgg 16500gtgtcgccgt cgtcgggggc gggttcatgg gtggcgtgca cgccgaggtc ctcaccgccg 16560atccccgggt ggatctgcgc tgggtggtgg accgcgacga gcgcgtcggc acggaactcg 16620ccacccgctt cggcgcacgt gccaccgcga ccctcgacga ggcgctggct gacgacgcgg 16680tccgcctcgt ggtggtggcc actccggccg ccacccacga accgatcgcg gcgcgggtga 16740tcgccgcagg ccggcacgtc ctggtggaga agccgctcgt gctctccacc gggcacgccc 16800ggcagttggc cgccgcagcc cgcgaacgcg gggtgacgct cgcgcacggt ggcaacttcg 16860tctacgcgcc gaagttcgtc cgggcccgcg aactggctgc ggaccgggac gcgctgggca 16920ccgtccactc cgtccgggtg gcgttccgga cgtccggccc ggacaccgac tggttccggt 16980cgaaggcgac cgccggtggc ggtgccctca ccgacctcgg ctggcacgcc gtggagctgt 17040gccgctggat gctcggcaag ccggccatcc ggtccgtcgc cgcctgcacc cgccagctca 17100gcgccgcggg ggacgtcgag gaccagggcg tcgtcctgat cgagttcgcc gacggcgcga 17160tcggtcagtg cgacgtctcc tgggtctgcc ccggtggtga acagctcacg gtcgaggtga 17220tcggcacgga gggtctggtc accgccgacc tctggcaggg catgggcgtc gaggtgtaca 17280ccaacaccaa gttcggcgcg gtgtgggagc ccaaccaggg gtggctgcgt cctgagtggg 17340agtggatccg caacagcgga tacgtgcacc aggaccgtca ggtcgtggac gcggtgctcg 17400agggccggcc gatggagcac accccggacg acgcagtcgc gatcgtcgag gcgctcgagg 17460cggcctaccg cagcgcggcg gacggacgga aagtggagac gaatgcctga caaccgtgcc 17520ccccggggcg tcctctcgat gacaccgttc ttcctctacg ccgaccacca gaagctgtgg 17580aagccacggt tcgacccgat gggcggcatg cacgtgttgg gccacgcgat cgtgacggag 17640atgggccggc ggggcttccc gcaacgggtc ctcaccatgg ccccacccgg cgtcccgaag 17700gacctccaga tcgcgccgaa cgtcaccgtg cacgcccggc gcctgccggt gttgccgatc 17760ccgtccaagc tggagggtta cttcggcctg gtcggggcgt gggcgaaggc cagcctgctc 17820tacgtggtgc gtaacaagga gcaactcaag cgggagatcg ggatcgtgca cgcgcactgc 17880gacggatccg gctcggcccc ggcgtacgcg tacgccgcgg cgcaggtcct cgacgtgccg 17940atcgtgtcgc acatctactc atgccggtca ctcacccagc gcccgaccac ggtgttcgag 18000cgggtggccg acccggtggc caagtcggcg gagaagtacg tcatccagca ctccggtgcg 18060gtgctgaccc tcagcgacaa ggtccgcgag cgcatccggg acgagctgca cgtgccggac 18120gaccgggtgc accggttggc acacctggtc accgacaact tcgtcgggca cgacacgccg 18180gagcgccggg aggaactgcg gcagcggttc gggctgaccg acgacaagcc gaccgtcctc 18240tacgtgggcc ggatctcctc ggagaagggc gtcgactggt tcgtcaaggc cgccgccgag 18300attgccaagc ggcgggactg ccggttcctg atcgccggtg acggaccgca gcgcggtgac 18360atcgaggcgc tggcgcggca gctcggcgtc gccgacaagc tggtcatcac cggcttcctg 18420ctccccgagt acatcccgtc gatcatctcg ctctcgacgc tcgccgtcct gccctcgcag 18480tacgaggagc tgggcgtcgt cgtgctcgag tacatgatga tgaagcgccc ggtcgtggcg 18540cacgacgtca gcggcgtaca caagctagtc gagcacatga agaccggcgt gctggtgccg 18600cccttcgacc ctccgaagct cgccgacgcc atcgagatgg ttctcgacga tccggacctg 18660
gcccgtcgcc tggcggacgc cgccgagccg attcctcagc gggagtactc gctggcctcg 18720gccggtgaac gtctggaggc gatctaccta tccctcatgg aggagtcctg agatgaccgt 18780cactaacaag atcgtcaccg gtgtcgcctt tccaccgtcg ctgttggcgg agaccccgcc 18840gatctcggtg gcgacgctca cggcctatct tcgcgacaag ggcatgccgg cccgtggcct 18900ggacctgaac gcggacttca acgagtacct gctcaaccgg gtcgagctcg agcaggtaca 18960gggcccggag aacagccacg agttcaccca gcccttcatc aagcagttct tcctgaacca 19020catcaccggc aactacttcg ccgagacgaa cttcgagcag tgggaactgc agcagcagtg 19080ccaggtggct ccggagagcc tctccatctg ggacccgccg ttcccgttct cgtactgtga 19140gttcctgtcg atcctgcggg acgagccgga acgcgtcgcg aagctggtcc gggacccgga 19200cgcgaacatc taccacgcct tctaccacga gaaggtcgcc ggccaggccg ccgagctggg 19260catgatgggc ttctcgatca tggggtacaa ccaggtcatc cccgcgctga ccctgggcta 19320cctgatgaag caggagaacc cggacctcta catctgctgg ggcgggccct gggtgacctc 19380cttcgcggac atgctcatcc cgcgtctgga ggcctgcccg gagctgggcg acctgatcga 19440tgcgctggtc gtccgggagg gcgaggagcc gctgctgaag atggccgagg cgttgtcccg 19500cggcgagcgt ccggtgggca tccccggcgg ttgcaagccg atgtcggagc agagcgtgct 19560cgacaccaag ccggtcgtcc gcaagctgct gctggagatg tcgaagcccc gggaaaacgt 19620cccgaacacc cactggcgga ccgaggacgg cacctacgag cgcagcggtg acatctcctg 19680ggtcgccgac atgaaccaga tcccgacccc ggactacagc gacttcgacc tgtcgctgta 19740caccacgttc cgggagggtc agggcagcct ggtgctccag ggctcgcggt cctgctacta 19800catgaagtgc tccttctgca acgcgatcac caacttcgcg ccgtggagct accgggagcg 19860cagcaccgag aacatcgaga aggacatcga caccttcctg gagctgtacc cgggcgtcgt 19920gcacttcgac ttcgccgacg cggtcttccc ggccaagcgg ctggtcgaga tcgccgactt 19980cttcatcgag aagaagcgcc cggagctgtt ctgggaggtg gacgtccggt tcgagggcaa 20040catcgacaag gccgtcctga ccaagatgcg cgactcgcag ggcaagctgc gcttcggcct 20100ggagaccgcg aacgaacgcc tgctcgacct ggtccggaag ggcaaccgga tggacgtcgt 20160ccaccggctg ctccaggaca gccgggaact gggctacaag ccgttcctga tgaccatcgt 20220cggcctgccc accgaggagc ggaacgaggc cgaggagctt tacgagttcc tcagcgagta 20280ccacgacacg gtgacgtacc agatcgccga cttcatcgtc gagcggaact cgccgatcca 20340gctccgcccg gacgagtacg gcatccacat cgaggacgac gaacagcaga gcttccacca 20400caacctgcgc ttcacccgtc gcgccggcta cagcgacgag gaggcgcagg aggtgtaccg 20460ggacatcctg gtccgcacca tgcagcggtt caagggtgcc cgtgaggtgg acgtggagca 20520ggagcggagc cgggtggccc cggacgactc ggtctaccga ctgagcctgc gggccggctc 20580cttcgcattg gagaactact gggtgaagca caacaacctg ccgttcgagg gcctggtgcc 20640catcggctac aaggtccagc agcagtggac cgacatgacc aacaagggca cggtcttcga 20700gatcgacccg gacatcgccc tcggggccct cgccggggca ggtagccgct gatgacggag 20760aaactggcca ttctcggtgg cgacccggtc cggcagcggc cctggccgga gtggccgcac 20820gtcggcccgg cggacgtgga gcggctccgc ggcgtcatcg agtcccgcaa cctcggcggc 20880atccccttcc cgaacaccat gcaccgggag cagttcgccg agcggttcac cgccaagctc 20940ggggcgaagt acggcctcct ggcgaccaac ggcacggtga ccctctcgat ggcgctgcgc 21000gcgctcggga tccatgccgg tgacgaggtg atcaccaccg ccttcacctg ggtcgggacg 21060gtcgccggca tcgtgcacgt caacgccgtg ccggtgctgg cggacatctc cgacgacaac 21120tggtgcatcg acccggtgaa ggtcgaggag gcgatcaccg accggaccag ggcgatcatg 21180gtggtgcacc tgggcaacca ggtcgccgac atggacgcgc tgctggacat ctgccgccgg 21240cacaacctgc tgctcatcga ggactgcgcg cacgcgcact tcgcggagtg gcggggccgg 21300tgcgtcggca ccatcggcga cgccggcagc tacagcttcg agaccagcaa gatcatgacc 21360tcgggcgagg gtggcttcct ggtcaccgca accgaggagg cgttccaccg ggcgatgtcc 21420
ctggcgcacg tcggccgcaa ggaggccccg tacgacaggt tcccgggccg ggtcttcggc 21480tggaaccacc gggccaccga gatgcaggcg gccgtcctgc tggggcagct cgaccggtac 21540gacgccctcg acaagcagcg gaccgcgatg gcggagatgc tgacccaggg gctggtcgag 21600atcggcggct tcaagccgct ggcggaggac ccccgggtca cccgccggca gcgttacgag 21660ctgctcttcc ggttcgacac cgaggcctgg gacgggctcc accgggacaa ggtgctggag 21720gcgatcctcg ccgagggcgt cgagttcgag gggaacacct tctacccgcc gatgcaccgc 21780gacgagctgt tccacatcac cgccgacgac tggccggcga tccgggagcg ctacggcgag 21840aagatcgagc cggacgcgtt ccacctgccg gtggcggagc gggtggcctt cgacgaagcg 21900gtgtggatcc accactccct gctgtcggtg gagccggagg acgtacagga catgctggat 21960gcggtggtca aggtccggga caatctgggg gcgctgaaga agagcctatg atcggatcat 22020ggctctgacg aagctcggtc gggcggacac cccgcccgac cgatccctcg aaacattccc 22080gatcggcgac agctcgcagg agatcaccat cgactgccgg gagttcacct gccgctgccc 22140catcaccggg cagccggact gggcgaccat ccggatcgaa taccgtcccg gcgaccgggg 22200agtggagacc aagagtctca agctctacct ggagaccttc cgggacgagg ggatcttcca 22260cgagcacctg gcgacgaaga tgcgtgacga cctggtggcg gccctcgaac cggtcttcct 22320caaggtcacg gtcgacttca acgtccgggg cgggatcgcg ctggcagcgt cgagcacgta 22380ccagcgctga ctcccagaac gcgacgaacg gcggcggccg tggttcctcc gggaaaccac 22440ggccgccgcc gtttcgtgct gtccgggtcg gttctgcccg ggtcagttct gtgccgggaa 22500gaggaccggc ttgatgctgc ggtcccggtt gaccaccttc tcgatggtct cgtcgatcaa 22560cgcgttcgtc cgctcgtcgt cacgcagcag accaccgaag gcctcctccg cgaagtccag 22620cttccgctcc tccgtcaact caccacccga cgtcggcgcg atgtccggcc gatccgcgac 22680cacctgacgc gtcgccttcc ggaacgccgt caacgcgtgg tccaccgccg cctcgtcgaa 22740cgccgccgtc accaactgcg tcccggaatc ctcgaagtac accccgaagt cgtgcgccgt 22800cttgtagatc tcccaaccca gatcgtcatt cggcaacacc acgtcgaaca tcagggccgg 22860gccacccacc cagttcggaa tcccctcacc ggtgaggatc tcgcgcatac cgtccgccag 22920ccggcgaccc atcgcctccg cgtgctcgta cacacccggc gtgtccagca cctcgaacac 22980cgcgagcgcc gccgccatcg gcggcacctc ccgcgtgtac gtcccctgga tccccgacac 23040gtcatacgca tcgatgatgt cccgacgacc catcaccgcc gccaacgaat gaccgttcgc 23100cagtcccttg ccgagtacga cgacgtcagc cggcacaccc aacccgtgca cgcccttcgg 23160ccccgcccgg aacccggtgt acacctcatc caacatgaac ggcacgtcat accgcgcaca 23220caacgccgac atccggcggt agtgatcgag gtcgaagtac aggacctcgg gcgagacgat 23280gacgccggcg acctgctcac cgaacgcctc cagcatcttc gccagggcct tctcgttgta 23340cccgaaaccc accacaccgg tggactgctg gtacccgaac tcctccccgg ccatctgcca 23400ctcgtgccag ccgtggtagc cggacgacag gaccaactcc cgacccgtcg ccgctcgcgc 23460caaccggacc gccatcgccg tgccctcggt accagttttg tggaagacga ccttctccgc 23520acactcgtac cgctcacaca tccgctccgc cagctccacc cgcggaaccg acaacgtcga 23580cgcgaacgtc gtaccgtagt cccgaatctg ccgcgtgatc gcctcattga ctgccggatg 23640acggtagccg aggatgacgg cggcatcggc gccggtcagg tcgacgtaac ggttgcccga 23700caggtccgtc atccaggcgc cctcggcgtg cgcgatcacc gacggatagc gccccgagat 23760gtcgtactcc tcggccgcgg tcgtccgccg ggcccgctcg atcaactcac ggtagttcat 23820gtgcccacca cgccattcac gtctcccggg gtcggacgcg gccgcccggg tcagctcaga 23880gaaattcgtc cagcagttgg atgtaggtca gcttgtgctg gtcgacggtg atgccgtacc 23940gccggaggaa gtgctcggcg tgcggcggac cgtagcccca gacgtcgtcc tggccgatgt 24000tgtacagcgc cagggcgagg tccatccacc ggtccgacac cccggcccgg tcgacgtcga 24060ggatgccggc cagggtcagc gtctccggat cgaccagcac gttgtcgagg cagaagtcac 24120cgtggcagac gacgaggtcg tcctcggccg ggggtgtcat cttgctcaac tcgtcccaga 24180
gctgctgagc cgtccagccc tcgtgcgagg ggtccacgtc gtcgaggtcg agcgcgccca 24240gcgccatcga ggagctggcc tggtggatca ggtcggccag ccgacgctcg aacgggcact 24300ccgccaccgg aagcgcgtgc agcgtacgcg cgacgtcggc gacgacgtcg atcacccgcc 24360agcgttcctc cggtttccag tgccgggcgg cgggccgccc gggcagcgcc ctggtgacca 24420cccacgccag ctcgtcgttg gcatcgaggg ccaccacctc ggggacgggc agcccctggg 24480cggccagcca gcggagccgc tcggcctcct tggtcgggtt gaaccggtgg tcgtcagggt 24540gcctgggcgg cgtggtcttc acgtagaagg agggaacctc ccccacgcgg tagaccgtcg 24600cgccggacga acgctcgccc aggcactccc acgggtcgtc cttgtcgccc cagccagcca 24660ccggtatcgg tgctgcaacc atcttcaccg gccctgtcgt tcctacgcca gggtccgggt 24720cagttctggg cggggatgag aaccggcttg atgctgcggt cccggttgac caccttctcg 24780atggtctcgt cgatcaacgc gttcgtccgc tcgtcgtcac gcagcagacc accgaaggcc 24840tcctccgcga agtccagctt ccgctcctcc gtcaactcac cacccgacgt cggcgcgatg 24900tccggccgat ccgcgatcac ctgacgcgtc gccttacgga acgccgtcaa cgcgtggtcc 24960accgccgcct cgtcgaacgc cgtcgtcacc aactgcgtcc cggaatcctc gaagtacacc 25020ccgaagtcgt gcgccgtctt gtagatctcc caacccagat cgtcattcgg cagcaccgta 25080tcgaacatca gggccgggcc acccacccag ttcggaatcc cctcaccggt gaggatctcc 25140cgcataccgt ccgccagccg acggcccatc gcctccgcgt gctcgtacac acccggcgtg 25200tccagcacat ccaacaccgc catcgccgcc gccatcggcg gcacctcccg cgtgtacgtc 25260ccctggatcc ccgacacgtc atacgcatcg atgatgtccc gacgacccat caccgccgcc 25320aacgaatgac cattcgccag acccttgctg accaccacca cgtcagccgg cacacccaac 25380ccgtgcacac ccttcggccc cgcccggaac ccggtgtaca cctcgtccat catgaacggc 25440acgtcatacc gcgcacacaa cgcatacatg cgctggtaga actcgacatc gaagtacagc 25500agctccggcg agatcagcac cccggccacc tcgttaccga aggcctccag catcttcgcc 25560agggccttct cgttgtaccc gaaaccgacc acaccggtgg tctgctggta cccgaacgtc 25620tcgcccgcca actgccactc gtgccagccg tgatatccac acgacaggat caactcacga 25680ccggtcgccg cccgcgccag acgagccgcc atcgccgtac cctcggagcc ggtcttgtgg 25740aagaccacct tctccgcaca ctcgtaccgc tcacacaacc gctccgccaa ctccacccgc 25800ggaaccgaca acgtcgacgc gaacgccgta ccgaaatccc gaatctgccg cgtgatcgcc 25860tcggtcaccg cctgattccg gtgaccgagg atgatcgtcc cgctggaggc ggtgaggtcg 25920acgtaacggt tgccctcgac gtcggtcagc cacgcgccct cgcccgactg gatcatcgcc 25980gagaagcggg tcccgatgtc gtagttctcc gctgcggtca cccgacgggc ccgctcgacc 26040agcccccggt tcgtcaagtt ggcagaatcc atgtcctggc taccttctct cgccgatttg 26100acccttgccc aggagtgcca ccgggatcgg cgccgggctg tccggccggc gcgccagctg 26160ggctcgctcg acctgtggtc ggcgactgcc atcagctatc cccaagggac accgtggccg 26220ccagcatata gcactgtaac tatgcgcgga atggccgaaa cagctactga cgtttagtga 26280ttttactttc cgtaacgcga cgggagcagg gcggagtatc cgccggtcaa tccattgccg 26340accagtcggc acggaggcgc tacgaggtgc gtcgaccgca tcgtcgaccc aactgcggat 26400cacttaccgt ggtttcccgg gcgaaccttc gggataatcc ggtggctgcg gttgcccagg 26460gaaacctaat tctgactgaa cagccggtac ggctcggccg aattgtccgg gacgctgccc 26520cggagacatt tttccgcatc cgccgcgaac ccatccacac ccgcccaccg ccgtcactgt 26580ccgtagccat cagccggtgc caggggttgc cgatcacggg gttgccgacg gaatccgtgg 26640tcgactttcc cgccagcttc ccggacgaca ggacaggagc ggtgggacgg gtgtggtggg 26700acgagggtca gtgggaaacc gcctcggcgg tcaccagttc ggcctcccgg cggttctcgt 26760cgagcagctc gacgaagcgg cgctggatcc ggccgatccg ctcgtcaccg gtgggccgga 26820ccatgaacga gcacccttcg gcatctccgg ccgtctgcgc tccgacctgc gcgctgacct 26880gcggctgacc gctgtacagc gcgatggccg cagcgatcat gtcaccggcg aagcggcaga 26940
actggtcggc gccggccccc ttgtcggcgt ccgcgacgtg ctgcatcacg cagacgcaac 27000ccagcgggtg ccccagtgcc agcagtccgt cggcggactc ccggatcgcc cgcacggtgg 27060ccggcagttc ctccgggctc tccgggtcga gctgcgccat gctgtgctcg accagacgtg 27120cgccggcctc cgccgccgag accggcccct gctcgcggcg ctccgccccc tcaaggacgt 27180acttcggcca cagcgccatg gcgagggtcc ccacccaggc cgtgtagagc tcgtccgcgg 27240ccaggacacc gttggcgaag gcgaagttga actggtcgaa cagggcgggg tcggtcagcg 27300ggtcgacgat gccccgggtc agacaggtct ggtagtccgg ggagccgtag atcgggtaga 27360acgggttggt ccagaactcg accccggcca gcaccaggtt gaccgcgtcc tgcacgatcg 27420cgtcgaggct ctggtcgggc agcccgacga tgatcgcggc gctcgccgtc agcccgaact 27480tctcgaacag ggcgaccccg gcggagacct tgtccagcga ggtgaacccc ttgcgcatct 27540tgcgcagccg ggccgcgtcg gtggtctcca gcccgaggaa gaggtcgtcg aagccggccg 27600agaccatgct ctccaccagg tcctcggtga gcttcacgac ggtcatcccg ttcggcaggc 27660tgagccggac gtcgagctta cggcggacga tctcctggca gatggcgtgc acccgctcga 27720tgtcgaaggt gaagttgtcg tcctccacca ggaagcggcg caccccgtgc acgttgacgt 27780agtgctcgat ctcgtcgacc acgcgctgcg ggtcacgggc ccggaactgc ttgccgaccg 27840tggcgtgcac cgtgcagaac gagcacgaga acgggcagcc ccggctggtg atcagggtga 27900ccgcgttgcc gtaccggtcg aagtcgagct ggtcggcggc cggcggcgcg agggagtcga 27960ggtcggcgac gaagggcgca cggggacgga tgtgcggcgt gccgggcgtg gcgcactcgc 28020agagcccctc gccacagcgg aaggccaccc cgagcagctc ggtcaggggc cgcccggtgg 28080cgaacgcgtc cagcagcgcg accgtggtca cctcggcctc accgagcatc accgcgtcga 28140cctcgggcac ctcgagcacg tgcgggaagg cgacggtgcc gtgctgaccg ccaacgatca 28200ccttcgcgtt cggcaggacg cgcttcgcca tccgggccag ctcgtaggcg ctctcgtagt 28260agggggtgaa catgcaggag atgccgacga cgtccgcctc gctggcggcg agggcagcct 28320cgatgcgctc cgtccgggcg ccccagtgca tgatgtgccg ccagcgcggg tggcgctcca 28380gcttggcccg ctcgatcgtg gtcaggtgct gggtgagtga ccggcatgag tagatgtgcg 28440acacgatcgg cacgtcgagg acctgcgccg cggcgtacgc gtacgccggg gccgagccgg 28500atccgtcgca gtgcgcgtgc acgatcccga tctcccgctt gagttgctcc ttgttacgca 28560ccacgtagag caggctggcc ttcgcccacg ccccgaccag gccgaagtaa ccctccagct 28620tggacgggat cggcaacacc ggcaggcgcc gggcgtgcac ggtgacgttc ggcgcgatct 28680ggaggtcctt cgggacgccg ggtggggcca tggtgaggac ccgttgcggg aagccccgcc 28740ggcccatctc cgtcacgatc gcgtggccca acacgtgcat gccgcccatc gggtcgaacc 28800gtggcttcca cagcttctgg tggtcggcgt agaggaagaa cggtgtcatc gagaggacgc 28860cccggggggc acggttgtca ggcattcgtc tccactttcc gtccgtccgc cgcgctgcgg 28920taggccgcct cgagcgcctc gacgatcgcg accgcgtcgt ccggggtgtg ctccatcggc 28980cggccctcga gcaccgcgtc cacgacctga cggtcctggt gcacgtatcc gctgttgcgg 29040atccactccc actcaggacg cagccacccc tggttgggct cccacaccgc gccgaacttg 29100gtgttggtgt acacctcgac gcccatgccc tgccagaggt cggcggtgac cagaccctcc 29160gtgccgatca cctcgaccgt gagctgttca ccaccggggc agacccagga gacgtcgcac 29220tgaccgatcg cgccgtcggc gaactcgatc aggacgacgc cctggtcctc gacgtccccc 29280gcggcgctga gctggcgggt gcaggcggcg acggaccgga tggccggctt gccgagcatc 29340cagcggcaca gctccacggc gtgccagccg aggtcggtga gggcaccgcc accggcggtc 29400gccttcgacc ggaaccagtc ggtgtccggg ccggacgtcc ggaacgctac ccggacggag 29460tggacggtgc ccagcgcgtc ccggtccgca gccagttcac gggcccggac gaacttcggc 29520gcgtagacga agttgccacc gtgcgcgagc gtcaccccgc gttcgcgggc tgcggcggcc 29580aactaccggg cgtgcccggt ggagagcacg agcggcttct ccaccaggac gtgccggcct 29640gcggcgatca cccgcgccgc gatcggttcg tgggtggcgg ccggagtggc caccaccacg 29700
aggcggaccg cgtcgtcagc cagcgcctcg tcgagggtcg cggtggcacg tgcgccgaag 29760cgggtggcga gttccgtgcc gacgcgctcg tcgcggtcca ccacccagcg cagatccacc 29820cggggatcgg cggtgaggac ctcggcgtgc acgccacccg tgaacccgcc cccgacgacg 29880gcgacaccca gacgctcaac catcggcagc acccaccgtg tccggcaccc gctcgccctg 29940agccgctgcc accagctcga agttcggcat ctccgggcag gcgatctcgt tgatgacctc 30000gccgaccagg gccatcggga cggagaccag tggacggccg tcctgccaca gtggctggcc 30060cagtccaccg aggaggacca tcgcgctgct ctcggccggg tcgctgaggt agccgcgctt 30120gttgtcgaac cgcaaccggt gcatcacctc gtcaaggtcg acctcctcgg ggatggtcac 30180catcgcgccc gcccgggtca gcagctcccg gtgcagtgcg acggcccggt cgtcaaggtg 30240acccagccgg cgggacacct cggcggccac caccatgccg aggccgatcg cctggccgtg 30300ggagagccca ccggaggcgg tgtactcgat ggcgtgcccg accgtgtggc cgtactccag 30360cacgaggccg gcgcggcact cgtgcatgtc gtcctcggtc accgaggcct tcgccaggat 30420gctctccgag atgatctggt acatggtctc gtcgtcgtag cagccgtcct gccgcagcga 30480cgtccggagc atctcgatca tgctgggccg gatggccagc gagttcttga cgacctcgca 30540gagaccggag accgtctccc ggaacggcag gctccgcagc atggcagcgt cggccaggac 30600ggactccggc gcgtagaacg tgccgaccag gttcttgccc acgctggcgt tgaccgcctg 30660cttgagggag aggaccgagt cggacatcgc gatgagcgac gtcgggacgt ggacgagacg 30720gatcccgcgg aagagcagtg cggccatcaa ccccgcgatg ttgccgatca cgccgccacc 30780gacggcgacc accaccgagg cgcggtccgc gccgagctgg agcgccgact cggccagcgt 30840gctgacggcc tggagatcct tgtacggctc accggctcgg tggatgagca ggttcgccgg 30900aacccgtggg gagagacgtt cgaccagttc cgcgccgaac agtggaccgg tgttgttgtc 30960gcagacgatc aggagtcgac tggccgacat cgcgaccagg tcctccacga tggcaccgag 31020acaatcggtg ccgagccgga acggataccg aaccgcgccc aggcgtatct cgacctccat 31080acgcttaccc ttcgtcacgg gtccttacaa cccttggatg gggcccttcc caacgggagc 31140cccggggtcg gggctcccga tcgcaactgc cggggccggg gtcaatgggg agcctccccg 31200tccggccctg gtggtcagcc gcgcagttct cggtgattcg tgaacacctt ctcgaaggcg 31260cggacgatgt ccttcatgtc cgactcgtcg cccagcagcg ccgagtggtg gatcgtgacg 31320acccgttgac cggcgtcctc ggcgaccggc agcgagtggc cggtcaggtc gagtcccggg 31380acgccgttga accgcgaccg ggtggcgggc cggtagagcc ggttgtggtt catcgggggg 31440tagctggcgt agatggccgc gccggagagc tcggcggcga ccgccggggc gatccgctcg 31500acgccgatct gcccgatctc gtcgtcggag atccgaccgg cccactcgta gtaggtgcgc 31560tcggtggtgc cgggcgagga gacctggggc tggatgccga tcgcgccgag accctcgtcg 31620agcagggccg cgttggcccg ccgccgctcg ttctgctcgt cgagcagttc gagctggccg 31680agcaggagcg ccgcctggaa ctccgacagg caccggttgc tgcccatcag ctccgcggtc 31740tgggccagct ccatctcccc gacggcgggc tcgtccggcg cgtaggtgcg gccgtccgcc 31800cgcaggtgct cggcccggcg ggagagtacg gggtccccgg tgatgacggc agccacccag 31860aacgccctac gcatcccctc gaccgggtcg gcgggcgtgc ccgccgcggt gaccagcacg 31920gccagtccca gcgccggacc gatctgctgg accgcctgca acacgctgga cgccgcgccg 31980gtcacctccg gcgccacgtt ggacatgatc gaggcggtca ccgacgagta gatcaggccg 32040gcgccgaaac cggcgatcgc cagcggaccg agcagcgagg tgacgtagcc gccgtcggcg 32100gagatctggg tgagccagat catcccgagc gtggtgagca gcgcgccgat cccggccacg 32160acgctcggac cgagcttggg taccagctgt ccgctcagga tcgcggcgac caggaccagg 32220accgccgccg ggatgaaggc gaacccggta cgcagcgcgg agtagctcca caccccctgg 32280aagtactggg tgaggaagaa gaacatgccg gcgaaggcgg ccgggaagaa cagcagggtg 32340acgaagccgc tggcccggac ccggtcggcg aacagccgca gcggcagcag cggctgccgg 32400gcccgacgct cggccaggat cagcacggtg aacaggacgg ccgccacggc gaggcaggcc 32460
aggacgaccg ggtcgcccca acccttggtc gaggtgcgga cgagcgcgta caccagggcg 32520accatcgcac cggtcgaggt caccgccccg acgatgtcga acgagccgcg ctgcggctgg 32580ctctcgcgca ggacgcgcgg cgcgagcagg agcaccagcg cgaccaccgg cacgttgatg 32640aagaacaccc agcgccagga ggcggcgtcg ctgagcaccc cgccgaggat caggccgagc 32700gtgccgccgg ccgcggcgat gccggtgtag acaccgatcg ccttgttccg ggccgcgttg 32760tcggtgaagt tgatcggaat cagcgagagc gacgtcgggg cgaccagcgc ggccccgatc 32820ccctggaggg cacgggcacc gatcagcatc tccggcgagg tcgccagacc gcagatcagc 32880gaggcgacgc cgaagaccgc cagcccgacg aggaggatcc gccgctggcc gacgatgtcg 32940ccggcccggc cgccgagcag catcagaccg ccgaacgcca gggcgtacgc gttgaccacc 33000cagaccagcc cggtggcgct cacctcgagg ctctgctgga tctgcggcag ggcgacgtag 33060accaccgtcg agtcgaggac gatcatcaac gcacaggagg ccagaagggt cagcgcgagt 33120cccggtcggc tgggacccgc tgcgccgggc tgcttgacct ccgcgccggt cgcttgtttg 33180gccgtgtcag acatagacag cctcactcaa tatggtcgga atcaggatcg gccaatatat 33240gcgattcggc gtgtccgtct gaagacccgg aacgggtccg tccgtccact tcggagaaac 33300tctggcgcac gacggctcct tctcccgccg ccacggtgga cggtttcggc gaccacctga 33360cggccaacaa ggaaacggcc ggtgacgatt cgggtcaccg gccgttggtg gccggcggcc 33420atggaaccgg ccggtcgtgg tgccgccgta ccgaatggcg gcaccacgtt ccgacccgta 33480cgtcggctac tcgttccgca ggtcgaagac gacccggacg gtgccgtccg tgcggttgat 33540ggcacggtcg atggcggggg cgtagtcgtc cagcgtgacg atgtcggtga ggatgggctg 33600ggtgtcgatc gccccgttcg cgagcaggtc cacggcttcc cggtacttgc caccgggacc 33660catcacaccg accaggctgg cgtacgacag cggcagccgg gcggtctcca gcgcgtgctc 33720ggcgcccacc tggtagccga ccaggcagac ccgtccaccg gggcggacca ggtcgagcgc 33780gcggacgacc gactccgggt cgccggacgc ctcgaacacg acgtccacct tgtccgcgta 33840actggtgagc tcgggcagct cgctggggtg cacggcagcg gcggcgccgc tctcctcggc 33900gatcttgcgg cgctcggcga ccaggtcggt ggcgagcgtg accgtggccc cggtcgcccg 33960ggccgactgg aggatgagct ggccgatgcc gccggcgccc agcacggcga cccgctccgc 34020gggccggagg ttgatccggt ccaccgcgtg cagcgcgacg gcgagcggct cggtctggct 34080cgccgcggcg aggtccatcc cctcgggaag caggtagagg ttggtgatcg gcaccgccac 34140gtagccggcg cagccaccgt ccacggtgaa gccgatctcg atcaggttct cgcacatcac 34200cggcaacccg tcccggcagg gcccacagcc ctgacagccg acgatcagat cgccggtgac 34260cggacggccg acccaggact cgtaaccctc cggggcggag tccaccacac cggcccactc 34320gtggcccggc acgatcgggt accggttgcc gtgccacttg ccccggtaga gccagaggtc 34380gctaccgcag aggcagcagt agtgcacctt gacgacagcc catccgggag gtgcctccgg 34440gcggggagtg tcgatgatct gagccttgtg tccgccatgg aactgtagag cccgcattcg 34500tccccccacg cggctgtgag ttgttctccg gacaccttag aggccggttg atcagggccc 34560aacagttccg ctctggattt tccatcttga cggagcatcc attgccgact atcgtcccga 34620aaggatcctc caacctctgg gagatttgac ggccggttct ccggtgacgt cctccagcat 34680cggggcttgg ctgtgtcgag gtcgcgcccg cggtcgtcgg acacgtttgg gggtgtggcg 34740gtagacatca cgagaactgt cgtcgcgccg cgtctcgaaa acgccgttct ccactgccgc 34800cgtcgcgtcg catttccggc ccgtccatct ccgcaccacc tttcggccat ctggtgatgg 34860tctatgccca ggggcgggag cggggcccgg taccgaccgg gtgagtcgcc gcgaccggtg 34920accggagagc caccaccggg acgtcgacac ctgagcgacc cttactcctt cacgacgcct 34980gtgctcgtgt gctcccgggc ggaacgacga gccctctccc ggaccgcttc ccgcgttctc 35040ccggcagacg cgacgatggt ccgtgtccgg agcccaccac aacacgaccg gcgtccatgc 35100tgaccagttc aaggatccag atgaactccg tacactccga cctcaaggtc gccatcgtcg 35160tcgccgacat cgccatcgtg ctgatcgtcg gctcactgct gatcatgctg ttccgtcggc 35220
tcaagcaacc cccggtcatc ggtgagatca ccgctggcat cgtgctcgga ccgagcctcc 35280tcgggctgct gcccggagac gtcaccggct tcctcttccc ggccgagctc cgcccccacc 35340tctcgatgat ctcccaggtg ggactgctgc tcttcatgtt cctggtcggc tgggagttca 35400acggtcaact gctcaagcgc cgctccgggt cggtcgcctc ggtatcgctc tccgcgatcg 35460ccctcgcgtt cacgctcggt atcggcgcgg ccgcgctgct ctacgaccgg cacgacgtgg 35520tcgacgggga gagggtctcc ttcggctatt tcgccgcgtt cctgggcatc gcgatgtcga 35580tcatcgcgtt cccggtgctg gcccggctcc tcaccgagac cggcctggcc cggacccggg 35640tcggagccct ctccctggcc gccgccgcgc tggacgacgt gatggcctgg accctgctgg 35700ccttcatcgt ggtcatcttc ggggccggcg gtggcggtac cggcacgctg gtggccgtcc 35760tcgggctctt cctgctctac gtggcgctga tggtattcgg ggtccggccg ctgctccgcc 35820ggctcgtcgc ccggctcatc cggggcggca cggcctcgcc cttcctcgtc ccgctgatcg 35880ccgccggggc gttcctctcc gcctatgcca cgtcgtggat cggggtccac gcggtcttcg 35940gggccttcgc cttcggtctg gtgatgcccc gggagccacg ggcgttgctc gccgagtccc 36000tgcacatccc gctggagagc gccacccgcc tgctgctgcc gatcttcttc atcgtcaccg 36060ggctcaacgt caacatcggc gccctcggtt ggaccggtct gggcgagctg gcgatcatca 36120tggtcgccgc ctgcatcggc aagctcgtcg ccgcaggctt cgccgccagg ttgtccggca 36180tgaactggca ggagtcctac gcggtcgggc cgctcatgaa cacccggggc ctgaccgagc 36240tggtgatcct caacatcggt ctctccctgg gggtgctgga cggcgagatg ttcaccatga 36300tggtgctgat ggccctcctc accacggcca tggcggtgcc gctgctgccc aaggggctgc 36360cccgggcgcc ggggggcctg ttcggcatcc catccgtcac cgtgccgttc ggggcgacca 36420ccacccggcg cgcgcccgcg cagggtgacg ccgcggactc tgcccccacc gggcacgagg 36480tgccgtccgg caagtcctga gcgacggccg cgacacaccg gcgacgggga tgcccgccgc 36540cggtgtgtcg cgtgccgcag ggccacgccc tgacccgggc gtacgcctga acgctgagta 36600ggcttaccgc cgggtacgtc cgtgcccgcc gacgaggtgg aagggtggtg tggcgcgtgc 36660cgacggagaa gcgcagggcc gtggtgctgc tcagcggtgg gctcgactcc gccacggtgc 36720tcgcgatggc cgtgcacgag gggtacgaag cgcacgcgct cagcttccgc tacggccagc 36780ggcacaccgt cgagctggag gccgccgccc gggtggcgaa ggcactgggc gcgacccggc 36840acgtggtcgc cgacatcgac ctgcgggtct tcgggggctc ggcgctgacc gacgacacgc 36900tcgccgtacc gcaccacgac agcgccgacg agctgggcga cgagatcccg gtcacctacg 36960tgcccgcccg gaacaccatc ttcctgtcgt tcgccctggc ctgggcggag accctggacg 37020cctcggacat cttcatcggg gtcagcgcgc tggactacag cggctacccg gactgccgtc 37080cggagtacgt cgccgcctac gagacgatgg ccaacctggc caccaaggcc ggtgtcgagg 37140ggcggcagcg gctgcgcatc cacaccccgc tgatccagct caccaaggcc gagaccatcc 37200gcaggggcct ggagctgggc gtcgactacg cctggacgca cagctgctac gacgacgaga 37260ccatgtacca gatcatctcg gagagcatcc tggcgaaggc ctcggtgacc gaggacgaca 37320tgcacgagtg ccgcgccggc ctcgtgctgg agtacggcca cacggtcggg cacgccatcg 37380agtacaccgc ctccggtggg ctctcccacg gccaggcgat cggcctcggc atggtggtgg 37440ccgccgaggt gtcccgccgg ctgggtcacc tcgacgaccg ggccgtcgca ctgcactggg 37500agctgctgac ccgggcgggc gcgatggtga ccatccccga ggaggtcgac cttgacgagg 37560tgatgcaccg gttgcggttc gacaataagc gcggctacct cagcgacccg gccgagagca 37620gcgcgatggt cctcctcggt ggactgggcc agccactgtg gcaggacggc cgtccactgg 37680tctccgtccc gatggccctg gtcggcgagg tcatcaacga gatcgcctga tggagatcc 37739
權(quán)利要求
1.一種依尼奧小單孢菌西索霉素生物合成基因簇,其特征在于其堿基序列如序列表中SEQID NO.1所示。
全文摘要
本發(fā)明從西索米星產(chǎn)生菌依尼奧小單孢菌Ts388高產(chǎn)菌株中克隆到西索米星生物合成基因簇,該基因簇總長(zhǎng)約37739p,包括多個(gè)orf和2個(gè)rRNA(rRNA1和rRNA2);分子量(37.739/1.575)*10
文檔編號(hào)C12N15/31GK101045930SQ20071000867
公開(kāi)日2007年10月3日 申請(qǐng)日期2007年3月9日 優(yōu)先權(quán)日2007年3月9日
發(fā)明者洪文榮, 李殿殿, 許向前, 林玉雙 申請(qǐng)人:福州大學(xué)