專利名稱:具有改變的性質(zhì)的葡糖淀粉酶變體的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及具有改變的性質(zhì)(例如,改善的熱穩(wěn)定性和/或比活性)的親本葡糖 淀粉酶的變體。具體地,本發(fā)明提供包含變體葡糖淀粉酶的組合物,包括淀粉水解組合物, 動(dòng)物飼料組合物和清潔組合物。本發(fā)明也涉及編碼所述變體的DNA構(gòu)建體和在宿主細(xì)胞中 生產(chǎn)所述葡糖淀粉酶變體的方法。
背景技術(shù):
葡糖淀粉酶(葡聚糖1,4-α-葡糖水解酶,EC3.2. 1.3)是淀粉水解外切糖酶,其 催化從淀粉或相關(guān)寡糖和多糖分子的非還原性末端去除連續(xù)的葡萄糖單元。葡糖淀粉酶可 以水解線性的和分枝的糖苷鍵連接的淀粉(例如,直鏈淀粉和支鏈淀粉)。葡糖淀粉酶可以通過多種株系的細(xì)菌,真菌,酵母和植物生產(chǎn)。尤其有趣和商業(yè) 上重要的是,葡糖淀粉酶是細(xì)胞外產(chǎn)生的真菌酶,例如來自曲霉屬(Svensson等,(1983) Carlsberg Res.Commun. 48 :529_544 ;Boel 等·,(1984)EMBO J. 3 1097-1102 ;Hayashida 等·,(1989)Agric BiolChem. 53 923~929 ;USP 5024,941 ;USP4,794,175 和 W088/09795); 踝節(jié)菌屬(USP4, 247,637 ;USP6, 255,084 和 USP6, 620,924);根霉屬(Ashikari 等·, (1986)Agric. Biol. Chem. 50 957-964 ;Ashikari 等·, (1989)App. Microbiol.禾口 Biotech. 32 129-133 和 USP4, 863,864);腐質(zhì)霉屬(W005/052148 和 USP4, 618579)和毛霉 菌(Houghton-Larsen 等·,(2003) Appl. Microbiol. Biotechnol. 62 :210_217)的菌株。編 碼這些酶的很多基因已經(jīng)在酵母,真菌和/或細(xì)菌細(xì)胞內(nèi)被克隆和表達(dá)。葡糖淀粉酶是商業(yè)上非常重要的酶,并已經(jīng)應(yīng)用于需要淀粉水解的各種應(yīng)用(例 如,從淀粉產(chǎn)生葡萄糖和其它單糖)。葡糖淀粉酶用于產(chǎn)生高果糖漿甜味劑,其構(gòu)成美國(guó)超 過50%的甜味劑市場(chǎng)。一般來說,葡糖淀粉酶可以,并且通常與α-淀粉酶一起用于淀粉水 解過程,以水解淀粉為糊精,然后水解為葡萄糖。接著葡萄糖可以由其它酶(例如,葡萄糖 異構(gòu)酶)轉(zhuǎn)化為果糖;結(jié)晶化;或用于發(fā)酵以產(chǎn)生多種終產(chǎn)物(例如,乙醇,檸檬酸,乳酸, 琥珀酸,抗壞血酸中間體,谷氨酸,甘油和1,3_丙二醇)。通過在淀粉和/或包含纖維素材 料的發(fā)酵中使用葡糖淀粉酶產(chǎn)生的乙醇可以用做燃料或用于酒精消費(fèi)。盡管葡糖淀粉酶已經(jīng)成功用于商業(yè)用途多年,對(duì)具有改變性質(zhì)的新葡糖淀粉酶的 需要仍然存在。發(fā)明概述在有些方面,本發(fā)明涉及分離的葡糖淀粉酶變體,其在對(duì)應(yīng)于SEQ IDNO 2或SEQ ID NO :3 殘基位置 10,14,15,23,42,45,46,59,60,61,67,68,72,73,97,98,99,102,108, 110,113,114,122,124,125,133,140,144,145,147,152,153,164,175,182,204,205,214,216,219,228,229,230,231,236,239,240,241,242,244,263,264,265,268,269,276,284, 291,300,301,303,310,311,313,316,338,342,344,346,349,359,361,364,379,382,390, 391,393,394,408,410,415,417,418,430,431,433,436,442,443,444,448 和 451 的位置上 或親本葡糖淀粉酶的等同位置上具有一個(gè)或多個(gè)氨基酸取代。在一些實(shí)施方案中,親本葡糖淀粉酶包含SEQ ID ΝΟ:1,4,5,6,7,8或9的序列。在一些實(shí)施方案中,親本葡糖淀粉酶 包含SEQ ID NO :2。在一些實(shí)施方案中,親本葡糖淀粉酶獲自木霉菌,曲霉菌,腐質(zhì)霉菌,青 霉菌,踝節(jié)菌,或裂殖酵母菌。在另外的實(shí)施方案中,親本的等同位置通過序列同一性確定。 在其它的實(shí)施方案中,親本葡糖淀粉酶具有與SEQ IDNO :2至少80%的序列同一性。在另外 的實(shí)施方案中,親本的等同位置通過與SEQ ID NO :2或3的結(jié)構(gòu)同一性確定。在此方面的其 它實(shí)施方案中,變體在選自 SEQ ID NO :2 或 SEQ ID NO :3 的 T10D/F/G/K/L/M/P/R/S ;L14E/ H ;N15D/N ;P23A/G ;F59A/G ;K60F/H ;N61D/I/L/Q/V/W ;R65A/C/G/I/K/M/S/V/Y ;T67C/I/K/ M/T ;E68I/M/W ;A72E/G/L/M/Q/R/W/Y ;G73C/L/W ;S97F/M/N/P/R/S/V/W/Y ;L98H/M ;A99C/ L/M/N/P ;S102A/C/1/L/M/N/R/V/W/Y;E110Q/S/W ;L113E/N ;Kl 14C/D/E/L/M/Q/S/T/V ; I133K/R/S/T ;K140A/E/F/H/K/L/M/N/Q/R/S/V/W/Y ;N144C/D/E/I/K ;N145A/C/E/I/K/L/M/ Q/R/V/W/Y;Y147A/M/R ;S152H/M ;N153C/D/K/L/W/Y ;N164A/G ;N182C/E/K/P/R ;A204C/D/ G/I/M/Q/T ; T205A/D/H/1/Κ/Μ/Ν/Ρ/Q/S/V/ff/Y ;S214P/T ;V216C/G/H/K/N/Y ; Q219D/G/H/N/ P/S ;W228A/F/G/H/I/L/M/Q/S/T/V/Y ;V229E/I/M/N/Q ;S230C/D/E/F/G/H/I/K/L/N/P/Q/R/ T/V/Y ; S231C/D/F/L/M/N/Q/R/S/V/Y ;D236F/G/L/M/N/P/S/T/V ; I239M/Q/S/V/W/Y ;T241C/ E/H/L/M/P/S/T/V ;N242C/F/H/M/T/V/W ;N263H/K/P ;L264A/C/E/F/L/S ;G265E/G/H/I/K/R/ T ;A268C/D/E/F/G/I/K/L/P/R/T/W ;G269E ;D276S ;V284R/T/V/Y/A/E/F/H/K/N/P/W ;P300K/ R ;A301E/K/L/P/S/W ;A303C/D/F/H/I/K/L/N/R/T/V/W/Y;A311N/P/Q/S/Y ;V338P/Q/S/ Y;T342N/V ;S344A/T ;T346G/H/M/N/P/Q/Y ;A349L/I/K/M/N/Q/R/W ;G361H/L/R ;A364M/W ; N379A/C/D/G/I/M/P/S ; S382A/N/P/V/W ; S390A/Y ;E391A/E/1/K/L/M/Q/R/V/W/Y ;A393E/G/ H/1/K/L/M/N/Q/R/S/T/V/ff/Y ;K394A/H/K/L/M/Q/R/S/T/V/W ; S410E/H/N ; L417A/D/E/F/G/ I/K/Q/R/S/T/V/ff/Υ ;H418E/M ;T430A/E/F/G/H/1/K/M/N/Q/R/V ;A431C/E/H/I/L/M/Q/R/S/ ff/Υ ;R433A/C/E/F/G/K/L/M/N/S/V/W/Y ; I436E/F/G/H/K/P/R/S/T/V/Y ;S444M/N/P/Q/R/T/ V/W ;T448F/G/I/P/Q/T/V ;和S451E/H/K/L/Q/T的位置上或親本葡糖淀粉酶的等同位置上 具有取代。 在另一方面,本發(fā)明涉及分離的葡糖淀粉酶變體,其在對(duì)應(yīng)于SEQ IDNO 2或SEQ ID NO 3 的位置 10,14,15,23,42,45,46,59,60,61,67,68,72,73,97,98,99,102,108,110, 113,114,122,124,125,133,140,144,145,147,152,153,164,175,182,204,205,214,216, 219,228,229,230,231,236,239,240,241,242,244,263,264,265,268,269,276,284,291, 300,301,303,310,311,313,316,338,342,344,346,349,359,361,364,379,382,390,391, 393,394,408,410,415,417,418,430,431,433,436,442,443,444,448 和 451 上包含一個(gè)或 多個(gè)氨基酸取代。在此方面的一個(gè)實(shí)施方案中,葡糖淀粉酶變體在對(duì)應(yīng)于選自SEQ ID NO 2 或 3 的 10,14,15,23,59,60,61,65,67,68,72,73,97,98,99,102,110,113,133,140,144, 145,147,152,153,164,182,204,205,214,216,219,228,229,230,231,236,239,241,242, 263,264,265,268,269,276,284,291,300,301,303,311,338,342,344,346,349,359,361, 364,379,382,390,391,393,394,410,417,418,430,431,433,442,444,448 和 451 上包含一個(gè)或多個(gè)氨基酸取代。在該方面的其它實(shí)施方案中,葡糖淀粉酶變體在對(duì)應(yīng)于SEQ ID NO 2 或 SEQ ID NO 3 的位置 61,67,72,97,102,133,205,219,228,230,231,239,263,268,291, 342,394,430,431和451上包含一個(gè)或多個(gè)氨基酸取代。在此方面的另外的實(shí)施方案中,葡 糖淀粉酶變體具有一個(gè)或多個(gè)氨基酸取代,其對(duì)應(yīng)于SEQ ID NO 2或SEQ ID NO 3的至少 一個(gè)下列取代:T67M, A72Y, S97N, S102M, I133T, T205Q, Q219S, W228M, S230F, S230G, S230N, S230R, S231L, I239V, I239Y, N263P, A268C, A268G, A268K, S291A, T342V, K394S, T430K, A431Q, S451K。在另一方面,與親本葡糖淀粉酶相比,本發(fā)明的葡糖淀粉酶變體具有改變的性質(zhì)。 在一些實(shí)施方案中,比較于包含SEQ ID NO :2、SEQ ID NO 3的序列的葡糖淀粉酶或與SEQ ID NO :2有至少80%序列同一性的親本葡糖淀粉酶,改變的性質(zhì)為比活性的增加。在一些 實(shí)施方案中,比較于包含SEQ ID NO :2的葡糖淀粉酶,葡糖淀粉酶變體具有增加的比活性。 在此方面的其它實(shí)施方案中,葡糖淀粉酶變體在對(duì)應(yīng)于選自SEQ ID而2或3的10,14,15, 23,59,60,61,65,67,68,72,73,97,98,99,102,110,113,133,140,144,145,147,152,153, 164,182,204,205,214,216,219,228,229,230,231,236,239,241,242,263,264,265,268, 269,276,284,291,300,301,303,311,338,342,344,346,349,359,361,364,379,382,390, 391,393,394,410,417,418,430,431,433,442,444,448,和 451 的位置上包含一個(gè)或多個(gè) 氨基酸取代。在其它的方面,比較于包含SEQ ID NO :2、SEQ ID NO 3的序列的葡糖淀粉酶或與 SEQ ID NO :2有至少80%序列同一性的親本葡糖淀粉酶,本發(fā)明的葡糖淀粉酶變體具有增 加的熱穩(wěn)定性。在一些實(shí)施方案中,比較于包含SEQ ID NO :2或SEQ ID NO :3的葡糖淀粉 酶,葡糖淀粉酶變體具有增加的熱穩(wěn)定性。在此方面的一些實(shí)施方案中,本發(fā)明的葡糖淀粉 酶變體在對(duì)應(yīng)于選自 SEQ ID NO :2 或 SEQ ID NO :3 的位置 10,15,23,42,59,60,61,68,72, 73,97,98,99,102,114,133,140,144,147,152,153,164,182,204,205,214,216,228,229, 230,231,236,241,242,263,264,265,268,269,276,284,291,300,301,303,311,338,342, 344,346,349,359,361,364,379,382,390,391,393,394,410,417,430,431,433,436,442, 443,444,448和451的位置上包含一個(gè)或多個(gè)氨基酸取代。在此方面的其它實(shí)施方案中,本 發(fā)明的葡糖淀粉酶變體在對(duì)應(yīng)于選自SEQ ID NO :2或SEQ ID NO :3的位置10,42,68,73, 97,114,153, 229, 231, 236, 264, 291, 301, 344, 361, 364,417, ^P 433 的位置上包含一個(gè)或多 個(gè)氨基酸取代。在此方面的其它實(shí)施方案中,本發(fā)明的葡糖淀粉酶變體在對(duì)應(yīng)于選自SEQ ID NO :2 或 SEQ ID NO :3 的位置 68,73,114,153,236,344,361,364 和 433 的位置上包含一 個(gè)或多個(gè)氨基酸取代。在此方面的又一些實(shí)施方案中,葡糖淀粉酶變體包含一個(gè)或多個(gè)氨 基酸取代,其對(duì)應(yīng)于至少一個(gè)下面的SEQ ID NO 2或SEQ ID NO 3的T10S,T42V,E68C, E68M, G73F, G73W, K114M, K114T, N153A, N153S, N153V, W228V, D236R, G361D, G361E, G361P, G361Y, A364D, A364E, A364F, A364G, A364K, A365L, A365R, R433C, R433G, R433L, R433N, R433S, R433V,和 I436H。在另外的方面,比較于包含SEQ ID NO 2或SEQ ID NO 3序列的葡糖淀粉酶或與 SEQ ID NO :2有至少80%序列同一性的親本葡糖淀粉酶,本發(fā)明的葡糖淀粉酶變體具有增 強(qiáng)的比活性和增加的熱穩(wěn)定性。在此方面的一些實(shí)施方案中,本發(fā)明的葡糖淀粉酶變體在 對(duì)應(yīng)于選自 SEQ ID NO :2 或SEQ ID NO :3 的位置10,15,59,61,68,72,73,97,99,102,133,140,153,182,204,205,214,228,229,230,231,236,241,242,264,265,268,275,284,291, 300,301,303,311,338,344,346,359,361,364,370,382,391,393,394,410,417,430,431, 433,444,448,和451的位置上包含一個(gè)或多個(gè)氨基酸取代。在此方面的另外實(shí)施方案中, 葡糖淀粉酶變體在對(duì)應(yīng)于選自SEQ IDNO :2或SEQ ID NO :3的位置228,230,231,268,291, 417,433和451的位置上包含一個(gè)或多個(gè)氨基酸取代。在此方面的另外實(shí)施方案中,葡糖淀 粉酶變體包含一個(gè)或多個(gè)氨基酸取代,其對(duì)應(yīng)于至少一個(gè)下面的取代SEQID NO 2或SEQ ID NO 3 的 W228A, W228F, W228H, W228M, S230F, S230G, S230R, S231L, A268C, A268G,S291A, L417R, R433Y,和 S451K。在另一方面,本發(fā)明涉及編碼涵蓋在本發(fā)明中的任何一種葡糖淀粉酶變體的分離 的多核苷酸。在一些實(shí)施方案中,本發(fā)明涉及一種宿主細(xì)胞,其包含編碼涵蓋在本發(fā)明中的 葡糖淀粉酶的多核苷酸。在其它的方面,本發(fā)明涉及酶組合物,其包含一種或多種涵蓋在本發(fā)明中的葡糖 淀粉酶變體。在一些實(shí)施方案中,所述酶組合物將包括另外的酶,例如一種或多種α-淀粉 酶。在一些實(shí)施方案中,所述酶組合物可以用于淀粉轉(zhuǎn)化方法,乙醇發(fā)酵方法和/或動(dòng)物飼 料配制。在有些方面,本發(fā)明涉及生產(chǎn)涵蓋在本發(fā)明中的變體葡糖淀粉酶的方法,包括用 編碼本發(fā)明的葡糖淀粉酶變體的多核苷酸轉(zhuǎn)化宿主細(xì)胞;在適于表達(dá)和生產(chǎn)所述葡糖淀粉 酶變體的條件下培養(yǎng)該宿主細(xì)胞并生產(chǎn)所述變體。在一些實(shí)施方案中,所述葡糖淀粉酶變 體從培養(yǎng)基中回收。
圖1顯示了具有632個(gè)氨基酸(SEQ ID NO 1)的里氏木霉葡糖淀粉酶(TrGA)。信 號(hào)肽加下劃線,以氨基酸殘基SVDDFI (SEQ ID NO 12)開始,并具有453個(gè)氨基酸殘基的催 化區(qū)(SEQ ID NO 3)以粗體顯示;接頭區(qū)域以斜體顯示,淀粉結(jié)合區(qū)(SBD)以斜體顯示并加 下劃線。包括催化區(qū)(SEQ ID Ν0:3),接頭區(qū)(SEQ ID NO 10)和淀粉結(jié)合區(qū)(SEQ IDNO 11)的成熟蛋白由SEQ ID NO 2表示。圖IB顯示了編碼TrGA的cDNA(SEQ ID NO 4)。圖 IC顯示了 TrGA前體和成熟蛋白結(jié)構(gòu)域。圖 2 顯示了包括 TrGA 的 cDNA(SEQ ID NO 4)的目的質(zhì)粒 pDONR-TrGA。圖 3 顯示了質(zhì)粒 pTTT-Dest。圖4顯示了最終的表達(dá)載體pTTT-TrGA。圖5A-5B顯示了親本葡糖淀粉酶催化區(qū)的比對(duì)比較,所含葡糖淀粉酶包括來源于 泡盛曲霉(Aspergillus awamori) (AaGA) (SEQ ID NO 5);黑曲霉(Aspergillus niger) (AnGA) (SEQ ID NO 6);米曲霉(Aspergillusoryzae) (AoGA) (SEQ ID NO 7);里氏木霉 (Trichoderma reesei) (TrGA) (SEQ ID NO 3);灰腐質(zhì)霉(Humicola grisea) (HgGA) (SEQID NO 8)和Hypocrea vinosa(HvGA) (SEQ ID NO 9)的葡糖淀粉酶。相同的氨基酸通過星號(hào) (女)指出。圖5C顯示了踝節(jié)菌葡糖淀粉酶(TeGA)成熟蛋白序列(SEQ IDNO 308)。圖6是從側(cè)面觀察的木霉菌葡糖淀粉酶(黑色)(SEQ ID NO 2)和泡盛曲霉葡糖淀 粉酶(灰色)三維結(jié)構(gòu)的比較。根據(jù)活性中心測(cè)定側(cè)面并且活性中心入口在該分子的“頂部”。圖7是從頂部觀察木霉菌葡糖淀粉酶(黑色)和泡盛曲霉葡糖淀粉酶(灰色)三 維結(jié)構(gòu)的比較?;钚灾行娜肟谠谠摲肿拥摹绊敳俊?。發(fā)明詳述定義除非另有定義,本文使用的所有技術(shù)和科學(xué)術(shù)語具有與本發(fā)明所屬技術(shù)領(lǐng)域的 普通技術(shù)人員通常理解相同的含義。Singleton等,DICTI0NARY0F MICROBIOLOGY AND MOLECULAR BIOLOGY, 2D ED.,JohnWiley 和 Sons, New York (1994),和 Hale&Markham,The HARPERCOLLINS DICTIONARY OF BIOLOGY,Harper Perennial,N. Y. (1991)為技術(shù)人員提供 本文應(yīng)用的很多術(shù)語的通常含義。但為了清楚和便于參考,仍在下面定義某些術(shù)語。本文所使用的術(shù)語“葡糖淀粉酶(EC3. 2.1.3) ”是指催化從淀粉和相關(guān)寡糖和多糖 的非還原性末端釋放D-葡萄糖的酶。本文所使用的術(shù)語“親本“或“親本序列”指的是與TrGA具有序列和/或結(jié)構(gòu)同 一性的序列(例如,SEQ ID N0:l,2和/或3)和宿主細(xì)胞內(nèi)天然的或自然出現(xiàn)的序列。本文所使用的術(shù)語“TrGA”指的是具有SEQ ID NO 2中顯示的成熟蛋白序列的里 氏木霉葡糖淀粉酶序列,其包括具有SEQ ID NO :3中顯示序列的催化區(qū)。W02006/060062 和2006年5月4日公開的美國(guó)專利號(hào)2006/0094080中描述了 TrGA的分離,克隆和表達(dá), 其并入本文做為參考。TrGA也被認(rèn)為是親本葡糖淀粉酶序列。在一些實(shí)施方案中,親本序 列指的是做為蛋白質(zhì)工程的起點(diǎn)的TrGA。本文中葡糖淀粉酶氨基酸的編號(hào)基于TrGA葡糖 淀粉酶序歹Ij (SEQ ID NO 2 和 SEQ ID NO :3)。短語“蛋白質(zhì)或多肽的成熟形式”指的是蛋白質(zhì)或多肽的最終功能形式。舉例來 說,TrGA成熟形式包括催化區(qū),接頭區(qū)和淀粉結(jié)合區(qū),具有SEQ ID NO 2的氨基酸序列。術(shù)語“木霉菌葡糖淀粉酶同源物”指的是具有與TrGA序列(SEQ IDN0:1, SEQ ID NO :2或SEQ ID NO 3)至少80%氨基酸序列同一性的親本葡糖淀粉酶,其中該葡糖淀粉酶 保持了葡糖淀粉酶的功能性特征。本文中使用的“同源序列”意思是為了比較進(jìn)行最佳序列比對(duì)時(shí),與一種核酸序 列或多肽序列具有至少100%,至少99%,至少98%,至少97%,至少96%,至少95%,至 少94%,至少93%,至少92%,至少91%,至少90%,至少88%,至少85%,至少80%,至少 75 %,至少70 %,至少65 %,至少60 %,至少55 %,至少50 %或至少45 %序列同一性的核酸 或多肽序列,其中候選核酸序列或多肽序列的功能與和所述候選同源序列相比較的核酸序 列或多肽序列基本相同。在一些實(shí)施方案,同源序列具有85%和100%之間的序列同一性, 而在其它的實(shí)施方案中具有90%和100%之間的序列同一性,在其它的實(shí)施方案中,具有 95%和100%的序列同一性。在一些實(shí)施方案中,候選同源序列或親本與TrGA核酸序列或 成熟蛋白序列比較。序列同一性可以經(jīng)由親本或同源序列的全長(zhǎng)測(cè)定。本文中使用的術(shù)語“葡糖淀粉酶變體”,“變體”和“TrGA變體”用于與親本葡糖淀粉酶序列相似的葡糖淀粉酶(例如,TrGA或木霉菌葡糖淀粉酶同源物),但在其氨基酸序 列中具有使其在序列上不同于親本葡糖淀粉酶的至少一個(gè)取代,缺失或插入。在一些情況 中,它們已經(jīng)被操作/改造以在它們的氨基酸序列中包括至少一個(gè)取代,缺失或插入,其使 得它們的序列不同于親本葡糖淀粉酶。
本文中使用的術(shù)語“催化區(qū)”指的是多肽的結(jié)構(gòu)區(qū),其包含底物水解的活性位點(diǎn)。術(shù)語“接頭”指的是通常具有3到40個(gè)之間氨基酸殘基的短氨基酸序列,其共價(jià) 連接包含淀粉結(jié)合區(qū)的氨基酸序列和包含催化區(qū)的氨基酸序列。術(shù)語“淀粉結(jié)合區(qū)”指的是優(yōu)選結(jié)合于淀粉底物的氨基酸序列。本文中使用的術(shù)語“突變序列,,和“突變基因”可互換使用,指的是一種多核苷酸 序列,其具有發(fā)生于宿主細(xì)胞親本序列中的至少一個(gè)密碼子內(nèi)的改變。突變序列的表達(dá)產(chǎn) 物為相對(duì)于親本具有改變的氨基酸序列的變體蛋白。所述表達(dá)產(chǎn)物可以具有改變的功能容 量(例如,增強(qiáng)的酶活性)。在多肽背景下,本文應(yīng)用的術(shù)語“性質(zhì)”或其語法上的等同對(duì)應(yīng)詞指的是能夠被選 擇或檢測(cè)的多肽的任何特點(diǎn)或?qū)傩浴_@些性質(zhì)包括,但不限于氧化穩(wěn)定性,底物特異性,催 化活性,熱穩(wěn)定性,PH活性曲線,對(duì)蛋白降解的抗性,KM, Kcat, Kcat/Km比率,蛋白折疊,結(jié)合底 物的能力和分泌能力。在核酸背景下,本文應(yīng)用的術(shù)語“性質(zhì)”或其語法上的等同對(duì)應(yīng)詞指的是能夠被選 擇或檢測(cè)的核酸的任何特點(diǎn)或?qū)傩?。這些性質(zhì)包括,但不限于,影響基因轉(zhuǎn)錄的性質(zhì)(例 如,啟動(dòng)子強(qiáng)度和啟動(dòng)子識(shí)別),影響RNA加工的性質(zhì)(例如,RNA剪接和RNA穩(wěn)定性),影 響翻譯的性質(zhì)(例如,調(diào)控,結(jié)合mRNA到核糖體蛋白)。
術(shù)語“熱穩(wěn)定的”和“耐熱的”指的是在淀粉底物水解過程中普通的條件下,本發(fā) 明的葡糖淀粉酶變體在給定的時(shí)段暴露于確認(rèn)的溫度后,例如暴露于改變的溫度后,保持 特定量的酶活性。在性質(zhì)例如熱穩(wěn)定性的背景下,術(shù)語“增強(qiáng)的穩(wěn)定性”指的是比較于另一個(gè)參照 (例如,親本)葡糖淀粉酶,隨時(shí)間推移維持的更高的淀粉水解活性。在性質(zhì)例如熱穩(wěn)定性的背景下,術(shù)語“降低的穩(wěn)定性”指的是比較于另一個(gè)參照葡 糖淀粉酶,隨時(shí)間推移維持的更低的淀粉水解活性。術(shù)語“比活性”被定義為每毫克葡糖淀粉酶蛋白的活性。在一些實(shí)施方案中,葡糖 淀粉酶的活性通過本文描述的乙醇試驗(yàn)測(cè)定并表達(dá)為從淀粉底物產(chǎn)生的葡萄糖的量。在一 些實(shí)施方案中,蛋白質(zhì)濃度可以使用本文描述的Caliper試驗(yàn)測(cè)定。術(shù)語“活性”和“生物活性”指的是與某具體蛋白相關(guān)的生物活性。由此可見,給 定蛋白的生物活性指的是由本領(lǐng)域技術(shù)人員通常歸因于該蛋白的任何生物活性。例如,與 葡糖淀粉酶相關(guān)的酶活性是水解的,于是活性葡糖淀粉酶具有水解活性。術(shù)語“多核苷酸”和“核酸”,在本文中互換使用,指的是任何長(zhǎng)度核苷酸的聚合形 式,或者核糖核苷酸或者脫氧核糖核苷酸。這些術(shù)語包括,但不限于,單_,雙_,或三-鏈 DNA,基因組DNA,cDNA, RNA, DNA-RNA雜合物,或包含嘌呤和嘧啶堿基的聚合物,或其他天然 的,化學(xué),生物化學(xué)修飾的,非天然的或者衍化的核苷酸堿基。本文中使用的術(shù)語“DNA構(gòu)建體” “轉(zhuǎn)化DNA”和“表達(dá)載體”互換使用,指的是用 于引入序列到宿主細(xì)胞或生物的DNA。所述DNA可以通過PCR或本領(lǐng)域技術(shù)人員已知的任 何其它合適的技術(shù)在體外產(chǎn)生。DNA構(gòu)建體,轉(zhuǎn)化DNA或重組表達(dá)盒可以被摻入到質(zhì)粒,染 色體,線粒體DNA,質(zhì)體DNA,病毒或核酸片段。通常地,表達(dá)載體的重組表達(dá)盒部分,DNA構(gòu) 建體或轉(zhuǎn)化DNA包括,除其它序列外,被轉(zhuǎn)錄的核酸序列和啟動(dòng)子。在實(shí)施方案中,表達(dá)載 體具有在宿主細(xì)胞中摻入和表達(dá)異源DNA片段的能力。
本文中使用的術(shù)語“載體”指的是設(shè)計(jì)用于引入核酸到一種或多種細(xì)胞類型的多 核苷酸構(gòu)建體。載體包括克隆載體,表達(dá)載體,穿梭載體,質(zhì)粒,表達(dá)盒等等。在引入核酸序列到細(xì)胞內(nèi)的背景下,本文使用的術(shù)語“引入”指的是適合轉(zhuǎn)移核酸 序列到細(xì)胞內(nèi)的任何方法。這些引入方法方法包括但不限于原生質(zhì)體融合,轉(zhuǎn)染,轉(zhuǎn)化,接 合,和轉(zhuǎn)導(dǎo)。本文中使用的術(shù)語“轉(zhuǎn)化的”和“穩(wěn)定轉(zhuǎn)化的”指的是細(xì)胞,其具有整合入其基因 組的非天然(異源的)多核苷酸序列或做為維持至少兩代的游離質(zhì)粒。本文中使用的術(shù)語“選擇標(biāo)記”和“選擇性標(biāo)記”指的是能夠在宿主細(xì)胞內(nèi)表達(dá)的 核酸(例如,基因),其允許容易地選擇那些包含載體的宿主。通常,選擇標(biāo)記是賦予宿主細(xì) 胞抗生素抗性或代謝優(yōu)勢(shì)的基因,以在轉(zhuǎn)化過程中允許包含外源DNA的細(xì)胞與未接受任何 外源序列的細(xì)胞區(qū)分開來。本文中使用的術(shù)語“啟動(dòng)子”指的是具有指導(dǎo)下游基因轉(zhuǎn)錄作用的核酸序列。啟 動(dòng)子,和其他轉(zhuǎn)錄和翻譯調(diào)節(jié)核酸序列(也稱為“控制序列”)一起對(duì)于表達(dá)給定基因是必 須的。通常,轉(zhuǎn)錄和翻譯調(diào)節(jié)序列包括,但不限于啟動(dòng)子序列,核糖體結(jié)合位點(diǎn),轉(zhuǎn)錄起始和 終止序列,翻譯起始和終止序列,和增強(qiáng)子或激活子序列。當(dāng)其置于與另外一個(gè)核酸序列的功能關(guān)系中時(shí),核酸被“有效連接”。例如,如果 編碼分泌前導(dǎo)序列(即,信號(hào)肽)的DNA表達(dá)為參與多肽分泌的前導(dǎo)蛋白,那么編碼分泌前 導(dǎo)序列(即,信號(hào)肽)的DNA有效地連接于多肽的DNA。通常,“有效連接”意思是被連接的 DNA序列是相鄰的,并且至于分泌前導(dǎo)序列,是相鄰的并且在閱讀相內(nèi)。本文中使用的術(shù)語“基因”指的是多核苷酸(例如,DNA片段),其編碼多肽,并包 括編碼區(qū)之前和之后的區(qū)域以及單個(gè)編碼區(qū)段(外顯子)之間的間插序列(內(nèi)含子)。本文中使用的“同源基因”指的是來自不同,但通常相關(guān)的物種的一對(duì)基因,其相 互對(duì)應(yīng)并且彼此相同或非常近似。該術(shù)語包括由物種形成(即新物種發(fā)展)分離的基因 (例如,直向同源基因),以及已經(jīng)由基因復(fù)制分離的基因(例如,旁系同源基因)。本文中使用的“直向同源物”和“直向同源基因”指的是通過物種形成從共同的祖 先基因(S卩,同源基因)進(jìn)化而來的不同物種中的基因。通常,直向同源物在進(jìn)化過程中保 持相同的功能。直向同源物的鑒定在新近測(cè)序的基因組中可靠預(yù)測(cè)基因功能中得到應(yīng)用。本文中使用的“旁系同源物”和“旁系同源基因”指的是基因組內(nèi)通過復(fù)制相關(guān)的 基因。盡管直向同源物在進(jìn)化過程中保持相同的功能,但是旁系同源物進(jìn)化新功能,盡管一 些功能通常與最初的基因相關(guān)。旁系同源基因的實(shí)例包括,但不限于編碼胰蛋白酶,胰凝乳 蛋白酶,彈性蛋白酶和凝血酶的基因,其都是絲氨酸蛋白酶并在同一物種內(nèi)一起發(fā)生。本文中使用的術(shù)語“同源性”指的是序列相似性或同一性,優(yōu)選同一性。該同源 性使用本領(lǐng)域已知的標(biāo)準(zhǔn)技術(shù)確定(參見,例如,Smith和Waterman,(1981)Adv. Appl. Math. ,2482 ;Needleman 禾口 Wunsch, (1988)J. Mol. Biol. ,48443 ;Pearson 禾口 Lipman, (1988) Proc. Natl. Acad. Sci. USA 85:2444;程序,如 Wisconsin Genetics Software Package (GeneticsComputer Group, Madison, WI)中的 GAP,BESTFIT,F(xiàn)ASTA,和 TFASTA ;禾口 Devereux et al.,(1984)Nucl. Acid Res.,12 :387_395)?!昂怂嵝蛄型恍园俜?jǐn)?shù)(% ) ”或“氨基酸序列同一性百分?jǐn)?shù)(% ) ”被定義為候 選序列中與起始序列(如,TrGA)的核苷酸殘基或氨基酸殘基相同的核苷酸殘基或氨基酸殘基的百分比。序列同一性可以在起始序列全長(zhǎng)(即,TrGA SEQ ID NO :2或3)上測(cè)量。同源序列由已知的序列比對(duì)方法確定。通常使用的比對(duì)方法是由Altschul等 (Altschul 等,(1990) J. Mol.Biol.,215 403-410 ;禾口 Karl in 等,(1993) Proc. Natl. Acad. Sci.USA 90 5873-5787)描述的BLAST。一個(gè)尤其有用的BLAST程序是WU-BLAST-2程序(參 見,Altschul 等,(1996)Meth. Enzymol.,266 460-480)。WU-BLAST-2 使用幾個(gè)檢索參數(shù), 其大多數(shù)被設(shè)定為默認(rèn)值??烧{(diào)整的參數(shù)設(shè)定為下列值,重疊間隔=1,重疊部分=0. 125, 字段閾值(T) =11。HSPS和HSP S2參數(shù)是動(dòng)態(tài)值并通過程序本身建立,其依賴于具體序 列的組成和目的序列被檢索的具體數(shù)據(jù)庫的組成。但是,這些值可以被調(diào)整以增加靈敏性。 氨基酸序列同一性值由匹配的相同殘基的數(shù)目除以比對(duì)區(qū)內(nèi)“更長(zhǎng)”序列的殘基總數(shù)來 確定。“更長(zhǎng)”序列是在比對(duì)區(qū)中具有大多數(shù)實(shí)際殘基的序列(忽略由WU-Blast-2為最大 化比對(duì)得分而引入的空位)。其它的方法也應(yīng)用于比對(duì)序列。一個(gè)有用算法的例子是PILEUP。PILEUP使用漸 進(jìn)的逐對(duì)比對(duì)從一組相關(guān)序列產(chǎn)生多個(gè)序列比對(duì)。PILEUP使用Feng和Doolittle的漸進(jìn) 式比對(duì)方法的簡(jiǎn)化形式(Feng和Doolittle,(1987) J. Mol. Evol. ,35 :351_360)。該方法與 Higgins 和 Sharp 描述的方法相似(Higgins 和 Sharp,(1989)CABI0S 5 151-153)。有用的 PILEUP參數(shù)包括默認(rèn)的空位權(quán)重3. 00,默認(rèn)的空位長(zhǎng)度權(quán)重0. 10和加權(quán)的末端空位。術(shù)語“最優(yōu)比對(duì)”指的是提供最高同一性百分率得分的比對(duì)?!暗韧恢谩敝傅氖?兩個(gè)序列之間的最優(yōu)比對(duì)。例如利用圖5D和5E,TrGA(SEQID NO 2)中491位是C491 ;黑 曲霉的等同位置是C509位;泡盛曲霉的等同位置是Q538位。對(duì)于三維序列的示例性比對(duì) 參見圖8。本文中使用的術(shù)語“雜交”指的是如本領(lǐng)域所知,核酸鏈與互補(bǔ)鏈通過堿基配對(duì)結(jié) 合的過程。如果在中等到高嚴(yán)格度雜交和洗滌條件下,兩個(gè)序列互相特異地雜交,則認(rèn)為核 酸序列對(duì)于參考序列是“選擇性雜交的”。雜交條件是以核酸結(jié)合復(fù)合體或探針的解鏈溫度 (Tm)為基礎(chǔ)的。例如,“最大嚴(yán)格性”通常發(fā)生在約Tm-5°C (低于探針Tm 5°C );“高嚴(yán)格 性”在低于Tm約5-10°C ;“中等嚴(yán)格性”在低于探針Tm約10_20°C ;“低嚴(yán)格性”在低于Tm 約20-25°C。功能上來說,最大嚴(yán)格性條件可以用于鑒定與雜交探針具有嚴(yán)格同一性或接近 嚴(yán)格同一性的序列;而中等或低嚴(yán)格性條件可以用于鑒定或檢測(cè)多核苷酸序列同源物。中等和高嚴(yán)格性雜交條件是本領(lǐng)域公知的。高嚴(yán)格性條件的一個(gè)例子包括在約 42°C,在 50% 甲酰胺,5XSSC,5XDenhardt,s 液,0. 5% SDS 和 100 ii g/ml 變性載體 DNA 中雜 交,之后在室溫下,2XSSC和0. 5%SDS中洗滌兩次,并在42°C,0. IX SSC和0. 5%SDS中洗滌 另外兩次。中等嚴(yán)格性條件的一個(gè)例子包括37°C,在包含20%甲酰胺,5X SSC(150mMNaCl, 15mM檸檬酸三鈉),50mM磷酸鈉(pH7. 6),5XDenhardt,s液,10%硫酸葡聚糖和20mg/ml變 性的剪切鮭精DNA的溶液中溫育,之后在約37-50°C,lX SSC中洗滌濾膜。本領(lǐng)域技術(shù)人員 知曉如何調(diào)整溫度,離子強(qiáng)度等,其對(duì)于適應(yīng)例如探針長(zhǎng)度等等的因素是必須的。本文中使用的“重組”包括涉及的細(xì)胞或載體,其通過引入異源的或同源的核酸序 列被修飾或所述細(xì)胞來源于此種修飾的細(xì)胞。這樣,例如,作為人類有意干預(yù)的結(jié)果,重組 細(xì)胞表達(dá)天然(非重組)形式細(xì)胞內(nèi)未發(fā)現(xiàn)相同形式的基因,或表達(dá)天然基因,其否則異常 表達(dá),低表達(dá)或根本不表達(dá)。
在本發(fā)明的一些實(shí)施方案中,突變的DNA序列通過在至少一個(gè)密碼子中位點(diǎn)飽和 誘變產(chǎn)生。在其它的實(shí)施方案中,位點(diǎn)飽和誘變實(shí)施于兩個(gè)或更多的密碼子。在另一實(shí)施 方案中,突變的DNA序列具有與親本序列超過50 %,超過55 %,超過60%,超過65%,超過 70%,超過75%,超過80%,超過85%,超過90%,超過95%,超過98%或超過99%的同源 性。在備選實(shí)施方案中,突變DNA使用任何已知的誘變方法如,舉例來說,輻射,亞硝基胍等 等在體內(nèi)產(chǎn)生。希望DNA序列于是被分離和在本文提供的方法中使用。本文中使用的“異源蛋白”指的是非宿主細(xì)胞內(nèi)自然發(fā)生的蛋白質(zhì)或多肽。本文中使用的“同源蛋白”指的是細(xì)胞內(nèi)天然或自然發(fā)生的蛋白質(zhì)或多肽,并包括 由重組DNA技術(shù)或者細(xì)胞內(nèi)天然過表達(dá)的天然蛋白質(zhì)。如果酶在細(xì)胞內(nèi)以比其在相應(yīng)野生型細(xì)胞內(nèi)表達(dá)的水平更高的水平表達(dá),酶即為 在宿主細(xì)胞內(nèi)“過表達(dá)”。術(shù)語“蛋白質(zhì)”和“多肽”在本文中可互換使用。在本公開和權(quán)利要求中,使用用 于氨基酸殘基的常規(guī)單字母和三字母代碼。氨基酸三字母代碼定義與IUPAC-IUB生物化學(xué) 命名聯(lián)合委員會(huì)(JCBN) —致。也可以理解的是,由于基因密碼的簡(jiǎn)并性,多肽可以由不止 一個(gè)核苷酸序列編碼。通過下面的命名法描述本發(fā)明的變體[原始氨基酸殘基/位置/取代的氨基酸 殘基]。例如在76位用亮氨酸取代精氨酸被表示為R76L。當(dāng)多于一個(gè)氨基酸在給定位置 被取代,該取代被表示為DQ172C, Q172D或Q172R ;2)Q172C, D,R或c)Q172C/D/R??梢岳?解的是,當(dāng)本文鑒定的適合取代的位置沒有推薦的特定氨基酸,那么任何氨基酸殘基可以 取代該位置上存在的氨基酸殘基。與其它葡糖淀粉酶相比,變體葡糖淀粉酶包含缺失時(shí),該 缺失以標(biāo)示。例如,位置R76的缺失被表示為R76 *。兩個(gè)或更多個(gè)連續(xù)氨基酸的缺 失被標(biāo)示為,例如(76-78) *?!扒靶蛄小笔切盘?hào)序列和成熟蛋白之間對(duì)于蛋白質(zhì)分泌必需的氨基酸序列。切割前 序列將產(chǎn)生成熟有活性的蛋白質(zhì)。術(shù)語“信號(hào)序列”或“信號(hào)肽”指的是可以參與成熟或前體形式蛋白質(zhì)分泌的任何 核苷酸和/或氨基酸序列。信號(hào)序列的該定義是功能性定義,意味著包括由所述蛋白基因 的N-末端部分編碼的所有那些氨基酸序列,其參與蛋白分泌的完成。其經(jīng)常,但不總是,結(jié) 合于蛋白質(zhì)的N-末端部分或前體蛋白的N-末端部分。信號(hào)序列可以是內(nèi)源的或外源的。 信號(hào)序列可以通常情況下結(jié)合于所述蛋白質(zhì)(例如,葡糖淀粉酶)或可以來自編碼另一分 泌蛋白的基因。術(shù)語蛋白質(zhì)或肽的“前體”形式指的是具有有效連接于該蛋白質(zhì)的氨基或羰基末 端的前序列的成熟形式的蛋白質(zhì)。前體也可以具有有效連接于前序列氨基末端的“信號(hào)” 序列。前體也可以具有參與翻譯后活動(dòng)(例如,從中切割以產(chǎn)生成熟形式蛋白質(zhì)或肽的多 肽)的另外的多肽?!八拗骶辍被颉八拗骷?xì)胞”指的是包含根據(jù)本發(fā)明DNA的表達(dá)載體的適宜宿主。術(shù)語“來自”和“獲自,,不僅指由討論中的生物株系產(chǎn)生或可產(chǎn)生的葡糖淀粉酶, 也指由分離自如此株系的DNA序列編碼的和在包含如此DNA序列的宿主生物中產(chǎn)生的葡糖 淀粉酶。此外,該術(shù)語指由合成的和/或cDNA來源的DNA序列編碼的并且具有討論中的葡 糖淀粉酶確認(rèn)特征的葡糖淀粉酶。
該定義范圍內(nèi)的“衍生物”通常保持野生型,天然的或親本形式中觀察到的特征性 水解活性到這樣的程度,其使該衍生物可用于與野生型,天然的或親本形式相似的目的。葡 糖淀粉酶功能性的衍生物包含自然發(fā)生的,合成地或重組產(chǎn)生的肽或肽片段,其具有本發(fā) 明的葡糖淀粉酶的一般特征。術(shù)語“分離的”或“純化的”指的是從其起始環(huán)境中被移開的物質(zhì)(例如自然環(huán) 境,如果其是自然發(fā)生地)。在一些實(shí)施方案中,如通過SDS-PAGE確定,分離的蛋白質(zhì)是超 過10%純的,優(yōu)選超過20%純的,和更優(yōu)選超過30%純的。本發(fā)明另外的方面包括如通過 SDS-PAGE確定的高度純化形式的蛋白質(zhì)(即超過40 %純的,超過60 %純的,超過80 %純 的,超過90 %純的,超過95 %純的,超過97 %純的,和甚至超過99 %純的)。本文中使用的術(shù)語“組合誘變”指的是產(chǎn)生起始序列的變體文庫的方法。在這些 文庫內(nèi),變體包含選自預(yù)先確定的一組突變的一個(gè)或幾個(gè)突變。除此之外,方法提供了引 入隨機(jī)突變的手段,所述隨機(jī)突變不是預(yù)先確定的一組突變的成員。在一些實(shí)施方案中, 所述方法包括USP6,582,914中闡述的那些方法,在此并入作為參考。在備選的實(shí)施方案 中,組合誘變方法包括商業(yè)上可獲得的試劑盒(例如,QUIKCHANGE MUltisite, Stratagene, San Diego, CA)0本文中使用的術(shù)語“突變體文庫”指的是細(xì)胞群體,其基因組的大多數(shù)相同,但包 括一個(gè)或多個(gè)基因的不同同源物。這樣的文庫可以用于,例如,鑒定具有改良性狀的基因或 操縱子。本文中使用的術(shù)語“干燥固體含量(DS或ds) ”指的是漿液的總固體基于干重的百 分比。本文中使用的術(shù)語“起始命中”指的是通過篩選組合共有誘變文庫鑒定的變體。在 實(shí)施方案中,與起始基因相比,起始命中具有改善的性能特征。本文中使用的術(shù)語“改善的命中”指的是通過篩選增強(qiáng)的組合共有誘變文庫鑒定 的變體。本文中使用的術(shù)語“目標(biāo)特性”指的是將被改變的起始基因的特性。并不意圖將 本發(fā)明限定于任何具體的目標(biāo)特性。但是,在一些實(shí)施方案中,目標(biāo)特性是基因產(chǎn)物的穩(wěn)定 性(例如,對(duì)變性,蛋白水解或其它降解因素的抗性),而在其它的實(shí)施方案中,生產(chǎn)宿主中 的產(chǎn)物的水平改變。事實(shí)上,預(yù)期起始基因的任何特性都在本發(fā)明中得到應(yīng)用。術(shù)語的其 它定義可在說明書的各處出現(xiàn)。在更詳細(xì)描述示例性的實(shí)施方案之前,應(yīng)當(dāng)理解的是,本發(fā)明不限于本文描述的 具體實(shí)施方案,因?yàn)檫@些可以變化。也應(yīng)當(dāng)理解,本文中使用的術(shù)語只是為了描述具體的實(shí) 施方案,并無限制性意圖。當(dāng)提供數(shù)值范圍時(shí),應(yīng)當(dāng)理解,除非上下文另有明確規(guī)定,該范圍的上限和下限之 間的每個(gè)中間值,直至下限單位的十分之一,也被具體地公開。任何陳述值之間的每個(gè)更小 范圍或陳述范圍內(nèi)的中間值和任何其它公開的或所述公開范圍內(nèi)的中間值都包括在本發(fā) 明內(nèi)。這些更小范圍的上限或下限可以獨(dú)立地包括于或排除于該范圍,兩個(gè)端點(diǎn)之一,兩個(gè) 端點(diǎn)都不或都包括在更小范圍的每個(gè)范圍也包括在本發(fā)明之內(nèi),其受限于公開范圍內(nèi)任何 具體排除的界限。如果公開的范圍排除一個(gè)或兩個(gè)端點(diǎn),排除一個(gè)或者兩個(gè)所述被包括端 點(diǎn)的范圍也包括在本發(fā)明內(nèi)。
盡管與本文描述的那些方法和材料相似或等同的任何方法和材料可以用于實(shí)施或測(cè)試本發(fā)明,現(xiàn)在仍描述示例性的和優(yōu)選的方法和材料。本文提到的所有出版物并入本 文作為參考,以公開和描述與引用的出版物有關(guān)的方法和/或材料。除非上下文另有明確規(guī)定,單數(shù)形式包括復(fù)數(shù)指代。這樣,例如,提到“一個(gè)基因” 包括多個(gè)這樣的候選基因,提到“細(xì)胞”包括涉及一個(gè)或多個(gè)細(xì)胞和本領(lǐng)域技術(shù)人員知曉的 等同物,等等。本文中討論的出版物只有其公開早于本申請(qǐng)的申請(qǐng)日,才被提供。本文不承認(rèn)本 發(fā)明無權(quán)由于是在先發(fā)明而早于此類出版物。詳述的實(shí)施方案本發(fā)明的目的是改變親本葡糖淀粉酶,尤其是里氏木霉葡糖淀粉酶(TrGA)的特 性,例如熱穩(wěn)定性和/或比活性,以獲得具有改變特性的葡糖淀粉酶變體,其將會(huì)用于多種 應(yīng)用,例如淀粉轉(zhuǎn)化或乙醇發(fā)酵過程。親本葡糖淀粉酶在一些實(shí)施方案中,本發(fā)明提供了親本葡糖淀粉酶的葡糖淀粉酶變體。親本葡糖 淀粉酶可以包含與TrGA(SEQ ID NOs :2和/或3)有序列和/或結(jié)構(gòu)同一性的序列。在一 些實(shí)施方案中,親本葡糖淀粉酶包含如SEQ IDNOs :1,2,3,5,6,7,8或9中顯示的氨基酸序 列。在一些實(shí)施方案中,親本葡糖淀粉酶是同源物。在一些實(shí)施方案中,親本葡糖淀粉酶具 有與SEQ ID NO :2的TrGA氨基酸序列至少50%的序列同一性,至少60%的序列同一性, 至少70%的序列同一性,至少80%的序列同一性,至少85%的序列同一性,至少88%的序 列同一性,至少90%的序列同一性,至少93%的序列同一性,至少95%的序列同一性,至少 96 %的序列同一性,至少97 %的序列同一性,至少98 %的序列同一性,和至少99 %的序列 同一性。在一些實(shí)施方案中,親本葡糖淀粉酶包含催化區(qū),其具有與SEQ IDNO =1,2,3,5,6, 7或8中顯示的一個(gè)或多個(gè)氨基酸序列有至少50%的氨基酸序列同一性,至少60%的氨基 酸序列同一性,至少70%的氨基酸序列同一性,至少80%的氨基酸序列同一性,至少85% 的氨基酸序列同一性,至少90 %的氨基酸序列同一性,至少93 %的氨基酸序列同一性,至 少95%的氨基酸序列同一性,至少97%的氨基酸序列同一性和至少99%的氨基酸序列同 一性的氨基酸序列。在其它的實(shí)施方案中,親本葡糖淀粉酶將具有與SEQ IDNO :3的TrGA 氨基酸序列的催化區(qū)至少80%的序列同一性,至少85%的序列同一性,至少90%的序列同 一性,至少95%的序列同一性,至少97%的序列同一性,和至少98%的序列同一性。親本葡糖淀粉酶可以由DNA序列編碼,其在中等或高嚴(yán)格性條件下與編碼具有 SEQ ID N0:l,2或3的一個(gè)氨基酸序列的葡糖淀粉酶的DNA雜交。在一些實(shí)施方案中,具 有至少50%序列同一性,至少60%的氨基酸序列同一性,至少70%的氨基酸序列同一性, 至少80%的氨基酸序列同一性,至少90%的氨基酸序列同一性,至少95%的氨基酸序列同 一性和至少97%的氨基酸序列同一性的親本葡糖淀粉酶也具有與SEQ ID NOs :2和/或3 的結(jié)構(gòu)同一性。盡管親本葡糖淀粉酶是宿主細(xì)胞內(nèi)天然的或自然發(fā)生的序列,但在一些實(shí) 施方案中,親本葡糖淀粉酶是自然發(fā)生的變體。在一些實(shí)施方案中,親本葡糖淀粉酶是改造 的變體和/或雜合葡糖淀粉酶。葡糖淀粉酶的預(yù)測(cè)結(jié)構(gòu)和已知序列在真菌物種中是保守的(Coutinho等,(1994)Protein Eng. ,7 :393_400 和 Coutinho 等· , (1994), ProteinEng. ,7 :749_760)。在一 些實(shí)施方案中,親本葡糖淀粉酶是絲狀真菌葡糖淀粉酶。在一些實(shí)施方案中,親本葡 糖淀粉酶獲自木霉屬菌株(例如,里氏木霉,長(zhǎng)梗木霉(T. longibrachiatum),嚴(yán)緊木 霉(T. strictipilis),棘胞木霉(T. asperellum),康長(zhǎng)木霉(T. koni langbra)和哈茨 木霉(T.hazianum)),曲霉屬菌株(例如黑曲霉,構(gòu)巢曲霉,A. kawachi,泡盛曲霉和米曲 霉),踝節(jié)菌屬株(例如埃默森踝節(jié)菌(T. emersonii),濕熱踝節(jié)菌(T. thermophilus) 和T. duponti),肉座菌屬菌株(例如膠質(zhì)肉座菌(H. gelatinosa),東方肉座菌 (H. orientalis),H. vinosa,H. citrina),鐮孢屬菌株(例如,尖鐮孢(F. oxysporum),粉紅 鐮孢(F. roseum)和F. venenatum),脈孢菌屬菌株(例如粗糙脈孢菌(N. crassa))和腐質(zhì)霉 屬菌株(例如,灰腐質(zhì)霉,特異腐質(zhì)霉(H. insolens)和H. lanuginosa),青霉屬菌株(例如 點(diǎn)青霉或產(chǎn)黃青霉),或復(fù)膜孢酵母屬菌株(例如S. fibuligera)。在一些實(shí)施方案中,親本葡糖淀粉酶是細(xì)菌葡糖淀粉酶。例如,多肽可以獲自革蘭氏陽性菌株,例如芽孢桿菌(例如,嗜堿芽孢桿菌(B. alkalophilus),解淀粉芽孢桿菌 (B. amyloliquefaciens),遲緩芽孢桿菌(B. Ientus),地衣芽孢桿菌(B. Iicheniformis), 嗜熱脂肪芽孢桿菌(B. stearothermophilus),枯草芽孢桿菌(B. subtilis)和蘇云金芽孢 桿菌(B. thuringiensis))或鏈霉屬菌株(例如,淺青紫鏈霉菌(S. Iividans))。在一些其它實(shí)施方案中,親本葡糖淀粉酶將包含與SEQ ID NO :5或SEQ ID NO 6 的曲霉親本葡糖淀粉酶的催化區(qū)有至少90%序列同一性,至少93%序列同一性,至少95% 序列同一性,至少96%序列同一性,至少97%序列同一性,至少98%序列同一性和至少 99 %序列同一性的氨基酸序列。在其它實(shí)施方案中,親本葡糖淀粉酶將包含與SEQ ID NO 8的灰腐質(zhì)霉(HgGA)親 本葡糖淀粉酶的催化區(qū)有至少90%序列同一性,至少95%序列同一性,至少97%序列同一 性和至少99%序列同一性的氨基酸序列。在一些實(shí)施方案中,親本葡糖淀粉酶具有與SEQ ID NO :2或3的TrGA氨基酸序列 至少50%的序列同一性,至少60%的序列同一性,至少70%的序列同一性,至少80%的序 列同一性,至少85 %的序列同一性,至少88 %的序列同一性,至少90 %的序列同一性,至少 93 %的序列同一性,至少95 %的序列同一性,至少96 %的序列同一性,至少97 %的序列同 一性,至少98%的序列同一性和至少99%的序列同一性,并具有與SEQ IDNO :2或3的葡糖 淀粉酶的結(jié)構(gòu)同一性。在另外的實(shí)施方案中,木霉屬葡糖淀粉酶同源物可以獲自木霉屬或肉座菌屬的菌 株。有些木霉葡糖淀粉酶同源物在美國(guó)專利
發(fā)明者C·弗勒門, I·尼古拉耶夫, M·謝弗斯, P·范索林恩, R·R·博特, W·埃赫勒 申請(qǐng)人:丹尼斯科美國(guó)公司