專利名稱:新型糖基水解酶及其用途的制作方法
技術(shù)領(lǐng)域:
本公開內(nèi)容一般涉及糖基水解酶,包括此類酶的組合物,和使用所述酶和組合物的方法,例如用于將纖維素和半纖維素材料糖化或轉(zhuǎn)化為糖。3.背景自20世紀(jì)70年代起,當(dāng)OPEC減少原油輸出造成石油危機(jī)時(shí),將可再生的木質(zhì)纖維素生物量生物轉(zhuǎn)化為可發(fā)酵的糖類就已經(jīng)吸引了研究人員的廣泛關(guān)注(Bungay,H. R.,“Energy :the biomass options” · NY :Wiley, 1981 ;01sson L, Hahn-Hagerdal B. EnzymeMicrob Technol 1996,18 :312-31 ;Zaldivar, J 等人,Appl Microbiol Biotechnol 2001,56 :17-34 ;Galbe, M 等人,Appl Microbiol Biotechnol 2002,59 :618-28),所述糖類之后被發(fā)酵生產(chǎn)醇類(例如,乙醇),作為液體燃料的替代品。過(guò)去二十年間,乙醇已經(jīng)在USA被廣泛用作汽油的10%的摻合物,在巴西則被用作凈燃料。生物乙醇燃料的重要性將隨著石油價(jià)格飛漲和石油來(lái)源的逐漸耗竭而平行的增加。此外,可發(fā)酵的糖類正遞增的用于生產(chǎn)塑料、聚合物和其他基于生物的產(chǎn)品,并且預(yù)期在未來(lái)數(shù)年該工業(yè)將得到實(shí)質(zhì)性的擴(kuò)展。因而,對(duì)于豐富的低成本可發(fā)酵糖類的需求不斷增長(zhǎng),所述糖類可用作替代基于石油原料的原料。有用的可再生原料中主要是纖維素和半纖維素(木聚糖),其可以轉(zhuǎn)化為可發(fā)酵的糖類。由于多種酶的組合作用,發(fā)生這些多糖向可溶性糖的酶促轉(zhuǎn)化,例如葡萄糖、木糖、阿拉伯糖、半乳糖、甘露糖和/或其他己糖和戊糖。例如,內(nèi)切-1,4-β-葡聚糖酶(EG)和外切纖維二糖水解酶(CBH)催化不可溶的纖維素水解為纖維寡糖(例如,以纖維二糖為主要產(chǎn)物),而葡糖苷酶(BGL)催化寡糖轉(zhuǎn)化為葡萄糖。木聚糖酶與其他輔助蛋白(非限制性實(shí)例包括L-α -阿拉伯呋喃糖苷酶、阿魏酸和乙酰木聚糖酯酶、葡糖醛酸糖苷酶和β -木糖苷酶)一起催化半纖維素的水解。植物的細(xì)胞壁包括通過(guò)共價(jià)和非共價(jià)手段相互作用的復(fù)雜多糖的異源混合物。高等植物細(xì)胞壁的復(fù)雜多糖包括例如纖維素(β -I,4葡聚糖),纖維素一般構(gòu)成35-50%的在細(xì)胞壁組分中發(fā)現(xiàn)的碳。纖維素多聚體本身通過(guò)氫鍵、范德華氏相互作用和疏水性相互作用相關(guān)聯(lián),形成半結(jié)晶狀纖維素微纖絲。這些微纖絲還包括非結(jié)晶的區(qū)域,一般被稱為無(wú)定型纖維素。纖維素微纖絲包埋在由半纖維素(包括例如木聚糖、阿拉伯聚糖和甘露聚糖)、果膠(例如,聚半乳糖醛酸和半乳聚糖)和各種其他β_1,3和β-I,4葡聚糖形成的基質(zhì)中。這些基質(zhì)聚合物通常被例如阿拉伯糖、半乳糖和/或木糖殘基取代,產(chǎn)生高度復(fù)雜的阿拉伯木聚糖、阿拉伯半乳聚糖、半乳甘露聚糖和木葡聚糖。反過(guò)來(lái),半纖維素基質(zhì)被多酚木質(zhì)素包圍。
基質(zhì)的復(fù)雜性使得難以通過(guò)微生物降解,在酶可以作用于核心的纖維素微纖絲之前,必須降解木質(zhì)素和半纖維素組分。一般,降解細(xì)胞壁聚合物來(lái)釋放組分單糖需要不同酶活性的聯(lián)合。為了糖化植物細(xì)胞壁,必須滲透木質(zhì)素且破壞半纖維素,允許纖維素降解酶可以作用于它們的底物。不論纖維素原料的類型,酶的成本和水解效率是限制生物量生物轉(zhuǎn)化方法商業(yè)化的主要因素。微生物生產(chǎn)酶的生產(chǎn)成本與酶生產(chǎn)菌株的生產(chǎn)力及其在發(fā)酵培養(yǎng)基中的最終活性產(chǎn)量密切相關(guān)。多酶復(fù)合體的水解效率取決于每個(gè)酶的特性,它們之間的協(xié)同作用,以及它們?cè)诙嗝笓胶衔镏械谋壤?。本領(lǐng)域中存在這樣的需求,即鑒別能夠以改善的效率和產(chǎn)量,將植物和/或其他纖維素或半纖維素材料轉(zhuǎn)化為可發(fā)酵糖類的酶和/或酶摻合物/組合物。4.概述本公開內(nèi)容提供了某些具有半纖維素水解活性的糖基水解酶多肽,包括例如木聚
糖酶(例如,內(nèi)切木聚糖酶)、木糖苷酶(例如,β -木糖苷酶)、阿拉伯呋喃糖苷酶(例如,L-α-阿拉伯呋喃糖苷酶),編碼這些多肽的核酸,和用于制造和使用所述多肽和/或核酸的方法。本公開內(nèi)容是部分的基于發(fā)現(xiàn)具有木聚糖酶、β -木糖苷酶和/或L- α -阿拉伯呋喃糖苷酶活性的新型的酶和變體。本公開內(nèi)容還基于鑒別出有效催化纖維素和半纖維素材料水解的酶摻合物(或組合物)。出于本公開內(nèi)容的目的,酶可以定義為具有特定酶活性的多肽,或者是所述酶。例如木聚糖酶可以指具有木聚糖酶活性的多肽或是木聚糖酶,β_木糖苷酶可以指具有木糖苷酶活性的多肽或者木糖苷酶。本公開內(nèi)容的酶和/或酶摻合物/組合物可用于從生物量生產(chǎn)糖類。如此生產(chǎn)的糖類可被微生物用于乙醇生產(chǎn)或可用于生產(chǎn)多種工業(yè)應(yīng)用中的其他生物產(chǎn)品。因此,本公開內(nèi)容還提供了使用本文所述的酶和/或酶摻合物/組合物的工業(yè)應(yīng)用(例如,乙醇生產(chǎn)中的糖化方法)。本公開內(nèi)容的酶和/或酶摻合物/組合物可用于減少生物燃料生產(chǎn)中的酶成本。在一個(gè)方面,本公開內(nèi)容的發(fā)明涉及有效用于水解木質(zhì)纖維素生物量的主要組分(包括例如,纖維素、半纖維素和木質(zhì)素)或任何包含纖維素和/或半纖維素的材料的酶(包括其變體)或酶摻合物/組合物。此類木質(zhì)纖維素生物量和/或包括纖維素和/或半纖維素的材料包括例如種子、谷類、塊莖、食品加工或工業(yè)加工的植物廢棄物或副產(chǎn)物(例如,莖)、玉米(包括例如,玉米棒、秸桿等)、草(例如,印度草,如印度落芒草(Sorghastrum nutans);或柳枝稷(switchgrass),如黍?qū)?Panicum)物種,例如柳枝稷(Panicum virgatum))、木材(包括例如,木屑、下腳料)、紙、紙衆(zhòng)、再生紙(例如,報(bào)紙)。本發(fā)明的酶摻合物/組合物可用于水解在植物之間不相同的復(fù)雜結(jié)構(gòu)的纖維素(其包含線性鏈狀的β -1,4-連接的葡萄糖部分),或半纖維素。本發(fā)明的酶摻合物/組合物可包括多種不同的酶,包括例如纖維素酶和/或半纖維素酶。例如,本發(fā)明的酶摻合物/組合物可以用于水解生物量或適宜地原料。本發(fā)明的酶摻合物/組合物理想的包括酶的混合物,選自例如木聚糖酶、木糖苷酶、纖維二糖水解酶、阿拉伯呋喃糖苷酶和/或其他可以消化半纖維素為單體糖的酶。本發(fā)明的酶摻合物/組合物可包括兩種或多種、三種或多種,或四種或多種的酶的混合物,所述酶選自一種或多種木聚糖酶、一種或多種木糖苷酶、一種或多種纖維二糖水解酶、一種或多種阿拉伯呋喃糖苷酶和一種或多種其他能夠?qū)肜w維素轉(zhuǎn)化為單體糖的酶??梢韵肜w維素為單體糖的其他的酶包括但不限于纖維素酶、半纖維素酶或包含纖維素酶或半纖維素酶的組合物。本發(fā)明的酶摻合物/組合物可包括兩種或多種、三種或多種,或四種或多種的酶的混合物,所述酶選自木聚糖酶、木糖苷酶、纖維二糖水解酶、阿拉伯呋喃糖苷酶和至少一種其他可以轉(zhuǎn)化半纖維素為單體糖的酶。本發(fā)明的酶摻合物/組合物的非限制性實(shí)例包括木聚糖酶、木糖苷酶、纖維二糖水解酶、阿拉伯呋喃糖苷酶和β-葡糖苷酶的混合物。本發(fā)明的酶摻合物/組合物適合是非天然存在的。如本文中使用的,術(shù)語(yǔ)“天然存在的組合物”指由天然存在的來(lái)源生產(chǎn)的組合物,包括一種或多種酶組分或活性,其中每種這些組分或活性都被發(fā)現(xiàn)處于天然存在的來(lái)源所產(chǎn)生的比例和水平,如同在自然的、未被人工接觸和修飾的條件下發(fā)現(xiàn)的。相應(yīng)的,天然存在的組合物是例如由對(duì)于纖維素水解或半纖維素水解酶沒有修飾的生物體所生產(chǎn)的組合物,使得所述組分酶的比例或水平與天然環(huán)境中的天然生物體所生產(chǎn)的沒有變化。另一方面,“非天然存在的組合物”指由以下生產(chǎn)的組合物(1)以天然存在的比例或非天然存在的(即,改變的)比例組合的纖維素水解或半纖維素水解組分酶;或(2)修飾生物體使得表達(dá)、過(guò)表達(dá)或低表達(dá)一種或多種內(nèi)源性或外源性酶;或⑶修飾生物體使得刪除了至少一種內(nèi)源性酶。“非天然存在的組合物”還可以指由天然存在的和未修飾的生物體所生產(chǎn)的組合物,但所述生物體培養(yǎng)在不同于生物體的天然環(huán)境的人造基質(zhì)或環(huán)境中,使得組合物中特定酶的量或重量比不同于由天然棲息地中生長(zhǎng)的天然生物體所制造的組合物中存在的量或重量比。本文所述的本發(fā)明的酶摻合物/組合物是例如發(fā)酵培養(yǎng)基。發(fā)酵培養(yǎng)基可以是絲狀真囷之一,包括例如木霉屬、腐質(zhì)霉屬、鍵抱霉屬、曲霉屬、脈抱囷屬、青霉屬、頭抱霉屬、綿霉屬、柄孢殼屬、內(nèi)座殼屬、毛霉屬、旋孢腔菌、梨孢屬(Pyricularia)或金孢子菌屬(Chrysosporium)。木霉屬物種的示例性真菌是里氏木霉(Trichoderma reesei)。青霉屬物種的示例性真菌是繩狀青霉(Penicillium funiculosum)。發(fā)酵培養(yǎng)基可以是例如無(wú)細(xì)胞的發(fā)酵培養(yǎng)基或全細(xì)胞培養(yǎng)基。在另一個(gè)實(shí)例中,本文所述的本發(fā)明的酶摻合物/組合物是纖維素酶組合物。纖維素酶組合物是絲狀真菌的纖維素酶組合物,包括例如木霉,如里氏木霉的纖維素酶組合物。纖維素酶組合物可以由絲狀真菌生產(chǎn),例如木霉,如里氏木霉。例如,本發(fā)明的酶摻合物/組合物可包括(a) —種或多種木聚糖酶,其中所述一種或多種木聚糖酶的至少一種是里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2或AfuXyn5 ; (b)一種或多種木糖苷酶,其中至少一種所述一種或多種木糖苷酶是I型β-木糖苷酶或2型β -木糖苷酶,其中I型β -木糖苷酶是Fv3A或Fv43A,2型β -木糖苷酶是Pf43A、Fv43D、Fv39A、Fv43E、Fo43A、Fv43B、Pa51A、Gz43A 或里氏木霉 Bxll ; (c) 一種或多種L-α -阿拉伯呋喃糖苷酶,其中至少一種所述一種或多種L-α -阿拉伯呋喃糖苷酶是Af43A、Fv43B、Pf51A、Pa51A或Fv51A ; (d) 一種或多種纖維素酶;和任選的(e) 一種或多種其他組分。酶摻合物/組合物適宜地是非天然存在的。根據(jù)calcofluor測(cè)定所確定的,(d)的一種或多種纖維素酶理想的能夠達(dá)到至少O. 00005級(jí)分產(chǎn)物/毫克蛋白質(zhì)/克磷酸溶脹的纖維素(PASC)。在非限制性的實(shí)例中,組合物中的木聚糖酶的組合重量可代表或構(gòu)成組合物中組合的或總蛋白重量的5wt%至45wt% (例如,5wt%至25wt %, 5wt %至15wt%,15wt% ),而β -木糖苷酶的組合重量可代表或構(gòu)成組合物中總蛋白重量的 2wt% 至 50wt% (例如,2wt% 至 30wt%, 5wt% 至 25wt%, 5wt% 至 10wt% ), L- α -阿拉伯呋喃糖苷酶的組合重量可代表或構(gòu)成組合物中組合的或總蛋白重量的2 〖%至50wt%(例如,2¥七%至3(^七%,2¥七%至2(^七%,5¥七%至15¥七%,5¥七%至10wt% ),而纖維素酶的組合重量可代表或構(gòu)成組合物中組合的或總蛋白重量的30wt %至80wt % (例如,40wt %至70被%,50被%至60wt% )。如本文所述的酶摻合物/組合物是例如發(fā)酵培養(yǎng)基組合物。發(fā)酵培養(yǎng)基是例如一種絲狀真菌,包括但不限于木霉屬、腐質(zhì)霉屬、鐮孢霉、曲霉屬、脈孢菌屬、青霉屬、頭孢霉屬、綿霉屬、柄孢殼屬、內(nèi)座殼屬、毛霉屬、旋孢腔菌、梨孢屬或金孢子菌屬。木霉屬物種的示例性真菌是里氏木霉。青霉屬物種的示例性真菌是繩狀青霉。發(fā)酵可以是例如無(wú)細(xì)胞的發(fā)酵培養(yǎng)基或全細(xì)胞培養(yǎng)基。如本文所述的酶摻合物/組合物還可以是纖維素酶組合物,例如絲狀真菌的纖維素酶組合物。纖維素酶組合物可以由絲狀真菌生產(chǎn),例如木霉屬。例如,本發(fā)明的酶摻合物/組合物可包括(a) —種或多種木聚糖酶,其中至少一種所述一種或多種木聚糖酶是里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2或AfuXyn5 ; (b) 一種
或兩種I型β -木糖苷酶Fv3A或Fv43A ; (c) 一種或多種選自Pf43A、Fv43D、Fv39A、Fv43E、Fo43A、Fv43B、Pa51A、Gz43A和/或里氏木霉Bxll的2型β -木糖苷酶;(d) 一種或多種纖維素酶;和任選的(e) —種或多種其他組分。根據(jù)calcofluor測(cè)定所確定的,(d)的一種或多種纖維素酶理想的能夠達(dá)到至少O. 00005級(jí)分產(chǎn)物/毫克蛋白質(zhì)/克磷酸溶脹的纖維素(PASC)。酶摻合物/組合物適宜地是非天然存在的。在非限制性的實(shí)例中,組合物中的木聚糖酶的組合重量可代表或構(gòu)成組合物中組合的或總蛋白重量的5¥丨%至45wt% (例如,5wt%至25wt%, 5wt%至15wt%, IOwt %至15wt% ),而I型β -木糖苷酶的組合重量可構(gòu)成組合物中總蛋白重量的2wt%至50wt% (例如,2wt%至30wt %, 5wt %至
至10wt% ),而2型β -木糖苷酶的組合重量可構(gòu)成組合物中總蛋白重量的2¥七%至50界七%(例如,2wt%至30wt %, 5wt %至25wt %, 5wt %至10wt% ),其中纖維素酶的組合重量可代表或構(gòu)成組合物中組合的或總蛋白重量的3(^七%至80wt% (例如,4(^七%至70wt%,50界七%至60wt% )。I型β -木糖苷酶的重量與2型β -木糖苷酶的重量的比例可以是例如 I : 10 至 10 1(例如,I 8 至 8 1、1 6 至 6 1、1 4 至 4 1、1 2 至 2 I或I : I)。酶摻合物/組合物可進(jìn)一步包含額外的組分,可以是輔助蛋白或其他蛋白質(zhì)/非蛋白質(zhì)組分。額外的組分可以構(gòu)成例如組合物中的總蛋白重量的^^%至50wt%、lwt%至lOwt^dwt1^至Swt^jwt^至IOwt %或5wt%至20wt%。如本文所述的酶摻合物/組合物是例如發(fā)酵培養(yǎng)基組合物。發(fā)酵培養(yǎng)基是例如一種絲狀真菌,包括但不限于木霉屬、腐質(zhì)霉屬、鍵抱霉、曲霉屬、脈抱圃屬、青霉屬、頭抱霉屬、綿霉屬、柄抱殼屬、內(nèi)座殼屬、毛霉屬、旋孢腔菌、梨孢屬或金孢子菌屬。木霉屬物種的示例性真菌是里氏木霉。青霉屬物種的示例性真菌是繩狀青霉。發(fā)酵可以是例如無(wú)細(xì)胞的發(fā)酵培養(yǎng)基或全細(xì)胞培養(yǎng)基。如本文所述的酶摻合物/組合物還可以是纖維素酶組合物,例如絲狀真菌的纖維素酶組合物。纖維素酶組合物可以由絲狀真菌生產(chǎn),例如木霉屬。在其他實(shí)例中,本發(fā)明的酶摻合物/組合物可包括(a) —種或多種木聚糖酶,其中至少一種所述一種或多種木聚糖酶是里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2或AfuXyn5 ;(b) 一種或多種β-木糖苷酶,其中至少一種所述一種或多種β_木糖苷酶是I型β_木糖苷酶或2型β-木糖苷酶,其中I型β-木糖苷酶是Fv3A或Fv43A,2型β -木糖苷酶是 Pf43A、Fv43D、Fv39A、Fv43E、Fo43A、Fv43B、Pa51A、Gz43A 和 / 或里氏木霉 Bxll ; (c) 一種或多種L-α -阿拉伯呋喃糖苷酶,其中至少一種所述一種或多種L-α -阿拉伯呋喃糖苷酶是Af43A、Fv43B、Pf51A或Fv51A ;(d) —種或多種β _葡糖苷酶;和任選的(e) —種或多種其他組分。酶摻合物/組合物適宜地是非天然存在的。在非限制性的實(shí)例中,組合物中的木聚糖酶的組合重量可代表或構(gòu)成組合物中組合的或總蛋白重量的5¥丨%至45¥丨% (例如,5wt%至至15wt%, 10wt%至15wt% ),而β -木糖苷酶的組合重量可構(gòu)成組合物中總蛋白重量的2wt%至50wt% (例如,2wt%至30wt %, 5wt %至至10wt% ),L-α-阿拉伯呋喃糖苷酶的組合重量可構(gòu)成組合物中總蛋白重量的2¥丨%至50wt% (例如,2¥七%至3(^七%,5¥七%至25¥七%,5¥七%至1(^七%),其中,β-葡糖苷酶的組合重量可構(gòu)成組合物中組合的或總蛋白重量的2wt%至50wt% (例如,多達(dá)SOwt^dwt1^至10wt%,或3 丨%至8 丨% )。酶摻合物/組合物可進(jìn)一步包含額外的組分,可以是輔助蛋白或其他蛋白質(zhì)/非蛋白質(zhì)組分。額外的組分可以構(gòu)成例如組合物中的總蛋白重量的
Iwt % 至 50wt %、Iwt % 至 IOwt %、2wt % 至 5wt %、5wt % 至 IOwt % 或 5wt % 至 20wt %。如本文所述的酶摻合物/組合物是例如發(fā)酵培養(yǎng)基組合物。發(fā)酵培養(yǎng)基是例如一種絲狀真菌,包括但不限于木霉屬、腐質(zhì)霉屬、鍵抱霉、曲霉屬、脈抱圃屬、青霉屬、頭抱霉屬、綿霉屬、柄孢殼屬、內(nèi)座殼屬、毛霉屬、旋孢腔菌、梨孢屬或金孢子菌屬。木霉屬物種的示例性真菌是里氏木霉。青霉屬物種的示例性真菌是繩狀青霉。發(fā)酵可以是例如無(wú)細(xì)胞的發(fā)酵培養(yǎng)基或全細(xì)胞培養(yǎng)基。如本文所述的酶摻合物/組合物還可以是纖維素酶組合物,例如絲狀真菌的纖維素酶組合物。纖維素酶組合物可以由絲狀真菌生產(chǎn),例如木霉屬。本發(fā)明的酶摻合物/組合物還可包括例如(a) —種或多種木聚糖酶,其中至少一種所述一種或多種木聚糖酶是里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2或AfuXyn5 ; (b) 一種或兩種的I型β -木糖苷酶Fv3A或Fv43A ; (c) 一種或多種選自Pf43A、Fv43D、Fv39A、Fv43E、Fo43A、Fv43B、Pa51A、Gz43A和/或里氏木霉Bxll的2型β -木糖苷酶;(d) 一種或多種β_葡糖苷酶;和任選的(e) —種或多種其他組分。酶摻合物/組合物適宜地是非天然存在的。在非限制性的實(shí)例中,木聚糖酶的組合重量構(gòu)成組合物中總蛋白重量的5wt%至 45wt% (例如,5wt% 至 25wt%, 5wt% 至 15wt%, IOwt % 至 15wt% ),而 I 型 β -木糖苷酶的組合重量構(gòu)成組合物中總蛋白重量的2wt%至50wt% (例如,2wt%至SOwtWAwt1^至25¥七%,5¥七%至10wt% ),而2型β-木糖苷酶的組合重量構(gòu)成組合物中總蛋白重量的2wt% 至 50wt% (例如,2wt% 至 30wt%, 5wt% 至 25wt%, 5wt% 至 10wt% ), β -葡糖苷酶的組合重量構(gòu)成組合物中總蛋白重量的2wt%至50wt% (例如,2wt%至30wt %, 5wt %至至IOwt%)。I型β-木糖苷酶的重量與2型β -木糖苷酶的重量的比例可以是例如 I : 10 至 10 I (例如,I :8 至 8: I、1:6 至 6: I、1:4 至 4: I、1:2至2 I或I : I)。酶摻合物/組合物可進(jìn)一步包含額外的組分,可以是輔助蛋白或其他蛋白質(zhì)/非蛋白質(zhì)組分。額外的組分可以構(gòu)成例如組合物中的總蛋白重量的Iwt %至50wt %、Iwt %至10wt%、2wt%至5wt%、5wt%至IOwt %或5wt%至20wt%。如本文所述的酶慘合物/組合物是例如發(fā)酵培養(yǎng)基組合物。發(fā)酵培養(yǎng)基是例如一種絲狀真菌的發(fā)酵培養(yǎng)基,包括但不限于木霉屬、腐質(zhì)霉屬、鍵抱霉、曲霉屬、脈抱圃屬、青霉屬、頭抱霉屬、綿霉屬、柄抱殼屬、內(nèi)座殼屬、毛霉屬、旋孢腔菌、梨孢屬或金孢子菌屬。木霉屬物種的示例性真菌是里氏木霉。青霉屬物種的示例性真菌是繩狀青霉。發(fā)酵可以是例如無(wú)細(xì)胞的發(fā)酵培養(yǎng)基或全細(xì)胞培養(yǎng)基。如本文所述的酶摻合物/組合物還可以是纖維素酶組合物,例如絲狀真菌的纖維素酶組合物。纖維素酶組合物可以由絲狀真菌生產(chǎn),例如木霉屬。此外,本發(fā)明的酶摻合物/組合物可包括,例如(a) —種或多種木聚糖酶,其中至少一種所述一種或多種木聚糖酶是里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2或AfuXyn5 ; (b)一種或多種β -木糖苷酶,其中至少一種所述一種或多種木糖苷酶是I型β-木糖苷酶或2型β-木糖苷酶,其中I型β-木糖苷酶可以是Fv3A或Fv43A,2型β-木糖苷酶可以是 Pf43A、Fv43D、Fv39A、Fv43E、Fo43A、Fv43B、Pa51A、Gz43A 和 / 或里氏木霉 Bxll ;和(c)一種或多種L-α -阿拉伯呋喃糖苷酶,其中至少一種所述一種或多種L-α -阿拉伯呋喃糖苷酶是Af43A、Fv43B、Pf51A或Fv51A ;和任選的(d) —種或多種其他組分。酶摻合物/組合物適宜地是非天然存在的。在非限制性的實(shí)例中,組合物中的木聚糖酶的組合重量構(gòu)成組合物中總蛋白重量的5wt%至45wt% (例如,5wt%至25wt%, 5wt%至15wt%, 10wt%至15wt%),而β-木糖苷酶的組合重量構(gòu)成組合物中總蛋白重量的(例如,2wt%至30wt%, 5wt%至25wt%, 5wt%至IOwt % ) ,L-α -阿拉伯呋喃糖苷酶的組合重量構(gòu)
成組合物中總蛋白重量的2wt%至50wt% (例如,2wt%至30wt %, 5wt %至
至10wt% )。酶摻合物/組合物可進(jìn)一步包含額外的組分,可以是輔助蛋白或其他蛋白質(zhì)/非蛋白質(zhì)組分。額外的組分可以構(gòu)成例如組合物中的總蛋白重量的Iwt %至50wt %、Iwt %至lOwt^dwt1^至Swt^jwt^至IOwt %或5wt%至20wt%。如本文所述的酶摻合物/組合物是例如發(fā)酵培養(yǎng)基組合物。發(fā)酵培養(yǎng)基是例如一種絲狀真菌,包括但不限于木霉屬、腐質(zhì)霉屬、鍵抱霉、曲霉屬、脈抱圃屬、青霉屬、頭抱霉屬、綿霉屬、柄抱殼屬、內(nèi)座殼屬、毛霉屬、旋孢腔菌、梨孢屬或金孢子菌屬。木霉屬物種的示例性真菌是里氏木霉。青霉屬物種的示例性真菌是繩狀青霉。發(fā)酵可以是例如無(wú)細(xì)胞的發(fā)酵培養(yǎng)基或全細(xì)胞培養(yǎng)基。如本文所述的酶摻合物/組合物還可以是纖維素酶組合物,例如絲狀真菌的纖維素酶組合物。纖維素酶組合物可以由絲狀真菌生產(chǎn),例如木霉屬。本發(fā)明的酶摻合物/組合物還可以是包括(a) —種或多種木聚糖酶,其中至少一種所述一種或多種木聚糖酶是里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2或AfuXyn5 ; (b) 一種或兩種的I型β -木糖苷酶Fv3A或Fv43A ; (c) 一種或多種選自Pf43A、Fv43D、Fv39A、Fv43E、Fo43A、Fv43B、Pa51A、Gz43A和/或里氏木霉Bxll的2型β-木糖苷酶;和任選的(d)一種或多種其他組分。酶摻合物/組合物適宜地是非天然存在的。在非限制性的實(shí)例中,木聚糖酶的組合重量構(gòu)成組合物中總蛋白重量的5wt%至45wt% (例如,5wt%至25wt%,5wt%至15wt%, 10wt%至15wt% ),而I型β -木糖苷酶的組合重量構(gòu)成組合物中總蛋白重量的 2wt % 至 50wt % (例如,2wt % 至 30wt %, 5wt % 至 25wt %, 5wt % 至 IOwt % ),而 2型木糖苷酶的組合重量構(gòu)成組合物中總蛋白重量的(例如,2¥丨%至30界七%,5¥丨%至25¥丨%,5¥丨%至10wt% )。I型木糖苷酶的重量與2型β -木糖苷酶的重量的比例可以是例如I : 10至10 I (例如,I : 8至8 : 1、1 : 6至6 : 1、1 : 4至4 : 1、1 : 2至2 : I或I : I)。酶摻合物/組合物可進(jìn)一步包含額外的組分,可以是輔助蛋白或其他蛋白質(zhì)/非蛋白質(zhì)組分。額外的組分可以構(gòu)成例如組合物中的總蛋白重量的 Iwt %至 50wt%、Iwt %至 IOwt %、2wt%至 5wt%、5wt%至 IOwt %或 5wt%至 20wt%。如本文所述的酶摻合物/組合物是例如發(fā)酵培養(yǎng)基組合物。發(fā)酵培養(yǎng)基是例如一種絲狀真囷,包括但不限于木霉屬、腐質(zhì)霉屬、鍵抱霉、曲霉屬、脈抱囷屬、青霉屬、頭抱霉屬、綿霉屬、柄孢殼屬、內(nèi)座殼屬、毛霉屬、旋孢腔菌、梨孢屬或金孢子菌屬。木霉屬物種的示例性真菌是里氏木霉。青霉屬物種的示例性真菌是繩狀青霉。發(fā)酵可以是例如無(wú)細(xì)胞的發(fā)酵培養(yǎng)基或全細(xì)胞培養(yǎng)基。如本文所述的酶摻合物/組合物還可以是纖維素酶組合物,例如絲狀真菌的纖維素酶組合物。纖維素酶組合物可以由絲狀真菌生產(chǎn),例如木霉屬。本公開內(nèi)容的酶、酶摻合物/組合物可用于食品工業(yè),例如烘焙、水果和蔬菜加工、降解農(nóng)業(yè)廢棄物、生產(chǎn)動(dòng)物飼料、生產(chǎn)紙漿和紙、生產(chǎn)紡織物或者家用和工業(yè)清潔劑。本公開內(nèi)容的酶和酶摻合物/組合物中的酶是例如由微生物獨(dú)立生產(chǎn)的,例如由真菌或細(xì)菌。本公開內(nèi)容的酶、酶摻合物/組合物還可用作消化任何合適來(lái)源的木質(zhì)纖維素的商業(yè)酶或組合物,包括所有的生物學(xué)來(lái)源,例如植物生物量,如玉米、谷類、草(例如,印
度草,如印度落芒草(Sorghastrum nutans);或柳枝稷,如黍(Panicum)物種,例如柳枝稷(Panicum virgatum))或者,木材或木材加工的副產(chǎn)物,例如木材加工、紙衆(zhòng)和/或造紙業(yè)、紡織物生產(chǎn)、家用和工業(yè)清潔劑和/或生物量廢棄物加工中的副產(chǎn)物。在另一個(gè)方面,本公開內(nèi)容提供了分離的、合成的或重組的核酸,其與SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、46、47、48、49 或 50 的核酸序列,在至少約 10 個(gè),例如至少約 15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、I150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950或2000個(gè)殘基的區(qū)域,具有至少約70%,例如至少約71 %、72%、73%、74%、75%、76%,77%,78%,79%,80%,81 %,82%,83%,84%,85%,86%,87%,88% ;89%,90%,91%、92%、93%、94%、95%、96%、97%、98%、99%或完全(100%)的序列同一性。相關(guān)的,本公開內(nèi)容提供了分離的、合成的或重組的核酸,其能夠在高嚴(yán)緊條件下,與SEQ IDNO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、46、47、48、49 或 50的核酸序列的97%、98%、99%或完全(100%)的序列同一性的互補(bǔ)體,或與其片段雜交。片段可以是例如長(zhǎng)度上至少150個(gè)連續(xù)殘基,例如長(zhǎng)度是至少200、250或300個(gè)連續(xù)殘基。本公開內(nèi)容提供了編碼具有半纖維素水解活性的多肽的核酸。示例性的半纖維素水解活性包括但不限于木聚糖酶、β_木糖苷酶和/或L-α-阿拉伯呋喃糖苷酶活性。示例性的具有半纖維素水解活性的多肽包括但不限于木聚糖酶、β -木糖苷酶和/或L- α -阿拉伯呋喃糖苷酶。本公開內(nèi)容進(jìn)一步提供了分離的、合成的或重組的核酸,其編碼本公開內(nèi)容的酶,包括包含SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43或44的氨基酸序列或其子序列(例如,催化結(jié)構(gòu)域(“CD”)或碳水化合物結(jié)合模塊(“CBM”))的多肽,或其適宜地變體。在一些實(shí)施方案中,本公開內(nèi)容的核酸編碼氨基酸序列為 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43或44的蛋白質(zhì)的成熟部分,任選的與異源信號(hào)序列有效連接,例如里氏木霉CBHI信號(hào)序列。核酸理想的編碼具有半纖維素水解活性的多肽,例如,木聚糖酶、β_木糖苷酶和/或L-α-阿拉伯呋喃糖苷酶活性。本公開內(nèi)容的核酸編碼半纖維素酶,例如木聚糖酶、β-木糖苷酶和/或L-α -阿拉伯呋喃糖苷酶,或其適宜地變體。本公開內(nèi)容的其他核酸描述在下文6.2節(jié)中。本公開內(nèi)容額外的提供了包含本公開內(nèi)容的核酸或其子序列的表達(dá)盒。例如,核酸與 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、46、47、48、49或50的核酸序列,在至少約10個(gè),例如至少約10、20、30、40、50、75、90、100、150、200、250、300、350、400或500個(gè)殘基的區(qū)域,包括至少約70 %,例如至少約75 %、80 %、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 的序列同一性。在另一個(gè)實(shí)例中,核酸編碼 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43或44的多肽,其中所述核酸任選的與啟動(dòng)子有效連接。啟動(dòng)子可以是例如真菌、病毒、細(xì)菌、哺乳動(dòng)物或植物的啟動(dòng)子。啟動(dòng)子可以是組成型啟動(dòng)子或可誘導(dǎo)型啟動(dòng)子。示例性的合適啟動(dòng)子是在絲狀真菌中可表達(dá)的啟動(dòng)子,例如在里氏木霉中可表達(dá)的啟動(dòng)子。適宜地啟動(dòng)子可以源自絲狀真菌例如里氏木霉,如里氏木霉的纖維二糖水解酶I (cbhl)
基因的啟動(dòng)子。本公開內(nèi)容進(jìn)一步提供了重組細(xì)胞,所述細(xì)胞經(jīng)改造表達(dá)本公開內(nèi)容的核酸或本公開內(nèi)容的表達(dá)盒。例如,核酸與 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、46、47、48、49或50的核酸序列,在至少約10個(gè),例如至少約15、20、25、50、75、100、150、200、250、300、400或500個(gè)核苷酸殘基的區(qū)域,包括至少約70 %,例如至少約 75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 的序列同一性。核酸可以編碼SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43或44的多肽,其中所述核酸任選的與啟動(dòng)子有效連接。表達(dá)盒可以包括這樣的核酸,所述核酸與 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、46、47、48、49或50的核酸序列,在至少約10個(gè)核苷酸殘基的區(qū)域具有至少約 70% (例如至少約 75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)的序列同一性。例如,表達(dá)盒可以包括編碼SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43 或 44 的多肽的核酸,其中所述核酸任選的與啟動(dòng)子有效連接。重組細(xì)胞理想的是重組細(xì)菌細(xì)胞、重組哺乳動(dòng)物細(xì)胞、重組真菌細(xì)胞、重組酵母細(xì)胞、重組昆蟲細(xì)胞、重組藻類細(xì)胞或重組植物細(xì)胞。例如,重組細(xì)胞是重組的絲狀真圃細(xì)胞,例如木霉屬、腐質(zhì)霉屬、鍵抱霉、曲霉屬、脈抱圃屬、青霉屬、頭抱霉屬、綿霉屬、柄孢殼屬、內(nèi)座殼屬、毛霉屬、旋孢腔菌、梨孢屬或金孢子菌屬細(xì)胞。本公開內(nèi)容提供了包含本公開內(nèi)容的核酸或本公開內(nèi)容的表達(dá)盒的轉(zhuǎn)基因植物。本公開內(nèi)容提供了分離的、合成的或重組的多肽,其包括與SEQ IDNO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43 或 44 的多肽在至少約 10個(gè),例如至少約 15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325或350個(gè)殘基的區(qū)域,或在全長(zhǎng)的未成熟多肽、全長(zhǎng)的成熟多肽、全長(zhǎng)的⑶或全長(zhǎng)的CBM上,具有至少約80%,例如至少約81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 或完全的(100% )序列同一性的氨基酸序列。示例性的多肽包括長(zhǎng)度至少約10個(gè),例如至少約 15、20、25、30、35、40、45、50、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600個(gè)殘基的片段。在特定的實(shí)施方案中,片段包括⑶和/或CBM。當(dāng)片段同時(shí)包括本公開內(nèi)容的酶的CD和CBM時(shí),片段任選的包括分開CD和CBM的接頭。接頭可以是天然接頭或異源的接頭。在某些實(shí)施方案中,本公開內(nèi)容的多肽具有一種或多種半纖維素酶活性。本公開內(nèi)容的多肽或肽序列是由本公開內(nèi)容的核酸編碼的。示例性的多肽描述在6. I節(jié)中。本公開內(nèi)容額外的提供了嵌合的或融合的蛋白質(zhì),所述蛋白質(zhì)包括本公開內(nèi)容的多肽的至少一個(gè)結(jié)構(gòu)域(例如,CD、CBM或兩者)。至少一個(gè)結(jié)構(gòu)域可以與第二氨基酸序列有效連接,例如,信號(hào)肽序列。相反,本公開內(nèi)容提供了嵌合的或融合的蛋白質(zhì),所述蛋白質(zhì)包括本公開內(nèi)容的多肽的信號(hào)序列與第二序列有效連接,例如編碼不與信號(hào)序列天然相關(guān)的異源多肽的氨基酸序列。相應(yīng)的,本公開內(nèi)容提供了包括SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43 或 44 的殘基 I 至 13、1 至 14、1 至 15、1 至 16、1 至 17、1至 18、1 至 19、1 至 20、1 至 21、1 至 22、1 至 23、1 至 24、1 至 25、1 至 26、1 至 27、1 至 28、1至 28、1 至 30、1 至 31、1 至 32、1 至 33、1 至 34、1 至 35、1 至 36、1 至 37、1 至 38 或 I 至 40的重組多肽。其他的示例性的嵌合或融合多肽描述在6. I. I節(jié)中。本公開內(nèi)容還提供了生產(chǎn)重組多肽的方法,包括(a)培養(yǎng)經(jīng)改造表達(dá)本公開內(nèi)容的多肽的宿主細(xì)胞;和(b)回收所述多肽。多肽的回收包括例如回收包含多肽的發(fā)酵培養(yǎng)基。在某些實(shí)施方案中,多肽的回收可以包括其他純化步驟。本公開內(nèi)容提供了水解、降解或打斷包含纖維寡糖、阿拉伯木聚糖寡聚物或葡聚糖或纖維素的組合物的方法,包括在適宜地條件下將所述組合物與本公開內(nèi)容的酶、酶摻合物/組合物接觸,其中所述酶或酶摻合物/組合物水解、降解或打斷包含纖維寡糖、阿拉伯木聚糖寡聚物或葡聚糖或纖維素的組合物。本公開內(nèi)容提供了酶“摻合物”或組合物(在本文中也稱為“酶摻合物/組合物”),包括本公開內(nèi)容的多肽,或由本公開內(nèi)容的核酸編碼的多肽。在一些實(shí)施方案中,本公開內(nèi)容的多肽具有一種或多種選自木聚糖酶、β -木糖苷酶和L- α -阿拉伯呋喃糖苷酶活性的活性。在某些實(shí)施方案中,酶摻合物/組合物用于或有效用于纖維素和半纖維素聚合物解聚為可代謝的碳部分。本公開內(nèi)容的酶摻合物可以是組合物的形式,例如作為生產(chǎn)的產(chǎn)品。組合物可以是例如制劑,并可以采用例如液體或固體的形式。在示例性的實(shí)施方案中,本公開內(nèi)容的酶摻合物/組合物包括這樣的纖維素酶,所述纖維素酶包含至少三種不同酶類型,選自(I)內(nèi)切葡聚糖酶、(2)纖維二糖水解酶和(3) β-葡糖苷酶;或者包含至少三種不同的酶活性,選自(I)催化切割纖維素或半纖維素材料內(nèi)部的β_1,4連接的內(nèi)切葡聚糖酶活性,獲得更短的葡寡糖,(2)以“外切”的方式,催化切割和釋放纖維二糖單位(例如β_1,4葡萄糖-葡萄糖二糖)的纖維二糖水解酶活性,和(3)催化從短的纖維寡糖(例如,纖維二糖)中釋放葡萄糖單體的葡糖苷酶活性。本公開內(nèi)容的示例性的酶摻合物/組合物描述在下文6. 3. 4節(jié)中。在另一個(gè)方面,本公開內(nèi)容提供了加工包含木質(zhì)纖維素的生物量材料的方法,包括將包含纖維素和/或可發(fā)酵的糖的組合物與本公開內(nèi)容的多肽、本公開內(nèi)容的核酸編碼的多肽、或本公開內(nèi)容的酶摻合物/組合物(例如,制品)接觸。適宜地含木質(zhì)纖維素的生物量材料可源自農(nóng)業(yè)作物、食品或飼料生產(chǎn)的副產(chǎn)品、木質(zhì)纖維素廢棄物產(chǎn)品、植物殘余物或廢紙或廢紙產(chǎn)品。本公開內(nèi)容的多肽可具有一種或多種選自纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、β -葡糖苷酶、木聚糖酶、甘露聚糖酶、木糖苷酶、阿拉伯呋喃糖苷酶和其他半纖維素酶活性的酶活性。適宜地植物殘余物可包括谷類、種子、莖、葉、谷殼、外殼、玉米棒、玉米秸桿、稻草秸桿、草、木材、木屑、木漿和鋸屑。草可以是例如印度草或柳枝稷。草還可以是例如芒屬植物(Miscanthus)。紙廢棄物可以是例如丟棄或使用過(guò)的影印紙、計(jì)算機(jī)打印紙、筆記本紙、記事本紙、打字機(jī)紙、報(bào)紙、雜志、紙板和各種基于紙的包裝材料。紙廢棄物還可以是例如紙漿。本公開內(nèi)容提供了包含半纖維素水解酶和纖維素水解酶的混合物的組合物(包括酶、酶摻合物/組合物,例如本公開內(nèi)容的制品),以及至少一種生物量材料。任選的,生物量材料包括源自農(nóng)業(yè)作物的木質(zhì)纖維素材料。可選的,生物量材料是食品或飼料生產(chǎn)的副產(chǎn)品。適宜地生物量材料還可以是木質(zhì)纖維素廢品、植物殘余物、廢紙或廢紙產(chǎn)品,或包括植物殘余物。植物殘余物可以是例如包括谷類、種子、莖、葉、谷殼、外殼、玉米棒、玉米秸桿、草、稻草秸桿、木材、木屑、木漿和鋸屑。示例性的草包括但不限于印度草或柳枝稷。示例性的草還可以包括芒屬植物。示例性的紙廢棄物包括但不限于丟棄或使用過(guò)的影印紙、
計(jì)算機(jī)打印紙、筆記本紙、記事本紙、打字機(jī)紙、報(bào)紙、雜志、紙板和各種基于紙的包裝材料。示例性的紙廢棄物還可以包括例如紙漿。本文引用的提交日前所有公眾可獲得的信息包括例如出版物、專利、專利申請(qǐng)、GenBank序列和ATCC保藏物都通過(guò)引用明確整合到本文中。5.附圖和表格簡(jiǎn)介表1A-1B :表IA提供了本公開內(nèi)容中用于糖基水解酶的序列名稱的概括;表IB提供了實(shí)施例中提及的其他糖基水解酶的登錄號(hào)。表2 :相對(duì)于里氏木霉四缺失(Quad-delete)的宿主背景活性,表達(dá)的蛋白質(zhì)對(duì)合成底物PNPA和pNPX(如下文7. I. 6節(jié)所定義)的活性。四缺失的宿主背景(或“XQuad”)定義為所表達(dá)的蛋白質(zhì)在四缺失的菌株中的活性,除以未表達(dá)該蛋白質(zhì)的四缺失背景的菌株的活性。例如,> I的值表示所表達(dá)的蛋白質(zhì)具有大于所述背景的活性。表3 :純化的候選內(nèi)切木聚糖酶與birchwood木聚糖在50°C, pH 5下孵育的木聚糖酶活性。表4 :根據(jù)酸水解確定的,基于可利用的總糖,玉米阿拉伯木聚糖寡聚物向單體產(chǎn)物的百分比轉(zhuǎn)化。參見實(shí)施例4。表5 :定義半纖維素酶水解待處理的玉米棒為單體糖的活性的水平的實(shí)驗(yàn)結(jié)果(如實(shí)施例7所述)。命名為“run#”的列表示隨機(jī)的實(shí)驗(yàn)順序。命名為“trial#”的列表示標(biāo)準(zhǔn)實(shí)驗(yàn)的設(shè)計(jì)順序。命名為“Quad”的列表示來(lái)自四缺失的里氏木霉菌株的培養(yǎng)上清液的總蛋白的部分。命名為“Xyn3”的列表示里氏木霉Xyn3的總蛋白的部分。命名為“Fv43D”的列表示Fv43D的總蛋白的部分。命名為“Fv51A”的列表示Fv51A的總蛋白的部分。命名為“Fv43A”的列表示是Fv43A的總蛋白的部分。命名為“Fv43B”的列表示是Fv43B的總蛋白的部分。命名為“加載(ug/mgcarbo) ”的列表示按微克蛋白質(zhì)/毫克碳水化合物的單位,加入到糖化反應(yīng)中的蛋白質(zhì)。命名為“Xyl mg/mL、Glu mg/mL、Arab mg/mL和G+X+A mg/mL”的列表示在糖化反應(yīng)結(jié)束時(shí),檢測(cè)到的木糖、葡萄糖、阿拉伯糖和這三種糖產(chǎn)物的組合的濃度。命名為“Xyl % theor、Glu% theor和Arab% theor”的列表示在糖化反應(yīng)結(jié)束時(shí),木糖、葡萄糖和阿拉伯糖達(dá)到理論產(chǎn)量的百分比。表6:用于從玉米棒水解的葡萄糖、木糖和阿拉伯糖的預(yù)測(cè)最大產(chǎn)量的七種酶組分的經(jīng)計(jì)算的比例?!凹虞d總mg/gr carb”列表示在計(jì)算預(yù)測(cè)值時(shí)的總酶劑量。命名為“總mg/ml G+X+A、%葡萄糖產(chǎn)量、%木糖產(chǎn)量和%阿拉伯糖產(chǎn)量”的行表示對(duì)所計(jì)算的最佳值的反應(yīng)。命名為“模型擬合的r2數(shù)據(jù)(包括兩種加載物)”的列表示用于表5所示數(shù)據(jù)擬合的模型的r平方的統(tǒng)計(jì)參數(shù)。命名為“Accellerase的部分、Quaddel sup的部分、純化的里氏木霉Xyn3的部分、純化的Fv43D的部分、純化的Fv51A的部分、純化的Fv43A的部分,和純化的Fv43B的部分”的列表示通過(guò)對(duì)表5中的數(shù)據(jù)擬合的模型計(jì)算為最佳的組分的部分。表7 :在1.068、14%干燥固體的預(yù)處理的玉米棒反應(yīng)中,使用包括?¥3么和?¥430酶的摻合物最大水解轉(zhuǎn)化玉米棒的精制的酶加載物。糖化條件如實(shí)施例7所述。用酶名字標(biāo)記的列表示每克葡聚糖或木聚糖使用的每種所列酶的毫克數(shù)。表8 :在I. 06gr、14%干燥固體的預(yù)處理的玉米棒反應(yīng)中,使用含有Fv51A作為唯
一的L-α -阿拉伯呋喃糖苷酶的摻合物最大轉(zhuǎn)化玉米棒的精制的酶加載物。用于糖化的條件如實(shí)施例7所述。用酶名字標(biāo)記的列表示每克葡聚糖或木聚糖使用的每種所列酶的毫克數(shù)。用碳水化合物標(biāo)記的列表示基于用尺寸排阻層析測(cè)量的所生產(chǎn)的每種碳水化合物產(chǎn)品的mg/ml數(shù)。> dp2列表示大于二糖的所有寡聚物。表9 :在I. 06g、14%干燥固體的預(yù)處理的玉米棒反應(yīng)中測(cè)試的,由純化的半纖維素酶的混合物A、B、C獲得的糖產(chǎn)量。用于糖化的條件如實(shí)施例7所述。混合物A :每克木聚糖6mg里氏木霉Xyn3、4mg Fv3A、lmg Fv51A。混合物B :每克木聚糖6mg里氏木霉Xyn3、Img Fv43D、3mg Fv43A、3mg Fv43B?;旌衔?C :每克木聚糖 6mg 里氏木霉 Xyn3、3mg Fv3A、Img Fv43D、lmg Fv51A。用單體糖標(biāo)記的列表示每種列舉的單體的%產(chǎn)量。表10 :通過(guò)半纖維素酶混合物A、B、C處理由玉米棒、高粱、柳枝稷和鹿糖洛制造的半纖維素制品的糖產(chǎn)量。反應(yīng)在48°C下,100- μ L規(guī)模的50mM pH 5. O醋酸鈉緩沖液中運(yùn)行6h,如實(shí)施例8所述。顯示了每種單體糖的%產(chǎn)量。表11 :根據(jù)整合的HPLC面積百分比確定的,各種里氏木霉整合型表達(dá)菌株(命名為 H3A、39A、69A、A10A、G6A、102、44A、11A、G9A)表達(dá)的主要酶的濃度。表12 :柳枝稷預(yù)處理參數(shù)和各種預(yù)處理的糖化結(jié)果列表。表13 :在不同量的固體、酶和孵育時(shí)間下,用里氏木霉整合型菌株H3A生產(chǎn)的酶組合物糖化硬木衆(zhòng)(hardwood pulp)的結(jié)果。表14 :用整合型菌株H3A生產(chǎn)的酶組合物在一定溫度范圍和pH范圍下對(duì)硬木漿的糖化作用。下文和附圖中列舉的信號(hào)序列是預(yù)測(cè)的。預(yù)測(cè)是使用SignalP算法(可獲得自http://www. cbs. dtu. dk)進(jìn)行的。結(jié)構(gòu)域預(yù)測(cè)是基于Pfam、SMART或NCBI數(shù)據(jù)庫(kù)的一個(gè)或多個(gè)而進(jìn)行的。
圖1A-1B :圖 IA Fv3A 核苷酸序列(SEQ ID NO :1)。圖 IB Fv3A 氨基酸序列(SEQID NO 2) ο SEQ ID NO 2是未成熟Fv3A的序列。Fv3A具有對(duì)應(yīng)于SEQ ID NO :2的I至23位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO 2的24至766位的序列。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。圖2A-2B :圖 2A :Pf43A 核苷酸序列(SEQ ID NO 3)。圖 2B :Pf43A氨基酸序列(SEQID NO 4)。SEQ ID NO 4是未成熟Pf43A的序列。Pf43A具有對(duì)應(yīng)于SEQ ID NO :4的I至20位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQID NO 4的21至445位的序列。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示,預(yù)測(cè)的碳水化合物結(jié)合模塊(CBM)用大寫字母表示,預(yù)測(cè)的分開CD和CBM的接頭用斜體字表示。圖3A-3B :圖 3A :Fv43E 核苷酸序列(SEQ ID NO 5)。圖 3B :Fv43E 氨基酸序列(SEQID NO 6)。SEQ ID NO 6是未成熟Fv43E的序列。Fv43E具有對(duì)應(yīng)于SEQ ID NO :6的I至18位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQID NO 6的19至530位的序列。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。圖4A-4B :圖 4A :Fv39A 核苷酸序列(SEQ ID NO 7)。圖 4B :Fv39A 氨基酸序列(SEQID NO 8)。SEQ ID NO 8是未成熟Fv39A的序列。Fv39A具有對(duì)應(yīng)于SEQ ID NO :8的I至19位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO 8的20至439位的序列。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。圖5A-5B :圖 5A :Fv43A 核苷酸序列(SEQ ID NO 9)。圖 5B :Fv43A 氨基酸序列(SEQID NO: 10)。SEQ ID NO : 10 是未成熟 Fv43A 的序列。Fv43A 具有對(duì)應(yīng)于 SEQ ID NO : 10 的 I至22位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO : 10的23至449位的序列。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示,預(yù)測(cè)的CBM用大寫字母表示,預(yù)測(cè)的分開保守結(jié)構(gòu)域和CBM的接頭用斜體字表示。圖6A-6B 圖 6A Fv43B 核苷酸序列(SEQ ID NO :11)。圖 6B Fv43B 氨基酸序列(SEQ ID NO: 12)。SEQ ID NO : 12 是未成熟 Fv43B 的序列。Fv43B 具有對(duì)應(yīng)于 SEQ ID NO:12的I至16位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO 12的17至574位的序列。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。圖7A-7B 圖 7A Pa51A 核苷酸序列(SEQ ID NO :13)。圖 7B Pa51A 氨基酸序列(SEQ ID N0:14)。SEQ ID NO : 14 是未成熟 Pa51A 的序列。Pa51A 具有對(duì)應(yīng)于 SEQ ID NO:14的I至20位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO 14的21至676位的序列。預(yù)測(cè)的L- α -阿拉伯呋喃糖苷酶保守結(jié)構(gòu)域用粗體字表示。出于表達(dá)目的,基因組DNA進(jìn)行密碼子優(yōu)化用于在里氏木霉中的表達(dá)(參見圖60Β) ο圖8Α-8Β :圖 8Α :Gz43A 核苷酸序列(SEQ ID NO: 15)。圖 8B :Gz43A 氨基酸序列(SEQ ID NO: 16)。SEQ ID NO : 16 是未成熟 Gz43A 的序列。Gz43A 具有對(duì)應(yīng)于 SEQ ID NO:16的I至18位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO : 16的19至340位的序列。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。出于表達(dá)目的,在里氏木霉中,用里氏木霉CBHl信號(hào)序列(myrklavisaflatara(SEQ ID NO:51))替代Gz43A預(yù)測(cè)的信號(hào)序列(參見圖61)。圖9A-9B :圖 9A :Fo43A 核苷酸序列(SEQ ID NO: 17)。圖 9B :Fo43A 氨基酸序列(SEQ ID NO: 18)。SEQ ID NO : 18 是未成熟 Fo43A 的序列。Fo43A 具有對(duì)應(yīng)于 SEQ ID NO:18的I至20位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO: 18的21至348位的序列。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。出于表達(dá)目的,用里氏木霉CBHl信號(hào)序列(myrklavisaflatara(SEQ IDNO :51))替代Fo43A預(yù)測(cè)的信號(hào)序列(參見圖62)。圖IOA-1OB :圖 IOA :Af43A 核苷酸序列(SEQ ID NO :19)。圖 IOB :Af43A 氨基酸序列(SEQ ID NO :20)。SEQ ID NO :20是未成熟Af43A的序列。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表不。圖11A-11B :圖 IlA :Pf51A 核苷酸序列(SEQ ID NO :21)。圖 IlB :Pf51A 氨基酸序列(SEQ ID N0:22)。SEQ ID NO :22是未成熟Pf51A的序列。Pf51A具有對(duì)應(yīng)于SEQID NO 22的I至20位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO :22的21至642位的序列。預(yù)測(cè)的L-α -阿拉伯呋喃糖苷酶保守結(jié)構(gòu)域用粗體字表示。出于表達(dá)目的,用密碼子優(yōu)化的里氏木霉CBHl信號(hào)序列(myrklavisaf latara (SEQ ID NO :51))替代預(yù)測(cè)的Pf51A信號(hào)序列(下劃線的),并密碼子優(yōu)化Pf5IA核苷酸序列用于在里氏木霉中的表達(dá)(參見圖63)。圖12A-12B :圖 12A AfuXyn2 核苷酸序列(SEQ ID NO 23)。圖 12B AfuXyn2 氨基酸序列(SEQ ID NO: 24)。SEQ ID NO :24是未成熟AfuXyn2的序列。AfuXyn2具有對(duì)應(yīng)于SEQ ID NO :24的I至18位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的
蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO 24的19至228位的序列。預(yù)測(cè)的GHll保守結(jié)構(gòu)域用粗
體子表不。圖13A-13B :圖 13A AfuXyn5 核苷酸序列(SEQ ID NO 25)。圖 13B AfuXyn5 氨基酸序列(SEQ ID NO: 26)。SEQ ID NO :26是未成熟AfuXyn5的序列。AfuXyn5具有對(duì)應(yīng)于SEQ ID NO :26的I至19位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO :26的20至313位的序列。預(yù)測(cè)的GHll保守結(jié)構(gòu)域用粗
體子表不。圖14A-14B :圖 14A Fv43D 核苷酸序列(SEQ ID NO 27)。圖 14B Fv43D 氨基酸序列(SEQ ID NO 28)。SEQ ID NO 28是未成熟Fv43D的序列。Fv43D具有對(duì)應(yīng)于SEQ IDNO :28的I至20位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO :28的21至350位的序列。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。圖15A-15B :圖 15A Pf43B 核苷酸序列(SEQ ID NO 29)。圖 15B Pf43B 氨基酸序列(SEQ ID NO 30)。SEQ ID NO 30是未成熟Pf43B的序列。Pf43B具有對(duì)應(yīng)于SEQ IDNO :30的I至20位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO 30的21至321位的序列。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。圖16A-16B 圖 16A Fv51A 核苷酸序列(SEQ ID NO 31)。圖 16B Fv51A 氨基酸序列(SEQ ID NO: 32)。SEQ ID NO : 32是未成熟Fv5 IA的序列。Fv5 IA具有對(duì)應(yīng)于SEQ IDNO :32的I至19位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO :32的20至660位的序列。預(yù)測(cè)的L-α -阿拉伯呋喃糖苷酶保守結(jié)構(gòu)域用粗體字表示。圖17Α-17Β :圖 17Α Cg51B 核苷酸序列(SEQ ID NO 33)。圖 17B Cg51B 氨基酸序列(SEQ ID NO 34)。SEQ ID NO 34是未成熟Cg51B的序列。Cg51B具有對(duì)應(yīng)于SEQ IDNO :34的I至20位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO 34的21至670位的序列。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。圖18A-18B 圖 18A Fv43C 核苷酸序列(SEQ ID NO 35)。圖 18B Fv43C 氨基酸序列(SEQ ID NO: 36)。SEQ ID NO :36是未成熟Fv43C的序列。Fv43C具有對(duì)應(yīng)于SEQ IDNO :36的I至22位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO :36的23至333位的序列。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。圖19A-19B 圖 19A Fv30A 核苷酸序列(SEQ ID NO 37)。圖 19B Fv30A 氨基酸序列(SEQ ID NO: 38)。SEQ ID NO :38是未成熟Fv30A的序列。Fv30A具有對(duì)應(yīng)于SEQ IDNO :38的I至19位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO 38的20至537位的序列。圖20A-20B 圖 20A Fv43F 核苷酸序列(SEQ ID NO 39)。圖 20B Fv43F 氨基酸序列(SEQ ID N0:40)。SEQ ID NO :40是未成熟Fv43F的序列。Fv43F具有對(duì)應(yīng)于SEQ IDNO :40的I至20位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO :40的21至315位的序列。圖21A-21B :圖21A :里氏木霉Xyn3核苷酸序列(SEQ ID NO :41)。圖21B :里氏木霉Xyn3氨基酸序列(SEQ ID NO 42)。SEQ ID NO 42是未成熟里氏木霉Xyn3的序列。里
氏木霉Xyn3具有對(duì)應(yīng)于SEQ IDNO 42的I至16位的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO 42的17至347位的序列。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。圖22 :里氏木霉Xyn2的氨基酸序列(SEQ ID NO 43)。信號(hào)序列用下劃線表示。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。編碼序列可見于T6rr6lieil等人,Biotechnology, 1992,10 :1461-65 中。圖23 :里氏木霉Bxll的氨基酸序列(SEQ ID NO 44)。信號(hào)序列用下劃線表示。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。編碼序列可見于Margolles-Clark等人,Appl. Environ.Microbiol. 1996,62(10) :3840-46 中。圖24 :里氏木霉Bgll的氨基酸序列(SEQ ID NO 45)。信號(hào)序列用下劃線表示。預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。編碼序列可見于Barnett等人,Bio-Technology, 1991,9(6) :562-567 中。圖25 :使用用calcofluor檢測(cè)的PASC水解的纖維素酶活性測(cè)定。圖26 :木聚糖酶洗脫譜。圖27 :兩步分離的AfuXyn5的SDS-PAGE檢測(cè)。道I :粗制樣品;道2 =Phenyl柱的洗脫液;道3 :GF柱的洗脫液。圖28 pENTR/D-T0P0 質(zhì)粒。圖29 :pTrex3gM。圖30A-30B :不同的酶對(duì)玉米棒底物的性能。誤差棒表示與重復(fù)三次的玉米棒測(cè)定相關(guān)的實(shí)驗(yàn)誤差。沿X軸的括號(hào)中的數(shù)字表示按mg蛋白質(zhì)/g纖維素計(jì)的酶劑量。圖31 :不同的酶摻合物/組合物對(duì)玉米棒底物的性能。誤差棒表示與重復(fù)三次的玉米棒測(cè)定相關(guān)的實(shí)驗(yàn)誤差。沿X軸的括號(hào)中的數(shù)字表示按mg蛋白質(zhì)/g纖維素計(jì)的酶劑量。圖32 :不同的酶摻合物/組合物對(duì)玉米棒底物的性能。誤差棒表示與重復(fù)三次的玉米棒測(cè)定相關(guān)的實(shí)驗(yàn)誤差。沿X軸的括號(hào)中的數(shù)字表示按mg蛋白質(zhì)/g纖維素計(jì)的酶劑量。圖33 :不同的酶摻合物/組合物對(duì)玉米棒底物的性能。誤差棒表示與重復(fù)三次的玉米棒測(cè)定相關(guān)的實(shí)驗(yàn)誤差。沿X軸的括號(hào)中的數(shù)字表示按mg蛋白質(zhì)/g纖維素計(jì)的酶劑量。圖34 :不同的酶摻合物/組合物對(duì)玉米棒底物的性能。誤差棒表示與重復(fù)三次的玉米棒測(cè)定相關(guān)的實(shí)驗(yàn)誤差。沿X軸的括號(hào)中的數(shù)字表示按mg蛋白質(zhì)/g纖維素計(jì)的酶劑量。圖35A-35C :不同的酶摻合物/組合物對(duì)玉米棒底物的性能。誤差棒表示與重復(fù)三次的玉米棒測(cè)定相關(guān)的實(shí)驗(yàn)誤差。沿X軸的數(shù)字表示按mg蛋白質(zhì)/g纖維素計(jì)的酶劑量。圖36 :短的阿拉伯木聚糖寡聚物的異頭質(zhì)子NMR區(qū),顯示被Fv43A加Fv43B切割。圖37 :短的阿拉伯木聚糖寡聚物的異頭質(zhì)子NMR區(qū),顯示被Fv3A從阿拉伯糖切割的3-1,2-連接的木糖。圖38 :里氏木霉P -木糖苷酶和Fv3A的氨基酸序列之間的比對(duì)。圖39 pENTR-T0P0-BglI (943/942)質(zhì)粒。圖40 pTrex3g 943/942Bgll 表達(dá)載體。圖41 :pENTR_里氏木霉Xyn3質(zhì)粒。圖42 pTrex3g/里氏木霉Xyn3表達(dá)載體。圖43 pENTR-Fv3A 質(zhì)粒。圖44 :pTrex6g/Fv3A 表達(dá)載體。圖45 T0P0 Blunt/Pegll-Fv43D 質(zhì)粒。圖46 T0P0 Blunt/Pegll-FvSlA 質(zhì)粒。圖47A-47C :通過(guò)里氏木霉整合型表達(dá)菌株的分泌型酶發(fā)酵培養(yǎng)基,將葡聚糖(圖47A)和木聚糖(圖47B)轉(zhuǎn)化為単體糖。分析3天的樣品的葡聚糖和木聚糖轉(zhuǎn)化為單體和可溶性寡聚物產(chǎn)物的程度(圖47C)。圖47D顯示了三種里氏木霉整合型表達(dá)菌株的酶產(chǎn)物的層析比較。實(shí)驗(yàn)條件描述在實(shí)施例I中。轉(zhuǎn)化子之間的蛋白質(zhì)比例不同,可以定量為總整合峰面積的百分比?!癊GL”標(biāo)記了內(nèi)切葡聚糖酶峰的總面積。EndoH被少量添加到蛋白質(zhì)樣品中,作為HPLC分析的試劑。圖48A-48B 在氨(ammonia)預(yù)處理的玉米棒中,7mg總蛋白/克葡聚糖+木聚糖時(shí),響應(yīng)向整合型菌株生產(chǎn)的酶組合物中添加的半纖維素酶,在木糖單體產(chǎn)量方面增加的糖化作用。圖48A :由整合型菌株生產(chǎn)的酶組合物中的串珠錸刀菌(Fusariumverticillioides)半纖維素酶成分。圖48B :來(lái)自其他真菌的半纖維素酶。圖49A-49B :在氨預(yù)處理的玉米棒中,7mg總蛋白/克葡聚糖+木聚糖時(shí),響應(yīng)向整合型菌株生產(chǎn)的酶組合物中添加的半纖維素酶,在葡萄糖單體產(chǎn)量方面増加的糖化作用。圖49A :由整合型菌株生產(chǎn)的酶組合物中的輪枝樣錸刀菌半纖維素酶成分。圖49B :來(lái)自其他真菌的半纖維素酶。圖50A-50B:在氨預(yù)處理的玉米棒中,7mg總蛋白/克葡聚糖+木聚糖時(shí),響應(yīng)向整合型菌株生產(chǎn)的酶組合物中添加的半纖維素酶,在阿拉伯糖單體產(chǎn)量方面增加的糖化作用。圖50A:由整合型菌株生產(chǎn)的酶組合物中的輪枝樣錸刀菌半纖維素酶成分。圖50B:來(lái)自其他真菌的半纖維素酶。圖51 :圖示預(yù)處理?xiàng)l件下的糖化性能。X軸對(duì)應(yīng)表12中列舉的實(shí)驗(yàn)結(jié)果。產(chǎn)量是基于粗制柳枝稷中可利用的葡聚糖或木聚糖的理論量計(jì)算的。所有的產(chǎn)量都是基于用酶混合物糖化3天后釋放的單體糖。
圖52 :多個(gè)GH39P-木糖苷酶的氨基酸序列比對(duì)。粗體下劃線表示的殘基是預(yù)測(cè)的催化性普通酸堿殘基(在比對(duì)上方用“ A”標(biāo)記)和催化親核殘基(在比對(duì)上方用“ N”標(biāo)記)。底部?jī)蓷l序列中普通字體的用下劃線表示的殘基是距各自3D結(jié)構(gòu)(pdb :分別是Iuhv和2bs9)的活性位點(diǎn)中的底物4埃以內(nèi)的。Fv39A序列中的下劃線殘基是預(yù)測(cè)距活性位點(diǎn)中的結(jié)合底物4埃以內(nèi)的。圖53 :多個(gè)GH43家族水解酶的氨基酸序列比對(duì)。在家族成員中高度保守的氨基酸殘基顯示為下劃線和粗體。圖54 :多個(gè)GHSl家族酶的氨基酸序列比對(duì)。在家族成員中高度保守的氨基酸殘基顯示為下劃線和粗體。圖55A-55B :多個(gè)GHlO和GHll家族內(nèi)切木聚糖酶的氨基酸序列比對(duì)。圖55A :GH10家族木聚糖酶的比對(duì)。粗體的下劃線殘基是催化親核殘基(在比對(duì)上方用“ N”標(biāo)記)。圖55B:GH11家族木聚糖酶的比對(duì)。粗體的下劃線殘基是催化親核殘基和普通酸堿殘基(在
比對(duì)上方分別用“N”和“A”標(biāo)記)。圖56A-56B :用多種酶摻合物/組合物對(duì)稀釋的氨預(yù)處理的柳枝稷的糖化作用。圖56A:葡聚糖轉(zhuǎn)化。圖56B:木聚糖轉(zhuǎn)化。附圖下方X軸上的數(shù)字指每克葡聚糖或木聚糖的給定摻合物/組合物中每種蛋白質(zhì)的總毫克量,如實(shí)施例13所述。圖57A-57B :用整合型菌株H3A生產(chǎn)的酶組合物對(duì)稀釋的氨預(yù)處理的柳枝稷的糖化作用。圖57A:葡聚糖轉(zhuǎn)化。圖57B:木聚糖轉(zhuǎn)化。實(shí)施例14中描述了實(shí)驗(yàn)條件。圖58A-58C :用整合型菌株H3A生產(chǎn)的酶組合物,在不同酶劑量下對(duì)蒸汽膨脹的蔗糖渣的糖化作用。圖58A :葡聚糖轉(zhuǎn)化;圖58B :木聚糖轉(zhuǎn)化;圖58C :3天的葡聚糖和木聚糖轉(zhuǎn)化。實(shí)施例17中描述了實(shí)驗(yàn)條件。圖59A-59C :用各種酶或酶摻合物對(duì)稀酸預(yù)處理的玉米纖維的糖化作用。圖59A :葡聚糖轉(zhuǎn)化;圖59B :木聚糖轉(zhuǎn)化;圖59C 5天的葡聚糖和木聚糖轉(zhuǎn)化。受調(diào)節(jié)的糖(葡萄糖或木糖)反映了由酶促步驟所產(chǎn)生的糖減去起始糖水平。沿X軸顯示的比例代表按mg總蛋白/g纖維素計(jì)的酶劑量。實(shí)施例18中描述了實(shí)驗(yàn)條件。圖60A-60B :圖 60A :Pa51A 推導(dǎo)的 cDNA (SEQ ID NO 46)。圖 60B :Pa51A 密碼子優(yōu)化的 cDNA(SEQ ID NO 47)。圖61 :在編碼成熟的Gz43A的基因組DNA的上游包含CBHl信號(hào)序列(下劃線的)的構(gòu)建體的編碼序列(SEQ ID NO 48)。圖62 :在編碼成熟的Fo43A的基因組DNA的上游包含CBHl信號(hào)序列(下劃線的)的構(gòu)建體的編碼序列(SEQ ID NO 49)。圖63 :在編碼成熟的Pf51A的密碼子優(yōu)化的DNA的上游包含CBHl信號(hào)序列(下劃線的)的構(gòu)建體的密碼子優(yōu)化的編碼序列(SEQ IDNO :50)。圖64 :多個(gè)GH3家族水解酶的氨基酸序列比對(duì)。家族成員中高度保守的氨基酸殘基用下劃線和粗體顯示。方框標(biāo)記了具有側(cè)翼預(yù)測(cè)涉及底物結(jié)合的殘基的預(yù)測(cè)催化殘基。圖65 :兩條代表性的錸刀菌GH30家族水解酶的氨基酸序列比對(duì)。家族成員中保守的氨基酸殘基用下劃線和粗體顯示。6.詳述傳統(tǒng)上,按底物特異性和反應(yīng)產(chǎn)物將酶分類。在前基因組時(shí)代,功能被視為用于比較酶的最應(yīng)服從(并且可能是最有效)的基礎(chǔ),用于多種酶活性的測(cè)定已開發(fā)多年,獲得了熟悉的EC分類體系。纖維素酶和其他作用于兩個(gè)碳水化合物部分之間(或者碳水化合物和非碳水化合物部分之間——如硝基酚-糖苷衍生物中存在的)的糖苷鍵的糖基水解酶在該分類體系中指定為EC 3.2. I. _,最后ー個(gè)數(shù)字表示切割的鍵的確切類型。例如,根據(jù)該方案,內(nèi)切作用的纖維素酶(1,4-3-內(nèi)切葡聚糖酶)被指定為EC 3. 2. 1.4。隨著普遍的基因組測(cè)序計(jì)劃的進(jìn)展,測(cè)序數(shù)據(jù)促進(jìn)了對(duì)相關(guān)基因和蛋白質(zhì)的分析和比較。相應(yīng)的,已經(jīng)結(jié)晶了數(shù)量不斷増加的能夠作用于碳水化合物部分(即,碳水化合物酶)的酶,并解析了它們的3D結(jié)構(gòu)。此類分析已鑒別出具有相關(guān)序列的細(xì)分的酶家族,含有可基于其氨基酸序列預(yù)測(cè)的保守三維折疊。此外,已顯示具有相同或相似三維折疊的酶表現(xiàn)出相同或相似的水解的立體特異性,即使當(dāng)其催化不同的反應(yīng)時(shí)(Henrissat等人,1998, FEBS Lett 425(2) :352-4 ;Coutinho和Henrissat, 1999, in Genetics, biochemistryand ecology oi cellulose degradation. T. Kimura. Tokyo, Uni Puolishers Co:15_2j)0這些發(fā)現(xiàn)形成了基于序列分類碳水化合物酶模塊的基礎(chǔ),所述模塊可獲得自http: //afmb. cnrs~mrs. fr/CAZY/index, html 的網(wǎng)絡(luò)數(shù)據(jù)庫(kù) Carbohydrate-Active enZYme
服務(wù)器(CAZy),(碳水化合物活性酶整合的數(shù)據(jù)庫(kù)方法)。參見Cantarel等人,2009,Nucleic Acids Res. 37(Database issue) :D233_38)。CAZy定義了四種主要類型的碳水化合物酶,可通過(guò)催化的反應(yīng)類型區(qū)分糖基水解酶(GH)、糖基轉(zhuǎn)移酶(GT)、多糖裂合酶(PL)和碳水化合物酯酶(CE)。本公開內(nèi)容的酶是糖基水解酶。GH是ー類水解兩個(gè)或多個(gè)碳水化合物之間或碳水化合物和非碳水化合物部分之間的糖苷鍵的酶。按序列相似性分組的糖基水解酶分類系統(tǒng)導(dǎo)致定義了超過(guò)85個(gè)不同的家族。該分類可獲得自CAZy網(wǎng)站。本公開內(nèi)容的酶尤其屬于糖基水解酶家族3、10、11、30、39、43和/或51。糖苷水解酶家族3 ( “GH3”)的酶包括例如P -葡糖苷酶(EC :3. 2. I. 21) ; P -木糖苷酶(EC :3. 2. I. 37) ;N-こ?!?氨基葡糖苷酶(EC :3. 2. I. 52);葡聚糖¢-1, 3-葡糖苷酶(EC :3. 2. I. 58);纖維糊精酶(cellodextrinase) (EC :3. 2. I. 74);外切-1,3-1,4- 聚糖酶(EC :3. 2. I);和¢-半乳糖苷酶(EC 3.2. 1.23)。例如,GH3酶可以是具有P -葡糖苷酶、¢-木糖苷酶、N-こ?!?氨基葡糖苷酶、葡聚糖¢-1, 3-葡糖苷酶、纖維糊精酶、夕卜切1,3-1,4_葡聚糖酶和/或¢-半乳糖苷酶活性的酶。一般而言,GH3酶是球狀蛋白質(zhì),可由兩個(gè)或多個(gè)亞結(jié)構(gòu)域構(gòu)成。在¢-葡糖苷酶中,催化殘基鑒別為位于肽N端第三位的天冬氨酸殘基,位于氨基酸片段SDW中(Li等人,2001,Biochem. J. 355 :835-840)。里氏木霉Bgll中的相應(yīng)序列是T266D267W268(從起始位置的甲硫氨酸開始計(jì)數(shù)),而催化殘基天冬氨酸是D267。在測(cè)試的GH3P-木糖苷酶中,羥基/天冬氨酸序列也是保守的。例如在里氏木霉Bxll中的相應(yīng)序列是S310D311,而在Fv3A中的相應(yīng)序列是S290D291。糖苷水解酶家族39 ( “GH39”)的酶具有a -L-艾杜糖苷酸酶(EC :3. 2. I. 76)或 @ -木糖苷酶(EC 3. 2. I. 37)活性。已解析了來(lái)自 Thermoanaerobacteriumsaccharolyticum (Uniprot 登錄號(hào) P36906)和嗜熱脂肪地芽抱桿菌(Geobacillusstearothermophilus) (Uniprot登錄號(hào)Q9ZFM2)的2種GH39 0 -木糖苷酶的三維結(jié)構(gòu)(參見Yang 等人,J. Mol. Biol. 2004,335(1) : 155-65 和 Cz jzek 等人,J. Mol. Biol. 2005,353(4)838-46)。這些酶中最高度保守的區(qū)域位于其N端部分,具有經(jīng)典的(a/0)8TM桶狀折疊,兩個(gè)關(guān)鍵的活性位點(diǎn)谷氨酸位于¢-鏈4(酸/堿)和7(親核)的C末端。基于上述的Thermoanaerobacteriumsaccharolyticum和嗜熱脂肪地芽抱桿菌的GH39 ^ -木糖苷酶與Fv39A的比對(duì),預(yù)測(cè)Fv39A的殘基E168和E272分別作為催化性酸-堿和親核基團(tuán)發(fā)揮功能。糖苷水解酶家族43( “GH43”)的酶包括例如L-a-阿拉伯呋喃糖苷酶(EC3. 2. I. 55) 木糖苷酶(EC :3. 2. I. 37);內(nèi)切阿拉伯聚糖酶(EC 3. 2. 1.99);和/或半乳聚糖1,3-卜半乳糖苷酶(EC 3.2.1.145)。例如,GH43酶可以是具有L-a-阿拉伯呋喃糖苷酶活性、^ -木糖苷酶活性、內(nèi)切阿拉伯聚糖酶活性,和/或半乳聚糖1,3-0 -半乳糖苷酶活性的酶。GH43家族的酶表現(xiàn)出五葉片狀的¢-螺旋槳樣結(jié)構(gòu)。螺旋槳樣結(jié)構(gòu)是基于葉片的五次重復(fù),所述葉片由四條鏈的¢-片層組成。通過(guò)Cellvibriojaponicus CjAbn43A的晶體結(jié)構(gòu),鑒別出催化性的普通堿——天冬氨酸、催化性的普通酸——谷氨酸,和調(diào)節(jié)普通堿的pKa的天冬氨酸,并通過(guò)定點(diǎn)誘變驗(yàn)證(參見Nurizzo等人,Nat. Struct. Biol. 2002,9(9)665-8)。催化殘基排列在廣泛分布于氨基酸序列中的三個(gè)保守區(qū)段(blocks)中(Pons等人,Proteins !Structure, Function andBioinformatics, 2004, 54 :424-432)。在測(cè)試生
物量水解的有效活性的GH43家族酶中,預(yù)測(cè)的催化殘基在圖53的序列中顯示為粗體和下劃線的殘基。嗜熱脂肪地芽孢桿菌(Geobacillus stearothermophylus)的木糖苷酶的晶體結(jié)構(gòu)(Brux等人,J. Mol. Bio.,2006,359 =97-109)提示若干其他殘基可能對(duì)于該酶的底物結(jié)合是重要的。由于測(cè)試生物量水解的GH43家族酶具有不同的底物偏愛,這些殘基在圖53的比對(duì)序列中不是完全保守的。然而,在測(cè)試的木糖苷酶中,若干通過(guò)疏水性相互作用或通過(guò)氫鍵對(duì)底物結(jié)合有貢獻(xiàn)的保守殘基是保守的,并在圖53中通過(guò)單下劃線標(biāo)記。糖苷水解酶家族51 ( “GH51”)的酶具有L-a -阿拉伯呋喃糖苷酶(EC 3. 2. I. 55)和/或內(nèi)切葡聚糖酶(EC 3. 2. I. 4)活性。來(lái)自嗜熱脂肪地芽孢桿菌T-6的GH51L- a -阿拉伯呋喃糖苷酶的高解析度晶體結(jié)構(gòu)顯示所述酶是六聚體,每個(gè)單體組織成2個(gè)結(jié)構(gòu)域ー個(gè)8桶狀(P/a)和ー個(gè)具有果醬卷(jelly-roll)拓?fù)鋵W(xué)結(jié)構(gòu)的12鏈狀P夾心(參見HSvel等人,EMBO J. 2003,22(19) =4922-4932)??梢灶A(yù)期催化殘基將是酸性的,并在該家族的酶之間是保守的。當(dāng)將Fv51A、Pf51A和Pa51A的氨基酸序列與更多種序列的GH51酶比對(duì)吋,8個(gè)酸性殘基仍然是保守的。在圖54中顯示為粗體和下劃線。糖苷水解酶家族10 (“GH10”)的酶也具有8桶狀(@/a)結(jié)構(gòu)。它們以內(nèi)切方式水解,其余機(jī)制在一般性酸/堿催化方法中使用至少ー個(gè)酸性催化殘基(Pell等人,J.Biol.Chem.,2004,279 (10) :9597-9605)。已經(jīng)解析了 簡(jiǎn)青霉(Penicillium simplicissimum)(Uniprot P56588)和 Thermoascus aurantiacus (Uniprot P23360)的 GHlO 木聚糖酶在活性位點(diǎn)與底物復(fù)合后的晶體結(jié)構(gòu)(參見Schmidt等人,Biochem.,1999,38 =2403-2412 ;和Lo Leggio等人,F(xiàn)EBS Lett. 2001,509 :303-308)。對(duì)底物結(jié)合和催化重要的里氏木霉Xyn3殘基可源自與上述簡(jiǎn)青霉和Thermoascus aurantiacus的GHlO木聚糖酶的序列的比對(duì)(圖55A)。預(yù)測(cè)里氏木霉Xyn3的殘基E282是催化性親核殘基,而預(yù)測(cè)殘基E91、N92、K95、Q97、S98、H128、W132、Q135、N175、E176、Y219、Q252、H254、W312 和/或 W320 涉及底物結(jié)合和 /或催化。糖苷水解酶家族11( “GH11”)的酶具有果醬卷結(jié)構(gòu)。它們以內(nèi)切方式水解,其余機(jī)制在一般性酸/堿催化方法中使用至少ー個(gè)酸性催化殘基。遍布整個(gè)結(jié)構(gòu)中的若干其他殘基可能對(duì)穩(wěn)定底物中靠近被水解切割的成對(duì)木糖單體中的木糖単位有貢獻(xiàn)。測(cè)試了三個(gè)GHll家族的內(nèi)切木聚糖酶,其序列比對(duì)在圖55B中。鑒別出E118 (或成熟的里氏木霉Xyn2中的E86)和E209 (或成熟的里氏木霉Xyn2中的E177)分別作為里氏木霉Xyn2中的催化親核基團(tuán)和一般性酸堿殘基(參見Havukainen等人,Biochem.,1996,35 =9617-24)。糖苷水解酶家族30 (“GH30”)的酶屬于具有葡糖神經(jīng)酰胺酶(EC3. 2. I. 45) ; @ -1,6-葡聚糖酶(EC 3. 2. I. 75) ; P -木糖苷酶(EC 3. 2. I. 37) ; P -葡糖苷酶(3. 2. I. 21)活性的酶。第一個(gè) GH30 晶體結(jié)構(gòu)是 Grabowski、Gatt 和 Horowitz (Crit Rev Biochem MolBiol 1990 ;25 (6) 385-414)解析的Gaucher病相關(guān)性人^ -葡糖腦苷脂酶。GH30具有(a /3) JIM桶狀折疊,兩個(gè)關(guān)鍵的活性位點(diǎn)谷氨酸位于¢-鏈4(酸/堿)和7(親核)的C末端(Henrissat B,等人,Proc Natl Acad Sci U S A, 92 (15) :7090-4,1995 ; Jordan 等人,Applied Microbiol Biotechnol,86 :1647,2010)。在 14 個(gè)比對(duì)的 GH30 蛋白中,F(xiàn)v30A 的162位谷氨酸在14個(gè)中是保守的(13個(gè)細(xì)菌蛋白和I個(gè)來(lái)自真菌Biospora的內(nèi)切-P -木聚糖酶——登錄號(hào)ADG62369),F(xiàn)v30A的250位谷氨酸在同樣的14個(gè)蛋白的10個(gè)中是保守的,其他三個(gè)中是天冬氨酸,ー個(gè)中是非酸性的。存在其他的中等保守的酸性殘基,但無(wú)ー
如此廣泛保守。6. I本公開內(nèi)容的多肽本公開內(nèi)容提供了分離的、合成的或重組的多肽,其包括與SEQ IDNO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43、44 或 45 的多肽在至少約 10個(gè),例如至少約 15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325或350個(gè)殘基的區(qū)域,或在全長(zhǎng)的未成熟多肽、全長(zhǎng)的成熟多肽、全長(zhǎng)的保守結(jié)構(gòu)域和/或全長(zhǎng)的CBM,具有至少約80%,例如至少約81 %、82%>83%,84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或99%或完全的(100% )序列同一性的氨基酸序列。保守結(jié)構(gòu)域可以是預(yù)測(cè)的催化結(jié)構(gòu)域(“CD”)。示例性的多肽包括長(zhǎng)度至少約10個(gè),例如至少約15、20、25、30、35、40、45、50、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550 或 600 個(gè)殘基的片段。片段可以包括保守結(jié)構(gòu)域和/或CBM。當(dāng)片段包括酶的保守結(jié)構(gòu)域和CBM吋,片段任選的包括分開兩者的接頭。接頭可以是天然接頭或異源的接頭??紤]本公開內(nèi)容的多肽可以是由這樣的核酸序列編碼,所述核酸序列與SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39或41具有至少約85 %、約86 %、約87 %、約88 %、約89 %或約90 %的序列同一性,或者由能夠在高嚴(yán)緊條件下與SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39或41的互補(bǔ)體或其片段雜交的核酸序列編碼。示例性的本公開內(nèi)容的核酸描述在下文6. 2節(jié)中。本公開內(nèi)容的多肽包括具有這樣的氨基酸序列的蛋白質(zhì),所述氨基酸序列與SEQID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43、44 或 45的糖基水解酶序列的至少50個(gè)連續(xù)的氨基酸殘基具有至少約85%,例如至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 的序列同一性。例如,本公開內(nèi)容的多肽可以包括與 SEQ IDNO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43、44或45的糖基水解酶序列的至少10個(gè),例如至少11、12、13、14、15、20、25、30、40、50、75、100、125、150、175、200、250、300 或 350 個(gè)連續(xù)的氨基酸殘基具有至少 85%,例如至少 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%、98%或99%的序列同一性的氨基酸序列。連續(xù)的氨基酸序列對(duì)應(yīng)于保守結(jié)構(gòu)域和/或CBM和/或信號(hào)序列。本文所述的任何氨基酸序列都可以與特定氨基酸序列的C-和/或N-末端每個(gè)側(cè)翼的至少I個(gè),例如至少2、3、5、10或20個(gè)異源氨基酸一起產(chǎn)生,或者與之結(jié)合產(chǎn)生,和/或從本公開內(nèi)容的酶的C-和/或N-末端刪除至少I個(gè),例如至少2、3、5、10或20個(gè)氨基酸。其他變體也落入本公開內(nèi)容的范圍內(nèi)。例如,可以修飾一個(gè)或多個(gè)氨基酸殘基來(lái)増加或減少酶的P〗??梢酝ㄟ^(guò)去除谷氨酸殘基或用另ー個(gè)氨基酸殘基替代它,來(lái)實(shí)現(xiàn)Pl值的改變。本公開內(nèi)容具體提供了Fv3A、Pf43A、Fv43E、Fv39A、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、Af43A、Pf51A、AfuXyn2、AfuXyn5、Fv43D、Pf43B, Fv43B、Fv51A、里氏木霉 Xyn3、里氏
木霉Xyn2、里氏木霉Bxll和/或里氏木霉Bgll多肽。在本發(fā)明的酶摻合物/組合物中適合存在一種或多種這些酶的組合,例如非天然存在的。Fv3A Fv3A 的氨基酸序列(SEQ ID NO 2)顯示在圖 1B、38 和 64 中。SEQ ID NO 2是未成熟的Fv3A的序列。Fv3A具有對(duì)應(yīng)于SEQID NO 2的殘基I至23的預(yù)測(cè)的信號(hào)序列(下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID N0:2的殘基24至766的序列。預(yù)測(cè)的保守結(jié)構(gòu)域在圖IB中用粗體字表示。Fv3A表現(xiàn)出具有¢-木糖苷酶活性,例如在使用對(duì)-硝基苯-木批喃糖苷、木ニ糖(xylobiose)、混合的線性木糖寡聚物、來(lái)自半纖維素的分支的阿拉伯木聚糖寡聚物或用稀釋的氨預(yù)處理的玉米棒作為底物的酶學(xué)測(cè)定中。預(yù)測(cè)的催化殘基是D291,而側(cè)翼殘基S290和C292預(yù)測(cè)涉及底物結(jié)合(圖64)。E175和E213在其他GH3酶中是保守的,預(yù)測(cè)具有催化功能。如本文中使用的,“Fv3A多肽”指包含這樣的序列的多肽和/或其變體,所述序列與SEQ ID NO 2的殘基24至 766 之間至少 50,例如至少 75、100、125、150、175、200、250、300、350、400、450、500、550、600、650或700個(gè)連續(xù)的氨基酸殘基具有至少85 %,例如至少86 %、87 %、88 %、89 %、90 %、91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性。Fv3A 多肽與天然的Fv3A相比,優(yōu)選在殘基D291、S290、C292、E175和E213是沒有改變的。Fv3A多肽優(yōu)選至少 70%、75%、80%、85%、90%、95%、98%或 99%的在 Fv3A、里氏木霉 Bxll 和/或里氏木霉Bgll中保守的氨基酸殘基是沒有改變的,如圖64的比對(duì)所示。Fv3A多肽適宜地包括圖IB所示天然Fv3A的完整的預(yù)測(cè)保守結(jié)構(gòu)域。示例性的本發(fā)明的Fv3A多肽包括與圖IB所示成熟的 Fv3A 序列具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%、96%、97%、98%、99%或100%同一性的序列。本發(fā)明的Fv3A多肽優(yōu)選具有¢-木糖苷酶活性。相應(yīng)的,本發(fā)明的Fv3A多肽適宜地包括與SEQ ID NO :2,或與SEQID NO :2的殘基(i) 24-766、(ii) 73-321、(iii) 73-394、(iv) 395-622、(v) 24-622 或(vi) 73-622 的氨基酸序列具有至少 90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性的氨基酸序列。多肽適宜地具有¢-木糖苷酶活性。Pf43A Pf43A 的氨基酸序列(SEQ ID NO 4)顯示在圖 2B 和 53 中。SEQ ID NO 4是未成熟的Pf43A的序列。Pf43A具有對(duì)應(yīng)于SEQ IDNO 4的殘基I至20的預(yù)測(cè)的信號(hào)序列(圖2B中下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO4的殘基21至445的序列。在圖2B中,預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示,預(yù)測(cè)的CBM用大寫字母表示,而預(yù)測(cè)的分開CD和CBM的接頭用斜體字表示。Pf43A表現(xiàn)出具有P -木糖苷酶活性,例如在使用對(duì)-硝基苯-P -木吡喃糖苷、木ニ糖、混合的線性木糖寡聚物或用氨預(yù)處理的玉米棒作為底物的酶學(xué)測(cè)定中。預(yù)測(cè)的催化殘基是D32或D60、D145和E206。圖53中下劃線的C端區(qū)域是預(yù)測(cè)的CBM。如本文中使用的,“Pf43A多肽”指包含這樣的序列的多肽和/或其變體,所述序列與SEQ ID NO :4的殘基21至445之間至少50、75、100、125、150、175、200、250、300、350或400個(gè)連續(xù)的氨基酸殘基具有至少85 %、86%、87%、88 %、89 %、90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性。Pf43A 多肽與天然的Pf43A相比,優(yōu)選在殘基D32或D60、D145和E206是沒有改變的。Pf43A多肽優(yōu)選至少70%、80%、90%、95%、98%或99%的在蛋白質(zhì)家族中保守的氨基酸殘基是沒有改變的,該家族包括Pf43A和圖53中比對(duì)的1、2、3、4、5、6、7或所有8條其他的氨基酸序列。本發(fā)明的Pf43A多肽適宜地包括兩個(gè)或多個(gè)或所有的下列結(jié)構(gòu)域(I)預(yù)測(cè)的CBM、⑵預(yù)測(cè)的保守結(jié)構(gòu)域,和(3)圖2B中所示的Pf43A的接頭。示例性的本發(fā)明的Pf43A多肽包括與圖2B所示成熟的Pf43A序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、
93%,94%,95%,96%,97%,98%,99%^; 100% 同一性的序列。本發(fā)明的 Pf43A 多肽優(yōu)選具有¢-木糖苷酶活性。相應(yīng)的,本發(fā)明的Pf43A多肽適宜地包括與SEQ ID NO :4,或與SEQ ID NO 4的殘基(i)2 ト445、(ii)21-301、(iii)2 ト323、(iv) 21-444, (v) 302-444, (vi) 302-445,(vii) 324-444 或(viii) 324-445 的氨基酸序列具有至少 90 % ,91 % ,92 % ,93 % ,94 %,95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。多肽適宜地具有P -木糖苷酶活性。Fv43E Fv43E 的氨基酸序列(SEQ ID NO. 6)顯示在圖 3B 和 53 中。SEQ ID NO 6是未成熟的Fv43E的序列。Fv43E具有對(duì)應(yīng)于SEQ IDNO 6的殘基I至18的預(yù)測(cè)的信號(hào)序列(圖3B中下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO 6的殘基19至530的序列。在圖3B中,預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。Fv43E表現(xiàn)出具有@ -木糖苷酶活性,例如在使用4-硝基苯-P -D-木吡喃糖苷、木ニ糖和混合的線性木糖寡聚物或用氨預(yù)處理的玉米棒作為底物的酶學(xué)測(cè)定中。預(yù)測(cè)的催化殘基是D40或D71、D155和E241。如本文中使用的,“Fv43E多肽”指包含這樣的序列的多肽和/或其變體,所述序列與 SEQID NO 6 的殘基19至530之間至少50、75、100、125、150、175、200、250、300、350、400、450或500個(gè)連續(xù)的氨基酸殘基具有至少85 %、86 %、87 %、88 %、89 %、90 %、91 %、92 %、93%、94%、95%、96%、97%、98%、99%或100%序列同ー性。卩¥43£多肽與天然的?¥43£相比,優(yōu)選在殘基D40或D71、D155和E241是沒有改變的。Fv43E多肽優(yōu)選至少70%、80%、90%、95%、98%或99%的在酶家族中保守的氨基酸殘基是沒有改變的,包括Fv43E和圖53中比對(duì)的1、2、3、4、5、6、7或所有8條其他的氨基酸序列。Fv43E多肽適宜地包括圖3B所示天然Fv43E的完整的預(yù)測(cè)保守結(jié)構(gòu)域。示例性的Fv43E多肽包括與圖3B所示成熟的Fv43E序列具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%、99%或100%同一性的序列。本發(fā)明的Fv43E多肽優(yōu)選具有¢-木糖苷酶活性。相應(yīng)的,本發(fā)明的Fv43E多肽適宜地包括與SEQ ID NO :6,或與SEQ ID NO 6的殘基(i) 19-530、(ii) 29-530、(iii) 19-300 或(iv) 29-300 的氨基酸序列具有至少90%,91%,92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。多肽適宜地具有¢-木糖苷酶活性。Fv39A Fv39A 的氡某酸序列(SEQ ID NO :8)顯示在圖 4B 和 52 中。SEQ ID NO:8是未成熟的Fv39A的序列。Fv39A具有對(duì)應(yīng)于SEQ IDNO 8的殘基I至19的預(yù)測(cè)的信號(hào)序列(圖4B中下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ IDNO :8的殘基20至439的序列。在圖4B中,預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。Fv39A表現(xiàn)出具有P -木糖苷酶活性,例如在使用對(duì)-硝基苯-木吡喃糖苷、木ニ糖或混合的線性木糖寡聚物作為底物的酶學(xué)測(cè)定中?;贔v39A與上述來(lái)自Thermoanaerobacteriumsaccharolyticum (Uniprot登錄號(hào)P36906)和嗜熱脂肪地芽孢桿菌(Uniprot登錄號(hào)Q9ZFM2)的GH39木糖苷酶的序列比對(duì),預(yù)測(cè)Fv39A的殘基E168和E272分別作為催化性酸-堿對(duì)和親核基團(tuán)發(fā)揮功能。如本文中使用的,“Fv39A多肽”指包含這樣的序列的多肽和/或其變體,所述序列與SEQ ID NO 8的殘基20至439之間至少50、75、100、125、150、175、200、250、300、350或400個(gè)連續(xù)的氨基酸殘基具有至少85%、86%、87%、88%、89%、90%、
91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性。Fv39A 多肽與天然的Fv39A相比,優(yōu)選在殘基E168和E272是沒有改變的。Fv39A多肽優(yōu)選至少70%、80%、90 %、95 %、98 %或99 %的在家族或酶之間保守的氨基酸殘基是沒有改變的,包括Fv39A與來(lái)自Thermoanaerobacterium saccharolyticum和嗜熱脂肪地芽抱桿菌的木糖苷酶(見上文)。Fv39A多肽適宜地包括圖4B所示天然Fv39A的完整的預(yù)測(cè)保守結(jié)構(gòu)域。示例性的Fv39A多肽包括與圖4B所示成熟的Fv39A序列具有至少85 %、86 %、87 %、88 %、89 %、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100% 同一性的序列。本發(fā)明的Fv39A多肽優(yōu)選具有¢-木糖苷酶活性。相應(yīng)的,本發(fā)明的Fv39A多肽適宜地包括與SEQ ID NO :8,或與SEQ ID NO :8的殘基(i) 20-439、(ii) 20-291、(iii) 145-291 或 145-439 的氨基酸序列具有至少 90%、91 %、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。多肽適宜地具有¢-木糖苷酶活性。Fv43A Fv43A 的氨基酸序列(SEQ ID NO 10)顯示在圖 5B 和 53 中。SEQ ID NO 10是未成熟的Fv43A的序列。Fv43A具有對(duì)應(yīng)于SEQID NO 10的殘基I至22的預(yù)測(cè)的信號(hào)序列(圖5B中下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ IDNO 10的殘基23至449的序列。在圖5B中,預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示,預(yù)測(cè)的CBM用大寫字母表示,而預(yù)測(cè)的分開CD和CBM的接頭用斜體字表示。Fv43A表現(xiàn)出具有P -木糖苷酶活性,例如在使用4-硝基苯-P -D-木吡喃糖苷、木ニ糖、混合的線性木糖寡聚物、來(lái)自半纖維素的分支的阿拉伯木聚糖寡聚物和/或線性木糖寡聚物作為底物的酶學(xué)測(cè)定中。預(yù)測(cè)的催化殘基包括D34或D62、D148和E209。如本文中使用的,“ Fv43A多肽”指包含這樣的序列的多肽和/或其變體,所述序列與SEQ ID NO: 10的殘基23至449之間至少50、75、100、125、150、175、200、250、300、350 或 400 個(gè)連續(xù)的氨基酸殘基具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性。Fv43A多肽與天然的Fv43A相比,優(yōu)選在殘基D34或D62、D148和E209是沒有改變的。Fv43A多肽優(yōu)選至少70%、80%、90%、95%、98%或99%的在酶家族之間保守的氨基酸殘基是沒有改變的,包括Fv43A與圖53中比對(duì)的1、2、3、4、5、6、7、8或所有9條其他氨基酸序列。Fv43A多肽適宜地包括圖5B所示的天然Fv43A的完整的預(yù)測(cè)CBM,和/或天然Fv43A的完整的預(yù)測(cè)保守結(jié)構(gòu)域,和/或Fv43A的接頭。示例性的Fv43A多肽包括與圖5B所示成熟的 Fv43A 序列具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%、97%、98%、99%或100%同一性的序列。本發(fā)明的Fv43A多肽優(yōu)選具有P -木糖苷酶活性。相應(yīng)的,本發(fā)明的Fv43A多肽適宜地包括與SEQ ID N0:10,或與SEQ ID NO 10的殘基(i) 23-449、(ii) 23-302、(iii) 23-320、(iv) 23-448、(v) 303-448、(vi) 303-449、(vii) 321-448 或(viii) 321-449 的氨基酸序列具有至少 90 % ,91 % ,92 % ,93 % ,94 %,95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。多肽適宜地具有P -木糖苷酶活性。Fv43B Fv43B 的氨基酸序列(SEQ ID NO 12)顯示在圖 6B 和 53 中。SEQ ID NO 12是未成熟的Fv43B的序列。Fv43B具有對(duì)應(yīng)于SEQID NO 12的殘基I至16的預(yù)測(cè)的信
號(hào)序列(圖6B中下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ IDNO 12的殘基17至574的序列。在圖6B中,預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。Fv43B表現(xiàn)出同時(shí)具有P -木糖苷酶和L-a -阿拉伯呋喃糖苷酶活性,例如在使用4-硝基苯-D-木吡喃糖苷和對(duì)_硝基苯-a -L-阿拉伯呋喃糖苷作為底物的第一酶學(xué)測(cè)定中。在第二酶學(xué)測(cè)定中,表現(xiàn)出催化阿拉伯糖從分支的阿拉伯糖基-木糖寡聚物中釋放,并在存在其他木糖苷酶的條件下,催化從寡聚物混合物中増加的木糖釋放。預(yù)測(cè)的催化殘基包括D38或D68、D151和E236。如本文中使用的,“Fv43B多肽”指包含這樣的序列的多肽和/或其變體,所述序列與 SEQ ID NO 12 的殘基17至574之間至少50、75、100、125、150、175、200、250、300、350、400、450、500或550個(gè)連續(xù)的氨基酸殘基具有至少85%、86%、87%、88%、89%、90%、91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性。Fv43B 多肽與天然的Fv43B相比,優(yōu)選在殘基D38或D68、D151和E236是沒有改變的。Fv43B多肽優(yōu)選至少70%、80%、90%、95%、98%或99%的在酶家族之間保守的氨基酸殘基是沒有改變的,包括Fv43B與圖53中比對(duì)的1、2、3、4、5、6、7、8或所有9條其他氨基酸序列。Fv43B多肽適宜地包括圖6B和53所示的天然Fv43B的完整的預(yù)測(cè)保守結(jié)構(gòu)域。示例性的Fv43B多肽包括與圖 6B 所示成熟的 Fv43B 序列具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。本發(fā)明的Fv43B多肽優(yōu)選具有^ -木糖苷酶活性、L- a -阿拉伯呋喃糖苷酶活性或同時(shí)具有P -木糖苷酶和L- a -阿拉伯呋喃糖苷酶活性。相應(yīng)的,本發(fā)明的Fv43B多肽適宜地包括與SEQ ID NO :12,或與SEQ ID NO 12的殘基⑴ 17-574、(ii) 27-574、(iii) 17-303 或(iv) 27-303 的氨基酸序列具有至少 90 %、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%序列同一性的氨基酸序列。多肽適宜地具有¢-木糖苷酶活性、L-a-阿拉伯呋喃糖苷酶活性或同時(shí)具有¢-木糖苷酶和L- a -阿拉伯呋喃糖苷酶活性。Pa51A Pa51A 的氨基酸序列(SEQ ID NO 14)顯示在圖 7B 和 54 中。SEQ ID NO 14是未成熟的Pa51A的序列。Pa51A具有對(duì)應(yīng)于SEQID NO 14的殘基I至20的預(yù)測(cè)的信號(hào)序列(圖7B中下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ IDNO 14的殘基21至676的序列。在圖7B中,預(yù)測(cè)的L-a -阿拉伯呋喃糖苷酶保守結(jié)構(gòu)域用粗體字表示。Pa51A表現(xiàn)出同時(shí)具有¢-木糖苷酶和L-a-阿拉伯呋喃糖苷酶活性,例如在使用人工底物對(duì)-硝基苯-P -木吡喃糖苷和對(duì)-硝基苯-a -L-阿拉伯呋喃糖苷的酶學(xué)測(cè)定中。它表現(xiàn)出催化阿拉伯糖從分支的阿拉伯糖基-木糖寡聚物中釋放,并在存在其他木糖苷酶的條件下,催化從寡聚物混合物中增加的木糖釋放。保守的酸性殘基包括E43、D50、E257、E296、E340、E370、E485和E493。如本文中使用的,“Pa51A多肽”指包含這樣的序列的多肽和/或其變體,所述序列與SEQ ID NO 14的殘基21至676之間至少50、75、100、125、150、175、200、250、300、350、400、450、500、550、600 或 650 個(gè)連續(xù)的氨基酸殘基具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。Pa51A多肽與天然的?85認(rèn)相比,優(yōu)選在殘基£43、050、£257』296、E340、E370、E485 和 E493 是沒有改變的。Pa5 IA 多肽優(yōu)選至少 70 %、80 %、90 %、95 %、98 % 或99%的在ー類酶之間保守的氨基酸殘基是沒有改變的,上述酶包括Pa51A、Fv51A和Pf51A,如圖54的比對(duì)所示。Pa51A多肽適宜地包括圖7B所示的天然Pa51A的預(yù)測(cè)的保守結(jié)構(gòu)域。示例性的Pa51A多肽包括與圖7B所示成熟的Pa51A序列具有至少85%、86%、87%、88%、89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100% 同一性的序列。本
發(fā)明的Pa51A多肽優(yōu)選具有¢-木糖苷酶活性、L-a-阿拉伯呋喃糖苷酶活性或同時(shí)具有^ -木糖苷酶和L-a -阿拉伯呋喃糖苷酶活性。相應(yīng)的,本發(fā)明的Pa51A多肽適宜地包括與SEQ ID N0:14,或與SEQ ID N0:14的殘基(i) 21-676、(ii) 21-652、(iii) 469-652 或(iv) 469-676 的氨基酸序列具有至少 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%序列同一性的氨基酸序列。多肽適宜地具有¢-木糖苷酶活性、L-a-阿拉伯呋喃糖苷酶活性或同時(shí)具有¢-木糖苷酶和L- a -阿拉伯呋喃糖苷酶活性。Gz43A Gz43A 的氨基酸序列(SEQ ID NO 16)顯示在圖 8B 和 53 中。SEQ ID NO 16是未成熟的Gz43A的序列。Gz43A具有對(duì)應(yīng)于SEQID NO 16的殘基I至18的預(yù)測(cè)的信號(hào)序列(圖8B中下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ IDNO 16的殘基19至340的序列。在圖8B中,預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。Gz43A表現(xiàn)出具有P -木糖苷酶活性,例如在使用對(duì)-硝基苯-P -木吡喃糖苷、木ニ糖或混合的和/或線性的木糖寡聚物作為底物的酶學(xué)測(cè)定中。預(yù)測(cè)的催化殘基包括D33或D68、D154和E243。如本文中使用的,“Gz43A多肽”指包含這樣的序列的多肽和/或其變體,所述序列與SEQ IDNO 16的殘基19至340之間至少50、75、100、125、150、175、200、250或300個(gè)連續(xù)的氨基酸殘基具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%、99%或100%序列同一性。Gz43A多肽與天然的Gz43A相比,優(yōu)選在殘基D33或D68、D154和E243是沒有改變的。Gz43A多肽優(yōu)選至少70 %、80 %、90 %、95 %、98 %或99 %的在一類酶之間保守的氨基酸殘基是沒有改變的,上述酶包括Gz43A和圖53中比對(duì)的I、2、3、4、
5、6、7、8或所有9條其他氨基酸序列。Gz43A多肽適宜地包括圖8B所示的天然Gz43A的預(yù)測(cè)的保守結(jié)構(gòu)域。示例性的Gz43A多肽包括與圖8B所示成熟的Gz43A序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或 100%同一性的序列。本發(fā)明的Gz43A多肽優(yōu)選具有¢-木糖苷酶活性。相應(yīng)的,本發(fā)明的Gz43A多肽適宜地包括與SEQ ID N0:16,或與SEQ ID NO :16的殘基(i) 19-340、(ii) 53-340、(iii) 19-383 或(iv) 53-383 的氨基酸序列具有至少 90 %、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%序列同一性的氨基酸序列。多肽適宜地具有¢-木糖苷酶活性。Fo43A Fo43A 的氨基酸序列(SEQ ID NO 18)顯示在圖 9B 和 53 中。SEQ ID NO 18是未成熟的Fo43A的序列。Fo43A具有對(duì)應(yīng)于SEQID NO 18的殘基I至20的預(yù)測(cè)的信號(hào)序列(圖9B中下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ IDNO 18的殘基21至348的序列。在圖9B中,預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。Fo43A表現(xiàn)出具有¢-木糖苷酶活性,例如在使用對(duì)-硝基苯-¢-木吡喃糖苷、木ニ糖和/或混合的線性的木糖寡聚物作為底物的酶學(xué)測(cè)定中。預(yù)測(cè)的催化殘基包括D37或D72、D159和E251。如本文中使用的,“Fo43A多肽”指包含這樣的序列的多肽和/或其變體,所述序列與SEQ IDNO 18的殘基18至344之間至少50、75、100、125、150、175、200、250或300個(gè)連續(xù)的氨基酸殘基具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%、99%或100%序列同一性。Fo43A多肽與天然的Fo43A相比,優(yōu)選在殘基D37或D72、D159和E251是沒有改變的。Fo43A多肽優(yōu)選至少70%、80%、90%、95%、98%或99%的在
一類酶之間保守的氨基酸殘基是沒有改變的,上述酶包括Fo43A和圖53中比對(duì)的I、2、3、4、
5、6、7、8或所有9條其他氨基酸序列。Fo43A多肽適宜地包括圖9B所示的天然Fo43A的預(yù)測(cè)的保守結(jié)構(gòu)域。示例性的Fo43A多肽包括與圖9B所示成熟的Fo43A序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或 100%同一性的序列。本發(fā)明的Fo43A多肽優(yōu)選具有¢-木糖苷酶活性。相應(yīng)的,本發(fā)明的Fo43A多肽適宜地包括與SEQ ID N0:18,或與SEQ ID NO :18的殘基(i)21-341、(ii) 107-341、(iii) 21-348 或(iv) 107-348 的氨基酸序列具有至少 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%序列同一性的氨基酸序列。多肽適宜地具有¢-木糖苷酶活性。Af43A Af43A 的氨基酸序列(SEQ ID NO 20)顯示在圖 IOB 和 53 中。SEQ ID NO 20是未成熟的Af43A的序列。在圖IOB中,預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。Af43A表現(xiàn)出具有L- a -阿拉伯呋喃糖苷酶活性,例如在使用對(duì)-硝基苯-a -L-阿拉伯呋喃糖苷作為底物的酶學(xué)測(cè)定中。Af43A表現(xiàn)出催化阿拉伯糖從寡聚物集合中釋放,所述寡聚物集合是通過(guò)內(nèi)切木聚糖酶的作用從半纖維素中釋放的。預(yù)測(cè)的催化殘基包括D26或D58、D139和E227。如本文中使用的,“Af43A多肽”指包含這樣的序列的多肽和/或其變體,所述序列與SEQ ID勵(lì)20的至少50、75、100、125、150、175、200、250或300個(gè)連續(xù)的氨基酸殘基具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。Af43A多肽與天然的Af43A相比,優(yōu)選在殘基D26或D58、D139和E227是沒有改變的。Af43A多肽優(yōu)選至少70%、80%、90%、95%、98%或99%的在ー類酶之間保守的氨基酸殘基是沒有改變的,上述酶包括Af43A和圖53中比對(duì)的1、2、3、4、5、
6、7、8或所有9條其他氨基酸序列。Af43A多肽適宜地包括圖IOB所示的天然Af43A的預(yù)測(cè)的保守結(jié)構(gòu)域。示例性的Af43A多肽包括與SEQ ID NO :20具有至少85%、86%、87%、88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99% 100%序列同一性的序列。本發(fā)明的Af43A多肽優(yōu)選具有L-a -阿拉伯呋喃糖苷酶活性。相應(yīng)的,本發(fā)明的Af43A多肽適宜地包括與SEQ ID N0:20,或與SEQ ID NO :20的殘基(i) 15-558 或(ii) 15-295 的氨基酸序列具有至少 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。多肽適宜地具有L-a -阿拉伯呋喃糖苷酶活性。Pf51A Pf51A 的氨基酸序列(SEQ ID NO 22)顯示在圖 IIB 和 54 中。SEQ ID NO 22是未成熟的Pf51A的序列。Pf51A具有對(duì)應(yīng)于SEQ IDNO 22的殘基I至20的預(yù)測(cè)的信號(hào)序列(圖IlB中下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQID NO 22的殘基21至642的序列。在圖IlB中,預(yù)測(cè)的L-a -阿拉伯呋喃糖苷酶保守結(jié)構(gòu)域用粗體字表示。Pf51A表現(xiàn)出具有L-a -阿拉伯呋喃糖苷酶活性,例如在使用4-硝基苯- a -L-阿拉伯呋喃糖苷作為底物的酶學(xué)測(cè)定中。Pf51A表現(xiàn)出催化阿拉伯糖從寡聚物集合中釋放,所述寡聚物集合是通過(guò)內(nèi)切木聚糖酶的作用從半纖維素中釋放的。預(yù)測(cè)的保守酸性殘基包括E43、D50、E248、E287、E331、E360、E472和E480。如本文中使用的,“Pf5IA多肽”指包含這樣的序列的多肽和/或其變體,所述序列與SEQ ID NO 22的殘基21至642之間至少 50、75、100、125、150、175、200、250、300、350、400、450、500、550或600個(gè)連續(xù)的氨基酸殘基具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%或100%序列同一性。Pf51A多肽與天然的Pf51A相比,優(yōu)選在殘基E43、D50、E248、E287、E331、E360、E472 和 E480 是沒有改變的。Pf51A 多肽優(yōu)選至少 70%、80%、90 %、95 %、98 %或99 %的在Pf 51A、Pa5IA和Fv5IA之間保守的氨基酸殘基是沒有改變的,如圖54的比對(duì)所示。Pf51A多肽適宜地包括圖IlB所示的天然Pf51A的預(yù)測(cè)的保守結(jié)構(gòu)域。示例性的Pf51A多肽包括與圖1川所示成熟的?デ5認(rèn)序列具有至少85%、86%、87%、88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%100% 同一性的序列。本發(fā)明的Pf51A多肽優(yōu)選具有L-a -阿拉伯呋喃糖苷酶活性。相應(yīng)的,本發(fā)明的Pf51A多肽適宜地包括與SEQ ID N0:22,或與SEQ ID NO :22的殘基(i) 21-632、(ii)461-632、(iii) 2ト642 或(iv)461-642 的氨基酸序列具有至少 90%,91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%序列同一性的氨基酸序列。多肽適宜地具有L- a -阿拉伯呋喃糖苷酶活性。AfuXyn2 AfuXyn2 的氨基酸序列(SEQ ID NO 24)顯示在圖 12B和 55B 中。SEQ IDNO 24是未成熟的AfuXyn2的序列。AfuXyn2具有對(duì)應(yīng)于SEQ ID NO 24的殘基I至18的預(yù)測(cè)的信號(hào)序列(圖12B中下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ IDNO 24的殘基19至228的序列。在圖12B中,預(yù)測(cè)的GHll保守結(jié)構(gòu)域用粗體字表示。通過(guò)觀察AfuXyn2在存在木ニ糖酶(xylobiosidase)下作用于預(yù)處理的生物量或分離的半纖維素時(shí),催化増加的木糖単體生產(chǎn)的能力,間接的表現(xiàn)出AfuXyn2具有內(nèi)切木聚糖酶活性。保守的催化殘基包括E124、E129和E215。如本文中使用的,“AfuXyn2多肽”指包含這樣的序列的多肽和/或其變體,所述序列與SEQ ID NO :24的殘基19至228之間至少50、75、100、125、150、175或200個(gè)連續(xù)的氨基酸殘基具有至少85 %、86 %、87 %、88 %、89 %、90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性。AfuXyn2 多肽與天然的AfuXyn2相比,優(yōu)選在殘基E124、E129和E215是沒有改變的。AfuXyn2多肽優(yōu)選至少70 %、80 %、90 %、95 %、98 %或99 %的在AfuXyn2、AfuXyn5和里氏木霉Xyn2之間保守的氨基酸殘基是沒有改變的,如圖55B的比對(duì)所示。AfuXyn2多肽適宜地包括圖12B所示的天然AfuXyn2的完整的預(yù)測(cè)的保守結(jié)構(gòu)域。示例性的AfuXyn2多肽包括與圖12B所示成熟的 AfuXyn2 序列具有至少 85 % ,86 % ,87 % ,88 % ,89 % ,90 % ,91 % ,92 % ,93 % ,94 %,95%、96%、97%、98%、99%或100%同一性的序列。本發(fā)明的AfuXyn2多肽優(yōu)選具有木聚糖酶活性。AfuXvn5 AfuXvn5 的氡某酸序列(SEQ ID NO :26)顯示在圖 13B 和 55B 中。SEQID NO 26是未成熟的AfuXyn5的序列。AfuXyn5具有對(duì)應(yīng)于SEQ ID NO 26的殘基I至19的預(yù)測(cè)的信號(hào)序列(圖13B中下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ IDNO 26的殘基20至313的序列。在圖13B中,預(yù)測(cè)的GHll保守結(jié)構(gòu)域用粗體字表示。通過(guò)觀察AfuXyn5在存在木ニ糖酶(xylobiosidase)作用于預(yù)處理的生物量或分離的半纖維素的條件下,催化增加的木糖單體生產(chǎn)的能力,間接的表現(xiàn)出AfuXyn5具有內(nèi)切木聚糖酶活性。保守的催化殘基包括E119、E124和E210。預(yù)測(cè)的CBM靠近C末端,特征是多個(gè)疏水殘基排在長(zhǎng)的富含絲氨酸、蘇氨酸的氨基酸序列后。所述區(qū)域以下劃線顯示在圖55B中。如本文中使用的,“AfuXyn5多肽”指包含這樣的序列的多肽和/或其變體,所述序列與 SEQ ID NO 26 的殘基 20 至 313 之間至少 50、75、100、125、150、175、200、250 或 275個(gè)連續(xù)的氨基酸殘基具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、99%或100%序列同一性。AfuXyn5多肽與天然的AfuXyn5相比,優(yōu)選在殘基E119、E120和E210是沒有改變的。AfuXyn5多肽優(yōu)選至少70%、80%、90%、95%、98 %或99 %的在AfuXyn5、AfuXyn2和里氏木霉Xyn2之間保守的氨基酸殘基是沒有改變的,如圖55B的比對(duì)所示。AfuXyn5多肽適宜地包括圖13B所示的天然AfuXyn5的整個(gè)預(yù)測(cè)的CBM和/或天然AfuXyn5的完整的預(yù)測(cè)保守結(jié)構(gòu)域(下劃線示出)。示例性的AfuXyn5多肽包括與圖13B所示成熟的AfuXyn5序列具有至少85%、86%、87%、88%、89%、90%、91 %、92%、93%、94%、95%、96%、97%、98%、99%或 100% 同一性的序列。本發(fā)明的 AfuXyn5 多肽優(yōu)選具有木聚糖酶活性。Fv43D Fv43D 的氨基酸序列(SEQ ID NO 28)顯示在圖 14B 和 53 中。SEQ ID NO 28是未成熟的Fv43D的序列。Fv43D具有對(duì)應(yīng)于SEQ ID NO :28的殘基I至20的預(yù)測(cè)的信號(hào)序列(圖14B中下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQID NO 28的殘基21至350的序列。在圖14B中,預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。Fv43D表現(xiàn)出具有¢-木糖苷酶活性,在例如使用對(duì)-硝基苯-¢-木吡喃糖苷、木ニ糖和/或混合的線性的木糖寡聚物作為底物的酶學(xué)測(cè)定中。預(yù)測(cè)的催化殘基包括D37或D72、D159和E251。如本文中使用的,“Fv43D多肽”指包含這樣的序列的多肽和/或其變體,所述序列與 SEQ ID NO 28 的殘基 21 至 350 之間至少 50、75、100、125、150、175、200、250、300 或 320個(gè)連續(xù)的氨基酸殘基具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。Fv43D多肽與天然的Fv43D相比,優(yōu)選在殘基D37或D72、D159和E251是沒有改變的。Fv43D多肽優(yōu)選至少70%、80%、90%、95%、
98%或99 %的在一類酶之間保守的氨基酸殘基是沒有改變的,所述酶包括Fv43D和圖53的比對(duì)中的1、2、3、4、5、6、7、8或所有9個(gè)其它氨基酸序列。Fv43D多肽適宜地包括圖14B所示的天然Fv43D的完整的預(yù)測(cè)⑶。示例性的Fv43D多肽包括與圖14B所示成熟的Fv43D序列具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%、99%或100%同一性的序列。本發(fā)明的Fv43D多肽優(yōu)選具有P -木糖苷酶活性。相應(yīng)的,本發(fā)明的Fv43D多肽適宜地包括與SEQ ID NO :28,或與SEQ ID NO 28的殘基(i) 20-341、(ii) 21-350、(iii) 107-341 或(iv) 107-350 的氨基酸序列具有至少 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%序列同一性的氨基酸序列。多
肽適宜地具有¢-木糖苷酶活性。Pf43B Pf43B 的氨基酸序列(SEQ ID NO 30)顯示在圖 15B 和 53 中。SEQ ID NO 30是未成熟的Pf43B的序列。Pf43B具有對(duì)應(yīng)于SEQ IDNO 30的殘基I至20的預(yù)測(cè)的信號(hào)序列(圖15B中下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQID NO 30的殘基21至321的序列。在圖15B中,預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。保守結(jié)構(gòu)域中的保守酸性殘基包括D32、D61、D148和E212。Pf43B表現(xiàn)出具有P -木糖苷酶活性,在例如使用對(duì)-硝基苯-木批喃糖苷、木ニ糖(xylobiose)和/或混合的線性的木糖寡聚物作為底物的酶學(xué)測(cè)定中。如本文中使用的,“Pf43B多肽”指包含這樣的序列的多肽和/或其變體,所述序列與SEQ ID勵(lì)30的殘基21至321之間至少50、75、100、125、150、175、200、250或280個(gè)連續(xù)的氨基酸殘基具有至少85%、86%、87%、88%、89%、90%、91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性。Pf43B 多肽與天然的Pf43B相比,優(yōu)選在殘基D32、D61、D148和E212是沒有改變的。Pf43B多肽優(yōu)選至少70%、80%、90%、95%、98%或99%的在ー類酶之間保守的氨基酸殘基是沒有改變的,所述酶包括Pf43B和圖53的比對(duì)中的1、2、3、4、5、6、7、8或所有9個(gè)其它氨基酸序列。Pf43B多肽適宜地包括圖15B所示的天然Pf43B的預(yù)測(cè)保守結(jié)構(gòu)域。示例性的Pf43B多肽包括與圖15B 所示成熟的 Pf43B 序列具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。本發(fā)明的Pf43B多肽優(yōu)選具有3 -木糖苷酶活性。相應(yīng)的,本發(fā)明的Pf43B多肽適宜地包括與SEQ ID NO :30的氨基酸序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性的氨基酸序列。多肽適宜地具有¢-木糖苷酶活性。Fv51A Fv51A 的氨基酸序列(SEQ ID NO 32)顯示在圖 16B 和 54 中。SEQ ID NO 32是未成熟的Fv51A的序列。Fv51A具有對(duì)應(yīng)于SEQ ID NO :32的殘基I至19的預(yù)測(cè)的信號(hào)序列(圖16B中下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQID NO 32的殘基20至660的序列。在圖16B中,預(yù)測(cè)的L-a -阿拉伯呋喃糖苷酶保守結(jié)構(gòu)域用粗體字表示。Fv51A表現(xiàn)出具有L-a -阿拉伯呋喃糖苷酶活性,在例如使用4_硝基苯-a -L-阿拉伯呋喃糖作為底物的酶學(xué)測(cè)定中。Fv51A表現(xiàn)出從寡聚物集合中催化阿拉伯糖的釋放,所述寡聚物通過(guò)內(nèi)切木聚糖酶的作用從半纖維素釋放。保守的殘基包括E42、D49、E247、E286、E330、E359、E479和E487。如本文中使用的,“Fv51A多肽”指包含這樣的序列的多肽和/或其變體,所述序列與SEQ ID NO 32的殘基20至660之間至少50、75、100、125、150、175、200、250、300、350、400、450、500、550、600 或 625 個(gè)連續(xù)的氨基酸殘基具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。Fv51A多肽與天然的?¥5認(rèn)相比,優(yōu)選在殘基£42、049、£247』286、E330、E359、E479 和 E487 是沒有改變的。Fv51A 多肽優(yōu)選至少 70%、80%、90%、95%、98%或99%的在Fv51A、Pa51A和Pf51A之間保守的氨基酸殘基是沒有改變的,如圖54的比對(duì)所示。Fv51A多肽適宜地包括圖16B所示的天然Fv51A的預(yù)測(cè)保守結(jié)構(gòu)域。示例性的Fv51A多肽包括與圖16B所示成熟的Fv51A序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100% 同一性的序列。本發(fā)明的 Fv51A 多肽優(yōu)選具有L- a -阿拉伯呋喃糖苷酶活性。相應(yīng)的,本發(fā)明的Fv51A多肽適宜地包括與SEQ ID N0:32,或與SEQ ID NO :32的殘基(i) 2ト660、(ii) 21-645、(iii) 450-645 或(iv) 450-660 氨基酸序列具有至少 90 %、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%序列同一性的氨基酸序列。多肽適宜地具有L- a -阿拉伯呋喃糖苷酶活性。Xvn3 単氐木霍Xvn3的氡某酸序列(SEQ ID NO 42)顯示在圖21B中。SEQ ID NO 42是未成熟的里氏木霉Xyn3的序列。里氏木霉Xyn3具有對(duì)應(yīng)于SEQ ID NO :42的殘基I至16的預(yù)測(cè)的信號(hào)序列(圖21B中下劃線的);預(yù)測(cè)切割信號(hào)序列產(chǎn)生成熟的蛋白質(zhì),其具有對(duì)應(yīng)于SEQ ID NO 42的殘基17至347的序列。在圖21B中,預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。通過(guò)觀察當(dāng)酶作用于預(yù)處理的生物量或分離的半纖維素時(shí),里氏木霉Xyn3在存在木ニ糖酶(xylobiosidase)的條件下催化增加的木糖單體生產(chǎn)的能力,間接的表現(xiàn)出里氏木霉
Xyn3具有內(nèi)切木聚糖酶活性。保守的催化殘基包括E91、E176、E180、E195和E282,如通過(guò)與另ー種GHlO家族酶比對(duì)所確定的,所述GHlO家族酶是霍耳斯特德氏鏈霉菌(Sti^ptomyceshalstedii)的 Xysl delta (Canals 等人,2003, Act Crystalogr. D Biol. 59 :1447_53),具有與里氏木霉Xyn3的33%序列同一性。如本文中使用的,“里氏木霉Xyn3多肽”指包含這樣的序列的多肽和/或其變體,所述序列與SEQ ID NO 42的殘基17至347之間至少50、75、100、125、150、175、200、250或300個(gè)連續(xù)的氨基酸殘基具有至少85 % ,86 % ,87 % ,88 %,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性。里氏木霉Xyn3多肽與天然的里氏木霉Xyn3相比,優(yōu)選在殘基E91、E176、E180、E195和E282是沒有改變的。里氏木霉Xyn3多肽優(yōu)選至少70 %、80 %、90 %、95 %、98 %或99 %的在里氏木霉Xyn3和Xysl delta之間保守的氨基酸殘基是沒有改變的。里氏木霉Xyn3多肽適宜地包括圖21B所示的天然里氏木霉Xyn3的完整的預(yù)測(cè)保守結(jié)構(gòu)域。示例性的里氏木霉Xyn3多肽包括與圖21B所示成熟的里氏木霉Xyn3序列具有至少85 %、86 %、87 %、88 %、89 %、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100% 同一性的序列。本發(fā)明的里氏木霉Xyn3多肽優(yōu)選具有木聚糖酶活性。Xyn2 里氏木霉Xyn2的氨基酸序列(SEQ ID NO 43)顯示在圖22和55B中。SEQID NO 43是未成熟的里氏木霉Xyn2的序列。里氏木霉Xyn2具有對(duì)應(yīng)于SEQ ID NO 43的殘基I至33的預(yù)測(cè)的前多肽原序列(圖22中下劃線的);預(yù)期切割在16和17位之間的預(yù)測(cè)信號(hào)序列產(chǎn)生原肽,所述原肽在32和33位之間被kexin樣蛋白酶加工,產(chǎn)生具有對(duì)應(yīng)于的序列SEQ ID NO 43的殘基33至222的成熟蛋白質(zhì)。在圖22中,預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。通過(guò)觀察當(dāng)酶作用于預(yù)處理的生物量或分離的半纖維素時(shí),里氏木霉Xyn2在存在木ニ糖酶(xylobiosidase)的條件下,催化增加的木糖單體生產(chǎn)的能力,間接的表現(xiàn)出里氏木霉Xyn2具有內(nèi)切木聚糖酶活性。保守的酸性殘基包括E118、E123和E209。如本文中使用的,“里氏木霉Xyn2多肽”指包含這樣的序列的多肽和/或其變體,所述序列與SEQID NO 43的殘基33至222之間至少50、75、100、125、150或175個(gè)連續(xù)的氨基酸殘基具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100 %序列同一性。里氏木霉Xyn2多肽與天然的里氏木霉Xyn2相比,優(yōu)選在殘基El 18、E123和E209是沒有改變的。里氏木霉Xyn2多肽優(yōu)選至少70%、80%、90%、95%、98%或99%的在里氏木霉Xyn2、AfuXyn2和AfuXyn5之間保守的氨基酸殘基是沒有改變的,如圖55B的比對(duì)中所示。里氏木霉Xyn2多肽適宜地包括圖22所示的天然里氏木霉Xyn2的完整的預(yù)測(cè)保守結(jié)構(gòu)域。示例性的里氏木霉Xyn2多肽包括與圖22所示成熟的里氏木霉Xyn2序列具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98^,99%或100%同一性的序列。本發(fā)明的里氏木霉Xyn2多肽優(yōu)選具有木聚糖酶活性。Bxll :単氏木霉BxlI的氨基酸序列(SEQ ID NO 44)顯示在圖23和64中。SEQ IDNO :44是未成熟的里氏木霉Bxll的序列。里氏木霉BxlI具有對(duì)應(yīng)于SEQ ID NO :44的殘基I至18的預(yù)測(cè)的信號(hào)序列(圖23中下劃線的);預(yù)期切割信號(hào)序列產(chǎn)生具有對(duì)應(yīng)于的序列SEQ IDNO 44的殘基19至797的序列的成熟蛋白質(zhì)。在圖23中,預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。里氏木霉Bxll表現(xiàn)出具有@ -木糖苷酶活性,在例如使用對(duì)-硝基苯-P -木吡喃糖苷、木ニ糖和/或混合的線性的木糖寡聚物作為底物的酶學(xué)測(cè)定中。保守的酸性殘基包括E193、E234和D310。如本文中使用的,“里氏木霉Bxll多肽”指包含這樣的序列的多肽和/或其變體,所述序列與SEQ ID NO 44的殘基17至797之間至少50、75、100、125、150、
175、200、250、300、350、400、450、500、550、600、650、700 或 750 個(gè)連續(xù)的氨基酸殘基具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。里氏木霉BxlI多肽與天然的里氏木霉BxlI相比,優(yōu)選在殘基E193、E234和D310是沒有改變的。里氏木霉Bxll多肽優(yōu)選至少70%、80%、90%、95%、98%或
99%的在里氏木霉Bxl I、Fv3A和里氏木霉Bgl I之間保守的氨基酸殘基是沒有改變的,如圖64的比對(duì)中所示。里氏木霉Bxll多肽適宜地包括圖23所示的天然里氏木霉Bxll的完整的預(yù)測(cè)保守結(jié)構(gòu)域。示例性的里氏木霉Bxll多肽包括與圖23所示成熟的里氏木霉Bxll序列具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%、99%或100%同一性的序列。本發(fā)明的里氏木霉Bxll多肽優(yōu)選具有¢-木糖苷酶活性。相應(yīng)的,本發(fā)明的里氏木霉Bxll多肽適宜地包括與SEQ ID NO 44的氨基酸序列具有至少 90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性的
氨基酸序列。多肽適宜地具有¢-木糖苷酶活性。Bgll :里氏木霉Bgll的氨基酸序列(SEQ ID NO 45)顯示在圖24和64中。里氏木霉Bgll具有對(duì)應(yīng)于SEQ ID NO 45的殘基I至19的預(yù)測(cè)的信號(hào)序列(圖24中下劃線的);預(yù)期切割信號(hào)序列產(chǎn)生具有對(duì)應(yīng)于SEQ ID NO :45的殘基20至744的序列的成熟蛋白質(zhì)。在圖24中,預(yù)測(cè)的保守結(jié)構(gòu)域用粗體字表示。通過(guò)觀察其催化對(duì)硝基苯-P-D-吡喃葡萄糖苷水解生成對(duì)硝基苯酚的能力,和催化纖維ニ糖水解的能力,里氏木霉Bgll表現(xiàn)出具有¢-葡糖苷酶活性。保守的酸性殘基包括D164、E197和D267。如本文中使用的,“里氏木霉Bgll多肽”指包含這樣的序列的多肽和/或其變體,所述序列與SEQ ID NO 45的殘基 20 至 744 之間至少 50、75、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750或780個(gè)連續(xù)的氨基酸殘基具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%序列同一性。里氏木霉Bgll 多肽與天然的Bgll相比,優(yōu)選在殘基D164、E197和D267是沒有改變的。里氏木霉Bgll多肽優(yōu)選至少70%、80%、90%、95%、98%或99%的在里氏木霉Bgll、Fv3A和里氏木霉Bxll之間保守的氨基酸殘基是沒有改變的,如圖64的比對(duì)中所示。里氏木霉Bgll多肽適宜地包括圖24所示的天然里氏木霉Bgll的完整的預(yù)測(cè)保守結(jié)構(gòu)域。示例性的里氏木霉Bgll多肽包括與圖24所示成熟的里氏木霉8§11序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100% 同一性的序列。本發(fā)明的里氏木霉Bgll多肽優(yōu)選具有P -葡糖苷酶活性。相應(yīng)的,本公開內(nèi)容提供了多個(gè)分離的、合成的或重組的半纖維素水解多肽或變體,如下所述(I)包括這樣的氨基酸序列的多肽,所述氨基酸序列與對(duì)應(yīng)于(i)SEQ ID NO 2的24 至 766 位;(ii) SEQ ID NO 2 的 73 至 321 位;(iii) SEQ ID NO 2 的 73 至 394 位;(iv)SEQ ID NO 2 的 395 至 622 位;(v) SEQ ID NO 2 的 24 至 622 位;或(vi) SEQ ID NO 2 的73至622位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽優(yōu)選具有P-木糖苷酶活性;或(2)包括這樣的氨基酸序列的多肽,所述氨基酸序列與對(duì)應(yīng)于(i)SEQ ID NO 4的21 至 445 位;(ii) SEQ ID NO :4 的 21 至 301 位;(iii) SEQ ID NO :4 的 21 至 323 位;(iv)SEQ ID NO :4 的 21 至 444 位;(v) SEQ ID NO 4 的 302 至 444 位;(vi) SEQ ID NO 4 的 302至 445 位;(vii) SEQ ID NO 4 的 324 至 444 位;或(viii) SEQ ID NO 4 的 324 至 445 位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽優(yōu)選具有3-木糖苷酶活性;或(3)包括這樣的氨基酸序列的多肽,所述氨基酸序列與對(duì)應(yīng)于(i)SEQ ID NO 6的
19至 530 位;(ii) SEQ ID NO 6 的 29 至 530 位;(iii) SEQ ID NO 6 的 19 至 300 位;或(iv)SEQ ID NO :6的29至300位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽優(yōu)選具有P -木糖苷酶活性;或(4)包括這樣的氨基酸序列的多肽,所述氨基酸序列與對(duì)應(yīng)于(i)SEQ ID NO 8的
20至 439 位;(ii) SEQ ID NO :8 的 20 至 291 位;(iii) SEQ ID NO :8 的 145 至 291 位;或(iv) SEQ ID NO :8的145至439位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽優(yōu)選具有P -木糖苷酶活性;或(5)包括這樣的氨基酸序列的多肽,所述氨基酸序列與對(duì)應(yīng)于(i) SEQ ID N010的 23 至 449 位;(ii) SEQ ID NO :10 的 23 至 302 位;(iii) SEQ ID NO : 10 的 23 至 320 位;(iv) SEQ ID NO 10 的 23 至 448 位;(v) SEQ ID NO 10 的 303 至 448 位;(vi) SEQ ID NO 10的 303 至 449 位;(vii)SEQ ID NO 10 的 321 至 448 位;或(viii) SEQ ID NO :10 的 321 至449位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽優(yōu)選具有¢-木糖苷酶活性;或(6)包括這樣的氨基酸序列的多肽,所述氨基酸序列與對(duì)應(yīng)于(i) SEQ ID NO 12的 17 至 574 位;(ii)SEQ ID NO :12 的 27 至 574 位;(iii) SEQ ID NO 12 的 17 至 303 位;或(iv)SEQ ID NO :12的27至303位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽優(yōu)選具有P -木糖苷酶活性和L-a -阿拉伯呋喃糖苷酶活性;或(7)包括這樣的氨基酸序列的多肽,所述氨基酸序列與對(duì)應(yīng)于(i) SEQ ID NO 14的 21 至 676 位;(ii)SEQ ID NO :14 的 21 至 652 位;(iii) SEQ ID NO 14 的 469 至 652 位;或(iv)SEQ ID NO :14的469至676位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽優(yōu)選具有P -木糖苷酶活性和L-a -阿拉伯呋喃糖苷酶活性;或(8)包括這樣的氨基酸序列的多肽,所述氨基酸序列與對(duì)應(yīng)于(i) SEQ ID NO 16的 19 至 340 位;(ii)SEQ ID NO :16 的 53 至 340 位;(iii) SEQ ID NO 16 的 19 至 383 位;或(iv)SEQ ID NO :16的53至383位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽優(yōu)選具有P -木糖苷酶活性;或(9)包括這樣的氨基酸序列的多肽,所述氨基酸序列與對(duì)應(yīng)于(i) SEQ ID NO 18的 21 至 341 位;(ii)SEQ ID NO :18 的 107 至 341 位;(iii) SEQ ID NO 18 的 21 至 348 位;或(iv)SEQ ID NO :18的107至348位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽優(yōu)選具有P -木糖苷酶活性;或(10)包括這樣的氨基酸序列的多肽,所述氨基酸序列與對(duì)應(yīng)于(i) SEQ ID NO :20的15至558位;或(ii) SEQ ID NO :20的15至295位的氨基酸序列具有至少90%、至少
95%、至少98%、至少99%或100%序列同一性;多肽優(yōu)選具有L-a -阿拉伯呋喃糖苷酶活性;或(11)包括這樣的氨基酸序列的多肽,所述氨基酸序列與對(duì)應(yīng)于(i)SEQ ID NO :22的 21 至 632 位;(ii)SEQ ID NO :22 的 461 至 632 位;(iii) SEQ ID NO 22 的 21 至 642 位;或(iv)SEQ ID NO :22的461至642位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽優(yōu)選具有L-a -阿拉伯呋喃糖苷酶活性;或(12)包括這樣的氨基酸序列的多肽,所述氨基酸序列與對(duì)應(yīng)于(i) SEQ ID NO :28的 20 至 341 位;(ii)SEQ ID NO :28 的 21 至 350 位;(iii) SEQ ID NO 28 的 107 至 341 位;或(iv)SEQ ID NO :28的107至350位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽優(yōu)選具有P -木糖苷酶活性;或(13)包括這樣的氨基酸序列的多肽,所述氨基酸序列與對(duì)應(yīng)于(i) SEQ ID NO :32的 21 至 660 位;(ii)SEQ ID NO :32 的 21 至 645 位;(iii) SEQ ID NO 32 的 450 至 645 位;或(iv)SEQ ID NO :32的450至660位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽優(yōu)選具有L-a -阿拉伯呋喃糖苷酶活性。本公開內(nèi)容還提供了富含ー種或多種上述多肽的組合物(例如,纖維素酶組合物或酶摻合物/組合物)或發(fā)酵培養(yǎng)基。因而,酶摻合物/組合物是非天然存在的組合物。纖維素酶組合物可以是例如絲狀真菌纖維素酶組合物,例如木霉的纖維素酶組合物。發(fā)酵培養(yǎng)基可以是絲狀真菌的發(fā)酵培養(yǎng)基,例如木霉屬、腐質(zhì)霉屬、錸孢霉屬、曲霉屬、脈孢菌屬、青霉屬、頭孢霉屬、綿霉屬、柄孢殼屬、內(nèi)座殼屬、毛霉屬、旋孢腔菌、梨孢屬或金孢子菌屬的發(fā)酵培養(yǎng)基。特別的,發(fā)酵培養(yǎng)基可以是例如一種木霉屬物種的,例如里氏木霉的,或者青霉屬物種的,例如繩狀青霉的發(fā)酵培養(yǎng)基。發(fā)酵培養(yǎng)基還可以適宜地是無(wú)細(xì)胞的發(fā)酵培養(yǎng)基。此外,本公開內(nèi)容提供了經(jīng)重組改造而表達(dá)上述多肽的宿主細(xì)胞。宿主細(xì)胞可以是例如絲狀真菌宿主細(xì)胞,例如木霉屬、腐質(zhì)霉屬、錸孢霉屬、曲霉屬、脈孢菌屬、青霉屬、頭孢霉屬、綿霉屬、柄孢殼屬、內(nèi)座殼屬、毛霉屬、旋孢腔菌、梨孢屬或金孢子菌屬的細(xì)胞。特別的,宿主細(xì)胞可以是例如一種木霉屬物種的細(xì)胞(例如里氏木霉細(xì)胞),或者青霉細(xì)胞(例如繩狀青霉細(xì)胞)、曲霉細(xì)胞(例如米曲霉(Aspergillus oryzae)或構(gòu)巢曲霉細(xì)胞(Aspergillus nidulans)),或錸孢霉細(xì)胞(例如輪孢錸刀菌(Fusarium verticilloides)或尖孢錸刀菌(Fusarium oxysporum)細(xì)胞)。6. I. I融合蛋白本公開內(nèi)容還提供了這樣的融合蛋白,所述融合蛋白包括與ー個(gè)或多個(gè)融合片段連接的本公開內(nèi)容的蛋白質(zhì)的結(jié)構(gòu)域,所述融合片段典型的是與所述蛋白質(zhì)異源的(即,源自與本公開內(nèi)容的蛋白質(zhì)的不同的來(lái)源)。適宜地融合片段包括但不限于可以增強(qiáng)蛋白質(zhì)穩(wěn)定性、提供其他理想的生物學(xué)活性和/或促進(jìn)蛋白質(zhì)純化(例如,通過(guò)親和層析)的片段。適宜地融合片段可以是具有理想功能的任何大小的結(jié)構(gòu)域(例如,給予增加的穩(wěn)定性、溶解度、作用或生物學(xué)活性;和/或簡(jiǎn)化蛋白質(zhì)純化)。融合片段可以與本公開內(nèi)容的蛋白質(zhì)的結(jié)構(gòu)域的氨基和/或羧基端連接。融合片段可以是對(duì)切割敏感的。具有該敏感性可具有ー些優(yōu)點(diǎn),例如能夠直接回收目標(biāo)蛋白。融合蛋白優(yōu)選是通過(guò)培養(yǎng)用編碼蛋白質(zhì)的融合核酸轉(zhuǎn)染的重組細(xì)胞生產(chǎn)的,所述蛋白質(zhì)包括與蛋白質(zhì)或其結(jié)構(gòu)域的羧基或氨基端連接的融合片段,或者同時(shí)與羧基和氨基端連接的融合片段。此外,本公開內(nèi)容的蛋白質(zhì)還包括基因融合體(例如,重組蛋白的過(guò)表達(dá)的、可溶的和活性的形式)的表達(dá)產(chǎn)物、誘變基因(例如具有密碼子修飾以增強(qiáng)基因轉(zhuǎn)錄和翻譯的基因)的表達(dá)產(chǎn)物,和截短的基因(例如,具有去除信號(hào)序列的或用異源信號(hào)序列取代的基因)的表達(dá)產(chǎn)物。利用不溶性底物的糖基水解酶通常是模塊化酶。通常包括添加了一個(gè)或多個(gè)非催化性碳水化合物結(jié)合結(jié)構(gòu)域(CBM)的催化模塊。本質(zhì)上,CBM被認(rèn)為促進(jìn)糖基水解酶與其靶底物多糖的相互作用。因而,本公開內(nèi)容提供了具有改變的底物特異性的嵌合酶;包括例如,作為“切入”異源CBM的結(jié)果而具有多個(gè)底物的嵌合酶。本公開內(nèi)容的嵌合酶的異源CBM還可以設(shè)計(jì)為模塊化的,以便添加到催化性模塊或催化性結(jié)構(gòu)域(“CD”,例如在活性位點(diǎn))上,同樣其可以是與糖基水解酶異源或同源的。因而,本公開內(nèi)容提供了由CBM/⑶模塊組成的肽和多肽,或包括CBM/⑶模塊的肽和多肽,所述模塊可以是同源的配對(duì)或連接形成嵌合(異源)的CBM/CD對(duì)。因而,這些嵌合多肽/肽可用于改善或改變目標(biāo)酶的性能。相應(yīng)的,本公開內(nèi)容提供了這樣的嵌合酶,所述嵌合酶包括例如SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43、44或45的酶的至少ー個(gè)CBM。本公開內(nèi)容的多肽例如包括這樣的氨基酸序列,所述氨基酸序列包括 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43、44或45的糖基水解酶序列的CD和/或CBM。因而,本公開內(nèi)容的多肽可以適宜地是包括來(lái)自兩個(gè)或多個(gè)不同蛋白質(zhì)的功能結(jié)構(gòu)域的融合蛋白(例如,ー種蛋白質(zhì)的CBM與另ー種蛋白質(zhì)的⑶連接)。本公開內(nèi)容的多肽可以適宜地以“基本純的”形式獲得和/或使用。例如,本公開內(nèi)容的多肽構(gòu)成給定組合物中至少約80wt% (例如,至少約85wt WjOwt1^jlwt %、
或 99wt*% )的總蛋白,所述組合物
還包括其他成分,例如緩沖液或溶液。本公開內(nèi)容的多肽還可以適宜地以重組培養(yǎng)物培養(yǎng)基(例如,絲狀真菌培養(yǎng)物培養(yǎng)基)來(lái)獲得和/或使用。重組培養(yǎng)物培養(yǎng)基可以是非天然存在的;例如,可以通過(guò)經(jīng)改造表達(dá)本公開內(nèi)容的異源多肽的重組宿主細(xì)胞,或通過(guò)經(jīng)改造以比內(nèi)源表達(dá)水平更大或更少的量(例如,以比內(nèi)源表達(dá)水平大或小1、2、3、4、5或更多倍的量)表達(dá)本公開內(nèi)容的內(nèi)源多肽的重組宿主細(xì)胞來(lái)生產(chǎn)培養(yǎng)物培養(yǎng)基。此外,本公開內(nèi)容的多肽可以作為重組培養(yǎng)物培養(yǎng)基獲得和/或使用,所述重組培養(yǎng)物培養(yǎng)基是通過(guò)經(jīng)改造以理想比例表達(dá)本公開內(nèi)容多個(gè)多肽的“整合的”宿主細(xì)胞菌株生產(chǎn)的。示例性的理想比例描述在本文中,例如在下文的6. 3. 4節(jié)中。6. 2核酸和宿主細(xì)胞本公開內(nèi)容提供了編碼本公開內(nèi)容的多肽的核酸,例如上文6. I節(jié)中描述的。本公開內(nèi)容提供了包括這樣的核酸序列的分離的、合成的或重組的核酸,所述核酸序列與 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、46、47、48、49或50的核酸序列,在至少約10個(gè),例如至少約15、20、25、30、35、40、45、50、
75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、I100、I150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950或2000個(gè)核苷酸的區(qū)域,具有至少約70%,例如至少約71 %、72%,73%,74%,75%,76%,77%,78%,79%,80%,81 %,82%,83%,84%,85%,86%,87%、88%;89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或完全(100% )的序列同一性。本公開內(nèi)容還提供了編碼至少ー種具有半纖維素水解活性(例如,木聚糖酶、P -木糖苷酶和/或L- a -阿拉伯呋喃糖苷酶活性)的多肽的核酸。本公開內(nèi)容的核酸還包括分離的、合成的或重組的核酸,其編碼具有SEQ ID NO
2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43、44 或 45 的序列的酶,及其子序列(例如保守結(jié)構(gòu)域或碳水化合物結(jié)合結(jié)構(gòu)域(CBM)),及其變體。本公開內(nèi)容的核酸可以例如編碼SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43、44或45的蛋白質(zhì)的成熟部分。本公開內(nèi)容具體提供了編碼 Fv3A、Pf43A、Fv43E、Fv39A、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、Af43A、Pf51A、AfuXyn2、AfuXyn5、Fv43D、Pf43B、Fv43B、Fv51A、里氏木霉 Xyn3、里氏木霉Xyn2、里氏木霉BxlI,或里氏木霉Bgll多肽的核酸。例如,本公開內(nèi)容提供了分離的核酸分子,其中核酸分子編碼(I)包括與對(duì)應(yīng)于⑴ SEQ ID NO 2 的 24 至 766 位;(ii) SEQ IDNO 2 的 73 至 321位;(iii) SEQ ID NO 2 的 73 至 394 位;(iv) SEQID NO :2 的 395 至 622 位;(v) SEQ ID NO 2的24至622位;或(vi)SEQ ID NO :2的73至622位的氨基酸序列具有至少90 %、至少95%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽;或(2)包括與對(duì)應(yīng)于⑴ SEQ ID NO 4 的 21 至 445 位;(ii) SEQ IDNO 4 的 21 至 301位;(iii) SEQ ID NO :4 的 21 至 323 位;(iv) SEQID NO :4 的 21 至 444 位;(v) SEQ ID NO 4的 302 至 444 位;(vi) SEQ ID NO 4 的 302 至 445 位;(vii) SEQ ID NO 4 的 324 至 444 位;或(viii)SEQ ID NO :4的324至445位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽;或(3)包括與對(duì)應(yīng)于⑴ SEQ ID NO 6 的 19 至 530 位;(ii) SEQ IDNO 6 的 29 至 530位;(iii) SEQ ID NO 6的19至300位;或(iv) SEQID NO 6的29至300位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽;或(4)包括與對(duì)應(yīng)于⑴ SEQ ID NO 8 的 20 至 439 位;(ii) SEQ IDNO 8 的 20 至 291位;(iii) SEQ ID NO 8 的 145 至 291 位;或(iv)SEQ ID NO 8 的 145 至 439 位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽;或(5)包括與對(duì)應(yīng)于(i) SEQ ID NO :10 的 23 至 449 位;(ii) SEQID N0:10 的 23 至302 位;(iii) SEQ ID NO : 10 的 23 至 320 位;(iv) SEQ ID NO : 10 的 23 至 448 位;(v) SEQ IDNO :10 的 303 至 448 位;(vi)SEQ ID NO : 10 的 303 至 449 位;(vii) SEQ ID NO :10 的 321 至448位;或(viii)SEQ ID NO :10的321至449位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽;或(6)包括與對(duì)應(yīng)于⑴ SEQ ID NO : 12 的 17 至 574 位;(ii) SEQID NO: 12 的 27 至574 位;(iii) SEQ ID NO : 12 的 17 至 303 位;或(iv) SEQ ID NO : 12 的 27 至 303 位的氨基酸序列具有至少90 %、至少95 %、至少98 %、至少99 %或100 %序列同一性的氨基酸序列的多肽;或(7)包括與對(duì)應(yīng)于(i) SEQ ID NO : 14 的 21 至 676 位;(ii) SEQID NO : 14 的 21 至652 位;(iii) SEQ ID NO 14 的 469 至 652 位;或(iv) SEQ ID NO :14 的 469 至 676 位的氨基酸序列具有至少90 %、至少95 %、至少98 %、至少99 %或100 %序列同一性的氨基酸序列的多肽;或(8)包括與對(duì)應(yīng)于(i) SEQ ID NO : 16 的 19 至 340 位;(ii) SEQID NO: 16 的 53 至
340位;(iii) SEQ ID NO 16 的 19 至 383 位;或(iv)SEQ ID NO :16 的 53 至 383 位的氨基酸序列具有至少90 %、至少95 %、至少98 %、至少99 %或100 %序列同一性的氨基酸序列的多肽;或(9)包括與對(duì)應(yīng)于(i) SEQ ID NO : 18 的 21 至 341 位;(ii) SEQID NO : 18 的 107 至
341位;(iii) SEQ ID NO 18 的 21 至 348 位;或(iv) SEQ ID NO :18 的 107 至 348 位的氨基酸序列具有至少90 %、至少95 %、至少98 %、至少99 %或100 %序列同一性的氨基酸序列的多肽;或(10)包括與對(duì)應(yīng)于(i)SEQ ID NO :20 的 15 至 558 位;或(ii)SEQ ID NO :20 的15至295位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽;或(11)包括與對(duì)應(yīng)于(i) SEQ ID NO :22 的 21 至 632 位;(ii) SEQID N0:22 的 461 至632 位;(iii) SEQ ID NO 22 的 21 至 642 位;或(iv) SEQ ID NO :22 的 461 至 642 位的氨基酸序列具有至少90 %、至少95 %、至少98 %、至少99 %或100 %序列同一性的氨基酸序列的多肽;或(12)包括與對(duì)應(yīng)于(i)SEQ ID NO :28 的 20 至 341 位;(ii) SEQID NO 28 的 21 至350 位;(iii) SEQ ID NO 28 的 107 至 341 位;或(iv) SEQ ID NO :28 的 107 至 350 位的氨基酸序列具有至少90 %、至少95 %、至少98 %、至少99 %或100 %序列同一性的氨基酸序列的多肽;或(13)包括與對(duì)應(yīng)于(i) SEQ ID NO :32 的 21 至 660 位;(ii) SEQID NO :32 的 21 至645 位;(iii) SEQ ID NO 32 的 450 至 645 位;或(iv) SEQ ID NO :32 的 450 至 660 位的氨基酸序列具有至少90 %、至少95 %、至少98 %、至少99 %或100 %序列同一性的氨基酸序列的多肽。
本公開內(nèi)容還提供(I)與 SEQ ID N0:1 具有至少 90% (例如,至少 90 %、91 %、92 %、93 %、94 %、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能夠在高嚴(yán)緊條件下與SEQ IDNO 1的互補(bǔ)體或與其片段雜交的核酸;或(2)與 SEQ ID N0:3 具有至少 90% (例如,至少 90 %、91 %、92 %、93 %、94 %、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能夠在高嚴(yán)緊條件下與SEQ IDNO 3的互補(bǔ)體或與其片段雜交的核酸;或(3)與 SEQ ID N0:5 具有至少 90% (例如,至少 90 %、91 %、92 %、93 %、94 %、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能夠在高嚴(yán)緊條件下與SEQ IDNO 5的互補(bǔ)體或與其片段雜交的核酸;或(4)與 SEQ ID N0:7 具有至少 90% (例如,至少 90 %、91 %、92 %、93 %、94 %、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能夠在高嚴(yán)緊條件下與SEQ IDNO 7的互補(bǔ)體或與其片段雜交的核酸;或(5)與 SEQ ID N0:9 具有至少 90% (例如,至少 90 %、91 %、92 %、93 %、94 %、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能夠在高嚴(yán)緊條件下與SEQ IDNO 9的互補(bǔ)體或與其片段雜交的核酸;或(6)與 SEQ ID N0:11 具有至少 90% (例如,至少 90 %、91 %、92 %、93 %、94 %、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能夠在高嚴(yán)緊條件下與SEQ IDNO 11的互補(bǔ)體或與其片段雜交的核酸;或(7)與 SEQ ID N0:13 具有至少 90% (例如,至少 90%、91 %、92%、93%、94%、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能夠在高嚴(yán)緊條件下與SEQ IDNO 13的互補(bǔ)體或與其片段雜交的核酸;或(8)與 SEQ ID N0:15 具有至少 90% (例如,至少 90 %、91 %、92 %、93 %、94 %、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能夠在高嚴(yán)緊條件下與SEQ IDNO 15的互補(bǔ)體或與其片段雜交的核酸;或(9)與 SEQ ID N0:17 具有至少 90% (例如,至少 90 %、91 %、92 %、93 %、94 %、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能夠在高嚴(yán)緊條件下與SEQ IDNO 17的互補(bǔ)體或與其片段雜交的核酸;或(10)與 SEQ ID NO : 19 具有至少 90 % (例如,至少 90%、91 %、92%、93%、94%、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能夠在高嚴(yán)緊條件下與SEQ IDNO 19的互補(bǔ)體或與其片段雜交的核酸;或(11)與 SEQ ID N0:21 具有至少 90% (例如,至少 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能夠在高嚴(yán)緊條件下與SEQ IDNO 21的互補(bǔ)體或與其片段雜交的核酸;或(12)與 SEQ ID NO :27 具有至少 90 % (例如,至少 90%、91 %、92%、93%、94%、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能夠在高嚴(yán)緊條件下與SEQ IDNO 27的互補(bǔ)體或與其片段雜交的核酸;或(13)與 SEQ ID NO :31 具有至少 90 % (例如,至少 90%、91 %、92%、93%、94%、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能夠在高嚴(yán)緊條件下與SEQ IDNO 31的互補(bǔ)體或與其片段雜交的核酸。本公開內(nèi)容還提供了包含上述核酸的表達(dá)盒和/或載體。適宜地,將編碼本公開內(nèi)容的酶的核酸與啟動(dòng)子有效連接。具體是當(dāng)需要在絲狀真菌宿主中重組表達(dá)時(shí),啟動(dòng)子可以是絲狀真菌啟動(dòng)子。核酸可以是例如處于異源啟動(dòng)子的控制下。核酸還可以在組成型或誘導(dǎo)型啟動(dòng)子的控制下表達(dá)??墒褂玫膯?dòng)子的實(shí)例包括但不限于纖維素酶啟動(dòng)子、木聚糖酶啟動(dòng)子、1818啟動(dòng)子(之前定義為由EST作圖的木霉的高表達(dá)蛋白質(zhì))。例如,啟動(dòng)子可以適宜地是纖維ニ糖水解酶、內(nèi)切葡聚糖酶或¢-葡糖苷酶的啟動(dòng)子。特別適宜地啟動(dòng)子可以是例如里氏木霉纖維ニ糖水解酶、內(nèi)切葡聚糖酶或¢-葡糖苷酶的啟動(dòng)子。例如啟動(dòng)子是纖維ニ糖水解酶I (cbhl)啟動(dòng)子。啟動(dòng)子的非限制性實(shí)例包括 cbhl、cbh2、egll、egl2、egl3、egl4、egl5、pkil、gpdl、xynl 或 xyn2 啟動(dòng)子。啟動(dòng)子的其他非限制性實(shí)例包括里氏木霉cbhl、cbh2、egll、egl2、egl3、egl4、egl5、pkil、gpdl、xynl 或 xyn2 啟動(dòng)子。本公開內(nèi)容還提供了經(jīng)改造以表達(dá)ー種或多種本公開內(nèi)容的酶的宿主細(xì)胞。適宜地宿主細(xì)胞包括任何微生物的細(xì)胞(例如,細(xì)菌、原生生物、藻類、真菌(例如酵母或絲狀真菌)或其他微生物的細(xì)胞),優(yōu)選細(xì)菌、酵母或絲狀真菌的細(xì)胞。適宜地細(xì)菌屬的宿主細(xì)胞包括但不限于埃希菌屬、芽孢桿菌屬、乳桿菌屬、假單胞菌屬和鏈霉菌屬的細(xì)胞。適宜地細(xì)菌物種的宿主細(xì)胞包括但不限于大腸桿菌(Escherichiacoli)、枯草芽抱桿菌(Bacillussubtilis)、地衣芽抱桿菌(Bacillus licheniformis)、短乳桿菌(Lactobacillusbrevis)、綠胺假單胞菌(Pseudomonas aeruginosa)和淺青紫鏈霉菌(Streptomyces Iividans)的細(xì)胞。適宜地酵母屬的宿主細(xì)胞包括但不限于酵母屬(Saccharomyces)、裂埴酵母屬(Schizosaccharomyces)、假絲酵母屬(Candida)、漢森氏酵母屬(Hansenula)、畢赤酵母屬(Pichia)、克魯維酵母屬(Kluyveromyces)和法夫酵母屬(Phaffia)的細(xì)胞。適宜地酵母物種的宿主細(xì)胞包括但不限于釀酒酵母(Saccharomyces cerevisiae)、栗酒裂埴酵母(Schizosaccharomyces pombe)、白色假絲酵母(Candidaalbicans)、多形漢森酵母(Hansenula polymorpha)、巴斯德畢赤酵母(Pichiapastoris)、P. canadensis、馬克思克魯維酵母(Kluyveromycesmarxianus)和法夫酵母(Phaffia rhodozyma)的細(xì)胞。適宜地絲狀真菌的宿主細(xì)胞包括真菌亞門的所有絲狀體形式。適宜地絲狀真菌屬的宿主細(xì)胞包括但不限于支頂孢屬(Acremonium)、曲霉屬、短梗霉屬(Aureobasidium)、煙管菌屬(Bjerkandera)、擬臘菌屬(Ceriporiopsis)、金孢子菌屬(Chrysoporium)、鬼傘屬(Coprinus)、革蓋菌屬(Coriolus)、Corynascus、毛殼菌屬(Chaetomium)、隱球菌屬(Cryptococcus)、線黑粉酵母屬(Filobasidium)、錸孢霉屬、赤霉菌屬(Gibberella)、腐質(zhì)霉屬、肉座菌屬(Hypocrea)、Magnaporthe、毛霉屬、毀絲霉屬(Myceliophthora)、毛霉屬、Neocal I imastix、脈孢菌屬、擬青霉屬(Paecilomyces)、青霉屬、平革菌屬(Phanerochaete)、射脈菌屬(Phlebia)、Piromyces、側(cè)耳屬(Pleurotus)、Scytaldium、裂裙菌屬(Schizophyllum)、孢子絲菌屬(Sporotrichum)、籃狀菌屬(Talaromyces)JiI熱子囊菌(Thermoascus)、梭孢殼屬(Thielavia)、彎頸霉屬(Tolypocladium)、栓菌屬(Trametes)和木霉屬的細(xì)胞。適宜地細(xì)胞還可以包括這些絲狀真菌屬的各種無(wú)性型和有性型形式的細(xì)胞。
適宜地絲狀真菌物種的宿主細(xì)胞包括但不限于泡盛曲霉、煙曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、構(gòu)巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillusoryzae)、Chrysosporiumlucknowense^ Fusarium bactridioides、Fusarium cerealis、克地f廉刀菌(Fusarium crookwellense)、大刀f廉刀菌(Fusarium culmorum)、禾谷f(wàn)廉抱菌(Fusarium graminearum)、Fusarium graminum、弁抱 廉刀-囷(Fusarium heterosporum)、Fusarium negundi、尖抱,廉刀菌(Fusariumoxysporum)、Fusarium reticulatum、粉紅錸刀菌(Fusarium roseum)、接骨木錸刀菌(Fusarium sambucinum)、膚色f廉刀M (Fusariumsarcochroum)、擬分枝抱辛廉 ノ^)菌(Fusarium sporotrichioidesノ、硫色 廉 ノコ囷(Fusarium sulphureum ノ、Fusarium torulosum、擬絲抱,廉刀菌(Fusariumtrichothecioidesノ、Fusarium venenatum、黑管菌(Bjerkan deraadusta)、十?dāng)M錯(cuò)M (Ceriporiopsis aneirina; ^ ¢0 ^ (Ceriporiopsisaneirina; ^ Ceriporiopsiscaregiea、ダ戈成擬錯(cuò)菌(Ceriporiopsis gilvescens)、しeriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、 蟲擬錯(cuò)菌(Ceriporiopsissubvermispora)、灰蓋鬼傘(Coprinus cinereus)、毛云芝菌(Coriolus hirsutus)、特
異腐質(zhì)霉(Humicola insolens)、柔毛腐質(zhì)霉(Humicola lanuginosa)、米赫毛霉(Mucormiehei)、嗜熱毀絲霉(Myceliophthora thermophila)、粗糖脈抱霉(Neurospora crassa)、間型脈抱菌(Neurospora intermedia)、產(chǎn)紫青霉(Penicilliumpurpurogenum)、變灰青霉(Penicillium canescens)、離生青霉(Penicillium solitum)、繩狀青霉(Penicilliumfuniculosum)、黃抱原毛平革菌(Phanerochaete chrysosporium)、白腐菌射脈側(cè)菌(Phlebiaradiate)、杏鮑燕(Pleurotus eryngii)、黃色籃狀菌(Talaromyces flavus)、太瑞斯梭抱殼霉(Thielavia terrestris)、長(zhǎng)域毛栓霉(Trametes villosa)、云芝(Trametesversicolor)、哈茨木霉(Tricnoderma harzianum)、康氏木霉(Trichoderma koningii)、長(zhǎng)枝木霉(Trichodermalongibrachiatum)、里氏木霉或綠色木霉(Trichoderma viride)的細(xì)胞。本公開內(nèi)容進(jìn)ー步提供了重組的宿主細(xì)胞,所述宿主細(xì)胞經(jīng)改造而表達(dá)ー種或多種、兩種或多種、三種或多種、四種或多種,或五種或多種的Fv3A、Pf43A、Fv43E、Fv39A、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、Af43A、Pf51A、AfuXyn2、AfuXyn5、Fv43D、Pf43B 和 Fv51A多肽。重組宿主細(xì)胞是例如重組的里氏木霉宿主細(xì)胞。在特定的實(shí)例中,本公開內(nèi)容提供了重組真菌,例如經(jīng)改造而表達(dá)ー種或多種、兩種或多種、三種或多種、四種或多種,或五種或多種的 Fv3A、Pf43A、Fv43E、Fv39A、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、Af43A、Pf51A、AfuXyn2、AfuXyn5、Fv43D、Pf43B和Fv51A多肽的重組里氏木霉。本公開內(nèi)容提供了重組的里氏木霉宿主細(xì)胞,所述宿主細(xì)胞經(jīng)改造而表達(dá)1、2、3、4、5或更多種的Fv3A、Pf43A、Fv43E、Fv39A、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、Af43A、Pf51A、AfuXyn2、AfuXyn5、Fv43D、Pf43B 和 Fv51A 多肽。本公開內(nèi)容提供了宿主細(xì)胞,例如重組的真菌宿主細(xì)胞或重組的絲狀真菌,其經(jīng)改造而重組的表達(dá)至少ー種木聚糖酶、至少ー種P -木糖苷酶和至少ー種L-a -阿拉伯呋喃糖苷酶。本公開內(nèi)容還提供了重組的宿主細(xì)胞,例如重組的真菌宿主細(xì)胞或重組的絲狀真菌,如重組的里氏木霉,所述重組的宿主細(xì)胞經(jīng)過(guò)改造,除一種或多種的里氏木霉Xyn2、里氏木霉Xyn3、里氏木霉Bxll和/或里氏木霉Bgllタト,還表達(dá)1、2、3、4、5或更多種的Fv3A、Pf43A、Fv43E、Fv39A、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、Af43A、Pf51A、AfuXyn2、八血乂7115{430、?デ438和?¥5認(rèn)多肽。重組宿主細(xì)胞是例如里氏木霉宿主細(xì)胞。重組真菌是例如重組的里氏木霉。本公開內(nèi)容提供了里氏木霉宿主細(xì)胞,或重組的里氏木霉真菌,其經(jīng)過(guò)改造,除了重組表達(dá)一種或多種的里氏木霉Xyn2、里氏木霉Xyn3、里氏木霉Bxll和/或里氏木霉Bgllタト,還重組表達(dá)1、2、3、4、5或更多種的Fv3A、Pf43A、Fv43E、Fv39A、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、Af43A、Pf51A、AfuXyn2、AfuXyn5、Fv43D、Pf43B 和 Fv51A 多肽。本公開內(nèi)容還提供了重組的宿主細(xì)胞,例如重組的真菌宿主細(xì)胞或重組的生物體,例如絲狀真菌,如重組的里氏木霉,其經(jīng)改造而重組的表達(dá)里氏木霉Xyn3、里氏木霉BglU Fv3A、Fv43D和Fv51A多肽。例如,重組的宿主細(xì)胞適宜地是里氏木霉宿主細(xì)胞。重組的真菌適宜地是重組的里氏木霉。本公開內(nèi)容提供了例如經(jīng)改造而重組表達(dá)里氏木霉Xyn3、里氏木霉Bgll、Fv3A、Fv43D和Fv51A多肽的里氏木霉宿主細(xì)胞。此外,本公開內(nèi)容提供了重組的宿主細(xì)胞或重組的真菌,其經(jīng)改造而表達(dá)酶摻合物,所述酶摻合物以適合糖化的比例包含合適的酶。重組宿主細(xì)胞是例如真菌宿主細(xì)胞。重
組真菌是例如重組的里氏木霉。在合適的酶摻合物中存在的示例性的酶比例/量描述在下文6. 3. 4節(jié)中。本公開內(nèi)容進(jìn)ー步提供了包含本公開內(nèi)容的核酸或本公開內(nèi)容的表達(dá)盒的轉(zhuǎn)基因植物。轉(zhuǎn)基因植物可以是例如谷類植物、玉米植物、馬鈴薯植物、西紅柿植物、小麥植物、油料種子植物、油菜籽植物、大豆植物、水稻植物、大麥植物或煙草植物。6. 3用于糖化的酶摻合物本公開內(nèi)容提供了包含能夠降解木質(zhì)纖維素材料的酶摻合物/組合物的組合物。此類多酶摻合物/組合物包括至少ー種本公開內(nèi)容的多肽,組合了一種或多種其他本公開內(nèi)容的多肽,或一種或多種來(lái)自其他微生物、植物或生物體的酶。考慮了協(xié)同的酶組合和相關(guān)的方法。本公開內(nèi)容包括用于鑒別包括在用于降解特定的木質(zhì)纖維素材料的摻合物/組合物中的最佳酶比例的方法。這些方法包括例如這樣的測(cè)試,所述測(cè)試鑒別最佳的酶摻合物/組合物和用于將給定的木質(zhì)纖維素底物有效轉(zhuǎn)化為其組分糖的比例。下列實(shí)施例包括可用于鑒別降解木質(zhì)纖維素材料的酶的最佳比例和摻合物/組合物的測(cè)定。6. 3. I 背景高等植物的細(xì)胞壁包括多種碳水化合物聚合物(CP)組分。這些CP通過(guò)共價(jià)和非共價(jià)方式相互作用,提供了形成堅(jiān)硬的細(xì)胞壁和抵抗植物膨壓所需的結(jié)構(gòu)完整性。在植物中發(fā)現(xiàn)的主要CP是纖維素,形成了細(xì)胞壁的結(jié)構(gòu)骨架。在纖維素的生物合成過(guò)程中,聚-3 -1,4-D-葡萄糖鏈自身通過(guò)氫鍵和疏水相互作用相關(guān)聯(lián),形成纖維素微纖絲,微纖絲再進(jìn)ー步自身關(guān)聯(lián)形成更大的纖絲(fibri I s)。纖維素微纖絲通常是不規(guī)則結(jié)構(gòu)的,并含有變化的結(jié)晶度的區(qū)域。纖維素微纖絲的結(jié)晶程度取決于其組分纖維素鏈之間和之中的氫鍵如何緊密排列的。具有較低有序結(jié)合的區(qū)域,因而具有更多可接近的葡萄糖鏈,被稱為無(wú)定型區(qū)域。纖維素解聚為葡萄糖的一般模型最少涉及三種不同的酶活性。在増加可接觸末端的數(shù)量的過(guò)程中,內(nèi)切葡聚糖酶內(nèi)部切割纖維素鏈為短鏈,所述末端比完整的纖維素鏈對(duì)外切葡聚糖酶活性更敏感。這些外切葡聚糖酶(例如,纖維ニ糖水解酶)特異性針對(duì)還原端或非還原端,在大多數(shù)情況下釋放葡萄糖的ニ聚體纖維ニ糖。積累的纖維ニ糖然后經(jīng)歷纖維ニ糖酶(例如,0-1,4-葡糖苷酶)切割為葡萄糖。纖維素僅含有無(wú)水合葡萄糖。相反,半纖維素含有多個(gè)不同的糖単體。例如除葡萄糖外,半纖維素中的糖單體還可包括木糖、甘露糖、半乳糖、鼠李糖和阿拉伯糖。半纖維素大部分含有D-戊糖,偶爾含少量L-糖。典型的存在最大量的木糖,但也傾向于存在甘露糖醛酸和半乳糖醛酸。半纖維素包括木聚糖、葡糖醛酸木聚糖、阿拉伯木聚糖、葡糖甘露聚糖和木葡聚糖。本公開內(nèi)容的酶和多酶組合物可用于半纖維素材料的糖化,包括例如,木聚糖、阿拉伯木聚糖,和含有木聚糖或阿拉伯木聚糖的底物。阿拉伯木聚糖是包括木糖和阿拉伯糖的多糖,其中L-a-阿拉伯呋喃糖殘基作為分支點(diǎn)與¢-(1,4)-連接的木糖多聚體骨架相連接。大部分生物量來(lái)源是相當(dāng)復(fù)雜的,其中含有纖維素、半纖維素、果膠、木質(zhì)素、蛋白
質(zhì)和灰質(zhì)等。相應(yīng)的,在某些方面,本公開內(nèi)容提供了含有這樣的酶的酶摻合物/組合物,所述酶當(dāng)以最有效的方式共同作用降解生物量為可發(fā)酵糖時(shí),產(chǎn)生多種底物特異性。本發(fā)明的多酶摻合物/組合物的一個(gè)實(shí)例是纖維ニ糖水解酶、木聚糖酶、內(nèi)切葡聚糖酶、P -葡糖苷酶、3-木糖苷酶和任選的輔助蛋白質(zhì)的混合物。酶摻合物/組合物適宜地是非天然存在的組合物。相應(yīng)的,本公開內(nèi)容提供了包含木聚糖水解酶、半纖維素水解酶和/或纖維素水解酶的混合物的酶摻合物/組合物(包含制備產(chǎn)物),包括至少ー種、若干種或所有的纖維素酶,包括葡聚糖酶、纖維ニ糖水解酶、L-a-阿拉伯呋喃糖苷酶、木聚糖酶、0 -葡糖苷酶和¢-木糖苷酶。優(yōu)選的,本公開內(nèi)容的每種酶摻合物/組合物包括至少ー種本公開內(nèi)容的酶。本公開內(nèi)容還提供了酶摻合物/組合物,其是非天然存在的組合物。如本文中使用的,術(shù)語(yǔ)“酶摻合物/組合物”指(I)通過(guò)組合組分酶制造的組合物,不論是以發(fā)酵培養(yǎng)基還是部分或完全分離或純化的形式;(2)由經(jīng)修飾而表達(dá)ー種或多種組分酶的生物體生產(chǎn)的組合物;在某些實(shí)施方案中,用于表達(dá)ー種或多種組分酶的生物體可以經(jīng)修飾而刪除了ー個(gè)或多個(gè)基因;在某些其他實(shí)施方案中,用于表達(dá)ー種或多種組分酶的生物體可以進(jìn)一歩包括影響木聚糖水解、半纖維素水解和/或纖維素水解的蛋白質(zhì);(3)在糖化或發(fā)酵反應(yīng)的過(guò)程中,同時(shí)、分別或順序地組合組分酶而制造的組合物;(4)原位生產(chǎn)的酶混合物,例如在糖化或發(fā)酵反應(yīng)的過(guò)程中;(5)根據(jù)任ー或所有的上述(1)-(4)生產(chǎn)的組合物。術(shù)語(yǔ)“發(fā)酵培養(yǎng)基”在本文中指通過(guò)發(fā)酵生產(chǎn)的酶制品,所述酶制品在發(fā)酵后沒有經(jīng)過(guò)或只經(jīng)過(guò)最小程度的回收和/或純化。例如,將微生物培養(yǎng)物生長(zhǎng)至飽和,在碳限制條件下孵育,允許蛋白質(zhì)合成(例如,表達(dá)酶)。然后,一旦酶被分泌到細(xì)胞培養(yǎng)基中,就可以使用發(fā)酵培養(yǎng)基。本公開內(nèi)容的發(fā)酵培養(yǎng)基可以含有未分級(jí)的或分級(jí)的源自發(fā)酵末期的發(fā)酵材料內(nèi)容物。例如,本發(fā)明的發(fā)酵培養(yǎng)基是未分級(jí)的,包括在微生物細(xì)胞(例如,絲狀真菌細(xì)胞)經(jīng)歷發(fā)酵過(guò)程后存在的耗盡營(yíng)養(yǎng)的培養(yǎng)基和細(xì)胞碎片。發(fā)酵培養(yǎng)基可以適宜地含有耗盡營(yíng)養(yǎng)的細(xì)胞培養(yǎng)基、胞外酶,和活的或殺死的微生物細(xì)胞??蛇x的,可以分級(jí)發(fā)酵培養(yǎng)基以去除微生物細(xì)胞。在這些情況下,發(fā)酵培養(yǎng)基可以包括例如耗盡營(yíng)養(yǎng)的細(xì)胞培養(yǎng)基和胞外酶。本文具體描述的任何酶都可與本文描述的任何一種或多種酶組合,或與任何其他可獲得和合適的酶組合,來(lái)生產(chǎn)合適的多酶摻合物/組合物。本公開內(nèi)容不限于下文列舉的特定示例性組合。6. 3. 2 牛物量本公開內(nèi)容提供了使用本公開內(nèi)容的酶、酶摻合物/組合物進(jìn)行生物量糖化的方法。如本文中使用的,術(shù)語(yǔ)“生物量”指包含纖維素和/或半纖維素(任選的還有在木質(zhì)纖維素生物量材料中的木質(zhì)素)的任何組合物。如本文中使用的,生物量包括但不限于種子、谷類、塊莖、植物廢棄物或食品加工或エ業(yè)加工的副產(chǎn)物(例如,莖)、玉米(包括例如玉米棒、稻桿等)、草(包括例如,印度草,印度落芒草(Sorgh astrum nutans);或柳枝稷,如黍
(Panicum)物種,例如柳枝稷(Panicum virgatum))、木材(包括例如,木屑、下腳料)、紙、紙漿、再生紙(例如,報(bào)紙、印刷紙等)。其他生物量包括但不限于馬鈴薯、大豆(例如,油菜)、大麥、黑麥、燕麥、小麥、甜菜和鹿糖洛。本公開內(nèi)容提供了糖化方法,包括將包含生物量材料的組合物(例如包含木聚糖、半纖維素、纖維素和/或可發(fā)酵的糖的材料)與本公開內(nèi)容的多肽、或與由本公開內(nèi)容的核酸編碼的多肽、或與本公開內(nèi)容的任一種酶摻合物/組合物或制品接觸。糖化的生物量(例如,通過(guò)本公開內(nèi)容的酶加工的木質(zhì)纖維素材料)可以通過(guò)例如微生物發(fā)酵和/或化學(xué)合成,制成多種生物產(chǎn)品。如本文中使用的,“微生物發(fā)酵”指在適宜地條件下培養(yǎng)和收獲發(fā)酵微生物的方法。發(fā)酵微生物可以是任何適用于理想的生產(chǎn)生物產(chǎn)品的發(fā)酵方法的微生物。合適的發(fā)酵微生物包括但不限于絲狀真菌、酵母和細(xì)菌。糖化生物量可以通過(guò)發(fā)酵和/或化學(xué)合成,制成例如燃料(例如,生物燃料,如生物こ醇、生物丁醇、生物甲醇、生物丙醇、生物柴油、航空煤油等)。糖化的生物量還可以通過(guò)發(fā)酵和/或化學(xué)合成,制成例如日用化學(xué)品(例如,抗壞血酸、異戊ニ烯、1,3_丙ニ醇)、脂類、氨基酸、蛋白質(zhì)和酶。6. 3. 3 預(yù)處理在糖化前,為了使木聚糖、半纖維素、纖維素和/或木質(zhì)素材料更加接近酶或?qū)γ父舾?,?yōu)選將生物量(例如木質(zhì)纖維素材料)進(jìn)行ー個(gè)或多個(gè)預(yù)處理步驟,從而更易于被本公開內(nèi)容的酶和/或酶摻合物/組合物水解。在示例性的實(shí)施方案中,預(yù)處理涉及使生物量材料在反應(yīng)罐中經(jīng)過(guò)包含強(qiáng)酸和金屬鹽的稀釋溶液的催化劑處理。生物量材料可以是例如原材料或干燥的材料。該預(yù)處理可以降低纖維素水解的活化能或溫度,最終允許更高的可發(fā)酵糖的產(chǎn)量。參見例如美國(guó)專利號(hào) 6,660,506 ;6,423,145。另ー個(gè)示例性的預(yù)處理方法涉及通過(guò)使生物量材料在含水基質(zhì)中經(jīng)過(guò)第一水解步驟,來(lái)水解生物量,所述第一水解步驟選擇的溫度和壓カ主要實(shí)現(xiàn)解聚半纖維素而不顯著解聚纖維素為葡萄糖。該步驟產(chǎn)生這樣的漿料,所述漿料中的液體水相含有自半纖維素解聚獲得的溶解單糖,以及含有纖維素和木質(zhì)素的固相。然后,漿料在允許大部分纖維素解聚的條件下進(jìn)行第二次水解,產(chǎn)生含有溶解的/可溶性纖維素解聚產(chǎn)物的液體水相。參見例如美國(guó)專利號(hào)5,536,325。進(jìn)ー步的示例性方法涉及通過(guò)ー個(gè)或多個(gè)稀酸水解階段加工生物量材料,使用約0. 4%至約2%的強(qiáng)酸;再用堿脫木質(zhì)素化處理酸水解材料的未反應(yīng)的固體木質(zhì)纖維素組分。參見例如美國(guó)專利號(hào)6,409,841。另ー個(gè)示例性的預(yù)處理方法包括在預(yù)水解反應(yīng)罐中預(yù)水解生物量(例如,木質(zhì)纖維素材料);向固體的木質(zhì)纖維素材料中添加酸性液體,產(chǎn)生混合物;加熱混合物至反應(yīng)溫度;維持反應(yīng)溫度一段時(shí)間,所述時(shí)間足以將木質(zhì)纖維素材料分餾為含有至少約20%的來(lái)自木質(zhì)纖維素材料的木質(zhì)素的可溶性部分,和含有纖維素的固體級(jí)分;在反應(yīng)溫度下或附近,將可溶性部分與固體級(jí)分分離,去除可溶性部分;回收可溶性部分。致使固體級(jí)分中的纖維素更易于被酶促消化。參見例如美國(guó)專利號(hào)5,705,369。其他預(yù)處理方法可涉及使用過(guò)氧化氫H202。參見Gould, 1984, Biotech, andBioengr. 26 :46_52。預(yù)處理還可以包括將生物量材料與理論配比量的氫氧化鈉和極低濃度的氫氧化銨接觸。參見。Teixeira 等人,1999, Appl. Biochem. andBiotech. 77-79 :19_34。預(yù)處理還可以包括在中等溫度、壓カ和pH下,將木質(zhì)纖維素與pH約9至約14的化學(xué)品(例如堿,如碳酸鈉或氫氧化鉀)接觸。參見PCT公開W02004/081185。在優(yōu)選的預(yù)處理方法中使用例如氨。此類預(yù)處理方法包括使生物量材料在高固體的條件下接受低氨濃度處理。參見例如美國(guó)專利號(hào)20070031918和PCT公開WO 06110901。6. 3. 4示例件的酶摻合物本公開內(nèi)容提供了包括本公開內(nèi)容的一種或多種酶的酶摻合物/組合物。酶摻合物/組合物的ー種或多種酶可以通過(guò)重組宿主細(xì)胞或重組生物體生產(chǎn)。酶摻合物/組合物適宜地是非天然存在的組合物。本公開內(nèi)容的酶摻合物/組合物可以適宜地包括具有¢-木糖苷酶活性的第一多肽,并進(jìn)一歩包括1、2、3或4種具有0 -木糖苷酶活性的第二多肽、ー種或多種具有L-a-阿拉伯呋喃糖苷酶活性的多肽、ー種或多種具有木聚糖酶活性的多肽和ー種或多種具有纖維素酶活性的多肽。具有P -木糖苷酶活性的第一多肽是例如Fv3A、Pf43A、Fv43E、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A或Fv39A多肽。如果存在具有P -木糖苷酶活性的第ニ多肽,則其是例如不同于具有P -木糖苷酶活性的第一多肽,且適宜地是Fv3A、Pf43A、Fv43E、Fv43A、Fv43B、Pa51A、Gz43A、Fv43D、Fo43A、Fv39A 或里氏木霉 Bxll 多肽。如果存在具有L- a -阿拉伯呋喃糖苷酶活性的多肽的ー種或多種,則每種所述多肽是例如Af43A、Pf51A、Pa51A、Fv43B或Fv51A多肽。ー種或多種具有木聚糖酶活性的多肽中的每ー種是例如里氏木霉Xyn、里氏木霉Xyn2、AfuXyn2或AfuXyn5。如果存在ー種或多種具有纖維素酶活性的多肽,則每種所述多肽是例如內(nèi)切葡聚糖酶,如里氏木霉EGl或EG2 ;纖維ニ糖水解酶,如里氏木霉CBHl或CBH2 ;或¢-葡糖苷酶,如里氏木霉BglI。本公開內(nèi)容的另ー種酶摻合物/組合物可以適宜地包括具有L-a -阿拉伯呋喃糖苷酶活性的第一多肽,并進(jìn)一歩包括1、2、3或4種具有L- a -阿拉伯呋喃糖苷酶活性的第ニ多肽、ー種或多種具有¢-木糖苷酶活性的多肽、ー種或多種具有木聚糖酶活性的多肽和/或ー種或多種具有纖維素酶活性的多肽。第一種L-a -阿拉伯呋喃糖苷酶是Af43A、Pf51A或Fv51A多肽。第二種L-a -阿拉伯呋喃糖苷酶不同于第ー種L- a -阿拉伯呋喃糖苷酶,且是例如4デ434、?デ5認(rèn)、?&5認(rèn)、?¥438或?¥5認(rèn)多肽。ー種或多種P _木糖苷酶中的每ー種是例如 Fv3A、Pf43A、Fv43E、Fv43A、Fv43B、Pa51A、Fv43D、Gz43A、Fo43A、Fv39A 或里氏木霉Bxll多肽。在某些實(shí)施方案中,一種或多種木聚糖酶中的每ー種是里氏木霉Xyn3、里氏木霉Xyn2、AfuXyn2或AfuXyn5多肽。在某些實(shí)施方案中,ー種或多種纖維素酶中的每ー種分別是內(nèi)切葡聚糖酶,如里氏木霉EGl或EG2多肽;纖維ニ糖水解酶,如里氏木霉CBHl或CBH2多肽;或¢-葡糖苷酶,如里氏木霉Bgll多肽。木聚糖酶木聚糖酶適宜地構(gòu)成本公開內(nèi)容的酶摻合物/組合物的酶的(即,木聚糖酶的百分比是相對(duì)于組合物中的所有蛋白質(zhì)的重量的重量百分比)或相對(duì)重量基礎(chǔ)(即,其中木聚糖酶的百分比是相對(duì)于木聚糖酶、¢-木糖苷酶、纖維素酶、L-a-阿拉伯呋喃糖苷酶和輔助蛋白的組合重量的重量百分比)的約0. 05wt%至約75wt%的酶??梢苑奖愕挠?jì)算本公開內(nèi)容的酶摻合物/組合物中的任何ー對(duì)蛋白質(zhì)相對(duì)于彼此的比例??紤]這樣的摻合物/組合物,所述摻合物/組合物包含的酶的重量比例是可以從本文公開的重量百分比衍生的任何重量比例。木聚糖酶含量可以在這樣的范圍內(nèi),其中下限是酶摻合物/
組合物中的酶總重量的 0. 05wt% > Iwt % > 2wt % > 3wt % > 4wt % > 5wt % > 6wt % > 7wt % > 8wt % >9wt %、IOwt %、12wt %、15wt % >20wt % >25wt % >30wt % >40wt % >45wt % 或 50wt ,上限是酶摻合物/組合物中的酶總重量的IOwt %、15wt %、20wt %、25wt %、30wt %、35wt %、40wt 、50wt 、55wt 、60wt 、65wt 、70wt 或 75wt 。酶慘合物或組合物中的一種或多種木聚糖酶可以代表酶摻合物/組合物中的例如5wt %至20wt %、IOwt %至15wt %或15wt%至25wt%的總酶。包括在本公開內(nèi)容的酶摻合物/組合物中的示例性的合適的木聚糖酶描述在下文的6. 3. 6節(jié)中。L-a -阿拉伯呋喃糖苷酶L_ a -阿拉伯呋喃糖苷酶適宜地構(gòu)成給定的酶摻合物/組合物中所有酶總重量(即,其中L-a -阿拉伯呋喃糖苷酶的百分比是相對(duì)于摻合物/組合物中的所有蛋白質(zhì)的重量的重量百分比)或相對(duì)重量基礎(chǔ)(即,其中L-a -阿拉伯呋喃糖苷酶的百分比是相對(duì)于木聚糖酶、¢-木糖苷酶、纖維素酶、L-a-阿拉伯呋喃糖苷酶和輔助蛋白的組合重量的重量百分比)的約0. 05wt%至約75wt%的酶?;诒竟_內(nèi)容可以方便的計(jì)算任何ー對(duì)蛋白質(zhì)相對(duì)于彼此的比例。考慮這樣的摻合物/組合物,所述摻合物/組合物包含的酶的重量比例是可以從本文公開的重量百分比衍生的任何重量比例。L-a -阿拉伯呋喃糖苷酶含量可以在這樣的范圍內(nèi),其中下限是酶摻合物/組合物中的酶總重量的 0. 05wt %、Iwt % >2wt % >3wt % >4wt % >5wt % >6wt % >7wt % >8wt % >9wt %、IOwt %、12wt %、15wt % >20wt % >25wt % >30wt % >40wt % >45wt % 或 50wt %,上限是酶慘合物 / 組合物中的酶總重量的 IOwt %、15wt %、20wt % >25wt % >30wt % >35wt % >40wt %、50wt % >55wt % >60wt % >65wt % >70wt %或75wt %。例如,酶摻合物或組合物中的一種或多種L-a -阿拉伯呋喃糖苷酶可以適宜地代表?yè)胶衔?組合物中的例如2wt%至25wt%、5wt%至20wt%或5wt%至IOwt%的總酶。包括在本公開內(nèi)容的酶摻合物/組合物中的示例性的合適的L-a -阿拉伯呋喃糖苷酶描述在下文的6. 3. 8節(jié)中。木糖苷酶木糖苷酶適宜地構(gòu)成酶摻合物/組合物中酶總重量的約0. 05wt%至約75wt%?;诒竟_內(nèi)容可以方便計(jì)算任何ー對(duì)蛋白質(zhì)相對(duì)于彼此的比例。考慮這樣的摻合物/組合物,所述摻合物/組合物包含的酶的重量比例是可以從本文公開的重量百分比衍生的任何重量比例?!?木糖苷酶含量可以在這樣的范圍內(nèi),其中下限是摻合物/組合物中的酶總重量的約0. 05wt % > Iwt % > 2wt % >3wt % >4wt % >5wt % >6wt % >7wt % >8wt % >9wt % > IOwt % > 12wt % > 15wt % >20wt % >25wt % >30wt % >40wt % >45wt %或50wt 上限是摻合物/組合物中的酶總重量的約IOwt %、15wt %、20wt %、25wt %、30wt*%、35wt*%、40wt*%、50wt*%、55wt*%、60wt*%、65wt*%、70wt*%或 75wt*%。例如,^ -木糖苷酶可以代表?yè)胶衔?組合物中的酶總重量的約0. 05wt %至約75wt %。此外,^ -木糖苷酶可以代表?yè)胶衔?組合物中的酶總重量的約0. 05wt%至約70wt%、約lwt%至約65wt%、約 Iwt % 至約 60wt *%、約 2wt % 至約 55wt *%、約 3wt % 至約 50wt *%、約 4wt % 至約 45wt %,或約5wt%至約40wt%。在仍然進(jìn)一步的實(shí)例中,P -木糖苷酶適宜地代表?yè)胶衔?組合物中的酶總重量的2wt*%至30wt*% ;10wt*%至20wt*% ;或5wt*%至10wt*%。示例性的合適的^ -木糖苷酶描述在下文的6. 3. 7節(jié)中。纖維素酶纖維素酶適宜地構(gòu)成酶摻合物/組合物中酶總重量的約0. 05wt%至約90wt%。基于本公開內(nèi)容可以方便地計(jì)算任何ー對(duì)蛋白質(zhì)相對(duì)于彼此的比例??紤]這樣的摻合物/組合物,所述摻合物/組合物包含的酶的重量比例是可以從本文公開的重量
百分比衍生的任何重量比例。纖維素酶含量可以在這樣的范圍內(nèi),其中下限是摻合物/組合物中的酶總重量的約 0. 05wt% >5wt% > 10wt% >20wt% >30wt% >40wt% >50wt% >60wt% >70wt %,上限是摻合物/組合物中的酶總重量的約20wt % >30wt % >40wt % >50wt %、60wt%,70wt%,80wt%或90wt%。例如,纖維素酶適宜地代表?yè)胶衔?組合物中的酶總重量的30wt*%至80wt*% ;50wt*%至70wt*% ;或40wt*%至60wt*%。示例性的合適的纖維素酶描述在下文的6. 3. 5節(jié)中。根據(jù)calcofluor測(cè)定所確定的,本公開內(nèi)容的酶摻合物/組合物中的纖維素酶組分適宜地能夠達(dá)到至少約0. 005級(jí)分產(chǎn)物/mg蛋白質(zhì)/克磷酸溶脹的纖維素(PASC)。例如,本公開內(nèi)容的摻合物/組合物中的纖維素酶組分能夠達(dá)到這樣的每毫克蛋白質(zhì)每克PASC的級(jí)分產(chǎn)物范圍,其中范圍的下限是約0. 005,0. 01,0. 015,0. 02、0. 03,0. 04,0. 05,0. 06,0. 075 或 0. 1,而其中范圍的上限是 0. 03,0. 04,0. 05,0. 06,0. 075、0. U0. 2,0. 3,0. 4,0. 5,0. 6或0. 7。根據(jù)calcofluor測(cè)定所確定的,本公開內(nèi)容的摻合物/組合物中的纖維素酶組分可以達(dá)到例如0. 00005-0. 0001,0. 0005-0. 001,0. 001-0. 005、0. 005-0. 03,0. 01-0. 06,0. 02-0. 04,0. 01-0. 03,0. 02-0. 05,0. 02-0. 04,0. 01-0. 05、0. 015-0. 035或0. 015-0. 075產(chǎn)物級(jí)分每毫克蛋白質(zhì)每克PASC。纖維素酶可以是例如全纖維素酶。纖維素酶還可以例如適宜地富含¢-葡糖苷酶。輔助蛋白酶摻合物/組合物可以進(jìn)ー步適宜地包括一種或多種輔助蛋白。酶摻合物/組合物的輔助蛋白含量的范圍可以從酶摻合物/組合物中的蛋白質(zhì)總重量的約Owt%至約60wt%?;诒竟_內(nèi)容可以方便地計(jì)算任何ー對(duì)蛋白質(zhì)相對(duì)于彼此的比例。考慮這樣的摻合物/組合物,所述摻合物/組合物包含的酶的重量比例是可以從本文公開的重量百分比衍生的任何重量比例。輔助蛋白的含量可以在這樣的范圍內(nèi),其中下限是酶摻合物/組合物中的蛋白質(zhì)總重量的Owt%、Iwt%、%、7wt% >8wt% > IOwt % > 12wt% > 15wt*%、20wt*%、25wt*%或 35wt*%,上限是酶慘合物 / 組合物中的蛋白質(zhì)總重量的約 2wt % >3wt % >4wt % >5wt % >6wt % >7wt % >8wt % >9wt %、IOwt %、llwt% > 12wt% > 13wt% > 14wt% > 15wt*%、20wt*%、30wt*%、40wt*%、50wt*%或 60wt*%。例如,輔助蛋白可以適宜地代表酶摻合物/組合物中的Owt%至2wt%、5wt%至IOwt%,20wt%至50wt%或2wt%至5wt%。包括在本公開內(nèi)容的酶摻合物/組合物中的示例性的合適的輔助蛋白描述在下文的6. 3. 9節(jié)中。本公開內(nèi)容提供了用于木質(zhì)纖維素糖化的第一種酶摻合物/組合物,包括(I)約 30wt 至約 80wt % (例如,30wt % 至 80wt % >35wt % 至 75wt % >40wt %至70wt %、40wt %至60wt %、50wt %至70wt*%等)的纖維素酶,例如,全纖維素酶或富含^-葡糖苷酶的全纖維素酶;(2)約 3wt 至約 50wt % (例如,5wt % 至 40wt %、IOwt % 至 30wt % >5wt % 至20wt% > IOwt%至15wt*%、15wt*%至25wt*%等)的木聚糖酶,例如,里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2、AfuXyn5,或者兩種或多種上述酶的混合物;(3)約 2wt 至約 40wt % (例如,2wt % 至 35wt % >5wt % 至 30wt %、IOwt % 至25wt 、2wt 至 30wt *%、IOwt 至 20wt 、5wt 至 IOwt 等)的 P -木糖苷酶,例如,
Fv3A、Pf43A、Fv43D、Fv39A、Fv43E、Fv43A、Fv43B、Pa51A、Fo43A、Gz43A、里氏木霉 Bxll,或者兩種或多種上述酶的混合物;(4)約 2wt 至約 40wt % (例如,2wt % 至 35wt % >5wt % 至 30wt %、IOwt % 至25wt*%、2wt*% 至 25wt*%、5wt*% 至 20wt *%、5wt 至 IOwt 等)的 L- a -阿拉伯呋喃糖苷酶,例如,Af43A、Fv43B、Pa51A、Pf51A、Fv51A,或者兩種或多種上述酶的混合物;和(5)約 Owt 至約 50wt % (2wt % 至 40wt %、5wt % 至 30wt %、IOwt % 至 25wt %、Owt至 2wt*%、5wt*%至 10wt*%、20wt*%至 50wt*%、2wt至 5wt*%等)的輔助蛋白。本公開內(nèi)容提供了用于木質(zhì)纖維素糖化的第二種酶摻合物/組合物,包括(I)約 30wt 至約 80wt (例如,30wt 至 80wt 、35wt 至 75wt 、40wt至70wt %、40wt %至60wt %、50wt %至70wt*%等)的纖維素酶,例如,全纖維素酶或富含
3-葡糖苷酶的全纖維素酶,或約2wt %至約IOwt % (例如,2wt %至8wt %、4wt %至6wt %、2wt*%至4wt*%、6wt*%至8wt*%、8wt*%至 10wt*%、2wt*%至 10wt*%等)的 P -葡糖苷酶,例如,里氏木霉Bgll ;(2)約 3wt % 至約 50wt % (例如,5wt % 至 40wt %、IOwt % 至 30wt %、5wt % 至20wt% > IOwt%至15wt*%、15wt*%至25wt*%等)的木聚糖酶,例如,里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2、AfuXyn5,或者兩種或多種上述酶的混合物;(3)約 2wt 至約 40wt % (例如,2wt % 至 35wt % >5wt % 至 30wt %、IOwt % 至25wt*%、2wt*% 至 30wt*%、10wt*% 至 20wt*%、5wt*% 至 10wt*% 等)的至少兩種 P -木糖苷酶,其中至少ー種¢-木糖苷酶選自組I和至少ー種¢-木糖苷酶選自組2;其中組I :Fv3A、Fv43A,或其混合物;組2 :Fv43D、Pa51A、Gz43A、里氏木霉 Bxl I、Pf 43A、Fv43E、Fv39A、Fo43A、Fv43B,或者兩種或多種上述酶的混合物;(4)約 2wt%至約 25wt% (例如,2wt%至 25wt%、5wt%至 20wt%、5wt%至 IOwt%等)的L- a -阿拉伯呋喃糖苷酶,例如,Af43A、Fv43B、Pa51A、Pf51A、Fv51A,或者兩種或多種上述酶的混合物;和(5)約 Owt 至約 50wt % (2wt % 至 40wt %、5wt % 至 30wt %、IOwt % 至 25wt %、Owt至 2wt、5wt至 IOwt、20wt至 50wt 、2wt至 5wt等)的輔助蛋白。本公開內(nèi)容提供了用于木質(zhì)纖維素糖化的第三種酶摻合物/組合物,包括
(I)約 3wt 至約 50wt % (例如,5wt % 至 40wt %、IOwt % 至 30wt % >5wt % 至20wt% > IOwt%至15wt*%、15wt*%至25wt*%等)的木聚糖酶,例如,里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2、AfuXyn5,或者兩種或多種上述酶的混合物;和(2)約 2wt至 40wt(例如,2wt至 35wt、5wt至 30wt*%、IOwt至 25wt*%、2wt*%至30wt*%、10wt*%至20wt*%、5wt*%至10wt*%等)的至少兩種P -木糖苷酶,其中至少ー種P-木糖苷酶選自組I和至少ー種P-木糖苷酶選自組2 ;其中組I :Fv3A、Fv43A,或其混合物;組2 :Fv43D、Pa51A、Gz43A、里氏木霉 Bxl I、Pf 43A、Fv43E、Fv39A、Fo43A、Fv43B,或者兩種或多種上述酶的混合物。本公開內(nèi)容提供了用于木質(zhì)纖維素糖化的第四種酶摻合物/組合物,包括(I)約 5wt*%至約 25wt*% (例如,2wt至 25wt、5wt至 20wt、5wt至 IOwt等)的木聚糖酶,例如,里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2、AfuXyn5,或者兩種或多種上述酶的混合物;(2)約 2wt 至約 30wt % (例如,2wt % 至 30wt %、IOwt % 至 20wt % >5wt % 至IOwt %等)的木糖苷酶,例如,F(xiàn)v3A、a Pf43A、Fv43D、Fv39A、Fv43E、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、里氏木霉Bxl I,或者兩種或多種上述酶的混合物;和(3)約 2wt 至約 50wt % (例如,2wt % 至 5wt % >5wt % 至 45wt %、IOwt % 至40wt*%、15wt*%至 30wt*%、10wt*%至25wt*%、5wt*%至20wt*%、15wt*%至40wt*%等)的 ¢-葡糖苷酶,例如,里氏木霉BglI。本公開內(nèi)容提供了用于木質(zhì)纖維素糖化的第五種酶摻合物/組合物,包括(I)約 5wt 至約 25wt (例如,2wt 至 25wt 、5wt 至 20wt 、5wt 至 IOwt等)的木聚糖酶,例如,里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2、AfuXyn5,或者兩種或多種上述酶的混合物;和 (2)約 2wt 至約 30wt % (例如,2wt % 至 30wt %、IOwt % 至 20wt %、5wt % 至10wt%—)的 P -木糖苷酶,例如,F(xiàn)v3A、Pf43A、Fv43D、Fv39A、Fv43E、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、里氏木霉Bxl I,或者兩種或多種上述酶的混合物。本公開內(nèi)容提供了用于木質(zhì)纖維素糖化的第六種酶摻合物/組合物,包括(I)約 2wt 至約 50wt % (例如,2wt % 至 5wt % >5wt % 至 45wt %、IOwt % 至40wt*%、15wt*%至 30wt*%、10wt*%至25wt*%、5wt*%至20wt*%、15wt*%至40wt*%等)的 ¢-葡糖苷酶,例如Bgll ;(2)約 3wt 至約 50wt % (例如,5wt % 至 40wt %、IOwt % 至 30wt % >5wt % 至20wt% > IOwt%至15wt*%、15wt*%至25wt*%等)的木聚糖酶,例如,里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2、AfuXyn5,或者兩種或多種上述酶的混合物;(3)約 2wt至 40wt(例如,2wt至 35wt、5wt至 30wt*%、IOwt至 25wt*%、2wt*%至 30wt*%、10wt*%至 20wt*%、5wt*%至 10wt*%等)的 P -木糖苷酶,例如,F(xiàn)v3A、Pf43A、Fv43D、Fv39A、Fv43E、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、里氏木霉 Bxl I,或者兩種或多種上述酶的混合物;和(4)約 2wt*%至約 25wt*% (例如,2wt至 25wt、5wt至 20wt、5wt至 IOwt等)的L- a -阿拉伯呋喃糖苷酶,例如,Af43A、Fv43B、Pa51A、Pf51A、Fv51A,或者兩種或多種上述酶的混合物。上述用于木質(zhì)纖維素糖化的第六種酶摻合物/組合物可以包括例如約2wt%至約40wt%的至少兩種P -木糖苷酶,其中至少ー種P -木糖苷酶選自組I和至少ー種¢-木糖苷酶選自組2 ;其中組I :Fv3A、Fv43A,或其混合物;組2 :Fv43D、Pa51A、Gz43A、里氏木霉 Bxl I、Pf 43A、Fv43E、Fv39A、Fo43A、Fv43B,或者兩種或多種上述酶的混合物。當(dāng)本公開內(nèi)容的酶摻合物/組合物同時(shí)含有組I和組2的P -木糖苷酶時(shí),組I與組2的¢-木糖苷酶的比例優(yōu)先是I : 10至10 I。例如,比例適宜地是I : 2至2 : I、2 5 至 5 2、3 8 至 8 3、1 4 至 4 1、1 5 至 5 1、1 7 至 7 1,或任何在任何ー對(duì)上述終點(diǎn)之間的范圍(例如,I : 10至2 : 1、4 : I至2 : 5、3 : 8至5 : 1,
等)。合適比例的特定實(shí)例是約I : I。當(dāng)本公開內(nèi)容的酶摻合物/組合物含有Fv43A作為P -木糖苷酶吋,摻合物/組合物可以進(jìn)ー步含有Fv43B作為L(zhǎng)-a -阿拉伯呋喃糖苷酶。本公開內(nèi)容的酶摻合物/組合物適宜地是例如含有除酶摻合物/組合物的組分以外還含有生物量的糖化反應(yīng)混合物的一部分。例如,糖化反應(yīng)混合物的特征是可具有1、2、3或所有4個(gè)下列特征(i)在所述糖化反應(yīng)混合物中的每千克半纖維素酶的木聚糖酶總重量是在這樣的范圍內(nèi),所述范圍的下限是約0. 5g、lg、2g、3g、4g、5g、7g或IOg,上限獨(dú)立的是約5g、7g、10g、15g、20g、30g_40g ;例如,反應(yīng)混合物中的每千克半纖維素酶的木聚糖酶總重量可以是 0. 5g 至 40g、0. 5g 至 30g、0. 5g 至 20g、0. 5 至 10g、0. 5 至 5g、lg 至 40g、2g 至 40g、3g 至40g、5g 至 40g、7g 至 30g、IOg 至 30g、5g 至 20g 或 5g 至 30g。(ii)在所述糖化反應(yīng)混合物中的每千克半纖維素酶的¢-木糖苷酶總重量是在這樣的范圍內(nèi),所述范圍的下限是約0. 5g、lg、2g、3g、4g、5g、7g或IOg,上限獨(dú)立的是約5g、7g、10g、15g、20g、30g、40g或50g ;例如,反應(yīng)混合物中的每千克半纖維素酶的P _木糖苷酶總重量可以是 0. 5g 至 40g、0. 5 至 50g、0. 5g 至 30g、0. 5g 至 20g、0. 5g 至 10g、0. 5g 至 5g、Ig至 40g、2g 至 40g、3g 至 40g、5g 至 40g、7g 至 30g、IOg 至 30g、5g 至 30g、5g 至 20g。(iii)在所述糖化反應(yīng)混合物中的每千克半纖維素酶的L-a -阿拉伯呋喃糖苷酶總重量是在這樣的范圍內(nèi),所述范圍的下限是約0. 2g、0. 5g、lg、l. 5g、2g、2. 5g、3g、4g或5g,上限獨(dú)立的是約2g、3g、4g、5g、7g、10g、15g或20g ;例如,反應(yīng)混合物中的每千克半纖維素酶的L-a -阿拉伯呋喃糖苷酶總重量可以是0. 2g至20g、0. 5g至20g、lg至20g、2g至20g、2. 5g 至 20g、3g 至 15g、4g 至 20g、5g 至 15g、5g 至 10g、5g 至 20g 或 2. 5g 至 15g。(iv)在所述糖化反應(yīng)混合物中的每千克纖維素酶的纖維素酶總重量是在這樣的范圍內(nèi),所述范圍的下限是約lg、3g、5g、7g、10g、12g、15g、18g或20g,上限獨(dú)立的是約10g、15g、18g、20g、25g、30g、50g、75g或IOOg ;例如,反應(yīng)混合物中的每千克纖維素酶的纖維素酶總重量可以是 Ig 至 100g、3g 至 100g、5g 至 100g、7g 至 100g、12g 至 100g、15g 至 100g、18g 至 100g、3g 至 75g、5g 至 50g、7g 至 75g、IOg 至 75g、IOg 至 50g、12g 至 75g、12g 至 50g、15g 至 75g、15g 至 50g、18g 至 30g、18g 至 75g。
6. 3. 5纖維素酶本公開內(nèi)容的酶摻合物/組合物可以包括一種或多種纖維素酶。纖維素酶是水解纖維素(0-1,4-葡聚糖或PD-糖苷連接)導(dǎo)致形成葡萄糖、纖維ニ糖、纖維寡糖等的酶。纖維素酶?jìng)鹘y(tǒng)上被分為三大類內(nèi)切葡聚糖酶(EC 3.2. 1.4) ( “EG”)、外切葡聚糖酶或纖維ニ糖水解酶(EC 3. 2. I. 91) ( “CBH”),和P -葡糖苷酶W -D-葡糖苷葡糖水解酶;EC 3. 2. I. 21) ( “BG”)(Knowles 等人,1987,Trends in Biotechnology 5(9) :255-261 ;Shulein,1988,Methods in Enzymology, 160 :234-242) □內(nèi)切葡聚糖酶主要作用于纖維素纖維的無(wú)定型部分,而纖維ニ糖水解酶還能夠降解結(jié)晶纖維素。根據(jù)本公開內(nèi)容的方法和組合物使用的纖維素酶尤其可獲得自,或重組的生產(chǎn)自ー種或多種下列生物Crinipellis scapella,菜豆殼球抱菌(Macrophominaphaseolina),嗜熱毀絲菌(Myceliophthorathermophila),類生類殼菌(Sordariafimicola),Volutella colletotrichoides,太瑞斯梭抱殼霉(Thielavia terrestris),支頂孢屬物種,黑耳(Exidiaglandulosa),木蹄層孔菌(Fomes fomentarius),綿皮
孔菌屬物種(Spongipellis sp.),紅根囊壺菌(Rhizophlyctis rosea)、微小根毛霉(Rhizomucor pusillus)、閃光須霉(Phycomyces niteus),弗雷生剌枝霉(Chaetostylumiresenn) , Diplodia gossypm a, Uiospora biigramii, Saccobolus dilutellus,優(yōu)抱青 ft (Penicillium verruculosum)、廣黃青霉(Penicillium chrysogenum)、優(yōu)狀頂抱霉(Thermomyces verrucosus), Diaporthe syngenesia,黃瓜炭徂抦(Colletotrichum Iagenarium),黑抱屬物種(Nigrospora sp.),鹿角炭角菌(Xylariahypoxylon), Nectria pinea,^ordaria macrospora,Th lelavia thermoph I la,卷頂毛殼菌(Chaetomiummororum),變綠毛殼(Chaetomium virscens),巴西毛殼(しhaetomiumbrasiliensisノ, Cnaetomium cunicolorum, ^yspastospora boninensis,Cladorrhinum foecundissimum,Scytalidium thermophila,海洋真菌鏈T包粘借M (Gliociadium catenulatum), Fusarium oxysporum ssp.lycopersici, Fusariumoxysporum ssp. passiflora,腐皮,廉刀菌(Fusarium solani),fe 形 廉抱(Fusariumanguioides),早熟禾f廉刀菌(Fusarium poae),黑腐質(zhì)霉(Humicola nigrescens)、灰腐質(zhì)霉(Humicola grisea)、花糟傘(Panaeolusretirugis),血紅色陀螺孔菌(Trametessanguine),裂糟菌(Schizophyllumcommune),粉紅單端抱霉(Trichothecium roseum),Microsphaeropsis sp.,Acsobolus stictoideus spej.,點(diǎn)ずし座冗(Poronia punctata),Nodulisporumsp.,木霉屬物種(例如,里氏木霉)和柱孢屬(Cylindrocarpon)物種。例如,用于本公開內(nèi)容的方法和/或組合物的纖維素酶是全纖維素酶和/或通過(guò)下文7. I. 10節(jié)所述的calcofluor測(cè)定所確定的,能夠?qū)崿F(xiàn)至少0. I (例如,0. I至0. 4)級(jí)分產(chǎn)物的。 6.3.5. I 葡糖苷酶本公開內(nèi)容的酶摻合物/組合物可任選的包括ー種或多種¢-葡糖苷酶。術(shù)語(yǔ)“3-葡糖苷酶”在本文中指分類為EC 3.2. I. 21的P-D-葡糖苷葡糖水解酶,和/或某些GH家族的成員,包括但不限于GH家族1、3、9或48的成員,其催化纖維ニ糖水解釋放P-D-葡萄糖。適宜地3 -葡糖苷酶可通過(guò)重組手段獲得自多種微生物,或從商業(yè)來(lái)源購(gòu)買。來(lái)自微生物的¢-葡糖苷酶的實(shí)例包括但不限于來(lái)自細(xì)菌和真菌的。例如,本公開內(nèi)容的^-葡糖苷酶適宜地獲得自絲狀真菌。P -葡糖苷酶尤其可獲得自,或重組的生產(chǎn)自棘孢曲霉(Aspergillusaculeatus)(Kawaguchi 等人,Gene 1996,173 :287_288)、泡盛曲霉(Aspergillus kawachi) (Iwashita等人,Appl. Environ. Microbiol. 1999,65 :5546-5553)、米曲霉(TO 2002/095014)、雙氮纖維單胞菌(Cellulomonas biazotea) (Wong 等人,Gene, 1998, 207 :79_86)、繩狀青霉(W02004/078919)、扣囊復(fù)膜抱酵母(Saccharomycopsisfibuligera) (Machida 等人,Appl.Environ. Microbiol. 1988,54 :3147-3155)、粟酒裂殖酵母(Wood 等人,Nature 2002,415 871-880),或里氏木霉(例如,^ -葡糖苷酶I (美國(guó)專利號(hào)6,022,725)、^ -葡糖苷酶3 (美國(guó)專利號(hào)6,982,159)、^ -葡糖苷酶4 (美國(guó)專利號(hào)7,045,332)、^ -葡糖苷酶5 (美國(guó)專利號(hào)7,005,289)、¢-葡糖苷酶6 (美國(guó)
發(fā)明者B·R·凱萊門, B·鮑爾, C·米奇森, E·A·拉雷納斯, K·D·溫, M·Y·席, M·恩普蒂奇, S·E·蘭茨, S·基姆, T·卡佩爾, W·D·希茨 申請(qǐng)人:丹尼斯科美國(guó)公司