具有內(nèi)切葡聚糖酶活性的多肽和編碼該多肽的多核苷酸的制作方法【專利摘要】本發(fā)明涉及具有內(nèi)切葡聚糖酶活性的分離的多肽,以及編碼所述多肽的分離的多核苷酸。本發(fā)明還涉及包含所述多核苷酸的核酸構建體、載體和宿主細胞,以及用于產(chǎn)生和使用所述多肽的方法?!緦@f明】具有內(nèi)切葡聚糖酶活性的多肽和編碼該多肽的多核苷酸[0001]對于在聯(lián)邦資助的研究和開發(fā)下完成的發(fā)明的權利的聲明[0002]本發(fā)明是在由美國能源部授予的合作協(xié)議(CooperativeAgreement)DE-FC36-08G018080下以政府支持完成的。政府在本發(fā)明中具有一定權利。[0003]涉及序列表[0004]本申請包含計算機可讀形式的序列表,其通過提述并入本文。[0005]發(fā)明背景【
技術領域:
】[0006]本發(fā)明涉及具有內(nèi)切葡聚糖酶活性的多肽,催化域,和碳水化合物結合域,和編碼所述多肽,催化域,和碳水化合物結合域的多核苷酸。本發(fā)明亦涉及包含所述多核苷酸的核酸構建體、載體和宿主細胞,以及產(chǎn)生和使用所述多肽,催化域,和碳水化合物結合域的方法。【
背景技術:
】[0007]纖維素是簡單糖葡萄糖通過β-1,4-鍵共價連接的聚合物。許多微生物產(chǎn)生水解連接的葡聚糖的酶。這些酶包括內(nèi)切葡聚糖酶、纖維二糖水解酶和葡糖苷酶。內(nèi)切葡聚糖酶在隨機位置消化纖維素聚合物,使其暴露于纖維二糖水解酶攻擊(attack)。纖維二糖水解酶從纖維素聚合物的末端順序地釋放纖維二糖的分子。纖維二糖是水溶性的β-1,4-連接的葡萄糖二聚體。β-葡糖苷酶將纖維二糖水解成葡萄糖。[0008]將含木素纖維素原料(lignocellulosicfeedstock)轉化為乙醇具有以下優(yōu)勢:大量原料現(xiàn)成可用,避免燃燒或填埋材料的合意性和乙醇燃料的清潔性。木材、農(nóng)業(yè)殘余物、草本作物和城市固體廢物被認為是用于乙醇生產(chǎn)的原料。這些材料主要由纖維素、半纖維素和木質素組成。一旦木素纖維素轉化為可發(fā)酵的糖如葡萄糖,所述可發(fā)酵的糖可容易地由酵母發(fā)酵為乙醇。[0009]UNIPR0T_G2Y5P1公開了來自Botryotiniafuckeliana的糖基水解酶家族5蛋白。W02008151079公開了嗜熱毀絲霉(Mycel1phthorathermophila)內(nèi)切葡聚糖酶,SEQIDN0:32(GENESEQP:AUM17218)。UNIPR0T:B0Y8K1公開了來自Neosartoryafumigata的推定的內(nèi)切葡聚糖酶。UNIPR0T:B0XRX9公開了來自Neosartoryafumigate的可能的葡聚糖內(nèi)切_1,6-β-葡糖苷酶B。UNIPROT:Β6Η2Ρ2公開了來自Penicilliumchrysogenum的蛋白。W02011057140公開了煙曲霉(Aspergillusfumigatus)GH5內(nèi)切葡聚糖酶II(GENESEQP:AZ105010)。UNIPROT:AlDGPl公開了來自Neosartoryafischeri的推定的內(nèi)切葡聚糖酶/纖維素酶。UNIPROT:B6QR50B6QR50_PENMQ公開了來自Penicilliummarneffei的推定的內(nèi)切_1,6-β-葡糖苷酶。W02009033071公開了來自真菌/后生動物(Metazoa)組的真菌酶序列SEQIDNO:170(GENESEQP:Aff136308)。ΤΡ2003164284-Α公開了來自米曲霉的內(nèi)切葡聚糖酶(GENESEQP:ADZ51810)。US2008229451公開了來自粗糙脈孢霉的蛋白SEQ:3080(GENESEQP:AVA14940)。[0010]在本領域存在對供用于纖維素材料的水解的新的具有內(nèi)切葡聚糖酶活性的多肽的需求。[0011]本發(fā)明提供了具有內(nèi)切葡聚糖酶活性的多肽和編碼所述多肽的多核苷酸?!?br/>發(fā)明內(nèi)容】[0012]本發(fā)明涉及具有內(nèi)切葡聚糖酶活性的分離的多肽,其選自下組:[0013](a)多肽,其與SEQIDNO:4的成熟多肽具有至少90%序列同一性,多肽,其與SEQIDNO:14的成熟多肽具有至少71%序列同一性,多肽,其與SEQIDN0:18的成熟多肽或SEQIDN0:24的成熟多肽具有至少65%序列同一性,多肽,其與SEQIDNO:10的成熟多肽或SEQIDNO:22的成熟多肽,SEQIDNO:2的成熟多肽具有至少70%序列同一性,多肽,其與SEQIDN0:6,SEQIDN0:8或SEQIDNO:16的成熟多肽具有至少75%序列同一性,多肽,其與SEQIDNO:12的成熟多肽具有至少76%序列同一性,或多肽,其與SEQIDNO:20的成熟多肽具有至少80%序列同一性;[0014](b)多肽,其由多核苷酸編碼,所述多核苷酸在低、中等、中等-高、高、或非常高嚴格條件下與以下雜交:(i)SEQIDNO:3的成熟多肽編碼序列,SEQIDNO:13的成熟多肽編碼序列,SEQIDNO:1的成熟多肽編碼序列,SEQIDNO:5的成熟多肽編碼序列,SEQIDNO:7的成熟多肽編碼序列,SEQIDNO:11的成熟多肽編碼序列,SEQIDNO:15的成熟多肽編碼序列,SEQIDNO:21的成熟多肽編碼序列,SEQIDNO:23的成熟多肽編碼序列,或其cDNA序列,(ii)SEQIDN0:9,SEQIDNO:17,SEQIDNO:19的成熟多肽編碼序列,或(iii)⑴或(ii)的全長互補物;[0015](c)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:3的成熟多肽編碼序列具有至少90%序列同一性,多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:13的成熟多肽編碼序列具有至少71%序列同一性,多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:17的成熟多肽編碼序列或SEQIDN0:23的成熟多肽編碼序列具有至少65%序列同一性,多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:9的成熟多肽編碼序列,SEQIDNO:21的成熟多肽編碼序列,或SEQIDNO:1的成熟多肽編碼序列具有至少70%序列同一性,多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:5的成熟多肽編碼序列,SEQIDNO:7的成熟多肽編碼序列或SEQIDNO:15的成熟多肽編碼序列具有至少75%序列同一性,多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:11的成熟多肽編碼序列具有至少76%序列同一性,多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:19的成熟多肽編碼序列具有至少80%序列同一性;[0016](d)SEQIDNO:4的成熟多肽的變體,SEQIDNO:14的成熟多肽的變體,SEQIDN0:2的成熟多肽的變體,SEQIDN0:6的成熟多肽的變體,SEQIDN0:8的成熟多肽的變體,SEQIDNO:10的成熟多肽的變體,SEQIDNO:12的成熟多肽的變體,SEQIDNO:16的成熟多肽的變體,SEQIDNO:18的成熟多肽的變體,SEQIDNO:20的成熟多肽的變體,SEQIDNO:22的成熟多肽的變體,或SEQIDNO:24的成熟多肽的變體,其在一個或多個(例如幾個)位置包含取代、缺失和/或插入;和[0017](e)(a),(b),(C),或(d)的多肽的片段,其具有內(nèi)切葡聚糖酶活性。[0018]本發(fā)明亦涉及分離的多肽,其包含選自下組的催化域:[0019](a)催化域,其與SEQIDNO:4的氨基酸80-383具有至少90%序列同一性,催化域,其與SEQIDNO:14的氨基酸45-346具有至少71%序列同一性,催化域,其與SEQIDNO:18的氨基酸61-448或SEQIDNO:24的氨基酸60-444具有至少65%序列同一性,催化域,其與SEQIDNO:10的氨基酸49-416,SEQIDNO:22的氨基酸80-404,或SEQIDNO:2的氨基酸22-390具有至少70%序列同一性,催化域,其與SEQIDNO:6的氨基酸20-342,SEQIDNO:8的氨基酸26-382或SEQIDNO:16的氨基酸26-418具有至少75%序列同一性,催化域,其與SEQIDN0:12的氨基酸19-324具有至少76%序列同一性,或催化域,其與SEQIDNO:20的氨基酸28-414具有至少80%序列同一性;[0020](b)催化域,其由多核苷酸編碼,所述多核苷酸在低、中等、中等-高、高、或非常高嚴格條件下與以下雜交:(i)SEQIDNO:3的核苷酸238至1441,SEQIDN0:13的核苷酸133至1316,SEQIDNO:1的核苷酸64至1254,SEQIDNO:5的核苷酸58至1300,SEQIDNO:7的核苷酸76至1230,SEQIDNO:11的核苷酸55至1333,SEQIDNO:15的核苷酸76至1452,SEQIDNO:21的核苷酸349至1535,或SEQIDNO:23的核苷酸178至1332,或其cDNA序列,(ii),SEQIDNO:9的核苷酸145至1248,SEQIDNO:17的核苷酸181至1344,或SEQIDNO:19的核苷酸82至1242,或(iii)⑴或(ii)的全長互補物;[0021](C)催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:3的核苷酸238至1441具有至少90%序列同一性,所述多核苷酸與SEQIDNO:13的核苷酸133至1316具有至少71%序列同一性,所述多核苷酸與SEQIDNO:17的核苷酸181至1344或SEQIDNO:23的核苷酸178至1332具有至少65%序列同一性,所述多核苷酸與SEQIDN0:9的核苷酸145至1248,SEQIDNO:21的核苷酸349至1535,或SEQIDNO:1的核苷酸64至1254具有至少70%序列同一性,所述多核苷酸與SEQIDNO:5的核苷酸58至1300,SEQIDNO:7的核苷酸76至1230,或SEQIDNO:15的核苷酸76至1452具有至少75%序列同一性,所述多核苷酸與SEQIDNO:11的核苷酸55至1333具有至少76%序列同一性,或所述多核苷酸與SEQIDNO:19的核苷酸82至1242具有至少80%序列同一性;[0022](d)SEQIDNO:4的氨基酸80至383的,SEQIDNO:14的氨基酸45至346的,SEQIDNO:2的氨基酸22至390的,SEQIDNO:6的氨基酸20至342的,SEQIDNO:8的氨基酸26至382的,SEQIDNO:10的氨基酸49至416的,SEQIDNO:12的氨基酸19至324的,SEQIDNO:16的氨基酸26至418的,SEQIDNO:18的氨基酸61至448的,SEQIDNO:20的氨基酸28至414的,SEQIDNO:22的氨基酸80至404的,或SEQIDNO:24的氨基酸60至444的變體,其在一個或多個(例如幾個)位置包含取代、缺失和/或插入;和[0023](e)(a),(b),(C),或⑷的催化域的片段,其具有內(nèi)切葡聚糖酶活性。[0024]本發(fā)明亦涉及分離的多肽,其包含選自下組的碳水化合物結合域:[0025](a)碳水化合物結合域,其與SEQIDNO:4的氨基酸17至52具有至少90%序列同一性,與SEQIDNO:14的氨基酸442至474具有至少71%序列同一性,或與SEQIDNO:22的氨基酸22至50具有至少70%序列同一性;[0026](b)碳水化合物結合域,其由多核苷酸編碼,所述多核苷酸在低、中等、中等-高、高、或非常高嚴格條件下與以下雜交:(i)SEQIDNO:3的核苷酸49至159,SEQIDNO:13的核苷酸1602至1700,或SEQIDNO:21的核苷酸64至261,(ii)其cDNA序列,或(iii)(i)或(ii)的全長互補物;[0027](c)碳水化合物結合域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:3的核苷酸49至159具有至少90%序列同一性,與SEQIDNO:13的核苷酸1602至1700具有至少71%序列同一性,或與SEQIDN0:21的核苷酸64至261具有至少70%序列同一性;[0028](d)SEQIDNO:4的氨基酸17至52的,SEQIDNO:14的氨基酸442至474的或SEQIDNO:22的氨基酸22至50的變體,其在一個或多個(例如幾個)位置包含取代、缺失和/或插入;和[0029](e)(a),(b),(c)或(d)的碳水化合物結合域的片段,其具有碳水化合物結合活性。[0030]本發(fā)明亦涉及編碼本發(fā)明的多肽的分離的多核苷酸,包含所述多核苷酸的核酸構建體、重組表達載體、和重組宿主細胞;和產(chǎn)生所述多肽的方法。[0031]本發(fā)明亦涉及降解或轉化纖維素材料的方法,其包括:在本發(fā)明的具有內(nèi)切葡聚糖酶活性的多肽的存在下用酶組合物處理纖維素材料。在一個方面,所述方法還包括回收經(jīng)降解或轉化的纖維素材料。[0032]本發(fā)明亦涉及產(chǎn)生發(fā)酵產(chǎn)物的方法,其包括:(a)在本發(fā)明的具有內(nèi)切葡聚糖酶活性的多肽的存在下用酶組合物糖化纖維素材料;(b)用一種或多種(例如幾種)發(fā)酵微生物發(fā)酵經(jīng)糖化的纖維素材料以產(chǎn)生發(fā)酵產(chǎn)物;和(C)從發(fā)酵回收該發(fā)酵產(chǎn)物。[0033]本發(fā)明亦涉及發(fā)酵纖維素材料的方法,其包括用一種或多種(例如幾種)發(fā)酵微生物發(fā)酵所述纖維素材料,其中所述纖維素材料在本發(fā)明具有內(nèi)切葡聚糖酶活性的多肽的存在下用酶組合物糖化。在一個方面,所述纖維素材料的發(fā)酵產(chǎn)生發(fā)酵產(chǎn)物。在另一個方面,上述方法進一步包括從發(fā)酵回收發(fā)酵產(chǎn)物。[0034]本發(fā)明亦涉及編碼信號肽的多核苷酸,所述信號肽包含或組成為(consistof)SEQIDNO:4的氨基酸I至16,SEQIDNO:14的氨基酸I至18,SEQIDNO:2的氨基酸I至21,SEQIDNO:6的氨基酸I至18,SEQIDNO:8的氨基酸I至19,SEQIDNO:10的氨基酸I至24,SEQIDNO:12的氨基酸I至18,SEQIDNO:16的氨基酸I至19,SEQIDNO:18的氨基酸I至29,SEQIDNO:20的氨基酸I至15,SEQIDNO:22的氨基酸I至18,或SEQIDNO:24的氨基酸I至35,其可操作地連接于編碼蛋白的基因,其中所述基因對于編碼信號肽的多肽是外源的;包含所述多核苷酸的核酸構建體、表達載體和重組宿主細胞;和產(chǎn)生蛋白的方法。[0035]附圖簡述[0036]圖1顯不一種CorynascusthermophilusGH5內(nèi)切葡聚糖酶基因的基因組DNA序列(SEQIDNO:1)和推導的序列(SEQIDNO:2)?[0037]圖2顯不一種CorynascusthermophilusGH5內(nèi)切葡聚糖酶基因的基因組DNA序列(SEQIDNO:3)和推導的序列(SEQIDNO:4)。[0038]圖3顯不一種MalbrancheacinnamomeaGH5內(nèi)切葡聚糖酶基因的基因組DNA序列(SEQIDNO:5)和推導的序列(SEQIDNO:6)。[0039]圖4顯示一種草酸青霉(Penicilliumoxalicum)GH5內(nèi)切葡聚糖酶基因的基因組DNA序列(SEQIDNO:7)和推導的序列(SEQIDNO:8)?[0040]圖5顯示一種草酸青霉GH5內(nèi)切葡聚糖酶基因的基因組DNA序列(SEQIDNO:9)和推導的序列(SEQIDNO:10)。[0041]圖6顯示一種草酸青霉GH5內(nèi)切葡聚糖酶基因的基因組DNA序列(SEQIDNO:11)和推導的序列(SEQIDNO:12)。[0042]圖7顯示一種草酸青霉GH5內(nèi)切葡聚糖酶基因的基因組DNA序列(SEQIDNO:13)和推導的序列(SEQIDNO:14)。[0043]圖8顯示一種桔橙嗜熱子囊菌(Thermoascusaurantiacus)GH5內(nèi)切葡聚糖酶基因的基因組DNA序列(SEQIDNO:15)和推導的序列(SEQIDNO:16)。[0044]圖9顯示一種桔橙嗜熱子囊菌GH5內(nèi)切葡聚糖酶基因的基因組DNA序列(SEQIDNO:17)和推導的序列(SEQIDNO:18)。[0045]圖10顯不一種ScytalidiumthermophilumGH5內(nèi)切葡聚糖酶基因的基因組DNA序列(SEQIDNO:19)和推導的序列(SEQIDNO:20)。[0046]圖11顯不一種PenicilliumemersoniiGH5內(nèi)切葡聚糖酶基因的基因組DNA序列(SEQIDN0:21)和推導的序列(SEQIDNO:22)?[0047]圖12顯不一種PenicilliumemersoniiGH5內(nèi)切葡聚糖酶基因的基因組DNA序列(SEQIDNO:23)和推導的序列(SEQIDNO:24)?[0048]圖13顯示pGH5_Mf3026的限制性圖。[0049]圖14顯示pGH5_Mf0435的限制性圖。[0050]圖15顯示pGH5_ZY582305_7的限制性圖。[0051]圖16顯示pGH5_ZY569165_627的限制性圖。[0052]圖17顯示pGH5_ZY569181_38的限制性圖。[0053]圖18顯示pGH5_ZY569168_520的限制性圖。[0054]圖19顯示pGH5_ZY569165_195的限制性圖。[0055]圖20顯示pGH5EG_PE04100005799的限制性圖。[0056]圖21顯示pGH5EG_PE04100006270的限制性圖。[0057]圖22顯示pGH5_ZY577362_5的限制性圖。[0058]圖23顯示pGH5_PE04230003418的限制性圖。[0059]圖24顯示Corynascusthermophilus內(nèi)切葡聚糖酶(P24F2H)對纖維素分解酶組合物水解經(jīng)磨制、未經(jīng)洗滌的PCS的作用。[0060]圖25顯示Penicilliumoxalicum內(nèi)切葡聚糖酶(P241M4)對纖維素分解酶組合物水解經(jīng)磨制、未經(jīng)洗滌的PCS的作用。[0061]定義[0062]乙酰木聚糖酯酶:術語“乙酰木聚糖酯酶”意指羧基酯酶(EC3.1.1.72),其催化乙?;鶑木酆夏揪厶?、乙?;咎?、乙?;咸烟恰⒁宜幡?萘酯(alpha-napthylacetate)和乙酸對硝基苯酯(p-nitrophenylacetate)的水解。就本發(fā)明而言,乙酰木聚糖酯酶活性是使用含有0.01%TWEEN?20(聚氧乙烯山梨聚糖單月桂酸酯)的50mM乙酸鈉pH5.0中的0.5mM乙酸對硝基苯酯作為底物確定的。一個單位的乙酰木聚糖酯酶定義為能夠在pH5,25°C每分鐘釋放I微摩爾對硝基苯酹陰離子(p-nitrophenolatean1n)的酶量。[0063]等位變體(allelicvariant):術語“等位變體”意指占據(jù)相同染色體基因座的基因的任何兩種或更多種可選形式。等位變異通過突變天然地發(fā)生,并且可導致種群內(nèi)的多態(tài)性?;蛲蛔兛梢允浅聊?在編碼的多肽中無變化)或可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。[0064]a-L-阿拉伯呋喃糖苷酶:術語“a_L_阿拉伯呋喃糖苷酶”意指a_L_阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC3.2.1.55),其催化對a-L-阿拉伯糖苷中的末端非還原性a-L-阿拉伯呋喃糖苷殘基的水解。該酶對a-L-阿拉伯呋喃糖苷、含有(1,3)-和/或(1,5)_鍵的a-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶也稱為阿拉伯糖苷酶、α-阿拉伯糖苷酶、a-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖a-L-阿拉伯呋喃糖苷酶、a-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶或a-L-阿拉伯聚糖酶。就本發(fā)明而言,a-L-阿拉伯呋喃糖苷酶活性是使用總體積200μI中的每ml的10mM乙酸鈉pH5中5mg的中等粘度小麥阿拉伯木聚糖(MegazymeInternat1nalIreland,Ltd.,Bray,C0.Wicklow,Ireland)在4CTC進行30分鐘,接著通過AMINEX?HPX-87H柱層析(B1-RadLaboratories,Inc.,Hercules,CA,USA)的阿拉伯糖分析來確定的。[0065]α-葡糖醛酸糖苷酶:術語“α-葡糖醛酸糖苷酶”意指a_D_葡糖苷酸葡糖醛酸水解酶(alpha-D-glucosiduronateglucuronohydrolase)(EC3.2.1.139),其催化a-D-葡糖醛酸糖苷水解為D-葡糖醛酸和醇。就本發(fā)明而言,α-葡糖醛酸糖苷酶活性是根據(jù)deVries,1998,J.Bacter1l.180:243-249確定的。一個單位的α-葡糖醒酸糖苷酶等于能夠在pH5,40°C每分鐘釋放I微摩爾葡糖醛酸或4-0-甲基葡糖醛酸的酶量。[0066]β-葡糖苷酶:術語“β-葡糖苷酶”意指β-D-葡糖苷葡糖水解酶(beta-D-glucosideglucohydrolase)(E.C.N0.3.2.1.21),其催化末端非還原β-D-葡萄糖殘基的水解,并釋放β-D-葡萄糖。就本發(fā)明而言,葡糖苷酶根據(jù)Venturi等,2002,Extracellularbeta-D-glucosidasefromChaetomiumthermophilumvar.coprophiIum!product1n,purificat1nandsomeb1chemicalproperties,J.BasicMicrob1l.42:55-66的方法使用對硝基苯基-β_D_葡糖吡喃糖苷作為底物確定。一個單位的葡糖苷酶定義為在25°C,pH4.8,在含有0.01%TWEEN?20的50mM檸檬酸鈉中從作為底物的ImM對硝基苯基-β-D-葡糖吡喃糖苷每分鐘產(chǎn)生1.0微摩爾對硝基苯酚陰離子。[0067]β-木糖苷酶:術語“β-木糖苷酶”意指β-D-木糖苷木糖水解酶(β-D-xylosidexylohydrolase)(E.C.3.2.1.37),其催化短β(I—4)木寡糖(xylooligosaccharide)的外水解以從非還原端去除連續(xù)的D-木糖殘基。就本發(fā)明而言,一個單位的β_木糖苷酶定義為在40。。,ρΗ5在含有0.01%TWEEN?20的10mM檸檬酸鈉中從作為底物的ImM對硝基苯基-β-D-木糖苷每分鐘產(chǎn)生1.0微摩爾對硝基苯酚陰離子。[0068]碳水化合物結合域:術語“碳水化合物結合域”意指介導酶對碳水化合物底物的無定形區(qū)的結合的酶的區(qū)域。碳水化合物結合域(CBD),亦稱為碳水化合物結合模塊,通常見于酶的N末端或C末端。[0069]催化域:術語“催化域”意指含有酶的催化機構(catalyticmachinery)的酶的區(qū)域。[0070]cDNA:術語“cDNA”意指能夠通過反轉錄從得自真核或原核細胞的成熟的、已剪接的mRNA分子制備得到的DNA分子。cDNA缺少通常存在于相應基因組DNA中的內(nèi)含子序列。最初的(initial)初級RNA轉錄物是mRNA的前體,其通過一系列的步驟加工包括剪接,然后作為成熟的已剪接的mRNA出現(xiàn)。[0071]纖維二糖水解酶:術語“纖維二糖水解酶”意指l,4-13_D-葡聚糖纖維二糖水解酶(I,4-beta-D-glucancellob1hydrolase)(E.C.3.2.1.91和E.C.3.2.1.176),其催化纖維素、纖維寡糖,或任何包含β-1,4-連接的葡萄糖的聚合物中的1,4-β-D-糖苷鍵的水解,從鏈的還原端(纖維二糖水解酶I)或非還原端(纖維二糖水解酶II)釋放纖維二糖(Teeri,1997,Crystallinecellulosedegradat1n:Newinsightintothefunct1nofcellob1hydrolases,TrendsinB1technology15:160-167;Teeri等,1998,Trichodermareeseicellob1hydrolases:whysoefficientoncrystallinecellulose?,B1chem.Soc.Trans.26:173-178)?就本發(fā)明而言,根據(jù)Lever等,1972,Anal.B1chem.47:273-279;vanTilbeurgh等,1982,F(xiàn)EBSLetters149:152-156;vanTilbeurgh和Claeyssens,1985,F(xiàn)EBSLetters187:283-288;以及Tomme等,1988,Eur.J.B1chem.170:575-581描述的方法確定纖維二糖水解酶活性。在本發(fā)明中,Tomme等的方法可用于確定纖維二糖水解酶活性。[0072]纖維素分解酶或纖維素酶:術語“纖維素分解酶”或“纖維素酶”意指一種或多種(例如幾種)水解纖維素材料的酶。此類酶包括內(nèi)切葡聚糖酶,纖維二糖水解酶,β_葡糖苷酶,或其組合。測量纖維素分解活性的兩種基本方法包括:(1)測量總纖維素分解活性,和(2)測量單獨的纖維素分解活性(內(nèi)切葡聚糖酶、纖維二糖水解酶和β_葡糖苷酶),如Zhang等,Outlookforcellulaseimprovement:Screeningandselect1nstrategies,2006,B1technologyAdvances24:452-481所綜述的??偫w維素分解活性通常是使用不溶性底物來測定的,所述底物包括Whatmanl號濾紙、微晶纖維素、細菌纖維素、藻類纖維素、棉花、經(jīng)預處理的木素纖維素等。最常見的總纖維素分解活性測定法是使用Whatmanl號濾紙作為底物的濾紙測定法。該測定法是由Internat1nalUn1nofPureandAppliedChemistry(IUPAC)(Ghose,1987,Measurementofcellulaseactivities,PureApp1.Chem.59:257-68)確立的。[0073]就本發(fā)明而言,纖維素分解酶活性通過測量在下述條件下由纖維素分解酶進行的纖維素材料水解相比于未添加纖維素分解酶蛋白的對照水解的增加來確定:l-50mg的纖維素分解酶蛋白/g的PCS中纖維素(或其它經(jīng)預處理的纖維素材料)在合適的溫度,例如50°C、55°C或60°C進行3-7日。通常條件為:1ml反應液,經(jīng)洗滌或未洗滌的PCS,5%不溶性固形物,50mM乙酸鈉pH5,ImMMnSO4,50°C、55°C或60°C,72小時,通過ΛΜΤΝΤΧRHPX-87H柱(B1-RadLaboratories,Inc.,Hercules,CA,USA)進行糖分析。[0074]纖維素材料:術語“纖維素材料”意指包含纖維素的任何材料。生物質的初生細胞壁(primarycellwall)中的主要多糖是纖維素,其次最豐富的是半纖維素,而第三是果膠。次生細胞壁(secondarycellwall)在細胞停止生長后產(chǎn)生,其同樣含有多糖并通過共價交聯(lián)至半纖維素的聚合木質素而加強。纖維素是脫水纖維二糖的均聚物,因此是直鏈β-(1-4)-D-葡聚糖,而半纖維素包括多種化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,形成具有多種多樣的取代基的復雜分支結構。盡管纖維素通常是多形的,但存在于植物組織中的纖維素主要是平行葡聚糖鏈的不溶晶體基質。半纖維素通常與纖維素以及其它半纖維素以氫鍵相連,其幫助穩(wěn)定細胞壁基質。[0075]纖維素通常見于例如植物的莖、葉、殼、皮和穗軸,或樹的葉、枝和木材。纖維素材料可以是,但不限于,農(nóng)業(yè)殘余物、草本材料(包括能源作物)、城市固體廢物、紙漿與造紙廠殘余物、廢紙和木材(包括林業(yè)殘余物)(參見,例如,Wiselogel等,1995,于HandbookonB1ethanol(CharlesE.Wyman編),pp.105-118,Taylor&Francis,WashingtonD.C.;Wyman,1994,B1resourceTechnology50:3—16;Lyndj1990,AppliedB1chemistryandB1technology24/25:695-719;Mosier等,1999,RecentProgressinB1convers1nofLignocellulosicsj于AdvancesinB1chemicalEngineering/B1technology,T.Scheper主編,Volume65,pp.23-40,Springer-VerlagjNewYork)。在本文中應理解的是,纖維素可以是木素纖維素的形式,木素纖維素是一種植物細胞壁材料,包含木質素、纖維素和半纖維素的混合基質。在一個優(yōu)選的方面,纖維素材料是任何生物質材料。在另一個優(yōu)選的方面,所述纖維素材料是木素纖維素,其包含纖維素、半纖維素和木質素。[0076]在一個方面,纖維素材料是農(nóng)業(yè)殘余物。在另一個方面,纖維素材料是草本材料(包括能源作物)。在另一個方面,纖維素材料是城市固體廢物。在另一個方面,纖維素材料是紙漿和造紙廠殘余物。在另一個方面,纖維素材料是廢紙。在另一個方面,纖維素材料是木材(包括林業(yè)殘余物)。[0077]在另一個方面,纖維素材料是蘆竹(arundo)。在另一個方面,纖維素材料是蔗渣。在另一個方面,纖維素材料是竹子。在另一個方面,纖維素材料是玉米穗軸。在另一個方面,纖維素材料是玉米纖維。在另一個方面,纖維素材料是玉米秸桿。在另一個方面,纖維素材料是芒草屬。在另一個方面,纖維素材料是橙皮。在另一個方面,纖維素材料是稻桿。在另一個方面,纖維素材料是柳枝稷(switchgrass)。在另一個方面,纖維素材料是麥桿。[0078]在另一個方面,纖維素材料是白楊。在另一個方面,纖維素材料是桉樹。在另一個方面,纖維素材料揪樹(fir)。在另一個方面,纖維素材料是松樹。在另一個方面,纖維素材料是楊樹。在另一個方面,纖維素材料是云杉。在另一個方面,纖維素材料是柳樹。[0079]在另一個方面,纖維素材料是藻類纖維素。在另一個方面,纖維素材料是細菌纖維素。在另一個方面,纖維素材料是棉絨(cottonlinter)。在另一個方面,纖維素材料是濾紙。在另一個方面,纖維素材料是微晶纖維素。在另一個方面,纖維素材料是磷酸處理的纖維素。[0080]在另一個方面,纖維素材料是水生生物質。如用于本文中,“水生生物質”意指在水生環(huán)境中由光合作用過程產(chǎn)生的生物質。水生生物質可為藻類、挺水植物(emergentplant)、浮葉植物(floating-leafplant)或沉水植物(submergedplant)。[0081]纖維素材料可以按原樣(asis)使用或進行預處理,預處理使用本領域已知的常規(guī)方法,如本文所述。在一個優(yōu)選的方面,預處理纖維素材料。[0082]編碼序列:術語“編碼序列”意指直接指定多肽的氨基酸序列的多核苷酸。編碼序列的邊界通常由開放閱讀框決定,所述開放閱讀框以起始密碼子如ATG、GTG或TTG開始,并且以終止密碼子如TAA、TAG或TGA結束。編碼序列可以是基因組DNA、cDNA、合成DNA或其組合。[0083]調控序列(controlsequence):術語“調控序列”意指對編碼本發(fā)明的成熟多肽的多核苷酸表達是必需的核酸序列。各個調控序列對于編碼所述成熟多肽的多核苷酸可以是天然的(即,來自同一基因)或外源的(即,來自不同基因),或各個調控序列對于彼此可以是天然的或外源的。這些調控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉錄終止子。至少,調控序列包括啟動子和轉錄和翻譯的終止信號。調控序列可以配備用于引入特異性限制位點的接頭,所述特異性限制位點促進調控序列與編碼多肽的多核苷酸編碼區(qū)的連接。[0084]內(nèi)切葡聚糖酶:術語“內(nèi)切葡聚糖酶”意指內(nèi)切_1,4-(1,3;l,4)-13-D_葡聚糖4-葡聚糖水解酶(endo-Ι,4_β-D-glucan4-glucanohydrolase)(E.C.3.2.1.4),其催化纖維素、纖維素衍生物(例如羧甲基纖維素和羥乙基纖維素)、地衣淀粉(Iichenin)中的l,4-13-D-糖苷鍵、混合的β_1,3葡聚糖例如谷類β-D-葡聚糖或木葡聚糖和含有纖維素組分的其它植物材料中的β-1,4鍵的內(nèi)水解(endohydrolysis)。內(nèi)切葡聚糖酶活性可通過測量底物粘度的減少或由還原糖測定法(Zhang等,2006,B1technologyAdvances24:452-481)確定的還原端增加來確定。根據(jù)Ghose,1987,PureandApp1.Chem.59:257-268的方法,在pH5,40°C使用羧甲基纖維素(CMC)作為底物來確定內(nèi)切葡聚糖酶活性。或者,內(nèi)切葡聚糖酶活性可使用本發(fā)明的實施例33-37中所述的步驟來確定。[0085]本發(fā)明的多肽具有SEQIDN0:2的成熟多肽,SEQIDN0:4的成熟多肽,SEQIDN0:6的成熟多肽,SEQIDN0:8的成熟多肽,SEQIDNO:10的成熟多肽,SEQIDN0:12的成熟多肽,SEQIDNO:14的成熟多肽,SEQIDNO:16的成熟多肽,SEQIDNO:18的成熟多肽,SEQIDNO:20的成熟多肽,SEQIDNO:22的成熟多肽,或SEQIDNO:24的成熟多肽的內(nèi)切葡聚糖酶活性的至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少95%,或至少100%。[0086]表達:術語“表達”包括涉及多肽產(chǎn)生的任何步驟,其包括但不限于轉錄、轉錄后修飾、翻譯、翻譯后修飾和分泌。[0087]表達載體:術語“表達載體”意指線性的或環(huán)狀的DNA分子,其包含編碼多肽的多核苷酸,并且所述多核苷酸與提供用于其表達的調控序列可操作地連接。[0088]家族61糖苷水解酶:術語“家族61糖苷水解酶”或“家族GH61”或“GH61”在本文中定義為根據(jù)HenrissatB.,1991,Aclassificat1nofglycosylhydrolasesbasedonamino-acidsequencesimilarities,B1chem.J.280:309-316,及HenrissatB.和BairochA.,1996,Updatingthesequence-basedclassificat1nofglycosylhydrolases,B1chem.J.316:695-696屬于糖苷水解酶家族61的多肽。該家族中的酶原先基于在一個家族成員測量到的非常弱的內(nèi)切-1,4-β-D葡聚糖酶活性而歸類為糖苷水解酶家族。這些酶的結構和作用模式是非經(jīng)典的,且它們無法視為真正的(bonafide)糖苷酶。然而,基于當與纖維素酶或纖維素酶的混合物一同使用時,其增強木素纖維素分解的能力,它們被保留在CAZy分類中。[0089]阿魏酸酯酶:術語“阿魏酸酯酶(feruloylesterase)”意指4_羥基_3_甲氧基肉桂酰-糖水解酶(EC3.1.1.73),其催化4-羥基-3-甲氧基肉桂酰(阿魏酰)基團從酯化的糖(其在“天然生物質”底物中通常為阿拉伯糖)的水解,以產(chǎn)生阿魏酸(4-羥基-3-甲氧基肉桂酸)。阿魏酸酯酶也稱作阿魏酸酯酶(ferulicacidesterase)、羥基肉桂?;ッ?、FAE-1I1、肉桂酸酯水解酶、FAEA、cinnAE、FAE-1或FAE-1I。就本發(fā)明而言,阿魏酸酯酶活性是使用50mM乙酸鈉pH5.0中的0.5mM阿魏酸對硝基苯酯作為底物確定的。一個單位的阿魏酸酯酶等于能夠在pH5,25°C每分鐘釋放I微摩爾對硝基苯酚陰離子的酶量。[0090]片段:術語“片段”意指從成熟多肽或域的氨基和/或羧基末端缺失一個或多個(例如幾個)氨基酸的多肽或域;其中所述片段具有內(nèi)切葡聚糖酶活性或糖結合活性。在一個方面,本發(fā)明的片段含有SEQIDNO:2的至少315個氨基酸殘基,例如至少333個氨基酸殘基,或至少351個氨基酸殘基。在一個方面,本發(fā)明的片段含有SEQIDN0:4的至少313個氨基酸殘基,例如至少331個氨基酸殘基或至少349個氨基酸殘基。在一個方面,本發(fā)明的片段含有SEQIDNO:6的至少272個氨基酸殘基,例如至少290個氨基酸殘基或至少308個氨基酸殘基。在一個方面,本發(fā)明的片段含有SEQIDNO:8的至少325個氨基酸殘基,例如至少344個氨基酸殘基,或至少363個氨基酸殘基。在一個方面,本發(fā)明的片段含有SEQIDNO:10的至少332個氨基酸殘基,例如至少352個氨基酸殘基或至少372個氨基酸殘基。在一個方面,本發(fā)明的片段含有SEQIDNO:12的至少261個氨基酸殘基,例如至少276個氨基酸殘基或至少291個氨基酸殘基。在一個方面,本發(fā)明的片段含有SEQIDNO:14的至少377個氨基酸殘基,例如至少410個氨基酸殘基,或至少433個氨基酸殘基。在一個方面,本發(fā)明的片段含有SEQIDNO:16的至少339個氨基酸殘基,例如至少359個氨基酸殘基或至少379個氨基酸殘基。在一個方面,本發(fā)明的片段含有SEQIDNO:18的至少336個氨基酸殘基,例如至少356個氨基酸殘基或至少376個氨基酸殘基。在一個方面,本發(fā)明的片段含有SEQIDNO:20的至少338個氨基酸殘基,例如至少359個氨基酸殘基或至少380個氨基酸殘基。在一個方面,本發(fā)明的片段含有SEQIDNO:22的至少517個氨基酸殘基,例如至少548個氨基酸殘基或至少579個氨基酸殘基。在一個方面,本發(fā)明的片段含有SEQIDNO:24的至少362個氨基酸殘基,例如至少383個氨基酸殘基或至少404個氨基酸殘基。[0091]半纖維素分解酶或半纖維素酶:術語“半纖維素分解酶”或“半纖維素酶”意指一種或多種(例如幾種)水解半纖維素材料的酶。參見,例如ShallomD.和ShohamY.Microbialhemicellulases.CurrentOpin1nInMicrob1logy,2003,6(3):219-228)。半纖維素酶是植物生物質降解中的關鍵成分。半纖維素酶的實例包括但不限于乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。這些酶的底物,半纖維素是支化和直鏈多糖的混雜集團,這些多糖通過氫鍵鍵合于植物細胞壁中的纖維素微纖維,將其交聯(lián)為魯棒(robust)的網(wǎng)絡。半纖維素亦共價地附于木質素,與纖維素一同形成高度復雜的結構。半纖維素的多變的結構和組織形式需要許多酶的協(xié)同作用使其完全降解。半纖維素酶的催化模塊為水解糖苷鍵的糖苷水解酶(GH),或水解乙酸或阿魏酸側基的酯連接的糖酯酶(CE)。這些催化模塊,基于其一級結構的同源性,可指派為GH和CE家族。一些家族,具有總體上類似的折疊,可進一步歸類為宗族(clan),以字母標記(例如,GH-A)。最具信息性和最新的這些和其他糖活性酶的分類可在Carbohydrate-ActiveEnzymes(CAZy)數(shù)據(jù)庫獲得。半纖維素分解酶活性可根據(jù)Ghose和Bisaria,1987,Pure&Appl.Chem.59:1739-1752在合適的溫度,例如50°C、55°C或60°C,和pH,例如5.0或5.5進行測量。[0092]高嚴格條件:術語“高嚴格條件”意指對于長度至少100個核苷酸的探針,在42°C,在5XSSPE、0.3%SDS,200微克/ml已剪切并且變性的鮭精DNA和50%的甲酰胺中,根據(jù)標準的Southern印跡法進行預雜交和雜交12至24小時。使用2XSSC、0.2%SDS在65°C將載體材料最終洗滌三次,每次15分鐘。[0093]宿主細胞:術語“宿主細胞”意指適合于使用包含本發(fā)明多核苷酸的核酸構建體或表達載體進行轉化、轉染、轉導等的細胞類型。術語“宿主細胞”涵蓋親本細胞的任何由于在復制中發(fā)生的突變而不同于親本細胞的后代。[0094]分離的:術語“分離的”意指以不在自然界出現(xiàn)的形式或環(huán)境存在的物質。分離的物質的非限定性實例包括(I)任何非天然存在的物質,(2)任何至少部分地與一種或多種或全部與其天然伴隨的天然存在的成分脫離的物質,包括但不限于任何酶、變體、核酸、蛋白質、肽或輔因子;(3)任何相對于自然界中所見的該物質而言經(jīng)過了人工修飾的物質;或(4)任何通過相對于與其天然伴隨的其他組分增加該物質的量(例如,在宿主細胞中的重組產(chǎn)生;編碼該物質的基因的多拷貝;以及使用比與編碼該物質的基因天然伴隨的啟動子更強的啟動子)而修飾的物質。[0095]低嚴格條件:術語“低嚴格條件”意指對于長度至少100個核苷酸的探針,在42°C,在5XSSPE、0.3%SDS,200微克/ml已剪切并且變性的鮭精DNA和25%的甲酰胺中,根據(jù)標準的Southern印跡法進行預雜交和雜交12至24小時。使用2XSSC、0.2%SDS在50°C將載體材料最終洗滌三次,每次15分鐘。[0096]成熟多肽:術語“成熟多肽”意指以其在翻譯和任何翻譯后修飾之后的最終形式存在的多肽,所述修飾例如N-末端加工、C-末端截短、糖基化、磷酸化等。在一個方面,根據(jù)預測SEQIDN0:2(P24F2G)的氨基酸I至21是信號肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),成熟多妝是SEQIDNO:2的氨基酸22至390。在另一個方面,根據(jù)預測SEQIDN0:4(P24F2H)的氨基酸I至16是信號肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),成熟多妝是SEQIDN0:4的氨基酸17至383。在另一個方面,根據(jù)預測SEQIDN0:6(P249Xff)的氨基酸I至18是信號肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),成熟多妝是SEQIDNO:6的氨基酸19至342。在另一個方面,根據(jù)預測SEQIDNO:8的氨基酸I至19是信號妝的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),成熟多妝是SEQIDNO:2的氨基酸20至401。在另一個方面,根據(jù)預測SEQIDNO:10的氨基酸I至24是信號妝的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),成熟多妝是SEQIDNO:10的氨基酸25至416。在另一個方面,根據(jù)預測SEQIDNO:12(P241M2)的氨基酸I至18是信號肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),成熟多肽是SEQIDNO:12的氨基酸19至324。SEQIDNO:14(P241M4)的氨基酸I至18是信號肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),成熟多妝是SEQIDNO:14的氨基酸19至474。在另一個方面,根據(jù)預測SEQIDNO:16的氨基酸I至19是信號肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),成熟多肽是SEQIDNO:16的氨基酸20至418。在另一個方面,根據(jù)預測SEQIDNO:18的氨基酸I至29是信號肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),成熟多肽是SEQIDNO:18的氨基酸30至454。在另一個方面,根據(jù)預測SEQIDNO:20的氨基酸I至15是信號肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),成熟多肽是SEQIDNO:20的氨基酸16至416。在另一個方面,根據(jù)預測SEQIDN0:22的氨基酸I至18是信號肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),成熟多肽是SEQIDNO:22的氨基酸19至628。在另一個方面,根據(jù)預測SEQIDNO:24的氨基酸I至35是信號妝的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),成熟多肽是SEQIDNO:24的氨基酸36至460。本領域中已知宿主細胞可產(chǎn)生有相同多肽表達的兩種或更多種不同成熟多肽(即,具有不同的C-端和/或N-端氨基酸)的混合物。本領域中亦已知不同的宿主細胞以不同方式加工多肽,并因此,一個表達多肽的的宿主細胞與表達相同多肽的另一個宿主細胞相比,可產(chǎn)生不同的成熟多肽(例如具有不同的C-端和/或N-端氨基酸)。[0097]成熟多肽編碼序列:術語“成熟多肽編碼序列”意指編碼具有內(nèi)切葡聚糖酶活性的成熟多肽的多核苷酸。在一個方面,根據(jù)預測SEQIDNO:1的核苷酸I至63編碼信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDN0:1或其cDNA序列的核苷酸64至1254。在一個方面,根據(jù)預測SEQIDNO:3的核苷酸I至48編碼信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDNO:3或其cDNA序列的核苷酸49至1441。在另一個方面,根據(jù)預測SEQIDNO:5的核苷酸I至54編碼信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDN0:5或其cDNA序列的核苷酸55至1300。在一個方面,根據(jù)預測SEQIDNO:7的核苷酸I至57編碼信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDN0:7或其cDNA序列的核苷酸58至1360。在一個方面,根據(jù)預測SEQIDNO:9的核苷酸I至72編碼信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDNO:9的核苷酸73至73。在另一個方面,根據(jù)預測SEQIDNO:11的核苷酸I至54編碼信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQID勵:11或其。0嫩序列的核苷酸55至1333。在一個方面,根據(jù)預測SEQIDNO:13的核苷酸I至54編碼信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDNO:13或其cDNA序列的核苷酸55至1700。在一個方面,根據(jù)預測SEQIDNO:15的核苷酸I至57編碼信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDN0:15或其cDNA序列的核苷酸58至1452。在另一個方面,根據(jù)預測SEQIDNO:17的核苷酸I至57編碼信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDNO:17的核苷酸58至1362。在一個方面,根據(jù)預測SEQIDNO:19的核苷酸I至45編碼信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDNO:19的核苷酸46至1248。在一個方面,根據(jù)預測SEQIDNO:21的核苷酸I至54編碼信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDNO:21或其cDNA序列的核苷酸55至2265。在另一個方面,根據(jù)預測SEQIDNO:23的核苷酸I至105編碼信號肽的SignalP程序(Nielsen等,1997,見上),成熟多肽編碼序列是SEQIDN0:23或其cDNA序列的核苷酸106至1380。[0098]中等嚴格條件:術語“中等嚴格條件”意指對于長度至少100個核苷酸的探針,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA和35%的甲酰胺中,根據(jù)標準的Southern印跡法進行預雜交和雜交12至24小時。使用2XSSC、0.2%SDS在55°C將載體材料最終洗滌三次,每次15分鐘。[0099]中等-高嚴格條件:術語“中等-高嚴格條件”意指對于長度至少100個核苷酸的探針,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA和35%的甲酰胺中,根據(jù)標準的Southern印跡法進行預雜交和雜交12至24小時。使用2XSSC、0.2%SDS在60°C將載體材料最終洗滌三次,每次15分鐘。[0100]核酸構建體:術語“核酸構建體”意指單鏈或雙鏈的核酸分子,其分離自天然存在的基因,或其經(jīng)修飾以本來不存在于(nototherwiseexist)自然界中的方式含有核酸的區(qū)段,或其為合成的,其包含一個或多個調控序列。[0101]可操作地連接:術語“可操作地連接”意指這樣的構型,其中將調控序列置于相對于多核苷酸的編碼序列的適當位置,使得調控序列指導編碼序列的表達。[0102]具有纖維素分解增強活性的多肽:術語“具有纖維素分解增強的多肽”意指催化具有纖維素分解活性的酶對纖維素材料的水解的增強的GH61多肽。就本發(fā)明而言,通過測量來自由纖維素分解酶在下述條件下與對照水解相比較水解纖維素材料的還原糖增加或纖維二糖與葡萄糖的總量增加來確定纖維素分解增強活性:l-50mg總蛋白/g預處理的玉米秸桿(PCS)中纖維素,其中總蛋白包含50-99.5%w/w的纖維素分解酶蛋白,及0.5-50%w/w的具有纖維素分解增強活性的GH61多肽的蛋白質,在合適的溫度,例如50°C、55°C或60°C和合適的pH,如4-9,例如5.0或5.5歷時1_7天,對照水解使用等量的總蛋白加載量而無纖維素分解增強活性(1-50mg纖維素分解蛋白/gPCS中纖維素)進行。在一個優(yōu)選的方面,使用在總蛋白重量的2-3%的米曲霉β-葡糖苷酶(根據(jù)WO02/095014在米曲霉中重組產(chǎn)生)或者總蛋白質量的2-3%的煙曲霉β-葡糖苷酶(如WO2002/095014所述在米曲霉中重組產(chǎn)生)的纖維素酶蛋白加載量存在下的CELLUCLAST?1.5L(NovozymesA/S,Bagsvaerd,Denmark)的混合物作為纖維素分解活性的來源。[0103]具有纖維素分解增強活性的GH61多肽通過降低達到相同水解水平所需的纖維素分解酶的量而增強由具有纖維素分解活性的酶催化的纖維素材料的水解,優(yōu)選降低至少1.01倍,例如至少1.05倍,至少1.10倍,至少1.25倍,至少1.5倍,至少2倍,至少3倍,至少4倍,至少5倍,至少10倍,或至少20倍。[0104]預處理的玉米秸桿:術語“PCS”或“預處理的玉米秸桿”意指通過用熱和稀硫酸處理、堿預處理或中性預處理的源自玉米秸桿的纖維素材料。[0105]序列同一性:參數(shù)“序列同一性”描述兩個氨基酸序列之間或兩個核苷酸序列之間的相關性。[0106]就本發(fā)明而言,兩個氨基酸序列之間的序列同一性程度使用如EMBOSS軟件包(EMBOSS:TheEuropeanMolecularB1logyOpenSoftwareSuite,Rice等,2000,TrendsGenet.16:276-277),優(yōu)選3.0.0、5.0.0版或更高版本的Needle程序中所執(zhí)行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.B1l.48:443-453)來測定。使用的參數(shù)為缺口打開罰分(gapopenpenalty)10,缺口延伸罰分(gapextens1npenalty)0.5和EBL0SUM62(BL0SUM62的EMBOSS版)取代矩陣。使用Needle標記為“最高同一I"生(longestidentity)”的輸出結果(使用-nobrief選項獲得)作為同一丨生百分比,并計算如下:[0107](同樣的殘基X100)/(比對長度一比對中缺口的總數(shù))[0108]就本發(fā)明而言,兩個核苷酸序列之間的序列同一性程度使用如EMBOSS軟件包(EMBOSS:TheEuropeanMolecularB1logyOpenSoftwareSuite,Rice等,2000,見上文),優(yōu)選5.0.0版或更高版本的Needle程序中所執(zhí)行的Needleman-Wunsch算法(Needleman和Wunsch,1970,見上文)來測定。使用的參數(shù)為缺口打開罰分10,缺口延伸罰分0.5和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩陣。使用Needle標記為“最高同一性”的輸出結果(使用-nobrief選項獲得)作為同一性百分比,并計算如下:[0109](同樣的脫氧核糖核苷酸X100)/(比對長度一比對中缺口的總數(shù))[0110]亞序列:術語“亞序列(subsequence)”意指從成熟多肽編碼序列或域的5’和/或3’端缺失一個或多個(例如幾個)核苷酸的多核苷酸;其中所述亞序列編碼具有內(nèi)切葡聚糖酶或糖結合活性的片段。在一個方面,本發(fā)明的亞序列含有SEQIDNO:1的至少945個核苷酸,例如至少999個核苷酸,或至少1053個核苷酸。在一個方面,本發(fā)明的亞序列含有SEQIDNO:3的至少939個核苷酸,例如至少993個核苷酸或至少1047個核苷酸。在一個方面,本發(fā)明的亞序列含有SEQIDNO:5的至少816個核苷酸,例如至少870個核苷酸或至少924個核苷酸。在一個方面,本發(fā)明的亞序列含有SEQIDNO:7的至少975個核苷酸,例如至少1032個核苷酸,或至少1089個核苷酸。在一個方面,本發(fā)明的亞序列含有SEQIDNO:9的至少996個核苷酸,例如至少1056個核苷酸或至少1116個核苷酸。在一個方面,本發(fā)明的亞序列含有SEQIDNO:11的至少783個核苷酸,例如至少828個核苷酸或至少873個核苷酸。在一個方面,本發(fā)明的亞序列含有SEQIDNO:13的至少1131個核苷酸,例如至少1230個核苷酸,或至少1299個核苷酸。在一個方面,本發(fā)明的亞序列含有SEQIDNO:15的至少1017個核苷酸,例如至少1077個核苷酸或至少1137個核苷酸。在一個方面,本發(fā)明的亞序列含有SEQIDNO:17的至少1008個核苷酸,例如至少1068個核苷酸或至少1128個核苷酸。在一個方面,本發(fā)明的亞序列含有SEQIDNO:19的至少1014個核苷酸,例如至少1077個核苷酸,或至少1140個核苷酸。在一個方面,本發(fā)明的亞序列含有SEQIDN0:21的至少1551個核苷酸,例如至少1644個核苷酸或至少1737個核苷酸。在一個方面,本發(fā)明的亞序列含有SEQIDNO:23的至少1086個核苷酸,例如至少1149個核苷酸或至少1212個核苷酸。[0111]變體:術語“變體”意指在一個或多個(例如幾個)位置包含改變,即取代、插入和/或缺失的具有內(nèi)切葡聚糖酶活性的多肽。取代意指將占據(jù)某位置的氨基酸用不同的氨基酸替代;缺失意指去除占據(jù)某位置的氨基酸;而插入意指在鄰接并緊接著占據(jù)某位置的氨基酸之后添加氨基酸。[0112]非常高嚴格條件:術語“非常高嚴格條件”意指對于長度至少100個核苷酸的探針,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA和50%的甲酰胺中,根據(jù)標準的Southern印跡法進行預雜交和雜交12至24小時。使用2XSSC、0.2%SDS在70°C將載體材料最終洗滌三次,每次15分鐘。[0113]非常低嚴格條件:術語“非常低嚴格條件”意指對于長度至少100個核苷酸的探針,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且變性的鮭精DNA和25%的甲酰胺中,根據(jù)標準的Southern印跡法進行預雜交和雜交12至24小時。使用2XSSC、0.2%SDS在45°C將載體材料最終洗滌三次,每次15分鐘。[0114]含木聚糖材料:術語“含木聚糖材料”意指任何包含含有β-(1-4)連接的木糖殘基骨架的植物細胞壁多糖的材料。陸生植物的木聚糖是具有β-(1-4)-吡喃木糖骨架的雜聚物,其具有短的糖鏈分支。它們包含D-葡糖醛酸或其4-0-甲基醚,L-阿拉伯糖和/或多種包含D-木糖、L-阿拉伯糖、D-或L-半乳糖和D-葡萄糖的寡糖。木聚糖類型的多糖可分為均木聚糖(homoxylan)和雜木聚糖(heteroxylan),后者包括葡糖醒酸木聚糖,(阿拉伯)葡糖醛酸木聚糖,(葡糖醛酸)阿拉伯木聚糖,阿拉伯木聚糖和復合雜木聚糖。參見,例如Ebringerova等,2005,Adv.Polym.Sc1.186:1-67。[0115]在本發(fā)明的工藝中,可使用任何含有木聚糖的材料。在一個優(yōu)選的方面,所述含木聚糖材料是木素纖維素。[0116]木聚糖降解活性或木聚糖分解活性:術語“木聚糖降解活性”或“木聚糖分解活性”意指水解含木聚糖材料的生物學活性。兩種測定木聚糖分解活性的基礎方法包括:(I)測定總木聚糖分解活性,和(2)測定單獨的木聚糖分解活性(例如內(nèi)切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶和α-葡糖醛酸酯酶(a-glucuronylesterase))。最近在木聚糖分解酶測定法的進展總結于幾個公開文獻中,包括Biely和Puchard,2006,Recentprogressintheassaysofxylanolyticenzymes,JournaloftheScienceofFood和Agriculture86(II):1636-1647;Spanikova和Biely,2006,Glucuronoylesterase-NovelcarbohydrateesteraseproducedbySchizophyllumcommune,FEBSLetters580(19):4597-4601;Herrmann,Vrsanska,Jurickova,Hirsch,Biely,和Kubicek,1997,Thebeta-D-xylosidaseofTrichodermareeseiisamultifunct1nalbeta—D—xylanxylohydrolase,B1chemicalJournal321:375-381。[0117]總木聚糖降解活性可通過確定從多種類型的木聚糖形成的還原糖來測量,所述木聚糖包括例如燕麥小麥(oatspelt)、山毛櫸木(beechwood)和落葉松木(Iarchwood)木聚糖,或者可通過光度法確定從多種共價染色的木聚糖釋放出的染色的木聚糖片段來測量。最常見的總木聚糖分解活性測定法基于從多聚的4-0-甲基葡糖醛酸木聚糖產(chǎn)生還原糖,如Bailey,Biely,Poutanen,1992,Interlaboratorytestingofmethodsforassayofxylanaseactivity,JournalofB1technology23(3):257-270中所述。木聚糖酶活性亦可用0.2%AZCL-阿拉伯木聚糖作為底物在37°C在0.01%TRITON?X-100(4-(I,1,3,3-四甲基丁基)苯基-聚乙二醇)和200mM磷酸鈉緩沖液pH6中來確定。一個單位的木聚糖酶活性定義為在37°C,pH6在200mM磷酸鈉pH6緩沖液中從作為底物的0.2%AZCL-阿拉伯木聚糖每分鐘產(chǎn)生1.0微摩爾天青蛋白(azurine)。[0118]就本發(fā)明而言,木聚糖降解活性是通過測量由木聚糖降解酶在下述通常條件下造成的樺木木聚糖(SigmaChemicalC0.,Inc.,St.Louis,MO,USA)水解的增加來確定的:Iml反應,5mg/ml底物(總固形物),5mg木聚糖分解蛋白質/g底物,50mM乙酸鈉,pH5,50°C,24小時,如Lever,1972,Anewreact1nforcolorimetricdeterminat1nofcarbohydrates,Anal.B1chem47:273-279所述使用對羥基苯甲酸酸餅(PHBAH)測定法進行糖分析。[0119]木聚糖酶:術語“木聚糖酶”意指1,4-β-D-木聚糖-木糖水解酶(I,4-β-D-xylan-xylohydrolase)(E.C.3.2.1.8),其催化木聚糖中I,4_β-D-木糖苷鍵的內(nèi)水解。就本發(fā)明而言,木聚糖酶活性使用0.2%AZCL-阿拉伯木聚糖作為底物在37°C在0.01%TRITON?X-100和200mM乙酸鈉緩沖液,pH6中確定。一個單位的木聚糖酶活性定義為在37°C在200mM磷酸鈉pH6緩沖液中從作為底物的0.2%AZCL-阿拉伯木聚糖每分鐘產(chǎn)生1.0微摩爾天青蛋白。[0120]發(fā)明詳述[0121]具有內(nèi)切葡聚糖酶活性的多肽[0122]在一個實施方案中,本發(fā)明涉及分離的多肽,其與SEQIDNO:18的成熟多肽或SEQIDNO:24的成熟多肽具有至少65%,例如至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,其具有內(nèi)切葡聚糖酶活性。在一個實施方案中,本發(fā)明涉及分離的多肽,其與SEQIDN0:10的成熟多肽,SEQIDN0:22的成熟多肽,或SEQIDNO:2的成熟多肽具有至少70%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,其具有內(nèi)切葡聚糖酶活性。在一個實施方案中,本發(fā)明涉及分離的多肽,其與SEQIDNO:14的成熟多肽具有至少71%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,其具有內(nèi)切葡聚糖酶活性。在一個實施方案中,本發(fā)明涉及分離的多肽,其與SEQIDNO:6,SEQIDN0:8或SEQIDNO:16的成熟多肽具有至少75%,例如至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,其具有內(nèi)切葡聚糖酶活性。在一個實施方案中,本發(fā)明涉及分離的多肽,其與SEQIDNO:12的成熟多肽具有至少76%,例如至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,其具有內(nèi)切葡聚糖酶活性。在一個實施方案中,本發(fā)明涉及分離的多肽,其與SEQIDNO:20的成熟多肽具有至少80%,例如至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,其具有內(nèi)切葡聚糖酶活性。在一個實施方案中,本發(fā)明涉及分離的多肽,其與SEQIDN0:4的成熟多肽具有至少90%,例如至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,其具有內(nèi)切葡聚糖酶活性。在一個方面,所述多肽與SEQIDNO:2的成熟多肽,SEQIDNO:4的成熟多肽,SEQIDNO:6的成熟多肽,SEQIDNO:8的成熟多肽,SEQIDNO:10的成熟多肽,SEQIDNO:12的成熟多肽,SEQIDNO:14的成熟多肽,SEQIDNO:16的成熟多肽,SEQIDNO:18的成熟多肽,SEQIDNO:20的成熟多肽,SEQIDNO:22的成熟多肽,或SEQIDNO:24的成熟多肽的成熟多肽的成熟多肽相差最多達10個氨基酸,例如1、2、3、4、5、6、7、8、9或10個氨基酸。[0123]本發(fā)明的多肽優(yōu)選包含或組成為SEQIDNO:2的氨基酸序列或其等位變體;或為其具有內(nèi)切葡聚糖酶活性的片段。在另一個方面,所述多肽包含或組成為SEQIDN0:2的成熟多肽。在另一個方面,所述多肽包含或組成為SEQIDNO:2的氨基酸22至390。本發(fā)明的多肽優(yōu)選包含或組成為SEQIDN0:4的氨基酸序列或其等位變體;或為其具有內(nèi)切葡聚糖酶活性的片段。在另一個方面,所述多肽包含或組成為SEQIDN0:4的成熟多肽。在另一個方面,所述多肽包含或組成為SEQIDN0:4的氨基酸17至383。本發(fā)明的多肽優(yōu)選包含或組成為SEQIDNO:6的氨基酸序列或其等位變體;或為其具有內(nèi)切葡聚糖酶活性的片段。在另一個方面,所述多肽包含或組成為SEQIDNO:6的成熟多肽。在另一個方面,所述多肽包含或組成為SEQIDNO:6的氨基酸19至342。本發(fā)明的多肽優(yōu)選包含或組成為SEQIDNO:8的氨基酸序列或其等位變體;或為其具有內(nèi)切葡聚糖酶活性的片段。在另一個方面,所述多肽包含或組成為SEQIDNO:8的成熟多肽。在另一個方面,所述多肽包含或組成為SEQIDNO:8的氨基酸20至401。本發(fā)明的多肽優(yōu)選包含或組成為SEQIDNO:10的氨基酸序列或其等位變體;或為其具有內(nèi)切葡聚糖酶活性的片段。在另一個方面,所述多肽包含或組成為SEQIDNO:10的成熟多肽。在另一個方面,所述多肽包含或組成為SEQIDNO:10的氨基酸25至416。本發(fā)明的多肽優(yōu)選包含或組成為SEQIDNO:12的氨基酸序列或其等位變體;或為其具有內(nèi)切葡聚糖酶活性的片段。在另一個方面,所述多肽包含或組成為SEQIDNO:12的成熟多肽。在另一個方面,所述多肽包含或組成為SEQIDNO:12的氨基酸19至324。本發(fā)明的多肽優(yōu)選包含或組成為SEQIDNO:14的氨基酸序列或其等位變體;或為其具有內(nèi)切葡聚糖酶活性的片段。在另一個方面,所述多肽包含或組成為SEQIDN0:14的成熟多肽。在另一個方面,所述多肽包含或組成為SEQIDN0:14的氨基酸19至474。本發(fā)明的多肽優(yōu)選包含或組成為SEQIDNO:16的氨基酸序列或其等位變體;或為其具有內(nèi)切葡聚糖酶活性的片段。在另一個方面,所述多肽包含或組成為SEQIDNO:16的成熟多肽。在另一個方面,所述多肽包含或組成為SEQIDNO:16的氨基酸20至418。本發(fā)明的多肽優(yōu)選包含或組成為SEQIDNO:18的氨基酸序列或其等位變體;或為其具有內(nèi)切葡聚糖酶活性的片段。在另一個方面,所述多肽包含或組成為SEQIDNO:18的成熟多肽。在另一個方面,所述多肽包含或組成為SEQIDNO:18的氨基酸30至454。本發(fā)明的多肽優(yōu)選包含或組成為SEQIDNO:20的氨基酸序列或其等位變體;或為其具有內(nèi)切葡聚糖酶活性的片段。在另一個方面,所述多肽包含或組成為SEQIDN0:20的成熟多肽。在另一個方面,所述多肽包含或組成為SEQIDNO:20的氨基酸16至416。本發(fā)明的多肽優(yōu)選包含或組成為SEQIDNO:22的氨基酸序列或其等位變體;或為其具有內(nèi)切葡聚糖酶活性的片段。在另一個方面,所述多肽包含或組成為SEQIDNO:22的成熟多肽。在另一個方面,所述多肽包含或組成為SEQIDNO:22的氨基酸19至628。本發(fā)明的多肽優(yōu)選包含或組成為SEQIDNO:24的氨基酸序列或其等位變體;或為其具有內(nèi)切葡聚糖酶活性的片段。在另一個方面,所述多肽包含或組成為SEQIDNO:24的成熟多肽。在另一個方面,所述多肽包含或組成為SEQIDNO:24的氨基酸36至460。[0124]在另一個實施方案中,本發(fā)明涉及具有內(nèi)切葡聚糖酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸在非常低嚴格條件,低嚴格條件,中等嚴格條件,中等-高嚴格條件,高嚴格條件,或非常高嚴格條件下與以下雜交:(b)多肽,其由多核苷酸編碼,所述多核苷酸在低、中等、中等-高、高、或非常高嚴格條件下與以下雜交:(i)SEQIDN0:1的成熟多肽編碼序列,SEQIDNO:3的成熟多肽編碼序列,SEQIDNO:5的成熟多肽編碼序列,SEQIDN0:7的成熟多肽編碼序列,SEQIDNO:11的成熟多肽編碼序列,SEQIDNO:13的成熟多肽編碼序列,SEQIDNO:15的成熟多肽編碼序列,SEQIDNO:21的成熟多肽編碼序列,或SEQIDNO:23的成熟多肽編碼序列,或其cDNA序列;(ii)SEQIDNO:9的成熟多肽編碼序列,SEQIDNO:17的成熟多肽編碼序列,SEQIDNO:19的成熟多肽編碼序列,或(iii)的全長互補物(i)或(ii)(Sambrooketal.,1989,MolecularCloning,ALaboratoryManual,2dedit1n,ColdSpringHarbor,NewYork)。[0125]可利用SEQIDNO:1,SEQIDNO:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQIDNO:11,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,SEQIDNO:21,或SEQIDNO:23的多核苷酸或其亞序列,以及SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,SEQIDN0:22,或SEQIDNO:24的多肽或其片段設計核酸探針,以根據(jù)本領域內(nèi)公知的方法從不同屬或種的菌株鑒定和克隆編碼具有內(nèi)切葡聚糖酶活性的多肽的DNA。具體而言,根據(jù)標準的Southern印跡方法,可將這些探針用于與感興趣的細胞的基因組DNA或cDNA雜交,以鑒定和從其中分離相應的基因。這些探針可明顯短于完整序列,但長度上應為至少15,例如至少25,至少35,或至少70個核苷酸。優(yōu)選地,所述核酸探針是至少100個核苷酸的長度,例如,至少200個核苷酸,至少300個核苷酸,至少400個核苷酸,至少500個核苷酸,至少600個核苷酸,至少700個核苷酸,至少800個核苷酸,或至少900個核苷酸的長度。DNA和RNA探針二者均可使用。通常將探針標記以探測相應的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)標記)。這些探針涵蓋于本發(fā)明中。[0126]可從由這樣的其它菌株制備的基因組DNA或cDNA文庫中篩選與上述探針雜交并且編碼具有內(nèi)切葡聚糖酶活性的多肽的DNA??梢酝ㄟ^瓊脂糖或聚丙烯酰胺凝膠電泳,或通過其它分離技術分離來自這些其它菌株的基因組或其它DNA??梢詫碜晕膸斓腄NA或分離的DNA轉移至硝化纖維素(nitrocellulose)或其它合適的載體材料并且固定于其上。為了鑒定與SEQIDNO:1,SEQIDNO:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQIDNO:11,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,SEQIDNO:21,或SEQIDNO:23,或其成熟多肽編碼序列,或其亞序列雜交的克隆或DNA,將所述載體材料用在Sounthern印跡中。[0127]就本發(fā)明而言,雜交表示多核苷酸在非常低至非常高的嚴格條件下與標記的核酸探針雜交,所述核酸探針對應于:(i)SEQIDNO:1,SEQIDN0:3,SEQIDN0:5,SEQIDN0:7,SEQIDN0:9,SEQIDNO:11,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,SEQIDNO:21,或SEQIDNO:23,(ii)SEQIDNO:1的成熟多肽編碼序列,SEQIDNO:3的成熟多肽編碼序列,SEQIDNO:5的成熟多肽編碼序列,SEQIDNO:7的成熟多肽編碼序列,SEQIDNO:11的成熟多肽編碼序列,SEQIDNO:13的成熟多肽編碼序列,SEQIDNO:15的成熟多肽編碼序列,SEQIDNO:21的成熟多肽編碼序列,或SEQIDNO:23的成熟多肽編碼序列,(iii)SEQIDNO:1的cDNA序列,SEQIDNO:3的cDNA序列,或SEQIDNO:5的cDNA序列,(iv)它們的全長互補物,或(V)它們的亞序列??墒褂美鏧射線膠片(X-rayfilm)或其他任何本領域中已知的檢測手段檢測在這些條件下與核酸探針雜交的分子。[0128]在一個方面,核酸探針是SEQIDNO:1或其cDNA序列的成熟多肽編碼序列。在另一個方面,核酸探針是SEQIDNO:1或其cDNA序列的核苷酸64至1254。在一個方面,核酸探針是SEQIDNO:3或其cDNA序列的成熟多肽編碼序列。在另一個方面,核酸探針是SEQIDNO:3或其cDNA序列的核苷酸49至1441。在一個方面,核酸探針是SEQIDN0:5或其cDNA序列的成熟多肽編碼序列。在另一個方面,核酸探針是SEQIDN0:5或其cDNA序列的核苷酸55至1300。在一個方面,核酸探針是SEQIDNO:7或其cDNA序列的成熟多肽編碼序列。在另一個方面,核酸探針是SEQIDNO:7或其cDNA序列的核苷酸58至1360。在一個方面,核酸探針是SEQIDNO:9的成熟多肽編碼序列。在另一個方面,核酸探針是SEQIDNO:9的核苷酸73至1248。在一個方面,核酸探針是SEQIDNO:11或其cDNA序列的成熟多肽編碼序列。在另一個方面,核酸探針是SEQIDNO:11或其cDNA序列的核苷酸55至1333。在一個方面,核酸探針是SEQIDNO:13或其cDNA序列的成熟多肽編碼序列。在另一個方面,核酸探針是SEQIDNO:13或其cDNA序列的核苷酸55至1700。在一個方面,核酸探針是SEQIDNO:15或其cDNA序列的成熟多肽編碼序列。在另一個方面,核酸探針是SEQIDNO:15或其cDNA序列的核苷酸58至1452。在一個方面,核酸探針是SEQIDNO:17的成熟多肽編碼序列。在另一個方面,核酸探針是SEQIDNO:17的核苷酸58至1362。在一個方面,核酸探針是SEQIDNO:19的成熟多肽編碼序列。在另一個方面,核酸探針是SEQIDNO:19的核苷酸46至1248。在一個方面,核酸探針是SEQIDNO:21或其cDNA序列的成熟多肽編碼序列。在另一個方面,核酸探針是SEQIDNO:21或其cDNA序列的核苷酸55至2265。在一個方面,核酸探針是SEQIDNO:23或其cDNA序列的成熟多肽編碼序列。在另一個方面,核酸探針是SEQIDNO:23或其cDNA序列的核苷酸106至1380。在另一個方面,核酸探針是編碼SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,SEQIDNO:22,或SEQIDNO:24,或其成熟多肽,或其片段的多核苷酸。在另一個方面,核酸探針是SEQIDNO:1。在另一個方面,核酸探針是SEQIDNO:3。在另一個方面,核酸探針是SEQIDNO:5。在另一個方面,核酸探針是SEQIDNO:7。在另一個方面,核酸探針是SEQIDNO:9。在另一個方面,核酸探針是SEQIDNO:11。在另一個方面,核酸探針是SEQIDNO:13。在另一個方面,核酸探針是SEQIDNO:15。在另一個方面,核酸探針是SEQIDNO:17。在另一個方面,核酸探針是SEQIDNO:19。在另一個方面,核酸探針是SEQIDNO:21。在另一個方面,核酸探針是SEQIDNO:23。[0129]在另一個實施方案中,本發(fā)明涉及具有內(nèi)切葡聚糖酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:17的成熟多肽編碼序列或SEQIDNO:23的成熟多肽編碼序列具有至少65%,例如至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在另一個實施方案中,本發(fā)明涉及具有內(nèi)切葡聚糖酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:9的成熟多肽編碼序列,SEQIDN0:21的成熟多肽編碼序列orSEQIDNO:1的成熟多肽編碼序列具有至少70%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在另一個實施方案中,本發(fā)明涉及具有內(nèi)切葡聚糖酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:13的成熟多肽編碼序列具有至少71%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在另一個實施方案中,本發(fā)明涉及具有內(nèi)切葡聚糖酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:5的成熟多肽編碼序列,SEQIDNO:7或SEQIDNO:15具有至少75%,例如至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在另一個實施方案中,本發(fā)明涉及具有內(nèi)切葡聚糖酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDΝΟ:11的成熟多肽編碼序列具有至少76%,例如至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在另一個實施方案中,本發(fā)明涉及具有內(nèi)切葡聚糖酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:19的成熟多肽編碼序列具有至少80%,例如至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在另一個實施方案中,本發(fā)明涉及具有內(nèi)切葡聚糖酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:3的成熟多肽編碼序列具有至少90%,例如至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。[0130]在另一個實施方案中,本發(fā)明涉及SEQIDN0:2,SEQIDNO:4,SEQIDN0:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDN0:20,SEQIDN0:22,或SEQIDNO:24的成熟多肽的變體,其在一個或多個(例如幾個)位置包含取代、缺失和/或插入。在一個方面,導入SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,SEQIDN0:22,或SEQIDNO:24的成熟多肽的氨基酸取代、缺失和/或插入的數(shù)量是至多10個,例如1、2、3、4、5、6、7、8、9或10個。氨基酸改變可以是次要性的,即保守的氨基酸取代或插入,其不顯著影響蛋白質的折疊和/或活性;通常為I至大約30個氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸殘基;至多大約20-25個殘基的小接頭肽;或通過改變凈電荷或其它功能來促進純化的小延伸,如多組氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)或結合域(bindingdomain)。[0131]保守取代的實例是在以下組之內(nèi):堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性(specificactivity)的氨基酸取代是本領域已知的,并且由例如H.Neuratt^PR.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍發(fā)生的交換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。[0132]或者,氨基酸改變具有導致多肽的物理化學特性改變的性質。例如,氨基酸改變可改善多肽的熱穩(wěn)定性,改變底物特異性,改變最適PH等。[0133]可以根據(jù)本領域已知的方法,例如定位誘變或丙氨酸分區(qū)誘變法(Cunningham和Wells,1989,Science244:1081-1085)來鑒定親本多肽中的必需氨基酸。在后一技術中,將單一丙氨酸突變引入到分子中的每個殘基,并且測試所得到的突變分子是否具有內(nèi)切葡聚糖酶活性,以鑒定對于所述分子的活性關鍵的氨基酸殘基。另參見Hilton等,1996,J.B1l.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也可以通過對結構的物理分析,結合針對推定的接觸位點氨基酸的突變來確定,結構通過以下這些技術來測定:如核磁共振、晶體學、電子衍射或光親和標記。參見例如deVos等,1992,Science255:306-312;Smith等,1992,J.Mol.B1l.224:899-904;fflodaver等,1992,F(xiàn)EBSLett.309:59-64。也可以從與相關多肽的同一性分析來推斷必需氨基酸的身份。[0134]可使用已知的誘變、重組和/或改組方法,然后進行相關的篩選過程,如由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sc1.USA86:2152-2156;W095/17413;或者WO95/22625所公開的那些,進行一個或多個氨基酸取代、缺失和/或插入并加以測試。其他可使用的方法包括易錯PCR、噬菌體展示(例如Lowman等,1991,B1chemistry30:10832-10837;美國專利號5,223,409;W092/06204)和區(qū)域定向誘變(reg1n-directedmutagenesis)(Derbyshire等,1986,Gene46:145;等,1988,DNA7:127)。[0135]誘變/改組方法可與高通量、自動篩選方法組合以檢測由宿主細胞表達的經(jīng)克隆、誘變的多肽的活性(Ness等,1999,NatureB1technology17:893-896)。編碼活性多肽的經(jīng)誘變的DNA分子可自宿主細胞回收并使用本領域標準方法迅速測序。這些方法允許快速確定多肽中單個氨基酸殘基的重要性。[0136]所述多肽可為雜合多肽,其中一個多肽的區(qū)域融合于另一個多肽的區(qū)域的N端或C端。[0137]所述多肽可為融合多肽或可切開的融合多肽,其中另一個多肽融合于本發(fā)明的多肽的N端或C端。通過將編碼另一個多肽的多核苷酸融合于本發(fā)明的多核苷酸來產(chǎn)生融合多肽。產(chǎn)生融合多肽的技術是本領域已知的,并包括連接編碼多肽的編碼序列以使它們符合讀框(inframe),并且使融合多肽的表達在相同啟動子和終止子的控制下。融合蛋白亦可使用內(nèi)蛋白(intein)技術構建,其中融合物在翻譯后產(chǎn)生(Cooper等,1993,EMBOJ.12:2575-2583;Dawson等,1994,Science266:776-779)。[0138]融合多肽還可以在兩個多肽之間包含切割位點。在分泌融合多肽時,所述位點就被切開,釋放所述兩個多肽。切開位點的實例包括,但不限于,公開于Martin等,2003,J.1nd.Microb1l.B1technol.3:568-76;Svetina等,2000,J.B1technol.76:245-251;Rasmussen-ffiIson等,1997,Appl.Environ.Microb1l.63:3488-3493;ffard等,1995,B1technology13:498-503;和Contreras等,1991,B1technology9:378-381;Eaton等,1986,B1chem.25:505-512);Collins-Racie等,1995,B1technology13:982-987;Carter等,1989,Proteins:Structure,Funct1n,andGenetics6:240-248;以及Stevens,2003,DrugDiscoveryWorld4:35-48中的位點。[0139]具有內(nèi)切葡聚糖酶活性的多肽的來源[0140]本發(fā)明的具有內(nèi)切葡聚糖酶活性的多肽可以獲得自任何屬的微生物。就本發(fā)明而言,用于本文與給定的來源有關的術語“獲得自”,意思應為由多核苷酸編碼的多肽由所述來源產(chǎn)生,或由其中插入了來自所述來源的多核苷酸的菌株產(chǎn)生。在一個方面,從給定來源獲得的多肽是胞外分泌的。[0141]所述多肽可為真菌多肽。[0142]在另一個方面,所述多肽是Corynascus多肽。在另一個方面,所述多肽是Corynascusthermophilus多妝。在另一個方面,所述多妝是CorynascusthermophilusNN000308多肽。在另一個方面,所述多肽是Malbranchea多肽。在另一個方面,所述多肽是Malbrancheacinnamomea多月太。在另一個方面,所述多妝是MalbrancheacinnamomeaNN044758多肽。在另一個方面,所述多肽是青霉屬多肽。在另一個方面,所述多肽是草酸青霉多肽。在另一個方面,所述多肽是草酸青霉NN051380多肽。在另一個方面,所述多妝是Penicilliumemersonii多妝。在另一個方面,所述多妝是PenicilliumemersoniiNN051602多肽。在另一個方面,所述多肽是嗜熱子囊菌屬多肽。在另一個方面,所述多肽是桔橙嗜熱子囊菌多肽。在另一個方面,所述多肽是桔橙嗜熱子囊菌NN044936多肽。在另一個方面,所述多肽是Scytalidium多肽。在另一個方面,所述多肽是Scytalidiumthermophilum多妝。在另一個方面,所述多妝是ScytalidiumthermophilumNN047338多肽.[0143]可理解的是對于前述的種,本發(fā)明包含完全和不完全階段(perfectandimperfectstates),和其它分類學的等同物(equivalent),例如無性型(anamorph),而無論它們已知的種名。本領域技術人員將容易地識別適合的等同物的身份。[0144]這些種的菌株在許多培養(yǎng)物保藏中心對于公眾能夠容易地取得,所述保藏中心諸如美國典型培養(yǎng)物保藏中心(theAmericanTypeCultureCollect1n)(ATCC)、德意志微生物和細胞培養(yǎng)物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSMZ)、真菌菌種保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和農(nóng)業(yè)研究機構專利培養(yǎng)物保藏中心北區(qū)研究中心(AgriculturalResearchServicePatentCultureCollect1n,NorthernReg1nalResearchCenter)(NRRL)。[0145]可以利用上述的探針從其它來源,包括從自然界(例如,土壤、堆肥、水等)分離的微生物或直接獲得自自然材料(例如,土壤、堆肥、水等)的DNA樣品,鑒定并獲得所述多肽。用于直接從天然生境(habitat)分離微生物和DNA的技術是本領域內(nèi)公知的。隨后可通過類似地篩選另一種微生物的基因組DNA或cDNA文庫或混合的DNA樣品來得到編碼所述多肽的多核苷酸。一旦用探針檢測到編碼多肽的多核苷酸,就可以使用本領域普通技術人員已知的技術將所述多核苷酸分離或克隆(參見,例如,Sambrook等,1989,見上文)。[0146]催化域[0147]在一個實施方案中,本發(fā)明涉及催化域,其與SEQIDNO:18的氨基酸61至448或SEQIDNO:24的氨基酸60至444具有至少65%,例如至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一個實施方案中,本發(fā)明涉及催化域,其與SEQIDNO:10的氨基酸49至416,SEQIDNO:22的氨基酸80至404,或SEQIDNO:2的氨基酸22至390具有至少70%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一個實施方案中,本發(fā)明涉及催化域,其與SEQIDNO:14的氨基酸45至346具有至少71%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一個實施方案中,本發(fā)明涉及催化域,其與SEQIDNO:6的氨基酸20至342,SEQIDNO:8的氨基酸26至382,或SEQIDNO:16的氨基酸26至418具有至少75%,例如至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一個實施方案中,本發(fā)明涉及催化域,其與SEQIDNO:12的氨基酸19至324具有至少76%,例如至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一個實施方案中,本發(fā)明涉及催化域,其與SEQIDNO:20的氨基酸28至414具有至少80%,例如至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一個實施方案中,本發(fā)明涉及催化域,其與SEQIDN0:4的氨基酸80至383具有至少90%,例如至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一個方面,所述催化域包含氨基酸序列,所述氨基酸序列與SEQIDNO:2的氨基酸22至390,SEQIDNO:4的氨基酸80至383,SEQIDNO:6的氨基酸20至342,SEQIDNO:8的氨基酸26至382,SEQIDNO:10的氨基酸49至416,SEQIDNO:12的氨基酸19至324,SEQIDNO:14的氨基酸45至346,SEQIDNO:16的氨基酸26至418,SEQIDNO:18的氨基酸61至448,SEQIDNO:20的氨基酸28至414,SEQIDNO:22的氨基酸80至404,或SEQIDNO:24的氨基酸60至444相差最多達10個,例如,1、2、3、4、5、6、7、8、9或10個氨基酸。[0148]所述催化域優(yōu)選包含或組成為SEQIDNO:2的氨基酸22至390或其等位變體,或為其具有內(nèi)切葡聚糖酶活性的片段。所述催化域優(yōu)選包含或組成為SEQIDN0:4的氨基酸80至383或其等位變體,或為其具有內(nèi)切葡聚糖酶活性的片段。所述催化域優(yōu)選包含或組成為SEQIDNO:6的氨基酸20至342或其等位變體,或為其具有內(nèi)切葡聚糖酶活性的片段。所述催化域優(yōu)選包含或組成為SEQIDNO:8的氨基酸26至382或其等位變體,或為其具有內(nèi)切葡聚糖酶活性的片段。所述催化域優(yōu)選包含或組成為SEQIDNO:10的氨基酸49至416或其等位變體,或為其具有內(nèi)切葡聚糖酶活性的片段。所述催化域優(yōu)選包含或組成為SEQIDNO:12的氨基酸19至324或其等位變體,或為其具有內(nèi)切葡聚糖酶活性的片段。所述催化域優(yōu)選包含或組成為SEQIDNO:14的氨基酸45至346或其等位變體,或為其具有內(nèi)切葡聚糖酶活性的片段。所述催化域優(yōu)選包含或組成為SEQIDNO:16的氨基酸26至418或其等位變體,或為其具有內(nèi)切葡聚糖酶活性的片段。所述催化域優(yōu)選包含或組成為SEQIDNO:18的氨基酸61至448或其等位變體,或為其具有內(nèi)切葡聚糖酶活性的片段。所述催化域優(yōu)選包含或組成為SEQIDNO:20的氨基酸28至414或其等位變體,或為其具有內(nèi)切葡聚糖酶活性的片段。所述催化域優(yōu)選包含或組成為SEQIDNO:22的氨基酸80至404或其等位變體,或為其具有內(nèi)切葡聚糖酶活性的片段。所述催化域優(yōu)選包含或組成為SEQIDNO:24的氨基酸60至444或其等位變體,或為其具有內(nèi)切葡聚糖酶活性的片段。[0149]在另一個實施方案中,本發(fā)明涉及催化域,其由多核苷酸編碼,所述多核苷酸在非常低嚴格條件,低嚴格條件,中等嚴格條件,中等-高嚴格條件,高嚴格條件,或非常高嚴格條件(如上文定義)下與以下雜交:SEQIDNO:1的核苷酸64至1254,SEQIDN0:3的核苷酸238至1441,SEQIDNO:5的核苷酸58至1300,SEQIDNO:7的核苷酸76至1230,SEQIDNO:9的核苷酸145至1248,SEQIDNO:11的核苷酸55至1333,SEQIDNO:13的核苷酸133至1316,SEQIDNO:15的核苷酸76至1452,SEQIDNO:17的核苷酸181至1344,SEQIDNO:19的核苷酸82至1242,SEQIDNO:21的核苷酸349至1535,或SEQIDNO:23的核苷酸178至1332或其全長互補物(Sambrook等,1989,見上文)。[0150]在另一個實施方案中,本發(fā)明涉及催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:17的核苷酸181至1244或SEQIDNO:23的核苷酸178至1332具有至少65%,例如至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在另一個實施方案中,本發(fā)明涉及催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:9的核苷酸145至1248,SEQIDNO:21的核苷酸349至1535或SEQIDNO:1的核苷酸64至1254具有至少70%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在另一個實施方案中,本發(fā)明涉及催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:13的核苷酸133至1316具有至少71%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在另一個實施方案中,本發(fā)明涉及催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:5的核苷酸58至1300,SEQIDNO:7的核苷酸76至1230或SEQIDNO:15的核苷酸76至1452具有至少75%,例如至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在另一個實施方案中,本發(fā)明涉及催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:11的核苷酸55至1333具有至少76%,例如至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在另一個實施方案中,本發(fā)明涉及催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:19的核苷酸82至1242具有至少80%,例如至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在另一個實施方案中,本發(fā)明涉及催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:3的核苷酸238至1441具有至少90%,例如至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。[0151]編碼所述催化域的多核苷酸優(yōu)選包含或組成為SEQIDNO:1的核苷酸64至1254。編碼所述催化域的多核苷酸優(yōu)選包含或組成為SEQIDN0:3的核苷酸238至1441。編碼所述催化域的多核苷酸優(yōu)選包含或組成為SEQIDNO:5的核苷酸58至1300。編碼所述催化域的多核苷酸優(yōu)選包含或組成為SEQIDNO:7的核苷酸76至1230。編碼所述催化域的多核苷酸優(yōu)選包含或組成為SEQIDNO:9的核苷酸145至1248。編碼所述催化域的多核苷酸優(yōu)選包含或組成為SEQIDNO:11的核苷酸55至1333。編碼所述催化域的多核苷酸優(yōu)選包含或組成為SEQIDNO:13的核苷酸133至1316。編碼所述催化域的多核苷酸優(yōu)選包含或組成為SEQIDNO:15的核苷酸76至1452。編碼所述催化域的多核苷酸優(yōu)選包含或組成為SEQIDNO:17的核苷酸181至1344。編碼所述催化域的多核苷酸優(yōu)選包含或組成為SEQIDNO:19的核苷酸82至1242。編碼所述催化域的多核苷酸優(yōu)選包含或組成為SEQIDNO:21的核苷酸349至1535。編碼所述催化域的多核苷酸優(yōu)選包含或組成為SEQIDNO:23的核苷酸178至1332。[0152]在另一個實施方案中,本發(fā)明涉及SEQIDNO:2的氨基酸22至390的催化域變體,SEQIDNO:4的氨基酸80至383的催化域變體,SEQIDNO:6的氨基酸20至342的催化域變體,SEQIDNO:8的氨基酸26至382的催化域變體,SEQIDNO:10的氨基酸49至416的催化域變體,SEQIDNO:12的氨基酸19至324的催化域變體,SEQIDNO:14的氨基酸45至346的催化域變體,SEQIDNO:16的氨基酸26至418的催化域變體,SEQIDNO:18的氨基酸61至448的催化域變體,SEQIDNO:20的氨基酸28至414的催化域變體,SEQIDNO:22的氨基酸80至404的催化域變體,或SEQIDNO:24的氨基酸60至444的催化域變體,所述變體在一個或多個(例如幾個)位置包含取代、缺失和/或插入。在一個方面,弓丨入SEQIDNO:2的氨基酸22至390,SEQIDNO:4的氨基酸80至383,SEQIDNO:6的氨基酸20至342,SEQIDNO:8的氨基酸26至382,SEQIDNO:10的氨基酸49至416,SEQIDNO:12的氨基酸19至324,SEQIDNO:14的氨基酸45至346,SEQIDNO:16的氨基酸26至418,SEQIDNO:18的氨基酸61至448,SEQIDNO:20的氨基酸28至414,SEQIDNO:22的氨基酸80至404,或SEQIDNO:24的氨基酸60至444的序列的氨基酸取代、缺失和/或插入數(shù)為最多達10,例如1、2、3、4、5、6、7、8、9或10。[0153]碳水化合物結合域[0154]在一個實施方案中,本發(fā)明涉及碳水化合物結合域,其與SEQIDN0:22的氨基酸22至50具有至少70%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一個實施方案中,本發(fā)明涉及碳水化合物結合域,其與SEQIDNO:14的氨基酸442至474具有至少71%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一個實施方案中,本發(fā)明涉及碳水化合物結合域,其與SEQIDN0:4的氨基酸17至52具有至少90%,例如至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一個方面,所述碳水化合物結合域包含氨基酸序列,所述氨基酸序列與SEQIDNO:22的氨基酸22至50,SEQIDNO:14的氨基酸442至474或SEQIDNO:4的氨基酸17至52相差最多達10個,例如,1、2、3、4、5、6、7、8、9或10個氨基酸。[0155]所述碳水化合物結合域優(yōu)選包含或組成為SEQIDNO:22的氨基酸22至50,SEQIDNO:14的氨基酸442至474或SEQIDNO:4的氨基酸17至52;或其等位變體,或為其具有糖結合活性的片段。[0156]在另一個實施方案中,本發(fā)明涉及碳水化合物結合域,其由多核苷酸編碼,所述多核苷酸在非常低嚴格條件、低嚴格條件、中等嚴格條件,中等-高嚴格條件,高嚴格條件,或非常高嚴格條件(如上文定義)下與以下雜交:SEQIDN0:21的核苷酸64至261,SEQIDNO:13的多核苷酸1602至1700,或SEQIDNO:3的核苷酸49至159,或其全長互補物(Sambrook等,1989,見上文)。[0157]在另一個實施方案中,本發(fā)明涉及碳水化合物結合域,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:21的核苷酸64至261具有至少70%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在另一個實施方案中,本發(fā)明涉及碳水化合物結合域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:13的多核苷酸1602至1700具有至少71%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在另一個實施方案中,本發(fā)明涉及碳水化合物結合域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:3的核苷酸49至159具有至少90%,例如至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一丨f生。[0158]編碼所述碳水化合物結合域的多核苷酸優(yōu)選包含或組成為SEQIDN0:21的核苷酸64至261。編碼所述碳水化合物結合域的多核苷酸優(yōu)選包含或組成為SEQIDNO:13的多核苷酸1602至1700。編碼所述碳水化合物結合域的多核苷酸優(yōu)選包含或組成為SEQIDNO:3的核苷酸49至159。[0159]在另一個實施方案中,本發(fā)明涉及SEQIDN0:21的氨基酸64至261,SEQIDNO:13的氨基酸1602至1700,或SEQIDNO:3的氨基酸49至156在一個或多個(例如幾個)位置包含取代、缺失和/或插入的碳水化合物結合域變體。在一個方面,引入SEQIDNO:21的氨基酸64至261,SEQIDNO:13的氨基酸1602至1700,或SEQIDNO:3的氨基酸49至156的序列的氨基酸取代、缺失和/或插入數(shù)為最多達10,例如1、2、3、4、5、6、7、8、9或10。[0160]所述碳水化合物結合域可以可操作連接于催化域。所述催化域可得自水解酶、異構酶、連接酶、裂合酶、氧還酶或轉移酶,例如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、殼多糖酶、角質酶、環(huán)糊精糖基轉移酶、脫氧核糖核酸酶、內(nèi)切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、轉化酶、漆酶、脂肪酶、甘露糖苷酶、變聚糖酶、氧化酶、果膠分解酶、過氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶、木聚糖酶或木糖苷酶。編碼催化域的多肽可從任何原核、真核或其它來源獲得。[0161]多核苷酸[0162]本發(fā)明亦涉及編碼如本文中所述的本發(fā)明的多肽,催化域,或碳水化合物結合域的分離的多核苷酸。[0163]用于分離或克隆多核苷酸的技術在本領域中是已知的,并包括從基因組DNA或cDNA,或其組合分離??赏ㄟ^例如使用熟知的聚合酶鏈式反應(PCR)或表達文庫的抗體篩選來檢測具有共有結構特性的克隆DNA片段,從而實現(xiàn)從這種基因組DNA克隆多核苷酸。參見,例如,Innis等,1990,PCR:AGuidetoMethodsandApplicat1n,AcademicPress,NewYork。可以使用其它核酸擴增方法,如連接酶鏈式反應(LCR)、連接活化轉錄(ligatedactivatedtranscript1n;LAT)和基于多核苷酸的擴增(NASBA)??梢詮腃orynascus、Malbranchea、青霉屬、嗜熱子囊菌屬或Scytalidium的菌株,或相關生物體克隆所述多核苷酸,因此,例如可為所述多核苷酸的多肽編碼區(qū)的等位基因變體或種間變體(speciesvariant)。[0164]修飾編碼本發(fā)明多肽的多核苷酸對于合成與所述多肽基本上相似的多肽而言可能是必需的。術語與所述多肽“基本上相似”指多肽的非天然存在的形式。這些多肽可能以一些工程改造的方式而不同于從其天然來源分離的多肽,例如,比活性、熱穩(wěn)定性、最適pH等方面不同的變體??梢栽谧鳛镾EQIDNO:1的成熟多肽序列,SEQIDN0:3的成熟多肽序列,SEQIDNO:5的成熟多肽序列,SEQIDNO:7的成熟多肽編碼序列,SEQIDN0:9的成熟多肽編碼序列,SEQIDNO:11的成熟多肽編碼序列,SEQIDNO:13的成熟多肽編碼序列,SEQIDNO:15的成熟多肽編碼序列,SEQIDNO:17的成熟多肽編碼序列,SEQIDNO:19的成熟多肽編碼序列,SEQIDNO:21的成熟多肽編碼序列,或SEQIDNO:23的成熟多肽編碼序列,或其cDNA序列,或其亞序列呈現(xiàn)的多核苷酸的基礎上和/或通過引入如下核苷酸取代:所述取代不導致多肽氨基酸序列的改變,但是符合意欲產(chǎn)生酶的宿主生物體的密碼子用法;或者通過導入可產(chǎn)生不同的氨基酸序列的核苷酸取代來構建變體。關于核苷酸取代白勺概述,參見,例如,F(xiàn)ord等,1991,ProteinExpress1nandPurificat1n〗:95-107。[0165]核酸構建體[0166]本發(fā)明還涉及包含本發(fā)明的多核苷酸的核酸構建體,所述多核苷酸與一個或多個(例如幾個)調控序列可操作地連接,所述調控序列在合適的宿主細胞中在與該調控序列相容的條件下指導編碼序列的表達。[0167]可以用許多方式操作所述多核苷酸以便于多肽的表達。取決于表達載體,在將多核苷酸插入載體之前對其進行操作可能是理想的或必需的。使用重組DNA方法修飾多核苷酸的技術是本領域熟知的。[0168]調控序列可為啟動子,其由用于表達編碼本發(fā)明的多肽的多核苷酸的宿主細胞所識別的多核苷酸。啟動子含有介導多肽的表達的轉錄調控序列。啟動子可以是在宿主細胞中顯示轉錄活性的任何多核苷酸,包括突變的、截短的和雜合的啟動子,并且可以從編碼與宿主細胞同源或異源的胞外或胞內(nèi)多肽的基因獲得。[0169]用于在細菌宿主細胞中指導本發(fā)明的核酸構建體轉錄的合適啟動子的實例是從下述獲得的啟動子:解淀粉芽孢桿菌α-淀粉酶基因(amyQ)、地衣芽孢桿菌α-淀粉酶基因(amyL)、地衣芽孢桿菌青霉素酶基因(penP)、嗜熱脂肪芽孢桿菌產(chǎn)麥芽淀粉酶基因(amyM)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、枯草芽孢桿菌xylA和xylB基因、蘇云金芽抱桿菌cryIIIA基因(Agaisse和Lereclus,1994,MolecularMicrob1logy13:97-107)、大腸桿菌Iac操縱子、大腸桿菌trc啟動子(Egon等,1988,Gene69:301-315)、天藍鏈霉菌瓊脂糖酶基因(dagA)和原核β-內(nèi)酰胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNat1nalAcademyofSciencesUSA75:3727-3731),以及tac啟動子(DeBoer等,1983,Proc.Natl.Acad.Sc1.USA80:21-25)。另外的啟動子在"Usefulproteinsfromrecombinantbacteria"于Gilbert等,1980,ScientificAmerican,242:74-94中;和在Sambrook等,1989,見上文中描述。串聯(lián)啟動子的實例公開于TO99/43835。[0170]用于指導本發(fā)明的核酸構建體在絲狀真菌宿主細胞中轉錄的合適啟動子的實例是從下列酶的基因獲得的啟動子:構巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩(wěn)定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構酶、尖鐮孢胰蛋白酶樣蛋白酶(W096/00787)、鑲片鐮孢淀粉葡糖苷酶(W000/56900)、鑲片鐮孢Daria(W000/56900)、鑲片鐮孢Quinn(W000/56900)、曼赫根毛霉(Rhizomucormiehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶1、里氏木霉纖維二糖水解酶I1、里氏木霉內(nèi)切葡聚糖酶1、里氏木霉內(nèi)切葡聚糖酶I1、里氏木霉內(nèi)切葡聚糖酶II1、里氏木霉內(nèi)切葡聚糖酶V、里氏木霉木聚糖酶1、里氏木霉木聚糖酶I1、里氏木霉木聚糖酶II1、里氏木霉β-木糖苷酶、里氏木霉翻譯延伸因子,以及NA2_tpi啟動子(一種修飾的啟動子,其來自在曲霉屬中性α-淀粉酶基因,其中未翻譯的前導序列由曲霉屬丙糖磷酸異構酶的基因的未翻譯的前導序列所替代;非限制性實例包括修飾的啟動子,其來自黑曲霉中性α-淀粉酶的基因,其中未翻譯的前導序列由構巢曲霉或米曲霉丙糖磷酸異構酶的基因的未翻譯的前導序列所替代);和它們的突變的、截短的和雜合的啟動子。其它啟動子描述于美國專利號6,011,147。[0171]在酵母宿主中,有用的啟動子從如下的基因獲得:釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母半乳糖激酶(GALl)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1,ADH2/GAP)、釀酒酵母丙糖磷酸異構酶(TPI)、釀酒酵母金屬硫蛋白(CUPl)和釀酒酵母3-磷酸甘油酸激酶。對于酵母宿主細胞其它有用的啟動子由Romanos等,1992,Yeast8:423-488描述。[0172]調控序列也可以是轉錄終止子,其由宿主細胞識別以終止轉錄。所述終止子與編碼所述多肽的多核苷酸的3’末端可操作地連接。在本發(fā)明中,可使用在宿主細胞中有功能的任何終止子。[0173]對于細菌宿主細胞優(yōu)選的終止子從如下的基因獲得:克勞氏芽孢桿菌堿性蛋白酶(aprH)、地衣芽孢桿菌α-淀粉酶(amyL)和大腸桿菌核糖體RNA(rrnB)。[0174]對于絲狀真菌宿主細胞優(yōu)選的終止子從如下酶的基因獲得:構巢曲霉乙酰胺酶、構巢曲霉鄰氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖鐮孢胰蛋白酶樣蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶1、里氏木霉纖維二糖水解酶I1、里氏木霉內(nèi)切葡聚糖酶1、里氏木霉內(nèi)切葡聚糖酶I1、里氏木霉內(nèi)切葡聚糖酶II1、里氏木霉內(nèi)切葡聚糖酶V、里氏木霉木聚糖酶1、里氏木霉木聚糖酶I1、里氏木霉木聚糖酶II1、里氏木霉β-木糖苷酶和里氏木霉翻譯延伸因子。[0175]對于酵母宿主細胞優(yōu)選的終止子從如下酶的基因獲得:釀酒酵母烯醇化酶、釀酒酵母細胞色素C(CYCl)和釀酒酵母甘油醛-3-磷酸脫氫酶。對于酵母宿主細胞其它有用的終止子由Romanos等,1992,見上文描述。[0176]調控序列還可以是啟動子下游和基因的編碼序列上游的mRNA穩(wěn)定化區(qū),其增加所述基因的表達。[0177]合適的mRNA穩(wěn)定化區(qū)的實例從如下的基因獲得:蘇云金芽孢桿菌cryIIIA基因(W094/25612)和枯草芽抱桿菌SP82基因(Hue等,1995,JournalofBacter1logy177:3465-3471)。[0178]調控序列還可以是合適的前導序列,其為對于宿主細胞的翻譯重要的mRNA非翻譯區(qū)。前導序列可操作地連接于編碼多肽的多核苷酸的5’-末端。可使用在宿主細胞中有功能的任何前導序列。[0179]對于絲狀真菌宿主細胞優(yōu)選的前導序列從如下酶的基因獲得:米曲霉TAKA淀粉酶和構巢曲霉丙糖磷酸異構酶。[0180]對于酵母宿主細胞合適的前導序列從如下酶的基因獲得:釀酒酵母烯醇化酶(EN0-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)。[0181]調控序列也可以是聚腺苷酸化序列,其是與多核苷酸的3’末端可操作地連接的序列,并且在轉錄時,宿主細胞將其識別為將聚腺苷殘基添加至轉錄的mRNA的信號??墒褂迷谒拗骷毎杏泄δ艿娜魏尉巯佘账峄蛄?。[0182]對于絲狀真菌宿主細胞優(yōu)選的聚腺苷酸化序列從如下酶的基因獲得:構巢曲霉鄰氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖鐮孢胰蛋白酶樣蛋白酶。[0183]對于酵母宿主細胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Mol.CellularB1l.15:5983-5990描述。[0184]調控序列還可以是信號肽編碼區(qū),其編碼與多肽的N端相連的信號肽,并指導所述多肽進入細胞分泌途徑。多核苷酸的編碼序列5’端可固有地包含信號肽編碼序列,其與編碼所述多肽的編碼序列的區(qū)段一起天然地連接在翻譯閱讀框中?;蛘?,編碼序列5’端可含有對于所述編碼序列外源的信號肽編碼序列。當編碼序列天然不含有信號肽編碼序列時,外源信號肽編碼序列可能是必需的?;蛘?,可直接用外源信號肽編碼序列取代天然信號肽編碼序列以增強多肽的分泌。然而,可使用指導表達的多肽進入宿主細胞的分泌途徑的任何號妝編碼序列。[0185]對于細菌宿主細胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列:芽孢桿菌屬NCIB11837產(chǎn)麥芽糖淀粉酶、地衣芽孢桿菌枯草桿菌蛋白酶(subtilisin)、地衣芽孢桿菌內(nèi)酰胺酶、嗜熱脂肪芽孢桿菌α-淀粉酶、嗜熱脂肪芽孢桿菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢桿菌prsA。另外的信號肽由Simonen和Palva,1993,Microb1logicalReviews57:109-137描述。[0186]對于絲狀真菌宿主細胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特異腐質霉纖維素酶、特異腐質霉內(nèi)切葡聚糖酶V、疏棉狀腐質霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。[0187]對于酵母宿主細胞有用的信號肽從釀酒酵母α因子和釀酒酵母轉化酶的基因獲得。其它有用的信號肽編碼序列由Romanos等,1992,見上文描述。[0188]調控序列還可以是前肽編碼序列,其編碼位于多肽N端的前肽。所得多肽稱為酶原(proenzyme)或前多肽(propolypeptide)(或在某些情況下稱為酶原(zymogen))。前多肽通常是無活性的,并且能夠通過前肽的催化或自催化切割從前多肽轉化為活性多肽??梢詮目莶菅挎邨U菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、嗜熱毀絲霉漆酶(W095/33836)、曼赫根毛霉天冬氨酸蛋白酶和釀酒酵母α因子的基因獲得前肽編碼序列。[0189]當信號肽和前肽序列二者均存在時,將前肽序列置于緊接著(nextto)多肽的N端,并且將信號肽序列置于緊接著前肽序列的N端。[0190]同樣理想的是添加調節(jié)序列,其相對于宿主細胞的生長來調節(jié)多肽的表達。調節(jié)序列的實例是引起基因表達響應化學或物理刺激物,包括調節(jié)化合物的存在而開啟或關閉的那些系統(tǒng)。原核系統(tǒng)中的調節(jié)序列包括lac、tac和trp操縱基因系統(tǒng)。在酵母中,可使用ADH2系統(tǒng)或GALl系統(tǒng)。在絲狀真菌中,可以使用黑曲霉葡糖淀粉酶啟動子、米曲霉TAKAa-淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子、里氏木霉纖維二糖水解酶I啟動子和里氏木霉纖維二糖水解酶II啟動子。調節(jié)序列的其它實例是那些允許基因擴增的序列。在真核系統(tǒng)中,這些調節(jié)序列包括在氨甲蝶呤(methotrexate)存在下擴增的二氫葉酸還原酶基因,和以重金屬(withheavymetal)擴增的金屬硫蛋白基因。在這些情況下,編碼多肽的多核苷酸將與調節(jié)序列可操作地連接。[0191]表達載體[0192]本發(fā)明還涉及重組表達載體,所述重組表達載體包含本發(fā)明的多核苷酸、啟動子和轉錄和翻譯終止信號。多種核苷酸和調控序列可以結合在一起以產(chǎn)生重組表達載體,所述表達載體可以包括一個或多個(例如幾個)方便的限制位點以允許在這些位點插入或取代編碼多肽的多核苷酸?;蛘撸梢酝ㄟ^在適當?shù)挠糜诒磉_的載體中插入包含所述多核苷酸的核酸構建體或多核苷酸來表達所述多核苷酸。在制備表達載體的過程中,將編碼序列置于載體中,從而將該編碼序列與適當?shù)恼{控序列可操作地連接以供表達。[0193]重組表達載體可以是任何能夠方便地進行重組DNA步驟,并且能夠產(chǎn)生多核苷酸的表達的載體(例如,質?;虿《?。載體的選擇將通常依賴于載體與將引入該載體的宿主細胞的相容性。載體可以是線狀或閉合環(huán)狀質粒。[0194]載體可以是自主復制載體,即,作為染色體外實體(entity)存在的載體,其復制獨立于染色體復制,例如,質粒、染色體外元件、微型染色體(minichromosome)或人工染色體。載體可以含有任何用于確保自我復制的手段(means)?;蛘撸d體可以是一種當被引入宿主細胞中時,整合到基因組中并且與整合了該載體的染色體一起復制的載體。此外,可以使用單獨的載體或質?;騼蓚€或更多個載體或質粒,其共同含有待引入宿主細胞基因組的完整DNA(totalDNA),或可以使用轉座子(transposon)。[0195]所述載體優(yōu)選地含有一個或多個(例如幾個)選擇性標記,以便于容易地選擇經(jīng)轉化、轉染、轉導等的細胞。選擇性標記是這樣的基因,其產(chǎn)物提供殺生物劑或病毒抗性、對重金屬的抗性、對營養(yǎng)缺陷型的原養(yǎng)性(prototrophytoauxotrophs)等。[0196]細菌選擇性標記的實例是地衣芽孢桿菌或枯草芽孢桿菌dal基因,或賦予抗生素抗性的標記,所述抗生素抗性例如氨芐青霉素、氯霉素、卡那霉素、新霉素、壯觀霉素或四環(huán)素抗性。對于酵母宿主細胞合適的標記包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRPl和URA3。用于絲狀真菌宿主細胞的選擇性標記包括但不限于adeA(磷酸核糖氨基咪唑琥珀羧酉先胺合酶,phosphoribosylaminoimidazoIe-succinocarboxamidesynthase)>adeB(憐酸核糖氨基咪唑合酶,phosphoribosy1-aminoimidazoIesynthase)、amdS(乙酸胺酶)、argB(鳥氨酸氨甲?;D移酶)、bar(草銨膦(phosphinothricin)乙酰轉移酶)、hph(潮霉素磷酸轉移酶)、niaD(硝酸還原酶)(nitratereductase)、pyrG(乳清酸核苷_5’-磷酸脫羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺苷酸轉移酶)和trpC(鄰氨基苯甲酸合酶(anthranilatesynthase))以及它們的等同物。優(yōu)選用在曲霉屬細胞中的是構巢曲霉或米曲霉amdS和pyrG基因和吸水鏈霉菌(Streptomyceshygroscopicus)bar基因。優(yōu)選用于木霉屬細胞的是adeA、adeB、amdS、hph和pyrG基因。[0197]選擇性標記可為WO2010/039889中所述的雙重選擇性標記系統(tǒng)。在一個方面,所述雙重選擇性標記是ph-tk雙重選擇性標記系統(tǒng)。[0198]所述載體優(yōu)選含有允許載體整合入宿主細胞基因組或載體在細胞中獨立于基因組的自主復制的元件。[0199]為了整合入宿主細胞基因組,載體可依賴編碼多肽的多核苷酸的序列或用于通過同源或非同源重組整合入基因組的任何其它載體元件?;蛘撸d體可以含有用于指導通過同源重組整合入宿主細胞基因組染色體中的精確位置的額外的多核苷酸。為了增加在精確位置整合的可能性,整合元件應含有足夠數(shù)量的與相應的目標序列具有高度序列同一性的核酸,如100至10,000堿基對,400至10,000堿基對,和800至10,000堿基對,以提高同源重組的概率。整合元件可為任何與宿主細胞基因組中的目標序列同源的序列。此外,整合元件可為非編碼或編碼的多核苷酸。另一方面,可以將載體通過非同源重組整合到宿主細胞的基因組中。[0200]為了自主復制,載體可以還包含復制起點,其使載體能夠在所述的宿主細胞中自主地復制。復制起點可以是在細胞中發(fā)揮功能的介導自主復制的任何質粒復制子(replicator)。術語“復制起點”或“質粒復制子”意指能夠使質粒或載體體內(nèi)復制的多核苷酸。[0201]細菌復制起點的實例是允許在大腸桿菌中復制的質粒pBR322、pUC19、pACYC177和pACYC184的復制起點,和允許在芽孢桿菌屬中復制的質粒pUBllO、pE194、pTA1060和ρΑΜβI的復制起點。[0202]用于酵母宿主細胞中的復制起點的實例是2微米復制起點,ARS1,ARS4,ARSl和CEN3的組合,和ARS4和CEN6的組合。[0203]在絲狀真菌細胞中有用的復制起點的實例是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsRes.15:9163-9175;W000/24883)。分離AMAl基因和構建包含該基因的質?;蜉d體能夠根據(jù)公開于WO00/24883中的方法完成。[0204]可以將多于一個拷貝的本發(fā)明的多核苷酸插入宿主細胞以增加多肽的產(chǎn)生。多核苷酸拷貝數(shù)的增加可通過如下方法獲得:將至少一個額外拷貝的序列整合入宿主細胞基因組,或將可擴增的選擇性標記基因包括于多核苷酸,其中可通過在合適的選擇劑(selectableagent)存在下培養(yǎng)細胞來選擇含有選擇性標記基因的擴增拷貝,且由此含有多核苷酸的額外拷貝的細胞。[0205]用于連接上述元件以構建本發(fā)明的重組表達載體的方法是本領域技術人員熟知的(參見,例如,Sambrook等,1989,見上文)。[0206]宿主細胞[0207]本發(fā)明還涉及重組宿主細胞,其包含本發(fā)明的多核苷酸可操作地連接于一個或多個(例如幾個)指導本發(fā)明多肽的產(chǎn)生的調控序列。將包含多核苷酸的構建體或載體引入宿主細胞,使所述構建體或載體如前所述作為染色體整合體或者作為自我復制的染色體外載體維持。術語“宿主細胞”包括親本細胞的任何由于復制過程中發(fā)生的突變而不同于親本細胞的后代。宿主細胞的選擇將在很大程度上依賴于編碼多肽的基因及其來源。[0208]宿主細胞可以是在本發(fā)明的多肽的重組產(chǎn)生中有用的任何細胞,例如,原核或真核細胞。[0209]原核宿主細胞可以是任何革蘭氏陽性或革蘭氏陰性細菌。革蘭氏陽性細菌包括但不限于,芽孢桿菌屬、梭菌屬、腸球菌屬、地芽孢桿菌屬、乳桿菌屬、乳球菌屬、海洋芽孢桿菌屬、葡萄球菌屬、鏈球菌屬和鏈霉菌屬。革蘭氏陰性細菌包括但不限于,彎曲桿菌屬、大腸桿菌、黃桿菌屬、梭桿菌屬、螺桿菌屬、泥桿菌屬、奈瑟氏菌屬、假單胞菌屬、沙門氏菌屬和脲原體屬。[0210]細菌宿主細胞可以是任何芽孢桿菌屬細胞,包括但不限于嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、克勞氏芽孢桿菌、凝結芽孢桿菌、堅強芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌和蘇云金芽孢桿菌細胞。[0211]細菌宿主細胞還可以是任何鏈球菌屬細胞,包括但不限于,似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌和馬鏈球菌獸瘟亞種細胞。[0212]細菌宿主細胞還可以是任何鏈霉菌屬細胞,包括但不限于,不產(chǎn)色鏈霉菌、除蟲鏈霉菌、天藍鏈霉菌、灰色鏈霉菌和淺青紫鏈霉菌細胞。[0213]可通過如下方法實現(xiàn)將DNA引入到芽孢桿菌屬細胞:原生質體轉化(參見,例如,Chang和Cohen,1979,Mol.Gen.Genet.168:111-115),感受態(tài)細胞轉化(參見,例如,Young和Spizizen,1961,J.Bacter1l.81:823-829或Dubnau和Davidoff-Abelson,1971,J.Mol.B1l.56:209-221),電穿孔(參見,例如,Shigekawa和Dower,1988,B1techniques6:742-751)或接合(參見,例如,Koehler和Thorne,1987,J.Bacter1l.169:5771-5278)??赏ㄟ^如下方法實現(xiàn)將DNA引入到大腸桿菌細胞:原生質體轉化(參見,例如,Hanahan,1983,J.Mol.B1l.166:557-580)或電穿孔(參見,例如,Dower等,1988,NucleicAcidsRes.16:6127-6145)??赏ㄟ^如下方法實現(xiàn)將DNA引入到鏈霉菌屬細胞:原生質體轉化,電穿孔(參見,例如,Gong等,2004,F(xiàn)oliaMicrob1l.(Praha)49:399-405),接合(參見,例如,Mazodier等,1989,J.Bacter1l.171:3583-3585),或轉導(參見,例如,Burke等,2001,Proc.Natl.Acad.Sc1.USA98:6289-6294)??赏ㄟ^如下方法實現(xiàn)將DNA引入到假單胞菌屬細胞:電穿孔(參見,例如,Choi等,2006,J.Microb1l.Methods64:391-397)或接合(參見,例如,Pinedo和Smets,2005,Appl.Environ.Microb1l.71:51-57)??赏ㄟ^如下方法實現(xiàn)將DNA引入到鏈球菌屬細胞:天然感受態(tài)(naturalcompetence)(參見,例如,Perry和Kuramitsu,1981,Infect.Tmmun.32:1295-1297),原生質體轉化(參見,例如,Catt和Jollick,1991,Microb1s.68:189-207),電穿孔(參見,例如,Buckley等,1999,Appl.Environ.Microb1l.65:3800-3804)或接合(參見,例如,Clewell,1981,Microb1l.Rev.45:409-436)。然而,可使用本領域已知的將DNA引入宿主細胞的任何方法。[0214]宿主細胞還可為真核生物,如哺乳動物、昆蟲、植物或真菌細胞。[0215]宿主細胞可為真菌細胞?!罢婢庇迷诒疚陌ㄒ韵麻T:子囊菌門(Ascomycota)、擔子菌門(Basid1mycota)、壺菌門(Chytrid1mycota)和接合菌門(Zygomycota)以及卵菌門(Oomycota)和所有有絲分裂抱子真菌(mitosporicfungi)(如由Hawksworth等,于AinsworthandBisbyjsDict1naryofTheFungi,第8版,1995,CABInternat1nal,UniversityPress,Cambridge,UK中所定義)。[0216]真菌宿主細胞可為酵母細胞?!敖湍浮庇迷诒疚陌óa(chǎn)子囊酵母(ascospOTogenousyeast)(內(nèi)抱霉目(Endomycetales))、產(chǎn)擔子酵母(basid1sporogenousyeast)和屬于半知菌類(FungiImperfecti)(芽孢綱(Blastomycetes))的酵母。由于酵母的分類在未來可能改變,就本發(fā)明而言,將酵母定義為如B1logyandActivitiesofYeast(Skinner,Passmore,和Davenport編,Soc.App.Bacter1l.SymposiumSeriesN0.9,1980)中所述。[0217]酵母宿主細胞可為假絲酵母屬、漢遜酵母屬(Hansenula)、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬細胞,如乳酸克魯維酵母(Kluyveromyceslactis)、卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母、卵形酵母、或解脂西洋蓍霉(YarrowiaIipolytica)細胞。[0218]真菌宿主細胞可為絲狀真菌細胞?!敖z狀真菌”包括真菌門(Eumycota)和卵菌門的亞門(如由Hawksworth等,1995,見上文,所定義)的所有絲狀形式。絲狀真菌通常的特征在于由殼多糖(chitin)、纖維素、葡聚糖、殼聚糖(chitosan)、甘露聚糖和其它復雜多糖構成的菌絲體壁。通過菌絲延伸進行營養(yǎng)生長,而碳分解代謝是專性需氧的。相反,酵母例如釀酒酵母的營養(yǎng)生長通過單細胞菌體的出芽生殖(budding)進行,而碳分解代謝可以是發(fā)酵性的。[0219]絲狀真菌宿主細胞可為枝頂孢霉屬、曲霉屬、短梗霉屬、煙管霉屬(Bjerkandera)、擬臘菌屬、金孢子菌屬、鬼傘屬(Coprinus)、革蓋菌屬(Cor1lus)、隱球菌屬、FiIibasidium、鐮孢屬、腐質霉屬、梨孢菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬(Phanerochaete)、射脈菌屬(Phlebia)、瘤胃壺菌屬、側耳屬(Pleurotus)、裂裙菌屬、踝節(jié)菌屬、嗜熱子囊菌屬、梭孢霉屬、彎頸霉屬、栓菌屬(Trametes)或木霉屬細胞。[0220]例如,絲狀真菌宿主細胞可為泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構巢曲霉、黑曲霉、米曲霉、黑刺煙管菌(Bjerkanderaadusta)、干擬臘菌(Ceripor1psisaneirina)、Ceripor1psiscaregiea、Ceripor1psisgilvescens、Ceripor1psispannocinta、Ceripor1psisrivulosa、Ceripor1psissubrufa、蟲擬錯菌(Ceripor1psissubvermispora)、Chrysosporiuminops、嗜角質金抱子菌、Chrysosporiumlucknowense、Chrysosporiummerdarium、租金抱子菌、Chrysosporiumqueenslandicum、熱帶金抱子菌、Chrysosporiumzonatum、灰蓋鬼傘(Coprinuscinereus)、毛革蓋菌(Cor1lushirsutus)、桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢、鑲片鐮孢、特異腐質霉、疏棉狀腐質霉、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、產(chǎn)紫青霉、黃孢平革菌(Phanerochaetechrysosporium)、福射射脈菌(Phlebiaradiata)、剌序側耳(Pleurotuseryngii)、土生梭孢霉、長域毛栓菌(Trametesvillosa)、變色栓菌(Trametesversicolor)、哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉細胞。[0221]可以將真菌細胞通過涉及原生質體形成、原生質體轉化和細胞壁再生的方法以本身公知的方式轉化。用于轉化曲霉屬和木霉屬宿主細胞的合適方法在EP238023和Yelton等,1984,Proc.Natl.Acad.Sc1.USA81:1470-1474以及Christensen等,1988,B1/Technology6:1419-1422中描述。用于轉化鐮孢屬菌種的合適方法由Malardier等,1989,Gene78:147-156和WO96/00787描述??梢允褂糜扇缦挛墨I描述的方法轉化酵母:Becker矛口Guarente,于AbelsonjJ.N.矛口Simon,Μ.1.編,GuidetoYeastGeneticsandMolecularB1logy,MethodsinEnzymologyjVolume194,pp182—187,AcademicPress,Inc.,NewYork;Ito等,1983,J.Bacter1l.153:163;和Hinnen等,1978,Proc.Natl.Acad.Sc1.USA75:1920。[0222]產(chǎn)生方法[0223]本發(fā)明還涉及用于產(chǎn)生本發(fā)明多肽的方法,其包括:(a)在有助于產(chǎn)生多肽的條件下培養(yǎng)細胞,所述細胞以其野生型形式產(chǎn)生所述多肽;和任選地(b)回收所述多肽。在另一個方面,所述多肽是Corynascus多肽。在另一個方面,所述多肽是Corynascusthermophilus多妝。在另一個方面,所述多妝是CorynascusthermophilusNN000308多肽。在另一個方面,所述多肽是Malbranchea多肽。在另一個方面,所述多肽是Malbrancheacinnamomea多肽。在另一個方面,所述多肽是MalbrancheacinnamomeaNN044758多肽。在另一個方面,所述多肽是青霉屬多肽。在另一個方面,所述多肽是草酸青霉多肽。在另一個方面,所述多肽是草酸青霉NN051380多肽。在另一個方面,所述多肽是Penicilliumemersonii多妝。在另一個方面,所述多妝是PenicilliumemersoniiNN051602多妝。在另一個方面,所述多肽是嗜熱子囊菌屬多肽。在另一個方面,所述多肽是桔橙嗜熱子囊菌多肽。在另一個方面,所述多肽是桔橙嗜熱子囊菌NN044936多肽。在另一個方面,所述多肽是Scytalidium多肽。在另一個方面,所述多肽是Scytalidiumthermophilum多肽。在另一個方面,所述多妝是ScytalidiumthermophilumNN047338多妝。[0224]本發(fā)明還涉及用于產(chǎn)生本發(fā)明的多肽的方法,其包括:(a)在有助于產(chǎn)生多肽的條件下培養(yǎng)本發(fā)明的重組宿主細胞;和任選地(b)回收所述多肽。[0225]所述宿主細胞使用本領域已知的方法在適合于產(chǎn)生所述多肽的營養(yǎng)培養(yǎng)基中培養(yǎng)。例如,可以通過在合適培養(yǎng)基中和允許表達和/或分離所述多肽的條件下的搖瓶培養(yǎng),或實驗室或工業(yè)發(fā)酵罐中的小規(guī)?;虼笠?guī)模發(fā)酵(包括連續(xù)、分批、補料分批或固態(tài)發(fā)酵)來培養(yǎng)細胞。使用本領域已知的方法在合適的營養(yǎng)培養(yǎng)基中進行培養(yǎng),所述營養(yǎng)培養(yǎng)基包含碳源和氮源和無機鹽。合適的培養(yǎng)基能夠從商業(yè)供應商獲得或可以根據(jù)公開的組成制備(例如,在美國典型培養(yǎng)物保藏中心的目錄中)。如果多肽分泌到營養(yǎng)培養(yǎng)基中,該多肽可以從所述培養(yǎng)基中直接回收。如果多肽不分泌,其可以從細胞裂解物(lysate)回收。[0226]可以使用本領域已知的對于所述多肽特異性的方法來檢測多肽。這些檢測方法包括但不限于特異性抗體的使用、酶產(chǎn)物的形成或酶底物的消失。例如,酶測定法(enzymeassay)可用于確定多肽的活性。[0227]多肽可以使用本領域已知的方法回收。例如,多肽可以通過常規(guī)方法從營養(yǎng)培養(yǎng)基中回收,所述常規(guī)方法包括但不限于收集、離心、過濾、提取、噴霧干燥、蒸發(fā)或沉淀。在一個方面,回收了包含多肽的全發(fā)酵液。[0228]多肽可以通過多種本領域已知的方法純化以獲得基本上純的多肽,所述方法包括但不限于層析(例如,離子交換、親和、疏水、層析聚焦和大小排阻)、電泳方法(例如,制備型(preparative)等電聚焦)、差示溶解度(例如,硫酸銨沉淀)、SDS_PAGE或提取(參見,例如,ProteinPurificat1n,Janson和Ryden編,VCHPublishers,NewYork,1989)。[0229]在另一個方面,不回收多肽,而是使用表達所述多肽的本發(fā)明的宿主細胞作為所述多肽的來源。[0230]植物[0231]本發(fā)明還涉及分離的植物,例如,轉基因植物、植物部分或植物細胞,其包含本發(fā)明的多核苷酸,從而以可回收的量表達和產(chǎn)生所述多肽或域。多肽或域可從植物或植物部分回收?;蛘撸梢园丛瓨?assuch)將含有該多肽或域的植物或植物部分用于改進食品或飼料的質量,例如,改進營養(yǎng)價值、適口性(palatability)和流變性質(rheologicalproperties),或用于破壞抗營養(yǎng)因子。[0232]轉基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉植物的實例是草(grasses),如草地早熟禾(meadowgrass)(藍草(bluegrass),早熟禾屬(Poa));飼用牧草(foragegrass)如羊茅屬(Festuca)、黑麥草屬(Lolium);寒地型牧草(temperategrass),如Agrostis(翦股穎屬);和谷類,例如,小麥、燕麥、黑麥、大麥、稻(rice)、高粱和玉蜀黍(maize)(玉米)。[0233]雙子葉植物的實例是煙草(tobacco),豆類(legumes),如羽扇豆(lupins),馬鈴薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜桿(rapeseed)和緊密相關的模型生物體擬南芥(Arabidopsisthaliana)。[0234]植物部分的實例是莖(stem)、愈傷組織(callus)、葉(leaf)、根(root)、果實(fruit)、種子(seed)和塊莖(tuber),以及包含這些部分的獨立組織,例如,表皮(epidermis)、葉肉(mesophyll)、薄壁組織(parenchyme)、維管組織(vasculartissue)、分生組織(meristem)。具體的植物細胞區(qū)室(compartments),如葉綠體(chloroplast)、質外體(apoplast)、線粒體(mitochondria)、液泡(vacuole)、過氧化物酶體(peroxisome)和細胞質(cytoplasm)也被認為是植物部分。此外,任何植物細胞,無論什么組織來源,都被認為是植物部分。同樣地,植物部分,如被分離用來促進本發(fā)明的應用的具體組織和細胞也被認為是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和種皮(seedcoat)。[0235]同樣包含于本發(fā)明范圍內(nèi)的還有這些植物、植物部分和植物細胞的后代。[0236]表達多肽或域的轉基因植物或植物細胞可以依照本領域已知方法構建。簡而言之,通過如下方法構建所述植物或植物細胞:將編碼多肽或域的一個或多個表達構建體導入植物宿主基因組或葉綠體基因組,并且將所得的經(jīng)修飾的植物或植物細胞繁殖為轉基因植物或植物細胞。[0237]表達構建體便利地是包含編碼多肽或域的多核苷酸的核酸構建體,所述多核苷酸與在選擇的植物或植物部分中表達該多核苷酸所需的適當?shù)恼{節(jié)序列可操作地連接。此外,表達構建體可以包含對于鑒定植物細胞有用的選擇性標記,在所述植物細胞中整合了表達構建體和將該構建體引入到所述植物中所必需的DNA序列(后者依賴于使用的DNA引入方法)。[0238]調節(jié)序列的選擇,例如啟動子和終止子序列和任選地信號或轉運序列的選擇,舉例來說,基于期望何時、何處以及如何表達多肽或域而確定。例如,編碼多肽或域的基因的表達可以是組成型的或誘導型的,或可以是發(fā)育、階段或組織特異性的,并且基因產(chǎn)物可以祀向特定的組織或植物部分如種子或葉。調節(jié)序列由例如Tague等,1988,PlantPhys1logy86:506所述。[0239]對于組成性表達,可以使用35S_CaMV、玉米泛素I或稻肌動蛋白I啟動子(Franck等,1980,Cell21:285-294,Christensen等,1992,PlantM0.B1l.18:675-689;Zhang等,1991,PlantCell3:1155-1165)。器官特異性啟動子可以是例如來自貯藏庫組織(storagesinktissue)例如種子、馬鈴薯塊莖和果實的啟動子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303),或來自代謝庫組織(metabolicsinktissue)例如分生組織的啟動子(Ito等,1994,PlantMol.B1l.24:863-878),種子特異性啟動子諸如來自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)啟動子(Wu等,1998,PlantCellPhys1l.39:885-889),來自豆球蛋白(Iegumin)B4和蠶豆(Viciafaba)的未知的種子蛋白基因的蠶豆啟動子(Conrad等,1998,J.PlantPhys1l.152:708-711)、來自種子油體蛋白(oilbodyprotein)的啟動子(Chen等,1998,PlantCellPhys1l.39:935-941),來自歐洲油菜(Brassicanapus)的忙藏蛋白napA啟動子,或本【
技術領域:
】公知的任何其他種子特異性的啟動子,例如,在WO91/14772中所描述的。此外,啟動子可為葉特異性的啟動子,如來自稻或番爺?shù)膔bcs啟動子(Kyozuka等,1993,PlantPhys1l.102:991-1000),小球藻病毒(chlorellavirus)腺嘌呤甲基轉移酶(adeninemethyltransferase)基因啟動子(Mitra和Higgins,1994,PlantMol.B1l.26:85-93),來自稻的aldP基因啟動子(Kagaya等,1995,Mol.Gen.Genet.248:668-674),或傷口誘導的啟動子,如馬鈴薯pin2啟動子(Xu等,1993,PlantMol.B1l.22:573-588)。同樣地,所述啟動子可通過非生物的處理誘導,所述非生物的處理諸如溫度、干旱或鹽度變化,或通過外源施加的激活所述啟動子的物質誘導,例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脫落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金屬。[0240]啟動子增強子元件也可以用于實現(xiàn)多肽或域在植物中的較高表達。例如,啟動子增強子元件可以是內(nèi)含子,其置于啟動子和編碼多肽或域的多核苷酸之間。例如Xu等,1993,見上,公開了使用稻肌動蛋白I基因的第一內(nèi)含子以增強表達。[0241]選擇性標記基因和表達構建體的任何其它部分可以選自本領域內(nèi)可用的那些。[0242]將核酸構建體根據(jù)本領域已知的常規(guī)技術導入植物基因組,所述常規(guī)技術包括土壤桿菌屬(Agrobacterium)介導的轉化、病毒介導的轉化、顯微注射(microinject1n)、粒子轟擊、生物射彈轉化和電穿孔(Gasser等,1990,Science244:1293;Potrykus,1990,B1/Technology8:535;Shimamoto等,1989,Nature338:274)。[0243]根癌土壤桿菌(Agrobacteriumtumefaciens)介導的基因轉移(genetransfer),是一種產(chǎn)生轉基因雙子葉植物(其綜述,參見Hooykas和Schilperoort,1992,PlantMol.B1l.19:15-38),和用于轉化單子葉植物的方法,雖然對于這些植物可使用其他的轉化方法。一種產(chǎn)生轉基因單子葉植物的方法是用粒子(用轉化DNA涂覆的微觀的金或鶴粒子)轟擊胚愈傷組織(embryoniccalli)或發(fā)育中的胚(developingembryos)(Christou,1992,PlantJ.2:275-281;Shimamoto,1994,Curr.0pin.B1technol.5:158-162;Vasil等,1992,B1/Technology10:667-674)。轉化單子葉植物的一種替代方法是基于原生質體轉化,如由Omirulleh等,1993,PlantMol.B1l.21:415-428所描述的。其它轉化方法包括描述于美國專利號6,395,966和7,151,204中的那些(兩者均通過提述以其整體并入本文)。[0244]轉化之后,根據(jù)本領域熟知的方法選擇具有導入的表達構建體的轉化體并且再生成為完整植物。通常設計轉化方法用于通過如下方法在再生期間或在后續(xù)世代中選擇性消除選擇基因:例如,使用帶有兩個獨立的T-DNA構建體的共轉化或通過特異性重組酶位點特異性地切除選擇基因。[0245]除了直接用本發(fā)明的構建體直接轉化具體植物基因型之外,還可通過將具有構建體的植物與缺乏該構建體的第二植物雜交來制備轉基因植物。舉例而言,可將編碼多肽或域的構建體通過雜交而引入特定植物品種,而根本無需直接轉化該給定品種的植物。因此,本發(fā)明不僅涵蓋從依照本發(fā)明經(jīng)轉化的細胞直接再生的植物,還包括此類植物的后代(progeny)。如用于本文的,后代可指依照本發(fā)明制備的親本植物任何世代的后裔(offspring)0此種后代可包含依據(jù)本發(fā)明制備的DNA構建體。雜交導致轉基因通過將起始種系供體植物種系交叉授粉而引入植物種系。此類步驟的非限制性實例描述于美國專利號7,151,204。[0246]植物通過回交轉化方法生成。舉例而言,該植物包括稱作回交轉化的基因型、種系、近交體(inbred)或雜交體(hybrid)的植物。[0247]可使用遺傳標記以協(xié)助本發(fā)明的一種或多種轉基因從一個遺傳背景基因滲入(introgress1n)至另一個。標記協(xié)助的選擇提供了相對于常規(guī)育種的優(yōu)勢,在于其可用于避免由表型變異導致的錯誤。進一步,遺傳標記可在特定雜交的個體后代中提供有關良種種質相對程度的數(shù)據(jù)。舉例而言,當本不(otherwise)具有非農(nóng)藝學所需的遺傳背景但具有所需性狀的植物與良種親本雜交時,可使用遺傳標記來選擇不僅具有目標性狀,還具有相對較大比例的所需種質的后代。以此方式,使一種或多種性狀基因滲入特定遺傳背景所需的世代數(shù)得到最小化。[0248]本發(fā)明亦涉及產(chǎn)生本發(fā)明的多肽或域的方法,其包括:(a)在有助于產(chǎn)生所述多肽或域的條件下培養(yǎng)轉基因植物或植物細胞,所述植物或植物細胞包含編碼多肽或域的多核苷酸;和任選地(b)回收所述多肽或域。[0249]去除或減少內(nèi)切葡聚糖酶活性[0250]本發(fā)明還涉及用于產(chǎn)生親本細胞突變體的方法,其包括破壞或缺失編碼本發(fā)明的多肽的多核苷酸或其部分,所述方法導致在相同條件下培養(yǎng)時,與親本細胞相比突變的細胞產(chǎn)生較少的所述多肽。[0251]可以使用本領域熟知的方法(例如,插入、破壞、替代或缺失)通過減少或消除多核苷酸的表達來構建突變細胞。在一個優(yōu)選的方面,所述多核苷酸是失活的。待修飾或失活的多核苷酸可以是,例如,編碼區(qū)或其對活性關鍵的部分,或表達編碼區(qū)所需的調節(jié)元件。這種調節(jié)或調控序列的實例可以是啟動子序列或其功能部分,即,足以影響多核苷酸表達的部分。用于可能的修飾的其它調控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、信號肽序列、轉錄終止子和轉錄激活子。[0252]可以通過向親本細胞施以誘變,并且選擇其中已將多核苷酸的表達減少或消除的突變細胞來進行多核苷酸的修飾或失活。誘變可能是特異性的或隨機的,可以通過例如使用合適的物理或化學誘變劑進行,通過使用合適的寡核苷酸進行,或通過將所述DNA序列進行PCR產(chǎn)生的誘變。此外,可以通過使用這些誘變劑的任何組合來進行誘變。[0253]適合于本發(fā)明目的的物理或化學誘變劑的實例包括紫外線(UV)照射、羥胺、N-甲基-N’-硝基-N-亞硝基胍(MNNG)、0-甲基羥胺、亞硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亞硫酸氫鈉、甲酸和核苷酸類似物。[0254]當使用這些試劑時,通常通過如下方法來進行所述誘變:在合適條件下存在選定的誘變劑時溫育待誘變的親本細胞,并篩選和/或選擇顯示基因表達減少的或無基因表達的突變體細胞。[0255]多核苷酸的修飾或失活也可以通過插入、取代或缺失基因中的一個或多個核苷酸或其轉錄或翻譯所需的調控元件實現(xiàn)。例如,可以插入或去除核苷酸從而導致引入終止密碼子,去除起始密碼子,或改變開讀框。按照本領域已知的方法通過定位誘變或PCR產(chǎn)生的誘變可以實現(xiàn)這種修飾或失活。盡管在理論上所述修飾可以在體內(nèi)進行,即,直接在表達待修飾的多核苷酸的細胞上進行,但優(yōu)選如下面所示例的那樣在體外進行所述修飾。[0256]消除或減少多核苷酸表達的便利方式的例子有基于基因取代,基因缺失,或基因破壞的技術。例如,在基因破壞方法中,將相應于內(nèi)源多核苷酸的核酸序列在體外進行誘變以產(chǎn)生缺陷性的核酸序列,然后將其轉化入親本細胞中以產(chǎn)生缺陷基因。通過同源重組,所述缺陷性核酸序列替代了內(nèi)源性多核苷酸。可能理想的是所述缺陷性多核苷酸還編碼標記,其可用于選擇其中多核苷酸被修飾或破壞的轉化子。在一個方面,用可選擇的標記(如本文所述的那些)來破壞所述多核苷酸。[0257]本發(fā)明亦涉及在細胞中抑制具有內(nèi)切葡聚糖酶活性的多肽的表達的方法,其包括向細胞施用或在細胞中表達雙鏈RNA(dsRNA)分子,其中所述dsRNA包含本發(fā)明的多核苷酸的亞序列。在一個優(yōu)選的方面,所述dsRNA長度為約15、16、17、18、19、20、21、22、23、24、25或更多個雙鏈體核苷酸。[0258]所述dsRNA優(yōu)選為小干擾RNA(siRNA)或微RNA(miRNA)。在一個優(yōu)選的方面,所述dsRNA是用于抑制轉錄的小干擾RNA。在另一個優(yōu)選的方面,所述dsRNA是用于抑制翻譯的微RNA。[0259]本發(fā)明亦涉及這樣的雙鏈RNA(dsRNA)分子,其包含SEQIDNO:1的成熟多肽編碼序列的一部分,SEQIDNO:3的成熟多肽編碼序列的一部分,或SEQIDNO:5的成熟多肽編碼序列的一部分,以供在細胞中抑制所述多肽的表達。盡管本發(fā)明并不受任何具體作用機制的限制,但所述dsRNA可進入細胞并導致類似或相同序列的單鏈RNA(ssRNA),包括內(nèi)源mRNA的降解。當細胞暴露于dsRNA時,來自同源基因的mRNA通過稱為RNA干擾(RNAi)的過程受選擇性降解。[0260]本發(fā)明的dsRNA可用于基因沉默。在一個方面,本發(fā)明提供了使用本發(fā)明的dsRNAi選擇性降解RNA的方法。該方法可在體外、離體或體內(nèi)實施。在一個方面,所述dsRNA分子可用于在細胞、器官或動物中生成功能喪失的突變。用于制備和使用dsRNA分子選擇性降解RNA的方法是本領域中公知的,參見,例如美國專利號6,489,127;6,506,559;6,511,824;和6,515,109。[0261]本發(fā)明進一步涉及親本細胞的突變體細胞,其包含編碼多肽的多核苷酸或其調控序列的破壞或缺失或編碼所述多肽的基因的沉默,這導致與親本細胞相比突變體細胞產(chǎn)生更少的多肽或不產(chǎn)生多肽。[0262]多肽缺陷型突變細胞作為表達天然和異源多肽的宿主細胞特別有用。所以,本發(fā)明進一步涉及生產(chǎn)天然或異源多肽的方法,其包括:(a)在有助于生產(chǎn)多肽的條件下培養(yǎng)突變細胞;和任選地(b)回收所述多肽。術語“異源多肽”意指對宿主細胞不是天然的多肽,例如,天然蛋白的變體。宿主細胞可包含超過一個拷貝的編碼所述天然或異源多肽的多核苷酸。[0263]用于培養(yǎng)和純化感興趣的產(chǎn)物的方法可以通過本領域已知的方法進行。[0264]本發(fā)明用于產(chǎn)生基本上無內(nèi)切葡聚糖酶活性的產(chǎn)物的方法在真核多肽,特別是真菌蛋白質例如酶的產(chǎn)生中是特別令人有興趣的。內(nèi)切葡聚糖酶活性缺陷細胞也可以用于表達在制藥上有意義的異源蛋白質例如激素、生長因子、受體等。術語“真核多肽”不僅包括天然多肽,也包括通過氨基酸取代、缺失或添加或其它這樣的修飾而被修飾以增強了活性、熱穩(wěn)定性、pH耐受性等的多肽,例如酶。[0265]在其他方面,本發(fā)明涉及基本上無內(nèi)切葡聚糖酶活性的蛋白質產(chǎn)物,其通過本發(fā)明的方法產(chǎn)生。[0266]發(fā)酵液配制物或細胞組合物[0267]本發(fā)明亦涉及發(fā)酵液配制物和細胞組合物,其包含本發(fā)明的多肽。所述發(fā)酵液產(chǎn)物進一步包含用于發(fā)酵工藝的其它成分,例如細胞(包括含有編碼本發(fā)明的多肽的基因的宿主細胞,其用于產(chǎn)生感興趣的多肽),細胞碎片,生物質,發(fā)酵培養(yǎng)基和/或發(fā)酵產(chǎn)物。在一些實施方案中,所述組合物是含有機酸的已殺滅細胞的全培養(yǎng)液,已被殺滅的細胞和/或細胞碎片,以及培養(yǎng)基。[0268]術語“發(fā)酵液(fermentat1nbroth)”用于本文中指由細胞發(fā)酵產(chǎn)生、不經(jīng)歷或僅經(jīng)歷最低限的回收和/或純化的制備物。舉例而言,當將微生物培養(yǎng)物生長至飽和,在限制碳的條件下溫育以允許蛋白合成(例如由宿主細胞表達酶),并分泌入細胞培養(yǎng)基時,產(chǎn)生發(fā)酵液。所述發(fā)酵液可含有在發(fā)酵終止時得到的發(fā)酵材料的未分級或分級的內(nèi)含物。通常而言,發(fā)酵液是未分級的,并包含去除(例如通過離心)微生物細胞(例如絲狀真菌細胞)之后存在的用過的培養(yǎng)基以及細胞碎片。在一些實施方案中,所述發(fā)酵液含有用過的細胞培養(yǎng)基,胞外酶,和能成活的和/或不能成活的(viableand/ornonviable)微生物細胞。[0269]在一個實施方案中,所述發(fā)酵液配制物和細胞組合物包含第一有機酸組分和第二有機酸組分,所述第一有機酸組分包含至少一種1-5碳的有機酸和/或其鹽,而所述第二有機酸組分包含至少一種6個或更多個碳的有機酸和/或其鹽。在一個具體實施方案中,所述第一有機酸組分是乙酸、甲酸、丙酸、它們的鹽,或前述兩種或更多種的混合物,而所述第二有機酸組分是苯甲酸、環(huán)己烷羧酸、4-甲基戊酸、苯乙酸、它們的鹽,或前述兩種或更多種的混合物。[0270]在一個方面,所述組合物含有有機酸,并任選地進一步含有已被殺滅的細胞和/或細胞碎片。在一個實施方案中,從已殺滅細胞的全培養(yǎng)液中移除所述已被殺滅的細胞和/或細胞碎片以提供不含這些組分的組合物。[0271]所述發(fā)酵液配制物或細胞組合物可進一步包含防腐劑和/或抗微生物(例如抑菌)劑,包括但不限于山梨醇、氯化鈉、山梨酸鉀和其它本領域中已知的。[0272]所述發(fā)酵液配制物或細胞組合物可進一步包含多種酶活性,如一種或多種(例如幾種)選自下組的酶:纖維素酶、具有纖維素分解增強活性的GH61多肽、半纖維素酶、酯酶、棒曲霉素、漆酶、木質素分解酶、果膠酶、過氧化物酶、蛋白酶和膨脹素。所述發(fā)酵液配制物或細胞組合物亦可包含一種或多種(例如幾種)選自下組的酶:水解酶、異構酶、連接酶、裂合酶、氧還酶或轉移酶,例如α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、葡糖苷酶、木糖苷酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、殼多糖酶、角質酶、環(huán)糊精糖基轉移酶、脫氧核糖核酸酶、內(nèi)切葡聚糖酶、酯酶、葡糖淀粉酶、轉化酶、漆酶、脂肪酶、甘露糖苷酶、變聚糖酶、氧化酶、果膠分解酶、過氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶或木聚糖酶。[0273]所述已殺滅細胞的全培養(yǎng)液或組合物可含有在發(fā)酵終止時得到的發(fā)酵材料的未分級內(nèi)含物。通常而言,所述已殺滅細胞的全培養(yǎng)液或組合物含有在將微生物細胞(例如絲狀真菌細胞)生長至飽和,并在限制碳的條件下溫育以允許蛋白合成(例如,表達纖維素酶和葡糖苷酶)之后存在用過的培養(yǎng)基以及細胞碎片。在一些實施方案中,所述已殺滅細胞的全培養(yǎng)液或組合物含有用過的細胞培養(yǎng)基,胞外酶,和已被殺滅的絲狀真菌細胞。在一些實施方案中,在已殺滅細胞的全培養(yǎng)液或組合物中存在的微生物細胞可使用本領域中已知的方法滲透和/或裂解。[0274]如本文中所述的全培養(yǎng)液或細胞組合物通常為液體,但可含有不溶性組分,如已被殺滅的細胞、細胞碎片、培養(yǎng)基組分和/或不溶性酶。在一些實施方案中,可去除不溶性組分以提供澄清的液體組合物。[0275]本發(fā)明的全培養(yǎng)液配制物和細胞組合物可通過WO90/15861或WO2010/096673中描述的方法來產(chǎn)生。[0276]下文給出了本發(fā)明的組合物的優(yōu)選用途的實施例。所述組合物的劑量和組合物使用的其它條件可基于本領域已知方法決定。[0277]酶組合物[0278]本發(fā)明還涉及包含本發(fā)明的多肽的組合物。優(yōu)選地,所述組合物是富集了此種多肽的。術語“富集了”表明所述組合物的內(nèi)切葡聚糖酶活性以例如至少1.1的富集因子增加。[0279]所述組合物可包含本發(fā)明的多肽作為主要酶組分,例如單組分組合物?;蛘?,所述組合物可包含多種酶活性,如選自下組的一種或多種(例如幾種)酶:纖維素酶、具有纖維素分解增強活性的GH61多肽、半纖維素酶、酯酶、棒曲霉素、漆酶、木質素分解酶、果膠酶、過氧化物酶、蛋白酶和膨脹素。所述發(fā)組合物亦可包含一種或多種(例如幾種)選自下組的酶:水解酶,異構酶,連接酶,裂合酶,氧還酶或轉移酶,例如α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、半乳糖苷酶、葡糖苷酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、殼多糖酶、角質酶、環(huán)糊精糖基轉移酶、脫氧核糖核酸酶、內(nèi)切葡聚糖酶、酯酶、葡糖淀粉酶、轉化酶、漆酶、脂肪酶、甘露糖苷酶、變聚糖酶、氧化酶、果膠分解酶、過氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶、或木聚糖酶。所述組合物可依照本領域中已知的方法制備,并可為液體或干組合物的形式。所述組合物可依照本領域中已知的方法穩(wěn)定化。[0280]下文中給出本發(fā)明的組合物的優(yōu)選用途的實例。組合物的劑量和組合物使用的其它條件可給予本領域已知的方法來確定。[0281]用途[0282]本發(fā)明還涉及下述使用具有內(nèi)切葡聚糖酶活性的多肽或其組合物的方法。[0283]本發(fā)明還涉及降解或轉化纖維素材料的方法,其包括:在本發(fā)明的具有內(nèi)切葡聚糖酶活性的多肽的存在下,用酶組合物處理纖維素材料。在一個方面,所述方法進一步包括回收已降解或轉化的纖維素材料。所述纖維素材料的降解或轉化的可溶性產(chǎn)物可從不溶性纖維素材料使用本領域已知的方法分離,如例如離心、過濾或重力沉降。[0284]本發(fā)明還涉及產(chǎn)生發(fā)酵產(chǎn)物的方法,其包括:(a)在本發(fā)明的具有內(nèi)切葡聚糖酶活性的多肽的存在下,用酶組合物糖化纖維素材料;(b)用一種或多種(例如幾種)發(fā)酵微生物發(fā)酵經(jīng)糖化的纖維素材料以產(chǎn)生發(fā)酵產(chǎn)物;和(C)從發(fā)酵回收發(fā)酵產(chǎn)物。[0285]本發(fā)明還涉及發(fā)酵纖維素材料的方法,其包括:用一種或多種(例如幾種)發(fā)酵微生物發(fā)酵纖維素材料,其中所述纖維素材料是在本發(fā)明的具有內(nèi)切葡聚糖酶活性的多肽的存在下用酶組合物糖化的。在一個方面,纖維素材料的發(fā)酵產(chǎn)生發(fā)酵產(chǎn)物。在另一個方面,所述方法還包括從發(fā)酵回收發(fā)酵產(chǎn)物。[0286]本發(fā)明的方法可以用于將纖維素材料糖化成可發(fā)酵糖,并且將可發(fā)酵糖轉化成很多有用的發(fā)酵產(chǎn)物,例如燃料、飲用乙醇和/或平臺化學品(platformchemical)(例如酸、醇、酮、氣體等)。從纖維素材料產(chǎn)生期望的發(fā)酵產(chǎn)物通常涉及預處理、酶水解(糖化)和發(fā)酵。[0287]根據(jù)本發(fā)明的纖維素材料的處理可以使用本領域的常規(guī)方法完成。此外,本發(fā)明的方法可使用經(jīng)配置以依照發(fā)明操作的任何常規(guī)生物質加工設備進行。[0288]水解(糖化)和發(fā)酵,分別的或同時的,包括但不限于,分離的水解和發(fā)酵(SHF)、同時糖化和發(fā)酵(SSF)、同時糖化和共發(fā)酵(SSCF)、混合的水解和發(fā)酵(HHF)、分離的水解和共發(fā)酵(SHCF)、混合的水解和共發(fā)酵(HHCF),和直接微生物轉化(DMC),有時也稱為聯(lián)合生物加工(consolidatedb1processing,CBP)。SHF使用分離的處理步驟以首先將纖維素材料酶水解為可發(fā)酵糖,例如,葡萄糖,纖維二糖和戊糖單體,然后將可發(fā)酵糖發(fā)酵成為乙醇。在SSF中,纖維素材料的酶水解和糖變?yōu)橐掖嫉陌l(fā)酵組合在一個步驟中(Philippidis,G.P.,1996,Celluloseb1convers1ntechnology,于HandbookonB1ethanol:Product1nandUtilizat1n,Wyman,C.E編,Taylor&Francis,Washington,DCj179-212)oSSCF包括多種糖的共發(fā)酵(Sheehan,J.和Himmel,M.,1999,Enzymes,energyandtheenvironment:AstrategicperspectiveontheU.S.DepartmentofEnergy^sresearchanddevelopmentactivitiesforb1ethanol,B1technol.Prog.15:817-827)oHHF在同時糖化和水解步驟之外,還包括單獨的水解步驟,所述各步驟可以在同一個反應器中進行。HHF過程中的步驟可以在不同的溫度進行,即,高溫酶法糖化,然后在發(fā)酵菌株能夠耐受的較低溫度進行SSF。DMC在一個或多個(例如幾個)步驟中組合了所有三個過程(酶產(chǎn)生、水解和發(fā)酵),其中使用相同的生物體產(chǎn)生用于將纖維素材料轉化成可發(fā)酵糖并將可發(fā)酵糖轉化成終產(chǎn)物的酶(LyndL.R.,Weimer,P.J.,vanZyljW.H.,和Pretorius,1.S.,2002,Microbialcelluloseutilizat1n:Fundamentalsandb1technology,Microb1l.Mol.B1l.Reviews66:506-577)。在本文可以理解的是,任何本領域中已知的方法,包括預處理、酶水解(糖化)、發(fā)酵,或它們的組合,都可用于實施本發(fā)明的方法。[0289]常規(guī)設備可包括補料分批式攪拌反應器、分批式攪拌反應器、具有超濾的連續(xù)流攪拌反應器和/或連續(xù)活塞流柱式反應器(FernandadeCastilhosCorazzajFlav1FariadeMoraes,GisellaMariaZanin和IvoNeitzel,2003,Optimalcontrolinfed—batchreactorforthecellob1sehydrolysis,ActaScientiarum.Technology25:33-38;Gusakov,A.V.和Sinitsyn,A.P.,1985,Kineticsoftheenzymatichydrolysisofcellulose:1.Amathematicalmodelforabatchreactorprocess,Enz.Microb.Technol.7:346-352)、研磨反應器(Ryu,S.K.和Lee,J.M.,1983,B1convers1nofwastecellulosebyusinganattrit1nb1reactor,B1technol.B1eng.25:53-65),或者具有由電磁場引起的強烈攪拌的反應器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkinj1.Y.,DavydkinjV.Y.,Protasj0.V.,1996,Enhancementofenzymaticcellulosehydrolysisusinganoveltypeofb1reactorwithintensivestirringinducedbyelectromagneticfield,Appl.B1chem.B1technol.56:141-153)。其它反應器類型包括:流化床、升流層(upflowblanket)、固定化和用于水解和/或發(fā)酵的擠出機型的反應器。[0290]預處理。在本發(fā)明的方法的實施中,可以使用本領域已知的任何預處理過程破壞植物細胞壁的纖維素材料組分(Chandra等,2007,Substratepretreatment:Thekeytoeffectiveenzymatichydrolysisoflignocellulosics?Adv.B1chem.Engin./B1technol.108:67-93;Galbe和Zacchi,2007,Pretreatmentoflignocellulosicmaterialsforefficientb1ethanolproduct1n,Adv.B1chem.Engin./B1technol.108:41-65;Hendriks和Zeeman,2009,Pretreatmentstoenhancethedigestibilityoflignocellulosicb1mass,B1resourceTechnol.100:10-18;Mosier等,2005,F(xiàn)eaturesofpromisingtechnologiesforpretreatmentoflignocellulosicb1mass,B1resourceTechnol.96:673-686;Taherzadeh和Karimi,2008,Pretreatmentoflignocellulosicwastestoimproveethanolandb1gasproduct1n:Areview,Int.J.0fMol.Sc1.9:1621-1651;Yang和Wyman,2008,Pretreatment:thekeytounlockinglow-costcellulosicethanol,B1fuelsB1productsandB1refining-B1fpr.2:26-40)。[0291]纖維素材料也可以在預處理之前使用本領域中已知的方法進行粒度減小、篩分、預浸泡、潤濕、洗漆和/或調理(condit1ning)。[0292]常規(guī)的預處理包括但不限于,蒸汽預處理(伴隨或不伴隨爆破)、稀酸預處理、熱水預處理、堿預處理、石灰預處理、濕氧化、濕爆破、氨纖維爆破、有機溶劑預處理和生物預處理。其它預處理包括氨滲濾、超聲、電穿孔、微波、超臨界CO2、超臨界H20、臭氧、離子性液體和Y輻射預處理。[0293]可以在水解和/或發(fā)酵之前預處理纖維素材料。預處理優(yōu)選在水解前進行?;蛘?,預處理可以與酶水解同時進行以釋放可發(fā)酵糖,如葡萄糖、木糖和/或纖維二糖。在大多數(shù)情況下,預處理步驟本身使一些生物質轉化成可發(fā)酵糖(甚至在不存在酶的情況下)。[0294]蒸汽預處理。在蒸汽預處理中,加熱纖維素材料以破壞植物細胞壁成分,包括木質素、半纖維素和纖維素,使纖維素和其它級分,例如半纖維素,能夠被酶觸及。將纖維素材料經(jīng)過或通過反應容器,其中注入蒸汽以增加溫度至需要的溫度和壓力,并且在其中保持期望的反應時間。蒸汽預處理優(yōu)選在140-250°C,例如160-200°C,或170_190°C進行,其中最優(yōu)的溫度范圍依賴于化學催化劑的添加。蒸汽預處理的停留時間優(yōu)選1-60分鐘,例如1-30分鐘,1-20分鐘,3-12分鐘,或4-10分鐘,其中最優(yōu)的停留時間依賴于溫度范圍和化學催化劑的添加。蒸汽預處理允許相對較高的固形物加載量,以至于纖維素材料在預處理過程中通常僅僅變得潮濕。蒸汽預處理經(jīng)常與預處理后的物質的爆破放料(explosivedischarge)組合,這稱為蒸汽爆破,即,快速閃變至大氣壓和物質的瑞流,以通過破碎增加可接觸的表面積(Duff和Murray,1996,B1resourceTechnology855:1-33;Galbe和Zacchi,2002,Appl.Microb1l.B1technol.59:618-628;美國專利申請N0.20020164730)。在蒸汽預處理過程中,半纖維素乙?;鶊F被切開,并且得到的酸自催化半纖維素部分水解成為單糖和寡糖。木質素僅以有限的程度被去除。[0295]化學預處理:術語“化學處理”指能促進纖維素、半纖維素和/或木質素分離和/或釋放的任何化學處理。此種預處理可將晶體纖維素轉化為無定形纖維素。合適的化學預處理工藝的實例包括例如稀酸預處理、石灰預處理、濕氧化、氨纖維/冷凍爆破(AFEX)、氨滲濾(APR)、離子性液體和有機溶劑預處理。[0296]經(jīng)常在蒸汽預處理之前加入催化劑如H2SO4或SO2(通常0.3至5%w/w),其可減少時間,降低溫度,增加回收率,并改進酶水解(Ballesteros等,2006,Appl.B1chem.B1technol.129-132:496-508;Varga等,2004,Appl.B1chem.B1technoI.113-116:509-523;Sassner等.,2006,EnzymeMicrob.Technol.39:756-762)。在稀酸預處理中,將纖維素材料與稀酸(通常是H2SO4)和水混合以形成漿料,由蒸汽加熱至期望的溫度,并在一段停留時間后閃變至大氣壓。可以用很多反應器設計形式進行稀酸預處理,例如,活塞流反應器、逆流反應器或連續(xù)逆流收縮床反應器(Duff和Murray,1996,supra;Schell等,2004,B1resourceTechnol.91:179-188;Lee等,1999,Adv.B1chem.Eng.B1technol.65:93-115)。[0297]還可以使用堿性條件下的幾種預處理方法。這些堿預處理包括,但不限于,氫氧化鈉、石灰、濕氧化、氨滲濾(APR)和氨纖維/冷凍爆破(AFEX)。[0298]用氧化鈣或氫氧化鈣在85_150°C的溫度進行石灰預處理,停留時間從I小時到幾天(Wyman等,2005,B1resourceTechnol.96:1959-1966;Mosier等,2005,B1resourceTechnol.96:673-686)。WO2006/110891、WO2006/110899、WO2006/110900和WO2006/110901公開了使用氨的預處理方法。[0299]濕氧化是一種熱預處理,通常在180-200V進行5_15分鐘,加入氧化劑如過氧化氫或過壓氧(Schmidt和Thomsen,1998,B1resourceTechnol.64:139-151;Palonen等,2004,Appl.B1chem.B1technol.117:1-17;Varga等,2004,B1technol.B1eng.88:567-574;Martin等,2006,J.Chem.Technol.B1technol.81:1669-1677)。預處理以優(yōu)選1-40%干物質,例如2-30%干物質,或5-20%干物質進行,并且經(jīng)常通過加入堿如碳酸鈉來增加初始pH。[0300]濕氧化預處理方法的修改方法,稱為濕爆破(濕氧化和蒸汽爆破的組合),能夠處理高達30%的干物質。在濕爆破中,在預處理過程中,在一定的停留時間后引入氧化劑。然后通過閃變至大氣壓而結束預處理(W02006/032282)。[0301]氨纖維爆破(AFEX)涉及在中等溫度如90-150°C和高壓如17_20bar,用液氨或氨氣將纖維素材料處理5-10分鐘,其中干物質含量可以高達60%(Gollapalli等,2002,Appl.B1chem.B1technol.98:23-35;Chundawat等,2007,B1technol.B1eng.96:219-231;Alizadeh等,2005,Appl.B1chem.B1technol.121:1133-1141;Teymouri等,2005,B1resourceTechnol.96:2014-2018)。在AFEX預處理過程中,纖維素和半纖維素保持相對完整。木質素-糖復合物被切開。[0302]有機溶劑預處理通過用含水乙醇(40-60%乙醇)在160-200°C提取30-60分鐘而將纖維素材料去木質素化(Pan等,2005,B1technol.B1eng.90:473-481;Pan等,2006,B1technol.B1eng.94:851-861;Kurabi等,2005,Appl.B1chem.B1technol.121:219-230)。經(jīng)常加入硫酸作為催化劑。在有機溶劑預處理中,大部分半纖維素和木質素得以去除。[0303]合適的預處理方法的其他實例如Schell等,2003,Appl.B1chemandB1techn.Vol.105-108:69-85,和Mosier等,2005,B1resourceTechnology96:673-686,和美國公開申請2002/0164730所述。[0304]在一個方面,化學預處理優(yōu)選作為稀酸處理,并且更優(yōu)選作為連續(xù)稀酸處理進行。酸通常是硫酸,但也可以使用其它酸,如乙酸、檸檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氫或其混合物。弱酸(mildacid)處理在優(yōu)選1_5,例如1_4,或1-2.5的pH范圍進行。在一個方面,酸濃度在優(yōu)選0.01至,例如0.05至5wt%酸或0.1至2wt%酸的范圍。將酸與纖維素材料接觸,并在優(yōu)選140-200°C,例如165-190°C范圍的溫度保持I至60分鐘的時間。[0305]在另一個方面,預處理發(fā)生在含水漿料中。在優(yōu)選的方面,在預處理過程中纖維素材料以優(yōu)選10-80wt%,例如20-70wt%*30-60wt%,如約40wt%的量存在。預處理的纖維素材料可以不洗滌或者使用本領域任何已知的方法洗滌,例如,用水洗滌。[0306]機械預處理或物理預處理:術語“機械預處理”或“物理預處理”指任何促進顆粒大小減少的預處理。舉例而言,此種預處理可涉及各種類型的研磨(grinding)或磨制(milling)(例如,干磨、濕磨或振動球磨)。[0307]纖維素材料可經(jīng)物理(機械)和化學預處理二者。機械或物理預處理可與下述偶聯(lián):汽蒸/蒸汽爆破、水熱解(hydrothermolysis)、稀酸或弱酸處理、高溫、高壓處理、福射(例如微波輻射),或其組合。在一個方面,高壓指優(yōu)選約100至約400psi,例如約150至約250psi的范圍的壓強。在另一個方面,高溫指約100至300°C,例如約140至約200°C范圍的溫度。在一個優(yōu)選的方面,機械或物理預處理在使用利用如上所定義的高溫和高壓的蒸汽槍水解器系統(tǒng)(例如來自SundsDefibratorAB,Sweden的SundsHydrolyzer)的分批過程中進行。所述物理和化學預處理可視需要順序進行或同時進行。[0308]因此,在一個優(yōu)選的方面,對纖維素材料進行物理(機械)或化學預處理,或者它們的任何組合,以促進纖維素、半纖維素和/或木質素的分離和/或釋放。[0309]生物預處理:術語“生物預處理”指可以促進纖維素、半纖維素和/或木質素從纖維素材料分離和/或釋放的任何生物預處理。生物預處理技術可以包括應用溶解木質素的微生物和/或酶(參見,例如,Hsu,T.-A.,1996,Pretreatmentofb1mass,于HandbookonB1ethanol:Product1nandUtilizat1n,Wyman,C.E編,Taylor&Francis,Washington,DC,179-212;Ghosh和Singh,1993,Physicochemicalandb1logicaltreatmentsforenzymatic/microbialconvers1noflignocellulosicb1mass,Adv.Appl.Microb1l.39:295-333;McMiIlan,J.D.,1994,Pretreatinglignocellulosicb1mass:areview,于EnzymaticConvers1nofB1massforFuelsProduct1n,Himmel,M.E.,Baker,J.0.,和Overend,R.P.,編,ACSSymposiumSeries566,AmericanChemicalSociety,Washington,DC,第15章;Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanolproduct1nfromrenewableresources,于AdvancesinB1chemicalEngineering/B1technology,Scheper,T.,編,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;01sson和Hahn-Hagerdal,1996,Fermentat1noflignocellulosichydrolysatesforethanolproduct1n,Enz.Microb.Tech.18:312-331;和Vallander和Eriksson,1990,Product1nofethanolfromlignocellulosicmaterials:Stateoftheart,Adv.B1chem.Eng./B1technol.42:63-95)。[0310]趣化。在水解步驟中,將纖維素材料,例如經(jīng)預處理的纖維素材料水解以將纖維素和半纖維素分解成可發(fā)酵糖,如葡萄糖、纖維二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶的寡糖。水解利用酶組合物在本發(fā)明具有內(nèi)切葡聚糖酶活性的多肽的存在下如本文中所述酶促進行。組合物的酶組分還可以同時或順序加入。[0311]酶水解優(yōu)選在容易由本領域技術人員確定的條件下,在合適的含水環(huán)境中進行。在一個方面,水解在適于酶組分的活性,即對于酶組分最佳的條件下進行。水解可以以補料分批或連續(xù)的過程進行,在連續(xù)過程中將纖維素材料逐漸補入,例如,補入含酶的水解溶液中。[0312]糖化通常在攪拌釜反應器或發(fā)酵罐中在受控的pH、溫度和混合條件下進行。合適的處理時間、溫度和pH條件可以由本領域技術人員容易地確定。例如,糖化可持續(xù)長達200小時,但是通常進行優(yōu)選約12至約120小時,例如約16至約72小時,或約24至約48小時。溫度在優(yōu)選約25°C至約70°C,例如約30°C至約65°C,約40°C至約60°C,或約50°C至55°C的范圍。pH在優(yōu)選約3至約8,例如約3.5至約7,約4至約6,或約5.0至約5.5的范圍。干固形物含量在優(yōu)選約5至約50wt%,例如約10至約40wt%,或約20至約30wt%的范圍。[0313]酶組合物可包含任何可用于降解纖維素材料的蛋白。[0314]在一個方面,所述酶組合物包含或還包含一種或多種(例如幾種)選自下組的蛋白/多肽:纖維素酶、具有纖維素分解增強活性的GH61多肽,半纖維素酶、酯酶、棒曲霉素、漆酶、木質素分解酶、果膠酶、過氧化物酶、蛋白酶和膨脹素。在另一個方面,所述纖維素酶為優(yōu)選一種或多種(例如幾種)選自下組的酶:內(nèi)切葡聚糖酶、纖維二糖水解酶和葡糖苷酶。在另一個方面,所述半纖維素酶為優(yōu)選一種或多種(例如幾種)選自下組的酶:乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。[0315]在另一個方面,所述酶組合物包含一種或多種(例如幾種)纖維素分解酶。在另一個方面,所述酶組合物包含或進一步包含一種或多種(例如幾種)半纖維素分解酶。在另一個方面,所述酶組合物包含一種或多種(例如幾種)纖維素分解酶和一種或多種(例如幾種)半纖維素分解酶。在另一個方面,所述酶組合物包含一種或多種(例如幾種)選自下組的酶:纖維素分解酶和半纖維素分解酶。在另一個方面,所述酶組合物包含內(nèi)切葡聚糖酶。在另一個方面,所述酶組合物包含纖維二糖水解酶。在另一個方面,所述酶組合物包含β_葡糖苷酶。在另一個方面,所述酶組合物包含具有纖維素分解增強活性的多肽。在另一個方面,所述酶組合物包含內(nèi)切葡聚糖酶和具有纖維素分解增強活性的多肽。在另一個方面,所述酶組合物包含纖維二糖水解酶和具有纖維素分解增強活性的多肽。在另一個方面,所述酶組合物包含β_葡糖苷酶和具有纖維素分解增強活性的多肽。在另一個方面,所述酶組合物包含內(nèi)切葡聚糖酶和纖維二糖水解酶。在另一個方面,所述酶組合物包含內(nèi)切葡聚糖酶和葡糖苷酶。在另一個方面,所述酶組合物包含纖維二糖水解酶和葡糖苷酶。在另一個方面,所述酶組合物包含內(nèi)切葡聚糖酶、纖維二糖水解酶和具有纖維素分解增強活性的多肽。在另一個方面,所述酶組合物包含內(nèi)切葡聚糖酶、β-葡糖苷酶和具有纖維素分解增強活性的多肽。在另一個方面,所述酶組合物包含纖維二糖水解酶、β-葡糖苷酶和具有纖維素分解增強活性的多肽。在另一個方面,所述酶組合物包含內(nèi)切葡聚糖酶、纖維二糖水解酶和葡糖苷酶。在另一個方面,所述酶組合物包含內(nèi)切葡聚糖酶、纖維二糖水解酶、β-葡糖苷酶和具有纖維素分解增強活性的多肽。[0316]在另一個方面,所述酶組合物包含乙酰甘露聚糖酯酶。在另一個方面,所述酶組合物包含乙酰木聚糖酯酶。在另一個方面,所述酶組合物包含阿拉伯聚糖酶(例如α-L-阿拉伯聚糖酶)。在另一個方面,所述酶組合物包含阿拉伯呋喃糖苷酶(例如a-L-阿拉伯呋喃糖苷酶)。在另一個方面,所述酶組合物包含香豆酸酯酶。在另一個方面,所述酶組合物包含阿魏酸酯酶。在另一個方面,所述酶組合物包含半乳糖苷酶(例如α-半乳糖苷酶和/或半乳糖苷酶)。在另一個方面,所述酶組合物包含葡糖醛酸糖苷酶(例如a-D-葡糖醛酸糖苷酶)。在另一個方面,所述酶組合物包含葡糖醛酸酯酶。在另一個方面,所述酶組合物包含甘露聚糖酶。在另一個方面,所述酶組合物包含甘露糖苷酶(例如甘露糖苷酶)。在另一個方面,所述酶組合物包含木聚糖酶。在一個優(yōu)選的方面,所述木聚糖酶是家族10木聚糖酶。在另一個方面,所述酶組合物包含木糖苷酶(例如β-木糖苷酶)。[0317]在另一個方面,所述酶組合物包含酯酶。在另一個方面,所述酶組合物包含棒曲霉素。在另一個方面,所述酶組合物包含漆酶。在另一個方面,所述酶組合物包含木質素分解酶。在另一個優(yōu)選的方面,所述木質素分解酶是錳過氧化物酶。在另一個優(yōu)選的方面,所述木質素分解酶是木質素過氧化物酶。在另一個優(yōu)選的方面,所述木質素分解酶是產(chǎn)生H2O2的酶。在另一個方面,所述酶組合物包含果膠酶。在另一個方面,所述酶組合物包含過氧化物酶。在另一個方面,所述酶組合物包含蛋白酶。在另一個方面,所述酶組合物包含膨脹素。[0318]在本發(fā)明的方法中,酶可在糖化,糖化和發(fā)酵,或發(fā)酵之前或過程中添加。[0319]所述酶組合物的一種或多種(例如幾種)組分可為野生型蛋白、重組蛋白或野生型蛋白和重組蛋白的組合。舉例而言,一種或多種(例如幾種)組分可為細胞的天然蛋白,其用作宿主細胞以重組表達酶組合物的一種或多種(例如幾種)其他組分??蓪⒚附M合物的一種或多種(例如幾種)組分作為單獨組分產(chǎn)生,然后將其組合以形成酶組合物。所述酶組合物可為多組分和單組分蛋白制備物的組合。[0320]用于本發(fā)明方法中的酶可為任何適用的形式,例如發(fā)酵液配制物,細胞組合物,含或不含細胞碎片的細胞裂解液,半純化或純化的酶制備物,或作為酶的來源的宿主細胞。所述酶組合物可為干粉或顆粒,無粉塵的顆粒,液體,穩(wěn)定化液體或穩(wěn)定化受保護的酶。液體酶制備物可根據(jù)確立的工藝,例如通過添加穩(wěn)定劑如糖、糖醇或其他多元醇,和/或乳酸或其他有機酸來穩(wěn)定化。[0321]具有內(nèi)切葡聚糖酶活性的酶和多肽的最適量取決于幾個因素,其包括但不限于,纖維素分解和/或半纖維素分解酶組分的混合物、纖維素材料、纖維素材料的濃度、纖維素材料的預處理、溫度、時間、PH和包括發(fā)酵生物體(例如,同時糖化和發(fā)酵的酵母)。[0322]在一個方面,纖維素分解酶或半纖維素分解酶對于纖維素材料的有效量是約0.5至約50mg,例如約0.5至約40mg,約0.5至約25mg,約0.75至約20mg,約0.75至約15mg,約0.5至約1mg,或約2.5至約1mg每g纖維素材料。[0323]在另一個方面,具有內(nèi)切葡聚糖酶活性的多肽對于纖維素材料的有效量是約0.01至約50.0mg,例如約0.01至約40mg,約0.01至約30mg,約0.01至約20mg,約0.01至約1mg,約0.01至約5mg,約0.025至約1.5mg,約0.05至約1.25mg,約0.075至約1.25mg,約0.1至約1.25mg,約0.15至約1.25mg,或約0.25至約1.0mg每g纖維素材料。[0324]在另一個方面,具有內(nèi)切葡聚糖酶活性的多肽對于纖維素分解酶或半纖維素分解酶的有效量是約0.005至約L0g,例如約0.01至約L0g,約(λ15至約(λ75g,約(λ15至約0.5g,約0.1至約0.5g,約0.1至約0.25g,或約0.05至約0.2g每g纖維素分解酶或半纖維素分解酶。[0325]具有纖維素分解酶活性或半纖維素分解酶活性的多肽,以及其它可用于纖維素材料的降解的蛋白/多肽,例如具有纖維素分解增強活性的GH61多肽(在本文中統(tǒng)稱為具有酶活性的多肽)可源自或獲得自任何合適的來源,包括細菌、真菌、酵母、植物或哺乳動物來源。術語“獲得”在本文中還意指該酶可在宿主生物中使用本文中所述的方法重組產(chǎn)生,其中經(jīng)重組產(chǎn)生的酶對于宿主生物是天然的或外源的,或具有修飾的氨基酸序列,例如,具有一個或多個(例如幾個)缺失、插入和/或取代的氨基酸,即重組產(chǎn)生的酶,其是天然氨基酸序列的片段和/或突變體或是通過本領域已知的氨基酸改組方法產(chǎn)生的酶。天然酶的含義中涵蓋的是天然變體,而外來酶的含義中涵蓋的是重組(如通過定位誘變或重排)獲得的變體。[0326]具有酶活性的多肽可以是細菌多肽。例如,所述多肽可以是革蘭氏陽性細菌多肽如芽孢桿菌屬(Bacillus)、鏈球菌屬(Streptococcus)、鏈霉菌屬(Streptomyces)、葡萄球菌屬(Staphylococcus)、腸球菌屬(Enterococcus)、乳桿菌屬(Lactobacillus)、乳球菌屬(Lactococcus)、梭菌屬(Clostridium)、地芽孢桿菌屬(Geobacillus)、熱解纖維素菌屬(Caldicellulosiruptor)、熱酸菌屬(Acidothermus)、Thermobifidia或海洋芽抱桿菌屬(Oceanobacillus)多肽,所述多肽具有酶活性;或革蘭氏陰性細菌多肽,如大腸桿菌、假單胞菌屬(Pseudomonas)、沙門氏菌屬(Salmonella)、彎曲桿菌屬(Campylobacter)、螺桿菌屬(Helicobacter)、黃桿菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)、泥桿菌屬(Ilyobacter)、奈瑟氏菌屬(Neisseria)或脲原體屬(Ureaplasma)多肽,所述多肽具有酶活性。[0327]在一個方面,所述多肽是具有酶活性的嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、克勞氏芽孢桿菌、凝結芽孢桿菌、堅強芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌或蘇云金芽孢桿菌多肽。[0328]在另一個方面,所述多肽是具有酶活性的似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌或馬鏈球菌獸瘟亞種多肽。[0329]在另一個方面,所述多肽是具有酶活性的不產(chǎn)色鏈霉菌、除蟲鏈霉菌、天藍鏈霉菌、灰色鏈霉菌或淺青紫鏈霉菌多肽。[0330]具有酶活性的多肽也可以是真菌多肽,并且更優(yōu)選酵母多肽如假絲酵母屬、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬多肽,其具有酶活性;或更優(yōu)選絲狀真菌多肽如枝頂孢霉屬、傘菌屬、鏈格孢屬、曲霉屬、短梗霉屬、Botryospaeria、擬臘菌屬、Chaetomidium、金抱子菌屬、Claviceps、Cochl1bolus、鬼傘屬、Coptotermes、棒囊殼屬、隱叢赤殼菌屬、隱球菌屬、色二孢屬、黑耳屬、FiIibasidium、鐮孢屬、赤霉屬、全鞭毛蟲屬、腐質霉屬、IE齒菌屬、蘑燕屬、Leptospaeria、梨孢菌屬、Melanocarpus、多孔菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬、瘤胃壺菌屬、Poitrasia、假黑盤菌屬、Pseudotrichonympha、根毛霉屬、裂裙菌屬、柱頂孢屬、踝節(jié)菌屬、嗜熱子囊菌屬、梭孢霉屬、彎頸霉屬、木霉屬、長毛盤菌屬、輪枝孢屬、包腳菇屬或炭角菌屬多肽,其具有酶活性。[0331]在一個方面,所述多肽是具有酶活性的卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母或卵形酵母多肽。[0332]在另一個方面,所述多肽是具有酶活性的解纖維枝頂孢霉、棘孢曲霉、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構巢曲霉、黑曲霉、米曲霉、嗜角質金孢子菌、Chrysosporiumlucknowense、熱帶金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、租金抱子菌、Chrysosporiumqueenslandicum、Chrysosporiumzonatum、桿抱狀鍵抱、禾谷鍵抱、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢、鑲片鐮孢、灰腐質霉、特異腐質霉、疏棉狀腐質霉、白耙齒菌、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、繩狀青霉、產(chǎn)紫青霉、黃抱平革菌、Thielaviaachromatica、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭孢霉、Thielaviafimet1、小孢梭孢霉、卵孢梭孢霉、Thielaviaperuviana、瘤孢梭孢霉、毛梭孢霉、Thielaviasubthermophila、土生梭孢霉、哈茨木霉、康寧木霉、長枝木霉、里氏木霉、綠色木霉或褐孢長毛盤菌(Trichophaeasaccata)多肽。[0333]還可以使用具有酶活性的多肽的經(jīng)化學修飾或蛋白質工程改造的突變體。[0334]所述組合物的一種或多種(例如幾種)組分可以是重組組分,亦即,通過克隆編碼所述單獨組分的DNA序列并隨后用該DNA序列轉化細胞并在宿主中表達(參見,例如,W091/17243和W091/17244)而產(chǎn)生的。所述宿主優(yōu)選是異源宿主(酶對宿主是外源的),但該宿主在一定條件下也可以是同源宿主(酶對宿主是天然的)。單組分纖維素分解蛋白還可以通過從發(fā)酵液中提純這樣的蛋白質來制備。[0335]在一個方面,所述一種或多種(例如幾種)纖維素分解酶包含商業(yè)性纖維素分解酶制備物。適用于本發(fā)明的商業(yè)的纖維素分解酶制備物的實例包括,例如,CELLIC?Ctec(NovozymesA/S)、CELLIC?CTec2(NovozymesA/S)、CELIJC..?CTec3(NovozymesA/S)、CELLUCLAST?(NovozymesA/S)、NOVOZYM?188(NovozymesA/S),CELLUZYME?(NovozymesA/S)、CEREFLO?(NovozymesA/S)和ULTRAFLO?(NovozymesA/S),ACCELERASE?(GenencorInt.)、LAMINEX?(GenencorInt.)、SPEZYME?CP(GenencorInt.),FILTRASE?NL(DSM),METHAPLUS?S/L10(DSM),R0HAMENT?7069W(RohmGmbH),FIBREZYME?LDI(DyadicInternat1nal,Inc.)、FIBREZYME?LBR(DyadicInternat1nal,Inc.)或VISCOSTAR?150L(DyadicInternat1nal,Inc.)。所述纖維素酶酶以固形物的約0.001至約5.0wt%,例如固形物的約0.025至約4.0wt%,或固體的約0.005至約1.0wt%的有效量添加。的方法的細菌內(nèi)切葡聚糖酶的實例包括但不僅限于,解纖維熱酸菌(Acidothermuscellulolyticus)內(nèi)切葡聚糖酶(W091/05039;W093/15186;美國專利5,275,944;W096/02551;美國專利5,536,655,WO00/70031,WO05/093050);Thermobifidafusca內(nèi)切葡聚糖酶III(TO05/093050)jPThermobifidafusca內(nèi)切葡聚糖酶V(W005/093050)。[0337]可以用于本發(fā)明的真菌內(nèi)切葡聚糖酶的實例包括但不僅限于,里氏木霉內(nèi)切葡聚糖酶KPenttila等,1986,Gene45:253-263,里氏木霉Cel7B內(nèi)切葡聚糖酶I(GENBANK?登錄號M15665);里氏木霉內(nèi)切葡聚糖酶II(Saloheimo等,1988,Gene63:11-22),里氏木霉Cel5A內(nèi)切葡聚糖酶II(GENBANK?登錄號M19373);里氏木霉內(nèi)切葡聚糖酶III(Okada等,1988,Appl.Environ.Microb1l.64:555-563;GENBANK?登錄號AB003694);里氏木霉內(nèi)切葡聚糖酶V(Saloheimo等,1994,MolecularMicrob1logy13:219-228;GENBANK?登錄號Z33381);棘抱曲霉內(nèi)切葡聚糖酶(Ooi等,1990,NucleicAcidsResearchl8:5884);川地曲霉(Aspergilluskawachii)內(nèi)切葡聚糖酶(Sakamoto等,1995,CurrentGenetics27:435-439);胡蘿卜軟腐歐文氏菌(Erwiniacarotovara)內(nèi)切葡聚糖酶(Saarilahti%,1990,Gene90:9-14);尖鐮孢內(nèi)切葡聚糖酶(GENBANK?登錄號L29381);灰腐質霉thermoidea變種內(nèi)切葡聚糖酶(GENBANK?登錄號AB003107);Melanocarpusalbomyces內(nèi)切葡聚糖酶(GENBANK?登錄號MAL515703);粗糙脈孢菌內(nèi)切葡聚糖酶(GENBANK?登錄號XM_324477);特異腐質霉內(nèi)切葡聚糖酶V;嗜熱毀絲霉CBS117.65內(nèi)切葡聚糖酶;擔子菌綱(basidi0myCete)CBS495.95內(nèi)切葡聚糖酶;擔子菌綱CBS494.95內(nèi)切葡聚糖酶;土生梭孢霉NRRL8126CEL6B內(nèi)切葡聚糖酶;土生梭孢霉NRRL8126CEL6C內(nèi)切葡聚糖酶;土生梭孢霉NRRL8126CEL7C內(nèi)切葡聚糖酶;土生梭孢霉NRRL8126CEL7E內(nèi)切葡聚糖酶;土生梭抱霉NRRL8126CEL7F內(nèi)切葡聚糖酶;CladorrhinumfoecundissimumATCC62373CEL7A內(nèi)切葡聚糖酶;以及里氏木霉菌株N0.VTT-D-80133內(nèi)切葡聚糖酶(GENBANK?登錄號M15665)。[0338]可用于本發(fā)明的纖維二糖水解酶的實例包括但不僅限于,棘孢曲霉纖維二糖水解酶II(WO2011/059740),嗜熱毛殼菌(Chaetomiumthermophilum)纖維二糖水解酶I,嗜熱毛殼菌纖維二糖水解酶II,特異腐質霉纖維二糖水解酶I,嗜熱毀絲霉纖維二糖水解酶II,(W02009/042871),Thielaviahyrcanie纖維二糖水解酶II(W02010/141325),土生梭孢霉纖維二糖水解酶II(CEL6A,WO2006/074435),里氏木霉纖維二糖水解酶I,里氏木霉纖維二糖水解酶II,以及褐孢長毛盤菌纖維二糖水解酶II(W02010/057086)。[0339]可用于本發(fā)明的葡糖苷酶的實例包括但不僅限于來自棘孢曲霉(Kawaguchi等,1996,Gene173:287-288)、煙曲霉(W02005/047499)、黑曲霉(Dan等,2000,J.B1l.Chem.275:4973-4980)、米曲霉(W02002/095014)、巴西青霉IBT20888(W02007/019442和WO2010/088387)、土生梭孢霉(W02011/035029)和褐孢長毛盤菌(W02007/019442)的β-葡糖苷酶。[0340]所述β-葡糖苷酶可以是融合蛋白。在一個方面,所述β-葡糖苷酶是WO米曲霉葡糖苷酶變體BG融合蛋白(W02008/057637)或米曲霉β-葡糖苷酶融合蛋白(2008/057637)。[0341]其它可用的內(nèi)切葡聚糖酶、纖維二糖水解酶和葡糖苷酶公開于使用根據(jù)HenrissatB.,1991,Aclassificat1nofglycosylhydrolasesbasedonamino-acidsequencesimilarities,B1chem.J.280:309-316和HenrissatB.和BairochA.,1996,Updatingthesequence-basedclassificat1nofglycosylhydrolases,B1chem.J.316:695-696的分類的許多糖基水解酶家族中。[0342]其它可用于本發(fā)明的纖維素分解酶描述于WO98/13465、WO98/015619、WO98/015633、WO99/06574、WO99/10481、WO99/025847、WO99/031255、WO2002/101078、WO2003/027306,WO2003/052054,WO2003/052055,WO2003/052056,WO2003/052057、WO2003/052118,WO2004/016760,WO2004/043980,WO2004/048592,WO2005/001065、WO2005/028636,WO2005/093050,WO2005/093073,WO2006/074005,WO2006/117432、WO2007/071818、WO2007/071820、WO2008/008070、WO2008/008793、美國專利N0.5,457,046、美國專利N0.5,648,263和美國專利N0.5,686,593。[0343]在本發(fā)明的方法中,可使用任何具有纖維素分解增強活性的GH61多肽作為酶組合物的組分。[0344]在第一個方面,所述具有纖維素分解增強活性的GH61多肽包含下述基序:[0345][ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ](SEQIDN0:47或SEQIDNO:48)和[FW]-[TF]-K-[AIV],[0346]其中X為任意氨基酸,X(4,5)為在4或5個連續(xù)位置上的任意氨基酸,而X(4)是在4個連續(xù)位置上的任意氨基酸。[0347]包含上述所示的基序的分離的多肽可還包含:[0348]H-X(l,2)-G-P-X(3)-[Yff]-[AILMV](SEQIDN0:49或SEQIDNO:50),[0349][EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV](SEQIDN0:51),或[0350]H-X(I,2)-G-P-X(3)-[Yff]-[AILMV](SEQIDN0:49或SEQIDNO:50)和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV](SEQIDN0:51),[0351]其中X為任意氨基酸,X(1,2)為在I個位置或2個連續(xù)位置上的任意氨基酸,X(3)為3個連續(xù)位置上的任意氨基酸,而X(2)為2個連續(xù)位置上的任意氨基酸。在上述基序中,采用公認的IUPAC單字母氨基酸縮寫。[0352]在一個優(yōu)選的實施方案,所述具有纖維素分解增強活性的分離的GH61多肽還包含H-X(l,2)-G-P-X(3)-[YW]-[AILMV](SEQIDN0:49或SEQIDNO:50)?在另一個優(yōu)選的方面,具有纖維素分解增強活性的分離的GH61多肽還包含[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV](SEQIDN0:51)。在另一個優(yōu)選的方面,具有纖維素分解增強活性的分離的GH61多肽還包含H-X(l,2)-G-P-X(3)-[YW]-[AILMV](SEQIDN0:49或SEQIDNO:50)[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV](SEQIDN0:51)。[0353]在第二個方面,所述具有纖維素分解增強活性的分離的多肽包含下述基序:[0354][ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(3)-A-[HNQ](SEQIDN0:52或SEQIDNO:53),[0355]其中X為任意氨基酸,X(4,5)為在4或5個連續(xù)位置上的任意氨基酸,而x(3)為3個連續(xù)位置上的任意氨基酸。在上述基序中,采用公認的IUPAC單字母氨基酸縮寫。[0356]可用于本發(fā)明的工藝的具有纖維素分解增強活性的GH61多肽的實例包括但不限于來自土生梭孢霉(W02005/074647,WO2008/148131和WO2011/035027);桔橙熱子囊菌(W02005/074656和WO2010/065830),里氏木霉(W02007/089290),嗜熱毀絲霉(wo2009/085935,WO2009/085859,WO2009/085864,WO2009/085868),煙曲霉(W02010/138754)的GH61多肽,來自嗜松青霉(W02011/005867),嗜熱子囊菌菌種(W02011/039319),青霉屬菌種(W02011/041397),和Thermoascuscrustaceous(W02011/041504)的GH61多肽。[0357]在一個方面,所述具有纖維素分解增強活性的GH61多肽在WO2008/151043中所述的可溶性活化二價金屬陽離子,例如錳或銅的存在下使用。[0358]在另一個方面,所述具有纖維素分解增強活性的GH61多肽在二氧化合物、二環(huán)化合物、雜環(huán)化合物、含氮化合物、醌化合物、含硫化合物、或從經(jīng)預處理的纖維素材料如經(jīng)預處理的玉米秸桿(PCS)獲得的液劑的存在下使用。[0359]所述二氧化合物可包括任何含有兩個或更多氧原子的合適化合物。在一些方面,所述二氧化合物含有如本文中所述的取代的芳基模塊(moiety)。所述二氧化合物可包括一個或多個(例如幾個)羥基和/或羥基衍生物,但亦包括缺乏羥基和羥基衍生物的取代的芳基模塊。二氧化合物的非限定性實例包括鄰苯二酚或兒茶酚;咖啡酸;3,4-二羥基苯甲酸;4_叔丁基-5-甲氧基-1,2-苯二酚;連苯三酚;沒食子酸;甲基_3,4,5-三羥基苯甲酸;2,3,4-三羥基二苯甲酮;2,6-二甲氧基苯酚;芥子酸;3,5-二羥基苯甲酸;4-氯-1,2-苯二酚;4_硝基-1,2-苯二酚;鞣酸;沒食子酸乙酯;羥乙酸甲酯;二羥基延胡索酸;2-丁炔-1,4-二醇;克酮酸;1,3-丙二醇;酒石酸;2,4_戊二醇;3-乙氧基-1,2-丙二醇;2,4,4’-三羥基二苯甲酮;順-2-丁烯-1,4-二醇;3,4_二羥基-3-環(huán)丁烯-1,2-二酮;二羥基丙酮;乙酰丙烯醛(acroleinacetal);甲基_4_羥基苯甲酸;4_羥基苯甲酸;和甲基-3,5-二甲氧基-4-羥基苯甲酸;或它們的鹽或溶劑合物(solvate)。[0360]所述二環(huán)化合物可包括任何如本文中所述的合適的取代稠環(huán)系統(tǒng)。所述化合物可包含一個或多個(例如幾個)另外的環(huán),且除非另行說明,不限于具體的環(huán)數(shù)。在一個方面,所述二環(huán)化合物是類黃酮。在另一個方面,所述二環(huán)化合物是任選取代的異類黃酮(isoflavonoid)。在另一個方面,所述二環(huán)化合物是任選取代的花色鮮離子(fIavyIium1n),如任選取代的花色素或任選取代的花色苷,或其衍生物。二環(huán)化合物的非限定性實例包括表兒茶素(epicatechin);槲皮素(quercetin);楊梅黃酮(myricetin);黃杉素(taxifolin);山奈酌.(kaempferol);桑素(morin);金合歡素(acacetin);柚皮素(naringenin);異鼠李黃素(isorhamnetin);療菜苷配基(apigenin);花青素(cyanidin);花色素苷(cyanin);kuromanin;花青素鼠李葡糖苷(keracyanin);或它們的鹽或溶劑合物。[0361]所述雜環(huán)化合物可為任何合適的化合物,如本文中所述的任選取代的包含雜原子的芳環(huán)或非芳環(huán)。在一個方面,所述雜環(huán)是包含任選取代的雜環(huán)烷基模塊或任選取代的雜芳基模塊的化合物。在另一個方面,所述任選取代的雜環(huán)烷基模塊或任選取代的雜芳基模塊是任選取代的五元雜環(huán)烷基或任選取代的五元雜芳基模塊。在另一個方面,任選取代的雜環(huán)烷基或任選取代的雜芳基模塊是選自如下的任選取代的模塊:吡唑基、呋喃基、咪唑基、異噁唑基、噁二唑基、噁唑基、吡咯基、吡啶基、嘧啶基、噠嗪基、噻唑基、三唑基、噻吩基(thienyl)、二氫噻吩-批唑基(dihydrothieno-pyrazolyl)、硫卻基、咔唑基、苯并咪唑基、苯并噻吩基(benzothienyl)、苯并呋喃基、吲哚基、喹啉基、苯并三唑基、苯并噻唑基、苯并噁唑基(benzooxazolyl)、苯并咪唑基、異喹啉基、異Π引哚基、Π丫唳基、苯并異B,惡唑基(benzoisazolyl)、二甲基乙內(nèi)酰脲、吡嗪基、四氫呋喃基、吡咯啉基、吡咯烷基、嗎啉基、吲哚基、二氮雜環(huán)庚三烯基(diazepinyl)、氮雜環(huán)庚三烯基(azepinyl)、硫雜環(huán)庚三烯基(thiepinyl)、哌唳基和氧雜環(huán)庚三烯基(ox印inyl)。在另一個方面所述任選取代的雜環(huán)烷基模塊或任選取代的雜芳基模塊是任選取代的呋喃基。雜環(huán)化合物的非限定性實例包括(1,2-二羥乙基)-3,4-二氫呋喃-2(5H)-酮;4-羥基-5-甲基_3_呋喃酮;5-羥基-2(5H)-呋喃酮;[1,2-二羥乙基]呋喃_2,3,4(5H)-三酮;α-羥基-y-丁內(nèi)酯;核糖酸Y-內(nèi)酯;己醒糖酸Y-內(nèi)酯(aldohexuronicaldohexuronicacidY-lactone);葡糖酸S-內(nèi)酯;4-羥基香豆素;二氫苯并呋喃;5-(羥甲基)糠醛;糠偶姻(fu1in);2(5H)_呋喃酮;5,6-二氫-2H-吡喃-2-酮;和5,6-二氫-4-羥基-6-甲基-2H-吡喃-2-酮;或它們的鹽或溶劑合物。[0362]所述含氮化合物可為任何具有一個或多個氮原子的合適化合物。在一個方面,所述含氮化合物包含胺、亞胺、羥胺或氧化亞氮(nitroxide)模塊。含氮化合物的非限定性實例包括丙酮肟;紫尿酸;吡啶-2-醛肟;2_氨基苯酚;1,2-苯二胺;2,2,6,6-四甲基-1-哌啶基氧(piperidinyloxy);5,6,7,8-四氫生物蝶呤;6,7-二甲基-5,6,7,8-四氫蝶呤;和馬來酰胺酸;或它們的鹽或溶劑合物。[0363]所述醌化合物可為任何本文中所述的包含醌模塊的合適的化合物。醌化合物的非限定性實例包括1,4-苯醌;1,4-萘醌;2-羥基-1,4-萘醌;2,3-二甲氧基-5-甲基-1,4-苯醌或輔酶Qtl;2,3,5,6-四甲基-1,4-苯醌或四甲基對苯醌;1,4-二羥基蒽醌;3-羥基-1-甲基-5,6-二氫吲哚二酮或腎上腺色素;4_叔丁基-5-甲氧基-1,2-苯醌;批咯并喹啉醌(pyrroloquinolinequinone);或它們的鹽或溶劑合物。[0364]所述含硫化合物可為任何包含一個或多個硫原子的合適的化合物。在一個方面,所述含硫化合物包含選自如下的模塊:亞硫酰,硫醚,亞磺酰,磺酰,磺酰胺(sulfamide),磺酰胺(sulfonamide),磺酸和磺酸酯。含硫化合物的非限定性實例包括乙硫醇;2-丙硫醇;2_丙烯-1-硫醇;2_巰基乙磺酸;苯硫醇;苯-1,2-二硫醇;半胱氨酸;甲硫氨酸;谷胱甘肽;胱氨酸;或它們的鹽或溶劑合物。[0365]在一個方面,此種如上所述的化合物對纖維素材料的有效量,以對纖維素糖單元的摩爾比例計,為約I(T6至約10,例如約I(T6至約7.5,約I(T6至約5,約I(T6至約2.5,約I(T6至約1,約I(T5至約1,約I(T5至約KT1,約I(T4至約KT1,約I(T3至約KT1,或約I(T3至約10'在另一個方面,如上所述的化合物的有效量為約0.1μM至約1Μ,例如約0.5μM至約0.75Μ,約0.75μM至約0.5Μ,約IμM至約0.25Μ,約IμM至約0.1Μ,約5μM至約50mM,約10μM至約25mM,約50μM至約25mM,約10μM至約10mM,約5μM至約5mM,或約0.1mM至約ImM。[0366]術語“液劑(liquor)”意指在本文中所述的條件下,通過處理漿料中的木素纖維素和/或半纖維素材料,或其單糖例如木糖、阿拉伯糖、甘露糖等,所產(chǎn)生的溶液相,即水相、有機相或其組合,及其可溶性內(nèi)含物。用于GH61多肽的纖維素分解增強的液劑可通過,任選在催化劑例如酸的存在下,任選在有機溶劑的存在下,且任選與對所述材料的物理破壞相組合來藉由施加熱和/或壓力來處理纖維素材料或半纖維素材料(或原料),然后將溶液與殘余固體分離來產(chǎn)生。此類條件決定了在借助纖維素酶制備物水解纖維素材料的過程中通過液劑和GH61多肽的組合可獲得的纖維素分解增強的程度。所述液劑可使用本領域中的標準方法如過濾、沉積或離心從經(jīng)處理的材料分離。[0367]在一個方面,所述液劑對纖維素的有效量為約10_6至約1g每g纖維素,例如約10-6至約7.5g,約10-6至約5,約10-6至約2.5g,約10-6至約Ig,約10-5至約Ig,約10-5至約10、,約I(T4至約10、,約I(T3至約10、,或約I(T3至約10、每g纖維素。[0368]在一個方面,所述一種或多種(例如幾種)半纖維素分解酶包含商業(yè)性半纖維素分解酶制備物。適用于本發(fā)明的商業(yè)性半纖維素分解酶制備物的實例包括,例如SHEARZYME?(NovozymesA/S)、CELLIC?HTec(NovozymesA/S)、CELLIC?Htec2(NovozymesA/S)、CELLIC?HTec3(NovozymesA/S)、VISCOZYME?(NovozymesA/S)、ULTRAFLO?(NovozymesA/S)、PULPZYME?HC(NovozymesA/S)、MULTIFECT?Xylanase(Genencor)、ACCELLERASE?XY(Genencor)、ACCELLERASE?XC(Genencor)、ECOPULP?TX-200A(ABEnzymes)、HSP6000Xylanase(DSM),DEP0L?333P(B1catalystsLimit,Wales,UK)、DEP0L?740L(B1catalystsLimit,Wales,UK)和DEP0L?762P(B1catalystsLimit,Wales,UK)?[0369]可用于本發(fā)明方法的木聚糖酶的實例包括但不限于來自棘孢曲霉(Aspergillusaculeatus)(GeneSeqP:AAR63790;W094/21785)、煙曲霉(Aspergillusfumigatus)(WO2006/078256)、嗜松青霉(WO2011/041405)、青霉屬菌種(WO2010/126772)、土生梭孢霉(Thielaviaterrestris)NRRL8126(WO2009/079210)和褐孢長毛盤菌GHlO(W02011/057083)的木聚糖酶。[0370]可用于本發(fā)明方法的β_木糖苷酶的實例包括但不限于來自粗糙脈孢菌(Neurosporacrassa)(SwissProt登錄號Q7S0W4)、里氏木霉(Trichodermareesei)(UniProtKB/TrEMBL登錄號Q92458)和埃默森踩節(jié)菌(Talaromycesemersonii)(SwissProt登錄號Q8X212)的β-木糖苷酶。[0371]可用于本發(fā)明方法的乙酰木聚糖酯酶的實例包括但不限于來自棘孢曲霉(W02010/108918)、球毛殼菌(Chaetomiumglobosum)(Uniprot登錄號Q2GWX4)、細_毛殼菌(Chaetomiumgracile)(GeneSeqP登錄號AAB82124)、特異腐質霉(Humicolainsolens)DSM1800(W02009/073709)、紅褐肉座菌(Hypocreajecorina)(W02005/001036)、嗜熱毀絲霉(Wo2010/014880)、粗糙脈孢菌(UniProt登錄號q7s259)、穎枯殼針孢(Phaeosphaerianodorum)(Uniprot登錄號Q0UHJ1)和土生梭孢霉NRRL8126(W02009/042846)的乙酰木聚糖酯酶。[0372]可用于本發(fā)明方法的阿魏酸酯酶的實例包括但不限于來自特異腐質霉DSM1800(W02009/076122)、費希新薩托菌(Neosartoryafischer)(UniProt登錄號A1D9T4)、粗糙脈孢菌(UniProt登錄號Q9HGR3)、橘灰青霉(W02009/127729)和土生梭孢霉(W02010/053838和WO2010/065448)的阿魏酸酯酶。[0373]可用于本發(fā)明方法的阿拉伯呋喃糖苷酶的實例包括但不限于來自黑曲霉(Aspergillusniger)(GeneSeqP登錄號AAR94170)、特異腐質霉(Humicolainsolens)DSM1800(W02006/114094和WO2009/073383)和M.giganteus(W02006/114094)的阿拉伯呋喃糖苷酶。[0374]可用于本發(fā)明方法的α-葡糖醛酸糖苷酶的實例包括但不限于來自棒曲霉(Aspergillusclavatus)(UniProt登錄號alccl2)、煙曲霉(SwissProt登錄號Q4WW45)、黑曲霉(Uniprot登錄號Q96WX9)、土曲霉(Aspergillusterreus)(SwissProt登錄號Q0CJP9)、特異腐質霉(W02010/014706)、橘灰青霉(TO2009/068565)、埃默森踝節(jié)菌(UniProt登錄號Q8X211)和里氏木霉(Uniprot登錄號Q99024)的α-葡糖醒酸糖苷酶。[0375]用于本發(fā)明方法的具有酶活性的多肽可通過在含有合適碳源和氮源和無機鹽的營養(yǎng)培養(yǎng)基上,使用本領域已知方法(參見,例如Bennett,J.W.和LaSure,L.(編),MoreGeneManipulat1nsinFungi,AcademicPress,CA,1991)發(fā)酵上述指出的微生物菌株來產(chǎn)生。合適的培養(yǎng)基可從供應商獲得,或可根據(jù)已公開的組成制備(例如美國典型培養(yǎng)物保藏中心的目錄)。適于生長和酶產(chǎn)生的溫度范圍和其他條件在本領域是已知的(參見,例如Bailey,J.E.和Ollis,D.F.,B1chemicalEngineeringFundamentals,McGraw-HillBookCompany,NY,1986)。[0376]所述發(fā)酵可以是任何導致酶或蛋白表達或分離的培養(yǎng)細胞的方法。因此,發(fā)酵可以理解為包括在合適的培養(yǎng)基中并在允許所述酶得以表達或分離的條件下進行的搖瓶培養(yǎng),或在實驗室或工業(yè)發(fā)酵罐中的小-或大規(guī)模發(fā)酵(包括連續(xù)、分批、補料分批或固態(tài)發(fā)酵)。通過上述方法產(chǎn)生的所得的酶可從發(fā)酵培養(yǎng)基回收并通過常規(guī)方法純化。[0377]發(fā)璧??赏ㄟ^一種或多種(例如幾種)能將糖直接或間接發(fā)酵成所需發(fā)酵產(chǎn)物的發(fā)酵微生物發(fā)酵自經(jīng)水解的纖維素材料獲得的可發(fā)酵糖?!鞍l(fā)酵”或“發(fā)酵方法”指任何發(fā)酵方法或任何包含發(fā)酵步驟的方法。發(fā)酵方法還包括用于消費品醇工業(yè)(例如,啤酒和葡萄酒)、乳品業(yè)(例如,發(fā)酵乳產(chǎn)品)、皮革業(yè)和煙草業(yè)的發(fā)酵方法。發(fā)酵條件依賴于期望的發(fā)酵產(chǎn)物和發(fā)酵生物體,并且能由本領域的技術人員容易地確定。[0378]在發(fā)酵步驟中,作為預處理和酶水解步驟的結果從纖維素材料釋放的糖,通過發(fā)酵生物體(如酵母)發(fā)酵成為產(chǎn)物,例如,乙醇。如本文中所述,水解(糖化)和發(fā)酵可以是單獨或同時的。[0379]在實施本發(fā)明的發(fā)酵步驟中可以使用任何合適的經(jīng)水解的纖維素材料。通常根據(jù)所需發(fā)酵產(chǎn)品(即,要從發(fā)酵獲得的物質)和使用的方法來選擇所述材料,如本領域中所公知的。[0380]術語“發(fā)酵培養(yǎng)基”在本文中可理解為指加入發(fā)酵微生物之前的培養(yǎng)基,如,由糖化過程產(chǎn)生的培養(yǎng)基,以及同時糖化和發(fā)酵方法(SSF)中使用的培養(yǎng)基。[0381]“發(fā)酵微生物”指適用于理想的發(fā)酵方法產(chǎn)生發(fā)酵產(chǎn)物的任何微生物,包括細菌和真菌生物體。發(fā)酵生物體可以是己糖和/或戊糖發(fā)酵生物體,或它們的組合。己糖和戊糖發(fā)酵生物體在本領域均是公知的。合適的發(fā)酵微生物能將糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麥芽糖、甘露糖、半乳糖和/或寡糖)直接或間接地發(fā)酵(即,轉化)成所需的發(fā)酵產(chǎn)品??僧a(chǎn)生乙醇的細菌和真菌發(fā)酵生物體的實例如Lin等,2006,Appl.Microb1l.B1technol.69:627-642所述。[0382]能發(fā)酵己糖的發(fā)酵微生物的實例包括細菌和真菌生物體,如酵母。優(yōu)選的酵母包括假絲酵母屬、克魯維酵母屬和酵母屬,例如Candidasonorensis、馬克斯克魯維酵母和釀酒酵母的菌株。[0383]以其天然狀態(tài)能發(fā)酵戊糖的發(fā)酵生物體的實例包括細菌和真菌生物體,如一些酵母。優(yōu)選的木糖發(fā)酵酵母包括假絲酵母屬,優(yōu)選休哈塔假絲酵母(Candidasheatae)或Candidasonorensis;和畢赤酵母屬,優(yōu)選樹干畢赤酵母(Pichiastipitis)的菌株,如樹干畢赤酵母CBS5773的菌株。優(yōu)選的戍糖發(fā)酵酵母包括管囊酵母屬(Pachysolen),優(yōu)選嗜鞋管囊酵母(Pachysolentannophilus)的菌株。不能夠發(fā)酵戍糖如木糖和阿拉伯糖的生物可通過本領域已知方法遺傳修飾而發(fā)酵戊糖。[0384]能有效地將己糖和戊糖發(fā)酵成乙醇的細菌包括,例如,凝結芽孢桿菌(Bacilluscoagulans)、丙酮丁醇梭菌(Clostridiumacetobutylicum)、熱纖維梭菌(Clostridiumthermocellum)、Clostridiumphytofermentans、地芽抱桿菌屬菌種、解糖熱厭氧桿菌(ThermoanaerobactersaccharoIyticum)和運動發(fā)酵單胞菌(Zymomonasmobilis)(Philippidis,1996,見上文)。[0385]其它發(fā)酵生物包括芽孢桿菌屬,如凝結芽孢桿菌;假絲酵母屬,如Candidasonorensis、C.methanosorbosa、迪丹斯假絲酵母(Candidadiddensii)、近平滑假絲酵母(Candidaparapsilosis)、C.naedodendra、C.blanki1、C.entomophilia、蕓薹假絲酵母(C.brassicae)、假熱帶假絲酵母(Candidapseudotropicalis)、博伊丁假絲酵母(Candidaboidinii)、產(chǎn)I元假絲酵母(Candidautilis)和休哈塔假絲酵母(C.scehatae);梭菌屬,如丙酮丁醇梭菌、熱纖維梭菌和C.phytofermentans;大腸桿菌,特別是經(jīng)遺傳修飾促進乙醇產(chǎn)生的大腸桿菌菌株;地芽孢桿菌屬菌種;漢遜酵母屬,如異常漢遜酵母(Hansenulaanomala);克雷伯氏菌屬(Klebsiella),如產(chǎn)酸克雷伯氏菌(Klebsiellaoxytoca);克魯維酵母屬,如馬克斯克魯維酵母、乳酸克魯維酵母(K.lactis)、K.thermotolerans和脆壁克魯維酵母;裂殖酵母屬,如粟酒裂殖酵母(S.pombe);熱厭氧桿菌屬(Thermoanaerobacter),如解糖熱厭氧桿菌,和發(fā)酵單胞菌屬(Zymomonas),如運動發(fā)酵單胞菌的菌株。[0386]在一個優(yōu)選的方面,酵母是酒香酵母屬(Bretannomyces)。在一個更優(yōu)選的方面,酵母是克勞森酒香酵母(Bretannomycesclausenii)。在另一個更優(yōu)選的方面,酵母是假絲酵母。在另一個更優(yōu)選的方面,酵母是Candidasonorensis。在另一個更優(yōu)選的方面,酵母是博伊丁假絲酵母。在另一個更優(yōu)選的方面,酵母是Candidablankii。在另一個更優(yōu)選的方面,酵母是蕓薹假絲酵母。在另一個更優(yōu)選的方面,酵母是迪丹斯假絲酵母。在另一個更優(yōu)選的方面,酵母是CandidaentomophiIiia0在另一個更優(yōu)選的方面,酵母是假熱帶假絲酵母。在另一個更優(yōu)選的方面,酵母是休哈塔假絲酵母。在另一個更優(yōu)選的方面,酵母是產(chǎn)朊假絲酵母。在另一個優(yōu)選的方面,酵母是棒孢酵母屬(Clavispora)。在另一個更優(yōu)選的方面,酵母是葡萄牙棒孢酵母(ClavisporaIusitaniae)。在另一個更優(yōu)選的方面,酵母是仙人掌棒孢酵母(Clavisporaopuntiae)。在另一個優(yōu)選的方面,酵母是克魯維酵母。在另一個更優(yōu)選的方面,酵母是脆壁克魯維酵母。在另一個更優(yōu)選的方面,酵母是馬克斯克魯維酵母。在另一個更優(yōu)選的方面,酵母是Kluyveromycesthermotolerans。在另一個優(yōu)選的方面,酵母是管囊酵母屬(Pachysolen)。在另一個更優(yōu)選的方面,酵母是嗜鞣管囊酵母。在另一個優(yōu)選的方面,酵母是畢赤酵母。在另一個更優(yōu)選的方面,酵母是樹干畢赤酵母。在另一個優(yōu)選的方面,酵母是酵母屬菌種。在另一個優(yōu)選的方面,酵母是釀酒酵母。在另一個更優(yōu)選的方面,酵母是糖化酵母(Saccharomycesdistaticus)。在另一個更優(yōu)選的方面,酵母是葡萄汁酵母(Saccharomycesuvarum)。[0387]在一個優(yōu)選的方面,細菌是芽孢桿菌屬。在一個更優(yōu)選的方面,細菌是凝結芽孢桿菌。在另一個更優(yōu)選的方面,細菌是梭菌屬。在另一個更優(yōu)選的方面,細菌是丙酮丁醇梭菌。在另一個更優(yōu)選的方面,細菌是Clostridiumphytofermentans。在另一個更優(yōu)選的方面,細菌是熱纖維梭菌。在另一個更優(yōu)選的方面,細菌是地芽孢桿菌屬菌種。在另一個更優(yōu)選的方面,細菌是熱厭氧桿菌屬。在另一個更優(yōu)選的方面,細菌是解糖熱厭氧桿菌。在另一個更優(yōu)選的方面,細菌是發(fā)酵單胞菌屬。在另一個更優(yōu)選的方面,細菌是運動發(fā)酵單胞菌。[0388]商業(yè)上可得到的適合乙醇產(chǎn)生的酵母包括,例如B1FERM?AFT和XR(NABC-NorthAmericanB1productsCorporat1n,GA,USA),ETHANOLRED?酵母(RedStar/Lesaffre,USA)>FALI?(Fleischmann,sYeast,BurnsPhilpFoodInc.,USA),FERM10L?(DSMSpecialties),GERTSTRAND?(GertStrandAB,Sweden)以及SUPERSTART?和THERMOSACC?新鮮酵母(EthanolTechnology,WI,USA)。[0389]在一個優(yōu)選的方面,發(fā)酵微生物已經(jīng)經(jīng)過遺傳修飾從而提供發(fā)酵戊糖的能力,如利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物。[0390]已經(jīng)通過將異源基因克隆入多種發(fā)酵微生物構建了能將己糖和戊糖轉化成乙醇(共發(fā)酵)的生物體(Chen和Ho,1993,Cloningandimprovingtheexpress1nofPichiastipitisxylosereductasegeneinSaccharomycescerevisiae,Appl.B1chem.B1technol.39-40:135-147;Ho等,1998,GeneticallyengineeredSaccharomycesyeastcapableofeffectivelycofermentingglucoseandxylose,Appl.Environ.Microb1l.64:1852-1859;Kotter和Ciriacy,1993,Xylosefermentat1nbySaccharomycescerevisiae,Appl.Microb1l.B1technol.38:776-783;ffalfridsson等,1995,Xylose-metabolizingSaccharomycescerevisiaestrainsoverexpressingtheTKLlandTALIgenesencodingthepentosephosphatepathwayenzymestransketolaseandtransaldolase,Appl.Environ.Microb1l.61:4184-4190;Kuyper等,2004,MinimalmetabolicengineeringofSaccharomycescerevisiaeforefficientanaerobicxylosefermentat1n:aproofofprinciple,FEMSYeastResearch4:655-664;Beall等,1991,Parametricstudiesofethanolproduct1nfromxyloseandothersugarsbyrecombinantEscherichiacoli,B1tech.B1eng.38:296-303;Ingram等,1998,Metabolicengineeringofbacteriaforethanolproduct1n,B1technol.B1eng.58:204-214;Zhang等,1995,MetabolicengineeringofapentosemetabolismpathwayinethanologenicZymomonasmobilis,Science267:240-243;Deanda等,1996,Developmentofanarabinose-fermentingZymomonasmobilisstrainbymetabolicpathwayengineering,Appl.Environ.Microb1l.62:4465-4470;W02003/062430,xyloseisomerase)。[0391]在一個優(yōu)選的方面,經(jīng)過遺傳修飾的發(fā)酵微生物是Candidasonorensi。在另一個優(yōu)選的方面,經(jīng)過遺傳修飾的發(fā)酵微生物是大腸桿菌。在另一個優(yōu)選的方面,經(jīng)過遺傳修飾的發(fā)酵微生物是產(chǎn)酸克雷伯氏菌。在另一個優(yōu)選的方面,所述經(jīng)遺傳修飾的發(fā)酵微生物是馬克斯克魯維酵母。在另一個優(yōu)選的方面,所述經(jīng)遺傳修飾的發(fā)酵微生物是釀酒酵母。在另一個優(yōu)選的方面,經(jīng)過遺傳修飾的發(fā)酵微生物是運動發(fā)酵單胞菌。[0392]本領域中公知的是,上述生物體還能用于產(chǎn)生其它物質,如本文所述。[0393]通常向降解的纖維素材料或水解物加入發(fā)酵微生物,并進行約8至約96小時,例如約24至約60小時發(fā)酵。溫度通常為約26°C至約60°C,例如約32°C或50°C,并且在約pH3至約pH8,例如約pH4-5、6或7。[0394]在一個方面,對降解的纖維素材料施用酵母和/或另一種微生物,并進行約12至約96小時,如通常為24-60小時發(fā)酵。在另一個方面,溫度優(yōu)選為約20°C至約60°C,例如約25°C至約50°C,并且約32°C至約50°C,約32°C至約50°C,并且pH通常為約pH3至約pH7,例如約PH4至約pH7。然而,一些發(fā)酵生物體例如細菌,具有更高的最適發(fā)酵溫度。酵母或另一種微生物優(yōu)選以約15-1O12,優(yōu)選約17-1Oltl,特別是約2xl08活細胞計數(shù)每ml發(fā)酵液的量施用。關于使用酵母進行發(fā)酵的進一步指導可見于例如“TheAlcoholTextbook”(K.Jacques,Τ.P.Lyons和D.R.Kelsall編,NottinghamUniversityPress,UnitedKingdom1999),其通過提述并入本文。[0395]發(fā)酵刺激劑可以與本文所述的任何方法組合使用,以進一步改進發(fā)酵工藝,特別是改進發(fā)酵微生物的性能,如,速率增加和乙醇得率。“發(fā)酵刺激劑”指用于發(fā)酵微生物(特別是酵母)生長的刺激劑。優(yōu)選的用于生長的發(fā)酵刺激劑包括維生素和礦物質。維生素的實例包括多種維生素、生物素、泛酸(鹽)、煙酸、內(nèi)消旋肌醇(meso-1nositol)、硫胺素、吡哆醇(pyridoxine)、對氨基苯甲酸、葉酸、核黃素和維生素A、B、C、D和E。參見,例如,Alfenore等,Improvingethanolproduct1nandviabilityofSaccharomycescerevisiaebyavitaminfeedingstrategyduringfed-batchprocess,Springer-Verlag(2002),其通過提述并入本文。礦物質的實例包括能夠提供營養(yǎng)物的礦物質和礦物質鹽,所述營養(yǎng)物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。[0396]發(fā)酵產(chǎn)物:發(fā)酵產(chǎn)物可以是源自發(fā)酵的任何物質。發(fā)酵產(chǎn)物可以是,不限于,醇(例如,阿拉伯醇、正丁醇、異丁醇、乙醇、甘油、甲醇、乙二醇、1,3-丙二醇(丙二醇)、丁二醇、丙三醇、山梨醇和木糖醇);燒烴(例如戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷和十二烷);環(huán)烷烴(例如環(huán)戊烷、環(huán)己烷、環(huán)庚烷、和環(huán)辛烷);烯烴(例如戊烯、己烯、庚烯和辛烯);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、賴氨酸、絲氨酸和蘇氨酸);氣體(例如,甲烷、氫氣(H2)、二氧化碳(CO2)和一氧化碳(CO));異戊二烯;酮(例如,丙酮);有機酸(例如,乙酸、醋酮酸、己二酸、抗壞血酸、檸檬酸、2,5-二酮-D-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羥基丙酸、衣康酸、乳酸、蘋果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸);和聚酮化合物。發(fā)酵產(chǎn)物還可以是作為高價值產(chǎn)品的蛋白質。[0397]在一個優(yōu)選的方面,發(fā)酵產(chǎn)物是醇??衫斫獾氖?,術語“醇”包括包含一個或多個羥基基團的物質。在更優(yōu)選的方面,所述醇是正丁醇。在另一個更優(yōu)選的方面,所述醇是異丁醇。在另一個更優(yōu)選的方面,所述醇是乙醇。在另一個更優(yōu)選的方面,所述醇是甲醇。在另一個更優(yōu)選的方面,所述醇是阿拉伯糖醇。在另一個更優(yōu)選的方面,所述醇是丁二醇。在另一個更優(yōu)選的方面,所述醇是乙二醇。在另一個更優(yōu)選的方面,所述醇是丙三醇(glycerin)。在另一個更優(yōu)選的方面,所述醇是甘油(glycerol)。在另一個更優(yōu)選的方面,所述醇是1,3-丙二醇。在另一個更優(yōu)選的方面,所述醇是山梨醇。在另一個更優(yōu)選的方面,所述醇是木糖醇。參見,例如,Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanolproduct1nfromrenewableresources,于AdvancesinB1chemicalEngineering/B1technology,Scheper,T.編,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;Silveira,M.M.,和Jonas,R.,2002,Theb1technologicalproduct1nofsorbitol,Appl.Microb1l.B1technol.59:400-408;Nigam,P.和Singh,D.,1995,Processesforfermentativeproduct1nofxylitol-asugarsubstitute,ProcessB1chemistry30(2):117-124;Ezeji,T.C.,Qureshi,N.和Blaschek,H.P.,2003,Product1nofacetone,butanolandethanolbyClostridiumbeijerinckiiBAlOlandinsiturecoverybygasstripping,WorldJournalofMicrob1logyandB1technology19(6):595-603。[0398]在另一個優(yōu)選的方面,所述發(fā)酵產(chǎn)物是烷烴。所述烷烴是未支化或支化的烷烴。在另一個更優(yōu)選的方面,所述烷烴是戊烷。在另一個更優(yōu)選的方面,所述烷烴是己烷。在另一個更優(yōu)選的方面,所述烷烴是庚烷。在另一個更優(yōu)選的方面,所述烷烴是辛烷。在另一個更優(yōu)選的方面,所述烷烴是壬烷。在另一個更優(yōu)選的方面,所述烷烴是癸烷。在另一個更優(yōu)選的方面,所述烷烴是十一烷。在另一個更優(yōu)選的方面,所述烷烴是十二烷。[0399]在另一個優(yōu)選的方面,所述發(fā)酵產(chǎn)物是環(huán)烷烴。在另一個更優(yōu)選的方面,所述環(huán)烷烴是環(huán)戊烷。在另一個更優(yōu)選的方面,所述環(huán)烷烴是環(huán)己烷。在另一個更優(yōu)選的方面,所述環(huán)烷烴是環(huán)庚烷。在另一個更優(yōu)選的方面,所述環(huán)烷烴是環(huán)辛烷。[0400]在另一個優(yōu)選的方面,所述發(fā)酵產(chǎn)物是烯烴。所述烯烴可為未支化或支化的烯烴。在另一個更優(yōu)選的方面,所述烯烴是戊烯。在另一個更優(yōu)選的方面,所述烯烴是己烯。在另一個更優(yōu)選的方面,所述烯烴是庚烯。在另一個更優(yōu)選的方面,所述烯烴是辛烯。[0401]在另一個優(yōu)選的方面,所述發(fā)酵產(chǎn)物是氨基酸。在另一個更優(yōu)選的方面,所述有機酸是天冬氨酸。在另一個更優(yōu)選的方面,所述氨基酸是谷氨酸。在另一個更優(yōu)選的方面,所述氨基酸是甘氨酸。在另一個更優(yōu)選的方面,所述氨基酸是賴氨酸。在另一個更優(yōu)選的方面,所述氨基酸是絲氨酸。在另一個更優(yōu)選的方面,所述氨基酸是蘇氨酸。參見,例如,Richard,A.和Margaritis,A.,2004,Empiricalmodelingofbatchfermentat1nkineticsforpoly(glutamicacid)product1nandothermicrobialb1polymers,B1technologyandB1engineering87(4):501-515。[0402]在另一個優(yōu)選的方面,所述物質是氣體。在另一個更優(yōu)選的方面,所述氣體是甲烷。在另一個更優(yōu)選的方面,所述氣體是H2。在另一個更優(yōu)選的方面,所述氣體是C02。在另一個更優(yōu)選的方面,所述氣體是CO。參見,例如,Kataoka,N.,A.Miya,和K.Kiriyama,1997,Studiesonhydrogenproduct1nbycontinuousculturesystemofhydrogen-producinganaerobicbacteria,WaterScienceandTechnology36(6-7):41-47;和Gunaseelan,V.N.,于B1massandB1energy,Vol.13(1-2),pp83-114,1997,Anaerobicdigest1nofb1massformethaneproduct1n:Areview。[0403]在另一個優(yōu)選的方面,所述發(fā)酵產(chǎn)物是異戊二烯。[0404]在另一個優(yōu)選的方面,所述發(fā)酵產(chǎn)物是酮。應理解的是,術語“酮”涵蓋了含有一個或多個酮模塊的酮。在另一個更優(yōu)選的方面,所述酮是丙酮。參見,例如Qureshi和Blaschek,2003,見上文。[0405]在另一個優(yōu)選的方面,所述發(fā)酵產(chǎn)物是有機酸。在另一個更優(yōu)選的方面,所述有機酸是乙酸。在另一個更優(yōu)選的方面,所述有機酸是醋酮酸。在另一個更優(yōu)選的方面,所述有機酸是己二酸。在另一個更優(yōu)選的方面,所述有機酸是抗壞血酸。在另一個更優(yōu)選的方面,所述有機酸是檸檬酸。在另一個更優(yōu)選的方面,所述有機酸是2,5-二酮-D-葡糖酸。在另一個更優(yōu)選的方面,所述有機酸是甲酸。在另一個更優(yōu)選的方面,所述有機酸是反丁烯二酸。在另一個更優(yōu)選的方面,所述有機酸是葡糖二酸。在另一個更優(yōu)選的方面,所述有機酸是葡糖酸。在另一個更優(yōu)選的方面,所述有機酸是葡糖醛酸。在另一個更優(yōu)選的方面,所述有機酸是戊二酸。在另一個優(yōu)選的方面,所述有機酸是3-羥基丙酸。在另一個更優(yōu)選的方面,所述有機酸是衣康酸。在另一個更優(yōu)選的方面,所述有機酸是乳酸。在另一個更優(yōu)選的方面,所述有機酸是蘋果酸。在另一個更優(yōu)選的方面,所述有機酸是丙二酸。在另一個更優(yōu)選的方面,所述有機酸是草酸。在另一個更優(yōu)選的方面,所述有機酸是丙酸。在另一個更優(yōu)選的方面,所述有機酸是琥珀酸。在另一個更優(yōu)選的方面,所述有機酸是木糖酸。參見,例如,Chen,R.和Lee,Y.Y.,1997,Membrane-mediatedextractivefermentat1nforlacticacidproduct1nfromcellulosicb1mass,Appl.B1chem.B1technol.63-65:435—448。[0406]在另一個優(yōu)選的方面,所述物質是聚酮化合物。[0407]通I可以使用本領域已知的任何方法,任選地從發(fā)酵培養(yǎng)基回收發(fā)酵產(chǎn)物,所述方法包括,但不限于,層析、電泳方法、差示溶解度、蒸餾或提取。例如,通過常規(guī)蒸餾方法從發(fā)酵的纖維素材料分離并純化醇??梢垣@得純度高達約96vol.%的乙醇,其能用作,例如,燃料乙醇、飲用乙醇(即,可飲用的中性含酒精飲料),或工業(yè)乙醇。[0408]信號肽[0409]本發(fā)明還涉及編碼信號肽的分離的多核苷酸,所述信號肽包含或組成為SEQIDNO:2的氨基酸I至21。在一個方面,所述多核苷酸是SEQIDNO:1的核苷酸I至63。本發(fā)明還涉及編碼信號肽的分離的多核苷酸,所述信號肽包含或組成為SEQIDN0:4的氨基酸I至16。在一個方面,所述多核苷酸是SEQIDN0:3的核苷酸I至48。本發(fā)明還涉及編碼信號肽的分離的多核苷酸,所述信號肽包含或組成為SEQIDN0:6的氨基酸I至18。在一個方面,所述多核苷酸是SEQIDN0:5的核苷酸I至54。本發(fā)明還涉及編碼信號肽的分離的多核苷酸,所述信號肽包含或組成為SEQIDN0:8的氨基酸I至19。在一個方面,所述多核苷酸是SEQIDN0:7的核苷酸I至57。本發(fā)明還涉及編碼信號肽的分離的多核苷酸,所述信號肽包含或組成為SEQIDNO:10的氨基酸I至24。在一個方面,所述多核苷酸是SEQIDN0:9的核苷酸I至72。本發(fā)明還涉及編碼信號肽的分離的多核苷酸,所述信號肽包含或組成為SEQIDNO:12的氨基酸I至18。在一個方面,所述多核苷酸是SEQIDNO:11的核苷酸I至54。本發(fā)明還涉及編碼信號肽的分離的多核苷酸,所述信號肽包含或組成為SEQIDNO:14的氨基酸I至18。在一個方面,所述多核苷酸是SEQIDNO:13的核苷酸I至54。本發(fā)明還涉及編碼信號肽的分離的多核苷酸,所述信號肽包含或組成為SEQIDNO:16的氨基酸I至19。在一個方面,所述多核苷酸是SEQIDNO:15的核苷酸I至57。本發(fā)明還涉及編碼信號肽的分離的多核苷酸,所述信號肽包含或組成為SEQIDNO:18的氨基酸I至29。在一個方面,所述多核苷酸是SEQIDNO:17的核苷酸I至57。本發(fā)明還涉及編碼信號肽的分離的多核苷酸,所述信號肽包含或組成為SEQIDNO:20的氨基酸I至15。在一個方面,所述多核苷酸是SEQIDNO:19的核苷酸I至45。本發(fā)明還涉及編碼信號肽的分離的多核苷酸,所述信號肽包含或組成為SEQIDNO:22的氨基酸I至18。在一個方面,所述多核苷酸是SEQIDNO:21的核苷酸I至54。本發(fā)明還涉及編碼信號肽的分離的多核苷酸,所述信號肽包含或組成為SEQIDNO:24的氨基酸I至35。在一個方面,所述多核苷酸是SEQIDNO:23的核苷酸I至105。所述多核苷酸還可包含編碼蛋白的基因,其可操作地連接于信號肽。所述蛋白優(yōu)選地對于信號肽是外源的。[0410]本發(fā)明還涉及包含此種多核苷酸的核酸構建體、表達載體和重組宿主細胞。[0411]本發(fā)明還涉及用于產(chǎn)生蛋白質的方法,包括:(a)培養(yǎng)包含可操作連接的此種多核苷酸與編碼所述蛋白的基因的重組宿主細胞;和任選地(b)回收所述蛋白質。[0412]所述蛋白質對于宿主細胞可以是天然的或異源的。術語“蛋白質”在本文的意思不是指特定長度的編碼產(chǎn)物,并且因此涵蓋肽、寡肽和多肽。術語“蛋白質”還涵蓋經(jīng)組合以形成編碼產(chǎn)物的兩種以上多肽。所述蛋白質還包括雜合多肽和融合多肽。[0413]優(yōu)選蛋白質是激素、酶、受體或其部分、抗體或其部分,或報告蛋白(reporter)。例如,所述蛋白質可為水解酶、異構酶、連接酶、裂合酶(Iyase)、氧化還原酶或轉移酶,例如α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、殼多糖酶、角質酶、環(huán)糊精糖基轉移酶、脫氧核糖核酸酶、內(nèi)切葡聚糖酶、酯酶、葡糖淀粉酶、轉化酶、漆酶、脂肪酶、甘露糖苷酶、變聚糖酶(mutanase)、氧化酶、果膠分解酶、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶、或木聚糖酶。[0414]基因可以從任何原核、真核或其它來源獲得。[0415]通過以下實施例進一步對本發(fā)明進行描述,但不應將其理解為對本發(fā)明范圍的限制。實施例[0416]菌株[0417]真菌菌株NN000308購自真菌菌種保藏中心(CentraalbureauVoorSchimmelcultures),命名為CBS174.70?;谛螒B(tài)學特征和ITSrDNA序列二者將菌株NN000308鑒定為Corynascusthermophilus(之前鑒定為Thielaviathermophila,同種異名Mycel1phthorafergusii)。[0418]真菌菌株NN044758通過在45°C用PDA培養(yǎng)基的稀釋平板方法從收集自中國的土壤樣品分離。然后通過將單個分生孢子轉移至YG瓊脂平板上來進行純化?;谛螒B(tài)學特征和ITSrDNA序列二者將菌株NN044758鑒定為Malbrancheacinnamomea。[0419]真菌菌株NN051380從收集自中國的土壤樣品分離?;谛螒B(tài)學特征和ITSrDNA序列二者將菌株NN051380鑒定為草酸青霉。[0420]真菌菌株NN044936從收集自中國的土壤樣品分離?;谛螒B(tài)學特征和ITSrDNA序列二者將菌株NN044936鑒定為桔橙嗜熱子囊菌。[0421]真菌菌株NN047338通過在45°C用PDA培養(yǎng)基的稀釋平板方法從收集自中國的土壤樣品分離。然后通過將單個分生孢子轉移至YG瓊脂平板上來進行純化。基于形態(tài)學特征和ITSrDNA序列二者將菌株NN047338鑒定為Scytalidiumthermophilum。[0422]真菌菌株通過在45°C用PDA培養(yǎng)基的稀釋平板方法NN051602從收集自中國的堆肥樣品分離。然后通過將單個分生孢子轉移至YG瓊脂平板上來進行純化?;谛螒B(tài)學特征和ITSrDNA序列二者將菌株NN051602鑒定為Penicilliumemersonii。[0423]培養(yǎng)基[0424]PDA培養(yǎng)基由39克的馬鈴薯右旋糖瓊脂和去離子水加至I升構成。[0425]YG瓊脂平板由5.0g的酵母提取物,10.0g的葡萄糖,20.0g的瓊脂,和去離子水加至I升構成。[0426]YPG培養(yǎng)基由去離子水中的0.4%的酵母提取物,0.1%的KH2PO4,0.05%的MgSO4.7H20,和1.5%葡萄糖構成。[0427]YPM培養(yǎng)基由去離子水中的I%的酵母提取物,2%的蛋白胨,和2%的麥芽糖構成。[0428]Czapek培養(yǎng)基在I升最終體積的水中含有30克的蔗糖,3克的NaNO3,0.5克的MgSO4.7H20,0.01克的FeSO4.7H20,I克的K2HPO4和0.5克的KCl。pH用IMHCl調整至pH40[0429]基本培養(yǎng)基平板由342g的蔗糖,20ml的鹽溶液,20g的瓊脂,和去離子水加至I升構成。鹽溶液由2.6%KCl,2.6%MgSO4.7H20,7.6%KH2PO4,2ppmNa2B4O7.1H2O,20ppmCuSO4.5H20,40ppmFeSO4.7H20,40ppmMnSO4.2H20,40ppmNa2MoO4.2H20,和400ppmZnSO4.7H20構成。[0430]實施例1:Corynascusthermophilus基因組DNA提取[0431]將Corynascusthermophilus菌株NN000308接種于PDA平板上并在45°C避光溫育3日。將數(shù)個菌絲體-PDA栓接種入含有10ml的YPG培養(yǎng)基的500ml搖瓶。將瓶在45°C在160rpm振蕩下溫育3日。菌絲體通過經(jīng)由MIRACLOTH⑩(Calb1chem,LaJolla,CA,USA)過濾來收集并在液氮中凍結。將凍結的菌絲體通過研缽和杵磨碎至細微粉末,并使用DNEASY?PlantMaxiKit(QIAGENGmbH,Hilden,Germany)分離基因組DNA。[0432]實施例2:基因組測序、匯編和調繪[0433]將提取的基因組DNA樣品遞送至BeijingGenomeInstitute(BGI,Shenzhen,China)以供使用ILLUMINA?GA2System(Illumina,Inc.,SanDiego,CA,USA)的基因組測序。將粗讀取在BGI使用SOAPdenovo程序(Li等,2010,GenomeResearch20(2):265-72)進行匯編。將匯編的序列使用標準生物信息學方法進行分析以供基因鑒定和功能預測。使用geneID(Parra等,2000,GenomeResearch10(4):511-515)進行基因預測。使用Blastall版本2.2.10(Altschul等,1990,J.Mol.B1l.215(3):403-410,Nat1nalCenterforB1technologyInformat1n(NCBI),Bethesda,MD,USA)和HMMER版本2.1.1(Nat1nalCenterforB1technologyInformat1n(NCBI),Bethesda,MD,USA)基于結構同源性預測功能。家族GH5內(nèi)切葡聚糖酶基因通過Blast結果的分析直接鑒定出。使用Agene程序(Munch和Krogh,2006,BMCB1informatics7:263)和SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6)鑒定起始密碼子。進一步使用SignalP程序預測信號肽。使用Pepstats(Rice等,2000,TrendsGenet.16(6):276-277)預測蛋白的等電點和推導的氨基酸序列的分子量。[0434]實施例3:從基因組DNA克隆CorynascusthermophilusGH5內(nèi)切葡聚糖酶基因[0435]選擇兩個GH5內(nèi)切葡聚糖酶基因(表1中所示)進行表達克隆。[0436]表1:GH5內(nèi)切葡聚糖酶基因[0437]【權利要求】1.一種具有內(nèi)切葡聚糖酶活性的分離的多肽,其選自下組:(a)多肽,其與SEQIDN0:4的成熟多肽具有至少90%,例如至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,多肽,其與SEQIDNO:14的成熟多肽具有至少71%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,多肽,其與SEQIDNO:18的成熟多肽或SEQIDNO:24的成熟多肽具有至少65%,例如至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,多肽,其與SEQIDN0:10的成熟多肽,SEQIDNO:22的成熟多肽,或SEQIDNO:22的成熟多肽具有至少70%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,多肽,其與SEQIDNO:6的成熟多肽,SEQIDNO:8的成熟多肽,或SEQIDNO:16的成熟多肽具有至少75%,例如至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,多肽,其與SEQIDNO:12的成熟多肽具有至少76%,例如至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,或多肽,其與SEQIDNO:20的成熟多肽具有至少80%,例如至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸在低、中等、中等-高、高、或非常高嚴格條件下與以下雜交:(i)SEQIDNO:3的成熟多肽編碼序列,SEQIDNO:13的成熟多肽編碼序列,SEQIDNO:1的成熟多肽編碼序列,SEQIDNO:5的成熟多肽編碼序列,SEQIDNO:7的成熟多肽編碼序列,SEQIDNO:11的成熟多肽編碼序列,SEQIDNO:15的成熟多肽編碼序列,SEQIDNO:21的成熟多肽編碼序列,或SEQIDNO:23的成熟多肽編碼序列,或其cDNA序列(ii),SEQIDNO:9的成熟多肽編碼序列,SEQIDNO:17的成熟多肽編碼序列,或SEQIDNO:19的成熟多肽編碼序列,或(iii)(i)或(ii)的全長互補物;(c)多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:3的成熟多肽編碼序列具有至少90%,例如至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:13的成熟多肽編碼序列具有至少71%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:17的成熟多肽編碼序列或SEQIDNO:23的成熟多肽編碼序列具有至少65%,例如至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:9的成熟多肽編碼序列,SEQIDNO:21的成熟多肽編碼序列或SEQIDNO:1的成熟多肽編碼序列具有至少70%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:5的成熟多肽編碼序列,SEQIDNO:7的成熟多肽編碼序列或SEQIDNO:15的成熟多肽編碼序列具有至少75%,例如至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:11的成熟多肽編碼序列具有至少76%,例如至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,或多肽,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:19的成熟多肽編碼序列具有至少80%,例如至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;(d)SEQIDNO:4的成熟多肽的變體,SEQIDNO:2的成熟多肽的變體,SEQIDNO:6的成熟多肽的變體,SEQIDNO:8的成熟多肽的變體,SEQIDNO:10的成熟多肽的變體,SEQIDNO:12的成熟多肽的變體,SEQIDNO:14的成熟多肽的變體,SEQIDNO:16的成熟多肽的變體,SEQIDNO:18的成熟多肽的變體,SEQIDNO:20的成熟多肽的變體,SEQIDNO:22的成熟多肽的變體,或SEQIDNO:24的成熟多肽的變體,其在一個或多個(例如幾個)位置包含取代、缺失和/或插入;和(e)(a),(b),(c),或(d)的多肽的片段,其具有內(nèi)切葡聚糖酶活性。2.權利要求1的多肽,其包含或組成為SEQIDNO:4,SEQIDNO:14,SEQIDNO:2,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,SEQIDNO:22,或SEQIDNO:24,或其成熟多肽。3.一種分離的多肽,其包含催化域,所述催化域選自下組:(a)催化域,其與SEQIDN0:4的氨基酸80-383具有至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,催化域,其與SEQIDNO:14的氨基酸45-346具有至少71%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,催化域,其與SEQIDNO:18的氨基酸61-448或SEQIDNO:24的氨基酸60-444具有至少65%,至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,催化域,其與SEQIDNO:10的氨基酸49-416,SEQIDNO:22的氨基酸80-404或SEQIDNO:2的氨基酸.22-390具有至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少.92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,多肽,其與SEQIDNO:6的氨基酸20-342,SEQIDNO:8的氨基酸26-382或SEQIDNO:16的氨基酸26-418具有至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少.99%,或100%序列同一性,催化域,其與SEQIDNO:12的氨基酸19-324具有至少76%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少.95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,或催化域,其與SEQIDNO:20的氨基酸28-414具有至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少.93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;(b)催化域,其由多核苷酸編碼,所述多核苷酸在低、中等、中等-高、高、或非常高嚴格條件下與以下雜交:(i)SEQIDNO:3的核苷酸238至1441,SEQIDNO:13的核苷酸133至.1316,SEQIDNO:1的核苷酸64至1254,SEQIDNO:5的核苷酸58至1300,SEQIDNO:7的核苷酸76至1230,SEQIDNO:11的核苷酸55至1333,SEQIDNO:15的核苷酸76至1452,SEQIDNO:21的核苷酸349至1535,或SEQIDNO:23的核苷酸178至1332,或其cDNA序列(ii),SEQIDNO:9的核苷酸145至1248,SEQIDNO:17的核苷酸181至1344,或SEQIDNO:19的核苷酸82至1242,或(iii)⑴或(ii)的全長互補物;(c)催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:3的核苷酸238至1441具有至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:13的核苷酸133至1316具有至少71%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:17的核苷酸181至1344或SEQIDNO:23的核苷酸178至1332具有至少65%,至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:9的核苷酸145至1248,SEQIDNO:21的核苷酸349至1535或SEQIDNO:1的核苷酸64至1254具有至少70%,至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:5的核苷酸58至1300,SEQIDNO:7的核苷酸76至1230或SEQIDNO:15的核苷酸76至1452具有至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:11的核苷酸55至1333具有至少76%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,或催化域,其由多核苷酸編碼,所述多核苷酸與SEQIDNO:19的核苷酸82至1242具有至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;(d)SEQIDNO:4的氨基酸80至383的,SEQIDNO:14的氨基酸45至346的,SEQIDNO:2的氨基酸22至390的,SEQIDNO:6的氨基酸20至342的,SEQIDNO:8的氨基酸26至382的,SEQIDNO:10的氨基酸49至416的,SEQIDNO:12的氨基酸19至324的,SEQIDNO:16的氨基酸26至418的,SEQIDNO:18的氨基酸61至448的,SEQIDNO:20的氨基酸28至414的,SEQIDNO:22的氨基酸80至404的,或SEQIDNO:24的氨基酸60至444的變體,其在一個或多個(例如幾個)位置包含取代、缺失和/或插入;和(e)(a),(b),(c),或(d)的催化域的片段,其具有內(nèi)切葡聚糖酶活性。4.一種分離的多肽,其包含碳水化合物結合域,所述碳水化合物結合域選自下組:(a)碳水化合物結合域,其與SEQIDN0:4的氨基酸17至52具有至少90%,例如至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,與SEQIDNO:14的氨基酸442至474具有至少71%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,或與SEQIDNO:22的氨基酸22至50具有至少70%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;(b)碳水化合物結合域,其由多核苷酸編碼,所述多核苷酸在低、中等、中等-高、高、或非常高嚴格條件下與以下雜交:(i)SEQIDNO:3的核苷酸49至159,SEQIDNO:13的多核苷酸1602至1700,或SEQIDNO:21的核苷酸64至261,(ii)其cDNA序列,或(iii)⑴或(ii)的全長互補物;(c)碳水化合物結合域,其由多核苷酸編碼,所述多核苷酸與SEQIDN0:3的核苷酸49至156具有至少90%,例如至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,與SEQIDNO:13的核苷酸1602至1700具有至少71%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,或與SEQIDNO:21的核苷酸64至261具有至少70%,例如至少75%,至少78%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;(d)SEQIDNO:4的氨基酸17至52的,SEQIDNO:14的氨基酸442至474的或SEQIDNO:22的氨基酸22至50的變體,其在一個或多個(例如幾個)位置包含取代、缺失和/或插入;和(e)(a),(b),(c)或(d)的碳水化合物結合域的片段,其具有碳水化合物結合活性。5.—種分離的多核苷酸,其編碼權利要求1-4任一項的多肽。6.一種重組宿主細胞,其包含權利要求5的多核苷酸,所述多核苷酸可操作地連接于一個或多個指導具有內(nèi)切葡聚糖酶活性的多肽的產(chǎn)生的調控序列。7.—種產(chǎn)生權利要求1-4任一項的多肽的方法,其包括:(a)在有助于所述多肽產(chǎn)生的條件下培養(yǎng)細胞,所述細胞以其野生型形式產(chǎn)生所述多肽;和任選地(b)回收所述多肽。8.—種產(chǎn)生具有內(nèi)切葡聚糖酶活性的多肽的方法,其包括:(a)在有助于所述多肽產(chǎn)生的條件下培養(yǎng)權利要求6的重組宿主細胞;和任選地(b)回收所述多肽。9.一種轉基因植物、植物部分或植物細胞,其由編碼權利要求1-4任一項的多肽的多核苷酸轉化。10.一種產(chǎn)生具有內(nèi)切葡聚糖酶活性的多肽的方法,其包括:(a)在有助于所述多肽產(chǎn)生的條件下培養(yǎng)權利要求9的轉基因植物或植物細胞;和任選地(b)回收所述多肽。11.一種分離的多核苷酸,其編碼信號肽,所述信號肽包含或組成為SEQIDN0:4的氨基酸I至16,SEQIDNO:14的氨基酸I至18,SEQIDNO:2的氨基酸I至21,SEQIDNO:6的氨基酸I至18,SEQIDNO:8的氨基酸I至19,SEQIDNO:10的氨基酸I至24,SEQIDNO:12的氨基酸I至18,SEQIDNO:16的氨基酸I至19,SEQIDNO:18的氨基酸I至29,SEQIDNO:20的氨基酸I至15,SEQIDNO:22的氨基酸I至18,或SEQIDNO:24的氨基酸I至35。12.—種產(chǎn)生蛋白質的方法,其包括:(a)在有助于所述蛋白質產(chǎn)生的條件下培養(yǎng)重組宿主細胞,所述重組宿主細胞包含與權利要求11的多核苷酸可操作連接的編碼蛋白質的基因,其中所述基因對于編碼信號肽的多核苷酸而言是外源的;和任選地(b)回收所述多肽。13.一種降解或轉化纖維素材料的方法,其包括:在權利要求1-4任一項的具有內(nèi)切葡聚糖酶活性的多肽存在下用酶組合物處理纖維素材料。14.權利要求13的方法,其進一步包括回收經(jīng)降解的纖維素材料。15.—種產(chǎn)生發(fā)酵產(chǎn)物的方法,其包括:(a)在權利要求1-4任一項的具有內(nèi)切葡聚糖酶活性的多肽存在下,用酶組合物糖化纖維素材料;(b)用一種或多種發(fā)酵微生物發(fā)酵經(jīng)糖化的纖維素材料以產(chǎn)生發(fā)酵產(chǎn)物;和任選地(C)從所述發(fā)酵中回收所述發(fā)酵產(chǎn)物。16.一種發(fā)酵纖維素材料的方法,其包括:用一種或多種發(fā)酵微生物發(fā)酵纖維素材料,其中所述纖維素材料是在權利要求1-4任一項的具有內(nèi)切葡聚糖酶活性的多肽的存在下用酶組合物糖化的。17.權利要求16的方法,其進一步包括從發(fā)酵回收發(fā)酵產(chǎn)物。18.—種全培養(yǎng)液配制物或細胞培養(yǎng)組合物,其包含權利要求1-4任一項的多肽。【文檔編號】C12N9/42GK104136608SQ201280069558【公開日】2014年11月5日申請日期:2012年12月14日優(yōu)先權日:2011年12月15日【發(fā)明者】劉曄,張羽,段俊欣,湯嵐申請人:諾維信股份有限公司