專(zhuān)利名稱(chēng):使用過(guò)氧化物酶修飾非淀粉的碳水化合物材料的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于以下的方法修飾包含非淀粉的碳水化合物材料的材料,提高這 類(lèi)材料對(duì)酶促降解的易感性,降解這類(lèi)材料和使用過(guò)氧化物酶由這類(lèi)材料生產(chǎn)一種或多種 糖。本發(fā)明還涉及過(guò)氧化物酶在這類(lèi)方法中的用途。
背景技術(shù):
碳水化合物組成地球上最豐量的有機(jī)化合物。然而,許多這類(lèi)碳水化合物隱蔽在 復(fù)合聚合物中,包括淀粉(種子和谷物中的主要儲(chǔ)存碳水化合物)和已知為木質(zhì)纖維素的 碳水化合物與木質(zhì)素的集合。木質(zhì)纖維素的主要碳水化合物組分是纖維素、半纖維素和果 膠。這些復(fù)合的聚合物通常被合稱(chēng)為木質(zhì)纖維素。從由于OPEC減少石油輸出而導(dǎo)致石油危機(jī)爆發(fā)的70年代開(kāi)始,可再生的木質(zhì)纖 維素生物質(zhì)成為可發(fā)酵的糖的生物轉(zhuǎn)化吸引了研究人員強(qiáng)烈的注意力,所述可發(fā)酵的糖隨 后被發(fā)酵產(chǎn)生醇(例如乙醇),作為液體燃料的替代品。在過(guò)去二十年間,乙醇已被廣泛使 用,在美國(guó)作為與汽油的10%的摻合物,或在巴西作為車(chē)輛的純?nèi)剂稀8┠?,?shí)現(xiàn)了 E85(85%乙醇摻合物)的使用,特別是用于清潔城市應(yīng)用。燃料生物乙醇的重要性將會(huì)隨 著油價(jià)的提高及其來(lái)源的逐漸耗盡而提高。另外,可發(fā)酵的糖被用于生產(chǎn)塑料、聚合物和其 它基于生物的制品,這一工業(yè)預(yù)期會(huì)大幅增長(zhǎng),因此提高了對(duì)豐量的可以被用作原料來(lái)代 替基于石油的原料的低成本可發(fā)酵糖的需求。這類(lèi)大量碳水化合物在植物生物質(zhì)中的掩蔽提供了糖(五碳糖以及六碳糖)形式 的大量潛在的能量來(lái)源,所述糖能夠被用于大量工業(yè)和農(nóng)業(yè)過(guò)程中。然而,這些碳水化合物 的大量能源潛力目前利用不足,因?yàn)樘潜绘i定在復(fù)合聚合物中,因此不容易進(jìn)行發(fā)酵。由植 物生物質(zhì)生產(chǎn)糖的方法會(huì)提供大量的、經(jīng)濟(jì)上有競(jìng)爭(zhēng)力的原料,用于發(fā)酵成化學(xué)品、塑料和 燃料。盡管過(guò)去幾十年為了理解酶促木質(zhì)纖維素生物質(zhì)降解和纖維素酶生產(chǎn)而進(jìn)行了 持續(xù)的研究,但是仍然期望發(fā)現(xiàn)或者改造新的有高度活性的纖維素酶和半纖維素酶。還高 度期望構(gòu)建能夠進(jìn)行迅速和高效的木質(zhì)纖維素材料生物降解的高效的酶組合物。另外,典型地使用化學(xué)-機(jī)械方法,從而釋放纖維素,以便隨后被轉(zhuǎn)化成可發(fā)酵的 糖。這類(lèi)化學(xué)-機(jī)械方法需要昂貴的反應(yīng)器并且是能量密集型的。另外,在高溫和極端PH 條件下發(fā)生的化學(xué)預(yù)處理與已知的纖維素降解酶不相容。另外,這些反映產(chǎn)生的化合物在 進(jìn)行發(fā)酵之前必須去除。因此,化學(xué)預(yù)處理方法目前在與纖維素降解分開(kāi)的反應(yīng)器中發(fā)生, 并且必須在纖維素降解之前發(fā)生。因此,與纖維素降解過(guò)程更加相容的、不需要高溫和高壓的、不產(chǎn)生有毒廢棄制品 并且需要更少能量的方法是期望的。
發(fā)明內(nèi)容
我們展示了 Marasmius scorodonius的過(guò)氧化物酶能夠幫助纖維素酶從木質(zhì)纖維 素原料中釋放與不存在所述過(guò)氧化物酶時(shí)相比更大量的糖。
根據(jù)本發(fā)明,因此提供了用于修飾包含非淀粉的碳水化合物的材料的方法,所述 方法包括將所述包含非淀粉的碳水化合物的材料與具有過(guò)氧化物酶活性的多肽接觸,并 且所述多肽是a.包含SEQ NO 2的第21到513位氨基酸;SEQ NO 4的第20到510位氨基酸; SEQ NO 6的第1到493位氨基;或SEQ NO 8的第1到491位氨基酸之任一中示出的氨基 酸序列的多肽,或所述多肽的功能等同物或片段;或b.由包含 SEQ ID NO 1 的第 61 至Ij 1539 位核苷酸;SEQ ID NO 3 的第 58 到 1530 位核苷酸;SEQ ID NO 5的第1到1479位核苷酸;或SEQ ID NO 7的第1到1473位核苷酸 之任一中示出的核苷酸序列的多核苷酸編碼的多肽,或所述多肽的功能等同物或片段,從而修飾所述包含非淀粉的碳水化合物的材料。本發(fā)明還提供了 -提高所述包含非淀粉的碳水化合物的材料對(duì)酶促降解的易感性的方法,所述方 法包括將所述包含非淀粉的碳水化合物材料的材料與具有過(guò)氧化物酶活性的多肽接觸,并 且所述多肽是a.包含SEQ NO 2的第21到513位氨基酸;SEQ NO 4的第20到510位氨基酸; SEQ NO 6的第1到493位氨基;或SEQ NO 8的第1到491位氨基酸之任一中示出的氨基 酸序列的多肽,或所述多肽的功能等同物或片段;或b.由包含 SEQ ID NO 1 的第 61 至Ij 1539 位核苷酸;SEQ ID NO 3 的第 58 到 1530 位核苷酸;SEQ ID NO 5的第1到1479位核苷酸;或SEQ ID NO 7的第1到1473位核苷酸 之任一中示出的核苷酸序列的多核苷酸編碼的多肽,或所述多肽的功能等同物或片段,從而提高包含非淀粉的碳水化合物的材料對(duì)酶促降解的易感性;-用于降解包含非淀粉的碳水化合物的材料的方法,所述方法包括(i)使用上文所述的方法修飾所述包含非淀粉的碳水化合物的材料,或提高所述 包含非淀粉的碳水化合物的材料對(duì)酶促降解的易感性;和(ii)將藉此修飾的包含非淀粉的碳水化合物的材料與纖維素酶和/或半纖維素 酶和/或果膠酶接觸,從而降解所述包含非淀粉的碳水化合物的材料;-用于降解所述包含非淀粉的碳水化合物的材料的方法,所述方法包括將所述包 含非淀粉的碳水化合物的材料與下述物質(zhì)接觸(i)具有過(guò)氧化物酶活性的多肽,并且所述多肽是a.包含SEQ NO 2的第21到513位氨基酸;SEQ NO 4的第20到510位氨基酸; SEQ NO 6的第1到493位氨基;或SEQ NO 8的第1到491位氨基酸之任一中示出的氨基 酸序列的多肽,或所述多肽的功能等同物或片段;或b.由包含 SEQ ID NO 1 的第 61 至Ij 1539 位核苷酸;SEQ ID NO 3 的第 58 到 1530 位核苷酸;SEQ ID NO 5的第1到1479位核苷酸;或SEQ ID NO 7的第1到1473位核苷酸 之任一中示出的核苷酸序列的多核苷酸編碼的多肽,或所述多肽的功能等同物或片段,和(ii)纖維素酶和/或半纖維素酶和/或果膠酶,從而降解所述包含非淀粉的碳水化合物的材料;-由包含非淀粉的碳水化合物的材料生產(chǎn)一種或多種糖的方法,所述方法包括
(i)使用上文所述的方法修飾所述包含非淀粉的碳水化合物的材料,或提高所述 包含非淀粉的碳水化合物的材料對(duì)酶促降解的易感性;和(ii)將藉此修飾的包含非淀粉的碳水化合物的材料與纖維素酶和/或半纖維素 酶和/或果膠酶接觸,從而由所述包含非淀粉的碳水化合物的材料生產(chǎn)一種或多種糖;和-由包含非淀粉的碳水化合物的材料生產(chǎn)一種或多種糖的方法,所述方法包括將 所述包含非淀粉的碳水化合物的材料與以下物質(zhì)接觸(i)具有過(guò)氧化物酶活性的多肽,并且所述多肽是a.包含SEQ NO 2的第21到513位氨基酸;SEQ NO 4的第20到510位氨基酸; SEQ NO 6的第1到493位氨基;或SEQ NO 8的第1到491位氨基酸之任一中示出的氨基 酸序列的多肽,或所述多肽的功能等同物或片段;或b.由包含 SEQ ID NO 1 的第 61 至Ij 1539 位核苷酸;SEQ ID NO 3 的第 58 到 1530 位核苷酸;SEQ ID NO 5的第1到1479位核苷酸;或SEQ ID NO 7的第1到1473位核苷酸 之任一中示出的核苷酸序列的多核苷酸編碼的多肽,或所述多肽的功能等同物或片段,和(ii)纖維素酶和/或半纖維素酶和/或果膠酶,從而由包含非淀粉的碳水化合物的材料生產(chǎn)一種或多種糖。上文公開(kāi)的本發(fā)明的方法可以如下方式進(jìn)行,使得具有過(guò)氧化物酶活性的多肽在 預(yù)處理步驟期間、之前或之后與非淀粉的碳水化合物材料接觸(或者事實(shí)上其自身可以被 用作預(yù)處理步驟)。因此,本發(fā)明的方法可以是經(jīng)改進(jìn)的預(yù)處理方法,因?yàn)樵陬A(yù)處理期間、 之前或之后使用具有過(guò)氧化物酶活性的多肽可允許在這類(lèi)預(yù)處理中使用更少的化學(xué)品和/ 或能量。用于這類(lèi)預(yù)處理的條件可以與隨后非淀粉的碳水化合物發(fā)生降解的條件更加相 容。本發(fā)明還提供了用于制備發(fā)酵產(chǎn)物的方法,所述方法包括a.使用上述方法降解非淀粉的碳水化合物材料或由非淀粉的碳水化合物材料生 產(chǎn)一種或多種糖;和b.發(fā)酵得到的材料,從而制備發(fā)酵產(chǎn)物;和本發(fā)明還涉及上述具有過(guò)氧化物酶活性的多肽用于下述方法中的用途,所述方法 用于修飾包含非淀粉的碳水化合物材料的材料;提高包含非淀粉的碳水化合物的材料對(duì) 酶促降解的易感性;降解包含非淀粉的碳水化合物的材料;或由包含非淀粉的碳水化合物 的材料生產(chǎn)一種或多種糖。本發(fā)明涉及上述具有過(guò)氧化物酶活性的多肽在包含非淀粉的碳 水化合物的材料的預(yù)處理方法中的用途。本發(fā)明還提供了用于制備發(fā)酵產(chǎn)物的方法,所述方法包括a.根據(jù)上述方法降解非淀粉的碳水化合物材料或由非淀粉的碳水化合物材料生 產(chǎn)一種或多種糖;和b.發(fā)酵得到的材料,從而制備發(fā)酵產(chǎn)物。此外,本發(fā)明涉及本文定義的具有過(guò)氧化物酶活性的多肽用于下述方法的用途, 所述方法用于修飾非淀粉的碳水化合物;提高非淀粉的碳水化合物材料對(duì)酶促降解的易感性;降解非淀粉的碳水化合物材料;或由非淀粉的碳水化合物材料生產(chǎn)一種或多種糖。附圖概述
圖1展示了與熱失活的參照+ )相比,由愈創(chuàng)木酚(guaiacol)和 MsP1+H202 (D形成棕色的反應(yīng)產(chǎn)物。圖2展示了用活性(一)或熱失活(一)的MsPl和H2A生產(chǎn)的木質(zhì)素 (organosolv)提取物的 HPLC-DAD (195nm)色譜。圖3展示了用活性(一)或熱失活(一)的MsPl和原位H2A生產(chǎn)產(chǎn)生的木質(zhì)素 (organosolv)提取物的 HPLC-ELSD 色譜。圖4展示了 M. scorodonius (——過(guò)氧化物酶一一漆酶)的沉水培養(yǎng)物;培養(yǎng)基 A、培養(yǎng)基B、培養(yǎng)基C、培養(yǎng)基D中漆酶和過(guò)氧化物酶的活性。圖5展示了分別使用銀和ABTS染色的IEF電泳。第1道參照蛋白質(zhì);第2-7道 (銀染色)和8-13 (ABTS染色)培養(yǎng)基A,第2-7天;第14-17道(ABTS染色)培養(yǎng)基A-D 第11天;第18道;SNS培養(yǎng)基第11天。圖6展示了 M. scorodonius的沉水培養(yǎng)物中漆酶和過(guò)氧化物酶活性的誘導(dǎo)。SNS 培養(yǎng)基漆酶O—),過(guò)氧化物酶(一);補(bǔ)充木質(zhì)素的SNS:漆酶(---),過(guò)氧化物酶(―);補(bǔ) 充玉米稈的培養(yǎng)基D 漆酶(---),過(guò)氧化物酶(~)。圖7展示了補(bǔ)充有玉米稈的M. scorodonius沉水培養(yǎng)物中;培養(yǎng)基A、培養(yǎng)基B、培 養(yǎng)基C、培養(yǎng)基D中葡萄糖苷酶的活性。圖8展示了 Μ. scorodonius的沉水培養(yǎng)物中的酯水解活性。圖9展示了使用活性染色使酯水解活性顯影的IEF電泳;第1道培養(yǎng)基B,第7 天;第2道培養(yǎng)基D,第7天;第3道培養(yǎng)基B,第10天;第4道培養(yǎng)基D,第10天;第5 道培養(yǎng)基B,第14天;第6道培養(yǎng)基D,第14天。圖10展示了來(lái)自玉米稈的葡萄糖釋放,表述為通過(guò)還原糖實(shí)驗(yàn)測(cè)定的玉米稈dm 的百分比葡萄糖。序列表概述SEQ ID NO 1 示出 了來(lái)自 Marasmius scorodonius 的 MsPl 的 cDNA 序列。SEQ ID NO :2 示出 了來(lái)自 Marasmius scorodonius 的 MsPl 的氨基酸序列。在第 20/21位存在信號(hào)肽切割序列。因此,第21到513位氨基酸代表了成熟的MsPl序列。SEQ ID NO :3 示出 了來(lái)自 Marasmius scorodonius 的 MsP2 的 cDNA 序列。SEQ ID NO :4 示出 了來(lái)自 Marasmius scorodonius 的 MsP2 的氨基酸序列。在第 19/20位存在信號(hào)肽切割序列。因此,第20到510位氨基酸代表了成熟的MsPl序列。SEQ ID NO :5 示出了用于在 A. niger 中表達(dá)來(lái)自 Marasmius scorodonius 的 MsPl 的核苷酸序列。SEQ ID NO :6 示出了用于在 A. niger 中表達(dá)來(lái)自 Marasmius scorodonius 的 MsPl 的氨基酸序列。SEQ ID NO :7 示出了用于在 A. niger 中表達(dá)來(lái)自 Marasmius scorodonius 的 MsP2 的核苷酸序列。SEQ ID NO :8 示出了用于在 A. niger 中表達(dá)來(lái)自 Marasmius scorodonius 的 MsP2 的氨基酸序列。
發(fā)明詳述在本說(shuō)明書(shū)和附帶的權(quán)利要求書(shū)中,詞語(yǔ)“包含”和“包括”及其變體如“包 含”(〃 comprises",‘‘ comprising")、“包括”(〃 includes" and" including")應(yīng) 被解釋為包含在內(nèi)。也就是說(shuō),在上下文允許時(shí),這些詞語(yǔ)旨在傳達(dá)可能包括未明確指出的 其它元素或整數(shù)。冠詞“一個(gè)”(“a”和“an”)在本文中被用于表示一個(gè)或多于一個(gè)(即一個(gè)或至 少一個(gè))所述冠詞的語(yǔ)法客體。例如,“一個(gè)元件”可表示一個(gè)元件或多于一個(gè)元件。本發(fā)明涉及具有過(guò)氧化物酶的多肽的用途。這些多肽可以被用于修飾包含非淀粉 的碳水化合物的材料(在本文中也稱(chēng)作含有非淀粉的材料)。包含非淀粉的碳水化合物的 材料是包含一種或多種非淀粉的碳水化合物、由它們組成或基本由它們組成的材料。此類(lèi) 非淀粉的碳水化合物可以是纖維素、半纖維素或果膠/果膠物質(zhì)。在本文上下文中,碳水化合物包括所有糖,例如多糖、寡糖、二糖或單糖。根據(jù)本發(fā)明使用的具有過(guò)氧化物酶活性的多肽可通過(guò)化學(xué)修飾或物理修飾包含 非淀粉的碳水化合物的材料來(lái)修飾這類(lèi)材料。包含非淀粉的碳水化合物的材料的化學(xué)修飾 可例如通過(guò)水解、氧化或其它化學(xué)修飾(例如通過(guò)裂合酶的作用)導(dǎo)致這類(lèi)材料的降解?;?者,修飾可以使包含非淀粉的碳水化合物的材料對(duì)酶促降解更加易感,所述酶促降解由已 知降解非淀粉的碳水化合物(例如木質(zhì)纖維素)的酶如纖維素酶和/或半纖維素酶和/或 果膠酶造成。纖維素酶可包括一種或多種內(nèi)切纖維素酶、外切纖維素酶或葡萄糖苷酶 活性。也就是說(shuō),含有非淀粉的碳水化合物的材料可以被修飾,使得所述材料的非淀粉的碳 水化合物組分對(duì)下述酶的降解更加易感,所述酶能夠降解非淀粉的碳水化合物。因此,本發(fā)明涉及用于修飾包含非淀粉的碳水化合物的材料的方法,所述方法包 括將所述非淀粉的碳水化合物材料與本文所述的具有過(guò)氧化物酶活性的多肽接觸。這類(lèi)修飾可以使包含非淀粉的碳水化合物材料的材料對(duì)酶促降解更加易感(特 別使材料的非淀粉的碳水化合物組分對(duì)酶促降解更加易感)。因此,本發(fā)明涉及提高包含非 淀粉的碳水化合物的材料對(duì)酶促降解的易感性的方法,所述方法包括將所述包含非淀粉的 碳水化合物材料與本文所述的具有過(guò)氧化物酶活性的多肽接觸。“對(duì)酶促降解更加易感”表示包含非淀粉的碳水化合物的材料(特別是非淀粉的碳 水化合物組分)與本文所述的過(guò)氧化物酶多肽接觸時(shí),與不與此類(lèi)多肽接觸的情況相比, 會(huì)被能夠進(jìn)行這類(lèi)降解的酶降解至更大的程度。本發(fā)明的方法可以是預(yù)處理方法。也就是說(shuō),可以對(duì)包含非淀粉的碳水化合物的 材料進(jìn)行預(yù)處理方法,所述方法涉及具有過(guò)氧化物酶活性的多肽的使用。因此,可以進(jìn)行本 發(fā)明的方法,使得預(yù)處理期間的能量和/或化學(xué)品輸入少于其它情況下的輸入。本發(fā)明還涉及其中進(jìn)行了上述方法的方法,即修飾包含非淀粉的碳水化合物的材 料,或使這類(lèi)材料對(duì)酶促降解更加易感,隨后進(jìn)行和/或伴隨著下述酶的降解,所述酶可以 降解包含非淀粉的碳水化合物的材料(特別是所述材料的非淀粉的碳水化合物組分)。典 型地,與非淀粉的碳水化合物材料未與本文所述的過(guò)氧化物酶接觸時(shí)相比,這類(lèi)非碳水化 合物材料的降解會(huì)發(fā)生至更大程度或更迅速地發(fā)生。因此,本發(fā)明提供了用于降解包含非淀粉的碳水化合物的材料的方法,所述方法 包括使用本文所述的方法使所述非淀粉的碳水化合物材料與本文所述的過(guò)氧化物酶接觸,即修飾所述包含非淀粉的碳水化合物的材料,或提高此類(lèi)材料對(duì)酶促降解的易感性;使 藉此修飾的包含非淀粉的碳水化合物的材料與下述酶接觸,所述酶降解所述包含非淀粉的 碳水化合物的材料。此類(lèi)酶典型地會(huì)是能夠降解材料的非淀粉的碳水化合物組分的酶,例 如纖維素酶和/或半纖維素酶和/或果膠酶。通過(guò)這種方式,可以降解非淀粉的碳水化合 物材料(例如非淀粉的碳水化合物組分)。包含非淀粉的碳水化合物的材料的降解典型地會(huì)導(dǎo)致一種或多種糖的生產(chǎn)。典型 地,一種糖或至少一種糖會(huì)是可發(fā)酵的糖。因此,本發(fā)明提供了由包含非淀粉的碳水化合物的材料生產(chǎn)一種或多種糖的方 法,所述方法包括使用本文所述的方法使所述包含非淀粉的碳水化合物的材料與本文所 述的過(guò)氧化物酶接觸,即修飾所述包含非淀粉的碳水化合物的材料,或提高此類(lèi)材料對(duì)酶 促降解的易感性;使藉此修飾的包含非淀粉的碳水化合物的材料與下述酶接觸,所述酶降 解所述包含非淀粉的碳水化合物的材料。此類(lèi)酶典型地會(huì)是能夠降解材料的非淀粉的碳水 化合物組分的酶,例如纖維素酶和/或半纖維素酶和/或果膠酶。通過(guò)這種方式,可以由包 含非淀粉的碳水化合物的材料生產(chǎn)一種或多種糖。在本發(fā)明的方法中,使用的多肽可以是具有過(guò)氧化物酶活性的多肽,例如經(jīng)分離 的多肽,并且包含根據(jù)SEQ ID NOs :2、4、6或8任一的序列,或是此類(lèi)多肽的功能等同物或 片段。SEQ ID Nos 6和8公開(kāi)了來(lái)自Marasmius scorodonius的具有過(guò)氧化物酶活性 的成熟多肽(分別為MsPl和MsP2)的序列。令人驚訝的是,MsPl和MsP2與已知的鎂過(guò) 氧化物酶和木質(zhì)素過(guò)氧化物酶不相容,但是與“DyP-型”過(guò)氧化物酶(染料脫色過(guò)氧化物 酶)組顯示更大的同源性。MsPl和MsP2還作為二聚體存在。lkheibner et al. Appl. Microbiol. Biotechnol. (2008) 77,1241-1240,pp. 1247。然而,SEQ ID NOs :2 和 4 展示了 包括信號(hào)序列的MsPl和MsP2的全長(zhǎng)序列。SEQ ID NO 2的第20/21位和SEQ ID NO 4的 第19/20位處存在信號(hào)肽切割位點(diǎn)。因此,基于SEQ ID NO :2或4的本發(fā)明中使用的多肽 典型地會(huì)包含SEQ NO 2的第21到513位氨基酸或SEQ NO 4的第20到510位氨基酸中示 出的序列,或者是此類(lèi)多肽的功能等同物或片段。在本發(fā)明中使用的多肽(例如經(jīng)分離的多肽)可以通過(guò)在適當(dāng)?shù)乃拗骷?xì)胞例如 Aspergillus niger中表達(dá)包含SEQ ID NOs :1、3、5或7任一中示出的序列的多核苷酸或 包含所述多核苷酸的載體來(lái)獲得。在本發(fā)明中使用的多肽可以是此類(lèi)多肽的功能等同物或 片段。考慮到SEQ ID NOs 1和3包含信號(hào)序列編碼部分的事實(shí),本發(fā)明的多肽可以由包 含SEQ ID NO 1的第61到1539位核苷酸或SEQ ID NO 3的第58到1530位核苷酸中示出 的序列的多核苷酸編碼。本發(fā)明中使用的多肽可以是此類(lèi)多肽的功能等同物或片段。術(shù)語(yǔ)“具有過(guò)氧化物酶活性的多肽”在此處和下文中被定義為EC 1.11.1.的多 肽,其典型地能夠催化下式的反應(yīng)R00R' + 電子供體— R0H+R' OH或 H2A (電子供體)+ — 2H20+A 具有過(guò)氧化物酶活性的多肽可使用過(guò)氧化氫作為其最優(yōu)底物,或者具有過(guò)氧化物酶活性的多肽可對(duì)有機(jī)氫過(guò)氧化物(hydroperoxide)如脂質(zhì)過(guò)氧化物更有活性。具有過(guò)氧 化物酶活性的多肽可在其活性位點(diǎn)中含有亞鐵血紅素輔因子(heme cofactor),或含有氧 化還原半胱氨酸或硒代半胱氨酸殘基。本發(fā)明的方法或用途可以利用經(jīng)純化的多肽。本文所述和適用于本發(fā)明方法中的 多肽包括本文所述多核苷酸編碼的多肽。特別優(yōu)選的是包含SEQ NO 2的第21到513位氨 基酸;SEQ NO 4的第20到510位氨基酸;SEQ NO 6的第1到493位氨基;或SEQ NO 8的 第1到491位氨基酸中示出的序列的多肽,或任何這些多肽的功能等同物。包含本文所述的多肽的融合蛋白也可以在本發(fā)明的方法中使用。本文描述了用于制造可以在本發(fā)明的方法中使用的多肽的方法。本文描述了包含與下述多核苷酸的反向互補(bǔ)鏈優(yōu)選地在高度嚴(yán)格條件下雜交的 核苷酸序列的多核苷酸,所述多核苷酸具有根據(jù)以下任一的序列SEQ ID NO :1的第61到 1539位核苷酸;SEQ ID NO 3的第58到1530位核苷酸;SEQ ID NO 5的第1到1479位核 苷酸;或SEQ ID NO 7的第1到1473位核苷酸。可被用于提供適用于本發(fā)明的多肽的這類(lèi)核酸可包含與SEQ ID NO 1的第61到 1539位核苷酸;SEQ ID NO 3的第58到1530位核苷酸;SEQ ID NO 5的第1到1479位核苷 酸;或SEQ ID NO 7的第1到1473位核苷酸任一中示出的序列具有至少約55%、優(yōu)選地至 少約65%、更優(yōu)選地至少約70%、進(jìn)一步更優(yōu)選地至少約75%、至少約80%、至少約85%、 至少約90%、至少約95%、至少約96%、至少約97%、至少約98%或至少約99%的序列同 一性的序列。在一個(gè)更優(yōu)選的實(shí)施方案中,此類(lèi)多核苷酸,或由此類(lèi)多肽編碼的多肽,可以 得自真菌,優(yōu)選地得自絲狀真菌,例如得自Dikarya,例如得自Basidiomycota,例如得 自 Agaricomycotina,例如得自 Agaricomycetidae,例如得自 Agaricales,例如得自 Trichomataceae,特別是得自 Marasmius 屬,例如 Marasmius scorodonius。合適的多核苷 酸可得自分解垃圾的真菌。此類(lèi)多核苷酸可包含編碼下述多肽的核酸序列,所述多肽包含如以下任一中所示 的氨基酸序列SEQ NO 2的第21到513位氨基酸;SEQ NO 4的第20到510位氨基酸;SEQ NO 6的第1到493位氨基;或SEQ NO 8的第1到491位氨基酸,或此類(lèi)多肽的功能等同物 或片段。此類(lèi)多核苷酸可編碼下述多肽的至少一個(gè)功能結(jié)構(gòu)域,所述多肽包含SEQ NO 2 的第21到513位氨基酸;SEQ NO 4的第20到510位氨基酸;SEQ NO 6的第1到493位氨 基;或SEQ NO 8的第1到491位氨基酸中示出的序列,或此類(lèi)多肽的功能等同物的至少一 個(gè)功能結(jié)構(gòu)域。在一個(gè)優(yōu)選的實(shí)施方案中,本發(fā)明的方法使用下述基因編碼的過(guò)氧化物酶進(jìn)行, 所述基因包含根據(jù)以下任一的序列SEQ ID NO 1的第61到1539位核苷酸;SEQ ID NO 3 的第58到1530位核苷酸;SEQ ID NO 5的第1到1479位核苷酸;或SEQ ID NO 7的第1 到1473位核苷酸。在另一個(gè)優(yōu)選的實(shí)施方案中進(jìn)行本發(fā)明,其中過(guò)氧化物酶由多核苷酸編 碼,使得氨基酸序列包含以下任一 SEQ NO 2的第21到513位氨基酸;SEQ NO 4的第20 到510位氨基酸;SEQ NO 6的第1到493位氨基;或SEQ NO 8的第1到491位氨基酸中示 出的序列,或者是任何這些多肽的變體或片段。
產(chǎn)生適合在本發(fā)明中使用的多肽的多核苷酸可包含編碼本文所述多肽的編碼序 列,優(yōu)選的是包含以下任一的多核苷酸序列SEQ ID NO 1的第61到1539位核苷酸;SEQ ID NO 3的第58到1530位核苷酸;SEQ ID NO 5的第1到1479位核苷酸;或SEQ ID NO 7的第1到1473位核苷酸。本文所述的多核苷酸可被整合進(jìn)載體中,從而表達(dá)可以在本發(fā)明的方法中使用的 多肽。在此類(lèi)載體中,編碼過(guò)氧化物酶的多核苷酸序列可與適合在合適的宿主細(xì)胞中表 達(dá)所編碼的氨基酸序列的調(diào)節(jié)序列功能性連接,所述合適的宿主細(xì)胞例如是細(xì)菌或絲狀真 菌,如 Marasmius,例如 M. scorodonius 或 Aspergillus,例如 A. niger 或 A. oryzae。適合在本發(fā)明中使用的多肽可以在含有本文所述的異源或同源多核苷酸的宿主 細(xì)胞中重組生產(chǎn)。在此類(lèi)細(xì)胞中,過(guò)氧化物酶的表達(dá)可以被顯著提高,或者過(guò)氧化物酶的活 性可以被提高。典型地,此類(lèi)細(xì)胞能夠生產(chǎn)根據(jù)本發(fā)明的功能性過(guò)氧化物酶,優(yōu)選地是能夠 過(guò)表達(dá)過(guò)氧化物酶的細(xì)胞,例如為下述Aspergillus菌株,所述Aspergillus菌株包含提高 拷貝數(shù)的編碼此類(lèi)過(guò)氧化物酶的基因。本發(fā)明需要使用包含以下任一中示出的氨基酸序列的經(jīng)分離的多肽SEQ NO 2 的第21到513位氨基酸;SEQ NO 4的第20到510位氨基酸;SEQ NO 6的第1到493位氨 基;或SEQ NO 8的第1到491位氨基酸,或能夠通過(guò)在適當(dāng)?shù)乃拗髦羞^(guò)表達(dá)下述多核苷酸 而獲得的氨基酸序列,所述多核苷酸包含SEQ ID NO :1的第61到1539位核苷酸;SEQ ID NO 3的第58到1530位核苷酸;SEQ ID NO 5的第1到1479位核苷酸;或SEQ ID NO 7的 第1到1473位核苷酸中示出的序列。本發(fā)明中還可以使用包含此類(lèi)多肽的功能性片段的 肽或多肽。術(shù)語(yǔ)“肽”和“寡肽”在此處和下文中被認(rèn)為是同義的(如其通常被認(rèn)為的那樣), 且當(dāng)上下文需要表示通過(guò)肽鍵偶合的至少兩個(gè)氨基酸鏈時(shí),每個(gè)術(shù)語(yǔ)可以互換使用。詞語(yǔ) “多肽”在本文中使用表示含有多于七個(gè)氨基酸殘基的鏈。所有的寡肽和多肽式或序列在 本文中從左到右和從氨基端到羧基端的方向書(shū)寫(xiě)。本文使用的單字母氨基酸代碼是本領(lǐng) 域普遍已知的,并可見(jiàn)于 Sambrook, et al. (Molecular Cloning :A Laboratory Manual, 2nd, ed. Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)。“經(jīng)分離的”多肽或蛋白質(zhì)表示被從其天然環(huán)境中取出的多肽或蛋白質(zhì)。例如, 就本發(fā)明的目的而言,在宿主細(xì)胞中表達(dá)的重組產(chǎn)生的多肽和蛋白質(zhì)被認(rèn)為是分離的,與 通過(guò)任何合適的技術(shù)已基本純化的天然或重組多肽一樣,所述合適的技術(shù)例如Smith and Johnson, Gene 67:31-40(1988)中公開(kāi)的單步驟純化方法。本文所述的具有過(guò)氧化物酶活性的多肽或其功能等同物或片段可以通過(guò)公知的 方法從重組細(xì)胞培養(yǎng)物中回收和純化,所述公知方法包括硫酸銨或乙醇沉淀,酸提取,陰離 子或陽(yáng)離子交換色譜,磷酸纖維素色譜、疏水相互作用色譜、親和色譜、羥基磷灰石色譜和 凝集素色譜。最優(yōu)選地,使用高效液相色譜("HPLC“)進(jìn)行純化。適合在本發(fā)明中使用的多肽包括天然純化的產(chǎn)物、化學(xué)合成步驟的產(chǎn)物,和通過(guò) 重組技術(shù)從原核或真核宿主生產(chǎn)的產(chǎn)物,所述宿主包括例如細(xì)菌、酵母、高等植物、昆蟲(chóng)和 哺乳動(dòng)物細(xì)胞。取決于重組生產(chǎn)步驟中使用的宿主,可以將本發(fā)明的多肽糖基化或不糖基化。另外,本發(fā)明的多肽也可以包含最初被修飾的殘基(在一些情況下由宿主介導(dǎo)的過(guò)程 產(chǎn)生)。術(shù)語(yǔ)“功能等同物”和“功能變體”在本文中可互換使用。本文所述的過(guò)氧化物酶 的編碼多核苷酸的功能等同物是編碼下述多肽的經(jīng)分離的多核苷酸,所述多肽顯示過(guò)氧化 物酶活性,典型地顯示與本文定義的至少一種過(guò)氧化物酶多肽至少大約相同或更好的過(guò)氧 化物酶活性(即包含SEQ NO 2的第21到513位氨基酸;SEQ NO 4的第20到510位氨基 酸;SEQ NO 6的第1到493位氨基;或SEQ NO 8的第1到491位氨基酸任一中示出的序列 的多肽)。過(guò)氧化物酶多肽的功能等同物是下述多肽,所述多肽顯示過(guò)氧化物酶活性,典型 地顯示與本文定義的至少一種過(guò)氧化物酶多肽至少相同或更好的過(guò)氧化物酶活性(即包 含SEQ NO 2的第21到513位氨基酸;SEQ NO 4的第20到510位氨基酸;SEQ NO 6的第 1到493位氨基;或SEQ NO 8的第1到491位氨基酸任一中示出的序列的多肽)。與包含SEQ NO 2的第21到513位氨基酸;SEQ NO 4的第20到510位氨基酸; SEQ NO 6的第1到493位氨基;或SEQ NO 8的第1到491位氨基酸任一中示出的序列的 多肽相比,功能性蛋白質(zhì)或多肽等同物可包含一個(gè)或多個(gè)取代、插入或缺失。與此類(lèi)多肽相 比,功能性蛋白質(zhì)或多肽等同物可僅含有一個(gè)或多個(gè)氨基酸的保守取代。取代、插入或缺失 應(yīng)典型地與非必需氨基酸相關(guān)。非必需氨基酸是能夠在任一所述序列中被改變而不顯著改變多肽生物功能的殘 基。例如,在本文所述的過(guò)氧化物酶蛋白質(zhì)之間保守的氨基酸殘基被預(yù)測(cè)為尤其不適合改 變。另外,在本文所述的過(guò)氧化物酶蛋白質(zhì)和其它過(guò)氧化物酶之間保守的氨基酸不可能適 合改變。術(shù)語(yǔ)“保守取代”旨在表示下述取代其中氨基酸殘基被具有相似側(cè)鏈的氨基酸殘 基取代。這些家族是本領(lǐng)域已知的,并包括具有堿性側(cè)鏈(例如賴(lài)氨酸、精氨酸和組氨酸)、 酸性側(cè)鏈(天冬氨酸、谷氨酸)、不帶電荷的極性側(cè)鏈(例如甘氨酸、天冬酰胺、谷氨酰胺、 絲氨酸、蘇氨酸、酪氨酸、半胱氨酸)、非極性側(cè)鏈(丙氨酸、纈氨酸、亮氨酸、異亮氨酸、脯氨 酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-分支側(cè)鏈(蘇氨酸、纈氨酸、異亮氨酸)和芳香族側(cè) 鏈(例如酪氨酸、苯丙氨酸、色氨酸、組氨酸)的氨基酸。與包含SEQ ID NO 1的第61到1539位核苷酸;SEQ ID NO 3的第58到1530位 核苷酸;SEQ ID NO 5的第1到1479位核苷酸;或SEQ ID NO 7的第1到1473位核苷酸任 一中示出的序列的多核苷酸相比,功能性核酸等同物可典型地含有突變。典型地,這類(lèi)突變 會(huì)是沉默突變或者不改變所編碼的多肽的生物功能的突變。因此,可以使用下述核酸分子產(chǎn)生在本發(fā)明中使用的酶,所述核酸分子編碼在對(duì) 具體生物活性而言非必需的氨基酸殘基中含有改變的,包含以下示出的序列的過(guò)氧化物酶 蛋白質(zhì)多肽SEQ NO 2的第21到513位氨基酸;SEQ NO 4的第20到510位氨基酸;SEQ NO :6的第1到493位氨基;或SEQ NO 8的第1到491位氨基酸。功能變體或功能等同物過(guò)氧化物酶多肽應(yīng)當(dāng)在氨基酸序列上與本文特定描述的 序列任一不同,但是仍會(huì)保留此類(lèi)多肽的至少一種生物活性。在一個(gè)實(shí)施方案中,適用于生產(chǎn)在本發(fā)明中使用的多肽的經(jīng)分離的核酸分子包 含編碼下述多肽的核苷酸序列,其中所述多肽包含與SEQ NO 2的第21到513位氨基酸;SEQ NO 4的第20到510位氨基酸;SEQ NO 6的第1到493位氨基;或SEQ NO 8的第1到 491位氨基酸之任一中所示氨基酸序列具有至少約55%、至少約65%、至少約70%、至少約 75 %、至少約80 %、至少約85 %、至少約90 %、至少約95 %、至少約96 %、至少約97 %、至少 約98%、至少約99%或更多序列同一性的氨基酸序列。這樣的多肽可以是適合在本發(fā)明中 使用的功能等同物或功能變體。例如,涉及如何制造表型沉默的氨基酸取代的指導(dǎo)在Bowie,J. U. et al. ,Science 247 1306-1310(1990)中提供,其中作者指出,存在兩種途徑,用于研究氨基酸序列對(duì)改變 的耐受。第一種途徑依賴(lài)于進(jìn)化過(guò)程,其中突變由自然選擇接受或拒絕。第二種途徑使用 基因工程在被克隆的基因的特定位點(diǎn)引入氨基酸改變并選擇或篩選,以鑒定保留功能性的 序列。如作者所述,這些研究已揭示了蛋白質(zhì)令人驚奇地對(duì)氨基酸取代耐受。作者還指出 蛋白質(zhì)某位置上的何種改變很可能被允許。例如,最深埋(buried)的氨基酸殘基需要非極 性側(cè)鏈,而表面?zhèn)孺湹暮苌偬卣魇瞧毡楸J氐?。其它這類(lèi)表型沉默取代在上文Bowie et al 及其中所引用的參考文獻(xiàn)中描述??梢匀缦轮圃炀幋a本文所述的過(guò)氧化物酶蛋白質(zhì)的經(jīng)分離的核酸分子向包含 SEQ ID NO 1的第61到1539位核苷酸;SEQ ID NO 3的第58到1530位核苷酸;SEQ ID NO 5的第1到1479位核苷酸;或SEQ ID NO 7的第1到1473位核苷酸之任一的多核苷酸 的編碼序列中引入一個(gè)或多個(gè)核苷酸取代、添加或缺失,使得一個(gè)或多個(gè)氨基酸取代、缺失 或插入被引入所編碼的蛋白質(zhì)中。這類(lèi)突變可以通過(guò)標(biāo)準(zhǔn)技術(shù)引入,如定點(diǎn)誘變和PCR-介 導(dǎo)的誘變。術(shù)語(yǔ)“功能等同物”還包括本文所述的M. scorodonius過(guò)氧化物酶MsPl或MsP2蛋 白質(zhì)的直向同源物。M. scorodonius過(guò)氧化物酶MsPl或MsP2蛋白質(zhì)的直向同源物是能夠 從其它菌株或物種中分離并具有相似或相同生物活性、特別是過(guò)氧化物酶活性的蛋白質(zhì)。 這類(lèi)直向同源物可容易地被鑒定,因?yàn)楹信c以下任一基本同源的氨基酸序列SEQ NO 2 的第21到513位氨基酸;SEQ NO 4的第20到510位氨基酸;SEQ NO 6的第1到493位氨 基;或SEQ NO 8的第1到491位氨基酸。本文定義術(shù)語(yǔ)“基本同源”是指含有與第二氨基酸或核苷酸序列足夠或最少的同 一或等同(例如具有相似側(cè)鏈)的氨基酸或核苷酸的第一氨基酸或核苷酸序列,使得所述 第一和第二氨基酸或核苷酸序列具有共同的結(jié)構(gòu)域。例如,含有下述共有結(jié)構(gòu)域的氨基酸 或核苷酸序列在本文中被定義為足夠同一,所述共有結(jié)構(gòu)域具有至少約55%、優(yōu)選地至少 約65%、至少約70%、更優(yōu)選地至少約75%、至少約80%、至少約85%、至少約90%、至少 約95%、至少約96%、至少約97%、至少約98%或至少約99%的同一性或更多。此外,編碼其它過(guò)氧化物酶家族成員的核酸(其因而具有與本文所述的序列不同 的核苷酸序列)可適用于產(chǎn)生適合在本發(fā)明中使用的酶。另外,編碼來(lái)自不同物種的本文 所述的過(guò)氧化物酶蛋白質(zhì)的核酸(其因而具有與本文所述的序列不同的核苷酸序列)也適 合在本發(fā)明中使用??梢愿鶕?jù)它們與本文所述的過(guò)氧化物酶DNA核酸的同源性,使用本文所述的過(guò)氧 化物酶DNA核酸或其合適的片段作為雜交探針,根據(jù)標(biāo)準(zhǔn)的雜交技術(shù),優(yōu)選地在高度嚴(yán)格 的雜交條件下,來(lái)分離對(duì)應(yīng)于本文所述的過(guò)氧化物酶DNA的變體(例如天然等位基因變體) 或同源物的核酸分子。
除了本文所述的過(guò)氧化物酶序列的天然存在的等位基因變體外,技術(shù)人員知道, 可以通過(guò)突變向這些核苷酸序列中引入改變,從而導(dǎo)致過(guò)氧化物酶蛋白質(zhì)的氨基酸序列中 的改變,而不顯著改變所述蛋白質(zhì)的功能。本發(fā)明中可以使用經(jīng)改進(jìn)的過(guò)氧化物酶蛋白質(zhì)。經(jīng)改進(jìn)的過(guò)氧化物酶蛋白質(zhì)是與 包含以下任一中示出的序列的多肽相比,其中至少一種生物活性、特別是過(guò)氧化物酶活性 被改進(jìn)的蛋白質(zhì),所述序列為SEQ NO 2的第21到513位氨基酸;SEQ NO 4的第20到510 位氨基酸;SEQ NO 6的第1到493位氨基;或SEQ NO 8的第1到491位氨基酸。這類(lèi)蛋白 質(zhì)可以如下獲得沿全部或部分這類(lèi)蛋白質(zhì)的編碼序列隨機(jī)地(例如通過(guò)飽和誘變)引入 突變,并可重組表達(dá)得到的突變體并針對(duì)生物活性進(jìn)行篩選。例如,本領(lǐng)域提供了用于測(cè)量 過(guò)氧化物酶的酶活性的標(biāo)準(zhǔn)實(shí)驗(yàn),因而經(jīng)改進(jìn)的蛋白質(zhì)可以容易地被選擇。在一個(gè)優(yōu)選的實(shí)施方案中,適合在本發(fā)明中使用的過(guò)氧化物酶蛋白質(zhì)具有根據(jù)以 下任一的氨基酸序列SEQ NO 2的第21到513位氨基酸;SEQ NO 4的第20到510位氨基 酸;SEQ NO 6的第1到493位氨基;或SEQ NO 8的第1到491位氨基酸。在另一實(shí)施方案 中,過(guò)氧化物酶多肽與此類(lèi)氨基酸序列基本同源,并保留此類(lèi)多肽的至少一種生物活性,例 如過(guò)氧化物酶活性,但是由于如上所述的天然變異或誘變而在氨基酸序列上有差異。在又一個(gè)優(yōu)選的實(shí)施方案中,適合在本發(fā)明中使用的過(guò)氧化物酶蛋白質(zhì)包含由下 述核酸片段編碼的氨基酸序列,所述核酸片段能夠與包含以下任一的核酸序列的反向互補(bǔ) 鏈優(yōu)選地在高度嚴(yán)格的雜交條件下雜交SEQ ID NO 1的第61到1539位核苷酸;SEQ ID NO 3的第58到1530位核苷酸;SEQ ID NO 5的第1到1479位核苷酸;或SEQ ID NO 7的 第1到1473位核苷酸。因此,在本文所述的方法中使用的過(guò)氧化物酶多肽是下述蛋白質(zhì),所述蛋白質(zhì)包 含與SEQ NO 2的第21到513位氨基酸;SEQ NO 4的第20到510位氨基酸;SEQ NO 6的 第1到493位氨基;或SEQ NO 8的第1到491位氨基酸之任一的氨基酸序列具有至少約 55 %、至少約65 %、至少約70 %、至少約75 %、至少約80 %、至少約85 %、至少約90 %、至少 約95%、至少約96%、至少約97%、至少約98%、至少約99%或更多的序列同一性,并且保 留所述多肽的至少一種功能活性,典型地保留過(guò)氧化物酶活性。也可以如下文所述來(lái)鑒定本文所述的蛋白質(zhì)的功能等同物例如,針對(duì)過(guò)氧化物 酶活性,篩選本發(fā)明蛋白質(zhì)的突變體(例如截短突變體)的組合文庫(kù)。在一個(gè)實(shí)施方案中, 通過(guò)核酸水平上的組合誘變產(chǎn)生有斑文庫(kù)(variegated library)。可以通過(guò)例如將合成 的寡核苷酸混合物酶連接為基因序列來(lái)產(chǎn)生變體的有斑文庫(kù),從而可能的蛋白質(zhì)序列的簡(jiǎn) 并集合(degenerate set)可作為個(gè)體多肽表達(dá),或者作為一組更大的融合蛋白表達(dá)(例如 用于噬菌體展示)。存在可用于從簡(jiǎn)并寡核苷酸生產(chǎn)本文所述多肽的可能變體文庫(kù)的多種 方法。用于合成簡(jiǎn)并寡核苷酸的方法是本領(lǐng)域已知的(見(jiàn)例如Narang(1983)Tetrahedron 39 3 ;ltakura et al. (1984) Annu. Rev. Biochem. 53 :323 ;ltakura et al. (1984) Science 198 1056 ;Ike et al. (1983)Nucleic Acid Res. 11 477)。另外,本文所述多肽的編碼序列的片段文庫(kù)可以被用于產(chǎn)生有斑的多肽群,用于 篩選隨后的變體選擇。例如,可以如下產(chǎn)生編碼序列片段的文庫(kù)在每個(gè)分子僅發(fā)生約一 次切割的條件下用核酸酶處理感興趣的編碼序列的雙鏈PCR片段,變性雙鏈DNA,將DNA復(fù) 性形成雙鏈DNA(其可包含來(lái)自被不同切割的產(chǎn)物的有義/反義對(duì)),通過(guò)用Sl核酸酶處理從再形成的雙鏈體上去除單鏈部分,并將得到的片段文庫(kù)連接進(jìn)表達(dá)載體中。通過(guò)該方 法,可以得到下述表達(dá)文庫(kù),所述表達(dá)文庫(kù)編碼感興趣的蛋白質(zhì)的不同大小的N-末端和內(nèi) 部片段。本領(lǐng)域已知有若干種技術(shù)可用于篩選組合文庫(kù)(其通過(guò)截短的點(diǎn)突變制造)的基 因產(chǎn)物,和用于篩選cDNA文庫(kù)以獲得具有選定特性的基因產(chǎn)物。用于篩選大基因文庫(kù)的、 適用于高通量分析的、最廣泛使用的技術(shù)典型地包括將基因文庫(kù)克隆進(jìn)可復(fù)制的表達(dá)載 體中,用得到的載體文庫(kù)轉(zhuǎn)化合適的細(xì)胞,和在下述條件下表達(dá)組合基因,所述條件下想要 的活性的檢測(cè)簡(jiǎn)化編碼基因(其產(chǎn)物被檢測(cè))的載體的分離。循環(huán)總體誘變(Recursive ensemble mutagenesis, REM),一種增強(qiáng)文庫(kù)中功能突變體頻率的技術(shù),可以與篩選實(shí)驗(yàn)組 合使用以鑒定本發(fā)明蛋白質(zhì)的變體(Arkin and Yourvan(1992)Proc. Natl. Acad. Sci. USA 89 7811-7815 ;Delgrave et al. (1993)Protein Engineering 6(3) :327_331)。除了本文所述的過(guò)氧化物酶編碼序列以外,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)知道給定的種群 中可存在DNA序列多態(tài),所述多態(tài)可導(dǎo)致過(guò)氧化物酶蛋白質(zhì)氨基酸序列中的改變。這類(lèi)遺 傳多態(tài)性可存在于來(lái)自不同種群的細(xì)胞中或由于天然等位基因變異而存在于一個(gè)種群中。 等位基因變體也可包括功能等同物。適合在本發(fā)明中使用的過(guò)氧化物酶編碼序列的功能等同物可以使用含有經(jīng)分離 的核酸的經(jīng)標(biāo)記的探針來(lái)獲得,所述經(jīng)分離的核酸編碼根據(jù)以下任一的序列之全部或部 分SEQ ID NO :1的第61到1539位核苷酸;SEQ ID NO :3的第58到1530位核苷酸;SEQ ID NO 5的第1到1479位核苷酸;或SEQ ID NO 7的第1到1473位核苷酸或任何它們的 變體;在允許探針與文庫(kù)中的核酸片段雜交從而形成核酸雙鏈體的條件下,用經(jīng)標(biāo)記的探 針篩選核酸片段文庫(kù),和從任何被標(biāo)記的雙鏈體中的核酸片段制備全長(zhǎng)的基因序列,以獲 得與所述編碼序列相關(guān)的基因。在一個(gè)實(shí)施方案中,適用于制備本發(fā)明中使用的多肽的過(guò)氧化物酶多核苷酸可包 含與SEQ ID NO 1的第61到1539位核苷酸;SEQ ID NO 3的第58到1530位核苷酸;SEQ ID NO 5的第1到1479位核苷酸;或SEQ ID NO 7的第1到1473位核苷酸之任一或任何它 們的反向互補(bǔ)鏈具有至少約55%、至少約65%、至少約70%、至少約75%、至少約80%、至 少約85 %、至少約90 %、至少約91%、至少約92 %、至少約93 %、至少約94%、至少約95 %、 至少約96%、至少約97%、至少約98%、至少約99%或更多序列同一性的序列。適合在本發(fā)明中使用的過(guò)氧化物酶多肽可包含與SEQ NO 2的第21到513位氨基 酸;SEQ NO 4的第20到510位氨基酸;SEQ NO 6的第1到493位氨基;或SEQ NO 8的第 1到491位氨基酸之任一具有至少約55%、至少約65%、至少約70%、至少約75%、至少約 80 %、至少約85 %、至少約90 %、至少約91%、至少約92 %、至少約93 %、至少約94%、至少 約95%、至少約96%、至少約97%、至少約98%、至少約99%或更多序列同一性的序列。本發(fā)明涉及其中使用編碼下述過(guò)氧化物酶的多核苷酸的方法,所述過(guò)氧化物酶包 含根據(jù)以下任一的氨基酸序列SEQ NO 2的第21到513位氨基酸;SEQ NO 4的第20到 510位氨基酸;SEQ NO 6的第1到493位氨基;或SEQ NO 8的第1到491位氨基酸,或此 類(lèi)多肽的功能等同物或片段。具有SEQ ID NO :5和SEQ ID NO :7 (編碼過(guò)氧化物酶)的序 列是原始分離的基因的優(yōu)化版本,其中發(fā)生了密碼子優(yōu)化。密碼子優(yōu)化可以根據(jù)本領(lǐng)域技 術(shù)人員公知的方法使用,尤其適用于在宿主細(xì)胞中進(jìn)行改進(jìn)的基因表達(dá)。
還適用于生產(chǎn)在本發(fā)明中使用的酶的是下述多核苷酸,所述多核苷酸包含在嚴(yán)格 條件下、優(yōu)選地在高度嚴(yán)格條件下能夠與以下任一的反向互補(bǔ)鏈雜交的序列SEQ ID NO 1 的第61到1539位核苷酸;SEQ ID NO 3的第58到1530位核苷酸;SEQ ID NO 5的第1到 1479位核苷酸;或SEQ ID NO 7的第1到1473位核苷酸。有利地,此類(lèi)多核苷酸可得自真菌,優(yōu)選地得自絲狀真菌,特別是得自Marasmius scorodoniuso在此處和下文中使用時(shí),術(shù)語(yǔ)“基因”和“重組基因”指可從染色體DNA中分離的、 包含編碼蛋白質(zhì)(例如M. scorodonius漂白酶)的開(kāi)放讀碼框的核酸分子?;蚩砂?碼序列、非編碼序列、內(nèi)含子和調(diào)節(jié)序列。此外,基因表示本文定義的經(jīng)分離的核酸分子??梢允褂脴?biāo)準(zhǔn)的分子生物學(xué)技術(shù)和本文提供的序列信息,來(lái)分離適用于產(chǎn)生適合 在本發(fā)明的方法中使用的多肽的核酸分子,例如本文所述的核酸分子。例如,使用包含SEQ ID NO :1的第61到1539位核苷酸;SEQ ID NO :3的第58到1530位核苷酸;SEQ ID N0: 5的第1到1479位核苷酸;或SEQ ID NO 7的第1到1473位核苷酸之一個(gè)或多個(gè)的所 有或部分核酸序列作為雜交探針,能夠使用標(biāo)準(zhǔn)雜交和克隆技術(shù)(例如描述于Sambrook, J.,F(xiàn)ritsh,Ε. F.,and Maniatis,Τ. Molecular Cloning :A Laboratory Manual. 2nd,ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press,Cold Spring Harbor, NY, 1989中)分離根據(jù)本發(fā)明的核酸分子。另外,可以使用以序列信息為基礎(chǔ)設(shè)計(jì)的合成的寡核苷酸引物,通過(guò)聚合酶鏈?zhǔn)?反應(yīng)(PCR),來(lái)分離包含SEQ ID NO 1的第61到1539位核苷酸;SEQ ID NO 3的第58到 1530位核苷酸;SEQ ID NO 5的第1到1479位核苷酸;或SEQ ID NO 7的第1到1473位 核苷酸之任一的所有或部分的核酸分子??梢允褂胏DNA、mRNA或者基因組DNA作為模板,并使用適當(dāng)?shù)墓押塑账嵋锔鶕?jù) 標(biāo)準(zhǔn)的PCR擴(kuò)增技術(shù),來(lái)擴(kuò)增本發(fā)明的合適的核酸。這樣擴(kuò)增的核酸可以被克隆進(jìn)適當(dāng)?shù)?載體中并通過(guò)DNA序列分析被表征。另外,可以通過(guò)標(biāo)準(zhǔn)的合成技術(shù)(例如使用自動(dòng)化DNA合成儀)制備下述寡核苷 酸,所述寡核苷酸對(duì)應(yīng)于本文所述的核苷酸序列或能夠與本文所述的核苷酸序列雜交。適用于生產(chǎn)適合在本發(fā)明方法中使用的多肽的核酸分子可包含下述核酸分子,所 述核酸分子是本文所述的核酸序列的反向互補(bǔ)鏈,或是這些核苷酸序列的功能等同物。與另一核苷酸序列互補(bǔ)的核酸分子是與所述另一核苷酸序列足夠互補(bǔ),從而其能 夠與所述另一核苷酸序列雜交形成穩(wěn)定雙鏈體的核酸分子。本發(fā)明的一個(gè)方面涉及編碼適合在本發(fā)明方法中使用的多核苷酸的核酸分子或 其功能等同物例如生物活性片段或結(jié)構(gòu)域,以及足夠用作雜交探針來(lái)鑒定編碼本發(fā)明多肽 的核酸分子的核酸分子,和適合用作PCR引物用于擴(kuò)增或突變核酸分子的這類(lèi)核酸分子的 片段?!敖?jīng)分離的多核苷酸”或“經(jīng)分離的核酸”是與來(lái)源生物的天然存在的基因組中緊 鄰的兩條編碼序列(一個(gè)在5’端,一個(gè)在3’端)均不緊鄰的DNA或RNA。因此,經(jīng)分離的 核酸可包含與編碼序列緊鄰的部分或所有5’非編碼(例如啟動(dòng)子)序列。該術(shù)語(yǔ)因此包 括例如被整合進(jìn)載體、整合進(jìn)自主復(fù)制的制?;虿《?、或整合進(jìn)原核生物或真核生物的基 因組DNA中的重組DNA,或作為不依賴(lài)于其它序列的獨(dú)立分子(例如通過(guò)PCR或限制性?xún)?nèi)切酶處理產(chǎn)生的cDNA或基因組DNA片段)存在的重組DNA。其還包括編碼下述額外多肽的 雜交基因的一部分的重組DNA,所述額外多肽基本不含細(xì)胞材料、病毒材料或培養(yǎng)基(通過(guò) 重組DNA技術(shù)生產(chǎn)時(shí))或化學(xué)前體或其它化學(xué)品(化學(xué)合成時(shí))。另外,“經(jīng)分離的核酸片 段”是天然不作為片段存在并且在天然狀態(tài)下不被發(fā)現(xiàn)的核酸片段。本文使用的術(shù)語(yǔ)“多核苷酸”或“核酸分子”旨在包括DNA分子(例如cDNA或基 因組DNA)和RNA分子(例如mRNA)和使用核苷酸類(lèi)似物產(chǎn)生的DNA或RNA類(lèi)似物。核酸 分子可以是單鏈的或雙鏈的,但是優(yōu)選是雙鏈DNA??梢允褂霉押塑账犷?lèi)似物或衍生物(例 如肌苷或硫代膦酸核苷酸)來(lái)合成核酸。這類(lèi)寡核苷酸可被用于例如制備核酸,所述核酸 具有改變的堿基配對(duì)能力或提高的核酸酶抗性。本文提供的序列信息不應(yīng)當(dāng)被狹義地理解為需要包括被錯(cuò)誤鑒定的堿基。本文示 出的特定序列可被容易地用于從真菌、特別是從M. scorodonius中分離完整基因,所述完 整基因可隨后被容易地進(jìn)行序列分析,從而鑒定測(cè)序錯(cuò)誤。除非另有說(shuō)明,通過(guò)對(duì)本文的DNA分子測(cè)序確定的所有核苷酸序列均使用自動(dòng) DNA測(cè)序儀測(cè)定,由本文測(cè)定的DNA分子編碼的多肽的所有氨基酸序列是通過(guò)翻譯如上測(cè) 定的DNA序列來(lái)預(yù)測(cè)的。因此,如本領(lǐng)域所已知的,對(duì)通過(guò)該自動(dòng)化途徑測(cè)定的任何DNA序 列而言,本文測(cè)定的任何核苷酸序列可含有一些錯(cuò)誤。通過(guò)自動(dòng)化測(cè)定的核苷酸序列與被 測(cè)序的DNA分子的實(shí)際核苷酸序列典型地至少約90%同一,更典型地至少約95%到至少約 99. 9%同一??梢酝ㄟ^(guò)其它途徑(包括本領(lǐng)域公知的手動(dòng)DNA測(cè)序法)更精確地測(cè)定實(shí)際 序列。又如本領(lǐng)域所已知的,與實(shí)際序列相比,被測(cè)定的核苷酸序列中的單個(gè)插入或刪除會(huì) 引起核苷酸序列翻譯中的移碼(frame shift),從而由被測(cè)定的核苷酸序列編碼的預(yù)測(cè)氨 基酸序列會(huì)與由被測(cè)定的核苷酸序列實(shí)際編碼的氨基酸序列完全不同(從該插入或刪除 的位點(diǎn)開(kāi)始)。本領(lǐng)域技術(shù)人員能夠鑒定這類(lèi)被錯(cuò)誤鑒定的堿基,并知道如何糾正這類(lèi)錯(cuò)誤。術(shù)語(yǔ)“同源性”或“百分(比)同一性”或“序列同一性”等等在本文可互換使用。 就本發(fā)明的目的而言,在本文中定義為了測(cè)定兩條氨基酸序列或兩條核酸序列共享的序列 同一性程度,就最適比較的目的排列所述序列(例如為了與第二氨基酸或核酸序列最適比 對(duì),可以向第一氨基酸或核酸序列的序列中引入缺口)。這類(lèi)排列可以在被比較的序列的全 長(zhǎng)上進(jìn)行?;蛘撸帕锌稍诟痰拈L(zhǎng)度上進(jìn)行,例如在約20個(gè)、約50個(gè)、約100或更多個(gè)核 酸/堿基或氨基酸上進(jìn)行。然后比較相應(yīng)的氨基酸位置或核苷酸位置上的氨基酸殘基或核 苷酸。當(dāng)?shù)谝粭l序列中的一個(gè)位置被與第二序列中相應(yīng)位置上相同的氨基酸殘基或核苷酸 占據(jù)時(shí),則所述分子在該位置上是同一的。兩條序列之間同一性百分比是所述序列共享的 相同位置數(shù)的函數(shù)(即%同一性=相同位置數(shù)/位置總數(shù)(即重疊位置)χ100)。優(yōu)選地, 兩條序列具有相同長(zhǎng)度。兩條序列可以在其整個(gè)長(zhǎng)度上比對(duì)。技術(shù)人員應(yīng)當(dāng)明白下述事實(shí)可獲得若干種不同的計(jì)算機(jī)程序以測(cè)定兩條序列之 間的同源性。例如,可以使用數(shù)學(xué)算法完成兩個(gè)序列之間的序列比較和同一性百分比測(cè)定。在一個(gè)優(yōu)選的實(shí)施方案中,使用Needleman and Wunsch(J. Mol. Biol. (48) 444-453 (1970))算法,使用 Blossom 62 矩陣或 PAM250 矩陣和 16、14、12、10、8、6 或 4 的缺 口權(quán)重和1、2、3、4、5或6的長(zhǎng)度權(quán)重測(cè)定兩條氨基酸序列之間的序列同一性,所述算法已 經(jīng)被整合進(jìn)GCG軟件包內(nèi)的GAP程序中(可得自http //www, accelrys. com/solutions/bioinformatician/)。技術(shù)人員應(yīng)當(dāng)知道這勝不同的參數(shù)會(huì)產(chǎn)牛輕微差異的結(jié)果,佰是使 用不同的算法時(shí)兩條序列的整體同一性百分比不會(huì)被顯著改變。在另一實(shí)施方案中,使用GCG軟件包(可得自http://Vww.gcg. com)中的GAP 程序,使用NWSgapdna. CMP矩陣和40、50、60、70或80的缺口權(quán)重和1、2、3、4、5或6的長(zhǎng) 度權(quán)重測(cè)定兩條核苷酸序列之間的序列同一性。在另一實(shí)施方案中,使用E.Meyers and W. Miller算法(CAB I OS, 4:11-17 (1989)),使用PAMl 20權(quán)重殘表、12的缺口長(zhǎng)度罰分和4的 缺口罰分測(cè)定兩條氨基酸或核苷酸序列的同一性百分比,所述算法已被整合進(jìn)ALIGN程序 (2. 0 版)中(可得自 http://veRa. iRh. cnrs. fr/bin/aliRn-Ruess. cri)?;蛘?,可以使用例如Ε. Meyers and W. Miller 的算法(CABIOS,4 11-17 (1989)), 使用PAM120權(quán)重殘表、12的缺口長(zhǎng)度罰分和4的缺口罰分測(cè)定兩條氨基酸或核苷酸序列 之間的序列同一性,所述算法已被整合進(jìn)ALIGN程序(2. 0版)中(可使用Genestream服 務(wù)器 IGH Montpellier France 的序列數(shù)據(jù)得自 ALIGN Query :http //vega. igh. cnrs. fr/ bin/aliRn-Ruess. cri)。本發(fā)明的核酸和蛋白質(zhì)序列還可以被用作“查詢(xún)序列”,針對(duì)公開(kāi)數(shù)據(jù)庫(kù)進(jìn)行搜 索,以例如鑒定其它家族成員或相關(guān)序列。這類(lèi)搜索可以使用Altschul,et al. (1990) J. Mol. Biol. 215 :403_10 的 BLASTN、BLASTP和 BLASTX程序(2. 0 版)進(jìn)行。可以使用 BLASTN 程序在核苷酸數(shù)據(jù)庫(kù)中進(jìn)行BLAST核苷酸搜索,以獲得與本發(fā)明的ZFX核酸分子同源的核 苷酸序列。可以用BLASTX程序在蛋白質(zhì)數(shù)據(jù)庫(kù)中對(duì)經(jīng)翻譯的核苷酸序列進(jìn)行BLAST搜索, 以獲得與經(jīng)翻譯的本發(fā)明ZFX基因同源的氨基酸序列?;蛘撸瑸榱伺c蛋白質(zhì)數(shù)據(jù)庫(kù)進(jìn)行蛋 白質(zhì)序列比較,可以使用BLASTP程序,其中矩陣Blosum 62,預(yù)期的閾值=10,字長(zhǎng)=3,缺 口存在成本11,缺口延伸成本1。使用BLAST程序時(shí),可以使用各個(gè)程序(例如BLASTX、 BLASTP和BLASTN)的默認(rèn)參數(shù)。公共數(shù)據(jù)庫(kù)中同源性搜索的所有相關(guān)信息見(jiàn)http //www. ncbi. nlm. nih. gov/ 上的 National Center for Biotechnology Information 主頁(yè)。BLASTP和BLASTN算法可以被用于計(jì)算序列同一性或排列序列(例如基于它們的 默認(rèn)設(shè)置來(lái)例如鑒定等同物或相應(yīng)的序列)。公眾可通過(guò) National Center for Biotechnology Information (http: //www, ncbi. nlm. nih. rov/)獲得用于進(jìn)行BLAST分析的軟件。所述算法涉及通過(guò)在查詢(xún)序列中 鑒定長(zhǎng)度為W的短詞來(lái)首先鑒定高評(píng)分序列對(duì)(HSP),所述短詞與數(shù)據(jù)庫(kù)序列中相同長(zhǎng)度 的詞比對(duì)時(shí)匹配或者滿(mǎn)足一些正值閾值分?jǐn)?shù)Τ。T被稱(chēng)作相鄰詞評(píng)分閾值(neighborhood word score threshold)。這些初始的相鄰詞擊中發(fā)揮種子的作用來(lái)起始搜索,尋找含有它 們的HSP。所述詞擊中沿各條序列在兩個(gè)方向上延伸,直至能夠提高累積的比對(duì)評(píng)分。在以 下情況下停止各個(gè)方向上詞擊中的延伸累積比對(duì)評(píng)分比其達(dá)到的最大值降低X量;由于 一個(gè)或多個(gè)負(fù)評(píng)分殘基比對(duì)的累積,累積評(píng)分達(dá)到零或以下;或達(dá)到任一序列末端。BLAST 算法參數(shù)W、T和X決定比對(duì)的靈敏度和速度。來(lái)自DNA-DNA比較的BLASTN程序使用11的 詞長(zhǎng)(W)、10的預(yù)期(E)和兩條鏈的比較作為默認(rèn)值。用于蛋白質(zhì)-蛋白質(zhì)比對(duì)的BLASTP 程序使用3的詞長(zhǎng)(W)、BL0SUM62評(píng)分矩陣、11的缺口存在罰分和1的缺口延伸罰分以及 10的預(yù)期(E)作為默認(rèn)值。BLAST算法進(jìn)行兩條序列之間相似性的統(tǒng)計(jì)學(xué)分析。BLAST算法提供的一種相似 性度量是最小和概率(P(N)),所述最小和概率提供了兩條核苷酸或氨基酸序列之間隨機(jī)發(fā)生匹配的概率的指征。例如,當(dāng)一條序列與另一序列比較的最小和概率小于約1,優(yōu)選地小 于約0. 1,更優(yōu)選地小于約0. 01,最優(yōu)選地小于約0. 001時(shí),所述一條序列被認(rèn)為與所述另 一序列相似。另外,肽基序可以被用于鑒定編碼含有該肽基序的蛋白質(zhì)的基因。除一個(gè)肽基序 以外,兩個(gè)或更多肽基序的組合也可以被用于鑒定編碼含有所述肽基序的蛋白質(zhì)的基因。 當(dāng)編碼特定脯氨酸特異性蛋白酶的一個(gè)或若干個(gè)肽基序被鑒定時(shí),可能使用一個(gè)或若干個(gè) 這些肽基序的組合來(lái)鑒定編碼編碼脯氨酸特異性蛋白酶的基因。脯氨酸特異性蛋白酶被 用作如何鑒定這類(lèi)基因的一個(gè)例子,但是所述方法是普遍適用的。肽基序可被用于使用程 序如 Patscan (http //www~unix. mcs. anl. gov/compbio/PatScan/HTML/)在經(jīng)翻譯的來(lái)自 DNA數(shù)據(jù)庫(kù)的DNA序列或來(lái)自蛋白質(zhì)序列數(shù)據(jù)庫(kù)的蛋白質(zhì)序列中進(jìn)行搜索。氨基酸序列 必須以網(wǎng)站上描述的特定格式輸入。可以進(jìn)行的另一方法是使用基序的序列,使用程序如 http://myhits. isb-sib. ch/cgi-bin/在經(jīng)翻譯的來(lái)自DNA數(shù)據(jù)庫(kù)的DNA序列或來(lái)自蛋 白質(zhì)序列數(shù)據(jù)庫(kù)的蛋白質(zhì)序列中進(jìn)行搜索。對(duì)于該程序而言,以所謂的Prosite格式在搜 索欄中輸入所述基序,并針對(duì)蛋白質(zhì)序列或經(jīng)翻譯的DNA序列中所述基序的存在搜索數(shù)據(jù) 庫(kù)。所述方法可被用于鑒定編碼有用的脯氨酸特異性蛋白酶的真菌基因。隨后可使用本領(lǐng) 域技術(shù)人員已知的程序,將使用這些方法之一鑒定的基因翻譯成蛋白質(zhì)序列,并且在它們 的氨基端檢查信號(hào)序列的存在。為了檢測(cè)信號(hào)序列,可以使用程序如SignaiP (MMiZZm^ cbs. dtu. dk/services/SiRnalP/)。下述蛋白質(zhì)序列的尋找為這類(lèi)酶的工業(yè)化生產(chǎn)提供了 巨大的益處,所述蛋白質(zhì)序列既含有共有序列又含有預(yù)測(cè)的信號(hào)序列。以這種方式鑒定的核苷酸和多肽序列可適合在本發(fā)明的方法中使用。本文使用的術(shù)語(yǔ)“雜交”旨在描述用于下述雜交和洗滌的條件,典型地,在所述條 件下彼此具有至少約50%、至少約40%、至少約70%、更優(yōu)選地至少約80%、進(jìn)一步更優(yōu)選 地至少約85 %、至少約90 %、更優(yōu)選地至少約95 %、至少約98 %、至少約99 %序列同一性的 核苷酸序列保持彼此雜交。這類(lèi)雜交條件的一個(gè)優(yōu)選的非限制性例子是于約45°C下在6X氯化鈉/檸檬酸 鈉(SSC)中雜交,然后于約50°C、優(yōu)選約55°C、優(yōu)選約60°C和進(jìn)一步更優(yōu)選約65°C下,在IX SSC,0. 1% SDS中洗滌一次或多次。高度嚴(yán)格條件包括例如于約68°C下在5x SSC/5x Denhardt' s溶液/1.0% SDS 中雜交并于約室溫下在0.2x SSC/0. 1%SDS中洗滌?;蛘?,洗滌可以在42°C進(jìn)行。技術(shù)人員應(yīng)當(dāng)知道對(duì)于嚴(yán)格和高度嚴(yán)格的雜交條件而言應(yīng)用何種條件。涉及這 類(lèi)條件的其它指示在該領(lǐng)域能夠容易地獲得,例如在Sambrook et al.,1989,Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, N. Y.; 禾口 Ausubel et al. (eds.),1995,Current Protocols in Molecular Biology,(John Wiley & Sons,N. Y.) 中。當(dāng)然,僅與多聚A序列(例如mRNA的3’末端多聚(A))或互補(bǔ)的T(或U)殘基段 雜交的多核苷酸不應(yīng)被包括于與本發(fā)明的核酸部分特異雜交的本發(fā)明多核苷酸中,因?yàn)檫@ 類(lèi)多核苷酸會(huì)與含有多聚(A)段或其補(bǔ)體的任何核酸分子(例如尤其是任何雙鏈cDNA克 隆)雜交。可以以一種典型的途徑,來(lái)篩選從其它生物(例如絲狀真菌,特別是來(lái)自Marasmius的種)構(gòu)建的cDNA文庫(kù),以獲得編碼可在本發(fā)明中使用的多肽的多核苷酸。例如,可以通過(guò)Northern印跡針對(duì)同源的過(guò)氧化物酶多核苷酸篩選Marasmius菌 株。檢測(cè)到與根據(jù)本發(fā)明的多核苷酸同源的轉(zhuǎn)錄物后,可以利用本領(lǐng)域技術(shù)人員公知的標(biāo) 準(zhǔn)技術(shù)從分離自適當(dāng)菌株的RNA構(gòu)建cDNA文庫(kù)?;蛘?,可以使用能夠與本文所述的過(guò)氧化 物酶多核苷酸雜交的探針來(lái)篩選總基因組DNA文庫(kù)??梢岳缤ㄟ^(guò)進(jìn)行PCR分離同源的基因序列,所述PCR使用以本文所述核苷酸序 列為基礎(chǔ)設(shè)計(jì)的兩個(gè)簡(jiǎn)并寡核苷酸引物池。用于反應(yīng)的模板可以是通過(guò)反轉(zhuǎn)錄mRNA獲得的cDNA,所述mRNA從已知或懷疑表 達(dá)本發(fā)明多核苷酸的菌株中制備。可以對(duì)PCR產(chǎn)物進(jìn)行亞克隆和測(cè)序,以確保被擴(kuò)增的序 列代表了新過(guò)氧化物酶核酸序列的序列或其功能等同物。然后可以通過(guò)多種已知方法,使用PCR片段來(lái)分離全長(zhǎng)cDNA克隆。例如,被擴(kuò)增 的片段可以被標(biāo)記,并用于篩選噬菌體或粘粒cDNA文庫(kù)?;蛘?,被標(biāo)記的片段可以被用于 篩選基因組文庫(kù)。也可以用PCR技術(shù)來(lái)從其它生物中分離全長(zhǎng)cDNA序列。例如,可以根據(jù)標(biāo)準(zhǔn)步驟 從合適的細(xì)胞或組織來(lái)源中分離RNA。可以使用特異于被擴(kuò)增片段最5’端的寡核苷酸引 物,引導(dǎo)第一鏈合成,針對(duì)RNA進(jìn)行反轉(zhuǎn)錄反應(yīng)。然后可以使用標(biāo)準(zhǔn)的末端轉(zhuǎn)移酶反應(yīng)將得到的RNA/DNA雜交體“加尾”(例如用鳥(niǎo) 嘌呤),可以用RNase H消化所述雜交體,然后(例如用多聚-C引物)引物起始第二鏈合 成。因此,被擴(kuò)增片段上游的cDNA序列可以容易地被分離。有用的克隆策略的綜述,參閱 例如上文 Sambrook et al. ;禾口上文白勺Ausubel et al. 0載體,優(yōu)選表達(dá)載體,可含有編碼本文定義的過(guò)氧化物酶蛋白質(zhì)或其功能等同物 的核酸。本文使用的術(shù)語(yǔ)“載體”指能夠轉(zhuǎn)運(yùn)與之連接的另一核酸的核酸分子。一種類(lèi)型的 載體是“質(zhì)粒”,質(zhì)粒是指其中可以連接其它DNA區(qū)段的環(huán)狀雙鏈DNA環(huán)。另一種類(lèi)型的載體 是病毒載體,其中其它DNA區(qū)段可以被連接進(jìn)病毒基因組中。某些載體在它們被引入的宿 主細(xì)胞中能夠自主復(fù)制(例如具有細(xì)菌復(fù)制起點(diǎn)的細(xì)菌載體和附加體哺乳動(dòng)物載體)。其 它載體(例如非附加體哺乳動(dòng)物載體)在引入宿主細(xì)胞時(shí)被整合進(jìn)宿主細(xì)胞的基因組中, 從而隨宿主細(xì)胞的基因組一起被復(fù)制。另外,某些載體能夠指導(dǎo)與它們可操作地連接的基 因的表達(dá)。這類(lèi)載體在本文中被稱(chēng)作“表達(dá)載體”。一般而言,重組DNA技術(shù)中使用的表達(dá) 載體通常是以質(zhì)粒的形式存在的。術(shù)語(yǔ)“質(zhì)粒”和“載體”在本文中可互換使用,因?yàn)橘|(zhì)粒 是最常用的載體形式。然而,本發(fā)明旨在包括這類(lèi)表達(dá)載體的起等同作用的其它形式,如病 毒載體(例如復(fù)制缺陷反轉(zhuǎn)錄病毒、腺病毒和腺伴隨病毒)。本文所述的重組表達(dá)載體以適合核酸在宿主細(xì)胞中表達(dá)的形式包含核酸,這意味 著重組表達(dá)載體含有一個(gè)或多個(gè)與待表達(dá)的核酸序列可操作地連接的調(diào)節(jié)序列,以要用于 表達(dá)的宿主細(xì)胞為基礎(chǔ)選擇所述調(diào)節(jié)序列。在重組表達(dá)載體中,“可操作地連接”旨在表 示感興趣的核苷酸序列與調(diào)節(jié)序列以允許核苷酸序列表達(dá)(例如在體外轉(zhuǎn)錄/翻譯體系 中或當(dāng)載體被引入宿主細(xì)胞中時(shí)在宿主細(xì)胞中)的方式連接。術(shù)語(yǔ)“調(diào)節(jié)序列”旨在包括 啟動(dòng)子、增強(qiáng)子和其它表達(dá)控制元件(例如多腺苷酸化信號(hào))。這類(lèi)調(diào)節(jié)序列描述于例如 Goeddel ;Gene Expression Technology :Methods in Enzymology 185,Academic Press, San Diego,CA(1990)中。調(diào)節(jié)序列包括在許多類(lèi)型的宿主細(xì)胞中指導(dǎo)核苷酸序列組成型表
20達(dá)的那些和僅在某種宿主細(xì)胞中指導(dǎo)核苷酸序列表達(dá)的那些(例如組織特異調(diào)節(jié)序列)。 本領(lǐng)域技術(shù)人員應(yīng)當(dāng)知道對(duì)表達(dá)載體的設(shè)計(jì)可以以下述因素為基礎(chǔ),如待轉(zhuǎn)化的宿主細(xì) 胞的選擇、期望的蛋白質(zhì)表達(dá)水平等。此類(lèi)表達(dá)載體可以被引入宿主細(xì)胞中,從而生產(chǎn)由本 文所述的核酸編碼的蛋白質(zhì)或肽。重組表達(dá)載體可以被設(shè)計(jì),以用于過(guò)氧化物酶蛋白質(zhì)在原核細(xì)胞或真核細(xì)胞中 的表達(dá)。例如過(guò)氧化物酶蛋白質(zhì)可以在真菌細(xì)胞,細(xì)菌細(xì)胞如E.coli,昆蟲(chóng)細(xì)胞(使用桿 狀病毒表達(dá)載體),酵母細(xì)胞或哺乳動(dòng)物細(xì)胞中表達(dá)。合適的宿主細(xì)胞在Goeddel,Gene Expression Technology :Methods in Enzymology 185,Academic Press,San Diego, CA(1990)中進(jìn)一步討論?;蛘?,可以例如使用T7啟動(dòng)子調(diào)節(jié)序列和T7聚合酶體外轉(zhuǎn)錄和 翻譯重組表達(dá)載體??捎糜谏a(chǎn)可用于本發(fā)明的多肽的表達(dá)載體包括來(lái)自染色體、附加體和病毒的載 體,例如來(lái)自細(xì)菌質(zhì)粒、噬菌體、酵母附加體、酵母染色體元件、病毒(如桿狀病毒、乳多空 病毒、痘苗病毒、腺病毒、禽痘病毒、假狂犬病病毒和反轉(zhuǎn)錄病毒)的載體和來(lái)自其組合的 病毒,如來(lái)自質(zhì)粒和噬菌體遺傳元件的病毒(如粘粒和噬菌粒)。DNA插入物應(yīng)與合適的啟動(dòng)子可操作地連接,所述啟動(dòng)子如噬菌體λ PL啟動(dòng)子, Ε. coli lac、trp和tac啟動(dòng)子,SV40早期和晚期啟動(dòng)子和反轉(zhuǎn)錄病毒LTR的啟動(dòng)子,但不 限于這些。其它合適的啟動(dòng)子是技術(shù)人員應(yīng)當(dāng)知道的。在一個(gè)特定的實(shí)施方案中,能夠在 原核生物或絲狀真菌中指導(dǎo)過(guò)氧化物酶高水平表達(dá)的啟動(dòng)子是優(yōu)選的。這類(lèi)啟動(dòng)子是本領(lǐng) 域已知的。表達(dá)構(gòu)建體可含有轉(zhuǎn)錄起始位點(diǎn)、終止位點(diǎn)和(在被轉(zhuǎn)錄的區(qū)域中)用于翻譯 的核糖體結(jié)合位點(diǎn)。構(gòu)建體表達(dá)的成熟轉(zhuǎn)錄本的編碼部分應(yīng)包含位于起點(diǎn)的翻譯起始AUG 和適當(dāng)?shù)匚挥诖g多肽末端的終止密碼子。可以通過(guò)常規(guī)的轉(zhuǎn)化或轉(zhuǎn)染技術(shù)將載體DNA引入原核或真核細(xì)胞中。本文使用 的術(shù)語(yǔ)“轉(zhuǎn)化”和“轉(zhuǎn)染”旨在表示用于向宿主細(xì)胞中引入外源核酸(例如DNA)的多種本 領(lǐng)域公認(rèn)的技術(shù),包括磷酸鈣或氯化鈣共沉淀、DEAE-葡聚糖-介導(dǎo)的轉(zhuǎn)染、轉(zhuǎn)導(dǎo)、感染、 脂質(zhì)轉(zhuǎn)染、陽(yáng)離子脂質(zhì)介導(dǎo)的轉(zhuǎn)染或電穿孔。用于轉(zhuǎn)化或轉(zhuǎn)染宿主細(xì)胞的合適方法可見(jiàn) 于 Sambrook,et al. (Molecular Cloning :A Laboratory Manual,2nd, ed· Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989),Davis et al. ,Basic Methods in Molecular Biology(1986)和其它實(shí)驗(yàn)室手冊(cè)中。對(duì)于哺乳動(dòng)物細(xì)胞的穩(wěn)定轉(zhuǎn)染而言,已知取決于使用的表達(dá)載體和轉(zhuǎn)染技術(shù),只 有非常小的細(xì)胞級(jí)分可以將外源DNA整合進(jìn)它們的基因組中。為了鑒定并選擇這些整合 體,通常將編碼可選擇標(biāo)記(例如抗性或抗生素)的基因與感興趣的基因一起引入宿主細(xì) 胞中。優(yōu)選的可選擇標(biāo)記包括賦予藥物(例如G418、潮霉素和甲氨喋呤)抗性的基因。編 碼可選擇標(biāo)記的核酸可以被引入宿主細(xì)胞中與編碼過(guò)氧化物酶蛋白質(zhì)的核酸相同的載體 上,或可以被引入獨(dú)立的載體上??梢酝ㄟ^(guò)藥物選擇來(lái)鑒定用被引入的核酸穩(wěn)定轉(zhuǎn)染的細(xì) 胞(例如,已經(jīng)整合了可選擇標(biāo)記基因的細(xì)胞能夠存活,而其它細(xì)胞死亡)。蛋白質(zhì)在原核生物中的表達(dá)常在E.coli中用下述載體完成,所述載體含有指導(dǎo) 融合蛋白或非融合蛋白表達(dá)的組成型或誘導(dǎo)型啟動(dòng)子。融合載體對(duì)其中編碼的蛋白質(zhì)、例 如對(duì)重組蛋白的氨基端添加大量氨基酸。這類(lèi)融合載體典型地具有三個(gè)目的1)提高重組 蛋白的表達(dá);2)提高重組蛋白的溶解度;3)通過(guò)在親和層析中發(fā)揮配體作用來(lái)幫助純化重組蛋白。通常在融合表達(dá)載體中,在融合片段和重組蛋白的接合處引入蛋白水解切割位點(diǎn), 使得能夠在融合蛋白的純化后將重組蛋白與融合片段分開(kāi)。這類(lèi)酶及其同族的識(shí)別序列包 括因子X(jué)a、凝血酶和腸激酶。如所指出的,表達(dá)載體優(yōu)選地含有可選擇標(biāo)記。這類(lèi)標(biāo)記包括用于真核細(xì)胞培 養(yǎng)的二氫葉酸還原酶或新霉素抗性,和用于在E. coli和其它細(xì)菌中培養(yǎng)的四環(huán)素或氨 芐西林抗性。合適的宿主細(xì)胞的代表性例子包括細(xì)菌細(xì)胞,如E. coli、Streptomyces和 Salmonella typhimurium ;真菌細(xì)胞,如酵母;昆蟲(chóng)細(xì)胞如 Drosophila S2 禾口 Spodoptera Sf9 ;動(dòng)物細(xì)胞如CH0,C0S和Bowes melanoma ;和植物細(xì)胞。用于上述宿主細(xì)胞的適當(dāng)培養(yǎng) 基和條件是本領(lǐng)域已知的。載體中優(yōu)選用于細(xì)菌的是可得自Qiagen的pQE70、pQE60和PQE-9 ;可得自 Stratagene 的 pBS 本、Phagescript 本、Bluescript 本、ρΝΗ8Α> ρΝΗ16Α> ρΝΗ18Α> ρΝΗ46Α 和可得自 Pharmacia 的 ptrc99a、pKK223-3、pKK233_3、pDR540、pRIT5。優(yōu)選的真核 載體為可得自 Stratagene 的 PWLNE0、pSV2CAT、p0G44、pZTl 和 pSG ;和可得自 Pharmacia 的 pSVK3、pBPV、pMSG和pSVL。其它合適的載體是技術(shù)人員顯而易見(jiàn)的。用于本發(fā)明的已知的細(xì)菌啟動(dòng)子包括E. coli Iacl和IacZ啟動(dòng)子,T3和T7啟動(dòng) 子,gpt啟動(dòng)子,λ PR、PL啟動(dòng)子和trp啟動(dòng)子,HSV胸苷激酶啟動(dòng)子,早期和晚期SV40啟動(dòng) 子,反轉(zhuǎn)錄LTR的啟動(dòng)子如Rous肉瘤病毒(“RSV")的啟動(dòng)子和金屬硫蛋白啟動(dòng)子如小 鼠金屬硫蛋白-I啟動(dòng)子??梢酝ㄟ^(guò)向載體中插入增強(qiáng)子序列,來(lái)提高高等真核生物對(duì)編碼本發(fā)明多肽的 DNA的轉(zhuǎn)錄。增強(qiáng)子是DNA的順式作用元件,通常約10到300bp,其作用于提高啟動(dòng)子在給 定的宿主細(xì)胞類(lèi)型中的轉(zhuǎn)錄活性。增強(qiáng)子的例子包括SV40增強(qiáng)子(其位于復(fù)制起點(diǎn)下游 的bp 100到270)、巨細(xì)胞病毒早期啟動(dòng)子增強(qiáng)子、復(fù)制起點(diǎn)下游的多瘤增強(qiáng)子和腺病毒增 強(qiáng)子。為了將翻譯的蛋白質(zhì)分泌進(jìn)入內(nèi)質(zhì)網(wǎng)腔中、進(jìn)入壁膜間隙中或進(jìn)入細(xì)胞外環(huán)境 中,可以向被表達(dá)的多肽中整合進(jìn)適當(dāng)?shù)姆置谛盘?hào)。所述信號(hào)對(duì)多肽可以是同源的或它們 可以是異源信號(hào)。多肽可以以經(jīng)修飾(如融合蛋白)的方式被表達(dá),并可不僅含有分泌信號(hào)而且含 有額外的異源功能區(qū)。因此,例如額外氨基酸區(qū)(尤其是帶電荷的氨基酸)可被添加至多 肽的N端,以促進(jìn)純化期間或隨后的操作和儲(chǔ)存期間在宿主細(xì)胞中的穩(wěn)定性和持久性。還 可向多肽添加肽基元,以便于純化。本文中還描述了含有下述核酸的細(xì)胞,例如經(jīng)轉(zhuǎn)化的宿主細(xì)胞或重組宿主細(xì)胞, 所述核酸編碼適合在本發(fā)明的方法中使用的多肽。“經(jīng)轉(zhuǎn)化的細(xì)胞”或“重組細(xì)胞”是其中 (或其祖先中)已經(jīng)借助于重組DNA技術(shù)引入了本文所述的核酸的細(xì)胞。原核和真核細(xì)胞 均包括在內(nèi),例如細(xì)菌、真菌、酵母等等。合適的宿主細(xì)胞的例子是Microcystis,L印ista,例如L. irina, Cyathus,例如 C. pallidus, Ganoderma,例如 G. applanatum, Ischnoderma,例如 I. benzoinum, Marasmius, 例如 M. scorodonius, Trametes,例如 T. suaveolens of Τ. versicolor, Cryptococcus, 例如 C. Iaurentii, Hypomyces,例如 H. odoratus 或 Phaffia,例如 P. rhodozyma, Phanerochaete 例 如 P. chrysosporium, Lentinula 例 如 L. edodes, Coprinus 例 如C. cinereus, Gloeophyllum 例如 G. trabeum, Ophiostoma 例如 0. piliferum, Aspergillus 例如 A. niger, A. oryzae, A. nidulans, Thermomyces,例如 Τ· lanuginosa, Sporotrichum, 例如 S. thermophile, Aureobasidium 例如 k. pullulans, Amorphotheca,例如 k. resinae, Leucosporidium,例如 L. scottii, Cunninghamella,例如 C. elegans。尤其優(yōu)選的是來(lái)自絲狀真菌的細(xì)胞,特別是Aspergi 1 Ius-例如Aspergi 1 Ius oryzae 或 Aspergillus niger-禾口 Marasmius-例如 Marasmius scorodonius-或來(lái)自酵母 的細(xì)胞如Pichia,-例如Pichia Pastoris-或來(lái)自細(xì)菌的細(xì)胞。可選用調(diào)控插入序列表達(dá)并以特異的、期望的方式加工基因產(chǎn)物的宿主細(xì)胞。蛋 白質(zhì)產(chǎn)物的這類(lèi)修飾(例如糖基化)和加工(例如切割)可促進(jìn)蛋白質(zhì)發(fā)揮最佳功能。多種宿主細(xì)胞具有用于翻譯前加工和修飾蛋白質(zhì)和基因產(chǎn)物的特性和特異機(jī)制。 可選用分子生物學(xué)和/或微生物學(xué)領(lǐng)域技術(shù)人員熟悉的適當(dāng)細(xì)胞系或宿主系統(tǒng),以確保對(duì) 所表達(dá)的外源蛋白質(zhì)的想要的和正確的修飾與加工。為此,可以使用具有下述細(xì)胞機(jī)制的 真核宿主細(xì)胞,所述細(xì)胞機(jī)制用于適當(dāng)?shù)丶庸ぴ嫁D(zhuǎn)錄本、糖基化和磷酸化基因產(chǎn)物。這類(lèi) 宿主細(xì)胞是本領(lǐng)域公知的。宿主細(xì)胞還包括但不限于哺乳動(dòng)物細(xì)胞系如CHO、VERO, BHK、HeLa, COS、MDCK, 293、3T3、WI38和脈絡(luò)叢細(xì)胞系。需要時(shí),根據(jù)本發(fā)明的多肽可以由經(jīng)穩(wěn)定轉(zhuǎn)染的細(xì)胞系生 產(chǎn)。公眾可獲得適用于穩(wěn)定轉(zhuǎn)染哺乳動(dòng)物細(xì)胞的大量載體,構(gòu)建這類(lèi)細(xì)胞系的方法也是公 眾已知的,例如見(jiàn)Ausubel et al.(上文)。在本發(fā)明的方法中,本發(fā)明的多肽與包含非淀粉的碳水化合物的材料接觸。多肽可以作為經(jīng)分離或經(jīng)純化的酶、酶制劑而添加,或者通過(guò)能夠生產(chǎn)所述酶的 微生物原位生產(chǎn)。酶制劑可得自多種來(lái)源,例如來(lái)自植物、動(dòng)物和微生物。優(yōu)選地,酶制劑 得自微生物,因?yàn)槲⑸锸沟每赡芤允芸氐姆绞揭怨I(yè)規(guī)模獲得酶。來(lái)自微生物的酶制劑 可以通過(guò)選定的微生物菌株的經(jīng)典發(fā)酵方法獲得,或者通過(guò)發(fā)酵過(guò)表達(dá)所述酶的微生物 獲得。微生物可以是細(xì)菌、真菌或酵母。合適的微生物的例子是Microcystis,L印ista, 例如 L. irina, Cyathus,例如 C. pallidus, Ganoderma,例如 G. applanatum, Ischnoderma, 例如 I. benzoinum, Marasmius,例如 M. scorodonius, Trametes,例如 T. suaveoluens of Τ.versicolour, Cryptococcus,例如 C. Iaurentii, Hypomyces,例如 H. odoratus 或 Phaffia,例如 P.rhodozyma, Phanerochaete 例如 P.chrysosporium, Lentinula 例如 L. edodes, Coprinus 例如 C. cinereus, Gloeophyllum 例如 G. trabeum, Ophiostoma 例 如 0. piliferum, Aspergillus 例如 k. niger, A. oryzae, A. nidulans, Thermomyces,例如 Τ. lanuginosa, Sporotrichum,例如 S. thermophile, Aureobasidium 例如 k. pullulans, Amorphotheca,例如 k. resinae, Leucosporidium,例如 L. scottii, Cunninghamella,例如 C. elegans。本發(fā)明的方法可以如下進(jìn)行,其中所述多肽作為得自植物的酶制劑添加或由植物 原位生產(chǎn),所述植物例如為玉米植物、水稻植物、甘蔗植物、小麥植物或大麥植物。包含適用于被本發(fā)明多肽修飾的剕淀粉碳水化合物的材料典型地是木質(zhì)纖維素。 可以被認(rèn)為是潛在的可再生原料的,包含不同木質(zhì)纖維素殘基的主要的多糖是纖維素(葡 聚糖)、半纖維素(木聚糖、雜木聚糖(heteroxylans)和木葡聚糖(xyloglucans))。另外, 一些半纖維素可能作為葡甘露聚糖(glucomarmans)存在于例如木材衍生的原料中。這些多糖成為可溶糖(例如葡萄糖、木糖、阿拉伯糖、半乳糖、蔗糖、果糖、甘露糖、鼠李糖、核糖、 D-半乳糖醛酸和其它己糖和戊糖)的酶促水解發(fā)生于共同作用(acting in concert)的不 同酶的作用下。另外,果膠和其它果膠物質(zhì)如阿拉伯聚糖(arabinans)可構(gòu)成來(lái)自非木本植物組 織典型的細(xì)胞壁干物質(zhì)的可觀(guān)的比例(約四分之一到一半的干物質(zhì)可以是果膠)。在本發(fā)明的方法中,包含非淀粉的碳水化合物的材料可以是木質(zhì)纖維素的形式, 即木質(zhì)纖維素“底物”或“生物質(zhì)”或“原料”。這包括含有纖維素、半纖維素、木質(zhì)素、蛋白 質(zhì)和碳水化合物(如淀粉和糖)的任何材料?!吧镔|(zhì)”包括原生生物質(zhì)(virgin biomass) 或非原生生物質(zhì)如農(nóng)業(yè)生物質(zhì),商業(yè)有機(jī)物,建筑和拆除碎片,市政固體廢棄物,廢紙和庭 院廢棄物。常見(jiàn)的生物質(zhì)形式包括樹(shù)木,灌木叢(shrubs)和草,小麥,小麥秸,甘蔗渣, 玉米,玉米殼,玉米粒(包括來(lái)自玉米粒的纖維),來(lái)自谷物如玉米研磨(包括濕磨和干 磨)的產(chǎn)物和副產(chǎn)物以及市政固體廢棄物,廢紙和庭院廢棄物?!皳胶仙镔|(zhì)(Blended biomass) ”是原生和非原生生物質(zhì)的任何混合物,優(yōu)選地具有按重量計(jì)從約5%到約95% 的非原生生物質(zhì)?!稗r(nóng)業(yè)生物質(zhì)”包括樹(shù)枝,灌木(bushes),藤蔓,玉米和玉米殼,能量作物, 森林,水果,鮮花,谷物,草,草本作物,樹(shù)葉,樹(shù)皮,針葉,原木,根,樹(shù)苗,短期輪種木本作物 (short-rotation woody crops),灌木叢,柳枝稷,樹(shù)木,蔬菜,水果皮,硬或軟木材(不包括 帶有有害材料的木材)。另外,農(nóng)業(yè)生物質(zhì)包括由農(nóng)業(yè)工藝產(chǎn)生的有機(jī)廢棄物材料,所述農(nóng) 業(yè)工藝包括農(nóng)業(yè)和林業(yè)活動(dòng),特定地包括林業(yè)木材廢棄物。農(nóng)業(yè)生物質(zhì)可以是前述任一或 其混合物的任何組合。富含淀粉、糖或蛋白質(zhì)的生物質(zhì)如玉米、谷物、水果和蔬菜通常作為食物被消耗。 相反,富含纖維素、半纖維素和木質(zhì)素的生物質(zhì)不是容易消化的,并且主要被用于木材和 紙制品,燃料或典型地被丟棄。通常,底物具有高木質(zhì)纖維素含量,包括玉米秸稈(corn stover),水稻秸,干草,甘蔗渣,和其它農(nóng)業(yè)生物質(zhì),柳枝稷,林業(yè)廢棄物,楊木片(poplar wood chips),松木片(pine wood chips),鋸屑,庭院廢棄物等等,包括底物的任何組合。在本發(fā)明的方法中,包含非淀粉的碳水化合物的材料與本文所述的過(guò)氧化物酶多 肽接觸。然后將非淀粉的碳水化合物材料與下述酶接觸,所述酶降解材料中包含的所述非 淀粉的碳水化合物,例如從所述非淀粉的碳水化合物生產(chǎn)糖。另外,在本發(fā)明的方法中可以使用輔助多肽。這類(lèi)多肽可以是酶。輔助多肽可以 在使用本文所述的過(guò)氧化物酶多肽的同時(shí)、之前或之后使用。輔助多肽可發(fā)揮作用,從而進(jìn)一步修飾包含非淀粉的碳水化合物的材料,或可進(jìn) 一步提高所述包含非淀粉的碳水化合物的材料對(duì)酶促降解的易感性。輔助酶可發(fā)揮作用, 從而進(jìn)一步提高本文所述的過(guò)氧化物酶多肽的效果。輔助多肽可提高降解非淀粉的碳水化合物的酶的活性。在反應(yīng)中與生物質(zhì)接觸時(shí),輔助多肽可提高降解非淀粉的碳水化合物的酶(如纖 維素酶)的活性和/或提高對(duì)所述酶的易感性。輔助酶可以在與本文所述的過(guò)氧化物酶多肽和/或非淀粉降解酶(例如纖維素 酶)相同的反應(yīng)器中反應(yīng)。盡管認(rèn)為許多種類(lèi)的酶可以作為輔助酶發(fā)揮作用,但是特別的輔助酶可由以下種 類(lèi)的酶組成(但不限于此)淀粉酶、蛋白酶、脂肪酶、葡糖醛酸糖苷酶或氧化還原酶。
適合在本發(fā)明的方法中使用的多肽(例如酶)可以由來(lái)自以下的酶組成⑴供 應(yīng)商;(2)經(jīng)克隆的表達(dá)酶的基因;(3)復(fù)合培養(yǎng)液(例如由培養(yǎng)基中微生物菌株的生長(zhǎng)得 到的,其中所述菌株向培養(yǎng)基中分泌蛋白質(zhì)和酶);(4)如(3)中培養(yǎng)的菌株的細(xì)胞裂解物; 和(5)表達(dá)能夠降解木質(zhì)纖維素的酶的植物材料。公認(rèn)可以利用(除本文所述的過(guò)氧化物酶以外使用)酶的任何組合。酶可以單獨(dú) 使用或者在下述混合物中使用,所述混合物包括但不限于至少一種纖維素酶;至少一種半 纖維素酶;至少一種果膠酶。也就是說(shuō),本發(fā)明的方法可以如下進(jìn)行,其中使用纖維素酶,例 如內(nèi)切纖維素酶和/或外切纖維素酶和/或β _葡萄糖苷酶。應(yīng)當(dāng)理解,如上文所述,酶混合物可由每個(gè)這些酶種類(lèi)的一個(gè)成員、一個(gè)酶種類(lèi)的 若干成員(如兩種或更多半纖維素酶)或這些酶種類(lèi)成員的任何組合(如蛋白酶、外切纖 維素酶和內(nèi)切木聚糖酶;或外切木聚糖酶和脂肪酶)組成。在本文中,纖維素酶是能夠降解或修飾纖維素的任何多肽。能夠降解纖維素的多 肽是能夠催化下述過(guò)程的多肽將纖維素降解成更小的單元,例如部分地降解成纖維素糊 精,或者完全降解成葡萄糖單體。與纖維素酶接觸時(shí),根據(jù)本發(fā)明的纖維素酶可造成纖維素 糊精與葡萄糖單體的混合種群。此類(lèi)降解應(yīng)典型地通過(guò)水解反應(yīng)而發(fā)生。本文中,半纖維素是能夠降解或修飾半纖維素的任何多肽。也就是說(shuō),半纖維素酶 可以能夠降解或修飾木聚糖、葡糖醛酸木聚糖、阿拉伯木聚糖、葡甘露聚糖和木葡聚糖之一 種或多種。能夠降解半纖維素的多肽是能夠催化下述過(guò)程的多肽將半纖維素降解成更小 的多糖,例如部分地降解成寡糖,或者完全降解成糖單體,例如己糖或戊糖單體。與半纖維 素酶接觸時(shí),根據(jù)本發(fā)明的半纖維素酶可造成寡糖與糖單體的混合種群。此類(lèi)降解應(yīng)典型 地通過(guò)水解反應(yīng)而發(fā)生。本文中,果膠酶是能夠降解或修飾果膠的任何多肽。能夠降解果膠的多肽是能夠 催化下述過(guò)程的多肽將果膠降解成更小的單元,例如部分地降解成寡糖,或者完全降解成 糖單體。與果膠酶接觸時(shí),根據(jù)本發(fā)明的果膠酶可造成寡糖與糖單體的混合種群。此類(lèi)降 解應(yīng)典型地通過(guò)水解反應(yīng)而發(fā)生?!袄w維素酶”包括能夠?qū)⒗w維素或由纖維素降解得到的產(chǎn)物識(shí)別為底物的外切水 解酶和內(nèi)切水解酶。纖維素酶包括酶的混合物,所述酶包括內(nèi)切葡聚糖酶、纖維二糖水解 酶、葡糖苷酶或任何單獨(dú)的這些酶,或與其它活性組合的這些酶。生產(chǎn)纖維素降解活性的生 物通常生產(chǎn)具有不同底物特異性的多種酶。因此,被鑒定為消化纖維素的菌株可以被描述 為含有纖維素酶,其中實(shí)際可有若干種酶為所述活性作出貢獻(xiàn)。例如,“纖維素酶”的商業(yè)制 劑通常是若干酶如內(nèi)切葡聚糖酶、外切葡聚糖酶和葡萄糖苷酶活性的混合物。因此,“纖維素酶”在本文中包括此類(lèi)酶的混合物,并且包括能夠降解纖維素的商 業(yè)制劑,以及顯示纖維素降解活性或作用于纖維素降解的分解產(chǎn)物(例如纖維三糖或纖維 二糖)的培養(yǎng)上清液或細(xì)胞提取物?!袄w維二糖水解酶”或“外切葡聚糖酶”或“外切纖維素酶”或“ 1,4,_ β -D-葡聚糖纖 維二糖水解酶”或“纖維素1,4-β -纖維二糖酶”或“纖維二糖酶”包括水解纖維素和纖維四 糖中的1,4-β -D-糖苷鍵,從鏈的還原性或非還原性末端釋放纖維二糖的酶。EC 3. 2. 1. 91 類(lèi)的酶包括如CBHl和CBH2的這些酶。“ β -葡萄糖苷酶”或“葡萄糖苷酶”或“ β -D-葡萄糖苷葡萄糖水解酶”或“纖維二糖酶"EC 3. 2. 1. 21包括釋放葡萄糖分子作為其催化反應(yīng)產(chǎn)物的酶。這些酶識(shí)別葡萄糖的寡 聚體,如纖維二糖(通過(guò)β _1,4鍵連接的葡萄糖二聚體)或纖維三糖(通過(guò)β_1,4鍵連接 的葡萄糖三聚體)作為底物。典型地,它們水解末端非還原性β-D-葡萄糖,釋放β-D-葡萄糖。 “內(nèi)切葡聚糖酶”或“ 1,4- β -D-葡聚糖4-葡聚糖水解酶”或“ β -1,4,內(nèi)切纖維素 酶”或“內(nèi)切纖維素酶”或“纖維素酶” EC 3.2. 1.4包括切割通過(guò)β_1,4鍵連接的葡萄糖聚 合物的酶。這些酶作用的底物包括纖維素和經(jīng)修飾的纖維素底物如羧甲基纖維素、RBB-纖 維素等等。EG1、EG2、EG3、EG4、EG5、EG6和EG7落入這類(lèi)酶中?!鞍肜w維素酶”或“木聚糖酶”包括能夠?qū)肜w維素或由半纖維素降解得到的產(chǎn) 物作為底物識(shí)別并水解的外切水解酶和內(nèi)切水解酶。在其中異木聚糖(heteroxylans) 是半纖維素主要成分的單子葉植物中,可使用內(nèi)切-1,4_β-木聚糖酶(EC 3.2. 1.8) 和β-D-木糖苷酶(EC 3.2. 1.37)的組合將半纖維素分解成木糖。額外的脫支酶 (debranching enzymes)能夠水解位于半纖維素結(jié)構(gòu)分支點(diǎn)處的其它糖組分(阿拉伯糖、 半乳糖、甘露糖)。額外的酶能夠水解在半纖維素糖(主要是阿拉伯糖)和木質(zhì)素之間形 成的鍵?!皟?nèi)切木聚糖酶”或“1,4-β-內(nèi)切木聚糖酶”或“l(fā),4-i3-D-木聚糖木聚糖水解 酶”或(EC 3.2. 1.8)包括水解通過(guò)β _1,4鍵結(jié)合的木糖聚合物。內(nèi)切木聚糖酶可以被用 于水解木質(zhì)纖維素的半纖維素組分以及經(jīng)純化的木聚糖底物?!巴馇心揪厶敲浮被颉唉?木 糖苷酶”或“木聚糖1,4-β-木糖苷酶”或“l(fā),4-i3-D-木聚糖木糖水解酶”或“木二糖酶 (xylobiase) ”或“外切_1,4_β -木糖苷酶”(EC 3. 2. 1. 37)包括從木聚糖聚合物的非還原 性末端依次水解D-木糖殘基的酶?!鞍⒗揪厶敲?arabinoxylanase) ”或“葡糖醛酸阿 拉伯木聚糖內(nèi)切一1,4-β 木聚糖醇(glucuronoarabinoxylan endo—1,4-β-xylanase),,或 "feraxan內(nèi)切木聚糖酶”包括水解一些木聚糖底物中β_1,4木糖基鍵的酶?!鞍肜w維素酶”在本發(fā)明中還包括水解木聚糖聚合物的木糖單元與乙酰基(乙?;?木聚糖酯酶,EC 3. 1. 1. 6和EC 3. 1. 1. 72)之間酯鍵(酯酶,EC 3. 1. 1)的酶,或者阿拉伯 糖基和酚部件如阿魏酸(阿魏酰基酯酶(feruloyl esterase),EC 3. 1. 1. 73)和對(duì)香豆酸 (香豆?;ッ?coumaroyl esterase),EC 3. 1. 1_)酯鍵酯鍵(酯酶,EC 3. 1. 1)的酶。半纖維素酶在本發(fā)明中還包括從木聚糖主鏈上去除阿拉伯糖取代基的α -L-阿 拉伯呋喃糖苷酶(EC 3. 2. 1. 55)。因此,在本發(fā)明中可使用“ α _Ν_阿拉伯呋喃糖苷酶”、“阿 拉伯糖苷酶”、“ α _阿拉伯糖苷酶”、“ α -L-阿拉伯糖苷酶”、“ α _阿拉伯呋喃糖苷酶”、“多糖 α -L-阿拉伯呋喃糖苷酶”、“ α -L-阿拉伯呋喃糖苷水解酶”、“L_阿拉伯糖苷酶”、“ α -L-阿 拉伯聚糖酶”或“ α -L-阿拉伯呋喃糖苷阿拉伯呋喃糖水解酶”。“半纖維素酶”在本發(fā)明中包括水解甘露聚糖酶、半乳甘露聚糖和/或葡甘露聚糖 中l(wèi),4-i3_D-甘露糖苷鍵的酶。因此,本發(fā)明中可以使用“甘露聚糖內(nèi)切-1,4_β-甘露糖 苷酶”、“內(nèi)切-1,4-β -甘露聚糖酶”、“內(nèi)切-β-1,4-甘露聚糖酶”、“ β -甘露聚糖酶B”、 “ β-1,4-甘露聚糖-4-甘露聚糖水解酶”、“內(nèi)切- β -甘露聚糖酶”、“ β -D-甘露聚糖酶”或 “1,4-β-D-甘露聚糖甘露聚糖水解酶”(EC 3. 1. 1.78)?!肮z酶”在本發(fā)明中包括能夠水解果膠或果膠物質(zhì)的任何物質(zhì)。本發(fā)明的組合物 可包含任何果膠酶,例如內(nèi)切多聚半乳糖醛酸酶,果膠甲基酯酶,內(nèi)切_半乳聚糖酶,β _半 乳糖苷酶,果膠乙?;ッ?,內(nèi)切-果膠裂合酶,果膠酸裂合酶,α "鼠李糖苷酶,外切_半乳糖醛酸酶,外切多聚半乳糖醛酸酯裂合酶,鼠李半乳糖醛酸聚糖水解酶,鼠李半乳糖醛酸 聚糖裂合酶,鼠李半乳糖醛酸聚糖乙?;ッ福罄畎肴樘侨┧峋厶前肴樘侨┧崴饷?,木 半乳糖醛酸酶。本文中,內(nèi)切-多聚半乳糖醛酸酶(EC 3. 2. 1. 15)是能夠催化果膠酸酯和其它 半乳糖醛酸聚糖中1,4_α-D-半乳糖醛酸鍵的隨機(jī)水解的任何多肽。所述酶也可以被稱(chēng) 作多聚半乳糖醛酸酶果膠解聚酶,果膠酶(pectinase),內(nèi)切多聚半乳糖醛酸酶,果膠酶 (pectolase),果膠水解酶,果膠多聚半乳糖醛酸酶,多聚-α _1,4_半乳糖醛酸苷聚糖水解 酶,內(nèi)切半乳糖醛酸酶;內(nèi)切-D-半乳糖醛酸酶或多聚(1,4-α-D-半乳糖醛酸苷)聚糖水 解酶。在本文中,果膠甲基酯酶(EC 3. 1. 1. 11)是能夠催化下述反應(yīng)的任何酶果膠+η H2O = η甲醇+果膠酸。所述酶也已知為果膠酯酶(pectinesterase),果膠脫甲氧基酶, 果膠甲氧基酶,果膠甲基酯酶,果膠酶,果膠酯酶(pectinoesterase)或果膠果?;饷?(pectin pectylhydrolase)。在本文中,內(nèi)切-半乳聚糖酶(EC 3. 2. 1. 89,EC 3. 2. 1. 90)是能夠催化阿拉伯半 乳聚糖中l(wèi),4-i3_D-半乳糖苷鍵的內(nèi)切水解的任何酶。所述酶也已知為阿拉伯半乳聚糖內(nèi) 切-1,4- β -半乳糖苷鍵,內(nèi)切-1,4- β -半乳聚糖酶,半乳聚糖酶,阿拉伯半乳聚糖酶或阿 拉伯半乳聚糖4-β -D-半乳聚糖水解酶。本文中,果膠乙酰基酯酶在本文中被定義為下述任何酶,所述酶具有催化果膠 GaIUA殘基羥基處乙?;拿撘阴;饔玫囊阴;ッ富钚?。本文中,內(nèi)切-果膠裂合酶(EC 4.2.2. 10)是能夠催化(1 — 4)-α-D-半乳糖醛酸 聚糖甲基酯的清除性切割,得到在其非還原末端具有4-脫氧-6-0-甲基-a -D-半乳-4-糖 醛?;墓烟?。酶也可已知為果膠裂合酶,果膠反式消除酶(trans-eliminase),內(nèi)切果膠 裂合酶,多聚甲基半乳糖醛酸反式消除酶,果膠甲基反式消除酶,果膠酶(pectolyasehPL, PNL或PMGL或(1 — 4) -6-0-甲基-α -D-半乳糖醛酸聚糖裂合酶。本文中,果膠酸裂合酶(EC 4. 2. 2. 2)是能夠催化(1 — 4) - α -D-半乳糖醛酸聚糖 的消除性切割,得到在其非還原性末端具有4-脫氧-a -D-半乳-4-糖醛?;娜魏蚊?。酶 也可以已知為多聚半乳糖醛酸反式消除酶,果膠酸反式消除酶,多聚半乳糖醛酸酯裂合酶, 內(nèi)切果膠甲基反式消除酶,果膠酸反式消除酶,內(nèi)切半乳糖醛酸酯反式消除酶,果膠酸裂合 酶,果膠裂合酶,a-l,4_D-內(nèi)切多聚半乳糖醛酸裂合酶,PGA裂合酶,PPase-N,內(nèi)切-a-1, 4-多聚半乳糖醛酸裂合酶,多聚半乳糖醛酸裂合酶,果膠反式消除酶,多聚半乳糖醛酸反式 消除酶或(1 — 4)-a-D-半乳糖醛酸聚糖裂合酶。本文中,α -鼠李糖苷酶(EC 3. 2. 1. 40)是能夠催化α -L-鼠李糖苷或鼠李半 乳糖醛酸聚糖中末端非還原性α-L-鼠李糖殘基水解的任何多肽。所述酶也可以已知為 α -L-鼠李糖苷酶Τ,α -L-鼠李糖苷酶N或α -L-鼠李糖苷鼠李糖水解酶。本文中,外切-半乳糖醛酸酶(EC 3. 2. 1. 82)是能夠從非還原性末 端水解果膠酸,釋放二半乳糖醛酸的任何多肽。酶也可以已知為外切-多 聚- α-半乳糖醛酸苷酶(exo-poly-a-galacturonosidase)、外切多聚半 乳糖醛酸苷酶(exopolygalacturonosidase)或外切多聚聚半乳糖醛酸苷酶 (exopolygalacturanosidase)。
本文中,外切_半乳糖醛酸酶(EC 3.2.1.67)是能夠催化以下的任何多肽(1,
4-(1-0-半乳糖醛酸苷)11+!120=(1,4-0-0-半乳糖醛酸苷)11_1+0-半乳糖醛酸酯。所述酶 也可以已知為galacturan 1,4_ α-galacturonidase,外切多聚半乳糖醛酸酶,多聚(半乳 糖醛酸酯)水解酶,外切-D-半乳糖醛酸酶,外切-D-半乳糖醛酸聚糖酶,外切多聚-D-半 乳糖醛酸酶或多聚(1,4-α-D-半乳糖醛酸苷)半乳糖醛酸水解酶。本文中,外切多聚半乳糖醛酸酯裂合酶(EC 4. 2. 2. 9)是能夠催化從果膠酸(即脫 脂化的果膠)的還原末端消除性切割4- (4-脫氧-α -D-半乳-4-糖醛酰基)-D-半乳糖醛 酸酯的任何多肽。所述酶可已知為果膠酸二糖裂合酶,果膠酸外切裂合酶,外切果膠酸反 式消除酶,外切果膠酸裂合酶,外切多聚半乳糖醛酸_反式-消除酶,ΡΑΤΕ,外切-PATEjh 切-PGL或(1 — 4) - α -D-半乳糖醛酸聚糖還原末端二糖裂合酶。本文中,鼠李半乳糖醛酸聚糖水解酶是能夠以嚴(yán)格改變鼠李半乳糖醛酸聚糖結(jié)構(gòu) 的內(nèi)切方式水解半乳基糖醛酸酸和吡喃鼠李糖基之間鍵的任何多肽,所述鼠李半乳糖醛酸 聚糖結(jié)構(gòu)由二糖[(l,2-a-L-鼠李糖基-(1,4)-α-半乳糖醛酸]組成。本文中,鼠李半乳糖醛酸聚糖裂合酶是能夠以?xún)?nèi)切方式在鼠李半乳糖醛酸聚糖中 通過(guò)β -消除切割α -L-Rhap-(1 — 4) - α -D-GalpA鍵的任何多肽。本文中,鼠李半乳糖醛酸聚糖乙?;ッ甘悄軌虼呋罄畎肴樘侨┧峋厶侵薪惶?出現(xiàn)的鼠李糖和半乳糖醛酸殘基主鏈的脫乙?;娜魏味嚯?。本文中,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶是能夠以外切方式,從嚴(yán)格交替 出現(xiàn)的鼠李半乳糖醛酸聚糖結(jié)構(gòu)的非還原性末端水解半乳糖醛酸的任何多肽。本文中,木半乳糖醛酸酶是通過(guò)以?xún)?nèi)切方式切割β-木糖取代的半乳糖醛酸主鏈 而作用于木半乳糖醛酸聚糖的任何多肽。所述酶也可以已知為木半乳糖醛酸聚糖水解酶。本文中,α -L-阿拉伯糖呋喃糖苷酶(EC 3. 2. 1. 55)是能夠作用于α -L-阿拉伯 呋喃糖苷,含有(1,2)和/或(1,3)_和/或(1,5)_鍵的α-L-阿拉伯聚糖,阿拉伯木聚糖 和阿拉伯半乳聚糖的任何多肽。所述酶也可以被稱(chēng)作α-N-阿拉伯糖呋喃糖苷酶,阿拉伯 糖呋喃糖苷酶或阿拉伯糖苷酶。本文中,內(nèi)切阿拉伯聚糖酶EC 3.2. 1.99是能夠催化1,5_阿拉伯聚糖中1,
5-α-阿拉伯呋喃糖苷鍵內(nèi)切水解的任何多肽。所述酶也已知為內(nèi)切阿拉伯糖酶,阿拉伯聚 糖內(nèi)切-1,5- α -L-阿拉伯糖苷酶,內(nèi)切-1,5- α -L-阿拉伯聚糖酶,內(nèi)切-α -1,5_阿拉伯 聚糖酶;內(nèi)切_阿拉伯聚糖酶或1,5- α -L-阿拉伯聚糖1,5- α -L-阿拉伯聚糖水解酶。“淀粉酶”或“ α _葡萄糖苷酶”包括水解寡糖和多糖中1,4- [ α ] _糖苷鍵的酶?!暗鞍酌浮卑ㄋ怆逆I的酶(肽酶),以及水解肽和其它部件如糖之間鍵的酶(糖 肽酶)。許多肽酶在EC 3. 4下表征,適合在本發(fā)明中使用并且通過(guò)引用并入本文。一些特 定類(lèi)型的蛋白酶包括半胱氨酸蛋白酶(包括胃蛋白酶,木瓜蛋白酶)和絲氨酸蛋白酶(包 括糜蛋白酶,羧肽酶和金屬內(nèi)切蛋白酶)?!爸久浮卑ㄋ庵|(zhì)、脂肪酸和?;视王?包括磷酸甘油酯)、脂蛋白、二酰 基甘油等等的酶。在植物中,脂質(zhì)被用作結(jié)構(gòu)組分,來(lái)限制水損失和病原體感染。這些脂質(zhì) 包括來(lái)自脂肪酸的蠟質(zhì),以及角質(zhì)和木栓素(suberin)?!捌咸侨┧崽擒彰浮卑ù呋?葡糖醛酸苷水解得到醇和葡糖醛酸酯的酶。許 多葡糖醛酸糖苷酶已被表征,并可適合在本發(fā)明中使用,例如β-葡糖醛酸糖苷酶(EC3.2. 1.31),透明質(zhì)酸酶葡糖醛酸糖苷酶(EC 3.2. 1. 36),葡糖醛?;?二硫葡糖胺葡糖醛 酸糖苷酶(3. 2. 1. 56),甘草酸β -葡糖醛酸糖苷酶(3. 2. 1. 128)或α -D-葡糖醛酸糖苷酶 (EC 3. 2. 1. 139)?!把趸€原酶”是催化電子從一個(gè)分子(還原劑,也稱(chēng)作氫或電子供體)轉(zhuǎn)移至另 一分子(氧化劑,也稱(chēng)作氫或電子受體)的酶,例如落入EC 1中的酶。可在本發(fā)明方法中使 用的此類(lèi)酶的例子是葡糖氧化酶(EC 1. 1.3. 4),即催化β-D-葡萄糖氧化成D-葡糖酸-1, 5-內(nèi)酯。在上述此類(lèi)方法中,可以使用酶的組合,所述酶的組合同時(shí)、單獨(dú)或先后作用于發(fā) 揮原料作用的例如木質(zhì)纖維素底物或植物生物質(zhì)上,從而將所述復(fù)合底物轉(zhuǎn)化成簡(jiǎn)單的糖 和寡糖,用于生產(chǎn)乙醇或其它有用的產(chǎn)物。因此,本發(fā)明的另一方面包括下述方法,所述方法同時(shí)、單獨(dú)或先后(任選地與其 它酶或物理處理例如溫度和PH —起)利用上述酶混合物,從而將木質(zhì)纖維素植物生物質(zhì)轉(zhuǎn) 化成糖和寡糖。酶組合或物理處理可以并發(fā)、先后或單獨(dú)地施用。酶可以在微生物、酵母、真菌、細(xì) 菌或植物中外源產(chǎn)生,然后分離并加入木質(zhì)纖維素原料中?;蛘?,酶可以被生產(chǎn)但不分離, 并且將粗制細(xì)胞群發(fā)酵液或植物材料(如玉米稈)等等加入原料中。或者,可以處理粗制 細(xì)胞群或酶生產(chǎn)培養(yǎng)基或植物材料,以預(yù)防進(jìn)一步的微生物生長(zhǎng)(例如通過(guò)加熱或添加抗 微生物劑),然后添加至原料。這些粗制酶混合物可包含生產(chǎn)酶的生物。或者,酶可以在下 述發(fā)酵中生產(chǎn),所述發(fā)酵施用原料(例如玉米稈)對(duì)生產(chǎn)酶的生物提供營(yíng)養(yǎng)。通過(guò)這種方 式,生產(chǎn)酶的植物可以發(fā)揮木質(zhì)纖維素原料的作用,并且被添加進(jìn)木質(zhì)纖維素原料中。盡管輔助酶已作為混合物被討論,但是認(rèn)為酶可以先后添加,其中溫度、ρΗ和其它 條件可以被改變,以提高每種個(gè)體酶的活性?;蛘撸梢葬槍?duì)酶混合物測(cè)定最適PH和溫度。本發(fā)明的多肽可以在任何預(yù)處理步驟之前、同時(shí)或之后使用?;蛘呋蛄硗?,本發(fā)明 的多肽可以與非淀粉的碳水化合物降解酶(如纖維素酶)組合使用。因此,本文所述的多 肽可以作為預(yù)處理流程的部分被使用,從而與常規(guī)預(yù)處理流程相比降低化學(xué)品和/或能量 輸入。本發(fā)明所述多肽可以被用作糖化流程的部分。多肽的使用可允許使用更少的非淀粉 降解酶,或可允許需要更少時(shí)間來(lái)進(jìn)行的流程。本發(fā)明的方法可以在不包括(如目前使用生物反應(yīng)器進(jìn)行生物質(zhì)轉(zhuǎn)化的)極端的 熱或酸處理的溫和條件下進(jìn)行,即與包含非淀粉的碳水化合物的底物反應(yīng)。本文所述過(guò)氧 化物酶多肽可以與本文所述的一種或多種其它多肽或酶同時(shí)、單獨(dú)或先后使用。例如,酶可以在約25 V,約30 V,約35 V,約37 V,約40 V,約45 V,約50 V或約 55°C下孵育。也就是說(shuō),它們可以在從約20°C到約70°C下,在低到中等離子強(qiáng)度的緩沖液 中和中性PH下孵育。“中等離子強(qiáng)度”表示對(duì)任何單個(gè)離子組分而言,緩沖液具有約200毫 摩爾(mM)或更少的離子濃度。ρΗ可在從約ρΗ 2. 5,約ρΗ 3.0,約ρΗ 3. 5,約ρΗ 4.0,約ρΗ 4. 5,約 ρΗ 5,約 ρΗ 5. 5,約 ρΗ 6,約 ρΗ 6. 5,約 ρΗ 7,約 ρΗ 7. 5,約 ρΗ 8. 0,到約 ρΗ 8. 5 的 范圍內(nèi)。通常,PH范圍會(huì)從約ρΗ 3.0到約ρΗ 9。本文所述的酶組合(即過(guò)氧化物酶多肽和非淀粉的碳水化合物降解酶)的孵育, 例如在上文示出的條件下的孵育,會(huì)導(dǎo)致從底物例如木質(zhì)纖維素中釋放或解離出糖。解離 的糖的量可以是至少約20%、至少約30%、至少約40%、至少約50%、至少約60%、至少約70 %、至少約80 %、至少約90 %、至少約95 %或更多的可利用的糖。用非碳水化合物降解酶處理可進(jìn)行數(shù)分鐘到數(shù)小時(shí),例如從約6小時(shí)到約120小 時(shí),優(yōu)選地從約12小時(shí)到約72小時(shí),更優(yōu)選地從約24小時(shí)到48小時(shí)??梢岳蒙婕坝妹富蛎富旌衔锓跤念A(yù)處理步驟。預(yù)處理步驟可以在許多溫度下 進(jìn)行,但是優(yōu)選預(yù)處理在最適合要測(cè)試的酶混合物的溫度下進(jìn)行,或預(yù)測(cè)的要測(cè)試的酶的 最適度下進(jìn)行。預(yù)處理的溫度可以在從約10°C到約80°C,約20°C到約80°C,約30°C到約 700C,約40°C到約60°C,約37°C到約50°C,優(yōu)選地約37°C到約80°C,更優(yōu)選地約50°C的范 圍內(nèi)。缺失溫度最適度數(shù)據(jù)時(shí),優(yōu)選首先在37°C下,然后在更高溫度如50°C下進(jìn)行預(yù)處理 反應(yīng)。預(yù)處理混合物的pH可以在從約2. 0到約10. 0,但是優(yōu)選地約3. 0到約7. 0,更優(yōu)選 地約4. 0到約6. 0,進(jìn)一步更優(yōu)選地約4. 5到約5的范圍內(nèi)。另外,可以調(diào)節(jié)pH調(diào)節(jié)以最大 化酶活性,并且可以通過(guò)添加酶來(lái)調(diào)節(jié)PH。來(lái)自該測(cè)試的實(shí)驗(yàn)結(jié)果的結(jié)果比較會(huì)允許人們 修飾方法,使其最適合要測(cè)試的酶。預(yù)處理反應(yīng)可進(jìn)行數(shù)分鐘到數(shù)小時(shí),例如從約6小時(shí)到約120小時(shí),優(yōu)選地約6小 時(shí)到約48小時(shí),更優(yōu)選地約6小時(shí)到約24小時(shí),最優(yōu)選地約6小時(shí)。如果在預(yù)處理中使用本發(fā)明的過(guò)氧化物酶多肽,則這可允許使用上述溫和條件, 以避免使用(如目前用于使用生物反應(yīng)器進(jìn)行生物質(zhì)轉(zhuǎn)化的)極端的熱或酸處理。用于生產(chǎn)一種或多種糖的本發(fā)明的方法典型地是下述方法,所述方法用于將復(fù)合 碳水化合物如木質(zhì)纖維素轉(zhuǎn)化成糖,優(yōu)選地轉(zhuǎn)化成可發(fā)酵的糖。此類(lèi)方法可以被稱(chēng)作“糖 化”。因此,本發(fā)明的方法可導(dǎo)致解離一個(gè)或多個(gè)己糖和/或戊糖,如一個(gè)或多個(gè)葡萄糖、木 糖、阿拉伯糖、半乳糖、D-半乳糖醛酸、甘露糖、鼠李糖、蔗糖和果糖??砂l(fā)酵的糖可以被轉(zhuǎn)化成有用的增值的(value-added)發(fā)酵產(chǎn)物,其非限制性例 子包括氨基酸、維生素、藥物、動(dòng)物飼料補(bǔ)充劑、特種化學(xué)品(specialty chemicals)、化學(xué) 品原料、塑料、溶劑、燃料或其它有機(jī)聚合物、乳酸和乙醇,包括燃料乙醇??梢酝ㄟ^(guò)本發(fā)明的方法生產(chǎn)的特定的增值產(chǎn)物包括但不限于生物燃料(包括乙 醇和甲醇和沼氣(biogas));乳酸;塑料;特種化學(xué)品;有機(jī)酸,包括檸檬酸、琥珀酸、反丁烯 二酸、衣康酸和順丁烯二酸;3-羥基_丙酸,丙烯酸;乙酸;1,3-丙烷-二醇;乙烯,丙三醇; 溶劑;動(dòng)物飼料補(bǔ)充劑;藥物,如β -內(nèi)酰胺抗生素或頭孢菌素;維生素;氨基酸,如賴(lài)氨 酸,甲硫氨酸,色氨酸,蘇氨酸和天冬氨酸;工業(yè)酶,如蛋白酶,纖維素酶,淀粉酶,葡聚糖酶, 乳糖酶,脂肪酶,裂合酶,氧化還原酶,轉(zhuǎn)移酶或木聚糖酶;和化學(xué)品原料。因此,本發(fā)明提供了制備發(fā)酵產(chǎn)物的方法,所述方法包括a.使用本文所述的方法降解非淀粉的碳水化合物,例如由非淀粉的碳水化合物生 產(chǎn)一種或多種糖;和b.發(fā)酵得到的材料,從而制備發(fā)酵產(chǎn)物。發(fā)酵產(chǎn)物可以是氨基酸,維生素,藥物,動(dòng)物飼料補(bǔ)充劑,特種化學(xué)品,化學(xué)品原 料,塑料,乙醇,包括燃料乙醇(術(shù)語(yǔ)“乙醇”被理解為包括乙醇或乙醇和水的混合物)。非 特異性發(fā)酵產(chǎn)物包括乳酸,3-羥基-丙酸,丙烯酸,乙酸,琥珀酸,檸檬酸,氨基酸,1,3-丙二 醇,乙烯,丙三醇,β-內(nèi)酰胺抗生素或頭孢菌素。用于制備發(fā)酵產(chǎn)物的方法可任選的包括發(fā)酵產(chǎn)物的回收。
30
此類(lèi)方法可在需氧或厭氧條件下進(jìn)行。優(yōu)選地,所述方法在微需氧或氧受限的條 件下進(jìn)行。厭氧發(fā)酵方法在本文中被定義為在不存在氧時(shí)運(yùn)行的,或者其中基本不消耗氧, 優(yōu)選地消耗少于5、2. 5或lmmol/L/h氧,并且其中有機(jī)分子既作為電子供體又作為電子受 體的發(fā)酵方法。氧受限的發(fā)酵方法是其中氧消耗受到從氣體到液體的氧轉(zhuǎn)移限制的方法。氧限制 程度由進(jìn)入氣流的量和組成以及使用的發(fā)酵設(shè)備的實(shí)際混合/物料轉(zhuǎn)移性質(zhì)決定。優(yōu)選 地,在氧受限條件下進(jìn)行的方法中,氧消耗速率至少為5. 5,更優(yōu)選地至少為6,進(jìn)一步更優(yōu) 選地至少為7mmol/L/h。本發(fā)明還提供了本文所述具有過(guò)氧化物酶活性的多肽在用于降解木質(zhì)素的方法 中使用的用途。在根據(jù)本發(fā)明的此類(lèi)用途中,木質(zhì)素可以是木質(zhì)纖維素的形式。以下實(shí)施例闡述本發(fā)明實(shí)施例1通過(guò)得自Marasmius scorodonius的過(guò)氧化物酶降解木質(zhì)素模式化合物2-甲氧基苯酚(愈創(chuàng)木酚)、藜蘆醇、阿魏酸和香豆酸用作低分子量木質(zhì)素模式化 合物。將2mM每種底物與1. 5 μ L酶溶液禾口 15 μ L H2O2 (20mM)在乙酸鈉緩沖液(50mM, 1. 5mL 總樣品體積,PH 6. 0,27°C )中孵育。60分鐘后,再添加15 μ L H2O2,并在2小時(shí)后終止反 應(yīng)。使用愈創(chuàng)木酚(見(jiàn)圖1)和阿魏酸時(shí)觀(guān)察到棕色。使用香豆酸和藜蘆醇時(shí)沒(méi)有發(fā)生肉 眼可見(jiàn)的改變。使用木質(zhì)素organosolvTM(棕色粉末,Sigma-Aldrich)評(píng)價(jià)MsPl對(duì)不溶性高分 子量木質(zhì)素的影響。將2. 5mg木質(zhì)素organosolv與20 μ L MsPl在乙酸鈉緩沖液(50mM, PH 3-6,總樣品體積1. 5mL)中的溶液(活性或熱失活的)和100 μ L過(guò)氧化氫溶液(20mM) 混合。60分鐘后再添加100 μ L過(guò)氧化氫溶液??偡磻?yīng)時(shí)間為120分鐘(在27°C下在旋 轉(zhuǎn)搖床上孵育)。通過(guò)離心去除固體,并對(duì)上清液進(jìn)行HPLC分析。使用的柱來(lái)自Polymer IaboratoriesTM PL水凝膠-OH MIXED和PL水凝膠-OH 20,在195nm下進(jìn)行UV檢測(cè)。因 為木質(zhì)素材料在水中不溶,所以使用熱失活的酶的樣品的上清液保持無(wú)色。使用活性酶時(shí), 在上清液中觀(guān)察到紅色到棕色。酶處理釋放的高分子量化合物可借助于尺寸排除色譜來(lái)追 蹤(見(jiàn)圖2)。為了持續(xù)生產(chǎn)H2O2,可以應(yīng)用葡萄糖/葡萄糖氧化酶體系。將500mg木質(zhì)素 (organosolv)、4mL MsPl、20mmoL葡萄糖和10 μ L(IOU)葡萄糖氧化酶在216mL乙酸鈉緩沖 液(50mM,pH 6.0)中于室溫下140rpm孵育24小時(shí)。通過(guò)離心分開(kāi)上清液,并通過(guò)HPLC(DAD 和蒸發(fā)光散射(ELSD)檢測(cè))進(jìn)行分析。檢測(cè)到先前不溶材料的顯著溶解(見(jiàn)圖3)。運(yùn)行所述實(shí)驗(yàn)后,將固體離心并干燥。使用熱失活的過(guò)氧化物酶時(shí),觀(guān)察到2. 5% 的沉淀物干重?fù)p失。使用活性過(guò)氧化物酶時(shí),所述損失為7.3%。因此,由于酶的活性,木質(zhì) 素被部分溶解。實(shí)施例2玉米稈的化學(xué)分析通過(guò)Kjeldahl氮(蛋白質(zhì)),Soxhlet萃取(脂質(zhì)),地衣酚-硫酸實(shí)驗(yàn)(碳水化 合物)的測(cè)定,和通過(guò)乙酰溴方法(木質(zhì)素),分析玉米稈的化學(xué)組成(表1)。
表1 玉米稈的組成
權(quán)利要求
1.用于修飾木質(zhì)纖維素材料的方法,所述方法包括將所述木質(zhì)纖維素材料與具有過(guò)氧 化物酶活性的下述多肽接觸,所述多肽是a.包含下述氨基酸序列的多肽,所述氨基酸序列與SEQNO :2的第21到513位氨基酸; SEQ ID NO 4的第20到510位氨基酸;SEQ ID NO 6的第1到493位氨基;或SEQ ID NO 8的第1到491位氨基酸之任一示出的氨基酸序列具有至少55%同源性;或b.由包含下述核苷酸序列的多核苷酸編碼的多肽,所述核苷酸序列與SEQID N0:1的 第61到1539位核苷酸;SEQ ID NO 3的第58到1530位核苷酸;SEQ ID NO 5的第1到 1479位核苷酸;或SEQ ID NO :7的第1到1473位核苷酸之任一示出的核苷酸序列具有至 少55%同源性。
2.根據(jù)權(quán)利要求1的方法,其中所述修飾是提高所述木質(zhì)纖維素材料對(duì)酶促降解的易 感性。
3.用于從木質(zhì)纖維素材料生產(chǎn)一種或多種糖的方法,所述方法包括以下步驟(i)對(duì)所述木質(zhì)纖維素材料進(jìn)行預(yù)處理;( )使用根據(jù)權(quán)利要求1或2的方法修飾所述木質(zhì)纖維素;和(iii)將藉此修飾的木質(zhì)纖維素材料與一種或多種纖維素酶和/或一種或多種半纖維 素酶和/或一種或多種果膠酶接觸。
4.根據(jù)權(quán)利要求3的方法,其中所述具有過(guò)氧化物酶活性的多肽在所述預(yù)處理步驟期 間、之前或之后與包含非淀粉的碳水化合物的材料接觸。
5.根據(jù)前述權(quán)利要求中任一項(xiàng)的方法,其中所述具有過(guò)氧化物酶活性的多肽與輔助酶 組合與所述木質(zhì)纖維素材料接觸,所述輔助酶進(jìn)一步修飾所述包含非淀粉的碳水化合物的 材料,或提高所述包含非淀粉的碳水化合物的材料對(duì)酶促降解的易感性。
6.根據(jù)前述權(quán)利要求中任一項(xiàng)的方法,其中所述具有過(guò)氧化物酶活性的多肽由能夠得 自Marasmius scorodonius的多核苷酸編碼。
7.根據(jù)前述權(quán)利要求中任一項(xiàng)的方法,其中所述木質(zhì)纖維素材料是果園底料(orchard primings),樹(shù)叢(chaparral),磨坊廢棄物(mill waste),城市木材廢棄物(urban wood waste),市政廢棄物(municipal waste),伐木廢棄物(logging waste),森林疏伐廢棄物 (forest thinnings),短期輪種木本作物,工業(yè)廢棄物,小麥秸,燕麥秸,水稻秸,大麥秸,黑 麥秸,亞麻秸,大豆殼,稻殼,水稻秸,玉米麩質(zhì)飼料,燕麥殼,甘蔗,玉米秸稈,玉米桿(corn stalks),玉米芯,玉米殼,牧場(chǎng)草(prairie grass), gamagrass,狐尾草(foxtail),舌甘菜菜, 柑橘果實(shí)漿,種子殼,纖維素動(dòng)物糞便,草坪修剪廢棄物,棉花,海藻,樹(shù)木,灌木,草,小麥, 小麥秸,甘蔗渣,玉米,玉米殼,玉米棒(corn hobs),玉米粒,來(lái)自玉米粒的纖維,來(lái)自谷物 濕磨或干磨的產(chǎn)物和副產(chǎn)物,市政固體廢棄物,廢紙,庭院廢棄物,草本材料,農(nóng)業(yè)殘余物, 林業(yè)殘余物,市政固體廢棄物,廢紙,紙漿,造紙廠(chǎng)殘余物,樹(shù)枝,灌木,甘蔗,玉米,玉米殼, 能源作物,森林,水果,鮮花,谷物,草,草本作物,樹(shù)葉,樹(shù)皮,針葉,原木,根,樹(shù)苗,灌木叢, 柳枝稷,樹(shù)木,蔬菜,水果皮,藤蔓,甜菜漿,小麥麩皮(wheat midlings),燕麥殼,硬或軟木 材,從農(nóng)業(yè)工藝或林業(yè)木材廢棄物產(chǎn)生的有機(jī)廢棄物材料,或其中任意兩種或多種的組合。
8.用于制備發(fā)酵產(chǎn)物的方法,所述方法包括a.根據(jù)權(quán)利要求之任一降解木質(zhì)纖維素材料,和b.發(fā)酵得到的材料,從而制備發(fā)酵產(chǎn)物。
9.根據(jù)權(quán)利要求8的方法,其中所述發(fā)酵產(chǎn)物是乙醇、丁醇、乳酸、3-羥基-丙酸、 丙烯酸、乙酸、琥珀酸、檸檬酸、蘋(píng)果酸、反丁烯二酸、衣康酸、氨基酸、1,3-丙二醇、乙烯 (ethylene)、丙三醇、β -內(nèi)酰胺抗生素或頭孢菌素。
全文摘要
用于修飾包含非淀粉的碳水化合物的材料的方法,所述方法包括將所述包含非淀粉的碳水化合物的材料與具有過(guò)氧化物酶活性的多肽接觸,并且所述多肽是a.包含與SEQ NO2的第21到513位氨基酸;SEQ NO4的第20到510位氨基酸;SEQ NO6的第1到493位氨基;或SEQ NO8的第1到491位氨基酸之任一示出的氨基酸序列具有至少55%同源性的氨基酸序列的多肽;或b.由包含與SEQ ID NO1的第61到1539位核苷酸;SEQ ID NO3的第58到1530位核苷酸;SEQ ID NO5的第1到1479位核苷酸;或SEQ ID NO7的第1到1473位核苷酸之任一示出的核苷酸序列具有至少55%同源性的核苷酸序列的多核苷酸編碼的多肽。
文檔編號(hào)C12P7/10GK102112620SQ200980130233
公開(kāi)日2011年6月29日 申請(qǐng)日期2009年7月10日 優(yōu)先權(quán)日2008年7月29日
發(fā)明者曼杰·庫(kù)馬爾, 瑞內(nèi)特·斯威達(dá), 約翰尼斯·威爾姆斯, 霍爾格·佐恩 申請(qǐng)人:帝斯曼知識(shí)產(chǎn)權(quán)資產(chǎn)管理有限公司