專利名稱:產(chǎn)生碳氫化合物的方法和組合物的制作方法
產(chǎn)生碳氫化合物的方法和組合物相關(guān)申請的交叉引用本申請要求2008年5月16日提交的美國臨時申請第61/053955號的優(yōu)先權(quán),在 此將其內(nèi)容全部并入。
背景技術(shù):
石油是地球上發(fā)現(xiàn)的、液體、氣體或固體形式的有限的天然資源。石油主要由 碳氫化合物組成,碳氫化合物主要由碳和氫組成。石油還含有大量的處于不同形式的其 他元素,例如氮、氧或硫。石油是寶貴資源,但是以相當(dāng)大的金融和環(huán)境代價對石油產(chǎn)品進行開發(fā)。首 先,必須發(fā)現(xiàn)石油資源。石油勘探是耗資并有風(fēng)險的投資。勘探深水井的費用可以超過 1億美元。此外,不能保證這些井會含有石油。據(jù)估計,僅40%的鉆井成為產(chǎn)生商業(yè)碳 氫化合物的生產(chǎn)井。除經(jīng)濟費用外,石油勘探存在嚴重的環(huán)境代價。例如近海勘探擾亂 周圍海洋環(huán)境。發(fā)現(xiàn)生產(chǎn)井后,必須以巨大代價從地球開采石油。在初次采收(primary recovery)中,地下的自然壓力足以開采約20%的井中石油。當(dāng)該自然壓力降低時,如果 經(jīng)濟上合算,則使用二次采收(secondrecovery)。通常,二次采收涉及通過例如水注射、 天然氣注射或氣舉等增加井壓。使用二次采油,采收到另外5%至15%的石油。一旦二 次采收方法不起作用,如果經(jīng)濟上合算,可以使用三次采收方法。三次方法涉及降低石 油的粘度以使其更易開采。使用三次采收方法,采收到另外5%至15%的石油。因此, 即使在最佳條件下,僅可以開采50%的井中石油。石油開采也存在環(huán)境代價。例如,石 油開采可以導(dǎo)致大量石油滲漏上升至表面。此外,近海鉆井涉及挖掘河床,這擾亂或破 壞周圍海洋環(huán)境。因為石油礦藏不是在地球各處均勻發(fā)現(xiàn)的,所以石油必須從石油產(chǎn)生區(qū)長距離 運輸?shù)绞拖膮^(qū)。除運輸費用外,還存在大規(guī)模油泄漏的環(huán)境風(fēng)險。從地球開采的原油在天然形式時具有少數(shù)商業(yè)用途。其是具有不同長度和復(fù) 雜性的碳氫化合物(例如,石蠟(或烷)、烯烴(或烯)、炔、環(huán)烷(napthenes)(或環(huán)烷 (cylcoalkanes))>脂肪族化合物、芳香族化合物等)的混合物。此外,原油含有其他有機 化合物(例如含有氮、氧、硫等的有機化合物)和雜質(zhì)(例如硫磺、鹽、酸、金屬等)。因此,在商業(yè)上可以使用前,必須提煉并純化原油。由于其高能量密度及其便 利的可運輸性,大部分石油被提煉為燃料,例如運輸燃料(例如汽油、柴油、航空燃料 等)、燃用油、液化石油氣等。原油還是用于產(chǎn)生石化產(chǎn)品的原材料的主要來源。兩類主要的來自石油的原材 料是短鏈烯烴(例如乙烯和丙烯)和芳香族化合物(例如苯和二甲苯異構(gòu)體)。這些原材 料來源于原油中較長鏈的碳氫化合物,這是通過以相當(dāng)大的費用使用各種方法,例如催 化裂化、蒸汽裂化或催化重整,裂化原油。這些原材料用于制造不能直接從原油提煉的 石化產(chǎn)品,例如單體、溶劑、去垢劑或粘合劑。來源于原油的原材料的一個實例是乙烯。 乙烯被用于生產(chǎn)石化產(chǎn)品,例如聚乙烯、乙醇、氧化乙烯、乙二醇、聚酯、乙二醇醚、乙氧基化物、乙酸乙烯酯、1,2-二 氯乙烷、三氯乙烯、四氯乙烯、氯乙烯和聚氯乙烯。原材料的其他實例是丙烯,丙烯用 于生產(chǎn)異丙醇、丙烯腈、聚丙烯、氧化丙烯、丙烯二醇、乙二醇醚、丁烯、異丁烯、1, 3_ 丁二烯、合成橡膠、聚烯烴、α-烯烴、脂肪醇、丙烯酸、丙烯聚合物、氯化丙烯、 環(huán)氧氯丙烷和環(huán)氧樹脂。然后,這些石化產(chǎn)品可以用于制造特種化學(xué)品,例如塑料、樹脂、纖維、橡 膠、藥品、潤滑劑或凝膠??梢援a(chǎn)自石化材料的具體特種化學(xué)品為脂肪酸、碳氫化合 物(例如長鏈、支鏈、飽和的、不飽和的等)、脂肪醇、酯、脂肪醛、酮、潤滑劑等。特種化學(xué)品具有很多商業(yè)用途。脂肪酸在商業(yè)上被用作表面活性劑,例如在去 垢劑和肥皂中。它們還可以被用作燃料中的添加劑、潤滑油、涂料、漆、蠟燭、色拉 油、起酥油、化妝品和乳化劑。此外,在橡膠產(chǎn)品中脂肪酸被用作促進劑活性劑。脂肪 酸還可以被用作生產(chǎn)甲基酯、酰胺、胺、?;取Ⅳ⒁蚁┩畚镆约斑^氧酸和酯的 原料。碳氫化合物具有很多商業(yè)用途。例如鏈較短的烷被用作燃料。甲烷和乙烷是天 然氣的主要成分。鏈較長的烷(例如5至16個碳)被用作運輸燃料(例如汽油、柴油或航 空燃料)。具有多于16個碳原子的烷是燃油和潤滑油的重要組分。即使在室溫下為固體 的較長的烷也可以被用作,例如石蠟。含有約35個碳的烷見于用于路面(road surfacing) 的浙青中。此外,可以裂化較長鏈的烷以生產(chǎn)商業(yè)上有用的較短鏈的碳氫化合物。與短鏈烷類似,短鏈烯被用于運輸燃料中。較長鏈的烯被用于塑料、潤滑劑和 合成潤滑劑中。此外,烯被用作生產(chǎn)醇類、酯、增塑劑、表面活性劑、叔胺、增強型采 油劑(enhanced oil revovery agent)、脂肪酸、硫醇、烯基琥珀酸酐、環(huán)氧化物、氯化烷、 氯化烯、蠟、燃油添加劑和粘性流減阻劑。脂肪醇具有很多商業(yè)用途。鏈較短的脂肪醇在化妝品和食品工業(yè)中,用作乳化 齊U、潤滑劑和增稠劑。由于其兩性分子屬性,脂肪醇起非離子表面活性劑的作用,所述 非離子表面活性劑可用作去垢劑。此外,脂肪醇被用于蠟、樹膠、樹脂、藥物軟膏和 洗劑、潤滑油添加劑、紡織品抗靜電和整理劑、增塑劑、化妝品、工業(yè)溶劑和脂肪溶劑 中。酯具有很多商業(yè)用途。例如作為替代燃料的生物柴油是由酯(例如脂肪酸甲基 酯、脂肪酸乙基酯等)組成。一些低分子量的酯是揮發(fā)性的,具有令人愉悅的氣味,這 使得它們可用作芳香劑或調(diào)味劑。另外,酯被用作漆、涂料和清漆的溶劑。此外,一 些天然存在的物質(zhì),例如蠟、脂肪和油是由酯組成的。酯還被用作樹脂和塑料中的軟化 齊U、增塑劑、滅火劑以及汽油和油中的添加劑。此外,酯可以用于制造聚合物、膠片、 紡織品、染料和藥品。醛用于生產(chǎn)很多特種化學(xué)品。例如,醛用于生產(chǎn)聚合物、樹脂(例如膠木 (Bakelite))、染料、調(diào)味劑、增塑劑、香水、藥品和其他化學(xué)品。一些被用作溶劑、防 腐劑或消毒劑。一些天然和合成的化合物,例如維生素和激素是醛。此外,很多糖含有酸基。酮在商業(yè)上被用作溶劑。例如, 丙酮常常被用作溶劑,但其也是制造聚合物的 原材料。酮還用于漆、涂料、爆炸物、香水和紡織品加工中。此外,酮用于生產(chǎn)醇、烯、烷、亞胺和烯胺。此外,原油是潤滑劑的來源。來自石油的潤滑劑通常由烯烴組成,特別是聚烯烴和α-烯烴。潤滑劑可以從原油提煉或使用提煉自原油的原材料生產(chǎn)。從原油獲得這些特種化學(xué)品需要大量的金融投資以及大量的能量。因為原油中 的長鏈碳氫化合物常常被裂化以產(chǎn)生較小的單體,其也是低效的過程。這些單體然后被 用作生產(chǎn)更復(fù)雜的特種化學(xué)品的原材料。除勘探、開采、運輸和提煉石油的問題外,石油是有限的并逐漸減少的資源。 估計世界石油消耗為每年300億桶。據(jù)估計,以現(xiàn)有生產(chǎn)水平,世界石油儲量預(yù)計在 2050年前會耗竭。最后,基于石油的燃料的燃燒釋放溫室氣體(例如二氧化碳)和其他形式的空氣 污染(例如一氧化碳、二氧化硫等)。隨著世界對燃料需求的增加,溫室氣體和其他形式 的空氣污染的排放也增加。大氣中溫室氣體的累積導(dǎo)致增加全球變暖。因此,除局部破 壞環(huán)境外(例如油泄漏、海洋環(huán)境的挖掘等),燃燒石油還破壞全球環(huán)境。由于石油所引起的內(nèi)在挑戰(zhàn),存在對于不需要像石油一樣被勘探、開采、長距 離運輸或大量提煉的可再生石油資源的需要。存在對于可以經(jīng)濟地生產(chǎn)而不會產(chǎn)生石油 工業(yè)和基于石油的燃料的燃燒所產(chǎn)生的類型的環(huán)境破壞的可再生石油資源?;谙嗨圃?因,還存在對于通常來自石油的化學(xué)品的可再生資源的需要。發(fā)明_既述本發(fā)明至少部分基于編碼碳氫化合物生物合成多肽的藍細菌基因的鑒定。因 此,在一方面,本發(fā)明特征為產(chǎn)生碳氫化合物的方法,所述方法包括在宿主細胞中產(chǎn)生 包含 SEQ ID NO: 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、 34或36的氨基酸序列的多肽或其變體,并從所述宿主細胞分離所述碳氫化合物。在一些實施方案中,所述多肽包含與SEQ ID NO 2、4、6、8、10、12、14、 16、18、20、22、24、26、28、30、32、34 或 36 具有至少約 70 %、至少約 80%、至少 約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約 95%,至少約96%、至少約97%、至少約98%或至少約99%的同一性的氨基酸序列。在一些實施方案中,所述多肽包含具有一個或多個氨基酸取代、添加、插入或 缺失的 SEQ ID NO: 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34或36的氨基酸序列。在一些實施方案中,所述多肽具有脫羰酶活性。在其他實施 方案中,所述多肽包含具有一個或多個保守型氨基酸取代的SEQ ID NO: 2、4、6、8、 10、12、14、16、18、20、22、24、26、28、30、32、34 或 36 的氨基酸序列。例如,所 述多肽包含一個或多個以下保守型氨基酸取代諸如丙氨酸、纈氨酸、亮氨酸和異亮氨 酸的脂肪族氨基酸被另一脂肪族氨基酸替換;絲氨酸被蘇氨酸替換;蘇氨酸被絲氨酸替 換;諸如天冬氨酸和谷氨酸的酸性殘基被另一酸性殘基替換;諸如天冬酰胺和谷氨酰胺 的攜帶酰胺基的殘基被另一攜帶酰胺基的殘基替換;諸如賴氨酸和精氨酸的堿性殘基被 另一堿性殘基交換;以及諸如苯丙氨酸和酪氨酸的芳香族殘基被另一芳香族殘基替換。 在一些實施方案中,所述多肽具有約1、2、3、4、5、6、7、8、9、10、15、20、30、 40、50、60、70、80、90、100或更多的氨基酸取代、添加、插入或缺失。在一些實施方 案中,所述多肽具有脫羰酶活性。
在其他實施方案中,所述多肽包含以下的氨基酸序列(i)SEQIDNO: 37或 SEQ ID NO 38 或 SEQ ID NO 39 ;或(ii) SEQ ID NO 40 以及(a) SEQ ID NO 37、 (b) SEQ ID NO 38 和(c) SEQ ID NO 39 中的任一個;或(iii) SEQ ID NO 41 或 SEQ
ID NO 42或SEQ ID NO 43或SEQ IDNO 44。在某些實施方案中,所述多肽具有脫
羰酶活性。在另一方面,本發(fā)明特征為產(chǎn)生碳氫化合物的方法,所述方法包括在宿主細胞 中表達多核苷酸,所述多核苷酸包含與SEQ ID NO: 1、3、5、7、9、11、13、15、17、 19、21、23、25、27、29、31、33 或 35 具有至少約 70%、至少約 75%、至少約 80%、 至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至 少約95%、至少約96%、至少約97%、至少約98%或至少約99%的序列同一性的核苷酸 序列。在一些實施方案中,所述核苷酸序列是SEQ ID NO 1、3、5、7、9、11、13、 15、17、19、21、23、25、27、29、31、33或35。在一些實施方案中,所述方法還包含 從所述宿主細胞分離所述碳氫化合物。在其他實施方案中,所述核苷酸序列與SEQIDNO 1、3、5、7、9、11、13、 15、17、19、21、23、25、27、29、31、33或35的互補物或其片段雜交,例如,在低嚴
緊性、中嚴緊性、高嚴緊性或非常高的嚴緊性條件下。在其他實施方案中,所述核苷酸序列編碼包含以下的多肽(i)SEQIDNO: 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34 或 36 的氨基酸序 列;或(ii)具有一個或多個氨基酸取代、添加、插入或缺失的SEQ ID NO: 2、4、6、 8、10、12、14、16、18、20、22、24、26、28、30、32、34 或 36 的氨基酸序列。在一 些實施方案中,所述多肽包含具有一個或多個保守型氨基酸取代的SEQ ID NO: 2、4、
6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或 36 的氨基酸序列。在 一些實施方案中,所述多肽具有脫羰酶活性。在其他實施方案中,所述核苷酸序列編碼與包含SEQ IDNO 2、4、6、8、 10、12、14、16、18、20、22、24、26、28、30、32、34 或 36 的氨基酸序列的多肽具有 相同生物活性的多肽。在一些實施方案中,所述核苷酸序列是SEQ ID NO : 1、3、5、
7、9、11、13、15、17、19、21、23、25、27、29、31、33或 35,或其片段。在其他實 施方案中,所述核苷酸序列與 SEQIDN0 1、3、5、7、9、11、13、15、17、19、21、 23、25、27、29、31、33或35的互補物或其片段雜交,例如在低嚴緊性、中嚴緊性、高 嚴緊性或非常高的嚴緊性條件下。在一些實施方案中,所述生物活性是脫羰酶活性。在一些實施方案中,所述方法包括用重組載體轉(zhuǎn)化宿主細胞,所述重組載體包 含與 SEQ ID NO: 1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33 或35具有至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少 約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約 97%,至少約98%或至少約99%的序列同一性的核苷酸序列。在一些實施方案中,所 述重組載體還包含可操作地連接到所述核苷酸序列的啟動子。在一些實施方案中,所述 啟動子是發(fā)育調(diào)節(jié)性、細胞器特異性、組織特異性、誘導(dǎo)型、組成型或細胞特異性啟動 子。在具體實施方案中,所述重組載體包含至少一個選自以下的序列 (a)可操作地連接 到所述核苷酸序列的調(diào)節(jié)序列;(b)可操作地連接到所述核苷酸序列的選擇標記;(c)可操作地連接到所述核苷酸序列的標記序列;(d)可操作地連接到所述核苷酸序列的純化部分;(e)可操作地連接到所述核苷酸序列的分泌序列;和(f)可操作地連接到所述核苷 酸序列的引導(dǎo)序列(targeting sequence)。在某些實施方案中,所述核苷酸序列被穩(wěn)定并入 所述宿主細胞的基因組DNA,并且所述核苷酸序列的表達受可調(diào)型啟動子區(qū)的控制。在本文所述的任何方面中,所述宿主細胞可以選自哺乳動物細胞、植物細胞、 昆蟲細胞、酵母細胞、真菌細胞、絲狀真菌細胞和細菌細胞。在一些實施方案中,所述宿主細胞是革蘭氏陽性細菌細胞。在其他實施方案 中,所述宿主細胞是革蘭氏陰性細菌細胞。在一些實施方案中,所述宿主細胞選自以下的屬埃希氏菌屬(Escherichia)、 芽孢桿菌屬(Bacillus)、乳酸桿菌屬(Lactobacillus)、紅球菌屬(Rhodococcus)、假 單胞菌屬(Pseudomonas)、曲霉屬(Aspergillus)、木霉屬(Trichoderma)、鏈孢霉屬 (Neurospora)、鐮刀菌屬(Fusarium)、腐質(zhì)霉屬(Humicola)、根毛霉屬(Rhizomucor)、 克魯維酵母菌屬(Kluyveromyces)、畢赤酵母屬(Pichia)、毛霉菌屬(Mucor)、蝕絲霉屬 (Myceliophtora)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、側(cè)耳屬(Pleurotus)、 栓菌屬(Trametes)、金黃孢子菌屬(Chrysosporium)、酵母屬(Saccharomyces)、寡養(yǎng)單胞 菌屬(Stenotrophamonas)、裂殖酵母屬(Schizosaccharomyces)、耳口 氏酵母屬(Yarrowia)或 鏈霉菌屬(Streptomyces)。在具體實施方案中,所述宿主細胞為遲緩芽孢桿菌(Bacillus lentus)細胞、短芽 孢桿菌(Bacillusbrevis)細胞、嗜熱脂肪芽孢桿菌(Bacillusstearothermophilus)細胞、地衣 芽孢桿菌(Bacilluslicheniformis)細胞、嗜堿芽孢桿菌(Bacillusalkalophilus)細胞、凝結(jié) 芽孢桿菌(Bacillus coagulans)細胞、環(huán)狀芽孢桿菌(Bacillus circulans)細胞、短小芽孢桿 菌(Bacilluspumilis)細胞、蘇云金芽孢桿菌(Bacillusthuringiensis)細胞、克勞氏芽孢桿菌 (Bacillusclausii)細胞、巨大芽孢桿菌(Bacillusmegaterium)細胞、枯草芽孢桿菌(Bacillus subtilis)細胞或解淀粉芽孢桿菌(Bacillusamyloliquefaciens)細胞。在其他實施方案中,宿主細胞為康氏木霉(Trichodermakoningii)細胞、綠色木 霉(Trichoderma viride)細胞、里氏木霉(Trichodermareesei)細胞、長枝木霉(Trichoderma longibrachiatum)細胞、泡盛曲霉(Aspergillus awamori)細胞、煙曲霉(Aspergillus fomigates)細胞、臭曲霉(Aspergillus foetidus)細胞、構(gòu)巢曲霉(Aspergillus nidulans) 細胞、黑曲霉(Aspergillusniger)細胞、米曲霉(Aspergillus oryzae)細胞、特異腐質(zhì) 霉(Humicola insolens)細胞、棉毛狀腐質(zhì)霉(Humicola lanuginose)細胞、混濁紅球菌 (Rhodococcusopacus)細胞、米黑根毛霉(Rhizomucormiehei)細胞或米黑毛酶(Mucor michei)細胞。在其他實施方案中,所述宿主細胞是淺青紫鏈霉菌(Streptomyces lividans)細 胞或鼠灰鏈霉菌(Streptomyces murinus)細胞。在其他實施方案中,宿主細胞是放線菌 (Actinomycetes)細胞。在一些實施方案中,所述宿主細胞是CHO細胞、COS細胞、VERO細胞、BHK 細胞、HeLa細胞、Cvl細胞、MDCK細胞、293細胞、3T3細胞或PC12細胞。在具體實施方案中,所述宿主細胞是大腸桿菌(E.coli)細胞、例如菌株B、菌株 C、菌株K或菌株W大腸桿菌細胞。
在其他實施方案中,所述宿主細胞是藍細菌宿主細胞。在具體實施方案中,所 述藍細菌宿主細胞是表1中列出的細胞。在一些實施方案中,所述碳氫化合物由所述宿主細胞分泌在某些實施方案中,所述宿主細胞超表達本文所述的底物。在一些實施方案 中,所述方法還包括用編碼本文所述的酶的核酸轉(zhuǎn)化宿主細胞,并且所述宿主細胞超表 達本文所述的底物。在其他實施方案中,所述方法還包括在至少一種本文所述的底物的 存在下培養(yǎng)所述宿主細胞。在一些實施方案中,所述底物是脂肪酸衍生物、酰基ACP、 脂肪酸、?;鵆oA、脂肪醛、脂肪醇或脂肪酯。在一些實施方案中,所述脂肪酸衍生物底物是不飽和脂肪酸衍生物底物、單不 飽和脂肪酸衍生物底物或飽和脂肪酸衍生物底物。在其他實施方案中,所述脂肪酸衍生 物底物是直鏈脂肪酸衍生物底物、支鏈脂肪酸衍生物底物或包括環(huán)狀部分的脂肪酸衍生 物底物。在本文所述的方面的某些實施方案中,所產(chǎn)生的碳氫化合物是烷。在一些實施 方案中,所述烷是C3-C25烷。例如,所述烷是C3、C4> C5、C6> C7、C8> c9、C1Q、 Cll、Ci2、Ci3、C14 Λ Ci5、Ci6、Ci7、Ci8、C19 Λ C2C)、C2” C22、C23、C24 或C25燒。在 一些實施方案中,所述烷是十三烷、甲基十三烷、十九烷、甲基十九烷、十七烷、甲基 十七烷、十五烷或甲基十五烷。在一些實施方案中,所述烷是直鏈烷、支鏈烷或環(huán)狀烷。在某些實施方案中,所述方法還包括在飽和脂肪酸衍生物的存在下培養(yǎng)宿主 細胞,并且所產(chǎn)生的碳氫化合物是烷。在某些實施方案中,所述飽和脂肪酸衍生物是 C6-C26脂肪酸衍生物底物。例如,所述脂肪酸衍生物底物是c6、c7、c8、c9、c10> cn、 Ci2、Ci3、C14 λ Ci5、Ci6、Ci7、Ci8、C19、C2C)、C2I Λ C22、C23、C24、C25 或C 26 脂肪酸衍 生物底物。在具體實施方案中,所述脂肪酸衍生物底物是2-甲基二十烷醛、二十烷醛、 十八烷醛、十四烷醛、2-甲基十八烷醛、硬脂醛或棕櫚醛。在一些實施方案中,所述方法還包括從所述宿主細胞或從培養(yǎng)基分離所述烷。 在其他實施方案中,所述方法還包括裂化或提煉所述烷。在本文所述的方面的某些實施方案中,所產(chǎn)生的碳氫化合物是烯。在一些實施 方案中,所述烯是C3-C25烯。例如,所述烯是C3、C4> C5、C6> C7、C8> c9、C1Q、 Cll、Ci2、Ci3、C14 Λ Ci5、Ci6、Ci7、Ci8、C19 Λ C2C)、C2” C22、C23、C24 或C25烯。在 一些實施方案中,所述烯是十五烯、十七烯、甲基十五烯或甲基十七烯。在一些實施方案中,所述烯是直鏈烯、支鏈烷或環(huán)狀烯。在某些實施方案中,所述方法還包括在不飽和脂肪酸衍生物的存在下培養(yǎng)宿主 細胞,并且所產(chǎn)生的碳氫化合物是烯。在某些實施方案中,所述不飽和脂肪酸衍生物是 C6-C26脂肪酸衍生物底物。例如,所述脂肪酸衍生物底物是c6、c7、c8、c9、c10> cn、 C12、Ci3、C14 Λ Ci5、Ci6、Ci7、Ci8、C19、C2C)、C2I Λ C22、C23、C24、C25 或C 26 不飽和脂 肪酸衍生物底物。在具體實施方案中,所述脂肪酸衍生物底物是十八烯醛、十六烯醛、 甲基十六烯醛或甲基十八烯醛。在另一方面,本發(fā)明特征為遺傳改造的微生物, 其包含穩(wěn)定并入所述微生物的 基因組DNA的外源控制序列。在一個實施方案中,所述控制序列被整合到多核苷酸的上游,該多核苷酸包含與 SEQIDNO 1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或35具有至少約70%的序列同一性的核苷酸序列。在一些實施方 案中,所述核苷酸序列與 SEQIDNO 1、3、5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33或35具有至少約75%、至少約80%、至少約85%、至少約90%、 至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至 少約97%、至少約98%或至少約99%的序列同一性。在一些實施方案中,所述核苷酸序 列是 SEQ ID NO: 1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33 或35。在一些實施方案中,所述多核苷酸對于所述微生物是內(nèi)源的。在一些實施方案 中,所述微生物相對于野生型微生物表達水平增高的碳氫化合物。在一些實施方案中, 所述微生物是藍細菌(cyanobacterium)。在另一方面,本發(fā)明特征為制造碳氫化合物的方法,所述方法包括在適于基因 表達的條件下,培養(yǎng)本文所述的遺傳改造的微生物,并分離所述碳氫化合物。在另一方面,本發(fā)明特征為制造碳氫化合物的方法,所述方法包括使底物與以 下接觸(i)與 SEQ ID NO: 2、4、6、8、10、12、14、16、18、20、22、24、26、28、 30、32、34或36的氨基酸序列具有至少70%的同一性的多肽或其變體;(ii)與SEQ ID NO: 1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33 或 35 具有至 少70%的同一性的核苷酸序列所編碼的多肽或其變體;(iii)包含SEQ ID NO 37、38或 39的氨基酸序列的多肽;(iv)包含SEQ ID NO 40以及(a) SEQ ID NO 37、(b) SEQ ID NO 38和(c) SEQ ID NO 39中的任一個的氨基酸序列的多肽;或(v) SEQ ID NO 41、42、43或44。在一些實施方案中,所述多肽具有脫羰酶活性。在一些實施方案中,所述多肽與SEQ ID NO 2、4、6、8、10、12、14、16、 18、20、22、24、26、28、30、32、34或36具有至少約80 %、至少約85%、至少約 90%,至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約 96%,至少約97%、至少約98%或至少約99%的同一性。在一些實施方案中,所述多肽 具有 SEQ ID NO: 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、 34或36的氨基酸序列。在一些實施方案中,所述多肽由與SEQ ID NO 1、3、5、7、9、11、13、 15、17、19、21、23、25、27、29、31、33 或 35 具有至少約 75%、至少約 80%、至少 約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約 95%,至少約96%、至少約97%、至少約98%或至少約99%的序列同一性的核苷酸序列 編碼。在一些實施方案中,所述多肽由具有SEQIDNO 1、3、5、7、9、11、13、15、 17、19、21、23、25、27、29、31、33 或 35 的核苷酸序列編碼。在一些實施方案中,所述生物底物是脂肪酸衍生物、?;鵄CP、脂肪酸、?;?CoA,脂肪醛、脂肪醇或脂肪酯。在一些實施方案中,所述底物是飽和脂肪酸衍生物,并且所述碳氫化合物是 烷,例如 C3-C25 烷。例如,所述烷是 C3、C4、C5、C6> C7> C8、C9> c10> cn、c12、 Ci3、C14 Λ Ci5、Ci6、Ci7、Ci8、C19、C2C)、C2I Λ C22、C23、C24 或C25燒。在一些實施 方案中,所述烷是十三烷、甲基十三烷、十九烷、甲基十九烷、十七烷、甲基十七烷、十五烷或甲基十五烷。在一些實施方 案中,所述烷是直鏈烷、支鏈烷或環(huán)狀烷。在一些實施方案中,所述飽和脂肪酸衍生物是2_甲基二十烷醛、二十烷醛、 十八烷醛、十四烷醛、2-甲基十八烷醛、硬脂醛或棕櫚醛。在其他實施方案中,所述生物底物是不飽和脂肪酸衍生物,并且所述碳氫化合 物是烯,例如 C3-C25 烯。例如,所述烯是 C3、C4> C5、C6、C7、C8> C9> C1Q、cn、 Cl2、Ci3、Ci4、Ci5、Ci6、Ci7、Ci8、C19 λ C2C)、C2” C22、C23、C24 或C25烯。在一些實 施方案中,所述烯是十五烯、十七烯、甲基十五烯或甲基十七烯。在一些實施方案中,所述烯是直鏈烯、支鏈烷或環(huán)狀烯。在一些實施方案中,所述不飽和脂肪酸衍生物是十八烯醛、十六烯醛、甲基 十六烯醛或甲基十八烯醛。在另一方面,本發(fā)明特征為由本文所述的任何方法或微生物所產(chǎn)生的碳氫化合 物。在具體實施方案中,所述碳氫化合物是S 13C為約-15.4或更高的烷或烯。例如, 所述烷或烯的為δ 13C約-15.4至約-10.9,例如約-13.92至約-13.84。在其他實施方案 中,所述烷或烯的fM14C為至少約1.003。例如,所述烷或烯的fM14C為至少約1.01或至 少約1.5。在一些實施方案中,所述烷或烯的fM14C為約1.111至約1.124。在另一方面,本發(fā)明特征為包括由本文所述的任何方法或微生物所產(chǎn)生的碳氫 化合物的生物燃料。在具體實施方案中,所述碳氫化合物是S 13C為約-15.4或更高的烷 或烯。例如,所述烷或烯的S 13C為約-15.4至約-10.9,例如約-13.92至約-13.84。在 其他實施方案中,所述烷或烯具有至少約1.003的fM14C。例如,所述烷或烯的fM14C為至 少約1.01或至少約1.5。在一些實施方案中,所述烷或烯的fM14C為約1.111至約1.124。 在一些實施方案中,所述生物燃料是柴油、汽油或噴氣燃料(jet fuel)。在另一方面,本發(fā)明特征為由SEQIDNO 1、3、5、7、9、11、13、15、17、 19、21、23、25、27、29、31、33或35的不多于約500個核苷酸組成的分離的核酸。在 一些實施方案中,所述核酸由 SEQIDNO 1、3、5、7、9、11、13、15、17、19、21、 23、25、27、29、31、33或35的不多于約300個核苷酸、不多于約350個核苷酸、不多 于約400個核苷酸、不多于約450個核苷酸、不多于約550個核苷酸、不多于約600個核 苷酸或不多于約650個核苷酸組成。在一些實施方案中,所述核酸編碼具有脫羰酶活性 的多肽。在另一方面,本發(fā)明特征為由不多于約99%、不多于約98%、不多于約97%、 不多于約96%、不多于約95%、不多于約94%、不多于約93%、不多于約92%、不多于 約91%、不多于約90%、不多于約85%或不多于約80%的SEQ ID NO 1、3、5、7、 9、11、13、15、17、19、21、23、25、27、29、31、33 或 35 的核苷酸組成的分離的核
酸。在一些實施方案中,所述核酸編碼具有脫羰酶活性的多肽。在另一方面,本發(fā)明特征為由SEQ ID NO 2、4、6、8、10、12、14、16、 18、20、22、24、26、28、30、32、34或36的不多于約200、不多于約175、不多于約
150或不多于約100個氨基酸組成的分離的多肽。在一些實施方案中,所述多肽具有脫羰 酶活性。在另一方面,本發(fā)明特征為由不多于約99%、不多于約98%、不多于約97%、不多于約96%、不多于約95%、不多于約94%、不多于約93%、不多于約92%、不多于 約91%、不多于約90%、不多于約85%或不多于約80%的SEQ ID NO 2、4、6、8、 10、12、14、16、18、20、22、24、26、28、30、32、34 或 36 的氨基酸組成的分離的多 肽。在一些實施方案中,所述多肽具有脫羰酶活性。定義 在整個本說明書中,可以使用縮寫基因名稱或多肽名稱進行引用,但是應(yīng)當(dāng)理 解到,該縮寫基因或多肽名稱表示基因或多肽的種類。這些基因名稱包括編碼相同多肽 和具有相同生理功能的同源多肽的所有基因。多肽名稱包括具有相同活性(例如催化相 同基礎(chǔ)化學(xué)反應(yīng)活性)的所有多肽。本文引用的登錄號來自美國國立衛(wèi)生研究院(National Institute of Health, U.S.Α)所維護的NCBI數(shù)據(jù)庫(國家生物技術(shù)信息中心(National Center for Biotechnology Information))。除非另作說明,登錄號按照截止到2009年四月的數(shù)據(jù)庫中提供的。EC號由國際生物化學(xué)和分子生物學(xué)聯(lián)盟命名委員會(Nomenclature Committee of the International Union of Biochemistry and Molecular Biology (NC-IUBMB))(可獲取自 http://www.chem.qmul.ac.uk/iubmb/enzvme/)制定。本文引用的EC號來自由東京大學(xué) 部分資助的京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomics)所維 護的KEGG配體數(shù)據(jù)庫。除非另作說明,EC號按照截止到2008年三月的數(shù)據(jù)庫中提供 的。本文所用冠詞“a”和“an”是指該冠詞的一個或多于一個(即至少一個)語 法對象。作為實例,“元件(an element)“表示一個元件或多于一個元件。本文所用術(shù)語“約”表示給定數(shù)值的士20%的值。因此,“約60%”表示在 60士 (60 ^ 20% )之間的值(即48至70)。如本文所用術(shù)語“醛”表示具有通式RCHO的碳氫化合物,所述RCHO特征為 不飽和羰基(C = O)。在優(yōu)選的實施方案中,所述醛是產(chǎn)生自脂肪酸或脂肪酸衍生物的 任何醛。在一個實施方案中,R基長度為至少約1、2、3、4、5、6、7、8、9、10、11、 12、13、14、15、16、17、18、19 或 20 個碳。如本文所用的“醛生物合成基因”或“醛生物合成多核苷酸”是編碼醛生物合 成多肽的核酸。如本文所用的“醛生物合成多肽”是作為醛的生物合成途徑的部分的多肽。這 些多肽可以作用于生物底物以產(chǎn)生醛。在一些情況下,所述醛生物合成多肽具有還原酶 活性。如本文所用的術(shù)語“烷”表示僅含有單一碳-碳鍵的碳氫化合物。如本文所用的“烷生物合成基因”或“烷生物合成多核苷酸”是編碼烷生物合 成多肽的核酸。如本文所用的“烷生物合成多肽”是作為烷的生物合成途徑的部分的多肽。這 些多肽可以作用于生物底物以產(chǎn)生烷。在一些情況下,所述烷生物合成多肽具有脫羰酶 活性。如本文所用的“烯生物合成基因”或“烯生物合成多核苷酸”是編碼烯生物合 成多肽的核酸。
如本文所用的“烯生物合成多肽”是作為烯的生物合成途徑的部分的多肽。這 些多肽可以作用于生物底物以產(chǎn)生烯。在一些情況下,所述烯生物合成多肽具有脫羰酶 活性。
如本文所用的術(shù)語“減弱”表示削弱、降低或縮小。例如,可以通過修飾多肽 來減弱多肽以降低其活性(例如,通過修飾編碼所述多肽的核苷酸序列)。
如本文所用的術(shù)語“生物柴油”表示可以作為來源于石油的柴油的替代品的生 物燃料。生物柴油可以以被稱為“純(neat)”生物柴油的純品形式或作為以任何濃度與 基于石油的柴油的混合物用于內(nèi)燃柴油發(fā)動機。生物柴油可以包括酯或碳氫化合物,例 如醛和烷。
如其中所用的術(shù)語“生物燃料”是指來源于生物量的任何燃料。生物燃料可以 替代基于石油的燃料。例如,生物燃料包括運輸工具燃料(例如汽油、柴油、噴氣燃料 (jet fuel)等)、燃用燃料和發(fā)電燃料。生物燃料是可再生能源。
如本文使用,術(shù)語“生物量”是指來源于生物材料的碳源。生物量可以被轉(zhuǎn)變 為生物燃料。生物量的一個示例性來源是植物物質(zhì)。例如,玉米、甘蔗或柳枝稷可以 用作生物量。生物量的另一非限制性實例是動物物質(zhì),例如牛糞。生物量還包括來自工 業(yè)、農(nóng)業(yè)、林業(yè)和家庭的廢品。可以用作生物量的這些廢品的實例是發(fā)酵廢渣、秸稈、 無用雜物、污水、垃圾和剩余食物。生物量還包括例如碳水化合物(例如單糖、二糖或 多糖)的碳源。
如本文所用的短語“碳源”是指適于用作原核或簡單真核細胞生長的碳的來源 的底物或化合物。碳源可以是不同形式的,包括但不限于聚合物、碳水化合物、酸、 醇、醛、酮、氨基酸、肽和氣體(例如CO和CO2)。這些包括,例如各種單糖,例如葡 萄糖、果糖、甘露糖和半乳糖;寡糖,例如低聚果糖和低聚半乳糖;多糖,例如木糖和 阿拉伯糖;二糖,例如蔗糖、麥芽糖和松二糖;纖維素原料,例如甲基纖維素和羧甲基 纖維素鈉;飽和或不飽和脂肪酸酯,例如琥珀酸酯、乳酸酯和醋酸酯;醇,例如乙醇或 其混合物。碳源還可以是光合作用的產(chǎn)物,包括但不限于葡萄糖。優(yōu)選的碳源是生物 量。另一優(yōu)選的碳源是葡萄糖。
如本文所用的“降低濁點的添加劑”是添加到組合物以減少或降低溶液的濁點 的添加劑。
如本文所用的短語“液體的濁點”表示溶解的固體不再完全可溶的溫度。在該 溫度下,固體開始作為第二相沉淀,給予液體渾濁的外觀。在石油工業(yè)中,濁點是指這 樣的溫度在該溫度下固化物質(zhì)或其他重碳氫化合物在原油、提煉油或燃料中結(jié)晶以形 成渾濁的外觀。固化物質(zhì)的存在影響該液體的流動特性、該液體堵塞燃料過濾器、噴嘴 的傾向等、固化物質(zhì)在冷表面(例如管道或熱交換器污垢)上的聚積以及該液體與水的乳 化特性。
如果兩個序列的每個堿基都匹配(即能夠形成Watson Crick堿基對),則核苷酸 序列與另一核苷酸序列是“互補的”。術(shù)語“互補鏈”在本文中與術(shù)語“互補物”互 換使用。核酸鏈的互補物可以是編碼鏈的互補物或非編碼鏈的互補物。
如本文所用的術(shù)語“足以允許表達的條件”表示允許宿主細胞產(chǎn)生諸如本文所 述的多肽、醛或烷的所需產(chǎn)物的任何條件。合適的條件包括,例如發(fā)酵條件。發(fā)酵條件可以包含很多參數(shù),例如溫度范圍、通氣水平和培養(yǎng)基組分。這些條件中每一個單獨地 并聯(lián)合地允許宿主細胞生長。示例性培養(yǎng)基包括培養(yǎng)液或膠。通常,所述培養(yǎng)基包括諸 如葡萄糖、果糖、纖維素等的碳源,該碳源可以直接被宿主細胞代謝。此外,培養(yǎng)基中 可以使用酶以便于動員(例如淀粉或纖維素的解聚為可發(fā)酵的糖)和隨后碳源的代謝。
為了確定條件是否足以允許表達,可以將宿主細胞培養(yǎng)例如約4、8、12、24、 36或48小時。培養(yǎng)中和/或培養(yǎng)后,可以獲取樣品并分析樣品以確定該條件是否允許表 達。例如,可以測試樣品或宿主細胞在其中生長的培養(yǎng)基中的宿主細胞的所需產(chǎn)物的存 在。當(dāng)測試產(chǎn)物的存在時,可以使用諸如但不限于TLC、HPLC> GC/FID、GC/MS、 LC/MS、MS的檢測。
應(yīng)當(dāng)理解到,本文所述的多肽可以具有另外的對于多肽功能沒有本質(zhì)影響的保 守型或非必需氨基酸取代。特定取代是否會被允許(即不會不利地影響例如脫羧酶活性 的所需生物性質(zhì)),可以按照Bowie et al.,Science (1990) 247 13061310中所述進行測 定?!氨J匦桶被崛〈笔前被釟埢痪哂邢嗨苽?cè)鏈的氨基酸殘基所替代的取代。 具有相似側(cè)鏈的氨基酸殘基的家族在本領(lǐng)域中已有定義。這些家族包括具有以下側(cè)鏈的 氨基酸堿性側(cè)鏈(例如賴氨酸、精氨酸、組氨酸)、酸性側(cè)鏈(例如天冬氨酸、谷氨 酸)、不帶電荷的極性側(cè)鏈(例如甘氨酸、天冬酰胺、谷氨酰胺、絲氨酸、蘇氨酸、酪氨 酸、半胱氨酸)、非極性側(cè)鏈(例如丙氨酸、纈氨酸、亮氨酸、異亮氨酸、脯氨酸、苯丙 氨酸、甲硫氨酸、色氨酸)、β-分枝側(cè)鏈(例如蘇氨酸、纈氨酸、異亮氨酸)和芳香族 側(cè)鏈(例如酪氨酸、苯丙氨酸、色氨酸、組氨酸)。
如本文所用的“控制元件”表示轉(zhuǎn)錄控制元件??刂圃▎幼雍驮鰪?子。術(shù)語“啟動子元件”、“啟動子”或“啟動子序列”是指作為激活基因表達的開 關(guān)發(fā)揮功能的DNA序列。如果基因被激活,認為其被轉(zhuǎn)錄或參與轉(zhuǎn)錄。轉(zhuǎn)錄涉及由基 因合成mRNA。因此,啟動子充當(dāng)轉(zhuǎn)錄調(diào)節(jié)元件并且還提供基因轉(zhuǎn)錄為mRNA的起始 位點??刂圃c參與轉(zhuǎn)錄的細胞蛋白特異性相互作用(Maniatis et al, Science 236 1237, 1987)。
如本文所用的術(shù)語“酯合酶”表示能夠產(chǎn)生脂肪酯的肽。更具體而言,酯合酶 是將硫酯轉(zhuǎn)變?yōu)橹觉サ碾?。在?yōu)選的實施方案中,所述酯合酶將硫酯(例如?;鵆oA) 轉(zhuǎn)變?yōu)橹觉ァ?br>
在可選的實施方案中,酯合酶使用硫酯和醇作為底物產(chǎn)生脂肪酯。酯合酶能夠 使用短和長鏈硫酯作為底物。此外,酯合酶能夠使用短和長鏈醇作為底物。
酯合酶的非限制性實例是蠟合酶、蠟酯合酶、酰基CoA:醇轉(zhuǎn)酰酶、?;D(zhuǎn)移 酶和脂肪酰輔酶A 脂肪醇?;D(zhuǎn)移酶。示例性的酯合酶被分在酶分類號EC 2.3.1.75 中。示例性的GenBank登錄號提供于圖40中。
如本文使用,術(shù)語“脂肪酸”表示具有通式RCOOH的羧酸。R表示脂肪族基 團,優(yōu)選地表示烷基。R可以包含約4到約22個碳原子。脂肪酸可以為飽和的、單不 飽和的或多不飽和的。在優(yōu)選的實施方案中,所述脂肪酸由脂肪酸生物合成途徑產(chǎn)生。
如本文所用的術(shù)語“脂肪酸生物合成途徑”表示產(chǎn)生脂肪酸的生物合成途徑。 所述脂肪酸生物合成途徑包括脂肪酸酶,所述脂肪酸酶可以按照本文所述經(jīng)改造產(chǎn)生脂 肪酸,并且在一些實施方案中可以與其他酶一起表達以產(chǎn)生具有所需碳鏈特征的脂肪
如本文所用的術(shù)語“脂肪酸衍生物”表示部分地產(chǎn)生于生產(chǎn)宿主生物體的脂肪 酸生物合成途徑的產(chǎn)物。“脂肪酸衍生物”還包括部分地產(chǎn)生于?;鵄CP或酰基ACP 衍生物的產(chǎn)物。所述脂肪酸生物合成途徑包括脂肪酸合酶酶類,所述脂肪酸合酶酶類可 以按照本文所述經(jīng)改造產(chǎn)生脂肪酸衍生物,并且在一些實施例中可以與其他酶一起表達 以產(chǎn)生具有所需碳鏈特征的脂肪酸衍生物。示例性的脂肪酸衍生物包括,例如脂肪酸、 ?;鵆oA、脂肪醛、短和長鏈醇、碳氫化合物、脂肪醇和酯(例如蠟、脂肪酸酯或脂肪 酯)。
如本文所用的術(shù)語“脂肪酸衍生酶”表示在脂肪酸衍生物的產(chǎn)生中可以被表達 或超表達的所有酶。這些酶在本文統(tǒng)稱為脂肪酸衍生酶。這些酶可以是脂肪酸生物合 成途徑的一部分。脂肪酸衍生酶的非限制性實例包括脂肪酸合酶、硫酯酶、?;鵆oA合 酶、?;鵆oA還原酶、醇脫氫酶、醇酰基轉(zhuǎn)移酶、脂肪醇形成?;鵆oA還原酶、酯合 酶、醛生物合成多肽和烷生物合成多肽。脂肪酸衍生酶將底物轉(zhuǎn)變?yōu)橹舅嵫苌?。?一些實施例中,所述底物可以是被脂肪酸衍生酶轉(zhuǎn)變?yōu)椴煌闹舅嵫苌锏闹舅嵫?生物。
如本文所用的術(shù)語“脂肪醇形成肽”表示能夠催化?;鵆oA轉(zhuǎn)變?yōu)橹敬嫉?肽,包括脂肪醇形成?;鵆oA還原酶(FAR,EC111.*)、?;鵆oA還原酶(EC 1.2丄50) 或醇脫氫酶(EC1.L1.1)。此外,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解到,一些脂肪醇形成肽還會催 化其他反應(yīng)。例如,除脂肪酸外,一些?;鵆oA還原酶肽會接受其他底物。因此,還 包括這些非特異性肽。編碼脂肪醇形成肽的核酸序列是本領(lǐng)域已知的,并且這些肽是可 公開獲取的。示例性的GenBank登錄號提供于圖40中。
如本文所用的“脂肪酸酶”表示參與脂肪酸生物合成的任何酶。脂肪酸酶可以 在宿主細胞中表達或超表達以產(chǎn)生脂肪酸。脂肪酸酶的非限制性實例包括脂肪酸合酶和 硫酯酶。
如本文所用的術(shù)語“脂肪酯”表示酯。在優(yōu)選的實施方案中,脂肪酯是產(chǎn)生自 脂肪酸的任何酯,例如脂肪酸酯。在一個實施方案中,脂肪酯含有A側(cè)(即連接于羧基 氧的碳鏈)和B側(cè)(即包含母體羧基的碳鏈)。在優(yōu)選的實施方案中,當(dāng)所述脂肪酯來 源于脂肪酸生物合成途徑時,A側(cè)由醇貢獻,并且B側(cè)由脂肪酸貢獻。任何醇可以用于 形成脂肪酯的A側(cè)。例如,所述醇可以來自脂肪酸生物合成途徑??蛇x地,所述醇可以 通過非脂肪酸生物合成途徑產(chǎn)生。此外,所述醇可以是外源提供的。例如,在脂肪酯是 由生物體產(chǎn)生的情況下,所述醇可以提供在發(fā)酵液(fermentation broth)中。可選地,例 如在脂肪酯是由還產(chǎn)生醇的生物體產(chǎn)生的情況下,諸如脂肪酸或乙酸的羧酸可以是外源 提供的。
包含A側(cè)或B側(cè)的碳鏈可以是任何長度。在一個實施方案中,酯的A側(cè)的長度 為至少約1、2、3、4、5、6、7、8、10、12、14、16或18個碳。酯的B側(cè)的長度為至 少約4、6、8、10、12、14、16、18、20、22、對或洸個碳。A側(cè)和/或B側(cè)可以是直 鏈或支鏈。支鏈可以具有一個或多個分支點。此外,支鏈可以包括環(huán)狀分支。而且, A側(cè)和/或B側(cè)可以是飽和的或不飽和的。如果是不飽和的,A側(cè)和/或B側(cè)可以具有 一個或多個不飽和點。
在一個實施方案中,脂肪酯是生物合成產(chǎn)生的。在該實施方案中,首先脂肪酸 被“活化”?!盎罨摹敝舅岬姆窍拗菩詫嵗酋;鵆oA、酰基ACP和?;姿猁}。 ?;鵆oA可以是脂肪酸生物合成或降解的直接產(chǎn)物。此外,酰基CoA可以由游離脂肪 酸、CoA或三磷酸腺苷(ATP)合成。產(chǎn)生酰基CoA的酶的實例是?;鵆oA合酶。
在脂肪酸被活化后,其可以被容易地轉(zhuǎn)移到接受體親核體。示例性的親核體為 醇、硫醇或磷酸鹽。
在一個實施方案中,脂肪酯是蠟。蠟可以來自長鏈醇和長鏈脂肪酸。在另一實 施方案中,所述脂肪酯可以來自脂肪酰基硫酯和醇。在另一實施方案中,所述脂肪酯是 脂肪酸硫酯,例如脂肪酰輔酶A(CoA)。在其他實施方案中,所述脂肪酯是脂肪?;?酸酯、酰基載體蛋白(ACP)或脂肪磷酸酯。脂肪酯具有很多用途。例如,脂肪酯可以 被用作生物燃料。
如本文所用的“現(xiàn)代碳比例(fraction of modern carbon)”或“fM”與分別由 稱為草酸標準HOxI和HOxII的國家標準技術(shù)研究院(National Institute of Standards and Technology(NIST))標準參考物6RMs) 4990B和4990C所定義的具有相同意義?;径?義涉及0.95倍的WC/12C同位素比例HOxI (參考AD 1950)。這粗略地等于衰變校正的工 業(yè)革命前樹木(!decay-corrected pre-Industrial Revolution wood)。對于現(xiàn)今生命生物圈(植 物物質(zhì))而言,fM約為1.1。
可以按照以下計算兩個序列之間“同源性”。序列以最佳比較目的進行比對 (例如,可以在第一和第二氨基酸或核酸序列之一或兩者中引入空位用于最佳比對,并且 為了比較目的可以忽略非同源序列)。在優(yōu)選的實施方案中,用于比較目的的而比對的參 考序列長度為參考序列長度的至少約30%、優(yōu)選地至少約40%、更優(yōu)選地至少約50%、 更優(yōu)選地至少約60%并且更優(yōu)選地至少約70%、至少約80%、至少約90%或約100%。 然后比較位于對應(yīng)氨基酸位置或核苷酸位置的氨基酸殘基或核苷酸。當(dāng)?shù)谝恍蛄兄械奈?置被與第二序列中對應(yīng)位置相同的氨基酸殘基或核苷酸占據(jù)時,則分子在該位置是相同 的(如本文所用的,氨基酸或核酸“同一性”等同于氨基酸或核酸“同源性”)。兩個 序列之間的同一性百分比是序列所共享的相同位置數(shù)的函數(shù),這考慮到空位數(shù)和每個空 位的長度,為了兩個序列的最佳比對需要引入空位。
可以使用數(shù)學(xué)算法完成序列的比較和兩個序列之間同源性百分比的測定。在 優(yōu)選的實施方案中,使用以下測定兩個氨基酸序列之間的同源性百分比Needleman and Wunsch (1970), J.Mol.Biol.48 444453的算法,其被并入GCG軟件包中的GAP程序中, 使用Blossum 62矩陣或PAM250矩陣,以及16、14、12、10、8、6或4的空位權(quán)重和1、 2、3、4、5或6的長度權(quán)重。在另一優(yōu)選的實施方案中,使用以下測定兩個核苷酸序列 之間的同源性百分比GCG軟件包中的GAP程序,使用NWSgapdna.CMP矩陣以及40、 50、60、70或80的空位權(quán)重和1、2、3、4、5或6的長度權(quán)重。特別優(yōu)選的參數(shù)組(和 如果操作者不確定應(yīng)當(dāng)應(yīng)用哪些參數(shù)確定分子是否在要求的同源性限制內(nèi)而應(yīng)該使用的 參數(shù)組)是具有12的空位罰分、4的空位延伸罰分和5的移碼空位罰分的Blossum 62評 分矩陣。
如本文所用的“宿主細胞”是用于產(chǎn)生本文所述的產(chǎn)物(例如本文所述的醛或 烷)的細胞??梢愿脑焖拗骷毎员磉_或超表達所選擇的基因或具有所選擇的基因的減弱的表達。宿主細胞的非限制性實例包括植物、動物、人、細菌、酵母或絲狀真菌細 胞。
如本文所用的術(shù)語“在低嚴緊性、中嚴緊性、高嚴緊性或非常高的嚴緊性條件 下雜交”描述用于雜交和洗滌的條件。講行雜交反應(yīng)的指導(dǎo)可以見于Current Protocols in Molecular Biology (現(xiàn)代分子牛物學(xué)實驗技術(shù)),John Wiley&Sons,N.Y.(1989), 6.3.1-6.3.6。該參考資料中描述了水性和非水性方法并且可以使用任一方法。本文涉 及的具體雜交條件如下1)低嚴緊性雜交條件在約45°C下、在6X氯化鈉/檸檬酸鈉 6SC)中,然后是在至少50°C下、在0.2XSSC、0.1% SDS中洗滌兩次(對于低嚴緊性條 件,洗滌溫度可以升至55°C) ; 2)中嚴緊性雜交條件在約45°C下在、在6XSSC中,然 后是在60°C的0.2XSSC、0.1% SDS中洗滌一次或多次;3)高嚴緊性雜交條件在約45°C 的6XSSC中,然后是在65°C下、在0.2XSSC、0.1 % SDS中洗滌一次或多次;以及優(yōu) 選地4)非常高嚴緊性雜交條件為65°C的0.5M磷酸鈉、7%SDS,然后是在65°C下、在 0.2XSSC、1% SDS中洗滌一次或多次。除非另作規(guī)定,非常高的嚴緊性條件(4)是優(yōu) 選的條件。
本文中涉及諸如DNA或RNA的核酸所用的術(shù)語“分離的”是指分別從所述核 酸的天然來源中存在的其他DNA或RNA中隔離的分子。此外,“分離的核酸”包括核 酸片段,例如不是天然存在的片段。本文所用的術(shù)語“分離的”還指從其他細胞蛋白分 離的多肽,并且包括純化的內(nèi)源多肽和重組多肽兩者。當(dāng)核酸或多肽是通過重組DNA技 術(shù)產(chǎn)生時,本文使用的術(shù)語“分離的”還指基本上游離于細胞物質(zhì)、病毒物質(zhì)或培養(yǎng)基 的核酸或多肽。當(dāng)核酸或多肽是化學(xué)合成時,本文所用的術(shù)語“分離的”還指基本上游 離于化學(xué)前體或其他化學(xué)品的核酸或多肽。
如本文所用的“細胞中的基因表達水平”是指由所述細胞中基因編碼的 mRNA、前體mRNA新生轉(zhuǎn)錄物、轉(zhuǎn)錄加工中間體、成熟mRNA和/或降解產(chǎn)物的水平。
如本文所用的術(shù)語“微生物”表示來自古菌域、細菌域和真核域的原核和真核 微生物種類,后者包括酵母和絲狀真菌、原生動物、藻類或高等原生生物。如本文所用 的術(shù)語“微生物細胞”表示來自微生物的細胞。
如本文所用的術(shù)語“核酸”是指多核苷酸,例如脫氧核糖核酸(DNA)以及適當(dāng) 情況下,指核糖核酸(RNA)。該術(shù)語還包括產(chǎn)生自核苷酸類似物的RNA或DNA的類 似物,以及適用于所述實施方案的單鏈(有義或反義)和雙鏈多核苷酸、EST、染色體、 cDNA、mRNA 禾口 rRNA。
如本文所用的術(shù)語“可操作地連接”表示所選擇的核苷酸序列(例如編碼本文 所述的多肽)與啟動子接近以允許所述啟動子調(diào)節(jié)該選擇的核苷酸序列的表達。此外, 按照轉(zhuǎn)錄和翻譯的方向,所述啟動子位于所述選擇的核苷酸序列的上游?!翱刹僮鞯剡B 接”表示將核苷酸序列和調(diào)節(jié)序列連接以便當(dāng)合適的分子(例如轉(zhuǎn)錄激活蛋白)與調(diào)節(jié)序 列結(jié)合時允許基因表達。
本文所用術(shù)語“或”表示術(shù)語“和/或”并且與術(shù)語“和/或”交換使用,除 非上下文明確表示并非如此。
如本文所用的“超表達”表示在細胞中以高于對應(yīng)野生型細胞中正常表達濃度的濃度表達核酸、多肽或碳氫化合物或使 之被表達。例如,當(dāng)在重組宿主細胞中多肽以 與其在相同種類的非重組宿主細胞中的濃度相比更高的濃度存在時,所述多肽在所述重 組宿主細胞中能夠“超表達”。
如本文所用的“分配系數(shù)”或“P”定義為化合物在有機相中的平衡濃度除以 在水相中(例如發(fā)酵液)平衡時的濃度。在本文所述的兩相系統(tǒng)的一個實施方案中,生 產(chǎn)過程中所述有機相是由醛或烷形成的。但是,在一些實施例中,可以例如通過提供辛 烷層來提供有機相以便于產(chǎn)物分離。當(dāng)描述兩相系統(tǒng)時,化合物的分配特性可以描述為 logP。例如,IogP為1的化合物會10 1分配到有機相。IogP為-1的化合物會1 10 分配到有機相。通過選擇合適的發(fā)酵液和有機相,具有高IogP值的醛或烷在發(fā)酵容器中 也會分離到有機相中,即使處于很低的濃度。
如本文所用的術(shù)語“純化(purify),,、“純化的(purified),,或“純化 (purification) ”表示通過例如分離或隔離從分子的環(huán)境中移除或分離所述分子。“基本 上純化的”分子為至少約60%、優(yōu)選地至少約75%以及更優(yōu)選地至少約90%游離于與其 相關(guān)的其他組分。如本文所用的這些術(shù)語還指從樣品中去除污染物。例如,污染物的去 除可以導(dǎo)致樣品中醛或烷的百分比增加。例如,當(dāng)醛或烷在宿主細胞中產(chǎn)生時,可以通 過去除宿主細胞蛋白純化醛或烷。純化后,樣品中醛或烷的百分比增加。
術(shù)語“純化(purify),,、“純化的(purified),,或“純化(purification),,不需要絕 對純。它們是相對的術(shù)語。因此,例如當(dāng)醛或烷在宿主細胞中產(chǎn)生時、純化的醛或純化 的烷是基本與其他細胞組分(例如核酸、多肽、脂質(zhì)、碳水化合物或其他碳氫化合物)隔 離的醛或烷。在另一實施例中,純化的醛或純化的烷制劑是這樣的制劑,在該制劑中, 所述醛或烷基本游離于例如可能存在于后續(xù)發(fā)酵的那些污染物。在一些實施方案中,當(dāng) 樣品重量的至少約50%是由醛或烷組成時,所述醛或烷是純化的。在其他實施方案中, 當(dāng)樣品重量的至少約60%、70%, 80%, 85%, 90%, 92%, 95%, 98%或99%或更多 是由醛或烷組成時,所述醛或烷是純化的。
如本文使用,術(shù)語“重組多肽”是指通過重組DNA技術(shù)產(chǎn)生的多肽,其中通常 將編碼所表達的多肽或RNA的DNA插入合適的表達載體,并且所述表達載體接下來用于 轉(zhuǎn)化宿主細胞以產(chǎn)生所述多肽或RNA。
如本文所用的術(shù)語“基本相同”(或“基本同源”)是用于指含有足夠數(shù)量的 與第二氨基酸或核苷酸序列相同或等同的(例如具有相似側(cè)鏈,例如保守氨基酸取代)氨 基酸殘基或核苷酸的第一氨基酸或核苷酸序列,這樣所述第一和第二氨基酸或核苷酸序 列具有相似活性。
如本文所用的術(shù)語“合酶”表示催化合成過程的酶。如本文所用的術(shù)語合酶包 括合酶、合成酶和連接酶。
如本文所用的術(shù)語“轉(zhuǎn)染”表示將核酸(例如通過表達載體)通過核酸介導(dǎo)的 基因轉(zhuǎn)移引入到受體細胞。
如本文所用的“轉(zhuǎn)化”是指這樣的過程,在該過程中,細胞的基因型由于細胞 攝入外源核酸而改變。這可以導(dǎo)致表達重組形式的RNA或多肽的轉(zhuǎn)化的細胞。在由轉(zhuǎn) 移的基因反義表達的情況下,天然存在形式的多肽的表達被破壞。
如本文使用,“轉(zhuǎn)運蛋白”是便于一種或多種化合物移入和/或移出細胞器和/20或細胞的多肽。
如本文所用,多肽X的“變體”是指具有多肽X的氨基酸序列的多肽,其中一 個或多個氨基酸殘基被改變。所述變體可以具有保守型改變或非保守型改變。使用本領(lǐng) 域熟知的計算機程序,例如LASERGENE軟件(DNASTAR),可以找到確定哪些氨基酸 殘基可以被取代、插入或缺失而不影響生物活性的指導(dǎo)。
在用于多核苷酸序列的情況下,術(shù)語“變體”可以包括與基因或其編碼序列的 多核苷酸序列相關(guān)的多核苷酸序列。該定義還可以包括,例如“等位基因”變體、“剪 接”變體、“物種”變體或“多態(tài)性”變體。剪接變體可以與參考多核苷酸具有顯著的 同一性,但是由于在mRNA加工中的可選的外顯子剪接,會通常具有更多或更少的多核 苷酸數(shù)。對應(yīng)的多肽可以具有另外的功能結(jié)構(gòu)域或結(jié)構(gòu)域缺失。物種變體是在物種之間 彼此不同的多核苷酸序列。得到的多肽通常會具有顯著的相對于彼此的氨基酸同一性。 多態(tài)性變體是在給定物種的個體之間特定基因的多核苷酸序列中的變異。
如本文所用,術(shù)語“載體”是指能夠轉(zhuǎn)運另一核酸的核酸分子,所述核酸分子 連接到所述另一核酸。一種有用的載體是附加體(即能夠染色體外的復(fù)制的核酸)。有 用的載體是能夠自主復(fù)制和/或表達與其連接的核酸的那些載體。能夠指導(dǎo)基因的表達 的載體在本文被稱為“表達載體”,所述載體被可操作地連接到所述基因。通常,在重 組DNA技術(shù)中有用的表達載體經(jīng)常是“質(zhì)?!钡男问?,所述“質(zhì)?!蓖ǔJ侵冈谄漭d 體形式時不與染色體結(jié)合的環(huán)狀雙鏈DNA環(huán)。在本說明書中,因為質(zhì)粒是最通常使用的 載體形式,所以“質(zhì)?!焙汀拜d體”是交換使用的。但是,還包括發(fā)揮等同功能并隨 后至今成為本領(lǐng)域已知的表達載體的這些其他形式。
除非另外限定,本文使用的所有技術(shù)和科學(xué)術(shù)語與本發(fā)明所屬領(lǐng)域技術(shù)人員通 常理解的具有相同的意義。盡管與本文所述的那些方法和材料相似或等同的方法和材料 可以用于本發(fā)明的實踐或測試,仍然在下文描述了合適的方法和材料。本文提及的所有 出版物、專利申請、專利和其他參考資料通過引用全文并入。如有沖突,以包括定義在 內(nèi)的本說明書為準。此外,材料、方法和實施例僅是舉例說明并不意圖限制。
根據(jù)下文的詳細描述和權(quán)利要求,本發(fā)明的其他特征和優(yōu)勢會清晰。
附圖簡述
圖IA是海洋原綠球菌(Prochlorococcus marinus) CCMP1986細胞產(chǎn)生的碳氫化合 物的GC/MS追蹤。圖IB是圖IA的7.55分鐘時的峰的質(zhì)量裂解譜(mass fragmentation pattern)。
圖2A是點狀念珠藍細菌(Nostoc punctiforme)PCC73102細胞產(chǎn)生的碳氫化合物 的GC/MS追蹤。圖2B是圖2A的8.73分鐘時的峰的質(zhì)量裂解譜。
圖3A是無類囊體藍細菌(Gloeobaceter violaceus) ATCC29082細胞產(chǎn)生的碳氫化 合物的GC/MS追蹤。圖3B是圖3A的8.72分鐘時的峰的質(zhì)量裂解譜。
圖4A是集胞藍細菌Mynechocystic sp.)PCC6803細胞產(chǎn)生的碳氫化合物的GC/ MS追蹤。圖4B是圖4A的7.36分鐘時的峰的質(zhì)量裂解譜。
圖5A是集胞藍細菌Mynechocystis sp.) PCC6803野生型細胞產(chǎn)生的碳氫化合物的 GC/MS追蹤。圖5B是具有S110208和sll0209基因缺失的集胞藍細菌PCC6803細胞產(chǎn)生 的碳氫化合物的GC/MS追蹤。
圖6A是大腸桿菌MG1655野生型細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖 6B 是表達細長聚球藍細菌(Synechococcus elongatus) PCC7942YP_400611 (Synpcc7942_l5 94) (SEQ ID NO 65)的大腸桿菌MG1655細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖7 是表達藍絲 菌(Cyanothece sp.) ATCC51142 cce_1430 (ΥΡ_001802846) (SEQ ID NO 69)的大腸桿菌細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖8A 是表達細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO: 65)和細長聚球藍細菌 PCC7942YP_400610(Synpcc7942_1593) (SEQ ID NO : 1)的 大腸桿菌細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖8B描述圖8A在6.98分鐘時的峰和 十五烷的質(zhì)量裂解譜。圖8C描述圖8A在8.12分鐘時的峰和8-十七烯的質(zhì)量裂解譜。圖9 是表達細長聚球藍細菌 PCC7942YP_400611 (Synpcc7942_l 594) (SEQ ID NO: 65)和點狀念珠藍細菌 PCC73102 Npun02004178(ZP00108838) (SEQ ID NO : 5)的 大腸桿菌MG1655細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。
圖10 是表達細長聚球藍細菌 PCC7942YP_400611 (Synpcc7942_1594) (SEQ ID NO 65)和集胞藍細菌 PCC6803 sll0208 (NP 442147) (SEQ IDNO 3)的大腸桿菌 MG1655細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖11 是表達細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO 65)和念珠藍細菌(Nostoc sp.) PCC72IO alr5283 (NP 489323) (SEQ ID NO 7)的大腸 桿菌MG1655細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖12 是表達細長聚球藍細菌 PCC7942 YP_400611(Synpcc7942_1594) (SEQ ID NO 65)和密碼子優(yōu)化的海濱藍藻菌(Acaryochloris marina) MBICl 1017 AM1_4041 (YP_001518340) (SEQ ID NO 46)的大腸桿菌MG1655細胞產(chǎn)生的碳氫化合 物的GC/MS追蹤。圖13 是表達細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO: 65)和密碼子優(yōu)化的細長嗜熱聚球藍細菌(Thermosynechococcuselongatus)BP-I tlll313(NP_682103) (SEQ IDNO 47)的大腸桿菌MG1655細胞產(chǎn)生的碳氫化合物的GC/
MS追蹤。圖14 是表達細長聚球藍細菌 PCC7942 YP_400611(Synpcc7942_1594) (SEQ ID NO 65)和密碼子優(yōu)化的聚球藍細菌(Synechococcus sp.) JA-3-3AbCYA_0415 (YP_473897) (SEQ ID NO 48)的大腸桿菌 MG1655 細胞產(chǎn)生的碳氫 化合物的GC/MS追蹤。圖15 是表達細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO 65)和無類囊體藍細菌 PCC7421 gll3146 (NP 926092) (SEQ IDNO 15)的大腸桿菌 MG1655細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖16 是表達細長聚球藍細菌 PCC7942 YP_400611(Synpcc7942_1594) (SEQ ID NO 65)和密碼子優(yōu)化的海洋原綠球菌MIT9313 PMT1231 (NP895059) (SEQ ID NO 49) 的大腸桿菌MG1655細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖17 是表達細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO: 65)和海洋原綠球菌 CCMP 1986 PMM0532 (NP 892650) (SEQID NO : 19)的大腸桿 菌MG1655細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。
圖18 是表達細長聚球藍細菌 PCC7942 YP_400611(Synpcc7942_1594) (SEQ ID NO 65)和密碼子優(yōu)化的海洋原綠球菌NATL2A PMN2A_1863 (YP_293054) (SEQ ID NO: 51)的大腸桿菌MG1655細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖19 表達細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO: 65)和密碼子優(yōu)化的聚球藍細菌 RS9917 RS9917_09941(ZP_01079772) (SEQ ID NO 52)的大腸桿菌MG1655細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖20 是表達細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO 65)和密碼子優(yōu)化的聚球藍細菌 RS9917 RS9917_12945 (ΖΡ_01080370) (SEQ ID NO 53)的大腸桿菌MG1655細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖21 是表達細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO: 65)和藍絲菌 ATCC51142 cce_0778(YP_001802195) (SEQ IDNO : 27)的大腸桿菌 MG1655細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖22 是表達細長聚球藍細菌 PCC7942 YP_400611(Synpcc7942_1594) (SEQ ID NO 65)和藍絲菌 PCC7425 Cyan7425_0398 (YP_002481151) (SEQID NO 29)的大腸桿 菌MG1655細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖23 是表達細長聚球藍細菌 PCC7942 YP_400611(Synpcc7942_1594) (SEQ ID NO 65)和藍絲菌 PCC7425 Cyan7425_2986(YP_002483683) (SEQ ID NO 31)的大腸桿 菌MG1655細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖 24A 是表達海洋原綠球菌 CCMP1986PMM0533(NP_892651) (SEQ ID NO 71)的大腸桿菌MG1655細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖24B是表達海洋原 綠球菌 CCMP1986 PMM0533 (NP_892651) (SEQ ID NO 71)和海洋原綠球菌 CCMP1986 PMM0532 (NP_892650) (SEQ ID NO 19)的大腸桿菌MG1655細胞產(chǎn)生的碳氫化合物的 GC/MS追蹤。圖25A是大腸桿菌MG1655 Δ fadE lacZ::Ptrc ‘tesA-fadD細胞產(chǎn)生的碳氫化合物 的GC/MS追蹤。圖25B是表達細長聚球藍細菌PCC7942YP_400611 (Synpcc7942_1594) (SEQ ID NO 65)和海濱藍藻菌 MBIC11017AM1_4041 (YP_001518340) (SEQ ID NO 9) 的大腸桿菌MG1655 Δ fadElacZ::Ptrc ‘tesA-fadD細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖26A 是表達集胞藍細菌 PCC6803 sll0209 (NP_442146) (SEQ ID NO 67)的大腸桿菌MG1655 Δ fadE lacZ::Ptrc ‘tesA-fadD細胞產(chǎn)生的碳氫化合物的GC/MS追 蹤。圖 26B 是表達集胞藍細菌 PCC6803 sll0209 (NP_442146) (SEQ ID NO 67)和集 胞藍細菌 PCC6803 sll0208 (NP_442147) (SEQ ID NO 3)的大腸桿菌 MG1655 Δ fadE lacZ::Ptrc ‘tesA-fadD細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖27A是表達恥垢分枝桿菌(M.smegmatis)菌株MC2 155MSMEG_5739 (YP_889972) (SEQ ID NO 85)的大腸桿菌 MG1655 Δ fadElacZ::Ptrc ‘tesA-fadD細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖27B 是表達恥垢分枝桿菌菌株MC2 155 MSMEG_5739 (YP_889972) (SEQ ID NO 85)和點 狀念珠藍細菌 PCC73102 Npun02004178 (ΖΡ_00108838) (SEQ ID NO 5)的大腸桿菌 MG1655 Δ fadE lacZ::Ptrc ‘tesA-fadD細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖28是大腸桿菌MG1655 Δ fadE lacZ::Ptrc ‘tesA-fadD細胞產(chǎn)生的碳氫化合物的圖示,所述細胞單獨表達恥垢分枝桿菌菌株MC2 155MSMEG_5739(YP_889972) (SEQ ID NO 85)或表達恥垢分枝桿菌菌株 MC2 155MSMEG_5739 (YP_889972) (SEQ ID NO 85)與以下的組合念珠藍細菌PCC7120 alr5283(SEQ ID NO 7)、點狀念珠藍細菌 PCC73102Npun02004178 (SEQ ID NO 5)、海洋原綠球菌 CCMP1986PMM0532 (SEQID NO 19)、無類囊體藍細菌PCC7421 gll3146 (SEQ ID NO 15)、聚球藍細菌 RS9917_09941 (SEQ ID NO 23)、聚球藍細菌 RS9917_12945 (SEQ IDNO : 25)或海濱藍 藻菌 MBIC11017AM 1_4041 (SEQ IDNO 9)。圖29A是I型核糖核酸酶還原酶亞基β蛋白RN Ri^的三維結(jié)構(gòu)展示。圖29Β 是海洋原綠球菌ΜΙΤ9313 PMT1231 (NP_895059) (SEQ ID NO 17)的三維結(jié)構(gòu)的展示。 圖29C是海洋原綠球菌MIT9313 PMT1231 (NP_895059) (SEQ ID NO 17)的活性位點三
維結(jié)構(gòu)的展示。圖 30A 是表達點狀念珠藍細菌 PCC73102 Npun02004178 (ΖΡ_00108838) (SEQ ID NO 5)的大腸桿菌MG1655細胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖30B是表達點 狀念珠藍細菌 PCC73102Npun02004178(ZP_00108838)Y123F 變體的大腸桿菌 MG1655 細 胞產(chǎn)生的碳氫化合物的GC/MS追蹤。圖30C是表達點狀念珠藍細菌PCC73102Npun020 04178 (ΖΡ_00108838) Y126F變體的大腸桿菌MG1655細胞產(chǎn)生的碳氫化合物的GC/MS追
S示ο圖31 描述了使用點狀念珠藍細菌 PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO 6)和十八烷醛(A) ; Npun02004178(ZP_00108838) (SEQ ID NO 6)、十八烷 醛、菠菜鐵氧還蛋白還原酶和NADPH(B);十八烷醛、菠菜鐵氧還蛋白、菠菜鐵氧還蛋 白還原酶和 NADPH(C);或 Npun02004178(ZP_00108838) (SEQ ID NO 6)、菠菜鐵氧 還蛋白和菠菜鐵氧還蛋白(D),體外產(chǎn)生的碳氫化合物的GC/MS追蹤。圖32 描述了 使用點狀念珠藍細菌 PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO: 6)、NADPH、十八烷醛和(A)菠菜鐵氧還蛋白和菠菜鐵氧還蛋白還 原酶;(B)點狀念珠藍細菌 PCC73102Npun02003626 (ΖΡ_00109192) (SEQ ID NO 88)和點狀念珠藍細菌 PCC73102 Npun02001001(ZP_00111633) (SEQ ID NO: 90); (C)Npun02003626(ZP_00109192) (SEQ ID NO 88)和點狀念珠藍細菌 PCC73102 Npun02003530(ZP_00109422) (SEQ ID NO 92);或(D)Npun02003626 (ZP_00109192) (SEQ ID NO 88)和點狀念珠藍細菌 PCC73102 Npun02003123 (ZP_00109501) (SEQ ID NO 94),體外產(chǎn)生的碳氫化合物的GC/MS追蹤。圖33A是使用十八酰CoA、細長聚球藍細菌PCC7942YP_400611 (Synpcc7942 _1594) (SEQ ID NO 66)、NADH和Mg2+體外產(chǎn)生的碳氫化合物的GC/MS追蹤。圖 33B是使用十八酰CoA、細長聚球藍細菌卩07942¥ _400611(37叩(^7942_1594) (SEQ ID NO 66)、NADPH和Mg2+體外產(chǎn)生的碳氫化合物的GC/MS追蹤。圖33C是使用十八 酰 CoA、細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO 66)禾口 NADPH體外產(chǎn)生的碳氫化合物的GC/MS追蹤。圖34A是使用十八酰CoA、標記的NADPH、細長聚球藍細菌PCC7942 YP_400611 (Synpcc7942_l 594) (SEQ ID NO 66)和未標記的 NADPH 體外產(chǎn)生的碳氫 化合物的GC/MS追蹤。圖34B是使用十八酰CoA、標記的NADPH、細長聚球藍細菌PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO 66)禾Π S_(4」H)NADPH 體外產(chǎn)生 的碳氫化合物的GC/MS追蹤。圖34C是使用十八酰CoA、標記的NADPH、細長聚球 藍細菌 PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO 66)和 R-(4」H) NADPH 體 外產(chǎn)生的碳氫化合物的GC/MS追蹤。 圖35是由Che-9培養(yǎng)基中的表達細長聚球藍細菌PCC7942YP_400611 (Synpcc7 942_1594) (SEQ IDNO 65)的大腸桿菌MG1655 Δ fadE細胞所產(chǎn)生的無細胞上清中碳氫 化合物的GC/MS追蹤。圖36是由Che-9培養(yǎng)基中的表達細長聚球藍細菌PCC7942YP_400611 (Synpcc7 942_1594) (SEQ ID NO 65)和點狀念珠藍細菌 PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO 5)的大腸桿菌MG1655 Δ fadE細胞所產(chǎn)生的無細胞上清中碳氫化合物的 GC/MS追蹤。圖37 是表達念珠藍細菌 PCC7120 alr5283 (NP_489323) (SEQ IDNO 7)和念珠藍 細菌 PCC7120 alr5284 (NP_489324) (SEQ ID NO 81)的大腸桿菌 MG1655 細胞產(chǎn)生的碳 氫化合物的GC/MS追蹤。圖38是來自宏基因組數(shù)據(jù)庫的細長聚球藍細菌PCC7942YP_400610(Synpcc7942 _1593) (SEQ IDNO 1)的同系物的實例列表。圖39是來自宏基因組數(shù)據(jù)庫的細長聚球藍細菌PCC7942YP_400611 (Synpcc7942 _1594) (SEQ ID NO 65)的同系物的實例列表。圖40是鑒定出可以被表達、超表達或減弱以增加特定底物的產(chǎn)生的各種基因的表。詳細描述本發(fā)明提供了從例如酰基ACP、脂肪酸、酰基CoA、脂肪醛的底物或脂肪醇底 物(例如PCT/US08/058788中所述的,在此通過引用特別并入)產(chǎn)生醛、脂肪醇和碳氫 化合物(例如烷、烯和炔)的組合物和方法。此類醛、烷和烯作為生物燃料(例如汽油、 柴油、噴氣燃料等的替代品)、特種化學(xué)品(例如潤滑劑、燃料添加劑等)或用于后續(xù)化 學(xué)轉(zhuǎn)變(例如,燃料、聚合物、塑料、紡織品、溶劑、粘合劑等)的原料是有用的。本 發(fā)明部分地基于參與醛、烷和烯生物合成的基因的鑒定。這些烷和烯生物合成基因包括,例如細長聚球藍細菌 PCC7942Synpcc7942_1593 (SEQ ID NO 1)、集胞藍細菌 PCC6803 sll0208 (SEQ ID NO 3)、點狀念珠藍細菌 PCC73102 Npun02004178 (SEQ ID NO 5)、念珠藍細菌 PCC 7120 alr5283 (SEQ ID NO 7)、海濱藍藻菌 MBIC11017AM1_4041 (SEQ ID NO : 9)、細長 嗜熱聚球藍細菌 BP-I tlll313(SEQ ID NO : 11)、聚球藍細菌 JA-3-3A CYA_0415 (SEQ ID NO 13)、無類囊體藍細菌PCC7421 gll3146(SEQIDNO: 15)、海洋原綠球菌 MIT9313 PM 123 (SEQ ID NO 17)、狹義的海洋原綠球菌 pastoris 亞種(Prochlorococcus marinus subsp.pastoris str.) CCMP1986PMM0532 (SEQ ID NO 19)、狹義的海洋原綠球 菌(Prochlorococcus marinus str.)NATL2A PMN2A_1863 (SEQ ID NO 21)、聚球藍細 菌 RS9917 RS9917_09941 (SEQ ID NO 23)、聚球藍細菌 RS9917 RS9917_12945 (SEQ ID NO : 25)、藍絲菌 ATCC51142cce_0778(SEQ ID NO : 27)、藍絲菌 PCC7245 Cyan7425DRAFT_1220 (SEQ ID NO : 29)、藍絲菌 PCC7245 cce_0778 (SEQ ID NO 31)、多變魚腥藍細菌(Anabaena variabilis) ATCC29413 YP_323043 (Ava 2533) (SEQ ID NO 33)和細長聚球藍細菌 PCC6301 YP_170760(syc0050_d) (SEQ ID NO 35)。其他烷
和烯生物合成基因在表1和圖38中列出。 醛生物合成基因包括,例如細長聚球藍細菌PCC7942Synpcc7942_1594(SEQ ID NO 65)、集胞藍細菌 PCC6803 sll0209 (SEQ ID NO 67)、藍絲菌 ATCC51142 cce_1430 (SEQ ID NO 69)、狹義的海洋原綠球菌pastoris亞種 CCMP1986PMM0533 (SEQ ID NO 71)、無類囊體藍細菌 PCC7421 NP_96091(gll3145) (SEQ ID NO : 73)、點狀 念珠藍細菌 PCC73102 ZP_00108837(Npun02004176) (SEQIDNO: 75)、多變魚腥藍 細菌 ATCC29413 YP_323044(Ava_2534) (SEQ ID NO 77)、細長聚球藍細菌 PCC6301 YP_170761 (syc0051_d) (SEQ ID NO 79)和念珠藍絲菌 PCC7120 alr5284 (SEQ ID NO 81)。其他醛生物合成基因在表1和圖39中列出。使用本文所述的方法,使用一個或多個本文所述的醛、烷和/或烯生物合成基 因或多肽或所述基因或多肽的變體,利用宿主細胞或無細胞方法,可以制備醛、脂肪 醇、烷和烯。表1.藍細菌基因組中醛和烷生物合成基因同系物
權(quán)利要求
1.產(chǎn)生碳氫化合物的方法,所述方法包括在宿主細胞中產(chǎn)生包含SEQID NO: 2、 4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34 或 36 的氨基酸序列 的多肽或其變體,并從所述宿主細胞分離所述碳氫化合物。
2.產(chǎn)生碳氫化合物的方法,所述方法包括在宿主細胞中產(chǎn)生多肽并從所述宿主細胞 分離所述碳氫化合物,所述多肽包含與SEQ ID NO 2、4、6、8、10、12、14、16、 18、20、22、24、26、28、30、32、34或36具有至少約70%同一性的氨基酸序列。
3.產(chǎn)生碳氫化合物的方法,所述方法包括在宿主細胞中產(chǎn)生多肽,所述多肽包含具 有一個或多個氨基酸取代、添加、插入或缺失的SEQ IDNO : 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36的氨基酸序列,其中所述多肽具有 脫羰酶活性。
4.如權(quán)利要求3所述的方法,其中所述多肽包含具有一個或多個保守型氨基酸取代的 SEQ ID NO 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34 或36的氨基酸序列。
5.產(chǎn)生碳氫化合物的方法,所述方法包括在宿主細胞中表達多核苷酸并從所述宿主 細胞分離所述碳氫化合物,所述多核苷酸包含與SEQ IDNO : 1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或35具有至少約70%的序列同一性的核苷酸序列。
6.產(chǎn)生碳氫化合物的方法,所述方法包括在宿主細胞中表達多核苷酸,所述多核苷 酸與 SEQ ID NO: 1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33 或35的互補物或其片段雜交,其中所述多核苷酸編碼與包含SEQ ID NO: 2、4、6、8、 10、12、14、16、18、20、22、24、26、28、30、32、34 或 36 的多肽具有相同生物活性的多肽。
7.如權(quán)利要求1-6中任一項權(quán)利要求所述的方法,其中所述多肽或所述多核苷酸來自藍細菌。
8.產(chǎn)生碳氫化合物的方法,所述方法包括用重組載體轉(zhuǎn)化宿主細胞并從所述宿主細 胞分離所述碳氫化合物,所述重組載體包含與SEQ IDNO : 1、3、5、7、9、11、13、 15、17、19、21、23、25、27、29、31、33或35具有至少約70%的序列同一性的核苷酸序列。
9.如權(quán)利要求8所述的方法,其中所述重組載體還包含可操作地連接到所述核苷酸序 列的啟動子。
10.如權(quán)利要求1-9中任一項權(quán)利要求所述的方法,其中所述宿主細胞選自哺乳動物 細胞、植物細胞、昆蟲細胞、酵母細胞、真菌細胞、絲狀真菌細胞和細菌細胞。
11.如權(quán)利要求10所述的方法,其中所述宿主細胞是大腸桿菌細胞。
12.如權(quán)利要求11所述的方法,其中所述大腸桿菌細胞是菌株B、菌株C、菌株K或 菌株W大腸桿菌細胞。
13.如權(quán)利要求8所述的方法,其中所述宿主細胞產(chǎn)生所述重組載體的核苷酸序列所 編碼的多肽。
14.如權(quán)利要求10所述的方法,其中所述碳氫化合物由所述宿主細胞分泌。
15.如權(quán)利要求10所述的方法,其中所述碳氫化合物是烷。
16.如權(quán)利要求15所述的方法,其中所述烷包含C13-C21烷。
17.如權(quán)利要求15所述的方法,其中所述烷選自十三烷、甲基十三烷、十九烷、甲基 十九烷、十七烷、甲基十七烷、十五烷和甲基十五烷。
18.如權(quán)利要求1-14中任一項權(quán)利要求所述的方法,還包括在至少一種所述多肽或所 述核苷酸序列編碼的多肽的生物底物的存在下,培養(yǎng)所述宿主細胞。
19.如權(quán)利要求18所述的方法,其中所述底物是脂肪酸衍生物。
20.如權(quán)利要求15所述的方法,還包括在飽和脂肪酸衍生物的存在下培養(yǎng)所述宿主細胞。
21.如權(quán)利要求20所述的方法,其中所述飽和脂肪酸衍生物是C14-C22飽和脂肪酸衍 生物。
22.如權(quán)利要求20所述的方法,其中所述飽和脂肪酸衍生物選自2-甲基二十烷醛、 二十烷醛、十八烷醛、十四烷醛、2-甲基十八烷醛、硬脂醛、棕櫚醛及它們的衍生物。
23.如權(quán)利要求10所述的方法,其中所述碳氫化合物是烯。
24.如權(quán)利要求22所述的方法,其中所述烯包含C13-C21烯。
25.如權(quán)利要求22所述的方法,其中所述烯選自十五烯、十七烯、甲基十五烯和甲基 十七烯。
26.如權(quán)利要求22所述的方法,還包括在不飽和脂肪酸衍生物的存在下培養(yǎng)所述宿主 細胞。
27.如權(quán)利要求26所述的方法,其中所述不飽和脂肪酸衍生物是C14-C22不飽和脂肪 酸衍生物。
28.如權(quán)利要求26所述的方法,其中所述不飽和脂肪酸衍生物選自十八烯醛、十六烯 醛、甲基十六烯醛和甲基十八烯醛。
29.遺傳改造的微生物,其包含穩(wěn)定并入所述微生物的基因組DNA、位于多核苷酸 上游的外源控制序列,所述多核苷酸包含與SEQ IDNO : 1、3、5、7、9、11、13、15、 17、19、21、23、25、27、29、31、33或35具有至少約70 %的序列同一性的核苷酸序 列,其中所述微生物相對于野生型微生物產(chǎn)生水平增高的碳氫化合物。
30.如權(quán)利要求29所述的微生物,其中所述微生物是藍細菌。
31.產(chǎn)生碳氫化合物的方法,所述方法包括在適于基因表達的條件下培養(yǎng)權(quán)利要求29 所述的微生物。
32.通過權(quán)利要求1-28和31所述的方法的任一方法產(chǎn)生的碳氫化合物。
33.生物燃料,包含權(quán)利要求32所述的碳氫化合物。
34.如權(quán)利要求33所述的生物燃料,其中所述生物燃料是柴油、汽油或噴氣燃料。
35.如權(quán)利要求33所述的生物燃料,其中所述碳氫化合物的δ13C為約-15.4或更大。
36.如權(quán)利要求33所述的生物燃料,其中所述碳氫化合物的fM14C為至少約1.003。
37.制造碳氫化合物的方法,所述方法包括使底物與以下接觸(i)包含SEQID NO: 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30 32、34 或 36 的氨 基酸序列的多肽或其變體;(ii)與 SEQ ID NO: 1、3、5、7、9、11、13、15、17、19、 21、23、25、27、29、31、33或35具有至少70%的同一性的核苷酸序列所編碼的多肽或 其變體。
38.如權(quán)利要求37所述的方法,其中所述碳氫化合物包含C13-C21烷。
39.如權(quán)利要求37所述的方法,其中所述碳氫化合物選自十三烷、甲基十三烷、十九 烷、甲基十九烷、十七烷、甲基十七烷、十五烷和甲基十五烷。
40.如權(quán)利要求39所述的方法,其中所述底物選自2-甲基二十烷醛、二十烷醛、 十八烷醛、十四烷醛、2-甲基十八烷醛、硬脂醛、棕櫚醛及它們的衍生物。
41.如權(quán)利要求37所述的方法,其中所述碳氫化合物包含C13-C21烯。
42.如權(quán)利要求37所述的方法,其中所述碳氫化合物選自十五烯、十七烯、甲基十五 烯和甲基十七烯。
43.如權(quán)利要求42所述的方法,其中所述底物選自十八烯醛、十六烯醛、甲基十六烯 醛和甲基十八烯醛。
44.產(chǎn)生碳氫化合物的方法,所述方法包括在宿主細胞中產(chǎn)生包含以下氨基酸序列的 多肽(i)SEQ ID NO 37 或 SEQ ID NO 38 或 SEQ ID NO 39 ;或(ii)SEQ ID NO 40 以及(a) SEQ ID NO 37、 (b) SEQ ID NO 38 禾口(c) SEQ ID NO 39中的任一個;或(iii)SEQ ID NO 41 或 SEQ ID NO 42 或 SEQ ID NO 43 或 SEQ IDNO 44,其中所述多肽具有脫羰酶活性。
45.如權(quán)利要求44所述的方法,其中所述多肽來自藍細菌。
46.如權(quán)利要求44或45所述的方法,其中所述宿主細胞選自哺乳動物細胞、植物細 胞、昆蟲細胞、酵母細胞、真菌細胞、絲狀真菌細胞和細菌細胞。
47.如權(quán)利要求46所述的方法,其中所述宿主細胞是大腸桿菌細胞。
48.如權(quán)利要求44所述的方法,其中所述碳氫化合物由所述宿主細胞分泌。
49.如權(quán)利要求44所述的方法,其中所述碳氫化合物包含C13-C21烷。
50.如權(quán)利要求44所述的方法,其中所述碳氫化合物選自十三烷、甲基十三烷、十九 烷、甲基十九烷、十七烷、甲基十七烷、十五烷和甲基十五烷。
51.如權(quán)利要求44-48中任一項權(quán)利要求所述的方法,還包括在至少一種所述多肽的 生物底物的存在下,培養(yǎng)所述宿主細胞。
52.如權(quán)利要求51所述的方法,其中所述底物是脂肪酸衍生物。
53.如權(quán)利要求49所述的方法,還包括在飽和脂肪酸衍生物的存在下培養(yǎng)所述宿主細胞。
54.如權(quán)利要求53所述的方法,其中所述飽和脂肪酸衍生物選自2-甲基二十烷醛、 二十烷醛、十八烷醛、十四烷醛、2-甲基十八烷醛、硬脂醛、棕櫚醛及它們的衍生物。
55.如權(quán)利要求44所述的方法,其中所述碳氫化合物包含C13-C21烯。
56.如權(quán)利要求44所述的方法,其中所述碳氫化合物選自十五烯、十七烯、甲基十五 烯和甲基十七烯。
57.如權(quán)利要求55所述的方法,還包括在不飽和脂肪酸衍生物的存在下培養(yǎng)所述宿主 細胞。
58.如權(quán)利要求57所述的方法,其中所述不飽和脂肪酸衍生物選自十八烯醛、十六烯 醛、甲基十六烯醛和甲基十八烯醛。
59.制造碳氫化合物的方法,所述方法包括使底物與包含以下氨基酸序列的多肽接觸(i)SEQ ID NO 37 或 SEQ ID NO 38 或 SEQ ID NO 39 ;或(ii)SEQ ID NO 40 以及(a) SEQ ID NO 37、 (b) SEQ ID NO 38 禾口(c) SEQ ID NO 39中的任一個;或(iii)SEQ ID NO 41 或 SEQ ID NO 42 或 SEQ ID NO 43 或 SEQ IDNO 44,其中所述多肽具有脫羰酶活性。
60.如權(quán)利要求59所述的方法,其中所述碳氫化合物包含C13-C21烷。
61.如權(quán)利要求59所述的方法,其中所述碳氫化合物選自十三烷、甲基十三烷、十九 烷、甲基十九烷、十七烷、甲基十七烷、十五烷和甲基十五烷。
62.如權(quán)利要求59所述的方法,其中所述底物是脂肪酸衍生物。
63.如權(quán)利要求60所述的方法,其中所述底物是飽和脂肪酸衍生物。
64.如權(quán)利要求61所述的方法,其中所述底物選自2-甲基二十烷醛、二十烷醛、 十八烷醛、十四烷醛、2-甲基十八烷醛、硬脂醛、棕櫚醛及它們的衍生物。
65.如權(quán)利要求59所述的方法,其中所述碳氫化合物包含C13-C21烯。
66.如權(quán)利要求59所述的方法,其中所述碳氫化合物選自十五烯、十七烯、甲基十五 烯和甲基十七烯。
67.如權(quán)利要求65所述的方法,其中所述底物是不飽和脂肪酸底物。
68.如權(quán)利要求66所述的方法,其中所述底物選自十八烯醛、十六烯醛、甲基十六烯 醛和甲基十八烯醛。
69.分離的核酸,由SEQ ID NO: 1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或35的不多于500個核苷酸組成。
70.分離的核酸,由不多于90%的 SEQ ID NO 1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或 35 的核苷酸組成。
71.如權(quán)利要求69或70所述的核酸,其中所述核酸編碼具有脫羰酶活性的多肽。
72.分離的多肽,由SEQ ID NO: 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36的不多于200個氨基酸組成。
73.分離的多肽,由不多于90%的 SEQ IDNO 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或 36 的氨基酸組成。
74.如權(quán)利要求72或73所述的分離的多肽,其中所述多肽具有脫羰酶活性。
全文摘要
本為描述了用于產(chǎn)生諸如醛、烷和烯的碳氫化合物的組合物和方法。某些碳氫化合物可用于生物燃料。
文檔編號C12N9/88GK102027108SQ200980117663
公開日2011年4月20日 申請日期2009年5月18日 優(yōu)先權(quán)日2008年5月16日
發(fā)明者安德里亞斯·席爾默, 謝恩·布魯貝克, 馬修·路德 申請人:Ls9公司