專利名稱:一種樹干畢赤酵母基因組規(guī)模代謝網絡模型構建及分析方法
技術領域:
本發(fā)明涉及ー種以整合基因組注釋技術為核心的樹干畢赤酵母基因組規(guī)模代謝網絡模型構建方法及對構建所得模型的分析方法,屬于系統(tǒng)生物學領域。
背景技術:
人類基因組計劃的完成標志著后基因組時代的到來,后基因組時代各種高通量的組學技術的發(fā)展使的生物學的研究從傳統(tǒng)的分子生物學進入到系統(tǒng)生物學時代,而基因組規(guī)模代謝網絡模型(Genome Scale Metabolic Model)無疑是研究熱點之一。繼流感嗜血桿菌基因組規(guī)模代謝網絡模型構建完成,迄今已有80多個不同物種的基因組規(guī)模代謝網絡模型被公布。基因組規(guī)模代謝網絡模型就是將細胞內所有的生化反應看作ー個整體,在 系統(tǒng)水平上研究所有參與代謝過程的基因、酶和反應物之間的相互作用。根據擬穩(wěn)態(tài)的假設,代謝網絡處于ー種瞬時平衡穩(wěn)態(tài),運用模擬算法可得到完整的細胞代謝流分布圖,掲示細胞代謝變化規(guī)律,為代謝工程改造和生理生化代謝特點解析提供依據。作為一種非傳統(tǒng)型酵母,樹干畢赤酵母(Scheffersomyces stipitis CBS6054)因其寬廣的碳源代謝能力而成為纖維素こ醇的潛在生產菌。由于自然環(huán)境的進化選擇,樹干畢赤酵母不僅可以利用葡萄糖、甘露糖、半乳糖等六碳糖,還可以發(fā)酵木糖、阿拉伯糖等釀酒酵母不能利用的五碳糖,甚至可以代謝纖維ニ糖、木聚糖等。在其已公布的全基因組測序結果中也證實了大量糖代謝相關基因的存在。此外,樹干畢赤酵母利用木糖發(fā)酵產こ醇的得率最高已達O. 47g/g木糖,并且利用樹干畢赤酵母發(fā)酵還具有營養(yǎng)要求簡單、抗污染能力強等優(yōu)點。然而,エ業(yè)化應用也存在許多不可避免的問題,如底物吸收較低,發(fā)酵こ醇需要嚴格控制溶氧水平等。因此,我們需要在系統(tǒng)層面上研究樹干畢赤酵母的代謝機理,為樹干畢赤酵母更為廣泛的應用提供一個有效的平臺。常規(guī)的基因組規(guī)模代謝網絡模型構建以公布的基因組測序結果為信息源提取具有代謝功能的基因,再整合生化數據庫信息,進而組合成能代表此微生物細胞內發(fā)生的所有己知生化反應的反應列表。本發(fā)明提出的是ー種半自動化的整合微生物基因組規(guī)模代謝網絡模型構建方法。運用此方法進行代謝網絡模型構建的優(yōu)點是更加省時、方便,且所得模型更為全面、準確。
發(fā)明內容
本發(fā)明的目的是提供ー種樹干畢赤酵母基因組規(guī)模代謝網絡模型構建及分析方法。本發(fā)明的技術方案I.基因組規(guī)模代謝網絡模型構建與分析包括全基因組注釋與粗略模型的構建、模型的精煉、數學模型的建立、模型的驗證與分析四個步驟。I)全基因組注釋與粗略模型的構建首先從Uniprot、NCBI Entre Gene或者EBI等公共數據庫平臺上下載最新的FASTA格式基因組序列,后采用多種全自動化的基因組注釋方法,包括在線數據庫 KAAS (KEGG Automatic Annotation Server)、IdentiCS、和位點特異比對(PSI-BLAST)對特定的全基因組序列進行整合注釋得到關于目的微生物全面的代謝基因信息,構建出以基因-蛋白質-反應關聯為核心的粗略代謝網絡模型。2)模型的精煉模型精煉的主要目標是通過整合生化數據庫和文獻組學的數據來建立物種特異的詳細反應列表,具體工作包括驗證補充基因-蛋白質-反應關聯信息,添加必要的運輸交換反應,文獻信息的挖掘與補充,生物量方程及能量維持反應的建立等。3)數學模型的建立將上述反應列表轉換成數學模型,其核心內容是計量系數矩陣,通常用S表示。在安裝COBRA工具箱之后,通過加載Matlab程序可將精細代謝模型轉、換成系統(tǒng)生物學語言格式的文件(SBML)后可在計算機上模擬。為使模擬結果更加接近微生物真實的代謝通常要添加一定的約束條件如代謝通量平衡(S-V = O)、熱力學平衡(ΛΕ=O)等。4)模型的驗證與分析基于約束條件的模擬優(yōu)化方法是基因組規(guī)模代謝網絡模型常用的模擬算法,而通量平衡分析(FBA Flux Balance Analysis)是Matlab平臺上最常用的算法,通過函數調用和COBRA工具箱的使用,模擬微生物在特定條件下的代謝狀況。2.樹干畢赤酵母的基因組規(guī)模代謝網絡模型?;谏鲜鲈?,構建獲得樹干畢赤酵母基因組規(guī)模代謝網絡模型iTL779,注釋出的具有代謝功能的779個基因占樹干畢赤酵母總基因的13. 2%。運用通量平衡分析方法證實模型的準確性后,運用COBRA單基因、單反應敲除程序鑒定出樹干畢赤酵母細胞生長所需的最小基因、反應集合分別為110個基因和158個反應。
圖I樹干畢赤酵母的基因組規(guī)模代謝網絡模型構建示意流程圖
具體實施例方式以下是樹干畢赤酵母的基因組規(guī)模代謝網絡模型構建、分析的實施例。實施例I樹干畢赤酵母基因組規(guī)模代謝網絡模型構建過程I)從NCBI Entre Gene數據庫中下載最新的Scheffersomyces stipitis CBS6054基因組序列,采用以下三種方法對其進行基因組注釋。①在KAAS中上傳S. stipitisFASTA格式的基因組序列,選擇與之親緣關系較近的多種菌種的數據庫進行雙向BLAST。
②IdentiCS是ー種快速的獨立基因組注釋軟件,采用簡化的兩步注釋法,用公共數據庫如UnipiOt的基因注釋信息來比對所要注釋的基因序列而鑒別出更多可能的基因編碼序列。
③PSI-BLAST是ー種利用迭代的BLAST搜索,在線提交目的微生物序列后返回與選定的在線數據庫的比對結果特點是可增加發(fā)現遠親進化關系的相似序列數目。整合三種自動化基因組注釋結果,得到樹干畢赤酵母的初始代謝反應列表。關于基因編碼的蛋白質的定位我們采用在線注釋的方法在PA-SUB和CELLO上得到細胞器定位結果,據此將模型劃分為細胞質、線粒體、過氧化物酶體和胞外四個區(qū)室。2)從KEGG, MetaCyc and PubMed等專業(yè)數據庫中以樹干畢赤酵母為關鍵詞檢索樹干畢赤酵母代謝相關信息,補充添加到粗模型中,同時從文獻和測序結果中提取生物量組成等模擬所需組分,由此得到精確的樹干畢赤酵母代謝網絡模型。3)將上述精細模型加載到Matlab,設置合適的約束條件對模型進行通量平衡分析。 表I建模過程使用的數據庫
權利要求
1.ー種以整合基因組注釋技術為核心的樹干基因組規(guī)模代謝網絡模型的構建方法,其特征在于根據公布的目的微生物的測序結果,采用多種基因組注釋技術進行全基因注釋,同時補充生化數據庫和文獻組學數據,構建具有基因-蛋白質-反應關聯的基因組規(guī)模代謝網絡模型,后使用基于Matlab平臺的COBRA工具箱對所構建的模型進行模擬驗證與分祈。
2.根據權利要求I所述,其涉及的目的微生物為ScheffersomycesstipitisCBS6054,其構建的最終模型為iTL779。
3.根據權利要求I所述,整合基因組注釋技術包括KAAS、IdentiCS和位點特異比對(PSI-BLAST)相結合的基因組序列比對方法。
4.根據權利要求I所述,補充信息來源于KEGG和MetaCyc生化數據庫及PubMed文獻組學數據。
5.根據權利要求I所述,模型證實運用通量平衡分析方法考察五種碳源對生長的影響,并與文獻實驗數據進行比較。
6.根據權利要求I所述,模型分析鑒定出維持樹干畢赤酵母細胞生長所需的最小基因、反應集合分別為110個基因和158個生化反應。
全文摘要
本發(fā)明以樹干畢赤酵母為例具體闡述了一種整合的基因組規(guī)模代謝網絡模型構建及分析方法,屬于系統(tǒng)生物學領域?;诖朔椒▽嫿ㄋ玫臉涓僧叧嘟湍富蚪M規(guī)模代謝網絡模型進行系統(tǒng)層次的細胞生長模擬和最小基因、反應集合的鑒別,為全面理解樹干畢赤酵母的代謝特征和機理提供了重要的平臺。
文檔編號G09B19/12GK102663924SQ20121009773
公開日2012年9月12日 申請日期2012年4月6日 優(yōu)先權日2012年4月6日
發(fā)明者劉婷, 劉立明, 徐楠 申請人:江南大學