一種預(yù)測(cè)藥物的蛋白質(zhì)相互作用靶點(diǎn)的方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于生物技術(shù)和信息技術(shù)技術(shù)領(lǐng)域,具體涉及一種預(yù)測(cè)藥物的蛋白質(zhì)相互 作用靶點(diǎn)的方法和系統(tǒng)。
【背景技術(shù)】
[0002] 系統(tǒng)生物學(xué)強(qiáng)調(diào)生物分子的協(xié)同作用在決定系統(tǒng)層面表型中的重要作用,在此 觀念的驅(qū)動(dòng)下產(chǎn)生了海量的相互作用數(shù)據(jù)。一個(gè)典型例子是通過酵母雙雜交實(shí)驗(yàn)和質(zhì)譜 實(shí)驗(yàn)生成的蛋白質(zhì)相互作用數(shù)據(jù)。相互作用的蛋白質(zhì)復(fù)合物被認(rèn)為是活體細(xì)胞生物過程 的主要實(shí)施者,功能大于單個(gè)蛋白質(zhì)的簡(jiǎn)單加和,它們是藥物進(jìn)入活體細(xì)胞后作用的主 要單元。相對(duì)于作用單個(gè)蛋白質(zhì),藥物作用到相互作用的蛋白質(zhì)復(fù)合物會(huì)產(chǎn)生更少的副 作用而且可以極大地拓寬藥物革E點(diǎn)的搜索空間(參考文獻(xiàn)Klussmann, E. and Scott, J. (2008)Protein-Protein Interactions as New Drug Targets. Springer-Verlag Berlin Heidelberg.)。這些事實(shí)使得藥物的蛋白質(zhì)相互作用靶點(diǎn)預(yù)測(cè)無論在學(xué)術(shù)領(lǐng)域還是在藥物 制造工業(yè)領(lǐng)域都受到廣泛關(guān)注。
[0003] 利用生物實(shí)驗(yàn)方法尋找藥物的蛋白質(zhì)相互作用靶點(diǎn)是很困難的,因?yàn)榈鞍踪|(zhì) 相互作用具有動(dòng)態(tài)性,隨著細(xì)胞類型和時(shí)間而變化。此外相互作用蛋白質(zhì)復(fù)合物與藥 物作用的結(jié)合位點(diǎn)也是很難檢測(cè)的(參考文獻(xiàn)Valkov E,Sharpe T,Marsh M, Greive S, Hyvoncn Μ. (2012)Targeting protein-protein interactions and fragment-based drug discovery. Topics in Current Chemistry, 317, 145 - 179)。所以研究人員開發(fā)了 若干計(jì)算方法預(yù)測(cè)藥物的蛋白質(zhì)相互作用靶點(diǎn),這為接下來的生物實(shí)驗(yàn)提供更為可靠的 實(shí)驗(yàn)候選集(參看文獻(xiàn) Neugebauer A, Hartmann R W, Klein C D. (2007) Prediction of protein-protein interaction inhibitors by chemoinformatics and machine learning methods.Journal of medicinal chemistry, 50(19):4665-4668. Voet A, Banwell E F, Sahu K K, et al. (2013)Protein interface pharmacophore mapping tools for small molecule protein:protein interaction inhibitor discovery. Current topics in medicinal chemistry, 13(9):989-1001.)。
[0004] 預(yù)測(cè)藥物蛋白質(zhì)相互作用靶點(diǎn)最初的想法是試圖找到那些結(jié)構(gòu)特異的蛋白 質(zhì)相互作用復(fù)合物,以及那些可以和該復(fù)合物結(jié)合的具有特殊結(jié)構(gòu)的小分子。為此, 研究人員通過研究實(shí)驗(yàn)證實(shí)的藥物蛋白質(zhì)相互作用靶點(diǎn),歸納總結(jié)可作用到蛋白質(zhì)相 互作用復(fù)合物的藥物的結(jié)構(gòu)特征?;谶@些共性的特征,可以從大量的化學(xué)分子中篩 選出具有特殊結(jié)構(gòu)的化合物,這些化合物可以特異性地作用到蛋白質(zhì)相互作用復(fù)合物 上,成為潛在的藥物祀點(diǎn)(參考文獻(xiàn)Christelle Reynfes, H6l6ne Host, Anne-Claude Camproux, Guillaume Laconde, Florence Leroux, Anne Mazars, Benoit Deprez, Robin Fahraeus, Bruno 0. Villoutreix, and Olivier Sperandiol. (2010)Designing focused chemical libraries enriched in protein-protein interaction inhibitors using machine-learning methods. PLoS computationalbiology, 6(3):e100 0695.) 〇 與此同 時(shí),研究人員還依據(jù)他們的發(fā)現(xiàn)構(gòu)建了使用方便的數(shù)據(jù)庫,用以存儲(chǔ)那些具有特殊分子 結(jié)構(gòu)的化合物以及和它們作用的蛋白質(zhì)相互作用復(fù)合物(參考文獻(xiàn)Labb6CM,Laconde G, Kuenemann MA, Villoutreix BO, Sperandio 0. (2013)iPPI-DB:a manually curated and interactive database of small non-peptide inhibitors of protein-protein interactions. Drug Discovery Today, 18, 958 - 968. Basse M J,Betzi S,Bourgeas R,et al. (2013)2P2Idb:a structural database dedicated to orthosteric modulation of protein - protein interactions. Nucleic acids research,2013, 41 (Dl):D824_D827.)〇 但這些研究集中于個(gè)例研究,實(shí)驗(yàn)費(fèi)用昂貴且費(fèi)時(shí)費(fèi)力。
[0005] 為了尋找可以和蛋白質(zhì)復(fù)合物結(jié)合的小分子,研究人員開發(fā)了基于蛋白質(zhì)序 列片段的計(jì)算方法。這種方法認(rèn)為藥物和蛋白質(zhì)復(fù)合物的結(jié)合主要發(fā)生在蛋白質(zhì)復(fù)合 物的結(jié)合表面上的一些高度保守的氨基酸位點(diǎn)上。因此可以通過分析蛋白質(zhì)復(fù)合物結(jié) 合表面的結(jié)構(gòu),尋找那些可以和該結(jié)構(gòu)匹配的小分子,由此確定與其結(jié)合的化合物分 子(參考文獻(xiàn) Valkov E,Sharpe T,Marsh M,Greive S, HyvfmenM. (2012) Targeting protein-protein interactions and fragment-based drug discovery. Topics in Current Chemistry, 317, 145 - 179)。該方法需要已知蛋白質(zhì)復(fù)合物的結(jié)構(gòu),然而事實(shí)上, 只有少部分蛋白質(zhì)的結(jié)構(gòu)是已知的,因此基于蛋白質(zhì)序列片段的方法只適用于小規(guī)模研 究。
[0006] 隨著高通量生物實(shí)驗(yàn)的發(fā)展,許多模式生物的蛋白質(zhì)相互作用網(wǎng)絡(luò)已知,包 括大腸桿菌、酵母、線蟲、果繩和人(參考文獻(xiàn)Butland G,Peregrin-Alvarez J M,Li J, et al. (2005)Interaction network containing conserved and essential protein complexes in Escherichia coli. Nature, 433(7025):531-537. Gavin A C, Bosche M,Krause R, et al. (2002)Functional organization of the yeast proteome by systematic analysis of protein complexes. Nature, 415 (6868) :141-147. Li S,Armstrong C M, Bertin N, et al. (2004)A map of the interactome network of the metazoan C. elegans. (2003) Science, 303 (5657) : 540-543. Giot L1Bader J S, Brouwer C, et al. (2003)A protein interaction map of Drosophila melanogaster. Science, 302 (5651):1727-1736. Rual J F1Venkatesan K, Hao T, et al. (2005)Towards a proteome-scale map of the human protein - protein interaction network. Nature, 437 (7062) : 1173-1178.)。與此同時(shí),KEGG,SuperTarget 和 DrugBank 等數(shù)據(jù)庫存 儲(chǔ)了大量實(shí)驗(yàn)獲取的藥物單個(gè)蛋白質(zhì)靶點(diǎn)數(shù)據(jù)。通過整合這些數(shù)據(jù),可以建立藥物的蛋白 質(zhì)相互作用靶點(diǎn)數(shù)據(jù)集,并通過機(jī)器學(xué)習(xí)揭示藥物和相互作用蛋白質(zhì)的結(jié)合規(guī)律,進(jìn)而建 立有效的模型預(yù)測(cè)新的藥物蛋白質(zhì)相互作用靶點(diǎn)。
[0007] 與此同時(shí),生物實(shí)驗(yàn)技術(shù)的迅速發(fā)展使得越來越多的數(shù)據(jù)可用于描述藥物的 特征。比如藥物的化合物分子結(jié)構(gòu)提供了預(yù)測(cè)藥物功能的最直接依據(jù);藥物功能注釋 系統(tǒng) Anatomical Therapeutic Chemical Classification System(ATC annotations) 描述了藥物的治療效果;藥物的副作用(side-effect)描述了藥物帶來的負(fù)面效 應(yīng),也為預(yù)測(cè)藥物靶點(diǎn)提供了重要依據(jù)(參考文獻(xiàn)Campillos M,Kuhn M,Gavin A C,et al. (2008)Drug target identification using side-effect similarity. Science, 321 (5886) :263-266.)。不同數(shù)據(jù)都從不同側(cè)面反應(yīng)藥物的功能和性質(zhì),因此不難 想象,基于數(shù)據(jù)整合的計(jì)算模型將成為藥物靶點(diǎn)預(yù)測(cè)的有效工具。
[0008] 目前的藥物蛋白質(zhì)相互作用靶點(diǎn)預(yù)測(cè)還停留在個(gè)例研究的階段。主要針對(duì)藥物的 結(jié)構(gòu)信息這一單一數(shù)據(jù)源,通過對(duì)實(shí)驗(yàn)驗(yàn)證的與蛋白質(zhì)相互作用復(fù)合物結(jié)合的藥物分子特 征進(jìn)行人工的歸納總結(jié),再擴(kuò)展到其他化合物分子,尋找那些具有特殊結(jié)構(gòu)、能夠結(jié)合蛋白 質(zhì)復(fù)合物的化合物小分子。然而,藥物與蛋白質(zhì)的作用是相互的,只有結(jié)構(gòu)特殊的蛋白質(zhì)復(fù) 合物才會(huì)有可能被藥物作用,因此預(yù)測(cè)藥物蛋白質(zhì)相互作用靶點(diǎn)理應(yīng)結(jié)合蛋白質(zhì)的信息。 除此之外,現(xiàn)有方法強(qiáng)烈依賴于蛋白質(zhì)復(fù)合物的結(jié)構(gòu)信息,而受限于小規(guī)模研究。從實(shí)用角 度講,現(xiàn)有的技術(shù)也未能將藥物蛋白質(zhì)相互作用靶點(diǎn)的檢測(cè)、建模和驗(yàn)證形成一個(gè)計(jì)算系 統(tǒng)。
【發(fā)明內(nèi)容】
[0009]