一種藥物基因靶點(diǎn)預(yù)測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及藥物基因組學(xué)和計(jì)算生物學(xué)領(lǐng)域,具體設(shè)及一種藥物基因祀點(diǎn)預(yù)測(cè)方 法。
【背景技術(shù)】
[0002] 藥物基因組學(xué)是后基因組時(shí)代最重要的科學(xué)研究方向之一,是藥物功能研究、 藥物祀點(diǎn)設(shè)計(jì)、研究藥物基因互作和探索現(xiàn)有祀向藥物機(jī)制的有效方法。藥物基因組 學(xué)是功能基因組學(xué)與分子藥理學(xué)的有機(jī)結(jié)合,并區(qū)別于一般意義上的基因?qū)W,它不是 W發(fā)現(xiàn)人類(lèi)基因?yàn)橹饕康?,而是相?duì)簡(jiǎn)單地運(yùn)用已知的基因理論改善病人的治療, W藥物效應(yīng)及安全性為目標(biāo),研究各種基因突變與藥效及安全性的關(guān)系。正因?yàn)樗幬?基因組學(xué)是研究基因序列變異及其對(duì)藥物不同反應(yīng)的科學(xué),所W它是研究高效、特效 藥物的重要途徑(Pharmaco邑enemies of Hypertension and Heart Disease. Arwood MJl,化vallari LH, Duarte JD.Qirr Hype;rtens Rep. 2015Sep;17(9):586. doi: 10. 1007/ S11906-015-0586-5.)〇
[0003] 精準(zhǔn)醫(yī)療(PrecisionMedicine)是W個(gè)體化醫(yī)療為基礎(chǔ)、隨著基因組測(cè)序技術(shù)快 速進(jìn)步W及生物信息與大數(shù)據(jù)科學(xué)的交叉應(yīng)用而發(fā)展起來(lái)的新型醫(yī)學(xué)概念與醫(yī)療模式。其 本質(zhì)是通過(guò)基因組、蛋白質(zhì)組等組學(xué)技術(shù)和醫(yī)學(xué)前沿技術(shù),對(duì)于大樣本人群與特定疾病類(lèi) 型進(jìn)行生物標(biāo)記物的分析與鑒定、驗(yàn)證與應(yīng)用,從而精確尋找到疾病的原因和治療的祀點(diǎn), 并對(duì)一種疾病不同狀態(tài)和過(guò)程進(jìn)行精確分類(lèi),最終實(shí)現(xiàn)對(duì)于疾病和特定患者進(jìn)行個(gè)性化精 準(zhǔn)治療的目的,提高疾病診治與預(yù)防的效益。
[0004] 祀向藥物的研發(fā)是精準(zhǔn)醫(yī)療的重要組成部分。實(shí)現(xiàn)精準(zhǔn)醫(yī)療的基礎(chǔ)是合理利用 已經(jīng)有效整合的海量組學(xué)數(shù)據(jù);同樣,祀向藥物的研發(fā),第一步需要對(duì)現(xiàn)有的藥物基因組 數(shù)據(jù)庫(kù)進(jìn)行有效的整合并從中進(jìn)行數(shù)據(jù)挖掘。當(dāng)前,世界上的權(quán)威藥物基因組數(shù)據(jù)庫(kù)有 Dru濁anKHierapeutic Target Dat油ase和地armG邸等。Dru濁ank,是目前世界上最大 的藥物數(shù)據(jù)庫(kù),由加拿大阿爾伯塔大學(xué)的科研工作者建立并負(fù)責(zé)維護(hù),其收錄了3000多種 祀向藥物品牌名、化學(xué)結(jié)構(gòu)、蛋白和DNA序列、藥理學(xué)、毒理學(xué)和病理學(xué)等80多個(gè)方面的信 息,此外還收錄了4100種已經(jīng)獲準(zhǔn)或?qū)嶒?yàn)中藥物的相關(guān)信息值ru濁ank:a comprehensive resource for in silico drug discovery and exploration. Wishart DS,Knox C, Guo AC, Shrivastava S, Hassanali M, Stothard P, Chang Z,Woolsey J.Nucleic Acids Res. 2006 Jan 1;;34值at油ase issue):D668_72. Dru濁ank 4. 0:shedding new li曲t on drug metabolism. Law V,Knox C, Djoumbou Y, Jewison T, Guo AC, Liu Y, Maciejewski A, Arndt D, Wilson M, Neveu V, Tang A, Gabriel G, Ly C, Adamjee S, Dame ZT, Han B,Zhou Y, Wishart DS.Nucleic Acids Res.2014 Jan l;42(l):D1091-7.)。Dru濁ank最大的特 色是它支持全面而復(fù)雜的捜索,結(jié)合化u濁ank可視化軟件,能讓科研工作者們非常容易的 檢索到新的藥物祀點(diǎn)、比較藥物結(jié)構(gòu)、研究藥物機(jī)制W及探索新型藥物。舉個(gè)例子,如果 有人得到了一種新病毒或致病菌的序列,他就可W利用化U濁ank檢索運(yùn)些病毒或病菌上 可能的蛋白質(zhì)祀點(diǎn)和作用于運(yùn)些祀點(diǎn)的藥物,運(yùn)就為醫(yī)療和藥物開(kāi)發(fā)帶來(lái)了極大的便利。 化erapeuticTargetDat油ase,由新加坡國(guó)立大學(xué)的科研工作者建立并負(fù)責(zé)維護(hù),該數(shù)據(jù) 庫(kù)提供了已知或正在探索的可用作治療的蛋白質(zhì)祀點(diǎn)和核巧酸祀點(diǎn)的信息,化及與運(yùn)些祀 點(diǎn)對(duì)應(yīng)的祀疾病、祀通路和相應(yīng)的藥物/配體信息,還包含運(yùn)些祀點(diǎn)在其他數(shù)據(jù)庫(kù)中的相 關(guān)鏈接,包括祀點(diǎn)的功能、序列、3D結(jié)構(gòu)、配體結(jié)合性質(zhì)、酶的命名W及相關(guān)文獻(xiàn)等信息的 鏈接。目前,此數(shù)據(jù)庫(kù)中包含1174個(gè)祀點(diǎn)W及1251個(gè)藥物/配體(化enX,JiZL^en YZ.TTD:l'herapeuticTargetDat油ase.NucleicAcidsRes. 30(1) :412-415, 2002.Zhu F,ShiZ,QinC,TaoL,LiuX,XuF,ZhangL,SongY,LiuXH,ZhangJX,HanBC,Zhang P,ChenYZ.Therapeutictargetdatabaseupdate2012:aresourceforfacilitating target-orienteddrugdiscovery.NucleicAcidsRes. 40Ol):D1128-1136, 2012.)D pharmGKB,全稱為T(mén)hePharmacogenetics&Pharmacogenomicsknowledgebase,是一個(gè)遺 傳藥理學(xué)和基因組藥理學(xué)數(shù)據(jù)庫(kù),同時(shí)也是對(duì)人類(lèi)個(gè)體基因中存在的差異如何導(dǎo)致個(gè)體對(duì) 藥物反應(yīng)差異進(jìn)行研究的研究聯(lián)盟,包含有15188個(gè)基因與4654種藥物和4067種疾病 的相互作用資料(M.怖id-Carrillo,E.M.McDona曲,J.M.Hebert,L.Gong,K.Sangkuhl,C. F.Thorn,R.B.AltmanandT.E.Klein."PharmacogenomicsKnowledgeforPersonalized Medicine"Clinical化a;rmacology&Therapeutics(2012)92(4) :414-417.)。該數(shù)據(jù)庫(kù)由 NIH/NIGMS遺傳藥理學(xué)研究網(wǎng)絡(luò)和數(shù)據(jù)庫(kù)支持。
[0005] 近年來(lái),聚類(lèi)算法被越來(lái)越多地應(yīng)用于藥物基因祀點(diǎn)的預(yù)測(cè),常見(jiàn)的聚類(lèi)算法有 MC0DE算法和M化算法。
[0006] MC0DE算法,英文全稱為MolecularComplexDetection,中文名稱為分子復(fù)合物 檢測(cè),是針對(duì)檢測(cè)蛋白質(zhì)網(wǎng)絡(luò)中的蛋白質(zhì)復(fù)合體而提出的一種聚類(lèi)算法,它主要包括W下3 個(gè)步驟:節(jié)點(diǎn)賦權(quán)重、模塊預(yù)測(cè)W及可選的后期處理操作。該算法首先計(jì)算每個(gè)結(jié)點(diǎn)的密度 (密度根據(jù)該節(jié)點(diǎn)W及其鄰接點(diǎn)組成的子圖的密度計(jì)算),再根據(jù)設(shè)定的結(jié)點(diǎn)的度和密度 W及遍歷深度等參數(shù)對(duì)網(wǎng)絡(luò)圖進(jìn)行深度遍歷找到符合條件的子圖,其中一個(gè)網(wǎng)絡(luò)圖中的一 個(gè)結(jié)點(diǎn)代表一種事物,兩個(gè)結(jié)點(diǎn)之間的邊代表兩個(gè)結(jié)點(diǎn)所代表的事物之間的聯(lián)系。MC0DE算 法可W用來(lái)發(fā)現(xiàn)網(wǎng)絡(luò)圖中的稠密子圖,一個(gè)稠密子圖代表運(yùn)些結(jié)點(diǎn)之間具有密切的聯(lián)系, 預(yù)示運(yùn)些結(jié)點(diǎn)所代表的事物之間可能存在某些尚未被發(fā)現(xiàn)的關(guān)聯(lián)(Anautomatedmethod forfindingmolecularcomplexesinlargeproteininteractionnetworks.GaryD Baderand化ristopherWV化gue),同時(shí),該算法始終根據(jù)結(jié)點(diǎn)的度進(jìn)行聚類(lèi)操作,所W對(duì) 網(wǎng)絡(luò)圖中的邊的變動(dòng)較為敏感。此外,MC0呢算法不適用于帶權(quán)網(wǎng)絡(luò)圖。
[0007] M化算法,英文全稱為MarkovClusterAlgorithm,中文名稱為馬爾可夫算法, 是一種快速、簡(jiǎn)單、易擴(kuò)展的聚類(lèi)算法,它可W應(yīng)用于有權(quán)有向圖,核屯、思想為模擬圖中的 隨機(jī)游走過(guò)程,其理論基礎(chǔ)是:如果一個(gè)網(wǎng)絡(luò)圖中存在多個(gè)聚類(lèi)簇,那么一個(gè)聚類(lèi)簇中的 邊(事物與事物的聯(lián)系)會(huì)相對(duì)較多,而聚類(lèi)簇之間的邊會(huì)比較少,運(yùn)就意味著如果從一 個(gè)結(jié)點(diǎn)開(kāi)始隨機(jī)地訪問(wèn)一個(gè)它的鄰接點(diǎn),則它更傾向于訪問(wèn)一個(gè)與它同屬于一個(gè)聚類(lèi)簇 的令陶點(diǎn)度roheeS,v曰nHe1denJ(2006)Ev曰lu曰tionofclustering曰Igorithmsfor protein-proteininteractionnetworks.BMCBioinformatics7:488.)。MCL算法從網(wǎng) 絡(luò)圖的鄰接矩陣經(jīng)過(guò)反復(fù)對(duì)矩陣執(zhí)行normalization,inflation,expansion等操作使矩 陣達(dá)到最終的穩(wěn)定狀態(tài)。所W相對(duì)于MC0DE算法,該算法對(duì)網(wǎng)絡(luò)圖的邊的變動(dòng)相對(duì)不為敏 感。此外,MCL算法既可用于不帶權(quán)網(wǎng)絡(luò)圖,也可用于帶權(quán)網(wǎng)絡(luò)圖。
[0008] MC0DE算法與M化算法都可W只依據(jù)網(wǎng)絡(luò)圖中結(jié)點(diǎn)的度進(jìn)行聚類(lèi),所W本發(fā)明設(shè) 及到了運(yùn)兩種算法并對(duì)MC0DE算法進(jìn)行了改進(jìn)。
【