獲得改善的治療性配體的制作方法
【專利說明】獲得改善的治療性配體
[0001] 本發(fā)明涉及獲得改善的治療性配體,特別是通過確定現(xiàn)有或候選配體可如何被修 飾以改善該配體在靶蛋白質(zhì)上的結(jié)合位點(diǎn)處的結(jié)合或者通過幫助將作為前體的候選配體 從頭設(shè)計(jì)成治療劑來(lái)獲得。
[0002] 治療性分子(配體)分成2種不同的類別:化學(xué)實(shí)體(或新型化學(xué)實(shí)體,NCE)和生 物制品。前者為低分子量有機(jī)化合物,其分子量通常為500道爾頓或更低,并且是化學(xué)合成 的或分離自天然產(chǎn)物。這些化合物通常衍生自通過篩選化學(xué)或天然產(chǎn)物文庫(kù)而發(fā)現(xiàn)的起始 化學(xué)物質(zhì)或"苗頭化合物"。這樣的苗頭化合物通常對(duì)靶具有亞最佳的結(jié)合親和性,并且需 要在化學(xué)修飾中大量的反復(fù)試驗(yàn)以獲得針對(duì)靶的較好的親和性(通常具有低微摩爾或更 低的親和常數(shù)(K d))。優(yōu)選的是,苗頭化合物具有較低的分子量(例如,300道爾頓或更低), 以便隨后的化學(xué)修飾不會(huì)超過500道爾頓的界限。這些苗頭化合物通常被稱為"片段"。用 以獲得候選治療性分子或前導(dǎo)分子的苗頭化合物優(yōu)化通過結(jié)構(gòu)信息而大幅增強(qiáng);例如通過 獲得與苗頭分子或片段共復(fù)合的蛋白質(zhì)的X射線晶體結(jié)構(gòu)。這樣的數(shù)據(jù)提供了對(duì)于小分子 在靶蛋白質(zhì)上的結(jié)合位置的洞察,并且重要的是表明了該兩者之間的原子相互作用如何導(dǎo) 致結(jié)合。此外,揭示了緊緊圍繞所結(jié)合的苗頭化合物的蛋白質(zhì)表面的拓?fù)湫再|(zhì);具體而言, 如果其為裂溝或口袋,則該結(jié)構(gòu)將表明所述苗頭化合物可如何經(jīng)過精細(xì)的加工以更好地填 充口袋內(nèi)的空間以及如何與蛋白質(zhì)進(jìn)一步相互作用并由此改善結(jié)合親和性和特異性。
[0003] 有大量的基于計(jì)算機(jī)的算法可以用來(lái)幫助醫(yī)藥藥劑師對(duì)苗頭化合物的化學(xué)精細(xì) 加工進(jìn)行合理的選擇。這些是基于物理學(xué)的方法(其試圖根據(jù)第一原理來(lái)計(jì)算小分子與蛋 白質(zhì)之間的結(jié)合自由能)(例如Schrodinger(RTM)軟件套件)或統(tǒng)計(jì)勢(shì)方法(其依賴于從 蛋白質(zhì)-小分子結(jié)構(gòu)的集合提取的原子相互作用的數(shù)據(jù)庫(kù))(例如SuperStar)。
[0004] 生物制品為大的肽或蛋白質(zhì)分子(其分子量超過1000道爾頓)。它們通常為識(shí)別 并結(jié)合靶分子的抗體或抗體樣分子,其通常具有比NCE更好的親和性和特異性(低納摩爾 或更低的K d)。它們還可以為其它類型的蛋白質(zhì)分子,例如激素、細(xì)胞因子、生長(zhǎng)因子或可溶 性受體。
[0005] 候選生物治療性分子與結(jié)合位點(diǎn)的結(jié)合可以通過使該候選治療性分子突變來(lái)修 飾。這可被需要來(lái)改善結(jié)合親和性或改變結(jié)合特異性。然而,實(shí)施突變以及檢驗(yàn)突變分子 的結(jié)合效率是相對(duì)耗時(shí)的。在得到結(jié)合效率的改善之前可能需要許多不同的突變。
[0006] 已知使用計(jì)算機(jī)來(lái)預(yù)測(cè)可能是最有效的修飾類型。然而,給定的分子可以以巨大 量的方式修飾,并且難以配置計(jì)算機(jī)以使得預(yù)測(cè)可以在實(shí)用的時(shí)間段內(nèi)可靠地實(shí)現(xiàn)。
[0007] Laskowski R A, Thornton J M,Humblet C&Singh J (1996) "X-SITE: use of empirically derived atomic packing preferences to identify favourable interaction regions in the binding sites of proteins",Journal of Molecular Biology, 259, 175-201公開了基于計(jì)算機(jī)的方法,其用于鑒定針對(duì)蛋白質(zhì)表面上(例 如在二聚體界面上或在分子識(shí)別或結(jié)合位點(diǎn)上)不同原子類型的有利相互作用區(qū)域。 Laskowski等人的預(yù)測(cè)基于關(guān)于在高分辨率蛋白質(zhì)結(jié)構(gòu)中所觀察到的非鍵合的分子內(nèi)接觸 的經(jīng)驗(yàn)數(shù)據(jù)的數(shù)據(jù)庫(kù)。
[0008] 在Laskowski等人的方法中,20種氨基酸被打碎以產(chǎn)生總計(jì)488種可能的3原子 片段。考慮到化學(xué)相似性,這些片段減少至一組163種片段類型(其將數(shù)據(jù)庫(kù)細(xì)分)。每個(gè) 片段均包含第一原子(被稱為"位置3"),其與2個(gè)其它原子定義了三角測(cè)量(或空間標(biāo)準(zhǔn) 化)位置。通過記錄其中原子(其可被稱為"第二原子")被發(fā)現(xiàn)與3原子片段中的第一原 子形成非鍵合分子內(nèi)接觸的各個(gè)位置而衍生密度函數(shù)。
[0009] Laskowski等人通過將密度函數(shù)植入結(jié)合位點(diǎn)而獲得針對(duì)給定原子類型的預(yù)測(cè)的 有利相互作用區(qū)域。植入各密度函數(shù)以使得與密度函數(shù)相應(yīng)的3原子片段的3個(gè)原子的坐 標(biāo)被迭加至結(jié)合位點(diǎn)中相應(yīng)的3原子片段的坐標(biāo)上。當(dāng)來(lái)自結(jié)合位點(diǎn)中不同的3原子片段 的密度函數(shù)重疊時(shí),使用平均"密度"來(lái)預(yù)測(cè)有利的相互作用區(qū)域。
[0010] Laskowski等人的方法是相對(duì)復(fù)雜的,并丟棄了潛在有用的數(shù)據(jù)。Laskowski等人 通過利用針對(duì)各片段類型的第二原子接觸的位置填充3D網(wǎng)格來(lái)獲得密度函數(shù)。不同的網(wǎng) 格用于163種片段類型的每一種。然后,將各第二原子類型的數(shù)據(jù)進(jìn)行數(shù)學(xué)轉(zhuǎn)換以給出密 度函數(shù)。通過使用Laskowski等人的片段定義,片段類型可以由相同殘基上的不同原子和 由不同殘基上的原子所共有。當(dāng)Laskowski等人的數(shù)據(jù)庫(kù)在這些片段類型上建立時(shí),存在 主鏈片段過剩,這需要在將密度函數(shù)植入結(jié)合位點(diǎn)的階段進(jìn)行權(quán)重下調(diào)。此外,給定的片段 類型可包括數(shù)個(gè)實(shí)際片段,其在鍵長(zhǎng)和鍵角中具有微小差異、以及在第二原子分布中具有 伴隨差異,當(dāng)在這些標(biāo)度(division)中結(jié)合時(shí),這些差異將被掩蓋。
[0011] Laskowski等人用于獲得經(jīng)驗(yàn)數(shù)據(jù)的蛋白質(zhì)短程二級(jí)結(jié)構(gòu)可導(dǎo)致偏倚并降低經(jīng)驗(yàn) 數(shù)據(jù)指示有利相互作用區(qū)域的效率。
[0012] 本發(fā)明的目的是解決上文討論的現(xiàn)有技術(shù)的至少一個(gè)問題。
[0013] 根據(jù)本發(fā)明的方面,提供了用于從頭設(shè)計(jì)將與大分子靶的結(jié)合位點(diǎn)結(jié)合的配體或 者鑒定用于改善配體對(duì)大分子靶的結(jié)合位點(diǎn)的親和性的配體修飾的方法,其包括:
[0014] a)鑒定形成靶結(jié)合位點(diǎn)的表面的原子的靶列表;
[0015] b)將靶列表中的各原子(下文被稱為Θ原子)鑒定為特定的Θ原子類型;
[0016] c)從生物大分子的結(jié)構(gòu)數(shù)據(jù)庫(kù)中提取關(guān)于非鍵合的分子內(nèi)或分子間原子與原子 接觸的信息,其中原子的接觸對(duì)中的第一原子為特定的Θ原子類型,并且該接觸對(duì)中相對(duì) 的第二原子(下文被稱為t原子)為特定的t原子類型,所述信息包括關(guān)于t原子相對(duì) 于Θ原子的空間和/或上下文數(shù)據(jù),并且針對(duì)給定Θ原子類型的多個(gè)接觸從所述數(shù)據(jù)庫(kù) 收集的所述數(shù)據(jù)在下文中被稱為Θ接觸集;
[0017] d)對(duì)于在步驟b)中在靶列表中鑒定的每個(gè)Θ原子,根據(jù)在步驟c)中提取的相應(yīng) Θ接觸集,將關(guān)于給定t原子類型或預(yù)定的相關(guān)t原子類型組的數(shù)據(jù)在靶結(jié)合位點(diǎn)中或 其周圍進(jìn)行迭加;
[0018] e)以預(yù)測(cè)結(jié)合位點(diǎn)的一個(gè)或多個(gè)有利區(qū)域的方式組合和/或解析迭加的數(shù)據(jù),在 所述有利區(qū)域中給定的I原子類型或預(yù)定的相關(guān)I原子類型組具有高的理論傾向性;以 及
[0019] f)通過使用理論上對(duì)接至結(jié)合位點(diǎn)中的候選配體,將候選配體的一個(gè)或多個(gè)原子 的類型和位置與針對(duì)各自t原子類型所預(yù)測(cè)的有利區(qū)域相比較,以就備選的和/或額外的 候選配體原子而言鑒定候選配體的修飾,所述修飾將在備選的和/或額外的候選配體原子 與各自I原子類型有利區(qū)域之間產(chǎn)生更大的交叉,從而使得修飾的候選配體對(duì)結(jié)合位點(diǎn) 的親和性相較于未修飾的候選配體得到改善;
[0020] 其中數(shù)據(jù)庫(kù)中的每個(gè)非鍵合的分子內(nèi)或分子間接觸被定義為蛋白質(zhì)折疊的相對(duì) 殘基之間或者大分子折疊的相對(duì)單體單元之間或者2個(gè)相互作用的大分子伴侶之間的接 觸,并且特別是折疊的一側(cè)上或第一相互作用伴侶上的Θ原子與相對(duì)一側(cè)上或第二相互 作用伴侶上的I原子之間的接觸;在該情形中,滿足以下條件:
[0021 ] S-Rw彡t,其中s為所述接觸的2個(gè)原子之間的間隔,Rw為所述接觸的2個(gè)原子 的范德華半徑的總和,而t為預(yù)定的閾值距離;以及
[0022] 其中在步驟b)中獨(dú)特地鑒定Θ原子類型,使得在針對(duì)給定的Θ原子類型在步驟 c)中提取的Θ接觸集的數(shù)據(jù)與針對(duì)任何其它Θ原子類型在步驟c)中提取的任何其它Θ 接觸集的數(shù)據(jù)之間不存在交叉,除了關(guān)于涉及作為I原子的給定Θ原子的接觸的數(shù)據(jù)以 外。
[0023] 因此,結(jié)合位點(diǎn)中的各靶原子類型被獨(dú)特地分類,并且與關(guān)于從結(jié)構(gòu)數(shù)據(jù)庫(kù)提取 的接觸集(其是獨(dú)特的,并且不與與任何其它原子類型有關(guān)的接觸集重疊,除了涉及本身 作為I原子的靶原子類型的那些接觸以外)的信息有關(guān)。這意味著基于結(jié)合位點(diǎn)中的一 個(gè)靶原子測(cè)定的針對(duì)給定I原子類型或預(yù)定的相關(guān)I原子類型組的理論位置的分布可以 更有效地(例如不進(jìn)行加權(quán))與基于結(jié)合位點(diǎn)中的另一個(gè)靶原子測(cè)定的針對(duì)I原子類型 或預(yù)定的相關(guān)I原子類型組的理論位置的分布結(jié)合(例如通過總和),例如以提供針對(duì)I 原子類型或預(yù)定的相關(guān)I原子類型組的一個(gè)或多個(gè)有利區(qū)域的改善的預(yù)測(cè)。并且由于結(jié) 合位點(diǎn)中的各靶原子被獨(dú)特地分類,故不存在要考慮的鍵長(zhǎng)或鍵角變化,因此給定I原子 的理論位置更精確。
[0024] 在實(shí)施方案中,利用簡(jiǎn)單的規(guī)則來(lái)為三角測(cè)量的目的獨(dú)特地鑒定相鄰的原子。不 需要關(guān)于相鄰原子的化學(xué)性質(zhì)進(jìn)行假設(shè),這例如在根據(jù)Laskowski等人的163個(gè)3原子片 段類型來(lái)表征接觸類型時(shí)是必需的。
[0025] 在實(shí)施方案中,在步驟c)中提取的空間數(shù)據(jù)通過幾何參照Θ原子的位置和第三 及第四原子的位置而定義了 Θ接觸集中指定的各t原子的位置,其中第三原子與Θ原子 共價(jià)鍵合,并且第四原子與第三原子共價(jià)鍵合。在這樣的實(shí)施方案的實(shí)例中,對(duì)于Θ接觸 集中指定的各個(gè)I原子,在步驟c)中提取的所述空間數(shù)據(jù)還通過幾何參照Θ原子的位置 和第三及第四原子的位置而定義了第五和第六原子的位置,其中第五原子與I原子共價(jià) 鍵合,并且第六原子與第五原子或I原子共價(jià)鍵合。
[0026] 在實(shí)施方案中,步驟d)的靶位點(diǎn)中或其周圍的迭加包括:解析Θ接觸集以提取針 對(duì)包含給定的I原子類型或一種或多種預(yù)定的相關(guān)I原子類型組的接觸的空間數(shù)據(jù);和 標(biāo)繪此空間數(shù)據(jù)以測(cè)定理論位置,其代表了其中如果:i)該接觸的Θ原子定位于靶結(jié)合位 點(diǎn)中的相應(yīng)Θ原子的位置;以及ii)該接觸的第三和第四原子定位于靶結(jié)合位點(diǎn)中的相應(yīng) Θ原子的第三和第四原子的位置,則各t原子類型或一種或多種預(yù)定的相關(guān)t原子類型 組的每一種會(huì)定位于的位置。在實(shí)施方案中,在標(biāo)繪步驟之前針對(duì)上下文數(shù)據(jù)對(duì)空間數(shù)據(jù) 進(jìn)行解析。
[0027] 在實(shí)施方案中,其中針對(duì)t原子類型(或者一種或多種預(yù)定的相關(guān)t原子類型 組)的理論位置的密度高于預(yù)定閾值的區(qū)域被鑒定為有利區(qū)域之一。在這樣的實(shí)施方案的 實(shí)例中,針對(duì)靶列表上的多個(gè)Θ原子測(cè)定針對(duì)給定t原子類型或一種或多種預(yù)定的相關(guān) I原子類型組的理論位置,并且其中累積理論位置的密度高于預(yù)定閾值的區(qū)域被鑒定為有 利區(qū)域之一。
[0028] 因此,將來(lái)自結(jié)合位點(diǎn)中不同原子的理論位置累積結(jié)合起來(lái),隨后為預(yù)測(cè)有利區(qū) 域的目的獲得理論位置的密度。這導(dǎo)致更準(zhǔn)確地統(tǒng)計(jì)學(xué)表示給定I原子類型或在相關(guān)I 原子類型的給定組中,位于給定位置處的概率,因?yàn)槠湟猿杀壤覠o(wú)偏的方式考慮了結(jié)合 位點(diǎn)所有相關(guān)原子類型的貢獻(xiàn)。相反,在Laskowski等人的方法中,密度函數(shù)衍生自3原子 片段的組。每個(gè)原子可以與幾個(gè)不同的3原子片段組關(guān)聯(lián),因此不可能簡(jiǎn)單地以與本發(fā)明 的實(shí)施方案相當(dāng)?shù)姆绞綄⒚芏群瘮?shù)加算在一起。實(shí)際上,在組合密度函數(shù)之前必須進(jìn)行加 權(quán)和/或平均,這增加了復(fù)雜性和/或降低了準(zhǔn)確性。
[0029] 在實(shí)施方案中,僅將彼此間隔4個(gè)或更多殘基的原子之間的接觸用于鑒定有利區(qū) 域。這顯著減少或避免了由于短程二級(jí)結(jié)構(gòu)所導(dǎo)致的偏倚。在實(shí)施方案中,接觸數(shù)據(jù)主要 代表了遠(yuǎn)程的交叉折疊的蛋白質(zhì)數(shù)據(jù)。
[0030] 根據(jù)本發(fā)明的另一個(gè)方面,提供了生成數(shù)據(jù)庫(kù)的方法,所述數(shù)據(jù)庫(kù)用于從頭設(shè)計(jì) 將與大分子靶的結(jié)合位點(diǎn)結(jié)合的配體或者鑒定用于改善配體對(duì)大分子靶的結(jié)合位點(diǎn)的親 和性的配體修飾的方法,所述生成數(shù)據(jù)庫(kù)的方法包括:
[0031] 分析多個(gè)蛋白質(zhì)或其它生物學(xué)大分子的每一個(gè)中原子的相對(duì)位置,以鑒定所述蛋 白質(zhì)或大分子的第一原子(被稱為Θ原子)與第二原子(被稱為t原子)之間的非鍵合 分子內(nèi)接觸的情形;以及
[0032] 生成數(shù)據(jù)庫(kù),對(duì)于各個(gè)鑒定的接觸,所述數(shù)據(jù)庫(kù)指定:Θ原子的類型,t原子的類 型,以及I原子相對(duì)于Θ原子的位置;
[0033] 其中非鍵合的分子內(nèi)接觸被定義為滿足以下條件的情形:
[0034] S-Rw < t,其中s為Θ原子和I原子之間的間隔,Rw為Θ原子和I原子的范 德華半徑的總和,而t為預(yù)定的閾值距離,其通常為2. 5埃,優(yōu)選為0. 8埃;以及
[0035] 其中在蛋白質(zhì)的情況下,Θ原子和t原子在線性多肽上彼此間隔至少4個(gè)殘基 的氨基酸殘基上,或者在分開的多肽鏈上。
[0036] 根據(jù)本發(fā)明的另一個(gè)方面,提供了生成數(shù)據(jù)庫(kù)的方法,所述數(shù)據(jù)庫(kù)用于從頭設(shè)計(jì) 將與大分子靶的結(jié)合位點(diǎn)結(jié)合的配體或者鑒定用于改善配體對(duì)大分子靶的結(jié)合位點(diǎn)的親 和性的配體修飾的方法,所述生成數(shù)據(jù)庫(kù)的方法包括:
[0037] 分析多個(gè)蛋白質(zhì)或其它生物學(xué)大分子的每一個(gè)中原子的相對(duì)位置,以鑒定所述蛋 白質(zhì)或大分子的第一原子(被稱為Θ原子)與第二原子(被稱為t原子)之間的非鍵合 分子內(nèi)接觸的情形;以及
[0038] 生成數(shù)據(jù)庫(kù),對(duì)于各個(gè)鑒定的接觸,所述數(shù)據(jù)庫(kù)指定:Θ原子的類型,t原子的類 型,以及I原子相對(duì)于Θ原子的位置;
[0039] 生成數(shù)據(jù)庫(kù),對(duì)于各個(gè)鑒定的接觸而言,數(shù)據(jù)庫(kù)指定:θ原子的類型,t原子的類 型,以及I原子相對(duì)于Θ原子的位置;
[0040] 其中非鍵合的分子內(nèi)接觸被定義為滿足以下條件的情形:
[0041] s-Rw < t,其中s為Θ原子和I原子之間的間隔,Rw為Θ原子和I原子的范 德華半徑的總和,而t為預(yù)定的閾值距離,其通常為2. 5埃,優(yōu)選為0. 8埃;以及
[0042] 其中該方法包括將數(shù)據(jù)庫(kù)細(xì)分以形成鑒定的接觸的組,其中Θ原子為蛋白質(zhì)的 20種天然氨基酸中存在的167種非氫原子的一種且僅一種,并且t原子在通過基于化學(xué)相 似性將蛋白質(zhì)的20種天然氨基酸中存在的167種非氫原子分選成組而獲得的多個(gè)非重疊 組中的一種且僅一種中。
[0043] 現(xiàn)將參照附圖,僅以舉例的