專利名稱::一種新穎堿基和核苷及其衍生物的nmr氫譜化學位移預(yù)測方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種NMR氫譜化學位移預(yù)測方法,特別是一種新穎堿基和核香及其衍生物的NMR氫i普化學位移預(yù)測方法。
背景技術(shù):
:堿基和核苷及其衍生物對于構(gòu)成生物體及維持正常的生物機能至關(guān)重要。同時,很多藥物也是堿基和核苷及其衍生物分子。目前,對于此類生物分子的結(jié)構(gòu)解析經(jīng)常釆用核磁共振(NMR)實驗技術(shù)。但是,NMR實驗技術(shù)費時且費力,因此,人們經(jīng)常借助計算技術(shù)預(yù)測化學位移,從而進行化合物的輔助結(jié)構(gòu)解析。NMR波譜模擬對于幫助科學家迅捷的進行化合物的結(jié)構(gòu)解析具有重要的意義。NMR波譜模擬方法已經(jīng)有很多報道,大致可以分為3類l.官能團貢獻法;2.數(shù)據(jù)庫檢索法;3.數(shù)學模型法。最常用方法是通過建立線性數(shù)學模型模擬,即建立化學位移與基于原子水平的描述子之間的線性模型。因為化學位移與原子所處的化學微環(huán)境及其自身狀態(tài)有密切的關(guān)系,因此所建的模型要能夠較好的表征原子所處的化學微環(huán)境及自身狀態(tài)與化學位移之間的關(guān)系,同時,模型還要具有穩(wěn)健的預(yù)測能力。
發(fā)明內(nèi)容有鑒于此,為了解決上述問題,本發(fā)明提供一種新穎石成基和核苷及其衍生物的NMR氫譜化學位移預(yù)測方法,能夠用于堿基和核苷及其衍生物的NMR氫譜化學位移預(yù)測,為堿基和核苷及其衍生物分子的結(jié)構(gòu)解析提供方法借鑒。本發(fā)明的目的是這樣實現(xiàn)的一種新穎堿基和核苷及其衍生物的NMR氫譜化學位移預(yù)測方法,包括如下步驟a)從分子二維拓樸結(jié)構(gòu)出發(fā),根據(jù)原子之間相互作用方式和自身所處狀態(tài)得到用于描述原子所處分子微觀化學環(huán)境和雜化狀態(tài)的原子電性作用矢量和原子雜化狀態(tài)指數(shù);b)應(yīng)用原子電性作用矢量和原子雜化狀態(tài)指數(shù)對堿基、核苷及其衍生物的結(jié)構(gòu)進行表征;c)用多元線性回歸技術(shù)建立NMR氫譜化學位移預(yù)測模型,并采用留一法和留分子法交互校驗評價^t型的穩(wěn)定性和預(yù)測能力。進一步,在于步驟a)具體包括如下步驟al)將分子中的原子按元素周期表主族分類,得到按主族分類的5類不同原子電性對目標原子按距離6次方遞減的作用項;a2)定義原子的相對電負性和相對鍵長,進而計算原子電性作用矢量;a3)原子固有狀態(tài)進行修正,得到原子雜化狀態(tài)指數(shù),用于表征原子自身的雜化類型。進一步,步驟b)具體包括應(yīng)用原子電性作用矢量和原子雜化狀態(tài)指數(shù)對堿基、核苦及其衍生物的結(jié)構(gòu)進行表征;進一步,步驟c)具體包括如下步驟利用多元線性回歸技術(shù)建立NMR氫譜化學位移預(yù)測模型,并采用留一法和留分子法交互校驗評價模型的穩(wěn)定性和預(yù)測能力。本發(fā)明的一種新穎堿基和核苷及其衍生物的NMR氛譜化學位移預(yù)測方法,因為建立數(shù)學模型的關(guān)鍵是如何選擇合適的描述子來合理的表征分子結(jié)構(gòu),本發(fā)明提出的原子電性作用矢量和原子雜化狀態(tài)指數(shù)表征能力強、易于解釋、拓展性能好、使用操作方便;采用多元線性回歸技術(shù)所建NMR氫諳化學位移預(yù)測模型可以較好的體現(xiàn)分子內(nèi)部化學環(huán)境和原子狀態(tài)與化學位移之間的關(guān)系,模型穩(wěn)健、簡單且具有較高的預(yù)測能力。本發(fā)明的其他優(yōu)點、目標和特征在某種程度上將在隨后的說明書中進行闡述,并且在某種程度上,基于對下文的考察研究對本領(lǐng)域技術(shù)人員而言將是顯而易見的,或者可以從本發(fā)明的實踐中得到教導(dǎo)。本發(fā)明的目標和其他優(yōu)點可以通過下面的說明書,權(quán)利要求書,以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。具體實施例方式以下對采用本發(fā)明的方法用于堿基和核苷及其衍生物的NMR氫譜化學位移預(yù)測為例進行詳細的描述,包括以下步驟a)從分子二維拓樸結(jié)構(gòu)出發(fā),根據(jù)原子之間相互作用方式和自身所處狀態(tài)得到用于描述原子所處分子孩i觀化學環(huán)境和雜化狀態(tài)的原子電性作用矢量和原子雜化狀態(tài)指數(shù);化學位移作為一個結(jié)構(gòu)參數(shù)描述分子的性質(zhì)或活性,因為相似化學環(huán)境中共振效應(yīng)有相似的化學位移,因此可用化學位移值表達原子所處復(fù)雜的化學環(huán)境,化學位移值類似一種獨特的指紋,可以很容易的確定一個未知化合物的結(jié)構(gòu),理論上可以清晰的表達具有15-20個非氫原子的分子的結(jié)構(gòu)。研究已經(jīng)證實,原子的化學位移與其所處的化學微環(huán)境以及原子自身的雜化類型密切相關(guān)?;诖?,首先,為了全面地表征原子所處的化學微環(huán)境,本發(fā)明做了如下幾個改進由于各類原子與周圍鍵合原子電負性及距離的6次方相同。所以將分子中的原子按元素周期表主族分類(表1),由此得到了按主族分類的5類不同原子電性對目標原子按距離6次方遞減的作用項。表1按元素周期表劃分的5類原子<table>complextableseeoriginaldocumentpage5</column></row><table>-取原子的相對電負性值,即以碳原子的鮑林(Pauling)電負性為基準,所得到的其它原子與其的比值大小(表2),例如氧的相對電負性為3.44/2.55=1.3490。表2原子的鮑林電負性和相對電性<table>complextableseeoriginaldocumentpage6</column></row><table>對于鍵長則取其相對于碳-碳單鍵的鍵長大小(表3),例如碳-氧雙鍵的相對鍵長為0.122nm/0.154nm=0.792。這樣就將整個的原子電負性和鍵長統(tǒng)一起來。由此,可以得到不同類別原子對目標原子的作用項,將此作用項定義為原子電性作用矢量,計算公式為<formula>complexformulaseeoriginaldocumentpage6</formula>(1)其中,Vi為第i個原子的原子電性作用矢量的計算值,j為分子中屬于第k種類型的所有原子(ji);義取原子相對電性大??;dij為i,j兩原子的相對鍵距,即為連接它們的最短路徑的相對鍵長之和。表3有機化合物常見化學鍵的鍵長和相對鍵長<table>complextableseeoriginaldocumentpage6</column></row><table><table>complextableseeoriginaldocumentpage7</column></row><table>為了表征原子的雜化狀態(tài),引入了Hall和Kier所提出的原子固有狀態(tài)(/),并對其進行了一定的修正,得到原子雜化狀態(tài)指數(shù),用于表征原子自身的雜化類型。計算式如下<formula>complexformulaseeoriginaldocumentpage7</formula>。(2)其中,?是原子價電層的電子數(shù);n為該原子價電層所屬的主量子數(shù);ds+p是原子參與成s和p鍵的總電子數(shù);ds為成s鍵的電子數(shù)。上述定義比Hall和Kier的原始定義多了一個(/4)1/2系數(shù)以及4+p和4的計算中都沒有減去與氫原子成鍵的電子數(shù)。這樣就完全不考慮原子所處環(huán)境因素,而重點放在了其雜化類型的表達上。不同雜化類型的C,N,O原子的原子雜化狀態(tài)指數(shù)值見表4。表4不同雜化類型的C,N,O原子的原子雜化狀態(tài)指數(shù)值<table>complextableseeoriginaldocumentpage7</column></row><table>b)應(yīng)用原子電性作用矢量和原子雜化狀態(tài)指數(shù)對堿基、核苷及其衍生物的結(jié)構(gòu)進行表征;從文獻中選取堿基、核香及其衍生物共48種分子的399個氫語化學位移數(shù)據(jù)。首先對原子進行編號,并將每個分子的非氫原子數(shù)、原子屬性及連接關(guān)系輸入到計算機中。其中,原子屬性是一個表征處于化學環(huán)境中的非氫原子所屬元素原子特征以及在分子中所屬化學鍵的特性。采用一個雙字符的字符串表示。第一個字符表示該非氫原子所屬化學元素原子類型,一般用化學元素符號表示,但氯與溴分別以L、B表示。第二個字符表示與其它非氫原子形成的共價鍵類型屬性。例如與第一個表征元素原子類型的字符重復(fù)時表示形成的化學鍵是共輒雙鍵。而數(shù)字1,2,3分別表示形成單鍵,雙鍵及三鍵等。形成多個共價鍵時,以共價鍵的鍵級高低為優(yōu)先次序。比如以"巻鍵—共軛雙鍵或雙鍵—單鍵"的次序定義原子屬性。另外,直鏈中的共軛CC寫為CE,環(huán)中的共軛CC寫為CC,在具有共軛體系的環(huán)中,若N連接一個H,則寫為Nl,否則寫為NN。由此定義,可知嘧啶中的8個非氫原子的原子屬性分別為Nl;CC;Nl;CC;CC;CC;02;02,嘧啶中原子的連接關(guān)系是1-2,1-6,2-3,2-7,3-4,4-5,4-8,5-6。利用CT+語言編寫的應(yīng)用程序VAEIMP.exe計算原子電性作用矢量和原子雜化狀態(tài)指數(shù)值。c)用多元線性回歸技術(shù)建立NMR氫譜化學位移預(yù)測模型,并采用留一法和留分子法交互校驗評價模型的穩(wěn)定性和預(yù)測能力;所取的48種分子包括組成核酸常見的5種堿基、8種核苷的衍生物。以48種分子為訓練集,通過多元線性回歸技術(shù)建立線性回歸模型,應(yīng)用自編的程序計算有關(guān)的統(tǒng)計變量及回歸系數(shù),得到化學位移(CS)與原子電性作用矢量和原子雜化狀態(tài)指數(shù)關(guān)系間的9參數(shù)模型CS二3.901-5.449xv"1.345xv2+1.911xv3-0.347xv4+1.954xv5+0.767xv6+0.912xv7+0.203xv8-1.817xv9(3)其中,復(fù)相關(guān)系數(shù)R=0.9555,均方根誤差RMS=0.5951ppm,結(jié)果表明,模型對化學位移估計值與觀測值吻合良好,說明399個C的化學位移與9個描述子之間具有良好的相關(guān)性,所建的模型對內(nèi)部樣本具有良好的估計能力。為了說明模型的穩(wěn)定性和預(yù)測能力,經(jīng)留一法交互檢驗,即分別將每個樣本從訓練集中取出,以其余樣本為校正集建立多元線性回歸線性模型,并用該模型預(yù)測抽出的那個外部預(yù)測樣本的化學位移,將訓練集中每個樣本都作1次,由于計算量較大,開發(fā)了應(yīng)用程序GETLOO.exe用于留一法的交互檢驗工作,訓練集中共有399個氫譜數(shù)據(jù),因此經(jīng)過399次預(yù)測,計算得R=0.9519,RMS=0.618ppm,統(tǒng)計結(jié)果表明模型的擬合能力較好,估計誤差較小。為了更全面的驗證所建模型的穩(wěn)健性,又采用了留分子法交互檢驗,不過與常用的留組法不同的是,其以分子為單位將48個分子樣本共分成6組,即每次留下8個分子所包含的碳原子不參與建模,再利用剩下樣本所建立的模型對該分子中未參與建模的氫譜的化學位移進行交互校驗,交互校驗6次即可將48個分子包含的399組氫鐠的化學位移預(yù)測一遍。因計算量較大,開發(fā)了應(yīng)用程序GETLMO.exe用于留分子法的交互檢驗工作,得建沖莫統(tǒng)計參數(shù)R=0.9395,RMS=0.69lppm,這進一步驗證了所建模型具有穩(wěn)健的預(yù)測能力。一個模型的質(zhì)量好壞不僅在于模型對于內(nèi)部樣本的擬合能力和估計誤差的大小,而且更重要的在于模型對外部樣本性質(zhì)的預(yù)測能力大小。因此,進一步選取了三類含有大量的雜環(huán)和雜化原子的嘧啶和。票呤的衍生物分子體系,預(yù)測了氫語的化學位移,評價了模型的預(yù)測能力。很多噤呤類衍生物具有類膽堿(功)能,從文獻中取得了一類N-千基-氮雜環(huán)己烷及氮雜環(huán)戊烷-嘌呤衍生物,共6種分子89組氫譜,對其化學位移值進行了預(yù)測,經(jīng)過計算得到R和RMS分別為0.9098和1.0371ppm,顯示模型對該組化合物化學位移的預(yù)測效果良好。嘌呤類衍生物在生物體中的重要性是顯而易見的,而6-取代噤呤衍生物在藥物創(chuàng)制方面具有獨特的潛力和可選擇性,本發(fā)明選擇11類6-取代噤呤衍生物,利用所建的模型預(yù)測了此類化合物82組氫語的化學位移值,得R-0.8962,RMS=0.8121ppm,由計算結(jié)果可以看出,所建模型對此類衍生物的氬譜的化學位移值的預(yù)測結(jié)果具有較高的精度。某些嘧啶類衍生物可以作為抗肺瘤、抗濾過性病原體或殺真菌劑的藥物,從文獻中取得8種6-氮雜胞嘧口定類衍生物分子共22個氬譜的化學位移值,作為預(yù)測集,利用所建模型預(yù)測此類化合物的化學位移值并評價了模型的預(yù)測能力。經(jīng)計算得到R=0.9657,RMS=0.6337ppm,表明所建模型對此嘧啶類衍生物的氬譜化學位移值的預(yù)測能力很穩(wěn)健。以上所述僅為本發(fā)明的優(yōu)選實施例,并不用于限制本發(fā)明,顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。權(quán)利要求1.一種新穎堿基和核苷及其衍生物的NMR氫譜化學位移預(yù)測方法,其特征在于包括如下步驟a)從分子二維拓撲結(jié)構(gòu)出發(fā),根據(jù)原子之間相互作用方式和自身所處狀態(tài)得到用于描述原子所處分子微觀化學環(huán)境和雜化狀態(tài)的原子電性作用矢量和原子雜化狀態(tài)指數(shù);b)應(yīng)用原子電性作用矢量和原子雜化狀態(tài)指數(shù)對堿基、核苷及其衍生物的結(jié)構(gòu)進行表征;c)用多元線性回歸技術(shù)建立NMR氫譜化學位移預(yù)測模型,并采用留一法和留分子法交互校驗評價模型的穩(wěn)定性和預(yù)測能力。2.根據(jù)權(quán)利要求1的一種新穎堿基和核苦及其衍生物的NMR氫譜化學位移預(yù)測方法,其特征在于步驟a)具體包括如下步驟al)將分子中的原子按元素周期表主族分類,得到按主族分類的5類不同原子電性對目標原子按距離6次方遞減的作用項;a2)定義原子的相對電負性和相對鍵長,進而計算原子電性作用矢量;a3)對原子固有狀態(tài)進行修正,得到原子雜化狀態(tài)指數(shù),用于表征原子自身的雜化類型。3.根據(jù)權(quán)利要求2的一種新穎堿基和核苷及其衍生物的NMR氫譜化學位移預(yù)測方法,其特征在于步驟b)具體包括應(yīng)用原子電性作用矢量和原子雜化狀態(tài)指數(shù)對堿基、核苷及其衍生物的結(jié)構(gòu)進行表征。4.根據(jù)權(quán)利要求1至3中任一項的一種新穎堿基和核苷及其衍生物的NMR氳譜化學位移預(yù)測方法,其特征在于步驟c)利用多元線性回歸技術(shù)建立NMR氫譜化學位移預(yù)測模型,并采用留一法和留分子法交互校驗評價模型的穩(wěn)定性和預(yù)測能力。全文摘要本發(fā)明公開了一種新穎堿基和核苷及其衍生物的NMR氫譜化學位移預(yù)測方法,包括如下步驟a)從分子二維拓撲結(jié)構(gòu)出發(fā),根據(jù)原子之間相互作用方式和自身所處狀態(tài)得到用于描述原子所處分子微觀化學環(huán)境和雜化狀態(tài)的原子電性作用矢量和原子雜化狀態(tài)指數(shù);b)應(yīng)用原子電性作用矢量和原子雜化狀態(tài)指數(shù)對堿基、核苷及其衍生物的結(jié)構(gòu)進行表征;c)用多元線性回歸技術(shù)建立NMR氫譜化學位移預(yù)測模型,并采用留一法和留分子法交互校驗評價模型的穩(wěn)定性和預(yù)測能力。該發(fā)明方法具有預(yù)測能力強、簡單方便、拓展性能好的優(yōu)點,能夠用于堿基和核苷及其衍生物NMR氫譜化學位移預(yù)測,以便于化合物的結(jié)構(gòu)解析。文檔編號G06F19/00GK101344900SQ20081007017公開日2009年1月14日申請日期2008年8月25日優(yōu)先權(quán)日2008年8月25日發(fā)明者李志良,梁桂兆,牛維環(huán)申請人:重慶大學