国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      分子力學(xué)力場參數(shù)的自動化生成方法

      文檔序號:6555707閱讀:521來源:國知局
      專利名稱:分子力學(xué)力場參數(shù)的自動化生成方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及計(jì)算化學(xué)中的分子模擬方法,包含了自動生成分子模擬必需的 分子力學(xué)力場參數(shù)的方法,可應(yīng)用于材料科學(xué)、生命科學(xué)、藥物科學(xué)和化學(xué)化 工等方面的基礎(chǔ)研究。
      背景技術(shù)
      隨著現(xiàn)代計(jì)算機(jī)硬件和軟件技術(shù)的迅速發(fā)展,分子模擬已經(jīng)成為一個不可 或缺的研究手段,在材料科學(xué)、生命科學(xué)、藥物科學(xué)和化學(xué)化工等方面起到日 益重要的作用。而分子模擬的基礎(chǔ)是能夠準(zhǔn)確描述原子間相互作用的勢函數(shù), 也就是通常所說的分子力學(xué)力場。目前,不完整的分子力學(xué)力場常常阻礙分子 模擬方法在工業(yè)中的應(yīng)用。雖然公開文獻(xiàn)中已有許多分子力學(xué)力場的報(bào)道(如CHARMM, AMBER, MM2, MM3, MMFF, CFF9x, COMPASS, Drieding, UFF等),但是現(xiàn)有力場在可遷移性和可擴(kuò)展性方面存在著嚴(yán)重的局限性,在應(yīng)用 到新藥物或新材料分子的研發(fā)時仍有很多要求難以滿足,往往出現(xiàn)因缺乏參數(shù) 而無法進(jìn)行計(jì)算的現(xiàn)象。原子類型的使用是限制力場可遷移性的根本原因。當(dāng)力場被用于一個分子 時,如果其中一個原子的環(huán)境未被完整地定義,這一原子則可能被歸為另一相 近的己經(jīng)定義了的原子類型,從而導(dǎo)致在分子模擬過程中提取到錯誤的力場參 數(shù)。這樣,就破壞了該力場的可遷移性。另一方面,要提高可遷移性,只好將 原子類型按照更為嚴(yán)格的標(biāo)準(zhǔn)進(jìn)行細(xì)化,為不同化學(xué)環(huán)境下的原子提供合適的 參數(shù),但是,這樣不僅會極大地增加推導(dǎo)參數(shù)的工作量,而且會降低整體覆蓋 面?;瘜W(xué)分子結(jié)構(gòu)千變?nèi)f化,新的分子也層出不窮,顯然這種方式無法窮盡所 有分子。所以,不斷細(xì)分原子類型是不能從根本上解決力場參數(shù)的可遷移性問 題的。同時,原子類型的使用也嚴(yán)重的限制了力場的可擴(kuò)展性。當(dāng)一個力場包含
      有一定數(shù)目的原子類型的定義后,新原子類型的引入往往導(dǎo)致力場原定義域的 變化,從而使整個力場發(fā)生變化。所以,引入新原子類型及其參數(shù)時必須嚴(yán)格 檢查原有力場的整體計(jì)算精度是否受到破壞。而這需要重新驗(yàn)證所有的計(jì)算并 調(diào)整相應(yīng)的參數(shù)。對一般使用者來講,這是不切實(shí)際的??蛇w移性決定了力場參數(shù)的適用范圍,而可擴(kuò)展性則決定著力場的開放性 和生命力,為其不斷發(fā)展和完善創(chuàng)造基礎(chǔ)。由于缺乏可遷移性和可擴(kuò)展性,現(xiàn)有的力場都是不完備的。比如,即使是當(dāng)今最"大"的力場,如CFF和MMFF, 也只有很小一部分己知的藥物分子可以被準(zhǔn)確地描述。在千變?nèi)f化的藥物分子 結(jié)構(gòu)面前,現(xiàn)有的力場常常顯得無能為力。這極大地妨礙著分子模擬方法的應(yīng) 用價值和應(yīng)用范圍。推導(dǎo)力場的過程需要很高的技巧,往往耗費(fèi)研究人員大量的時間。很難滿 足應(yīng)用的需要。因此,缺乏完整準(zhǔn)確的力場已經(jīng)成為迫切需要解決的制約分子 模擬技術(shù)廣泛應(yīng)用的瓶頸問題,而開發(fā)一個能夠快速、準(zhǔn)確、自動地推導(dǎo)分子 力場的方法,取代繁瑣的人力勞動,已成為分子模擬發(fā)展的客觀而迫切的要求。 本發(fā)明的發(fā)明正是為了滿足這一需求。發(fā)明內(nèi)容本發(fā)明的目的就是為了克服上述現(xiàn)有技術(shù)存在的缺陷而提供一種快速、準(zhǔn) 確的分子力學(xué)力場參數(shù)的自動化生成方法。本發(fā)明的目的可以通過以下技術(shù)方案來實(shí)現(xiàn)分子力學(xué)力場參數(shù)的自動化 生成方法,其特征在于,可以用計(jì)算機(jī)程序?qū)崿F(xiàn)的自動制作分子力學(xué)力場的方 法,該方法包含以下步驟a) 用目標(biāo)分子尋找可以用來制作其分子力場參數(shù)的唯一的一組分子模型集 合,b) 實(shí)施量子力學(xué)計(jì)算得到可以用來擬合分子力學(xué)力場的基準(zhǔn)數(shù)據(jù),c) 無須人力干預(yù)的擬合大量非線性數(shù)據(jù)的程序,d) 用數(shù)據(jù)庫儲存管理上述數(shù)據(jù)和擬合結(jié)果。所述的用目標(biāo)分子尋找可以用來制作其分子力場參數(shù)的唯一的一組分子 模型集合包括下述步驟a) 對任意給定的分子系統(tǒng)中確定組成該分子的、適合制作其分子力學(xué)力場的分子片斷集的方法,b) 用模式識別的方法過濾得到的分子片斷集除去其中的子片斷,c) 用加氫的方法將得到的分子片斷制作成完整的分子模型。所述的實(shí)施量子力學(xué)計(jì)算得到可以用來擬合分子力學(xué)力場的基準(zhǔn)數(shù)據(jù)包括下述步驟a) 根據(jù)輸入的分子片斷以及制作分子力學(xué)力場的需要確定分步實(shí)施的量子力學(xué)計(jì)算的參數(shù),b) 實(shí)施和監(jiān)督量子力學(xué)計(jì)算的過程,c) 檢驗(yàn)量子力學(xué)計(jì)算的結(jié)果,將量子力學(xué)計(jì)算的結(jié)果轉(zhuǎn)換為可以用來推導(dǎo)分子力學(xué)力場參數(shù)的數(shù)據(jù)。所述的無須人力干預(yù)的擬合大量非線性數(shù)據(jù)的程序包括下述步驟a) 根據(jù)導(dǎo)入的分子模型和量子力學(xué)計(jì)算的基準(zhǔn)數(shù)據(jù)估算初始力場參數(shù),b) 根據(jù)導(dǎo)入的分子模型和量子力學(xué)計(jì)算的基準(zhǔn)數(shù)據(jù)選擇擬合方法,c) 實(shí)施、監(jiān)督和管理擬合過程的方法。所述的用數(shù)據(jù)庫儲存管理上述數(shù)據(jù)和擬合結(jié)果包括下述步驟a) 儲存分子模型中的原子的三維坐標(biāo),原子類型、原子電荷數(shù)據(jù),b) 儲存量子力學(xué)計(jì)算的能量、能量的一、二階導(dǎo)數(shù)、電荷、頻率數(shù)據(jù),c) 儲存擬和得到的分子力學(xué)力場參數(shù)。所述的根據(jù)導(dǎo)入的分子模型和基準(zhǔn)數(shù)據(jù)估算初始力場參數(shù)包括下述步驟a) 根據(jù)分子力場類型選定函數(shù)形式,b) 給分子模型中的原子指定原子類型,c) 根據(jù)基本原子參數(shù)估算初始分子力場參數(shù)。所述的根據(jù)導(dǎo)入的分子模型和基準(zhǔn)數(shù)據(jù)選擇擬合方法包括下述步驟-a) 用Levenberg-Marquardt非線性最小二乘擬合方法確定非線性參數(shù),b) 用SVD方法確定線性參數(shù),c) 用SUMT方法控制參數(shù)可調(diào)范圍。所述的實(shí)施、監(jiān)督和管理擬合過程的方法包括下述步驟 a)驗(yàn)證輸入的分子模型和基準(zhǔn)數(shù)據(jù)的一致性,
      b)根據(jù)輸入的分子模型和基準(zhǔn)數(shù)據(jù)估算初始力場參數(shù),C)根據(jù)輸入基準(zhǔn)數(shù)據(jù)分步擬和分子力場參數(shù),d)檢驗(yàn)得到的分子力場參數(shù)和基準(zhǔn)數(shù)據(jù)的符合程度。
      本發(fā)明提供了一種新的,能夠快速、準(zhǔn)確、自動地推導(dǎo)分子力場的系統(tǒng)方 法,為目標(biāo)分子尋找可以用來制作其分子力場參數(shù)的唯一的一組分子模型集 合,對分子模型集合實(shí)施量子力學(xué)計(jì)算,以得到可以用來擬合分子力學(xué)力場的 基準(zhǔn)數(shù)據(jù),自動擬合大量非線性數(shù)據(jù),自動驗(yàn)證擬合的結(jié)果,以及用數(shù)據(jù)庫方 法儲存管理上述數(shù)據(jù)和擬合結(jié)果。


      圖1是本發(fā)明的總體系統(tǒng)框架圖; 圖2是圖1中參數(shù)化系統(tǒng)的流程圖;; 圖3是圖2中片斷化工具流程圖; 圖4是圖2中量化計(jì)算步驟流程圖; 圖5是圖2中力場屬性設(shè)置流程圖; 圖6是圖2中估算參數(shù)流程圖; 圖7是圖2中擬合流程圖; 圖8是圖2中數(shù)據(jù)庫結(jié)構(gòu)圖。
      具體實(shí)施例方式
      下面結(jié)合附圖對本發(fā)明作進(jìn)一步詳細(xì)說明。
      在本發(fā)明以及附圖中涉及到的專業(yè)術(shù)語解釋如下 "模型" 一一是指一個包含有不同數(shù)量原子,分子和分子簇的分子系統(tǒng)。 "基準(zhǔn)數(shù)據(jù)" 一一包括能量,能量在笛卡爾坐標(biāo)下的一階導(dǎo)數(shù)以及二階導(dǎo)數(shù)等基準(zhǔn)數(shù)據(jù),這些數(shù)據(jù)是計(jì)算所得的。例如,可以是用量子力學(xué)計(jì)算方法所得數(shù)據(jù)。
      "分子力場" 一一是指用一組數(shù)學(xué)公式來描述分子與分子,分子與原子, 以及原子與原子之間的相互作用勢函數(shù)。分子力場給出了模型的總能量、能量 的導(dǎo)數(shù)作為原子坐標(biāo)的函數(shù)。函數(shù)里包含了可調(diào)參數(shù)。開發(fā)一個分子力場的關(guān)
      鍵問題就是要確定所有的可調(diào)參數(shù)。"力場類型" 一一指一組特定的函數(shù)組合。常用的力場類型有CHARMM, AMBER, MM2, MM3, MMFF, CFF9x, COMPASS, Drieding, UFF等.力場類型 和參數(shù)共同定義了一個特定的分子力場。"分子片斷" 一一是按一定規(guī)則劃分的完整的分子片斷;這些分子片斷相 對獨(dú)立,在不同的分子體系里有相對穩(wěn)定的性質(zhì)(可遷移性),而其組合能包 含并反映所研究分子體系的主要化學(xué)特性。"原子類型"一一是指化學(xué)元素的2級分類,即把同一元素在不同化學(xué)環(huán) 境下的原子區(qū)分開來。 一種元素可以有多種原子類型。不同的原子類型代表了 不同的分子力場能量,也就是說,在分子力場術(shù)語中,我們不再說原子A和B 的相互作用,而是要詳細(xì)到是原子類型A和原子類型B之間的相互作用。"默認(rèn)原子類型"(DAT)—一是一種在本項(xiàng)專利中所使用到的特定原子類 型系統(tǒng)。用于生成不同力場類型的不同初始默認(rèn)參數(shù)。"默認(rèn)原子參數(shù)"一一是指可以用來做力場參數(shù)快速估計(jì)的一組原子參數(shù)。本發(fā)明的主要內(nèi)容是圖1中的參數(shù)化系統(tǒng)105。在圖1中可以看到,從目 標(biāo)分子101出發(fā),該系統(tǒng)尋找可以為目標(biāo)分子制作分子力場參數(shù)的分子模型集 合103;對這組集合的每個分子實(shí)施量子力學(xué)計(jì)算102,得到可以用來擬合分 子力學(xué)力場的基準(zhǔn)數(shù)據(jù)104后;參數(shù)化系統(tǒng)105自動擬合數(shù)據(jù);并將得到的力 場參數(shù)106提交給分子模擬系統(tǒng)107使用。圖2中列出了參數(shù)化系統(tǒng)105的主要作用。目標(biāo)分子首先被分割成分子片 斷201,經(jīng)過檢索數(shù)據(jù)庫判斷分子片斷202是否存在數(shù)據(jù)庫204中。如果數(shù)據(jù) 庫204中已經(jīng)有了分子片斷202,則直接從數(shù)據(jù)空中調(diào)用相應(yīng)的數(shù)據(jù)合成目標(biāo) 分子的力場。如果數(shù)據(jù)庫204中未包含分子片斷202的力場參數(shù),分子片斷202 就被輸入到構(gòu)造量化計(jì)算模型205 (在圖4中詳細(xì)敘述)計(jì)算得到基準(zhǔn)數(shù)據(jù), 經(jīng)過206檢查量化數(shù)據(jù)后,在207處定義分子力場的函數(shù)形式和原子類型(圖 2b),在208估算參數(shù)后輸入到擬合引擎209,對擬合完的分子力場參數(shù)進(jìn)行 參數(shù)驗(yàn)證210,驗(yàn)證無誤的分子力場參數(shù)保存211到數(shù)據(jù)庫204中,也可用以 合成目標(biāo)分子力場。
      圖1的參數(shù)化系統(tǒng)105包括一個分子片斷化引擎201 (圖3具體描述)。 其功能是將復(fù)雜的分子體系按一定規(guī)則劃分為有限個分子片斷;這些分子片斷 相對獨(dú)立,在不同的分子體系里有相對穩(wěn)定的性質(zhì),而其組合能包含并反映所 研究分子體系的主要化學(xué)特性。劃分分子片斷的規(guī)則如下,參見圖3:1) 以原子為中心的片斷包含中心原子,以及與中心原子直接相連的原 子,除去所有以單鍵形式和上述原子相連的其它所有原子。如果其它原子是以 雙鍵、三鍵和上述原子相連、或和上述原子相連同屬于小環(huán)(小于等于6元環(huán))、 芳香環(huán),則保留;2) 以鍵為中心的片斷包含鍵連接的一對原子,以及與這對原子直接相 連的原子。切斷規(guī)則同上;3) 除去用模式識別方法過濾得到的分子片斷集中的子片斷302;4) 根據(jù)原子的雜化態(tài)決定了原子的首選幾何構(gòu)型,然后為未成對電子加 上氫原子303。完成上述步驟得到的分子片斷的空間構(gòu)象不一定合理,于是在清理結(jié)構(gòu)步 驟304調(diào)整分子片斷中原子的坐標(biāo),使得空間構(gòu)象合理,從而得到了分子片斷 202。在圖2參數(shù)化系統(tǒng)的判斷步驟203處判斷數(shù)據(jù)庫中是否存在分子片斷202 的分子力場參數(shù),如果已存在數(shù)據(jù)庫中,可以將數(shù)據(jù)輸出,合成目標(biāo)分子力場 參數(shù),供分子模擬需要。對于沒有分子力場參數(shù)的新的分子片斷,則將其輸入 到構(gòu)造量化計(jì)算模型步驟205,對分子片斷202實(shí)施量子力學(xué)計(jì)算,得到用來 擬合分子力學(xué)力場的基準(zhǔn)數(shù)據(jù)。對于進(jìn)入步驟205的分子片斷,需要分步進(jìn)行量子力學(xué)計(jì)算。首先對分子 片斷進(jìn)行步驟401構(gòu)象采樣,對取得的樣品用半經(jīng)驗(yàn)的快速的(如PM3)量子 力學(xué)方法優(yōu)化這些構(gòu)象(初始優(yōu)化402),依據(jù)能量的不同篩選所得到的優(yōu)化 構(gòu)象,去除其中冗余的構(gòu)象(403)。對剩余的能量不同的構(gòu)象作量子力學(xué)高 階優(yōu)化404 (如B3LYP/6-31G*)。將優(yōu)化結(jié)果輸入步驟405判斷是否得到優(yōu)化 收斂的結(jié)構(gòu),如果沒得到優(yōu)化結(jié)構(gòu),返回步驟401重新采樣尋找最優(yōu)化結(jié)構(gòu); 如果已經(jīng)得到優(yōu)化結(jié)構(gòu),則輸入步驟406,計(jì)算上述得到的高階優(yōu)化結(jié)果中能 量最低的構(gòu)象的二階導(dǎo)數(shù)406。將二階導(dǎo)數(shù)計(jì)算結(jié)果輸入步驟408判斷是否得
      到的能量最低構(gòu)象為最優(yōu)化結(jié)構(gòu),如果不是,返回步驟401重新采樣尋找最優(yōu) 化結(jié)構(gòu);如果得到最優(yōu)化結(jié)構(gòu),則對這個能量最低構(gòu)象旋轉(zhuǎn)釆樣,計(jì)算樣品的 能量梯度407。至此,最低能量的二階導(dǎo)數(shù)和能量梯度值,以及其他非最低能 量的優(yōu)化構(gòu)象的能量梯度值就組成了該分子片斷的基準(zhǔn)數(shù)據(jù)。參數(shù)化系統(tǒng)105中的檢査量化數(shù)據(jù)步驟206會驗(yàn)證輸入的分子模型和基準(zhǔn) 數(shù)據(jù)的一致性,無誤后,將其輸入到步驟207。設(shè)置模型的分子力場屬性207在圖5中有相應(yīng)介紹,他包括力場類型中的 算法,方法,以及力場計(jì)算中所需的DAT,AT,AC等數(shù)據(jù)。從圖5中可以看到 一個特殊的命名系統(tǒng),用于實(shí)現(xiàn)DAT獨(dú)立的不同力場類型的區(qū)分。有超過230 種DAT被定義,覆蓋了絕大多數(shù)有機(jī)分子系統(tǒng)和許多無機(jī)分子系統(tǒng)。在本文 中,"定義"是指所有DAT參數(shù)都己提供,所以系統(tǒng)能估計(jì)出默認(rèn)的力場參、ty .數(shù)。如上文所說的任何分子系統(tǒng),如果其DAT沒有給出完整定義,則系統(tǒng)都 會給缺失的數(shù)值給出一個默認(rèn)的值,例如,通過元素符號,鍵的數(shù)量或原子連 接度和鍵類型,查找到一個最接近的數(shù)據(jù)。然后系統(tǒng)會給用戶一個檢查/修改/ 編輯DAT參數(shù)的提示,步驟207從206獲得輸入,輸出給了步驟209。在圖6中所描述的估計(jì)參數(shù)過程208包含了計(jì)算默認(rèn)力場參數(shù)的算法。算 法是和UFF方法相似。然而,和UFF方法相比,本發(fā)明的方法更具有通用性, 適用于更廣范圍的分子系統(tǒng)。在步驟208中,默認(rèn)參數(shù)被定義成具有物理意義的變量(例如力常數(shù),參 照值等),描述了原子之間相互能量的主要特點(diǎn)。這些變量只和DAT有關(guān)。 這樣使得默認(rèn)參數(shù)和所選力場類型的合適參數(shù)能容易結(jié)合。所有這些參數(shù)都是 存在數(shù)據(jù)文件中。這些文件可以由用戶修改擴(kuò)展,歩驟208從步驟207處接收 數(shù)據(jù),輸出到步驟209。圖7中詳細(xì)描述了擬合過程209,它根據(jù)輸入的默認(rèn)力場參數(shù),基準(zhǔn)數(shù)據(jù) 和模型,根據(jù)最小均方誤差生成基準(zhǔn)數(shù)據(jù)的擬合結(jié)果。步驟209分析數(shù)據(jù)和力 場參數(shù),決定最好的擬合方法。步驟209使用了不同的數(shù)值算法,非線性和線 性擬合來有效反應(yīng)變量。步驟209從208處獲得數(shù)據(jù),輸出給210。驗(yàn)證過程210是用基準(zhǔn)數(shù)據(jù)和所得的力場,進(jìn)行能量最小和振動分析。把
      計(jì)算所得結(jié)果(例如優(yōu)化內(nèi)值,振動頻率等)進(jìn)行比較和數(shù)據(jù)錯誤分析。如果 擬合滿意,則控制命令傳輸?shù)讲襟E211。反過來,如果擬合不滿意,則用LM/SUMT和SVD擬合方法(例如,最大梯度,開銷,懲罰權(quán)重等的考慮) 以及參數(shù)的控制進(jìn)行調(diào)整,并且重復(fù)209的擬合過程。還有一個自動覆蓋擬合 結(jié)果的選項(xiàng),因此可以直接控制擬合過程。步驟210從209輸入,輸出至211。輸出步驟211把計(jì)算結(jié)果(力場參數(shù))根據(jù)不同協(xié)議,在已規(guī)定的格式下 保存到文件中,或輸出至外部程序107。圖5-7分別是步驟207, 208和209的詳細(xì)流程圖。步驟207在最后的輸出有力場分配的屬性。步驟501把DAT自動分配給 每個模型中的原子。分配過程遵循以下幾個條件 命名DAT示范(1) DAT包含3-4個字符(2) 字符l-3用處很大,每個DAT至少包含3個字符。(3) 前2個字符是元素的符號,如果該元素是單字符的,例如(H,C,O), 則用后加下劃線(H—,C—,0—)代替(4) 第3個字符是一個0-9的整數(shù),用來表示配位數(shù)(例如有幾個鍵連接)(5) 第4個字符表示原子所處的環(huán)境,例如(a) "c":在一個3-4個成員的環(huán)分子中,(b) "r":在共振結(jié)構(gòu)里,(c) "a":在芳香族分子中,(d) "p":電極化環(huán)境(e.g.,附近有高電荷存在),(e) "+":陽離子(f) "-":陰離子.每個DAT都有一組原子參數(shù)(被稱為DAT參數(shù)),例如下面幾個對估計(jì) 力場默認(rèn)參數(shù)有幫助的幾個DAT參數(shù)(1) 原子數(shù)(2) 上文所解釋的DAT字符(3) 相關(guān)數(shù)(鍵數(shù)目)(4) 如以下之一的幾何描述"無"、"線性"、"彎曲"、"平面"、"金
      字塔"、"4面體"、"正方形"、"雙金字塔"、"正方金字塔"、"8面 體"、"其它"(5) 鍵半徑(例如該原子貢獻(xiàn)的價鍵長度(6) 鍵傾角(最好是在原子中間的鍵傾角);(7) Vdw直徑(Vdw直徑參數(shù));(8) Vdw能量(Vdw能量參數(shù));(9) 有效電荷(有效核電荷,用來計(jì)算力常數(shù))(10) 轉(zhuǎn)動參數(shù)(貢獻(xiàn)轉(zhuǎn)動勢能高度,如果該原子是二面角中兩個中心原子 中的一個).DAT數(shù)據(jù)庫504是包含上述注明數(shù)據(jù)的數(shù)據(jù)庫,這些數(shù)據(jù)可以被系統(tǒng)和 用戶導(dǎo)出、修改和保存。步驟501接收206步輸入的模型,添加DAT定義步 驟503和數(shù)據(jù)庫DATDB 504中的數(shù)據(jù),發(fā)送輸出到步驟502。是否定義DAT的判斷步驟502判斷DAT數(shù)據(jù)庫504的原子參數(shù)是否已經(jīng) 被分配原子類型。如果沒有,步驟502查找最接近數(shù)據(jù)。步驟502接收501的 輸入,然后傳輸控制到503或505。力場類型選擇器505選擇需要的分子力場類型(函數(shù)形式)。定義表觀原字類型步驟506將表觀原子類型(AAT)分配給輸出文件。原 子類型由模式匹配程序賦值,該程序使用深度優(yōu)先搜索(DFS)運(yùn)算法則。步 驟506輸出到判斷AAT是否正確步驟507,如果正確,則將設(shè)置分子力場屬性 完成的分子片斷輸出到208進(jìn)行估算參數(shù)計(jì)算;如果AAT不正確,則輸入到 步驟508進(jìn)行AAT編輯后輸出到208。在圖6中,估計(jì)參數(shù)208過程在601輸入模型,在604輸出已經(jīng)更新了原 子電荷參數(shù)和價參數(shù)的模型。輸入到602步驟的分子片斷模型經(jīng)電荷參數(shù)檢查器判斷,如果沒有設(shè)置電 荷參數(shù),則將模型輸入到電荷參數(shù)產(chǎn)生器603中,設(shè)置電荷參數(shù)后輸出到604; 如果已有電荷參數(shù),則直接輸出到604檢查是否已有價參數(shù)。如果沒有,輸入 模型到605設(shè)置價參數(shù)后輸出;如果已有,直接輸出到擬合步驟209。步驟603輸出兩種類型的電荷參數(shù)文件,基于原子類型(AT)的和基于鍵 類型(BT)的,它們由步驟450產(chǎn)生?;谠宇愋偷膮?shù)由原子類型qat(i)定
      義(每種原子類型有一個電荷參數(shù),所有同一原子類型的原子共享同一種參 數(shù))?;阪I類型的參數(shù)也叫鍵電荷增量,它由兩個鍵接的原子的原子類型 的),at(j)標(biāo)明。該參數(shù)表現(xiàn)原子j到原子i的電荷重置。例如,如果at(i),at(j)- 0.5, 表示原子i得到0.5個電子而原子j得到-0.5個電子。對于任意原子i,凈電荷 是所有與之相關(guān)的鍵電荷增量的總和,如下
      <formula>formula see original document page 13</formula>
      上面討論的,鍵電荷增量的定義可以讓任何化學(xué)鍵系統(tǒng)的總電荷自動保持 中性。為了描述電荷系統(tǒng),必須使用基于原子類型的電荷參數(shù)或基于原子類型 和鍵類型相結(jié)合的電荷參數(shù)。
      在步驟603中,輸出的FFQ參數(shù)由通過最小二乘法計(jì)算的原子電荷得到。 例如假設(shè)給出一套原子電荷,含有M個原子的分子系統(tǒng),貝ij:
      Q二(qi,q2,q3,…qM)并且
      電荷參數(shù)可以由解下列方程得到
      P是電荷參數(shù)(基于原子類型或鍵類型)
      P,,P2,P3,…PN)并且 AMxN是如下給出的賦值矩陣
      如果Pj是基于原子類型的,貝U:
      aij=l, if pj=qat(i); aii=0, otherwise.
      而如果Pj是基于鍵類型,貝IJ:
      <formula>formula see original document page 14</formula>
      上面討論的,一般,M(原子數(shù)量)〉N(電荷參數(shù)數(shù)量),因此方程AP-Q沒 有精確解。然而可以通過SVD方法解這個方程。用SVD方法解上述方程,得 到的P有最小值,是最小二乘意義上的最接近的解。由步驟603產(chǎn)生電荷參數(shù) 結(jié)果并輸出,是基于原子類型或鍵類型的任意一個。步驟603接收來自步驟601 輸入,然后在步驟604輸出電荷參數(shù)。
      在圖7中,擬合步驟209使用了一個擬合引擎系統(tǒng),在701處輸入模型、 初始參數(shù)和基準(zhǔn)數(shù)據(jù)。步驟209將最終擬合力場參數(shù)輸出到211,進(jìn)行數(shù)據(jù)驗(yàn) 證。
      設(shè)置SUMT項(xiàng)步驟701控制參數(shù)可調(diào)范圍后(SUMT懲罰辦法有助于確 保非線性相應(yīng)參數(shù)由其中的平衡值保持在一個很合理的序列中),輸入模型到 LM擬合步驟702使用Levenberg-Marquardt非線性最小二乘擬合法確定非線性 參數(shù),對步驟701中輸入的初始參數(shù)進(jìn)行最初擬合。步驟703檢査參數(shù)和變量, 如果參數(shù)需要修改和固定,則在704處固定參數(shù),送回702重復(fù)LM擬合。如 果不需修改,則輸入下一步705進(jìn)行SVD擬合。SVD擬合步驟接收步驟703 的輸出,然后使用SVD方法擬合線性項(xiàng),同時非線性項(xiàng)固定在最佳值。SVD 方法擬合線性方程很理想,因?yàn)樗詣赢a(chǎn)生一個解決辦法可以生成最小二乘意 義上的最小值。經(jīng)過SVD擬合的參數(shù)在步驟706處檢查參數(shù)和變量,如果需 要固定參數(shù),送到步驟707固定后輸入705重新SVD擬合。由步驟705擬合 得到的最終力場參數(shù)輸出到步驟210,完成步驟擬合過程209。
      完成了 205-209各步驟的模型具有了基準(zhǔn)數(shù)據(jù)和分子力場參數(shù)。將其輸入 到210驗(yàn)證參數(shù)步驟檢驗(yàn)得到的分子力場參數(shù)和基準(zhǔn)數(shù)據(jù)的符合程度。完成檢 驗(yàn)后的分子片斷、基準(zhǔn)數(shù)據(jù)、擬合結(jié)果都可存儲在數(shù)據(jù)庫204中或者供合成目 標(biāo)分子力場直接應(yīng)用。
      數(shù)據(jù)庫204具備基本管理功能包括檢索,排序,增加,刪除等;能為任
      意分子確定分子片段;并為任一分子構(gòu)造所需要的力場參數(shù);統(tǒng)計(jì)分析參數(shù)的 可遷移性。除了基本的數(shù)據(jù)庫管理功能外,數(shù)據(jù)庫204的獨(dú)特功能是用模式識 別的原理完成分子片斷的搜索和組合。根據(jù)一套預(yù)定的規(guī)則,數(shù)據(jù)庫204能處 理任意分子結(jié)構(gòu),找出所有的,滿足規(guī)則的分子片斷。如果所有的片斷己儲存 在數(shù)據(jù)庫中,DFF-DBD可以用這些數(shù)據(jù)構(gòu)造所需要的力場參數(shù),并對參數(shù)的 質(zhì)量進(jìn)行分析。
      數(shù)據(jù)庫204中儲存的分子片斷包括分子的三維坐標(biāo),原子類型以及原子電 荷數(shù)據(jù)。
      儲存的基準(zhǔn)數(shù)據(jù)包括量子力學(xué)計(jì)算的能量、能量的一、二階導(dǎo)數(shù)、電荷和頻率。
      儲存的擬合結(jié)果為擬合得到的分子力學(xué)力場參數(shù)。 其具體存儲方式如圖8數(shù)據(jù)庫結(jié)構(gòu)示意圖所示
      "Index Entries"為某一示例分子片斷的索引號。在該索引號下,分別存儲 了該分子的編號ID、 SMILES字符串、名稱Name、分子量mol.wt、公式Formula
      以及原子存儲位置信息、量化數(shù)據(jù)存儲位置信息、力場數(shù)據(jù)存儲位置信息和用 戶記錄信息存儲位置信息。其中的原子存儲位置信息、量化數(shù)據(jù)存儲位置信息、 力場數(shù)據(jù)存儲位置信息和用戶記錄信息存儲位置信息分別都對應(yīng)了其相應(yīng)的 真是信息。方便檢索,使用以及管理。
      權(quán)利要求
      1.分子力學(xué)力場參數(shù)的自動化生成方法,其特征在于,可以用計(jì)算機(jī)程序?qū)崿F(xiàn)的自動制作分子力學(xué)力場的方法,該方法包含以下步驟a)用目標(biāo)分子尋找可以用來制作其分子力場參數(shù)的唯一的一組分子模型集合,b)實(shí)施量子力學(xué)計(jì)算得到可以用來擬合分子力學(xué)力場的基準(zhǔn)數(shù)據(jù),c)無須人力干預(yù)的擬合大量非線性數(shù)據(jù)的程序,d)用數(shù)據(jù)庫儲存管理上述數(shù)據(jù)和擬合結(jié)果。
      2. 根據(jù)權(quán)利要求l所述的分子力學(xué)力場參數(shù)的自動化生成方法,其特征在于,所述的用目標(biāo)分子尋找可以用來制作其分子力場參數(shù)的唯一的一組分子模型集合包括下述步驟a) 對任意給定的分子系統(tǒng)中確定組成該分子的、適合制作其分子力學(xué)力場的分子片斷集的方法,b) 用模式識別的方法過濾得到的分子片斷集除去其中的子片斷,c) 用加氫的方法將得到的分子片斷制作成完整的分子模型。
      3. 根據(jù)權(quán)利要求l所述的分子力學(xué)力場參數(shù)的自動化生成方法,其特征在 于,所述的實(shí)施量子力學(xué)計(jì)算得到可以用來擬合分子力學(xué)力場的基準(zhǔn)數(shù)據(jù)包括下述步驟a) 根據(jù)輸入的分子片斷以及制作分子力學(xué)力場的需要確定分步實(shí)施的量子 力學(xué)計(jì)算的參數(shù),b) 實(shí)施和監(jiān)督量子力學(xué)計(jì)算的過程,c) 檢驗(yàn)量子力學(xué)計(jì)算的結(jié)果,將量子力學(xué)計(jì)算的結(jié)果轉(zhuǎn)換為可以用來推導(dǎo) 分子力學(xué)力場參數(shù)的數(shù)據(jù)。
      4. 根據(jù)權(quán)利要求1所述的分子力學(xué)力場參數(shù)的自動化生成方法,其特征在于,所述的無須人力干預(yù)的擬合大量非線性數(shù)據(jù)的程序包括下述步驟a) 根據(jù)導(dǎo)入的分子模型和量子力學(xué)計(jì)算的基準(zhǔn)數(shù)據(jù)估算初始力場參數(shù),b) 根據(jù)導(dǎo)入的分子模型和量子力學(xué)計(jì)算的基準(zhǔn)數(shù)據(jù)選擇擬合方法,c) 實(shí)施、監(jiān)督和管理擬合過程的方法。
      5. 根據(jù)權(quán)利要求l所述的分子力學(xué)力場參數(shù)的自動化生成方法,其特征在 于,所述的用數(shù)據(jù)庫儲存管理上述數(shù)據(jù)和擬合結(jié)果包括下述步驟a) 儲存分子模型中的原子的三維坐標(biāo),原子類型、原子電荷數(shù)據(jù),b) 儲存量子力學(xué)計(jì)算的能量、能量的一、二階導(dǎo)數(shù)、電荷、頻率數(shù)據(jù),c) 儲存擬和得到的分子力學(xué)力場參數(shù)。
      6. 根據(jù)權(quán)利要求4所述的分子力學(xué)力場參數(shù)的自動化生成方法,其特征在 于,所述的根據(jù)導(dǎo)入的分子模型和基準(zhǔn)數(shù)據(jù)估算初始力場參數(shù)包括下述步驟a) 根據(jù)分子力場類型選定函數(shù)形式,b) 給分子模型中的原子指定原子類型,c) 根據(jù)基本原子參數(shù)估算初始分子力場參數(shù)。
      7. 根據(jù)權(quán)利要求4所述的分子力學(xué)力場參數(shù)的自動化生成方法,其特征在 于,所述的根據(jù)導(dǎo)入的分子模型和基準(zhǔn)數(shù)據(jù)選擇擬合方法包括下述步驟-a) 用Levenberg-Marquardt非線性最小二乘擬合方法確定非線性參數(shù),b) 用SVD方法確定線性參數(shù),c) 用SUMT方法控制參數(shù)可調(diào)范圍。
      8. 根據(jù)權(quán)利要求4所述的分子力學(xué)力場參數(shù)的自動化生成方法,其特征在 于,所述的實(shí)施、監(jiān)督和管理擬合過程的方法包括下述步驟a) 驗(yàn)證輸入的分子模型和基準(zhǔn)數(shù)據(jù)的一致性,b) 根據(jù)輸入的分子模型和基準(zhǔn)數(shù)據(jù)估算初始力場參數(shù),c) 根據(jù)輸入基準(zhǔn)數(shù)據(jù)分步擬和分子力場參數(shù),d) 檢驗(yàn)得到的分子力場參數(shù)和基準(zhǔn)數(shù)據(jù)的符合程度。
      全文摘要
      本發(fā)明涉及分子力學(xué)力場參數(shù)的自動化生成方法,包含了自動生成分子模擬必需的分子力學(xué)力場參數(shù)的方法,可應(yīng)用于材料科學(xué)、生命科學(xué)、藥物科學(xué)和化學(xué)化工等方面的基礎(chǔ)研究。本發(fā)明主要內(nèi)容是為目標(biāo)分子尋找可以用來制作其分子力場參數(shù)的唯一的一組分子模型集合;對分子模型集合實(shí)施量子力學(xué)計(jì)算,以得到可以用來擬合分子力學(xué)力場的基準(zhǔn)數(shù)據(jù);自動擬合大量非線性數(shù)據(jù);自動驗(yàn)證擬合的結(jié)果;以及用數(shù)據(jù)庫方法儲存管理上述數(shù)據(jù)和擬合結(jié)果。本發(fā)明是為了解決缺乏完整準(zhǔn)確的力場這一在當(dāng)前分子模擬技術(shù)廣泛應(yīng)用中的瓶頸問題。本發(fā)明提供了一個新的,能夠快速、準(zhǔn)確、自動地推導(dǎo)分子力場的系統(tǒng)方法。
      文檔編號G06F17/50GK101131707SQ20061003046
      公開日2008年2月27日 申請日期2006年8月25日 優(yōu)先權(quán)日2006年8月25日
      發(fā)明者淮 孫 申請人:屹昂計(jì)算化學(xué)軟件(上海)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1