国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于差分進化和構象空間退火的蛋白質三維結構預測方法

      文檔序號:6505901閱讀:247來源:國知局
      基于差分進化和構象空間退火的蛋白質三維結構預測方法
      【專利摘要】針對蛋白質三維結構預測這個高維復雜的優(yōu)化問題,本發(fā)明提出了一種綜合差分進化算法和構象空間退火算法的一種蛋白質三維結構預測方法,將差分進化算法融入到構象空間退火算法中,形成混合優(yōu)化算法。在構象空間退火算法的框架下,差分進化算法能夠很好的提高種群的多樣性,同時差分進化算法中的全局優(yōu)化因子能夠增加種群競爭,提高了算法的收斂能力。仿真結果表明,該方法具有較好的收斂性能和預測精度,能夠有效的找到腦啡肽的全局能量最小對應的結構。
      【專利說明】基于差分進化和構象空間退火的蛋白質三維結構預測方法
      【技術領域】
      [0001]本發(fā)明涉及蛋白質三維結構預測【技術領域】,特別涉及一種基于差分進化和構象空間退火相結合的一種蛋白質三維結構預測方法,屬于將現(xiàn)代智能優(yōu)化方法應用到蛋白質三維結構的工程預測方法。
      【背景技術】
      [0002]隨著人類基因組計劃的完成和蛋白質的研究日益深入,在當今分子生物學領域中,蛋白質分子空間結構與功能的研究無疑是最具有挑戰(zhàn)性的問題。三聯(lián)密碼的破譯使人們掌握了遺傳信息從DNA到氨基酸序列的復制規(guī)律,然而僅有氨基酸序列是不夠的,氨基酸序列還必須形成一定的空間結構,才真正完成了蛋白質的合成,也才能行使其特定的生物功能,因此蛋白質結構的確定將是研究其生物功能的基礎。同時蛋白質結構預測對于全新蛋白質分子設計、藥物分子設計、生物和化學催化劑、光能-化學能-動能的轉換、生物傳感器、以及環(huán)境科學等許多領域都有深遠的意義。特別是隨著2000年基因組工作草圖的完成,基因組的工作重心已經(jīng)從測序轉向了基因功能的識別,這一問題的解決顯得尤為重要。人們通過研究蛋白質的內在結構來了解其內在機理,并找出蛋白質折疊的真正驅動力,這樣可以按照人們的設想設計出符合特定需求的非天然蛋白質,對疾病進行有效的預測和控制。
      [0003]然而蛋白質結構的測定遠遠趕不上基因組測序速度,X射線晶體學方法和多維核磁共振技術是目前測定蛋白質結構的主要物理方法。用X射線晶體學方法測定蛋白質結構不僅需要花相當長的時間,在技術上也受到相當大的限制;多維核磁共振技術能夠有效測定蛋白質的結構,但僅適用于小蛋白。因此,單純依靠試驗方法測定所有蛋白質的空間結構遠遠不能滿足后基因時代對于蛋白質數(shù)據(jù)分析的需求,有必要發(fā)展一種可靠的理論預測方法,從而迅速、簡便的獲取蛋白質的結構信息。
      [0004]早在1961年,Anfinsen提出蛋白質一級結構完全決定其空間結構的著名論斷,并因此獲得諾貝爾獎,從此揭開了理論預測蛋白質結構的序幕。解決蛋白質空間結構預測問題可以分為三部曲:即首先進行形式化,將蛋白質結構抽象轉化成一個數(shù)學模型;然后分析模型的可計算性;最后進行算法設計,從算法的時間和空間復雜度出發(fā),尋找最優(yōu)算法。理論計算方法(也稱熱力學方法)是一種常用的蛋白質結構預測方法,由于它僅利用一級序列信息進行預測,而不需要任何其他已知蛋白質結構信息,所以該方法是比較理想的預測方法。其基本假設是:一定環(huán)境中的天然蛋白質的三維結構是整個系統(tǒng)自由能最小的結構。要實現(xiàn)這一方法有兩個關鍵:一是要有一個合理的勢函數(shù),勢函數(shù)的全局極小值對應蛋白質的天然結構;二是要有個好的算法,保證在有效的計算時間找到勢能函數(shù)的全局最小。
      [0005]目前,根據(jù)Anfinsen假設,直接從氨基酸序列出發(fā),基于分子力場勢能模型,采用全局優(yōu)化方法,在其勢能面上搜索蛋白質分子系統(tǒng)的最小能量狀態(tài),從而能夠高通量、廉價地預測肽鏈的天然構像,已經(jīng)成為生物信息學最重要的研究課題之一。由于蛋白質是一種強柔性的大分子體系,其勢函數(shù)表達式極其復雜,存在極多局部極小點。據(jù)估計,N個殘基的氨基酸序列,其局部極小點在IOn以上,而迄今發(fā)現(xiàn)的蛋白質中肽鏈平均含300-500個氨基酸殘基,所以有效解決全局優(yōu)化問題是蛋白質結構預測中的一個關鍵。
      [0006]近年來,許多隨機全局優(yōu)化算法陸續(xù)提出來解決蛋白質三維結構預測問題,如遺傳算法、差分進化算法、構象空間退火算法。差分進化算法雖然具有較強的全局搜索能力和求解問題的能力,還具有簡單、通用和并行處理等特點。但是用差分進化這種群體優(yōu)化算法處理多模態(tài)優(yōu)化問題時,由于使用了全局選擇因子,算法只能收斂到全局最優(yōu)解,而忽略了眾多局部極值解;其次,模型的復雜性造成這些算法極易陷入某個局優(yōu)解;同時差分這種隨機算法缺乏全局收斂理論依據(jù)及解的不確定性,進一步限制了它們在實際問題中的應用。
      [0007]構象空間退火算法結合了遺傳算法、模擬退火等算法的優(yōu)點,具有很好的搜索全局最優(yōu)的能力。在構象空間退火法中,首先以一組隨機選擇的蛋白質構象開始,然后對這些構想進行能量極小化,所得到的局部最小蛋白質構象作為種群庫中的新成員,這些構象要求是隨機分布的,并且在相互獨立的條件下進一步被優(yōu)化,以覆蓋種群庫中盡可能大的區(qū)域。單種智能算法總存在一些算法固有的缺點,而將兩種或多種智能算法按照某種規(guī)則融合在一起或在單種智能算法中引入其他優(yōu)化思想,形成混合優(yōu)化算法,則可以有效地揚長避短,發(fā)揮智能算法的優(yōu)點,大大提高算法的全局和局部收斂能力。構象空間退火法雖然能夠很好的解決蛋白質三維結構預測問題,但是由于蛋白質結構極其復雜,其勢能函數(shù)曲面分布大量的局部極值點,而構象空間退火算法優(yōu)化種群較小,優(yōu)化過程中種群多樣性較小,同時種群缺乏競爭機制,所以算法容易陷入局部極值解。

      【發(fā)明內容】

      [0008]本發(fā)明針對現(xiàn)有的蛋白質三維結構預 測在采用單一現(xiàn)代進化算法時,容易陷入極小值、預測效率差等缺點,提出了一種綜合構象空間退火算法和差分進化算法的一種蛋白質三維結構預測方法。
      [0009]實現(xiàn)本發(fā)明而采取的技術方案概括如下:
      [0010]1、選擇優(yōu)化目標,即蛋白質力場模型函數(shù)E⑴。
      [0011]2、初始化進化種群:隨機產(chǎn)生Nbank個蛋白質結構作為初始種群Ρ0Ρ,同時設定算法各參數(shù),并使用擬牛頓法對初始種群進行能量極小化處理。
      [0012]3、將處理過的Nbank個蛋白質個體作為初始種群庫firstbank,并設定初始Dcut=l/2Dave 其中 D— = -τ;~~In Σ Σ Σ |,其中 i 關 j,Ndre 表示的是優(yōu)化目標
      ’iyBank \iybank ~l) i=l./=1 k=l
      的維數(shù),名表示的是第i個蛋白質結構的第k個二面角。
      [0013]4、將firstbank中的個體直接復制給Bank中,并更新Bank中的個體。
      [0014]5、隨機從Bank中選取M個個體作為種子,每個種子按照以下四種擾動策略產(chǎn)生10個新的個體,總共產(chǎn)生M*10個新個體。同時檢查Bank中的個體是否全部都作為過種子,若庫中的個體全部做過種子,而循環(huán)仍然沒有結束,則重新隨機產(chǎn)生Nbank個蛋白質結構加入Bank 中。
      [0015]5.1以基本差分進化算法中變異操作產(chǎn)生3個新的蛋白質結構,其中具體操作公式為:u = xa+F.(xb-xc) a ^ b ^ c,其中公式中基準矢量Xa為種子個體;個體Xb和X。是隨機從Bank中選取的蛋白質結構,F(xiàn)為變異因子。
      [0016]5.2以改進差分進化算法中變異操作產(chǎn)生3個新的蛋白質結構,其中具體操作公式為:u = Xbest+F.(xb-xc) best關b關c,其中Xbest是Bank庫中能量最低個體;xb和Xc是隨機從Bank中選取的蛋白質結構,F(xiàn)為變異因子。
      [0017]5.3隨機選取一種蛋白質結構片段(小組),同時隨機從M個種子中和Bank中各選取一個種子和待測試個體,將待測試個體中和小組相對應的局部片段直接復制給種子相應的片段。以這種擾動策略產(chǎn)生2個新的蛋白質結構。
      [0018]5.4隨機選取一種蛋白質結構片段(組合組),同時隨機從M個種子中和Bank中各選取一個種子和待測試個體,將待測試個體中和組合組相對應的局部片段直接復制給種子相應的片段。以這種擾動策略產(chǎn)生2個新的蛋白質結構。
      [0019]6、將新產(chǎn)生的個體經(jīng)擬牛頓法進行能量極小化處理,然后將這些新產(chǎn)生的蛋白質結構更新給Bank各種子生境中。其中更新的具體操作:
      [0020]6.1、通過計算新產(chǎn)生個體B和Bank中的種子A之間的距離d(A, B),再將d(A, B)
      和Deut進行比較。其中=拉(x:4-.4f , s表示的是蛋白質結構A的第S個二面角,Nfce
      V S=IxA
      表示的是優(yōu)化目標的維數(shù)。
      [0021]6.2、若d (A, BXDcut,則將新產(chǎn)生個體更新至此種子的生境中,同時若個體B所代表的能量值小于若小于A,則B成為這個種子生境的代表。
      [0022]6.3、若新產(chǎn)生個體B不屬于Bank中任何的種子生境,則重新成為一個種子生境,同時為了保證Bank中生境總數(shù)不變,則移除Bank中能量值最大的種子生境。
      [0023]7、檢測此時種群中是否出現(xiàn)蛋白質全局能量最小結構。如若找到循環(huán)結束;若沒
      找到循環(huán)繼續(xù)。每循環(huán)一輪,通過減小Drat大小更新Bank,使Drat減小至| D.。
      [0024]8、循環(huán)執(zhí)行步驟4-7,直至達到終止條件或找到蛋白質的全局能量最小結構。
      [0025]針對蛋白質三維結構預測這個高維復雜的優(yōu)化問題, 本發(fā)明的優(yōu)點是:本發(fā)明提出了一種基于構象空間退火和差分進化相結合的一種蛋白質三維結構預測方法,在構象空間退火算法的框架下,差分進化算法能夠很好的提高種群的多樣性,同時差分進化算法中的全局優(yōu)化因子能夠增加種群競爭,提高了算法的收斂能力。
      【專利附圖】

      【附圖說明】
      [0026]圖1為本發(fā)明中算法的算法流程圖;
      [0027]圖2為算法對蛋白質構象相對應小組的劃分圖;
      [0028]圖3為本發(fā)明中算法所得到全局能量最低的腦啡肽PDB圖;
      【具體實施方式】
      [0029]下面結合附圖和實施例對本發(fā)明進行詳細的描述。
      [0030]腦啡肽(Try1-Gly2-Gly3-Phe4-Met5)是由五個氨基酸組成的蛋白質分子,由75個原子組成,可用24個獨立的主-側鏈二面角描述,公認的腦啡肽穩(wěn)定能量值為-11.707kcal/molo參照圖2,算法將腦啡肽為例,將其對應的24個二面角分為8個小組,小組中的P、Ψ、ω代表腦啡肽主鏈中的二面角,X 1代表腦啡肽側鏈中的二面角。在算法中,我們進一步的將8個小組分為7個集合組,如下表1所示。小組和集合組中的成員分別對應24個二面角中的某些片段,這些小組和組合組類似于原始集結過程中兩種不同的片段。
      [0031]表1
      [0032]
      【權利要求】
      1.一種基于混合優(yōu)化算法的蛋白質三維結構預測方法,其特征是:在構象空間退火算法的基礎上,綜合了差分進化算法,引入了幾種不同的種子擾動策略,對蛋白質三維結構進行優(yōu)化搜索,具體實現(xiàn)如下: 1)、選擇優(yōu)化目標,確定蛋白質的力場模型函數(shù)E(X); 2)、初始化進化種群:隨機產(chǎn)生Nbank個蛋白質結構作為初始種群POP,同時設定算法各參數(shù),并使用擬牛頓法對初始種群進行能量極小化處理; 3)、將處理過的Nbank個蛋白質個體作為初始種群庫firstbank,并設定初始Deut=l/2Dave, 其
      2.如權利要求1中所述的方法,其特征在于:步驟5)針對種子的擾動策略: `5.1以基本差分進化算法中變異操作產(chǎn)生3個新的蛋白質結構,其中具體操作公式為:u = xa+F.(xb-x。) a ^ b ^ c,其中公式中基準矢量Xa為種子個體;個體Xb和X。是隨機從Bank中選取的蛋白質結構,F(xiàn)為變異因子; `5.2以改進差分進化算法中變異操作產(chǎn)生3個新的蛋白質結構,其中具體操作公式為:u = Xbest+F.(xb-x。) best ^ b ^ c,其中Xbest是Bank庫中能量最低個體;xb和X。是隨機從Bank中選取的蛋白質結構,F(xiàn)為變異因子; `5.3隨機選取一種蛋白質結構劃分方式(小組),同時隨機從M個種子中和Bank中各選取一個種子和待測試個體,將待測試個體中和小組相對應的局部片段直接復制給種子相應的片段,以這種擾動策略產(chǎn)生2個新的蛋白質結構;`5.4隨機選取一種蛋白質結構劃分方式(組合組),同時隨機從M個種子中和Bank中各選取一個種子和待測試個體,將待測試個體中和組合組相對應的局部片段直接復制給種子相應的片段,以這種擾動策略產(chǎn)生2個新的蛋白質結構。
      【文檔編號】G06F19/16GK103473482SQ201310299435
      【公開日】2013年12月25日 申請日期:2013年7月15日 優(yōu)先權日:2013年7月15日
      【發(fā)明者】張貴軍, 程正華, 姚春龍, 鄧勇躍, 周曉根, 陳先跑 申請人:浙江工業(yè)大學
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1