国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      多級質(zhì)譜生物大分子結構鑒定方法

      文檔序號:9248424閱讀:973來源:國知局
      多級質(zhì)譜生物大分子結構鑒定方法
      【技術領域】
      [0001] 本發(fā)明設及生物信息技術和計算技術領域,具體地說,本發(fā)明設及一種使用多級 質(zhì)譜技術進行生物大分子結構鑒定的方法。
      【背景技術】
      [0002] 本發(fā)明中,生物大分子主要是指核酸、蛋白質(zhì)、脂類和糖類化合物等作為細胞的主 要成分的大分子。在生物信息領域,對生物大分子結構的鑒定在細胞周期調(diào)控、調(diào)亡衰老、 細胞表面的相互作用等生命過程的研究中起到十分重要的作用。
      [0003] 在各種生物大分子的鑒定中,由于糖類化合物W多種結構構型存在于細胞中,因 此其復雜性通常也相對較高。例如:對蛋白質(zhì)數(shù)據(jù)庫SWISS-PROT的分析表明;超過一半的 蛋白質(zhì)W糖基化形式存在。此外,糖類還常常與脂類化合物連接形成糖脂。另外,糖類化合 物通常由多個單糖通過糖巧鍵連接而成,并呈現(xiàn)出樹形的分枝結構。因此,糖類化合物結 構鑒定包括對糖類分子組成、單糖的連接順序與分枝位置等信息的分析。圖1示出了N糖 GlcNAc2Man9糖結構的多種經(jīng)典表示方式,雖然表示方式不同,但它們都是二維的樹形結 構,其中根節(jié)點位于結構的最右邊,子節(jié)點向左逐步延伸;每一個節(jié)點代表一個單糖;每一 條邊代表連接兩個單糖的糖巧鍵。圖2示出了糖結構中典型的糖巧鍵的表示方式。在上述 圖中,一個單糖可W通過糖巧鍵跟另外一個或多個單糖相連接,該種分枝結構的復雜性導 致了糖類化合物結構構型的多樣性。
      [0004] 現(xiàn)有的基于質(zhì)譜的糖類化合物鑒定大多是基于一級質(zhì)譜或二級質(zhì)譜數(shù)據(jù)的策略。 一級質(zhì)譜只能得到母離子質(zhì)量,不能給出糖類化合物的詳細信息,例如支鏈信息、結構信息 和鏈接位點信息等。二級質(zhì)譜是將糖在質(zhì)譜儀中進一步打碎成碎片進行分析,現(xiàn)有技術中 的基于二級質(zhì)譜的糖結構鑒定策略主要包括W下幾種:
      [0005] (1)結構庫捜索策略;對糖結構庫中的每個已知糖結構,首先預測其理論質(zhì)譜;然 后將待鑒定質(zhì)譜與理論質(zhì)譜逐一進行比較,返回相似度最高的理論譜所對應的糖結構作為 鑒定結果。其缺陷是;糖結構庫捜索策略依賴于理論質(zhì)譜的預測,而目前對于質(zhì)譜形成機制 認識仍然有局限,導致理論質(zhì)譜預測的精度不高,從而影響了鑒定結果的準確性。
      [0006] (2)DeNovo結構鑒定策略:它的基本思想是通過譜圖中譜峰間的m/z差值,來推 斷可能的糖結構。與糖結構庫捜索策略不同,DeNovo結構鑒定策略不依賴于已知的糖結 構數(shù)據(jù)庫,而是直接對質(zhì)譜數(shù)據(jù)進行分析,然而DeNovo策略的鑒定準確度嚴重依賴于質(zhì)譜 譜圖數(shù)據(jù)質(zhì)量。在高質(zhì)量的質(zhì)譜數(shù)據(jù)中,每一個糖巧鍵都會有相應的碎裂離子出現(xiàn);而在低 質(zhì)量的質(zhì)譜中,部分離子的缺失導致DeNovo策略無法得出準確的鑒定結果。此外,由于要 枚舉所有可能的糖結構,DeNovo策略通常速度較慢。
      [0007] (3)譜庫捜索策略:該種策略的基本思想是將已知鑒定結果的二級質(zhì)譜質(zhì) 譜-結構對"的映射形式收錄于數(shù)據(jù)庫中,然后將待鑒定質(zhì)譜與質(zhì)譜數(shù)據(jù)庫中的真實譜進行 比較,返回相似度最高的糖結構作為鑒定結果。該種策略的優(yōu)點是:與糖結構庫捜索策略相 比,譜庫捜索策略使用已知的真實譜,而不是預測出的理論譜進行比較,從而使得鑒定結果 更可信。然而,原則上來說,譜庫捜索策略僅適用于已鑒定過的譜,對于未收錄的質(zhì)譜則無 法鑒定;此外,在收錄"質(zhì)譜-結構對"數(shù)據(jù)庫時的誤差,將會影響候選鑒定結果的準確度。 [000引總而言之,相對于糖類化合物復雜的結構來說,二級質(zhì)譜僅提供了有限的信息,從 而導致基于二級質(zhì)譜的糖類化合物鑒定策略準確度不高。基于此,有些研究者使用多種質(zhì) 譜聯(lián)合的方式,W期提高鑒定結果的準確度。其中一種方案是;使用多種質(zhì)譜儀對同一樣品 進行多次實驗,從而獲得多種類型的質(zhì)譜,期望利用更多的碎裂信息實現(xiàn)糖結構的鑒定。例 如,對同一糖樣品分別使用CID質(zhì)譜儀和ETD質(zhì)譜儀進行碎裂,產(chǎn)生兩張包含不同碎裂信息 的質(zhì)譜,然后綜合利用兩張質(zhì)譜的碎裂信息進行糖結構鑒定。然而,多糖化合物結構往往十 分復雜,兩次實驗所提供的碎裂信息,通常遠遠達不到準確鑒定各種同分異構體的需求;而 如果對同一糖樣品進行大量的實驗,雖然能夠提供足夠的碎裂信息,但該種鑒定方案的開 銷過大,尤其是需要借助多臺不同型號的質(zhì)譜儀,導致鑒定過程復雜同時也增加了鑒定成 本。
      [0009] 有研究者進一步提出另一種方案;多級質(zhì)譜捜索策略,即使用超過二級質(zhì)譜的多 級質(zhì)譜能夠提供更多的斷裂信息,來實現(xiàn)同分異構體的逐步區(qū)分。一種已有的使用多級質(zhì) 譜鑒定方法是將多級質(zhì)譜與譜庫捜索策略相結合,使用已知糖結構的二級和=級質(zhì)譜構建 "質(zhì)譜-結構對"數(shù)據(jù)庫。此方法在一定程度上提高了鑒定準確度,但是由于其譜庫中譜數(shù) 據(jù)量少、物種單一,且多級質(zhì)譜數(shù)據(jù)僅局限于S級質(zhì)譜,所W對于某些糖類化合物的同分異 構體依然無法準確區(qū)分。
      [0010] 綜上所述,當前迫切需要一種能夠W較小的開銷實現(xiàn)高準確度的多級質(zhì)譜鑒定的 解決方案。

      【發(fā)明內(nèi)容】

      [0011] 因此,本發(fā)明的任務是克服現(xiàn)有技術的上述缺陷,提供一種多級質(zhì)譜鑒定的解決 方案。
      [0012] 本發(fā)明提供了一種多級質(zhì)譜生物大分子結構鑒定方法,包括下列步驟:
      [0013] 1)對生物大分子樣品進行二級質(zhì)譜分析,將所獲得的二級質(zhì)譜作為當前質(zhì)譜;
      [0014] 2)在當前質(zhì)譜中,選擇產(chǎn)生下一級質(zhì)譜的離子,基于所選擇的離子進行質(zhì)譜實驗 獲得所述下一級質(zhì)譜;
      [0015] 3)使用層次貝葉斯模型將所述當前質(zhì)譜的后驗概率W先驗概率的方式代入所述 下一級質(zhì)譜,進而對每個候選結構對應的理論質(zhì)譜進行譜譜比對打分,其中,所述候選結構 根據(jù)當前質(zhì)譜的母離子質(zhì)量進行結構庫捜索得出;
      [0016] 4)如果無法根據(jù)當前的譜譜比對打分結果得出唯一的匹配結構,則將所述下一級 質(zhì)譜作為當前質(zhì)譜,重復步驟2)進行下一級的質(zhì)譜分析,直至得出唯一的匹配結構。。
      [0017] 其中,所述步驟2)中,所述產(chǎn)生下一級質(zhì)譜的離子根據(jù)各候選離子對應的信息滴 選出。
      [0018] 其中,所述步驟2)中,所述產(chǎn)生下一級質(zhì)譜的離子的選擇方法如下:
      [0019] 21)根據(jù)當前的質(zhì)譜的譜峰,選擇產(chǎn)生下一級質(zhì)譜的候選離子;
      [0020] 22)計算各候選離子對應的信息滴;其中,對于每一個候選離子,模擬生成其所有 可能形成的下一級可能質(zhì)譜;然后每個可能質(zhì)譜存在的條件下,更新每個候選結構的后驗 概率,計算得到后驗概率的信息滴作為該可能質(zhì)譜的信息滴;對于每一個候選離子,計算該 候選離子所有可能質(zhì)譜的平均信息滴,將該個平均信息滴作為該候選離子對應的信息滴;
      [0021] 23)根據(jù)所述各候選離子對應的信息滴選擇產(chǎn)生下一級質(zhì)譜的離子。
      [0022] 其中,所述步驟23)還包括:選擇各候選離子中對應信息滴最小的作為產(chǎn)生下一 級質(zhì)譜的離子。
      [0023] 其中,所述步驟23)還包括:結合各候選離子的豐度和的對應信息滴選擇產(chǎn)生下 一級質(zhì)譜的離子;其中,根據(jù)豐度篩除部分候選離子,然后在剩余的候選離子中,選擇對應 信息滴最小的作為產(chǎn)生下一級質(zhì)譜的離子。
      [0024] 其中,所述步驟21)還包括:從候選譜峰離子中,排除在所有的候選結構中對應于 相同的子結構的離子。
      [0025] 其中,所述步驟22)中,候選離子對應的信息滴的計算方法包括下列步驟:
      [0026] 221)對于當前實驗質(zhì)譜中的候選離子i,分析其再次碎裂后可能產(chǎn)生的各個碎片 離子,得到每個碎片離子所對應的理論峰,每個理論峰在譜中出現(xiàn)或者不出現(xiàn)構成所有理 論譜的集合…,Sw,…,Si,。},其中Sw表示第i個離子產(chǎn)生的第j種可能的質(zhì) 譜;
      [0027] 222)然后計算每一個候選結構在下一級質(zhì)譜實驗中產(chǎn)生質(zhì)譜Sw的概率P(Si, JIGk,si,…sM),其中M表示當前已得到的實驗譜的個數(shù);進一步地,計算各個可能質(zhì)譜 分別存在的情況下,各個候選結構是正確結構的概率,并計算該概率集合的信息滴H(sw); 進而計算第i個離子產(chǎn)生的所有可能質(zhì)譜sw得到的信息滴的均值H(Si)。
      [002引其中,所述步驟3)還包括:根據(jù)概率P(Gi|Si)和理論譜中的每個峰在實驗譜中出 現(xiàn)的概率
      當前第1頁1 2 3 4 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1