一種生物質(zhì)譜重疊同位素輪廓的解析方法
【專利摘要】本發(fā)明涉及一種生物質(zhì)譜重疊同位素輪廓的解析方法。本解析方法基于所述質(zhì)譜的原始一級和二級質(zhì)譜,通過計算重疊同位素峰的理想實驗強(qiáng)度及其與實際實驗強(qiáng)度的偏差從而計算重疊同位素峰在各同位素輪廓中的實際分配強(qiáng)度。與現(xiàn)有技術(shù)相比,本發(fā)明的解析方法對重疊同位素峰的強(qiáng)度的解析和拆分計算量小,通量高,準(zhǔn)確度高,適用于生物大分子(如蛋白質(zhì),糖類)質(zhì)譜及串級質(zhì)譜高效解析及結(jié)構(gòu)準(zhǔn)確鑒定。
【專利說明】一種生物質(zhì)譜重疊同位素輪廓的解析方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種生物質(zhì)譜重疊同位素輪廓的解析方法,主要涉及與生物質(zhì)譜相關(guān) 的系統(tǒng)生物學(xué)領(lǐng)域,包括蛋白質(zhì)組學(xué)、代謝組學(xué)、糖組學(xué)等【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002] 隨著軟電離技術(shù)(如電噴霧電離)及高分辨質(zhì)量分析器(如軌道阱)的發(fā)展和商 業(yè)化,質(zhì)譜越來越多地用于生物大分子(如蛋白質(zhì)、多糖)的分析。
[0003] 中國專利CN 103389335 A公布了一種通過分析生物大分子質(zhì)譜數(shù)據(jù)來鑒定生物 大分子一級結(jié)構(gòu)和組成的分析裝置和方法。該分析裝置和方法基于所述生物大分子的原始 一級和二級質(zhì)譜,通過同位素峰質(zhì)荷比及輪廓指紋比對從而對該生物大分子進(jìn)行鑒定。上 述分析裝置和方法直接利用質(zhì)譜儀所采集的原始實驗質(zhì)譜數(shù)據(jù),對前體離子和碎片離子同 位素輪廓中每個原始實驗同位素峰的精確質(zhì)荷比和相對強(qiáng)度與相應(yīng)的理論值進(jìn)行比對,分 別用于從數(shù)據(jù)庫中找到候選生物大分子和利用串級質(zhì)譜確認(rèn)其中可信度最高的一個,從而 對生物分子進(jìn)行高可信度的定性、定量分析。
[0004] 質(zhì)譜測量這些大分子的帶電離子(前體離子,一級質(zhì)譜)和相應(yīng)的碎片(碎片離 子,二級質(zhì)譜)。質(zhì)譜是橫軸為質(zhì)荷比、縱軸為強(qiáng)度的二維譜圖。由于同位素的存在,所有離 子(包括前體離子和碎片離子)在質(zhì)譜中均為包含若干個同位素峰的同位素輪廓。因為質(zhì) 譜橫軸,也就是質(zhì)量分析器對質(zhì)荷比的分析的有一定的范圍(如500-2000),而生物大分子 的碎片較多(且每個碎片一般以多個價態(tài)出現(xiàn)),二級質(zhì)譜中碎片離子的同位素輪廓有較 為密集的重疊。傳統(tǒng)基于"去卷積"(也稱作去同位素)的方法未能對這些重疊同位素輪廓 進(jìn)行有效的解析和拆分;新近發(fā)展的"同位素輪廓指紋比對"算法中的比例配分法雖然準(zhǔn)確 度高,但速度較慢。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的就是為了克服上述現(xiàn)有技術(shù)存在的缺陷而提供一種計算量小、通量 高、準(zhǔn)確度高的生物質(zhì)譜重疊同位素輪廓的解析方法。
[0006] 本發(fā)明的目的可以通過以下技術(shù)方案來實現(xiàn):
[0007] -種生物質(zhì)譜重疊同位素輪廓的解析方法,包括以下步驟:
[0008] (1)由質(zhì)譜圖中實驗同位素輪廓與數(shù)據(jù)庫中理論同位素輪廓的指紋比對找出重疊 離子及其所有同位素峰的理論相對強(qiáng)度與實驗絕對強(qiáng)度,包括重疊同位素峰的理論相對強(qiáng) 度與實際實驗絕對強(qiáng)度之和;
[0009] (2)以各參與重疊的離子的理論同位素輪廓中無重疊的最高峰作為參考峰,對相 應(yīng)的實驗同位素輪廓中每個同位素峰的實驗強(qiáng)度進(jìn)行歸一化;
[0010] (3)計算重疊同位素峰在各個重疊離子中的理想實驗絕對強(qiáng)度;
[0011] (4)計算重疊同位素峰實際實驗絕對強(qiáng)度之和相對于理想實驗絕對強(qiáng)度之和的強(qiáng) 度偏差;
[0012] (5)計算重疊同位素峰在各參與重疊的離子中的實際實驗絕對強(qiáng)度。
[0013] 步驟(3)中,重疊同位素峰在各個重疊離子中的理想實驗絕對強(qiáng)度通過以下公式 計算得到:
[0014] 各重疊同位素峰的理想實驗絕對強(qiáng)度=各參與重疊的同位素峰的理論相對強(qiáng)度* 參考同位素峰實際實驗絕對強(qiáng)度/參考同位素峰理論相對強(qiáng)度。
[0015] 步驟(4)中,重疊同位素峰實際實驗絕對強(qiáng)度之和相對于理想實驗絕對強(qiáng)度之和 的強(qiáng)度偏差通過以下公式計算得到:
[0016] 重疊同位素峰實際實驗絕對強(qiáng)度之和相對于理想實驗絕對強(qiáng)度之和的強(qiáng)度偏差 =[重疊同位素峰的實際實驗絕對強(qiáng)度之和-(重疊同位素峰在各重疊離子中的理想實驗 絕對強(qiáng)度總和)v(重疊同位素峰在各重疊離子中的理想實驗絕對強(qiáng)度總和)。
[0017] 步驟(5)中,重疊同位素峰在各參與重疊的離子中的實際實驗絕對強(qiáng)度通過以下 公式計算得到:
[0018] 重疊同位素峰在各參與重疊的離子中的實際實驗絕對強(qiáng)度=重疊同位素峰在各 重疊離子中的理想實驗絕對強(qiáng)度* (1+重疊同位素峰實際實驗絕對強(qiáng)度之和相對于理想實 驗絕對強(qiáng)度之和的強(qiáng)度偏差)。
[0019] 根據(jù)計算得到的重疊同位素峰在各參與重疊的離子中的實際實驗絕對強(qiáng)度,做出 解析后的同位素輪廓指紋比對圖。
[0020] 本發(fā)明涉及的方法同樣適用于其他質(zhì)譜以及任何二維數(shù)據(jù)中重疊輪廓信息和數(shù) 據(jù)的解析。
[0021] 與現(xiàn)有技術(shù)相比,本發(fā)明的解析方法基于所述質(zhì)譜的原始一級和二級質(zhì)譜,通過 計算重疊同位素峰的理想實驗強(qiáng)度及其與實際實驗強(qiáng)度的偏差從而計算重疊同位素峰在 各重疊同位素輪廓中的實際分配強(qiáng)度。本發(fā)明的解析方法對重疊同位素峰的強(qiáng)度的解析和 拆分計算量小,通量高,準(zhǔn)確度高,適用于生物大分子(如蛋白質(zhì)、糖類)串級質(zhì)譜高效解析 及結(jié)構(gòu)準(zhǔn)確鑒定。
【專利附圖】
【附圖說明】
[0022] 圖IA為泛素蛋白高能碰撞誘導(dǎo)解離二級質(zhì)譜中碎片離子y52_6+質(zhì)荷比為 982. 37582和983. 388428的重疊同位素峰(圖中箭頭標(biāo)注)重疊解析前的同位素輪廓指紋 比對圖;
[0023] 圖IB為泛素蛋白高能碰撞誘導(dǎo)解離二級質(zhì)譜中碎片離子y52_6+質(zhì)荷比為 982. 37582和983. 388428的重疊同位素峰(圖中箭頭標(biāo)注)重疊解析后的同位素輪廓指紋 比對圖;
[0024] 圖2A為泛素蛋白高能碰撞誘導(dǎo)解離二級質(zhì)譜中碎片離子y61-H20_7+質(zhì)荷比為 982. 37582和983. 388428的重疊同位素峰(圖中箭頭標(biāo)注)重疊解析前的同位素輪廓指紋 比對圖;
[0025] 圖2B為泛素蛋白高能碰撞誘導(dǎo)解離二級質(zhì)譜中碎片離子y61-H20_7+質(zhì)荷比為 982. 37582和983. 388428的重疊同位素峰(圖中箭頭標(biāo)注)重疊解析后的同位素輪廓指紋 比對圖。
[0026] 圖中m/z為質(zhì)荷比,Abundance (a. u.)為任意單位絕對實驗強(qiáng)度;Theo.為理論同 位素輪廓,Exp.為實驗同位素輪廓。
【具體實施方式】
[0027] 下面結(jié)合附圖和具體實施例對本發(fā)明進(jìn)行詳細(xì)說明。
[0028] 實施例
[0029] -種生物質(zhì)譜重疊同位素輪廓的解析方法,包括以下步驟:
[0030] (1)由質(zhì)譜圖中實驗同位素輪廓與數(shù)據(jù)庫中理論同位素輪廓的指紋比對找出重疊 離子及其所有同位素峰的理論相對強(qiáng)度與實驗絕對強(qiáng)度,包括重疊同位素峰的理論相對強(qiáng) 度與實際實驗絕對強(qiáng)度之和;
[0031] (2)以各參與重疊的離子的理論同位素輪廓中無重疊的最高峰作為參考峰,對相 應(yīng)的實驗同位素輪廓中每個同位素峰的實驗強(qiáng)度進(jìn)行歸一化;
[0032] (3)計算重疊同位素峰在各個重疊離子中的理想實驗絕對強(qiáng)度:
[0033] 各重疊同位素峰的理想實驗絕對強(qiáng)度=各參與重疊的同位素峰的理論相對強(qiáng)度* 參考同位素峰實際實驗絕對強(qiáng)度/參考同位素峰理論相對強(qiáng)度;
[0034] (4)計算重疊同位素峰實際實驗絕對強(qiáng)度之和相對于理想實驗絕對強(qiáng)度之和的強(qiáng) 度偏差:
[0035] 重疊同位素峰實際實驗絕對強(qiáng)度之和相對于理想實驗絕對強(qiáng)度之和的強(qiáng)度偏差 =[重疊同位素峰的實際實驗絕對強(qiáng)度之和_(重疊同位素峰在各重疊離子中的理想實驗 絕對強(qiáng)度總和)V(重疊同位素峰在各重疊離子中的理想實驗絕對強(qiáng)度總和);
[0036] (5)計算重疊同位素峰在各參與重疊的離子中的實際實驗絕對強(qiáng)度:
[0037] 重疊同位素峰在各參與重疊的離子中的實際實驗絕對強(qiáng)度=重疊同位素峰在各 重疊離子中的理想實驗絕對強(qiáng)度* (1+重疊同位素峰實際實驗絕對強(qiáng)度之和相對于理想實 驗絕對強(qiáng)度之和的強(qiáng)度偏差)。
[0038] 然后根據(jù)計算得到的重疊同位素峰在各參與重疊的離子中的實際實驗絕對強(qiáng)度, 做出解析后的同位素輪廓指紋比對圖。
[0039] 下面以泛素蛋白高能碰撞誘導(dǎo)解離二級質(zhì)譜中y52_6+和y61-H20_7+兩個重疊 離子的解析和拆分為例說明本解析方法的具體實施步驟和結(jié)果,如表1和圖IA?圖2B所 示。表1的行和列分別用阿拉伯?dāng)?shù)字和英文字母進(jìn)行標(biāo)記,格子則用字母和數(shù)字的組合來 表示,如B6表示第B列第6行。對于質(zhì)荷比在982. 385132處的重疊同位素峰,第一步分別 用B7*D8/B8和B12*D13/B13計算y52-6+和y61-H20-7+離子的理想實驗絕對強(qiáng)度,即格子 E3和F3中的數(shù)值;第二步,用公式(D3-(E3+F3)V(E3+F3)計算實際實驗絕對強(qiáng)度之和相 對于理想實驗絕對強(qiáng)度之和的強(qiáng)度偏差,即格子G3中的數(shù)值;第三步,用公式E3*(l+G3)和 F3* (1+G3)分別計算y52-6+和y61-H20-7+離子質(zhì)荷比為982. 385132的同位素峰的實際實 驗絕對強(qiáng)度。從表1列H和列G中相對強(qiáng)度偏差的比較來看,解析后的誤差較解析前分別 下降了 88和125個百分點。y52-6+和y61-H20-7+離子的另外一個重疊同位素峰(質(zhì)荷比 983. 388428)按上述同樣的步驟進(jìn)行解析和拆分后的結(jié)果也列于表1中。y52-6+離子重疊 同位素峰解析前后的同位素輪廓指紋比對圖分別于圖1A、圖IB所示。y61-H20-7+離子重 疊同位素峰解析前后的同位素輪廓指紋比對圖如圖2A、圖2B所示。
[0040] 表 1
[0041]
【權(quán)利要求】
1. 一種生物質(zhì)譜重疊同位素輪廓的解析方法,其特征在于,包括以下步驟: (1) 由質(zhì)譜圖中實驗同位素輪廓與數(shù)據(jù)庫中理論同位素輪廓的指紋比對找出重疊離子 及其所有同位素峰的理論相對強(qiáng)度與實驗絕對強(qiáng)度,包括重疊同位素峰的理論相對強(qiáng)度與 實際實驗絕對強(qiáng)度之和; (2) 以各參與重疊的離子的理論同位素輪廓中無重疊的最高峰作為參考峰,對相應(yīng)的 實驗同位素輪廓中每個同位素峰的實驗強(qiáng)度進(jìn)行歸一化; (3) 計算重疊同位素峰在各個重疊離子中的理想實驗絕對強(qiáng)度; (4) 計算重疊同位素峰實際實驗絕對強(qiáng)度之和相對于理想實驗絕對強(qiáng)度之和的強(qiáng)度偏 差; (5) 計算重疊同位素峰在各參與重疊的離子中的實際實驗絕對強(qiáng)度。
2. 根據(jù)權(quán)利要求1所述的一種生物質(zhì)譜重疊同位素輪廓的解析方法,其特征在于,步 驟(3)中,重疊同位素峰在各個重疊離子中的理想實驗絕對強(qiáng)度通過以下公式計算得到: 各重疊同位素峰的理想實驗絕對強(qiáng)度=各參與重疊的同位素峰的理論相對強(qiáng)度*參 考同位素峰實際實驗絕對強(qiáng)度/參考同位素峰理論相對強(qiáng)度。
3. 根據(jù)權(quán)利要求2所述的一種生物質(zhì)譜重疊同位素輪廓的解析方法,其特征在于,步 驟(4)中,重疊同位素峰實際實驗絕對強(qiáng)度之和相對于理想實驗絕對強(qiáng)度之和的強(qiáng)度偏差 通過以下公式計算得到: 重疊同位素峰實際實驗絕對強(qiáng)度之和相對于理想實驗絕對強(qiáng)度之和的強(qiáng)度偏差= [重疊同位素峰的實際實驗絕對強(qiáng)度之和-(重疊同位素峰在各重疊離子中的理想實驗絕 對強(qiáng)度總和)V(重疊同位素峰在各重疊離子中的理想實驗絕對強(qiáng)度總和)。
4. 根據(jù)權(quán)利要求3所述的一種生物質(zhì)譜重疊同位素輪廓的解析方法,其特征在于,步 驟(5)中,重疊同位素峰在各參與重疊的離子中的實際實驗絕對強(qiáng)度通過以下公式計算得 到: 重疊同位素峰在各參與重疊的離子中的實際實驗絕對強(qiáng)度=重疊同位素峰在各重疊 離子中的理想實驗絕對強(qiáng)度*(1+重疊同位素峰實際實驗絕對強(qiáng)度之和相對于理想實驗絕 對強(qiáng)度之和的強(qiáng)度偏差)。
5. 根據(jù)權(quán)利要求1所述的一種生物質(zhì)譜重疊同位素輪廓的解析方法,其特征在于,根 據(jù)計算得到的重疊同位素峰在各參與重疊的離子中的實際實驗絕對強(qiáng)度,做出解析后的同 位素輪廓指紋比對圖。
【文檔編號】G01N27/62GK104359967SQ201410593905
【公開日】2015年2月18日 申請日期:2014年10月29日 優(yōu)先權(quán)日:2014年10月29日
【發(fā)明者】田志新 申請人:同濟(jì)大學(xué)