專(zhuān)利名稱(chēng):一種基于分子結(jié)構(gòu)和環(huán)境溫度預(yù)測(cè)化學(xué)物質(zhì)與臭氧氧化反應(yīng)速率常數(shù)的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及不同環(huán)境溫度下臭氧與有機(jī)化學(xué)物質(zhì)氧化反應(yīng)速率常數(shù)(k03)的快速預(yù)測(cè)方法,屬于面向環(huán)境風(fēng)險(xiǎn)評(píng)價(jià)的定量結(jié)構(gòu)與活性關(guān)系OiSAR)技術(shù)領(lǐng)域。背景介紹大多數(shù)的工業(yè)化學(xué)品具有一定的生化穩(wěn)定性,由光所引發(fā)的直接降解以及自由基反應(yīng)是其在環(huán)境中轉(zhuǎn)化的主要途徑。在大氣層中有機(jī)污染物的持久性(半衰期)可以通過(guò)與羥基自由基、硝基自由基和臭氧進(jìn)行化學(xué)反應(yīng)的速率常數(shù)等信息進(jìn)行計(jì)算。大氣對(duì)流層中的有機(jī)污染物,日間主要是通過(guò)羥基自由基和臭氧降解來(lái)去除,夜間主要是通過(guò)硝基自由基反應(yīng)降解。其中,化合物與臭氧反應(yīng)的降解速率常數(shù)(kj是表征化學(xué)品在環(huán)境中持久性的關(guān)鍵參數(shù)。目前對(duì)于化學(xué)品環(huán)境持久性評(píng)價(jià)多基于實(shí)驗(yàn)測(cè)試,如光解活性和活性氧物種 (ROS)氧化活性測(cè)試等,但完全依靠實(shí)驗(yàn)測(cè)試來(lái)獲得化學(xué)品的環(huán)境持久性數(shù)據(jù),具有巨大的財(cái)政壓力。同時(shí),新合成的日常使用有機(jī)化學(xué)品正以每年500 1000種的速度增加,對(duì)這些化學(xué)品一一進(jìn)行實(shí)驗(yàn)測(cè)試,無(wú)法滿(mǎn)足環(huán)境管理的要求,亟需發(fā)展成本低且快速的化學(xué)品環(huán)境持久性評(píng)估方法。基于定量結(jié)構(gòu)與活性關(guān)系OiSAR),可以從化學(xué)品的分子結(jié)構(gòu)出發(fā),預(yù)測(cè)化學(xué)品與臭氧反應(yīng)的速率常數(shù),彌補(bǔ)基礎(chǔ)數(shù)據(jù)的缺失,用于評(píng)估化學(xué)品的光穩(wěn)定性。已報(bào)導(dǎo)關(guān)于的QSAR模型,但這些模型在實(shí)用性、預(yù)測(cè)能力與穩(wěn)健性、應(yīng)用域
Fatemi · (Fatemi, M. H. Prediction of ozone tropospheric degradation rate constant of organic compounds by using artificial neural networks. Analytica Chimica Acta. 2006,556 :355-363)建立了基于人工神經(jīng)網(wǎng)絡(luò) (ANN)的137種化合物與臭氧反應(yīng)的QSAR模型,該模型采用非線(xiàn)性的方法,主要用于預(yù)測(cè)^SK條件下有機(jī)化合物與臭氧反應(yīng)的1^,模型的透明度不強(qiáng),不能預(yù)測(cè)不同溫度下的 k03。Pompe 禾口 Veber (Pompe,Μ.,Veber, Μ.,Prediction of rate constants for the reaction of O3 with different organic compounds. Atmospheric Environment. 2001, 35(22) :3781-3788)建立了基于多元線(xiàn)性回歸(MLR)的117種不同種類(lèi)化合物與臭氧反應(yīng)的QSAR模型,不能預(yù)測(cè)多個(gè)溫度下的kQ3。Jiang等(Jiang,J. L.,Yue, Χ. Α.,Chen, Q. F. Determination of ozonization reaction rate constants of aromatic pollutants and QSAR study. Bulletin of Environmental Contamination and Toxicology. 2010,85 568-72)建立了基于密度泛函理論(DFT)的39種芳香族化合物與臭氧反應(yīng)的QSAR模型,該模型選擇的化合物種類(lèi)單一,應(yīng)用域偏小,需擴(kuò)大應(yīng)用域的范圍。構(gòu)建實(shí)用性強(qiáng)且算法簡(jiǎn)單透明的溫度依附性預(yù)測(cè)模型,并對(duì)其預(yù)測(cè)能力和穩(wěn)健性進(jìn)行評(píng)價(jià),在此基礎(chǔ)上對(duì)應(yīng)用域范圍進(jìn)行表征,對(duì)有機(jī)化學(xué)品的生態(tài)風(fēng)險(xiǎn)評(píng)價(jià)與監(jiān)管工作具有重要意義
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題是提供一種不同環(huán)境溫度下有機(jī)化合物與臭氧反應(yīng)速率常數(shù)的簡(jiǎn)便、快速、低成本、應(yīng)用范圍廣的預(yù)測(cè)方法。為解決以上技術(shù)問(wèn)題本發(fā)明采用的技術(shù)方案如下(1)為了保證用于建立模型的數(shù)據(jù)準(zhǔn)確性,對(duì)從文獻(xiàn)收集的實(shí)驗(yàn)測(cè)定值進(jìn)行評(píng)估和分析,刪除離群點(diǎn)。首先,對(duì)同一化合物的多個(gè)實(shí)驗(yàn)測(cè)定值進(jìn)行統(tǒng)計(jì)學(xué)評(píng)估,刪除偏離平均值的數(shù)據(jù)點(diǎn);其次,對(duì)同一化合物在不同溫度下的Iogkffi對(duì)1/T作圖分析,刪除偏離線(xiàn)性的數(shù)據(jù)點(diǎn)。最終得到1 種有機(jī)化合物共264個(gè)Iogkffi數(shù)據(jù),溫度范圍從178K到364K。根據(jù)化合物與臭氧反應(yīng)的機(jī)理分析,計(jì)算26個(gè)量子化學(xué)描述符、1481個(gè)Dragon描述符和12 個(gè)分子結(jié)構(gòu)碎片,加入1/T溫度描述符?;衔锇▎蜗N、二烯烴及多烯烴、鹵代烯烴、環(huán)狀化合物、芳香族化合物、含氧化合物、含氮化合物等。以4 1的比例隨機(jī)劃分訓(xùn)練集和驗(yàn)證集。(2)聯(lián)合應(yīng)用逐步回歸和PLS回歸篩選訓(xùn)練集的描述符組合,構(gòu)建預(yù)測(cè)的QSAR 模型,具體步驟如下第一步,采用逐步回歸方法進(jìn)行初篩變量,在多元線(xiàn)性回歸(MLR)模型中,膨脹因子(VIF)小于10 ;第二步,基于PLS回歸,篩選變量的過(guò)程如下先建立包含所有初篩得到的變量的 PLS模型,選擇模型相關(guān)系數(shù)的平方(R2)和累計(jì)交叉驗(yàn)證系數(shù)(Q2oti)為參考值,R2和Q2am 是由Simca6. 0軟件計(jì)算得出;分別去除每個(gè)描述符一次,以R2和Q2aa數(shù)值升高最大的模型為基準(zhǔn)模型,重復(fù)上述步驟直至R2和Q2oti不再升高為止。若有幾個(gè)方程的R2和Q2oti數(shù)值相近,則比較經(jīng)自由度調(diào)整后的決定系數(shù)(R2adj),選擇R2adj最大的模型為最優(yōu)模型。最優(yōu)模型的表達(dá)式Iogk03 = -12. 542-493. 3X (1/T) +0. 41722XEHOMO+0. 4443Xelectrophility+O. 66 971Xnc = c-0. 26128XqCmax+0. 74783XBELm2+4. 8412XMor32v+0. 35198XH3u+0. 38372Xn =
CHE-1. 7438Xnffl^O. 4576Xn = CK2-1. 1235XnBM+0. 28542XnCIKCLE (1)其中,1/T表示溫度的倒數(shù);Ehqmq表示最高占據(jù)分子軌道能;electrophility表示親電性;η。=。表示碳碳雙鍵的個(gè)數(shù);qCmax表示碳原子最大正電荷;BELm2表示BCUT描述符; Mor32v表示3D-Morse描述符;H!3u表示Getaway描述符;η = CHE表示=CHR的個(gè)數(shù);nra2表示氨基的個(gè)數(shù);H = Oi2表示=CR2的個(gè)數(shù);nBM表示苯環(huán)上甲基的個(gè)數(shù);如_表示脂肪環(huán)的個(gè)數(shù)。經(jīng)內(nèi)部驗(yàn)證和外部驗(yàn)證證實(shí)kQ3預(yù)測(cè)模型的穩(wěn)健性和預(yù)測(cè)能力。模型的擬合能力由R2adj和均方根誤差(RMSE)來(lái)表征,R2adj = 0. 849, RMSE = 0. 562,表明模型具有較好的擬合能力。穩(wěn)健性用內(nèi)部驗(yàn)證的交叉驗(yàn)證系數(shù)評(píng)價(jià),交叉驗(yàn)證系數(shù)Q2cum = 0. 838,表明該QSAR 模型具有較好的穩(wěn)健性。模型的預(yù)測(cè)能力采用未參與建模的50個(gè)外部數(shù)據(jù)評(píng)價(jià),由外部預(yù)測(cè)相關(guān)系數(shù)的平方(Q2rat)來(lái)表征,Q2ext = 0.878,表明模型具有較好的預(yù)測(cè)能力。其中, R2adj, RMSE, Q2ext由下列公式得出
權(quán)利要求
1.一種基于分子結(jié)構(gòu)和環(huán)境溫度預(yù)測(cè)化學(xué)物質(zhì)與臭氧氧化反應(yīng)速率常數(shù)的方法,其特征在于,(1)首先,對(duì)同一化合物的多個(gè)實(shí)驗(yàn)測(cè)定值進(jìn)行統(tǒng)計(jì)學(xué)評(píng)估,刪除偏離平均值的數(shù)據(jù)點(diǎn);其次,對(duì)同一化合物在不同溫度下的Iogkffi對(duì)1/T作圖分析,刪除偏離線(xiàn)性的數(shù)據(jù)點(diǎn); 最終得到1 種有機(jī)化合物共264個(gè)Iogkra數(shù)據(jù),溫度范圍從178K到364K ;根據(jù)化合物與臭氧反應(yīng)的機(jī)理分析,計(jì)算26個(gè)量子化學(xué)描述符、1481個(gè)Dragon描述符和12個(gè)分子結(jié)構(gòu)碎片,加入1/T溫度描述符;(2)聯(lián)合應(yīng)用逐步回歸和PLS回歸篩選描述符組合,構(gòu)建預(yù)測(cè)1 的QSAR模型;具體步驟如下第一步,采用逐步回歸方法進(jìn)行初篩變量,在多元線(xiàn)性回歸(MLR)模型中,膨脹因子 (VIF)小于 10 ;第二步,基于PLS回歸,篩選變量的過(guò)程如下先建立包含所有初篩得到的變量的PLS 模型,選擇模型相關(guān)系數(shù)的平方(R2)和累計(jì)交叉驗(yàn)證系數(shù)(Q2cJ為參考值,分別去除每個(gè)描述符一次,以R2和Q2cm數(shù)值升高最大的模型為基準(zhǔn)模型,重復(fù)上述步驟直至R2y和Q2oti不再升高為止;若有幾個(gè)方程的R2和Q2cum數(shù)值相近,則比較訓(xùn)練集的經(jīng)自由度調(diào)整后的決定系數(shù)(R2atu),選擇R2atu最大的模型為最優(yōu)模型;最優(yōu)模型的表達(dá)式Iogk03 = -12. 542-493. 3X (1/T) +0. 41722XEHOMO+0. 4443Xelectrophility+O. 66971Xnc = G-0. 26128XqCmax+0. 74783XBELm2+4. 8412XMor32v+0. 35198XH3u+0. 38372Xn = CHE-1. 7438XnNH2+0. 4576Xn = CE2-l. 1235XnBM+0. 28542XnCIECLE (1)其中,1/T表示溫度的倒數(shù);Ehqmq表示最高占據(jù)分子軌道能;electrophility表示親電性;η。=。表示碳碳雙鍵的個(gè)數(shù);qCmax表示碳原子最大正電荷;BELm2表示BCUT描述符; Mor32v表示3D-Morse描述符;H!3u表示Getaway描述符;η = CHE表示=CHR的個(gè)數(shù);nra2表示氨基的個(gè)數(shù);H = Oi2表示=CR2的個(gè)數(shù);nBM表示苯環(huán)上甲基的個(gè)數(shù);如_表示脂肪環(huán)的個(gè)數(shù)。
2.根據(jù)權(quán)利要求1所述的的方法,其特征在于,所述的化合物包括單烯烴、二烯烴及多烯烴、商代烯烴、環(huán)狀化合物、芳香族化合物、含氧化合物、含氮化合物。
全文摘要
本發(fā)明公開(kāi)了一種基于分子結(jié)構(gòu)和環(huán)境溫度預(yù)測(cè)化學(xué)品與臭氧反應(yīng)速率常數(shù)(kO3)的方法,屬面向化學(xué)品環(huán)境監(jiān)管的定量結(jié)構(gòu)-活性關(guān)系(QSAR)技術(shù)領(lǐng)域。kO3影響化學(xué)品在大氣中滯留時(shí)間(半衰期),是評(píng)估化學(xué)品的環(huán)境持久性的重要參數(shù)。本發(fā)明采用了量子化學(xué)描述符、Dragon計(jì)算的描述符、分子結(jié)構(gòu)碎片表征化合物的分子結(jié)構(gòu)特征,構(gòu)建了預(yù)測(cè)kO3的QSAR模型。所構(gòu)建的不同環(huán)境溫度下kO3的QSAR模型,經(jīng)內(nèi)部驗(yàn)證和外部驗(yàn)證證實(shí)了其有良好的穩(wěn)健性和預(yù)測(cè)能力,并基于Williams圖法表征了QSAR模型的應(yīng)用域,明確了模型的應(yīng)用范圍。
文檔編號(hào)G01N25/00GK102507630SQ201110392788
公開(kāi)日2012年6月20日 申請(qǐng)日期2011年11月30日 優(yōu)先權(quán)日2011年11月30日
發(fā)明者喬顯亮, 姜菁秋, 李晶, 李雪花, 蔡喜運(yùn), 趙文星, 陳景文 申請(qǐng)人:大連理工大學(xué)