本發(fā)明涉及一種混凝土強度預(yù)測方法,具體涉及一種海洋環(huán)境下混凝土強度預(yù)測方法。
背景技術(shù):
隨著經(jīng)濟的發(fā)展,大量的建筑工程在海洋環(huán)境中開展。在海洋環(huán)境下,Mg2+濃度、SO42-濃度、Cl-濃度、溫度等因素相互之間耦合作用導(dǎo)致混凝土性能劣化,尤其是強度的退化,從而使海洋環(huán)境下混凝土建筑物的耐久性成為研究者們關(guān)注的問題。而海洋環(huán)境下混凝土強度服役狀態(tài)的預(yù)測評價,對于混凝土結(jié)構(gòu)的安全性判定以及建筑物的服役壽命的預(yù)測及設(shè)計具有重要意義。由于多種因素之間錯綜復(fù)雜,相互耦合以及不可避免的偶然因素,導(dǎo)致預(yù)測評價出強度的劣化狀態(tài),是非常困難的。
傳統(tǒng)的回歸統(tǒng)計方法以及半經(jīng)驗半理論推導(dǎo)的方法,得到的結(jié)果不是很理想,并且有一定局限性,很難從某一次或者少量的實驗數(shù)據(jù)中得到合理的混凝土性能劣化的規(guī)律。因此從大數(shù)據(jù)分析出發(fā),探索其中的復(fù)雜規(guī)律勢在必行。但是在實際的混凝土服役環(huán)境下,能充分考慮服役環(huán)境的變化和材料組分變化對混凝土性能的影響,并探究其潛在的顯性邏輯關(guān)系,是非常困難的。
因此,有必要提出混凝土性能劣化的預(yù)測新方法,提取潛在的邏輯推理關(guān)系,這對于混凝土設(shè)計和以耐久性具有重要意義。
技術(shù)實現(xiàn)要素:
發(fā)明目的:本發(fā)明的目的在于針對現(xiàn)有技術(shù)的不足,提供一種海洋環(huán)境下混凝土強度劣化預(yù)測評價方法,通過處理不同服役條件下、不同時期的劣化數(shù)據(jù),并進行分析建模,得到樹狀I(lǐng)F-THAN決策邏輯規(guī)則,最終預(yù)測服役混凝土不同年限和服役環(huán)境下強度的退化情況。
技術(shù)方案:本發(fā)明提供了一種海洋環(huán)境下混凝土強度劣化預(yù)測評價方法,包括以下步驟:
(1)通過實驗檢測不同配比下混凝土在海洋環(huán)境下隨齡期強度劣化的數(shù)據(jù),并收集已有公開文獻中的數(shù)據(jù)形成數(shù)據(jù)庫;
(2)將獲得的運行數(shù)據(jù)分為訓練組和測試組,其中影響混凝土強度的因素作為因素屬性集,強度劣化的狀態(tài)作為劣化結(jié)果屬性集;
(3)進行決策樹建模:
(3.1)將訓練組按屬性進行劃分,計算每個屬性的信息增益,選擇信息增益值最大的屬性作為特征屬性,并設(shè)置優(yōu)先級,作為決策樹的一級中間節(jié)點,所對應(yīng)的劣化狀態(tài)的屬性類別作為一級分支;
(3.2)依次從訓練組中取出屬性,確定屬性的信息增益,直至得到訓練組中所有屬性的信息增益,對所有屬性的信息增益進行排序,信息增益值最大的屬性即為特征屬性;
(3.3)按照特征屬性的類別種類將訓練組進行劃分,訓練群組將已經(jīng)判定為特征屬性的屬性去除,并判斷剔除的特征屬性是否存在使運行類別為劣化狀態(tài)的類別,如果存在,則劣化狀態(tài)類別對應(yīng)的下一節(jié)點為葉子節(jié)點,該葉子節(jié)點中存儲劣化的運行類別,并進入步驟(3.4);若剔除的特征屬性不存在劣化狀態(tài)的類別,則繼續(xù)尋找其他屬性進行分支;
(3.4)在每個新劃分的訓練群組中計算每個屬性的信息增益,選擇信息增益值最大的屬性作為特征屬性,并設(shè)置優(yōu)先級為r,作為決策樹的r級中間節(jié)點,其中r=2,3,4,…N,N為正整數(shù),逐層形成決策樹節(jié)點;
(3.5)重復(fù)步驟(3.3)(3.4),直至劃分的訓練群組中只存在最后一個屬性,將該屬性作為特征屬性,特征屬性的類別對應(yīng)的運行類別均存儲在下一分支的葉子節(jié)點中,決策樹構(gòu)建完成;
(4)按照所述對應(yīng)屬性的屬性值選擇輸出分支,直至到達葉子節(jié)點,將葉子節(jié)點存放的運行類別作為分析結(jié)果輸出;
(5)模型性能評估;
(6)采用C4.5算法對建立的決策樹減枝。
進一步,屬性信息增益確定的方法為:
設(shè)S是由屬性組成的樣本集合,將S劃分為c個類Ci(i=1,2,…,c),每個類Ci含有的樣本數(shù)目為ni,則S劃分為c個不同類的信息熵或期望信息:
其中,pi為S中的樣本屬于i類Ci的概率,即pi=ni/n,n為S的樣本總數(shù);SV是S中屬性Δx的值為V的樣本子集,選擇Δx導(dǎo)致的信息熵定義為:
其中,E(SV)是將SV中的樣本劃分到各個類的信息熵,屬性Δx相對樣本集合S的信息增益Gain(S,Δx)定義為:
Gain(S,Δx)=E(S)-E(S,Δx)
Gain(S,Δx)是指因知道屬性Δx的值后導(dǎo)致的熵的期望壓縮,Gain(S,Δx)越大,說明選擇測試屬性Δx對分類提供的信息越多。
進一步,步驟(5)通過將屬性值代入決策樹,得到劣化的強度數(shù)值,并通過平均誤差、均方根誤差和擬合度檢驗其精確度。
進一步,步驟(6)使用剔除屬性之外的其他屬性設(shè)置為每一層的葉子節(jié)點,通過步驟(5)分析決策樹性能,如果誤差下降則選擇該屬性作為新的節(jié)點,如果誤差沒有下降則原有屬性無需被代替,依次計算每一個分支節(jié)點,得到簡化后的決策樹。
有益效果:1、與傳統(tǒng)的數(shù)據(jù)擬合公式、理論推導(dǎo)的半經(jīng)驗半理論預(yù)測方法相比,適用性更強,并首次使用決策樹得到if-then決策樹狀屬性規(guī)則,并提出規(guī)則優(yōu)化方法,對混凝土性能劣化進行定量預(yù)測。
2、與目前現(xiàn)有的神經(jīng)網(wǎng)絡(luò),支持向量機不同,決策樹得到的是數(shù)據(jù)間的邏輯關(guān)系,是一個可見的白盒模型(決策樹狀圖),而神經(jīng)網(wǎng)絡(luò)和支持向量機等模型得到的是黑匣子關(guān)系,最終得到的是不同因素和結(jié)果之間的非線性映射函數(shù)關(guān)系。
3、針對復(fù)雜混凝土服役環(huán)境劣化條件以及最終劣化狀態(tài)響應(yīng),采用ID3算法得到最終的決策樹狀圖,并使用C4.5優(yōu)化算法對決策樹進行減枝,能夠明顯提高決策樹的性能,更好的對海洋服役條件下混凝土強度劣化狀態(tài)做出預(yù)測評價,從而能得到建筑物強度的劣化即時信息,提前對建筑物耐久性破壞造成的危險進行評估。
附圖說明
圖1實施例中決策樹的構(gòu)建圖;
圖2(a)(b)為訓練集和測試集的實驗和預(yù)測效果圖;
圖3(a)(b)為80組訓練集和36組測試集相對誤差;
圖4為C4.5算法減枝后決策樹;
圖5為116組減枝前后預(yù)測效果對比。
具體實施方式
下面對本發(fā)明技術(shù)方案進行詳細說明,但是本發(fā)明的保護范圍不局限于所述實施例。
實施例:一種海洋環(huán)境下混凝土強度裂化預(yù)測評價方法的預(yù)測方法,本實施例數(shù)據(jù)來源于不同實驗的116組混凝土實驗室人工模擬混凝土強度劣化的數(shù)據(jù),具體操作如下:
(1)通過實驗檢測不同配比下混凝土隨齡期強度劣化的數(shù)據(jù),并收集已有公開文獻中的數(shù)據(jù)形成數(shù)據(jù)庫。
(2)將獲得的運行數(shù)據(jù)分為(80)訓練組和(36)測試組,將各訓練組按屬性進行劃分,其中影響混凝土強度的因素作為因素屬性集,在表1所示的訓練樣例中,訓練組分為8個屬性:放入海水時的強度(Δx1),粉煤灰參量(Δx2),礦渣參量(Δx3),氯離子濃度(Δx4),鎂離子濃度(Δx5),硫酸根濃度(Δx6),時間(Δx7),溫度(Δx8)。強度劣化的狀態(tài)作為劣化結(jié)果屬性集,本實施例抗壓強度f作為輸出參數(shù)形成劣化結(jié)果屬性集。
(3)由于期望信息越小,信息增益越大,從而純度越高。所以構(gòu)建決策樹的核心思想就是選擇分裂后信息增益最大的屬性作為特征屬性,再進行下一步分裂。其中,核心部分就是計算每個屬性的信息增益,根據(jù)信息增益獲得特征屬性,具體操作步驟如下:
(3.1)將訓練組按屬性進行劃分,計算每個屬性的信息增益,選擇信息增益值最大的屬性Δx作為特征屬性,并設(shè)置優(yōu)先級,作為決策樹的中間節(jié)點,所對應(yīng)的劣化狀態(tài)的屬性類別作為一級分支。信息增益計算如下所示:
設(shè)S是由8個輸入屬性組成的樣本集合,將樣本集劃分為10個不同的類Ci(i=1,2,…,10),每個類Ci含有的樣本數(shù)目為8,則S劃分為10個不同類的信息熵或期望信息為:
其中,pi為S中的樣本屬于i類Ci的概率,即pi=ni/n;SV是S中屬性Δx的值為V的樣本子集,選擇Δx導(dǎo)致的信息熵定義為:
其中,E(SV)是將SV中的樣本劃分到各個類的信息熵,屬性Δx相對樣本集合S的信息增益Gain(S,Δx)定義為:
Gain(S,Δx)=E(S)-E(S,Δx)
Gain(S,Δx)是指因知道屬性Δx的值后導(dǎo)致的熵的期望壓縮,Gain(S,Δx)越大,說明選擇測試屬性Δx對分類提供的信息越多。該步驟ID3算法就是在每個節(jié)點選擇信息增益(S,Δx)最大的屬性作為測試屬性。
(3.2)依次從訓練組中取出屬性,重復(fù)步驟(3.1),直至得到訓練元組中所有屬性的信息增益,對所有屬性的信息增益進行排序,息增益值最大的屬性即為特征屬性。經(jīng)過計算,在表1所示的訓練樣本中,訓練組中8個屬性的信息增益中第Δx7個屬性鎂離子的信息增益最大,設(shè)為第一層分支節(jié)點,如圖1第一層節(jié)點所示。
表1混凝土強度劣化的部分數(shù)據(jù)及條件
(3.3)按照特征屬性的類別種類將訓練組進行劃分,訓練群組將Δx7剔除,并判斷剔除的特征屬性是存在使運行類別為劣化狀態(tài)的類別,則劣化狀態(tài)類別對應(yīng)的下一節(jié)點為葉子節(jié)點,葉子節(jié)點中存儲劣化狀態(tài)的運行類別,轉(zhuǎn)向步驟(3.4)。
(3.4)在每個新劃分的訓練群組中計算每個屬性的信息增益,選擇信息增益值最大的屬性作為特征屬性,并設(shè)置優(yōu)先級為r,作為決策樹的r級中間節(jié)點,其中r=2,3,4,…N,N為正整數(shù),逐層形成決策樹節(jié)點;
(3.5)重復(fù)步驟(3.3)(3.4)直至新劃分的訓練群組中只存在一個屬性,將該屬性作為特征屬性,這個特征屬性的類別對應(yīng)的運行類別均存儲在下一分支的葉子節(jié)點中,決策樹構(gòu)建完成,如圖1所示。
(4)按照所述對應(yīng)屬性的屬性值選擇輸出分支,直至到達葉子節(jié)點,將葉子節(jié)點存放的運行類別作為分析結(jié)果輸出,例如圖1中,每一個分支的終止就是運行的結(jié)果。
(5)評價模型性能
將80組訓練集和36組測試集的8個屬性值Δx,分別帶入(3)中的決策樹,得到劣化的強度數(shù)值,并通過公式a,b,c檢驗其精確度。
a.平均誤差
b.均方根誤差
c.擬合度
式中y為8個屬性對應(yīng)的實驗測量值,yi為輸入8個屬性值后得到的預(yù)測強度劣化值。
(6)由于訓練樣本太少或數(shù)據(jù)中存在噪音和孤立點,許多分枝反映的是訓練樣本集中的異?,F(xiàn)象,建立的決策樹會過度擬合訓練樣本集。剪枝方法可以減少訓練樣本集中噪音的影響,剪枝的時機選擇是很關(guān)鍵的。本專利采用C4.5算法,最小分度值為5,即擴展的葉子結(jié)點為每5個數(shù)據(jù)的匯總。
由訓練集得到的決策樹模型,減枝的主要過程為:使用剔除屬性之外的其他屬性設(shè)置為每一層的葉子節(jié)點,通過(4)中的公式分析決策樹性能,如果誤差下降就選擇新的屬性作為節(jié)點,分別使用其他屬性,例如放入海水初始強度(Δx1),粉煤灰參量(Δx2),礦渣參量(Δx3),氯離子濃度(Δx4),硫酸根濃度(Δx6),時間(Δx7),溫度(Δx8)代替鎂離子濃度(Δx5),作為第一級分支,誤差沒有下降,則不能代替,依次計算每一個分支節(jié)點,得到簡化后的決策樹,如圖4所示。減枝后的決策樹預(yù)測性能通過圖5可以看出。
本實施例實驗操作時使用不同配合比的混凝土試件,不同海域的海水濃度對混凝土進行侵蝕試驗,通過上文中的提到的建模方式,建立模型生成決策樹,得到if-than邏輯決策關(guān)系,從而對混凝土的性能劣化做出預(yù)測。通過對訓練集進行訓練,得到圖1的決策樹,然后檢驗決策樹的性能如圖2和3所示,訓練集和測試集平均相對偏差為7.64%和13.12%,其性能滿足工程需求。采用C4.5減枝算法得到減枝后的決策樹如圖4所示,此方法將ID3的模型簡化并且還能提高預(yù)測精度,如圖5。其中116組數(shù)據(jù)中ID3平均相對誤差為9.22%,減枝后平均相對誤差為7.85%。