本發(fā)明涉及交通信息預(yù)測
技術(shù)領(lǐng)域:
,具體涉及一種基于卷積神經(jīng)網(wǎng)絡(luò)的大規(guī)模交通網(wǎng)絡(luò)擁堵預(yù)測方法及裝置。
背景技術(shù):
:為了更加準(zhǔn)確的預(yù)測交通擁堵狀況,以為車輛出行提供更加合理的線路規(guī)劃,十分有必要進行大規(guī)模的交通網(wǎng)絡(luò)擁堵預(yù)測,這是因為:(1)在交通網(wǎng)絡(luò)中,道路的擁堵狀況是相互影響的,一個區(qū)域的交通擁堵狀態(tài)與相鄰區(qū)域的擁堵狀態(tài)密不可分,因此預(yù)測各區(qū)域交通動態(tài)變化情況需要從網(wǎng)絡(luò)全局角度出發(fā);(2)單一路段交通擁堵預(yù)測具有短視性,最顯著的是局部交通預(yù)測僅僅借助歷史數(shù)據(jù),或基于周邊有限路段交通狀態(tài)進行預(yù)測,在由單一路段預(yù)測擴展到大規(guī)模交通網(wǎng)絡(luò)預(yù)測時,運算量大,造成預(yù)測效率和精度都無法得到保障,無法滿足交通信息服務(wù)的實時性和準(zhǔn)確性要求。速度是表征交通擁堵的重要特征,因此可以通過預(yù)測交通速度判定交通擁堵狀態(tài)。以往的交通速度預(yù)測技術(shù)包括:(1)基于傳統(tǒng)統(tǒng)計技術(shù)進行交通預(yù)測,如通過交通特性對速度進行回歸預(yù)測、用歷史平均速度數(shù)據(jù)預(yù)測等;考慮交通數(shù)據(jù)的周期性和波動性,可以考慮非參數(shù)模型,如KNN近鄰搜索,通過在歷史空間中搜索相似的狀態(tài)進行預(yù)測。但是回歸預(yù)測普遍存在精度不高問題,KNN存在效率低和精度低問題。(2)基于時間序列進行短時交通速度預(yù)測,因為交通速度內(nèi)在時序性特征,時間序列模型在交通速度預(yù)測中得到了大量的應(yīng)用,主要模型是自回歸移動平均模型ARIMA,ARIMA模型能考慮到一個交通速度時間序列的內(nèi)存規(guī)律(移動平均)和時間序列在時間上的啟后影響關(guān)系(自回歸)。為了提高預(yù)測的精度,其他的改進的ARIMA模型也有一定應(yīng)用,如KARIMA模型、季節(jié)ARIMA模型、帶解釋變量的ARIMAX模型等。ARIMA能夠在單路段交通速度預(yù)測情形下取得一定效果,但是不能同時考慮整個網(wǎng)絡(luò),特別是路段之間的相互影響關(guān)系,這限制了模型的應(yīng)用。(3)現(xiàn)代機器學(xué)習(xí)算法,如支持向量機SVM算法,SVM通過尋找數(shù)據(jù)的高維可分或近似可分平面,一般可以取得比回歸更好的結(jié)果,但是算法訓(xùn)練需要更多時間和計算內(nèi)存,而且不能很好處理多輸出問題,無法在大規(guī)模網(wǎng)絡(luò)層面進行應(yīng)用;人工神經(jīng)網(wǎng)絡(luò)ANN也被應(yīng)用到交通預(yù)測之中,而且可以同時預(yù)測多個輸出,通過網(wǎng)絡(luò)層的不斷學(xué)習(xí)也可以捕捉到交通數(shù)據(jù)中存在的一定模式,但是ANN數(shù)據(jù)驅(qū)動的形式并不能很好理解數(shù)據(jù)的空間關(guān)系,而且與深度學(xué)習(xí)的方法相比,ANN顯得太簡單以及預(yù)測精度太低。以上這些技術(shù)能較好處理交通局部的擁堵狀態(tài)預(yù)測問題,但是在預(yù)測全網(wǎng)絡(luò)的交通速度時,以上的模型都需要對每個時刻和每個路段的交通速度信息進行單獨建模,當(dāng)時間跨度增大和交通網(wǎng)絡(luò)擴大時,所需構(gòu)建的模型數(shù)量極大;而且,這些大量的模型是獨立存在的,不能同時考慮整個交通網(wǎng)絡(luò)的關(guān)系。技術(shù)實現(xiàn)要素:有鑒于此,本發(fā)明提供一種基于卷積神經(jīng)網(wǎng)絡(luò)的大規(guī)模交通網(wǎng)絡(luò)擁堵預(yù)測方法及裝置,能同時考慮路網(wǎng)車輛速度信息的時序性和空間性,進而可以更準(zhǔn)確的預(yù)測整個路網(wǎng)交通擁堵狀態(tài)。一方面,本發(fā)明實施例提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的大規(guī)模交通網(wǎng)絡(luò)擁堵預(yù)測方法,包括:S1、收集車輛的GPS數(shù)據(jù),并提取在每個時刻每個路段的車輛運行數(shù)據(jù),根據(jù)獲得的所述車輛運行數(shù)據(jù)生成矩陣M,其中,所述車輛運行數(shù)據(jù)包括車輛平均速度,所述矩陣M中的元素aij表示在時間段i路段j上對應(yīng)的所述車輛運行數(shù)據(jù);S2、根據(jù)所述矩陣M生成至少一天的時空熱力圖;其中,所述時空熱力圖的橫坐標(biāo)表示時間,縱坐標(biāo)表示按照空間關(guān)系排序的路段ID序列;S3、在所述時空熱力圖上,采取窗口滑動的方式生成數(shù)據(jù)集(X,Y);具體地,將矩陣M表示為[m1,m2,...,mN],mt為矩陣第t列數(shù)據(jù),N表示一天所有時刻數(shù),當(dāng)時間單位為T分鐘時,設(shè)滑動窗口大小為k個時間單位,則第i個數(shù)據(jù)(Xi,Yi)=([mi,mi+1,...,mk-1],[mk,mk+1,...,m2k-1]),i=1...N-2k+1;S4、構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)模型,并利用所述數(shù)據(jù)集(X,Y)對所述卷積神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練;S5、將待測試的數(shù)據(jù)集輸入到經(jīng)過訓(xùn)練的所述卷積神經(jīng)網(wǎng)絡(luò)模型中,得到預(yù)測結(jié)果。另一方面,本發(fā)明實施例提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的大規(guī)模交通網(wǎng)絡(luò)擁堵預(yù)測裝置,包括:矩陣生成單元,用于收集車輛的GPS數(shù)據(jù),并提取在每個時刻每個路段的車輛運行數(shù)據(jù),根據(jù)獲得的所述車輛運行數(shù)據(jù)生成矩陣M,其中,所述車輛運行數(shù)據(jù)包括車輛平均速度,所述矩陣M中的元素aij表示在時間段i路段j上對應(yīng)的所述車輛運行數(shù)據(jù);熱力圖生成單元,用于根據(jù)所述矩陣M生成至少一天的時空熱力圖;其中,所述時空熱力圖的橫坐標(biāo)表示時間,縱坐標(biāo)表示按照空間關(guān)系排序的路段ID序列;數(shù)據(jù)集生成單元,用于在所述時空熱力圖上,采取窗口滑動的方式生成數(shù)據(jù)集(X,Y);具體地,將矩陣M表示為[m1,m2,...,mN],mt為矩陣第t列數(shù)據(jù),N表示一天所有時刻數(shù),當(dāng)時間單位為T分鐘時,設(shè)滑動窗口大小為k個時間單位,則第i個數(shù)據(jù)(Xi,Yi)=([mi,mi+1,...,mk-1],[mk,mk+1,...,m2k-1]),i=1...N-2k+1;訓(xùn)練單元,用于構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)模型,并利用所述數(shù)據(jù)集(X,Y)對所述卷積神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練;預(yù)測單元,用于將待測試的數(shù)據(jù)集輸入到經(jīng)過訓(xùn)練的所述卷積神經(jīng)網(wǎng)絡(luò)模型中,得到預(yù)測結(jié)果。本發(fā)明具有如下有益效果:1、本發(fā)明通過時空圖的方式來處理網(wǎng)絡(luò)車輛速度信息,生成速度熱力圖,整合了車輛速度信息在時間和空間上的關(guān)系,表達直觀形象,可以幫助交通管理部門更加直觀的了解路網(wǎng)的交通信息;2、本發(fā)明考慮了交通網(wǎng)絡(luò)信息的時序性和空間性,并能通過卷積神經(jīng)網(wǎng)絡(luò)大規(guī)模實施,具有較好的適用性和較高的預(yù)測精度,這對于減小道路交通擁堵、提高道路運行效率、減小城市二氧化碳排放以及城市智能交通的實現(xiàn)都有重要意義;3、本發(fā)明不需要大量的數(shù)據(jù)預(yù)處理,操作簡單,對較大交通網(wǎng)絡(luò)學(xué)習(xí)效率高,不需要對每個時刻每個路段進行單獨建模,可基于TensorFlow等分布式平臺進行實現(xiàn),提高模型計算效率。附圖說明圖1為本發(fā)明基于卷積神經(jīng)網(wǎng)絡(luò)的大規(guī)模交通網(wǎng)絡(luò)擁堵預(yù)測方法一實施例的流程示意圖;圖2為本發(fā)明所述的整合了交通路網(wǎng)車輛速度信息時間性和空間性的熱力圖;圖3為本發(fā)明所述的基于卷積神經(jīng)網(wǎng)絡(luò)CNN進行交通網(wǎng)絡(luò)車輛速度信息預(yù)測的原理圖;圖4為本發(fā)明基于卷積神經(jīng)網(wǎng)絡(luò)的大規(guī)模交通網(wǎng)絡(luò)擁堵預(yù)測裝置一實施例的結(jié)構(gòu)示意圖。具體實施方式為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。參看圖1,本實施例公開一種基于卷積神經(jīng)網(wǎng)絡(luò)的大規(guī)模交通網(wǎng)絡(luò)擁堵預(yù)測方法,包括:S1、收集車輛的GPS數(shù)據(jù),并提取在每個時刻每個路段的車輛運行數(shù)據(jù),根據(jù)獲得的所述車輛運行數(shù)據(jù)生成矩陣M,其中,所述車輛運行數(shù)據(jù)包括車輛平均速度,所述矩陣M中的元素aij表示在時間段i路段j上對應(yīng)的所述車輛運行數(shù)據(jù);生成矩陣M的過程伴隨著對數(shù)據(jù)進行時空上的均值插補,具體地,當(dāng)需要在一個時間×空間為3×3的范圍內(nèi)對數(shù)據(jù)進行均值插補時,設(shè)矩陣M=a11,a12,a13a21,a22,a23a31,a32,a33=42,43,4035,?,4033,41,35---(3)]]>其中行為時間單元[1,2,3],列為路段id[1,2,3],那么aij表示在時間段i路段j上車輛的平均速度,當(dāng)a22缺失時其在時空上的均值插補為a^22=18(42+43+40+35+40+33+41+35)=38.625---(4)]]>S2、根據(jù)所述矩陣M生成至少一天的時空熱力圖;其中,所述時空熱力圖的橫坐標(biāo)表示時間,縱坐標(biāo)表示按照空間關(guān)系排序的路段ID序列;如圖2所示為本發(fā)明所述的整合了交通路網(wǎng)車輛速度信息時間性和空間性的熱力圖,熱力圖的橫坐標(biāo)方向為時間,按照每1個時間單位(可以為2分鐘)的間隔遞增,時間跨度為一天;縱坐標(biāo)為按照空間關(guān)系排序的路網(wǎng)路段id序列??臻g關(guān)系可采用從北→東→南→西排序方式,在其他復(fù)雜的交通路網(wǎng)中,還可以采用多種空間方式排序,如從北到南的橫向掃描方式,所采用的空間關(guān)系排序方式應(yīng)盡可能的保留路網(wǎng)的空間信息,最后將每一種排序結(jié)果作為圖像處理的一個通道;每天的車輛速度熱力圖都按照相同的方式生成。S3、在所述時空熱力圖上,采取窗口滑動的方式生成數(shù)據(jù)集(X,Y);具體地,對某一天而言,當(dāng)時間單位為2分鐘時,熱力圖矩陣M為[m1,m2,...,m720];在窗口滑動過程中保持縱坐標(biāo)的路段ID序列不變,若采用窗口為10個時間單位,第i個訓(xùn)練樣本(Xi,Yi)=([mi,mi+1,...,mi+9],[mi+10,mi+11,...,mi+19]),i=1...701。因此,每一天生成的訓(xùn)練樣本數(shù)目為720-10-10+1=701,數(shù)據(jù)集(X,Y)中X矩陣大小為(701,1,n,10),Y矩陣大小為(701,1,n,10),n為交通網(wǎng)絡(luò)的路段總數(shù),數(shù)字1表示圖像有一個通道,當(dāng)通過多種空間表達方式時,通道數(shù)會相應(yīng)增加,比如,當(dāng)所述車輛運行數(shù)據(jù)還包括車輛流量時,通道數(shù)為2。當(dāng)數(shù)據(jù)包含d天的數(shù)據(jù)時,數(shù)據(jù)集(X,Y)中X矩陣大小為(701d,1,n,10),Y矩陣大小為(701d,1,n,10)。數(shù)據(jù)集的生成采取窗口滑動的方式,這保證了CNN深度學(xué)習(xí)模式有大量的可訓(xùn)練樣本。S4、構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)模型,并利用所述數(shù)據(jù)集(X,Y)對所述卷積神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練;卷積神經(jīng)網(wǎng)絡(luò)模型主要由卷積層、池化層、全連接層組成,在不同的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,三者的組合方式和數(shù)量并不相同,本發(fā)明在經(jīng)過實踐并保持模型學(xué)習(xí)能力和訓(xùn)練速度的基礎(chǔ)上,采用了如圖3的結(jié)構(gòu),但是本發(fā)明并不僅限于這樣的結(jié)構(gòu),其他CNN模型(卷積神經(jīng)網(wǎng)絡(luò)模型)可能在卷積層和池化層的組合方式和數(shù)量上不同。下面按照如圖3的結(jié)構(gòu)詳細講解,為了方便說明,以下的講解以一個樣本為例,樣本大小為(1,n,10)。第一層是一個60*3*3的卷積層,該卷積層含有60個不同的3*3大小的卷積核,不同的卷積核可以學(xué)習(xí)到圖像的60種不同抽象特征。設(shè)卷積核f=w11,w12,w13w21,w22,w23w31,w32,w33---(7)]]>圖像中一個3*3區(qū)域m=m11,m12,m13m21,m22,m23m31,m32,m33---(8)]]>當(dāng)卷積核f作用于m時,可得卷積值為:c=w11m11+w12m12+w13m13+w21m21+w22m22+w23m23+w31m31+w32m32+w33m33---(9)]]>上式中,wij為卷積核系數(shù),mij為相應(yīng)的卷積圖像值,i,j∈(1,2,3)。卷積核通過滑窗的方式滑動卷積圖像,設(shè)置卷積后邊界大小不變,樣本的大小變?yōu)?60,n,10);得到所有卷積值通過RELU函數(shù)g(x)激活,激活值后的矩陣作為該層的輸出。RELU函數(shù)為:第二層是一個2*2的池化層,池化層能對數(shù)據(jù)進行降維,大大減少模型訓(xùn)練的時間。對圖像中一個2*2區(qū)域m=m11,m12m21,m22---(11)]]>經(jīng)過池化層作用后,對應(yīng)的值變?yōu)閙axpooling(m)=max(m11,m12,m21,m22)(12)將池化過程運用到(60,n,10)的樣本中,得到新矩陣(60,n/2,5),這是第二層的輸出。第三層是一個60*3*3的卷積層,激活函數(shù)為RELU,設(shè)置邊界大小不變,運用第一步中的計算過程,得到新輸出(60,n/2,5),這將使得學(xué)習(xí)到的特征抽象程度更高。第四層是一個60*3*3的卷積層,激活函數(shù)為RELU,設(shè)置邊界大小不變,運用第一步中的計算過程,得到新輸出(60,n/2,5),這將使得學(xué)習(xí)到的特征抽象程度更高。第五層是一個2*2的池化層,將池化層作用于第四層的輸出,得到新輸出(60,n/4,3)。第六層是一個數(shù)據(jù)轉(zhuǎn)換層,將第五層輸出的矩陣轉(zhuǎn)換為一個(60*n/4*3,1)的向量,這為之后的全連接層作數(shù)據(jù)準(zhǔn)備。第七層是一個全連接層,即通過(60*n/4*3,1)向量預(yù)測n個路段在未來10個時間單位內(nèi)的速度,預(yù)測輸出為(10n,1)。在具體應(yīng)用中,可以采用深度學(xué)習(xí)框架,如Caffe,Theano構(gòu)建CNN模型,為了加速計算過程,調(diào)用計算機GPU計算;為了防止模型過擬合,采用EarlyStopping策略,其將訓(xùn)練集按照用戶指定的比例(如8:2)分為新的訓(xùn)練集和驗證集,模型訓(xùn)練時只采用新的訓(xùn)練集,且在每輪模型訓(xùn)練結(jié)束之后驗證模型在驗證集上的表現(xiàn),如監(jiān)聽均方誤差MSE的變化,當(dāng)MSE不斷變小,說明模型通過學(xué)習(xí)預(yù)測能力不斷增強,此時應(yīng)當(dāng)繼續(xù)訓(xùn)練,當(dāng)MSE開始增大時,說明模型開始出現(xiàn)過擬合,應(yīng)當(dāng)停止訓(xùn)練。其中,MSE的計算公式為:MSE=1nΣi=1n(yi-y^i)2---(13)]]>其中,yi與分別為第i個路段的真實數(shù)據(jù)與預(yù)測結(jié)果。本發(fā)明采用卷積神經(jīng)網(wǎng)絡(luò)CNN學(xué)習(xí)熱力圖,通過卷積神經(jīng)網(wǎng)絡(luò)的卷積過程和池化過程將速度熱力圖抽象為單一向量v,通過向量v可對未來交通路網(wǎng)車輛速度信息進行預(yù)測。S5、將待測試的數(shù)據(jù)集輸入到經(jīng)過訓(xùn)練的所述卷積神經(jīng)網(wǎng)絡(luò)模型中,得到預(yù)測結(jié)果。如圖3為本發(fā)明所述的基于卷積神經(jīng)網(wǎng)絡(luò)CNN進行交通網(wǎng)絡(luò)車輛速度信息預(yù)測的原理圖,將待測試的數(shù)據(jù)(比如前20分鐘的二環(huán)速度)集輸入CNN模型,待測試的數(shù)據(jù)依次經(jīng)卷積層、池化層、卷積層、池化層、全連接層處理,得到預(yù)測結(jié)果,比如可以為未來20分鐘的二環(huán)速度。參看圖4,本實施例公開一種基于卷積神經(jīng)網(wǎng)絡(luò)的大規(guī)模交通網(wǎng)絡(luò)擁堵預(yù)測裝置,包括:矩陣生成單元1,用于收集車輛的GPS數(shù)據(jù),并提取在每個時刻每個路段的車輛運行數(shù)據(jù),根據(jù)獲得的所述車輛運行數(shù)據(jù)生成矩陣M,其中,所述車輛運行數(shù)據(jù)包括車輛平均速度,所述矩陣M中的元素aij表示在時間段i路段j上對應(yīng)的所述車輛運行數(shù)據(jù);在具體應(yīng)用中,所述車輛運行數(shù)據(jù)還可以包括車輛流量。所述矩陣生成單元,具體用于對獲得的所述車輛運行數(shù)據(jù)進行均值插補,并根據(jù)均值插補后的數(shù)據(jù)生成矩陣M。熱力圖生成單元2,用于根據(jù)所述矩陣M生成至少一天的時空熱力圖;其中,所述時空熱力圖的橫坐標(biāo)表示時間,縱坐標(biāo)表示按照空間關(guān)系排序的路段ID序列;具體地,所述空間關(guān)系可以包括從北→東→南→西的排序方式。數(shù)據(jù)集生成單元3,用于在所述時空熱力圖上,采取窗口滑動的方式生成數(shù)據(jù)集(X,Y);具體地,將矩陣M表示為[m1,m2,...,mN],mt為矩陣第t列數(shù)據(jù),N表示一天所有時刻數(shù),當(dāng)時間單位為T分鐘時,設(shè)滑動窗口大小為k個時間單位,則第i個數(shù)據(jù)(Xi,Yi)=([mi,mi+1,...,mk-1],[mk,mk+1,...,m2k-1]),i=1...N-2k+1;訓(xùn)練單元4,用于構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)模型,并利用所述數(shù)據(jù)集(X,Y)對所述卷積神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練;所述訓(xùn)練單元,具體用于:S40、打亂數(shù)據(jù)集(X,Y),并按照預(yù)設(shè)比例將所述數(shù)據(jù)集(X,Y)劃分為訓(xùn)練集和驗證集;S41、利用當(dāng)前得到的訓(xùn)練集對所述卷積神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練,并通過利用當(dāng)前得到的驗證集對訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)模型進行驗證,判斷所述訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)模型是否出現(xiàn)過擬合,若出現(xiàn)過擬合,則停止訓(xùn)練,否則,則執(zhí)行步驟S42;S42、將當(dāng)前得到的訓(xùn)練集按照預(yù)設(shè)比例劃分為新的訓(xùn)練集和驗證集,并執(zhí)行步驟S41。預(yù)測單元5,用于將待測試的數(shù)據(jù)集輸入到經(jīng)過訓(xùn)練的所述卷積神經(jīng)網(wǎng)絡(luò)模型中,得到預(yù)測結(jié)果。以下以北京二環(huán)為例,進一步實例說明本發(fā)明的應(yīng)用。第一步,收集北京市二環(huán)的車輛速度信息,包含2015年05月25日到2016年06月30日共37天的全天車輛速度數(shù)據(jù),共236個路段。由于數(shù)據(jù)存在部分缺失,因此在時間×空間為3×3的范圍內(nèi)對數(shù)據(jù)進行均值插補,缺失值填補能夠減小離異點對模型的影響。第二步,生成熱力圖如圖2,其中x軸為時間,取值范圍為[1,720],一個刻度代表一個時間單位(2分鐘),縱坐標(biāo)為北京市二環(huán)的路段ID,所有路段按照從北→東→南→西的空間順序排列,圖像中顏色代表了道路的擁堵程度,顏色越深表示擁堵越嚴重。第三步,生成訓(xùn)練集和測試集。在實例中通過前10個時間單位的交通網(wǎng)絡(luò)車輛速度來預(yù)測后10個時間單位的交通網(wǎng)絡(luò)車輛速度,對每一天而言可以得到樣本701份,進而在37天中可以得到樣本25937份,按照比例8:2將以上數(shù)據(jù)分為訓(xùn)練集和測試集,因此訓(xùn)練集共有樣本20750份,測試集有數(shù)據(jù)5187份。第四步,構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)模型。Keras是一個可基于Theano和TensorFlow的深度學(xué)習(xí)框架,Keras通過訓(xùn)練層疊加的方式使用構(gòu)建深度學(xué)習(xí)模型非常簡單,且Keras能通過Theano或TensorFlow調(diào)用系統(tǒng)GPU進行模型計算,因此在實例中選擇Keras作為搭建模型的框架。卷積神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建完成了由數(shù)據(jù)輸出到數(shù)據(jù)預(yù)測輸出的全轉(zhuǎn)換過程,表1總結(jié)了模型中每一層輸出矩陣大小,以及要學(xué)習(xí)的參數(shù)規(guī)模。表1卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)說明第五步,模型訓(xùn)練。配置Keras在GPU上運行,并實施EarlyStopping策略,將20750份訓(xùn)練樣本按照8:2比例分為16600份訓(xùn)練集和4150份驗證集,在模型每輪運行結(jié)束時檢驗?zāi)P驮隍炞C集上的MSE,當(dāng)MSE不降反升時表明訓(xùn)練開始出現(xiàn)過擬合,此時停止訓(xùn)練,并以現(xiàn)在的模型為最終模型訓(xùn)練結(jié)果;在實例中,訓(xùn)練在第23回合被EarlyStopping。第六步,模型預(yù)測并計算預(yù)測結(jié)果的均方誤差。將測試集5187份數(shù)據(jù)輸入第五步訓(xùn)練好的模型中,得到結(jié)果如表2。為了說明該發(fā)明的效果,表2還給出了其他算法的結(jié)果,可以看出,在測試集上CNN模型的MSE結(jié)果最好,為44.71,該結(jié)果比其他算法提高2倍以上。Extratrees算法在訓(xùn)練集上MSE為0,但是其在測試集中MSE增至80.76,說明Extratrees出現(xiàn)了明顯的過擬合現(xiàn)象。表2各算法在訓(xùn)練集和測試集上的MSE雖然結(jié)合附圖描述了本發(fā)明的實施方式,但是本領(lǐng)域技術(shù)人員可以在不脫離本發(fā)明的精神和范圍的情況下做出各種修改和變型,這樣的修改和變型均落入由所附權(quán)利要求所限定的范圍之內(nèi)。當(dāng)前第1頁1 2 3