本發(fā)明涉及機(jī)車控制方法,尤其涉及一種基于動態(tài)時序圖的不確定性機(jī)車仿真模型系統(tǒng)構(gòu)建方法。
背景技術(shù):
列車運(yùn)行控制是一個典型的多目標(biāo)、多約束、非線性的復(fù)雜實時變化過程。因此列車操縱問題是一個非線性有約束動態(tài)最優(yōu)化問題。而列車在實際運(yùn)行控制過程中,需要考慮列車安全限速、牽引電機(jī)飽和特性和車間最大耦合力等約束條件,同時還需綜合考慮運(yùn)營準(zhǔn)時性、節(jié)能高效和乘客乘坐舒適度等性能指標(biāo)。為了保證鐵路的安全行駛和提高運(yùn)輸?shù)男剩S多國家和大經(jīng)濟(jì)體都在積極的展開高速鐵路方面的研究。而出于安全、高效、方便等方面的考慮,設(shè)計出針對列車的運(yùn)行過程仿真系統(tǒng)是很有必有的。
所謂系統(tǒng)仿真,是在系統(tǒng)分析的基礎(chǔ)上,對系統(tǒng)的各個部分的性質(zhì)包括它們之間的關(guān)系的性質(zhì)進(jìn)行分析,從而創(chuàng)建出能夠?qū)ο到y(tǒng)結(jié)構(gòu)和系統(tǒng)的運(yùn)行狀態(tài)、過程進(jìn)行描述,并且擁有符合要求的數(shù)量和邏輯的關(guān)系的仿真模型,同時進(jìn)行試驗,并且需要根據(jù)實驗的結(jié)果進(jìn)行定性或者定量的研究,來對系統(tǒng)進(jìn)行正確的判斷。在一般情況下,仿真系統(tǒng)都是利用客觀的系統(tǒng)模型,代替真實模型進(jìn)行客觀的、真實的實驗,并在這實驗的基礎(chǔ)上,進(jìn)行系統(tǒng)性能等方面的評價。
railsys是由德國漢諾威大學(xué)(universityofhannover)和德國鐵路管理咨詢公司(rmcon)共同進(jìn)行開發(fā)研究的鐵路運(yùn)行模擬仿真系統(tǒng)。它作為一款對鐵路的運(yùn)行時間表和鐵路的基礎(chǔ)設(shè)施進(jìn)行優(yōu)化管理的仿真軟件,能夠進(jìn)行鐵路交通網(wǎng)絡(luò)的建立分析、設(shè)計優(yōu)化。甚至可以對列車對某一條線路的占用和當(dāng)前可用的鐵路情況進(jìn)行綜合的分析,還可以對信號的安全性,列車的運(yùn)行進(jìn)行評鑒??梢匀娴某尸F(xiàn)鐵路網(wǎng)絡(luò)系統(tǒng)的實際運(yùn)行情況,對分析鐵路無時不刻在變化的運(yùn)輸量對固定的鐵路運(yùn)行能力的影響、鐵路中的相關(guān)設(shè)施是否需要新建、信號系統(tǒng)的安全及可用性評價、列車時刻表的制定和優(yōu)化等起到重要的輔助決策作用。該系統(tǒng)目前在歐洲和世界鐵路運(yùn)輸行業(yè)得到了廣泛的應(yīng)用,如悉尼,科隆.萊茵.堪培拉的高速鐵路線,慕尼黑、科隆、悉尼、墨爾本的城市鐵路以及柏林和哥本哈根的鐵路網(wǎng)絡(luò)等。
隨著計算機(jī)技術(shù)的快速發(fā)展,國內(nèi)很多學(xué)者也進(jìn)行了相關(guān)研究,如郜春海,唐濤等做的“高速鐵路列車運(yùn)行控制系統(tǒng)車載設(shè)備的軟件設(shè)計”,主要進(jìn)行了高速鐵路列車運(yùn)行控制系統(tǒng)車載設(shè)備功能軟件的設(shè)計;茍徑,寧濱等做的“列車追蹤運(yùn)行仿真系統(tǒng)的研究與實現(xiàn)”,
唐金金,周磊山做的“高速列車運(yùn)行仿真系統(tǒng)研究",彭其淵,石紅國等做的“城市軌道交通列車牽引計算”。同時在列車仿真系統(tǒng)的建立和實現(xiàn)上,也有比較全面的進(jìn)步。如盧衍丹在“鐵路信號與列車控制系統(tǒng)的面向?qū)ο蠓抡妗敝刑岢隽嘶谀P蛶斓腶to仿真系統(tǒng),主要是將ato系統(tǒng)分解成為一些有獨立屬性和操作的獨立的單元,并提出建立了一種新的列車模型庫的建立方法,這樣深化了列車模型庫的建立;如張勇,張維維做的“ctcs.3級列控系統(tǒng)車載設(shè)備仿真測試平臺研究”方面的研究都是關(guān)于列車仿真軟件方面的應(yīng)用。
而目前傳統(tǒng)的機(jī)車預(yù)測控制模型存在以下問題:(1)能仿真模擬的機(jī)車運(yùn)行情景是有限的,不能完全滿足實際自動駕駛需求(2)在設(shè)計列車各車廂分布式牽引力和制動力時,可能會造成拖車在牽引到巡航的轉(zhuǎn)換階段有制動力輸出的情況,增大了列車運(yùn)行能耗;(3)有些方案需要實時在線求解優(yōu)化問題,會造成控制器設(shè)計過程計算量大、硬件實現(xiàn)成本高等問題,極大地限制了其應(yīng)用范圍和應(yīng)用場合。
因此,在處理機(jī)車駕駛仿真時,好的機(jī)車運(yùn)行環(huán)境模型對后期使用機(jī)器學(xué)習(xí)等人工智能方法進(jìn)行優(yōu)化駕駛研究至關(guān)重要。機(jī)車自動駕駛是個算法模型與環(huán)境不斷交互學(xué)習(xí)的過程,所以算法訓(xùn)練環(huán)境是自動駕駛算法得以實現(xiàn)的重要因素。而機(jī)車運(yùn)行環(huán)境中包含了眾多不確定性因素(如天氣變化等),所以亟待構(gòu)建不確定性的機(jī)車運(yùn)行環(huán)境模型實現(xiàn)對外界環(huán)境的有效模擬方法。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于
本發(fā)明的技術(shù)方案是一種基于動態(tài)時序圖的不確定性機(jī)車仿真模型系統(tǒng)構(gòu)建方法,其特征在于:
步驟1、利用基本動力學(xué)模型構(gòu)建基礎(chǔ)環(huán)境模型
該步驟中,基于機(jī)車運(yùn)行日志,通過監(jiān)督式的學(xué)習(xí)算法來完成機(jī)車基礎(chǔ)環(huán)境模型的學(xué)習(xí)與構(gòu)建;其中:
基礎(chǔ)環(huán)境模型的輸入為具體機(jī)車運(yùn)行環(huán)境參數(shù),包括車重、車長、速度、天氣、重力加速度、空氣阻力、轉(zhuǎn)動阻力、曲度;
基礎(chǔ)環(huán)境模型可用如下公式表示:
其中,m為機(jī)車質(zhì)量;t為時間;ρ為機(jī)車旋轉(zhuǎn)質(zhì)量的計數(shù)因子;v為機(jī)車速度;s為機(jī)車位移;
f(s)為當(dāng)前位置的牽引力或者制動力;
rb(v)為機(jī)車基本阻力;
rl(s)為軌道阻力;
步驟2、注入動態(tài)時序圖模型,動態(tài)時序圖模型為一個基于隱馬爾科夫模型的狀態(tài)轉(zhuǎn)移圖模型;
步驟3、完成動態(tài)時序圖模型的不確定性參數(shù)學(xué)習(xí),即隱馬爾可夫模型的學(xué)習(xí)與訓(xùn)練;
步驟4、動態(tài)時序圖學(xué)習(xí)完畢后,輸入具體不確定環(huán)境因素,不確定環(huán)境因素包括大雨天氣、出現(xiàn)輪滑,將不確定環(huán)境因素作為模型的觀察序列,即可模擬產(chǎn)生隱藏狀態(tài)序列,及確定如何對基本物理模型修改參數(shù)使其能適應(yīng)該具體環(huán)境因素下的機(jī)車運(yùn)行。
進(jìn)一步地,步驟3中,隱馬爾可夫模型的學(xué)習(xí)和訓(xùn)練過程就是得到狀態(tài)轉(zhuǎn)移矩陣,混淆矩陣,以及初始化概率向量,具體包括:
(1)首先對于隱馬爾科夫模型的參數(shù)進(jìn)行一個初始的估計,然后通過對于給定的數(shù)據(jù)評估參數(shù)的的價值并減少它們所引起的錯誤來重新修訂參數(shù);
(2)根據(jù)需要建立模型的隱形狀態(tài)數(shù),首先給定初始參數(shù)λ0=(π,a,b),在構(gòu)建不確定性機(jī)車運(yùn)行環(huán)境時,具體給定的初始參數(shù)如下:
π:初始概率向量;
a:狀態(tài)轉(zhuǎn)移矩陣;
b:混淆矩陣;
(3)利用baum-welch重估公式進(jìn)行參數(shù)估計,直到達(dá)到收斂誤差或最大迭代步長;
(4)迭代后更新的三元組(π,a,b),便得到構(gòu)建不確定性機(jī)車運(yùn)行環(huán)境問題的新馬爾科夫模型
本發(fā)明的有益效果在于:
本發(fā)明的優(yōu)點在于:基于動態(tài)時序圖模型,進(jìn)行列車運(yùn)行環(huán)境擾動參數(shù)的學(xué)習(xí)。動態(tài)時序圖模型適應(yīng)于狀態(tài)圖隨時間動態(tài)改變的應(yīng)用場景,能夠提供較為精準(zhǔn)的預(yù)測結(jié)果。應(yīng)用該模型進(jìn)行列車運(yùn)行環(huán)境擾動參數(shù)的學(xué)習(xí),與基礎(chǔ)模型參數(shù)學(xué)習(xí)共同構(gòu)建成完善的列車運(yùn)行環(huán)境模型,從而更能適應(yīng)多變的機(jī)車運(yùn)行環(huán)境仿真模擬。
附圖說明
圖1是一組用于識別和預(yù)測的時間序列;
圖2是流程圖;
具體實施方式
下面結(jié)合附圖1-2對本發(fā)明的具體技術(shù)方案進(jìn)行詳細(xì)描述。
該實施例提供了一種基于動態(tài)時序圖的不確定性機(jī)車仿真模型系統(tǒng)構(gòu)建方法。該方法主要包括以下步驟;首先進(jìn)行基礎(chǔ)環(huán)境模型的學(xué)習(xí)與構(gòu)建,其次設(shè)計動態(tài)時序圖模型以適用于機(jī)車運(yùn)行場景,然后進(jìn)行動態(tài)時序圖模型的學(xué)習(xí)與構(gòu)建,最后輸入具體的不確定環(huán)境因素,利用構(gòu)建好的模型獲得適應(yīng)于該情形的機(jī)車運(yùn)行模型,更具體地包括:
步驟1、利用基本動力學(xué)模型構(gòu)建基礎(chǔ)環(huán)境模型
通常,模型的構(gòu)建分為基礎(chǔ)環(huán)境模型構(gòu)建和不確定性環(huán)境參數(shù)變化趨勢學(xué)習(xí)兩個部分。由于機(jī)車的運(yùn)行遵循基本動力學(xué)模型,該實施例中,擬基于機(jī)車運(yùn)行日志,通過監(jiān)督式的學(xué)習(xí)算法來完成機(jī)車基礎(chǔ)環(huán)境模型的學(xué)習(xí)與構(gòu)建。
基礎(chǔ)環(huán)境模型指該模型的輸入為具體機(jī)車運(yùn)行環(huán)境參數(shù),包括車重、車長、速度、天氣、重力加速度、空氣阻力、轉(zhuǎn)動阻力、曲度,具體機(jī)車運(yùn)行環(huán)境參數(shù)均可以從機(jī)車運(yùn)行日志中獲取。
基礎(chǔ)環(huán)境模型可用如下公式表示:
其中,m為機(jī)車質(zhì)量;t為時間;ρ為機(jī)車旋轉(zhuǎn)質(zhì)量的計數(shù)因子;v為機(jī)車速度;s為機(jī)車位移;
f(s)為當(dāng)前位置的牽引力或者制動力;
rb(v)為機(jī)車基本阻力,包含轉(zhuǎn)動阻力和空氣阻力,其經(jīng)驗公式可定義為:
rb(v)=m(a1+a2v+a3v2)
其中a1,a2,a3均為經(jīng)驗常數(shù)系數(shù)。
rl(s)為軌道阻力,軌道阻力是由軌道坡度、曲度、隧道等因素產(chǎn)生的,軌道阻力可由如下公式給出定義:
rl(s)=m*g*sinα(s)+fc(r(s))+ft(lt(s),v)
其中,g為重力加速度,α(s)、r(s)、lt(s)分別表示坡度、彎道半徑,以及隧道長度。其中彎道阻力fc()和隧道阻力ft()可以由以下公式定義:
當(dāng)機(jī)車在隧道中行駛時,會受到更大的空氣阻力,這取決于隧道形狀,隧道墻面的粗糙程度,以及機(jī)車外觀設(shè)計等等因素。
步驟2、注入動態(tài)時序圖模型,動態(tài)時序圖模型為一個基于隱馬爾科夫模型的狀態(tài)轉(zhuǎn)移圖模型。
該實施例中,利用動態(tài)時序圖進(jìn)行不確定性機(jī)車仿真的方法可以將實際運(yùn)行環(huán)境中存在的眾多非確定性擾動因素考慮進(jìn)來,具體實現(xiàn)方法可以有多種,比如可以采用改進(jìn)的隱馬爾科夫回歸模型和baum-welch回歸算法相結(jié)合的動態(tài)時序圖方法來實現(xiàn)對不確定性環(huán)境參數(shù)變化趨勢的學(xué)習(xí),從而完善機(jī)車運(yùn)行環(huán)境模型。包含不確定性的機(jī)車運(yùn)行環(huán)境模型的成功構(gòu)建將為機(jī)車自動駕駛算法的訓(xùn)練與驗證提供有效的支持。
在實際機(jī)車運(yùn)行環(huán)境中,環(huán)境參數(shù)可能會產(chǎn)生不確定性擾動,此時學(xué)習(xí)到的基礎(chǔ)環(huán)境模型將無法覆蓋該場景。針對此問題,本發(fā)明基于動態(tài)時序圖模型,進(jìn)行列車運(yùn)行環(huán)境擾動參數(shù)的學(xué)習(xí)。
基于隱馬爾科夫模型的狀態(tài)轉(zhuǎn)移圖模型能夠適應(yīng)于狀態(tài)圖隨時間動態(tài)改變的應(yīng)用場景,能夠提供較為精準(zhǔn)的預(yù)測結(jié)果。應(yīng)用該模型進(jìn)行列車運(yùn)行環(huán)境擾動參數(shù)的學(xué)習(xí),與基礎(chǔ)模型參數(shù)學(xué)習(xí)共同構(gòu)建成完善的列車運(yùn)行環(huán)境模型。
一個隱馬爾科夫模型應(yīng)包含兩層:隱藏層和可觀測層。
隱藏層由馬爾科夫鏈構(gòu)成,可以看做有限狀態(tài)機(jī),每個狀態(tài)si都帶有狀態(tài)轉(zhuǎn)移概率。
可觀測層是一組用于識別和預(yù)測的時間序列ci。如圖1所示:
一個隱馬爾科夫模型是一個三元組,即:
初始化概率向量:π=(πi),其中πi=p(i1=qi),i=1,2,…,n
狀態(tài)轉(zhuǎn)移矩陣:a=(aij),其中
混淆矩陣:b=(bij),其中bij=p(bi|aj)
該實施例中,不確定性機(jī)車仿真模型可以使用hmm來進(jìn)行描述,我們可以根據(jù)一個觀察序列(來自于已知的集合),以及與其有關(guān)的一個隱藏狀態(tài)集,估計一個最合適的隱馬爾科夫模型(hmm),也就是確定對已知序列描述的最合適的(π,a,b)三元組。
在該模型中,隱藏狀態(tài)為列車運(yùn)行環(huán)境擾動參數(shù)的改變情況,即基礎(chǔ)模型中出現(xiàn)的機(jī)車基本阻力系數(shù)a,b,c、彎道阻力系數(shù)fc和隧道阻力系數(shù)ft。
而觀察狀態(tài)為實際中我們可以觀察到的機(jī)車運(yùn)行狀態(tài),即正常運(yùn)行、空轉(zhuǎn)、輪滑、超速等等。具體隱藏狀態(tài)、觀察狀態(tài)的設(shè)計體現(xiàn)在如下狀態(tài)轉(zhuǎn)移矩陣和混淆矩陣中。然后通過實際的機(jī)車運(yùn)行日志得到一些列觀察狀態(tài)序列完成hmm模型的學(xué)習(xí)。
模型狀態(tài)轉(zhuǎn)移矩陣
模型混淆矩陣
步驟3、完成動態(tài)時序圖模型的不確定性參數(shù)學(xué)習(xí),即隱馬爾可夫模型的學(xué)習(xí)與訓(xùn)練
學(xué)習(xí)隱馬爾可夫模型的過程實則為得到其狀態(tài)轉(zhuǎn)移概率矩陣,混淆矩陣,以及初始概率向的混淆矩陣。然而,在許多實際問題的情況下這些參數(shù)都不能直接計算的,因此我們首先需要進(jìn)行估計。
進(jìn)行參數(shù)估計的方法有很多種,以baum-welch算法為例,baum-welch算法就可以以一個觀察序列為基礎(chǔ)來進(jìn)行這樣的估計,而這個觀察序列來自于一個給定的集合,它所代表的是一個隱馬爾科夫模型中的一個已知的隱藏集合。具體來講,需要以下步驟:
(1)首先對于隱馬爾科夫模型的參數(shù)進(jìn)行一個初始的估計,然后通過對于給定的數(shù)據(jù)評估這些參數(shù)的的價值并減少它們所引起的錯誤來重新修訂這些hmm參數(shù)。
(2)根據(jù)需要建立的模型的隱形狀態(tài)數(shù),首先給定初始參數(shù)λ0=(π,a,b),在構(gòu)建不確定性機(jī)車運(yùn)行環(huán)境時,具體給定的初始參數(shù)可以設(shè)計如下:
π:初始概率向量,即時刻t=1時,處于各隱藏狀態(tài),即ai:如增大基本阻力系數(shù)a/b/c、減小彎道阻力系數(shù)ft、保持系數(shù)不變的概率;
a:狀態(tài)轉(zhuǎn)移概率矩陣。如在t時刻處于增大基本阻力系數(shù)a的狀態(tài)下,在t+1時刻處于減小彎道阻力系數(shù)ft的狀態(tài)下的概率。
b:混淆矩陣,如處于減小彎道阻力系數(shù)ft狀態(tài)下時,機(jī)車發(fā)生輪滑現(xiàn)象的概率。
步驟(1)和步驟(2)便是模型學(xué)習(xí)的輸入?yún)?shù),這些輸入僅僅通過先驗知識輸入即可,即便是錯誤的也沒關(guān)系,后期模型學(xué)習(xí)過程中會自動更正。
(3)利用baum-welch重估公式進(jìn)行參數(shù)估計,直到達(dá)到收斂誤差或最大迭代步長。
(4)迭代后更新的三元組(π,a,b)便是適用于構(gòu)建不確定性機(jī)車運(yùn)行環(huán)境問題的新馬爾科夫模型。
步驟4、動態(tài)時序圖學(xué)習(xí)完畢后,輸入具體不確定環(huán)境因素,不確定環(huán)境因素包括大雨天氣、出現(xiàn)輪滑,將不確定環(huán)境因素作為模型的觀察序列,即可模擬產(chǎn)生隱藏狀態(tài)序列,及確定如何對基本物理模型修改參數(shù)使其能適應(yīng)該具體環(huán)境因素下的機(jī)車運(yùn)行。
而根據(jù)模型的觀測序列推出最有可能的隱藏狀態(tài)序列的算法有很多,比如viterbi算法。
盡管以上結(jié)合附圖對本發(fā)明的實施方案進(jìn)行了描述,但是本發(fā)明并不同限于上述的具體實施方案和應(yīng)用領(lǐng)域,上述的具體實施方案僅僅是示意性的、指導(dǎo)性的,而不是限制性的。本領(lǐng)域的普通技術(shù)人員在說明書的啟示下,在不脫離本發(fā)明權(quán)利要求所保護(hù)的范圍的情況下,還可以做出很多種的形式,這些均屬于本發(fā)明保護(hù)之列。