一種基于條件隨機(jī)場(chǎng)的城市人口移動(dòng)數(shù)據(jù)模型分析方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明提出了一種基于條件隨機(jī)場(chǎng)的城市人口移動(dòng)數(shù)據(jù)模型分析方法,該方法結(jié) 合天氣因素分析城市居民通過(guò)地鐵移動(dòng)的目的地分布。該方法將軌道交通客流和天氣數(shù)據(jù) 關(guān)聯(lián),預(yù)測(cè)各個(gè)0D對(duì)客流量,然后歸一化得到出站概率向量來(lái)表示居民出站點(diǎn)即居民移動(dòng) 目的地分布,而后依據(jù)實(shí)時(shí)刷卡數(shù)據(jù)和軌道交通基礎(chǔ)數(shù)據(jù)模擬乘客出行,統(tǒng)計(jì)出軌道交通 網(wǎng)絡(luò)全路網(wǎng)客流分布。本發(fā)明旨在挖掘軌道交通客流與天氣因素的相關(guān)關(guān)系,分析天氣因 素對(duì)城市人口移動(dòng)的影響,預(yù)測(cè)城市居民通過(guò)地鐵去往的目的地分布。
【背景技術(shù)】
[0002] 現(xiàn)在人們?cè)絹?lái)越重視健康出行,在出行時(shí)對(duì)室外空氣質(zhì)量的考慮越來(lái)越看重,因 此城市人口移動(dòng)受到天氣因素越來(lái)越大的影響?,F(xiàn)在在分析城市人口移動(dòng)、預(yù)測(cè)乘客出行 目的地方面,大多數(shù)客流預(yù)測(cè)算法只是考慮算法客流序列自身的特征,而沒(méi)有與影響客流 變化的因素結(jié)合,因此本專(zhuān)利申請(qǐng)?jiān)趫D模型的基礎(chǔ)上結(jié)合客流序列與天氣因素對(duì)乘客出站 進(jìn)行預(yù)測(cè),以達(dá)到分析城市人口通過(guò)地鐵移動(dòng)的分布的目的。同時(shí),在預(yù)測(cè)乘客出站的基礎(chǔ) 上提出一種統(tǒng)計(jì)客流分布的方法,即時(shí)計(jì)算路網(wǎng)客流分布。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明的目的在于提出一種基于條件隨機(jī)場(chǎng)的城市人口移動(dòng)數(shù)據(jù)模型分析方法。 該方法將軌道交通客流和天氣因素關(guān)聯(lián),結(jié)合歷史客流數(shù)據(jù)和天氣數(shù)據(jù),預(yù)測(cè)各個(gè)站點(diǎn)到 其它站點(diǎn)的出站概率向量,然后對(duì)于乘客實(shí)時(shí)刷卡數(shù)據(jù),預(yù)測(cè)乘客的出站點(diǎn)和出行路徑,并 模擬乘客出行,統(tǒng)計(jì)軌道交通網(wǎng)絡(luò)客流分布。這種算法將軌道交通客流與天氣因素關(guān)聯(lián),更 加準(zhǔn)確的預(yù)測(cè)乘客的出站點(diǎn)和全路網(wǎng)客流分布。
[0004] 本發(fā)明解決其技術(shù)問(wèn)題所采取的技術(shù)方案是:通過(guò)歷史數(shù)據(jù)訓(xùn)練模型得到客流預(yù) 測(cè)模型,計(jì)算各個(gè)站點(diǎn)的出站概率向量,之后,通過(guò)對(duì)實(shí)時(shí)乘客進(jìn)站數(shù)據(jù)進(jìn)行模擬,統(tǒng)計(jì)全 路網(wǎng)客流分布。首先將一天依據(jù)客流特征劃分為η個(gè)時(shí)段,針對(duì)每個(gè)0D對(duì)建立客流預(yù)測(cè)模 型,將天氣數(shù)據(jù)和歷史客流作為模型輸入,預(yù)測(cè)出該0D對(duì)的客流序列;然后對(duì)每個(gè)站點(diǎn),歸 一化其到其它站點(diǎn)的客流序列得到該站點(diǎn)的出站概率向量;最后實(shí)時(shí)獲取乘客進(jìn)站數(shù)據(jù), 預(yù)測(cè)乘客出站點(diǎn)和出行路徑,對(duì)每條數(shù)據(jù)進(jìn)行出行模擬,統(tǒng)計(jì)得到全路網(wǎng)各個(gè)站點(diǎn)的客流 量和各輛列車(chē)上的客流量。
[0005] 本發(fā)明的詳細(xì)技術(shù)方案如下:一種基于條件隨機(jī)場(chǎng)的城市人口移動(dòng)數(shù)據(jù)模型分析 方法包括兩個(gè)步驟:
[0006] 步驟一:預(yù)測(cè)站點(diǎn)到其它站點(diǎn)的出站概率向量:依據(jù)歷史客流數(shù)據(jù)和天氣數(shù)據(jù)訓(xùn) 練條件隨機(jī)場(chǎng)客流預(yù)測(cè)模型,輸入天氣數(shù)據(jù)預(yù)測(cè)每個(gè)0D對(duì)客流序列,歸一化計(jì)算各個(gè)站點(diǎn) 出站概率向量。
[0007] (1)條件隨機(jī)場(chǎng)模型建立
[0008] 見(jiàn)圖2,將一天劃分為η個(gè)時(shí)段,天氣數(shù)據(jù)(溫度、空氣質(zhì)量、是否下雨)Χ= {Xi,x2, . . .,xj作為模型的輸入數(shù)據(jù),0D對(duì)客流數(shù)據(jù)Y= {y^y2, . . .,yj作為模型的輸出 數(shù)據(jù)。模型中變量χ和y包括兩種相互關(guān)系,一種是觀察變量和輸出變量之間的關(guān)系,一種 是輸出變量之間的時(shí)間序列關(guān)系。
[0009] 觀察變量和輸出變量之間的關(guān)系稱(chēng)為聯(lián)合勢(shì)能,采用二次的函數(shù)gt(yt,X;α,β) 表示,表達(dá)式如下所示:
[0011] 式中:
[0012] gt(yt,χ;α,β):聯(lián)合勢(shì)能函數(shù)
[0014] zt:t時(shí)段是否下雨這一狀態(tài)
[0015] v.j:v.j= {1,2}分別表示下雨和不下雨兩種狀態(tài)
[0016] < :t時(shí)段v。狀態(tài)下二次變量的參數(shù)
[0017] t時(shí)段v〗狀態(tài)下一次變量yt的參數(shù)
[0018]輸出變量之間的關(guān)系稱(chēng)為相互勢(shì)能,采用二次函數(shù)匕匕^+以;λ)表示,表達(dá)式 如下所示:
[0020]式中:
[0021]ft(yt,yt+1,χ;λ):相互勢(shì)能函數(shù)
[0023] zt:t時(shí)段是否下雨這一狀態(tài)
[0024] vj:vj= {1, 2}分別表示下雨和不下雨兩種狀態(tài)
[0025] :t時(shí)段\狀態(tài)下相鄰變量ytyt+1的參數(shù)
[0026] 在聯(lián)合勢(shì)能函數(shù)和相互勢(shì)能函數(shù)的基礎(chǔ)上,條件隨機(jī)場(chǎng)客流預(yù)測(cè)模型的條件概率 P(yIχ)的表達(dá)式為:
[0028] 式中:
[0029]p(y|χ;α,β,λ):條件隨機(jī)場(chǎng)客流預(yù)測(cè)模型的條件概率
[0031] Τ:客流序列每天劃分的時(shí)段數(shù)
[0032]依據(jù)歷史客流數(shù)據(jù)和歷史天氣數(shù)據(jù)對(duì)模型的條件概率p(y|X;a,β,λ)使用梯 度下降算法進(jìn)行優(yōu)化迭代得到模型的最優(yōu)參數(shù)。
[0033] (2)預(yù)測(cè)0D對(duì)客流序列
[0034] 由于乘客在出行時(shí)一般由進(jìn)站點(diǎn)的天氣因素影響,因此本發(fā)明提出的條件隨機(jī)場(chǎng) 模型將進(jìn)站點(diǎn)的天氣數(shù)據(jù)作為輸入。在(1)中,本發(fā)明對(duì)各個(gè)0D對(duì)進(jìn)行訓(xùn)練得到各自的參 數(shù),將天氣數(shù)據(jù)輸入可以得到站點(diǎn)0到站點(diǎn)Di的客流序列為{yi,yf2,...,yi}。因此本發(fā)明對(duì)各 個(gè)0D對(duì)進(jìn)行預(yù)測(cè),得到每個(gè)0D對(duì)的客流序列。
[0035] (3)出站概率向量計(jì)算:對(duì)一個(gè)進(jìn)站點(diǎn)在不同時(shí)間段歸一化該站到其它站點(diǎn)的客 流序列,計(jì)算出出站點(diǎn)概率向量;
[0036] 出站概率向量計(jì)算方法如下:
[0037] 對(duì)于一個(gè)站點(diǎn)0,輸入天氣數(shù)據(jù)預(yù)測(cè)從該站點(diǎn)到其它m個(gè)站點(diǎn)的客流序列分 別為丨yi,y〗,...,yi} (i=i,各….?Β),則在k時(shí)段,站點(diǎn)〇到其它m個(gè)站點(diǎn)的客流向量為 iyi,y〗,...,yr】,對(duì)客流向量進(jìn)行歸一化得到該站點(diǎn)在k時(shí)段到其它m個(gè)站點(diǎn)的客流比例,即
表示k時(shí)段m個(gè)站點(diǎn)客流總和。該客流比例表明乘客 從0站點(diǎn)出發(fā)到達(dá)其它站點(diǎn)的比例,對(duì)于一條乘客進(jìn)站數(shù)據(jù),該向量表示乘客去往其它各 個(gè)站點(diǎn)的概率,即為站點(diǎn)0的出站概率向量。對(duì)每個(gè)計(jì)算其去往其它站點(diǎn)的出站概率向量, 得到全路網(wǎng)站點(diǎn)的出站概率矩陣,用于預(yù)測(cè)乘客的出站站點(diǎn)。
[0038] 步驟二:實(shí)時(shí)獲取乘客進(jìn)站數(shù)據(jù),模擬乘客出行,統(tǒng)計(jì)軌道交通網(wǎng)絡(luò)全路網(wǎng)客流分 布。
[0039] (1)出站站點(diǎn)預(yù)測(cè):依據(jù)刷卡記錄時(shí)間所屬的時(shí)間段,搜索該時(shí)間段進(jìn)站點(diǎn)的出 站向量,依據(jù)隨機(jī)數(shù)所屬的區(qū)間預(yù)測(cè)出站點(diǎn);
[0040] (2)出行路徑選擇:對(duì)于一個(gè)記錄的進(jìn)展點(diǎn)和出站點(diǎn),依據(jù)歷史該0D對(duì)路徑客流 比例的統(tǒng)計(jì)數(shù)據(jù),分配一條出行路徑給該條記錄。
[0041] (3)模擬乘客出行:以軌道交通基礎(chǔ)數(shù)據(jù)(發(fā)車(chē)時(shí)間、行車(chē)速度等)和乘客的進(jìn)站 時(shí)間、預(yù)測(cè)的出站點(diǎn),模擬乘客的在軌道網(wǎng)絡(luò)中的出行情況。
[0042] (4)計(jì)算全路網(wǎng)客流分布:模擬每個(gè)乘客的出行,將乘客出行數(shù)據(jù)存入數(shù)據(jù)庫(kù),綜 合所有乘客的出行數(shù)據(jù)統(tǒng)計(jì)出軌道交通網(wǎng)絡(luò)各個(gè)站點(diǎn)和列車(chē)的實(shí)時(shí)客流量。
[0043] 其中,列車(chē)上實(shí)時(shí)客流量統(tǒng)計(jì)方法如下:
[0044] 當(dāng)乘客進(jìn)站后到達(dá)站臺(tái),依據(jù)列車(chē)時(shí)刻表和列車(chē)運(yùn)行時(shí)間計(jì)算出將要到達(dá)的列車(chē) i,則列車(chē)i的客流量f\+l,當(dāng)列車(chē)到達(dá)乘客的目的站點(diǎn)后乘客下車(chē),列車(chē)的客流量為fi=f;-1。對(duì)每個(gè)乘客的出行,列車(chē)的客流量做如上的統(tǒng)計(jì),依據(jù)乘客的出行狀態(tài)變化,即 可統(tǒng)計(jì)出列車(chē)上即時(shí)客流量。
[0045] 其中,站點(diǎn)客流量統(tǒng)計(jì)方法如下:
[0046] 車(chē)站的客流量為當(dāng)前時(shí)刻車(chē)站內(nèi)客流量,加上進(jìn)入站點(diǎn)的客流量,減去離開(kāi)站點(diǎn) 的客流量,其中進(jìn)站客流量包括刷卡進(jìn)站客流量和從列車(chē)上下來(lái)進(jìn)入站點(diǎn)的客流量,離開(kāi) 站點(diǎn)的客流量包括刷卡出站客流量和上車(chē)離開(kāi)站點(diǎn)客流量,數(shù)學(xué)表達(dá)式如下:
[0047]=Ν'- +N取+Nm - -NOTi
[0048] 式中:
[0049] \ :站點(diǎn)s在t時(shí)刻客流量
[0050] :站點(diǎn)s在t時(shí)刻刷卡進(jìn)站客流量
[0051] I/r,:站點(diǎn)s在t時(shí)刻從列車(chē)上下車(chē)進(jìn)站客流量
[0052] Iqs,:站點(diǎn)s在t時(shí)刻刷卡出站客流量
[0053] :站點(diǎn)s在t時(shí)刻上車(chē)離開(kāi)站點(diǎn)客流量。
[0054] 優(yōu)點(diǎn)及功效:本發(fā)明一種基于條件隨機(jī)場(chǎng)的城市人口移動(dòng)數(shù)據(jù)模型分析方法,實(shí) 時(shí)預(yù)測(cè)乘客出站站點(diǎn),在預(yù)測(cè)基礎(chǔ)上模擬乘客出行情況并統(tǒng)計(jì)路網(wǎng)客流分布,其優(yōu)點(diǎn)是:基 于目前天氣因素(如空氣質(zhì)量)對(duì)乘客出行影響越來(lái)越大,本發(fā)明將軌道交通客流與天氣 因素關(guān)聯(lián),從影響客流變化的內(nèi)在因素出發(fā),挖掘天氣因素與客流的深層次關(guān)系,達(dá)到了提 高預(yù)測(cè)乘客出站站點(diǎn)精確度和路網(wǎng)客流分布統(tǒng)計(jì)準(zhǔn)確度度的目的。
【附圖說(shuō)明】
[0055] 圖1是基于條件隨機(jī)場(chǎng)的城市人口移動(dòng)數(shù)據(jù)模型的全過(guò)程流程圖。
[0056] 圖2是基于條件隨機(jī)場(chǎng)的城市人口移動(dòng)數(shù)據(jù)模型示意圖。
[0057] 圖中符號(hào)說(shuō)明如下:
[0058] 輸入序列71{1 =l,2,...,n}表示在每天第i個(gè)時(shí)段0D對(duì)的客流量;輸出序列 xji= 1,2,. . .,n}表示進(jìn)站站點(diǎn)在第i個(gè)時(shí)段的天氣數(shù)據(jù),其中h表示溫度,8;表示空氣 質(zhì)量,1^表示是否下雨。
【具體實(shí)施方式】
[0059] 本發(fā)明是一種基于條件隨機(jī)場(chǎng)的城市人口移動(dòng)數(shù)據(jù)模型分析方法。該方法將軌道 交通客流和天氣因素關(guān)聯(lián),預(yù)測(cè)乘客出站站點(diǎn),之后通過(guò)乘客出行模擬統(tǒng)計(jì)全路網(wǎng)客流分 布。
[0060] 實(shí)施方法包括兩個(gè)步驟,分別是訓(xùn)練預(yù)測(cè)模型生成出站概率向量和實(shí)時(shí)數(shù)據(jù)預(yù)測(cè) 出站點(diǎn)模擬出行。如圖1、圖2所示,具體步驟如下所示:
[0061] 步驟一結(jié)合歷史客流數(shù)據(jù)和天氣數(shù)據(jù),訓(xùn)練模型并生成出站概率向量
[0062] 步驟一將歷史每天的客流數(shù)據(jù)和天氣數(shù)據(jù)每天劃分為η個(gè)時(shí)段。將于軌道交通 網(wǎng)絡(luò)一個(gè)進(jìn)站0到第i個(gè)站客流數(shù)據(jù)依據(jù)劃分的時(shí)段進(jìn)行聚合,生成客流時(shí)間序列 狀忒,…,y"} (m...m)作為模型的輸出變量,同時(shí)將天氣數(shù)據(jù)(溫度、空氣質(zhì)量、是否 下雨)也同樣生成時(shí)間序列X= {Xl,X2,...,XJ作為模型的輸入序列,采用梯度下降算法 對(duì)模型的參數(shù)進(jìn)行優(yōu)化得到模型的最優(yōu)參數(shù),即可得到進(jìn)站〇到其它出站Di的客流預(yù)測(cè)模 型。在訓(xùn)練處客流預(yù)測(cè)模型后,在預(yù)測(cè)天,將當(dāng)天的天氣數(shù)據(jù)按時(shí)段生成天氣數(shù)據(jù)時(shí)間序列 輸入模型,模型即可以計(jì)算出進(jìn)站0到其它出站Di的客流序列{S〈名,...次,} (i=l,2,.…m)a 對(duì)于軌道交通網(wǎng)絡(luò)中,對(duì)每個(gè)站點(diǎn)進(jìn)行模型訓(xùn)練和客流序列預(yù)測(cè),獲取軌道交通每個(gè)站點(diǎn) 到其它站