一種公交車到站時間實時預(yù)測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及交通技術(shù)領(lǐng)域,更具體地,涉及一種公交車到站時間實時預(yù)測方法。
【背景技術(shù)】
[0002] 公交車到站時間信息是先進的公共交通系統(tǒng)(ATPS)中的重要組成部分。及時而 準確的公交到站時間預(yù)測可以大幅提升公共交通運營質(zhì)量和乘客的滿意度,它既可以令交 通部門及時調(diào)整調(diào)度系統(tǒng),以改善服務(wù)質(zhì)量,同時乘客也可以及時調(diào)整自己的行程,從而減 少等待時間及等待過程中的焦慮感。
[0003] 公交車到站時間可以分解為兩個部分,一部分是公交車在站臺的??繒r間,另一 部分是公交車在站臺間的行駛時間。目前已建立的公交智能系統(tǒng)中,電子站牌上所顯示的 下班車預(yù)計到達時間大都采用車輛當前位置到電子站牌的距離和平均車速之比簡單計算 得到,而這種方法顯示的預(yù)測結(jié)果和實際值往往有較大的出入。
[0004] 如何通過提出實時浮動車數(shù)據(jù)獲得實時交通狀態(tài),并將其融入到公交車到站時間 預(yù)測算法中,從而提升公共交通服務(wù)質(zhì)量,是本發(fā)明研究的重點和目的所在?,F(xiàn)在的國內(nèi)外 研究和技術(shù)現(xiàn)狀主要如下:
[0005] -方面,公交車在站臺的??繒r間長短是衡量服務(wù)水平的重要指標。Shalaby通過 相關(guān)歷史數(shù)據(jù)考慮乘客到達率來計算公交車在各個站點的??繒r間。但是若想獲得真實有 效的實驗數(shù)據(jù)則需要靠人工收集,收集手段昂貴而費時。
[0006] 另一方面,公交車在站間的行駛時間影響因素眾多,如路段的交通狀態(tài)、交叉口的 延誤、距離、天氣等因素,這導致了公交行駛時間分布的隨機性和復(fù)雜性較大。公交車的行 駛時間預(yù)測方法較多,主要可分為以下幾類:時間序列、歷史數(shù)據(jù)模型,多元回歸預(yù)測方法, 卡爾曼濾波、人工神經(jīng)網(wǎng)絡(luò)模型。
[0007] 上文提到的研究大多數(shù)都是基于研究經(jīng)驗來挑選影響公交車行程時間的各種影 響因素,缺乏一個相對科學的挑選影響因素過程,基于經(jīng)驗雖然能挑選出對公交車行程時 間影響較大的幾個重要因素,但同時也會引入一些影響非常小甚至為負的因子,延長算法 運行時間,也可能會忽略對公交車運行時間影響較大而未被重視的因素,因此不能找到最 好的影響因素集用于公交車到站時間預(yù)測。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明為解決以上現(xiàn)有技術(shù)的不足,提供了一種公交車到站時間實時預(yù)測方法, 該方法使用經(jīng)過篩選的因素分別構(gòu)建各個站點路段的支持向量回歸模型,并通過采集這些 因素在各個站點路段的實時值作為輸入應(yīng)用相應(yīng)的支持向量回歸模型對公交到站時間進 行預(yù)測。因此本方法可以將冗余、無關(guān)的因素排除在外,在降低預(yù)測花費時間的同時,其預(yù) 測的精度也得到了提高。
[0009] 為解決上述技術(shù)問題,本發(fā)明的技術(shù)方案如下:
[0010] 一種公交車到站時間實時預(yù)測方法,包括以下步驟:
[0011] Si.分別提取相鄰站點間的站點路段的歷史浮動車數(shù)據(jù)和歷史運行時間數(shù)據(jù),作 為訓練集,根據(jù)訓練集使用基于序列前向特征選擇方法對影響公交車在該站點路段運行時 間的因素進行篩選,經(jīng)過篩選的因素組成特征子集;根據(jù)特征子集分別構(gòu)建相應(yīng)站點路段 的支持向量回歸模型;
[0012] S2.確定公交車當前站點與目標站點間的行駛路線所包含的站點路段,獲取這些 站點路段各自的實時浮動車數(shù)據(jù)和實時運行時間數(shù)據(jù),作為預(yù)測集,對預(yù)測集提取實時特 征子集,并分別將實時特征子集作為相應(yīng)站點路段的支持向量回歸模型的輸入從而使用支 持向量回歸模型預(yù)測公交車在該站點路段的運行時間,根據(jù)預(yù)測的公交車在行駛路線各個 站點路段的運行時間,即可獲得公交車從當前站點到目標站點的到站時間。
[0013] 優(yōu)選地,步驟S2中,在預(yù)測獲得站點路段的運行時間Zi之后,使用貝葉斯理論對 運行時間一進行修正,并根據(jù)修正后的運行時間,對到站時間進行計算,所述修正具體如 下:
[0014] SlL對z的先驗概率P(Z)進行求解:其中z為貝葉斯修正的預(yù)測值,設(shè)P(Z)服從 高斯混合分布,SI
【主權(quán)項】
1. 一種公交車到站時間實時預(yù)測方法,其特征在于:包括以下步驟:
51. 分別提取相鄰站點間的站點路段的歷史浮動車數(shù)據(jù)和歷史運行時間數(shù)據(jù),作為訓 練集,根據(jù)訓練集使用基于序列前向特征選擇方法對影響公交車在該站點路段運行時間的 因素進行篩選,經(jīng)過篩選的因素組成特征子集;根據(jù)特征子集分別構(gòu)建相應(yīng)站點路段的支 持向量回歸模型;
52. 確定公交車當前站點與目標站點間的行駛路線所包含的站點路段,獲取這些站點 路段各自的實時浮動車數(shù)據(jù)和實時運行時間數(shù)據(jù),作為預(yù)測集,對預(yù)測集提取實時特征子 集,并分別將實時特征子集作為相應(yīng)站點路段的支持向量回歸模型的輸入從而使用支持向 量回歸模型預(yù)測公交車在該站點路段的運行時間,根據(jù)預(yù)測的公交車在行駛路線各個站點 路段的運行時間,即可獲得公交車從當前站點到目標站點的到站時間。
2. 根據(jù)權(quán)利要求1所述的公交車到站時間實時預(yù)測方法,其特征在于:步驟S2中,在 預(yù)測獲得站點路段的運行時間f之后,使用貝葉斯理論對運行時間^進行修正,并根據(jù)修 正后的運行時間,對到站時間進行計算,所述修正具體如下 : SI 1.對Z的先驗概率P (z)進行求解:其中Z為貝葉斯修正的預(yù)測值,設(shè)P (z)服從高斯 混合分布,即),其中C為高斯分布的個數(shù),α。為C類被選擇的概率,且 C=I C 滿足I利用最大化期望算法對ρ (ζ)的高斯混合分布進行求解,得到ρ(ζ)的分布; c=l
512. 對似然函數(shù)P (zlz)進行求解: 令'與2的差服從正態(tài)分布,即(z-zO~Ν(μ,σ),此時似然函數(shù)P(z#|z)可表示為
其中正態(tài)分布參數(shù)μ,σ可以由支持向量回歸模型的殘差得到;
513. 在求取得到P(Z)、P(z*|z)之后,建立貝葉斯公式:
對P (z I z#)取最大值時的Z的值Ztl進行求解, Z0= argmax ZP (z | z*) =argmaxzP (z* I z) P (z) Ztl為修正后的運行時間。
3. 根據(jù)權(quán)利要求1所述的公交車到站時間實時預(yù)測方法,其特征在于:所述相鄰站點 間的站點路段的歷史浮動車數(shù)據(jù)和實時浮動車數(shù)據(jù)為出租車GPS數(shù)據(jù)。
4. 根據(jù)權(quán)利要求1所述的公交車到站時間實時預(yù)測方法,其特征在于:支持向量回歸 模型f(x)可用下式表示: N
其中K(x,Xi)為核函數(shù),叫,<,b為模型的參數(shù)。
5. 根據(jù)權(quán)利要求1~5任一項所述的公交車到站時間實時預(yù)測方法,其特征在于:所 述歷史浮動車數(shù)據(jù)包括相鄰站點間的站點路段在不同時期、不同時段的浮動車平均速度, 所述公交歷史報站數(shù)據(jù)包括相鄰站點間的站點路段在不同時期、不同時段的公交站臺停靠 時間和公交站間的行駛時間。
6. 根據(jù)權(quán)利要求1~5任一項所述的公交車到站時間實時預(yù)測方法,其特征在于:所 述經(jīng)過篩選的因素為對公交到站時間的影響呈正相關(guān)的因素。
【專利摘要】本發(fā)明涉及一種公交車到站時間實時預(yù)測方法,包括以下步驟:S1.分別提取相鄰站點間的站點路段的歷史浮動車數(shù)據(jù)和歷史運行時間數(shù)據(jù),作為訓練集,根據(jù)訓練集對影響公交車在該站點路段運行時間的因素進行篩選,根據(jù)篩選的因素分別構(gòu)建相應(yīng)站點路段的支持向量回歸模型;S2.確定公交車當前站點與目標站點間的行駛路線所包含的站點路段,獲取這些站點路段各自的實時浮動車數(shù)據(jù)和實時運行時間數(shù)據(jù),作為預(yù)測集,根據(jù)預(yù)測集使用支持向量回歸模型預(yù)測公交車在該站點路段的運行時間,根據(jù)預(yù)測的公交車在行駛路線各個站點路段的運行時間,即可獲得公交車從當前站點到目標站點的到站時間。本發(fā)明提供的方法可提高預(yù)測公交到站時間的準確度。
【IPC分類】G08G1-123
【公開號】CN104637334
【申請?zhí)枴緾N201510072539
【發(fā)明人】何兆成, 鄧玲麗, 鐘任新
【申請人】中山大學
【公開日】2015年5月20日
【申請日】2015年2月10日