本發(fā)明涉及輿情預(yù)測(cè),具體涉及一種基于集成算法預(yù)測(cè)模型的信號(hào)交叉口輿情預(yù)測(cè)及系統(tǒng)。
背景技術(shù):
1、隨著城市化進(jìn)程的不斷推進(jìn)和經(jīng)濟(jì)的發(fā)展,國(guó)民交通需求不斷增加,居民出行品質(zhì)的需求也不斷提高。近年來(lái),交通與互聯(lián)網(wǎng)、大數(shù)據(jù)的進(jìn)一步融合,交通類重大突發(fā)事件通過(guò)網(wǎng)絡(luò)曝光與傳播越來(lái)越頻繁,社交媒體等新媒體平臺(tái)又成為交通輿情快速擴(kuò)散的首要平臺(tái),交通輿情分析與監(jiān)測(cè)成為解決交通問(wèn)題的重要內(nèi)容,也是未來(lái)交通運(yùn)輸、社會(huì)輿情和城市治理緊密結(jié)合的重要發(fā)展方向。
2、交通輿情是對(duì)現(xiàn)狀交通問(wèn)題的暴露,是對(duì)現(xiàn)狀交通系統(tǒng)性能的反饋,富含重要的交通相關(guān)信息。目前,對(duì)于城市交通輿情的分析尚處于起步階段,缺乏對(duì)城市交通輿情數(shù)據(jù)的深入分析,未能有效利用交通輿情信息,助力城市交通治理。另一方面,人工智能的迅速發(fā)展為交通問(wèn)題的剖析與解決提供新的思路。合理利用交通大數(shù)據(jù)并結(jié)合智能方法以發(fā)現(xiàn)城市交通隱患,進(jìn)行主動(dòng)式干預(yù),提高城市交通服務(wù)質(zhì)量至關(guān)重要?,F(xiàn)階段,相關(guān)學(xué)者多采用樸素貝葉斯方法開(kāi)展輿情預(yù)測(cè),但模型精確的不足,影響因素考慮不夠。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是提供一種基于集成算法預(yù)測(cè)模型的信號(hào)交叉口輿情預(yù)測(cè)及系統(tǒng),所述方法主要采用半樸素貝葉斯算法、邏輯回歸算法和分類決策樹(shù)作為基學(xué)習(xí)器的集成算法預(yù)測(cè)模型,并將其通過(guò)加權(quán)組合成一個(gè)強(qiáng)分類器,通過(guò)強(qiáng)分類器對(duì)城市信號(hào)交叉口的輿情分析預(yù)測(cè),可以通過(guò)提高模型的泛化能力和性能,以此來(lái)準(zhǔn)確提升輿情預(yù)測(cè)結(jié)果。
2、為解決上述技術(shù)問(wèn)題,本發(fā)明采用了以下方案:
3、一種基于集成算法預(yù)測(cè)模型的信號(hào)交叉口輿情預(yù)測(cè),所述方法具體包括以下步驟:
4、s1:獲得所有信號(hào)交叉口的特征數(shù)據(jù)以及與信號(hào)交叉口相關(guān)的輿情信息;
5、s2:對(duì)信號(hào)交叉口的特征數(shù)據(jù)以及輿情信息進(jìn)預(yù)處理,根據(jù)預(yù)處理后的信號(hào)交叉口的特征數(shù)據(jù)以及輿情信息建立信號(hào)交叉口輿情數(shù)據(jù)集;
6、所述信號(hào)交叉口輿情數(shù)據(jù)集包括若干個(gè)樣本子集,每個(gè)樣本子集以一個(gè)輿情信息為樣本,并收集相關(guān)信號(hào)交叉口的特征數(shù)據(jù)作為該樣本的樣本特征;
7、s3:將樣本子集中的樣本特征代入到集成算法預(yù)測(cè)模型中以迭代的方式進(jìn)行樣本加權(quán)預(yù)測(cè),等待迭代結(jié)束后得到最佳預(yù)測(cè)樣本。
8、進(jìn)一步的,在s3中,所述集成算法預(yù)測(cè)模型包括第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器;第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器均用于根據(jù)當(dāng)前樣本特征的權(quán)重對(duì)當(dāng)前樣本特征進(jìn)行樣本預(yù)測(cè)。
9、進(jìn)一步的,在s3中,在每一次迭代過(guò)程中,依次將樣本子集中的樣本特征通過(guò)第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器進(jìn)行樣本預(yù)測(cè),得到樣本預(yù)測(cè)結(jié)果,將通過(guò)第三基學(xué)習(xí)器得到的樣本預(yù)測(cè)結(jié)果中的預(yù)測(cè)樣本作為最佳預(yù)測(cè)樣本。
10、進(jìn)一步的,在s3中,所述樣本加權(quán)預(yù)測(cè)的過(guò)程具體為:
11、在第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器進(jìn)行迭代的過(guò)程中,獲得當(dāng)前基學(xué)習(xí)器中當(dāng)前樣本特征的權(quán)重,使當(dāng)前基學(xué)習(xí)器以當(dāng)前樣本特征的權(quán)重對(duì)樣本特征進(jìn)行樣本預(yù)測(cè),從而,得到當(dāng)前基學(xué)習(xí)器的樣本預(yù)測(cè)結(jié)果,再根據(jù)當(dāng)前基學(xué)習(xí)器的樣本預(yù)測(cè)結(jié)果對(duì)下一基學(xué)習(xí)器中樣本特征的權(quán)重進(jìn)行加權(quán)處理,使下一基學(xué)習(xí)器以加權(quán)處理后的樣本特征的權(quán)重對(duì)樣本特征進(jìn)行樣本預(yù)測(cè),依次類推。
12、進(jìn)一步的,所述樣本預(yù)測(cè)結(jié)果中包括預(yù)測(cè)樣本,根據(jù)當(dāng)前基學(xué)習(xí)器的樣本預(yù)測(cè)結(jié)果對(duì)下一基學(xué)習(xí)器中樣本特征的權(quán)重進(jìn)行加權(quán)處理的過(guò)程具體為:
13、將通過(guò)當(dāng)前基學(xué)習(xí)器得到的預(yù)測(cè)樣本與對(duì)應(yīng)的樣本進(jìn)行比較,根據(jù)比較結(jié)果判斷該預(yù)測(cè)樣本是否為預(yù)測(cè)錯(cuò)誤的樣本,若是,則對(duì)當(dāng)前基學(xué)習(xí)器中樣本特征的權(quán)重進(jìn)行提高,得到提高后的權(quán)重,根據(jù)提高后的權(quán)重更新下一基學(xué)習(xí)器中樣本特征的權(quán)重。
14、進(jìn)一步的,所述第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器均具有基學(xué)習(xí)器權(quán)重,獲得當(dāng)前基學(xué)習(xí)器中當(dāng)前樣本特征的權(quán)重的過(guò)程具體為:
15、根據(jù)當(dāng)前基學(xué)習(xí)器自身的基學(xué)習(xí)器權(quán)重以及根據(jù)上一基學(xué)習(xí)器中樣本特征的權(quán)重進(jìn)行提高后的權(quán)重進(jìn)行權(quán)重更新,得到當(dāng)前基學(xué)習(xí)器中樣本特征的權(quán)重。
16、進(jìn)一步的,在s2中,對(duì)信號(hào)交叉口的特征數(shù)據(jù)以及輿情信息進(jìn)預(yù)處理的過(guò)程包括以下步驟:
17、sa1:對(duì)信號(hào)交叉口的特征數(shù)據(jù)以及輿情信息進(jìn)行數(shù)據(jù)清洗與數(shù)據(jù)脫敏處理,針對(duì)輿情信息中個(gè)人信息以及交叉口信息剔除不屬實(shí)的輿情信息;
18、sa2:根據(jù)輿情類別確定每個(gè)輿情信息的輿情類別并標(biāo)記;
19、sa3:根據(jù)交叉口特征確定每個(gè)輿情信息中交叉口信息含有的交叉口特征數(shù)據(jù)。
20、進(jìn)一步的,在s2中,每個(gè)樣本子集以一個(gè)輿情信息為樣本,通過(guò)輿情信息標(biāo)記該樣本的輿情類別,并將輿情信息中交叉口信息含有的交叉口特征數(shù)據(jù)作為該樣本的樣本特征。
21、進(jìn)一步的,所述第一基學(xué)習(xí)器以超父獨(dú)依賴估計(jì)模型作為基學(xué)習(xí)器,所述第二基學(xué)習(xí)器以邏輯回歸模型作為基學(xué)習(xí)器,所述第三基學(xué)習(xí)器以決策樹(shù)模型作為基學(xué)習(xí)器。
22、一種基于集成算法預(yù)測(cè)模型的信號(hào)交叉口輿情預(yù)測(cè)系統(tǒng),包括:
23、數(shù)據(jù)收集模塊:獲得所有信號(hào)交叉口的特征數(shù)據(jù)以及與信號(hào)交叉口相關(guān)的輿情信息;
24、數(shù)據(jù)處理模塊:對(duì)信號(hào)交叉口的特征數(shù)據(jù)以及輿情信息進(jìn)預(yù)處理,根據(jù)預(yù)處理后的信號(hào)交叉口的特征數(shù)據(jù)以及輿情信息建立信號(hào)交叉口輿情數(shù)據(jù)集;
25、所述信號(hào)交叉口輿情數(shù)據(jù)集包括若干個(gè)樣本子集,每個(gè)樣本子集以一個(gè)輿情信息為樣本,并收集相關(guān)信號(hào)交叉口的特征數(shù)據(jù)作為該樣本的樣本特征;
26、樣本加權(quán)預(yù)測(cè)模塊:將樣本子集中的樣本特征代入到集成算法預(yù)測(cè)模型中以迭代的方式進(jìn)行樣本加權(quán)預(yù)測(cè),等待迭代結(jié)束后得到最佳預(yù)測(cè)樣本。
27、本發(fā)明的有益效果:
28、本發(fā)明提供了一種基于集成算法預(yù)測(cè)模型的信號(hào)交叉口輿情預(yù)測(cè)及系統(tǒng),所述方法主要采用半樸素貝葉斯算法、邏輯回歸算法和分類決策樹(shù)作為基學(xué)習(xí)器的集成算法預(yù)測(cè)模型,并將其通過(guò)加權(quán)組合成一個(gè)強(qiáng)分類器,通過(guò)強(qiáng)分類器對(duì)城市信號(hào)交叉口的輿情分析預(yù)測(cè),可以通過(guò)提高模型的泛化能力和性能,以此來(lái)準(zhǔn)確提升輿情預(yù)測(cè)結(jié)果。
1.一種基于集成算法預(yù)測(cè)模型的信號(hào)交叉口輿情預(yù)測(cè),其特征在于,所述方法具體包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于集成算法預(yù)測(cè)模型的信號(hào)交叉口輿情預(yù)測(cè),其特征在于,在s3中,所述集成算法預(yù)測(cè)模型包括第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器;第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器均用于根據(jù)當(dāng)前樣本特征的權(quán)重對(duì)當(dāng)前樣本特征進(jìn)行樣本預(yù)測(cè)。
3.根據(jù)權(quán)利要求2所述的一種基于集成算法預(yù)測(cè)模型的信號(hào)交叉口輿情預(yù)測(cè),其特征在于,在s3中,在每一次迭代過(guò)程中,依次將樣本子集中的樣本特征通過(guò)第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器進(jìn)行樣本預(yù)測(cè),得到樣本預(yù)測(cè)結(jié)果,將通過(guò)第三基學(xué)習(xí)器得到的樣本預(yù)測(cè)結(jié)果中的預(yù)測(cè)樣本作為最佳預(yù)測(cè)樣本。
4.根據(jù)權(quán)利要求2所述的一種基于集成算法預(yù)測(cè)模型的信號(hào)交叉口輿情預(yù)測(cè),其特征在于,在s3中,所述樣本加權(quán)預(yù)測(cè)的過(guò)程具體為:
5.根據(jù)權(quán)利要求4所述的一種基于集成算法預(yù)測(cè)模型的信號(hào)交叉口輿情預(yù)測(cè),其特征在于,所述樣本預(yù)測(cè)結(jié)果中包括預(yù)測(cè)樣本,根據(jù)當(dāng)前基學(xué)習(xí)器的樣本預(yù)測(cè)結(jié)果對(duì)下一基學(xué)習(xí)器中樣本特征的權(quán)重進(jìn)行加權(quán)處理的過(guò)程具體為:
6.根據(jù)權(quán)利要求5所述的一種基于集成算法預(yù)測(cè)模型的信號(hào)交叉口輿情預(yù)測(cè),其特征在于,所述第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器均具有基學(xué)習(xí)器權(quán)重,獲得當(dāng)前基學(xué)習(xí)器中當(dāng)前樣本特征的權(quán)重的過(guò)程具體為:
7.根據(jù)權(quán)利要求1所述的一種基于集成算法預(yù)測(cè)模型的信號(hào)交叉口輿情預(yù)測(cè),其特征在于,在s2中,對(duì)信號(hào)交叉口的特征數(shù)據(jù)以及輿情信息進(jìn)預(yù)處理的過(guò)程包括以下步驟:
8.根據(jù)權(quán)利要求7所述的一種基于集成算法預(yù)測(cè)模型的信號(hào)交叉口輿情預(yù)測(cè),其特征在于,在s2中,每個(gè)樣本子集以一個(gè)輿情信息為樣本,通過(guò)輿情信息標(biāo)記該樣本的輿情類別,并將輿情信息中交叉口信息含有的交叉口特征數(shù)據(jù)作為該樣本的樣本特征。
9.根據(jù)權(quán)利要求2所述的一種基于集成算法預(yù)測(cè)模型的信號(hào)交叉口輿情預(yù)測(cè),其特征在于,所述第一基學(xué)習(xí)器以超父獨(dú)依賴估計(jì)模型作為基學(xué)習(xí)器,所述第二基學(xué)習(xí)器以邏輯回歸模型作為基學(xué)習(xí)器,所述第三基學(xué)習(xí)器以決策樹(shù)模型作為基學(xué)習(xí)器。
10.一種基于集成算法預(yù)測(cè)模型的信號(hào)交叉口輿情預(yù)測(cè)系統(tǒng),其特征在于,包括: