專利名稱:基于稀疏采樣的手機(jī)定位數(shù)據(jù)的人員常駐地點(diǎn)識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于稀疏采樣的手機(jī)定位數(shù)據(jù)的人員常駐地點(diǎn)識(shí)別方法,用于從海量的手機(jī)定位數(shù)據(jù)中挖掘有價(jià)值的人員出行軌跡,推導(dǎo)出人員常駐地點(diǎn)的信息,可為交通規(guī)劃、交通需求管理、交通政策評(píng)估與交通運(yùn)營(yíng)管理服務(wù),屬于交通規(guī)劃與管理方法技術(shù)領(lǐng)域。
背景技術(shù):
隨著近年來(lái)經(jīng)濟(jì)的高速增長(zhǎng)、基礎(chǔ)設(shè)施建設(shè)突飛猛進(jìn)和土地利用的頻繁變更,國(guó)內(nèi)幾乎所有城市的人員出行特征、出行規(guī)律都在經(jīng)常性發(fā)生變化。尤其隨著軌道交通等大運(yùn)量、高速度、高可靠性出行方式的普及,完全能夠滿足短時(shí)間內(nèi)大量人口大空間范圍的出行,如果這些出行集中在早晚高峰進(jìn)行,必將對(duì)交通造成非常大的壓力。因此,市域范圍內(nèi)準(zhǔn)確可靠的人員常駐地點(diǎn),是為交通運(yùn)營(yíng)管理措施、政策等提供決策支持定量分析的基礎(chǔ)數(shù)據(jù)之一,以信息化手段自動(dòng)化獲取交通基礎(chǔ)數(shù)據(jù)與出行特征數(shù)據(jù)顯得尤為迫切。隨著現(xiàn)代通信技術(shù)的進(jìn)步與服務(wù)水平的提升,無(wú)線通信網(wǎng)絡(luò)能夠覆蓋人類能夠到達(dá)的所有空間區(qū)域范圍。同時(shí),隨著手機(jī)終端普及,手機(jī)擁有率和使用率達(dá)到了相當(dāng)高的比例。可以從海量的手機(jī)定位數(shù)據(jù)中挖掘有價(jià)值的人員出行特征的信息,識(shí)別出常駐地點(diǎn),為交通規(guī)劃、交通需求管理、交通政策評(píng)估與交通運(yùn)營(yíng)管理服務(wù)。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種獲取手機(jī)用戶的常駐地點(diǎn)情況的方法。為了達(dá)到上述目的,本發(fā)明的技術(shù)方案是提供了一種基于稀疏采樣的手機(jī)定位數(shù)據(jù)的人員常駐地點(diǎn)識(shí)別方法 ,其特征在于,步驟為:步驟1、以大小為N米*N米的網(wǎng)格將目標(biāo)城市劃分為a列*b行個(gè)網(wǎng)格,生產(chǎn)每個(gè)網(wǎng)格的網(wǎng)格信息,網(wǎng)格信息至少包括網(wǎng)格編號(hào)、網(wǎng)格中心點(diǎn)的X軸坐標(biāo)及網(wǎng)格中心點(diǎn)的Y軸坐標(biāo);步驟2、獲取目標(biāo)城市內(nèi)所有手機(jī)用戶在某個(gè)時(shí)間段內(nèi)的稀疏采樣的手機(jī)定位數(shù)據(jù),每條手機(jī)定位數(shù)據(jù)帶有X軸坐標(biāo)信息及Y軸坐標(biāo)信息,建立每條手機(jī)定位數(shù)據(jù)與每個(gè)網(wǎng)格之間的相互映射關(guān)系,得到每個(gè)手機(jī)用戶出現(xiàn)過(guò)的網(wǎng)格總數(shù)r,對(duì)于第i個(gè)手機(jī)用戶的第h條手機(jī)定位數(shù)據(jù)而言,將其與每個(gè)網(wǎng)格的網(wǎng)格信息進(jìn)行比對(duì),若滿足:gx-N/2 ( X< gx+N/2且gy-N/2 ^ y < gy+N/2,其中,gx及gy分別為網(wǎng)格中心點(diǎn)的X軸坐標(biāo)及網(wǎng)格中心點(diǎn)的Y軸坐標(biāo),X及y分別為第h條手機(jī)定位數(shù)據(jù)帶有的X軸坐標(biāo)信息及Y軸坐標(biāo)信息,則第h條手機(jī)定位數(shù)據(jù)與滿足條件的gx,gy所在的網(wǎng)格做映射關(guān)系;步驟3、將某個(gè)時(shí)間段內(nèi)取η天作為分析天,將每個(gè)分析天劃分為m個(gè)分析周期,根據(jù)手機(jī)定位數(shù)據(jù)與網(wǎng)格之間的映射關(guān)系,統(tǒng)計(jì)每個(gè)手機(jī)用戶所有分析天的相同分析周期在各個(gè)網(wǎng)格中的出現(xiàn)頻率,第i個(gè)手機(jī)用戶所有分析天的第t個(gè)分析周期在第j個(gè)網(wǎng)格中的出現(xiàn)頻率Nf =^dik),其中:
權(quán)利要求
1.一種基于稀疏采樣的手機(jī)定位數(shù)據(jù)的人員常駐地點(diǎn)識(shí)別方法,其特征在于,步驟為: 步驟1、以大小為N米*N米的網(wǎng)格將目標(biāo)城市劃分為a列*b行個(gè)網(wǎng)格,生產(chǎn)每個(gè)網(wǎng)格的網(wǎng)格信息,網(wǎng)格信息至少包括網(wǎng)格編號(hào)、網(wǎng)格中心點(diǎn)的X軸坐標(biāo)及網(wǎng)格中心點(diǎn)的Y軸坐標(biāo); 步驟2、獲取目標(biāo)城市內(nèi)所有手機(jī)用戶在某個(gè)時(shí)間段內(nèi)的稀疏采樣的手機(jī)定位數(shù)據(jù),每條手機(jī)定位數(shù)據(jù)帶有X軸坐標(biāo)信息及Y軸坐標(biāo)信息,建立每條手機(jī)定位數(shù)據(jù)與每個(gè)網(wǎng)格之間的相互映射關(guān)系,得到每個(gè)手機(jī)用戶出現(xiàn)過(guò)的網(wǎng)格總數(shù)r,對(duì)于第i個(gè)手機(jī)用戶的第h條手機(jī)定位數(shù)據(jù)而言,將其與每個(gè)網(wǎng)格的網(wǎng)格信息進(jìn)行比對(duì),若滿足:gx-N/2 ( X < gx+N/2且gy-N/2 ^ y < gy+N/2,其中,gx及gy分別為網(wǎng)格中心點(diǎn)的X軸坐標(biāo)及網(wǎng)格中心點(diǎn)的Y軸坐標(biāo),X及y分別為第h條手機(jī)定位數(shù)據(jù)帶有的X軸坐標(biāo)信息及Y軸坐標(biāo)信息,則第h條手機(jī)定位數(shù)據(jù)與滿足條件的gx,gy所在的網(wǎng)格做映射關(guān)系; 步驟3、將某個(gè)時(shí)間段內(nèi)取η天作為分析天,將每個(gè)分析天劃分為m個(gè)分析周期,根據(jù)手機(jī)定位數(shù)據(jù)與網(wǎng)格之間的映射關(guān)系,統(tǒng)計(jì)每個(gè)手機(jī)用戶所有分析天的相同分析周期在各個(gè)網(wǎng)格中的出現(xiàn)頻率,第i個(gè)手機(jī)用戶所有分析天的第t個(gè)分析周期在第j個(gè)網(wǎng)格中的出現(xiàn)頻率V =^d(Ic),其中: k減 [I 第i個(gè)手WS戶在第k個(gè)分祈天的第t個(gè)分析周期內(nèi)在第j個(gè)W格中出現(xiàn) [O 個(gè)手機(jī)ffl戶在第k+分析天韻第t個(gè)分析周期內(nèi)在第計(jì)網(wǎng)格中未出現(xiàn);統(tǒng)計(jì)每個(gè)手機(jī)用戶所有分析天的相同分析周期在各個(gè)網(wǎng)格中的出現(xiàn)概率,其中,第 ρ..> = —i個(gè)手機(jī)用戶所有分析天的第t個(gè)分析周期在第j個(gè)網(wǎng)格中的出現(xiàn)概率1*M,= 二I 統(tǒng)計(jì)每個(gè)手機(jī)用戶在所有分析天在各個(gè)網(wǎng)格中的出現(xiàn)概率,第i個(gè)手機(jī)用戶所有分析 QJ =^天在第j個(gè)網(wǎng)格中的出現(xiàn)概率1 步驟4、對(duì)每個(gè)手機(jī)用戶出現(xiàn)頻率與出現(xiàn)概率分別進(jìn)行時(shí)空聚類,以合并在時(shí)間和空間出現(xiàn)特點(diǎn)相似的網(wǎng)格,對(duì)于第i個(gè)手機(jī)用戶而言,其步驟為: 步驟4.1、時(shí)間相似性分析: 定義網(wǎng)格J1與網(wǎng)格j2之間在第t個(gè)分析周期的時(shí)間相似性判斷參數(shù) I f'Vt = f'-nU >.HJ: _ I' 1 ■■T,h-h =YjH';-,1 —jo F]ih ^fif.= 11 Q>h -e' and - θι 戶=11 Qih 4 and p,hS 4 ,其中,及1 [0 elsef [0 else一、 Q-hβ〃分別為第i個(gè)手機(jī)用戶在所有分析天在網(wǎng)格J1及網(wǎng)格j2中的出現(xiàn)概率,P,及f分別為第i個(gè)手機(jī)用戶在第t個(gè)分析周期在網(wǎng)格J1及網(wǎng)格j2中的出現(xiàn)概率,若P".’ >Θ、*則認(rèn)為第i個(gè)手機(jī)用戶在網(wǎng)格J1與網(wǎng)格」2上的時(shí)間出現(xiàn)特點(diǎn)具有時(shí)間相似性,θρθ2& θ3為預(yù)先設(shè)定的經(jīng)驗(yàn)閾值; 步驟4.2、空間相似性分析: 定義網(wǎng)格J1與網(wǎng)格j2之間空間范圍相近判斷參數(shù)1),
2.如權(quán)利要求1所述的一種基于稀疏采樣的手機(jī)定位數(shù)據(jù)的人員常駐地點(diǎn)識(shí)別方法,其特征在于,在所述步驟5.2中,若分析網(wǎng)格為網(wǎng)格集,則在該網(wǎng)格集中取第i個(gè)手機(jī)用戶所有分析天在其中出現(xiàn)概率最高的作為常駐地點(diǎn)。
全文摘要
本發(fā)明涉及一種基于稀疏采樣的手機(jī)定位數(shù)據(jù)的人員常駐地點(diǎn)識(shí)別方法,其特征在于,步驟為步驟1、將目標(biāo)城市網(wǎng)格化;步驟2、建立手機(jī)定位數(shù)據(jù)與網(wǎng)格的映射關(guān)系;步驟3、統(tǒng)計(jì)用戶的出現(xiàn)概率及出現(xiàn)頻率;步驟4、對(duì)每個(gè)手機(jī)用戶出現(xiàn)頻率與出現(xiàn)概率分別進(jìn)行時(shí)空聚類,以合并在時(shí)間和空間出現(xiàn)特點(diǎn)相似的網(wǎng)格;步驟5、每個(gè)手機(jī)用戶的常駐地點(diǎn)識(shí)別。本發(fā)明的優(yōu)點(diǎn)是充分依托現(xiàn)有的移動(dòng)通信網(wǎng)絡(luò)資源,以海量的手機(jī)定位數(shù)據(jù)為輸入,采用虛擬網(wǎng)格技術(shù),實(shí)現(xiàn)快速建立映射關(guān)系,減少與地圖匹配的運(yùn)算量,同時(shí)基于出現(xiàn)頻率與概率,采用時(shí)空聚類,實(shí)現(xiàn)用戶常駐地點(diǎn)的識(shí)別機(jī)制。該發(fā)明可用于自動(dòng)化地識(shí)別人員常駐地點(diǎn)信息。
文檔編號(hào)G06F19/00GK103116696SQ20131001616
公開(kāi)日2013年5月22日 申請(qǐng)日期2013年1月16日 優(yōu)先權(quán)日2013年1月16日
發(fā)明者裘煒毅, 陸俊賢, 劉杰, 邱志軍, 陳明威, 劉勝平, 冉斌 申請(qǐng)人:上海美慧軟件有限公司