本發(fā)明涉及時空數(shù)據(jù)處理領(lǐng)域,特別涉及一種時空軌跡數(shù)據(jù)的分級處理方法。
背景技術(shù):
隨著GPS技術(shù)的不斷發(fā)展和個人終端產(chǎn)品的廣泛使用,現(xiàn)實生活中產(chǎn)生了大量的軌跡數(shù)據(jù),比如手機記錄的人們的每天出行軌跡數(shù)據(jù),其中包含了人們?nèi)粘=?jīng)過的道路信息和經(jīng)常去的超市、商場、餐館等感興趣地點信息;出租車上GPS所記錄的車租車行駛軌跡數(shù)據(jù),其中包含了城市中人們出行的頻繁區(qū)域和道路擁堵信息等。
一方面,軌跡數(shù)據(jù)中包含了一些重要的信息,在大數(shù)據(jù)時代越多的數(shù)據(jù)越能挖掘出更多感興趣的知識,另一方面,平均幾秒一次的采樣率使得每天積累了大量數(shù)據(jù),隨著時間的推移產(chǎn)生了海量軌跡數(shù)據(jù),對存儲條件帶來了巨大的考驗。因此,如何對時空移動軌跡數(shù)據(jù)進行處理成了亟待解決的問題。現(xiàn)有的時空軌跡數(shù)據(jù)處理一般只針對問題給出離線或在線壓縮其中某一種方法,并且在對數(shù)據(jù)壓縮后沒有進行進一步的特征提取,整個過程缺少了分級處理框架,不利于后續(xù)的數(shù)據(jù)分析和挖掘,如何對軌跡數(shù)據(jù)進行分層地,多角度地處理仍缺乏具體的處理流程和方法。
技術(shù)實現(xiàn)要素:
鑒于現(xiàn)有方案存在的問題,為了克服上述現(xiàn)有技術(shù)方案的不足,本發(fā)明提出了一種時空軌跡數(shù)據(jù)的分級處理方法。
根據(jù)本發(fā)明的一個方面,提供了一種時空軌跡數(shù)據(jù)的分級處理方法,其中,包括以下步驟:獲取增量軌跡數(shù)據(jù),所述軌跡為一移動對象在空間中形成的路徑;使用在線壓縮方法對所述增量軌跡數(shù)據(jù)進行實時壓縮;獲取一段時間內(nèi)的離線軌跡數(shù)據(jù);使用離線壓縮方法對所述離線軌跡數(shù)據(jù)進行壓縮;以及從所述離線軌跡數(shù)據(jù)提取出特征向量。
從上述技術(shù)方案可以看出,本發(fā)明具有以下有益效果:
通過分級處理減少了計算復雜度,減少了存儲空間而且最大程度保留了軌跡數(shù)據(jù)信息,全面地對時空軌跡數(shù)據(jù)進行前期處理,可以滿足各種應(yīng)用場合的需求,最大可能的保留了數(shù)據(jù)的原始信息,并且加以提煉、提取,增加了數(shù)據(jù)的表達形式,提高了時空軌跡數(shù)據(jù)的使用效率,便于后續(xù)的數(shù)據(jù)分析和挖掘;
對增量軌跡數(shù)據(jù)基于Sliding Window算法在線壓縮,針對收集到的實時軌跡點數(shù)據(jù)決定是否保存,減小存儲壓力;
對離線軌跡數(shù)據(jù)基于動態(tài)分割進行離線壓縮,結(jié)合不同的應(yīng)用場景,設(shè)定合適的曲率閾值,對于特定時間段內(nèi)數(shù)據(jù)進行壓縮,剔除不重要的冗余數(shù)據(jù);
對離線軌跡數(shù)據(jù)進行特征提取及構(gòu)建特征向量,可以用于構(gòu)建目標知識庫和目標判別工作
附圖說明
圖1是本發(fā)明實施例時空軌跡數(shù)據(jù)的分級處理方法流程圖;
圖2是圖1中步驟S2中基于Sliding Window算法的軌跡數(shù)據(jù)在線壓縮流程圖;
圖3是圖1中步驟S4中基于動態(tài)分割的軌跡數(shù)據(jù)離線壓縮流程圖;
圖4是圖1中步驟S5中時空軌跡數(shù)據(jù)特征提取流程圖。
具體實施方式
本發(fā)明某些實施例于后方將參照所附附圖做更全面性地描述,其中一些但并非全部的實施例將被示出。實際上,本發(fā)明的各種實施例可以許多不同形式實現(xiàn),而不應(yīng)被解釋為限于此數(shù)所闡述的實施例;相對地,提供這些實施例使得本發(fā)明滿足適用的法律要求。
在本說明書中,下述用于描述本發(fā)明原理的各種實施例只是說明,不應(yīng)該以任何方式解釋為限制發(fā)明的范圍。參照附圖的下述描述用于幫助全面理解由權(quán)利要求及其等同物限定的本發(fā)明的示例性實施例。下述描述包括多種具體細節(jié)來幫助理解,但這些細節(jié)應(yīng)認為僅僅是示例性的。因此,本領(lǐng)域普通技術(shù)人員應(yīng)認識到,在不悖離本發(fā)明的范圍和精神的情況下,可以對本文中描述的實施例進行多種改變和修改。此外,為了清楚和簡潔起見,省略了公知功能和結(jié)構(gòu)的描述。此外,貫穿附圖,相同附圖標記用于相似功能和操作。
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,以下結(jié)合具體實施例,并參照附圖,對本發(fā)明進一步詳細說明。
本發(fā)明實施例提供了一種本發(fā)明實施例提供了一種時空軌跡的分級處理方法,對增量軌跡數(shù)據(jù)和離線軌跡數(shù)據(jù)采用不同的壓縮處理,減少了存儲空間而且最大程度保留了軌跡數(shù)據(jù)信息,可以滿足各種應(yīng)用場合的需求,最大可能的保留了數(shù)據(jù)的原始信息,并對離線軌跡數(shù)據(jù)提取特征向量,增加了數(shù)據(jù)的表達形式,提高了時空軌跡數(shù)據(jù)的使用效率,便于后續(xù)的數(shù)據(jù)分析和挖掘。
圖1示出了本發(fā)明實施例時空軌跡數(shù)據(jù)的分級處理方法流程圖,請參照圖1,本方法實施例中的時空軌跡數(shù)據(jù)的分級處理方法具體包括:
S1、獲取增量軌跡數(shù)據(jù),所述軌跡為一移動對象在空間中形成的路徑;
S2、對增量軌跡數(shù)據(jù),使用在線壓縮方法進行實時壓縮,用于實時可視化的功能;
S3、獲取一段時間內(nèi)的離線軌跡數(shù)據(jù),所述一段時間針對不同應(yīng)用場景可以進行設(shè)置,如一小時、一天、一周等
S4、對步驟S3獲取的離線軌跡數(shù)據(jù),使用離線壓縮方法進行壓縮;
S5、對步驟S3獲取的離線軌跡數(shù)據(jù),使用特征提取技術(shù)提取出特征向量。
圖2為步驟S2中基于Sliding Window算法的軌跡數(shù)據(jù)在線壓縮流程圖,Sliding Window算法由起始軌跡點開始,每次將新產(chǎn)生的數(shù)據(jù)點加入滑動窗,并作為新的終止點,連接起始點和終止點,計算之間點到該連線的最大距離,如果小于設(shè)定閾值,則以此類推,增加窗口大小;如果大于設(shè)定閾值,則將之間的點除上次終止點外都刪除,以此次終止點作為新的初始窗口,以此類推。
請參照附圖2步驟S2具體包括:
S21、初始化滑動窗,滑動窗初始大小為1,即僅包括一個軌跡點,設(shè)定軌跡點到起始點與終止點連線的距離閾值d,所述起始點為滑動窗內(nèi)的第一個軌跡點,終止點為滑動窗口最新增加的軌跡點;
S22、計算滑動窗內(nèi)所有軌跡點到起始點與終止點連線的距離Di;
具體的,軌跡點到起始點與終止點連線的距離可以包括垂直歐氏距離或時間同步歐氏距離。
垂直歐氏距離為將起始點與終止點連線后,之間各個軌跡點到該連線的垂直距離;時間同步歐氏距離為將起始點與終止點連線后,按照對象均勻運動方式,根據(jù)兩點之間時間,對應(yīng)映射到該連線,原始點與映射點的距離即為時間同步歐式距離。
S23、統(tǒng)計上述距離中Di的最大值,令Dmax=Max(Di);
S24、將上述距離中Di的最大值Dmax與設(shè)定閾值d對比,若Dmax<d,則執(zhí)行步驟S25,否則執(zhí)行步驟S26;
S25、將窗口后一個軌跡點加入,形成新的滑動窗口,并將新加入軌跡點更新為終止點,返回步驟S22;
S26、保留起始點和終止點的前一個軌跡點,刪除起始點與終止點之間其他的軌跡點,并將終止點作為新的滑動窗口的起始點,返回步驟21;
S27、重復步驟S21到S25,直到軌跡壓縮任務(wù)完成。
圖3為步驟S4中基于動態(tài)分割的軌跡數(shù)據(jù)離線壓縮流程圖,請參照附圖3,步驟S4具體包括:
S41、獲取起始點和終止點之間所有待處理的軌跡點數(shù)據(jù);
具體地,獲取步驟S3中獲得的離線軌跡數(shù)據(jù)中所有的軌跡點數(shù)據(jù)。
S42、根據(jù)基于Douglas-Peucker算法的先驗實驗確定曲率閾值與壓縮比關(guān)系公式,設(shè)定曲率閾值k;
曲率閾值與壓縮比關(guān)系公式如式(1)所示,其中k為曲率閾值,z為壓縮比
S43、計算出所有軌跡點的曲率值;
所述計算出第i個軌跡點的曲率值可通過式(2)計算,其中xi表示第i個點的橫坐標,yi表示第i個點的縱坐標:
S44、將各個軌跡點曲率與曲率閾值對比,將完整的軌跡按曲率劃分為N+1段,其中N為自然數(shù),且N≥1;
將選取所有曲率大于等于曲率閾值的軌跡點,若符合要求的軌跡點數(shù)量為N,則將整個軌跡按照從起始點到終止點的順序基于上述符合要求的軌跡點分割為N+1段,其中第i段為起始點為第i-1個符合要求的軌跡點之后的第一個點,終止點為i個符合要求的軌跡點,其中1≤i≤N+1。
S45、對N+1段分割軌跡,都做如下操作:計算每一點到起始點和終止點連線的垂直徑向距離,找到最大距離對應(yīng)的軌跡點,并與距離閾值f進行對比,如果小于f,則保留起始點和終止點兩點完成壓縮任務(wù),如果大于f,則對軌跡分割,將最大距離對應(yīng)的點作為分割點,對分割后的軌跡段再次重復如上操作,直到壓縮完成。
圖4為步驟S5的時空軌跡數(shù)據(jù)特征提取流程圖,請參照附圖4,步驟S4具體包括:
S51、獲取起始點和終止點之間所有待處理的軌跡數(shù)據(jù);
具體地,獲取步驟S3中獲得的離線軌跡數(shù)據(jù)中所有的軌跡點數(shù)據(jù)。
S52、提取出軌跡數(shù)據(jù)中全局特征和屬性特征;
全局特征是軌跡點運動參數(shù)的統(tǒng)計特性,所述的運動參數(shù)包括速度、加速度、方向和轉(zhuǎn)角、曲率等,屬性特征包括國家地區(qū)、活動區(qū)域等。
S53、對全局特征統(tǒng)計分析;
對全局特征統(tǒng)計分析包括:
計算出最大最小的各三個值、取值范圍、均值、方差、偏度、峰度、自相關(guān)系數(shù)、變異系數(shù)、轉(zhuǎn)角變化率等;其中,自相關(guān)系數(shù)為不同步長下觀測值的相關(guān)程度,變異系數(shù)為描述數(shù)據(jù)的散布程度,轉(zhuǎn)角變化率為轉(zhuǎn)角大于某個閾值的比例。
S54、采用時序圖分解方法提取出軌跡數(shù)據(jù)局部特征;
時序圖分解方法具體為,將所有軌跡點分成高幅高頻,低幅低頻,高幅低頻,低幅高頻四類,并且將軌跡分段,計算每一段的統(tǒng)計量,統(tǒng)計例如每類長度的均值、方差;每條軌跡軌跡段改變的數(shù)目,每類軌跡段所占百分比。
S55、將全局特征和屬性特征及局部特征構(gòu)造成高維特征向量,對每條軌跡的全局特征、局部特征和屬性特征拼接成行向量。
前面的附圖中所描繪的進程或方法可通過包括硬件(例如,電路、專用邏輯等)、固件、軟件(例如,被承載在非瞬態(tài)計算機可讀介質(zhì)上的軟件),或兩者的組合的處理邏輯來執(zhí)行。雖然上文按照某些順序操作描述了進程或方法,但是,應(yīng)該理解,所描述的某些操作能以不同順序來執(zhí)行。此外,可并行地而非順序地執(zhí)行一些操作。
需要說明的是,在附圖或說明書正文中,未繪示或描述的實現(xiàn)方式,均為所屬技術(shù)領(lǐng)域中普通技術(shù)人員所知的形式,并未進行詳細說明。此外,上述對各元件和方法的定義并不僅限于實施例中提到的各種具體結(jié)構(gòu)、形狀或方式,本領(lǐng)域普通技術(shù)人員可對其進行簡單地更改或替換。
以上所述的具體實施例,對本發(fā)明的目的、技術(shù)方案和有益效果進行了進一步詳細說明,應(yīng)理解的是,以上所述僅為本發(fā)明的具體實施例而已,并不用于限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。