本發(fā)明涉及計算機,尤其涉及一種地址類型的識別方法、相關分析方法和裝置。
背景技術:
1、隨著經濟的快速發(fā)展,城市的產業(yè)布局、交通規(guī)劃、商業(yè)選址等策略的制定顯得尤為重要。有效識別居民的職場商用地址和住宅居住地址的地理位置分布有助于從職住平衡、通勤行為等角度了解城市空間特征,合理引導城市產業(yè)布局、交通規(guī)劃、商業(yè)選址,以及物流站配置等?,F有技術主要通過信令數據來確定人員軌跡,通過統(tǒng)計停留時長識別人員停留地的地址類型是商用地址還是居住地址。
2、在實現本發(fā)明過程中,發(fā)明人發(fā)現現有技術中存在如下問題:
3、信令數據通過基站接收大量時空報點數據,數據規(guī)模大,分析統(tǒng)計需要較高的計算資源,且通過基站信號確定人員所在地的類型不夠精確,只能確定到地理編碼的網格地塊級別,不能精確到具體地址粒度,不利于后續(xù)的數據分析。
技術實現思路
1、有鑒于此,本發(fā)明實施例提供一種地址類型的識別方法、相關分析方法和裝置,實現了經濟高效、細粒度的地址類型的識別,由于互聯網物流訂單數據遠少于移動設備報點數據,對物流訂單中的地址數據進行地址類型的識別不僅減少了計算資源,提高了識別效率;而且可以精確到具體地址,為后續(xù)的通勤分析提供了高質量的數據支持。
2、為實現所述目的,根據本發(fā)明實施例的第一方面,提供了一種地址類型的識別方法,包括:
3、響應于接收到地址類型識別請求,獲取歷史物流訂單數據;
4、根據預設的篩選規(guī)則,對所述歷史物流訂單數據進行訂單篩選,得到待進行地址類型識別的有效物流訂單,提取所述有效物流訂單中的地址數據,其中,所述地址數據具有交易品類別標簽;
5、根據預先獲取到的商用地和居住地的規(guī)劃數據,以及所述地址數據的交易品類別標簽,確定所述地址數據的地址類型。
6、可選地,獲取歷史物流訂單數據之后,所述方法還包括:對所述歷史物流訂單數據中的地址進行標準化處理。
7、可選地,對所述歷史物流訂單數據中的地址進行標準化處理之前,所述方法還包括:對所述歷史物流訂單數據中的每個訂單數據的地址數據進行要素切分,獲取每個所述訂單數據中的街道要素和興趣點要素;對各個所述訂單數據中的街道要素和興趣點要素進行文本聚類處理,識別出各個所述訂單數據中表征相同街道的同類街道要素,以及表征相同興趣點的同類興趣點要素,以對所述同類街道要素和所述同類興趣點要素進行標準化處理。
8、可選地,識別出各個所述訂單數據中表征相同街道的同類街道要素,以及表征相同興趣點的同類興趣點要素之后,所述方法還包括:使用各個所述訂單數據中的收件地經緯度信息來對所述同類街道要素和所述同類興趣點要素進行校驗。
9、可選地,根據預設的篩選規(guī)則,對所述歷史物流訂單數據進行訂單篩選,包括:按照預設的訂單數量篩選規(guī)則,以收件人為維度,從所述歷史物流訂單數據中篩選訂單數量符合所述訂單數量篩選規(guī)則的物流訂單;按照預設的交易品類別篩選規(guī)則,將篩選出的符合所述訂單數量篩選規(guī)則的物流訂單進行交易物品類別篩選;對篩選出的符合所述交易品類別篩選規(guī)則的物流訂單進行自購行為核查,從中篩選出自購行為的物流訂單。
10、可選地,所述規(guī)劃數據中定義的商用地和居住地以興趣點為粒度,所述地址類型包括商用地址和居住地址;根據預先獲取到的商用地和居住地的規(guī)劃數據,以及所述地址數據的交易品類別標簽,確定所述地址數據的地址類型,包括:將所述地址數據中的興趣點和所述規(guī)劃數據進行匹配,得到所述地址數據的參考類型,所述參考類型具有對應的交易品類別標簽集;判斷所述地址數據的交易品類別標簽是否屬于所述交易品類別標簽集;響應于所述地址數據的交易品類別標簽屬于所述交易品類別標簽集,將所述參考類型作為所述地址數據的地址類型;響應于所述地址數據的交易品類別標簽不屬于所述交易品類別標簽集,根據所述地址數據的交易品類別標簽確定所述地址數據的地址類型。
11、根據本發(fā)明實施例的第二方面,提供一種基于地址類型的通勤分析方法,包括:
12、將識別到的具有地址類型的地址數據所屬的物流訂單作為分析樣本,其中,所述地址類型是根據本發(fā)明實施例的第一方面的任一方法確定的;
13、根據所述分析樣本,構建用于表征人員關聯的職場商用地址和住宅居住地址的職住地址知識圖譜;
14、根據所述職住地址知識圖譜,分析指定地理區(qū)域內人員的職住通勤數據。
15、可選地,根據所述分析樣本,構建職住地址知識圖譜,包括:從所述分析樣本中提取出收件人和地址數據,以所述收件人和所述地址數據為實體,訂單號為所述實體之間的關聯邊,組成人員職住地址知識圖譜,所述地址數據具有地址類別的標記。
16、可選地,構建職住地址知識圖譜之后,所述方法還包括:查找所述職住地址知識圖譜中是否具有相同的實體;在所述職住地址知識圖譜中具有相同的實體的情況下,將相同的實體的進行實體融合,得到融合職住地址知識圖譜。
17、可選地,構建職住地址知識圖譜之后,所述方法還包括:查詢所述職住地址知識圖譜中的每個收件人關聯的具有相同地址類別的地址數據的個數;在所述收件人關聯多個具有相同地址類別的地址數據的情況下,根據關聯邊的訂單號的個數和訂單時間,保留一個地址數據。
18、可選地,根據所述職住地址知識圖譜,分析指定地理區(qū)域內人員的職住通勤數據,包括:從所述職住地址知識圖譜中查找實體落入所述指定地理區(qū)域內的知識圖譜子圖,獲取所述知識圖譜子圖中的待分析人員,以及所述待分析人員關聯的職場商用地址和住宅居住地址;根據所述職場商用地址和所述住宅居住地址,分析計算所述待分析人員的通勤數據。
19、根據本發(fā)明實施例的第三方面,提供一種地址類型的識別裝置,包括:
20、訂單獲取模塊,用于響應于接收到地址類型識別請求,獲取歷史物流訂單數據;
21、地址提取模塊,用于根據預設的篩選規(guī)則,對所述歷史物流訂單數據進行訂單篩選,得到待進行地址類型識別的有效物流訂單,提取所述有效物流訂單中的地址數據,其中,所述地址數據具有交易品類別標簽;
22、地址類型識別模塊,用于根據預先獲取到的商用地和居住地的規(guī)劃數據,以及所述地址數據的交易品類別標簽,確定所述地址數據的地址類型。
23、根據本發(fā)明實施例的第四方面,提供一種基于地址類型的通勤分析裝置,包括:
24、分析樣本確定模塊,用于將識別到的具有地址類型的地址數據所屬的物流訂單作為分析樣本,其中,所述地址類型是根據權利要求1~6所述的任一方法確定的;
25、圖譜構建模塊,用于根據所述分析樣本,構建用于表征人員對應的職場商用地址和住宅居住地址的職住地址知識圖譜;
26、通勤分析模塊,用于根據所述職住地址知識圖譜,分析指定地理區(qū)域內人員的職住通勤數據。
27、根據本發(fā)明實施例的第五方面,提供一種地址類型的電子識別設備、相關通勤分析設備,包括:
28、一個或多個處理器;
29、存儲裝置,用于存儲一個或多個程序,
30、當所述一個或多個程序被所述一個或多個處理器執(zhí)行,使得所述一個或多個處理器實現本發(fā)明實施例第一方面和第二方面提供的方法。
31、根據本發(fā)明實施例的第六方面,提供一種計算機可讀介質,其上存儲有計算機程序,所述程序被處理器執(zhí)行時實現本發(fā)明實施例第一方面和第二方面提供的方法。
32、根據本發(fā)明實施例的第七方面,提供了一種計算機程序產品。本技術實施例的一種計算機程序產品,包括計算機程序,程序被處理器執(zhí)行時實現本發(fā)明實施例第一方面和第二方面提供的方法。
33、所述發(fā)明中的一個實施例具有如下優(yōu)點或有益效果:通過響應于接收到地址類型識別請求,獲取歷史物流訂單數據;根據預設的篩選規(guī)則,對歷史物流訂單數據進行訂單篩選,得到待進行地址類型識別的有效物流訂單,提取有效物流訂單中的地址數據,其中,地址數據具有交易品類別標簽;根據預先獲取到的商用地和居住地的規(guī)劃數據,以及地址數據的交易品類別標簽,確定地址數據的地址類型的技術方案,實現了一種經濟高效、細粒度的地址類型的識別方法,由于互聯網物流訂單數據遠少于移動設備報點數據,對物流訂單中的地址數據進行地址類型的識別不僅減少了計算資源,提高了識別效率;而且可以精確到具體地址,為后續(xù)的通勤分析提供了高質量的數據支持。