1.一種數(shù)據(jù)處理方法,其特征在于,包括:
根據(jù)用戶在場景下的歷史行為數(shù)據(jù)以及所述歷史行為數(shù)據(jù)中每條信息的各標(biāo)簽的權(quán)重獲取所述用戶在每個標(biāo)簽上的累計權(quán)重;
計算所述用戶在所述每個標(biāo)簽上的累計權(quán)重與所述用戶在所有標(biāo)簽上的總累計權(quán)重之間的比值,作為所述用戶在所述每個標(biāo)簽的累計權(quán)重分布;
根據(jù)所述用戶在所述每個標(biāo)簽上的累計權(quán)重分布以及所述場景下所有用戶在所述每個標(biāo)簽上對應(yīng)的總累計權(quán)重分布,確定所述用戶在所述每個標(biāo)簽上的興趣權(quán)重;
利用所述每個標(biāo)簽以及所述每個標(biāo)簽上所述用戶的興趣權(quán)重生成所述場景下所述用戶的興趣分布向量。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
針對場景集合中的每個場景,利用所述用戶在所述場景下所述每個標(biāo)簽上的興趣權(quán)重、所述用戶在所述場景下在所有標(biāo)簽上的總累計權(quán)重以及所述用戶在所述場景集合中所有場景下的總累計權(quán)重,確定所述用戶在所述場景下在所述每個標(biāo)簽上的興趣權(quán)重比例;
針對每個標(biāo)簽,計算所述用戶在所述所有場景下在所述標(biāo)簽上的所述興趣權(quán)重比例之和,作為所述用戶在所述所有場景下在所述標(biāo)簽上的總興趣權(quán)重;
利用所述每個標(biāo)簽以及所述用戶在所述每個標(biāo)簽對應(yīng)的所述總興趣權(quán)重,生成所述用戶在所述所有場景下的最終的興趣分布向量。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)用戶在場景下的歷史行為數(shù)據(jù)以及所述歷史行為數(shù)據(jù)中每條信息的各標(biāo)簽的權(quán)重獲取所述用戶在每個標(biāo)簽上的累計權(quán)重之前,所述方法還包括:
根據(jù)用戶在場景下歷史行為數(shù)據(jù)中每條信息的特征,將所述每條信息量化為標(biāo)簽向量,所述標(biāo)簽向量包括所述每條信息具有的標(biāo)簽以及所述每個標(biāo)簽的權(quán)重。
4.根據(jù)權(quán)利要求1至3任一項所述的方法,其特征在于,所述根據(jù)用戶在場景下的歷史行為數(shù)據(jù)以及所述歷史行為數(shù)據(jù)中每條行為信息的各標(biāo)簽的權(quán)重獲取所述用戶在每個標(biāo)簽上的累計權(quán)重,包括:
針對用戶在場景下的歷史行為數(shù)據(jù)中的每條信息,計算所述每條信息的每個標(biāo)簽的權(quán)重與所述每條信息對應(yīng)的歷史行為產(chǎn)生時刻距離當(dāng)前時刻的衰減因子之間的乘積,作為所述每條信息的整體權(quán)重;
計算所述用戶的歷史行為對應(yīng)的所有信息的整體權(quán)重之和,作為所述用戶在所述每個標(biāo)簽上的累計權(quán)重。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述針對用戶在場景下的歷史行為數(shù)據(jù)中的每條信息,計算所述每條信息的每個標(biāo)簽的權(quán)重與所述每條信息對應(yīng)的歷史行為產(chǎn)生時刻距離當(dāng)前時刻的衰減因子之間的乘積,作為所述每條信息的整體權(quán)重之前,所述方法還包括:
以預(yù)設(shè)周期獲取用戶在各場景下的歷史行為數(shù)據(jù)。
6.一種數(shù)據(jù)處理裝置,其特征在于,包括:
第一獲取模塊,用于根據(jù)用戶在場景下的歷史行為數(shù)據(jù)以及所述歷史行為數(shù)據(jù)中每條信息的各標(biāo)簽的權(quán)重獲取所述用戶在每個標(biāo)簽上的累計權(quán)重;
計算模塊,用于計算所述用戶在所述每個標(biāo)簽上的累計權(quán)重與所述用戶在所有標(biāo)簽上的總累計權(quán)重之間的比值,作為所述用戶在所述每個標(biāo)簽的累計權(quán)重分布;
確定模塊,用于根據(jù)所述用戶在所述每個標(biāo)簽上的累計權(quán)重分布以及所述場景下所有用戶在所述每個標(biāo)簽上對應(yīng)的總累計權(quán)重分布,確定所述用戶在所述每個標(biāo)簽上的興趣權(quán)重;
生成模塊,用于利用所述每個標(biāo)簽以及所述每個標(biāo)簽上所述用戶的興趣權(quán)重生成所述場景下所述用戶的興趣分布向量。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述確定模塊還用于:
針對場景集合中的每個場景,利用所述用戶在所述場景下所述每個標(biāo)簽上的興趣權(quán)重、所述用戶在所述場景下在所有標(biāo)簽上的總累計權(quán)重以及所述用戶在所述場景集合中所有場景下的總累計權(quán)重,確定所述用戶在所述場景下在所述每個標(biāo)簽上的興趣權(quán)重比例;
所述計算模塊,還用于針對每個標(biāo)簽,計算所述用戶在所述所有場景下在所述標(biāo)簽上的所述興趣權(quán)重比例之和,作為所述用戶在所述所有場景下在所述標(biāo)簽上的總興趣權(quán)重;
所述生成模塊,還用于利用所述每個標(biāo)簽以及所述用戶在所述每個標(biāo)簽對應(yīng)的所述總興趣權(quán)重,生成所述用戶在所述所有場景下的最終的興趣分布向量。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括:
量化模塊,用于根據(jù)用戶在場景下歷史行為數(shù)據(jù)中每條信息的特征,將所述每條信息量化為標(biāo)簽向量,所述標(biāo)簽向量包括所述每條信息具有的標(biāo)簽以及所述每個標(biāo)簽的權(quán)重。
9.根據(jù)權(quán)利要求6至8任一項所述的裝置,其特征在于,所述第一獲取模塊,具體用于:
針對用戶在場景下的歷史行為數(shù)據(jù)中的每條信息,計算所述每條信息的每個標(biāo)簽的權(quán)重與所述每條信息對應(yīng)的歷史行為產(chǎn)生時刻距離當(dāng)前時刻的衰減因子之間的乘積,作為所述每條信息的整體權(quán)重;
計算所述用戶的歷史行為對應(yīng)的所有信息的整體權(quán)重之和,作為所述用戶在所述每個標(biāo)簽上的累計權(quán)重。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述裝置還包括:
第二獲取模塊,用于以預(yù)設(shè)周期獲取用戶在各場景下的歷史行為數(shù)據(jù)。