基于社交行為進(jìn)行用戶的類別劃分、廣告投放方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開(kāi)了一種基于社交行為進(jìn)行用戶的類別劃分、廣告投放方法和系統(tǒng),該方法包括:根據(jù)待分類的用戶的UID,獲取對(duì)應(yīng)該UID記錄的設(shè)定周期內(nèi)的社交日志,并作為該用戶的用戶社交數(shù)據(jù);根據(jù)該UID所對(duì)應(yīng)的cookie ID,獲取對(duì)應(yīng)該cookie ID記錄的設(shè)定周期內(nèi)的訪問(wèn)日志,并作為該用戶的用戶行為數(shù)據(jù);從所述用戶行為數(shù)據(jù)中抽取用戶行為屬性特征,從所述用戶社交數(shù)據(jù)中抽取用戶社交屬性特征;根據(jù)抽取的用戶行為屬性特征和用戶社交屬性特征,將所述用戶劃分到相應(yīng)類別。應(yīng)用本發(fā)明,可以提高用戶的類別劃分的準(zhǔn)確度和廣告投放有效性。
【專利說(shuō)明】基于社交行為進(jìn)行用戶的類別劃分、廣告投放方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,尤其涉及一種基于社交行為進(jìn)行用戶的類別劃分、廣告投放方法和系統(tǒng)。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,互聯(lián)網(wǎng)廣告以其快速、便捷、靈活性強(qiáng)的優(yōu)勢(shì)迅速取代了傳統(tǒng)的媒體廣告?;ヂ?lián)網(wǎng)廣告就是通過(guò)網(wǎng)絡(luò)廣告平臺(tái)在網(wǎng)絡(luò)上投放廣告,利用網(wǎng)站上的廣告橫幅、文本鏈接、多媒體的方法,在互聯(lián)網(wǎng)刊登或發(fā)布廣告,通過(guò)網(wǎng)絡(luò)傳遞到互聯(lián)網(wǎng)用戶的一種高科技廣告運(yùn)作方式。與傳統(tǒng)的四大傳播媒體(報(bào)紙、雜志、電視、廣播)廣告及備受垂青的戶外廣告相比,互聯(lián)網(wǎng)廣告以互聯(lián)網(wǎng)為廣告媒體,具有得天獨(dú)厚的優(yōu)勢(shì),是實(shí)施現(xiàn)代營(yíng)銷媒體戰(zhàn)略的重要一部分。
[0003]而且,隨著互聯(lián)網(wǎng)廣告技術(shù)的高速發(fā)展,廣告商對(duì)目標(biāo)受眾的需要也越來(lái)越高。而傳統(tǒng)的媒體廣告不是生命周期較短、制作復(fù)雜,就是靈活性和及時(shí)性比較差,同時(shí)還極易受到外界因素的干擾;更主要是它們無(wú)法精確鎖定自己所需要的受眾人群,因此亟需提供一種能夠面向人群的、用以提升推廣效果大大提升的廣告模式。
[0004]實(shí)際應(yīng)用中,IGRP(Internet Gross Rating Points,互聯(lián)網(wǎng)總收視點(diǎn))廣告就是一種從傳統(tǒng)電視廣告的GRP (Gross Rating Point,總收視點(diǎn))演變而來(lái)的面向人群的廣告售賣方案。通過(guò)互聯(lián)網(wǎng)大數(shù)據(jù)優(yōu)勢(shì)可以深入挖掘受眾用戶的年齡、性別、興趣等特征,繼而根據(jù)挖掘的特征來(lái)對(duì)用戶進(jìn)行類別劃分,以便廣告商有針對(duì)性地進(jìn)行廣告投放,提升推廣效果。
[0005]現(xiàn)有提供了一種用戶類別劃分方法,其主要是根據(jù)用戶在廣告投放網(wǎng)站的訪問(wèn)日志,將用戶劃分到相應(yīng)的類別。具體地,可以在獲取用戶在廣告投放網(wǎng)站的訪問(wèn)日志后,對(duì)用戶訪問(wèn)的頁(yè)面進(jìn)行分析,得到用戶訪問(wèn)的頁(yè)面的特征;繼而,根據(jù)用戶訪問(wèn)的頁(yè)面的特征,推斷出用戶的類別。然而,事實(shí)上,根據(jù)單方面的用戶訪問(wèn)的頁(yè)面的特征來(lái)反推用戶的類別,其可信度不高,導(dǎo)致用戶的類別劃分結(jié)果的準(zhǔn)確度不高,繼而導(dǎo)致根據(jù)類別劃分結(jié)果所投放的廣告的受眾針對(duì)性不夠、推廣效果差,降低了廣告投放的有效性。
[0006]因此,有必要提供一種提高類別劃分準(zhǔn)確度的用戶類別劃分方法。
【發(fā)明內(nèi)容】
[0007]針對(duì)上述現(xiàn)有技術(shù)存在的缺陷,本發(fā)明提供了一種基于社交行為進(jìn)行用戶的類別劃分、廣告投放方法和系統(tǒng),用以提高用戶的類別劃分的準(zhǔn)確度和廣告投放有效性。
[0008]根據(jù)本發(fā)明的一個(gè)方面,提供了一種基于社交行為進(jìn)行用戶的類別劃分方法,包括:
[0009]獲取設(shè)定周期內(nèi)待分類的用戶的用戶行為數(shù)據(jù),以及用戶社交數(shù)據(jù);
[0010]從所述用戶行為數(shù)據(jù)中抽取用戶行為屬性特征,從所述用戶社交數(shù)據(jù)中抽取用戶社交屬性特征;
[0011]根據(jù)抽取的用戶行為屬性特征和用戶社交屬性特征,將所述用戶劃分到相應(yīng)類別。
[0012]較佳地,所述根據(jù)抽取的用戶行為屬性特征和用戶社交屬性特征,將所述用戶劃分到相應(yīng)類別,具體包括:
[0013]將所述用戶的用戶行為屬性特征,與預(yù)建的行為特征規(guī)則庫(kù)中記錄的用戶行為屬性特征進(jìn)行匹配,根據(jù)匹配結(jié)果判斷出所述用戶所屬的行為族群;其中,所述行為特征規(guī)則庫(kù)中針對(duì)每種行為族群,記錄了該行為族群所具有的用戶行為屬性特征;
[0014]將所述用戶的用戶社交屬性特征,與預(yù)建的社交特征規(guī)則庫(kù)中記錄的用戶社交屬性特征進(jìn)行匹配,根據(jù)匹配結(jié)果判斷出所述用戶所屬的社交族群;其中,所述社交特征規(guī)則庫(kù)中針對(duì)每種社交族群,記錄了該社交族群所具有的用戶社交屬性特征;
[0015]查找出所述用戶所屬的行為族群與社交族群之間共同的族群,并將所述用戶劃分到查找出的共同的族群中。
[0016]較佳地,所述根據(jù)抽取的用戶行為屬性特征和用戶社交屬性特征,將所述用戶劃分到相應(yīng)類別,具體包括:
[0017]將抽取的所述用戶的用戶行為屬性特征和用戶社交屬性特征融合匯總得到所述用戶的用戶特征;
[0018]將得到的所述用戶的用戶特征輸入到用于類別劃分的類別劃分模型中;通過(guò)所述類別劃分模型將所述用戶劃分到相應(yīng)類別。
[0019]較佳地,所述類別劃分模型是預(yù)先訓(xùn)練的:
[0020]對(duì)于從網(wǎng)站的用戶中選取出的每個(gè)訓(xùn)練用戶,統(tǒng)計(jì)該訓(xùn)練用戶的用戶行為屬性特征和用戶社交屬性特征后,融合匯總得到該訓(xùn)練用戶的用戶特征;并根據(jù)該訓(xùn)練用戶的用戶行為屬性特征確定出該訓(xùn)練用戶所屬的行為族群,根據(jù)該訓(xùn)練用戶的用戶社交屬性特征確定出該訓(xùn)練用戶所屬的社交族群,并將該訓(xùn)練用戶所屬的行為族群與社交族群之間共同的族群作為該訓(xùn)練用戶的所屬族群;
[0021]將每個(gè)訓(xùn)練用戶的所屬族群、用戶特征作為訓(xùn)練數(shù)據(jù),使用所述訓(xùn)練數(shù)據(jù)運(yùn)用預(yù)置的多標(biāo)簽多分類算法進(jìn)行模型訓(xùn)練,得到類別劃分模型。
[0022]較佳地,在所述得到類別劃分模型之前,還包括:
[0023]對(duì)于從網(wǎng)站的用戶中選取出的每個(gè)測(cè)試用戶,統(tǒng)計(jì)該測(cè)試用戶的用戶行為屬性特征和用戶社交屬性特征后,融合匯總得到該測(cè)試用戶的用戶特征;并根據(jù)該測(cè)試用戶的用戶行為屬性特征確定出該測(cè)試用戶所屬的行為族群,根據(jù)該測(cè)試用戶的用戶社交屬性特征確定出該測(cè)試用戶所屬的社交族群,并將該測(cè)試用戶所屬的行為族群與社交族群之間共同的族群作為該測(cè)試用戶的所屬族群;
[0024]將每個(gè)測(cè)試用戶的所屬族群、用戶特征作為測(cè)試數(shù)據(jù);以及
[0025]在使用所述訓(xùn)練數(shù)據(jù)運(yùn)用預(yù)置的多標(biāo)簽多分類算法進(jìn)行模型訓(xùn)練時(shí),還使用所述測(cè)試數(shù)據(jù)運(yùn)用預(yù)置的多標(biāo)簽多分類算法進(jìn)行模型訓(xùn)練,得到所述類別劃分模型。
[0026]本發(fā)明還提供了一種廣告投放方法,包括:
[0027]網(wǎng)站接收到用戶的訪問(wèn)請(qǐng)求后,獲取所述用戶的身份識(shí)別號(hào)碼cookieID以及對(duì)應(yīng)的用戶身份證明WD ;
[0028]根據(jù)所述用戶的cookieID和UID,采用如權(quán)利要求1_5任一所述的方法,得到所述用戶的類別劃分結(jié)果;
[0029]將得到的類別劃分結(jié)果作為搜索關(guān)鍵詞,查找出與所述搜索關(guān)鍵詞相匹配的廣告內(nèi)容;
[0030]在針對(duì)所述訪問(wèn)請(qǐng)求向所述用戶返回的網(wǎng)頁(yè)的廣告播放欄中播放查找出的廣告內(nèi)容。
[0031]根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種基于社交行為進(jìn)行用戶的類別劃分系統(tǒng),包括:
[0032]用戶數(shù)據(jù)獲取模塊,用于獲取設(shè)定周期內(nèi)待分類的用戶的用戶行為數(shù)據(jù)、以及用戶社交數(shù)據(jù)并輸出;
[0033]屬性特征抽取模塊,用于從所述用戶數(shù)據(jù)獲取模塊輸出的用戶行為數(shù)據(jù)中抽取用戶行為屬性特征,從所述用戶數(shù)據(jù)獲取模塊輸出的用戶社交數(shù)據(jù)中抽取用戶社交屬性特征;
[0034]用戶類別劃分模塊,用于根據(jù)所述屬性特征抽取模塊抽取的用戶行為屬性特征和用戶社交屬性特征,將所述用戶劃分到相應(yīng)類別。
[0035]較佳地,所述用戶類別劃分模塊具體包括:第一用戶類別劃分單元或第二用戶類別劃分單元;其中,
[0036]所述第一用戶類別劃分單元具體包括:
[0037]行為特征匹配子單元,用于將所述屬性特征抽取模塊抽取的用戶行為屬性特征,與預(yù)建的行為特征規(guī)則庫(kù)中記錄的用戶行為屬性特征進(jìn)行匹配,根據(jù)匹配結(jié)果判斷出所述用戶所屬的行為族群;其中,所述行為特征規(guī)則庫(kù)中針對(duì)每種行為族群,記錄了該行為族群所具有的用戶行為屬性特征;
[0038]社交特征匹配子單元,用于將所述屬性特征抽取模塊抽取的用戶社交屬性特征,與預(yù)建的社交特征規(guī)則庫(kù)中記錄的用戶社交屬性特征進(jìn)行匹配,根據(jù)匹配結(jié)果判斷出所述用戶所屬的社交族群;其中,所述社交特征規(guī)則庫(kù)中針對(duì)每種社交族群,記錄了該社交族群所具有的用戶社交屬性特征;
[0039]類別劃分子單元,用于接收所述行為特征匹配單元輸出的用戶所屬的行為族群、以及所述社交特征匹配單元輸出的用戶所屬的社交族群;查找出所述用戶所屬的行為族群與社交族群之間共同的族群,并將所述用戶劃分到查找出的共同的族群中;以及
[0040]所述第二用戶類別劃分單元用于將所述屬性特征抽取模塊抽取的所述用戶的用戶行為屬性特征和用戶社交屬性特征,融合匯總得到所述用戶的用戶特征;并將得到的所述用戶的用戶特征輸入到用于類別劃分的類別劃分模型中;通過(guò)所述類別劃分模型將所述用戶劃分到相應(yīng)類別。
[0041]較佳地,基于社交行為進(jìn)行用戶的類別劃分系統(tǒng)還包括:
[0042]劃分模型訓(xùn)練模塊,用于對(duì)于從網(wǎng)站的用戶中選取出的每個(gè)訓(xùn)練用戶,統(tǒng)計(jì)該訓(xùn)練用戶的用戶行為屬性特征和用戶社交屬性特征后,融合匯總得到該訓(xùn)練用戶的用戶特征;并根據(jù)該訓(xùn)練用戶的用戶行為屬性特征確定出該訓(xùn)練用戶所屬的行為族群,根據(jù)該訓(xùn)練用戶的用戶社交屬性特征確定出該訓(xùn)練用戶所屬的社交族群,并將該訓(xùn)練用戶所屬的行為族群與社交族群之間共同的族群作為該訓(xùn)練用戶的所屬族群;將每個(gè)訓(xùn)練用戶的所屬族群、用戶特征作為訓(xùn)練數(shù)據(jù),使用所述訓(xùn)練數(shù)據(jù)運(yùn)用預(yù)置的多標(biāo)簽多分類算法進(jìn)行模型訓(xùn)練,得到類別劃分模型。
[0043]本發(fā)明還提供了一種廣告投放系統(tǒng),包括:
[0044]上述基于社交行為進(jìn)行用戶的類別劃分系統(tǒng)中的用戶數(shù)據(jù)獲取模塊、屬性特征抽取模塊、用戶類別劃分模塊;
[0045]網(wǎng)頁(yè)請(qǐng)求接收模塊,用于接收用戶的訪問(wèn)請(qǐng)求后,獲取用戶的cookieID以及對(duì)應(yīng)的WD,并發(fā)送至所述用戶數(shù)據(jù)獲取模塊;
[0046]廣告查詢模塊,用于將所述用戶類別劃分模塊輸出的用戶的類別劃分結(jié)果作為搜索關(guān)鍵詞,查找出與所述搜索關(guān)鍵詞相匹配的廣告內(nèi)容;
[0047]請(qǐng)求處理模塊,用于在所述訪問(wèn)請(qǐng)求所請(qǐng)求的網(wǎng)頁(yè)的廣告播放欄中插入所述廣告查詢模塊查找出的廣告內(nèi)容后,將所述網(wǎng)頁(yè)向所述用戶返回;
[0048]所述用戶數(shù)據(jù)獲取模塊具體用于根據(jù)用戶的cookieID以及對(duì)應(yīng)的WD,獲取設(shè)定周期內(nèi)用戶的用戶行為數(shù)據(jù)、以及用戶社交數(shù)據(jù)并輸出。
[0049]本發(fā)明的技術(shù)方案中,根據(jù)用戶在網(wǎng)站上的用戶行為數(shù)據(jù)、在社交平臺(tái)下的用戶社交數(shù)據(jù),分別抽取出用戶行為屬性特征、以及用戶社交屬性特征;繼而,根據(jù)抽取出的用戶行為屬性特征和用戶社交屬性特征來(lái)進(jìn)行用戶的類別劃分。相比現(xiàn)有僅根據(jù)用戶訪問(wèn)頁(yè)面的信息來(lái)反推用戶的興趣,本發(fā)明提供的技術(shù)方案,綜合考慮用戶行為屬性特征和用戶社交屬性特征來(lái)進(jìn)行用戶類別劃分,增加了類別劃分的特征豐富度,并提高了用戶類別劃分準(zhǔn)確度,也就可以提高人群定位準(zhǔn)確度;這樣,基于更高的人群定位準(zhǔn)確度,可以提高廣告、宣傳視頻等的受眾的針對(duì)性、投放有效性。
【專利附圖】
【附圖說(shuō)明】
[0050]圖1為本發(fā)明實(shí)施例的基于社交行為進(jìn)行用戶的類別劃分方法的流程示意圖;
[0051]圖2為本發(fā)明實(shí)施例的廣告投放方法的流程示意圖;
[0052]圖3為本發(fā)明實(shí)施例的抽取出用戶行為屬性特征的流程示意圖;
[0053]圖4為本發(fā)明實(shí)施例的抽取出用戶社交屬性特征的流程示意圖;
[0054]圖5為本發(fā)明實(shí)施例的類別劃分模型的訓(xùn)練方法流程示意圖;
[0055]圖6為本發(fā)明實(shí)施例的基于社交行為進(jìn)行用戶的類別劃分系統(tǒng)的結(jié)構(gòu)示意圖;
[0056]圖7為本發(fā)明實(shí)施例的第一用戶類別劃分單元的結(jié)構(gòu)示意圖;
[0057]圖8為本發(fā)明實(shí)施例的廣告投放系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0058]以下將結(jié)合附圖對(duì)本發(fā)明的技術(shù)方案進(jìn)行清楚、完整的描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明的一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)的前提下所得到的所有其它實(shí)施例,都屬于本發(fā)明所保護(hù)的范圍。
[0059]本申請(qǐng)使用的“模塊”、“系統(tǒng)”等術(shù)語(yǔ)旨在包括與計(jì)算機(jī)相關(guān)的實(shí)體,例如但不限于硬件、固件、軟硬件組合、軟件或者執(zhí)行中的軟件。例如,模塊可以是,但并不僅限于:處理器上運(yùn)行的進(jìn)程、處理器、對(duì)象、可執(zhí)行程序、執(zhí)行的線程、程序和/或計(jì)算機(jī)。舉例來(lái)說(shuō),計(jì)算設(shè)備上運(yùn)行的應(yīng)用程序和此計(jì)算設(shè)備都可以是模塊。一個(gè)或多個(gè)模塊可以位于執(zhí)行中的一個(gè)進(jìn)程和/或線程內(nèi),一個(gè)模塊也可以位于一臺(tái)計(jì)算機(jī)上和/或分布于兩臺(tái)或更多臺(tái)計(jì)算機(jī)之間。
[0060]本發(fā)明的發(fā)明人發(fā)現(xiàn),對(duì)于網(wǎng)站中,除了用戶在該網(wǎng)站上的訪問(wèn)頁(yè)面的情況可以在一定程度上反映用戶的興趣,用戶在該網(wǎng)站登錄的社交平臺(tái)上發(fā)布的、轉(zhuǎn)發(fā)的、點(diǎn)贊的博文也能夠在一定程度上反應(yīng)用戶的興趣。
[0061]因此,本發(fā)明的發(fā)明人考慮到,可以將用戶在網(wǎng)站上的訪問(wèn)日志作為用戶行為數(shù)據(jù)、將用戶在社交平臺(tái)下的社交日志作為用戶社交數(shù)據(jù),并從用戶行為數(shù)據(jù)、用戶社交數(shù)據(jù)分別抽取出用戶行為屬性特征、以及用戶社交屬性特征;繼而,可以根據(jù)抽取出的用戶行為屬性特征和用戶社交屬性特征來(lái)進(jìn)行用戶的類別劃分。相比現(xiàn)有僅根據(jù)用戶訪問(wèn)頁(yè)面的信息來(lái)反推用戶的興趣,本發(fā)明提供的技術(shù)方案,綜合考慮用戶行為屬性特征和用戶社交屬性特征來(lái)進(jìn)行用戶類別劃分,可以增加類別劃分的特征豐富度,并提高用戶類別劃分準(zhǔn)確度,也就可以提高人群定位準(zhǔn)確度;基于更高的人群定位準(zhǔn)確度,可以提高廣告、宣傳視頻等的受眾的針對(duì)性、投放有效性。
[0062]下面結(jié)合附圖詳細(xì)說(shuō)明本發(fā)明的技術(shù)方案。
[0063]本發(fā)明實(shí)施例提供了一種基于社交行為進(jìn)行用戶的類別劃分方法,其流程如圖1所示,具體可以包括如下步驟:
[0064]SlOl:獲取設(shè)定周期內(nèi)待分類的用戶的用戶行為數(shù)據(jù),以及用戶社交數(shù)據(jù)。
[0065]實(shí)際應(yīng)用中,用戶在向網(wǎng)站發(fā)送訪問(wèn)請(qǐng)求時(shí),網(wǎng)站通常會(huì)通過(guò)cookieID(Identity,身份識(shí)別號(hào)碼)來(lái)標(biāo)記用戶,并記錄該用戶的所有訪問(wèn)日志。相應(yīng)地,若用戶在該網(wǎng)站的社交平臺(tái)進(jìn)行了注冊(cè),會(huì)得到唯一的UID(User Identificat1n,用戶身份證明);這樣,在該用戶每次通過(guò)WD登錄社交平臺(tái)時(shí),網(wǎng)站可以對(duì)應(yīng)該WD,記錄該用戶的cookie ID、以及所有社交日志。本發(fā)明實(shí)施例中的社交平臺(tái)具體可以是微博、推特等。
[0066]因此,具體地,再確定待分類的用戶的UID后,可以根據(jù)該用戶的WD,可以獲取對(duì)應(yīng)該UID記錄的設(shè)定周期內(nèi)的社交日志,并作為該用戶的用戶社交數(shù)據(jù)。進(jìn)一步地,可以根據(jù)該UID所對(duì)應(yīng)的cookie ID,獲取對(duì)應(yīng)該cookie ID記錄的設(shè)定周期內(nèi)的訪問(wèn)日志,并作為該用戶的用戶行為數(shù)據(jù)。
[0067]其中,用戶在設(shè)定周期內(nèi)的訪問(wèn)日志具體可以包括:用戶在設(shè)定周期內(nèi)在網(wǎng)站上訪問(wèn)的每個(gè)頁(yè)面及其訪問(wèn)次數(shù)、點(diǎn)擊的每個(gè)廣告及其點(diǎn)擊次數(shù)等。用戶在設(shè)定周期內(nèi)的社交日志具體可以包括:用戶的博文,用戶的注冊(cè)信息,用戶的關(guān)注信息,用戶的LBS (Locat1n Based Service,基于位置服務(wù))位置信息等。
[0068]S102:從用戶行為數(shù)據(jù)中抽取用戶行為屬性特征,從用戶社交數(shù)據(jù)中抽取用戶社交屬性特征。
[0069]具體地,可以根據(jù)獲取的用戶行為數(shù)據(jù),從中抽取出用戶的用戶行為屬性特征,例如,用戶的性別、年齡、興趣等。進(jìn)一步地,可以根據(jù)獲取的用戶社交數(shù)據(jù),從中抽取出用戶的用戶社交屬性特征,例如,性別、年齡、博文特征、關(guān)注用戶特征、LBS特征等。實(shí)際應(yīng)用中,從用戶行為數(shù)據(jù)中抽取出的用戶行為屬性特征也可以稱為基于cookie ID的特征;從用戶社交數(shù)據(jù)中抽取出的用戶社交屬性特征也可以稱為基于UID的特征。
[0070]關(guān)于如何從用戶行為數(shù)據(jù)中抽取出上述用戶行為屬性特征,以及如何從用戶社交數(shù)據(jù)中抽取出上述用戶社交屬性特征,將在后續(xù)詳細(xì)介紹。
[0071]S103:根據(jù)抽取的用戶行為屬性特征和用戶社交屬性特征,將用戶劃分到相應(yīng)類別。
[0072]具體地,可以將用戶的用戶行為屬性特征,與預(yù)建的行為特征規(guī)則庫(kù)中記錄的用戶行為屬性特征進(jìn)行匹配,根據(jù)匹配結(jié)果判斷出用戶所屬的行為族群。其中,行為特征規(guī)則庫(kù)中針對(duì)每種行為族群,記錄了該行為族群所具有的用戶行為屬性特征。相應(yīng)地,可以將獲取的用戶的用戶社交屬性特征,與預(yù)建的社交特征規(guī)則庫(kù)中記錄的用戶社交屬性特征進(jìn)行匹配,根據(jù)匹配結(jié)果判斷出用戶所屬的社交族群。其中,社交特征規(guī)則庫(kù)中針對(duì)每種社交族群,記錄了該社交族群所具有的用戶社交屬性特征。
[0073]本發(fā)明實(shí)施例中,行為特征規(guī)則庫(kù)中的行為族群和社交特征規(guī)則庫(kù)中的社交族群都是預(yù)先設(shè)置的,例如可以包括:投資理財(cái)族群、運(yùn)動(dòng)健身族群、都市白領(lǐng)族群、親子家庭族群、青春校園族群、影視族群、攝影族群等。
[0074]考慮到用戶如果對(duì)某類事物感興趣,其在訪問(wèn)瀏覽行為上和社交行為上通常會(huì)表現(xiàn)出相似性。因此,可以對(duì)用戶所屬的行為族群與社交族群之間共同的族群進(jìn)行查找,若查找出用戶所屬的行為族群與社交族群之間共同的族群,則可以將用戶劃分到查找出的共同的族群中。相比現(xiàn)有基于單方面的行為所劃分的類別,本發(fā)明的方案中,通過(guò)基于cookieID的特征與基于WD的特征所分別判斷出的行為族群和社交族群之間共同的族群作為用戶的類別劃分結(jié)果,準(zhǔn)確度更高。
[0075]實(shí)際應(yīng)用中,可以針對(duì)行為特征規(guī)則庫(kù)中的每種行為族群,將抽取出的用戶行為屬性特征與該行為族群所具有的用戶行為屬性特征進(jìn)行匹配,若匹配成功,則可以判定該行為族群為該用戶所屬的行為族群;若不匹配,則可以判定該用戶不屬于該行為族群。相應(yīng)地,可以針對(duì)社交特征規(guī)則庫(kù)中的每種社交族群,將抽取出的用戶社交屬性特征與該社交族群所具有的用戶社交屬性特征進(jìn)行匹配,若匹配成功,則可以判定該社交族群為該用戶所屬的社交族群;若不匹配,則可以判定該用戶不屬于該社交族群。
[0076]進(jìn)一步地,在行為特征規(guī)則庫(kù)中針對(duì)每種行為族群,該行為族群所具有的用戶行為屬性特征具體可以包括若干個(gè)屬于該行為族群的用戶所必須具備的用戶行為屬性特征,也可以包括一些屬于該行為族群的用戶所普遍具備的用戶行為屬性特征。
[0077]因此,將抽取出的用戶行為屬性特征與該行為族群所具有的用戶行為屬性特征進(jìn)行匹配時(shí),若抽取出的用戶行為屬性特征包括了屬于該行為族群的用戶所必須具備的用戶行為屬性特征,則可以判斷匹配成功;否則,判斷匹配不成功。相應(yīng)地,在社交特征規(guī)則庫(kù)中針對(duì)每種社交族群,該社交族群所具有的用戶社交屬性特征具體可以包括若干個(gè)屬于該社交族群的用戶所必須具備的用戶社交屬性特征,也可以包括一些屬于該社交族群的用戶所普遍具備的用戶社交屬性特征。因此,將抽取出的用戶社交屬性特征與該社交族群所具有的用戶社交屬性特征進(jìn)行匹配時(shí),若抽取出的用戶社交屬性特征包括了屬于該社交族群的用戶所必須具備的用戶社交屬性特征,則可以判斷匹配成功;否則,判斷匹配不成功。
[0078]此外,若用戶所屬的行為族群與社交族群之間不存在共同的族群,則可以將抽取出的用戶的用戶行為屬性特征和用戶社交屬性特征融合匯總,得到用戶的用戶特征。繼而,根據(jù)得到的用戶的用戶特征、以及預(yù)先訓(xùn)練的類別劃分模型,將用戶劃分到相應(yīng)類別。具體地,可以將近義的多個(gè)特征融合為一個(gè)用戶特征;將沒(méi)有近義的特征單獨(dú)作為一個(gè)用戶特征;按照預(yù)設(shè)的融合規(guī)則,將矛盾的多個(gè)特征融合為一個(gè)用戶特征。例如,若抽取出的用戶行為屬性特征中的年齡特征與抽取出的用戶社交屬性特征中的年齡特征相矛盾,則可以按照預(yù)設(shè)的關(guān)于年齡的融合規(guī)則,將用戶社交屬性特征中的年齡特征直接作為用戶特征中的年齡特征。
[0079]本發(fā)明還提供了一種更優(yōu)的實(shí)施方式,在進(jìn)行步驟S102:從用戶行為數(shù)據(jù)中抽取用戶行為屬性特征,從用戶社交數(shù)據(jù)中抽取用戶社交屬性特征之后,可以直接將抽取的用戶的用戶行為屬性特征和用戶社交屬性特征進(jìn)行融合匯總,得到用戶的用戶特征;繼而,可以將得到的用戶的用戶特征輸入到預(yù)先訓(xùn)練的用于類別劃分的類別劃分模型中;通過(guò)類別劃分模型將用戶劃分到相應(yīng)類別。
[0080]本發(fā)明實(shí)施例中,關(guān)于類別劃分模型的訓(xùn)練,將在后續(xù)詳細(xì)介紹。
[0081]實(shí)際應(yīng)用中,在根據(jù)抽取的用戶行為屬性特征和用戶社交屬性特征,將用戶劃分到相應(yīng)類別之后,可以將用戶劃分到的類別作為類別劃分結(jié)果進(jìn)行存儲(chǔ)??紤]到實(shí)際應(yīng)用中該用戶在不同的計(jì)算機(jī)登錄網(wǎng)站,網(wǎng)站對(duì)應(yīng)該用戶記錄的cookie ID不同,也就是說(shuō),對(duì)應(yīng)同一個(gè)用戶可能存在多個(gè)cookie ID ;但同一個(gè)用戶存在唯一的WD ;因此,進(jìn)一步地,可以將用戶的類別劃分結(jié)果與用戶的UID對(duì)應(yīng)存儲(chǔ),便于后續(xù)的使用。當(dāng)然,實(shí)際應(yīng)用中,也可以將用戶的cookie ID與WD、以及類別劃分結(jié)果共同對(duì)應(yīng)存儲(chǔ)。
[0082]基于上述類別劃分方法,本發(fā)明還提供了一種廣告投放方法,其流程如圖2所示,具體可以包括如下步驟:
[0083]S201:網(wǎng)站接收到用戶的訪問(wèn)請(qǐng)求后,獲取用戶的cookie ID以及對(duì)應(yīng)的WD。
[0084]具體地,網(wǎng)站接收到用戶的訪問(wèn)請(qǐng)求后,除了可以正常獲取與訪問(wèn)請(qǐng)求相對(duì)應(yīng)的網(wǎng)頁(yè);還可以可以獲取該用戶的cookie ID及其對(duì)應(yīng)的MD。
[0085]S202:根據(jù)獲取的cookie ID和WD,獲取設(shè)定周期內(nèi)用戶的用戶行為數(shù)據(jù),以及用戶社交數(shù)據(jù)。
[0086]S203:從獲取的用戶行為數(shù)據(jù)中抽取用戶行為屬性特征,從獲取的用戶社交數(shù)據(jù)中抽取用戶社交屬性特征;并根據(jù)抽取的用戶行為屬性特征和用戶社交屬性特征,將用戶劃分到相應(yīng)類別,得到用戶的類別劃分結(jié)果。
[0087]更優(yōu)地,網(wǎng)站接收到用戶的訪問(wèn)請(qǐng)求,獲取用戶的cookie ID和UID后,可以直接從用戶類別劃分結(jié)果庫(kù)中查找出與獲取的cookie ID和UID對(duì)應(yīng)的類別劃分結(jié)果,作為該用戶的類別劃分結(jié)果。其中,用戶類別劃分結(jié)果庫(kù)中對(duì)應(yīng)每個(gè)用戶,存儲(chǔ)有根據(jù)如步驟S101-S103的方法劃分出的類別劃分結(jié)果及與之對(duì)應(yīng)的cookie ID和MD。
[0088]S204:將得到的類別劃分結(jié)果作為搜索關(guān)鍵詞,查找出與搜索關(guān)鍵詞相匹配的廣告內(nèi)容;在針對(duì)訪問(wèn)請(qǐng)求向用戶返回的網(wǎng)頁(yè)的廣告播放欄中播放查找出的廣告內(nèi)容。
[0089]具體地,可以采用本領(lǐng)域技術(shù)人員所熟知的方法,在獲取搜索關(guān)鍵詞后,可以從網(wǎng)站后臺(tái)查找出與搜索關(guān)鍵詞相匹配的廣告內(nèi)容;并將所有獲取的廣告內(nèi)容加入到針對(duì)訪問(wèn)請(qǐng)求向用戶返回的網(wǎng)頁(yè)的廣告播放欄中。這樣,當(dāng)用戶在訪問(wèn)網(wǎng)站的網(wǎng)頁(yè)時(shí),網(wǎng)站可以根據(jù)用戶的類別劃分結(jié)果向用戶推送用戶可能感興趣的廣告,提高廣告投放的精準(zhǔn)度。
[0090]本發(fā)明實(shí)施例中,在對(duì)用戶進(jìn)行類別劃分之前,可以預(yù)先針對(duì)網(wǎng)站的每個(gè)頁(yè)面,根據(jù)該頁(yè)面的內(nèi)容和受眾用戶的特性,對(duì)應(yīng)存儲(chǔ)有在各頁(yè)面屬性的各頁(yè)面屬性特征及其得分。
[0091]其中,頁(yè)面屬性具體可以包括:年齡、性別和興趣愛(ài)好;每個(gè)頁(yè)面屬性下具有不同的頁(yè)面屬性特征。這樣,針對(duì)每個(gè)頁(yè)面,可以根據(jù)該頁(yè)面的受眾用戶的特性,該頁(yè)面在不同的頁(yè)面屬性特征上具有相應(yīng)的得分。為便于描述,本發(fā)明實(shí)施例中,還可以將頁(yè)面屬性特征的得分簡(jiǎn)稱為頁(yè)屬特征分。
[0092]實(shí)際應(yīng)用中,頁(yè)面屬性-年齡的頁(yè)面屬性特征(也可以簡(jiǎn)稱為年齡特征)具體可以包括:10?20歲、或21?30歲、或31?40歲、或大于等于41歲。如,對(duì)于網(wǎng)站的某一頁(yè)面,該頁(yè)面對(duì)應(yīng)的頁(yè)面屬性特征-10?20歲的得分為0.1 ;該頁(yè)面對(duì)應(yīng)的頁(yè)面屬性特征-21?30歲的得分為0.7 ;該頁(yè)面對(duì)應(yīng)的頁(yè)面屬性特征-31?40歲的得分為0.1 ;該頁(yè)面對(duì)應(yīng)的頁(yè)面屬性特征-大于等于41歲的得分為0.1。
[0093]頁(yè)面屬性-性別的頁(yè)面屬性特征(也可以簡(jiǎn)稱為性別特征)具體可以包括:男性、女性。比如,對(duì)于網(wǎng)站網(wǎng)站的某一頁(yè)面,該頁(yè)面對(duì)應(yīng)的頁(yè)面屬性特征-男性的得分為0.3;該頁(yè)面對(duì)應(yīng)的頁(yè)面屬性特征-女性的得分為0.7。
[0094]頁(yè)面屬性-興趣的頁(yè)面屬性特征(也可以簡(jiǎn)稱為興趣特征)具體可以包括;讀書、旅游、房產(chǎn)、二手房、籃球、足球、理財(cái)?shù)?。比如,?duì)于網(wǎng)站網(wǎng)站的某一頁(yè)面,該頁(yè)面對(duì)應(yīng)的頁(yè)面屬性特征-理財(cái)?shù)牡梅譃?.5 ;該頁(yè)面對(duì)應(yīng)的頁(yè)面屬性特征-讀書的得分為0.3 ;該頁(yè)面對(duì)應(yīng)的頁(yè)面屬性特征-房產(chǎn)的得分為0.2 ;而該頁(yè)面對(duì)應(yīng)的頁(yè)面屬性-興趣下的其他頁(yè)面屬性特征的得分均為O。
[0095]基于上述預(yù)先預(yù)先存儲(chǔ)的各頁(yè)面對(duì)應(yīng)的各頁(yè)面屬性特征及其得分,關(guān)于上述步驟S102中提及的如何從用戶行為數(shù)據(jù)中抽取出用戶行為屬性特征,如圖3所示,具體可以通過(guò)如下步驟來(lái)抽取:
[0096]S301:從獲取的用戶行為數(shù)據(jù)中,確定出用戶在設(shè)定周期內(nèi)訪問(wèn)的每個(gè)頁(yè)面。
[0097]具體地,從用戶行為數(shù)據(jù)中除了可以確定出用戶在設(shè)定周期內(nèi)訪問(wèn)的每個(gè)頁(yè)面,還可以確定出每個(gè)頁(yè)面的訪問(wèn)次數(shù)。
[0098]S302:針對(duì)用戶在設(shè)定周期內(nèi)訪問(wèn)的每個(gè)頁(yè)面,獲取該頁(yè)面在各頁(yè)面屬性下的各頁(yè)面特征及其得分。
[0099]S303:根據(jù)每個(gè)頁(yè)面在各頁(yè)面屬性下的所有頁(yè)面屬性特征的得分,確定出用戶在各頁(yè)面屬性下的頁(yè)面特征,并將確定出的頁(yè)面特征作為抽取出的用戶行為屬性特征。
[0100]具體地,針對(duì)頁(yè)面屬性-年齡,對(duì)于該頁(yè)面屬性下的每個(gè)頁(yè)面屬性特征(年齡特征),可以根據(jù)獲取的各頁(yè)面所對(duì)應(yīng)存儲(chǔ)的該頁(yè)面屬性特征的得分,計(jì)算該頁(yè)面屬性特征的得分的平均值;選取平均值最高的頁(yè)面屬性特征作為用戶在該頁(yè)面屬性下的頁(yè)面特征,并作為抽取出的用戶行為屬性特征。相應(yīng)地,針對(duì)頁(yè)面屬性-性別,對(duì)于該頁(yè)面屬性下的每個(gè)頁(yè)面屬性特征(性別特征),可以根據(jù)獲取的各頁(yè)面所對(duì)應(yīng)存儲(chǔ)的該頁(yè)面屬性特征的得分,計(jì)算該頁(yè)面屬性特征的得分的平均值;選取平均值最高的頁(yè)面屬性特征作為用戶在該頁(yè)面屬性下的頁(yè)面特征,并作為抽取出的用戶行為屬性特征。
[0101]進(jìn)一步地,針對(duì)頁(yè)面屬性-興趣,在獲取用戶訪問(wèn)的每個(gè)頁(yè)面所對(duì)應(yīng)存儲(chǔ)的在頁(yè)面屬性-興趣下的各頁(yè)面屬性特征及其得分后,針對(duì)頁(yè)面屬性-興趣下的每個(gè)頁(yè)面屬性特征,將各頁(yè)面對(duì)應(yīng)存儲(chǔ)的該頁(yè)面屬性特征的得分進(jìn)行累加,若該頁(yè)面屬性特征的累加得分大于設(shè)定的頁(yè)面屬性得分閾值,則將該頁(yè)面屬性特征作為該用戶在頁(yè)面屬性-興趣下的頁(yè)面特征,并作為抽取出的用戶行為屬性特征。其中,頁(yè)面屬性得分閾值可以具體設(shè)置為O。
[0102]實(shí)際應(yīng)用中,相對(duì)于用戶的興趣,用戶的性別和年齡屬于用戶的基本屬性,因此,本發(fā)明實(shí)施例中,可以將用戶的用戶行為屬性特征劃分為:基于行為的基本屬性特征、基于行為的興趣特征。這樣,用戶在頁(yè)面屬性-年齡下的頁(yè)面特征、以及在頁(yè)面屬性-性別下的頁(yè)面特征具體屬于用戶的用戶行為屬性特征中的基于行為的基本屬性特征;用戶在頁(yè)面屬性-興趣下的頁(yè)面特征具體屬于用戶的用戶行為屬性特征中基于行為的興趣特征。
[0103]實(shí)際應(yīng)用中,若用戶對(duì)網(wǎng)站預(yù)先分類的某一頻道感興趣,其在該頻道下的頁(yè)面的訪問(wèn)次數(shù)將會(huì)比較多;因此,更優(yōu)地,本發(fā)明實(shí)施例中,在進(jìn)行步驟S303的同時(shí),還可以通過(guò)如下步驟抽取出用戶行為屬性特征:
[0104]S304:根據(jù)用戶在設(shè)定周期內(nèi)訪問(wèn)的每個(gè)頁(yè)面所屬的頻道,統(tǒng)計(jì)出用戶在網(wǎng)站上的各訪問(wèn)頻道,并將統(tǒng)計(jì)出的各訪問(wèn)頻道作為抽取出的用戶行為屬性特征。
[0105]具體地,針對(duì)用戶在設(shè)定周期內(nèi)訪問(wèn)的每個(gè)頁(yè)面,確定出該頁(yè)面所屬的頻道;根據(jù)確定出的各頁(yè)面所屬的頻道,統(tǒng)計(jì)出用戶設(shè)定周期內(nèi)在網(wǎng)站上的所有訪問(wèn)頻道,并將統(tǒng)計(jì)出的訪問(wèn)頻道作為用戶的用戶行為屬性特征中基于行為的興趣特征中的一種。其中,網(wǎng)站上每個(gè)頁(yè)面的所屬頻道是預(yù)先劃分的。
[0106]進(jìn)一步地,針對(duì)統(tǒng)計(jì)出的每個(gè)訪問(wèn)頻道,可以根據(jù)用戶設(shè)定周期內(nèi)在屬于該訪問(wèn)頻道的各頁(yè)面的訪問(wèn)次數(shù)確定出該訪問(wèn)頻道的特征得分。這樣,更優(yōu)地,可以從用戶的行為屬性特征中剔除特征得分未超過(guò)設(shè)定的訪問(wèn)頻道特征得分閾值的訪問(wèn)頻道,保證基于用戶行為屬性特征所劃分的類別劃分結(jié)果的準(zhǔn)確度。
[0107]例如,針對(duì)每個(gè)訪問(wèn)頻道,可以將用戶設(shè)定周期內(nèi)在屬于該訪問(wèn)頻道的各頁(yè)面的訪問(wèn)次數(shù)的總和作為該頻道特征的特征得分?;蛘?,也可以針對(duì)每個(gè)訪問(wèn)頻道,將用戶設(shè)定周期內(nèi)在屬于該訪問(wèn)頻道的各頁(yè)面的訪問(wèn)次數(shù)總和作為該訪問(wèn)頻道的訪問(wèn)頻次;并將該頻道特征的訪問(wèn)頻次與所有統(tǒng)計(jì)出的訪問(wèn)頻道的訪問(wèn)頻次總和的比值作為該頻道特征的特征得分。
[0108]實(shí)際應(yīng)用中,從用戶行為數(shù)據(jù)中除了可以確定出用戶在設(shè)定周期內(nèi)訪問(wèn)的每個(gè)頁(yè)面及其訪問(wèn)次數(shù),還可以確定出用戶在設(shè)定周期內(nèi)點(diǎn)擊的每個(gè)廣告及其點(diǎn)擊次數(shù)。
[0109]因此,更優(yōu)地,本發(fā)明實(shí)施例中,在進(jìn)行步驟S303的同時(shí),還可以通過(guò)如下步驟抽取出用戶行為屬性特征:
[0110]S305:根據(jù)用戶在設(shè)定周期內(nèi)在網(wǎng)站上點(diǎn)擊的每個(gè)廣告所屬的行業(yè),統(tǒng)計(jì)出用戶在網(wǎng)站上的各點(diǎn)擊行業(yè),并將統(tǒng)計(jì)出的點(diǎn)擊行業(yè)作為抽取出的用戶行為屬性特征。
[0111]具體地,針對(duì)用戶在設(shè)定周期內(nèi)在網(wǎng)站上點(diǎn)擊的每個(gè)廣告,確定出該廣告所屬的行業(yè);根據(jù)確定出的各廣告所屬的行業(yè),統(tǒng)計(jì)出用戶設(shè)定周期內(nèi)在網(wǎng)站上的所有點(diǎn)擊行業(yè),并將統(tǒng)計(jì)出的點(diǎn)擊行業(yè)作為用戶的用戶行為屬性特征中基于行為的興趣特征中的一種。其中,網(wǎng)站上每個(gè)廣告所屬的行業(yè)是預(yù)先劃分的。
[0112]進(jìn)一步地,針對(duì)統(tǒng)計(jì)出的每個(gè)點(diǎn)擊行業(yè),可以根據(jù)用戶設(shè)定周期內(nèi)在屬于該點(diǎn)擊行業(yè)的各廣告的點(diǎn)擊次數(shù),確定出該點(diǎn)擊行業(yè)的特征得分。這樣,更優(yōu)地,可以從用戶的用戶行為屬性特征中剔除特征得分未超過(guò)設(shè)定的點(diǎn)擊行業(yè)特征得分閾值的點(diǎn)擊行業(yè),保證用戶行為屬性特征所劃分的類別劃分結(jié)果的準(zhǔn)確度。
[0113]例如,針對(duì)每個(gè)點(diǎn)擊行業(yè),可以將用戶設(shè)定周期內(nèi)在屬于該點(diǎn)擊行業(yè)的各廣告的點(diǎn)擊次數(shù)總和作為該點(diǎn)擊行業(yè)的特征得分;或者,也可以針對(duì)每個(gè)點(diǎn)擊行業(yè),將用戶設(shè)定周期內(nèi)在屬于該點(diǎn)擊行業(yè)的各廣告的點(diǎn)擊次數(shù)總和作為該點(diǎn)擊行業(yè)的點(diǎn)擊頻次,并將該點(diǎn)擊行業(yè)的點(diǎn)擊頻次與所有點(diǎn)擊行業(yè)的點(diǎn)擊頻次總和的比值作為該點(diǎn)擊行業(yè)的特征得分。
[0114]關(guān)于上述步驟S102中提及的如何從用戶社交數(shù)據(jù)中抽取出用戶社交屬性特征,如圖4所示,具體可以通過(guò)如下步驟來(lái)抽取:
[0115]S401:從獲取的用戶社交數(shù)據(jù)中,確定出用戶在設(shè)定周期內(nèi)每篇博文。
[0116]其中,用戶的博文具體可以包括:用戶發(fā)起、轉(zhuǎn)發(fā)、評(píng)論、點(diǎn)贊的博文。
[0117]S402:針對(duì)確定出的每篇博文,抽取出該博文的博文主題詞;并將抽取出的所有博文的博文主題詞作為用戶的用戶社交屬性特征。
[0118]本發(fā)明實(shí)施例中,可以將用戶的用戶社交屬性特征劃分為:基于社交的基本屬性特征、基于社交的興趣特征。其中,抽取出的博文主題詞具體屬于用戶的用戶社交屬性特征中基于社交的興趣特征中的一種。關(guān)于如何抽取博文中的博文主題詞,可以采用本領(lǐng)域技術(shù)人員的常用技術(shù)手段,在此不再詳述。
[0119]進(jìn)一步地,針對(duì)抽取出的每個(gè)博文主題詞,還可以根據(jù)該博文主題詞在所有博文中的出現(xiàn)次數(shù),確定出該博文主題詞的特征得分。實(shí)際應(yīng)用中,針對(duì)每個(gè)博文主題詞,可以將統(tǒng)計(jì)出的該博文主題詞在所有博文中的出現(xiàn)次數(shù)直接作為該博文主題詞的特征得分。或者,也可以將該博文主題詞在所有博文中的出現(xiàn)次數(shù)與各博文主題詞在所有博文中的出現(xiàn)次數(shù)總和的比值作為該博文主題詞的特征得分。這樣,更優(yōu)地,可以從用戶的用戶社交屬性特征中剔除特征得分未超過(guò)設(shè)定的博文主題詞特征得分閾值的博文主題詞,保證基于用戶社交屬性特征所劃分的類別劃分結(jié)果的準(zhǔn)確度。
[0120]實(shí)際應(yīng)用中,用戶在網(wǎng)站中的社交平臺(tái)登錄之前需要注冊(cè),而用戶的注冊(cè)信息通??梢园?用戶的年齡、性別、學(xué)歷、職業(yè)信息等。
[0121]因此,更優(yōu)地,本發(fā)明實(shí)施例中,在進(jìn)行步驟S401、S402時(shí),還可以通過(guò)如下步驟抽取用戶社交屬性特征:
[0122]S403:從獲取的用戶社交數(shù)據(jù)中確定出用戶的注冊(cè)信息;并從用戶的注冊(cè)信息中抽取出用戶的用戶社交屬性特征。
[0123]具體地,可以將從用戶的注冊(cè)信息中抽取出的用戶的年齡、性別、學(xué)歷等信息直接作為用戶的用戶社交屬性特征中的基于社交的基本屬性特征。
[0124]進(jìn)一步地,在社交平臺(tái)上用戶可以根據(jù)自己的情況,選擇自定義標(biāo)簽。考慮到自定義標(biāo)簽?zāi)軌蛟谝欢ǔ潭壬戏从秤脩舻呐d趣愛(ài)好。因此,進(jìn)一步地,本發(fā)明實(shí)施例中,在進(jìn)行步驟S401、S402的同時(shí),還可以通過(guò)如下步驟抽取用戶社交屬性特征:
[0125]S404:從獲取的用戶社交數(shù)據(jù)中確定出用戶的自定義標(biāo)簽,并將確定出的自定義標(biāo)簽作為抽取出的用戶社交屬性特征。
[0126]具體地,可以將從獲取的用戶社交數(shù)據(jù)中確定出的用戶的自定義標(biāo)簽作為用戶的用戶社交屬性特征中基于社交的興趣特征。
[0127]實(shí)際應(yīng)用中,用戶在社交平臺(tái)上通常會(huì)關(guān)注其他用戶,而用戶所關(guān)注的對(duì)象通常能夠在一定程度上反應(yīng)出用戶的興趣。因此,更優(yōu)地,進(jìn)一步地,本發(fā)明實(shí)施例中,在進(jìn)行步驟S401、S402的同時(shí),還可以根據(jù)用戶的關(guān)注信息來(lái)抽取出用戶的用戶社交屬性特征,具體可以通過(guò)如下步驟抽取用戶社交屬性特征:
[0128]用戶在設(shè)定周期內(nèi)的社交日志具體可以包括:用戶的博文,用戶的注冊(cè)信息,用戶的關(guān)注信息,用戶的LBS(Locat1n Based Service,基于位置服務(wù))位置信息等。
[0129]S405:從獲取的用戶社交數(shù)據(jù)中確定出用戶的關(guān)注信息,并從確定出的關(guān)注信息中提取出用戶所關(guān)注的屬于特定行業(yè)的認(rèn)證用戶;針對(duì)提取出的每個(gè)認(rèn)證用戶,將該認(rèn)證用戶所屬的行業(yè)作為抽取出的用戶社交屬性特征。
[0130]具體地,可以將用戶關(guān)注的各認(rèn)證用戶的所屬行業(yè)作為該用戶的用戶社交屬性特征中基于社交的興趣特征。
[0131]例如,若用戶關(guān)注了 @任志強(qiáng)、@新浪房產(chǎn)、@北京自住房等屬于房地產(chǎn)行業(yè)的認(rèn)證用戶,則可以將房地產(chǎn)行業(yè)作為抽取出的用戶社交屬性特征。
[0132]進(jìn)一步地,針對(duì)提取出的每個(gè)認(rèn)證用戶,確定該認(rèn)證用戶所屬的行業(yè)后,可以根據(jù)每個(gè)認(rèn)證用戶的所屬行業(yè),統(tǒng)計(jì)出用戶所關(guān)注的行業(yè);針對(duì)統(tǒng)計(jì)出的每個(gè)用戶關(guān)注的行業(yè),還可以根據(jù)用戶的關(guān)注信息中屬于該行業(yè)的認(rèn)證用戶的數(shù)量,計(jì)算出該行業(yè)的特征得分。這樣,更優(yōu)地,可以從用戶的用戶社交屬性特征中剔除特征得分未超過(guò)設(shè)定的行業(yè)特征得分閾值的行業(yè),保證基于用戶社交屬性特征所劃分的類別劃分結(jié)果的準(zhǔn)確度。
[0133]實(shí)際應(yīng)用中,有些地理區(qū)域的特征比較明顯(特征區(qū)域),例如,國(guó)家體育場(chǎng)、旅游景點(diǎn)區(qū)域、商貿(mào)區(qū)等;若用戶經(jīng)常出入上述地方,可以在一定程度上反映用戶的興趣。因此,可以預(yù)先進(jìn)行區(qū)域劃分,將這些具有明顯特征的區(qū)域作為特征區(qū)域,并對(duì)應(yīng)該特征區(qū)域存儲(chǔ)相關(guān)聯(lián)的興趣。
[0134]本發(fā)明的發(fā)明人考慮到,網(wǎng)站的用戶往往基于某種因素(比如:工作、興趣等)經(jīng)常在某一位置登錄社交平臺(tái);因此,可以考慮根據(jù)用戶的LBS位置和預(yù)先劃分的特征區(qū)域,抽取出用戶社交屬性特征。
[0135]具體地,由于社交平臺(tái)的LBS服務(wù)可以記錄用戶的登錄位置,因此,可以從社交日志中直接獲取待定位的用戶設(shè)定周期內(nèi)的LBS位置。進(jìn)而,針對(duì)獲取的每個(gè)LBS位置,根據(jù)該LBS位置所屬的特征區(qū)域,將該特征區(qū)域所關(guān)聯(lián)的興趣作為用戶的用戶社交屬性特征中基于社交的興趣特征。
[0136]本發(fā)明實(shí)施例中,關(guān)于步驟S103中提及的類別劃分模型是預(yù)先訓(xùn)練的,如圖5所示,具體可以通過(guò)如下步驟來(lái)進(jìn)行訓(xùn)練:
[0137]S501:對(duì)于從網(wǎng)站的用戶中選取出的每個(gè)訓(xùn)練用戶,統(tǒng)計(jì)該訓(xùn)練用戶的用戶行為屬性特征和用戶社交屬性特征后,融合匯總得到該訓(xùn)練用戶的用戶特征。
[0138]S502:對(duì)于每個(gè)訓(xùn)練用戶,根據(jù)該訓(xùn)練用戶的用戶行為屬性特征確定出該訓(xùn)練用戶所屬的行為族群。
[0139]S503:對(duì)于每個(gè)訓(xùn)練用戶,根據(jù)該訓(xùn)練用戶的用戶社交屬性特征確定出該訓(xùn)練用戶所屬的社交族群。
[0140]S504:對(duì)于每個(gè)訓(xùn)練用戶,將該訓(xùn)練用戶所屬的行為族群與社交族群之間共同的族群作為該訓(xùn)練用戶的所屬族群。
[0141]S505:將每個(gè)訓(xùn)練用戶的所屬族群、用戶特征作為訓(xùn)練數(shù)據(jù),使用訓(xùn)練數(shù)據(jù)運(yùn)用預(yù)置的多標(biāo)簽多分類算法進(jìn)行模型訓(xùn)練,得到類別劃分模型。
[0142]其中,預(yù)置的多標(biāo)簽多分類算法具體可以為M31算法、或Multiboost算法。
[0143]本發(fā)明實(shí)施例中,步驟S501-S504具體可以參考上述基于社交行為進(jìn)行用戶的類別劃分方法中的步驟S101-S103,在此不再詳述。
[0144]更優(yōu)地,為了保證得到精確度更高的類別劃分模型,提高用戶的類別劃分結(jié)果的準(zhǔn)確度,可以在使用訓(xùn)練數(shù)據(jù)運(yùn)用預(yù)置的多標(biāo)簽多分類算法進(jìn)行模型訓(xùn)練時(shí),還可以進(jìn)一步使用測(cè)試數(shù)據(jù)運(yùn)用預(yù)置的多標(biāo)簽多分類算法進(jìn)行模型訓(xùn)練得到類別劃分模型。實(shí)際應(yīng)用中,可以使用測(cè)試數(shù)據(jù)對(duì)類別劃分模型的劃分效果(比如精確度和召回率)進(jìn)行評(píng)估,以此得到效果最優(yōu)的類別劃分模型。其中,測(cè)試數(shù)據(jù)具體可以通過(guò)如下方式獲得:
[0145]對(duì)于從網(wǎng)站的用戶中選取出的每個(gè)測(cè)試用戶,統(tǒng)計(jì)該測(cè)試用戶的用戶行為屬性特征和用戶社交屬性特征后,融合匯總得到該測(cè)試用戶的用戶特征;并根據(jù)該測(cè)試用戶的用戶行為屬性特征確定出該測(cè)試用戶所屬的行為族群,根據(jù)該測(cè)試用戶的用戶社交屬性特征確定出該測(cè)試用戶所屬的社交族群,并將該測(cè)試用戶所屬的行為族群與社交族群之間共同的族群作為該測(cè)試用戶的所屬族群;將每個(gè)測(cè)試用戶的所屬族群、用戶特征作為測(cè)試數(shù)據(jù)。
[0146]實(shí)際應(yīng)用中,為了提高模型訓(xùn)練效率,可以針對(duì)所有訓(xùn)練用戶的訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理,具體可以包括:編碼、歸一化、降維等操作。
[0147]根據(jù)上述基于社交行為進(jìn)行用戶的類別劃分方法,本發(fā)明實(shí)施例還提供了一種基于社交行為進(jìn)行用戶的類別劃分系統(tǒng),如圖6所示,具體可以包括:用戶數(shù)據(jù)獲取模塊601、屬性特征抽取模塊602、以及用戶類別劃分模塊603。
[0148]其中,用戶數(shù)據(jù)獲取模塊601用于獲取設(shè)定周期內(nèi)待分類的用戶的用戶行為數(shù)據(jù)、以及用戶社交數(shù)據(jù)并輸出。
[0149]具體地,用戶數(shù)據(jù)獲取模塊601可以根據(jù)待分類的用戶的WD,獲取對(duì)應(yīng)該UID記錄的設(shè)定周期內(nèi)的社交日志,并作為該用戶的用戶社交數(shù)據(jù)。進(jìn)一步地,可以根據(jù)該WD所對(duì)應(yīng)的cookie ID,獲取對(duì)應(yīng)該cookie ID記錄的設(shè)定周期內(nèi)的訪問(wèn)日志,并作為該用戶的用戶行為數(shù)據(jù)。
[0150]屬性特征抽取模塊602用于從用戶數(shù)據(jù)獲取模塊601輸出的用戶行為數(shù)據(jù)中抽取用戶行為屬性特征,從用戶數(shù)據(jù)獲取模塊601輸出的用戶社交數(shù)據(jù)中抽取用戶社交屬性特征。
[0151]用戶類別劃分模塊603用于根據(jù)屬性特征抽取模塊602抽取的用戶行為屬性特征和用戶社交屬性特征,將用戶劃分到相應(yīng)類別。
[0152]更優(yōu)地,本發(fā)明實(shí)施例中,基于社交行為進(jìn)行用戶的類別劃分系統(tǒng)還進(jìn)一步包括:劃分模型訓(xùn)練模塊604。
[0153]劃分模型訓(xùn)練模塊604用于對(duì)于從網(wǎng)站的用戶中選取出的每個(gè)訓(xùn)練用戶,統(tǒng)計(jì)該訓(xùn)練用戶的用戶行為屬性特征和用戶社交屬性特征后,融合匯總得到該訓(xùn)練用戶的用戶特征;并根據(jù)該訓(xùn)練用戶的用戶行為屬性特征確定出該訓(xùn)練用戶所屬的行為族群,根據(jù)該訓(xùn)練用戶的用戶社交屬性特征確定出該訓(xùn)練用戶所屬的社交族群,并將該訓(xùn)練用戶所屬的行為族群與社交族群之間共同的族群作為該訓(xùn)練用戶的所屬族群;將每個(gè)訓(xùn)練用戶的所屬族群、用戶特征作為訓(xùn)練數(shù)據(jù),使用訓(xùn)練數(shù)據(jù)運(yùn)用預(yù)置的多標(biāo)簽多分類算法進(jìn)行模型訓(xùn)練,得到類別劃分模型。
[0154]本發(fā)明實(shí)施例中,用戶類別劃分模塊603具體可以包括:第一用戶類別劃分單元或第二用戶類別劃分單元。
[0155]其中,第一用戶類別劃分單元用于根據(jù)屬性特征抽取模塊602抽取的用戶行為屬性特征、用戶社交屬性特征、預(yù)建的行為特征規(guī)則庫(kù)和社交特征規(guī)則庫(kù),將用戶劃分到相應(yīng)類別。
[0156]第二用戶類別劃分單元用于將屬性特征抽取模塊602抽取的用戶的用戶行為屬性特征和用戶社交屬性特征,融合匯總得到用戶的用戶特征;并將得到的用戶的用戶特征輸入到用于類別劃分的類別劃分模型中;通過(guò)類別劃分模型將用戶劃分到相應(yīng)類別。
[0157]進(jìn)一步地,如圖7所示,第一用戶類別劃分單元可以具體包括:行為特征匹配子單元701、社交特征匹配子單元702、以及類別劃分子單元703。
[0158]行為特征匹配子單元701用于將屬性特征抽取模塊602抽取的用戶行為屬性特征,與預(yù)建的行為特征規(guī)則庫(kù)中記錄的用戶行為屬性特征進(jìn)行匹配,根據(jù)匹配結(jié)果判斷出所述用戶所屬的行為族群。其中,行為特征規(guī)則庫(kù)中針對(duì)每種行為族群,記錄了該行為族群所具有的用戶行為屬性特征。
[0159]社交特征匹配子單元702用于將屬性特征抽取模塊602抽取的用戶社交屬性特征,與預(yù)建的社交特征規(guī)則庫(kù)中記錄的用戶社交屬性特征進(jìn)行匹配,根據(jù)匹配結(jié)果判斷出所述用戶所屬的社交族群。其中,社交特征規(guī)則庫(kù)中針對(duì)每種社交族群,記錄了該社交族群所具有的用戶社交屬性特征。
[0160]類別劃分子單元703用于接收行為特征匹配子單元701輸出的用戶所屬的行為族群、以及社交特征匹配子單元702輸出的用戶所屬的社交族群;查找出用戶所屬的行為族群與社交族群之間共同的族群,并將用戶劃分到查找出的共同的族群中。
[0161]本發(fā)明實(shí)施例中,基于上述廣告投放方法和用戶類別劃分系統(tǒng),本發(fā)明實(shí)施例還提供了一種廣告投放系統(tǒng),如圖8所示,具體可以包括:基于社交行為進(jìn)行用戶的類別劃分系統(tǒng)中的用戶數(shù)據(jù)獲取模塊601、屬性特征抽取模塊602、用戶類別劃分模塊603、網(wǎng)頁(yè)請(qǐng)求接收模塊801、廣告查詢模塊802、以及請(qǐng)求處理模塊803。
[0162]其中,網(wǎng)頁(yè)請(qǐng)求接收模塊801用于接收用戶的訪問(wèn)請(qǐng)求后,獲取用戶的cookieID以及對(duì)應(yīng)的WD,并發(fā)送至用戶數(shù)據(jù)獲取模塊601。用戶數(shù)據(jù)獲取模塊601可以根據(jù)用戶的cookieID以及對(duì)應(yīng)的WD,獲取設(shè)定周期內(nèi)用戶的用戶行為數(shù)據(jù)、以及用戶社交數(shù)據(jù)并輸出。
[0163]廣告查詢模塊802用于將用戶類別劃分模塊603輸出的用戶的類別劃分結(jié)果作為搜索關(guān)鍵詞,查找出與搜索關(guān)鍵詞相匹配的廣告內(nèi)容。
[0164]請(qǐng)求處理模塊803用于在訪問(wèn)請(qǐng)求所請(qǐng)求的網(wǎng)頁(yè)的廣告播放欄中插入廣告查詢模塊802查找出的廣告內(nèi)容后,將訪問(wèn)請(qǐng)求所請(qǐng)求的網(wǎng)頁(yè)向用戶返回。
[0165]本發(fā)明實(shí)施例中,基于社交行為進(jìn)行用戶的類別劃分系統(tǒng)中的各模塊、單元、子單元的具體功能實(shí)現(xiàn),可以參照上述基于社交行為進(jìn)行用戶的類別劃分方法中的步驟S101-103、步驟S301-S305、以及步驟S401-S405的詳細(xì)過(guò)程;廣告投放系統(tǒng)中的各模塊的具體功能實(shí)現(xiàn),可以參照上述廣告投放方法中的步驟S201-204,在此不再詳述。
[0166]本發(fā)明的技術(shù)方案中,根據(jù)用戶在網(wǎng)站上的用戶行為數(shù)據(jù)、在社交平臺(tái)下的用戶社交數(shù)據(jù),分別抽取出用戶行為屬性特征、以及用戶社交屬性特征;繼而,根據(jù)抽取出的用戶行為屬性特征和用戶社交屬性特征來(lái)進(jìn)行用戶的類別劃分。相比現(xiàn)有僅根據(jù)用戶訪問(wèn)頁(yè)面的信息來(lái)反推用戶的興趣,本發(fā)明提供的技術(shù)方案,綜合考慮用戶行為屬性特征和用戶社交屬性特征來(lái)進(jìn)行用戶類別劃分,可以增加類別劃分的特征豐富度,并提高用戶類別劃分準(zhǔn)確度,也就可以提高人群定位準(zhǔn)確度;基于更高的人群定位準(zhǔn)確度,可以提高廣告、宣傳視頻等的受眾的針對(duì)性、投放有效性。
[0167]以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本【技術(shù)領(lǐng)域】的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明原理的前提下,還可以作出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。
【權(quán)利要求】
1.一種基于社交行為進(jìn)行用戶的類別劃分方法,其特征在于,包括: 獲取設(shè)定周期內(nèi)待分類的用戶的用戶行為數(shù)據(jù),以及用戶社交數(shù)據(jù); 從所述用戶行為數(shù)據(jù)中抽取用戶行為屬性特征,從所述用戶社交數(shù)據(jù)中抽取用戶社交屬性特征; 根據(jù)抽取的用戶行為屬性特征和用戶社交屬性特征,將所述用戶劃分到相應(yīng)類別。
2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)抽取的用戶行為屬性特征和用戶社交屬性特征,將所述用戶劃分到相應(yīng)類別,具體包括: 將所述用戶的用戶行為屬性特征,與預(yù)建的行為特征規(guī)則庫(kù)中記錄的用戶行為屬性特征進(jìn)行匹配,根據(jù)匹配結(jié)果判斷出所述用戶所屬的行為族群;其中,所述行為特征規(guī)則庫(kù)中針對(duì)每種行為族群,記錄了該行為族群所具有的用戶行為屬性特征; 將所述用戶的用戶社交屬性特征,與預(yù)建的社交特征規(guī)則庫(kù)中記錄的用戶社交屬性特征進(jìn)行匹配,根據(jù)匹配結(jié)果判斷出所述用戶所屬的社交族群;其中,所述社交特征規(guī)則庫(kù)中針對(duì)每種社交族群,記錄了該社交族群所具有的用戶社交屬性特征; 查找出所述用戶所屬的行為族群與社交族群之間共同的族群,并將所述用戶劃分到查找出的共同的族群中。
3.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)抽取的用戶行為屬性特征和用戶社交屬性特征,將所述用戶劃分到相應(yīng)類別,具體包括: 將抽取的所述用戶的用戶行為屬性特征和用戶社交屬性特征融合匯總得到所述用戶的用戶特征; 將得到的所述用戶的用戶特征輸入到用于類別劃分的類別劃分模型中;通過(guò)所述類別劃分模型將所述用戶劃分到相應(yīng)類別。
4.如權(quán)利要求3所述的方法,其特征在于,所述類別劃分模型是預(yù)先訓(xùn)練的: 對(duì)于從網(wǎng)站的用戶中選取出的每個(gè)訓(xùn)練用戶,統(tǒng)計(jì)該訓(xùn)練用戶的用戶行為屬性特征和用戶社交屬性特征后,融合匯總得到該訓(xùn)練用戶的用戶特征;并根據(jù)該訓(xùn)練用戶的用戶行為屬性特征確定出該訓(xùn)練用戶所屬的行為族群,根據(jù)該訓(xùn)練用戶的用戶社交屬性特征確定出該訓(xùn)練用戶所屬的社交族群,并將該訓(xùn)練用戶所屬的行為族群與社交族群之間共同的族群作為該訓(xùn)練用戶的所屬族群; 將每個(gè)訓(xùn)練用戶的所屬族群、用戶特征作為訓(xùn)練數(shù)據(jù),使用所述訓(xùn)練數(shù)據(jù)運(yùn)用預(yù)置的多標(biāo)簽多分類算法進(jìn)行模型訓(xùn)練,得到類別劃分模型。
5.如權(quán)利要求4所述的方法,其特征在于,在所述得到類別劃分模型之前,還包括: 對(duì)于從網(wǎng)站的用戶中選取出的每個(gè)測(cè)試用戶,統(tǒng)計(jì)該測(cè)試用戶的用戶行為屬性特征和用戶社交屬性特征后,融合匯總得到該測(cè)試用戶的用戶特征;并根據(jù)該測(cè)試用戶的用戶行為屬性特征確定出該測(cè)試用戶所屬的行為族群,根據(jù)該測(cè)試用戶的用戶社交屬性特征確定出該測(cè)試用戶所屬的社交族群,并將該測(cè)試用戶所屬的行為族群與社交族群之間共同的族群作為該測(cè)試用戶的所屬族群; 將每個(gè)測(cè)試用戶的所屬族群、用戶特征作為測(cè)試數(shù)據(jù);以及 在使用所述訓(xùn)練數(shù)據(jù)運(yùn)用預(yù)置的多標(biāo)簽多分類算法進(jìn)行模型訓(xùn)練時(shí),還使用所述測(cè)試數(shù)據(jù)運(yùn)用預(yù)置的多標(biāo)簽多分類算法進(jìn)行模型訓(xùn)練,得到所述類別劃分模型。
6.—種廣告投放方法,其特征在于,包括: 網(wǎng)站接收到用戶的訪問(wèn)請(qǐng)求后,獲取所述用戶的身份識(shí)別號(hào)碼cookieID以及對(duì)應(yīng)的用戶身份證明UID ; 根據(jù)所述用戶的cookieID和WD,采用如權(quán)利要求1-5任一所述的方法,得到所述用戶的類別劃分結(jié)果; 將得到的類別劃分結(jié)果作為搜索關(guān)鍵詞,查找出與所述搜索關(guān)鍵詞相匹配的廣告內(nèi)容; 在針對(duì)所述訪問(wèn)請(qǐng)求向所述用戶返回的網(wǎng)頁(yè)的廣告播放欄中播放查找出的廣告內(nèi)容。
7.一種基于社交行為進(jìn)行用戶的類別劃分系統(tǒng),其特征在于,包括: 用戶數(shù)據(jù)獲取模塊,用于獲取設(shè)定周期內(nèi)待分類的用戶的用戶行為數(shù)據(jù)、以及用戶社交數(shù)據(jù)并輸出; 屬性特征抽取模塊,用于從所述用戶數(shù)據(jù)獲取模塊輸出的用戶行為數(shù)據(jù)中抽取用戶行為屬性特征,從所述用戶數(shù)據(jù)獲取模塊輸出的用戶社交數(shù)據(jù)中抽取用戶社交屬性特征; 用戶類別劃分模塊,用于根據(jù)所述屬性特征抽取模塊抽取的用戶行為屬性特征和用戶社交屬性特征,將所述用戶劃分到相應(yīng)類別。
8.如權(quán)利要求7所述的系統(tǒng),其特征在于,所述用戶類別劃分模塊具體包括:第一用戶類別劃分單元或第二用戶類別劃分單元;其中, 所述第一用戶類別劃分單元具體包括: 行為特征匹配子單元,用于將所述屬性特征抽取模塊抽取的用戶行為屬性特征,與預(yù)建的行為特征規(guī)則庫(kù)中記錄的用戶行為屬性特征進(jìn)行匹配,根據(jù)匹配結(jié)果判斷出所述用戶所屬的行為族群;其中,所述行為特征規(guī)則庫(kù)中針對(duì)每種行為族群,記錄了該行為族群所具有的用戶行為屬性特征; 社交特征匹配子單元,用于將所述屬性特征抽取模塊抽取的用戶社交屬性特征,與預(yù)建的社交特征規(guī)則庫(kù)中記錄的用戶社交屬性特征進(jìn)行匹配,根據(jù)匹配結(jié)果判斷出所述用戶所屬的社交族群;其中,所述社交特征規(guī)則庫(kù)中針對(duì)每種社交族群,記錄了該社交族群所具有的用戶社交屬性特征; 類別劃分子單元,用于接收所述行為特征匹配單元輸出的用戶所屬的行為族群、以及所述社交特征匹配單元輸出的用戶所屬的社交族群;查找出所述用戶所屬的行為族群與社交族群之間共同的族群,并將所述用戶劃分到查找出的共同的族群中;以及 所述第二用戶類別劃分單元用于將所述屬性特征抽取模塊抽取的所述用戶的用戶行為屬性特征和用戶社交屬性特征,融合匯總得到所述用戶的用戶特征;并將得到的所述用戶的用戶特征輸入到用于類別劃分的類別劃分模型中;通過(guò)所述類別劃分模型將所述用戶劃分到相應(yīng)類別。
9.如權(quán)利要求6所述的系統(tǒng),其特征在于,還包括: 劃分模型訓(xùn)練模塊,用于對(duì)于從網(wǎng)站的用戶中選取出的每個(gè)訓(xùn)練用戶,統(tǒng)計(jì)該訓(xùn)練用戶的用戶行為屬性特征和用戶社交屬性特征后,融合匯總得到該訓(xùn)練用戶的用戶特征;并根據(jù)該訓(xùn)練用戶的用戶行為屬性特征確定出該訓(xùn)練用戶所屬的行為族群,根據(jù)該訓(xùn)練用戶的用戶社交屬性特征確定出該訓(xùn)練用戶所屬的社交族群,并將該訓(xùn)練用戶所屬的行為族群與社交族群之間共同的族群作為該訓(xùn)練用戶的所屬族群;將每個(gè)訓(xùn)練用戶的所屬族群、用戶特征作為訓(xùn)練數(shù)據(jù),使用所述訓(xùn)練數(shù)據(jù)運(yùn)用預(yù)置的多標(biāo)簽多分類算法進(jìn)行模型訓(xùn)練,得到類別劃分模型。
10.一種廣告投放系統(tǒng),其特征在于,包括: 如權(quán)利要求7-9任一所述的用戶數(shù)據(jù)獲取模塊、屬性特征抽取模塊、用戶類別劃分模塊; 網(wǎng)頁(yè)請(qǐng)求接收模塊,用于接收用戶的訪問(wèn)請(qǐng)求后,獲取用戶的cookieID以及對(duì)應(yīng)的WD,并發(fā)送至所述用戶數(shù)據(jù)獲取模塊; 廣告查詢模塊,用于將所述用戶類別劃分模塊輸出的用戶的類別劃分結(jié)果作為搜索關(guān)鍵詞,查找出與所述搜索關(guān)鍵詞相匹配的廣告內(nèi)容; 請(qǐng)求處理模塊,用于在所述訪問(wèn)請(qǐng)求所請(qǐng)求的網(wǎng)頁(yè)的廣告播放欄中插入所述廣告查詢模塊查找出的廣告內(nèi)容后,將所述網(wǎng)頁(yè)向所述用戶返回; 所述用戶數(shù)據(jù)獲取模塊具體用于根據(jù)用戶的cookieID以及對(duì)應(yīng)的WD,獲取設(shè)定周期內(nèi)用戶的用戶行為數(shù)據(jù)、以及用戶社交數(shù)據(jù)并輸出。
【文檔編號(hào)】G06F17/30GK104298719SQ201410492126
【公開(kāi)日】2015年1月21日 申請(qǐng)日期:2014年9月23日 優(yōu)先權(quán)日:2014年9月23日
【發(fā)明者】方慶安, 潘偉, 白彥冰, 彭琨 申請(qǐng)人:新浪網(wǎng)技術(shù)(中國(guó))有限公司