個體用戶畫像方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明實施例提供一種個體用戶畫像方法,包括:基于包括標(biāo)簽、屬性、標(biāo)簽和屬性之間的推導(dǎo)規(guī)則以及所述推導(dǎo)規(guī)則的邏輯強度值的標(biāo)簽規(guī)則庫,檢測用戶行為,為所述用戶打上各種標(biāo)簽;根據(jù)一段時間內(nèi)為用戶打上的每一種標(biāo)簽的數(shù)量和/或時效性、利用推導(dǎo)規(guī)則從標(biāo)簽推導(dǎo)出的屬性、推導(dǎo)規(guī)則的邏輯強度值,確定每一種標(biāo)簽推導(dǎo)出的各種屬性的參考值;將其中一種標(biāo)簽推導(dǎo)出的其中一種屬性的參考值與預(yù)定閾值進行對比,判斷是否能夠確定用戶屬性包含其中一種屬性,若否,則連同對應(yīng)于其中一種屬性的其他標(biāo)簽共同判斷是否能夠確定其中一種屬性;根據(jù)所確定的用戶屬性,完成用戶畫像。本發(fā)明還提出了一種個體用戶畫像系統(tǒng)。能有效提高用戶畫像的精準(zhǔn)度。
【專利說明】
個體用戶畫像方法和系統(tǒng)
技術(shù)領(lǐng)域
[0001]本發(fā)明實施例涉及用戶畫像的領(lǐng)域,尤其涉及一種個體用戶畫像方法和系統(tǒng)。
【背景技術(shù)】
[0002]在互聯(lián)網(wǎng)逐漸步入大數(shù)據(jù)時代后,消費者的一切行為在企業(yè)面前似乎都將是“可視化”的。企業(yè)的專注點日也開始益聚焦于怎樣利用大數(shù)據(jù)來為精準(zhǔn)地向用戶提供服務(wù)。于是,“用戶畫像”也就應(yīng)運而生了。
[0003]用戶畫像,即用戶信息標(biāo)簽化,就是通過收集與分析用戶社會屬性、生活習(xí)慣、行為等主要信息的數(shù)據(jù)之后,完美地抽象出一個用戶的全貌。用戶畫像為企業(yè)提供了足夠的信息基礎(chǔ),能夠幫助企業(yè)快速找到精準(zhǔn)用戶群體以及用戶需求等更為廣泛的反饋信息。其中,屬性是進行用戶畫像所需要統(tǒng)計的維度,如性別下的男和女,年齡下的少年、青年、中年、老年,收入等級下的貧困,中低,中等,富裕等。
[0004]現(xiàn)有技術(shù)中用戶畫像方法主要有兩種:通過用戶的注冊信息直接畫出用戶畫像的方法;對用戶的行為進行監(jiān)測,而后為用戶打上各種標(biāo)簽,后臺工作人員利用個人經(jīng)驗對所有標(biāo)簽進行分析推導(dǎo)得出用戶畫像的方法。
[0005]關(guān)于前一種方法,存在以下缺點:目前很多的網(wǎng)站/媒體的訪問并不需要提前注冊,故這些網(wǎng)站/媒體也并不清楚當(dāng)前用戶的屬性;另外,有些用戶也不愿意注冊用戶信息,即使用戶注冊了信息,也很難保證注冊信息的準(zhǔn)確性(比如,涉及用戶的個人隱私、時間因素等),這樣就很難得到準(zhǔn)確的用戶畫像。
[0006]對于后一種方法,存在以下缺點:過于依賴后臺工作人員個人因素會導(dǎo)致得到的用戶畫像結(jié)果的差異性很大,同時也很難避免噪音標(biāo)簽對用戶畫像的干擾,而且也沒有考慮到標(biāo)簽的時效性,導(dǎo)致最終得到的用戶畫像不夠精確。
【發(fā)明內(nèi)容】
[0007]本發(fā)明實施例提供一種個體用戶畫像方法,用以解決現(xiàn)有技術(shù)中用戶畫像不夠精確的技術(shù)問題。
[0008]本發(fā)明一方面提出了一種個體用戶畫像方法,包括:
[0009]基于包括標(biāo)簽、屬性、標(biāo)簽和屬性之間的推導(dǎo)規(guī)則以及所述推導(dǎo)規(guī)則的邏輯強度值的標(biāo)簽規(guī)則庫,檢測用戶行為以確定用戶屬性,包括:
[0010]-檢測用戶行為,為所述用戶打上各種標(biāo)簽;
[0011]-根據(jù)一段時間內(nèi)為用戶打上的每一種標(biāo)簽的數(shù)量和/或時效性、利用推導(dǎo)規(guī)則從標(biāo)簽推導(dǎo)出的屬性、推導(dǎo)規(guī)則的邏輯強度值,確定每一種標(biāo)簽推導(dǎo)出的各種屬性的參考值;
[0012]-將其中一種標(biāo)簽推導(dǎo)出的其中一種屬性的參考值與預(yù)定閾值進行對比,判斷是否能夠確定用戶屬性包含所述其中一種屬性,若否,則利用所述參考值連同其他標(biāo)簽下的對應(yīng)于所述其中一種屬性的參考值共同判斷是否能夠確定用戶屬性包含所述其中一種屬性;
[0013]根據(jù)所確定的用戶屬性,完成用戶畫像。
[0014]本發(fā)明一實施例提供一種個體用戶畫像系統(tǒng),包括:
[0015]行為檢測單元,配置以:基于包括標(biāo)簽、屬性、標(biāo)簽和屬性之間的推導(dǎo)規(guī)則以及所述推導(dǎo)規(guī)則的邏輯強度值的標(biāo)簽規(guī)則庫,檢測用戶行為,為所述用戶打上各種標(biāo)簽;
[0016]屬性預(yù)估單元,配置以:根據(jù)一段時間內(nèi)為用戶打上的每一種標(biāo)簽的數(shù)量和/或時效性、利用推導(dǎo)規(guī)則從標(biāo)簽推導(dǎo)出的屬性、推導(dǎo)規(guī)則的邏輯強度值,確定每一種標(biāo)簽推導(dǎo)出的各種屬性的參考值;
[0017]屬性確定單元,配置以:將其中一種標(biāo)簽推導(dǎo)出的其中一種屬性的參考值與預(yù)定閾值進行對比,判斷是否能夠確定用戶屬性包含所述其中一種屬性,若否,則利用所述參考值連同其他標(biāo)簽下的對應(yīng)于所述其中一種屬性的參考值共同判斷是否能夠確定用戶屬性包含所述其中一種屬性;
[0018]用戶畫像生成單元,配置以:根據(jù)所確定的用戶屬性,完成用戶畫像。
[0019]本發(fā)明實施例提出了一套通過為用戶打標(biāo)簽進而確定屬性的方法及系統(tǒng),避免了因個人差異為用戶畫像而造成的差異;既保證了所有標(biāo)簽共同作用,又避免了因噪音標(biāo)簽對個體用戶畫像產(chǎn)生的誤差,提高了個體用戶畫像的精確性。
【附圖說明】
[0020]為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0021]圖1示出了本發(fā)明一實施例的個體用戶畫像方法的流程圖;
[0022]圖2示出了圖1中方法中的步驟S103的一種【具體實施方式】的詳細執(zhí)行圖;
[0023]圖3示出了本發(fā)明一實施例的個體用戶畫像系統(tǒng)的示意圖;
【具體實施方式】
[0024]為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0025]參見圖1,示出的是本發(fā)明一具體實施例的個體用戶畫像方法的流程圖,所述方法包括:
[0026]基于標(biāo)簽規(guī)則庫,檢測用戶行為以確定用戶屬性,包括:
[0027]SlOl:基于包括標(biāo)簽、屬性、標(biāo)簽和屬性之間的推導(dǎo)規(guī)則以及所述推導(dǎo)規(guī)則的邏輯強度值的標(biāo)簽規(guī)則庫,檢測用戶行為,為所述用戶打上各種標(biāo)簽;
[0028]S102:根據(jù)一段時間內(nèi)為用戶打上的每一種標(biāo)簽的數(shù)量和/或時效性、利用推導(dǎo)規(guī)則從標(biāo)簽推導(dǎo)出的屬性、推導(dǎo)規(guī)則的邏輯強度值,確定每一種標(biāo)簽推導(dǎo)出的各種屬性的參考值;
[0029]S103:將其中一種標(biāo)簽推導(dǎo)出的其中一種屬性的參考值與預(yù)定閾值進行對比,判斷是否能夠確定用戶屬性包含所述其中一種屬性,若否,則利用所述參考值連同其他標(biāo)簽下的對應(yīng)于所述其中一種屬性的參考值共同判斷是否能夠確定用戶屬性包含所述其中一種屬性;
[0030]S104:根據(jù)所確定的用戶屬性,完成用戶畫像。
[0031]關(guān)于標(biāo)簽的時效性的確定具體包括:統(tǒng)計一段時間內(nèi)為用戶打上的其中一種標(biāo)簽的各個標(biāo)簽的生成時間,并以此來判斷所述其中一種標(biāo)簽的各個標(biāo)簽的時效性。
[0032]將標(biāo)簽的時效性也作為用戶屬性的參考值的一個參考條件,使得所得的屬性的參考值更加的精確,進一步地在利用屬性參考值與閾值進行對比而確定用戶屬性時,使得所確定的用戶屬性更加精確。
[0033]作為圖1所示實施例方法的進一步優(yōu)化,圖1所示的實施例方法的S104步驟之后還包括:
[0034]在完成用戶畫像后,根據(jù)用戶畫像為用戶進行個性化信息推送,并基于標(biāo)簽規(guī)則庫,繼續(xù)檢測用戶在收到所述個性化信息推送后的行為以重新確定用戶屬性。
[0035]基于用戶畫像為用戶進行個性化信息推送,根據(jù)用戶對個性化信息推送反饋的用戶行為,重新確定用戶屬性,實現(xiàn)了對用戶屬性和用戶畫像的校準(zhǔn),同時也避免了對用戶信息推送的一成不變。
[0036]繼續(xù)參照圖2,作為圖1所示實施例方法的進一步優(yōu)化,關(guān)于圖1中的步驟S103的執(zhí)行,可以包括如下子步驟:
[0037]S1031:將第一標(biāo)簽推導(dǎo)出的其中一種屬性的第一參考值與預(yù)定閾值進行對比,當(dāng)?shù)谝粎⒖贾荡笥陂撝禃r,則確定用戶屬性包含所述其中一種屬性,當(dāng)?shù)谝粎⒖贾挡淮笥陂撝禃r,則不確定用戶屬性包含所述其中一種屬性;
[0038]S1032:將所述第一參考值與第二標(biāo)簽下的對應(yīng)于所述其中一種屬性的第二參考值加權(quán)求和,將所述加權(quán)求和所得的值與預(yù)定閾值進行對比,當(dāng)所述加權(quán)求和所得的值大于閾值時,則確定用戶屬性包含所述其中一種屬性,當(dāng)所述加權(quán)求和所得的值不大于閾值時,則不確定用戶屬性包含所述其中一種屬性;
[0039]S1033:依次類推,直到能夠確定用戶屬性包含所述其中一種屬性。
[0040]當(dāng)對用戶的其中一種標(biāo)簽進行推導(dǎo)就可以確定用戶屬性時,則無需再對其他標(biāo)簽進行推導(dǎo)計算,降低了用戶畫像對服務(wù)器資源的消耗;當(dāng)對用戶的其中一個標(biāo)簽進行推導(dǎo)無法確定用戶屬性時,可以結(jié)合其他標(biāo)簽共同對用戶屬性進行推導(dǎo),提高了所確定的用戶屬性的精確度。
[0041]在本發(fā)明方法的一種實施方式中,每一種標(biāo)簽推導(dǎo)出的各種屬性的參考值以邏輯值為基準(zhǔn),并與一段時間內(nèi)標(biāo)簽的數(shù)量和標(biāo)簽的時效性成正比。
[0042]在本發(fā)明方法的一種實施方式中,關(guān)于S103步驟的具體實現(xiàn)過程還可以包括:
[0043]將第一標(biāo)簽推導(dǎo)出的其中一種屬性的第一參考值與預(yù)定閾值進行對比,當(dāng)?shù)谝粎⒖贾荡笥陂撝禃r,則確定用戶屬性包含所述其中一種屬性,當(dāng)?shù)谝粎⒖贾挡淮笥陂撝禃r,則不確定用戶屬性包含所述其中一種屬性;例如:第一標(biāo)簽為“化妝品”,由標(biāo)簽“化妝品”所推導(dǎo)的其中一種屬性為女性,若用戶的標(biāo)簽“化妝品”的參考值大于預(yù)定閾值,則確定用戶為女性。
[0044]當(dāng)對應(yīng)于其中一種屬性的第一標(biāo)簽的參考值小于或等于閾值時,則將所有對應(yīng)于所述其中一種屬性的標(biāo)簽對應(yīng)于所述其中一種屬性的各個參考值依次加權(quán)迭代相加,直至所述各個參考值加權(quán)迭代相加所得的參考迭代值超過預(yù)定閾值時,則確定用戶包含的所述其中一種屬性,示例性地,當(dāng)對應(yīng)于用戶性別下的女性的標(biāo)簽“化妝品”的參考值小于或等于閾值時,則引入用戶的同樣對應(yīng)于女性的標(biāo)簽“裙子”作為第二標(biāo)簽,對“裙子”相對應(yīng)于女性的參考值進行加權(quán),例如對屬性的第二標(biāo)簽設(shè)置權(quán)重為0.5,將第二標(biāo)簽“裙子”相對應(yīng)于女性的參考值乘以第二標(biāo)簽所對應(yīng)的權(quán)重0.5,并將所得的值與“化妝品”進行求和相加,得到用戶相對應(yīng)于用戶性別下女性的屬性參考疊加值,再將所得的屬性參考疊加值與預(yù)定閾值進行對比,當(dāng)屬性參考疊加值大于預(yù)定閾值時,則由第一標(biāo)簽“化妝品”和第二標(biāo)簽“裙子”共同確定該項屬性女性;當(dāng)屬性參考疊加值仍小于預(yù)定閾值時,則再引入用戶的與女性相對應(yīng)的一個新的標(biāo)簽“青春偶像劇”作為第三標(biāo)簽,并將第三標(biāo)簽“青春偶像劇”對應(yīng)于女性的參考值加權(quán)并累加至屬性參考疊加值中,例如對屬性的第三標(biāo)簽設(shè)置權(quán)重為0.25,貝1J“青春偶像劇”作為用戶性別下的女性的第三標(biāo)簽,相對應(yīng)于女性的參考值乘以第三標(biāo)簽所對應(yīng)的權(quán)重0.25,并將所得的值與屬性參考疊加值進行求和相加,由此更新了屬性參考疊加值,進一步地將所得的屬性可參考疊加值與預(yù)定閾值進行對比,若此時的屬性參考疊加值大于預(yù)定閾值,則由第一標(biāo)簽“化妝品”、第二標(biāo)簽“裙子”和第三標(biāo)簽“青春偶像劇”共同確定屬性,且確定用戶為女性;若屬性參考疊加值仍小于預(yù)定閾值,則依次類推,引入用戶的對應(yīng)于女性的新的標(biāo)簽作為第四標(biāo)簽、第五標(biāo)簽…,直到所述各標(biāo)簽的參照值加權(quán)求和所得的值大于閾值,則確定用戶為女性,同時用戶的屬性由上述第一、第二、第三、第四標(biāo)簽…多個標(biāo)簽共同推理得出;在本發(fā)明方法的另一種實施方式中,相對應(yīng)于屬性的第一、第二、第三、第四標(biāo)簽…等各個標(biāo)簽的權(quán)重也可以均為1,關(guān)于屬性的具體推導(dǎo)過程可參照上述屬性為女性的推導(dǎo)過程,故在此不再贅述。
[0045]在本發(fā)明方法的一種實施方式中,在SlOl步驟之前,還包括建立標(biāo)簽規(guī)則庫:提供標(biāo)簽、屬性、以及標(biāo)簽和屬性之間的推導(dǎo)規(guī)則;根據(jù)所述標(biāo)簽和屬性之間的推導(dǎo)規(guī)則的強弱設(shè)置相應(yīng)的邏輯強度值;具體可以包括如下子步驟:
[0046]建立標(biāo)簽群;
[0047]在本發(fā)明一種實施例中,標(biāo)簽群還可以是由多個子標(biāo)簽群構(gòu)成,不同的子標(biāo)簽群與不同維度的屬性相對應(yīng),例如:用戶年齡子標(biāo)簽群與用戶年齡維度屬性相對應(yīng)、用戶收入等級子標(biāo)簽群與用戶收入等級維度屬性相對應(yīng)、用戶消費等級子標(biāo)簽群與用戶消費等級維度屬性相對應(yīng)、用戶消費喜好子標(biāo)簽群與用戶消費喜好維度屬性相對應(yīng)等,由用戶各個不同維度的屬性共同構(gòu)成了用戶畫像。
[0048]所述推導(dǎo)規(guī)則群包括推導(dǎo)規(guī)則、利用推導(dǎo)規(guī)則從標(biāo)簽推導(dǎo)出的屬性、推導(dǎo)規(guī)則的邏輯強度值;
[0049]建立推導(dǎo)規(guī)則群,包括:
[0050]釋義所述標(biāo)簽群中的各個標(biāo)簽,獲得與各個標(biāo)簽的邏輯釋義相接近的匹配屬性;
[0051]分析各個標(biāo)簽和匹配屬性之間的邏輯強度,并為各個標(biāo)簽與匹配屬性之間的邏輯強度賦予與所述邏輯強度相對應(yīng)的邏輯強度值;
[0052]將各個邏輯強度值以各個相應(yīng)的標(biāo)簽和所述匹配屬性為key作為推導(dǎo)規(guī)則存儲于推導(dǎo)規(guī)則群中。
[0053]通過分析標(biāo)簽與匹配屬性之間的邏輯強度,將匹配屬性與標(biāo)簽之間的邏輯強度做量化處理,并得到能反映邏輯強度的量化值,將此量化值作為邏輯強度值并相對應(yīng)于標(biāo)簽和匹配屬性存儲于推導(dǎo)規(guī)則群中;由此建立的標(biāo)簽規(guī)則庫應(yīng)用于用戶畫像中,避免了因個人差異為用戶畫像而造成的差異。
[0054]在本發(fā)明的一種實施方式中,標(biāo)簽對應(yīng)著用戶行為,由于用戶在各個數(shù)據(jù)源對應(yīng)的網(wǎng)頁上執(zhí)行諸如瀏覽產(chǎn)品操作、購買產(chǎn)品操作、關(guān)注產(chǎn)品操作或收藏產(chǎn)品操作時,均可觸發(fā)日志信息的生成,相應(yīng)地日志信息的生成時間用于說明用戶執(zhí)行上述諸如瀏覽產(chǎn)品操作、購買產(chǎn)品操作、關(guān)注產(chǎn)品操作或收藏產(chǎn)品操作所對應(yīng)的時間;針對上述用戶行為的情形,可以選擇將產(chǎn)品信息或產(chǎn)品的分類信息作為用戶行為相匹配的標(biāo)簽,例如當(dāng)用戶經(jīng)常瀏覽數(shù)碼產(chǎn)品類網(wǎng)站,則可以為用戶打上“數(shù)碼”這一標(biāo)簽。
[0055]作為圖1所示實施例方法的進一步優(yōu)化,關(guān)于圖1中的步驟S102的執(zhí)行,可以包括如下子步驟:
[0056]統(tǒng)計一段時間內(nèi)為用戶打上的其中一種標(biāo)簽的數(shù)量;
[0057]以所述其中一種標(biāo)簽為key遍歷標(biāo)簽規(guī)則庫,獲取包含所述標(biāo)簽的各個推導(dǎo)規(guī)貝1J,利用推導(dǎo)規(guī)則從標(biāo)簽推導(dǎo)出的屬性以及推導(dǎo)規(guī)則的邏輯強度值;從所述為用戶打上的一種標(biāo)簽推導(dǎo)得出的屬性的參考值。
[0058]依次類推,獲取從所述為用戶打上的每一種標(biāo)簽推導(dǎo)得出的屬性的參考值。
[0059]將一段時間內(nèi)為用戶打上的標(biāo)簽數(shù)量作為考慮標(biāo)簽參考值的一個參考條件,避免了因噪音標(biāo)簽對個體用戶畫像產(chǎn)生的誤差,即避免了因為用戶失誤操作所生成的標(biāo)簽對用戶畫像的干擾,提高了個體用戶畫像的精確性。
[0060]在本發(fā)明方法的一種實施方式中,關(guān)于參考值的確定可以是:
[0061]現(xiàn)在對個體用戶的性別進行推導(dǎo),需要確定個體用戶相對應(yīng)于性別屬性的參考值;查詢標(biāo)簽規(guī)則庫,根據(jù)標(biāo)簽規(guī)則庫中與性別屬性相對應(yīng)的各種推導(dǎo)規(guī)則,確定在一段時間內(nèi)為用戶打上的標(biāo)簽中與性別屬性相對應(yīng)的各種標(biāo)簽,例如:查詢標(biāo)簽規(guī)則庫與用戶緩存信息,確定用戶在30天內(nèi)生成的標(biāo)簽包含“化妝品”、“裙子”等與性別屬性相對應(yīng)標(biāo)簽;統(tǒng)計各種標(biāo)簽的數(shù)量、生成時間及標(biāo)簽相對應(yīng)于性別的邏輯強度值,例如:根據(jù)標(biāo)簽查詢標(biāo)簽規(guī)則庫,獲取標(biāo)簽所對應(yīng)于性別屬性的邏輯強度值,若標(biāo)簽規(guī)則庫中包含推導(dǎo)規(guī)則及推導(dǎo)規(guī)則的邏輯強度值為“化妝品-女性_7”、“裙子-女性_8”,則確定一種標(biāo)簽“裙子”相對應(yīng)于女性的邏輯強度值為8,確定另一種標(biāo)簽“化妝品”相對應(yīng)于女性的邏輯強度值為7,以此類推,確定用戶生成的標(biāo)簽中對應(yīng)于性別的各種標(biāo)簽的邏輯強度值;根據(jù)與性別屬性相對應(yīng)的各種標(biāo)簽的生成時間,為用戶生成的各種標(biāo)簽賦予與時效性強弱相對應(yīng)的時效權(quán)重,例如:為在10天內(nèi)的標(biāo)簽賦予最高的時效權(quán)重1,為在10-20天內(nèi)生成的標(biāo)簽賦予一般的時效權(quán)重1/2,為20-30天內(nèi)生成的標(biāo)簽賦予最低的時效權(quán)重1/4 ;然后基于用戶標(biāo)簽的數(shù)量為各種標(biāo)簽賦予相應(yīng)的數(shù)量權(quán)重,例如:為標(biāo)簽數(shù)量為1-2的標(biāo)簽賦予最弱的數(shù)量權(quán)重1/4,為標(biāo)簽數(shù)量為3-10的各個標(biāo)簽賦予一般的數(shù)量權(quán)重1/2,為標(biāo)簽數(shù)量為10以上的各種標(biāo)簽賦予最高的數(shù)量權(quán)重I ;基于各種標(biāo)簽的數(shù)量權(quán)重、時效權(quán)重和邏輯強度值,確定各種標(biāo)簽的參考值,例如:將各種標(biāo)簽的數(shù)量權(quán)重、時效權(quán)重和邏輯強度值相乘,由此確定“化妝品”、“裙子”等各種標(biāo)簽相對應(yīng)于性別的參考值。
[0062]本實施例方法的更具體的表現(xiàn)方式包括但不限于:
[0063]檢測用戶行為,為所述用戶打上各種標(biāo)簽;
[0064]統(tǒng)計一段時間為10天內(nèi)為用戶打上的標(biāo)簽“數(shù)碼”的次數(shù)為5次,查詢5次標(biāo)簽“數(shù)碼”每一次標(biāo)簽的生成時間,基于生成時間與當(dāng)前時間的時間差分別確定5次標(biāo)簽“數(shù)碼”每一次標(biāo)簽的時效權(quán)重,其中標(biāo)簽時效權(quán)重的大小與標(biāo)簽的時效性相對應(yīng);例如,當(dāng)標(biāo)簽“數(shù)碼”的生成時間與當(dāng)前時間的時間差小于或等于2天,則為所述標(biāo)簽“數(shù)碼”賦予時效權(quán)重1,當(dāng)標(biāo)簽“數(shù)碼”的生成時間與當(dāng)前時間的時間差大于2天,小于或等于4天時,則為所述標(biāo)簽賦予時效權(quán)重1/2,當(dāng)標(biāo)簽“數(shù)碼”的生成時間與當(dāng)前時間的時間差大于4天,小于或等于6天時,則為此次標(biāo)簽賦予時效權(quán)重1/4,依次類推,獲得5次標(biāo)簽“數(shù)碼”每一次標(biāo)簽的時效權(quán)重;
[0065]以標(biāo)簽“數(shù)碼”為key遍歷標(biāo)簽規(guī)則庫,獲取包含標(biāo)簽的各個推導(dǎo)規(guī)則,利用推導(dǎo)規(guī)則從標(biāo)簽推導(dǎo)出的屬性以及推導(dǎo)規(guī)則的邏輯強度值;由此得到了關(guān)于標(biāo)簽“數(shù)碼”的各個推導(dǎo)規(guī)則,包含:“數(shù)碼-男性_7”、“數(shù)碼-青年-8”…
[0066]其中標(biāo)簽“數(shù)碼”的參考值與每次標(biāo)簽“數(shù)碼”的時效權(quán)重、標(biāo)簽“數(shù)碼”在不同時間段的數(shù)量和標(biāo)簽“數(shù)碼”的邏輯強度值有關(guān),例如:標(biāo)簽“數(shù)碼”的參考值與每次標(biāo)簽“數(shù)碼”的時效權(quán)重、標(biāo)簽“數(shù)碼”在不同時間段的頻次成正比,標(biāo)簽“數(shù)碼”所對應(yīng)的邏輯強度值參考于標(biāo)簽規(guī)則庫,標(biāo)簽“數(shù)碼”所對應(yīng)的邏輯強度值為一確定的值;由此,依次類推,獲得10天內(nèi)用戶所有的標(biāo)簽所對應(yīng)的屬性的參考值;
[0067]獲取對應(yīng)于用戶性別屬性的所有標(biāo)簽及標(biāo)簽所對應(yīng)的參考值,例如獲取對應(yīng)于用戶性別男性的還有“軍事” “科技論壇”等標(biāo)簽,相應(yīng)地獲取“軍事” “科技論壇”等標(biāo)簽的參考值;比較“數(shù)碼”所推導(dǎo)出的用戶性別男性的參考值與預(yù)定閾值的大??;當(dāng)“數(shù)碼”所對應(yīng)的參考值大于預(yù)定閾值時,則確定用戶性別為男性,當(dāng)“數(shù)碼”所對應(yīng)的參考值小于預(yù)定閾值時,則可借鑒“軍事”“科技論壇”等標(biāo)簽的參考值與預(yù)定閾值的比較來確定用戶性別為男性;
[0068]當(dāng)對應(yīng)于用戶性別下的男性的標(biāo)簽“數(shù)碼”的參考值小于或等于閾值時,則引入用戶的同樣對應(yīng)于男性的標(biāo)簽“軍事”作為第二標(biāo)簽,對“軍事”相對應(yīng)于男性的參考值進行加權(quán),例如對屬性的第二標(biāo)簽設(shè)置權(quán)重為0.5,則將第二標(biāo)簽“軍事”相對應(yīng)于男性的參考值乘以第二標(biāo)簽所對應(yīng)的權(quán)重0.5,并將所得的值與“數(shù)碼”進行求和相加,得到用戶相對應(yīng)與用戶性別下男性的屬性參考疊加值,再將所得的屬性參考疊加值與預(yù)定閾值進行對比,當(dāng)屬性參考疊加值大于預(yù)定閾值時,則由第一標(biāo)簽“數(shù)碼”和第二標(biāo)簽“軍事”共同確定該項屬性男性;當(dāng)屬性參考疊加值仍小于預(yù)定閾值時,則再引入用戶的與男性相對應(yīng)的一個新的標(biāo)簽“科技論壇”作為第三標(biāo)簽,并將第三標(biāo)簽“科技論壇”對應(yīng)于男性的參考值加權(quán)并累加至屬性參考疊加值中,例如對屬性的第三標(biāo)簽設(shè)置權(quán)重為0.25,則“科技論壇”作為用戶性別下的男性的第三標(biāo)簽,相對應(yīng)于男性的參考值乘以第三標(biāo)簽所對應(yīng)的權(quán)重0.25,并將所得的值與屬性參考疊加值進行求和相加,由此更新了屬性參考疊加值,進一步地將所得的屬性可參考疊加值與預(yù)定閾值進行對比,若此時的屬性參考疊加值大于預(yù)定閾值,則由第一標(biāo)簽“數(shù)碼”、第二標(biāo)簽“軍事”和第三標(biāo)簽“科技論壇”共同確定屬性,且確定用戶為男性;若屬性參考疊加值仍小于預(yù)定閾值,則依次類推,引入用戶的對應(yīng)于男性的新的標(biāo)簽作為第四標(biāo)簽、第五標(biāo)簽…,直到所述各標(biāo)簽的參照值加權(quán)求和所得的值大于閾值,則確定用戶為男性,同時用戶的屬性由上述第一、第二、第三、第四標(biāo)簽…多個標(biāo)簽共同推理得出。
[0069]以此類推,統(tǒng)計用戶的各個維度的用戶屬性,例如,用戶的消費水平的高低,用戶學(xué)歷等級的本科或本科以上學(xué)歷或本科以下學(xué)歷,進一步地由用戶的各個維度的用戶屬性構(gòu)建成用戶的用戶畫像。
[0070]在一種情況下,當(dāng)對應(yīng)于同一屬性的所有標(biāo)簽對應(yīng)于該項屬性的參考值之和仍小于預(yù)定閾值時,則通過用戶屬性挖掘模型對對應(yīng)于屬性的所有標(biāo)簽進行計算推導(dǎo),最終得到屬性;常用的用戶屬性挖掘模型有svm、貝葉斯、聚類、加權(quán)平均等各種算法模型。
[0071]—種實施方式下預(yù)定閾值的確定過程可以是根據(jù)實驗或經(jīng)驗推導(dǎo)獲取的,例如:經(jīng)過多次實驗推導(dǎo)可知,當(dāng)標(biāo)簽“數(shù)碼”的參考值大于實驗值時,便可確定出用戶的性別屬性為男性;當(dāng)標(biāo)簽“數(shù)碼”的參考值小于或等于實驗值時,則無法確定用戶的性別屬性為男性,由此設(shè)置此實驗值為閾值;
[0072]本發(fā)明提供一種解決思路,主要在于:首先建立一個標(biāo)簽規(guī)則庫,標(biāo)簽規(guī)則庫里存儲有用戶行為與用戶標(biāo)簽相對應(yīng)的規(guī)則(例如:當(dāng)用戶行為經(jīng)常瀏覽化妝品類網(wǎng)站,則可為用戶打一標(biāo)簽為“化妝品”,可推導(dǎo)出用戶性別為女性;當(dāng)用戶行為為各種奶粉品牌時,則可為用戶打另一標(biāo)簽為“奶粉”時,可推導(dǎo)用戶年齡為中年);推導(dǎo)規(guī)則不一定完全準(zhǔn)確,但要符合邏輯,并根據(jù)推導(dǎo)規(guī)則邏輯性的強弱為推導(dǎo)規(guī)則設(shè)定相對應(yīng)于用戶標(biāo)簽的邏輯強度值;之后根據(jù)每個用戶的行為為其打上相應(yīng)的標(biāo)簽,標(biāo)簽是可以重復(fù)打,同時標(biāo)簽越新其時效性越好;可以基于用戶緩存,統(tǒng)計用戶身上每種標(biāo)簽的個數(shù),時效性和邏輯強度值并推導(dǎo)計算出標(biāo)簽相對于屬性的屬性的參考值;當(dāng)屬性的參考值大于預(yù)定閾值時,則確定該項屬性。當(dāng)屬性的參考值小于或等于預(yù)定閾值時,則該項屬性則由多個標(biāo)簽共同確定。
[0073]本發(fā)明實施例提出了一套通過打標(biāo)簽推導(dǎo)屬性的方法,避免了因個人差異為用戶畫像而造成的差異;既保證了所有標(biāo)簽共同作用,又避免了因噪音標(biāo)簽對畫像產(chǎn)生的誤差;通過定期針對用戶標(biāo)簽重新確定屬性值,由此確保了用戶畫像的精確性,進一步避免了個性化信息推送的一成不變。
[0074]其中上述圖1的方法,可以根據(jù)本發(fā)明的下述系統(tǒng)(參照圖3)予以操作來實現(xiàn)。
[0075]行為檢測單元,配置以:基于包括標(biāo)簽、屬性、標(biāo)簽和屬性之間的推導(dǎo)規(guī)則以及所述推導(dǎo)規(guī)則的邏輯強度值的標(biāo)簽規(guī)則庫,檢測用戶行為,為所述用戶打上各種標(biāo)簽;
[0076]屬性預(yù)估單元,配置以:根據(jù)一段時間內(nèi)為用戶打上的每一種標(biāo)簽的數(shù)量、利用推導(dǎo)規(guī)則從標(biāo)簽推導(dǎo)出的屬性、推導(dǎo)規(guī)則的邏輯強度值,確定每一種標(biāo)簽推導(dǎo)出的各種屬性的參考值;
[0077]屬性確定單元,配置以:將其中一種標(biāo)簽推導(dǎo)出的其中一種屬性的參考值與預(yù)定閾值進行對比,判斷是否能夠確定用戶屬性包含所述其中一種屬性,若否,則利用所述參考值連同其他標(biāo)簽下的對應(yīng)于所述其中一種屬性的參考值共同判斷是否能夠確定用戶屬性包含所述其中一種屬性;
[0078]用戶畫像生成單元,配置以:根據(jù)所確定的用戶屬性,完成用戶畫像。
[0079]作為圖3所示實施例系統(tǒng)的進一步優(yōu)化,屬性確定單元,其具體的工作方式可以是配置以:
[0080]將第一標(biāo)簽推導(dǎo)出的其中一種屬性的第一參考值與預(yù)定閾值進行對比,當(dāng)?shù)谝粎⒖贾荡笥陂撝禃r,則確定用戶屬性包含所述其中一種屬性,當(dāng)?shù)谝粎⒖贾挡淮笥陂撝禃r,則不確定用戶屬性包含所述其中一種屬性;將所述第一參考值與第二標(biāo)簽下的對應(yīng)于所述其中一種屬性的第二參考值加權(quán)求和,將所述加權(quán)求和所得的值與預(yù)定閾值進行對比,當(dāng)所述加權(quán)求和所得的值大于閾值時,則確定用戶屬性包含所述其中一種屬性,當(dāng)所述加權(quán)求和所得的值不大于閾值時,則不確定用戶屬性包含所述其中一種屬性;依次類推,直到能夠確定用戶屬性包含所述其中一種屬性。
[0081]當(dāng)對用戶的其中一種標(biāo)簽進行推導(dǎo)就可以確定用戶屬性時,則無需再對其他標(biāo)簽進行推導(dǎo)計算,降低了用戶畫像對服務(wù)器資源的消耗;當(dāng)對用戶的其中一個標(biāo)簽進行推導(dǎo)無法確定用戶屬性時,可以結(jié)合其他標(biāo)簽共同對用戶屬性進行推導(dǎo),提高了所確定的用戶屬性的精確度。
[0082]作為圖3所示實施例系統(tǒng)的進一步優(yōu)化,所述系統(tǒng)還包括標(biāo)簽規(guī)則庫建立單元,所述標(biāo)簽規(guī)則庫建立單元配置以:提供標(biāo)簽、屬性、以及標(biāo)簽和屬性之間的推導(dǎo)規(guī)則;根據(jù)所述標(biāo)簽和屬性之間的推導(dǎo)規(guī)則的強弱設(shè)置相應(yīng)的邏輯強度值;
[0083]所述標(biāo)簽規(guī)則庫建立單元包括:
[0084]標(biāo)簽群建立模塊,所述標(biāo)簽群建立模塊配置以:
[0085]建立標(biāo)簽群;
[0086]推導(dǎo)規(guī)則群建立模塊,所述推導(dǎo)規(guī)則群建立模塊配置以:
[0087]建立推導(dǎo)規(guī)則群,所述推導(dǎo)規(guī)則群包括推導(dǎo)規(guī)則、利用推導(dǎo)規(guī)則從標(biāo)簽推導(dǎo)出的屬性、推導(dǎo)規(guī)則的邏輯強度值,包括:
[0088]釋義所述標(biāo)簽群中的各個標(biāo)簽,獲得與各個標(biāo)簽的邏輯釋義相接近的匹配屬性,分析各個標(biāo)簽和匹配屬性之間的邏輯強度,并為各個標(biāo)簽與匹配屬性之間的邏輯強度賦予與所述邏輯強度相對應(yīng)的邏輯強度值,將各個邏輯強度值以各個相應(yīng)的標(biāo)簽和所述匹配屬性為key作為推導(dǎo)規(guī)則存儲于推導(dǎo)規(guī)則群中。
[0089]通過分析標(biāo)簽與匹配屬性之間的邏輯強度,將匹配屬性與標(biāo)簽之間的邏輯強度做量化處理,并得到能反映邏輯強度的量化值,將此量化值作為邏輯強度值并相對應(yīng)于標(biāo)簽和匹配屬性存儲于推導(dǎo)規(guī)則群中;由此建立的標(biāo)簽規(guī)則庫應(yīng)用于用戶畫像中,避免了因個人差異為用戶畫像而造成的差異。
[0090]作為圖3所示實施例系統(tǒng)的進一步優(yōu)化,在所述用戶畫像生成單元后還包括信息推送單元,配置以:在完成用戶畫像后,根據(jù)用戶畫像為用戶進行個性化信息推送,并基于標(biāo)簽規(guī)則庫,繼續(xù)檢測用戶在收到所述個性化信息推送后的行為以重新確定用戶屬性。
[0091]基于用戶畫像為用戶進行個性化信息推送,根據(jù)用戶對個性化信息推送反饋的用戶行為,重新確定用戶屬性,實現(xiàn)了對用戶屬性和用戶畫像的校準(zhǔn),同時也避免了對用戶信息推送的一成不變。
[0092]在本發(fā)明一方面的應(yīng)用上,本發(fā)明實施例中的個體用戶畫像系統(tǒng)可以是作為功能元件的形式內(nèi)嵌于網(wǎng)站服務(wù)器中;作為本發(fā)明的另一方面的應(yīng)用,本發(fā)明實施例中的個體用戶畫像系統(tǒng)還可以內(nèi)嵌于云計算服務(wù)器中,此云計算服務(wù)器連接于網(wǎng)站服務(wù)器和用戶終端之間。
[0093]以上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性的勞動的情況下,即可以理解并實施。
[0094]通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到各實施方式可借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當(dāng)然也可以通過硬件?;谶@樣的理解,上述技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品可以存儲在計算機可讀存儲介質(zhì)中,如R0M/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行各個實施例或者實施例的某些部分所述的方法。
[0095]最后應(yīng)說明的是:以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精神和范圍。
【主權(quán)項】
1.一種個體用戶畫像方法,包括: 基于包括標(biāo)簽、屬性、標(biāo)簽和屬性之間的推導(dǎo)規(guī)則以及所述推導(dǎo)規(guī)則的邏輯強度值的標(biāo)簽規(guī)則庫,檢測用戶行為以確定用戶屬性,包括: -檢測用戶行為,為所述用戶打上各種標(biāo)簽; -根據(jù)一段時間內(nèi)為用戶打上的每一種標(biāo)簽的數(shù)量和/或時效性、利用推導(dǎo)規(guī)則從標(biāo)簽推導(dǎo)出的屬性、推導(dǎo)規(guī)則的邏輯強度值,確定每一種標(biāo)簽推導(dǎo)出的各種屬性的參考值; -將其中一種標(biāo)簽推導(dǎo)出的其中一種屬性的參考值與預(yù)定閾值進行對比,判斷是否能夠確定用戶屬性包含所述其中一種屬性,若否,則利用所述參考值連同其他標(biāo)簽下的對應(yīng)于所述其中一種屬性的參考值共同判斷是否能夠確定用戶屬性包含所述其中一種屬性; 根據(jù)所確定的用戶屬性,完成用戶畫像。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將其中一種標(biāo)簽推導(dǎo)出的其中一種屬性的參考值與預(yù)定閾值進行對比,判斷是否能夠確定用戶屬性包含所述其中一種屬性,若否,則利用所述參考值連同其他標(biāo)簽下的對應(yīng)于所述其中一種屬性的參考值共同判斷是否能夠確定用戶屬性包含所述其中一種屬性包括: 將第一標(biāo)簽推導(dǎo)出的其中一種屬性的第一參考值與預(yù)定閾值進行對比,當(dāng)?shù)谝粎⒖贾荡笥陂撝禃r,則確定用戶屬性包含所述其中一種屬性,當(dāng)?shù)谝粎⒖贾挡淮笥陂撝禃r,則不確定用戶屬性包含所述其中一種屬性; 當(dāng)基于所述第一參考值不確定用戶屬性包含所述其中一種屬性時,利用所述第一參考值連同第二標(biāo)簽下的對應(yīng)于所述其中一種屬性的第二參考值加權(quán)求和所得的值與預(yù)定閾值進行對比,當(dāng)?shù)谝粎⒖贾岛偷诙⒖贾导訖?quán)求和所得的值大于閾值時,則確定用戶屬性包含所述其中一種屬性,當(dāng)?shù)谝粎⒖贾岛偷诙⒖贾导訖?quán)求和所得的值不大于閾值時,則不確定用戶屬性包含所述其中一種屬性; 依次類推,直到能夠確定用戶屬性包含所述其中一種屬性。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在完成用戶畫像后,根據(jù)用戶畫像為用戶進行個性化信息推送,并基于標(biāo)簽規(guī)則庫,繼續(xù)檢測用戶在收到所述個性化信息推送后的行為以重新確定用戶屬性。4.根據(jù)權(quán)利要求1-3中任一項所述的方法,其特征在于,在所述基于包括標(biāo)簽、推導(dǎo)規(guī)貝1J、利用推導(dǎo)規(guī)則從標(biāo)簽推導(dǎo)出的屬性、推導(dǎo)規(guī)則的邏輯強度值的標(biāo)簽規(guī)則庫,檢測用戶行為以確定用戶屬性之前,還包括建立標(biāo)簽規(guī)則庫: 提供標(biāo)簽、屬性、以及標(biāo)簽和屬性之間的推導(dǎo)規(guī)則; 根據(jù)所述標(biāo)簽和屬性之間的推導(dǎo)規(guī)則的強弱設(shè)置相應(yīng)的邏輯強度值。5.一種個體用戶畫像系統(tǒng),包括: 行為檢測單元,配置以:基于包括標(biāo)簽、屬性、標(biāo)簽和屬性之間的推導(dǎo)規(guī)則以及所述推導(dǎo)規(guī)則的邏輯強度值的標(biāo)簽規(guī)則庫,檢測用戶行為,為所述用戶打上各種標(biāo)簽; 屬性預(yù)估單元,配置以:根據(jù)一段時間內(nèi)為用戶打上的每一種標(biāo)簽數(shù)量和/或時效性、利用推導(dǎo)規(guī)則從標(biāo)簽推導(dǎo)出的屬性、推導(dǎo)規(guī)則的邏輯強度值,確定每一種標(biāo)簽推導(dǎo)出的各種屬性的參考值; 屬性確定單元,配置以:將其中一種標(biāo)簽推導(dǎo)出的其中一種屬性的參考值與預(yù)定閾值進行對比,判斷是否能夠確定用戶屬性包含所述其中一種屬性,若否,則利用所述參考值連同其他標(biāo)簽下的對應(yīng)于所述其中一種屬性的參考值共同判斷是否能夠確定用戶屬性包含所述其中一種屬性; 用戶畫像生成單元,配置以:根據(jù)所確定的用戶屬性,完成用戶畫像。6.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,所述屬性確定單元,配置以: 將第一標(biāo)簽推導(dǎo)出的其中一種屬性的第一參考值與預(yù)定閾值進行對比,當(dāng)?shù)谝粎⒖贾荡笥陂撝禃r,則確定用戶屬性包含所述其中一種屬性,當(dāng)?shù)谝粎⒖贾挡淮笥陂撝禃r,則不確定用戶屬性包含所述其中一種屬性; 當(dāng)基于所述第一參考值不確定用戶屬性包含所述其中一種屬性時,利用所述第一參考值連同第二標(biāo)簽下的對應(yīng)于所述其中一種屬性的第二參考值加權(quán)求和所得的值與預(yù)定閾值進行對比,當(dāng)?shù)谝粎⒖贾岛偷诙⒖贾导訖?quán)求和所得的值大于閾值時,則確定用戶屬性包含所述其中一種屬性,當(dāng)?shù)谝粎⒖贾岛偷诙⒖贾导訖?quán)求和所得的值不大于閾值時,則不確定用戶屬性包含所述其中一種屬性; 依次類推,直到能夠確定用戶屬性包含所述其中一種屬性。7.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,還包括信息推送單元,所述信息推送單元,配置以:在完成用戶畫像后,根據(jù)用戶畫像為用戶進行個性化信息推送,所述行為檢測單元、所述屬性預(yù)估單元、所述屬性確定單元、所述用戶畫像生成單元配置以基于所述標(biāo)簽規(guī)則庫,繼續(xù)檢測用戶在收到所述個性化信息推送后的行為以重新確定用戶屬性。8.根據(jù)權(quán)利要求5-7任一項所述的系統(tǒng),其特征在于,所述標(biāo)簽規(guī)則庫包括: 標(biāo)簽規(guī)則庫建立單元,配置以: 提供標(biāo)簽、屬性、以及標(biāo)簽和屬性之間的推導(dǎo)規(guī)則; 根據(jù)所述標(biāo)簽和屬性之間的推導(dǎo)規(guī)則的強弱設(shè)置相應(yīng)的邏輯強度值。
【文檔編號】G06F17/30GK105893407SQ201510777008
【公開日】2016年8月24日
【申請日】2015年11月12日
【發(fā)明人】張幼明
【申請人】樂視云計算有限公司