本發(fā)明涉及信息推送技術(shù),尤其涉及基于用戶行為的運(yùn)營(yíng)數(shù)據(jù)歸因比例回傳分發(fā)方法及系統(tǒng)。
背景技術(shù):
1、在現(xiàn)有的運(yùn)營(yíng)數(shù)據(jù)歸因技術(shù)中,最常見(jiàn)的方法包括最后點(diǎn)擊歸因(last?clickattribution)和線性歸因(linear?attribution)。這些方法雖然簡(jiǎn)單易行,但存在明顯的局限性:
2、最后點(diǎn)擊歸因:此方法將全部歸因功效賦予用戶最后一次點(diǎn)擊的運(yùn)營(yíng)數(shù)據(jù),忽略了用戶在決策過(guò)程中接觸的其他運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)。這種方法過(guò)于簡(jiǎn)化,不能準(zhǔn)確反映運(yùn)營(yíng)數(shù)據(jù)的全面效果。
3、線性歸因:此方法將歸因均勻分配給所有觸點(diǎn),雖然比最后點(diǎn)擊歸因公平,但仍然無(wú)法準(zhǔn)確反映各觸點(diǎn)的實(shí)際影響力。
4、這些傳統(tǒng)方法的主要缺點(diǎn)在于無(wú)法精確評(píng)估各運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)對(duì)用戶決策的實(shí)際貢獻(xiàn),導(dǎo)致運(yùn)營(yíng)數(shù)據(jù)預(yù)算分配不準(zhǔn)確,影響運(yùn)營(yíng)數(shù)據(jù)投放的效率和效果。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明實(shí)施例提供基于用戶行為的運(yùn)營(yíng)數(shù)據(jù)歸因比例回傳分發(fā)方法及系統(tǒng),能夠解決現(xiàn)有技術(shù)中的問(wèn)題。
2、本發(fā)明實(shí)施例的第一方面,
3、提供基于用戶行為的運(yùn)營(yíng)數(shù)據(jù)歸因比例回傳分發(fā)方法,包括:
4、通過(guò)部署在客戶端的追蹤代碼,實(shí)時(shí)收集用戶對(duì)運(yùn)營(yíng)數(shù)據(jù)的點(diǎn)擊、觀看時(shí)長(zhǎng)的行為數(shù)據(jù);將所述行為數(shù)據(jù)傳輸至服務(wù)器端的數(shù)據(jù)處理中心;在所述數(shù)據(jù)處理中心對(duì)所述行為數(shù)據(jù)進(jìn)行預(yù)處理,包括:刪除缺失值和重復(fù)數(shù)據(jù),將時(shí)間戳轉(zhuǎn)換為統(tǒng)一格式;
5、從預(yù)處理后的行為數(shù)據(jù)中提取特征,所述特征包括用戶活躍時(shí)間段、點(diǎn)擊強(qiáng)度和停留時(shí)間;構(gòu)建特征矩陣x和目標(biāo)變量y,其中x包含所提取的特征,y表示用戶的轉(zhuǎn)化結(jié)果;利用機(jī)器學(xué)習(xí)模型對(duì)所述特征矩陣x和目標(biāo)變量y進(jìn)行訓(xùn)練,得到各運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)的貢獻(xiàn)權(quán)重;基于所述貢獻(xiàn)權(quán)重,結(jié)合時(shí)間衰減馬爾可夫模型計(jì)算每個(gè)運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)的歸因比例;
6、將計(jì)算得到的歸因比例通過(guò)加密的api接口實(shí)時(shí)回傳給運(yùn)營(yíng)數(shù)據(jù)平臺(tái)和運(yùn)營(yíng)數(shù)據(jù)主;運(yùn)營(yíng)數(shù)據(jù)平臺(tái)和運(yùn)營(yíng)數(shù)據(jù)主根據(jù)接收到的歸因比例,動(dòng)態(tài)調(diào)整運(yùn)營(yíng)數(shù)據(jù)投放策略和預(yù)算分配。
7、在一種可選的實(shí)施方式中,
8、利用機(jī)器學(xué)習(xí)模型對(duì)所述特征矩陣x和目標(biāo)變量y進(jìn)行訓(xùn)練,得到各運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)的貢獻(xiàn)權(quán)重包括:
9、將用戶行為數(shù)據(jù)集按照預(yù)設(shè)比例隨機(jī)劃分為訓(xùn)練集和測(cè)試集;對(duì)特征矩陣進(jìn)行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)化特征矩陣;
10、初始化隨機(jī)森林模型和梯度提升決策樹(shù)模型,并設(shè)置初始超參數(shù);利用訓(xùn)練集數(shù)據(jù)對(duì)隨機(jī)森林模型和梯度提升決策樹(shù)模型進(jìn)行訓(xùn)練;
11、使用測(cè)試集評(píng)估隨機(jī)森林模型和梯度提升決策樹(shù)模型的性能,計(jì)算均方根誤差和判定系數(shù);通過(guò)網(wǎng)格搜索和交叉驗(yàn)證方法優(yōu)化隨機(jī)森林模型和梯度提升決策樹(shù)模型的超參數(shù);從優(yōu)化后的隨機(jī)森林模型和梯度提升決策樹(shù)模型中提取特征重要性;對(duì)隨機(jī)森林模型和梯度提升決策樹(shù)模型的特征重要性進(jìn)行歸一化處理;將歸一化后的隨機(jī)森林模型和梯度提升決策樹(shù)模型的特征重要性進(jìn)行加權(quán)平均,得到集成特征重要性;
12、建立特征與運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)之間的映射關(guān)系;根據(jù)集成特征重要性和特征與運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)的映射關(guān)系,計(jì)算每個(gè)運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)的貢獻(xiàn)權(quán)重;對(duì)得到的運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)貢獻(xiàn)權(quán)重進(jìn)行歸一化處理,得到最終的運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)貢獻(xiàn)權(quán)重。
13、在一種可選的實(shí)施方式中,
14、基于所述貢獻(xiàn)權(quán)重,結(jié)合時(shí)間衰減馬爾可夫模型計(jì)算每個(gè)運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)的歸因比例包括:
15、基于用戶行為序列構(gòu)建運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)轉(zhuǎn)移概率矩陣,所述運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)轉(zhuǎn)移概率矩陣中的元素表示從一個(gè)運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)到另一個(gè)運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)的轉(zhuǎn)移概率;引入時(shí)間衰減函數(shù),所述時(shí)間衰減函數(shù)為指數(shù)衰減函數(shù),其中衰減參數(shù)通過(guò)交叉驗(yàn)證確定;將所述時(shí)間衰減函數(shù)應(yīng)用于所述運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)轉(zhuǎn)移概率矩陣,得到衰減后的運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)轉(zhuǎn)移概率矩陣,其中衰減后的轉(zhuǎn)移概率為原轉(zhuǎn)移概率與時(shí)間衰減因子的乘積;
16、使用冪迭代法求解所述衰減后的運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)轉(zhuǎn)移概率矩陣的穩(wěn)態(tài)分布;基于所述穩(wěn)態(tài)分布和預(yù)先確定的運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)貢獻(xiàn)權(quán)重,計(jì)算每個(gè)運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)的歸因比例。
17、在一種可選的實(shí)施方式中,
18、所述方法還包括:
19、對(duì)所述衰減后的運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)轉(zhuǎn)移概率矩陣進(jìn)行平滑處理,以避免零概率問(wèn)題;
20、構(gòu)建多階馬爾可夫鏈,以捕捉更長(zhǎng)歷史狀態(tài)下的用戶行為模式;使用網(wǎng)格搜索或貝葉斯優(yōu)化方法自適應(yīng)選擇最優(yōu)的時(shí)間衰減參數(shù);
21、計(jì)算模型對(duì)測(cè)試數(shù)據(jù)的對(duì)數(shù)似然度,評(píng)估模型的擬合程度;使用所述模型預(yù)測(cè)下一個(gè)可能的運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn),并計(jì)算預(yù)測(cè)準(zhǔn)確率。
22、在一種可選的實(shí)施方式中,
23、將計(jì)算得到的歸因比例通過(guò)加密的api接口實(shí)時(shí)回傳給運(yùn)營(yíng)數(shù)據(jù)平臺(tái)和運(yùn)營(yíng)數(shù)據(jù)主;運(yùn)營(yíng)數(shù)據(jù)平臺(tái)和運(yùn)營(yíng)數(shù)據(jù)主根據(jù)接收到的歸因比例,動(dòng)態(tài)調(diào)整運(yùn)營(yíng)數(shù)據(jù)投放策略和預(yù)算分配包括:
24、利用非對(duì)稱加密算法rsa對(duì)運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)歸因結(jié)果進(jìn)行加密,得到加密后的歸因結(jié)果;通過(guò)restful?api接口接收所述加密后的歸因結(jié)果,并將所述加密后的歸因結(jié)果轉(zhuǎn)發(fā)至消息隊(duì)列;
25、利用apache?kafka作為所述消息隊(duì)列,確保高吞吐量和低延遲地處理所述加密后的歸因結(jié)果;使用apache?flink對(duì)所述消息隊(duì)列中的加密后的歸因結(jié)果進(jìn)行實(shí)時(shí)數(shù)據(jù)處理,包括解密所述加密后的歸因結(jié)果和進(jìn)行初步分析;
26、基于解密后的歸因結(jié)果,利用策略優(yōu)化引擎生成運(yùn)營(yíng)數(shù)據(jù)投放策略優(yōu)化建議,所述優(yōu)化建議包括預(yù)算分配方案和出價(jià)策略;通過(guò)實(shí)時(shí)反饋機(jī)制將所述優(yōu)化建議發(fā)送給運(yùn)營(yíng)數(shù)據(jù)平臺(tái)和運(yùn)營(yíng)數(shù)據(jù)主;
27、利用redis緩存頻繁訪問(wèn)的歸因結(jié)果數(shù)據(jù),減少數(shù)據(jù)庫(kù)查詢壓力;實(shí)現(xiàn)自適應(yīng)批處理機(jī)制,根據(jù)系統(tǒng)負(fù)載動(dòng)態(tài)調(diào)整批處理大小,其中初始批處理大小為100,最大批處理大小為1000;
28、實(shí)現(xiàn)多租戶數(shù)據(jù)隔離,確保不同運(yùn)營(yíng)數(shù)據(jù)主之間的數(shù)據(jù)安全性;周期性地更新所述優(yōu)化建議,更新周期為5分鐘;
29、在生成所述優(yōu)化建議時(shí),根據(jù)歸因比例將運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)分為激進(jìn)、適中和保守三種出價(jià)策略,其中歸因比例大于0.2的運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)采用激進(jìn)策略,歸因比例大于0.1且小于等于0.2的運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)采用適中策略,歸因比例小于等于0.1的運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)采用保守策略;
30、基于所述優(yōu)化建議,動(dòng)態(tài)調(diào)整運(yùn)營(yíng)數(shù)據(jù)投放參數(shù),包括預(yù)算分配和出價(jià)策略,形成閉環(huán)優(yōu)化系統(tǒng)。
31、在一種可選的實(shí)施方式中,
32、基于解密后的歸因結(jié)果,利用策略優(yōu)化引擎生成運(yùn)營(yíng)數(shù)據(jù)投放策略優(yōu)化建議,所述優(yōu)化建議包括預(yù)算分配方案和出價(jià)策略包括:
33、接收解密后的歸因結(jié)果、歷史績(jī)效數(shù)據(jù)和市場(chǎng)競(jìng)爭(zhēng)數(shù)據(jù);
34、利用數(shù)據(jù)預(yù)處理模塊對(duì)所述歸因結(jié)果、所述歷史績(jī)效數(shù)據(jù)和所述市場(chǎng)競(jìng)爭(zhēng)數(shù)據(jù)進(jìn)行合并、缺失值處理和異常值檢測(cè),得到預(yù)處理后的數(shù)據(jù);
35、基于所述預(yù)處理后的數(shù)據(jù),計(jì)算效率得分和市場(chǎng)份額,其中所述效率得分為轉(zhuǎn)化率與每次點(diǎn)擊成本的比值,所述市場(chǎng)份額為運(yùn)營(yíng)數(shù)據(jù)展示次數(shù)與總市場(chǎng)展示次數(shù)的比值;
36、利用凸優(yōu)化算法對(duì)預(yù)算進(jìn)行分配優(yōu)化,其中目標(biāo)函數(shù)為最大化效率得分與預(yù)算分配的乘積之和,約束條件為預(yù)算分配之和等于總預(yù)算;
37、根據(jù)歸因比例、市場(chǎng)份額和預(yù)算份額生成出價(jià)策略,其中歸因比例大于0.2且市場(chǎng)份額小于0.3時(shí)采用激進(jìn)策略,歸因比例大于0.1或預(yù)算份額大于0.15時(shí)采用適中策略,其他情況采用保守策略;
38、基于出價(jià)策略計(jì)算出價(jià)調(diào)整系數(shù),其中激進(jìn)策略的出價(jià)調(diào)整系數(shù)為1.2,適中策略的出價(jià)調(diào)整系數(shù)為1.0,保守策略的出價(jià)調(diào)整系數(shù)為0.8;
39、利用隨機(jī)森林回歸模型對(duì)優(yōu)化后的績(jī)效進(jìn)行預(yù)測(cè),其中輸入特征包括預(yù)算、出價(jià)調(diào)整系數(shù)和市場(chǎng)份額,輸出為預(yù)測(cè)的投資回報(bào)率;
40、整合優(yōu)化后的預(yù)算分配、出價(jià)策略和預(yù)測(cè)績(jī)效,生成最終的優(yōu)化建議,并計(jì)算預(yù)期改善程度;
41、根據(jù)預(yù)期改善程度對(duì)優(yōu)化建議進(jìn)行降序排序,得到排序后的優(yōu)化建議列表;
42、將所述排序后的優(yōu)化建議列表輸出給運(yùn)營(yíng)數(shù)據(jù)主,用于指導(dǎo)運(yùn)營(yíng)數(shù)據(jù)投放策略的調(diào)整。
43、本發(fā)明實(shí)施例的第二方面,
44、提供基于用戶行為的運(yùn)營(yíng)數(shù)據(jù)歸因比例回傳分發(fā)系統(tǒng),包括:
45、第一單元,用于通過(guò)部署在客戶端的追蹤代碼,實(shí)時(shí)收集用戶對(duì)運(yùn)營(yíng)數(shù)據(jù)的點(diǎn)擊、觀看時(shí)長(zhǎng)的行為數(shù)據(jù);將所述行為數(shù)據(jù)傳輸至服務(wù)器端的數(shù)據(jù)處理中心;在所述數(shù)據(jù)處理中心對(duì)所述行為數(shù)據(jù)進(jìn)行預(yù)處理,包括:刪除缺失值和重復(fù)數(shù)據(jù),將時(shí)間戳轉(zhuǎn)換為統(tǒng)一格式;
46、第二單元,用于從預(yù)處理后的行為數(shù)據(jù)中提取特征,所述特征包括用戶活躍時(shí)間段、點(diǎn)擊強(qiáng)度和停留時(shí)間;構(gòu)建特征矩陣x和目標(biāo)變量y,其中x包含所提取的特征,y表示用戶的轉(zhuǎn)化結(jié)果;利用機(jī)器學(xué)習(xí)模型對(duì)所述特征矩陣x和目標(biāo)變量y進(jìn)行訓(xùn)練,得到各運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)的貢獻(xiàn)權(quán)重;基于所述貢獻(xiàn)權(quán)重,結(jié)合時(shí)間衰減馬爾可夫模型計(jì)算每個(gè)運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)的歸因比例;
47、第三單元,用于將計(jì)算得到的歸因比例通過(guò)加密的api接口實(shí)時(shí)回傳給運(yùn)營(yíng)數(shù)據(jù)平臺(tái)和運(yùn)營(yíng)數(shù)據(jù)主;運(yùn)營(yíng)數(shù)據(jù)平臺(tái)和運(yùn)營(yíng)數(shù)據(jù)主根據(jù)接收到的歸因比例,動(dòng)態(tài)調(diào)整運(yùn)營(yíng)數(shù)據(jù)投放策略和預(yù)算分配。
48、本發(fā)明實(shí)施例的第三方面,
49、提供一種電子設(shè)備,包括:
50、處理器;
51、用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
52、其中,所述處理器被配置為調(diào)用所述存儲(chǔ)器存儲(chǔ)的指令,以執(zhí)行前述所述的方法。
53、本發(fā)明實(shí)施例的第四方面,
54、提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序指令,所述計(jì)算機(jī)程序指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)前述所述的方法。
55、本技術(shù)的技術(shù)方案可以提高運(yùn)營(yíng)數(shù)據(jù)預(yù)算的使用效率:準(zhǔn)確的歸因信息幫助運(yùn)營(yíng)數(shù)據(jù)主更合理地分配運(yùn)營(yíng)數(shù)據(jù)預(yù)算。增強(qiáng)運(yùn)營(yíng)數(shù)據(jù)投放的精準(zhǔn)性:了解每個(gè)運(yùn)營(yíng)數(shù)據(jù)觸點(diǎn)的實(shí)際效果,可以更精準(zhǔn)地進(jìn)行目標(biāo)受眾定位和運(yùn)營(yíng)數(shù)據(jù)內(nèi)容優(yōu)化。提升整體運(yùn)營(yíng)數(shù)據(jù)roi:通過(guò)優(yōu)化運(yùn)營(yíng)數(shù)據(jù)投放策略,提高運(yùn)營(yíng)數(shù)據(jù)的回報(bào)率。