本發(fā)明涉及本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種基于網(wǎng)站用戶的信息預(yù)測(cè)方法。
背景技術(shù):
隨著進(jìn)入移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來(lái),信息更新迭代的時(shí)間逐漸縮短,要想在行業(yè)中處于不敗之地必須有把握市場(chǎng)方向的能力,即預(yù)測(cè)能力。古人在當(dāng)時(shí)科學(xué)依據(jù)較少的情況下,以經(jīng)驗(yàn)來(lái)對(duì)某一個(gè)即將發(fā)生的事情進(jìn)行預(yù)判斷,但是這種完全憑借經(jīng)驗(yàn)的判斷很難稱其為“預(yù)測(cè)”,因?yàn)槠渫耆珱](méi)有一個(gè)相對(duì)標(biāo)準(zhǔn)的依據(jù)。比如現(xiàn)在從事網(wǎng)站運(yùn)營(yíng)業(yè)務(wù)的團(tuán)隊(duì),不能有效的預(yù)測(cè)未來(lái)一段時(shí)間新用戶注冊(cè)量,就很難掌握網(wǎng)站運(yùn)營(yíng)的業(yè)務(wù)方向,一旦行業(yè)方向發(fā)生轉(zhuǎn)向,運(yùn)營(yíng)團(tuán)隊(duì)再去改變運(yùn)營(yíng)方向,就很難再跟上行業(yè)的發(fā)展,甚至被整個(gè)行業(yè)拋棄。但是現(xiàn)在市場(chǎng)上公開(kāi)的準(zhǔn)確度較高并且操作相對(duì)簡(jiǎn)單的預(yù)測(cè)模型基本上沒(méi)有。本發(fā)明不僅很好的解決了預(yù)測(cè)問(wèn)題,而且填補(bǔ)了預(yù)測(cè)網(wǎng)站用戶注冊(cè)量的空白。
技術(shù)實(shí)現(xiàn)要素:
下面描述的一種預(yù)測(cè)網(wǎng)站新增用戶數(shù)的模型有效的解決了上面所述的問(wèn)題。
本發(fā)明公開(kāi)一種基于網(wǎng)站用戶的信息預(yù)測(cè)方法。包括:
步驟1:通過(guò)控制單元設(shè)定:客觀事件邊界、主觀事件邊界、事件發(fā)生時(shí)間間隔、事件影響持續(xù)時(shí)間。
步驟2:基于控制單元獲取客觀事件和用戶新增數(shù)據(jù)表;
步驟3:基于控制單元獲取主觀事件和用戶新增數(shù)據(jù)表;
步驟4:通過(guò)數(shù)據(jù)處理單元分別建立:1、客觀事件和用戶新增關(guān)系的模型;2、建立主觀事件和用戶新增關(guān)系的模型;
步驟5:通過(guò)數(shù)據(jù)預(yù)測(cè)單元建立以客觀事件和用戶新增關(guān)系、主觀事件和用戶新增關(guān)系為因子的預(yù)測(cè)模型,基于模型預(yù)測(cè)網(wǎng)站新增用戶數(shù)。
步驟6:通過(guò)數(shù)據(jù)分析單元對(duì)比網(wǎng)站預(yù)測(cè)增長(zhǎng)的用戶數(shù)和實(shí)際增長(zhǎng)的用戶數(shù),基于對(duì)比結(jié)果,排除干擾預(yù)測(cè)的客觀事件和主觀事件,并且實(shí)時(shí)調(diào)整對(duì)應(yīng)的事件發(fā)生時(shí)間間隔、事件影響持續(xù)時(shí)間等設(shè)置,進(jìn)而實(shí)現(xiàn)模型的自我優(yōu)化和更新。
其中,步驟1所述的控制單元為本裝置的基礎(chǔ)單元,控制單元通過(guò)定義相關(guān)等參數(shù)等操作控制預(yù)測(cè)裝置的實(shí)際運(yùn)行,具體包含:
101:定義客觀事件邊界:即定義影響網(wǎng)站用戶增長(zhǎng)的客觀事件發(fā)生列表,并且基于網(wǎng)站運(yùn)營(yíng)隨時(shí)保持更新(本發(fā)明所指的客觀事件均為影響本網(wǎng)站的客觀事件,如果事件發(fā)生時(shí)間間隔內(nèi)沒(méi)有任何外部客觀事件發(fā)生也算一種客觀事件,如:網(wǎng)站服務(wù)群體是否放假、影響網(wǎng)站業(yè)務(wù)的政策發(fā)布更新等);
102:定義主觀事件邊界:即定義影響網(wǎng)站注冊(cè)的主觀事件發(fā)生列表(本發(fā)明所指的主觀事件均為影響本網(wǎng)站的主觀事件,如:網(wǎng)站版本更新、網(wǎng)站內(nèi)容模塊更新、網(wǎng)站業(yè)務(wù)信息推送等事件);
103:定義事件發(fā)生時(shí)間間隔:即如果長(zhǎng)時(shí)間沒(méi)有發(fā)生外部客觀事件,定義多長(zhǎng)時(shí)間算一個(gè)事件發(fā)生的時(shí)間間隔,也就是這段時(shí)間內(nèi),基于時(shí)間間隔,可以確認(rèn)這個(gè)時(shí)間段內(nèi)有幾個(gè)客觀事件發(fā)生。
104:定義事件影響持續(xù)時(shí)間:即定義事件發(fā)生后,截止到什么時(shí)間,來(lái)計(jì)算用戶增長(zhǎng)的數(shù)量。
步驟2所述的獲取客觀事件和用戶新增數(shù)據(jù)表具體包含:
步驟201:基于控制單元獲取每一個(gè)客觀事件發(fā)生后,事件影響持續(xù)時(shí)間內(nèi)的新增用戶數(shù);
步驟202:生成客觀事件和新增用戶數(shù)的關(guān)系列表。
步驟3所述的獲取主觀事件和用戶新年增數(shù)據(jù)表具體包含:
步驟301:基于控制單元獲取每一個(gè)主觀事件發(fā)生后,事件影響持續(xù)時(shí)間內(nèi)的新增用戶數(shù);
步驟302:生成主觀事件和新增用戶數(shù)的關(guān)系列表。
步驟4所述數(shù)據(jù)處理單元主要包含對(duì)兩個(gè)事件列表的邏輯處理,具體處理方法如下:
步驟401:對(duì)于每個(gè)客觀事件,當(dāng)此事件發(fā)生后,把事件影響持續(xù)時(shí)間內(nèi)新增用戶數(shù)量構(gòu)成一個(gè)變量Xm。其中,m是客觀事件發(fā)生的次數(shù);
步驟402:對(duì)于每個(gè)主觀事件,當(dāng)此事件發(fā)生后,把事件影響持續(xù)時(shí)間內(nèi)新增用戶數(shù)量構(gòu)成一個(gè)變量Xn。其中,n是客觀事件發(fā)生的次數(shù);
步驟403:假設(shè)新增用戶數(shù)Yi,和以上兩個(gè)有如下關(guān)系:
Yi=a+bXm+cXn。
利用上述m和n維參數(shù)對(duì)此式進(jìn)行線性回歸,利用最小二乘法估計(jì)出模型參數(shù)a、b和c。
針對(duì)未來(lái)用戶新增數(shù)用上述二元線性回歸方程預(yù)測(cè)。
本發(fā)明的關(guān)鍵點(diǎn):
1、本發(fā)明基于線性回歸的模型相比于其他(德?tīng)柗品A(yù)測(cè)模型、灰色預(yù)測(cè)模型等)預(yù)測(cè)模型更具有可操作性和高效性;
2、算法創(chuàng)造性的把客觀事件影主觀時(shí)間影響分類處理,區(qū)分為兩個(gè)因子,符合實(shí)際情況,增加了預(yù)測(cè)的準(zhǔn)確性;
3、由于主觀和客觀事件的列表是積累更新的,所以可以實(shí)現(xiàn)對(duì)算法預(yù)測(cè)的同步實(shí)時(shí)更新;
4、通過(guò)控制單元人為的設(shè)定相關(guān)參數(shù),并且通過(guò)數(shù)據(jù)分析單元?jiǎng)討B(tài)更新,提升了預(yù)測(cè)系統(tǒng)的準(zhǔn)確性。
附圖說(shuō)明
圖1是本發(fā)明的基于網(wǎng)站用戶的信息預(yù)測(cè)方法流程圖。
圖2是控制單元參數(shù)設(shè)定步驟圖。
圖3是在系統(tǒng)中獲取預(yù)先設(shè)定的客觀事件和新增用戶關(guān)系的數(shù)據(jù)表信息圖。
圖4是在系統(tǒng)中獲取預(yù)先設(shè)定的主觀事件和新增用戶關(guān)系的數(shù)據(jù)表信息圖。
圖5是用戶預(yù)測(cè)模型圖。
具體實(shí)施方式
下面結(jié)合具體實(shí)施例對(duì)本發(fā)明所述的預(yù)測(cè)網(wǎng)站新增用戶數(shù)的方法做進(jìn)一步詳細(xì)說(shuō)明,但是本發(fā)明的保護(hù)范圍并不限于此。
本發(fā)明的整體思路是通過(guò)獲取客觀事件發(fā)生后,事件影響持續(xù)時(shí)間內(nèi)新增用戶的關(guān)系;主觀事件發(fā)生后,事件影響持續(xù)時(shí)間內(nèi)新增用戶數(shù)的關(guān)系為二元線性回歸方程的兩個(gè)因子,通過(guò)計(jì)算線性回歸方程的參數(shù),得到預(yù)測(cè)一定時(shí)間內(nèi)用戶新增數(shù)量的模型。進(jìn)而預(yù)測(cè)在一定時(shí)間段內(nèi)相應(yīng)事件發(fā)生后,網(wǎng)站用戶新增數(shù),如圖1。
下面結(jié)合附圖說(shuō)明本發(fā)明的實(shí)現(xiàn)方式,具體實(shí)施步驟如下:
步驟1:在系統(tǒng)中設(shè)定關(guān)鍵參數(shù),并且基于數(shù)據(jù)分析單元實(shí)時(shí)調(diào)整相應(yīng)參數(shù),如圖2所示;
步驟2:在系統(tǒng)中獲取預(yù)先設(shè)定的客觀事件和新增用戶關(guān)系的數(shù)據(jù)表信息,如圖3所示;
其中,對(duì)同一客觀事件多次發(fā)生后用戶新增數(shù)量求平均值計(jì)入此關(guān)系數(shù)據(jù)表,
步驟3:在系統(tǒng)中獲取預(yù)先設(shè)定的主觀事件和新增用戶關(guān)系的數(shù)據(jù)表信息,如圖4所示;
其中,對(duì)同一事件多次發(fā)生后用戶新增數(shù)量求平均值計(jì)入此關(guān)系數(shù)據(jù)表,
步驟4:基于以上數(shù)據(jù)表,將每一個(gè)客觀事件發(fā)生后,事件影響持續(xù)時(shí)間內(nèi)新增用戶數(shù)量,建立一個(gè)變量Xm;
Xm=[OeU1,OeU2,OeU3,......,OeUk,......,OeUm],其中,OeUk為客觀事件Oe發(fā)生后新增的用戶數(shù)量Uk;
步驟5:基于以上關(guān)系表,將每一個(gè)主觀事件發(fā)生后,事件影響持續(xù)時(shí)間內(nèi)新增用戶數(shù)量,建立一個(gè)向量Xn;
Xn=[SeU1,SeU2,SeU3,......,SeUk,......,SeUn],其中,SeUk為主觀事件Se發(fā)生后新增的用戶數(shù)量Uk;
步驟6:假設(shè)新增用戶數(shù)Yi和Xm、Xn存在如下關(guān)系,如圖5:
Yi=a+bXm+cXn;
利用上述m和n參數(shù)對(duì)此式進(jìn)行線性回歸,利用最小二乘法估計(jì)出模型參數(shù)a、b和c。
以誤差平方和最小作為確定回歸系數(shù)的準(zhǔn)則,我們得到以下數(shù)據(jù)模型:
模型1:
其中,當(dāng)滿足時(shí),Q有最小值。
通過(guò)數(shù)據(jù)預(yù)測(cè)單元基于最小二乘法計(jì)算參數(shù)a、b和c的值,得出以下模型:
模型2:其中,
通過(guò)求解方程,得出最終的用戶模型。
預(yù)測(cè)模型:
通過(guò)以上模型實(shí)現(xiàn)用戶新增數(shù)量的預(yù)測(cè)。
步驟6:基于數(shù)據(jù)分析單元通過(guò)預(yù)測(cè)模型預(yù)測(cè)出的用戶增長(zhǎng)數(shù)據(jù)和網(wǎng)站實(shí)際增長(zhǎng)的數(shù)據(jù)進(jìn)行對(duì)比確認(rèn),排除干擾預(yù)測(cè)的客觀事件和主觀事件,并且動(dòng)態(tài)調(diào)整控制單元的控制參數(shù),優(yōu)化預(yù)測(cè)模型。
可以理解的是,以上實(shí)施方式僅僅是為了說(shuō)明本發(fā)明的原理而采用的示例性實(shí)施方式,然而本發(fā)明并不局限于此。對(duì)于本領(lǐng)域內(nèi)的普通技術(shù)人員而言,在不脫離本發(fā)明的精神和實(shí)質(zhì)的情況下,可以做出各種變型和改進(jìn),這些變型和改進(jìn)也視為本發(fā)明的保護(hù)范圍。