網(wǎng)站數(shù)據(jù)統(tǒng)計(jì)的系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種數(shù)據(jù)統(tǒng)計(jì)方法,具體是一種網(wǎng)站數(shù)據(jù)統(tǒng)計(jì)的系統(tǒng)和方法。
【背景技術(shù)】
[0002]網(wǎng)站流量統(tǒng)計(jì)分析,是指在獲得網(wǎng)站訪(fǎng)問(wèn)量基本數(shù)據(jù)的情況下,對(duì)有關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、分析,掌握網(wǎng)站流量趨勢(shì)、洞察訪(fǎng)客行為習(xí)慣的工具,通過(guò)此系統(tǒng)可以直觀的了解網(wǎng)站用戶(hù)群的大小、地域分布、網(wǎng)站內(nèi)容的關(guān)注度、網(wǎng)站來(lái)源、用戶(hù)在訪(fǎng)問(wèn)過(guò)的每個(gè)頁(yè)面上的鼠標(biāo)事件(點(diǎn)擊、滑過(guò))以及關(guān)注內(nèi)容區(qū)域分布及所關(guān)注時(shí)間長(zhǎng)短,頁(yè)面瀏覽高度、位置都將被精準(zhǔn)捕捉到,通過(guò)鼠標(biāo)軌跡熱圖、關(guān)注熱圖、點(diǎn)擊熱圖和滾動(dòng)熱圖全方位給您展現(xiàn)多種信息。以了解網(wǎng)站當(dāng)前的訪(fǎng)問(wèn)效果和訪(fǎng)問(wèn)用戶(hù)行為并發(fā)現(xiàn)當(dāng)前網(wǎng)絡(luò)營(yíng)銷(xiāo)活動(dòng)中存在的問(wèn)題,并為進(jìn)一步修正或重新制定網(wǎng)絡(luò)營(yíng)銷(xiāo)策略提供依據(jù)。
[0003]但是目前基于互聯(lián)網(wǎng)的網(wǎng)站訪(fǎng)問(wèn)統(tǒng)計(jì)系統(tǒng),并不能精準(zhǔn)了解每個(gè)網(wǎng)站注冊(cè)用戶(hù)的性別、訪(fǎng)問(wèn)興趣,不能做到對(duì)用戶(hù)分析有的放矢,分析用戶(hù)購(gòu)物行為習(xí)慣和喜好,不能有效實(shí)現(xiàn)智能精準(zhǔn)推薦,不能有效幫助網(wǎng)站進(jìn)行精準(zhǔn)營(yíng)銷(xiāo)和對(duì)癥下藥。
【發(fā)明內(nèi)容】
[0004]本發(fā)明針對(duì)現(xiàn)有技術(shù)的不足,提供一種網(wǎng)站數(shù)據(jù)統(tǒng)計(jì)的系統(tǒng)和方法。
[0005]網(wǎng)站數(shù)據(jù)統(tǒng)計(jì)的方法,用于對(duì)網(wǎng)站訪(fǎng)問(wèn)量基本數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、分析,掌握網(wǎng)站流量趨勢(shì)、洞察訪(fǎng)客行為習(xí)慣的方法,包括以下步驟:
在網(wǎng)站頁(yè)面添加數(shù)據(jù)統(tǒng)計(jì)代碼和設(shè)置數(shù)據(jù)傳輸代碼,用以判斷、創(chuàng)建、記錄和傳輸用戶(hù)訪(fǎng)問(wèn)網(wǎng)站的基本?目息;
部署后臺(tái)處理程序,進(jìn)行程序分析,發(fā)送數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行分組處理;
根據(jù)需要分成多個(gè)表文件用于記錄數(shù)據(jù);
數(shù)據(jù)可視化展示,通過(guò)使用圖表組件,以及服務(wù)器端架構(gòu),對(duì)數(shù)據(jù)內(nèi)容進(jìn)行展示。
[0006]所述基本信息的記錄包括瀏覽器的頭信息、ip、訪(fǎng)問(wèn)功能代碼、操作代碼和reffer信息。
[0007]通過(guò)記錄的頭信息,判斷來(lái)源的瀏覽器類(lèi)型、操作系統(tǒng)類(lèi)型,通過(guò)判斷記錄來(lái)訪(fǎng)時(shí)間。
[0008]通過(guò)re f f er信息獲取上一個(gè)頁(yè)面信息,判斷用戶(hù)訪(fǎng)問(wèn)瀏覽深度,通過(guò)基本信息,判斷是否已記錄用戶(hù),多用戶(hù)身份驗(yàn)證,用戶(hù)訪(fǎng)問(wèn)軌跡記錄,并對(duì)數(shù)據(jù)進(jìn)行文件緩存處理,對(duì)部分?jǐn)?shù)據(jù)進(jìn)行分月分表記錄,以減少數(shù)據(jù)量過(guò)大對(duì)服務(wù)器的壓力,并且優(yōu)化合理的索引結(jié)構(gòu)增加速度。
[0009]表文件包括帖文統(tǒng)計(jì)總表,帖文日/時(shí)分月記錄表,訪(fǎng)問(wèn)深度記錄表,用戶(hù)行為記錄按月統(tǒng)計(jì)表,用戶(hù)終端按月記錄表,板塊ip/p按日/時(shí)統(tǒng)計(jì)分月記錄表,爬蟲(chóng)統(tǒng)計(jì)分月記錄表,爬蟲(chóng)來(lái)訪(fǎng)記錄分月記錄表,搜索引擎來(lái)源分月記錄表,搜索引擎來(lái)源次數(shù)分月記錄表,停留時(shí)間記錄表,用戶(hù)id驗(yàn)證表。
[0010]服務(wù)器端架構(gòu)為L(zhǎng)AMP服務(wù)器端架構(gòu)。
[0011]網(wǎng)站數(shù)據(jù)統(tǒng)計(jì)的系統(tǒng),包括服務(wù)器,內(nèi)存服務(wù)器和數(shù)據(jù)分析處理服務(wù)器,在服務(wù)器的網(wǎng)站頁(yè)面添加數(shù)據(jù)統(tǒng)計(jì)代碼和設(shè)置數(shù)據(jù)傳輸代碼,用以判斷、創(chuàng)建、記錄和傳輸用戶(hù)訪(fǎng)問(wèn)網(wǎng)站的基本信息;內(nèi)存服務(wù)器內(nèi)用于數(shù)據(jù)庫(kù)進(jìn)行信息存儲(chǔ);數(shù)據(jù)分析處理服務(wù)器用于根據(jù)實(shí)際的數(shù)據(jù)分析需求,編輯操作表、數(shù)據(jù)記錄、程序分析,發(fā)送數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行分組處理。
[0012]所述內(nèi)存服務(wù)器為redis內(nèi)存服務(wù)器。
[0013]本發(fā)明的有益效果:
第一,硬件消耗少,redis核心內(nèi)存處理框架可以更快速的實(shí)現(xiàn)數(shù)據(jù)的存取,比使用關(guān)系數(shù)據(jù)庫(kù)性能更高。
[0014]第二,與生產(chǎn)環(huán)境分離處理,可以減少大數(shù)據(jù)量分析對(duì)服務(wù)器性能的影響,處理速度快,內(nèi)容精準(zhǔn)。
[0015]第三,可擴(kuò)展性好,能夠適應(yīng)各種數(shù)據(jù)統(tǒng)計(jì)的需求,進(jìn)行針對(duì)性開(kāi)發(fā),數(shù)據(jù)記錄完整,可以回滾,重復(fù)檢索,適合大數(shù)據(jù)挖掘。
【附圖說(shuō)明】
[0016]圖1為系統(tǒng)流程圖;
圖2訪(fǎng)問(wèn)數(shù)據(jù)記錄流程圖;
圖3為后臺(tái)數(shù)據(jù)梳理流程圖;
【具體實(shí)施方式】
[0017]下面結(jié)合附圖,對(duì)本發(fā)明實(shí)現(xiàn)數(shù)據(jù)統(tǒng)計(jì)所采取的技術(shù)方案做進(jìn)一步說(shuō)明:
1、在網(wǎng)站頁(yè)面里添加數(shù)據(jù)統(tǒng)計(jì)代碼,用于傳輸數(shù)據(jù)到后端隊(duì)列存儲(chǔ)服務(wù)器,根據(jù)網(wǎng)頁(yè)類(lèi)型設(shè)置數(shù)據(jù)傳輸代碼。根據(jù)業(yè)務(wù)形式進(jìn)行數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì),分為列表頁(yè),內(nèi)容頁(yè),發(fā)帖,回帖,編輯,搜索,分類(lèi)標(biāo)簽,圖集,刪帖,登錄等操作,并對(duì)用戶(hù)訪(fǎng)問(wèn)時(shí)做一個(gè)唯一性hash存儲(chǔ)到用戶(hù)的cookie中,根據(jù)用戶(hù)實(shí)際的登陸情況,以及cookie進(jìn)行用戶(hù)身份的辨別。
[0018]2、根據(jù)圖2所不。I)用戶(hù)訪(fǎng)問(wèn)WEB服務(wù)器,系統(tǒng)讀取用戶(hù)cookie信息,獲取身份認(rèn)證唯一代碼;2)有記錄并且獲取到信息,根據(jù)頁(yè)面類(lèi)型和行為代碼插入緩存隊(duì)列;3)如無(wú)身份認(rèn)證信息,則隨機(jī)生成一個(gè)唯一驗(yàn)證碼,用于用戶(hù)登錄;4)用戶(hù)登錄行為中,以前有cookie身份唯一代碼,系統(tǒng)修改cookie信息存儲(chǔ)的用戶(hù)身份碼,并重復(fù)2)插入緩存隊(duì)列;5)用戶(hù)之前無(wú)身份唯一代碼,創(chuàng)建新的用戶(hù)數(shù)據(jù)記錄到da_suname表,并重復(fù)2)插入緩存隊(duì)列。
[0019]3、部署后臺(tái)處理程序,讀取redis緩存隊(duì)列,對(duì)數(shù)據(jù)進(jìn)行處理,通過(guò)crontab方式運(yùn)行Php腳本,從隊(duì)列內(nèi)逐條讀取數(shù)據(jù),進(jìn)行程序分析,分發(fā)到數(shù)據(jù)庫(kù)中。
[0020]4、根據(jù)實(shí)際的數(shù)據(jù)分析需求,分為帖子統(tǒng)計(jì)總表,帖子ip/pv/回復(fù)按日統(tǒng)計(jì)表,編輯用戶(hù)表,ip統(tǒng)計(jì)表,編輯操作表,用戶(hù)訪(fǎng)問(wèn)深度表,用戶(hù)行文統(tǒng)計(jì)表,用戶(hù)終端特性表,用戶(hù)登錄統(tǒng)計(jì)表,板塊ip/pv/回復(fù)表,爬蟲(chóng)記錄表,爬蟲(chóng)來(lái)訪(fǎng)數(shù)據(jù)表,搜索引擎來(lái)源統(tǒng)計(jì)表,停留時(shí)間表,用戶(hù)辨認(rèn)表以及分表,共84個(gè)數(shù)據(jù)庫(kù)表文件,用于數(shù)據(jù)記錄。如圖3所示。
[0021]5、根據(jù)圖2、3所示,步驟3、4中分析得到的數(shù)據(jù)通過(guò)jquery和chart組件,對(duì)數(shù)據(jù)進(jìn)行可視化展示,根據(jù)實(shí)際需求進(jìn)行展示方式的設(shè)置,使用LAMP架構(gòu),實(shí)現(xiàn)數(shù)據(jù)可視化。
[0022]本發(fā)明方法具體包括以下步驟:
(I)添加數(shù)據(jù)統(tǒng)計(jì)代碼和設(shè)置數(shù)據(jù)傳輸代碼。
[0023](2)部署后臺(tái)可讀取redis緩存隊(duì)列處理程序。
[0024](3)根據(jù)要求分成84個(gè)表文件用于記錄數(shù)據(jù)。
[0025](4)實(shí)現(xiàn)數(shù)