用戶行為分析的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息技術(shù),特別涉及用戶行為分析的方法。
【背景技術(shù)】
[0002]用戶行為分析在電子商務(wù)、智能營(yíng)銷等領(lǐng)域廣泛應(yīng)用,是收集用戶的控制動(dòng)作信息,分析用戶在使用資源時(shí)表現(xiàn)出來(lái)的規(guī)律、個(gè)性化的習(xí)慣,并生成用戶偏好信息。
[0003]智能電視的問世,改變了用戶觀看電視節(jié)目的傳統(tǒng),實(shí)現(xiàn)讓用戶通過(guò)移動(dòng)端(手機(jī)、平板等)觀看電視的功能。大數(shù)據(jù)對(duì)用戶使用移動(dòng)端產(chǎn)生的行為屬性進(jìn)行了采集和存儲(chǔ),利用大數(shù)據(jù)對(duì)用戶行為進(jìn)行分析,提取用戶興趣,了解其特點(diǎn),一方面可以進(jìn)行用戶個(gè)性化定制和推送,另一方面可以優(yōu)化完善移動(dòng)端APP界面組織,提升界面交互能力,使用戶操作更加簡(jiǎn)潔。
【發(fā)明內(nèi)容】
[0004]本發(fā)明要解決的技術(shù)問題是:提供一種用戶行為分析的方法,獲取用戶行為數(shù)據(jù),并對(duì)用戶進(jìn)行分析,將分析結(jié)果展示給商家。
[0005]為解決上述問題,本發(fā)明采用的技術(shù)方案是:用戶行為分析的方法,包括如下步驟:
[0006]a.采集用戶的行為數(shù)據(jù),并上傳給數(shù)據(jù)處理系統(tǒng);
[0007]b.數(shù)據(jù)處理系統(tǒng)對(duì)上傳的行為數(shù)據(jù)進(jìn)行處理;
[0008]c.周期性地從數(shù)據(jù)處理系統(tǒng)中抽取數(shù)據(jù),并存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng);
[0009]d.依據(jù)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中的存儲(chǔ)數(shù)據(jù)確定用戶的行為分析維度,并依據(jù)所述行為分析維度在數(shù)據(jù)庫(kù)管理系統(tǒng)中建立數(shù)據(jù)庫(kù)模型;
[0010]e.從數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中抽取出目標(biāo)數(shù)據(jù),對(duì)目標(biāo)數(shù)據(jù)進(jìn)行清洗和轉(zhuǎn)換,將清洗和轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行匯總分析,并將匯總分析后的結(jié)果數(shù)據(jù)加載到數(shù)據(jù)庫(kù)管理系統(tǒng)的對(duì)應(yīng)數(shù)據(jù)表中;
[0011]f.將所述結(jié)果數(shù)據(jù)進(jìn)行各類圖形展示。
[0012]進(jìn)一步的,步驟a中所述行為數(shù)據(jù)包括用戶點(diǎn)播的內(nèi)容及格式。
[0013]進(jìn)一步的,步驟a中的行為數(shù)據(jù)以json格式上傳給數(shù)據(jù)處理系統(tǒng)。
[0014]進(jìn)一步的,步驟d中數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的存儲(chǔ)數(shù)據(jù)包括節(jié)目類型、節(jié)目名稱、觀看記錄數(shù)、觀看人數(shù)。
[0015]進(jìn)一步的,在進(jìn)行抽取目標(biāo)數(shù)據(jù)時(shí),以數(shù)據(jù)上報(bào)到的時(shí)間作為分區(qū)字段抽取數(shù)據(jù)。
[0016]進(jìn)一步的,步驟e中的清洗指:剔除不完整的數(shù)據(jù)、賣場(chǎng)機(jī)以及測(cè)試機(jī)上報(bào)的干擾數(shù)據(jù)。
[0017]本發(fā)明的有益效果是:通過(guò)定期獲取用戶行為,經(jīng)過(guò)清洗、轉(zhuǎn)換、匯總分析后,最終按照預(yù)先定義好的數(shù)據(jù)庫(kù)模型把匯總分析好的結(jié)果數(shù)據(jù)加載到對(duì)應(yīng)表中去,商家能夠有效精準(zhǔn)的用戶推送,優(yōu)化移動(dòng)端APP界面組織,提升用戶體驗(yàn),增加移動(dòng)端APP及電視的使用量。
【附圖說(shuō)明】
[0018]圖1為實(shí)施例方法的流程圖
【具體實(shí)施方式】
[0019]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明進(jìn)一步說(shuō)明。
[0020]用戶在點(diǎn)播過(guò)程中,行為數(shù)據(jù)量大,且用戶喜好電視節(jié)目具有近期有效性,如一部電影,從上映到后續(xù)一段時(shí)間內(nèi)受到用戶關(guān)注度較大,我們?cè)诜治鲞@類數(shù)據(jù)的時(shí)候不需要全量掃描所有行為數(shù)據(jù),因此數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)可以選用hive。hive是一種基于Hadoop的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫(kù)表,并提供簡(jiǎn)單的sql查詢功能,同時(shí)hive的分區(qū)存儲(chǔ)機(jī)制大大節(jié)省數(shù)據(jù)掃描分析時(shí)間。
[0021]本發(fā)明選用kafka對(duì)行為數(shù)據(jù)進(jìn)行處理,kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),它可以處理消費(fèi)者規(guī)模的網(wǎng)站中的所有動(dòng)作流數(shù)據(jù),具有如下特性通過(guò)0(1)的磁盤數(shù)據(jù)結(jié)構(gòu)提供消息的持久化,這種結(jié)構(gòu)對(duì)于即使數(shù)以TB的消息存儲(chǔ)也能夠保持長(zhǎng)時(shí)間的穩(wěn)定性能高吞吐量:即使是非常普通的硬件kafka也可以支持每秒數(shù)十萬(wàn)的消息;ii1.支持通過(guò)kafka服務(wù)器和消費(fèi)機(jī)集群來(lái)分區(qū)消息;iv.支持Hadoop并行數(shù)據(jù)加載。
[0022]數(shù)據(jù)庫(kù)管理系統(tǒng)選用mysql,mysql具有用于存儲(chǔ)不同數(shù)據(jù)的數(shù)據(jù)表,不同數(shù)據(jù)的數(shù)據(jù)表可以方便的存儲(chǔ)不同數(shù)據(jù),且還兼具體積小、速度快、總體擁有成本低、開放源碼的特點(diǎn)。
[0023]如圖1所示,本發(fā)明具體實(shí)現(xiàn)步驟如下:
[0024]1.采集用戶點(diǎn)播的內(nèi)容、格式等行為數(shù)據(jù),并將行為數(shù)據(jù)以以json格式上傳給kafka ο其中,行為數(shù)據(jù)以json格式傳送到kafka進(jìn)行處理,json作為一種輕量級(jí)的數(shù)據(jù)格式,具有傳輸效率高的特點(diǎn)。
[0025]2.kafka對(duì)行為數(shù)據(jù)進(jìn)行處理;
[0026]3.每天定時(shí)地從kafka中抽取數(shù)據(jù),并加載到hive中。
[0027]4.依據(jù)hive中的節(jié)目類型、節(jié)目名稱、觀看記錄數(shù)、觀看人數(shù)等數(shù)據(jù),確定用戶的行為分析維度,并依據(jù)所述行為分析維度在mysql中建立數(shù)據(jù)倉(cāng)庫(kù)模型。
[0028]5.從hive中抽取出目標(biāo)數(shù)據(jù),并對(duì)目標(biāo)數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換。
[0029]在進(jìn)行抽取目標(biāo)數(shù)據(jù)時(shí),我們可以數(shù)據(jù)上報(bào)到的時(shí)間p_log_date作為分區(qū)字段,抽取有效時(shí)間內(nèi)用戶行為數(shù)據(jù),提高數(shù)據(jù)清洗分析效率。
[0030]上述清洗指剔除不完整的數(shù)據(jù)、賣場(chǎng)機(jī)以及測(cè)試機(jī)上報(bào)的干擾數(shù)據(jù),以保證最后用戶行為分析結(jié)果的準(zhǔn)確性。清洗的具體步驟為:根據(jù)給賣場(chǎng)機(jī)用戶機(jī)打的標(biāo)記,剔除isprototype = ' Γ or isprototype = ’ true’代表的賣場(chǎng)機(jī)數(shù)據(jù);測(cè)試機(jī)可根據(jù)電視軟件版本排除,以及用IP定位,通過(guò)IP地址剔除公司(企業(yè))內(nèi)部測(cè)試機(jī)。
[0031]6.將清洗和轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行匯總分析,并將匯總分析后的結(jié)果數(shù)據(jù)加載到數(shù)據(jù)庫(kù)管理系統(tǒng)的對(duì)應(yīng)數(shù)據(jù)表中。
[0032]7.對(duì)結(jié)果數(shù)據(jù)進(jìn)行各類圖形展示。可直觀看出近段時(shí)間(近一個(gè)月),每個(gè)節(jié)目類型下的節(jié)目觀看排行情況,供業(yè)務(wù)查看及進(jìn)行深度分析。商家根據(jù)深度分析的結(jié)果能夠有效、精準(zhǔn)地進(jìn)行用戶推送,優(yōu)化移動(dòng)端APP界面組織,提升用戶體驗(yàn),增加移動(dòng)端APP及電視的使用量。
[0033]本發(fā)明通過(guò)對(duì)數(shù)據(jù)的精準(zhǔn)分析,準(zhǔn)確定位用戶喜好,方便用戶使用,提升用戶體驗(yàn),增加移動(dòng)端APP及電視的使用量。
[0034]以上描述了本發(fā)明的基本原理和主要的特征,說(shuō)明書的描述只是說(shuō)明本發(fā)明的原理,在不脫離本發(fā)明精神和范圍的前提下,本發(fā)明還會(huì)有各種變化和改進(jìn),這些變化和改進(jìn)都落入要求保護(hù)的本發(fā)明范圍內(nèi)。
【主權(quán)項(xiàng)】
1.用戶行為分析的方法,其特征在于,包括如下步驟: a.采集用戶的行為數(shù)據(jù),并上傳給數(shù)據(jù)處理系統(tǒng); b.數(shù)據(jù)處理系統(tǒng)對(duì)上傳的行為數(shù)據(jù)進(jìn)行處理; c.周期性地從數(shù)據(jù)處理系統(tǒng)中抽取數(shù)據(jù),并存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng); d.依據(jù)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中的存儲(chǔ)數(shù)據(jù)確定用戶的行為分析維度,并依據(jù)所述行為分析維度在數(shù)據(jù)庫(kù)管理系統(tǒng)中建立數(shù)據(jù)庫(kù)模型; e.從數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中抽取出目標(biāo)數(shù)據(jù),對(duì)目標(biāo)數(shù)據(jù)進(jìn)行清洗和轉(zhuǎn)換,將清洗和轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行匯總分析,并將匯總分析后的結(jié)果數(shù)據(jù)加載到數(shù)據(jù)庫(kù)管理系統(tǒng)的對(duì)應(yīng)數(shù)據(jù)表中; f.將所述結(jié)果數(shù)據(jù)進(jìn)行各類圖形展示。2.根據(jù)權(quán)利要求1所述的用戶行為分析的方法,其特征在于,步驟a中所述行為數(shù)據(jù)包括用戶點(diǎn)播的內(nèi)容及格式。3.根據(jù)權(quán)利要求1所述的用戶行為分析的方法,其特征在于,步驟a中的行為數(shù)據(jù)以json格式上傳給數(shù)據(jù)處理系統(tǒng)。4.根據(jù)權(quán)利要求1所述的用戶行為分析的方法,其特征在于,步驟d中數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的存儲(chǔ)數(shù)據(jù)包括節(jié)目類型、節(jié)目名稱、觀看記錄數(shù)、觀看人數(shù)。5.根據(jù)權(quán)利要求1所述的用戶行為分析的方法,其特征在于,步驟e中,在進(jìn)行抽取目標(biāo)數(shù)據(jù)時(shí),以數(shù)據(jù)上報(bào)到的時(shí)間作為分區(qū)字段抽取數(shù)據(jù)。6.根據(jù)權(quán)利要求1所述的用戶行為分析的方法,其特征在于,步驟e中的清洗指:剔除不完整的數(shù)據(jù)、賣場(chǎng)機(jī)以及測(cè)試機(jī)上報(bào)的干擾數(shù)據(jù)。
【專利摘要】本發(fā)明涉及信息技術(shù)領(lǐng)域,提供一種用戶行為分析的方法,獲取用戶行為數(shù)據(jù),并對(duì)用戶進(jìn)行分析,將分析結(jié)果展示給商家。本方法包括:采集用戶的行為數(shù)據(jù),并上傳給數(shù)據(jù)處理系統(tǒng);數(shù)據(jù)處理系統(tǒng)對(duì)上傳的行為數(shù)據(jù)進(jìn)行處理;周期性地從數(shù)據(jù)處理系統(tǒng)中抽取數(shù)據(jù),并存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng);依據(jù)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中的存儲(chǔ)數(shù)據(jù)確定用戶的行為分析維度,并依據(jù)所述行為分析維度在數(shù)據(jù)庫(kù)管理系統(tǒng)中建立數(shù)據(jù)庫(kù)模型;從數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中抽取出目標(biāo)數(shù)據(jù),對(duì)目標(biāo)數(shù)據(jù)進(jìn)行清洗和轉(zhuǎn)換,將清洗和轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行匯總分析,并將匯總分析后的結(jié)果數(shù)據(jù)加載到數(shù)據(jù)庫(kù)管理系統(tǒng)的對(duì)應(yīng)數(shù)據(jù)表中;將所述結(jié)果數(shù)據(jù)進(jìn)行各類圖形展示。發(fā)明適用于智能電視。
【IPC分類】G06F17/30
【公開號(hào)】CN105426478
【申請(qǐng)?zhí)枴緾N201510797227
【發(fā)明人】滕娜娜, 杜科, 唐軍, 梁敏, 羅弦, 漆堯, 唐永瑞
【申請(qǐng)人】四川長(zhǎng)虹電器股份有限公司
【公開日】2016年3月23日
【申請(qǐng)日】2015年11月18日