一種根據(jù)用戶行為提煉關(guān)鍵字并智能分發(fā)的方法
【專利摘要】本發(fā)明的公開了一種根據(jù)用戶行為提煉關(guān)鍵字并實現(xiàn)資訊智能分發(fā)的方法,服務(wù)器會為每個用戶建立個人數(shù)據(jù)庫,還有每30分鐘關(guān)鍵字評分表,用戶每看一條資訊,服務(wù)器都會分析該資訊包含哪些關(guān)鍵字,并在歷史數(shù)據(jù)關(guān)鍵字評分表中對這些關(guān)鍵字進行加分,等用戶下次請求資訊時,服務(wù)器會先分析用戶近30分鐘的瀏覽記錄,若30分鐘內(nèi),瀏覽記錄多于10條,則根據(jù)30分鐘內(nèi),瀏覽記錄最多的關(guān)鍵字,下發(fā)資訊,若否,服務(wù)器會優(yōu)先下發(fā)歷史數(shù)據(jù)關(guān)鍵字評分表中分?jǐn)?shù)較高的關(guān)鍵字對應(yīng)的資訊,上述方法即可實現(xiàn)按用戶所需和興趣愛好推薦服務(wù)的功能。
【專利說明】一種根據(jù)用戶行為提煉關(guān)鍵字并智能分發(fā)的方法
[0001]
【技術(shù)領(lǐng)域】: 本發(fā)明涉及智能手機閱讀軟件的資訊智能分發(fā)【技術(shù)領(lǐng)域】,特別地涉及一種互聯(lián)網(wǎng)應(yīng)用 軟件的資訊智能分發(fā)的技術(shù)方法。
[0002]
【背景技術(shù)】: 隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,每天在我們的生活中出現(xiàn)了大量的信息,新聞信息飛速增加、 廣告信息鋪天蓋地、科技信息飛速遞增。很多時候,用戶并不想、也無法接受那么多的信息 量,更加無法有效找到自身感興趣的內(nèi)容。目前,市面上的資訊聚合類軟件,大多都只是通 過設(shè)置頻道、或者讓用戶選擇標(biāo)簽的方式,來區(qū)分用戶群體,未能實現(xiàn)每個用戶差異化、智 能化分發(fā)。
[0003]根據(jù)用戶行為提煉關(guān)鍵字并智能分發(fā)資訊,解決了用戶無法有效找到喜愛內(nèi)容的 問題,在算法邏輯上尚屬首創(chuàng)。針對活躍用戶,效果尤其明顯。
[0004]實現(xiàn)資訊智能分發(fā),通過分析用戶所有的瀏覽記錄,以及近30分鐘的瀏覽記錄, 提煉出用戶最喜歡的關(guān)鍵字是哪些,并儲存在用戶的個人數(shù)據(jù)庫中。以后,用戶請求資訊, 服務(wù)器會根據(jù)該用戶個人數(shù)據(jù)庫中的關(guān)鍵字信息,自動匹配用戶喜歡的資訊內(nèi)容,分發(fā)給 用戶。
[0005]
【發(fā)明內(nèi)容】
: 本發(fā)明的主要內(nèi)容是提供一種根據(jù)用戶行為提煉關(guān)鍵字并實現(xiàn)資訊智能分發(fā)的方法, 以解決現(xiàn)有的資訊類軟件,無法識別用戶興趣和行為的不同,按用戶所需和興趣愛好推薦 服務(wù)的功能; 為解決上述問題,提供如下解決方案: :、服務(wù)器建立一個關(guān)鍵字庫,包含大量網(wǎng)絡(luò)上、日常生活會碰到的關(guān)鍵字; 一、服務(wù)器會為每個用戶建立個人數(shù)據(jù)庫,包含兩個關(guān)鍵字評分表-歷史數(shù)據(jù)關(guān)鍵 字評分表,以及30分鐘關(guān)鍵字評分表。用戶每看一條資訊,服務(wù)器都會分析該資訊包含哪 些關(guān)鍵字,并在歷史數(shù)據(jù)關(guān)鍵字評分表中對這些關(guān)鍵字進行加分,等用戶下次請求資訊時, 服務(wù)器會先分析用戶近30分鐘的瀏覽記錄,若30分鐘內(nèi),瀏覽記錄多于 10條,則根據(jù)3〇 分鐘內(nèi),瀏覽記錄最多的關(guān)鍵字,下發(fā)資訊,若否,服務(wù)器會優(yōu)先下發(fā)歷史數(shù)據(jù)關(guān)鍵字評分 表中分?jǐn)?shù)較高的關(guān)鍵字對應(yīng)的資訊。
[0006]
【專利附圖】
【附圖說明】: 圖1 :用戶歷史數(shù)據(jù)關(guān)鍵字評分表 圖2 :用戶30分鐘關(guān)鍵字評分表
【具體實施方式】: 1、資訊軟件發(fā)布的每一條資訊,在后臺已通過文本數(shù)據(jù)挖掘的方法,分析出了關(guān)鍵字 是哪些。當(dāng)用戶查看了某一條資訊,我們默認(rèn)為用戶喜歡這條資訊,于是,我們對這些關(guān)鍵 字進行加分,對其余關(guān)鍵字進行減分,最終保證總分為零。
[0007]設(shè)現(xiàn)在共有關(guān)鍵詞N個,總分為M,設(shè)每個關(guān)鍵詞對應(yīng)的分 數(shù)為哪最初狀態(tài),每個關(guān)鍵詞對應(yīng)的分?jǐn)?shù)為0,即 M1=財2, =。.伽=A+1+ …+A := 0。
[0008] 當(dāng)用戶查看一條資訊不抽、Λ、、 、'不妨奴這條資訊有k個關(guān)鍵詞,對應(yīng)分?jǐn)?shù)為 MvMZf M3r......< AQ。
[0009] 當(dāng)用戶看完這條資訊后脂么取』 一 '服務(wù)器對該用戶的這k個關(guān)鍵詞進行加分,即 11% + i.= .i,M2 =仏 +1 = i:'以. .,... ..... ...: 4 千, 1 ^ 2 2 1 = Λ?3 - 1 = 1,……,=Mk + lCL,對剩 下的iV - 個關(guān)鍵詞進訂減分,每個苦鍵空、#八 丨天鍵子減分一樣多,同時要保證總分Μ恒等于0,即 :處_ . * Λ?, , -· Λ? ju -j - ~一~ ? iVl = // _ ^ ( . . :? ,+1 V~f:卜二"k+2 ......,?- 1 = 廣丄, 最終,總分 :M Μ:Σ^ι'Μ,M *f % +, m' +^,.,:m^· .., .C i (-? i 卞 1) 了(? 一 1) +......+ (乂 + i) + (仏+1 _ 5) + {Mk+2 ΛΓ-fe) + + (^JV-1 - - ( Λ? ν - -i-'j = f;lf1 _ -L --…丁'丄…"了叫-1 + Wv) + fl . k- (ΛΓ - fc) _ 4 = ¢+ 0 = 〇 L 'V - k] 如果用戶蒲另-條錢,同_,那絲訊對麵關(guān)麵各加丨分,其余關(guān)鍵字分?jǐn)?減分,保證總分為零。
[0010] 2、每個用戶都有兩個關(guān)鍵字評分表(如圖i、圖2),一個是歷史數(shù)據(jù)的關(guān)鍵字評分 表,另一個是近30分鐘的關(guān)鍵字評分表。
[0011] 3、服務(wù)器每隔一分鐘,會分析每個用戶近30分鐘的瀏覽記錄,如果某用戶 30分鐘內(nèi)瀏覽記錄少于10條,不進行分析,如果該用戶3〇分鐘內(nèi)瀏覽記錄多于或等 于10條,對該用戶的這些記錄進行分析:假設(shè)用戶3〇分鐘內(nèi)看了條資訊,包含 了 η (η > 0)個關(guān)鍵字,它們對應(yīng)的分?jǐn)?shù)為M r Μ:, M3…_,每個關(guān)鍵字出現(xiàn)的次數(shù)分別是 …..-KM £ (1.2.3......n),fc,.,則服務(wù)器會對這11個關(guān)鍵字加分,即各個關(guān)鍵字的 r 新分?jǐn)?shù)Α? = Α?,,fii = ,財,=財3 + 灸3 ........時,1 一 財"..。 d 的單鍵窣令教衷,毎分鐘計算-次。當(dāng)某個用戶請求資訊時,服 務(wù)器會優(yōu)先判斷該用戶30分鐘內(nèi)哪個關(guān)鍵字分?jǐn)?shù)最高,如果用戶30分鐘內(nèi)沒有閱讀過資 訊,則30分鐘關(guān)鍵字評分表中各關(guān)鍵字分?jǐn)?shù)為零,直接跳到第七步;否則,若3〇分鐘內(nèi)關(guān)鍵 字評分表中,有至少1個關(guān)鍵字分?jǐn)?shù)大于零,則服務(wù)器會判斷該用戶哪個關(guān)鍵字分?jǐn)?shù)最高, 假設(shè)該用戶 3〇分鐘評分表中得分最高的關(guān)鍵字是A (如果有兩個或多個關(guān)鍵字同分,隨機 取其中一個),則服務(wù)器從資訊池中尋找包含關(guān)鍵字A的資訊,由于用戶每次請求資訊,服務(wù) 器都是返回十條數(shù)據(jù)(資訊),故服務(wù)器還需分析出剩下的9條資訊應(yīng)該選擇哪些內(nèi)容,方法 是服務(wù)器繼續(xù)分析用戶近30分鐘關(guān)鍵字評分表,找到排除關(guān)鍵字A后,30分鐘內(nèi)得分最高 的關(guān)鍵字B (如果有兩個或多個關(guān)鍵字同分,隨機取其中一個),并從資訊池中尋找包含關(guān)鍵 字B的資訊,還需分析出剩下8條資訊怎么選擇,再找到排除 A、b關(guān)鍵字后,得分最高的關(guān) 鍵字C,并從資訊池中尋找包含關(guān)鍵字c的資訊,……,如此反復(fù),直到服務(wù)器找到了 7條資 訊,之后,服務(wù)器從資訊池中隨機抽取3條資訊(無需分析關(guān)鍵字),組裝成10條資訊,一并 分發(fā)給用戶; 5、假設(shè)用戶30分鐘內(nèi),沒有瀏覽資訊,3〇分鐘關(guān)鍵字分?jǐn)?shù)表中,各關(guān)鍵字分?jǐn)?shù)都為零。 此時,服務(wù)器會根據(jù)用戶歷史數(shù)據(jù)關(guān)鍵字評分表來分發(fā)資訊,具體方法是:假設(shè)該用戶歷史 數(shù)據(jù)評分表中,分?jǐn)?shù)最高的關(guān)鍵字是A (如果有兩個或多個關(guān)鍵字同分,隨機取其中一個), 則服務(wù)器從資訊池中尋找包含關(guān)鍵字A的資訊,由于用戶每次請求資訊,服務(wù)器都是返回 1〇條數(shù)據(jù)(資訊),故服務(wù)器還需分析出剩下的 9條資訊應(yīng)該選擇哪些內(nèi)容,方法是服務(wù)器 繼續(xù)^析用戶歷史數(shù)據(jù)關(guān)鍵字評分表,找到排除關(guān)鍵字A后,歷史數(shù)據(jù)關(guān)鍵字評分表中得 =最高=關(guān)鍵字B (如果有兩個或多個關(guān)鍵字同分,隨機取其中一個),并從資訊池中尋找包 含關(guān)鍵字B的資訊,還需分析剩下8條資訊怎么選擇,再找到排除 A、b關(guān)鍵字后,得分最高 的j鍵字C,并從資訊池中尋找包含關(guān)鍵字c的資訊,……,如此反復(fù),直到服務(wù)器找到了 7 條資訊,之后,服務(wù)器從資訊池中隨機抽取3條資訊,組裝成1〇條資訊,一并分發(fā)給用戶。
【權(quán)利要求】
1. 一種提煉關(guān)鍵字,并實現(xiàn)資訊智能分發(fā)的方法,其特征在于,所述方法包括: 對每個用戶建立個人數(shù)據(jù)庫,包括兩個關(guān)鍵字評分表一用戶歷史數(shù)據(jù)關(guān)鍵字評分 表,以及用戶30分鐘關(guān)鍵字評分表,對每個關(guān)鍵字賦值(每個關(guān)鍵字初值為零),并在用戶查 看資訊后,進行加分、減分操作,然后再通過分值高低,實現(xiàn)資訊的智能分發(fā)。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 在用戶歷史數(shù)據(jù)關(guān)鍵字評分表中,每個關(guān)鍵字有對應(yīng)的分?jǐn)?shù),初始值均為零,用戶看了 某條資訊,該資訊會包含一個(或幾個)關(guān)鍵字,這些關(guān)鍵字的分值會加一分,其余關(guān)鍵字需 要減去同樣的分?jǐn)?shù),且最終要保證所有關(guān)鍵字的分?jǐn)?shù)之和仍然等于零。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 在用戶30分鐘關(guān)鍵字評分表中,每個關(guān)鍵字有對應(yīng)的分?jǐn)?shù),初始值均為零,服務(wù)器每 分鐘分析一次用戶近30分鐘查看了哪些資訊,從而分析出這些資訊出現(xiàn)了哪些關(guān)鍵字(有 些關(guān)鍵字會出現(xiàn)多次),對這些關(guān)鍵字進行相應(yīng)的加分(某個關(guān)鍵字出現(xiàn)幾次就加幾分)。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 當(dāng)用戶近30分鐘有瀏覽資訊的記錄時,服務(wù)器優(yōu)先根據(jù)用戶近30分鐘的行為智能分 發(fā)資訊,當(dāng)用戶近30分鐘沒有瀏覽資訊時,服務(wù)器會根據(jù)用戶歷史行為智能分發(fā)資訊。
5. 根據(jù)權(quán)利要求4的方法,其特征在于,還包括: 若用戶近30分鐘沒有瀏覽資訊,服務(wù)器會根據(jù)用戶歷史行為智能分發(fā)資訊,具體方法 為,利用前述方法,確定用戶瀏覽最多的關(guān)鍵字,優(yōu)先分發(fā)包含該關(guān)鍵字的資訊,再確定用 戶瀏覽第二多的關(guān)鍵字,繼續(xù)分發(fā)包含該關(guān)鍵字的資訊,再確定用戶瀏覽第三多的關(guān)鍵字, 分發(fā)包含該關(guān)鍵字的資訊,如此反復(fù),直到湊齊7條資訊,剩下的3條資訊從資訊池中隨機 獲取。
6. 根據(jù)權(quán)利要求4的方法,其特征在于,還包括: 若用戶近30分鐘有瀏覽資訊,服務(wù)器會根據(jù)用戶近30分鐘的行為智能分發(fā)資訊,具體 方法為,利用前述方法,確定用戶近30分鐘瀏覽最多的關(guān)鍵字,優(yōu)先分發(fā)包含該關(guān)鍵字的 資訊,再確定用戶瀏覽第二多的關(guān)鍵字,繼續(xù)分發(fā)包含該關(guān)鍵字的資訊,再確定用戶瀏覽第 三多的關(guān)鍵字,分發(fā)包含該關(guān)鍵字的資訊,如此反復(fù),直到湊齊7條資訊(若出現(xiàn)30分鐘內(nèi), 用戶瀏覽過的關(guān)鍵字?jǐn)?shù)量太少,則余下的資訊從資訊池中隨機選擇),剩下的3條資訊從資 訊池中隨機獲取。
7. 根據(jù)權(quán)利要求4的方法,其特征在于,還包括: 只要用戶有不一樣的瀏覽記錄,根據(jù)算法規(guī)則,每個用戶拉取到的資訊是不一樣的,一 是因為各個用戶關(guān)鍵字評分不一樣,二是哪怕關(guān)鍵字評分一樣,資訊也是從資訊池中選擇, 而資訊池可用資訊很多,只能隨機選取其中的一個(或幾個),所以各用戶拉取到的資訊會 有一定不同。
8. 根據(jù)權(quán)利要求1的方法,其特征在于,還包括: 隨著某個用戶使用時間的增長,瀏覽記錄的增多,關(guān)鍵字評分表會越來越符合用戶的 真實喜好,通俗來說,就是"越看越精準(zhǔn)",比如用戶喜歡體育,是梅西的球迷,那么他平時會 更多地關(guān)注足球,梅西這一類的新聞,等時間久了,"梅西"這個關(guān)鍵字的評分會慢慢變高, 于是該用戶看到的資訊里面,包含"梅西"這個關(guān)鍵字的資訊也會越來越多。
【文檔編號】G06F17/30GK104298703SQ201410356356
【公開日】2015年1月21日 申請日期:2014年7月25日 優(yōu)先權(quán)日:2014年7月25日
【發(fā)明者】不公告發(fā)明人 申請人:深圳市英威諾科技有限公司