推薦網(wǎng)絡(luò)信息的方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種推薦網(wǎng)絡(luò)信息的方法和系統(tǒng)。所述方法包括:根據(jù)網(wǎng)絡(luò)信息的點擊次數(shù)對網(wǎng)絡(luò)平臺中的網(wǎng)絡(luò)信息進行劃分得到信息集合和對應的評級;對信息集合中的網(wǎng)絡(luò)信息進行特征抽取得到瀏覽行為特征,并根據(jù)所述瀏覽行為特征訓練得到所述信息集合對應的分類模型;將更新的網(wǎng)絡(luò)信息輸入分類模型得到所屬的信息集合;根據(jù)所述更新的網(wǎng)絡(luò)信息所屬的信息集合對應的評級進行所述更新的網(wǎng)絡(luò)信息的推薦。所述系統(tǒng)包括:信息處理模塊、特征處理模塊、預測模塊以及推薦模塊。采用本發(fā)明能提高推薦的準確性。
【專利說明】推薦網(wǎng)絡(luò)信息的方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息處理技術(shù),特別是涉及一種推薦網(wǎng)絡(luò)信息的方法和系統(tǒng)。
【背景技術(shù)】
[0002]各種各樣的論壇、門戶網(wǎng)站等網(wǎng)絡(luò)平臺通過互聯(lián)網(wǎng)絡(luò)為用戶提供大量的網(wǎng)絡(luò)信息,例如,論壇中發(fā)布的文章、門戶網(wǎng)站中更新的新聞等。每一個為用戶提供網(wǎng)絡(luò)信息的網(wǎng)絡(luò)平臺所擁有以及更新的網(wǎng)絡(luò)信息數(shù)量是非常龐大的,為了避免用戶淹沒于海量網(wǎng)絡(luò)信息中,常常對網(wǎng)絡(luò)信息進行篩選,將篩選得到的網(wǎng)絡(luò)信息推薦給用戶。
[0003]傳統(tǒng)的網(wǎng)絡(luò)信息推薦方法包括了編輯的挑選推薦和基于網(wǎng)絡(luò)信息質(zhì)量的智能推薦。編輯的挑選推薦主要是由編輯依據(jù)個人經(jīng)驗進行網(wǎng)絡(luò)信息的挑選,以挑選出個人認為可能受歡迎的網(wǎng)絡(luò)信息;基于網(wǎng)絡(luò)信息質(zhì)量的智能推薦是由編輯挑選語料,通過語料訓練出與網(wǎng)絡(luò)信息質(zhì)量相關(guān)的預測模型,進而將網(wǎng)絡(luò)平臺中更新的網(wǎng)絡(luò)信息輸入預測模型中得到相應的質(zhì)量評分,將一定數(shù)量的質(zhì)量評分較高的網(wǎng)絡(luò)信息推薦給用戶。
[0004]然而,對于編輯的挑選推薦而言,所挑選得到的網(wǎng)絡(luò)信息大都與編輯自身的品味和知識背景等因素相關(guān),但這些網(wǎng)絡(luò)信息并不一定是用戶所喜歡的,因此,這一網(wǎng)絡(luò)信息推薦方法較為隨意,無法準確地推薦符合用戶意圖的網(wǎng)絡(luò)信息。
[0005]對于基于網(wǎng)絡(luò)信息質(zhì)量的智能推薦而言,形成預測模型的語料也是由編輯挑選的,因此,也存在著無法準確地推薦符合用戶意圖的網(wǎng)絡(luò)信息的問題。
【發(fā)明內(nèi)容】
[0006]基于此,提供一種能提高準確性的推薦網(wǎng)絡(luò)信息的方法。
[0007]此外,還有必要提供一種能提高準確性的推薦網(wǎng)絡(luò)信息的系統(tǒng)。
[0008]一種推薦網(wǎng)絡(luò)信息的方法,包括如下步驟:
[0009]根據(jù)網(wǎng)絡(luò)信息的點擊次數(shù)對網(wǎng)絡(luò)平臺中的網(wǎng)絡(luò)信息進行劃分得到信息集合和對應的評級;
[0010]對信息集合中的網(wǎng)絡(luò)信息進行特征抽取得到瀏覽行為特征,并根據(jù)所述瀏覽行為特征訓練得到所述信息集合對應的分類模型;
[0011]將更新的網(wǎng)絡(luò)信息輸入分類模型得到所屬的信息集合;
[0012]根據(jù)所述更新的網(wǎng)絡(luò)信息所屬的信息集合對應的評級進行所述更新的網(wǎng)絡(luò)信息的推薦。
[0013]一種推薦網(wǎng)絡(luò)信息的系統(tǒng),其特征在于,包括:
[0014]信息處理模塊,用于根據(jù)網(wǎng)絡(luò)信息的點擊次數(shù)對網(wǎng)絡(luò)平臺中的網(wǎng)絡(luò)信息進行劃分得到信息集合和對應的評級;
[0015]特征處理模塊,用于對信息集合中的網(wǎng)絡(luò)信息進行特征抽取得到瀏覽行為特征,并根據(jù)所述瀏覽行為特征訓練得到所述信息集合對應的分類模型;
[0016]預測模塊,用于將更新的網(wǎng)絡(luò)信息輸入分類模型得到所屬的信息集合;[0017]推薦模塊,用于根據(jù)所述更新的網(wǎng)絡(luò)信息所屬的信息集合對應的評級進行所述更新的網(wǎng)絡(luò)信息的推薦。
[0018]上述推薦網(wǎng)絡(luò)信息的方法和系統(tǒng),根據(jù)網(wǎng)絡(luò)信息的點擊次數(shù)對網(wǎng)絡(luò)平臺中的網(wǎng)絡(luò)信息進行劃分以得信息集合和對應的評級,然后從劃分的信息集合中逐一抽取網(wǎng)絡(luò)信息的瀏覽行為特征,以根據(jù)這一瀏覽行為特征進行訓練得到分類模型,進而將更新的網(wǎng)絡(luò)信息輸入分類模型中得到該網(wǎng)絡(luò)信息所屬的信息集合,從而根據(jù)該網(wǎng)絡(luò)信息所屬的信息集合對應的評級對更新的網(wǎng)絡(luò)信息進行推薦,由于網(wǎng)絡(luò)信息的點擊次數(shù)以及網(wǎng)絡(luò)信息的瀏覽行為特征均反映了用戶意思,因此根據(jù)網(wǎng)絡(luò)信息的點擊次數(shù)和瀏覽行為特征所實現(xiàn)的網(wǎng)絡(luò)信息推薦將有效地提高了準確性。
【專利附圖】
【附圖說明】
[0019]圖1為一個實施例中推薦網(wǎng)絡(luò)信息的方法流程圖;
[0020]圖2為另一個實施例中推薦網(wǎng)絡(luò)信息的方法流程圖;
[0021]圖3為一個實施例中根據(jù)網(wǎng)絡(luò)信息的點擊次數(shù)對網(wǎng)絡(luò)平臺中的網(wǎng)絡(luò)信息進行劃分得到信息集合和對應的評級的方法流程圖;
[0022]圖4為一個實施例中對信息集合中的網(wǎng)絡(luò)信息進行特征抽取得到瀏覽行為特征,并根據(jù)瀏覽行為特征訓練得到信息集合對應的分類模型的方法流程圖;
[0023]圖5為一個實施例中根據(jù)更新的網(wǎng)絡(luò)信息所屬的信息集合對應的評級進行更新的網(wǎng)絡(luò)信息的推薦的方法流程圖;
[0024]圖6為一個實施例中推薦網(wǎng)絡(luò)信息的應用示意圖;
[0025]圖7為另一個實施例中推薦網(wǎng)絡(luò)信息的原理示意圖;
[0026]圖8為圖6中推薦網(wǎng)絡(luò)信息的應用示意圖;
[0027]圖9為一個實施例中推薦網(wǎng)絡(luò)信息的結(jié)構(gòu)示意圖;
[0028]圖10為另一個實施例中推薦網(wǎng)絡(luò)信息的結(jié)構(gòu)示意圖;
[0029]圖11為一個實施例中信息處理模塊的結(jié)構(gòu)示意圖;
[0030]圖12為一個實施例中特征處理模塊的結(jié)構(gòu)示意圖;
[0031]圖13為一個實施例中推薦模塊的結(jié)構(gòu)示意圖。
【具體實施方式】
[0032]如圖1所示,在一個實施例中,一種推薦網(wǎng)絡(luò)信息的方法,包括如下步驟:
[0033]步驟S110,根據(jù)網(wǎng)絡(luò)信息的點擊次數(shù)對網(wǎng)絡(luò)平臺中的網(wǎng)絡(luò)信息進行劃分得到信息集合和對應的評級。
[0034]本實施例中,網(wǎng)絡(luò)信息的點擊次數(shù)是指網(wǎng)絡(luò)平臺中每一網(wǎng)絡(luò)信息所對應的點擊次數(shù),通常認為某一網(wǎng)絡(luò)信息的點擊次數(shù)較多,相應的,這一網(wǎng)絡(luò)信息的受歡迎程度也就越高。對網(wǎng)絡(luò)平臺中的若干個網(wǎng)絡(luò)信息按照點擊次數(shù)進行劃分,以得到多個信息集合以及信息集合所對應的評級,該評級與信息集合中網(wǎng)絡(luò)信息的點擊次數(shù)相關(guān),可用于衡量信息集合中的網(wǎng)絡(luò)信息受歡迎程度,評級越高則相應信息集合中的網(wǎng)絡(luò)信息越受歡迎。
[0035]例如,信息集合對應的評級可分為第一評級、第二評級和第三評級這三檔,第一評級所對應的信息集合中網(wǎng)絡(luò)信息的點擊次數(shù)均處于68至100的范圍之內(nèi),第二評級所對應的信息集合中網(wǎng)絡(luò)信息的點擊次數(shù)均處于34至67的范圍之內(nèi),第三評級所對應的信息集合中網(wǎng)絡(luò)信息的點擊次數(shù)均處于O至33的范圍內(nèi),根據(jù)上述每一評級所對應的范圍進行網(wǎng)絡(luò)平臺中網(wǎng)絡(luò)信息的劃分,進而將網(wǎng)絡(luò)平臺中的網(wǎng)絡(luò)信息劃分到相應的信息集合中,實現(xiàn)海量網(wǎng)絡(luò)信息的分類管理。
[0036]步驟S130,對信息集合中的網(wǎng)絡(luò)信息進行特征抽取得到瀏覽行為特征,并根據(jù)瀏覽行為特征訓練得到信息集合對應的分類模型。
[0037]本實施例中,如表1所示,瀏覽行為特征包括了網(wǎng)絡(luò)信息的瀏覽量、回復數(shù)。瀏覽趨勢等特征項,而表1中的范圍指的是每一特征項所對應的數(shù)值范圍。
[0038]
【權(quán)利要求】
1.一種推薦網(wǎng)絡(luò)信息的方法,包括如下步驟: 根據(jù)網(wǎng)絡(luò)信息的點擊次數(shù)對網(wǎng)絡(luò)平臺中的網(wǎng)絡(luò)信息進行劃分得到信息集合和對應的評級; 對信息集合中的網(wǎng)絡(luò)信息進行特征抽取得到瀏覽行為特征,并根據(jù)所述瀏覽行為特征訓練得到所述信息集合對應的分類模型; 將更新的網(wǎng)絡(luò)信息輸入分類模型得到所屬的信息集合; 根據(jù)所述更新的網(wǎng)絡(luò)信息所屬的信息集合對應的評級進行所述更新的網(wǎng)絡(luò)信息的推薦。
2.根據(jù)權(quán)利要求1所述的推薦網(wǎng)絡(luò)信息的方法,其特征在于,還包括: 將更新的網(wǎng)絡(luò)信息輸入分類模型得到其與所屬的信息集合對應的匹配值; 根據(jù)所述更新的網(wǎng)絡(luò)信息所屬的信息集合對應的評級和匹配值進行所述更新的網(wǎng)絡(luò)信息的推薦。
3.根據(jù)權(quán)利要求1或2所述的推薦網(wǎng)絡(luò)信息的方法,其特征在于,所述根據(jù)網(wǎng)絡(luò)信息的點擊次數(shù)對網(wǎng)絡(luò)平臺中的網(wǎng)絡(luò)信息進行劃分得到信息集合和對應的評級的步驟之前還包括: 獲取通過客戶端采 集得到的日志數(shù)據(jù)以及對應的用戶標識,根據(jù)所述日志數(shù)據(jù)對所述用戶標識進行聚類處理得到用戶集合。
4.根據(jù)權(quán)利要求3所述的推薦網(wǎng)絡(luò)信息的方法,其特征在于,所述根據(jù)網(wǎng)絡(luò)信息的點擊次數(shù)對網(wǎng)絡(luò)平臺中的網(wǎng)絡(luò)信息進行劃分得到信息集合和對應的評級的步驟包括: 對用戶集合中每一用戶標識所點擊的網(wǎng)絡(luò)信息進行次數(shù)統(tǒng)計,得到網(wǎng)絡(luò)信息在所述用戶集合中的點擊次數(shù); 根據(jù)所述網(wǎng)絡(luò)信息在所述用戶集合中的點擊次數(shù)對所述網(wǎng)絡(luò)信息進行劃分得到所述用戶集合對應的信息集合和評級; 將所述信息集合和所述用戶集合相關(guān)聯(lián)。
5.根據(jù)權(quán)利要求4所述的推薦網(wǎng)絡(luò)信息的方法,其特征在于,所述對信息集合中的網(wǎng)絡(luò)信息進行特征抽取得到瀏覽行為特征,并根據(jù)所述瀏覽行為特征訓練得到所述信息集合對應的分類模型的步驟包括: 在與所述用戶集合相關(guān)聯(lián)的信息集合中抽取網(wǎng)絡(luò)信息的瀏覽行為特征; 根據(jù)所述瀏覽行為特征訓練得到所述信息集合對應的分類模型,并將所述分類模型與用戶集合相關(guān)聯(lián)。
6.根據(jù)權(quán)利要求5所述的推薦網(wǎng)絡(luò)信息的方法,其特征在于,所述根據(jù)所述更新的網(wǎng)絡(luò)信息所屬的信息集合對應的評級進行所述更新網(wǎng)絡(luò)信息的推薦的步驟包括: 根據(jù)評級,或者,根據(jù)評級和匹配值選取輸入分類模型的網(wǎng)絡(luò)信息; 獲取當前登錄的用戶標識,判斷所述當前登錄的用戶標識是否存在于用戶集合中,若是,則根據(jù)當前登錄的用戶標識進行選取得到的網(wǎng)絡(luò)信息的推送,所述推送的網(wǎng)絡(luò)信息輸入的分類模型是與當前登錄的用戶標識所存在的用戶集合相關(guān)聯(lián)的。
7.一種推薦網(wǎng)絡(luò)信息的系統(tǒng),其特征在于,包括: 信息處理模塊,用于根據(jù)網(wǎng)絡(luò)信息的點擊次數(shù)對網(wǎng)絡(luò)平臺中的網(wǎng)絡(luò)信息進行劃分得到信息集合和對應的評級;特征處理模塊,用于對信息集合中的網(wǎng)絡(luò)信息進行特征抽取得到瀏覽行為特征,并根據(jù)所述瀏覽行為特征訓練得到所述信息集合對應的分類模型; 預測模塊,用于將更新的網(wǎng)絡(luò)信息輸入分類模型得到所屬的信息集合; 推薦模塊,用于根據(jù)所述更新的網(wǎng)絡(luò)信息所屬的信息集合對應的評級進行所述更新的網(wǎng)絡(luò)信息的推薦。
8.根據(jù)權(quán)利要求7所述的推薦網(wǎng)絡(luò)信息的系統(tǒng),其特征在于,所述預測模塊還用于將更新的網(wǎng)絡(luò)信息輸入分類模型得到其與所屬的信息集合對應的匹配值; 所述推薦模塊還用于根據(jù)所述更新的網(wǎng)絡(luò)信息所屬的信息集合對應的評級和匹配值進行所述更新的網(wǎng)絡(luò)信息的推薦。
9.根據(jù)權(quán)利要求7或8所述的推薦網(wǎng)絡(luò)信息的系統(tǒng),其特征在于,還包括: 聚類處理模塊,用于獲取通過客戶端采集得到的日志數(shù)據(jù)以及對應的用戶標識,根據(jù)所述日志數(shù)據(jù)對所述用戶標識進行聚類處理得到用戶集合。
10.根據(jù)權(quán)利要求9所述的推薦網(wǎng)絡(luò)信息的系統(tǒng),其特征在于,所述信息處理模塊包括: 計數(shù)單元,用于對用戶集合中每一用戶標識所點擊的網(wǎng)絡(luò)信息進行次數(shù)統(tǒng)計,得到網(wǎng)絡(luò)信息在用戶集合中的點擊次數(shù); 劃分單元,用于根據(jù)所述網(wǎng)絡(luò)信息在所述用戶集合中的點擊次數(shù)對所述網(wǎng)絡(luò)信息進行劃分得到信息集合和對應的評級; 關(guān)聯(lián)單元,用于將所述信息集合和所述用戶集合相關(guān)聯(lián)。
11.根據(jù)權(quán)利要求O所述的推薦網(wǎng)絡(luò)信息的方法,其特征在于,所述特征處理模塊包括: 抽取單元,用于在與所述用戶集合相關(guān)聯(lián)的信息集合中抽取網(wǎng)絡(luò)信息的瀏覽行為特征; 訓練單元,用于根據(jù)所述瀏覽行為特征訓練得到所述信息集合對應的分類模型,并將所述分類模型與用戶集合相關(guān)聯(lián)。
12.根據(jù)權(quán)利要求11所述的推薦網(wǎng)絡(luò)信息的系統(tǒng),其特征在于,所述推薦模塊包括: 選取單元,用于根據(jù)評級,或者,根據(jù)評級和匹配值選取輸入分類模型的網(wǎng)絡(luò)信息; 識別單元,用于獲取當前登錄的用戶標識,判斷所述當前登錄的用戶標識是否存在于用戶集合中,若是,則通知推送單元; 所述推送單元用于根據(jù)當前登錄的用戶標識進行選取得到的網(wǎng)絡(luò)信息的推送;所述推送的網(wǎng)絡(luò)信息輸入的分類模型是與當前登錄的用戶標識所存在的用戶集合相關(guān)聯(lián)的。
【文檔編號】H04L29/08GK103810162SQ201210436266
【公開日】2014年5月21日 申請日期:2012年11月5日 優(yōu)先權(quán)日:2012年11月5日
【發(fā)明者】王亮, 姚從磊, 翟俊杰, 溫泉, 李新娟, 張文龍 申請人:騰訊科技(深圳)有限公司