一種協(xié)同過濾推薦方法及裝置制造方法
【專利摘要】本申請公開了一種協(xié)同過濾推薦方法及裝置,方法為:預先建立表征用戶間近鄰關系、項目間近鄰關系、用戶與項目間實際行為關系和用戶與項目間預測行為關系的第一矩陣、第二矩陣、第三矩陣和第四矩陣,利用用戶實際行為數(shù)據(jù)更新第三和第四矩陣,利用用戶預測行為數(shù)據(jù)更新第四矩陣,利用第三和第四矩陣更新第一和第二矩陣,選取用戶與項目的實際行為關系值為零的組合,對選取的用戶與項目進行評分預測,判斷評分值與上一輪預測的評分值的偏差是否小于閥值,若否,則將其作為用戶預測行為數(shù)據(jù)返回更新第四矩陣步驟,直至預測評分值小于閥值,依據(jù)該評分值確定是否將項目推薦給用戶。本申請考慮了用戶間、項目間的關系,使得推薦結果更精確。
【專利說明】一種協(xié)同過濾推薦方法及裝置
【技術領域】
[0001]本申請涉及協(xié)同過濾推薦【技術領域】,更具體地說,涉及一種協(xié)同過濾推薦方法及
>J-U ρ?α裝直。
【背景技術】
[0002]互聯(lián)網(wǎng)技術的快速發(fā)展帶動了電子商務的蓬勃發(fā)展,服務信息與商品數(shù)量呈爆炸式急劇增長。隨之而來的是“信息過載(informat1n overload) ”問題。而個性化推薦技術因其能有效處理信息過濾問題而受到廣泛地關注和研究。協(xié)同過濾推薦技術是個性化推薦技術中應用最成功的技術之一,其基本思想是根據(jù)興趣相似的最近鄰居的行為數(shù)據(jù)向目標用戶推薦資源。隨著互聯(lián)網(wǎng)數(shù)據(jù)資源的快速增長,協(xié)同過濾推薦技術的研究面臨著很多難點問題:數(shù)據(jù)稀疏性、可擴展性以及無法自適應用戶興趣遷移等。
[0003]為了解決這些問題,現(xiàn)有技術利用協(xié)同推薦系統(tǒng)中用戶與項目間的關系提出基于網(wǎng)絡結構的推薦方法,將用戶和項目關系圖抽象為二分網(wǎng)絡,針對二分網(wǎng)絡的統(tǒng)計特性進行社區(qū)結構和演化的研究,以及對二分網(wǎng)絡的一些屬性特征進行研究,如分析二分網(wǎng)絡的度及其分布、最短路徑等。但二分網(wǎng)絡結構的研究僅考慮了用戶與資源之間的聯(lián)系,而忽略了用戶間或項目間的內在關聯(lián),因此推薦結果精度不高。
【發(fā)明內容】
[0004]有鑒于此,本申請?zhí)峁┝艘环N協(xié)同過濾推薦方法及裝置,用于解決現(xiàn)有推薦方法沒有考慮用戶或項目間的內在關聯(lián),導致推薦結果精度不高的問題。
[0005]為了實現(xiàn)上述目的,現(xiàn)提出的方案如下:
[0006]一種協(xié)同過濾推薦方法,包括:
[0007]判斷是否有新增的用戶實際行為數(shù)據(jù);
[0008]若是,則利用所述用戶實際行為數(shù)據(jù)更新預先建立的推薦關系矩陣R中的第三矩陣和第四矩陣,所述推薦關系矩陣R包括表征用戶間近鄰關系的第一矩陣Ruu、表征項目間近鄰關系的第二矩陣R?、表征用戶與項目間實際行為關系的所述第三矩陣Riu和表征用戶與項目間預測行為關系的所述第四矩陣Rui,在初始建立時所述第三矩陣與所述第四矩陣相等;
[0009]判斷是否有新增的用戶預測行為數(shù)據(jù);
[0010]若是,利用所述新增的用戶預測行為數(shù)據(jù)二次更新所述第四矩陣,然后執(zhí)行步驟a ;
[0011]若不是,執(zhí)行所述步驟a ;
[0012]步驟a、利用所述第四矩陣和所述第三矩陣,對所述第一矩陣和所述第二矩陣進行更新;
[0013]選取用戶Ua及項目Ii,所述用戶Ua及項目Ii滿足Ua與Ii的實際行為關系值為零;
[0014]預測本次循環(huán)過程用戶Ua對項目Ii的評分值;
[0015]計算本次循環(huán)過程用戶Ua對項目Ii的評分值與用戶Ua對項目Ii的評分參考值的偏差量;
[0016]判斷所述偏差量是否小于預設閥值;
[0017]若是,根據(jù)本次循環(huán)過程用戶Ua對項目Ii的評分值確定是否將項目Ii推薦給用戶Ua ;
[0018]若不是,將本次循環(huán)過程所確定的用戶Ua對項目Ii的評分值更新為所述用戶比對項目Ii的評分參考值,并將其作為新增的用戶預測行為數(shù)據(jù),返回執(zhí)行所述判斷是否有新增的用戶預測行為數(shù)據(jù)步驟。
[0019]優(yōu)選地,所述第三矩陣中的矩陣元素為;T [H) = r‘,,,(/,XU表示用戶比對項目Ii實際行為關系值,ra,i表示用戶Ua對項目Ii的實際評分值,所述第四矩陣Rui中的矩
\,) (I:.U ,)^0
陣元素為如(U)=-Λ,其中Pai為預測的用戶比對項目Ii的評
[PaJ廠把((丸)=0’
分值,所述利用所述用戶實際行為數(shù)據(jù)更新預先建立的推薦關系矩陣中的第三矩陣和第四矩陣,包括:
[0020]將新增的用戶Ua對項目Ii的實際評分值ra,i填入所述第三矩陣的相應位置;
[0021]利用更新的所述第三矩陣對所述第四矩陣進行更新。
[0022]優(yōu)選地,所述新增的用戶預測行為數(shù)據(jù)為用戶Ua對項目Ii的預測評分值P。,則所述利用所述新增的用戶預測行為數(shù)據(jù)二次更新所述第四矩陣,包括:
[0023]判斷所述第三矩陣中的矩陣元素;7 (/,W,,)是否為零;
[0024]若為零,將新增的用戶Ua對項目Ii的預測評分值P。填入所述第四矩陣的相應位置;
[0025]若不為零,則判斷是否等于
[0026]若二者不等,則將^ (%,/,)更新為^ (/,,R)。
[0027]優(yōu)選地,所述利用所述第四矩陣和所述第三矩陣,對所述第一矩陣和所述第二矩陣進行更新,包括:
[0028]由所述第四矩陣和所述第三矩陣確定用戶相似度影響因子ε υ和項目相似度影響因子h,其中,
T V T
「 ? ^ 1UaUb 入 1UaUb
[0029]Su =-
[0030]IUaJUb分別表示由所述第三矩陣和所述第四矩陣確定的用戶Ua,Ub所分別鏈接的項目集合,1UaUb表示由所述第三矩陣和所述第四矩陣確定的用戶Ua, Ub共同鏈接的項目集合;
【權利要求】
1.一種協(xié)同過濾推薦方法,其特征在于,包括: 判斷是否有新增的用戶實際行為數(shù)據(jù);若是,則利用所述用戶實際行為數(shù)據(jù)更新預先建立的推薦關系矩陣R中的第三矩陣和第四矩陣,所述推薦關系矩陣R包括表征用戶間近鄰關系的第一矩陣R?、表征項目間近鄰關系的第二矩陣R?、表征用戶與項目間實際行為關系的所述第三矩陣Riu和表征用戶與項目間預測行為關系的所述第四矩陣Rui,在初始建立時所述第三矩陣與所述第四矩陣相等;判斷是否有新增的用戶預測行為數(shù)據(jù); 若是,利用所述新增的用戶預測行為數(shù)據(jù)二次更新所述第四矩陣,然后執(zhí)行步驟a; 若不是,執(zhí)行所述步驟a; 步驟a、利用所述第四矩陣和所述第三矩陣,對所述第一矩陣和所述第二矩陣進行更新; 選取用戶Ua及項目Ii,所述用戶Ua及項目Ii滿足Ua與Ii的實際行為關系值為零; 預測本次循環(huán)過程用戶Ua對項目Ii的評分值; 計算本次循環(huán)過程用戶Ua對項目Ii的評分值與用戶Ua對項目Ii的評分參考值的偏差量; 判斷所述偏差量是否小于預設閥值; 若是,根據(jù)本次循環(huán)過程用戶Ua對項目Ii的評分值確定是否將項目Ii推薦給用戶Ua ;若不是,將本次循環(huán)過程所確定的用戶Ua對項目Ii的評分值更新為所述用戶Ua對項目Ii的評分參考值,并將其作為新增的用戶預測行為數(shù)據(jù),返回執(zhí)行所述判斷是否有新增的用戶預測行為數(shù)據(jù)步驟。
2.根據(jù)權利要求1所述的協(xié)同過濾推薦方法,其特征在于,所述第三矩陣中的矩陣元素為rH {I ,,Uil) = /.?,,I), [IiJJ1,)表示用戶Ua對項目Ii實際行為關系值,ra,i表示用戶Ua對項目Ii的實際評分值,所述第四矩陣Rui中的矩陣元素為—, 、?/Γ(1.υ ) ^7(1.υ )^0Q(K)=- ; Γ; Λ,其中Pai為預測的用戶比對項目Ii的評分值,所
[PuJrwiJ.,L、) = 0’述利用所述用戶實際行為數(shù)據(jù)更新預先建立的推薦關系矩陣中的第三矩陣和第四矩陣,包括: 將新增的用戶Ua對項目Ii的實際評分值填入所述第三矩陣的相應位置; 利用更新的所述第三矩陣對所述第四矩陣進行更新。
3.根據(jù)權利要求2所述的協(xié)同過濾推薦方法,其特征在于,所述新增的用戶預測行為數(shù)據(jù)為用戶Ua對項目Ii的預測評分值P。,則所述利用所述新增的用戶預測行為數(shù)據(jù)二次更新所述第四矩陣,包括: 判斷所述第三矩陣中的矩陣元素“丄',)是否為零; 若為零,將新增的用戶Ua對項目Ii的預測評分值P。填入所述第四矩陣的相應位置; 若不為零,則判斷石(R J,)是否等于^ (/,.,R); 若二者不等,則將^ (i/u, J,.)更新為石(I,,Ua)。
4.根據(jù)權利要求1所述的協(xié)同過濾推薦方法,其特征在于,所述利用所述第四矩陣和所述第三矩陣,對所述第一矩陣和所述第二矩陣進行更新,包括: 由所述第四矩陣和所述第三矩陣確定用戶相似度影響因子ε?和項目相似度影響因子ε工,其中,
1Ua Jub分別表示由所述第三矩陣和所述第四矩陣確定的用戶Ua, Ub所分別鏈接的項目集合,1VaUl表示由所述第三矩陣和所述第四矩陣確定的用戶ua,Ub共同鏈接的項目集合;
UirUi,分別表示由所述第三矩陣和所述第四矩陣確定的項目Ii, Ij所分別鏈接的用戶集合,t7Z+表示由所述第三矩陣和所述第四矩陣確定的項目Ii, L共同鏈接的用戶集合; 確定所述第一矩陣為f {Ua,Ub) = Sim'{Ua,Ub),
其中,sim’ (Ua, Ub) = ε uXSim(Ua,Ub),sim(Ua, Ub)為用戶 Ua, Ub 的相似度; 確定所述第二矩陣為孓(/,,/,) = —V丨Ji), 其中,sim’(Ii, I」)=ε Wsimdi, I」),Simdi, I」)為項目Ii, I」的相似度。
5.根據(jù)權利要求4所述的協(xié)同過濾推薦方法,其特征在于,所述預測本次循環(huán)過程用戶Ua對項目Ii的評分值,包括: 依據(jù)下述公式預測用戶Ua對項目Ii的評分值:
其中,λ為預設平衡參量7~和€分別表示第一矩陣中用戶Ua和用戶Ub已評分項目的平均評分值,r/;和' 分別表示第一矩陣中項目Ii和項目L已被評分的平均值,N(Ua)和N(Ii)分別滿足下式:
其中,α和β分別為用戶相似度閥值和項目相似度閥值。
6.一種協(xié)同過濾推薦裝置,其特征在于,包括: 第一判斷單元,用于判斷是否有新增的用戶實際行為數(shù)據(jù); 第一更新單元,用于在所述第一判斷單元的判斷結果為是時,利用所述用戶實際行為數(shù)據(jù)更新預先建立的推薦關系矩陣R中的第三矩陣和第四矩陣,所述推薦關系矩陣R包括表征用戶間近鄰關系的第一矩陣Rm1、表征項目間近鄰關系的第二矩陣R?、表征用戶與項目間實際行為關系的所述第三矩陣Riu和表征用戶與項目間預測行為關系的所述第四矩陣Rui,在初始建立時所述第三矩陣與所述第四矩陣相等; 第二判斷單元,用于判斷是否有新增的用戶預測行為數(shù)據(jù); 第二更新單元,用于在所述第二判斷單元的判斷結果為是時,利用所述新增的用戶預測行為數(shù)據(jù)二次更新所述第四矩陣; 第三更新單元,用于利用所述第二更新單元更新的第四矩陣或者所述第一更新單元更新的第四矩陣以及所述第一更新單元更新的第三矩陣,對所述第一矩陣和所述第二矩陣進行更新; 選取單元,用于選取用戶Ua及項目Ii,所述用戶Ua及項目Ii滿足Ua與Ii的實際行為關系值為零; 評分預測單元,用于預測本次循環(huán)過程用戶Ua對項目Ii的評分值; 偏差量計算單元,用于計算本次循環(huán)過程用戶Ua對項目Ii的評分值與用戶Ua對項目Ii的評分參考值的偏差量; 第三判斷單元,用于判斷所述偏差量是否小于預設閥值; 項目推薦單元,用于在所述第三判斷單元的判斷結果為是時,根據(jù)本次循環(huán)過程用戶Ua對項目Ii的評分值確定是否將項目Ii推薦給用戶Ua ; 評分值處理單元,用于在所述第三判斷單元的判斷結果為否時,將本次循環(huán)過程所確定的用戶Ua對項目Ii的評分值更新為所述用戶Ua對項目Ii的評分參考值,并將其作為新增的用戶預測行為數(shù)據(jù),返回至所述第二判斷單元。
7.根據(jù)權利要求6所述的協(xié)同過濾推薦裝置,其特征在于,所述第三矩陣中的矩陣元素為,rn [InVl,)表示用戶Ua對項目Ii實際行為關系值,ra,i表示用戶Ua對項目Ii的實際評分值,所述第四矩陣Rui中的矩陣元素為G(U) = Iv上,其中pai為預測的用戶Ue對項目I1的評分值,所 I Pa,1H’述第一更新單元包括: 第一填充子單元,用于將新增的用戶Ua對項目Ii的實際評分值填入所述第三矩陣的相應位置; 第四更新子單元,利用更新的所述第三矩陣對所述第四矩陣進行更新。
8.根據(jù)權利要求7所述的協(xié)同過濾推薦裝置,其特征在于,所述新增的用戶預測行為數(shù)據(jù)為用戶Ua對項目Ii的預測評分值Pu,所述第二更新單元包括: 第四判斷子單元,用于判斷所述第三矩陣中的矩陣元素^ )是否為零; 第二填充子單元,用于在所述第四判斷子單元的判斷結果為是時,將新增的用戶Ua對項目Ii的預測評分值Pu填入所述第四矩陣的相應位置; 第五判斷子單元,用于在所述第四判斷子單元的判斷結果為否時,判斷是否等予 VM,uu)., 第五更新子單元,用于在所述第五判斷子單元的判斷結果為否時,將更新為rIU。
9.根據(jù)權利要求6所述的協(xié)同過濾推薦裝置,其特征在于,所述第三更新單元包括: 影響因子確定單元,用于由所述第四矩陣和所述第三矩陣確定用戶相似度影響因子ε 項目相似度影響因子S1,其中,
1Ua JiJb分別表示由所述第三矩陣和所述第四矩陣確定的用戶Ua, Ub所分別鏈接的項目集合,1UjJl表示由所述第三矩陣和所述第四矩陣確定的用戶Ua,Ub共同鏈接的項目集合;
uI^uIl分別表示由所述第三矩陣和所述第四矩陣確定的項目Ii, Ij所分別鏈接的用戶集合,uI1Il表示由所述第三矩陣和所述第四矩陣確定的項目Ii, L共同鏈接的用戶集合; 矩陣確定單元,用于確定所述第一矩陣為^07,,所述第二矩陣為廠〃(/,,/,) =),其中,
sim’ (Ua, Ub) = ε uXsim(Ua, Ub),sim(Ua, Ub)為用戶 Ua, Ub 的相似度;
sim’ (Ii, I」)=ε JXsimdi, Ij), Simdi, Ij)為項目 Ii, Ij 的相似度。
10.根據(jù)權利要求9所述的協(xié)同過濾推薦裝置,其特征在于,所述評分預測單元包括: 第一評分預測子單元,用于依據(jù)下述公式預測用戶Ua對項目Ii的評分值:
其中,λ為預設平衡參量,&和^分別表示第一矩陣中用戶Ua和用戶Ub已評分項目的平均評分值,Vh和/,分別表示第一矩陣中項目Ii和項目L已被評分的平均值,N(Ua)和N(Ii)分別滿足下式:
其中,α和β分別為用戶相似度閥值和項目相似度閥值。
【文檔編號】G06Q30/00GK104182518SQ201410420928
【公開日】2014年12月3日 申請日期:2014年8月25日 優(yōu)先權日:2014年8月25日
【發(fā)明者】吳健, 冒九妹, 趙朋朋, 崔志明 申請人:蘇州大學