專利名稱:一種基于交易網絡的商家推薦方法
技術領域:
本發(fā)明涉及電子商務領域中的商家推薦,特別涉及存在大量歷史交易數據的情況下,充分發(fā)掘買家和賣家的交易偏好,構成用戶簇;同時引入社會網絡因素,為買家或賣家劃分社團;通過隨機行走完成商 家推薦。
背景技術:
推薦系統已應用到信息檢索、新聞傳媒、電子商務、社會網絡服務等諸多領域。在電子商務領域,良好的推薦系統能夠有效提升用戶體驗(包括買家和賣家),增加用戶黏著度,促進更多交易行為的發(fā)生。目前眾多的電子商務網站,如淘寶、大眾點評、亞馬遜、億貝、京東等都建立了各自的推薦系統,在商品層面進行有效的統計、建模、挖掘和推薦工作,取得了良好成果。目前的推薦技術大致可分為三大類基于內容的推薦、協同過濾、以及混合推薦?;趦热莸耐扑]為用戶(買家)推薦與其之前的選擇相類似的物品(商品);協同過濾為用戶推薦與其偏好最相近的用戶所選擇過的物品;混合方式采用多種推薦方法的組合為用戶推薦物品,一種策略是結合基于內容和協同過濾為用戶提供推薦,另一種目前比較流行的策略是在協同過濾中引入社會網絡技術為用戶推薦物品。目前電子商務網站在交易過程中主要承擔平臺和中介的角色,每一次交易實際發(fā)生在買家和賣家之間?,F有的推薦系統在為買家發(fā)掘商品、促進買家體驗和交易量方面已取得良好成果;但對賣家的關注度仍然不夠,實際是較少考慮到社會網絡因素的影響。已有市場調查報告顯示超過65%的買家更傾向于同信任的賣家進行交易,并建立所謂“老客”、“回頭客”等相對穩(wěn)固的信任交易關系;考慮到在線商品交易中更高的劣質商品風險和質保代價,合理的商家推薦是當前電子商務領域需要立即考慮的問題?,F有的推薦方法和技術尚未考慮商家推薦的問題,有效的商家推薦方法將填補這一空白。
發(fā)明內容
本發(fā)明主要目的是針對傳統推薦系統沒有考慮商家推薦的問題,提出一種基于交易網絡的商家推薦方法,通過在買家和賣家之間建立偏好相似的用戶簇,根據交易網絡的連接模式劃分社團,通過隨機行走完成商家推薦。為實現本發(fā)明所述目的,本發(fā)明采用如下的步驟
1)整理交易數據并建立交易網絡,包含兩個工作其一為每個用戶(包括買家和賣家)建立和維護偏好向量;其二根據歷史交易記錄在用戶之間建立交易網絡;
2)根據用戶交易歷史對用戶聚類;采用期望最大化算法EM,通過用戶偏好向量進行用戶聚類,形成偏好相似的用戶簇;
3)對交易網絡進行社團劃分;采用K均值算法KM,根據交易網絡中各(用戶)節(jié)點的連接模式劃分社團;4)應用隨機行走方法實現商家推薦,從買家(目標用戶)出發(fā),在社團間隨機行走,根據用戶簇決定停止概率,完成商家推薦。上述步驟I)中用戶的偏好向量用數組表示令in表示電子商務網站中商品類別的數量;用戶《<的偏好向量為二-■ );其中元素^ (I < k < M )的定義如下
{] H1 IMHiglit or sold fomnich! it irs ofk
0r tIn*rwiHo。上述步驟I)中的交易網絡是一個有向圖U= (d/),其中;/表示電子商務網站中的用戶集合;有向邊集合£ C F X反映用戶之間的交易歷史,對于任意兩個用戶 和"j ^ P),有向邊< rH >€ E表示用戶h曾經從用戶購買過商品;/:丑—N是一個映射,其中W為自然數集,作用是為£中的每一條有向邊賦予權重;簡化處理有向邊
>■的權重表示為叫代表_向w,購買商品的次數,若< .<-+ >i E, IjiiJ u<tJ 二 U,另有
=()。上述步驟2)中的EM算法包含兩個階段E-Step (Expectation)根據用戶簇的當前組成計算每個簇的中心點;M-Step (Maximization)將每個用戶重新分配到從屬概率最高的用戶簇;
2. I)考慮E-Step,計算用戶族的中心點A.; ~ (:.a. .Va ,1,其中in表不商品類別的數量,元素¥的計算公式如下
印―=士 ^噸.
I '。病
其中|4|表示用戶簇4的規(guī)模,即簇中包含的用戶數量是用戶Uf的偏好向量_中的對應元素,〃;必須屬于4 ;
2.2)考慮M-St印,用戶+ , 屬于用戶簇Z,的從屬概率由 (W1IZi)表示,為計算引入背景向量〃=(辦取..…知),其中元素ft的計算公式如下
—i ( . = TTTT 乙
I' I ,er
其中f/為用戶集合;再引入平滑因子A,A可設為0. 01,取值范圍0. OOfO. 06,交易數據越稀疏,A取值越大;計算用戶簇4的特征向量朽=..…朽《),其中元素朽n 的計算公式如下
PA:: U. — ^}Sjk + Mk進一步計算系數向量4 - 1 .4、…為其中元素‘的計算公式如下
fpIy^J1A'
= m---Ig -—-—■
I — Pjp I — Aift
基于上述,計算用戶化屬于用戶簇4的從屬概率坪,公式如下
權利要求
1.一種基于交易網絡的商家推薦方法,其特征在于包括以下步驟 1)整理交易數據并建立交易網絡,包括為每個用戶,即買家和賣家,建立和維護偏好向量;并根據歷史交易記錄在用戶之間建立交易網絡; 2)根據用戶交易歷史對用戶聚類;采用期望最大化算法EM,通過用戶偏好向量進行用戶聚類,形成偏好相似的用戶簇; 3)對交易網絡進行社團劃分;采用K均值算法KM,根據交易網絡中各用戶節(jié)點的連接模式劃分社團; 4)應用隨機行走方法實現商家推薦,從買家出發(fā),在社團間隨機行走,根據用戶簇決定停止概率,完成商家推薦。
2.根據權利要求I所述的基于交易網絡的商家推薦方法,其特征在于,上述步驟I)中用戶的偏好向量用數組表示令■表不電子商務網站中商品類別的數量;用戶《.f的偏好向量為二 ;其中兀素S A 5 W )的定義如下
3.根據權利要求I所述的基于交易網絡的商家推薦方法,其特征在于,上述步驟I)中的交易網絡是一個有向圖DV =(〖/.£./),其中£/表示電子商務網站中的用戶集合;有向邊集合I' X反映用戶之間的交易歷史,對于任意兩個用戶 和e f+「),有向邊< H >€ £'表示用戶Uf曾經從用戶~購買過商品;/ : E ^ N是一個映射,其中N為自然數集,作用是為E中的每一條有向邊賦予權重;簡化處理有向邊< >的權重表示為 ,代表 向+";:購買商品的次數,若< “,+■技j >f ,則.另有二 O。
4.根據權利要求I、2或3所述的基于交易網絡的商家推薦方法,其特征在于,上述步驟2)中的EM算法包含兩個階段=E-Step根據用戶簇的當前組成計算每個簇的中心點;M_Step將每個用戶重新分配到從屬概率最高的用戶簇;具體過程為 .2.I)考慮E-St印,計算用戶簇Zf的中心點<,:(―二…. ,),其中m表示商品類別的數量,元素%1的計算公式如下
5.根據權利要求4所述的基于交易網絡的商家推薦方法,其特征在于,上述步驟2)中采用EM算法完成用戶聚類的過程是首先根據電子商務網站中的用戶總數設置用戶簇的數量,保證用戶簇規(guī)模的平均范圍為50(T3000個用戶;隨機設定個用戶簇,對每一個用戶,以均一概率分配到某一個簇中;然后開始迭代第一步執(zhí)行EM算法為每一個用戶重新分配用戶簇;第二步對過大和過小的用戶簇做處理,過程是 · 2.3)判定過小的用戶簇設定用戶簇規(guī)模的最小值e,一般= 30 ;如果存在用戶簇&的規(guī)模小于e,則解散I,其成員以均一概率分配到其他用戶簇中; ·2.4)判定過大的用戶簇計算所有用戶簇規(guī)模取對數后的均值,用M Ig P:)表示,再計算用戶簇規(guī)模取對數后的方差值,用〃表示,如果用戶簇4滿足以下公式則4過大,在其中隨機設定2個用戶簇,&的每個成員以均一概率1/2分配到一個新簇中; 迭代結束時判斷用戶簇的組成是否發(fā)生變化如果發(fā)生變化,則進入下一次迭代;如果沒有發(fā)生變化,則迭代結束,輸出聚類好的用戶簇。
6.根據權利要求I、2或3所述的基于交易網絡的商家推薦方法,其特征在于,上述步驟·3)中的KM算法包含兩個階段K-Step將每個用戶重新分配到匹配度最高的社團;M_Step根據社團的當前組成計算每個社團的特征向量;具體過程為 ·3.I)考慮M-Step,計算社團C,.的特征向量Cr = hi, d .…其中》為用戶總數;元素I.. (I. < k < )的計算公式如下
7.根據權利要求6所述的基于交易網絡的商家推薦方法,其特征在于,上述步驟3)中采用KM算法完成交易網絡中社團劃分的過程是首先根據電子商務網站中的用戶總數設置社團的數量保證社團規(guī)模的平均值范圍為50(T3000個用戶;然后初始化社團對交易網絡中的用戶節(jié)點按度數,即出度+入度排序,等分為個區(qū)間;從每個區(qū)間隨機選擇10 30個用戶節(jié)點;每個用戶節(jié)點單獨作為一個社團,社團特征向量等于用戶特征向量;每次選擇兩個特征向量的歐氏距離最近的社團,將這兩個社團合并為一個社團,重新計算新社團的特征向量;重復上述操作,直至剩余個社團;然后迭代執(zhí)行KM算法,迭代過程的收斂條件是一次迭代后,每個用戶同社團的從屬關系沒有發(fā)生改變;最后輸出社團劃分結果。
8.根據權利要求I、2或3所述的基于交易網絡的商家推薦方法,其特征在于,上述步驟4)中應用隨機行走方法實現商家推薦的過程是首先確定推薦的商家數量Y , N =3^20 ;然后從目標用戶^出發(fā)隨機行走,選擇下一個用戶& ;判定隨機行走是否終止;如果未能終止,則將 作為當前用戶 繼續(xù)隨機行走;如果過程終止,輸出為推薦的商家;上述過程重復』V次,最后輸出所推薦的一組商家。
9.根據權利要求8所述的基于交易網絡的商家推薦方法,其特征在于, 上述步驟4)中的隨機行走過程包含兩個階段其一是按概率選擇一個社團G ;其二是按概率從G中選擇一個用戶; .4.I)令當前用戶為U4,計算選擇社團C:,.的概率IUD),公式如下
10.根據權利要求9所述的基于交易網絡的商家推薦方法,其特征在于,上述步驟4)中計算隨機行走的終止概率#分四種情況,其中令所選用戶為…,目標用戶為 情況I. 1 不是賣家,或者已經同%交易過,不需要再推薦;此時G = U ; 情況2. %和《 屬于同一個用戶簇,此時^二 I,即隨機行走立即終止; 情況3. 1%所屬用戶簇各與《 所屬用戶簇瓦不相同,此時計算%對石的隸屬度/^名),公式如下
全文摘要
本發(fā)明公開了一種基于交易網絡的商家推薦方法,其步驟為(1)整理交易數據并建立交易網絡;(2)根據用戶交易歷史對用戶聚類;(3)對交易網絡進行社團劃分;(4)應用隨機行走方法實現商家推薦。本發(fā)明可廣泛應用于各類電子商務網站中的商家(賣家)推薦,為廣大買家推薦合適的賣家;充分利用買家和賣家的歷史交易數據,發(fā)掘買家和賣家的偏好特征,分析買家和賣家交易的相似性,合理應用隨機行走方法,有效提高商家推薦的準確性和針對性。所采用的計算方法簡單高效,切合電子商務網站海量交易數據、同時買家和賣家交易信息稀疏的特性,有較好的擴展性和適用性;有效填補目前電子商務網站商家推薦方面的空白。
文檔編號G06Q30/02GK102750647SQ201210219288
公開日2012年10月24日 申請日期2012年6月29日 優(yōu)先權日2012年6月29日
發(fā)明者湯九斌, 蔣智威, 許鼎鼎, 陳道蓄, 顧慶 申請人:南京大學