基于上下文預(yù)過(guò)濾的實(shí)時(shí)音樂(lè)推薦方法
【專(zhuān)利摘要】基于上下文預(yù)過(guò)濾的實(shí)時(shí)音樂(lè)推薦方法,依據(jù)用戶(hù)的歷史數(shù)據(jù),針對(duì)每個(gè)在線(xiàn)活躍用戶(hù)進(jìn)行以下操作:首先,提取所有用戶(hù)的歷史數(shù)據(jù)(如用戶(hù)聽(tīng)音樂(lè)的時(shí)間、場(chǎng)所和天氣等),構(gòu)建“用戶(hù)-音樂(lè)-上下文”三元數(shù)據(jù)模型,并針對(duì)每個(gè)用戶(hù)建立由音樂(lè)和上下文組成的個(gè)人記錄集合;其次,構(gòu)造用戶(hù)K近鄰的當(dāng)前上下文相似記錄集合,從而將三元數(shù)據(jù)模型轉(zhuǎn)化為用戶(hù)和音樂(lè)組成的二元模型;最后,采用基于模糊聚類(lèi)的協(xié)同過(guò)濾算法預(yù)測(cè)用戶(hù)對(duì)不同音樂(lè)的偏愛(ài)程度。本發(fā)明的優(yōu)點(diǎn)在于:充分考慮上下文信息,推薦更符合用戶(hù)偏好、當(dāng)前心情和周?chē)h(huán)境的音樂(lè)。
【專(zhuān)利說(shuō)明】基于上下文預(yù)過(guò)濾的實(shí)時(shí)音樂(lè)推薦方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及音樂(lè)推薦系統(tǒng)的【技術(shù)領(lǐng)域】,特別是基于上下文預(yù)過(guò)濾的實(shí)時(shí)音樂(lè)推薦系統(tǒng)的算法。
【背景技術(shù)】
[0002]20世紀(jì)90年代以來(lái),隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,人們?cè)讷@取豐富信息的同吋,也浸于信息泥潭而難以高效地搜集自身所需的信息,從而引發(fā)“信息過(guò)載”問(wèn)題。目前,通用搜索引擎(如谷歌、百度)是最流行的獲取信息的工具,但正因?yàn)樗鼈兊耐ㄓ眯?,這類(lèi)搜索引擎不能很好地滿(mǎn)足不同背景、不同時(shí)間、不同目標(biāo)的使用者的個(gè)性化信息需求,從而無(wú)法真正地解決“信息過(guò)載”難題。于是,學(xué)術(shù)界和企業(yè)界都提出“個(gè)性化服務(wù)”的概念,來(lái)為不同特征不同需求的用戶(hù)提供不同的信息內(nèi)容。推薦系統(tǒng)作為個(gè)性化服務(wù)研究的重要領(lǐng)域,通過(guò)挖掘用戶(hù)和服務(wù)項(xiàng)目之間的ニ元關(guān)系,用戶(hù)之間的組群關(guān)系,以及服務(wù)項(xiàng)目之間的相似關(guān)系等,幫助用戶(hù)從海量數(shù)據(jù)中發(fā)現(xiàn)其可能感興趣的項(xiàng)目(如音樂(lè)、家政服務(wù)和在線(xiàn)商品等),并生成個(gè)性化推薦結(jié)果以滿(mǎn)足個(gè)性化需求。
[0003]目前,隨著電子商務(wù)、移動(dòng)計(jì)算和物聯(lián)網(wǎng)等應(yīng)用領(lǐng)域的進(jìn)ー步發(fā)展,將上下文感知計(jì)算應(yīng)用于這些領(lǐng)域的推薦服務(wù)以提高用戶(hù)體驗(yàn)和系統(tǒng)性能,成為學(xué)術(shù)界和エ業(yè)界關(guān)注的熱點(diǎn)之一。在傳統(tǒng)推薦系統(tǒng)中,“用戶(hù)ー項(xiàng)目”之間的關(guān)聯(lián)關(guān)系是主要的研究対象,而下文環(huán)境(如時(shí)間、位置、情緒、網(wǎng)絡(luò)條件和最近幾次選擇的項(xiàng)目等等)往往被忽略。然而,對(duì)很多實(shí)際應(yīng)用而言,單純的“用戶(hù)-項(xiàng)目”ニ元關(guān)系無(wú)法提供高效的推薦服務(wù)。例如,用戶(hù)A只有在“外地出差”時(shí)才想要被推薦ー些周邊的餐館、商場(chǎng)等,而平時(shí)在熟悉的家鄉(xiāng)時(shí)這些信息都屬于嚴(yán)重多余;用戶(hù)B在“失落沮喪”時(shí)更愿意被推薦ー些治愈系的療傷歌曲;用戶(hù)C喜歡在“早上”而不是“中午”被推薦NBA體育新聞。上下文感知推薦系統(tǒng)將上下文信息引入推薦系統(tǒng),進(jìn)ー步提高了推薦效率和用戶(hù)體驗(yàn),兼具“個(gè)性化”和“普適計(jì)算”兩方面的優(yōu)越性,具有重要的研究意義和實(shí)用價(jià)值。
【發(fā)明內(nèi)容】
[0004]為了幫助用戶(hù)解決“信息過(guò)載”問(wèn)題,在海量音樂(lè)中精選出符合用戶(hù)風(fēng)格和當(dāng)前情緒的音樂(lè),本發(fā)明提出了一種基于上下文預(yù)過(guò)濾的實(shí)時(shí)音樂(lè)推薦方法,該方法包括以下步驟:
[0005]I)提取所有用戶(hù)的歷史數(shù)據(jù),構(gòu)建“用戶(hù)-音樂(lè)-上下文”三元數(shù)據(jù)模型,并針對(duì)每個(gè)用戶(hù)u建立由音樂(lè)和上下文組成的個(gè)人記錄集合Pu ;
[0006]2)對(duì)每個(gè)當(dāng)前活躍用戶(hù)Ua,根據(jù)其個(gè)人記錄集合利用余弦相關(guān)性評(píng)估歷史記
錄中的上下文與當(dāng)前上下文c的相似度,構(gòu)造出K近鄰的當(dāng)前上下文相似記錄集合S(C);
[0007]3)利用S(C)將“用戶(hù)-音樂(lè)-上下文”三元數(shù)據(jù)模型轉(zhuǎn)換成“用戶(hù)-音樂(lè)”ニ元數(shù)據(jù)模型;
[0008]4)采用基于模糊集劃分的協(xié)同過(guò)濾算法,預(yù)測(cè)每個(gè)當(dāng)前活躍用戶(hù)Ua對(duì)所有音樂(lè)的評(píng)分。
[0009]進(jìn)ー步,步驟I)中所述的用戶(hù)歷史數(shù)據(jù)、三元數(shù)據(jù)模型和個(gè)人記錄集合Pu,具體是:
[0010]I)每條用戶(hù)歷史數(shù)據(jù)記錄包含用戶(hù)編號(hào)、音樂(lè)編號(hào)、上下文信息和評(píng)分,根據(jù)所有的用戶(hù)歷史數(shù)據(jù)記錄可以構(gòu)建“用戶(hù)-音樂(lè)-上下文”三元數(shù)據(jù)模型;
[0011]2)針對(duì)每個(gè)用戶(hù)U,建立由音樂(lè)和上下文組成的個(gè)人記錄集合Pu,該集合的每條記錄包含音樂(lè)編號(hào)、上下文信息和評(píng)分。
[0012]進(jìn)一歩,步驟2)中所述K近鄰相似記錄集合S (C),具體是:
[0013]I)利用余弦相關(guān)性公式計(jì)算用戶(hù)Ua當(dāng)前上下文c與其個(gè)人記錄集合中任一上下文X的相似度:
【權(quán)利要求】
1.基于上下文預(yù)過(guò)濾的實(shí)時(shí)音樂(lè)推薦方法,該方法的特征在于獲取用戶(hù)使用音樂(lè)服務(wù)的歷史數(shù)據(jù)后,針對(duì)當(dāng)前在線(xiàn)活躍用戶(hù)進(jìn)行以下操作: I)提取所有用戶(hù)的歷史數(shù)據(jù),構(gòu)建“用戶(hù)-音樂(lè)-上下文”三元數(shù)據(jù)模型,并針對(duì)每個(gè)用戶(hù)U建立的音樂(lè)和上下文組成的個(gè)人記錄集合Pu ;2)對(duì)每個(gè)當(dāng)前活躍用戶(hù)Ua,根據(jù)其個(gè)人記錄集合~*利用余弦相關(guān)性評(píng)估歷史記錄中的上下文與當(dāng)前上下文c的相似度,構(gòu)造出K近鄰的當(dāng)前上下文相似記錄集合S(C); 3)利用S(C)將“用戶(hù)-音樂(lè)-上下文”三元數(shù)據(jù)模型轉(zhuǎn)換成“用戶(hù)-音樂(lè)”二元數(shù)據(jù)模型;4)采用基于模糊集劃分的協(xié)同過(guò)濾算法,預(yù)測(cè)每個(gè)當(dāng)前活躍用戶(hù)Ua對(duì)所有音樂(lè)的評(píng)分。
2.如權(quán)利要求1所述的基于上下文預(yù)過(guò)濾的實(shí)時(shí)音樂(lè)推薦方法,其特征在于:步驟I)中所述的用戶(hù)歷史數(shù)據(jù)、三元數(shù)據(jù)模型和個(gè)人記錄集合Pu,具體是: 1)每條用戶(hù)歷史數(shù)據(jù)記錄包含用戶(hù)編號(hào)、音樂(lè)編號(hào)、上下文信息和評(píng)分,根據(jù)所有的用戶(hù)歷史數(shù)據(jù)記錄可以構(gòu)建“用戶(hù)-音樂(lè)-上下文”三元數(shù)據(jù)模型; 2)針對(duì)每個(gè)用戶(hù)U,建立由音樂(lè)和上下文組成的個(gè)人記錄集合Pu,該集合的每條記錄包含音樂(lè)編號(hào)、上下文信息和評(píng)分。
3.如權(quán)利要求2所述的基`于上下文預(yù)過(guò)濾的實(shí)時(shí)音樂(lè)推薦方法,其特征在于:步驟2)中所述K近鄰相似記錄集合S (c),具體是:` 1)利用余弦相關(guān)性公式計(jì)算用戶(hù)Ua當(dāng)前上下文c與其個(gè)人記錄集合K、中任一上下文X的相似度:
4.如權(quán)利要求3所述的基于上下文預(yù)過(guò)濾的實(shí)時(shí)音樂(lè)推薦方法,其特征在于:步驟3)中所述利用S(C)將三元“用戶(hù)-音樂(lè)-上下文”模型轉(zhuǎn)化成二元“用戶(hù)-音樂(lè)”模型,具體是: 1)在每個(gè)用戶(hù)Ua的K近鄰相似記錄集合S(C)中,如果不同上下文中對(duì)同一音樂(lè)服務(wù)存在不同的偏好值,則僅保留其上下文與目標(biāo)用戶(hù)當(dāng)前上下文c相似度最大的那條偏好記錄; 2)將所有用戶(hù)的相似上下文記錄集合S(C)合并起來(lái),刪除每條記錄的上下文數(shù)據(jù)項(xiàng),構(gòu)成集合M,這樣M中的每條記錄僅包含用戶(hù)、音樂(lè)和評(píng)分三個(gè)數(shù)據(jù)項(xiàng); 3)根據(jù)集合M,構(gòu)造二元“用戶(hù)-音樂(lè)”模型的數(shù)據(jù)矩陣D,其中矩陣的行表示用戶(hù),列表示音樂(lè),矩陣元素Dy表示用戶(hù)i對(duì)音樂(lè)j的評(píng)分。
5.如權(quán)利要求4所述的基于上下文預(yù)過(guò)濾的實(shí)時(shí)音樂(lè)推薦方法,其特征在于:步驟4)中所述的對(duì)二元“用戶(hù)-音樂(lè)”模型采用的基于模糊集劃分的協(xié)同過(guò)濾算法,具體是: I)數(shù)據(jù)矩陣D的每一行代表ー個(gè)用戶(hù)對(duì)所有音樂(lè)的評(píng)分(未評(píng)分的記為0),看成ー個(gè)用戶(hù)的屬性,用經(jīng)典模糊C均值聚類(lèi)算法把用戶(hù)聚成k類(lèi),其中simk(i,j)是第k類(lèi)用戶(hù)i和用戶(hù)j的相似度; 2)預(yù)測(cè)第k類(lèi)用戶(hù)i對(duì)未評(píng)分音樂(lè)d的評(píng)分Pi,d,計(jì)算公式如下:
【文檔編號(hào)】G06F17/30GK103559197SQ201310438728
【公開(kāi)日】2014年2月5日 申請(qǐng)日期:2013年9月23日 優(yōu)先權(quán)日:2013年9月23日
【發(fā)明者】卜佳俊, 王學(xué)慶, 李平, 陳純, 何占盈, 王燦, 吳曉凡 申請(qǐng)人:浙江大學(xué)