專利名稱:一種富媒體個性化推薦方法
技術(shù)領(lǐng)域:
本發(fā)明屬于網(wǎng)絡(luò)應(yīng)用個性化推薦技術(shù)領(lǐng)域,具體來講,涉及一種富媒體個性化推薦方法。
背景技術(shù):
網(wǎng)絡(luò)應(yīng)用及業(yè)務(wù)的不斷發(fā)展,激發(fā)了網(wǎng)絡(luò)海量信息與用戶狹窄專一需求之間的矛盾。一方面,用戶通過搜索引擎能夠主動搜索到需求的網(wǎng)絡(luò)信息,但不夠準(zhǔn)確,而且還需要用戶再篩選。另一方面,運(yùn)營商無法主動獲知用戶需求,并針對用戶提供個性化服務(wù)。運(yùn)營商不只希望由用戶定制服務(wù),還希望能夠主動根據(jù)用戶行為進(jìn)行用戶偏好分析,然后定向推送個性化服務(wù)。前者是被動的,后者是主動的,后者的需求在互聯(lián)網(wǎng)運(yùn)營商、電信運(yùn)營商和廣電運(yùn)營商中廣泛存在并且急切。富媒體和傳統(tǒng)媒體有所區(qū)別,它是文本、圖片、音頻、視頻、動畫等多種媒體的結(jié)合,并提供豐富的交互能力。一個優(yōu)秀的富媒體存在被動及主動交互兩個方面,被動交互可以定位在所有用戶通用的交互,而主動交互需要根據(jù)用戶或者用戶群體的不同而不同。正是基于這樣的交互能力,富媒體可以為個性化推薦系統(tǒng)提供豐富的基礎(chǔ)數(shù)據(jù),使得個性化推薦系統(tǒng)能夠更加準(zhǔn)確地推薦,達(dá)到網(wǎng)絡(luò)個性化的目的。個性化推薦系統(tǒng)通過收集富媒體交互過程中用戶的行為數(shù)據(jù)來獲取用戶的偏好特性,進(jìn)而根據(jù)這些偏好特性從網(wǎng)絡(luò)上的海量信息中挖掘用戶潛在感興趣的或者需要的資源,并提供相應(yīng)的推薦。推薦的實質(zhì)是通過分析用戶已選擇的資源來預(yù)測用戶對未選擇資源的喜歡程度,并將預(yù)測的結(jié)果以某種有效的形式展現(xiàn)給用戶,比如將預(yù)測值較高的資源推薦給用戶。經(jīng)過對多種網(wǎng)絡(luò)中個性化推薦模型的研究與抽象,整理出個性化推薦系統(tǒng)的典型框架如
圖1所示,各組件功能如下1、用戶-業(yè)務(wù)系統(tǒng)交互接口用戶-業(yè)務(wù)系統(tǒng)交互接口為用戶使用業(yè)務(wù),即進(jìn)行資源訪問的基本接口。個性化推薦系統(tǒng)通過用戶對資源的訪問歷史及行為直接或者間接的收集用戶數(shù)據(jù),然后給后端推薦引擎建立個性化推薦模型并形成個性化推薦結(jié)果展示給用戶。2、用戶數(shù)據(jù)采集模塊用戶數(shù)據(jù)采集通常可以分為兩種方式,通過服務(wù)器日志進(jìn)行數(shù)據(jù)預(yù)處理形成用戶行為日志的間接采集或者通過服務(wù)器采集功能模塊直接采集。服務(wù)器日志間接采集方式可以通過一段時間內(nèi)的日志積累對用戶行為做一個系統(tǒng)分析,但是實時性不強(qiáng),需要離線分析;服務(wù)器采集模塊直接采集從用戶進(jìn)入系統(tǒng)初期就開始實時采集,積少成多,但對服務(wù)器會形成較高負(fù)載。3、推薦引擎推薦引擎在不同的個性化推薦系統(tǒng)中實現(xiàn)方式不同,也是個性化推薦系統(tǒng)研究的核心,但推薦引擎中通常會包含以下子模塊
3.1用戶規(guī)則數(shù)據(jù)經(jīng)過交互接口直接或者間接采集的用戶數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,整理縮減,形成的可用可分析的用戶規(guī)則數(shù)據(jù)條目。本數(shù)據(jù)將提供給數(shù)據(jù)挖掘模塊進(jìn)行用戶偏好模型的建立。3. 2用戶偏好模型首先由已有的用戶規(guī)則數(shù)據(jù)經(jīng)過數(shù)據(jù)挖掘模塊處理得到用戶偏好模型,同時,個性化推薦系統(tǒng)根據(jù)用戶的瀏覽行為不斷修正并改變此模型。3. 3資源特征模型該模塊在大多數(shù)系統(tǒng)中都只涉及資源的條目數(shù)據(jù),并用于進(jìn)行與用戶規(guī)則數(shù)據(jù)、 資源數(shù)據(jù)的交叉建模過程。個性化推薦系統(tǒng)將在用戶規(guī)則數(shù)據(jù)的基礎(chǔ)上進(jìn)行資源特征的交叉建模,資源自身特征可以基于基本的語義屬性,也可以采用視頻挖掘技術(shù)所提取的視頻摘要及模式信息等。3. 4業(yè)務(wù)推薦模型該模塊是個性化推薦系統(tǒng)的核心模塊,也是前面眾多工作成果的集中體現(xiàn)。它以用戶偏好模型及資源特征模型為輸入,經(jīng)過推薦算法,最終向用戶推薦他很可能會感興趣的,并且還未瀏覽過的資源。但現(xiàn)有技術(shù)的個性化推薦方法存在推薦不夠準(zhǔn)確和實用的缺陷。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)不足,提供一種推薦準(zhǔn)確和實用的富媒體個性化推薦方法。為實現(xiàn)上述發(fā)明目的,本發(fā)明富媒體個性化推薦方法,其特征在于,包括以下步驟(1)、選擇能夠體現(xiàn)富媒體資源特征的語義標(biāo)簽集合,基于這個語義標(biāo)簽集合,以語義標(biāo)簽的權(quán)值表示富媒體資源在該標(biāo)簽的語義強(qiáng)度,對富媒體資源進(jìn)行全面的描述,為每個富媒體資源形成一個特征描述樣本
權(quán)利要求
1. 一種富媒體個性化推薦方法,其特征在于,包括以下步驟 (1)、選擇能夠體現(xiàn)富媒體資源特征的語義標(biāo)簽集合,基于這個語義標(biāo)簽集合,以語義標(biāo)簽的權(quán)值表示富媒體資源在該標(biāo)簽的語義強(qiáng)度,對富媒體資源進(jìn)行全面的描述,為每個富媒體資源形成一個特征描述樣本
2.根據(jù)權(quán)利要求1所述的富媒體個性化推薦方法,其特征在于,所述的個性化推薦為 a、基于用戶與富媒體資源之間興趣度距離的推薦遍歷資源庫中的富媒體資源,求得當(dāng)前用戶與富媒體資源之間的興趣度距離
全文摘要
本發(fā)明公開了一種富媒體個性化推薦方法,通過選擇能夠體現(xiàn)富媒體資源特征的語義標(biāo)簽集合,以語義標(biāo)簽的權(quán)值表示富媒體資源在該標(biāo)簽的語義強(qiáng)度,為每個富媒體資源形成一個特征描述樣本;然后記錄下用戶富媒體資源使用情況,得到m個特征樣本構(gòu)成的用戶興趣度原始數(shù)據(jù)U,并經(jīng)過歸一化后得到的用戶興趣度模型u;最后,以富媒體資源的特征描述樣本及用戶興趣度模型u為基礎(chǔ),采用興趣度距離及特征距離來度量并形成推薦列表進(jìn)行個性化推薦。由于采用語義標(biāo)簽對富媒體資源進(jìn)行描述、對用戶的使用情況進(jìn)行采集,這樣可以較為定量地確定用戶對于富媒體資源的興趣程度,因此,本發(fā)明富媒體個性化推薦具有推薦準(zhǔn)確和實用的特點。
文檔編號G06F17/30GK102402594SQ201110345078
公開日2012年4月4日 申請日期2011年11月4日 優(yōu)先權(quán)日2011年11月4日
發(fā)明者吳曉琴, 孫健, 謝發(fā)川, 車斌, 隆克平 申請人:電子科技大學(xué)