本發(fā)明涉及互聯(lián)網(wǎng)信息技術(shù)領(lǐng)域,尤其涉及一種跨業(yè)務(wù)的電子資源推薦方法及裝置。
背景技術(shù):
當(dāng)今社會(huì),網(wǎng)絡(luò)信息浩如煙海,搜索引擎是用戶查找自己喜愛(ài)的電子資源的重要手段之一,用戶在已知自己期望查找的電子資源的關(guān)鍵詞的情況下,可以通過(guò)搜索引擎查找希望使用的電子資源。如果用戶不清楚自己期望得到什么電子資源,將無(wú)法使用搜索引擎進(jìn)行搜索。而現(xiàn)有的電子資源推薦方法,一般是通過(guò)智能推薦算法,計(jì)算用戶的搜索記錄,確定用戶感興趣的電子資源,并向用戶進(jìn)行推薦。顯然,得到的推薦電子資源往往仍為用戶之前期望獲得的電子資源。
目前,基于內(nèi)容的推薦方法主要是根據(jù)歷史信息構(gòu)造用戶內(nèi)容偏好文檔,然后計(jì)算推薦項(xiàng)目與用戶偏好文檔的相似度,將最相似的項(xiàng)目推薦給用戶?;趦?nèi)容的推薦方法推薦的電子資源基本都是比較大眾的,只能推薦和用戶已有興趣相似的電子資源,不能為用戶發(fā)現(xiàn)更多新的興趣。
基于用戶的協(xié)同過(guò)濾方法主要是根據(jù)某些用戶對(duì)某一物品的評(píng)價(jià)比較相似,就可以假設(shè)這些用戶具有相同的興趣,進(jìn)而認(rèn)為他們對(duì)其他物品的興趣可能也比較相似,找到具有相似興趣的用戶形成興趣群,向該興趣群中其他用戶進(jìn)行推薦。當(dāng)推薦系統(tǒng)中數(shù)據(jù)量很大而用戶的評(píng)價(jià)數(shù)據(jù)又很少時(shí),難以計(jì)算相似性,而無(wú)法推薦;當(dāng)新物品剛進(jìn)入系統(tǒng)時(shí),沒(méi)有用戶對(duì)其評(píng)價(jià),造成協(xié)同過(guò)濾無(wú)法推薦該資源。并且,用戶和資源會(huì)隨時(shí)間快速的增長(zhǎng),而協(xié)同過(guò)濾方法的復(fù)雜度和數(shù)據(jù)量呈線性關(guān)系增長(zhǎng),導(dǎo)致在大數(shù)據(jù)量下,推薦方法的計(jì)算性能與效率較差,可擴(kuò)展性較差。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明實(shí)施例期望提供一種跨業(yè)務(wù)的電子資源推薦方法及裝置,能實(shí)現(xiàn)跨業(yè)務(wù)的電子資源推薦,且能提高推薦效率。
為達(dá)到上述目的,本發(fā)明實(shí)施例的技術(shù)方案是這樣實(shí)現(xiàn)的:
本發(fā)明實(shí)施例提供一種跨業(yè)務(wù)的電子資源推薦方法,所述方法包括:
建立資源名稱、資源對(duì)象及資源標(biāo)簽各自與電子資源的關(guān)聯(lián)關(guān)系表;
將各個(gè)業(yè)務(wù)對(duì)應(yīng)的電子資源庫(kù)中與資源名稱、或資源對(duì)象、或資源標(biāo)簽相關(guān)的電子資源,分別放入資源名稱、資源對(duì)象及資源標(biāo)簽各自對(duì)應(yīng)的關(guān)聯(lián)關(guān)系表中;
將資源名稱、資源對(duì)象及資源標(biāo)簽各自對(duì)應(yīng)的關(guān)聯(lián)關(guān)系表進(jìn)行合并,生成電子資源推薦列表;所述電子資源推薦列表用于向用戶推薦電子資源。
優(yōu)選地,所述方法還包括:刪除電子資源推薦列表中重復(fù)的電子資源。
優(yōu)選地,所述方法還包括:計(jì)算電子資源推薦列表中電子資源的綜合相似度,并將電子資源推薦列表中的電子資源按照所述綜合相似度進(jìn)行降序排列;
所述綜合相似度通過(guò)資源名稱相似度、資源對(duì)象相似度及資源標(biāo)簽相似度加權(quán)求和得到。
優(yōu)選地,所述方法還包括:將按照所述綜合相似度進(jìn)行降序排列的電子資源推薦列表中,存在特殊關(guān)系的電子資源添加到電子資源特殊關(guān)系表,并將電子資源特殊關(guān)系表中的電子資源按已有順序排列在電子資源推薦列表的前部。
優(yōu)選地,所述方法還包括:在建立所述資源名稱、資源對(duì)象及資源標(biāo)簽各自對(duì)應(yīng)的關(guān)聯(lián)關(guān)系表之前,根據(jù)用戶瀏覽信息主動(dòng)獲取資源名稱、資源對(duì)象及資源標(biāo)簽;并在生成電子資源推薦列表后主動(dòng)向用戶推薦電子資源。
本發(fā)明實(shí)施例提供一種跨業(yè)務(wù)的電子資源推薦裝置,所述裝置包括:構(gòu)建模塊、整合模塊及生成模塊;其中,
所述構(gòu)建模塊,用于建立資源名稱、資源對(duì)象及資源標(biāo)簽各自與電子資源的關(guān)聯(lián)關(guān)系表;
所述整合模塊,用于將各個(gè)業(yè)務(wù)對(duì)應(yīng)的電子資源庫(kù)中與資源名稱、或資源對(duì)象、或資源標(biāo)簽相關(guān)的電子資源,分別放入資源名稱、資源對(duì)象及資源標(biāo)簽各自對(duì)應(yīng)的關(guān)聯(lián)關(guān)系表中;
所述生成模塊,用于將資源名稱、資源對(duì)象及資源標(biāo)簽各自對(duì)應(yīng)的關(guān)聯(lián)關(guān)系表進(jìn)行合并,生成電子資源推薦列表;所述電子資源推薦列表用于向用戶推薦電子資源。
優(yōu)選地,所述生成模塊,還用于刪除電子資源推薦列表中重復(fù)的電子資源。
優(yōu)選地,所述裝置還包括統(tǒng)計(jì)模塊,用于計(jì)算電子資源推薦列表中電子資源的綜合相似度,并將電子資源推薦列表中的電子資源按照所述綜合相似度進(jìn)行降序排列;
所述綜合相似度通過(guò)資源名稱相似度、資源對(duì)象相似度及資源標(biāo)簽相似度加權(quán)求和得到。
優(yōu)選地,所述生成模塊,還用于將按照所述綜合相似度進(jìn)行降序排列的電子資源推薦列表中,存在特殊關(guān)系的電子資源添加到電子資源特殊關(guān)系表,并將電子資源特殊關(guān)系表中的電子資源按已有順序排列在電子資源推薦列表的前部。
優(yōu)選地,所述構(gòu)建模塊,還用于在建立所述資源名稱、資源對(duì)象及資源標(biāo)簽各自對(duì)應(yīng)的關(guān)聯(lián)關(guān)系表之前,根據(jù)用戶瀏覽信息主動(dòng)獲取資源名稱、資源對(duì)象及資源標(biāo)簽;
其中,所述裝置還包括推薦模塊,用于在生成電子資源推薦列表后主動(dòng)向用戶推薦電子資源。
本發(fā)明實(shí)施例的跨業(yè)務(wù)的電子資源推薦方法及裝置,建立資源名稱、資源對(duì)象及資源標(biāo)簽各自與電子資源的關(guān)聯(lián)關(guān)系表;將各個(gè)業(yè)務(wù)對(duì)應(yīng)的電子資源庫(kù)中與資源名稱、或資源對(duì)象、或資源標(biāo)簽相關(guān)的電子資源,分別放入資源名稱、資源對(duì)象及資源標(biāo)簽各自對(duì)應(yīng)的關(guān)聯(lián)關(guān)系表中;將資源名稱、資源對(duì)象及資源標(biāo)簽各自對(duì)應(yīng)的關(guān)聯(lián)關(guān)系表進(jìn)行合并,生成電子資源推薦列表;所述電子資源推薦列表用于向用戶推薦電子資源??梢钥闯?,本發(fā)明實(shí)施例根據(jù)資源名稱、資源對(duì)象及資源標(biāo)簽這三個(gè)屬性信息,創(chuàng)建了基于電子資源的資源名稱-電子資源關(guān)聯(lián)關(guān)系表、資源對(duì)象-電子資源關(guān)聯(lián)關(guān)系表、資源標(biāo)簽-電子資源關(guān)聯(lián)關(guān)系表,通過(guò)計(jì)算電子資源之間的相似度,生成電子資源推薦列表,從而實(shí)現(xiàn)跨業(yè)務(wù)的電子資源推薦。
進(jìn)一步的,本發(fā)明實(shí)施例還引入了電子資源熱度,并采用刪除電子資源推薦列表中重復(fù)電子資源的方式,優(yōu)化向用戶推薦電子資源的電子資源推薦列表,以實(shí)現(xiàn)向用戶推薦更優(yōu)、更符合不同用戶需求的電子資源。
可見(jiàn),本發(fā)明實(shí)施例克服了現(xiàn)有電子資源關(guān)系推薦方法中在多內(nèi)容業(yè)務(wù)融合網(wǎng)中不能跨業(yè)務(wù)場(chǎng)景推薦的不足,解決了電子資源熱度推薦個(gè)性化程度較弱、以及電子資源數(shù)量急劇增加時(shí)計(jì)算性能不足的問(wèn)題,提高了電子資源推薦的效率和可擴(kuò)展性。
附圖說(shuō)明
圖1為本發(fā)明實(shí)施例跨業(yè)務(wù)的電子資源推薦方法實(shí)現(xiàn)流程示意圖;
圖2為本發(fā)明實(shí)施例電子資源綜合相似度獲得方法示意圖;
圖3為本發(fā)明實(shí)施例實(shí)現(xiàn)跨業(yè)務(wù)的電子資源推薦具體流程示意圖;
圖4為本發(fā)明實(shí)施例實(shí)現(xiàn)跨業(yè)務(wù)的電子資源推薦的顯示示意圖;
圖5為本發(fā)明實(shí)施例跨業(yè)務(wù)的電子資源推薦裝置的組成結(jié)構(gòu)示意圖。
具體實(shí)施方式
在本發(fā)明實(shí)施例中,建立資源名稱、資源對(duì)象及資源標(biāo)簽各自與電子資源的關(guān)聯(lián)關(guān)系表;將各個(gè)業(yè)務(wù)對(duì)應(yīng)的電子資源庫(kù)中與資源名稱、或資源對(duì)象、或資源標(biāo)簽相關(guān)的電子資源,分別放入資源名稱、資源對(duì)象及資源標(biāo)簽各自對(duì)應(yīng)的關(guān)聯(lián)關(guān)系表中;將資源名稱、資源對(duì)象及資源標(biāo)簽各自對(duì)應(yīng)的關(guān)聯(lián)關(guān)系表進(jìn)行合并,生成電子資源推薦列表;所述電子資源推薦列表用于向用戶推薦電子資源。
進(jìn)一步地,為了優(yōu)化電子資源推薦列表,可將重復(fù)的電子資源從生成的電子資源推薦列表中刪除。
其中,所述資源名稱、資源對(duì)象及資源標(biāo)簽可以在建立所述關(guān)聯(lián)關(guān)系表之前,根據(jù)用戶瀏覽信息主動(dòng)獲??;對(duì)生成的電子資源推薦列表,可以是在生成電子資源推薦列表后主動(dòng)向用戶推薦電子資源。
對(duì)于生成的電子資源推薦列表,可通過(guò)計(jì)算綜合相似度的方式對(duì)電子資源推薦列表中電子資源進(jìn)行排序,具體的:計(jì)算電子資源推薦列表中電子資源的綜合相似度,并將電子資源推薦列表中的電子資源按照所述綜合相似度進(jìn)行降序排列;所述綜合相似度通過(guò)資源名稱相似度、資源對(duì)象相似度及資源標(biāo)簽相似度加權(quán)求和得到。
其中,資源名稱相似度、資源對(duì)象相似度及資源標(biāo)簽相似度可分別通過(guò)已有的相似度算法計(jì)算得到。
進(jìn)一步地,可將按照所述綜合相似度進(jìn)行降序排列的電子資源推薦列表中,存在特殊關(guān)系的電子資源添加到電子資源特殊關(guān)系表,并將電子資源特殊關(guān)系表中的電子資源按已有順序排列在電子資源推薦列表的前部。這里,所述特殊關(guān)系可以是通過(guò)爬蟲收集的電子資源數(shù)據(jù)中發(fā)現(xiàn)的電子資源之間的關(guān)系,比如:電子資源的作者之間存在師生、親屬等關(guān)系。
本發(fā)明實(shí)施例中,跨業(yè)務(wù)的電子資源推薦方法的實(shí)現(xiàn)流程如圖1所示,包括以下步驟:
步驟101:建立資源名稱、資源對(duì)象及資源標(biāo)簽各自與電子資源的關(guān)聯(lián)關(guān)系表;將各個(gè)業(yè)務(wù)對(duì)應(yīng)的電子資源庫(kù)中與資源名稱、或資源對(duì)象、或資源標(biāo)簽相關(guān)的電子資源,分別放入資源名稱、資源對(duì)象及資源標(biāo)簽各自對(duì)應(yīng)的關(guān)聯(lián)關(guān)系表中;
本發(fā)明實(shí)施例中,首先需要將多種類型的電子資源庫(kù)分別接入電子資源推薦平臺(tái);這里,多種類型的電子資源庫(kù)分別對(duì)應(yīng)不同的業(yè)務(wù),比如:提供音樂(lè)的音頻數(shù)據(jù)庫(kù),提供電影、電視劇、娛樂(lè)節(jié)目等的視頻數(shù)據(jù)庫(kù),提供游戲的游戲數(shù)據(jù)庫(kù),提供動(dòng)畫/漫畫、圖片/圖像等的動(dòng)漫數(shù)據(jù)庫(kù),等等;所謂接入就是指將各個(gè)數(shù)據(jù)庫(kù)與電子資源推薦平臺(tái)相連,使電子資源推薦平臺(tái)可以從各種類型的電子資源庫(kù)中獲取所需的電子資源。
之后,需要對(duì)電子資源庫(kù)中的用戶使用日志進(jìn)行抽取、轉(zhuǎn)換、清洗、加載,提取出處理后的各電子資源庫(kù)中用戶行為數(shù)據(jù)與電子資源數(shù)據(jù)的屬性信息,并將提取到的數(shù)據(jù)保存成預(yù)設(shè)的數(shù)據(jù)結(jié)構(gòu),將規(guī)范化的預(yù)設(shè)數(shù)據(jù)結(jié)構(gòu)的用戶行為數(shù)據(jù)與電子資源數(shù)據(jù)的屬性信息導(dǎo)入電子資源推薦平臺(tái)。
其中,由于不同類型的電子資源庫(kù)中電子資源的屬性信息存在差別,本發(fā)明實(shí)施例通過(guò)對(duì)各種類型的電子資源所具有的共性的屬性信息進(jìn)行全面考察,如:電子資源名稱、信息描述、信息類型、信息格式、人物、信息描述性標(biāo)簽等;提取能夠充分體現(xiàn)電子資源內(nèi)容且共性存在于各種類型的電子資源中的屬性信息,并轉(zhuǎn)換為預(yù)設(shè)數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)進(jìn)行處理。
最終,本發(fā)明實(shí)施例采用資源名稱、資源對(duì)象及資源標(biāo)簽這三個(gè)具有共性的屬性作為電子資源的屬性信息;其中,資源名稱包含電子資源的語(yǔ)義信息,可采用分詞工具對(duì)電子資源名稱進(jìn)行分詞處理得到名稱詞,每個(gè)電子資源可對(duì)應(yīng)至少一個(gè)名稱詞;資源對(duì)象為電子資源中包含的對(duì)象的特征信息,每個(gè)電子資源存在一系列相關(guān)的資源對(duì)象,如:音樂(lè)資源與作曲者、作詞者、演唱者等相關(guān)信息;資源標(biāo)簽為電子資源的風(fēng)格類型信息,每個(gè)電子資源存在一系列相關(guān)的資源標(biāo)簽,如視頻資源與體育、財(cái)經(jīng)、軍事等內(nèi)容相關(guān),音樂(lè)資源與搖滾、民樂(lè)、爵士等類型相關(guān)。
進(jìn)一步地,本發(fā)明實(shí)施例將各電子資源庫(kù)進(jìn)行整合,建立電子資源庫(kù)所具有的各個(gè)屬性信息各自與電子資源數(shù)據(jù)的關(guān)聯(lián)關(guān)系表;具體的,建立資源名稱與電子資源的關(guān)聯(lián)關(guān)系表,建立資源對(duì)象與電子資源的關(guān)聯(lián)關(guān)系表,建立資源標(biāo)簽與電子資源的關(guān)聯(lián)關(guān)系表。
其中,資源名稱-電子資源關(guān)聯(lián)關(guān)系表,表示該表中的電子資源均與相應(yīng)的名稱詞相關(guān),例如,所有包含“名稱詞a”的電子資源,均存在于名稱a-電子資源關(guān)聯(lián)關(guān)系表中;這里,資源名稱可以包括多個(gè)名稱詞,具有相同名稱詞的電子資源形成一個(gè)資源名稱-電子資源關(guān)聯(lián)關(guān)系表中,實(shí)際應(yīng)用中,會(huì)存在多個(gè)資源名稱-電子資源關(guān)聯(lián)關(guān)系表;資源對(duì)象-電子資源關(guān)聯(lián)關(guān)系表,表示資源對(duì)象與電子資源的關(guān)系,例如,所有包含“對(duì)象a”的電子資源,均存在于對(duì)象a-電子資源關(guān)聯(lián)關(guān)系表中,同樣,實(shí)際應(yīng)用中,會(huì)存在多個(gè)資源對(duì)象-電子資源關(guān)聯(lián)關(guān)系表;資源標(biāo)簽-電子資源關(guān)聯(lián)關(guān)系表,表示標(biāo)簽與電子資源的關(guān)系,例如,所有包含“標(biāo)簽a”的電子資源,均存在于標(biāo)簽a-電子資源關(guān)聯(lián)關(guān)系表中類似的,實(shí)際應(yīng)用中,會(huì)存在多個(gè)資源標(biāo)簽-電子資源關(guān)聯(lián)關(guān)系表。
下面以電子資源庫(kù)中的一個(gè)目標(biāo)電子資源為例,具體說(shuō)明如何根據(jù)電子資源的屬性信息:資源名稱、或資源對(duì)象、或資源標(biāo)簽,生成各屬性信息與電子資源的關(guān)聯(lián)關(guān)系表。
1)資源名稱-電子資源關(guān)聯(lián)關(guān)系表的生成方法包括:
A1.獲取預(yù)先收集的預(yù)設(shè)數(shù)據(jù)結(jié)構(gòu)的電子資源;
這里,所述預(yù)設(shè)數(shù)據(jù)結(jié)構(gòu)是通過(guò)對(duì)電子資源庫(kù)中的用戶使用日志進(jìn)行抽取、轉(zhuǎn)換、清洗、加載,提取出處理后的各個(gè)電子資源庫(kù)中用戶行為數(shù)據(jù)與電子資源數(shù)據(jù)的屬性信息,進(jìn)一步將提取到的數(shù)據(jù)保存而成。其中,所述屬性信息可以是資源名稱、資源對(duì)象及資源標(biāo)簽等。
A2.獲取各個(gè)電子資源的名稱詞;
A3.根據(jù)獲取到的目標(biāo)電子資源的名稱詞,創(chuàng)建目標(biāo)電子資源的資源名稱-電子資源列表;
A4.根據(jù)電子資源包含的名稱詞,將與該名稱詞具有相同名稱詞的電子資源分別加入對(duì)應(yīng)的資源名稱-電子資源列表中,得到資源名稱-電子資源關(guān)聯(lián)關(guān)系表;
A5.剔除資源名稱-電子資源關(guān)聯(lián)關(guān)系表中重復(fù)的電子資源;
A6.獲取統(tǒng)計(jì)周期內(nèi)電子資源熱度表;
這里,所述統(tǒng)計(jì)周期可以根據(jù)用戶需求或使用習(xí)慣等自行設(shè)置,比如:一天內(nèi)、一周內(nèi)、一個(gè)月內(nèi)等等;所謂電子資源熱度是指電子資源的使用頻率;
A7.從電子資源熱度表中,獲得資源名稱-電子資源關(guān)聯(lián)關(guān)系表中各電子資源的熱度,并將資源名稱-電子資源關(guān)聯(lián)關(guān)系表中的各電子資源按照熱度降序排列,取前K個(gè)電子資源,作為目標(biāo)電子資源的資源名稱-電子資源關(guān)聯(lián)關(guān)系表中的電子資源,K可以根據(jù)需要自行調(diào)整。
2)資源對(duì)象-電子資源關(guān)聯(lián)關(guān)系表的生成方法如下:
B1.獲取預(yù)先收集的預(yù)設(shè)數(shù)據(jù)結(jié)構(gòu)的電子資源;
這里,所述預(yù)設(shè)數(shù)據(jù)結(jié)構(gòu)是通過(guò)對(duì)電子資源庫(kù)中的用戶使用日志進(jìn)行抽取、轉(zhuǎn)換、清洗、加載,提取出處理后的各個(gè)電子資源庫(kù)中用戶行為數(shù)據(jù)與電子資源數(shù)據(jù)的屬性信息,進(jìn)一步將提取到的數(shù)據(jù)保存而成。其中,所述屬性信息可以是多個(gè)資源名稱、資源對(duì)象及資源標(biāo)簽等。
B2.獲取各電子資源的對(duì)象;
B3.根據(jù)獲取到的目標(biāo)電子資源的對(duì)象,創(chuàng)建目標(biāo)電子資源的資源對(duì)象-電子資源列表;
B4.根據(jù)電子資源包含的對(duì)象,將與目標(biāo)電子資源具有相同對(duì)象的電子資源分別加入對(duì)應(yīng)的資源對(duì)象-電子資源列表中,得到資源對(duì)象-電子資源關(guān)聯(lián)關(guān)系表;
B5.剔除資源對(duì)象-電子資源關(guān)聯(lián)關(guān)系表中重復(fù)的電子資源;
B6.獲取統(tǒng)計(jì)周期內(nèi)電子資源熱度表;
這里,所述統(tǒng)計(jì)周期可以根據(jù)用戶需求或使用習(xí)慣等自行設(shè)置,比如:一天內(nèi)、一周內(nèi)、一個(gè)月內(nèi)等等;所謂電子資源熱度是指電子資源的使用頻率;
B7.從電子資源熱度表中,獲得資源對(duì)象-電子資源關(guān)聯(lián)關(guān)系表中各電子資源的熱度,并將資源對(duì)象-電子資源關(guān)聯(lián)關(guān)系表中的各電子資源按照熱度降序排列,取前K個(gè)電子資源,作為目標(biāo)電子資源的資源對(duì)象-電子資源關(guān)聯(lián)關(guān)系表中的電子資源,K可以根據(jù)需要自行調(diào)整。
3)資源標(biāo)簽-電子資源關(guān)聯(lián)關(guān)系表的生成方法如下:
C1.獲取預(yù)先收集的預(yù)設(shè)數(shù)據(jù)結(jié)構(gòu)的電子資源;
這里,所述預(yù)設(shè)數(shù)據(jù)結(jié)構(gòu)是通過(guò)對(duì)電子資源庫(kù)中的用戶使用日志進(jìn)行抽取、轉(zhuǎn)換、清洗、加載,提取出處理后的各個(gè)電子資源庫(kù)中用戶行為數(shù)據(jù)與電子資源數(shù)據(jù)的屬性信息,進(jìn)一步將提取到的數(shù)據(jù)保存而成。其中,所述屬性信息可以是多個(gè)資源名稱、資源對(duì)象及資源標(biāo)簽等。
C2.獲取各電子資源的標(biāo)簽;
C3.根據(jù)獲取到的目標(biāo)電子資源的標(biāo)簽,創(chuàng)建目標(biāo)電子資源的資源標(biāo)簽-電子資源列表;
C4.根據(jù)電子資源包含的標(biāo)簽,將與目標(biāo)電子資源具有相同標(biāo)簽的電子資源分別加入對(duì)應(yīng)的資源標(biāo)簽-電子資源列表中,得到資源標(biāo)簽-電子資源關(guān)聯(lián)關(guān)系表;
C5.剔除資源標(biāo)簽-電子資源關(guān)聯(lián)關(guān)系表中重復(fù)的電子資源;
C6.獲取統(tǒng)計(jì)周期內(nèi)電子資源熱度表;
C7.從電子資源熱度表中,獲得資源標(biāo)簽-電子資源關(guān)聯(lián)關(guān)系表中各電子資源的熱度,并將資源標(biāo)簽-電子資源關(guān)聯(lián)關(guān)系表中的各電子資源按照熱度降序排列,取前K個(gè)電子資源,作為目標(biāo)電子資源的資源標(biāo)簽-電子資源關(guān)聯(lián)關(guān)系表中的電子資源,K可以根據(jù)需要自行調(diào)整。
其中,對(duì)所有電子資源庫(kù)中的電子資源在預(yù)設(shè)周期內(nèi)的用戶收藏、訂購(gòu)等用戶行為數(shù)據(jù)進(jìn)行統(tǒng)計(jì),將每個(gè)電子資源在預(yù)設(shè)周期內(nèi)對(duì)應(yīng)的用戶行為數(shù)據(jù)數(shù)量定義為電子資源熱度,建立電子資源熱度表。其預(yù)設(shè)周期初始值可以設(shè)定為1個(gè)月。
步驟102:將資源名稱、資源對(duì)象及資源標(biāo)簽各自對(duì)應(yīng)的關(guān)聯(lián)關(guān)系表進(jìn)行合并,生成電子資源推薦列表;所述電子資源推薦列表用于向用戶推薦電子資源。
這里,考慮到生成的電子資源推薦列表通過(guò)多個(gè)關(guān)聯(lián)關(guān)系表合并而成,可能會(huì)存在重復(fù)的電子資源,因此,可進(jìn)一步刪除電子資源推薦列表中重復(fù)的電子資源,以優(yōu)化生成的電子資源推薦列表。
進(jìn)一步地,還可以對(duì)電子資源推薦列表中的所有電子資源進(jìn)行排序,具體的:計(jì)算電子資源推薦列表中電子資源的綜合相似度,并將電子資源推薦列表中的電子資源按照所述綜合相似度進(jìn)行降序排列;
其中,所述綜合相似度通過(guò)資源名稱相似度、資源對(duì)象相似度及資源標(biāo)簽相似度加權(quán)求和得到:
電子資源綜合相似度=電子資源名稱相似度*電子資源名稱屬性權(quán)重+電子資源對(duì)象相似度*電子資源對(duì)象屬性權(quán)重+電子資源標(biāo)簽相似度*電子資源標(biāo)簽屬性權(quán)重。
其中,所述資源名稱相似度、資源對(duì)象相似度及資源標(biāo)簽相似度各自的權(quán)重,可以參考需要進(jìn)行業(yè)務(wù)推薦的電子資源,為各個(gè)屬性信息對(duì)應(yīng)設(shè)置符合推薦業(yè)務(wù)需求的權(quán)重。
本發(fā)明實(shí)施例中,電子資源綜合相似度獲得方法如圖2所示,假設(shè)電子資源A的屬性信息分別為:名稱詞a、對(duì)象a以及標(biāo)簽a;電子資源B的屬性信息分別為:名稱詞b、對(duì)象b以及標(biāo)簽b,分別計(jì)算電子資源A與電子資源B名稱相似度、對(duì)象相似度以及標(biāo)簽相似度,并對(duì)名稱相似度、對(duì)象相似度以及標(biāo)簽相似度進(jìn)行加權(quán)求和,計(jì)算得到電子資源A與電子資源B的綜合相似度。
其中,計(jì)算電子資源的名稱相似度、對(duì)象相似度及標(biāo)簽相似度的算法具體如下:
1)計(jì)算電子資源的名稱相似度的算法,包括:
對(duì)電子資源庫(kù)中各類型的電子資源的名稱使用分詞工具進(jìn)行分詞處理,每個(gè)電子資源名稱處理后得到若干個(gè)名稱詞;
電子資源的名稱相似度=兩個(gè)電子資源名稱中相同名稱詞的數(shù)量÷兩個(gè)電子資源名稱中所有無(wú)重復(fù)名稱詞的數(shù)量。
2)電子資源對(duì)象相似度算法,包括:
獲取電子資源庫(kù)中各類型的電子資源的對(duì)象列表,即每個(gè)電子資源對(duì)應(yīng)若干個(gè)資源對(duì)象;
電子資源對(duì)象相似度=兩個(gè)電子資源對(duì)應(yīng)的資源對(duì)象中共有對(duì)象數(shù)量÷兩個(gè)電子資源的所有無(wú)重復(fù)資源對(duì)象數(shù)量。
3)電子資源標(biāo)簽相似度算法,包括:
獲取電子資源庫(kù)中各類型的電子資源的標(biāo)簽列表,即每個(gè)電子資源對(duì)應(yīng)若干個(gè)資源標(biāo)簽;
電子資源標(biāo)簽相似度=兩個(gè)電子資源對(duì)應(yīng)的資源標(biāo)簽中共有標(biāo)簽數(shù)量÷兩個(gè)電子資源的所有無(wú)重復(fù)資源標(biāo)簽數(shù)量。
這里,電子資源各屬性相似度的取值范圍均為(0,1),電子資源綜合相似度取值范圍是(0,1)。
進(jìn)一步地,將按照所述綜合相似度進(jìn)行降序排列的電子資源推薦列表中,存在特殊關(guān)系的電子資源添加到電子資源特殊關(guān)系表,獲取電子資源特殊關(guān)系表,將按照綜合相似度進(jìn)行降序排列的電子資源推薦列表中,存在于電子資源特殊關(guān)系表中的電子資源按已有的順序排列在電子資源推薦列表的前部;將電子資源推薦列表中的其他電子資源按已有的順序排列在后部。
這里,可以通過(guò)爬蟲收集互聯(lián)網(wǎng)電子資源數(shù)據(jù),發(fā)現(xiàn)電子資源之間的特殊關(guān)系,形成電子資源特殊關(guān)系表;并且,由于特殊關(guān)系會(huì)不斷更新,電子資源特殊關(guān)系表需由專人維護(hù)并定時(shí)更新。其中,所述特殊關(guān)系可以是電子資源的作者之間存在師生、親屬等關(guān)系。
圖3為實(shí)現(xiàn)跨業(yè)務(wù)的電子資源推薦具體流程圖,如圖3所示,本發(fā)明實(shí)施例實(shí)現(xiàn)跨業(yè)務(wù)的電子資源推薦具體處理流程包括以下步驟:
步驟31:獲取用戶的瀏覽信息,確定用戶需要的電子資源a;
這里,通過(guò)用戶當(dāng)前的瀏覽內(nèi)容獲得用戶的瀏覽信息,對(duì)用戶的瀏覽信息進(jìn)行抽簽、轉(zhuǎn)換、加載,然后提取處理后的用戶的行為數(shù)據(jù),確定用戶需要的電子資源a。
步驟32:根據(jù)用戶需要的電子資源a,生成針對(duì)電子資源a的電子資源推薦列表;
本步驟具體包括:
首先,獲取各電子資源庫(kù)中的電子資源a;
這里,將多種類型的電子資源庫(kù)的電子資源接入電子資源推薦平臺(tái),提取關(guān)于電子資源a的屬性信息,所述屬性信息包括:資源名稱、資源對(duì)象及資源標(biāo)簽;將提取到的電子資源a的各屬性信息保存成預(yù)設(shè)的數(shù)據(jù)結(jié)構(gòu),然后將保存成預(yù)設(shè)的數(shù)據(jù)結(jié)構(gòu)的電子資源屬性信息導(dǎo)入電子資源推薦平臺(tái)。
之后,確定電子資源a的屬性信息,建立屬性信息與電子資源a的關(guān)聯(lián)關(guān)系表;
這里,根據(jù)電子資源a的資源名稱、資源對(duì)象及資源標(biāo)簽這三個(gè)共性屬性,創(chuàng)建資源名稱-電子資源關(guān)聯(lián)關(guān)系表、資源對(duì)象-電子資源關(guān)聯(lián)關(guān)系表、資源標(biāo)簽-電子資源關(guān)聯(lián)關(guān)系表,并結(jié)合電子資源熱度對(duì)電子資源關(guān)聯(lián)關(guān)系表進(jìn)行降序排列。
最后,創(chuàng)建電子資源a的推薦列表;
這里,將電子資源a的資源名稱-電子資源關(guān)聯(lián)關(guān)系表、資源對(duì)象-電子資源關(guān)聯(lián)關(guān)系表、資源標(biāo)簽-電子資源關(guān)聯(lián)關(guān)系表中的電子資源,添加到電子資源a的推薦列表并刪除重復(fù)的電子資源;計(jì)算電子資源a的推薦列表中電子資源的綜合相似度,并將電子資源a的推薦列表中的電子資源按照所述綜合相似度進(jìn)行降序排列;接下來(lái),獲取電子資源a的特殊關(guān)系表,將按照綜合相似度進(jìn)行降序排列的電子資源a的推薦表中,存在于電子資源a的特殊關(guān)系表中的電子資源按已有的次序排列在電子資源a的推薦列表的前部;將電子資源a的推薦列表中的其他電子資源按已有的次序排列在后部。
步驟33:獲得電子資源a對(duì)應(yīng)的電子資源推薦列表;根據(jù)電子資源a對(duì)應(yīng)的電子資源推薦列表,向用戶推薦電子資源a。
圖4為本發(fā)明實(shí)施例實(shí)現(xiàn)跨業(yè)務(wù)的電子資源推薦的顯示示意圖,如圖4所示,在確定用戶需要的電子資源為《不能說(shuō)的秘密》之后,根據(jù)該電子資源的資源名稱、或資源對(duì)象、或資源標(biāo)簽生成電子資源推薦列表,并向用戶推薦;在推薦結(jié)果中顯示關(guān)于《不能說(shuō)的秘密》的相關(guān)電子資源,包含歌曲及電影,雖然用戶當(dāng)前使用的是音樂(lè)網(wǎng)站,但是該網(wǎng)站仍然可以在網(wǎng)頁(yè)的指定位置顯示有關(guān)電影《不能說(shuō)的秘密》的搜索結(jié)果;優(yōu)選地,還可以向用戶顯示電影《不能說(shuō)的秘密》的觀影地址,如:推薦觀影網(wǎng)站、網(wǎng)址鏈接、下載鏈接等等。
這里,顯示相關(guān)電子資源的位置不固定,可以如圖4一樣直接顯示在目標(biāo)電子資源下方,或者也可以在網(wǎng)頁(yè)的其他區(qū)域進(jìn)行顯示。
進(jìn)一步的,當(dāng)用戶使用的是客戶端進(jìn)行資源搜索時(shí),比如,假設(shè)用戶使用咪咕音樂(lè)搜索《不能說(shuō)的秘密》,根據(jù)本發(fā)明實(shí)施例的實(shí)現(xiàn)方案,咪咕音樂(lè)不僅僅會(huì)向用戶展示有關(guān)歌曲《不能說(shuō)的秘密》的搜索結(jié)果,還可以向用戶展示有關(guān)電影《不能說(shuō)的秘密》的搜索結(jié)果,比如,展示相關(guān)推薦為:“電影《不能說(shuō)的秘密》,咪咕視頻”,當(dāng)用戶使用的終端設(shè)備上同時(shí)安裝有咪咕視頻時(shí),用戶點(diǎn)擊上述相關(guān)推薦信息,則可以直接喚起移動(dòng)終端如手機(jī)上的咪咕視頻客戶端,并將當(dāng)前展示界面跳轉(zhuǎn)到咪咕視頻進(jìn)行視頻播放、或者展示有關(guān)電影《不能說(shuō)的秘密》的搜索結(jié)果。
為實(shí)現(xiàn)上述跨業(yè)務(wù)的電子資源推薦方法,本發(fā)明實(shí)施例還提供了一種裝置,所述裝置的組成結(jié)構(gòu)示意圖如圖5所示,包括:構(gòu)建模塊51、整合模塊52和生成模塊53;其中,
所述構(gòu)建模塊51,用于建立資源名稱、資源對(duì)象及資源標(biāo)簽各自與電子資源的關(guān)聯(lián)關(guān)系表;
所述整合模塊52,用于將各個(gè)業(yè)務(wù)對(duì)應(yīng)的電子資源庫(kù)中與資源名稱、或資源對(duì)象、或資源標(biāo)簽相關(guān)的電子資源,分別放入資源名稱、資源對(duì)象及資源標(biāo)簽各自對(duì)應(yīng)的關(guān)聯(lián)關(guān)系表中;
所述生成模塊53,用于將資源名稱、資源對(duì)象及資源標(biāo)簽各自對(duì)應(yīng)的關(guān)聯(lián)關(guān)系表進(jìn)行合并,生成電子資源推薦列表;所述電子資源推薦列表用于向用戶推薦電子資源。
這里,所述生成模塊53,還用于優(yōu)化電子資源推薦列表,刪除電子資源推薦列表中重復(fù)的電子資源。
其中,所述構(gòu)建模塊,還用于在建立所述資源名稱、資源對(duì)象及資源標(biāo)簽各自對(duì)應(yīng)的關(guān)聯(lián)關(guān)系表之前,根據(jù)用戶瀏覽信息主動(dòng)獲取資源名稱、資源對(duì)象及資源標(biāo)簽;
所述裝置還包括推薦模塊,用于在生成電子資源推薦列表后主動(dòng)向用戶推薦電子資源。
進(jìn)一步地,所述裝置還包括統(tǒng)計(jì)模塊,用于采用計(jì)算綜合相似度的方式對(duì)電子資源推薦列表中電子資源進(jìn)行排序,具體的:計(jì)算電子資源推薦列表中電子資源的綜合相似度,并將電子資源推薦列表中的電子資源按照所述綜合相似度進(jìn)行降序排列;所述綜合相似度通過(guò)資源名稱相似度、資源對(duì)象相似度及資源標(biāo)簽相似度加權(quán)求和得到。
其中,資源名稱相似度、資源對(duì)象相似度及資源標(biāo)簽相似度可分別通過(guò)已有的相似度算法計(jì)算得到。
進(jìn)一步地,所述生成模塊53,還用于將按照所述綜合相似度進(jìn)行降序排列的電子資源推薦列表中,存在特殊關(guān)系的電子資源添加到電子資源特殊關(guān)系表,并將電子資源特殊關(guān)系表中的電子資源按已有順序排列在電子資源推薦列表的前部。這里,所述特殊關(guān)系可以是通過(guò)爬蟲收集的電子資源數(shù)據(jù)中發(fā)現(xiàn)的電子資源之間的關(guān)系,比如:電子資源的作者之間存在師生、親屬等關(guān)系。
在實(shí)際應(yīng)用中,所述構(gòu)建模塊51、整合模塊52、生成模塊53、統(tǒng)計(jì)模塊和推薦模塊均可由位于移動(dòng)終端中的中央處理器(CPU,Central Processing Unit)、微處理器(MPU,Micro Processor Unit)、數(shù)字信號(hào)處理器(DSP,Digital Signal Processor)、或現(xiàn)場(chǎng)可編程門陣列(FPGA,F(xiàn)ield Programmable Gate Array)等實(shí)現(xiàn)。
以上所述,僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。