數(shù)據(jù)推送的方法及裝置制造方法
【專(zhuān)利摘要】本申請(qǐng)公開(kāi)了一種數(shù)據(jù)推送的方法及裝置,其中,該方法包括:提取用戶的大于預(yù)設(shè)搜索頻率的搜索信息;提取系統(tǒng)中大于預(yù)設(shè)訪問(wèn)頻率的所有訪問(wèn)信息,并獲取訪問(wèn)信息所對(duì)應(yīng)的關(guān)鍵詞類(lèi)目關(guān)聯(lián)度信息;根據(jù)搜索信息和關(guān)鍵詞類(lèi)目關(guān)聯(lián)度信息進(jìn)行權(quán)重計(jì)算,以獲取對(duì)應(yīng)每個(gè)用戶的關(guān)鍵詞權(quán)重信息,其中,關(guān)鍵詞權(quán)重信息包括推薦關(guān)鍵詞和權(quán)重參數(shù);根據(jù)對(duì)應(yīng)兩個(gè)用戶的推薦關(guān)鍵詞和權(quán)重參數(shù)進(jìn)行相似度計(jì)算,得到兩個(gè)用戶的相似度值;根據(jù)相似度值獲取與用戶對(duì)應(yīng)的相似度信息,并根據(jù)相似度信息向用戶推薦關(guān)鍵詞。通過(guò)本申請(qǐng),實(shí)現(xiàn)了系統(tǒng)快速處理信息發(fā)布用戶的關(guān)鍵詞擴(kuò)充,并可以根據(jù)用戶的特點(diǎn)向用戶準(zhǔn)確推薦關(guān)鍵詞,從而提高了系統(tǒng)的關(guān)鍵詞信息處理速度。
【專(zhuān)利說(shuō)明】數(shù)據(jù)推送的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及互聯(lián)網(wǎng)領(lǐng)域,具體而言,涉及一種數(shù)據(jù)推送的方法及裝置。
【背景技術(shù)】
[0002]目前,電子商務(wù)網(wǎng)站主要包括信息發(fā)布用戶和信息搜索用戶兩大類(lèi)客戶,其中信息發(fā)布用戶是在電子商務(wù)網(wǎng)站上展示并銷(xiāo)售產(chǎn)品的客戶群體,信息搜索用戶是在電子商務(wù)網(wǎng)站上瀏覽并有購(gòu)買(mǎi)意向的客戶群體,一般電子商務(wù)網(wǎng)站上擁有大量的信息發(fā)布用戶和商品信息,為了幫助每一位信息發(fā)布用戶的成長(zhǎng),網(wǎng)站需要根據(jù)其近鄰用戶的運(yùn)營(yíng)信息幫助其更好的運(yùn)營(yíng)網(wǎng)站,其中,近鄰用戶為在電子商務(wù)網(wǎng)站上發(fā)布相同或者類(lèi)似信息的兩個(gè)信息發(fā)布用戶,具體地,近鄰用戶也可以為在電子商務(wù)網(wǎng)站上銷(xiāo)售相同或者類(lèi)似產(chǎn)品的兩個(gè)信息發(fā)布用戶。
[0003]為了幫助平臺(tái)信息發(fā)布用戶更好地發(fā)展其業(yè)務(wù),電子商務(wù)網(wǎng)站應(yīng)該為每一位信息發(fā)布用戶挖掘與其關(guān)聯(lián)的關(guān)鍵詞,我們稱(chēng)該過(guò)程為關(guān)鍵詞擴(kuò)充。電子商務(wù)平臺(tái)尋找到每個(gè)信息發(fā)布用戶的近鄰用戶之后,根據(jù)近鄰用戶發(fā)布的所有關(guān)鍵詞信息,將其中有價(jià)值的關(guān)鍵詞信息推薦給當(dāng)前的信息發(fā)布用戶以幫助其實(shí)現(xiàn)關(guān)鍵詞擴(kuò)充。
[0004]現(xiàn)有的近鄰用戶推薦方法一般是基于每一個(gè)信息發(fā)布用戶的所有產(chǎn)品信息,提取所有產(chǎn)品所包含的關(guān)鍵詞的出現(xiàn)頻率,然后根據(jù)該頻率判斷每一個(gè)關(guān)鍵詞的權(quán)重,獲得每一個(gè)信息發(fā)布用戶的關(guān)鍵詞權(quán)重表。在近鄰搜索時(shí),通過(guò)計(jì)算兩個(gè)信息發(fā)布用戶關(guān)鍵詞權(quán)重表的權(quán)重分布的相似程度計(jì)算相似度,為每一個(gè)信息發(fā)布用戶推薦一定數(shù)量相似度得分最高的其他信息發(fā)布用戶。然而,這種方法存在以下的缺點(diǎn):
[0005](I)現(xiàn)有技術(shù)中為某一信息發(fā)布用戶推薦近鄰用戶時(shí),需要根據(jù)近鄰用戶所發(fā)布的所有商品信息來(lái)計(jì)算該二用戶的相似度,由于電子商務(wù)網(wǎng)站信息發(fā)布用戶所發(fā)布的商品信息數(shù)量極多,將會(huì)導(dǎo)致數(shù)據(jù)處理量龐大,進(jìn)一步導(dǎo)致數(shù)據(jù)處理速度緩慢。另外,電子商務(wù)網(wǎng)站上大多數(shù)信息發(fā)布用戶雖然擁有大量的產(chǎn)品品種、數(shù)量,但實(shí)際得到曝光和點(diǎn)擊的產(chǎn)品品種、數(shù)量卻非常有限,考慮一個(gè)信息發(fā)布用戶的所有產(chǎn)品信息不僅使得產(chǎn)品特點(diǎn)不夠突出還會(huì)使得后續(xù)進(jìn)行信息發(fā)布用戶的相似度計(jì)算時(shí)的得分偏低,使得相似度的得分不能準(zhǔn)確反映相鄰信息發(fā)布用戶的關(guān)聯(lián)程度。
[0006](2)由于不同關(guān)鍵詞與產(chǎn)品類(lèi)目的關(guān)聯(lián)程度可能有很大區(qū)別,完全按照關(guān)鍵詞出現(xiàn)的頻率計(jì)算關(guān)鍵詞權(quán)重不能準(zhǔn)確的衡量關(guān)鍵詞對(duì)信息發(fā)布用戶的重要程度。
[0007]針對(duì)現(xiàn)有技術(shù)中在進(jìn)行關(guān)鍵詞擴(kuò)充時(shí),系統(tǒng)向信息發(fā)布用戶推薦關(guān)鍵詞的處理速度慢并且推薦關(guān)鍵詞與信息發(fā)布用戶的屬性不符的問(wèn)題,目前尚未提出有效的解決方案。
【發(fā)明內(nèi)容】
[0008]針對(duì)相關(guān)技術(shù)在進(jìn)行關(guān)鍵詞擴(kuò)充時(shí),系統(tǒng)向信息發(fā)布用戶推薦關(guān)鍵詞的處理速度慢并且推薦關(guān)鍵詞與信息發(fā)布用戶的屬性不符的問(wèn)題,目前尚未提出有效的解決方案,為此,本申請(qǐng)的主要目的在于提供一種數(shù)據(jù)推送的方法及裝置,以解決上述問(wèn)題。[0009]為了實(shí)現(xiàn)上述目的,根據(jù)本申請(qǐng)的一個(gè)方面,提供了一種數(shù)據(jù)推送的方法,該方法包括:提取用戶的大于預(yù)設(shè)搜索頻率的搜索信息;提取系統(tǒng)中大于預(yù)設(shè)訪問(wèn)頻率的所有訪問(wèn)信息,并獲取訪問(wèn)信息所對(duì)應(yīng)的關(guān)鍵詞類(lèi)目關(guān)聯(lián)度信息;根據(jù)搜索信息和關(guān)鍵詞類(lèi)目關(guān)聯(lián)度信息進(jìn)行權(quán)重計(jì)算,以獲取對(duì)應(yīng)每個(gè)用戶的關(guān)鍵詞權(quán)重信息,其中,關(guān)鍵詞權(quán)重信息包括推薦關(guān)鍵詞和權(quán)重參數(shù);根據(jù)對(duì)應(yīng)兩個(gè)用戶的推薦關(guān)鍵詞和權(quán)重參數(shù)進(jìn)行相似度計(jì)算,得到兩個(gè)用戶的相似度值;根據(jù)相似度值獲取與用戶對(duì)應(yīng)的相似度信息,并根據(jù)相似度信息向用戶推薦關(guān)鍵詞。
[0010]進(jìn)一步地,提取系統(tǒng)中大于預(yù)設(shè)訪問(wèn)頻率的所有訪問(wèn)信息,并獲取訪問(wèn)信息所對(duì)應(yīng)的關(guān)鍵詞類(lèi)目關(guān)聯(lián)度信息的步驟包括:獲取訪問(wèn)信息所對(duì)應(yīng)的訪問(wèn)信息ID、訪問(wèn)關(guān)鍵詞以及訪問(wèn)次數(shù);將訪問(wèn)信息ID進(jìn)行ID更新和對(duì)訪問(wèn)次數(shù)進(jìn)行累加計(jì)算,以獲取對(duì)應(yīng)的訪問(wèn)信息類(lèi)目ID以及訪問(wèn)總次數(shù);根據(jù)訪問(wèn)關(guān)鍵詞、訪問(wèn)信息類(lèi)目ID以及訪問(wèn)總次數(shù)進(jìn)行關(guān)聯(lián)度計(jì)算,以獲取關(guān)聯(lián)度值;將關(guān)聯(lián)度值以及與關(guān)聯(lián)度值相對(duì)應(yīng)的訪問(wèn)關(guān)鍵詞和訪問(wèn)信息類(lèi)目ID進(jìn)行保存,以獲取關(guān)鍵詞類(lèi)目關(guān)聯(lián)度信息。
[0011]進(jìn)一步地,根據(jù)訪問(wèn)關(guān)鍵詞、訪問(wèn)信息類(lèi)目ID以及訪問(wèn)總次數(shù)進(jìn)行關(guān)聯(lián)度計(jì)算,以獲取關(guān)聯(lián)度值的步驟包括:根據(jù)訪問(wèn)關(guān)鍵詞、訪問(wèn)信息類(lèi)目ID以及訪問(wèn)總次數(shù)通過(guò)第一公式進(jìn)行關(guān)聯(lián)度計(jì)算,獲取關(guān)聯(lián)度值relation (keyword, category_id),第一公式為:
【權(quán)利要求】
1.一種數(shù)據(jù)推送的方法,其特征在于,包括: 提取用戶的大于預(yù)設(shè)搜索頻率的搜索信息; 提取系統(tǒng)中大于預(yù)設(shè)訪問(wèn)頻率的所有訪問(wèn)信息,并獲取所述訪問(wèn)信息所對(duì)應(yīng)的關(guān)鍵詞類(lèi)目關(guān)聯(lián)度信息; 根據(jù)所述搜索信息和所述關(guān)鍵詞類(lèi)目關(guān)聯(lián)度信息進(jìn)行權(quán)重計(jì)算,以獲取對(duì)應(yīng)每個(gè)所述用戶的關(guān)鍵詞權(quán)重信息,其中,所述關(guān)鍵詞權(quán)重信息包括推薦關(guān)鍵詞和權(quán)重參數(shù); 根據(jù)對(duì)應(yīng)兩個(gè)所述用戶的所述推薦關(guān)鍵詞和所述權(quán)重參數(shù)進(jìn)行相似度計(jì)算,得到兩個(gè)所述用戶的相似度值; 根據(jù)所述相似度值獲取與所述用戶對(duì)應(yīng)的相似度信息,并根據(jù)所述相似度信息向所述用戶推薦關(guān)鍵詞。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,提取系統(tǒng)中大于預(yù)設(shè)訪問(wèn)頻率的所有訪問(wèn)信息,并獲取所述訪問(wèn)信息所對(duì)應(yīng)的關(guān)鍵詞類(lèi)目關(guān)聯(lián)度信息的步驟包括: 獲取所述訪問(wèn)信息所對(duì)應(yīng)的訪問(wèn)信息ID、訪問(wèn)關(guān)鍵詞以及訪問(wèn)次數(shù); 將所述訪問(wèn)信息ID進(jìn)行ID更新和對(duì)所述訪問(wèn)次數(shù)進(jìn)行累加計(jì)算,以獲取對(duì)應(yīng)的訪問(wèn)信息類(lèi)目ID以及訪問(wèn)總次數(shù); 根據(jù)所述訪問(wèn)關(guān)鍵詞、所述訪問(wèn)信息類(lèi)目ID以及所述訪問(wèn)總次數(shù)進(jìn)行關(guān)聯(lián)度計(jì)算,以獲取關(guān)聯(lián)度值; 將所述關(guān)聯(lián)度值以及與所述 關(guān)聯(lián)度值相對(duì)應(yīng)的所述訪問(wèn)關(guān)鍵詞和所述訪問(wèn)信息類(lèi)目ID進(jìn)行保存,以獲取所述關(guān)鍵詞類(lèi)目關(guān)聯(lián)度信息。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述訪問(wèn)關(guān)鍵詞、所述訪問(wèn)信息類(lèi)目ID以及所述訪問(wèn)總次數(shù)進(jìn)行關(guān)聯(lián)度計(jì)算,以獲取關(guān)聯(lián)度值的步驟包括: 根據(jù)所述訪問(wèn)關(guān)鍵詞、所述訪問(wèn)信息類(lèi)目ID以及所述訪問(wèn)總次數(shù)通過(guò)第一公式進(jìn)行關(guān)聯(lián)度計(jì)算,獲取所述關(guān)聯(lián)度值relation (keyword, category_id),所述第一公式為:
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,將所述訪問(wèn)信息ID進(jìn)行ID更新和對(duì)所述訪問(wèn)次數(shù)進(jìn)行累加計(jì)算,以獲取對(duì)應(yīng)的訪問(wèn)信息類(lèi)目ID以及訪問(wèn)總次數(shù)的步驟包括: 將所述訪問(wèn)信息中的所述訪問(wèn)信息ID轉(zhuǎn)換為訪問(wèn)信息類(lèi)目ID,以獲取更新后的第一訪問(wèn)信息; 對(duì)所述第一訪問(wèn)信息中對(duì)應(yīng)相同的所述訪問(wèn)信息類(lèi)目ID的所述訪問(wèn)次數(shù)進(jìn)行累加計(jì)算,以獲取所述訪問(wèn)總次數(shù)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,獲取所述訪問(wèn)信息所對(duì)應(yīng)的訪問(wèn)信息ID、訪問(wèn)關(guān)鍵詞以及訪問(wèn)次數(shù)的步驟包括: 提取所述訪問(wèn)信息中的所述訪問(wèn)信息ID和初始訪問(wèn)關(guān)鍵詞; 對(duì)所述初始訪問(wèn)關(guān)鍵詞進(jìn)行歸一化處 理,以獲取標(biāo)準(zhǔn)形式的所述訪問(wèn)關(guān)鍵詞,并得到更新后的第三訪問(wèn)信息;提取與所述第三訪問(wèn)信息中的所述訪問(wèn)關(guān)鍵詞相對(duì)應(yīng)的點(diǎn)擊次數(shù); 對(duì)具有相同的訪問(wèn)關(guān)鍵詞的所述第三訪問(wèn)信息的點(diǎn)擊次數(shù)進(jìn)行累加計(jì)算,以獲取所述訪問(wèn)次數(shù)。
6.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述搜索信息和所述關(guān)鍵詞類(lèi)目關(guān)聯(lián)度信息進(jìn)行權(quán)重計(jì)算,以獲取對(duì)應(yīng)每個(gè)所述用戶的關(guān)鍵詞權(quán)重信息的步驟包括: 從每個(gè)所述用戶的所述搜索信息中分別提取所述推薦關(guān)鍵詞,生成對(duì)應(yīng)每個(gè)所述用戶的當(dāng)前關(guān)鍵詞權(quán)重信息,其中,所述當(dāng)前關(guān)鍵詞權(quán)重信息包括:用戶ID、所述推薦關(guān)鍵詞以及當(dāng)前關(guān)鍵詞類(lèi)目關(guān)聯(lián)度,所述當(dāng)前關(guān)鍵詞類(lèi)目關(guān)聯(lián)度等于所述關(guān)聯(lián)度值,所述推薦關(guān)鍵詞為所述搜索信息中的搜索信息標(biāo)題中與所述訪問(wèn)關(guān)鍵詞相同的關(guān)鍵詞; 提取所述當(dāng)前關(guān)鍵詞權(quán)重信息中具有相同的所述用戶ID和推薦關(guān)鍵詞的關(guān)鍵詞權(quán)重信息,并將所述具有相同的所述用戶ID和所述推薦關(guān)鍵詞的關(guān)鍵詞權(quán)重信息保存在一個(gè)或多個(gè)權(quán)重信息表中,對(duì)每個(gè)所述權(quán)重信息表中的所述當(dāng)前關(guān)鍵詞類(lèi)目關(guān)聯(lián)度分別進(jìn)行累加計(jì)算,得到權(quán)重參數(shù),以獲取所述關(guān)鍵詞權(quán)重信息,其中,所述關(guān)鍵詞權(quán)重信息包括所述用戶ID、所述推薦關(guān)鍵詞以及所述權(quán)重參數(shù)。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)對(duì)應(yīng)兩個(gè)所述用戶的所述推薦關(guān)鍵詞和所述權(quán)重參數(shù)進(jìn)行相似度計(jì)算,得到兩個(gè)所述用戶的相似度值的步驟包括: 根據(jù)第二公式進(jìn)行余弦相似度的計(jì)算,得到兩個(gè)所述用戶的相似度值similarity,其中,所述第二公式為:
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,提取用戶的大于預(yù)設(shè)搜索頻率的搜索信息的步驟包括: 提取大于所述預(yù)設(shè)搜索頻率的當(dāng)前搜索信息,其中,所述當(dāng)前搜索信息包括:用戶ID、搜索信息ID、搜索信息類(lèi)目ID以及當(dāng)前搜索信息標(biāo)題; 對(duì)所述當(dāng)前搜索信息中的所述當(dāng)前搜索信息標(biāo)題進(jìn)行歸一化處理,以獲取標(biāo)準(zhǔn)形式的所述搜索信息標(biāo)題,得到更新后的所述搜索信息。
9.一種數(shù)據(jù)推送的裝置,其特征在于,包括: 第一提取模塊,用于提取用戶的大于預(yù)設(shè)搜索頻率的搜索信息; 第四處理模塊,用于提取系統(tǒng)中大于預(yù)設(shè)訪問(wèn)頻率的所有訪問(wèn)信息,并獲取所述訪問(wèn)信息所對(duì)應(yīng)的關(guān)鍵詞類(lèi)目關(guān)聯(lián)度信息; 第一處理模塊,用于根據(jù)所述搜索信息和所述關(guān)鍵詞類(lèi)目關(guān)聯(lián)度信息進(jìn)行權(quán)重計(jì)算,以獲取對(duì)應(yīng)每個(gè)所述用戶的關(guān)鍵詞權(quán)重信息,其中,所述關(guān)鍵詞權(quán)重信息包括推薦關(guān)鍵詞和權(quán)重參數(shù); 第二處理模塊,用于根據(jù)對(duì)應(yīng)兩個(gè)所述用戶的所述推薦關(guān)鍵詞和所述權(quán)重參數(shù)進(jìn)行相似度計(jì)算,得到兩個(gè)所述用戶的相似度值; 第三處理模塊,用于根據(jù)所述相似度值獲取與所述用戶對(duì)應(yīng)的相似度信息,并根據(jù)所述相似度信息向所述用戶推薦關(guān)鍵詞。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述第四處理模塊包括: 第一獲取模塊,用于獲取所述訪問(wèn)信息所對(duì)應(yīng)的訪問(wèn)信息ID、訪問(wèn)關(guān)鍵詞以及訪問(wèn)次數(shù); 第五處理模塊,用于將所述訪問(wèn)信息ID進(jìn)行ID更新和對(duì)所述訪問(wèn)次數(shù)進(jìn)行累加計(jì)算,以獲取對(duì)應(yīng)的訪問(wèn)信息類(lèi)目ID以及訪問(wèn)總次數(shù); 第一計(jì)算模塊,用于根據(jù)所述訪問(wèn)關(guān)鍵詞、所述訪問(wèn)信息類(lèi)目ID以及所述訪問(wèn)總次數(shù)進(jìn)行關(guān)聯(lián)度計(jì)算,以獲取關(guān)聯(lián)度值; 保存模塊,用于將所述關(guān)聯(lián)度值以及與所述關(guān)聯(lián)度值相對(duì)應(yīng)的所述訪問(wèn)關(guān)鍵詞和所述訪問(wèn)信息類(lèi)目ID進(jìn)行保存,以獲取所述關(guān)鍵詞類(lèi)目關(guān)聯(lián)度信息。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述第一計(jì)算模塊包括: 第一子計(jì)算模塊,用于根據(jù)所述訪問(wèn)關(guān)鍵詞、所述訪問(wèn)信息類(lèi)目ID以及所述訪問(wèn)總次數(shù)通過(guò)第一公式進(jìn)行關(guān)聯(lián)度計(jì)算,獲取所述關(guān)聯(lián)度值relation (keyword, category_id),所述第一公式為:
12.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述第五處理模塊包括: 第一子處理模塊,用于將所述訪問(wèn)信息中的所述訪問(wèn)信息ID轉(zhuǎn)換為訪問(wèn)信息類(lèi)目ID,以獲取更新后的第一訪問(wèn)信息; 第二子計(jì)算模塊,用于對(duì)所述第一訪問(wèn)信息中對(duì)應(yīng)相同的所述訪問(wèn)信息類(lèi)目ID的所述訪問(wèn)次數(shù)進(jìn)行累加計(jì)算,以獲取所述訪問(wèn)總次數(shù)。
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述第一獲取模塊包括: 第一子提取模塊,用于提取所述訪問(wèn)信息中的所述訪問(wèn)信息ID和初始訪問(wèn)關(guān)鍵詞; 第二子處理模塊,用于對(duì)所述初始訪問(wèn)關(guān)鍵詞進(jìn)行歸一化處理,以獲取標(biāo)準(zhǔn)形式的所述訪問(wèn)關(guān)鍵詞,并得到更新后的第三訪問(wèn)信息; 第三子處理模塊,用于提取與所述第三訪問(wèn)信息中的所述訪問(wèn)關(guān)鍵詞相對(duì)應(yīng)的點(diǎn)擊次數(shù); 第四子處理模塊,用于對(duì)具有相同的訪問(wèn)關(guān)鍵詞的所述第三訪問(wèn)信息的點(diǎn)擊次數(shù)進(jìn)行累加計(jì)算,以獲取所述訪問(wèn)次數(shù)。
14.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述第一處理模塊包括: 第二子提取模塊,用于從每個(gè)所述用戶的所述搜索信息中分別提取所述推薦關(guān)鍵詞,生成對(duì)應(yīng)每個(gè)所述用戶的當(dāng)前關(guān)鍵詞權(quán)重信息,其中,所述當(dāng)前關(guān)鍵詞權(quán)重信息包括:用戶ID、所述推薦關(guān)鍵詞以及當(dāng)前關(guān)鍵詞類(lèi)目關(guān)聯(lián)度,所述當(dāng)前關(guān)鍵詞類(lèi)目關(guān)聯(lián)度等于所述關(guān)聯(lián)度值,所述推薦關(guān)鍵詞為所述搜索信息中的搜索信息標(biāo)題中與所述訪問(wèn)關(guān)鍵詞相同的關(guān)鍵詞; 第五子處理模塊,用于提取所述當(dāng)前關(guān)鍵詞權(quán)重信息中具有相同的所述用戶ID和推薦關(guān)鍵詞的關(guān)鍵詞權(quán)重信息,并將所述具有相同的所述用戶ID和所述推薦關(guān)鍵詞的關(guān)鍵詞權(quán)重信息保存在一個(gè)或多個(gè)權(quán)重信息表中,對(duì)每個(gè)所述權(quán)重信息表中的所述當(dāng)前關(guān)鍵詞類(lèi)目關(guān)聯(lián)度分別進(jìn)行累加計(jì)算,得到權(quán)重參數(shù),以獲取所述關(guān)鍵詞權(quán)重信息,其中,所述關(guān)鍵詞權(quán)重信息包括所述用戶ID、所述推薦關(guān)鍵詞以及所述權(quán)重參數(shù)。
15.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述第二處理模塊包括: 第四子計(jì)算模塊,用于根據(jù)第二公式進(jìn)行余弦相似度的計(jì)算,得到兩個(gè)所述用戶的相似度值similarity,其中,所述第二公式為:
16.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述第一提取模塊包括: 第三子提取模塊,用于提取大于所述預(yù)設(shè)搜索頻率的當(dāng)前搜索信息,其中,所述當(dāng)前搜索信息包括:用戶ID、搜索信息ID、搜索信息類(lèi)目ID以及當(dāng)前搜索信息標(biāo)題; 第六子處理模塊,用于對(duì)所述當(dāng)前搜索信息中的所述當(dāng)前搜索信息標(biāo)題進(jìn)行歸一化處理,以獲取標(biāo)準(zhǔn)形式的所述搜索信息標(biāo)題,得到更新后的所述搜索信息。
【文檔編號(hào)】G06F17/30GK103885971SQ201210560700
【公開(kāi)日】2014年6月25日 申請(qǐng)日期:2012年12月20日 優(yōu)先權(quán)日:2012年12月20日
【發(fā)明者】陳智強(qiáng), 馮貝, 曾鵬, 顧海杰 申請(qǐng)人:阿里巴巴集團(tuán)控股有限公司