国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種個(gè)性化內(nèi)容推薦方法、平臺(tái)以及系統(tǒng)的制作方法

      文檔序號(hào):6564982閱讀:217來源:國(guó)知局
      專利名稱:一種個(gè)性化內(nèi)容推薦方法、平臺(tái)以及系統(tǒng)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及無線互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體來說,涉及一種個(gè)性化內(nèi)容推薦的方法和系統(tǒng)。
      背景技術(shù)
      隨著移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來,用戶的需求也發(fā)展到了一個(gè)新的階段,體現(xiàn)為對(duì)貼心服務(wù)和個(gè)性化服務(wù)的追求。同時(shí),隨著各種移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù)的極大豐富,“用戶尋找信息”的被動(dòng)服務(wù)模式將逐步轉(zhuǎn)變?yōu)椤靶畔ふ矣脩簟钡闹鲃?dòng)服務(wù)模式。實(shí)現(xiàn)這種信息尋找用戶的核心技術(shù)就是個(gè)性化推薦技術(shù)(Personalized Recommendation Techniques)。推薦技術(shù)就是通過記錄和分析用戶瀏覽行為或者購買行為,發(fā)現(xiàn)用戶的興趣偏好,然后在海量數(shù)據(jù)庫中找到與之興趣相近的人群、內(nèi)容或者商品,篩選和過濾這些信息,然后向該用戶推薦他可能會(huì)感興趣的內(nèi)容或者商品。例如您瀏覽過一本編程的圖書,推薦技術(shù)就會(huì)關(guān)注很多其它同樣找編程圖書的用戶,記錄他們的搜索,瀏覽,點(diǎn)擊和購買行為,來確定哪些人與當(dāng)前用戶具有同樣的興趣;然后,為當(dāng)前用戶做出個(gè)性化的商品或內(nèi)容推薦。個(gè)性化推薦技術(shù)在互聯(lián)網(wǎng)領(lǐng)域已經(jīng)產(chǎn)生了巨大的商業(yè)價(jià)值,Amazon有35%以上的圖書收入來自系統(tǒng)提供的推薦;Netflix有60%以上的電影租賃收入來自系統(tǒng)的推薦,Google利用個(gè)性化推薦技術(shù)為每個(gè)用戶組織其新聞資訊,提升了 38%的點(diǎn)擊通過率;Apple的Genius的個(gè)性化音樂服務(wù)深受廣大用戶的喜愛。在個(gè)性化推薦領(lǐng)域,網(wǎng)頁這類文本內(nèi)容的推薦又是一個(gè)非常重要的領(lǐng)域,尤其是在移動(dòng)互聯(lián)網(wǎng)領(lǐng)域,瀏覽網(wǎng)頁(包括新聞資訊、博客等形式,客戶端、瀏覽器等方式)仍然是當(dāng)前移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)流量中的最主要的組成部分。手機(jī)能瀏覽到的網(wǎng)頁中,WAP網(wǎng)頁數(shù)量超過20億,部分終端還能直接訪問更豐富的Web網(wǎng)頁。同時(shí),移動(dòng)互聯(lián)網(wǎng)網(wǎng)網(wǎng)民超過3億,其中絕大部分有過資訊內(nèi)容的瀏覽行為。如何從海量的信息中計(jì)算得到海量用戶可能感興趣的內(nèi)容并推薦給他,是一個(gè)極具挑戰(zhàn)性的技術(shù)領(lǐng)域?,F(xiàn)有技術(shù)主要有兩種技術(shù)方案比較流行,具體來說,包括(I)基于協(xié)同過濾的個(gè)性化推薦方法協(xié)同過濾算法是以被推薦對(duì)象Item為中心的個(gè)性化推薦算法,Item可以是網(wǎng)頁、圖書、音樂、視頻、實(shí)物等任意對(duì)象。根據(jù)機(jī)器學(xué)習(xí)理論,它屬于基于實(shí)例的學(xué)習(xí)范疇。與傳統(tǒng)的以用戶為中心的實(shí)例學(xué)習(xí)算法相比,它的主要差異在于為每個(gè)Item、而不是用戶構(gòu)建近鄰集合,并產(chǎn)生最終的評(píng)分預(yù)測(cè)結(jié)果。協(xié)同過濾算法有很多種,但原理上基本上一致。因此下面以其中最為典型的SlopeOne算法來進(jìn)行說明SlopeOne算法提出的主要目的有兩點(diǎn)1)解決基于實(shí)例的算法可伸縮性問題。在典型的產(chǎn)品評(píng)論、電子商務(wù)類網(wǎng)站中,以Item為中心構(gòu)建近鄰集合相比于以用戶為中心的算法能夠顯著減少計(jì)算量和存儲(chǔ)開銷;2)提升預(yù)測(cè)準(zhǔn)確性。一些文獻(xiàn)的經(jīng)驗(yàn)評(píng)估表明,相比于以用戶為中心的算法,此類算法預(yù)測(cè)準(zhǔn)確性較高。需要指出的是,還有一類協(xié)同過濾算法,它們通過建立依賴關(guān)系來構(gòu)建預(yù)測(cè)器,被稱為“基于模型的算法”。在基于模型的算法中,一般不顯著構(gòu)建近鄰集合,而是通過訓(xùn)練貝葉斯網(wǎng)絡(luò)、模糊聚類等方式來產(chǎn)生預(yù)測(cè)結(jié)果。它們的離線計(jì)算復(fù)雜度通常遠(yuǎn)高于基于實(shí)例的算法,但存儲(chǔ)開銷和在線計(jì)算復(fù)雜度又遠(yuǎn)低于后者。在實(shí)踐中,這兩類算法都有大規(guī)模應(yīng)用的案例。其主要流程如圖I所示。(2)基于內(nèi)容的個(gè)性化推薦算法基于內(nèi)容的推薦(content-based recommendation)不需要依據(jù)用戶對(duì)項(xiàng)目的評(píng)價(jià)意見,而依據(jù)用戶已經(jīng)選擇的產(chǎn)品內(nèi)容信息計(jì)算用戶之間的相似性,送兩送行相應(yīng)的推薦。隨著機(jī)器學(xué)習(xí)等技術(shù)的完善,當(dāng)前的基于內(nèi)容的推薦系統(tǒng)可以分別對(duì)用戶和內(nèi)容建立配置文件,通過分析已經(jīng)購買(或?yàn)g覽)過的內(nèi)容,建立或更新用戶的配置文件。系統(tǒng)可以比較出用戶與內(nèi)容的相似度,并直接向用戶推薦與其配置文件最相似的產(chǎn)品。基于內(nèi)容的推薦算法的根本在于信息獲取和信息過濾。因?yàn)樵谖谋拘畔@取與過濾方法的研究較為成熟,現(xiàn)有很多基于內(nèi)容的推薦系統(tǒng)都是通過分析產(chǎn)品的文本信息進(jìn)行推薦。在信息獲取中,表征文本最常用的方法就TF-IDF方法,該方法的定義如下設(shè)有M個(gè)文本文件,關(guān)鍵詞h在Hii個(gè)文件中出現(xiàn),設(shè)fu為關(guān)鍵詞h在文件Cli中出現(xiàn)的次數(shù),那么kj在文件4中的詞頻TFu定義為
      權(quán)利要求
      1.一種個(gè)性化內(nèi)容推薦方法,包括 根據(jù)用戶的訪問數(shù)據(jù)生成用戶第一興趣列表; 對(duì)候選文件進(jìn)行處理形成候選文件列表;其特征在于,還包括 根據(jù)含有所述用戶第一興趣列表中的關(guān)鍵詞的其他用戶的興趣列表,對(duì)所述用戶第一興趣列表進(jìn)行興趣擴(kuò)散形成用戶第二興趣列表; 比較用戶第二興趣列表和候選文件列表之間的相似度,并從大到小排序?qū)OP-K個(gè)候選文件推薦給用戶。
      2.根據(jù)權(quán)利要求I所述的個(gè)性化內(nèi)容推薦方法,其特征在于,所述根據(jù)含有所述用戶第一興趣列表中的關(guān)鍵詞的其他用戶的興趣列表,對(duì)所述用戶第一興趣列表進(jìn)行興趣擴(kuò)散形成用戶第二興趣列表,具體包括 分別計(jì)算用戶第一興趣列表中關(guān)鍵詞向其他所有用戶推薦關(guān)鍵詞的推薦能力; 根據(jù)所述關(guān)鍵詞的推薦能力形成興趣擴(kuò)散矩陣; 根據(jù)所述興趣擴(kuò)散矩陣對(duì)用戶第一興趣列表進(jìn)行向量計(jì)算,形成用戶第二興趣列表。
      3.根據(jù)權(quán)利要求I或2所述的個(gè)性化內(nèi)容推薦方法,其特征在于,所述根據(jù)用戶的訪問數(shù)據(jù)生成用戶第一興趣列表,具體包括 建立用戶集合Ui = K,U2,.. .,un},其中,用戶Ui的興趣列表采用向量空間模型表示 Pi = ((T1, Wil), (T2, wi2), . . . , (Tk, Wik)), 其中,Wij表示用戶Ui第一興趣列表中關(guān)鍵詞L對(duì)于用戶Ui的權(quán)重,k表示用戶Ui第一興趣列表之中所有關(guān)鍵詞的數(shù)量。
      4.根據(jù)權(quán)利要求I或2所述的個(gè)性化內(nèi)容推薦方法,其特征在于,所述對(duì)候選文件進(jìn)行處理形成候選文件列表,具體包括 建立候選文件集合D = {屯,d2,. . .,dn},其中,候選文件4的文件列表采用向量空間模型表示為 dj = KT1, Wlj), (T2, w2J), . . . , (Tk, wkJ)}, 其中,Wij表示文件七之中關(guān)鍵詞Ti在文件4之中的權(quán)值,k表示文件4之中關(guān)鍵詞的數(shù)量。
      5.根據(jù)權(quán)利要求2所述的個(gè)性化內(nèi)容推薦方法,其特征在于,所述分別計(jì)算列表中任意關(guān)鍵詞向所有用戶推薦其他關(guān)鍵詞的推薦能力,具體包括 設(shè)定有N個(gè)用戶,按照下列表達(dá)式計(jì)算任一關(guān)鍵詞i相對(duì)于關(guān)鍵詞j對(duì)所有用戶的推薦能力
      6.根據(jù)權(quán)利要求5所述的個(gè)性化內(nèi)容推薦方法,其特征在于,所述根據(jù)上述推薦能力形成興趣擴(kuò)散矩陣,根據(jù)所述興趣擴(kuò)散矩陣對(duì)用戶第一興趣列表進(jìn)行向量計(jì)算,形成用戶第二興趣列表,具體包括 根據(jù)所述推薦能力Vu形成興趣擴(kuò)散矩陣V = {ViJ.}; 按照下列表達(dá)式進(jìn)行擴(kuò)散形成所述用戶第二興趣列表
      7.根據(jù)權(quán)利要求6所述的個(gè)性化內(nèi)容推薦方法,其特征在于,所述比較用戶第二興趣列表和候選文件列表之間的相似度,并從大到小排序?qū)OP-K個(gè)候選文件推薦給用戶,具體包括 基于夾角余弦法計(jì)算所述第二興趣列表Pi'和候選文件列表4的相似性,具體包括 接著,根據(jù)值從大到小排序?qū)op-κ個(gè)文件推薦給用戶。
      8.—種個(gè)性化內(nèi)容推薦平臺(tái),其特征在于,包括 用戶興趣計(jì)算模塊,用于根據(jù)用戶的訪問數(shù)據(jù)生成用戶第一興趣列表; 候選文件預(yù)處理模塊,用于對(duì)候選文件進(jìn)行處理形成候選文件列表; 用戶興趣擴(kuò)散更新模塊,根據(jù)含有所述用戶第一興趣列表中的關(guān)鍵詞的其他用戶的興趣列表,對(duì)所述用戶第一興趣列表進(jìn)行興趣擴(kuò)散以形成用戶第二興趣列表; 推薦生成計(jì)算模塊,用于比較用戶第二興趣列表和候選文件列表之間的相似度,并從大到小排序?qū)OP-K個(gè)候選文件輸出給用戶。
      9.根據(jù)權(quán)利要求8所述的個(gè)性化內(nèi)容推薦平臺(tái),其特征在于,還包括有 用戶行為采集模塊,用于按周期從日志服務(wù)器之中同步用戶訪問數(shù)據(jù); 候選文件采集模塊,用于按周期從內(nèi)容數(shù)據(jù)庫之中同步候選文件。
      10.一種個(gè)性化內(nèi)容推薦系統(tǒng),其特征在于,包括 應(yīng)用服務(wù)器,用于接收采集并輸送用戶的訪問數(shù)據(jù)和候選文件給個(gè)性化平臺(tái);個(gè)性化平臺(tái),用于獲取來自于應(yīng)用服務(wù)器的用戶的訪問數(shù)據(jù)和候選文件以生成擴(kuò)散后的用戶興趣列表和候選文件列表,并根據(jù)擴(kuò)散后的用戶興趣列表以及候選文件列表的相似度,將TOP-K個(gè)候選文件推薦給用戶。
      11.根據(jù)權(quán)利要求10所述的個(gè)性化內(nèi)容推薦系統(tǒng),其特征在于,還設(shè)置有 日志服務(wù)器,用于接收從應(yīng)用服務(wù)器實(shí)時(shí)傳來的用戶訪問日志并按周期遠(yuǎn)程同步日志數(shù)據(jù)到個(gè)性化推薦平臺(tái)之中; 內(nèi)容數(shù)據(jù)庫,用于接收從應(yīng)用服務(wù)器實(shí)時(shí)提供的候選文件并按周期遠(yuǎn)程同步所述候選文件到個(gè)性化推薦平臺(tái)之中。
      12.根據(jù)權(quán)利要求10或11所述的個(gè)性化內(nèi)容推薦系統(tǒng),其特征在于,還設(shè)有推薦接口服務(wù)器,用于按周期遠(yuǎn)程同步個(gè)性化推薦平臺(tái)輸出的推薦結(jié)果并實(shí)時(shí)提供推薦信息給所述應(yīng)用服務(wù)器。
      全文摘要
      本發(fā)明公開了一種個(gè)性化內(nèi)容推薦方法,包括根據(jù)用戶的訪問數(shù)據(jù)以生成用戶第一興趣列表;對(duì)候選文件進(jìn)行處理形成候選文件列表;根據(jù)含有所述用戶第一興趣列表中的關(guān)鍵詞的其他用戶的興趣列表,對(duì)所述用戶第一興趣列表進(jìn)行興趣擴(kuò)散以形成用戶第二興趣列表;比較用戶第二興趣列表和候選文件列表之間的相似度,并從大到小排序?qū)OP-K個(gè)候選文件推薦給用戶。本發(fā)明采取了上述技術(shù)方案以后,不需要用戶的評(píng)分轉(zhuǎn)換評(píng)分參與計(jì)算,而是通過用戶對(duì)內(nèi)容的偏好度(關(guān)鍵詞權(quán)重)和關(guān)鍵詞在該用戶相關(guān)的群體中的流行度來計(jì)算某項(xiàng)內(nèi)容推薦給用戶的可能性。此外,本發(fā)明還公開了一種個(gè)性化內(nèi)容推薦平臺(tái)以及系統(tǒng)。
      文檔編號(hào)G06F17/30GK102982042SQ20111026379
      公開日2013年3月20日 申請(qǐng)日期2011年9月7日 優(yōu)先權(quán)日2011年9月7日
      發(fā)明者陶振武 申請(qǐng)人:中國(guó)移動(dòng)通信集團(tuán)公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1