一種基于大數(shù)據(jù)雙向推薦的深度學(xué)習(xí)方法及雙向推薦裝置的制造方法

文檔序號(hào)：10725137閱讀：180來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種基于大數(shù)據(jù)雙向推薦的深度學(xué)習(xí)方法及雙向推薦裝置的制造方法
【專利摘要】本發(fā)明涉及一種基于大數(shù)據(jù)雙向推薦的深度學(xué)習(xí)方法及雙向推薦裝置，屬于人工智能和機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域；其在大數(shù)據(jù)平臺(tái)環(huán)境下，解決了社會(huì)化網(wǎng)絡(luò)體系之中互為主體和客體的人與人之間穿越信息墻的問題。作為主客體雙向信息反饋的個(gè)性化推薦方法，其將主體與客體都作為評(píng)價(jià)對(duì)象，從兩個(gè)方向建立用戶評(píng)價(jià)矩陣和項(xiàng)目評(píng)價(jià)矩陣，利用消息反饋機(jī)制建立了主客體雙向推薦模式，并利用匹配技術(shù)對(duì)雙向的相似度矩陣進(jìn)行二次匹配融合。本發(fā)明徹底改變了單向推薦模式中主體或客體一方獲取推薦的方法，而是用機(jī)器學(xué)習(xí)方法建立了主體與客體相互關(guān)聯(lián)的推薦模式，開創(chuàng)了利用深度學(xué)習(xí)對(duì)大數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析的新領(lǐng)域。
【專利說明】
一種基于大數(shù)據(jù)雙向推薦的深度學(xué)習(xí)方法及雙向推薦裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及一種基于大數(shù)據(jù)雙向推薦的深度學(xué)習(xí)方法及雙向推薦裝置，屬于人工智能和機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 隨著大數(shù)據(jù)時(shí)代的到來，人們逐漸從信息匱乏的時(shí)代走入了信息過載的時(shí)代。結(jié) 構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)量的爆發(fā)性增長在信息的消費(fèi)者和生產(chǎn)者之間豎起了一道龐大的信息墻。人腦在面對(duì)海量的數(shù)據(jù)時(shí)，難以找到自己感興趣的信息。信息的生產(chǎn)者也很難讓自己的信息準(zhǔn)確的傳遞到有需要的人面前。為了解決信息過載的問題，在搜索引擎之后，推薦系統(tǒng)誕生并作為一種幫助用戶快速發(fā)現(xiàn)有用信息的工具?，F(xiàn)有的推薦系統(tǒng)是通過分析用戶的歷史行為和需求，進(jìn)行用戶畫像，從而向用戶主動(dòng)推薦他們所感興趣的信息。協(xié)同過濾方法是推薦系統(tǒng)中最具代表性的方法。協(xié)同過濾算法根據(jù)信息消費(fèi)者已瀏覽或關(guān)心的信息，通過大數(shù)據(jù)分析來推導(dǎo)出消費(fèi)者還可能感興趣的信息。雖然這個(gè)方法通過信息的過濾以及智能篩選解決了信息消費(fèi)者在選擇時(shí)的迷茫，但是，它仍然是一種單向的信息到人的傳遞過程。其主要是利用計(jì)算項(xiàng)目的相似度和用戶對(duì)項(xiàng)目的評(píng)價(jià)數(shù)據(jù)來向用戶推薦信息，它忽略了項(xiàng)目也可以作為評(píng)價(jià)主體，也需要從海量信息中獲得感興趣的用戶信息。例如，如果商家作為項(xiàng)目，那么除了商家向用戶推薦商品外，機(jī)器學(xué)習(xí)還應(yīng)當(dāng)具備將潛在用戶推薦給商家的能力。所以，這里需要明確的是，人工智能與機(jī)器學(xué)習(xí)的初衷并不僅僅是實(shí)現(xiàn)一種信息的有效過濾和傳遞，而是在實(shí)現(xiàn)機(jī)器智能的基礎(chǔ)上，更好的為人與人服務(wù)，為整個(gè)社會(huì) 化網(wǎng)絡(luò)服務(wù)。這也是信息傳遞的根本任務(wù)，即更高效的建立人與人之間的聯(lián)系。所以，現(xiàn)有的推薦方法只是實(shí)現(xiàn)了信息生產(chǎn)者提交的信息更有效的傳遞到信息消費(fèi)者，但是，并沒有考慮到信息消費(fèi)者也在生產(chǎn)信息，只有這些信息也有效的傳遞到所需要的人的時(shí)候，在海量信息墻兩端的人們才會(huì)建立起個(gè)性化的聯(lián)系。

【發(fā)明內(nèi)容】

[0003] 本發(fā)明的目的是為了克服已有技術(shù)的缺陷，為了解決人與人跨越信息墻并建立有機(jī)聯(lián)系的問題，提出一種基于大數(shù)據(jù)雙向推薦的深度學(xué)習(xí)方法及雙向推薦裝置;其在大數(shù) 據(jù)平臺(tái)環(huán)境下，解決了社會(huì)化網(wǎng)絡(luò)體系之中互為主體和客體的人與人之間穿越信息墻的問題;作為主客體雙向信息反饋的個(gè)性化推薦方法，其將主體與客體都作為評(píng)價(jià)對(duì)象，從兩個(gè) 方向建立用戶評(píng)價(jià)矩陣和項(xiàng)目評(píng)價(jià)矩陣，利用消息反饋機(jī)制建立了主客體雙向推薦模式，并利用匹配技術(shù)對(duì)雙向的相似度矩陣進(jìn)行二次匹配融合。
[0004] 本發(fā)明的目的是通過下述技術(shù)方案實(shí)現(xiàn)的：
[0005] -種基于大數(shù)據(jù)雙向推薦的深度學(xué)習(xí)方法，其基本實(shí)施過程如下：
[0006] 1)確定主體與客體的關(guān)系，定義協(xié)同過濾的方向和流程；
[0007] 在這個(gè)方法中，用戶與項(xiàng)目互為信息傳遞的主體和客體。其機(jī)器學(xué)習(xí)的過程，不僅僅要收集用戶對(duì)項(xiàng)目的評(píng)價(jià)數(shù)據(jù)，還需要收集項(xiàng)目對(duì)用戶的評(píng)價(jià)數(shù)據(jù)。這里，將向用戶推薦信息的過程稱為"正向過程"，將向項(xiàng)目推薦信息的過程稱為"逆向過程"。正向過程和逆向過程同時(shí)進(jìn)行，并進(jìn)行匹配運(yùn)算。
[0008] 2)提取用戶評(píng)價(jià)數(shù)據(jù)，即用戶對(duì)項(xiàng)目的興趣度評(píng)分值，構(gòu)造用戶評(píng)價(jià)矩陣；
[0009] 例如，利用深度學(xué)習(xí)的推薦方法執(zhí)行葡萄酒的購買和銷售過程，那么用戶是購買葡萄酒的人，項(xiàng)目是葡萄酒，用戶評(píng)價(jià)數(shù)據(jù)就是買家對(duì)不同類型葡萄酒的評(píng)分，評(píng)估酒的味道，價(jià)格和質(zhì)量等。用戶評(píng)價(jià)矩陣由用戶對(duì)項(xiàng)目的評(píng)分構(gòu)成。每一個(gè)行向量由某個(gè)用戶對(duì)各個(gè)項(xiàng)目的評(píng)分值組成。
[0010] 3)在用戶評(píng)價(jià)數(shù)據(jù)中提取每個(gè)項(xiàng)目被所有用戶的評(píng)價(jià)數(shù)據(jù)，構(gòu)成項(xiàng)目特征行向量，由所有項(xiàng)目的特征行向量構(gòu)成項(xiàng)目特征矩陣;利用相似度算法，計(jì)算各個(gè)項(xiàng)目之間的相似度，構(gòu)造項(xiàng)目相似度矩陣；
[0011] 4)提取項(xiàng)目評(píng)價(jià)數(shù)據(jù)，項(xiàng)目評(píng)分并不是項(xiàng)目對(duì)用戶的直接評(píng)分，而是項(xiàng)目的執(zhí)行人對(duì)用戶的評(píng)分；
[0012] 例如，利用深度學(xué)習(xí)的推薦方法執(zhí)行葡萄酒的購買和銷售過程，那么用戶是購買葡萄酒的人，項(xiàng)目是葡萄酒，項(xiàng)目評(píng)價(jià)數(shù)據(jù)就是葡萄酒商家對(duì)用戶的評(píng)分，評(píng)估用戶的口味，購買力和購買偏好等。用項(xiàng)目評(píng)價(jià)數(shù)據(jù)來構(gòu)造項(xiàng)目評(píng)價(jià)矩陣。每一個(gè)行向量由某個(gè)項(xiàng)目對(duì)各個(gè)用戶的評(píng)分值組成。
[0013] 5)在項(xiàng)目評(píng)價(jià)數(shù)據(jù)中提取每個(gè)用戶被所有項(xiàng)目的評(píng)價(jià)數(shù)據(jù)，構(gòu)成用戶特征行向量，由所有用戶的特征行向量構(gòu)成用戶特征矩陣;利用相似度算法，計(jì)算各個(gè)用戶之間的相似度，構(gòu)造用戶相似度矩陣。
[0014] 6)利用用戶評(píng)價(jià)矩陣和項(xiàng)目相似度矩陣進(jìn)行運(yùn)算，利用用戶評(píng)價(jià)值高的項(xiàng)目，在項(xiàng)目相似度矩陣?yán)镎业狡渌麧撛陧?xiàng)目，在以用戶為行，項(xiàng)目為列的矩陣中，將潛在項(xiàng)目的評(píng) 分值標(biāo)為1，其他值為零;這樣就構(gòu)造了用戶推薦矩陣；
[0015] 7)利用項(xiàng)目評(píng)價(jià)矩陣和用戶相似度矩陣進(jìn)行運(yùn)算，利用項(xiàng)目評(píng)價(jià)值高的項(xiàng)目，在用戶相似度矩陣?yán)镎业狡渌麧撛谟脩簦谝皂?xiàng)目為行，用戶為列的矩陣中，將潛在用戶的評(píng) 分值標(biāo)為1，其他值為零;這樣就構(gòu)造了項(xiàng)目推薦矩陣；
[0016] 8)將用戶推薦矩陣和項(xiàng)目推薦矩陣之一轉(zhuǎn)置后進(jìn)行矩陣與運(yùn)算，得到用戶與項(xiàng)目的匹配推薦矩陣;此矩陣中的非零值標(biāo)志著無論從正向還是逆向推薦的角度考慮，都能達(dá) 到潛在推薦效果的用戶-項(xiàng)目匹配對(duì)；
[0017] 9)對(duì)匹配推薦矩陣?yán)庙?xiàng)目評(píng)價(jià)矩陣和用戶評(píng)價(jià)矩陣一起進(jìn)行匹配驗(yàn)證運(yùn)算，將匹配推薦矩陣中推薦的用戶或項(xiàng)目中評(píng)分較低的項(xiàng)目或用戶去除即得到匹配推薦矩陣。
[0018] -種基于大數(shù)據(jù)的雙向推薦裝置，包括用戶評(píng)價(jià)與推薦模塊，項(xiàng)目評(píng)價(jià)與推薦模塊，匹配推薦模塊;用戶評(píng)價(jià)與推薦模塊和項(xiàng)目評(píng)價(jià)與推薦模塊分別與匹配推薦模塊相連；
[0019] 用戶評(píng)價(jià)與推薦模塊作為用戶評(píng)價(jià)數(shù)據(jù)的輸入端，獲得用戶針對(duì)項(xiàng)目的評(píng)價(jià)數(shù) 據(jù)，并以其構(gòu)建用戶評(píng)價(jià)矩陣，然后對(duì)其進(jìn)行特征提取及項(xiàng)目相似度運(yùn)算，接下來基于相似度運(yùn)算結(jié)果結(jié)合用戶評(píng)價(jià)矩陣進(jìn)行用戶推薦以得到用戶推薦矩陣；
[0020] 項(xiàng)目評(píng)價(jià)與推薦模塊將項(xiàng)目作為評(píng)價(jià)主體，輸入端為項(xiàng)目對(duì)用戶的評(píng)價(jià)數(shù)據(jù)，以該數(shù)據(jù)構(gòu)建項(xiàng)目評(píng)價(jià)矩陣，并對(duì)其進(jìn)行特征提取及用戶相似度運(yùn)算，然后基于相似度運(yùn)算結(jié)果結(jié)合項(xiàng)目評(píng)價(jià)矩陣進(jìn)行項(xiàng)目推薦以得到項(xiàng)目推薦矩陣；
[0021] 匹配推薦模塊用于綜合用戶推薦結(jié)果和項(xiàng)目推薦結(jié)果得到匹配推薦矩陣，然后對(duì) 該矩陣再次利用初始用戶評(píng)價(jià)數(shù)據(jù)和項(xiàng)目評(píng)價(jià)數(shù)據(jù)進(jìn)行驗(yàn)證，獲得最終的配對(duì)推薦矩陣。
[0022] 有益效果
[0023] 本發(fā)明方法，對(duì)比已有的個(gè)性化推薦技術(shù)，改單向信息推薦為雙向配對(duì)型推薦，進(jìn) 一步提升了推薦的信息可靠性，能夠更有效的解決在大數(shù)據(jù)時(shí)代，社會(huì)化網(wǎng)絡(luò)體系之中的人與人之間穿越信息墻的問題，開創(chuàng)了利用深度學(xué)習(xí)對(duì)大數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析的新領(lǐng)域。同時(shí)，進(jìn)一步轉(zhuǎn)變和明確了人工智能的思路，人工智能的最終目的，不僅僅是建立純粹獨(dú)立的機(jī)器智能應(yīng)用，還要利用深度學(xué)習(xí)方法，更好的建立人與人之間的聯(lián)系，最終為人類服務(wù)。
【附圖說明】
[0024] 圖1為本發(fā)明實(shí)施例一種基于大數(shù)據(jù)的雙向推薦裝置結(jié)構(gòu)示意圖；
[0025] 圖2為本發(fā)明實(shí)施例一種基于大數(shù)據(jù)雙向推薦的深度學(xué)習(xí)方法的流程示意圖；
[0026] 圖3為本發(fā)明實(shí)施例用戶評(píng)價(jià)矩陣內(nèi)容示意圖；
[0027] 圖4為本發(fā)明實(shí)施例項(xiàng)目評(píng)價(jià)矩陣內(nèi)容示意圖；
[0028] 圖5為本發(fā)明實(shí)施例項(xiàng)目特征矩陣內(nèi)容示意圖；
[0029] 圖6為本發(fā)明實(shí)施例用戶特征矩陣內(nèi)容示意圖；
[0030] 圖7為本發(fā)明實(shí)施例用戶相似度矩陣內(nèi)容示意圖；
[0031] 圖8為本發(fā)明實(shí)施例項(xiàng)目相似度矩陣內(nèi)容示意圖；
[0032] 圖9為本發(fā)明實(shí)施例用戶推薦矩陣內(nèi)容示意圖；
[0033] 圖10為本發(fā)明實(shí)施例項(xiàng)目推薦矩陣內(nèi)容示意圖；
[0034] 圖11為本發(fā)明實(shí)施例匹配推薦矩陣內(nèi)容示意圖；
[0035] 圖12為本發(fā)明實(shí)施例配對(duì)推薦矩陣內(nèi)容示意圖。
【具體實(shí)施方式】
[0036] 下面結(jié)合附圖對(duì)本發(fā)明方法的實(shí)施方式做詳細(xì)說明。
[0037] 如圖2所示為一種基于大數(shù)據(jù)雙向推薦的深度學(xué)習(xí)方法的流程示意圖，下面以人才招聘為例說明該方法的實(shí)施過程，具體包括以下步驟：
[0038] 步驟一、確定主體與客體的關(guān)系，定義協(xié)同過濾的方向和流程；
[0039] 在本實(shí)例中，確定用戶、項(xiàng)目和項(xiàng)目主體分別如下：
[0040] 用戶為求職者，其提供個(gè)人簡歷信息，并對(duì)獲得的職位信息進(jìn)行評(píng)價(jià)；
[0041] 項(xiàng)目為職位信息；
[0042] 項(xiàng)目主體為企業(yè)，企業(yè)除了發(fā)布職位信息吸引求職者外，還對(duì)獲得的求職者信息進(jìn)行評(píng)價(jià)。
[0043]這樣，就可以在雙向評(píng)價(jià)的基礎(chǔ)上來實(shí)現(xiàn)雙向推薦的機(jī)器學(xué)習(xí)過程。
[0044] 步驟二、提取用戶評(píng)價(jià)數(shù)據(jù)和項(xiàng)目評(píng)價(jià)數(shù)據(jù)，以用戶為行，項(xiàng)目為列來構(gòu)造用戶評(píng) 價(jià)矩陣，以項(xiàng)目為行，用戶為列來構(gòu)造項(xiàng)目評(píng)價(jià)矩陣。
[0045] 收集評(píng)價(jià)數(shù)據(jù)，其包括用戶對(duì)項(xiàng)目（職位)的評(píng)價(jià)信息和項(xiàng)目主體(企業(yè))對(duì)用戶的評(píng)價(jià)信息，將兩部分?jǐn)?shù)據(jù)分別進(jìn)行處理，得到用戶評(píng)價(jià)矩陣和項(xiàng)目評(píng)價(jià)矩陣。如圖3所示，在用戶評(píng)價(jià)矩陣中，是把每個(gè)用戶評(píng)價(jià)過的項(xiàng)目進(jìn)行整合，沒有評(píng)價(jià)過的設(shè)置為〇。那么對(duì)于用戶1來說，其評(píng)價(jià)行向量為[2.5,3.0,5.0,2.3,2.6，1.9,0,0,0]。如圖4所示，在項(xiàng)目評(píng)價(jià) 矩陣中，是把每個(gè)項(xiàng)目主體評(píng)價(jià)過的用戶進(jìn)行整合，沒有評(píng)價(jià)過的設(shè)置為〇。那么對(duì)于項(xiàng)目主體來說，其第一條評(píng)價(jià)行向量為[3.1，3.9,2.6,5.0,0,0]。在本實(shí)例中，評(píng)分的取值范圍是[0，5]。
[0046] 為了提高效率，兩個(gè)評(píng)價(jià)矩陣的構(gòu)造，可以利用分布式并行方法進(jìn)行矩陣化的數(shù) 據(jù)處理。在本例中，使用Hadoop平臺(tái)，利用兩個(gè)Job任務(wù)進(jìn)行矩陣化的數(shù)據(jù)處理，建立用戶評(píng) 價(jià)矩陣E u和項(xiàng)目評(píng)價(jià)矩陣EP。
[0047] 步驟三、分別將用戶評(píng)價(jià)矩陣Eu和項(xiàng)目評(píng)價(jià)矩陣匕轉(zhuǎn)置得到項(xiàng)目特征矩陣!^和用戶特征矩陣Tu，同前，本例中，這兩個(gè)特征矩陣的構(gòu)造也分別用兩個(gè)Job任務(wù)來完成，構(gòu)造后的矩陣如圖5和圖6所示。
[0048] 步驟四、在項(xiàng)目特征矩陣TjP用戶特征矩陣Tu中，依次計(jì)算各個(gè)行向量之間的曼哈頓距離，分別得到各個(gè)行向量之間的相似度，構(gòu)成項(xiàng)目相似度矩陣叫和用戶相似度矩陣D u。則相似度矩陣的構(gòu)造過程如下：
[0049] DP(Pi,Pj) = ( |E(Ui/Pi)-E(Ui/Pj) | + |E(U2/Pi)-E(U2/Pj) | + . . . + |E(Un/Pi)-E(Un/Pj) )/δη
[0050] Du(Ui,Uj) = ( |E(Pi/Ui)-E(Pi/Uj) | + |E(P2/Ui)-E(P2/Uj) | + . . . + |E(Pm/Ui)-E(Pm/Uj) )/δπι
[0051] 其中，Pi代表項(xiàng)目特征矩陣中第i個(gè)項(xiàng)目的用戶評(píng)價(jià)向量，E^i/Pj)代表第一個(gè)用戶對(duì)第j個(gè)項(xiàng)目的評(píng)價(jià)值，EOJk/PO代表第k個(gè)用戶(ke[l， n])對(duì)第i個(gè)項(xiàng)目的評(píng)價(jià)值，n表示總的用戶數(shù)目。
[0052] Ui代表用戶特征矩陣中第i個(gè)用戶的項(xiàng)目評(píng)價(jià)向量，E(Pi/Ui)代表第一個(gè)項(xiàng)目對(duì)第 i個(gè)用戶的評(píng)價(jià)值，E(Pk/Ui)代表第k個(gè)項(xiàng)目（ke [1，m])對(duì)第i個(gè)用戶的評(píng)價(jià)值，m表示總的項(xiàng) 目數(shù)目。
[0053]由于本實(shí)施例中，評(píng)分的取值范圍是[0,5]，因此δ = 5,得到的用戶相似度矩陣Du 和項(xiàng)目相似度矩陣DP如圖7、圖8所示。
[0054]當(dāng)然，相似度矩陣的構(gòu)造算法不限于本實(shí)施例中的曼哈頓距離，任何能夠表征出兩個(gè)向量相似度的算法都適用，只要根據(jù)不同的算法調(diào)整后續(xù)步驟相應(yīng)的取值適于本發(fā)明的思想即可。
[0055] 步驟五，根據(jù)項(xiàng)目相似度矩陣叫和用戶評(píng)價(jià)矩陣Eu來計(jì)算用戶推薦矩陣U-P，并根據(jù)用戶相似度矩陣D u和項(xiàng)目評(píng)價(jià)矩陣匕來計(jì)算項(xiàng)目推薦矩陣P-U。
[0056] 首先，基于用戶評(píng)價(jià)值最高的項(xiàng)目，根據(jù)項(xiàng)目相似度，設(shè)定相似度的閾值δ。此閾值的取值范圍一般在0.3到0.6之間，需要根據(jù)實(shí)際項(xiàng)目的情況自行指定。在項(xiàng)目相似度矩陣里進(jìn)行遍歷運(yùn)算，找到所有低于此閾值S的項(xiàng)目。本實(shí)施例中4 = 0.34。由于本實(shí)施例中采用曼哈頓距離作為相似度的度量，因此，其距離越小，相似度越高。此處亦可采用其它方法計(jì)算相似度。接下來構(gòu)造以用戶為行，項(xiàng)目為列的矩陣，將類似項(xiàng)目的評(píng)分值標(biāo)為1，其他值為零;這樣就構(gòu)造了由值〇和1構(gòu)成的用戶推薦矩陣U-P，如圖9所示。
[0057] 其次，基于項(xiàng)目評(píng)價(jià)值最高的用戶，根據(jù)用戶相似度，設(shè)定相似度的閾值μ。在用戶相似度矩陣?yán)镞M(jìn)行遍歷運(yùn)算，找到所有低于此閾值μ的用戶。本實(shí)施例中，μ = 〇.36。并構(gòu)造以項(xiàng)目為行，用戶為列的矩陣，將類似用戶的評(píng)分值標(biāo)為1，其他值為零;構(gòu)造完成由值〇和1 構(gòu)成的項(xiàng)目推薦矩陣Ρ-υ，如圖10所示。
[0058] 步驟六，將項(xiàng)目推薦矩陣P-U和用戶推薦矩陣U-P作為輸入，將用戶推薦矩陣U- P進(jìn)行轉(zhuǎn)置，并將轉(zhuǎn)置后的矩陣與項(xiàng)目推薦矩陣P-U進(jìn)行矩陣的與運(yùn)算，得到經(jīng)過匹配后的推薦矩陣Rup，如圖11所示。其作為雙向推薦過程的初始結(jié)果，用作計(jì)算配對(duì)推薦矩陣時(shí)的輸入數(shù)據(jù)。
[0059] 步驟七，分別提取匹配后的推薦矩陣RUP中的用戶推薦結(jié)果和項(xiàng)目推薦結(jié)果，并將結(jié)果按照如下方式與用戶評(píng)價(jià)矩陣和項(xiàng)目評(píng)價(jià)矩陣進(jìn)行比較驗(yàn)證:首先定義一個(gè)驗(yàn)證閾值r，本實(shí)施例中r = 3.0,然后找到用戶推薦結(jié)果的值在用戶評(píng)價(jià)矩陣中對(duì)應(yīng)的值F，如果值 F小于閾值r，則將推薦矩陣RDUP中對(duì)應(yīng)的元素改置為0;同理，根據(jù)項(xiàng)目推薦結(jié)果的值找到項(xiàng) 目評(píng)價(jià)矩陣中對(duì)應(yīng)的值，將小于閾值的元素改置為0。驗(yàn)證完成之后，即得到配對(duì)推薦矩陣 RDUP，如圖12所示。這樣，就進(jìn)一步提高了推薦數(shù)據(jù)的精準(zhǔn)度，使得用戶和項(xiàng)目雙方都可獲得高質(zhì)量的推薦數(shù)據(jù)。
[0060] 自此，就實(shí)現(xiàn)了一種雙向的機(jī)器學(xué)習(xí)推薦方法，解決了社會(huì)化網(wǎng)絡(luò)體系之中互為主體和客體的人與人之間穿越信息墻的問題，開創(chuàng)了利用深度學(xué)習(xí)對(duì)大數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析的新領(lǐng)域。
[0061] 基于上述一種基于大數(shù)據(jù)雙向推薦的深度學(xué)習(xí)方法，本發(fā)明還實(shí)現(xiàn)了一套基于大數(shù)據(jù)的雙向推薦裝置，其結(jié)構(gòu)示意圖如圖1所示，從圖中可以看出，該裝置包括用戶評(píng)價(jià)與推薦模塊，項(xiàng)目評(píng)價(jià)與推薦模塊，匹配推薦模塊;用戶評(píng)價(jià)與推薦模塊和項(xiàng)目評(píng)價(jià)與推薦模塊分別與匹配推薦模塊相連;其中用戶評(píng)價(jià)與推薦模塊作為用戶評(píng)價(jià)數(shù)據(jù)的輸入端，獲得用戶針對(duì)項(xiàng)目的評(píng)價(jià)數(shù)據(jù)，并以其構(gòu)建用戶評(píng)價(jià)矩陣，然后對(duì)其進(jìn)行特征提取及項(xiàng)目相似度運(yùn)算，接下來基于相似度運(yùn)算結(jié)果結(jié)合用戶評(píng)價(jià)矩陣進(jìn)行用戶推薦以得到用戶推薦矩陣;項(xiàng)目評(píng)價(jià)與推薦模塊將項(xiàng)目作為評(píng)價(jià)主體，輸入端為項(xiàng)目對(duì)用戶的評(píng)價(jià)數(shù)據(jù)，以該數(shù)據(jù) 構(gòu)建項(xiàng)目評(píng)價(jià)矩陣，并對(duì)其進(jìn)行特征提取及用戶相似度運(yùn)算，然后基于相似度運(yùn)算結(jié)果結(jié) 合項(xiàng)目評(píng)價(jià)矩陣進(jìn)行項(xiàng)目推薦以得到項(xiàng)目推薦矩陣;匹配推薦模塊用于綜合用戶推薦結(jié)果和項(xiàng)目推薦結(jié)果得到匹配推薦矩陣，然后對(duì)該矩陣再次利用初始用戶評(píng)價(jià)數(shù)據(jù)和項(xiàng)目評(píng)價(jià) 數(shù)據(jù)進(jìn)行驗(yàn)證，獲得最終的配對(duì)推薦矩陣。
[0062] 進(jìn)一步的，為完成所述用戶評(píng)價(jià)與推薦模塊的功能，其由依次連接的用戶評(píng)價(jià)矩陣構(gòu)建單元、項(xiàng)目特征提取及矩陣化單元、項(xiàng)目相似度計(jì)算單元以及用戶推薦單元組成；其中用戶評(píng)價(jià)矩陣構(gòu)建單元還與用戶推薦單元連接；
[0063] 所述用戶評(píng)價(jià)矩陣構(gòu)建單元用于接受用戶對(duì)項(xiàng)目的評(píng)價(jià)數(shù)據(jù)，并基于該數(shù)據(jù)構(gòu)建用戶評(píng)價(jià)矩陣；
[0064] 所述項(xiàng)目特征提取及矩陣化單元用于基于用戶評(píng)價(jià)矩陣提取項(xiàng)目特征并以其構(gòu) 建項(xiàng)目特征矩陣；
[0065] 所述項(xiàng)目相似度計(jì)算單元用于基于項(xiàng)目特征矩陣計(jì)算項(xiàng)目間的相似度，并以相似度計(jì)算結(jié)果構(gòu)建項(xiàng)目相似度矩陣；
[0066] 所述用戶推薦單元用于基于用戶評(píng)價(jià)矩陣以及項(xiàng)目相似度矩陣按照預(yù)設(shè)閾值篩選相似項(xiàng)目從而進(jìn)行用戶推薦獲得用戶推薦矩陣。
[0067] 進(jìn)一步的，為完成所述項(xiàng)目評(píng)價(jià)與推薦模塊的功能，其由依次連接的項(xiàng)目評(píng)價(jià)矩陣構(gòu)建單元、用戶特征提取及用戶特征矩陣化單元、用戶相似度計(jì)算單元以及項(xiàng)目推薦單元組成;其中項(xiàng)目評(píng)價(jià)矩陣構(gòu)建單元還與項(xiàng)目推薦單元連接；
[0068] 所述項(xiàng)目評(píng)價(jià)矩陣構(gòu)建單元用于接受項(xiàng)目對(duì)用戶的評(píng)價(jià)數(shù)據(jù)，并基于該數(shù)據(jù)構(gòu)建項(xiàng)目評(píng)價(jià)矩陣；
[0069] 所述用戶特征提取及用戶特征矩陣化單元用于基于項(xiàng)目評(píng)價(jià)矩陣提取用戶特征并以其構(gòu)建用戶特征矩陣；
[0070] 所述用戶相似度計(jì)算單元用于基于用戶特征矩陣計(jì)算用戶間的相似度，并以相似度計(jì)算結(jié)果構(gòu)建用戶相似度矩陣；
[0071 ]所述項(xiàng)目推薦單元用于基于項(xiàng)目評(píng)價(jià)矩陣以及用戶相似度矩陣按照預(yù)設(shè)閾值篩選相似用戶從而進(jìn)行項(xiàng)目推薦獲得項(xiàng)目推薦矩陣。
[0072] 進(jìn)一步的，為完成所述匹配推薦模塊的功能，其由依次連接的計(jì)算匹配矩陣單元和匹配驗(yàn)證單元組成；
[0073] 所述計(jì)算匹配矩陣單元用于基于用戶推薦矩陣和項(xiàng)目推薦矩陣，將二者之一轉(zhuǎn) 置后進(jìn)行與運(yùn)算獲得匹配推薦矩陣；
[0074]所述匹配驗(yàn)證單元用于對(duì)匹配推薦矩陣基于預(yù)設(shè)閾值重新審視用戶評(píng)價(jià)矩陣和項(xiàng)目評(píng)價(jià)矩陣，將低于預(yù)設(shè)閾值的推薦去除從而得到配對(duì)推薦矩陣并輸出。
[0075]從用戶的視角，將矩陣中值為1的項(xiàng)目提取并輸出即得到向用戶推薦的項(xiàng)目；從項(xiàng) 目的視角，將矩陣中值為1的用戶提取并輸出即得到向項(xiàng)目推薦的用戶。
[0076]實(shí)驗(yàn)結(jié)果
[0077]實(shí)驗(yàn)介紹和實(shí)驗(yàn)數(shù)據(jù)準(zhǔn)備：
[0078]通過建立基于語義挖掘的大數(shù)據(jù)平臺(tái)，對(duì)北京市范圍的所有高校就業(yè)信息網(wǎng)的數(shù) 據(jù)進(jìn)行了分布式實(shí)時(shí)抓取，并利用自然語言理解技術(shù)對(duì)數(shù)據(jù)進(jìn)行了多維度的語義分析，將數(shù)據(jù)以多維標(biāo)簽的形式表示。每一條招聘信息對(duì)應(yīng)的維度元素為:來源，行業(yè)，工作性質(zhì)，戶口取向，工作地點(diǎn)取向，收入，工作壓力，工作內(nèi)容取向。這樣，在以招聘數(shù)據(jù)為模型的大數(shù) 據(jù)平臺(tái)上，用戶取向與企業(yè)需求的匹配根據(jù)取向維度相關(guān)聯(lián)。在系統(tǒng)初始化過程中，利用程序創(chuàng)建了默認(rèn)的20萬個(gè)機(jī)器人用戶，并對(duì)每個(gè)用戶指派了取向維度。其中，每條取向維度的生成都由數(shù)據(jù)庫中的存儲(chǔ)過程執(zhí)行，保證了取向維度在機(jī)器人用戶中的平均分布。在抓取的10萬條數(shù)據(jù)中，按照取向維度的取值，對(duì)20萬個(gè)機(jī)器人用戶進(jìn)行了可選性的數(shù)據(jù)隨機(jī)分發(fā)，使得這些用戶具備了第一批的數(shù)據(jù)。然后，創(chuàng)建隨機(jī)評(píng)價(jià)腳本，通過隨機(jī)評(píng)價(jià)過程，獲得了所有用戶對(duì)第一批數(shù)據(jù)的私有評(píng)價(jià)。這樣，推薦系統(tǒng)所需要的用戶數(shù)據(jù)，項(xiàng)目數(shù)據(jù)，評(píng)價(jià) 數(shù)據(jù)三個(gè)方面都已具備。
[0079]實(shí)驗(yàn)設(shè)置：
[0080]在實(shí)驗(yàn)部分，本發(fā)明使用5倍交叉驗(yàn)證的方法來進(jìn)行評(píng)價(jià)，即：選取80%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)，剩余的20%數(shù)據(jù)作為測試數(shù)據(jù)，進(jìn)行試驗(yàn)。并使用準(zhǔn)確率和召回率作為評(píng)價(jià)方法，其定義為：
[0083]其中：P是推薦數(shù)據(jù)的準(zhǔn)確率，TP是測試數(shù)據(jù)中被系統(tǒng)正確判定的樣本數(shù)量，F(xiàn)P是測試數(shù)據(jù)中被系統(tǒng)錯(cuò)誤判定的樣本數(shù)量;R是推薦數(shù)據(jù)的召回率，F(xiàn)N是測試數(shù)據(jù)中有推薦的樣本數(shù)量。
[0084] 實(shí)驗(yàn)結(jié)果：
[0085] 為了驗(yàn)證本發(fā)明方法的效果，實(shí)驗(yàn)分別和傳統(tǒng)的單向基于用戶的協(xié)同過濾方法 (UBCF)以及單向基于物品的協(xié)同過濾方法（IBCF)進(jìn)行比較，結(jié)果如下表所示：
[0087]在上表中，我們可以看出相對(duì)于傳統(tǒng)的UBCF和IBCF方法，本發(fā)明方法可以有效地提高推薦模型的準(zhǔn)確率和召回率，其中準(zhǔn)確率分別提高了 4.27 %和7.8 %，召回率分別提高了 3.19%和4.79%。因此，實(shí)驗(yàn)結(jié)果清晰表明本發(fā)明方法比傳統(tǒng)的單向方法效果要好，這些提高則是因?yàn)槭褂昧穗p向推薦模型。
[0088]以上所述的具體描述，對(duì)發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)益處都進(jìn)行了進(jìn)一步的詳細(xì)說明，所應(yīng)理解的是，以上所述僅為本發(fā)明的具體實(shí)施例而已，并不用于限定本發(fā)明的保護(hù)范圍，凡在本發(fā)明的精神和原則之內(nèi)，所做的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于大數(shù)據(jù)雙向推薦的深度學(xué)習(xí)方法，其特征在于:包括以下步驟： 1) 確定主體與客體的關(guān)系，定義協(xié)同過濾的方向和流程； 2) 提取用戶評(píng)價(jià)數(shù)據(jù)，即用戶對(duì)項(xiàng)目的興趣度評(píng)分值，構(gòu)造用戶評(píng)價(jià)矩陣； 3) 在用戶評(píng)價(jià)數(shù)據(jù)中提取每個(gè)項(xiàng)目被所有用戶的評(píng)價(jià)數(shù)據(jù)，構(gòu)成項(xiàng)目特征行向量，由所有項(xiàng)目的特征行向量構(gòu)成項(xiàng)目特征矩陣;利用相似度算法，計(jì)算各個(gè)項(xiàng)目之間的相似度，構(gòu)造項(xiàng)目相似度矩陣； 4) 提取項(xiàng)目評(píng)價(jià)數(shù)據(jù)，項(xiàng)目評(píng)分并不是項(xiàng)目對(duì)用戶的直接評(píng)分，而是項(xiàng)目的執(zhí)行人對(duì) 用戶的評(píng)分； 5) 在項(xiàng)目評(píng)價(jià)數(shù)據(jù)中提取每個(gè)用戶被所有項(xiàng)目的評(píng)價(jià)數(shù)據(jù)，構(gòu)成用戶特征行向量，由所有用戶的特征行向量構(gòu)成用戶特征矩陣;利用相似度算法，計(jì)算各個(gè)用戶之間的相似度，構(gòu)造用戶相似度矩陣。 6) 利用用戶評(píng)價(jià)矩陣和項(xiàng)目相似度矩陣進(jìn)行運(yùn)算，利用用戶評(píng)價(jià)值高的項(xiàng)目，在項(xiàng)目相似度矩陣?yán)镎业狡渌麧撛陧?xiàng)目，在以用戶為行，項(xiàng)目為列的矩陣中，將潛在項(xiàng)目的評(píng)分值標(biāo)為1，其他值為零;這樣就構(gòu)造了用戶推薦矩陣； 7) 利用項(xiàng)目評(píng)價(jià)矩陣和用戶相似度矩陣進(jìn)行運(yùn)算，利用項(xiàng)目評(píng)價(jià)值高的項(xiàng)目，在用戶相似度矩陣?yán)镎业狡渌麧撛谟脩?，在以?xiàng)目為行，用戶為列的矩陣中，將潛在用戶的評(píng)分值標(biāo)為1，其他值為零;這樣就構(gòu)造了項(xiàng)目推薦矩陣； 8) 將用戶推薦矩陣和項(xiàng)目推薦矩陣之一轉(zhuǎn)置后進(jìn)行矩陣與運(yùn)算，得到用戶與項(xiàng)目的匹配推薦矩陣;此矩陣中的非零值標(biāo)志著無論從正向還是逆向推薦的角度考慮，都能達(dá)到潛在推薦效果的用戶-項(xiàng)目匹配對(duì)； 9) 對(duì)匹配推薦矩陣?yán)庙?xiàng)目評(píng)價(jià)矩陣和用戶評(píng)價(jià)矩陣一起進(jìn)行匹配驗(yàn)證運(yùn)算，將匹配推薦矩陣中推薦的用戶或項(xiàng)目中評(píng)分較低的項(xiàng)目或用戶去除即得到匹配推薦矩陣，該矩陣中值為1的項(xiàng)目或用戶即為推薦項(xiàng)目或用戶。2. 根據(jù)權(quán)利要求1所述的一種基于大數(shù)據(jù)雙向推薦的深度學(xué)習(xí)方法，其特征在于:所述相似度算法為曼哈頓距離。3. -種基于大數(shù)據(jù)的雙向推薦裝置，其特征在于:包括用戶評(píng)價(jià)與推薦模塊，項(xiàng)目評(píng)價(jià) 與推薦模塊，匹配推薦模塊；用戶評(píng)價(jià)與推薦模塊和項(xiàng)目評(píng)價(jià)與推薦模塊分別與匹配推薦豐吳塊相連；用戶評(píng)價(jià)與推薦模塊作為用戶評(píng)價(jià)數(shù)據(jù)的輸入端，獲得用戶針對(duì)項(xiàng)目的評(píng)價(jià)數(shù)據(jù)，并以其構(gòu)建用戶評(píng)價(jià)矩陣，然后對(duì)其進(jìn)行特征提取及項(xiàng)目相似度運(yùn)算，接下來基于相似度運(yùn) 算結(jié)果結(jié)合用戶評(píng)價(jià)矩陣進(jìn)行用戶推薦以得到用戶推薦矩陣；項(xiàng)目評(píng)價(jià)與推薦模塊將項(xiàng)目作為評(píng)價(jià)主體，輸入端為項(xiàng)目對(duì)用戶的評(píng)價(jià)數(shù)據(jù)，以該數(shù) 據(jù)構(gòu)建項(xiàng)目評(píng)價(jià)矩陣，并對(duì)其進(jìn)行特征提取及用戶相似度運(yùn)算，然后基于相似度運(yùn)算結(jié)果結(jié)合項(xiàng)目評(píng)價(jià)矩陣進(jìn)行項(xiàng)目推薦以得到項(xiàng)目推薦矩陣；匹配推薦模塊用于綜合用戶推薦結(jié)果和項(xiàng)目推薦結(jié)果得到匹配推薦矩陣，然后對(duì)該矩陣再次利用初始用戶評(píng)價(jià)數(shù)據(jù)和項(xiàng)目評(píng)價(jià)數(shù)據(jù)進(jìn)行驗(yàn)證，獲得最終的配對(duì)推薦矩陣。4. 根據(jù)權(quán)利要求3所述的一種基于大數(shù)據(jù)的雙向推薦裝置，其特征在于:所述用戶評(píng)價(jià) 與推薦模塊由依次連接的用戶評(píng)價(jià)矩陣構(gòu)建單元、項(xiàng)目特征提取及矩陣化單元、項(xiàng)目相似度計(jì)算單元以及用戶推薦單元組成;其中用戶評(píng)價(jià)矩陣構(gòu)建單元還與用戶推薦單元連接；所述用戶評(píng)價(jià)矩陣構(gòu)建單元用于接受用戶對(duì)項(xiàng)目的評(píng)價(jià)數(shù)據(jù)，并基于該數(shù)據(jù)構(gòu)建用戶評(píng)價(jià)矩陣；所述項(xiàng)目特征提取及矩陣化單元用于基于用戶評(píng)價(jià)矩陣提取項(xiàng)目特征并以其構(gòu)建項(xiàng) 目特征矩陣；所述項(xiàng)目相似度計(jì)算單元用于基于項(xiàng)目特征矩陣計(jì)算項(xiàng)目間的相似度，并以相似度計(jì) 算結(jié)果構(gòu)建項(xiàng)目相似度矩陣；所述用戶推薦單元用于基于用戶評(píng)價(jià)矩陣以及項(xiàng)目相似度矩陣按照預(yù)設(shè)閾值篩選相似項(xiàng)目從而進(jìn)行用戶推薦獲得用戶推薦矩陣。5. 根據(jù)權(quán)利要求3所述的一種基于大數(shù)據(jù)的雙向推薦裝置，其特征在于:所述項(xiàng)目評(píng)價(jià) 與推薦模塊由依次連接的項(xiàng)目評(píng)價(jià)矩陣構(gòu)建單元、用戶特征提取及用戶特征矩陣化單元、用戶相似度計(jì)算單元以及項(xiàng)目推薦單元組成;其中項(xiàng)目評(píng)價(jià)矩陣構(gòu)建單元還與項(xiàng)目推薦單元連接；所述項(xiàng)目評(píng)價(jià)矩陣構(gòu)建單元用于接受項(xiàng)目對(duì)用戶的評(píng)價(jià)數(shù)據(jù)，并基于該數(shù)據(jù)構(gòu)建項(xiàng)目評(píng)價(jià)矩陣；所述用戶特征提取及用戶特征矩陣化單元用于基于項(xiàng)目評(píng)價(jià)矩陣提取用戶特征并以其構(gòu)建用戶特征矩陣；所述用戶相似度計(jì)算單元用于基于用戶特征矩陣計(jì)算用戶間的相似度，并以相似度計(jì) 算結(jié)果構(gòu)建用戶相似度矩陣；所述項(xiàng)目推薦單元用于基于項(xiàng)目評(píng)價(jià)矩陣以及用戶相似度矩陣按照預(yù)設(shè)閾值篩選相似用戶從而進(jìn)行項(xiàng)目推薦獲得項(xiàng)目推薦矩陣。6. 根據(jù)權(quán)利要求3-5任一所述的一種基于大數(shù)據(jù)的雙向推薦裝置，其特征在于:所述匹配推薦模塊由依次連接的計(jì)算匹配矩陣單元和匹配驗(yàn)證單元組成；所述計(jì)算匹配矩陣單元用于基于用戶推薦矩陣和項(xiàng)目推薦矩陣，將二者之一轉(zhuǎn)置后進(jìn) 行與運(yùn)算獲得匹配推薦矩陣；所述匹配驗(yàn)證單元用于對(duì)匹配推薦矩陣基于預(yù)設(shè)閾值重新審視用戶評(píng)價(jià)矩陣和項(xiàng)目評(píng)價(jià)矩陣，將低于預(yù)設(shè)閾值的推薦去除從而得到配對(duì)推薦矩陣并輸出。
【文檔編號(hào)】G06F17/30GK106096015SQ201610471259
【公開日】2016年11月9日
【申請(qǐng)日】2016年6月24日
【發(fā)明人】毛煜, 蘇巖, 牛科, 左琦, 劉軍
【申請(qǐng)人】北京理工大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：毛煜;蘇巖;?？?左琦;劉軍;
技術(shù)所有人：北京理工大學(xué);
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種基于大數(shù)據(jù)雙向推薦的深度學(xué)習(xí)方法及雙向推薦裝置的制造方法