一種基于群組匹配的專家推薦方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于群組匹配的專家推薦方法及系統(tǒng),屬于互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,所述方法包括:S1:通過網(wǎng)絡(luò)爬蟲獲取專家列表中各專家的網(wǎng)頁信息;S2:對(duì)所述網(wǎng)頁信息進(jìn)行提取,以獲得各專家的專家學(xué)術(shù)信息;S3:根據(jù)所述專家學(xué)術(shù)信息計(jì)算各專家與待匹配項(xiàng)目之間的匹配度;S4:根據(jù)所述匹配度及群組匹配模型通過動(dòng)態(tài)規(guī)劃算法確定為所述待匹配項(xiàng)目所推薦的專家。本發(fā)明通過群組匹配的方式實(shí)現(xiàn)專家推薦,提高了專家推薦效率,大幅降低時(shí)間開銷,另外,計(jì)算各專家與待匹配項(xiàng)目之間的匹配度時(shí),還考慮了各專家與待匹配項(xiàng)目之間的社會(huì)關(guān)系匹配度,從而在實(shí)現(xiàn)專家推薦時(shí),還有效避免或預(yù)防了學(xué)術(shù)腐敗問題。
【專利說明】一種基于群組匹配的專家推薦方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,特別涉及一種基于群組匹配的專家推薦方法及系 統(tǒng)。
【背景技術(shù)】
[0002] 科研項(xiàng)目的評(píng)審效率和評(píng)審質(zhì)量對(duì)一個(gè)單位甚至一個(gè)國家的科研發(fā)展水平有重 要影響。作為一種快捷、先進(jìn)的評(píng)審方式,網(wǎng)絡(luò)評(píng)審貫穿一個(gè)科研或工程項(xiàng)目從立項(xiàng)、申請(qǐng)、 組織、論證、評(píng)估、驗(yàn)收、獎(jiǎng)勵(lì)到備案等各個(gè)階段的全生命周期,其宗旨是利用計(jì)算機(jī)和網(wǎng)絡(luò) 系統(tǒng)替代傳統(tǒng)的人工操作,從而低評(píng)審成本、提高工作效率和評(píng)審質(zhì)量,并利用電子信息系 統(tǒng)來規(guī)范評(píng)審過程。
[0003] 近年來,云計(jì)算、大數(shù)據(jù)、推薦系統(tǒng)、深度學(xué)習(xí)、社會(huì)網(wǎng)絡(luò)等新型信息技術(shù)的迅速發(fā) 展使得智能化的網(wǎng)絡(luò)評(píng)審成為可能,其中智能化的專家推薦系統(tǒng)是整個(gè)網(wǎng)絡(luò)評(píng)審過程的核 心與難點(diǎn)。這里智能化的含義是:系統(tǒng)不僅能對(duì)內(nèi)部信息(基于代碼、精確化、結(jié)構(gòu)化)進(jìn) 行處理和提煉,還能不斷匯聚外部信息(基于語義、模糊化、非結(jié)構(gòu)化),通過數(shù)據(jù)積累對(duì)專 家本身進(jìn)行分類和評(píng)價(jià),生成更具指導(dǎo)意義的智能專家?guī)?,從而?gòu)造更為合理的推薦模型 和算法,但現(xiàn)有的專家推薦系統(tǒng)存在專家推薦效率過低的問題,導(dǎo)致時(shí)間開銷過大。
【發(fā)明內(nèi)容】
[0004] 鑒于上述問題,本發(fā)明提供了一種基于群組匹配的專家推薦方法,所述方法包 括:
[0005] Sl :通過網(wǎng)絡(luò)爬蟲獲取專家列表中各專家的網(wǎng)頁信息;
[0006] S2 :對(duì)所述網(wǎng)頁信息進(jìn)行提取,以獲得各專家的專家學(xué)術(shù)信息;
[0007] S3 :根據(jù)所述專家學(xué)術(shù)信息計(jì)算各專家與待匹配項(xiàng)目之間的匹配度;
[0008] S4 :根據(jù)所述匹配度及群組匹配模型通過動(dòng)態(tài)規(guī)劃算法確定為所述待匹配項(xiàng)目所 推薦的專家,所述群組匹配模型為所有待匹配項(xiàng)目推薦專家的匹配度之和達(dá)到最大時(shí),所 述待匹配項(xiàng)目和推薦的專家之間的對(duì)應(yīng)關(guān)系。
[0009] 其中,步驟Sl中,根據(jù)所述專家列表中的專家姓名通過網(wǎng)絡(luò)爬蟲獲取專家列表中 各專家的網(wǎng)頁信息。
[0010] 其中,步驟S2具體包括:
[0011] S201 :從所述網(wǎng)頁信息中搜索與當(dāng)前專家的專家姓名及工作單位相匹配的網(wǎng)頁信 息,若未搜索到,則執(zhí)行步驟S202,否則從搜索到的第一個(gè)網(wǎng)頁信息中提取出專家學(xué)術(shù)信 息,并執(zhí)行步驟S203,所述專家列表包括:各專家的專家姓名及工作單位;
[0012] S202:從所述網(wǎng)頁信息中搜索與當(dāng)前專家的專家姓名相匹配的網(wǎng)頁信息,從搜索 到的第一個(gè)網(wǎng)頁信息中提取專家學(xué)術(shù)信息;
[0013] S203 :將所述專家列表中未提取專家學(xué)術(shù)信息的專家作為當(dāng)前專家,并返回步驟 S201。
[0014] 其中,所述專家學(xué)術(shù)信息包括:專家姓名、工作單位、研究領(lǐng)域關(guān)鍵詞、論文名稱及 論文作者。
[0015] 其中,步驟S3中,根據(jù)所述專家學(xué)術(shù)信息通過下式計(jì)算各專家與待匹配項(xiàng)目之間 的匹配度,
[0016] Mi,』=a *MKi,』+ β *MJi,』+ Y *MLi,j- δ *MSi,』
[0017] 其中,Mi;j為專家i與待匹配項(xiàng)目j之間的匹配度,α、β、Y、δ均為常數(shù),MKy 為專家i與待匹配項(xiàng)目j之間的科研領(lǐng)域關(guān)鍵詞匹配度,MJu為專家i與待匹配項(xiàng)目j之 間的期刊會(huì)議標(biāo)簽匹配度,MLu為專家i與待匹配項(xiàng)目j之間的學(xué)術(shù)層次匹配度,MSu為 專家i與待匹配項(xiàng)目j之間的社會(huì)關(guān)系匹配度。
[0018] 其中,所述MSi,」通過下式進(jìn)行計(jì)算,
【權(quán)利要求】
1. 一種基于群組匹配的專家推薦方法,其特征在于,所述方法包括: 51 :通過網(wǎng)絡(luò)爬蟲獲取專家列表中各專家的網(wǎng)頁信息; 52 :對(duì)所述網(wǎng)頁信息進(jìn)行提取,以獲得各專家的專家學(xué)術(shù)信息; 53 :根據(jù)所述專家學(xué)術(shù)信息計(jì)算各專家與待匹配項(xiàng)目之間的匹配度; 54 :根據(jù)所述匹配度及群組匹配模型通過動(dòng)態(tài)規(guī)劃算法確定為所述待匹配項(xiàng)目所推薦 的專家,所述群組匹配模型為所有待匹配項(xiàng)目推薦專家的匹配度之和達(dá)到最大時(shí),所述待 匹配項(xiàng)目和推薦的專家之間的對(duì)應(yīng)關(guān)系。
2. 如權(quán)利要求1所述的方法,其特征在于,步驟Sl中,根據(jù)所述專家列表中的專家姓名 通過網(wǎng)絡(luò)爬蟲獲取專家列表中各專家的網(wǎng)頁信息。
3. 如權(quán)利要求2所述的方法,其特征在于,步驟S2具體包括: 5201 :從所述網(wǎng)頁信息中搜索與當(dāng)前專家的專家姓名及工作單位相匹配的網(wǎng)頁信息, 若未搜索到,則執(zhí)行步驟S202,否則從搜索到的第一個(gè)網(wǎng)頁信息中提取出專家學(xué)術(shù)信息,并 執(zhí)行步驟S203,所述專家列表包括:各專家的專家姓名及工作單位; 5202 :從所述網(wǎng)頁信息中搜索與當(dāng)前專家的專家姓名相匹配的網(wǎng)頁信息,從搜索到的 第一個(gè)網(wǎng)頁信息中提取專家學(xué)術(shù)信息; S203:將所述專家列表中未提取專家學(xué)術(shù)信息的專家作為當(dāng)前專家,并返回步驟 S201。
4. 如權(quán)利要求3所述的方法,其特征在于,所述專家學(xué)術(shù)信息包括:專家姓名、工作單 位、研究領(lǐng)域關(guān)鍵詞、論文名稱及論文作者。
5. 如權(quán)利要求4所述的方法,其特征在于,步驟S3中,根據(jù)所述專家學(xué)術(shù)信息通過下式 計(jì)算各專家與待匹配項(xiàng)目之間的匹配度, Mi; j = a *MKi; j+ ^ *MJi; j+ y *MLi; r 8 *MSi; j 其中,My為專家i與待匹配項(xiàng)目j之間的匹配度,a、3、Y、S均為常數(shù),MKu為專 家i與待匹配項(xiàng)目j之間的科研領(lǐng)域關(guān)鍵詞匹配度,MJu為專家i與待匹配項(xiàng)目j之間的 期刊會(huì)議標(biāo)簽匹配度,MLu為專家i與待匹配項(xiàng)目j之間的學(xué)術(shù)層次匹配度,MSu為專家 i與待匹配項(xiàng)目j之間的社會(huì)關(guān)系匹配度。
6. 如權(quán)利要求5所述的方法,其特征在于,所述MS^」通過下式進(jìn)行計(jì)算,
家之間工作單位的相關(guān)度,當(dāng)工作單位相同時(shí),S U的取值為1,否則取值為O ;SP為專家i 與第V個(gè)專家合作過的論文;n為論文作者的數(shù)量山為專家i所占的權(quán)重;tv為第V個(gè)專 家所占的權(quán)重;k為待匹配項(xiàng)目j所對(duì)應(yīng)項(xiàng)目 申請(qǐng)人:的序號(hào);a為待匹配項(xiàng)目j所對(duì)應(yīng)項(xiàng)目 申請(qǐng)人:的數(shù)量。
7. 如權(quán)利要求5所述的方法,其特征在于,所述群組匹配模型為:
則矩陣中對(duì)應(yīng)的第i行第j列取值為1,否則取值為O ;m為待匹配項(xiàng)目的總數(shù);n為專家的 總數(shù);e為每個(gè)待匹配項(xiàng)目所對(duì)應(yīng)專家數(shù)量的最大值;〇為每個(gè)專家所對(duì)應(yīng)項(xiàng)目數(shù)量的最 大值。
8. 如權(quán)利要求7所述的方法,其特征在于,步驟S4中,根據(jù)所述匹配度及群組匹配模型 通過動(dòng)態(tài)規(guī)劃算法確定為所述待匹配項(xiàng)目所推薦的專家,具體包括: 5401 :根據(jù)所述研究領(lǐng)域關(guān)鍵詞確定每個(gè)待匹配項(xiàng)目所對(duì)應(yīng)的專家,并將每個(gè)待匹配 項(xiàng)目所對(duì)應(yīng)的專家按照所述匹配度進(jìn)行排序; 5402 :依次將所述匹配度最高的專家分配給對(duì)應(yīng)的待匹配項(xiàng)目,直至所述待匹配項(xiàng)目 所對(duì)應(yīng)專家數(shù)量達(dá)到了最大值e或所述專家所對(duì)應(yīng)項(xiàng)目數(shù)量達(dá)到了最大值〇。
9. 一種基于群組匹配的專家推薦系統(tǒng),其特征在于,所述系統(tǒng)包括: 網(wǎng)頁獲取模塊,用于通過網(wǎng)絡(luò)爬蟲獲取專家列表中各專家的網(wǎng)頁信息; 信息提取模塊,用于對(duì)所述網(wǎng)頁信息進(jìn)行提取,以獲得各專家的專家學(xué)術(shù)信息; 匹配度計(jì)算模塊,用于根據(jù)所述專家學(xué)術(shù)信息計(jì)算各專家與待匹配項(xiàng)目之間的匹配 度; 專家推薦模塊,用于根據(jù)所述匹配度及群組匹配模型通過動(dòng)態(tài)規(guī)劃算法確定為所述待 匹配項(xiàng)目所推薦的專家,所述群組匹配模型為所有待匹配項(xiàng)目推薦專家的匹配度之和達(dá)到 最大時(shí),所述待匹配項(xiàng)目和推薦的專家之間的對(duì)應(yīng)關(guān)系。
【文檔編號(hào)】G06F17/30GK104361102SQ201410680306
【公開日】2015年2月18日 申請(qǐng)日期:2014年11月24日 優(yōu)先權(quán)日:2014年11月24日
【發(fā)明者】肖賀, 李振華, 劉云浩 申請(qǐng)人:清華大學(xué)