国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      種子用戶(hù)確定方法與流程

      文檔序號(hào):12034749閱讀:312來(lái)源:國(guó)知局
      種子用戶(hù)確定方法與流程

      本發(fā)明涉及數(shù)據(jù)處理技術(shù),尤其涉及一種種子用戶(hù)確定方法。



      背景技術(shù):

      隨著web2.0技術(shù)和在線社交網(wǎng)絡(luò)的出現(xiàn)和迅猛發(fā)展,人們使用互聯(lián)網(wǎng)的方式發(fā)生了深刻變革——由單純的網(wǎng)頁(yè)瀏覽和信息搜索轉(zhuǎn)向各類(lèi)社交網(wǎng)絡(luò)上社會(huì)關(guān)系的構(gòu)建與維護(hù)、基于社會(huì)關(guān)系的信息發(fā)布、交流和共享。社會(huì)影響力是社交網(wǎng)絡(luò)中常見(jiàn)的一種現(xiàn)象,具體是指由于用戶(hù)、組織或者社區(qū)與其他用戶(hù)、組織或者社區(qū)等具有社交關(guān)系,導(dǎo)致自身行為隨其他用戶(hù)、組織或者社區(qū)變化而變化的一種現(xiàn)象。通過(guò)對(duì)社交網(wǎng)絡(luò)中節(jié)點(diǎn)、用戶(hù)等個(gè)體的影響力進(jìn)行分析,可以發(fā)現(xiàn)社交網(wǎng)絡(luò)中的具有重要影響力的種子用戶(hù),可用于企業(yè)商業(yè)營(yíng)銷(xiāo)、廣告定向投放、言論渠道推薦、輿情監(jiān)控等諸多領(lǐng)域。

      目前的一些研究中將種子用戶(hù)確定的問(wèn)題轉(zhuǎn)化為對(duì)其他用戶(hù)偏好影響力最大化問(wèn)題,提出了一種貪心算法對(duì)該問(wèn)題進(jìn)行求解,即每一步都選擇當(dāng)前對(duì)其他用戶(hù)偏好最具影響力的用戶(hù)作為當(dāng)前最高影響力用戶(hù),直到將所有數(shù)據(jù)枚舉完時(shí)的當(dāng)前最高影響力用戶(hù)作為種子用戶(hù)。

      現(xiàn)有技術(shù)確定種子用戶(hù)的效率不高。



      技術(shù)實(shí)現(xiàn)要素:

      本發(fā)明提供一種種子用戶(hù)確定方法,包括:

      根據(jù)預(yù)設(shè)的區(qū)域從屬關(guān)系確定a個(gè)最小簽到區(qū)域,其中,所述a為大于等于1的整數(shù);

      針對(duì)每個(gè)所述最小簽到區(qū)域,獲取所述最小簽到區(qū)域?qū)?yīng)的簽到用戶(hù)和所述簽到用戶(hù)的偏好話題;

      獲取所述最小簽到區(qū)域的第一影響力列表,所述第一影響力列表包含針對(duì)所述偏好話題對(duì)應(yīng)的簽到用戶(hù)的影響用戶(hù),以及所述影響用戶(hù)對(duì)所述簽到用戶(hù)的影響力值;

      根據(jù)查詢(xún)區(qū)域、多個(gè)查詢(xún)?cè)掝}和所述區(qū)域從屬關(guān)系,獲取b個(gè)子覆蓋區(qū)域;每個(gè)所述子覆蓋區(qū)域包含一個(gè)最小簽到區(qū)域,和/或,每個(gè)所述子覆蓋區(qū)域包含d個(gè)最小簽到區(qū)域的部分簽到位置;其中,所述最小簽到區(qū)域?qū)?yīng)簽到用戶(hù)的偏好話題,所述偏好話題包含x個(gè)所述查詢(xún)?cè)掝};所述最小簽到區(qū)域的部分簽到位置對(duì)應(yīng)簽到用戶(hù)的偏好話題,所述偏好話題包含y個(gè)所述查詢(xún)?cè)掝},所述b為大于等于2的整數(shù),所述d、x、y分別為大于等于1的整數(shù);

      針對(duì)每個(gè)子覆蓋區(qū)域,獲取所述每個(gè)子覆蓋區(qū)域針對(duì)所述查詢(xún)?cè)掝}的第二影響力列表,并獲取第二影響力列表中針對(duì)查詢(xún)?cè)掝}的影響力值最大的第二影響力值;

      根據(jù)獲取的b個(gè)第二影響力值確定所述查詢(xún)區(qū)域的第一影響力閾值;

      獲取最大的第二影響力值對(duì)應(yīng)的影響用戶(hù)在所述查詢(xún)區(qū)域的第三影響力值;

      從歷史獲取的第三影響力值中確定最大第三影響力值,并確定所述最大第三影響力值是否大于或等于所述第一影響力閾值:

      若所述最大第三影響力值大于或等于所述第一影響力閾值,則獲取所述當(dāng)前最大第三影響力值對(duì)應(yīng)的影響用戶(hù)為第一種子用戶(hù)。

      進(jìn)一步地,還包括:若所述最大第三影響力值小于所述第一影響力閾值,則對(duì)所述第二影響力列表進(jìn)行第一類(lèi)更新;

      根據(jù)進(jìn)行第一類(lèi)更新后的第二影響力列表,執(zhí)行所述獲取在第二影響力列表中針對(duì)查詢(xún)?cè)掝}的影響力值最大的第二影響力值,直到獲取到所述第一種子用戶(hù)。

      進(jìn)一步地,還包括:在獲取所述第一種子用戶(hù)之后,從所述第二影響力列表中刪除已獲取的種子用戶(hù)獲得新的第二影響力列表,所述已獲取的種子用戶(hù)包含所述第一種子用戶(hù);

      根據(jù)新的第二影響力列表獲取第二影響力列表中針對(duì)查詢(xún)?cè)掝}的影響力值最大的第四影響力值,

      以獲取的b個(gè)第四影響力值之和為所述查詢(xún)區(qū)域的第二影響力閾值;

      獲取所述最大的第四影響力值對(duì)應(yīng)的影響用戶(hù)在所述查詢(xún)區(qū)域的第五影響力值,并將所述第五影響力值確定為初始狀態(tài);從歷史獲取的第五影響力值中確定最大第五影響力值,并確定所述最大第五影響力值是否大于等于所述第二影響力閾值,

      若所述最大第五影響力值小于所述第二影響力閾值,則執(zhí)行所述獲取最大的第四影響力值對(duì)應(yīng)的影響用戶(hù)在所述查詢(xún)區(qū)域的第五影響力值,

      若所述最大第五影響力值大于等于所述第二影響力閾值,則檢測(cè)所述最大第五影響力值的狀態(tài),

      若所述最大第五影響力值為初始狀態(tài),則更新所述最大第五影響力值為估計(jì)狀態(tài),執(zhí)行所述從歷史獲取的第五影響力值中確定最大第五影響力值,

      若所述最大第五影響力值為估計(jì)狀態(tài),則更新所述最大第五影響力值為準(zhǔn)確狀態(tài),執(zhí)行所述從歷史獲取的第五影響力值中確定最大第五影響力值,

      若所述最大第五影響力值為準(zhǔn)確狀態(tài),則獲取所述最大第五影響力值對(duì)應(yīng)的影響用戶(hù)為后續(xù)種子用戶(hù),刪除所述歷史獲取的第五影響力值中所述已獲取的種子用戶(hù)對(duì)應(yīng)的第五影響力值,執(zhí)行所述從所述第二影響力列表中刪除已獲取的種子用戶(hù)獲得新的第二影響力列表,直到獲取所述后續(xù)種子用戶(hù)的數(shù)量滿(mǎn)足qk-1,所述qk為查詢(xún)個(gè)數(shù)。

      進(jìn)一步地,所述獲取所述最小簽到區(qū)域的第一影響力列表具體包括:

      根據(jù)獲取的針對(duì)所述偏好話題的簽到用戶(hù)獲取所述影響用戶(hù);

      根據(jù)所述影響用戶(hù)u對(duì)所述簽到用戶(hù)v的影響因子p(u,v)、所述簽到用戶(hù)v對(duì)所述最小簽到區(qū)域的偏好值γ(v,rj)以及所述簽到用戶(hù)v對(duì)所述話題t的偏好值獲得所述影響用戶(hù)u對(duì)所述簽到用戶(hù)v的影響力值其中,所述是在最小簽到區(qū)域rj中偏好話題t且能被用戶(hù)u影響的簽到用戶(hù)v的集合。

      進(jìn)一步地,所述針對(duì)每個(gè)子覆蓋區(qū)域,獲取所述每個(gè)子覆蓋區(qū)域的第二影響力列表具體包括:

      若所述子覆蓋區(qū)域包含一個(gè)針對(duì)查詢(xún)?cè)掝}的最小簽到區(qū)域,則確定所述第二影響力列表包括:針對(duì)所述查詢(xún)?cè)掝}的簽到用戶(hù)的影響用戶(hù),以及所述影響用戶(hù)對(duì)所述簽到用戶(hù)針對(duì)所述查詢(xún)?cè)掝}的影響力值;

      若所述子覆蓋區(qū)域包含d個(gè)針對(duì)查詢(xún)?cè)掝}的最小簽到區(qū)域的部分簽到位置,則確定所述第二影響力列表包括:在所述部分簽到位置針對(duì)所述查詢(xún)?cè)掝}的簽到用戶(hù)的影響用戶(hù),以及所述影響用戶(hù)對(duì)所述簽到用戶(hù)針對(duì)所述查詢(xún)?cè)掝}的影響力值。

      進(jìn)一步地,所述根據(jù)獲取的b個(gè)第二影響力值確定所述查詢(xún)區(qū)域的第一影響力閾值具體包括:對(duì)獲取的b個(gè)第二影響力值求和獲得所述第一影響力閾值。

      進(jìn)一步地,所述對(duì)所述第二影響力列表進(jìn)行第一類(lèi)更新具體包括:從所述第二影響力列表中刪除當(dāng)前的所述第二影響力值。

      進(jìn)一步地,所述更新所述最大第五影響力值為估計(jì)狀態(tài)的同時(shí)還包括:

      將所述最大第五影響力值更新為其中σst(u,qr)為初始狀態(tài)下的第五影響力,是影響用戶(hù)u對(duì)簽到用戶(hù)v的影響因子的最小值,是在查詢(xún)區(qū)域中針對(duì)查詢(xún)?cè)掝}且被影響用戶(hù)u影響的簽到用戶(hù)v的集合,σst(s,v)是已確定的種子用戶(hù)集合s對(duì)簽到用戶(hù)v在查詢(xún)區(qū)域的影響力值。

      進(jìn)一步地,所述更新所述最大第五影響力值為準(zhǔn)確狀態(tài)的同時(shí)還包括:

      將所述最大第五影響力值更新為σst({u∪s},q)-σst(s,q),其中所述σst({u∪s},q)為已確定的種子用戶(hù)集合s和估計(jì)狀態(tài)的所述最大第五影響力對(duì)應(yīng)的影響用戶(hù)u在查詢(xún)區(qū)域針對(duì)查詢(xún)?cè)掝}的影響力值,所述σst(s,q)為種子用戶(hù)集合s對(duì)查詢(xún)區(qū)域和查詢(xún)?cè)掝}的影響力值,q為包含查詢(xún)區(qū)域qr和查詢(xún)?cè)掝}qt的查詢(xún)條件。

      進(jìn)一步地,所述根據(jù)預(yù)設(shè)的區(qū)域從屬關(guān)系確定a個(gè)最小簽到區(qū)域包括:

      以所述區(qū)域從屬關(guān)系作為樹(shù)形節(jié)點(diǎn)的層級(jí)關(guān)系確定一樹(shù)形索引,所述樹(shù)形節(jié)點(diǎn)存儲(chǔ)所述最小簽到區(qū)域、所述最小簽到區(qū)域?qū)?yīng)簽到用戶(hù)的偏好話題和至少一指向文檔的指針,所述指針指向的文檔包含所述最小簽到區(qū)域?qū)?yīng)的簽到用戶(hù)、所述簽到用戶(hù)的總簽到次數(shù)、所述簽到用戶(hù)在所述最小簽到區(qū)域中的簽到次數(shù)、所述簽到用戶(hù)的偏好話題及所述用戶(hù)對(duì)所述偏好話題的偏好值。

      本發(fā)明獲取每個(gè)子覆蓋區(qū)域針對(duì)查詢(xún)?cè)掝}的影響力值最大的第二影響力值;根據(jù)獲取的b個(gè)第二影響力值確定第一影響力閾值;獲取最大的第二影響力值對(duì)應(yīng)的影響用戶(hù)在查詢(xún)區(qū)域的第三影響力值;從歷史第三影響力值中確定最大第三影響力值,若最大第三影響力值大于或等于第一影響力閾值,

      則獲取最大第三影響力值對(duì)應(yīng)的影響用戶(hù)為第一種子用戶(hù)。本發(fā)明通過(guò)上述方法提高了確定種子用戶(hù)的效率。

      附圖說(shuō)明

      為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

      圖1為本發(fā)明的一種種子用戶(hù)確定方法流程圖;

      圖2為本發(fā)明的一種區(qū)域從屬關(guān)系的實(shí)施例;

      圖3為本發(fā)明的后續(xù)種子用戶(hù)確定方法流程圖;

      圖4為以預(yù)設(shè)的區(qū)域從屬關(guān)系作為樹(shù)形節(jié)點(diǎn)的層級(jí)關(guān)系確定的樹(shù)形索引結(jié)構(gòu)。

      具體實(shí)施方式

      為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

      圖1為本發(fā)明的一種種子用戶(hù)確定方法流程圖。如圖1所示,本發(fā)明提供了一種種子用戶(hù)確定方法,包括:

      s110,根據(jù)預(yù)設(shè)的區(qū)域從屬關(guān)系確定a個(gè)最小簽到區(qū)域,其中,所述a為大于等于1的整數(shù)。

      圖2為本發(fā)明的一種區(qū)域從屬關(guān)系的實(shí)施例。圖2中以矩形框范圍劃分所示的區(qū)域從屬關(guān)系,每個(gè)矩形框?yàn)橐话浞秶鷥?nèi)所有簽到位置的最小簽到區(qū)域。具體地,如圖2所示,r3是指包含簽到位置l0、l1、l2的最小簽到區(qū)域,而r3又進(jìn)一步包含r7和r8。r8是由簽到位置l0、l2組成的最小簽到區(qū)域。r7是由簽到位置l1組成的最小簽到區(qū)域。

      本實(shí)施例中s110依據(jù)預(yù)設(shè)的所述區(qū)域從屬關(guān)系來(lái)對(duì)包含簽到位置的最小簽到區(qū)域進(jìn)行確定。該區(qū)域從屬關(guān)系中簽到位置和最小簽到區(qū)域的劃分可以不與實(shí)際地理位置完全對(duì)應(yīng),例如最小簽到區(qū)域r8包含的簽到位置l0為北京,l2為巴基斯坦;r7包含的簽到位置l1為南昌。

      s120,針對(duì)每個(gè)所述最小簽到區(qū)域,獲取所述最小簽到區(qū)域?qū)?yīng)的簽到用戶(hù)和所述簽到用戶(hù)的偏好話題。

      步驟s120中根據(jù)最小簽到區(qū)域可以獲得最小簽到區(qū)域中的簽到用戶(hù),而根據(jù)簽到用戶(hù)則可以對(duì)應(yīng)獲得該用戶(hù)對(duì)應(yīng)的偏好話題和其他信息,參見(jiàn)表1.表1為本發(fā)明的一種簽到用戶(hù)信息表。

      表1

      s130,獲取所述最小簽到區(qū)域的第一影響力列表,所述第一影響力列表包含針對(duì)所述偏好話題對(duì)應(yīng)的簽到用戶(hù)的影響用戶(hù),以及所述影響用戶(hù)對(duì)所述簽到用戶(hù)的影響力值。

      s130中所述獲取所述最小簽到區(qū)域的第一影響力列表具體包括:

      根據(jù)獲取的針對(duì)所述偏好話題的簽到用戶(hù)獲取所述影響用戶(hù);

      根據(jù)所述影響用戶(hù)u對(duì)所述簽到用戶(hù)v的影響因子p(u,v)、所述簽到用戶(hù)v對(duì)所述最小簽到區(qū)域的偏好值γ(v,rj)以及所述簽到用戶(hù)v對(duì)所述話題t的偏好值獲得所述影響用戶(hù)u對(duì)所述簽到用戶(hù)v的影響力值其中,所述是在最小簽到區(qū)域rj中偏好話題t且能被用戶(hù)u影響的簽到用戶(hù)v的集合。在第一影響力列表中對(duì)每個(gè)話題都對(duì)應(yīng)有影響用戶(hù),每個(gè)影響用戶(hù)針對(duì)該話題的影響力值作為一條列表記錄。每個(gè)影響力值σst(u,rj)是一個(gè)影響用戶(hù)u對(duì)該最小簽到區(qū)域rj中所有簽到用戶(hù)v針對(duì)一個(gè)話題t的影響力值。

      對(duì)于每個(gè)最小簽到區(qū)域ri,其中的偏好話題t∈ri.ts都中第一影響力列表中有對(duì)應(yīng)的影響用戶(hù),ri.ts是指所有話題集合ts中屬于最小簽到區(qū)域ri的話題集合,t是指一個(gè)話題。列表是由多個(gè)兩元組構(gòu)成的,其中是對(duì)偏好用戶(hù)集合有影響力的影響用戶(hù)集合,偏好用戶(hù)集合是對(duì)最小簽到區(qū)域ri和話題t有偏好的簽到用戶(hù)集合,是用戶(hù)u對(duì)偏好用戶(hù)集合的影響力。

      可選地,其中其中代表用戶(hù)v對(duì)話題t的偏好值,γ(v,ri)代表用戶(hù)v對(duì)最小簽到區(qū)域ri的偏好值。

      可選地,為每個(gè)用戶(hù)u存儲(chǔ)一個(gè)索引列表該列表是由多個(gè)三元組構(gòu)成的,每一個(gè)三元組對(duì)應(yīng)用戶(hù)u對(duì)在最小簽到區(qū)域ri中簽到且對(duì)話題t有偏好的簽到用戶(hù)v的影響力。

      s140,根據(jù)查詢(xún)區(qū)域、多個(gè)查詢(xún)?cè)掝}和所述區(qū)域從屬關(guān)系,獲取b個(gè)子覆蓋區(qū)域;每個(gè)所述子覆蓋區(qū)域包含一個(gè)最小簽到區(qū)域,和/或,每個(gè)所述子覆蓋區(qū)域包含d個(gè)最小簽到區(qū)域的部分簽到位置;其中,所述最小簽到區(qū)域?qū)?yīng)簽到用戶(hù)的偏好話題,所述偏好話題包含x個(gè)所述查詢(xún)?cè)掝};所述最小簽到區(qū)域的部分簽到位置對(duì)應(yīng)簽到用戶(hù)的偏好話題,所述偏好話題包含y個(gè)所述查詢(xún)?cè)掝},所述b為大于等于2的整數(shù),所述d、x、y分別為大于等于1的整數(shù)。

      具體地,給定查詢(xún)條件q={qr,qt,qk},qr為查詢(xún)區(qū)域,qt為查詢(xún)?cè)掝},qk為查詢(xún)個(gè)數(shù)。首先從圖2所示的區(qū)域從屬關(guān)系的r0開(kāi)始遍歷該區(qū)域從屬關(guān)系,并找到由被查詢(xún)條件完全覆蓋的一個(gè)最小簽到區(qū)域構(gòu)成的子覆蓋區(qū)域rq={r1,...,ri,...rn},其中,子覆蓋區(qū)域且子覆蓋區(qū)域中的偏好話題以及,一個(gè)包括所有沒(méi)有被查詢(xún)條件完全覆蓋的最小簽到區(qū)域的子覆蓋區(qū)域r0,r0=qr-rq

      s151,針對(duì)每個(gè)子覆蓋區(qū)域,獲取所述每個(gè)子覆蓋區(qū)域針對(duì)所述查詢(xún)?cè)掝}的第二影響力列表。

      若所述子覆蓋區(qū)域包含一個(gè)針對(duì)查詢(xún)?cè)掝}的最小簽到區(qū)域,則確定所述第二影響力列表包括:針對(duì)所述查詢(xún)?cè)掝}的簽到用戶(hù)的影響用戶(hù),以及所述影響用戶(hù)對(duì)所述簽到用戶(hù)針對(duì)所述查詢(xún)?cè)掝}的影響力值。對(duì)子覆蓋區(qū)域ri∈rq,每個(gè)子覆蓋區(qū)域ri對(duì)應(yīng)獲得一與第一影響力列表相同的第二影響力列表包含多個(gè)二元組

      其中,是指子覆蓋區(qū)域ri和ri中簽到用戶(hù)的偏好話題與查詢(xún)?cè)掝}qt的交集是影響用戶(hù)u針對(duì)的影響力。可以由第一影響力列表直接獲得。

      在如圖2所示的區(qū)域從屬關(guān)系中,查詢(xún)條件q的查詢(xún)區(qū)域?qū)12、r6完全覆蓋,若查詢(xún)?cè)掝}分別與r12、r6的交集不為空集,則r12、r6為兩個(gè)所述子覆蓋區(qū)域。

      若所述子覆蓋區(qū)域包含d個(gè)針對(duì)查詢(xún)?cè)掝}的最小簽到區(qū)域的部分簽到位置,則確定所述第二影響力列表包括:在所述部分簽到位置針對(duì)所述查詢(xún)?cè)掝}的簽到用戶(hù)的影響用戶(hù),以及所述影響用戶(hù)對(duì)所述簽到用戶(hù)針對(duì)所述查詢(xún)?cè)掝}的影響力值。對(duì)于子覆蓋區(qū)域r0,獲得由多個(gè)二元組組成的第二影響力列表第二影響力列表中包含:

      p(u,v)是影響用戶(hù)u對(duì)偏好子覆蓋區(qū)域r0的簽到用戶(hù)v的影響因子,為簽到用戶(hù)v針對(duì)查詢(xún)?cè)掝}qt的話題偏好值,為簽到用戶(hù)v對(duì)子覆蓋區(qū)域r0中簽到位置的位置偏好值,所述也可以由d個(gè)最小簽到區(qū)域的第一影響力列表中直接獲得。本發(fā)明中所述簽到用戶(hù)在簽到位置簽到,也即是指該簽到用戶(hù)偏好該簽到位置,本發(fā)明不應(yīng)對(duì)這兩種說(shuō)法有區(qū)分。

      在如圖2所示的區(qū)域從屬關(guān)系中,查詢(xún)條件q的查詢(xún)區(qū)域?qū)9的部分簽到位置(簽到位置l5)覆蓋,獲取簽到位置l5上簽到用戶(hù)的偏好話題,若查詢(xún)?cè)掝}與l5上簽到用戶(hù)的偏好話題的交集不為空集,則l5包含于所述子覆蓋區(qū)域r0中。可選地,第二影響力列表也是一個(gè)按照降序排列的列表。

      在一種可選的實(shí)施例中包含b=3個(gè)子覆蓋區(qū)域。表2為一種3個(gè)子覆蓋區(qū)域?qū)?yīng)獲取的3個(gè)第二影響力列表的示例。第二影響力列表中按照的大小降序排列。

      表2

      s152,獲取第二影響力列表中針對(duì)查詢(xún)?cè)掝}的影響力值最大的第二影響力值。

      對(duì)于b個(gè)第二影響力列表選擇每個(gè)第二影響力列表中的第一個(gè)用戶(hù)的影響力值(第二影響力列表中針對(duì)查詢(xún)?cè)掝}的影響力值最大的)作為第二影響力值,即每個(gè)第二影響力列表中的第一個(gè)表2中的3個(gè)第二影響力列表對(duì)應(yīng)的第二影響力值分別為10、30、50。

      s160,根據(jù)獲取的b個(gè)第二影響力值確定所述查詢(xún)區(qū)域的第一影響力閾值

      作為一種可選的第一影響力閾值計(jì)算方法,包括以獲取的所述b個(gè)第二影響力值求和獲得所述第一影響力閾值

      表2中首次獲取的第二影響力值10、30、50對(duì)應(yīng)的首次獲取的第一影響力閾值為90。

      s170,獲取最大的第二影響力值對(duì)應(yīng)的影響用戶(hù)在所述查詢(xún)區(qū)域的第三影響力值。

      具體地,獲取比較這些影響用戶(hù)的第二影響力值,計(jì)算最大第二影響力值的影響用戶(hù)在查詢(xún)區(qū)域上的第三影響力值σst(u,qr)。最大第二影響力值對(duì)應(yīng)的影響用戶(hù)和其在查詢(xún)區(qū)域上的第三影響力值σst(u,qr)加入一動(dòng)態(tài)優(yōu)先隊(duì)列中。動(dòng)態(tài)優(yōu)先隊(duì)列根據(jù)第三影響力值σst(u,qr)實(shí)時(shí)動(dòng)態(tài)降序排列。

      由于第二影響力列表中的影響用戶(hù)都對(duì)目標(biāo)用戶(hù)有影響力,所述目標(biāo)用戶(hù)是在查詢(xún)區(qū)域內(nèi)簽到且偏好至少一個(gè)查詢(xún)?cè)掝}的簽到用戶(hù),因此,根據(jù)這些第二影響力列表,可以快速計(jì)算第二影響力列表中影響用戶(hù)針對(duì)查詢(xún)區(qū)域qr的第三影響力值:

      s180,從歷史獲取的第三影響力值中確定最大第三影響力值,并確定所述最大第三影響力值是否大于或等于所述第一影響力閾值。

      可選地,動(dòng)態(tài)優(yōu)先隊(duì)列中存儲(chǔ)所述歷史獲取的第三影響力值,取動(dòng)態(tài)優(yōu)先隊(duì)列中當(dāng)前的第一個(gè)用戶(hù)的第三影響力值即為所述最大第三影響力值。

      s181,若所述最大第三影響力值大于或等于所述第一影響力閾值,則獲取所述當(dāng)前最大第三影響力值對(duì)應(yīng)的影響用戶(hù)為第一種子用戶(hù)。結(jié)束第一種子用戶(hù)的獲取流程。

      圖3為本發(fā)明的后續(xù)種子用戶(hù)確定方法流程圖。

      如圖3所示,還包括s182,若所述最大第三影響力值小于所述第一影響力閾值,則對(duì)所述第二影響力列表進(jìn)行第一類(lèi)更新;根據(jù)進(jìn)行第一類(lèi)更新后的第二影響力列表,執(zhí)行s152所述獲取在第二影響力列表中針對(duì)查詢(xún)?cè)掝}的影響力值最大的第二影響力值,直到獲取到所述第一種子用戶(hù)。

      可選地,所述對(duì)所述第二影響力列表進(jìn)行第一類(lèi)更新具體包括:從所述第二影響力列表中刪除當(dāng)前的所述第二影響力值。

      由于后續(xù)種子用戶(hù)可能與當(dāng)前已獲得的種子用戶(hù)集合有共同的影響力,因此,需要對(duì)如何選擇第一個(gè)種子用戶(hù)和如何選擇后續(xù)種子用戶(hù)分別求解。

      在查詢(xún)個(gè)數(shù)大于1的情況下,在獲取所述第一種子用戶(hù)之后還包括:

      s210,從所述第二影響力列表中刪除已獲取的種子用戶(hù)獲得新的第二影響力列表,所述已獲取的種子用戶(hù)包含所述第一種子用戶(hù)。

      s220,根據(jù)新的第二影響力列表獲取第二影響力列表中針對(duì)查詢(xún)?cè)掝}的影響力值最大的第四影響力值。

      對(duì)于第二影響力列表選擇每個(gè)第二影響力列表中的第一個(gè)用戶(hù)也即是選擇針對(duì)查詢(xún)?cè)掝}的影響力值最大的,將其作為所述第四影響力值。

      s230,以獲取的b個(gè)第四影響力值之和為所述查詢(xún)區(qū)域的第二影響力閾值。

      s240,獲取所述最大的第四影響力值對(duì)應(yīng)的影響用戶(hù)在所述查詢(xún)區(qū)域的第五影響力值,并將所述第五影響力值確定為初始狀態(tài)。本步驟的計(jì)算方法參見(jiàn)前述步驟s170。將最大第四影響力值對(duì)應(yīng)的影響用戶(hù)和其在查詢(xún)區(qū)域上的第五影響力值σst(u,qr)加入一動(dòng)態(tài)優(yōu)先隊(duì)列中。動(dòng)態(tài)優(yōu)先隊(duì)列根據(jù)第五影響力值σst(u,qr)實(shí)時(shí)動(dòng)態(tài)降序排列。可以選擇是同一個(gè)隊(duì)列,也可以是不同的兩個(gè)隊(duì)列。

      s250,從歷史獲取的第五影響力值中確定最大第五影響力值,并確定所述最大第五影響力值是否大于等于所述第二影響力閾值。

      可選地,動(dòng)態(tài)優(yōu)先隊(duì)列中存儲(chǔ)所述歷史獲取的第五影響力值,取動(dòng)態(tài)優(yōu)先隊(duì)列中當(dāng)前的第一個(gè)用戶(hù)的第五影響力值即為所述最大第五影響力值。

      若所述最大第五影響力值小于所述第二影響力閾值,則執(zhí)行s240,

      若所述最大第五影響力值大于等于所述第二影響力閾值,則進(jìn)入s260。

      如圖3所示,s260進(jìn)一步包括:

      s261,檢測(cè)所述最大第五影響力值的狀態(tài).

      s262,若所述最大第五影響力值為初始狀態(tài),則更新所述最大第五影響力值為估計(jì)狀態(tài),執(zhí)行s250。

      具體地,所述更新所述最大第五影響力值為估計(jì)狀態(tài)的同時(shí)還包括:

      將所述最大第五影響力值更新為其中σst(u,qr)為初始狀態(tài)下的第五影響力,是影響用戶(hù)u對(duì)簽到用戶(hù)v的影響因子的最小值,是在查詢(xún)區(qū)域中針對(duì)查詢(xún)?cè)掝}且被影響用戶(hù)u影響的簽到用戶(hù)v的集合,σst(s,v)是已確定的種子用戶(hù)集合s對(duì)簽到用戶(hù)v在查詢(xún)區(qū)域的影響力值。

      s263,若所述最大第五影響力值為估計(jì)狀態(tài),則更新所述最大第五影響力值為準(zhǔn)確狀態(tài),執(zhí)行s250。

      具體地,所述更新所述最大第五影響力值為準(zhǔn)確狀態(tài)的同時(shí)還包括:

      將所述最大第五影響力值更新為σst({u∪s},q)-σst(s,q),其中所述σst({u∪s},q)為已確定的種子用戶(hù)集合s和估計(jì)狀態(tài)的所述最大第五影響力對(duì)應(yīng)的影響用戶(hù)u在查詢(xún)區(qū)域針對(duì)查詢(xún)?cè)掝}的影響力值,所述σst(s,q)為種子用戶(hù)集合s對(duì)查詢(xún)區(qū)域和查詢(xún)?cè)掝}的影響力值,q為包含查詢(xún)區(qū)域qr和查詢(xún)?cè)掝}qt的查詢(xún)條件。

      s264,若所述最大第五影響力值為準(zhǔn)確狀態(tài),則獲取所述最大第五影響力值對(duì)應(yīng)的影響用戶(hù)為后續(xù)種子用戶(hù)。

      s265,判斷后續(xù)種子用戶(hù)的數(shù)量是否滿(mǎn)足qk-1,所述qk為查詢(xún)個(gè)數(shù)。

      s266,若后續(xù)種子用戶(hù)的數(shù)量滿(mǎn)足qk-1,則確定所述第一種子用戶(hù)和所述后續(xù)種子用戶(hù)為種子用戶(hù)結(jié)合s;

      s267,若后續(xù)種子用戶(hù)的數(shù)量不滿(mǎn)足qk-1,則刪除所述歷史獲取的第五影響力值中所述已獲取的種子用戶(hù)對(duì)應(yīng)的第五影響力值,執(zhí)行s210。直到獲取所述后續(xù)種子用戶(hù)的數(shù)量滿(mǎn)足qk-1。

      對(duì)第五影響力值設(shè)置狀態(tài),根據(jù)狀態(tài)進(jìn)行響應(yīng)的更新計(jì)算,能夠有效地對(duì)加速計(jì)算過(guò)程。準(zhǔn)確狀態(tài)下第五影響力值的計(jì)算的過(guò)程較為繁雜,需要相對(duì)較多的計(jì)算量。而在本方法的s240-s260中,初始狀態(tài)和估計(jì)狀態(tài)相對(duì)較小的影響用戶(hù)可以避開(kāi)準(zhǔn)確狀態(tài)下第五影響力值的計(jì)算,將計(jì)算量集中在當(dāng)前的首個(gè)影響用戶(hù)上,能夠高效地利用計(jì)算資源獲取種子用戶(hù)。

      步驟s250-s260的一種可選實(shí)施例為:

      動(dòng)態(tài)優(yōu)先隊(duì)列中的影響用戶(hù)有三種狀態(tài):“無(wú)效”、“估計(jì)”以及“準(zhǔn)確”,并且中的影響用戶(hù)是按照影響用戶(hù)的第五影響力值降序排列的,新插入中的影響用戶(hù)的狀態(tài)為“初始”。

      選擇中的第一個(gè)用戶(hù)u,并獲取本次循環(huán)的第二影響力閾值

      如果u的狀態(tài)是“初始”且第五影響力值則要計(jì)算u的估計(jì)增量影響力并將u的狀態(tài)更新為“估計(jì)”,自動(dòng)調(diào)整u在中的位置。

      如果u的狀態(tài)是“估計(jì)”且第五影響力值則要計(jì)算u的準(zhǔn)確增量影響力σst(u|s,q)=σst({u∪s},q)-σst(s,q),將u的狀態(tài)更新為“準(zhǔn)確”,并自動(dòng)調(diào)整u在中的位置。

      如果u的狀態(tài)是“準(zhǔn)確”且第五影響力值則用戶(hù)u為當(dāng)前種子用戶(hù)。

      否則,再返回當(dāng)前第二影響力列表中,重新選擇每個(gè)第二影響力列表的第一個(gè)用戶(hù),比較他們的影響力的大小,把影響力最大的用戶(hù)從其列表中取出,并插入到中,重新計(jì)算第二影響力閾值并對(duì)中的第一個(gè)用戶(hù),執(zhí)行上述的過(guò)程。按照這樣的循環(huán)計(jì)算,依次獲取后續(xù)種子用戶(hù)。

      本發(fā)明將確定種子用戶(hù)集合s的問(wèn)題轉(zhuǎn)換為找一個(gè)集合s',使得集合s'中用戶(hù)滿(mǎn)足針對(duì)查詢(xún)區(qū)域和查詢(xún)?cè)掝}的影響力值最大,且集合s'中的成員總量為查詢(xún)個(gè)數(shù),即其中,p(s',v)是集合s'對(duì)簽到用戶(hù)v的影響因子,p(s',v)是通過(guò)網(wǎng)絡(luò)數(shù)據(jù)采集獲得,本發(fā)明不做贅述;用戶(hù)v對(duì)查詢(xún)q的偏好為簽到用戶(hù)v對(duì)查詢(xún)?cè)掝}的偏好值,γ(v,q)為簽到用戶(hù)v對(duì)查詢(xún)區(qū)域包含的簽到位置的偏好值。

      代表簽到用戶(hù)v對(duì)所有偏好話題的話題偏好值,z為用偏好話題的總數(shù),表1所示的實(shí)施例中z為6,qt為查詢(xún)?cè)掝}集合。

      為簽到用戶(hù)v對(duì)查詢(xún)區(qū)域中的簽到位置l的位置偏好值,其中,c(v)代表用戶(hù)v的歷史簽到地點(diǎn)集合,nv(l)代表用戶(hù)v在簽到位置l的簽到次數(shù)。

      作為一種實(shí)現(xiàn)方式,所述根據(jù)預(yù)設(shè)的區(qū)域從屬關(guān)系確定a個(gè)最小簽到區(qū)域包括:

      以所述區(qū)域從屬關(guān)系作為樹(shù)形節(jié)點(diǎn)的層級(jí)關(guān)系確定一樹(shù)形索引,如圖4所示。

      所述樹(shù)形節(jié)點(diǎn)存儲(chǔ)所述最小簽到區(qū)域、所述最小簽到區(qū)域?qū)?yīng)簽到用戶(hù)的偏好話題和至少一指向文檔的指針,所述指針指向的文檔包含所述最小簽到區(qū)域?qū)?yīng)的簽到用戶(hù)、所述簽到用戶(hù)的總簽到次數(shù)、所述簽到用戶(hù)在所述最小簽到區(qū)域中的簽到次數(shù)、所述簽到用戶(hù)的偏好話題及所述用戶(hù)對(duì)所述偏好話題的偏好值。

      圖4為以預(yù)設(shè)的區(qū)域從屬關(guān)系作為樹(shù)形節(jié)點(diǎn)的層級(jí)關(guān)系確定的樹(shù)形索引結(jié)構(gòu)。如圖4,rj為根據(jù)預(yù)設(shè)的區(qū)域從屬關(guān)系確定的最小簽到區(qū)域,j=all,1,2,3,4,5,6。d_*為所述指針指向的文檔,*=0,1,…,14。圖4中的t1,t2,t3,t4,t5,t6為表1中所示的簽到用戶(hù)的偏好話題。圖4中樹(shù)形的節(jié)點(diǎn)分布依據(jù)圖2所示的區(qū)域從屬關(guān)系來(lái)確定。

      給定一個(gè)查詢(xún)條件,目標(biāo)用戶(hù)是對(duì)查詢(xún)位置以及查詢(xún)?cè)掝}有偏好的用戶(hù),設(shè)計(jì)一個(gè)如圖4所示的樹(shù)形索引結(jié)構(gòu),并利用該樹(shù)形索引結(jié)構(gòu),快速得到目標(biāo)用戶(hù)以及計(jì)算他們對(duì)查詢(xún)的偏好值。

      如圖4所示,樹(shù)形索引的結(jié)構(gòu)具體包括:

      1、葉子節(jié)點(diǎn)o:是由多個(gè)實(shí)體e組成的,每個(gè)實(shí)體包含一個(gè)三元組<pd,m,ts>,其中pd代表該實(shí)體指向文檔d的指針,m代表該實(shí)體上所有位置組成的最小簽到區(qū)域rj,ts代表該實(shí)體的話題集合。表3為本發(fā)明的最小簽到區(qū)域r3對(duì)應(yīng)節(jié)點(diǎn)指向的文檔示例。如表3所示,實(shí)體e指向的文檔d包含以下四部分:

      u:對(duì)實(shí)體e的m和ts有偏好的用戶(hù)集合;

      tv:簽到用戶(hù)的話題偏好向量;

      tn:簽到用戶(hù)所有簽到的位置以及總次數(shù);

      ln:簽到用戶(hù)在m內(nèi)簽到的次數(shù)。

      除此之外,葉子節(jié)點(diǎn)o還有一個(gè)指向文檔o.d的指針,該文檔o.d是通過(guò)合并所有屬于葉子節(jié)點(diǎn)o的實(shí)體的文檔構(gòu)造的。o.d也由上述四部分組成。

      表3

      2、非葉子節(jié)點(diǎn)n:是由多個(gè)實(shí)體組成的,每個(gè)實(shí)體包含一個(gè)三元祖<pc,m,ts>,其中,pc代表指向孩子節(jié)點(diǎn)的指針,m代表該實(shí)體其所有孩子節(jié)點(diǎn)的最小簽到區(qū)域,ts代表該實(shí)體其所有孩子節(jié)點(diǎn)的話題集合的交集。一個(gè)非葉子節(jié)點(diǎn)也包含一個(gè)指針指向文檔n.d,該文檔是通過(guò)合并所有孩子節(jié)點(diǎn)的文檔構(gòu)造的。其構(gòu)造過(guò)程和葉子節(jié)點(diǎn)的文檔的構(gòu)造過(guò)程類(lèi)似。

      最后應(yīng)說(shuō)明的是:以上各實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。

      當(dāng)前第1頁(yè)1 2 
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1