本發(fā)明涉及一種計(jì)算系統(tǒng)及方法,特別是涉及一種基于隨機(jī)游走人員親密度的計(jì)算系統(tǒng)及方法。
背景技術(shù):
隨機(jī)游走模型的基本思想是,從一個(gè)或一系列頂點(diǎn)開(kāi)始遍歷一張圖,在任意一個(gè)頂點(diǎn),遍歷者將以概率1-A游走到這個(gè)頂點(diǎn)的鄰居頂點(diǎn),以概率A隨機(jī)跳躍(teleport)到圖中的任何一個(gè)頂點(diǎn),稱(chēng)A為跳轉(zhuǎn)發(fā)生概率。每次游走后得出一個(gè)概率分布,該概分布刻畫(huà)了圖中每一個(gè)頂點(diǎn)被訪問(wèn)到的概率,用這個(gè)概率分布作為下一次游走的輸入并反復(fù)迭代這一過(guò)程當(dāng),滿足一定前提條件時(shí)這個(gè)概率分布會(huì)趨于收斂收斂即可以得到一個(gè)穩(wěn)定的概率分布。在數(shù)據(jù)挖掘領(lǐng)域,傳統(tǒng)的都是利用隨機(jī)游走模型,構(gòu)造大量數(shù)據(jù),根據(jù)隨機(jī)游走數(shù)據(jù)分布特征,解決一些多標(biāo)簽分類(lèi)問(wèn)題、判斷證券價(jià)格走勢(shì)等。然而,這些方法需要構(gòu)建大量數(shù)據(jù),容易造成數(shù)據(jù)冗余,計(jì)算量大,耗時(shí)耗材。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種基于隨機(jī)游走人員親密度的計(jì)算系統(tǒng)及方法,其能夠通過(guò)對(duì)隨機(jī)游走算法的改進(jìn),使該方法執(zhí)行效率更高,更加節(jié)省資源;通過(guò)使用最終收斂的轉(zhuǎn)移矩陣作為親密度的衡量,將人與人之間的關(guān)系更加準(zhǔn)確。
本發(fā)明是通過(guò)下述技術(shù)方案來(lái)解決上述技術(shù)問(wèn)題的:一種基于隨機(jī)游走人員親密度的計(jì)算系統(tǒng),其包括語(yǔ)義網(wǎng)絡(luò)引擎模塊、親密度計(jì)算推薦引擎模塊,語(yǔ)義網(wǎng)絡(luò)引擎模塊與親密度計(jì)算推薦引擎模塊相連,其中語(yǔ)義網(wǎng)絡(luò)引擎模塊包括數(shù)據(jù)抽取模塊、關(guān)系權(quán)重自動(dòng)識(shí)別器模塊,數(shù)據(jù)抽取模塊與關(guān)系權(quán)重自動(dòng)識(shí)別器模塊相連;親密度計(jì)算推薦引擎模塊包括添加阻尼系數(shù)的隨機(jī)游走訓(xùn)練模塊、馬爾可夫矩陣收斂性能評(píng)估模塊,添加阻尼系數(shù)的隨機(jī)游走訓(xùn)練模塊與馬爾可夫矩陣收斂性能評(píng)估模塊相連。
優(yōu)選地,所述數(shù)據(jù)抽取模塊從實(shí)體庫(kù)、屬性庫(kù)、關(guān)系庫(kù)中將數(shù)據(jù)抽取到分布式圖形數(shù)據(jù)庫(kù)中。
優(yōu)選地,所述關(guān)系權(quán)重自動(dòng)識(shí)別器模塊將分布式圖形數(shù)據(jù)庫(kù)中的數(shù)據(jù)按照權(quán)重進(jìn)行計(jì)算形成多圖模型的建立。
優(yōu)選地,所述添加阻尼系數(shù)的隨機(jī)游走訓(xùn)練模塊使用隨機(jī)游走訓(xùn)練算法,將多圖模型的數(shù)據(jù)對(duì)相關(guān)人員進(jìn)行處理,形成一個(gè)親密度關(guān)系矩陣。
優(yōu)選地,所述馬爾可夫矩陣收斂性能評(píng)估模塊做為對(duì)隨機(jī)游走訓(xùn)練模塊形成的矩陣進(jìn)行正確性驗(yàn)證,驗(yàn)證完成后形成最終親密度矩陣。
本發(fā)明還提供一種基于隨機(jī)游走人員親密度的計(jì)算方法,其包括以下步驟:
步驟一,抽取、清洗數(shù)據(jù),構(gòu)建包含人物實(shí)體與屬性實(shí)體,以及實(shí)體與實(shí)體間的語(yǔ)義網(wǎng)絡(luò);
步驟二,通過(guò)對(duì)權(quán)重的匹配計(jì)算形成多圖模型;
步驟三,對(duì)整個(gè)語(yǔ)義網(wǎng)絡(luò)使用改進(jìn)的隨機(jī)游走算法進(jìn)行計(jì)算;
步驟四,使用最終收斂的轉(zhuǎn)移矩陣作為親密度的衡量。
本發(fā)明的積極進(jìn)步效果在于:本發(fā)明能夠通過(guò)實(shí)體庫(kù)、屬性庫(kù)、關(guān)系庫(kù),分布式圖形數(shù)據(jù)庫(kù)、關(guān)系權(quán)重自動(dòng)識(shí)別器和關(guān)系權(quán)重規(guī)則器,構(gòu)建一個(gè)大型語(yǔ)義網(wǎng)絡(luò);通過(guò)人與人之間關(guān)系既有直接關(guān)系,以及間接關(guān)系構(gòu)建一個(gè)親密度關(guān)系矩陣;在矩陣構(gòu)建成功后,可以使用到不同的應(yīng)用場(chǎng)景,使查詢?nèi)穗H關(guān)系更加便捷。
附圖說(shuō)明
圖1為本發(fā)明的結(jié)構(gòu)示意圖。
圖2為本發(fā)明的流程圖。
具體實(shí)施方式
下面結(jié)合附圖給出本發(fā)明較佳實(shí)施例,以詳細(xì)說(shuō)明本發(fā)明的技術(shù)方案。
如圖1所示,本發(fā)明基于隨機(jī)游走人員親密度的計(jì)算系統(tǒng)包括語(yǔ)義網(wǎng)絡(luò)引擎模塊、親密度計(jì)算推薦引擎模塊,語(yǔ)義網(wǎng)絡(luò)引擎模塊與親密度計(jì)算推薦引擎模塊相連,其中:
語(yǔ)義網(wǎng)絡(luò)引擎模塊包括數(shù)據(jù)抽取模塊、關(guān)系權(quán)重自動(dòng)識(shí)別器模塊,數(shù)據(jù)抽取模塊與關(guān)系權(quán)重自動(dòng)識(shí)別器模塊相連;
親密度計(jì)算推薦引擎模塊包括添加阻尼系數(shù)的隨機(jī)游走訓(xùn)練模塊、馬爾可夫矩陣收斂性能評(píng)估模塊,添加阻尼系數(shù)的隨機(jī)游走訓(xùn)練模塊與馬爾可夫矩陣收斂性能評(píng)估模塊相連。
所述數(shù)據(jù)抽取模塊從實(shí)體庫(kù)、屬性庫(kù)、關(guān)系庫(kù)中將數(shù)據(jù)抽取到分布式圖形數(shù)據(jù)庫(kù)中。
所述關(guān)系權(quán)重自動(dòng)識(shí)別器模塊將分布式圖形數(shù)據(jù)庫(kù)中的數(shù)據(jù)按照權(quán)重進(jìn)行計(jì)算形成多圖模型的建立。
所述添加阻尼系數(shù)的隨機(jī)游走訓(xùn)練模塊使用隨機(jī)游走訓(xùn)練算法,將多圖模型的數(shù)據(jù)對(duì)相關(guān)人員進(jìn)行處理,形成一個(gè)親密度關(guān)系矩陣。
所述馬爾可夫矩陣收斂性能評(píng)估模塊做為對(duì)隨機(jī)游走訓(xùn)練模塊形成的矩陣進(jìn)行正確性驗(yàn)證,驗(yàn)證完成后形成最終親密度矩陣。
如圖2所示,本發(fā)明基于隨機(jī)游走人員親密度的計(jì)算方法包括以下步驟:
步驟S1,抽取、清洗數(shù)據(jù),構(gòu)建包含人物實(shí)體與屬性實(shí)體,以及實(shí)體與實(shí)體間的語(yǔ)義網(wǎng)絡(luò);將數(shù)據(jù)從外部數(shù)據(jù)庫(kù)中抽取,清洗,然后存入分布式圖形數(shù)據(jù)庫(kù)中將模型持久化存儲(chǔ);
步驟S2,通過(guò)對(duì)權(quán)重的匹配計(jì)算形成多圖模型;將分布式圖形數(shù)據(jù)庫(kù)中的多圖模型與權(quán)重庫(kù)中設(shè)置的計(jì)算權(quán)重進(jìn)行匹配、計(jì)算形成多圖模型;
步驟S3,對(duì)整個(gè)語(yǔ)義網(wǎng)絡(luò)使用改進(jìn)的隨機(jī)游走算法進(jìn)行計(jì)算;通過(guò)對(duì)隨機(jī)算法改進(jìn),對(duì)步驟S2形成的多圖模型進(jìn)行計(jì)算,形成一個(gè)人員親密度關(guān)系矩陣;
步驟S4,使用最終收斂的轉(zhuǎn)移矩陣作為親密度的衡量;主要是對(duì)步驟S3形成的矩陣進(jìn)行衡量,衡量計(jì)算出現(xiàn)不穩(wěn)定情況將會(huì)停止,如果是穩(wěn)定矩陣那么就將穩(wěn)定的矩陣關(guān)系存入數(shù)據(jù)庫(kù)中。
以上所述的具體實(shí)施例,對(duì)本發(fā)明的解決的技術(shù)問(wèn)題、技術(shù)方案和有益效果進(jìn)行了進(jìn)一步詳細(xì)說(shuō)明,所應(yīng)理解的是,以上所述僅為本發(fā)明的具體實(shí)施例而已,并不用于限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。