国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      關(guān)系模型的確定方法及裝置的制造方法

      文檔序號:9217156閱讀:764來源:國知局
      關(guān)系模型的確定方法及裝置的制造方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及統(tǒng)計技術(shù)領(lǐng)域,特別涉及一種關(guān)系模型的確定方法及裝置。
      【背景技術(shù)】
      [0002] 隨著統(tǒng)計技術(shù)的不斷發(fā)展,對對象間的關(guān)系信息進行建模成為了一個熱點問題。 其中,對象間的關(guān)系信息多種多樣,例如被調(diào)查人群中人與人之間的聯(lián)系信息,因特網(wǎng)上 頁面與頁面之間的鏈接關(guān)系信息等等。各種各樣的關(guān)系信息描述了一類對象內(nèi)的相互關(guān) 系或是多類對象間的關(guān)系,通過對關(guān)系信息進行分析,可以獲得很多有價值的信息。也正 因為如此,基于關(guān)系信息的應用種類越來越多,將不同樣本數(shù)據(jù)根據(jù)關(guān)系信息進行關(guān)系聚 類即是其中的一種。而在關(guān)系聚類的過程中,通常會用到關(guān)系模型。例如,如果某電影公司 想要獲取用戶對當前上映的一系列電影的評價,則收集一批用戶對上映的一系列電影的評 分,通過關(guān)系模型將用戶和電影分到不同的樣本類別內(nèi),實現(xiàn)對用戶、電影和電影評分同時 進行聚類,從而通過聚類結(jié)果進行電影評價分析。因此,如何確定關(guān)系模型成為了目前研究 關(guān)系聚類的關(guān)鍵。
      [0003] 在實際應用中,關(guān)系模型由隱變量的變分分布和模型參數(shù)確定。隱變量是指不 能被直接觀測到,而需要通過樣本數(shù)據(jù)推導得出的變量,隱變量的變分分布用于描述樣 本數(shù)據(jù)被聚類到對應類別的概率;模型參數(shù)用于描述每個類別下子模型的參數(shù)。目前,文 章 Variational Bayesian inference and complexity control for stochastic block models, Latouche et al.,Statistical Modelling, 2012 中給出了一種針對網(wǎng)絡數(shù)據(jù)提出 的確定隱變量的變分分布和模型參數(shù)的方式。該方式下,首先,獲取根據(jù)觀測數(shù)據(jù)、隱變量 及模型參數(shù)確定的對數(shù)似然及隱變量的變分分布的對數(shù);其次,根據(jù)對數(shù)似然及隱變量的 變分分布的對數(shù)確定目標函數(shù),并確定使目標函數(shù)收斂的隱變量的變分分布及模型參數(shù), 而該使目標函數(shù)收斂的隱變量的變分分布及模型參數(shù)即可作為用于確定關(guān)系模型的隱變 量的變分分布及模型參數(shù)。
      [0004] 在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題:
      [0005] 由于上述確定關(guān)系模型的方式針對的是網(wǎng)絡數(shù)據(jù),而網(wǎng)絡數(shù)據(jù)是一類對象間的相 互關(guān)系,因而可以通過一個隱變量來實現(xiàn),導致根據(jù)上述方式得到的隱變量的變分分布及 模型參數(shù)所確定的關(guān)系模型的應用范圍具有一定的局限性;此外,由于目標函數(shù)根據(jù)對數(shù) 似然的期望值及隱變量的變分分布的對數(shù)的期望值確定,因而通過該種目標函數(shù)所確定的 關(guān)系模型的復雜度較高。

      【發(fā)明內(nèi)容】

      [0006] 為了解決現(xiàn)有技術(shù)的問題,本發(fā)明實施例提供了一種關(guān)系模型的確定方法及裝 置。所述技術(shù)方案如下:
      [0007] 第一方面,提供了一種關(guān)系模型的確定方法,所述方法包括:
      [0008] 獲取根據(jù)樣本數(shù)據(jù)、至少兩個隱變量及模型參數(shù)確定的對數(shù)似然、正則項及各個 隱變量的變分分布的對數(shù),每個隱變量用于說明樣本數(shù)據(jù)所屬樣本類別;
      [0009] 根據(jù)所述對數(shù)似然、正則項及各個隱變量的變分分布的對數(shù)確定目標函數(shù);
      [0010] 確定使所述目標函數(shù)收斂的各個隱變量的變分分布及模型參數(shù),根據(jù)使所述目標 函數(shù)收斂的各個隱變量的變分分布及模型參數(shù)確定關(guān)系模型。
      [0011] 結(jié)合第一方面,在第一方面的第一種可能的實現(xiàn)方式中,根據(jù)所述樣本數(shù)據(jù)、至少 兩個隱變量及模型參數(shù)確定的對數(shù)似然為:
      [0013] 其中,所述logpO表示對數(shù)似然,所述P表示聯(lián)合概率密度函數(shù),所述夂為樣 本數(shù)據(jù),所述d為樣本數(shù)據(jù)的維度,所述Ni為第1維樣本數(shù)據(jù)的個數(shù),所述Nd為第d維樣本 數(shù)據(jù)的個數(shù),所述Z1為第1維樣本數(shù)據(jù)的隱變量,所述Zd為第d維樣本數(shù)據(jù)的隱變量,所述 0為模型參數(shù)的集合,所述模型參數(shù)包括a\...,ad,- ?所述a1為第1維的混合比率, 所述ad為第d維的混合比率,所述P表示模型參數(shù)。
      [0014] 結(jié)合第一方面,在第一方面的第二種可能的實現(xiàn)方式中,根據(jù)樣本數(shù)據(jù)、至少兩個 隱變量及模型參數(shù)確定的正則項為:
      [0016] 其中,所述d為樣本數(shù)據(jù)的維度,所述Ni為第1維樣本數(shù)據(jù)的個數(shù),所述Nd為第d維樣本數(shù)據(jù)的個數(shù),所述隊為第i維樣本數(shù)據(jù)的個數(shù),所述&是第1維樣本類別的個數(shù), 所述Kd是第d維樣本類別的個數(shù);所述f ( >為隱變量的變分分布的近似值,所述為第 1維第i個樣本數(shù)據(jù)所在第Pl個樣本類別的隱變量,所述為第d維第jd個樣本數(shù)據(jù) 所在第Pd個樣本類別的隱變量;所述a1為第i維的混合比率,所述為所述a1的維度, 所述1&為第1維第Pl個樣本類別、…第d維第pd個樣本類別內(nèi)的子模型參數(shù)的維度, L(a,b)=logb+(a_b)/b,所述a為
      >
      [0017] 結(jié)合第一方面,在第一方面的第三種可能的實現(xiàn)方式中,根據(jù)所述樣本數(shù)據(jù)、至少 兩個隱變量及模型參數(shù)確定的各個隱變量的變分分布的對數(shù)為:
      [0018]logqO,…logq(Zd);
      [0019] 其中,所述q(Z1)為隱變量ZK的變分分布,所述q(Zd)為隱變量Ze的變分分布。 [0020] 結(jié)合第一方面至第一方面的第三種可能的實現(xiàn)方式中的任一種可能的實現(xiàn)方式, 在第一方面的第四種可能的實現(xiàn)方式中,所述根據(jù)所述對數(shù)似然、正則項及各個隱變量的 變分分布的對數(shù)確定目標函數(shù),包括:
      [0021] 根據(jù)所述對數(shù)似然的期望值、所述正則項的期望值及所述各個隱變量的變分分布 的對數(shù)的期望值確定目標函數(shù)。
      [0022] 結(jié)合第一方面的第四種可能的實現(xiàn)方式,在第一方面的第五種可能的實現(xiàn)方式 中,根據(jù)所述對數(shù)似然的期望值、所述正則項的期望值及所述各個隱變量的變分分布的對 數(shù)的期望值確定的目標函數(shù)rb,gWv' 1為:
      [0024] 結(jié)合第一方面的第五種可能的實現(xiàn)方式,在第一方面的第六種可能的實現(xiàn)方式 中,所述確定使所述目標函數(shù)收斂的各個隱變量的變分分布及模型參數(shù),包括:
      [0025] 獲取更新的各個隱變量的變分分布及更新的模型參數(shù);
      [0026] 根據(jù)更新的各個隱變量的變分分布及更新的模型參數(shù)確定所述目標函數(shù)是否收 斂,如果所述目標函數(shù)未收斂,則重新獲取更新的各個隱變量的變分分布及更新的模型參 數(shù),直至得到使所述目標函數(shù)收斂的各個隱變量的變分分布及模型參數(shù)。
      [0027] 結(jié)合第一方面的第六種可能的實現(xiàn)方式,在第一方面的第七種可能的實現(xiàn)方式 中,所述獲取更新的各個隱變量的變分分布及更新的模型參數(shù),包括:
      [0028] 按照如下公式交替更新各個隱變量的變分分布,直至得到收斂的更新的各個隱變 量的變分分布:
      [0032] 根據(jù)更新的各個隱變量的變分分布按照如下公式更新模型參數(shù),得到更新的模型 參數(shù):
      述t代表當前更新,所述t_l代表上一次更新或初始化。
      [0036] 結(jié)合第一方面的第六種可能的實現(xiàn)方式,在第一方面的第八種可能的實現(xiàn)方式 中,所述獲取更新的各個隱變量的變分分布及更新的模型參數(shù),包括:
      [0037] 按照如下公式更新模型參數(shù),得到更新的模型參數(shù):
      [0041] 根據(jù)更新的模型參數(shù)按照如下公式交替更新各個隱變量的變分分布,得到收斂的 更新的各個隱變量的變分分布:
      [0045] 其中,所述t代表當前更新,所述t_l代表上一次更新或初始化。
      [0046] 結(jié)合第一方面的第六種至第八種可能的實現(xiàn)方式中任一種可能的實現(xiàn)方式,在第 一方面的第九種可能的實現(xiàn)方式中,所述根據(jù)更新的各個隱變量的變分分布及更新的模型 參數(shù)確定所述目標函數(shù)是否收斂,包括:
      [0047] 比較根據(jù)更新的各個隱變量的變分分布及更新的模型參數(shù)確定的目標函數(shù)與上 一次得到的目標函數(shù)之間的距離是否小于閾值,所述上一次得到的目標函數(shù)根據(jù)上一次更 新的各個隱變量的變分分布及更新的模型參數(shù)確定;
      [0048] 如果根據(jù)更新的各個隱變量的變分分布及更新的模型參數(shù)確定的目標函數(shù)與上 一次得到的目標函數(shù)之間的距離小于閾值,則確定所述目標函數(shù)收斂。
      [0049] 第二方面,提供了一種關(guān)系模型的確定裝置,所述裝置包括:
      [0050] 獲取模塊,用于獲取根據(jù)樣本數(shù)據(jù)、至少兩個隱變量及模型參數(shù)確定的對數(shù)似然、 正則項及各個隱變量的變分分布的對數(shù),每個隱變量用于說明樣本數(shù)據(jù)所屬樣本類別;
      [0051] 第一確定模塊,用于根據(jù)所述對數(shù)似然、正則項及各個隱變量的變分分布的對數(shù) 確定目標函數(shù);
      [0052] 第二確定模塊,用于確定使所述目標函數(shù)收斂的各個隱變量的變分分布及模型參 數(shù);
      [0053] 第三確定模塊,用于根據(jù)使所述目標函數(shù)收斂的各個隱變量的變分分布及模型參 數(shù)確定關(guān)系模型。
      [0054] 結(jié)合第二方面,在第二方面的第一種可能的實現(xiàn)方式中,所述獲取模塊獲取到的 對數(shù)似然為:
      [0056] 其中,所述logp ()表示對數(shù)似然,所述p表示聯(lián)合概率密度函數(shù),所述rVi ?夂為樣 本數(shù)據(jù),所述d為樣本數(shù)據(jù)的維度,所述&為第1維樣本數(shù)據(jù)的個數(shù),所述Nd為第d維樣本 數(shù)據(jù)的個數(shù),所述Z 1為第1維樣本數(shù)據(jù)的隱變量,所述Zd為第d維樣本數(shù)據(jù)的隱變量,所述 0為模型參數(shù)的集合,所述模型參數(shù)包括a \ ...,a d,P,所述a 1為第1維的混合比率, 所述ad為第d維的混合比率,所述f?表示模型參數(shù)。
      [0057] 結(jié)合第二方面,在第二方面的第二種可能的實現(xiàn)方式中,所述獲取模塊獲取到的 正則項為:
      [0059] 其中,所述d為樣本數(shù)據(jù)的維度,所述&為第1維樣本數(shù)據(jù)的個數(shù),所述Nd為第d 維樣本數(shù)據(jù)的個數(shù),所述隊為第i維樣本數(shù)據(jù)的個數(shù),所述&是第1維樣本類別的個數(shù), 所述K d是第d維樣本類別的個數(shù);所述f I; >為隱變量的變分分布的近似值,所述Zj|n為第 1維第^個樣本數(shù)據(jù)所在第Pl個樣本類別的隱變量,所述為第d維第j d個樣本數(shù)據(jù) 所在第Pd個樣本類別的隱變量;所述a 1為第i維的混合比率,所述為所述a 1的維度, 所述&為第1維第Pl個樣本類別、…第d維第pd個樣本類別內(nèi)的子模型參數(shù)的維度, L (a, b) =logb+ (a_b) /b,所述 a 為
      [0060] 結(jié)合第二方面,在第二方面的第三種可能的實現(xiàn)方式中,所述獲取模塊獲取到的 各個隱變量的變分分布的對數(shù)為:
      [0061] logqG1),…logq(Zd);
      [0062] 其中,所述q (Z1)為隱變量ZK的變分分布,所述q (Zd)為隱變量Ze的變分分布。
      [0063] 結(jié)合第二方面至第二方面的第三種可能的實現(xiàn)方式中任一種可能的實現(xiàn)方式,在 第二方面的第四種可能的實現(xiàn)方式中,所述第一確定模塊,用于根據(jù)所述對數(shù)似然的期望 值、所述正則項的期望值及所述各個隱變量的變分分布的對數(shù)的期望值確定目標函數(shù)。 [0064] 結(jié)合第二方面的第四種可能的實現(xiàn)方式,在第二方面的第五種可能的實現(xiàn)方式 中,所述第一確定模塊確定的目標函數(shù)氣,為:
      [0066] 結(jié)合第二方面的第五種可能的實現(xiàn)方式,在第二方面的第六種可能的實現(xiàn)方式 中,所述第二確定模塊,包括:
      [0067] 獲取單元,獲取更新的各個隱變量的變分分布及更新的模型
      當前第1頁1 2 3 4 5 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1