国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于社群潛在主題挖掘的自動(dòng)圖像標(biāo)注的方法

      文檔序號(hào):6575842閱讀:308來源:國知局
      專利名稱:基于社群潛在主題挖掘的自動(dòng)圖像標(biāo)注的方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及圖像的自動(dòng)標(biāo)注領(lǐng)域,尤其涉及一種基于社會(huì)共享網(wǎng)絡(luò)的圖像自動(dòng)標(biāo)注的方法。
      背景技術(shù)
      We隨著網(wǎng)絡(luò)和多媒體技術(shù)的迅猛發(fā)展,互聯(lián)網(wǎng)上的圖像數(shù)量呈爆炸性增長。據(jù)統(tǒng)計(jì),2008年,Google己索引Web網(wǎng)頁規(guī)模達(dá)到1萬億,其中圖像數(shù)據(jù)超過幾十億張。近年來,共享網(wǎng)絡(luò)引起了互聯(lián)網(wǎng)用戶的特別關(guān)注,在提供數(shù)字圖像共享的大眾標(biāo)注網(wǎng)站Flickr上,其索引的圖像已超過30億張,并以每月幾百萬張的速度快速增長。
      互聯(lián)網(wǎng)用戶為Flickr圖像手工添加的圖像標(biāo)簽信息為圖像的高效管理和檢索帶來了極大便利。但是,通過對(duì)Flickr圖像手工標(biāo)注的結(jié)果進(jìn)行深入分析發(fā)現(xiàn),64%圖像的標(biāo)簽均少于或等于3個(gè)。如何對(duì)大量無標(biāo)簽或者標(biāo)簽不足的圖像自動(dòng)添加或完善其所具有標(biāo)簽是當(dāng)前研究的熱點(diǎn)問題。
      與普通圖像不同,互聯(lián)網(wǎng)共享圖像具有如下幾個(gè)特點(diǎn)
      .共享網(wǎng)絡(luò)圖像質(zhì)量參差不齊,由不同用戶通過不同相機(jī)在不同時(shí)間從不同的角度或使用不同拍照技巧拍攝得到;
      .共享網(wǎng)絡(luò)圖像內(nèi)容豐富,F(xiàn)lickr圖像的標(biāo)簽詞條已超過了 1億3千萬條,
      涵蓋了6千多萬概念,囊括了風(fēng)景、建筑、人物肖像、活動(dòng)剪輯等多樣的內(nèi)容、事件和對(duì)象等等;
      共享網(wǎng)絡(luò)圖像語義復(fù)雜, 一張圖像往往同時(shí)包含多個(gè)不同的主題信息,比如一張圖像可能既包含了"Sky"、 "Clouds,,等主題信息,同時(shí)也包含了"Water"、"River"等主題信息。
      由于共享網(wǎng)絡(luò)圖像具有上述特點(diǎn),因此難以使用傳統(tǒng)算法對(duì)其進(jìn)行有效標(biāo)注。深入分析Flickr上的共享圖像可發(fā)現(xiàn)一個(gè)顯著特征當(dāng)用戶根據(jù)時(shí)間、地點(diǎn)或者事件將圖像上傳到個(gè)人相冊(cè)后,會(huì)進(jìn)一步根據(jù)圖像主題將其推薦到相應(yīng)社群中去。Flickr中的社群是指包含某一特定主題的圖像集合,當(dāng)用戶上傳不符合社群主題的圖像到社群上時(shí),管理員會(huì)刪除這些無關(guān)圖像,這就保證了社群圖像主題上的一致性。因此,可利用圖像所在社群的主題信息對(duì)圖像進(jìn)行標(biāo)注。同時(shí),針對(duì)某一社群主題又可進(jìn)一步細(xì)分為多個(gè)子主題的事實(shí),可對(duì)社群進(jìn)行隱含主題挖掘,然后結(jié)合圖像視覺相似性最終取得更精細(xì)的標(biāo)注結(jié)果。

      發(fā)明內(nèi)容
      本發(fā)明的目的是克服現(xiàn)有技術(shù)的不足,提供一種基于社群潛在主題挖掘的自動(dòng)圖像標(biāo)注的方法。
      基于社群潛在主題挖掘的自動(dòng)圖像標(biāo)注的方法包括如下步驟
      1) 采用隱狄利克雷分配模型對(duì)單個(gè)社群里的隱含主題進(jìn)行挖掘;
      2) 通過對(duì)社群潛在主題分析得到圖像標(biāo)簽和隱含主題的概率分布后,刪除社群圖像標(biāo)簽和隱含主題概率小于設(shè)定值A(chǔ)的圖像標(biāo)簽來對(duì)社群圖像標(biāo)簽進(jìn)行"去噪"過濾;
      3) 通過相似圖像標(biāo)簽傳播產(chǎn)生待標(biāo)注圖像的圖像候選標(biāo)注標(biāo)簽;
      4) 根據(jù)圖像候選標(biāo)注標(biāo)簽與圖像的隱含主題之間相關(guān)性對(duì)圖像候選標(biāo)注標(biāo)簽進(jìn)行優(yōu)化;
      5) 通過多社群信息融合得到圖像最終標(biāo)注結(jié)果。
      所述的通過相似圖像標(biāo)簽傳播產(chǎn)生待標(biāo)注圖像的圖像候選標(biāo)注標(biāo)簽的步驟對(duì)于社群中一張待標(biāo)注圖像/ ,待標(biāo)注圖像/ 和圖像標(biāo)簽w之間的概率從以下的公式計(jì)算得到iWJ-SP^/J^-S/WW",^),其中尸(HJ)表示訓(xùn)練圖像中圖像標(biāo)簽W出現(xiàn)次數(shù)r尸(/,,|力表#〈待標(biāo)注圖像/ 和訓(xùn)練圖像J之間的視覺相似性,選取與待標(biāo)注圖像4視覺相似性最高的10幅訓(xùn)練圖像/所對(duì)應(yīng)的圖像標(biāo)簽w作為待標(biāo)注圖像A的候選標(biāo)注標(biāo)簽,即/5 |/,,)值最大的IO個(gè)圖像標(biāo)簽w作為待標(biāo)注圖像/ 的圖像候選標(biāo)注標(biāo)簽。
      所述的根據(jù)圖像候選標(biāo)注標(biāo)簽與圖像的隱含主題之間相關(guān)性對(duì)圖像候選標(biāo)注標(biāo)簽進(jìn)行優(yōu)化的步驟
      1) 通過計(jì)算所有隱含主題中兩個(gè)圖像候選標(biāo)注標(biāo)簽之間概率乘積的和得到
      圖像候選標(biāo)注標(biāo)簽W和W之間的隱含主題相似性,計(jì)算公式為
      尸(Wl"卜iPKIz"')戶("j1w,hi^)/,其中0表示圖像標(biāo)簽和隱含主題的概率分產(chǎn)i
      布;
      2) 通過計(jì)算圖像候選標(biāo)注標(biāo)簽和其它圖像候選標(biāo)注標(biāo)簽之間的隱含主題相關(guān)性之和得到圖像候選標(biāo)注標(biāo)簽w,.和待標(biāo)注圖像/ 的隱含主題的相關(guān)性,計(jì)算
      公式為Mw,,/,,)^^'"'""'',其中k)表示圖像候選標(biāo)注標(biāo)簽巧和W,之間的隱含主題相似性;
      3) 重新計(jì)算圖像候選標(biāo)注標(biāo)簽^和待標(biāo)注圖像的概率,計(jì)算公式為|/ ) = />~, |/,,)*11(1",/ ),其中/^|/ )表示待標(biāo)注圖像/ 和圖像標(biāo)簽W,.之間的概
      率,11(^,,/,,)表示圖像候選標(biāo)注標(biāo)簽W,和待標(biāo)注圖像/ 的隱含主題的相關(guān)性。所述的通過多社群信息融合對(duì)圖像進(jìn)行最終的標(biāo)注的步驟 1 )通過從每個(gè)社群的標(biāo)題中選取在社群里出現(xiàn)最頻繁的圖像標(biāo)簽來代表社
      群的主題,然后通過這個(gè)圖像標(biāo)簽就在WordNet的"entity"語義樹中找到代表該 社群的節(jié)點(diǎn),構(gòu)成各個(gè)社群之間的層次相關(guān)性;
      2) 通過各個(gè)社群之間的層次相關(guān)性,對(duì)各個(gè)社群從下到上依次通過融合對(duì) 圖像進(jìn)行最終的標(biāo)注,對(duì)于含有共同祖先節(jié)點(diǎn)的各個(gè)社群之間通過對(duì)各子節(jié)點(diǎn) 社群的標(biāo)注信息求平均值得到一個(gè)新的父節(jié)點(diǎn),刪除子節(jié)點(diǎn),達(dá)到融合的目的;
      3) 通過選取圖像候選標(biāo)注標(biāo)簽前5個(gè)值得到待標(biāo)注圖像的最終標(biāo)注結(jié)果。 本發(fā)明充分利用了圖像所在的不同的社群的信息,以及利用社群所在的潛
      在主題信息來對(duì)標(biāo)注標(biāo)簽進(jìn)行"去噪"和優(yōu)化,因此比傳統(tǒng)的標(biāo)注方法所標(biāo)注的結(jié)
      果更準(zhǔn)確,標(biāo)注信息也更加廣泛。


      圖1是基于社群潛在主題挖掘的自動(dòng)圖像標(biāo)注的方法流程圖。 圖2是本發(fā)明的自動(dòng)圖像標(biāo)注結(jié)果。 圖3是隱狄利克雷分配模型。
      具體實(shí)施例方式
      基于社群潛在主題挖掘的自動(dòng)圖像標(biāo)注的方法包括如下步驟-1 )采用隱狄利克雷分配模型對(duì)單個(gè)社群里的隱含主題進(jìn)行挖掘;
      2)通過對(duì)社群潛在主題分析得到圖像標(biāo)簽和隱含主題的概率分布后,刪除 社群圖像標(biāo)簽和隱含主題概率小于設(shè)定值A(chǔ)的圖像標(biāo)簽來對(duì)社群圖像標(biāo)簽進(jìn)行 "去噪"過濾;
      3)通過相似圖像標(biāo)簽傳播產(chǎn)生待標(biāo)注圖像的圖像候選標(biāo)注標(biāo)簽;
      4) 根據(jù)圖像候選標(biāo)注標(biāo)簽與圖像的隱含主題之間相關(guān)性對(duì)圖像候選標(biāo)注標(biāo) 簽進(jìn)行優(yōu)化;
      5)通過多社群信息融合得到圖像最終標(biāo)注結(jié)果。
      所述的采用隱狄利克雷分配模型對(duì)單個(gè)社群里的隱含主題進(jìn)行挖掘的步驟 如下
      1) 隱狄利克雷分配模型常用來對(duì)文本進(jìn)行主題分析;隱狄利克雷分配模型 (如圖3)中圖像(文檔)&隱含主題z、圖像標(biāo)簽w之間關(guān)系主要由隱含變
      量0和^決定,其中e表示圖像c/主題分布,A為主題z標(biāo)簽分布,cc、》為隱
      含變量隊(duì)^的先驗(yàn)概率。先驗(yàn)概率cu ^服從狄利克雷分布,r為社群主題總
      數(shù),Z)為社群圖像總數(shù),A^為每個(gè)圖像標(biāo)記標(biāo)簽總數(shù);
      2) 由于直接計(jì)算圖像集中隱含主題z與圖像d和圖像標(biāo)簽W之間的概率比較復(fù)雜,通常采用Gibbs采樣來簡化LDA模型計(jì)算;對(duì)于第/個(gè)圖像標(biāo)簽token, 該token的圖像標(biāo)簽索引為w, token所對(duì)應(yīng)圖像索引為《,Gibbs采樣輪流地考 慮每一個(gè)圖像標(biāo)簽token,通過計(jì)算其它token被賦給每一個(gè)主題的次數(shù),來估 計(jì)當(dāng)前token被賦給哪一個(gè)主題。在這個(gè)過程中,主題被循環(huán)采樣,主題條件概 率為
      ~, = JI 《w "〃V - ( 1 )
      其中,z產(chǎn)y表示主題/被賦值給token /, ^表示除了 token z'之外地其它圖像標(biāo)簽 token的主題分配,","表示其他的所有己知信息,比如所有其它圖像標(biāo)簽索引
      w.,,圖像索引".,以及先驗(yàn)概率a、 A。 c^與c^分別是大小為『*r、 i^r維數(shù)
      矩陣。C,^'表示圖像標(biāo)簽W被賦給主題_/的次數(shù),CJ表示圖像"里面的圖像標(biāo)簽 被賦給主題j'的次數(shù)(不包括當(dāng)前標(biāo)簽token 0;
      3)在每次Gibbs采樣中,圖像集里所有圖像標(biāo)簽都被賦給某一個(gè)主題。當(dāng) Gibbs采樣被迭代足夠次數(shù)后,主題概率就逼近于先驗(yàn)狄利克雷分布。Gibbs釆 樣結(jié)束之后,就得到了需要求解的標(biāo)簽一主題分布-以及主題一圖像《分布, 主題條件概率為
      其中c:表示圖像標(biāo)簽W被賦給主題7'的次數(shù),《J表示圖像J里面的圖像標(biāo)簽被
      賦給主題乂的次數(shù),『表示圖像標(biāo)簽的數(shù)目,r表示主題的數(shù)目,a、"表示先 驗(yàn)概率。
      所述的通過相似圖像標(biāo)簽傳播產(chǎn)生待標(biāo)注圖像的圖像候選標(biāo)注標(biāo)簽的步
      驟對(duì)于社群中一張待標(biāo)注圖像/ ,待標(biāo)注圖像A和圖像標(biāo)簽W之間的概率從 以下的公式計(jì)算得到P(w|/ ) = SP(w,/,, I /) = ZPOI /)/>(/,, I /),其中P(H■/)表示訓(xùn)練 圖像/中圖像標(biāo)簽w出現(xiàn)次數(shù)r P(/ l乃表宗'待標(biāo)注圖像/ 和訓(xùn)練圖像J之間的
      視覺相似性,選取與待標(biāo)注圖像/"視覺相似性最高的10幅訓(xùn)練圖像/所對(duì)應(yīng)的
      圖像標(biāo)簽w作為待標(biāo)注圖像4的候選標(biāo)注標(biāo)簽,即P(叫/,')值最大的IO個(gè)圖像標(biāo)
      簽w作為待標(biāo)注圖像/ 的圖像候選標(biāo)注標(biāo)簽。
      所述的根據(jù)圖像候選標(biāo)注標(biāo)簽與圖像的隱含主題之間相關(guān)性對(duì)圖像候選標(biāo) 注標(biāo)簽進(jìn)行優(yōu)化的步驟-
      1)通過計(jì)算所有隱含主題中兩個(gè)圖像候選標(biāo)注標(biāo)簽之間概率乘積的和得到圖像候選標(biāo)注標(biāo)簽W和VV,之間的隱含主題相似性,計(jì)算公式為
      /^k,)=ip(W4|Z"')p(z">,)=i>M',其中^表示圖像標(biāo)簽和隱含主題的概率分
      布;
      2) 通過計(jì)算圖像候選標(biāo)注標(biāo)簽和其它圖像候選標(biāo)注標(biāo)簽之間的隱含主題相 關(guān)性之和得到圖像候選標(biāo)注標(biāo)簽vu,和待標(biāo)注圖像/ 的隱含主題的相關(guān)性,計(jì)算 公式為W(w,,/ ) = e' ",其中戶(、"lw,)表示圖像候選標(biāo)注標(biāo)簽W和W,之間的隱 含主題相似性;
      3) 重新計(jì)算圖像候選標(biāo)注標(biāo)簽W,和待標(biāo)注圖像/2,的概率,計(jì)算公式為 |/ ) = P(w, |/,,)*R(w,,/,,),其中戶(VP'K)表示待標(biāo)注圖像和圖像標(biāo)簽W,之間的概
      率,R(w,,"表示圖像候選標(biāo)注標(biāo)簽VV,和待標(biāo)注圖像的隱含主題的相關(guān)性。 所述的通過多社群信息融合對(duì)圖像進(jìn)行最終的標(biāo)注的步驟
      1) 通過從每個(gè)社群的標(biāo)題中選取在社群里出現(xiàn)最頻繁的圖像標(biāo)簽來代表社
      群的主題,然后通過這個(gè)圖像標(biāo)簽就在WordNet的"entity"語義樹中找到代表該 社群的節(jié)點(diǎn),構(gòu)成各個(gè)社群之間的層次相關(guān)性;
      2) 通過各個(gè)社群之間的層次相關(guān)性,對(duì)各個(gè)社群從下到上依次通過融合對(duì) 圖像進(jìn)行最終的標(biāo)注,對(duì)于含有共同祖先節(jié)點(diǎn)的各個(gè)社群之間通過對(duì)各子節(jié)點(diǎn) 社群的標(biāo)注信息求平均值得到一個(gè)新的父節(jié)點(diǎn),刪除子節(jié)點(diǎn),達(dá)到融合的目的;
      3) 通過選取圖像候選標(biāo)注標(biāo)簽前5個(gè)值得到待標(biāo)注圖像的最終標(biāo)注結(jié)果。 本發(fā)明充分利用了社會(huì)共享網(wǎng)絡(luò)中圖像所在不同社群的信息,以及利用社
      群所在潛在主題信息來對(duì)標(biāo)注標(biāo)簽進(jìn)行"去噪"和優(yōu)化,因此比傳統(tǒng)標(biāo)注方法產(chǎn)生 的標(biāo)注結(jié)果更準(zhǔn)確,標(biāo)注信息也更加廣泛。
      如圖1所示,基于社群潛在主題挖掘的自動(dòng)圖像標(biāo)注的方法具體說明如下
      1) 對(duì)于一張待標(biāo)注圖像,找到該圖像所在的N個(gè)不同社群;
      2) 對(duì)每個(gè)社群利用隱狄利克雷分配模進(jìn)行隱含主題挖掘;
      3) 根據(jù)社群標(biāo)簽與社群隱含主題的相關(guān)性對(duì)社群標(biāo)簽進(jìn)行"去噪"過濾;
      4) 通過相似圖像標(biāo)簽傳播產(chǎn)生待標(biāo)注圖像的圖像候選標(biāo)注標(biāo)簽;
      5) 根據(jù)圖像候選標(biāo)注標(biāo)簽與圖像隱含主題之間相關(guān)性對(duì)圖像候選標(biāo)注標(biāo)簽 進(jìn)行優(yōu)化;
      6) 通過多社群信息融合來對(duì)圖像進(jìn)行標(biāo)注;
      7) 得到待標(biāo)注圖像的最終圖像標(biāo)注結(jié)果。 實(shí)施例1
      圖2給出了基于社群潛在主題挖掘的自動(dòng)圖像標(biāo)注的一個(gè)具體例子。1) 選取一張待標(biāo)注圖像,找到該圖像所在的3個(gè)不同社群社群l"Water, Oceans, Lakes, Rivers, Creeks"、社群2"Sky & Clouds"、社群3"Beautiful Scenery";
      2) 對(duì)3個(gè)社群分別利用隱狄利克雷分配模進(jìn)行隱含主題挖掘;
      3) 根據(jù)社群標(biāo)簽與社群隱含主題的相關(guān)性對(duì)3個(gè)社群標(biāo)簽進(jìn)行"去噪"過濾;
      4) 通過相似圖像標(biāo)簽傳播產(chǎn)生待標(biāo)注圖像的圖像候選標(biāo)注標(biāo)簽"river san water antonio bexar county courthouse blue clouds sea,,;
      5) 根據(jù)候選標(biāo)注標(biāo)簽與圖像隱含主題之間相關(guān)性對(duì)候選標(biāo)注標(biāo)簽進(jìn)行優(yōu)化 得至U圖像候選標(biāo)注標(biāo)簽"river san water bexar blue courthouse antonio county clouds S6a,,;
      6) 通過2個(gè)社群信息融合來得到圖像候選標(biāo)注標(biāo)簽"clouds river san sky water bexar blue courthouse antonio count";通過3個(gè)社群信息融合得到圖像候選 標(biāo)注標(biāo)簽"sky blue clouds river water san landscape bexar courthouse mountains"
      7) 通過選取圖像候選標(biāo)注標(biāo)簽前5個(gè)值得到待標(biāo)注圖像的最終圖像標(biāo)注結(jié) 果"sky blue clouds river water"。
      從上面的例子可以看到,與傳統(tǒng)的圖像標(biāo)注方法不同的是,本發(fā)明充分利 用了社會(huì)共享網(wǎng)絡(luò)中圖像所在的不同的社群的信息,以及利用社群所在的潛在 主題信息來對(duì)標(biāo)注標(biāo)簽進(jìn)行"去噪"和優(yōu)化,因此比傳統(tǒng)的標(biāo)注方法所產(chǎn)生的標(biāo)注 結(jié)果更準(zhǔn)確,標(biāo)注信息也更加廣泛。
      權(quán)利要求
      1.一種基于社群潛在主題挖掘的自動(dòng)圖像標(biāo)注的方法,其特征在于包括如下步驟1)采用隱狄利克雷分配模型對(duì)單個(gè)社群里的隱含主題進(jìn)行挖掘;2)通過對(duì)社群潛在主題分析得到圖像標(biāo)簽和隱含主題的概率分布后,刪除社群圖像標(biāo)簽和隱含主題概率小于設(shè)定值k的圖像標(biāo)簽來對(duì)社群圖像標(biāo)簽進(jìn)行“去噪”過濾;3)通過相似圖像標(biāo)簽傳播產(chǎn)生待標(biāo)注圖像的圖像候選標(biāo)注標(biāo)簽;4)根據(jù)圖像候選標(biāo)注標(biāo)簽與圖像的隱含主題之間相關(guān)性對(duì)圖像候選標(biāo)注標(biāo)簽進(jìn)行優(yōu)化;5)通過多社群信息融合得到圖像最終標(biāo)注結(jié)果。
      2. 根據(jù)權(quán)利要求1所述的一種基于社群潛在主題挖掘的自動(dòng)圖像標(biāo)注的方 法,其特征在于,所述的通過相似圖像標(biāo)簽傳播產(chǎn)生待標(biāo)注圖像的圖像候選標(biāo) 注標(biāo)簽的步驟對(duì)于社群中一張待標(biāo)注圖像/ ,待標(biāo)注圖像/ 和圖像標(biāo)簽W之 間的概率從以下的公式計(jì)算得到/^|/,,) = ^/^,/ |/) = ^/(叫《^(/,,1乃,其中 P(HJ)表示訓(xùn)練圖像J中圖像標(biāo)簽W出現(xiàn)次類0(/,, IJ)表g,寺標(biāo)注圖像/ 和訓(xùn)練 圖像J之間的視覺相似性,選取與待標(biāo)注圖像/ 視覺相似性最高的IO幅訓(xùn)練圖 像J所對(duì)應(yīng)的圖像標(biāo)簽w作為待標(biāo)注圖像/M的候選標(biāo)注標(biāo)簽,即尸(—/ )值最大 的10個(gè)圖像標(biāo)簽w作為待標(biāo)注圖像/ 的圖像候選標(biāo)注標(biāo)簽。
      3. 根據(jù)權(quán)利要求1所述的一種基于社群潛在主題挖掘的自動(dòng)圖像標(biāo)注的方 法,其特征在于,所述的根據(jù)圖像候選標(biāo)注標(biāo)簽與圖像的隱含主題之間相關(guān)性對(duì)圖像候選標(biāo)注標(biāo)簽進(jìn)行優(yōu)化的步驟1) 通過計(jì)算所有隱含主題中兩個(gè)圖像候選標(biāo)注標(biāo)簽之間概率乘積的和得到 圖像候選標(biāo)注標(biāo)簽W和W/之間的隱含主題相似性,計(jì)算公式為尸(w k,)-i^Kiz"')/^"如.,其中^表示圖像標(biāo)簽和隱含主題的概率分 布;2) 通過計(jì)算圖像候選標(biāo)注標(biāo)簽和其它圖像候選標(biāo)注標(biāo)簽之間的隱含主題相關(guān)性之和得到圖像候選標(biāo)注標(biāo)簽w和待標(biāo)注圖像/ 的隱含主題的相關(guān)性,計(jì)算公式為Ww,,/,,)^^^,其中P(,liO表示圖像候選標(biāo)注標(biāo)簽巧和W,之間的隱 含主題相似性;3) 重新計(jì)算圖像候選標(biāo)注標(biāo)簽W,和待標(biāo)注圖像的概率,計(jì)算公式為 戶>,|/,,) = />^|/,,)*1^(^/,,),其中/^|/ )表示待標(biāo)注圖像_4和圖像標(biāo)簽^之間的概率,11—,/ )表示圖像候選標(biāo)注標(biāo)簽W,和待標(biāo)注圖像/ 的隱含主題的相關(guān)性。
      4.根據(jù)權(quán)利要求1所述的一種基于社群潛在主題挖掘的自動(dòng)圖像標(biāo)注的方法,其特征在于,所述的通過多社群信息融合對(duì)圖像進(jìn)行最終的標(biāo)注的步驟1 )通過從每個(gè)社群的標(biāo)題中選取在社群里出現(xiàn)最頻繁的圖像標(biāo)簽來代表社群的主題,然后通過這個(gè)圖像標(biāo)簽就在WordNet的"entity"語義樹中找到代表該社群的節(jié)點(diǎn),構(gòu)成各個(gè)社群之間的層次相關(guān)性;2) 通過各個(gè)社群之間的層次相關(guān)性,對(duì)各個(gè)社群從下到上依次通過融合對(duì) 圖像進(jìn)行最終的標(biāo)注,對(duì)于含有共同祖先節(jié)點(diǎn)的各個(gè)社群之間通過對(duì)各子節(jié)點(diǎn) 社群的標(biāo)注信息求平均值得到一個(gè)新的父節(jié)點(diǎn),刪除子節(jié)點(diǎn),達(dá)到融合的目的;3) 通過選取圖像候選標(biāo)注標(biāo)簽前5個(gè)值得到待標(biāo)注圖像的最終標(biāo)注結(jié)果。
      全文摘要
      本發(fā)明公開了一種基于社群潛在主題挖掘的自動(dòng)圖像標(biāo)注的方法。包括如下步驟1)采用隱狄利克雷分配模型對(duì)單個(gè)社群里的隱含主題進(jìn)行挖掘;2)通過對(duì)社群潛在主題分析得到圖像標(biāo)簽和隱含主題的概率分布后,刪除社群圖像標(biāo)簽和隱含主題概率小于設(shè)定值k的圖像標(biāo)簽來對(duì)社群圖像標(biāo)簽進(jìn)行“去噪”過濾;3)通過相似圖像標(biāo)簽傳播產(chǎn)生待標(biāo)注圖像的圖像候選標(biāo)注標(biāo)簽;4)根據(jù)圖像候選標(biāo)注標(biāo)簽與圖像的隱含主題之間相關(guān)性對(duì)圖像候選標(biāo)注標(biāo)簽進(jìn)行優(yōu)化;5)通過多社群信息融合得到圖像最終標(biāo)注結(jié)果。本發(fā)明充分利用了社會(huì)共享網(wǎng)絡(luò)中圖像所在不同社群的信息以及社群潛在主題信息來對(duì)圖像進(jìn)行標(biāo)注,比傳統(tǒng)標(biāo)注方法產(chǎn)生的標(biāo)注結(jié)果更準(zhǔn)確。
      文檔編號(hào)G06F17/30GK101685464SQ20091009991
      公開日2010年3月31日 申請(qǐng)日期2009年6月18日 優(yōu)先權(quán)日2009年6月18日
      發(fā)明者飛 吳, 莊越挺, 科 朱, 健 邵, 燁 陳 申請(qǐng)人:浙江大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1