一種基于加權(quán)圖像金字塔結(jié)構(gòu)和模糊支持向量機(jī)的圖像語(yǔ)義索引方法
【專(zhuān)利摘要】本發(fā)明提出了一種基于加權(quán)圖像金字塔結(jié)構(gòu)和模糊支持向量機(jī)的圖像語(yǔ)義索引方法。首先根據(jù)訓(xùn)練樣本集建立概念模型庫(kù),分別訓(xùn)練各個(gè)概念語(yǔ)義所對(duì)應(yīng)的模型;其次計(jì)算樣本圖像與概念模型庫(kù)中各個(gè)模型的關(guān)聯(lián)程度;最后根據(jù)關(guān)聯(lián)程度對(duì)樣本圖像進(jìn)行索引,實(shí)現(xiàn)圖像的自動(dòng)語(yǔ)義索引。本發(fā)明介紹了概念模型庫(kù)的構(gòu)造及為了衡量圖像內(nèi)容與概念模型之間的關(guān)聯(lián)程度推出的關(guān)聯(lián)度計(jì)算方法,并通過(guò)實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證了本發(fā)明提出的方法的準(zhǔn)確性。與其他方法相比,本發(fā)明提供的方法在一系列相似程度不太大的圖像集中能夠取得很好的效果。
【專(zhuān)利說(shuō)明】一種基于加權(quán)圖像金字塔結(jié)構(gòu)和模糊支持向量機(jī)的圖像語(yǔ)義索引方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像索引方法,特別是一種基于加權(quán)圖像金字塔結(jié)構(gòu)和模糊支持向量機(jī)的圖像語(yǔ)義索引方法。
【背景技術(shù)】
[0002]在圖像檢索領(lǐng)域,一般認(rèn)為用戶(hù)傾向于在語(yǔ)義層次上判斷檢索結(jié)果的好壞。這就是說(shuō),用戶(hù)所認(rèn)為的好結(jié)果必然是與用戶(hù)查詢(xún)?cè)谡Z(yǔ)義上(而不是在其它方面)高度相關(guān)的。由于基于內(nèi)容的圖像檢索建立在對(duì)圖像底層特征的提取和分析,匹配的基礎(chǔ)之上,而圖像資源底層特征與高層語(yǔ)義之間固有的“語(yǔ)義鴻溝”決定了僅僅從圖像底層特征這一方面著手的檢索方式無(wú)法取得滿(mǎn)意的效果。
[0003]隨著互聯(lián)網(wǎng)和數(shù)字圖書(shū)館之類(lèi)的數(shù)字化信息庫(kù)的出現(xiàn)帶來(lái)了海量的圖像數(shù)據(jù),同時(shí)由于圖像信息的底層特征具有高維數(shù)的特點(diǎn),使基于內(nèi)容的圖像檢索受到“維數(shù)災(zāi)難”和高計(jì)算復(fù)雜度等難以克服的難點(diǎn)。因此圖像如果缺少了語(yǔ)義的支持,那么對(duì)它們的檢索無(wú)論在準(zhǔn)確率和效率上都無(wú)法滿(mǎn)足用戶(hù)的需求。所以圖像的語(yǔ)義檢索逐漸成為了近年來(lái)圖像分析檢索研究的熱點(diǎn),建立圖像的語(yǔ)義表示和檢索機(jī)制也勢(shì)在必行。
[0004]基于文本信息的圖像檢索具有用戶(hù)界面友好、處理速度快以及可應(yīng)用于大規(guī)模數(shù)據(jù)集等優(yōu)點(diǎn),這一檢索方式在目前和將來(lái)都具有非常廣泛的應(yīng)用和研究?jī)r(jià)值。圖像索引這個(gè)直觀地想法能有效地彌補(bǔ)語(yǔ)義缺失給檢索帶來(lái)的麻煩,現(xiàn)有系統(tǒng)主要依靠手工標(biāo)注和半自動(dòng)方式獲取圖像的索引信息,巨大的人力,物力代價(jià)使得純手工的圖像索引變得不切實(shí)際,因此研究人員將統(tǒng)計(jì)模型引入標(biāo)注研究領(lǐng)域,希望通過(guò)機(jī)器學(xué)習(xí)方法自動(dòng)索引圖像。這些模型將索引的過(guò)程看成將圖像內(nèi)容翻譯成文本內(nèi)容的過(guò)程。在這類(lèi)模型中,如何精確描述圖像的視覺(jué)特征及如何建立圖像與文本之間的對(duì)關(guān)系成了各研究人員的研究熱點(diǎn)。
[0005]本發(fā)明提出了一種基于加權(quán)圖像金字塔結(jié)構(gòu)和模糊支持向量機(jī)的圖像語(yǔ)義索引方法。首先根據(jù)訓(xùn)練樣本集建立概念模型庫(kù),分別訓(xùn)練各個(gè)概念語(yǔ)義所對(duì)應(yīng)的模型;其次計(jì)算樣本圖像與概念模型庫(kù)中各個(gè)模型的關(guān)聯(lián)程度;最后根據(jù)關(guān)聯(lián)程度對(duì)樣本圖像進(jìn)行索弓丨,實(shí)現(xiàn)圖像的自動(dòng)語(yǔ)義索引。
【發(fā)明內(nèi)容】
[0006]為更好的滿(mǎn)足用戶(hù)的要求,本發(fā)明要設(shè)計(jì)并實(shí)現(xiàn)一種基于加權(quán)圖像金字塔結(jié)構(gòu)和模糊支持向量機(jī)的圖像語(yǔ)義索引方法,包括以下步驟:
[0007]A、建立概念模型庫(kù):
[0008]概念庫(kù)中的每一個(gè)概念都對(duì)應(yīng)于一組圖像樣本數(shù)據(jù);對(duì)于訓(xùn)練集中的每一幅圖像,處理流程為:
[0009]Al、構(gòu)造加權(quán)圖像金字塔:
[0010]把整個(gè)圖像當(dāng)成金字塔第一層;其次,采用對(duì)圖像進(jìn)行切分,作為金字塔結(jié)構(gòu)的第二層;最后,將圖像切割成4*4個(gè)小塊,作為金字塔結(jié)構(gòu)的第三層;
[0011]其中金字塔中的每一層來(lái)都代表著整幅圖像,在圖像理解過(guò)程中都發(fā)揮著相同的作用;
[0012]對(duì)每個(gè)圖像塊進(jìn)行加權(quán)處理;
[0013]設(shè)每層結(jié)構(gòu)的整體權(quán)重
【權(quán)利要求】
1.一種基于加權(quán)圖像金字塔結(jié)構(gòu)和模糊支持向量機(jī)的圖像語(yǔ)義索引方法,其特征在于:包括以下步驟: A、建立概念模型庫(kù): 概念庫(kù)中的每一個(gè)概念都對(duì)應(yīng)于一組圖像樣本數(shù)據(jù);對(duì)于訓(xùn)練集中的每一幅圖像,處理流程為: Al、構(gòu)造加權(quán)圖像金字塔: 把整個(gè)圖像當(dāng)成金字塔第一層;其次,采用對(duì)圖像進(jìn)行切分,作為金字塔結(jié)構(gòu)的第二層;最后,將圖像切割成4*4個(gè)小塊,作為金字塔結(jié)構(gòu)的第三層; 其中金字塔中的每一層來(lái)都代表著整幅圖像,在圖像理解過(guò)程中都發(fā)揮著相同的作用; 對(duì)每個(gè)圖像塊進(jìn)行加權(quán)處理; 設(shè)每層結(jié)構(gòu)的整體權(quán)重^= 1,顯然:
【文檔編號(hào)】G06F17/30GK103838793SQ201210491410
【公開(kāi)日】2014年6月4日 申請(qǐng)日期:2012年11月27日 優(yōu)先權(quán)日:2012年11月27日
【發(fā)明者】鄭世明 申請(qǐng)人:大連靈動(dòng)科技發(fā)展有限公司