国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于顯著對象的圖像檢索方法及系統(tǒng)與流程

      文檔序號:12034744閱讀:323來源:國知局
      一種基于顯著對象的圖像檢索方法及系統(tǒng)與流程

      本發(fā)明屬于圖像檢索領域,更具體地,涉及一種基于顯著對象的圖像檢索方法及系統(tǒng)。



      背景技術:

      隨著可獲取圖像數(shù)據(jù)量的急劇增加,對圖像檢索的應用需求不斷提高,如何從海量圖像數(shù)據(jù)快速有效地實現(xiàn)感興趣目標的檢索,近年來一直是計算機視覺領域的研究熱點,得到來自科研人員和商業(yè)機構的關注,在醫(yī)學、遙感、社交媒體、電子商務、交通、刑偵等領域均有廣泛應用?;趦?nèi)容的圖像檢索能夠克服單純基于文本的圖像檢索在主觀性和歧義性方面的缺點,而圖像內(nèi)容的描述和提取是決定基于內(nèi)容的圖像檢索性能最關鍵的因素。圖像主要包括顯著對象和背景兩部分,例如在草地上拍攝狗得到的圖像,圖像中狗為顯著對象,草地為背景。顯著對象所屬的種類可稱為語義類別,例如顯著對象為狗的圖像的語義類別為狗,顯著對象為馬匹的圖像的語義類別為馬匹等。

      在包含顯著對象的圖像中,若圖像顯著對象語義類別相同但是背景不同,則背景會對圖像視覺特征的計算產(chǎn)生干擾。研究者們嘗試利用圖像顯著性來解決這一方面的問題,比如融合視覺顯著性到圖像視覺計算中,盡管在一定程度上可以抑制背景的干擾,但是會增加特征計算復雜度,并且不能完全消除背景的干擾。

      由圖像低視覺特征與高層語義之間的語義鴻溝會造成圖像檢索準確度降低。采用詞袋模型縮小語義鴻溝的思路是,通過創(chuàng)建圖像特征與視覺詞匯之間的映射來構造圖像特征描述子,但是由于提取視覺詞匯是基于整幅圖像,這樣容易引入噪聲。另外,隨著深度學習的發(fā)展,利用深度學習網(wǎng)絡的特征學習能力獲取圖像深度特征來實現(xiàn)檢索的研究也取得了一定的成果,但是直接由深度網(wǎng)絡獲取的圖像特征維度較大,在進行特征匹配時計算量大、耗時長。

      綜上,現(xiàn)有圖像檢索方法中,圖像語義類別相同時背景的干擾以及圖像低層視覺特征與高層語義之間的語義鴻溝均會造成圖像檢索的準確度降低。



      技術實現(xiàn)要素:

      針對現(xiàn)有技術的缺陷,本發(fā)明的目的在于解決現(xiàn)有檢索方法中,圖像語義類別相同時背景干擾和圖像低層視覺特征與高層語義之間的語義鴻溝等均會使得圖像檢索的準確度降低的技術問題。

      為實現(xiàn)上述目的,第一方面,本發(fā)明實施例提供了一種基于顯著對象的圖像檢索方法,包括:通過對包含顯著對象的查詢圖像進行顯著性檢測,確定所述查詢圖像的顯著對象所在的區(qū)域;確定所述查詢圖像的顯著對象所在的區(qū)域的視覺特征;確定所述顯著對象的語義類別;將所述查詢圖像的顯著對象的視覺特征與圖像庫中相同語義類別的圖像的顯著對象的視覺特征進行相似度度量,確定所述圖像庫中與所述查詢圖像的相似度大于相似度閾值的圖像。

      本發(fā)明實施例通過提取顯著對象的視覺特征,并基于顯著對象的視覺特征進行圖像檢索,減少了背景干擾,提高了圖像檢索的準確度,通過判別顯著對象的語義類別,僅對圖像庫中相同語義類別的圖像進行檢索,縮小了檢索目標范圍,在降低圖像檢索的復雜度的同時,有效提高了圖像檢索的準確度。

      可選地,通過對包含顯著對象的查詢圖像進行顯著性檢測,確定所述查詢圖像的顯著對象所在的區(qū)域,包括:通過對包含顯著對象的查詢圖像進行多尺度下的顯著性檢測,對每一層尺度下的查詢圖像進行超像素分割,分割后的每一塊為一個超像素,所述多尺度通過圖像金字塔實現(xiàn);根據(jù)每一層尺度下的每一個超像素與鄰近超像素的色彩對比度和空間對比度確定該層尺度下的顯著圖;通過對每層尺度下的顯著圖融合得到所述查詢圖像的顯著圖;通過對所述查詢圖像的顯著圖進行自適應閾值分割確定所述查詢圖像的顯著對象所在的區(qū)域。

      可選地,確定所述查詢圖像的顯著對象所在的區(qū)域的視覺特征,包括:所述視覺特征包括顏色特征、紋理特征以及關鍵點特征中的至少一種;所述顏色特征包括hsv直方圖特征、顏色矩特征以及顏色相關圖中的至少一種,所述紋理特征包括gabor變換特征和小波矩特征。

      可選地,本發(fā)明提供的圖像檢索方法還包括:通過對圖像庫中的每幅圖像進行顯著性檢測,確定圖像庫中的每幅圖像的顯著對象所在的區(qū)域;確定所述圖像庫中每幅圖像的顯著對象所在的區(qū)域的視覺特征;通過對每幅圖像的顯著對象所在的區(qū)域進行訓練得到網(wǎng)絡分類器,所述網(wǎng)絡分類器用于確定圖像中顯著對象所屬的語義類別。

      可選地,確定所述查詢圖像的顯著對象的語義類別,包括:通過將所述查詢圖像的顯著對象輸入至所述網(wǎng)絡分類器,確定所述查詢圖像的顯著對象的語義類別。

      可選地,將所述顯著對象的視覺特征與圖像庫中相同語義類別的圖像的顯著對象的視覺特征進行相似度度量,包括:通過特征距離度量方式進行所述相似度度量,所述特征距離度量方式為以下幾種距離度量方式之一:相關距離(correlation)、余弦距離(cosine)、曼哈頓距離(cityblock)、歐氏距離(euclidean)、明可夫斯基距離(minkowski)和切比雪夫距離(chebychev)等。

      可選地,所述網(wǎng)絡分類器的結構為以下幾種網(wǎng)絡結構之一:alexnet網(wǎng)絡、lenet網(wǎng)絡、googlenet網(wǎng)絡、vgg網(wǎng)絡以及resnet網(wǎng)絡。

      可選地,所述hsv直方圖特征通過以下步驟得到:在hsv顏色空間,將所述顯著對象對應的圖像像素劃分到等量空間c中,所述hsv直方圖特征通過以下公式確定:

      其中,h(c)表示hsv直方圖特征,(x,y)為像素點坐標s(x,y)=1表示顯著對象所在區(qū)域的像素點集合,i(x,y)表示查詢圖像中像素(x,y)的hsv值,m和n分別為查詢圖像的長寬,c為等量空間c中的一個單元,δ[·]用來判別像素值是否屬于等量空間c中當前單元c。

      所述顏色矩特征根據(jù)顏色均值和標準差確定,所述顏色均值和標準差分別從r、g以及b通道提取,所述色彩均值μk和標準差σk通過以下公式確定:

      其中,ik(x,y)表示坐標(x,y)的像素顏色值。

      所述顏色相關圖通過顏色自相關圖確定,所述顏色自相關圖為只計算圖像中具有相同灰度值像素的空間關系,不考慮背景像素。

      本發(fā)明通過顏色自相關圖,不考慮背景像素,降低了特征計算復雜度,提高了圖像檢索效率。

      可選地,所述gabor變換特征通過多尺度多方向的濾波器組計算各個尺度下不同方向子帶系數(shù)的均值和標準差確定,所述均值和方差代表系數(shù)的邊緣分布,所述邊緣分布用于確定gabor變換特征向量。所述小波矩特征獲取所述顯著對象所在區(qū)域的總特征維度為190維,以作為所述顯著對象的特征描述子。

      第二方面,本發(fā)明實施例提供了一種基于顯著對象的圖像檢索系統(tǒng),包括:顯著性檢測模塊,用于通過對包含顯著對象的查詢圖像進行顯著性檢測,確定所述查詢圖像的顯著對象所在的區(qū)域;視覺特征確定模塊,用于確定所述查詢圖像的顯著對象所在的區(qū)域的視覺特征;語義類別確定模塊,用于確定所述查詢圖像的顯著對象的語義類別;相似度度量模塊,用于將所述查詢圖像的顯著對象的視覺特征與圖像庫中相同語義類別的圖像的顯著對象的視覺特征進行相似度度量,確定所述圖像庫中與所述查詢圖像的相似度大于相似度閾值的圖像。

      可選地,本發(fā)明提供的圖像檢索系統(tǒng)還包括:圖像庫顯著性檢測模塊,用于對圖像庫中的每個圖像進行顯著性檢測,確定圖像庫中的每個圖像的顯著對象所在的區(qū)域;訓練模塊,用于通過對每個圖像的顯著對象所在的區(qū)域進行訓練得到網(wǎng)絡分類器,所述網(wǎng)絡分類器用于確定圖像中顯著對象所屬的語義類別。

      總體而言,通過本發(fā)明所構思的以上技術方案與現(xiàn)有技術相比,具有以下有益效果:

      (1)本發(fā)明不同于傳統(tǒng)的基于全圖進行視覺特征的圖像檢索方法,本發(fā)明直接計算圖像顯著對象所在區(qū)域的視覺特征,避免背景帶來的干擾,通過對圖像顯著對象的更準確地描述,大大提升了圖像檢索的準確度。

      (2)本發(fā)明通過確定查詢圖像顯著對象的語義類別,過濾掉圖像庫中不同語義類別的圖像,縮小了圖像檢索的語義鴻溝,降低了圖像檢索的復雜度,進一步提升了圖像檢索的準確性。

      附圖說明

      圖1為本發(fā)明實施例提供的一種基于圖像顯著對象的圖像檢索方法流程示意圖;

      圖2為本發(fā)明實施例提供的一種基于圖像顯著對象的圖像檢索系統(tǒng)的結構示意圖;

      圖3為本發(fā)明實施例提供另一種基于圖像顯著對象的圖像檢索方法的流程圖;

      圖4為本發(fā)明實施例提供另一種基于圖像顯著對象的圖像檢索系統(tǒng)的結構示意圖。

      具體實施方式

      為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下結合附圖及實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

      圖1為本發(fā)明實施例提供的一種基于圖像顯著對象的圖像檢索方法流程示意圖;包括步驟s101至步驟s104。

      s101,通過對包含顯著對象的查詢圖像進行顯著性檢測,確定所述查詢圖像的顯著對象所在的區(qū)域。

      具體地,通過對包含顯著對象的查詢圖像進行多尺度下的顯著性檢測,對每一層尺度下的查詢圖像進行超像素分割,分割后的每一塊為一個超像素,所述多尺度通過圖像金字塔實現(xiàn);根據(jù)每一層尺度下的每一個超像素與鄰近超像素的色彩對比度和空間對比度確定該層尺度下的顯著圖;通過對每層尺度下的顯著圖融合得到所述查詢圖像的顯著圖;通過對所述查詢圖像的顯著圖進行自適應閾值分割確定所述查詢圖像的顯著對象所在的區(qū)域。

      s102,確定所述查詢圖像的顯著對象所在的區(qū)域的視覺特征。

      具體地,所述視覺特征包括顏色特征、紋理特征以及關鍵點特征中的至少一種;所述顏色特征包括hsv直方圖特征、顏色矩特征以及顏色相關圖中的至少一種,所述紋理特征包括gabor變換特征和小波矩特征。

      可選地,所述顏色hsv直方圖特征通過以下步驟得到:在hsv顏色空間,將所述顯著對象對應的圖像像素劃分到等量空間c中,所述hsv直方圖特征通過以下公式確定:

      其中,h(c)表示hsv直方圖特征,(x,y)為像素點坐標s(x,y)=1表示顯著對象所在區(qū)域的像素點集合,i(x,y)表示查詢圖像中像素(x,y)的hsv值,m和n分別為查詢圖像的長寬,c為等量空間c中的一個單元,δ[·]用來判別像素值是否屬于等量空間c中當前單元c。

      所述顏色矩特征根據(jù)顏色均值和標準差確定,所述顏色均值和標準差分別從r、g以及b通道提取,所述顏色均值μk和標準差σk通過以下公式確定:

      其中,ik(x,y)表示坐標(x,y)的像素顏色值。

      所述顏色相關圖通過顏色自相關圖確定,所述顏色自相關圖為只計算圖像中具有相同灰度值像素的空間關系,不考慮背景像素。

      本發(fā)明通過顏色自相關圖,不考慮背景像素,降低了特征計算復雜度,提高了圖像檢索效率。

      可選地,所述gabor變換特征通過多尺度多方向的濾波器組計算各個尺度下不同方向子帶系數(shù)的均值和標準差確定,所述均值和方差代表系數(shù)的邊緣分布,所述邊緣分布用于確定gabor變換特征向量。所述小波矩特征獲取所述顯著對象所在區(qū)域的總特征維度為190維,以作為所述顯著對象的特征描述子。

      s103,確定所述查詢圖像的顯著對象的語義類別。

      具體地,本發(fā)明提供的圖像檢索方法還包括:通過對圖像庫中的每幅圖像進行顯著性檢測,確定圖像庫中的每幅圖像的顯著對象所在的區(qū)域;通過對每幅圖像的顯著對象所在的區(qū)域進行訓練得到網(wǎng)絡分類器,所述網(wǎng)絡分類器用于確定圖像中顯著對象所屬的語義類別。

      其中,語義類別可以為馬匹、花朵、狗、建筑等。

      具體地,通過將所述查詢圖像的顯著對象輸入至所述網(wǎng)絡分類器,確定所述查詢圖像的顯著對象的語義類別。

      s104,將所述查詢圖像的顯著對象的視覺特征與圖像庫中相同語義類別的圖像的顯著對象的視覺特征進行相似度度量,確定所述圖像庫中與所述查詢圖像的相似度大于相似度閾值的圖像。

      需要說明的是,相似度閾值可根據(jù)實際需要預設,大于相似度閾值的圖像均作為與查詢圖像相似的圖像輸出,也可以定義輸出圖像個數(shù),按相似度由大到小依次輸出所需個數(shù)的圖像作為與查詢圖像相似的圖像。

      本發(fā)明實施例提供的圖像檢索方法可適用于電子商務中的以圖搜圖,可輸入某物品的圖片以查詢相似的物品。還可適用于其它類似需求的圖像檢索方法中,本發(fā)明不對此做任何限定。

      通過特征距離度量方式進行所述相似度度量,所述特征距離度量方式為以下幾種距離度量方式之一:相關距離(correlation)、余弦距離(cosine)、曼哈頓距離(cityblock)、歐氏距離(euclidean)、明可夫斯基距離(minkowski)和切比雪夫距離(chebychev)等。

      本發(fā)明實施例通過提取顯著對象的視覺特征,并基于顯著對象的視覺特征進行圖像檢索,減少了背景干擾,提高了圖像檢索的準確度,通過判別顯著對象的語義類別,僅對圖像庫中相同語義類別的圖像進行檢索,降低圖像檢索復雜度的同時,進一步提高了圖像檢索的準確度。

      相應地,圖2為本發(fā)明實施例提供的一種基于圖像顯著對象的圖像檢索系統(tǒng)的結構示意圖;包括:查詢圖像顯著性檢測模塊、視覺特征確定模塊、語義類別確定模塊、相似度度量模塊、圖像庫顯著性檢測模塊以及訓練模塊。

      查詢圖像顯著性檢測模塊,用于通過對包含顯著對象的查詢圖像進行顯著性檢測,確定所述查詢圖像的顯著對象所在的區(qū)域;視覺特征確定模塊,用于確定所述查詢圖像的顯著對象所在的區(qū)域的視覺特征;語義類別確定模塊,用于確定所述查詢圖像的顯著對象的語義類別;相似度度量模塊,用于將所述查詢圖像的顯著對象的視覺特征與圖像庫中相同語義類別的圖像的顯著對象的視覺特征進行相似度度量,確定所述圖像庫中與所述查詢圖像的相似度大于相似度閾值的圖像。

      可選地,圖像庫顯著性檢測模塊,用于對圖像庫中的每個圖像進行顯著性檢測,確定圖像庫中的每個圖像的顯著對象所在的區(qū)域;訓練模塊,用于通過對每個圖像的顯著對象所在的區(qū)域進行訓練得到網(wǎng)絡分類器,所述網(wǎng)絡分類器用于確定圖像中顯著對象所屬的語義類別。

      可以理解的是,圖2所示的圖像檢索系統(tǒng)可以包括更多或者更少的部件,各部件的功能可參見圖1、圖3所示的方法實施例,在此不做贅述。

      圖3為本發(fā)明實施例提供另一種基于圖像顯著對象的圖像檢索方法的流程圖;包括如下步驟:

      s1:從圖像庫中選取樣本圖像訓練深度網(wǎng)絡分類器,本發(fā)明選用卷積神經(jīng)網(wǎng)絡對樣本圖像進行訓練,經(jīng)典的卷積神經(jīng)網(wǎng)絡有alexnet網(wǎng)絡、lenet網(wǎng)絡、googlenet網(wǎng)絡、vgg網(wǎng)絡和resnet網(wǎng)絡,本實施例選用alexnet網(wǎng)絡,將樣本圖像尺寸歸一化到256×256后輸入到網(wǎng)絡訓練,樣本類別數(shù)為圖像庫圖像所屬語義類別數(shù),得到網(wǎng)絡分類器。

      s2:輸入一幅查詢圖像i,圖像尺寸為m×n,本發(fā)明針對包含顯著對象的圖像數(shù)據(jù),因此輸入的查詢圖像包含顯著對象。

      s3:對包含顯著對象的查詢圖像進行顯著性檢測,得到圖像顯著圖s。然后基于圖像顯著圖自動分割出顯著對象所在的區(qū)域。

      其中,對圖像進行多尺度下的顯著性檢測,圖像多尺度是由圖像金字塔實現(xiàn),常用的金字塔結構有高斯金字塔、拉普拉斯金字塔和小波金字塔等,本實施例選用高斯金字塔得到多尺度圖像,本實施例的多尺度為三層尺度,即l=3。

      對每一層尺度下的圖像,對圖像進行超像素分割,分割后的每一塊為一個超像素,本實施例通過計算每一個超像素與周邊鄰近超像素的色彩對比度和空間對比度得到該尺度下的顯著圖sl,然后將每層所得的顯著圖融合得到最終顯著圖顯著圖像素s(x,y)與原始查詢圖像像素i(x,y)一一對應,顯著圖像素的灰度值表示對應原始查詢圖像像素的顯著度。

      通過得到的圖像顯著圖s,我們使用自適應閾值分割得到圖像顯著對象所在區(qū)域,其中m和n為顯著圖s的長寬值,(x,y)為像素點坐標。顯著對象所在區(qū)域即s(x,y)=1對應的區(qū)域,圖像像素i(x,y)在r、g、b三個顏色通道的灰度值保持不變,背景即s(x,y)=0對應的區(qū)域,圖像像素i(x,y)的灰度值置為零。

      s4:計算查詢圖像顯著對象所在區(qū)域的視覺特征,常用的視覺特征包括色彩特征、紋理特征、關鍵點特征(例如sift特征)等,本實施例選用基本的hsv直方圖特征、顏色矩特征和顏色相關圖作為圖像顏色特征,gabor變換特征和小波矩特征作為紋理特征。

      在hsv顏色空間,圖像像素被劃分到8×2×2的等量空間c中,其中不考慮s(x,y)=0對應的背景像素,計算公式為:

      其中,h(c)表示hsv直方圖特征,i(x,y)代表像素(x,y)的hsv值,m和n分別為圖像的長寬,c為等量空間c中的某一單元,δ[·]用來判別像素值是否屬于當前單元,hsv顏色空間下,圖像顏色直方圖特征長度為32。

      顏色矩特征分別由顏色均值和標準差獲取,我們分別從r、g、b三個顏色通道計算顏色均值和標準差,獲取長度為6的顏色矩特征,計算公式如下:

      顏色相關圖可以描述顏色的空間相關性,計算公式為:

      其中,pr為一種表示相關性的符號,ic(x),ic(y)是圖像中灰度值為c(x),c(y)的像素的總和,c(x),c(y)為顯著對象中兩種不同的顏色,x,y∈{1,2,...,n},k∈{1,2,...,d},n是顏色系列總數(shù),d是像素間的最大距離。|p1-p2|是像素p1與p2之間的距離。本實施例在計算顏色特征時,為了降低特征計算復雜度,采用顏色自相關圖,也就是只計算每幅圖像中具有相同灰度值像素的空間關系,其中不考慮s(x,y)=0的背景像素,顏色自相關特征維度為64。

      本實施例計算顯著對象gabor變換紋理特征,為了充分獲取各個尺度和方向上的紋理特征,我們選用的gabor變換濾波器包括四個尺度:0.05、0.1、0.2和0.4,包括六個相同間隔的不同方向,這樣就得到了多尺度多方向的濾波器組,然后計算各個尺度下不同方向子帶系數(shù)的均值和標準差,用均值和標準差代表系數(shù)的邊緣分布并構建紋理特征向量。

      把分割出的顯著對象所在區(qū)域彩色圖像轉變?yōu)榛叶葓D像,對其中背景區(qū)域進行灰度均值填充以弱化分割邊界處的紋理。本實施例濾波器尺度為fm,方向子帶數(shù)為fn,設wmn(,x)y為第m層第n個方向子帶上坐標為(x,y)的子帶系數(shù),其中m=1,2,k,fm,n=1,2...,fn,則對應子帶上均值μmn和標準差σmn的計算公式為:

      通過上述公式計算出均值和標準差之后,得到顯著對象的紋理特征向量為:

      ftexture=(μ11,σ11,μ12,σ12,...,μfmfn,σfmfn)

      另外,由于小波矩特征的平移旋轉和尺度不變性,本實施例還計算了圖像的小波矩特征,最終獲取圖像顯著對象所在區(qū)域的總特征維度為190維,以此作為圖像的特征描述子。

      s5:將步驟s3所得的顯著對象圖像輸入到由步驟s1訓練所得的網(wǎng)絡分類器中,其中圖像尺寸歸一化到256×256,得到查詢圖像顯著對象的語義類別。

      s6:對待檢索圖像庫中所有圖像進行步驟s3~s5的操作,獲取圖像庫中所有圖像的視覺特征和語義類別庫。

      s7:基于查詢圖像語義類別將待檢索的圖像庫目標范圍縮小到同語義類別圖像,將查詢圖像特征與圖像庫中同類別的圖像特征進行相似性度量,返回與查詢圖像視覺特征相似的圖像集合。

      其中,相似性度量方式選用特征距離度量方式,常用的特征距離計算方式有:相關距離(correlation)、余弦距離(cosine)、曼哈頓距離(cityblock)、歐氏距離(euclidean)、明可夫斯基距離(minkowski)和切比雪夫距離(chebychev)等,本實施例選用相關距離度量方式計算圖像相似度,計算公式為a=[a1,a2,...,an]為查詢圖像特征,而b=[b1,b2,...,bn]是圖像庫中某幅圖像的特征。

      本發(fā)明通過分割出圖像顯著對象,提取顯著對象所在區(qū)域的視覺特征作為圖像特征描述子,避免背景信息的干擾。另外通過深度網(wǎng)絡獲取查詢圖像中顯著對象的語義類別信息,過濾掉返回的不同語義類別圖像,縮小目標檢索范圍,提高圖像檢索性能。

      圖4為本發(fā)明實施例提供另一種基于圖像顯著對象的圖像檢索系統(tǒng)的結構示意圖,如圖所示,包括離線模塊和在線模塊:

      離線模塊包括以下子模塊:分類器訓練子模塊和特征庫建庫子模塊。

      分類器訓練子模塊,用于訓練深度網(wǎng)絡分類器。本實施例選用卷積神經(jīng)網(wǎng)絡對樣本圖像進行訓練確定語義類別,經(jīng)典的卷積神經(jīng)網(wǎng)絡有alexnet網(wǎng)絡、lenet網(wǎng)絡、googlenet網(wǎng)絡、vgg網(wǎng)絡和resnet網(wǎng)絡,本實施例選用alexnet網(wǎng)絡,將樣本圖像尺寸歸一化到256×256后輸入到網(wǎng)絡訓練,樣本類別數(shù)為圖像庫圖像所屬類別數(shù),得到網(wǎng)絡分類器。

      特征庫建庫子模塊,用于構建待檢索的圖像特征庫和類別庫。對圖像庫中的圖像進行顯著性檢測后得到圖像顯著圖,基于顯著圖使用自動閾值分割出圖像顯著對象所在區(qū)域,然后基于顯著對象所在區(qū)域計算圖像視覺特征,包括顏色特征和紋理特征,得到圖像特征庫。另外,將圖像庫輸入到訓練好的分類器,得到圖像類別庫。

      在線檢索模塊包括以下子模塊:在線輸入子模塊、類別判定子模塊、特征計算子模塊以及檢索輸出子模塊。

      在線輸入子模塊,用于輸入查詢圖像,其中查詢圖像包含顯著對象。

      類別判定子模塊,用于判斷查詢顯著對象的類別,使用離線訓練好的分類器判別查詢圖像顯著對象類別。

      特征計算子模塊,用于分割出查詢圖像顯著對象區(qū)域,并計算圖像顯著對象的視覺特征。其中圖像顯著圖是基于多尺度顯著性檢測模型得到,基于顯著圖使用自動閾值分割出圖像顯著對象,然后計算顯著對象所在區(qū)域的顏色和紋理特征得到查詢圖像特征向量。

      檢索輸出子模塊,基于查詢圖像語義類別將待檢索的圖像庫目標范圍縮小到同語義類別圖像,然后利用相關距離度量方式計算查詢圖像顯著對象特征與圖像庫中同語義類別圖像特征的相似度,返回并輸出顯示與查詢圖像相似的圖像集合。

      可以理解的是,圖4所示的圖像檢索系統(tǒng)可以包括更多或者更少的部件,各部件的功能可參見圖1、圖3所示的方法實施例,在此不做贅述。

      綜上所述,針對包含顯著對象的圖像數(shù)據(jù),本發(fā)明實施例提供了一種基于顯著對象的圖像檢索方法和系統(tǒng),通過自動分割出顯著對象保留圖像顯著對象并計算特征,消除背景信息干擾,另外本發(fā)明利用訓練所得深度網(wǎng)絡分類器,獲取查詢圖像語義類別,進行同類別圖像匹配檢索,縮小語義鴻溝,提升圖像檢索準確度。

      以上,僅為本申請較佳的具體實施方式,但本申請的保護范圍并不局限于此,任何熟悉本技術領域的技術人員在本申請揭露的技術范圍內(nèi),可輕易想到的變化或替換,都應涵蓋在本申請的保護范圍之內(nèi)。因此,本申請的保護范圍應該以權利要求的保護范圍為準。

      當前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1