国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于局部保持迭代量化哈希的圖像檢索方法與流程

      文檔序號:11623588閱讀:346來源:國知局
      基于局部保持迭代量化哈希的圖像檢索方法與流程
      本發(fā)明屬于圖像處理領域,更進一步涉及大規(guī)模圖像數(shù)據(jù)的快速檢索方法,可用于移動設備、物聯(lián)網(wǎng)和電子商務等的圖片搜索服務。

      背景技術:
      近年來,隨著互聯(lián)網(wǎng)、云計算、移動設備和物聯(lián)網(wǎng)的飛速發(fā)展,全球數(shù)據(jù)量進入ZB時代,并且每年仍以指數(shù)級形式增長。大數(shù)據(jù)中的圖像數(shù)據(jù)與人的視覺認知方式相同,在信息表達方式中占有重要的地位。如何高效檢索有價值的圖像來充分利用大數(shù)據(jù)獲得效益成為現(xiàn)今的一大難題。為了在大數(shù)據(jù)中高效地檢索到有價值的圖像,人們提出了哈希算法。該算法可以將圖像轉換成一定長度的二進制編碼序列,由于二進制編碼序列能夠直接被計算機存儲和處理,因此使用二進制編碼序列能夠大大加快圖像檢索速度。并且運用長度較短的二進制編碼序列代替高維圖像數(shù)據(jù),能夠大大節(jié)省存儲空間。大連理工大學提出的專利申請“基于多哈希表映射誤差最小化的圖像檢索方法”(申請?zhí)枺?01110357850.3,公開號:CN102508910A)公開了一種基于多哈希表映射誤差最小化的圖像檢索方法。該方法首先提取圖像特征,然后計算訓練特征的主成分方向并采用迭代量化法對主成分方向進行優(yōu)化,將待檢索特征和查詢特征投影到優(yōu)化后的主成分方向上,得到其對應的哈希碼。然后對先前訓練特征進行能量弱化得到新的訓練特征,重復該過程得到多組哈希碼。該方法克服了單哈希表在召回率較高時漢明球半徑較大的缺點,又采用相同哈希碼長的多個哈希表,提高了檢索的準確率。但是,該專利申請?zhí)岢龅姆椒ù嬖诘牟蛔阒幨牵阂环矫嫱ㄟ^線性降維方式得到主成分方向,這不符合現(xiàn)實中大多數(shù)數(shù)據(jù)的非線性特性,且后續(xù)的迭代優(yōu)化主成分方向過程會增加算法時間復雜度;另一方面針對大數(shù)據(jù),多哈希表的使用增加了存儲空間的占用率。浙江大學提出的專利申請“基于稀疏降維的譜哈希索引方法”(申請?zhí)枺?01010196539.0,公開號:CN101894130A)公開了一種基于稀疏表達和拉普拉斯圖的哈希索引方法。該方法首先提取圖像底層特征,進一步通過聚類得到視覺單詞,然后利用有權重的拉普拉斯-貝爾特拉米算子的特征方程和特征根,求得歐式空間到漢明空間的映射函數(shù),得到低維空間漢明向量。該方法用稀疏降維方式代替譜哈希的主成分分析降維方式,增加了結果的可解釋性。但卻仍沒有避免譜哈希模型中強制訓練數(shù)據(jù)服從均勻分布的前提假設,使其應用價值受到限制。YunchaoGong和SvetlanaLazebnik在文章“IterativeQuantization:AProcrusteanApproachtoLearningBinaryCodes”(IEEEConferenceonComputerVisionandPatternRecognition,2011,pp.817-824)中提出一種迭代量化方法,該方法首先對圖像提取底層特征,然后使用主成分分析方法對底層特征降維,得到低維特征,然后對低維特征旋轉并量化得到圖像的編碼。該方法使得旋轉后的主成分方向的方差盡量保持平衡,提高了獲取哈希編碼序列的性能。但是,該方法的前提假設是圖像數(shù)據(jù)服從高斯分布,而實際數(shù)據(jù)可能并不服從高斯分布,并且該方法沒有考慮圖像之間的近鄰關系,使得檢索性能降低。

      技術實現(xiàn)要素:
      本發(fā)明的目的在于針對上述已有技術的不足,提出一種基于局部保持迭代量化哈希的圖像檢索方法,以節(jié)省哈希編碼的存儲空間,降低檢索的時間復雜度,有效提高圖像檢索的查準率與查全率。本發(fā)明的技術思路是:在訓練模式下,對圖像訓練數(shù)據(jù)通過主成分分析和構造近鄰圖,得到訓練數(shù)據(jù)的低維表示和數(shù)據(jù)之間的近鄰關系,根據(jù)數(shù)據(jù)之間的近鄰關系,運用迭代量化方法計算出訓練數(shù)據(jù)低維表示的哈希值,得到圖像訓練數(shù)據(jù)哈希編碼。在測試模式下,獲得測試數(shù)據(jù)哈希編碼,計算測試數(shù)據(jù)與訓練數(shù)據(jù)哈希編碼間的漢明距離,得到檢索結果。根據(jù)上述思路,本發(fā)明的實現(xiàn)步驟如下:(1)調用圖像數(shù)據(jù)庫中原始圖像,對原始圖像數(shù)據(jù)進行特征提取,得到圖像特征數(shù)據(jù);(2)對圖像特征數(shù)據(jù)做歸一化處理,得到歸一化數(shù)據(jù);(3)對歸一化數(shù)據(jù)進行主成分分析降維,得到低維的歸一化數(shù)據(jù)矩陣;(4)從低維的歸一化數(shù)據(jù)矩陣隨機選取五分之一的數(shù)據(jù)矩陣作為圖像測試數(shù)據(jù)矩陣,其余的五分之四的歸一化數(shù)據(jù)矩陣作為圖像訓練數(shù)據(jù)矩陣;(5)構造圖像訓練數(shù)據(jù)矩陣之間的近鄰圖,得到圖像訓練數(shù)據(jù)的近鄰關系;5a)用圖像訓練數(shù)據(jù)矩陣的訓練數(shù)據(jù)點作為節(jié)點,用數(shù)據(jù)點之間的連線作為邊,由高斯核函數(shù)求得兩兩數(shù)據(jù)點之間的相似度作為權重,構造圖像訓練數(shù)據(jù)的無向圖;5b)計算圖像訓練數(shù)據(jù)無向圖的拉普拉斯矩陣L,得到表現(xiàn)圖像訓練數(shù)據(jù)關系的正則項約束YTLY,其中Y為訓練數(shù)據(jù)矩陣的哈希碼,YT表示對Y的轉置;(6)隨機生成一個正交矩陣作為旋轉矩陣R;(7)根據(jù)圖像訓練數(shù)據(jù)關系的正則項約束YTLY,通過迭代量化,不斷優(yōu)化旋轉矩陣R,得到優(yōu)化后的旋轉矩陣R';(8)根據(jù)優(yōu)化后的旋轉矩陣R',分別得到圖像訓練數(shù)據(jù)矩陣的哈希碼BX和圖像測試數(shù)據(jù)矩陣的哈希碼BT;(9)從測試數(shù)據(jù)矩陣的哈希碼BT中取其中的一個測試數(shù)據(jù)的哈希碼,計算該哈希碼與訓練數(shù)據(jù)矩陣的哈希碼BX之間的漢明距離,得到漢明距離向量;(10)將漢明距離向量中的數(shù)值按從小到大的順序排序,輸出對應的原始圖像,得到檢索結果。本發(fā)明與現(xiàn)有技術相比具有以下優(yōu)點:第一,本發(fā)明由于引入了原始空間數(shù)據(jù)的近鄰關系來保持原始空間局部信息,克服了現(xiàn)有技術中圖像原有的近鄰信息在漢明空間中丟失的缺點,改善了哈希碼性能,提高了檢索精度。第二,本發(fā)明由于構造無向圖獲得表現(xiàn)圖像訓練數(shù)據(jù)關系的正則項約束,將相似性與獨立性結合起來,得到了更為緊湊的哈希碼,減少了內存空間的占用。第三,本發(fā)明由于采用旋轉矩陣獲得單組哈希編碼,克服了現(xiàn)有技術采用多組哈希編碼而占用內存空間、消耗檢索時間的缺點,使得本發(fā)明所提出的方法在圖像檢索中效率更高。附圖說明圖1為本發(fā)明的實現(xiàn)流程圖;圖2為本發(fā)明與現(xiàn)有哈希方法在MNIST數(shù)據(jù)庫下的實驗結果對比圖;圖3為本發(fā)明與現(xiàn)有哈希方法在CIFAR-10數(shù)據(jù)庫下的實驗結果對比圖。具體實施方案以下結合附圖,對本發(fā)明的具體實現(xiàn)方法和技術效果作進一步描述。參照圖1,本發(fā)明實現(xiàn)步驟如下:步驟1,獲取原始圖像。從給定的圖像數(shù)據(jù)庫MNIST或CIFAR-10中提取5000個圖像,作為原始圖像。步驟2,對原始圖像進行特征提取,得到圖像特征數(shù)據(jù)。(2a)對每一張原始圖像3個顏色通道的像素值取均值,得到該原始圖像數(shù)據(jù)的灰度圖像;(2b)利用Gabor濾波器對灰度圖像進行4個尺度、8個方向的濾波,得到灰度圖像的32個特征圖;(2c)將每個特征圖分成大小為4×4的子網(wǎng)格,分別對每個子網(wǎng)格中的所有像素取均值,將該均值排列在一個向量中,得到這張圖像的特征數(shù)據(jù)。步驟3,對圖像特征數(shù)據(jù)做歸一化處理,得到歸一化數(shù)據(jù)。(3a)對圖像特征數(shù)據(jù)取均值,用圖像特征數(shù)據(jù)中的每個圖像特征數(shù)據(jù)減去該均值,得到相應的圖像特征數(shù)據(jù)的中心化向量;(3b)對每個圖像特征數(shù)據(jù)的中心化向量的各個分量進行平方和開根號運算,得到該向量的模;(3c)用每個圖像特征數(shù)據(jù)中心化向量除以該向量的模,得到每個圖像特征數(shù)據(jù)的歸一化向量。步驟4,對歸一化數(shù)據(jù)進行主成分分析,得到低維的歸一化數(shù)據(jù)矩陣。(4a)聯(lián)合每個圖像特征數(shù)據(jù)的歸一化向量,得到圖像特征數(shù)據(jù)的歸一化矩陣;(4b)計算圖像特征數(shù)據(jù)的歸一化矩陣的協(xié)方差矩陣;(4c)根據(jù)圖像特征數(shù)據(jù)的歸一化矩陣的協(xié)方差矩陣,計算協(xié)方差矩陣的特征值和特征向量;(4d)將協(xié)方差矩陣的特征值從大到小順序排列,并提取出協(xié)方差矩陣的前r個最大特征值;(4e)根據(jù)協(xié)方差矩陣的前r個最大特征值,獲得與此r個最大特征值所對應的r個特征向量;(4f)將圖像特征數(shù)據(jù)的歸一化矩陣和獲得的r個特征向量相乘,得到n行r列的低維歸一化數(shù)據(jù)矩陣V,其中n表示圖像的總個數(shù),r表示圖像數(shù)據(jù)哈希編碼的長度。步驟5,從低維的歸一化數(shù)據(jù)矩陣V隨機選取五分之一的數(shù)據(jù)矩陣作為圖像測試數(shù)據(jù)矩陣VT,其余的五分之四的歸一化數(shù)據(jù)矩陣作為圖像訓練數(shù)據(jù)矩陣VX。步驟6,構造圖像訓練數(shù)據(jù)矩陣VX之間近鄰圖,得到圖像訓練數(shù)據(jù)的近鄰關系。(6a)將圖像訓練數(shù)據(jù)矩陣的每個訓練數(shù)據(jù)點作為節(jié)點,每兩個訓練數(shù)據(jù)點之間連線作為邊,求得兩兩節(jié)點之間的歐氏距離d;(6b)根據(jù)兩兩節(jié)點之間的歐氏距離d,通過相似度公式求得任意兩節(jié)點之間的相似度z,將相似度作為權重,構造圖像訓練數(shù)據(jù)的無向圖,其中σ=0.9;(6c)將任意兩節(jié)點之間的權重z組合,得到圖像訓練數(shù)據(jù)相似度矩陣Z;(6d)對相似度矩陣Z的每一行求和,將求和結果作為矩陣的對角值,矩陣的其他元素都為零,得到相似度矩陣的度矩陣D;(6e)計算圖像訓練數(shù)據(jù)的拉普拉斯矩陣:L=D-Z;(6f)根據(jù)拉普拉斯矩陣L,得到表示圖像訓練數(shù)據(jù)關系的正則項約束YTLY。步驟7,初始化旋轉矩陣R。(7a)隨機生成一個服從標準正態(tài)分布的隨機高斯矩陣Q;(7b)對隨機高斯矩陣Q進行奇異值分解得到左正交矩陣H和右正交矩陣即:其中Λ1為Q分解所對應的奇異值;(7c)把分解后得到的一個左正交矩陣H賦值給旋轉矩陣R。步驟8,更新旋轉矩陣。(8a)以正則項約束YTLY為限定條件,通過旋轉矩陣R,得到旋轉訓練數(shù)據(jù)矩陣:其中I是單位矩陣,VX是圖像訓練數(shù)據(jù)矩陣,α是調節(jié)參數(shù),取值為10,[·]-1表示對矩陣求逆,LT表示對L轉置;(8b)對旋轉訓練數(shù)據(jù)矩陣進行二值量化,得到編碼(8c)對編碼的轉置和圖像訓練數(shù)據(jù)VX的乘積進行奇異值分解,得到左酉矩陣U與右酉矩陣奇異值分解公式為:其中Λ為奇異值;(8d)根據(jù)奇異值分解得到的左酉矩陣U與右酉矩陣得到更新的旋轉矩陣:步驟9,將步驟8迭代50次,得到最優(yōu)的旋轉矩陣R'。步驟10,根據(jù)最優(yōu)的旋轉矩陣R',分別得到圖像訓練數(shù)據(jù)矩陣的哈希碼BX和圖像測試數(shù)據(jù)矩陣的哈希碼BT。(10a)將圖像訓練數(shù)據(jù)VX與最優(yōu)的旋轉矩陣R'相乘,得到圖像訓練數(shù)據(jù)量化矩陣CX;(10b)將訓練數(shù)據(jù)量化矩陣CX中大于等于0的元素賦值為1,小于0的元素賦值為0,從而得到圖像訓練數(shù)據(jù)矩陣的哈希碼BX;(10c)將圖像測試數(shù)據(jù)VT與最優(yōu)的旋轉矩陣R'相乘,得到圖像測試數(shù)據(jù)量化矩陣CT;(10d)將測試數(shù)據(jù)量化矩陣CT中大于等于0的元素賦值為1,小于0的元素賦值為0,從而得到圖像測試數(shù)據(jù)矩陣的哈希碼BT。步驟11,求取漢明向量。(11a)從測試數(shù)據(jù)矩陣的哈希碼BT中取其中的一個測試數(shù)據(jù)的哈希碼b,將該圖像測試數(shù)據(jù)的哈希碼b與每一個圖像訓練數(shù)據(jù)的哈希碼進行異或處理,得到哈希碼中不同編碼值的位數(shù);(11b)將不同編碼值的位數(shù)作為漢明距離進行組合,得到漢明距離向量。步驟12,將漢明距離向量中的數(shù)值按從小到大的順序排序,輸出對應的原始圖像,得到檢索結果。本發(fā)明的效果結合以下仿真實驗進一步說明:1.仿真條件本發(fā)明是在中央處理器為Intel(R)Corei5-34702.80GHZ、內存4G、WINDOWS7操作系統(tǒng)上,運用MATLAB軟件進行的實驗仿真。2.仿真內容將本發(fā)明的方法與現(xiàn)有三種哈希方法進行了對比,這三種方法分別是:局部敏感哈希LSH方法、迭代量化ITQ方法、譜哈希SH方法。仿真實驗中,分別畫出數(shù)據(jù)檢索的查準率-查全率曲線和平均準確率曲線去評估圖像檢索性能。其中,查準率:在某具體漢明距離中,查詢得到的與查詢點相關的圖像數(shù)據(jù)點個數(shù)和所有的查詢得到的圖像數(shù)據(jù)點個數(shù)之比。查全率:在某具體漢明距離中,查詢得到的與查詢點相關的圖像數(shù)據(jù)點個數(shù)和數(shù)據(jù)集中與查詢點相關的全部圖像數(shù)據(jù)點個數(shù)之比。仿真1:在MNIST數(shù)據(jù)庫下分別采用本發(fā)明方法和現(xiàn)有三種哈希方法進行查準率-查全率、平均準確率的對比實驗,實驗結果如圖2所示。其中,圖2(a)為哈希編碼長度取24位的查全率-查準率曲線圖,橫軸表示查全率,縱軸表示查準率。圖2(b)為哈希編碼長度取32位的查全率-查準率曲線圖,橫軸表示查全率,縱軸表示查準率。圖2(c)為哈希編碼長度取48位的查全率-查準率曲線圖,橫軸表示查全率,縱軸表示查準率。圖2(d)為平均準確率曲線圖,橫軸表示哈希編碼長度,縱軸表示平均準確率。仿真2:在CIFAR-10數(shù)據(jù)庫下分別采用本發(fā)明方法和現(xiàn)有三種哈希方法進行查準率-查全率、平均準確率的對比實驗,實驗結果如圖3所示。其中,圖3(a)為哈希編碼長度取16位的查全率-查準率曲線圖,橫軸表示查全率,縱軸表示查準率。圖3(b)為哈希編碼長度取24位的查全率-查準率曲線圖,橫軸表示查全率,縱軸表示查準率。圖3(c)為哈希編碼長度取32位的查全率-查準率曲線圖,橫軸表示查全率,縱軸表示查準率。圖3(d)為平均準確率曲線圖,橫軸表示哈希編碼長度,縱軸表示平均準確率。由圖2和圖3的仿真結果可見,采用本發(fā)明進行圖像檢索的查全率-查準率性能及平均準確率性能都優(yōu)于現(xiàn)有的哈希方法。因此,與現(xiàn)有技術相比,本發(fā)明利用原始空間數(shù)據(jù)的近鄰關系來保持原始空間局部信息方法,能有效獲取原始圖像數(shù)據(jù)的哈希碼,從而提高了圖像檢索的性能。
      當前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1