国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于稀疏降維的譜哈希索引方法

      文檔序號:6603946閱讀:183來源:國知局

      專利名稱::基于稀疏降維的譜哈希索引方法
      技術(shù)領(lǐng)域
      :本發(fā)明涉及圖像搜索方法,尤其涉及一種基于稀疏降維的譜哈希索引方法。
      背景技術(shù)
      :隨著互聯(lián)網(wǎng)的不斷發(fā)展,傳統(tǒng)圖像搜索方法中索引機(jī)制已很難滿足用戶高層次需求,以指數(shù)級迅猛增長的海量數(shù)據(jù)給提高搜索引擎效率帶來了巨大挑戰(zhàn)。當(dāng)前,海量圖像數(shù)據(jù)呈現(xiàn)高維、多階特性。對于給定的互聯(lián)網(wǎng)圖像數(shù)據(jù),其中提取的視覺特征等動輒成百上千,這些高維數(shù)據(jù)給圖像的相似度計(jì)算和語義分析帶來了諸多困難。為了提高高維圖像數(shù)據(jù)處理效率,下述三種方法被廣泛研究,成為國際國內(nèi)學(xué)術(shù)執(zhí)占·1)流形學(xué)習(xí)。近來,研究者已普遍認(rèn)識到數(shù)據(jù)所具有高維特征本質(zhì)上被有限自由度決定,分析數(shù)據(jù)幾何拓?fù)浞植冀Y(jié)構(gòu)不僅能優(yōu)化數(shù)據(jù)間相似性計(jì)算,也能夠大大降低計(jì)算復(fù)雜度,這一方面代表性工作是“流形學(xué)習(xí)”。流形學(xué)習(xí)理論通過構(gòu)建離散數(shù)據(jù)間形成的相鄰圖,應(yīng)用譜分析手段獲得高維特征內(nèi)嵌子空間,包括等距映射(IS0MAP)、局部線性嵌入(LLE)和保局投影(LPP)等代表性方法。作為一種有效的高維降維手段,流形學(xué)習(xí)在圖像語義理解和計(jì)算機(jī)視覺等領(lǐng)域得到了深入研究和廣泛應(yīng)用。2)變量選擇(VariableSelection)。在數(shù)據(jù)分析過程中,當(dāng)樣本特征維數(shù)遠(yuǎn)遠(yuǎn)大于樣本數(shù)目時,傳統(tǒng)方法難以準(zhǔn)確進(jìn)行數(shù)據(jù)預(yù)測與識別,斯坦福大學(xué)Tibshirani和加州大學(xué)伯克利分校Breiman幾乎同時提出了對特征系數(shù)施以I1-范式約束的lassoQeastabsolutionshrinkageandselectionoperator)思想,促使被選擇出來的特征盡可能稀疏,以保證結(jié)果穩(wěn)定性和提高數(shù)據(jù)處理過程的可解釋性(interpretable)。由于從圖像中可提取特征眾多,如何從高維數(shù)據(jù)中尋找有效稀疏表達(dá),在稀疏表達(dá)基礎(chǔ)上理解圖像所蘊(yùn)含語義,成為當(dāng)前計(jì)算機(jī)視覺和模式識別領(lǐng)域一個發(fā)展趨勢。3)高維索引。與海量環(huán)境中文本檢索可以按照字典序通過倒排表和Pat數(shù)組等模型進(jìn)行高效索引不同,從多媒體數(shù)據(jù)提取的無序高維特征難以進(jìn)行以字典序?yàn)榛A(chǔ)高效索引。目前以R樹、K-D-B樹及X樹等樹形結(jié)構(gòu)為代表的多維索引技術(shù)雖然取得了一些進(jìn)展,然而研究表明大多數(shù)多維索引結(jié)構(gòu)的時間開銷為指數(shù)級,不適合維數(shù)過高的情況(比如幾十維),其查詢效率甚至低于對原始數(shù)據(jù)進(jìn)行順序掃描的查詢效率。同時,如何保證數(shù)據(jù)的語義索引(SemanticHashing),即在索引空間中所計(jì)算相似度與在原始高維空間中所計(jì)算相似度保持一致,成為熱點(diǎn)問題。如何利用機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)高維數(shù)據(jù)的“語義索引”。為了提高高維數(shù)據(jù)相似度匹配的效率,一些索引方法被相繼提出。在這一方面,LSH(LocalitySensitiveHash)是一種代表性的高維特征索引技術(shù)。LSH通過一組哈希函數(shù)的映射結(jié)果達(dá)到高維索引目的。在LSH中,所使用的哈希函數(shù)必須滿足如下條件任意兩個高維數(shù)據(jù)通過哈希函數(shù)作映射時發(fā)生沖突概率正比于數(shù)據(jù)點(diǎn)在原始高維空間之間距離。這樣,任意兩個相似的高維數(shù)據(jù)通過哈希函數(shù)會以很大概率被分配到哈希表中同一項(xiàng)中。由于LSH是基于概率模型產(chǎn)生編碼,在實(shí)際應(yīng)用中難以保證穩(wěn)定的表現(xiàn),往往會產(chǎn)生令人難以滿意的結(jié)果。從圖1可以看出,隨著編碼位數(shù)的上升,LSH的準(zhǔn)確率提升比較緩慢,而迭代收斂的速度也可能非常慢。機(jī)器學(xué)習(xí)的思路被引入索引方法后產(chǎn)生了RBM(restrictedBoltzmannmachine-RBM)和stumpBoostingSSC等方法。RBM利用一種兩層無向圖形學(xué)的模型,產(chǎn)生RBM機(jī)來處理指數(shù)型分布族。該模型最底層代表原空間向量,最高層代表得到的數(shù)據(jù)二進(jìn)制編碼,最頂上的兩層形成了一個無向兩偶圖,其余層形成了一個有向的自上而下聯(lián)系的信念網(wǎng)絡(luò)。每層均通過訓(xùn)練RBM機(jī),得到隱藏變量。預(yù)處理完,每一層各自的RBM展開用以建立一個深的自動編碼器。如果隨機(jī)的二進(jìn)制特征活動是確定的、實(shí)值概率,那么我們可以通過整個網(wǎng)絡(luò)反向傳播來微調(diào)計(jì)數(shù)數(shù)據(jù)的最佳重建的權(quán)重。為了讓編碼成為二進(jìn)制編碼,可從底層向高層的輸入加入高斯噪聲,由每個編碼單元接受。圖1顯示了RBM相較于LSH有更好的表現(xiàn)。將RBM應(yīng)用于海量數(shù)據(jù)檢索,可較之LSH取得幾個數(shù)量級的效率提高。但是由于RBM自身方法的復(fù)雜性,在保證精確的同時大大地犧牲了效率?!癇oosting”是一種提高任何學(xué)習(xí)方法性能的常用方法。它通過在訓(xùn)練數(shù)據(jù)的不同分布上反復(fù)運(yùn)行一個給定的弱學(xué)習(xí)方法來工作的,然后結(jié)合由弱學(xué)習(xí)器產(chǎn)生的單個復(fù)合的分類器。在Boosting方法中,每個弱學(xué)習(xí)器是一個決定樁(decisionstump),對于輸入數(shù)據(jù),所有弱學(xué)習(xí)器的輸出是一個二進(jìn)制編碼。圖1顯示了這種Boosting程序同樣比LSH編碼奏效,但是稍弱于RBM。但是,Boosting仍然面臨方法復(fù)雜度較高和高維索引效率較低的問題。為了克服上述問題,基于譜分析的哈希函數(shù)(spectralhashing)被提出。譜哈希對高維數(shù)據(jù)樣本集引入特征函數(shù)(eigenfunction),通過主成份分析(Principlecomponentanalysis,PCA)對高維數(shù)據(jù)降維后的結(jié)果直接進(jìn)行二元編碼,不僅提高了索引效率,而且在索引空間中所計(jì)算樣本距離與高維空間所計(jì)算樣本距離能保持一致。但是,譜哈希編碼過程中將使用PCA對原始空間進(jìn)行降維。PCA雖然是常用的數(shù)據(jù)降維方式,但PCA求得的主成分是幾乎所有原始變量的線性組合,而實(shí)際中降維所得的變量往往僅與原始的某幾個變量有關(guān)?;谶@點(diǎn),本發(fā)明引入SparsePCA(SPCA)的方法,對譜哈希方法進(jìn)行了改進(jìn)。
      發(fā)明內(nèi)容本發(fā)明的目的是克服現(xiàn)有技術(shù)的不足,提供一種基于稀疏降維的譜哈希索引方法。基于稀疏表達(dá)和拉普拉斯圖的哈希索引方法包括如下步驟1)將原始圖像利用SIFT方法提取圖像底層特征,得到具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征;2)對具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征利用K-means方法進(jìn)行聚類,用每個聚類中心作為視覺單詞,從而將原始圖像表示為高維空間的視覺單詞的向量;3)利用直接的稀疏主成分分析方法對高維空間的視覺單詞的向量進(jìn)行降維并稀疏化,得到低維空間的視覺單詞的稀疏向量;4)利用有權(quán)重的拉普拉斯-貝爾特拉米算子的特征方程和特征根,求得歐氏空間到漢明空間的映射函數(shù),從而將低維空間的視覺單詞的稀疏向量轉(zhuǎn)化為低維漢明空間向量;5)對于待檢索的圖像,在低維漢明空間中計(jì)算待檢索的圖像與原始圖像的漢明距離,作為圖像相似度計(jì)算結(jié)果,得到待檢索的圖像的相似圖像。所述的將原始圖像利用SIFT方法提取圖像底層特征,得到具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征步驟為對于包含N幅原始圖像的訓(xùn)練集,定義圖像的尺度空間L(x,y,σ)為如下公式L(X,y,σ)=G(x,yσ)*Ι(χ,y)其中G(x,y,σ)是尺度可變高斯函數(shù),G(xjp)=^^e+2+^/2σ2(x,y)是空間坐標(biāo),σ是尺度坐標(biāo),I(x,y)是圖像的像素值,則利用不同尺度坐標(biāo)生成高斯差分尺度空間D(x,y,σ),公式如下D(x,y,σ)=(G(χ,y,kσ)-G(χ,y,σ))ΦΙ(χ,y)=L(χ,y,kσ)-L(χ,y,σ)k為不同尺度空間的變化系數(shù),計(jì)算每個像素點(diǎn)的D(χ,y,σ),并與其相鄰的8個像素點(diǎn)以及相鄰尺度空間的9個像素點(diǎn),共26個像素點(diǎn)進(jìn)行比較,找到變化最大的像素點(diǎn),即為原始圖像的關(guān)鍵像素點(diǎn);關(guān)鍵像素點(diǎn)26個方向中變化最大的方向作為關(guān)鍵像素點(diǎn)的變化方向,以每個關(guān)鍵像素點(diǎn)為中心,四周取64個像素點(diǎn),每相鄰的4個像素點(diǎn)為一像素組,共得到16像素組,每個像素組的四個像素點(diǎn)的方向做向量相加得到像素組的方向,再投射到每個關(guān)鍵像素點(diǎn)的上、下、左、右、左上、右上、左下、右下八個方向上,得到8個坐標(biāo)值,共得到128個坐標(biāo)值,為一個圖像底層特征。所述的對具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征利用K-means方法進(jìn)行聚類,用每個聚類中心作為視覺單詞,從而將原始圖像表示為高維空間的視覺單詞的向量步驟為用m表示降維的維度,將所有圖像底層特征中的前m個作為m類,各自為自己的聚類中心,然后將剩余的圖像底層特征分別計(jì)算與各個聚類中心的距離,并將其加入距離最近的一類中,取各個類所有圖像底層特征的算術(shù)平均作為新的聚類中心,重復(fù)這一過程直至收斂,此時所有圖像底層特征聚為m類,將每類的中心作為視覺單詞,統(tǒng)計(jì)每幅圖像中每個視覺單詞出現(xiàn)的次數(shù),得到的m維向量用來表示原始圖像。所述的利用直接的稀疏主成分分析方法對高維空間的視覺單詞的向量進(jìn)行降維并稀疏化,得到低維空間的視覺單詞的稀疏向量步驟為將原始圖像構(gòu)成的向量作為行向量將訓(xùn)練集和測試集表示成矩陣形式,即原集合的特征矩陣X,根據(jù)如下公式計(jì)算特征矩陣的協(xié)方差矩陣ΣΣ=E[(X-E[X])(X-E(X))τ]其中E表示期望計(jì)算,T表示矩陣轉(zhuǎn)置,利用半正定約束近似計(jì)算協(xié)方差矩陣Σ的稀疏主成分P,并利用如下公式更新矩陣ΣΣ=Σ-(PtΣρ)ρρτ重復(fù)這一過程直到找到Σ的m個稀疏主成分{Pl,...,pm},將這些主成分向量作為矩陣的列向量,得到矩陣M,從而通過B=XXM得到新的NXm的低維空間的稀疏向量矩陣B。所述的利用有權(quán)重的拉普拉斯_貝爾特拉米算子的特征方程和特征根,求得歐氏空間到漢明空間的映射函數(shù),從而將低維空間的視覺單詞的稀疏向量轉(zhuǎn)化為低維漢明空間向量步驟為定義矩陣B的第j個列向量為Β(:,」),則<可以定義如下,2S2π§k其中k=1,...和巧"J分別表示B(:,j0的最大值和最小值,ε是一個常數(shù)。這樣對于每一個列向量Β(:,Λ,求得,因此共得到NXm個=…iV;/=l,…w)。排序《,取前m個巧記為,...,《in},假設(shè)對應(yīng)于Xi的二元編碼是yie{_l,l}m,則其第j個映射值y(i,j)由如下映射函數(shù)求得^rKTTy('·’J)=(Sfa,B(U0)-sin(-+———B(i,t))1BCJ)其中Vn為{W..,《m}的第j個最小值,它由k和B的第t列求得,和分別表示B(:,t)的最大值和最小值,i=(i,...N),j=(l,...m),以0作為閾值,所得值大于0則用1表示,否則則用-1表示,將歐式空間向量其轉(zhuǎn)化為二元編碼,即是漢明空間向量。所述的對于待檢索的圖像,在低維漢明空間中計(jì)算待檢索的圖像與原始圖像的漢明距離,作為圖像相似度計(jì)算結(jié)果,得到待檢索的圖像的相似圖像步驟為漢明空間向量是由{_1,1}組成的向量,向量之間的距離用漢明距離來度量,即將同維度向量之間不同元素的個數(shù)作為向量之間的距離,對于待檢索的圖像,得到漢明空間向量與原始圖像的漢明空間向量之間的漢明距離,返回漢明距離最近的一個向量所對應(yīng)的原始圖像,如果有多個向量與待檢索圖像的漢明距離相等,則全部作為待檢索的圖像的相似圖像返回。本發(fā)明與現(xiàn)有技術(shù)相比具有的有益效果1)本發(fā)明用稀疏降維方式代替譜哈希的主成分分析降維方式,增加了結(jié)果的可解釋性;2)本發(fā)明將歐氏空間的搜索問題映射到漢明空間,大大提高了搜索效率。圖1是LSH、RBM、stumpsboostingSSC方法的比較。在海明距離2作為搜索半徑,隨著維度增加各種方法的準(zhǔn)確率;圖2是本發(fā)明與譜哈希和RBM方法在Fl評價系統(tǒng)下的對比結(jié)果,其中點(diǎn)劃線為本發(fā)明結(jié)果,實(shí)線為譜哈希結(jié)果,虛線為RBM結(jié)果;圖3是本發(fā)明與譜哈希和RBM方法在AUC評價系統(tǒng)下的對比結(jié)果,其中點(diǎn)劃線為本發(fā)明結(jié)果,實(shí)線為譜哈希結(jié)果,虛線為RBM結(jié)果。具體實(shí)施例方式基于稀疏表達(dá)和拉普拉斯圖的哈希索引方法包括如下步驟1)將原始圖像利用SIFT方法提取圖像底層特征,得到具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征;2)對具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征利用K-means方法進(jìn)行聚類,用每個聚類中心作為視覺單詞,從而將原始圖像表示為高維空間的視覺單詞的向量;3)利用直接的稀疏主成分分析方法對高維空間的視覺單詞的向量進(jìn)行降維并稀疏化,得到低維空間的視覺單詞的稀疏向量;4)利用有權(quán)重的拉普拉斯-貝爾特拉米算子的特征方程和特征根,求得歐氏空間到漢明空間的映射函數(shù),從而將低維空間的視覺單詞的稀疏向量轉(zhuǎn)化為低維漢明空間向量;5)對于待檢索的圖像,在低維漢明空間中計(jì)算待檢索的圖像與原始圖像的漢明距離,作為圖像相似度計(jì)算結(jié)果,得到待檢索的圖像的相似圖像。所述的將原始圖像利用SIFT方法提取圖像底層特征,得到具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征步驟為對于包含N幅原始圖像的訓(xùn)練集,定義圖像的尺度空間L(x,y,σ)為如下公式L(X,y,σ)=G(x,yσ)*Ι(χ,y)其中G(x,y,σ)是尺度可變高斯函數(shù),((χ,;;,σ)二/2σ2(x,y)是空間坐標(biāo),σ是尺度坐標(biāo),I(x,y)是圖像的像素值,則利用不同尺度坐標(biāo)生成高斯差分尺度空間D(x,y,σ),公式如下D(x,y,σ)=(G(χ,y,kσ)-G(χ,y,σ))ΦΙ(χ,y)=L(χ,y,kσ)-L(χ,y,σ)k為不同尺度空間的變化系數(shù),計(jì)算每個像素點(diǎn)的D(χ,y,σ),并與其相鄰的8個像素點(diǎn)以及相鄰尺度空間的9個像素點(diǎn),共26個像素點(diǎn)進(jìn)行比較,找到變化最大的像素點(diǎn),即為原始圖像的關(guān)鍵像素點(diǎn);關(guān)鍵像素點(diǎn)26個方向中變化最大的方向作為關(guān)鍵像素點(diǎn)的變化方向,以每個關(guān)鍵像素點(diǎn)為中心,四周取64個像素點(diǎn),每相鄰的4個像素點(diǎn)為一像素組,共得到16像素組,每個像素組的四個像素點(diǎn)的方向做向量相加得到像素組的方向,再投射到每個關(guān)鍵像素點(diǎn)的上、下、左、右、左上、右上、左下、右下八個方向上,得到8個坐標(biāo)值,共得到128個坐標(biāo)值,為一個圖像底層特征。所述的對具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征利用K-means方法進(jìn)行聚類,用每個聚類中心作為視覺單詞,從而將原始圖像表示為高維空間的視覺單詞的向量步驟為用m表示降維的維度,將所有圖像底層特征中的前m個作為m類,各自為自己的聚類中心,然后將剩余的圖像底層特征分別計(jì)算與各個聚類中心的距離,并將其加入距離最近的一類中,取各個類所有圖像底層特征的算術(shù)平均作為新的聚類中心,重復(fù)這一過程直至收斂,此時所有圖像底層特征聚為m類,將每類的中心作為視覺單詞,統(tǒng)計(jì)每幅圖像中每個視覺單詞出現(xiàn)的次數(shù),得到的m維向量用來表示原始圖像。所述的利用直接的稀疏主成分分析方法對高維空間的視覺單詞的向量進(jìn)行降維并稀疏化,得到低維空間的視覺單詞的稀疏向量步驟為將原始圖像構(gòu)成的向量作為行向量將訓(xùn)練集和測試集表示成矩陣形式,即原集合的特征矩陣X,根據(jù)如下公式計(jì)算特征矩陣的協(xié)方差矩陣ΣΣ=E[(X-E[X])(X-E(X))τ]其中E表示期望計(jì)算,T表示矩陣轉(zhuǎn)置,利用半正定約束近似計(jì)算協(xié)方差矩陣Σ的稀疏主成分P,并利用如下公式更新矩陣ΣΣ=Σ-(PtΣρ)ρρτ重復(fù)這一過程直到找到Σ的m個稀疏主成分{Pl,...,pm},將這些主成分向量作為矩陣的列向量,得到矩陣M,從而通過B=XXM得到新的NXm的低維空間的稀疏向量矩陣B0所述的利用有權(quán)重的拉普拉斯_貝爾特拉米算子的特征方程和特征根,求得歐氏空間到漢明空間的映射函數(shù),從而將低維空間的視覺單詞的稀疏向量轉(zhuǎn)化為低維漢明空間向量步驟為定義矩陣B的第j個列向量為8(:」.),則<可以定義如下£2knk~TB^-BmJnSj=l-e其中k=1,...隊(duì)巧二和巧分別表示B(:,j0的最大值和最小值,ε是一個常數(shù)。這樣對于每一個列向量Β(:』,求得N個^,因此共得到NXm個《0=l,…iV;_/=l,…m)。排m],取前m個《記為,...,Cin},假設(shè)對應(yīng)于Xi的二元編碼是yie{_l,l}m,則其第j個映射值y(i,j)由如下映射函數(shù)求得ητΚ.7Γy(Uj)二Θ(Vn,B(i,0)-sin(-+B(i,t))2\t)其中^"in為丨丨的第j個最小值,它由k和B的第t列求得,A=和Sg分別表示B(:,t)的最大值和最小值,i=(i,...N),j=(l,...m),以0作為閾值,所得值大于0則用1表示,否則則用-1表示,將歐式空間向量其轉(zhuǎn)化為二元編碼,即是漢明空間向量。所述的對于待檢索的圖像,在低維漢明空間中計(jì)算待檢索的圖像與原始圖像的漢明距離,作為圖像相似度計(jì)算結(jié)果,得到待檢索的圖像的相似圖像步驟為漢明空間向量是由{_1,1}組成的向量,向量之間的距離用漢明距離來度量,即將同維度向量之間不同元素的個數(shù)作為向量之間的距離,對于待檢索的圖像,得到漢明空間向量與原始圖像的漢明空間向量之間的漢明距離,返回漢明距離最近的一個向量所對應(yīng)的原始圖像,如果有多個向量與待檢索圖像的漢明距離相等,則全部作為待檢索的圖像的相似圖像返回。實(shí)施例我們在TREC-V2009數(shù)據(jù)集上具體實(shí)現(xiàn)了上述方法。在所有關(guān)鍵幀中隨機(jī)選取3047幅圖像作為原始圖像,利用度可變高斯函數(shù)計(jì)算每一個像素點(diǎn),得到關(guān)鍵像素點(diǎn),提取圖像底層特征,再用k-means方法表示為300維空間的視覺單詞的向量,從而形成原始圖像特征矩陣X。再通過下述方法步驟得到漢明空間向量。輸入原始訓(xùn)練圖像集合X和編碼長度m;輸出每幅圖像的二元編碼;方法描述步驟1計(jì)算X的協(xié)方差矩陣Σ;步驟2計(jì)算Σ的m個稀疏主成分得到矩陣M;步驟3:B=XXM;步驟4計(jì)算矩陣Σ的NXm個《并升序排列;步驟5將B映射到漢明空間。另外隨機(jī)抽取45幅圖像作為待檢索圖像,計(jì)算求得待檢索圖像與原始圖像的漢明距離,返回相似圖像。返回結(jié)果與現(xiàn)有技術(shù)譜哈希、RBM的對比結(jié)果如圖2、圖3所示??梢钥闯觯覀兊姆椒▋?yōu)于現(xiàn)有方法。權(quán)利要求一種基于稀疏表達(dá)和拉普拉斯圖的哈希索引方法,其特點(diǎn)在于包括如下步驟1)將原始圖像利用SIFT方法提取圖像底層特征,得到具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征;2)對具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征利用Kmeans方法進(jìn)行聚類,用每個聚類中心作為視覺單詞,從而將原始圖像表示為高維空間的視覺單詞的向量;3)利用直接的稀疏主成分分析方法對高維空間的視覺單詞的向量進(jìn)行降維并稀疏化,得到低維空間的視覺單詞的稀疏向量;4)利用有權(quán)重的拉普拉斯貝爾特拉米算子的特征方程和特征根,求得歐氏空間到漢明空間的映射函數(shù),從而將低維空間的視覺單詞的稀疏向量轉(zhuǎn)化為低維漢明空間向量;5)對于待檢索的圖像,在低維漢明空間中計(jì)算待檢索的圖像與原始圖像的漢明距離,作為圖像相似度計(jì)算結(jié)果,得到待檢索的圖像的相似圖像。2.根據(jù)權(quán)利要求1所述的一種基于稀疏表達(dá)和拉普拉斯圖的哈希方法,其特點(diǎn)在于所述的將原始圖像利用SIFT方法提取圖像底層特征,得到具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征步驟為對于包含N幅原始圖像的訓(xùn)練集,定義圖像的尺度空間L(x,y,σ)為如下公式L(x,y,σ)=G(χ,yσ(χ,y)其中G(x,y,σ)是尺度可變高斯函數(shù),是空間坐標(biāo),σ是尺度坐標(biāo),I(x,y)是圖像的像素值,則利用不同尺度坐標(biāo)生成高斯差分尺度空間D(x,y,σ),公式如下k為不同尺度空間的變化系數(shù),計(jì)算每個像素點(diǎn)的D(χ,y,σ),并與其相鄰的8個像素點(diǎn)以及相鄰尺度空間的9個像素點(diǎn),共26個像素點(diǎn)進(jìn)行比較,找到變化最大的像素點(diǎn),即為原始圖像的關(guān)鍵像素點(diǎn);關(guān)鍵像素點(diǎn)26個方向中變化最大的方向作為關(guān)鍵像素點(diǎn)的變化方向,以每個關(guān)鍵像素點(diǎn)為中心,四周取64個像素點(diǎn),每相鄰的4個像素點(diǎn)為一像素組,共得到16像素組,每個像素組的四個像素點(diǎn)的方向做向量相加得到像素組的方向,再投射到每個關(guān)鍵像素點(diǎn)的上、下、左、右、左上、右上、左下、右下Λ個方向上,得到8個坐標(biāo)值,共得到128個坐標(biāo)值,為一個圖像底層特征。3.根據(jù)權(quán)利要求1所述的一種基于稀疏表達(dá)和拉普拉斯圖的哈希方法,其特征在于所述的對具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征利用K-means方法進(jìn)行聚類,用每個聚類中心作為視覺單詞,從而將原始圖像表示為高維空間的視覺單詞的向量步驟為用m表示降維的維度,將所有圖像底層特征中的前m個作為m類,各自為自己的聚類中心,然后將剩余的圖像底層特征分別計(jì)算與各個聚類中心的距離,并將其加入距離最近的一類中,取各個類所有圖像底層特征的算術(shù)平均作為新的聚類中心,重復(fù)這一過程直至收斂,此時所有圖像底層特征聚為m類,將每類的中心作為視覺單詞,統(tǒng)計(jì)每幅圖像中每個視覺單詞出現(xiàn)的次數(shù),得到的m維向量用來表示原始圖像。4.根據(jù)權(quán)利要求1所述的一種基于稀疏表達(dá)和拉普拉斯圖的哈希方法,其特點(diǎn)在于所述的利用直接的稀疏主成分分析方法對高維空間的視覺單詞的向量進(jìn)行降維并稀疏化,得到低維空間的視覺單詞的稀疏向量步驟為將原始圖像構(gòu)成的向量作為行向量將訓(xùn)練集和測試集表示成矩陣形式,即原集合的特征矩陣X,根據(jù)如下公式計(jì)算特征矩陣的協(xié)方差矩陣Σ其中E表示期望計(jì)算,T表示矩陣轉(zhuǎn)置,利用半正定約束近似計(jì)算協(xié)方差矩陣Σ的稀疏主成分P,并利用如下公式更新矩陣Σ重復(fù)這一過程直到找到Σ的m個稀疏主成分(Pl,...,pm},將這些主成分向量作為矩陣的列向量,得到矩陣M,從而通過B=XXM得到新的NXm的低維空間的稀疏向量矩陣B。5.根據(jù)權(quán)利要求1所述的一種基于稀疏表達(dá)和拉普拉斯圖的哈希方法,其特點(diǎn)在于所述的利用有權(quán)重的拉普拉斯_貝爾特拉米算子的特征方程和特征根,求得歐氏空間到漢明空間的映射函數(shù),從而將低維空間的視覺單詞的稀疏向量轉(zhuǎn)化為低維漢明空間向量步驟為定義矩陣B的第j個列向量為Β(:,Λ,則<可以定義如下其中k=1,...N,巧1^和巧分別表示B(…)的最大值和最小值,ε是一個常數(shù)。這樣對于每一個列向量Β(:,」),求得N個《,因此共得到NXm個==...m)。排序<,取前m個<記為WZnin,...,δΓ},假設(shè)對應(yīng)于Xi的二元編碼是Yie{-l,l}m,則其第j個映射值y(i,j)由如下映射函數(shù)求得其中為{f,...jj3}的第j個最小值,它由k和B的第t列求得,《廠和辟分別表示B(:,t)的最大值和最小值,i=(i,...N),j=(1,...m),以0作為閾值,所得值大于0則用1表示,否則則用-1表示,將歐式空間向量其轉(zhuǎn)化為二元編碼,即是漢明空間向量。6.根據(jù)權(quán)利要求1所述的一種基于稀疏表達(dá)和拉普拉斯圖的哈希方法,其特點(diǎn)在于所述的對于待檢索的圖像,在低維漢明空間中計(jì)算待檢索的圖像與原始圖像的漢明距離,作為圖像相似度計(jì)算結(jié)果,得到待檢索的圖像的相似圖像步驟為漢明空間向量是由{-1,1}組成的向量,向量之間的距離用漢明距離來度量,即將同維度向量之間不同元素的個數(shù)作為向量之間的距離,對于待檢索的圖像,得到漢明空間向量與原始圖像的漢明空間向量之間的漢明距離,返回漢明距離最近的一個向量所對應(yīng)的原始圖像,如果有多個向量與待檢索圖像的漢明距離相等,則全部作為待檢索的圖像的相似圖像返回。全文摘要本發(fā)明公開了一種基于稀疏表達(dá)和拉普拉斯圖的哈希索引方法。包括如下步驟1)將原始圖像利用SIFT方法提取圖像底層特征;2)對圖像底層特征利用K-means方法進(jìn)行聚類,用每個聚類中心作為視覺單詞;3)利用直接的稀疏主成分分析方法對視覺單詞的向量進(jìn)行降維并稀疏化;4)利用有權(quán)重的拉普拉斯-貝爾特拉米算子的特征方程和特征根,求得歐氏空間到漢明空間的映射函數(shù),得到低維漢明空間向量;5)對于待檢索的圖像,在低維漢明空間中計(jì)算待檢索的圖像與原始圖像的漢明距離,作為圖像相似度計(jì)算結(jié)果。本發(fā)明用稀疏降維方式代替譜哈希的主成分分析降維方式,增加了結(jié)果的可解釋性;將歐氏空間的搜索問題映射到漢明空間,大大提高了搜索效率。文檔編號G06F17/30GK101894130SQ201010196539公開日2010年11月24日申請日期2010年6月8日優(yōu)先權(quán)日2010年6月8日發(fā)明者吳飛,張嘯,邵健申請人:浙江大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1