本發(fā)明涉及信息安全技術(shù)領(lǐng)域,具體的說是一種基于sift特征點投影的緊湊型圖像哈希方法,該方法能有效地對圖像拷貝進行檢測,可用于對互聯(lián)網(wǎng)中的數(shù)字圖像進行識別與監(jiān)測,防止非法傳播。
背景技術(shù):
伴隨著計算機、互聯(lián)網(wǎng)、圖像、視頻獲取技術(shù)的迅猛發(fā)展,多媒體信息的使用與傳播越來越便利。但與此同時,互聯(lián)網(wǎng)在豐富人們生活的同時,傳播過程也摻雜了一些受版權(quán)保護和非法的圖像,它們的傳播一方面極大損害了版權(quán)者的利益,另一方面也對社會造成了不良影響。數(shù)字媒體的版權(quán)保護和監(jiān)管除了相關(guān)法規(guī)約束管理外,都需要技術(shù)上的支持和保證,來識別和限制非法多媒體數(shù)據(jù)的傳播。
圖像哈希技術(shù)可以有效的分析和識別圖像數(shù)據(jù)。圖像哈希指從原始圖像數(shù)據(jù)中提取出魯棒特征,并對其經(jīng)過壓縮或量化處理形成更短的二值序列,目的是用很少量的數(shù)據(jù)表示大量的原始圖像數(shù)據(jù),以便在圖像拷貝檢測、數(shù)據(jù)監(jiān)控、圖像認證等應(yīng)用中代表原始圖像參與計算,也有文獻中將其稱為圖像摘要、圖像指紋、圖像簽名等。魯棒性、獨特性和緊湊性是哈希三個重要特性,魯棒性指提取的特征在多媒體數(shù)據(jù)受到常規(guī)信號處理或噪聲干擾后保持不變,是實現(xiàn)正確匹配率的基礎(chǔ);獨特性表示不同圖像哈希序列的相似度應(yīng)盡可能低,是實現(xiàn)低誤檢率的基礎(chǔ);緊湊性指圖像哈希序列的長度足夠短,是實現(xiàn)低存儲空間和快速匹配的基礎(chǔ)。
哈希技術(shù)的一個重要環(huán)節(jié)是魯棒特征提取,即從原始多媒體數(shù)據(jù)中提取出少量的、獨特的、穩(wěn)定的信息,該信息通常為實值序列。哈希技術(shù)的另一個重要環(huán)節(jié)是特征表示,就是將提取的實值哈希序列通過量化過程轉(zhuǎn)換為二值哈希序列,便于存儲與匹配。從特征提取時涉及的圖像區(qū)域來劃分,分為全局特征和局部特征。全局特征描述圖像的整體信息,是圖像宏觀層面信息的表示;局部特征代表圖像的局部信息,反映了圖像區(qū)域特性。
典型的全局特征提取方法有小波變換(discretewavelettransform,dwt)、奇異值分解(sigularvaluedecomposiont,svd)、非負矩陣分解(non-negativematrixfactorization,nmf)等。文獻r.venkatesan,s.koon,m.jakubowski,andp.moulin.robustimagehashing.ieeeinternationalconferenceonimageprocessing(icip),2000,vol.3,pp.664-666.將圖像進行隨機分塊,對子塊進行小波變換,對系數(shù)進行處理后組成哈希序列。文獻s.kozat,r.venkatesan,andm.mihcak.robustperceptualimagehashingviamatrixinvariants.ieeeinternationalconferenceonimageprocessing(icip),2004,vol.5,pp.3443-3446.采用矩陣奇異值分解方法,利用分解得到的特征向量構(gòu)建了200維的實值哈希序列。在此基礎(chǔ)上,文獻v.mongaandm.mhcak.robustandsecureimagehashingvianonnegativematrixfactorizations.ieeetransactiononinformationforensicsandsecurity,vol.2,no.3,pp.376-390,sep.2007.采用非負矩陣分解實現(xiàn)了64維的實值哈希序列,魯棒性和緊湊性都得到了提高。這一類方法在進行特征提取時都先把原始圖像不同程度的分解為子塊圖像,然后進行特征提取,最后依據(jù)特征關(guān)系構(gòu)建哈希序列。實質(zhì)是利用全局特征提取方法描述區(qū)域特征,再將區(qū)域特征組合表達全局特性。
典型的局部特征以特征點為代表,描述了圖像局部區(qū)域中的突出性質(zhì)。比如harris興趣點、尺度不變特征變換(scaleinvariantfeaturetransform,sift)特征點、主成分分析-尺度不變特征變換(principlecomponentanalysis-scaleinvariantfeaturetransform,pca-sift)特征、加速魯棒特征(speededuprobustfeatures,surf)。文獻d.lowe.distinctiveimagefeaturesfromscale-invariantkeypoints.internationaljournalofcomputervision,vol.2,no.60,pp.91-110,2004.提出的sift特征具有對旋轉(zhuǎn)、尺度和亮度不變性,同時對仿射變換、視角變化和噪聲等也有一定的魯棒性,在各種特征點中具有最好性能。pca-sift和surf在計算效率上做了改善,但以犧牲一定程度的魯棒性為代價。文獻[12]劉兆慶,李瓊,劉景瑞,彭喜元.一種基于sift的圖像哈希算法,儀器儀表學(xué)報,vol.32no.9,september2011,pp.2024-2028.以分布質(zhì)心為標準對提取的sift特征點進行篩選并量化,最后生成若干個二值哈希序列。文獻xudonglv,andz.janewang.perceptualimagehashingbasedonshapecontextsandlocalfeaturepoints.ieeetransactionsoninformationforensicsandsecurity,vol.7,no.3,pp.1081-10836,mar.2012.將用于目標識別的形狀語義和sift特征點結(jié)合提出了一種的哈希算法,得到實值哈希序列的維數(shù)降低至20維,綜合性能相比nmf方法也得到了大幅提高。文獻hefeiling,lingyuyan,fuhaozou,congliu,huifeng.fastimagecopydetectionapproachbasedonlocalfingerprintdefinedvisualwords.signalprocessing,93,pp.2328-2338,2013.將每一sift描述子量化為32比特二值序列作為詞典中一個元素,在此基礎(chǔ)上設(shè)計了一種快速檢索框架,魯棒性和檢索效率都取得了不錯效果。文獻顏雪軍,趙春霞,袁夏.2dpca-sift:一種有效的局部特征描述方法,自動化學(xué)報vol.40,no.4,april,2014,pp.675-582.為了提高pca-sift的計算效率,提出了2dpca-sift方法,在保證性能相當?shù)耐瑫r降低了計算復(fù)雜度。以上方法均是以sift的描述子為基礎(chǔ)構(gòu)建的哈希序列,沒有著重考慮哈希的緊湊性,并且上述方法中對每一幅圖像提取若干個特征點,每個特征點對應(yīng)一個哈希子序列,即每幅圖像對應(yīng)若干個哈希子序列,采用交互匹配方式對數(shù)據(jù)庫中所有哈希序列進行匹配,提高了匹配次數(shù)導(dǎo)致計算效率降低。
sift特征是圖像局部區(qū)域梯度突出關(guān)系的一種反映,不但對旋轉(zhuǎn)、尺度縮放具有不變性,同時對亮度變化、噪聲、濾波具有很好的魯棒性,并且對每幅圖像生成的特征點數(shù)量非常多,這些因素使得圖像中的特征點保持數(shù)量和位置分布的穩(wěn)定性。圖1給出了1000幅圖像的sift數(shù)量變化圖,從上到下依次對應(yīng)原始圖像、模板3*3的中值濾波、jpeg壓縮30%、添加鹽椒噪聲(密度0.03)、亮度變換(gamma因子1.1),其中第一行是特征點數(shù)量,圖像的特征點數(shù)量范圍為52~1118,平均值約為470。圖1第2行至第5行為特征點數(shù)量變化率,均值依次為5.2%、42.4%、7.3%,-1.4%。圖像受到中值濾波、鹽椒噪聲、亮度變換時特征點數(shù)量相對穩(wěn)定,受到深度有損壓縮時,圖像解碼過程中失去了較多細節(jié)信息,圖像局部數(shù)據(jù)變化不夠平滑,導(dǎo)致特征點數(shù)量增加幅度較大。通過深入分析發(fā)現(xiàn),增加或減少的特征點總體位置分布比較均勻,也就是說特征點的變化基本不影響總體分布,特征點在局部區(qū)域內(nèi)的數(shù)量關(guān)系相對穩(wěn)定。圖2給出了8幅圖像特征點在x軸上投影的分布情況,從上到下依次對應(yīng)原始圖像、中值濾波、jpeg壓縮、添加噪聲、亮度變換,從中可以看出投影點總體分布趨勢基本保持不變。按照類似分析方法,得到特征點的方向分布較特征點投影分布更為穩(wěn)定,可以直接用來構(gòu)造二值哈希。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于利用圖像歸一化方向和全部sift特征點在圖像中分布的獨特性和穩(wěn)定性作為圖像的特征,將不同區(qū)域特征點數(shù)量關(guān)系組建二值哈希序列,利用歸一化方向作為哈希索引提高匹配準確率和效率。本方法在失真拷貝檢測方面不但具有很高的檢測準確度,而且哈希編碼長度明顯降低,從根本上提高了匹配效率。
本發(fā)明在設(shè)計哈希算法時將穩(wěn)定的歸一化方向和sift特征點相結(jié)合組成哈希表,并且綜合衡量方法的魯棒性與緊湊性,在滿足魯棒性要求下,設(shè)計最緊湊的二值哈希序列。本發(fā)明在魯棒性、獨特性、緊湊性三個方面都能取得較好效果。本發(fā)明的哈希登記過程和哈希匹配過程如圖3所示,特征點投影如圖4所示。下面分別詳細敘述哈希登記與匹配過程。
哈希登記過程如下:
(1)對待登記圖像計算歸一化方向,檢測所有sift特征點;
(2)以圖像中心為坐標原點,以歸一化方向為參考建立投影直線系;
(3)將sift特征點投影在直線上,根據(jù)投影點到參考點的距離得到序列向量;
(4)對得到的距離序列劃分區(qū)間,統(tǒng)計各區(qū)間元素數(shù)量;
(5)根據(jù)相鄰區(qū)間像素的數(shù)量關(guān)系生成二值哈希子序列;
(6)重復(fù)步驟(3)~(5),對所有直線生成哈希子序列;
(7)按照步驟(4)、(5),將sift特征點的方向生成哈希子序列;
(8)將所有哈希子序列串接形成哈希序列;
(9)以歸一化方向為索引,將哈希序列登記入數(shù)據(jù)庫。
哈希匹配過程如下:
(1)對待檢圖像計算歸一化方向和旋轉(zhuǎn)方向、檢測所有sift特征點;
(2)以圖像中心為坐標原點,用旋轉(zhuǎn)方向?qū)w一化方向進行補償,建立投影直線系;
(3)將sift特征點投影在直線上,根據(jù)投影點到參考點的距離得到序列向量;
(4)對得到的距離序列劃分區(qū)間,統(tǒng)計各區(qū)間元素數(shù)量;
(5)根據(jù)相鄰區(qū)間像素的數(shù)量關(guān)系生成二值哈希子序列;
(6)重復(fù)步驟(3)~(5),對所有直線生成哈希子序列;
(7)按照步驟(4)、(5),將sift特征點的方向生成哈希子序列;
(8)將所有哈希子序列串接形成哈希序列;
(9)以歸一化方向為參考標準,在哈希數(shù)據(jù)庫中確定參考范圍,與確定范圍內(nèi)的哈希計算漢明距離;
(10)用漢明距離與設(shè)定閾值進行比較作出待檢圖像是否為數(shù)據(jù)庫中已登記圖像的判斷。
本發(fā)明可以有效檢測圖像失真拷貝,魯棒性得到保證的同時,哈希編碼長度獲得明顯降低,從根本上提高了匹配效率。
附圖說明
圖1sift特征點在失真圖像拷貝變化情況(原始圖像、中值濾波、jpeg壓縮、鹽椒噪聲、亮度變換);
圖2sift特征點在x軸投影分布(1原始圖像2中值濾波3jpeg壓縮4鹽椒噪聲5亮度變換);
圖3哈??蚣?;
圖4特征點投影到直線示意圖;
圖5jpeg壓縮失真拷貝的查準率-查全率;
圖6旋轉(zhuǎn)、縮放失真拷貝的查準率-查全率;
圖7濾波失真拷貝的查準率-查全率;
圖8添加噪聲或亮度非線性變換失真拷貝的查準率-查全率;
圖9平均查準率-查全率。
具體實施方式
哈希登記過程具體分為下面九個步驟:
第一步:計算歸一化方向和檢測特征點。設(shè)待登記圖像i′大小為m′×n′,將其變換為m×m的圖像i,其中m=min(m′,n′),計算圖像i的歸一化方向θ,檢測所有sift特征點s={si|i∈λ},λ表示所有特征點下標集合。
第二步:建立直線系。將圖像的坐標原點(0,0)平移至(m/2,m/2),建立4條直線組成的直線系,方向分別為θ、
第三步:計算點si在直線y=kx上的投影距離。假設(shè)特征點si在新坐標系中的坐標為(ai,bi),其在直線y=kx上的投影點為
第四步:計算區(qū)間投影向量。組成元素升序的投影距離向量d={di|di≤di+1,i∈λ},將[-m/2,m/2]均分為p+1個區(qū)間,統(tǒng)計向量d中元素落在各區(qū)間的數(shù)量得到v=[v1,v2,…,vj,vj+1,…,vp+1],vj=size([dj,dj+1])表示落在第j個區(qū)間的投影點數(shù)量。
第五步:構(gòu)建哈希子序列。根據(jù)區(qū)間投影向量v構(gòu)建h1=[h1,h2,…,hj,hj+1,…,hp],hj=0ifvj≥vj+1,hj=1ifvj<vj+1。
第六步:重復(fù)第二步至第四步得到h2,h3,h4。
第七步:計算區(qū)間方向向量ω。組成元素升序的方向向量γ={γi|γi≤γi+1,i∈λ},γi表示特征點si的方向,將[-π,π]均分為q+1個區(qū)間,統(tǒng)計向量γ中元素落在各區(qū)間的數(shù)量得到ω={ω1,ω2…,ωj,ωj+1,…,ωq+1},其中ωj=size([γj,γj+1])表示第j區(qū)間的元素數(shù)量。
第八步:構(gòu)建哈希子序列。根據(jù)區(qū)間方向向量ω構(gòu)建hω=[h1,h2,…,hj,hj+1,…,hq],hj=0ifωj≥ωj+1,hj=1ifωj<ωj+1。
第九步:哈希序列登記入庫。生成哈希序列hα=h1⊕…⊕h4⊕hω,符號⊕表示向量串聯(lián)。以歸一化方向θα=θ為索引,將哈希序列入庫σ={(θα,hα)|θα≤θα+1,α∈α}。
哈希匹配過程具體分為下面十一個步驟:
第一步:計算歸一化方向、特征點、旋轉(zhuǎn)角度。設(shè)待匹配圖像
第二步:建立直線系。將圖像的坐標原點(0,0)平移至(
第三步:計算點
第四步:計算區(qū)間投影向量。組成元素升序的投影距離向量
第五步:構(gòu)建哈希子序列。根據(jù)區(qū)間投影向量
第六步:重復(fù)第二步至第四步得到
第七步:計算區(qū)間方向向量
第八步:構(gòu)建哈希子序列。根據(jù)區(qū)間方向向量
第九步:生成哈希序列
第十步:計算漢明距離。依據(jù)歸一化方向θ與數(shù)據(jù)庫中索引θα確定匹配范圍
第十一步:作出是否登記判斷。如果hdα≥threshold則第α幅圖像為已登記圖像,否則為未登記圖像。
為了說明發(fā)明的性能,采用查準率與查全率評價算法的性能,定義查準率和查全率分別為
其中tp表示正確匹配的數(shù)量,即哈希庫中已注冊數(shù)據(jù)被正確識別的數(shù)量;fp表示錯誤匹配的數(shù)量,即哈希庫中未注冊數(shù)據(jù)被錯認為已注冊數(shù)據(jù)的數(shù)量;fn表示漏匹配的數(shù)量,即哈希庫中已注冊數(shù)據(jù)未被識別出的數(shù)量。查準率precision表示系統(tǒng)檢測的準確率,對應(yīng)哈希的獨特性;查全率recall反映系統(tǒng)檢測的全面性,對應(yīng)哈希的魯棒性,兩者的值越高表明系統(tǒng)的獨特性和魯棒性越好。將閾值在一范圍內(nèi)變化,可以得到一組pr數(shù)據(jù),然后用曲線表示可以得到pr曲線圖。
采用corel數(shù)據(jù)庫進行仿真,數(shù)據(jù)庫中1000幅圖像共分10種類別,分別包含非洲人、海灘、建筑、公交車、恐龍、大象、花、馬、山脈、食物。投影區(qū)間數(shù)量參數(shù)p分別設(shè)置為30和20,方向區(qū)間數(shù)量q設(shè)置20,哈希序列總長度分別為140和100比特。閾值變化范圍設(shè)為0.6~0.85。對數(shù)據(jù)庫中的圖像分別生成24幅拷貝,1000幅圖像共得到24000幅失真拷貝。失真拷貝包括7幅jpeg壓縮圖像(0.3~0.9間隔0.1),4幅亮度非線性變換圖像(gamma因子0.8~1.2),1幅中值濾波圖像(模板3×3),1幅高斯濾波圖像(模板3×3),2幅維納濾波圖像(模板3×3,5×5),2幅鹽椒噪聲圖像(密度0.02,0.03),2幅高斯噪聲圖像(方差0.004),1幅乘性噪聲圖像(強度0.02),2幅縮放圖像(因子0.8,1.2),3幅旋轉(zhuǎn)圖像(2,5,10度)。結(jié)果見圖5、圖6、圖7、圖8、圖9。