本發(fā)明屬于計算機(jī)圖像處理和模式識別技術(shù)領(lǐng)域,具體涉及基于余弦距離和中心輪廓距離的兩次植物物種識別方法。
背景技術(shù):
植物及其物種多樣化是人和所有動物賴以生存的物質(zhì)基礎(chǔ),由于多年來的亂砍亂伐和近年來大規(guī)模的城市擴(kuò)張以及超常態(tài)的經(jīng)濟(jì)發(fā)展,導(dǎo)致很多植物物種頻臨滅絕或已經(jīng)滅絕,從而嚴(yán)重影響了生態(tài)平衡?,F(xiàn)在各國政府和很多民眾已經(jīng)認(rèn)識到了保護(hù)植物物種的重要性,隨著計算機(jī)技術(shù)和圖像處理技術(shù)的不斷發(fā)展,植物物種識別成為一個較為熱門的研究方向,出現(xiàn)了很多利用植物葉片圖像進(jìn)行植物物種自動識別的方法和系統(tǒng),杜吉祥等人提出葉片形狀和神經(jīng)網(wǎng)絡(luò)的植物識別方法【Du,J.X.,Huang,D.S.,Wang,X.F.,et al.Shape Recognition Based on Neural Networks Trained by Differential Evolution Algorithm.Neurocomputing,2007,70:896-903;Du,J.X.,Zhai,C.M.,Wang,Q.P.Recognition of plant leaf image based on fractal dimension feature.Neurocomputing,2013,116:150-156;】,Chaki等人提出了基于葉片紋理和形狀的植物識別方法【Jyotismita Chaki,Ranjan Parekh,Samar Bhattacharya.Plant Leaf Recognition using Texture and Shape Features with Neural Classifiers.Pattern Recognition Letters,2015,58(C):61-68】。傳統(tǒng)的基于葉片圖像的植物物種識別方法和系統(tǒng)主要研究如何精確提取植物葉片圖像的分類特征。但由于植物葉片圖像的復(fù)雜多樣性,使得很多方法和系統(tǒng)的識別效果不能滿足在大規(guī)模數(shù)據(jù)庫上的植物物種識別的實(shí)際需要。
技術(shù)實(shí)現(xiàn)要素:
為了克服上述現(xiàn)有植物物種識別方法技術(shù)的缺點(diǎn),本發(fā)明的目的在于提供基于余弦距離和中心輪廓距離的兩次植物物種識別方法,提高了植物物種識別方法的速度和精度。
為了達(dá)到上述目的,本發(fā)明采取的技術(shù)方案為:
基于余弦距離和中心輪廓距離的兩次植物物種識別方法,包括如下步驟:
步驟一、將所有有類別標(biāo)簽的C種植物葉片圖像組成訓(xùn)練圖像集,然后將所有訓(xùn)練集中的樣本和一幅待識別的葉片圖像轉(zhuǎn)換成灰度圖像,再將所有灰度圖像縮放為大小都為64×64像素的圖像,處理后的訓(xùn)練集中的C個灰度圖像子集的集合記為{G1,G2,...,GC},處理后的待識別葉片圖像的灰度圖像記為g;
步驟二、計算{G1,G2,...,GC}中的每幅圖像與g的余弦距離,
其中:gij為第i類子集Gi中的第j幅灰度圖像,T表示矩陣轉(zhuǎn)置;
然后計算{G1,G2,...,GC}中的每個圖像子集與g的平均余弦距離,
其中:ni為Gi中的圖像數(shù)目,i=1,2,...,C;
步驟三、將步驟二得到的C個平均余弦距離由大到小進(jìn)行排序,選擇前個平均余弦距離對應(yīng)的個不同種類灰度圖像子集作為待識別圖像g的候選集,其中表示取不大于的整數(shù)運(yùn)算;
步驟四、對于候選集中任意一幅灰度圖像和待識別的灰度圖像g,利用Canny邊緣檢測方法提取灰度圖像的邊緣輪廓點(diǎn)的坐標(biāo),選擇該圖像的所有輪廓點(diǎn)中縱坐標(biāo)最大的點(diǎn)作為起始點(diǎn),按照逆時針順序?qū)⒃搱D像的所有輪廓點(diǎn)進(jìn)行排序,記為{(x1,y1),(x2,y2),...,(xp,yp)},p為輪廓點(diǎn)的數(shù)目,然后計算輪廓點(diǎn)的中心點(diǎn)的坐標(biāo),記為(x0,y0),其中x0和y0分別為再計算中心距離向量[d1,d2,d3,...,dp],其中di(i=1,2...,p)表示第i個輪廓點(diǎn)(xi,yi)到中心點(diǎn)(x0,y0)的歐氏距離,計算向量[d1,d2,...,dp]的長度為128的快速傅里葉變換,
其中:τ為單位復(fù)數(shù)
計算式(3)對應(yīng)的幅度譜向量,記為[F0,F1,F2,...,F127],將其歸一化為然后去掉該向量的第一項后得到作為該圖像的中心輪廓特征向量;
步驟五、利用步驟四得到待識別灰度圖像g和它的候選集中的每幅葉片圖像的中心輪廓特征向量,計算待識別灰度圖像g的中心輪廓特征向量和它的候選集中的每幅葉片圖像的中心輪廓特征向量之間的相似度,
其中:F為g的中心輪廓特征向量,F(xiàn)st為候選集中第s類子圖像集中的第t幅灰度圖像的中心輪廓特征向量;
從候選集集中選擇前三個最大的相似度對應(yīng)的圖像,判別選擇的三幅圖像是否屬于同一類,若是屬于同一類,則待識別圖像的類別屬于這一類別,識別過程結(jié)束,否則選擇前5個最大的相似度對應(yīng)的不同類圖像子集,計算每個子集中所有圖像與g的中心輪廓特征向量之間的相似度的平均值,再選擇最大的平均相似度對應(yīng)的圖像類別,則待識別圖像的類別屬于這一類別。
本發(fā)明的有益效果為:本發(fā)明首先通過余弦距離法排除大規(guī)模訓(xùn)練樣本集中與待識別葉片圖像差異較大的圖像類別,從而大幅度地減小了算法的時間復(fù)雜度;然后利用中心輪廓距離法得到圖像的分類特征,該特征對圖像的顏色、變換、大小尺寸和旋轉(zhuǎn)具有魯棒性,由此計算待識別圖像與候選集中的每幅圖像之間的相似度,再進(jìn)行圖像類別識別。該方法能夠快速識別葉片圖像類別,而且減少實(shí)際圖像識別中圖像之間的顏色差異、大小不同、不對齊和圖像變換對識別效果帶來的影響;利用該方法能夠快速、很好地在大規(guī)模植物物種數(shù)據(jù)庫中識別未知植物物種。本發(fā)明在普通PC計算機(jī)上實(shí)現(xiàn),對操作系統(tǒng)沒有要求。
附圖說明
圖1-1和圖1-2是兩幅原始葉片圖像。
圖2-1和圖2-2是兩幅葉片圖像的輪廓圖像。
圖3-1和圖3-2是兩幅輪廓圖像的中心輪廓距離特征向量。
圖4-1和圖4-2是兩個中心輪廓距離特征向量的頻域特征向量。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對本發(fā)明進(jìn)行詳細(xì)說明。
基于余弦距離和中心輪廓距離的兩次植物物種識別方法,包括如下步驟:
步驟一、將所有有類別標(biāo)簽的C種植物葉片圖像組成訓(xùn)練圖像集,然后將所有訓(xùn)練集中的樣本和一幅待識別的葉片圖像轉(zhuǎn)換成灰度圖像,再將所有灰度圖像縮放為大小都為64×64像素的圖像,處理后的訓(xùn)練集中的C個灰度圖像子集的集合記為{G1,G2,...,GC},處理后的待識別葉片圖像的灰度圖像記為g;
步驟二、計算{G1,G2,...,GC}中的每幅圖像與g的余弦距離,
其中:gij為第i類子集Gi中的第j幅灰度圖像,T表示矩陣轉(zhuǎn)置;
然后計算{G1,G2,...,GC}中的每個圖像子集與g的平均余弦距離,
其中:ni為Gi中的圖像數(shù)目,i=1,2,...,C;
步驟三、將步驟二得到的C個平均余弦距離由大到小進(jìn)行排序,選擇前個平均余弦距離對應(yīng)的個不同種類灰度圖像子集作為待識別圖像g的候選集,其中表示取不大于的整數(shù)運(yùn)算;
參照圖1-1和圖1-2,從圖1-1和圖1-2可以看出,不同植物物種的葉片圖像之間有差異,若差異很大,就可以利用不同類植物葉片圖像之間的余弦距離將他們區(qū)分開;
步驟四、對于任意候選集中的一幅灰度圖像和待識別灰度圖像g,利用Canny邊緣檢測方法提取灰度圖像的邊緣輪廓點(diǎn)的坐標(biāo),如圖2-1和如2-2所示,由于得到的邊緣輪廓點(diǎn)是二維數(shù)據(jù),在葉片圖像識別中不容易處理,所以計算對應(yīng)的輪廓中心距離向量;
選擇該圖像的所有輪廓點(diǎn)中縱坐標(biāo)最大的點(diǎn)作為起始點(diǎn),按照逆時針順序?qū)⒃搱D像的所有輪廓點(diǎn)進(jìn)行排序,記為{(x1,y1),(x2,y2),...,(xp,yp)},p為輪廓點(diǎn)的數(shù)目,然后計算輪廓點(diǎn)的中心點(diǎn)的坐標(biāo),記為(x0,y0),其中x0和y0分別為再計算中心距離向量[d1,d2,d3,...,dp],其中di(i=1,2...,p)表示第i個輪廓點(diǎn)(xi,yi)到中心點(diǎn)(x0,y0)的歐氏距離,如圖3-1和圖3-2所示,由于中心輪廓距離向量與輪廓的起始點(diǎn)選擇有關(guān),所以計算對應(yīng)的傅里葉變換;
計算向量[d1,d2,...,dp]的長度為128的快速傅里葉變換,
其中:τ為單位復(fù)數(shù)
計算式(3)對應(yīng)的幅度譜向量,記為[F0,F1,F2,...,F127],將其歸一化為然后去掉該向量的第一項后得到作為該圖像的中心輪廓特征向量,該向量不隨葉片圖像的旋轉(zhuǎn)、平移和尺度變化而變化,在植物物種識別中具有魯棒性。圖4-1和圖4-2分別是圖3-1和圖3-2對應(yīng)的幅度譜向量,該向量具有魯棒性,不隨圖像的旋轉(zhuǎn)、平移和尺度大小變化而變化;
步驟五、利用步驟四得到待識別灰度圖像g和它的候選集中的每幅葉片圖像的中心輪廓特征向量,然后計算待識別灰度圖像g的中心輪廓特征向量和它的候選集中的每幅葉片圖像的中心輪廓特征向量之間的相似度,
其中:F為g的中心輪廓特征向量,F(xiàn)st為候選集中第s類子圖像集中的第t幅灰度圖像的中心輪廓特征向量;
選擇前三個最大的相似度對應(yīng)的圖像,判別選擇的三幅圖像是否屬于同一類,若是屬于同一類,則待識別圖像的類別屬于這一類別,識別過程結(jié)束,否則選擇前5個最大的相似度對應(yīng)的不同類圖像子集,計算每個子集中所有圖像與g的中心輪廓特征向量之間的相似度的平均值,再選擇最大的平均相似度對應(yīng)的圖像類別,則待識別圖像的類別屬于這一類別。