甘蔗種芽完好性分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及甘蔗種芽的分類方法,特別涉及一種甘蔗種芽完好性分類方法。
【背景技術(shù)】
[0002] 貝葉斯決策(BayesianDecisionTheory)就是在不完全情報(bào)下,對(duì)部分未知的狀 態(tài)用主觀概率估計(jì),然后用貝葉斯公式對(duì)發(fā)生概率進(jìn)行修正,最后再利用期望值和修正概 率做出最優(yōu)決策。
[0003] 廣西是我國最大的甘蔗產(chǎn)區(qū),連續(xù)多年產(chǎn)量超過全國總產(chǎn)量的60%。目前大力推 廣的甘蔗機(jī)械化種植技術(shù)無法實(shí)現(xiàn)種芽完好性檢測以及不能實(shí)現(xiàn)自動(dòng)剔除種芽破損的甘 蔗種的功能,進(jìn)而不能保證新植甘蔗的出芽率?,F(xiàn)階段對(duì)于保證甘蔗種芽完好的研究都是 通過定位甘蔗莖節(jié),間接確定甘蔗種芽位置,然后控制切刀避開種芽位置,對(duì)甘蔗種芽完好 性分類方法的研究基本上還是一片空白。
[0004] 公開于該【背景技術(shù)】部分的信息僅僅旨在增加對(duì)本發(fā)明的總體背景的理解,而不應(yīng) 當(dāng)被視為承認(rèn)或以任何形式暗示該信息構(gòu)成已為本領(lǐng)域一般技術(shù)人員所公知的現(xiàn)有技術(shù)。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于提供一種甘蔗種芽完好性分類方法,能對(duì)甘蔗種芽完好性進(jìn)行 分類。
[0006] 為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種甘蔗種芽完好性分類方法,包括以下步驟:
[0007] (1)獲取甘蔗圖像;
[0008] ⑵截取甘蔗圖像的種芽區(qū)域;
[0009] (3)確定種芽的有效分類特征;
[0010] (4)由訓(xùn)練樣本確定完好與破損兩類種芽的先驗(yàn)概率;
[0011] (5)確定種芽分類特征的類條件概率密度函數(shù);
[0012] (6)計(jì)算種芽分類特征的后驗(yàn)概率;
[0013](7)根據(jù)貝葉斯決策理論確定種芽完好性分類規(guī)則。
[0014] 優(yōu)選地,上述技術(shù)方案中,所述步驟(3)種芽有效分類特征為種芽區(qū)域圖像的灰 度最大值、灰度最小值、灰度平均值、灰度值中位數(shù)以及灰度值標(biāo)準(zhǔn)差。
[0015] 優(yōu)選地,上述技術(shù)方案中,所述步驟(4)確定先驗(yàn)概率時(shí),訓(xùn)練樣本總數(shù)為N,其中 包括K個(gè)完好種芽圖像和N2f破損種芽圖像,建立種芽區(qū)域圖像特征庫。用ωω2分 別表示種芽完好和破損的兩種狀態(tài),則先驗(yàn)概率為:
[0016] Ρ ( ω ^ = Ni/N
[0017] Ρ(ω2)=N2/N。
[0018] 優(yōu)選地,上述技術(shù)方案中,所述步驟(5)確定種芽分類特征的類條件概率密度函 數(shù),包括以下步驟:
[0019](1)將種芽區(qū)域圖像特征庫中的每一類特征值分別按照由小到大的順序排列, 并從中取出最小值和最大值,構(gòu)成種芽區(qū)域圖像五個(gè)特征向量的分布區(qū)間,用[A,,B,]和 = 1,2, 3, 4, 5)分別表示完好和破損種芽區(qū)域圖像的特征分布區(qū)間,將個(gè)別與相 鄰數(shù)據(jù)差值在分布區(qū)間范圍的8%以上的數(shù)據(jù)視為誤差值,并剔除;
[0020] (2)統(tǒng)計(jì)每一個(gè)特征向量的分布情況,建立特征向量值與出現(xiàn)次數(shù)之間的關(guān)系;
[0021] (3)將特征分布情況簡化為均勻分布,并計(jì)算完好和破損種芽區(qū)域圖像五個(gè)分類 特征的均勻分布區(qū)間寬度;
[0022] (4)計(jì)算完好和破損種芽區(qū)域圖像五個(gè)分類特征的分布區(qū)間寬度,得到完好和破 損兩類種芽圖像五個(gè)分類特征的均勻分布區(qū)間占整個(gè)特征區(qū)間的百分比,并計(jì)算相應(yīng)百分 比的差值;
[0023] (5)選取均勻分布比例高,兩類種芽相應(yīng)的比例相差小的分類特征最為最終的分 類特征,并將其簡化為均勻分布;
[0024] (6)最終確定的分類特征的類條件概率密度函數(shù)為:
[0027] 其中,(Β,-Α,)和(h-a,)分別表示完好和破損種芽區(qū)域圖像相應(yīng)特征的分布區(qū)間 寬度。
[0028] 優(yōu)選地,上述技術(shù)方案中,所述貝葉斯決策理論為:
[0030] 則樣本X屬于ω1類,即將X歸屬為后驗(yàn)概率最大的類別;
[0031] 由貝葉斯公式和全概率公式有:
[0040]與現(xiàn)有技術(shù)相比,本發(fā)明具有如下有益效果:本發(fā)明的甘蔗種芽完好性分類方法, 對(duì)三種常見的甘蔗品種即臺(tái)糖22號(hào)、桂糖42號(hào)、粵糖60號(hào)進(jìn)行種芽完好性分類,三個(gè)品 種分類準(zhǔn)確率分別為92. 09%、93. 49%和93. 02%,破損種芽的分類準(zhǔn)確率分別達(dá)到98%、 97%和96%,表明該分類方法可行,能夠?qū)崿F(xiàn)甘蔗種芽完好性分類的功能。本發(fā)明分類規(guī)則 的分類準(zhǔn)確率較高,均在90%以上,充分證明本發(fā)明的種芽完好性分類方法合理、有效。
【附圖說明】
[0041]圖1是根據(jù)本發(fā)明的甘蔗種芽完好性分類方法中的種芽區(qū)域圖像特征分布情況 曲線圖中的灰度最大值分布曲線圖。
[0042]圖2是根據(jù)本發(fā)明的甘蔗種芽完好性分類方法中的種芽區(qū)域圖像特征分布情況 曲線圖中的灰度最小值分布曲線圖。
[0043]圖3是根據(jù)本發(fā)明的甘蔗種芽完好性分類方法中的種芽區(qū)域圖像特征分布情況 曲線圖中的灰度平均值分布曲線圖。
[0044]圖4是根據(jù)本發(fā)明的甘蔗種芽完好性分類方法中的種芽區(qū)域圖像特征分布情況 曲線圖中的灰度標(biāo)準(zhǔn)差分布曲線圖。
[0045]圖5是根據(jù)本發(fā)明的甘蔗種芽完好性分類方法中的種芽區(qū)域圖像特征分布情況 曲線圖中的灰度中位數(shù)分布曲線圖。
【具體實(shí)施方式】
[0046] 下面結(jié)合附圖,對(duì)本發(fā)明的【具體實(shí)施方式】進(jìn)行詳細(xì)描述,但應(yīng)當(dāng)理解本發(fā)明的保 護(hù)范圍并不受【具體實(shí)施方式】的限制。
[0047]除非另有其它明確表示,否則在整個(gè)說明書和權(quán)利要求書中,術(shù)語"包括"或其變 換如"包含"或"包括有"等等將被理解為包括所陳述的元件或組成部分,而并未排除其它 元件或其它組成部分。
[0048]一種甘蔗種芽完好性分類方法,包括以下步驟:
[0049] 1.獲取甘蔗圖像;
[0050] 選擇臺(tái)糖22號(hào)、桂糖42號(hào)和粵糖60號(hào)三個(gè)品種的甘蔗種作為種芽完好性的研究 樣本,采用MVC360MF黑白攝像頭拍攝種芽圖像。拍攝時(shí)為了增強(qiáng)甘蔗樣本圖像的亮度,在 室內(nèi)光照條件下進(jìn)行,調(diào)節(jié)鏡頭焦距為〇亮度為8,并采用普通的40W白熾燈補(bǔ)光,用白色紙 板作為背景板,采集的種芽圖像像素為752 X 480。拍攝過程中,人工將甘蔗樣本放置在支架 上,并手動(dòng)調(diào)節(jié)甘蔗樣本的位置,確保甘蔗種芽位于甘蔗樣本圖像中心位置,每個(gè)品種的甘 蔗采集100張種芽完好的圖像以及100張種芽破損的圖像。
[0051] 2.截取甘蔗圖像的種芽區(qū)域;
[0052] 經(jīng)過觀測,發(fā)現(xiàn)一副像素為752X480的甘蔗樣本圖像,只有大約的區(qū)域是研究所 需要的種芽區(qū)域,為了使研究簡化,利用MATLAB截取甘蔗樣本圖像中的種芽區(qū)域,得到種 芽區(qū)域樣本圖像。
[0053] 3.確定種芽的有效分類特征;
[0054] 利用MATLAB截取種芽區(qū)域40X40的圖像,并進(jìn)行灰度處理,將得到的灰度值轉(zhuǎn)化 為雙精度型,得到了灰度最大值(Max)、灰度最小值(Min)、灰度平均值(Mean)、灰度值標(biāo)準(zhǔn) 差(Std)以及灰度值中位數(shù)(Median)五個(gè)有效的甘蔗種芽分類特征。
[0055] 4.由訓(xùn)練樣本確定完好與破損兩類種芽的先驗(yàn)概率;
[0056] (1)基于最小錯(cuò)誤率的貝葉斯(Bayes)決策
[0057]Bayes決策理論包括最小錯(cuò)誤率和最小損失兩大準(zhǔn)則,分別用于衡量準(zhǔn)確率的高 低和誤判代價(jià)的大小。在實(shí)際生產(chǎn)中,完好種芽被誤判為破損種芽而被剔除后,還可以返回 糖廠榨糖,損失較小。結(jié)合本申請(qǐng)的發(fā)明目的是為了盡可能多的找出破損的種芽,則本發(fā)明 研究的分類方法應(yīng)以最小錯(cuò)誤率為準(zhǔn)則,優(yōu)先考慮破損種芽的識(shí)別準(zhǔn)確率。。
[0058] 用ω^Ρω2分別表示種芽完好和破損的兩種狀態(tài),由Bayes公式,可得:
[0060]式中:
[0061]P(Wi)表示所屬樣本類別的先驗(yàn)概率,表示ω1出現(xiàn)的概率;
[0062] P(x|Wi)是X的類條件概率密度,表示屬于%類的條件下出現(xiàn)X的概率;
[0063] Ρ(ωi|X)為后驗(yàn)概率,表示將X放入ω1類,判斷其屬于ω1類的概率;
[0064] 根據(jù)Bayes決策理論,分類規(guī)則描述為:
[0066] 則樣本X屬于^^類,即將X歸屬為后驗(yàn)概率最大的類別,其中,j= 1,2, 3, 4, 5, 分別表示Max、Min、Mean、Std和Median五類特征值。也就是說Bayes分類的本質(zhì)是通過 統(tǒng)計(jì)樣本特征X的分布情況,然后將類的先驗(yàn)概率Ρ(ωJ轉(zhuǎn)化為后驗(yàn)概率Ρ(ωι|χ)的
為全概率公式,對(duì)于所有類別的ωi都是相等的,則分類規(guī)則可以 改寫成:
[0067]若P(X|ωJP(ωD>P(X|ω2)P(ω2),X屬于ω淡
[0068]若Ρ(χ| coJPhi)<Ρ(χ| ω2)Ρ(ω2),X屬于(〇2類 ⑶
[0069] 由式(3)可知,先驗(yàn)概率Ρ(ωJ和類條件概率密度Ρ(X|ωJ是Bayes決策分類的 基礎(chǔ)。
[0070] (2)種芽區(qū)域特征的先驗(yàn)概率P(ωi)
[0071] 先驗(yàn)概率Ρ(ω^和Ρ(ω2)是由訓(xùn)練樣本數(shù)據(jù)確定的完好和破損種芽的概率。表 1、表2、表3組成的種芽區(qū)域圖像特征庫分別由臺(tái)糖22號(hào)、桂糖42號(hào)和粵糖60號(hào)樣本圖 像特征組成,每一個(gè)甘蔗品種圖像樣本總數(shù)為200,記為Ν,其中包括100個(gè)完好種芽圖像和 100個(gè)破損種芽圖像,分別用&和Ν2表示。由先驗(yàn)概率的概念可知:
[0072] P(〇/) = NVN = 50% (4)
[0073] P ( ω 2) = Ν2/Ν = 50 %
[0074] 表1:臺(tái)糖22號(hào)種芽區(qū)域圖像特征數(shù)據(jù)
[0075]
[0080] 5.確定種芽分類特征的類條件概率密度函數(shù)P (x Iω i)
[0081] 種芽圖像特征值數(shù)據(jù)庫包括Max、Min、Mean、Std和Median五類特征值,用Xj(j= 1,2, 3, 4, 5)表示,其中\(zhòng)是1X100的單列向量,分別對(duì)應(yīng)100個(gè)特征值。
[0082] 以表1臺(tái)糖22號(hào)種芽區(qū)域圖像特征為例,將每一類特征值分別按由小到大的順序 排列,并從中取出最小值和最大值,構(gòu)成種芽區(qū)域圖像五個(gè)特征向量的分布區(qū)間,用[A,,B,] 和[a,,b,](j= 1,2, 3, 4, 5)分別表示完好和破損種芽區(qū)域圖像的特征分布區(qū)間。將個(gè)別與 相鄰數(shù)據(jù)差值在分布區(qū)間范圍的8%以上的數(shù)據(jù)視為誤差值,并剔除,得到特征區(qū)間數(shù)據(jù)如 表4示。
[0083] 表4 :種芽圖像特征分布區(qū)間
[0084]
[0085] 根據(jù)表1的特征數(shù)據(jù),統(tǒng)計(jì)每一個(gè)特征向量的分布情況。得到臺(tái)糖22號(hào)完好種芽 灰度最大值的統(tǒng)計(jì)