【技術(shù)領(lǐng)域】
本發(fā)明涉及一種圖像目標(biāo)識(shí)別方法及裝置。
背景技術(shù):
圖像中目標(biāo)識(shí)別是采用各種算法將圖像中特定的目標(biāo)或特征在機(jī)器中區(qū)分出來的過程,并且將區(qū)分出的目標(biāo)進(jìn)行下一步處理提供基礎(chǔ)。在信息化網(wǎng)絡(luò)化的今天,可以廣泛應(yīng)用到許多領(lǐng)域。人眼在進(jìn)行識(shí)別某個(gè)特定目標(biāo)時(shí)速度往往較慢,若需要對(duì)于大量數(shù)據(jù)或大量圖像進(jìn)行識(shí)別或區(qū)分,則需要耗費(fèi)大量的人力物力,采用機(jī)器識(shí)別代替人眼識(shí)別,利用計(jì)算機(jī)計(jì)算量代替人眼的用腦量可以提高速度與降低能耗,對(duì)于圖像識(shí)別領(lǐng)域而言是非常有利的。例如:對(duì)一千幅十字路口的視頻幀圖片進(jìn)行識(shí)別,要求找出通過的車流量,明顯采用機(jī)器識(shí)別遠(yuǎn)遠(yuǎn)有利于人眼識(shí)別;同樣的,若給機(jī)器人加上圖像目標(biāo)識(shí)別系統(tǒng),則相當(dāng)于給機(jī)器人添加了“眼睛”,對(duì)于發(fā)展ai技術(shù)也是非常有利的。目前,人們不僅將圖像識(shí)別技術(shù)應(yīng)用于人臉識(shí)別,物品識(shí)別等方面,還將其應(yīng)用在了手寫識(shí)別等方面,極大地方便了人們的生活。
圖像目標(biāo)識(shí)別技術(shù)一般為以下流程:圖像預(yù)處理、圖像分割、特征提取和特征識(shí)別或匹配。但是所處理的圖像一般為較清晰的圖像,對(duì)于對(duì)比度較低的圖像辦法很少,很難分割提取出有效的目標(biāo)特征。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是:彌補(bǔ)上述現(xiàn)有技術(shù)的不足,提出一種圖像目標(biāo)識(shí)別方法及裝置,可針對(duì)對(duì)比度較低的圖像有效地識(shí)別出圖像中的各目標(biāo)對(duì)象。
本發(fā)明的技術(shù)問題通過以下的技術(shù)方案予以解決:
一種圖像目標(biāo)識(shí)別方法,包括以下步驟:s1,將圖像中各像素點(diǎn)二值化處理,劃分為有效像素點(diǎn)和背景點(diǎn),從而將圖像轉(zhuǎn)換為二值化的圖片;s2,根據(jù)圖像的像素點(diǎn)的總個(gè)數(shù)和待識(shí)別的目標(biāo)的尺寸范圍設(shè)定第三閾值的大小,將二值化圖片中已連通的區(qū)域內(nèi)的有效像素點(diǎn)的個(gè)數(shù)與第三閾值進(jìn)行比較,如果小于所述第三閾值,則將該區(qū)域內(nèi)的像素點(diǎn)均設(shè)置為背景點(diǎn),從而去除該區(qū)域;s3,對(duì)剩余的已連通的各區(qū)域確定出其外接矩形框,形成框取區(qū)域;其中,外接矩形框的四條邊分別與圖像的四條邊平行;s4,將框取區(qū)域有重疊的已連通區(qū)域視為合并的整體區(qū)域,確定出整體區(qū)域的外接矩形框,外接矩形框的四條邊分別與圖像的四條邊平行;圖像中,外接矩形框中的圖像內(nèi)容為識(shí)別到的目標(biāo)。
一種圖像目標(biāo)識(shí)別裝置,包括二值化處理模塊、區(qū)域去除模塊、區(qū)域框取模塊和區(qū)域合并模塊;其中,所述二值化處理模塊用于將圖像中各像素點(diǎn)二值化處理,劃分為有效像素點(diǎn)和背景點(diǎn),從而將圖像轉(zhuǎn)換為二值化的圖片;所述區(qū)域去除模塊用于根據(jù)圖像的像素點(diǎn)的總個(gè)數(shù)和待識(shí)別的目標(biāo)的尺寸范圍設(shè)定第三閾值的大小,將二值化圖片中已連通的區(qū)域內(nèi)的有效像素點(diǎn)的個(gè)數(shù)與第三閾值進(jìn)行比較,如果小于所述第三閾值,則將該區(qū)域內(nèi)的像素點(diǎn)均設(shè)置為背景點(diǎn),從而去除該區(qū)域;區(qū)域框取模塊用于對(duì)剩余的已連通的各區(qū)域確定出其外接矩形框,形成框取區(qū)域;其中,外接矩形框的四條邊分別與圖像的四條邊平行;所述區(qū)域合并模塊用于將框取區(qū)域有重疊的已連通區(qū)域視為合并的整體區(qū)域,確定出整體區(qū)域的外接矩形框,外接矩形框的四條邊分別與圖像的四條邊平行,外接矩形框中的圖像內(nèi)容為識(shí)別到的目標(biāo)。
本發(fā)明與現(xiàn)有技術(shù)對(duì)比的有益效果是:
本發(fā)明的圖像目標(biāo)識(shí)別方法及裝置,通過二值化處理后轉(zhuǎn)換為二值化圖片,并根據(jù)圖像中像素點(diǎn)的個(gè)數(shù)與待識(shí)別目標(biāo)尺寸范圍設(shè)置閾值進(jìn)行比較后,有效地舍去背景區(qū)域。最后通過連通域方法對(duì)圖像進(jìn)行分割以及合并,從而有效地識(shí)別到目標(biāo)在圖像中所在的位置和在圖像中的數(shù)量。本發(fā)明通過上步驟,可提高對(duì)對(duì)比度較低、圖像特征不清晰的圖像進(jìn)行識(shí)別的準(zhǔn)確率。
【附圖說明】
圖1是本發(fā)明具體實(shí)施方式的圖像目標(biāo)識(shí)別方法的流程圖;
圖2是本發(fā)明具體實(shí)施方式的整幅圖像轉(zhuǎn)為二值化的圖片的效果圖;
圖3是圖2經(jīng)過優(yōu)化去除散點(diǎn)噪音后的效果圖;
圖4是圖3中經(jīng)過去除干擾區(qū)域后的效果圖;
圖5是本發(fā)明具體實(shí)施方式的圖像中確定外接矩形框后的效果圖;
圖6是本發(fā)明具體實(shí)施方式的圖像中部分區(qū)域合并確定外接矩形框后的效果圖;
圖7是本發(fā)明具體實(shí)施方式的支持向量機(jī)二元分類的原理圖;
圖8是本發(fā)明具體實(shí)施方式的支持向量機(jī)多元分類的原理圖;
圖9是本發(fā)明具體實(shí)施方式的第一種分類過程的流程圖;
圖10是本發(fā)明具體實(shí)施方式中待提取邊緣信息的原圖;
圖11是圖10中感興趣區(qū)域的圖像;
圖12是圖11中經(jīng)過特征點(diǎn)提取后獲得的圖像;
圖13是本發(fā)明具體實(shí)施方式中特征點(diǎn)統(tǒng)計(jì)方法中的分布示意圖。
【具體實(shí)施方式】
下面結(jié)合具體實(shí)施方式并對(duì)照附圖對(duì)本發(fā)明做進(jìn)一步詳細(xì)說明。
如圖1所示,為本具體實(shí)施方式中圖像目標(biāo)識(shí)別方法的流程圖,包括以下步驟:
s1,將圖像中各像素點(diǎn)二值化處理,劃分為有效像素點(diǎn)和背景點(diǎn),從而將圖像轉(zhuǎn)換為二值化的圖片。
該步驟中,二值化轉(zhuǎn)換處理,便于后續(xù)識(shí)別到目標(biāo)所在的位置。二值化時(shí),優(yōu)選地,按照如下步驟進(jìn)行:以像素點(diǎn)為中心設(shè)定第一窗口,通過第一窗口內(nèi)像素點(diǎn)的像素值的平均值和標(biāo)準(zhǔn)差設(shè)置第一閾值的大小,以所述第一閾值與像素點(diǎn)的像素值進(jìn)行比較,如果像素值大于第一閾值,則將像素點(diǎn)設(shè)為有效像素點(diǎn);否則,將像素點(diǎn)設(shè)為背景點(diǎn)。
其中,第一閾值可根據(jù)如下式子設(shè)置得到:
該過程中,以像素點(diǎn)為中心進(jìn)行窗口滑動(dòng),通過第一窗口內(nèi)像素點(diǎn)的平均像素值、像素值標(biāo)準(zhǔn)差設(shè)置閾值。對(duì)于圖像高對(duì)比度區(qū)域,標(biāo)準(zhǔn)差δ(x,y)趨近于r,這樣設(shè)置得到的閾值t(x,y)則近似等于均值m(x,y),即將中心像素點(diǎn)(x,y)的像素值與一個(gè)近似于局部窗口的平均像素值的閾值進(jìn)行比較,大于閾值,也即表明大于平均像素值,從而確認(rèn)為有效像素點(diǎn)。對(duì)于局部對(duì)比度非常低的領(lǐng)域內(nèi),標(biāo)準(zhǔn)差δ(x,y)遠(yuǎn)小于r,這樣設(shè)置得到的閾值t(x,y)則比均值m(x,y)要小。比較時(shí),即將中心像素點(diǎn)(x,y)的像素值與一個(gè)小于局部窗口的平均像素值的閾值進(jìn)行比較,而不是始終與固定的均值進(jìn)行比較,這樣可將大于閾值的中心像素點(diǎn)保留為有效的,避免遺漏模糊區(qū)域的潛在目標(biāo)像素點(diǎn)。通過上述使用局部區(qū)域的方式設(shè)置各個(gè)像素點(diǎn)相對(duì)應(yīng)比較的閾值,使用第一窗口中像素點(diǎn)的標(biāo)準(zhǔn)差自適應(yīng)地調(diào)整閾值的大小,使得閾值隨圖像的對(duì)比度自適應(yīng)調(diào)整,從而可對(duì)圖像中各個(gè)像素點(diǎn)進(jìn)行精確劃分,避免因圖像模糊而遺漏有效像素點(diǎn)。
將第一閾值與像素點(diǎn)的像素值比較,若像素值大于閾值,則該點(diǎn)為有效像素,可將其設(shè)置為白色點(diǎn),如圖2中所示的白色點(diǎn);否則,為背景點(diǎn),如圖2中所示的黑色區(qū)域的像素點(diǎn),從而將整幅圖像轉(zhuǎn)為二值化的圖片。
進(jìn)一步優(yōu)選地,還包括對(duì)二值化處理后的圖片進(jìn)行再確認(rèn)處理的過程,包括:以像素點(diǎn)為中心設(shè)定第二窗口,根據(jù)第二窗口內(nèi)像素點(diǎn)的個(gè)數(shù)設(shè)置第二閾值的大??;將第二窗口內(nèi)有效像素點(diǎn)的個(gè)數(shù)與所述第二閾值進(jìn)行比較,如果大于所述第二閾值,則將該像素點(diǎn)設(shè)為有效像素點(diǎn);否則,將該像素點(diǎn)設(shè)為背景點(diǎn)。該步驟中,第二窗口的大小可以與前述第一窗口的大小相同,也可以不相同。
其中,第二閾值可根據(jù)如下式子設(shè)置得到:
上述進(jìn)一步優(yōu)化的過程,在二值化的基礎(chǔ)上,繼續(xù)以像素點(diǎn)為中心選定第二窗口(窗口大小可自定),以此為一個(gè)整體查看第二窗口內(nèi)有效點(diǎn)的個(gè)數(shù),與自設(shè)定的閾值進(jìn)行比較。若比閾值大,則將中心的像素點(diǎn)設(shè)為有效像素點(diǎn),否則為噪點(diǎn),設(shè)為背景點(diǎn),去除。該步驟,通過第二窗口的局部有效像素點(diǎn)個(gè)數(shù)的比較過程,可將周圍有效像素點(diǎn)確實(shí)較多的中心像素點(diǎn)再次確認(rèn)為有效點(diǎn),而將周圍有效像素點(diǎn)不太多的中心像素點(diǎn)確認(rèn)為背景點(diǎn),從而有效去除圖2中圖像中的散點(diǎn)。此外,也很重要的一點(diǎn)時(shí),還可以將經(jīng)過前述局部區(qū)域處理后產(chǎn)生的斷點(diǎn)進(jìn)行連接,例如可能有的黑色點(diǎn)在該過程中轉(zhuǎn)變?yōu)榘咨瑥亩鴮⑾噜彽陌咨c(diǎn)連接起來形成連通的白色區(qū)域。通過該進(jìn)一步的優(yōu)化過程,便于后續(xù)進(jìn)行精確的區(qū)域識(shí)別。如圖3所示,為進(jìn)一步優(yōu)化去除散點(diǎn)噪音后的效果圖。
s2,根據(jù)圖像的像素點(diǎn)的總個(gè)數(shù)和待識(shí)別的目標(biāo)的尺寸范圍設(shè)定第三閾值的大小,將二值化圖片中已連通的區(qū)域內(nèi)的有效像素點(diǎn)的個(gè)數(shù)與第三閾值進(jìn)行比較,如果小于所述第三閾值,則將該區(qū)域內(nèi)的像素點(diǎn)均設(shè)置為背景點(diǎn),從而去除該區(qū)域。
經(jīng)過二值化處理后的圖片,某些區(qū)域的零散的有效像素點(diǎn),某些區(qū)域集中了較多的有效像素點(diǎn),從而形成已連通的區(qū)域。該過程,對(duì)整張二值化圖片中的已連通域進(jìn)行篩選,以檢測到目標(biāo)所在的區(qū)域,而對(duì)于干擾的區(qū)域,則予以去除。
具體地,設(shè)置第三閾值的大小,根據(jù)整幅圖像的像素點(diǎn)的總個(gè)數(shù)與待識(shí)別的目標(biāo)的尺寸范圍設(shè)定第三閾值的大小。可根據(jù)如下式子設(shè)置第三閾值的大?。簕(a*b)*c/d}/e,其中,a*b表示整幅圖像中所有的像素點(diǎn)個(gè)數(shù),a表示寬度方向的像素點(diǎn)個(gè)數(shù),b表示長度方向的像素點(diǎn)個(gè)數(shù);c表示待識(shí)別目標(biāo)的最小尺寸;d表示待識(shí)別目標(biāo)的最大尺寸;e表示估算的a*b大小的圖片最多包含的待識(shí)別目標(biāo)的數(shù)量。以待識(shí)別的目標(biāo)為浮游生物為例,浮游生物的大小尺寸范圍一般在20μm~5cm的范圍內(nèi)。通過浮游生物采集設(shè)備獲取的圖片包含的像素點(diǎn)總個(gè)數(shù)為2448*2050。估算一張圖最多包含10個(gè)最大的浮游生物(估算時(shí),可以按照整張圖的尺寸和生物尺寸1:1看待,整張圖片的尺寸是3厘米*3.5厘米,為10.5平方厘米,以浮游生物平均占1平方厘米的面積,所以四舍五入估算為最多包括10個(gè))。設(shè)置第三閾值時(shí),由[(2448*2050)*20/50000]/10設(shè)定得到第三閾值為200.736。
將已連通的區(qū)域內(nèi)的有效點(diǎn)的個(gè)數(shù)和設(shè)定的第三閾值進(jìn)行比較,小于該第三閾值,則表明這些連通的區(qū)域內(nèi)的有效點(diǎn)不足,為干擾區(qū)域,從而將該區(qū)域內(nèi)的像素點(diǎn)均設(shè)置為背景點(diǎn),舍去該區(qū)域。如圖4所示,為圖3中舍去干擾區(qū)域后的效果示意圖。
s3,對(duì)剩余的已連通的區(qū)域確定出其外接矩形框,形成框取區(qū)域;其中,外接矩形框的四條邊分別與圖像的四條邊平行。
經(jīng)過步驟s2,已連通的區(qū)域中,部分區(qū)域被舍去,部分區(qū)域被保留。對(duì)剩余保留的已連通的各區(qū)域,通過上述步驟s3,確定出各區(qū)域的水平方向的外接矩形框,形成框取區(qū)域。外接矩形框即為一個(gè)矩形,矩形的四條邊分別穿過區(qū)域的上下左右四個(gè)邊界像素點(diǎn)(最上、最下、最左和最右的像素點(diǎn))。水平方向的外接矩形框,表示矩形框的四條邊分別平行于圖像的四條邊,是水平的。確定出外接矩形框后,矩形框內(nèi)的內(nèi)容即為框取區(qū)域。如圖5所示,為確定外接矩形框后的效果示意圖。
s4,將框取區(qū)域有重疊的已連通區(qū)域視為合并的整體區(qū)域,確定出整體區(qū)域的外接矩形框,外接矩形框的四條邊分別與圖像的四條邊平行,外接矩形框中的圖像內(nèi)容為識(shí)別到的目標(biāo)。
對(duì)于框取的區(qū)域,有些區(qū)域是獨(dú)立零散的,有些區(qū)域彼此有重疊。對(duì)于矩形框有重疊的部分,將這部分的已連通區(qū)域視為合并的整體區(qū)域,對(duì)該整體區(qū)域確定出其水平方向的外接矩形框。
如圖6所示,為經(jīng)過步驟s4后,圖像中確定出外接矩形框后的效果示意圖。相對(duì)于圖5,圖6中的有些區(qū)域由一個(gè)外接矩形框合并框取。圖6中,各外接矩形框中的圖像內(nèi)容即為識(shí)別到的目標(biāo),從而篩選出疑似目標(biāo)所在的位置,及相應(yīng)的數(shù)量。
本具體實(shí)施方式中,經(jīng)過上述步驟,處理模糊圖像(例如渾濁度較高的水體中成的像)時(shí),通過局部閾值進(jìn)行比較,精確二值化劃分像素點(diǎn)為有效點(diǎn)或者背景噪聲點(diǎn),然后對(duì)于二值化后的已連通域進(jìn)行再次去噪,連通域框取處理以及合并處理,從而對(duì)圖像進(jìn)行有效的分割,提取出目標(biāo)所在的感興趣區(qū)域,可提高對(duì)對(duì)比度較低、圖像特征不清晰的圖像進(jìn)行識(shí)別的準(zhǔn)確率。該目標(biāo)識(shí)別方法尤其適合在水中拍攝的浮游生物的識(shí)別。
識(shí)別到目標(biāo)所在的區(qū)域后,可進(jìn)一步地結(jié)合分類方法對(duì)區(qū)域內(nèi)的圖像內(nèi)容進(jìn)行分類處理,識(shí)別目標(biāo)的類別信息。本具體實(shí)施方式中,通過如下兩種分類方案分別從邊界梯度、形態(tài)結(jié)構(gòu)單元特征兩個(gè)方面進(jìn)行分類。當(dāng)然,實(shí)際應(yīng)用中,也可根據(jù)實(shí)際情況選擇更適用的其它分類方法。
為便于分類識(shí)別處理,對(duì)提取出的各區(qū)域進(jìn)行歸一化處理,處理為包含有128*128個(gè)像素點(diǎn)的圖像。
第一種分類方案:采用svm+hog的分類方法分析邊界梯度進(jìn)行分類。對(duì)歸一化后得到的圖像進(jìn)行簡單的背景去噪處理后,提取圖形的邊緣密度和邊界梯度進(jìn)行統(tǒng)計(jì)成直方圖,從而由支持向量機(jī)(svm)結(jié)合方向梯度直方圖(hog)對(duì)待測圖片進(jìn)行分析,分辨出是哪種類別的目標(biāo)。svm是一個(gè)傳統(tǒng)的二元分類器,其原理如圖7所示。其中,x1表示下方線條更密集的樣本點(diǎn);x2表示上方線條稀疏的樣本點(diǎn)。ωtx+b=0的含義是:用線性方程來劃分不同樣本的超平面;線性方程右側(cè)的1和-1分別代表兩個(gè)種類。
分類過程包括以下步驟:
分類之前先對(duì)樣本進(jìn)行訓(xùn)練(樣本是事先已挑選的)。訓(xùn)練過程為:將n類樣本按照二分法的方式分成1~n/2和n/2+1~n兩類,再對(duì)這兩類包含的樣本進(jìn)行圖形的邊緣密度和邊界梯度統(tǒng)計(jì);重復(fù)該過程,將這兩類繼續(xù)按照二分的方法繼續(xù)分類和統(tǒng)計(jì),直到將樣本分類至其中單獨(dú)的一個(gè)類別,即表示訓(xùn)練結(jié)束。原理圖如圖8所示。
分類時(shí),對(duì)歸一化處理后的各連通域的圖像,分別提取各區(qū)域中圖像的邊緣密度和邊界梯度,根據(jù)邊緣密度和梯度信息,與訓(xùn)練獲得的樣本的統(tǒng)計(jì)信息進(jìn)行比較,將圖像分類為n個(gè)大類中的n/2個(gè)類別中,重復(fù)分類過程,將圖像分類至n/2個(gè)類別中n/4個(gè)類別中,重復(fù)分類,直至圖像分類至其中一個(gè)類別中,從而得到圖像所屬的生物類別。分類的流程圖如圖9所示。
查找確定類別時(shí),由于待檢測的圖像對(duì)于分類器來說未知,所以時(shí)間對(duì)于查找種類來說最為重要,最常見的查找方式和排序方式為冒泡法、二分法和快速排序。從時(shí)間復(fù)雜度上看,冒泡算法為o(n2),二分法為o(log2n),快速排序?yàn)閛(n*logn),本具體實(shí)施方式中最終選取二分法為查找手段。
第二種分類方案:采用特征點(diǎn)分布算法(shape-context)分析形態(tài)結(jié)構(gòu)單元特征進(jìn)行分類。采用邊緣快速提取算法提取特征點(diǎn)。該算法可以直接將圖形的邊緣提取出來,從而可以將提取出來的點(diǎn)作為特征點(diǎn),更為有效地看出圖形的邊緣及特征分布情況。該邊緣快速提取算法提取精確,且耗時(shí)也較短。以圖10所示的原圖為例,其大小為2448*2050,感興趣區(qū)域的浮游生物圖像為圖11所示,大小為210*210,提取疑似浮游生物區(qū)域的特征點(diǎn)的過程耗時(shí)為54秒,提取后得到的特征點(diǎn)(黑色像素點(diǎn))的圖像如圖12所示。
分析邊界梯度進(jìn)行分類的過程包括以下步驟:
分類之前對(duì)樣本進(jìn)行訓(xùn)練(樣本是是事先已挑選的),訓(xùn)練過程為:將樣本通過邊緣快速提取算法進(jìn)行處理得到邊緣和特征點(diǎn)的分布情況,再通過圖13所示的特征點(diǎn)統(tǒng)計(jì)方法對(duì)特征點(diǎn)分布進(jìn)行統(tǒng)計(jì),將每種樣本的特征點(diǎn)分布情況分別統(tǒng)計(jì)在各自的一個(gè)文本中,統(tǒng)計(jì)出所有樣本的特征點(diǎn)分布情況即完成訓(xùn)練。圖13所示的統(tǒng)計(jì)方法為:以特征點(diǎn)為中心進(jìn)行8等分(45°為一個(gè)區(qū)域,360°平分成8個(gè)區(qū)域),再根據(jù)圖形特征大小向外擴(kuò)散5個(gè)區(qū)域,即以該特征點(diǎn)為中心,到能包含所有特征點(diǎn)的外接圓的最大半徑,將這個(gè)最大半徑分五等分,構(gòu)成五個(gè)圓,同時(shí)每個(gè)圓按照上述分成8個(gè)區(qū)域,由此將圖形中所有特征點(diǎn)劃分到40個(gè)區(qū)域內(nèi)。
分類時(shí),將歸一化處理后的各連通域的圖像通過邊緣快速提取算法進(jìn)行處理得到邊緣和特征點(diǎn)的分布情況,再通過圖13所示的方法對(duì)特征點(diǎn)分布進(jìn)行統(tǒng)計(jì),將待檢測圖像統(tǒng)計(jì)后的特征點(diǎn)分布結(jié)果和訓(xùn)練所得的每個(gè)樣本的特征點(diǎn)分布統(tǒng)計(jì)結(jié)果進(jìn)行比較,從而識(shí)別出待檢測圖像所屬的類別。
通過上述設(shè)計(jì)出的多種類分類器以及多種類訓(xùn)練器可以更好地對(duì)目標(biāo),例如世界萬千物種進(jìn)行分類。
本具體實(shí)施方式中還提供一種圖像目標(biāo)識(shí)別裝置,包括二值化處理模塊、區(qū)域去除模塊、區(qū)域框取模塊和區(qū)域合并模塊;其中,所述二值化處理模塊用于將圖像中各像素點(diǎn)二值化處理,劃分為有效像素點(diǎn)和背景點(diǎn),從而將圖像轉(zhuǎn)換為二值化的圖片;所述區(qū)域去除模塊用于根據(jù)圖像的像素點(diǎn)的總個(gè)數(shù)和待識(shí)別的目標(biāo)的尺寸范圍設(shè)定第三閾值的大小,將二值化圖片中已連通的區(qū)域內(nèi)的有效像素點(diǎn)的個(gè)數(shù)與第三閾值進(jìn)行比較,如果小于所述第三閾值,則將該區(qū)域內(nèi)的像素點(diǎn)均設(shè)置為背景點(diǎn),從而去除該區(qū)域;區(qū)域框取模塊用于對(duì)剩余的已連通的各區(qū)域確定出其外接矩形框,形成框取區(qū)域;其中,外接矩形框的四條邊分別與圖像的四條邊平行;所述區(qū)域合并模塊用于將框取區(qū)域有重疊的已連通區(qū)域視為合并的整體區(qū)域,確定出整體區(qū)域的外接矩形框,外接矩形框的四條邊分別與圖像的四條邊平行,外接矩形框中的圖像內(nèi)容為識(shí)別到的目標(biāo)。本具體實(shí)施方式的目標(biāo)識(shí)別裝置可提高對(duì)對(duì)比度較低、圖像特征不清晰的圖像進(jìn)行識(shí)別的準(zhǔn)確率。
以上內(nèi)容是結(jié)合具體的優(yōu)選實(shí)施方式對(duì)本發(fā)明所作的進(jìn)一步詳細(xì)說明,不能認(rèn)定本發(fā)明的具體實(shí)施只局限于這些說明。對(duì)于本發(fā)明所屬技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下做出若干替代或明顯變型,而且性能或用途相同,都應(yīng)當(dāng)視為屬于本發(fā)明的保護(hù)范圍。