一種圖像目標(biāo)識(shí)別方法及裝置與流程

文檔序號(hào)：12887668閱讀：543來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

【技術(shù)領(lǐng)域】

本發(fā)明涉及一種圖像目標(biāo)識(shí)別方法及裝置。

背景技術(shù)：

圖像中目標(biāo)識(shí)別是采用各種算法將圖像中特定的目標(biāo)或特征在機(jī)器中區(qū)分出來的過程，并且將區(qū)分出的目標(biāo)進(jìn)行下一步處理提供基礎(chǔ)。在信息化網(wǎng)絡(luò)化的今天，可以廣泛應(yīng)用到許多領(lǐng)域。人眼在進(jìn)行識(shí)別某個(gè)特定目標(biāo)時(shí)速度往往較慢，若需要對(duì)于大量數(shù)據(jù)或大量圖像進(jìn)行識(shí)別或區(qū)分，則需要耗費(fèi)大量的人力物力，采用機(jī)器識(shí)別代替人眼識(shí)別，利用計(jì)算機(jī)計(jì)算量代替人眼的用腦量可以提高速度與降低能耗，對(duì)于圖像識(shí)別領(lǐng)域而言是非常有利的。例如：對(duì)一千幅十字路口的視頻幀圖片進(jìn)行識(shí)別，要求找出通過的車流量，明顯采用機(jī)器識(shí)別遠(yuǎn)遠(yuǎn)有利于人眼識(shí)別；同樣的，若給機(jī)器人加上圖像目標(biāo)識(shí)別系統(tǒng)，則相當(dāng)于給機(jī)器人添加了“眼睛”，對(duì)于發(fā)展ai技術(shù)也是非常有利的。目前，人們不僅將圖像識(shí)別技術(shù)應(yīng)用于人臉識(shí)別，物品識(shí)別等方面，還將其應(yīng)用在了手寫識(shí)別等方面，極大地方便了人們的生活。

圖像目標(biāo)識(shí)別技術(shù)一般為以下流程：圖像預(yù)處理、圖像分割、特征提取和特征識(shí)別或匹配。但是所處理的圖像一般為較清晰的圖像，對(duì)于對(duì)比度較低的圖像辦法很少，很難分割提取出有效的目標(biāo)特征。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明所要解決的技術(shù)問題是：彌補(bǔ)上述現(xiàn)有技術(shù)的不足，提出一種圖像目標(biāo)識(shí)別方法及裝置，可針對(duì)對(duì)比度較低的圖像有效地識(shí)別出圖像中的各目標(biāo)對(duì)象。

本發(fā)明的技術(shù)問題通過以下的技術(shù)方案予以解決：

一種圖像目標(biāo)識(shí)別方法，包括以下步驟：s1，將圖像中各像素點(diǎn)二值化處理，劃分為有效像素點(diǎn)和背景點(diǎn)，從而將圖像轉(zhuǎn)換為二值化的圖片；s2，根據(jù)圖像的像素點(diǎn)的總個(gè)數(shù)和待識(shí)別的目標(biāo)的尺寸范圍設(shè)定第三閾值的大小，將二值化圖片中已連通的區(qū)域內(nèi)的有效像素點(diǎn)的個(gè)數(shù)與第三閾值進(jìn)行比較，如果小于所述第三閾值，則將該區(qū)域內(nèi)的像素點(diǎn)均設(shè)置為背景點(diǎn)，從而去除該區(qū)域；s3，對(duì)剩余的已連通的各區(qū)域確定出其外接矩形框，形成框取區(qū)域；其中，外接矩形框的四條邊分別與圖像的四條邊平行；s4，將框取區(qū)域有重疊的已連通區(qū)域視為合并的整體區(qū)域，確定出整體區(qū)域的外接矩形框，外接矩形框的四條邊分別與圖像的四條邊平行；圖像中，外接矩形框中的圖像內(nèi)容為識(shí)別到的目標(biāo)。

一種圖像目標(biāo)識(shí)別裝置，包括二值化處理模塊、區(qū)域去除模塊、區(qū)域框取模塊和區(qū)域合并模塊；其中，所述二值化處理模塊用于將圖像中各像素點(diǎn)二值化處理，劃分為有效像素點(diǎn)和背景點(diǎn)，從而將圖像轉(zhuǎn)換為二值化的圖片；所述區(qū)域去除模塊用于根據(jù)圖像的像素點(diǎn)的總個(gè)數(shù)和待識(shí)別的目標(biāo)的尺寸范圍設(shè)定第三閾值的大小，將二值化圖片中已連通的區(qū)域內(nèi)的有效像素點(diǎn)的個(gè)數(shù)與第三閾值進(jìn)行比較，如果小于所述第三閾值，則將該區(qū)域內(nèi)的像素點(diǎn)均設(shè)置為背景點(diǎn)，從而去除該區(qū)域；區(qū)域框取模塊用于對(duì)剩余的已連通的各區(qū)域確定出其外接矩形框，形成框取區(qū)域；其中，外接矩形框的四條邊分別與圖像的四條邊平行；所述區(qū)域合并模塊用于將框取區(qū)域有重疊的已連通區(qū)域視為合并的整體區(qū)域，確定出整體區(qū)域的外接矩形框，外接矩形框的四條邊分別與圖像的四條邊平行，外接矩形框中的圖像內(nèi)容為識(shí)別到的目標(biāo)。

本發(fā)明與現(xiàn)有技術(shù)對(duì)比的有益效果是：

本發(fā)明的圖像目標(biāo)識(shí)別方法及裝置，通過二值化處理后轉(zhuǎn)換為二值化圖片，并根據(jù)圖像中像素點(diǎn)的個(gè)數(shù)與待識(shí)別目標(biāo)尺寸范圍設(shè)置閾值進(jìn)行比較后，有效地舍去背景區(qū)域。最后通過連通域方法對(duì)圖像進(jìn)行分割以及合并，從而有效地識(shí)別到目標(biāo)在圖像中所在的位置和在圖像中的數(shù)量。本發(fā)明通過上步驟，可提高對(duì)對(duì)比度較低、圖像特征不清晰的圖像進(jìn)行識(shí)別的準(zhǔn)確率。

【附圖說明】

圖1是本發(fā)明具體實(shí)施方式的圖像目標(biāo)識(shí)別方法的流程圖；

圖2是本發(fā)明具體實(shí)施方式的整幅圖像轉(zhuǎn)為二值化的圖片的效果圖；

圖3是圖2經(jīng)過優(yōu)化去除散點(diǎn)噪音后的效果圖；

圖4是圖3中經(jīng)過去除干擾區(qū)域后的效果圖；

圖5是本發(fā)明具體實(shí)施方式的圖像中確定外接矩形框后的效果圖；

圖6是本發(fā)明具體實(shí)施方式的圖像中部分區(qū)域合并確定外接矩形框后的效果圖；

圖7是本發(fā)明具體實(shí)施方式的支持向量機(jī)二元分類的原理圖；

圖8是本發(fā)明具體實(shí)施方式的支持向量機(jī)多元分類的原理圖；

圖9是本發(fā)明具體實(shí)施方式的第一種分類過程的流程圖；

圖10是本發(fā)明具體實(shí)施方式中待提取邊緣信息的原圖；

圖11是圖10中感興趣區(qū)域的圖像；

圖12是圖11中經(jīng)過特征點(diǎn)提取后獲得的圖像；

圖13是本發(fā)明具體實(shí)施方式中特征點(diǎn)統(tǒng)計(jì)方法中的分布示意圖。

【具體實(shí)施方式】

下面結(jié)合具體實(shí)施方式并對(duì)照附圖對(duì)本發(fā)明做進(jìn)一步詳細(xì)說明。

如圖1所示，為本具體實(shí)施方式中圖像目標(biāo)識(shí)別方法的流程圖，包括以下步驟：

s1，將圖像中各像素點(diǎn)二值化處理，劃分為有效像素點(diǎn)和背景點(diǎn)，從而將圖像轉(zhuǎn)換為二值化的圖片。

該步驟中，二值化轉(zhuǎn)換處理，便于后續(xù)識(shí)別到目標(biāo)所在的位置。二值化時(shí)，優(yōu)選地，按照如下步驟進(jìn)行：以像素點(diǎn)為中心設(shè)定第一窗口，通過第一窗口內(nèi)像素點(diǎn)的像素值的平均值和標(biāo)準(zhǔn)差設(shè)置第一閾值的大小，以所述第一閾值與像素點(diǎn)的像素值進(jìn)行比較，如果像素值大于第一閾值，則將像素點(diǎn)設(shè)為有效像素點(diǎn)；否則，將像素點(diǎn)設(shè)為背景點(diǎn)。

其中，第一閾值可根據(jù)如下式子設(shè)置得到：其中，以像素點(diǎn)(x,y)為中心時(shí)，t(x,y)表示對(duì)應(yīng)于所述像素點(diǎn)(x,y)的第一閾值；r表示整幅圖像的像素點(diǎn)的像素值的標(biāo)準(zhǔn)差的動(dòng)態(tài)范圍；k為設(shè)定的偏差系數(shù)，取正值；m(x,y)表示所述第一窗口內(nèi)像素點(diǎn)的像素值的平均值；δ(x,y)表示所述第一窗口內(nèi)像素點(diǎn)的像素灰度值的標(biāo)準(zhǔn)差。通過上述計(jì)算式子，可使得第一閾值隨第一窗口中像素點(diǎn)的像素灰度值的標(biāo)準(zhǔn)差自適應(yīng)調(diào)整。

該過程中，以像素點(diǎn)為中心進(jìn)行窗口滑動(dòng)，通過第一窗口內(nèi)像素點(diǎn)的平均像素值、像素值標(biāo)準(zhǔn)差設(shè)置閾值。對(duì)于圖像高對(duì)比度區(qū)域，標(biāo)準(zhǔn)差δ(x,y)趨近于r，這樣設(shè)置得到的閾值t(x,y)則近似等于均值m(x,y)，即將中心像素點(diǎn)(x,y)的像素值與一個(gè)近似于局部窗口的平均像素值的閾值進(jìn)行比較，大于閾值，也即表明大于平均像素值，從而確認(rèn)為有效像素點(diǎn)。對(duì)于局部對(duì)比度非常低的領(lǐng)域內(nèi)，標(biāo)準(zhǔn)差δ(x,y)遠(yuǎn)小于r，這樣設(shè)置得到的閾值t(x,y)則比均值m(x,y)要小。比較時(shí)，即將中心像素點(diǎn)(x,y)的像素值與一個(gè)小于局部窗口的平均像素值的閾值進(jìn)行比較，而不是始終與固定的均值進(jìn)行比較，這樣可將大于閾值的中心像素點(diǎn)保留為有效的，避免遺漏模糊區(qū)域的潛在目標(biāo)像素點(diǎn)。通過上述使用局部區(qū)域的方式設(shè)置各個(gè)像素點(diǎn)相對(duì)應(yīng)比較的閾值，使用第一窗口中像素點(diǎn)的標(biāo)準(zhǔn)差自適應(yīng)地調(diào)整閾值的大小，使得閾值隨圖像的對(duì)比度自適應(yīng)調(diào)整，從而可對(duì)圖像中各個(gè)像素點(diǎn)進(jìn)行精確劃分，避免因圖像模糊而遺漏有效像素點(diǎn)。

將第一閾值與像素點(diǎn)的像素值比較，若像素值大于閾值，則該點(diǎn)為有效像素，可將其設(shè)置為白色點(diǎn)，如圖2中所示的白色點(diǎn)；否則，為背景點(diǎn)，如圖2中所示的黑色區(qū)域的像素點(diǎn)，從而將整幅圖像轉(zhuǎn)為二值化的圖片。

進(jìn)一步優(yōu)選地，還包括對(duì)二值化處理后的圖片進(jìn)行再確認(rèn)處理的過程，包括：以像素點(diǎn)為中心設(shè)定第二窗口，根據(jù)第二窗口內(nèi)像素點(diǎn)的個(gè)數(shù)設(shè)置第二閾值的大??；將第二窗口內(nèi)有效像素點(diǎn)的個(gè)數(shù)與所述第二閾值進(jìn)行比較，如果大于所述第二閾值，則將該像素點(diǎn)設(shè)為有效像素點(diǎn)；否則，將該像素點(diǎn)設(shè)為背景點(diǎn)。該步驟中，第二窗口的大小可以與前述第一窗口的大小相同，也可以不相同。

其中，第二閾值可根據(jù)如下式子設(shè)置得到：其中，floor函數(shù)表示向下取整運(yùn)算，z表示所述第二窗口內(nèi)像素點(diǎn)的個(gè)數(shù)。該計(jì)算方法中，以正方形窗口為例，可表示邊長，表示對(duì)角線的平方，將其開根號(hào)取整后可近似為對(duì)角線長度的取整。即上述設(shè)置第二閾值的方式是利用第二窗口對(duì)角線上像素點(diǎn)的個(gè)數(shù)作為閾值。減去2的含義在于去掉自身的1個(gè)像素點(diǎn)，再去掉一個(gè)可能性的有效像素點(diǎn)，從而使閾值的設(shè)置較準(zhǔn)確。當(dāng)然，其余自定義設(shè)置閾值的方式也是可行的，只要能識(shí)別的絕大多數(shù)的有效像素點(diǎn)即可。

上述進(jìn)一步優(yōu)化的過程，在二值化的基礎(chǔ)上，繼續(xù)以像素點(diǎn)為中心選定第二窗口(窗口大小可自定)，以此為一個(gè)整體查看第二窗口內(nèi)有效點(diǎn)的個(gè)數(shù)，與自設(shè)定的閾值進(jìn)行比較。若比閾值大，則將中心的像素點(diǎn)設(shè)為有效像素點(diǎn)，否則為噪點(diǎn)，設(shè)為背景點(diǎn)，去除。該步驟，通過第二窗口的局部有效像素點(diǎn)個(gè)數(shù)的比較過程，可將周圍有效像素點(diǎn)確實(shí)較多的中心像素點(diǎn)再次確認(rèn)為有效點(diǎn)，而將周圍有效像素點(diǎn)不太多的中心像素點(diǎn)確認(rèn)為背景點(diǎn)，從而有效去除圖2中圖像中的散點(diǎn)。此外，也很重要的一點(diǎn)時(shí)，還可以將經(jīng)過前述局部區(qū)域處理后產(chǎn)生的斷點(diǎn)進(jìn)行連接，例如可能有的黑色點(diǎn)在該過程中轉(zhuǎn)變?yōu)榘咨瑥亩鴮⑾噜彽陌咨c(diǎn)連接起來形成連通的白色區(qū)域。通過該進(jìn)一步的優(yōu)化過程，便于后續(xù)進(jìn)行精確的區(qū)域識(shí)別。如圖3所示，為進(jìn)一步優(yōu)化去除散點(diǎn)噪音后的效果圖。

s2，根據(jù)圖像的像素點(diǎn)的總個(gè)數(shù)和待識(shí)別的目標(biāo)的尺寸范圍設(shè)定第三閾值的大小，將二值化圖片中已連通的區(qū)域內(nèi)的有效像素點(diǎn)的個(gè)數(shù)與第三閾值進(jìn)行比較，如果小于所述第三閾值，則將該區(qū)域內(nèi)的像素點(diǎn)均設(shè)置為背景點(diǎn)，從而去除該區(qū)域。

經(jīng)過二值化處理后的圖片，某些區(qū)域的零散的有效像素點(diǎn)，某些區(qū)域集中了較多的有效像素點(diǎn)，從而形成已連通的區(qū)域。該過程，對(duì)整張二值化圖片中的已連通域進(jìn)行篩選，以檢測到目標(biāo)所在的區(qū)域，而對(duì)于干擾的區(qū)域，則予以去除。

具體地，設(shè)置第三閾值的大小，根據(jù)整幅圖像的像素點(diǎn)的總個(gè)數(shù)與待識(shí)別的目標(biāo)的尺寸范圍設(shè)定第三閾值的大小。可根據(jù)如下式子設(shè)置第三閾值的大?。簕(a*b)*c/d}/e，其中，a*b表示整幅圖像中所有的像素點(diǎn)個(gè)數(shù)，a表示寬度方向的像素點(diǎn)個(gè)數(shù)，b表示長度方向的像素點(diǎn)個(gè)數(shù)；c表示待識(shí)別目標(biāo)的最小尺寸；d表示待識(shí)別目標(biāo)的最大尺寸；e表示估算的a*b大小的圖片最多包含的待識(shí)別目標(biāo)的數(shù)量。以待識(shí)別的目標(biāo)為浮游生物為例，浮游生物的大小尺寸范圍一般在20μm～5cm的范圍內(nèi)。通過浮游生物采集設(shè)備獲取的圖片包含的像素點(diǎn)總個(gè)數(shù)為2448*2050。估算一張圖最多包含10個(gè)最大的浮游生物(估算時(shí)，可以按照整張圖的尺寸和生物尺寸1:1看待，整張圖片的尺寸是3厘米*3.5厘米，為10.5平方厘米，以浮游生物平均占1平方厘米的面積，所以四舍五入估算為最多包括10個(gè))。設(shè)置第三閾值時(shí)，由[(2448*2050)*20/50000]/10設(shè)定得到第三閾值為200.736。

將已連通的區(qū)域內(nèi)的有效點(diǎn)的個(gè)數(shù)和設(shè)定的第三閾值進(jìn)行比較，小于該第三閾值，則表明這些連通的區(qū)域內(nèi)的有效點(diǎn)不足，為干擾區(qū)域，從而將該區(qū)域內(nèi)的像素點(diǎn)均設(shè)置為背景點(diǎn)，舍去該區(qū)域。如圖4所示，為圖3中舍去干擾區(qū)域后的效果示意圖。

s3，對(duì)剩余的已連通的區(qū)域確定出其外接矩形框，形成框取區(qū)域；其中，外接矩形框的四條邊分別與圖像的四條邊平行。

經(jīng)過步驟s2，已連通的區(qū)域中，部分區(qū)域被舍去，部分區(qū)域被保留。對(duì)剩余保留的已連通的各區(qū)域，通過上述步驟s3，確定出各區(qū)域的水平方向的外接矩形框，形成框取區(qū)域。外接矩形框即為一個(gè)矩形，矩形的四條邊分別穿過區(qū)域的上下左右四個(gè)邊界像素點(diǎn)(最上、最下、最左和最右的像素點(diǎn))。水平方向的外接矩形框，表示矩形框的四條邊分別平行于圖像的四條邊，是水平的。確定出外接矩形框后，矩形框內(nèi)的內(nèi)容即為框取區(qū)域。如圖5所示，為確定外接矩形框后的效果示意圖。

s4，將框取區(qū)域有重疊的已連通區(qū)域視為合并的整體區(qū)域，確定出整體區(qū)域的外接矩形框，外接矩形框的四條邊分別與圖像的四條邊平行，外接矩形框中的圖像內(nèi)容為識(shí)別到的目標(biāo)。

對(duì)于框取的區(qū)域，有些區(qū)域是獨(dú)立零散的，有些區(qū)域彼此有重疊。對(duì)于矩形框有重疊的部分，將這部分的已連通區(qū)域視為合并的整體區(qū)域，對(duì)該整體區(qū)域確定出其水平方向的外接矩形框。

如圖6所示，為經(jīng)過步驟s4后，圖像中確定出外接矩形框后的效果示意圖。相對(duì)于圖5，圖6中的有些區(qū)域由一個(gè)外接矩形框合并框取。圖6中，各外接矩形框中的圖像內(nèi)容即為識(shí)別到的目標(biāo)，從而篩選出疑似目標(biāo)所在的位置，及相應(yīng)的數(shù)量。

本具體實(shí)施方式中，經(jīng)過上述步驟，處理模糊圖像(例如渾濁度較高的水體中成的像)時(shí)，通過局部閾值進(jìn)行比較，精確二值化劃分像素點(diǎn)為有效點(diǎn)或者背景噪聲點(diǎn)，然后對(duì)于二值化后的已連通域進(jìn)行再次去噪，連通域框取處理以及合并處理，從而對(duì)圖像進(jìn)行有效的分割，提取出目標(biāo)所在的感興趣區(qū)域，可提高對(duì)對(duì)比度較低、圖像特征不清晰的圖像進(jìn)行識(shí)別的準(zhǔn)確率。該目標(biāo)識(shí)別方法尤其適合在水中拍攝的浮游生物的識(shí)別。

識(shí)別到目標(biāo)所在的區(qū)域后，可進(jìn)一步地結(jié)合分類方法對(duì)區(qū)域內(nèi)的圖像內(nèi)容進(jìn)行分類處理，識(shí)別目標(biāo)的類別信息。本具體實(shí)施方式中，通過如下兩種分類方案分別從邊界梯度、形態(tài)結(jié)構(gòu)單元特征兩個(gè)方面進(jìn)行分類。當(dāng)然，實(shí)際應(yīng)用中，也可根據(jù)實(shí)際情況選擇更適用的其它分類方法。

為便于分類識(shí)別處理，對(duì)提取出的各區(qū)域進(jìn)行歸一化處理，處理為包含有128*128個(gè)像素點(diǎn)的圖像。

第一種分類方案：采用svm+hog的分類方法分析邊界梯度進(jìn)行分類。對(duì)歸一化后得到的圖像進(jìn)行簡單的背景去噪處理后，提取圖形的邊緣密度和邊界梯度進(jìn)行統(tǒng)計(jì)成直方圖，從而由支持向量機(jī)(svm)結(jié)合方向梯度直方圖(hog)對(duì)待測圖片進(jìn)行分析，分辨出是哪種類別的目標(biāo)。svm是一個(gè)傳統(tǒng)的二元分類器，其原理如圖7所示。其中，x1表示下方線條更密集的樣本點(diǎn)；x2表示上方線條稀疏的樣本點(diǎn)。ω^tx+b＝0的含義是：用線性方程來劃分不同樣本的超平面；線性方程右側(cè)的1和-1分別代表兩個(gè)種類。表示兩個(gè)類別的最外層平行面之間的距離。以待識(shí)別的目標(biāo)為浮游生物為例，浮游生物種類繁多，僅二元是不夠的，因此本具體實(shí)施方式中將其優(yōu)化為多種類分類器。

分類過程包括以下步驟：

分類之前先對(duì)樣本進(jìn)行訓(xùn)練(樣本是事先已挑選的)。訓(xùn)練過程為：將n類樣本按照二分法的方式分成1～n/2和n/2+1～n兩類，再對(duì)這兩類包含的樣本進(jìn)行圖形的邊緣密度和邊界梯度統(tǒng)計(jì)；重復(fù)該過程，將這兩類繼續(xù)按照二分的方法繼續(xù)分類和統(tǒng)計(jì)，直到將樣本分類至其中單獨(dú)的一個(gè)類別，即表示訓(xùn)練結(jié)束。原理圖如圖8所示。

分類時(shí)，對(duì)歸一化處理后的各連通域的圖像，分別提取各區(qū)域中圖像的邊緣密度和邊界梯度，根據(jù)邊緣密度和梯度信息，與訓(xùn)練獲得的樣本的統(tǒng)計(jì)信息進(jìn)行比較，將圖像分類為n個(gè)大類中的n/2個(gè)類別中，重復(fù)分類過程，將圖像分類至n/2個(gè)類別中n/4個(gè)類別中，重復(fù)分類，直至圖像分類至其中一個(gè)類別中，從而得到圖像所屬的生物類別。分類的流程圖如圖9所示。

查找確定類別時(shí)，由于待檢測的圖像對(duì)于分類器來說未知，所以時(shí)間對(duì)于查找種類來說最為重要，最常見的查找方式和排序方式為冒泡法、二分法和快速排序。從時(shí)間復(fù)雜度上看，冒泡算法為o(n²)，二分法為o(log2n)，快速排序?yàn)閛(n*logn)，本具體實(shí)施方式中最終選取二分法為查找手段。

第二種分類方案：采用特征點(diǎn)分布算法(shape-context)分析形態(tài)結(jié)構(gòu)單元特征進(jìn)行分類。采用邊緣快速提取算法提取特征點(diǎn)。該算法可以直接將圖形的邊緣提取出來，從而可以將提取出來的點(diǎn)作為特征點(diǎn)，更為有效地看出圖形的邊緣及特征分布情況。該邊緣快速提取算法提取精確，且耗時(shí)也較短。以圖10所示的原圖為例，其大小為2448*2050，感興趣區(qū)域的浮游生物圖像為圖11所示，大小為210*210，提取疑似浮游生物區(qū)域的特征點(diǎn)的過程耗時(shí)為54秒，提取后得到的特征點(diǎn)(黑色像素點(diǎn))的圖像如圖12所示。

分析邊界梯度進(jìn)行分類的過程包括以下步驟：

分類之前對(duì)樣本進(jìn)行訓(xùn)練(樣本是是事先已挑選的)，訓(xùn)練過程為：將樣本通過邊緣快速提取算法進(jìn)行處理得到邊緣和特征點(diǎn)的分布情況，再通過圖13所示的特征點(diǎn)統(tǒng)計(jì)方法對(duì)特征點(diǎn)分布進(jìn)行統(tǒng)計(jì)，將每種樣本的特征點(diǎn)分布情況分別統(tǒng)計(jì)在各自的一個(gè)文本中，統(tǒng)計(jì)出所有樣本的特征點(diǎn)分布情況即完成訓(xùn)練。圖13所示的統(tǒng)計(jì)方法為：以特征點(diǎn)為中心進(jìn)行8等分(45°為一個(gè)區(qū)域，360°平分成8個(gè)區(qū)域)，再根據(jù)圖形特征大小向外擴(kuò)散5個(gè)區(qū)域，即以該特征點(diǎn)為中心，到能包含所有特征點(diǎn)的外接圓的最大半徑，將這個(gè)最大半徑分五等分，構(gòu)成五個(gè)圓，同時(shí)每個(gè)圓按照上述分成8個(gè)區(qū)域，由此將圖形中所有特征點(diǎn)劃分到40個(gè)區(qū)域內(nèi)。

分類時(shí)，將歸一化處理后的各連通域的圖像通過邊緣快速提取算法進(jìn)行處理得到邊緣和特征點(diǎn)的分布情況，再通過圖13所示的方法對(duì)特征點(diǎn)分布進(jìn)行統(tǒng)計(jì)，將待檢測圖像統(tǒng)計(jì)后的特征點(diǎn)分布結(jié)果和訓(xùn)練所得的每個(gè)樣本的特征點(diǎn)分布統(tǒng)計(jì)結(jié)果進(jìn)行比較，從而識(shí)別出待檢測圖像所屬的類別。

通過上述設(shè)計(jì)出的多種類分類器以及多種類訓(xùn)練器可以更好地對(duì)目標(biāo)，例如世界萬千物種進(jìn)行分類。

本具體實(shí)施方式中還提供一種圖像目標(biāo)識(shí)別裝置，包括二值化處理模塊、區(qū)域去除模塊、區(qū)域框取模塊和區(qū)域合并模塊；其中，所述二值化處理模塊用于將圖像中各像素點(diǎn)二值化處理，劃分為有效像素點(diǎn)和背景點(diǎn)，從而將圖像轉(zhuǎn)換為二值化的圖片；所述區(qū)域去除模塊用于根據(jù)圖像的像素點(diǎn)的總個(gè)數(shù)和待識(shí)別的目標(biāo)的尺寸范圍設(shè)定第三閾值的大小，將二值化圖片中已連通的區(qū)域內(nèi)的有效像素點(diǎn)的個(gè)數(shù)與第三閾值進(jìn)行比較，如果小于所述第三閾值，則將該區(qū)域內(nèi)的像素點(diǎn)均設(shè)置為背景點(diǎn)，從而去除該區(qū)域；區(qū)域框取模塊用于對(duì)剩余的已連通的各區(qū)域確定出其外接矩形框，形成框取區(qū)域；其中，外接矩形框的四條邊分別與圖像的四條邊平行；所述區(qū)域合并模塊用于將框取區(qū)域有重疊的已連通區(qū)域視為合并的整體區(qū)域，確定出整體區(qū)域的外接矩形框，外接矩形框的四條邊分別與圖像的四條邊平行，外接矩形框中的圖像內(nèi)容為識(shí)別到的目標(biāo)。本具體實(shí)施方式的目標(biāo)識(shí)別裝置可提高對(duì)對(duì)比度較低、圖像特征不清晰的圖像進(jìn)行識(shí)別的準(zhǔn)確率。

以上內(nèi)容是結(jié)合具體的優(yōu)選實(shí)施方式對(duì)本發(fā)明所作的進(jìn)一步詳細(xì)說明，不能認(rèn)定本發(fā)明的具體實(shí)施只局限于這些說明。對(duì)于本發(fā)明所屬技術(shù)領(lǐng)域的普通技術(shù)人員來說，在不脫離本發(fā)明構(gòu)思的前提下做出若干替代或明顯變型，而且性能或用途相同，都應(yīng)當(dāng)視為屬于本發(fā)明的保護(hù)范圍。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：程雪岷;畢洪生;王育琦;王嶸;張臨風(fēng)
技術(shù)所有人：清華大學(xué)深圳研究生院
我是此專利的發(fā)明人

上一篇：極速地理GeoHash聚類方法與流程
上一篇：數(shù)據(jù)處理方法和裝置與流程

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

sar圖像目標(biāo)識(shí)別相關(guān)技術(shù)

無人機(jī)圖像目標(biāo)識(shí)別相關(guān)技術(shù)

圖像目標(biāo)識(shí)別相關(guān)技術(shù)

圖像目標(biāo)識(shí)別與定位相關(guān)技術(shù)

高光譜圖像目標(biāo)識(shí)別相關(guān)技術(shù)

遙感圖像目標(biāo)識(shí)別相關(guān)技術(shù)

圖像目標(biāo)識(shí)別綜述相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種圖像目標(biāo)識(shí)別方法及裝置與流程