一種感興趣區(qū)域的定位方法
【專利摘要】本發(fā)明涉及一種感興趣區(qū)域的定位方法,具體步驟包括:A、在感興趣區(qū)域ROI邊緣確定位置處粘貼二維碼即Marker標記;B、檢測Marker標記,定位到ROI感興趣區(qū)域,具體步驟如下:(1)圖像灰度化;(2)圖像二值化;(3)檢測圖像輪廓;(4)搜索圖像中可能的Marker標記;(5)檢測并解碼可能的Marker標記;(6)篩選解碼后的可能的Marker標記,找出正確的Marker標記;(7)對感興趣區(qū)域ROI進行定位。本發(fā)明Marker標記只有黑、白兩種顏色,圖像二值化后很明顯,能夠快速而準確地定位感興趣區(qū)域ROI,簡化了圖像預處理操作,能夠適應光線變化的情況且魯棒性很強。
【專利說明】一種感興趣區(qū)域的定位方法
【技術領域】
[0001]本發(fā)明涉及一種感興趣區(qū)域的定位方法,屬于圖像處理與模式識別【技術領域】。
【背景技術】
[0002]隨著圖像處理技術的發(fā)展,自動定位方法的應用領域越來越廣泛。在許多實際應用中,自動定位出圖像的感興趣區(qū)域是問題的關鍵,也是對圖像進行分析和理解的基礎。對圖像某個區(qū)域的定位有很多方法,其中常見的有模板匹配定位法、幾何特征定位法、小波變換定位方法。這些方法都廣泛應用于人臉檢測、人眼定位、期刊圖像文件處理系統(tǒng)、車牌識別等領域。
[0003]二維碼的編碼組合則非常多,如Qrcode及Datamatrix條碼最多可以存2K左右的信息,但是存儲這么多的信息,識別起來難度就會很大。傳統(tǒng)的感興趣區(qū)域ROI定位策略,往往是對數(shù)字圖像上的原始內(nèi)容進行腐蝕、銳化、濾波、去噪、傾斜校正等一系列復雜的預處理操作,即便如此,也未必實現(xiàn)良好的ROI感興趣區(qū)域定位;此外,這些策略也極易受到光線亮度、照射角度等的干擾;另外,在很多場合中,圖像中的原始特征不夠明顯,非常難于提取,要定位到感興趣區(qū)域R0I,就需要非常復雜的預處理操作,不斷地尋找新的特征才能完成定位。
【發(fā)明內(nèi)容】
[0004]為了克服上述現(xiàn)有技術的不足,本發(fā)明公開了一種感興趣區(qū)域的定位方法;
[0005]本發(fā)明Marker標記具有通用性,極易檢測和識別,能夠適應光線的變化和識別對象的傾斜、倒置等情況,通過檢測所述Marker標記,再根據(jù)相對位置定位出感興趣區(qū)域ROI,即可對感興趣區(qū)域ROI進行模式識別。
[0006]本發(fā)明應用于工業(yè)儀表的讀數(shù)識別,在儀表的字符或指針區(qū)域設計Marker標記,監(jiān)控攝像頭采集儀表圖像,通過Marker標記區(qū)分儀表的型號并定位到感興趣區(qū)域R0I,然后進行讀數(shù)識別。
[0007]本發(fā)明的技術方案為:
[0008]術語解釋:
[0009]圖像灰度化,指由彩色圖像轉(zhuǎn)化為灰度圖像的過程;
[0010]圖像二值化,指將圖像上的像素點的灰度值設置為O或255,也就是將整個圖像呈現(xiàn)出明顯的黑白效果;
[0011]漢明距離,指兩個等長字符串之間對應位置的不同字符的個數(shù),即將一個字符串變換成另外一個字符串所需要替換的字符個數(shù)。
[0012]一種感興趣區(qū)域的定位方法,具體步驟包括:
[0013]A、在感興趣區(qū)域ROI邊緣確定位置處粘貼二維碼即Marker標記;所述確定位置是指通過刻度尺或其它測量工具通過所述Marker標記的大小和位置能夠定位所述感興趣區(qū)域 ROI ;
[0014]B、檢測所述Marker標記,定位到感興趣區(qū)域R0I,具體步驟如下:
[0015](I)圖像灰度化;
[0016](2)圖像二值化;
[0017]⑶檢測圖像輪廓;
[0018](4)搜索圖像中可能的Marker標記;
[0019](5)檢測并解碼步驟⑷得到的可能的Marker標記;
[0020](6)篩選解碼后的可能的Marker標記,找出正確的Marker標記;
[0021](7)對感興趣區(qū)域ROI進行定位,根據(jù)所述Marker標記與感興趣區(qū)域ROI的所述確定位置,完成對感興趣區(qū)域ROI的定位;
[0022]所述Marker標記是由白色塊和黑色塊構成的規(guī)則圖形,所述Marker標記有如下特點:
[0023]①所述白色塊為白色,所述黑色塊為黑色;
[0024]②所述Marker標記為規(guī)則的矩形;
[0025]③所述Marker標記有方向?qū)傩?所述方向?qū)傩允侵笇⑺鯩arker標記以及按照同一方向?qū)⑺鯩arker標記旋轉(zhuǎn)90°、180° >270°得到的四種圖像各不相同;
[0026]④所述Marker標記為7 X 7的柵格,所述Marker標記中心5 X 5的柵格為識別編碼,所述Marker標記周圍一圈為黑色邊界。
[0027]根據(jù)所述Marker標記的特點,非常容易將圖像中的所述Marker標記提取出來,所述Marker標記只有黑、白兩種顏色,在圖像二值化后很明顯,根據(jù)所述Marker標記的矩形特征和方向?qū)傩?對圖像進行透視變化和傾斜校正,另外,每種所述Marker標記的內(nèi)部結構不同,對內(nèi)部結構進行編碼和解碼,用來定位感興趣區(qū)域R0I。
[0028]根據(jù)本發(fā)明優(yōu)選的,所述檢測圖像輪廓,具體是指,使用opencv庫中的findContours O函數(shù)從圖像中得到一系列多邊形輪廓。
[0029]根據(jù)本發(fā)明優(yōu)選的,所述搜索圖像中可能的Marker標記,具體是指,通過MarkerDetector類中的findMarkerCandi dates ()方法從所述多邊形輪廓中獲取可能的Marker標記,用approxPolyDPO函數(shù)從所述多邊形輪廓中篩選出頂點數(shù)目為4的凸多邊形,檢測所述凸多邊形邊長,如果所述凸多邊形的最小邊長小于lOpixel,則不認為是可能的Marker標記,否則,認為是可能的Marker標記。
[0030]只有頂點數(shù)目為4的凸多邊形且才有可能是Marker標記。
[0031]根據(jù)本發(fā)明優(yōu)選的,所述檢測并解碼步驟⑷得到的可能的Marker標記,具體步驟包括:
[0032]a、將所有步驟(4)得到的可能的Marker標記逆時針排序,即將所述步驟⑷得到的可能的Marker標記4個頂點按照逆時針排序;
[0033]b、檢測所有可能的Marker標記中是否有重復的Marker標記,計算所有可能的Marker標記中任意兩個Marker標記的周長S1、S2,取所述周長S1、S2中的較小值S,計算所述任意兩個Marker標記的4個對應頂點之間的距離L1、L2、L3、L4,如果(L1+L2+L3+L4)
<S,則認為所述任意兩個Marker標記重復,去掉所述任意兩個Marker標記中那個周長較短的Marker標記,保留所述任意兩個Marker標記中周長較長的Marker標記,否則,保留所述任意兩個Marker標記,接著采用上述同樣的方法檢測剩下的可能的Marker標記中是否有重復的Marker標記;
[0034]C、利用透視變換將步驟b得到的所述Marker標記轉(zhuǎn)換成正方形Marker標記;
[0035]d、識別步驟c得到的所述正方形Marker標記,所述正方形Marker標記為7X7的柵格,首先,檢測所述正方形Marker標記的周圍一圈是否為黑色邊界,如果不是,檢測下一個Marker標記,如果是,接著對所述正方形Marker標記中心5X5的柵格解碼,所述正方形Marker標記中心5X5的柵格中,取第一列、第三列、第五列為校驗碼,用來保證旋轉(zhuǎn),第二列和第四列作為id關鍵詞。
[0036]針對每種所述校驗碼,最多有1024種不同的編碼方式。
[0037]所述正方形Marker標記中心5X5的柵格旋轉(zhuǎn)不變性才能得到唯一的編碼。
[0038]根據(jù)本發(fā)明優(yōu)選的,篩選解碼后的可能的Marker標記,找出正確的Marker標記,具體是指,步驟(5)得到的所述Marker標記以及按照同一方向?qū)⑺鯩arker標記旋轉(zhuǎn)90° > 180° >270°得到的4種不同方向的Marker標記,對所述四種不同方向的Marker標記進行編碼,得到4種不同的編碼,取所述4種不同的編碼中漢明距離最小的編碼對應的Marker標記為正確的Marker標記,所述漢明距離是指4種不同的編碼中一、三、五列與校驗碼不同的柵格總數(shù)。
[0039]本發(fā)明的有益效果為:
[0040]1、本發(fā)明Marker標記只有黑、白兩種顏色,在圖像二值化后很明顯,能夠快速而準確地定位到圖像中的感興趣區(qū)域R0I,簡化了圖像預處理操作,能夠適應光線變化的情況且魯棒性很強,而且根據(jù)不同的Marker標記對要識別的感興趣區(qū)域ROI做類別的區(qū)分;
[0041]2、本發(fā)明利用所述Marker標記來定位感興趣區(qū)域R0I,另辟蹊徑,人為加入Marker標記作為特征,解決了傳統(tǒng)定位中特征提取的難題;所述Marker標記解碼中使用校驗碼的思想,解決了此類二維碼的類別區(qū)分難度大的問題。
【專利附圖】
【附圖說明】
[0042]圖1是本發(fā)明所述Marker標記的示例圖;
[0043]圖2是本發(fā)明流程圖;
[0044]圖3是本發(fā)明Marker標記的編碼圖,圖3中,Marker標記為7X7的柵格,周圍一圈為黑色邊界,Marker標記中心5X5的柵格中,取第一列、第三列、第五列為校驗碼,第二列和第四列作為id關鍵詞,第二列和第四列中,黑色柵格編碼為0,白色柵格編碼為1,編碼為 00001010 ;
[0045]圖4為感興趣區(qū)域ROI與Marker標記所述確定位置示例圖,圖4中,已知Marker標記的邊長為a,左上角坐標為(al,a2),感興趣區(qū)域ROI位于Marker標記正上方,感興趣區(qū)域ROI長2.5a,寬1.5a ;據(jù)此,確定感興趣區(qū)域ROI的左上角坐標(m,η)為(al, a2+l.5a),感興趣區(qū)域 ROI 長 2.5a,寬 1.5a ;
[0046]圖5a為一種Marker標記的不例圖;
[0047]圖5b為圖5a所述Marker標記順時針旋轉(zhuǎn)90°的示例圖;
[0048]圖5c為圖5a所述Marker標記順時針旋轉(zhuǎn)180°的示例圖;
[0049]圖5d為圖5a所述Marker標記順時針旋轉(zhuǎn)270°的示例圖;
[0050]圖5a、圖5b、圖5c、圖5d為四種不同的Marker標記,反應了 Marker標記的方向?qū)傩浴?br>
【具體實施方式】
[0051]實施例1
[0052]一種感興趣區(qū)域的定位方法,具體步驟包括:
[0053]A、在感興趣區(qū)域ROI邊緣確定位置處粘貼二維碼即Marker標記;所述確定位置是指通過刻度尺或其它測量工具通過所述Marker標記的大小和位置能夠定位所述感興趣區(qū)域 ROI ;
[0054]B、檢測所述Marker標記,定位到ROI感興趣區(qū)域,具體步驟如下:
[0055](I)圖像灰度化;
[0056](2)圖像二值化;
[0057](3)檢測圖像輪廓;
[0058](4)搜索圖像中可能的Marker標記;
[0059](5)檢測并解碼可能的Marker標記;
[0060](6)篩選解碼后的可能的Marker標記,找出正確的Marker標記;
[0061](7)對感興趣區(qū)域ROI進行定位,根據(jù)所述Marker標記與感興趣區(qū)域ROI的所述確定位置,完成對感興趣區(qū)域ROI的定位;
[0062]所述Marker標記是由白色塊和黑色塊構成的規(guī)則圖形,所述Marker標記有如下特點:
[0063]①所述白色塊為白色,所述黑色塊為黑色;
[0064]②所述Marker標記為規(guī)則的矩形;
[0065]③所述Marker標記有方向?qū)傩?所述方向?qū)傩允侵笇⑺鯩arker標記以及按照同一方向?qū)⑺鯩arker標記旋轉(zhuǎn)90°、180° >270°得到的四種圖像各不相同;
[0066]④所述Marker標記為7 X 7的柵格,所述Marker標記中心5 X 5的柵格為識別編碼,所述Marker標記周圍一圈為黑色邊界。
[0067]根據(jù)所述Marker標記的特點,非常容易將圖像中的所述Marker標記提取出來,所述Marker標記只有黑、白兩種顏色,在圖像二值化后很明顯,根據(jù)所述Marker標記的矩形特征和方向?qū)傩?對圖像進行透視變化和傾斜校正,另外,每種所述Marker標記的內(nèi)部結構不同,對內(nèi)部結構進行編碼和解碼,用來定位感興趣區(qū)域R0I。
[0068]實施例2
[0069]根據(jù)實施例1所述的一種感興趣區(qū)域的定位方法,其區(qū)別在于,所述檢測圖像輪廓,具體是指,使用opencv庫中的findContours O函數(shù)從圖像中得到一系列多邊形輪廓。
[0070]實施例3
[0071]根據(jù)實施例1所述的一種感興趣區(qū)域的定位方法,其區(qū)別在于,所述搜索圖像中可能的Marker標記,具體是指,通過MarkerDetector類中的findMarkerCandidates O方法從所述多邊形輪廓中獲取可能的Marker標記,用approxPolyDP O函數(shù)從所述多邊形輪廓中篩選出頂點數(shù)目為4的凸多邊形,檢測所述凸多邊形邊長,如果所述凸多邊形的最小邊長小于1pixel,則不認為是可能的Marker標記,否則,認為是可能的Marker標記。
[0072]只有頂點數(shù)目為4的凸多邊形且才有可能是Marker標記。
[0073]實施例4
[0074]根據(jù)實施例1所述的一種感興趣區(qū)域的定位方法,其區(qū)別在于,所述檢測并解碼步驟(4)得到的可能的Marker標記,具體步驟包括:
[0075]a、將所有步驟(4)得到的可能的Marker標記逆時針排序,即將所述步驟⑷得到的可能的Marker標記4個頂點按照逆時針排序;
[0076]b、檢測所有可能的Marker標記中是否有重復的Marker標記,計算所有可能的Marker標記中任意兩個Marker標記的周長S1、S2,取所述周長S1、S2中的較小值S,計算所述任意兩個Marker標記的4個對應頂點之間的距離L1、L2、L3、L4,如果(L1+L2+L3+L4)
<S,則認為所述任意兩個Marker標記重復,去掉所述任意兩個Marker標記中那個周長較短的Marker標記,保留所述任意兩個Marker標記中周長較長的Marker標記,否則,保留所述任意兩個Marker標記,接著采用上述同樣的方法檢測剩下的可能的Marker標記中是否有重復的Marker標記;
[0077]C、利用透視變換將步驟b得到的所述Marker標記轉(zhuǎn)換成正方形Marker標記;
[0078]d、識別步驟c得到的所述正方形Marker標記,所述正方形Marker標記為7X7的柵格,首先,檢測所述正方形Marker標記的周圍一圈是否為黑色邊界,如果不是,檢測下一個Marker標記,如果是,接著對所述正方形Marker標記中心5X5的柵格解碼,所述正方形Marker標記中心5X5的柵格中,取第一列、第三列、第五列為校驗碼,用來保證旋轉(zhuǎn),第二列和第四列作為id關鍵詞。
[0079]針對每種所述校驗碼,最多有1024種不同的編碼方式。
[0080]所述正方形Marker標記中心5X5的柵格旋轉(zhuǎn)不變性才能得到唯一的編碼。
[0081]實施例5
[0082]根據(jù)實施例1所述的一種感興趣區(qū)域的定位方法,其區(qū)別在于,篩選解碼后的可能的Marker標記,找出正確的Marker標記,具體是指,步驟(5)得到的所述Marker標記以及按照同一方向?qū)⑺鯩arker標記旋轉(zhuǎn)90°、180° >270°得到的4種不同方向的Marker標記,對所述四種不同方向的Marker標記進行編碼,得到4種不同的編碼,取所述4種不同的編碼中漢明距離最小的編碼對應的Marker標記為正確的Marker標記,所述漢明距離是指4種不同的編碼中一、三、五列與校驗碼不同的柵格總數(shù)。
【權利要求】
1.一種感興趣區(qū)域的定位方法,其特征在于,具體步驟包括: A、在感興趣區(qū)域ROI邊緣確定位置處粘貼二維碼即Marker標記;所述確定位置是指通過刻度尺或其它測量工具通過所述Marker標記的大小和位置能夠定位所述感興趣區(qū)域ROI ; B、檢測所述Marker標記,定位到ROI感興趣區(qū)域,具體步驟如下: (1)圖像灰度化; (2)圖像二值化; (3)檢測圖像輪廓; (4)搜索圖像中可能的Marker標記; (5)檢測并解碼可能的Marker標記; (6)篩選解碼后的可能的Marker標記,找出正確的Marker標記; (7)對感興趣區(qū)域ROI進行定位,根據(jù)所述Marker標記與感興趣區(qū)域ROI的所述確定位直,完成對感興趣區(qū)域ROI的定位; 所述Marker標記是由白色塊和黑色塊構成的規(guī)則圖形,所述Marker標記有如下特占-^ \\\.①所述白色塊為白色,所述黑色塊為黑色; ②所述Marker標記為規(guī)則的矩形; ③所述Marker標記有方向?qū)傩?所述方向?qū)傩允侵笇⑺鯩arker標記以及按照同一方向?qū)⑺鯩arker標記旋轉(zhuǎn)90°、180° >270°得到的四種圖像各不相同; ④所述Marker標記為7X7的柵格,所述Marker標記中心5X5的柵格為識別編碼,所述Marker標記周圍一圈為黑色邊界。
2.根據(jù)權利要求1所述的一種感興趣區(qū)域的定位方法,其特征在于,所述檢測圖像輪廓,具體是指,使用opencv庫中的findContours O函數(shù)從圖像中得到一系列多邊形輪廓。
3.根據(jù)權利要求1所述的一種感興趣區(qū)域的定位方法,其特征在于,所述搜索圖像中可能的Marker標記,具體是指,通過MarkerDetector類中的findMarkerCandidates O方法從所述多邊形輪廓中獲取可能的Marker標記,用approxPolyDP O函數(shù)從所述多邊形輪廓中篩選出頂點數(shù)目為4的凸多邊形,檢測所述凸多邊形邊長,如果所述凸多邊形的最小邊長小于1pixel,則不認為是可能的Marker標記,否則,認為是可能的Marker標記。
4.根據(jù)權利要求1所述的一種感興趣區(qū)域的定位方法,其特征在于,所述檢測并解碼步驟(4)得到的可能的Marker標記,具體步驟包括: a、將所有步驟(4)得到的可能的Marker標記逆時針排序,即將所述步驟(4)得到的可能的Marker標記4個頂點按照逆時針排序; b、檢測所有可能的Marker標記中是否有重復的Marker標記,計算所有可能的Marker標記中任意兩個Marker標記的周長S1、S2,取所述周長S1、S2中的較小值S,計算所述任意兩個Marker標記的4個對應頂點之間的距離L1、L2、L3、L4,如果(L1+L2+L3+L4) < S,則認為所述任意兩個Marker標記重復,去掉所述任意兩個Marker標記中那個周長較短的Marker標記,保留所述任意兩個Marker標記中周長較長的Marker標記,否則,保留所述任意兩個Marker標記,接著采用上述同樣的方法檢測剩下的可能的Marker標記中是否有重復的Marker標記; C、利用透視變換將步驟b得到的所述Marker標記轉(zhuǎn)換成正方形Marker標記;d、識別步驟c得到的所述正方形Marker標記,所述正方形Marker標記為7X7的柵格,首先,檢測所述正方形Marker標記的周圍一圈是否為黑色邊界,如果不是,檢測下一個Marker標記,如果是,接著對所述正方形Marker標記中心5X5的柵格解碼,所述正方形Marker標記中心5X5的柵格中,取第一列、第三列、第五列為校驗碼,用來保證旋轉(zhuǎn),第二列和第四列作為id關鍵詞。
5.根據(jù)權利要求1-4任一所述的一種感興趣區(qū)域的定位方法,其特征在于,篩選解碼后的可能的Marker標記,找出正確的Marker標記,具體是指,步驟(5)得到的所述Marker標記以及按照同一方向?qū)⑺鯩arker標記旋轉(zhuǎn)90°、180° >270°得到的4種不同方向的Marker標記,對所述四種不同方向的Marker標記進行編碼,得到4種不同的編碼,取所述4種不同的編碼中漢明距離最小的編碼對應的Marker標記為正確的Marker標記,所述漢明距離是指4種不同的編碼中一、三、五列與校驗碼不同的柵格總數(shù)。
【文檔編號】G06K9/46GK104331697SQ201410655560
【公開日】2015年2月4日 申請日期:2014年11月17日 優(yōu)先權日:2014年11月17日
【發(fā)明者】姜威, 于向陽, 李振宇, 朱秀娟 申請人:山東大學