基于圖像綜合特征的答題卡填涂信息自動(dòng)識(shí)別方法
【專利摘要】本發(fā)明提供基于圖像綜合特征的答題卡填涂信息自動(dòng)識(shí)別方法。首先獲取一道選擇題區(qū)域圖像數(shù)據(jù),對(duì)其進(jìn)行形態(tài)學(xué)處理,然后再進(jìn)行自適應(yīng)閾值的二值化,接再對(duì)二值化圖像進(jìn)行輪廓檢測(cè)與異常輪廓判斷,接著利用原始圖像、形態(tài)學(xué)處理后圖像與二值圖像計(jì)算相關(guān)評(píng)價(jià)指標(biāo),然后利用所計(jì)算出來(lái)的評(píng)價(jià)指標(biāo)和全局一致性閾值進(jìn)行填涂結(jié)果判斷,最后返回識(shí)別結(jié)果并更新全局一致性閾值。本發(fā)明能兼容不同紙張的答題卡,也能兼容濾紅卡、選項(xiàng)區(qū)域有半框、全框或者字母等類型的答題卡,且具有很快的識(shí)別速度和較高的魯棒性。
【專利說(shuō)明】基于圖像綜合特征的答題卡填涂信息自動(dòng)識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明一般涉及計(jì)算機(jī)模式識(shí)別與圖像處理領(lǐng)域,具體涉及答題卡填涂信息自動(dòng) 識(shí)別方法。
【背景技術(shù)】
[0002] 隨著信息技術(shù)的發(fā)展,計(jì)算機(jī)處理的數(shù)據(jù)量越來(lái)越大,在很多領(lǐng)域里,亟需解決 海量數(shù)據(jù)的采集、識(shí)別和錄入的問(wèn)題。目前,在高考、成人高考、全國(guó)大學(xué)英語(yǔ)等級(jí)考試等大 型考試已經(jīng)使用OMR(光學(xué)標(biāo)記閱讀機(jī))解決該問(wèn)題。雖然OMR技術(shù)解決了一些答題卡數(shù) 據(jù)錄入的問(wèn)題,但是由于其自身技術(shù)是基于光電識(shí)別技術(shù)的,存在許多目前難以解決的問(wèn) 題:(1)設(shè)備專用:光電識(shí)別機(jī)只能在審閱客觀題中使用,主觀題仍需使用掃描儀掃描,價(jià) 格昂貴;(2)答題卡格式固定:受限于光電頭安裝位置和排列密度相對(duì)固定,對(duì)于不同格式 的答題卡調(diào)整難度很大,甚至無(wú)法滿足要求;(3)答題卡制造成本高:0MR答題卡必須為含 鉛銅版紙進(jìn)行彩色印刷且對(duì)答題卡裁切精度有嚴(yán)格要求,經(jīng)濟(jì)成本、環(huán)境成本高,對(duì)于大多 數(shù)中小學(xué)無(wú)力承擔(dān)該費(fèi)用;(4)糾錯(cuò)流程復(fù)雜:0MR技術(shù)中,若在識(shí)別的過(guò)程中發(fā)生異常,必 須停機(jī),人工分揀出出錯(cuò)答題卡,逐張人工重新填涂,才能重新開機(jī)識(shí)別,大大影響閱卷效 率。(5)圖像不能保存待查:不能保存識(shí)別過(guò)的答題卡圖像,判題透明性差,若要查對(duì)必須 人工從紙質(zhì)答題卡中重新分揀出來(lái)。
[0003] 利用圖像處理技術(shù)對(duì)經(jīng)過(guò)掃描的答題卡的數(shù)據(jù)進(jìn)行識(shí)別和錄入是一項(xiàng)新技術(shù)。它 除了可以克服上述OMR技術(shù)存在的缺陷外,還具有設(shè)備、紙張成本低,識(shí)別率及速度可隨計(jì) 算機(jī)軟、硬件發(fā)展不斷優(yōu)化、提升,改卷結(jié)果可直接顯示在掃描圖像上,判卷透明性高,校對(duì) 方便等特點(diǎn)。該技術(shù)將在計(jì)算機(jī)閱卷、電子政務(wù)、社會(huì)調(diào)查數(shù)據(jù)采集、生產(chǎn)和流通領(lǐng)域的過(guò) 程管理及其它領(lǐng)域中顯示出其良好的應(yīng)用前景。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明針對(duì)目前答題卡識(shí)別技術(shù)的不足,提供了基于圖像綜合特征的答題卡填涂 信息自動(dòng)識(shí)別方法。本發(fā)明的目的在于克服現(xiàn)有現(xiàn)有識(shí)別算法兼容性較差和識(shí)別效率較低 的問(wèn)題,提供一種能兼容不同紙張的答題卡,也能兼容濾紅卡、選項(xiàng)區(qū)域有半框、全框或者 字母等類型的答題卡,且具有很快的識(shí)別速度和較高的魯棒性的方法,具體技術(shù)方案如下。
[0005] 基于圖像綜合特征的答題卡填涂信息自動(dòng)識(shí)別方法,包括以下步驟:
[0006] (a)從答題卡圖像中依次獲取一道選擇題區(qū)域灰度圖像;
[0007] (b)對(duì)步驟(a)獲取的灰度圖像進(jìn)行形態(tài)學(xué)閉操作;
[0008] (C)對(duì)步驟(b)處理后所得的灰度圖像進(jìn)行自適應(yīng)閾值二值化操作,并得到二值 化閾值thresh ;
[0009] (d)對(duì)步驟(C)得到的二值化圖像進(jìn)行輪廓檢測(cè),并判斷是否存在異常輪廓; [0010] (e)將步驟(a)所得灰度圖像反相得到圖像A,將步驟(c)得到的二值化圖像反相 得圖像B,將步驟(b)得到的灰度圖像反相并與圖像B相與得圖像C,將圖像A與圖像B相 與得到圖像D,然后利用圖像A、B、C和D計(jì)算相應(yīng)的評(píng)價(jià)指標(biāo);
[0011] (f)利用步驟(e)計(jì)算出的評(píng)價(jià)指標(biāo)得出填涂結(jié)果;
[0012] (g)輸出填涂結(jié)果,更新全局一致性填涂閾值(globalGrayThresh);
[0013] (h)獲取下一道選擇題的圖像,重復(fù)步驟(b)-(g),直到完成所有選擇題的識(shí)別。
[0014] 上述基于圖像綜合特征的答題卡填涂信息自動(dòng)識(shí)別方法中,步驟(d)中判斷異常 輪廓的方法為:依次對(duì)查找到的輪廓取外接矩形,判斷是否存在外接矩形的寬度大于步驟 (a)所得圖像寬度的二分之一,同時(shí)外接矩形的高度小于步驟(a)所得圖像高度的四分之 一,若存在則為異常輪廓,將該輪廓?jiǎng)h除,即將該輪廓內(nèi)像素全部置255。
[0015] 上述基于圖像綜合特征的答題卡填涂信息自動(dòng)識(shí)別方法中,步驟(e)中所需計(jì)算 的評(píng)價(jià)指標(biāo)包括方差(imgDev)、選項(xiàng)灰度和(qsGraySum)、選項(xiàng)填涂塊面積(qsArea)和選 項(xiàng)平均灰度(qsAvgGray),其計(jì)算過(guò)程包括以下步驟:
[0016] (e-Ι)將步驟(a)所得灰度圖像反相得到圖像A,將步驟(c)得到的二值化圖像反 相得圖像B,將步驟(b)得到的灰度圖像反相并與圖像B相與得圖像C,將圖像A與圖像B 相與得到圖像D ;
[0017] (e_2)若題目選項(xiàng)數(shù)量為N,依次獲取步驟(e-Ι)中得到的圖像B、C和D對(duì)應(yīng)每個(gè) 選項(xiàng)的圖像 B^CjPDi, i = 1,2···Ν;
[0018] (e-3)利用A、Ci和Di依次計(jì)算每個(gè)選項(xiàng)的各個(gè)評(píng)價(jià)指標(biāo)imgDev、qsGraySum、 qsArea 和 qsAvgGray,其計(jì)算方法如下:perQstArea = A W*AH/N,imgDev = Σ i,j(A(i, j)- Σ k, #(k,I) AAW*AH)) V(AW*AH),其中Aw為圖像A的寬度,Ah為圖像A的高度;選項(xiàng)灰 度
【權(quán)利要求】
1. 基于圖像綜合特征的答題卡填涂信息自動(dòng)識(shí)別方法,其特征在于,包括以下步驟: (a) 從答題卡圖像中依次獲取一道選擇題區(qū)域灰度圖像; (b) 對(duì)步驟(a)獲取的圖像進(jìn)行形態(tài)學(xué)閉操作; (c) 對(duì)步驟(b)處理后所得的灰度圖像進(jìn)行自適應(yīng)閾值二值化操作,并得到二值化閾 值thresh; (d) 對(duì)步驟(c)得到的二值化圖像進(jìn)行輪廓檢測(cè),并判斷是否存在異常輪廓; (e) 將步驟(a)所得灰度圖像反相得到圖像A,將步驟(c)得到的二值化圖像反相得圖 像B,將步驟(b)得到的灰度圖像反相并與圖像B相與得圖像C,將圖像A與圖像B相與得 到圖像D,然后利用圖像A、B、C和D計(jì)算相應(yīng)的評(píng)價(jià)指標(biāo); (f) 利用步驟(e)計(jì)算出的評(píng)價(jià)指標(biāo)得出填涂結(jié)果; (g) 輸出填涂結(jié)果,更新全局一致性填涂閾值globalGrayThresh; (h) 獲取下一道選擇題的圖像,重復(fù)步驟(b)-(g),直到完成所有選擇題的識(shí)別。
2. 根據(jù)權(quán)利要求1所述基于圖像綜合特征的答題卡填涂信息自動(dòng)識(shí)別方法,其特征在 于,步驟(d)中判斷異常輪廓的方法為:依次對(duì)查找到的輪廓取外接矩形,判斷是否存在外 接矩形的寬度大于步驟(a)所得圖像寬度的二分之一,同時(shí)外接矩形的高度小于步驟(a) 所得圖像高度的四分之一,若存在則為異常輪廓,將該輪廓?jiǎng)h除,即將該輪廓內(nèi)像素全部置 255。
3. 根據(jù)權(quán)利要求1所述基于圖像綜合特征的答題卡填涂信息自動(dòng)識(shí)別方法,其特征在 于:步驟(e)中所需計(jì)算的評(píng)價(jià)指標(biāo)包括方差imgDev、選項(xiàng)灰度qsGraySum、選項(xiàng)填涂塊面 積qsArea和選項(xiàng)平均灰度qsAvgGray,其計(jì)算過(guò)程包括以下步驟: (e-Ι)將步驟(a)所得灰度圖像反相得到圖像A,將步驟(c)得到的二值化圖像反相得 圖像B,將步驟(b)得到的灰度圖像反相并與圖像B相與得圖像C,將圖像A與圖像B相與 得到圖像D; (e-2)若題目的選項(xiàng)數(shù)量為N,依次獲取步驟(e-Ι)中得到的圖像B、C和D對(duì)應(yīng)每個(gè)選 項(xiàng)的圖像&、(^和0" = 1,2"4; (e-3)利用A、Ci和Di依次計(jì)算每個(gè)選項(xiàng)的各個(gè)評(píng)價(jià)指標(biāo)imgDev、qsGraySum、qsArea和qsAvgGray,其計(jì)算方法如下:perQstArea=AW*AH/N,imgDev=Σi,j(A(i, j)-Σk, #(k,I)AAW*AH))V(AW*AH),其中Aw為圖像A的寬度,Ah為圖像A的高度;選項(xiàng)灰 度CpGraySumi= '其中Ci (j,k)為圖像Ci對(duì)應(yīng)像素點(diǎn)的像素值;選項(xiàng)填涂塊面 積qsArea|=¥Α(·Λ?)/255'其中Biak)為圖像Bi對(duì)應(yīng)像素點(diǎn)的像素值;選項(xiàng)平均灰度 qsAvg<3ray^ $D(_aA)/qsArcai '其中Diak)為圖像Di對(duì)應(yīng)像素點(diǎn)的像素值。
4. 根據(jù)權(quán)利要求1所述基于圖像綜合特征的答題卡填涂信息自動(dòng)識(shí)別方法,其特征在 于:步驟(f)包括以下步驟: (f-Ι)若步驟(C)所得二值化閾值thresh大于bwThresh則轉(zhuǎn)到步驟(f-2),否則轉(zhuǎn)到 步驟(f_3),其中bwThresh為可調(diào)閾值; (f_2)利用步驟(e)所計(jì)算的評(píng)價(jià)指標(biāo)判斷該選擇題是否為空白填涂,即考生沒(méi)有進(jìn) 行填涂,其判斷方法如下:若滿足以下兩個(gè)條件的任意一個(gè)則為空白填涂: (1)imgDev〈devThresh; (2)imgDev〈2*devThresh且MAX(qsArea)>perQstArea*0· 7 ; 其中MAX(qsArea)為qsArea中的最大值,devThresh為可調(diào)閾值; (f-3)計(jì)算判斷填涂結(jié)果所需的閾值threshold_filled和threshold_gray,其計(jì)算方 法如下: threshold_filled=MAX{perQstArea*fillThresh,MAX(qsGraySum)^sensibilityThre sh},其中MAX表不取最大值,fillThresh和sensibilityThresh為可調(diào)閾值; threshold_gray=MAX{globalGrayThresh,MAX(qsAvgGray)*grayThresh},其中MAX(qsAvgGray)為qsAvgGray中的最大值,MAX{,}為取兩個(gè)值中的最大值,grayThresh為 可調(diào)閾值; (f_4)利用步驟(e)所計(jì)算的評(píng)價(jià)指標(biāo)與步驟(f_3)計(jì)算的閾值進(jìn)行填涂結(jié)果 判斷,其判斷方法為:依次遍歷每個(gè)選項(xiàng),若滿足QsGraysumiHhresholcLfilled且 QsAvgGrayiHhresholcLgray則該選項(xiàng)考生有填涂; (f-5)返回識(shí)別結(jié)果。
5.根據(jù)權(quán)利要求1所述基于圖像綜合特征的答題卡填涂信息自動(dòng)識(shí)別方法,其特征 在于步驟(g)中更新全局一致性填涂閾值globalGrayThresh的方法為:若在步驟(f)中 該選項(xiàng)識(shí)別為填涂,則新的全局一致性填涂閾值為該選項(xiàng)平均灰度值與原先全局一致性填 涂閾值的平均值,即gl〇balGrayThreshnew = (globalGrayThresh^d+qsAvgGrayi)/% 其中 globalGrayThresh。;^為更新前的全局一致性閾值,globalGrayThreshnew為新的全局一致性 閾值,CisAvgGrayi為該選項(xiàng)的平均灰度,如果有多個(gè)選項(xiàng)有填涂,則只需計(jì)算一次即可。
【文檔編號(hào)】G06K9/46GK104239850SQ201410338618
【公開日】2014年12月24日 申請(qǐng)日期:2014年7月16日 優(yōu)先權(quán)日:2014年7月16日
【發(fā)明者】黃翰, 劉志方, 郝志峰 申請(qǐng)人:華南理工大學(xué)