一種基于機器視覺的舉牌智能識別方法
【專利摘要】本發(fā)明公開了一種基于機器視覺的舉牌智能識別方法。本方法為:1)將每一類別的選票保存為一模板圖像;2)對采集的包含選票文本的場景圖像進行去噪處理;所述場景圖像之間不重疊;3)從去噪處理后的場景圖像中提取包含多個選票信息的文本候選區(qū)域的二值圖像;4)對所述文本候選區(qū)域的二值圖像進行分割,得到只包含單個選票的矩形候選區(qū)域圖像塊;5)將所述候選區(qū)域圖像塊與每一所述模板圖像進行匹配,得到每一候選區(qū)域圖像塊對應的選票類別。本發(fā)明能在復雜場景和可變光照條件下,對大規(guī)模群眾舉牌方式投票達到90%以上的票數(shù)檢測率和100%對于不同票的識別率,處理時間快。
【專利說明】一種基于機器視覺的舉牌智能識別方法
【技術領域】:
[0001]本發(fā)明屬于圖像處理與模式識別【技術領域】,具體涉及一種基于機器視覺的舉牌智能識別方法;通過基于灰度圖像的圖像噪聲去除方法,復雜背景和可變光照條件下自然場景中文本識別方法,以及人機交互系統(tǒng)界面和交互方式的設計實現(xiàn)。
【背景技術】:
[0002]圖像處理與模式識別是一門交叉學科,近幾十年來,圖像處理與模式識別技術取得了顯著的進步,已開始從實驗室慢慢走向市場。隨著圖像處理與模式識別研究工作的不斷發(fā)展,針對不同性質圖像和不同模式的識別系統(tǒng),其識別精度已經(jīng)很高了,足以滿足市場用戶的需求,已經(jīng)在工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務和消費電子類產(chǎn)品等領域得以應用。但在計票系統(tǒng)領域,圖像處理與模式識別技術沒有得到充分利用。
[0003]針對大規(guī)模人群的計票系統(tǒng)有人工計票,計票機計票兩大種方式。人工計票準確度高,但是需要大量的人力成本;計票機計票效率高,但是存在計票機械成本高,安裝調試不便捷等問題;特別是針對臨時會議場,并且組織人員有限,參加投票人數(shù)眾多的場景,這兩種方法都有明顯局限 性。
[0004]目前,市場上出現(xiàn)了電子智能票箱,即采用智能票箱(俗稱:電子票箱)的方式,徹底取代傳統(tǒng)人工唱票計票的模式,真正實現(xiàn)“投票即計票”的目標,以OCR為識別核心,以先進的圖像處理識別技術為依托,可以實現(xiàn)聯(lián)網(wǎng)或單機運行,代表將選票投入投票箱的同時,智能票箱就進行了識別和處理,大大提高了計票效率。這類系統(tǒng)的局限性在于需要投票人依次將選票投入箱內,該過程也相對耗時,并且選民對最終的結果沒有直觀性的認識。
【發(fā)明內容】
:
[0005]針對現(xiàn)有技術存在的技術問題,本發(fā)明的目的是提供一種基于機器視覺的舉牌智能識別方法;本發(fā)明將傳統(tǒng)的計票問題轉換為圖像處理問題,并利用成熟的模式識別技術手段實現(xiàn)選票的識別,從而提高計票系統(tǒng)的便捷化,提高計票系統(tǒng)的直觀性,在不降低計票系統(tǒng)的準確性基礎上大大降低計票過程所需時間。與人工計票相比,降低人力成本;與現(xiàn)有電子計票系統(tǒng)相比,降低計票設備購買成本。
[0006]本發(fā)明的技術內容:
[0007]1.圖像降噪方法、
[0008]基于空間域的中值濾波器是一種常用的非線性平滑濾波器,基本原理是把數(shù)字圖像或數(shù)字序列中一點的值用該點鄰域內各點的中值代換。設f(x,y)表示數(shù)字圖像像素點(x,y)的灰度值,濾波窗口為A的中值濾波器可以定義為:
【權利要求】
1.一種基于機器視覺的舉牌智能識別方法,其步驟為: 1)將每一類別的選票保存為一模板圖像; 2)對采集的包含選票文本的場景圖像進行去噪處理;所述場景圖像之間不重疊; 3)從去噪處理后的場景圖像中提取包含多個選票信息的文本候選區(qū)域二值圖像; 4)對所述文本候選區(qū)域二值圖像進行分割,得到只包含單個選票的矩形候選區(qū)域圖像塊; 5)將所述候選區(qū)域圖像塊與每一所述模板圖像進行匹配,得到每一候選區(qū)域圖像塊對應的選票類別。
2.如權利要求1所述的方法,其特征在于統(tǒng)計每一類別的選票并將匹配出選票類別的候選區(qū)域圖像塊標注在所述場景圖像中。
3.如權利要求1或2所述的方法,其特征在于計算每一模板圖像的寬高比,利用所述寬高比對所述候選圖像塊進行過濾,然后進行步驟5)。
4.如權利要求3所述的方法,其特征在于利用所述寬高比對所述候選圖像塊進行過濾的方法為:根據(jù)模板圖像的寬高比,設定一寬高比上限Hd和下限Ld,濾除寬高比大于設定閾值Hd或者小于設定閾值Ld的候選區(qū)域圖像塊。
5.如權利要求1或2所述的方法,其特征在于計算每一模板圖像的占空比,利用所述占空比對所述候選圖像塊進行過濾,然后進行步驟5)。
6.如權利要求5所述的方法,其特征在于利用所述占空比對所述候選圖像塊進行過濾的方法為:根據(jù)模板圖像的占空比,設定一占空比上限Ho和下限Lo,濾除占空比大于設定閾值Ho或者小于設定閾值Lo的候選區(qū)域圖像塊。
7.如權利要求1所述的方法,其特征在于采用MSER方法提取包含多個選票信息的文本候選區(qū)域二值圖像。
8.如權利要求1所述的方法,其特征在于所述模板圖像為矩形圖像,所述候選區(qū)域圖像塊為矩形候選區(qū)域圖像塊;采用開源計算機視覺數(shù)據(jù)庫中的連通域對所述文本候選區(qū)域二值圖像進行分割,得到只包含單個選票的矩形候選區(qū)域圖像塊。
9.如權利要求8所述的方法,其特征在于提取所述矩形候選區(qū)域圖像塊的方法為:首先利用Harris邊緣檢測算子,得到二值圖像的邊緣圖;然后提取該邊緣圖中所有邊緣輪廓線閉合的區(qū)域,得出其外接矩形;然后從所述二值圖像中截取該外接矩形區(qū)域的圖像塊,得到所述矩形候選區(qū)域圖像塊。
10.如權利要求1所述的方法,其特征在于所述步驟5)中,首先將所述候選區(qū)域圖像塊幾何歸一化,使其與模板圖像大小一致。
【文檔編號】G06K9/54GK103886319SQ201410111626
【公開日】2014年6月25日 申請日期:2014年3月24日 優(yōu)先權日:2014年3月24日
【發(fā)明者】劉宏, 劉夢源, 王燦 申請人:北京大學深圳研究生院