一種局部文檔圖像的比對方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像分析技術(shù)領(lǐng)域,具體涉及一種局部文檔圖像的比對方法及系統(tǒng)。
【背景技術(shù)】
[0002] 文檔圖像即圖像格式的文檔,它是通過某種方式將紙質(zhì)文檔等轉(zhuǎn)化為圖像格式的 文檔,以供用戶電子閱讀,應(yīng)用非常廣泛。文檔圖像比對是利用文檔圖像的形狀特征、紋理 特征等對兩幅或兩幅以上的文檔圖像進(jìn)行相似度比對,并根據(jù)這些統(tǒng)計特征,計算出文檔 圖像兩兩之間的相似度數(shù)值或?qū)ξ臋n圖像之間的相似度做出評價的一個過程。
[0003] 現(xiàn)有技術(shù)中,比較兩幅文檔圖像是否相同可以利用光學(xué)字符識別(OCR)技術(shù),該技 術(shù)通過識別圖像中的文字來達(dá)到圖像比對的目的。該技術(shù)的缺陷是比對結(jié)果嚴(yán)重依賴OCR 的識別結(jié)果,并且OCR的識別速度較慢,大大限制了該方法的應(yīng)用。
[0004] 另外一類文檔圖像比對的方法是提取圖像中的特征點(例如Sift特征點、SUrf特 征點、角點等),并通過匹配特征點的方法給出兩個圖像的相似性的一個度量。這種方法的 缺點在于,文檔圖像的特征點不如自然圖像的特征顯著,匹配結(jié)果難以達(dá)到預(yù)期目標(biāo),并且 計算效率也不夠高。
【發(fā)明內(nèi)容】
[0005] 針對現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明的目的是提供一種局部文檔圖像的比對方法 及系統(tǒng),提高文檔圖像的比對效果和效率。
[0006] 為達(dá)到以上目的,本發(fā)明采用的技術(shù)方案是:一種局部文檔圖像的比對方法,包括 以下步驟:
[0007] (1)將待比對文檔圖像中的每個字符劃分為mXη個區(qū)塊,m和η均為正整數(shù);
[0008] (2)計算每個區(qū)塊的二值分布特征;所述的二值分布特征是指二值圖像中黑像素 的分布特征;
[0009] (3)將每個區(qū)塊的二值分布特征進(jìn)行組合,得到每個字符的組合分布,并將每個字 符的組合分布進(jìn)行組合,得到文檔圖像的組合分布;
[0010] (4)計算待比對文檔圖像的組合分布之間的距離,根據(jù)該距離判斷待比對文檔圖 像之間的相似度。
[0011] 進(jìn)一步,如上所述的一種局部文檔圖像的比對方法,步驟(1)中,將待比對文檔圖 像上的每個字符劃分為mXn個區(qū)塊的具體方式包括以下步驟:
[0012] 1)將文檔圖像進(jìn)行二值化處理,得到二值化圖像;
[0013] 2)判斷該二值化圖像中是否只有單行文本,若是則進(jìn)入步驟3),若否則對該二值 化圖像進(jìn)行成行處理;
[0014] 3)將該二值化圖像中的每行文本進(jìn)行字符拆分;
[0015] 4)將拆分得到的每個字符都劃分為mXn個區(qū)塊。
[0016] 進(jìn)一步,如上所述的一種局部文檔圖像的比對方法,步驟(2)中,計算每個區(qū)塊的 二值分布特征的具體方式包括以下步驟:
[0017] a)獲取每個區(qū)塊的單像素邊界圖像;
[0018] b)計算所述單像素邊界圖像上每個像素點的鄰域編碼;
[0019] c)根據(jù)每個像素點的鄰域編碼,構(gòu)建區(qū)塊統(tǒng)計直方圖,得到區(qū)塊的二值分布特征。
[0020] 進(jìn)一步,如上所述的一種局部文檔圖像的比對方法,步驟b)中,計算單像素邊界 圖像上每個像素點的鄰域編碼的具體步驟包括:
[0021] i)獲取單像素邊界圖像上每個像素點的設(shè)定個數(shù)的鄰域;
[0022] ii)根據(jù)設(shè)定的順序?qū)λ鲟徲虬凑帐M(jìn)制數(shù)進(jìn)行排列,該十進(jìn)制數(shù)為每個像素 點的鄰域編碼。
[0023] 進(jìn)一步,如上所述的一種局部文檔圖像的比對方法,步驟i)中,獲取每個像素點的 設(shè)定個數(shù)的鄰域時,根據(jù)每個鄰域?qū)?yīng)的像素值對鄰域進(jìn)行標(biāo)記,標(biāo)記的具體方式為:判斷 每個鄰域?qū)?yīng)的像素值是否為〇,若是則將該鄰域標(biāo)記為二進(jìn)制數(shù)1,若否則將該鄰域標(biāo)記 為二進(jìn)制數(shù)〇。
[0024] 進(jìn)一步,如上所述的一種局部文檔圖像的比對方法,步驟(1)中,m和η的取值范圍 是:1 <m<4,l <η<4。
[0025] 進(jìn)一步,如上所述的一種局部文檔圖像的比對方法,步驟(3)中,將每個區(qū)塊的二 值分布特征進(jìn)行組合時,待比對文檔圖像按照相同的組合順序進(jìn)行組合。
[0026] 再進(jìn)一步,如上所述的一種局部文檔圖像的比對方法,步驟(3)中,將每個區(qū)塊的 二值分布特征進(jìn)行組合的具體方式包括:對于每個字符,將每個區(qū)塊的二值分布特征按照 從左到右、從上到下的順序進(jìn)行組合;對于每行文字,將該行的每個字符的二值分布特征按 照從左到右的順序進(jìn)行組合。
[0027] 更進(jìn)一步,如上所述的一種局部文檔圖像的比對方法,步驟(4)中,所述的距離是 指歐氏距離或直方圖距離。
[0028] -種局部文檔圖像的比對系統(tǒng),包括:
[0029] 區(qū)塊劃分模塊,用于將待比對文檔圖像上的每個字符劃分為mXn個區(qū)塊,其中,m 和η均為正整數(shù);
[0030] 二值分布特征計算模塊,用于計算每個區(qū)塊的二值分布特征;所述的二值分布特 征是指二值圖像中黑像素的分布特征;
[0031] 組合分布獲取模塊,用于將每個區(qū)塊的二值分布特征進(jìn)行組合,得到每個字符的 組合分布,并將每個字符的組合分布進(jìn)行組合,得到文檔圖像的組合分布;
[0032] 相似度判斷模塊,計算待比對文檔圖像的組合分布之間的距離,根據(jù)該距離判斷 待比對文檔圖像之間的相似度。
[0033] 進(jìn)一步,如上所述的一種局部文檔圖像的比對系統(tǒng),所述的區(qū)塊劃分模塊包括:
[0034] 二值化單元,用于將文檔圖像進(jìn)行二值化處理,得到二值化圖像;
[0035] 成行單元,用于判斷該二值化圖像中是否只有單行文本,若是則進(jìn)入字符拆分單 元,若否則對該二值化圖像進(jìn)行成行處理;
[0036] 字符拆分單元,用于將該二值化圖像中的每行文本都按字符進(jìn)行拆分;
[0037] 區(qū)塊劃分單元,用于將拆分得到的每個字符都劃分為mXn個區(qū)塊。
[0038] 再進(jìn)一步,如上所述的一種局部文檔圖像的比對系統(tǒng),所述的二值分布特征計算 模塊包括:
[0039] 邊界圖像獲取單元,用于獲取每個區(qū)塊的單像素邊界圖像;
[0040] 鄰域編碼計算單元,用于計算單像素邊界圖像上每個像素點的鄰域編碼;
[0041] 直方圖構(gòu)建單元,用于根據(jù)每個像素點的鄰域編碼的統(tǒng)計直方圖,構(gòu)建每個所述 區(qū)塊的二值分布特征。
[0042] 本發(fā)明的效果在于:本發(fā)明所述的方法及系統(tǒng),通過將待比對文檔圖像上的每個 字符劃分區(qū)塊,計算每個區(qū)塊的二值分布特征后按順序組合得到對應(yīng)的組合分布,再計算 各個組合分布之間的距離,據(jù)此判斷文檔圖像之間的相似度,這樣既可以較快速地對文檔 圖像進(jìn)行比對,且不依賴OCR識別結(jié)果,能達(dá)到較好的比對效果,提高了比對效率。
【附圖說明】
[0043] 圖1是【具體實施方式】中一種局部文檔圖像的比對系統(tǒng)的結(jié)構(gòu)圖;
[0044] 圖2是【具體實施方式】中一種局部文檔圖像的比對方法的流程圖;
[0045] 圖3是實施例中待比對文檔圖像;
[0046] 圖4是圖3經(jīng)過成行處理的圖像;
[0047] 圖5是圖4經(jīng)過字符拆分的圖像;
[0048] 圖6是圖5中"現(xiàn)"字左上角區(qū)塊的單像素邊界圖像;
[0049] 圖7是圖6中任一像素的鄰域位置標(biāo)記示意圖;
[0050] 圖8是圖6的鄰域編碼的統(tǒng)計直方圖;
[0051] 圖9是圖5中所有字符的鄰域編碼的組合分布圖;
[0052] 圖10為實施例中的待比對文檔圖像;
[0053] 圖11為圖10中所有字符的鄰域編碼組合分布圖。
【具體實施方式】
[0054] 下面結(jié)合說明書附圖和【具體實施方式】對本發(fā)明作進(jìn)一步描述。
[0055] 圖1示出了本發(fā)明【具體實施方式】中一種局部文檔圖像比對系統(tǒng)