国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      對文檔圖像進行校正的方法和裝置與流程

      文檔序號:12367239閱讀:537來源:國知局
      對文檔圖像進行校正的方法和裝置與流程
      本發(fā)明涉及圖像處理領(lǐng)域,更具體地涉及一種對文檔圖像進行校正的方法和裝置。
      背景技術(shù)
      :隨著掃描儀的廣泛使用,文檔數(shù)字化在生活中扮演越來越重要的角色。置頂式掃描儀能在不損壞文檔的情況下對圖像進行數(shù)字化,但是由于例如書籍、雜志等文檔頁面不在一個平面上,在數(shù)字化的圖像中往往存在扭曲。文檔圖像校正技術(shù)能夠展平扭曲的圖像,改善閱讀體驗及提高OCR的識別精度。大部分傳統(tǒng)的方法更關(guān)注于固定的文檔模型或者文檔內(nèi)容。比如筒形模型方法有以下缺點:文檔曲面不是一個嚴(yán)格的筒形模型,在掃描的文檔中存在局部畸變,并且很難估計文檔的內(nèi)邊界。而基于文檔內(nèi)容的圖像校正有以下缺點:校正精度嚴(yán)格依賴于文檔內(nèi)容的提取,如:文檔直線、文本行等,但文檔的布局和文本內(nèi)容又很難有效的提取,或者沒有足夠的文檔內(nèi)容來校正圖像。因此,需要一種能夠有效地對文檔圖像進行校正的方法和裝置。技術(shù)實現(xiàn)要素:在下文中給出關(guān)于本發(fā)明的簡要概述,以便提供關(guān)于本發(fā)明的某些方面的基本理解。應(yīng)當(dāng)理解,這個概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關(guān)鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細(xì)描述的前序。本發(fā)明的一個主要目的在于,提供了一種對文檔圖像進行校正的方法,包括:輸入文檔圖像及其對應(yīng)的三維空間上的三維數(shù)據(jù)點;利用文檔圖像提取文檔圖像中的文檔頁面的邊界并估計邊界上的三維數(shù)據(jù)點;對三 維空間上的三維數(shù)據(jù)點進行采樣并基于采樣的三維數(shù)據(jù)點構(gòu)建三維網(wǎng)格;基于三維網(wǎng)格來估計二維網(wǎng)格;以及利用所估計的二維網(wǎng)格對文檔圖像進行校正。根據(jù)本發(fā)明的一個方面,提供一種對文檔圖像進行校正的裝置,包括:輸入單元,被配置為輸入文檔圖像及其對應(yīng)的三維空間上的三維數(shù)據(jù)點;邊界提取單元,被配置為利用文檔圖像提取文檔圖像包含的文檔頁面的邊界并估計邊界上的三維數(shù)據(jù)點;三維網(wǎng)格構(gòu)建單元,被配置為對三維空間上的三維數(shù)據(jù)點進行采樣并基于采樣的三維數(shù)據(jù)點構(gòu)建三維網(wǎng)格;二維網(wǎng)格估計單元,被配置為基于三維網(wǎng)格來估計二維網(wǎng)格;以及文檔圖像校正單元,被配置為利用所估計的二維網(wǎng)格對文檔圖像進行校正。另外,本發(fā)明的實施例還提供了用于實現(xiàn)上述方法的計算機程序。此外,本發(fā)明的實施例還提供了至少計算機可讀介質(zhì)形式的計算機程序產(chǎn)品,其上記錄有用于實現(xiàn)上述方法的計算機程序代碼。通過以下結(jié)合附圖對本發(fā)明的最佳實施例的詳細(xì)說明,本發(fā)明的這些以及其他優(yōu)點將更加明顯。附圖說明參照下面結(jié)合附圖對本發(fā)明實施例的說明,會更加容易地理解本發(fā)明的以上和其它目的、特點和優(yōu)點。附圖中的部件只是為了示出本發(fā)明的原理。在附圖中,相同的或類似的技術(shù)特征或部件將采用相同或類似的附圖標(biāo)記來表示。圖1示出了根據(jù)本發(fā)明的一個實施例的對文檔圖像進行校正的方法的總體框架圖;圖2示出了根據(jù)本發(fā)明的一個實施例的對文檔圖像進行校正的方法200的示例性過程的流程圖;圖3示出了文檔圖像上的3D掃描線的示意圖;圖4示出了提取的文檔頁面的邊界的示意圖;圖5示出了對三維空間上的三維數(shù)據(jù)點進行采樣的一種示例性過程的流程圖;圖6A示出了將文檔頁面表示為四邊形的集合的示意圖;圖6B示出了將圖6A中所示的若干四邊形分別分割為兩個三角形的示意圖;圖7示出了在整個文檔頁面上構(gòu)建的三維網(wǎng)格的圖;圖8示出了進行三角形映射的示意圖;圖9校正后的文檔頁面的示意圖;圖10示出了根據(jù)本發(fā)明的另一個實施例的對文檔圖像進行校正的方法1000的示例性過程的流程圖;圖11示出了對三維數(shù)據(jù)點的深度信息進行平滑的一個示例的示意圖;圖12是示出對校正后的文檔頁面的邊界進行改善的示意圖;圖13是示出根據(jù)本發(fā)明的一個實施例的對文檔圖像進行校正的裝置1300的示例性配置的框圖;圖14是示出根據(jù)本發(fā)明的另一個實施例的對文檔圖像進行校正的裝置1400的示例性配置的框圖;以及圖15是示出可以用于實施本發(fā)明的對文檔圖像進行校正的方法和裝置的計算設(shè)備的示例性結(jié)構(gòu)圖。具體實施方式下面參照附圖來說明本發(fā)明的實施例。在本發(fā)明的一個附圖或一種實施方式中描述的元素和特征可以與一個或更多個其它附圖或?qū)嵤┓绞街惺境龅脑睾吞卣飨嘟Y(jié)合。應(yīng)當(dāng)注意,為了清楚的目的,附圖和說明中省略了與本發(fā)明無關(guān)的、本領(lǐng)域普通技術(shù)人員已知的部件和處理的表示和描述。本發(fā)明提出了一種對文檔圖像進行校正的方法和裝置。具體地,本發(fā)明提出一種基于3D圖像的校正方法來重構(gòu)和展平扭曲的文檔圖像。本發(fā)明的方法和傳統(tǒng)方法相比有如下優(yōu)點:1)能夠利用深度信息來重構(gòu)文檔圖像,對局部畸變比較魯棒;2)基于3D信息的風(fēng)格構(gòu)建能夠有效的估計文檔圖像的曲面;3)掃描線間的3D數(shù)據(jù)平滑能夠有效的提高校正的性能。圖1示出了根據(jù)本發(fā)明的一個實施例的對文檔圖像進行校正的方法的 總體框架圖。從圖1中可以看出,簡單來說,根據(jù)本發(fā)明的一個實施例的對文檔圖像進行校正的方法包括:輸入二維圖像,包括二維圖像上的點和三維空間上的點,進行網(wǎng)格構(gòu)建,估計二維網(wǎng)格,進行紋理映射,最后可以輸出矯正的圖像。下面結(jié)合附圖詳細(xì)說明根據(jù)本發(fā)明的實施例的對文檔圖像進行校正的方法和裝置。圖2示出了根據(jù)本發(fā)明的一個實施例的對文檔圖像進行校正的方法200的示例性過程的流程圖。在步驟S202中,輸入所述文檔圖像及其對應(yīng)的三維空間上的三維數(shù)據(jù)點。本領(lǐng)域普通技術(shù)人員可以理解,文檔圖像所對應(yīng)的三維空間上的三維數(shù)據(jù)點可以通過利用3D掃描儀對文檔進行3D掃描來得到,在此不做贅述。3D掃描儀對文檔從上到下進行掃描,可以得到若干條3D數(shù)據(jù)掃描線。在圖3中,示出了對文檔進行掃描后得到的文檔圖像上的若干條3D掃描線。接著,在步驟S204中,利用文檔圖像提取文檔圖像中的文檔頁面的邊界并估計邊界上的三維數(shù)據(jù)點。具體地,通過假設(shè)邊界上的點的深度值和與其最接近的三維數(shù)據(jù)點的深度值相等來估計邊界上的三維數(shù)據(jù)點。在圖4中,用粗黑線框示意性的示出了所提取的文檔頁面的邊界。在一個示例中,還可以利用文檔圖像連同三維數(shù)據(jù)點的深度信息來提取文檔圖像包含的文檔頁面的邊界。在步驟S206中,對三維空間上的三維數(shù)據(jù)點進行采樣并基于采樣的三維數(shù)據(jù)點構(gòu)建三維網(wǎng)格。圖5是示出圖2中的步驟206中的對三維空間上的三維數(shù)據(jù)點進行采樣的一種示例性過程的流程圖。如圖5所示,對三維數(shù)據(jù)點進行采樣包括以下步驟:首先,在步驟S502中,選取一條完全在文檔頁面內(nèi)部的三維數(shù)據(jù)掃描線,在該三維數(shù)據(jù)掃描線上提取等長度的N個采樣點。接著,在步驟S504中,確定N個采樣點和文檔頁面的兩條邊界的消失點的N條連線與每條三維數(shù)據(jù)掃描線的各個交點。在此所述的兩條邊界指的是如圖4中所示的文檔頁面的中線處的邊界(即圖4中左邊的粗黑線)和文檔頁面的右邊界(即圖4中的右邊的組黑線),也即近似垂直于三維數(shù)據(jù)掃描線的兩條邊界。本領(lǐng)域技術(shù)人員可以理解,這兩條邊界會有一個消失點。將N個采樣點與該消失點連接的連線與每條三維數(shù)據(jù)掃描線都有一個交點。在步驟S504中,即確定這些交點。最后,在步驟S506中,用與各個交點最接近的三維數(shù)據(jù)掃描線上的三維數(shù)據(jù)點代替各個交點作為采樣點。在獲得采樣點之后,由于采樣點的順序是固定的(從上到下,從左到右),因此可以利用下面的方法快速構(gòu)建網(wǎng)格:對于當(dāng)前三維數(shù)據(jù)掃描線上的每個采樣點,在下一條三維數(shù)據(jù)掃描線上找到對應(yīng)的采樣點進行連線,這樣就將文檔頁面表示為多個四邊形的集合。圖6A示意性的示出了三條掃描線、掃描線上的幾個采樣點、和對這些采樣點進行連線所得到的若干四邊形。接著,再將每個四邊形分割為兩個三角形,優(yōu)選地,以四邊形的較短的對角線作為兩個三角形的公共邊,這樣就將文檔頁面表示為四邊形的數(shù)量的二倍多個三角形的集合。圖6B示出了將圖6A中所示的若干四邊形分別分割為兩個三角形的示意圖。在完成了三角形化處理之后,就構(gòu)建好了三維網(wǎng)格。圖7示出了在整個文檔頁面上構(gòu)建的三維網(wǎng)格的圖。在構(gòu)建了三維網(wǎng)格之后,在步驟S208中,基于三維網(wǎng)格來估計二維網(wǎng)格。在一個示例中,可以利用保角變換來估計二維網(wǎng)格。利用保角變換基于三維網(wǎng)格來估計二維網(wǎng)格,對于本領(lǐng)域普通技術(shù)人員來說是已知的,在此不再贅述。最后,在步驟S210中,利用所估計的二維網(wǎng)格對文檔圖像進行校正。在一個示例中,利用紋理映射技術(shù)來實現(xiàn)對文檔圖像進行校正。具體地,在紋理映射中,將一個三角形劃分成兩個部分分別進行相應(yīng)映射,在三角形的每個部分,利用掃描線填充和雙線性插值來填充整個三角形區(qū)域。圖8示出了三角形映射的示意圖。在一個示例中,紋理映射可以基于仿射變換來完成。利用仿射矩陣abtxcdty001]]>和下式(1)xdst=a*xsrc+b*ysrc+txydst=c*xsrc+d*ysrc+ty(1)可以求得映射后的區(qū)域中的坐標(biāo),其中,xsrc和ysrc是二維網(wǎng)格中的點的坐標(biāo),xdst和ydst為映射后的區(qū)域中的坐標(biāo)。紋理映射和仿射變換的技術(shù)對于本領(lǐng)域技術(shù)人員來說是已知的,在此不做贅述。圖9示出了校正后的文檔頁面的示意圖??梢钥吹綀D9中的文檔頁面得到了展平。圖10示出了根據(jù)本發(fā)明的另一個實施例的對文檔圖像進行校正的方法1000的示例性過程的流程圖。圖10中的對文檔圖像進行校正的方法1000的步驟S1002、1004、S1006、S1008和S1010與圖2中的對文檔圖像進行校正的方法200的步驟S202至S210類似,在此不再贅述。圖10中的對文檔圖像進行校正的方法1000在步驟S1006之前還包括步驟S1005,在步驟S1005中,對三維空間上的三維數(shù)據(jù)點進行平滑。具體地,首先,去除文檔頁面的邊界之外的三維數(shù)據(jù)點以去除這些點對校正性能的影響。其次,對同一三維數(shù)據(jù)掃描線上的三維數(shù)據(jù)點的三維坐標(biāo)進行平滑。例如,可以采用高斯模型進行平滑。最后,利用相鄰的三維數(shù)據(jù)掃描線對三維數(shù)據(jù)點的深度信息進行平滑。圖11示出了對三維數(shù)據(jù)點的深度信息進行平滑的一個示例的示意圖。zi-1,j0、zi,j1和zi+1,j2分別是三條掃描線上對應(yīng)的三個點的深度值,點(i,j1)處的平滑后的深度信息szi,j1可以通過下式(2)來求得。szi,j1=(zi-1,j0+zi,j1+zi+1,j2)/3(2)對每個三維數(shù)據(jù)點進行式(2)的計算,可以對三維數(shù)據(jù)點的深度信息進行平滑。通過對掃描線間的三維數(shù)據(jù)點進行平滑,能夠有效的提高校正的性能。在一個示例中,還可以對文檔頁面的邊界進行改善。可以看到圖9中的校正后的文檔圖像的邊緣存在一些豁口,在一個示例中,可以通過直線擬合對所校正的文檔圖像中的文檔頁面的邊界進行改善。利用直線擬合的方法來去除校正圖像中的背景區(qū)域。具體地,利用校正后的文檔頁面的邊界上的點來擬合一條直線,再經(jīng)過該邊界上的最內(nèi)部的點確定與該直線平行的一條直線,最后利用改平行的直線對所校正的文檔圖像的邊界進行改善。例如,將該平行的直線以外的部分去除。從圖12可以看出,其中的文檔頁面右邊的邊界平滑、沒有豁口,視覺上比較美觀。圖13是示出根據(jù)本發(fā)明的一個實施例的對文檔圖像進行校正的裝置1300的示例性配置的框圖。如圖13所示,對文檔圖像進行校正的裝置1300包括輸入單元1302、邊界提取單元1304、三維網(wǎng)格構(gòu)建單元1306、二維網(wǎng)格估計單元1308和文檔圖像校正單元1310。其中,輸入單元1302被配置為輸入文檔圖像及其對應(yīng)的三維空間上的三維數(shù)據(jù)點。邊界提取單元1304被配置為利用文檔圖像提取文檔圖像包含的文檔頁面的邊界并估計邊界上的三維數(shù)據(jù)點。三維網(wǎng)格構(gòu)建單元1306被配置為對三維空間上的三維數(shù)據(jù)點進行采樣并基于采樣的三維數(shù)據(jù)點構(gòu)建三維網(wǎng)格。二維網(wǎng)格估計單元1308被配置為基于三維網(wǎng)格來估計二維網(wǎng)格。文檔圖像校正單元1310被配置為利用所估計的二維網(wǎng)格對文檔圖像進行校正。其中,邊界提取單元1304進一步被配置為:通過假設(shè)邊界上的點的深度值和與其最接近的三維數(shù)據(jù)點的深度值相等來估計邊界上的三維數(shù) 據(jù)點。其中,三維網(wǎng)格構(gòu)建單元1306進一步被配置為:選取一條完全在文檔頁面內(nèi)部的三維數(shù)據(jù)掃描線,在該三維數(shù)據(jù)掃描線上提取等長度的N個采樣點;確定N個采樣點和文檔頁面的垂直于三維數(shù)據(jù)掃描線的兩條邊界的消失點的N條連線與每條三維數(shù)據(jù)掃描線的各個交點;以及用與各個交點最接近的三維數(shù)據(jù)掃描線上的三維數(shù)據(jù)點代替各個交點作為采樣點。其中,三維網(wǎng)格構(gòu)建單元1306再進一步被配置為:對于當(dāng)前三維數(shù)據(jù)掃描線上的每個采樣點,在下一條三維數(shù)據(jù)掃描線上找到對應(yīng)的采樣點進行連線,將文檔頁面表示為四邊形的集合;以及將每個四邊形分割為兩個三角形,其中以四邊形的較短的對角線作為兩個三角形的公共邊。在一個示例中,對文檔圖像進行校正的裝置1300還包括邊界改善單元(圖中未示出)。邊界改善單元被配置為通過直線擬合對所校正的文檔圖像中的文檔頁面的邊界進行改善。其中,邊界改善單元進一步被配置為:利用校正后的文檔頁面的邊界上的點來擬合一條直線;經(jīng)過該邊界上的最內(nèi)部的點確定與一條直線平行的直線;以及利用平行的直線對所校正的文檔圖像的邊界進行改善。其中,邊界提取單元1304進一步被配置為:利用文檔圖像和三維數(shù)據(jù)點的深度信息來提取文檔圖像包含的文檔頁面的邊界。圖14是示出根據(jù)本發(fā)明的另一個實施例的對文檔圖像進行校正的裝置1400的示例性配置的框圖。如圖14所示,對文檔圖像進行校正的裝置1400包括輸入單元1402、邊界提取單元1404、平滑單元1405、三維網(wǎng)格構(gòu)建單元1406、二維網(wǎng)格估計單元1408和文檔圖像校正單元1410。換句話說,圖14所示的對文檔圖像進行校正的裝置1400除了包括圖13所示的各個部件之外,還包括平滑單元1405。圖14中的輸入單元1402、邊界提取單元1404、三維網(wǎng)格構(gòu)建單元1406、二維網(wǎng)格估計單元1408和文檔圖像校正單元1410與圖13中的輸入單元1302、邊界提取單元1304、三維網(wǎng)格構(gòu)建單元1306、二維網(wǎng)格估計單元1308和文檔圖像校正單元1310類似,在此不再贅述,這里主要描述圖14中的平滑單元1405。平滑單元1405被配置為對三維空間上的三維數(shù)據(jù)點進行平滑。具體地,平滑單元被配置為:去除文檔頁面的邊界之外的三維數(shù)據(jù)點;對同一三維數(shù)據(jù)掃描線上的三維數(shù)據(jù)點的三維坐標(biāo)進行平滑;以及利用相鄰的三維數(shù)據(jù)掃描線對三維數(shù)據(jù)點的深度信息進行平滑。關(guān)于對文檔圖像進行校正的裝置1300和1400的各個部分的操作和功能的細(xì)節(jié)可以參照結(jié)合圖1-12描述的本發(fā)明的對文檔圖像進行校正的方法的實施例,這里不再詳細(xì)描述。在此需要說明的是,圖13-14所示的裝置及其組成單元的結(jié)構(gòu)僅僅是示例性的,本領(lǐng)域技術(shù)人員可以根據(jù)需要對圖13-14所示的結(jié)構(gòu)框圖進行修改。本發(fā)明提出一種基于3D圖像的校正方法來重構(gòu)和展平扭曲的文檔圖像。本發(fā)明的方法和傳統(tǒng)方法相比有如下優(yōu)點:1)能夠利用深度信息來重構(gòu)文檔圖像,對局部畸變比較魯棒;2)基于3D信息的風(fēng)格構(gòu)建能夠有效的估計文檔圖像的曲面;3)掃描線間的3D數(shù)據(jù)平滑能夠有效的提高校正的性能。以上結(jié)合具體實施例描述了本發(fā)明的基本原理,但是,需要指出的是,對本領(lǐng)域的普通技術(shù)人員而言,能夠理解本發(fā)明的方法和裝置的全部或者任何步驟或者部件,可以在任何計算裝置(包括處理器、存儲介質(zhì)等)或者計算裝置的網(wǎng)絡(luò)中,以硬件、固件、軟件或者它們的組合加以實現(xiàn),這是本領(lǐng)域普通技術(shù)人員在閱讀了本發(fā)明的說明的情況下運用他們的基本編程技能就能實現(xiàn)的。因此,本發(fā)明的目的還可以通過在任何計算裝置上運行一個程序或者一組程序來實現(xiàn)。所述計算裝置可以是公知的通用裝置。因此,本發(fā)明的目的也可以僅僅通過提供包含實現(xiàn)所述方法或者裝置的程序代碼的程序產(chǎn)品來實現(xiàn)。也就是說,這樣的程序產(chǎn)品也構(gòu)成本發(fā)明,并且存儲有這樣的程序產(chǎn)品的存儲介質(zhì)也構(gòu)成本發(fā)明。顯然,所述存儲介質(zhì)可以是任何公知的存儲介質(zhì)或者將來所開發(fā)出來的任何存儲介質(zhì)。在通過軟件和/或固件實現(xiàn)本發(fā)明的實施例的情況下,從存儲介質(zhì)或網(wǎng)絡(luò)向具有專用硬件結(jié)構(gòu)的計算機,例如圖15所示的通用計算機1500安裝構(gòu)成該軟件的程序,該計算機在安裝有各種程序時,能夠執(zhí)行各種功能等等。在圖15中,中央處理單元(CPU)501根據(jù)只讀存儲器(ROM)1502中存 儲的程序或從存儲部分1508加載到隨機存取存儲器(RAM)1503的程序執(zhí)行各種處理。在RAM1503中,也根據(jù)需要存儲當(dāng)CPU1501執(zhí)行各種處理等等時所需的數(shù)據(jù)。CPU1501、ROM1502和RAM1503經(jīng)由總線1504彼此鏈路。輸入/輸出接口1505也鏈路到總線1504。下述部件鏈路到輸入/輸出接口1505:輸入部分1506(包括鍵盤、鼠標(biāo)等等)、輸出部分1507(包括顯示器,比如陰極射線管(CRT)、液晶顯示器(LCD)等,和揚聲器等)、存儲部分1508(包括硬盤等)、通信部分1509(包括網(wǎng)絡(luò)接口卡比如LAN卡、調(diào)制解調(diào)器等)。通信部分1509經(jīng)由網(wǎng)絡(luò)比如因特網(wǎng)執(zhí)行通信處理。根據(jù)需要,驅(qū)動器1510也可鏈路到輸入/輸出接口1505??刹鹦督橘|(zhì)1511比如磁盤、光盤、磁光盤、半導(dǎo)體存儲器等等根據(jù)需要被安裝在驅(qū)動器1510上,使得從中讀出的計算機程序根據(jù)需要被安裝到存儲部分1508中。在通過軟件實現(xiàn)上述系列處理的情況下,從網(wǎng)絡(luò)比如因特網(wǎng)或存儲介質(zhì)比如可拆卸介質(zhì)1511安裝構(gòu)成軟件的程序。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這種存儲介質(zhì)不局限于圖15所示的其中存儲有程序、與設(shè)備相分離地分發(fā)以向用戶提供程序的可拆卸介質(zhì)1511??刹鹦督橘|(zhì)1511的例子包含磁盤(包含軟盤(注冊商標(biāo)))、光盤(包含光盤只讀存儲器(CD-ROM)和數(shù)字通用盤(DVD))、磁光盤(包含迷你盤(MD)(注冊商標(biāo)))和半導(dǎo)體存儲器?;蛘撸鎯橘|(zhì)可以是ROM1502、存儲部分1508中包含的硬盤等等,其中存有程序,并且與包含它們的設(shè)備一起被分發(fā)給用戶。本發(fā)明還提出一種存儲有機器可讀取的指令代碼的程序產(chǎn)品。指令代碼由機器讀取并執(zhí)行時,可執(zhí)行上述根據(jù)本發(fā)明實施例的方法。相應(yīng)地,用于承載上述存儲有機器可讀取的指令代碼的程序產(chǎn)品的存儲介質(zhì)也包括在本發(fā)明的公開中。存儲介質(zhì)包括但不限于軟盤、光盤、磁光盤、存儲卡、存儲棒等。本領(lǐng)域的普通技術(shù)人員應(yīng)理解,在此所例舉的是示例性的,本發(fā)明并不局限于此。在本說明書中,“第一”、“第二”以及“第N個”等表述是為了將所描述的特征在文字上區(qū)分開,以清楚地描述本發(fā)明。因此,不應(yīng)將其視為具有任何限定性的含義。作為一個示例,上述方法的各個步驟以及上述設(shè)備的各個組成模塊和 /或單元可以實施為軟件、固件、硬件或其組合,并作為相應(yīng)設(shè)備中的一部分。上述裝置中各個組成模塊、單元通過軟件、固件、硬件或其組合的方式進行配置時可使用的具體手段或方式為本領(lǐng)域技術(shù)人員所熟知,在此不再贅述。作為一個示例,在通過軟件或固件實現(xiàn)的情況下,可以從存儲介質(zhì)或網(wǎng)絡(luò)向具有專用硬件結(jié)構(gòu)的計算機(例如圖15所示的通用計算機1500)安裝構(gòu)成該軟件的程序,該計算機在安裝有各種程序時,能夠執(zhí)行各種功能等。在上面對本發(fā)明具體實施例的描述中,針對一種實施方式描述和/或示出的特征可以以相同或類似的方式在一個或更多個其他實施方式中使用,與其他實施方式中的特征相組合,或替代其他實施方式中的特征。應(yīng)該強調(diào),術(shù)語“包括/包含”在本文使用時指特征、要素、步驟或組件的存在,但并不排除一個或更多個其他特征、要素、步驟或組件的存在或附加。此外,本發(fā)明的方法不限于按照說明書中描述的時間順序來執(zhí)行,也可以按照其他的時間順序地、并行地或獨立地執(zhí)行。因此,本說明書中描述的方法的執(zhí)行順序不對本發(fā)明的技術(shù)范圍構(gòu)成限制。本發(fā)明及其優(yōu)點,但是應(yīng)當(dāng)理解在不超出由所附的權(quán)利要求所限定的本發(fā)明的精神和范圍的情況下可以進行各種改變、替代和變換。而且,本發(fā)明的范圍不僅限于說明書所描述的過程、設(shè)備、手段、方法和步驟的具體實施例。本領(lǐng)域內(nèi)的普通技術(shù)人員從本發(fā)明的公開內(nèi)容將容易理解,根據(jù)本發(fā)明可以使用執(zhí)行與在此的相應(yīng)實施例基本相同的功能或者獲得與其基本相同的結(jié)果的、現(xiàn)有和將來要被開發(fā)的過程、設(shè)備、手段、方法或者步驟。因此,所附的權(quán)利要求旨在在它們的范圍內(nèi)包括這樣的過程、設(shè)備、手段、方法或者步驟?;谝陨系恼f明,可知公開至少公開了以下技術(shù)方案:附記1、一種對文檔圖像進行校正的方法,包括:輸入所述文檔圖像及其對應(yīng)的三維空間上的三維數(shù)據(jù)點;利用所述文檔圖像提取所述文檔圖像中的文檔頁面的邊界并估計所述邊界上的三維數(shù)據(jù)點;對所述三維空間上的三維數(shù)據(jù)點進行采樣并基于采樣的三維數(shù)據(jù)點 構(gòu)建三維網(wǎng)格;基于所述三維網(wǎng)格來估計二維網(wǎng)格;以及利用所估計的二維網(wǎng)格對所述文檔圖像進行校正。附記2、根據(jù)附記1所述的方法,其中,對所述三維空間上的三維數(shù)據(jù)點進行采樣之前還包括:對所述三維空間上的三維數(shù)據(jù)點進行平滑。附記3、根據(jù)附記2所述的方法,其中,對所述三維數(shù)據(jù)點進行平滑包括:去除所述文檔頁面的所述邊界之外的三維數(shù)據(jù)點;對同一三維數(shù)據(jù)掃描線上的三維數(shù)據(jù)點的三維坐標(biāo)進行平滑;以及利用相鄰的三維數(shù)據(jù)掃描線對三維數(shù)據(jù)點的深度信息進行平滑。附記4、根據(jù)附記1所述的方法,其中,通過假設(shè)所述邊界上的點的深度值和與其最接近的三維數(shù)據(jù)點的深度值相等來估計所述邊界上的三維數(shù)據(jù)點。附記5、根據(jù)附記1所述的方法,其中,對所述三維數(shù)據(jù)點進行采樣包括:選取一條完全在所述文檔頁面內(nèi)部的三維數(shù)據(jù)掃描線,在該三維數(shù)據(jù)掃描線上提取等長度的N個采樣點;確定所述N個采樣點和所述文檔頁面的垂直于所述三維數(shù)據(jù)掃描線的兩條邊界的消失點的N條連線與每條三維數(shù)據(jù)掃描線的各個交點;以及用與所述各個交點最接近的三維數(shù)據(jù)掃描線上的三維數(shù)據(jù)點代替所述各個交點作為采樣點。附記6、根據(jù)附記5所述的方法,其中,基于采樣的三維數(shù)據(jù)點構(gòu)建三維網(wǎng)格包括:對于當(dāng)前三維數(shù)據(jù)掃描線上的每個采樣點,在下一條三維數(shù)據(jù)掃描線上找到對應(yīng)的采樣點進行連線,將所述文檔頁面表示為四邊形的集合;以及將每個四邊形分割為兩個三角形,其中以所述四邊形的較短的對角線作為兩個三角形的公共邊。附記7、根據(jù)附記1所述的方法,還包括:通過直線擬合對所校正的文檔圖像中的文檔頁面的邊界進行改善。附記8、根據(jù)附記7所述的方法,通過直線擬合對所校正的文檔圖像中的文檔頁面的邊界進行改善進一步包括:利用校正后的文檔頁面的邊界上的點來擬合一條直線;經(jīng)過該邊界上的最內(nèi)部的點確定與所述一條直線平行的直線;以及利用所述平行的直線對所校正的文檔圖像的邊界進行改善。附記9、根據(jù)附記1所述的方法,其中,利用所述文檔圖像提取所述文檔圖像包含的文檔頁面的邊界包括:利用所述文檔圖像和三維數(shù)據(jù)點的深度信息來提取所述文檔圖像包含的文檔頁面的邊界。附記10、一種對文檔圖像進行校正的裝置,包括:輸入單元,被配置為輸入所述文檔圖像及其對應(yīng)的三維空間上的三維數(shù)據(jù)點;邊界提取單元,被配置為利用所述文檔圖像提取所述文檔圖像包含的文檔頁面的邊界并估計所述邊界上的三維數(shù)據(jù)點;三維網(wǎng)格構(gòu)建單元,被配置為對所述三維空間上的三維數(shù)據(jù)點進行采樣并基于采樣的三維數(shù)據(jù)點構(gòu)建三維網(wǎng)格;二維網(wǎng)格估計單元,被配置為基于所述三維網(wǎng)格來估計二維網(wǎng)格;以及文檔圖像校正單元,被配置為利用所估計的二維網(wǎng)格對所述文檔圖像 進行校正。附記11、根據(jù)附記10所述的裝置,還包括:平滑單元,被配置為對所述三維空間上的三維數(shù)據(jù)點進行平滑。附記12、根據(jù)附記11所述的裝置,其中,所述平滑單元進一步被配置為:去除所述文檔頁面的所述邊界之外的三維數(shù)據(jù)點;對同一三維數(shù)據(jù)掃描線上的三維數(shù)據(jù)點的三維坐標(biāo)進行平滑;以及利用相鄰的三維數(shù)據(jù)掃描線對三維數(shù)據(jù)點的深度信息進行平滑。附記13、根據(jù)附記10所述的裝置,其中,所述邊界提取單元進一步被配置為:通過假設(shè)所述邊界上的點的深度值和與其最接近的三維數(shù)據(jù)點的深度值相等來估計所述邊界上的三維數(shù)據(jù)點。附記14、根據(jù)附記10所述的裝置,其中,所述三維網(wǎng)格構(gòu)建單元進一步被配置為:選取一條完全在所述文檔頁面內(nèi)部的三維數(shù)據(jù)掃描線,在該三維數(shù)據(jù)掃描線上提取等長度的N個采樣點;確定所述N個采樣點和所述文檔頁面的垂直于所述三維數(shù)據(jù)掃描線的兩條邊界的消失點的N條連線與每條三維數(shù)據(jù)掃描線的各個交點;以及用與所述各個交點最接近的三維數(shù)據(jù)掃描線上的三維數(shù)據(jù)點代替所述各個交點作為采樣點。附記15、根據(jù)附記14所述的裝置,其中,所述三維網(wǎng)格構(gòu)建單元進一步被配置為:對于當(dāng)前三維數(shù)據(jù)掃描線上的每個采樣點,在下一條三維數(shù)據(jù)掃描線上找到對應(yīng)的采樣點進行連線,將所述文檔頁面表示為四邊形的集合;以 及將每個四邊形分割為兩個三角形,其中以所述四邊形的較短的對角線作為兩個三角形的公共邊。附記16、根據(jù)附記10所述的裝置,還包括:邊界改善單元,被配置為通過直線擬合對所校正的文檔圖像中的文檔頁面的邊界進行改善。附記17、根據(jù)附記16所述的裝置,所述邊界改善單元進一步被配置為:利用校正后的文檔頁面的邊界上的點來擬合一條直線;經(jīng)過該邊界上的最內(nèi)部的點確定與所述一條直線平行的直線;以及利用所述平行的直線對所校正的文檔圖像的邊界進行改善。附記18、根據(jù)附記10所述的裝置,其中,所述邊界提取單元進一步被配置為:利用所述文檔圖像和三維數(shù)據(jù)點的深度信息來提取所述文檔圖像包含的文檔頁面的邊界。當(dāng)前第1頁1 2 3 
      當(dāng)前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1