国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      圖像處理設備,圖像方向判定方法,和計算機程序產(chǎn)品的制作方法

      文檔序號:6574647閱讀:297來源:國知局
      專利名稱:圖像處理設備,圖像方向判定方法,和計算機程序產(chǎn)品的制作方法
      技術領域
      本發(fā)明涉及圖像處理設備,圖像方向判定方法,和計算機程序產(chǎn)品。
      背景技術
      在眾所周知的判定圖像方向的技術中,字符從圖像中被提取,并且其特征量被隨后提取。然后,找到該字符與每個字符之間在字典中四個方向上的相似度。然后,具有最高相似度的方向被判定為圖像方向。在這類技術中,用于判定方向的字符的相似度在所有四個方向上被加在一起以判定方向。因此,例如,以6和9為例,當字符與相反方向上的字符具有高相似度時,文本圖像的方向可能因為相似度被累積在一起而被錯誤地判定。
      為了解決這個問題,日本公開專利申請?zhí)?000-113103揭露了一種技術,其中文本區(qū)域從圖像數(shù)據(jù)中被提取,并且對每個字符在四個方向上進行字符識別。然后,在每個方向上獲取字符識別的相似度,僅將超出預定閾值的相似度相加,并且將具有最高相似度的方向判定為圖像方向。
      然而,如果傳統(tǒng)技術被用來對在四個方向提取的字符執(zhí)行字符識別,中央處理單元(CPU)會有很大的負荷?;谶@個原因,在僅安裝了一個相對個人計算機(PC)而言性能較低的CPU的成像裝置,例如掃描儀,復印機,數(shù)碼相機中計算機,當光學字符識別(OCR)處理被執(zhí)行時,處理速度會不切實際地慢。
      為了加快處理速度,一種技術被提出,其中根據(jù)圖像數(shù)據(jù)中文本行的布局信息,可以判定圖像的方向。在傳統(tǒng)技術中,當四個方向,即,上,下,左和右被判定,圖像的方向是在水平方向還是垂直方向可以被準確地判定。然而,對于判定為垂直方向的圖像到底是向上還是向下的判斷以及對于判定為水平方向的圖像到底是向左還是向右的判斷可能會因為布局信息的差別比較小而弄錯。

      發(fā)明內(nèi)容
      本發(fā)明的目的是至少部分地解決傳統(tǒng)技術中的問題。
      根據(jù)本發(fā)明的一方面,圖像處理設備包括確定性測量單元,其關于與包含文本的圖像相對應的圖像數(shù)據(jù)中的各方向,測量與所述圖像的預定方向相對應的方向的確定度,以獲得具有最高確定度的第一方向和具有次高確定度的第二方向,和方向判定單元,其從所述圖像數(shù)據(jù)中提取至少一個文本行,并且當?shù)谝环较蚺c第二方向相反時,根據(jù)所述文本行的位置判定所述第一方向和第二方向之一是否對應于所述預定方向。
      根據(jù)本發(fā)明的另一方面,圖像方向判定方法包括從對應于包括文本的圖像的圖像數(shù)據(jù)中至少提取一個文本行,對于圖像數(shù)據(jù)中的每個方向,測量方向?qū)陬A定的圖像方向的確定度以獲取具有最高確定度的第一方向和具有次高確定度的第二方向,和當?shù)谝环较蚝偷诙较蛳喾磿r,根據(jù)文本行位置判定第一方向和第二方向之一是否對應于預定的方向。
      根據(jù)本發(fā)明的又一個方面,包含具有嵌入介質(zhì)的計算機可讀取程序編碼的計算機可用介質(zhì)的計算機程序產(chǎn)品,當被執(zhí)行時,使計算機施行上述的方法。
      結合附圖,通過下面對本發(fā)明的具體實施例詳細地描述,本發(fā)明上述和其它的目的,特征,優(yōu)點和技術以及產(chǎn)業(yè)上的重要性將很好地被了解。


      圖1是根據(jù)本發(fā)明實施例的圖像處理設備的方框圖;圖2是由圖像處理設備進行的方向判定和修正處理的流程圖;圖3是圖2所示的第一方向判定處理的詳細流程圖;圖4是圖2所示的第二方向判定處理的詳細流程圖;圖5是方向待定的圖像數(shù)據(jù)的一個實例;圖6是從圖5所示的圖像數(shù)據(jù)提取的文本行的一個實例;圖7是圖1所示的第二方向判定單元所進行的另一個方向判定處理的流程圖;圖8是提取的文本行產(chǎn)生簡單區(qū)域的一個實例;和圖9是圖像處理設備硬件結構的方框圖。
      具體實施例方式
      參考附圖本發(fā)明的具體實施例將在前面被詳細解釋。本發(fā)明并不僅限于前面描述的實施例。
      圖1是根據(jù)本發(fā)明實施例的圖像處理設備100的方框圖。在下面所描述的實施例中,圖像處理設備100被解釋為,例如,PC。然而,圖像處理設備100可以包括從原始材料,或者在其中儲存數(shù)據(jù)的數(shù)據(jù)庫讀取數(shù)據(jù)的掃描儀。圖像處理設備100也可以是打印機或者包括成像單元的多功能產(chǎn)品(MFP)。
      圖像處理設備100包括數(shù)據(jù)獲取單元101,第一方向判定單元102,第二方向判定單元103,方向修正單元104,和輸出單元105。例如,當文本通過掃描儀被讀取,通過取任意方向為向上的方向產(chǎn)生文本的圖像數(shù)據(jù)。因此,實際文本向上的方向可能與產(chǎn)生的圖像數(shù)據(jù)向上的方向不一樣。然而,為了在屏幕上顯示圖像數(shù)據(jù),圖像數(shù)據(jù)必須被顯示在字符向上的方向上。同樣地,為了打印圖像數(shù)據(jù),字符必須被打印在預定的方向上。圖像處理設備100可以修正在方向上的這類錯誤。
      數(shù)據(jù)獲取單元101獲取掃描儀讀取的或者通過網(wǎng)絡傳輸來的數(shù)據(jù)。在此假設所讀取數(shù)據(jù)是包括字母或者字符的圖像數(shù)據(jù)(在此以后,“文本圖像數(shù)據(jù)”)。
      第一方向判定單元102判定數(shù)據(jù)獲取單元101獲取的文本圖像數(shù)據(jù)上下左右每個方向?qū)谖谋緢D像數(shù)據(jù)的文本向上方向的確定度。文本圖像數(shù)據(jù)的方向代表了字符的方向。例如,向上的方向表示在文本圖像數(shù)據(jù)中包含的字符傾斜0度,也就是,字符向上。向左的方向表示在文本圖像數(shù)據(jù)中包含的字符傾斜90度,也就是,字符向左傾斜。向下的方向表示在文本圖像數(shù)據(jù)中包含的字符傾斜180度,也就是,字符顛倒。向右的方向表示在文本圖像數(shù)據(jù)中包含的字符傾斜270度,也就是,字符向右傾斜。第一方向判定單元102提取包含在文本圖像數(shù)據(jù)中的文本行作為垂直文本行或者水平文本行。
      第二方向判定單元103僅在有限的方向判定文本圖像數(shù)據(jù)的方向,也就是第一方向判定單元102判定的最高確定度的方向(列為最高確定度的方向)和第一方向判定單元102判定的次高確定度的方向(列為次高確定度的方向)。第二方向判定單元103包括文本行提取單元1031,坐標提取單元1032,和方向判定單元1033。文本行提取單元1031對于從第一方向判定單元102中提取的每個垂直或者水平文本行從文本圖像數(shù)據(jù)中提取文本行。坐標提取單元1032尋找文本行的頭坐標(此后,“頭坐標”)和文本行的尾坐標(此后,“尾坐標”)以產(chǎn)生柱狀圖。方向判定單元1033根據(jù)文本行頭坐標(頭坐標分布)和尾坐標(尾坐標分布)的分布或分散度來判定文本圖像數(shù)據(jù)的方向。
      方向修正單元104根據(jù)用于修正的第二方向判定單元103判定的文本圖像數(shù)據(jù)的方向來旋轉文本圖像數(shù)據(jù)。輸出單元105打印或者在屏幕上輸出通過方向修正單元104修正過的文本圖像數(shù)據(jù)。
      圖2是圖像處理設備100判定和修正方向的處理流程圖。
      數(shù)據(jù)獲取單元101獲取圖像數(shù)據(jù)(步驟S201)。第一方向判定單元102然后通過第一方向判定處理判定上下左右各方向的確定度(步驟S202)。第一方向判定處理的詳細內(nèi)容將在下面解釋。第二方向判定單元103然后判定四個方向也就是上下左右中的任一方向的判定度是否等于或者大于閾值(步驟S203)。如果四個方向中的任一方向的判定度等于或者大于閾值(步驟S203為是),第二方向判定單元103將具有最高確定度的方向判定為文本圖像數(shù)據(jù)的方向(步驟S204)。
      如果四個方向中的沒有一個方向的判定度等于或者大于閾值(步驟S203為否),第二方向判定單元103判定第一級方向和第二級方向是否具有上下關系或者左右關系(步驟S205)。
      如果第一級方向和第二級方向是上下關系或者左右關系(步驟S205為是),第二方向判定單元103通過第二方向判定處理將第一級方向和第二級方向之一判定為文本圖像數(shù)據(jù)的方向(步驟S206)。第二方向判定處理的詳細內(nèi)容將在下面解釋。方向修正單元104根據(jù)判定的方向旋轉圖像數(shù)據(jù)來進行修正(步驟S207)。順便提及,圖像數(shù)據(jù)的旋轉和修正的執(zhí)行不僅可以通過旋轉圖像數(shù)據(jù)的坐標來修正,當圖像數(shù)據(jù)是可移植文檔格式(PDF)還可以通過在圖像數(shù)據(jù)的開頭寫入相關旋轉角的信息來進行修正。當圖像數(shù)據(jù)是可交換圖像文件格式(EXIF),可以將相關旋轉角的信息作為附加信息寫入。為了顯示和打印圖像數(shù)據(jù),當閱讀器和打印程序支持PDF或者EXIF,不用改變圖像數(shù)據(jù)的坐標圖像數(shù)據(jù)通過旋轉可以被顯示和打印。
      如果第一級方向和第二級方向沒有上下關系或者左右關系(步驟S205為否),第二方向判定單元103將文本圖像數(shù)據(jù)的方向判定為未知(步驟S208)。輸出單元105然后將圖像數(shù)據(jù)輸出到屏幕或者打印機上(步驟S209)。
      以這種方法,如果,在第一方向判定處理中,上下左右方向的判定度不等于或者大于閾值,并且因此,文本圖像數(shù)據(jù)的方向不能被判定或者可能被錯誤判定,圖像文本數(shù)據(jù)的方向在不同于第一方向判定處理的第二方向判定處理中被再次判定,第一方向判定處理中判定的限定的兩方向作為文本圖像數(shù)據(jù)較高可能方向。以此,文本圖像數(shù)據(jù)的正確方向可以被判定。同樣,通過限制要在第二方向判定處理中判定的方向,判定正確方向的可能性被增加,并且處理時間也減少了。進一步,由于文本圖像數(shù)據(jù)根據(jù)修正的判定方向而旋轉,文本圖像數(shù)據(jù)可以在使用者可以方便觀看的方向上被顯示在屏幕上,也就是,因此字符是向上的。進一步,同樣在打印過程中,文本圖像數(shù)據(jù)可以在某個方向被打印。
      圖3是第一方向判定單元102執(zhí)行的第一方向判定處理的詳細流程圖(圖2中步驟S202)。這里,將簡要解釋一下處理步驟。更詳細的解釋,可以參考日本專利申請公開號2005-077879。
      第一方向判定單元102從圖像數(shù)據(jù)中提取水平文本行(步驟S301)。接下來,第一方向判定單元102從圖像數(shù)據(jù)中提取垂直文本行(步驟S302)。第一方向判定單元102從每個文本行中提取矩形特征體(步驟S303)。第一方向判定單元102將提取的矩形特征體與字典中寫入的特征體匹配(步驟S304)。第一方向判定單元102判定這一匹配是否進行了上下左右方向上的四次(步驟S305)。
      如果匹配沒有進行四次(步驟S305為否),第一方向判定單元102變換矩形的坐標,也就是,將矩形旋轉90度(步驟S306)。如果匹配進行了四次(步驟S305為是),第一方向判定單元102將具有最高特征匹配率的任一方向判定為文本行的方向(步驟S307)。第一方向判定單元102然后對每個方向上的文本行數(shù)進行計數(shù)(步驟S308)。第一方向判定單元102然后根據(jù)每個方向上文本行數(shù)計算每個方向的確定度(步驟S309)。
      第一方向判定處理并不僅限于這里解釋的處理。各方向上的確定度可以通過其它處理被找到。例如,比上述處理速度更快的方向判定處理可以被用來作為第一方向判定處理,這樣可以進一步整體地降低處理速度。
      圖4是第二方向判定單元103執(zhí)行的第二方向判定處理的詳細流程圖(圖2中步驟S206)。
      文本行提取單元1031提取文本行的判定區(qū)域(步驟S401)。特別地,當?shù)谝环较蚺卸▎卧?02判定的具有最高和次高確定度的文本圖像數(shù)據(jù)的第一級和第二級方向是向上和下方向時,文本圖像數(shù)據(jù)的方向被暫時地認為是向上的方向用于提取區(qū)域。另一方面,當?shù)谝环较蚺卸▎卧?02判定的具有最高和次高確定度的文本圖像數(shù)據(jù)的第一級和第二級方向是向左和右方向時,文本圖像數(shù)據(jù)的方向被暫時地認為是向左的方向用于提取區(qū)域。圖5是等待判定方向的圖像數(shù)據(jù)的一個實例。例如,在圖5中,被點線包圍的矩形區(qū)域51被提取作為矩形區(qū)域用于提取文本行。
      文本行提取單元1031從提取的矩形區(qū)域51中提取文本行(步驟S402)。圖6是從圖5所示的文本圖像數(shù)據(jù)中提取的文本行的一個實例。這個實例中第一方向判定單元102判定的具有最高和次高確定度的文本圖像數(shù)據(jù)的第一級和第二級方向是向上和下方向,根據(jù)第一方向判定處理的結果,文本行在水平方向被提取。順便提及,當文本行被提取,文本行的傾斜度可以被找到,考慮找到的傾斜度,頭和尾坐標可以被找到。文本行的傾斜是從文本行中矩形分布的尾坐標的回歸線找到的。因為眾所周知,所以如何找到回歸線在這里就不解釋了。若需要可以參考例如I.Guttman和S.S.Wilks所著的“工程分析入門”(日譯本由Baifukan有限公司出版)。
      坐標提取單元1032提取了每個提取的文本行的頭和尾坐標(步驟S403)。在圖6的實例中,每個文本行頭位置(左邊)的x坐標和它的尾位置(右邊)的x坐標被提取。方向判定單元1033生成文本行頭尾坐標的柱形圖(步驟S404)。在圖6的實例中,文本行頭x坐標的柱形圖和其尾x坐標的柱形圖生成。方向判定單元1033從生成的柱形圖測量離差(步驟S405)。特別地,文本行頭坐標分布和其尾坐標分布被測量。
      這里,指示文本行開始點的柱形圖具有下列特征之一(1)坐標集中在同一個值上,和(2)坐標集中在兩個地方,也就是,標記坐標(標記位置)和文本體頭的坐標。另一方面,指示文本行結束點的柱形圖具有下列特征之一(1)坐標離差大,和(2)坐標集中在相同值上。這里,當頭和尾坐標都集中在各自的相同值上,可以認為文本行的數(shù)量已經(jīng)大到某一程度。因此,第一方向判定單元102可以判定具有高確定度的方向,并且它們超過了閾值。因此,判定中的難度在這里不會產(chǎn)生問題。
      接下來,利用上述柱狀圖的特點,方向判定單元1033用測得的離差值來以條件表達式判定方向(步驟S406)。特別地,沒有滿足的文本行數(shù)(文本行頭x坐標的平均值-頭x坐標的離差值×2)和沒有滿足的文本行數(shù)(文本行尾x坐標的平均值-尾x坐標的離差值×2)被計算,并且計算所得數(shù)字大的被判定為文本行尾。在圖6的實例中,文本行尾(右邊)具有分散更多的X坐標,因此計算得較多的行。所以,文本行的右邊被判定為尾。這種情況下,字符被認為是向上的,并且圖像數(shù)據(jù)的方向被判定為向上的。
      在步驟S401中,通過抽取每個段落作為判定區(qū)域,判定區(qū)域內(nèi)第一文本行的頭坐標和最后文本行的尾坐標的柱狀圖可以被找到用來判定文本圖像數(shù)據(jù)的方向。以此,即使每一段的方向不同,也可以判定正確的方向。
      在另一個實施例中,替代從文本行頭坐標和尾坐標的分布來判定文本行的起點和結束點從而判定圖像數(shù)據(jù)的方向,包括提取的文本行的矩形區(qū)域被發(fā)現(xiàn)。矩形區(qū)域的邊界位置到每個文本行的頭的距離和從其邊界位置到每個文本行的尾的距離被找到,并且,基于距離的離差,可以判定圖像數(shù)據(jù)的方向。這一處理將在下面解釋。
      代替上述的處理,第二方向判定單元103的坐標提取單元1032找到包括提取的文本行的矩形區(qū)域,并且然后測得矩形區(qū)域的邊界位置到每個文本行的頭的距離和其邊界位置到每個文本行的尾的距離。坐標提取單元1032還找到至多個包括在矩形區(qū)域內(nèi)的文本行頭的距離和到其尾的距離以生成柱狀圖。代替上述的處理,方向判定單元1033根據(jù)從矩形區(qū)域到文本行頭和從矩形區(qū)域到其尾的距離分散度來判定文本圖像數(shù)據(jù)的方向。
      圖7是第二方向判定單元103所執(zhí)行的另一個方向判定處理的流程圖。在下述的方向判定處理中,根據(jù)關于第一方向判定單元102判定的文本行的信息,文本圖像數(shù)據(jù)的方向被判定。
      文本行提取單元1031選擇由第一方向判定單元102判定為具有最高確定度和次高確定度的文本行(步驟S701)。文本行提取單元1031將這些選擇出來的文本行統(tǒng)一以產(chǎn)生簡單區(qū)域(步驟S702)。圖8是提取的文本行產(chǎn)生簡單區(qū)域的一個實例。在圖8的實例中,文本圖像數(shù)據(jù)的最高確定度方向和次高確定度方向在上下方向,并且文本行81及其它通過第一方向判定處理提取的文本行被統(tǒng)一以產(chǎn)生簡單區(qū)域82。順便提及,在具有最高確定度和次高確定度的文本行中,通過找到最小x和y坐標以及最大x和y坐標,通過最小x和y坐標以及最大x和y坐標定義的矩形可被獲取作為判定區(qū)域。
      坐標提取單元1032為每一文本行測量從簡單區(qū)域到頭的距離(此后,“頭距離”)和從簡單區(qū)域到尾的距離(此后,“尾距離”)(步驟S703)。在圖8中,在文本行81中,例如,從簡單區(qū)域82到文本行81頭的距離是頭距離83。同樣,從簡單區(qū)域82到文本行81尾的距離是尾距離84。方向判定單元1033測量頭距離的離差和尾距離的離差(步驟S704)。順便提及,在這種情況下,可以產(chǎn)生柱狀圖以測量離差。
      方向判定單元1033用條件表達式來判定文本圖像數(shù)據(jù)的方向(步驟S705)。其中有特征與上述文本行的頭坐標和尾坐標的相似的特征,因此,使用這些特征的條件表達式被使用以判定文本圖像數(shù)據(jù)的方向。特別地,沒有滿足的文本行數(shù)(頭距離的平均值-頭距離的離差值×2)和沒有滿足的文本行數(shù)(尾距離的平均值-尾距離的離差值×2)被計算,并且計算所得數(shù)字大的被判定為文本行尾。在圖8的實例中,文本行尾(右邊)具有分散較多的文本行尾距離,因此計算得較多的行。所以,文本行的右邊被判定為尾。這種情況下,字符被認為是向上的,并且圖像數(shù)據(jù)的方向被判定為向上的。
      在上述的實施例中,第二方向判定單元103根據(jù)第一方向判定單元102提取的垂直方向或者水平方向文本行來判定文本行的頭坐標和尾坐標。作為選擇,第二方向判定單元103的文本行提取單元1031可獨立地在垂直方向或者水平方向提取文本行。這種情況下,坐標提取單元1032找到垂直方向的文本行的頭坐標和尾坐標以及水平方向的文本行的頭坐標和尾坐標,然后找到四類坐標的每種的離差。因此,文本圖像數(shù)據(jù)的方向被判定。
      當找到從矩形區(qū)域到每個文本行頭的距離以及矩形區(qū)域到其尾的距離,相似地,找到至垂直方向每個文本行的頭和尾的距離以及到水平方向每個文本行的頭和尾的距離。因此,找到四類距離的每種的離差,并且文本圖像數(shù)據(jù)的方向被判定。
      圖9是圖像處理設備100硬件結構的方框圖。在圖9所示的硬件結構中,如實施例所述的處理通過微處理器等的數(shù)字處理被執(zhí)行。在圖9中,圖像處理設備100是計算機,例如PC,并且包括掃描儀901,CPU 902,硬盤903,顯示裝置904,光盤驅(qū)動器905,隨機存取存儲器(RAM)906,只讀存儲器(ROM)907,和打印裝置908。CPU 902控制圖像處理設備100的每個組件。ROM 907儲存了用于啟動CPU 902的計算機程序。硬盤903儲存了掃描儀901讀取的圖像數(shù)據(jù),操作系統(tǒng),應用程序等。RAM 906作為工作區(qū)域,儲存在硬盤903上的圖像數(shù)據(jù)被載入用于字符方向識別的處理。顯示裝置904顯示圖像數(shù)據(jù),輸入狀態(tài)等。打印裝置908打印圖像數(shù)據(jù)。光盤驅(qū)動器905讀取儲存在例如壓縮盤只讀介質(zhì)(CD-ROMs)的各種光學信息記錄介質(zhì)上的計算機程序。在這些組件之間發(fā)送和接收的數(shù)據(jù)由總線控制器調(diào)節(jié)(沒有顯示)。
      掃描儀901光學地讀取原始材料,并且將讀取的結果轉換成電信號的圖像數(shù)據(jù)。CPU902讀取方向判定程序,其執(zhí)行儲存在ROM 907或者硬盤903中的方向判定處理,并且對作為工作區(qū)域的RAM 906中的文本圖像數(shù)據(jù)執(zhí)行圖像處理。方向判定程序可以通過光盤驅(qū)動器905從例如CD-ROM或者軟盤(FD)的儲存介質(zhì)讀取。被處理過的圖像數(shù)據(jù)在CPU902的控制下被儲存在硬盤903中并且,如果需要,被顯示在顯示裝置904上并由打印裝置908輸出。
      圖像處理設備100將圖像方向判定程序作為應用程序儲存在硬盤903中。即,硬盤903在其中儲存圖像方向判定程序。
      一般地,要安裝在硬盤903上的應用程序被儲存在存儲介質(zhì)中。儲存介質(zhì)的實例包括各種類型的例如CD-ROM的光學信息記錄介質(zhì)和例如FD的磁介質(zhì)。儲存在存儲介質(zhì)上的應用程序被安裝在硬盤903上。即,例如各種類型的包括CD-ROM的光學信息記錄介質(zhì)和包括FD的磁介質(zhì)的便攜儲存介質(zhì),可以用來儲存圖像方向判定程序。圖像方向判定處理也可以是,例如,通過通訊裝置(沒有顯示)從外部下載并安裝到硬盤903上。
      綜上所述,根據(jù)本發(fā)明的實施例,確定度測量單元對于對應于包含文本的圖像的圖像數(shù)據(jù)的每個方向,測量方向?qū)陬A定的圖像方向的確定度,并且獲取具有最高確定度的第一方向和具有次高確定度的第二方向。方向判定單元從圖像數(shù)據(jù)提取至少一個文本行,并且當?shù)谝环较蚝偷诙较蛳喾磿r,根據(jù)文本行判定第一方向和第二方向之一是否對應于預定的方向。即,對于圖像數(shù)據(jù)中的每個方向判定確定度,并且根據(jù)兩個方向判定圖像數(shù)據(jù)的方向。因此,圖像數(shù)據(jù)的方向可以精確并且高速地被判定。
      雖然已對于用于完整清楚的披露的特定實施例說明了本發(fā)明,但是附加權利要求并不僅限于此,而要被解釋為包含本領域技術人員可能想到的清楚地屬于在此提出的基本教義的所有變化例和可替換結構。
      權利要求
      1.一種圖像處理設備,其特征在于,包括確定性測量單元,所述確定性測量單元關于與包含文本的圖像相對應的圖像數(shù)據(jù)中的各方向,測量與所述圖像的預定方向相對應的方向的確定度,以獲得具有最高確定度的第一方向和具有次高確定度的第二方向;和方向判定單元,所述方向判定單元從所述圖像數(shù)據(jù)中提取至少一個文本行,并且當?shù)谝环较蚺c第二方向相反時,根據(jù)所述文本行的位置判定所述第一方向和第二方向之一是否對應于所述預定方向。
      2.如權利要求1所述的圖像處理設備,其特征在于,所述方向判定單元判定所述確定度是否等于或者小于閾值,并且在判定關于所有方向的所述確定度等于或者小于閾值的情況下,判定所述第一方向和第二方向之一是否對應于所述預定方向。
      3.如權利要求1所述的圖像處理設備,其特征在于,進一步包括提取所述文本行的頭坐標和尾坐標的坐標提取單元,其中,所述方向判定單元根據(jù)所述頭坐標和尾坐標來判定所述第一方向和第二方向之一是否對應于所述預定方向。
      4.如權利要求3所述的圖像處理設備,其特征在于,其中所述圖像數(shù)據(jù)包括多個文本行,所述坐標提取單元提取各所述文本行的頭坐標和尾坐標,并且獲取頭坐標分布和尾坐標分布,且所述方向判定單元根據(jù)所述頭坐標分布和尾坐標分布來判定所述第一方向和第二方向之一是否對應于所述預定方向。
      5.如權利要求1所述的圖像處理設備,其特征在于,進一步包括坐標提取單元,該坐標提取單元測量圖像數(shù)據(jù)中從包括多個文本行的矩形區(qū)域的邊界到所述文本行頭的第一距離和從所述矩形區(qū)域的邊界到所述文本行尾的第二距離,且所述方向判定單元根據(jù)所述第一距離和第二距離來判定所述第一方向和第二方向之一是否對應于所述預定方向。
      6.如權利要求5所述的圖像處理設備,其特征在于,其中所述坐標提取單元獲得第一距離的分布和第二距離的分布,并且所述方向判定單元根據(jù)所述第一距離的分布和所述第二距離的分布來判定所述第一方向和第二方向之一是否對應于所述預定方向。
      7.一種圖像方向判定方法,其特征在于,包括從與包含文本的圖像相對應的圖像數(shù)據(jù)中提取至少一個文本行;關于所述圖像數(shù)據(jù)中的各方向,測量與圖像的預定方向相對應的方向的確定度,以獲得具有最高確定度的第一方向和具有次高確定度的第二方向;和當所述第一方向與所述第二方向相反時,根據(jù)所述文本行的位置判定所述第一方向和第二方向之一是否對應于所述預定方向。
      8.如權利要求7所述的圖像方向判定方法,其特征在于,其中所述判定包括判定所述確定度是否等于或者小于閾值,并且當關于所有方向的所述確定度等于或者小于閾值時,判定所述第一方向和第二方向之一是否對應于所述預定方向。
      9.如權利要求7所述的圖像方向判定方法,其特征在于,進一步包括獲取所述文本行的頭坐標和尾坐標,其中所述判定包括根據(jù)所述頭坐標和尾坐標來判定所述第一方向和第二方向之一是否對應于所述預定方向。
      10.如權利要求9所述的圖像方向判定方法,其特征在于,其中所述提取包括提取多個文本行,所述獲取包括獲取各所述文本行的頭坐標和尾坐標,并獲取頭坐標分布和尾坐標分布,和所述判定包括根據(jù)所述頭坐標分布和尾坐標分布來判定所述第一方向和第二方向之一是否對應于所述預定方向。
      11.如權利要求7所述的圖像方向判定方法,其特征在于,其中,所述提取包括從所述圖像數(shù)據(jù)中提取包括多個文本行的矩形區(qū)域,所述圖像方向判定方法進一步包括測量從所述矩形區(qū)域的邊界到所述文本行的頭的第一距離;和測量從所述矩形區(qū)域的邊界到所述文本行的尾的第二距離,其中所述判定包括根據(jù)所述第一距離和所述第二距離來判定所述第一方向和第二方向之一是否對應于預定方向。
      12.如權利要求11所述的圖像方向判定方法,其特征在于,其中所述第一距離的測量包括獲取所述第一距離的分布,所述第二距離的測量包括獲取所述第二距離的分布,并且所述判定包括根據(jù)所述第一距離的分布和所述第二距離的分布來判定所述第一方向和第二方向之一是否對應于所述預定方向。
      13.一種計算機程序產(chǎn)品,其特征在于,該計算機程序產(chǎn)品包括計算機可用介質(zhì),該計算機可用介質(zhì)具有包含在該介質(zhì)中的計算機可讀程序編碼,當該計算機可讀程序編碼被執(zhí)行時使得計算機執(zhí)行從與包含文本的圖像相對應的圖像數(shù)據(jù)中提取至少一個文本行;關于所述圖像數(shù)據(jù)中的各方向,測量與所述圖像的預定方向相對應的方向的確定度,以獲得具有最高確定度的第一方向和具有次高確定度的第二方向;且當所述第一方向和所述第二方向相反時,根據(jù)所述文本行的位置判定所述第一方向和第二方向之一是否對應于所述預定方向。
      14.如權利要求13所述的計算機程序產(chǎn)品,其特征在于,其中所述判定包括判定所述確定度是否等于或者小于閾值,并且在關于所有方向的所述確定度等于或者小于閾值時,判定所述第一方向和第二方向之一是否對應于所述預定方向。
      15.如權利要求13所述的計算機程序產(chǎn)品,其特征在于,其中所述計算機可讀程序編碼進一步使得計算機執(zhí)行所述文本行的頭坐標和尾坐標的獲取,且所述判定包括根據(jù)所述頭坐標和尾坐標來判定所述第一方向和第二方向之一是否對應于所述預定方向。
      16.如權利要求15所述的計算機程序產(chǎn)品,其特征在于,其中所述提取包括提取多個文本行,所述獲取包括獲取各所述文本行的頭坐標和尾坐標,以及獲取頭坐標分布和尾坐標分布,且所述判定包括根據(jù)所述頭坐標分布和尾坐標分布來判定所述第一方向和第二方向之一是否對應于所述預定方向。
      17.如權利要求13所述的計算機程序產(chǎn)品,其特征在于,其中,所述提取包括從所述圖像數(shù)據(jù)中提取包括多個文本行的矩形區(qū)域,所述計算機可讀程序編碼進一步使得計算機執(zhí)行測量從所述矩形區(qū)域的邊界到所述文本行的頭的第一距離;和測量從所述矩形區(qū)域的邊界到所述文本行的尾的第二距離,所述判定包括根據(jù)所述第一距離和第二距離來判定所述第一方向和第二方向之一是否對應于所述預定方向。
      18.如權利要求17所述的計算機程序產(chǎn)品,其特征在于,其中所述第一距離的測量包括獲取所述第一距離的分布,所述第二距離的測量包括獲取所述第二距離的分布,并且所述判定包括根據(jù)所述第一距離的分布和所述第二距離的分布來判定所述第一方向和第二方向之一是否對應于所述預定方向。
      全文摘要
      本發(fā)明涉及圖像處理設備,圖像方向判定方法,和計算機程序產(chǎn)品。在本發(fā)明中,第一方向判定單元對于對應于包含文本的圖像的圖像數(shù)據(jù)中的每個方向,判定方向?qū)陬A定的圖像方向的確定度以獲取具有最高確定度的第一方向和具有次高確定度的第二方向。當?shù)谝环较蚝偷诙较蛳喾磿r,第二方向判定單元根據(jù)從圖像數(shù)據(jù)提取的文本行位置判定預定方向?qū)诘谝环较蜻€是第二方向。
      文檔編號G06K9/20GK101059841SQ200710088658
      公開日2007年10月24日 申請日期2007年3月14日 優(yōu)先權日2006年3月14日
      發(fā)明者山合敏文 申請人:株式會社理光
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1