圖像讀取裝置和方法
【專利摘要】本發(fā)明提供圖像讀取裝置和方法,該圖像讀取裝置具備:讀取單元,其讀取原稿并生成圖像數(shù)據(jù);文字識別單元,其為了使所述圖像數(shù)據(jù)的方向正立而對所述圖像數(shù)據(jù)中包含的文字進行識別;以及顯示單元,其以所設定的語言種類來進行顯示,在所設定的所述語言種類為所述文字識別單元無法識別的語言種類時,顯示如下信息,該信息表示指示針對所述讀取單元的所述原稿的文字方向。
【專利說明】圖像讀取裝置和方法
【技術領域】
[0001]本發(fā)明涉及圖像讀取裝置和方法。
【背景技術】
[0002]在日本特開2013-8122號公報中公開有如下技術:對圖像數(shù)據(jù)中的文字進行識另|J,根據(jù)文字識別結果來判定圖像數(shù)據(jù)的正立方向(正確閱讀圖像中的文字的方向)的技術。另外,公開有如下技術:在存在多個頁面的圖像數(shù)據(jù)的情況下,在無法判斷某頁面的正立方向時,根據(jù)對于該頁面以外的其它頁面的正立方向判定結果來確定正立方向。
【發(fā)明內容】
[0003]本發(fā)明的目的在于,提供如下的圖像讀取裝置:即使在能夠選擇文字識別單元無法識別的語言種類作為顯示單元的顯示語言的情況下,也能夠適當?shù)仫@示對讀取單元指示的原稿的文字方向的信息。
[0004]根據(jù)本發(fā)明的第1方案,提供圖像讀取裝置,具備:讀取單元,其讀取原稿并生成圖像數(shù)據(jù);文字識別單元,其為了使所述圖像數(shù)據(jù)的方向正立而對所述圖像數(shù)據(jù)中包含的文字進行識別;以及顯示單元,其以所設定的語言種類來進行顯示,在所設定的所述語言種類為所述文字識別單元無法識別的語言種類時,顯示指示所述原稿的文字相對于所述讀取單元的方向的信息。
[0005]根據(jù)本發(fā)明的第2方案,在所設定的所述語言種類為所述文字識別單元能夠識別的語言時,所述顯示單元對表示所述圖像數(shù)據(jù)的方向被正立的信息進行顯示。
[0006]根據(jù)本發(fā)明的第3方案,利用指定原稿的文字方向的圖形來顯示對所述原稿的文字相對于所述讀取單元的方向進行指示的信息。
[0007]根據(jù)本發(fā)明的第4方案,利用不將原稿的文字方向指定為規(guī)定方向的圖形來對表示所述圖像數(shù)據(jù)的方向被正立的信息進行顯示。
[0008]根據(jù)本發(fā)明的第5方案,提供圖像讀取方法,具有以下工序:通過讀取單元讀取原稿并生成圖像數(shù)據(jù);為了使所述圖像數(shù)據(jù)的方向正立,通過文字識別單元對所述圖像數(shù)據(jù)中包含的文字進行識別;以及通過以所設定的語言種類來進行顯示的顯示單元,在所設定的所述語言種類為所述文字識別單元無法識別的語言種類時,顯示指示所述原稿的文字相對于所述讀取單元的方向的信息。
[0009]根據(jù)上述第1、2或5方案,即使在能夠選擇文字識別單元無法識別的語言種類作為顯示單元的顯示語言的情況下,也能夠適當?shù)仫@示指示原稿的文字相對于讀取單元的方向的信息。
[0010]根據(jù)上述第3或4方案,與不具有本結構的情況相比,能夠對使用者顯示更容易明白的指不。
【專利附圖】
【附圖說明】
[0011]圖1是示出本實施方式的圖像讀取裝置10的結構示意圖的圖。
[0012]圖2是示出本實施方式的圖像讀取裝置10的處理流程的流程圖。
[0013]圖3是示出顯示于顯示單元20的語言選擇按鈕30和掃描功能選擇按鈕34的圖。
[0014]圖4是示出顯示語言為日語時的顯示單元20的顯示的圖。
[0015]圖5是示出顯示語言為泰語時的顯示單元20的顯示的圖。
[0016]圖6是示出指示原稿的文字方向的圖標的例子的圖。
【具體實施方式】
[0017]以下,對本發(fā)明的圖像讀取裝置的實施方式進行說明。此外,本發(fā)明不限定于以下的實施方式。
[0018]圖1是示出本實施方式的圖像讀取裝置10的結構示意圖的圖。圖像讀取裝置10具有讀取單元12、文字識別單元14、正立單元16、識別語言取得單元18、顯示單元20、輸入單元22、存儲單元24、通信單元26以及控制單元28。文字識別單元14、正立單元16以及識別語言取得單元18包含在控制單元28中。各個單元經(jīng)由總線分別進行連接。圖像讀取裝置10可以是內置了具有打印功能、復制功能、掃描功能、通信功能等的計算機的復合機,也可以是僅具有掃描功能的裝置。
[0019]讀取單元12是光學地讀取原稿來獲得圖像數(shù)據(jù)的掃描儀。讀取單元12也可以包含載置原稿的托盤和將原稿從托盤輸送到讀取部的輸送機構等。讀取單元12也可以如下:原稿被用戶直接載置在塑料或者玻璃材料的原稿臺上,而該讀取單元12對載置在原稿臺上的原稿進行讀取。
[0020]文字識別單元14對讀取單元12讀取的圖像數(shù)據(jù)中包含的文字或阿拉伯數(shù)字進行識別。關于文字識別單元14,也可以使用眾所周知的OCR技術。在本實施方式中,文字識別單元14應對日語、英語、德語、法語以及中國語,但也可以使文字識別單元14還能夠應對其它的語言種類。文字識別單元14從圖像數(shù)據(jù)中識別應對的語言種類的文字,但并非應對全部語言,對于無法應對的語言種類,無法在圖像數(shù)據(jù)中識別文字。在本實施方式中,文字識別單元14無法應對泰語。
[0021]正立單元16根據(jù)文字識別單元14識別出的文字或阿拉伯數(shù)字對讀取單元12讀取的圖像數(shù)據(jù)的方向進行修正。具體地講,對已識別的文字或阿拉伯數(shù)字的上下進行識別,以包含在圖像數(shù)據(jù)中的文字或阿拉伯數(shù)字的上方向成為圖像數(shù)據(jù)的上方向的方式使圖像數(shù)據(jù)旋轉?;蛘?,也可以不用旋轉圖像數(shù)據(jù),而進行僅對圖像數(shù)據(jù)附加表示上方向的信息的處理。
[0022]識別語言取得單元18取得文字識別單元14能夠識別的語言的種類。在本實施方式中,將文字識別單元14能夠識別的語言種類的列表預先存儲于后述的存儲單元24中。識別語言取得單元18通過取得該列表,從而取得文字識別單元14能夠識別的語言種類。或者,在文字識別單元14能夠識別的語言種類的列表存儲于外部服務器等中時,也可以經(jīng)由后述的通信單元26從外部服務器等取得文字識別單元14能夠識別的語言種類。
[0023]顯示單元20是例如設置于圖像讀取裝置10的前面板上的監(jiān)視器,顯示圖像讀取裝置10的各種設定和用于輔助用戶的信息等。用戶能夠選擇顯示于顯示單元20的語言的種類,在顯示單元20中以設定的種類的語言來顯示文字。在本實施方式中,能夠選擇的語言種類是日語、英語、德語、法語、中國語以及泰語,但不限于此,也可以使得還能夠選擇其它的語言。顯示單元20對于文字識別單元14無法應對的語言的種類也能夠進行顯示。在本實施方式中,雖然文字識別單元14無法應對泰語,但是顯示單元20能夠以泰語進行顯
/j、l Ο
[0024]輸入單元22是例如設置于圖像讀取裝置10的前面板上的按鈕或開關,其接受對于圖像讀取裝置10的來自用戶的命令。在本實施方式中,顯示單元20由觸控面板構成,在顯示單元20內顯示有按鈕,并將其作為輸入單元22的一部分。因此,在本實施方式中,輸入單元22中存在包含于顯示單元20的部分。
[0025]存儲單元24例如是ROM或RAM,存儲用于使圖像讀取裝置10發(fā)揮功能的程序和各單元的設定信息等各種信息。
[0026]通信單元26例如是網(wǎng)卡,是用于經(jīng)由LAN或者互聯(lián)網(wǎng)與其它設備進行通信的單
J Li ο
[0027]控制單元28是圖像讀取裝置10的CPU,除了上述文字識別單元14、正立單元16、識別語言取得單元18的功能以外,例如進行根據(jù)來自輸入單元22的輸入而使讀取單元12工作或者使顯示單元20的顯示變更等的控制。
[0028]以下,對本實施方式的圖像讀取裝置10的動作進行說明。圖2是示出本實施方式的圖像讀取裝置10的處理流程的流程圖。
[0029]在步驟S10中,控制單元28根據(jù)來自用戶的指示對顯示單元20的顯示語言進行設定。
[0030]圖3是示出顯示于顯示單元20的語言選擇按鈕30和掃描功能選擇按鈕36的圖。例如在圖像讀取裝置10啟動時,控制單元28使顯示單元20顯示圖3所示的畫面30。
[0031]在畫面30中設置有語言選擇按鈕32。在本實施方式中,當語言選擇按鈕32被用戶觸摸時,控制單元28使作為顯示單元20能夠顯示的語言種類的列表的可選擇語言列表34進行顯示。并且,當用戶選擇可選擇語言列表34的特定的語言時,控制單元28將所選擇的語言種類設定為顯示單元20的顯示語言。之后,控制單元28使文字以所設定的語言種類來進行顯示。
[0032]在步驟S12中,控制單元28啟動掃描功能。在本實施方式中,圖像讀取裝置10為復合機,由于還具有除了掃描功能以外的功能,因此圖像讀取裝置10根據(jù)來自用戶的指示來啟動掃描功能。具體地講,當用戶觸摸設置于畫面30上的掃描功能選擇按鈕36時,控制單元28啟動掃描功能。
[0033]在步驟S14中,控制單元28判斷圖像讀取裝置10的自動正立設定是否有效。在自動正立設定有效時進入到步驟S16,在自動正立設定無效時進入到步驟S24。
[0034]在自動正立設定有效時執(zhí)行如下一系列的處理:文字識別單元14從讀取單元12所讀取的圖像數(shù)據(jù)中識別文字或阿拉伯數(shù)字,正立單元16以識別出的文字或阿拉伯數(shù)字的上方向成為圖像數(shù)據(jù)的上方向的方式使圖像數(shù)據(jù)旋轉。在自動正立設定無效時,不進行這些處理,使圖像數(shù)據(jù)的上方向成為在圖像讀取裝置10中預先設定的相對于讀取單元12的規(guī)定方向。
[0035]在本實施方式中,只有圖像讀取裝置10的管理人員能夠變更自動正立設定的有效/無效。另外,對于在自動正立設定無效時被設為圖像數(shù)據(jù)的上方向的規(guī)定方向,也只有圖像讀取裝置10的管理人員能夠進行變更。
[0036]在步驟S16中,控制單元28對在步驟S10中設定的顯示單元20的顯示語言的種類是否為文字識別單元14能夠進行文字識別的語言的種類進行判斷。在本實施方式中,識別語言取得單元18取得預先存儲在存儲單元24的、文字識別單元14能夠識別文字的語言種類的列表,控制單元28判斷在該列表中是否包含設定為顯示單元20的顯示語言的語言種類。在顯示單元20的顯示語言的種類為文字識別單元14能夠識別的語言種類時進入到步驟S18,在顯示單元20的顯示語言的種類為文字識別單元14無法識別的語言種類時進入到步驟S22。
[0037]在步驟S18中,控制單元28使顯示單元20顯示不將記載于原稿中的文字方向指定為規(guī)定方向的圖形(圖標)。在本實施方式中,視為在由讀取單元12讀取的原稿中包含在步驟S10中設定的顯示單元20的顯示語言的文字而進行處理。例如,在將顯示單元20的顯示語言設定為日語時,視為在讀取單元12讀取的原稿中包含日語文字而進行處理。
[0038]在判斷為顯示單元20的顯示語言的種類為文字識別單元14能夠識別的語言種類時,視為文字識別單元14能夠識別在讀取單元12讀取原稿而得到的圖像數(shù)據(jù)中含有的文字。因此,可視為,無論原稿的文字方向相對于讀取單元12為哪個方向,都可以通過自動正立功能將圖像數(shù)據(jù)的上方向修正為正確的方向(可閱讀文字的方向)。由此,用戶可以不用在意原稿的文字方向而插入到讀取單元12,因此控制單元28使顯示單元20顯示不將原稿的文字方向指定為規(guī)定方向的圖標。
[0039]不將原稿的文字方向指定為規(guī)定的方向的圖標意味著圖像數(shù)據(jù)的方向能夠自動地進行正立。因此,用戶通過對不將原稿的文字方向指定為規(guī)定方向的圖標進行確認,從而可知:只要在原稿中含有顯示于顯示單元20的語言的種類,則對原稿進行掃描而得到的圖像數(shù)據(jù)就自動地進行正立。
[0040]圖4是示出顯示語言為日語時的顯示單元20的顯示的圖。在本實施方式中,文字識別單元14能夠對日語的文字進行識別,因此在畫面40中顯示不指定原稿的文字方向的圖標42。
[0041]只要用戶能夠理解圖像數(shù)據(jù)自動地進行正立的情況,則顯示的不是圖標42也不要緊。例如,也可以顯示“由于圖像數(shù)據(jù)的方向自動地進行正立,因此原稿的文字方向可以是任意的方向”等文字。
[0042]此外,在畫面40中還一并顯示輸入圖像數(shù)據(jù)的發(fā)送目的地的目的地輸入欄44、使對圖像數(shù)據(jù)的文件名進行指定的畫面進行顯示的文件名按鈕46、使對掃描儀的畫質等進行設定的畫面進行顯示的掃描設定按鈕48。
[0043]在步驟S20中,控制單元28處于能夠執(zhí)行掃描的狀態(tài),是等待來自用戶的掃描執(zhí)行命令的狀態(tài)。
[0044]在步驟S16中,在顯示單元20的顯示語言的種類為文字識別單元14無法識別的語言種類時,即,在視為由讀取單元12讀取的原稿中不含有文字識別單元14能夠識別的語言種類的文字時,進入到步驟S22。
[0045]在步驟S22中,文字識別單元24將自動正立設定設定為無效。當自動正立設定無效時,讀取單元12所讀取的圖像數(shù)據(jù)的上方向保持讀取單元12讀取的方向而不進行修正。如上所述,由管理人員設定哪個方向相對于讀取單元12的讀取方向成為上方向。
[0046]在步驟S24中,控制單元28使顯示單元20顯示對要進行掃描的原稿的文字方向進行指定的圖標。在認為記載于原稿的文字的語言種類為文字識別單元14無法識別的語言種類時,文字識別單元14無法對文字進行識別,因此不能使自動正立功能正確地發(fā)揮功能。因此,在該情況下,在步驟S22中使自動正立功能成為無效,并且在步驟S24中使顯示單元20顯示指定原稿的文字方向的圖標,以使圖像數(shù)據(jù)對于用戶成為正確的方向(可閱讀文字的方向)。
[0047]在步驟S22中使自動正立設定成為無效是因為防止出現(xiàn)如下情況:盡管在顯示單元20中顯示有指定原稿的文字方向的圖標(S卩,盡管顯示有表示自動正立功能不發(fā)揮功能的圖標),但是自動正立功能實際上發(fā)揮功能。例如,在顯示單元20以泰語進行顯示時,考慮對含有英語文字的原稿進行掃描的情況。在這種情況下,當自動正立設定一直保持有效時,因為選擇泰語作為顯示語言,因此盡管在顯示單元20中顯示有表示自動正立功能不發(fā)揮功能的圖標,但由于文字識別單元14能夠識別英語,因此自動正立功能實際上發(fā)揮了功能。這樣,在步驟S22中將自動正立設定設定為無效,以防止圖像讀取裝置10進行與用戶預期的動作不同的動作。
[0048]圖5是示出顯示語言為泰語時的顯示單元20的顯示的圖。在本實施方式中,文字識別單元14無法識別泰語文字,因此在畫面50中顯示指定原稿的文字方向的圖標52。
[0049]與圖4的情況相同,只要能夠指定原稿的文字方向,則即使所顯示的不是圖標52也不要緊,例如也可以顯示“請將原稿文字的上方向相對于托盤設置為左方向”等文字。
[0050]圖6是示出指示原稿的文字方向的圖標的例子的圖??刂茊卧?8根據(jù)由管理人員設定的相對于讀取單元12的上方向的設定,使所顯示的圖標變化。
[0051]如圖6所示,在上方向的設定為“上”時顯示圖標62,該圖標62表示以原稿文字的上方向成為上(從用戶的角度觀看時可閱讀原稿文字的方向)的方式放置在托盤上的原稿。此外,用特定的顏色(在本實施方式中為紅色)顯示的上方向指示標記60所示的一側表示原稿文字的上方向。另外,在上方向的設定為“左”時顯不圖標64,該圖標64表不以原稿文字的上方向成為左(從用戶的角度觀察時原稿文字的上方向為左)的方式放置在托盤上的原稿。
[0052]圖標62和64都是包含原稿托盤的一部分的圖標,是假設了在原稿托盤中插入有原稿的情況的圖標。但是,還可以想到如下情況:抬起原稿托盤而在塑料或者玻璃材料的原稿臺上直接載置原稿來進行掃描。在該情況下,控制單元28檢測出原稿托盤已被抬起,由此,也可以將所顯示的圖標變更為表示原稿載置在原稿臺上的狀態(tài)并且指定原稿的文字方向的圖標。
[0053]如上所述,在本實施方式中,視為在原稿中含有已設定的顯示單元20的顯示語言種類的文字而進行處理。
[0054]通常,為了當在原稿中記載有文字識別單元14能夠識別的文字時使顯示單元20進行表示能夠使用自動正立功能的顯示、當在原稿中沒有記載有文字識別單元14能夠識別的文字時使顯示單元20進行對用戶指定原稿方向的顯示,控制單元28需要取得在原稿中記載的文字的語言種類。
[0055]控制單元28為了取得在原稿中記載的文字語言的種類是否為文字識別單元14能夠識別的語言種類,需要實際地讀取一次原稿或者使用戶從輸入單元22輸入記載于原稿的語言種類。但是,無論是哪種方法,都要強制用戶進行某些操作。
[0056]因此,在本實施方式中,視為在原稿中含有所設定的顯示單元20的顯示語言種類的文字。由此,沒有強制用戶進行多余的操作,當認為在原稿中含有文字識別單元14能夠識別的文字時,使顯示單元20進行表示能夠使用自動正立功能的顯示,當認為在原稿中不含有文字識別單元14能夠識別的文字時,使顯示單元20進行對用戶指定原稿方向的顯示。
【權利要求】
1.一種圖像讀取裝置,其具備: 讀取單元,其讀取原稿并生成圖像數(shù)據(jù); 文字識別單元,其為了使所述圖像數(shù)據(jù)的方向正立而對所述圖像數(shù)據(jù)中包含的文字進行識別;以及 顯示單元,其以所設定的語言種類來進行顯示,在所設定的所述語言種類為所述文字識別單元無法識別的語言種類時,顯示指示所述原稿的文字相對于所述讀取單元的方向的信息。
2.根據(jù)權利要求1所述的圖像讀取裝置,其中, 在所設定的所述語言種類為所述文字識別單元能夠識別的語言時,所述顯示單元對表示所述圖像數(shù)據(jù)的方向被正立的信息進行顯示。
3.根據(jù)權利要求1所述的圖像讀取裝置,其中, 利用指定原稿的文字方向的圖形來顯示指示所述原稿的文字相對于所述讀取單元的方向的信息。
4.根據(jù)權利要求2所述的圖像讀取裝置,其中, 利用不將原稿的文字方向指定為規(guī)定方向的圖形來對表示所述圖像數(shù)據(jù)的方向被正立的信息進行顯示。
5.一種圖像讀取方法,具有以下工序: 通過讀取單元讀取原稿并生成圖像數(shù)據(jù); 為了使所述圖像數(shù)據(jù)的方向正立,通過文字識別單元對所述圖像數(shù)據(jù)中包含的文字進行識別;以及 通過以所設定的語言種類來進行顯示的顯示單元,在所設定的所述語言種類為所述文字識別單元無法識別的語言種類時,顯示指示所述原稿的文字相對于所述讀取單元的方向的信息。
【文檔編號】H04N1/00GK104346610SQ201410080684
【公開日】2015年2月11日 申請日期:2014年3月6日 優(yōu)先權日:2013年8月9日
【發(fā)明者】加藤伸隆 申請人:富士施樂株式會社