電子書制作裝置、電子書系統(tǒng)以及電子書制作方法
【專利摘要】本發(fā)明公開了電子書制作裝置、電子書系統(tǒng)和電子書制作方法。為了當(dāng)顯示具有復(fù)雜布局的頁面圖像而布局不變時容易在頁面圖像中跨多個字符區(qū)域搜索字符串,該裝置包括:獲得頁面圖像的圖像獲得單元;檢測頁面圖像中的字符區(qū)域的字符區(qū)域檢測單元;識別字符區(qū)域中的字符的字符識別單元;獲得指示每個字符的位置的字符位置信息的字符位置信息獲得單元;讀取順序確定單元,基于每個字符區(qū)域的位置以及字符區(qū)域之間的字符至字符的連續(xù)性來確定字符區(qū)域當(dāng)中的讀取順序;電子書數(shù)據(jù)生成單元,生成包括頁面圖像、字符信息、字符位置信息以及與字符或字符區(qū)域有關(guān)的順序信息的電子書數(shù)據(jù);以及輸出電子書數(shù)據(jù)的電子書數(shù)據(jù)輸出單元。
【專利說明】電子書制作裝置、電子書系統(tǒng)以及電子書制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及當(dāng)在布局不變的情況下在電子書閱讀器設(shè)備上顯示包括字符區(qū)域的頁面圖像而時允許易于在頁面圖像中的多個字符區(qū)域中搜索字符串的電子書制作裝置、電子書系統(tǒng)、電子書制作方法和程序。
【背景技術(shù)】
[0002]傳統(tǒng)地,公知的技術(shù)是允許電子書經(jīng)由網(wǎng)絡(luò)來分發(fā)或者經(jīng)由便攜式記錄介質(zhì)(存儲器卡)來獲得并且在便攜式終端上進(jìn)行顯示。
[0003]日本未經(jīng)審查專利申請公開N0.2012-133659公開了,對電子書上的每頁單元的圖像(頁面圖像)進(jìn)行分析,并且生成包括氣球信息(諸如氣球區(qū)域)、文本信息(諸如氣球中的線)、以及顯示控制信息(諸如頁面圖像的讀取順序)的附屬信息,以生成包括頁面圖像和附屬信息的電子書數(shù)據(jù)。
[0004]日本未經(jīng)審查專利申請公開N0.2004-240643公開了,首先與縱向書寫或橫向書寫相對應(yīng)地初步確定字符區(qū)域中的讀取順序,并且然后確定字符區(qū)域之間的字符連續(xù)性,以將讀取順序改變?yōu)樽罱K讀取順序。
【發(fā)明內(nèi)容】
[0005]然而,如果電子書的頁面圖像中的布局很復(fù)雜,則不利地難以在閱讀器設(shè)備上進(jìn)行對字符串的全文搜索。
[0006]在電子書當(dāng)中,難以對處于具有字符的電子書與主要具有圖像的電子書之間的混合電子書進(jìn)行處理?;旌想娮訒ǔ>哂性S多圖和表,并且在復(fù)雜布局中包括字符。在這種混合電子書中,期望實現(xiàn)布局再現(xiàn),并且還允許在頁面圖像中的對所有字符串的搜索(全文搜索)。具體地,例如,當(dāng)字符區(qū)域和非字符區(qū)域在頁面圖像中以混合組合進(jìn)行布置時,難以進(jìn)行在頁面圖像中的跨多個字符區(qū)域的字符串的搜索的操作。
[0007]在日本未經(jīng)審查專利申請公開N0.2012-133659中,生成用于指示頁面圖像中的讀取順序的信息并且將其附加到頁面圖像。然而,該專利公報既沒有公開特定讀取順序確定方法,也沒有公開在頁面圖像中的多個字符區(qū)域中搜索字符串的操作。
[0008]在日本未經(jīng)審查專利申請公開N0.2004-240643中,公開了一種用于確定字符區(qū)域中的讀取順序的方法。然而,該專利公報沒有公開在頁面圖像中的多個字符區(qū)域中搜索字符串的能力。
[0009]鑒于這些情況作出了本發(fā)明。本發(fā)明的目的在于,在完全再現(xiàn)復(fù)雜布局的同時允許進(jìn)行全文搜索。具體地,本發(fā)明的目的在于,當(dāng)在沒有布局改變的情況下,在電子書閱讀器設(shè)備上顯示包括字符區(qū)域的頁面圖像時,允許容易搜索在頁面圖像中跨多個字符區(qū)域的字符串。
[0010]為了實現(xiàn)上述目的,本發(fā)明提供了一種電子書制作裝置,該電子書制作裝置包括:圖像獲得單元,該圖像獲得單元獲得表示布置字符區(qū)域和非字符區(qū)域的每頁單元的圖像的頁面圖像;字符區(qū)域檢測單元,該字符區(qū)域檢測單元檢測在由圖像獲得單元所獲得的頁面圖像中的字符區(qū)域;字符識別單元,該字符識別單元識別由字符區(qū)域檢測單元所檢測到的字符區(qū)域中的字符;字符位置信息獲得單元,該字符位置信息獲得單元針對在字符區(qū)域中所識別的字符中的每一個獲得字符位置信息,該字符位置信息指示所識別的字符在頁面圖像中的位置;讀取順序確定單元,該讀取順序確定單元基于字符區(qū)域在頁面圖像中的位置以及在頁面圖像中的字符區(qū)域之間的從一個字符至另一字符的連續(xù)性,來確定該頁面圖像中的字符區(qū)域當(dāng)中的讀取順序;電子書數(shù)據(jù)生成單元,電子書數(shù)據(jù)生成單元生成下述電子書數(shù)據(jù):該電子書數(shù)據(jù)包括指示識別出的字符的字符信息、指示頁面圖像中的識別出的字符中每一個的位置的字符位置信息、以及關(guān)于與頁面圖像中的字符區(qū)域當(dāng)中的讀取順序相對應(yīng)的字符或字符區(qū)域的順序信息;以及電子書數(shù)據(jù)輸出單元,該電子書數(shù)據(jù)輸出單元輸出由電子書數(shù)據(jù)生成單元所生成的電子書數(shù)據(jù)。
[0011]根據(jù)本發(fā)明,不僅基于頁面圖像中的字符區(qū)域的位置,而且還基于從字符區(qū)域之間的字符至字符的連續(xù)性來確定頁面圖像中的字符區(qū)域當(dāng)中的讀取順序。而且,生成下述電子書數(shù)據(jù):該電子書數(shù)據(jù)包括指示識別出的字符的字符信息、指示在頁面圖像中所識別出的每個字符的位置的字符位置信息、以及關(guān)于與頁面圖像中的字符區(qū)域當(dāng)中的讀取順序相對應(yīng)的字符或字符區(qū)域的順序信息。因此,當(dāng)在沒有布局改變的情況下在獲得電子書的閱讀器設(shè)備處顯示具有復(fù)雜布局的頁面圖像時,可以進(jìn)行對在頁面圖像中跨多個字符區(qū)域的字符串的簡單搜索。
[0012]根據(jù)本發(fā)明的一方面,該裝置進(jìn)一步包括顯示控制程序生成單元,該顯示控制程序生成單元生成要由能夠顯示頁面圖像的閱讀器設(shè)備執(zhí)行的顯示控制程序,該顯示控制程序具有基于添加到電子書數(shù)據(jù)中的頁面圖像的信息能夠搜索在頁面圖像中的跨字符區(qū)域上的字符串的搜索功能以及能夠突出顯示通過該搜索所找到的字符區(qū)域中的字符串的突出顯示功能,其中電子書數(shù)據(jù)生成單元將顯示控制程序并入到電子書數(shù)據(jù)中。根據(jù)該方面,在電子書數(shù)據(jù)中包含顯示控制程序,該顯示控制程序具有能夠在頁面圖像中的字符區(qū)域中搜索字符串的搜索功能以及能夠突出顯示通過該搜索所找到的字符區(qū)域中的字符串的突出顯示功能。因此,即使在閱讀器設(shè)備側(cè)沒有配備特殊搜索功能,也可以進(jìn)行在頁面圖像中跨多個字符區(qū)域的字符串的簡單搜索。
[0013]根據(jù)本發(fā)明的另一方面,顯示控制程序生成單元生成顯示控制程序,該顯示控制程序具有通過閱讀器設(shè)備在第一顯示模式與第二顯示模式之間切換的功能,第一顯示模式在不改變字符區(qū)域和非字符區(qū)域的布置以及字符區(qū)域中的字符的布置的情況下顯示頁面圖像,第二顯示模式重排(reflow)顯示字符區(qū)域中的字符。根據(jù)該方面,即使在閱讀器設(shè)備側(cè)沒有配備特殊搜索功能,用戶也能夠在不改變布局的第一顯示模式和用于通過改變布局來重排顯示的第二顯示模式之間進(jìn)行選擇。
[0014]根據(jù)本發(fā)明的又一方面,讀取順序確定單元基于頁面圖像中的字符區(qū)域的位置來初步地確定字符區(qū)域當(dāng)中的讀取順序,并且基于從頁面圖像中的字符區(qū)域之間的一個字符至另一字符的連續(xù)性來對頁面圖像中的字符區(qū)域當(dāng)中的讀取順序進(jìn)行校正。根據(jù)該方面,可以快速并且可靠地確定字符區(qū)域當(dāng)中的讀取順序。
[0015]根據(jù)本發(fā)明的又一方面,該裝置進(jìn)一步包括目錄表信息生成單元,該目錄表信息生成單元生成目錄表信息,該目錄表信息指示頁面圖像的每頁或每多頁的標(biāo)題與頁碼之間的對應(yīng)性,其中電子書數(shù)據(jù)生成單元將目錄表信息并入到電子書數(shù)據(jù)中。根據(jù)該方面,可以基于目錄表信息來簡單地在閱讀器設(shè)備上顯示用戶期望的頁面圖像。
[0016]根據(jù)本發(fā)明的又一方面,該裝置進(jìn)一步包括生成索引信息的索引信息生成單元,該索引信息指示在頁面圖像中的字符區(qū)域中的字符串與頁碼之間的對應(yīng)性,其中電子書數(shù)據(jù)生成單元將該索引信息并入到電子書數(shù)據(jù)中。根據(jù)該方面,可以基于該索引信息來簡單地在閱讀器設(shè)備上顯示用戶期望的頁面圖像。
[0017]根據(jù)本發(fā)明的又一方面,該裝置進(jìn)一步包括錨點設(shè)置單元,該錨點設(shè)置單元對頁面圖像中的字符區(qū)域中的字符當(dāng)中的指示非字符區(qū)域中的任何一個中的部分圖像的字符設(shè)置用于將顯示切換到非字符區(qū)域中的該部分圖像的錨點。根據(jù)該方面,用戶可很容易閱讀彼此相關(guān)聯(lián)的字符區(qū)域中的字符信息以及非字符區(qū)域中的部分圖像。
[0018]根據(jù)本發(fā)明的又一方面,該裝置進(jìn)一步包括生成翻譯信息的翻譯信息生成單元,該翻譯信息是通過將指示由字符識別單元所識別的字符的字符信息翻譯成與字符信息的語言不同的語言來獲得的,其中電子書數(shù)據(jù)生成單元將翻譯信息并入到電子書數(shù)據(jù)中。根據(jù)該方面,用戶能夠容易理解甚至不是用戶母語的語言的電子書。
[0019]此外,本發(fā)明提供了一種電子書系統(tǒng),該電子書系統(tǒng)包括上述電子書制作裝置中的任何一個以及閱讀器設(shè)備,該閱讀器設(shè)備獲得從電子書制作裝置輸出的電子書數(shù)據(jù)并且顯示電子書數(shù)據(jù)中的頁面圖像。
[0020]根據(jù)本發(fā)明的又一方面,閱讀器設(shè)備具有能夠基于對電子書數(shù)據(jù)中的頁面圖像添加的信息來在頁面圖像中的字符區(qū)域中搜索字符串的搜索功能以及能夠突出顯示通過該搜索所找到的字符串的突出顯示功能。根據(jù)該方面,通過使用在閱讀器設(shè)備側(cè)配備的搜索功能和突出顯示功能,可以跨多個字符區(qū)域搜索字符串并且進(jìn)行顯示。
[0021]根據(jù)本發(fā)明的又一方面,閱讀器設(shè)備具有通過閱讀器設(shè)備在第一顯示模式與第二顯示模式之間進(jìn)行切換的功能,第一顯示模式在不改變字符區(qū)域以及字符區(qū)域中的字符的布置的情況下顯示頁面圖像,第二顯示模式通過改變字符區(qū)域中的字符的布置來重排顯示。根據(jù)該方面,通過使用在閱讀器設(shè)備側(cè)配備的切換功能,閱讀器設(shè)備可以在第一顯示模式(頁面圖像全顯示)與第二顯示模式(重排顯示)之間進(jìn)行切換。
[0022]本發(fā)明提供了一種電子書制作方法,該電子書制作方法包括:圖像獲得步驟,獲得表示布置字符區(qū)域和非字符區(qū)域的每頁單元的圖像的頁面圖像;字符區(qū)域檢測步驟,對在圖像獲得步驟中所獲得的頁面圖像中的字符區(qū)域進(jìn)行檢測;字符識別步驟,識別在字符區(qū)域檢測步驟中所檢測到的字符區(qū)域中的字符;字符位置信息獲得步驟,針對在字符區(qū)域中所識別的字符中的每一個來獲得指示所識別的字符在字符區(qū)域中位置的位置信息;讀取順序確定步驟,基于頁面圖像中的字符區(qū)域的位置以及在頁面圖像中的字符區(qū)域之間的字符至字符的連續(xù)性來確定頁面圖像中的字符區(qū)域當(dāng)中的讀取順序;電子書數(shù)據(jù)生成步驟,生成下述電子書數(shù)據(jù):該電子書數(shù)據(jù)包括指示所識別的字符的字符信息、指示頁面圖像中的所識別的字符中的每一個的位置的字符位置信息、以及關(guān)于與頁面圖像中的字符區(qū)域當(dāng)中的讀取順序相對應(yīng)的字符或字符區(qū)域的順序信息;以及電子書數(shù)據(jù)輸出步驟,輸出在電子書數(shù)據(jù)生成步驟中所生成的電子書數(shù)據(jù)。
[0023]根據(jù)本發(fā)明,當(dāng)在沒有布局改變的情況下在電子書閱讀器設(shè)備上顯示包括字符區(qū)域的頁面圖像時,能夠允許在頁面圖像中跨多個字符區(qū)域的字符串的簡單搜索。
【專利附圖】
【附圖說明】
[0024]圖1是電子書系統(tǒng)的示例的整體結(jié)構(gòu)圖;
[0025]圖2是電子書制作裝置的示例的硬件結(jié)構(gòu)圖;
[0026]圖3是在用于在描述電子書制作程序與各種信息之間的關(guān)系中所使用的描述圖;
[0027]圖4是電子書制作裝置的示例的功能框圖;
[0028]圖5是閱讀器設(shè)備的示例的硬件結(jié)構(gòu)圖;
[0029]圖6是描繪電子書制作處理的示例的流程的流程圖;
[0030]圖7是所獲得的頁面圖像的示例的描述圖;
[0031]圖8是從圖7的頁面圖像檢測到的字符區(qū)域的描述圖;
[0032]圖9是在描述指示圖7的頁面圖像中所識別的字符的位置的字符位置信息中所使用的描述圖;
[0033]圖10是在描述第一讀取順序確定結(jié)果中使用的描述圖;
[0034]圖11是在描述第二讀取順序確定結(jié)果中使用的描述圖;
[0035]圖12是閱讀器設(shè)備上的頁面圖像的全顯示的示例的描述圖;
[0036]圖13是圖12的頁面圖像的放大主要部分的描述圖;
[0037]圖14是在閱讀器設(shè)備上的重排顯示的示例的描述圖;以及
[0038]圖15是閱讀器設(shè)備上的超鏈接顯示的示例的描述圖。
【具體實施方式】
[0039]下面參考附圖來詳細(xì)描述本發(fā)明的實施例。
[0040]<系統(tǒng)結(jié)構(gòu)>
[0041]圖1是電子書系統(tǒng)(電子書數(shù)據(jù)分發(fā)系統(tǒng))的示例的整體結(jié)構(gòu)圖。
[0042]掃描儀I讀取紙張上的書稿以生成布置字符區(qū)域和非字符區(qū)域的每頁單元的圖像(以下簡稱為“頁面圖像”)。雖然圖1描繪了通過掃描儀I讀取紙張介質(zhì)的書稿以獲得一頁或多頁上的頁面圖像,但是本發(fā)明并不局限于該示例??梢越?jīng)由網(wǎng)絡(luò)或記錄介質(zhì)輸入電子生成的書稿(數(shù)字稿)以獲得一頁或多頁上的頁面圖像。
[0043]電子書制作裝置2是生成包括一頁或多頁上的頁面圖像的電子書數(shù)據(jù)(在下文中還簡稱為“電子書”)的裝置。電子書制作裝置2例如由計算機裝置來配置。
[0044]在有來自閱讀器設(shè)備4的分發(fā)請求時,服務(wù)器裝置3經(jīng)由網(wǎng)絡(luò)向閱讀器設(shè)備4傳送由電子書制作裝置2所生成的電子書數(shù)據(jù)。服務(wù)器裝置3例如由計算機裝置來配置。
[0045]閱讀器設(shè)備4 (4a,4b,4c,4d)接收從服務(wù)器裝置3傳送的電子書數(shù)據(jù)并且顯示頁面圖像。閱讀器設(shè)備4是諸如便攜式電話、智能電話和平板終端的各種便攜式終端中的任何一個或者諸如個人計算機的各種終端設(shè)備(計算機裝置)中的任何一個。
[0046]閱讀器設(shè)備4具有顯示屏,并且顯示屏的大小針對每個型號而變化。當(dāng)閱讀器設(shè)備4的顯示屏大小小于電子書數(shù)據(jù)的每頁單元的整個頁面圖像的顯示大小時,隨著與閱讀器設(shè)備4的顯示屏大小相對應(yīng)的顯示區(qū)域在每頁單元的頁面圖像中連續(xù)移動來進(jìn)行顯示。這樣,通過與顯示屏大小相對應(yīng)的顯示區(qū)域在頁面圖像中移動,在閱讀器設(shè)備4的顯示屏上順序顯示在顯示范圍中的部分圖像,這可以被稱為“追蹤顯示”或“順序顯示”。
[0047]<電子書制作裝置的部件>
[0048]圖2是電子書制作裝置2的示例的硬件結(jié)構(gòu)圖。如在圖2中所示,本示例的電子書制作裝置2由包括控制設(shè)備21、操作設(shè)備22、顯示設(shè)備23、通信設(shè)備24和存儲設(shè)備25的計算機裝置來配置??刂圃O(shè)備21例如由CPU (中央處理單元)來配置。在下文中可以將(PU簡稱為“微計算機”。操作設(shè)備22例如由鍵盤和鼠標(biāo)來配置。顯示設(shè)備23例如由液晶顯示設(shè)備來配置。通信設(shè)備24是可以經(jīng)由網(wǎng)絡(luò)與服務(wù)器裝置3進(jìn)行通信的設(shè)備。存儲設(shè)備25例如由諸如硬盤的大容量盤來配置。
[0049]如在圖3中所示,電子書制作裝置2的控制設(shè)備21執(zhí)行電子書制作程序50,使頁面圖像51與附屬信息相關(guān)聯(lián)以生成由IDPF (國際數(shù)字出版論壇)所公布的EPUB (電子出版)格式的電子文檔數(shù)據(jù)60,附屬信息諸如字符區(qū)域信息52、讀取順序信息53、字符信息54、字符位置信息55、錨點信息56、目錄表信息57和索引信息58。而且,可以對頁面圖像51添加顯示控制程序59。在該情況下,可以在顯示控制程序59中包括其他附加信息(例如字符區(qū)域信息52、讀取順序信息53、字符信息54、字符位置信息55、錨點信息56、目錄表信息57、以及索引信息58。下面進(jìn)一步詳細(xì)描述這些附加信息中的每一個。
[0050]圖4是電子書制作裝置2的示例的功能框圖。
[0051]將該示例的電子書制作裝置2被配置成包括存儲單元200、圖像獲得單元202、字符區(qū)域檢測單元204、字符識別單元206、字符位置信息獲得單元208、讀取順序確定單元210、錨點設(shè)置單元212、目錄表信息生成單元214、索引信息生成單元216、翻譯信息生成單元218、顯示控制程序生成單元220、電子書數(shù)據(jù)生成單元222、以及電子書數(shù)據(jù)輸出單元224。存儲單元200例如由圖2的存儲設(shè)備25來配置。圖像獲得單元202例如由圖2的通信設(shè)備24來配置。字符區(qū)域檢測單元204、字符識別單元206、字符位置信息獲得單元208、讀取順序確定單元210、錨點設(shè)置單元212、目錄表信息生成單元214、索引信息生成單元216、翻譯信息生成單元218、顯示控制程序生成單元220和電子書數(shù)據(jù)生成單元222例如由圖2的控制設(shè)備21來配置。電子書數(shù)據(jù)輸出單元224例如由圖2的通信設(shè)備24來配置。
[0052]存儲單元200存儲各種信息,諸如頁面圖像51、字符區(qū)域信息52、讀取順序信息53、字符信息54、字符位置信息55、錨點信息56、目錄表信息57、索引信息58以及顯示控制程序59。
[0053]圖像獲得單元202獲得表示布置字符區(qū)域和非字符區(qū)域的每頁單元的圖像的頁面圖像51、并入到電子書數(shù)據(jù)60 (電子書)中的頁面圖像51中的任何一個。這里,頁單元并不局限于一頁單元,而可以是多頁的單元(例如,兩頁單元)。頁面圖像51的示例包括從諸如報紙、雜志、連環(huán)漫畫(漫畫)、辦公文檔、教科書以及參考書的紙張所讀取的圖像。頁面圖像51可以是從頭開始電子生成的頁面圖像。例如,獲得由圖1的掃描儀I從紙張介質(zhì)讀取的一個或多個頁面圖像51。一個或多個頁面圖像51可以是從服務(wù)器裝置3獲得的。
[0054]字符區(qū)域檢測單元204檢測圖像獲得單元202所獲得的頁面圖像51中的字符區(qū)域,并且輸出字符區(qū)域信息52??梢酝ㄟ^使用各種已知技術(shù)中的任何一個來執(zhí)行字符區(qū)域的檢測。
[0055]字符識別單元206識別由字符區(qū)域檢測單元204所檢測到的字符區(qū)域中的字符并且輸出字符信息54??梢酝ㄟ^使用各種已知技術(shù)中的任何一個來執(zhí)行字符識別。
[0056]對于在任何字符區(qū)域中所識別的每個字符,字符位置信息獲得單元208獲得指示在頁面圖像51中所識別的字符的位置的字符位置信息55。下面進(jìn)一步描述字符位置信息55的示例。
[0057]讀取順序確定單元210基于頁面圖像51中的字符區(qū)域的位置以及頁面圖像51中的字符區(qū)域之間的字符至字符的連續(xù)性來確定頁面圖像51中的字符區(qū)域當(dāng)中的讀取順序,并且輸出讀取順序信息53。通過基于例如字符的語言、縱向書寫/橫向書寫等來確定字符區(qū)域當(dāng)中的縱向和橫向位置關(guān)系來執(zhí)行基于字符區(qū)域的位置的讀取順序確定。通過使用詞典、諸如語言分析的語言處理(例如形態(tài)分析)等,基于根據(jù)字符在作為詞的字符區(qū)域之間是否連續(xù)來執(zhí)行基于從字符至字符的連續(xù)性的讀取順序確定。
[0058]對于頁面圖像51中的字符區(qū)域中的字符當(dāng)中的指示非字符區(qū)域中的部分圖像(例如,圖或表)的字符(例如,圖或表號),錨點設(shè)置單元212設(shè)置用于將顯示切換到非字符區(qū)域中的部分圖像(例如圖或表)的錨點。即,錨點設(shè)置單元212將用于切換到非字符區(qū)域中的部分圖像的錨點信息56 (例如,超鏈接)插入到字符區(qū)域中的字符串中。
[0059]目錄表信息生成單元214生成目錄表信息57,該目錄表信息57指示與頁面圖像51有關(guān)的每頁或每多個頁的標(biāo)題(章節(jié)標(biāo)題)與頁碼之間的對應(yīng)性。
[0060]索引信息生成單元216生成索引信息58,該索引信息58指示頁面圖像51的字符區(qū)域中的字符串(關(guān)鍵字候選)與頁碼之間的對應(yīng)性。
[0061]翻譯信息生成單元218將指示由字符識別單元206所識別的字符的字符信息翻譯成與所識別的字符信息的語言(例如,日語)不同的語言(例如,英語)以生成翻譯信息。
[0062]顯示控制程序生成單元220生成可以顯示頁面圖像51的閱讀器設(shè)備4所要執(zhí)行的顯示控制程序59。例如,利用諸如JavaScript (注冊商標(biāo))的腳本語言來生成顯示控制程序59??梢允褂萌魏纹渌Z言。該示例的顯示控制程序59具有能夠基于對電子書數(shù)據(jù)60中的頁面圖像51添加的信息(諸如字符信息54、字符位置信息55、讀取順序信息53)來在字符區(qū)域中搜索字符串(搜索詞)并且在頁面圖像51中跨字符區(qū)域搜索字符串(搜索詞)的搜索功能、以及能夠突出顯示通過該搜索所找到的字符串的顯示功能。而且,該示例的顯示控制程序59具有通過閱讀器設(shè)備4在用于在不改變字符區(qū)域、非字符區(qū)域和字符區(qū)域中的字符的布置的情況下顯示頁面圖像的全顯示的顯示模式(第一顯示模式)與重排顯示字符區(qū)域中的字符的顯示模式(第二顯示模式)之間進(jìn)行切換的功能。
[0063]電子書數(shù)據(jù)生成單元222通過使各種信息與頁面圖像51相關(guān)聯(lián)而來生成電子書數(shù)據(jù)60。電子書數(shù)據(jù)生成單元222通過使至少指示所識別的字符的字符信息54、指示在頁面圖像51中所識別的字符的位置的字符位置信息55和包括與頁面圖像51中的字符區(qū)域當(dāng)中的讀取順序相對應(yīng)的字符順序信息(或者字符區(qū)域順序信息)的讀取順序信息53與頁面圖像51相關(guān)聯(lián)來生成電子書數(shù)據(jù)60。如在圖3中所示,可以對頁面圖像51添加字符區(qū)域信息52、讀取順序信息53、字符信息54、字符位置信息55、錨點信息56、目錄表信息57以及索引信息58。此外,可以添加翻譯信息。更進(jìn)一步,可以對頁面圖像51添加顯示控制程序59 ο
[0064]電子書數(shù)據(jù)輸出單元224輸出由電子書數(shù)據(jù)生成單元222所生成的電子書數(shù)據(jù)60。
[0065]〈閱讀器設(shè)備〉
[0066]圖5描繪了用于閱讀由電子書制作裝置2所生成的電子書數(shù)據(jù)60的閱讀器設(shè)備4的硬件結(jié)構(gòu)的示例。該示例的閱讀器設(shè)備4由包括控制單元41、操作單元42、顯示單元43、通信單元44以及存儲單元45的便攜式終端來配置。控制單元41例如由CPU (中央處理單元)來配置??刂茊卧?2和顯示單元43例如由觸摸板顯示器來配置。通信單元44是可經(jīng)由網(wǎng)絡(luò)與服務(wù)器設(shè)備3進(jìn)行通信的設(shè)備。存儲單元45例如由存儲器來配置。
[0067]通信單元44向服務(wù)器設(shè)備發(fā)出用于分發(fā)電子書數(shù)據(jù)60的請求,并且從服務(wù)器設(shè)備3接收電子書數(shù)據(jù)60。
[0068]控制單元41通過遵循從用戶輸入到操作單元42的指令來執(zhí)行存儲在存儲單元45中的閱讀器程序。
[0069]控制單元41還遵循并入電子書數(shù)據(jù)60中的顯示控制程序59,以執(zhí)行對并入電子書數(shù)據(jù)60中的頁面圖像51的顯示控制,并且使得在顯示單元43上顯示頁面圖像51。
[0070]<電子書制作處理的概要>
[0071]圖6是描繪電子書制作處理的示例的流程的流程圖。通過在圖2的控制設(shè)備21(微計算機)的控制下遵循程序來執(zhí)行處理。程序可以電地、磁地或者通過使用其他已知方法被預(yù)先存儲在記錄介質(zhì)中,并且可以從該記錄介質(zhì)進(jìn)行讀取。
[0072]首先,通過圖像獲得單元202來獲得頁面圖像51 (步驟SI),該頁面圖像51是布置字符區(qū)域和非字符區(qū)域的每頁單元的圖像。圖7描繪了所獲得的頁面圖像51的示例。
[0073]接下來,字符區(qū)域檢測單元204在所獲得的頁面圖像51中檢測字符區(qū)域(步驟S2)。這里,通過字符區(qū)域檢測單元204來生成字符區(qū)域信息52。圖8描繪了在圖7的頁面圖像51中所檢測到的字符區(qū)域Tl,T2,T3,T4,T5,T6,T7。
[0074]接下來,字符識別單元206識別所檢測到的字符區(qū)域Tl至T7中的字符(步驟S3)。這里,字符識別單元206生成字符信息54。
[0075]接下來,對于在字符區(qū)域Tl至T7中所識別的每個字符,獲得指示在頁面圖像51中所識別的字符的位置(坐標(biāo))的字符位置信息。這里,字符位置獲得單元208生成字符位置信息55。
[0076]圖9描繪了在圖7的頁面圖像51中所識別的每個字符的位置的示例。在圖9中所描繪的示例中,字符識別單元206已經(jīng)在字符區(qū)域Tl中識別了四個字符Cl,C2,C3,C4。此外,對于在字符區(qū)域Tl中所識別的字符Cl,C2, C3, C4中的每一個,字符識別單元206將頁面圖像中的字符周圍的矩形的對角線上的兩個點(在該示例中,右上端和左下段)的坐標(biāo)計算為字符位置信息(例如,與字符Cl有關(guān)的(xll,yll)和(xl2,yl2))。在該示例中,頁面圖像的右上端作為原點(0,0),并且將附圖中的水平方向作為X方向,并且將附圖中的豎直方向作為y方向。如字符區(qū)域Tl中的字符Cl至C4,對于在字符區(qū)域T2中所識別的字符(C5,C6,C7,C8,...)中的每一個,頁面圖像中的字符周圍的矩形的對角線上的兩個點的坐標(biāo)被計算為字符位置信息。類似地,在其他字符區(qū)域T3至T7中,計算字符位置信息。
[0077]接下來,作為第一讀取順序確定,讀取順序確定單元210基于頁面圖像51中的每個字符區(qū)域來確定頁面圖像51中的字符區(qū)域當(dāng)中的讀取順序(步驟S5)。圖10描繪了圖7的頁面圖像51中的第一讀取順序確定結(jié)果。在該示例的頁面圖像51中,因為字符是日語并且縱向書寫,因此基本上按照從右到左并且從上到下的順序初步地確定讀取順序。也就是說,讀取順序被初步確定為Tl — T2 — T3 — T4 — T5 — T6 — T7。
[0078]接下來,作為第二讀取順序確定,讀取順序確定單元210基于頁面圖像51中的字符區(qū)域之間的字符之間的連續(xù)性來確定頁面圖像51中的字符區(qū)域當(dāng)中的讀取順序(步驟S6)。圖11描繪了圖7的頁面圖像51中的第二讀取順序確定結(jié)果。在該示例中,確定字符區(qū)域之間的字符至字符的連續(xù)性是否以在步驟S5處初步確定的讀取順序中來實現(xiàn)。在該示例的頁面圖像51中,字符區(qū)域T3末尾的字符和字符區(qū)域T4開始的字符不具有語言上的連續(xù)性,字符區(qū)域T3末尾的字符和字符區(qū)域T6開始的字符具有語言上的連續(xù)性,并且字符區(qū)域T6末尾的字符和字符區(qū)域T7開始的字符具有語言上的連續(xù)性。因此,字符區(qū)域T3后面是字符區(qū)域T6,并且字符區(qū)域T6后面是字符區(qū)域T7,并且因而讀取順序從Tl — T2 — T3 — T4 — T5 — T6 — T7 變?yōu)?Tl — T2 — T3 — T6 — T7 — T4 — T5。
[0079]通過讀取順序確定單元210生成讀取順序信息53。在該示例中,不僅生成Tl — T2 — T3 — T4 — T5 — T6 — T7的字符區(qū)域中的讀取順序(字符區(qū)域順序信息)而且還生成指示頁面圖像51中的字符讀取順序的信息(字符順序信息)。字符順序信息和字符區(qū)域順序信息中的任何一個可以被生成。
[0080]接下來,在頁面圖像51的字符區(qū)域中的字符當(dāng)中,錨點設(shè)置單元212對指示非字符區(qū)域中的圖/表圖像的編號(圖/表號)的字符設(shè)置對每個非字符區(qū)域中的圖或表的圖像(以下簡稱為〃圖/表圖像〃)的超鏈接。這里,通過錨點設(shè)置單元212來生成錨點信息56。例如,當(dāng)在字符區(qū)域中存在指示非字符區(qū)域中的圖或表的“圖A”的圖/表號的字符“圖A”時,對非字符區(qū)域中的圖/表圖像的超鏈接被設(shè)置為“圖A”。
[0081]接下來,生成要對頁面圖像添加的各種附加信息(步驟S8)。在該步驟S8中,生成除了在步驟S2至S7所生成的附加信息之外的各種附加信息。在該示例中,通過目錄表信息生成單元214來生成指示與頁面圖像有關(guān)的每頁或每多頁的標(biāo)題(章節(jié)標(biāo)題)與頁碼之間的對應(yīng)性的目錄表信息57。而且,索引信息生成單元216生成指示關(guān)鍵字與頁碼之間的對應(yīng)性的索引信息58。而且,翻譯信息生成單元218生成翻譯信息,翻譯信息生成單元218將指示字符識別單元206所識別的字符的字符信息翻譯成與字符信息的語言(在該示例中,日語)不同的語言(例如,英語)。此外,顯示控制程序生成單元220生成要由閱讀器設(shè)備4執(zhí)行的顯示控制程序59。更進(jìn)一步,當(dāng)字符位置信息獲得單元208所獲得的字符位置信息以及讀取順序確定單元210所確定的讀取順序信息不是所需要的格式時,對字符位置信息和讀取順序信息進(jìn)行編輯。在該示例中,針對每個字符生成字符相關(guān)信息,包括字符ID(字符標(biāo)識信息)、字符位置信息(頁面圖像上的坐標(biāo))、字符信息(例如“寺院”)以及字符順序信息。例如,生成諸如〈char ID= “l(fā)”,rect= “20,20,100,100”,text= “寺院”,order= “1”/> 的信息。該字符相關(guān)信息與圖3的字符信息54、字符位置信息55以及讀取順序信息53相對應(yīng)。而且,在該示例中,頁面圖像中的字符順序信息被并入在電子書數(shù)據(jù)60中。替代地,指示字符區(qū)域的字符區(qū)域信息52以及字符區(qū)域順序信息可以被并入電子書數(shù)據(jù)60中。
[0082]接下來,電子書數(shù)據(jù)生成單元222使在步驟S2至S8生成的各種附加信息和頁面圖像51彼此相關(guān)聯(lián),以生成電子書數(shù)據(jù)60 (步驟S9)。例如,對頁面圖像51添加作為附加信息的由字符區(qū)域檢測單元204生成的字符區(qū)域信息52和包括由讀取順序確定單元210生成的字符區(qū)域順序信息和字符順序信息的讀取順序信息53、由字符識別單元206生成的字符信息54、由字符位置信息獲得單元208生成的字符位置信息55、由錨點設(shè)置單元212生成的錨點信息56、由目錄表信息生成單元214生成的目錄表信息57、由索引信息生成單元216生成的索引信息58、以及由顯示控制程序生成單元220生成的顯示控制程序59,以生成電子書數(shù)據(jù)60。在該示例中,步驟S8處所生成的字符相關(guān)信息被并入在電子書數(shù)據(jù)60中。
[0083]接下來,電子書數(shù)據(jù)輸出單元224輸出所生成的電子書數(shù)據(jù)60 (步驟S10)。
[0084]<閱讀器設(shè)備處的閱讀處理的概要>
[0085]描述在圖5所示的閱讀器設(shè)備4處閱讀電子書數(shù)據(jù)60的情況。首先,閱讀器設(shè)備4的通信單元44從服務(wù)器設(shè)備3獲得電子書數(shù)據(jù)60。可以從可移動的記錄介質(zhì)獲得電子書數(shù)據(jù)60。當(dāng)將顯示控制程序59封裝在電子書數(shù)據(jù)60中時,閱讀器設(shè)備4的控制單元41從電子書數(shù)據(jù)60中提取顯示控制程序59,并且通過遵循顯示控制程序59來執(zhí)行對頁面圖像51的顯示控制。
[0086]當(dāng)通過操作單元42的操作開始顯示控制程序59時,控制單元41使得顯示在圖7中所示的整個頁面圖像51。
[0087]圖12描繪了在控制單元41的控制下在閱讀器設(shè)備4的顯示單元43上顯示的電子書閱讀窗80。該示例中的電子書閱讀窗80設(shè)置有搜索詞輸入框82。
[0088]當(dāng)通過操作單元42的操作將搜索詞輸入到搜索詞輸入框82時,控制單元41使得突出顯示頁面圖像51的字符區(qū)域中的任何一個中的搜索詞84(與搜索詞輸入框82相對應(yīng)的字符區(qū)域中的字符串)。這里,突出顯示是具有以與要應(yīng)用于其他字符的模式不同的模式來突出顯示在字符區(qū)域中配置搜索詞的字符的顯示。存在各種突出顯示模式,例如,用與其他字符的顏色不同的顏色來顯示字符、比其他字符更明亮地顯示字符,提供灰度等級、在字符周圍顯示框等。
[0089]在圖13中對圖12的頁面圖像51中的附圖標(biāo)記86所表示的部分放大并描述。在該示例中,通過操作單元42輸入“可重排”作為搜索詞。在控制單元41的控制下,使字符區(qū)域中的搜索詞“可重排”被突出顯示。在該突出顯示中,當(dāng)搜索詞經(jīng)過不同的字符區(qū)域Tl和T2時,控制單元41基于與頁面圖像51相關(guān)聯(lián)的附加信息(諸如字符位置信息55和讀取順序信息53)來在字符區(qū)域Tl中突出顯示字符“重排”,并且在字符區(qū)域T2中突出顯示“可”。即,基于頁面圖像51的附加信息,通過遵循字符區(qū)域的讀取順序來使跨多個字符區(qū)域的搜索詞被突出顯示。
[0090]而且,當(dāng)通過操作單元42輸入用于在全顯示與重排顯示之間進(jìn)行切換的指令時,在控制單元41的控制下將圖12中所描繪的全顯示切換為在圖14中所描繪的重排顯示。在圖14的字符串中,“圖A”是非字符區(qū)域中的圖/表圖像的編號,并且對圖/表圖像(圖A)的超鏈接被設(shè)置為該“圖A”。當(dāng)利用操作單元42觸摸“圖A”時,如在圖15中所描述的顯示非字符區(qū)域中的圖A的圖像。
[0091]在上述實施例中,描述在電子書制作裝置2具有顯示控制程序生成單元220并且顯示控制程序59被并入到電子書數(shù)據(jù)60中的情況。然而,本發(fā)明并不局限于該示例。閱讀器設(shè)備4可以具有能夠基于對電子書數(shù)據(jù)60中的頁面圖像51添加的信息來搜索在頁面圖像中跨字符區(qū)域的字符串的搜索功能以及突出顯示跨通過搜索所找到的字符區(qū)域的字符串。此外,閱讀器設(shè)備4可以具有下述功能:該功能能夠通過閱讀器設(shè)備4在不改變字符區(qū)域、非字符區(qū)域和字符區(qū)域中的字符的布置的情況下顯示頁面圖像的全顯示的顯示模式(第一顯示模式)與通過改變字符區(qū)域中的字符的布置來重排顯示的顯示模式(第二顯示模式)之間進(jìn)行切換。
[0092]本發(fā)明不限于這里所述的示例以及在附圖中所述的示例,并且更不用說,在不脫離本發(fā)明的要旨的范圍之內(nèi)可做出各種設(shè)計變化和改進(jìn)。
【權(quán)利要求】
1.一種電子書制作裝置,包括: 圖像獲得單元,所述圖像獲得單元獲得表示布置字符區(qū)域和非字符區(qū)域的每頁單元的圖像的頁面圖像; 字符區(qū)域檢測單元,所述字符區(qū)域檢測單元檢測在所述圖像獲得單元所獲得的所述頁面圖像中的所述字符區(qū)域; 字符識別單元,所述字符識別單元識別所述字符區(qū)域檢測單元所檢測到的所述字符區(qū)域中的字符; 字符位置信息獲得單元,所述字符位置信息獲得單元針對在所述字符區(qū)域中所識別的所述字符中的每一個獲得指示所述頁面圖像中的所識別的字符的位置的字符位置信息; 讀取順序確定單元,所述讀取順序確定單元基于所述頁面圖像中的所述字符區(qū)域的位置以及所述頁面圖像中在所述字符區(qū)域之間的一個字符至另一字符的連續(xù)性來確定所述頁面圖像中的所述字符區(qū)域當(dāng)中的讀取順序; 電子書數(shù)據(jù)生成單元,所述電子書數(shù)據(jù)生成單元生成電子書數(shù)據(jù),所述電子書數(shù)據(jù)包括指示所識別的字符的字符信息、指示所述頁面圖像中的所識別的字符中的每一個的位置的所述字符位置信息、以及關(guān)于與所述頁面圖像中的所述字符區(qū)域當(dāng)中的所述讀取順序相對應(yīng)的字符或字符區(qū)域的順序信息;以及 電子書數(shù)據(jù)輸出單元,所述電子書數(shù)據(jù)輸出單元輸出所述電子書數(shù)據(jù)生成單元所生成的所述電子書數(shù)據(jù) 。
2.根據(jù)權(quán)利要求1所述的電子書制作裝置,進(jìn)一步包括顯示控制程序生成單元,所述顯示控制程序生成單元生成要由能夠顯示所述頁面圖像的閱讀器設(shè)備執(zhí)行的顯示控制程序,所述顯示控制程序具有基于添加到所述電子書數(shù)據(jù)中的所述頁面圖像的信息能夠搜索在所述字符區(qū)域的任何一個中的字符串以及在所述頁面圖像中跨字符區(qū)域上的字符串的搜索功能、以及能夠突出顯示通過所述搜索所找到的所述字符串的顯示功能,其中, 所述電子書數(shù)據(jù)生成單元將所述顯示控制程序并入到所述電子書數(shù)據(jù)中。
3.根據(jù)權(quán)利要求2所述的電子書制作裝置,其中, 所述顯示控制程序生成單元生成顯示控制程序,所述顯示控制程序具有通過所述閱讀器設(shè)備在第一顯示模式與第二顯示模式之間進(jìn)行切換的功能,所述第一顯示模式在不改變所述字符區(qū)域、所述非字符區(qū)域以及所述字符區(qū)域中的字符的布置的情況下顯示所述頁面圖像,所述第二顯示模式重排顯示所述字符區(qū)域中的字符。
4.根據(jù)權(quán)利要求1所述的電子書制作裝置,其中, 所述讀取順序確定單元基于所述頁面圖像中的所述字符區(qū)域的位置來初步地確定所述字符區(qū)域當(dāng)中的讀取順序,并且基于在所述頁面圖像中的所述字符區(qū)域之間的一個字符至另一字符的連續(xù)性來對所述頁面圖像中的所述字符區(qū)域當(dāng)中的所述讀取順序進(jìn)行校正。
5.根據(jù)權(quán)利要求1所述的電子書制作裝置,進(jìn)一步包括目錄表信息生成單元,所述目錄表信息生成單元生成目錄表信息,所述目錄表信息指示所述頁面圖像的每頁或每多頁的標(biāo)題與頁碼之間的對應(yīng)性,其中, 所述電子書數(shù)據(jù)生成單元將所述目錄表信息并入到所述電子書數(shù)據(jù)中。
6.根據(jù)權(quán)利要求1所述的電子書制作裝置,進(jìn)一步包括索引信息生成單元,所述索引信息生成單元生成索引信息,所述索引信息指示所述頁面圖像中的所述字符區(qū)域中的字符串與頁碼之間的對應(yīng)性,其中, 所述電子書數(shù)據(jù)生成單元將所述索引信息并入到所述電子書數(shù)據(jù)中。
7.根據(jù)權(quán)利要求1所述的電子書制作裝置,進(jìn)一步包括錨點設(shè)置單元,所述錨點設(shè)置單元對所述頁面圖像中的所述字符區(qū)域中的字符當(dāng)中的指示所述非字符區(qū)域中的任何一個中的部分圖像的字符設(shè)置用于將顯示切換為所述非字符區(qū)域中的部分圖像的錨點。
8.根據(jù)權(quán)利要求1所述的電子書制作裝置,進(jìn)一步包括翻譯信息生成單元,所述翻譯信息生成單元生成翻譯信息,所述翻譯信息是通過將指示由所述字符識別單元所識別的字符的字符信息翻譯成與所述字符信息的語言不同的語言來獲得的,其中, 所述電子書數(shù)據(jù)生成單元將所述翻譯信息并入到所述電子書數(shù)據(jù)中。
9.一種電子書系統(tǒng),所述電子書系統(tǒng)包括根據(jù)權(quán)利要求1至8中的任何一項所述的電子書制作裝置以及獲得從所 述電子書制作裝置輸出的所述電子書數(shù)據(jù)并且顯示所述電子書數(shù)據(jù)中的所述頁面圖像的閱讀器設(shè)備。
10.根據(jù)權(quán)利要求9所述的電子書系統(tǒng),其中,所述閱讀器設(shè)備具有基于添加到所述電子書數(shù)據(jù)中的所述頁面圖像的信息能夠搜索在所述字符區(qū)域中任何一個中的字符串和在所述頁面圖像中跨字符區(qū)域上的字符串的搜索功能以及能夠突出顯示通過所述搜索找到的所述字符串的顯示功能。
11.根據(jù)權(quán)利要求9所述的電子書系統(tǒng),其中,所述閱讀器設(shè)備具有通過所述閱讀器設(shè)備在第一顯示模式與第二顯示模式之間進(jìn)行切換的功能,所述第一顯示模式在不改變所述字符區(qū)域和所述非字符區(qū)域的布置以及所述字符區(qū)域中的字符的布置的情況下顯示所述頁面圖像,所述第二顯示模式通過改變所述字符區(qū)域中的字符的布置來重排顯示。
12.—種電子書制作方法,包括: 圖像獲得步驟,所述圖像獲得步驟獲得表示布置字符區(qū)域和非字符區(qū)域的每頁單元的圖像的頁面圖像; 字符區(qū)域檢測步驟,所述字符區(qū)域檢測步驟檢測在所述圖像獲得步驟中所獲得的所述頁面圖像中的所述字符區(qū)域; 字符識別步驟,所述字符識別步驟識別在所述字符區(qū)域檢測步驟中所檢測到的所述字符區(qū)域中的字符; 字符位置信息獲得步驟,所述字符位置信息獲得步驟針對在所述字符區(qū)域中識別的字符中的每一個來獲得指示所述頁面圖像中的所識別的字符的位置的字符位置信息; 讀取順序確定步驟,所述讀取順序確定步驟基于所述頁面圖像中的所述字符區(qū)域的位置以及所述頁面圖像中的所述字符區(qū)域之間的字符至字符的連續(xù)性來確定所述頁面圖像中的所述字符區(qū)域當(dāng)中的讀取順序; 電子書數(shù)據(jù)生成步驟,所述電子書數(shù)據(jù)生成步驟生成電子書數(shù)據(jù),所述電子書數(shù)據(jù)包括指示所識別的字符的字符信息、指示所述頁面圖像中的所識別的字符中的每一個的位置的字符位置信息、以及關(guān)于與所述頁面圖像中的所述字符區(qū)域當(dāng)中的所述讀取順序相對應(yīng)的字符或字符區(qū)域的順序信息;以及 電子書數(shù)據(jù)輸出步驟,所述電子書數(shù)據(jù)輸出步驟輸出在所述電子書數(shù)據(jù)生成步驟中所生成的所述電子書數(shù)據(jù)。
【文檔編號】G06F17/21GK104077270SQ201410126642
【公開日】2014年10月1日 申請日期:2014年3月31日 優(yōu)先權(quán)日:2013年3月29日
【發(fā)明者】寺橫素, 小椋繪理奈 申請人:富士膠片株式會社