文檔管理裝置以及文檔管理方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及對字符串添加注釋的文檔管理裝置以及文檔管理方法。
【背景技術(shù)】
[0002]在國語及外語的學(xué)習(xí)當(dāng)中,泛讀被當(dāng)作有效的手段之一。而且目前為了學(xué)習(xí),能夠從互聯(lián)網(wǎng)等處獲取很多文章來進(jìn)行閱讀。
[0003]但是,從互聯(lián)網(wǎng)處獲取的文章等并不是以特定水平的學(xué)習(xí)者為對象而創(chuàng)建的文章。因而,這樣并不能稱為適于語言學(xué)習(xí)。
[0004]因此,例如在某種典型的技術(shù)中,按照英語的每個(gè)單詞或短語、表達(dá)來添加屬性。如果是用戶已學(xué)習(xí)過的,則添加“已學(xué)習(xí)”屬性,如果是下一個(gè)應(yīng)學(xué)習(xí)的,則添加“正在學(xué)習(xí)”屬性。而且,在將獲取到的英文轉(zhuǎn)換為淺顯的英文時(shí),若轉(zhuǎn)換為以學(xué)習(xí)為目的的英文時(shí),則使用“已學(xué)習(xí)”和“正在學(xué)習(xí)”這兩個(gè)詞語來進(jìn)行轉(zhuǎn)換。此外,若轉(zhuǎn)換為以理解內(nèi)容為目的的英文時(shí),則僅使用“已學(xué)習(xí)”這一個(gè)詞語來進(jìn)行轉(zhuǎn)換。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的實(shí)施方式所涉及的文檔管理裝置包括讀取部、存儲部以及控制部。所述讀取部從原稿中讀取字符串。所述控制部,在對字符串進(jìn)行登記的字符串登記模式下,使所述讀取部讀取所述原稿,對讀取出的所述字符串進(jìn)行檢測,利用詞典對檢測出的字符串的注釋進(jìn)行檢索,將所述檢測出的字符串與檢索出的注釋相互建立關(guān)聯(lián)并使所述存儲部進(jìn)行存儲。
[0006]本發(fā)明的實(shí)施方式所涉及的文檔管理方法包括:(i)通過讀取部,從原稿中讀取字符串;(ii)通過控制部,在對字符串進(jìn)行登記的字符串登記模式下,使所述讀取部讀取所述原稿,對讀取出的所述字符串進(jìn)行檢測,利用詞典對檢測出的字符串的注釋進(jìn)行檢索,將所述檢測出的字符串與檢索出的注釋相互建立關(guān)聯(lián);(iii)通過存儲部,對建立了關(guān)聯(lián)的所述檢測出的字符串與所述檢索出的注釋進(jìn)行存儲。
【附圖說明】
[0007]圖1示出本發(fā)明的第一實(shí)施方式所涉及的文檔管理裝置的概要。
[0008]圖2示出第一實(shí)施方式所涉及的文檔管理裝置的一般性結(jié)構(gòu)。
[0009]圖3示出將第一實(shí)施方式所涉及的文檔管理裝置實(shí)現(xiàn)為圖像形成裝置時(shí)的結(jié)構(gòu)。
[0010]圖4示出利用以圖像形成裝置為中心的客戶端-服務(wù)器型的文檔管理系統(tǒng)來實(shí)現(xiàn)第一實(shí)施方式所涉及的文檔管理裝置時(shí)的結(jié)構(gòu)。
[0011]圖5示出第一實(shí)施方式所涉及的字符串登記模式下的處理流程。
[0012]圖6示出在第一實(shí)施方式所涉及的登記于存儲部中的信息的例子。
[0013]圖7示出在第一實(shí)施方式所涉及的文章輸出模式下,用戶對成為對欲插入注釋的字符串進(jìn)行選擇的基準(zhǔn)的用戶標(biāo)識符及用戶屬性進(jìn)行指定的方法的例子。
[0014]圖8示出第一實(shí)施方式所涉及的文章輸出模式下的處理流程。
[0015]圖9示出在第一實(shí)施方式中,在所獲取的文章中插入表示與用戶所指定的用戶標(biāo)識符或用戶屬性相對應(yīng)的字符串的含義的字符串(注釋)的例子。
[0016]圖10示出在第二實(shí)施方式所涉及的存儲于存儲部中的信息的例子。
[0017]圖11示出第二實(shí)施方式所涉及的文章輸出模式下的處理流程。
【具體實(shí)施方式】
[0018]以下參考附圖對本發(fā)明的各實(shí)施方式進(jìn)行說明。
[0019]第一實(shí)施方式
[0020]圖1是用于對本發(fā)明的第一實(shí)施方式所涉及的文檔管理裝置的概要進(jìn)行說明的圖。
[0021]如圖1所示,本發(fā)明的第一實(shí)施方式所涉及的文檔管理裝置在字符串登記模式和文章輸出模式這兩個(gè)模式下進(jìn)行工作。
[0022]在字符串登記模式下,用戶不明白含義的字符串等希望為該字符串添加注釋的字符串被登記到文檔管理裝置中。登記是在寫有希望登記的字符串的紙質(zhì)原稿上利用例如為希望登記的字符串加下劃線等方法來進(jìn)行。
[0023]在圖1的例子中,當(dāng)由于不明白寫在紙質(zhì)原稿上的“身在法隆寺,啖柿聽鐘鳴”這一文章中的“鐘”的含義因而希望添加注釋時(shí),用戶在“鐘”下劃線,并使其被文檔管理裝置讀入。
[0024]如此,用戶對于不明白的字符串等希望添加注釋的字符串,通過對紙質(zhì)原稿的字符串進(jìn)行標(biāo)記,從而能夠簡單地將其登記到文檔管理裝置中。
[0025]文檔管理裝置讀入“鐘”并利用詞典進(jìn)行檢索以獲取注釋,該注釋是表示“用于敲響的器具”這樣含義的字符串。
[0026]接著,在文章輸出模式下,如圖1所示,文檔管理裝置從用戶處獲取成為欲輸出的文章的基礎(chǔ)的文本數(shù)據(jù)。該文本數(shù)據(jù)不限于在字符串登記模式下讀入的原稿而為任意的文早。
[0027]由于在文檔管理裝置中登記有“鐘”,因此在文本數(shù)據(jù)的“鐘”之后,作為“鐘”的注釋的“用于敲響的器具”這一字符串被插入。插入注釋后的文章通過顯示裝置的顯示或打印裝置的打印而被提示給用戶。
[0028]如此,用戶能夠簡單地在欲輸出的文章中插入所登記的字符串的注釋。
[0029]以上對本發(fā)明的第一實(shí)施方式所涉及的文檔管理裝置的概要進(jìn)行了說明。
[0030]下面對本發(fā)明的第一實(shí)施方式所涉及的文檔管理裝置的結(jié)構(gòu)進(jìn)行說明。另外,在下文中,首先對文檔管理裝置的一般性結(jié)構(gòu)進(jìn)行說明。然后,對將文檔管理裝置實(shí)現(xiàn)為一個(gè)復(fù)合機(jī)(MFP,Multifunct1n Peripheral)的實(shí)施方式的結(jié)構(gòu)進(jìn)行說明。進(jìn)一步地,還對以經(jīng)由網(wǎng)絡(luò)的客戶端-服務(wù)器型的結(jié)構(gòu)來實(shí)現(xiàn)文檔管理裝置時(shí)的結(jié)構(gòu)進(jìn)行說明。
[0031]圖2是示出文檔管理裝置I的結(jié)構(gòu)的結(jié)構(gòu)圖。文檔管理裝置I包括:掃描儀2、信息處理裝置3以及輸出裝置9。
[0032]掃描儀2在字符串登記模式下讀入原稿,且在文章輸出模式下讀入欲輸出的文早。
[0033]輸出裝置9是顯示器等顯示裝置、打印機(jī)等打印裝置、用于向網(wǎng)絡(luò)上的外部設(shè)備發(fā)送數(shù)據(jù)的網(wǎng)絡(luò)設(shè)備等。輸出裝置9用于輸出已插入注釋后的文章。
[0034]信息處理裝置3可以使用一般的計(jì)算機(jī)來實(shí)現(xiàn)。信息處理裝置3包括:存儲部5、輸入部6、控制部7以及詞典8。
[0035]存儲部5對用戶登記的字符串及表示其含義的字符串、用戶標(biāo)識符(后述)、用戶屬性(后述)等進(jìn)行存儲。
[0036]輸入部6接收用戶對用戶標(biāo)識符及用戶屬性的輸入。
[0037]詞典8登記有大量的字符串以及用于表示其含義的字符串即注釋。
[0038]控制部7具有:0CR(0pticalCharacter Recognit1n,光學(xué)字符識別)處理部7a、輸入控制部7b、讀取控制部7c、檢測部7d、檢索部7e、存儲控制部7f、文章接收部7g、屬性獲取部7h、屬性對照部71、字符串選擇部7j以及輸出控制部7k??刂撇?執(zhí)行上述兩種模式下的處理。
[0039]OCR處理部7a從利用掃描儀2讀入的原稿的圖像數(shù)據(jù)中識別出文字,并生成電子文本數(shù)據(jù)。另外,掃描儀2和OCR處理部7a合在一起相當(dāng)于讀取部。
[0040]輸入控制部7b對輸入部6進(jìn)行控制。輸入控制部7b在字符串登記模式下使輸入部6接收對字符串進(jìn)行登記的用戶(登記者)的屬性。輸入控制部7b在文章輸出模式下使輸入部6接收欲將文章輸出的用戶(輸出者)的屬性。
[0041]讀取控制部7c在字符串登記模式下使掃描儀2讀取已標(biāo)記出欲登記的字符串的原稿。
[0042]檢測部7d根據(jù)從原稿中讀取出的標(biāo)記的位置,檢測出為了添加注釋而登記的字符串。
[0043]檢索部7e利用詞典8對通過檢測部7d檢測出的字符串進(jìn)行檢索。
[0044]存儲控制部7f將從原稿中檢測出的字符串、利用詞典8檢索出的注釋、以及對字符串進(jìn)行登記的用戶的屬性相互建立關(guān)聯(lián)并使存儲部5進(jìn)行存儲。
[0045]文章接收部7g在文章輸出模式下接收用戶欲輸出的文章。另外,文章接收部7g也可以使輸入部6接收欲輸出的文章。
[0046]屬性獲取部7h根據(jù)為了進(jìn)行輸出而接收的文章的文件信息,獲取所接收的文章的作者的屬性。
[0047]屬性對照部7i對欲將文章輸出的用戶的屬性、屬性獲取部7h所獲取的文章的作者的屬性、以及登記了字符串的用戶的屬性進(jìn)行對照。
[0048]字符串選擇部7 j根據(jù)屬性對照部7i的對照結(jié)果,從存儲部5所存儲的字符串中選擇出在欲輸出的文章中所包含的字符串中欲插入注釋的字符串。
[0049]輸出控制部7k使通過字符串選擇部7j選擇出的字符串的注釋與欲輸出的文章內(nèi)的字符串相對應(yīng),并與文章一起輸出到輸出裝置9。
[0050]以上即為文檔管理裝置I的一般性的結(jié)構(gòu)。
[0051]下面對將文檔管理裝置實(shí)現(xiàn)為圖像形成裝置時(shí)的結(jié)構(gòu)進(jìn)行說明。圖3是將文檔管理裝置實(shí)現(xiàn)為圖像形成裝置10時(shí)的結(jié)構(gòu)圖。
[0052]圖像形成裝置10具備控制部11。控制部11由中央處理器(CPU,CentralProcessing Unit)、隨機(jī)存取存儲器(RAM,Random Access Memory)、只讀存儲器(ROM,ReadOnly Memory)以及專用的硬件電路等構(gòu)成,負(fù)責(zé)圖像形成裝置10的整體的動作控制。
[0053]控制部11與圖像讀取部12、圖像處理部13、圖像存儲器14、圖