圖像文檔命名的方法
【專利摘要】一種圖像文檔命名的方法,包括下列步驟:尋找初始掃描圖像數(shù)據(jù)中的關(guān)鍵詞字符串,以及辨認(rèn)排序在關(guān)鍵詞字符串之后的編碼字符串。建立對(duì)應(yīng)于初始掃描圖像數(shù)據(jù)的初始文檔,若在其中尋找到關(guān)鍵詞字符串,自動(dòng)按編碼字符串命名初始文檔的文件名。
【專利說明】圖像文檔命名的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種圖像文檔命名的方法,特別是一種依據(jù)圖像文檔的內(nèi)容自動(dòng)命名該圖像文檔的方法。
【背景技術(shù)】
[0002]在電子化的時(shí)代,文檔管理的作業(yè)采用圖像數(shù)據(jù)來儲(chǔ)存是不可避免的趨勢(shì),以減少紙本的庫存量及紙本容易損毀的風(fēng)險(xiǎn)。將紙本的數(shù)據(jù)電子化之后,可以保存文稿來往的記錄、建立電子文檔,以利于文稿歸檔及查詢。但是,為了將大量的文稿輸進(jìn)計(jì)算機(jī)并分類、歸檔命名,常常耗掉相當(dāng)大的人力與成本。傳統(tǒng)的掃描儀掃描多個(gè)文稿,可以將每頁掃描圖像數(shù)據(jù)各自建立一個(gè)文檔,或是將所有圖像數(shù)據(jù)合并成一個(gè)文檔。無論是哪一種,對(duì)使用者而言都并不方便。前者須檢查文檔后重新命名,后者須自行分割文檔。其手續(xù)既繁瑣又沒有效率。
[0003]為了解決這個(gè)問題,就有自動(dòng)歸檔的概念出現(xiàn)。例如,當(dāng)有一疊文稿準(zhǔn)備掃描時(shí),先在文稿中預(yù)定分檔的地方安插空白頁、特定顏色頁、或貼上條形碼(barcode)等。當(dāng)掃描儀掃到空白頁、特定顏色頁、或條形碼,則將已掃描的復(fù)數(shù)圖像數(shù)據(jù)合并成一個(gè)獨(dú)立的文檔。然而,這樣的歸檔方式只是為了快速進(jìn)行分檔,并無法根據(jù)文稿上的文字為文檔命名,也無法判斷哪些圖像數(shù)據(jù)為彼此相關(guān)。因此還是需要逐一檢查圖像數(shù)據(jù)的內(nèi)容并重新給予一個(gè)新的文件名。
【發(fā)明內(nèi)容】
[0004]本發(fā)明是有關(guān)于一種圖像文檔命名的方法,其通過尋找掃描圖像數(shù)據(jù)中的關(guān)鍵詞字符串以及辨認(rèn)排序在關(guān)鍵詞字符串之后的編碼字符串,以建立文檔,并且自動(dòng)按編碼字符串為該文檔命名。
[0005]根據(jù)本發(fā)明的一個(gè)方面,提出一種圖像文檔命名的方法,包括下列步驟:尋找初始掃描圖像數(shù)據(jù)中的關(guān)鍵詞字符串,以及辨認(rèn)排序在關(guān)鍵詞字符串之后的編碼字符串。建立對(duì)應(yīng)于初始掃描圖像數(shù)據(jù)的初始文檔,若在其中尋找到關(guān)鍵詞字符串,自動(dòng)按編碼字符串命名初始文檔的文件名。
[0006]為了對(duì)本發(fā)明的上述及其他方面有更佳的了解,下文特舉較佳實(shí)施例,并結(jié)合附圖,作詳細(xì)說明如下。
【專利附圖】
【附圖說明】
[0007]圖1為依照本發(fā)明第一實(shí)施例的圖像文檔命名的方法中各個(gè)步驟的方法流程圖;
[0008]圖2為依照本發(fā)明第二實(shí)施例的圖像文檔命名的方法中各個(gè)步驟的方法流程圖;
[0009]圖3為依照本發(fā)明第三實(shí)施例的圖像文檔命名的方法中各個(gè)步驟的方法流程圖;
[0010]圖4為依照本發(fā)明第四實(shí)施例的圖像文檔命名的方法中各個(gè)步驟的方法流程圖;
[0011]圖5A?5E為應(yīng)用上述圖像文檔命名的方法的圖像數(shù)據(jù)的示意圖。
[0012]符號(hào)說明
[0013]101 ?103、201 ?208、301 ?308、401 ?403:各個(gè)步驟
[0014]Dl?D4:掃描圖像數(shù)據(jù)
[0015]001、002:編碼字符串
【具體實(shí)施方式】
[0016]本發(fā)明的圖像文檔命名的方法,是用于圖像數(shù)據(jù)的歸檔及管理。當(dāng)一疊文稿掃描后,在掃描圖像數(shù)據(jù)中尋找關(guān)鍵詞字符串,并以關(guān)鍵詞字符串之后的編碼字符串建立文檔,自動(dòng)以該編碼字符串為該文檔命名。例如:有一疊文稿依序帶有以下字符串:報(bào)價(jià)單編號(hào)001、報(bào)價(jià)單編號(hào)002、報(bào)價(jià)單編號(hào)003,則指定“報(bào)價(jià)單編號(hào)”為關(guān)鍵詞字符串,而這疊文稿對(duì)應(yīng)的掃描圖像數(shù)據(jù)所建立的文檔會(huì)被自動(dòng)命名為001、002、003。但是,依據(jù)編碼字符串來命名,不限于只完全依照編碼字符串,也可以以該編碼字符串為基礎(chǔ)而有其他變化。例如:編碼字符串為001,文件名可以為001-1、PR-OO1、報(bào)價(jià)單001等等諸多變化。
[0017]尋找關(guān)鍵詞字符串并依據(jù)其后的編碼字符串的優(yōu)點(diǎn)是,用戶可以很容易了解這些文檔的內(nèi)容,并且不需要額外花費(fèi)時(shí)間重新命名。例如有一疊性質(zhì)類似但是分屬不同案件的紙本報(bào)價(jià)單經(jīng)掃描后形成掃描圖像數(shù)據(jù),這些報(bào)價(jià)單的掃描圖像數(shù)據(jù)具有相同的關(guān)鍵詞字符串(例如:報(bào)價(jià)單編號(hào)),其關(guān)鍵詞字符串后的編碼字符串為案件編號(hào),則使用本發(fā)明的方法即可快速建立一系列的文檔并自動(dòng)依據(jù)案件編號(hào)為每一份圖像數(shù)據(jù)命名。
[0018]以下對(duì)提出實(shí)施例進(jìn)行詳細(xì)說明,實(shí)施例僅用以作為范例說明,并非用以限縮本發(fā)明的保護(hù)范圍。下列實(shí)施例雖主要以掃描儀產(chǎn)生的掃描圖像數(shù)據(jù)為例,但不限定以掃描儀掃描文稿,任何文稿的圖像數(shù)據(jù)只要能通過計(jì)算機(jī)軟件辨識(shí)、編輯,就可利用本發(fā)明的圖像數(shù)據(jù)的命名方法來進(jìn)行,例如利用數(shù)碼相機(jī)拍攝文稿。另外為方便理解,實(shí)施例提到的“文稿”指的是實(shí)體紙本文稿,“文檔”指的是實(shí)體文稿經(jīng)掃描后形成的電子文檔。
[0019]請(qǐng)參照?qǐng)D1,為依照本發(fā)明第一實(shí)施例的圖像文檔命名的方法中各個(gè)步驟的方法流程圖。在步驟101中,尋找初始掃描圖像數(shù)據(jù)中的關(guān)鍵詞字符串,以及辨認(rèn)排序在關(guān)鍵詞字符串之后的編碼字符串。例如初始掃描圖像數(shù)據(jù)中有一段文字為報(bào)價(jià)單編號(hào)001,若“報(bào)價(jià)單編號(hào)”為關(guān)鍵詞,則001為其編碼字符串。在步驟102中,建立對(duì)應(yīng)于初始掃描圖像數(shù)據(jù)的初始文檔。初始文檔可以例如是searchable PDF或.rtf等具有文字形式格式的電子文檔,但并不局限于此。在步驟101中,若尋找到關(guān)鍵詞字符串,則進(jìn)行步驟103,自動(dòng)按編碼字符串命名初始文檔的文件名。文件名不限于完全依照編碼字符串,也可以以該編碼字符串為基礎(chǔ)而有其他變化。例如:編碼字符串為001,文件名可以為001-1、PR-001、報(bào)價(jià)單001等等。
[0020]本發(fā)明又提出第二實(shí)施例。請(qǐng)參照?qǐng)D2,為依照本發(fā)明第二實(shí)施例的圖像文檔命名的方法中各個(gè)步驟的方法流程圖,包括步驟201?208,其中步驟201、202與第一實(shí)施例的步驟101、102相同。在步驟203中,本發(fā)明還包括尋找第二掃描圖像數(shù)據(jù)中的關(guān)鍵詞字符串,以及辨認(rèn)排序在關(guān)鍵詞字符串之后的第二編碼字符串。第二掃描圖像數(shù)據(jù)為接續(xù)在初始掃描圖像數(shù)據(jù)后的另一份掃描圖像數(shù)據(jù)。在步驟204中,若在第二掃描圖像數(shù)據(jù)中尋找到關(guān)鍵詞字符串,且第二編碼字符串經(jīng)步驟206的辨認(rèn)與步驟201中初始掃描圖像數(shù)據(jù)的編碼字符串不相同,則進(jìn)行步驟207,建立對(duì)應(yīng)于第二掃描圖像數(shù)據(jù)的第二文檔,并且自動(dòng)按第二編碼字符串命名第二文檔的文件名。第二文檔的文件名可依照初始文檔的命名方法,以形成一系列的文檔。舉例來說,初始掃描圖像數(shù)據(jù)與第二掃描圖像數(shù)據(jù)的編碼字符串分別為001、002,若初始文件名訂為001-1,則第二文件名訂為002-1 ;若初始文件名訂為報(bào)價(jià)單001,則第二文件名訂為報(bào)價(jià)單002。依照此方法,一疊具有關(guān)鍵詞的多個(gè)文件經(jīng)掃描后可依序自動(dòng)地建立文檔并命名。
[0021]請(qǐng)?jiān)賲⒄請(qǐng)D2,在步驟204中,若在第二掃描圖像數(shù)據(jù)中尋找到關(guān)鍵詞字符串,且第二編碼字符串經(jīng)步驟206的辨認(rèn)與步驟201中初始掃描圖像數(shù)據(jù)的編碼字符串相同,則進(jìn)行步驟208,附加第二掃描圖像數(shù)據(jù)至初始文檔,而不是產(chǎn)生獨(dú)立的第二文檔。例如,初始文檔原為包含初始掃描圖像數(shù)據(jù)的PDF格式文檔,共一頁;當(dāng)?shù)诙呙鑸D像數(shù)據(jù)被附加至該初始文檔后,初始掃描圖像數(shù)據(jù)與第二掃描圖像數(shù)據(jù)分別為該TOF的第一頁與第二頁。若在第二掃描圖像數(shù)據(jù)后的第三掃描圖像數(shù)據(jù),也同樣具有與初始掃描圖像數(shù)據(jù)相同的關(guān)鍵詞與編碼字符串,則繼續(xù)附加至初始文檔,形成第三頁,直到下一份掃描圖像數(shù)據(jù)的編碼字符串與初始掃描圖像的編碼字符串不同,而建立新的文檔。
[0022]請(qǐng)繼續(xù)參照?qǐng)D2,在步驟203中,尋找第二掃描圖像數(shù)據(jù)中的關(guān)鍵詞字符串,以及辨認(rèn)排序在關(guān)鍵詞字符串之后的第二編碼字符串。在步驟204中,若在第二掃描圖像數(shù)據(jù)中未尋找到關(guān)鍵詞字符串,則進(jìn)行步驟205,附加第二掃描圖像數(shù)據(jù)至初始文檔,而合并成同一文檔。并且,此未包含關(guān)鍵詞字符串的第二掃描圖像數(shù)據(jù),為接續(xù)初始掃描圖像數(shù)據(jù)所產(chǎn)生的掃描圖像數(shù)據(jù)。也就是說,初始掃描圖像數(shù)據(jù)與第二掃描圖像數(shù)據(jù),是在一次掃描復(fù)數(shù)文稿的掃描過程中,分別為第一份文稿與接續(xù)的第二份文稿所產(chǎn)生的掃描圖像數(shù)據(jù)。該掃描過程通常是在饋紙式掃描儀中執(zhí)行。初始掃描圖像數(shù)據(jù)具有關(guān)鍵詞字符串而第二掃描圖像數(shù)據(jù)沒有,此情形例如發(fā)生在掃描主文稿與其未含關(guān)鍵詞的附件。
[0023]本發(fā)明又提出第三實(shí)施例,為依照本發(fā)明第三實(shí)施例的圖像文檔命名的方法中各個(gè)步驟的方法流程圖。請(qǐng)參照?qǐng)D3,第三實(shí)施例的步驟301?307與第二實(shí)施例的步驟201?207完全相同,其差別為步驟308。在步驟304中,若在第二掃描圖像數(shù)據(jù)中尋找到關(guān)鍵詞字符串,且第二編碼字符串經(jīng)步驟306的辨認(rèn)與初始掃描圖像數(shù)據(jù)的編碼字符串相同,則進(jìn)行步驟308,建立對(duì)應(yīng)于第二掃描圖像數(shù)據(jù)的補(bǔ)充文檔,該補(bǔ)充文檔為對(duì)初始文檔的補(bǔ)充,并且自動(dòng)按初始文檔的文件名命名補(bǔ)充文檔的文件名。
[0024]較佳地,補(bǔ)充文檔跟初始文檔具有相似的文件名,并可以有一定的命名規(guī)則。例如:初始文檔為“001”,補(bǔ)充文檔可以為“001-1”、“ΟΟΙ-a”。初始文檔為“001-1”,補(bǔ)充文檔可以為“001-2”等等諸多變化。若在第二掃描圖像數(shù)據(jù)后的第三掃描圖像數(shù)據(jù),也同樣具有與初始掃描圖像數(shù)據(jù)相同的關(guān)鍵詞字符串與編碼字符串,則按照相同的命名規(guī)則繼續(xù)建立補(bǔ)充文檔,如001-3、001-c等等。這些與初始文檔具有相似文件名的補(bǔ)充文檔,除了可與其它文檔并列存放,也可視為以初始文檔為主的一個(gè)群組,而與初始文檔一起被存放至另一個(gè)文件夾中,該文件夾可以以該編碼字符串命名名稱。
[0025]本發(fā)明又提出第四實(shí)施例。請(qǐng)參照?qǐng)D4,為依照本發(fā)明第四實(shí)施例的圖像文檔命名的方法流程圖,包括步驟401?403。在步驟401中,接收關(guān)鍵詞設(shè)定指示。關(guān)鍵詞設(shè)定例如顯示在用戶操作接口上,以供用戶在該用戶操作接口上設(shè)定尋找關(guān)鍵詞的指示。用戶操作接口可以是掃描儀或事務(wù)機(jī)上的顯示屏幕與輸入設(shè)備,或是一臺(tái)連接到掃描儀的計(jì)算機(jī),用戶利用計(jì)算機(jī)上的軟件操作、指示掃描儀。在步驟402中,依據(jù)關(guān)鍵詞設(shè)定指示,尋找初始掃描圖像數(shù)據(jù)中的關(guān)鍵詞字符串。例如:利用光學(xué)字符識(shí)別(Optical characterrecognit1n, OCR)或智能字符識(shí)別(Intelligent character recognit1n, ICR)等方式尋找關(guān)鍵詞字符串。在步驟402中,若尋找到關(guān)鍵詞字符串,則進(jìn)行步驟403,自動(dòng)按編碼字符串命名初始文檔的文檔名。
[0026]在步驟401中,關(guān)鍵詞設(shè)定指示可以由用戶輸入要指定的關(guān)鍵詞。也可以由掃描儀先產(chǎn)生初始掃描圖像數(shù)據(jù)并顯示在屏幕上,用戶再經(jīng)由屏幕觸控或鼠標(biāo)、光標(biāo)等方式選擇關(guān)鍵詞。也可以在掃描儀產(chǎn)生最少兩份掃描圖像數(shù)據(jù)后,自動(dòng)比對(duì)并提供選單以建議用戶可選擇的關(guān)鍵詞。但本發(fā)明并不僅限于以上方法。
[0027]請(qǐng)參照?qǐng)D5A?5E,為應(yīng)用上述圖像文檔命名的方法的圖像數(shù)據(jù)的示意圖。圖中所示的建立的文檔以TOF的格式為例,實(shí)際上本發(fā)明并不僅限于此。在圖5A中,Dl可做為初始掃描圖像數(shù)據(jù),其具有關(guān)鍵詞字符串“報(bào)價(jià)單編號(hào)”以及位于關(guān)鍵詞字符串之后的編碼字符串001。依照第一實(shí)施例的命名方式,初始掃描圖像數(shù)據(jù)Dl建立的初始文件名可為001、PR-001、報(bào)價(jià)單001等等。在圖5B中,D2為相對(duì)于Dl的第二掃描圖像數(shù)據(jù),其具有關(guān)鍵詞字符串“報(bào)價(jià)單編號(hào)”以及位于關(guān)鍵詞字符串之后的編碼字符串002。依照第二實(shí)施例(步驟207)的命名方式,第二掃描圖像數(shù)據(jù)D2的編碼字符串002與初始掃描圖像數(shù)據(jù)Dl的編碼字符串001不相同,第二掃描圖像數(shù)據(jù)D2建立的第二文件名可為002、PR-002、報(bào)價(jià)單002等等。
[0028]在圖5C中,D3為相對(duì)于Dl的第二掃描圖像數(shù)據(jù),例如為附屬于報(bào)價(jià)單的請(qǐng)款單。因此此請(qǐng)款單也會(huì)記載關(guān)鍵詞字符串“報(bào)價(jià)單編號(hào)”以及位于關(guān)鍵詞字符串之后的編碼字符串001。依照第二實(shí)施例(步驟208)的命名方式,第二掃描圖像數(shù)據(jù)D3的編碼字符串001與初始掃描圖像數(shù)據(jù)Dl的編碼字符串001相同,第二掃描圖像數(shù)據(jù)D3可附加至初始文檔。或是,如圖所示,依照第三實(shí)施例(步驟308)的命名方式,第二掃描圖像數(shù)據(jù)D3的編碼字符串001與初始掃描圖像數(shù)據(jù)Dl的編碼字符串001相同,第二掃描圖像數(shù)據(jù)D3可建立補(bǔ)充文檔,其文件名可為001-l、001-a等等諸多變化。在圖中,初始文檔與補(bǔ)充文檔可與其他文檔并列存放,也可視為相關(guān)的群組而另存放在同一文件夾中,該文件夾可以以編碼字符串001命名名稱。
[0029]在圖5E中,D4為接續(xù)初始掃描圖像數(shù)據(jù)產(chǎn)生的掃描圖像數(shù)據(jù),其未包含關(guān)鍵詞字符串。若D4是在初始掃描圖像數(shù)據(jù)Dl之后接續(xù)掃描的下一份圖像數(shù)據(jù),依照第二實(shí)施例(步驟205)的命名方式,將掃描圖像數(shù)據(jù)D4附加至初始文檔,而合并成同一文檔。若D4是在掃描圖像數(shù)據(jù)D3之后接續(xù)掃描的下一份圖像數(shù)據(jù),因?yàn)閽呙鑸D像數(shù)據(jù)D3被并入初始掃描圖像數(shù)據(jù)D1,或建立補(bǔ)充文檔,因此掃描圖像數(shù)據(jù)D4仍然附加至初始文檔,而合并成同一文檔。
[0030]若D4不是在掃描圖像數(shù)據(jù)Dl或D3之后接續(xù)掃描的下一份圖像數(shù)據(jù),而是在掃描圖像數(shù)據(jù)D2之后,可將掃描圖像數(shù)據(jù)D4附加至第二文檔,而合并成同一文檔。
[0031]本發(fā)明上述實(shí)施例所公開的圖像文檔命名的方法,是用于圖像數(shù)據(jù)的歸檔及管理,可自動(dòng)為具有關(guān)鍵詞字符串的圖像數(shù)據(jù)建立文檔,且相關(guān)的文稿可并為同一個(gè)文檔或建立補(bǔ)充文檔,不需在文稿中安插空白頁、特定顏色頁或貼上條形碼。且從文件名中可直接辨別該文檔中所存放的圖像數(shù)據(jù)內(nèi)容,以利于后續(xù)文檔的管理。
[0032]綜上所述,雖然本發(fā)明例舉了以上較佳實(shí)施例,然其并非用以限定本發(fā)明。本發(fā)明所屬【技術(shù)領(lǐng)域】的技術(shù)人員,在不脫離本發(fā)明的宗旨和范圍內(nèi),可作各種變化和修改。因此,本發(fā)明保護(hù)范圍當(dāng)以權(quán)利要求書要求保護(hù)的范圍為準(zhǔn)。
【權(quán)利要求】
1.一種圖像文檔命名的方法,其特征在于,包括: 尋找初始掃描圖像數(shù)據(jù)中的關(guān)鍵詞字符串,以及辨認(rèn)排序在所述關(guān)鍵詞字符串之后的編碼字符串;以及 建立對(duì)應(yīng)于該初始掃描圖像數(shù)據(jù)的初始文檔,若在其中尋找到所述關(guān)鍵詞字符串,自動(dòng)按所述編碼字符串命名所述初始文檔的文件名。
2.如權(quán)利要求1所述的圖像文檔命名的方法,其特征在于,還包括: 尋找第二掃描圖像數(shù)據(jù)中的所述關(guān)鍵詞字符串,以及辨認(rèn)排序于所述關(guān)鍵詞字符串之后的第二編碼字符串;以及 若尋找到所述關(guān)鍵詞字符串,且所述第二編碼字符串經(jīng)辨認(rèn)與所述編碼字符串不相同,建立對(duì)應(yīng)于所述第二掃描圖像數(shù)據(jù)的第二文檔,并且自動(dòng)按所述第二編碼字符串命名所述第二文檔之文件名。
3.如權(quán)利要求2所述的圖像文檔命名的方法,其特征在于,還包括: 若尋找到所述關(guān)鍵詞字符串,且所述第二編碼字符串經(jīng)辨認(rèn)與所述編碼字符串相同,附加所述第二掃描圖像數(shù)據(jù)至所述初始文檔。
4.如權(quán)利要求2所述的圖像文檔命名的方法,其特征在于,還包括: 若尋找到所述關(guān)鍵詞字符串,且所述第二編碼字符串經(jīng)辨認(rèn)與所述編碼字符串相同,建立對(duì)應(yīng)于所述第二掃描圖像數(shù)據(jù)的補(bǔ)充文檔,并且自動(dòng)按所述初始文檔之文件名命名所述補(bǔ)充文檔的文件名。
5.如權(quán)利要求1所述的圖像文檔命名的方法,其特征在于,還包括: 尋找第二掃描圖像數(shù)據(jù)中的所述關(guān)鍵詞字符串;以及 若未尋找到所述關(guān)鍵詞字符串,附加所述第二掃描圖像數(shù)據(jù)至所述初始文檔。
6.如權(quán)利要求5所述的圖像文檔命名的方法,其特征在于,所述第二掃描圖像數(shù)據(jù)為接續(xù)所述初始掃描圖像數(shù)據(jù)產(chǎn)生的掃描圖像數(shù)據(jù)。
7.如權(quán)利要求1所述的圖像文檔命名的方法,其特征在于,還包括: 接收關(guān)鍵詞設(shè)定指不;以及 依據(jù)該關(guān)鍵詞設(shè)定指示,尋找所述初始掃描圖像數(shù)據(jù)中的所述關(guān)鍵詞字符串。
【文檔編號(hào)】G06F17/30GK104346415SQ201310447566
【公開日】2015年2月11日 申請(qǐng)日期:2013年9月26日 優(yōu)先權(quán)日:2013年8月8日
【發(fā)明者】廖俊杰 申請(qǐng)人:虹光精密工業(yè)股份有限公司