專利名稱:數(shù)碼照片面掃描方法及裝置的制作方法
技術(shù)領(lǐng)域:
該發(fā)明是一種可對文稿進(jìn)行掃描整理的數(shù)碼照片面掃描方法及裝置,是應(yīng)用在數(shù)碼圖像領(lǐng)域。
背景技術(shù):
現(xiàn)在的辦公與文檔處理,掃描儀是一個(gè)重要的外部輸入設(shè)備,它可以將文檔、照片、表格等我們需要的東西掃描并以圖像格式存儲在計(jì)算機(jī)內(nèi),但是現(xiàn)有的掃描儀體積較大,一般情況體積都比A4幅面的標(biāo)準(zhǔn)規(guī)格還要大一些,并且掃描的速度比較慢,在一般條件下,每分鐘只能夠掃描幾張文稿,所以,雖然現(xiàn)在的掃描儀很便宜,但并不是每一臺計(jì)算機(jī)都配套有掃描儀。
同時(shí),隨著數(shù)碼設(shè)備的日益完善和普及,原有的膠片相機(jī)已經(jīng)應(yīng)用的越來越少了,數(shù)碼相機(jī)已經(jīng)成為普通消費(fèi)者首選的用來獲取照片的設(shè)備,再加上近二年拍照手機(jī)的出現(xiàn),為數(shù)碼照片帶來更多的應(yīng)用,現(xiàn)在數(shù)碼相機(jī)和拍照手機(jī)的擁有量已經(jīng)十分驚人,并預(yù)計(jì)在將來還在迅猛增長,但是現(xiàn)在的數(shù)碼相機(jī)與拍照手機(jī)的主要功能還是攝取照片來觀賞,并沒有其它的應(yīng)用功能。
發(fā)明內(nèi)容
該發(fā)明的目的就是提供一種利用現(xiàn)有手機(jī)或是數(shù)碼相機(jī)的拍照功能,以及配套的軟件,以一定的方法與步驟,就可以實(shí)現(xiàn)直接可以對名片、文稿等進(jìn)行拍照及校正,以得到標(biāo)準(zhǔn)格式的圖像信息,如同一臺真正的掃描儀一樣,也可以在此基礎(chǔ)上進(jìn)行字體識別與保存。
該發(fā)明的目的是通過以下的方法和步驟來實(shí)現(xiàn)的(a)在計(jì)算機(jī)內(nèi)預(yù)定義好圖像規(guī)格模板;(b)將要準(zhǔn)備拍攝的文稿放在與其自身可形成明顯色彩反差的背景之上,或是在文稿邊緣加上具有明顯色彩反差的邊緣標(biāo)志;(c)由具有拍照功能的設(shè)備,對有目標(biāo)文稿進(jìn)行拍攝,以獲取目標(biāo)文稿的原始圖像信息;(d)將獲得的原始圖像信息可以實(shí)時(shí)傳輸?shù)接?jì)算機(jī)并顯示,也可以保存在計(jì)算機(jī)的存儲器中,或存在可拍照設(shè)備的內(nèi)部存儲器中;(e)對以上述獲得的圖像信息,由計(jì)算機(jī)程序進(jìn)行圖像邊緣提取,或選擇手動邊緣分割;(f)進(jìn)行邊緣連接,即根據(jù)上述的邊緣提取的結(jié)果,找出頂點(diǎn)并相連接,歸結(jié)為類矩形或是不規(guī)則多邊形;(g)與預(yù)定義的規(guī)格模板進(jìn)行比對;(h)如不符合規(guī)格模板的原始圖像則對其進(jìn)行校正,并匹配得到規(guī)格圖像,即將校正后的結(jié)果與模板進(jìn)行匹配并保存下來;(i)對具有對文字、名片、表格等圖像信息,可啟動字符識別程序或驅(qū)動方法,對文字及表格進(jìn)行識別;(j)識別的結(jié)果可反應(yīng)在設(shè)備顯示器及計(jì)算機(jī)顯示屏幕上;(k)判斷是否結(jié)束并保存識別掃描信息。
在實(shí)際拍攝中,為了得到明顯色彩反差,可以要拍攝的文稿邊緣加一相對色如黑色的邊框。
其中以上所述所提及的由計(jì)算機(jī)程序進(jìn)行圖像邊緣提取的步驟,主要包括(1)去噪聲;(2)微分或差分運(yùn)算;(3)二值化處理;(4)細(xì)化等幾個(gè)步驟。其中所提及的(2)微分或差分運(yùn)算,也可以采用拉普拉茲算子,索貝爾算子,羅伯特算子等模板運(yùn)算方法。
其中以上所述的邊緣連接是根據(jù)邊緣提取歸結(jié)為類矩形或是不規(guī)則多邊形,其基本算法步驟為(1)根據(jù)邊緣提取特征歸結(jié)為邊緣線,邊緣線可以為一直線或是曲線;(2)求出上述每兩條邊緣線的交點(diǎn)或頂點(diǎn);(3)將交點(diǎn)或是頂點(diǎn)各個(gè)相連接。
其中以上所述的對原始圖像則進(jìn)行校正,其方法為使原始圖像按照比例均勻拉伸、壓縮變換為規(guī)格模板,與預(yù)定義的規(guī)格模板相匹配。
同時(shí),上述的方法還提供了一種電子設(shè)備,可以應(yīng)用到一個(gè)快速掃描裝置中,它對預(yù)選區(qū)域的文稿進(jìn)行拍攝,將所拍攝到的結(jié)果傳輸?shù)接?jì)算機(jī)中保存下來,即達(dá)到與掃描儀相類似的效果。
該發(fā)明的優(yōu)點(diǎn)和效果是使現(xiàn)有的數(shù)碼相機(jī)與拍照手機(jī)除具有手機(jī)的正常功能外,還可以對文稿等進(jìn)行攝入,經(jīng)過軟件的校正后,可以成為標(biāo)準(zhǔn)規(guī)格的掃描圖像信息,使其具有同普通掃描儀一樣的功能與特點(diǎn),如果配套使用字體識別程序,將更容易對字符、表格進(jìn)行識別及保存。以上述方法制作成的快速掃描裝置,具有一次成像面掃描、速度快、方便的特點(diǎn),當(dāng)然,目前也存在分辨不高的不足。
下面結(jié)合附圖對本發(fā)明作進(jìn)一步說明。
圖1是本發(fā)明提出的數(shù)碼照片面掃描方法及裝置的流程與步驟示意圖。
圖2是本發(fā)明提出的數(shù)碼照片面掃描方法及裝置的掃描儀裝置結(jié)構(gòu)示意圖。
圖2中說明1、外殼;2、文稿箱;3、攝像頭。
具體實(shí)施例方式
在實(shí)際工作的文檔處理中,最常用的文檔規(guī)格以及掃描文件的規(guī)格是A4幅面的,所以在本優(yōu)選實(shí)施中,就以A4幅面和以顯示器像素點(diǎn)定義為例,當(dāng)然不僅限于此,可以預(yù)定義各種規(guī)格、尺寸及方式。
A4幅面的幾何尺寸為210mm*297mm,根據(jù)需要顯示的特性與想要得到的顯示尺寸定義一個(gè)像素點(diǎn),例如可以預(yù)定義一個(gè)像素點(diǎn)表示原圖像的0.25mm,這樣在顯示屏幕定義為1024*768個(gè)像素時(shí)就可以比較完整地一個(gè)A4幅面的圖像了。
建立規(guī)格模板的目的是為了建立一個(gè)標(biāo)準(zhǔn)的模式,為以后的校正圖像有一個(gè)匹配的參考樣本,拿己知的模板作參考,把合適的原始圖像也轉(zhuǎn)換成為同樣大小的一塊區(qū)域,就可以去成一系列的標(biāo)準(zhǔn)圖像,就如同掃描后的標(biāo)準(zhǔn)大小一樣,因而,這個(gè)規(guī)格可以根據(jù)需要而制定和修正,也可以手工來調(diào)整。
為了獲取文稿的圖像信息,在來實(shí)施例中用數(shù)碼相機(jī)或是拍照手機(jī)來對其進(jìn)行拍照,在實(shí)際辦公使用的文稿中,以白色紙為最為常見,為了能夠讓拍照產(chǎn)生的圖像與拍照背景之間具有明顯邊緣特征,也就是可以非常容易地在數(shù)碼照片中區(qū)分出哪一塊區(qū)域是文稿,哪一塊區(qū)域是背景,所以背景宜選用顏色與白色對比強(qiáng)烈的色彩,例如黑色或是深顏色,這樣就可以自數(shù)碼照片上簡單容易地區(qū)分出那一塊區(qū)域是文稿,那一塊區(qū)域是背景了,這樣做是為了便于識別算法對邊緣的準(zhǔn)確識別。如果文稿是深色的,那么背景最好是相對色的淺色,之后再以數(shù)碼相機(jī)或是拍照手機(jī)進(jìn)行拍攝即可。在實(shí)際應(yīng)用當(dāng)中,有時(shí)可能會不容易找到與文稿顏色相對比具有強(qiáng)烈反差的顏色背景,這時(shí)候,可以在文稿的邊緣加上一個(gè)相對色比較強(qiáng)烈的邊框,以形成一個(gè)具有明確色彩對比效果的邊緣,例如,在圖書館中,在淺色桌面上打開一本普通白色書籍,可以在所找開書籍的邊緣放置一個(gè)黑色邊框,此時(shí)再拍攝,就可以保存下具有明顯對比效果的圖像,以便于后一步的程序自動處理,在準(zhǔn)備完以上的工作之后即可以進(jìn)行拍攝了。
在前面這樣做是為了圖像的邊緣檢測,通常從一幅復(fù)雜背景中提取對象物的邊緣都是以原始圖像為基礎(chǔ),檢測圖中每個(gè)象素點(diǎn)與其鄰域內(nèi)的灰度變化,利用邊緣鄰近的一階或二階方向?qū)?shù)的變化規(guī)律來檢測出邊緣,以達(dá)到從背景中分割出對象物的目的,所以,相互對比程度越明顯,就越容易實(shí)現(xiàn)這個(gè)目的。
將上述通過拍攝所獲得的數(shù)碼照片圖像信息通過通訊接口,一般最常見的是與計(jì)算機(jī)通訊的USB接口傳輸?shù)接?jì)算機(jī),可以是將一批數(shù)碼照片文件傳輸?shù)接?jì)算機(jī)并保存起來,也可以進(jìn)行實(shí)時(shí)的觀察與選擇,實(shí)時(shí)的工作狀態(tài)就如同將數(shù)碼相機(jī)作為一個(gè)攝像頭來使用,但此時(shí)數(shù)據(jù)傳輸?shù)乃俣葧苤朴诮涌谕ㄓ嵉哪芰?,但可以?shí)時(shí)地看到所能夠獲取的圖像的效果與范圍,可以根據(jù)需要有針對性的進(jìn)行選擇,使最后的效果更加地接近真正的掃描儀。
在計(jì)算機(jī)上打開上述的數(shù)碼照片以后,可以選擇以自動與人工的方式進(jìn)行校正,在一般情況下都可以選用自動校正的方法,啟動相應(yīng)的校正程序,由程序完成,如果自動校正的效果不好或是其它原因而選用手動校正程序,可以所獲得的原始參考照片上直接對邊緣進(jìn)行分割,即把文稿的四個(gè)邊直接用直線劃分出來,正常情況下是一個(gè)不規(guī)則的四邊形,用這個(gè)不規(guī)則的四邊形直接與前面預(yù)定義的規(guī)格模板去匹配,就可以得到標(biāo)準(zhǔn)格式的文稿的圖像了。
自動校正的過程大致是這樣的對以上述獲得的圖像信息,由計(jì)算機(jī)程序進(jìn)行圖像邊緣提取,進(jìn)行圖像邊緣提取的步驟,主要包括(1)去噪聲;(2)微分或差分運(yùn)算;(3)二值化處理;(4)細(xì)化等幾個(gè)步驟。其中微分或差分運(yùn)算,也可以采用拉普拉茲算子,索貝爾算子,羅伯特算子等模板運(yùn)算方法。在進(jìn)行邊緣提取之后,再進(jìn)行邊緣連接,即根據(jù)上述的邊緣提取的結(jié)果,邊緣連接是把邊緣提取的結(jié)果歸結(jié)為類矩形或是不規(guī)則多邊形,其基本算法步驟為(1)根據(jù)邊緣提取特征歸結(jié)為邊緣線,邊緣線可以為一直線或是曲線;(2)求出上述每兩條邊緣線的交點(diǎn)或頂點(diǎn);(3)將交點(diǎn)或是頂點(diǎn)各個(gè)相連接。這樣就生成了一個(gè)多邊形,這個(gè)多邊形與預(yù)定義的規(guī)格模板進(jìn)行比對,一般情況肯定不能夠完全符合,如不符合規(guī)格模板的原始圖像則對其進(jìn)行校正,校正的方法是使原始圖像按照比例均勻拉伸、壓縮變換為規(guī)格模板,與預(yù)定義的規(guī)格模板相匹配。這樣就可以得到標(biāo)準(zhǔn)的規(guī)格圖像,也就是與普通掃描儀掃描后產(chǎn)生的圖像具有一樣的結(jié)果,把校正后的結(jié)果與模板進(jìn)行匹配并保存下來,就是我們需要的結(jié)果。
以上兩種方法所得到的圖像信息的過程可以得出,經(jīng)過數(shù)碼相機(jī)或是拍照手機(jī)的一次拍照即可以得到一個(gè)文稿的全部圖像信息,是通過對一個(gè)面的圖像的同時(shí)攝取,但與普通掃描儀的結(jié)果類似,所以稱作為數(shù)碼照片面掃描,而且是一次就可以完成的,速度只需要不到1秒種,少于現(xiàn)有的掃描儀掃描速度,它經(jīng)過軟件校正后消除了變形與畸變,即與標(biāo)準(zhǔn)掃描儀所掃描所得到的結(jié)果相同,當(dāng)然也有不足,最大不足就是在現(xiàn)有的攝影條件的限制下,就是在數(shù)碼相機(jī)與拍照手機(jī)的像素分辨率不高的情況下,數(shù)碼照片面掃描的分辨率會比不上現(xiàn)有掃描儀,但是在一般場合應(yīng)用已經(jīng)可以滿足,并且隨著圖像傳感器的分辨率的提高,一次性的數(shù)碼照片面掃描的分辨率也會越來越高的,并且具有掃描速度上的絕對優(yōu)勢。
在完成上述功能的基礎(chǔ)上,還可以應(yīng)用字符識別程序,對所獲得的信息進(jìn)行文字與表格識別,因?yàn)橐呀?jīng)對圖像進(jìn)行了校正,所以此進(jìn)的識別正確率較沒有經(jīng)過校正的結(jié)果會大大優(yōu)化與提高,使數(shù)碼照片面掃描方法及裝置更加具有實(shí)用性。
所以,上述的這種方案也適用于拍照手機(jī)對名片的識別保存,以及其它的文字圖案的處理和保存,不但可以應(yīng)用于中文,如果配套的識別軟件為其它語種,還可以進(jìn)行其它文字的文字圖案的識別、處理和保存,也可以達(dá)到同樣的目的。
同時(shí),應(yīng)用以上的數(shù)碼相片掃描方法,還可以制作一種可以進(jìn)行一次性數(shù)碼照片面掃描的裝置,其基本結(jié)構(gòu)如附圖2所示,該裝置主要由外殼1、文稿箱2、攝像頭3組成,外殼1呈箱體狀,為了便于放置書本或是文稿,在外殼1的下側(cè)設(shè)置有一文稿箱2,為了能夠獲取文稿的圖像信息,在外殼1的一側(cè)有一攝像頭3,攝像頭3也可以數(shù)碼相機(jī)及臨時(shí)的拍照手機(jī),都可以直接將圖像信息攝取,或是傳入到計(jì)算機(jī)并顯示在顯示屏上,為了更好地達(dá)到獲取圖像和方便的目的,可以在攝像頭3前面也可以設(shè)置光學(xué)模組,這樣用戶可以根據(jù)清晰度、位置等情況,決定是否拍攝下來,如果原始圖像沒有變形,可以直接存取,就不用校正,如果有變形,可以通過上述的方法進(jìn)行校正再保存下來,這樣的裝置可以快速一次性地把文稿的全部信息快速保留下來,就相當(dāng)于完成普通掃描儀的主要功能,如果有變形還可以應(yīng)用校正軟件進(jìn)行校正,使其保持原樣。
雖然這里只說明了本發(fā)明的一個(gè)實(shí)施例,但其意并非限制本發(fā)明的范圍、適用性和配置。相反,對實(shí)施例的詳細(xì)說明可使本領(lǐng)域技術(shù)人員得以實(shí)施。應(yīng)能理解,在不偏離所附權(quán)利要求書確定的本發(fā)明精神和范圍情況下,可對一些細(xì)節(jié)做適當(dāng)變更和修改。
權(quán)利要求
1.一種可對文稿進(jìn)行掃描整理的數(shù)碼照片面掃描方法及裝置,該數(shù)碼照片面掃描方法及裝置可以實(shí)現(xiàn)對可視圖像的一次性面掃描處理,其方法和步驟為(a)在計(jì)算機(jī)內(nèi)預(yù)定義好圖像規(guī)格模板;(b)將要準(zhǔn)備拍攝的文稿放在與其自身可形成明顯色彩反差的背景之上,或是在文稿邊緣加上具有明顯色彩反差的邊緣標(biāo)志;(c)由具有拍照功能的設(shè)備,對有目標(biāo)文稿進(jìn)行拍攝,以獲取目標(biāo)文稿的原始圖像信息;(d)將獲得的原始圖像信息可以實(shí)時(shí)傳輸?shù)接?jì)算機(jī)并顯示,也可以保存在計(jì)算機(jī)的存儲器中,或存在可拍照設(shè)備的內(nèi)部存儲器中;(e)對以上述獲得的圖像信息,由計(jì)算機(jī)程序進(jìn)行圖像邊緣提取,或選擇手動邊緣分割;(f)進(jìn)行邊緣連接,即根據(jù)上述的邊緣提取的結(jié)果,找出頂點(diǎn)并相連接,歸結(jié)為類矩形或是不規(guī)則多邊形;(g)與預(yù)定義的規(guī)格模板進(jìn)行比對;(h)如不符合規(guī)格模板的原始圖像則對其進(jìn)行校正,并匹配得到規(guī)格圖像,即將校正后的結(jié)果與模板進(jìn)行匹配并保存下來;(i)對具有對文字、名片、表格等圖像信息,可啟動字符識別程序或驅(qū)動方法,對文字及表格進(jìn)行識別;(j)識別的結(jié)果可反應(yīng)在設(shè)備顯示器及計(jì)算機(jī)顯示屏幕上;(k)判斷是否結(jié)束并保存識別掃描信息。
2.根據(jù)權(quán)利要求1所述的方法,其中(c)所述的設(shè)備為拍照手機(jī)、數(shù)碼相機(jī)及攝像頭等類似設(shè)備。
3.根據(jù)權(quán)利要求1所述的方法,為了得到明顯色彩反差,可以要拍攝的白色文稿邊緣加一相對色如黑色的邊框。
4.根據(jù)權(quán)利要求1所述的方法,其中(e)所提及的由計(jì)算機(jī)程序進(jìn)行圖像邊緣提取的步驟,主要包括(1)去噪聲;(2)微分或差分運(yùn)算;(3)二值化處理;(4)細(xì)化等幾個(gè)步驟。
5.根據(jù)權(quán)利要求4所述的方法,其中所提及的(2)微分或差分運(yùn)算,也可以采用拉普拉茲算子,索貝爾算子,羅伯特算子等模板運(yùn)算方法。
6.根據(jù)權(quán)得要求1中(f)所述的邊緣連接是根據(jù)邊緣提取歸結(jié)為類矩形或是不規(guī)則多邊形,其基本算法步驟為(1)根據(jù)邊緣提取特征歸結(jié)為邊緣線,邊緣線可以為一直線或是曲線;(2)求出上述每兩條邊緣線的交點(diǎn)或頂點(diǎn);(3)將交點(diǎn)或是頂點(diǎn)各個(gè)相連接。
7.根據(jù)權(quán)得要求1中(h)所述的對原始圖像則進(jìn)行校正,其方法為使找出邊緣頂點(diǎn)特征的原始圖像按照比例均勻拉伸、壓縮變換為規(guī)格模板,與預(yù)定義的規(guī)格模板相匹配。
8.根據(jù)權(quán)利要求1所述的方法,可以制作成一種數(shù)碼照片面掃描方法及裝置,其特征在于該裝置主要由外殼1、文稿箱2、攝像頭3組成,外殼1呈箱體狀,在外殼1的下側(cè)有一文稿箱2,用于放置文稿,在外殼1的一側(cè)有一攝像頭3。
全文摘要
該發(fā)明是一種數(shù)碼照片面掃描方法及裝置,其方法與步驟為在計(jì)算機(jī)內(nèi)預(yù)定義好圖像規(guī)格模板,使要準(zhǔn)備拍攝的文稿與背景之間具有明顯顏色反差,由具有拍照功能的設(shè)備,對文稿進(jìn)行拍攝,由計(jì)算機(jī)程序?qū)D像進(jìn)行邊緣提取,以及邊緣連接及匹配、保存,并可對文字及表格進(jìn)行字符識別,同時(shí),上述的方法可以應(yīng)用到一個(gè)快速面掃描裝置中,主要由外殼、文稿箱、攝像頭構(gòu)成,可達(dá)到與掃描儀相類似的效果,其優(yōu)點(diǎn)和效果是使現(xiàn)有的數(shù)碼相機(jī)與拍照手機(jī)除成為一種快速掃描裝置,具有一次成像、速度快、方便的特點(diǎn)。
文檔編號G06T11/00GK1870709SQ20051007102
公開日2006年11月29日 申請日期2005年5月23日 優(yōu)先權(quán)日2005年5月23日
發(fā)明者宋柏君 申請人:宋柏君