專利名稱:便攜式攝影閱讀裝置及其操作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種數(shù)據(jù)處理裝置,尤其涉及一種便攜式攝影閱讀裝置。
按現(xiàn)今的開方社會(huì),媒體信息日益發(fā)達(dá),尤以報(bào)紙、雜志、書刊為最,大量的新信息常給閱讀者造成理解上的困難,如此,查詢相關(guān)字匯的數(shù)據(jù)或解釋已迫在眉睫。按以往常見的方法,一般是搬來(lái)沉重的字典進(jìn)行手工查閱,以達(dá)到理解的目的。此方法費(fèi)時(shí)費(fèi)力,如遇一篇信息材料有多處生僻字匯,則勢(shì)必降低閱讀速度,且分散閱讀者的注意力。
于是,近來(lái)出現(xiàn)了許多電腦字匯翻譯軟件,來(lái)取代部份或分部字匯解釋的功能。但目前所發(fā)展出來(lái)的字匯翻譯軟件,在解釋印刷體字匯時(shí),均需將其經(jīng)由鍵盤或筆式鍵入的動(dòng)作來(lái)達(dá)到輸入的目的,雖省卻人為查閱字典的步驟,但增加了鍵入字匯的動(dòng)作,如遇較長(zhǎng)的字匯,速度后不及手工查閱,且鍵入過程中雖免發(fā)生拼寫錯(cuò)誤,使用者常需頻繁地修改,極易擾亂閱讀思路,影響閱讀效果。況且,就使用上而言,無(wú)論是傳統(tǒng)的字典,或是先進(jìn)行手持式個(gè)人電腦,始終還是具有攜帶或使用不方便的問題,有鑒于此,為了克服印刷體字匯翻譯快速性與便利性的矛盾,本發(fā)明的目的即在于結(jié)合電子技術(shù)及程序設(shè)計(jì),提供一便攜式攝影閱讀裝置。此種便攜式閱讀裝置包含有透鏡;二維CCD或CMOS影像感應(yīng)模組;數(shù)字信號(hào)處理器;開關(guān);存儲(chǔ)裝置;以及顯示裝置。其操作步驟及內(nèi)部控制流程為(1)首先使用者將便攜式攝影閱讀裝置的前端透鏡對(duì)準(zhǔn)待查詢的印刷體文字或片語(yǔ),按動(dòng)采集開關(guān),經(jīng)由光攝影透鏡擷取該文字影像的光信號(hào),同時(shí)并傳送影像感應(yīng)裝置(CCD或CMOS影像感應(yīng)裝置);(2)接著,攝像驅(qū)動(dòng)器經(jīng)由數(shù)字信號(hào)處理器控制,以驅(qū)動(dòng)影像感應(yīng)器將光信號(hào)轉(zhuǎn)換成模擬信號(hào),再通過模擬/數(shù)字轉(zhuǎn)換器轉(zhuǎn)換成數(shù)字影像信號(hào),然后再傳送至數(shù)字信號(hào)處理器中進(jìn)行濾波處理;(3)然后,前述數(shù)字信號(hào)處理器將經(jīng)濾波處理的數(shù)字影像信號(hào)轉(zhuǎn)換成影像陣列文件,利用OCR(光學(xué)字符識(shí)別)技術(shù)對(duì)此影像陣列辨識(shí)、得出文本關(guān)鍵詞,輸入數(shù)據(jù)庫(kù)查詢系統(tǒng)查詢得到所需的相關(guān)數(shù)據(jù)(如解釋文字、聲音、影像等),并同時(shí)將之顯示于顯示器上,本發(fā)明的優(yōu)點(diǎn)在于這種便攜式攝影閱讀裝置將攝影透鏡、影像感應(yīng)模組及光學(xué)字元辨識(shí)模組、顯示裝置等均速合于一獨(dú)立的操作環(huán)境中,例如筆或鼠標(biāo),使用時(shí)無(wú)需配合其他的電腦裝置,便可進(jìn)行數(shù)據(jù)的查詢,大幅地提高其便利性。
本發(fā)明的另一個(gè)優(yōu)點(diǎn)在于這種便攜式攝影閱讀裝置具有體積小、使用靈活、攜帶方便等特點(diǎn),將其應(yīng)用于印刷體文字的影像輸入,便于操作。
本發(fā)明的再一個(gè)優(yōu)點(diǎn)在于,本裝置提供了印刷體文字的線上即時(shí)辨識(shí)、即時(shí)查詢、即時(shí)顯示的功能,實(shí)現(xiàn)閱讀與理解同步的過程,大幅地提高閱讀者的閱讀速度。
為了進(jìn)一步說明本發(fā)明的結(jié)構(gòu)、操作方式及特點(diǎn),下面就配合
本發(fā)明的較佳實(shí)施例,其中圖1是本發(fā)明的便攜式攝影閱讀裝置的一實(shí)施例的結(jié)構(gòu)方塊圖;圖2是本發(fā)明的便攜式攝影閱讀裝置的另一實(shí)施例的結(jié)構(gòu)方塊圖;圖3是應(yīng)用于圖1或圖2的便攜式攝影閱讀裝置中的影像感測(cè)器的電路圖;圖4是本發(fā)明的便攜式攝影閱讀裝置擷取文字影像的流程圖;圖5是本發(fā)明的便攜式攝影閱讀裝置處理文字影像的流程圖;圖6是本發(fā)明的便攜式攝影閱讀裝置進(jìn)行文字影像辨識(shí)的流程圖;圖7a與圖7b是本發(fā)明中對(duì)文字影像進(jìn)行角度校正處理的示意圖;圖8是本發(fā)明中對(duì)文字影像乾地框架處理的示意圖;圖9是本發(fā)明的字元辨識(shí)程序中特征像素選取方式的示意圖;圖10是本發(fā)明的循環(huán)辨識(shí)程序中進(jìn)行匹配判別的流程圖;圖11是對(duì)數(shù)據(jù)庫(kù)進(jìn)行關(guān)鍵詞查詢動(dòng)作的流程圖;圖12是本發(fā)明的便攜式攝影閱讀裝置的一實(shí)施例的視圖;圖13是本發(fā)明的便攜式攝影閱讀裝置的另一實(shí)施例的視圖。
本發(fā)明的便攜式攝影閱讀裝置是將書本、雜志上的印刷體文字通過便攜式攝影閱讀裝置前端的透鏡傳入攝影閱讀裝置內(nèi)的影像感測(cè)裝置,例如二維CCD或CMSO制程元件的光影像感測(cè)裝置,經(jīng)模擬/數(shù)字(A/D)轉(zhuǎn)換后,利用數(shù)字信號(hào)處理(DSP)技術(shù)對(duì)數(shù)字影像信號(hào)進(jìn)行濾波,以除去數(shù)字影像信號(hào)的噪聲,然后,利用OCR技術(shù)辨識(shí)出文本關(guān)鍵詞,輸入數(shù)據(jù)庫(kù)查詢系統(tǒng)查詢得到所需相關(guān)資料(如解釋文字、聲音、影像等),并同時(shí)將之顯示于顯示器上。
本發(fā)明的便攜式攝影閱讀裝置的一實(shí)施例的硬件結(jié)構(gòu)說明如下。首先,請(qǐng)參閱圖1,本發(fā)明的便攜式攝影閱讀裝置包括攝影鏡頭10,作為影像攝入裝置,用以攝入印刷品5上的文字、數(shù)字、條碼、影像;二維CCD或CMOS影像感測(cè)器12,用以接收前述攝影鏡頭10攝入的影像,并產(chǎn)生模擬類比影像信號(hào);模擬/數(shù)字轉(zhuǎn)換器14,用以將前述模擬影像信號(hào)轉(zhuǎn)換成數(shù)字影像信號(hào);數(shù)字信號(hào)處理器16,作為整個(gè)系統(tǒng)的控制核心;電源裝置18,連接至前述數(shù)字信號(hào)處理器16,用向前述便攜式攝影閱讀裝置提供操作所需的電源;存儲(chǔ)裝置20,用以存儲(chǔ)前述數(shù)字信號(hào)處理器16的控制程序以及數(shù)據(jù)庫(kù);顯示裝置22,用以顯示查詢數(shù)據(jù)庫(kù)所得到的相關(guān)資料(稍后再加說明);以及開關(guān)24,用以控制便攜式攝影閱讀裝置的各種操作。當(dāng)攝影鏡頭10攝入影像后,經(jīng)由CCD或CMOS影像感應(yīng)器12及模擬/數(shù)字轉(zhuǎn)換器14,再經(jīng)數(shù)字信號(hào)處理器16配合前停存儲(chǔ)裝置20處理后,會(huì)得到影像的特征信息,藉以提供不同應(yīng)用的需要。例如,本發(fā)明的便攜式攝影閱讀裝置具有電子字典的功能,其在輸入字元、單字或片語(yǔ)的影像數(shù)據(jù)后,會(huì)顯示出該字元、單字或片語(yǔ)的相關(guān)資料。同時(shí),本發(fā)明的便攜式攝影閱讀裝置可具有個(gè)人信息管理的功能,可根據(jù)攝影閱讀裝置入的影像進(jìn)行數(shù)據(jù)的搜尋或編輯,請(qǐng)參閱圖2,本發(fā)明的便攜式攝影閱讀裝置的另一個(gè)實(shí)施例除了上述第一實(shí)施例中所包括的元件外,還包括通信控制接口26,其經(jīng)由總線連接至數(shù)字信號(hào)處理器16。經(jīng)由此通信控制接口26,便攜式攝影閱讀裝置可與其他電路或裝置相連接。例如,可經(jīng)由一數(shù)據(jù)傳輸電纜或無(wú)線傳輸裝置,連接至其他電腦裝置上?;蛘呤沁B接至一定位編碼電路,同時(shí)經(jīng)由數(shù)字信號(hào)處理器控制便攜式攝影閱讀裝置的操作模式,藉以在攝影閱讀模式及定位編碼模式間操作。至于各模式間的切換及不同的模式的流程操作,則可由開關(guān)24控制數(shù)字信號(hào)處理器16,配合存儲(chǔ)于存儲(chǔ)裝置20中的程序加以實(shí)現(xiàn)。
前述開關(guān)24可為一即時(shí)開關(guān),也就是當(dāng)使用者按著開關(guān)24時(shí),攝影閱讀裝置便持續(xù)地讀入影像,而在使用者放開開關(guān)24時(shí),攝取一靜態(tài)影像?;蛘撸_關(guān)24亦可為一般的按鍵開關(guān),當(dāng)開關(guān)24開啟時(shí),便攝取影像,當(dāng)開關(guān)24關(guān)閉時(shí),便停止攝取影像。
前述影像感應(yīng)器12受一影像感測(cè)驅(qū)動(dòng)裝置控制,以將擷取到的影像轉(zhuǎn)換成模擬影像信號(hào)。而在本實(shí)施例中,前述影像感測(cè)驅(qū)動(dòng)裝置是存儲(chǔ)于存儲(chǔ)裝置20中的程序指令,此程序指令同時(shí)亦控制前述數(shù)字信號(hào)處理器16的運(yùn)作。
前述數(shù)字信號(hào)處理器16為整個(gè)便攜式攝影閱讀裝置的控制核心,在本發(fā)明中可為微處理器、微電腦、微控制器或RISC處理器等,其主要?jiǎng)幼魅缦?1)受開關(guān)24控制接收影像信號(hào);(2)對(duì)模擬數(shù)字轉(zhuǎn)換器14輸出的數(shù)字影像信號(hào)進(jìn)行濾波處理,即去除信號(hào)的失真部分,同時(shí)進(jìn)行影像信號(hào)的邊緣定位,結(jié)構(gòu)加強(qiáng)及平滑處理,藉以得到較為理想的數(shù)字影像信號(hào);(3)將數(shù)字影像信號(hào)轉(zhuǎn)換為可識(shí)別的圖像數(shù)字信號(hào),然后進(jìn)行光學(xué)字元辨識(shí)及數(shù)據(jù)庫(kù)查詢。
請(qǐng)參閱圖3,前述影像感測(cè)器12包括影像感測(cè)電路34;及一移位暫存器44,經(jīng)由移動(dòng)門42與前述影像感測(cè)電路34連接。前述影像感測(cè)電路34包括排列成二維矩陣型式的多個(gè)光感測(cè)元件,且每一個(gè)光感測(cè)元件包括并聯(lián)的光電二極管36和電容器38,且其一端接地40。其具體運(yùn)作方式為光影像信號(hào)傳入光電二極管36后,經(jīng)其光電感應(yīng)過程轉(zhuǎn)變?yōu)橐恍盘?hào)電荷,并將之存于電容器38中,再經(jīng)移動(dòng)門42傳至移位暫存器44中,轉(zhuǎn)換為模擬影像信號(hào)。前述光電二級(jí)管36可用一光敏電阻器取代,而移位暫存器44亦可采用CMOS制程的模擬移位暫存器。
請(qǐng)參閱圖4,本發(fā)明的便攜式攝影閱讀裝置擷取文字影像的流程包括下列步驟(1)步驟60,決定使用者是否將便攜式攝影閱讀裝置的光攝影透鈄16對(duì)準(zhǔn)待辨別的印刷體文字或片語(yǔ),按動(dòng)采集開關(guān),若無(wú)則回到開始,否則進(jìn)行下一步驟;(2)步驟62,經(jīng)由光攝影透鏡16擷取影像的光信號(hào),同時(shí)經(jīng)由影像感應(yīng)器20產(chǎn)生矩陣格式的模擬影像信號(hào);(3)步驟64,前述模擬影像信號(hào)通過模擬/數(shù)字轉(zhuǎn)換器22轉(zhuǎn)換成數(shù)字影像信號(hào),然后,再傳送至數(shù)字信號(hào)處理器24中;(4)步驟66,經(jīng)數(shù)字信號(hào)處理器對(duì)數(shù)字影像信號(hào)進(jìn)行濾波處理及對(duì)應(yīng)的信號(hào)轉(zhuǎn)換,并產(chǎn)生一影像數(shù)據(jù)陣列,然后再回到開始,決定是否再擷取影像。
請(qǐng)參閱圖5,本發(fā)明的便攜式攝影閱讀裝置處理文字影像的流程包括下列步驟(1)步驟70,決定數(shù)字信號(hào)處理器是否讀取影像數(shù)據(jù)陣列,若無(wú)則回到開始,否則進(jìn)行下一步驟;(2)步驟72,處理單元開始進(jìn)行字元辨識(shí)程序;(3)步驟74,進(jìn)行數(shù)據(jù)庫(kù)查詢程序;(4)步驟76,依據(jù)查詢結(jié)果,自數(shù)據(jù)庫(kù)中擷取相關(guān)信息;(5)步驟78,將查詢得到所需的相關(guān)信息(如解釋文字、聲音、影像等)顯示于便攜式閱讀裝置的顯示器上。
如前所述,在本發(fā)明中是利用數(shù)字信號(hào)處理器,配合存儲(chǔ)于存儲(chǔ)裝置內(nèi)的控制軟件及數(shù)據(jù)庫(kù),進(jìn)行光學(xué)字元辨識(shí)及數(shù)據(jù)庫(kù)查詢等流程。
請(qǐng)參閱圖6,本發(fā)明的便攜式攝影閱讀裝置進(jìn)行文字影像辨識(shí)的流程包括下列步驟(1)步驟80,經(jīng)由便攜式攝影閱讀裝置讀取影像數(shù)據(jù),并將其以陣列的形式存儲(chǔ)于存儲(chǔ)裝置的RAM中;(2)步驟82,將影像數(shù)據(jù)陣列的多級(jí)灰度格式或彩色格式轉(zhuǎn)化成二級(jí)灰度格式,即以0與1表示像素的有無(wú),藉以區(qū)分文字與背景影像,以便于影像辨識(shí);(3)步驟84,根據(jù)各像素的稀疏綢密特征,進(jìn)行二值化的影像陣列所具有的噪聲過濾,去除一些特別稀疏的雜點(diǎn),使待辨識(shí)的影像點(diǎn)陣整齊、清晰;(4)步驟86,將攝入的影像進(jìn)行角度校正,對(duì)偏斜影像的像素點(diǎn)進(jìn)行采樣,計(jì)算出偏斜角度,再依據(jù)此角度對(duì)影像的各像素的坐標(biāo)進(jìn)行旋轉(zhuǎn)校正,藉以得到無(wú)偏斜的端正影像;(5)步驟88,將點(diǎn)陣影像依據(jù)其點(diǎn)陣疏密度,將其區(qū)分為多塊片語(yǔ)影像和多塊字元影像,以便于單個(gè)字元的辨識(shí);(6)步驟90,進(jìn)行字元或片語(yǔ)影像循環(huán)辨識(shí)程序;(7)步驟92,決定是否辨識(shí)下一個(gè)字元或片語(yǔ),若是則回到開始,否則結(jié)束辨識(shí)。
在前述步驟86中,影像角度校正的方式,請(qǐng)參閱圖7a,在攝入的影像偏斜的情況下,以“ZOF”為例,先由左至右從下而上對(duì)影像點(diǎn)陣進(jìn)行搜索,當(dāng)遇見黑點(diǎn)時(shí)就記錄其坐標(biāo),然后自該坐標(biāo)之后再重新搜索并記錄下一個(gè)黑點(diǎn)的坐標(biāo),因而形成一條曲線,再尋找該曲線的局部極小點(diǎn)。將各局部極小點(diǎn)依次連接以形成一組向量并計(jì)算其角度,并將所得到的多個(gè)角度依其大小分類,取分布較多的角度范圍中的角度的平均值作為影像中文字傾斜的角度,然后再根據(jù)此角度,旋轉(zhuǎn)修正各像素的坐標(biāo)值,藉以得到無(wú)偏斜的端正影像點(diǎn)陣,如圖7b所示。
在前述步驟88中,經(jīng)過濾波處理過的影像數(shù)據(jù)陣列,利用影像分離與連續(xù)的特征,切割成各個(gè)獨(dú)立字元的影像,此即為“框架處理”。
各個(gè)獨(dú)立的字元影像陣列分別以g1、g2、…、gt表示,請(qǐng)參閱圖8,以“ZOF”為例,其經(jīng)切分后,“Z”的影像區(qū)塊以g1表示,“Z”的影像區(qū)塊以g2表示,而“F”的影像區(qū)塊以g3表示。函數(shù)R(G)為影像循環(huán)辨識(shí)函數(shù),將m個(gè)獨(dú)立影像塊g1、g2、g3、…、gt代入R(G)得R(g1、g2、g3、…、gt),或辨識(shí)得相對(duì)應(yīng)的字元e1、e2、e3、…、et,循序存儲(chǔ)于數(shù)組E中,數(shù)組E即為辨識(shí)所得的關(guān)鍵詞。
前述影像循環(huán)辨識(shí)函數(shù)R(G)所采用的字元辨識(shí)方法基本上為匹配判別。請(qǐng)參閱圖9,以印刷體的“Z”為例,其具有的筆劃為S-1 94、S-2 96及S-3 98,首先決定每一筆劃的相對(duì)長(zhǎng)度,在本例中,S-2 96較長(zhǎng),而S-1 94及S-3 98則等長(zhǎng);接著決定字元影像的筆劃數(shù)目,以本例而言,共有三個(gè)筆劃;決定每一筆劃的方向,在本例中,S-1 94及S-3 98均為水平方向,S-2 96為右上至左下的方向;最后再?zèng)Q定字元影像的連接點(diǎn)數(shù)目,在本例中為二。然后,根據(jù)上述步驟所得到的特征信息,于數(shù)據(jù)庫(kù)查詢的程序中,再與字元持征庫(kù)中的每一個(gè)字元的特征相比較。前述字元特征庫(kù)為預(yù)先內(nèi)建于數(shù)據(jù)庫(kù)中,所以本發(fā)明的字元辨識(shí),依據(jù)內(nèi)建范本不同,除了可辨識(shí)各種不同的文字、數(shù)字外,尚可應(yīng)用于辨識(shí)影像。
為了更進(jìn)一步說明影像循環(huán)辨識(shí),請(qǐng)參閱圖10,其示出了步驟88中的字元或片語(yǔ)影像循環(huán)辨識(shí)程序的流程,其包括下列步驟(1)步驟100,辨識(shí)字元影像的筆劃;(2)步驟102,決定字元影像的筆劃數(shù)目;(3)步驟103,決定每一筆劃的相對(duì)長(zhǎng)度;(4)步驟104,決定相連接筆劃間的角度;(5)步驟105,決定每一筆劃的方向;(6)步驟106,根據(jù)上述步驟取得字元的特征信息;(7)步驟108,將每一個(gè)字元像素的特征與字元特征庫(kù)中的每一個(gè)字元影像的特征相比;(8)步驟110,是否找到特征相匹配的字元,若是則進(jìn)行至步驟112,否則進(jìn)行至步驟114;(9)步驟112,使用在字元特征庫(kù)中找到的字元做為參考字元碼;(10)步驟114,使用在字元特征庫(kù)中找到的特征最接近的字元做為參考字元碼。
請(qǐng)參閱圖11,其示出了對(duì)關(guān)鍵詞進(jìn)行查詢動(dòng)作的流程,包括下列步驟(1)步驟116,自存儲(chǔ)器中讀取經(jīng)辨識(shí)轉(zhuǎn)換后的文本關(guān)鍵詞;(2)步驟118,查詢數(shù)據(jù)庫(kù),將文本關(guān)鍵詞與數(shù)據(jù)庫(kù)中既有的數(shù)據(jù)進(jìn)行比較;(3)步驟120,決定是否找到相符的數(shù)據(jù),若是,則進(jìn)行至步驟124,否則進(jìn)行至步驟126;(4)步驟124,從數(shù)據(jù)庫(kù)中獲取此關(guān)詞的相關(guān)信息;(5)步驟126,獲取與此關(guān)鍵詞最接近的相關(guān)信息;(6)步驟250,將獲取的相關(guān)信息顯示于液晶顯示器上。
下面再分別說明本發(fā)明實(shí)際應(yīng)用的兩個(gè)實(shí)施例,請(qǐng)先參閱圖12,圖中示出筆型的便攜式攝影閱讀裝置的外觀,其包括筆型外殼13-;攝影鏡頭132,設(shè)置于前述筆型外殼130的前端;液晶顯示器134,設(shè)置于前述筆型外殼130上;多個(gè)開關(guān)136,設(shè)置于前述筆型外殼上;及一尺規(guī)138,設(shè)置于前述筆型外殼130上,位于前述攝影鏡頭132的前方,用以作為攝影鏡頭132攝入影像的指標(biāo)。至于CCD或CMOS影像感應(yīng)模組、數(shù)字信號(hào)處理器及存儲(chǔ)裝置等電路,則是設(shè)置于筆型外殼130中。
前述尺規(guī)138經(jīng)由一支架138a而被連接至筆型外殼130的一端,且尺規(guī)138與支架138a可被固接于任一角度下,或者是利用一球關(guān)節(jié)加以連接,藉以讓使用者可依照實(shí)際需要,調(diào)整角度。支架138a相對(duì)于筆型外130可以伸縮,也就是說,可在使用時(shí)將支架138a自筆型外殼130中伸出固定,同時(shí)在不使用時(shí)可將138a縮入至筆型外殼130中。支架138a的固定方式,可利用卡榫或開關(guān)等裝置。至于支架138a的長(zhǎng)度,則視攝影鏡頭132的焦距而定,藉以使得尺規(guī)138所標(biāo)示的物體,如文字、圖案等,正好位于攝影鏡頭132的焦距上。當(dāng)然,尺規(guī)的形狀可視實(shí)際使用的需要,做各種不同的變化,而并不限定于本發(fā)明實(shí)施例中所提供的。
請(qǐng)?jiān)賲㈤唸D13a,鼠標(biāo)型便攜式攝影閱讀裝置的外觀包括鼠標(biāo)外殼140;攝影鏡頭142,設(shè)置于前述鼠標(biāo)外殼140的前端;液晶顯示器144,設(shè)置于前述鼠標(biāo)外殼140上方;多個(gè)開關(guān)146,設(shè)置于前述鼠標(biāo)外殼140上;及一尺規(guī)148,設(shè)置于前述鼠標(biāo)外殼140上,位于前述攝影鏡頭142的前方,用以作為攝影鏡頭攝入影像的指標(biāo)。前述攝影鏡頭142及尺規(guī)148均可折疊收納至鼠標(biāo)外殼140中,如圖12b所示。其中尺規(guī)148可以伸出或縮入至鼠標(biāo)外殼140中,而前述攝影鏡頭142,則可經(jīng)由一樞軸連接于前述鼠標(biāo)外殼140上,藉以在不使用時(shí),可以旋轉(zhuǎn)收藏于鼠標(biāo)外殼140的底部。且,在前述鼠標(biāo)外殼140下方亦設(shè)置有一定位編碼裝置(未圖示),舉例而言,其可包括軌跡球、轉(zhuǎn)軸、編碼器及檢測(cè)器,藉以達(dá)到鼠標(biāo)原來(lái)的功能。
在前述兩個(gè)實(shí)施例中雖未示出,但均包括有用以裝入電源裝置的電池室,例如,在圖12所示的實(shí)施例中,電池可被裝置于筆型外殼的末端,然后再以一帽蓋封裝。另外,亦可包括通信端的插座,藉以可連接外部電腦,進(jìn)行數(shù)據(jù)的更新或交換。
權(quán)利要求
1.一種便攜式攝影閱讀裝置,包括攝影鏡頭,作為影像攝入裝置,用以攝入文字、數(shù)字條碼、影像;影像感應(yīng)模組,用以接收前述攝影鏡頭攝入的影像,并產(chǎn)生數(shù)字影像信號(hào);數(shù)字信號(hào)處理器,用以對(duì)前述影像感應(yīng)模組輸出的數(shù)字影像信號(hào)進(jìn)行濾波處理,將數(shù)字影像信號(hào)轉(zhuǎn)換為可識(shí)別的圖像數(shù)字信號(hào),然后進(jìn)行光學(xué)字元識(shí)別及數(shù)據(jù)庫(kù)查詢;存儲(chǔ)裝置,用以存儲(chǔ)控制前述數(shù)字信號(hào)處理器的程序及數(shù)據(jù)庫(kù);及顯示裝置,用以顯示前述數(shù)字信號(hào)處理器查詢數(shù)據(jù)庫(kù)后得到的結(jié)果。
2.如權(quán)利要求1所述的便攜式攝影閱讀裝置,其特征在于,前述影像感應(yīng)模組包括影像感應(yīng)器,用以接收前述影像鏡頭攝入的影像,并據(jù)此產(chǎn)生模擬影像信號(hào);以及模擬/數(shù)字轉(zhuǎn)換器,用以將前述模擬影像信號(hào)轉(zhuǎn)換成數(shù)字影像信號(hào)。
3.如權(quán)利要求1所述的便攜式攝影閱讀裝置,其特征在于,前述存儲(chǔ)裝置包括隨機(jī)存取存儲(chǔ)器及只讀存儲(chǔ)器。
4.如權(quán)利要求1所述的便攜式攝影閱讀裝置,其特征在于,還包括通信控制按口,其連接端可為并行端、串行端、符合通用串行總線協(xié)定,或PCMCIA或PC卡標(biāo)準(zhǔn)的通信端。
5.如權(quán)利要求1所述的便攜式攝影閱讀裝置,其特征在于,前述攝影鏡頭為一變焦鏡頭,藉以可調(diào)整攝入影像的成像大小。
6.如權(quán)利要求2所述的便攜式攝影閱讀裝置,其特征在于,前述影像感應(yīng)器包括影像感測(cè)電路;及移位暫存器,經(jīng)由一移位門與前述影像感測(cè)電路連接。
7.如權(quán)利要求2所述的便攜式攝影閱讀裝置,其特征在于,前述影像感應(yīng)器包括CCD及利用CMOS技術(shù)制作的電路元件。
8.如權(quán)利要求6所述的便攜式攝影閱讀裝置,其特征在于,前述影像感測(cè)電路包括排列成二維矩陣型式的多個(gè)光感測(cè)元件,且每一個(gè)光感測(cè)元件包括并聯(lián)的光電二極管及電容器,且其一端接地。
9.如權(quán)利要求5所述的便攜式攝影閱讀裝置,其特征在于,前述移位暫存器可為一CCD模擬移位暫存器或CMOS制程的模擬移位暫存器。
10.一種便攜式攝影閱讀裝置,其特征在于,包括筆型外殼;攝影鏡頭,設(shè)置于前述筆型外殼的一端,用以攝入文字、數(shù)字、條碼、影像;一影像感應(yīng)模組,設(shè)置于前述筆型外殼中、用以接收前述攝影鏡頭攝入的影像,并產(chǎn)生數(shù)字影像信號(hào);數(shù)字信號(hào)處理器,設(shè)置于前述筆型外殼之中,用以對(duì)前述影像感應(yīng)模組輸出的數(shù)字影像信號(hào)進(jìn)行濾波處理,將數(shù)字影像信號(hào)轉(zhuǎn)換為可識(shí)別的圖像數(shù)字信號(hào),然后進(jìn)行光學(xué)字元辨識(shí)及數(shù)據(jù)庫(kù)查詢;存儲(chǔ)裝置,設(shè)置于前述筆型外殼之中,用以存儲(chǔ)控制前述數(shù)字信號(hào)處理器的程序及數(shù)據(jù)庫(kù);顯示裝置,設(shè)置于前述筆型外殼上,用以顯示前述數(shù)字信號(hào)處理器查詢數(shù)據(jù)庫(kù)后所得到的結(jié)果;多個(gè)按鍵,設(shè)置于前述筆型外殼上,用以切換前述便攜式攝影閱讀裝置的操作模式,并控制其操作流程。
11.如權(quán)利要求10所述的便攜式攝影閱讀裝置,其特征在于,還包括一尺規(guī),用以指示將由攝影鏡頭攝入的文字、數(shù)字、條碼、影像,
12.如權(quán)利要求10所述的便攜式攝影閱讀裝置,其特征在于,前述顯示裝置為一液晶顯示器。
13.如權(quán)利要求10所述的便攜式攝影閱讀裝置,其特征在于,前述攝影鏡頭為一變焦鏡頭。
14.一種便攜式攝影閱讀裝置,其特征在于,包括鼠標(biāo)外殼;攝影鏡頭,設(shè)置于前述鼠標(biāo)外殼的一端,用以攝入文字、數(shù)字、條碼、影像;一影像感應(yīng)模組,設(shè)置于前述鼠標(biāo)外殼中,用以接收前述攝影鏡頭攝入的影像,并產(chǎn)生數(shù)字影像信號(hào);數(shù)字信號(hào)處理器,設(shè)置于前述鼠標(biāo)外殼之中,用以對(duì)前述影像感應(yīng)模組輸出的數(shù)字影像信號(hào)進(jìn)行濾波處理,將數(shù)字影像信號(hào)轉(zhuǎn)換為可識(shí)別的圖像數(shù)字信號(hào),然后進(jìn)行光學(xué)字元辨識(shí)及數(shù)據(jù)庫(kù)查詢;存儲(chǔ)裝置,設(shè)置于前述鼠標(biāo)外殼之中,用以存儲(chǔ)控制前述數(shù)字信號(hào)處理器的程序及數(shù)據(jù)庫(kù);顯示裝置,設(shè)置于前述鼠標(biāo)外殼上,用以顯示前述數(shù)字信號(hào)處理器查詢數(shù)據(jù)庫(kù)后所得到的結(jié)果;多個(gè)按鍵,設(shè)置于前述鼠標(biāo)外殼上,用以切換前述便攜式攝影閱讀裝置的操作模式,并控制其操作流程。
15.如權(quán)利要求14所述的便攜式攝影閱讀裝置,其特征在于,還包括一尺規(guī),用以指示將由攝影鏡頭攝入的文字、數(shù)字、條碼、影像。
16.如權(quán)利要求14所述的便攜式攝影閱讀裝置,其特征在于,前述顯示裝置為一液晶顯示器。
17.如權(quán)利要求14所述的便攜式攝影閱讀裝置,其特征在于,前述攝影鏡頭為一變焦鏡頭。
18.如權(quán)利要求14所述的便攜式攝影閱讀裝置,其特征在于,還包括一定位編碼裝置,設(shè)置于前述鼠標(biāo)外殼之中,用以產(chǎn)生相對(duì)位移的坐標(biāo)數(shù)據(jù),然后將相對(duì)位移的坐標(biāo)數(shù)據(jù)送給前述數(shù)字信號(hào)處理器,藉以完成鼠標(biāo)定位的功能。
19.一種便攜式攝影閱讀裝置的操作方法,其特征在于,包括下列步驟(i)當(dāng)使用者按動(dòng)采集開關(guān)時(shí),經(jīng)由攝影鏡頭擷取物體影像;(ii)將該影像傳送至一影像感應(yīng)裝置,并產(chǎn)生數(shù)字影像信號(hào);(iii)由一數(shù)字信號(hào)處理器對(duì)該影像信號(hào)進(jìn)行辨識(shí),同時(shí)根據(jù)辨識(shí)結(jié)果進(jìn)行數(shù)據(jù)庫(kù)查詢;(iv)自數(shù)據(jù)庫(kù)中擷取與辨識(shí)結(jié)果最接近的相關(guān)信息,并加以顯示。
20.如權(quán)利要求19所述的操作方法,其特征在于,在前述步驟(ii)中,當(dāng)便用者按動(dòng)采集開關(guān)時(shí),影像感應(yīng)裝置會(huì)連續(xù)地?cái)X取物體影像并產(chǎn)生影像信號(hào),而當(dāng)使用者放開開關(guān)時(shí),才擷取靜態(tài)影像進(jìn)行辨識(shí)。
21.如權(quán)利要求19所述的操作方法,其特征在于,在前述步驟(ii)中當(dāng)使用者按動(dòng)采集開關(guān)時(shí),影像感應(yīng)裝置會(huì)擷取物體影像并產(chǎn)生影像信號(hào)。
22.如權(quán)利要求19所述的操作方法,其特征在于,在前述步驟(iii),數(shù)字信號(hào)處理器進(jìn)行影像辨識(shí)的程序包括下列步驟(i)讀取影像數(shù)據(jù),并將其經(jīng)陣列的形式存儲(chǔ)于存儲(chǔ)裝置中;(ii)將影像數(shù)據(jù)陣列的多級(jí)灰度格式或彩色格式轉(zhuǎn)化成二級(jí)灰度格式,藉以區(qū)分圖像與背景影像,以便于影像辨識(shí);(iii)根據(jù)各像素的稀疏綢密特征,進(jìn)行二值化的影像陣列所具有的噪聲過濾,使待辨識(shí)的影像點(diǎn)陣整齊清晰;(iv)對(duì)影像點(diǎn)陣進(jìn)行搜索,找出由黑點(diǎn)構(gòu)成的曲線的局部極小點(diǎn),藉以計(jì)算出影像偏斜角度,再根據(jù)此角度,對(duì)影像進(jìn)行旋轉(zhuǎn)校正;(v)再將點(diǎn)陣影像依據(jù)其點(diǎn)陣疏密,進(jìn)行切分,以便于辨識(shí);(vi)進(jìn)行影像循環(huán)辨識(shí)程序。
23.如權(quán)利要求19所述的操作方法,其特征在于,在前述步驟(iii)中,數(shù)字信號(hào)處理器進(jìn)行數(shù)據(jù)庫(kù)查詢的程序包括下列步驟(i)自存儲(chǔ)裝置中讀取經(jīng)辨識(shí)轉(zhuǎn)換后的圖案的特征像素;(ii)查詢數(shù)據(jù)庫(kù),將特征像素與數(shù)據(jù)庫(kù)中既有的數(shù)據(jù)進(jìn)行比較;(iii)決定是否找到相行的數(shù)據(jù),若是,則從數(shù)據(jù)庫(kù)中獲取此相關(guān)信息,否則獲取最接近的相關(guān)信息。
24.如權(quán)利要求19所述的操作方法,其特征在于,前述影像為文字、數(shù)字、條碼及影像。
25.如權(quán)利要求19所述的操作方法,其特征在于,利用前述辨識(shí)出的結(jié)果的關(guān)鍵字去對(duì)數(shù)據(jù)庫(kù)進(jìn)行查詢,所得到的最接近的相關(guān)信息包括文字、影像、聲音等多媒體資料。
26.一種便攜式攝影閱讀裝置的操作方法,其特征在于,包括下列步驟(i)使用者將一攝影鏡頭對(duì)準(zhǔn)待辨識(shí)的印刷體文字或片語(yǔ),按動(dòng)采集開關(guān),文字影像經(jīng)由攝影鏡頭擷取,同時(shí)傳送至一影像感應(yīng)器;(ii)前述影像感應(yīng)器將光信號(hào)轉(zhuǎn)換成模擬電信號(hào),再經(jīng)由模擬/數(shù)字轉(zhuǎn)換器轉(zhuǎn)換成數(shù)字信號(hào);(iii)再將數(shù)字信號(hào)傳送至前述數(shù)字信號(hào)處理器中,經(jīng)濾波處理,存入存儲(chǔ)裝置中,數(shù)字信號(hào)處理器對(duì)存儲(chǔ)于存儲(chǔ)裝置中的影像數(shù)據(jù)進(jìn)行影像辨識(shí)轉(zhuǎn)換運(yùn)算,并將辨識(shí)轉(zhuǎn)換后的文本關(guān)鍵詞存回至存儲(chǔ)裝置中;(iv)然后數(shù)字信號(hào)處理器自前述存儲(chǔ)裝置中擷取前述辨識(shí)結(jié)果;(v)接著再對(duì)該辨識(shí)結(jié)果進(jìn)行查詢;及(vi)將所獲得的相關(guān)信息顯示于顯示器上。
27.如權(quán)利要求26所述的操作方法,其特征在于,在前述步驟(iii),數(shù)字信號(hào)處理器進(jìn)行影像辨識(shí)的程序包括下列步驟(i)數(shù)字信號(hào)處理器讀取影像數(shù)據(jù),并將其以陣列的形式存儲(chǔ)于存儲(chǔ)裝置中;(ii)將影像數(shù)據(jù)陣列的多級(jí)灰度格式或彩色格式轉(zhuǎn)化成二級(jí)灰度格式,藉以區(qū)分文字與背景影像,以便于影像辨識(shí);(iii)根據(jù)各像素的稀疏綢密特征,進(jìn)行二值化的影像陣列所具有的噪聲過濾,去除一些特別稀疏的雜點(diǎn),使待辨識(shí)的影像點(diǎn)陣整齊、清晰(iv)對(duì)影像點(diǎn)陣進(jìn)行搜索、找出由點(diǎn)構(gòu)成的曲線的局部極小點(diǎn),藉以計(jì)算出影像偏斜角度,再根據(jù)此角度,對(duì)影像各像素的坐標(biāo)進(jìn)行旋轉(zhuǎn)校正;(v)將點(diǎn)陣影像依據(jù)其點(diǎn)陣疏密,將其區(qū)分為多塊影像,以便于單個(gè)字元的辨識(shí);(vi)進(jìn)行字元或片語(yǔ)影像循環(huán)辨識(shí)程序。
28.如權(quán)利要求26所述的操作方法,其特征在于,在前述步驟(v),數(shù)字信號(hào)處理器進(jìn)行數(shù)據(jù)庫(kù)查詢的程序包括下列步驟(i)自存儲(chǔ)裝置中讀取經(jīng)辨識(shí)轉(zhuǎn)換后的文本關(guān)鍵詞;(ii)查詢數(shù)據(jù)庫(kù),將文本關(guān)鍵詞與數(shù)據(jù)庫(kù)在既有的數(shù)據(jù)進(jìn)行比較;(iii)決定是否找到相符的數(shù)據(jù),若是,則從數(shù)據(jù)庫(kù)中獲取此關(guān)鍵詞的相關(guān)信息,否則獲取與此關(guān)鍵詞最接近的相關(guān)信息;(iv)將獲取的相關(guān)信息顯示于液晶顯示器上。
29.如權(quán)利要求27所述的操作方法,其特征在于,前述影像循環(huán)辨識(shí)程序包括下列步驟(i)辨識(shí)字元影像的筆劃;(ii)決定字元影像的筆劃數(shù)目;(iii)決定每一筆劃的相對(duì)長(zhǎng)度;(iv)決定相連接筆劃間的角度;(v)決定每一筆劃的方向;(vi)根據(jù)上述步驟取得字元的特征信息;(vii)將每一個(gè)字元像素的特征與字元特征庫(kù)中的每一個(gè)字元影像的特征相比;(viii)判斷是否找到特征相匹配的字元,若是則使用在字元特征庫(kù)中找到的字元做為參考字元碼,否則使用在字元特征庫(kù)中找到特征最接近的字元做為參考字元碼。
全文摘要
本發(fā)明提供一種便攜式攝影閱讀裝置,包括:攝影鏡頭,用以攝入文字、數(shù)字、條形碼、影像;影像感應(yīng)模組,用以接收前述攝影鏡頭攝取的影像,并產(chǎn)生數(shù)字影像信號(hào);數(shù)字信號(hào)處理器,用以對(duì)前述影像感應(yīng)模組輸出的數(shù)字影像信號(hào)進(jìn)行濾波處理,將數(shù)字影像信號(hào)轉(zhuǎn)換為可識(shí)別的圖像數(shù)字信號(hào),然后進(jìn)行光學(xué)字元辨識(shí)及數(shù)字庫(kù)查詢;存儲(chǔ)裝置,用以存儲(chǔ)控制前述數(shù)字信號(hào)處理器的程序及數(shù)據(jù)庫(kù);及顯示裝置,用以顯示前述數(shù)字信號(hào)處理器查詢數(shù)字庫(kù)后所得到的結(jié)果。
文檔編號(hào)G06K9/00GK1259713SQ9812295
公開日2000年7月12日 申請(qǐng)日期1998年11月27日 優(yōu)先權(quán)日1998年11月27日
發(fā)明者張景嵩, 何代水, 陳淮琰, 王曉松, 李玲 申請(qǐng)人:英業(yè)達(dá)集團(tuán)(西安)電子技術(shù)有限公司