專利名稱:移動(dòng)裝置與傳送系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明的領(lǐng)域諸如移動(dòng)電話等帶有內(nèi)置圖象俘獲裝置的移動(dòng)裝置由于CPU性能的增加及CCD等的價(jià)格降低而廣泛普及。通過(guò)俘獲包含由用戶提示的字符串的圖象,并使用帶有內(nèi)置圖象俘獲裝置的移動(dòng)裝置識(shí)別字符串,已能夠從網(wǎng)絡(luò)抽取與字符串相關(guān)的信息。為了從圖象選擇目標(biāo)字符串,需要一種使用移動(dòng)裝置上可被直觀操作的簡(jiǎn)單的用戶界面的指令方法。
在分辨率與識(shí)別率之間總是有一種折衷。當(dāng)需要高識(shí)別率時(shí),需要對(duì)輸入圖象進(jìn)行處理。就結(jié)構(gòu)來(lái)說(shuō),移動(dòng)裝置俘獲高分辨率圖象是困難的。因此,使用由移動(dòng)裝置的照相機(jī)俘獲的低分辨率圖象進(jìn)行字符識(shí)別。
本發(fā)明的背景使用來(lái)自圖象的字符識(shí)別結(jié)果的信息檢索技術(shù)在JP-A-331006/2000及JP-A-254622/1998中有述。另外,JP-A-23012/2000描述了使用移動(dòng)裝置的一種翻譯器。該發(fā)明中,在圖象顯示器上顯示用于向圖形用戶界面(GUI)施加目標(biāo)字符行的行部分。然而,線段在長(zhǎng)度和位置上是固定的,并只用作為操作者俘獲圖形的索引,于是需要操作者調(diào)節(jié)字符行的位置和大小。該先有技術(shù)文獻(xiàn)沒(méi)有公開(kāi)任何用于通過(guò)移動(dòng)裝置中低分辨率圖象俘獲裝置俘獲圖象的字符識(shí)別。
JP-A-23012/2000描述了一種裝置,該裝置在移動(dòng)電話或移動(dòng)裝置中包含了一種的CCD相機(jī),以便俘獲圖象而進(jìn)行字符識(shí)別,并具有在語(yǔ)言之間進(jìn)行翻譯的翻譯功能,以及基于檢索的結(jié)果進(jìn)行檢索的檢索功能。然而,它沒(méi)有對(duì)操作者提供任何易于從圖象選擇目標(biāo)字符行的裝置。反之,根據(jù)本發(fā)明,任何需要時(shí),從輸入圖象抽取字符行的結(jié)果就能呈現(xiàn)給操作者。這使得能夠易于確認(rèn)目標(biāo)字符行。
此外,在平衡成本和尺寸時(shí),包含在移動(dòng)裝置等中的圖象俘獲裝置很難設(shè)計(jì)成能夠俘獲高分辨率圖象。如果對(duì)低分辨率圖象進(jìn)行識(shí)別處理,識(shí)別率受到負(fù)面的影響,這可能會(huì)限制操作者的意圖。這種情形下,根據(jù)本發(fā)明,從俘獲的低分辨率圖象進(jìn)行字符行的抽取處理,并然后字符行的圖象受到擴(kuò)展處理。其結(jié)果是提高了字符行圖象的分辨率,改進(jìn)了識(shí)別率。
本發(fā)明的概述本發(fā)明的目的是要提供一種移動(dòng)裝置,該裝置具有用于在俘獲的圖象中抽取字符圖象嵌入?yún)^(qū)域的一種裝置,其中在俘獲的圖象變化時(shí)字符行嵌入?yún)^(qū)域被連續(xù)抽取,且抽取的字符行嵌入?yún)^(qū)域隨之顯示在顯示裝置上,直到使輸入達(dá)到確認(rèn)裝置。本發(fā)明還具有用于確認(rèn)字符行確認(rèn)區(qū)域要被處理以供識(shí)別的裝置,用于通過(guò)網(wǎng)絡(luò)傳送識(shí)別結(jié)果的裝置,以及用于通過(guò)網(wǎng)絡(luò)基于識(shí)別的結(jié)果接收反饋的裝置。
本發(fā)明的另一目的是要提供進(jìn)而具有俘獲圖象分辨率提高裝置的移動(dòng)裝置,其中被確認(rèn)的字符行確認(rèn)區(qū)域受到象素補(bǔ)充,平滑,及二值化。
本發(fā)明的另一目的是要提供一種具有移動(dòng)裝置及通過(guò)網(wǎng)絡(luò)連接到該移動(dòng)裝置的傳送系統(tǒng),其中移動(dòng)裝置具有用于通過(guò)網(wǎng)絡(luò)向計(jì)算機(jī)傳送移動(dòng)裝置上獲得識(shí)別結(jié)果或字符行抽取區(qū)域的裝置,且計(jì)算機(jī)具有基于傳送的識(shí)別結(jié)果或字符行抽取區(qū)域通過(guò)網(wǎng)絡(luò)進(jìn)行信息搜索,并用于向移動(dòng)裝置傳送搜索結(jié)果的裝置。
附圖的簡(jiǎn)要說(shuō)明從以下參照附圖所考慮的詳細(xì)說(shuō)明本發(fā)明以上和附加的特性及特征將更為明顯,附圖中相同的標(biāo)號(hào)指示相同的元件,且其中
圖1是使用帶有識(shí)別功能的移動(dòng)裝置的信息收集的圖示;圖2是表示根據(jù)本發(fā)明移動(dòng)裝置的顯示內(nèi)容的圖示;圖3是表示根據(jù)本發(fā)明移動(dòng)裝置的其它顯示內(nèi)容的圖示;圖4是表示本發(fā)明的移動(dòng)裝置硬件配置的圖示;圖5是一流程圖,表示本發(fā)明網(wǎng)絡(luò)上的移動(dòng)裝置和計(jì)算機(jī)內(nèi)處理流程;圖6是字符行抽取的概念圖示;圖7是字符行抽取的流程圖;圖8是高分辨率圖象生成的概念圖示;圖9是高分辨率圖象生成的流程圖;圖10是字符行識(shí)別的概念圖示;圖11是字符行識(shí)別的流程圖;圖12表示顯示兩個(gè)或多個(gè)字符序列識(shí)別結(jié)果的一例。
優(yōu)選實(shí)施例的詳細(xì)說(shuō)明參照附圖對(duì)本發(fā)明詳細(xì)說(shuō)明如下。
圖1示出本發(fā)明中使用的一種移動(dòng)裝置,且?guī)в凶址械膶?duì)象圖象用作為輸入數(shù)據(jù)。標(biāo)號(hào)101標(biāo)記移動(dòng)裝置的一例。標(biāo)號(hào)102標(biāo)記移動(dòng)裝置101上的內(nèi)容顯示器。但是,相機(jī)在顯示器相對(duì)一側(cè)用作為圖象俘獲裝置。標(biāo)號(hào)103標(biāo)記控制桿,且104標(biāo)記按鈕。內(nèi)容顯示器是觸摸板,通過(guò)該觸摸板操作者能夠直接提供指令。使用這種移動(dòng)裝置,如標(biāo)號(hào)105標(biāo)記的對(duì)象上的URL地址和字符行圖象被俘獲。然后進(jìn)行字符行嵌入?yún)^(qū)域的抽取和字符行的識(shí)別。然后通過(guò)如標(biāo)號(hào)106所標(biāo)記的無(wú)線通信傳輸數(shù)據(jù)。使用連接到如標(biāo)號(hào)107所標(biāo)記的網(wǎng)絡(luò)的計(jì)算機(jī),可在網(wǎng)絡(luò)上搜索、傳輸并顯示與識(shí)別的內(nèi)容相關(guān)的信息。操作者看見(jiàn)顯示的內(nèi)容,并再次提供指令。這樣,相關(guān)的信息被檢索。
圖2和3表示本發(fā)明的內(nèi)容的顯示的例子。
圖2示出一例,其中已經(jīng)對(duì)嵌入在俘獲的對(duì)象圖象中的URL字符行進(jìn)行了字符識(shí)別處理,并基于識(shí)別的結(jié)果已經(jīng)檢索出對(duì)應(yīng)于該URL的主頁(yè)。首先,由圖象俘獲裝置俘獲的對(duì)象顯示在由標(biāo)號(hào)201標(biāo)記的內(nèi)容顯示器上。如202標(biāo)記的一個(gè)記號(hào)顯示在內(nèi)容顯示器中。該記號(hào)可由操作者移動(dòng)。在位于靠近該記號(hào)處對(duì)URL字符行上進(jìn)行字符行矩形抽取處理。每當(dāng)需要時(shí),由203標(biāo)記的從抽取所得的矩形條(虛線內(nèi))被重新加載,且重新加載的矩形條被重復(fù)顯示。其結(jié)果是,操作者通過(guò)操作該裝置或移動(dòng)記號(hào),能夠易于選擇識(shí)別的目標(biāo)字符行。當(dāng)所得的矩形輪廓正確地包圍了目標(biāo)字符行時(shí),用戶輸入確認(rèn)指令以進(jìn)行對(duì)于矩形條內(nèi)字符行的字符的識(shí)別。此后,識(shí)別的結(jié)果顯示在如204所標(biāo)記的彈出式窗口中。如果識(shí)別的結(jié)果正確,操作者輸入確認(rèn)指令。結(jié)果是,如205所標(biāo)記的圖示所示,對(duì)應(yīng)于識(shí)別結(jié)果的在URL處可得的內(nèi)容從計(jì)算機(jī)在網(wǎng)絡(luò)上傳輸?shù)揭苿?dòng)裝置。此后,操作者看見(jiàn)顯示器上的內(nèi)容,并選擇由206所標(biāo)記的顯示器上的圖標(biāo)。這樣,檢索到相關(guān)的信息。
圖3示出一例,其中已經(jīng)對(duì)俘獲的對(duì)象上的字符行進(jìn)行了字符識(shí)別處理,并已經(jīng)基于識(shí)別的結(jié)果搜索了網(wǎng)絡(luò)上的內(nèi)容,以便被顯示在移動(dòng)裝置上。與圖2同樣的方式,俘獲的內(nèi)容顯示在由301標(biāo)記的顯示器上。這時(shí),最接近由302標(biāo)記的記號(hào)的字符行被抽取。對(duì)于來(lái)自由303標(biāo)記的相繼顯示的字符行矩形條的字符行矩形條,用戶輸入一確認(rèn)指令。在識(shí)別處理之后,識(shí)別結(jié)果顯示在由304標(biāo)記的彈出式窗口中。當(dāng)識(shí)別結(jié)果正確時(shí),操作者輸入一確認(rèn)指令。之后,識(shí)別結(jié)果被輸入到與網(wǎng)絡(luò)連接的搜索引擎。然后,移動(dòng)裝置接收獲得的搜索結(jié)果,并由305標(biāo)記的圖示所示那樣顯示該結(jié)果。然后,操作者看見(jiàn)顯示的搜索結(jié)果,并在顯示器上選擇圖標(biāo)以接收其它內(nèi)容。
圖4示出移動(dòng)裝置的硬件配置。該移動(dòng)裝置包括用于執(zhí)行控制、圖象處理及字符識(shí)別的CPU(401),存儲(chǔ)器(402),顯示器(403),用于俘獲輸入數(shù)據(jù)的圖象俘獲裝置(404),用于無(wú)線通信的天線(405),揚(yáng)聲器(406),話筒(407),電池(408),按鈕(409),及內(nèi)裝在其中覆蓋在通過(guò)總線連接的顯示器上的觸摸板(410)。
圖5示出本發(fā)明的總體處理流程。首先,在移動(dòng)裝置中,在步驟501使用圖象俘獲裝置由CCD俘獲目標(biāo)對(duì)象的圖象。在步驟501被俘獲的圖象顯示在顯示器中。然后,如圖2和3所示,在步驟502使用最靠近記號(hào)字符作為核心進(jìn)行字符行抽取處理。在步驟503這樣獲得的抽取的結(jié)果以重疊的方式顯示在顯示器中的內(nèi)容上的矩形條中。這樣,進(jìn)程返回圖象俘獲步驟501并之后被重復(fù),直到在步驟504操作者輸入確認(rèn)指令。
在操作者輸入確認(rèn)指令之后,使用顯示的矩形條內(nèi)的本地圖象進(jìn)行圖象處理,并對(duì)于識(shí)別處理輸入被處理的數(shù)據(jù)。通過(guò)步驟505對(duì)從圖象俘獲裝置俘獲的低分辨率輸入圖象進(jìn)行分辨率提高處理。在步驟519輸入提高了分辨率的本地圖象用于字符行識(shí)別。然后,在步驟507向操作者呈現(xiàn)字符識(shí)別結(jié)果,并請(qǐng)求指令。當(dāng)操作者判斷出結(jié)果正確時(shí),操作者輸入確認(rèn)指令。被確認(rèn)的數(shù)據(jù)通過(guò)無(wú)線通信傳送到與網(wǎng)絡(luò)連接的計(jì)算機(jī)。如果操作者判斷出不是正確的識(shí)別結(jié)果,則進(jìn)程返回步驟501處理由通信俘獲裝置俘獲的另一圖象,并重復(fù)后繼的處理步驟。
在步驟509傳送到計(jì)算機(jī)的字符行由計(jì)算機(jī)或服務(wù)器接收。在步驟510區(qū)分字符行是URL地址還是其它字符行。如果字符行是URL地址,則在步驟511通過(guò)因特網(wǎng)鏈接該URL地址的萬(wàn)維網(wǎng)頁(yè),并在步驟512傳送到移動(dòng)裝置。否則,在步驟513區(qū)分字符行是否為電子郵件地址。如果是電子郵件地址,則在步驟512向該裝置傳送該地址已經(jīng)插入其地址字段的郵件處理程序??梢允褂糜蒍ava等寫(xiě)成的應(yīng)用程序?qū)崿F(xiàn)郵件處理程序。進(jìn)而,用于郵件處理的程序可以存儲(chǔ)到移動(dòng)裝置以便再次使用。然而,當(dāng)字符行既不是URL地址又不是電子郵件地址時(shí),在步驟515它被輸入到與因特網(wǎng)連接的內(nèi)容搜索引擎,以便以該字符行作為關(guān)鍵字進(jìn)行搜索。在步驟516,搜索的結(jié)果傳送到該裝置并呈現(xiàn)給操作者。
在移動(dòng)裝置側(cè),在步驟517接收內(nèi)容,并在步驟518,操作者查看內(nèi)容,以選擇所需的內(nèi)容,通過(guò)選擇適當(dāng)?shù)陌粹o進(jìn)行郵件處理等。
除了上述通過(guò)網(wǎng)絡(luò)在移動(dòng)裝置和計(jì)算機(jī)之間數(shù)據(jù)傳送處理共享之外,也可設(shè)想其它的活動(dòng)。例如,在移動(dòng)裝置上選擇目標(biāo)字符行嵌入?yún)^(qū)域,然后向網(wǎng)絡(luò)上的計(jì)算機(jī)傳送本地的圖象(而不是識(shí)別的結(jié)果)。然后,由計(jì)算機(jī)進(jìn)行圖象處理和字符識(shí)別。還有可以設(shè)想的傳送裝置用于把本地圖象附加到郵件并將其傳送?;谧鳛樽址R(shí)別處理的結(jié)果而獲得的多種候選項(xiàng),根據(jù)候選項(xiàng)的順序可在網(wǎng)絡(luò)上對(duì)內(nèi)容進(jìn)行搜索。當(dāng)使用多個(gè)候選項(xiàng)進(jìn)行搜索,并找到適當(dāng)?shù)膬?nèi)容時(shí),這些內(nèi)容被傳送到移動(dòng)裝置,并在其上顯示。如果基于所有的候選項(xiàng)通過(guò)搜索沒(méi)有找到適當(dāng)?shù)膬?nèi)容,改變參數(shù)以便重復(fù)字符識(shí)別處理。
使用上述的處理,只是在輸入字符行嵌入?yún)^(qū)域確認(rèn)指令之后操作者才能夠查看所需的內(nèi)容。然而,即使字符識(shí)別結(jié)果已經(jīng)失敗,如果存在任何對(duì)應(yīng)的的內(nèi)容,則顯示與操作者所需要的那些不同的內(nèi)容。
而且,可能對(duì)移動(dòng)裝置和計(jì)算機(jī)之間的傳送和接收的服務(wù)進(jìn)行收費(fèi)。由于這種服務(wù)收費(fèi),在接收字符串(失敗的結(jié)果)時(shí),或在本地圖象用作為來(lái)自移動(dòng)裝置被識(shí)別的對(duì)象時(shí),或在內(nèi)容向移動(dòng)裝置側(cè)傳送時(shí),管理連接到網(wǎng)絡(luò)的計(jì)算機(jī)的公司對(duì)操作者因服務(wù)而收費(fèi)。操作者能夠在確認(rèn)字符串識(shí)別結(jié)果之后接收內(nèi)容。結(jié)果是,保證穩(wěn)定的服務(wù)。
圖6示出字符行抽取處理的概念圖。首先,標(biāo)號(hào)601標(biāo)記由移動(dòng)裝置的相機(jī)俘獲的圖象,602是其上描述了目標(biāo)字符行的一對(duì)象。在顯示器中心由標(biāo)號(hào)603標(biāo)記的符號(hào)是一記號(hào)。用于抽取位于靠近記號(hào)的字符行的處理被執(zhí)行。通過(guò)由操作者點(diǎn)擊觸摸板或按鈕,記號(hào)的屏上位置能夠被移動(dòng)。然后,輸入圖象被二值化。然后生成大量黑色象素連接的部件。標(biāo)號(hào)604標(biāo)記顯示各連接部件的外圍矩形輪廓的圖象。使用連接部件的外圍矩形位置信息進(jìn)行字符行抽取的處理,以便加速處理。然后,選擇并以605標(biāo)記的粗體矩形輪廓指示最靠近記號(hào)的連接部件的外圍矩形輪廓之一。連接部件用作為字符行抽取的初始狀態(tài)的“核”。用作為“核”的連接部件不對(duì)操作者顯示。標(biāo)號(hào)606標(biāo)記字符行抽取的進(jìn)展。通過(guò)從605標(biāo)記的核向外把相鄰的連接部件結(jié)合在一起,形成字符行矩形條。然后,607標(biāo)記作為向外結(jié)合的結(jié)果由連接部件組成的字符行矩形。標(biāo)號(hào)608標(biāo)記由操作者所見(jiàn)到的字符行矩形抽取結(jié)果的顯示。虛線矩形條是字符行抽取結(jié)果。當(dāng)操作者看見(jiàn)矩形條,且矩形條正確地封閉了目標(biāo)字符行時(shí),操作者通過(guò)按鈕輸入確認(rèn)指令。當(dāng)需要時(shí)通過(guò)移動(dòng)該裝置或平移記號(hào)而改變字符行結(jié)果矩形條。
圖7示出字符行抽取處理的處理流程。字符行抽取處理以以下的方式實(shí)現(xiàn)。首先,在步驟701由圖象俘獲裝置俘獲圖象。在步驟702使輸入的圖象二值化,并然后在步驟703進(jìn)行噪聲去除。接下來(lái),在步驟704,從二值圖象生成連接部件,并在步驟705選擇最接近記號(hào)的連接部件作為初始值的“核”。然后在步驟706,在從作為“核”的連接部件起給定的短范圍內(nèi)使連接部件結(jié)合在一起以形成一字符行矩形條。然后,輸出字符行位置。在步驟707在顯示器中動(dòng)態(tài)地顯示該矩形條。進(jìn)程返回到圖象俘獲步驟701,重復(fù)后繼的處理步驟,直到用戶在步驟708輸入確認(rèn)指令。當(dāng)用戶已經(jīng)輸入確認(rèn)指令時(shí),字符行位置進(jìn)到對(duì)高分辨率字符行抽取處理。
圖8示出高分辨率圖象生成的概念圖。在為識(shí)別處理輸入字符行圖象之前,作為對(duì)象的本地圖象受到象素補(bǔ)充以生成高分辨率本地圖象,改進(jìn)識(shí)別率。標(biāo)號(hào)801標(biāo)記在操作者已經(jīng)對(duì)字符行矩形條輸入確認(rèn)指令之后的顯示。標(biāo)號(hào)802標(biāo)記通過(guò)對(duì)來(lái)自基于字符行矩形位置信息在圖象俘獲時(shí)獲得的圖象的本地圖象的修剪而獲得的圖象。本地圖象受到象素補(bǔ)充處理達(dá)到較高的分辨率,其結(jié)果是由標(biāo)號(hào)803標(biāo)記的圖象。當(dāng)以這種方式通過(guò)象素補(bǔ)充實(shí)現(xiàn)分辨率的提高時(shí),每一模糊的線段以階梯構(gòu)型出現(xiàn)。這種情形下,對(duì)圖象進(jìn)行平滑處理。結(jié)果是,如同由804標(biāo)記的圖示那樣,降低了噪聲,使得模糊的線段的構(gòu)型也變得平滑了。然后,進(jìn)行二值化處理以生成高分辨率無(wú)噪聲的字符模式圖象。清晰的構(gòu)型如805所標(biāo)記的圖示所示。即使使用低分辨率俘獲裝置,但通過(guò)輸入高分辨率線條圖象供識(shí)別處理,能夠獲得高分辨率的識(shí)別結(jié)果。
圖9示出高分辨率圖象生成的處理流程。首先,基于在字符行抽取處理中確定的字符行位置,在步驟901從圖象俘獲時(shí)獲得的圖象修剪本地圖象。在步驟902通過(guò)象素補(bǔ)充本地圖象受到圖象擴(kuò)展。然后擴(kuò)展的圖象在步驟903受到平滑處理,之后在步驟904被平滑化。結(jié)果是,生成高分辨率二值圖象。
圖10表示字符行識(shí)別處理的概念圖。標(biāo)號(hào)1001標(biāo)記已經(jīng)被輸入的字符行圖象。標(biāo)號(hào)1002標(biāo)記對(duì)于字符行圖象為每一連接部件生成的字符模式候選項(xiàng)。標(biāo)號(hào)1003標(biāo)記只截取“h”獲得的模式,而1004標(biāo)記組合“ht”獲得的模式。通過(guò)從這些組合中選擇適當(dāng)?shù)淖址J?,并在網(wǎng)絡(luò)上進(jìn)行路由搜索,能夠獲得字符行的識(shí)別結(jié)果。通過(guò)在網(wǎng)絡(luò)上向字符識(shí)別模塊輸入模式而獲得的結(jié)果由標(biāo)號(hào)1005標(biāo)記。需要說(shuō)明如下正如由1006標(biāo)記的,對(duì)于“h”的模式1003獲得“h”的識(shí)別結(jié)果;而如由1007的標(biāo)記的,對(duì)于兩個(gè)字符“ht”的組合模式的識(shí)別結(jié)果是“n”(即“ht”被手為“n”)。這樣,對(duì)于每一模式的字符識(shí)別結(jié)果與用于字符識(shí)別的模板之間的相似性程度被記錄在以分割假設(shè)圖描繪的網(wǎng)絡(luò)上。標(biāo)號(hào)1008標(biāo)記基于字?jǐn)?shù)據(jù)庫(kù)和識(shí)別結(jié)果之間的相似性程度通過(guò)網(wǎng)絡(luò)進(jìn)行路由搜索獲得的結(jié)果,其中每一識(shí)別處理的記錄已經(jīng)被收集起來(lái)。這個(gè)例子中,對(duì)于常常作為URL出現(xiàn)的字(http,//,www.co.jp,com,等)的路由基于字?jǐn)?shù)據(jù)庫(kù)被篩選/縮減。對(duì)于其它字的每一路由使用識(shí)別結(jié)果的相似性程度作為索引而被確定。為了獲得字?jǐn)?shù)據(jù)庫(kù),以下的手段應(yīng)考慮到URL地址是從DNS(域名服務(wù)器)獲得的,或者當(dāng)符號(hào)牌等用作為對(duì)象時(shí),現(xiàn)有的字是使用地理位置信息被篩選/縮減的。通過(guò)把確定的路由上的字符串在一起獲得的字符行由標(biāo)號(hào)1009標(biāo)記,這是對(duì)字符行圖象識(shí)別的結(jié)果。
圖11示出字符行識(shí)別的處理流程。首先,在步驟1101對(duì)輸入的字符行圖象生成作為字符模式候選項(xiàng)的組合以便構(gòu)成網(wǎng)絡(luò)。然后,在步驟1102,各字符模式候選項(xiàng)受到字符識(shí)別,并且使其對(duì)應(yīng)的識(shí)別結(jié)果和相似性程度相配。接下來(lái)在步驟1103,使用先前存儲(chǔ)的字?jǐn)?shù)據(jù)庫(kù)進(jìn)行網(wǎng)絡(luò)上的路由限制。然后,使用字?jǐn)?shù)據(jù)庫(kù)限制和字符識(shí)別結(jié)果的相似性程度確定網(wǎng)絡(luò)上最優(yōu)路由。從而,獲得字符行識(shí)別結(jié)果。
圖12示出兩個(gè)或多個(gè)字符序列識(shí)別結(jié)果。1201是移動(dòng)裝置的顯示屏幕,1202是記號(hào)。當(dāng)矩形對(duì)字符行諸如1203“ABCD RPOJECTco.”畫(huà)出輪廓以進(jìn)行識(shí)別操作時(shí),對(duì)由矩形畫(huà)出輪廓的字符行進(jìn)行字符序列識(shí)別處理。每當(dāng)在識(shí)別操作中引起模糊時(shí),在彈出式框1204中出現(xiàn)兩個(gè)或多個(gè)識(shí)別結(jié)果的候選項(xiàng)。在圖12中,識(shí)別結(jié)果候選項(xiàng)的數(shù)目是三,而正確的回答是候選項(xiàng)1,操作者可以點(diǎn)擊候選項(xiàng)1或輸入號(hào)碼“1”而選擇候選項(xiàng)1。另外,用戶能夠簡(jiǎn)單地以手指或指點(diǎn)物體觸摸觸摸板。于是,選擇了正確的識(shí)別結(jié)果,然后通過(guò)網(wǎng)絡(luò)被傳送到PC。此后,根據(jù)選擇的字符序列進(jìn)行處理。
使用上述的方法,能夠選擇由操作者確認(rèn)的字符行,并從字符識(shí)別的結(jié)果獲得信息內(nèi)容。
根據(jù)本發(fā)明,能夠?qū)ζ渖厦枋隽私o定的字符行的對(duì)象進(jìn)行拍攝,并使用內(nèi)置有圖象俘獲裝置的移動(dòng)裝置基于字符行獲得信息。進(jìn)而,當(dāng)操作者選擇給定的字符行時(shí),能夠便于操作移動(dòng)裝置。而且進(jìn)而,即使當(dāng)使用低分辨率圖象俘獲裝置時(shí),能夠通過(guò)以虛假的方式生成高分辨率圖象,并進(jìn)行字符識(shí)別處理而提高識(shí)別率。
本發(fā)明的原理、優(yōu)選實(shí)施例及操作方式已經(jīng)體現(xiàn)在上述說(shuō)明書(shū)中。然而,應(yīng)受到保護(hù)的本發(fā)明不限于所公開(kāi)的特定的實(shí)施例。這里所述的實(shí)施例只是示例性而不是限制性的。在不背離本發(fā)明的精神之下可以通過(guò)其它及所采用的等價(jià)物作出變形和變化。因而,要強(qiáng)調(diào)的是,所有屬于如權(quán)利要求中定義的本發(fā)明的精神和范圍的這些變形和變化和等價(jià)物均包括在內(nèi)。
權(quán)利要求
1.一種移動(dòng)裝置,包括用于俘獲圖象的裝置;用于顯示所俘獲的圖象的裝置;用于自動(dòng)抽取俘獲的圖象中字符行嵌入?yún)^(qū)域的裝置;用于確認(rèn)的裝置,確認(rèn)由抽取裝置抽取的字符行嵌入?yún)^(qū)域是要被處理以供識(shí)別;用于識(shí)別嵌入在被確認(rèn)的字符行嵌入?yún)^(qū)域中的字符行的裝置;用于通過(guò)網(wǎng)絡(luò)傳送識(shí)別結(jié)果的裝置;以及用于通過(guò)網(wǎng)絡(luò)基于識(shí)別結(jié)果接收反饋的裝置,其中抽取裝置從變化的被俘獲的圖象連續(xù)抽取字符行嵌入?yún)^(qū)域,且顯示裝置據(jù)此顯示抽取的字符行嵌入?yún)^(qū)域,直到確認(rèn)信號(hào)輸入到確認(rèn)裝置為止。
2.根據(jù)權(quán)利要求1的移動(dòng)裝置,其中顯示裝置顯示一記號(hào),抽取裝置檢測(cè)俘獲的圖象中的模式,并且使用最接近記號(hào)的模式之一作為核,用于結(jié)合相鄰的模式,從而抽取字符行嵌入?yún)^(qū)域。
3.根據(jù)權(quán)利要求2的移動(dòng)裝置,其中記號(hào)是可移動(dòng)的。
4.根據(jù)權(quán)利要求1的移動(dòng)裝置,還包括用于呈現(xiàn)由字符行識(shí)別裝置識(shí)別的多個(gè)識(shí)別候選項(xiàng)的裝置;以及用于選擇識(shí)別候選項(xiàng)之一的裝置。
5.根據(jù)權(quán)利要求1的移動(dòng)裝置,還包括分辨率提高裝置,所述分辨率提高裝置使確認(rèn)的字符行嵌入?yún)^(qū)域受到象素補(bǔ)充,平滑化,及二值化。
6.根據(jù)權(quán)利要求2的移動(dòng)裝置,其中每一模式是圍繞俘獲的圖象中一個(gè)連接部件的矩形輪廓。
7.一種圖象處理和傳送系統(tǒng),包括移動(dòng)裝置和通過(guò)網(wǎng)絡(luò)連接到該移動(dòng)裝置的計(jì)算機(jī),移動(dòng)裝置包括用于俘獲圖象的裝置;用于顯示所俘獲的圖象的裝置;用于自動(dòng)抽取俘獲的圖象中字符行嵌入?yún)^(qū)域的裝置;用于確認(rèn)的裝置,確認(rèn)由抽取裝置抽取的字符行嵌入?yún)^(qū)域是要被處理以供識(shí)別;用于通過(guò)網(wǎng)絡(luò)傳送數(shù)據(jù)的裝置;以及用于通過(guò)網(wǎng)絡(luò)基于識(shí)別結(jié)果接收反饋的裝置,其中抽取裝置從變化的被俘獲的圖象連續(xù)抽取字符行嵌入?yún)^(qū)域,且顯示裝置據(jù)此顯示抽取的字符行嵌入?yún)^(qū)域,直到確認(rèn)信號(hào)輸入到確認(rèn)裝置為止;計(jì)算機(jī)包括一裝置,用于通過(guò)網(wǎng)絡(luò)基于嵌入到被確認(rèn)的字符行嵌入?yún)^(qū)域的字符行搜索信息,并用于向移動(dòng)裝置傳送搜索的結(jié)果;以及用于識(shí)別嵌入在被確認(rèn)的字符行嵌入?yún)^(qū)域中的字符行的裝置配置在移動(dòng)裝置中或者配置在計(jì)算機(jī)中。
8.根據(jù)權(quán)利要求7的圖象處理和傳送系統(tǒng),其中計(jì)算機(jī)還包括一個(gè)裝置,用于區(qū)分識(shí)別的結(jié)果是URL地址、電子郵件地址還是一個(gè)其它字符串,一個(gè)裝置,用于如果區(qū)分的結(jié)果是URL地址,則向移動(dòng)裝置傳送由URL地址鏈接的內(nèi)容;一個(gè)裝置,用于如果區(qū)分的結(jié)果是郵件地址,則向移動(dòng)裝置傳送用于處理郵件的程序,及一個(gè)裝置,用于如果區(qū)分的結(jié)果是所述其它字符串,則啟動(dòng)一搜索程序的以便在網(wǎng)絡(luò)中基于所述其它字符串搜索信息,并用于向移動(dòng)裝置傳送搜索的結(jié)果。
9.根據(jù)權(quán)利要求7的圖象處理和傳送系統(tǒng),還包括一裝置,用于當(dāng)移動(dòng)裝置接收從計(jì)算機(jī)傳送的搜索結(jié)果時(shí)進(jìn)行收費(fèi)。
10.根據(jù)權(quán)利要求1的移動(dòng)裝置,其中顯示裝置有選擇地顯示由遙控相機(jī)俘獲的圖象,并通過(guò)網(wǎng)絡(luò)傳送到移動(dòng)裝置,顯示裝置顯示被傳送的圖象;抽取裝置在被傳送的圖象中抽取字符行嵌入?yún)^(qū)域,及抽取裝置從變化的被傳送的圖象中連續(xù)抽取字符行,且顯示裝置據(jù)此顯示被抽取的字符行嵌入?yún)^(qū)域,直到確認(rèn)信號(hào)輸入到確認(rèn)裝置為止。
11.根據(jù)權(quán)利要求7的圖象處理和傳送系統(tǒng),其中顯示裝置有選擇地顯示由遙控相機(jī)俘獲的圖象,并通過(guò)網(wǎng)絡(luò)傳送到移動(dòng)裝置,顯示裝置顯示被傳送的圖象;抽取裝置在被傳送的圖象中抽取字符行嵌入?yún)^(qū)域,及抽取裝置從變化的被傳送的圖象中連續(xù)抽取字符行嵌入?yún)^(qū)域,且顯示裝置據(jù)此顯示被抽取的字符行嵌入?yún)^(qū)域,直到確認(rèn)信號(hào)輸入到確認(rèn)裝置為止。
12.根據(jù)權(quán)利要求7的圖象處理和傳送系統(tǒng),其中移動(dòng)裝置顯示裝置顯示一記號(hào),抽取裝置檢測(cè)被俘獲的圖象中的模式,及最靠近該記號(hào)的模式之一用作為核,以便結(jié)合相鄰的模式,從而抽取字符行嵌入?yún)^(qū)域。
13.根據(jù)權(quán)利要求12的圖象處理和傳送系統(tǒng),其中記號(hào)是可移動(dòng)的。
14.根據(jù)權(quán)利要求7的圖象處理和傳送系統(tǒng),其中移動(dòng)裝置還包括用于呈現(xiàn)由字符行識(shí)別裝置識(shí)別的多個(gè)識(shí)別候選項(xiàng)的裝置;以及用于選擇識(shí)別候選項(xiàng)之一的裝置。
15.根據(jù)權(quán)利要求7的圖象處理和傳送系統(tǒng),其中移動(dòng)裝置還包括分辨率提高裝置,所述分辨率提高裝置使確認(rèn)的字符行嵌入?yún)^(qū)域受到象素補(bǔ)充,平滑化,及二值化。
16.根據(jù)權(quán)利要求12的圖象處理和傳送系統(tǒng),其中每一模式是圍繞俘獲的圖象中一個(gè)連接部件的矩形輪廓。
17.一種移動(dòng)裝置,包括用于俘獲圖象的裝置;用于顯示所俘獲的圖象的裝置;用于自動(dòng)抽取俘獲的圖象中字符行嵌入?yún)^(qū)域的裝置;用于確認(rèn)的裝置,確認(rèn)由抽取裝置抽取的字符行嵌入?yún)^(qū)域是要被處理以供識(shí)別;分辨率提高裝置,用于使確認(rèn)的字符行嵌入?yún)^(qū)域受到象素補(bǔ)充,平滑化,及二值化;及用于識(shí)別嵌入在分辨率被提高的字符行嵌入?yún)^(qū)域中的字符行的裝置。
18.根據(jù)權(quán)利要求17的移動(dòng)裝置,其中顯示裝置顯示一記號(hào),抽取裝置檢測(cè)被俘獲的圖象中的模式,及最靠近該記號(hào)的模式之一用作為核,以便結(jié)合相鄰的模式,從而抽取字符行嵌入?yún)^(qū)域。
19.根據(jù)權(quán)利要求18的移動(dòng)裝置,其中記號(hào)是可移動(dòng)的。
20.根據(jù)權(quán)利要求18的移動(dòng)裝置,其中每一模式是圍繞俘獲的圖象中一個(gè)連接部件的矩形輪廓。
全文摘要
本發(fā)明涉及一種移動(dòng)裝置,其帶有內(nèi)置的圖象俘獲裝置,及字符識(shí)別功能,以便呈現(xiàn)隨字符識(shí)別結(jié)果收集的信息。使用該移動(dòng)裝置,需要時(shí)可顯示字符行抽取進(jìn)程,并可提高被輸入供識(shí)別處理的圖象的分辨率。據(jù)此,操作者能夠易于選擇目標(biāo)字符行。此外,該移動(dòng)裝置的字符識(shí)別率通過(guò)分辨率的提高而被改進(jìn)。
文檔編號(hào)G06K9/03GK1407826SQ0213033
公開(kāi)日2003年4月2日 申請(qǐng)日期2002年8月16日 優(yōu)先權(quán)日2001年9月5日
發(fā)明者影廣達(dá)彥, 關(guān)峰伸, 酒匂裕 申請(qǐng)人:株式會(huì)社日立制作所