可以包括可由OCR系統(tǒng)120的web服務(wù)器124訪問(wèn)的數(shù)據(jù)存儲(chǔ)單元127。數(shù)據(jù)存儲(chǔ)單元127可以包括一個(gè)或多個(gè)有形計(jì)算機(jī)可讀存儲(chǔ)設(shè)備。
[0070 ]說(shuō)明書(shū)中被描述為由OCR系統(tǒng)120所執(zhí)行的任何功能可以由OCR應(yīng)用115、用戶計(jì)算設(shè)備110、或任何其他合適硬件或軟件系統(tǒng)或應(yīng)用來(lái)執(zhí)行。
[0071]用戶101可以在進(jìn)行諸如購(gòu)物、憑票進(jìn)入、會(huì)員簽到、或其他合適交易的交易時(shí)采用卡102。用戶101可以獲得卡信息以便將卡102所表示的賬戶輸入到計(jì)算設(shè)備110的數(shù)字錢包應(yīng)用模塊111或者用于其他數(shù)字賬戶用途???02通常是塑料卡,在卡102上包含賬戶信息和其他數(shù)據(jù)。在許多卡102實(shí)施例中,顧客名、有效期、和卡號(hào)物理地凸印在卡102上。凸印的信息可以從卡102的正面和背面看見(jiàn),盡管凸印信息通常在卡102的背面是反轉(zhuǎn)的。
[0072]將認(rèn)識(shí)到,所示的網(wǎng)絡(luò)連接是示例性的,可以使用在計(jì)算機(jī)和設(shè)備之間建立通信鏈路的其他裝置。而且,從本公開(kāi)獲益的本領(lǐng)域普通技術(shù)人員將認(rèn)識(shí)到,圖1中所示的用戶設(shè)備110、0CR系統(tǒng)120、支付處理系統(tǒng)140、和卡發(fā)行者系統(tǒng)170可以具有若干其他合適計(jì)算機(jī)系統(tǒng)配置的任何一種。例如,被實(shí)現(xiàn)為移動(dòng)電話或手持計(jì)算機(jī)的用戶設(shè)備110可以不包括上述的所有部件。
[0073]示例處理
[0074]下面關(guān)于示例操作環(huán)境100的組件來(lái)描述圖2至圖5中所圖示的示例方法。圖2至圖5的示例方法還可以利用其他系統(tǒng)以及在其他環(huán)境中執(zhí)行。
[0075]圖2是根據(jù)某些示例實(shí)施例的、描繪用于利用松卡102對(duì)準(zhǔn)來(lái)提取金融賬戶信息的方法200的塊流程圖。
[0076]參看圖1和2,在塊205中,用戶設(shè)備110上的光學(xué)字符辨識(shí)(“OCR”)應(yīng)用115獲得卡102的數(shù)字掃描。用戶101采用移動(dòng)電話、數(shù)碼相機(jī)、或其他用戶計(jì)算設(shè)備110來(lái)捕捉與用戶101想要輸入到用戶計(jì)算設(shè)備110中的賬戶相關(guān)聯(lián)的卡102的圖像。
[0077]用戶計(jì)算設(shè)備110上的OCR應(yīng)用115接收卡102的圖像。圖像可以從用戶計(jì)算設(shè)備110的相機(jī)模塊(諸如移動(dòng)電話上的相機(jī)114)來(lái)獲得。圖像可以從耦合到用戶計(jì)算設(shè)備110的掃描儀或者任何其他合適數(shù)字成像設(shè)備來(lái)獲得。圖像可以由用戶計(jì)算設(shè)備110上的OCR應(yīng)用115從用戶計(jì)算設(shè)備110上的存儲(chǔ)位置、從遠(yuǎn)程存儲(chǔ)位置、或者從任何合適位置來(lái)訪問(wèn)。能夠提供圖像的所有源將在這里被稱為“相機(jī)” 114。
[0078]OCR應(yīng)用115的功能可以由任何合適模塊、硬件、軟件、或操作在用戶計(jì)算設(shè)備110上的應(yīng)用來(lái)執(zhí)行。OCR應(yīng)用115的一些或全部功能可以由遠(yuǎn)程服務(wù)器或其他計(jì)算設(shè)備來(lái)執(zhí)行。
[0079]圖像在用戶計(jì)算設(shè)備110的用戶界面上被呈現(xiàn)為卡的現(xiàn)場(chǎng)視頻圖像。OCR應(yīng)用115可以隔離并存儲(chǔ)來(lái)自相機(jī)114的視頻流的一個(gè)或多個(gè)圖像。例如,用戶101可以將用戶計(jì)算設(shè)備110的相機(jī)114功能懸停在卡102上方并且觀察用戶計(jì)算設(shè)備110的用戶界面上的卡的表現(xiàn)。
[0080]在塊210中,OCR應(yīng)用115檢測(cè)四個(gè)邊緣取景區(qū)域中的卡102的邊緣。邊緣取景區(qū)域在圖6和7中圖示。
[0081]圖6描繪了根據(jù)某些示例實(shí)施例的、顯示四個(gè)邊緣取景區(qū)域610的用戶計(jì)算設(shè)備110的圖示。圖6中的用戶計(jì)算設(shè)備110是移動(dòng)智能電話。用戶計(jì)算設(shè)備110包括用戶界面屏幕605。在圖示中,用戶101已經(jīng)打開(kāi)OCR應(yīng)用115且準(zhǔn)備在屏幕605上顯示卡102的圖像。在圖示中,四個(gè)邊緣取景區(qū)域610示出在屏幕605上。邊緣取景區(qū)域610可能對(duì)于用戶101來(lái)說(shuō)在屏幕605上不可見(jiàn)。在示例中,邊緣取景區(qū)域610是四邊形區(qū)域,位于標(biāo)準(zhǔn)信用卡的縱橫比所指示的布置中。如果卡102是不同的形狀,則邊緣取景區(qū)域610的形狀可以由此更改。
[0082]邊緣取景區(qū)域610位于屏幕605可能包含卡邊緣的區(qū)域中。在示例中,邊緣取景區(qū)域610被示出為位于與屏幕邊緣接近的區(qū)域中?;谄聊坏某叽绾推渌到y(tǒng)限制,邊緣取景區(qū)域610的尺寸可能包含卡102的邊緣。邊緣取景區(qū)域610的尺寸和位置可以基于提供給用戶101來(lái)在圖像中定位卡102的指令。在示例中,OCR應(yīng)用115指示用戶101定位相機(jī)114,使得卡102幾乎填滿屏幕。用戶界面可以提供顯示以向用戶101提供怎樣在相機(jī)前定位卡102的示例。任何合適準(zhǔn)則可以用來(lái)指定邊緣取景區(qū)域610的尺寸和位置。
[0083]圖7是根據(jù)某些示例實(shí)施例的、顯示四個(gè)邊緣取景區(qū)域610的用戶計(jì)算設(shè)備的圖示和所顯示的金融卡102的圖像。用戶計(jì)算設(shè)備110顯示卡102的圖像,在圖像上疊加了邊緣取景區(qū)域610???02在前平行于相機(jī)114以外的位置上對(duì)準(zhǔn),但卡102的邊緣每個(gè)都主要在邊緣取景區(qū)域610中。用戶101可以將卡101放置在諸如桌上的平坦表面上,將相機(jī)114懸停在卡102上方???02顯示在用戶計(jì)算設(shè)備110的屏幕605上。用戶101可以被請(qǐng)求以確保邊緣位于邊緣取景區(qū)域610。邊緣取景區(qū)域610的尺寸和位置使得用戶101不需要精確定位卡102。只要用戶101將卡102定位在寬松的邊緣取景區(qū)域610中,OCR應(yīng)用115就能夠進(jìn)行數(shù)據(jù)提取。在示例中,邊緣取景區(qū)域610未顯示在屏幕605上。如這里所述,用戶101可以被請(qǐng)求以任何合適方式將卡102定位在顯示器上。
[0084]在圖3的方法210中更加詳細(xì)地描述塊210的方法的細(xì)節(jié)。
[0085]圖3是根據(jù)某些示例實(shí)施例的、描繪用于檢測(cè)在計(jì)算設(shè)備的用戶界面上顯示的四個(gè)邊緣取景區(qū)域中的卡邊緣的方法的塊流程圖。
[0086]在塊305中,OCR應(yīng)用115對(duì)圖像執(zhí)行模糊檢測(cè)。OCR應(yīng)用115、相機(jī)114模塊、或者用戶計(jì)算設(shè)備110可以識(shí)別圖像模糊、過(guò)亮、過(guò)暗、或者以阻止獲得高分辨率圖像的方式而模糊。OCR應(yīng)用115,或者用戶計(jì)算設(shè)備110或相機(jī)114的其他功能,可以調(diào)整圖像捕捉方法以減少圖像中的模糊。例如,C0R應(yīng)用115可以引導(dǎo)相機(jī)114調(diào)整金融卡上的聚焦。在另一示例中,OCR應(yīng)用115可以引導(dǎo)用戶101移動(dòng)相機(jī)114更接近或更遠(yuǎn)離金融卡。在另一示例中,OCR應(yīng)用115可以執(zhí)行數(shù)字圖像操縱以去除模糊。可以利用校正模糊圖像的任何其他合適方法。
[0087]在塊310中,OCR應(yīng)用115可以可選地將圖像轉(zhuǎn)換為灰度圖。金融卡通常在卡102的表面上包含圖片、徽標(biāo)、設(shè)計(jì)、圖標(biāo)、名字、全息圖以及其他美術(shù)品。通過(guò)OCR應(yīng)用115將圖像轉(zhuǎn)換為灰度圖,在某些環(huán)境下可以使得邊緣位置更加可辨別。轉(zhuǎn)換到灰度圖,或者其他合適圖像操縱,可以發(fā)生在OCR處理的任何其他時(shí)間。例如,灰度圖轉(zhuǎn)換可以發(fā)生在邊緣檢測(cè)之后。
[0088]在塊315中,OCR應(yīng)用115識(shí)別每個(gè)邊緣取景區(qū)域中的邊緣。OCR應(yīng)用115找到每個(gè)邊緣取景區(qū)域中的區(qū)別于區(qū)域中平均噪聲水平的一個(gè)或多個(gè)線。OCR應(yīng)用115可以定位卡102的邊緣,但也可以定位在卡102上印刷的線、在卡102所位于的表面上的線、或者圖像中的其他線。在某些環(huán)境中,卡102的邊緣不是圖像中最顯著的線。因此,OCR應(yīng)用115捕捉多條線來(lái)確保卡102的邊緣與其他線一起被識(shí)別。
[0089]邊緣檢測(cè)處理是數(shù)學(xué)方法集合,其旨在識(shí)別數(shù)字圖像在其處的圖像亮度劇烈變化或具有不連續(xù)性的點(diǎn)。圖像亮度在其處變化的點(diǎn)通常被組織為一組邊緣。典型的邊緣可以是卡102和卡下方的表面之間的邊界。與之對(duì)照,線可以是在未改變背景上的不同顏色的少量像素,諸如卡102上的卡美術(shù)品的部分。對(duì)于線,可以在線的每一側(cè)存在一個(gè)邊緣。一旦OCR應(yīng)用115計(jì)算邊緣強(qiáng)度的測(cè)量(通常是梯度幅值),應(yīng)用閾值來(lái)決定是否存在邊緣。閾值越低,將檢測(cè)到越多的邊緣,且結(jié)果將更加易受噪聲以及在圖像中檢測(cè)不相關(guān)特征的邊緣的影響。相反地,高閾值可能錯(cuò)失微小的邊緣,或者導(dǎo)致碎片邊緣。
[0090]OCR應(yīng)用115在邊緣取景區(qū)域中使用任何合適線檢測(cè)軟件或硬件來(lái)識(shí)別線或邊緣。線檢測(cè)可以由OCR應(yīng)用115或另一合適模塊針對(duì)用戶計(jì)算設(shè)備110來(lái)執(zhí)行。在替選實(shí)施例中,邊緣檢測(cè)可以由遠(yuǎn)程計(jì)算設(shè)備(諸如圖像已被傳遞到其的OCR系統(tǒng)服務(wù)器124)來(lái)執(zhí)行。如果沒(méi)有檢測(cè)到適當(dāng)?shù)木€,則圖像可能被拒絕。
[0091 ]圖8是根據(jù)某些示例實(shí)施例的表示所識(shí)別的卡102的邊緣的線的圖示。卡102被示出,其中邊緣被識(shí)別為線805。線805被示出為外延的。線805可以經(jīng)由外延而延伸到屏幕605的邊界或者任何合適的邊界???02被利用松定位而示出。也就是,卡102沒(méi)有被定位于與相機(jī)114前平行的位置。盡管是松定位,邊緣取景區(qū)域610在每個(gè)區(qū)域中找到邊緣805。
[0092]返回到圖3,在塊320中,OCR應(yīng)用115提取強(qiáng)線候選。如果檢測(cè)到多個(gè)線,則OCR應(yīng)用115可以從所檢測(cè)到的線或一組強(qiáng)邊緣候選中識(shí)別最強(qiáng)的邊緣候選。最強(qiáng)的線候選可以是最區(qū)別于背景噪聲的線,或者可以由任何合適準(zhǔn)則來(lái)識(shí)別。從塊320,方法310返回到圖2中的塊215。
[0093]返回到圖2,在塊215中,OCR應(yīng)用115執(zhí)行幾何驗(yàn)證來(lái)在圖像中隔離卡。塊215的細(xì)節(jié)在圖4的方法215中更詳細(xì)描述。
[0094]圖4是根據(jù)某些示例實(shí)施例的、描繪用于執(zhí)行幾何驗(yàn)證的方法的塊流程圖。
[0095]在塊405中,卡邊緣候選線被合并到一系列交叉。線或線的外延可以與其他線或其他線的外延相交。線的相交形成交叉。OCR應(yīng)用115可以識(shí)別圖像中所有線的交叉點(diǎn)。
[0096 ]在塊410中,卡邊緣交叉被合并到一系列四邊形。例如,OCR應(yīng)用115識(shí)別一起可以外延以形成四邊形的兩個(gè)或四個(gè)交叉。OCR應(yīng)用115可以識(shí)別由候選交叉形成的多于一個(gè)的四邊形。一些候選邊緣線和交叉可以用于多個(gè)四邊形中。示例交叉和四邊形在圖9中圖示。
[0097]圖9是根據(jù)某些示例實(shí)施例的表示所識(shí)別的卡的邊緣的線805所形成的四邊形905的圖示。如圖3中所述,線80 5被OCR應(yīng)用115所識(shí)別。如塊405中所述,交叉910被OCR應(yīng)用115所識(shí)別。如塊410中所述,四邊形905被OCR應(yīng)用115所識(shí)別。例如,在識(shí)別強(qiáng)邊緣候選805之后,OCR應(yīng)用識(shí)別線805的交叉910。交叉910的位置被分析,且四邊形緣90 5可以被建模,其中交叉910被建模為四邊形905的拐角。
[0098]返回圖4,在塊415中,0CR應(yīng)用115還可以在三維(“3D”)空間中渲染卡102的圖像以修正四邊形的形狀。OCR應(yīng)用115可以操縱圖像以產(chǎn)生四邊形和圖像中的卡的3D模型以允許圖像與不同視角重新對(duì)準(zhǔn)。3D模型可以由OCR應(yīng)用115或另一計(jì)算設(shè)備通過(guò)圖像的數(shù)字操縱而創(chuàng)建。
[0099]通過(guò)開(kāi)發(fā)對(duì)象的任何三維表面的數(shù)學(xué)表示來(lái)創(chuàng)建3D模型。產(chǎn)品被稱為3D模型。3D模型可以通過(guò)被稱為3D渲染的過(guò)程而被顯示為二維圖像。
[0100]當(dāng)創(chuàng)建3D模型時(shí),OCR應(yīng)用115不能確定線上哪個(gè)點(diǎn)與來(lái)自單個(gè)圖像的圖像點(diǎn)相對(duì)應(yīng)。如果兩個(gè)圖像可用,則3D點(diǎn)的位置可以被發(fā)現(xiàn)為兩個(gè)投射線的交叉。該處理被稱為三角測(cè)量。如果OCR應(yīng)用1