個人信息顯示系統(tǒng)和相關方法
【專利摘要】個人信息顯示系統(tǒng)和相關方法。一種用于在旅行集散站用戶的辨別和/或驗證的系統(tǒng),該系統(tǒng)包括:多用戶交互屏,有一個或多個交互區(qū),用戶能夠與該交互區(qū)交互;圖像產(chǎn)生系統(tǒng),用于在交互區(qū)上產(chǎn)生信息,以便向用戶提供該用戶能夠與之交互的信息;圖像捕獲系統(tǒng),它產(chǎn)生與該交互區(qū)接觸的任何物品的被捕獲的圖像;識別系統(tǒng),用于從被捕獲圖像識別一個或多個特征,以便能夠?qū)崿F(xiàn)用戶的辨別和/或驗證;和通信系統(tǒng),借助該圖像產(chǎn)生裝置與用戶通信,以便確認辨別或請求另外的信息。
【專利說明】個人信息顯示系統(tǒng)和相關方法
【技術領域】
[0001]本發(fā)明涉及個人信息顯示系統(tǒng)和相關方法,尤其但不排他地,供辨別旅客中使用。 【背景技術】
[0002]在空港或別的旅行集散站中,有許多到達的旅客要乘班機或其他航行。處理所有 旅客是費時的作業(yè),它常常意味著旅客的大量排隊。旅客帶著文件旅行,該文件被用于辨 別(identify)他們并使他們能通過安全控制等諸如此類。驗證(authentication)和檢驗 (check)旅客文件是安全過程的重要部分,并必須被滿足,以便旅客被允許旅行。在該方面 的改進總在探索。
[0003]為找到驗證和校驗(verify)文件的自動方式,已經(jīng)做出了努力。這些努力包含基 于字符的文本識別和文件識別過程,它們使文件中的特征或文本,與數(shù)據(jù)庫中等效信息匹 配,以驗證特定旅客。
[0004]US5, 970,484公開一種系統(tǒng),該系統(tǒng)借助通過傳真機發(fā)送用戶請求,檢索數(shù)據(jù)庫中 文件。搜索出現(xiàn)在數(shù)據(jù)庫中,且該傳真機其后向用戶發(fā)回匹配的文件。該方法包括使用字 符識別和專用搜索參數(shù),搜索類似于樣本文本的文本。加權技術也被應用于一些樣本文本。
[0005]US2006/085477公開一種系統(tǒng),該系統(tǒng)用于通過手持裝置、膝上計算機等等,檢索 涉及捕獲的圖像的電子文件,并用于向用戶提供被檢索的電子文件。該方法還包括,通過使 用任何圖像捕獲裝置檢索與該搜索匹配的文件,從專用數(shù)據(jù)庫搜索文件。這是借助確定一 組文本模式和根據(jù)該文本模式構建搜索詢問被執(zhí)行的。
[0006]US2002/037097公開一種系統(tǒng),該系統(tǒng)用于借助從數(shù)據(jù)庫檢索被搜索票據(jù),并借助 顧客和匹配票據(jù)之間匹配的驗證之后處理售賣,為顧客提供改進的購物過程。該搜索借助 使用條碼搜索、光學識別、以及模式比較被完成。
[0007]US2009/177653公開一種系統(tǒng),用于搜索存儲在被掃描圖像中的文本,并用于根據(jù) 該搜索,產(chǎn)生文件的電子副本。這是借助掃描原始文件、抽取關鍵字和根據(jù)該關鍵字搜索另 外信息被完成的。
[0008]上述現(xiàn)有技術文獻,解決在旅行之前與驗證和校驗旅客相關聯(lián)的一些問題。然而, 在上述方法中,依然存在有待克服的瑕疵。
【發(fā)明內(nèi)容】
[0009]本發(fā)明的目的,是克服與現(xiàn)有技術相關聯(lián)的至少一些問題。
[0010]本發(fā)明的又一目的,是提供一種系統(tǒng)和方法,用于改進旅行之前旅客的驗證和校驗。
[0011]本發(fā)明的再一目的,是提供一種系統(tǒng)和方法,該系統(tǒng)和方法是用戶友好地并容易 操作和降低旅行之前旅客的等待時間。
[0012]本發(fā)明提供一種如在所附權利要求書闡明的方法和系統(tǒng)。按照本發(fā)明的一方面, 是提供一種系統(tǒng),用于在旅行集散站的用戶的辨別和/或驗證,該系統(tǒng)包括:[0013]多用戶交互屏,有一個或多個交互區(qū),用戶能夠與該交互區(qū)交互;
[0014]圖像產(chǎn)生系統(tǒng),用于在交互區(qū)上產(chǎn)生信息,以便向用戶提供該用戶能夠與之交互 的信息;
[0015]圖像捕獲系統(tǒng),它產(chǎn)生與該交互區(qū)接觸的任何物品的被捕獲圖像;
[0016]識別系統(tǒng),用于從被捕獲圖像識別一個或多個特征,以便能實現(xiàn)用戶的辨別和/ 或驗證;和
[0017]通信系統(tǒng),借助該圖像產(chǎn)生裝置與用戶通信,以便確認辨別或請求另外的信息。
[0018]任選地,該識別系統(tǒng)包含至少如下之一:字符識別系統(tǒng);標識識別系統(tǒng);條碼識別 系統(tǒng)。
[0019]任選地,該識別系統(tǒng)識別不同種類的數(shù)據(jù)源的一個或多個特征,該不同種類的數(shù) 據(jù)源包括被使之與交互區(qū)接觸的至少兩種不同類型的信息表示。
[0020]任選地,在該識別系統(tǒng)中,信息表示的類型,包括文本、標識和條碼的至少兩種。
[0021]任選地,該識別系統(tǒng)包含匹配引擎,用于使來自物品的特征,與用戶信息數(shù)據(jù)庫中 含有的一個或多個用戶記錄匹配,以便確定最可能匹配的用戶記錄。
[0022]任選地,該匹配引擎被布置成在用戶信息數(shù)據(jù)庫中含有的用戶記錄的全文本版本 上,進行模糊搜索。
[0023]任選地,該匹配引擎被布置成使分類和分型信息與索引匹配,并根據(jù)相應用戶記 錄的假設相關性,把加權的匹配分數(shù)與找到的用戶記錄相關聯(lián)。
[0024]任選地,該系統(tǒng)還包括數(shù)據(jù)庫,該數(shù)據(jù)庫包含在旅行集散站中潛在的旅客的列表。
[0025]任選地,旅行集散站中潛在的用戶的列表包含PNR記錄,且該數(shù)據(jù)庫包括PNR數(shù)據(jù)庫。
[0026]任選地,該識別系統(tǒng)包括索引模塊,它被布置成分別把用戶信息數(shù)據(jù)庫的以及PNR 數(shù)據(jù)庫的結構化數(shù)據(jù)庫字段,變換成索引化的全文本數(shù)據(jù)。
[0027]任選地,該多用戶交互屏是墻的形式。
[0028]任選地,至少一些墻由光透射材料制成。
[0029]任選地,該系統(tǒng)還包括打印系統(tǒng),用于在用戶的辨別或驗證時,打印與旅行有關的 文件。
[0030]按照本發(fā)明的第二方面,是提供一種用于使用辨別系統(tǒng),辨別和/或驗證旅行集 散站中的用戶的方法,該辨別系統(tǒng)有:多用戶交互屏,有一個或多個交互區(qū);圖像產(chǎn)生系 統(tǒng),用于在交互區(qū)上產(chǎn)生信息;圖像捕獲系統(tǒng),它產(chǎn)生與該交互區(qū)接觸的任何物品的被捕獲 圖像;識別系統(tǒng),用于從被捕獲圖像識別一個或多個特征;以及通信系統(tǒng),用于借助該圖像 產(chǎn)生裝置與用戶通信,以便確認辨別或請求另外的信息,該方法包括:
[0031]通過照亮多用戶交互屏一部分,向用戶提供信息,以便用戶可以與之交互;
[0032]檢測被圖像捕獲系統(tǒng)捕獲的與交互區(qū)接觸的物品;
[0033]從被捕獲圖像抽取一個或多個特征,以便辨別或驗證該用戶;
[0034]借助屏上的圖像產(chǎn)生系統(tǒng),傳送辨別或驗證,或者請求進一步信息。
[0035]任選地,該方法還包括使用字符識別;標識識別;和條碼識別中的至少之一,識別 該特征。
[0036]任選地,該方法還包括識別不同種類的數(shù)據(jù)源的一個或多個特征,該不同種類的數(shù)據(jù)源包括被使之與交互區(qū)接觸的至少兩種不同類型的信息表示。
[0037]任選地,該信息表示的類型包括文本、標識和條碼中的至少兩種。
[0038]任選地,該方法還包括匹配引擎,用于使來自物品的特征,與用戶信息數(shù)據(jù)庫中含 有的一個或多個用戶記錄匹配,以便確定最可能匹配的用戶記錄。
[0039]任選地,該匹配引擎在用戶記錄的全文本版本上,進行模糊搜索。
[0040]任選地,該匹配引擎使分類和分型信息與索引匹配,并根據(jù)相應用戶記錄的假設 相關性,把加權的匹配分數(shù)與找到的用戶記錄相關聯(lián)。
[0041]任選地,該方法還包括確定旅行集散站中潛在的旅客的列表。
[0042]任選地,該方法還包括從PNR記錄和PNR數(shù)據(jù)庫,確定旅行集散站中潛在的旅客的 列表。
[0043]任選地,索引模塊分別把旅行信息數(shù)據(jù)庫的以及PNR數(shù)據(jù)庫的結構化數(shù)據(jù)庫字 段,變換成索引化的全文本數(shù)據(jù)。
[0044]任選地,該方法還包括提供墻形式的多用戶交互屏。
[0045]任選地,該方法還包括提供至少一些由光透射材料制成的墻。
[0046]任選地,該方法還包括在用戶的辨別或驗證時,打印與旅行有關的文件。
[0047]本發(fā)明給出優(yōu)于目前系統(tǒng)和方法的許多優(yōu)點。
【專利附圖】
【附圖說明】
[0048]現(xiàn)在將通過例子參考附圖,附圖中:
[0049]圖1是按照本發(fā)明實施例的個人信息顯示系統(tǒng)的概觀示意圖;
[0050]圖2是按照本發(fā)明實施例的圖1系統(tǒng)一部分的方塊圖;
[0051]圖3是由按照本發(fā)明實施例的系統(tǒng)所執(zhí)行的識別過程的流程圖;
[0052]圖4是在按照本發(fā)明實施例的系統(tǒng)中所使用的匹配引擎的方塊圖;
[0053]圖5是按照本發(fā)明實施例的服務器系統(tǒng)的圖解。
【具體實施方式】
[0054]本發(fā)明涉及一般以100表示的個人辨別顯示系統(tǒng)(PIDS)。該個人辨別顯示系統(tǒng)可 以被定位在空港或任何其他合適的集散站,例如車站或汽車租用地點。該系統(tǒng)被用于識別 旅客,并使旅客能繼續(xù)前進到旅途的下一站。例如,旅客可以被告知如何找到連接的航班登 機口、確定出租車柜臺位置、找出到擺渡地點的路徑等等。
[0055]該個人辨別顯示系統(tǒng),包含用作多用戶交互屏的墻102。該墻可以是任何形狀或 大小,并可以被定位在任何方便的地點。墻的至少一部分允許光通過它透射,且任選地由玻 璃或其他等效的光透射材料制成。該系統(tǒng)還包含至少一臺攝像機106、至少一臺視頻投影 儀108和至少一臺服務器110。攝像機被用于檢測用戶信息和交互;以及(通過墻102)捕 獲圖像,用于將跟隨的光學字符識別過程。視頻投影儀108把消息、電影和旅客信息(通過 墻102)顯示在該屏上,旅客能夠與屏幕交互并輸入信息。信息能夠借助把文件貼著窗口放 置而被輸入,該文件其后被攝像機讀取并在系統(tǒng)內(nèi)被解釋。服務器作為通信系統(tǒng)起作用,并 與第三方及外部系統(tǒng)交互,以便:管理識別系統(tǒng),諸如光學字符識別過程;接入數(shù)據(jù)庫;以 及管理信息在墻上的顯示。墻的一部分提供檢測的區(qū)域或交互區(qū)112,該交互區(qū)112適宜在適合旅客使旅行文件與之接觸的高度,以便它們能夠被攝像機106讀取。
[0056]在再一個實施例中,該墻也可以適用于從旅客讀取生物測定數(shù)據(jù)。這將用作與旅 客文件結合的用戶的進一步檢驗。
[0057]該墻可以包含任何適當?shù)臋z測器或識別系統(tǒng)。紙質(zhì)文件的識別提供一種系統(tǒng),該 系統(tǒng)確保安全并能夠潛在地意味著在空港等等內(nèi)涉及安全過程(security processes)的 人員更少。此外,安全過程的一些或全部自動化,將降低排隊和延遲。
[0058]如在下面描述的使用文件識別的實施例的重要部分,在于這樣的事實,該系統(tǒng)處 于與PNR (旅客姓名記錄(Passenger Name Record))數(shù)據(jù)庫(未示出)通信。借助接入該 PNR數(shù)據(jù)庫,該系統(tǒng)知道所論及的當天在該系統(tǒng)附近的計劃在該空港中的潛在的旅客。這 縮少了潛在旅客的列表,并意味著可以首先與預期在空港中的那些旅客的旅客記錄進行比 較。這將在下面更詳細描述。
[0059]墻的一部分以放大段114示出。該放大段示出具體航班的登機信息116。旅行文 件118被用戶貼著玻璃墻放置。該文件可以涉及先前的旅途或當前的旅途。事實上,含有 能辨別該旅客的信息的任何文件,諸如ID卡、頻繁旅客卡(frequent traveler card)、確認 的電子郵件、商務卡、信用卡、或含有存儲在PNR中的一些信息的任何文件,都可以被使用。 該信息被獲取并被利用的方式,不受約束,且沒有數(shù)據(jù)的特定格式或類型被要求。該系統(tǒng)能 讀取任何合適的文件。尤其是,該系統(tǒng)能處理包括兩種或更多種不同類型的信息表示的不 同種類的源。這種表示的不同類型,例如包括文本、標識和條碼。作為例子,頻繁旅客卡,一 般含有旅客的姓名、卡的ID (諸如卡號碼)以及航空公司的名字及標識。
[0060]登機信息其后可以借助投影儀108被顯示在墻上。如前所述,旅行文件被攝像機 106讀取。來自攝像機的數(shù)據(jù)通過字符識別被分析,并且查找諸如旅客姓名記錄(PNR)的特 定特征被執(zhí)行。圖形用戶接口(GUI)引擎與服務器結合,被用于管理分析來自攝像機的圖 像的各種不同過程,并產(chǎn)生將由投影儀顯示在墻上的圖像。
[0061]現(xiàn)在參考圖2,處理步驟的細節(jié)和模塊,現(xiàn)在將被描述。攝像機106發(fā)送位圖到圖 像捕獲模塊200。該位圖可以包含文件表示(documentary representation)或生物測定數(shù) 據(jù)。在文件表示的情形下,該位圖在處理模塊202中被處理,且光學字符識別過程被應用于 該文件的表示。然后,光學字符識別后處理被模塊204執(zhí)行,并且關鍵字206被該模塊抽取。 關鍵字搜索208其后被執(zhí)行。然后,比較已辨別的關鍵字與旅客姓名記錄數(shù)據(jù)庫索引210, 諸如從PNR數(shù)據(jù)庫計算的預處理數(shù)據(jù)。在該情形下,該搜索可以是全文本搜索索引。如以 前所述,PNR數(shù)據(jù)庫應當知道在所論及的時間很可能在空港中的旅客。這一點將意味著,該 數(shù)據(jù)庫能夠被詢問,以查明潛在旅客的列表:其后比較能夠至少首先與該潛在旅客列表進 行。與旅客姓名記錄(PNR)數(shù)據(jù)庫212中的旅客姓名記錄的比較,辨別該文件所涉及的人。 這被反饋到結果模塊214。在整個過程中,各個模塊與圖形用戶接口(⑶1)216交互,該⑶I 把信息在墻上傳送回旅客,如有必要,請求進一步信息。
[0062]圖像識別用于分析標識和“推測”航空公司或旅店連鎖,也可以被利用。從掃描文 件接收的圖像,可以與數(shù)據(jù)庫或其他存儲媒體上預裝載的圖像比較。比較圖像的方法是周 知的,并可以是任何適當?shù)念愋汀?br>
[0063]本發(fā)明描述一種用上下文敏感的技術,補充現(xiàn)有文本搜索技術的新穎方式,以便 允許數(shù)據(jù)庫記錄的模糊檢索。該技術超過目前的距離搜索算法,該距離搜索算法允許對關鍵字的相似性搜索。
[0064]更具體地說,本發(fā)明允許一組記錄只用一部分可用的相關關鍵字而被搜索,且即使在識別過程中存在誤差。此外,語義學推論被用于改進簡單的距離搜索技術。
[0065]下面的例子示出一些上述技術,并表明該系統(tǒng)如何識別旅客。全球分布系統(tǒng) (Global Distribution System (⑶S))有大的數(shù)據(jù)庫,在那里能夠根據(jù)PNR和姓名搜索旅客。在該例子中:
[0066].Alice John正在從Paris (巴黎)到New York(紐約)旅行。相關聯(lián)的PNR (通常6個字母數(shù)字字符)是1A2B3C。
[0067]? Bob Doe正在從Paris (巴黎)到San Francisco (舊金山)旅行,有PNR號碼 =1A2B3D。
[0068]? Bob Paris正在從Rome (羅馬)到Singapore (新加坡)旅行,有PNR號碼 =AQWZSX。
[0069]通過使用如下關鍵字和號碼(姓名=Alice&PNR=lA2B3C)或(姓名 =Bob&PNR=lA2B3D)搜索⑶S,來搜索旅途的細節(jié)一般是容易的。然而,如果文件已經(jīng)被低劣地掃描,那么一些誤差可能被添加到結果上,而其后的識別過程不是直接的。下面表明一些可能的問題區(qū)域或誤差:
[0070]?姓名和/或PNR被誤讀,結果,旅途上的相關信息難以查明。例如:姓名 ^ Allce&PNR ^ 1A2B8C。
[0071]?只有姓名和目的地(或某些與之接近的地點)是可用的,例如:姓名 Allce&Origin Baris。
[0072]?文件中一些字在其他字的數(shù)個字內(nèi)沒有被正確識別。這樣使之難以精確地確定所有相關信息。例如下面的術語被識別Allce& ^ Baris&lA2B8C&Amadeus雇員。這些不可能導致邏輯搜索被實施。
[0073]?字識別不大準 確但更多字是匹配的。例如,“PNR ^ lA2B80&0rigin ^ Baris”是與Alice還是與Bob有關?如果更多信息是可用的,即使是不大準確,也可以是能夠確定正確的旅客。例如,如果附加的信息是“PNR ^ lA2B80&0rigin ^ Barls&目的地& Nex_Yurk”, 則最可能的旅客是Alice。
[0074]?即使識別是完善的,沒有任何誤差,在不同旅客之間區(qū)分也是困難的。例如,當搜索 Bob、Paris、#lA2B3D 時,難以區(qū)分“Bob Doe 機票 #1A2B3D”(與名=Bob 和 PNR=1A2B3D 匹配)和“Bob Paris機票#AQWZSX”(與名=Bob和姓=Paris匹配)。
[0075]本發(fā)明提出一種系統(tǒng)和機制,為搜索預測最合適的待選結果,即使遇上如上所述的誤差和問題。
[0076]被描述的現(xiàn)有技術方案,與一般目的的使用情況,諸如互聯(lián)網(wǎng)搜索或基于知識的檢索相匹配。該現(xiàn)有技術方案,對于要求對給出的關鍵字的本質(zhì)和質(zhì)量的安全預測,以及要求最可能的相關數(shù)據(jù)集的檢索的特殊應用,將是不充分的。
[0077]為克服該問題,本解決方案包含一種過程,它使用方法的組合,并使用加權賦值, 該加權賦值是基于語義學關鍵字分析和索引化,加上潛在的候選者的知識,例如該旅客很可能此時就在該地點。與字段搜索相反,本發(fā)明不要求結構化輸入。如果這些字是從傳感器數(shù)據(jù)或從不同種類的源被確定,這一點尤其有用。不同種類的數(shù)據(jù)源,包括兩種或更多種不同類型的信息表示,它尤其包括文本、標識和條碼。不同種類的文件,可以以這些信息表 示的許多元素(element),例如,數(shù)個文本字段和數(shù)個標識,為特征。一般說,這些元素在文 件上的位置和它們的語義,對該系統(tǒng)是事先未知的。因此,在已經(jīng)掃描不同種類的數(shù)據(jù)源之 后,它的信息表示的相應基元被辨別和分析,以便為辨別相應的人的目的,找出它們的意義 和相關性。該過程的詳細解釋,將在下面參照圖3描述。
[0078]在本發(fā)明的系統(tǒng)內(nèi)能夠被采用的其他的方法,包含條碼的識別、全文本搜索、標識 的識別等等。
[0079]條碼是文本或二進制圖像中的二進制數(shù)據(jù),它被編碼在兩個獨立的電平上;首先, 與于文件格式(file format)類似,該數(shù)據(jù)格式本身定義數(shù)據(jù)被存儲在數(shù)據(jù)流中的方式;其 次,該符號學(symbology)定義條碼將如何作為圖像出現(xiàn)。要對條碼解碼,必須知道格式和 符號學二者。一旦這是已知的,該解碼被保證要么成功要么失敗。所以關于被解碼數(shù)據(jù)的 可靠性,沒有不確定性。因此,條碼通過提供被良好特征化并已知是正確(或不正確)的有價 值的信息,是改進搜索的有效方式。
[0080]全文本搜索利用被定義的標準和規(guī)則的體系,以便傳遞旅客信息。對每一旅客或 每一組旅客,PNR被建立。該記錄含有關于該旅途的所有細節(jié)(如,航空、旅店、汽車和其他環(huán) 節(jié)),以及旅途過程中涉及的公司(如,旅行代理機構、航空公司、旅店等等)的處置信息。旅 行企業(yè)變換到無紙手續(xù)和在線處理,已經(jīng)導致必然能使旅客詢問PNR,以便獲悉有關該旅途 和可能的變化。在線信息系統(tǒng)允許該信息被變換成人類可讀的形式。該形式常常被用附加 信息強化,并已經(jīng)變成旅客生活的中心部分。查找必要信息的一種方案,是使用全文本索引 和通過提供一定量軟判據(jù)的搜索,以確定匹配的PNR的列表。然后只需要確定最相關的一 個。
[0081]標識識別是基于收集和存儲的鋼印(brand)標識的數(shù)據(jù)庫的想法。標識搜索引擎 能從輸入圖像抽取標識,使它與數(shù)據(jù)庫匹配,并確定最可能的鋼印和/或來自它的生成物 (product).,它對圖像變形、顏色改變、尺度變化是強健的,且是有被良好定義的關鍵字的另 一個搜索值:鋼印或生成物,取決于該標識。
[0082]現(xiàn)在參照圖3,文件識別過程的整個體系結構,現(xiàn)在將被描述。本發(fā)明利用索引機 制,以便建立所有可能關鍵字和那些關鍵字的有關值的表。此外,具體情況的某些規(guī)則總被 遵守。例如,PNR總是6個字母數(shù)字字符,而電子客票紀錄編號(e-ticket reference)總 是13個數(shù)字值。近似規(guī)則也可以存在,其中該電子客票紀錄編號可以總用字:“e-tiCket”、 “ETK”等等近似。另外,名常常靠近姓;不是在它之前就是在它之后可以有助于唯一旅客的 辨別。另一個重要規(guī)則,是設定優(yōu)先權:例如查找電子客票紀錄編號要比字串更有可能辨別 唯一旅客,該字串可以按若干不同方式被解釋。照此,搜索引擎被鼓勵在查找字值之先查找 數(shù)字值,因為數(shù)字值更可能是唯一的。
[0083]圖3的過程能夠被分解為兩個階段,供應階段(supply phase)和詢問階段。在供 應階段中,有關空港和關聯(lián)的基礎設施的數(shù)據(jù),在系統(tǒng)中被索引化。這在圖的左手側被基本 上畫出。詢問階段涉及旅客辨別信息,以及使信息被處理成與供應階段提供的數(shù)據(jù)匹配的 方式。詢問階段在圖的右手側被基本上畫出。數(shù)據(jù)庫300含有所有相關顧客的數(shù)據(jù),這些 顧客包含將要或已經(jīng)按預定周期使用該空港的所有旅客。該數(shù)據(jù)然后被索引模塊302通過 把結構化數(shù)據(jù)庫字段變換成全文本數(shù)據(jù)而被索引化,該全文本數(shù)據(jù)然后被使用熟知的全文本索引化技術而被索引化。結果是索引化的表304。此外,數(shù)據(jù)庫的結構也被考慮,以便建 立自動規(guī)則306。這些規(guī)則將對某些詢問允許有更大的精確性。例如,如果姓名能夠被索 引化,那么當它在輸入顧客詢問中被識別時,它將比如果要求全文本搜索時,提供更可靠的 結果。PNR數(shù)據(jù)庫的使用,很可能引起最確定的結果,且是使搜索最優(yōu)化的重要特征。該算 法是有效的,因為它不限于“推測”寫了什么,而是從被認定此時就在該墻附近的潛在旅客 的預定義列表,建議最佳旅客。手動規(guī)則308能夠被添加,以便計及其他因素。該手動規(guī)則 作為第一規(guī)則引擎310,被應用于索引化的表。這導致關鍵字或可能的關鍵字列表的產(chǎn)生。 這些關鍵字然后與自動規(guī)則一道在稍后階段通過匹配引擎312被使用。
[0084]最初,顧客向捕獲裝置遞交不同種類文件320,于是掃描322被任何合適裝置產(chǎn) 生。文件的圖像324被產(chǎn)生并處理如下。該圖像經(jīng)歷光學字符識別326,它產(chǎn)生原始文本 的10個輸出(alOoutput)。手動規(guī)則可以被應用于該文本328,以便移除不相關的字,或進 行潛在的語義學推測。例如,“姓名:Alice”將被解釋,且“Alice”將被分類為姓名。最后 輸出是關鍵字和可能的語義的列表330。標識或圖像識別過程332將被應用于數(shù)據(jù)15,以 辨別與標識或圖像相關聯(lián)的鋼印和/或生成物。這將使用圖像識別334,以便產(chǎn)生被辨別 的標識336。條碼解碼抽取338將被執(zhí)行,以辨別任何ID或2D條碼。這將使用條碼識別 技術340,以便產(chǎn)生未加密條碼342。該三種過程的結果,包含20個自由文本和被分類的信 息。例如,從鋼印的標識識別的鋼印的名字,將照此被標記。然后,所有被抽取數(shù)據(jù)被傳送 到匹配引擎。
[0085]該匹配引擎使用在供應階段中作為信息數(shù)據(jù)庫收集的記錄,并嘗試找出最相關記 錄,或使來自詢問階段的最相關記錄與供應階段的最相關記錄匹配。這種匹配可以包括兩 個過程。首先,關于非分類的自由文本信息,對自由文本數(shù)據(jù)的每一字,該匹配引擎對記錄 的全文本版本進行模糊搜索。通過使用模糊搜索和詢問技術,不要求100%精確匹配,以便 把索引化的文本數(shù)據(jù)庫記錄的不同種類文件中被捕獲的字定位。反之,如果記錄偏離輸入 字符串某種程度,肯定的結果也被找到。至此,在含有例如因掃描或字符識別誤差引入的噪 聲的輸入上,匹配能夠更有效地施行。其次,分類和分型的信息被使用,并與利用自動和手 動規(guī)則獲得的索引匹配。每次詢問返回記錄的列表,有關聯(lián)的匹配分數(shù),如圖4所示。對給 定的記錄,所有分數(shù)以給定加權求和。該加權能對被相信比其他數(shù)據(jù)更相關的數(shù)據(jù),實現(xiàn)重 要性的辨別。例如,姓名能夠被認為比自由文本流中沒有分類的信息的字更相關。有最高 分數(shù)和的記錄,被作為匹配過程的結果被返回。
[0086]圖4示出可能相關的PNR400和關鍵字402的輸入。對10個PNR記錄中的關鍵字 的每次出現(xiàn)產(chǎn)生分數(shù)404。該分數(shù)是根據(jù)Levenshtein距離產(chǎn)生的。例如,對PNRl:分數(shù)對 關鍵字(I)是SI I,對關鍵字(i )是Sli,以及對關鍵字(n)是Sin。然后,分數(shù)的和被計算, 且最高的和被確定為對該搜索的最可能的PNR匹配。
[0087]一旦旅客已經(jīng)用上述識別過程被識別,則該旅客就在空港中的事實,能夠被傳送 到該空港系統(tǒng)。如果證實也已經(jīng)出現(xiàn),該墻可以產(chǎn)生登機牌或其他合適的文件,以便允許該 旅客進入到飛機上,或者移向訂座的下一階段。另外,該系統(tǒng)可以僅僅證實,某一特定旅客 已在空港中,并將在系統(tǒng)中及時利用訂座或檢票。
[0088]在文件數(shù)據(jù)已經(jīng)被識別的地方,最可能的旅客將已經(jīng)被識別,且信息將被顯示在 該墻上。該信息可以包含繼續(xù)旅行的信息,諸如飛機延誤、到下一登機口的方向、中途停留信息等等。因為該墻能夠被他人觀看,所以數(shù)據(jù)不應顯示太多信息,太多信息會引出隱私問 題。
[0089]本發(fā)明的系統(tǒng),能夠進行旅客的文件證實以便縮減通常在旅行集散站遇到的排隊 和延遲。該墻是用戶友好界面,它能使旅客容易地辨別他們自身,且它能使空港有關于該集 散站中旅客的早期信息。該空港系統(tǒng)可以使用旅客在該集散站的事實,以便視具體情況呼 叫該旅客檢票或登機??崭壑缆每驮谠摷⒄镜氖聦崳軌驇椭寡舆t最小。
[0090]該墻本文稱為實體矩形結構,它包含光學透明材料和諸如磚或水泥的其他材料。 然而,顯然該墻能夠有任何形狀、大小、取向或材料。
[0091]圖1所示服務器110的一種可能的技術實施方案,在圖5中畫出。圖5中,服務器 110被作為計算機250示出,它由數(shù)個被并行地連接到系統(tǒng)總線253的單元形成。詳細地說, 一個或多個微處理器256控制計算機250的操作;RAM259被微處理器256直接用作工作存 儲器,而R0M262為計算機250的引導程序存儲機器代碼。外圍單元圍繞本機總線265被群 集(借助各自的接口)。尤其是,用于存儲本文描述的數(shù)據(jù)庫,諸如PNR數(shù)據(jù)庫的大容量存儲 器,由硬盤268和讀?、?R0M274的驅(qū)動器271組成。此外,計算機250包含輸入裝置277 (例如,鍵盤和鼠標),以及輸出裝置280 (例如,監(jiān)視器和打印機,后者可以用作打印系統(tǒng),用 于在用戶的辨別或驗證時,打印與旅行有關的文件)。網(wǎng)絡接口卡283被用于把計算機250 連接到網(wǎng)絡。橋接單元286把系統(tǒng)總線253與本機總線265對接。每一微處理器256和橋 接單元286,能夠作為請求接入系統(tǒng)總線253的主代理操作,以便發(fā)送信息。判優(yōu)器289按 互斥方式管理接入系統(tǒng)總線253的許可。如果該系統(tǒng)有不同拓撲,或者它基于其他網(wǎng)絡,則 相似的考慮適用。
[0092]本發(fā)明是參照空港集散站描述的,但可以在其他集散站,或任何用戶必須排隊或 被辨別以進入諸如火車站、旅店登記辦公桌、汽車租賃辦公桌等等的地方中被使用。
[0093]本發(fā)明已經(jīng)參照軟件程序和應用程序二者,以及硬件模塊被描述。應當明白,作為 本發(fā)明一部分被實現(xiàn)的功能,既可以在軟件也可以在硬件模塊或它們的組合中實現(xiàn),不管 本文給出的例子。
[0094]應當明白,存在上面描述的各種特征的許多變化,這些變化都能夠落在本發(fā)明的 范圍內(nèi)。
【權利要求】
1.一種用于在旅行集散站中的用戶的辨別和/或驗證的系統(tǒng),該系統(tǒng)包括:多用戶交互屏,有一個或多個交互區(qū),用戶能夠與該交互區(qū)交互;圖像產(chǎn)生系統(tǒng),用于在交互區(qū)上產(chǎn)生信息,以便向用戶提供該用戶能夠與之交互的信息;圖像捕獲系統(tǒng),它產(chǎn)生與該交互區(qū)接觸的任何物品的被捕獲的圖像;識別系統(tǒng),用于從被捕獲圖像識別一個或多外特征,以便能實現(xiàn)用戶的辨別和/或驗證;通信系統(tǒng),借助該圖像產(chǎn)生裝置與用戶通信,以確認辨別或請求另外的信息。
2.權利要求1的系統(tǒng),其中該識別系統(tǒng)被布置成識別不同種類數(shù)據(jù)源的一個或多個特征,該不同種類數(shù)據(jù)源包括被使之與交互區(qū)接觸的至少兩種不同類型的信息表示。
3.權利要求2的系統(tǒng),其中該信息表示的類型包括文本、標識和條碼中的至少兩種。
4.前面權利要求任一項的系統(tǒng),其中該識別系統(tǒng)包含至少如下的兩種:字符識別系統(tǒng);標識識別系統(tǒng);條碼識別系統(tǒng);它們各包含搜索機制。
5.權利要求4的系統(tǒng),其中用于字符識別系統(tǒng)的搜索機制包含字搜索、諸如關鍵字搜索或模糊搜索,以便根據(jù)用戶信息的數(shù)據(jù)庫辨別字符相關特征?!?br>
6.權利要求5的系統(tǒng),其中該用戶信息的數(shù)據(jù)庫包括旅客姓名記錄PNR數(shù)據(jù)庫,并且該信息被用于辨別有PNR記錄的旅客。
7.權利要求5或權利要求6的系統(tǒng),包括索引模塊,它被布置成分別把用戶信息數(shù)據(jù)庫的以及PNR數(shù)據(jù)庫的結構化數(shù)據(jù)庫字段,變換成索引化的全文本數(shù)據(jù)。
8.權利要求4的系統(tǒng),其中該標識識別系統(tǒng)的搜索機制包含通過計算機把來自被捕獲圖像的特征與數(shù)據(jù)庫上關于標識等等的預加載圖像進行比較。
9.權利要求4的系統(tǒng),其中該條碼識別系統(tǒng)的搜索機制包含通過計算機辨別條碼和讀出該條碼。
10.前面權利要求任一項的系統(tǒng),其中該識別系統(tǒng)包含匹配引擎,用于使來自物品的特征與用戶信息的數(shù)據(jù)庫,諸如PNR數(shù)據(jù)庫中含有的一個或多個用戶記錄匹配,以便確定最可能的匹配用戶記錄。
11.權利要求10的系統(tǒng),其中該匹配引擎被布置成在用戶記錄的全文本版本上進行模糊搜索。
12.權利要求10或權利要求11的系統(tǒng),其中該匹配引擎被布置成使分類和分型信息與索引匹配,并根據(jù)相應用戶記錄的假設相關性,把加權的匹配分數(shù)與找到的用戶記錄相關聯(lián)。
13.前面權利要求任一項的系統(tǒng),還包括數(shù)據(jù)庫,該數(shù)據(jù)庫包含旅行集散站中潛在的旅客的列表。
14.一種用于使用辨別系統(tǒng)的在旅行集散站中的用戶的辨別和/或驗證的方法,該辨別系統(tǒng)有:多用戶交互屏,有一個或多個交互區(qū);圖像產(chǎn)生系統(tǒng),用于在交互區(qū)上產(chǎn)生信息;圖像捕獲系統(tǒng),它產(chǎn)生與該交互區(qū)接觸的任何物品的被捕獲圖像;識別系統(tǒng),用于從被捕獲圖像識別一個或多個特征;以及通信系統(tǒng),借助該圖像產(chǎn)生裝置與用戶通信,以便確認辨別或請求另外的信息,該方法包括:通過照亮多用戶交互屏一部分,向用戶提供信息,以便用戶可以與之交互;檢測被圖像捕獲系統(tǒng)捕獲的與交互區(qū)接觸的物品;從被捕獲圖像抽取一個或多個特征,以辨別或驗證該用戶;借助屏上的圖像產(chǎn)生系統(tǒng),傳送辨別或驗證,或請求進一步信息。
15.權利要求14的方法,還包括通過計算機識別不同種類數(shù)據(jù)源的一個或多個特征, 該不同種類數(shù)據(jù)源包括被使之與交互區(qū)接觸的至少兩種不同類型的信息表示。
16.權利要求15的方法,其中該信息表示的類型包括文本、標識和條碼中的至少兩種。
17.權利要求15或權利要求16的方法,還包括使用搜索機構,利用字符識別、標識識別和條碼識別中的至少兩種來識別該特征。
18.權利要求17的方法,還包括通過計算機,使用關鍵字或模糊搜索,按字的形式搜索圖像中的特征,以便根據(jù)用戶信息的數(shù)據(jù)庫,辨別字符相關的特征。
19.權利要求18的方法,還包括通過計算機搜索旅客姓名記錄PNR數(shù)據(jù)庫,以便辨別有可能與該用戶匹配的PNR記錄的列表。
20.權利要求18或權利要求19的方法,其中的索引模塊分別把用戶信息數(shù)據(jù)庫的以及 PNR數(shù)據(jù)庫的結構化數(shù)據(jù)庫字段,變換成索引化的全文本數(shù)據(jù)。
21.權利要求14到20任一項的方法,還包括匹配引擎,用于使來自物品的特征,與包含在用戶信息數(shù)據(jù)庫諸如PNR數(shù)據(jù)庫中的一個或多個用戶記錄匹配,以便確定最可能匹配的用戶記錄。
22.權利要求21的方法,其中該匹配引擎在用戶記錄的全文本版本上進行模糊搜索。
23.權利要求21或權利要求22的方法,其中該匹配引擎使分類和分型信息與索引匹配,并根據(jù)相應用戶記錄的假設相關性,把加權的匹配分數(shù)與找到的用戶記錄相關聯(lián)。
24.權利要求14到23任一項的方法,還包括確定在旅行集散站中潛在的旅客的列表。
25.一種包括指令的計算機程序,用于當所述計算機程序在計算機系統(tǒng)上被執(zhí)行時,實現(xiàn)按照權利要求14到24任一項的方法的步驟。
【文檔編號】G06F3/048GK103597434SQ201280027773
【公開日】2014年2月19日 申請日期:2012年6月6日 優(yōu)先權日:2011年6月7日
【發(fā)明者】B·比齊尼, B·魯費爾, R·薩瓦尼恩, I-T·羅特黑 申請人:阿瑪?shù)盟箖珊瞎?br>