行程估計裝置和方法以及信息分類方法
【專利摘要】行程估計裝置和方法以及信息分類方法。行程估計裝置包括分類單元和估計單元。分類單元根據從多條支出數據中的每條支出數據提取的時間信息的時間順序將包括與支出有關的信息的多條支出數據分類成一個或更多個支出數據組。估計單元基于包括從支出數據組中包括的每條經分類的支出數據提取的日期信息的信息來估計至少包括日期的行程。
【專利說明】
行程估計裝置和方法以及信息分類方法
技術領域
[0001]本發(fā)明涉及行程估計裝置和方法以及信息分類方法?!颈尘凹夹g】
[0002]日本未審查專利申請公開N0.2012-89033公開了用于抑制在工作流程中提出申請時所需的附著文件的附著中的人工錯誤的技術。利用日本未審查專利申請公開 N0.2012-89033中描述的技術,當在工作流程系統(tǒng)中提出新的申請時,要附著到申請中包括的詳細數據的電子圖像數據的選擇被接受,并且如果要附著到詳細數據的電子圖像數據不充分,用于創(chuàng)建要附著到申請數據的電子圖像數據的掃描票數據被創(chuàng)建。在掃描票數據中, 所創(chuàng)建的電子圖像數據要附著到的詳細數據被指定,并且服務器裝置根據這個信息將所創(chuàng)建的電子圖像數據附著到詳細數據。
【發(fā)明內容】
[0003]本發(fā)明的目的是獲得用于基于獨立發(fā)行的多個信息估計人的運動的信息組。
[0004]根據本發(fā)明的第一個發(fā)明,提供一種行程估計裝置,所述行程估計裝置包括:分類單元,所述分類單元根據從包括與支出有關的信息的多條支出數據中的每條支出數據提取的日期信息的時間順序,將所述多條支出數據分類到一個或更多個支出數據組中;以及估計單元,所述估計單元基于包括從所述支出數據組中包括的每條經分類的支出數據提取的日期信息的信息來估計至少包括日期的行程。
[0005]根據本發(fā)明的第二個方面,根據第一個方面的行程估計裝置包括:登記單元,所述登記單元登記可能是行程的起點或終點的位置,其中,所述分類單元:進行分類,該分類根據被提取了指示所登記的位置的登記位置信息的支出數據來限定所述支出數據組之間的邊界,并且所述估計單元:基于包括從一個所述支出數據組中包括的每條支出數據提取的日期信息和位置信息的信息來估計一個行程單位。
[0006]根據本發(fā)明的第三個方面,在根據第二個方面的行程估計裝置中,所述分類單元: 進行分類,該分類通過將被提取了所述登記位置信息的支出數據中的所述時間順序上的第奇數個支出數據與所述起點關聯,并且將第偶數個支出數據與所述終點關聯,來限定在所述支出數據組之間的邊界。
[0007]根據本發(fā)明的第四個方面,在根據第二或第三個方面的行程估計裝置中,所述分類單元:通過將被提取了所述登記位置信息、并且所述登記位置信息被包括在被提取的日期信息以連續(xù)關系存在的兩條或更多條支出數據中的支出數據中的、所述時間順序上的第一條支出數據與所述起點關聯,并且將最后一條支出數據與所述終點關聯,來限定所述支出數據組之間的邊界。
[0008]根據本發(fā)明的第五個方面,在根據第二或第三個方面的行程估計裝置中,如果所述登記位置信息是從被提取的日期信息以連續(xù)關系存在的兩條或更多條支出數據中的每條支出數據提取的,則所述分類單元通過將所述時間順序上較早的一條支出數據與一個行程單位的終點關聯,并且將較晚的一條支出數據與另一個行程單位的起點關聯,來限定所述支出數據組之間的邊界。
[0009]根據本發(fā)明的第六個方面,在根據第一個方面的行程估計裝置中,所述分類單元: 將被提取的日期信息以連續(xù)關系存在的兩條或更多條支出數據分類到同一支出數據組中, 并且所述估計單元:基于包括從在一個支出數據組中包括的支出數據的每條支出數據提取的日期信息的信息估計一個行程單位。
[0010]根據本發(fā)明的第七個方面,在根據第六個方面的行程估計裝置中,即使從一條支出數據中提取的日期信息與從在時間順序上為下一條的另一條支出數據提取的日期信息不以連續(xù)關系存在,當存在指示分別提取的日期信息被包括在住宿時段中的支出數據時, 所述分類單元也將所述一條支出數據和所述另一條支出數據分類到同一支出數據組。
[0011]根據本發(fā)明的第八個方面,根據第六或第七個方面的行程估計裝置包括:登記單元,所述登記單元登記可能是行程的起點或終點的位置,其中,即使從一條支出數據中提取的日期信息與從在所述時間順序上為下一條的另一條支出數據提取的日期信息不以連續(xù)關系存在,當從所述一條支出數據和所述另一條支出數據提取的位置信息指示共同共享的位置,并且還指示距所登記的所述位置遙遠的位置時,所述分類單元也將所述一條支出數據和所述另一條支出數據分類到同一所述支出數據組。
[0012]根據本發(fā)明的第九個方面,在根據第二個方面的行程估計裝置中,所述估計單元: 基于根據從一個支出數據組中包括的每條支出數據提取的多條位置信息之間的地理關系估計出的移動路線來估計行程單位。
[0013]根據本發(fā)明的第十個方面,在根據第一個方面的行程估計裝置中,所述估計單元: 基于從被分類到同一支出數據組中的其它支出數據提取的位置信息,補充不是從一條支出數據提取的位置信息。
[0014]根據本發(fā)明的第十一個方面,在根據第一個方面的行程估計裝置中,所述估計單元:基于從共享與所提取的位置信息指示的共同的同一位置的其它支出數據提取的日期信息,補充不是從一條支出數據提取的日期信息。
[0015]根據本發(fā)明的第十二個方面,在根據第一個方面的行程估計裝置中,所述估計單元:基于從包括在同一支出數據組中的其它支出數據提取的位置信息,作為識別包括在圖像中的文本的結果,修正從一條支出數據提取的位置信息。
[0016]根據本發(fā)明的第十三個方面,在根據第一個方面的行程估計裝置中,所述估計單元:基于從共享與所提取的位置信息指示的共同的同一位置的其它支出數據提取的日期信息,作為識別包括在圖像中的文本的結果,修正從一條支出數據提取的數據信息。
[0017]根據本發(fā)明的第十四個方面,在根據第一個方面的行程估計裝置中,所述估計單元:從所述多條支出數據排除不用于行程估計的支出數據。
[0018]根據本發(fā)明的第十五個方面,在根據第十四個方面的行程估計裝置中,所述估計單元:基于從包括在一個支出數據組中的每條支出數據提取的多條位置信息之間的地理關系,排除被提取了一些位置信息的支出數據。
[0019]根據本發(fā)明的第十六個方面,在根據第十四或十五個方面的行程估計裝置中,所述估計單元:基于包括在所述支出數據中的支出項目,排除不被使用的所述支出數據。
[0020]根據本發(fā)明的第十七個方面,根據第一個方面的行程估計裝置包括:查詢單元,當未從一條支出數據提取信息時,所述查詢單元查詢所述信息;以及響應接收單元,所述響應接收單元接收對所述查詢的響應,其中,所述估計單元:基于接收到的響應,補充未被提取的信息。
[0021]根據本發(fā)明的第十八個方面,根據第一個方面的行程估計裝置包括:呈現單元,當基于一個支出數據組估計了多個可能行程時,該呈現單元呈現所述多個可能行程;選擇接收單元,所述選擇接收單元接收從所呈現的所述多個可能行程中對行程的選擇;以及輸出處理器,所述輸出處理器基于接收到的選擇進行輸出關于行程的信息的處理。
[0022]根據本發(fā)明的第十九個方面,提供一種行程估計方法,所述行程估計方法包括:根據從包括與支出有關的信息的多條支出數據中的每條支出數據提取的日期信息的時間順序,將所述多條支出數據分類到一個或更多個支出數據組中;以及基于包括從所述支出數據組中包括的每條經分類的支出數據提取的日期信息的信息,來估計至少包括日期的行程。
[0023]根據本發(fā)明的第二十個方面,提供一種信息分類方法,所述信息分類方法包括:基于從獨立發(fā)行的多條信息中的每條信息提取的日期信息的連續(xù)性或多個時間處的位置信息的連續(xù)性,將所述多條信息中的每條信息分類到一個或更多個信息組中。
[0024]根據第一和第十九個方面,基于從每條支出數據提取的日期信息的時間順序,與多個支出有關的支出數據可以被分類到用于估計行程的一個或更多個支出數據組,并且行程可以被估計。
[0025]根據第二個方面,登記的位置信息指示潛在地是行程的起點或終點的登記位置的支出數據可以被用作線索,并且行程單位的起點或終點可以被估計。
[0026]根據第三個方面,基于由登記位置信息指示的位置在時間順序上另選地是行程的起點和終點的高可能性的估計,多條支出數據可以被分類成支出數據組。
[0027]根據第四個方面,如果存在日期信息以連續(xù)關系存在的兩條或更多條支出數據, 則多條支出數據可以基于這些條支出數據與一個行程單位有關的高可能性的估計而被分類到支出數據組。
[0028]根據第五個方面,如果從日期信息以連續(xù)關系存在的兩條或更多條支出數據中的每條提取了登記位置信息,則多條支出數據可以基于這些條支出數據與不同的行程單位有關的高可能性的估計而被分類到支出數據組。
[0029]根據第六個方面,基于日期信息以連續(xù)關系存在的兩條或更多條支出數據可以估計行程單位。
[0030]根據第七個方面,即使兩條或更多條支出數據中的日期信息不以連續(xù)關系存在, 基于與住宿有關的支出數據可以估計行程單位。
[0031]根據第八個方面,即使兩條或更多條支出數據中的日期信息不以連續(xù)關系存在, 基于由位置信息指示的位置距潛在地是行程的起點或終點的登記位置的距離程度,也可以估計行程單位。
[0032]根據第九個方面,基于根據多條位置信息之間的地理關系估計的運動路線,可以估計行程。
[0033]根據第十個方面,即使位置信息未從一條支出數據提取出,基于從被分類到同一支出數據組中的另一個支出數據提取的位置信息可以補充位置信息。
[0034]根據第十一個方面,即使時間信息未從一條支出數據提取出,用從其他支出數據提取的時間信息可以補充時間信息。
[0035]根據第十二個方面,即使位置信息由于識別文本的處理而未正確地從一條支出數據提取出,基于從被分類到同一支出數據組中的另一個支出數據提取的位置信息可以修正位置信息。
[0036]根據第十三個方面,即使時間信息由于識別文本的處理而未正確地從一條支出數據提取出,基于從其他支出數據提取的時間信息可以修正時間信息。
[0037]根據第十四個方面,不用于行程估計的支出數據可以被排除。
[0038]根據第十五個方面,基于多條位置信息之間的地理關系,與行程無關的支出數據可以被排除。
[0039]根據第十六個方面,基于支出項目,可以排除在行程中未使用的支出數據。
[0040]根據第十七個方面,即使存在未從支出數據提取的信息,可以用真實信息更容易地補充該信息。
[0041]根據第十八個方面,即使估計了多個可能行程,對應于真實行程的信息可以被更容易地輸出。
[0042]根據第二十個方面,基于獨立發(fā)行的多條信息,可以取得用于估計人的運動的信息組?!靖綀D說明】
[0043]基于以下附圖詳細描述本發(fā)明的示例性實施方式,其中:
[0044]圖1A到圖1E是例示由本發(fā)明的示例性實施方式處理的文檔的示例的說明圖;
[0045]圖2是例示根據本發(fā)明的第一示例性實施方式的行程估計裝置的功能構造的框圖;
[0046]圖3是例示根據第一示例性實施方式的行程估計裝置的硬件構造的框圖;
[0047]圖4是例示由根據第一示例性實施方式的行程估計裝置進行的用于估計行程的處理的流程圖;
[0048]圖5是例示圖4例示的由根據第一示例性實施方式的行程估計裝置進行的處理的繼續(xù)的流程圖;
[0049]圖6A和圖6B是例示根據第一示例性實施方式的支出數據的說明圖;
[0050]圖7是例示根據第一實施方式的支出數據的分類的說明圖;
[0051]圖8是例示根據第一實施方式的校正處理之后的支出數據的說明圖;
[0052]圖9是例示從根據第一實施方式的輸出處理器輸出的行程的說明圖;
[0053]圖10是例示由根據本發(fā)明的第二示例性實施方式的行程估計裝置進行的用于估計行程的處理的流程圖;
[0054]圖11A和圖11B是例示根據第二示例性實施方式的支出數據的說明圖;
[0055]圖12是例示根據第二實施方式的支出數據的分類的說明圖;
[0056]圖13是例示根據第二實施方式的校正處理之后的支出數據的說明圖;
[0057]圖14是例示從根據第二實施方式的輸出處理器輸出的行程的說明圖;
[0058]圖15是例示根據本發(fā)明的示例性修改例1的行程估計裝置的功能構造的框圖;
[0059]圖16是例示由根據示例性修改例1的行程估計裝置進行的查詢的說明圖;
[0060]圖17是例示由根據本發(fā)明的示例性修改例2的行程估計裝置進行的補充處理的說明圖;以及
[0061]圖18是例示根據本發(fā)明的示例性修改例5的行程估計裝置的功能構造的框圖。 【具體實施方式】
[0062]由人進行的行動可以通過收集具有時間和/或空間連續(xù)性的多條信息來跟蹤。為此,當結合人的行動發(fā)行的信息在多個時間被獲得時,通過分析多條信息的時間和/或空間連續(xù)性,能夠估計人的行動?;诎l(fā)明人的以上知識,本發(fā)明基于從獨立發(fā)行的多條信息中的每條信息提取的日期信息的連續(xù)性,或在多個時間所提取的位置信息的連續(xù)性,將多條發(fā)行的信息分類成用于估計由人(例如,單個人)進行的行動的一個或更多個信息組,并且估計行動。行動可以是人的行動的特定集合,或更具體地,人的一系列行動。
[0063]在下文,作為本發(fā)明的方面,將給出基于結合商業(yè)交易(具體地金錢或其他支出) 而發(fā)行的文檔估計行程的描述。在此,行程是為了諸如旅游、出差或迀移(搬家)而執(zhí)行的旅行的日程。作為以上文檔的代表示例是收據,其用于證明金錢被收到,并且是由金錢的接收方發(fā)行的。
[0064]與支出有關的文檔可以記載例如關于日期、位置、支出項目和金額的信息。在文檔中記載的日期指示例如商業(yè)交易發(fā)生的日期(文檔的發(fā)行日),或產品或服務(勞務)被提供的日期。在文檔中記載的位置指示例如商業(yè)交易發(fā)生的位置,或產品或服務被提供的位置。支出項目指示花費的項目。金額指示花費的金額。與支出有關的文檔在一些情況下可以記載全部以上信息,并且在其他情況下可以記載以上信息中的僅一些。
[0065]圖1A到圖1E是例示由本發(fā)明的示例性實施方式處理的文檔的示例的說明圖。
[0066]圖1A例示指示收據的文檔D1。文檔D1例示由“漢堡店AAA”發(fā)行的收據。文檔 D1記載了“2/15/2015”作為日期,“l(fā):44p.m.”作為時間,“東京中央區(qū)銀座”作為位置, “漢堡”和“飲料”作為支出項目,以及“ Y400”作為金額。
[0067]請注意指定位置的信息不限于地址,并且諸如在文檔D1中記載的商店名稱的“銀座”部分和在電話號碼“03-1111-XXXX”中包括的區(qū)域碼“03”也可以對應于指定位置的信息。
[0068]圖1B例示指示收據的文檔D2。文檔D2通過手寫發(fā)行,而不是像D1那樣電子處理的。文檔D2記載了 “2/16/2015”作為日期,“大阪府大阪市”作為位置,“計算機軟件” 作為支出項目,以及“Y25600”作為金額。這樣,較早討論的關于支出的信息可以也在通過手寫發(fā)行的文檔中記載。
[0069]圖1C例示示出來自住宿機構的收據的文檔D3。文檔D3記載了“2/21/15”作為日期,“福岡市博多區(qū)”和“博多”作為位置,“住宿費”作為支出項目,以及“6200”作為金額。文檔D3附加地記載了 “2.17.15”的入住日期和“2.21.15”的離開日期作為指定停留時段的日期。換句話說,文檔D3記載了指示從2015年2月17日到2015年2月21日的時段是住宿時段的彳目息。
[0070]與支出有關的文檔還包括除了用于證明金錢被接收的文檔之外的文檔。文檔還可以是例如與作為支付金錢的交換而提供的產品或服務有關的文檔。這種文檔包括用于交通方式的票,以及用于諸如體育活動和音樂會這樣的活動的票。圖1D例示示出用于限制的特快列車的票的文檔D4。文檔D4記載了 “2月15日”作為上車日期,“6:00”和“8:30”作為離開時間和到達時間,“東京”和“新大阪”作為離開位置和到達位置,“限制的特快”作為支出項目,以及“Y13000”作為金額。
[0071]與支出有關的文檔還包括由不是金錢的接收方的人發(fā)行的文檔。這種文檔例如包括由信用卡公司、銀行等發(fā)行的結算單。圖1E例示文檔D5,其例示信用卡結算單。文檔D5 記載了信息“2.21.15”作為日期,“東京”作為位置,“餐廳AAA東京”作為支出項目,以及 “Y5000”作為金額。
[0072]如上所述,存在各種與支出有關的文檔。與支出有關的文檔與以上給出的文檔無關,只要文檔記載了與支出有關的信息。這些文檔中的每種是與一個或更多個商業(yè)交易結合獨立于與支出有關的其他文檔發(fā)行的。
[0073]接著,將描述基于從與支出有關的文檔獲得的信息來估計行程的行程估計裝置的示例性實施方式。行程估計裝置用于例如在企業(yè)工作的用戶向企業(yè)解決出差支出的目的。 換句話說,在企業(yè),商業(yè)支出管理系統(tǒng)一般被引入來管理例如雇員出差支出的商業(yè)支出,但是這種系統(tǒng)會涉及用戶(雇員)通過在系統(tǒng)中登記出差日程、以及與出差有關的支出的支出報告來申請報銷。根據本發(fā)明的示例性實施方式的行程估計裝置可以用于這種情形。除了以上,行程估計裝置還可以用于管理由用戶進行的個人旅途的行程,并且還可以用于各種其他應用。
[0074][第一不例性實施方式]
[0075]圖2是例示根據本發(fā)明的第一示例性實施方式的行程估計裝置10的功能構造的框圖。行程估計裝置10可通信地連接到圖像捕捉裝置30。圖像捕捉裝置30捕捉包括在文檔組D中的每個文檔的圖像。圖像捕捉裝置30可以是具有圖像捕捉功能的任何裝置,諸如掃描儀、數碼相機和各種通信終端裝置,例如智能手機。在此情況下,行程估計裝置10由諸如個人使用的個人計算機這樣的信息處理裝置實現,或由多個用戶共享的服務器裝置實現。
[0076]請注意盡管圖像捕捉裝置30是與行程估計裝置10獨立提供的裝置,但是圖像捕捉裝置30的功能還可以構建到行程估計裝置10中。在此情況下,行程估計裝置10還可以由配備了圖像捕捉功能(例如,掃描功能)以及多個其他功能(諸如例如復印功能、打印機功能和傳真發(fā)送功能)的圖像形成裝置來實現。
[0077]行程估計裝置10配備了文本識別單元11、提取單元12、登記單元13、分類單元 14、估計單元15、呈現單元16、選擇接收單元17和輸出處理器18。
[0078] 文本識別單元11識別圖像捕捉裝置30捕捉的圖像中包括的文本。文本識別單元 11基于通過捕捉文檔組D中的每個文檔的圖像而獲得的圖像進行光學字符識別處理(在下文稱為“OCR處理”),并且生成字符代碼(諸如例如ASCI1、Unicode或Shift_JIS)。
[0079]提取單元12基于由文本識別單元11識別的文本(字符代碼)提取支出數據,該支出數據為包括與支出有關的信息的數據。在此,支出數據包括對應于在文檔中記載的日期的日期信息、對應于位置的位置信息、對應于支出項目的支出項目信息和關于金額的信息。 在一些情況下,從一個文檔獲得僅一條支出數據,而在其他情況下,從一個文檔獲得多條支出數據,例如使用圖1E描述的記載。
[0080]登記單元13登記潛在地是行程的起點或終點的位置。在此,行程的起點和終點是用作用戶的運動基準的位置(換句話說,家鄉(xiāng))。家鄉(xiāng)可以是用戶的家或工作地,或用戶經常使用的火車站(例如,距用戶的家或工作地最近的火車站)。指示由登記單元13登記的家鄉(xiāng)的位置信息在下文稱為“家鄉(xiāng)信息”。家鄉(xiāng)信息是根據本發(fā)明的示例性實施方式的登記的位置信息的示例。家鄉(xiāng)信息期望被表示為指示可以記載在文檔中的位置的字符串,諸如位置名稱或站名。
[0081]登記單元13例如登記由用戶指定的家鄉(xiāng)。并且,一個家鄉(xiāng)或兩個或更多個家鄉(xiāng)可以針對一個用戶登記。
[0082]分類單元14根據由提取單元12從多條支出數據中的每條支出數據提取的日期信息的時間順序將多條支出數據分類成一個或更多個支出數據組。支出數據組在下文稱為 “組”。在本示例性實施方式中,分類單元14進行分類,其通過使用從其提取了家鄉(xiāng)信息的支出數據作為組邊界來將支出數據分類到不同組中。
[0083]估計單元15指定包括在由分類單元14生成的每個組中的每條支出數據,并且基于從每條支出數據提取的諸如日期信息這樣的信息估計行程。估計單元15至少估計包括對應于所提取的日期信息的日期的行程。在本示例性實施方式中,估計單元15基于包括從一個組中包括的每條支出數據提取的日期信息的信息估計一個行程單位。在此,一個行程單位指的是從起點位置開始并且結束于終點位置的一個旅途的日程。
[0084]當由估計單元15基于一個組來估計多個行程時,呈現單元16向用戶呈現多個行程。
[0085]選擇接收單元17接收由用戶進行的對由呈現單元16呈現的多個行程中的一個行程的選擇。
[0086]輸出處理器18基于估計單元15估計的行程或由選擇接收單元17接收到的選擇來進行輸出行程信息的處理。輸出處理的具體內容不特別限制,并且可以包括例如用于發(fā)送或記錄(保存)行程數據、以及顯示或打印指示行程的圖像的處理中的一個或更多個。
[0087]圖3是例示行程估計裝置10的硬件構造的框圖。如圖3所例示,行程估計裝置10 配備了控制器101、操作單元102、NW通信單元103、顯示單元104、存儲單元105和接口單元 106〇
[0088]控制器101包括作為計算處理裝置的中央處理單元(CPU)、只讀存儲器(ROM)和作為工作區(qū)的隨機存取存儲器(RAM),并且控制行程估計裝置10的部件。CPU將存儲在ROM 或存儲單元105中的程序加載到RAM中并且執(zhí)行該程序。
[0089]操作單元102配備了例如鍵盤和鼠標,并且由用戶操作。NW通信單元103配備了例如調制解調器,并且通過連接到諸如因特網這樣的網絡來通信。顯示單元104配備了例如液晶顯示器,并且顯示各個圖像(畫面)。存儲單元105配備了例如硬盤,并且存儲各種數據。例如,存儲單元105存儲操作系統(tǒng)(0S)、用于實現使用圖2描述的行程估計裝置10 的功能的行程估計應用AP、以及登記的家鄉(xiāng)信息。接口單元106配備了例如用于連接線纜的連接器,并且經由該線纜連接到圖像捕捉裝置30。
[0090]使用圖2描述的文本識別單元11、提取單元12、登記單元13、分類單元14、和估計單元15例如由控制器101實現。呈現單元16例如由控制器101和顯示單元104實現。選擇接受單元17例如由控制器101和操作單元102實現。輸出處理器18例如由控制器101、NW通信單元103和顯示單元104實現。
[0091]圖4和圖5是例示由行程估計裝置10執(zhí)行的用于估計行程的處理的流程圖。圖 6A和圖6B是說明支出數據的圖。在在下文描述的處理之前,登記單元13預先登記家鄉(xiāng)信息。在此,地點名稱“東京”和站名“東京站”和“品川站”被登記作為家鄉(xiāng)信息。
[0092]在文檔組D中的每個文檔的圖像被圖像捕捉裝置30捕捉之后,文本識別單元11 基于所捕捉的圖像進行OCR處理(步驟SI)。OCR處理可以與文檔圖像捕捉并行地進行,或在圖像捕捉完成之后進行。
[0093]在OCR處理被進行之后,提取單元12基于從圖像識別出的文本提取支出數據(步驟S2)。圖6A例示在步驟S2提取的多個支出數據。在此,每條支出數據包括唯一標識該條支出數據的“ID”信息、唯一標識用戶的“用戶信息”、“日期信息”、“位置信息”、“支出項目信息”和“金額”。ID的值按照支出數據被生成的順序以升序來指派,或換句話說,按照文檔被圖像捕捉裝置30成像的順序以升序來指派。在此,用戶信息是“USER001”,其標識替同一用戶。日期信息包括指示至少在文檔中記載的日期的信息,但是在很多情況下可以附加地包括指示文檔中記載的時間的信息。
[0094]在此,位置信息是指示地點名稱的信息。在根據文檔中記載的信息直接指定地點名稱困難的情況下,可以采用以下配置:使用單獨提供的服務器(未例示)來從諸如電話號碼或商店名稱這樣的單獨信息推導地點名稱。
[0095]請注意在圖6A中,具有ID “0012”的支出數據的位置信息是“未知”。這個結果的可能原因是指示位置的信息沒有在文檔中記載,或發(fā)生了提取失敗。
[0096]在此,支出項目信息是諸如“飲食”這樣的信息,其中在文檔中記載的支出項目作為較總體概念性的類別表示,但是支出項目信息還可以被表示為較具體概念類別(細分)。 例如,根據日期信息中包括的時間信息或金額的相對大小,支出項目信息可以被細分為“早餐”、“午餐”和“晚餐”。另外,支出項目信息還可以根據諸如“中餐”或“意大利餐”這樣的飲食的內容來被細分。
[0097]分類單元14進行排序處理,該排序處理根據日期信息的時間順序將在步驟S2提取的支出數據排序(步驟S3)。在排序處理中,支出數據被按照最早的日期信息的順序排序。圖6B例示對使用圖6A描述的多條支出數據的排序處理的結果。在此階段,支出數據被根據日期信息的時間順序排序,但是仍是單塊數據。請注意在排序處理期間,當存在具有同一日期信息的多條支出數據時,一天中的時間的順序也被考慮在內。當時間信息未被提取時,時間可以被記為特定時間(例如,〇:〇〇)或通過參照支出項目信息等可以估計適當時間。在后一種情況下,如果支出項目信息是“正餐”,則時間可以被估計成例如“ 19:00”。
[0098]接著,分類單元14開始將多條支出數據中的每條支出數據分類成組的處理
[0099]首先,分類單元14從未被分類到組中的支出數據選擇按照排序順序中的第一條支出數據作為要處理的當前條支出數據(步驟S4)。在此,分類單元14選擇具有ID“0010” 的支出數據作為要處理的當前條支出數據。
[0100]接著,分類單元14確定從該當前支出數據提取的位置信息是否指示家鄉(xiāng)信息(步驟S5)。如圖6B所例示,“東京”被作為位置信息從具有ID “0010”的支出數據提取出來。 因此,分類單元14在步驟S5中確定“是”。接著,分類單元14確定是否將所提取的位置信息與旅途的起點關聯(步驟S6)。分類單元14基于以下描述的確定條件(C11)到(C13)在步驟S6進行確定。
[0101](C11)在從其提取了家鄉(xiāng)信息的支出數據中,將按照排序順序的奇數支出數據與起點關聯,并且將按照排序順序的偶數支出數據與終點關聯。
[0102](C12)在從中提取了家鄉(xiāng)信息并且家鄉(xiāng)信息被包括在所提取的時間信息以連續(xù)關系存在的兩條或更多條支出數據中的支出數據中,將按照時間順序的第一條支出數據與所述起點關聯并且將按照時間順序的最后條支出數據與所述終點關聯。
[0103](C13)如果家鄉(xiāng)信息是從所提取的日期信息以連續(xù)關系存在的兩條或更多條支出數據中的每條支出數據提取的,則將按照排序順序的較早條的支出數據與一個行程單位的所述終點關聯并且將按照排序順序的較晚條的支出數據與另一個行程單位的所述起點關聯。[01〇4] 實現確定條件(C11)的原因如下。假設當用戶以家鄉(xiāng)作為起點開始旅途并且以家鄉(xiāng)作為終點結束旅途時,存在旅途的起點和終點處發(fā)行的與支出有關的文檔。在此情況下, 當處理從其中提取了家鄉(xiāng)信息的一條支出數據時,估計對應于行程的起點的支出數據和對應于行程的終點的支出數據有可能交替出現。
[0105]實現確定條件(C12)的原因如下。當存在具有處于連續(xù)關系的日期信息的兩條或更多條支出數據時,估計這些條支出數據與一個行程單位有關。為此,估計從其中提取了家鄉(xiāng)信息并且具有最早日期信息的一條支出數據有可能對應于起點,而從其中提取了家鄉(xiāng)信息并且具有最晚日期信息的一條支出數據有可能對應于終點。如此處所用的,日期信息的連續(xù)關系包括由日期信息指示的日期在時間順序上連續(xù)的關系(換句話說,日期差一天),而且還包括由日期信息指示的日期在時間順序上相同的關系(換句話說,日期指示同一天)。
[0106]實現確定條件(C13)的原因如下。當家鄉(xiāng)信息是從其日期信息以連續(xù)關系存在的兩條支出數據的每條提取的時,由于在兩條支出數據之間單獨的支出數據不存在,這些條支出數據不大可能與同一行程有關。因此,這兩條支出數據被估計是與多個不同行程有關的支出數據。為此,估計具有較早日期信息的一條支出數據可能對應于一個行程單位的終點,而具有較晚日期信息的一條支出數據可能對應于另一個行程單位的起點。當用戶在旅途的結束返回到家鄉(xiāng)并且立即開始下一旅途時,確定條件(C13)趨于被滿足。
[0107]在步驟S6,當重復確定結果被確定條件(C11)到(C13)中的兩個或更多個返回時, 分類單元14將該確定結果認為是最終確定結果。另外,通過相對地增大賦予特定確定條件 (諸如例如確定條件(C12))的權重,分類單元14也可以計算最終確定結果。
[0108]在具有ID “0010”的支出數據的情況下,分類單元14基于至少確定條件(C11)和 (C12)確定將該條支出數據與行程的起點關聯(步驟S6:是)。
[0109]如果在步驟S6確定“是”,則分類單元14將該支出數據與行程的起點關聯,并且將該支出數據分類到新創(chuàng)建的組中(步驟S7)。圖7是說明支出數據的分類的圖。如圖7所例示,分類單元14將具有ID “0010”的支出數據分類到組G1中。
[0110]請注意在圖7中標記了“家鄉(xiāng)”的字段中,針對對應于行程起點的支出數據輸入了 “起點”,針對對應于終點的支出數據輸入了“終點”,并且針對不對應于起點也不對應于終點的支出數據輸入了 (橫線)。
[0111]接著,分類單元14確定是否在排序順序上存在下一條支出數據(步驟S8)。在此,在步驟S8中確定“是”,并且分類單元14返回到步驟S4中的處理。隨后,分類單元14從未被分類到組中的支出數據選擇按照排序順序中的第一條支出數據作為要處理的當前條支出數據(步驟S4)。在此,分類單元14選擇具有ID “0009”的支出數據作為要處理的當前條支出數據。
[0112]接著,分類單元14確定從該當前支出數據提取的位置信息是否指示家鄉(xiāng)信息(步驟S5)。如圖6B所例示,“小田原”被作為位置信息從具有ID “0009”的支出數據提取出來。 因此,分類單元14在步驟S5中確定“否”。如果在步驟S5中確定“否”,則分類單元14將該支出數據添加到當前創(chuàng)建的組中(步驟S9)。如圖7所例示,分類單元14將具有ID“0009” 的支出數據分類到組G1中。
[0113]隨后,分類單元14進行到步驟S8中的處理,并且確定在排序順序上是否存在下一條支出數據(S8)。在下一步驟S4中,分類單元14選擇具有ID “0004”的支出數據作為要處理的當前條支出數據。
[0114]“東京”被作為位置信息從具有ID “0004”的支出數據提取出來。因此,分類單元 14在步驟S5中確定“是”。隨后,分類單元14確定是否將所提取的位置信息與旅途的起點關聯(步驟S6)。在此,分類單元14基于至少確定條件(C11)和(C12),確定將該支出數據與行程終點關聯。因此,分類單元14在步驟S6中確定“否”,將該支出數據與行程終點關聯,并且將該支出數據分類到當前創(chuàng)建的組中(步驟S10)。如圖7所例示,分類單元14將具有ID “0004”的支出數據分類到組G1中。隨后,分類單元14完成一個組的創(chuàng)建(步驟 S11)。在此,支出數據到組G1中的分類完成。
[0115]接著,分類單元14確定是否在排序順序上存在下一條支出數據(S12)。分類單元 14在這一點確定“是”并且返回到步驟S4中的處理。之后,分類單元14通過重復步驟S4 到S12的處理,將全部條支出數據分類到組中。
[0116]如圖7所例示,分類單元14將具有ID “0013”、“0014”、和“0005”的支出數據分類到組G2中。另外,基于確定條件(C11)和(C13),分類單元14將具有ID “0013”的支出數據與行程起點關聯,并且將具有ID “0005”的支出數據與行程終點關聯。進一步地,分類單元 14 將具有 ID “0006”、“0015”、“0008”、“0002”、“0001”、“0011”、“0012”、“0007”和 “0003”的支出數據分到組G3中。另外,分類單元14將具有ID “0006”的支出數據與行程起點關聯,并且將具有ID “0003”的支出數據與行程終點關聯。
[0117]如圖7所例示,在此情況下,在組G1到G3的每個中,從其提取了家鄉(xiāng)的支出數據對應于起點或終點,但是這在其他情況下不發(fā)生。在步驟S7或S9中將支出數據分類之后, 如果分類單元14確定在排序順序上下一條支出數據不存在(步驟S8:否),則分類單元14 在這一點完成組的創(chuàng)建。在此情況下,分類單元14將在剛剛之前步驟S7或S9中分類的一條支出數據與行程終點關聯。例如,當用戶迀移到不同于家鄉(xiāng)的位置時,該位置變?yōu)樾谐痰慕K點。
[0118]并且,如果從其提取了家鄉(xiāng)信息并且要與行程起點關聯的支出數據不存在,則分類單元14將未被分類到組中的在排序順序上的第一條支出數據與行程起點關聯。
[0119]如上所述,在支出數據由分類單元14的分類結束之后,估計單元15估計針對每個組的一個行程單位(圖5中的步驟S13)。由分類單元14生成的每個組由支出數據組成,但僅是具有共同特定屬性的支出數據的集合。估計單元15分析每個組中包括的支出數據的內容,并且因而估計由多條支出數據證實的人(用戶)的行動,換句話說,估計行程。根據本示例性實施方式的估計單元15分析每個組中包括的支出數據,并且因而估計例如用戶在特定日期在哪里,用戶從何處到的何處,以及用戶在每天進行了哪些支出。因此,估計的行程包括關于人在旅途中的行動的信息,諸如用戶在相關日期出現在哪里的位置、在多個位置之間的移動路線、針對這種移動使用的交通方式、用戶過夜的地點以及旅行費用。
[0120]估計單元15基于根據從一個組中的每條支出數據提取的多條位置信息之間的地理關系估計的移動路線估計行程。這個移動路線估計考慮到了多個時間的位置信息的連續(xù)性。例如,當存在包括同一日期信息的兩條支出數據并且一條位置信息指示“東京”而另一條位置信息指示“大阪”時,估計單元15估計在由相關日期信息指示的那天發(fā)生了在“東京”和“大阪”之間的移動。當存在包括同一日期信息的三條支出數據并且從每條支出數據提取了指示“東京”、“大阪”和“福閃”的位置信息時,估計單元15基于這三條位置信息的地理位置的連續(xù)性估計在“東京“大阪“福閃”的路線上的移動或在“福閃“大阪“東京”的路線上的移動。當獲得了關于在每個位置停留的時間的信息時,類似與圖 1D中描述的文檔D4,估計單元15基于該時間信息估計移動路線。
[0121]關于旅行費用,估計單元15計算根據支出項目信息指定的相應類別的旅行支出, 諸如例如飲食支出、交通支出和住宿支出。然而,這些類別僅是一個示例,并且例如可以被進一步細分。
[0122]接著,估計單元15進行對多條支出數據中的每條支出數據進行校正的校正處理。 根據本示例性實施方式的校正處理包括排除處理、修正處理和補充處理。排除處理是排除不用于行程估計的支出數據的處理。修正處理是修正包含OCR處理期間由文本識別導致的錯誤的信息(文本)的處理。補充處理是補充未從支出數據提取的信息的處理。圖8是說明在校正處理之后的支出數據的圖。
[0123]首先,估計單元15進行排除處理(S14)。排除處理的算法是預定的,并且在本示例性實施方式中,是基于以下排除條件(C21)和(C22)來進行的。
[0124](C21)基于從被包括在一個組中的每條支出數據提取的多條位置信息之間的地理關系,排除從中提取了一些位置信息的支出數據。
[0125](C22)基于從支出數據提取的支出項目信息排除不用于行程估計的支出數據。
[0126]基于排除條件(C21)的排除處理是用于排除從其提取了指示不大可能給定多條位置信息之間的地理關系的移動的位置的位置信息的支出數據的處理。例如,圖7中例示的具有ID “0001”的支出數據的位置信息是“福岡”,但是同一組G3中包括的大多數其他支出數據的位置信息指示“大阪”或“神戶”,這與福閃距離有些遠。為此,估計具有ID“0001”的支出數據不是與從組G3估計的行程有關的支出數據。因此,估計單元15排除具有ID“0001” 的該條支出數據,如圖8中例示。例如,當發(fā)行給另一個人的文檔被混入支出數據時進行該排除處理。
[0127]基于排除條件(C22)的排除處理是用于不將被認為不是旅行支出的支出項目的金額與其余旅行支出包括在一起的處理。例如,當行程估計裝置10用于報銷出差支出時, 在一些情況下與諸如煙草這樣的奢侈商品有關的支出項目不可以被包括在旅行支出中。因此,估計單元15排除從其中提取了特定支出項目信息的支出數據。
[0128]接著,估計單元15進行修正處理(步驟S15)。修正處理的算法是預定的,并且在本示例性實施方式中,是基于以下修正條件(C31)來進行的。
[0129](C31)基于從被包括在同一組中的另一條支出數據提取的位置信息修正從一條支出數據提取出的位置信息。
[0130]如圖7所例示,“Osuka”是從具有ID “0008”的支出數據提取出來的位置信息。然而,同一組G3包括具有ID “0015”和“0002”的支出數據作為從其中提取了“大阪”作為位置信息的支出數據。當從同一組中的兩條或更多條其他支出數據提取了相同位置信息時, 估計單元15進行修正處理。因此,估計單元15修正從具有ID “0008”的支出數據提取的位置信息從“Osuka”到“大阪”,如圖8中例示。
[0131]假設地,如果具有位置信息“大阪”的支出數據不被包括在組G3中,則估計單元15 不將“Osuka”修正為“大阪”。其原因是因為有可能用戶確實訪問了稱為“Osuka”的位置, 或不表示位置的信息(諸如商店名字)被識別為位置信息。
[0132]接著,估計單元15進行補充處理。補充處理的算法是預定的,并且在本示例性實施方式中,是基于以下補充條件(C41)來執(zhí)行的。
[0133](C41)基于從被分類到同一組中的其它支出數據提取的位置信息補充不是從一條支出數據提取出的位置信息。
[0134]如圖7所例示,具有ID “0012”的支出數據的位置信息是“未知”。然而,“神戶”被從同一組G3中具有ID “0011”和“0007”的支出數據提取作為位置信息,其在排序順序上與具有ID“0012”的支出數據相鄰。在此情況下,估計單元15將“神戶”補充為具有ID“0012” 的支出數據的位置信息,如圖8中例示。這樣,當在排序順序上的一條支出數據之前和之后相鄰位置信息匹配時,進行用匹配的位置信息補充相關條支出數據的補充處理。當相鄰位置信息不同時,估計單元15可以用具有較近的日期信息的支出數據的位置信息補充相關條支出數據。
[0135]請注意排除處理、修正處理和補充處理的執(zhí)行順序可以改變。
[0136]接著,估計單元15確定具有多個估計的行程的組是否存在(步驟S17)。當針對一個組估計了一個行程時,估計單元15在步驟S17中確定“否”。在此情況下,輸出處理器18 在校正處理之后完成行程,并且進行輸出該行程的數據的輸出處理(步驟S20)。
[0137]圖9是說明從輸出處理器18輸出的行程的圖。
[0138]如圖9所例示,從組G1估計的“行程1”包括指示用戶在2014年9月20日在東京出現、在2014年9月21日在小田原出現并且過夜并且在2014年9月22日在東京出現的信息?!奥肪€”信息在此是“東京“小田原“東京”?!奥眯兄С觥卑▽凇帮嬍场?支出項目的“ 1150JPY”的飲食支出、對應于“出租車”支出項目的“ 2840JPY”的交通支出、 對應于“賓館”支出項目的“7800JPY”的住宿支出以及以上合計“11790JYP”的信息。從組 G2估計的“行程2”和從組G3估計的“行程3”也包括關于用戶在旅途中的行動的信息。
[0139]請注意使用圖9描述的行程信息僅是一個示例。例如,基于日期信息中包括的時間信息,可以估計較詳細的行程以不僅指示用戶在特定日期所在的位置,而且指示用戶在一天中的特定時間所在的位置。另外,使用圖9描述的信息的一些可以被省略。例如,支出金額與處理商業(yè)支出有關,但是在簡單想要獲得行程的粗略掌控的情況下,僅指示日期和移動路線的行程也是可想到的。此外,行程信息不限于表示為文本信息,并且還可以通過例如圖像信息(例如,地圖)、音頻信息和其他人或計算機可讀信息的組合來表示。
[0140]在步驟S17中,當估計單元15確定具有多個估計的行程的組存在(S17:否)時, 呈現單元16呈現多個估計的行程(步驟S18)。選擇接收單元17接收對從多個呈現的行程中的一個的選擇(步驟S19)。輸出處理器18進行輸出關于所選擇的行程的信息的輸出處理(步驟S20)。
[0141]在這一點,考慮以下情況:從組G3中具有ID “0012”的支出數據的角度,排序順序上的前一條支出數據的位置信息是“神戶”而下一條支出數據的位置信息是“大阪”,并且另夕卜,日期信息在時間上也等同遠離。在此情況下,要補充的位置信息變?yōu)閮煞N可能:“神戶” 和“大阪”。因此,估計單元15估計并且呈現兩種可能行程:針對使用位置信息“神戶”進行補充處理的情況的一個行程,和針對使用位置信息“大阪”進行補充處理的情況的一個行程。用戶從兩個呈現的行程選擇真實行程(也就是說,對應于真相的行程)。輸出處理器 18完成所選擇的行程,并且執(zhí)行輸出關于相關行程的信息的輸出處理。
[0142]因此,行程估計裝置10較容易地輸出關于真實行程的信息。與行程選擇有關的用戶負擔增加,但是行程估計的準確性提高。
[0143]在估計多個行程的情況下,行程估計裝置10還執(zhí)行處理步驟S18到S20,而與補充處理無關。
[0144]以上因此描述了行程估計裝置10基于根據以日語發(fā)行的文檔的支出數據估計日本國內行程的情況,但是行程估計裝置10基于根據以不同于日語的語言發(fā)行的文檔的支出數據也可以估計包括國際旅行的行程。
[0145]根據根據第一示例性實施方式的行程估計裝置10,基于從多條支出數據中的每條支出數據提取的日期信息的時間順序,多條支出數據可以被分類成組,并且可以從每個組估計一個行程單位。為此,從零開始將行程信息輸入到計算裝置的負擔不被施加到用戶。此夕卜,即使用戶手上具有與支出有關的大量的文檔,用戶也不用確定每個文檔是否是與行程有關的文檔,或當對文檔成像時保持跟蹤日期的順序。例如,即使用戶在他或她的錢包中以混亂順序保留了很多收據,用戶可以簡單地將錢包中保留的全部收據等一次放入根據本示例性實施方式的行程估計裝置10的輸入端中,而不用確定每個收據是否與行程有關。在這樣做時,與行程無關的文檔被排除處理自動排除,并且估計的行程被輸出。因此,對于用戶而言,抑制了獲得行程信息而花費的步驟的數量的增加。此外,根據行程估計裝置10,從其中提取了家鄉(xiāng)的支出數據被用作估計行程的起點或終點的線索,并且因此一個行程單位可以被準確地估計。另外,通過包括排除處理、修正處理和補充處理的校正處理,還增加了估計真實行程的準確性。
[0146][第二示例性實施方式]
[0147]接著,來描述本發(fā)明的第二示例性實施方式。在根據本示例性實施方式行程估計裝置1〇中,與將支出數據分類成組有關的配置與上述第一示例性實施方式不同。行程估計裝置10的功能構造大致與圖2例示的構造相同,但是分類單元14將所提取的日期信息以連續(xù)關系存在的兩條或更多條支出數據分類到同一組中。在本示例性實施方式中,對應于登記單元13的功能也可以被省略。行程估計裝置10的硬件構造與圖3例示的構造相同。 在本示例性實施方式中,用與上述第一示例性實施方式相同的附圖標記表示的結構元件代表與上述第一示例性實施方式相同的結構元件。
[0148]在下文,將主要就與上述第一示例性實施方式不同之處來描述與由行程估計裝置10進行的行程估計有關的處理。
[0149]圖10是例示由行程估計裝置10進行的用于估計行程的處理的流程圖。圖11A和圖11B是說明支出數據的圖。
[0150]在文檔組D中的每個文檔的圖像被圖像捕捉裝置30捕捉之后,文本識別單元11 基于所捕捉的圖像進行OCR處理(步驟S1)。在進行OCR處理之后,提取單元12基于從圖像識別出的文本提取支出數據(步驟S2)。圖11A例示在步驟S2提取的多條支出數據。接著,分類單元14進行排序處理,該排序處理根據日期信息的時間順序將在步驟S2提取的支出數據排序(步驟S3)。圖11B例示對使用圖11A描述的多條支出數據的排序處理的結果。
[0151]接著,分類單元14開始將多條支出數據中的每條支出數據分類成組的處理
[0152]首先,分類單元14從未被分類到組中的支出數據選擇按照排序順序的第一條支出數據作為要處理的當前條支出數據(步驟S4)。在此,分類單元14選擇具有ID “0010” 的支出數據作為要處理的當前條支出數據。
[0153]接著,分類單元14確定在步驟S4中選擇的當前條支出數據和在排序順序上的下一條支出數據是否包括以連續(xù)關系存在的日期信息(步驟S21)。在這一點,具有ID“0010” 的支出數據的日期信息“09/20/201408:41”和在排序順序上為下一個的具有ID “0009” 的支出數據的日期信息“09/21/2014”以連續(xù)關系存在,并且分類單元14在步驟S21確定 “是”。在此情況下,分類單元14將當前條支出數據和在排序順序上的下一條支出數據分類到同一組中(步驟S22)。如圖12所例示,分類單元14將具有ID “0009”和“0010”的支出數據分類到組G4中。接著,分類單元14確定從在步驟S4中選擇的當前條支出數據起在排序順序上的下一條之后是否存在第二條支出數據(S23)。下一條之后的一條支出數據是尚未被分類到組中的支出數據。在此,在步驟S23中確定“是”,并且分類單元14返回到步驟 S4中的處理。
[0154]接著,在步驟S4中,分類單元14選擇具有ID “0009”的支出數據作為要處理的當前條支出數據。隨后,分類單元14確定具有ID “0009”的支出數據的日期信息和在排序順序上為下一個的具有ID“0004”的支出數據的日期信息是否處于連續(xù)關系(步驟S21)。在這一點,分類單元14類似地在步驟S21中確定“是”,并且將具有ID “0004”的支出數據分類到組G4中(步驟S22)。
[0155]接著,在步驟S4中,分類單元14選擇具有ID“0004”的支出數據作為要處理的當前條支出數據。隨后,分類單元14確定具有ID“0004”的支出數據的日期信息和具有ID“0013” 的支出數據的日期信息是否處于連續(xù)關系(步驟S21)。具有ID“0004”的支出數據的日期信息“09/22/201408:34”和具有ID “0013”的支出數據的日期信息“ 11/05/201409:36”不存在于連續(xù)關系。因此,分類單元14在步驟S21中確定“否”。
[0156]接著,分類單元14確定是否存在與住宿有關的支出數據,該支出數據指示從在步驟S4中選擇的當前條支出數據提取的日期信息之前或之后的時間被包括在住宿時段中 (步驟S24)。如圖1C所描述,有時候來自諸如賓館的住宿機構的收據記載用于指定住宿時段的日期。從這種文檔的存在,可以估計用戶在住宿時段期間在住宿機構的位置出現。
[0157]在這一點,假定具有ID “0009”的支出數據的支出項目信息是“賓館”并且住宿時段是從9月21日到9月22日。在此情況下,分類單元14在步驟S24中確定“是”。接著,分類單元14確定從支出數據指定的住宿時長是否至少是日期信息中的非連續(xù)日的數量(換句話說,住宿時長多非連續(xù)日的數量)(步驟S25)。在此,由于住宿時段是從9月21日到 9月22日,住宿時長是“2”。相反,日期信息中的非連續(xù)日的數量是從“09/22/201408:34” 到“11/05/201409:36”的天數,因此大于住宿時長。因此,分類單元14在步驟S25中確定 “否”。在此情況下,分類單元14完成一個組的創(chuàng)建(步驟S11)。在此,支出數據到組G4中的分類完成。
[0158]接著,分類單元14確定是否在排序順序上存在下一個支出數據(步驟S12)。分類單元14在步驟S12確定“是”并且返回到步驟S4中的處理。
[0159]之后,分類單元14重復從步驟S4到步驟S12的處理步驟。如圖12所例示,在將具有ID “0013”的支出數據分類到組G5之后,在步驟S4分類單元14選擇具有ID “0014” 的支出數據作為要處理的當前條支出數據。在此情況下,具有ID “0014”的支出數據的日期信息“ 11/06/2014”和在排序順序上為下一個的具有ID “0005”的支出數據的日期信息 “11/08/201412:11”不以連續(xù)關系存在。因此,分類單元14在步驟S21中確定“否”。
[0160]接著,分類單元14確定是否存在與住宿有關的支出數據,該支出數據指示從在步驟S4中選擇的當前條支出數據提取的日期信息之前或之后的時間被包括在住宿時段中 (步驟S24)。在這一點,假定具有ID “0014”的支出數據的支出項目信息是“賓館”并且住宿時段是從11月6日到11月7日。在此情況下,分類單元14在步驟S24中確定“是”。
[0161]接著,分類單元14確定從支出數據指定的住宿時長是否至少是日期信息中的非連續(xù)日的數量(步驟S25)。在此,由于住宿時段是從11月6日到11月7日,住宿時長是“2”。 另外,日期信息中的非連續(xù)日的數量是“2”,其為從“11/06/2014”到“11/08/201412:11”的天數。因此,分類單元14在步驟S25中確定“是”。在此情況下,分類單元14將從其中提取了指示住宿的最后一天(也就是說,離開日)的日期信息的支出數據或從其中提取了在住宿時段期間的日期信息的支出數據分類到同一組中(步驟S26)。在此,分類單元14將從其中提取了指示住宿的最后一天的日期信息11月8日或從11月6日到11月7日的住宿時段期間的日期信息的支出數據分類到組G5中。因此,盡管具有ID “0005”的支出數據的日期信息與具有ID “0014”的支出數據的日期信息不存在連續(xù)關系,這些條支出數據也被分類到同一組G5中。接著,分類單元14進行到步驟S23并且確定從在步驟S4中選擇的當前條支出數據在排序順序上的下一條之后是否存在第二條支出數據。
[0162]關于組G6的創(chuàng)建,具有ID “0011”的支出數據的日期信息和具有ID “0001”的支出數據的日期信息不以連續(xù)關系存在。然而,假定具有ID “0011”的支出數據的支出項目信息與“賓館”有關并且住宿時段是從11月12日到11月13日。在此情況下,住宿時長是 “2”,并且日期信息中的非連續(xù)日數是“2”。因此,分類單元14在步驟S25中確定“是”并且將從其中提取了指示住宿的最后一天的日期信息11月14日或從11月12日到11月13日的住宿時段期間的日期信息的支出數據分類到同一組中。在此,盡管具有ID “0001”的支出數據的日期信息與具有ID “0011”的支出數據的日期信息不存在于連續(xù)關系,分類單元 14將這些條支出數據分類到同一組G6中。
[0163]請注意類似地在本實施方式中,分類單元14還可以基于家鄉(xiāng)信息將支出數據分類成組。在此情況下,在步驟S22中確定“是”之后,分類單元14確定排序順序的下一條支出數據的位置信息是否指示家鄉(xiāng)信息。在確定家鄉(xiāng)信息被指示的情況下,分類單元14完成在步驟S11中一個組的創(chuàng)建。在確定家鄉(xiāng)信息不被指示的情況下,分類單元14繼續(xù)到步驟S23,并且確定下一個之后的第二條支出數據是否存在。
[0164]如上所述,在由分類單元14對支出數據分類之后,估計單元15繼續(xù)到使用圖5描述的步驟S13,并且估計針對每個組的行程單位。之后,在行程估計裝置10中,從步驟S13 到步驟S20的處理按照以上第一示例性實施方式相同方式執(zhí)行。圖13是說明在校正處理之后的支出數據的圖。如圖13所例示,具有ID “0002”的支出數據的位置信息通過校正處理被從“Osuka”校正到“大阪”,并且“神戶”作為具有ID “0012”的支出數據的位置信息被補充處理補充。另外,具有ID “0008”的支出數據基于排除條件(C22)被排除處理排除。
[0165]圖14是說明從輸出處理器18輸出的行程的圖。根據本示例性實施方式的行程信息是根據上述第一示例性實施方式大致相同的方法而生成的。
[0166]如圖14所例示,從組G4估計的“行程4”包括指示用戶在2014年9月20日在東京出現、在2014年9月21日在小田原出現并且停留兩晚并且在2014年9月23日在東京出現的信息。在此,在2014年9月23日在東京出現在括號中指示。另外,與行程的結束點有關的路線的部分也在括號中指示。其原因是指示用戶在9月23日返回到家鄉(xiāng)東京的支出數據不存在。在“行程4”中,基于與住宿有關的具有ID “0009”的支出數據,住宿的最后一天被估計是行程的結束。
[0167]從組G5估計的“行程5”和從組G6估計的“行程6”也包括關于用戶在旅途中的行動的信息。在組G5中,在11月7日的支出數據不存在,并且在組G6中,在11月13日的支出數據不存在,但是基于以上討論的與住宿有關的支出數據分別從每個估計一個行程單位。
[0168]根據根據以上描述的第二示例性實施方式的行程估計裝置10,基于日期信息以連續(xù)關系存在的兩條或更多條支出數據估計一個行程單位,因此可以準確地估計行程。并且, 根據行程估計裝置10,即使當時間信息不以連續(xù)關系存在時,基于與住宿有關的支出數據也可以準確地估計一個行程單位。
[0169][示例性修改例]
[0170]本發(fā)明還可以在不同于上述示例性實施方式的實施方式中實現。此外,示例性實施方式還可以與以下指示的示例性修改例中的任一個組合。
[0171](示例性修改例1)
[0172]當信息沒有從支出數據提取時,行程估計裝置10還可以配備用于向用戶查詢該信息的構造。在例如文檔沒有記載信息的情況下,或當文檔記載了信息但是由于OCR處理造成的文本識別錯誤導致信息未被提取時,該信息可能不從支出數據提取。
[0173]圖15是例示根據本示例性修改例的行程估計裝置10的功能構造的框圖。根據本示例性修改例的行程估計裝置10配備了上述示例性實施方式的功能,以及查詢單元19和響應接收單元20。
[0174]當不從一條支出數據提取信息時,查詢單元19查詢所述信息。響應接收單元20 接收對查詢單元19進行的查詢的響應。估計單元15基于響應接收單元20接收到的響應補充未提取的信息。估計單元15使用補充的信息估計行程。
[0175]請注意查詢單元19例如由控制器101和顯示單元104實現,而響應接收單元20 例如由控制器101和操作單元102實現。
[0176]圖16是例示由根據本示例性修改例的行程估計裝置10進行的查詢的圖。圖16例示用于查詢使用圖6描述的具有ID “0011”的支出數據的位置信息的查詢畫面C。如圖 16所例示,查詢單元19顯示從具有ID“0011”的支出數據提取的日期信息、支付項目信息、 和金額,并且查詢位置信息。此時,查詢單元19基于通過補充處理估計的位置信息顯示消息““神戶”是正確位置嗎?”,標記了“是”的操作元素的圖像B1和標記了“人工編輯”的操作元素的圖像B2。如果用戶判斷所呈現的位置信息正確,則用戶通過進行選擇圖像B1的操作來響應。如果用戶判斷所呈現的位置信息不正確,則用戶進行選擇圖像B2的操作,并且用真實信息來響應。
[0177]請注意當存在用于位置信息的多個候選時,查詢單元19也可以優(yōu)先化來自所提取的日期信息在時間上接近的支出數據的位置信息的顯示。在此,優(yōu)先化顯示指的是使得位置信息能夠用較少的操作選擇,或按照對用戶更可見的方式顯示位置信息,諸如例如在畫面的頂部顯示位置信息。
[0178]在此,通過補充處理估計的位置信息被顯示,但是這些信息也可以不被顯示。類似地,在行程估計裝置10中,當沒有提取日期信息、支出項目信息或金額時,未被提取的信息可以被查詢。
[0179]查詢單元19的查詢時刻不被具體限制。例如,在估計行程的處理期間確定未知信息存在的情況下,查詢單元19通過顯示提示等可以立即查詢。另外,查詢時刻例如可以是在步驟S16中的處理結束之后的時刻,或在步驟S13中估計行程的時刻。
[0180]根據根據本示例性修改例的行程估計裝置10,用真實信息進行補充變得更容易。 另外,本示例性修改例的功能還可以由根據上述第二示例性實施方式的行程估計裝置10 實現。
[0181](示例性修改例2)
[0182]在上述示例性實施方式中的補充處理是補充位置信息的處理,但是補充時間信息的補充處理也可以被執(zhí)行。補充處理的算法在此情況下是預定的,并且是基于以下補充條件(C42)來執(zhí)行的。
[0183](C42)基于從共享與所提取的位置信息指示的共同的同一位置的另一個支出數據提取的日期信息補充不是從一條支出數據提取的日期信息。
[0184]如此處所用的,共享共同的同一位置可以表示共同共享同一位置信息,但是可以附加包括共享共同的同一區(qū)域,諸如“福岡”和作為組成福岡的部分的區(qū)的“博多區(qū)”。如圖 17所例示,假設具有ID“0008”的支出數據的日期信息是“未知”,要將該支出數據分類到其中的組是未知的。因此,估計單元15指定具有ID “0015”和“0002”的支出數據作為所提取的位置信息指示與具有ID “0008”的支出數據的位置信息“大阪”共同共享的位置的支出數據。具有ID “0015”的支出數據的日期信息是“11/10/201415:17”,并且具有ID “0002” 的支出數據的日期信息是“11/11/201412:16”。因此,估計單元15用從這些條支出數據提取的日期信息補充具有ID “0008”的支出數據的日期信息。在此,估計單元15基于“11月 10日”和“11月11日”補充。例如,估計單元15通過用這兩條日期信息中的一個進行補充來估計行程。
[0185](示例性修改例3)
[0186]在上述示例性實施方式中的修正處理是修正位置信息的處理,但是修正時間信息的修正處理也可以被執(zhí)行。修正處理的算法在此情況下是預定的,并且是基于以下修正條件(C32)來進行的。
[0187](C32)基于從共享與所提取的位置信息指示的共同的同一位置的另一個支出數據提取的日期信息修正不是從一條支出數據提取的日期信息。
[0188]當一條支出數據的日期信息包括由OCR處理導致的錯誤時,該支出數據可能不被分類到適當組中。因此,當存在提取的位置信息指示共同共享的位置的其它支出數據時,估計單元15用從該其它支出數據提取的日期信息進行補充。例如,假定文本識別單元11識別 “福岡”作為位置信息,并且錯誤地將日期信息“6月5日”識別為“6月S日(字母“S”)”。 在此情況下,如果“6月5日”被從提取了“福岡”作為位置信息的兩條或更多條支出數據提取作為日期信息,分類單元14將“6月S日”修正為“6月5日”。
[0189](示例性修改例4)
[0190]關于上述第二示例性實施方式,行程估計裝置10還可以基于從支出數據提取的位置信息指示的位置是否遠離家鄉(xiāng)來執(zhí)行組分類。在本示例性修改例中,假定登記單元14 登記家鄉(xiāng)。
[0191]當用戶為了旅游或出差而訪問距家鄉(xiāng)遠的遙遠位置時,估計用戶不大可能相隔幾天多次訪問同一位置。在上述第二示例性實施方式的組G6中,盡管家鄉(xiāng)是“東京”,存在日期信息指示11月10日和11月12日并且其位置信息均指示“大阪”的遙遠位置的兩條支出數據。在此情況下,盡管指示從11月10日到11月11日的時間段的過夜停留的文檔不存在,也估計用戶在此位置過夜,并且這些條支出數據對應于在同一行程上發(fā)行的與支出有關的文檔。相反,如果日期信息指示了 11月10日和11月12日并且位置信息指示了“橫濱”的非遙遠位置,則不大可能估計在同一旅途中發(fā)行該支出數據。
[0192]因此,即使從一條支出數據提取的日期信息和從排序順序上的下一條支出數據提取的日期信息不以連續(xù)關系存在,當從這些條支出數據提取的位置信息指示共同地共享的位置并且該位置是距家鄉(xiāng)遙遠的位置時,分類單元14將支出數據分類到同一組。位置距家鄉(xiāng)是否遙遠通常根據家鄉(xiāng)和遙遠位置之間的距離來確定。然而,該確定可以不僅基于距離,而且將例如從家鄉(xiāng)訪問該位置的交通方式考慮在內。例如,即使兩個位置同等遠,難以到達的位置可以被分類為遙遠位置,而容易到達的位置可以被分類到非遙遠位置。根據本示例性修改例,對于使用圖14描述的“行程6”,行程估計裝置10估計行程附加地包括信息 “11/10/2014-11/11/2014大阪(住宿2晚)”。根據根據本示例性修改例的行程估計裝置 10,估計真實行程的準確性增加。
[0193](示例性修改例5)
[0194]行程估計裝置10還可以不配備使用圖2描述的全部功能元件。如圖18所例示, 行程估計裝置10至少包括分類單元14和估計單元15是足夠的。在此情況下,文本識別單元11、提取單元12、登記單元13、呈現單元16、選擇接收單元17和輸出處理器18的至少一些的功能可以由外部裝置實現,或一些功能甚至可以被省略。
[0195]作為根據本示例性修改例的行程估計裝置10的方面,從文檔獲得支出數據的構造也可以不被采用。電子地發(fā)行收據、來自信用卡公司或銀行的結算單和各種票變得逐漸普遍。因此,行程估計裝置10還可以從外部裝置獲取包括與支出有關的信息的電子支出數據,并且基于支出數據估計行程。這是因為這些支出數據還可以包括具有與使用圖1描述的文檔的情況相同屬性的諸如日期信息、位置信息、支付項目信息和金額信息這樣的信息。例如,可以從用于作為信用卡的一種的企業(yè)卡的結算單數據中包括的數據提取支出數據。 由于用于企業(yè)卡的結算單數據包括針對卡的每個用戶的支出數據,根據本示例性修改例的行程估計裝置10還能夠基于針對每個用戶的支出數據估計行程。
[0196]另外,作為根據本示例性修改例的行程估計裝置10的另一個方面,可以提供從文檔獲得支出數據的構造和從外部裝置獲取包括與支出有關的信息的電子數據的構造。這是因為本發(fā)明還適用于從文檔獲得的支出數據和從外部裝置獲得的與支出有關的電子數據的混合體。
[0197] 此外,估計單元15的功能中的一些也可以被省略。估計單元15可以例如被構造成不執(zhí)行排除處理、修正處理和補充處理中的一個或更多個,或與這些處理有關的上述條件中的一些可以被省略。
[0198] 并且,要從支出數據提取的信息包括至少日期信息是充分的,并且來自位置信息、 支出項目信息和金額中的一些可以從提取排除。
[0199](示例性修改例6)
[0200] 此外,本發(fā)明還可以被指定為信息分類方法,其基于從發(fā)行的多條信息的每條信息提取的日期信息的連續(xù)性或在多個時間的位置信息的連續(xù)性,將發(fā)行的多條信息分類到一個或更多個信息組。換句話說,這些條信息不考慮信息之間的聯系或分類到以上信息組中而被發(fā)行。一個信息組可以包括可以被用作估計人的行動的特定集合(諸如例如一系列動作)的線索的信息,但是在其他情況下其他信息也可以被包括在內。日期信息的連續(xù)性可以由兩條或更多條日期信息之間存在的預定連續(xù)關系來指定。位置信息的連續(xù)性可以由在多個時間的多條日期信息之間存在的預定連續(xù)關系來指定。連續(xù)關系是基于由位置信息指示的位置的地理位置來確定的。在以上討論的示例性實施方式中,根據本發(fā)明的信息分類方法應用于估計行程的發(fā)明,但是可以應用于估計在不同于旅行的時間人的行動的發(fā)明。
[0201](示例性修改例7)
[0202] 由根據以上討論的每個示例性實施方式實現的行程估計裝置10實現的功能可以由一個或更多個硬件電路實現,通過執(zhí)行一個或更多個程序造成計算機實現相同功能來實現,或通過以上組合來實現。當行程估計裝置10的功能使用程序實現時,可以通過存儲在諸如磁記錄介質(諸如磁帶、磁盤(包括HDD和軟盤(FD)等)、光學記錄介質(諸如光盤)、 磁光記錄介質或閃速存儲器的非瞬時性計算機可讀存儲介質上來提供程序(例如,行程估計應用AP)。另選地,程序可以經由諸如因特網的通信鏈路來傳送。
[0203] 出于解釋和說明的目的對本發(fā)明的示例性實施方式提供了前述描述。其目的不是窮舉性的,也不是將本發(fā)明限制于所公開的精確形式。顯然,許多修改和變型對于本領域的技術人員是明顯的。為了最佳地解釋本發(fā)明的原理及其實際應用選擇并描述了這些實施方式,由此使得本領域的其他技術人員能夠對各種實施方式并設想出適合具體應用的各種修改來理解本發(fā)明。旨在利用所附權利要求書及其等同物限定本發(fā)明的范圍。
【主權項】
1.一種行程估計裝置,所述行程估計裝置包括:分類單元,所述分類單元根據從包括與支出有關的信息的多條支出數據中的每條支 出數據提取的日期信息的時間順序,將所述多條支出數據分類到一個或更多個支出數據組 中;以及估計單元,所述估計單元基于包括從所述支出數據組中包括的每條經分類的支出數據 提取的日期信息的信息來估計至少包括日期的行程。2.根據權利要求1所述的行程估計裝置,所述行程估計裝置包括:登記單元,所述登記單元登記可能是行程的起點或終點的位置,其中,所述分類單元:進行分類,該分類根據被提取了指示所登記的位置的登記位置信息的支出數據來限定 所述支出數據組之間的邊界,并且 所述估計單元:基于包括從一個所述支出數據組中包括的每條支出數據提取的日期信息和位置信息 的信息來估計一個行程單位。3.根據權利要求2所述的行程估計裝置,其中,所述分類單元:進行分類,該分類通過將被提取了所述登記位置信息的支出數據中的所述時間順序上 的第奇數個支出數據與所述起點關聯,并且將第偶數個支出數據與所述終點關聯,來限定 在所述支出數據組之間的邊界。4.根據權利要求2或3所述的行程估計裝置,其中,所述分類單元:通過將被提取了所述登記位置信息、并且所述登記位置信息被包括在被提取的日期信 息以連續(xù)關系存在的兩條或更多條支出數據中的支出數據中的、所述時間順序上的第一條 支出數據與所述起點關聯,并且將最后一條支出數據與所述終點關聯,來限定所述支出數 據組之間的邊界。5.根據權利要求2或3所述的行程估計裝置,其中,如果所述登記位置信息是從被提取的日期信息以連續(xù)關系存在的兩條或更多條支出 數據中的每條支出數據提取的,則所述分類單元通過將所述時間順序上較早的一條支出數 據與一個行程單位的終點關聯,并且將較晚的一條支出數據與另一個行程單位的起點關 聯,來限定所述支出數據組之間的邊界。6.根據權利要求1所述的行程估計裝置,其中,所述分類單元:將被提取的日期信息以連續(xù)關系存在的兩條或更多條支出數據分類到同一所述支出 數據組中,并且 所述估計單元:基于包括從在一個所述支出數據組中包括的支出數據的每條支出數據提取的日期信 息的信息來估計一個行程單位。7.根據權利要求6所述的行程估計裝置,其中,即使從一條支出數據中提取的日期信息與從在所述時間順序上為下一條的另一條支出數據提取的日期信息不以連續(xù)關系存在,當存在指示分別提取的多條日期信息被包括在 住宿時段中的支出數據時,所述分類單元也將所述一條支出數據和所述另一條支出數據分 類到同一所述支出數據組。8.根據權利要求6或7所述的行程估計裝置,所述行程估計裝置還包括:登記單元,所述登記單元登記可能是行程的起點或終點的位置,其中,即使從一條支出數據中提取的日期信息與從在所述時間順序上為下一條的另一條支 出數據提取的日期信息不以連續(xù)關系存在,當從所述一條支出數據和所述另一條支出數據 提取的位置信息指示共同共享的位置,并且還指示距所登記的所述位置遙遠的位置時,所 述分類單元也將所述一條支出數據和所述另一條支出數據分類到同一所述支出數據組。9.根據權利要求2所述的行程估計裝置,其中,所述估計單元:基于根據從一個所述支出數據組中包括的每條支出數據提取的多條位置信息之間的 地理關系估計出的移動路線來估計行程單位。10.根據權利要求1所述的行程估計裝置,其中,所述估計單元:基于從被分類到同一所述支出數據組中的其它支出數據提取的位置信息,補充不是從 一條支出數據提取的位置信息。11.根據權利要求1所述的行程估計裝置,其中,所述估計單元:基于從共享與所提取的位置信息指示的共同的同一位置的其它支出數據提取的日期 信息,補充不是從一條支出數據提取的日期信息。12.根據權利要求1所述的行程估計裝置,其中,所述估計單元:基于從包括在同一所述支出數據組中的其它支出數據提取的位置信息,作為識別包括 在圖像中的文本的結果,修正從一條支出數據提取的位置信息。13.根據權利要求1所述的行程估計裝置,其中,所述估計單元:基于從共享與所提取的位置信息指示的共同的同一位置的其它支出數據提取的日期 信息,作為識別包括在圖像中的文本的結果,修正從一條支出數據提取的數據信息。14.根據權利要求1所述的行程估計裝置,其中,所述估計單元:從所述多條支出數據排除不用于行程估計的支出數據。15.根據權利要求14所述的行程估計裝置,其中,所述估計單元:基于從包括在一個所述支出數據組中的每條支出數據提取的多條位置信息之間的地 理關系,排除被提取了 一些位置信息的支出數據。16.根據權利要求14或15所述的行程估計裝置,其中,所述估計單元:基于包括在所述支出數據中的支出項目,排除不被使用的所述支出數據。17.根據權利要求1所述的行程估計裝置,所述行程估計裝置還包括:查詢單元,當未從一條支出數據提取信息時,所述查詢單元查詢所述信息;以及 響應接收單元,所述響應接收單元接收對所述查詢的響應,其中,所述估計單元:基于接收到的所述響應,補充未被提取的信息。18.根據權利要求1所述的行程估計裝置,所述行程估計裝置包括:呈現單元,當基于一個所述支出數據組估計了多個可能行程時,該呈現單元呈現所述 多個可能行程;選擇接收單元,所述選擇接收單元接收從所呈現的所述多個可能行程中對行程的選 擇;以及輸出處理器,所述輸出處理器基于接收到的所述選擇進行輸出關于行程的信息的處理。19.一種行程估計方法,所述行程估計方法包括:根據從包括與支出有關的信息的多條支出數據中的每條支出數據提取的日期信息的 時間順序,將所述多條支出數據分類到一個或更多個支出數據組中;以及基于包括從所述支出數據組中包括的每條經分類的支出數據提取的日期信息的信息, 來估計至少包括日期的行程。20.—種信息分類方法,所述信息分類方法包括:基于從獨立發(fā)行的多條信息中的每條信息提取的日期信息的連續(xù)性或多個時間點的 位置信息的連續(xù)性,將所述多條信息中的每條信息分類到一個或更多個信息組中。
【文檔編號】G06Q10/10GK105989461SQ201510570370
【公開日】2016年10月5日
【申請日】2015年9月9日
【發(fā)明人】劉洋
【申請人】富士施樂株式會社