項目推薦裝置以及項目推薦方法
【專利說明】
[0001 ] 關聯(lián)申請
[0002] 本申請享受以日本專利申請2014 - 223222號(申請日:2014年10月31日)以及日本 專利申請2015 - 050664號(申請日:2015年3月13日)為基礎申請的優(yōu)先權。本申請通過參照 該基礎申請而包含基礎申請的全部的內容。
技術領域
[0003] 實施方式涉及項目推薦裝置以及項目推薦方法。
【背景技術】
[0004] 對期待用戶寄予關心的項目進行推薦的技術在例如電子商務(EC:Electronic Commerce)、網絡廣告、行動引導服務等各種各樣的領域中被廣泛利用。在項目推薦中最廣 泛使用的處理方式是,生成表示用戶與項目的相關關系(或用戶對項目的關心的程度)的矩 陣,以該矩陣為基礎進行統(tǒng)計分析的方式。但是,在該方式中,并沒有考慮到用戶對項目的 興趣、需求由于上下文而發(fā)生變化這點。因此,近年來提出例如以餐廳推薦任務為對象,追 加地使用時間段、機會(節(jié)假日、生日、記念日等)、場所、同伴者等上下文信息的方式。
[0005] 在使用上下文信息進行項目的推薦的以往的方式中,能夠利用的上下文信息限于 從外部能夠容易地觀測的信息。但是,在這些從外部能夠觀測的上下文信息以外,用戶的活 動目的、情緒等不向用戶詢問意圖就不清楚的內心的信息,在進行項目的推薦處理的方面 上被認為是有用的。因此,要求能夠推定內心的信息并精度更良好地進行項目的推薦的結 構的構建。
【發(fā)明內容】
[0006] 實施方式的項目推薦裝置具備上下文信息生成部以及排序部。上下文信息生成部 對所輸入的自然語言請求進行語義解析,生成包括用戶的意圖在內的上下文信息并輸出。 排序部基于上述上下文信息、對用戶的屬性進行表示的用戶信息、以及對用戶的項目利用 履歷進行表示的履歷信息,進行對于向用戶提示的項目的候選的排序。
【附圖說明】
[0007] 圖1是表示第1實施方式的項目推薦裝置的構成例的框圖。
[0008] 圖2是表示店鋪DB的數(shù)據(jù)構造的一個例子的圖。
[0009]圖3是表不檢索標簽的一個例子的圖。
[0010] 圖4是表示檢索標簽字典的數(shù)據(jù)構造的一個例子的圖。
[0011] 圖5是表示根據(jù)自然語言請求來生成檢索標簽組的處理順序的一個例子的流程 圖。
[0012] 圖6是表示根據(jù)檢索標簽組生成候選項目組的處理順序的一個例子的流程圖。 [0013]圖7是表不上下文標簽的一個例子的圖。
[0014]圖8是表示上下文標簽字典的數(shù)據(jù)構造的一個例子的圖。
[0015]圖9是表示根據(jù)自然語言請求來生成上下文標簽組的處理順序的一個例子的流程 圖。
[0016]圖10是表示用戶DB的數(shù)據(jù)構造的一個例子的圖。
[0017]圖11是表示利用記錄DB的數(shù)據(jù)構造的一個例子的圖。
[0018]圖12是表示預測處理的處理順序的一個例子的流程圖。
[0019]圖13是表示第2實施方式的項目推薦裝置的構成例的框圖。
[0020]圖14是表示利用記錄DB的數(shù)據(jù)構造的一個例子的圖。
[0021]圖15是說明用于上下文向量生成的在統(tǒng)計處理中使用的數(shù)理模型的圖。
[0022]圖16是說明圖15的數(shù)理模型中的各種參數(shù)的學習方法的圖。
[0023]圖17是表示各種參數(shù)的學習處理的處理順序的一個例子的流程圖。
[0024]圖18是表示生成上下文向量的處理順序的一個例子的流程圖。
[0025]圖19是表示第3實施方式的項目推薦裝置的構成例的框圖。
[0026]圖20是表示人物屬性推定器的處理順序的一個例子的流程圖。
[0027] 圖21是示意地表示項目推薦裝置的硬件構成的一個例子的框圖。
【具體實施方式】
[0028] 實施方式的項目推薦裝置具備語義解析引擎以及上下文識別型推薦引擎。語義解 析引擎以從用戶輸入的自然語言請求為基礎,對情緒、期望、目的等用戶的內心的信息進行 推定。上下文識別型推薦引擎將外部觀測信息(日期時間、場所等)與上述內心的信息共同 作為上下文信息進行分析。自然語言請求是基于自然語言的項目的推薦請求。近年來,以聲 音識別技術的成熟、便攜終端的普及等為背景,對話處理向系統(tǒng)、服務的導入被擴展并變成 基于自然語言的請求的輸入容易被用戶接受的土壤。
[0029] 在以下的實施方式中,作為本發(fā)明的應用事例,假想作為項目而推薦店鋪的店鋪 推薦任務。實施方式的項目推薦裝置受理自然語言請求作為輸入,輸出被排序后的店鋪列 表作為推薦項目列表。另外,假設作為后備數(shù)據(jù)(back data)而保持有保存了用戶組對各店 鋪的利用記錄后的利用記錄DB。但是,在本實施方式中說明的推薦處理是通用的,并不限定 于店鋪推薦任務的應用事例,能夠應用到各種各樣的任務。
[0030] 在下面表示具體的應用事例。在實施方式的項目推薦裝置中,例如在輸入了將"下 周末,想召開同期的歡送會"這樣的目的作為主體的自然語言請求時,進行以下的處理。
[0031] 根據(jù)"歡送會"這樣的關鍵字,推薦候選被集中到店鋪類別為酒館、酒吧、餐廳、咖 啡館、花店(禮品購入用)的店鋪。
[0032]根據(jù)"周末"這樣的關鍵字,推薦候選被集中到在周末開放的店鋪。
[0033] "歡送會"這樣的關鍵字與預先準備的標簽字典對照,生成"宴會"這樣的標簽。
[0034] "同期"這樣的關鍵字與預先準備的標簽字典對照,生成"同事"這樣的標簽。
[0035] 在通過歡送會以及周末而被集中的推薦候選之中,重視與"宴會"以及"同事"這樣 的標簽容易共現(xiàn)的店鋪(即,作為實際成果作為同事的宴會被較多地利用的店鋪),并且以 利用記錄為基礎,對推薦店鋪的候選進行排序并輸出推薦項目列表。
[0036]由此,在通過縮小(對應日語:絞込)處理排除不可能符合意圖的店鋪、進而通過標 簽使與意圖相符的可能性高的店鋪被優(yōu)先這樣的條件下,輸出與用戶的嗜好性相適合的推 薦結果。
[0037] <第1實施方式>
[0038]圖1是表示第1實施方式的項目推薦裝置的構成例的框圖。如圖1所示,本實施方式 的項目推薦裝置具備語義解析引擎10、以及上下文識別型推薦引擎20。
[0039]語義解析引擎10受理含有用戶期望等的自然語言請求D1作為輸入,輸出檢索標簽 組D2以及上下文標簽組D4。檢索標簽組D2所含有的各檢索標簽是說明店鋪應滿足的性質的 詢問信息片。上下文標簽組D4所含有的各上下文標簽是說明用戶側的狀況的詢問信息片。 為了生成上述的標簽,語義解析引擎10在內部具備語素解析器11、檢索標簽提取器12(檢索 信息生成部)、以及上下文標簽生成器13(上下文信息生成部)。
[0040] 上下文識別型推薦引擎20受理通過語義解析引擎10生成的檢索標簽組D2以及上 下文標簽組D4作為輸入,輸出推薦項目列表D5作為推薦結果。檢索標簽組D2作為對店鋪的 限制條件而與店鋪DB103對照,生成縮小后的候選項目組D3。上下文標簽組D4與用戶DB104 所保存的用戶信息以及利用記錄DB105所保存的利用記錄共同地被利用于候選項目組D3所 包含的各候選項目的排序中。被排序后的候選項目的列表是推薦項目列表D5。為了進行上 述的處理,上下文識別型推薦引擎20在內部具備候選提取器21(候選提取部)以及排序器22 (排序部)。
[0041] 在下面,將本實施方式的項目推薦裝置的處理的細節(jié)分成"店鋪縮小處理"、"上下 文標簽組的生成處理"、以及"推薦處理"這3個進行說明。上述的處理以跨模塊的方式執(zhí)行。 [0042](店鋪縮小處理)
[0043]所謂店鋪縮小處理是,以被輸入的包括用戶期望表現(xiàn)的自然語言請求D1為基礎, 對成為推薦候選的店鋪(候選項目)進行縮小的處理。在自然語言請求D1中含有店鋪名的情 況下,推薦候選利用該店鋪名而被縮小。在自然語言請求D1中含有店鋪類別名的情況下,推 薦候選利用該店鋪類別名而被縮小。除此以外,在自然語言請求D1中含有"便宜"、"有自助 餐"等表示店鋪的屬性的表現(xiàn)的情況下,推薦候選利用該屬性而被縮小。
[0044]店鋪DB103是保存本實施方式的項目推薦裝置進行處理的全部店鋪的店鋪信息的 數(shù)據(jù)庫,該店鋪DB103所保存的店鋪信息是店鋪縮小處理的對象。圖2表示店鋪DB103的數(shù)據(jù) 構造的一個例子。店鋪DB103所保存的店鋪信息成為例如圖2所示那樣的表形式,各記錄包 括店鋪ID、店鋪名、類別名、以及其他屬性的欄。
[0045]對店鋪ID欄分配唯一的序列號。在店鋪名欄保存有本實施方式的項目推薦裝置進 行處理的全部店鋪的店鋪名。在類別名欄保存有酒館、咖啡館等預先設定的類別之中的某 種類別。其他屬性欄成為多標簽形式,從便宜、有自助餐等表示店鋪的特征的預先設定的其 他屬性的標簽之中列舉出〇個以上的標簽。作為其他屬性的標簽,希望準備服務內容、商品 特征、氣氛等各種各樣的觀點下的標簽。
[0046]對根據(jù)自然語言請求D1生成檢索標簽組D2的處理進行說明。圖3表示本實施方式 的項目推薦裝置進行處理的檢索標簽的一個例子。如圖3所示,檢索標簽包括與店鋪名有關 的標簽、與類別名有關的標簽、以及與其他屬性有關的標簽。
[0047]在此,對在生成檢索標簽組D2的處理之中使用的檢索標簽字典101進行說明。檢索 標簽字典101作為在被輸入的自然語言請求D1中,將基于不同的措辭、不同的觀點的提及的 方式的差異吸收的知識源而被利用。由此,即使在用戶的請求表現(xiàn)中沒有直接的提及,也能 夠汲取其意圖而得到將對象店鋪縮小的效果。
[0048]圖4表示檢索標簽字典101的數(shù)據(jù)構造。檢索標簽字典101成為例如如圖4所示那樣 的表形式,各記錄包括檢索標簽、應用目標屬性、以及觸發(fā)詞的欄。
[0049]檢索標簽欄按照每個記錄是唯一的,該檢索標簽欄保存有本實施方式的項目推薦 裝置進行處理的檢索標簽。但是,也可以不必保存所有的檢索標簽。應用目標屬性欄保存有 欄名,該欄名成為檢索標簽布置限制的對象。例如,在是檢索標簽表示酒館那樣的類別名的 記錄的情況下,在該記錄的應用目標屬性欄中保存有"類別名"的值。觸發(fā)詞欄成為多標簽 形式,列舉有成為檢索標簽生成的觸發(fā)的單詞、短語等語句(下面,稱為"觸發(fā)詞"。)。通過在 生成檢索標簽組D2的處理中使用圖4所例示的檢索標簽字典101,從而,對于含有"酒"、"飲 酒會"、"用餐"這樣的觸發(fā)詞的自然語言請求D1,生成"酒館"這樣的檢索標簽,進行作為對 類別名的限制條件的店鋪縮小。
[0050]圖5是表示根據(jù)自然語言請求D1生成檢索標簽組D2的處理順序的一個例子的流程 圖。本實施方式的項目推薦裝置通過以下的步驟S101~步驟S109的處理,根據(jù)自然語言請 求D1生成檢索標簽組D2。
[0051]步驟S101:語素解析器11將自然語言請求D1分割成單詞或者短語并進行詞形還原 (Le_atiZe,字典標題字化(日語:辭書見出L語化))。
[0052]步驟S102:檢索標簽提取器12從在步驟S101中得到