基于上下文理解的信息搜索方法和系統(tǒng)的制作方法
【技術領域】
[0001]本發(fā)明涉及通信領域,特別涉及一種基于上下文理解的信息搜索方法和系統(tǒng)。
【背景技術】
[0002]搜索是指根據一定的策略、運用特定的計算機程序從互聯(lián)網上搜集與用戶檢索信息相關的信息。由于互聯(lián)網上具有海量信息,因此若搜索表達式不完整,則往往會得到大量的無關結果。因此需要用戶輸入完整的搜索表達式,才有可能得到所期望的結果。
[0003]例如,在諸如呼叫中心的服務環(huán)境下,當用戶向服務平臺提供搜索信息,服務平臺根據用戶提供的搜索信息進行搜索,并將搜索結果發(fā)送給用戶。若用戶詢問北京明天的天氣如何,服務平臺會搜索北京明天的天氣狀況,并將搜索結果發(fā)送給用戶。若用戶接著詢問上海明天的天氣如何,服務平臺會搜索上海明天的天氣狀況,并將搜索結果發(fā)送給用戶。但用戶往往不會這樣表達,在詢問北京明天的天氣后而僅簡單地詢問:上海呢?此時服務平臺若僅針對用戶該詢問信息進行搜索,無法搜索到用戶所希望的信息。
【發(fā)明內容】
[0004]本發(fā)明實施例提供一種基于上下文理解的信息搜索方法和系統(tǒng)。通過基于會話的上下文理解進行信息搜索,從而可實現智能搜索,解決了用戶搜索表達不準、節(jié)約用戶重復輸入類似問題的問題,提高了用戶體驗。
[0005]根據本發(fā)明的一個方面,提供一種基于上下文理解的信息搜索方法,包括:
[0006]在與用戶的會話過程中,當接收到用戶提供的會話信息時,利用會話信息生成當前搜索表達式;
[0007]利用當前搜索表達式在網絡中進行搜索;
[0008]判斷當前搜索結果是否達到相應的置信度;
[0009]若當前搜索結果達到相應的置信度,則將當前搜索結果提供給用戶;
[0010]若當前搜索結果沒有達到相應的置信度,則提取用戶的歷史會話記錄;
[0011]利用用戶的歷史會話記錄,對當前搜索表達式進行擴展,將擴展后的搜索表達式作為當前搜索表達式;
[0012]然后執(zhí)行利用當前搜索表達式在網絡中進行搜索的步驟。
[0013]優(yōu)選的,利用用戶的歷史會話記錄,對當前搜索表達式進行擴展,將擴展后的搜索表達式作為當前搜索表達式的步驟包括:
[0014]利用用戶的歷史會話記錄,重新確定搜索表達概念;
[0015]根據重新確定的搜索表達概念,對當前搜索表達式進行擴展;
[0016]將擴展后的搜索表達式作為當前搜索表達式。
[0017]優(yōu)選的,若當前搜索結果沒有達到相應的置信度,還包括:
[0018]判斷搜索次數是否小于預定的搜索次數閾值;
[0019]若搜索次數小于預定的搜索次數閾值,則執(zhí)行提取用戶的歷史會話記錄的步驟;
[0020]若搜索次數不小于預定的搜索次數閾值,則將當前搜索結果中置信度最高的m個結果提供給用戶,m為大于O的正整數。
[0021]優(yōu)選的,利用用戶的歷史會話記錄,對當前搜索表達式進行擴展,將擴展后的搜索表達式作為當前搜索表達式的步驟后,還包括:
[0022]判斷當前搜索表達式的擴展度是否大于預定的擴展閾值;
[0023]若當前搜索表達式的擴展度不大于預定的擴展閾值,則執(zhí)行利用當前搜索表達式在網絡中進行搜索的步驟;
[0024]若當前搜索表達式的擴展度大于預定的擴展閾值,則將當前搜索結果中置信度最高的m個結果提供給用戶,m為大于O的正整數。
[0025]優(yōu)選的,用戶提供的會話信息為文本信息或語音信息;
[0026]當接收到用戶提供的會話信息為語音信息時,利用會話信息生成當前搜索表達式的步驟包括:
[0027]對語音信息進行識別,以得到語音識別信息;
[0028]利用用戶會話的上下文確定搜索表達概念;
[0029]利用搜索表達概念和語音識別信息生成當前搜索表達式。
[0030]根據本發(fā)明的另一方面,提供一種基于上下文理解的信息搜索系統(tǒng),包括接收單元、搜索表達式生成單元、搜索單元、第一識別單元、發(fā)送單元、提取單元和表達式擴展單元,其中:
[0031]接收單元,用于在與用戶的會話過程中接收用戶提供的會話信息;
[0032]搜索表達式生成單元,用于當接收單元接收到用戶提供的會話信息時,利用會話信息生成當前搜索表達式;
[0033]搜索單元,用于利用當前搜索表達式在網絡中進行搜索;
[0034]第一識別單元,用于判斷當前搜索結果是否達到相應的置信度;
[0035]發(fā)送單元,用于根據第一識別單元的判斷結果,若當前搜索結果達到相應的置信度,則將當前搜索結果提供給用戶;
[0036]提取單元,用于根據第一識別單元的判斷結果,若當前搜索結果沒有達到相應的置信度,則提取用戶的歷史會話記錄;
[0037]表達式擴展單元,用于利用用戶的歷史會話記錄,對當前搜索表達式進行擴展,將擴展后的搜索表達式作為當前搜索表達式;然后指示搜索單元執(zhí)行利用當前搜索表達式在網絡中進行搜索的操作。
[0038]優(yōu)選的,表達式擴展單元具體包括概念確定模塊、擴展模塊和更新模塊,其中:
[0039]概念確定模塊,用于利用用戶的歷史會話記錄,重新確定搜索表達概念;
[0040]擴展模塊,用于根據重新確定的搜索表達概念,對當前搜索表達式進行擴展;
[0041]更新模塊,用于將擴展后的搜索表達式作為當前搜索表達式。
[0042]優(yōu)選的,上述系統(tǒng)還包括第二識別單元,其中:
[0043]第二識別單元,用于根據第一識別單元的判斷結果,若當前搜索結果沒有達到相應的置信度,判斷搜索次數是否小于預定的搜索次數閾值;若搜索次數小于預定的搜索次數閾值,則指示提取單元執(zhí)行提取用戶的歷史會話記錄的操作;若搜索次數不小于預定的搜索次數閾值,則指示發(fā)送單元將當前搜索結果中置信度最高的m個結果提供給用戶,m為大于O的正整數。
[0044]優(yōu)選的,上述系統(tǒng)還包括第三識別單元,其中:
[0045]第三識別單元,用于表達式擴展單元在利用用戶的歷史會話記錄,對當前搜索表達式進行擴展,將擴展后的搜索表達式作為當前搜索表達式的操作后,判斷當前搜索表達式的擴展度是否大于預定的擴展閾值;若當前搜索表達式的擴展度不大于預定的擴展閾值,則指示搜索單元執(zhí)行利用當前搜索表達式在網絡中進行搜索的操作;若當前搜索表達式的擴展度大于預定的擴展閾值,則指示發(fā)送單元將當前搜索結果中置信度最高的m個結果提供給用戶,m為大于O的正整數。
[0046]優(yōu)選的,用戶提供的會話信息為文本信息或語音信息;
[0047]搜索表達式生成單元還用于當接收到用戶提供的會話信息為語音信息時,對語音信息進行識別,以得到語音識別信息,利用用戶會話的上下文確定搜索表達概念,利用搜索表達概念和語音識別信息生成當前搜索表達式。
[0048]本發(fā)明通過針對對話語境,基于會話的上下文理解進行信息搜索,從而可實現智能搜索,解決了用戶搜索表達不準、節(jié)約用戶重復輸入類似問題的問題,提高了用戶體驗。
【附圖說明】
[0049]為了更清楚地說明本發(fā)明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
[0050]圖1為本發(fā)明信息搜索方法一個實施例的示意圖。
[0051]圖2為本發(fā)明搜索表達