一種時間信息提取方法及裝置、智能問答系統(tǒng)的制作方法
【技術領域】
[0001]本發(fā)明涉及通信領域,尤其是涉及一種時間信息提取方法及裝置、智能問答系統(tǒng)。
【背景技術】
[0002]傳統(tǒng)的客戶服務中心以電話呼叫中心為主,但在互聯網的發(fā)展、用戶數量的增多以及用戶問題多樣性等因素的影響下,傳統(tǒng)的客戶服務中心逐漸不能滿足客戶的需要。在這種情況下,很多大型服務企業(yè)在不斷拓展更為經濟高效的智能客服中心(例如,智能在線客服、智能手機應用等),以減小人工成本,增強用戶體驗。其中,智能客服的核心是智能問答系統(tǒng),智能問答系統(tǒng)能夠針對用戶輸入的問題提供簡短、精確的答案,以這樣的方式可以解決傳統(tǒng)的客戶服務無法滿足用戶需要的問題。
[0003]隨著智能問答系統(tǒng)被大量廣泛地研究和應用,智能問答系統(tǒng)的相關技術及相關產品引起了國內外許多科研機構和公司的極大興趣,已經有許多產品出現,很好地適應了市場的需求。然而,中文智能問答系統(tǒng)由于起步較晚導致不夠成熟,當然這也和中文的語法和語義的復雜性等多種因素有關。
[0004]在客戶服務過程中,如何提取用戶輸入文本的時間信息是一個關鍵問題,例如,查詢哪個月的話費,查詢哪一天的天氣情況等,提取時間信息的準確度直接關系到智能問答系統(tǒng)提供答案的準確性。在中文表達中,時間信息的表達方式有兩種:一種是使用直接時間表達,例如,2014年12月30日、兩千年十一月二十一號等;另一種是使用時間詞語表達,例如,去年、上個月、明天等。通常,一般文本內容中除了采用上述方式表達的時間信息,還存在方言等特殊的時間詞語。面對如此復雜的中文時間信息表達方式,傳統(tǒng)的固定單一的時間信息提取方案已經無法滿足用戶的需要。
[0005]然而,針對上述情況,現有技術中并沒有提供一種有效的時間信息提取方案,以充分滿足用戶的時間信息多樣化的需求。
【發(fā)明內容】
[0006]本發(fā)明的主要目的在于提供一種時間信息提取方法及裝置、智能問答系統(tǒng),以解決現有技術存在的面對復雜中文時間信息表達方式,傳統(tǒng)的固定單一的時間信息提取方案已經無法滿足用戶的需要的問題。
[0007]為了達到上述目的,本發(fā)明提供了一種時間信息提取方法,包括:從當前文本中提取出中文時間信息;根據預定的轉換規(guī)則,對中文時間信息中的中文時間短語進行轉換,得到數字年份信息、數字月份信息、和/或數字日數信息;根據數字年份信息、數字月份信息、和/或數字日數信息計算出符合預定時間格式的數字時間信息。
[0008]優(yōu)選地,轉換規(guī)則包括:數字年份信息=預先配置的年份差值X+當前年份的年份數字,其中,年份差值X代表中文時間短語中的中文年份與當前年份的數字差值;數字月份信息=預先配置的月份差值Y+當前月份的月份數字,其中,月份差值Y代表中文時間短語中的中文月份與當前月份的數字差值;數字日數信息=預先配置的日數差值Z+當前日數的日數數字,其中,日數差值Z代表中文時間短語中的中文日數與當前日數的數字差值。
[0009]優(yōu)選地,在根據預定的轉換規(guī)則,對中文時間信息中的中文時間短語進行轉換之前,包括:將中文時間信息中的中文數字轉換成阿拉伯數字;從阿拉伯數字中分別提取數字年份信息、數字月份信息、和/或數字日數信息,在提取失敗的情況下,確定需要使用轉換規(guī)則對中文時間短語進行轉換。
[0010]優(yōu)選地,從當前文本中提取出中文時間信息,包括:按照預定的文本分割規(guī)則,對當前文本進行分割,得到短文本;按照預定的提取規(guī)則,從短文本中提取中文時間信息。
[0011]優(yōu)選地,文本分割規(guī)則包括:按照標點符號對用戶輸入文本進行分割;提取規(guī)則包括:按照年、月、日的順序從短文本中提取至少包含年、月、日三個字中至少一個字的文本
?目息O
[0012]優(yōu)選地,根據數字年份信息、數字月份信息、和/或數字日數信息計算出符合預定時間格式的數字時間信息,包括:按照每個自然年的12個自然月的日數不同的特點,按照順序對數字日數信息、數字月份信息、和/或數字年份信息進行更新和組合,得到數字時間信息;按照預定時間格式輸出數字時間信息。
[0013]本發(fā)明提供了一種時間信息提取裝置,包括:第一提取模塊,用于從當前文本中提取出中文時間信息;第一轉換模塊,用于根據預定的轉換規(guī)則,對中文時間信息中的中文時間短語進行轉換,得到數字年份信息、數字月份信息、和/或數字日數信息;計算模塊,用于根據數字年份信息、數字月份信息、和/或數字日數信息計算出符合預定時間格式的數字時間信息。
[0014]優(yōu)選地,轉換規(guī)則包括:數字年份信息=預先配置的年份差值X+當前年份的年份數字,其中,年份差值X代表中文時間短語中的中文年份與當前年份的數字差值;數字月份信息=預先配置的月份差值Y+當前月份的月份數字,其中,月份差值Y代表中文時間短語中的中文月份與當前月份的數字差值;數字日數信息=預先配置的日數差值Z+當前日數的日數數字,其中,日數差值Z代表中文時間短語中的中文日數與當前日數的數字差值。
[0015]優(yōu)選地,該裝置還包括:第二轉換模塊,用于在第一轉換模塊根據預定的轉換規(guī)貝1J,對中文時間信息中的中文時間短語進行轉換之前,將中文時間信息中的中文數字轉換成阿拉伯數字;第二提取模塊,用于從阿拉伯數字中分別提取數字年份信息、數字月份信息、和/或數字日數信息,在提取失敗的情況下,確定需要由第一轉換模塊使用轉換規(guī)則對中文時間短語進行轉換。
[0016]優(yōu)選地,第一提取模塊包括:分割單元,用于按照預定的文本分割規(guī)則,對當前文本進行分割,得到短文本;提取單元,用于按照預定的提取規(guī)則,從短文本中提取中文時間
?目息O
[0017]優(yōu)選地,文本分割規(guī)則包括:按照標點符號對用戶輸入文本進行分割;提取規(guī)則包括:按照年、月、日的順序從短文本中提取至少包含年、月、日三個字中至少一個字的文本
?目息O
[0018]本發(fā)明還提供了一種智能問答系統(tǒng),包括:上述時間信息提取裝置。
[0019]與現有技術相比,本發(fā)明所述的時間信息提取方法及裝置、智能問答系統(tǒng),可以從文本中提取與時間有關的中文數字和時間短語,將時間中文數字轉換為時間信息,根據預先設定的轉換規(guī)則對時間短語進行轉換,得到時間信息,并最終輸出符合預定時間格式的時間信息,通過這樣的方式,可以滿足用戶對智能問答系統(tǒng)提取多樣性時間信息的需求。
【附圖說明】
[0020]圖1是根據本發(fā)明實施例的時間信息提取方法流程圖;
[0021]圖2是根據本發(fā)明優(yōu)選實施例的日期提取流程圖;
[0022]圖3是根據本發(fā)明優(yōu)選實施例的日期計算流程圖;
[0023]圖4是根據本發(fā)明實施例的時間信息提取裝置的結構框圖;
[0024]圖5是根據本發(fā)明優(yōu)選實施例的時間信息提取裝置的示意圖;
[0025]圖6是根據本發(fā)明實施例的智能問答系統(tǒng)的結構框圖;以及
[0026]圖7是根據本發(fā)明優(yōu)選實施例的智能問答系統(tǒng)的結構示意圖。
【具體實施方式】
[0027]下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明的一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領域的普通技術人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0028]針對現有技術中缺乏一種有效的時間信息提取方案,以充分滿足用戶的時間信息多樣化的需求的問題,本發(fā)明提供了一種可以把文本中的中文時間信息提取出來,并轉換成標準日期格式或自定義日期格式的時間信息輸出的方式。
[0029]本發(fā)明實施例提供了一種時間信息提取方法。圖1是根據本發(fā)明實施例的時間信息提取方法流程圖,如圖1所示,該流程包括以下步驟(步驟S102-步驟S106):
[0030]步驟S102、從當前文本中提取出中文時間信息。
[0031]在本實施例中,該步驟可以通過以下方式實現:先按照預定的文本分割規(guī)則,對當前文本進行分割,得到短文本;再按照預定的提取規(guī)則,從短文本中提取中文時間信息。