本發(fā)明涉及大數(shù)據(jù)處理的技術(shù)領(lǐng)域,具體涉及一種物流知識智能問答系統(tǒng)及方法。
背景技術(shù):
隨著網(wǎng)購文化日漸繁榮,物流行業(yè)蓬勃發(fā)展。而在物流、報關(guān)行業(yè)內(nèi),政策、熱點的變化對業(yè)務(wù)的影響甚大,及時掌握行業(yè)熱點趨勢以及解讀政策走向?qū)ζ髽I(yè)、業(yè)務(wù)員而言十分重要。但由于行業(yè)從業(yè)人員知識水平不一,有豐富業(yè)務(wù)經(jīng)驗的業(yè)務(wù)員寫作能力不過關(guān),而寫作能力強(qiáng)的可能行業(yè)知識不夠,導(dǎo)致關(guān)務(wù)及物流行業(yè)知識無法有效沉淀。
現(xiàn)有的物流行業(yè)中,用戶提問一般由客服人員進(jìn)行回答,但客服人員對行業(yè)知識的存儲量難以滿足用于需求,這一缺陷在實際業(yè)務(wù)操作知識和熱點政策知識上體現(xiàn)得尤為突出。物流及關(guān)務(wù)行業(yè)受政策及熱點趨勢的影響很大,而網(wǎng)絡(luò)資訊良莠不齊,難以有效甄別真正的熱點趨勢,這些都對滿足包括本領(lǐng)域從業(yè)人員在內(nèi)的客戶的提問需求造成了一定的困難。鑒于物流及關(guān)務(wù)行業(yè)受政策及熱點趨勢的影響很大,熱點信息的時效性非常重要,但關(guān)務(wù)及物流行業(yè)知識及規(guī)范皆由政府部門從上而下發(fā)布,因此政策相關(guān)信息很難落地于實際問答操作,導(dǎo)致解答提問的質(zhì)量和可靠性都大幅度降低。
中國專利申請cn105956809a公開了一種基于大數(shù)據(jù)的云實時推送物流信息監(jiān)控管理系統(tǒng),包括貨站倉庫信息管理系統(tǒng)、隨車監(jiān)控管理系統(tǒng)、大數(shù)據(jù)分析系統(tǒng)、大數(shù)據(jù)通訊網(wǎng)絡(luò)系統(tǒng)、大數(shù)據(jù)服務(wù)器及跨域訪問服務(wù)器,其中貨站倉庫信息管理系統(tǒng)分布在物料路線沿途各貨站中,并通過大數(shù)據(jù)通訊網(wǎng)絡(luò)系統(tǒng)與大數(shù)據(jù)分析系統(tǒng)連接,隨車監(jiān)控管理系統(tǒng)分布在各物流運輸工具中,并通過大數(shù)據(jù)通訊網(wǎng)絡(luò)系統(tǒng)與大數(shù)據(jù)分析系統(tǒng)連接,大數(shù)據(jù)分析系統(tǒng)通過大數(shù)據(jù)通訊網(wǎng)絡(luò)系統(tǒng)分別與大數(shù)據(jù)服務(wù)器及跨域訪問服務(wù)器連接。本發(fā)明一方面可對運輸工具運行情況進(jìn)行全程追蹤監(jiān)控,另一方面可各物流線路上貨物資源分布情況進(jìn)行監(jiān)控,從而為運輸工具運行調(diào)度及貨物調(diào)配提供可靠的依據(jù)?,F(xiàn)如今物流行業(yè)的技術(shù)研究方向集中于實際操作過程中信息及貨物的獲取、輸出和追蹤等,在物流行業(yè)知識積累、面向?qū)I(yè)及業(yè)余用戶的知識問答等仍存在較多空白。
中國專利申請cn105630938公開了一種智能問答系統(tǒng),包括:一個以上問題輸入模塊,問題輸入模塊用來輸入需要回答的問題,并對問題設(shè)定來源標(biāo)識,所述來源標(biāo)識中包含的大用戶信息至少為兩種以上,大用戶下面還包括小用戶,大用戶之間是彼此獨立的,不同的大用戶之間的小用戶是獨立的;一個問題庫;一個問題匹配模塊;一個通用答案庫;一個以上專業(yè)答案庫;一個問題應(yīng)答模塊,根據(jù)問題匹配模塊的匹配結(jié)果和問題的來源標(biāo)識在專業(yè)答案庫或通用答案庫中找到相應(yīng)問題的答案并根據(jù)來源標(biāo)識將相應(yīng)答案反饋給答案需要方。目前關(guān)于問答系統(tǒng)的研究趨于成熟,但都不能很好地應(yīng)用于物流行業(yè)中,基于物流及關(guān)務(wù)行業(yè)的特性,從既定數(shù)據(jù)庫或人工服務(wù)中均無法實現(xiàn)高質(zhì)量的用戶問答互動。
技術(shù)實現(xiàn)要素:
針對現(xiàn)有技術(shù)的不足,本發(fā)明的目的旨在提供一種物流知識智能問答系統(tǒng)及方法,主要應(yīng)用于物流行業(yè)中,以解決現(xiàn)有問答系統(tǒng)不能高質(zhì)量解答包括本領(lǐng)域從業(yè)人員在內(nèi)的客戶提問的問題,并保障問答系統(tǒng)所輸出答案的時效性。
為實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
一種物流知識智能問答系統(tǒng),包括:
問答互動模塊,用于接收來自用戶端的提問;
專家助手子系統(tǒng),包括專家管理模塊和專家信息推送模塊,專家管理模塊基于專家數(shù)據(jù)進(jìn)行專家畫像,專家信息推送模塊根據(jù)專家畫像向?qū)<彝扑吞釂枺<覍μ釂柕慕獯鹨涝窂絺魉椭劣脩舳恕?/p>
進(jìn)一步地,本發(fā)明公開的物流知識智能問答系統(tǒng)還包括歸類模塊和數(shù)據(jù)存儲模塊,專家信息推送模塊將提問和解答內(nèi)容傳送至歸類模塊,歸類模塊用于對提問和解答內(nèi)容進(jìn)行統(tǒng)一分類處理,數(shù)據(jù)存儲模塊用于根據(jù)歸類模塊的統(tǒng)一分類結(jié)果依類別存儲數(shù)據(jù)。
進(jìn)一步地,為了保障數(shù)據(jù)的時效性,數(shù)據(jù)存儲模塊還用于根據(jù)預(yù)設(shè)規(guī)則將所存儲的信息分別設(shè)置為有效信息和過期信息,預(yù)設(shè)規(guī)則包括:a、對應(yīng)于特定類別的信息遵循于對應(yīng)的有效時間,該特定類別的信息經(jīng)過有效時間后轉(zhuǎn)為過期信息;b、數(shù)據(jù)存儲模塊從歸類模塊中接收到的更新信息與原有有效信息進(jìn)行對比,當(dāng)更新信息與原有有效信息的關(guān)鍵詞相似度達(dá)到設(shè)定值時,則原有有效信息轉(zhuǎn)為過期信息,更新信息替換原有信息作為有效信息。
進(jìn)一步地,問答互動模塊還用于根據(jù)提問內(nèi)容在數(shù)據(jù)存儲模塊所存儲的有效信息中提取答案并計算所提取答案與提問的匹配度,問答互動模塊還用于根據(jù)該匹配度選擇后續(xù)的數(shù)據(jù)傳送模式:當(dāng)匹配度達(dá)到第一閾值時,將該答案傳送至用戶端完成自動化解答;另有低于第一閾值的第二閾值,當(dāng)匹配度低于第一閾值并不低于第二閾值時,將該答案傳送至用戶端,為了完善該答案同時將提問內(nèi)容經(jīng)專家助手子系統(tǒng)傳送至人工端,人工端對提問的解答依原路徑傳送至用戶端;當(dāng)匹配度低于第二閾值時,直接將提問內(nèi)容經(jīng)專家助手子系統(tǒng)傳送至人工端,人工端對提問的解答依原路徑傳送至用戶端。
進(jìn)一步地,本發(fā)明公開的物流知識智能問答系統(tǒng)還包括信息獲取模塊,信息獲取模塊用于從云端獲取熱點信息并傳送至歸類模塊,熱點信息經(jīng)歸類模塊進(jìn)行統(tǒng)一分類處理后傳送至數(shù)據(jù)存儲模塊中進(jìn)行存儲。
進(jìn)一步地,本發(fā)明公開的物流知識智能問答系統(tǒng)還包括信息處理模塊,信息處理模塊和專家助手子系統(tǒng)在熱點信息從信息獲取模塊至歸類模塊的過程中對其進(jìn)行處理,具體地,信息處理模塊用于接收來自信息獲取模塊的熱點信息并對其進(jìn)行原數(shù)據(jù)分類,完成原數(shù)據(jù)分類的熱點信息傳送至專家信息推送模塊,專家信息推送模塊根據(jù)專家畫像向?qū)<彝扑蜔狳c信息,并將專家對熱點信息的解讀分析和完成原數(shù)據(jù)分類的熱點信息傳送至歸類模塊;歸類模塊對完成原數(shù)據(jù)分類的熱點信息和專家對熱點信息的解讀分析進(jìn)行統(tǒng)一分類處理,數(shù)據(jù)存儲模塊根據(jù)歸類模塊的統(tǒng)一分類結(jié)果依類別存儲數(shù)據(jù)。
進(jìn)一步地,信息處理模塊基于多個維度的屬性特征對熱點信息進(jìn)行原數(shù)據(jù)分類。
進(jìn)一步地,信息處理模塊在對熱點信息進(jìn)行原數(shù)據(jù)分類之前,對熱點信息在多個維度的屬性特征分配對應(yīng)的權(quán)重值。
進(jìn)一步地,多個維度包括來源網(wǎng)站、來源目錄、地點信息和閱讀次數(shù)。
一種物流知識智能問答方法,包括如下步驟:
s0、專家管理模塊基于專家數(shù)據(jù)進(jìn)行專家畫像;
s1、問答互動模塊根據(jù)提問內(nèi)容在數(shù)據(jù)存儲模塊中提取答案并計算所提取答案與提問的匹配度;
s1’、問答互動模塊根據(jù)匹配度選擇后續(xù)的數(shù)據(jù)傳送模式:當(dāng)匹配度達(dá)到第一閾值時,將該答案傳送至用戶端完成自動化解答;另有低于第一閾值的第二閾值,當(dāng)匹配度低于第一閾值并不低于第二閾值時,將該答案傳送至用戶端,為了完善該答案同時將提問內(nèi)容傳送至專家信息推送模塊;當(dāng)匹配度低于第二閾值時,直接將提問內(nèi)容傳送至專家信息推送模塊;
s2、專家信息推送模塊根據(jù)專家畫像選擇專家推送提問;
s3、將專家對提問的解答依原路徑推送至用戶端。
進(jìn)一步地,數(shù)據(jù)存儲模塊根據(jù)預(yù)設(shè)規(guī)則將所存儲的信息分為有效信息和過期信息兩種狀態(tài),設(shè)定規(guī)則包括:a、對應(yīng)于特定類別的信息遵循于對應(yīng)的有效時間,該特定類別的信息經(jīng)過有效時間后轉(zhuǎn)為過期信息;b、數(shù)據(jù)存儲模塊從歸類模塊中接收到的更新信息與原有有效信息進(jìn)行對比,當(dāng)更新信息與原有有效信息的關(guān)鍵詞相似度達(dá)到設(shè)定值時,則原有有效信息轉(zhuǎn)為過期信息,更新信息替換原有信息作為有效信息;
并且在s1中,問答互動模塊根據(jù)提問內(nèi)容在數(shù)據(jù)存儲模塊所存儲的有效信息中提取答案。
本發(fā)明的有益效果在于:(1)通過專家助手子系統(tǒng)將用戶提問推送至專家,由理論專家或?qū)嵅賹<疫M(jìn)行解答,解決了現(xiàn)有技術(shù)中克服人員普遍不具備實操經(jīng)驗、不能解讀熱點資訊的問題;(2)專家助手子系統(tǒng)中包括了專家管理模塊,通過專家管理模塊對專家進(jìn)行畫像,將用戶提問精準(zhǔn)地推送至擅長對應(yīng)領(lǐng)域的專家,使提問流向真正的“專家”,大大保障了解答質(zhì)量;(3)通過云端獲取熱點信息,將熱點信息分類、解讀分析、再統(tǒng)一分類后存儲至數(shù)據(jù)存儲模塊,人工端與用戶端的問答內(nèi)容也經(jīng)處理后存儲至數(shù)據(jù)存儲模塊,形成行業(yè)知識庫,實現(xiàn)對物流行業(yè)知識的沉淀,為更深入的大數(shù)據(jù)挖掘提供了條件;(4)結(jié)合云端上的實時熱點信息,數(shù)據(jù)存儲模塊(即數(shù)據(jù)庫或答案庫)根據(jù)預(yù)設(shè)規(guī)則自動化更新數(shù)據(jù),使存儲內(nèi)容“與時俱進(jìn)”,將原本高懸于屋梁的政策、法規(guī)等熱點資訊落地于實際問答中,保障了問答系統(tǒng)輸出答案的時效性,大大提高了系統(tǒng)的可靠性;(5)問答互動系統(tǒng)可根據(jù)提問內(nèi)容從數(shù)據(jù)庫中提取答案進(jìn)行自動化解答,避免同樣的問題重復(fù)推送,從人工回答逐步過渡到ai智能回答,節(jié)省專家人力成本。
附圖說明
圖1是本發(fā)明中一種物流知識智能問答系統(tǒng)的結(jié)構(gòu)框圖。
具體實施方式
下面,結(jié)合附圖以及具體實施方式,對本發(fā)明做進(jìn)一步描述:
實施例1
如圖1所示,一種物流知識智能問答系統(tǒng),包括信息獲取模塊、信息處理模塊、專家助手子系統(tǒng)、歸類模塊、數(shù)據(jù)存儲模塊和問答互動模塊:
連接云端的信息獲取模塊用于根據(jù)物流行業(yè)關(guān)鍵詞以及信息源的預(yù)定義設(shè)置,通過爬蟲技術(shù)從云端獲取熱點信息,熱點信息包括與物流行業(yè)相關(guān)的政策信息及其衍生信息;信息獲取模塊還用于將完成預(yù)處理的熱點信息傳送至信息處理模塊;
信息處理模塊用于對熱點信息進(jìn)行篩選和原數(shù)據(jù)分類,對于符合特定關(guān)鍵詞的熱點新聞按照時間軸建立追蹤索引,其中原數(shù)據(jù)分類采用決策樹分類算法,具體為:提取熱點信息在來源網(wǎng)站、來源目錄、涉及行業(yè)、地點信息、閱讀次數(shù)等維度的屬性特征,對多個維度的屬性特征分配對應(yīng)的權(quán)重值,并通過orange等分析工具對熱點信息進(jìn)行歸納和原數(shù)據(jù)分類;信息處理模塊將完成原數(shù)據(jù)分類的熱點信息傳送至專家助手子系統(tǒng);
專家助手子系統(tǒng)用于連接系統(tǒng)和人工端,包括專家管理模塊和專家信息推送模塊,人工端面向理論專家和實操專家等行業(yè)專家,專家管理模塊根據(jù)專家數(shù)據(jù)進(jìn)行專家畫像,專家數(shù)據(jù)包括基本信息,基本信息包括教育背景、所屬細(xì)分行業(yè)、從業(yè)年限、行業(yè)經(jīng)驗和關(guān)注標(biāo)簽等,專家信息推送模塊基于熱點信息的原數(shù)據(jù)分類結(jié)果和專家畫像向?qū)<彝扑蜔狳c信息,專家信息推送模塊還基于用戶提問內(nèi)容結(jié)合用戶數(shù)據(jù)和專家畫像向?qū)<彝扑吞釂杻?nèi)容,該用戶數(shù)據(jù)包括用戶關(guān)注標(biāo)簽、用戶對各專家的關(guān)聯(lián)度(包括所屬細(xì)分行業(yè)的關(guān)聯(lián)度)與關(guān)注度等,使熱點信息和用戶提問流向真正的“專家”,以提高專家解讀信息和解答提問的效率,專家對熱點信息的解讀分析、專家對用戶提問的解答、該解答在用戶端的反響記錄也將作為專家管理模塊進(jìn)行專家畫像的依據(jù);專家助手子系統(tǒng)將人工端對提問的解答經(jīng)問答互動模塊傳送至用戶端,專家助手子系統(tǒng)還將完成原數(shù)據(jù)分類的熱點信息、專家對熱點信息的解讀分析和問答內(nèi)容傳送至歸類模塊;在運行過程中,專家助手子系統(tǒng)還可通過對各項數(shù)據(jù)進(jìn)行邏輯校驗實現(xiàn)自我進(jìn)化升級;
歸類模塊用于對完成原數(shù)據(jù)分類的熱點信息、專家對熱點信息的解讀分析和由人工端完成解答的問答內(nèi)容進(jìn)行統(tǒng)一化分類處理,并將完成統(tǒng)一化分類處理的信息內(nèi)容傳送至數(shù)據(jù)存儲模塊,統(tǒng)一分類處理的類別選擇包括實際操作類,對應(yīng)于與實際業(yè)務(wù)操作相關(guān)的內(nèi)容;
數(shù)據(jù)存儲模塊用于依類別存儲信息,存儲信息的類別也包括實際操作類;數(shù)據(jù)存儲模塊還用于根據(jù)預(yù)設(shè)規(guī)則將所存儲的信息分別設(shè)置為有效信息和過期信息兩種狀態(tài),預(yù)設(shè)規(guī)則包括:a、對應(yīng)于特定類別的信息遵循于對應(yīng)的有效時間,該特定類別的信息經(jīng)過有效時間后轉(zhuǎn)為過期信息;b、數(shù)據(jù)存儲模塊從歸類模塊中接收到的更新信息與原有有效信息進(jìn)行對比,當(dāng)更新信息與原有有效信息的關(guān)鍵詞相似度達(dá)到設(shè)定值時,則原有有效信息轉(zhuǎn)為過期信息,更新信息替換原有信息作為有效信息;
問答互動模塊面向用戶端,用于接收來自用戶端的提問,依據(jù)提問內(nèi)容從數(shù)據(jù)存儲模塊所沉淀的有效信息中提取答案并計算所提取答案與提問的匹配度,問答互動模塊還根據(jù)匹配度選擇后續(xù)的數(shù)據(jù)傳送模式:當(dāng)匹配度不低于第一閾值時,將該答案傳送至用戶端完成自動化解答;另有低于第一閾值的第二閾值,當(dāng)匹配度低于第一閾值并不小于第二閾值時,將該答案傳送至用戶端,為了完善該答案同時將提問內(nèi)容和用戶數(shù)據(jù)一起傳送至專家助手子系統(tǒng),并由專家助手子系統(tǒng)將提問內(nèi)容推送至人工端,人工端對提問的解答依原路徑傳送至用戶端;當(dāng)匹配度低于第二閾值時,直接將提問內(nèi)容和用戶數(shù)據(jù)一起傳送至專家助手子系統(tǒng),并由專家助手子系統(tǒng)將提問內(nèi)容推送至人工端,人工端對提問的解答依原路徑傳送至用戶端;其中第一閾值設(shè)為90%,第二閾值設(shè)為60%。
實施例2
一種物流知識智能問答方法,包括以下步驟:
s0、人工端面向?qū)<?,專家助手子系統(tǒng)包括專家管理模塊和專家信息推送模塊,專家管理模塊根據(jù)專家數(shù)據(jù)采用迭代決策算法(gbdt)進(jìn)行專家畫像,專家數(shù)據(jù)包括基本信息,基本信息包括教育背景、所屬細(xì)分行業(yè)、從業(yè)年限、行業(yè)經(jīng)驗和關(guān)注標(biāo)簽等;
s1、問答互動模塊根據(jù)提問內(nèi)容在數(shù)據(jù)存儲模塊所存儲的有效信息中提取答案并計算所提取答案與提問的匹配度;
s1’、問答互動模塊根據(jù)所提取答案與提問的匹配度選擇后續(xù)的數(shù)據(jù)傳送模式:當(dāng)匹配度不低于第一閾值時,將該答案傳送至用戶端完成自動化解答;當(dāng)匹配度低于第一閾值并不小于第二閾值時,將該答案傳送至用戶端,為了完善該答案同時將提問內(nèi)容和用戶數(shù)據(jù)一起傳送至專家信息推送模塊;當(dāng)匹配度低于第二閾值時,直接將提問內(nèi)容和用戶數(shù)據(jù)一起傳送至專家信息推送模塊;
s2、傳送至專家信息推送模塊的提問攜帶了用戶數(shù)據(jù),用戶數(shù)據(jù)包括用戶關(guān)注標(biāo)簽、用戶對各專家的關(guān)聯(lián)度(包括所屬細(xì)分行業(yè)的關(guān)聯(lián)度)與關(guān)注度等,專家信息推送模塊結(jié)合專家畫像和用戶數(shù)據(jù)選擇專家推送提問;
s3、將專家對提問的解答依原路徑推送至用戶端;
s4、將經(jīng)過專家助手子系統(tǒng)的提問和解答內(nèi)容經(jīng)歸類模塊進(jìn)行統(tǒng)一分類處理,將完成統(tǒng)一分類的數(shù)據(jù)存儲于數(shù)據(jù)存儲模塊中,數(shù)據(jù)存儲模塊根據(jù)預(yù)設(shè)規(guī)則將所存儲的信息分別設(shè)置為有效信息和過期信息兩種狀態(tài),預(yù)設(shè)規(guī)則包括:a、對應(yīng)于特定類別的信息遵循于對應(yīng)的有效時間,該特定類別的信息經(jīng)過有效時間后轉(zhuǎn)為過期信息;b、數(shù)據(jù)存儲模塊從歸類模塊中接收到的更新信息與原有有效信息進(jìn)行對比,當(dāng)更新信息與原有有效信息的關(guān)鍵詞相似度達(dá)到設(shè)定值時,則原有有效信息轉(zhuǎn)為過期信息,更新信息替換原有信息作為有效信息。
在進(jìn)行s0~s4的同時,從云端獲取熱點數(shù)據(jù)并提煉成有用數(shù)據(jù)存儲至數(shù)據(jù)存儲模塊中,具體包括以下步驟:
t1、信息獲取模塊根據(jù)物流行業(yè)關(guān)鍵詞以及信息源的預(yù)定義設(shè)置從云端獲取熱點信息,并將進(jìn)行預(yù)處理后的熱點信息傳送至信息處理模塊,預(yù)處理的內(nèi)容包括統(tǒng)一格式化、簡單分類(如政策類、新聞類)和簡單過濾(如有無違法關(guān)鍵字)等;
t2、信息處理模塊采用決策樹分類算法對熱點信息進(jìn)行原數(shù)據(jù)分類,具體為:提取熱點信息在來源網(wǎng)站、來源目錄、涉及行業(yè)、地點信息、閱讀次數(shù)等維度的屬性特征,對多個維度的屬性特征分配對應(yīng)的權(quán)重值,并通過orange等分析工具對熱點信息進(jìn)行歸納和原數(shù)據(jù)分類;專家信息推送模塊基于熱點信息的原數(shù)據(jù)分類結(jié)果和專家畫像向?qū)<彝扑蜔狳c信息,得到人工端對熱點信息的解讀分析,并將完成原數(shù)據(jù)分類的熱點信息、專家對熱點信息的解讀分析傳送至歸類模塊;
t3、歸類模塊對完成原數(shù)據(jù)分類的熱點信息、專家對熱點信息的解讀分析進(jìn)行統(tǒng)一化分類處理,完成統(tǒng)一化分類處理的信息依類別存儲至數(shù)據(jù)存儲模塊。
對本領(lǐng)域的技術(shù)人員來說,可根據(jù)以上描述的技術(shù)方案以及構(gòu)思,做出其它各種相應(yīng)的改變以及形變,而所有的這些改變以及形變都應(yīng)該屬于本發(fā)明權(quán)利要求的保護(hù)范圍之內(nèi)。