自然語言處理的系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及自然語言處理。某些實例提供了自然語言處理的系統(tǒng)和方法。
【背景技術(shù)】
[0002]目前已有各種技術(shù)被開發(fā)用于自然語言處理。過去的方法,包括那些使用語義網(wǎng)絡(luò)以體現(xiàn)知識或概念之間的關(guān)系的方法,會在學(xué)習(xí)和/或?qū)δ切┮郧耙阎膯栴}或情況未建立的響應(yīng)提供響應(yīng)遇到問題,因為這樣的技術(shù)可能不適合在連續(xù)或有不同設(shè)置及域名的語境使用。
[0003]對自然語言處理的系統(tǒng)和方法是有期望改進的,包括在沒有具體的先驗知識要求的情況下用于生成對自然語言輸入查詢或問題的響應(yīng)。
[0004]以上對相關(guān)技術(shù)和有關(guān)限制的實例旨在是說明而不是限定性的。相關(guān)技術(shù)的其它局限性會在本領(lǐng)域技術(shù)人員對其說明書閱讀和對附圖進行研究后變得顯而易見。
【附圖說明】
[0005]樣例會參照附圖進行說明。本文在此公開的樣例和附圖的意圖是旨在說明性而非限制性。
[0006]圖1是一個展示自然語言處理系統(tǒng)的框圖;
[0007]圖2所示的流程圖根據(jù)一個樣例展示了自然語言處理的方法;
[0008]圖3的框圖是圖1的系統(tǒng)中的一個內(nèi)存。
【具體實施方式】
[0009]以下描述的方法是在服務(wù)器中具有處理器,內(nèi)存,并且一個有存儲功能的網(wǎng)絡(luò)接口設(shè)備,包括一個有多個節(jié)點的圖形數(shù)據(jù)結(jié)構(gòu),每個節(jié)點與一個實體數(shù)據(jù)值相關(guān)聯(lián)并連接多個鏈路,其中,每個鏈路連接兩個節(jié)點,并與一個關(guān)系數(shù)據(jù)值和一個或多個評估準(zhǔn)則評級對值相關(guān)聯(lián),在網(wǎng)絡(luò)接口設(shè)備接收,在一個用于響應(yīng)電子裝置的輸入端分析輸入,以確定一個或一個以上實體數(shù)據(jù)值和一個或多個關(guān)系數(shù)據(jù)值,用已識別的實體數(shù)據(jù)值和關(guān)系數(shù)據(jù)值填寫圖形數(shù)據(jù)結(jié)構(gòu),其中所述的填寫包括應(yīng)用評估標(biāo)準(zhǔn)評估對值,遍歷圖形數(shù)據(jù)結(jié)構(gòu),以確定由評估標(biāo)準(zhǔn)評估對值識別出的一個或更多個問題,為了回應(yīng)這個遍歷,應(yīng)確定一個或多個對圖形數(shù)據(jù)結(jié)構(gòu)的改變,以滿足一個或多個所識別的問題,如果確定是肯定的,填寫圖形數(shù)據(jù)結(jié)構(gòu)解決方案以滿足一個或多個已識別的問題,并將其傳輸給電子設(shè)備作為對輸入的響應(yīng)。
[0010]為了使本領(lǐng)域的技術(shù)人員有更透徹的理解,下面對具體闡述專利細節(jié)。不過,為了避免與本公開內(nèi)容不必要地混淆,一些公認(rèn)的要素不會有詳細演示或描述。因此,本說明書和附圖應(yīng)被視為說明性的,而不是限制性的。
[0011]該公開內(nèi)容一般涉及自然語言處理,或特別涉及使用人工智能技術(shù)的自然語言處理的系統(tǒng)和方法。
[0012]下面的描述(包括附圖1)提供對用于自然語言處理的人工智能系統(tǒng)的示范性系統(tǒng)的詳細描述。結(jié)合圖2詳細描述相應(yīng)的計算機實現(xiàn)的方法。
[0013]附圖1是用于自然語言處理的系統(tǒng)100的例子。
[0014]在該例子中,系統(tǒng)100包括一個或多個電子設(shè)備102-1,102-2,...102_X(本文中“電子設(shè)備102”是泛指也是統(tǒng)稱;這個命名法也適用于本文其它要素),所有這些都經(jīng)由網(wǎng)絡(luò)106連接到服務(wù)器108。
[0015]服務(wù)器108是典型地含一個或多個處理器116,易失性內(nèi)存114 ( S卩,隨機存取內(nèi)存或內(nèi)存,持久性內(nèi)存114(例如,硬盤設(shè)備),以及網(wǎng)絡(luò)接口設(shè)備110(以允許服務(wù)器108通過網(wǎng)絡(luò)106通信)的服務(wù)器或主機,其所有組成都通過總線相互連接。本發(fā)明的范圍就包括在許多計算環(huán)境實現(xiàn)服務(wù)器108或使用組件。服務(wù)器108可包括一對冗余服務(wù)器的,經(jīng)由網(wǎng)絡(luò)106連接(例如,內(nèi)聯(lián)網(wǎng)或因特網(wǎng))(未示出)。
[0016]服務(wù)器108可以連接到其他計算基礎(chǔ)設(shè)施,包括顯示器,打印機,數(shù)據(jù)倉庫或文件服務(wù)器等(圖1中未示出)。
[0017]服務(wù)器108包括一個與處理器116互連的網(wǎng)絡(luò)接口設(shè)備110。網(wǎng)絡(luò)接口設(shè)備110允許服務(wù)器108與其他計算設(shè)備連接,如電子設(shè)備102經(jīng)由網(wǎng)絡(luò)106或者直接通過本地通信連接(例如通用串行總線(USB)或藍牙?連接,未示出)鏈接其他計算設(shè)備。網(wǎng)絡(luò)106可包括任何有線和/或無線網(wǎng)絡(luò)的適當(dāng)組合,包括但不限于廣域網(wǎng)(WAN),諸如因特網(wǎng),局域網(wǎng)(LAN),HSPA/EVDO/LTE小區(qū)電話網(wǎng)絡(luò),WiFi網(wǎng)絡(luò),和其他類似網(wǎng)絡(luò)技術(shù)。
[0018]網(wǎng)絡(luò)接口設(shè)備110根據(jù)需要與網(wǎng)絡(luò)106,以及與本地鏈路兼容。在一個例子中,網(wǎng)絡(luò)接口設(shè)備110和網(wǎng)絡(luò)106之間的鏈路是有線鏈路,例如以太網(wǎng)鏈路。因此網(wǎng)絡(luò)接口設(shè)備110需要包括必要的硬件在這樣的鏈路進行通信。在其它實例中,服務(wù)器108和網(wǎng)絡(luò)106之間的鏈路可以是無線的。網(wǎng)絡(luò)接口設(shè)備110可以包括(除了或代替任何有線鏈路硬件)一個或多個發(fā)送器/接收器組件,或無線電和相關(guān)電路。
[0019]服務(wù)器108可包括鍵盤,鼠標(biāo),觸敏顯示器(或其它輸入設(shè)備),監(jiān)視器(或顯示器,諸如觸敏顯示器或其它輸出設(shè)備)(圖1中未示出)。
[0020]在服務(wù)器108的內(nèi)存114中儲存了多個由處理器116執(zhí)行的計算機可讀指令。這些指令可以包括操作系統(tǒng)(“OS”)和各種應(yīng)用程序。在內(nèi)存114中的其中一個應(yīng)用程序是應(yīng)用程序104(在此也稱為為“應(yīng)用程序104”;在圖1中未示出)。當(dāng)116處理器執(zhí)行程序104的指令,處理器116被配置用于執(zhí)行由應(yīng)用程序104的計算機可讀指令指定的各種功能,這將在下面更詳細地討論。
[0021]服務(wù)器108還可以存儲于內(nèi)存114,和下面會更詳細地討論的圖形數(shù)據(jù)結(jié)構(gòu)118及元數(shù)據(jù)數(shù)據(jù)庫120中。內(nèi)存114還可以存儲包括在一個或多個電子設(shè)備102和服務(wù)器108之間的輸入和回應(yīng)信息放入傳輸。圖形數(shù)據(jù)結(jié)構(gòu)118匯集了指節(jié)點,鏈路,和評估標(biāo)準(zhǔn)評估對值,其可以作為數(shù)據(jù)變量,數(shù)組,字段和指針存儲在內(nèi)存114。
[0022]通常情況下,電子設(shè)備102是與通過服務(wù)器108的回應(yīng)自然語言輸入的用戶相關(guān)聯(lián)。電子設(shè)備102可以是任何一個臺式計算機,智能電話,筆記本電腦,平板電腦等。電子設(shè)備102可以包括一個或多個處理器,內(nèi)存,輸入和輸出設(shè)備(通常包括顯不器,揚聲器,一個麥克風(fēng),和一個照相機),并上述中提到的與服務(wù)器108連接的網(wǎng)絡(luò)接口設(shè)備(在圖1中未示出)。電子設(shè)備102可以由用戶來操作。
[0023]電子設(shè)備102與服務(wù)器108來經(jīng)由使用了在電子設(shè)備102上加載的客戶端應(yīng)用程序112(未在圖1中示出)的網(wǎng)絡(luò)106來交換消息。在一個示例中,客戶端112應(yīng)用可以是一個網(wǎng)頁瀏覽器或使用基于網(wǎng)絡(luò)或移動接口交換包括響應(yīng)自然語言輸入的信息的本機應(yīng)用程序。
[0024]根據(jù)一些例子,客戶端112應(yīng)用可以接收由電子設(shè)備102的麥克風(fēng)捕獲的自然語言口語輸入,并將之由電子設(shè)備102,或者,在一些情況下,由服務(wù)器108轉(zhuǎn)換為文本輸入。自然語言口語輸入采用目前語音到文本的技術(shù)進行處理。
[0025]在一個備選例中,電子設(shè)備104可以是爬行引擎(圖1中未示出)。一個爬行引擎是一個服務(wù)器或應(yīng)用程序,其在互聯(lián)網(wǎng),內(nèi)聯(lián)網(wǎng)的數(shù)據(jù)庫查詢處理器,或企業(yè)或機構(gòu)的數(shù)據(jù)庫系統(tǒng)中為自動化的“機器人”或數(shù)據(jù)源網(wǎng)絡(luò)爬行提供功能。根據(jù)該示例中,爬行引擎從檢索過的網(wǎng)頁或文本或其它位于該企業(yè)或機構(gòu)的數(shù)據(jù)庫,內(nèi)部網(wǎng)或互聯(lián)網(wǎng)上的媒體資源提供自然語言輸入。爬行引擎可以識別問題,并確定與“學(xué)習(xí)”新的實體數(shù)據(jù)值,關(guān)系價值和評價標(biāo)準(zhǔn)評價對值。這些術(shù)語還會在下面討論。
[0026]如上所述,內(nèi)存114支持圖數(shù)據(jù)結(jié)構(gòu)118和元數(shù)據(jù)數(shù)據(jù)庫120。元數(shù)據(jù)數(shù)據(jù)庫120是一個數(shù)據(jù)庫應(yīng)用程序可以加載在服務(wù)器108上,在一個與服務(wù)器108的網(wǎng)絡(luò)110接口裝置通信的獨立的數(shù)據(jù)庫服務(wù)器或虛擬機上,或加載在其他任何適合的數(shù)據(jù)庫上。
[0027]內(nèi)存114支持一個或多個118圖形數(shù)據(jù)結(jié)構(gòu)118-1,118-2,...,118-m。圖3示出一個118數(shù)據(jù)結(jié)構(gòu)樣例。圖數(shù)據(jù)結(jié)構(gòu)118包括多個節(jié)點,132-1,132-2,...132_n(圖3示例兩個節(jié)點)和多個鏈路134-1,134-2,...134-0 (圖3示例三個鏈路)。每個節(jié)點132與一個實體數(shù)據(jù)值136相關(guān)聯(lián)。一個實體數(shù)據(jù)值136對應(yīng)一個實體對象(例如,“蘋果”,“種子”)的或一個概念(例如,“饑餓”)。兩個節(jié)點132可以連接一個或多個鏈接134。一個鏈接134可與一個或多個關(guān)系數(shù)據(jù)值138和一個或多個評估準(zhǔn)則評級對關(guān)聯(lián)值140相關(guān)聯(lián)。關(guān)系數(shù)據(jù)值138對應(yīng)一類在實體數(shù)據(jù)關(guān)系值136之間的關(guān)系(例如,“收藏”,“保藏”,“展品”)。兩個節(jié)點132與檢測出的關(guān)系鏈接(例如,一個“蘋果”,“含有”,“種子(