許多軟件產(chǎn)品提供了相對(duì)大量的內(nèi)部功能以供在使用軟件產(chǎn)品執(zhí)行各種任務(wù)的同時(shí)利用。例如,文字處理器內(nèi)的拼寫(xiě)檢查功能、電子表格應(yīng)用內(nèi)的算法功能以及用于改變公布應(yīng)用中的文本的圖形功能相對(duì)常見(jiàn)。然而,大量的用戶(hù)不熟悉在一些軟件產(chǎn)品中所提供的許多其它特征、功能和工具。為了解決上述問(wèn)題,一些軟件產(chǎn)品提供了“幫助”或“查詢(xún)”工具,其允許用戶(hù)輸入與期望任務(wù)相關(guān)的表達(dá),以及接收根據(jù)由該幫助或查詢(xún)工具采用的特定算法的結(jié)果。例如,可允許用戶(hù)利用對(duì)用戶(hù)期望在底層的軟件產(chǎn)品中使用的功能進(jìn)行描述的自然語(yǔ)言來(lái)輸入短語(yǔ)或輸入詞語(yǔ)的群組。為了從短語(yǔ)推斷出有關(guān)的功能并隨后返回給用戶(hù),幫助或查詢(xún)工具必須確定在由用戶(hù)供給的短語(yǔ)與對(duì)可用功能的預(yù)定義描述之間存在什么匹配(如果有)。此外,與生成底層軟件產(chǎn)品和對(duì)相關(guān)聯(lián)的功能的描述的軟件編程者所使用的詞語(yǔ)的小群組相比,由任意數(shù)量的用戶(hù)創(chuàng)建的自然表達(dá)必須被考慮在內(nèi)。因此,將用于描述期望的軟件功能的自然語(yǔ)言表達(dá)與期望的軟件功能的實(shí)際的內(nèi)部命名規(guī)約相比較,兩者之間可能存在大的差距。本公開(kāi)正是基于這些考慮以及其它考慮而做出的。技術(shù)實(shí)現(xiàn)要素:本文描述了基于查詢(xún)來(lái)識(shí)別查詢(xún)意圖以便發(fā)現(xiàn)由軟件產(chǎn)品或軟件產(chǎn)品的群組所提供的功能的技術(shù)。特別地,可以基于一組對(duì)于自然語(yǔ)言詞語(yǔ)的基于規(guī)則的置換將自然語(yǔ)言表達(dá)反復(fù)地分割且合并成基于由軟件產(chǎn)品提供的功能的預(yù)定命名規(guī)約的一個(gè)或多個(gè)定義的詞語(yǔ)。此后,可以識(shí)別與定義的詞語(yǔ)相關(guān)的先前搜索詞語(yǔ)的聚類(lèi)(cluster),并且可以將所述自然語(yǔ)言表達(dá)與所識(shí)別的聚類(lèi)相關(guān)聯(lián)以創(chuàng)建基于意圖的聚類(lèi)信息。根據(jù)本文呈現(xiàn)的一個(gè)實(shí)施例,一種用于識(shí)別查詢(xún)意圖的方法包括:接收指向由計(jì)算機(jī)中可用的軟件產(chǎn)品提供的至少一個(gè)功能的原始查詢(xún)。該原始查詢(xún)包括與至少一個(gè)功能相關(guān)的自然語(yǔ)言表達(dá)。該方法還包括:基于一組對(duì)于自然語(yǔ)言詞語(yǔ)的基于規(guī)則的置換將自然語(yǔ)言表達(dá)的詞語(yǔ)反復(fù)地分割且合并成一個(gè)或多個(gè)定義的詞語(yǔ),一個(gè)或多個(gè)定義的詞語(yǔ)是基于至少一個(gè)功能的預(yù)定命名規(guī)約的。一個(gè)或多個(gè)定義的詞語(yǔ)可以指代至少一個(gè)功能。此后該方法包括:識(shí)別與一個(gè)或多個(gè)定義的詞語(yǔ)相關(guān)的先前搜索詞語(yǔ)的聚類(lèi),以及將自然語(yǔ)言表達(dá)與所識(shí)別的聚類(lèi)相關(guān)聯(lián)以創(chuàng)建一組基于意圖的聚類(lèi)信息。該查詢(xún)意圖由一個(gè)或多個(gè)定義的詞語(yǔ)來(lái)表示。根據(jù)本文呈現(xiàn)的另一實(shí)施例,一種聚類(lèi)系統(tǒng)被配置為從接收自多個(gè)客戶(hù)端計(jì)算機(jī)的原始查詢(xún)中識(shí)別意圖,用于發(fā)現(xiàn)由在客戶(hù)端計(jì)算機(jī)上執(zhí)行的軟件產(chǎn)品提供的功能。聚類(lèi)系統(tǒng)包括至少一個(gè)計(jì)算機(jī),其執(zhí)行原始查詢(xún)處理服務(wù),原始查詢(xún)處理服務(wù)被配置為:接收來(lái)自多個(gè)客戶(hù)端計(jì)算機(jī)中的至少一個(gè)客戶(hù)端計(jì)算機(jī)的原始查詢(xún),校正在該原始查詢(xún)中所包含的單詞拼寫(xiě)以創(chuàng)建已校正拼寫(xiě)的查詢(xún),覆蓋(override)所述已校正拼寫(xiě)的查詢(xún)中的單詞的一部分的已校正拼寫(xiě)以創(chuàng)建與至少一個(gè)功能相關(guān)的初始群(initialgrouping),以及基于自然語(yǔ)言表達(dá)中的修飾詞語(yǔ),將初始群的和已校正拼寫(xiě)的查詢(xún)的詞語(yǔ)(termsoftheinitialgroupingandthespell-correctedquery)群聚成一組初步詞語(yǔ)群。修飾詞語(yǔ)指代使用所述至少一個(gè)功能的任務(wù)。原始查詢(xún)處理服務(wù)可被進(jìn)一步配置為,基于對(duì)自然語(yǔ)言詞語(yǔ)的基于規(guī)則的置換將所述一組初步群(preliminarygrouping)的各個(gè)群(grouping)分割且合并成精煉詞語(yǔ)群(refinedgroupingsofterms),所述精煉詞語(yǔ)群是基于所述至少一個(gè)功能的預(yù)定命名規(guī)約的,所述精煉詞語(yǔ)群指代所述至少一個(gè)功能,識(shí)別與精煉詞語(yǔ)群相關(guān)的先前搜索詞語(yǔ)的聚類(lèi),將自然語(yǔ)言表達(dá)與所識(shí)別的聚類(lèi)相關(guān)聯(lián)以創(chuàng)建一組基于意圖的聚類(lèi)信息,接收包含至少一個(gè)短語(yǔ)的新的原始查詢(xún),以及將所述至少一個(gè)短語(yǔ)與基于意圖的聚類(lèi)信息進(jìn)行比較以識(shí)別相關(guān)聯(lián)的先前搜索詞語(yǔ)的聚類(lèi)。應(yīng)當(dāng)意識(shí)到上述主題還可以實(shí)現(xiàn)為計(jì)算機(jī)控制的裝置、計(jì)算機(jī)過(guò)程、計(jì)算系統(tǒng)或諸如計(jì)算機(jī)可讀介質(zhì)的制品。雖然本文呈現(xiàn)的實(shí)施例主要是在識(shí)別查詢(xún)意圖的上下文中公開(kāi),但是本文公開(kāi)的概念和技術(shù)也可以用于從其它用戶(hù)提交的數(shù)據(jù)中譯解意圖。這些特征以及各種其它特征將通過(guò)理解下面的詳述以及相關(guān)聯(lián)的附圖的閱覽而變得明顯。提供該
發(fā)明內(nèi)容以便以簡(jiǎn)化的形式來(lái)引入下面的具體實(shí)施方式中進(jìn)一步描述的概念的選集。該
發(fā)明內(nèi)容不旨在識(shí)別所要求保護(hù)的主題的關(guān)鍵特征或主要特征,也不旨在將該
發(fā)明內(nèi)容用于限制所要求保護(hù)的主題的范圍。此外,要求保護(hù)的主題不限于解決在本公開(kāi)的任何部分中提到的任何或全部缺點(diǎn)的實(shí)現(xiàn)方式。附圖說(shuō)明圖1是示出由本文呈現(xiàn)的實(shí)施例提供的示例性的操作環(huán)境和多個(gè)軟件組件的多方面的網(wǎng)絡(luò)圖;圖2是示出根據(jù)本文呈現(xiàn)的一個(gè)實(shí)施例的對(duì)原始用戶(hù)查詢(xún)進(jìn)行預(yù)處理的一個(gè)示例性的例程的多方面的流程圖;圖3是示出根據(jù)本文呈現(xiàn)的一個(gè)實(shí)施例的用于初步群聚查詢(xún)的詞典處理的一個(gè)示例性的例程的多方面的流程圖;圖4是示出根據(jù)本文呈現(xiàn)的一個(gè)實(shí)施例的用于群聚查詢(xún)的第二詞典處理(secondarydictionaryprocessing)的一個(gè)示例性的例程的多方面的流程圖;圖5是示出根據(jù)本文呈現(xiàn)的一個(gè)實(shí)施例的用于群聚查詢(xún)的最終詞典處理的一個(gè)示例性的例程的多方面的流程圖;圖6是示出可用于查詢(xún)意圖的標(biāo)識(shí)的一般輸出格式的示范性的表格;圖7是示出根據(jù)本文呈現(xiàn)的一個(gè)實(shí)施例的用于使用聚類(lèi)查詢(xún)信息進(jìn)行用戶(hù)查詢(xún)的處理的一個(gè)示例性的例程的多方面的流程圖;以及圖8是示出示例性的計(jì)算機(jī)硬件和軟件體系結(jié)構(gòu)的計(jì)算機(jī)體系結(jié)構(gòu)圖。具體實(shí)施方式下文的具體實(shí)施方式涉及用于確定用戶(hù)提交的針對(duì)由一個(gè)或一組軟件產(chǎn)品所提供的特征、功能和/或工具的查詢(xún)的意圖的技術(shù)。通過(guò)使用本文呈現(xiàn)的技術(shù)和概念,相對(duì)精確的意圖識(shí)別是可能的,使得可以為各種自然語(yǔ)言查詢(xún)提供適當(dāng)?shù)慕Y(jié)果,諸如用于發(fā)現(xiàn)計(jì)算機(jī)程序提供的功能的用戶(hù)查詢(xún)。如上文簡(jiǎn)要論述的,常規(guī)的軟件產(chǎn)品可能需要利用與功能的已確立的名稱(chēng)緊密地相匹配的描述,來(lái)以簡(jiǎn)潔的技術(shù)術(shù)語(yǔ)提交想要對(duì)可用功能進(jìn)行定位的查詢(xún)。然而,使用本文公開(kāi)的技術(shù)的實(shí)現(xiàn)方式,可以將對(duì)可用功能進(jìn)行定位的查詢(xún)表達(dá)為自然語(yǔ)言表達(dá),從中可以辨別出意圖。來(lái)自自然語(yǔ)言表達(dá)的短語(yǔ)和詞語(yǔ)可以在一個(gè)或多個(gè)詞典模型的界限內(nèi)被反復(fù)地解析成單個(gè)的詞語(yǔ)以及合并成單個(gè)的短語(yǔ),使得短語(yǔ)的意圖能夠被識(shí)別、聚類(lèi)以及用于未來(lái)的搜索。如本文所使用的,術(shù)語(yǔ)“詞典模型”指代將一組對(duì)于自然語(yǔ)言詞語(yǔ)的基于規(guī)則的置換與基于一個(gè)或多個(gè)軟件產(chǎn)品的內(nèi)部命名規(guī)約的一個(gè)或多個(gè)定義的詞語(yǔ)相關(guān)聯(lián)的文件或結(jié)構(gòu)。聚類(lèi)系統(tǒng)利用詞典模型來(lái)處理短語(yǔ)以持續(xù)地拆分和合并短語(yǔ),直至識(shí)別與一個(gè)或多個(gè)軟件功能相關(guān)的短語(yǔ)的一個(gè)或多個(gè)正確聚類(lèi)。聚類(lèi)系統(tǒng)隨后能夠提供將自然語(yǔ)言表達(dá)與相對(duì)少量的內(nèi)部軟件功能相匹配的“多對(duì)少(many-to-few)”表示的聚類(lèi)信息。聚類(lèi)信息可由被配置為接收查詢(xún)的任何軟件應(yīng)用或信息取回系統(tǒng)使用,包括例如被配置為接收來(lái)自期望使用軟件產(chǎn)品或一組軟件產(chǎn)品的用戶(hù)的查詢(xún)的信息取回系統(tǒng)。在接收到新的或未來(lái)的查詢(xún)時(shí),聚類(lèi)辨識(shí)算法或模塊能夠?qū)⑿虏樵?xún)與相關(guān)聯(lián)的聚類(lèi)匹配,并且提供結(jié)果以供由提交了查詢(xún)的用戶(hù)消費(fèi)。雖然本文所描述的主題是在關(guān)于計(jì)算機(jī)系統(tǒng)的操作系統(tǒng)和應(yīng)用程序的執(zhí)行相結(jié)合而執(zhí)行的程序模塊的一般上下文中呈現(xiàn)的,但是本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到,可以與其它類(lèi)型的程序模塊相結(jié)合來(lái)執(zhí)行其它的實(shí)現(xiàn)方式。通常,程序模塊包括執(zhí)行特定的任務(wù)或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類(lèi)型的例程、程序、組件、數(shù)據(jù)結(jié)構(gòu)、以及其它類(lèi)型的結(jié)構(gòu)。而且,本領(lǐng)域技術(shù)人員將意識(shí)到本文所述的主題可以利用其它計(jì)算機(jī)系統(tǒng)配置來(lái)實(shí)現(xiàn),包括手持式設(shè)備、多處理器系統(tǒng)、基于微處理器的或可編程消費(fèi)電子產(chǎn)品、微型計(jì)算機(jī)、大型計(jì)算機(jī)等。在下面的具體實(shí)施方式中參考了附圖,附圖構(gòu)成具體實(shí)施方式的部分并且是通過(guò)示例性的具體實(shí)施例或示例來(lái)示出的?,F(xiàn)在參考附圖對(duì)用于過(guò)濾電子消息的計(jì)算機(jī)系統(tǒng)和方法的多方面進(jìn)行說(shuō)明,在圖中相似的標(biāo)記表示相似的元件?,F(xiàn)在轉(zhuǎn)到圖1,將提供有關(guān)本文呈現(xiàn)的實(shí)施例所提供的示例性的操作環(huán)境和多個(gè)軟件組件的細(xì)節(jié)。特別地,圖1示出了用于確定一個(gè)或多個(gè)查詢(xún)的意圖的系統(tǒng)100的多方面。系統(tǒng)100包括經(jīng)由網(wǎng)絡(luò)105與聚類(lèi)系統(tǒng)140可操作通信的一個(gè)或多個(gè)客戶(hù)端101A,101B和101C(在本文中以單數(shù)形式稱(chēng)為“客戶(hù)端101”和/或復(fù)數(shù)形式稱(chēng)為“多個(gè)客戶(hù)端101”)??蛻?hù)端101可以是任何適合的計(jì)算機(jī)系統(tǒng),包括但不限于臺(tái)式或膝上型個(gè)人計(jì)算機(jī)、平板式計(jì)算設(shè)備、智能手機(jī)、其它類(lèi)型的移動(dòng)設(shè)備等??蛻?hù)端101可以被配置為執(zhí)行軟件產(chǎn)品,諸如應(yīng)用102A,102B和102C,或者一套軟件產(chǎn)品,其被提供以供用戶(hù)提交查詢(xún),以便發(fā)現(xiàn)由軟件產(chǎn)品所支持的特征、功能和工具。在這方面,客戶(hù)端101可以接收一個(gè)或多個(gè)原始查詢(xún)130A,130B和130C(在本文中以單數(shù)形式稱(chēng)為“原始查詢(xún)130”和/或以復(fù)數(shù)形式稱(chēng)為“多個(gè)原始查詢(xún)130”)。原始查詢(xún)130可以包括客戶(hù)端101的用戶(hù)所創(chuàng)建的短語(yǔ)、詞語(yǔ)的群組和/或自然語(yǔ)言表達(dá)。原始查詢(xún)可以被提交以經(jīng)由網(wǎng)絡(luò)105傳輸。網(wǎng)絡(luò)105可以包括計(jì)算機(jī)通信網(wǎng)絡(luò),諸如因特網(wǎng)、局域網(wǎng)(“LAN”)、廣域網(wǎng)(“WAN”)或任何其它類(lèi)型的網(wǎng)絡(luò),并且可用于將原始查詢(xún)130提交給聚類(lèi)系統(tǒng)140以便進(jìn)一步處理。聚類(lèi)系統(tǒng)140包括多個(gè)組件,所述多個(gè)組件被配置為執(zhí)行如本文所描述的與在詞典模型的界限內(nèi)對(duì)自然語(yǔ)言詞語(yǔ)和/或短語(yǔ)的群進(jìn)行拆分和合并以確定用戶(hù)提交的查詢(xún)的意圖相關(guān)的處理功能。例如,聚類(lèi)系統(tǒng)140可被配置為通過(guò)原始查詢(xún)處理服務(wù)141來(lái)接收并處理原始查詢(xún)130。通常,原始查詢(xún)處理服務(wù)141被配置為從網(wǎng)絡(luò)105接收原始查詢(xún)130。原始查詢(xún)處理服務(wù)141進(jìn)一步被配置為通過(guò)存儲(chǔ)在詞典存儲(chǔ)145中的一個(gè)或多個(gè)詞典模型以及通過(guò)在聚類(lèi)處理服務(wù)143處的聚類(lèi)處理來(lái)確定原始查詢(xún)130的實(shí)際意圖。對(duì)要確定意圖的原始查詢(xún)的實(shí)際處理將參考圖2進(jìn)行更詳細(xì)的說(shuō)明。在確定原始查詢(xún)130的意圖后,原始查詢(xún)處理服務(wù)141將所確定的意圖信息傳達(dá)給聚類(lèi)處理服務(wù)143,使得保持在聚類(lèi)存儲(chǔ)147中的聚類(lèi)信息146反映所確定的意圖和相關(guān)聯(lián)的自然語(yǔ)言表達(dá)。應(yīng)注意,原始查詢(xún)處理服務(wù)141和聚類(lèi)處理服務(wù)143在一些實(shí)施例中可以組合。因此,歸屬于兩者中任一服務(wù)的任何特定功能可以同等地歸屬于另一服務(wù),反之亦然。以可用的或期望的形式提供聚類(lèi)信息147的任何此類(lèi)修改都在本公開(kāi)的范圍內(nèi)。聚類(lèi)信息146包括與相對(duì)少量的內(nèi)部軟件功能匹配的多個(gè)自然語(yǔ)言表達(dá)的多對(duì)少表示。換言之,聚類(lèi)信息147將多個(gè)原始查詢(xún)的意圖表示為在客戶(hù)端101處能執(zhí)行的目標(biāo)軟件產(chǎn)品的內(nèi)部軟件功能的映射。聚類(lèi)信息146的一般的特征和布置在下文參考圖6來(lái)更全面地描述。聚類(lèi)信息146可以傳達(dá)給被布置成與聚類(lèi)系統(tǒng)140通信的可用的信息取回系統(tǒng)150。信息取回系統(tǒng)150可以包括任何適合的信息取回系統(tǒng),諸如例如搜索引擎、軟件產(chǎn)品幫助或查詢(xún)系統(tǒng)、在線服務(wù)提供商網(wǎng)絡(luò)(例如,在線幫助或信息提供商)或任何其它期望的系統(tǒng)。信息取回系統(tǒng)150一般包括:原始查詢(xún)處理服務(wù)151,其被布置成接收原始查詢(xún)130;以及聚類(lèi)辨識(shí)服務(wù),其被布置成基于原始查詢(xún)130來(lái)生成搜索結(jié)果138。原始查詢(xún)處理服務(wù)151可以將來(lái)自原始查詢(xún)130的自然語(yǔ)言表達(dá)解析和分割成任何期望的群。此后,聚類(lèi)辨識(shí)服務(wù)153可使用解析的查詢(xún)來(lái)確定在聚類(lèi)信息146中描述的任何聚類(lèi)是否匹配一個(gè)或多個(gè)解析的群。如果找到匹配,則聚類(lèi)辨識(shí)服務(wù)153可以生成搜索結(jié)果138并且經(jīng)由網(wǎng)絡(luò)105將搜索結(jié)果138指向適當(dāng)?shù)目蛻?hù)端101(即,生成查詢(xún)的客戶(hù)端)。網(wǎng)絡(luò)105可以將搜索結(jié)果138分布為分別指向單個(gè)的客戶(hù)端101A,101B和101C的單個(gè)的搜索結(jié)果138A,138B和138C。應(yīng)當(dāng)理解,取決于原始查詢(xún)130源自哪里,可以分布更多或更少的搜索結(jié)果,或者那些搜索結(jié)果可以與那些特別示出的形式不同地分布?,F(xiàn)在參考圖2,將提供關(guān)于本文呈現(xiàn)的用于通過(guò)聚類(lèi)系統(tǒng)140從原始查詢(xún)130提取意圖的實(shí)施例的另外的細(xì)節(jié)。特別地,圖2是示出了根據(jù)本文所呈現(xiàn)的一個(gè)實(shí)施例的用于處理原始查詢(xún)130的一個(gè)示例性的方法200的多方面的流程圖。如圖所示,方法200包括在框202處接收原始查詢(xún)。如上文簡(jiǎn)要論述,原始查詢(xún)處理服務(wù)141經(jīng)由網(wǎng)絡(luò)或其它通信介質(zhì)接收一個(gè)或多個(gè)原始查詢(xún)130。取決于任何特定的實(shí)現(xiàn),原始查詢(xún)130可以單獨(dú)地或者在基本并行的過(guò)程中被處理。因此,多種形式的原始查詢(xún)處理都在本公開(kāi)的范圍內(nèi),但是下面的特征是參考單一原始查詢(xún)130來(lái)描述的。方法200還包括:在框204處,對(duì)接收到的原始查詢(xún)130的初步拼寫(xiě)檢查和異常處理。例如,可以初始地執(zhí)行拼寫(xiě)檢查算法來(lái)校正在原始查詢(xún)130內(nèi)誤拼的任何詞語(yǔ)。拼寫(xiě)檢查算法可以包括任何已知的或期望的算法,其比較各個(gè)詞語(yǔ)以確定誤拼是否顯見(jiàn)。拼寫(xiě)檢查算法可以根據(jù)其個(gè)體的例程來(lái)校正任何誤拼,并且返回包含任何已校正的詞語(yǔ)的結(jié)果。此后,拼寫(xiě)異常處理可以基于拼寫(xiě)異常詞典模型來(lái)執(zhí)行,以進(jìn)一步校正詞語(yǔ)。例如,雖然特定的詞語(yǔ)可以在自然語(yǔ)言中正確地拼寫(xiě),但是一個(gè)或多個(gè)詞語(yǔ)可能實(shí)際上指代或者打算指代具有略微相似的拼寫(xiě)的內(nèi)部軟件功能。拼寫(xiě)異常詞典模型被布置成基于目標(biāo)軟件產(chǎn)品的內(nèi)部命名規(guī)約來(lái)校正這些不正確的指代。例如,雖然典型的拼寫(xiě)檢查算法可以確定詞語(yǔ)“pain(疼痛)”是正確拼寫(xiě)的詞語(yǔ),原始查詢(xún)130可能實(shí)際上指代諸如來(lái)自微軟公司的MICROSOFTWORD文字處理程序的文字處理軟件產(chǎn)品的“pane(窗格)”或“toolpane(工具窗格)”。因此,在本文公開(kāi)的實(shí)施例中所使用的拼寫(xiě)異常詞典模型可以被配置為將原始查詢(xún)130中的拼寫(xiě)校正后的自然語(yǔ)言正規(guī)化(例如,標(biāo)準(zhǔn)化)為與在客戶(hù)端101上執(zhí)行的目標(biāo)軟件產(chǎn)品一致。在下表1中提供了示范性的拼寫(xiě)異常詞典模型中可以包含的示例的一組置換規(guī)則:表1:原始詞語(yǔ)置換后詞語(yǔ)picottablepivottablepicottablespivottablepivioittablepivottablepiviottablepivottablepiviouttablepivottablepivotaltablepivottablepivitotablepivottablepivotaltablepivottablepivitoltablepivottablepivitottablepivottable如上表1所示,多個(gè)詞語(yǔ)可以在原始查詢(xún)130內(nèi)置換以指代實(shí)際的軟件功能,而不是它們的自然語(yǔ)言定義。在表1的特定示例中,指代目標(biāo)軟件產(chǎn)品的“pivottable”功能的自然語(yǔ)言表達(dá)的多個(gè)不同的版本被置換成詞語(yǔ)“pivottable”。根據(jù)任何期望的實(shí)現(xiàn)方式,該置換可以包括:原始查詢(xún)130中的詞語(yǔ)的實(shí)際的交換,或者描述置換的元數(shù)據(jù)的添加。通過(guò)這種方式,拼寫(xiě)異常詞典模型允許基于置換的詞語(yǔ)來(lái)創(chuàng)建基本詞語(yǔ)群。注意的是,基于任何期望的目標(biāo)軟件產(chǎn)品可應(yīng)用多種形式的拼寫(xiě)異常詞典,并且相應(yīng)地,所有這些變型例都在本公開(kāi)的范圍內(nèi)。方法200還包括:在框206處,來(lái)自框204的結(jié)果的初步群(preliminarygrouping)。一般地,原始查詢(xún)處理服務(wù)141可以基于在最初的原始查詢(xún)內(nèi)的修飾語(yǔ)或修飾語(yǔ)言將經(jīng)拼寫(xiě)校正和拼寫(xiě)異常置換的查詢(xún)處理成一組初步詞語(yǔ)群。修飾語(yǔ)詞語(yǔ)可以包括“哪里”以及“如何”或其它修飾詞語(yǔ),來(lái)指代可以借以使用目標(biāo)軟件產(chǎn)品完成任務(wù)的位置或過(guò)程。其它指代時(shí)間關(guān)系的修飾詞語(yǔ)(例如,“何時(shí)”)或指代不能被立即辨識(shí)為與期望功能相關(guān)的關(guān)系的修飾詞語(yǔ),可以被群聚在一起。相應(yīng)地,原始查詢(xún)處理服務(wù)141可以初始地基于這些修飾詞語(yǔ)的存在來(lái)對(duì)經(jīng)拼寫(xiě)校正和拼寫(xiě)異常置換的查詢(xún)進(jìn)行群聚。初始群可通過(guò)另外的詞典模型進(jìn)一步處理以推斷另外的關(guān)于原始查詢(xún)130的意圖的細(xì)節(jié)。方法200還包括:在框208處,初步群的初始詞典模型處理。例如,初始詞典模型處理可以包括通過(guò)有些類(lèi)似于上述的拼寫(xiě)異常詞典模型的多個(gè)初始詞典模型來(lái)處理。初始詞典模型處理可以得到被進(jìn)一步區(qū)分或拆分的群,使得一些短語(yǔ)被區(qū)分開(kāi),同義詞被辨識(shí)或去除,加記號(hào)的(tokenized)或者能加記號(hào)的(tokenizable)詞語(yǔ)被辨識(shí)出,和/或不重要的單詞被去除。下面參考圖2來(lái)詳述初始詞典處理。在框208處初始詞典模型處理至少部分成功完成時(shí),方法200還包括:在框210中,將預(yù)處理規(guī)則應(yīng)用于來(lái)自框208的結(jié)果。例如,預(yù)處理規(guī)則可以描述對(duì)被包含在框208的結(jié)果中的詞語(yǔ)進(jìn)行合并和分割,以形成與目標(biāo)軟件產(chǎn)品的功能更緊密相關(guān)的群。預(yù)處理規(guī)則可以被使用來(lái)嘗試將單個(gè)的或先前分割的詞語(yǔ)組織成與在客戶(hù)端101上執(zhí)行的目標(biāo)軟件產(chǎn)品的實(shí)際功能相關(guān)的合并短語(yǔ)。例如,預(yù)處理規(guī)則可以包括將諸如“打印”和“全部”等詞語(yǔ)合并成與其中文檔的全部頁(yè)被打印的打印功能相關(guān)的短語(yǔ),諸如“打印全部”或者“打印全部頁(yè)”,取決于原始查詢(xún)130的結(jié)果和這些詞語(yǔ)在原始查詢(xún)130中的放置。其它非限制示例包括將諸如“打印”、“每一個(gè)”和“其它”的詞語(yǔ)合并成與分段打印功能相關(guān)的短語(yǔ),諸如“隔頁(yè)打印”或“跳過(guò)打印奇數(shù)頁(yè)”,取決于原始查詢(xún)130的結(jié)構(gòu)和這些詞語(yǔ)在原始查詢(xún)130的放置。方法200還包括:在框212中從預(yù)處理群中提取詞性。如上所述,預(yù)處理群可以包括從原始查詢(xún)130處理的單個(gè)詞語(yǔ)群和單個(gè)短語(yǔ)群。例如,使用用于提取詞性的任何可用的應(yīng)用或服務(wù),原始查詢(xún)處理服務(wù)141可以將這些群分析成額外的詞性。一般地,詞性可以被組織為名詞、代詞、形容詞、動(dòng)詞、副詞、介詞、連詞和插入語(yǔ)。用于提取詞性的易于得到的工具可以包括例如,可從微軟獲得的統(tǒng)計(jì)解析與語(yǔ)言分析工具箱(“SPLAT”)。任何此類(lèi)工具的輸出可被處理以對(duì)所識(shí)別的詞性(partofspeech)進(jìn)行群聚、以及從先前的群中去除被群聚的詞性。此后,方法200包括:在框214處,對(duì)來(lái)自框212的群結(jié)果的第二詞典處理。原始查詢(xún)處理服務(wù)141可以例如通過(guò)有些類(lèi)似于上述的拼寫(xiě)異常詞典模型和初始詞典模型的多個(gè)第二詞典模型來(lái)處理框212的群結(jié)果。第二詞典模型處理可以得到進(jìn)一步合并的群,使得一些詞語(yǔ)經(jīng)過(guò)詞形還原(lemmatization),辨識(shí)出輕動(dòng)詞,提取的詞性經(jīng)過(guò)覆蓋詞典模型處理,和/或形容詞-動(dòng)詞異常被合并。下面參考圖4來(lái)更詳細(xì)地描述第二詞典處理。方法200還包括:在框216處,從處理后的群中提取用于接收的原始查詢(xún)130的基本意圖。原始查詢(xún)處理服務(wù)141可以基于框214的結(jié)果來(lái)執(zhí)行對(duì)原始查詢(xún)130的基本或主要意圖的基于規(guī)則的提取?;谝?guī)則的提取必要地提取動(dòng)詞-名詞集合作為意圖的基礎(chǔ)。例如,基于規(guī)則的提取的規(guī)則可以基于諸如詞性、在較大的短語(yǔ)或原始查詢(xún)130中的每個(gè)詞性的位置以及詞性的順序等一個(gè)或多個(gè)因素。該方法200還包括:在框218中,基于所提取的基本意圖和處理后的群來(lái)進(jìn)行最終詞典處理。原始查詢(xún)處理服務(wù)141可以例如通過(guò)有些類(lèi)似于上述的拼寫(xiě)異常詞典模型、初始詞典模型和第二詞典模型的多個(gè)最終詞典模型來(lái)處理框216的群結(jié)果。最終詞典模型處理可以得到進(jìn)一步被合并或區(qū)分的群,使得與實(shí)際聚類(lèi)相關(guān)的短語(yǔ)或詞語(yǔ)被識(shí)別和/或基于目標(biāo)軟件產(chǎn)品的專(zhuān)用短語(yǔ)被識(shí)別。下面參考圖5來(lái)進(jìn)一步描述最終詞典處理。在通過(guò)原始查詢(xún)服務(wù)141進(jìn)行成功的最終詞典處理后,方法200在框220處以從框218的結(jié)果中提取用于所接收的原始查詢(xún)的最終意圖而結(jié)束。一般地,框218的結(jié)果可通過(guò)聚類(lèi)服務(wù)143來(lái)處理以基于先前確定的表示意圖的聚類(lèi)來(lái)確定最終意圖。聚類(lèi)服務(wù)143可以將部分匹配已知聚類(lèi)的特定群與已知聚類(lèi)相關(guān)聯(lián)。例如,包含短語(yǔ)“插入對(duì)象”的原始查詢(xún)130可以與表示用于插入對(duì)象的軟件功能的聚類(lèi)相關(guān)聯(lián)??梢曰谧罱K群的數(shù)量或大小而進(jìn)行進(jìn)一步的區(qū)分,并且可以進(jìn)行基于閾值的比較以確定原始查詢(xún)的意圖的最可能候選者。在成功與已知聚類(lèi)相關(guān)聯(lián)后,聚類(lèi)信息146被更新以反映關(guān)聯(lián)。此后,聚類(lèi)信息146可以保持在聚類(lèi)存儲(chǔ)147中和/或傳輸?shù)叫畔⑷』叵到y(tǒng)150。另外,原始查詢(xún)處理服務(wù)141和聚類(lèi)處理服務(wù)143可以隨著新的原始查詢(xún)被取回、被接收或以其它方式被創(chuàng)建,而持續(xù)迭代經(jīng)過(guò)框202-220。如上所述,術(shù)語(yǔ)“詞典模型”指代將一組對(duì)于自然語(yǔ)言詞語(yǔ)的基于規(guī)則的置換與基于一個(gè)或多個(gè)目標(biāo)軟件產(chǎn)品的內(nèi)部命名規(guī)約的一個(gè)或多個(gè)定義的詞語(yǔ)或短語(yǔ)相關(guān)聯(lián)的文件或結(jié)構(gòu)。此外,術(shù)語(yǔ)“目標(biāo)軟件產(chǎn)品”指代安裝或布置以在客戶(hù)端101上執(zhí)行的、用戶(hù)針對(duì)其提交原始查詢(xún)的軟件產(chǎn)品。如此,本文所描述的每個(gè)詞典模型可以不同地布置以對(duì)于特定的目標(biāo)軟件產(chǎn)品實(shí)現(xiàn)期望的結(jié)果,即,通過(guò)如與一個(gè)或多個(gè)聚類(lèi)相關(guān)聯(lián)地對(duì)詞語(yǔ)的群組進(jìn)行拆分或合并的規(guī)則。在如上所述的最終詞典處理時(shí),詞語(yǔ)的最終群將反映在一個(gè)或多個(gè)目標(biāo)軟件產(chǎn)品的界限內(nèi)的最初的原始查詢(xún)的相關(guān)聯(lián)的意圖。因此,隨著易于匹配以提供聚類(lèi)信息146的新查詢(xún)被接收,進(jìn)一步的意圖識(shí)別可以通過(guò)簡(jiǎn)單的聚類(lèi)辨識(shí)算法(例如,聚類(lèi)辨識(shí)服務(wù)153)執(zhí)行,該簡(jiǎn)單的聚類(lèi)辨識(shí)算法被配置為在預(yù)定閾值以?xún)?nèi)或預(yù)定閾值以上找到原始查詢(xún)130的在聚類(lèi)信息146內(nèi)的匹配。然而,根據(jù)需要,表示上述軟件功能的聚類(lèi)的進(jìn)一步的拆分和合并可以持續(xù)地進(jìn)行,或者以批處理式樣的操作集合的方式進(jìn)行。下面參考圖7來(lái)提供在聚類(lèi)系統(tǒng)140中所產(chǎn)生的聚類(lèi)信息146的使用的更詳細(xì)的論述。下文中,參考圖3-5來(lái)提供初始的、第二的和最終的詞典處理和相關(guān)聯(lián)的詞典模型的多個(gè)示例。應(yīng)當(dāng)理解,雖然使用詞語(yǔ)“初始”、“第二”和“最終”描述,特定的處理順序或者詞典模型之間的依賴(lài)關(guān)系可在不偏離本公開(kāi)的范圍的前提下被重新布置。轉(zhuǎn)到圖3,圖示說(shuō)明了根據(jù)本文呈現(xiàn)的一個(gè)實(shí)施例,示出用于初步群聚查詢(xún)的初始詞典模型處理的一個(gè)示例性的方法300的多方面的流程圖。如圖所示,方法300包括:在框302處,接收來(lái)自框208的初步群。例如,框206的初步群可以被接收以進(jìn)行初始詞典模型處理。方法300還包括:在框304處,基于記號(hào)異常詞典模型(tokenexceptiondictionarymodel),對(duì)接收到的初步群上的記號(hào)異常群(tokenexceptiongroupings)進(jìn)行處理。記號(hào)異常詞典模型可被布置為應(yīng)當(dāng)保持相關(guān)聯(lián)在一起從而限制它們的分割的多個(gè)短語(yǔ)或詞語(yǔ)。因此,記號(hào)異常詞典模型保持原始查詢(xún)130中的一些短語(yǔ)的結(jié)構(gòu),使得它們與用于目標(biāo)軟件產(chǎn)品的功能的內(nèi)部命名更緊密地相關(guān)聯(lián)。可以包含在示范性的記號(hào)異常詞典模型中的示例的一組記號(hào)規(guī)則提供在下表2中:表2:保持短語(yǔ)(MaintainPhrase)一般格式(generalformat)文本格式(textformat)百分比樣式(percentstyle)百分比格式(percentformat)帳單格式(accountingformat)帳單樣式(accountingstyle)貨幣樣式(currencystyle)貨幣樣式(currencystyles)逗號(hào)分開(kāi)的值(commaseparatedvalue)便攜文檔格式(portabledocumentformat)如上表2中所示,多個(gè)短語(yǔ)可以與內(nèi)部軟件功能相關(guān),并且應(yīng)當(dāng)因此被保持為原始查詢(xún)130內(nèi)的單個(gè)短語(yǔ)。注意的是,基于任何期望的目標(biāo)軟件產(chǎn)品,能應(yīng)用多種形式的記號(hào)異常詞典,并且相應(yīng)地,所有此類(lèi)變型例都在本公開(kāi)的范圍內(nèi)。方法300還包括:在框306中,基于詞語(yǔ)同義詞詞典模型,對(duì)框304的結(jié)果上的詞語(yǔ)同義詞群進(jìn)行處理。詞語(yǔ)同義詞異常詞典模型可布置為更適合于由與目標(biāo)軟件產(chǎn)品更緊密相關(guān)的一個(gè)或多個(gè)同義詞替代的多個(gè)短語(yǔ)或詞語(yǔ)。相應(yīng)地,詞語(yǔ)同義詞異常詞典模型取代原始查詢(xún)130中的詞語(yǔ)的一部分,以與和目標(biāo)軟件產(chǎn)品相關(guān)聯(lián)的詞語(yǔ)一致??梢园谑痉缎缘脑~語(yǔ)同義詞異常詞典模型中的一組示例的置換規(guī)則提供在下表3中:表3:原始詞語(yǔ)置換后詞語(yǔ)下拉(drop-down)下拉列表(drop-downlist)下拉(drop-downs)下拉列表(drop-downlist)下列表(droplist)下拉列表(drop-downlist)下菜單(dropmenu)下拉列表(drop-downlist)下拉菜單(drop-downmenu)下拉列表(drop-downlist)拾取列表(picklist)下拉列表(drop-downlist)拉列表(pulllist)下拉列表(drop-downlist)拉列表(pull-list)下拉列表(drop-downlist)拉下列表(pull-downlist)下拉列表(drop-downlist)拉下框(pull-downbox)下拉列表(drop-downlist)如上表3所示,多個(gè)短語(yǔ)可以與和內(nèi)部軟件功能相關(guān)聯(lián)的單個(gè)詞語(yǔ)相關(guān)聯(lián),并且應(yīng)當(dāng)因此在原始查詢(xún)130內(nèi)被替代。注意的是,基于任何期望的目標(biāo)軟件產(chǎn)品,能應(yīng)用多種形式的詞語(yǔ)同義詞異常詞典,并且相應(yīng)地,所有此類(lèi)變型例都在本公開(kāi)的范圍內(nèi)。方法300還包括:在框308處,基于記號(hào)異常詞典模型,再處理框306的結(jié)果上的記號(hào)異常群。例如,在替代如上所述的同義詞后,多個(gè)先前的短語(yǔ)或群已經(jīng)被擾亂(disturbed)以創(chuàng)建更適合于保持為短語(yǔ)的單個(gè)詞語(yǔ)。因此,框306的結(jié)果可如上所述被再處理。此后,方法300包括:在框310處,基于子句詞典模型,處理框308的結(jié)果上的子句群。子句詞典模型可被布置為用于替代指向特定子句的詞語(yǔ)或短語(yǔ)的一組規(guī)則。例如,諸如“如果”、“條件”、“快捷方式”或其它詞語(yǔ)的詞語(yǔ)可能與功能相關(guān)或者可能將與軟件產(chǎn)品的功能相關(guān)的必要的任務(wù)分割。因此,可以使用子句詞典模型來(lái)取代與原始查詢(xún)130中的子句或功能描述符相關(guān)的單個(gè)詞語(yǔ)或短語(yǔ)以與目標(biāo)軟件產(chǎn)品一致。在下表4中提供了示范性的條件詞語(yǔ)詞典模型中可能包含的一組示例的置換規(guī)則:表4:原始詞語(yǔ)置換后詞語(yǔ)如果且(ifand)條件如果(conditionalif)如果或(ifor)條件如果(conditionalif)如果那么(ifthen)條件如果那么(conditionalifthen)如果那么excel(ifthenexcel)條件如果那么(conditionalifthen)如果那么公式(ifthenformula)功能條件(functionconditional)如果且功能(ifandfunction)功能條件(functionconditional)如上表4中所示,多個(gè)短語(yǔ)可以與軟件功能相關(guān),并且應(yīng)當(dāng)因此在原始查詢(xún)130內(nèi)替代。應(yīng)當(dāng)注意的是,基于任何期望的目標(biāo)軟件功能,能應(yīng)用多種形式的子句詞典,并且相應(yīng)地,所有此類(lèi)變型例都在本公開(kāi)的范圍內(nèi)。方法300還包括:在框312中,基于輕單詞(lightword)或停止單詞(stopword)詞典模型,處理框310的結(jié)果上的“輕單詞”或“停止單詞”的群。如本文所使用的,術(shù)語(yǔ)“輕單詞”或“停止單詞”指代在可以被忽略而不影響原始查詢(xún)的意圖的提取的詞語(yǔ)或短語(yǔ)的部分。例如,在原始查詢(xún)130內(nèi)的多個(gè)詞語(yǔ)可能與目標(biāo)軟件產(chǎn)品的實(shí)際功能無(wú)關(guān),并且可被忽略。在下表5中提供了可被忽略的一組示例的詞語(yǔ):表5:方法300還包括:在框314中輸出處理后的具有被忽略的詞語(yǔ)的群,進(jìn)一步如圖2的方法200中所概括的進(jìn)一步處理,并且在框316處停止。此后,通過(guò)原始查詢(xún)處理服務(wù)141可以進(jìn)行另外的處理,直至第二詞典處理可應(yīng)用為止。圖4是示出了根據(jù)本文呈現(xiàn)的實(shí)施例的用于群聚查詢(xún)的第二詞典處理的一個(gè)示例性的方法400的多方面的流程圖。如圖所示,方法400包括:在框402處,接收來(lái)自框214的一組群。在如上所述提取了詞性之后,可以從框212接收該組群。方法400還包括:在框404處,基于詞形還原詞典模型(lemmatizationdictionarymodel),對(duì)接收到的群進(jìn)行詞形還原。例如,在原始查詢(xún)130中的多個(gè)詞語(yǔ)可以與單個(gè)根詞語(yǔ)(rootterm)相關(guān)。因此,詞形還原詞典模型將原始查詢(xún)130中的詞語(yǔ)正規(guī)化(例如,標(biāo)準(zhǔn)化)成單數(shù)的根詞語(yǔ)或“詞元(lemma)”。在下表6中提供了可以包含在詞形還原詞典模型中的一組示例的置換規(guī)則:表6:原始詞語(yǔ)置換后詞語(yǔ)跑(run)跑(run)跑(runs)跑(run)跑(ran)跑(run)跑(running)跑(run)遮蔽(shade)遮蔽(shade)遮蔽(shading)遮蔽(shade)遮蔽(shaded)遮蔽(shade)如上表6中所示,多個(gè)詞語(yǔ)可以置換成單數(shù)的詞元以簡(jiǎn)化處理。注意的是,基于任何期望的目標(biāo)軟件產(chǎn)品,能應(yīng)用多種形式的詞形還原詞典,并且相應(yīng)地,所有這樣的變型例都在本公開(kāi)的范圍內(nèi)。方法400還包括:在框406中,基于輕單詞詞典模型,處理詞形還原后的群上的輕單詞群。一般地,輕單詞詞典模型包括在為提取意圖的處理過(guò)程中不應(yīng)比其它動(dòng)詞加權(quán)更多的各種輕權(quán)重動(dòng)詞。作為非限制示例,如果原始查詢(xún)130包括短語(yǔ)“創(chuàng)建excel的電子表格”,則輕單詞詞典模型可以將“excel”加權(quán)少于“創(chuàng)建”。因此,在利用輕單詞詞典模型進(jìn)行處理時(shí),所得到的群將包含與輕權(quán)重動(dòng)詞相比而言更大權(quán)重的動(dòng)詞,諸如“實(shí)現(xiàn)(make)”、“取得(take)”或“得到(get)”。方法400還包括:在框408中,基于詞性覆蓋模型處理框406的結(jié)果上的詞性覆蓋群(partsofspeechoverridegroupings)。一般地,詞性覆蓋模型被布置成對(duì)詞性進(jìn)行校正。例如,多個(gè)詞語(yǔ)可以由詞性工具推斷為名詞。然而,這些詞語(yǔ)當(dāng)在特定的目標(biāo)軟件產(chǎn)品的上下文中理解時(shí)更反映動(dòng)詞。因此,詞性覆蓋詞典模型將原始查詢(xún)130中的更適合的詞性置換以與執(zhí)行于客戶(hù)端101上的目標(biāo)軟件產(chǎn)品一致。在下表7中提供了可以包含在示范性的詞性覆蓋詞典模型中的一組示例的置換規(guī)則。表7:原始詞語(yǔ)詞性群聚(group)動(dòng)詞刷新(refresh)動(dòng)詞過(guò)濾(filter)動(dòng)詞導(dǎo)出(export)動(dòng)詞插入(insert)動(dòng)詞拆分(split)動(dòng)詞輸入(input)動(dòng)詞如上表7中所示,多個(gè)詞語(yǔ)可以被更適當(dāng)?shù)卣J(rèn)為是動(dòng)詞,或者在特定的軟件產(chǎn)品的上下文中考慮其它詞性。注意的是,基于任何期望的目標(biāo)軟件產(chǎn)品,能應(yīng)用詞性覆蓋詞典模型的多種形式,并且相應(yīng)地,所有這樣的變型例都在本公開(kāi)的范圍內(nèi)。方法400還包括:在框410中,基于形容詞-動(dòng)詞異常詞典模型,對(duì)框408的結(jié)果上的形容詞-動(dòng)詞異常群進(jìn)行處理。形容詞-動(dòng)詞異常詞典模型還可以另外地校正與使用一般的詞性提取工具相關(guān)的詞性問(wèn)題。例如,如果在原始查詢(xún)130中一些形容詞在名詞的緊前面,則可能更適合保留該詞語(yǔ)的詞性,而不是將其縮減為動(dòng)詞或名詞。作為非限制示例,如果諸如“有色的(colored)”、“陰影的(dashed)”和“打印的(printed)”的詞語(yǔ)出現(xiàn)在名詞之前,則適當(dāng)?shù)娜嚎梢园~棧,而不是將“打印的(printed)”縮減為動(dòng)詞“打印(print)”。方法400還包括:在框412處,輸出處理后的群以便如圖2的方法200中所概括的那樣進(jìn)一步處理,并且在框414處停止。這些處理后的群可以處理后以對(duì)于原始查詢(xún)130提取基本意圖,如上文所概括的。此后,可以執(zhí)行最終詞典處理以提取最終的意圖和聚類(lèi)。圖5是示出了根據(jù)本文所呈現(xiàn)的一個(gè)實(shí)施例的用于群聚查詢(xún)的詞典處理的一個(gè)示例性的例程的多方面的流程圖。如圖所示,方法500包括:在框502處,接收來(lái)自框218的一組處理后的群。方法500還包括:在框504處,基于聚類(lèi)同義詞詞典模型,處理接收到的群上的聚類(lèi)同義詞群。一般地,聚類(lèi)同義詞詞典模型被布置成將重復(fù)的群組映射到單個(gè)群組上。因此,多個(gè)不相干的群組可以映射到更反映原始查詢(xún)130的意圖的單個(gè)父群組(asingleparentgroups)上。在下表8中提供了在示范性的聚類(lèi)同義詞詞典模型中所包含的一組示例的置換規(guī)則:表8:如上表8中所示,多個(gè)短語(yǔ)或群組可以置換成單數(shù)群組以簡(jiǎn)化處理。注意的是,基于任何期望的目標(biāo)軟件產(chǎn)品,可以應(yīng)用多種形式的聚類(lèi)同義詞詞典,并且相應(yīng)地,所有這樣的變型例都在本公開(kāi)的范圍內(nèi)。方法500還包括:在框506中,基于對(duì)象-模型詞典模型(object-modeldictionarymodel),對(duì)框504的結(jié)果上的對(duì)象-模型群進(jìn)行處理。一般地,對(duì)象-模型詞典模型被布置成與目標(biāo)軟件產(chǎn)品的至少一個(gè)功能相關(guān)的詞語(yǔ)的詞典。短語(yǔ)可以直接指代單個(gè)的功能,并且因此,可以代表原始查詢(xún)130的意圖。因此,短語(yǔ)可被使用以與處理后的群進(jìn)行比較來(lái)通過(guò)試圖直接匹配處理后的群的部分而進(jìn)一步限定原始查詢(xún)130的意圖。在匹配時(shí),最終意圖信息可以是顯見(jiàn)的。方法500還包括:在框508處輸出處理后的群以如圖2的方法200中所概括的那樣進(jìn)一步處理,并且在框510處停止。圖6是示出了可用于識(shí)別查詢(xún)意圖的一般輸出格式的示范性的表600。注意的是,特定格式的表格600可改動(dòng)成任何期望的形式,并且因此,圖示的格式不限于本公開(kāi)。一般地,表格600可以表示聚類(lèi)信息146的一般形式,以便由諸如信息取回系統(tǒng)150的信息取回系統(tǒng)、搜索引擎系統(tǒng)或任何其它適合的系統(tǒng)使用。表格600包括被組織以分割原始查詢(xún)的原始搜索詞語(yǔ)或短語(yǔ)、反映原始查詢(xún)的意圖的更適合的新搜索詞語(yǔ)、原始查詢(xún)中的記號(hào)的總記號(hào)計(jì)數(shù)和用于識(shí)別所建立的聚類(lèi)的聚類(lèi)標(biāo)識(shí)(“ID”)值的列。表格600因此呈現(xiàn)了與表示字符串1的原始意圖的新詞語(yǔ)TERM1(詞語(yǔ)1)相關(guān)聯(lián)的多個(gè)搜索詞語(yǔ)TEXT1(文本1)-TEXTN(文本N)的多對(duì)少映射,以及相關(guān)聯(lián)的聚類(lèi)標(biāo)識(shí)ID1。雖然呈現(xiàn)為到單個(gè)最初意圖的映射,但是應(yīng)當(dāng)理解,取決于在系統(tǒng)600中所包含的目標(biāo)軟件產(chǎn)品,聚類(lèi)信息146的實(shí)際的輸出表示可以包括與多個(gè)不同的新詞語(yǔ)匹配的多個(gè)不同的搜索詞語(yǔ)。類(lèi)似于表格600所表示的聚類(lèi)信息146能夠用于識(shí)別在系統(tǒng)100的積極處理過(guò)程中接收到的新的原始查詢(xún)的意圖。例如,圖7是示出了根據(jù)本文呈現(xiàn)的一個(gè)實(shí)施例的用于使用聚類(lèi)查詢(xún)信息來(lái)處理原始用戶(hù)查詢(xún)的一個(gè)示例性的方法700的多方面的流程圖。如圖所示,方法700包括:在框702處,接收原始用戶(hù)查詢(xún)。該方法700還包括:在框704處,確定接收到的原始查詢(xún)的聚類(lèi)關(guān)聯(lián)。例如,聚類(lèi)辨識(shí)服務(wù)153可以將來(lái)自接收到的原始查詢(xún)的自然語(yǔ)言與聚類(lèi)信息146(或者表600的“搜索詞語(yǔ)”列)比較以確定聚類(lèi)ID或聚類(lèi)信息。如進(jìn)一步圖示的,該方法700包括用于所確定的聚類(lèi)信息的處理的多個(gè)分歧選項(xiàng)。例如,該方法700可以包括:在框706處,將接收到的原始用戶(hù)查詢(xún)搜索字符串信息與所確定的聚類(lèi)搜索字符串交換。此后,方法700包括:在框708處,利用交換后的字符串執(zhí)行查詢(xún),以及在框710處返回搜索結(jié)果??商娲兀摲椒?00可以包括:在框712處,找到(find)與所確定的關(guān)聯(lián)的聚類(lèi)相關(guān)的一個(gè)或多個(gè)“對(duì)等查詢(xún)”。例如,“對(duì)等查詢(xún)”可以指代對(duì)等用戶(hù)提交的原始查詢(xún),其可以具有類(lèi)似的或者至少部分相關(guān)的意圖。此后,方法700包括:在框714處,基于對(duì)等查詢(xún)來(lái)執(zhí)行查詢(xún),以及在框710處返回一個(gè)或多個(gè)對(duì)等查詢(xún)的搜索結(jié)果。另外地,該方法700可以包括:在框716處,找到與所確定的聚類(lèi)信息相關(guān)的一個(gè)或多個(gè)對(duì)等聚類(lèi)。此后,方法700包括:在框718處,返回對(duì)等聚類(lèi)信息。代表了意圖的波動(dòng)數(shù)量(fluctuatingnumber)的聚類(lèi)信息146可以多種形式以及由多個(gè)應(yīng)用來(lái)使用。聚類(lèi)信息146可以基于多個(gè)目標(biāo)軟件產(chǎn)品的用戶(hù)查詢(xún)的日志而在離線處理期間生成。日志可以通過(guò)聚類(lèi)系統(tǒng)140訪問(wèn)以創(chuàng)建和保持聚類(lèi)信息146,如上文所概述的。此后,聚類(lèi)信息146可在信息取回系統(tǒng)中用于通過(guò)更簡(jiǎn)單的意圖識(shí)別進(jìn)行原始查詢(xún)的更快速處理。應(yīng)當(dāng)意識(shí)到,上述的邏輯操作可以實(shí)現(xiàn)為(1)計(jì)算機(jī)實(shí)現(xiàn)的動(dòng)作或在計(jì)算系統(tǒng)上運(yùn)行的程序模塊的序列,和/或(2)在計(jì)算系統(tǒng)內(nèi)的互連的機(jī)器邏輯電路或電路模塊。該實(shí)現(xiàn)方式是取決于計(jì)算系統(tǒng)的性能和其他要求的選擇。因此,本文所述的邏輯操作被多樣化地稱(chēng)為狀態(tài)操作、結(jié)構(gòu)設(shè)備、動(dòng)作或模塊。這些操作、結(jié)構(gòu)設(shè)備、動(dòng)作和模塊可以用軟件、用固件、用專(zhuān)用數(shù)字邏輯以及它們的任意組合來(lái)實(shí)現(xiàn)。還應(yīng)當(dāng)意識(shí)到,可以執(zhí)行比圖中所示和本文所描述的更多或更少的操作。這些操作也可以按不同于那些描述的次序來(lái)執(zhí)行。圖8示出了能夠執(zhí)行本文所描述的軟件組件來(lái)用于以上文呈現(xiàn)的方式確定原始用戶(hù)查詢(xún)意圖的計(jì)算機(jī)800的示例的計(jì)算機(jī)體系結(jié)構(gòu)。圖8所示的計(jì)算機(jī)體系結(jié)構(gòu)圖示出常規(guī)的臺(tái)式計(jì)算機(jī)、膝上型計(jì)算機(jī)或服務(wù)器計(jì)算機(jī)并且可用于執(zhí)行本文所呈現(xiàn)的被描述在在聚類(lèi)系統(tǒng)140上執(zhí)行的軟件組件的任何方面。圖8所示的計(jì)算機(jī)體系結(jié)構(gòu)包括中央處理單元802(“CPU”)、系統(tǒng)存儲(chǔ)器808和將存儲(chǔ)器與CPU802耦合的系統(tǒng)總線804,系統(tǒng)存儲(chǔ)器包括隨機(jī)存取存儲(chǔ)器814(“RAM”)和只讀存儲(chǔ)器(“ROM”)816。包含了有助于例如在啟動(dòng)期間在計(jì)算機(jī)800內(nèi)的元件之間傳遞信息的基本例程的基本輸入/輸出系統(tǒng)存儲(chǔ)在ROM816中。計(jì)算機(jī)800還包括用于存儲(chǔ)操作系統(tǒng)818、應(yīng)用程序和在本文中詳述的其他程序模塊的大容量存儲(chǔ)設(shè)備810。大容量存儲(chǔ)設(shè)備810通過(guò)連接到總線804的大容量控制器(未示出)與CPU802連接。大容量存儲(chǔ)設(shè)備810及其相關(guān)聯(lián)的計(jì)算機(jī)可讀介質(zhì)為計(jì)算機(jī)800提供了非易失性存儲(chǔ)。雖然在本文包含的計(jì)算機(jī)可讀介質(zhì)的描述指的是大容量存儲(chǔ)設(shè)備,如硬盤(pán)或CD-ROM驅(qū)動(dòng)器,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)意識(shí)到計(jì)算機(jī)可讀介質(zhì)可以是能夠由計(jì)算機(jī)800訪問(wèn)的任何可用的計(jì)算機(jī)存儲(chǔ)介質(zhì)或通信介質(zhì)。通信介質(zhì)包含計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或諸如載波或其他傳輸機(jī)制的調(diào)制數(shù)據(jù)信號(hào)中的其他數(shù)據(jù)并且包括任何輸送介質(zhì)。術(shù)語(yǔ)“調(diào)制數(shù)據(jù)信號(hào)”意指使其一個(gè)或多個(gè)特性以將信息編碼在信號(hào)中的方式改變或設(shè)定的信號(hào)。通過(guò)示例的方式,而不是限制的方式,通信介質(zhì)包括諸如有線網(wǎng)絡(luò)或有線直連的有線介質(zhì)以及諸如聲波、RF、紅外和其他無(wú)線介質(zhì)的無(wú)線介質(zhì)。上述任意的組合也應(yīng)包含在計(jì)算機(jī)可讀介質(zhì)的范圍內(nèi)。通過(guò)示例而不是限制的方式,計(jì)算機(jī)存儲(chǔ)介質(zhì)可以包括以用于諸如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其他數(shù)據(jù)的信息的存儲(chǔ)的任何方法或技術(shù)實(shí)現(xiàn)的易失性和非易失性的、可移除的和非可移除的介質(zhì)。例如,計(jì)算機(jī)介質(zhì)包括,但不限于,RAM、ROM、EPROM、EEPROM、閃速存儲(chǔ)器或其他固態(tài)存儲(chǔ)器技術(shù)、CD-ROM、數(shù)字多功能盤(pán)(“DVD”)、HD-DVD、BLU-RAY或其他光學(xué)存儲(chǔ)設(shè)備、磁盒帶、磁帶、磁盤(pán)存儲(chǔ)或其他磁存儲(chǔ)設(shè)備,或者任何其他能用于存儲(chǔ)所需的信息且能夠由計(jì)算機(jī)800訪問(wèn)的介質(zhì)。為了權(quán)利要求的目的,短語(yǔ)“計(jì)算機(jī)存儲(chǔ)介質(zhì)”及其變體不包含波或信號(hào)本身和/或通信介質(zhì)。根據(jù)各個(gè)實(shí)施例,計(jì)算機(jī)800可以利用通過(guò)諸如網(wǎng)絡(luò)820的網(wǎng)絡(luò)到遠(yuǎn)程計(jì)算機(jī)的邏輯連接在聯(lián)網(wǎng)環(huán)境下操作。計(jì)算機(jī)800可以通過(guò)與總線804連接的網(wǎng)絡(luò)接口單元806而連接到網(wǎng)絡(luò)820。應(yīng)當(dāng)意識(shí)到,網(wǎng)絡(luò)接口單元806還可以用于與其他類(lèi)型的網(wǎng)絡(luò)和遠(yuǎn)程計(jì)算機(jī)系統(tǒng)連接。計(jì)算機(jī)800還可以包括輸入/輸出控制器812,用于接收和處理來(lái)自多個(gè)其他設(shè)備的輸入,包括鍵盤(pán)、鼠標(biāo)或電子觸筆(圖8中未示出)。類(lèi)似地,輸入/輸出控制器可以向顯示屏、打印機(jī)或其他類(lèi)型的輸出設(shè)備(圖8中也未示出)提供輸出。如上文簡(jiǎn)要提及的,多個(gè)程序模塊和數(shù)據(jù)文件可以存儲(chǔ)在計(jì)算機(jī)800的大容量存儲(chǔ)設(shè)備810和RAM814中,包括適合于控制聯(lián)網(wǎng)的臺(tái)式計(jì)算機(jī)、膝上型計(jì)算機(jī)或服務(wù)器計(jì)算機(jī)的操作的操作系統(tǒng)818。大容量存儲(chǔ)設(shè)備810和RAM814還可以存儲(chǔ)一個(gè)或多個(gè)程序模塊,諸如上述的原始查詢(xún)處理服務(wù)141、聚類(lèi)處理服務(wù)143、詞典存儲(chǔ)145和聚類(lèi)存儲(chǔ)147。大容量存儲(chǔ)設(shè)備810和RAM814還可以存儲(chǔ)其他類(lèi)型的程序模塊、服務(wù)和數(shù)據(jù)?;谏鲜觯瑧?yīng)當(dāng)意識(shí)到,本文提供了用于識(shí)別查詢(xún)意圖的技術(shù)。雖然本文呈現(xiàn)的主題以特定于計(jì)算機(jī)結(jié)構(gòu)特征、方法和變換動(dòng)作、具體的計(jì)算機(jī)器和計(jì)算機(jī)可讀介質(zhì)的語(yǔ)言進(jìn)行了描述,但是應(yīng)當(dāng)理解,在隨附的權(quán)利要求中限定的本發(fā)明不必限于本文所描述的具體的特征、動(dòng)作或介質(zhì)。相反,具體的特征、動(dòng)作和介質(zhì)是作為實(shí)現(xiàn)權(quán)利要求的示例的形式而被公開(kāi)的。上述的主題僅通過(guò)示例的方式來(lái)提供,不應(yīng)解釋為限制??梢詫?duì)本文所描述的主題進(jìn)行各種修改和改動(dòng)而不遵從所圖示的和描述的示例的實(shí)施例和應(yīng)用,并且不脫離在下面的權(quán)利要求所闡述的本發(fā)明的真正的精神和范圍。當(dāng)前第1頁(yè)1 2 3 當(dāng)前第1頁(yè)1 2 3