本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別涉及一種智能語義識(shí)別方法、搜索方法、裝置及系統(tǒng)。
背景技術(shù):
隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)量急劇增加。如何從海量的數(shù)據(jù)中快速準(zhǔn)確的獲取有用的數(shù)據(jù),成為用戶關(guān)注的重點(diǎn)。搜索引擎作為可為用戶提供搜索服務(wù)的系統(tǒng),成為解決此類問題的首選。
全文搜索引擎是最常用的搜索引擎,其工作原理一般為:按照預(yù)定義的分詞規(guī)則,對(duì)各個(gè)文章中的字符進(jìn)行分詞,然后對(duì)分詞后的每一個(gè)詞建立相應(yīng)的索引,并指明該詞在文章中出現(xiàn)的次數(shù)和位置。當(dāng)接收到用戶輸入的關(guān)鍵詞時(shí),可根據(jù)預(yù)先建立的索引查找對(duì)應(yīng)的文章,并將查找到的文章反饋給用戶。
由于用戶一般根據(jù)日常使用習(xí)慣進(jìn)行關(guān)鍵詞的輸入,這使得用戶輸入的關(guān)鍵詞與搜索引擎的分詞規(guī)則不相符,從而導(dǎo)致無法利用用戶輸入的關(guān)鍵詞準(zhǔn)確搜索到對(duì)應(yīng)的文章,造成搜索結(jié)果準(zhǔn)確性較低。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供了一種智能語義識(shí)別方法、搜索方法、裝置及系統(tǒng),能提高搜索結(jié)果的準(zhǔn)確性。
第一方面,本發(fā)明實(shí)施例提供了一種智能語義識(shí)別方法,包括:
構(gòu)建配置文件,所述配置文件中包括至少一個(gè)關(guān)鍵詞以及每一個(gè)所述關(guān)鍵詞分別對(duì)應(yīng)的正則表達(dá)式;
還包括:
獲取用戶輸入的至少一個(gè)關(guān)鍵詞;
從所述配置文件中確定與所述用戶輸入的至少一個(gè)關(guān)鍵詞對(duì)應(yīng)的至少一個(gè)目標(biāo)正則表達(dá)式;
根據(jù)所述至少一個(gè)目標(biāo)正則表達(dá)式,將所述用戶輸入的至少一個(gè)關(guān)鍵詞轉(zhuǎn)換為至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞;
將所述至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞發(fā)送給外部的搜索引擎。
優(yōu)選地,
所述構(gòu)建配置文件,所述配置文件中包括至少一個(gè)關(guān)鍵詞以及每一個(gè)所述關(guān)鍵詞分別對(duì)應(yīng)的正則表達(dá)式,包括:
構(gòu)建可擴(kuò)展標(biāo)記語言xml文檔,所述xml文檔中包括至少一個(gè)關(guān)鍵詞以及每一個(gè)所述關(guān)鍵詞分別對(duì)應(yīng)的正則表達(dá)式。
優(yōu)選地,
所述構(gòu)建可擴(kuò)展標(biāo)記語言xml文檔,所述xml文檔中包括至少一個(gè)關(guān)鍵詞以及每一個(gè)所述關(guān)鍵詞分別對(duì)應(yīng)的正則表達(dá)式,包括:
構(gòu)建xml初始文檔;
在所述xml初始文檔中構(gòu)建至少一個(gè)節(jié)點(diǎn),每一個(gè)所述節(jié)點(diǎn)下存儲(chǔ)至少一個(gè)所述正則表達(dá)式,形成所述xml文檔;其中,同一個(gè)節(jié)點(diǎn)下存儲(chǔ)的各個(gè)所述正則表達(dá)式與當(dāng)前節(jié)點(diǎn)下對(duì)應(yīng)的關(guān)鍵詞的類型相同。
優(yōu)選地,
所述從所述配置文件中確定與所述用戶輸入的至少一個(gè)關(guān)鍵詞對(duì)應(yīng)的至少一個(gè)目標(biāo)正則表達(dá)式,包括:
針對(duì)所述用戶輸入的每一個(gè)所述關(guān)鍵詞,均執(zhí)行:
根據(jù)所述關(guān)鍵詞的格式,確定所述關(guān)鍵詞對(duì)應(yīng)的類型;
從所述xml文檔中確定與所述關(guān)鍵詞的類型對(duì)應(yīng)的節(jié)點(diǎn);
從確定出的所述節(jié)點(diǎn)下存儲(chǔ)的至少一個(gè)正則表達(dá)式中,確定與所述關(guān)鍵詞對(duì)應(yīng)的目標(biāo)正則表達(dá)式。
第二方面,本發(fā)明實(shí)施例提供了一種搜索方法,應(yīng)用于搜索引擎,包括:
接收至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞;
根據(jù)所述至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞,進(jìn)行搜索。
優(yōu)選地,
進(jìn)一步包括:預(yù)先構(gòu)建至少一個(gè)設(shè)定格式的關(guān)鍵詞與至少一個(gè)文檔之間的索引關(guān)系;
所述根據(jù)所述至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞,進(jìn)行搜索,包括:
根據(jù)所述索引關(guān)系,確定與所述至少一個(gè)目標(biāo)關(guān)鍵詞相對(duì)應(yīng)的至少一個(gè)目標(biāo)文檔。
第三方面,本發(fā)明實(shí)施例提供了一種基于配置文件的智能語義識(shí)別裝置,包括:構(gòu)建單元、獲取單元、處理單元和發(fā)送單元;其中,
所述構(gòu)建單元,用于構(gòu)建配置文件,所述配置文件中包括至少一個(gè)關(guān)鍵詞以及每一個(gè)所述關(guān)鍵詞分別對(duì)應(yīng)的正則表達(dá)式;
所述獲取單元,用于獲取用戶輸入的至少一個(gè)關(guān)鍵詞;
所述處理單元,用于從所述配置文件中確定與所述用戶輸入的至少一個(gè)關(guān)鍵詞對(duì)應(yīng)的至少一個(gè)目標(biāo)正則表達(dá)式;根據(jù)所述至少一個(gè)目標(biāo)正則表達(dá)式,將所述用戶輸入的至少一個(gè)關(guān)鍵詞轉(zhuǎn)換為至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞;
所述發(fā)送單元,用于將所述至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞發(fā)送給外部的搜索引擎。
優(yōu)選地,
所述構(gòu)建單元,用于構(gòu)建xml初始文檔,并在所述xml初始文檔中構(gòu)建至少一個(gè)節(jié)點(diǎn),每一個(gè)所述節(jié)點(diǎn)下存儲(chǔ)至少一個(gè)所述正則表達(dá)式,形成所述xml文檔;其中,同一個(gè)節(jié)點(diǎn)下存儲(chǔ)的各個(gè)所述正則表達(dá)式與當(dāng)前節(jié)點(diǎn)下對(duì)應(yīng)的關(guān)鍵詞的類型相同。
第四方面,本發(fā)明實(shí)施例提供了一種搜索引擎,包括:接收單元和搜索單元;其中,
所述接收單元,用于接收至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞;
所述搜索單元,用于根據(jù)所述至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞,進(jìn)行搜索。
第五方面,本發(fā)明實(shí)施例提供了一種搜索系統(tǒng),包括:本發(fā)明上述任一實(shí)施例提供的智能語義識(shí)別裝置,以及本發(fā)明上述任一實(shí)施例提供的搜索引擎;其中,
所述智能語義識(shí)別裝置,用于將用戶輸入的至少一個(gè)關(guān)鍵詞轉(zhuǎn)換為至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞,并將所述目標(biāo)關(guān)鍵詞發(fā)送給所述搜索引擎;
所述搜索引擎,用于接收所述智能語義識(shí)別裝置發(fā)送的目標(biāo)關(guān)鍵詞,并根據(jù)所述目標(biāo)關(guān)鍵詞進(jìn)行搜索。
本發(fā)明實(shí)施例提供了一種智能語義識(shí)別方法、搜索方法、裝置及系統(tǒng),通過預(yù)先構(gòu)建包括至少一個(gè)關(guān)鍵詞以及每一個(gè)關(guān)鍵詞分別對(duì)應(yīng)的正則表達(dá)式的配置文件。當(dāng)獲取到用戶輸入的關(guān)鍵詞時(shí),從配置文件中確定與此關(guān)鍵詞相對(duì)應(yīng)的目標(biāo)正則表達(dá)式,并根據(jù)確定出的目標(biāo)正則表達(dá)式,將獲取到的關(guān)鍵詞轉(zhuǎn)換為設(shè)定格式的目標(biāo)關(guān)鍵詞,然后將轉(zhuǎn)換后的目標(biāo)關(guān)鍵詞發(fā)送給搜索引擎,以使搜索引擎根據(jù)接收到的目標(biāo)關(guān)鍵詞進(jìn)行搜索。由于通過預(yù)先構(gòu)建的正則表達(dá)式對(duì)用戶輸入的關(guān)鍵詞進(jìn)行轉(zhuǎn)換,從而使得用戶輸入的關(guān)鍵詞與搜索引擎的分詞規(guī)則相符,由此提高了搜索結(jié)果的準(zhǔn)確性。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明一個(gè)實(shí)施例提供的一種智能語義識(shí)別方法的流程圖;
圖2是本發(fā)明一個(gè)實(shí)施例提供的一種搜索方法的流程圖;
圖3是本發(fā)明一個(gè)實(shí)施例提供的一種智能語義識(shí)別裝置的結(jié)構(gòu)示意圖;
圖4是本發(fā)明一個(gè)實(shí)施例提供的一種搜索裝置的結(jié)構(gòu)示意圖;
圖5是本發(fā)明一個(gè)實(shí)施例提供的一種搜索系統(tǒng)的結(jié)構(gòu)示意圖;
圖6是本發(fā)明一個(gè)實(shí)施例提供的一種搜索系統(tǒng)的使用方法的流程圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例,基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
如圖1所示,本發(fā)明實(shí)施例提供了一種智能語義識(shí)別方法,該方法可以包括以下步驟:
步驟101:構(gòu)建配置文件,所述配置文件中包括至少一個(gè)關(guān)鍵詞以及每一個(gè)所述關(guān)鍵詞分別對(duì)應(yīng)的正則表達(dá)式;
步驟102:獲取用戶輸入的至少一個(gè)關(guān)鍵詞;
步驟103:從所述配置文件中確定與所述用戶輸入的至少一個(gè)關(guān)鍵詞對(duì)應(yīng)的至少一個(gè)目標(biāo)正則表達(dá)式;
步驟104:根據(jù)所述至少一個(gè)目標(biāo)正則表達(dá)式,將所述用戶輸入的至少一個(gè)關(guān)鍵詞轉(zhuǎn)換為至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞;
步驟105:將所述至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞發(fā)送給外部的搜索引擎。
上述實(shí)施例中,通過預(yù)先構(gòu)建包括至少一個(gè)關(guān)鍵詞以及每一個(gè)關(guān)鍵詞分別對(duì)應(yīng)的正則表達(dá)式的配置文件。當(dāng)獲取到用戶輸入的關(guān)鍵詞時(shí),從配置文件中確定與此關(guān)鍵詞相對(duì)應(yīng)的目標(biāo)正則表達(dá)式,并根據(jù)確定出的目標(biāo)正則表達(dá)式,將獲取到的關(guān)鍵詞轉(zhuǎn)換為設(shè)定格式的目標(biāo)關(guān)鍵詞,然后將轉(zhuǎn)換后的目標(biāo)關(guān)鍵詞發(fā)送給搜索引擎,以使搜索引擎根據(jù)接收到的目標(biāo)關(guān)鍵詞進(jìn)行搜索。由于通過預(yù)先構(gòu)建的正則表達(dá)式對(duì)用戶輸入的關(guān)鍵詞進(jìn)行轉(zhuǎn)換,從而使得用戶輸入的關(guān)鍵詞與搜索引擎的分詞規(guī)則相符,由此提高了搜索結(jié)果的準(zhǔn)確性。
本發(fā)明一個(gè)實(shí)施例中,步驟101的具體實(shí)施方式,可以包括:
構(gòu)建可擴(kuò)展標(biāo)記語言xml文檔,所述xml文檔中包括至少一個(gè)關(guān)鍵詞以及每一個(gè)所述關(guān)鍵詞分別對(duì)應(yīng)的正則表達(dá)式。
在這里,構(gòu)建的配置文件可為可擴(kuò)展標(biāo)記語言(extensiblemarkuplanguage,xml)文檔,則配置文件中的關(guān)鍵詞以及與關(guān)鍵詞對(duì)應(yīng)的正則表達(dá)式為xml格式。例如,年齡格式的關(guān)鍵詞對(duì)應(yīng)的正則表達(dá)式為:/^[0-9]{2}[-/\.歲]?/,/^[0-9]{2}[-/\.歲]{1}-[0-9]{2}[-/\.歲]{1}?/。這使得各個(gè)關(guān)鍵詞以及對(duì)應(yīng)的正則表達(dá)式可直接被計(jì)算機(jī)理解,從而可提高對(duì)用戶輸入的關(guān)鍵詞的轉(zhuǎn)換效率,進(jìn)而提高搜索效率。
具體地,本發(fā)明一個(gè)實(shí)施例中,所述構(gòu)建可擴(kuò)展標(biāo)記語言xml文檔,所述xml文檔中包括至少一個(gè)關(guān)鍵詞以及每一個(gè)所述關(guān)鍵詞分別對(duì)應(yīng)的正則表達(dá)式,包括:
構(gòu)建xml初始文檔;
在所述xml初始文檔中構(gòu)建至少一個(gè)節(jié)點(diǎn),每一個(gè)所述節(jié)點(diǎn)下存儲(chǔ)至少一個(gè)所述正則表達(dá)式,形成所述xml文檔;其中,同一個(gè)節(jié)點(diǎn)下存儲(chǔ)的各個(gè)所述正則表達(dá)式與當(dāng)前節(jié)點(diǎn)下對(duì)應(yīng)的關(guān)鍵詞的類型相同。
在這里,首先構(gòu)建xml初始文檔,在xml初始文檔中構(gòu)建分別與各種關(guān)鍵詞的類型相對(duì)應(yīng)的節(jié)點(diǎn),然后將同一類型的關(guān)鍵詞對(duì)應(yīng)的正則表達(dá)式存入同一節(jié)點(diǎn)下。例如,關(guān)鍵詞類型包括年齡類、日期類和車牌號(hào)類,則在xml初始文檔中建立三個(gè)節(jié)點(diǎn),分別與每一種關(guān)鍵詞類型對(duì)應(yīng),則將年齡類、日期類和車牌號(hào)類的關(guān)鍵詞對(duì)應(yīng)的正則表達(dá)式存入自身對(duì)應(yīng)的節(jié)點(diǎn)下,形成xml文檔,從而便于對(duì)配置文件進(jìn)行管理。
本發(fā)明一個(gè)實(shí)施例中,步驟103的具體實(shí)施方式,可以包括:
針對(duì)所述用戶輸入的每一個(gè)所述關(guān)鍵詞,均執(zhí)行:
根據(jù)所述關(guān)鍵詞的格式,確定所述關(guān)鍵詞對(duì)應(yīng)的類型;
從所述xml文檔中確定與所述關(guān)鍵詞的類型對(duì)應(yīng)的節(jié)點(diǎn);
從確定出的所述節(jié)點(diǎn)下存儲(chǔ)的至少一個(gè)正則表達(dá)式中,確定與所述關(guān)鍵詞對(duì)應(yīng)的目標(biāo)正則表達(dá)式。
舉例來說,用戶輸入的關(guān)鍵詞包括年齡a、日期b和車牌號(hào)c時(shí),由于年齡中包括的字符為數(shù)字,日期中會(huì)包括數(shù)字和漢字或數(shù)字和標(biāo)點(diǎn),車牌號(hào)中包括數(shù)字和字母,則可根據(jù)各個(gè)關(guān)鍵詞的不同格式,確定出關(guān)鍵詞對(duì)應(yīng)的類型。在這里,年齡a、日期b和車牌號(hào)c分別對(duì)應(yīng)的類型為年齡類、日期類和車牌號(hào)類。則可從xml文檔中確定出與各個(gè)類型相對(duì)應(yīng)的節(jié)點(diǎn),再從確定出的節(jié)點(diǎn)中確定出與關(guān)鍵詞對(duì)應(yīng)的目標(biāo)正則表達(dá)式。通過這種逐級(jí)確定的方式,可提高確定目標(biāo)正則表達(dá)式的效率,進(jìn)而提高搜索效率。
如圖2所示,本發(fā)明實(shí)施例提供了一種搜索方法,應(yīng)用于搜索引擎,該方法可以包括以下步驟:
步驟201:接收至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞;
步驟202:根據(jù)所述至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞,進(jìn)行搜索。
上述實(shí)施例中,根據(jù)接收到的設(shè)定格式的目標(biāo)關(guān)鍵詞進(jìn)行搜索,由于設(shè)定格式的目標(biāo)關(guān)鍵詞與搜索引擎的分詞規(guī)則相符,從而提高了搜索結(jié)果的準(zhǔn)確性。
本發(fā)明一個(gè)實(shí)施例中,該方法可以進(jìn)一步包括:預(yù)先構(gòu)建至少一個(gè)設(shè)定格式的關(guān)鍵詞與至少一個(gè)文檔之間的索引關(guān)系;
步驟202的具體實(shí)施方式,可以包括:
根據(jù)所述索引關(guān)系,確定與所述至少一個(gè)目標(biāo)關(guān)鍵詞相對(duì)應(yīng)的至少一個(gè)目標(biāo)文檔。
在全文搜索引擎中,可預(yù)先構(gòu)建至少一個(gè)設(shè)定格式的關(guān)鍵詞與至少一篇文章的索引關(guān)系,則在接受到設(shè)定格式的關(guān)鍵詞之后,可根據(jù)預(yù)先構(gòu)建的索引關(guān)系,確定出與關(guān)鍵詞對(duì)應(yīng)的目標(biāo)文章。由于預(yù)先構(gòu)建了關(guān)鍵詞和文檔之間的索引關(guān)系,則在接收到關(guān)鍵詞之后,可根據(jù)索引關(guān)系,直接確定出對(duì)應(yīng)的目標(biāo)文檔,則使得在提高搜索結(jié)果的準(zhǔn)確性的同時(shí),還提高了搜索效率。
如圖3所示,本發(fā)明實(shí)施例提供了一種基于配置文件的智能語義識(shí)別裝置,包括:構(gòu)建單元301、獲取單元302、處理單元303和發(fā)送單元304;其中,
所述構(gòu)建單元301,用于構(gòu)建配置文件,所述配置文件中包括至少一個(gè)關(guān)鍵詞以及每一個(gè)所述關(guān)鍵詞分別對(duì)應(yīng)的正則表達(dá)式;
所述獲取單元302,用于獲取用戶輸入的至少一個(gè)關(guān)鍵詞;
所述處理單元303,用于從所述構(gòu)建單元301構(gòu)建的配置文件中確定與所述獲取單元302獲取到的至少一個(gè)關(guān)鍵詞對(duì)應(yīng)的至少一個(gè)目標(biāo)正則表達(dá)式;根據(jù)所述至少一個(gè)目標(biāo)正則表達(dá)式,將所述用戶輸入的至少一個(gè)關(guān)鍵詞轉(zhuǎn)換為至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞;
所述發(fā)送單元304,用于將所述處理單元303轉(zhuǎn)換后的至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞發(fā)送給外部的搜索引擎。
上述實(shí)施例中,通過預(yù)先構(gòu)建包括至少一個(gè)關(guān)鍵詞以及每一個(gè)關(guān)鍵詞分別對(duì)應(yīng)的正則表達(dá)式的配置文件。當(dāng)獲取到用戶輸入的關(guān)鍵詞時(shí),從配置文件中確定與此關(guān)鍵詞相對(duì)應(yīng)的目標(biāo)正則表達(dá)式,并根據(jù)確定出的目標(biāo)正則表達(dá)式,將獲取到的關(guān)鍵詞轉(zhuǎn)換為設(shè)定格式的目標(biāo)關(guān)鍵詞,然后將轉(zhuǎn)換后的目標(biāo)關(guān)鍵詞發(fā)送給搜索引擎,以使搜索引擎根據(jù)接收到的目標(biāo)關(guān)鍵詞進(jìn)行搜索。由于通過預(yù)先構(gòu)建的正則表達(dá)式對(duì)用戶輸入的關(guān)鍵詞進(jìn)行轉(zhuǎn)換,從而使得用戶輸入的關(guān)鍵詞與搜索引擎的分詞規(guī)則相符,由此提高了搜索結(jié)果的準(zhǔn)確性。
本發(fā)明一個(gè)實(shí)施例中,所述構(gòu)建單元301,用于構(gòu)建xml初始文檔,并在所述xml初始文檔中構(gòu)建至少一個(gè)節(jié)點(diǎn),每一個(gè)所述節(jié)點(diǎn)下存儲(chǔ)至少一個(gè)所述正則表達(dá)式,形成所述xml文檔;其中,同一個(gè)節(jié)點(diǎn)下存儲(chǔ)的各個(gè)所述正則表達(dá)式與當(dāng)前節(jié)點(diǎn)下對(duì)應(yīng)的關(guān)鍵詞的類型相同。
在這里,構(gòu)建的配置文件可為可擴(kuò)展標(biāo)記語言(extensiblemarkuplanguage,xml)文檔,則配置文件中的關(guān)鍵詞以及與關(guān)鍵詞對(duì)應(yīng)的正則表達(dá)式為xml格式。例如,年齡格式的關(guān)鍵詞對(duì)應(yīng)的正則表達(dá)式為:/^[0-9]{2}[-/\.歲]?/,/^[0-9]{2}[-/\.歲]{1}-[0-9]{2}[-/\.歲]{1}?/。這使得各個(gè)關(guān)鍵詞以及對(duì)應(yīng)的正則表達(dá)式可直接被計(jì)算機(jī)理解,從而可提高對(duì)用戶輸入的關(guān)鍵詞的轉(zhuǎn)換效率,進(jìn)而提高搜索效率。
在構(gòu)建xml文檔時(shí),首先構(gòu)建xml初始文檔,在xml初始文檔中構(gòu)建分別與各種關(guān)鍵詞的類型相對(duì)應(yīng)的節(jié)點(diǎn),然后將同一類型的關(guān)鍵詞對(duì)應(yīng)的正則表達(dá)式存入同一節(jié)點(diǎn)下。例如,關(guān)鍵詞類型包括年齡類、日期類和車牌號(hào)類,則在xml初始文檔中建立三個(gè)節(jié)點(diǎn),分別與每一種關(guān)鍵詞類型對(duì)應(yīng),則將年齡類、日期類和車牌號(hào)類的關(guān)鍵詞對(duì)應(yīng)的正則表達(dá)式存入自身對(duì)應(yīng)的節(jié)點(diǎn)下,形成xml文檔,從而便于對(duì)配置文件進(jìn)行管理。
上述裝置內(nèi)的各單元之間的信息交互、執(zhí)行過程等內(nèi)容,由于與本發(fā)明方法實(shí)施例基于同一構(gòu)思,具體內(nèi)容可參見本發(fā)明方法實(shí)施例中的敘述,此處不再贅述。
如圖4所示,本發(fā)明實(shí)施例提供了一種搜索引擎,包括:接收單元401和搜索單元402;其中,
所述接收單元401,用于接收至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞;
所述搜索單元402,用于根據(jù)所述至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞,進(jìn)行搜索。
上述實(shí)施例中,根據(jù)接收到的設(shè)定格式的目標(biāo)關(guān)鍵詞進(jìn)行搜索,由于設(shè)定格式的目標(biāo)關(guān)鍵詞與搜索引擎的分詞規(guī)則相符,從而提高了搜索結(jié)果的準(zhǔn)確性。
上述裝置內(nèi)的各單元之間的信息交互、執(zhí)行過程等內(nèi)容,由于與本發(fā)明方法實(shí)施例基于同一構(gòu)思,具體內(nèi)容可參見本發(fā)明方法實(shí)施例中的敘述,此處不再贅述。
如圖5所示,本發(fā)明實(shí)施例提供了一種搜索系統(tǒng),包括:本發(fā)明上述任一實(shí)施例提供的智能語義識(shí)別裝置501,以及本發(fā)明上述任一實(shí)施例提供的搜索引擎502;其中,
所述智能語義識(shí)別裝置501,用于將用戶輸入的至少一個(gè)關(guān)鍵詞轉(zhuǎn)換為至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞,并將所述目標(biāo)關(guān)鍵詞發(fā)送給所述搜索引擎;
所述搜索引擎502,用于接收所述智能語義識(shí)別裝置發(fā)送的目標(biāo)關(guān)鍵詞,并根據(jù)所述目標(biāo)關(guān)鍵詞進(jìn)行搜索。
上述實(shí)施例中,將轉(zhuǎn)換成設(shè)定格式的目標(biāo)關(guān)鍵詞發(fā)送給搜索引擎,以使搜索引擎根據(jù)接收到的目標(biāo)關(guān)鍵詞進(jìn)行搜索。由于設(shè)定格式的關(guān)鍵詞與搜索引擎的分詞規(guī)則相符,由此提高了搜索結(jié)果的準(zhǔn)確性。
如圖6所示,本發(fā)明實(shí)施例提供了一種搜索系統(tǒng)的使用方法,該方法可以包括以下步驟:
步驟601:智能語義識(shí)別裝置構(gòu)建xml初始文檔。
步驟602:在所述xml初始文檔中構(gòu)建至少一個(gè)節(jié)點(diǎn),每一個(gè)所述節(jié)點(diǎn)下存儲(chǔ)至少一個(gè)所述正則表達(dá)式,形成所述xml文檔;其中,同一個(gè)節(jié)點(diǎn)下存儲(chǔ)的各個(gè)所述正則表達(dá)式與當(dāng)前節(jié)點(diǎn)下對(duì)應(yīng)的關(guān)鍵詞的類型相同。
例如,關(guān)鍵詞類型包括年齡類、日期類和車牌號(hào)類,則在xml初始文檔中建立三個(gè)節(jié)點(diǎn),分別與每一種關(guān)鍵詞類型對(duì)應(yīng),則將年齡類、日期類和車牌號(hào)類的關(guān)鍵詞對(duì)應(yīng)的正則表達(dá)式存入自身對(duì)應(yīng)的節(jié)點(diǎn)下,形成xml文檔。
步驟603:獲取用戶輸入的至少一個(gè)關(guān)鍵詞。
例如,用戶輸入的關(guān)鍵詞包括年齡a、日期b和車牌號(hào)c。
步驟604:根據(jù)所述關(guān)鍵詞的格式,確定所述關(guān)鍵詞對(duì)應(yīng)的類型,并從所述xml文檔中確定與所述關(guān)鍵詞的類型對(duì)應(yīng)的節(jié)點(diǎn)。
步驟605:從確定出的所述節(jié)點(diǎn)下存儲(chǔ)的至少一個(gè)正則表達(dá)式中,確定與所述關(guān)鍵詞對(duì)應(yīng)的目標(biāo)正則表達(dá)式。
舉例來說,年齡中包括的字符為數(shù)字,日期中會(huì)包括數(shù)字和漢字或數(shù)字和標(biāo)點(diǎn),車牌號(hào)中包括數(shù)字和字母,則可根據(jù)各個(gè)關(guān)鍵詞的不同格式,確定出關(guān)鍵詞對(duì)應(yīng)的類型。在這里,年齡a、日期b和車牌號(hào)c分別對(duì)應(yīng)的類型為年齡類、日期類和車牌號(hào)類。則可從xml文檔中確定出與各個(gè)類型相對(duì)應(yīng)的節(jié)點(diǎn),再從確定出的節(jié)點(diǎn)中確定出與關(guān)鍵詞對(duì)應(yīng)的目標(biāo)正則表達(dá)式。
步驟606:根據(jù)所述至少一個(gè)目標(biāo)正則表達(dá)式,將所述用戶輸入的至少一個(gè)關(guān)鍵詞轉(zhuǎn)換為至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞。
步驟607:將所述至少一個(gè)設(shè)定格式的目標(biāo)關(guān)鍵詞發(fā)送給外部的搜索引擎。
根據(jù)正則表達(dá)式,將用戶輸入的關(guān)鍵詞進(jìn)行轉(zhuǎn)換,以使其符合搜索引擎的分詞規(guī)則。例如,針對(duì)用戶輸入的年齡a,將其轉(zhuǎn)化為出生年月a’,則搜索引擎可根據(jù)出生年月進(jìn)行檢索。
步驟608:搜索引擎預(yù)先構(gòu)建至少一個(gè)設(shè)定格式的關(guān)鍵詞與至少一個(gè)文檔之間的索引關(guān)系。
例如,預(yù)先構(gòu)建不同的出生年月與對(duì)應(yīng)的文檔之間的索引關(guān)系。
步驟609:根據(jù)所述索引關(guān)系,確定與所述至少一個(gè)目標(biāo)關(guān)鍵詞相對(duì)應(yīng)的至少一個(gè)目標(biāo)文檔。
在這里,根據(jù)轉(zhuǎn)化后得到的出生年月a’以及預(yù)先構(gòu)建的索引關(guān)系,確定與出生年月a’對(duì)應(yīng)的目標(biāo)文檔。
綜上所述,由于智能語義識(shí)別裝置將用戶輸入的關(guān)鍵詞轉(zhuǎn)化為與搜索引擎的分詞規(guī)則相符的設(shè)定格式的關(guān)鍵詞,從而使得搜索引擎可根據(jù)轉(zhuǎn)化得到的設(shè)定格式的關(guān)鍵詞進(jìn)行搜索,從而提高的搜索準(zhǔn)確性。
本發(fā)明還提供了一種可讀介質(zhì),包括執(zhí)行指令,當(dāng)存儲(chǔ)控制器的處理器執(zhí)行所述執(zhí)行指令時(shí),所述存儲(chǔ)控制器執(zhí)行本發(fā)明上述任一實(shí)施例提供的方法。
另外,本發(fā)明還提供了一種存儲(chǔ)控制器,包括:處理器、存儲(chǔ)器和總線;所述存儲(chǔ)器用于存儲(chǔ)執(zhí)行指令,所述處理器與所述存儲(chǔ)器通過所述總線連接,當(dāng)所述存儲(chǔ)控制器運(yùn)行時(shí),所述處理器執(zhí)行所述存儲(chǔ)器存儲(chǔ)的所述執(zhí)行指令,以使所述存儲(chǔ)控制器執(zhí)行本發(fā)明上述任一實(shí)施例提供的方法。
綜上所述,本發(fā)明的各個(gè)實(shí)施例至少具有如下有益效果:
1、在本發(fā)明實(shí)施例中,通過預(yù)先構(gòu)建包括至少一個(gè)關(guān)鍵詞以及每一個(gè)關(guān)鍵詞分別對(duì)應(yīng)的正則表達(dá)式的配置文件。當(dāng)獲取到用戶輸入的關(guān)鍵詞時(shí),從配置文件中確定與此關(guān)鍵詞相對(duì)應(yīng)的目標(biāo)正則表達(dá)式,并根據(jù)確定出的目標(biāo)正則表達(dá)式,將獲取到的關(guān)鍵詞轉(zhuǎn)換為設(shè)定格式的目標(biāo)關(guān)鍵詞,然后將轉(zhuǎn)換后的目標(biāo)關(guān)鍵詞發(fā)送給搜索引擎,以使搜索引擎根據(jù)接收到的目標(biāo)關(guān)鍵詞進(jìn)行搜索。由于通過預(yù)先構(gòu)建的正則表達(dá)式對(duì)用戶輸入的關(guān)鍵詞進(jìn)行轉(zhuǎn)換,從而使得用戶輸入的關(guān)鍵詞與搜索引擎的分詞規(guī)則相符,由此提高了搜索結(jié)果的準(zhǔn)確性。
2、在本發(fā)明實(shí)施例中,構(gòu)建的配置文件可為xml文檔,則配置文件中的關(guān)鍵詞以及與關(guān)鍵詞對(duì)應(yīng)的正則表達(dá)式為xml格式。這使得各個(gè)關(guān)鍵詞以及對(duì)應(yīng)的正則表達(dá)式可直接被計(jì)算機(jī)理解,從而可提高對(duì)用戶輸入的關(guān)鍵詞的轉(zhuǎn)換效率,進(jìn)而提高搜索效率。
3、在本發(fā)明實(shí)施例中,首先構(gòu)建xml初始文檔,在xml初始文檔中構(gòu)建分別與各種關(guān)鍵詞的類型相對(duì)應(yīng)的節(jié)點(diǎn),然后將同一類型的關(guān)鍵詞對(duì)應(yīng)的正則表達(dá)式存入同一節(jié)點(diǎn)下,從而便于對(duì)配置文件進(jìn)行管理。
4、在本發(fā)明實(shí)施例中,根據(jù)用戶輸入的關(guān)鍵詞的格式,確定關(guān)鍵詞對(duì)應(yīng)的類型,并從xml文檔中確定出與此關(guān)鍵詞類型相對(duì)應(yīng)的節(jié)點(diǎn),并從確定出的該節(jié)點(diǎn)下存儲(chǔ)的至少一個(gè)正則表達(dá)式中,確定與用戶輸入的關(guān)鍵詞對(duì)應(yīng)的正則表達(dá)式。通過這種逐級(jí)確定的方式,可提高確定目標(biāo)正則表達(dá)式的效率,進(jìn)而提高搜索效率。
5、在本發(fā)明實(shí)施例中,通過預(yù)先構(gòu)建至少一個(gè)設(shè)定格式的關(guān)鍵詞與至少一篇文章的索引關(guān)系,則在接受到設(shè)定格式的關(guān)鍵詞之后,可根據(jù)索引關(guān)系,直接確定出對(duì)應(yīng)的目標(biāo)文檔,則使得在提高搜索結(jié)果的準(zhǔn)確性的同時(shí),還提高了搜索效率。
需要說明的是,在本文中,諸如第一和第二之類的關(guān)系術(shù)語僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)······”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同因素。
本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成,前述的程序可以存儲(chǔ)在計(jì)算機(jī)可讀取的存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:rom、ram、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)中。
最后需要說明的是:以上所述僅為本發(fā)明的較佳實(shí)施例,僅用于說明本發(fā)明的技術(shù)方案,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所做的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。