搜索方法及裝置的制造方法
【專利摘要】本發(fā)明提供一種搜索方法及裝置。本發(fā)明實施例通過對所獲取的搜索關(guān)鍵詞進(jìn)行語義分析處理,以獲得至少一個語義子結(jié)構(gòu),進(jìn)而根據(jù)所述至少一個語義子結(jié)構(gòu),獲得主干關(guān)鍵詞,使得能夠利用所述主干關(guān)鍵詞,執(zhí)行搜索操作,由于不再完全依賴搜索關(guān)鍵詞執(zhí)行搜索操作,而是利用基于搜索關(guān)鍵詞所提取的主干關(guān)鍵詞執(zhí)行搜索操作,使得搜索結(jié)果基本滿足用戶的真正意圖,因此,能夠避免現(xiàn)有技術(shù)中由于用戶通過應(yīng)用反復(fù)進(jìn)行搜索而導(dǎo)致的增加應(yīng)用與搜索引擎之間的數(shù)據(jù)交互的問題,從而降低了搜索引擎的處理負(fù)擔(dān)。
【專利說明】
搜索方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術(shù),尤其涉及一種搜索方法及裝置。
【【背景技術(shù)】】
[0002]搜索引擎是指根據(jù)一定的策略、運(yùn)用特定的計算機(jī)程序從互聯(lián)網(wǎng)上搜集信息,在對信息進(jìn)行組織和處理后,為用戶提供搜索服務(wù),將用戶搜索相關(guān)的信息展示給用戶的系統(tǒng)。據(jù)國家統(tǒng)計局的報道,中國網(wǎng)民人數(shù)已經(jīng)超過了4億,這個數(shù)據(jù)意味著中國已經(jīng)超過美國成為世界上第一大網(wǎng)民國,且中國的網(wǎng)站總數(shù)量已經(jīng)超過了200萬。因此,如何利用搜索服務(wù)最大限度滿足用戶需求,對于互聯(lián)網(wǎng)企業(yè)而言,始終是一個重要的課題。用戶可以將搜索關(guān)鍵詞提供給相關(guān)應(yīng)用,由應(yīng)用將搜索關(guān)鍵詞,發(fā)送給搜索引擎。搜索引擎則根據(jù)搜索關(guān)鍵詞,在數(shù)據(jù)庫中進(jìn)行搜索,以獲得與搜索關(guān)鍵詞匹配的搜索結(jié)果,并返回給應(yīng)用進(jìn)行輸出。
[0003]然而,由于用戶的表達(dá)方式需要借助自然語言,而每個用戶的措詞都會有較大差異,使得用戶所提供的搜索關(guān)鍵詞可能會存在語法不嚴(yán)格和語序顛倒等情況,完全依賴搜索關(guān)鍵詞執(zhí)行搜索操作,可能會使得搜索結(jié)果無法滿足用戶的真正意圖,使得用戶需要通過應(yīng)用反復(fù)進(jìn)行搜索,這樣,會增加應(yīng)用與搜索引擎之間的數(shù)據(jù)交互,從而導(dǎo)致了搜索引擎的處理負(fù)擔(dān)的增加。
【
【發(fā)明內(nèi)容】
】
[0004]本發(fā)明的多個方面提供一種搜索方法及裝置,用以降低搜索引擎的處理負(fù)擔(dān)。
[0005]本發(fā)明的一方面,提供一種搜索方法,包括:
[0006]獲取搜索關(guān)鍵詞;
[0007]對所述搜索關(guān)鍵詞進(jìn)行語義分析處理,以獲得至少一個語義子結(jié)構(gòu);
[0008]根據(jù)所述至少一個語義子結(jié)構(gòu),獲得主干關(guān)鍵詞;
[0009]利用所述主干關(guān)鍵詞,執(zhí)行搜索操作。
[0010]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述對所述搜索關(guān)鍵詞進(jìn)行語義分析處理,以獲得至少一個語義子結(jié)構(gòu),包括:
[0011]利用語義分析技術(shù),對所述搜索關(guān)鍵詞進(jìn)行語義分析處理;
[0012]對經(jīng)過語義分析處理之后的搜索關(guān)鍵詞進(jìn)行內(nèi)容提取,以獲得所述至少一個語義子結(jié)構(gòu)。
[0013]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述對所述搜索關(guān)鍵詞進(jìn)行語義分析處理,以獲得至少一個語義子結(jié)構(gòu),還包括:
[0014]對所獲得的所述至少一個語義子結(jié)構(gòu)進(jìn)行合并處理,以獲得合并之后的所述至少一個語義子結(jié)構(gòu)。
[0015]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述根據(jù)所述至少一個語義子結(jié)構(gòu),獲得主干關(guān)鍵詞,包括:
[0016]根據(jù)所述至少一個語義子結(jié)構(gòu)中兩兩語義子結(jié)構(gòu)中相同的詞,以及該詞在對應(yīng)的語義子結(jié)構(gòu)中的結(jié)構(gòu)成分,獲得兩兩語義子結(jié)構(gòu)之間的層級關(guān)系;
[0017]根據(jù)所述兩兩語義子結(jié)構(gòu)之間的層級關(guān)系,建立所述搜索關(guān)鍵詞的層級結(jié)構(gòu);
[0018]根據(jù)所述至少一個語義子結(jié)構(gòu)的層級結(jié)構(gòu),獲得所述主干關(guān)鍵詞。
[0019]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述根據(jù)所述至少一個語義子結(jié)構(gòu)的層級結(jié)構(gòu),獲得所述主干關(guān)鍵詞,包括:
[0020]根據(jù)所述至少一個語義子結(jié)構(gòu)的層級結(jié)構(gòu)中每個語義子結(jié)構(gòu)的層級信息,對所述每個語義子結(jié)構(gòu)中的詞進(jìn)行保留處理或者刪除處理,以獲得保留詞;所述每個語義子結(jié)構(gòu)的層級信息包括所述每個語義子結(jié)構(gòu)的層級關(guān)系、所述每個語義子結(jié)構(gòu)的結(jié)構(gòu)類型和所述每個語義子結(jié)構(gòu)中詞的結(jié)構(gòu)成分中的至少一項;
[0021 ]根據(jù)所述保留詞,獲得所述主干關(guān)鍵詞。
[0022]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述根據(jù)所述保留詞,獲得所述主干關(guān)鍵詞,包括:
[0023]根據(jù)指定結(jié)構(gòu),對所述保留詞的順序進(jìn)行調(diào)整;
[0024]對所述保留詞進(jìn)行歸一化處理,以獲得所述主干關(guān)鍵詞。
[0025]本發(fā)明的另一方面,提供一種搜索裝置,包括:
[0026]獲取單元,用于獲取搜索關(guān)鍵詞;
[0027]語義單元,用于對所述搜索關(guān)鍵詞進(jìn)行語義分析處理,以獲得至少一個語義子結(jié)構(gòu);
[0028]提取單元,用于根據(jù)所述至少一個語義子結(jié)構(gòu),獲得主干關(guān)鍵詞;
[0029]搜索單元,用于利用所述主干關(guān)鍵詞,執(zhí)行搜索操作。
[0030]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述語義單元,具體用于
[0031]利用語義分析技術(shù),對所述搜索關(guān)鍵詞進(jìn)行語義分析處理;以及
[0032]對經(jīng)過語義分析處理之后的搜索關(guān)鍵詞進(jìn)行內(nèi)容提取,以獲得所述至少一個語義子結(jié)構(gòu)。
[0033]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述語義單元,還用于
[0034]對所獲得的所述至少一個語義子結(jié)構(gòu)進(jìn)行合并處理,以獲得合并之后的所述至少一個語義子結(jié)構(gòu)。
[0035]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述提取單元,具體用于
[0036]根據(jù)所述至少一個語義子結(jié)構(gòu)中兩兩語義子結(jié)構(gòu)中相同的詞,以及該詞在對應(yīng)的語義子結(jié)構(gòu)中的結(jié)構(gòu)成分,獲得兩兩語義子結(jié)構(gòu)之間的層級關(guān)系;
[0037]根據(jù)所述兩兩語義子結(jié)構(gòu)之間的層級關(guān)系,建立所述搜索關(guān)鍵詞的層級結(jié)構(gòu);以及
[0038]根據(jù)所述至少一個語義子結(jié)構(gòu)的層級結(jié)構(gòu),獲得所述主干關(guān)鍵詞。
[0039]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述提取單元,具體用于
[0040]根據(jù)所述至少一個語義子結(jié)構(gòu)的層級結(jié)構(gòu)中每個語義子結(jié)構(gòu)的層級信息,對所述每個語義子結(jié)構(gòu)中的詞進(jìn)行保留處理或者刪除處理,以獲得保留詞;所述每個語義子結(jié)構(gòu)的層級信息包括所述每個語義子結(jié)構(gòu)的層級關(guān)系、所述每個語義子結(jié)構(gòu)的結(jié)構(gòu)類型和所述每個語義子結(jié)構(gòu)中詞的結(jié)構(gòu)成分中的至少一項;以及[0041 ]根據(jù)所述保留詞,獲得所述主干關(guān)鍵詞。
[0042]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述提取單元,具體用于
[0043]根據(jù)指定結(jié)構(gòu),對所述保留詞的順序進(jìn)行調(diào)整;以及
[0044]對所述保留詞進(jìn)行歸一化處理,以獲得所述主干關(guān)鍵詞。
[0045]由上述技術(shù)方案可知,本發(fā)明實施例通過對所獲取的搜索關(guān)鍵詞進(jìn)行語義分析處理,以獲得至少一個語義子結(jié)構(gòu),進(jìn)而根據(jù)所述至少一個語義子結(jié)構(gòu),獲得主干關(guān)鍵詞,使得能夠利用所述主干關(guān)鍵詞,執(zhí)行搜索操作,由于不再完全依賴搜索關(guān)鍵詞執(zhí)行搜索操作,而是利用基于搜索關(guān)鍵詞所提取的主干關(guān)鍵詞執(zhí)行搜索操作,使得搜索結(jié)果基本滿足用戶的真正意圖,因此,能夠避免現(xiàn)有技術(shù)中由于用戶通過應(yīng)用反復(fù)進(jìn)行搜索而導(dǎo)致的增加應(yīng)用與搜索引擎之間的數(shù)據(jù)交互的問題,從而降低了搜索引擎的處理負(fù)擔(dān)。
[0046]另外,采用本發(fā)明所提供的技術(shù)方案,由于不再完全依賴搜索關(guān)鍵詞執(zhí)行搜索操作,而是利用基于搜索關(guān)鍵詞所提取的主干關(guān)鍵詞執(zhí)行搜索操作,使得搜索結(jié)果基本滿足用戶的真正意圖,從而提高了搜索結(jié)果的有效性。
[0047]另外,采用本發(fā)明所提供的技術(shù)方案,由于不再完全依賴搜索關(guān)鍵詞執(zhí)行搜索操作,而是利用基于搜索關(guān)鍵詞所提取的主干關(guān)鍵詞執(zhí)行搜索操作,使得搜索結(jié)果基本滿足用戶的真正意圖,從而提高了搜索的效率。
[0048]另外,采用本發(fā)明所提供的技術(shù)方案,能夠有效地提高用戶的體驗。
【【附圖說明】】
[0049]為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0050]圖1為本發(fā)明一實施例提供的搜索方法的流程示意圖;
[0051]圖2為本發(fā)明另一實施例提供的搜索裝置的結(jié)構(gòu)示意圖。
【【具體實施方式】】
[0052]為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的全部其他實施例,都屬于本發(fā)明保護(hù)的范圍。
[0053]需要說明的是,本發(fā)明實施例中所涉及的終端可以包括但不限于手機(jī)、個人數(shù)字助理(Personal Digital Assistant,PDA)、無線手持設(shè)備、平板電腦(Tablet Computer)、個人電腦(Personal Computer,PC)、MP3播放器、MP4播放器、可穿戴設(shè)備(例如,智能眼鏡、智能手表、智能手環(huán)等)等。
[0054]另外,本文中術(shù)語“和/或”,僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,六和/或B,可以表示:單獨存在A,同時存在A和B,單獨存在B這三種情況。另夕卜,本文中字符,一般表示前后關(guān)聯(lián)對象是一種“或”的關(guān)系。
[0055]圖1為本發(fā)明一實施例提供的搜索方法的流程示意圖,如圖1所示。
[0056]101、獲取搜索關(guān)鍵詞。
[0057]102、對所述搜索關(guān)鍵詞進(jìn)行語義分析處理,以獲得至少一個語義子結(jié)構(gòu)。
[0058]103、根據(jù)所述至少一個語義子結(jié)構(gòu),獲得主干關(guān)鍵詞。
[0059]104、利用所述主干關(guān)鍵詞,執(zhí)行搜索操作。
[0060]需要說明的是,101?104的執(zhí)行主體的部分或全部可以為位于本地終端的應(yīng)用,或者還可以為設(shè)置在位于本地終端的應(yīng)用中的插件或軟件開發(fā)工具包(SoftwareDevelopment Kit,SDK)等功能單元,或者還可以為位于網(wǎng)絡(luò)側(cè)服務(wù)器中的搜索引擎,或者還可以為位于網(wǎng)絡(luò)側(cè)的分布式系統(tǒng),本實施例對此不進(jìn)行特別限定。
[0061 ]可以理解的是,所述應(yīng)用可以是安裝在終端上的本地程序(nativeApp),或者還可以是終端上的瀏覽器的一個網(wǎng)頁程序(webApp),本實施例對此不進(jìn)行特別限定。
[0062]這樣,通過對所獲取的搜索關(guān)鍵詞進(jìn)行語義分析處理,以獲得至少一個語義子結(jié)構(gòu),進(jìn)而根據(jù)所述至少一個語義子結(jié)構(gòu),獲得主干關(guān)鍵詞,使得能夠利用所述主干關(guān)鍵詞,執(zhí)行搜索操作,由于不再完全依賴搜索關(guān)鍵詞執(zhí)行搜索操作,而是利用基于搜索關(guān)鍵詞所提取的主干關(guān)鍵詞執(zhí)行搜索操作,使得搜索結(jié)果基本滿足用戶的真正意圖,因此,能夠避免現(xiàn)有技術(shù)中由于用戶通過應(yīng)用反復(fù)進(jìn)行搜索而導(dǎo)致的增加應(yīng)用與搜索引擎之間的數(shù)據(jù)交互的問題,從而降低了搜索引擎的處理負(fù)擔(dān)。
[0063]可選地,在本實施例的一個可能的實現(xiàn)方式中,在101中,具體可以采集用戶所提供的所述搜索關(guān)鍵詞。具體來說,具體可以通過用戶所觸發(fā)的搜索命令實現(xiàn)。具體可以采用但不限于下述幾種方式觸發(fā)搜索命令:
[0064]方式一:
[0065]用戶可以在當(dāng)前應(yīng)用所展現(xiàn)的頁面上所輸入所述搜索關(guān)鍵詞,然后,通過點擊該頁面上的搜索按鈕例如,百度一下,以觸發(fā)搜索命令,該搜索命令中包含所述搜索關(guān)鍵詞。其中,用戶輸入所述搜索關(guān)鍵詞的順序可以為任意順序。這樣,在接收到該搜索命令之后,則可以解析出其中所包含的所述搜索關(guān)鍵詞。
[0066]方式二:
[0067]采用異步加載技術(shù)例如,Ajax異步加載或Jsonp異步加載等,實時獲取用戶在當(dāng)前應(yīng)用所展現(xiàn)的頁面上所輸入的輸入內(nèi)容,為了與搜索關(guān)鍵詞進(jìn)行區(qū)分,此時的輸入內(nèi)容可以稱為是輸入關(guān)鍵詞。其中,用戶輸入所述搜索關(guān)鍵詞的順序可以為任意順序。具體地,具體可以提供Ajax接口或Jsonp接口等接口,這些接口可以使用Java、超級文本預(yù)處理(Hypertext Preprocessor,PHP)語言等語言進(jìn)行編寫,其具體的調(diào)用可以使用Jquery,或者原生的JavaScript等語言進(jìn)行編寫。
[0068]方式三:用戶可以通過長按當(dāng)前應(yīng)用所展現(xiàn)的頁面上的語音搜索按鈕,說出想要輸入的語音內(nèi)容,然后,松開語音搜索按鈕,以觸發(fā)搜索命令,該搜索命令中包含根據(jù)所說出的語音內(nèi)容轉(zhuǎn)換的文本形式的搜索關(guān)鍵詞。這樣,在接收到該搜索命令之后,則可以解析出其中所包含的所述搜索關(guān)鍵詞。
[0069]方式四:用戶可以通過點擊當(dāng)前應(yīng)用所展現(xiàn)的頁面上的語音搜索按鈕,說出想要輸入的語音內(nèi)容,待結(jié)束說出語音內(nèi)容一段時間例如,2秒鐘之后,則觸發(fā)搜索命令,該搜索命令中包含根據(jù)所說出的語音內(nèi)容轉(zhuǎn)換的文本形式的搜索關(guān)鍵詞。這樣,在接收到該搜索命令之后,則可以解析出其中所包含的所述搜索關(guān)鍵詞。
[0070]在獲取到所述輸入關(guān)鍵詞之后,則可以執(zhí)行后續(xù)操作即102?104。
[0071]可選地,在本實施例的一個可能的實現(xiàn)方式中,在102中,具體可以利用語義分析技術(shù),對所述搜索關(guān)鍵詞進(jìn)行語義分析處理,進(jìn)而,則可以對經(jīng)過語義分析處理之后的搜索關(guān)鍵詞進(jìn)行內(nèi)容提取,以獲得所述至少一個語義子結(jié)構(gòu)。
[0072]所謂的語義分析處理,是指將一個句子分解成一些小的組成部分(如詞、短語等),并獲得這些部分之間的關(guān)系。本發(fā)明中,可以采用現(xiàn)有技術(shù)中的語義分析技術(shù),對所獲取的搜索關(guān)鍵詞進(jìn)行語義分析處理,其處理結(jié)果可以作為103和104的執(zhí)行基礎(chǔ)。
[0073]在該實現(xiàn)方式中,在獲得所述至少一個語義子結(jié)構(gòu)之后,還可以進(jìn)一步對所獲得的所述至少一個語義子結(jié)構(gòu)進(jìn)行合并處理,以獲得合并之后的所述至少一個語義子結(jié)構(gòu)。具體來說,由于句子語法的需求,會借助一些虛詞來協(xié)助構(gòu)建整個句子,因此,可以跨越部分語義子結(jié)構(gòu)中無意義的詞,對所獲得的所述至少一個語義子結(jié)構(gòu)進(jìn)行合并處理。
[0074]以搜索關(guān)鍵詞“幫查一下配國語的韓劇繼承者們”為例,對經(jīng)過語義分析處理之后,所獲得的三個語義子結(jié)構(gòu)即“查—繼承者”、“配—國語”、以及“配—繼承者們”,進(jìn)行合并處理,獲得一個語義子結(jié)構(gòu)即“繼承者們—配—國語”。除了“繼承者們—配—國語”這個語義子結(jié)構(gòu)之外,還獲得了其他兩個語義子結(jié)構(gòu)即“查—繼承者們”、以及“韓劇—繼承者們”。
[0075]可選地,在本實施例的一個可能的實現(xiàn)方式中,在103中,具體可以根據(jù)所述至少一個語義子結(jié)構(gòu)中兩兩語義子結(jié)構(gòu)中相同的詞,以及該詞在對應(yīng)的語義子結(jié)構(gòu)中的結(jié)構(gòu)成分,獲得兩兩語義子結(jié)構(gòu)之間的層級關(guān)系。進(jìn)而,則可以根據(jù)所述兩兩語義子結(jié)構(gòu)之間的層級關(guān)系,建立所述搜索關(guān)鍵詞的層級結(jié)構(gòu)。然后,再根據(jù)所述至少一個語義子結(jié)構(gòu)的層級結(jié)構(gòu),獲得所述主干關(guān)鍵詞。一般來說,每個語義子結(jié)構(gòu)都可以由三個結(jié)構(gòu)成分組成,即兩個實體結(jié)構(gòu)成分,一個關(guān)系結(jié)構(gòu)成分。
[0076]仍然以搜索關(guān)鍵詞“幫查一下配國語的韓劇繼承者們”為例,其經(jīng)過語義分析處理之后,獲得如下三個語義子結(jié)構(gòu),即“繼承者們—配—國語”、“查—繼承者們”、以及“韓劇—繼承者們”。
[0077]其中,
[0078]語義子結(jié)構(gòu)“查—繼承者們”中,“繼承者們”為一個實體結(jié)構(gòu)成分,另一個實體結(jié)構(gòu)成分為省略的內(nèi)容即“搜索引擎”,“查”為兩個實體之間的關(guān)系結(jié)構(gòu)成分;
[0079]語義子結(jié)構(gòu)“繼承者們—配—國語”中,“繼承者們”為一個實體結(jié)構(gòu)成分,“國語”為另一個實體結(jié)構(gòu)成分,“配”為兩個實體之間的關(guān)系結(jié)構(gòu)成分;
[0080]語義子結(jié)構(gòu)“韓劇—繼承者們”中,“韓劇”為一個實體結(jié)構(gòu)成分,“繼承者們”為另一個實體結(jié)構(gòu)成分,這兩個實體之間的關(guān)系結(jié)構(gòu)成分是上下位關(guān)系。
[0081 ]針對語義子結(jié)構(gòu)“查—繼承者們”與語義子結(jié)構(gòu)“繼承者們—配—國語”來說,相同的詞為“繼承者們”,而在語義子結(jié)構(gòu)“查—繼承者們”中,“繼承者們”是賓語位置,其父親節(jié)點是“查”,在語義子結(jié)構(gòu)“繼承者們4配—國語”中,“繼承者們”是核心詞即整個結(jié)構(gòu)的最上層父親節(jié)點,所以,語義子結(jié)構(gòu)“查4繼承者們”應(yīng)該為父親結(jié)構(gòu),語義子結(jié)構(gòu)“繼承者們4配—國語”則是孩子結(jié)構(gòu);
[0082]針對語義子結(jié)構(gòu)“查—繼承者們”與語義子結(jié)構(gòu)“韓劇—繼承者們”來說,相同的詞為“繼承者們”,而在語義子結(jié)構(gòu)“查—繼承者們”中,“繼承者們”是賓語位置,其父親節(jié)點是“查”,在語義子結(jié)構(gòu)“韓劇—繼承者們”中,“韓劇”是“繼承者們”的上位概念,所以,語義子結(jié)構(gòu)“查—繼承者們”應(yīng)該為父親結(jié)構(gòu),語義子結(jié)構(gòu)“韓劇—繼承者們”則是孩子結(jié)構(gòu);
[0083]至此,獲得兩兩語義子結(jié)構(gòu)之間的層級關(guān)系,即語義子結(jié)構(gòu)“查—繼承者們”為父親結(jié)構(gòu),語義子結(jié)構(gòu)“繼承者們—配—國語”和語義子結(jié)構(gòu)“韓劇—繼承者們”為孩子結(jié)構(gòu),這些層級關(guān)系共同組成了搜索關(guān)鍵詞的結(jié)構(gòu)圖譜。
[0084]在一個具體的實現(xiàn)過程中,具體可以根據(jù)所述至少一個語義子結(jié)構(gòu)的層級結(jié)構(gòu)中每個語義子結(jié)構(gòu)的層級信息,對所述每個語義子結(jié)構(gòu)中的詞進(jìn)行保留處理或者刪除處理,以獲得保留詞;所述每個語義子結(jié)構(gòu)的層級信息包括所述每個語義子結(jié)構(gòu)的層級關(guān)系、所述每個語義子結(jié)構(gòu)的結(jié)構(gòu)類型和所述每個語義子結(jié)構(gòu)中詞的結(jié)構(gòu)成分中的至少一項。然后,則可以根據(jù)所述保留詞,獲得所述主干關(guān)鍵詞。
[0085]具體來說,在獲得保留詞之后,具體可以根據(jù)指定結(jié)構(gòu)例如,實體A—關(guān)系—實體B等,對所述保留詞的順序進(jìn)行調(diào)整,進(jìn)而,對所述保留詞進(jìn)行歸一化處理,以獲得所述主干關(guān)鍵詞。
[0086]仍然以搜索關(guān)鍵詞“幫查一下配國語的韓劇繼承者們”為例,其經(jīng)過語義分析處理之后,獲得如下三個語義子結(jié)構(gòu),即“繼承者們—配—國語”、“查—繼承者們”、以及“韓劇—繼承者們”,進(jìn)而,獲得兩兩語義子結(jié)構(gòu)之間的層級關(guān)系,即語義子結(jié)構(gòu)“查—繼承者們”為父親結(jié)構(gòu),語義子結(jié)構(gòu)“繼承者們—配—國語”和語義子結(jié)構(gòu)“韓劇—繼承者們”為孩子結(jié)構(gòu),這些層級關(guān)系共同組成了搜索關(guān)鍵詞的結(jié)構(gòu)圖譜。
[0087]針對父親結(jié)構(gòu)“查—繼承者們”,關(guān)系結(jié)構(gòu)成分和賓語位置的實體結(jié)構(gòu)成分都是重要的,需要保留,但這里的關(guān)系結(jié)構(gòu)成分是口語化詞條,可以進(jìn)行刪除處理;
[0088]針對孩子結(jié)構(gòu)“韓劇—繼承者們”,判斷出“韓劇”是“繼承者們”的上位詞,同時“繼承者們”是單義項數(shù)據(jù),因此,這里“韓劇”為非重要詞,僅需保留“繼承者們”。
[0089]針對孩子結(jié)構(gòu)“繼承者們—配—國語”,關(guān)系結(jié)構(gòu)成分、主語位置的實體結(jié)構(gòu)成分和賓語位置的實體結(jié)構(gòu)成分都是重要的,需要保留。
[0090]最終,保留詞則為“配國語繼承者們”。
[0091]在獲得保留詞“配國語繼承者們”之后,接著,則可以根據(jù)指定結(jié)構(gòu)即實體A—關(guān)系—實體B等,對保留詞“配國語繼承者們”的順序進(jìn)行調(diào)整,得到“繼承者們配國語”。然后,對調(diào)整順序之后的保留詞“繼承者們配國語”中的“配國語”進(jìn)行歸一化處理,獲得“國語版”這個歸一化結(jié)果,以獲得主干關(guān)鍵詞“繼承者們國語版”。
[0092]本實施例中,通過對所獲取的搜索關(guān)鍵詞進(jìn)行語義分析處理,以獲得至少一個語義子結(jié)構(gòu),進(jìn)而根據(jù)所述至少一個語義子結(jié)構(gòu),獲得主干關(guān)鍵詞,使得能夠利用所述主干關(guān)鍵詞,執(zhí)行搜索操作,由于不再完全依賴搜索關(guān)鍵詞執(zhí)行搜索操作,而是利用基于搜索關(guān)鍵詞所提取的主干關(guān)鍵詞執(zhí)行搜索操作,使得搜索結(jié)果基本滿足用戶的真正意圖,因此,能夠避免現(xiàn)有技術(shù)中由于用戶通過應(yīng)用反復(fù)進(jìn)行搜索而導(dǎo)致的增加應(yīng)用與搜索引擎之間的數(shù)據(jù)交互的問題,從而降低了搜索引擎的處理負(fù)擔(dān)。
[0093]另外,采用本發(fā)明所提供的技術(shù)方案,由于不再完全依賴搜索關(guān)鍵詞執(zhí)行搜索操作,而是利用基于搜索關(guān)鍵詞所提取的主干關(guān)鍵詞執(zhí)行搜索操作,使得搜索結(jié)果基本滿足用戶的真正意圖,從而提高了搜索結(jié)果的有效性。
[0094]另外,采用本發(fā)明所提供的技術(shù)方案,由于不再完全依賴搜索關(guān)鍵詞執(zhí)行搜索操作,而是利用基于搜索關(guān)鍵詞所提取的主干關(guān)鍵詞執(zhí)行搜索操作,使得搜索結(jié)果基本滿足用戶的真正意圖,從而提高了搜索的效率。
[0095]另外,采用本發(fā)明所提供的技術(shù)方案,能夠有效地提高用戶的體驗。
[0096]需要說明的是,對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動作順序的限制,因為依據(jù)本發(fā)明,某些步驟可以采用其他順序或者同時進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定是本發(fā)明所必須的。
[0097]在上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關(guān)描述。
[0098]圖2為本發(fā)明另一實施例提供的搜索裝置的結(jié)構(gòu)示意圖,如圖2所示。本實施例的搜索裝置可以包括獲取單元21、語義單元22、提取單元23和搜索單元24。其中,獲取單元21,用于獲取搜索關(guān)鍵詞;語義單元22,用于對所述搜索關(guān)鍵詞進(jìn)行語義分析處理,以獲得至少一個語義子結(jié)構(gòu);提取單元23,用于根據(jù)所述至少一個語義子結(jié)構(gòu),獲得主干關(guān)鍵詞;搜索單元24,用于利用所述主干關(guān)鍵詞,執(zhí)行搜索操作。
[0099]需要說明的是,本實施例所提供的搜索裝置的部分或全部可以為位于本地終端的應(yīng)用,或者還可以為設(shè)置在位于本地終端的應(yīng)用中的插件或軟件開發(fā)工具包(SoftwareDevelopment Kit,SDK)等功能單元,或者還可以為位于網(wǎng)絡(luò)側(cè)服務(wù)器中的搜索引擎,或者還可以為位于網(wǎng)絡(luò)側(cè)的分布式系統(tǒng),本實施例對此不進(jìn)行特別限定。
[0100]可以理解的是,所述應(yīng)用可以是安裝在終端上的本地程序(nativeApp),或者還可以是終端上的瀏覽器的一個網(wǎng)頁程序(webApp),本實施例對此不進(jìn)行特別限定。
[0101]可選地,在本實施例的一個可能的實現(xiàn)方式中,所述語義單元22,具體可以用于利用語義分析技術(shù),對所述搜索關(guān)鍵詞進(jìn)行語義分析處理;以及對經(jīng)過語義分析處理之后的搜索關(guān)鍵詞進(jìn)行內(nèi)容提取,以獲得所述至少一個語義子結(jié)構(gòu)。
[0102]進(jìn)一步可選地,所述語義單元22,還可以進(jìn)一步用于對所獲得的所述至少一個語義子結(jié)構(gòu)進(jìn)行合并處理,以獲得合并之后的所述至少一個語義子結(jié)構(gòu)。
[0103]可選地,在本實施例的一個可能的實現(xiàn)方式中,所述提取單元23,具體可以用于根據(jù)所述至少一個語義子結(jié)構(gòu)中兩兩語義子結(jié)構(gòu)中相同的詞,以及該詞在對應(yīng)的語義子結(jié)構(gòu)中的結(jié)構(gòu)成分,獲得兩兩語義子結(jié)構(gòu)之間的層級關(guān)系;根據(jù)所述兩兩語義子結(jié)構(gòu)之間的層級關(guān)系,建立所述搜索關(guān)鍵詞的層級結(jié)構(gòu);以及根據(jù)所述至少一個語義子結(jié)構(gòu)的層級結(jié)構(gòu),獲得所述主干關(guān)鍵詞。
[0104]在一個具體的實現(xiàn)過程中,所述提取單元23,具體可以用于根據(jù)所述至少一個語義子結(jié)構(gòu)的層級結(jié)構(gòu)中每個語義子結(jié)構(gòu)的層級信息,對所述每個語義子結(jié)構(gòu)中的詞進(jìn)行保留處理或者刪除處理,以獲得保留詞;所述每個語義子結(jié)構(gòu)的層級信息包括所述每個語義子結(jié)構(gòu)的層級關(guān)系、所述每個語義子結(jié)構(gòu)的結(jié)構(gòu)類型和所述每個語義子結(jié)構(gòu)中詞的結(jié)構(gòu)成分中的至少一項;以及根據(jù)所述保留詞,獲得所述主干關(guān)鍵詞。
[0105]具體來說,所述提取單元23,具體可以用于根據(jù)指定結(jié)構(gòu),對所述保留詞的順序進(jìn)行調(diào)整;以及對所述保留詞進(jìn)行歸一化處理,以獲得所述主干關(guān)鍵詞。
[0106]需要說明的是,圖1對應(yīng)的實施例中方法,可以由本實施例提供的搜索裝置實現(xiàn)。詳細(xì)描述可以參見圖1對應(yīng)的實施例中的相關(guān)內(nèi)容,此處不再贅述。
[0107]本實施例中,通過語義單元對獲取單元所獲取的搜索關(guān)鍵詞進(jìn)行語義分析處理,以獲得至少一個語義子結(jié)構(gòu),進(jìn)而由提取單元根據(jù)所述至少一個語義子結(jié)構(gòu),獲得主干關(guān)鍵詞,使得搜索單元能夠利用所述主干關(guān)鍵詞,執(zhí)行搜索操作,由于不再完全依賴搜索關(guān)鍵詞執(zhí)行搜索操作,而是利用基于搜索關(guān)鍵詞所提取的主干關(guān)鍵詞執(zhí)行搜索操作,使得搜索結(jié)果基本滿足用戶的真正意圖,因此,能夠避免現(xiàn)有技術(shù)中由于用戶通過應(yīng)用反復(fù)進(jìn)行搜索而導(dǎo)致的增加應(yīng)用與搜索引擎之間的數(shù)據(jù)交互的問題,從而降低了搜索引擎的處理負(fù)擔(dān)。
[0108]另外,采用本發(fā)明所提供的技術(shù)方案,由于不再完全依賴搜索關(guān)鍵詞執(zhí)行搜索操作,而是利用基于搜索關(guān)鍵詞所提取的主干關(guān)鍵詞執(zhí)行搜索操作,使得搜索結(jié)果基本滿足用戶的真正意圖,從而提高了搜索結(jié)果的有效性。
[0109]另外,采用本發(fā)明所提供的技術(shù)方案,由于不再完全依賴搜索關(guān)鍵詞執(zhí)行搜索操作,而是利用基于搜索關(guān)鍵詞所提取的主干關(guān)鍵詞執(zhí)行搜索操作,使得搜索結(jié)果基本滿足用戶的真正意圖,從而提高了搜索的效率。
[0110]另外,采用本發(fā)明所提供的技術(shù)方案,能夠有效地提高用戶的體驗。
[0111]所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng),裝置和單元的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。
[0112]在本發(fā)明所提供的幾個實施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如,多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
[0113]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上。可以根據(jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。
[0114]另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。
[0115]上述以軟件功能單元的形式實現(xiàn)的集成的單元,可以存儲在一個計算機(jī)可讀取存儲介質(zhì)中。上述軟件功能單元存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機(jī)裝置(可以是個人計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)裝置等)或處理器(processor)執(zhí)行本發(fā)明各個實施例所述方法的部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(Read-Only Memory,ROM)、隨機(jī)存取存儲器(Random Access Memory,RAM)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
[0116]最后應(yīng)說明的是:以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精神和范圍。
【主權(quán)項】
1.一種搜索方法,其特征在于,包括: 獲取搜索關(guān)鍵詞; 對所述搜索關(guān)鍵詞進(jìn)行語義分析處理,以獲得至少一個語義子結(jié)構(gòu); 根據(jù)所述至少一個語義子結(jié)構(gòu),獲得主干關(guān)鍵詞; 利用所述主干關(guān)鍵詞,執(zhí)行搜索操作。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述搜索關(guān)鍵詞進(jìn)行語義分析處理,以獲得至少一個語義子結(jié)構(gòu),包括: 利用語義分析技術(shù),對所述搜索關(guān)鍵詞進(jìn)行語義分析處理; 對經(jīng)過語義分析處理之后的搜索關(guān)鍵詞進(jìn)行內(nèi)容提取,以獲得所述至少一個語義子結(jié)構(gòu)。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對所述搜索關(guān)鍵詞進(jìn)行語義分析處理,以獲得至少一個語義子結(jié)構(gòu),還包括: 對所獲得的所述至少一個語義子結(jié)構(gòu)進(jìn)行合并處理,以獲得合并之后的所述至少一個語義子結(jié)構(gòu)。4.根據(jù)權(quán)利要求1?3任一權(quán)利要求所述的方法,其特征在于,所述根據(jù)所述至少一個語義子結(jié)構(gòu),獲得主干關(guān)鍵詞,包括: 根據(jù)所述至少一個語義子結(jié)構(gòu)中兩兩語義子結(jié)構(gòu)中相同的詞,以及該詞在對應(yīng)的語義子結(jié)構(gòu)中的結(jié)構(gòu)成分,獲得兩兩語義子結(jié)構(gòu)之間的層級關(guān)系; 根據(jù)所述兩兩語義子結(jié)構(gòu)之間的層級關(guān)系,建立所述搜索關(guān)鍵詞的層級結(jié)構(gòu); 根據(jù)所述至少一個語義子結(jié)構(gòu)的層級結(jié)構(gòu),獲得所述主干關(guān)鍵詞。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述至少一個語義子結(jié)構(gòu)的層級結(jié)構(gòu),獲得所述主干關(guān)鍵詞,包括: 根據(jù)所述至少一個語義子結(jié)構(gòu)的層級結(jié)構(gòu)中每個語義子結(jié)構(gòu)的層級信息,對所述每個語義子結(jié)構(gòu)中的詞進(jìn)行保留處理或者刪除處理,以獲得保留詞;所述每個語義子結(jié)構(gòu)的層級信息包括所述每個語義子結(jié)構(gòu)的層級關(guān)系、所述每個語義子結(jié)構(gòu)的結(jié)構(gòu)類型和所述每個語義子結(jié)構(gòu)中詞的結(jié)構(gòu)成分中的至少一項; 根據(jù)所述保留詞,獲得所述主干關(guān)鍵詞。6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述保留詞,獲得所述主干關(guān)鍵詞,包括: 根據(jù)指定結(jié)構(gòu),對所述保留詞的順序進(jìn)行調(diào)整; 對所述保留詞進(jìn)行歸一化處理,以獲得所述主干關(guān)鍵詞。7.一種搜索裝置,其特征在于,包括: 獲取單元,用于獲取搜索關(guān)鍵詞; 語義單元,用于對所述搜索關(guān)鍵詞進(jìn)行語義分析處理,以獲得至少一個語義子結(jié)構(gòu); 提取單元,用于根據(jù)所述至少一個語義子結(jié)構(gòu),獲得主干關(guān)鍵詞; 搜索單元,用于利用所述主干關(guān)鍵詞,執(zhí)行搜索操作。8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述語義單元,具體用于 利用語義分析技術(shù),對所述搜索關(guān)鍵詞進(jìn)行語義分析處理;以及 對經(jīng)過語義分析處理之后的搜索關(guān)鍵詞進(jìn)行內(nèi)容提取,以獲得所述至少一個語義子結(jié)構(gòu)。9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述語義單元,還用于 對所獲得的所述至少一個語義子結(jié)構(gòu)進(jìn)行合并處理,以獲得合并之后的所述至少一個語義子結(jié)構(gòu)。10.根據(jù)權(quán)利要求7?9任一權(quán)利要求所述的裝置,其特征在于,所述提取單元,具體用于 根據(jù)所述至少一個語義子結(jié)構(gòu)中兩兩語義子結(jié)構(gòu)中相同的詞,以及該詞在對應(yīng)的語義子結(jié)構(gòu)中的結(jié)構(gòu)成分,獲得兩兩語義子結(jié)構(gòu)之間的層級關(guān)系; 根據(jù)所述兩兩語義子結(jié)構(gòu)之間的層級關(guān)系,建立所述搜索關(guān)鍵詞的層級結(jié)構(gòu);以及 根據(jù)所述至少一個語義子結(jié)構(gòu)的層級結(jié)構(gòu),獲得所述主干關(guān)鍵詞。11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述提取單元,具體用于 根據(jù)所述至少一個語義子結(jié)構(gòu)的層級結(jié)構(gòu)中每個語義子結(jié)構(gòu)的層級信息,對所述每個語義子結(jié)構(gòu)中的詞進(jìn)行保留處理或者刪除處理,以獲得保留詞;所述每個語義子結(jié)構(gòu)的層級信息包括所述每個語義子結(jié)構(gòu)的層級關(guān)系、所述每個語義子結(jié)構(gòu)的結(jié)構(gòu)類型和所述每個語義子結(jié)構(gòu)中詞的結(jié)構(gòu)成分中的至少一項;以及根據(jù)所述保留詞,獲得所述主干關(guān)鍵詞。12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述提取單元,具體用于 根據(jù)指定結(jié)構(gòu),對所述保留詞的順序進(jìn)行調(diào)整;以及 對所述保留詞進(jìn)行歸一化處理,以獲得所述主干關(guān)鍵詞。
【文檔編號】G06F17/30GK105843849SQ201610147611
【公開日】2016年8月10日
【申請日】2016年3月15日
【發(fā)明人】王麗杰, 劉占, 劉占一
【申請人】北京百度網(wǎng)訊科技有限公司