本發(fā)明屬于互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別涉及一種縱向搜索引擎的構(gòu)建方法及裝置。
背景技術(shù):
現(xiàn)有的網(wǎng)頁搜索引擎核心,如同谷歌公司使用的page-rank算法,其是先找到與搜索關(guān)鍵字相關(guān)的所有網(wǎng)頁,再對結(jié)果集進行排序,排序依據(jù)是網(wǎng)頁之間的引用。
然而,使用上述現(xiàn)有的搜索引擎,當用戶在搜索引擎中輸入若干關(guān)鍵字時,搜索引擎返回的結(jié)果列表是對網(wǎng)頁進行排序的結(jié)果。
這樣就使得用戶在具體的搜索過程中,是通過在結(jié)果列表中依次點擊網(wǎng)頁鏈接來完成搜索過程,具有搜索效率低的技術(shù)缺陷。
技術(shù)實現(xiàn)要素:
本發(fā)明提供一種縱向搜索引擎的構(gòu)建方法及裝置,用以解決現(xiàn)有技術(shù)中由于用戶具體的搜索過程,是通過在結(jié)果列表中依次點擊網(wǎng)頁鏈接來完成搜索過程,而導致的具有搜索效率低的技術(shù)缺陷。
依據(jù)本發(fā)明實施例的一個方面,本發(fā)明實施例提供了一種縱向搜索引擎的構(gòu)建方法,包括:
獲取用戶瀏覽網(wǎng)頁時的搜索數(shù)據(jù),所述搜索數(shù)據(jù)至少包括:若干個網(wǎng)頁鏈接組,每一個所述網(wǎng)頁鏈接組包括若干個網(wǎng)頁鏈接;
確定所述每一個所述網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的第一權(quán)重值;
將所述每一個所述網(wǎng)頁鏈接組中相同的網(wǎng)頁鏈接進行合并,以確定合并后的每一個所述網(wǎng)頁鏈接的第二權(quán)重值;
依據(jù)每一個所述網(wǎng)頁鏈接的所述第二權(quán)重值獲得每一組所述網(wǎng)頁連接組的第三權(quán)重值;
依據(jù)所述第三權(quán)重值將若干個所述網(wǎng)頁鏈接組從大到小進行排序。
進一步地,所述方法還包括:將排序后所述的若干個所述網(wǎng)頁鏈接組按照排序順序進行輸出。
進一步地,所述方法還包括:所述搜索數(shù)據(jù)還包括若干個關(guān)鍵詞組,每一個所述關(guān)鍵詞組對應每一個所述網(wǎng)頁鏈接組。
進一步地,所述方法還包括:所述若干個網(wǎng)頁鏈接組是三組,包括第一網(wǎng)頁鏈接組,第二網(wǎng)頁鏈接組,第三網(wǎng)頁鏈接組;
所述第一網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的個數(shù)是n1;
所述第二網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的個數(shù)是n2;
所述第三網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的個數(shù)是n3;
所述確定所述每一個所述網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的第一權(quán)重值包括:
對于所述第一網(wǎng)頁鏈接組中,每一個網(wǎng)頁鏈接的第一權(quán)重值是1/n1;
對于所述第二網(wǎng)頁鏈接組中,每一個網(wǎng)頁鏈接的第一權(quán)重值是1/n2;
對于所述第三網(wǎng)頁鏈接組中,每一個網(wǎng)頁鏈接的第一權(quán)重值是1/n3;
其中,所述n1、所述n2和所述n3均為正整數(shù)。
進一步地,所述方法還包括:所述將所述每一個所述網(wǎng)頁鏈接組中相同的網(wǎng)頁鏈接進行合并,以確定合并后的每一個所述網(wǎng)頁鏈接的第二權(quán)重值包括:
在所述若干個網(wǎng)頁鏈接中,將每一個相同的所述網(wǎng)頁鏈接在對應的網(wǎng)頁鏈接組中的第一權(quán)重值進行相加,作為合并后所述相同的所述網(wǎng)頁鏈接的第二權(quán)重值;
在所述若干個網(wǎng)頁鏈接中,將每一個不同的所述網(wǎng)頁鏈接在對應的網(wǎng)頁鏈接組中的第一權(quán)重,作為所述不同的所述網(wǎng)頁鏈接的第二權(quán)重。
進一步地,所述方法還包括:所述依據(jù)每一個所述網(wǎng)頁鏈接的所述第二權(quán)重值獲得每一組所述網(wǎng)頁連接組的第三權(quán)重值包括:
分別將每一個所述網(wǎng)頁鏈接組中所述若干個所述網(wǎng)頁鏈接的第二權(quán)重值相加,作為所述網(wǎng)頁鏈接組的第三權(quán)重值。
依據(jù)本發(fā)明實施例的又一個方面,本發(fā)明實施例還提供了一種縱向搜索引擎的構(gòu)建裝置,所述裝置包括:搜索數(shù)據(jù)獲取模塊,用于獲取用戶瀏覽網(wǎng)頁時的搜索數(shù)據(jù),所述搜索數(shù)據(jù)至少包括:若干個網(wǎng)頁鏈接組,每一個所述網(wǎng)頁鏈接組包括若干個網(wǎng)頁鏈接;第一權(quán)重值確定模塊,用于確定所述每一個所述網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的第一權(quán)重值;第二權(quán)重值確定模塊,用于將所述每一個所述網(wǎng)頁鏈接組中相同的網(wǎng)頁鏈接進行合并,以確定合并后的每一個所述網(wǎng)頁鏈接的第二權(quán)重值;第三權(quán)重值確定模塊,用于依據(jù)每一個所述網(wǎng)頁鏈接的所述第二權(quán)重值獲得每一組所述網(wǎng)頁連接組的第三權(quán)重值;排序模塊,依據(jù)所述第三權(quán)重值將若干個所述網(wǎng)頁鏈接組從大到小進行排序。
可選的,所述裝置還包括:輸出模塊,用于將排序后所述的若干個所述網(wǎng)頁鏈接組按照排序順序進行輸出。
本發(fā)明實施例中提供的一個或多個技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點:
本發(fā)明通過首先獲取用戶使用搜索引擎時的網(wǎng)頁鏈接搜索數(shù)據(jù),第一方面,計算出各個網(wǎng)頁鏈接的第一權(quán)重值,第二方面,合并相同網(wǎng)頁鏈接計算出相同網(wǎng)頁的第二權(quán)重值,第三方面,依據(jù)相同網(wǎng)頁的第二權(quán)重值計算出網(wǎng)頁鏈接組的第三權(quán)重值;第四方面,依據(jù)網(wǎng)頁鏈接組的第三權(quán)重值對網(wǎng)頁鏈接組進行從大到小的排序。這樣就使得用戶在具體的搜索過程中,當輸入關(guān)鍵詞進行搜索時,反饋給用戶的結(jié)果列表是已經(jīng)進行了排列后的結(jié)果,即可以是與用戶輸入關(guān)鍵詞所對應的網(wǎng)頁鏈接組,此時的網(wǎng)頁鏈接組已經(jīng)是從大到小進行的排序。網(wǎng)頁鏈接組依據(jù)第三權(quán)重值進行排序的含義是:包含越多重要網(wǎng)頁鏈接的網(wǎng)頁鏈接組其重要性越高;包含在越多網(wǎng)頁鏈接組中的網(wǎng)頁鏈接其重要性越高。用戶根據(jù)反饋的結(jié)果,不需要依次點擊網(wǎng)頁鏈接來完成搜索過程,反饋的結(jié)果即是為用戶提供了經(jīng)驗信息參考,從而使用戶依據(jù)經(jīng)驗信息更快的完成搜索過程,提高了搜索效率,提升了用戶的搜索體驗效果。
上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明一實施例提供的一種縱向搜索引擎的構(gòu)建方法的流程示意圖;
圖2為本發(fā)明又一實施例提供的一種縱向搜索引擎的構(gòu)建裝置的結(jié)構(gòu)框圖;
圖3a為一種縱向搜索引擎的構(gòu)建方法中一次完整的搜索過程定義1的示意圖;
圖3b為一種縱向搜索引擎的構(gòu)建方法中一次完整的搜索過程定義2的示意圖;
圖4a為一種縱向搜索引擎的構(gòu)建方法的兩種不同搜索過程中搜索路徑定義1的示意圖;
圖4b為一種縱向搜索引擎的構(gòu)建方法的兩種不同搜索過程中搜索路徑定義2的示意圖;
圖5為一種縱向搜索引擎的構(gòu)建方法中用戶搜索的操作數(shù)據(jù)例子的示意圖。
具體實施方式
本發(fā)明實施例提供的一種縱向搜索引擎的構(gòu)建方法及裝置,用以解決現(xiàn)有技術(shù)中用戶具體的搜索過程,是通過在結(jié)果列表中依次點擊網(wǎng)頁鏈接來完成搜索過程,導致具有搜索效率低的技術(shù)問題,達到了提高搜索效率,提升了用戶的搜索體驗的技術(shù)效果。
本發(fā)明實施例中的技術(shù)方案,總體思路如下:
一種縱向搜索引擎的構(gòu)建方法,所述方法包括:
獲取用戶瀏覽網(wǎng)頁時的搜索數(shù)據(jù),所述搜索數(shù)據(jù)至少包括:若干個網(wǎng)頁鏈接組,每一個所述網(wǎng)頁鏈接組包括若干個網(wǎng)頁鏈接;
確定所述每一個所述網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的第一權(quán)重值;
將所述每一個所述網(wǎng)頁鏈接組中相同的網(wǎng)頁鏈接進行合并,以確定合并后的每一個所述網(wǎng)頁鏈接的第二權(quán)重值;
依據(jù)每一個所述網(wǎng)頁鏈接的所述第二權(quán)重值獲得每一組所述網(wǎng)頁連接組的第三權(quán)重值;
依據(jù)第三權(quán)重值將若干個所述網(wǎng)頁鏈接組從大到小進行排序。
本發(fā)明實施例通過獲取用戶使用搜索引擎時的網(wǎng)頁鏈接搜索數(shù)據(jù),第一計算出各個網(wǎng)頁鏈接的第一權(quán)重值,第二合并相同網(wǎng)頁鏈接計算出相同網(wǎng)頁鏈接的第二權(quán)重值,第三依據(jù)相同網(wǎng)頁鏈接的第二權(quán)重值計算出網(wǎng)頁鏈接組的第三權(quán)重值;第四依據(jù)網(wǎng)頁鏈接組的第三權(quán)重值對網(wǎng)頁鏈接組進行從大到小的排序。用戶在具體的搜索過程中,當輸入關(guān)鍵詞進行搜索時,反饋給用戶的結(jié)果列表是已經(jīng)進行了排列后的結(jié)果,即可以是與用戶輸入關(guān)鍵詞所對應的網(wǎng)頁鏈接組,此時的網(wǎng)頁鏈接組已經(jīng)過了從大到小的排序。網(wǎng)頁鏈接組依據(jù)第三權(quán)重值進行排序的含義是:包含越多重要網(wǎng)頁鏈接的網(wǎng)頁鏈接組其重要性越高;包含在越多網(wǎng)頁鏈接組中的網(wǎng)頁鏈接其重要性越高。用戶根據(jù)反饋的結(jié)果,不需要依次點擊網(wǎng)頁鏈接來完成搜索過程,反饋的結(jié)果即是為用戶提供了經(jīng)驗信息參考,從而使用戶依據(jù)經(jīng)驗信息更快的完成搜索過程,提高了搜索效率,提升了用戶的搜索體驗效果的技術(shù)效果。
為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
本文中術(shù)語“和/或”,僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,a和/或b,可以表示:單獨存在a,同時存在a和b,單獨存在b這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對象是一種“或”的關(guān)系。
本發(fā)明實施例提供了一種縱向搜索引擎的構(gòu)建方法,所述方法可以應用于互聯(lián)網(wǎng)技術(shù)領(lǐng)域,請參閱圖1,所述方法包括但不限于如下步驟:
步驟s101:獲取用戶瀏覽網(wǎng)頁時的搜索數(shù)據(jù),所述搜索數(shù)據(jù)至少包括:若干個網(wǎng)頁鏈接組,每一個所述網(wǎng)頁鏈接組包括若干個網(wǎng)頁鏈接;
進一步地,所述搜索數(shù)據(jù)還包括若干個關(guān)鍵詞組,每一個所述關(guān)鍵詞組對應每一個所述網(wǎng)頁鏈接組。
具體而言,網(wǎng)頁鏈接組是包括了在一次完整的搜索過程中用戶依次點擊的網(wǎng)頁鏈接,該網(wǎng)頁鏈接組是在用戶輸入關(guān)鍵詞搜索時而得到的。一個網(wǎng)頁鏈接組即是一次完整的搜索過程中所點擊的所有網(wǎng)頁鏈接。用戶輸入關(guān)鍵詞搜索,可以是在谷歌首頁中輸入若干關(guān)鍵字或者在百度首頁中輸入若干關(guān)鍵字,用戶是通過在搜索引擎返回的結(jié)果列表中依次點擊網(wǎng)頁鏈接。
獲取用戶瀏覽網(wǎng)頁時的搜索數(shù)據(jù),搜索數(shù)據(jù)還包括若干個關(guān)鍵詞組,每一個關(guān)鍵詞組對應每一個網(wǎng)頁鏈接組。該數(shù)據(jù)可以由搜索引擎獲取,例如在百度搜索網(wǎng)站的服務器中記錄每次搜索過程(從用戶使用瀏覽器訪問搜索引擎開始,直至用戶關(guān)閉瀏覽器為止,所有搜索關(guān)鍵字提交和網(wǎng)頁跳轉(zhuǎn)操作的過程可以稱為一次搜索過程)中用戶的操作數(shù)據(jù),包括輸入的關(guān)鍵字和/或點擊的網(wǎng)頁鏈接。這些數(shù)據(jù)以日志文件的形式存儲在百度搜索引擎服務器中,實際的日志文件包含的信息可能更多,但獲取用戶瀏覽網(wǎng)頁時的搜索數(shù)據(jù)只選取其中需要信息即可,數(shù)據(jù)的抽取過程可以利用etl工具完成。數(shù)據(jù)抽取完成后,獲取用戶瀏覽網(wǎng)頁時的搜索數(shù)據(jù)可以都是鍵值對(搜索關(guān)鍵詞和搜索鏈接)的形式,如<“健康”,(“網(wǎng)易健康”,“健康報網(wǎng)”)>,此時,關(guān)鍵詞組為:“健康”,網(wǎng)頁鏈接組是:“網(wǎng)易健康”,“健康報網(wǎng)”。每一個關(guān)鍵詞組對應每一個網(wǎng)頁鏈接組是指:作為一個關(guān)鍵詞組“健康”,在搜索引擎中輸入“健康”后,用戶在搜索引擎返回的結(jié)果里依次點擊:“網(wǎng)易健康”,“健康報網(wǎng)”兩個網(wǎng)頁鏈接;此時“網(wǎng)易健康”,“健康報網(wǎng)”即是關(guān)鍵詞組“健康”所對應的一個網(wǎng)頁鏈接組。
請參閱圖3a和圖3b,一次完整的搜索過程有兩種定義,圖3a和圖3b分別為兩種定義下的搜索過程圖示。
定義1:搜索過程是指用戶對搜索引擎服務器提交一次搜索關(guān)鍵詞組,并點擊網(wǎng)頁鏈接進行跳轉(zhuǎn)的整個過程。當用戶再次提交新的搜索關(guān)鍵詞組時,新的搜索過程開始。此時,網(wǎng)頁鏈接組是指:在一次完整的搜索過程中,用戶依次點擊的所有網(wǎng)頁鏈接。
如圖3a所示,用戶提交一次搜索關(guān)鍵詞組就開始一次搜索過程。需注意,圖3a中的網(wǎng)頁跳轉(zhuǎn)是指用戶在搜索引擎返回的結(jié)果列表中點擊網(wǎng)頁鏈接進行跳轉(zhuǎn)的操作。第1種搜索過程代表用戶準確給出搜索關(guān)鍵詞組,通過一次提交就找到所需網(wǎng)頁鏈接。
例如:用戶輸入“戶外運動裝備”作為關(guān)鍵詞組進行搜索,在搜索引擎服務器返回的結(jié)果列表中依次點擊了2個網(wǎng)頁鏈接:“中國戶外裝備”、“山脈戶外”(為描述的簡便,在說明書中省略具體的鏈接地址,使用鏈接標題代表鏈接本身,比如:“中國戶外裝備”為鏈接標題,它所對應的具體的鏈接地址是:http://www.papbout.com/);然后用戶再次輸入“電影2016”作為新的關(guān)鍵詞組提交搜索,則用戶輸入關(guān)鍵詞組“戶外運動裝備”以及點擊2個網(wǎng)頁鏈接的過程被定義為一次完整的搜索過程。同時,用戶點擊的這2個網(wǎng)頁鏈接都是針對“戶外運動裝備”這一組關(guān)鍵詞組的;此時用戶依次點擊的2個網(wǎng)頁鏈接:“中國戶外裝備”、“山脈戶外”即是一個網(wǎng)頁鏈接組。
定義2:搜索過程是指用戶使用瀏覽器訪問搜索引擎開始,直至用戶關(guān)閉瀏覽器為止,所有搜索關(guān)鍵詞組提交和網(wǎng)頁跳轉(zhuǎn)操作的過程。此時,網(wǎng)頁鏈接組是指:在一次完整的搜索過程中,用戶依次點擊的所有網(wǎng)頁鏈接。
如圖3b所示,用戶從打開瀏覽器開始,直到關(guān)閉瀏覽器為止,對搜索引擎服務器進行的所有搜索關(guān)鍵詞組提交和相應的網(wǎng)頁跳轉(zhuǎn)請求過程為搜索過程。第2種搜索過程代表用戶經(jīng)過多次修改搜索關(guān)鍵詞組才找到所需信息。
例如:用戶使用瀏覽器訪問搜索引擎時,第一次輸入的關(guān)鍵詞組是“戶外運動”,搜索引擎服務器返回結(jié)果列表,此時依次點擊了“新浪運動”、“鳳凰運動”兩個網(wǎng)頁鏈接;用戶第二次更新了關(guān)鍵詞組,此時輸入的關(guān)鍵詞組是“健康”,對應的依次點擊了“網(wǎng)易健康”,“健康報網(wǎng)”兩個網(wǎng)頁鏈接,然后用戶關(guān)閉瀏覽器。則用戶輸入關(guān)鍵詞組“戶外運動”和所對應點擊的2個網(wǎng)頁鏈接,以及輸入關(guān)鍵詞組“健康”和所對應點擊的2個網(wǎng)頁鏈接的過程被定義為一次完整的搜索過程。同時在用戶輸入關(guān)鍵詞組“戶外運動”,所對應點擊的2個網(wǎng)頁鏈接:“新浪運動”、“鳳凰運動”;用戶輸入關(guān)鍵詞組“健康”,所對應點擊的2個網(wǎng)頁鏈接:“網(wǎng)易健康”、“健康報網(wǎng)”的過程中,“新浪運動”、“鳳凰運動”、“網(wǎng)易健康”、“健康報網(wǎng)”四個網(wǎng)頁鏈接即是一個網(wǎng)頁鏈接組。
上述的兩種定義標準可以是二選一的關(guān)系,對于輸入數(shù)據(jù)的集合來說,要么使用第一種標準來處理,要么使用第二種。可以由搜索引擎的實現(xiàn)者來決定。
請參閱圖4a和圖4b,一條搜索路徑是指用戶在一次搜索過程中進行的網(wǎng)頁跳轉(zhuǎn)(點擊的所有網(wǎng)頁鏈接)的序列。兩種搜索路徑分別對應了以上2種搜索過程,如圖4a和圖4b分別是兩種不同搜索過程中的搜索路徑。
圖4a對應以上定義1的搜索過程,用戶提交搜索關(guān)鍵詞組后,進行網(wǎng)頁跳轉(zhuǎn)操作,即在搜索引擎返回的結(jié)果列表中點擊了若干網(wǎng)頁鏈接,這些網(wǎng)頁鏈接的序列即是搜索路徑。此時,一個網(wǎng)頁鏈接組是指:在一條搜索路徑中,所包含的所有網(wǎng)頁鏈接。
圖4b對應以上定義2的搜索過程,用戶在多次提交搜索關(guān)鍵詞組和多次網(wǎng)頁跳轉(zhuǎn)操作中,所有網(wǎng)頁鏈接的序列即是搜索路徑。此時,一個網(wǎng)頁鏈接組是指:在一條搜索路徑中,所包含的所有網(wǎng)頁鏈接。
若干個網(wǎng)頁鏈接組中的“若干”是正整數(shù),即若干個網(wǎng)頁鏈接組可以是一組、二組、三組、四組等,當搜索數(shù)據(jù)包括三個網(wǎng)頁鏈接組時,此時就有第一網(wǎng)頁鏈接組,第二網(wǎng)頁鏈接組,第三網(wǎng)頁鏈接組。搜索數(shù)據(jù)至少包括若干個網(wǎng)頁鏈接組是指,搜索數(shù)據(jù)還可以包括:與每個網(wǎng)頁鏈接組所對應的關(guān)鍵詞組等信息。如上例,當包括與每個網(wǎng)頁鏈接組所對應的關(guān)鍵詞組時,搜索數(shù)據(jù)如同<“健康”,(“網(wǎng)易健康”,“健康報網(wǎng)”)>,即“網(wǎng)易健康”和“健康報網(wǎng)”構(gòu)成的一個網(wǎng)頁鏈接組所對應的關(guān)鍵詞組為“健康”。
搜索數(shù)據(jù)至少包括若干個網(wǎng)頁鏈接組是指,搜索數(shù)據(jù)還可以包括搜索關(guān)鍵詞組。根據(jù)上述定義:在一條搜索路徑中,所包含的所有網(wǎng)頁鏈接即是:網(wǎng)頁鏈接組。
其中,搜索關(guān)鍵詞組和搜索路徑網(wǎng)頁鏈接組的鍵值對是<k,sp>,k為關(guān)鍵詞組,sp為關(guān)鍵詞組對應的網(wǎng)頁鏈接組,即每1條搜索路徑對應1個輸入鍵值對。
請參閱圖5,圖5為用戶搜索的操作數(shù)據(jù),用戶在打開瀏覽器后,向搜索引擎服務器提交了2次搜索關(guān)鍵詞組,第1次是“健康”,第2次是“運動”和“指導”。對應的,第1次提交后依次點擊了“網(wǎng)易健康”和“健康報網(wǎng)”2個網(wǎng)頁鏈接,第2次則是“健康運動指導”。然后,用戶關(guān)閉瀏覽器。
根據(jù)上述第1種搜索過程的定義,如圖5例子對應的輸入數(shù)據(jù)為2條,依次是<{“健康”},{“網(wǎng)易健康”,“健康報網(wǎng)”}>和<{“運動指導”},{“健康運動指導”}>。其中,<{“健康”},{“網(wǎng)易健康”,“健康報網(wǎng)”}>是1個輸入鍵值對,其中“網(wǎng)易健康”,“健康報網(wǎng)”為一個網(wǎng)頁鏈接組。
根據(jù)上述第2種搜索過程的定義,如圖5例子對應的輸入數(shù)據(jù)為1條,是<{“健康”,“運動指導”},{“網(wǎng)易健康”,“健康報網(wǎng)”,“健康運動指導”}>。其中,{“網(wǎng)易健康”,“健康報網(wǎng)”,“健康運動指導”}為一個網(wǎng)頁鏈接組。
步驟s102:確定所述每一個所述網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的第一權(quán)重值;
進一步的,所述若干個網(wǎng)頁鏈接組是三組,包括第一網(wǎng)頁鏈接組,第二網(wǎng)頁鏈接組,第三網(wǎng)頁鏈接組;
所述第一網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的個數(shù)是n1;
所述第二網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的個數(shù)是n2;
所述第三網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的個數(shù)是n3;
所述確定所述每一個所述網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的第一權(quán)重值包括:
對于所述第一網(wǎng)頁鏈接組中,每一個網(wǎng)頁鏈接的第一權(quán)重值是1/n1;
對于所述第二網(wǎng)頁鏈接組中,每一個網(wǎng)頁鏈接的第一權(quán)重值是1/n2;
對于所述第三網(wǎng)頁鏈接組中,每一個網(wǎng)頁鏈接的第一權(quán)重值是1/n3;
其中,所述n1、所述n2和所述n3均為正整數(shù)。
具體而言,若干個網(wǎng)頁鏈接組可以是:二個、三個、四個、五個等網(wǎng)頁鏈接組。當時若干個網(wǎng)頁鏈接組是三組時,這三組可以分別是:第一網(wǎng)頁鏈接組,第二網(wǎng)頁鏈接組,第三網(wǎng)頁鏈接組;其中,第一網(wǎng)頁鏈接組中若干個網(wǎng)頁鏈接的個數(shù)是n1;第二網(wǎng)頁鏈接組中若干個網(wǎng)頁鏈接的個數(shù)是n2;第三網(wǎng)頁鏈接組中若干個網(wǎng)頁鏈接的個數(shù)是n3;n1、n2和n3均為正整數(shù);每個網(wǎng)頁鏈接組的初始化權(quán)重值都可以設定為1。例如(在步驟s103中也會引用此列):第一網(wǎng)頁鏈接組是(“網(wǎng)易健康”,“健康報網(wǎng)”),所對應的關(guān)鍵詞組是:“健康”,第一網(wǎng)頁鏈接組中包括2個網(wǎng)頁鏈接,分別是“網(wǎng)易健康”,“健康報網(wǎng)”;第二網(wǎng)頁鏈接組是(“網(wǎng)易健康”,“搜狐健康”,“百度健康”),所對應的關(guān)鍵詞組是:“健康”,第二網(wǎng)頁鏈接組中包括3網(wǎng)頁鏈接,分別是“網(wǎng)易健康”,“搜狐健康”,“百度健康”;第三網(wǎng)頁鏈接組是(“網(wǎng)易健康”,“搜狐健康”,“鳳凰健康”),所對應的關(guān)鍵詞組是:“健康”,第三網(wǎng)頁鏈接組中包括3個網(wǎng)頁鏈接,分別是“網(wǎng)易健康”,“搜狐健康”,“鳳凰健康”;
所述確定所述每一個所述網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的第一權(quán)重值包括:對于所述第一網(wǎng)頁鏈接組中,每一個網(wǎng)頁鏈接的第一權(quán)重值是1/n1;
對于所述第二網(wǎng)頁鏈接組中,每一個網(wǎng)頁鏈接的第一權(quán)重值是1/n2;對于所述第三網(wǎng)頁鏈接組中,每一個網(wǎng)頁鏈接的第一權(quán)重值是1/n3;如上述例子:第一網(wǎng)頁鏈接組的n1=2,由于每個網(wǎng)頁鏈接組的初始化權(quán)重值都可以設定為1,第一網(wǎng)頁鏈接組中網(wǎng)頁鏈接“網(wǎng)易健康”的第一權(quán)重值是1/2;第二網(wǎng)頁鏈接組的n2=3,第二網(wǎng)頁鏈接組中的“搜狐健康”的第一權(quán)重值是1/3。
可以使用谷歌公司的mapreduce計算框架來實現(xiàn)本實施例的步驟,mapreduce計算框架是一個高度并行化的計算框架。即是同時使用多臺計算機去處理同一個問題,其中每臺計算機分到整個問題的一小部分,如果有上千臺機器同時計算的話,整個過程就相當于被分成上千個部分,會加快計算過程。當一個并行框架允許同時使用大量計算機進行并行計算的時候,一般習慣稱為高度并行化的。mapreduce計算框架將整個問題的計算過程分為map階段和reduce階段(以下會根據(jù)map階段和reduce階段詳細介紹實現(xiàn)本發(fā)明的各步驟,例如:map1階段即是map的第一階段,reduce2階段即是reduce的第二階段),其中map階段的輸出為reduce階段的輸入,同時也可以包含多個map階段和多個reduce階段。hadoop是實現(xiàn)了mapreduce計算框架的開源軟件,本發(fā)明實施例中的步驟s102、s103、s104、s105都可以運用mapreduce計算框架,直接采用hadoop軟件來實現(xiàn)。
例如:如下所示的算法偽代碼,在map階段(完成步驟s102),即是對輸入數(shù)據(jù)集合中的每條搜索數(shù)據(jù),計算各個網(wǎng)頁鏈接組中所有網(wǎng)頁鏈接的第一權(quán)重值。本階段接收輸入的數(shù)據(jù)集合是{<ki,spi>},其中<ki,spi>為所輸入數(shù)據(jù)集合中的第i條輸入數(shù)據(jù)(i為正整數(shù)),ki為關(guān)鍵詞組,spi為網(wǎng)頁鏈接組,比如:第1條輸入數(shù)據(jù)的關(guān)鍵詞組是k1,sp1是所對應的網(wǎng)頁鏈接組。算法中pj(j為正整數(shù))是指網(wǎng)頁鏈接,例如:p1是第一個網(wǎng)頁鏈接,在算法的第2至4行對搜索路徑中(即網(wǎng)頁鏈接組中)包含的每個網(wǎng)頁鏈接pj,計算網(wǎng)頁鏈接的第一權(quán)重值w,函數(shù)length(spi)用于取得spi中包含的網(wǎng)頁鏈接個數(shù)。如果一條搜索路徑包含n個網(wǎng)頁鏈接(n為正整數(shù)),則其中每個網(wǎng)頁鏈接的初始權(quán)重值為1/n。本階段的輸出的是一個鍵值對的集合,其中鍵值對數(shù)據(jù)包含了網(wǎng)頁連接的第一權(quán)重值,形式類似于<“健康”|“網(wǎng)易健康”,0.5>,鍵為網(wǎng)頁鏈接,值為相應的網(wǎng)頁鏈接第一權(quán)重值;其中,假設0.5是“網(wǎng)頁健康”的第一權(quán)重值。
mapphase1
第1行:input:{<ki,spi>}
第2行:forallpjinspido
第3行:
第4行:output{<ki|pj,w>}
第5行:endfor
reducephase1
第6行:input:{<ki|pj,w>}
第7行:
第8行:output{<ki|pj,wj>}
reducephase2
第9行:input:{<ki,spi>},{<ki|pj,wj>}
第10行:
第11行:output{<ki,spi|spwi>}
步驟s103:將所述每一個所述網(wǎng)頁鏈接組中相同的網(wǎng)頁鏈接進行合并,以確定合并后的每一個所述網(wǎng)頁鏈接的第二權(quán)重值;
進一步的,在所述若干個網(wǎng)頁鏈接中,將每一個相同的所述網(wǎng)頁鏈接在對應的網(wǎng)頁鏈接組中的第一權(quán)重值進行相加,作為合并后所述相同的所述網(wǎng)頁鏈接的第二權(quán)重值;
在所述若干個網(wǎng)頁鏈接中,將每一個不同的所述網(wǎng)頁鏈接在對應的網(wǎng)頁鏈接組中的第一權(quán)重,作為所述不同的所述網(wǎng)頁鏈接的第二權(quán)重。
具體而言,網(wǎng)頁鏈接組中相同的網(wǎng)頁鏈接是指每個網(wǎng)頁鏈接組中所包括的相同網(wǎng)頁鏈接,例如(在步驟s104中也會引用此列)上述舉例中,第一網(wǎng)頁鏈接組中的“網(wǎng)易健康”與第二網(wǎng)頁鏈接組中的“網(wǎng)易健康”、第三網(wǎng)頁鏈接組中的“網(wǎng)易健康”都是相同網(wǎng)頁鏈接,將第一、二、三網(wǎng)頁鏈接組中包括的相同網(wǎng)頁鏈接進行合并即是:將“網(wǎng)易健康”在三個網(wǎng)頁鏈接組中的第一權(quán)重值進行合并,由于每個網(wǎng)頁鏈接組的初始化權(quán)重值都可以設定為1,此時“網(wǎng)易健康”網(wǎng)頁鏈接的第二權(quán)重值是1/2+1/3+1/3=7/6;第二網(wǎng)頁鏈接組中的“搜狐健康”和第三網(wǎng)頁鏈接組中的“搜狐健康”也是相同的網(wǎng)頁鏈接,進行合并后“搜狐健康”的第二權(quán)重值是1/3+1/3=2/3。頁鏈接組中不同的網(wǎng)頁鏈接是指每個網(wǎng)頁鏈接組中所包括的互不相同的網(wǎng)頁鏈接,例如上述舉例中,第一網(wǎng)頁鏈接組中的“健康報網(wǎng)”與第二網(wǎng)頁鏈接組中的“百度健康”、第三網(wǎng)頁鏈接組中的“鳳凰健康”都是不同的互不相同的網(wǎng)頁鏈接,第一網(wǎng)頁鏈接組中“健康報網(wǎng)”的第二權(quán)重值等于它的第一權(quán)重,即“健康報網(wǎng)”的第二權(quán)重值等于1/2。
當用mapreduce計算框架時,在reduce1階段:完成步驟s103,即是對相同ki|pj下的所有網(wǎng)頁鏈接的第一權(quán)重值進行相加;其中,相同ki|pj是指:同時滿足ki和pj都相同。(請參閱上所示算法偽代碼的第7行,其中,wj是網(wǎng)頁鏈接的第二權(quán)重值,j為正整數(shù)),計算出所有網(wǎng)頁鏈接的第二權(quán)重值wj。本階段是將map階段的輸出作為reduce1階段的輸入,然后將所有網(wǎng)頁鏈接組中相同的網(wǎng)頁鏈接進行合并,相同網(wǎng)頁鏈接的第一權(quán)重值進行相加,作為合并后相同的網(wǎng)頁鏈接的第二權(quán)重值,將每一個不同的網(wǎng)頁鏈接在對應的網(wǎng)頁鏈接組中的第一權(quán)重,作為不同的網(wǎng)頁鏈接的第二權(quán)重。本階段輸出值仍然為一個鍵值對的集合,其中每條鍵值對數(shù)據(jù)的形式類似于<“健康”|“網(wǎng)易健康”,7/6>,“網(wǎng)易健康”為網(wǎng)頁鏈接,7/6是“網(wǎng)易健康”的第二權(quán)重值。
因為將相同的網(wǎng)頁鏈接進行合并,合并時將每一個相同的所述網(wǎng)頁鏈接在對應的網(wǎng)頁鏈接組中的第一權(quán)重值進行相加,所以權(quán)重值高的即是用戶在搜索時關(guān)注高的網(wǎng)頁鏈接,從而能將用戶歷史經(jīng)驗信息中價格高的信息反饋給用戶,使用戶能更快的完成搜索過來,達到了提高搜索效率的技術(shù)效果。
步驟s104:依據(jù)每一個所述網(wǎng)頁鏈接的所述第二權(quán)重值獲得每一組所述網(wǎng)頁連接組的第三權(quán)重值;
進一步的,分別將每一個所述網(wǎng)頁鏈接組中所述若干個所述網(wǎng)頁鏈接的第二權(quán)重值相加,作為所述網(wǎng)頁鏈接組的第三權(quán)重值。
具體而言,網(wǎng)頁鏈接組的第三權(quán)重值,是將網(wǎng)頁鏈接組中包含的若干個所述網(wǎng)頁鏈接的第二權(quán)重值相加的數(shù)值。如上述例子(在步驟s105中也會引用此列):第一網(wǎng)頁鏈接組中網(wǎng)頁鏈接“網(wǎng)易健康”的第二權(quán)重值是7/6,“健康報網(wǎng)”網(wǎng)頁鏈接的第二權(quán)重值是1/2,此時第一網(wǎng)頁鏈接組的第三權(quán)重值等于“網(wǎng)易健康”和“健康報網(wǎng)”的第二權(quán)重值相加,即第一網(wǎng)頁鏈接組的第三權(quán)重值為:7/6+1/2=5/3。
當用mapreduce計算框架時,在reduce2階段:完成步驟s104,即是將每個網(wǎng)頁連接組里所有網(wǎng)頁鏈接的第二權(quán)重值相加,計算所有網(wǎng)頁鏈接組的第三權(quán)重值。在上述算法偽代碼第10行的計算中,對于關(guān)鍵詞ki,相應的網(wǎng)頁鏈接組spi的第三權(quán)重值spwi,是由spi對應的所有ki|pj的網(wǎng)頁鏈接的第二權(quán)重值wj相加得到。本階段是將reduce1階段的輸出再次在reduce2階段作為輸入,根據(jù)reduce1階段輸出的每個網(wǎng)頁鏈接的第二權(quán)重值,計算所有網(wǎng)頁連接組的第三權(quán)重值,輸出一個鍵值對的集合,其中鍵值對數(shù)據(jù)包含了網(wǎng)頁鏈接組第三權(quán)重值的計算值,形式類似于<“健康”|(“網(wǎng)易健康”,“健康報網(wǎng)”)|5/3>,鍵為網(wǎng)頁鏈接組,值為相應網(wǎng)頁鏈接組的第三權(quán)重值。
步驟s105:依據(jù)所述第三權(quán)重值將若干個所述網(wǎng)頁鏈接組從大到小進行排序。
進一步的,將排序后所述的若干個所述網(wǎng)頁鏈接組按照排序順序進行輸出。
具體而言,相同的網(wǎng)頁鏈接組是指網(wǎng)頁鏈接組中所包括的網(wǎng)頁鏈接都相同,并且網(wǎng)頁鏈接組都是對應于相同的關(guān)鍵詞組。比如:假設第四網(wǎng)頁鏈接組中包括:“網(wǎng)易健康”、“搜狐健康”和“鳳凰健康”三個網(wǎng)頁鏈接,因為上述例子中的第三網(wǎng)頁鏈接組也只包括:“網(wǎng)易健康”、“搜狐健康”和“鳳凰健康”三個網(wǎng)頁鏈接,第四網(wǎng)頁鏈接組與第三網(wǎng)頁鏈接組所對應的關(guān)鍵詞組都是“健康”,即在用戶輸入關(guān)鍵詞組“健康”時依次點擊的網(wǎng)頁鏈接,所以第四網(wǎng)頁鏈接組與第三網(wǎng)頁鏈接組是相同的網(wǎng)頁鏈接組。當在第一、二、三、四網(wǎng)頁鏈接組中,只有第三與第四網(wǎng)頁鏈接組是相同的網(wǎng)頁鏈接組時,如果第三網(wǎng)頁鏈接組的第三權(quán)重值是1.2,第四網(wǎng)頁鏈接組的第三權(quán)重值也是1.2,最終這2個網(wǎng)頁鏈接組在排序時合并為一個鏈接組,排序時使用的網(wǎng)頁鏈接組的第三權(quán)重值也是1.2;將各個網(wǎng)頁鏈接組按照第三權(quán)重值的大小進行從大到小的排序。因為第三與第四網(wǎng)頁鏈接組是相同的網(wǎng)頁鏈接組,所以將第三與第四網(wǎng)頁鏈接組合并為一個網(wǎng)頁鏈接組參與排序,該網(wǎng)頁鏈接組中包括:“網(wǎng)易健康”、“搜狐健康”和“鳳凰健康”三個網(wǎng)頁鏈接,該網(wǎng)頁鏈接組的第三權(quán)重值是:1.2,將此合并后的網(wǎng)頁鏈接組第三權(quán)重值與各個不相同的網(wǎng)頁鏈接組的第三權(quán)重值進行大小的比較,即將此合并后的網(wǎng)頁鏈接組第三權(quán)重值與第一、二網(wǎng)頁鏈接組的第三權(quán)重值按照從大到小進行排列。
在輸出時按照網(wǎng)頁鏈接組第三權(quán)重值按照從大到小進行排列的結(jié)果可以是:(“網(wǎng)易健康”、“搜狐健康”、“鳳凰健康”)、(“網(wǎng)易健康”,“健康報網(wǎng)”)、(“網(wǎng)易健康”,“搜狐健康”,“百度健康”),而所對應的關(guān)鍵詞組都是:“健康”。此時可以單獨輸出此結(jié)果,或者將此結(jié)果和原來的搜索引擎搜索時返回的結(jié)果列表一起輸出,例如:可以和用戶在谷歌首頁中輸入關(guān)鍵字時,用戶在搜索引擎所返回的結(jié)果列表一起輸出。用戶在使用本方法時搜索流程可以是:照常向搜索引擎提交搜索關(guān)鍵詞,然后搜索引擎返回網(wǎng)頁排序和使用本方法按照網(wǎng)頁鏈接組的第三權(quán)重值從大到小進行排列的兩種結(jié)果。其中,搜索引擎返回的網(wǎng)頁排序結(jié)果與只使用搜索引擎時的排序結(jié)果一致。而使用本方法按照網(wǎng)頁鏈接組第三權(quán)重值從大到小進行排列的結(jié)果,則是為用戶提供推薦/可選的搜索路徑,其形式是多個網(wǎng)頁鏈接的序列。因為使用本方法是按照網(wǎng)頁鏈接組的第三權(quán)重值從大到小進行排列輸出,將用戶的經(jīng)驗信息反饋給了用戶,使用戶能更快的完成搜索過來,達到了提高搜索效率的技術(shù)效果。
當用mapreduce計算框架時,在上述算法偽代碼的第11行輸出結(jié)果是:集合{<ki,spi|spwi>}(完成步驟s105)。其中相同搜索關(guān)鍵詞組下的所有網(wǎng)頁鏈接組根據(jù)其第三權(quán)重值進行排序。當用戶開始一個新的搜索過程時,如果提交的搜索關(guān)鍵詞組正好與輸出結(jié)果中的某個關(guān)鍵詞組相同,則輸出該關(guān)鍵詞組下所有網(wǎng)頁鏈接組排序后的結(jié)果。
本發(fā)明提供的方法可以與大數(shù)據(jù)方法結(jié)合,對海量的用戶搜索數(shù)據(jù)進行收集和分析,所以分析的結(jié)果是:越多用戶選擇的搜索路徑,網(wǎng)頁鏈接組排名就越靠前。本發(fā)明提供的方法中,輸出的排列結(jié)果又是為海量用戶提供了參考信息。越是排名靠前的網(wǎng)頁鏈接組就越是具有參考價值,越能代表大多數(shù)用戶的選擇,因此本發(fā)明提供的方法提供的排列結(jié)果,可以符合大多數(shù)用戶的需求。因此,本發(fā)明提供的方法能夠提升大多數(shù)用戶的搜索體驗,讓大多數(shù)用戶能夠根據(jù)網(wǎng)頁鏈接組的排序結(jié)果快速找出所需的一系列網(wǎng)頁,達到提高搜索效率和提升用戶搜索體驗的技術(shù)效果。
基于同一發(fā)明構(gòu)思,本發(fā)明實施例還提供了與上述方法實施例對應的裝置裝置,如下所述:
本發(fā)明又一實施例提供了一種裝置,請參考圖2,所述裝置包括:
搜索數(shù)據(jù)獲取模塊201,用于獲取用戶瀏覽網(wǎng)頁時的搜索數(shù)據(jù),所述搜索數(shù)據(jù)至少包括:若干個網(wǎng)頁鏈接組,每一個所述網(wǎng)頁鏈接組包括若干個網(wǎng)頁鏈接;
第一權(quán)重值確定模塊202,用于確定所述每一個所述網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的第一權(quán)重值;
第二權(quán)重值確定模塊203,用于將所述每一個所述網(wǎng)頁鏈接組中相同的網(wǎng)頁鏈接進行合并,以確定合并后的每一個所述網(wǎng)頁鏈接的第二權(quán)重值;
第三權(quán)重值確定模塊204,用于依據(jù)每一個所述網(wǎng)頁鏈接的所述第二權(quán)重值獲得每一組所述網(wǎng)頁連接組的第三權(quán)重值;
排序模塊205,用于依據(jù)所述第三權(quán)重值將若干個所述網(wǎng)頁鏈接組從大到小進行排序。
本發(fā)明實施例中,所述裝置還包括:輸出模塊,用于將排序后所述的若干個所述網(wǎng)頁鏈接組按照排序順序進行輸出。
在本發(fā)明實施例中,所述若干個網(wǎng)頁鏈接組是三組,包括第一網(wǎng)頁鏈接組,第二網(wǎng)頁鏈接組,第三網(wǎng)頁鏈接組;所述第一網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的個數(shù)是n1;所述第二網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的個數(shù)是n2;所述第三網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的個數(shù)是n3;所述確定所述每一個所述網(wǎng)頁鏈接組中所述若干個網(wǎng)頁鏈接的第一權(quán)重值包括:對于所述第一網(wǎng)頁鏈接組中,每一個網(wǎng)頁鏈接的第一權(quán)重值是1/n1;對于所述第二網(wǎng)頁鏈接組中,每一個網(wǎng)頁鏈接的第一權(quán)重值是1/n2;對于所述第三網(wǎng)頁鏈接組中,每一個網(wǎng)頁鏈接的第一權(quán)重值是1/n3;其中,所述n1、所述n2和所述n3均為正整數(shù)。
在本發(fā)明實施例中,所述第二權(quán)重值確定模塊還包括:
第一子模塊,用于在所述若干個網(wǎng)頁鏈接中,將每一個相同的所述網(wǎng)頁鏈接在對應的網(wǎng)頁鏈接組中的第一權(quán)重值進行相加,作為合并后所述相同的所述網(wǎng)頁鏈接的第二權(quán)重值;
第二子模塊,用于在所述若干個網(wǎng)頁鏈接中,將每一個不同的所述網(wǎng)頁鏈接在對應的網(wǎng)頁鏈接組中的第一權(quán)重,作為所述不同的所述網(wǎng)頁鏈接的第二權(quán)重。
在本發(fā)明實施例中,所述第三權(quán)重值確定模塊還包括:
第三子模塊,用于分別將每一個所述網(wǎng)頁鏈接組中所述若干個所述網(wǎng)頁鏈接的第二權(quán)重值相加,作為所述網(wǎng)頁鏈接組的第三權(quán)重值。
由于本發(fā)明又一實施例所介紹的裝置,為實施本發(fā)明方法實施例所采用的裝置,故而基于本發(fā)明實施例一所介紹的方法,本領(lǐng)域所屬人員能夠了解該裝置的具體結(jié)構(gòu)及變形,故而在此不再贅述。凡是本發(fā)明實施例的方法所采用的裝置都屬于本發(fā)明所欲保護的范圍。
本發(fā)明實施例中提供的技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點:
通過獲取用戶使用搜索引擎時的網(wǎng)頁鏈接搜索數(shù)據(jù),第一計算出各個網(wǎng)頁鏈接的第一權(quán)重值,第二合并相同網(wǎng)頁鏈接計算出相同網(wǎng)頁的第二權(quán)重值,第三依據(jù)相同網(wǎng)頁的第二權(quán)重值計算出網(wǎng)頁鏈接組的第三權(quán)重值;第四依據(jù)網(wǎng)頁鏈接組的第三權(quán)重值對網(wǎng)頁鏈接組進行從大到小的排序,排序時重復網(wǎng)頁鏈接組只排一次。用戶在具體的搜索過程中,當輸入關(guān)鍵詞組進行搜索時,反饋給用戶的結(jié)果列表是已經(jīng)進行了排列后的結(jié)果,即可以是與用戶輸入關(guān)鍵詞組所對應的網(wǎng)頁鏈接組,此時的網(wǎng)頁鏈接組已經(jīng)過了從大到小的排序。網(wǎng)頁鏈接組依據(jù)第三權(quán)重值進行排序的含義是:包含越多重要網(wǎng)頁鏈接的網(wǎng)頁鏈接組其重要性越高;包含在越多網(wǎng)頁鏈接組中的網(wǎng)頁鏈接其重要性越高。用戶根據(jù)反饋的結(jié)果,不需要依次點擊網(wǎng)頁鏈接來完成搜索過程,反饋的結(jié)果即是為用戶提供了經(jīng)驗信息參考,從而使用戶依據(jù)經(jīng)驗信息更快的完成搜索過程,提高了搜索效率,提升了用戶的搜索體驗效果。
本領(lǐng)域內(nèi)的技術(shù)人員應明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、cd-rom、光學存儲器等)上實施的計算機程序產(chǎn)品的形式。
本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機程序指令也可存儲在能引導計算機或其他可編程數(shù)據(jù)處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設備上,使得在計算機或其他可編程設備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
盡管已描述了本發(fā)明的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本發(fā)明范圍的所有變更和修改。
顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明實施例進行各種改動和變型而不脫離本發(fā)明實施例的精神和范圍。這樣,倘若本發(fā)明實施例的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。