国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種搜索引擎的評測方法

      文檔序號:6378633閱讀:229來源:國知局
      專利名稱:一種搜索引擎的評測方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及計算機(jī)應(yīng)用技術(shù)領(lǐng)域,尤其涉及一種搜索引擎的評測方法。
      背景技術(shù)
      互聯(lián)網(wǎng)的迅猛發(fā)展和廣泛普及,使人們可以方便地從網(wǎng)絡(luò)上獲得信息,但網(wǎng)絡(luò)信息的爆炸性增長,又使人們準(zhǔn)確、快速地獲得有價值信息的難度大大增加。由于每個搜索引擎的語料庫大小、索引新鮮度和語料重復(fù)度不同,導(dǎo)致搜索引擎相對于同一個關(guān)鍵詞的返回結(jié)果大不相同。當(dāng)用戶需要對某個領(lǐng)域關(guān)鍵詞進(jìn)行搜索,并期望準(zhǔn)確的找到所需要的信息時,則需要先對比較各個搜索引擎在當(dāng)前領(lǐng)域的優(yōu)劣,以選擇最合適的搜索引擎進(jìn)行信息的獲取。現(xiàn)有技術(shù)中對搜索引擎進(jìn)行評測時需具備訪問搜索引擎內(nèi)部數(shù)據(jù)的特權(quán),并且需掌握搜索引擎工作原理等專業(yè)知識。然而,普通用戶并不具備上述能力,因此,無法快速、高效的實(shí)現(xiàn)搜索引擎評測。

      發(fā)明內(nèi)容
      本發(fā)明的目的是提供一種搜索引擎的評測方法,基于領(lǐng)域本體的外部方法,實(shí)現(xiàn)了簡潔、準(zhǔn)確、快速的對搜索弓I擎進(jìn)行評測。本發(fā)明的目的是通過以下技術(shù)方案實(shí)現(xiàn)的一種搜索引擎的評測方法,包括根據(jù)用于表示當(dāng)前關(guān)鍵詞與其他關(guān)鍵詞的權(quán)重及權(quán)重關(guān)系的領(lǐng)域本體圖及用于表示當(dāng)前網(wǎng)頁中當(dāng)前關(guān)鍵詞與其他關(guān)鍵詞的權(quán)重及權(quán)重關(guān)系的網(wǎng)頁本體圖計算當(dāng)前領(lǐng)域本體中的某一關(guān)鍵詞在當(dāng)前網(wǎng)頁的網(wǎng)頁相關(guān)度;計算所述當(dāng)前關(guān)鍵詞通過搜索引擎返回的若干網(wǎng)頁的網(wǎng)頁相關(guān)度總和,獲得當(dāng)前搜索引擎在所述當(dāng)前關(guān)鍵詞所處領(lǐng)域的評分。由上述本發(fā)明提供的技術(shù)方案可以看出,本發(fā)明無需訪問搜索引擎內(nèi)部文件或目錄來進(jìn)行搜索引擎評測,而通過基于領(lǐng)域本體的外部方法,實(shí)現(xiàn)了簡潔、準(zhǔn)確、快速的對搜索引擎進(jìn)行評測。


      為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對實(shí)施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域的普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他附圖。圖I為本發(fā)明實(shí)施例一提供的一種搜索引擎的評測方法的流程圖;圖2為本發(fā)明實(shí)施例二提供的又一種搜索引擎的評測方法的流程圖3為本發(fā)明實(shí)施例二提供的一種領(lǐng)域本體圖中關(guān)鍵詞權(quán)重值及關(guān)系權(quán)重值的示意圖。
      具體實(shí)施例方式下面結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整 地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明的保護(hù)范圍。實(shí)施例一下面將結(jié)合附圖對本發(fā)明實(shí)施例作進(jìn)一步地詳細(xì)描述。如圖I所示,一種搜索引擎的評測方法,包括如下步驟步驟101、根據(jù)用于表示當(dāng)前關(guān)鍵詞與其他關(guān)鍵詞的權(quán)重及權(quán)重關(guān)系的領(lǐng)域本體圖及用于表示當(dāng)前網(wǎng)頁中當(dāng)前關(guān)鍵詞與其他關(guān)鍵詞的權(quán)重及權(quán)重關(guān)系的網(wǎng)頁本體圖計算當(dāng)前領(lǐng)域本體中的某一關(guān)鍵詞在當(dāng)前網(wǎng)頁的網(wǎng)頁相關(guān)度。其方法可以為根據(jù)選定的關(guān)鍵詞構(gòu)建領(lǐng)域本體圖,該領(lǐng)域本體圖中包括當(dāng)前關(guān)鍵詞與當(dāng)前領(lǐng)域中其他關(guān)鍵詞間權(quán)重關(guān)系;將該關(guān)鍵詞通過搜索引擎進(jìn)行搜索,選定返回的搜索結(jié)果的中的某一網(wǎng)頁,構(gòu)建網(wǎng)頁本體圖,該網(wǎng)頁本體圖中包括當(dāng)前關(guān)鍵詞在當(dāng)前網(wǎng)頁中與當(dāng)前領(lǐng)域中其他關(guān)鍵詞間權(quán)重關(guān)系的;根據(jù)該關(guān)鍵詞的領(lǐng)域本體圖及網(wǎng)頁本體圖,計算該關(guān)鍵詞在當(dāng)前網(wǎng)頁的網(wǎng)頁相關(guān)度。步驟102、計算所述當(dāng)前關(guān)鍵詞通過搜索引擎返回的若干網(wǎng)頁的網(wǎng)頁相關(guān)度總和,獲得當(dāng)前搜索引擎在所述當(dāng)前關(guān)鍵詞所處領(lǐng)域的評分。其計算方法具體可以為分別將每一個返回的網(wǎng)頁的網(wǎng)頁相關(guān)度與該網(wǎng)頁在當(dāng)前搜索引擎頁面的權(quán)重值相乘,再計算總和,該數(shù)值則為當(dāng)前搜索引擎在所述某一關(guān)鍵詞所處領(lǐng)域的評分。其中,返回的網(wǎng)頁的權(quán)重值與該網(wǎng)頁所處搜索引擎頁面相關(guān),一般而言,返回的網(wǎng)頁越靠前其權(quán)重值越大,反之越小。還可將所述某一關(guān)鍵詞分別通過N (大于O的自然數(shù))個搜索引擎進(jìn)行搜索,并統(tǒng)一選取返回的若干網(wǎng)頁,分別計算每一個搜索引擎返回的若干網(wǎng)頁的網(wǎng)頁相關(guān)度總和,按照所述網(wǎng)頁相關(guān)度總和的大小,判斷搜索引擎在所述某一關(guān)鍵詞所處領(lǐng)域優(yōu)劣。本發(fā)明實(shí)施例提供的搜索引擎的評測方法,無需訪問搜索引擎內(nèi)部文件或目錄來進(jìn)行搜索引擎評測,而通過基于領(lǐng)域本體的外部方法,實(shí)現(xiàn)了簡潔、準(zhǔn)確、快速的對搜索引擎進(jìn)行評測。實(shí)施例二為便于理解,下面將結(jié)合附圖2-3對本發(fā)明實(shí)施例的具體實(shí)現(xiàn)方式作進(jìn)一步描述。如圖2所示,一種搜索引擎的評測方法,包括如下步驟步驟201、抓取關(guān)鍵詞。從專業(yè)目錄網(wǎng)站中,例如維基百科、百度百科和ODP等,抓取關(guān)鍵詞,將抓取到的關(guān)鍵詞按照領(lǐng)域進(jìn)行分類形成關(guān)鍵詞詞庫,如音樂,體育等。一般而言,利用專業(yè)目錄網(wǎng)站中的抓取到的關(guān)鍵詞來構(gòu)建領(lǐng)域相關(guān)的問詢詞詞庫,可以提高網(wǎng)頁相關(guān)度評測的準(zhǔn)確性,進(jìn)而提高系統(tǒng)的準(zhǔn)確性。
      步驟202、選定關(guān)鍵詞,并根據(jù)選定好的關(guān)鍵詞構(gòu)建領(lǐng)域本體圖。首先選擇一個關(guān)鍵詞,根據(jù)當(dāng)前關(guān)鍵詞所處的領(lǐng)域類型建立關(guān)鍵詞集合,確定所述關(guān)鍵詞集合中所有關(guān)鍵詞的詞性(如名次,動詞等),并按照語義相近程度將所述關(guān)鍵詞集合中的關(guān)鍵詞聚類;再根據(jù)分類學(xué)、語義和聚類概念對所述關(guān)鍵詞集合中的關(guān)鍵詞進(jìn)行抽取,獲得分類關(guān)系、關(guān)系集合與聚簇關(guān)系集合;最后根據(jù)抽取時的概率計算每一個關(guān)鍵詞在當(dāng)前領(lǐng)域本體中的權(quán)重值、分類關(guān)系中關(guān)鍵詞間的關(guān)系權(quán)重值及關(guān)系集合中關(guān)鍵詞間的關(guān)系權(quán)重值。上述僅為領(lǐng)域本體圖的其中一種建立方法,用戶還可以根據(jù)實(shí)際需求做出調(diào)整。例如,可在建立關(guān)鍵詞集合后通過本體語料庫對關(guān)鍵詞進(jìn)行校正等,還可對關(guān)鍵詞集合進(jìn)行其他類型的抽取,再建立對應(yīng)的集合;還可將七步法或骨架法等其他領(lǐng)域本體圖的構(gòu)建方法與上述方法相結(jié)合。為了便于理解通過上述方法建立的領(lǐng)域本體圖的含義,可將其定義為0G=〈T,F(xiàn),H,R,C,A>,其中T代表OG中關(guān)鍵詞集合,F(xiàn)代表屬于T中關(guān)鍵詞的詞性,H代表T中關(guān)鍵詞的分類關(guān)系,R代表關(guān)鍵詞之間關(guān)系集合,C代表T中關(guān)鍵詞的聚簇關(guān)系集合,A代表描述R中每個關(guān)系的理論集合。例如,以“娛樂”作為主體構(gòu)建的領(lǐng)域本體圖,關(guān)鍵詞集合T=K娛樂,1),(音樂,O. 9),(電影,O. 9),(流行,O. 8),(唱歌,O. 7),(卡通,O. 6),(演出,O. 5),(演員,O. 5)};詞性集合 F= {(娛樂,noun),(音樂,noun),(流行,noun),(唱歌,verb),(卡通,noun),(電影,noun)(演出,noun),(演員,noun)} ;H={(娛樂,音樂,O. 5),(音樂,流行,0.5)} ;R= {(唱歌,音樂,0.8),(演員,演出,0.9),(演員,電影,0.9)} ;C={(音樂,音樂),(音樂,流行),(音樂,唱歌),(動畫,卡通),(電影,演出),(電影,演員)},其中F中的英文為該關(guān)鍵詞的詞性,如名詞、動詞等;T中的數(shù)字為該關(guān)鍵詞在以“娛樂”為主體構(gòu)建的領(lǐng)域本體圖中的權(quán)重值;Η與R中的數(shù)字為兩個關(guān)鍵詞的權(quán)重邊的值。上述權(quán)重值與權(quán)重邊的值是根據(jù)抽該時出現(xiàn)的概率計算而來,對于不同的領(lǐng)域本體其關(guān)鍵詞的權(quán)重值與權(quán)重邊也會發(fā)生一定的變化。為更形象的表示各個關(guān)鍵詞的權(quán)重值及權(quán)重邊的值的關(guān)系,可以構(gòu)建如圖3所示的示意圖。而為了便于計算,可以使用關(guān)鍵詞的權(quán)重值及關(guān)鍵詞中的權(quán)重邊的值,計算相關(guān)聯(lián)的關(guān)鍵詞的關(guān)系權(quán)重值,下表以“娛樂”、“音樂”、“流行”和“唱歌”為例計算關(guān)系權(quán)重值
      權(quán)利要求
      1.一種搜索引擎的評測方法,其特征在于,包括 根據(jù)用于表示當(dāng)前關(guān)鍵詞與其他關(guān)鍵詞的權(quán)重及權(quán)重關(guān)系的領(lǐng)域本體圖及用于表示當(dāng)前網(wǎng)頁中當(dāng)前關(guān)鍵詞與其他關(guān)鍵詞的權(quán)重及權(quán)重關(guān)系的網(wǎng)頁本體圖計算當(dāng)前關(guān)鍵詞在當(dāng)前網(wǎng)頁中的網(wǎng)頁相關(guān)度; 計算所述當(dāng)前關(guān)鍵詞通過搜索引擎返回的若干網(wǎng)頁的網(wǎng)頁相關(guān)度總和,獲得當(dāng)前搜索引擎在所述當(dāng)前關(guān)鍵詞所處領(lǐng)域的評分。
      2.根據(jù)權(quán)利要求I所述的方法,其特征在于,該方法還包括 抓取關(guān)鍵詞,將抓取到的關(guān)鍵詞按照領(lǐng)域進(jìn)行分類,并構(gòu)建領(lǐng)域本體圖; 將某一關(guān)鍵詞發(fā)送至搜索引擎,通過所述搜索引擎返回的相關(guān)網(wǎng)頁及所述某一關(guān)鍵詞對應(yīng)的領(lǐng)域本體圖,構(gòu)建對應(yīng)的網(wǎng)頁本體圖。
      3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述領(lǐng)域本體圖包括關(guān)鍵詞集合及每個關(guān)鍵詞的權(quán)重值、關(guān)鍵詞的詞性、關(guān)鍵詞的分類關(guān)系及相關(guān)關(guān)鍵詞間的關(guān)系權(quán)重值; 構(gòu)建領(lǐng)域本體圖的步驟為 按照領(lǐng)域類型建立關(guān)鍵詞集合,確定所述關(guān)鍵詞集合中所有關(guān)鍵詞的詞性,并按照語義相近程度將所述關(guān)鍵詞集合中的關(guān)鍵詞聚類; 再根據(jù)分類學(xué)、語義和聚類概念對所述關(guān)鍵詞集合中的關(guān)鍵詞進(jìn)行抽取,獲得分類關(guān)系、關(guān)系集合與聚族關(guān)系集合; 根據(jù)抽取時的概率計算每一個關(guān)鍵詞在當(dāng)前領(lǐng)域本體中的權(quán)重值、分類關(guān)系中關(guān)鍵詞間的關(guān)系權(quán)重值及關(guān)系集合中關(guān)鍵詞間的關(guān)系權(quán)重值。
      4.根據(jù)權(quán)利要求3所述的方法,其特征在于,構(gòu)建網(wǎng)頁本體圖的步驟包括 將網(wǎng)頁文本分割為M個短句,從中提取出N個當(dāng)前領(lǐng)域本體中的關(guān)鍵詞,并分別計算每一個關(guān)鍵詞在當(dāng)前網(wǎng)頁中的權(quán)重值,所述M、N為大于O的自然數(shù); 根據(jù)當(dāng)前領(lǐng)域本體圖查找具有相關(guān)性的關(guān)鍵詞,并將其在當(dāng)前網(wǎng)頁中的權(quán)重值和當(dāng)前領(lǐng)域本體圖中對應(yīng)的相關(guān)關(guān)鍵詞的關(guān)系權(quán)重值相乘,獲得其在網(wǎng)頁中的關(guān)系權(quán)重值。
      5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述計算某一關(guān)鍵詞在當(dāng)前網(wǎng)頁的網(wǎng)頁相關(guān)度的步驟包括 將網(wǎng)頁本體圖中該關(guān)鍵詞與其自身間關(guān)系權(quán)重值之外的所有關(guān)系權(quán)重值之和除以當(dāng)前領(lǐng)域本體圖中該關(guān)鍵詞與其自身間關(guān)系權(quán)重值之外的所有關(guān)系權(quán)重值之和,獲得某一關(guān)鍵詞在當(dāng)前網(wǎng)頁的網(wǎng)頁相關(guān)度。
      6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述計算所述某一關(guān)鍵詞通過搜索引擎返回的若干網(wǎng)頁的網(wǎng)頁相關(guān)度總和包括 分別將每一個返回的網(wǎng)頁的網(wǎng)頁相關(guān)度與所述網(wǎng)頁在當(dāng)前搜索引擎頁面的權(quán)重值相乘,再計算總和,獲得當(dāng)前搜索引擎在所述某一關(guān)鍵詞所處領(lǐng)域的評分。
      7.根據(jù)權(quán)利要求I或6所述的方法,其特征在于,該方法還包括 將某一關(guān)鍵詞分別通過S個搜索引擎進(jìn)行搜索,并統(tǒng)一選取返回的若干網(wǎng)頁,分別計算每一個搜索引擎返回的若干網(wǎng)頁的網(wǎng)頁相關(guān)度總和,按照所述網(wǎng)頁相關(guān)度總和的大小,判斷搜索引擎在所述某一關(guān)鍵詞所處領(lǐng)域優(yōu)劣,所述S為大于O的自然數(shù)。
      全文摘要
      本發(fā)明公開了一種搜索引擎的評測方法,包括根據(jù)用于表示當(dāng)前關(guān)鍵詞與其他關(guān)鍵詞的權(quán)重及權(quán)重關(guān)系的領(lǐng)域本體圖及用于表示當(dāng)前網(wǎng)頁中當(dāng)前關(guān)鍵詞與其他關(guān)鍵詞的權(quán)重及權(quán)重關(guān)系的網(wǎng)頁本體圖計算當(dāng)前領(lǐng)域本體中的某一關(guān)鍵詞在當(dāng)前網(wǎng)頁的網(wǎng)頁相關(guān)度;計算所述當(dāng)前關(guān)鍵詞通過搜索引擎返回的若干網(wǎng)頁的網(wǎng)頁相關(guān)度總和,獲得當(dāng)前搜索引擎在所述當(dāng)前關(guān)鍵詞所處領(lǐng)域的評分。通過采用本發(fā)明公開的方法,實(shí)現(xiàn)了簡潔、準(zhǔn)確、快速的對搜索引擎進(jìn)行評測。
      文檔編號G06F17/30GK102929962SQ201210384318
      公開日2013年2月13日 申請日期2012年10月11日 優(yōu)先權(quán)日2012年10月11日
      發(fā)明者朱明 , 孫永錄, 尹文科 申請人:中國科學(xué)技術(shù)大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1