專利名稱:一種確定搜索項(xiàng)的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及一種確定搜索項(xiàng)的方法和系統(tǒng)。
背景技術(shù):
隨著網(wǎng)絡(luò)技術(shù)的不斷普及,網(wǎng)絡(luò)已經(jīng)融入了人們?nèi)粘9ぷ骱蜕畹母鱾€(gè)方面。其中借助網(wǎng)絡(luò)提供的搜索引擎來(lái)搜索自己需要的信息是一個(gè)非常重要的應(yīng)用。
發(fā)明人通過(guò)對(duì)現(xiàn)有技術(shù)的研究發(fā)現(xiàn),隨著信息量的增加,面對(duì)龐雜紛繁的信息,很多時(shí)候用戶并不知道要根據(jù)什么樣的搜索項(xiàng)才能夠找到準(zhǔn)確的信息。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例的目的是提供一種確定搜索項(xiàng)的方法和系統(tǒng),協(xié)助用戶在需要進(jìn)行搜索時(shí),能夠通過(guò)準(zhǔn)確的搜索項(xiàng)找到準(zhǔn)確的信息。
為實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供了如下技術(shù)方案 一種確定搜索項(xiàng)的方法,包括 獲取待定搜索項(xiàng)集合; 以待定搜索項(xiàng)集合中的各個(gè)待定搜索項(xiàng)為搜索條件,通過(guò)搜索引擎進(jìn)行搜索,并從搜索結(jié)果中獲得搜索結(jié)果文本; 統(tǒng)計(jì)各個(gè)搜索結(jié)果文本中候選目標(biāo)項(xiàng)的出現(xiàn)次數(shù),并根據(jù)候選目標(biāo)項(xiàng)的出現(xiàn)次數(shù)對(duì)各個(gè)待定搜索項(xiàng)進(jìn)行排序; 根據(jù)排序結(jié)果從待定搜索項(xiàng)中確定搜索項(xiàng)。
所述待定搜索項(xiàng)包括預(yù)設(shè)搜索項(xiàng)和第一推薦搜索項(xiàng)。
獲取待定搜索項(xiàng)包括 通過(guò)搜索引擎對(duì)預(yù)設(shè)搜索項(xiàng)進(jìn)行搜索; 根據(jù)所述預(yù)設(shè)搜索項(xiàng)的搜索結(jié)果獲得第一推薦搜索項(xiàng)。
所述待定搜索項(xiàng)還包括第二推薦搜索項(xiàng);所述獲取待定搜索項(xiàng)還包括 通過(guò)搜索引擎對(duì)第一推薦搜索項(xiàng)進(jìn)行搜索; 根據(jù)所述第一推薦搜索項(xiàng)的搜索結(jié)果獲得第二推薦搜索項(xiàng)。
所述從搜索結(jié)果中獲得搜索結(jié)果文本包括 從每個(gè)待定搜索項(xiàng)的搜索結(jié)果中提取統(tǒng)一資源定位符; 對(duì)每個(gè)統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)絡(luò)資源進(jìn)行下載,得到對(duì)應(yīng)的搜索結(jié)果文本。
一種確定搜索項(xiàng)的系統(tǒng),包括 第一獲取單元,用于獲取待定搜索項(xiàng)集合; 搜索單元,用于以待定搜索項(xiàng)集合中的各個(gè)待定搜索項(xiàng)為搜索條件,通過(guò)搜索引擎進(jìn)行搜索; 第二獲取單元,用于從搜索結(jié)果中獲得搜索結(jié)果文本; 統(tǒng)計(jì)單元,用于統(tǒng)計(jì)各個(gè)搜索結(jié)果文本中候選目標(biāo)項(xiàng)的出現(xiàn)次數(shù),并根據(jù)候選目
4標(biāo)項(xiàng)的出現(xiàn)次數(shù)對(duì)各個(gè)待定搜索項(xiàng)進(jìn)行排序; 確定單元,用于根據(jù)排序結(jié)果從待定搜索項(xiàng)中確定搜索項(xiàng)。
所述第一獲取單元包括 第一搜索子單元,用于通過(guò)搜索引擎對(duì)預(yù)設(shè)搜索項(xiàng)進(jìn)行搜索; 第一獲取子單元,用于根據(jù)所述預(yù)設(shè)搜索項(xiàng)的搜索結(jié)果獲得第一推薦搜索項(xiàng)。
所述待定搜索項(xiàng)還包括第二推薦搜索項(xiàng),所述第一獲取單元還包括 第二搜索子單元,用于通過(guò)搜索引擎對(duì)第一推薦搜索項(xiàng)進(jìn)行搜索; 第二獲取子單元,用于根據(jù)所述第一推薦搜索項(xiàng)的搜索結(jié)果獲得第二推薦搜索項(xiàng)。
所述第二獲取單元包括 提取子單元,用于從每個(gè)待定搜索項(xiàng)的搜索結(jié)果中提取統(tǒng)一資源定位符; 下載子單元,用于對(duì)每個(gè)統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)絡(luò)資源進(jìn)行下載,得到對(duì)應(yīng)的搜索結(jié)果文本。
可見(jiàn),在本發(fā)明實(shí)施例中,獲取待定搜索項(xiàng)集合;以待定搜索項(xiàng)集合中的各個(gè)待定搜索項(xiàng)為搜索條件,通過(guò)搜索引擎進(jìn)行搜索,并從搜索結(jié)果中獲得搜索結(jié)果文本;統(tǒng)計(jì)各個(gè)搜索結(jié)果文本中候選目標(biāo)項(xiàng)的出現(xiàn)次數(shù),并根據(jù)候選目標(biāo)項(xiàng)的出現(xiàn)次數(shù)對(duì)各個(gè)待定搜索項(xiàng)進(jìn)行排序;根據(jù)排序結(jié)果從待定搜索項(xiàng)中確定搜索項(xiàng)。本發(fā)明實(shí)施例所提供的技術(shù)方案,可以結(jié)合用戶輸入的預(yù)設(shè)搜索項(xiàng)協(xié)助用戶在需要進(jìn)行搜索時(shí),通過(guò)準(zhǔn)確的搜索項(xiàng)找到準(zhǔn)確的目標(biāo)信息。
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明中記載的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明一實(shí)施例所提供的方法流程圖; 圖2為本發(fā)明另一實(shí)施例所提供的方法的流程圖; 圖3為本發(fā)明一實(shí)施例所提供的系統(tǒng)的結(jié)構(gòu)示意圖; 圖4為本發(fā)明一實(shí)施例所提供的系統(tǒng)中一單元的結(jié)構(gòu)示意圖; 圖5為本發(fā)明一實(shí)施例提供的系統(tǒng)中另一單元的結(jié)構(gòu)示意圖。
具體實(shí)施例方式為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明中的技術(shù)方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。
參見(jiàn)圖1,本發(fā)明實(shí)施例提供的一種確定搜索項(xiàng)的方法,包括 S101、獲取待定搜索項(xiàng)集合; 本發(fā)明實(shí)施例中,所述待定搜索項(xiàng)集合中包含多個(gè)待定搜索項(xiàng)。該待定搜索項(xiàng)包括預(yù)設(shè)搜索項(xiàng)和推薦搜索項(xiàng)。
預(yù)設(shè)搜索項(xiàng)時(shí)待定搜索項(xiàng)的一種。預(yù)設(shè)搜索項(xiàng)可以是用戶輸入的搜索項(xiàng),例如,用戶希望通過(guò)搜索引擎搜索一下目前的流行語(yǔ),就可以在搜索引擎中輸入“最新流行語(yǔ)”這樣的搜索項(xiàng)。但是這個(gè)搜索項(xiàng)對(duì)于其希望獲得的目標(biāo)項(xiàng)——具體的最新流行語(yǔ)來(lái)說(shuō)不一定是非常準(zhǔn)確的搜索項(xiàng)。所以本發(fā)明實(shí)施例所提供的方法中,通過(guò)推薦搜索項(xiàng)對(duì)待確定搜索項(xiàng)進(jìn)行了補(bǔ)充。
推薦搜索項(xiàng)是通過(guò)預(yù)設(shè)搜索項(xiàng)獲得的。當(dāng)通過(guò)搜索引擎對(duì)預(yù)設(shè)搜索項(xiàng)進(jìn)行搜索后,搜索引擎會(huì)提供與預(yù)設(shè)搜索項(xiàng)相關(guān)或者相近的搜索項(xiàng)。這些相關(guān)或者相近的搜索項(xiàng)就是預(yù)設(shè)搜索項(xiàng)的推薦搜索項(xiàng)。
例如,利用一搜索引擎對(duì)預(yù)設(shè)搜索項(xiàng)“最新流行語(yǔ)”進(jìn)行搜索,得到的搜索結(jié)果頁(yè)面中,在搜索結(jié)果頁(yè)面中會(huì)提供“最新流行語(yǔ)”的相關(guān)搜索,包括“2009年網(wǎng)絡(luò)流行語(yǔ)”、 “2009最新流行語(yǔ)”等等。這些相關(guān)搜索就是預(yù)設(shè)搜索項(xiàng)的推薦搜索項(xiàng)。從預(yù)設(shè)搜索項(xiàng)的搜索結(jié)果頁(yè)面中將這些推薦搜索項(xiàng)提取出來(lái),成為待定搜索項(xiàng)。多個(gè)待定搜索項(xiàng)組成待定搜索項(xiàng)集合。
需要說(shuō)明的是,在獲取待定搜索項(xiàng)的過(guò)程中,為了獲得更多的待定搜索項(xiàng),在得到推薦搜索項(xiàng)后,可以利用搜索引擎對(duì)推薦搜索項(xiàng)進(jìn)行進(jìn)一步搜索,從對(duì)推薦搜索項(xiàng)的搜索結(jié)果頁(yè)面中得到推薦搜索項(xiàng)的相關(guān)搜索,將這些相關(guān)搜索也列入待確定搜索項(xiàng)中。為了描述上的方便,本發(fā)明實(shí)施例中,將根據(jù)預(yù)設(shè)搜索項(xiàng)得到的推薦搜索項(xiàng)記為第一推薦搜索項(xiàng); 將根據(jù)第一推薦搜索項(xiàng)得到的推薦搜索項(xiàng)記為第二推薦搜索項(xiàng)。
S102、以待定搜索項(xiàng)集合中的各個(gè)待定搜索項(xiàng)為搜索條件,通過(guò)搜索引擎進(jìn)行搜索,并從搜索結(jié)果中獲得搜索結(jié)果文本; 具體地,可以從每個(gè)待定搜索項(xiàng)的搜索結(jié)果中提取統(tǒng)一資源定位符;然后對(duì)每個(gè)統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)絡(luò)資源進(jìn)行下載,得到對(duì)應(yīng)的搜索結(jié)果文本。
例如,通過(guò)步驟SlOl得到的待定搜索項(xiàng)集合中的待定搜索項(xiàng)包括“最新流行語(yǔ)”、 “2009最新流行語(yǔ)”、“09最新流行語(yǔ)”等等。以每個(gè)待定搜索項(xiàng)為搜索條件,通過(guò)搜索引擎進(jìn)行搜索,得到搜索結(jié)果。該搜索結(jié)果中可以包括多個(gè)統(tǒng)一資源定位符,從搜索結(jié)果中將統(tǒng)一資源定位符提取出來(lái),然后對(duì)每個(gè)統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)絡(luò)資源進(jìn)行下載,所得到的內(nèi)容即為該待定搜索項(xiàng)對(duì)應(yīng)的搜索結(jié)果文本。
S103、統(tǒng)計(jì)各個(gè)搜索結(jié)果文本中候選目標(biāo)項(xiàng)的出現(xiàn)情況,并根據(jù)候選目標(biāo)項(xiàng)的出現(xiàn)情況對(duì)各個(gè)待定搜索項(xiàng)進(jìn)行排序; 為了從待定搜索項(xiàng)中準(zhǔn)確選取出搜索項(xiàng),本發(fā)明實(shí)施例所提供的方法中,針對(duì)待定搜索項(xiàng)可以預(yù)先設(shè)置一些候選目標(biāo)項(xiàng)。
以對(duì)流行語(yǔ)的搜索為例,為了確定在搜索流行語(yǔ)時(shí)的搜索項(xiàng),預(yù)先可以設(shè)置一些已經(jīng)確定是流行語(yǔ)的詞語(yǔ)作為候選目標(biāo)項(xiàng),多個(gè)候選目標(biāo)項(xiàng)組成候選目標(biāo)項(xiàng)集合。例如候選目標(biāo)項(xiàng)集合中可以包括“打醬油”、“躲貓貓”、“俯臥撐”等多個(gè)流行詞的候選目標(biāo)項(xiàng)。統(tǒng)計(jì)各個(gè)搜索結(jié)果文本中候選目標(biāo)項(xiàng)出現(xiàn)的情況,包括出現(xiàn)了多少個(gè)候選目標(biāo)項(xiàng),每個(gè)候選目標(biāo)項(xiàng)出現(xiàn)了多少次等等。每個(gè)搜索結(jié)果文本都與一個(gè)待定搜索項(xiàng)對(duì)應(yīng),最后可以根據(jù)各個(gè)待確定搜索項(xiàng)搜索到的搜索結(jié)果文本中候選目標(biāo)項(xiàng)的出現(xiàn)情況對(duì)各個(gè)待確定搜索項(xiàng)進(jìn)行排序,例如 可以將搜索結(jié)果文本中候選目標(biāo)項(xiàng)的出現(xiàn)次數(shù)進(jìn)行累加,按照候選目標(biāo)項(xiàng)出現(xiàn)的總次數(shù)對(duì)待定搜索項(xiàng)進(jìn)行排序; 或者,結(jié)合候選目標(biāo)項(xiàng)出現(xiàn)的個(gè)數(shù),以及每個(gè)候選目標(biāo)項(xiàng)出現(xiàn)的次數(shù)綜合對(duì)待確定搜索項(xiàng)進(jìn)行排序。
本發(fā)明不限定根據(jù)候選目標(biāo)項(xiàng)對(duì)待確定目標(biāo)項(xiàng)的具體分析方法,可以根據(jù)實(shí)際情況自行確定。
S104、根據(jù)排序結(jié)果從待定搜索項(xiàng)中確定搜索項(xiàng)。
當(dāng)根據(jù)候選目標(biāo)項(xiàng)在搜索結(jié)果文本中的出現(xiàn)情況對(duì)待確定搜索項(xiàng)進(jìn)行排序之后, 就可以根據(jù)排序結(jié)果確定搜索項(xiàng)。
例如,如果對(duì)流行詞搜索,最后,“2009年網(wǎng)絡(luò)流行語(yǔ)”這個(gè)待定搜索項(xiàng)搜索得到的搜索結(jié)果文本中出現(xiàn)的候選目標(biāo)詞,即流行語(yǔ)的數(shù)量和每個(gè)流行語(yǔ)出現(xiàn)的次數(shù)都排在其他待定搜索項(xiàng)之前,所以可以確定“2009年網(wǎng)絡(luò)流行語(yǔ)”即為與流行語(yǔ)對(duì)應(yīng)的搜索項(xiàng)。
S105、將搜索項(xiàng)提供給用戶,以使用戶利用確定的搜索項(xiàng)通過(guò)搜索引擎搜索對(duì)應(yīng)的目標(biāo)項(xiàng)。
本發(fā)明實(shí)施例所提供的方法,可以結(jié)合用戶輸入的預(yù)設(shè)搜索項(xiàng)協(xié)助用戶找到準(zhǔn)確的搜索項(xiàng),從而使用戶能夠通過(guò)準(zhǔn)確的搜索項(xiàng)找到準(zhǔn)確的目標(biāo)信息。
下面結(jié)合具體的實(shí)例對(duì)本發(fā)明實(shí)施例所提供的方法進(jìn)行詳細(xì)的說(shuō)明。
本實(shí)施例中,用戶希望通過(guò)搜索引擎找到現(xiàn)在網(wǎng)絡(luò)上的流行詞。于是在搜索引擎中輸入了“最新流行語(yǔ)”,并利用搜索引擎進(jìn)行搜索。則本發(fā)明實(shí)施例所提供的方法包括 S201、獲取預(yù)設(shè)搜索項(xiàng)“最新流行語(yǔ)”。
S202、以“最新流行語(yǔ)”為搜索條件,通過(guò)搜索引擎進(jìn)行搜索,獲得推薦搜索項(xiàng)。
具體地,可以首先通過(guò)搜索引擎對(duì)“最新流行語(yǔ)”進(jìn)行搜索獲得第一推薦搜索項(xiàng); 然后,再利用搜索引擎對(duì)第一推薦搜索項(xiàng)進(jìn)行搜索獲得第二推薦搜索項(xiàng)。
推薦搜索項(xiàng)一般會(huì)在搜索結(jié)果頁(yè)面的下方給出。本發(fā)明實(shí)施例中,從所述結(jié)果頁(yè)面中獲取推薦搜索項(xiàng)。
推薦搜索項(xiàng)和預(yù)設(shè)搜索項(xiàng)構(gòu)成本發(fā)明實(shí)施例中的待定搜索項(xiàng)。
S203、利用搜索引擎對(duì)每個(gè)待定搜索項(xiàng)進(jìn)行搜索后,獲取每個(gè)待定搜索項(xiàng)對(duì)應(yīng)的搜索結(jié)果。
S204、從待定搜索項(xiàng)的搜索結(jié)果頁(yè)面中提取統(tǒng)一資源定位符。
S205、下載待定搜索項(xiàng)的搜索結(jié)果頁(yè)面中的統(tǒng)一資源定位符,獲得搜索結(jié)果文本。
S206、統(tǒng)計(jì)每個(gè)待定搜索項(xiàng)所對(duì)應(yīng)的所述結(jié)果文本中對(duì)應(yīng)的候選目標(biāo)項(xiàng)。
如本發(fā)明實(shí)施例中,在最新流行語(yǔ)是搜索結(jié)果頁(yè)面中提取統(tǒng)一資源定位符。根據(jù)每個(gè)統(tǒng)一資源定位符,對(duì)該統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)絡(luò)資源進(jìn)行下載得到對(duì)應(yīng)的搜索結(jié)果文本。這些搜索結(jié)果文本就是獲得流行語(yǔ)的語(yǔ)料。從這些搜索結(jié)果文本中統(tǒng)計(jì)其中所具有的候選目標(biāo)項(xiàng)的情況。例如“最新流行語(yǔ)”對(duì)應(yīng)的搜索結(jié)果文本中包括的候選目標(biāo)項(xiàng)包括 “打醬油”、“俯臥撐”等流行語(yǔ)。統(tǒng)計(jì)這些候選目標(biāo)項(xiàng)并統(tǒng)計(jì)每個(gè)候選目標(biāo)項(xiàng)出現(xiàn)的次數(shù)。 例如,在“最新流行語(yǔ)”這個(gè)待定搜索項(xiàng)對(duì)應(yīng)的搜索結(jié)果文本中,共出現(xiàn)“打醬油”等共15個(gè)候選目標(biāo)項(xiàng),占所有候選目標(biāo)項(xiàng)的80 %,并且各個(gè)候選目標(biāo)項(xiàng)出現(xiàn)的次數(shù)都超過(guò)了預(yù)設(shè)的次數(shù)。
S207、將待定搜索項(xiàng)對(duì)應(yīng)的搜索結(jié)果文本中候選目標(biāo)項(xiàng)的出現(xiàn)次數(shù)進(jìn)行累加,按照候選目標(biāo)項(xiàng)出現(xiàn)的總次數(shù)對(duì)待定搜索項(xiàng)進(jìn)行排序。
S208、根據(jù)排序結(jié)果確定搜索項(xiàng),將搜索項(xiàng)顯示給用戶,提示用戶可以用該搜索項(xiàng)進(jìn)行搜索。
現(xiàn)有技術(shù)中,多依賴于構(gòu)詞法或者統(tǒng)計(jì)特征來(lái)發(fā)現(xiàn)新詞或者流行語(yǔ),例如基于規(guī)則的新詞發(fā)現(xiàn)方法主要是利用構(gòu)詞法和詞型結(jié)構(gòu),建立新詞的匹配模式,由于流行語(yǔ)和新詞大都不是按照傳統(tǒng)的構(gòu)詞方式結(jié)合形成的,基于規(guī)則的方法無(wú)法涵蓋這些處于變化中的詞型結(jié)構(gòu),基于規(guī)則的方法往往限于某一領(lǐng)域;基于統(tǒng)計(jì)的方法是利用詞語(yǔ)的統(tǒng)計(jì)特性,先提取出新詞候選串,然后利用規(guī)則的方法排除;或者利用相似度計(jì)算,尋找相關(guān)度最大的字與字的組合,往往用于短詞的識(shí)別上。兩種方法都是以大量的相關(guān)語(yǔ)料和背景知識(shí)為前提的,對(duì)于網(wǎng)絡(luò)流行語(yǔ)的識(shí)別,不具有實(shí)用性,通用性也差。
此外,現(xiàn)有技術(shù)中還有利用一些輸入日志來(lái)完成的。通過(guò)對(duì)輸入日志的挖掘,進(jìn)行新詞的發(fā)現(xiàn)。如搜狗輸入法中的新詞發(fā)現(xiàn)。這種方法需要有大量的輸入日志,對(duì)于普通應(yīng)用,不具有可行性,其使用也受到很大限制。
本發(fā)明實(shí)施例所提供的方法,以搜索引擎為基礎(chǔ),結(jié)合用戶輸入的預(yù)設(shè)的新詞或者流行詞的搜索項(xiàng)協(xié)助用戶找到準(zhǔn)確的搜索項(xiàng),從而使用戶能夠通過(guò)準(zhǔn)確的搜索項(xiàng)找到準(zhǔn)確的新詞或者流行詞。本發(fā)明實(shí)施例所提供的方法不受領(lǐng)域的限制,同時(shí)也無(wú)需輸入大量的輸入日志,方便快捷,有極高的可用性。
實(shí)際應(yīng)用中,還可以根據(jù)本發(fā)明實(shí)施例所提供的方法獲得組合搜索項(xiàng)。例如,分別通過(guò)本發(fā)明實(shí)施例所提供的方法獲得搜索項(xiàng)“最新流行語(yǔ)”之后,利用搜索引擎進(jìn)行搜索獲得一目標(biāo)項(xiàng)為“打醬油”,需要進(jìn)一步獲得“打醬油”的英文對(duì)照。此時(shí),可以進(jìn)一步通過(guò)本發(fā)明實(shí)施例提供的方法,確定搜索英文對(duì)照時(shí)的準(zhǔn)確的搜索項(xiàng)。
例如,用戶輸入的預(yù)設(shè)搜索項(xiàng)為“中英對(duì)照”,并通過(guò)搜索引擎得到推薦搜索項(xiàng)包括中英互譯、英文釋義等等。而后,分別利用搜索引擎對(duì)這些待定搜索項(xiàng)進(jìn)行搜索,分別得到搜索結(jié)果頁(yè)面,從待定搜索項(xiàng)的搜索結(jié)果頁(yè)面中提取統(tǒng)一資源定位符。下載待定搜索項(xiàng)的搜索結(jié)果頁(yè)面中的統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)絡(luò)資源,獲得搜索結(jié)果文本。統(tǒng)計(jì)每個(gè)待定搜索項(xiàng)所對(duì)應(yīng)的所述結(jié)果文本中對(duì)應(yīng)的候選目標(biāo)項(xiàng)。這里的候選目標(biāo)項(xiàng)是為了確定中英文對(duì)照而確定的,用來(lái)從多個(gè)待定搜索項(xiàng)中的確定能夠用來(lái)準(zhǔn)確地找到中英文對(duì)照的搜索項(xiàng)。
例如,通過(guò)實(shí)施本發(fā)明實(shí)施例所提供的方法,最后確定“中英文對(duì)照”這個(gè)搜索項(xiàng)能夠準(zhǔn)確地找到中英文對(duì)照的相關(guān)內(nèi)容,那么將“打醬油”和“中英文”對(duì)照結(jié)合起來(lái),就能夠找到打醬油的中英文對(duì)照的內(nèi)容了。
需要說(shuō)明的是,當(dāng)使用本發(fā)明實(shí)施例所提供的方法確定的搜索項(xiàng)來(lái)搜索目標(biāo)項(xiàng)時(shí),目標(biāo)項(xiàng)仍然是存在于搜索結(jié)果頁(yè)面中的統(tǒng)一資源定位符所對(duì)應(yīng)的內(nèi)容當(dāng)中的,還需要從每個(gè)統(tǒng)一資源定位符對(duì)應(yīng)的頁(yè)面中將搜索項(xiàng)提取出來(lái)。實(shí)際應(yīng)用中,可以根據(jù)搜索項(xiàng)本身的特點(diǎn)來(lái)抽取搜索項(xiàng)。例如當(dāng)利用搜索引擎搜索“最新流行語(yǔ)”時(shí),可以從得到的統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)絡(luò)資源中提取由雙引號(hào)修飾的內(nèi)容作為最新流行語(yǔ)。
本發(fā)明實(shí)施例所提供的方法主要提供一種協(xié)助用戶找到能夠準(zhǔn)確地查找到目標(biāo)
8項(xiàng)的搜索項(xiàng)的方法,至于如何從根據(jù)該搜索項(xiàng)查找到的內(nèi)容中對(duì)目標(biāo)項(xiàng)進(jìn)行取舍,本發(fā)明不做限定。
參見(jiàn)圖3,本發(fā)明一實(shí)施例還提供一種確定搜索項(xiàng)的系統(tǒng),包括 第一獲取單元301,用于獲取待定搜索項(xiàng)集合; 本發(fā)明實(shí)施例中,所述待定搜索項(xiàng)包括預(yù)設(shè)搜索項(xiàng)和第一推薦搜索項(xiàng)。
搜索單元302,用于以待定搜索項(xiàng)集合中的各個(gè)待定搜索項(xiàng)為搜索條件,通過(guò)搜索引擎進(jìn)行搜索; 第二獲取單元303,用于從搜索結(jié)果中獲得搜索結(jié)果文本; 統(tǒng)計(jì)單元304,用于統(tǒng)計(jì)各個(gè)搜索結(jié)果文本中候選目標(biāo)項(xiàng)的出現(xiàn)次數(shù),并根據(jù)候選目標(biāo)項(xiàng)的出現(xiàn)次數(shù)對(duì)各個(gè)待定搜索項(xiàng)進(jìn)行排序; 確定單元305,用于根據(jù)排序結(jié)果從待定搜索項(xiàng)中確定搜索項(xiàng)。
參見(jiàn)圖4,本發(fā)明另一實(shí)施例中,所述第一獲取單元301包括 第一搜索子單元3011,用于通過(guò)搜索引擎對(duì)預(yù)設(shè)搜索項(xiàng)進(jìn)行搜索; 第一獲取子單元3012,用于根據(jù)所述預(yù)設(shè)搜索項(xiàng)的搜索結(jié)果獲得第一推薦搜索項(xiàng)。
本發(fā)明另一實(shí)施例中,所述待定搜索項(xiàng)還包括第二推薦搜索項(xiàng),所述第一獲取單元301還包括 第二搜索子單元3013,用于通過(guò)搜索引擎對(duì)第一推薦搜索項(xiàng)進(jìn)行搜索; 第二獲取子單元3014,用于根據(jù)所述第一推薦搜索項(xiàng)的搜索結(jié)果獲得第二推薦搜索項(xiàng)。
本發(fā)明實(shí)施例中,參見(jiàn)圖5,所述第二獲取單元303包括 提取子單元3031,用于從每個(gè)待定搜索項(xiàng)的搜索結(jié)果中提取統(tǒng)一資源定位符; 下載子單元3032,用于對(duì)每個(gè)統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)絡(luò)資源進(jìn)行下載,得到對(duì)應(yīng)的搜索結(jié)果文本。
具體地,本發(fā)明另一實(shí)施例中,圖3所示的裝置還包括 提示單元306,用于將搜索項(xiàng)顯示給用戶,提示用戶可以用該搜索項(xiàng)進(jìn)行搜索。
本發(fā)明實(shí)施例所提供的系統(tǒng),可以結(jié)合用戶輸入的預(yù)設(shè)搜索項(xiàng)協(xié)助用戶找到準(zhǔn)確的搜索項(xiàng),從而使用戶能夠通過(guò)準(zhǔn)確的搜索項(xiàng)找到準(zhǔn)確的目標(biāo)信息。
為了描述的方便,本發(fā)明實(shí)施例在描述裝置時(shí)以功能分為各種單元分別描述。當(dāng)然,在實(shí)施本發(fā)明時(shí)可以把各單元的功能在同一個(gè)或多個(gè)軟件和/或硬件中實(shí)現(xiàn)。
通過(guò)以上的實(shí)施方式的描述可知,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn)?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在存儲(chǔ)介質(zhì)中,如ROM/RAM、磁碟、光盤等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備 (可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。
本說(shuō)明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。
本發(fā)明可用于眾多通用或?qū)S玫挠?jì)算系統(tǒng)環(huán)境或配置中。例如個(gè)人計(jì)算機(jī)、服務(wù)器計(jì)算機(jī)、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、置頂盒、可編程的消費(fèi)電子設(shè)備、網(wǎng)絡(luò)PC、小型計(jì)算機(jī)、大型計(jì)算機(jī)、包括以上任何系統(tǒng)或設(shè)備的分布式計(jì)算環(huán)境等等。
本發(fā)明可以在由計(jì)算機(jī)執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計(jì)算環(huán)境中實(shí)踐本發(fā)明,在這些分布式計(jì)算環(huán)境中,由通過(guò)通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來(lái)執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中,程序模塊可以位于包括存儲(chǔ)設(shè)備在內(nèi)的本地和遠(yuǎn)程計(jì)算機(jī)存儲(chǔ)介質(zhì)中。
雖然通過(guò)實(shí)施例描繪了本發(fā)明,本領(lǐng)域普通技術(shù)人員知道,本發(fā)明有許多變形和變化而不脫離本發(fā)明的精神,希望所附的權(quán)利要求包括這些變形和變化而不脫離本發(fā)明的精神。
權(quán)利要求
1.一種確定搜索項(xiàng)的方法,其特征在于,包括 獲取待定搜索項(xiàng)集合;以待定搜索項(xiàng)集合中的各個(gè)待定搜索項(xiàng)為搜索條件,通過(guò)搜索引擎進(jìn)行搜索,并從搜索結(jié)果中獲得搜索結(jié)果文本;統(tǒng)計(jì)各個(gè)搜索結(jié)果文本中候選目標(biāo)項(xiàng)的出現(xiàn)次數(shù),并根據(jù)候選目標(biāo)項(xiàng)的出現(xiàn)次數(shù)對(duì)各個(gè)待定搜索項(xiàng)進(jìn)行排序;根據(jù)排序結(jié)果從待定搜索項(xiàng)中確定搜索項(xiàng)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述待定搜索項(xiàng)包括預(yù)設(shè)搜索項(xiàng)和第一推薦搜索項(xiàng)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,獲取待定搜索項(xiàng)包括 通過(guò)搜索引擎對(duì)預(yù)設(shè)搜索項(xiàng)進(jìn)行搜索;根據(jù)所述預(yù)設(shè)搜索項(xiàng)的搜索結(jié)果獲得第一推薦搜索項(xiàng)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述待定搜索項(xiàng)還包括第二推薦搜索項(xiàng);獲得第一推薦搜索項(xiàng)之后還包括通過(guò)搜索引擎對(duì)第一推薦搜索項(xiàng)進(jìn)行搜索;根據(jù)所述第一推薦搜索項(xiàng)的搜索結(jié)果獲得第二推薦搜索項(xiàng)。
5.根據(jù)權(quán)利要求1-4任意一項(xiàng)所述的方法,其特征在于,所述從搜索結(jié)果中獲得搜索結(jié)果文本包括從每個(gè)待定搜索項(xiàng)的搜索結(jié)果中提取統(tǒng)一資源定位符; 對(duì)每個(gè)統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)絡(luò)資源進(jìn)行下載,得到對(duì)應(yīng)的搜索結(jié)果文本。
6.一種確定搜索項(xiàng)的系統(tǒng),其特征在于,包括 第一獲取單元,用于獲取待定搜索項(xiàng)集合;搜索單元,用于以待定搜索項(xiàng)集合中的各個(gè)待定搜索項(xiàng)為搜索條件,通過(guò)搜索引擎進(jìn)行搜索;第二獲取單元,用于從搜索結(jié)果中獲得搜索結(jié)果文本;統(tǒng)計(jì)單元,用于統(tǒng)計(jì)各個(gè)搜索結(jié)果文本中候選目標(biāo)項(xiàng)的出現(xiàn)次數(shù),并根據(jù)候選目標(biāo)項(xiàng)的出現(xiàn)次數(shù)對(duì)各個(gè)待定搜索項(xiàng)進(jìn)行排序;確定單元,用于根據(jù)排序結(jié)果從待定搜索項(xiàng)中確定搜索項(xiàng)。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述待定搜索項(xiàng)包括預(yù)設(shè)搜索項(xiàng)和第一推薦搜索項(xiàng)。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述第一獲取單元包括 第一搜索子單元,用于通過(guò)搜索引擎對(duì)預(yù)設(shè)搜索項(xiàng)進(jìn)行搜索;第一獲取子單元,用于根據(jù)所述預(yù)設(shè)搜索項(xiàng)的搜索結(jié)果獲得第一推薦搜索項(xiàng)。
9.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述待定搜索項(xiàng)還包括第二推薦搜索項(xiàng), 所述第一獲取單元還包括第二搜索子單元,用于通過(guò)搜索引擎對(duì)第一推薦搜索項(xiàng)進(jìn)行搜索;第二獲取子單元,用于根據(jù)所述第一推薦搜索項(xiàng)的搜索結(jié)果獲得第二推薦搜索項(xiàng)。
10.根據(jù)權(quán)利要求6 9任意一項(xiàng)所述的系統(tǒng),其特征在于,所述第二獲取單元包括 提取子單元,用于從每個(gè)待定搜索項(xiàng)的搜索結(jié)果中提取統(tǒng)一資源定位符;下載子單元,用于對(duì)每個(gè)統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)絡(luò)資源進(jìn)行下載,得到對(duì)應(yīng)的搜索結(jié)果文本。
全文摘要
本發(fā)明實(shí)施例公開了一種確定搜索項(xiàng)的方法和系統(tǒng)。其中,所述方法包括獲取待定搜索項(xiàng)集合;以待定搜索項(xiàng)集合中的各個(gè)待定搜索項(xiàng)為搜索條件,通過(guò)搜索引擎進(jìn)行搜索,并從搜索結(jié)果中獲得搜索結(jié)果文本;統(tǒng)計(jì)各個(gè)搜索結(jié)果文本中候選目標(biāo)項(xiàng)的出現(xiàn)次數(shù),并根據(jù)候選目標(biāo)項(xiàng)的出現(xiàn)次數(shù)對(duì)各個(gè)待定搜索項(xiàng)進(jìn)行排序;根據(jù)排序結(jié)果從待定搜索項(xiàng)中確定搜索項(xiàng)。本發(fā)明實(shí)施例所提供的方法,可以結(jié)合用戶輸入的預(yù)設(shè)搜索項(xiàng)協(xié)助用戶在需要進(jìn)行搜索時(shí),通過(guò)準(zhǔn)確的搜索項(xiàng)找到準(zhǔn)確的目標(biāo)信息。
文檔編號(hào)G06F17/30GK102193932SQ20101012126
公開日2011年9月21日 申請(qǐng)日期2010年3月9日 優(yōu)先權(quán)日2010年3月9日
發(fā)明者于亮, 張宇峰 申請(qǐng)人:北京金山軟件有限公司, 北京金山數(shù)字娛樂(lè)科技有限公司