專利名稱:一種視頻搜索方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及搜索引擎技術(shù)領(lǐng)域,具體涉及一種視頻搜索方法及系統(tǒng)。
背景技術(shù):
隨著視頻網(wǎng)絡(luò)應(yīng)用的普及和發(fā)展,涌現(xiàn)出很多視頻網(wǎng)站,同時(shí)也出現(xiàn)不少的視頻搜索網(wǎng)站。目前,這些視頻搜索網(wǎng)站的功能實(shí)現(xiàn),還是基于傳統(tǒng)的搜索引擎技術(shù),即基于文本信息的檢索。現(xiàn)有技術(shù)一種視頻搜索的方法流程具體可以包括:步驟1、接收用戶的搜索詞;所述搜索詞通常為用戶在視頻搜索網(wǎng)站中輸入;步驟2、對(duì)所述搜索詞進(jìn)行識(shí)別,得到識(shí)別后搜索詞;步驟3、依據(jù)所述識(shí)別后搜索詞在數(shù)據(jù)庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果;步驟4、將所述搜索結(jié)果展示給用戶。對(duì)于搜索引擎而言,其搜索準(zhǔn)確度和搜索速度均是衡量其性能的重要指標(biāo)。然而現(xiàn)有技術(shù)不可避免地存在一些問(wèn)題。例如,由于搜索詞的隨意性大,導(dǎo)致某些識(shí)別后搜索詞得不到對(duì)應(yīng)的搜索結(jié)果,或者,識(shí)別或檢索所花費(fèi)的時(shí)間過(guò)長(zhǎng),導(dǎo)致搜索速度的低下,等等,這些都會(huì)影響視頻搜索的準(zhǔn)確度和速度,降低用戶的搜索體驗(yàn)??傊?,需要本領(lǐng)域技術(shù)人員迫切解決的一個(gè)技術(shù)問(wèn)題就是:如何能夠提高視頻搜索的準(zhǔn)確度和速度。
發(fā)明內(nèi)容
鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的一種視頻搜索方法及系統(tǒng)。依據(jù)本發(fā)明的一個(gè)方面,提供了一種視頻搜索方法,包括:接收來(lái)自客戶端的訪問(wèn)請(qǐng)求;對(duì)所述訪問(wèn)請(qǐng)求中的搜索詞進(jìn)行哈希計(jì)算,生成對(duì)應(yīng)的搜索詞主鍵;調(diào)用內(nèi)存中的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的準(zhǔn)確詞,作為糾錯(cuò)后搜索詞;所述哈希表為依據(jù)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)建立;依據(jù)所述糾錯(cuò)后搜索詞在影視庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果;將所述搜索結(jié)果返回給客戶端,由客戶端在加載的網(wǎng)頁(yè)中展示所述搜索結(jié)果??蛇x地,所述哈希表包括糾錯(cuò)熱詞庫(kù)、糾錯(cuò)長(zhǎng)效詞庫(kù)及糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表;所述糾錯(cuò)熱詞庫(kù)、糾錯(cuò)長(zhǎng)效詞庫(kù)及糾錯(cuò)全詞庫(kù)分別用于記錄熱門視頻、長(zhǎng)視頻及所有視頻的名稱對(duì)應(yīng)的錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系;所述調(diào)用內(nèi)存中的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞的步驟,包括:調(diào)用內(nèi)存中的糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞;
在糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞;在糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表查找失敗時(shí),調(diào)用內(nèi)存中的糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞;在糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞;在糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表查找失敗時(shí),調(diào)用內(nèi)存中的糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞;在糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞。可選地,通過(guò)如下步驟收集所述錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系:將視頻的名稱作為準(zhǔn)確詞,及將該視頻的名稱對(duì)應(yīng)的別名、縮寫、拼音、錯(cuò)字、漏字或多字作為錯(cuò)誤詞;或者在所述糾錯(cuò)后搜索詞得不到對(duì)應(yīng)的搜索結(jié)果時(shí),依據(jù)所述糾錯(cuò)后搜索詞對(duì)應(yīng)的糾錯(cuò)前搜索詞在其它搜索引擎中進(jìn)行視頻的搜索,將得到的搜索結(jié)果對(duì)應(yīng)視頻的名稱作為準(zhǔn)確詞,及將所述糾錯(cuò)前搜索詞作為錯(cuò)誤詞。可選地,通過(guò)如下步驟獲取所述熱門視頻;對(duì)搜索日志進(jìn)行分析,得到預(yù)置的時(shí)間段內(nèi)視頻的播放頻率和/或搜索頻率,并將播放頻率和/或搜索頻率符合預(yù)置條件的視頻作為熱門視頻;所述搜索日志中記錄有用戶的搜索詞及用戶播放的視頻;或依據(jù)預(yù)置的時(shí)間段內(nèi)的熱門事件,收集相應(yīng)的視頻,作為熱門視頻??蛇x地,客戶端接收訪問(wèn)請(qǐng)求,并發(fā)送至第一服務(wù)端;第一服務(wù)端接收來(lái)自客戶端的訪問(wèn)請(qǐng)求,并發(fā)送至第二服務(wù)端;所述第二服務(wù)端對(duì)所述訪問(wèn)請(qǐng)求中的搜索詞進(jìn)行哈希計(jì)算,生成對(duì)應(yīng)的搜索詞主鍵,調(diào)用內(nèi)存中的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的準(zhǔn)確詞,作為糾錯(cuò)后搜索詞,并返回給所述第一服務(wù)端;所述第一服務(wù)端將所述糾錯(cuò)后搜索詞發(fā)送至第三服務(wù)端;所述第三服務(wù)端依據(jù)所述糾錯(cuò)后搜索詞在影視庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果,并返回給所述第一服務(wù)器端;所述第一服務(wù)端將所述搜索結(jié)果返回給所述客戶端,由所述客戶端在加載的網(wǎng)頁(yè)中展示所述搜索結(jié)果??蛇x地,通過(guò)如下步驟建立所述哈希表:對(duì)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)中的錯(cuò)誤詞進(jìn)行哈希運(yùn)算,生成對(duì)應(yīng)的主鍵,并將主鍵對(duì)應(yīng)的準(zhǔn)確詞作為鍵值構(gòu)建哈希表。可選地,所述影視庫(kù)包括存儲(chǔ)熱門影視庫(kù)和普通影視庫(kù);其中,所述熱門影視庫(kù)用于針對(duì)熱門視頻存儲(chǔ)搜索詞和對(duì)應(yīng)的搜索結(jié)果,所述普通影視庫(kù)用于針對(duì)除熱門視頻之外視頻存儲(chǔ)搜索詞和對(duì)應(yīng)的搜索結(jié)果;所述方法還包括:將所述糾錯(cuò)后搜索詞并行分發(fā)至熱門影視服務(wù)端和普通影視服務(wù)端,由所述熱門影視服務(wù)端和普通影視服務(wù)端分別依據(jù)所述糾錯(cuò)后搜索詞在熱門影視庫(kù)和普通影視庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果,并返回:對(duì)所述熱門影視服務(wù)端和普通影視服務(wù)端返回的搜索結(jié)果進(jìn)行合并處理,得到合并處理后的搜索結(jié)果;將所述合并處理后的搜索結(jié)果返回給所述客戶端,由所述客戶端在加載的網(wǎng)頁(yè)中展示所述合并處理后的搜索結(jié)果??蛇x地,所述影視庫(kù)存儲(chǔ)于高速存儲(chǔ)節(jié)點(diǎn)之上;所述高速存儲(chǔ)節(jié)點(diǎn)包括內(nèi)存節(jié)點(diǎn)或者固態(tài)硬盤節(jié)點(diǎn)。根據(jù)本發(fā)明的另一方面,提供了一種視頻搜索系統(tǒng),包括:接收單元,適于接收來(lái)自客戶端的訪問(wèn)請(qǐng)求;搜索詞運(yùn)算單元,適于對(duì)所述訪問(wèn)請(qǐng)求中的搜索詞進(jìn)行哈希計(jì)算,生成對(duì)應(yīng)的搜索詞主鍵;糾錯(cuò)單元,適于調(diào)用內(nèi)存中的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的準(zhǔn)確詞,作為糾錯(cuò)后搜索詞;所述哈希表為依據(jù)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)建立;檢索單元,適于依據(jù)所述糾錯(cuò)后搜索詞在影視庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果;及搜索結(jié)果加載單元,適于將所述搜索結(jié)果返回給所述客戶端,由所述客戶端在加載的網(wǎng)頁(yè)中展示所述搜索結(jié)果??蛇x地,所述哈希表包括糾錯(cuò)熱詞庫(kù)、糾錯(cuò)長(zhǎng)效詞庫(kù)及糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表;所述糾錯(cuò)熱詞庫(kù)、糾錯(cuò)長(zhǎng)效詞庫(kù)及糾錯(cuò)全詞庫(kù)分別用于記錄熱門視頻、長(zhǎng)視頻及所有視頻的名稱對(duì)應(yīng)的錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系;所述糾錯(cuò)單元包括:第一匹配模塊,適于調(diào)用內(nèi)存中的糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞王鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞;第一糾錯(cuò)成功模塊,適于在糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞;第二匹配模塊,適于在糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表查找失敗時(shí),調(diào)用內(nèi)存中的糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞;第二糾錯(cuò)成功模塊,適于在糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞;第三匹配模塊,適于在糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表查找失敗時(shí),調(diào)用內(nèi)存中的糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞;及第三糾錯(cuò)成功模塊,適于在糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞??蛇x地,所述系統(tǒng)還包括:適于收集所述錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系的收集單元;所述收集單元包括:第一收集模塊,適于將視頻的名稱作為準(zhǔn)確詞,及將該視頻的名稱對(duì)應(yīng)的別名、縮寫、拼音、錯(cuò)字、漏字或多字作為錯(cuò)誤詞;或者第二收集模塊,適于在所述糾錯(cuò)后搜索詞得不到對(duì)應(yīng)的搜索結(jié)果時(shí),依據(jù)所述糾錯(cuò)后搜索詞對(duì)應(yīng)的糾錯(cuò)前搜索詞在其它搜索引擎中進(jìn)行視頻的搜索,將得到的搜索結(jié)果對(duì)應(yīng)視頻的名稱作為準(zhǔn)確詞,及將所述糾錯(cuò)前搜索詞作為錯(cuò)誤詞。
可選地,所述系統(tǒng)還包括:適于獲取所述熱門視頻的視頻獲取單元;所述視頻獲取單元包括:第一視頻獲取模塊,適于對(duì)搜索日志進(jìn)行分析,得到預(yù)置的時(shí)間段內(nèi)視頻的播放頻率和/或搜索頻率,并將播放頻率和/或搜索頻率符合預(yù)置條件的視頻作為熱門視頻;所述搜索日志中記錄有用戶的搜索詞及用戶播放的視頻;或者,第二視頻獲取模塊,適于依據(jù)預(yù)置的時(shí)間段內(nèi)的熱門事件,收集相應(yīng)的視頻,作為熱門視頻??蛇x地,所述系統(tǒng)還包括:客戶端、第一服務(wù)端、第二服務(wù)端和第三服務(wù)端;其中,所述客戶端接收訪問(wèn)請(qǐng)求,并發(fā)送至第一服務(wù)端;所述第一服務(wù)端接收來(lái)自客戶端的訪問(wèn)請(qǐng)求,并發(fā)送至所述第二服務(wù)端;所述第二服務(wù)端對(duì)所述訪問(wèn)請(qǐng)求中的搜索詞進(jìn)行哈希計(jì)算,生成對(duì)應(yīng)的搜索詞主鍵,調(diào)用內(nèi)存中的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的準(zhǔn)確詞,作為糾錯(cuò)后搜索詞,并返回給所述第一服務(wù)端;所述第一服務(wù)端將所述糾錯(cuò)后搜索詞發(fā)送至所述第三服務(wù)端;所述第三服務(wù)端依據(jù)所述糾錯(cuò)后搜索詞在影視庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果,并返回給所述第一服務(wù)器端;所述第一服務(wù)端將所述搜索結(jié)果返回給所述客戶端,由所述客戶端在加載的網(wǎng)頁(yè)中展示所述搜索結(jié)果。可選地,所述系統(tǒng)還包括:適于建立所述哈希表的哈希表建立模塊,所述哈希表建立模塊對(duì)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)中的錯(cuò)誤詞進(jìn)行哈希運(yùn)算,生成對(duì)應(yīng)的主鍵,并將主鍵對(duì)應(yīng)的準(zhǔn)確詞作為鍵值構(gòu)建哈希表??蛇x地,所述影視庫(kù)包括存儲(chǔ)熱門影視庫(kù)和普通影視庫(kù);其中,所述熱門影視庫(kù)用于針對(duì)熱門視頻存儲(chǔ)搜索詞和對(duì)應(yīng)的搜索結(jié)果,所述普通影視庫(kù)用于針對(duì)除熱門視頻之外視頻存儲(chǔ)搜索詞和對(duì)應(yīng)的搜索結(jié)果;則所述系統(tǒng)還包括:并行分發(fā)單元,適于將所述糾錯(cuò)后搜索詞并行分發(fā)至熱門影視服務(wù)端和普通影視服務(wù)端,由所述熱門影視服務(wù)端和普通影視服務(wù)端分別依據(jù)所述糾錯(cuò)后搜索詞在熱門影視庫(kù)和普通影視庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果,并返回:合并處理單元,適于對(duì)所述熱門影視服務(wù)端和普通影視服務(wù)端返回的搜索結(jié)果進(jìn)行合并處理,得到合并處理后的搜索結(jié)果;所述搜索結(jié)果加載單元還適于,將所述合并處理后的搜索結(jié)果返回給客戶端,由客戶端在加載的網(wǎng)頁(yè)中展示所述合并處理后的搜索結(jié)果??蛇x地,所述影視庫(kù)存儲(chǔ)于高速存儲(chǔ)節(jié)點(diǎn)之上;所述高速存儲(chǔ)節(jié)點(diǎn)包括內(nèi)存節(jié)點(diǎn)或者固態(tài)硬盤節(jié)點(diǎn)。本發(fā)明的一種視頻搜索方法及系統(tǒng)具有如下有益效果:由于搜索詞的隨意性大,經(jīng)常由于別名、縮寫、拼音、錯(cuò)字等原因無(wú)法得到對(duì)應(yīng)的搜索結(jié)果;而本發(fā)明依據(jù)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系,對(duì)用戶的搜索詞進(jìn)行糾錯(cuò),能夠?qū)ι鲜鲈驅(qū)е碌乃阉髟~進(jìn)行糾錯(cuò),使得糾錯(cuò)后搜索詞糾錯(cuò)后搜索詞能夠具有準(zhǔn)確的搜索結(jié)果;并且,本發(fā)明將錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系存儲(chǔ)至哈希表中,由于哈希表是根據(jù)鍵值對(duì)(Key-value)而直接進(jìn)行內(nèi)存訪問(wèn)的數(shù)據(jù)結(jié)構(gòu)。其能夠通過(guò)把鍵值對(duì)映射到表中一個(gè)位置來(lái)訪問(wèn)內(nèi)存記錄,故能夠加快查找的速度,從而能夠提高視頻搜索的速度。上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式
。
通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種視頻搜索方法的流程圖;圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種視頻搜索方法的流程圖;圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種視頻搜索方法的流程圖;圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種視頻搜索方法的流程圖;以及圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種視頻搜索系統(tǒng)的結(jié)構(gòu)圖。
具體實(shí)施例方式下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。參照?qǐng)D1,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種視頻搜索方法實(shí)施例的流程圖,具體可以包括:步驟101、接收來(lái)自客戶端的訪問(wèn)請(qǐng)求;在實(shí)際應(yīng)用中,用戶可通過(guò)某種設(shè)備(如計(jì)算機(jī)、手機(jī)、平板電腦燈)在客戶端上產(chǎn)生訪問(wèn)請(qǐng)求,所述訪問(wèn)請(qǐng)求中通常攜帶有搜索詞。步驟102、對(duì)所述訪問(wèn)請(qǐng)求中的搜索詞進(jìn)行哈希計(jì)算,生成對(duì)應(yīng)的搜索詞主鍵;步驟103、調(diào)用內(nèi)存中的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的準(zhǔn)確詞,作為糾錯(cuò)后搜索詞;所述哈希表為依據(jù)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)建立;本發(fā)明實(shí)施例的錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系可用于反映得不到搜索結(jié)果的搜索詞的一些特性;其中,這些特性可基于對(duì)得不到搜索結(jié)果的搜索詞進(jìn)行的分析得到。例如,本發(fā)明實(shí)施例通過(guò)分析得知,搜索詞的隨意性大,經(jīng)常由于別名、縮寫、拼音、錯(cuò)字等原因無(wú)法得到對(duì)應(yīng)的搜索結(jié)果,故在本發(fā)明的一種優(yōu)選實(shí)施例中,可以依據(jù)所述別名、縮寫、拼音、錯(cuò)字等特性,收集所述錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系,具體可以包括:子步驟S101、將視頻的名稱作為準(zhǔn)確詞,及將該視頻的名稱對(duì)應(yīng)的別名、縮寫、拼音、錯(cuò)字、漏字或多字作為錯(cuò)誤詞。以“后宮甄嫘傳”這部電視劇為例,對(duì)相應(yīng)得不到搜索結(jié)果的搜索詞的特性進(jìn)行說(shuō)明:有些用戶想要搜索這部電視劇,但又不知道其全名,只好輸入其別名、縮寫來(lái)進(jìn)行搜索,相應(yīng)的搜索詞為“后宮”、“甄嫘傳”等等;有些用戶在輸入其別名或縮寫的過(guò)程中,本意是通過(guò)空格鍵上屏相應(yīng)的漢字,但是不小心按到了回車鍵,此種情況下輸入的搜索詞為“hougong”、“zhenhuan”等等;有些用戶在輸入縮寫“甄嫘傳”的過(guò)程中,不知道這幾個(gè)字的寫法,導(dǎo)致輸入了錯(cuò)字,此種情況下輸入的搜索詞為“真換轉(zhuǎn)”;當(dāng)然,還有漏字或多字的情形出現(xiàn),例如漏字對(duì)應(yīng)的搜索詞為“后宮甄嫘”,多字對(duì)應(yīng)的搜索詞為“后宮甄嫘傳記”等等。在具體實(shí)現(xiàn)中,可以針對(duì)每一部視頻,將視頻的名稱作為準(zhǔn)確詞,及將該視頻的名稱對(duì)應(yīng)的別名、縮寫、拼音、錯(cuò)字、漏字或多字作為錯(cuò)誤詞,以收集所述錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系??梢岳斫猓谛略龌騽h除視頻時(shí),本發(fā)明實(shí)施例可以依據(jù)視頻的相應(yīng)變化,對(duì)所述錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系進(jìn)行維護(hù)。在本發(fā)明的一種優(yōu)選實(shí)施例中,還可以依據(jù)用戶的搜索行為自動(dòng)學(xué)習(xí)所述錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系,具體地,可以通過(guò)如下步驟收集所述錯(cuò)誤詞和準(zhǔn)確詞之間的映身寸關(guān)系:子步驟S102、在所述糾錯(cuò)后搜索詞得不到對(duì)應(yīng)的搜索結(jié)果時(shí),依據(jù)所述糾錯(cuò)后搜索詞對(duì)應(yīng)的糾錯(cuò)前搜索詞在其它搜索引擎中進(jìn)行視頻的搜索,將得到的搜索結(jié)果對(duì)應(yīng)視頻的名稱作為準(zhǔn)確詞,及將所述糾錯(cuò)前搜索詞作為錯(cuò)誤詞。本優(yōu)選實(shí)施例的自動(dòng)學(xué)習(xí)可以適用于新增視頻但未維護(hù)所述錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系的關(guān)系,或者,可以適用于影視庫(kù)中未有的視頻。例如,在“江南style”視頻流行之前,當(dāng)前可能不存在相應(yīng)的所述錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系的關(guān)系,甚至影視庫(kù)中不存在該視頻,因此,糾錯(cuò)后搜索詞等同于糾錯(cuò)前搜索詞,得不到對(duì)應(yīng)的搜索結(jié)果。而依據(jù)所述糾錯(cuò)后搜索詞對(duì)應(yīng)的糾錯(cuò)前搜索詞在其它搜索引擎中進(jìn)行視頻的搜索,則會(huì)得到想要的視頻及名稱。因此,本優(yōu)選實(shí)施例還可以適用于影視庫(kù)中視頻的擴(kuò)充。在實(shí)際應(yīng)用中,可以將所述錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)存放至數(shù)據(jù)庫(kù)(如各種詞庫(kù))等各種數(shù)據(jù)結(jié)構(gòu)中。為了提高視頻搜索的速度,本發(fā)明實(shí)施例在提供搜索服務(wù)前,會(huì)將錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系存儲(chǔ)至哈希(Hash)表中,由于哈希表是根據(jù)鍵值對(duì)(Key-value)而直接進(jìn)行內(nèi)存訪問(wèn)的數(shù)據(jù)結(jié)構(gòu)。其能夠通過(guò)把鍵值對(duì)映射到表中一個(gè)位置來(lái)訪問(wèn)內(nèi)存記錄,故能夠加快查找的速度,從而能夠提高視頻搜索的速度。在本發(fā)明的一種優(yōu)選實(shí)施例中,可以對(duì)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)中的錯(cuò)誤詞進(jìn)行哈希運(yùn)算,生成對(duì)應(yīng)的主鍵(Key ),并主鍵對(duì)應(yīng)的準(zhǔn)確詞作為鍵值(Value )構(gòu)建哈希表。在實(shí)際應(yīng)用中,Hash算法通??梢园?循環(huán)冗余校驗(yàn)碼(CRC,CyclicRedundancy Check)算法 32、信息-摘要算法(MD5 算法,Message_DigestAlgorithm5)以及安全哈希算法(SHA, Secure HashAlgorithm)等等。通常采用Hash算法對(duì)數(shù)據(jù)串進(jìn)行數(shù)字化后生成一個(gè)主鍵(Key)值,再用Key值對(duì)一個(gè)較大的質(zhì)數(shù)M取余,得到鍵值對(duì)在內(nèi)存中的位置。可以理解,本發(fā)明實(shí)施例對(duì)具體的Hash算法不加以限制。當(dāng)需要查找哈希表中數(shù)據(jù)時(shí),首先對(duì)需要查詢的數(shù)據(jù)利用Hash算法進(jìn)行處理,得到Key值,接著對(duì)存儲(chǔ)的Hash表采用的質(zhì)數(shù)M進(jìn)行取余定位該數(shù)據(jù)在Hash表中的位置,然后在定位的位置查詢獲取Key值對(duì)應(yīng)的數(shù)據(jù)。需要說(shuō)明的是,步驟101和步驟103中應(yīng)采用相同的Hash算法進(jìn)行處理以得到Key值。步驟104、依據(jù)所述糾錯(cuò)后搜索詞在影視庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果;步驟105、將所述搜索結(jié)果返回給客戶端,由客戶端在加載的網(wǎng)頁(yè)中展示所述搜索結(jié)果。本發(fā)明可以應(yīng)用于各種視頻搜索引擎,在實(shí)際應(yīng)用中,視頻搜索引擎可以依據(jù)所述搜索結(jié)果產(chǎn)生搜索結(jié)果頁(yè)面代碼,并返回給客戶端,由客戶端通過(guò)加載所述搜索結(jié)果頁(yè)面代碼形成搜索結(jié)果頁(yè)面,進(jìn)行所述搜索結(jié)果的展示??梢岳斫?,本發(fā)明實(shí)施例對(duì)具體的視頻搜索引擎和具體客戶端的展示方式不加以限制。在實(shí)際應(yīng)用中,可以將錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)、影視庫(kù)數(shù)據(jù)等數(shù)據(jù)源存儲(chǔ)在存儲(chǔ)速度較高的存儲(chǔ)介質(zhì)中,以便于加快讀取數(shù)據(jù)的速度,這些存儲(chǔ)速度較高的存儲(chǔ)介質(zhì)通常為高速存儲(chǔ)節(jié)點(diǎn)(緩存節(jié)點(diǎn)),例如,可以包括內(nèi)存節(jié)點(diǎn)或者固態(tài)硬盤節(jié)點(diǎn)等
坐寸ο在此提供一種內(nèi)存節(jié)點(diǎn)的示例。在本發(fā)明的一種優(yōu)選實(shí)施例中,所述影視庫(kù)還可以用于通過(guò)鍵值對(duì)的方式存儲(chǔ)搜索詞和對(duì)應(yīng)的搜索結(jié)果;或者,所述影視庫(kù)用于通過(guò)鍵值對(duì)的方式存儲(chǔ)某視頻類別下的搜索詞和對(duì)應(yīng)的搜索結(jié)果;其中,搜索詞作為主鍵,搜索詞對(duì)應(yīng)的搜索結(jié)果作為鍵值。所述鍵值對(duì)與哈希表的原理類似,為直接進(jìn)行內(nèi)存訪問(wèn)的數(shù)據(jù)結(jié)構(gòu)。其能夠通過(guò)把鍵值對(duì)映射到表中一個(gè)位置來(lái)訪問(wèn)內(nèi)存記錄,故能夠加快步驟105的檢索速度,從而能夠提高視頻搜索的速度。上述視頻類別為劃分得到,如電影、電視劇、綜藝、動(dòng)漫、娛樂(lè)、體育等等。通常所有視頻的數(shù)量非常龐大,這樣導(dǎo)致搜索詞和對(duì)應(yīng)的搜索結(jié)果的數(shù)量通常龐大,如果逐個(gè)檢索則容易影響檢索效率;而各視頻類別下的搜索詞和對(duì)應(yīng)的搜索結(jié)果通常占用所有視頻的部分空間,因此具有檢索速度快的優(yōu)點(diǎn)。參照?qǐng)D2,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種視頻搜索方法實(shí)施例的流程圖,具體可以包括:步驟201、對(duì)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)中的錯(cuò)誤詞進(jìn)行哈希運(yùn)算,生成對(duì)應(yīng)的主鍵,并將主鍵對(duì)應(yīng)的準(zhǔn)確詞作為鍵值構(gòu)建哈希表;所述哈希表具體可以包括糾錯(cuò)熱詞庫(kù)、糾錯(cuò)長(zhǎng)效詞庫(kù)及糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表;所述糾錯(cuò)熱詞庫(kù)、糾錯(cuò)長(zhǎng)效詞庫(kù)及糾錯(cuò)全詞庫(kù)可分別用于記錄熱門視頻、長(zhǎng)視頻及所有視頻的名稱對(duì)應(yīng)的錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系;步驟202、接收來(lái)自客戶端的訪問(wèn)請(qǐng)求;步驟203、對(duì)所述訪問(wèn)請(qǐng)求中的搜索詞進(jìn)行哈希計(jì)算,生成對(duì)應(yīng)的搜索詞主鍵;步驟204、調(diào)用內(nèi)存中的糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞;步驟205、在糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞;步驟206、在糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表查找失敗時(shí),調(diào)用內(nèi)存中的糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞;步驟207、在糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞;
步驟208、在糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表查找失敗時(shí),調(diào)用內(nèi)存中的糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞;步驟209、在糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞;步驟210、依據(jù)所述糾錯(cuò)后搜索詞在影視庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果;步驟211、將所述搜索結(jié)果返回給客戶端,由客戶端在加載的網(wǎng)頁(yè)中展示所述搜索結(jié)果。前面提到,本發(fā)明實(shí)施例可以將所述錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)存放至各種詞庫(kù)中。本發(fā)明實(shí)施例具體設(shè)置糾錯(cuò)熱詞庫(kù)、糾錯(cuò)長(zhǎng)效詞庫(kù)及糾錯(cuò)全詞庫(kù),其中,糾錯(cuò)熱詞庫(kù)以分別記錄熱門視頻、長(zhǎng)視頻及所有視頻的名稱對(duì)應(yīng)的錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系O其中,熱門視頻用于表示在某段時(shí)間內(nèi)比較受關(guān)注的視頻,通常熱門視頻的時(shí)效性高而短,例如在某段時(shí)間內(nèi)可能被搜索并播放多次,但是過(guò)了該段時(shí)間就無(wú)人問(wèn)津;糾錯(cuò)熱詞庫(kù)與熱門視頻的時(shí)效性相應(yīng);長(zhǎng)視頻一般指超過(guò)預(yù)置播放時(shí)間(如半個(gè)小時(shí))的視頻,這里對(duì)播放時(shí)間進(jìn)行限制是為了保證視頻的正規(guī)性,可以將非正規(guī)視頻排除在外,因?yàn)橥ǔ€(gè)人錄制的非正規(guī)的視頻大多比較簡(jiǎn)短,在實(shí)際中,長(zhǎng)視頻以影視劇、綜藝為主;通常長(zhǎng)視頻的時(shí)效性中等且長(zhǎng),其在長(zhǎng)期的時(shí)間內(nèi)都有可能被搜索并播放;糾錯(cuò)長(zhǎng)效詞庫(kù)與長(zhǎng)視頻的時(shí)效性相應(yīng);所有視頻可以泛指影視庫(kù)中所有的視頻,其既可以包括上述熱門視頻和長(zhǎng)視頻,又可以包括一些冷門視頻、非正規(guī)視頻,其中,冷門視頻和非正規(guī)視頻的時(shí)效性較差;糾錯(cuò)全詞庫(kù)與所有視頻的效力相應(yīng)?,F(xiàn)有技術(shù)中通常僅有所有視頻的概念,但由于所有視頻的數(shù)量龐大,使得糾錯(cuò)全詞庫(kù)的容量龐大,如果直接使用糾錯(cuò)全詞庫(kù)對(duì)搜索詞進(jìn)行糾錯(cuò),則在糾錯(cuò)時(shí)需要進(jìn)行逐個(gè)匹配和查找,影響查找效率。為了提高查找效率,本發(fā)明實(shí)施例在利用所述錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)對(duì)搜索詞進(jìn)行糾錯(cuò)時(shí),采用糾錯(cuò)熱詞庫(kù)一糾錯(cuò)長(zhǎng)效詞庫(kù)一糾錯(cuò)全詞庫(kù)的先后順序,由于糾錯(cuò)熱詞庫(kù)的時(shí)效性最高,命中的概率最大,糾錯(cuò)長(zhǎng)效詞庫(kù)的時(shí)效性中等,命中的概率也較大,更重要的是,由于糾錯(cuò)熱詞庫(kù)和糾錯(cuò)長(zhǎng)效詞庫(kù)的容量均小于糾錯(cuò)全詞庫(kù)的容量,故本發(fā)明采用的先后順序能夠減少糾錯(cuò)時(shí)的匹配和查找操作,提高查找效率。需要說(shuō)明的是,為了保證視頻搜索的速度,本發(fā)明實(shí)施例在采用糾錯(cuò)熱詞庫(kù),糾錯(cuò)長(zhǎng)效詞庫(kù)或糾錯(cuò)全詞庫(kù)進(jìn)行匹配時(shí),也是首先將各詞庫(kù)的數(shù)據(jù)存儲(chǔ)至哈希表中,然后調(diào)用內(nèi)存中的各詞庫(kù)對(duì)應(yīng)的哈希表進(jìn)行查找的,在此不作贅述。本發(fā)明實(shí)施例可以提供如下獲取所述熱門視頻的方案:獲取方案1、獲取方案I對(duì)搜索日志進(jìn)行分析,得到預(yù)置的時(shí)間段內(nèi)視頻的播放頻率和/或搜索頻率,并將播放頻率和/或搜索頻率符合預(yù)置條件的視頻作為熱門視頻;所述搜索日志中通常記錄有用戶的搜索詞及用戶播放的視頻。在本發(fā)明的一種應(yīng)用示例中,分析得到播放頻率的過(guò)程可以為:依據(jù)搜索日志,統(tǒng)計(jì)預(yù)置的時(shí)間段內(nèi)視頻的播放次數(shù),按照播放次數(shù)從大到小的順序?qū)λy(tǒng)計(jì)的視頻進(jìn)行排列,并取排在前M位的視頻,作為熱門視頻;這里M為正整數(shù),可由本領(lǐng)域技術(shù)人員依據(jù)實(shí)際情況確定。在本發(fā)明的另一種應(yīng)用示例中,分析得到搜索頻率的過(guò)程可以為:依據(jù)搜索日志,統(tǒng)計(jì)預(yù)置的時(shí)間段內(nèi)搜索詞的出現(xiàn)次數(shù),按照出現(xiàn)次數(shù)從大到小的順序?qū)λy(tǒng)計(jì)的搜索詞進(jìn)行排列,取排在前N位的搜索詞,所述排在前N位的搜索詞對(duì)應(yīng)的視頻作為熱門視頻;這里N為正整數(shù),可由本領(lǐng)域技術(shù)人員依據(jù)實(shí)際情況確定。需要說(shuō)明的是,預(yù)置的時(shí)間段可由本領(lǐng)域技術(shù)人員依據(jù)實(shí)際情況確定,如最近一周,最近2天,最近I天等等,本發(fā)明實(shí)施例采用預(yù)置的時(shí)間段是為了保證熱門視頻的時(shí)效性,而不會(huì)對(duì)具體的預(yù)置的時(shí)間段加以限制。獲取方案2、獲取方案2依據(jù)預(yù)置的時(shí)間段內(nèi)的熱門事件,收集相應(yīng)的視頻,作為熱門視頻。熱門事件屬于網(wǎng)絡(luò)文化的一種。即最近身邊發(fā)生的熱門新聞事件,而且熱門事件往往具有對(duì)應(yīng)的視頻,這些視頻的長(zhǎng)度通常較小(如小于10分鐘),在實(shí)際中可通過(guò)收集得到;另外,為了保證熱門視頻的時(shí)效性,應(yīng)采用較短的周期(如每隔I小時(shí),每隔30分鐘,每隔10分鐘等等)進(jìn)行熱門事件的視頻的收集。參照?qǐng)D3,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種視頻搜索方法實(shí)施例的流程圖,具體可以包括:步驟301、客戶端接收訪問(wèn)請(qǐng)求,并發(fā)送至第一服務(wù)端;步驟302、第一服務(wù)端接收來(lái)自客戶端的訪問(wèn)請(qǐng)求,并發(fā)送至第二服務(wù)端;步驟303、所述第二服務(wù)端對(duì)所述訪問(wèn)請(qǐng)求中的搜索詞進(jìn)行哈希計(jì)算,生成對(duì)應(yīng)的搜索詞主鍵,調(diào)用內(nèi)存中的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的準(zhǔn)確詞,作為糾錯(cuò)后搜索詞,并返回給所述第一服務(wù)端;所述哈希表為依據(jù)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)建立;步驟304、所述第一服務(wù)端將所述糾錯(cuò)后搜索詞發(fā)送至第三服務(wù)端;步驟305、所述第三服務(wù)端依據(jù)所述糾錯(cuò)后搜索詞在影視庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果,并返回給所述第一服務(wù)器端;步驟306、所述第一服務(wù)端將所述搜索結(jié)果返回給所述客戶端,由所述客戶端在加載的網(wǎng)頁(yè)中展示所述搜索結(jié)果。通常,由于受硬件的限制,一臺(tái)服務(wù)器或一個(gè)服務(wù)端的處理能力是有限的,如果采用一個(gè)服務(wù)端處理整個(gè)搜索過(guò)程中的操作,則容易導(dǎo)致能處理的用戶請(qǐng)求數(shù)目較小,從而導(dǎo)致吞吐量的減??;而本實(shí)施例采用三個(gè)服務(wù)端處理整個(gè)搜索過(guò)程中的操作,則能夠提高處理的用戶請(qǐng)求數(shù)目,從而能夠提高系統(tǒng)的吞吐量。需要說(shuō)明的是,為了減少網(wǎng)絡(luò)請(qǐng)求的開銷,糾錯(cuò)熱詞庫(kù),糾錯(cuò)長(zhǎng)效詞庫(kù)或糾錯(cuò)全詞庫(kù)可以單獨(dú)地部署在第二服務(wù)端上;或者,在糾錯(cuò)熱詞庫(kù),糾錯(cuò)長(zhǎng)效詞庫(kù)或糾錯(cuò)全詞庫(kù)的容量不大時(shí),可以生成字典文件,由第二服務(wù)端進(jìn)行定時(shí)拉取,然后使用。參照?qǐng)D4,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種視頻搜索方法實(shí)施例的流程圖,具體可以包括:步驟401、對(duì)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)中的錯(cuò)誤詞進(jìn)行哈希運(yùn)算,生成對(duì)應(yīng)的主鍵,并將主鍵對(duì)應(yīng)的準(zhǔn)確詞作為鍵值構(gòu)建哈希表;
步驟402、接收來(lái)自客戶端的訪問(wèn)請(qǐng)求;步驟403、對(duì)所述訪問(wèn)請(qǐng)求中的搜索詞進(jìn)行哈希計(jì)算,生成對(duì)應(yīng)的搜索詞主鍵;步驟404、調(diào)用內(nèi)存中的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的準(zhǔn)確詞,作為糾錯(cuò)后搜索詞;步驟405、將所述糾錯(cuò)后搜索詞并行分發(fā)至熱門影視服務(wù)端和普通影視服務(wù)端,由所述熱門影視服務(wù)端和普通影視服務(wù)端分別依據(jù)所述糾錯(cuò)后搜索詞在熱門影視庫(kù)和普通影視庫(kù)中進(jìn)行檢索,并接收所述熱門影視服務(wù)端和普通影視服務(wù)端返回的搜索結(jié)果;其中,所述熱門影視庫(kù)用于針對(duì)熱門視頻存儲(chǔ)搜索詞和對(duì)應(yīng)的搜索結(jié)果,所述普通影視庫(kù)用于針對(duì)除熱門視頻之外視頻存儲(chǔ)搜索詞和對(duì)應(yīng)的搜索結(jié)果;步驟406、對(duì)所述熱門影視服務(wù)端和普通影視服務(wù)端返回的搜索結(jié)果進(jìn)行合并處理,得到合并處理后的搜索結(jié)果;在實(shí)際應(yīng)用中,所述合并處理可以包括去重、排序等等,通常,熱門影視服務(wù)端返回的搜索結(jié)果排在普通影視服務(wù)端返回的搜索結(jié)果的前面,當(dāng)然還可以結(jié)合其他的排序權(quán)重(如相關(guān)性)進(jìn)行排序。步驟407、將所述合并處理后的搜索結(jié)果返回給所述客戶端,由所述客戶端在加載的網(wǎng)頁(yè)中展示所述合并處理后的搜索結(jié)果。本實(shí)施例由熱門影視服務(wù)端和普通影視服務(wù)端分別依據(jù)熱門影視庫(kù)和普通影視庫(kù)進(jìn)行并行檢索,故能夠提高檢索速度。需要說(shuō)明的是,熱門影視庫(kù)和普通影視庫(kù)等影視庫(kù)可存儲(chǔ)于高速存儲(chǔ)節(jié)點(diǎn)之上,以提高數(shù)據(jù)讀取和數(shù)據(jù)檢索的速度;所述高速存儲(chǔ)節(jié)點(diǎn)具體可以包括內(nèi)存節(jié)點(diǎn)或者固態(tài)硬盤節(jié)點(diǎn)。在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒(méi)有詳述的部分,可以參見(jiàn)其他實(shí)施例的相關(guān)描述即可。并且,本領(lǐng)域技術(shù)人員易于想到的是:上述實(shí)施例的任意組合應(yīng)用都是可行的,故上述實(shí)施例之間的任意組合都是本發(fā)明的實(shí)施方案,但是由于篇幅限制,本說(shuō)明書在此就不 詳述了。參照?qǐng)D5,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種視頻搜索系統(tǒng)的結(jié)構(gòu)圖,具體可以包括:接收單元501,適于接收來(lái)自客戶端的訪問(wèn)請(qǐng)求;搜索詞運(yùn)算單元502,適于對(duì)所述訪問(wèn)請(qǐng)求中的搜索詞進(jìn)行哈希計(jì)算,生成對(duì)應(yīng)的搜索詞主鍵;糾錯(cuò)單元503,適于調(diào)用內(nèi)存中的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的準(zhǔn)確詞,作為糾錯(cuò)后搜索詞;所述哈希表為依據(jù)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)建立;檢索單元504,適于依據(jù)所述糾錯(cuò)后搜索詞在影視庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果;及搜索結(jié)果加載單元505,適于將所述搜索結(jié)果返回給所述客戶端,由所述客戶端在加載的網(wǎng)頁(yè)中展示所述搜索結(jié)果。在本發(fā)明的一種優(yōu)選實(shí)施例中,所述哈希表具體可以包括糾錯(cuò)熱詞庫(kù)、糾錯(cuò)長(zhǎng)效詞庫(kù)及糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表;所述糾錯(cuò)熱詞庫(kù)、糾錯(cuò)長(zhǎng)效詞庫(kù)及糾錯(cuò)全詞庫(kù)分別用于記錄熱門視頻、長(zhǎng)視頻及所有視頻的名稱對(duì)應(yīng)的錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系;則所述糾錯(cuò)單元503具體可以包括:第一匹配模塊,適于調(diào)用內(nèi)存中的糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞王鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞;第一糾錯(cuò)成功模塊,適于在糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞;第二匹配模塊,適于在糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表查找失敗時(shí),調(diào)用內(nèi)存中的糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞;第二糾錯(cuò)成功模塊,適于在糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞;第三匹配模塊,適于在糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表查找失敗時(shí),調(diào)用內(nèi)存中的糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞;及第三糾錯(cuò)成功模塊,適于在糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞。在本發(fā)明的另一種優(yōu)選實(shí)施例中,所述系統(tǒng)還可以包括:適于收集所述錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系的收集單元;所述收集單元具體可以包括:第一收集模塊,適于將視頻的名稱作為準(zhǔn)確詞,及將該視頻的名稱對(duì)應(yīng)的別名、縮寫、拼音、錯(cuò)字、漏字或多字作為錯(cuò)誤詞;或者第二收集模塊,適于在所述糾錯(cuò)后搜索詞得不到對(duì)應(yīng)的搜索結(jié)果時(shí),依據(jù)所述糾錯(cuò)后搜索詞對(duì)應(yīng)的糾錯(cuò)前搜索詞在其它搜索引擎中進(jìn)行視頻的搜索,將得到的搜索結(jié)果對(duì)應(yīng)視頻的名稱作為準(zhǔn)確詞,及將所述糾錯(cuò)前搜索詞作為錯(cuò)誤詞。在本發(fā)明的再一種優(yōu)選實(shí)施例中,所述系統(tǒng)還可以包括:適于獲取所述熱門視頻的視頻獲取單元;所述視頻獲取單元具體可以包括:第一視頻獲取模塊,適于對(duì)搜索日志進(jìn)行分析,得到預(yù)置的時(shí)間段內(nèi)視頻的播放頻率和/或搜索頻率,并將播放頻率和/或搜索頻率符合預(yù)置條件的視頻作為熱門視頻;所述搜索日志中記錄有用戶的搜索詞及用戶播放的視頻;或者,第二視頻獲取模塊,適于依據(jù)預(yù)置的時(shí)間段內(nèi)的熱門事件,收集相應(yīng)的視頻,作為熱門視頻。在本發(fā)明的一種優(yōu)選實(shí)施例中,所述系統(tǒng)還可以包括:客戶端、第一服務(wù)端、第二服務(wù)端和第三服務(wù)端;其中,所述客戶端接收訪問(wèn)請(qǐng)求,并發(fā)送至第一服務(wù)端;所述第一服務(wù)端接收來(lái)自客戶端的訪問(wèn)請(qǐng)求,并發(fā)送至所述第二服務(wù)端;所述第二服務(wù)端對(duì)所述訪問(wèn)請(qǐng)求中的搜索詞進(jìn)行哈希計(jì)算,生成對(duì)應(yīng)的搜索詞主鍵,調(diào)用內(nèi)存中的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的準(zhǔn)確詞,作為糾錯(cuò)后搜索詞,并返回給所述第一服務(wù)端;所述第一服務(wù)端將所述糾錯(cuò)后搜索詞發(fā)送至所述第三服務(wù)端;所述第三服務(wù)端依據(jù)所述糾錯(cuò)后搜索詞在影視庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果,并返回給所述第一服務(wù)器端;所述第一服務(wù)端將所述搜索結(jié)果返回給所述客戶端,由所述客戶端在加載的網(wǎng)頁(yè)中展示所述搜索結(jié)果。在本發(fā)明的一種優(yōu)選實(shí)施例中,所述系統(tǒng)還可以包括:適于建立所述哈希表的哈希表建立模塊,所述哈希表建立模塊對(duì)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)中的錯(cuò)誤詞進(jìn)行哈希運(yùn)算,生成對(duì)應(yīng)的主鍵,并將主鍵對(duì)應(yīng)的準(zhǔn)確詞作為鍵值構(gòu)建哈希表。在本發(fā)明的另一種優(yōu)選實(shí)施例中,所述影視庫(kù)用于通過(guò)鍵值對(duì)的方式存儲(chǔ)搜索詞和對(duì)應(yīng)的搜索結(jié)果;或者,所述影視庫(kù)用于通過(guò)鍵值對(duì)的方式存儲(chǔ)某視頻類別下的搜索詞和對(duì)應(yīng)的搜索結(jié)果;其中,搜索詞作為主鍵,搜索詞對(duì)應(yīng)的搜索結(jié)果作為鍵值。在本發(fā)明的再一種優(yōu)選實(shí)施例中,所述影視庫(kù)具體可以包括存儲(chǔ)熱門影視庫(kù)和普通影視庫(kù);其中,所述熱門影視庫(kù)用于針對(duì)熱門視頻存儲(chǔ)搜索詞和對(duì)應(yīng)的搜索結(jié)果,所述普通影視庫(kù)用于針對(duì)除熱門視頻之外視頻存儲(chǔ)搜索詞和對(duì)應(yīng)的搜索結(jié)果;則所述系統(tǒng)還可以包括:并行分發(fā)單元,適于將所述糾錯(cuò)后搜索詞并行分發(fā)至熱門影視服務(wù)端和普通影視服務(wù)端,由所述熱門影視服務(wù)端和普通影視服務(wù)端分別依據(jù)所述糾錯(cuò)后搜索詞在熱門影視庫(kù)和普通影視庫(kù)中進(jìn)行檢索,并接收所述熱門影視服務(wù)端和普通影視服務(wù)端返回的搜索結(jié)果;合并處理單元,適于對(duì)所述熱門影視服務(wù)端和普通影視服務(wù)端返回的搜索結(jié)果進(jìn)行合并處理,得到合并處理后的搜索結(jié)果;所述搜索結(jié)果加載單元還適于,將所述合并處理后的搜索結(jié)果返回給所述客戶端,由所述客戶端在加載的網(wǎng)頁(yè)中展示所述合并處理后的搜索結(jié)果。在本發(fā)明的一種優(yōu)選實(shí)施例中,所述影視庫(kù)可存儲(chǔ)于高速存儲(chǔ)節(jié)點(diǎn)之上;所述高速存儲(chǔ)節(jié)點(diǎn)具體可以包括內(nèi)存節(jié)點(diǎn)或者固態(tài)硬盤節(jié)點(diǎn)。在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見(jiàn)的。此外,本發(fā)明也不針對(duì)任何特定編程語(yǔ)言。應(yīng)當(dāng)明白,可以利用各種編程語(yǔ)言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語(yǔ)言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。在此處所提供的說(shuō)明書中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說(shuō)明書的理解。類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō),如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循具體實(shí)施方式
的權(quán)利要求書由此明確地并入該具體實(shí)施方式
,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。 本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過(guò)程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP )來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的設(shè)備中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者系統(tǒng)程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了若干系統(tǒng)的單元權(quán)利要求中,這些系統(tǒng)中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
權(quán)利要求
1.一種視頻搜索方法,其特征在于,包括: 接收來(lái)自客戶端的訪問(wèn)請(qǐng)求; 對(duì)所述訪問(wèn)請(qǐng)求中的搜索詞進(jìn)行哈希計(jì)算,生成對(duì)應(yīng)的搜索詞主鍵; 調(diào)用內(nèi)存中的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的準(zhǔn)確詞,作為糾錯(cuò)后搜索詞;所述哈希表為依據(jù)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)建立; 依據(jù)所述糾錯(cuò)后搜索詞在影視庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果; 將所述搜索結(jié)果返回給客戶端,由客戶端在加載的網(wǎng)頁(yè)中展示所述搜索結(jié)果。
2.如權(quán)利要求1所述的方法,其特征在于,所述哈希表包括糾錯(cuò)熱詞庫(kù)、糾錯(cuò)長(zhǎng)效詞庫(kù)及糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表;所述糾錯(cuò)熱詞庫(kù)、糾錯(cuò)長(zhǎng)效詞庫(kù)及糾錯(cuò)全詞庫(kù)分別用于記錄熱門視頻、長(zhǎng)視頻及所有視頻的名稱對(duì)應(yīng)的錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系; 所述調(diào)用內(nèi)存中的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞的步驟,包括: 調(diào)用內(nèi)存中的糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞; 在糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞; 在糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表查找失敗時(shí),調(diào)用內(nèi)存中的糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞; 在糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞; 在糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表查找失敗時(shí),調(diào)用內(nèi)存中的糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞; 在糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞。
3.如權(quán)利要求1或2所述的方法,其特征在于,通過(guò)如下步驟收集所述錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系: 將視頻的名稱作為準(zhǔn)確詞,及將該視頻的名稱對(duì)應(yīng)的別名、縮寫、拼音、錯(cuò)字、漏字或多字作為錯(cuò)誤詞;或者 在所述糾錯(cuò)后搜索詞得不到對(duì)應(yīng)的搜索結(jié)果時(shí),依據(jù)所述糾錯(cuò)后搜索詞對(duì)應(yīng)的糾錯(cuò)前搜索詞在其它搜索引擎中進(jìn)行視頻的搜索,將得到的搜索結(jié)果對(duì)應(yīng)視頻的名稱作為準(zhǔn)確詞,及將所述糾錯(cuò)前搜索詞作為錯(cuò)誤詞。
4.如權(quán)利要求2所述的方法,其特征在于,通過(guò)如下步驟獲取所述熱門視頻; 對(duì)搜索日志進(jìn)行分析,得到預(yù)置的時(shí)間段內(nèi)視頻的播放頻率和/或搜索頻率,并將播放頻率和/或搜索頻率符合預(yù)置條件的視頻作為熱門視頻;所述搜索日志中記錄有用戶的搜索詞及用戶播放的視頻;或 依據(jù)預(yù)置的時(shí)間段內(nèi)的熱門事件,收集相應(yīng)的視頻,作為熱門視頻。
5.如權(quán)利要求1或2所述的方法,其特征在于, 客戶端接收訪問(wèn)請(qǐng)求,并發(fā)送至第一服務(wù)端; 第一服務(wù)端接收來(lái)自客戶端的訪問(wèn)請(qǐng)求,并發(fā)送至第二服務(wù)端; 所述第二服務(wù)端對(duì)所述訪問(wèn)請(qǐng)求中的搜索詞進(jìn)行哈希計(jì)算,生成對(duì)應(yīng)的搜索詞主鍵,調(diào)用內(nèi)存中的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的準(zhǔn)確詞,作為糾錯(cuò)后搜索詞,并返回給所述第一服務(wù)端;所述第一服務(wù)端將所述糾錯(cuò)后搜索詞發(fā)送至第三服務(wù)端; 所述第三服務(wù)端依據(jù)所述糾錯(cuò)后搜索詞在影視庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果,并返回給所述第一服務(wù)器端; 所述第一服務(wù)端將所述搜索結(jié)果返回給所述客戶端,由所述客戶端在加載的網(wǎng)頁(yè)中展示所述搜索結(jié)果。
6.如權(quán)利要求1或2所述的方法,其特征在于,通過(guò)如下步驟建立所述哈希表: 對(duì)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)中的錯(cuò)誤詞進(jìn)行哈希運(yùn)算,生成對(duì)應(yīng)的主鍵,并將主鍵對(duì)應(yīng)的準(zhǔn)確詞作為鍵值構(gòu)建哈希表。
7.如權(quán)利要求1或2所述的方法,其特征在于,所述影視庫(kù)包括存儲(chǔ)熱門影視庫(kù)和普通影視庫(kù);其中,所述熱門影視庫(kù)用于針對(duì)熱門視頻存儲(chǔ)搜索詞和對(duì)應(yīng)的搜索結(jié)果,所述普通影視庫(kù)用于針對(duì)除熱門視頻之外視頻存儲(chǔ)搜索詞和對(duì)應(yīng)的搜索結(jié)果; 所述方法還包括: 將所述糾錯(cuò)后搜索詞并行分發(fā)至熱門影視服務(wù)端和普通影視服務(wù)端,由所述熱門影視服務(wù)端和普通影視服務(wù)端分別依據(jù)所述糾錯(cuò)后搜索詞在熱門影視庫(kù)和普通影視庫(kù)中進(jìn)行檢索,并接收所述熱門影視服務(wù)端和普通影視服務(wù)端返回的搜索結(jié)果; 對(duì)所述熱門影視服務(wù)端和普通影視服務(wù)端返回的搜索結(jié)果進(jìn)行合并處理,得到合并處理后的搜索結(jié)果; 將所述合并處理后的搜索結(jié)果返回給所述客戶端,由所述客戶端在加載的網(wǎng)頁(yè)中展示所述合并處理后的搜索結(jié)果。
8.如權(quán)利要求1或6所述的方法,其特征在于,所述影視庫(kù)存儲(chǔ)于高速存儲(chǔ)節(jié)點(diǎn)之上;所述高速存儲(chǔ)節(jié)點(diǎn)包括內(nèi)存節(jié)點(diǎn)或者固態(tài)硬盤節(jié)點(diǎn)。
9.一種視頻搜索系統(tǒng),其特征在于,包括: 接收單元,適于接收來(lái)自客戶端的訪問(wèn)請(qǐng)求; 搜索詞運(yùn)算單元,適于對(duì)所述訪問(wèn)請(qǐng)求中的搜索詞進(jìn)行哈希計(jì)算,生成對(duì)應(yīng)的搜索詞主鍵; 糾錯(cuò)單元,適于調(diào)用內(nèi)存中的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的準(zhǔn)確詞,作為糾錯(cuò)后搜索詞;所述哈希表為依據(jù)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)建立; 檢索單元,適于依據(jù)所述糾錯(cuò)后搜索詞在影視庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果;及 搜索結(jié)果加載單元,適于將所述搜索結(jié)果返回給所述客戶端,由所述客戶端在加載的網(wǎng)頁(yè)中展示所述搜索結(jié)果。
10.如權(quán)利要求9所述的系統(tǒng),其特征在于,所述哈希表包括糾錯(cuò)熱詞庫(kù)、糾錯(cuò)長(zhǎng)效詞庫(kù)及糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表;所述糾錯(cuò)熱詞庫(kù)、糾錯(cuò)長(zhǎng)效詞庫(kù)及糾錯(cuò)全詞庫(kù)分別用于記錄熱門視頻、長(zhǎng)視頻及所有視頻的名稱對(duì)應(yīng)的錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系; 所述糾錯(cuò)單元包括: 第一匹配模塊,適于調(diào)用內(nèi)存中的糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞; 第一糾錯(cuò)成功模塊,適于在糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞; 第二匹配模塊,適于在糾錯(cuò)熱詞庫(kù)對(duì)應(yīng)的哈希表查找失敗時(shí),調(diào)用內(nèi)存中的糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞; 第二糾錯(cuò)成功模塊,適于在糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞; 第三匹配模塊,適于在糾錯(cuò)長(zhǎng)效詞庫(kù)對(duì)應(yīng)的哈希表查找失敗時(shí),調(diào)用內(nèi)存中的糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的糾錯(cuò)后搜索詞;及 第三糾錯(cuò)成功模塊,適于在糾錯(cuò)全詞庫(kù)對(duì)應(yīng)的哈希表查找命中時(shí),得到對(duì)應(yīng)的糾錯(cuò)后搜索詞。
11.如權(quán)利要求9或10所述的系統(tǒng),其特征在于,還包括:適于收集所述錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系的收集單元; 所述收集單元包括: 第一收集模塊,適于將視頻的名稱作為準(zhǔn)確詞,及將該視頻的名稱對(duì)應(yīng)的別名、縮寫、拼音、錯(cuò)字、漏字或多字作為錯(cuò)誤詞;或者· 第二收集模塊,適于在所述糾錯(cuò)后搜索詞得不到對(duì)應(yīng)的搜索結(jié)果時(shí),依據(jù)所述糾錯(cuò)后搜索詞對(duì)應(yīng)的糾錯(cuò)前搜索詞在其它搜索引擎中進(jìn)行視頻的搜索,將得到的搜索結(jié)果對(duì)應(yīng)視頻的名稱作為準(zhǔn)確詞,及將所述糾錯(cuò)前搜索詞作為錯(cuò)誤詞。
12.如權(quán)利要求9所述的系統(tǒng),其特征在于,還包括:適于獲取所述熱門視頻的視頻獲取單元; 所述視頻獲取單元包括: 第一視頻獲取模塊,適于對(duì)搜索日志進(jìn)行分析,得到預(yù)置的時(shí)間段內(nèi)視頻的播放頻率和/或搜索頻率,并將播放頻率和/或搜索頻率符合預(yù)置條件的視頻作為熱門視頻;所述搜索日志中記錄有用戶的搜索詞及用戶播放的視頻;或者, 第二視頻獲取模塊,適于依據(jù)預(yù)置的時(shí)間段內(nèi)的熱門事件,收集相應(yīng)的視頻,作為熱門視頻。
13.如權(quán)利要求9或10所述的系統(tǒng),其特征在于,還包括:客戶端、第一服務(wù)端、第二服務(wù)端和第三服務(wù)端;其中, 所述客戶端接收訪問(wèn)請(qǐng)求,并發(fā)送至第一服務(wù)端; 所述第一服務(wù)端接收來(lái)自客戶端的訪問(wèn)請(qǐng)求,并發(fā)送至所述第二服務(wù)端; 所述第二服務(wù)端對(duì)所述訪問(wèn)請(qǐng)求中的搜索詞進(jìn)行哈希計(jì)算,生成對(duì)應(yīng)的搜索詞主鍵,調(diào)用內(nèi)存中的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的準(zhǔn)確詞,作為糾錯(cuò)后搜索詞,并返回給所述第一服務(wù)端; 所述第一服務(wù)端將所述糾錯(cuò)后搜索詞發(fā)送至所述第三服務(wù)端; 所述第三服務(wù)端依據(jù)所述糾錯(cuò)后搜索詞在影視庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果,并返回給所述第一服務(wù)器端; 所述第一服務(wù)端將所述搜索結(jié)果返回給所述客戶端,由所述客戶端在加載的網(wǎng)頁(yè)中展示所述搜索結(jié)果。
14.如權(quán)利要求9或10所述的系統(tǒng),其特征在于,還包括:適于建立所述哈希表的哈希表建立模塊,所述哈希表建立模塊對(duì)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)中的錯(cuò)誤詞進(jìn)行哈希運(yùn)算,生成對(duì)應(yīng)的主鍵,并將主鍵對(duì)應(yīng)的準(zhǔn)確詞作為鍵值構(gòu)建哈希表。
15.如權(quán)利要求9或10所述的系統(tǒng),其特征在于,所述影視庫(kù)包括存儲(chǔ)熱門影視庫(kù)和普通影視庫(kù);其中,所述熱門影視庫(kù)用于針對(duì)熱門視頻存儲(chǔ)搜索詞和對(duì)應(yīng)的搜索結(jié)果,所述普通影視庫(kù)用于針對(duì)除熱門視頻之外視頻存儲(chǔ)搜索詞和對(duì)應(yīng)的搜索結(jié)果; 則所述系統(tǒng)還包括:并行分發(fā)單元,適于將所述糾錯(cuò)后搜索詞并行分發(fā)至熱門影視服務(wù)端和普通影視服務(wù)端,由所述熱門影視服務(wù)端和普通影視服務(wù)端分別依據(jù)所述糾錯(cuò)后搜索詞在熱門影視庫(kù)和普通影視庫(kù)中進(jìn)行檢索,并接收所述熱門影視服務(wù)端和普通影視服務(wù)端返回的搜索結(jié)果;合并處理單元,適于對(duì)所述熱門影視服務(wù)端和普通影視服務(wù)端返回的搜索結(jié)果進(jìn)行合并處理,得到合并處理后的搜索結(jié)果; 所述搜索結(jié)果加載單元還適于,將所述合并處理后的搜索結(jié)果返回給客戶端,由客戶端在加載的網(wǎng)頁(yè)中展示所述合并處理后的搜索結(jié)果。
16.如權(quán)利要求9或14所述的系統(tǒng),其特征在于,所述影視庫(kù)存儲(chǔ)于高速存儲(chǔ)節(jié)點(diǎn)之上;所述高速存 儲(chǔ)節(jié)點(diǎn)包括內(nèi)存節(jié)點(diǎn)或者固態(tài)硬盤節(jié)點(diǎn)。
全文摘要
本發(fā)明公開了一種視頻搜索方法及系統(tǒng),其中的方法具體包括接收來(lái)自客戶端的訪問(wèn)請(qǐng)求;對(duì)所述訪問(wèn)請(qǐng)求中的搜索詞進(jìn)行哈希計(jì)算,生成對(duì)應(yīng)的搜索詞主鍵;調(diào)用內(nèi)存中的哈希表,查找與所述搜索詞主鍵相對(duì)應(yīng)的準(zhǔn)確詞,作為糾錯(cuò)后搜索詞;所述哈希表為依據(jù)錯(cuò)誤詞和準(zhǔn)確詞之間的映射關(guān)系數(shù)據(jù)建立;依據(jù)所述糾錯(cuò)后搜索詞在影視庫(kù)中進(jìn)行檢索,得到相應(yīng)的搜索結(jié)果;將所述搜索結(jié)果返回給客戶端,由客戶端在加載的網(wǎng)頁(yè)中展示所述搜索結(jié)果。本發(fā)明能夠提高視頻搜索的準(zhǔn)確度和速度。
文檔編號(hào)G06F17/30GK103150362SQ201310064099
公開日2013年6月12日 申請(qǐng)日期2013年2月28日 優(yōu)先權(quán)日2013年2月28日
發(fā)明者林超旗 申請(qǐng)人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司