一種詞條的存儲(chǔ)和管理方法
【專利摘要】本發(fā)明提供了一種詞條的存儲(chǔ)和管理方法,該方法包括:I、用戶創(chuàng)建搜索結(jié)果頁對應(yīng)的詞條;II、提交上線申請;III、審核人員檢查詞條;IV、搜索結(jié)果頁對應(yīng)詞條上線并存儲(chǔ)于緩存;V、用戶讀取緩存詞條,定位搜索結(jié)果頁。該方法通過對第三代搜索引擎的詞條(包括主詞、同義詞、分義標(biāo)注、SRP_ID等)的有效管理、分析及存儲(chǔ),滿足高效的搜索檢索頁(SRP)的需求,實(shí)現(xiàn)數(shù)據(jù)讀取更新的高效化和快速化。
【專利說明】—種詞條的存儲(chǔ)和管理方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種計(jì)算機(jī)領(lǐng)域的管理方法,具體講涉及一種詞條的存儲(chǔ)和管理方法。
【背景技術(shù)】
[0002]互聯(lián)網(wǎng)提供了即時(shí)豐富的人與人溝通參與/娛樂的平臺(tái)信息,深層影響著現(xiàn)代人的生活。但隨著網(wǎng)站數(shù)量和內(nèi)容的急增,互聯(lián)網(wǎng)就像是沒有目錄的巨大百科全書,讓人們無法找尋自己想要的信息。搜索引擎的出現(xiàn),使這本百科全書有了目錄和索引。不論想從互聯(lián)網(wǎng)中尋找什么內(nèi)容,只需要在搜索框中敲入關(guān)鍵詞匯,就能夠獲得相關(guān)的信息或網(wǎng)址。
[0003]搜索引擎是對計(jì)算機(jī)科學(xué)與技術(shù)的極大發(fā)展,將理論研究和工程開發(fā)完美結(jié)合,創(chuàng)造了非凡的用戶體驗(yàn)和文化。以Google為代表的傳統(tǒng)搜索引擎,在用戶輸入一個(gè)查詢詞時(shí),返回和此查詢詞相關(guān)的網(wǎng)頁摘要,并盡可能將用戶需要的結(jié)果排在了前面。但搜索引擎畢竟不會(huì)“猜心術(shù)”,對于一個(gè)詞,用戶會(huì)有不同的需求,如對于“綠茶”,可能是茶文化、健康知識(shí)、電影介紹、化妝品或者其他。大多數(shù)用戶并不能夠通過一兩個(gè)詞,精確表達(dá)自己所想要的內(nèi)容,搜索引擎也無能為力只有返回大量的結(jié)果供用戶選擇。這就產(chǎn)生了一個(gè)很大的問題,但結(jié)果量巨大到無限大的時(shí)候,就等于沒有結(jié)果,如何解決這一問題,一些學(xué)者指出第三代搜索引擎的應(yīng)該具備互動(dòng)式搜索、分類導(dǎo)航、查詢精確、更新速度快等特點(diǎn)。
[0004]而隨著互聯(lián)網(wǎng)時(shí)代的發(fā)展,每天都有各種各樣重要新聞、網(wǎng)站的更新,如何實(shí)現(xiàn)快速高效的查詢,如何實(shí)現(xiàn)精確的詞條到網(wǎng)站搜索結(jié)果頁(SRP,Search Result Page)的跳轉(zhuǎn)是目前第三代搜索引擎需要克服的重點(diǎn)問題之一。
【發(fā)明內(nèi)容】
[0005]為了克服上述現(xiàn)有技術(shù)的不足,本發(fā)明提供本發(fā)明提供了一種詞條的存儲(chǔ)管理方法。該方法通過對第三代搜索引擎的詞條(包括主詞、同義詞、分義標(biāo)注、SRP_ID等)的有效管理、分析及存儲(chǔ),滿足高效的搜索檢索頁(SRP)的需求,實(shí)現(xiàn)數(shù)據(jù)讀取更新的高效化和快速化。
[0006]實(shí)現(xiàn)上述目的所采用的解決方案為:
[0007]一種詞條的存儲(chǔ)和管理方法,其改進(jìn)之處在于:所述方法包括:1、創(chuàng)建搜索結(jié)果頁對應(yīng)的詞條;
[0008]I1、提交上線申請;
[0009]II1、審核人員檢查詞條;
[0010]IV、搜索結(jié)果頁對應(yīng)詞條上線并存儲(chǔ)于緩存;
[0011]V、讀取緩存詞條,定位搜索結(jié)果頁。
[0012]進(jìn)一步的,所述步驟I包括以下步驟:用戶根據(jù)搜索結(jié)果頁確定所述創(chuàng)建搜索結(jié)果頁對應(yīng)的詞條;所述搜索結(jié)果頁對應(yīng)的詞條提交上線。
[0013]進(jìn)一步的,所述詞條包括關(guān)鍵詞、分義標(biāo)注、搜索結(jié)果頁的SRPID。[0014]進(jìn)一步的,所述關(guān)鍵詞包括主詞和同義詞,所述主詞和同義詞中的任一對應(yīng)唯一搜索結(jié)果頁。
[0015]進(jìn)一步的,所述步驟II包括以下步驟:S201、提交搜索結(jié)果頁及其對應(yīng)詞條;
[0016]S202、在已有的詞庫中查找是否存在相同主詞,存在則進(jìn)入步驟S203,否則提交上線.-^4 ,
[0017]S203、判斷是否存在與所述主詞同義的詞,若存在則建立同義詞;否則進(jìn)入步驟S204 ;
[0018]S204、建立主詞的分義標(biāo)注,根據(jù)所述關(guān)鍵詞對應(yīng)的多個(gè)所述搜索結(jié)果頁的SRPID,創(chuàng)建消歧義頁面,消除不同條目擁有相同名稱一詞多義所引起的歧義,供用戶選擇;
[0019]S205、提交上線。
[0020]進(jìn)一步的,所述步驟III包括:審核人員接收所述搜索結(jié)果頁及其對應(yīng)的詞條,判斷是否合格,合格則添加并存儲(chǔ)于緩存的對應(yīng)關(guān)鍵詞區(qū),不合格則修改或刪除。
[0021]進(jìn)一步的,所述添加包括,在緩存中的詞條區(qū)中,根據(jù)詞條的關(guān)鍵詞查找詞條表,判斷詞條是否存在,不存在則創(chuàng)建詞條,更新詞條表。
[0022]所述修改包括,在緩存中的詞條表區(qū)中,根據(jù)詞條的關(guān)鍵詞查找詞條表,遍歷出需要修改的詞條,修改詞條中的信息,更新詞條表。
[0023]所述刪除包括,在緩存中的詞條區(qū)中,根據(jù)詞條的關(guān)鍵詞查找詞條表,遍歷出需要?jiǎng)h除的詞條,刪除所述詞條,更新`詞條表。
[0024]進(jìn)一步的,所述更新包括,刪除緩存中的詞條表,添加新的詞條表。
[0025]進(jìn)一步的,存儲(chǔ)所述詞條的信息的詞條表,包括詞條長度、主詞、主詞ID、分類ID、分類長度、搜索檢索頁的SRPID、分義標(biāo)注、分義標(biāo)注長度;
[0026]根據(jù)所述關(guān)鍵詞搜索詞條表獲得所述搜索檢索頁的SRPID,根據(jù)所述搜索結(jié)果頁的SRPID獲得對應(yīng)的搜索檢索頁。
[0027]進(jìn)一步的,所述關(guān)鍵詞與其對應(yīng)的詞條基于hash算法存儲(chǔ)于緩存中,所述關(guān)鍵詞為鍵,所述詞條為值;
[0028]所述搜索檢索頁的SRPID與其對應(yīng)的搜索檢索頁基于hash算法存儲(chǔ)于緩存中,所述搜索檢索頁的SRPID為鍵,所述搜索檢索頁為值。
[0029]與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:
[0030](I)本發(fā)明的方法中關(guān)鍵詞查找詞條表和SRPID查找SRP都是使用hash結(jié)構(gòu)實(shí)現(xiàn),時(shí)間復(fù)雜度為0(1),提高檢索速度,實(shí)現(xiàn)數(shù)據(jù)讀取更顯得高效化和快速化。
[0031](2)本發(fā)明的方法的完全基于內(nèi)存操作,檢索內(nèi)容高效,具有查詢精確、更新速度快的特點(diǎn)。
[0032](3)本發(fā)明的方法將上線的搜索結(jié)果頁及其對應(yīng)的詞條存儲(chǔ)于緩存中,減少了讀取數(shù)據(jù)庫的時(shí)間步驟,從而提高了速度和效率。
[0033](4)本發(fā)明的方法以關(guān)鍵詞為基準(zhǔn),查詢詞條表,進(jìn)而獲得搜索結(jié)果頁;將詞條表設(shè)計(jì)為包括主詞、分義標(biāo)注及搜索結(jié)果頁的SRPID,且詞條表基于緩的List實(shí)現(xiàn),通過上述設(shè)計(jì)方法較小數(shù)據(jù)讀取更新的復(fù)雜度,提高關(guān)鍵詞分析的針對性;同時(shí),通過關(guān)鍵詞(包括主詞和同義詞)的檢索提高了用戶的檢索效率,更直觀客觀的顯示結(jié)果。[0034](5)本發(fā)明的方法實(shí)現(xiàn)了在產(chǎn)生結(jié)果搜索頁的同時(shí)產(chǎn)生對于的關(guān)鍵詞,實(shí)現(xiàn)網(wǎng)站內(nèi)容快速高效的查詢,實(shí)現(xiàn)精確的詞條到網(wǎng)站搜索結(jié)果頁的跳轉(zhuǎn)。
【專利附圖】
【附圖說明】
[0035]圖1為詞條存儲(chǔ)的管理流程圖;
[0036]圖2為添加詞條的流程圖;
[0037]圖3為修改詞條的流程圖;
[0038]圖4為刪除詞條的流程圖;
[0039]圖5為關(guān)鍵詞與詞條表對應(yīng)關(guān)系圖;
[0040]圖6為SRPID與顯示頁對應(yīng)關(guān)系圖。
【具體實(shí)施方式】
[0041]下面結(jié)合附圖對本發(fā)明的【具體實(shí)施方式】做進(jìn)一步的詳細(xì)說明。
[0042]如圖1所示,圖1為詞條存儲(chǔ)的管理流程圖;詞條的存儲(chǔ)和管理方法包括:創(chuàng)建詞條,提交上線申請,審查人員審核詞條是否合格,合格則將詞條存儲(chǔ)于緩存中并將詞條做上線處理。具體包括以下步驟:
[0043]步驟一、用戶創(chuàng)建搜索結(jié)果頁及其對應(yīng)的詞條。
[0044]詞條為主詞、同義詞、分義標(biāo)注、SRP_ID等封裝的組合。
[0045]SRP為搜索結(jié)果頁(Search Result Page) ;SRPID為搜索結(jié)果頁的ID。
[0046]主詞為一個(gè)SRP的一個(gè)主要關(guān)鍵詞,是一對一關(guān)系。同義詞,當(dāng)一個(gè)主詞存在多種意思是,同樣意思主詞為一個(gè)關(guān)鍵詞,和主詞是多對一關(guān)系。
[0047]關(guān)鍵詞為主詞和同義詞的統(tǒng)稱,關(guān)鍵詞包括主詞及其同義詞,主詞及其同義詞中的任意一個(gè)對應(yīng)一個(gè)且唯一的搜索結(jié)果頁。
[0048]分義標(biāo)注:當(dāng)多個(gè)SRP存在一個(gè)同義詞的時(shí)候,為了便于區(qū)別而設(shè)置的,和主詞
是一對一關(guān)系。
[0049]當(dāng)一個(gè)關(guān)鍵詞對應(yīng)多個(gè)搜索結(jié)果頁的SRPID時(shí),創(chuàng)建消歧義頁面,供用戶選擇需要。
[0050]用戶創(chuàng)建搜索結(jié)果頁及其對應(yīng)的詞條具體包括以下步驟:
[0051]SlOl、用戶創(chuàng)建搜索結(jié)果頁,根據(jù)所述搜索結(jié)果頁確定對應(yīng)的詞條;
[0052]S102、將詞條在已有的詞庫中查找是否存在相同的主詞;
[0053]S103、若詞庫存在則判斷該主詞是否含義相同,相同則建立同義詞,否則建立主詞的分義標(biāo)注,根據(jù)所述關(guān)鍵詞對應(yīng)的多個(gè)所述搜索結(jié)果頁的SRPID創(chuàng)建消歧義頁面,即當(dāng)一個(gè)關(guān)鍵詞出現(xiàn)在多個(gè)頁面時(shí)生產(chǎn)消歧義頁,消除不同條目擁有相同名稱、一詞多義所引起的歧義,供用戶選擇;提交上線;
[0054]S104、若詞庫中不存在,則提交上線。
[0055]關(guān)鍵詞與其對應(yīng)的詞條表基于hash算法存儲(chǔ)于緩存中,關(guān)鍵詞為鍵,詞條表為值;所述詞條表包括主詞、分義標(biāo)注和搜索檢索頁的ID ;搜索檢索頁的SRPID與其對應(yīng)的搜索檢索頁基于hash算法存儲(chǔ)于緩存中,所述搜索檢索頁的ID為鍵,所述搜索檢索頁為值。如圖5、6所示。[0056]詞條表基于緩存的List的實(shí)現(xiàn),包括詞長度、主詞、隨機(jī)數(shù)長度(RandomLen)、隨機(jī)數(shù)(Random)、主詞ID、SRPID、分類ID、分類長度、分類、頻道個(gè)數(shù)、頻道數(shù)組Channels、分義標(biāo)注長度、分義標(biāo)注、圖片地址長度、圖片地址。
[0057]步驟二、提交上線申請。具體包括:
[0058]S201、提交搜索結(jié)果頁及其對應(yīng)詞條;
[0059]S202、在已有的詞庫中查找是否存在相同主詞,存在則進(jìn)入步驟S203,否則提交上線.[0060]S203、判斷所述主詞是否含義相同,若相同則建立同義詞;否則進(jìn)入步驟S204 ;
[0061]S204、建立主詞的分義標(biāo)注,根據(jù)所述關(guān)鍵詞對應(yīng)的多個(gè)所述搜索結(jié)果頁的SRPID時(shí),創(chuàng)建消歧義頁面,消除不同條目擁有相同名稱一詞多義所引起的歧義,供用戶選擇;
[0062]S205、提交上線。
[0063]步驟三、審核人員檢查詞條。具體包括以下:
[0064]審核人員接收所述搜索結(jié)果頁及其對應(yīng)的詞條,判斷是否合格,合格則添加并存儲(chǔ),不合格則修改或刪除;
[0065]添加詞條如圖2所示,包括,在緩存中的詞條區(qū)中,根據(jù)詞條的關(guān)鍵詞查找詞條表,判斷詞條是否存在,不存在則創(chuàng)建詞條,更新詞條表;所述更新包括,刪除緩存中的詞條表,添加新的詞條表。
[0066]修改詞條如圖3所示,包括,在緩存中的詞條區(qū)中,根據(jù)詞條的關(guān)鍵詞查找詞條表,遍歷出需要修改的詞條,修改詞條中的信息,更新詞條表;所述更新包括,刪除緩存中的詞條表,添加新的詞條表。
[0067]刪除詞條如圖4所以,包括,在緩存中的詞條區(qū)中,根據(jù)詞條的關(guān)鍵詞查找詞條表,遍歷出需要?jiǎng)h除的詞條,刪除所述詞條,更新詞條表;所述更新包括,刪除緩存中的詞條表,添加新的詞條表。
[0068]步驟四、搜索結(jié)果頁及其對應(yīng)詞條上線并存儲(chǔ)于緩存。
[0069]當(dāng)用戶搜索一個(gè)關(guān)鍵詞,如果詞條表只有一條記錄,則直接跳到SRP顯示頁面.如果詞條表存在多條記錄的,則跳轉(zhuǎn)到消歧義頁面,頁面則顯示詞條表所有的信息。
[0070]最后應(yīng)當(dāng)說明的是:以上實(shí)施例僅用于說明本申請的技術(shù)方案而非對其保護(hù)范圍的限制,盡管參照上述實(shí)施例對本申請進(jìn)行了詳細(xì)的說明,所屬領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:本領(lǐng)域技術(shù)人員閱讀本申請后依然可對申請的【具體實(shí)施方式】進(jìn)行種種變更、修改或者等同替換,但這些變更、修改或者等同替換,均在申請待批的權(quán)利要求保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種詞條的存儲(chǔ)和管理方法,其特征在于:所述方法包括:1、創(chuàng)建搜索結(jié)果頁對應(yīng)的詞條; I1、提交上線申請; II1、審核人員檢查詞條; IV、搜索結(jié)果頁對應(yīng)詞條上線并存儲(chǔ)于緩存; V、讀取緩存詞條,定位搜索結(jié)果頁。
2.如權(quán)利要求1所述的一種詞條的存儲(chǔ)和管理方法,其特征在于:所述步驟I包括以下步驟:用戶根據(jù)搜索結(jié)果頁確定所述創(chuàng)建搜索結(jié)果頁對應(yīng)的詞條;所述搜索結(jié)果頁對應(yīng)的詞條提交上線。
3.如權(quán)利要求2所述的一種詞條的存儲(chǔ)和管理方法,其特征在于:所述詞條包括關(guān)鍵詞、分義標(biāo)注、搜索結(jié)果頁的SRPID。
4.如權(quán)利要求3所述的一種詞條的存儲(chǔ)和管理方法,其特征在于:所述關(guān)鍵詞包括主詞和同義詞,所述主詞和同義詞中的任一對應(yīng)唯一搜索結(jié)果頁。
5.如權(quán)利要求1所述的一種詞條的存儲(chǔ)和管理方法,其特征在于:所述步驟II包括以下步驟:S201、提交搜索結(jié)果頁及其對應(yīng)詞條; 5202、在已有的詞庫中查找是否存在相同主詞,存在則進(jìn)入步驟S203,否則提交上線; 5203、判斷是否存在與所述主詞同義的詞,若存在則建立同義詞;否則進(jìn)入步驟S204; 5204、建立主詞的分義標(biāo)`注,根據(jù)所述關(guān)鍵詞對應(yīng)的多個(gè)所述搜索結(jié)果頁的SRPIDjiJ建消歧義頁面,消除不同條目擁有相同名稱一詞多義所引起的歧義,供用戶選擇; 5205、提交上線。
6.如權(quán)利要求1所述的一種詞條的存儲(chǔ)和管理方法,其特征在于:所述步驟III包括:審核人員接收所述搜索結(jié)果頁及其對應(yīng)的詞條,判斷是否合格,合格則添加并存儲(chǔ)于緩存的對應(yīng)關(guān)鍵詞區(qū),不合格則修改或刪除。
7.如權(quán)利要求6所述的一種詞條的管理存儲(chǔ)方法,其特征在于:所述添加包括,在緩存中的詞條區(qū)中,根據(jù)詞條的關(guān)鍵詞查找詞條表,判斷詞條是否存在,不存在則創(chuàng)建詞條,更新詞條表。 所述修改包括,在緩存中的詞條表區(qū)中,根據(jù)詞條的關(guān)鍵詞查找詞條表,遍歷出需要修改的詞條,修改詞條中的信息,更新詞條表。 所述刪除包括,在緩存中的詞條區(qū)中,根據(jù)詞條的關(guān)鍵詞查找詞條表,遍歷出需要?jiǎng)h除的詞條,刪除所述詞條,更新詞條表。
8.如權(quán)利要求7任一所述的一種詞條的存儲(chǔ)和管理方法,其特征在于:所述更新包括,刪除緩存中的詞條表,添加新的詞條表。
9.如權(quán)利要求7所述的一種詞條的存儲(chǔ)和管理方法,其特征在于:存儲(chǔ)所述詞條的信息的詞條表,包括詞條長度、主詞、主詞ID、分類ID、分類長度、搜索檢索頁的SRPID、分義標(biāo)注、分義標(biāo)注長度; 根據(jù)所述關(guān)鍵詞搜索詞條表獲得所述搜索檢索頁的SRPID,根據(jù)所述搜索結(jié)果頁的SRPID獲得對應(yīng)的搜索檢索頁。
10.如權(quán)利要求4所述的一種詞條的存儲(chǔ)和管理方法,其特征在于:所述關(guān)鍵詞與其對應(yīng)的詞條基于hash算法存儲(chǔ)于緩存中,所述關(guān)鍵詞為鍵,所述詞條為值;所述搜索檢索頁的SRPID與其對應(yīng)的搜索檢索頁基于hash算法存儲(chǔ)于緩存中,所述搜索檢索頁的SRPID為鍵,所述搜索檢`索頁為值。
【文檔編號(hào)】G06F17/30GK103559270SQ201310540625
【公開日】2014年2月5日 申請日期:2013年11月4日 優(yōu)先權(quán)日:2013年11月4日
【發(fā)明者】高杰 申請人:北京中搜網(wǎng)絡(luò)技術(shù)股份有限公司