本發(fā)明涉及網(wǎng)絡(luò)通信技術(shù)領(lǐng)域,更具體的說,涉及一種確定內(nèi)鏈關(guān)鍵詞的方法及裝置。
背景技術(shù):
網(wǎng)站內(nèi)鏈指的是在同一網(wǎng)站域名下的內(nèi)容頁面之間的相互鏈接,合理的網(wǎng)站內(nèi)鏈構(gòu)造,能提高搜索引擎的收錄與網(wǎng)站權(quán)重,同時還有助于提高搜索引擎對網(wǎng)站的爬行索引效率,網(wǎng)站的搜錄等。網(wǎng)站內(nèi)鏈的優(yōu)化主要是通過內(nèi)鏈關(guān)鍵詞(頁面中關(guān)聯(lián)有鏈接的關(guān)鍵詞)實現(xiàn),因此內(nèi)鏈關(guān)鍵詞的合理與否,不僅影響內(nèi)容頁面之間的轉(zhuǎn)化率,還會影響網(wǎng)站發(fā)展和網(wǎng)站后期排名。
傳統(tǒng)方案中,在對需設(shè)置內(nèi)鏈的頁面等預(yù)處理文本,設(shè)置內(nèi)鏈關(guān)鍵詞時,一般是人工從頁面等預(yù)處理文本中設(shè)置關(guān)鍵詞,并手動添加關(guān)鍵詞關(guān)聯(lián)的鏈接,實現(xiàn)頁面等預(yù)處理文本中內(nèi)鏈關(guān)鍵詞的確定;這種方式存在內(nèi)鏈關(guān)鍵詞的確定精度較低的問題。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明公開一種確定內(nèi)鏈關(guān)鍵詞的方法及裝置,以解決傳統(tǒng)方案中內(nèi)鏈關(guān)鍵詞的提取精度較低的問題。
一種確定內(nèi)鏈關(guān)鍵詞的方法,包括:
獲取預(yù)處理文本的核心關(guān)鍵詞;
對所述核心關(guān)鍵詞進行擴展,得到所述核心關(guān)鍵詞的相關(guān)關(guān)鍵詞;其中,所述相關(guān)關(guān)鍵詞關(guān)聯(lián)有鏈接,且所述相關(guān)關(guān)鍵詞至少根據(jù)所述核心關(guān)鍵詞的搜索結(jié)果確定;
將所述預(yù)處理文本的內(nèi)容與所述相關(guān)關(guān)鍵詞進行匹配,確定所述預(yù)處理文本中的待處理關(guān)鍵詞;
將所述預(yù)處理文本中的各待處理關(guān)鍵詞,替換成相匹配的關(guān)聯(lián)有鏈接的相關(guān)關(guān)鍵詞。
一種確定內(nèi)鏈關(guān)鍵詞的裝置,包括:
獲取單元,用于獲取預(yù)處理文本的核心關(guān)鍵詞;
擴展單元,用于對所述核心關(guān)鍵詞進行擴展,得到所述核心關(guān)鍵詞的相關(guān)關(guān)鍵詞;其中,所述相關(guān)關(guān)鍵詞關(guān)聯(lián)有鏈接,且所述相關(guān)關(guān)鍵詞至少根據(jù)所述核心關(guān)鍵詞的搜索結(jié)果確定;
匹配單元,用于將所述預(yù)處理文本的內(nèi)容與所述相關(guān)關(guān)鍵詞進行匹配,確定所述預(yù)處理文本中的待處理關(guān)鍵詞;
替換單元,用于將所述預(yù)處理文本中的各待處理關(guān)鍵詞,替換成相匹配的關(guān)聯(lián)有鏈接的相關(guān)關(guān)鍵詞。
從上述的技術(shù)方案可知,本發(fā)明在對預(yù)處理文本設(shè)置內(nèi)鏈關(guān)鍵詞時,會對預(yù)處理文本的核心關(guān)鍵詞進行擴展,得到核心關(guān)鍵詞的相關(guān)關(guān)鍵詞,然后將相關(guān)關(guān)鍵詞和預(yù)處理文本的內(nèi)容進行匹配,得到預(yù)處理文本的待處理關(guān)鍵詞,通過將各待處理關(guān)鍵詞替換成相匹配的關(guān)聯(lián)有鏈接相關(guān)關(guān)鍵詞,實現(xiàn)對關(guān)鍵詞內(nèi)鏈的自動添加。由于本發(fā)明中預(yù)處理文本的關(guān)鍵詞是通過與核心關(guān)鍵詞的相關(guān)關(guān)鍵詞匹配得到,因此相比人工設(shè)置關(guān)鍵詞而言,大大提高了內(nèi)鏈關(guān)鍵詞的提取精度。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)公開的附圖獲得其他的附圖。
圖1為本發(fā)明實施例公開的一種確定內(nèi)鏈關(guān)鍵詞的方法流程圖;
圖2為本發(fā)明實施例公開的一種對核心關(guān)鍵詞進行擴展,得到核心關(guān)鍵詞的相關(guān)關(guān)鍵詞的方法流程圖;
圖3為本發(fā)明實施例公開的一種相關(guān)關(guān)鍵詞的篩選方法流程圖;
圖4為本發(fā)明實施例公開的一種確定內(nèi)鏈關(guān)鍵詞的方法流程圖;
圖5為本發(fā)明實施例公開的一種對核心關(guān)鍵詞進行擴展,得到核心關(guān)鍵詞的相關(guān)關(guān)鍵詞的方法流程圖;
圖6為本發(fā)明實施例公開的另一種對核心關(guān)鍵詞進行擴展,得到核心關(guān)鍵詞的相關(guān)關(guān)鍵詞的方法流程圖;
圖7為本發(fā)明實施例公開的一種客戶端與網(wǎng)絡(luò)數(shù)據(jù)庫交互的信令圖;
圖8為本發(fā)明實施例公開的另一種客戶端與網(wǎng)絡(luò)數(shù)據(jù)庫交互的信令圖
圖9為本發(fā)明實施例公開的一種獲取相關(guān)關(guān)鍵詞關(guān)聯(lián)的鏈接的信令圖;
圖10為本發(fā)明實施例公開的一種確定內(nèi)鏈關(guān)鍵詞的裝置結(jié)構(gòu)示意圖;
圖11為本發(fā)明實施例公開的一種擴展單元的組成結(jié)構(gòu)示意圖;
圖12為本發(fā)明實施例公開的一種第一確定子單元的組成結(jié)構(gòu)示意圖;
圖13為本發(fā)明實施例公開的另一種確定內(nèi)鏈關(guān)鍵詞的裝置結(jié)構(gòu)示意圖;
圖14為本發(fā)明實施例公開的一種擴展單元的組成結(jié)構(gòu)示意圖;
圖15為本發(fā)明實施例公開的另一種擴展單元的組成結(jié)構(gòu)示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
為方便對本申請文件的理解,現(xiàn)對一些詞語解釋如下:
關(guān)鍵詞排名:關(guān)鍵詞排名是一種在搜索引擎搜索結(jié)果中以字、詞、詞組的相關(guān)性體現(xiàn)網(wǎng)頁排名的方式??梢苑譃殛P(guān)鍵詞自然排名以及各搜索引擎提供的關(guān)鍵詞競價排名服務(wù)兩種。關(guān)鍵詞自然排名一般是搜索引擎對所有相關(guān)網(wǎng)頁抓取結(jié)果自動分析、自動排名的體現(xiàn),一般可以通過SEO(Search Engine Optimization,搜索引擎優(yōu)化)優(yōu)化技術(shù)來達到關(guān)鍵詞排名提升。關(guān)鍵詞競價排名服務(wù)是由搜索引擎提供的一種有償排名服務(wù)。
關(guān)鍵詞排名優(yōu)化是指:通過各種搜索引擎優(yōu)化(SEO)方式,使網(wǎng)站的關(guān)鍵詞在搜索引擎自然排名中靠前。如用戶通過搜索引擎搜索關(guān)鍵詞“電動車”,在搜索界面左側(cè)會顯示多個包含有“電動車”的網(wǎng)站,這些網(wǎng)站的排序是根據(jù)網(wǎng)站相關(guān)性和重要性等參數(shù)確定的,排名越靠前,表明該網(wǎng)站在行業(yè)的影響力越大。
一個網(wǎng)站若想快速提高欄目和文章的排名,其內(nèi)鏈結(jié)構(gòu)的合理布局必不可少。并且合理的網(wǎng)站內(nèi)鏈構(gòu)造,還能提高搜索引擎的收錄與網(wǎng)站權(quán)重,同時還有助于提高搜索引擎對網(wǎng)站的爬行索引效率,網(wǎng)站的搜錄等。網(wǎng)站內(nèi)鏈的優(yōu)化主要是通過內(nèi)鏈關(guān)鍵詞實現(xiàn),而內(nèi)鏈關(guān)鍵詞排名的優(yōu)化取決于內(nèi)鏈關(guān)鍵詞的精度,因此,如何提高內(nèi)鏈關(guān)鍵詞的精度是本領(lǐng)域技術(shù)人員亟需解決的問題。
本發(fā)明實施例公開了一種確定內(nèi)鏈關(guān)鍵詞的方法及裝置,以解決傳統(tǒng)方案中內(nèi)鏈關(guān)鍵詞的提取精度較低的問題。
如圖1所示,本發(fā)明實施例公開的一種確定內(nèi)鏈關(guān)鍵詞的方法流程圖,該方法包括步驟:
步驟S101、獲取預(yù)處理文本的核心關(guān)鍵詞;
具體的,預(yù)處理文本包括:已編輯完成但未設(shè)置內(nèi)鏈關(guān)鍵詞的文本,以及已經(jīng)確定編輯主題但未編輯的文本。
核心關(guān)鍵詞可以根據(jù)官網(wǎng)內(nèi)容進行定義,一般為產(chǎn)品名,如推廣“使命召喚”游戲,則核心關(guān)鍵詞可選用“使命召喚”。
步驟S102、對所述核心關(guān)鍵詞進行擴展,得到所述核心關(guān)鍵詞的相關(guān)關(guān)鍵詞;
其中,所述相關(guān)關(guān)鍵詞關(guān)聯(lián)有鏈接,且所述相關(guān)關(guān)鍵詞至少根據(jù)所述核心關(guān)鍵詞的搜索結(jié)果確定。
具體的,對核心關(guān)鍵詞進行擴展可以通過將核心關(guān)鍵詞輸入到搜索引擎(如百度引擎、谷歌引擎),然后從關(guān)于核心關(guān)鍵詞的搜索結(jié)果中確定核心關(guān)鍵詞的相關(guān)關(guān)鍵詞實現(xiàn)。如核心關(guān)鍵詞為“使命召喚”,將“使命召喚”輸入到搜索引擎,得到關(guān)于“使命召喚”的搜索結(jié)果,然后從該搜索結(jié)果中確定“使命召喚”的相關(guān)關(guān)鍵詞,如韓寒(韓寒代言了使命召喚)、1246戰(zhàn)隊(使命召喚游戲比賽戰(zhàn)隊)、AN94地獄行者(使命召喚游戲中的槍)、賞金獵人(使命召喚里的游戲角色)等,其中,確定這些相關(guān)關(guān)鍵詞都關(guān)聯(lián)有鏈接。
對核心關(guān)鍵詞進行擴展還可以通過在數(shù)據(jù)庫中查找與該核心關(guān)鍵詞匹配的核心關(guān)鍵詞對應(yīng)的相關(guān)關(guān)鍵詞實現(xiàn),其中數(shù)據(jù)庫中記錄有很多個核心關(guān)鍵詞以及每個核心關(guān)鍵詞對應(yīng)的相關(guān)關(guān)鍵詞。如核心關(guān)鍵詞為“使命召喚”,將“使命召喚”與數(shù)據(jù)庫中記錄的各核心關(guān)鍵詞匹配,如數(shù)據(jù)庫中與“使命召喚”匹配到的核心關(guān)鍵詞為“使命召喚游戲”,則數(shù)據(jù)庫中記錄的“使命召喚游戲”對應(yīng)相關(guān)關(guān)鍵詞即是“使命召喚”的相關(guān)關(guān)鍵詞。
步驟S103、將所述預(yù)處理文本的內(nèi)容與所述相關(guān)關(guān)鍵詞進行匹配,確定所述預(yù)處理文本中的待處理關(guān)鍵詞;
具體的,當(dāng)預(yù)處理文本已編輯完成時,可以將預(yù)處理文本的內(nèi)容直接與各相關(guān)關(guān)鍵詞進行匹配,確定預(yù)處理文本中的待處理關(guān)鍵詞;當(dāng)預(yù)處理文本已經(jīng)確定編輯主題但未編輯時,可以首先查找一些與預(yù)處理文本編輯主題相近的文本,然后將這些主題相近的文本作為預(yù)處理文本與各相關(guān)關(guān)鍵詞進行匹配,以確定預(yù)處理文本中的待處理關(guān)鍵詞。
當(dāng)預(yù)處理文本中記錄有與相關(guān)關(guān)鍵詞完全相同的文字內(nèi)容時,則將該相同的文字內(nèi)容作為預(yù)處理文本中的待處理關(guān)鍵詞;當(dāng)預(yù)處理文本中記錄的是與相關(guān)關(guān)鍵詞相近的文字內(nèi)容時,則將該相近的文字內(nèi)容作為預(yù)處理文本中的待處理關(guān)鍵詞,如預(yù)處理文本中記錄的是“使命召喚”,相關(guān)關(guān)鍵詞為“使命召喚游戲”,則將“使命召喚”作為預(yù)處理文本中的待處理關(guān)鍵詞。
在一實施例中,可以采用正則表達式索引出預(yù)處理文本中的備用待處理關(guān)鍵詞,然后將備用待處理關(guān)鍵詞與各相關(guān)關(guān)鍵詞進行匹配,確定預(yù)處理文本中的待處理關(guān)鍵詞。
正則表達式(英文名稱:Regular Expression,在代碼中常簡寫為regex、regexp或RE),又稱規(guī)則表達式,是對字符串操作的一種邏輯公式,即用事先定義好的一些特定字符以及這些特定字符的組合,組成一個“規(guī)則字符串”,利用該“規(guī)則字符串”來表達對字符串的一種過濾邏輯?!耙?guī)則字符串”由普通字符(例如字符a到z)以及特殊字符(稱為“元字符”)組成。具體的,首先給定一個正則表達式和所要搜索的字符串(如上述的預(yù)處理文本),然后將正則表達式作為一個模板,將某個字符模式與所要搜索的字符串進行匹配,可以達到如下目的:
(1)判定給定的字符串是否符合正則表達式的過濾邏輯(稱作“匹配”);
(2)可通過正則表達式,從字符串中獲取需要的特定部分(如預(yù)處理文本中的備用待處理關(guān)鍵詞)。
因此,步驟S103中,可以采用正則表達式索引出預(yù)處理文本中的備用待處理關(guān)鍵詞。本實施例中,正則表達式具有的過濾邏輯可以包括:①過濾掉“停用詞”,如“的”、“是”、“在”等等;②過濾掉文本中出現(xiàn)頻率較小的詞;③過濾掉一些常用詞語,如“中國”。其中,本實施例中,正則表達式具有的過濾邏輯包括但不局限于上述三種情況。
步驟S104、將所述預(yù)處理文本中的各待處理關(guān)鍵詞,替換成相匹配的關(guān)聯(lián)有鏈接的相關(guān)關(guān)鍵詞。
具體的,當(dāng)預(yù)處理文本已編輯完成時,可以利用查找替換工具,直接將預(yù)處理文本中的各待處理關(guān)鍵詞,替換成相匹配的關(guān)聯(lián)有鏈接的相關(guān)關(guān)鍵詞。
當(dāng)預(yù)處理文本未編輯完成時,可以在文本編輯過程中,將各待處理關(guān)鍵詞,替換成相匹配的關(guān)聯(lián)有鏈接的相關(guān)關(guān)鍵詞。
需要說明的是,文本中的內(nèi)鏈關(guān)鍵詞并不是越多越好,若一個文本中內(nèi)鏈關(guān)鍵詞添加過多,就容易使搜索引擎對文本產(chǎn)生作弊的嫌疑,這樣不僅不會提高搜索引擎的收錄與網(wǎng)站權(quán)重,反而會降低搜索引擎的收錄與網(wǎng)站權(quán)重。因此,在編輯文本中添加內(nèi)鏈關(guān)鍵詞時,可采用如下幾點建議:①文本標(biāo)題部分可添加內(nèi)鏈關(guān)鍵詞,但該內(nèi)鏈關(guān)鍵詞是未關(guān)聯(lián)鏈接的關(guān)鍵詞,在實際應(yīng)用中,網(wǎng)站技術(shù)人員可以手動去掉內(nèi)鏈關(guān)鍵詞相關(guān)聯(lián)的鏈接;②可以在文章的首段、中間和結(jié)尾,添加內(nèi)鏈關(guān)鍵詞;③整個文本中的內(nèi)鏈關(guān)鍵詞的個數(shù)最好為7個或8個。
綜上可知,本發(fā)明在對預(yù)處理文本設(shè)置內(nèi)鏈關(guān)鍵詞時,會對預(yù)處理文本的核心關(guān)鍵詞進行擴展,得到核心關(guān)鍵詞的相關(guān)關(guān)鍵詞,然后將相關(guān)關(guān)鍵詞和預(yù)處理文本的內(nèi)容進行匹配,得到預(yù)處理文本的待處理關(guān)鍵詞,通過將各待處理關(guān)鍵詞替換成相匹配的關(guān)聯(lián)有鏈接相關(guān)關(guān)鍵詞,實現(xiàn)對關(guān)鍵詞內(nèi)鏈的自動添加。由于本發(fā)明中預(yù)處理文本的關(guān)鍵詞是通過與核心關(guān)鍵詞的相關(guān)關(guān)鍵詞匹配得到,因此相比人工設(shè)置關(guān)鍵詞而言,大大提高了內(nèi)鏈關(guān)鍵詞的提取精度。
另外,本發(fā)明還實現(xiàn)了對預(yù)處理文本中內(nèi)鏈關(guān)鍵詞的自動添加,相比傳統(tǒng)手動添加內(nèi)鏈關(guān)鍵詞的鏈接而言,本發(fā)明大大提高了內(nèi)鏈關(guān)鍵詞的鏈接的添加效率。
在一實施例中,如圖2所示,對核心關(guān)鍵詞進行擴展,得到核心關(guān)鍵詞的相關(guān)關(guān)鍵詞的過程包括步驟:
步驟S201、模擬對核心關(guān)鍵詞的搜索行為;
具體的,可以基于Node.js,使用PhantomJs模擬用戶在搜索引擎對核心關(guān)鍵詞的搜索行為。
Node.js是一個基于Chrome V8引擎的JavaScript運行環(huán)境。Node.js對一些特殊用例進行了優(yōu)化,提供了替代的API(Application Programming Interface,應(yīng)用程序編程接口),使Chrome V8在非瀏覽器環(huán)境下運行得更好。
PhantomJs是一個基于WebKit的服務(wù)器端JavaScript API。PhantomJs能夠全面支持web而不需瀏覽器支持,可以用于頁面自動化、網(wǎng)絡(luò)監(jiān)測、頁面解屏以及無界面測試等。
步驟S202、發(fā)出對所述核心關(guān)鍵詞的搜索請求;
具體的,在對核心關(guān)鍵詞進行搜索前,會在基于Node.js的運行環(huán)境顯示搜索引擎,該搜索引擎可以是預(yù)先配置的;然后向搜索引擎發(fā)出對核心關(guān)鍵詞的搜索請求,模擬用戶在搜索引擎對核心關(guān)鍵詞的搜索行為。
步驟S203、接收所述核心關(guān)鍵詞的搜索結(jié)果;
具體的,搜索引擎對核心關(guān)鍵詞進行搜索,查找到核心關(guān)鍵詞的相關(guān)關(guān)鍵詞,并輸出查找到的相關(guān)關(guān)鍵詞,如核心關(guān)鍵詞為“使命召喚”,查找到的“使命召喚”的相關(guān)關(guān)鍵詞可以包括:韓寒(韓寒代言了使命召喚)、1246戰(zhàn)隊(使命召喚游戲比賽戰(zhàn)隊)、AN94地獄行者(使命召喚游戲中的槍)、賞金獵人(使命召喚里的游戲角色)。
步驟S204、至少根據(jù)所述搜索結(jié)果確定所述核心關(guān)鍵詞的相關(guān)關(guān)鍵詞。
可以理解的是,根據(jù)核心關(guān)鍵詞會搜索到的很多相關(guān)關(guān)鍵詞,為提高相關(guān)關(guān)鍵詞的精度,在實際中可以將與核心關(guān)鍵詞關(guān)聯(lián)度較高的關(guān)鍵詞確定為核心關(guān)鍵詞的相關(guān)關(guān)鍵詞。
具體的,可以從搜索結(jié)果中,提取與核心關(guān)鍵詞的關(guān)聯(lián)度,滿足預(yù)設(shè)關(guān)聯(lián)度要求(具體數(shù)值可依據(jù)實際需要而定)的相關(guān)關(guān)鍵詞。如相關(guān)關(guān)鍵詞“使命召喚游戲”與核心關(guān)鍵詞“使用召喚”的關(guān)聯(lián)度為80%,80%超過預(yù)設(shè)關(guān)聯(lián)度65%,因此將“使命召喚游戲”確定為“使用召喚”的相關(guān)關(guān)鍵詞。
綜上可知,本發(fā)明基于Node.js,使用PhantomJs模擬用戶在搜索引擎對核心關(guān)鍵詞的搜索行為,能夠?qū)崿F(xiàn)對內(nèi)鏈關(guān)鍵詞的自動抓取,并且能夠?qū)崿F(xiàn)內(nèi)鏈關(guān)鍵詞在預(yù)處理文本中的自動添加。因此,相關(guān)傳統(tǒng)方案而言,本發(fā)明實現(xiàn)了在網(wǎng)站建設(shè)過程中,對網(wǎng)站內(nèi)鏈SEO的自動優(yōu)化。
可以理解的是,僅通過搜索核心關(guān)鍵詞得到的相關(guān)關(guān)鍵詞,不一定是核心關(guān)鍵詞的優(yōu)選相關(guān)關(guān)鍵詞,如通過搜索核心關(guān)鍵詞“使命召喚”得到相關(guān)關(guān)鍵詞“韓寒(韓寒代言了使命召喚)”。當(dāng)預(yù)處理文本的編輯主題為游戲中各武器的使用方法時,很顯然,預(yù)處理文本中不會多次提及“韓寒”這一相關(guān)關(guān)鍵詞,這樣,對于該預(yù)處理文本而言,“韓寒”就可以認為是“使命召喚”的非優(yōu)選相關(guān)關(guān)鍵詞。
因此,本發(fā)明為提高相關(guān)關(guān)鍵詞的精度,在另一實施例中,如圖3所示,提供了一種相關(guān)關(guān)鍵詞的篩選方法,即步驟S204具體可以包括步驟:
步驟S301、根據(jù)搜索結(jié)果執(zhí)行至少兩次模擬搜索;
其中,下一次模擬搜索的搜索關(guān)鍵詞,根據(jù)上一次的搜索結(jié)果確定。如核心關(guān)鍵詞為“使命召喚”,第一次搜索時,將“使命召喚”作為搜索關(guān)鍵詞,搜索得到“使命召喚”的一個相關(guān)關(guān)鍵詞“使命召喚游戲”;第二次搜索時,將“使命召喚游戲”作為第二次搜索的搜索關(guān)鍵詞,搜索得到“使命召喚游戲”的相關(guān)關(guān)鍵詞,如“使命召喚游戲大全”。
需要說明的是,本步驟中下一次模擬搜索的搜索關(guān)鍵詞,都是根據(jù)上一次的搜索結(jié)果確定,因此,本步驟執(zhí)行的搜索過程可以認為是一種迭代搜索??梢岳斫獾氖?,當(dāng)對每一個相關(guān)關(guān)鍵詞進行迭代搜索時,并不是迭代搜索的次數(shù)越多越好,很多情況下,迭代搜索的次數(shù)越多,搜索得到的搜索關(guān)鍵詞與核心關(guān)鍵詞的關(guān)聯(lián)度越小。所以為避免因迭代搜索帶來的無用功,本申請中對每個相關(guān)關(guān)鍵詞的迭代搜索的次數(shù)優(yōu)選為2次,最多不超過3次。
步驟S302、確定每次模擬搜索的搜索結(jié)果,與所述核心關(guān)鍵詞的關(guān)聯(lián)度;
如“使命召喚游戲”與“使命召喚”的關(guān)聯(lián)度為80%,“使命召喚游戲大全”與“使命召喚”的關(guān)聯(lián)度為70%。
步驟S303、將關(guān)聯(lián)度滿足預(yù)設(shè)關(guān)聯(lián)度要求的搜索結(jié)果,對應(yīng)的搜索關(guān)鍵詞作為相關(guān)關(guān)鍵詞。
如預(yù)設(shè)關(guān)聯(lián)度要求為75%,則將“使命召喚游戲”確定為“使命召喚”的相關(guān)關(guān)鍵詞。
當(dāng)多次搜索結(jié)果與核心關(guān)鍵詞的關(guān)聯(lián)度均滿足預(yù)設(shè)關(guān)聯(lián)度要求時,可以將關(guān)聯(lián)度值相對較大的搜索結(jié)果,對應(yīng)的搜索關(guān)鍵詞作為相關(guān)關(guān)鍵詞;或是將所有關(guān)聯(lián)度滿足預(yù)設(shè)關(guān)聯(lián)度要求的搜索結(jié)果,對應(yīng)的搜索關(guān)鍵詞均作為相關(guān)關(guān)鍵詞。
綜上可知,本發(fā)明首先對核心關(guān)鍵詞進行模擬搜索得到相關(guān)關(guān)鍵詞,然后采用依次對各相關(guān)關(guān)鍵詞循環(huán)搜索的方式,查找到與核心關(guān)鍵詞的關(guān)聯(lián)度相對高的相關(guān)關(guān)鍵詞,并將關(guān)聯(lián)度高的相關(guān)關(guān)鍵詞確認為核心關(guān)鍵詞的相關(guān)關(guān)鍵詞。本發(fā)明通過對各相關(guān)關(guān)鍵詞循環(huán)搜索提高了對相關(guān)關(guān)鍵詞的提取精度,從而提高了內(nèi)鏈關(guān)鍵詞的精度。
可以理解的是,當(dāng)通過對某個核心關(guān)鍵詞進行擴展,得到該核心關(guān)鍵詞的相關(guān)關(guān)鍵詞后,可以將核心關(guān)鍵詞和相對應(yīng)的相關(guān)關(guān)鍵詞以對應(yīng)關(guān)系的形式寫入數(shù)據(jù)庫,以便后續(xù)在數(shù)據(jù)庫中查找確定內(nèi)鏈關(guān)鍵詞。
因此,為進一步優(yōu)化上述實施例,如圖4所示,本發(fā)明另一實施例公開的一種確定內(nèi)鏈關(guān)鍵詞的方法流程圖,在步驟S102之后,還可以包括步驟:
步驟S401、在數(shù)據(jù)庫創(chuàng)建云端數(shù)據(jù)庫表;
其中,本步驟中的數(shù)據(jù)庫指的是網(wǎng)絡(luò)數(shù)據(jù)庫。
具體的,云端數(shù)據(jù)庫表的表名可以命名為:關(guān)鍵詞(keywords),云端數(shù)據(jù)庫表的字段名包括:數(shù)據(jù)庫索引(可用ID表示)、核心關(guān)鍵詞、核心關(guān)鍵詞對應(yīng)的相關(guān)關(guān)鍵詞(可用keywords)、每個相關(guān)關(guān)鍵詞的鏈接(可用URL表示)。
需要說明的是,數(shù)據(jù)庫索引是對數(shù)據(jù)庫表中一列或多列的值進行排序的一種結(jié)果,使用數(shù)據(jù)庫索引可快速訪問數(shù)據(jù)庫表中的特定信息。
從上述論述可知,一個核心關(guān)鍵詞同時與多個相關(guān)關(guān)鍵詞相對應(yīng),當(dāng)云端數(shù)據(jù)庫表中有多個核心關(guān)鍵詞時,數(shù)據(jù)庫列表中會相應(yīng)有很多個相關(guān)關(guān)鍵詞。這樣,當(dāng)將預(yù)處理文本的內(nèi)容與云端數(shù)據(jù)庫表中的相關(guān)關(guān)聯(lián)詞進行匹配時,必然會耗費很長時間。因此,本發(fā)明為提高預(yù)處理文本與云端數(shù)據(jù)庫列表中各相關(guān)關(guān)鍵詞的匹配速度,在云端數(shù)據(jù)庫表中增加了數(shù)據(jù)庫索引,以便快速查找到與預(yù)處理文本的內(nèi)容匹配的相關(guān)關(guān)鍵詞。
本領(lǐng)域技術(shù)人員可以理解的是,對企業(yè)、商家而言,核心關(guān)鍵詞就是他們的經(jīng)營范圍,如產(chǎn)品/服務(wù)名稱、行業(yè)定位,以及企業(yè)名稱或品牌名稱等。因此,避免不了某些核心關(guān)鍵詞的字數(shù)較多,如“租房和買賣房”,因此,為減少核心關(guān)鍵詞在數(shù)據(jù)庫中的占用空間,可以對各個核心關(guān)鍵詞設(shè)置一個業(yè)務(wù)名(Service),如核心關(guān)鍵詞為“租房和買賣房”時,相對應(yīng)的業(yè)務(wù)名可以選用“房屋中介”。
步驟S402、將所述核心關(guān)鍵詞,所述核心關(guān)鍵詞相對應(yīng)的相關(guān)關(guān)鍵詞寫入云端數(shù)據(jù)庫表,其中,所述相關(guān)關(guān)鍵詞關(guān)聯(lián)有鏈接。
具體的,當(dāng)將核心關(guān)鍵詞寫入云端數(shù)據(jù)庫表時,為保證寫入的核心關(guān)鍵詞和云端數(shù)據(jù)庫列表中記錄的核心關(guān)鍵詞不重復(fù),還需對核心關(guān)鍵詞的有效性進行驗證,將有效的核心關(guān)鍵詞及相對應(yīng)的相關(guān)關(guān)鍵詞寫入所述云端數(shù)據(jù)庫表。
其中,有效的核心關(guān)鍵詞指的是:云端數(shù)據(jù)庫表中不存在與該核心關(guān)鍵詞的關(guān)聯(lián)度滿足預(yù)設(shè)關(guān)聯(lián)要求的核心關(guān)鍵詞。
在一實施例中,如圖5所示,對核心關(guān)鍵詞進行擴展,得到核心關(guān)鍵詞的相關(guān)關(guān)鍵詞的過程包括步驟:
步驟S501、從數(shù)據(jù)庫中查找與核心關(guān)鍵詞匹配的核心關(guān)鍵詞,所述數(shù)據(jù)庫中記錄有:數(shù)據(jù)庫索引、核心關(guān)鍵詞、核心關(guān)鍵詞對應(yīng)的相關(guān)關(guān)鍵詞以及每個相關(guān)關(guān)鍵詞的鏈接;
具體的,當(dāng)數(shù)據(jù)庫中的核心關(guān)鍵詞以業(yè)務(wù)名進行存儲時,從數(shù)據(jù)庫中查找與核心關(guān)鍵詞匹配的核心關(guān)鍵詞具體為:從數(shù)據(jù)庫中查找業(yè)務(wù)名與核心關(guān)鍵詞的業(yè)務(wù)名匹配的核心關(guān)鍵詞。
步驟S502、將查找到的核心關(guān)鍵詞對應(yīng)的相關(guān)關(guān)鍵詞,確定為核心關(guān)鍵詞的相關(guān)關(guān)鍵詞。
在一實施例中,如圖6所示,對核心關(guān)鍵詞進行擴展,得到核心關(guān)鍵詞的相關(guān)關(guān)鍵詞的過程包括步驟:
步驟S601、將核心關(guān)鍵詞與數(shù)據(jù)庫存儲的各核心關(guān)鍵詞進行匹配,判斷所述數(shù)據(jù)庫中是否存儲有與所述核心關(guān)鍵詞匹配的核心關(guān)鍵詞,如果是,則執(zhí)行步驟S602,否則,執(zhí)行步驟S603;
其中,本步驟中的數(shù)據(jù)庫指的是網(wǎng)絡(luò)數(shù)據(jù)庫。
步驟S602、從所述數(shù)據(jù)庫中查找與核心關(guān)鍵詞對應(yīng)的相關(guān)關(guān)鍵詞;
步驟S603、模擬用戶在搜索引擎上對所述核心關(guān)鍵詞的搜索行為,至少根據(jù)所述核心關(guān)鍵詞的搜索結(jié)果確定所述核心關(guān)鍵詞的相關(guān)關(guān)鍵詞。
其中,模擬用于在搜索引擎上對核心關(guān)鍵詞的搜索行為的具體過程請參見上述實施例,此次不再贅述。
在一實施例中,如圖7和圖8所示,提供了一種客戶端與網(wǎng)絡(luò)數(shù)據(jù)庫交互的信令圖,交互過程包括步驟:
步驟S701、客戶端向網(wǎng)絡(luò)數(shù)據(jù)庫發(fā)送查找與核心關(guān)鍵詞匹配的核心關(guān)鍵詞的查找請求;
步驟S702、網(wǎng)絡(luò)數(shù)據(jù)庫將核心關(guān)鍵詞與預(yù)存儲的各核心關(guān)鍵詞進行匹配,當(dāng)查找到與核心關(guān)鍵詞匹配的核心關(guān)鍵詞時,執(zhí)行步驟S703;當(dāng)未查找到與核心關(guān)鍵詞匹配的核心關(guān)鍵詞時,執(zhí)行步驟S705;
步驟S703、將核心關(guān)鍵詞對應(yīng)的相關(guān)關(guān)鍵詞發(fā)送給客戶端;
步驟S704、客戶端輸出核心關(guān)鍵詞的相關(guān)關(guān)鍵詞;
步驟S705、向客戶端發(fā)送未查找到匹配的核心關(guān)鍵詞的響應(yīng);
步驟S706、模擬用戶在搜索引擎上對核心關(guān)鍵詞的搜索行為,至少根據(jù)核心關(guān)鍵詞的搜索結(jié)果確定核心關(guān)鍵詞的相關(guān)關(guān)鍵詞。
本領(lǐng)域技術(shù)人員可以理解的是,一個內(nèi)鏈關(guān)鍵詞的鏈接可以有1個或多個,因此,相應(yīng)的本發(fā)明中相關(guān)關(guān)鍵詞關(guān)聯(lián)的鏈接也可以有1個或多個。當(dāng)內(nèi)鏈關(guān)鍵詞關(guān)聯(lián)的鏈接有多個時,若編輯者沒有對內(nèi)鏈關(guān)鍵詞的鏈接進行篩選或排序,則當(dāng)該內(nèi)鏈關(guān)鍵詞在文本中顯示時,點擊該內(nèi)鏈關(guān)關(guān)鍵詞顯示的鏈接會是多個鏈接中隨機選取的一個鏈接。
為實現(xiàn)對內(nèi)鏈關(guān)鍵詞的優(yōu)化,除對內(nèi)鏈關(guān)鍵詞的關(guān)鍵詞進行篩選優(yōu)化外,還可以對內(nèi)鏈關(guān)鍵詞關(guān)聯(lián)的鏈接進行篩選優(yōu)化,在實際中,在對內(nèi)鏈關(guān)鍵詞關(guān)聯(lián)的鏈接進行篩選優(yōu)化時,可以用戶在官網(wǎng)的購買(點擊內(nèi)鏈關(guān)鍵詞后,頁面跳轉(zhuǎn)至用戶在官網(wǎng)的購買界面,如京東)、品牌展示效果(點擊內(nèi)鏈關(guān)鍵詞后,頁面跳轉(zhuǎn)至品牌展示效果界面,手機官網(wǎng)界面)和游戲內(nèi)容展示效果(點擊內(nèi)鏈關(guān)鍵詞后,頁面跳轉(zhuǎn)至游戲內(nèi)容展示效果界面,如“使命召喚”游戲界面)作為篩選依據(jù)。其中,內(nèi)鏈關(guān)鍵詞的鏈接優(yōu)選為三個。
在一實施例中,如圖9所示,在模擬用戶對核心關(guān)鍵詞的搜索行為時,獲取相關(guān)關(guān)鍵詞關(guān)聯(lián)的鏈接的過程包括步驟:
步驟S801、客戶端向服務(wù)器發(fā)送查找相關(guān)關(guān)鍵詞關(guān)聯(lián)的鏈接的查找請求;
步驟S802、服務(wù)器響應(yīng)客戶端發(fā)送的查找請求,并向橋接器發(fā)起查找相關(guān)關(guān)鍵詞關(guān)聯(lián)的鏈接的工作請求;
橋接器是一種用于在兩個或多個網(wǎng)段或子網(wǎng)間提供通信路徑的互聯(lián)設(shè)備,其可以連接兩個相似或不相似的LAN網(wǎng)段。橋接器可以看作是一個郵件分類裝置,其通過查看數(shù)據(jù)分組的地址,可以將數(shù)據(jù)發(fā)送到合適的網(wǎng)段。
步驟S803、橋接器根據(jù)接收到的工作請求,向搜索引擎服務(wù)器發(fā)送執(zhí)行獲取相關(guān)關(guān)鍵詞關(guān)聯(lián)的鏈接的工作指令;
步驟S804、搜索引擎服務(wù)器根據(jù)工作指令,從之前存儲的相關(guān)關(guān)鍵詞的鏈接數(shù)據(jù)中,獲取相關(guān)關(guān)鍵詞關(guān)聯(lián)的鏈接數(shù)據(jù),并將鏈接數(shù)據(jù)發(fā)送給橋接器;
需要說明的是,搜索引擎服務(wù)器用于為訪客保存之前的網(wǎng)頁快照內(nèi)容,以在訪客在無法打開某個搜索結(jié)果,或者打開速度特別慢的情況下,為訪客提供之前保存的網(wǎng)頁內(nèi)容的純文本。其中,搜索引擎服務(wù)器保存的網(wǎng)頁快照內(nèi)容一般只包括文本數(shù)據(jù),而圖片及其他多媒體等非文本數(shù)據(jù)并不會保存。
本實施例中,當(dāng)搜索引擎服務(wù)器接收到橋接器發(fā)送的工作指令后,會從之前保存的網(wǎng)頁快照內(nèi)容中,查找相關(guān)關(guān)鍵詞的鏈接數(shù)據(jù)。
步驟S805、橋接器將鏈接數(shù)據(jù)轉(zhuǎn)發(fā)給服務(wù)器;
步驟S806、服務(wù)器將鏈接數(shù)據(jù)在轉(zhuǎn)發(fā)給客戶端。
與上述方法實施例相對應(yīng),本發(fā)明還公開了一種確定內(nèi)鏈關(guān)鍵詞的裝置。
如圖10所示,本發(fā)明實施例公開的一種確定內(nèi)鏈關(guān)鍵詞的裝置結(jié)構(gòu)示意圖,該裝置包括:
獲取單元901,用于獲取預(yù)處理文本的核心關(guān)鍵詞;
具體的,預(yù)處理文本包括:已編輯完成但未設(shè)置內(nèi)鏈關(guān)鍵詞的文本,以及已經(jīng)確定編輯主題但未編輯的文本。
核心關(guān)鍵詞可以根據(jù)官網(wǎng)內(nèi)容進行定義,一般為產(chǎn)品名,如推廣“使命召喚”游戲,則核心關(guān)鍵詞可選用“使命召喚”。
擴展單元902,用于對所述核心關(guān)鍵詞進行擴展,得到所述核心關(guān)鍵詞的相關(guān)關(guān)鍵詞;其中,所述相關(guān)關(guān)鍵詞關(guān)聯(lián)有鏈接,且所述相關(guān)關(guān)鍵詞至少根據(jù)所述核心關(guān)鍵詞的搜索結(jié)果確定;
具體的,對核心關(guān)鍵詞進行擴展可以通過將核心關(guān)鍵詞輸入到搜索引擎(如百度引擎、谷歌引擎),然后從關(guān)于核心關(guān)鍵詞的搜索結(jié)果中確定核心關(guān)鍵詞的相關(guān)關(guān)鍵詞實現(xiàn)。如核心關(guān)鍵詞為“使命召喚”,將“使命召喚”輸入到搜索引擎,得到關(guān)于“使命召喚”的搜索結(jié)果,然后從該搜索結(jié)果中確定“使命召喚”的相關(guān)關(guān)鍵詞,如韓寒(韓寒代言了使命召喚)、1246戰(zhàn)隊(使命召喚游戲比賽戰(zhàn)隊)、AN94地獄行者(使命召喚游戲中的槍)、賞金獵人(使命召喚里的游戲角色)等,其中,確定這些相關(guān)關(guān)鍵詞都關(guān)聯(lián)有鏈接。
對核心關(guān)鍵詞進行擴展還可以通過在數(shù)據(jù)庫中查找與該核心關(guān)鍵詞匹配的核心關(guān)鍵詞對應(yīng)的相關(guān)關(guān)鍵詞實現(xiàn),其中數(shù)據(jù)庫中記錄有很多個核心關(guān)鍵詞以及每個核心關(guān)鍵詞對應(yīng)的相關(guān)關(guān)鍵詞。如核心關(guān)鍵詞為“使命召喚”,將“使命召喚”與數(shù)據(jù)庫中記錄的各核心關(guān)鍵詞匹配,如數(shù)據(jù)庫中與“使命召喚”匹配到的核心關(guān)鍵詞為“使命召喚游戲”,則數(shù)據(jù)庫中記錄的“使命召喚游戲”對應(yīng)相關(guān)關(guān)鍵詞即是“使命召喚”的相關(guān)關(guān)鍵詞。
匹配單元903,用于將所述預(yù)處理文本的內(nèi)容與所述相關(guān)關(guān)鍵詞進行匹配,確定所述預(yù)處理文本中的待處理關(guān)鍵詞;
具體的,當(dāng)預(yù)處理文本已編輯完成時,可以將預(yù)處理文本的內(nèi)容直接與各相關(guān)關(guān)鍵詞進行匹配,確定預(yù)處理文本中的待處理關(guān)鍵詞;當(dāng)預(yù)處理文本已經(jīng)確定編輯主題但未編輯時,可以首先查找一些與預(yù)處理文本編輯主題相近的文本,然后將這些主題相近的文本作為預(yù)處理文本與各相關(guān)關(guān)鍵詞進行匹配,以確定預(yù)處理文本中的待處理關(guān)鍵詞。
當(dāng)預(yù)處理文本中記錄有與相關(guān)關(guān)鍵詞完全相同的文字內(nèi)容時,則將該相同的文字內(nèi)容作為預(yù)處理文本中的待處理關(guān)鍵詞;當(dāng)預(yù)處理文本中記錄的是與相關(guān)關(guān)鍵詞相近的文字內(nèi)容時,則將該相近的文字內(nèi)容作為預(yù)處理文本中的待處理關(guān)鍵詞,如預(yù)處理文本中記錄的是“使命召喚”,相關(guān)關(guān)鍵詞為“使命召喚游戲”,則將“使命召喚”作為預(yù)處理文本中的待處理關(guān)鍵詞。
在一實施例中,可以采用正則表達式索引出預(yù)處理文本中的備用待處理關(guān)鍵詞,然后將備用待處理關(guān)鍵詞與各相關(guān)關(guān)鍵詞進行匹配,確定預(yù)處理文本中的待處理關(guān)鍵詞,具體可參見方法實施例對應(yīng)部分,此次不再贅述。
替換單元904,用于將所述預(yù)處理文本中的各待處理關(guān)鍵詞,替換成相匹配的關(guān)聯(lián)有鏈接的相關(guān)關(guān)鍵詞。
具體的,當(dāng)預(yù)處理文本已編輯完成時,可以利用查找替換工具,直接將預(yù)處理文本中的各待處理關(guān)鍵詞,替換成相匹配的關(guān)聯(lián)有鏈接的相關(guān)關(guān)鍵詞。
當(dāng)預(yù)處理文本未編輯完成時,可以在文本編輯過程中,將各待處理關(guān)鍵詞,替換成相匹配的關(guān)聯(lián)有鏈接的相關(guān)關(guān)鍵詞。
需要說明的是,文本中的內(nèi)鏈關(guān)鍵詞并不是越多越好,若一個文本中內(nèi)鏈關(guān)鍵詞添加過多,就容易使搜索引擎對文本產(chǎn)生作弊的嫌疑,這樣不僅不會提高搜索引擎的收錄與網(wǎng)站權(quán)重,反而會降低搜索引擎的收錄與網(wǎng)站權(quán)重。因此,在編輯文本中添加內(nèi)鏈關(guān)鍵詞時,可采用如下幾點建議:①文本標(biāo)題部分可添加內(nèi)鏈關(guān)鍵詞,但該內(nèi)鏈關(guān)鍵詞是未關(guān)聯(lián)鏈接的關(guān)鍵詞,在實際應(yīng)用中,網(wǎng)站技術(shù)人員可以手動去掉內(nèi)鏈關(guān)鍵詞相關(guān)聯(lián)的鏈接;②可以在文章的首段、中間和結(jié)尾,添加內(nèi)鏈關(guān)鍵詞;③整個文本中的內(nèi)鏈關(guān)鍵詞的個數(shù)最好為7個或8個。
綜上可知,本發(fā)明在對預(yù)處理文本設(shè)置內(nèi)鏈關(guān)鍵詞時,會對預(yù)處理文本的核心關(guān)鍵詞進行擴展,得到核心關(guān)鍵詞的相關(guān)關(guān)鍵詞,然后將相關(guān)關(guān)鍵詞和預(yù)處理文本的內(nèi)容進行匹配,得到預(yù)處理文本的待處理關(guān)鍵詞,通過將各待處理關(guān)鍵詞替換成相匹配的關(guān)聯(lián)有鏈接相關(guān)關(guān)鍵詞,實現(xiàn)對關(guān)鍵詞內(nèi)鏈的自動添加。由于本發(fā)明中預(yù)處理文本的關(guān)鍵詞是通過與核心關(guān)鍵詞的相關(guān)關(guān)鍵詞匹配得到,因此相比人工設(shè)置關(guān)鍵詞而言,大大提高了內(nèi)鏈關(guān)鍵詞的提取精度。
另外,本發(fā)明還實現(xiàn)了對預(yù)處理文本中內(nèi)鏈關(guān)鍵詞的自動添加,相比傳統(tǒng)手動添加內(nèi)鏈關(guān)鍵詞的鏈接而言,本發(fā)明大大提高了內(nèi)鏈關(guān)鍵詞的鏈接的添加效率。
在一實施例中,如圖11所示,擴展單元902可以包括:
模擬子單元1001,用于模擬對所述核心關(guān)鍵詞的搜索行為;
具體的,可以基于Node.js,使用PhantomJs模擬用戶在搜索引擎對核心關(guān)鍵詞的搜索行為。
請求發(fā)出子單元1002,用于發(fā)出對所述核心關(guān)鍵詞的搜索請求;
具體的,在對核心關(guān)鍵詞進行搜索前,會在基于Node.js的運行環(huán)境顯示搜索引擎,該搜索引擎可以是預(yù)先配置的;然后向搜索引擎發(fā)出對核心關(guān)鍵詞的搜索請求,模擬用戶在搜索引擎對核心關(guān)鍵詞的搜索行為。
接收子單元1003,用于接收所述核心關(guān)鍵詞的搜索結(jié)果;
具體的,搜索引擎對核心關(guān)鍵詞進行搜索,查找到核心關(guān)鍵詞的相關(guān)關(guān)鍵詞,并輸出查找到的相關(guān)關(guān)鍵詞,如核心關(guān)鍵詞為“使命召喚”,查找到的“使命召喚”的相關(guān)關(guān)鍵詞可以包括:韓寒(韓寒代言了使命召喚)、1246戰(zhàn)隊(使命召喚游戲比賽戰(zhàn)隊)、AN94地獄行者(使命召喚游戲中的槍)、賞金獵人(使命召喚里的游戲角色)。
第一確定子單元1004,用于至少根據(jù)所述搜索結(jié)果確定所述核心關(guān)鍵詞的相關(guān)關(guān)鍵詞。
可以理解的是,根據(jù)核心關(guān)鍵詞會搜索到的很多相關(guān)關(guān)鍵詞,為提高相關(guān)關(guān)鍵詞的精度,在實際中可以將與核心關(guān)鍵詞關(guān)聯(lián)度較高的關(guān)鍵詞確定為核心關(guān)鍵詞的相關(guān)關(guān)鍵詞。
因此,第一確定子單元1004還用于:從所述搜索結(jié)果中,提取與所述核心關(guān)鍵詞的關(guān)聯(lián)度,滿足預(yù)設(shè)關(guān)聯(lián)度要求的相關(guān)關(guān)鍵詞。
具體的,可以從搜索結(jié)果中,提取與核心關(guān)鍵詞的關(guān)聯(lián)度,滿足預(yù)設(shè)關(guān)聯(lián)度要求(具體數(shù)值可依據(jù)實際需要而定)的相關(guān)關(guān)鍵詞。如相關(guān)關(guān)鍵詞“使命召喚游戲”與核心關(guān)鍵詞“使用召喚”的關(guān)聯(lián)度為80%,80%超過預(yù)設(shè)關(guān)聯(lián)度65%,因此將“使命召喚游戲”確定為“使用召喚”的相關(guān)關(guān)鍵詞。
綜上可知,本發(fā)明基于Node.js,使用PhantomJs模擬用戶在搜索引擎對核心關(guān)鍵詞的搜索行為,能夠?qū)崿F(xiàn)對內(nèi)鏈關(guān)鍵詞的自動抓取,并且能夠?qū)崿F(xiàn)內(nèi)鏈關(guān)鍵詞在預(yù)處理文本中的自動添加。因此,相關(guān)傳統(tǒng)方案而言,本發(fā)明實現(xiàn)了在網(wǎng)站建設(shè)過程中,對網(wǎng)站內(nèi)鏈SEO的自動優(yōu)化。
可以理解的是,僅通過搜索核心關(guān)鍵詞得到的相關(guān)關(guān)鍵詞,不一定是核心關(guān)鍵詞的優(yōu)選相關(guān)關(guān)鍵詞,如通過搜索核心關(guān)鍵詞“使命召喚”得到相關(guān)關(guān)鍵詞“韓寒(韓寒代言了使命召喚)”。當(dāng)預(yù)處理文本的編輯主題為游戲中各武器的使用方法時,很顯然,預(yù)處理文本中不會多次提及“韓寒”這一相關(guān)關(guān)鍵詞,這樣,對于該預(yù)處理文本而言,“韓寒”就可以認為是“使命召喚”的非優(yōu)選相關(guān)關(guān)鍵詞。
因此,本發(fā)明為提高相關(guān)關(guān)鍵詞的精度,在另一實施例中,如圖12所示,第一確定子單元1004包括:
第一搜索子單1101元,用于根據(jù)所述搜索結(jié)果執(zhí)行至少兩次模擬搜索,其中,下一次模擬搜索的搜索關(guān)鍵詞,根據(jù)上一次的搜索結(jié)果確定;
舉例說明,核心關(guān)鍵詞為“使命召喚”,第一次搜索時,將“使命召喚”作為搜索關(guān)鍵詞,搜索得到“使命召喚”的一個相關(guān)關(guān)鍵詞“使命召喚游戲”;第二次搜索時,將“使命召喚游戲”作為第二次搜索的搜索關(guān)鍵詞,搜索得到“使命召喚游戲”的相關(guān)關(guān)鍵詞,如“使命召喚游戲大全”。
關(guān)聯(lián)度確定子單元1102,用于確定每次模擬搜索的搜索結(jié)果,與所述核心關(guān)鍵詞的關(guān)聯(lián)度;
如“使命召喚游戲”與“使命召喚”的關(guān)聯(lián)度為80%,“使命召喚游戲大全”與“使命召喚”的關(guān)聯(lián)度為70%。
篩選子單元1103,用于將關(guān)聯(lián)度滿足預(yù)設(shè)關(guān)聯(lián)度要求的搜索結(jié)果,對應(yīng)的搜索關(guān)鍵詞作為相關(guān)關(guān)鍵詞。
如預(yù)設(shè)關(guān)聯(lián)度要求為75%,則將“使命召喚游戲”確定為“使命召喚”的相關(guān)關(guān)鍵詞。
當(dāng)多次搜索結(jié)果與核心關(guān)鍵詞的關(guān)聯(lián)度均滿足預(yù)設(shè)關(guān)聯(lián)度要求時,可以將關(guān)聯(lián)度值相對較大的搜索結(jié)果,對應(yīng)的搜索關(guān)鍵詞作為相關(guān)關(guān)鍵詞;或是將所有關(guān)聯(lián)度滿足預(yù)設(shè)關(guān)聯(lián)度要求的搜索結(jié)果,對應(yīng)的搜索關(guān)鍵詞均作為相關(guān)關(guān)鍵詞。
綜上可知,本發(fā)明首先對核心關(guān)鍵詞進行模擬搜索得到相關(guān)關(guān)鍵詞,然后采用依次對各相關(guān)關(guān)鍵詞循環(huán)搜索的方式,查找到與核心關(guān)鍵詞的關(guān)聯(lián)度相對高的相關(guān)關(guān)鍵詞,并將關(guān)聯(lián)度高的相關(guān)關(guān)鍵詞確認為核心關(guān)鍵詞的相關(guān)關(guān)鍵詞。本發(fā)明通過對各相關(guān)關(guān)鍵詞循環(huán)搜索提高了對相關(guān)關(guān)鍵詞的提取精度,從而提高了內(nèi)鏈關(guān)鍵詞的精度。
可以理解的是,當(dāng)通過對某個核心關(guān)鍵詞進行擴展,得到該核心關(guān)鍵詞的相關(guān)關(guān)鍵詞后,可以將核心關(guān)鍵詞和相對應(yīng)的相關(guān)關(guān)鍵詞以對應(yīng)關(guān)系的形式寫入數(shù)據(jù)庫,以便后續(xù)在數(shù)據(jù)庫中查找確定內(nèi)鏈關(guān)鍵詞。
因此,為進一步優(yōu)化上述實施例,如圖13所示,在圖10所示實施例的基礎(chǔ)上,確定內(nèi)鏈關(guān)鍵詞的裝置還包括:
創(chuàng)建單元1201,用于在擴展單元902對所述核心關(guān)鍵詞進行擴展,得到所述核心關(guān)鍵詞的相關(guān)關(guān)鍵詞之后,在數(shù)據(jù)庫創(chuàng)建云端數(shù)據(jù)庫表,所述云端數(shù)據(jù)庫表包括:數(shù)據(jù)庫索引、核心關(guān)鍵詞的業(yè)務(wù)名、核心關(guān)鍵詞對應(yīng)的相關(guān)關(guān)鍵詞以及每個相關(guān)關(guān)鍵詞的鏈接;
需要說明的是,數(shù)據(jù)庫索引是對數(shù)據(jù)庫表中一列或多列的值進行排序的一種結(jié)果,使用數(shù)據(jù)庫索引可快速訪問數(shù)據(jù)庫表中的特定信息。
從上述論述可知,一個核心關(guān)鍵詞同時與多個相關(guān)關(guān)鍵詞相對應(yīng),當(dāng)云端數(shù)據(jù)庫表中有多個核心關(guān)鍵詞時,數(shù)據(jù)庫列表中會相應(yīng)有很多個相關(guān)關(guān)鍵詞。這樣,當(dāng)將預(yù)處理文本的內(nèi)容與云端數(shù)據(jù)庫表中的相關(guān)關(guān)聯(lián)詞進行匹配時,必然會耗費很長時間。因此,本發(fā)明為提高預(yù)處理文本與云端數(shù)據(jù)庫列表中各相關(guān)關(guān)鍵詞的匹配速度,在云端數(shù)據(jù)庫表中增加了數(shù)據(jù)庫索引,以便快速查找到與預(yù)處理文本的內(nèi)容匹配的相關(guān)關(guān)鍵詞。
本領(lǐng)域技術(shù)人員可以理解的是,對企業(yè)、商家而言,核心關(guān)鍵詞就是他們的經(jīng)營范圍,如產(chǎn)品/服務(wù)名稱、行業(yè)定位,以及企業(yè)名稱或品牌名稱等。因此,避免不了某些核心關(guān)鍵詞的字數(shù)較多,如“租房和買賣房”,因此,為減少核心關(guān)鍵詞在數(shù)據(jù)庫中的占用空間,可以對各個核心關(guān)鍵詞設(shè)置一個業(yè)務(wù)名(Service),如核心關(guān)鍵詞為“租房和買賣房”時,相對應(yīng)的業(yè)務(wù)名可以選用“房屋中介”。
寫入單元1202,用于將所述核心關(guān)鍵詞,所述核心關(guān)鍵詞相對應(yīng)的相關(guān)關(guān)鍵詞寫入所述云端數(shù)據(jù)庫表,其中,所述相關(guān)關(guān)鍵詞關(guān)聯(lián)有鏈接。
具體的,當(dāng)將核心關(guān)鍵詞寫入云端數(shù)據(jù)庫表時,為保證寫入的核心關(guān)鍵詞和云端數(shù)據(jù)庫列表中記錄的核心關(guān)鍵詞不重復(fù),還需對核心關(guān)鍵詞的有效性進行驗證,將有效的核心關(guān)鍵詞及相對應(yīng)的相關(guān)關(guān)鍵詞寫入所述云端數(shù)據(jù)庫表。
其中,有效的核心關(guān)鍵詞指的是:云端數(shù)據(jù)庫表中不存在與該核心關(guān)鍵詞的關(guān)聯(lián)度滿足預(yù)設(shè)關(guān)聯(lián)要求的核心關(guān)鍵詞。
因此,寫入單元1202可以包括:
驗證子單元,用于驗證所述核心關(guān)鍵詞的有效性;
寫入子單元,用于將有效的核心關(guān)鍵詞及相對應(yīng)的相關(guān)關(guān)鍵詞寫入所述云端數(shù)據(jù)庫表。
在一實施例中,如圖14所示,擴展單元802可以包括:
第一查找子單元1301,用于從數(shù)據(jù)庫中查找與所述核心關(guān)鍵詞匹配的核心關(guān)鍵詞,所述數(shù)據(jù)庫中記錄有:數(shù)據(jù)庫索引、核心關(guān)鍵詞、核心關(guān)鍵詞對應(yīng)的相關(guān)關(guān)鍵詞以及每個相關(guān)關(guān)鍵詞的鏈接;
具體的,當(dāng)數(shù)據(jù)庫中的核心關(guān)鍵詞以業(yè)務(wù)名進行存儲時,從數(shù)據(jù)庫中查找與核心關(guān)鍵詞匹配的核心關(guān)鍵詞具體為:從數(shù)據(jù)庫中查找業(yè)務(wù)名與核心關(guān)鍵詞的業(yè)務(wù)名匹配的核心關(guān)鍵詞。
第二確定子單元1302,用于將查找到的核心關(guān)鍵詞對應(yīng)的相關(guān)關(guān)鍵詞,確定為所述核心關(guān)鍵詞的相關(guān)關(guān)鍵詞。
在一實施例中,如圖15所示,擴展單元902可以包括:
判斷子單元1401,用于將所述核心關(guān)鍵詞與數(shù)據(jù)庫存儲的各核心關(guān)鍵詞進行匹配,判斷所述數(shù)據(jù)庫中是否存儲有與所述核心關(guān)鍵詞匹配的核心關(guān)鍵詞;
第二查找子單元1402,用于在判斷子單元1401判斷為是的情況下,從所述數(shù)據(jù)庫中查找與核心關(guān)鍵詞對應(yīng)的相關(guān)關(guān)鍵詞;
第二搜索子單元1403,用于在判斷子單元1401判斷為否的情況下,模擬用戶在搜索引擎上對所述核心關(guān)鍵詞的搜索行為,至少根據(jù)所述核心關(guān)鍵詞的搜索結(jié)果確定所述核心關(guān)鍵詞的相關(guān)關(guān)鍵詞。
其中,模擬用于在搜索引擎上對核心關(guān)鍵詞的搜索行為的具體過程請參見上述實施例,此次不再贅述。
本領(lǐng)域技術(shù)人員可以理解的是,一個內(nèi)鏈關(guān)鍵詞的鏈接可以有1個或多個,因此,相應(yīng)的本發(fā)明中相關(guān)關(guān)鍵詞關(guān)聯(lián)的鏈接也可以有1個或多個。當(dāng)內(nèi)鏈關(guān)鍵詞關(guān)聯(lián)的鏈接有多個時,若編輯者沒有對內(nèi)鏈關(guān)鍵詞的鏈接進行篩選或排序,則當(dāng)該內(nèi)鏈關(guān)鍵詞在文本中顯示時,點擊該內(nèi)鏈關(guān)關(guān)鍵詞顯示的鏈接會是多個鏈接中隨機選取的一個鏈接。
為實現(xiàn)對內(nèi)鏈關(guān)鍵詞的優(yōu)化,除對內(nèi)鏈關(guān)鍵詞的關(guān)鍵詞進行篩選優(yōu)化外,還可以對內(nèi)鏈關(guān)鍵詞關(guān)聯(lián)的鏈接進行篩選優(yōu)化,在實際中,在對內(nèi)鏈關(guān)鍵詞關(guān)聯(lián)的鏈接進行篩選優(yōu)化時,可以用戶在官網(wǎng)的購買(點擊內(nèi)鏈關(guān)鍵詞后,頁面跳轉(zhuǎn)至用戶在官網(wǎng)的購買界面,如京東)、品牌展示效果(點擊內(nèi)鏈關(guān)鍵詞后,頁面跳轉(zhuǎn)至品牌展示效果界面,手機官網(wǎng)界面)和游戲內(nèi)容展示效果(點擊內(nèi)鏈關(guān)鍵詞后,頁面跳轉(zhuǎn)至游戲內(nèi)容展示效果界面,如“使命召喚”游戲界面)作為篩選依據(jù)。其中,內(nèi)鏈關(guān)鍵詞的鏈接優(yōu)選為三個。
需要說明的是,裝置實施例中,各組成部分的具體工作原理,請參見方法實施例對應(yīng)部分,此次不再贅述。
最后,還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
本說明書中各個實施例采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似部分互相參見即可。
對所公開的實施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對這些實施例的多種修改對本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現(xiàn)。因此,本發(fā)明將不會被限制于本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的范圍。