本發(fā)明涉及語(yǔ)義網(wǎng)絡(luò)技術(shù)領(lǐng)域,具體涉及改進(jìn)的模糊C-均值算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化。
背景技術(shù):
由于用戶在互聯(lián)網(wǎng)檢索信息時(shí),通常的手段是使用搜索引擎進(jìn)行搜索,用戶對(duì)搜索結(jié)果頁(yè)面的關(guān)注點(diǎn)不在付費(fèi)推廣的鏈接區(qū)域,而是聚焦于自然排名的搜索結(jié)果處,因此進(jìn)行搜索引擎優(yōu)化來(lái)提高自然排名就變得尤為重要。對(duì)于大部分企業(yè)來(lái)說(shuō),進(jìn)行搜索引擎優(yōu)化是投入少、回報(bào)高的營(yíng)銷行為,搜索引擎優(yōu)化對(duì)于企業(yè)網(wǎng)站的網(wǎng)絡(luò)營(yíng)銷起著重要的作用。搜索引擎優(yōu)化技術(shù)包括黑帽技術(shù)和白帽技術(shù),目前各搜索引擎已經(jīng)引入相關(guān)技術(shù)和規(guī)則對(duì)使用黑帽技術(shù)的網(wǎng)站進(jìn)行懲罰;白帽技術(shù)則表示被搜索引擎認(rèn)可的優(yōu)化技術(shù)。一個(gè)商業(yè)網(wǎng)站以其核心關(guān)鍵字在主流搜索引擎中獲得自然排名優(yōu)先,在今天的商業(yè)社會(huì),有著非比尋常的價(jià)值。因此關(guān)鍵字也常被稱為是整個(gè)搜索應(yīng)用的基石。關(guān)鍵詞的使用是否得當(dāng),直接關(guān)系到網(wǎng)站在搜索引擎的搜索結(jié)果中的位置,現(xiàn)今,暫未提出一個(gè)有效的方法來(lái)簡(jiǎn)化關(guān)鍵詞分析流程,也沒有一個(gè)完善的機(jī)制來(lái)管理關(guān)鍵詞優(yōu)化策略和進(jìn)度,基于上述需求,本發(fā)明提供了改進(jìn)的模糊C-均值算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)于關(guān)鍵詞優(yōu)化實(shí)現(xiàn)搜索引擎優(yōu)化的技術(shù)問題,本發(fā)明提供了改進(jìn)的模糊C-均值算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化。
為了解決上述問題,本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的:
步驟1:根據(jù)企業(yè)業(yè)務(wù)確定核心關(guān)鍵詞,利用搜索引擎搜集相關(guān)關(guān)鍵字,這些關(guān)鍵字在搜索引擎中有相應(yīng)數(shù)據(jù)項(xiàng),如本國(guó)每月搜索量、競(jìng)爭(zhēng)程度和估算每次點(diǎn)擊費(fèi)用(CPC)等
步驟2:結(jié)合企業(yè)產(chǎn)品和市場(chǎng)分析,篩選降維上述搜索到的相關(guān)關(guān)鍵字集合;
步驟3:針對(duì)篩選降維后的關(guān)鍵詞集合,通過搜索引擎搜索關(guān)鍵詞對(duì)應(yīng)的頁(yè)面,這里記錄首頁(yè)網(wǎng)頁(yè)數(shù)和總搜索頁(yè)面數(shù),即每個(gè)關(guān)鍵詞由五維向量再降維為四維的。
步驟4:改進(jìn)的模糊C-均值算法,對(duì)上述關(guān)鍵詞進(jìn)行聚類處理,其具體子步驟如下:
步驟4.1:初始化數(shù)據(jù)對(duì)象集合D為C類,用值[0,1]間的隨機(jī)數(shù)初始化隸屬矩陣J,使其滿足隸屬的整個(gè)約束條件
步驟4.2:初始化每一個(gè)ε領(lǐng)域的相似度函數(shù)構(gòu)建C類總目標(biāo)函數(shù)
步驟4.3:根據(jù)判定函數(shù)Δ(S)的結(jié)果,重新計(jì)算各簇中心;
步驟4.4:用wij計(jì)算新的隸屬矩陣J,則轉(zhuǎn)到步驟4.2,否則迭代結(jié)束,輸出聚類結(jié)果。
步驟5:根據(jù)企業(yè)具體情況,綜合關(guān)鍵詞效能優(yōu)化和價(jià)值率優(yōu)化,選擇合適的關(guān)鍵詞優(yōu)化策略達(dá)到網(wǎng)站優(yōu)化目標(biāo)。
本發(fā)明有益效果是:
1,此算法可以精簡(jiǎn)關(guān)鍵詞分析流程,進(jìn)而減少整個(gè)網(wǎng)站優(yōu)化工作量。
2,此算法的運(yùn)行時(shí)間復(fù)雜度低,處理速度更快。
3、此算法具有更大的利用價(jià)值。
4、能幫助網(wǎng)站在短時(shí)間內(nèi)快速提升其關(guān)鍵詞的排名。
5、為企業(yè)網(wǎng)站帶來(lái)一定的流量和詢盤,從而達(dá)到理想的網(wǎng)站優(yōu)化目標(biāo)。
6、此算法精確地分配了每個(gè)領(lǐng)域密度與相似度的權(quán)重系數(shù),分類結(jié)果的準(zhǔn)確度更符合經(jīng)驗(yàn)值。
7、此算法得到的聚類結(jié)果信噪比更好。
8,避免結(jié)果過早收斂。
附圖說(shuō)明
圖1改進(jìn)的模糊C-均值算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化結(jié)構(gòu)流程圖
圖2改進(jìn)的模糊C-均值算法在聚類分析中的應(yīng)用流程圖
具體實(shí)施方式
為了解決關(guān)鍵詞優(yōu)化實(shí)現(xiàn)搜索引擎優(yōu)化的技術(shù)問題,結(jié)合圖1-圖2對(duì)本發(fā)明進(jìn)行了詳細(xì)說(shuō)明,其具體實(shí)施步驟如下:
步驟1:根據(jù)企業(yè)業(yè)務(wù)確定核心關(guān)鍵詞,利用搜索引擎搜集相關(guān)關(guān)鍵字,這些關(guān)鍵字在搜索引擎中有相應(yīng)數(shù)據(jù)項(xiàng),如本國(guó)每月搜索量、競(jìng)爭(zhēng)程度和估算每次點(diǎn)擊費(fèi)用(CPC)等。
步驟2:結(jié)合企業(yè)產(chǎn)品和市場(chǎng)分析,篩選降維上述搜索到的相關(guān)關(guān)鍵字集合;
步驟3:針對(duì)篩選降維后的關(guān)鍵詞集合,通過搜索引擎搜索關(guān)鍵詞對(duì)應(yīng)的頁(yè)面,這里記錄首頁(yè)網(wǎng)頁(yè)數(shù)和總搜索頁(yè)面數(shù),即每個(gè)關(guān)鍵詞由五維向量再降維為四維的,其具體計(jì)算過程如下:
這里相關(guān)關(guān)鍵詞個(gè)數(shù)為m,既有下列m×5矩陣:
Ni、Ldi、CPCi、NiS、NiY依次為第i個(gè)關(guān)鍵詞對(duì)應(yīng)的本國(guó)每月搜索量、競(jìng)爭(zhēng)程度、估算每次點(diǎn)擊費(fèi)用(CPC)、首頁(yè)網(wǎng)頁(yè)數(shù)、總搜索頁(yè)面數(shù)。
再降維為四維,即
Xi∈(1,2,…,m)為搜索效能,Zi∈(1,2,…,m)為價(jià)值率,即為下式:
步驟4:改進(jìn)的模糊C-均值算法,對(duì)上述關(guān)鍵詞進(jìn)行聚類處理,其具體子步驟如下:
步驟4.1:初始化數(shù)據(jù)對(duì)象集合D為C類,用值[0,1]間的隨機(jī)數(shù)初始化隸屬矩陣J,使其滿足隸屬的整個(gè)約束條件,其具體計(jì)算過程如下:
根據(jù)ε領(lǐng)域初始化數(shù)據(jù)對(duì)象集合D劃分為C類;
初始化隸屬矩陣J為m×C:
wij為關(guān)鍵詞i屬于j類的程度系數(shù),即j∈(1,2,…,C)、i∈(1,2,…,m)。
隸屬的整個(gè)約束條件為:
步驟4.2:初始化每一個(gè)ε領(lǐng)域的相似度函數(shù)構(gòu)建C類總目標(biāo)函數(shù)其具體計(jì)算過程如下:
上式nε為每一個(gè)ε領(lǐng)域內(nèi)數(shù)據(jù)對(duì)象的個(gè)數(shù),為每一個(gè)ε領(lǐng)域內(nèi)第i個(gè)關(guān)鍵詞向量與其中心點(diǎn)向量的相似度,α、β分別為數(shù)量nε、相似度函數(shù)的影響系數(shù),且α+β=1,α<β,其值可以根據(jù)實(shí)驗(yàn)迭代出合適的值。
為屬于j類的第i個(gè)關(guān)鍵詞的空間向量,為j類簇中心向量,h為向量對(duì)應(yīng)元素的個(gè)數(shù)。
構(gòu)建C類總目標(biāo)函數(shù)為:
λ1,λ2,…,λm為n個(gè)約束式的拉格朗日乘子。對(duì)所有輸入?yún)⒘壳髮?dǎo),即可得使上式達(dá)到最大的必要條件,即wij、Cj的值;
上式為關(guān)鍵詞i所對(duì)應(yīng)的向量;
步驟4.3:根據(jù)判定函數(shù)Δ(S)的結(jié)果,重新計(jì)算各簇中心,其具體計(jì)算過程如下:
當(dāng)前迭代得到的全局相似度函數(shù),為前一次迭代得到的全局相似度函數(shù),當(dāng)?shù)玫降牡Y(jié)果差值滿足上式判定條件,則算法停止。
步驟4.4:用wij計(jì)算新的隸屬矩陣J,則轉(zhuǎn)到步驟4.2,否則迭代結(jié)束,輸出聚類結(jié)果。
改進(jìn)的模糊C-均值算法的具體結(jié)構(gòu)流程如圖2。
步驟5:根據(jù)企業(yè)具體情況,綜合關(guān)鍵詞效能優(yōu)化和價(jià)值率優(yōu)化,選擇合適的關(guān)鍵詞優(yōu)化策略達(dá)到網(wǎng)站優(yōu)化目標(biāo)。
改進(jìn)的模糊C-均值算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化,其偽代碼過程
輸入:網(wǎng)站提取的核心關(guān)鍵詞,基于ε領(lǐng)域初始化簇,隨機(jī)初始化隸屬矩陣J;
輸出:全局相似度函數(shù)的總和最大的C個(gè)簇。