本發(fā)明涉及語義網(wǎng)絡(luò)技術(shù)領(lǐng)域,具體涉及改進的基于約束條件的聚類算法實現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化。
背景技術(shù):
搜索引擎對提高網(wǎng)站訪問量起著至關(guān)重要的作用,由于用戶在互聯(lián)網(wǎng)檢索信息,通常的手段是使用搜索引擎進行搜索。因此,在網(wǎng)絡(luò)推廣領(lǐng)域,SEO(Search Engine Optimization,搜索引擎優(yōu)化)就具有了舉足輕重的作用,從而備受廣大網(wǎng)站的重視。搜索引擎優(yōu)化技術(shù)包括黑帽技術(shù)和白帽技術(shù),其中黑帽技術(shù)表示違反搜索引擎優(yōu)化規(guī)則的惡意優(yōu)化技術(shù),在關(guān)鍵詞優(yōu)化技術(shù)中表現(xiàn)為在頁面中堆砌關(guān)鍵詞或放置無關(guān)關(guān)鍵詞以提高在搜索引擎中的排名,目前各搜索引擎已經(jīng)引入相關(guān)技術(shù)和規(guī)則對使用黑帽技術(shù)的網(wǎng)站進行懲罰;白帽技術(shù)則表示被搜索引擎認(rèn)可的優(yōu)化技術(shù)。真正的SEO是通過采用易于搜索引擎索引的合理手段,使網(wǎng)站對用戶和搜索引擎更友好(Search Engine Friendly),從而更容易被搜索引擎收錄及優(yōu)先排序。
目前國外的搜索引擎優(yōu)化理論已經(jīng)非常成熟,國內(nèi)的理論也已形成。但是就國內(nèi)企業(yè)應(yīng)用搜索引擎優(yōu)化來看還不是很理想,還正處于一種正在興起的狀態(tài),針對企業(yè)網(wǎng)站的實際情況所建立起來的優(yōu)化策略理論還沒有形成,還只是一些零零散散的研究成果和理論,并且發(fā)展也極為不成熟,導(dǎo)致了一些企業(yè)濫用優(yōu)化理論,追求眼前暫時的利益而進行作弊。這對于企業(yè)網(wǎng)站的信息化推廣來說極為不利,必須對這些“散落”的企業(yè)級優(yōu)化策略理論進行有效的整合,使之成為一整套企業(yè)級的優(yōu)化策略理論來指導(dǎo)企業(yè)網(wǎng)站進行相關(guān)的優(yōu)化?;谏鲜鲂枨螅景l(fā)明提供了改進的基于約束條件的聚類算法實現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化。
技術(shù)實現(xiàn)要素:
針對于關(guān)鍵詞優(yōu)化實現(xiàn)搜索引擎優(yōu)化的技術(shù)問題,本發(fā)明提供了改進的基于約束條件的聚類算法實現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化。
為了解決上述問題,本發(fā)明是通過以下技術(shù)方案實現(xiàn)的:
步驟1:根據(jù)企業(yè)業(yè)務(wù)確定核心關(guān)鍵詞,利用搜索引擎搜集相關(guān)關(guān)鍵字,這些關(guān)鍵字在搜索引擎中有相應(yīng)數(shù)據(jù)項,如本國每月搜索量、競爭程度和估算每次點擊費用(CPC)等
步驟2:結(jié)合企業(yè)產(chǎn)品和市場分析,篩選降維上述搜索到的相關(guān)關(guān)鍵字集合;
步驟3:針對篩選降維后的關(guān)鍵詞集合,通過搜索引擎搜索關(guān)鍵詞對應(yīng)的頁面,這里記錄首頁網(wǎng)頁數(shù)和總搜索頁面數(shù),即每個關(guān)鍵詞由五維向量再降維為四維的。
步驟4:改進的基于約束條件的聚類算法,對上述關(guān)鍵詞進行聚類處理,其具體子步驟如下:
步驟4.1:利用基于ε領(lǐng)域的k-means算法初始化為c類。
步驟4.2:用值[0,1]間的隨機數(shù)初始化隸屬矩陣J,使其滿足隸屬的整個約束條件。
步驟4.3:初始化每一個領(lǐng)域目標(biāo)函數(shù)構(gòu)建c類總目標(biāo)函數(shù),綜合隸屬約束條件,構(gòu)建m個方程組,對其進行求解,即可得聚類結(jié)果
步驟4.4:利用下式判定函數(shù)Δ(g)的結(jié)果,重新計算各簇中心;
步驟4.5:如果簇中心發(fā)生變化,則轉(zhuǎn)到步驟4.2,重新計算隸屬矩陣J,否則迭代結(jié)束,輸出聚類結(jié)果。
步驟5:根據(jù)企業(yè)具體情況,綜合關(guān)鍵詞效能優(yōu)化和價值率優(yōu)化,選擇合適的關(guān)鍵詞優(yōu)化策略達到網(wǎng)站優(yōu)化目標(biāo)。
本發(fā)明有益效果是:
1,此算法可以精簡關(guān)鍵詞分析流程,進而減少整個網(wǎng)站優(yōu)化工作量。
2,此算法的運行時間復(fù)雜度低,處理速度更快。
3、此算法具有更大的利用價值。
4、能幫助網(wǎng)站在短時間內(nèi)快速提升其關(guān)鍵詞的排名。
5、為企業(yè)網(wǎng)站帶來一定的流量和詢盤,從而達到理想的網(wǎng)站優(yōu)化目標(biāo)。
6、此算法精準(zhǔn)的分配每個領(lǐng)域占比與局部領(lǐng)域內(nèi)相關(guān)度的權(quán)重系數(shù)使得分類結(jié)果更加符合經(jīng)驗值。
7、減小了孤立點對聚類結(jié)果的影響。
8、數(shù)據(jù)光滑度處理的更好,降低了人為誤差。
附圖說明
圖1改進的基于約束條件的聚類算法實現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化結(jié)構(gòu)流程圖
圖2改進的基于約束條件的聚類算法在聚類分析中的應(yīng)用流程圖
具體實施方式
為了解決關(guān)鍵詞優(yōu)化實現(xiàn)搜索引擎優(yōu)化的技術(shù)問題,結(jié)合圖1-圖2對本發(fā)明進行了詳細(xì)說明,其具體實施步驟如下:
步驟1:根據(jù)企業(yè)業(yè)務(wù)確定核心關(guān)鍵詞,利用搜索引擎搜集相關(guān)關(guān)鍵字,這些關(guān)鍵字在搜索引擎中有相應(yīng)數(shù)據(jù)項,如本國每月搜索量、競爭程度和估算每次點擊費用(CPC)等。
步驟2:結(jié)合企業(yè)產(chǎn)品和市場分析,篩選降維上述搜索到的相關(guān)關(guān)鍵字集合;
步驟3:針對篩選降維后的關(guān)鍵詞集合,通過搜索引擎搜索關(guān)鍵詞對應(yīng)的頁面,這里記錄首頁網(wǎng)頁數(shù)和總搜索頁面數(shù),即每個關(guān)鍵詞由五維向量再降維為四維的,其具體計算過程如下:
這里相關(guān)關(guān)鍵詞個數(shù)為m,既有下列m×5矩陣:
Ni、Ldi、CPCi、NiS、NiY依次為第i個關(guān)鍵詞對應(yīng)的本國每月搜索量、競爭程度、估算每次點擊費用(CPC)、首頁網(wǎng)頁數(shù)、總搜索頁面數(shù)。
再降維為四維,即
Xi∈(1,2,…,m)為搜索效能,Zi∈(1,2,…,m)為價值率,即為下式:
步驟4:改進的基于約束條件的聚類算法,對上述關(guān)鍵詞進行聚類處理,其具體子步驟如下:
步驟4.1:利用基于ε領(lǐng)域的k-means算法初始化為c類。
步驟4.2:用值[0,1]間的隨機數(shù)初始化隸屬矩陣J,使其滿足隸屬的整個約束條件,其具體計算過程如下:
根據(jù)ε領(lǐng)域初始化數(shù)據(jù)對象集合D劃分為C類;
初始化隸屬矩陣J為m×C:
wij為關(guān)鍵詞i屬于j類的程度系數(shù),即j∈(1,2,…,C)、i∈(1,2,…,m)。
隸屬的整個約束條件為:
步驟4.3:初始化每一個領(lǐng)域目標(biāo)函數(shù)構(gòu)建c類總目標(biāo)函數(shù),綜合隸屬約束條件,構(gòu)建m個方程組,對其進行求解,即可得聚類結(jié)果,其具體計算過程如下:
上式nεj為j類ε領(lǐng)域內(nèi)數(shù)據(jù)對象的個數(shù),為j類ε領(lǐng)域內(nèi)總的緊湊度,α、β分別為數(shù)量nεj、緊湊度的影響系數(shù),且α+β=1,其值可以根據(jù)實驗迭代出合適的值。
構(gòu)建c類總目標(biāo)函數(shù)
a為一個處理常數(shù),a>1;
上式
為空間中的第i個關(guān)鍵詞向量與其簇中心向量的內(nèi)積。
綜合隸屬約束條件,構(gòu)建m個方程組:
λi(i=1,…,m)是m個約束式的拉格朗日算子,對上述式子進行求導(dǎo),對所有輸入?yún)⒘壳髮?dǎo),即可求得使達到最大的必要條件ci、wij:
上式為關(guān)鍵詞i所對應(yīng)的向量;
步驟4.4:利用下式判定函數(shù)Δ(g)的結(jié)果,重新計算各簇中心,其具體計算過程如下:
為新的總目標(biāo)函數(shù),為上一次迭代得出的總目標(biāo)函數(shù),θ為一個足夠小的數(shù),只有滿足上述條件,則找到了最佳分類。
步驟4.5:如果簇中心發(fā)生變化,則轉(zhuǎn)到步驟4.2,重新計算隸屬矩陣J,否則迭代結(jié)束,輸出聚類結(jié)果。
改進的基于約束條件的聚類算法的具體結(jié)構(gòu)流程如圖2。
步驟5:根據(jù)企業(yè)具體情況,綜合關(guān)鍵詞效能優(yōu)化和價值率優(yōu)化,選擇合適的關(guān)鍵詞優(yōu)化策略達到網(wǎng)站優(yōu)化目標(biāo)。
改進的基于約束條件的聚類算法實現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化,其偽代碼過程
輸入:網(wǎng)站提取的核心關(guān)鍵詞,基于ε領(lǐng)域初始化為c簇。
輸出:總目標(biāo)函數(shù)最大的c個簇。