本發(fā)明涉及語義網(wǎng)絡技術領域,具體涉及基于約束條件的聚類算法實現(xiàn)搜索引擎關鍵詞優(yōu)化。
背景技術:
搜索引擎已成為廣大網(wǎng)民獲取信息的一個重要工具。搜索引擎優(yōu)化(Search Engine Optimization,簡稱SEO)是指采用相關技術對網(wǎng)站進行一系列優(yōu)化,從而提高相應關鍵詞在搜索引擎上的排名,最終達到網(wǎng)站營銷的目的。其實,搜索引擎優(yōu)化就是開展網(wǎng)絡營銷的一種形式,讓企業(yè)在利用主要的搜索引擎優(yōu)化策略,對網(wǎng)頁中的關鍵詞、內(nèi)容以及鏈接等各種因素策略進行相關的優(yōu)化,使得應用策略之后的企業(yè)網(wǎng)站能被各大主流搜索引擎優(yōu)先抓取并收錄,在索引目標頁面中排名靠前、吸引點擊率,從而可達到提高企業(yè)形象、推廣網(wǎng)站的目的。就目前所有網(wǎng)絡營銷的形式中,搜索引擎優(yōu)化無疑是能在短時間內(nèi)擴大影響、提升企業(yè)網(wǎng)站形象的最好途徑。SEO歸根結(jié)底是關鍵詞的優(yōu)化。關鍵詞是用戶在搜索相關頁面時使用的單詞或短語,也是搜索引擎在建立索引表使用的單詞。利用關鍵詞有助于獲得較高的搜索引擎查詢排名,要注意關鍵詞研究旨在找出最有價值的關鍵詞。目前國內(nèi)外對關鍵詞優(yōu)化的理論研究和技術應用比較多,但暫未提出一個有效的方法來簡化關鍵詞分析流程,也沒有一個完善的機制來管理關鍵詞優(yōu)化策略和進度。基于上述需求,本發(fā)明提供了基于約束條件的聚類算法實現(xiàn)搜索引擎關鍵詞優(yōu)化。
技術實現(xiàn)要素:
針對于關鍵詞優(yōu)化實現(xiàn)搜索引擎優(yōu)化的技術問題,本發(fā)明提供了基于約束條件實現(xiàn)搜索引擎關鍵詞優(yōu)化。
為了解決上述問題,本發(fā)明是通過以下技術方案實現(xiàn)的:
步驟1:根據(jù)企業(yè)業(yè)務確定核心關鍵詞,利用搜索引擎搜集相關關鍵字,這些關鍵字在搜索引擎中有相應數(shù)據(jù)項,如本國每月搜索量、競爭程度和估算每次點擊費用(CPC)等
步驟2:結(jié)合企業(yè)產(chǎn)品和市場分析,篩選降維上述搜索到的相關關鍵字集合;
步驟3:針對篩選降維后的關鍵詞集合,通過搜索引擎搜索關鍵詞對應的頁面,這里記錄首頁網(wǎng)頁數(shù)和總搜索頁面數(shù),即每個關鍵詞由五維向量再降維為四維的。
步驟4:基于約束條件的聚類算法,對上述關鍵詞進行聚類處理,其具體子步驟如下:
步驟4.1:利用基于ε領域的k-means算法初始化簇;
步驟4.2:初始化每一個ε領域的信息量函數(shù)從數(shù)據(jù)對象集合D中按下述判定條件選擇k個初始簇中心;
步驟4.3:對每類關鍵詞i(i∈(1,2,…,m))進行重新分配,按概率函數(shù)p(i)選擇聚類中心j′;
步驟4.4:根據(jù)判定函數(shù)Δ(I)的結(jié)果,重新計算各簇中心;
步驟4.5:如果簇中心發(fā)生變化,則轉(zhuǎn)到步驟4.2,否則迭代結(jié)束,輸出聚類結(jié)果。
步驟5:根據(jù)企業(yè)具體情況,綜合關鍵詞效能優(yōu)化和價值率優(yōu)化,選擇合適的關鍵詞優(yōu)化策略達到網(wǎng)站優(yōu)化目標。
本發(fā)明有益效果是:
1,此算法可以精簡關鍵詞分析流程,進而減少整個網(wǎng)站優(yōu)化工作量。
2,此算法的運行時間復雜度低,處理速度更快。
3、此算法具有更大的利用價值。
4、能幫助網(wǎng)站在短時間內(nèi)快速提升其關鍵詞的排名。
5、為企業(yè)網(wǎng)站帶來一定的流量和詢盤,從而達到理想的網(wǎng)站優(yōu)化目標。
6、此算法局部從相關度來區(qū)分每個類,分類結(jié)果的準確度更符合經(jīng)驗值。
7,全局考慮了每個的領域的占比,這樣可以降低孤立點對聚類結(jié)果的影響。
8、數(shù)據(jù)處理的效果更好。
附圖說明
圖1基于約束條件的聚類算法實現(xiàn)搜索引擎關鍵詞優(yōu)化結(jié)構流程圖
圖2基于約束條件的聚類算法在聚類分析中的應用流程圖
具體實施方式
為了解決關鍵詞優(yōu)化實現(xiàn)搜索引擎優(yōu)化的技術問題,結(jié)合圖1-圖2對本發(fā)明進行了詳細說明,其具體實施步驟如下:
步驟1:根據(jù)企業(yè)業(yè)務確定核心關鍵詞,利用搜索引擎搜集相關關鍵字,這些關鍵字在搜索引擎中有相應數(shù)據(jù)項,如本國每月搜索量、競爭程度和估算每次點擊費用(CPC)等。
步驟2:結(jié)合企業(yè)產(chǎn)品和市場分析,篩選降維上述搜索到的相關關鍵字集合;
步驟3:針對篩選降維后的關鍵詞集合,通過搜索引擎搜索關鍵詞對應的頁面,這里記錄首頁網(wǎng)頁數(shù)和總搜索頁面數(shù),即每個關鍵詞由五維向量再降維為四維的,其具體計算過程如下:
這里相關關鍵詞個數(shù)為m,既有下列m×5矩陣:
Ni、Ldi、CPCi、NiS、NiY依次為第i個關鍵詞對應的本國每月搜索量、競爭程度、估算每次點擊費用(CPC)、首頁網(wǎng)頁數(shù)、總搜索頁面數(shù)。
再降維為四維,即
Xi∈(1,2,…,m)為搜索效能,Zi∈(1,2,…,m)為價值率,即為下式:
步驟4:基于約束條件的聚類算法,對上述關鍵詞進行聚類處理,其具體子步驟如下:
步驟4.1:利用基于ε領域的k-means算法初始化為c簇。
步驟4.2:用值[0,1]間的數(shù)初始化隸屬矩陣J,使其滿足隸屬的整個約束條件,其具體計算過程如下:
上式為空間中的第i個關鍵詞向量與簇中心向量的內(nèi)積,μij為關鍵詞i隸屬于類j的程度系數(shù),其滿足下列隸屬約束條件:
初始化隸屬矩陣J為m×c:
步驟4.3:初始化每一個領域目標函數(shù)構建c類總目標函數(shù),綜合隸屬約束條件,構建m個方程組,對其進行求解,即可得聚類結(jié)果,其具體計算過程如下:
上式nεj為j類ε領域內(nèi)數(shù)據(jù)對象的個數(shù)。
c類總目標函數(shù)為
綜合隸屬約束條件,構建m個方程組:
這里λi(i∈(1,2,…,m))是m個約束式的拉格朗日乘子。對所有輸入?yún)⒘壳髮?,即可求得使達到最大的必要條件cj、μij;
上式xi為關鍵詞i所對應的向量;
步驟4.4:利用下式判定函數(shù)Δ(I)的結(jié)果,重新計算各簇中心,其具體計算過程如下:
判定函數(shù)Δ(I):
上式為新的總目標函數(shù),為上一次迭代得出的總目標函數(shù)。θ為一個足夠小的數(shù),只有滿足上述條件,則找到了最佳分類,否則沒有找到。
基于約束條件的聚類算法的具體結(jié)構流程如圖2。
步驟5:根據(jù)企業(yè)具體情況,綜合關鍵詞效能優(yōu)化和價值率優(yōu)化,選擇合適的關鍵詞優(yōu)化策略達到網(wǎng)站優(yōu)化目標。
基于約束條件的聚類算法實現(xiàn)搜索引擎關鍵詞優(yōu)化,其偽代碼過程
輸入:網(wǎng)站提取的核心關鍵詞,基于ε領域初始化為c類
輸出:全局總目標函數(shù)的總和最大的c個簇。