本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別涉及一種cdn節(jié)點的探測方法和裝置。
背景技術(shù):
cdn(contentdeliverynetwork,內(nèi)容分發(fā)網(wǎng)絡(luò)),是通過在網(wǎng)絡(luò)各處放置節(jié)點服務(wù)器所構(gòu)成的在現(xiàn)有的互聯(lián)網(wǎng)基礎(chǔ)之上的一層智能虛擬網(wǎng)絡(luò),cdn能夠?qū)崟r地根據(jù)網(wǎng)絡(luò)流量和各節(jié)點的連接、負載狀況以及到用戶的距離和響應(yīng)時間等綜合信息將用戶的請求重新導(dǎo)向離用戶最近的服務(wù)節(jié)點上。
因可以快速提升用戶訪問和下載速度、提高用戶體驗,cdn業(yè)務(wù)被市場大范圍使用,但也逐漸暴露出一些問題,尤其是網(wǎng)絡(luò)信息安全隱患顯現(xiàn),比如詐騙、釣魚網(wǎng)站等不良網(wǎng)站通過cdn業(yè)務(wù),利用互聯(lián)網(wǎng)傳播不良信息、詐騙等非法信息;另外,新行業(yè)分類目錄發(fā)布將cdn作為獨立的業(yè)務(wù)發(fā)展與管理,但仍存在無證經(jīng)營企業(yè),即企業(yè)未取得cdn業(yè)務(wù)的電信業(yè)務(wù)經(jīng)營許可證,擅自開展cdn業(yè)務(wù)。因此,為凈化網(wǎng)絡(luò)環(huán)境、強化網(wǎng)絡(luò)信息安全管理,有必要對cdn節(jié)點進行探測,以需要掌握到cdn業(yè)務(wù)的使用情況。
現(xiàn)有技術(shù)中,一般是通過投入大量的設(shè)備和資源對被訪問網(wǎng)站的所有cdn帶寬進行采樣分析,來探測cdn節(jié)點。因此,現(xiàn)有技術(shù)中,由于在cdn節(jié)點的探測過程中,需要投入了大量的設(shè)備和資源,存在cdn節(jié)點探測時使用資源較高,以及探測效率較低的問題。
技術(shù)實現(xiàn)要素:
為了節(jié)省對cdn節(jié)點探測時使用的資源,以及提高cdn節(jié)點的探測效率,本發(fā)明實施例提供了一種cdn節(jié)點的探測方法和裝置。所述技術(shù)方案如下:
第一方面,提供了一種cdn節(jié)點的探測方法,所述方法包括:
根據(jù)多個域名服務(wù)器分別針對域名解析請求返回的域名解析結(jié)果,獲取被訪問網(wǎng)站的特征信息,所述域名解析請求中攜帶有所述被訪問網(wǎng)站的域名信息;
根據(jù)所述被訪問網(wǎng)站的特征信息,確定所述被訪問網(wǎng)站的cdn節(jié)點疑似度;
根據(jù)所述cdn節(jié)點疑似度,判斷所述被訪問網(wǎng)站是否存在cdn節(jié)點。
結(jié)合第一方面,在第一種可能的實現(xiàn)方式中,所述特征信息至少包括與所述域名信息對應(yīng)的cname、ip地址和所述ip地址的分布區(qū)域,所述根據(jù)所述特征信息,確定所述被訪問網(wǎng)站的cdn節(jié)點疑似度包括:
根據(jù)所述域名信息對應(yīng)的cname,確定第一特征值;
根據(jù)所述域名信息對應(yīng)的ip地址,確定第二特征值;
根據(jù)所述ip地址的分布區(qū)域,確定第三特征值;
根據(jù)所述第一特征值、所述第二特征值和所述第三特征值,確定所述被訪問網(wǎng)站的cdn節(jié)點疑似度;
其中,所述第一特征值、所述第二特征值和所述第三特征值均用于量化所述被訪問網(wǎng)站的cdn節(jié)點疑似度。
結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第二種可能的實現(xiàn)方式中,
所述根據(jù)所述域名信息對應(yīng)的cname,確定第一特征值包括:
判斷所述域名信息對應(yīng)的cname是否包含預(yù)設(shè)關(guān)鍵詞;
若所述域名信息對應(yīng)的cname包含所述預(yù)設(shè)關(guān)鍵詞,則根據(jù)預(yù)設(shè)評分標準,確定所述第一特征值;
所述根據(jù)所述域名信息對應(yīng)的ip地址,確定第二特征值包括:
獲取所述域名信息對應(yīng)的所有ip地址,并去重統(tǒng)計所述ip地址的數(shù)目;
根據(jù)所述預(yù)設(shè)評分標準和所述ip地址的數(shù)目,確定所述第二特征值;
所述根據(jù)所述ip地址的分布區(qū)域,確定第三特征值包括:
去重統(tǒng)計所述ip地址的分布區(qū)域的數(shù)目;
根據(jù)所述預(yù)設(shè)評分標準和所述ip地址的分布區(qū)域的數(shù)目,確定所述第三特征值。
結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第三種可能的實現(xiàn)方式中,所述根據(jù)所述第一特征值、所述第二特征值和所述第三特征值,確定所述被訪問網(wǎng)站的cdn節(jié)點疑似度包括:
獲取所述第一特征值、所述第二特征值和所述第三特征值分別對應(yīng)的權(quán)重系數(shù);
根據(jù)所述第一特征值、所述第二特征值和所述第三特征值與分別對應(yīng)的權(quán)重系數(shù)乘積的累加值,確定所述cdn節(jié)點疑似度。
結(jié)合第一方面或第一方面的第一種可能的實現(xiàn)方式,在第四種可能的實現(xiàn)方式中,所述根據(jù)所述cdn節(jié)點疑似度,判斷所述被訪問網(wǎng)站是否存在cdn節(jié)點包括:
判斷所述cdn節(jié)點疑似度是否超過預(yù)設(shè)閾值,若是,則判定所述被訪問網(wǎng)站存在cdn節(jié)點。
結(jié)合第一方面,在第五種可能的實現(xiàn)方式中,所述方法還包括:
模擬客戶端的域名解析請求,并將所述域名解析請求發(fā)送至所述多個域名服務(wù)器;
接收所述多個域名服務(wù)器分別針對所述域名解析請求返回的域名解析結(jié)果。
第二方面,提供了一種cdn節(jié)點的探測裝置,所述裝置包括:
獲取模塊,用于根據(jù)多個域名服務(wù)器分別針對域名解析請求返回的域名解析結(jié)果,獲取被訪問網(wǎng)站的特征信息,所述域名解析請求中攜帶有所述被訪問網(wǎng)站的域名信息;
確定模塊,用于根據(jù)所述被訪問網(wǎng)站的特征信息,確定所述被訪問網(wǎng)站的cdn節(jié)點疑似度;
判斷模塊,用于根據(jù)所述cdn節(jié)點疑似度,判斷所述被訪問網(wǎng)站是否存在cdn節(jié)點。
結(jié)合第二方面,在第一種可能的實現(xiàn)方式中,所述特征信息至少包括與所述域名信息對應(yīng)的cname、ip地址和所述ip地址的分布區(qū)域,所述確定模塊包括:
第一確定子模塊,用于根據(jù)所述域名信息對應(yīng)的cname,確定第一特征值;
第二確定子模塊,用于根據(jù)所述域名信息對應(yīng)的ip地址,確定第二特征值;
第三確定子模塊,用于根據(jù)所述ip地址的分布區(qū)域,確定第三特征值;
第四確定子模塊,用于根據(jù)所述第一特征值、所述第二特征值和所述第三特征值,確定所述被訪問網(wǎng)站的cdn節(jié)點疑似度;
其中,所述第一特征值、所述第二特征值和所述第三特征值均用于量化所述被訪問網(wǎng)站的cdn節(jié)點疑似度。
結(jié)合第二方面的第一種可能的實現(xiàn)方式,在第二種可能的實現(xiàn)方式中,
所述第一確定子模塊具體用于:
判斷所述域名信息對應(yīng)的cname是否包含預(yù)設(shè)關(guān)鍵詞;
若所述域名信息對應(yīng)的cname包含所述預(yù)設(shè)關(guān)鍵詞,則根據(jù)預(yù)設(shè)評分標準,確定所述第一特征值;
所述第二確定子模塊具體用于:
獲取所述域名信息對應(yīng)的所有ip地址,并去重統(tǒng)計所述ip地址的數(shù)目;
根據(jù)所述預(yù)設(shè)評分標準和所述ip地址的數(shù)目,確定所述第二特征值;
所述第三確定子模塊具體用于:
去重統(tǒng)計所述ip地址的分布區(qū)域的數(shù)目;
根據(jù)所述預(yù)設(shè)評分標準和所述ip地址的分布區(qū)域的數(shù)目,確定所述第三特征值。
結(jié)合第二方面的第一種可能的實現(xiàn)方式,在第三種可能的實現(xiàn)方式中,所述第四確定子模塊具體用于:
獲取所述第一特征值、所述第二特征值和所述第三特征值分別對應(yīng)的權(quán)重系數(shù);
根據(jù)所述第一特征值、所述第二特征值和所述第三特征值與分別對應(yīng)的權(quán)重系數(shù)乘積的累加值,確定所述cdn節(jié)點疑似度。
結(jié)合第二方面或第二方面的第一種可能的實現(xiàn)方式,在第四種可能的實現(xiàn)方式中,所述判斷模塊具體用于:
判斷所述cdn節(jié)點疑似度是否超過預(yù)設(shè)閾值,若是,則判定所述被訪問網(wǎng)站存在cdn節(jié)點。
結(jié)合第二方面,在第五種可能的實現(xiàn)方式中,所述裝置還包括:
模擬模塊,用于模擬客戶端的域名解析請求;
發(fā)送模塊,用于將所述域名解析請求發(fā)送至所述多個域名服務(wù)器;
接收模塊,用于接收所述多個域名服務(wù)器分別針對所述域名解析請求返回的域名解析結(jié)果。
本發(fā)明實施例提供了一種cdn節(jié)點的探測方法和裝置,由于通過根據(jù)多個域名服務(wù)器分別針對域名解析請求返回的域名解析結(jié)果,獲取被訪問網(wǎng)站的特征信息,因此能夠根據(jù)多個域名服務(wù)器返回的域名解析結(jié)果獲取到對被訪問網(wǎng)站進行分析的大量分析數(shù)據(jù),由此提高了探測被訪問網(wǎng)站是否存在cdn節(jié)點的準確性;另外,由于通過根據(jù)所述被訪問網(wǎng)站的特征信息,確定所述被訪問網(wǎng)站的cdn節(jié)點疑似度,并根據(jù)所述cdn節(jié)點疑似度,判斷所述被訪問網(wǎng)站是否存在cdn節(jié)點,因此相比較現(xiàn)有技術(shù),本發(fā)明的方案能夠避免在cdn節(jié)點探測過程中投入大量的設(shè)備和資源對被訪問網(wǎng)站的所有cdn帶寬進行采樣分析,因此不但節(jié)省了cdn節(jié)點探測時使用的資源,同時也提高了cdn節(jié)點的探測效率。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實施例提供的一種cdn節(jié)點的探測方法流程圖;
圖2是本發(fā)明實施例提供的一種cdn節(jié)點的探測方法流程圖;
圖3是本發(fā)明實施例提供的一種cdn節(jié)點的探測裝置結(jié)構(gòu)示意圖。
具體實施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
實施例一
本發(fā)明實施例提供了一種cdn節(jié)點的探測方法,參照圖1所示,該方法包括:
101、模擬客戶端的域名解析請求,并將域名解析請求發(fā)送至多個域名服務(wù)器。
102、接收多個域名服務(wù)器分別針對域名解析請求返回的域名解析結(jié)果。
103、根據(jù)多個域名服務(wù)器分別針對域名解析請求返回的域名解析結(jié)果,獲取被訪問網(wǎng)站的特征信息,域名解析請求中攜帶有被訪問網(wǎng)站的域名信息。
104、根據(jù)被訪問網(wǎng)站的特征信息,確定被訪問網(wǎng)站的cdn節(jié)點疑似度。
具體的,特征信息至少包括與域名信息對應(yīng)的cname、ip地址和ip地址的分布區(qū)域;
根據(jù)特征信息,確定被訪問網(wǎng)站的cdn節(jié)點疑似度,該過程可以包括:
根據(jù)域名信息對應(yīng)的cname,確定第一特征值;
根據(jù)域名信息對應(yīng)的ip地址,確定第二特征值;
根據(jù)ip地址的分布區(qū)域,確定第三特征值;
根據(jù)第一特征值、第二特征值和第三特征值,確定被訪問網(wǎng)站的cdn節(jié)點疑似度;
其中,第一特征值、第二特征值和第三特征值均用于量化被訪問網(wǎng)站的cdn節(jié)點疑似度。
其中,根據(jù)域名信息對應(yīng)的cname,確定第一特征值,該過程可以包括:
判斷域名信息對應(yīng)的cname是否包含預(yù)設(shè)關(guān)鍵詞;
若域名信息對應(yīng)的cname包含預(yù)設(shè)關(guān)鍵詞,則根據(jù)預(yù)設(shè)評分標準,確定第一特征值。
其中,根據(jù)域名信息對應(yīng)的ip地址,確定第二特征值,該過程可以包括:
獲取域名信息對應(yīng)的所有ip地址,并去重統(tǒng)計ip地址的數(shù)目;
根據(jù)預(yù)設(shè)評分標準和ip地址的數(shù)目,確定第二特征值。
其中,根據(jù)ip地址的分布區(qū)域,確定第三特征值,該過程可以包括:
去重統(tǒng)計ip地址的分布區(qū)域的數(shù)目;
根據(jù)預(yù)設(shè)評分標準和ip地址的分布區(qū)域的數(shù)目,確定第三特征值。
其中,根據(jù)第一特征值、第二特征值和第三特征值,確定被訪問網(wǎng)站的cdn節(jié)點疑似度,該過程可以包括:
獲取第一特征值、第二特征值和第三特征值分別對應(yīng)的權(quán)重系數(shù);
根據(jù)第一特征值、第二特征值和第三特征值與分別對應(yīng)的權(quán)重系數(shù)乘積的累加值,確定cdn節(jié)點疑似度。
105、根據(jù)cdn節(jié)點疑似度,判斷被訪問網(wǎng)站是否存在cdn節(jié)點。
具體的,判斷cdn節(jié)點疑似度是否超過預(yù)設(shè)閾值,若是,則判定被訪問網(wǎng)站存在cdn節(jié)點。
本發(fā)明實施例提供了一種cdn節(jié)點的探測方法,由于通過根據(jù)多個域名服務(wù)器分別針對域名解析請求返回的域名解析結(jié)果,獲取被訪問網(wǎng)站的特征信息,因此能夠根據(jù)多個域名服務(wù)器返回的域名解析結(jié)果獲取到對被訪問網(wǎng)站進行分析的大量分析數(shù)據(jù),由此提高了探測被訪問網(wǎng)站是否存在cdn節(jié)點的準確性;另外,由于通過根據(jù)被訪問網(wǎng)站的特征信息,確定被訪問網(wǎng)站的cdn節(jié)點疑似度,并根據(jù)cdn節(jié)點疑似度,判斷被訪問網(wǎng)站是否存在cdn節(jié)點,因此相比較現(xiàn)有技術(shù),本發(fā)明的方案能夠避免在cdn節(jié)點探測過程中投入大量的設(shè)備和資源對被訪問網(wǎng)站的所有cdn帶寬進行采樣分析,由此不但節(jié)省了cdn節(jié)點探測時使用的資源,同時也提高了cdn節(jié)點的探測效率。
實施例二
本發(fā)明實施例提供了一種cdn節(jié)點的探測方法,參照圖2所示,方法包括:
201、模擬客戶端的域名解析請求,并將域名解析請求發(fā)送至多個域名服務(wù)器,域名解析請求中攜帶有被訪問網(wǎng)站的域名信息。
客戶端上安裝有網(wǎng)頁瀏覽器,客戶端可以是臺式計算機、筆記本計算機、膝上型計算機、手機、個人數(shù)字助理等。
域名服務(wù)器,又稱dns服務(wù)器(domainnameserver),用于域名和與域名相對應(yīng)的ip地址轉(zhuǎn)換的服務(wù)器。
多個域名服務(wù)器包括基礎(chǔ)運營商的域名服務(wù)器和企業(yè)的域名服務(wù)器,其中基礎(chǔ)運營商的域名服務(wù)器,比如聯(lián)通dns服務(wù)器、電信dns服務(wù)器等。
多個域名服務(wù)器分布在多個不同區(qū)域,多個不同區(qū)域包括境外的多個國家或地區(qū)以及中國境內(nèi)的多個省份或地區(qū)。
具體的,該過程可以包括:
通過程序模擬客戶端針對被訪問網(wǎng)站的域名發(fā)起域名解析請求;
根據(jù)多個域名服務(wù)器的ip地址,將域名解析請求多線程并發(fā)發(fā)送至多個域名服務(wù)器;
該多個域名服務(wù)器的ip地址與多個域名服務(wù)器名稱之間的對應(yīng)關(guān)系預(yù)先存儲在域名服務(wù)器列表中。
除此以外,模擬客戶端的域名解析請求還可以作為一觸發(fā)事件,并在滿足一定觸發(fā)條件時而觸發(fā)。
202、接收多個域名服務(wù)器分別針對域名解析請求返回的域名解析結(jié)果。
具體的,判斷是否接收到多個域名服務(wù)器中的每個域名服務(wù)器返回的域名解析結(jié)果,若是,則執(zhí)行步驟203;否則,結(jié)束或者返回步驟201。
本發(fā)明對具體的接收過程不加以限定。
可選的,在實際應(yīng)用中,若在預(yù)設(shè)時間內(nèi)未接收到多個域名服務(wù)器中的某個域名服務(wù)器返回的域名解析結(jié)果,則可以重新模擬客戶端的域名解析請求,并將域名解析請求發(fā)送至未返回域名解析結(jié)果的該域名服務(wù)器,直至接收到該域名服務(wù)器返回的域名解析結(jié)果。
本發(fā)明實施例中,通過模擬客戶端的域名解析請求,實現(xiàn)了對被訪問網(wǎng)站是否存在cdn節(jié)點的主動探測;另外,由于是將域名解析請求發(fā)送至多個域名服務(wù)器,并接收多個域名服務(wù)器分別針對域名解析請求返回的域名解析結(jié)果,因此根據(jù)多個域名服務(wù)器返回的域名解析結(jié)果能夠獲取到對被訪問網(wǎng)站進行分析的大量分析數(shù)據(jù),由此提高了探測被訪問網(wǎng)站是否存在cdn節(jié)點的準確性。
203、根據(jù)多個域名服務(wù)器分別針對域名解析請求返回的域名解析結(jié)果,獲取被訪問網(wǎng)站的特征信息。
其中,特征信息至少包括與域名信息對應(yīng)的cname、ip地址和ip地址的分布區(qū)域。
cname為別名記錄,即允許將多個名字映射到同一個域名。如“www.example.com”的別名為“www.example.com.cloudglb.net”。
ip地址包括ipv4地址和ipv6地址中的至少一個。
具體的,該過程可以包括:
a、接收多個域名服務(wù)器分別針對域名解析請求返回的域名解析結(jié)果,該域名解析結(jié)果為標準網(wǎng)絡(luò)協(xié)議報文。
其中,多個域名服務(wù)器分別針對域名解析請求返回域名解析結(jié)果,該過程可以包括:
多個域名服務(wù)器中的每個域名服務(wù)器通過查詢其各自的解析日志記錄,判斷各自的解析日志記錄中是否存在與域名解析請求中的域名信息相對應(yīng)的域名解析結(jié)果,若存在,則返回與域名解析請求中域名信息相對應(yīng)的域名解析結(jié)果。否則,對域名解析請求解析不成功的域名服務(wù)器將域名解析請求轉(zhuǎn)發(fā)至上一級域名服務(wù)器,由上一級域名服務(wù)器進行解析,如果上一級域名服務(wù)器不能解析,或?qū)⒃撚蛎馕稣埱蟀l(fā)至根域名服務(wù)器,或?qū)⒃撚蛎馕稣埱筠D(zhuǎn)至上上級域名服務(wù)器,以此循環(huán),以獲取到最終的域名解析結(jié)果并返回。
b、對多個域名服務(wù)器域名解析結(jié)果進行匯總分類形成域名信息、cname與ip地址的多對多的對應(yīng)關(guān)系,以獲取被訪問網(wǎng)站的特征信息。
其中,特征信息至少包括與域名信息對應(yīng)的cname、ip地址和ip地址的分布區(qū)域。
除此以外,被訪問網(wǎng)站的特征信息還可以包括其他的能夠用于探測被訪問網(wǎng)站是否存在cdn節(jié)點的信息,本發(fā)明實施例對此不加以限定。
本發(fā)明實施例中,通過根據(jù)多個域名服務(wù)器分別針對域名解析請求返回的域名解析結(jié)果,獲取被訪問網(wǎng)站的特征信息,因此根據(jù)多個域名服務(wù)器返回的域名解析結(jié)果能夠獲取到對被訪問網(wǎng)站進行分析的大量分析數(shù)據(jù),由此提高了探測被訪問網(wǎng)站是否存在cdn節(jié)點的準確性;而同時,獲取到的被訪問網(wǎng)站的特征信息至少包括與域名信息對應(yīng)的cname、ip地址和ip地址的分布區(qū)域,由此通過被訪問網(wǎng)站的特征信息來確定被訪問網(wǎng)站是否存在cdn節(jié)點,進一步提高了cdn節(jié)點探測的準確性。
204、根據(jù)域名信息對應(yīng)的cname,確定第一特征值。
其中,第一特征值用于量化被訪問網(wǎng)站的cdn節(jié)點疑似度。
具體的,該過程可以包括:
判斷域名信息對應(yīng)的cname是否包含預(yù)設(shè)關(guān)鍵詞;
若域名信息對應(yīng)的cname包含預(yù)設(shè)關(guān)鍵詞,則根據(jù)預(yù)設(shè)評分標準,確定第一特征值。
其中,預(yù)設(shè)關(guān)鍵詞可以是一個關(guān)鍵詞或由多個關(guān)鍵詞結(jié)合得到的預(yù)設(shè)關(guān)鍵詞,比如,可以是關(guān)鍵詞“cdn”、“cloud”、“cache”或“dns”,也可以由關(guān)鍵詞“cdn”、“cloud”、“cache”和“dns”中的多個關(guān)鍵詞結(jié)合得到,示例性的,將關(guān)鍵詞“cdn”和“cloud”相結(jié)合得到“cloudcdn”作為預(yù)設(shè)關(guān)鍵詞,本發(fā)明實施例對具體的預(yù)設(shè)關(guān)鍵詞不加以限定。
其中,預(yù)設(shè)評分標準中設(shè)定域名信息對應(yīng)的cname包含預(yù)設(shè)關(guān)鍵詞時的第一特征值。
根據(jù)預(yù)設(shè)評分標準,確定第一特征值,該第一特征值可以是介于0到99之間的任一值,比如,預(yù)設(shè)評分標準中設(shè)定域名信息對應(yīng)的cname包含預(yù)設(shè)關(guān)鍵詞時的第一特征值為t,若預(yù)設(shè)關(guān)鍵詞為“cloudcdn”,域名信息對應(yīng)的cname為www.example.com.cloudcdn.net”,判定cname中包含預(yù)設(shè)關(guān)鍵詞,那么根據(jù)預(yù)設(shè)評分標準,確定第一特征值為t。
本發(fā)明實施例中,由于cname能夠指向一個cdn服務(wù)器集群,因此通過cname確定第一特征值,能夠保證cdn節(jié)點的探測準確性。
205、根據(jù)域名信息對應(yīng)的ip地址,確定第二特征值。
其中,第二特征值用于量化被訪問網(wǎng)站的cdn節(jié)點疑似度。
具體的,該過程可以包括:
獲取域名信息對應(yīng)的所有ip地址,并去重統(tǒng)計ip地址的數(shù)目;
根據(jù)預(yù)設(shè)評分標準和ip地址的數(shù)目,確定第二特征值。
其中,預(yù)設(shè)評分標準中設(shè)定ip地址不同的數(shù)目對應(yīng)不同的第二特征值,ip地址的數(shù)目越大,其所對應(yīng)的第二特征值越高,該第二特征值可以是介于0到99之間的任一值。預(yù)設(shè)評分標準可以設(shè)定如下:ip地址的數(shù)目低于a時,所對應(yīng)的第二特征值為a;ip地址的數(shù)目在a與b之間時,所對應(yīng)的第二特征值為b;ip地址的數(shù)目在b與c之間時,所對應(yīng)的第二特征值為c;ip地址的數(shù)目超過c時,所對應(yīng)的第二特征值為d,其中,a<b<c,a<b<c<d。
本發(fā)明實施例中,因為cdn是分布式的,分布式必然存在至少一個ip地址,因此通過域名信息對應(yīng)的ip地址來確定第二特征值,能夠保證cdn節(jié)點的探測準確性。
206、根據(jù)ip地址的分布區(qū)域,確定第三特征值。
其中,第三特征值用于量化被訪問網(wǎng)站的cdn節(jié)點疑似度。
具體,該過程可以包括:
去重統(tǒng)計ip地址的分布區(qū)域的數(shù)目;
根據(jù)預(yù)設(shè)評分標準和ip地址的分布區(qū)域的數(shù)目,確定第三特征值。
其中,預(yù)設(shè)評分標準中設(shè)定ip地址的分布區(qū)域不同的數(shù)目對應(yīng)不同的第三特征值,ip地址的分布區(qū)域的數(shù)目越大,其所對應(yīng)的第三特征值越高,該第三特征值可以是介于0到99之間的任一值。預(yù)設(shè)評分標準可以設(shè)定如下:ip地址的分布區(qū)域的數(shù)目低于m時,所對應(yīng)的第三特征值為m;ip地址的數(shù)目在m與n之間時,所對應(yīng)的第三特征值為n;ip地址的數(shù)目超過p時,所對應(yīng)的第三特征值為p,其中,m<n<p,m<n<p。
需要說明的是,本發(fā)明對步驟204、步驟205與步驟206的執(zhí)行先后順序不作具體限定,在實際應(yīng)用中,同時執(zhí)行步驟204、步驟205與步驟206,為優(yōu)選方案,以進一步提高cdn節(jié)點的探測效率。
值得注意的是,步驟204至步驟206是實現(xiàn)根據(jù)特征信息,確定被訪問網(wǎng)站的cdn節(jié)點疑似度的過程,除了上述步驟的方式之外,還可以通過其他方式實現(xiàn)該過程,本發(fā)明實施例對具體的方式不加以限定。
本發(fā)明實施例中,因為對于同一個被訪問網(wǎng)站而言,若獲取到分布在多個不同區(qū)域的ip地址,表明該被訪問網(wǎng)站使用了cdn,因此通過域名信息對應(yīng)的ip地址來確定第三特征值,能夠保證cdn節(jié)點的探測準確性。
207、根據(jù)第一特征值、第二特征值和第三特征值,確定被訪問網(wǎng)站的cdn節(jié)點疑似度。
具體的,該過程可以包括:
a、獲取第一特征值、第二特征值和第三特征值分別對應(yīng)的權(quán)重系數(shù)。
其中,第一特征值、第二特征值和第三特征值分別對應(yīng)的權(quán)重系數(shù)用于指示第一特征值、第二特征值和第三特征值相對重要程度,其分別對應(yīng)的權(quán)重系數(shù)可以根據(jù)專家指導(dǎo)進行確定,或者根據(jù)機器學(xué)習(xí)結(jié)果進行確定,或者根據(jù)專家指導(dǎo)與機器學(xué)習(xí)結(jié)果的結(jié)合進行確定。
比如,第一特征值、第二特征值、第三特征值分別對應(yīng)的權(quán)重系數(shù)均大于等于0且小于等于1,其分別對應(yīng)的權(quán)重系數(shù)之間的關(guān)系可以是:第一特征值的權(quán)重系數(shù)小于第三特征值的權(quán)重系數(shù),第三特征值的權(quán)重系數(shù)小于第二特征值的權(quán)重系數(shù);也可以是,第一特征值的權(quán)重系數(shù)、第三特征值的權(quán)重系數(shù)與第三特征值的權(quán)重系數(shù)均相等。
b、根據(jù)第一特征值、第二特征值和第三特征值與分別對應(yīng)的權(quán)重系數(shù)乘積的累加值,確定cdn節(jié)點疑似度。
具體的,cdn節(jié)點疑似度可以通過如下計算公式進行計算:
d=m1*a1+m2*a2+m3*a3;
其中,d表示cdn節(jié)點疑似度,m1表示第一特征值,a1表示第一特征值的權(quán)重系數(shù),m2表示第二特征值,a2表示第二特征值的權(quán)重系數(shù),m3表示第三特征值,a3表示第三特征值的權(quán)重系數(shù)。
比如,將第一特征值的權(quán)重系數(shù)、第二特征值的權(quán)重系數(shù)、第三特征值的權(quán)重系數(shù)中的其中兩項值設(shè)置為不等于0,另外一項值設(shè)置為等于0,即通過兩項特征值的結(jié)合確定cdn節(jié)點疑似度;由此通過兩項特征值的結(jié)合確定cdn節(jié)點疑似度能夠節(jié)約探測cdn節(jié)點使用的資源,且進一步提高cdn節(jié)點的探測效率。
又如,將第一特征值的權(quán)重系數(shù)、第二特征值的權(quán)重系數(shù)、第三特征值的權(quán)重系數(shù)中的其中一項值設(shè)置為不等于0,另外兩項值設(shè)置為等于0,即通過一項特征值確定cdn節(jié)點疑似度,由此能夠最大程度節(jié)約探測cdn節(jié)點使用的資源,且進一步提高cdn節(jié)點的探測效率,但相對使用兩項或三項特征值的結(jié)合來探測cdn節(jié)點而言,通過一項特征值對cdn節(jié)點進行的探測準確率較低。
在實際應(yīng)用中,將該第一特征值、第二特征值和第三特征值相結(jié)合來確定cdn節(jié)點疑似度,以進一步提高cdn節(jié)點探測的準確性,為優(yōu)選方案,但是不排除采用其中的一項或兩項的結(jié)合以探測cdn節(jié)點,其均在本發(fā)明保護范圍之內(nèi),本發(fā)明實施例對此不加以限定。
208、判斷cdn節(jié)點疑似度是否超過預(yù)設(shè)閾值,若是,則判定被訪問網(wǎng)站存在cdn節(jié)點。
其中,預(yù)設(shè)閾值可以根據(jù)專家指導(dǎo)進行確定,或者根據(jù)機器學(xué)習(xí)結(jié)果進行確定,或者根據(jù)專家指導(dǎo)與機器學(xué)習(xí)結(jié)果的結(jié)合進行確定。
具體的,若cdn節(jié)點疑似度超過預(yù)設(shè)閾值,則判定被訪問網(wǎng)站存在cdn節(jié)點,否則,判定被訪問網(wǎng)站不存在cdn節(jié)點。
本發(fā)明實施例對具體的判斷過程不加以限定。
本發(fā)明實施例中,通過第一特征值、第二特征值和第三特征值三個維度來確定被訪問網(wǎng)站的cdn節(jié)點疑似度,以及通過判斷cdn節(jié)點疑似度是否超過預(yù)設(shè)閾值,以確定被訪問網(wǎng)站是否存在cdn節(jié)點,使得判斷結(jié)果更加準確,適用于所有的被訪問網(wǎng)站,從而進一步提高了cdn節(jié)點的探測效率。
本發(fā)明實施例提供了一種cdn節(jié)點的探測方法,由于通過根據(jù)多個域名服務(wù)器分別針對域名解析請求返回的域名解析結(jié)果,獲取被訪問網(wǎng)站的特征信息,因此根據(jù)多個域名服務(wù)器返回的域名解析結(jié)果能夠獲取到對被訪問網(wǎng)站進行分析的大量分析數(shù)據(jù),由此提高了探測被訪問網(wǎng)站是否存在cdn節(jié)點的準確性;另外,由于通過根據(jù)被訪問網(wǎng)站的特征信息,確定被訪問網(wǎng)站的cdn節(jié)點疑似度,并根據(jù)cdn節(jié)點疑似度,判斷被訪問網(wǎng)站是否存在cdn節(jié)點,因此相比較現(xiàn)有技術(shù),本發(fā)明的方案能夠避免在cdn節(jié)點探測過程中投入大量的設(shè)備和資源對被訪問網(wǎng)站的所有cdn帶寬進行采樣分析,由此不但節(jié)省了cdn節(jié)點探測時使用的資源,同時也提高了cdn節(jié)點的探測效率。
實施例三
本發(fā)明實施例提供了一種cdn節(jié)點的探測裝置,參照圖3所示,cdn節(jié)點的探測裝置3包括:
獲取模塊31,用于根據(jù)多個域名服務(wù)器分別針對域名解析請求返回的域名解析結(jié)果,獲取被訪問網(wǎng)站的特征信息,域名解析請求中攜帶有被訪問網(wǎng)站的域名信息;
確定模塊32,用于根據(jù)被訪問網(wǎng)站的特征信息,確定被訪問網(wǎng)站的cdn節(jié)點疑似度;
判斷模塊33,用于根據(jù)cdn節(jié)點疑似度,判斷被訪問網(wǎng)站是否存在cdn節(jié)點。
可選的,特征信息至少包括與域名信息對應(yīng)的cname、ip地址和ip地址的分布區(qū)域,確定模塊32包括:
第一確定子模塊321,用于根據(jù)域名信息對應(yīng)的cname,確定第一特征值;
第二確定子模塊322,用于根據(jù)域名信息對應(yīng)的ip地址,確定第二特征值;
第三確定子模塊323,用于根據(jù)ip地址的分布區(qū)域,確定第三特征值;
第四確定子模塊324,用于根據(jù)第一特征值、第二特征值和第三特征值,確定被訪問網(wǎng)站的cdn節(jié)點疑似度;
其中,第一特征值、第二特征值和第三特征值均用于量化被訪問網(wǎng)站的cdn節(jié)點疑似度。
可選的,第一確定子模塊321具體用于:
判斷域名信息對應(yīng)的cname是否包含預(yù)設(shè)關(guān)鍵詞;
若域名信息對應(yīng)的cname包含預(yù)設(shè)關(guān)鍵詞,則根據(jù)預(yù)設(shè)評分標準,確定第一特征值;
第二確定子模塊322具體用于:
獲取域名信息對應(yīng)的所有ip地址,并去重統(tǒng)計ip地址的數(shù)目;
根據(jù)預(yù)設(shè)評分標準和ip地址的數(shù)目,確定第二特征值;
第三確定子模塊323具體用于:
去重統(tǒng)計ip地址的分布區(qū)域的數(shù)目;
根據(jù)預(yù)設(shè)評分標準和ip地址的分布區(qū)域的數(shù)目,確定第三特征值。
可選的,第四確定子模塊324具體用于:
獲取第一特征值、第二特征值和第三特征值分別對應(yīng)的權(quán)重系數(shù);
根據(jù)第一特征值、第二特征值和第三特征值與分別對應(yīng)的權(quán)重系數(shù)乘積的累加值,確定cdn節(jié)點疑似度。
可選的,判斷模塊33具體用于:
判斷cdn節(jié)點疑似度是否超過預(yù)設(shè)閾值,若是,則判定被訪問網(wǎng)站存在cdn節(jié)點。
可選的,cdn節(jié)點的探測裝置3還包括:
模擬模塊34,用于模擬客戶端的域名解析請求;
發(fā)送模塊35,用于將域名解析請求發(fā)送至多個域名服務(wù)器;
接收模塊36,用于接收多個域名服務(wù)器分別針對域名解析請求返回的域名解析結(jié)果。
本發(fā)明實施例提供了一種cdn節(jié)點的探測裝置,該裝置通過根據(jù)多個域名服務(wù)器分別針對域名解析請求返回的域名解析結(jié)果,獲取被訪問網(wǎng)站的特征信息,因此根據(jù)多個域名服務(wù)器返回的域名解析結(jié)果能夠獲取到對被訪問網(wǎng)站進行分析的大量分析數(shù)據(jù),由此提高了探測被訪問網(wǎng)站是否存在cdn節(jié)點的準確性;另外,由于通過根據(jù)被訪問網(wǎng)站的特征信息,確定被訪問網(wǎng)站的cdn節(jié)點疑似度,并根據(jù)cdn節(jié)點疑似度,判斷被訪問網(wǎng)站是否存在cdn節(jié)點,因此相比較現(xiàn)有技術(shù),本發(fā)明的方案能夠避免在cdn節(jié)點探測過程中投入大量的設(shè)備和資源對被訪問網(wǎng)站的所有cdn帶寬進行采樣分析,由此不但節(jié)省了cdn節(jié)點探測時使用的資源,同時也提高了cdn節(jié)點的探測效率。
上述所有可選技術(shù)方案,可以采用任意結(jié)合形成本發(fā)明的可選實施例,在此不再一一贅述。
需要說明的是,本發(fā)明實施例中所述的“第一”、“第二”、“第三”、“第四”均是相對而言,是為了幫助本領(lǐng)域技術(shù)人員進一步理解本發(fā)明實施例所提供的cdn節(jié)點的探測方法和裝置,并非特指或限定。
需要說明的是:上述實施例提供的cdn節(jié)點的探測裝置在執(zhí)行cdn節(jié)點的探測方法時,僅以上述各功能模塊的劃分進行舉例說明,實際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將裝置的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實施例提供的cdn節(jié)點的探測裝置與cdn節(jié)點的探測方法實施例屬于同一構(gòu)思,其具體實現(xiàn)過程詳見方法實施例,這里不再贅述。
本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。