一種數(shù)據(jù)過濾方法及數(shù)據(jù)過濾裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及一種數(shù)據(jù)過濾方法及數(shù)據(jù)過濾裝置。
【背景技術(shù)】
[0002]用戶在經(jīng)由終端設(shè)備(比如臺(tái)式計(jì)算機(jī)或者移動(dòng)終端設(shè)備)瀏覽互聯(lián)網(wǎng)時(shí)所發(fā)生的上網(wǎng)行為(例如,在瀏覽器地址欄中鍵入頁面地址或者點(diǎn)擊頁面中的超鏈接)會(huì)產(chǎn)生大量通信數(shù)據(jù)。
[0003]當(dāng)需要對(duì)用戶產(chǎn)生的這些通信數(shù)據(jù)進(jìn)行分析時(shí),由于產(chǎn)生的數(shù)據(jù)量較大,且存在大量“臟數(shù)據(jù)”(即,與用戶真實(shí)的上網(wǎng)行為(例如,用戶手動(dòng)行為)無關(guān)的數(shù)據(jù))較多。這樣會(huì)導(dǎo)致對(duì)數(shù)據(jù)的處理速度較慢,并影響數(shù)據(jù)分析的準(zhǔn)確性,以至于影響了多個(gè)層面的數(shù)據(jù)質(zhì)量,而且需要的存儲(chǔ)空間較大。
【發(fā)明內(nèi)容】
[0004]本發(fā)明所要解決的技術(shù)問題是提供一種數(shù)據(jù)過濾方法及數(shù)據(jù)過濾裝置,對(duì)用戶與終端設(shè)備的交互數(shù)據(jù)進(jìn)行過濾。
[0005]本發(fā)明解決上述技術(shù)問題的技術(shù)方案如下:
[0006]基于本發(fā)明的一個(gè)方面,提供了一種數(shù)據(jù)過濾方法,所述方法包括:
[0007]S1、獲取用戶與終端設(shè)備交互過程中產(chǎn)生的通信數(shù)據(jù);
[0008]S2、提取所述通信數(shù)據(jù)的數(shù)據(jù)特征;
[0009]S3、判斷所述數(shù)據(jù)特征是否滿足數(shù)據(jù)過濾條件;
[0010]S4、若所述數(shù)據(jù)特征滿足數(shù)據(jù)過濾條件,則對(duì)產(chǎn)生的所述通信數(shù)據(jù)進(jìn)行過濾。
[0011]基于本發(fā)明的另一個(gè)方面,提供了一種數(shù)據(jù)過濾裝置,所述裝置包括:
[0012]數(shù)據(jù)獲取模塊,用于獲取用戶與終端設(shè)備交互過程中產(chǎn)生的通信數(shù)據(jù);
[0013]特征提取模塊,用于提取所述通信數(shù)據(jù)的數(shù)據(jù)特征;
[0014]判斷模塊,用于判斷所述數(shù)據(jù)特征是否滿足數(shù)據(jù)過濾條件;
[0015]數(shù)據(jù)過濾模塊,用于若所述數(shù)據(jù)特征滿足數(shù)據(jù)過濾條件,則對(duì)產(chǎn)生的所述通信數(shù)據(jù)進(jìn)行過濾。
[0016]本發(fā)明提供的一種數(shù)據(jù)過濾方法及數(shù)據(jù)過濾裝置,獲取用戶與終端設(shè)備交互產(chǎn)生的通信數(shù)據(jù)并提取該通信數(shù)據(jù)中的數(shù)據(jù)特征,判斷該數(shù)據(jù)特征是否滿足數(shù)據(jù)過濾條件,若滿足,則對(duì)通信數(shù)據(jù)進(jìn)行過濾,能夠?qū)τ脩襞c終端設(shè)備的交互數(shù)據(jù)進(jìn)行過濾,使據(jù)能夠更加準(zhǔn)確的反映用戶的真實(shí)行為。
【附圖說明】
[0017]圖1為本發(fā)明實(shí)施例1的一種數(shù)據(jù)過濾方法流程圖;
[0018]圖2為本發(fā)明實(shí)施例2的一種數(shù)據(jù)過濾裝置示意圖。
【具體實(shí)施方式】
[0019]以下結(jié)合附圖對(duì)本發(fā)明的原理和特征進(jìn)行描述,所舉實(shí)例只用于解釋本發(fā)明,并非用于限定本發(fā)明的范圍。
[0020]實(shí)施例1、一種數(shù)據(jù)過濾方法。以下結(jié)合圖1對(duì)本實(shí)施例提供的方法進(jìn)行詳細(xì)說明。
[0021]參見圖1,S1、獲取用戶與終端設(shè)備交互過程中產(chǎn)生的通信數(shù)據(jù)。
[0022]S2、提取所述通信數(shù)據(jù)的數(shù)據(jù)特征;
[0023]S3、判斷所述數(shù)據(jù)特征是否滿足數(shù)據(jù)過濾條件;
[0024]S4、若所述數(shù)據(jù)特征滿足數(shù)據(jù)過濾條件,則對(duì)產(chǎn)生的所述通信數(shù)據(jù)進(jìn)行過濾。
[0025]其中,步驟S2中的用戶與終端設(shè)備交互過程中產(chǎn)生的通信數(shù)據(jù)的數(shù)據(jù)特征具體包括通信數(shù)據(jù)的文件類型信息,文件類型信息又具體包括內(nèi)容類型標(biāo)識(shí)和/或文件類型標(biāo)識(shí)。所述內(nèi)容類型標(biāo)識(shí)是由所述通信數(shù)據(jù)的http包頭解析而來,所述文件類型標(biāo)識(shí)是由所述通信數(shù)據(jù)的http包體解析而來。
[0026]步驟S3根據(jù)所述通信數(shù)據(jù)的文件類型信息,判斷該文件類型信息是否滿足數(shù)據(jù)過濾條件。具體為:根據(jù)通信數(shù)據(jù)的內(nèi)容類型標(biāo)識(shí)和/或文件類型標(biāo)識(shí),判斷通信數(shù)據(jù)所屬內(nèi)容和/或文件是否滿足數(shù)據(jù)過濾條件,若滿足數(shù)據(jù)過濾條件,則根據(jù)數(shù)據(jù)過濾條件對(duì)通信數(shù)據(jù)進(jìn)行過濾。
[0027]在數(shù)據(jù)過濾的過程中,預(yù)先為終端設(shè)備配置數(shù)據(jù)過濾函數(shù),若用戶與終端設(shè)備交互產(chǎn)生的通信數(shù)據(jù)滿足數(shù)據(jù)過濾條件,則步驟S4調(diào)用與該終端設(shè)備對(duì)應(yīng)的數(shù)據(jù)過濾函數(shù),對(duì)通信數(shù)據(jù)進(jìn)行過濾。
[0028]實(shí)施例2、一種數(shù)據(jù)過濾裝置。以下結(jié)合圖2對(duì)本實(shí)施例提供的裝置進(jìn)行詳細(xì)描述。
[0029]參見圖2,本實(shí)施例提供的數(shù)據(jù)過濾裝置包括數(shù)據(jù)獲取模塊201、特征提取模塊202、判斷模塊203、函數(shù)配置模塊204和數(shù)據(jù)過濾模塊205。
[0030]其中,數(shù)據(jù)獲取模塊201,用于獲取用戶與終端設(shè)備交互過程中產(chǎn)生的通信數(shù)據(jù)。
[0031]特征提取模塊202,用于提取所述通信數(shù)據(jù)的數(shù)據(jù)特征。
[0032]判斷模塊203,用于判斷所述數(shù)據(jù)特征是否滿足數(shù)據(jù)過濾條件。
[0033]數(shù)據(jù)過濾模塊205,用于若所述數(shù)據(jù)特征滿足數(shù)據(jù)過濾條件,則對(duì)產(chǎn)生的所述通信數(shù)據(jù)進(jìn)行過濾。
[0034]其中,特征提取模塊202提取的用戶與終端設(shè)備交互過程中產(chǎn)生的通信數(shù)據(jù)的數(shù)據(jù)特征具體包括通信數(shù)據(jù)的文件類型信息,文件類型信息又具體包括內(nèi)容類型標(biāo)識(shí)和/或文件類型標(biāo)識(shí)。所述內(nèi)容類型標(biāo)識(shí)是由所述通信數(shù)據(jù)的http包頭解析而來,所述文件類型標(biāo)識(shí)是由所述通信數(shù)據(jù)的http包體解析而來。
[0035]判斷模塊203根據(jù)所述通信數(shù)據(jù)的文件類型信息,判斷該文件類型信息是否滿足數(shù)據(jù)過濾條件。具體為:根據(jù)通信數(shù)據(jù)的內(nèi)容類型標(biāo)識(shí)和/或文件類型標(biāo)識(shí),判斷通信數(shù)據(jù)所屬內(nèi)容和/或文件是否滿足數(shù)據(jù)過濾條件,若滿足數(shù)據(jù)過濾條件,則根據(jù)數(shù)據(jù)過濾條件對(duì)通信數(shù)據(jù)進(jìn)行過濾。
[0036]在數(shù)據(jù)過濾的過程中,函數(shù)配置模塊204預(yù)先為終端設(shè)備配置數(shù)據(jù)過濾函數(shù),若用戶與終端設(shè)備交互產(chǎn)生的通信數(shù)據(jù)滿足數(shù)據(jù)過濾條件,則數(shù)據(jù)過濾模塊205調(diào)用與該終端設(shè)備對(duì)應(yīng)的數(shù)據(jù)過濾函數(shù),對(duì)通信數(shù)據(jù)進(jìn)行過濾。
[0037]本發(fā)明提供的一種數(shù)據(jù)過濾方法及數(shù)據(jù)過濾裝置,獲取用戶與終端設(shè)備交互產(chǎn)生的通信數(shù)據(jù)并提取該通信數(shù)據(jù)中的數(shù)據(jù)特征,判斷該數(shù)據(jù)特征是否滿足數(shù)據(jù)過濾條件,若滿足,則對(duì)通信數(shù)據(jù)進(jìn)行過濾,能夠?qū)τ脩襞c終端設(shè)備的交互數(shù)據(jù)進(jìn)行過濾,使據(jù)能夠更加準(zhǔn)確的反映用戶的真實(shí)行為。
[0038]在本說明書的描述中,參考術(shù)語“實(shí)施例一”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體方法、裝置或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對(duì)上述術(shù)語的示意性表述不必須針對(duì)的是相同的實(shí)施例或示例。而且,描述的具體特征、方法、裝置或者特點(diǎn)可以在任一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說明書中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。
[0039]以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種數(shù)據(jù)過濾方法,其特征在于,所述方法包括: 51、獲取用戶與終端設(shè)備交互過程中產(chǎn)生的通信數(shù)據(jù); 52、提取所述通信數(shù)據(jù)的數(shù)據(jù)特征; 53、判斷所述數(shù)據(jù)特征是否滿足數(shù)據(jù)過濾條件; 54、若所述數(shù)據(jù)特征滿足數(shù)據(jù)過濾條件,則對(duì)產(chǎn)生的所述通信數(shù)據(jù)進(jìn)行過濾。2.如權(quán)利要求1所述的數(shù)據(jù)過濾方法,其特征在于,所述步驟S2中的數(shù)據(jù)特征包括通信數(shù)據(jù)中的文件類型信息。3.如權(quán)利要求2所述的數(shù)據(jù)過濾方法,其特征在于,所述文件類型信息包括內(nèi)容類型標(biāo)識(shí)和/或文件類型標(biāo)識(shí)。4.如權(quán)利要求3所述的數(shù)據(jù)過濾方法,其特征在于,所述內(nèi)容類型標(biāo)識(shí)是由所述通信數(shù)據(jù)的http包頭解析而來,所述文件類型標(biāo)識(shí)是由所述通信數(shù)據(jù)的http包體解析而來。5.如權(quán)利要求2所述的數(shù)據(jù)過濾方法,其特征在于,所述步驟S3具體包括: 根據(jù)所述通信數(shù)據(jù)的文件類型信息,判斷該文件類型信息是否滿足數(shù)據(jù)過濾條件。6.如權(quán)利要求1所述的數(shù)據(jù)過濾方法,其特征在于,所述步驟S4具體包括: 為終端設(shè)備配置數(shù)據(jù)過濾函數(shù),若用戶與終端設(shè)備交互產(chǎn)生的通信數(shù)據(jù)滿足數(shù)據(jù)過濾條件,則調(diào)用與該終端設(shè)備對(duì)應(yīng)的數(shù)據(jù)過濾函數(shù),對(duì)通信數(shù)據(jù)進(jìn)行過濾。7.一種數(shù)據(jù)過濾裝置,其特征在于,所述裝置包括: 數(shù)據(jù)獲取模塊,用于獲取用戶與終端設(shè)備交互過程中產(chǎn)生的通信數(shù)據(jù); 特征提取模塊,用于提取所述通信數(shù)據(jù)的數(shù)據(jù)特征; 判斷模塊,用于判斷所述數(shù)據(jù)特征是否滿足數(shù)據(jù)過濾條件; 數(shù)據(jù)過濾模塊,用于若所述數(shù)據(jù)特征滿足數(shù)據(jù)過濾條件,則對(duì)產(chǎn)生的所述通信數(shù)據(jù)進(jìn)行過濾。8.如權(quán)利要求7所述的數(shù)據(jù)過濾裝置,其特征在于,所述通信數(shù)據(jù)的數(shù)據(jù)特征包括文件類型信息。9.如權(quán)利要求8所述的數(shù)據(jù)過濾裝置,其特征在于,所述判斷模塊具體用于: 根據(jù)所述通信數(shù)據(jù)的文件類型信息,判斷該文件類型信息是否滿足數(shù)據(jù)過濾條件。10.如權(quán)利要求7所述的數(shù)據(jù)過濾裝置,其特征在于,所述裝置還包括: 函數(shù)配置模塊,用于為終端設(shè)備配置數(shù)據(jù)過濾函數(shù); 所述數(shù)據(jù)過濾模塊具體用于若用戶與終端設(shè)備交互產(chǎn)生的通信數(shù)據(jù)滿足數(shù)據(jù)過濾條件,則調(diào)用與該終端設(shè)備對(duì)應(yīng)的數(shù)據(jù)過濾函數(shù),對(duì)通信數(shù)據(jù)進(jìn)行過濾。
【專利摘要】本發(fā)明公開了一種數(shù)據(jù)過濾方法及數(shù)據(jù)過濾裝置,其中,數(shù)據(jù)過濾方法包括獲取用戶與終端設(shè)備交互過程中產(chǎn)生的通信數(shù)據(jù);提取所述通信數(shù)據(jù)的數(shù)據(jù)特征;判斷所述數(shù)據(jù)特征是否滿足數(shù)據(jù)過濾條件;若所述數(shù)據(jù)特征滿足數(shù)據(jù)過濾條件,則對(duì)產(chǎn)生的所述通信數(shù)據(jù)進(jìn)行過濾。本發(fā)明能夠?qū)τ脩襞c終端設(shè)備的交互數(shù)據(jù)進(jìn)行過濾,使據(jù)能夠更加準(zhǔn)確的反映用戶的真實(shí)行為。
【IPC分類】G06F17/30
【公開號(hào)】CN105335486
【申請(qǐng)?zhí)枴緾N201510669876
【發(fā)明人】徐波
【申請(qǐng)人】桂林電子科技大學(xué)
【公開日】2016年2月17日
【申請(qǐng)日】2015年10月15日