1.一種信息處理方法,其特征在于,所述方法包括:
獲取待處理數(shù)據(jù),所述待處理數(shù)據(jù)包括多個用戶終端手機號、所述各個用戶終端手機號分別對應(yīng)的各個預設(shè)字段的值、以及所述用戶終端手機號對應(yīng)的號碼類別,所述號碼類別包括普遍號碼類別或異常號碼類別;
計算不同號碼類別下,所述各個預設(shè)字段值的分布,根據(jù)所述不同用戶類別下,所述各個預設(shè)字段值的分布,從所述多個預設(shè)字段中選取預設(shè)模型的輸入變量;
根據(jù)所述輸入變量以及待處理數(shù)據(jù),從各個預設(shè)模型中選取一個作為篩選模型,并獲取所述篩選模型對應(yīng)的篩選標準;
獲取待測試數(shù)據(jù),所述待測試數(shù)據(jù)包括待測試用戶終端手機號及所述待測試用戶終端手機號對應(yīng)的多個預設(shè)字段的值;
根據(jù)所述篩選標準,獲取所述待測試用戶終端手機號分別屬于各個號碼類別的概率值;
判斷所述待測試用戶終端手機號屬于異常號碼類別的概率值是否大于預設(shè)閾值;
如果是,確定所述待測試用戶終端手機號為異常號碼類別,并根據(jù)所述概率值,確定所述待測試用戶終端手機號的監(jiān)控等級。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述不同用戶類別下,所述各個預設(shè)字段值的分布,從所述多個預設(shè)字段中選取預設(shè)模型的輸入變量,包括:
分別計算各個預設(shè)字段下,不同用戶類別對應(yīng)的字段值的差異值;
分別計算各個字段對應(yīng)的信息增益;
根據(jù)所述差異值以及所述信息增益,從所述多個預設(shè)字段中選取預設(shè)模型的輸入變量。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,獲取待處理數(shù)據(jù),所述待處理數(shù)據(jù)包括多個用戶終端手機號及所述各個用戶終端手機號分別對應(yīng)的各個預設(shè)字段的值,包括:
獲取待處理數(shù)據(jù),所述待處理數(shù)據(jù)包括多個用戶終端手機號及所述各個用戶終端手機號分別對應(yīng)的第一預設(shè)字段集合中各個預設(shè)字段的值;
對所述待處理數(shù)據(jù)進行預處理,分別獲取所述各個用戶終端手機號分別對應(yīng)的第二預設(shè)字段集合中各個預設(shè)字段的值。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預設(shè)模型包括神經(jīng)網(wǎng)絡(luò)算法模塊、決策樹算法模型、邏輯回歸算法模型。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述根據(jù)所述輸入變量以及待處理數(shù)據(jù),從各個預設(shè)模型中選取一個作為篩選模型,并獲取所述篩選模型對應(yīng)的篩選標準之后,所述方法還包括:
獲取待驗證數(shù)據(jù),所述待驗證數(shù)據(jù)包括多個用戶終端手機號、所述各個用戶終端手機號分別對應(yīng)的各個預設(shè)字段的值、以及所述用戶終端手機號對應(yīng)的號碼類別;
根據(jù)所述篩選標準,分別確定所述待驗證數(shù)據(jù)中各個用戶終端手機號的預測號碼類別;
根據(jù)所述預測號碼類別與獲取到的待驗證數(shù)據(jù)中的用戶終端手機號碼的號碼類別,計算預測的準確率及召回率;
當所述準確率小于第一預設(shè)閾值或所述召回率小于第二預設(shè)閾值時,重新從所述多個預設(shè)字段中選取預設(shè)模型的輸入變量;
根據(jù)重新確定的輸入變量以及待處理數(shù)據(jù),從各個預設(shè)模型中選取一個作為篩選模型,并獲取所述篩選模型對應(yīng)的篩選標準。
6.一種信息處理裝置,其特征在于,所述裝置包括:
第一獲取模塊,用于獲取待處理數(shù)據(jù),所述待處理數(shù)據(jù)包括多個用戶終端手機號、所述各個用戶終端手機號分別對應(yīng)的各個預設(shè)字段的值、以及所述用戶終端手機號對應(yīng)的號碼類別,所述號碼類別包括普遍號碼類別或異常號碼類別;
計算模塊,用于計算不同號碼類別下,所述各個預設(shè)字段值的分布,根據(jù)所述不同用戶類別下,所述各個預設(shè)字段值的分布,從所述多個預設(shè)字段中選取預設(shè)模型的輸入變量;
選取模塊,用于根據(jù)所述輸入變量以及待處理數(shù)據(jù),從各個預設(shè)模型中選取一個作為篩選模型,并獲取所述篩選模型對應(yīng)的篩選標準;
第二獲取模塊,用于獲取待測試數(shù)據(jù),所述待測試數(shù)據(jù)包括待測試用戶終端手機號及所述待測試用戶終端手機號對應(yīng)的多個預設(shè)字段的值;
第三獲取模塊,用于根據(jù)所述篩選標準,獲取所述待測試用戶終端手機號分別屬于各個號碼類別的概率值;
判斷模塊,用于判斷所述待測試用戶終端手機號屬于異常號碼類別的概率值是否大于預設(shè)閾值;如果是,確定所述待測試用戶終端手機號為異常號碼類別,并根據(jù)所述概率值,確定所述待測試用戶終端手機號的監(jiān)控等級。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述計算模塊包括第一計算子模塊,第二計算子模塊以及處理模塊,
所述第一計算子模塊,用于分別計算各個預設(shè)字段下,不同用戶類別對應(yīng)的字段值的差異值;
所述第二計算子模塊,用于分別計算各個字段對應(yīng)的信息增益;
所述處理模塊,用于根據(jù)所述差異值以及所述信息增益,從所述多個預設(shè)字段中選取預設(shè)模型的輸入變量。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述第一獲取模塊,具體用于獲取待處理數(shù)據(jù),所述待處理數(shù)據(jù)包括多個用戶終端手機號及所述各個用戶終端手機號分別對應(yīng)的第一預設(shè)字段集合中各個預設(shè)字段的值;對所述待處理數(shù)據(jù)進行預處理,分別獲取所述各個用戶終端手機號分別對應(yīng)的第二預設(shè)字段集合中各個預設(shè)字段的值。
9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述預設(shè)模型包括神經(jīng)網(wǎng)絡(luò)算法模塊、決策樹算法模型、邏輯回歸算法模型。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述裝置還包括優(yōu)化模塊,用于獲取待驗證數(shù)據(jù),所述待驗證數(shù)據(jù)包括多個用戶終端手機號、所述各個用戶終端手機號分別對應(yīng)的各個預設(shè)字段的值、以及所述用戶終端手機號對應(yīng)的號碼類別;根據(jù)所述篩選標準,分別確定所述待驗證數(shù)據(jù)中各個用戶終端手機號的預測號碼類別;根據(jù)所述預測號碼類別與獲取到的待驗證數(shù)據(jù)中的用戶終端手機號碼的號碼類別,計算預測的準確率及召回率;當所述準確率小于第一預設(shè)閾值或所述召回率小于第二預設(shè)閾值時,重新從所述多個預設(shè)字段中選取預設(shè)模型的輸入變量;根據(jù)重新確定的輸入變量以及待處理數(shù)據(jù),從各個預設(shè)模型中選取一個作為篩選模型,并獲取所述篩選模型對應(yīng)的篩選標準。