国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種利用實(shí)時(shí)算法實(shí)現(xiàn)惡意電話過濾的方法和系統(tǒng)與流程

      文檔序號(hào):12132945閱讀:577來源:國知局
      一種利用實(shí)時(shí)算法實(shí)現(xiàn)惡意電話過濾的方法和系統(tǒng)與流程

      本發(fā)明屬于移動(dòng)電話通信技術(shù)領(lǐng)域,具體涉及一種利用實(shí)時(shí)算法實(shí)現(xiàn)惡意電話過濾的方法和系統(tǒng)。



      背景技術(shù):

      移動(dòng)電話已經(jīng)成為人們溝通的主要工具之一,用戶使用手機(jī)等移動(dòng)終端可以與其他用戶進(jìn)行電話撥打等通信行為。用戶在享受手機(jī)等移動(dòng)終端為工作或生活帶來便利的同時(shí),可能會(huì)受到詐騙、營銷等騷擾電話的打擾,這些騷擾電話給人們的正常的工作和生活造成了嚴(yán)重影響。

      為了識(shí)別騷擾電話號(hào)碼,現(xiàn)有技術(shù)采用的方法是,由運(yùn)營人員人工收集騷擾電話號(hào)碼,生成黑名單列表,然后下發(fā)給終端,終端將黑名單列表在本地保存。當(dāng)終端接收到呼入電話請(qǐng)求時(shí),根據(jù)本地保存的黑名單列表,判斷該呼入的電話號(hào)碼是否為黑名單中的騷擾電話號(hào)碼,如果是,則對(duì)用戶做出提醒或?qū)υ摵羧腚娫捳?qǐng)求進(jìn)行攔截處理。這種方法雖然能夠在一定程度上幫助用戶過濾掉一些騷擾電話,但是,因?yàn)樵趯?shí)際中騙子或者營銷人員會(huì)經(jīng)常更換電話號(hào)碼,新的騷擾電話號(hào)碼會(huì)源源不斷的產(chǎn)生,導(dǎo)致終端中保存的黑名單列表存在嚴(yán)重的滯后性問題,經(jīng)常會(huì)出現(xiàn)不能有效幫助用戶對(duì)騷擾電話進(jìn)行過濾的情況,用戶體驗(yàn)較差。

      如申請(qǐng)?zhí)枮?01310457733.3的中國發(fā)明專利申請(qǐng)公開了一種外來電話過濾的實(shí)現(xiàn)方法及系統(tǒng),該方法的特征在于:提供一虛擬分機(jī),接入的電話線分成兩路,一路接到所述虛擬分機(jī),另一路接到一延時(shí)器;所述延時(shí)器用于保證虛擬分機(jī)先獲得并截獲來電信號(hào);所述的虛擬分機(jī)將所有來電號(hào)碼分成四類:白名單、灰名單、黑名單、其余號(hào)碼;并根據(jù)所述四類號(hào)碼控制電話線路處于:全連通狀態(tài)、選擇性連通狀態(tài)以及轉(zhuǎn)接狀態(tài)。該發(fā)明的方法和系統(tǒng)由于采用虛擬分機(jī)技術(shù),可以根據(jù)帶時(shí)間性的策略和對(duì)方號(hào)碼來決定是拒絕(對(duì)方聽到忙音),留言接聽,還是接聽并激發(fā)鈴聲。但是,該外來電話過濾的實(shí)現(xiàn)方法及系統(tǒng)針對(duì)的是固定電話,而且也沒有具體說明是如何實(shí)現(xiàn)過濾的,只是提供了一個(gè)框架思路。

      當(dāng)前,網(wǎng)絡(luò)上出現(xiàn)一種軟件叫“呼死你”,又名網(wǎng)絡(luò)電話自動(dòng)追呼系統(tǒng)或者“手機(jī)轟炸軟件”,是利用通訊費(fèi)用低廉的網(wǎng)絡(luò)電話作為呼叫平臺(tái),采用國際先進(jìn)網(wǎng)絡(luò)電話通訊技術(shù),可以方便設(shè)置追呼的任何一部、任何區(qū)域的固定電話及手機(jī)號(hào)碼。但時(shí)下,這種“呼死你”軟件卻成為不法分子的工具,作為惡意報(bào)復(fù)甚至敲詐勒索的手段。針對(duì)這種惡意電話,目前運(yùn)營商和移動(dòng)用戶都缺乏有效的治理手段。



      技術(shù)實(shí)現(xiàn)要素:

      針對(duì)現(xiàn)有技術(shù)中存在的不足,本發(fā)明提供一種利用實(shí)時(shí)算法實(shí)現(xiàn)惡意電話過濾的方法和系統(tǒng)。

      為了達(dá)到上述發(fā)明目的,本發(fā)明采用以下技術(shù)方案:

      一種利用實(shí)時(shí)算法實(shí)現(xiàn)惡意電話過濾的方法,包括以下步驟:

      201,主叫號(hào)碼對(duì)已申請(qǐng)惡意電話保護(hù)的被叫號(hào)碼發(fā)起呼叫;

      202,主、被叫號(hào)碼被傳輸至惡意電話實(shí)時(shí)分析過濾平臺(tái);

      203,惡意電話實(shí)時(shí)分析過濾平臺(tái)將主、被叫號(hào)碼與號(hào)碼庫進(jìn)行匹配,再利用實(shí)時(shí)算法進(jìn)行判斷是否攔截;若不攔截則接通。通過被叫號(hào)碼申請(qǐng)惡意電話保護(hù),并將主、被叫號(hào)碼傳輸至惡意電話實(shí)時(shí)分析過濾平臺(tái),先進(jìn)行號(hào)碼庫匹配攔截,未被攔截的主叫號(hào)碼再利用實(shí)時(shí)算法進(jìn)行判斷是否攔截,從而實(shí)現(xiàn)對(duì)惡意電話的過濾,排除被叫用戶的煩惱。

      優(yōu)選的,所述惡意電話保護(hù)的申請(qǐng)流程包括以下步驟:

      101,被叫號(hào)碼在惡意電話實(shí)時(shí)分析過濾平臺(tái)申請(qǐng)惡意電話保護(hù);

      102,惡意電話實(shí)時(shí)分析過濾平臺(tái)將被叫號(hào)碼信息傳遞至NGIN進(jìn)行呼叫控制訂閱;

      103,惡意電話實(shí)時(shí)分析過濾平臺(tái)通知被叫號(hào)碼惡意電話保護(hù)開啟。惡意電話保護(hù)的業(yè)務(wù)申請(qǐng)流程簡單、方便,一鍵即可完成申請(qǐng)的過程。

      優(yōu)選的,所述實(shí)時(shí)算法包括序列后向選擇和K-means聚類算法,能準(zhǔn)確地判斷號(hào)碼是否需要攔截。

      優(yōu)選的,所述實(shí)時(shí)算法的具體流程如下:

      步驟A1:確定指標(biāo)與指標(biāo)個(gè)數(shù)n,計(jì)算全集的特征組合,共有2n種特征組合,則K-means的參數(shù)K的初始值為2n;

      步驟A2:判斷K是否為0,若K為0,則結(jié)束流程;若不為0,則轉(zhuǎn)至下一步驟;

      步驟A3:根據(jù)業(yè)務(wù)經(jīng)驗(yàn)與實(shí)際情況逐步減小K的取值;

      步驟A4:選擇K個(gè)初始聚類中心;

      步驟A5:計(jì)算每個(gè)樣本Xi=(Xi1,Xi2,…Xin)到聚類中心Xk=(Xk1,Xk2,…Xkn)的歐幾里得距離,并將樣本劃分到距離最近的簇中;

      步驟A6:計(jì)算當(dāng)前簇的均值作為新的聚類中心,并計(jì)算每個(gè)樣本到新聚類中心的歐幾里得距離,重復(fù)該步驟直到收斂,得到最終的聚類中心;

      步驟A7:若聚類中心的指標(biāo)大于0.5,則認(rèn)為更接近于該指標(biāo)為1的樣本;若小于0.5,則認(rèn)為更接近該指標(biāo)為0的樣本;若等于0.5,則與該指標(biāo)為1和0的樣本距離相等;

      步驟A8:根據(jù)聚類中心找到距離近的樣本的特征組合,保留距離近的樣本的特征組合,剔除距離遠(yuǎn)的樣本的特征組合;

      步驟A9:根據(jù)特征組合得到判斷規(guī)則;

      步驟A10:計(jì)算對(duì)應(yīng)規(guī)則的效果評(píng)估值;

      步驟A11:返至步驟A2,重復(fù)步驟直至K為0,并結(jié)束流程。通過實(shí)時(shí)算法能很好地將惡意電話過濾。

      優(yōu)選的,所述指標(biāo)包括主叫號(hào)碼歸屬地、與上一通電話的時(shí)間間隔和主叫號(hào)碼前三位號(hào)段。設(shè)置不同的過濾指標(biāo),更加準(zhǔn)確地判斷號(hào)碼是否為惡意號(hào)碼。

      優(yōu)選的,所述步驟A9還包括以下步驟:

      步驟A91:通過融合聚類的序列后向選擇算法得到不同K值下的特征組合以及評(píng)估值,根據(jù)業(yè)務(wù)目標(biāo)選擇相應(yīng)的特征組合;

      步驟A92:將所選的所有特征組合的并集作為惡意電話的實(shí)時(shí)分析上線規(guī)則;

      步驟A93:分別計(jì)算每個(gè)被選擇的特征的信息熵,信息熵越小的特征在流程上優(yōu)先判斷;

      步驟A94:得到最終判斷流程;

      步驟A95:設(shè)計(jì)惡意電話號(hào)碼實(shí)時(shí)分析初始樣本獲取流程;

      步驟A96:設(shè)計(jì)惡意電話號(hào)碼實(shí)時(shí)分析與攔截流程。

      優(yōu)選的,所述步驟A95還包括以下步驟:

      步驟A951:被叫號(hào)碼開啟惡意電話保護(hù);

      步驟A952:判斷是否在t段時(shí)間內(nèi)至少打了s個(gè)電話;

      步驟A953:提取t段時(shí)間內(nèi)前m個(gè)號(hào)碼的特征;

      步驟A954:獲取特征的包括m個(gè)號(hào)碼的歸屬地、m個(gè)號(hào)碼的前三位號(hào)段、計(jì)算m個(gè)號(hào)碼的時(shí)間間隔的平均值和標(biāo)準(zhǔn)差σ,m個(gè)號(hào)碼時(shí)間間隔范圍為

      優(yōu)選的,所述步驟A96還包括以下步驟:

      步驟A961:將第s+1個(gè)號(hào)碼與個(gè)人黑白名單進(jìn)行匹配;

      步驟A962:將號(hào)碼進(jìn)行系統(tǒng)匹配,包括系統(tǒng)白名單匹配、惡意電話黑名單匹配、系統(tǒng)灰名單匹配和系統(tǒng)黑名單匹配;

      步驟A963:若號(hào)碼在個(gè)人白名單里則放行接通,若號(hào)碼在個(gè)人黑名單里則進(jìn)行攔截;若號(hào)碼在系統(tǒng)白名單或系統(tǒng)灰名單里,則放行接通;若號(hào)碼在系統(tǒng)黑名單或惡意電話黑名單里,則進(jìn)行攔截;若號(hào)碼不在以上名單中,則進(jìn)入下一步驟;

      步驟A964:提取號(hào)碼的歸屬地、前三位號(hào)段、與上一通電話的時(shí)間間隔、前m個(gè)號(hào)碼時(shí)間間隔均值與標(biāo)準(zhǔn)差;

      步驟A965:判斷該號(hào)碼的歸屬地是否與樣本歸屬地一致,若一致則攔截,其號(hào)段和時(shí)間間隔存儲(chǔ)至樣本表中,若不一致則進(jìn)入下一步驟;

      步驟A966:判斷號(hào)段是否與樣本號(hào)段表中已有的號(hào)段一致,若一致則攔截,其歸屬地和時(shí)間間隔加入到樣本表中,若不一致則進(jìn)入下一步驟;

      步驟A967:時(shí)間間隔是否在前m個(gè)號(hào)碼時(shí)間間隔的范圍內(nèi),若屬于該范圍內(nèi)則攔截,其號(hào)段和歸屬地加入到樣本表中;若不屬于該范圍,則進(jìn)入下一步驟;

      步驟A968:號(hào)碼接通。

      本發(fā)明還公開了一種利用實(shí)時(shí)算法實(shí)現(xiàn)惡意電話的過濾系統(tǒng),包括惡意電話攔截組件模塊、支撐平臺(tái)模塊、算法模型模塊和外聯(lián)接口模塊,惡意電話攔截組件模塊實(shí)現(xiàn)對(duì)呼叫是否接續(xù)的判斷;支撐平臺(tái)模塊實(shí)現(xiàn)包括對(duì)系統(tǒng)和號(hào)碼庫的管理;算法模型模塊實(shí)現(xiàn)對(duì)呼叫是否為惡意電話的判斷;外聯(lián)接口模塊用于連接外部系統(tǒng)。通過四大模塊的協(xié)同作用實(shí)現(xiàn)惡意電話的過濾。

      優(yōu)選的,所述惡意電話攔截組件模塊包括個(gè)人號(hào)碼庫攔截、系統(tǒng)號(hào)碼庫攔截和實(shí)時(shí)算法分析攔截。通過個(gè)人號(hào)碼庫和系統(tǒng)號(hào)碼庫進(jìn)行過濾,可減輕實(shí)時(shí)算法攔截資源壓力,且多重?cái)r截設(shè)置能有效地過濾惡意電話。

      本發(fā)明與現(xiàn)有技術(shù)相比,有益效果是:本發(fā)明利用實(shí)時(shí)算法實(shí)現(xiàn)惡意電話過濾的方法和系統(tǒng),用戶在惡意電話實(shí)時(shí)分析過濾平臺(tái)申請(qǐng)惡意電話保護(hù)后,在保護(hù)期間有電話呼入時(shí),經(jīng)過號(hào)碼庫匹配與實(shí)時(shí)分析攔截兩步為用戶過濾惡意電話;號(hào)碼庫匹配是通過對(duì)比用戶個(gè)人黑/白名單以及系統(tǒng)號(hào)碼庫進(jìn)行過濾,可減輕實(shí)時(shí)算法分析攔截的壓力;根據(jù)融合K-means聚類的序列后向選擇算法得到判斷惡意號(hào)碼的特征組合,以特征組合的并集作為判斷惡意電話號(hào)碼的上線規(guī)則,過濾惡意電話效率高;實(shí)時(shí)分析攔截包括惡意號(hào)碼實(shí)時(shí)分析初始樣本獲取流程以及惡意號(hào)碼實(shí)時(shí)分析與攔截流程,準(zhǔn)確攔截惡意號(hào)碼。

      附圖說明

      圖1是本發(fā)明惡意電話保護(hù)申請(qǐng)流程圖。

      圖2是本發(fā)明惡意電話過濾流程圖。

      圖3是本發(fā)明利用實(shí)時(shí)算法實(shí)現(xiàn)惡意電話攔截的流程圖。

      圖4是本發(fā)明利用實(shí)時(shí)算法實(shí)現(xiàn)電話正常接續(xù)的流程圖。

      圖5是本發(fā)明融合K-means聚類算法的序列后向選擇算法流程圖。

      圖6是本發(fā)明惡意號(hào)碼判斷規(guī)則獲取流程圖。

      圖7是本發(fā)明不同特征組合策略下電話攔截比例圖。

      圖8是本發(fā)明惡意號(hào)碼實(shí)時(shí)分析初始樣本獲取流程圖。

      圖9是本發(fā)明惡意號(hào)碼實(shí)時(shí)分析與攔截流程圖。

      圖10是本發(fā)明惡意號(hào)碼實(shí)時(shí)分析智能開關(guān)流程圖。

      圖11是本發(fā)明利用實(shí)時(shí)算法實(shí)現(xiàn)惡意電話的過濾系統(tǒng)的結(jié)構(gòu)示意圖。

      圖12是本發(fā)明利用實(shí)時(shí)算法實(shí)現(xiàn)惡意電話的過濾系統(tǒng)硬件的結(jié)構(gòu)示意圖。

      具體實(shí)施方式

      下面通過具體實(shí)施例對(duì)本發(fā)明的技術(shù)方案作進(jìn)一步描述說明。

      呼死你這種軟件具有以下特點(diǎn):(1)二十四小時(shí)不間斷運(yùn)行;(2)遇忙可自動(dòng)重?fù)?,重?fù)艽螖?shù)可任意設(shè)定;(3)系統(tǒng)工作時(shí)間可任意設(shè)定。不法份子利用呼死你軟件具有的上述特點(diǎn)對(duì)移動(dòng)電話用戶進(jìn)行惡意的騷擾,給用戶帶來了極大的困擾。針對(duì)上述情況,本發(fā)明開發(fā)了一種利用實(shí)時(shí)算法實(shí)現(xiàn)惡意電話過濾的方法和系統(tǒng)。

      利用實(shí)時(shí)算法實(shí)現(xiàn)惡意電話過濾的方法和系統(tǒng)需要用戶在惡意電話實(shí)時(shí)分析過濾平臺(tái)申請(qǐng)呼死你保護(hù)的業(yè)務(wù)。該業(yè)務(wù)的受理范圍包括所有電信、聯(lián)通和移動(dòng)手機(jī),暫不包括固定電話。如圖1所示,申請(qǐng)呼死你保護(hù)業(yè)務(wù)的流程包括以下步驟:

      101,被叫用戶在惡意電話實(shí)時(shí)分析過濾平臺(tái)申請(qǐng)呼死你保護(hù);

      102,平臺(tái)將用戶信息傳遞至NGIN進(jìn)行呼叫控制訂閱;

      103,惡意電話實(shí)時(shí)分析過濾平臺(tái)通知用戶呼死你保護(hù)開啟。

      其中,NGIN是一款全稱為Next Generation Intelligent Network的可集成多種Service Enabler能力的融合通訊能力,解決傳統(tǒng)話音業(yè)務(wù)的演進(jìn)問題的智能網(wǎng),NGIN為運(yùn)營商提供。

      圖2為本發(fā)明的惡意電話過濾流程圖,用戶在惡意電話實(shí)時(shí)分析過濾平臺(tái)申請(qǐng)呼死你保護(hù)后,在保護(hù)期間內(nèi)有電話呼入時(shí),依次進(jìn)行個(gè)人黑白名單匹配攔截、系統(tǒng)號(hào)碼庫匹配攔截、呼死你號(hào)碼實(shí)時(shí)分析與攔截,最后對(duì)過濾后的號(hào)碼進(jìn)行電話接通。經(jīng)過號(hào)碼庫匹配與實(shí)時(shí)分析攔截兩步為用戶過濾呼死你電話;號(hào)碼庫匹配是通過對(duì)比用戶個(gè)人黑/白名單以及系統(tǒng)號(hào)碼庫進(jìn)行過濾,可減輕實(shí)時(shí)分析攔截資源壓力。

      本發(fā)明采用實(shí)時(shí)算法實(shí)現(xiàn)呼死你電話過濾,在用戶申請(qǐng)呼死你保護(hù)后,NGIN為用戶接續(xù)前先在惡意電話實(shí)時(shí)分析過濾平臺(tái)對(duì)號(hào)碼進(jìn)行分析判斷,若符合呼死你攔截規(guī)則,則將電話掛斷,如圖3所示,具體步驟如下:

      201,主叫發(fā)起呼叫給已申請(qǐng)呼死你保護(hù)的用戶,呼叫接入到運(yùn)營商的NGIN;

      202,NGIN將主、被叫號(hào)碼傳給惡意電話實(shí)時(shí)分析過濾平臺(tái)進(jìn)行是否需要攔截的判斷;

      203,惡意電話實(shí)時(shí)分析過濾平臺(tái)將主、被叫號(hào)碼與號(hào)碼庫進(jìn)行匹配,再利用實(shí)時(shí)算法進(jìn)行判斷,如果符合攔截規(guī)則,通知NGIN掛斷電話;

      204,NGIN掛斷電話,提示主叫您呼叫的用戶占時(shí)無法接通;

      205,惡意電話實(shí)時(shí)分析過濾平臺(tái)具備合并攔截記錄功能,將在攔截一定數(shù)據(jù)量后向用戶推送攔截短信,避免因頻繁推送消息對(duì)用戶造成打擾。

      若不符合呼死你攔截規(guī)則,本發(fā)明利用實(shí)時(shí)算法實(shí)現(xiàn)惡意電話過濾的方法并不影響正常呼叫的接續(xù)。正常的主叫經(jīng)過實(shí)時(shí)算法的分析與號(hào)碼庫匹配,不符合攔截規(guī)則時(shí)通話接續(xù),如圖4所示,具體步驟如下:

      301,主叫發(fā)起呼叫給已申請(qǐng)呼死你保護(hù)的用戶,呼叫接入到運(yùn)營商的NGIN;

      302,NGIN將主、被叫號(hào)碼傳給惡意電話實(shí)時(shí)分析過濾平臺(tái)進(jìn)行是否需要攔截的判斷;

      303,惡意電話實(shí)時(shí)分析過濾平臺(tái)將主、被叫號(hào)碼與號(hào)碼庫進(jìn)行匹配,再利用實(shí)時(shí)算法進(jìn)行判斷,如果不符合攔截規(guī)則,通知NGIN接通電話;

      304,NGIN將電話接續(xù)到被叫用戶,完成本次呼叫接續(xù)。

      本發(fā)明的實(shí)時(shí)算法為序列后向和K-means聚類算法的結(jié)合。

      序列后向選擇(SBS,Sequential Backward Selection)是指從特征全集O開始,每次從特征集O中剔除一個(gè)特征y,計(jì)算每次剔除特征y后的評(píng)估值,選擇最優(yōu)評(píng)估值。

      聚類是一種簡單、高效且常用的數(shù)據(jù)挖掘技術(shù),是把一些事物按照某個(gè)標(biāo)準(zhǔn)劃分為若干個(gè)類別的過程。相似的聚為一類,不相近的聚為不同類。本發(fā)明主要采用的是K-means聚類算法。K-means聚類算法的具體步驟分為四步:

      1、隨機(jī)選擇k個(gè)樣本作為初始聚類中心;

      2、將剩余樣本劃分到與之最相近的聚類中心所在的簇中;

      3、計(jì)算當(dāng)前簇的均值作為新的聚類中心;

      4、不斷循環(huán)上述2、3步,直到所有樣本所屬的類別不在變化為止。

      本發(fā)明實(shí)時(shí)算法是針對(duì)呼死你號(hào)碼進(jìn)行實(shí)時(shí)分析并攔截,因此在指標(biāo)選擇上存在一定的限制,主要包括但不限于主叫號(hào)碼歸屬地、主叫號(hào)碼前三位號(hào)段、與上一通電話的時(shí)間間隔等。每一個(gè)指標(biāo)需要與呼死你樣本進(jìn)行對(duì)比,是否與樣本特征一致,若一致則標(biāo)記為“1”,若不一致則標(biāo)記為“0”。

      實(shí)時(shí)算法描述:由于每個(gè)指標(biāo)只有0和1兩種水平并選擇0.5為中間值,因此聚類中心的各個(gè)指標(biāo)一般會(huì)出現(xiàn)兩種情況即大于0.5或者小于0.5。若指標(biāo)數(shù)量為n,則在全集狀態(tài)下,一共有2n種特征組合情況。根據(jù)序列后向選擇的原理,逐步剔除一部分特征,計(jì)算評(píng)估值,再融合K-means聚類算法,通過聚類個(gè)數(shù)K值的逐步減小得出不同K值的聚類中心,以聚類中心為依據(jù)選出鄰近類的特征組合子集。若得到的聚類中心的指標(biāo)大于0.5,則認(rèn)為更接近于1;若小于0.5,則認(rèn)為更接近0;若等于0.5,則與1和0的距離相等,仍分為兩個(gè)聚類中心。保留鄰近類的特征組合,剔除距離較遠(yuǎn)的類的特征組合,以鄰近類的特征作為判斷是否為呼死你號(hào)碼的特征。隨著K值的不斷減小,特征也不斷減小,判斷呼死你號(hào)碼的規(guī)則也更加嚴(yán)格苛刻。計(jì)算每一次特征選擇后的規(guī)則的算法效果評(píng)估,包括但不限于攔截率、漏攔率等。如圖5所示,實(shí)時(shí)算法的具體流程為:

      步驟A1:確定指標(biāo)與指標(biāo)個(gè)數(shù)n,計(jì)算全集的特征組合,共有2n種特征組合,則K-means的參數(shù)K的初始值為2n;

      步驟A2:判斷K是否=0,若為0則結(jié)束流程;若不為0則進(jìn)行下一步驟;

      步驟A3:當(dāng)K不為0時(shí),根據(jù)業(yè)務(wù)經(jīng)驗(yàn)與實(shí)際情況逐步減小K的取值;

      步驟A4:選擇K個(gè)初始聚類中心;

      步驟A5:計(jì)算每個(gè)樣本Xi=(Xi1,Xi2,…Xin)到聚類中心Xk=(Xk1,Xk2,…Xkn)的歐幾里得距離:

      并將樣本劃分到距離最近的簇中;

      步驟A6:計(jì)算當(dāng)前簇的均值作為新的聚類中心并計(jì)算每個(gè)樣本到新聚類中心的歐式距離,重復(fù)該步驟直到收斂,得到最終的聚類中心;

      步驟A7:若聚類中心的指標(biāo)大于0.5,則認(rèn)為更接近于該指標(biāo)為1的樣本;若小于0.5,則認(rèn)為更接近該指標(biāo)為0的樣本;若等于0.5,則與該指標(biāo)為1和0的樣本距離相等。

      步驟A8:根據(jù)聚類中心找到距離近的樣本的特征組合,保留距離近的樣本的特征組合,剔除距離遠(yuǎn)的樣本的特征組合;

      步驟A9:根據(jù)特征組合得到判斷規(guī)則;

      步驟A10:計(jì)算對(duì)應(yīng)規(guī)則的效果評(píng)估值,包括但不限于攔截率、漏攔率等。

      步驟A11:返至步驟A2,重復(fù)步驟直至K為0,并結(jié)束流程。

      在該實(shí)時(shí)算法的實(shí)際應(yīng)用中,選擇主叫號(hào)碼歸屬地、主叫號(hào)碼前三位號(hào)段、與上一通電話的時(shí)間間隔三個(gè)特征進(jìn)行模型構(gòu)建,因此全集狀態(tài)下共有23=8種特征組合,隨著K值的不斷減小,一部分特征組合被剔除,以K=3為例,得到的聚類中心為:(0,0.43,0.43),(1,1,0.87),(1,0,0.75)。根據(jù)規(guī)則,與聚類中心距離最近的樣本特征為:(0,0,0),(1,1,1),(1,0,1),其中(0,0,0)的三個(gè)特征與呼死你樣本特征都不符合,因此該類不攔截;(1,1,1)表示三個(gè)特征都滿足則攔截,(1,0,1)表示第一個(gè)與第三個(gè)特征同時(shí)滿足則攔截。通過實(shí)時(shí)算法能很好地將惡意電話過濾。

      根據(jù)融合K-means聚類的序列后向選擇算法得到判斷呼死你號(hào)碼的特征組合,以特征組合的并集作為判斷呼死你號(hào)碼的上線規(guī)則。如圖6所示,實(shí)時(shí)算法中的步驟A9還可以進(jìn)一步細(xì)分為:

      步驟A91:通過融合K-means聚類的序列后向選擇算法得到不同K值下的特征組合以及評(píng)估值,根據(jù)業(yè)務(wù)目標(biāo)選擇相應(yīng)的特征組合;

      步驟A92:將所選的所有特征組合的并集作為呼死你的實(shí)時(shí)分析上線規(guī)則;

      步驟A93:分別計(jì)算每個(gè)被選擇的特征的信息熵,信息熵越小的特征在流程上優(yōu)先判斷;信息熵的具體計(jì)算公式為:

      步驟A94:得到最終判斷流程;

      步驟A95:設(shè)計(jì)呼死你號(hào)碼實(shí)時(shí)分析初始樣本獲取流程;

      步驟A96:設(shè)計(jì)呼死你號(hào)碼實(shí)時(shí)分析與攔截流程。

      在實(shí)際應(yīng)用中,根據(jù)實(shí)驗(yàn)結(jié)果,每一種特征組合策略下的攔截率如圖7所示,在全集的狀態(tài)下,攔截率最高,隨K值減小,攔截率依次降低。在項(xiàng)目冷啟動(dòng)階段,選擇全集特征組合策略更為安全。按照流程全集策略的特征組合并集即為上線規(guī)則,因此上線規(guī)則為:三個(gè)特征只要有一個(gè)特征與樣本特征符合則攔截。通過信息熵計(jì)算得到主叫號(hào)碼歸屬地信息熵為0.209、主叫號(hào)碼前三位號(hào)段信息熵為0.247、與上一通電話的時(shí)間間隔信息熵為0.288,因此上線流程中,三個(gè)指標(biāo)的判斷順序依次為:主叫號(hào)碼歸屬地、主叫號(hào)碼前三位號(hào)段、與上一通電話的時(shí)間間隔。針對(duì)該實(shí)驗(yàn)結(jié)果設(shè)計(jì)對(duì)應(yīng)的呼死你號(hào)碼實(shí)時(shí)分析初始樣本獲取流程以及呼死你號(hào)碼實(shí)時(shí)分析與攔截流程。

      一、呼死你號(hào)碼實(shí)時(shí)分析初始樣本獲取流程

      由于呼死你號(hào)碼實(shí)時(shí)分析判斷規(guī)則在上線時(shí)需要一定的初始樣本號(hào)碼特征作為判斷依據(jù),因此需要首先定義用戶在開啟呼死你保護(hù)后是否已經(jīng)處于被呼死你騷擾狀態(tài)。當(dāng)確認(rèn)用戶已經(jīng)被呼死你騷擾后,提取相應(yīng)的特征。如圖8所示,實(shí)時(shí)算法流程中的步驟A95還可以進(jìn)一步包括:

      步驟A951:用戶開啟呼死你保護(hù);

      步驟A952:判斷是否在t段時(shí)間內(nèi)至少打了s個(gè)電話;

      步驟A953:提取t段時(shí)間內(nèi)前m個(gè)號(hào)碼的特征;

      步驟A954:獲取包括但不限于以下特征:m個(gè)號(hào)碼的歸屬省(去除被叫號(hào)碼歸屬市)、m個(gè)號(hào)碼的前三位號(hào)段(可根據(jù)業(yè)務(wù)建議去除一部分安全號(hào)段)、計(jì)算m個(gè)號(hào)碼的時(shí)間間隔的平均值和標(biāo)準(zhǔn)差σ;其中,m個(gè)號(hào)碼時(shí)間間隔均值的計(jì)算公式為:

      m個(gè)號(hào)碼時(shí)間間隔標(biāo)準(zhǔn)差的計(jì)算公式為:

      m個(gè)號(hào)碼時(shí)間間隔范圍為:

      二、呼死你號(hào)碼實(shí)時(shí)分析與攔截流程

      確認(rèn)呼死你號(hào)碼實(shí)時(shí)分析初始樣本后,當(dāng)?shù)趕+1個(gè)號(hào)碼進(jìn)入時(shí),將對(duì)每一個(gè)號(hào)碼進(jìn)行特征提取并且與初始樣本進(jìn)行實(shí)時(shí)匹配。特征的匹配順序按照步驟A93中的信息熵取值來確定。若該號(hào)碼的特征與樣本號(hào)碼的其中一個(gè)特征一致,則認(rèn)為是呼死你號(hào)碼,對(duì)其進(jìn)行攔截并且將該號(hào)碼的其他特征加入到樣本特征中,若該號(hào)碼的特征與所有樣本特征都不一致則放行接通。如圖9所示,實(shí)時(shí)算法流程中的步驟A96進(jìn)一步包括:

      步驟A961:將該號(hào)碼進(jìn)行個(gè)人黑白名單匹配;

      步驟A962:將該號(hào)碼進(jìn)行系統(tǒng)匹配,包括但不限于:系統(tǒng)白名單匹配、呼死你黑名單匹配、系統(tǒng)灰名單匹配、系統(tǒng)黑名單匹配等;

      步驟A963:若該號(hào)碼在個(gè)人白名單里則放行接通,若在個(gè)人黑名單里則進(jìn)行攔截;若該號(hào)碼在系統(tǒng)白名單或系統(tǒng)灰名單里,則放行接通,若在該號(hào)碼在系統(tǒng)黑名單或呼死你黑名單里則進(jìn)行攔截;若該號(hào)碼不在以上任何名單中,則進(jìn)入下一步流程;

      步驟A964:提取該號(hào)碼的歸屬地、前三位號(hào)段、與上一通電話的時(shí)間間隔、前m個(gè)號(hào)碼時(shí)間間隔均值與標(biāo)準(zhǔn)差等特征;

      步驟A965:判斷該號(hào)碼的歸屬地是否與樣本歸屬地表中已有的省份一致且不屬于被叫歸屬市,若一致則攔截,其號(hào)段和時(shí)間間隔加入到樣本表中,若不一致則進(jìn)入下一步流程;

      步驟A966:判斷該號(hào)段是否與樣本號(hào)段表中已有的號(hào)段一致,若一致則攔截,其歸屬地和時(shí)間間隔加入到樣本表中,若不一致則進(jìn)入下一步驟;

      步驟A967:時(shí)間間隔是否在前m個(gè)號(hào)碼時(shí)間間隔的范圍內(nèi),若屬于該范圍內(nèi)則攔截,其號(hào)段和歸屬地加入到樣本表中;若不屬于該范圍,則進(jìn)入下一步驟;

      步驟A968:該號(hào)碼放行接通。

      三、呼死你號(hào)碼實(shí)時(shí)分析智能開關(guān)流程

      申請(qǐng)呼死你保護(hù)后,平臺(tái)會(huì)檢測用戶的被叫頻率,當(dāng)用戶被叫頻率到達(dá)高頻狀態(tài)時(shí),進(jìn)入分析攔截流程。同時(shí)判斷每次呼叫的時(shí)間與上次的時(shí)間間隔,當(dāng)時(shí)間間隔過長時(shí),判斷為非高頻狀態(tài),則暫停攔截,開始高頻檢測狀態(tài)。如圖10所示,呼死你號(hào)碼實(shí)時(shí)分析智能開關(guān)的詳細(xì)流程為:

      步驟A971:用戶開啟呼死你保護(hù);

      步驟A972:是否在t段時(shí)間內(nèi)至少被撥打了s個(gè)電話;

      轉(zhuǎn)至實(shí)時(shí)算法步驟A95-A96:進(jìn)入高頻狀態(tài),開始呼死你號(hào)碼實(shí)時(shí)分析初始樣本獲取流程與呼死你號(hào)碼實(shí)時(shí)分析判斷流程;

      步驟A973:判斷當(dāng)前電話與上一次電話的時(shí)間間隔是否大于m;

      步驟A973:若時(shí)間間隔是否大于m,則進(jìn)入非高頻狀態(tài),停止攔截,重新進(jìn)入高頻判斷流程,達(dá)到呼死你攔截支持智能開關(guān)的效果。

      如圖11-12所示,本發(fā)明還設(shè)計(jì)了一種利用實(shí)時(shí)算法實(shí)現(xiàn)惡意電話的過濾系統(tǒng),包括呼死你攔截組件模塊、支撐平臺(tái)模塊、算法模型模塊和外聯(lián)接口模塊。

      呼死你攔截組件模塊主要實(shí)現(xiàn)對(duì)呼叫是否接續(xù)的判斷。對(duì)申請(qǐng)呼死你保護(hù)的用戶,將其來電號(hào)碼個(gè)人號(hào)碼庫、系統(tǒng)號(hào)碼庫進(jìn)行對(duì)比,再采用實(shí)時(shí)算法分析出是否需要攔截的判斷并通知NGIN攔截或接續(xù)。

      支撐平臺(tái)模塊主要實(shí)現(xiàn)對(duì)業(yè)務(wù)、用戶、號(hào)碼庫、統(tǒng)計(jì)等管理,用戶管理用于管理申請(qǐng)呼死你保護(hù)的用戶清單,支持為用戶開通或取消業(yè)務(wù);攔截記錄查詢,管理所有攔截記錄,包括主叫號(hào)碼、被叫號(hào)碼、時(shí)間、原因等;號(hào)碼庫管理,定期入庫或出庫算法分析得到的黑白名單,管理號(hào)碼清單,支持查詢分類、入庫時(shí)間、出庫時(shí)間等信息;告警管理,對(duì)業(yè)務(wù)的情況進(jìn)行監(jiān)控,當(dāng)異常時(shí)告警通知維護(hù)人員;統(tǒng)計(jì)分析,對(duì)用戶情況、攔截效果、號(hào)碼等做一個(gè)直觀的圖表展示,作為業(yè)務(wù)的效果分析模塊;系統(tǒng)管理,主要用于對(duì)管理平臺(tái)的賬號(hào)、角色進(jìn)行管理。

      算法模型模塊包括四個(gè)算法,系統(tǒng)黑名單算法用于分析通用呼死你號(hào)碼并入庫、系統(tǒng)白名單算法用于分析官方服務(wù)號(hào)碼;個(gè)人號(hào)碼庫算法,即個(gè)人白名單算法通過分析用戶近期的正常通話聯(lián)系人號(hào)碼;實(shí)時(shí)分析攔截算法用于實(shí)時(shí)分析用戶呼入的電話是否符合呼死你樣本特征。

      外聯(lián)接口模塊主要用于連接外部系統(tǒng),主要包括以下接口:短信接口用于實(shí)現(xiàn)對(duì)用戶的攔截短信消息通知;呼叫事件訂閱/取消接口用于將用戶信息的訂購或取消信息傳到NGIN;呼叫控制接口用于通知NGIN呼叫是否需要轉(zhuǎn)接到被叫手機(jī);新業(yè)務(wù)訂購/取消接口用于將用戶在前臺(tái)申請(qǐng)開通或取消業(yè)務(wù)的信息傳遞到惡意電話實(shí)時(shí)分析過濾平臺(tái)。

      呼死你攔截組件模塊與外聯(lián)接口模塊之間通過業(yè)務(wù)接口管控模塊連通,通過業(yè)務(wù)接口管控模塊實(shí)現(xiàn)業(yè)務(wù)接口的選擇,可選擇外聯(lián)接口中的一個(gè)或多個(gè)業(yè)務(wù)接口,可以適應(yīng)不同用戶的需求。

      該利用實(shí)時(shí)算法實(shí)現(xiàn)惡意電話的過濾系統(tǒng)的硬件設(shè)備包括應(yīng)用服務(wù)器集群、業(yè)務(wù)數(shù)據(jù)服務(wù)器集群和數(shù)據(jù)分析服務(wù)器集群,應(yīng)用服務(wù)器集群外接CMNET,在應(yīng)用服務(wù)器集群與CMNET之間設(shè)有負(fù)載均衡,負(fù)載均衡用于擴(kuò)展網(wǎng)絡(luò)設(shè)備和應(yīng)用服務(wù)器的帶寬、增加吞吐量、加強(qiáng)網(wǎng)絡(luò)數(shù)據(jù)處理能力、提高網(wǎng)絡(luò)的靈活性和可用性;應(yīng)用服務(wù)器集群與業(yè)務(wù)數(shù)據(jù)服務(wù)器集群信號(hào)連接,業(yè)務(wù)數(shù)據(jù)服務(wù)器集群與數(shù)據(jù)分析服務(wù)器集群信號(hào)連接,通過用服務(wù)器集群、業(yè)務(wù)數(shù)據(jù)服務(wù)器集群和數(shù)據(jù)分析服務(wù)器集群的協(xié)同作用實(shí)現(xiàn)惡意電話的過濾攔截。

      以上對(duì)本發(fā)明的優(yōu)選實(shí)施例及原理進(jìn)行了詳細(xì)說明,對(duì)本領(lǐng)域的普通技術(shù)人員而言,依據(jù)本發(fā)明提供的思想,在具體實(shí)施方式上會(huì)有改變之處,而這些改變也應(yīng)視為本發(fā)明的保護(hù)范圍。

      當(dāng)前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1