本發(fā)明涉及信息安全智能識別,更具體地說,本發(fā)明涉及基于用戶畫像的涉詐號碼識別方法及系統(tǒng)。
背景技術(shù):
1、目前,電信詐騙已經(jīng)越來越嚴(yán)重的危害社會環(huán)境,其頻繁多發(fā)的特點(diǎn)也使涉詐號碼識別也越來越困難;具體問題包括:如何獲取通信號碼初步用戶畫像數(shù)據(jù)、如何進(jìn)行畫像數(shù)據(jù)涉詐分析預(yù)測、如何進(jìn)行涉詐敏感信息專家模型信息驗(yàn)證、如何進(jìn)行通信號碼精準(zhǔn)用戶畫像以及預(yù)警聯(lián)動追溯精準(zhǔn)識別涉詐號碼等問題尚待解決;因此,有必要提出基于用戶畫像的涉詐號碼識別方法及系統(tǒng),以至少部分地解決現(xiàn)有技術(shù)中存在的問題。
技術(shù)實(shí)現(xiàn)思路
1、在
技術(shù)實(shí)現(xiàn)要素:
部分中引入了一系列簡化形式的概念,這將在具體實(shí)施方式部分中進(jìn)一步詳細(xì)說明;本發(fā)明的發(fā)明內(nèi)容部分并不意味著要試圖限定出所要求保護(hù)的技術(shù)方案的關(guān)鍵特征和必要技術(shù)特征,更不意味著試圖確定所要求保護(hù)的技術(shù)方案的保護(hù)范圍。
2、為至少部分地解決上述問題,本發(fā)明提供了基于用戶畫像的涉詐號碼識別方法,包括:
3、s100,基于通信號碼歷史記錄大數(shù)據(jù),對通信號碼進(jìn)行初步用戶畫像,獲取通信號碼初步用戶畫像數(shù)據(jù);
4、s200,根據(jù)通信號碼初步用戶畫像數(shù)據(jù),通過畫像數(shù)據(jù)分析預(yù)測模型進(jìn)行畫像數(shù)據(jù)涉詐分析預(yù)測,獲取畫像數(shù)據(jù)涉詐分析預(yù)測信息;
5、s300,根據(jù)畫像數(shù)據(jù)涉詐分析預(yù)測信息,通過涉詐敏感信息專家模型進(jìn)行信息驗(yàn)證,獲取涉詐敏感信息專家模型信息驗(yàn)證結(jié)果;
6、s400,根據(jù)涉詐敏感信息專家模型信息驗(yàn)證結(jié)果,通過涉詐方向智能判定,進(jìn)行通信號碼精準(zhǔn)用戶畫像,并發(fā)送到通信號碼監(jiān)管端和通信號碼接收端,進(jìn)行雙端預(yù)警聯(lián)動追溯精準(zhǔn)識別涉詐號碼。
7、優(yōu)選的,s100包括:
8、s101,基于通信號碼歷史記錄大數(shù)據(jù),提取通信號碼歷史記錄用戶特征;
9、s102,根據(jù)通信號碼歷史記錄用戶特征,通過通信號碼業(yè)務(wù)場景還原,創(chuàng)建通信號碼歷史還原業(yè)務(wù)場景;
10、s103,根據(jù)通信號碼歷史還原業(yè)務(wù)場景,通過行為模式分析,創(chuàng)建通信號碼歷史行為模式,對通信號碼進(jìn)行初步用戶畫像,獲取通信號碼初步用戶畫像數(shù)據(jù);通信號碼歷史行為模式分析包括:通信號碼歷史通話記錄分析、通信號碼歷史短信記錄和通信號碼歷史網(wǎng)絡(luò)交互數(shù)據(jù)分析。
11、優(yōu)選的,s200包括:
12、s201,根據(jù)通信號碼初步用戶畫像數(shù)據(jù),創(chuàng)建畫像數(shù)據(jù)分析預(yù)測模型;通過畫像數(shù)據(jù)分析預(yù)測模型進(jìn)行畫像數(shù)據(jù)涉詐分析預(yù)測,分析預(yù)測初步用戶畫像數(shù)據(jù)是否具有涉詐風(fēng)險(xiǎn);
13、s202,根據(jù)畫像數(shù)據(jù)分析預(yù)測模型分析預(yù)測初步用戶畫像數(shù)據(jù)輸出結(jié)果,獲取畫像數(shù)據(jù)涉詐分析預(yù)測信息;
14、畫像數(shù)據(jù)分析預(yù)測模型包括:畫像數(shù)據(jù)讀取單元、畫像數(shù)據(jù)處理分析預(yù)測單元和預(yù)測信息輸出單元;畫像數(shù)據(jù)處理分析預(yù)測單元包括:數(shù)據(jù)規(guī)則配置處理子單元、畫像數(shù)據(jù)標(biāo)簽化管理子單元及標(biāo)簽化數(shù)據(jù)分析預(yù)測子單元;通過畫像數(shù)據(jù)讀取單元讀取通信號碼初步用戶畫像數(shù)據(jù)并輸入到畫像數(shù)據(jù)處理分析預(yù)測單元,經(jīng)過畫像數(shù)據(jù)處理分析預(yù)測單元的數(shù)據(jù)規(guī)則配置處理子單元進(jìn)行畫像數(shù)據(jù)轉(zhuǎn)換及處理監(jiān)控,得到配置轉(zhuǎn)換處理監(jiān)控?cái)?shù)據(jù);畫像數(shù)據(jù)標(biāo)簽化管理子單元根據(jù)配置轉(zhuǎn)換處理監(jiān)控?cái)?shù)據(jù)通過數(shù)據(jù)標(biāo)簽化及數(shù)據(jù)目錄關(guān)聯(lián)管理,獲取監(jiān)控標(biāo)簽化關(guān)聯(lián)數(shù)據(jù);標(biāo)簽化數(shù)據(jù)分析預(yù)測子單元對監(jiān)控標(biāo)簽化關(guān)聯(lián)數(shù)據(jù)進(jìn)行分析,分析監(jiān)控標(biāo)簽化關(guān)聯(lián)數(shù)據(jù)與涉詐號碼標(biāo)簽化數(shù)據(jù)的標(biāo)簽關(guān)聯(lián)相似度是否達(dá)到或超過涉詐參照標(biāo)簽關(guān)聯(lián)相似度;當(dāng)標(biāo)簽關(guān)聯(lián)相似度達(dá)到或超過涉詐參照標(biāo)簽關(guān)聯(lián)相似度,預(yù)測為初步用戶畫像數(shù)據(jù)具有涉詐風(fēng)險(xiǎn);預(yù)測信息輸出單元將具有涉詐風(fēng)險(xiǎn)的初步用戶畫像數(shù)據(jù)輸出。
15、優(yōu)選的,s300包括:
16、s301,根據(jù)涉詐敏感信息搜集,通過涉詐敏感信息集成決策樹強(qiáng)化訓(xùn)練創(chuàng)建涉詐敏感信息專家模型;
17、s302,通過涉詐敏感信息專家模型,對畫像數(shù)據(jù)涉詐分析預(yù)測信息進(jìn)行涉詐敏感信息驗(yàn)證;
18、s303,根據(jù)涉詐敏感信息驗(yàn)證,篩選出驗(yàn)證后具有涉詐敏感信息結(jié)果,獲取涉詐敏感信息專家模型信息驗(yàn)證結(jié)果;
19、通過涉詐敏感信息集成決策樹強(qiáng)化創(chuàng)建涉詐敏感信息專家模型,包括:提取涉詐敏感信息的度量特征,標(biāo)注所有度量特征的涉詐敏感屬性;提取涉詐敏感信息中的全局信息,將全局?jǐn)?shù)據(jù)劃分為多個(gè)子集,獲取涉詐敏感信息規(guī)則集合,作為集成決策樹節(jié)點(diǎn)構(gòu)成第一決策路徑,將涉詐敏感信息訓(xùn)練樣本分為第一涉詐敏感信息訓(xùn)練樣本及第二涉詐敏感信息訓(xùn)練樣本;根據(jù)涉詐敏感屬性擴(kuò)展第一決策路徑,獲取第二決策路徑;集成決策樹節(jié)點(diǎn)的第一子節(jié)點(diǎn)及第二子節(jié)點(diǎn)分別添加第一決策規(guī)則和第二決策規(guī)則,第一決策規(guī)則和第二決策規(guī)則進(jìn)行多次復(fù)用;根據(jù)第一決策規(guī)則,第一子節(jié)點(diǎn)分支分為第一涉詐敏感信息訓(xùn)練樣本得分和第一子節(jié)點(diǎn)決策規(guī)則;根據(jù)第二決策規(guī)則,第二子節(jié)點(diǎn)分支分為第二涉詐敏感信息訓(xùn)練樣本得分和第二子節(jié)點(diǎn)決策規(guī)則;第一子節(jié)點(diǎn)決策規(guī)則和第二子節(jié)點(diǎn)決策規(guī)則依次分支,直至達(dá)到集成決策樹葉節(jié)點(diǎn),集成決策樹葉節(jié)點(diǎn)全部為涉詐敏感信息訓(xùn)練樣本得分;通過加權(quán)平均方式計(jì)算最終樣本得分;創(chuàng)建涉詐敏感信息專家模型。
20、優(yōu)選的,s400包括:
21、s401,根據(jù)涉詐敏感信息專家模型信息驗(yàn)證結(jié)果,進(jìn)行涉詐敏感信息涉詐方向智能判定;
22、s402,通過涉詐方向智能判定,進(jìn)行涉詐號碼精準(zhǔn)用戶畫像,精準(zhǔn)識別涉詐號碼;
23、s403,將涉詐號碼精準(zhǔn)用戶畫像發(fā)送到通信號碼監(jiān)管端和通信號碼接收端,進(jìn)行雙端預(yù)警聯(lián)動追溯精準(zhǔn)識別涉詐號碼;
24、將涉詐號碼精準(zhǔn)用戶畫像發(fā)送到通信號碼監(jiān)管端和通信號碼接收端,進(jìn)行涉詐號碼雙端預(yù)警聯(lián)動精準(zhǔn)識別包括:將涉詐號碼精準(zhǔn)用戶畫像發(fā)送到通信號碼監(jiān)管端和通信號碼接收端;在通信號碼接收端,首先發(fā)送涉詐預(yù)警信息,并警示通信號碼接收端其通信方式已被涉詐號碼端獲取,與通信號碼監(jiān)管端進(jìn)行雙端聯(lián)動預(yù)警,追溯通信方式泄露路徑,精準(zhǔn)識別涉詐號碼獲取涉詐敏感信息渠道,進(jìn)行雙端預(yù)警聯(lián)動追溯精準(zhǔn)識別涉詐號碼。
25、本發(fā)明提供了基于用戶畫像的涉詐號碼識別系統(tǒng),包括:
26、大數(shù)據(jù)初步畫像分系統(tǒng),基于通信號碼歷史記錄大數(shù)據(jù),對通信號碼進(jìn)行初步用戶畫像,獲取通信號碼初步用戶畫像數(shù)據(jù);
27、畫像數(shù)據(jù)涉詐分析預(yù)測分系統(tǒng),根據(jù)通信號碼初步用戶畫像數(shù)據(jù),通過畫像數(shù)據(jù)分析預(yù)測模型進(jìn)行畫像數(shù)據(jù)涉詐分析預(yù)測,獲取畫像數(shù)據(jù)涉詐分析預(yù)測信息;
28、涉詐信息專家模型驗(yàn)證分系統(tǒng),根據(jù)畫像數(shù)據(jù)涉詐分析預(yù)測信息,通過涉詐敏感信息專家模型進(jìn)行信息驗(yàn)證,獲取涉詐敏感信息專家模型信息驗(yàn)證結(jié)果;
29、涉詐方向追溯識別分系統(tǒng),根據(jù)涉詐敏感信息專家模型信息驗(yàn)證結(jié)果,通過涉詐方向智能判定,進(jìn)行通信號碼精準(zhǔn)用戶畫像,并發(fā)送到通信號碼監(jiān)管端和通信號碼接收端,進(jìn)行雙端預(yù)警聯(lián)動追溯精準(zhǔn)識別涉詐號碼。
30、優(yōu)選的,大數(shù)據(jù)初步畫像分系統(tǒng)包括:
31、用戶特征提取子系統(tǒng),基于通信號碼歷史記錄大數(shù)據(jù),提取通信號碼歷史記錄用戶特征;
32、號碼業(yè)務(wù)場景還原子系統(tǒng),根據(jù)通信號碼歷史記錄用戶特征,通過通信號碼業(yè)務(wù)場景還原,創(chuàng)建通信號碼歷史還原業(yè)務(wù)場景;
33、行為分析初步畫像子系統(tǒng),根據(jù)通信號碼歷史還原業(yè)務(wù)場景,通過行為模式分析,創(chuàng)建通信號碼歷史行為模式,對通信號碼進(jìn)行初步用戶畫像,獲取通信號碼初步用戶畫像數(shù)據(jù);通信號碼歷史行為模式分析包括:通信號碼歷史通話記錄分析、通信號碼歷史短信記錄和通信號碼歷史網(wǎng)絡(luò)交互數(shù)據(jù)分析。
34、優(yōu)選的,畫像數(shù)據(jù)涉詐分析預(yù)測分系統(tǒng)包括:
35、預(yù)測模型涉詐分析子系統(tǒng),根據(jù)通信號碼初步用戶畫像數(shù)據(jù),創(chuàng)建畫像數(shù)據(jù)分析預(yù)測模型;通過畫像數(shù)據(jù)分析預(yù)測模型進(jìn)行畫像數(shù)據(jù)涉詐分析預(yù)測,分析預(yù)測初步用戶畫像數(shù)據(jù)是否具有涉詐風(fēng)險(xiǎn);
36、涉詐預(yù)測信息輸出子系統(tǒng),根據(jù)畫像數(shù)據(jù)分析預(yù)測模型分析預(yù)測初步用戶畫像數(shù)據(jù)輸出結(jié)果,獲取畫像數(shù)據(jù)涉詐分析預(yù)測信息;
37、畫像數(shù)據(jù)分析預(yù)測模型包括:畫像數(shù)據(jù)讀取單元、畫像數(shù)據(jù)處理分析預(yù)測單元和預(yù)測信息輸出單元;畫像數(shù)據(jù)處理分析預(yù)測單元包括:數(shù)據(jù)規(guī)則配置處理子單元、畫像數(shù)據(jù)標(biāo)簽化管理子單元及標(biāo)簽化數(shù)據(jù)分析預(yù)測子單元;通過畫像數(shù)據(jù)讀取單元讀取通信號碼初步用戶畫像數(shù)據(jù)并輸入到畫像數(shù)據(jù)處理分析預(yù)測單元,經(jīng)過畫像數(shù)據(jù)處理分析預(yù)測單元的數(shù)據(jù)規(guī)則配置處理子單元進(jìn)行畫像數(shù)據(jù)轉(zhuǎn)換及處理監(jiān)控,得到配置轉(zhuǎn)換處理監(jiān)控?cái)?shù)據(jù);畫像數(shù)據(jù)標(biāo)簽化管理子單元根據(jù)配置轉(zhuǎn)換處理監(jiān)控?cái)?shù)據(jù)通過數(shù)據(jù)標(biāo)簽化及數(shù)據(jù)目錄關(guān)聯(lián)管理,獲取監(jiān)控標(biāo)簽化關(guān)聯(lián)數(shù)據(jù);標(biāo)簽化數(shù)據(jù)分析預(yù)測子單元對監(jiān)控標(biāo)簽化關(guān)聯(lián)數(shù)據(jù)進(jìn)行分析,分析監(jiān)控標(biāo)簽化關(guān)聯(lián)數(shù)據(jù)與涉詐號碼標(biāo)簽化數(shù)據(jù)的標(biāo)簽關(guān)聯(lián)相似度是否達(dá)到或超過涉詐參照標(biāo)簽關(guān)聯(lián)相似度;當(dāng)標(biāo)簽關(guān)聯(lián)相似度達(dá)到或超過涉詐參照標(biāo)簽關(guān)聯(lián)相似度,預(yù)測為初步用戶畫像數(shù)據(jù)具有涉詐風(fēng)險(xiǎn);預(yù)測信息輸出單元將具有涉詐風(fēng)險(xiǎn)的初步用戶畫像數(shù)據(jù)輸出。
38、優(yōu)選的,涉詐信息專家模型驗(yàn)證分系統(tǒng)包括:
39、涉詐敏感信息專家模型子系統(tǒng),根據(jù)涉詐敏感信息搜集,通過涉詐敏感信息集成決策樹強(qiáng)化訓(xùn)練創(chuàng)建涉詐敏感信息專家模型;
40、涉詐敏感信息驗(yàn)證子系統(tǒng),通過涉詐敏感信息專家模型,對畫像數(shù)據(jù)涉詐分析預(yù)測信息進(jìn)行涉詐敏感信息驗(yàn)證;
41、信息驗(yàn)證結(jié)果篩選子系統(tǒng),根據(jù)涉詐敏感信息驗(yàn)證,篩選出驗(yàn)證后具有涉詐敏感信息結(jié)果,獲取涉詐敏感信息專家模型信息驗(yàn)證結(jié)果;
42、通過涉詐敏感信息集成決策樹強(qiáng)化創(chuàng)建涉詐敏感信息專家模型,包括:提取涉詐敏感信息的度量特征,標(biāo)注所有度量特征的涉詐敏感屬性;提取涉詐敏感信息中的全局信息,將全局?jǐn)?shù)據(jù)劃分為多個(gè)子集,獲取涉詐敏感信息規(guī)則集合,作為集成決策樹節(jié)點(diǎn)構(gòu)成第一決策路徑,將涉詐敏感信息訓(xùn)練樣本分為第一涉詐敏感信息訓(xùn)練樣本及第二涉詐敏感信息訓(xùn)練樣本;根據(jù)涉詐敏感屬性擴(kuò)展第一決策路徑,獲取第二決策路徑;集成決策樹節(jié)點(diǎn)的第一子節(jié)點(diǎn)及第二子節(jié)點(diǎn)分別添加第一決策規(guī)則和第二決策規(guī)則,第一決策規(guī)則和第二決策規(guī)則進(jìn)行多次復(fù)用;根據(jù)第一決策規(guī)則,第一子節(jié)點(diǎn)分支分為第一涉詐敏感信息訓(xùn)練樣本得分和第一子節(jié)點(diǎn)決策規(guī)則;根據(jù)第二決策規(guī)則,第二子節(jié)點(diǎn)分支分為第二涉詐敏感信息訓(xùn)練樣本得分和第二子節(jié)點(diǎn)決策規(guī)則;第一子節(jié)點(diǎn)決策規(guī)則和第二子節(jié)點(diǎn)決策規(guī)則依次分支,直至達(dá)到集成決策樹葉節(jié)點(diǎn),集成決策樹葉節(jié)點(diǎn)全部為涉詐敏感信息訓(xùn)練樣本得分;通過加權(quán)平均方式計(jì)算最終樣本得分;創(chuàng)建涉詐敏感信息專家模型。
43、優(yōu)選的,涉詐方向追溯識別分系統(tǒng)包括:
44、涉詐方向智能判定子系統(tǒng),根據(jù)涉詐敏感信息專家模型信息驗(yàn)證結(jié)果,進(jìn)行涉詐敏感信息涉詐方向智能判定;
45、涉詐號碼精準(zhǔn)用戶畫像子系統(tǒng),通過涉詐方向智能判定,進(jìn)行涉詐號碼精準(zhǔn)用戶畫像,精準(zhǔn)識別涉詐號碼;
46、雙端預(yù)警追溯識別子系統(tǒng),將涉詐號碼精準(zhǔn)用戶畫像發(fā)送到通信號碼監(jiān)管端和通信號碼接收端,進(jìn)行雙端預(yù)警聯(lián)動追溯精準(zhǔn)識別涉詐號碼;
47、將涉詐號碼精準(zhǔn)用戶畫像發(fā)送到通信號碼監(jiān)管端和通信號碼接收端,進(jìn)行涉詐號碼雙端預(yù)警聯(lián)動精準(zhǔn)識別包括:將涉詐號碼精準(zhǔn)用戶畫像發(fā)送到通信號碼監(jiān)管端和通信號碼接收端;在通信號碼接收端,首先發(fā)送涉詐預(yù)警信息,并警示通信號碼接收端其通信方式已被涉詐號碼端獲取,與通信號碼監(jiān)管端進(jìn)行雙端聯(lián)動預(yù)警,追溯通信方式泄露路徑,精準(zhǔn)識別涉詐號碼獲取涉詐敏感信息渠道,進(jìn)行雙端預(yù)警聯(lián)動追溯精準(zhǔn)識別涉詐號碼。
48、相比現(xiàn)有技術(shù),本發(fā)明至少包括以下有益效果:
49、本發(fā)明提供了基于用戶畫像的涉詐號碼識別方法及系統(tǒng),包括:基于通信號碼歷史記錄大數(shù)據(jù),對通信號碼進(jìn)行初步用戶畫像,獲取通信號碼初步用戶畫像數(shù)據(jù);根據(jù)通信號碼初步用戶畫像數(shù)據(jù),通過畫像數(shù)據(jù)分析預(yù)測模型進(jìn)行畫像數(shù)據(jù)涉詐分析預(yù)測,獲取畫像數(shù)據(jù)涉詐分析預(yù)測信息;根據(jù)畫像數(shù)據(jù)涉詐分析預(yù)測信息,通過涉詐敏感信息專家模型進(jìn)行信息驗(yàn)證,獲取涉詐敏感信息專家模型信息驗(yàn)證結(jié)果;根據(jù)涉詐敏感信息專家模型信息驗(yàn)證結(jié)果,通過涉詐方向智能判定,進(jìn)行通信號碼精準(zhǔn)用戶畫像,并發(fā)送到通信號碼監(jiān)管端和通信號碼接收端,進(jìn)行雙端預(yù)警聯(lián)動追溯精準(zhǔn)識別涉詐號碼;能夠針對嚴(yán)重危害社會環(huán)境的電信詐騙頻繁多發(fā)的特點(diǎn),精準(zhǔn)識別涉詐號碼;能夠獲取通信號碼初步用戶畫像數(shù)據(jù)大范圍獲取涉詐號碼初步用戶畫像,可以進(jìn)行畫像數(shù)據(jù)涉詐分析預(yù)測,針對用戶畫像驗(yàn)證困難的問題可以進(jìn)行涉詐敏感信息專家模型信息驗(yàn)證,顯著降低驗(yàn)證誤差;可以進(jìn)行通信號碼精準(zhǔn)用戶畫像以及預(yù)警聯(lián)動追溯精準(zhǔn)識別涉詐號碼,大幅增加涉詐號碼識別的精準(zhǔn)度,涉詐預(yù)警的及時(shí)性顯著改善,對于涉詐信息渠道根源的及時(shí)追溯使詐騙追溯效率明顯提高。
50、本發(fā)明所述的基于用戶畫像的涉詐號碼識別方法及系統(tǒng),本發(fā)明的其它優(yōu)點(diǎn)、目標(biāo)和特征將部分通過下面的說明體現(xiàn),部分還將通過對本發(fā)明的研究和實(shí)踐而為本領(lǐng)域的技術(shù)人員所理解。