本發(fā)明涉及大數(shù)據(jù)挖掘,具體涉及一種暗網(wǎng)線索與輿情事件關(guān)聯(lián)定位目標(biāo)人物的方法。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,在對人類社會帶來便捷的同時也帶來了許多新的問題,其中大量非法活動通常是在暗網(wǎng)中進(jìn)行的,基于暗網(wǎng)加密性、隱秘性強(qiáng)的特點(diǎn),且參與者通常是匿名的,不易追蹤到真實(shí)的地理位置和使用者的身份;因此目前針對暗網(wǎng)的監(jiān)控分析僅可實(shí)現(xiàn)非法情報線索挖掘,對非法事件的組織者、參與者無法跟蹤和定位。
2、然而基于大數(shù)據(jù)挖掘技術(shù)的輿情監(jiān)控可實(shí)現(xiàn)對特定目標(biāo)賬號的在公開社交平臺上的發(fā)帖等信息實(shí)時監(jiān)測分析,挖掘可能包含姓名、性別、年齡、手機(jī)號、郵箱、教育程度、工作經(jīng)歷、主要言論、社會關(guān)系等信息。因此,有必要將暗網(wǎng)與社交網(wǎng)絡(luò)關(guān)鍵賬號相關(guān)聯(lián),并通過以圖搜圖、人臉識別等技術(shù),結(jié)合在暗網(wǎng)中挖掘的交易信息,實(shí)現(xiàn)多維度刻畫目標(biāo)人物畫像,以維護(hù)網(wǎng)絡(luò)環(huán)境的安全。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種暗網(wǎng)線索與輿情事件關(guān)聯(lián)定位目標(biāo)人物的方法,解決以下技術(shù)問題:
2、如何解決當(dāng)前暗網(wǎng)目標(biāo)線索無法識別定位到對應(yīng)的關(guān)鍵人物的問題;
3、本發(fā)明的目的可以通過以下技術(shù)方案實(shí)現(xiàn):
4、一種暗網(wǎng)線索與輿情事件關(guān)聯(lián)定位目標(biāo)人物的方法,所述方法包括以下步驟:
5、s1、通過暗網(wǎng)目標(biāo)線索關(guān)鍵詞獲取敏感賬號;
6、s2、建立暗網(wǎng)敏感賬號畫像指標(biāo)庫;
7、s3、在輿情事件中挖掘關(guān)鍵人物,對關(guān)鍵人物賬號與暗網(wǎng)敏感賬號進(jìn)行關(guān)聯(lián)性分析;
8、s4、根據(jù)關(guān)聯(lián)性分析刻畫目標(biāo)人物真實(shí)身份畫像。
9、作為進(jìn)一步的技術(shù)方案,獲取敏感賬號的過程包括:
10、s11、建立暗網(wǎng)目標(biāo)線索分類機(jī)制,并根據(jù)分類機(jī)制將各目標(biāo)線索劃分為若干類;
11、s12、為每類目標(biāo)線索配置關(guān)鍵詞庫;
12、s13、根據(jù)目標(biāo)線索關(guān)鍵詞庫,針對暗網(wǎng)不同站點(diǎn)類型,對站點(diǎn)進(jìn)行綜合信息采集,并提取敏感賬號。
13、作為進(jìn)一步的技術(shù)方案,獲取敏感賬號的過程還包括:
14、s14、根據(jù)目標(biāo)線索,通過機(jī)器人賬號模擬人為操作加入群組,收集敏感賬號。
15、作為進(jìn)一步的技術(shù)方案,建立暗網(wǎng)敏感賬號畫像指標(biāo)庫的過程包括:
16、s21、通過md5算法,將敏感賬號進(jìn)行哈希運(yùn)算,進(jìn)行重復(fù)性判斷和去重處理;
17、s22、對敏感賬號進(jìn)行監(jiān)測分析,建立暗網(wǎng)敏感賬號資源庫,根據(jù)暗網(wǎng)敏感賬號的來源目標(biāo)線索種類,對應(yīng)地對暗網(wǎng)敏感賬號進(jìn)行分類;
18、s23、通過持續(xù)監(jiān)測,拓展各個暗網(wǎng)敏感賬號的畫像指標(biāo)。
19、作為進(jìn)一步的技術(shù)方案,所述畫像指標(biāo)指示的內(nèi)容包括對應(yīng)的暗網(wǎng)敏感賬號的個人信息以及歷史言論。
20、作為進(jìn)一步的技術(shù)方案,在輿情事件中挖掘關(guān)鍵人物的過程包括:
21、s31、監(jiān)測各類社交媒體與公開網(wǎng)站,采用數(shù)據(jù)自動聚類算法,發(fā)現(xiàn)輿情事件
22、s32、通過設(shè)置重大輿情事件的關(guān)鍵詞,對發(fā)現(xiàn)的重大輿情事件在各類社交媒體與公開網(wǎng)站上的信息進(jìn)行監(jiān)測;
23、s33、通過關(guān)鍵詞關(guān)聯(lián)檢索獲取輿情事件中的關(guān)鍵人物對應(yīng)的關(guān)鍵人物賬號。
24、作為進(jìn)一步的技術(shù)方案,獲取關(guān)鍵人物賬號的方式包括:
25、計算在輿情事件中社交賬號的互動量,所述互動量為單位時間內(nèi)社交賬號的點(diǎn)贊量、轉(zhuǎn)發(fā)量以及評論量的總和,提取互動量超過預(yù)設(shè)值的社交賬號,并標(biāo)記為關(guān)鍵賬號。
26、作為進(jìn)一步的技術(shù)方案,對關(guān)鍵人物賬號與暗網(wǎng)敏感賬號進(jìn)行關(guān)聯(lián)性分析的過程包括:
27、通過對比關(guān)鍵人物賬號與暗網(wǎng)敏感賬號的賬號名以及賬號跟人信息做初步匹配;
28、通過以圖搜圖、人臉識別技術(shù)進(jìn)行跨平臺社交賬號關(guān)聯(lián),并將關(guān)聯(lián)上的關(guān)鍵人物賬號加入目標(biāo)庫;
29、基于歐氏距離算法對關(guān)鍵人物言論關(guān)鍵詞與暗網(wǎng)每類線索關(guān)鍵詞進(jìn)行相似度計算,計算結(jié)果指示關(guān)鍵人物言論關(guān)鍵詞與每類線索關(guān)鍵詞的相似度,選取相似度超過預(yù)設(shè)標(biāo)準(zhǔn)的一組關(guān)鍵人物言論關(guān)鍵詞。
30、本發(fā)明的有益效果:
31、本發(fā)明通過輿情事件挖掘關(guān)鍵社交賬號,對關(guān)鍵社交賬號進(jìn)行分析,刻畫關(guān)鍵社交賬號畫像,關(guān)聯(lián)真實(shí)目標(biāo)人物;同時聚類輿情事件關(guān)鍵詞,通過相似度計算,選擇相似值最大的一組暗網(wǎng)敏感賬號與輿情事件關(guān)鍵賬號相關(guān)聯(lián),建立并不斷豐富的目標(biāo)庫,并通過大數(shù)據(jù)分析挖掘技術(shù),挖掘價值信息,并通過以圖搜圖、人臉識別等技術(shù),多維度刻畫目標(biāo)人物真實(shí)身份畫像。
1.一種暗網(wǎng)線索與輿情事件關(guān)聯(lián)定位目標(biāo)人物的方法,其特征在于,所述方法包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種暗網(wǎng)線索與輿情事件關(guān)聯(lián)定位目標(biāo)人物的方法,其特征在于,獲取敏感賬號的過程包括:
3.根據(jù)權(quán)利要求2所述的一種暗網(wǎng)線索與輿情事件關(guān)聯(lián)定位目標(biāo)人物的方法,其特征在于,獲取敏感賬號的過程還包括:
4.根據(jù)權(quán)利要求3所述的一種暗網(wǎng)線索與輿情事件關(guān)聯(lián)定位目標(biāo)人物的方法,其特征在于,建立暗網(wǎng)敏感賬號畫像指標(biāo)庫的過程包括:
5.根據(jù)權(quán)利要求4所述的一種暗網(wǎng)線索與輿情事件關(guān)聯(lián)定位目標(biāo)人物的方法,其特征在于,所述畫像指標(biāo)指示的內(nèi)容包括對應(yīng)的暗網(wǎng)敏感賬號的個人信息以及歷史言論。
6.根據(jù)權(quán)利要求5所述的一種暗網(wǎng)線索與輿情事件關(guān)聯(lián)定位目標(biāo)人物的方法,其特征在于,在輿情事件中挖掘關(guān)鍵人物的過程包括:
7.根據(jù)權(quán)利要求6所述的一種暗網(wǎng)線索與輿情事件關(guān)聯(lián)定位目標(biāo)人物的方法,其特征在于,獲取關(guān)鍵人物賬號的方式包括:
8.根據(jù)權(quán)利要求7所述的一種暗網(wǎng)線索與輿情事件關(guān)聯(lián)定位目標(biāo)人物的方法,其特征在于,對關(guān)鍵人物賬號與暗網(wǎng)敏感賬號進(jìn)行關(guān)聯(lián)性分析的過程包括: