本發(fā)明涉及應(yīng)用圖標(biāo),尤其涉及一種應(yīng)用圖標(biāo)的相似性檢測方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著應(yīng)用程序的普及,市面上出現(xiàn)了越來越多的盜版應(yīng)用,用于迷惑用戶獲取利益。為及時(shí)發(fā)現(xiàn)市面上一些盜版的相似應(yīng)用,往往通過尋找相似性軟件來識別是否有出現(xiàn)類似的應(yīng)用,通過提前告知用戶或者進(jìn)行安全攔截來警醒用戶進(jìn)行合理選擇。目前進(jìn)行相似性判斷的方式是通過應(yīng)用名或者圖標(biāo)進(jìn)行相似性檢索,相似性檢索的方式是通過計(jì)算圖標(biāo)之間的海明距離判斷是否相似,如果圖標(biāo)的數(shù)量較多,計(jì)算的過程會(huì)比較復(fù)雜。因此,如何簡單有效地對應(yīng)用圖標(biāo)進(jìn)行相似性檢測,成為一個(gè)亟待解決的問題。
2、上述內(nèi)容僅用于輔助理解本發(fā)明的技術(shù)方案,并不代表承認(rèn)上述內(nèi)容是現(xiàn)有技術(shù)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的主要目的在于提供了一種應(yīng)用圖標(biāo)的相似性檢測方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),旨在解決如何簡單有效地對應(yīng)用圖標(biāo)進(jìn)行相似性檢測的技術(shù)問題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種應(yīng)用圖標(biāo)的相似性檢測方法,所述應(yīng)用圖標(biāo)的相似性檢測方法包括以下步驟:
3、對待檢測應(yīng)用圖標(biāo)的哈希特征值進(jìn)行分段,獲得多段第一特征值;
4、獲取標(biāo)準(zhǔn)應(yīng)用圖標(biāo)的標(biāo)準(zhǔn)哈希特征值對應(yīng)的多段第二特征值;
5、按分段索引方式對所述多段第一特征值和所述多段第二特征值進(jìn)行特征值匹配;
6、根據(jù)匹配結(jié)果對所述待檢測應(yīng)用圖標(biāo)和所述標(biāo)準(zhǔn)應(yīng)用圖標(biāo)進(jìn)行相似性檢測。
7、可選地,所述對待檢測應(yīng)用圖標(biāo)的哈希特征值進(jìn)行分段,獲得多段第一特征值的步驟,具體包括:
8、獲取所述待檢測應(yīng)用圖標(biāo)對應(yīng)的哈希特征值;
9、確定所述哈希特征值對應(yīng)的分段段數(shù);
10、根據(jù)所述分段段數(shù)對所述哈希特征值進(jìn)行分段,獲得多段后的第一特征值。
11、可選地,所述獲取所述待檢測應(yīng)用圖標(biāo)對應(yīng)的哈希特征值的步驟,具體包括:
12、通過預(yù)設(shè)靜態(tài)分析工具確定預(yù)設(shè)數(shù)據(jù)庫中的應(yīng)用圖標(biāo)對應(yīng)的預(yù)設(shè)圖標(biāo)文件集合,所述預(yù)設(shè)數(shù)據(jù)庫中的應(yīng)用圖標(biāo)包括:所述待檢測應(yīng)用圖標(biāo)和標(biāo)準(zhǔn)應(yīng)用圖標(biāo);
13、通過simhash算法確定所述預(yù)設(shè)圖標(biāo)文件集合對應(yīng)的預(yù)設(shè)哈希特征值集合;
14、從所述預(yù)設(shè)哈希特征值集合中選取所述待檢測應(yīng)用圖標(biāo)對應(yīng)的哈希特征值。
15、可選地,所述確定所述哈希特征值對應(yīng)的分段段數(shù)的步驟,具體包括:
16、確定所述預(yù)設(shè)哈希特征值集合中的所有預(yù)設(shè)哈希特征值對應(yīng)的預(yù)設(shè)位數(shù)集合;
17、從所述預(yù)設(shè)位數(shù)集合中選取所述哈希特征值對應(yīng)的位數(shù);
18、根據(jù)所述預(yù)設(shè)位數(shù)集合中的各預(yù)設(shè)位數(shù)和所述位數(shù)確定段落位數(shù);
19、根據(jù)所述段落位數(shù)確定所述哈希特征值對應(yīng)的分段段數(shù)。
20、可選地,所述確定所述哈希特征值對應(yīng)的分段段數(shù)的步驟,具體包括:
21、獲取所述預(yù)設(shè)圖標(biāo)文件集合中的所有預(yù)設(shè)圖標(biāo)文件對應(yīng)的預(yù)設(shè)圖標(biāo)尺寸集合;
22、從所述預(yù)設(shè)圖標(biāo)尺寸集合中選取所述待檢測應(yīng)用圖標(biāo)對應(yīng)的圖標(biāo)尺寸;
23、根據(jù)所述預(yù)設(shè)圖標(biāo)尺寸集合中的各預(yù)設(shè)圖標(biāo)尺寸和所述圖標(biāo)尺寸確定分段尺寸;
24、根據(jù)所述分段尺寸確定所述哈希特征值對應(yīng)的分段段數(shù)。
25、可選地,所述獲取標(biāo)準(zhǔn)應(yīng)用圖標(biāo)的標(biāo)準(zhǔn)哈希特征值對應(yīng)的多段第二特征值的步驟,具體包括:
26、從所述預(yù)設(shè)哈希特征值集合中選取所述標(biāo)準(zhǔn)應(yīng)用圖標(biāo)對應(yīng)的標(biāo)準(zhǔn)哈希特征值;
27、根據(jù)所述分段段數(shù)和所述標(biāo)準(zhǔn)哈希特征值確定標(biāo)準(zhǔn)分段段數(shù);
28、根據(jù)所述標(biāo)準(zhǔn)分段段數(shù)對所述標(biāo)準(zhǔn)哈希特征值進(jìn)行分段,獲得多段第二特征值。
29、可選地,所述按分段索引方式對所述多段第一特征值和所述多段第二特征值進(jìn)行特征值匹配的步驟,具體包括:
30、對所述多段第一特征值分段進(jìn)行存儲(chǔ),并對各段存儲(chǔ)的第一特征值創(chuàng)建索引集合;
31、對所述索引集合中的各索引對應(yīng)的目標(biāo)第一特征值分別與所述多段第二特征值進(jìn)行特征值匹配。
32、可選地,所述對所述索引集合中的各索引對應(yīng)的目標(biāo)第一特征值分別與所述多段第二特征值進(jìn)行特征值匹配的步驟,具體包括:
33、在所述索引集合中的各索引對應(yīng)的目標(biāo)第一特征值和所述多段第二特征值中存在任一相等的特征值時(shí),判定特征值匹配通過;
34、在所述索引集合中的各索引對應(yīng)的目標(biāo)第一特征值和所述多段第二特征值中不存在任一相等的特征值時(shí),判定特征值匹配失敗。
35、可選地,所述根據(jù)匹配結(jié)果對所述待檢測應(yīng)用圖標(biāo)和所述標(biāo)準(zhǔn)應(yīng)用圖標(biāo)進(jìn)行相似性檢測的步驟,具體包括:
36、在匹配結(jié)果為特征值匹配通過時(shí),從所述標(biāo)準(zhǔn)應(yīng)用圖標(biāo)中選取對應(yīng)的目標(biāo)標(biāo)準(zhǔn)應(yīng)用圖標(biāo);
37、確定所述待檢測應(yīng)用圖標(biāo)與所述目標(biāo)標(biāo)準(zhǔn)應(yīng)用圖標(biāo)之間的海明距離集合;
38、根據(jù)所述海明距離集合從所述目標(biāo)標(biāo)準(zhǔn)應(yīng)用圖標(biāo)中選取所述待檢測應(yīng)用圖標(biāo)對應(yīng)的相似應(yīng)用圖標(biāo)。
39、可選地,所述確定所述待檢測應(yīng)用圖標(biāo)與所述目標(biāo)標(biāo)準(zhǔn)應(yīng)用圖標(biāo)之間的海明距離集合的步驟,具體包括:
40、從所述預(yù)設(shè)哈希特征值集合中選取所述目標(biāo)標(biāo)準(zhǔn)應(yīng)用圖標(biāo)對應(yīng)的目標(biāo)標(biāo)準(zhǔn)哈希特征值;
41、根據(jù)所述哈希特征值和所述目標(biāo)標(biāo)準(zhǔn)哈希特征值確定所述待檢測應(yīng)用圖標(biāo)與所述目標(biāo)標(biāo)準(zhǔn)應(yīng)用圖標(biāo)之間的海明距離集合。
42、可選地,所述根據(jù)所述海明距離集合從所述目標(biāo)標(biāo)準(zhǔn)應(yīng)用圖標(biāo)中選取所述待檢測應(yīng)用圖標(biāo)對應(yīng)的相似應(yīng)用圖標(biāo)的步驟,具體包括:
43、確定所述海明距離集合中的最小海明距離,并從所述目標(biāo)標(biāo)準(zhǔn)應(yīng)用圖標(biāo)中選取所述最小海明距離對應(yīng)的目標(biāo)應(yīng)用圖標(biāo);
44、在所述目標(biāo)應(yīng)用圖標(biāo)對應(yīng)的圖標(biāo)個(gè)數(shù)大于預(yù)設(shè)個(gè)數(shù)時(shí),獲取所述目標(biāo)應(yīng)用圖標(biāo)對應(yīng)的目標(biāo)應(yīng)用程序和所述待檢測應(yīng)用圖標(biāo)對應(yīng)的待檢測應(yīng)用程序;
45、根據(jù)所述目標(biāo)應(yīng)用程序和所述待檢測應(yīng)用程序從所述目標(biāo)應(yīng)用圖標(biāo)中選取所述待檢測應(yīng)用圖標(biāo)對應(yīng)的相似應(yīng)用圖標(biāo)。
46、可選地,所述根據(jù)所述目標(biāo)應(yīng)用程序和所述待檢測應(yīng)用程序從所述目標(biāo)應(yīng)用圖標(biāo)中選取所述待檢測應(yīng)用圖標(biāo)對應(yīng)的相似應(yīng)用圖標(biāo)的步驟,具體包括:
47、獲取所述目標(biāo)應(yīng)用程序與用戶之間的歷史交互次數(shù)和所述目標(biāo)應(yīng)用程序?qū)?yīng)的目標(biāo)進(jìn)程;
48、獲取所述待檢測應(yīng)用程序?qū)?yīng)的待檢測進(jìn)程;
49、在所述歷史交互次數(shù)大于預(yù)設(shè)次數(shù)時(shí),對所述目標(biāo)進(jìn)程和所述待檢測進(jìn)程進(jìn)行進(jìn)程匹配;
50、根據(jù)進(jìn)程匹配結(jié)果從所述目標(biāo)應(yīng)用圖標(biāo)中選取所述待檢測應(yīng)用圖標(biāo)對應(yīng)的相似應(yīng)用圖標(biāo)。
51、此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種應(yīng)用圖標(biāo)的相似性檢測裝置,所述應(yīng)用圖標(biāo)的相似性檢測裝置包括:
52、特征值分段模塊,用于對待檢測應(yīng)用圖標(biāo)的哈希特征值進(jìn)行分段,獲得多段第一特征值;
53、所述特征值分段模塊,還用于獲取標(biāo)準(zhǔn)應(yīng)用圖標(biāo)的標(biāo)準(zhǔn)哈希特征值對應(yīng)的多段第二特征值;
54、特征值匹配模塊,用于按分段索引方式對所述多段第一特征值和所述多段第二特征值進(jìn)行特征值匹配;
55、相似性檢測模塊,用于根據(jù)匹配結(jié)果對所述待檢測應(yīng)用圖標(biāo)和所述標(biāo)準(zhǔn)應(yīng)用圖標(biāo)進(jìn)行相似性檢測。
56、可選地,所述特征值分段模塊,還用于獲取所述待檢測應(yīng)用圖標(biāo)對應(yīng)的哈希特征值;確定所述哈希特征值對應(yīng)的分段段數(shù);根據(jù)所述分段段數(shù)對所述哈希特征值進(jìn)行分段,獲得多段第一特征值。
57、可選地,所述特征值分段模塊,還用于通過預(yù)設(shè)靜態(tài)分析工具確定預(yù)設(shè)數(shù)據(jù)庫中的應(yīng)用圖標(biāo)對應(yīng)的預(yù)設(shè)圖標(biāo)文件集合,所述預(yù)設(shè)數(shù)據(jù)庫中的應(yīng)用圖標(biāo)包括:所述待檢測應(yīng)用圖標(biāo)和標(biāo)準(zhǔn)應(yīng)用圖標(biāo);通過simhash算法確定所述預(yù)設(shè)圖標(biāo)文件集合對應(yīng)的預(yù)設(shè)哈希特征值集合;從所述預(yù)設(shè)哈希特征值集合中選取所述待檢測應(yīng)用圖標(biāo)對應(yīng)的哈希特征值。
58、可選地,所述特征值分段模塊,還用于確定所述預(yù)設(shè)哈希特征值集合中的所有預(yù)設(shè)哈希特征值對應(yīng)的預(yù)設(shè)位數(shù)集合;從所述預(yù)設(shè)位數(shù)集合中選取所述哈希特征值對應(yīng)的位數(shù);根據(jù)所述預(yù)設(shè)位數(shù)集合中的各預(yù)設(shè)位數(shù)和所述位數(shù)確定段落位數(shù);根據(jù)所述段落位數(shù)確定所述哈希特征值對應(yīng)的分段段數(shù)。
59、可選地,所述特征值分段模塊,還用于獲取所述預(yù)設(shè)圖標(biāo)文件集合中的所有預(yù)設(shè)圖標(biāo)文件對應(yīng)的預(yù)設(shè)圖標(biāo)尺寸集合;從所述預(yù)設(shè)圖標(biāo)尺寸集合中選取所述待檢測應(yīng)用圖標(biāo)對應(yīng)的圖標(biāo)尺寸;根據(jù)所述預(yù)設(shè)圖標(biāo)尺寸集合中的各預(yù)設(shè)圖標(biāo)尺寸和所述圖標(biāo)尺寸確定分段尺寸;根據(jù)所述分段尺寸確定所述哈希特征值對應(yīng)的分段段數(shù)。
60、可選地,所述特征值分段模塊,還用于從所述預(yù)設(shè)哈希特征值集合中選取所述標(biāo)準(zhǔn)應(yīng)用圖標(biāo)對應(yīng)的標(biāo)準(zhǔn)哈希特征值;根據(jù)所述分段段數(shù)和所述標(biāo)準(zhǔn)哈希特征值確定標(biāo)準(zhǔn)分段段數(shù);根據(jù)所述標(biāo)準(zhǔn)分段段數(shù)對所述標(biāo)準(zhǔn)哈希特征值進(jìn)行分段,獲得多段第二特征值。
61、此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提出一種應(yīng)用圖標(biāo)的相似性檢測設(shè)備,所述應(yīng)用圖標(biāo)的相似性檢測設(shè)備包括:存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的應(yīng)用圖標(biāo)的相似性檢測程序,所述應(yīng)用圖標(biāo)的相似性檢測程序配置為實(shí)現(xiàn)如上文所述的應(yīng)用圖標(biāo)的相似性檢測方法的步驟。
62、此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提出一種存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)上存儲(chǔ)有應(yīng)用圖標(biāo)的相似性檢測程序,所述應(yīng)用圖標(biāo)的相似性檢測程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上文所述的應(yīng)用圖標(biāo)的相似性檢測方法的步驟。
63、本發(fā)明通過對待檢測應(yīng)用圖標(biāo)的哈希特征值進(jìn)行分段,獲得多段第一特征值,然后獲取標(biāo)準(zhǔn)應(yīng)用圖標(biāo)的標(biāo)準(zhǔn)哈希特征值對應(yīng)的多段第二特征值,然后按分段索引方式對多段第一特征值和多段第二特征值進(jìn)行特征值匹配,再根據(jù)匹配結(jié)果對待檢測應(yīng)用圖標(biāo)和標(biāo)準(zhǔn)應(yīng)用圖標(biāo)進(jìn)行相似性檢測。相較于現(xiàn)有的需要計(jì)算待檢測應(yīng)用圖標(biāo)和標(biāo)準(zhǔn)應(yīng)用圖標(biāo)之間的海明距離,本發(fā)明上述方式通過對待檢測應(yīng)用圖標(biāo)的哈希特征值和標(biāo)準(zhǔn)應(yīng)用圖標(biāo)的標(biāo)準(zhǔn)哈希特征值分別進(jìn)行分段,并根據(jù)多段第一特征值和多段第二特征值之間的匹配結(jié)果進(jìn)行相似性檢測,從而簡單有效地對應(yīng)用圖標(biāo)進(jìn)行相似性檢測,提高相似性檢測的效率。