本發(fā)明涉及視頻流量分析技術(shù),具體涉及一種基于多示例學(xué)習(xí)的隱蔽攝像頭發(fā)現(xiàn)方法及系統(tǒng)。
背景技術(shù):
1、對隱蔽攝像頭的主動檢測是用戶預(yù)防隱私泄漏的的重要手段。目前的檢測手段之一主要通過感知和分析攝像頭設(shè)備的發(fā)出的特殊物理信號來發(fā)現(xiàn)設(shè)備,如無線電、紅外線、聲波等。還有一類方法是通過分析攝像頭的運(yùn)行對環(huán)境因素的影響來側(cè)面識別設(shè)備。
2、從無線信號角度來說,已有檢測隱藏?cái)z像頭的主流方法依賴于射頻接收器,該接收器感測特定頻率范圍內(nèi)的接收功率是否高于特定閾值。然而,由于此類探測器的工作原理是感測周圍的射頻信號,它們很容易被手機(jī)、收音機(jī)、智能電視和其他智能設(shè)備等合法的射頻設(shè)備觸發(fā),從而限制了這些探測器的實(shí)用性。此外,還出現(xiàn)了一種單純基于網(wǎng)絡(luò)流量統(tǒng)計(jì)來檢測物聯(lián)網(wǎng)設(shè)備是否存在的替代方法。然而,這些方法僅確定設(shè)備的存在,而沒有關(guān)于設(shè)備信息、位置或設(shè)備是否實(shí)際上正在監(jiān)視用戶的語義信息。而且如果所處網(wǎng)絡(luò)環(huán)境內(nèi)有視頻直播、視頻通話、視頻會議等服務(wù)運(yùn)行,此類單純的網(wǎng)絡(luò)流量統(tǒng)計(jì)方法會有很高的誤報(bào)率,對于用戶的實(shí)際使用存在很大影響。類似的,還有一類方法,將可信攝像機(jī)的wifi流量模式與網(wǎng)絡(luò)上其他隱藏?cái)z像機(jī)的wifi流量模式相關(guān)聯(lián),以檢測它們是否同時(shí)觀察同一空間。但是,這些特定于相機(jī)的方法無法跨模式推廣,對于實(shí)際應(yīng)用而言,還需要使用者隨身攜帶一個(gè)攝像頭,對于用戶來說極為不便。
3、例如專利cn113038375a公開一種隱蔽攝像頭感知、定位方法及系統(tǒng),該技術(shù)方案先需要判斷目的地址與本機(jī)是否匹配,再需要將探測設(shè)備連接入攝像頭所在wifi,而實(shí)際場景可能無法確定隱藏?cái)z像頭的wifi。另外,該技術(shù)方案攝像頭感知方法中沒有區(qū)分?jǐn)z像頭流量與其他視頻流量特征,如視頻通話、視頻點(diǎn)播碼,還有其需要調(diào)用手機(jī)運(yùn)動軌跡,但手機(jī)的運(yùn)動感知對于小范圍環(huán)境的誤差較大,難以準(zhǔn)確獲取用戶移動距離。
技術(shù)實(shí)現(xiàn)思路
1、發(fā)明目的:本發(fā)明的目的在于解決現(xiàn)有技術(shù)中存在的不足,提供一種基于多示例學(xué)習(xí)的隱蔽攝像頭發(fā)現(xiàn)方法及系統(tǒng)。
2、技術(shù)方案:本發(fā)明的一種基于多示例學(xué)習(xí)的隱蔽攝像頭發(fā)現(xiàn)方法,包括以下步驟:
3、步驟1、嗅探設(shè)備開啟混淆模式,使用空口抓包方法對環(huán)境內(nèi)的所有wifi信號進(jìn)行嗅探,并對2.4g頻段下所有的頻道進(jìn)行掃描,抓取一定時(shí)間段內(nèi)的流量,并從抓取到的流量報(bào)文中提取視頻流特征向量;
4、步驟2、基于決策樹構(gòu)建的視頻流識別模型m1,將視頻流特征向量輸入視頻流識別模型m1,通過視頻流識別模型m1識別出環(huán)境內(nèi)包含視頻流的wifi報(bào)文,獲取對應(yīng)的源mac地址集合cs1,并將源mac地址集合cs1中的mac地址標(biāo)記為可能的隱蔽攝像頭設(shè)備;
5、步驟3、將源mac地址集合cs1中每個(gè)mac地址對應(yīng)的實(shí)時(shí)報(bào)文作為輸入,使用滑動窗口方法,以5秒為一個(gè)窗口,提取報(bào)文的特征向量,并組合成多示例的特征向量序列vseq,再通過基于多示例的攝像頭流量發(fā)現(xiàn)模型m2,識別出該mac地址的上行流量有無突發(fā)視頻流量;
6、步驟4、用戶通過人為移動的方式觸發(fā)突發(fā)視頻流量,系統(tǒng)獲取用戶移動的開始和結(jié)束時(shí)間,并同時(shí)對比該時(shí)間區(qū)間內(nèi)攝像頭流量發(fā)現(xiàn)模型m2的輸出結(jié)果,來判斷當(dāng)前區(qū)域有無隱蔽攝像頭正在拍攝,如果確定有隱蔽攝像頭正在拍攝,則輸出隱蔽攝像頭數(shù)量以及每個(gè)隱蔽攝像頭的mac地址,得到隱蔽攝像頭的mac地址集合cs2。
7、進(jìn)一步地,所述步驟1中提取視頻流特征向量時(shí),基于攝像頭的wifi流量特點(diǎn)以5秒作為采集時(shí)間窗口,將收集的數(shù)據(jù)劃分為多個(gè)序列,并針對每個(gè)序列中的每個(gè)mac地址提取視頻流量特征,具體包括以下視頻流量特征:
8、send_num特征,是指某mac地址在5秒內(nèi)發(fā)送報(bào)文的總數(shù)量,表示該設(shè)備發(fā)送報(bào)文的頻繁程度;
9、recv_num特征,是指mac地址在5秒內(nèi)接收報(bào)文的總數(shù)量,表示該設(shè)備接收報(bào)文的頻繁程度;
10、data_type特征,是指統(tǒng)計(jì)該mac地址在5秒內(nèi)發(fā)送的所有報(bào)文的幀類型并取平均值,表示該設(shè)備發(fā)送報(bào)文中對不同數(shù)據(jù)類型的傾向;
11、data_subtype特征,是指統(tǒng)計(jì)該mac地址在5秒內(nèi)發(fā)送的所有報(bào)文的幀子類型并取平均值,表示該設(shè)備發(fā)送報(bào)文的細(xì)粒度數(shù)據(jù)類型,包括是否為qos報(bào)文;
12、send_length_mean特征,是指該mac地址在5秒內(nèi)發(fā)送的所有報(bào)文的平均長度,表示該設(shè)備每次發(fā)送數(shù)據(jù)包含的信息量大??;
13、send_length_var特征,是指該mac地址在5秒內(nèi)發(fā)送的所有報(bào)文的長度方差,表示該設(shè)備發(fā)送數(shù)據(jù)的變化幅度;
14、recv_length_mean特征,是指該mac地址在5秒內(nèi)接收的所有報(bào)文的平均長度,表示該設(shè)備收到數(shù)據(jù)的信息量大?。?/p>
15、recv_length_var特征,是指該mac地址在5秒內(nèi)接收的所有報(bào)文的長度方差,表示該設(shè)備收到數(shù)據(jù)的變化幅度。
16、進(jìn)一步地,所述步驟2根據(jù)提取到的每個(gè)mac地址對應(yīng)的報(bào)文特征,通過視頻流識別模型m1識別出包含視頻流信息的報(bào)文,并將該類報(bào)文的源mac地址初步認(rèn)定為攝像頭地址,即得到疑似攝像頭的mac地址集合cs1;所述視頻流識別模型m1的構(gòu)建方法為:
17、步驟a、構(gòu)建訓(xùn)練集,即采集攝像頭與非攝像頭流量,并基于已知mac地址及實(shí)際設(shè)備類型對其所屬類別進(jìn)行標(biāo)記;
18、步驟b、訓(xùn)練分類模型,即將訓(xùn)練集導(dǎo)入已初始化的決策樹分類模型中,并基于模型預(yù)測結(jié)果與實(shí)際結(jié)果之間的偏差計(jì)算信息增益,進(jìn)而對決策樹模型進(jìn)行優(yōu)化,最終構(gòu)建最優(yōu)的決策樹分類模型;
19、步驟c、優(yōu)化模型,即對步驟b所得最優(yōu)的決策樹分類模型進(jìn)行后剪枝優(yōu)化,以確保其訓(xùn)練結(jié)果不會出現(xiàn)過擬合等情況。
20、進(jìn)一步地,所述步驟3中源mac地址集合cs1中各個(gè)mac地址代表發(fā)送視頻數(shù)據(jù)的設(shè)備,將無線嗅探到的報(bào)文根據(jù)mac地址分類,分別對每個(gè)mac地址的5s內(nèi)的報(bào)文提取特征向量v,每次提取10s-20s的報(bào)文(具體時(shí)間根據(jù)用戶交互操作),設(shè)置不同的重疊度,可以得到每個(gè)mac地址對應(yīng)的不同長度的特征向量序列vseq,再把特征向量序列vseq作為攝像頭流量發(fā)現(xiàn)模型m2的輸入,輸出結(jié)果表示最近10-20s內(nèi)的mac地址對應(yīng)的報(bào)文里有無突發(fā)視頻流量。
21、進(jìn)一步地,基于多示例的攝像頭流量發(fā)現(xiàn)模型m2的構(gòu)建方法為:
22、步驟a、采集訓(xùn)練數(shù)據(jù),將全過程中無移動行為的攝像頭流量作為負(fù)示例包數(shù)據(jù),將過程中存在移動行為的攝像頭流量作為正示例包,具體方法為:
23、首先,在一個(gè)確保無人的環(huán)境使用無線流量嗅探方法采集攝像頭的靜態(tài)畫面數(shù)據(jù),在此過程中,收集到的全部流量均不包含移動流量特征,因此可將其用于負(fù)示例包數(shù)據(jù)的生成;隨后,通過在攝像頭監(jiān)控范圍內(nèi)外保持移動狀態(tài),不斷出入攝像頭畫面的方法采集攝像頭的動態(tài)畫面數(shù)據(jù),在此過程中,收集到的流量同時(shí)包含有代表移動與靜止的正負(fù)示例;基于多示例學(xué)習(xí)的思想,取一段較長的時(shí)間序列用于生成正示例包,以確保該段序列內(nèi)除了存在不確定數(shù)量的負(fù)示例外,一定存在部分正示例數(shù)據(jù),因此可以在多示例學(xué)習(xí)場景下被標(biāo)記為正示例包;
24、步驟b、設(shè)計(jì)模型架構(gòu)
25、基于輸入的無線流量數(shù)據(jù)構(gòu)建多示例包,后續(xù)的分類網(wǎng)絡(luò)由三個(gè)全連接層、一個(gè)池化層和一個(gè)激活層組成;全連接層提取示例級別的特征表示向量,隨后基于池化層對整個(gè)示例包級別的特征表示進(jìn)行學(xué)習(xí),激活層基于獲得的示例包級別的表示向量計(jì)算分類結(jié)果,由此實(shí)現(xiàn)隱蔽攝像頭定位的包分類問題;本發(fā)明中全連接層與池化層的目的是學(xué)習(xí)一個(gè)表示整體示例包的特征表示向量,并最終由激活層進(jìn)行分類結(jié)果計(jì)算,該模型實(shí)是一個(gè)遵循嵌入空間范式的深度多示例學(xué)習(xí)模型;
26、通過下述公式對模型進(jìn)行描述:
27、
28、其中,代表第l層提取的特征向量,i為示例包編號,j為其內(nèi)的示例編號,yi代表第i個(gè)示例包的分類結(jié)果,l為模型的最大層數(shù),hl為模型的第l層全連接層,ml為模型最后的計(jì)算層,包含一個(gè)mil池化層和最終的激活層。
29、本發(fā)明還公開一種多示例學(xué)習(xí)的隱蔽攝像頭發(fā)現(xiàn)方法的系統(tǒng),包括無線嗅探模塊、mac地址過濾模塊、突發(fā)視頻流分析模塊、對比判斷模塊;
30、無線嗅探模塊開啟混雜模式,對區(qū)域內(nèi)的wifi信號進(jìn)行空口抓包,為保證盡可能發(fā)現(xiàn)所有可能的隱蔽攝像頭,需要對2.4g頻段下所有頻道進(jìn)行跳頻采集;
31、mac地址過濾模塊先對嗅探到的報(bào)文提取特征向量,使用基于決策樹方法的視頻流識別模型m1,對嗅探到的wifi報(bào)文進(jìn)行識別,得到發(fā)送視頻流的設(shè)備mac地址集合cs1;
32、突發(fā)視頻流分析模塊將初步過濾得到的mac地址集合cs1作為依據(jù),將每個(gè)包含mac源地址的報(bào)文分類,提取多示例特征向量,使用攝像頭流量發(fā)現(xiàn)模型,判斷最近一段時(shí)間內(nèi)是否出現(xiàn)突發(fā)視頻流;
33、序列比對模塊將用戶交互得到的人體移動時(shí)間段與該時(shí)間段內(nèi)某mac源地址的報(bào)文是否出現(xiàn)突發(fā)視頻流的結(jié)果進(jìn)行對比判斷,可以得出判斷為隱蔽攝像頭的設(shè)備mac地址,最終得到區(qū)域內(nèi)的隱蔽攝像頭數(shù)量及對應(yīng)mac地址。
34、有益效果:本發(fā)明將多示例學(xué)習(xí)模型用于隱蔽攝像頭發(fā)現(xiàn),通過引入人體移動導(dǎo)致突發(fā)視頻流量包含多示例特征,提高隱蔽攝像頭發(fā)現(xiàn)的準(zhǔn)確性。廣泛的實(shí)驗(yàn)證明了本方法的有效性,且在實(shí)際物理環(huán)境進(jìn)行測試,針對四類品牌多臺設(shè)備,采集100條樣本,發(fā)現(xiàn)準(zhǔn)確率平均為95%,可以得出本發(fā)明提出的方法具有較好性能、較高準(zhǔn)確率的結(jié)論。