音頻嘯叫檢測(cè)方法、使用該方法的視頻監(jiān)控方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及監(jiān)控領(lǐng)域,尤其涉及音頻嘯叫檢測(cè)方法、使用該方法的視頻監(jiān)控方法 及系統(tǒng)。
【背景技術(shù)】
[0002] 隨著社會(huì)安全的迫切需求以及平安城市的大力建設(shè),視頻監(jiān)控系統(tǒng)得到了飛速發(fā) 展,監(jiān)控?cái)z像機(jī)也得到了越來(lái)越廣泛的應(yīng)用。傳統(tǒng)的攝像機(jī)在完成了數(shù)字化和網(wǎng)絡(luò)化的轉(zhuǎn) 變后,正朝著智能化的方向發(fā)展。視頻分析技術(shù)由此孕育而生,然而視頻分析無(wú)法檢測(cè)到攝 像機(jī)視野外的異常行為,若異常行為不在監(jiān)控范圍內(nèi),則無(wú)法檢測(cè)到。因此,單純使用視頻 分析檢測(cè)有很大的局限性。
[0003] 聲音向四面八方傳播,音頻嘯叫檢測(cè)技術(shù)通過(guò)采集環(huán)境中的聲音信號(hào),可以檢測(cè) 異常的尖峰信號(hào),檢測(cè)的范圍不受限于攝像機(jī)的視野。因此將音頻嘯叫檢測(cè)與攝像機(jī)已有 的視頻分析功能相結(jié)合,在聲音和行為上對(duì)異常行為進(jìn)行雙重辨識(shí),既可以在很大程度上 提高監(jiān)控的可靠性,又可以擴(kuò)大監(jiān)控范圍,達(dá)到更加有效的監(jiān)控效果。
[0004] 然而,現(xiàn)有的攝像機(jī)主要是通過(guò)視頻分析,檢測(cè)異常行為,并沒(méi)有檢測(cè)環(huán)境中的異 常聲音信號(hào)的功能。另外,在某些安防系統(tǒng)中,有一種音頻異常檢測(cè)系統(tǒng),但它是一個(gè)獨(dú)立 的模塊,沒(méi)有對(duì)視頻實(shí)時(shí)監(jiān)控的功能。在監(jiān)控行業(yè)中一般由攝像機(jī)視頻監(jiān)控系統(tǒng)實(shí)現(xiàn)對(duì)視 頻的監(jiān)控,音頻異常檢測(cè)系統(tǒng)實(shí)現(xiàn)對(duì)音頻的監(jiān)控。這種音視頻檢測(cè)的分離需要更多的設(shè)備、 更復(fù)雜的安裝和維護(hù),需要更多的人力、時(shí)間和費(fèi)用,造成了資源的浪費(fèi)。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明所要解決的技術(shù)問(wèn)題在于,通過(guò)發(fā)明音頻嘯叫檢測(cè)方法、使用該方法的視 頻監(jiān)控方法及系統(tǒng),將音頻嘯叫檢測(cè)集成到攝像機(jī)視頻監(jiān)控系統(tǒng)中,通過(guò)攝像機(jī)同時(shí)對(duì)周 圍環(huán)境中的視頻與聲音信號(hào)進(jìn)行檢測(cè),達(dá)到更有效的監(jiān)控效果,提高攝像機(jī)監(jiān)控的可靠性, 并且節(jié)省人力與物力成本。
[0006] 本發(fā)明是這樣實(shí)現(xiàn)的,一種音頻嘯叫檢測(cè)方法,包括以下步驟:
[0007] S1、獲取每幀聲音信號(hào)的能量均值A(chǔ)x,并根據(jù)能量均值4計(jì)算該幀的能量特征值 Dx;
[0008] S2、緩存連續(xù)η幀聲音信號(hào)的能量特征值Dxm~D ,找出最大值D xmaj^為尖峰 信號(hào)值,并計(jì)算除尖峰信號(hào)值以外的其它能量特征值的均值Dxavg;
[0009] S3、計(jì)算尖峰信號(hào)值Dxmaj^ D ^的偏移值d alOTaffset;
[0010] S4、將偏移值dala"affsrt與預(yù)設(shè)的報(bào)警閾值d th進(jìn)行比較,若所述偏移值d ala"affsrt大 于報(bào)警閾值dth,則判定所述尖峰信號(hào)為異常信號(hào),否則,未檢測(cè)出異常信號(hào)。
[0011] 其中,S2中緩存連續(xù)η幀聲音信號(hào)的方法為:
[0012]若為首次緩存,則緩存連續(xù)η幀聲音信號(hào)的能量特征值DXM~D χ[η_1];
[0013] 若非首次緩存,則去除上一次緩存數(shù)據(jù)中的首個(gè)聲音信號(hào)的能量特征值Dxm,將 上一次緩存數(shù)據(jù)中的Dx[1]~D Mlril作為本次緩存數(shù)據(jù)中的D x[(l]~D x[n_2],并在本次緩存數(shù)據(jù) 中加入新的能量特征值Dxm,得到本次緩存的能量特征值Dxm~D ,所述新的能量特征 值Dxflrf為上一次緩存數(shù)據(jù)中的能量特征值D 對(duì)應(yīng)的聲音信號(hào)的下一幀聲音信號(hào)的能 量特征值。
[0014] 一種視頻監(jiān)控方法,采用上述的音頻嘯叫檢測(cè)方法進(jìn)行音頻檢測(cè),包括以下內(nèi) 容:
[0015] 1)實(shí)時(shí)采集視頻數(shù)據(jù);找出視頻數(shù)據(jù)中的異常行為,根據(jù)所述異常行為生成異常 行為特征數(shù)據(jù),所述異常行為特征數(shù)據(jù)包含異常行為發(fā)生時(shí)間;
[0016] 2)實(shí)時(shí)采集音頻數(shù)據(jù);找出音頻數(shù)據(jù)中的異常音頻,根據(jù)所述異常音頻生成異常 音頻特征數(shù)據(jù),所述異常音頻特征數(shù)據(jù)包含異常音頻發(fā)生時(shí)間;
[0017] 3)判斷異常行為發(fā)生時(shí)間與異常音頻發(fā)生時(shí)間是否重疊;若不重疊,則分別對(duì)異 常行為和異常音頻進(jìn)行普通報(bào)警;若重疊,則進(jìn)行緊急報(bào)警。
[0018] 所述異常行為特征數(shù)據(jù)包括異常行為發(fā)生時(shí)間和異常行為發(fā)生區(qū)域;所述異常音 頻特征數(shù)據(jù)包括異常音頻發(fā)生時(shí)間和異常音頻能量值。所述視頻數(shù)據(jù)和所述音頻數(shù)據(jù)均帶 有時(shí)間戳。
[0019] 一種視頻監(jiān)控系統(tǒng),采用上述視頻監(jiān)控方法,包括位于后端的系統(tǒng)管理平臺(tái)和集 成于攝像機(jī)之中的音頻采集模塊、音頻嘯叫檢測(cè)模塊、圖像采集模塊、圖像處理模塊、碼流 傳輸模塊和攝像機(jī)報(bào)警模塊,其中,
[0020] 所述音頻采集模塊由內(nèi)置于攝像機(jī)的拾音器和音頻采集芯片組成,用于實(shí)時(shí)采集 音頻數(shù)據(jù),為音頻數(shù)據(jù)打時(shí)間戳,生成帶有時(shí)間戳的音頻流,并將音頻流傳輸至音頻嘯叫檢 測(cè)模塊和碼流傳輸模塊;
[0021] 所述音頻嘯叫檢測(cè)模塊對(duì)音頻流進(jìn)行嘯叫檢測(cè),找出音頻流中的異常音頻,根據(jù) 所述異常音頻生成異常音頻特征數(shù)據(jù),并將所述異常音頻特征數(shù)據(jù)傳輸至攝像機(jī)報(bào)警模 塊,所述異常音頻特征數(shù)據(jù)包含異常音頻發(fā)生時(shí)間;
[0022] 所述圖像采集模塊用于實(shí)時(shí)采集視頻數(shù)據(jù),為視頻數(shù)據(jù)打時(shí)間戳,生成帶有時(shí)間 戳的視頻流,并將視頻流傳輸至圖像處理模塊和碼流傳輸模塊;
[0023] 所述圖像處理模塊用于對(duì)視頻流進(jìn)行視頻分析,找出視頻流中的異常行為,根據(jù) 所述異常行為生成異常行為特征數(shù)據(jù),并將異常行為特征數(shù)據(jù)傳輸至攝像機(jī)報(bào)警模塊,所 述異常行為特征數(shù)據(jù)包含異常行為發(fā)生時(shí)間;
[0024] 攝像機(jī)報(bào)警模塊用于判斷異常行為發(fā)生時(shí)間與異常音頻發(fā)生時(shí)間是否重疊;若不 重疊,則分別對(duì)異常行為和異常音頻進(jìn)行普通報(bào)警;若重疊,則進(jìn)行緊急報(bào)警。所述攝像機(jī) 報(bào)警模塊播放報(bào)警音樂(lè)并生成報(bào)警信息,將所述報(bào)警信息傳輸至系統(tǒng)管理平臺(tái),所述報(bào)警 信息包括報(bào)警類別、異常行為特征數(shù)據(jù)和/或異常音頻特征數(shù)據(jù)
[0025] 碼流傳輸模塊將接收的視頻流與音頻流傳輸至系統(tǒng)管理平臺(tái)。
[0026] 系統(tǒng)管理平臺(tái)用于實(shí)時(shí)展示所述視頻流、以文件形式存儲(chǔ)所述音頻流和顯示所述 報(bào)警信息;允許用戶對(duì)視頻監(jiān)控過(guò)程的相關(guān)參數(shù)進(jìn)行設(shè)置和對(duì)視頻監(jiān)控系統(tǒng)進(jìn)行管理。
[0027] 進(jìn)一步地,所述音頻嘯叫檢測(cè)模塊輸出的異常音頻特征數(shù)據(jù)包括異常信號(hào)發(fā)生時(shí) 間和異常信號(hào)能量值;所述圖像處理模塊輸出的異常行為特征數(shù)據(jù)包括異常行為發(fā)生時(shí)間 和異常行為發(fā)生區(qū)域。
[0028] 進(jìn)一步地,音頻嘯叫檢測(cè)的報(bào)警閾值dth可以預(yù)先根據(jù)環(huán)境和安防要求進(jìn)行設(shè)定, 默認(rèn)有11個(gè)不同的閾值。
[0029] 進(jìn)一步地,所述拾音器可以根據(jù)需求選擇外置拾音器,攝像機(jī)有可與外置拾音器 通訊的接口。
[0030] 進(jìn)一步地,所述音頻嘯叫檢測(cè)模塊和圖像處理模塊只有檢測(cè)到異常,才將檢測(cè)結(jié) 果傳輸給攝像機(jī)報(bào)警模塊。
[0031] 實(shí)施本發(fā)明,具有如下有益效果:
[0032] 本發(fā)明提供了音頻嘯叫檢測(cè)