專利名稱:一種用于音頻監(jiān)控系統(tǒng)中的音頻特征參數(shù)的提取方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種新的多^某體信息及其提取方法,確切地說,涉及一種用于 音頻監(jiān)控系統(tǒng)中的音頻特征參數(shù)的提取方法,屬于多媒體信息的音頻監(jiān)控系統(tǒng) 中的音頻信號分析及其應(yīng)用的信息安全技術(shù)領(lǐng)域。
背景技術(shù):
隨著人民群眾安全意識的提高,監(jiān)控系統(tǒng)越來越受到人們的重視,并被廣 泛地應(yīng)用于銀行、商場、學(xué)校、辦公大樓、以及家居安全的防范系統(tǒng)中。另夕卜, 多媒體技術(shù)的不斷發(fā)展,使得視、音頻信息在人們的工作、文體、娛樂和曰常 生活中起著日益重要的作用。例如,視頻監(jiān)控系統(tǒng)已經(jīng)廣泛應(yīng)用于當(dāng)前許多公 共場合的安全系統(tǒng)中,該系統(tǒng)通過前端攝像系統(tǒng)對設(shè)定的區(qū)域進(jìn)行監(jiān)控,并將 其采集到的視頻信號傳送到監(jiān)控中心,由監(jiān)控中心的服務(wù)器自動進(jìn)行實時分析 而發(fā)現(xiàn)異常事件,或者由人員監(jiān)控發(fā)現(xiàn)異常事件并立即進(jìn)行處理。然而,視頻 監(jiān)控系統(tǒng)也有很多不足和局限之處。首先,攝像機(jī)很容易受到光線照明的影響,
在光照等條件發(fā)生變化時很容易出現(xiàn)誤判;尤其是辦公樓熄燈以后,攝像機(jī)通 常就無法正常工作,而保持正常照明又會造成能源浪費。另外,對于某些特殊 事件,如在公共場所發(fā)出尖叫或異常聲響等,音頻信號的檢測效果要明顯優(yōu)于 視頻信號。這是因為在音頻監(jiān)控系統(tǒng)中,人們通常不需要準(zhǔn)確判斷聲音的類別。 例如,在辦公樓內(nèi),不需要取區(qū)分槍聲和玻璃破碎聲,只要能夠確定這是在特 定場景下不應(yīng)該發(fā)出的異常聲音即可。因此,目前在國內(nèi)外都廣泛開展了針對 音頻異常事件的監(jiān)控及檢測技術(shù)的研究。
現(xiàn)在,有些科技人員利用隱馬爾科夫模型對語音、樂音等基本音頻事件進(jìn) 行建模,并根據(jù)最大似然值對輸入的音頻信號進(jìn)行分類。然而,在音頻監(jiān)控系 統(tǒng)中,人們最關(guān)心的是事件的"異常性",而不是事件的種類。例如,在安靜的辦公樓內(nèi),只要檢測到尖叫聲或槍聲都是異常事件的征兆,而不需要對這兩種 不同的聲響進(jìn)行區(qū)分。
有些研發(fā)人員針對不同的應(yīng)用場景展開探討和設(shè)計。例如,針對辦公樓的 特定工作環(huán)境,對其中的音頻能量、過零率等低層音頻特征參數(shù)進(jìn)行統(tǒng)計和分 析,并根據(jù)統(tǒng)計結(jié)果設(shè)定不同時間段內(nèi)的門限值。 一旦這些音頻特征參數(shù)超出 相應(yīng)的門限時,就認(rèn)為發(fā)生了異常事件。然而,如果只使用音頻能量、過零率 等時域音頻信號特征參數(shù)只能檢測到少數(shù)的異常事件,不能滿足實際應(yīng)用需求。
還有部分科技人員對正常事件中的例如語音、腳步聲等的音頻能量、過零 率等特征參數(shù)進(jìn)行總結(jié)和分析后,再實時采集這些音頻信號,并將其與相關(guān)的 這些特征參數(shù)進(jìn)行實時對比,當(dāng)^f企測到的音頻信號與正常事件的特征參數(shù)的相 似度小于設(shè)定值時,就判定為異常事件。然而,由于采集到的各種特征參數(shù)之 間具有很大的重疊性(例如語音和樂音的過零率基本無法區(qū)分出來),于是在 復(fù)雜環(huán)境下很難做到準(zhǔn)確的檢測。
所以,如何利用音頻特征參數(shù)來監(jiān)控異常事件的發(fā)生與否,以及如何提取 相關(guān)的音頻特征參數(shù)仍然是業(yè)內(nèi)科技人員關(guān)注的熱點課題。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的是^t是供一種用于音頻監(jiān)控系統(tǒng)中的音頻特征參數(shù)
的提取方法,以便較好地解決傳統(tǒng)音頻監(jiān)控方法在選取音頻特征參數(shù)上的缺陷; 本發(fā)明首創(chuàng)并提取的音頻特征參數(shù)是音頻短段時頻差,它的特點是將時域和頻 域的音頻特征參數(shù)相互結(jié)合為一體,既能發(fā)揮其各自長處,又可在一定程度上 規(guī)避各自缺點,從而能夠有效地應(yīng)對各種不同類型的背景噪聲,對某個設(shè)定時 段的音頻中可能出現(xiàn)的異常事件及時作出正確判斷,為適時采取告警等其它各 種安全技術(shù)措施奠定基礎(chǔ)。
為了達(dá)到上述目的,本發(fā)明提供了 一種用于音頻監(jiān)控系統(tǒng)中的音頻特征參 數(shù)的提取方法,其特征在于,所述方法包括下述操作步驟
(1 )按照設(shè)定的短時間的時長對音頻采樣信號序列進(jìn)行分幀處理,將該音頻采樣信號序列劃分為音頻數(shù)據(jù)幀序列,其中每個短時間段為 一個音頻數(shù)據(jù)幀; (2 )分別對所述音頻數(shù)據(jù)幀序列中的每個音頻數(shù)據(jù)幀實時提取該幀的短時
能量、短時過零率和短時信息熵三個基本音頻特征參數(shù);
(3 )對音頻數(shù)據(jù)幀序列進(jìn)行分段處理,將該音頻幀序列劃分為音頻短段序 列;并在上述三個音頻特征參數(shù)的基礎(chǔ)上,計算并提取綜合每個音頻短段內(nèi)的 所有音頻數(shù)據(jù)幀的時域特征和頻域特征、并充分考慮其當(dāng)前時刻與前一時刻之 間差異的音頻特征參數(shù),即音頻短段時頻差,用于音頻監(jiān)控系統(tǒng),及時發(fā)現(xiàn)音 頻異常事件。
所述步驟(1 )中的設(shè)定的短時間的時長范圍是30ms - 50ms。 所述音頻數(shù)據(jù)幀的短時能量是反映該音頻數(shù)據(jù)幀在單位時間內(nèi)的時域強(qiáng)度 特征參數(shù),每個音頻數(shù)據(jù)幀的短時能量是該幀內(nèi)所有音頻采樣值的平方和,即
第〖幀的短時能量是£, = |;&2,式中,自然數(shù)/是音頻數(shù)據(jù)幀的序號,自
然數(shù)w是第/個音頻數(shù)據(jù)幀中的音頻采樣值的序號,其最大值是見&是第" 個采樣的取樣值;
所述音頻數(shù)據(jù)幀的短時過零率是在某種程度上反映該音頻數(shù)據(jù)幀中的音頻 信號的時域頻率特征參數(shù),第/幀的短時過零率是在該/個音頻數(shù)據(jù)幀中的音頻
信號穿過零值、即坐標(biāo)橫軸的次數(shù)Z,=|f>gn(&)-Sgn(&—,)|;式中,sgn() 為符號函數(shù),音頻采樣值&為正數(shù)的符號函數(shù)是1,音頻采樣值&為負(fù)數(shù)和0 的符號函數(shù)都是-1,即sgn(&)=《二,::;
所述信息熵是頻域的重要音頻參數(shù),用于反應(yīng)音頻信號所傳達(dá)的信息量 的大??;所述短時信息熵是每個音頻數(shù)據(jù)幀的信息熵。 所述短時信息熵的計算方法如下
(21 )利用傅里葉變換FFT對每個音頻數(shù)據(jù)幀的信號進(jìn)行由時域向頻域的 轉(zhuǎn)換,分別得到設(shè)定的各個頻率的頻譜能量;
(22)分別計算每個音頻數(shù)據(jù)幀中所述各個頻率的出現(xiàn)概率,即第y個頻率《的出現(xiàn)概率P,的計算公式為^ — fsOO ,式中,是第J個頻率力
的頻譜能量,自然數(shù)c是該音頻數(shù)據(jù)幀中設(shè)定的各頻率的序號,其最大值為0; (23)分別計算每個音頻數(shù)據(jù)幀中音頻信號的短時信息熵,即第/幀的短
時信息熵的計算公式為A 二三P,xl。g巧,式中,自然數(shù))是該第/個音頻
數(shù)據(jù)幀中計算短時信息熵過程中所選取的各頻率的序號,其最大值是x 。
所述步驟(21)中,在對音頻數(shù)據(jù)幀的信號進(jìn)行由時域向頻域的轉(zhuǎn)換處理
時,設(shè)定的各個頻率是OHZ、 100HZ、 200HZ、 300 HZ、......、至5000HZ。
所述步驟(3)進(jìn)一步包括下列操作步驟
(31) 對音頻幀序列進(jìn)行分段處理按照設(shè)定短時間段的時長所包括的音 頻數(shù)據(jù)幀的數(shù)量對所述音頻數(shù)據(jù)幀序列進(jìn)行分段,其中每個設(shè)定時長中的多個 音頻數(shù)據(jù)幀組成一個音頻短段;
(32) 分別計算每個音頻短段中的所有音頻數(shù)據(jù)幀的短時能量、短時過 零率和短時信息熵的平均值,并分別定義為該音頻短段的短段能量
& =溫&'、短段過零率"=和短段短時信息熵仏=f>m ;其中,
自然數(shù)i是音頻短段的序號,自然數(shù)m是第ir個音頻短段中的音頻數(shù)據(jù)幀 的序號,其最大值是7^;
(33 )分別計算每個音頻短段的音頻短段時頻差,即第A個音頻短段的 音頻短段時頻差〈WoW - rF、的計算公式為
〈WoW-77^— ,)x(Z廣A-,)x(//4-/A—,),并設(shè)置其中第 一個音
頻^i^殳,即當(dāng)1=1時,= = //" = 0 。
所述步驟(31)中,設(shè)定短時間段的時長所包括的音頻數(shù)據(jù)幀是50幀。 本發(fā)明的重要創(chuàng)新點是提出 一種適用于音頻監(jiān)控系統(tǒng)的新的音頻特征參數(shù)
——音頻短段時頻差,該參數(shù)的特點是同時將時域音頻特征參數(shù)(短時能量和短時過零率)和頻域的音頻特征參數(shù)(短時信息熵)兼容在一起,既能夠發(fā)揮 其各自長處,又可在一定程度上分別規(guī)避其缺點,從而能夠有效地應(yīng)對各種不 同類型的背景噪聲。另外,現(xiàn)有的音頻參數(shù)大都只著重于衡量音頻信號在某個 特定時刻所呈現(xiàn)的特性,而本發(fā)明的音頻短段時頻差的另 一特點是在提取過程 中充分考慮了前一時刻與當(dāng)前時刻的音頻特征的差異或區(qū)別,能夠更好地發(fā)現(xiàn) 音頻信號的突變點'有效區(qū)分"正常"音頻信號與"異常"音頻信號,從而對 不同時段的音頻信號中可能出現(xiàn)的異常事件及時作出正確判斷,為適時采取告 警等安全技術(shù)措施奠定基礎(chǔ)。
再者,本發(fā)明提取音頻短段時頻差的方法操作步驟簡單、容易,信號處理 所需要的計算量也非常簡單、時延4艮小,能夠應(yīng)用于實時監(jiān)控系統(tǒng)中。因此, 本發(fā)明具有很好的推廣應(yīng)用前景。
圖1是本發(fā)明一種用于音頻監(jiān)控系統(tǒng)中的音頻特征參數(shù)的提取方法操作步
驟流程圖。
具體實施例方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖和實施例的 試驗情況對本發(fā)明作進(jìn)一 步的詳細(xì)描述。
參見圖1,介紹本發(fā)明一種用于音頻監(jiān)控系統(tǒng)中的音頻特征參數(shù)的提取方
法的具體操作步驟
步驟1、按照設(shè)定的短時間的時長(例如30ms - 50ms )對音頻采樣信號序 列進(jìn)行分幀處理,將該音頻采樣信號序列劃分為音頻數(shù)據(jù)幀序列,其中每個短 時間段為一個音頻數(shù)據(jù)幀。分幀操作后,原始音頻采樣信號序列就表示為一個 音頻數(shù)據(jù)幀序列。
步驟2、分別對該音頻數(shù)據(jù)幀序列中的每個音頻數(shù)據(jù)幀實時提取該幀的短 時能量、短時過零率和短時信息熵三個基本音頻特征參數(shù)。其中
9音頻數(shù)據(jù)幀的短時能量是反映該音頻數(shù)據(jù)幀在單位時間內(nèi)的時域強(qiáng)度特征 參數(shù),每個音頻數(shù)據(jù)幀的短時能量定義為該幀內(nèi)所有音頻采樣值的平方和,例
如,第,'幀的短時能量是£,= f&2 ,式中,自然數(shù)/是音頻數(shù)據(jù)幀的序號,
自然數(shù)n是第/個音頻數(shù)據(jù)幀中的音頻采樣值的序號,其最大值是見&是第 "個采樣的取樣值。
音頻數(shù)據(jù)幀的短時過零率是在某種程度上反映該音頻數(shù)據(jù)幀中的音頻信號 的時域頻率特征參數(shù),第/幀的短時過零率是在該Z'個音頻數(shù)據(jù)幀中的音頻信號
穿過坐標(biāo)橫軸(即零值點)的次數(shù),即Z,二會tlsgn(&)-sgn(V,)|;式中,sgn()
為符號函數(shù),音頻采樣值&為正數(shù)的符號函數(shù)是1,音頻采樣值&為負(fù)數(shù)和0
的符號函數(shù)都是-1,即sgn(s")=:::。
眾所周知,音頻信號的感知過程與人類聽覺系統(tǒng)具有頻譜分析功能是緊 密相關(guān)的。因此,對音頻信號進(jìn)行頻譜分析,是認(rèn)識音頻信號和處理音頻信 號的重要方法。音頻信號作為一種典型的非平穩(wěn)信號,它的非平穩(wěn)性是由發(fā) 音器官的物理運動過程的不平穩(wěn)性而產(chǎn)生的,但是,由此可假定其頻域信號 也是短時平穩(wěn)的。信息熵是頻域的重要音頻參數(shù),用于反應(yīng)音頻信號所傳達(dá)的信息量的大
小。信息熵在語音編解碼中經(jīng)常被使用,J丄.Shen首次將該參數(shù)應(yīng)用于語音 端點檢測技術(shù)中。本發(fā)明方法也要對每個音頻數(shù)據(jù)幀都計算其信息熵,即短 時信息熵。該短時信息熵的計算方法如下
(A) 利用傅里葉變換(FFT)對每個音頻數(shù)據(jù)幀的信號進(jìn)行由時域向頻域 的轉(zhuǎn)換,分別得到設(shè)定的各個頻率的頻語能量。通常,在該音頻信號轉(zhuǎn)換過程
中,i殳定的各個頻率是OHZ、 IOOHZ、 200HZ、 300 HZ........至5000HZ的頻譜。
(B) 分別計算每個音頻數(shù)據(jù)幀中上述各個頻率的出現(xiàn)概率,即按照下述=</》
公式計算第)個頻率/,的出現(xiàn)概率P,為^一f sa),式中,s")是第/個
頻率《的頻譜能量,自然數(shù)c是該音頻數(shù)據(jù)幀中設(shè)定的各頻率的序號,其最大 值為^。
(C)分別計算每個音頻數(shù)據(jù)幀中音頻信號的短時信息熵,即按照下述公
式計算第/幀的短時信息熵H"A ^!]^xlog巧,式中,自然數(shù)y'是該第/
j二l
個音頻數(shù)據(jù)幀中計算短時信息熵過程中所選取的各頻率的序號,其最大值是X。
步驟3、對音頻數(shù)據(jù)幀序列進(jìn)行分段處理,將該音頻幀序列劃分為音頻短段 序列;并在上述三個音頻特征參數(shù)的基礎(chǔ)上,計算并提取綜合每個音頻短段內(nèi) 的所有音頻數(shù)據(jù)幀的時域特征和頻域特征、并充分考慮其當(dāng)前時刻與前一時刻 之間差異的音頻特征參數(shù),即音頻短段時頻差,記做short-TF,用于音頻監(jiān)控 系統(tǒng),及時發(fā)現(xiàn)音頻異常事件。該步驟包括下列操作內(nèi)容
(1 )對音頻幀序列進(jìn)行分段按照設(shè)定短時間段的時長所包括的音頻 數(shù)據(jù)幀的數(shù)量(通常設(shè)定短時間段的時長包括50幀)對所述音頻數(shù)據(jù)幀序 列進(jìn)行分段,其中每個設(shè)定時長中的多個音頻數(shù)據(jù)幀組成一個音頻短段。
(2) 分別計算每個音頻短段中的所有音頻數(shù)據(jù)幀的短時能量、短時過
零率和短時信息熵的平均值,并分別定義為
- M - 、M、
該音頻短段的短段能量丑* = Z)£,m ,短段過零率Z^ = ,短
m = 1 m = 1
_ M
段短時信息熵5* = I] Hm ;式中,自然數(shù)A是音頻短段的序號,自然數(shù)
m是第i個音頻短段中的音頻數(shù)據(jù)幀的序號,其最大值是Af。
(3) 分別計算每個音頻短段的音頻短段時頻差,即第A個音頻短段的 音頻短段時頻差〈^oW-770A的計算公式為
〈涵or卜77^ 仏—,)x(Za-Za—,)x(^4-,并設(shè)置其中第一個音頻短段,即當(dāng)hl時,A—, = Z", =/fh' = 0 。這里得到的各個音頻短段的音 頻短段時頻差〈s/zoW -7F、就可以直接用于音頻監(jiān)控系統(tǒng)。
本發(fā)明方法已經(jīng)作了實施試驗,計算機(jī)仿真的實施例的試驗是成功的,實 現(xiàn)了發(fā)明目的。
權(quán)利要求
1、一種用于音頻監(jiān)控系統(tǒng)中的音頻特征參數(shù)的提取方法,其特征在于,所述方法包括下述操作步驟(1)按照設(shè)定的短時間的時長對音頻采樣信號序列進(jìn)行分幀處理,將該音頻采樣信號序列劃分為音頻數(shù)據(jù)幀序列,其中每個短時間段為一個音頻數(shù)據(jù)幀;(2)分別對所述音頻數(shù)據(jù)幀序列中的每個音頻數(shù)據(jù)幀實時提取該幀的短時能量、短時過零率和短時信息熵三個基本音頻特征參數(shù);(3)對音頻數(shù)據(jù)幀序列進(jìn)行分段處理,將該音頻幀序列劃分為音頻短段序列;并在上述三個音頻特征參數(shù)的基礎(chǔ)上,計算并提取綜合每個音頻短段內(nèi)的所有音頻數(shù)據(jù)幀的時域特征和頻域特征、并充分考慮其當(dāng)前時刻與前一時刻之間差異的音頻特征參數(shù),即音頻短段時頻差,用于音頻監(jiān)控系統(tǒng),及時發(fā)現(xiàn)音頻異常事件。
2、 根據(jù)權(quán)利要求1所述的方法,其特征在于所述步驟(l)中的設(shè)定的 短時間的時長范圍是30ms - 50ms。
3、 根據(jù)權(quán)利要求1所述的方法,其特征在于所述音頻數(shù)據(jù)幀的短時能量 是反映該音頻數(shù)據(jù)幀在單位時間內(nèi)的時域強(qiáng)度特征參數(shù),每個音頻數(shù)據(jù)幀的短 時能量是該幀內(nèi)所有音頻采樣值的平方和,即第幀的短時能量是五,=^人2,式中,自然數(shù)/是音頻數(shù)據(jù)幀的序號,自然數(shù)"是第/個音頻數(shù) 二1據(jù)幀中的音頻采樣值的序號,其最大值是見&是第"個采樣的取樣值;所述音頻數(shù)據(jù)幀的短時過零率是在某種程度上反映該音頻數(shù)據(jù)幀中的音頻 信號的時域頻率特征參數(shù),第/幀的短時過零率是在該/個音頻數(shù)據(jù)幀中的音頻信號穿過零值、即坐標(biāo)橫軸的次數(shù)Z,=4^>gn(S )-sgn(Ul;式中,sgn() 為符號函數(shù),音頻采樣值&為正數(shù)的符號函數(shù)是1,音頻采樣值&為負(fù)數(shù)和o 的符號函數(shù)都是-1,即sgn(S") =所述信息熵是頻域的重要音頻參數(shù),用于反應(yīng)音頻信號所傳達(dá)的信息量的大??;所述短時信息熵是每個音頻數(shù)據(jù)幀的信息熵。
4、 根據(jù)權(quán)利要求3所述的方法,其特征在于所述短時信息熵的計算 方法力o下(21 )利用傅里葉變換FFT對每個音頻數(shù)據(jù)幀的信號進(jìn)行由時域向頻域的 轉(zhuǎn)換,分別得到設(shè)定的各個頻率的頻語能量;(22) 分別計算每個音頻數(shù)據(jù)幀中所述各個頻率的出現(xiàn)概率,即第7'個頻二 s(力)率,的出現(xiàn)概率P,的計算公式為巧—f s(/e),式中,s(力)是第y'個頻率力的頻譜能量,自然數(shù)c是該音頻數(shù)據(jù)幀中設(shè)定的各頻率的序號,其最大值為g;(23) 分別計算每個音頻數(shù)據(jù)幀中音頻信號的短時信息熵,即第/幀的短時信息熵的計算公式為A = xlog巧,式中,自然數(shù)y是該第/個音頻■7 = 1數(shù)據(jù)幀中計算短時信息熵過程中所選取的各頻率的序號,其最大值是x 。
5、 根據(jù)權(quán)利要求4所述的方法,其特征在于所述步驟(21)中,在對音 頻數(shù)據(jù)幀的信號進(jìn)行由時域向頻域的轉(zhuǎn)換處理時,設(shè)定的各個頻率是0HZ、 IOOHZ、 200HZ、 300 HZ........至5000HZ。
6、 根據(jù)權(quán)利要求1所述的方法,其特征在于所述步驟(3)進(jìn)一步包 括下列操作步驟(31) 對音頻幀序列進(jìn)行分段處理按照設(shè)定短時間段的時長所包括的音 頻數(shù)據(jù)幀的數(shù)量對所述音頻數(shù)據(jù)幀序列進(jìn)行分段,其中每個設(shè)定時長中的多個 音頻數(shù)據(jù)幀組成一個音頻短段;(32) 分別計算每個音頻短段中的所有音頻數(shù)據(jù)幀的短時能量、短時過 零率和短時信息熵的平均值,并分別定義為該音頻短段的短段能量& = 、短段過零率^ = 和短段短時信息熵^ = E "m ;其中,m = 1 fTi 二 1 m = 1自然數(shù)l是音頻短段的序號,自然數(shù)m是第ir個音頻短段中的音頻數(shù)據(jù)幀 的序號,其最大值是Af;(33)分別計算每個音頻短段的音頻短段時頻差,即第A個音頻短段的 音頻短段時頻差〈W - TF〉 *的計算公式為〈WoW-r尸、二(&-&一)x(Za-i)x(/^-/^—,),并設(shè)置其中第一個音頻4豆,殳,即當(dāng)hl時,iw =Z", =^", =0 。
7、根據(jù)權(quán)利要求6所述的方法,其特征在于所述步驟(31)中,設(shè) 定短時間段的時長所包括的音頻數(shù)據(jù)幀是50幀。
全文摘要
一種用于音頻監(jiān)控系統(tǒng)中的音頻特征參數(shù)的提取方法,操作步驟如下(1)按照設(shè)定的短時間的時長對音頻采樣信號序列進(jìn)行分幀而將其劃分為音頻數(shù)據(jù)幀序列;(2)分別對該音頻數(shù)據(jù)幀序列中的每個音頻數(shù)據(jù)幀實時提取該幀的短時能量、短時過零率和短時信息熵;(3)對音頻數(shù)據(jù)幀序列進(jìn)行分段而將其劃分為音頻短段序列;并在上述參數(shù)基礎(chǔ)上,提取綜合每個音頻短段內(nèi)的所有音頻數(shù)據(jù)幀的時域和頻域特征、并充分考慮其前后兩個時刻之間音頻差異的特征參數(shù)音頻短段時頻差,用于音頻監(jiān)控系統(tǒng)。本發(fā)明能克服現(xiàn)有技術(shù)缺陷,有效應(yīng)對各種不同類型的背景噪聲,及時發(fā)現(xiàn)音頻信號中可能出現(xiàn)的異常事件,正確作出判斷,為適時采取告警等其它各種安全技術(shù)措施奠定基礎(chǔ)。
文檔編號G10L15/00GK101494049SQ20091007944
公開日2009年7月29日 申請日期2009年3月11日 優(yōu)先權(quán)日2009年3月11日
發(fā)明者祺 李, 馬華東, 千 黃 申請人:北京郵電大學(xué)