專利名稱:一種基于多維特征向量的關(guān)鍵幀提取算法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計(jì)算機(jī)視覺領(lǐng)域,特別涉及一種基于多維特征向量的關(guān)鍵幀提取算法,及該方法在智能安防中的應(yīng)用。
背景技術(shù):
隨著計(jì)算機(jī)網(wǎng)絡(luò)、數(shù)字化視頻技術(shù)迅速發(fā)展,基于數(shù)字網(wǎng)絡(luò)的視頻監(jiān)控得到廣范的應(yīng)用,但隨之而來(lái)的是,隨著監(jiān)控部防的范圍日益擴(kuò)大,監(jiān)控設(shè)備的數(shù)量也以驚人的數(shù)量增加,面對(duì)數(shù)以萬(wàn)計(jì)的監(jiān)控設(shè)備,如何快速的了解海量監(jiān)控點(diǎn)的視頻主要內(nèi)容成為平安城市等項(xiàng)目進(jìn)一步發(fā)展的最大制約。目前面對(duì)這一制約的一般解決方案為視頻摘要系統(tǒng)、視頻差異化快速播放系統(tǒng)等。但由于這些解決方案一般只能處理監(jiān)控點(diǎn)固定不變的場(chǎng)景,對(duì)于廣范部署球機(jī)的場(chǎng)景,這些解決方案也無(wú)能為力。因此業(yè)界亟待一種能夠?qū)崿F(xiàn)對(duì)變化場(chǎng)景的海量視頻數(shù)據(jù)進(jìn)行快速理解的算法工具,本發(fā)明提出了一種基于多維特征向量的關(guān)鍵幀提取算法,可以較好的針對(duì)運(yùn)動(dòng)球機(jī)的場(chǎng)景的摘要處理算法。
發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)現(xiàn)有可變監(jiān)控場(chǎng)景的視頻監(jiān)視系統(tǒng),存在無(wú)法生成視頻摘要,從而使監(jiān)控人員無(wú)法快速了解海量視頻數(shù)據(jù)基本內(nèi)容的問題,提出一種基于多維特征向量的關(guān)鍵幀提取算法。為了實(shí)現(xiàn)發(fā)明目的,采用的技術(shù)方案如下:基于多維特征向量的關(guān)鍵幀提取算法的基本流程如
圖1所示。首先對(duì)輸入的視頻數(shù)據(jù)進(jìn)行基于灰度直方圖滑動(dòng)窗口的關(guān)鍵幀初檢并輸出檢測(cè)后的備選關(guān)鍵幀序列,然后對(duì)該序列進(jìn)行基于高頻信息檢測(cè)的光照干擾檢測(cè),排除光照干擾幀,并輸出過濾后的備選干擾幀,最后對(duì)備選干擾幀進(jìn)行基于顏色特征的偽聚類關(guān)鍵幀提取并最終輸出關(guān)鍵幀結(jié)果。以下分別具體說明。1、基于灰度直方圖滑動(dòng)窗口的關(guān)鍵幀初檢:首先,對(duì)本專利中用到的灰度圖進(jìn)行定,RGB彩色幀圖像按如下方式轉(zhuǎn)換成灰度圖,令I(lǐng)k為視頻序列的第k幀圖像,Pr(x, y)、Pg (x, y)、Pb(x, y)分別表示Ik在(x, y)像素點(diǎn)處的RGB像素值,Pgray (x, y)為Ik按下式轉(zhuǎn)換后的灰度圖。Pgray= (Pr X 30+PgX 59+Pb X 11+50) /100將圖像轉(zhuǎn)換為灰度圖后,再對(duì)本專利中用到的灰度統(tǒng)計(jì)直方圖做如下定義:若Pgray (X,y)表示灰度圖像中的像素集,則灰度統(tǒng)計(jì)直方圖H(b)表示為:H(b) = nb b = O, I,...255得到幀圖像對(duì)應(yīng)的灰度統(tǒng)計(jì)直方圖后,在基于灰度直方圖滑動(dòng)窗口的關(guān)鍵幀初檢算法中,按下式利用相關(guān)法對(duì)得到的幀間灰度直方圖進(jìn)行對(duì)比。
權(quán)利要求
1.一種基于多維特征向量的關(guān)鍵幀提取算法,其特征在于首先利用基于圖像灰度統(tǒng)計(jì)直方圖特征的快速關(guān)鍵幀提取算法提取備選關(guān)鍵幀;其次,通過基于圖像頻域的方法對(duì)備選關(guān)鍵幀進(jìn)行過濾處理;最后,通過基于偽聚類算法的關(guān)鍵幀復(fù)檢,用以對(duì)運(yùn)動(dòng)場(chǎng)景或大運(yùn)動(dòng)畫面的安防視頻進(jìn)行關(guān)鍵幀索引的建立。
2.根據(jù)權(quán)利要求1所述的算法,其特征在于利用一種基于圖像灰度統(tǒng)計(jì)直方圖的關(guān)鍵幀初檢算法進(jìn)行視頻的關(guān)鍵幀快速篩選,首先,將前后兩幀圖像轉(zhuǎn)換成灰度圖并提取其統(tǒng)計(jì)直方圖;其次,利用卡方分布得出兩個(gè)灰度統(tǒng)計(jì)的相似值,結(jié)合整個(gè)歷史幀之間的相似值,以高斯分布為統(tǒng)計(jì)理論基礎(chǔ),建立基于滑動(dòng)窗口的視頻幀序列差異分布;最后利用基于滑動(dòng)窗口的判定算法,得出視頻序列的備選關(guān)鍵幀序列。
3.根據(jù)權(quán)利要求1所述的算法,其特征在于利用一種基于圖像頻域信息的算法對(duì)備選關(guān)鍵幀進(jìn)行光照和模糊化過濾,為了降低算法的運(yùn)算復(fù)雜性,算法中通過圖像的的梯度統(tǒng)計(jì)信息來(lái)反映圖像的頻域信息;首先,利用Sobel算子作為卷積核,先對(duì)圖像的灰度圖做水平方向的卷積,之后再對(duì)卷積結(jié)果做垂直方向的卷積,從而得到備選關(guān)鍵幀圖像對(duì)應(yīng)的梯度圖;其次,對(duì)得到的梯度圖像進(jìn)行統(tǒng)計(jì)直方圖統(tǒng)計(jì);最后,能得到的一維統(tǒng)計(jì)直方圖進(jìn)行高低頻分量的分析,若高頻分量小于閾值T時(shí),則認(rèn)為該備選關(guān)鍵幀為受干擾圖像,故而將該圖像從備選關(guān)鍵幀圖像中刪除。
4.根據(jù)權(quán)利要求1所述的算法,其特征在于利用一種基于HS彩色統(tǒng)計(jì)直方圖的關(guān)鍵幀復(fù)檢算法進(jìn)行備選關(guān)鍵幀的復(fù)選檢測(cè),首先,將經(jīng)過頻域過濾的備選關(guān)鍵幀轉(zhuǎn)換到HSV色彩空間;第二,對(duì)HSV圖像進(jìn)行基于HS色彩分量的二維統(tǒng)計(jì)直方圖統(tǒng)計(jì);最后,利用基于偽聚類的方法抽取備選關(guān)鍵幀中的最終結(jié)果,輸出關(guān)鍵幀序列。
5.根據(jù)權(quán)利要求2所述的算法,其特征在于利用基于滑動(dòng)窗口的算法進(jìn)行幀間差異性預(yù)計(jì)和歸類,其特點(diǎn)為,第一,待處理的數(shù)據(jù)集為一維數(shù)據(jù)集;第二,該方法基于一定的概率統(tǒng)計(jì)理論基礎(chǔ)根據(jù)已經(jīng)獲取到的數(shù)據(jù)對(duì)數(shù)據(jù)的發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè);第三,根據(jù)已有數(shù)據(jù)的發(fā)展趨勢(shì)來(lái)判定當(dāng)前獲取數(shù)據(jù)是否滿足既定趨勢(shì)。
6.根據(jù)權(quán)利要求4所述的算法,其特征在于利用基于偽聚類的算法進(jìn)行對(duì)備選關(guān)鍵幀的復(fù)檢處理,其特點(diǎn)在于,首先,對(duì)備選關(guān)鍵幀序列進(jìn)行偽聚類運(yùn)算,最終選取每個(gè)聚類的聚類中心為最終關(guān)鍵幀;其次,偽聚類算法的特征選取對(duì)幀間圖像HS顏色空間的統(tǒng)計(jì)直方圖的卡方分布對(duì)比;最后,偽聚類算法的相似性測(cè)度選取基于滑動(dòng)窗口的預(yù)測(cè)統(tǒng)計(jì)方法來(lái)規(guī)定聚類是否收斂,從而得到最終的一個(gè)聚類結(jié)果。
全文摘要
本發(fā)明提供了一種基于多維特征向量的關(guān)鍵幀提取算法及其在智能安防中的應(yīng)用,該方法可以有效的解決球機(jī)等運(yùn)動(dòng)場(chǎng)景的基于內(nèi)容的視頻理解,并能夠根據(jù)分析視頻內(nèi)容的結(jié)果構(gòu)建出視頻的概要關(guān)鍵幀序列,使監(jiān)控人員可以快速的了解運(yùn)動(dòng)場(chǎng)景視頻中的主要內(nèi)容。
文檔編號(hào)H04N5/14GK103118220SQ201210488270
公開日2013年5月22日 申請(qǐng)日期2012年11月16日 優(yōu)先權(quán)日2012年11月16日
發(fā)明者趙剛, 馮琰一, 蔣天耀 申請(qǐng)人:佳都新太科技股份有限公司