專利名稱:一種視頻拷貝的檢測方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻檢測領(lǐng)域,特別是涉及一種視頻拷貝的檢測方法和系統(tǒng)。
技術(shù)背景數(shù)字化技術(shù)極大地方便了視頻信息的存儲(chǔ)、傳輸和復(fù)制,使得數(shù)字視頻內(nèi) 容的數(shù)量飛速增長。而在實(shí)際應(yīng)用中受到網(wǎng)絡(luò)傳輸帶寬、視頻質(zhì)量要求等條件 的限制,相同的視頻內(nèi)容經(jīng)常被編碼為不同的格式,以適應(yīng)不同的需求。一般地,稱這種在內(nèi)容上與原視頻相同,而在格式上發(fā)生改變的視頻為視 頻拷貝,或者拷貝視頻。檢測拷貝視頻在視覺信息處理中有著重要的實(shí)際用途首先視頻拷貝檢測 在視頻信息檢索和對(duì)搜索結(jié)果進(jìn)行過濾、排序方面具有重要意義;其次,在媒 體追蹤方面,視頻拷貝檢測可以用來自動(dòng)地監(jiān)控特定內(nèi)容視頻的播出狀況;此 外,在數(shù)字視頻版權(quán)保護(hù)方面,相對(duì)于傳統(tǒng)的數(shù)字水印技術(shù)而言,由于具有無 需在媒體中加入附加信息,特征提取可在媒體發(fā)布之后進(jìn)行等良好的特性,拷 貝檢測也開始受到關(guān)注。要檢測出經(jīng)過格式變化后的拷貝視頻,檢測方法必須滿足兩個(gè)要求,即一 方面要對(duì)因格式轉(zhuǎn)變而產(chǎn)生的視頻數(shù)據(jù)變化魯棒,另一方面又要對(duì)因視頻內(nèi)容 變化產(chǎn)生的視頻數(shù)據(jù)變化敏感。為此,研究人員提出了多種視頻拷貝檢測方法,但由于視頻格式和內(nèi)容的 多樣性,如何選取有效的特征,準(zhǔn)確地檢測視頻拷貝依然是一個(gè)未解決的問題。發(fā)明內(nèi)容本發(fā)明的目的在于提供一種視頻拷貝的檢測方法和系統(tǒng),其減小視頻拷貝 檢測的搜索空間,有效提高了檢測效率。為實(shí)現(xiàn)本發(fā)明目的而提供的一種視頻拷貝的檢測方法,包括下列步驟 步驟A,將査詢視頻和被檢測視頻轉(zhuǎn)化為統(tǒng)一格式的數(shù)字視頻;對(duì)所述査
詢視頻和被檢測視頻進(jìn)行視頻結(jié)構(gòu)分析,分割視頻中的鏡頭,提取關(guān)鍵幀;步驟B,對(duì)被檢測視頻的關(guān)鍵幀建立索引,利用查詢視頻的關(guān)鍵幀在索引中進(jìn)行視頻拷貝的初歩查找,得到與査詢視頻的關(guān)鍵幀具有相似內(nèi)容的被檢測視頻,并將這些被檢測視頻作為下一步匹配的備選視頻,-步驟C,計(jì)算查詢視頻的關(guān)鍵幀和備選視頻的關(guān)鍵幀序列之間的相似度,對(duì)關(guān)鍵幀序列進(jìn)行匹配,確認(rèn)視頻之間的相似度,相似度高的視頻作為查詢視頻的拷貝視頻源。所述歩驟A中,所述提取關(guān)鍵幀,包括下列步驟-.步驟A1,計(jì)算視頻中各幀的HSI值;步驟A2,生成并統(tǒng)計(jì)整個(gè)視頻的各幀HSI值的直方圖,估算得到視頻信 息熵;步驟A3,確定較佳的關(guān)鍵幀幀數(shù)。 所述步驟A3之后,還包括下列步驟步驟A4,根據(jù)較佳的關(guān)鍵幀數(shù),用自適應(yīng)無監(jiān)督聚類方法的聚類中心作為K-均值聚類的初始中心,對(duì)視頻中各幀進(jìn)行K-均值聚類。所述歩驟B中,對(duì)被檢測視頻的關(guān)鍵幀的特征建立索引,包括下列步驟 歩驟B1 ,對(duì)提取的被檢測視頻的關(guān)鍵幀的SIFT特征進(jìn)行主成分分析降維; 步驟B2,對(duì)降維后的被檢測視頻關(guān)鍵幀的特征采用仗*樹結(jié)構(gòu)建立索引。 所述步驟C中,計(jì)算査詢視頻的關(guān)鍵幀和備選視頻的關(guān)鍵幀序列之間的相似度,對(duì)關(guān)鍵幀序列進(jìn)行匹配,包括下列步驟步驟Cl,將一個(gè)關(guān)鍵幀作為時(shí)間序列上一時(shí)間點(diǎn)上的取值,則關(guān)鍵幀序列可視為時(shí)間序列,即隨時(shí)間變化的一組值,將査詢視頻的關(guān)鍵幀序列和備選視頻的關(guān)鍵幀序列分別視為兩個(gè)關(guān)鍵幀時(shí)間序列 ,步驟C2,按特征對(duì)時(shí)間序列進(jìn)行動(dòng)態(tài)時(shí)間規(guī)整相似度計(jì)算,對(duì)關(guān)鍵幀序列進(jìn)行匹配。為實(shí)現(xiàn)本發(fā)明目的還提供一種視頻拷貝的檢測系統(tǒng),包括分析提取模塊, 索引模塊,檢測模塊,其中.-所述分析提取模塊,用于將查詢視頻和被檢測視頻轉(zhuǎn)化為統(tǒng)一格式的數(shù)字 視頻;對(duì)所述查詢視頻和被檢測視頻進(jìn)行視頻結(jié)構(gòu)分析,分割視頻中的鏡頭, 提取關(guān)鍵幀;
所述索引模塊,用于對(duì)被檢測視頻的關(guān)鍵幀建立索引,利用查詢視頻的關(guān) 鍵幀在索引中進(jìn)行視頻拷貝的初步查找,得到與査詢視頻的關(guān)鍵幀具有相似內(nèi) 容的被檢測視頻的關(guān)鍵幀以及該被檢測視頻的視頻號(hào),并將這些被檢測視頻作 為下一步匹配的備選視頻;檢測模塊,用于計(jì)算查詢視頻的關(guān)鍵幀和備選視頻的關(guān)鍵幀序列之間的相 似度,對(duì)關(guān)鍵幀序列進(jìn)行匹配,確認(rèn)視頻之間的相似度,相似度高的視頻作為 查詢視頻的拷貝視頻。所述提取關(guān)鍵幀,包括計(jì)算視頻中各幀的HSI值;生成并統(tǒng)計(jì)整個(gè)視頻的各幀HSI值的直方圖,估算得到視頻信息熵; 確定較佳的關(guān)鍵幀幀數(shù)。根據(jù)較佳的關(guān)鍵幀數(shù),用自適應(yīng)無監(jiān)督聚類方法的聚類中心作為K-均值 聚類的初始中心,對(duì)視頻中各幀進(jìn)行K-均值聚類。所述對(duì)被檢測視頻的關(guān)鍵幀的特征建立索引,包括.-對(duì)提取的被檢測視頻的關(guān)鍵幀的SIFT特征進(jìn)行主成分分析降維;對(duì)降維后的被檢測視頻關(guān)鍵幀的特征采用11*樹結(jié)構(gòu)建立索引。 所述計(jì)算查詢視頻的關(guān)鍵幀和備選視頻的關(guān)鍵幀序列之間的相似度,對(duì)關(guān)鍵幀序列進(jìn)行匹配,是指將一個(gè)關(guān)鍵幀作為時(shí)間序列上一時(shí)間點(diǎn)上的取值,則關(guān)鍵幀序列可視為 時(shí)間序列,即隨時(shí)間變化的一組值,將査詢視頻的關(guān)鍵幀序列和備選視頻的關(guān) 鍵幀序列分別視為兩個(gè)關(guān)鍵幀時(shí)間序列 ,按特征對(duì)時(shí)間序列進(jìn)行動(dòng)態(tài)時(shí)間規(guī)整相似度計(jì)算,對(duì)關(guān)鍵幀序列進(jìn)行匹配。本發(fā)明的有效效果是本發(fā)明的視頻拷貝的檢測方法和系統(tǒng),對(duì)視頻進(jìn)行 關(guān)鍵幀提取,以此作為分析的基礎(chǔ),提高了效率和處理速率;對(duì)關(guān)鍵幀提取 SIFT特征,該特征對(duì)視頻拷貝過程中對(duì)視頻信號(hào)帶來的噪聲比較魯棒,從而 在進(jìn)行關(guān)鍵幀序列匹配時(shí)不受噪聲影響。在進(jìn)行關(guān)鍵幀匹配時(shí)采用時(shí)間序列匹 配中的DTW方法,能有效克服關(guān)鍵幀位置不完全對(duì)應(yīng)而帶來的序列匹配問題。
圖1是本發(fā)明視頻拷貝的檢測方法流程圖;圖2是本發(fā)明視頻拷貝的檢測系統(tǒng)結(jié)構(gòu)示意圖。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí) 施例,對(duì)本發(fā)明的一種視頻拷貝的檢測方法和系統(tǒng)進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng) 理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。本發(fā)明的視頻拷貝的檢測方法和系統(tǒng),是對(duì)視頻片段是否為另一視頻內(nèi)容 拷貝進(jìn)行檢測,其對(duì)已經(jīng)得到的數(shù)字視頻進(jìn)行內(nèi)容分析,得到內(nèi)容單元,對(duì)各 單元提取能表達(dá)單元主要內(nèi)容的視頻關(guān)鍵幀,通過分析關(guān)鍵幀序列的相似度來 確定一個(gè)視頻片段是不是另一視頻的全部或者部分的視頻拷貝。在本發(fā)明實(shí)施例中,以具有版權(quán)的視頻(稱為被檢測視頻),對(duì)來自于互 聯(lián)網(wǎng)上的査詢視頻,檢測其中的查詢視頻是否包含被檢測視頻中的內(nèi)容(即查 詢視頻是否拷貝了被檢測視頻的部分或全部內(nèi)容)為例,說明本發(fā)明的視頻拷 貝檢測方法,但其不是對(duì)本發(fā)明應(yīng)用范圍的限定,本發(fā)明也可以適用于其他視 頻拷貝的檢測。下面詳細(xì)說明本發(fā)明的一種視頻拷貝的檢測方法,如圖1所示,包括下列 步驟步驟S100,將査詢視頻和被檢測視頻轉(zhuǎn)化為統(tǒng)一格式的數(shù)字視頻;對(duì)所 述査詢視頻和被檢測視頻進(jìn)行視頻結(jié)構(gòu)分析,分割視頻中的鏡頭,提取關(guān)鍵幀。 將被檢測視頻和從互聯(lián)網(wǎng)上下載的多個(gè)查詢視頻,轉(zhuǎn)化為統(tǒng)一格式的數(shù)字視頻格式,使得視頻的尺寸、編碼格式是統(tǒng)一的,如從AVI、 DV-AVI、 MOV 格式轉(zhuǎn)化為MPEG格式等。這種轉(zhuǎn)化是本領(lǐng)域的現(xiàn)有技術(shù),本領(lǐng)域技術(shù)人員 在可以依照本發(fā)明公開的內(nèi)容,實(shí)現(xiàn)其轉(zhuǎn)化過程,因此,在本發(fā)明中不再一一 詳細(xì)描述。對(duì)被檢測視頻和查詢視頻均進(jìn)行視頻結(jié)構(gòu)分析,分割視頻中的鏡頭(shot), 提取關(guān)鍵幀。。視頻結(jié)構(gòu)化分析是指對(duì)視頻流進(jìn)行鏡頭分割、關(guān)鍵幀提取和場景分割等處 理。鏡頭分割的關(guān)鍵在于確定鏡頭的邊界?,F(xiàn)有鏡頭分割方法多以視頻內(nèi)容的 不連續(xù)性為劃分鏡頭的依據(jù),通常選取視頻的某種特征來度量視頻內(nèi)容的不連 續(xù)性,如顏色特征、運(yùn)動(dòng)矢量特征、邊緣特征等。通過鏡頭分割,可對(duì)視頻內(nèi)容進(jìn)行基于鏡頭單元的簡潔表達(dá),從而在保持 視頻基本內(nèi)容的前提下對(duì)視頻內(nèi)容進(jìn)行基于鏡頭單元的關(guān)鍵幀表達(dá);鏡頭分割后,對(duì)每個(gè)鏡頭可提取若干關(guān)鍵幀,并用關(guān)鍵幀來簡潔地表示鏡頭。由于同一個(gè)鏡頭中的各幀圖像之間的內(nèi)容有相當(dāng)程度的冗余,因此可以選 取反映鏡頭中主要信息內(nèi)容的幀圖像作為關(guān)鍵幀。這樣關(guān)鍵幀之間的冗余度被 降低了,可以提高基于內(nèi)容的視頻處理的效率。其中,在本發(fā)明實(shí)施例中,所述視頻的關(guān)鍵幀提取的具體方法是步驟S110,計(jì)算視頻中各幀的HSI值;其中,HSI(Hue, Saturation, Intensity,或稱HSV)表示色相、飽和度和亮度。 HSI的計(jì)算方法是一種現(xiàn)有技術(shù),作為一種可實(shí)施方式,可以利用如《多媒體計(jì)算機(jī)技術(shù)基礎(chǔ)及應(yīng)用》(鐘玉琢等,高等教育出版社,1999年)中描述的方法來實(shí)現(xiàn)。以每幀圖像的中各個(gè)像素點(diǎn)HSV的均值表示該圖像,同時(shí)把HSI非均勻 量化到0 165共166個(gè)等級(jí)。量化方法也是一種現(xiàn)有技術(shù),作為一種可實(shí)施的 方式,可以禾U用如《VIP: Vision tool for comparing Images of People》 (Michel Lantage, Marc Parizeau and Robert Bergevin, In: Vision Interface 2003 )中描述的方法來實(shí)現(xiàn)。步驟S120,生成并統(tǒng)計(jì)整個(gè)視頻的各幀HSI值的直方圖,估算得到視頻其中信息熵的計(jì)算方法為= —f F腦函附,F謂一 比特/符號(hào)其中toto/^V,dV,表示該視頻流的總幀數(shù),^ww,'表示視頻流中被量化到第''階的幀數(shù),N=l, 2,……。步驟S130,確定較佳的關(guān)鍵幀幀數(shù);
關(guān)鍵幀個(gè)數(shù)與信息熵的關(guān)系可以表述如下對(duì)于關(guān)鍵幀,從關(guān)鍵幀精簡的需要來看,關(guān)鍵幀是各不相同,對(duì)于K個(gè) 關(guān)鍵幀,可以視為等概率出現(xiàn)的K個(gè)符號(hào),這時(shí)的信息熵為^(力-log^比特;從反映視頻內(nèi)容的角度來看,基于圖像幀在視頻中出現(xiàn)越多越重要的假 設(shè),若//(1)>//(力,視頻流信源的隨機(jī)性大于精簡后關(guān)鍵幀的隨機(jī)性,關(guān)鍵 幀的個(gè)數(shù)不足以反映視頻的變化,而若//(1)<//(勾,視頻流信源的隨機(jī)性小 于精簡后關(guān)鍵幀的隨機(jī)性,關(guān)鍵幀的個(gè)數(shù)過多,可能選取了在視頻中出現(xiàn)很少 的幀作為關(guān)鍵幀。因此,較佳的情況是使關(guān)鍵幀的幀數(shù)K與視頻的信息熵滿 足//(f) = log2K = //(X),即i^2"("。步驟S140,根據(jù)較佳的關(guān)鍵幀數(shù),用自適應(yīng)無監(jiān)督聚類方法的聚類中心作為K-均值聚類的初始中心,對(duì)視頻中各幀進(jìn)行K-均值聚類。聚類是以數(shù)字公式為基礎(chǔ)的在不同對(duì)象之間的相似性的度量。K-均值是簡 單的非監(jiān)督學(xué)習(xí)方法(算法),它用于解決一些公知的聚類問題。K-均值聚類 方法被用于產(chǎn)生根據(jù)相似性的距離度量的聚類和固定尺寸的、平直的分類。其 通過事先固定的聚類的給定數(shù)目(例如,K個(gè)聚類)把給定的數(shù)據(jù)集進(jìn)行分類。 其是一種現(xiàn)有技術(shù),本領(lǐng)域技術(shù)人員根據(jù)本發(fā)明公開的內(nèi)容,能夠?qū)崿F(xiàn)對(duì)視頻 中各幀的K-均值聚類過程,因此,在本發(fā)明中不再一一詳細(xì)描述。步驟S200,對(duì)被檢測視頻的關(guān)鍵幀建立索引,利用査詢視頻的關(guān)鍵幀在 索引中進(jìn)行初步查找,得到與査詢視頻的關(guān)鍵幀具有相似內(nèi)容的被檢測視頻的 關(guān)鍵幀以及該被檢測視頻的視頻號(hào),并將這些被檢測視頻作為下一步匹配的備 選視頻。本發(fā)明實(shí)施例中,對(duì)被檢測視頻的關(guān)鍵幀建立索引,是對(duì)關(guān)鍵幀提取SIFT (Scale Invariant Feature Transform) f寺征,并建立索引,用來初步查找被檢測 視頻中是否存在與查詢視頻匹配的內(nèi)容。其對(duì)關(guān)鍵幀提取能表達(dá)視頻內(nèi)容的魯棒(robustness)特征,通過以這些 特征建立高維索引,加快查找相似關(guān)鍵幀的速度。在進(jìn)行初步査找時(shí),記錄經(jīng)查找,與査詢視頻(即所提交視頻)的關(guān)鍵幀 具有相似內(nèi)容的被檢測視頻的關(guān)鍵幀,以及該被檢測視頻的視頻號(hào),將這些被 檢測視頻作為下一步匹配的備選視頻,依據(jù)關(guān)鍵幀査找的結(jié)果來初步選定進(jìn)一 步進(jìn)行視頻拷貝檢測的初歩范圍。
其中,在本發(fā)明實(shí)施例中,對(duì)被檢測視頻的關(guān)鍵幀建立索引的具體方法是 步驟S210,對(duì)提取的被檢測視頻的關(guān)鍵幀的SIFT特征進(jìn)行降維;因?yàn)樯傻腟IFT特征點(diǎn)比較多,數(shù)據(jù)量大,因此,對(duì)SIFT特征點(diǎn)的描述構(gòu)成的矩陣進(jìn)行降維。較佳地,鑒于主成分分析(Principal Component Analysis, PCA)在能量集中 意義方面最為有效,本發(fā)明實(shí)施例采用PCA對(duì)SIFT特征矩陣進(jìn)行降維。本發(fā)明實(shí)施例中,將各點(diǎn)SIFT特征看作是特征矩陣的一行,則一幀圖像 的特征成為一個(gè)特征矩陣,對(duì)該特征矩陣進(jìn)行PCA變換.取變換后的低維特 征向量作為低維度的關(guān)鍵幀特征。作為一種可實(shí)施方式,PCA變換可以利用 如《The Complete Reference (2nd Edition)》 (David Salomon; Data Compression: The Complete Reference (2nd Edition), Springer, ISBN 0-387-95045-1, 2000)中描 述的方法實(shí)現(xiàn)。步驟S220,對(duì)降維后的被檢測視頻關(guān)鍵幀的特征采用11*樹結(jié)構(gòu)建立索引。其中,R^對(duì)是R樹(regiontree,區(qū)域樹)的變形結(jié)構(gòu),是目前大規(guī)模數(shù) 據(jù)庫中的常用索引結(jié)構(gòu),具有結(jié)構(gòu)穩(wěn)定、檢索迅速等優(yōu)點(diǎn)。本發(fā)明針對(duì)圖像特 征數(shù)據(jù)的特點(diǎn),采用了R^對(duì)結(jié)構(gòu)來實(shí)現(xiàn)圖像庫的索引。R^對(duì)是基于不同數(shù)據(jù)分布提出的R樹變種。它不同于R樹僅在小的葉子 區(qū)域體積優(yōu)化,R^樹還優(yōu)化了 (1)葉子節(jié)點(diǎn)區(qū)域之間的覆蓋;(2)葉 子節(jié)點(diǎn)區(qū)域的表面;(3)存儲(chǔ)利用率。與R樹插入算法不同,R^樹在為一 個(gè)數(shù)據(jù)目標(biāo)選擇合適的插入葉子節(jié)點(diǎn)時(shí),當(dāng)點(diǎn)未被包括在任何葉子節(jié)點(diǎn)區(qū)域內(nèi) 時(shí),葉子節(jié)點(diǎn)和目錄節(jié)點(diǎn)的處理方法是不同的。對(duì)于葉子節(jié)點(diǎn),選擇使覆蓋產(chǎn) 生最小擴(kuò)大值的區(qū)域,擴(kuò)大值相同時(shí),進(jìn)一步比較葉子節(jié)點(diǎn)的體積擴(kuò)大值和自 身體積大小。對(duì)于目錄節(jié)點(diǎn),先判斷最小體積擴(kuò)大區(qū)域,若不能判定時(shí),則由 自身的體積決定。11*樹分裂算法的特點(diǎn)在于提出了一種"強(qiáng)行再插入"的概 念,即如果一個(gè)節(jié)點(diǎn)溢出,就刪除一定百分比的遠(yuǎn)離中心區(qū)域的目標(biāo),再按插 入方法重新插入這些目標(biāo)。雖然尺*樹的"再插入"算法會(huì)增加運(yùn)算復(fù)雜度和 訪問磁盤次數(shù),但這種增加量避免了很多節(jié)點(diǎn)的分裂。步驟S300,計(jì)算查詢視頻的關(guān)鍵幀和備選視頻的關(guān)鍵幀序列之間的相似 度,對(duì)關(guān)鍵幀序列進(jìn)行匹配,確認(rèn)視頻之間的相似度,相似度高的視頻作為查 詢視頻的拷貝視頻源,即認(rèn)為來自于網(wǎng)上的査詢視頻拷貝了被檢測視頻中的這
本發(fā)明中,將視頻之間相似度的計(jì)算轉(zhuǎn)化為關(guān)鍵幀序列相似性計(jì)算,通過 時(shí)間序列匹配方法,可以有效計(jì)算關(guān)鍵幀序列之間的相似度,從而依據(jù)相似度 來有效判斷一視頻是否是另一視頻的全部或者部分的視頻拷貝。其中,在本發(fā)明實(shí)施例中計(jì)算查詢視頻的關(guān)鍵幀和備選視頻的關(guān)鍵幀序列 之間的相似度,對(duì)關(guān)鍵幀序列進(jìn)行匹配的具體方法是步驟S310,將一個(gè)關(guān)鍵幀作為時(shí)間序列上一時(shí)間點(diǎn)上的取值,則關(guān)鍵幀序 列可視為時(shí)間序列,即隨時(shí)間變化的一組值。將査詢視頻的關(guān)鍵幀序列和備選 視頻的關(guān)鍵幀序列分別視為兩個(gè)關(guān)鍵幀時(shí)間序列;時(shí)間序列是一類重要的數(shù)據(jù)對(duì)象,在經(jīng)濟(jì)、水文、氣象等許多應(yīng)用領(lǐng)域廣 泛存在。時(shí)間序列具有維數(shù)高、數(shù)據(jù)量大以及噪聲干擾嚴(yán)重等特點(diǎn),時(shí)間序列 的模式表示有三方面的好處 一是對(duì)時(shí)間序列進(jìn)行壓縮,換來更小的存儲(chǔ)和計(jì)算代價(jià);二是只保留了時(shí)間序列的主要形態(tài),去除了細(xì)節(jié)干擾,更能反映出時(shí) 間序列的自身特征,有利于提高數(shù)據(jù)挖掘的效率和準(zhǔn)確性;三是很多應(yīng)用領(lǐng)域關(guān)心的是時(shí)間序列一段時(shí)間內(nèi)的變化模式和規(guī)律,而不是時(shí)間序列中單個(gè)序列 點(diǎn)的值,模式表示更能符合其特點(diǎn)。歩驟S320,按特征對(duì)時(shí)間序列進(jìn)行動(dòng)態(tài)時(shí)間規(guī)整(Dynamic Time Warping, DTW)相似度計(jì)算,對(duì)關(guān)鍵幀序列進(jìn)行匹配。在進(jìn)行DTW方法計(jì)算時(shí),采用引入Keogh下界的快速算法來進(jìn)行DTW 距離計(jì)算;按特征對(duì)時(shí)間序列進(jìn)行DTW相似度計(jì)算是一種現(xiàn)有技術(shù),作為一種可實(shí) 施方式,可以禾ll用如《Indexing Multi-Dimensional Time-Series with Support for Multiple Distance Measures》 (Michail Vlachos, Marios Hadjieleftheriou, Dimitrios Gunopulos, Eamo皿Keogh,SIGKDD '03, August 24-27, 2003, Washington, DC, USA)中描述的方法來實(shí)現(xiàn)。最后,可以通過預(yù)先設(shè)定一闊值,當(dāng)相似度高于預(yù)先設(shè)定閥值的視頻,則 作為查詢視頻的拷貝視頻。本發(fā)明的視頻拷貝的檢測方法,通過確定備選視頻,縮小了要進(jìn)行視頻片 段匹配的視頻的范圍;對(duì)該范圍內(nèi)的視頻逐個(gè)進(jìn)行關(guān)鍵幀序列匹配,從而得到 最終的判定結(jié)果,所選中的視頻
相應(yīng)地,本發(fā)明還提供一種視頻拷貝的檢測系統(tǒng)20,如圖2所示,該系統(tǒng)包括分析提取模塊21,索引模塊22,檢測模塊23。其中所述分析提取模塊21,用于將查詢視頻和被檢測視頻轉(zhuǎn)化為統(tǒng)一格式的 數(shù)字視頻;對(duì)所述查詢視頻和被檢測視頻進(jìn)行視頻結(jié)構(gòu)分析,分割視頻中的鏡 頭,提取關(guān)鍵幀。所述索引模塊22,用于對(duì)被檢測視頻的關(guān)鍵幀建立索引,利用查詢視頻 的關(guān)鍵幀在索引中進(jìn)行初步查找,得到與查詢視頻的關(guān)鍵幀具有相似內(nèi)容的被 檢測視頻的關(guān)鍵幀以及該被檢測視頻的視頻號(hào),并將這些被檢測視頻作為下一 步匹配的備選視頻。檢測模塊23,用于計(jì)算查詢視頻的關(guān)鍵幀和備選視頻的關(guān)鍵幀序列之間 的相似度,對(duì)關(guān)鍵幀序列進(jìn)行匹配,確認(rèn)視頻之間的相似度,相似度高的視頻 作為査詢視頻的拷貝視頻源。本發(fā)明的視頻拷貝的檢測系統(tǒng),以與本發(fā)明的視頻拷貝的檢測方法相同的 過程進(jìn)行工作,因此,在本發(fā)明實(shí)施例中,不再一一重復(fù)詳細(xì)。本發(fā)明實(shí)施例的視頻拷貝的檢測方法和系統(tǒng),對(duì)視頻進(jìn)行關(guān)鍵幀提取,以 此作為分析的基礎(chǔ),提高了效率和處理速率;對(duì)關(guān)鍵幀提取SIFT特征,該特 征對(duì)視頻拷貝過程中對(duì)視頻信號(hào)帶來的噪聲比較魯棒,從而在進(jìn)行關(guān)鍵幀序列 匹配時(shí)不受噪聲影響。在進(jìn)行關(guān)鍵幀匹配時(shí)采用時(shí)間序列匹配中的DTW方法, 能有效克服關(guān)鍵幀位置不完全對(duì)應(yīng)而帶來的序列匹配問題。通過結(jié)合附圖對(duì)本發(fā)明具體實(shí)施例的描述,本發(fā)明的其它方面及特征對(duì)本 領(lǐng)域的技術(shù)人員而言是顯而易見的。以上對(duì)本發(fā)明的具體實(shí)施例進(jìn)行了描述和說明,這些實(shí)施例應(yīng)被認(rèn)為其只 是示例性的,并不用于對(duì)本發(fā)明進(jìn)行限制,本發(fā)明應(yīng)根據(jù)所附的權(quán)利要求進(jìn)行 解釋。
權(quán)利要求
1、一種視頻拷貝的檢測方法,其特征在于,包括下列步驟步驟A,將查詢視頻和被檢測視頻轉(zhuǎn)化為統(tǒng)一格式的數(shù)字視頻;對(duì)所述查詢視頻和被檢測視頻進(jìn)行視頻結(jié)構(gòu)分析,分割視頻中的鏡頭,提取關(guān)鍵幀;步驟B,對(duì)被檢測視頻的關(guān)鍵幀建立索引,利用查詢視頻的關(guān)鍵幀在索引中進(jìn)行初步查找,得到與查詢視頻的關(guān)鍵幀具有相似內(nèi)容的被檢測視頻,并將這些被檢測視頻作為下一步匹配的備選視頻;步驟C,計(jì)算查詢視頻的關(guān)鍵幀和備選視頻的關(guān)鍵幀序列之間的相似度,對(duì)關(guān)鍵幀序列進(jìn)行匹配,確認(rèn)視頻之間的相似度,相似度高的視頻作為查詢視頻的拷貝視頻源。
2、 根據(jù)權(quán)利要求1所述的視頻拷貝的檢測方法,其特征在于,所述步驟 A中,所述提取關(guān)鍵幀,包括下列步驟步驟A1,計(jì)算視頻中各幀的HSI值;步驟A2,生成并統(tǒng)計(jì)整個(gè)視頻的各幀HSI值的直方圖,估算得到視頻信 息熵;步驟A3,確定較佳的關(guān)鍵幀幀數(shù)。
3、 根據(jù)權(quán)利要求2所述的視頻拷貝的檢測方法,其特征在于,所述步驟 A3之后,還包括下列步驟歩驟A4,根據(jù)較佳的關(guān)鍵幀數(shù),用自適應(yīng)無監(jiān)督聚類方法的聚類中心作 為K-均值聚類的初始中心,對(duì)視頻中各幀進(jìn)行K-均值聚類。
4、 根據(jù)權(quán)利要求1所述的視頻拷貝的檢測方法,其特征在于,所述步驟 B中,對(duì)被檢測視頻的關(guān)鍵幀的特征建立索引,包括下列步驟步驟B1 ,對(duì)提取的被檢測視頻的關(guān)鍵幀的SIFT特征進(jìn)行主成分分析降維; 歩驟B2,對(duì)降維后的被檢測視頻關(guān)鍵幀的特征采用尺*樹結(jié)構(gòu)建立索引。
5、 根據(jù)權(quán)利要求l所述的視頻拷貝的檢測方法,其特征在于,所述歩驟 C中,計(jì)算查詢視頻的關(guān)鍵幀和備選視頻的關(guān)鍵幀序列之間的相似度,對(duì)關(guān)鍵 幀序列進(jìn)行匹配,包括下列步驟步驟Cl,將一個(gè)關(guān)鍵幀作為時(shí)間序列上一時(shí)間點(diǎn)上的取值,則關(guān)鍵幀序 列可視為時(shí)間序列,即隨時(shí)間變化的一組值,將査詢視頻的關(guān)鍵幀序列和備選視頻的關(guān)鍵幀序列分別視為兩個(gè)關(guān)鍵幀時(shí)間序列;步驟C2,按特征對(duì)時(shí)間序列進(jìn)行動(dòng)態(tài)時(shí)間規(guī)整相似度計(jì)算,對(duì)關(guān)鍵幀序 列進(jìn)行匹配。
6、 一種視頻拷貝的檢測系統(tǒng),其特征在于,包括分析提取模塊,索引模 塊,檢測模塊,其中所述分析提取模塊,用于將查詢視頻和被檢測視頻轉(zhuǎn)化為統(tǒng)一格式的數(shù)字 視頻;對(duì)所述查詢視頻和被檢測視頻進(jìn)行視頻結(jié)構(gòu)分析,分割視頻中的鏡頭, 提取關(guān)鍵幀;所述索引模塊,用于對(duì)被檢測視頻的關(guān)鍵幀建立索引,利用査詢視頻的關(guān) 鍵幀在索引中進(jìn)行初步査找,得到與查詢視頻的關(guān)鍵幀具有相似內(nèi)容的被檢測 視頻,并將這些被檢測視頻作為下一步匹配的備選視頻;檢測模塊,用于計(jì)算查詢視頻的關(guān)鍵幀和備選視頻的關(guān)鍵幀序列之間的相 似度,對(duì)關(guān)鍵幀序列進(jìn)行匹配,確認(rèn)視頻之間的相似度,相似度高的視頻作為 查詢視頻的拷貝視頻源。
7、 根據(jù)權(quán)利要求6所述的視頻拷貝的檢測系統(tǒng),其特征在于,所述提取關(guān)鍵幀,包括計(jì)算視頻中各幀的HSI值;生成并統(tǒng)計(jì)整個(gè)視頻的各幀HSI值的直方圖,估算得到視頻信息熵; 確定較佳的關(guān)鍵幀幀數(shù)。
8、 根據(jù)權(quán)利要求7所述的視頻拷貝的檢測系統(tǒng),其特征在于,所述提取 關(guān)鍵幀,還包括根據(jù)較佳的關(guān)鍵幀數(shù),用自適應(yīng)無監(jiān)督聚類方法的聚類中心作為K-均值 聚類的初始中心,對(duì)視頻中各幀進(jìn)行K-均值聚類。
9、 根據(jù)權(quán)利要求6所述的視頻拷貝的檢測系統(tǒng),其特征在于,所述對(duì)被檢測視頻的關(guān)鍵幀的特征建立索引,包括對(duì)提取的被檢測視頻的關(guān)鍵幀的SIFT特征進(jìn)行主成分分析降維; 對(duì)降維后的被檢測視頻關(guān)鍵幀的特征采用Rf樹結(jié)構(gòu)建立索引。
10、 根據(jù)權(quán)利要求6所述的視頻拷貝的檢測系統(tǒng),其特征在于,所述計(jì)算査詢視頻的關(guān)鍵幀和備選視頻的關(guān)鍵幀序列之間的相似度,對(duì)關(guān)鍵幀序列進(jìn)行匹配,是指將一個(gè)關(guān)鍵幀作為時(shí)間序列上一時(shí)間點(diǎn)上的取值,則關(guān)鍵幀序列可視為 時(shí)間序列,即隨時(shí)間變化的一組值,將査詢視頻的關(guān)鍵幀序列和備選視頻的關(guān) 鍵幀序列分別視為兩個(gè)關(guān)鍵幀時(shí)間序列;按特征對(duì)時(shí)間序列進(jìn)行動(dòng)態(tài)時(shí)間規(guī)整相似度計(jì)算,對(duì)關(guān)鍵幀序列進(jìn)行匹配。
全文摘要
本發(fā)明公開了一種視頻拷貝的檢測方法和系統(tǒng)。該方法包括下列步驟將查詢視頻和被檢測視頻轉(zhuǎn)化為統(tǒng)一格式的數(shù)字視頻;對(duì)所述查詢視頻和被檢測視頻進(jìn)行視頻結(jié)構(gòu)分析,分割視頻中的鏡頭,提取關(guān)鍵幀;對(duì)被檢測視頻的關(guān)鍵幀建立索引,利用查詢視頻的關(guān)鍵幀在索引中進(jìn)行視頻拷貝的初步查找,得到與查詢視頻的關(guān)鍵幀具有相似內(nèi)容的被檢測視頻,并將這些被檢測視頻作為下一步匹配的備選視頻;計(jì)算查詢視頻的關(guān)鍵幀和備選視頻的關(guān)鍵幀序列之間的相似度,對(duì)關(guān)鍵幀序列進(jìn)行匹配,確認(rèn)視頻之間的相似度,相似度高的視頻作為查詢視頻的拷貝視頻源。其減小視頻拷貝檢測的搜索空間,有效提高了檢測效率。
文檔編號(hào)H04N5/76GK101394522SQ200710122018
公開日2009年3月25日 申請(qǐng)日期2007年9月19日 優(yōu)先權(quán)日2007年9月19日
發(fā)明者張勇東, 李錦濤, 潘雪峰 申請(qǐng)人:中國科學(xué)院計(jì)算技術(shù)研究所