重復(fù)視頻檢測方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種重復(fù)視頻檢測方法,采集所有待檢測視頻的關(guān)鍵幀和與所述關(guān)鍵幀相對應(yīng)的鄰近幀,并確定高斯融合圖像;確定所述高斯融合圖像的特征子的描述子;選舉不同視頻之間的描述子相近的匹配特征子;對所述匹配特征子所對應(yīng)的高斯融合圖像進(jìn)行余弦相似度判斷,得到所述不同視頻之間的相似度;根據(jù)所述不同視頻之間的相似度與預(yù)設(shè)閾值之間的大小判斷視頻是否重復(fù)。相應(yīng)的還提供一種重復(fù)視頻檢測系統(tǒng);本發(fā)明的重復(fù)視頻檢測方法及系統(tǒng),通過基于關(guān)鍵幀的匹配在本質(zhì)上使用圖像內(nèi)容匹配的方法,通過基于不同視頻的關(guān)鍵幀的高斯融合圖像之間的余弦相似度計算,在本質(zhì)上使用圖像內(nèi)容匹配的方法,提高了確定重復(fù)視頻的準(zhǔn)確度。
【專利說明】
重復(fù)視頻檢測方法和系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及視頻處理領(lǐng)域,特別涉及一種重復(fù)視頻檢測方法和系統(tǒng)。
【背景技術(shù)】
[0002] 在視頻搜索領(lǐng)域,需要處理海量的、來自不同提供方的視頻源,它們中間存在著大 量的重復(fù)視頻,尤其是一些熱門視頻。這樣會嚴(yán)重影響搜索和視頻推薦結(jié)果的質(zhì)量,導(dǎo)致用 戶體驗的下降。所以如何去除具有相同內(nèi)容的視頻,成為視頻搜索中必須要解決的問題。而 視頻相似度分析在視頻去重、視頻分類等技術(shù)中處于一個核心的步驟和重要的地位。
[0003] 現(xiàn)有技術(shù)中視頻去重的計算最普遍的是以兩個視頻的md5是否相同作判斷為兩 個視頻是否為同一視頻的依據(jù),該方法認(rèn)為擁有同一個md5值的視頻是同一個視頻,但是 視頻只要經(jīng)過轉(zhuǎn)碼、添加字幕、修改一些基本屬性、再傳遞等操作md5值就會發(fā)生變化,所 以這種方法只適用兩個完全相同的視頻文件相比較,并且對于較大的視頻進(jìn)行md5值計算 會消耗大量的時間。
[0004] 另一種方式是使用字幕、時長、文件名等多種視頻特征進(jìn)行余弦相似度這樣的距 離計算求解兩個視頻的相似程度,但這樣的計算方式誤差很大,這些特征都不是很穩(wěn)定,很 容易被修改。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的實施方式提供一種重復(fù)視頻檢測方法及系統(tǒng),用于解決現(xiàn)有技術(shù)中不能 準(zhǔn)確確定重復(fù)視頻的技術(shù)問題。
[0006] 根據(jù)本發(fā)明的一個方面,提供了一種重復(fù)視頻檢測方法,包括:
[0007] 米集所有待檢測視頻的關(guān)鍵幀和與所述關(guān)鍵幀相對應(yīng)的鄰近幀,并確定尚斯融合 圖像;
[0008] 確定所述高斯融合圖像的特征子的描述子;
[0009] 選舉不同視頻之間的描述子相近的匹配特征子;
[0010] 對所述匹配特征子所對應(yīng)的高斯融合圖像進(jìn)行余弦相似度判斷,得到所述不同視 頻之間的相似度;
[0011] 根據(jù)所述不同視頻之間的相似度與預(yù)設(shè)閾值之間的大小判斷視頻是否重復(fù)。
[0012] 本發(fā)明的另一個方面,提供了一種重復(fù)視頻檢測系統(tǒng),包括:
[0013] 高斯融合單元,其用于采集所有待檢測視頻的關(guān)鍵幀和與所述關(guān)鍵幀相對應(yīng)的鄰 近幀,并確定高斯融合圖像;
[0014] 特征子捕獲單元,其用于確定所述高斯融合圖像的特征子的描述子;
[0015] 匹配特征子捕獲單元,其用于選舉不同視頻之間的描述子相近的匹配特征子;
[0016] 相似度計算單元,其用于對所述匹配特征子所對應(yīng)的高斯融合圖像進(jìn)行余弦相似 度判斷,得到所述不同視頻之間的相似度;
[0017] 重復(fù)判定單元,其用于根據(jù)所述不同視頻之間的相似度與預(yù)設(shè)閾值之間的大小判 斷視頻是否重復(fù)。
[0018] 本發(fā)明實施例提供的重復(fù)視頻檢測方法及系統(tǒng),通過基于不同視頻的關(guān)鍵幀的高 斯融合圖像之間的余弦相似度計算,在本質(zhì)上使用圖像內(nèi)容匹配的方法,提高了確定重復(fù) 視頻的準(zhǔn)確度。
【附圖說明】
[0019] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā) 明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根 據(jù)這些附圖獲得其他的附圖。
[0020] 圖1為本發(fā)明的重復(fù)視頻檢測方法一實施方式的流程圖;
[0021] 圖2為本發(fā)明的重復(fù)視頻檢測方法另一實施方式的流程圖;
[0022] 圖3為本發(fā)明的重復(fù)視頻檢測方法又一實施方式的流程圖;
[0023] 圖4為本發(fā)明的重復(fù)視頻檢測方法再一實施方式的流程圖;
[0024] 圖5為本發(fā)明的重復(fù)視頻檢測系統(tǒng)一實施方式的示意圖;
[0025] 圖6為本發(fā)明的高斯融合單元一實施方式的示意圖;
[0026] 圖7為本發(fā)明的特征子捕獲單元一實施方式的示意圖;
[0027] 圖8為本發(fā)明的相似度計算單元一實施方式的示意圖;
[0028] 圖9為本發(fā)明的重復(fù)視頻檢測方法一實施方式的關(guān)鍵幀獲取示意圖;
[0029] 圖10為本發(fā)明的重復(fù)視頻檢測方法一實施方式的關(guān)鍵幀以及與關(guān)鍵幀鄰近的幀 的尚斯融合不意圖;
[0030] 圖11為本發(fā)明的重復(fù)視頻檢測方法一實施方式的關(guān)鍵幀高斯融合圖像特征點匹 配示意圖。
【具體實施方式】
[0031] 為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員 在沒有作出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
[0032] 需要說明的是,在不沖突的情況下,本申請中的實施方式及實施方式中的特征可 以相互組合。
[0033] 本發(fā)明可用于眾多通用或?qū)S玫挠嬎阆到y(tǒng)環(huán)境或配置中。例如:個人計算機(jī)、服務(wù) 器計算機(jī)、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、置頂 盒、可編程的消費電子設(shè)備、網(wǎng)絡(luò)PC、小型計算機(jī)、大型計算機(jī)、包括以上任何系統(tǒng)或設(shè)備的 分布式計算環(huán)境等等。
[0034] 本發(fā)明可以在由計算機(jī)執(zhí)行的計算機(jī)可執(zhí)行指令的一般上下文中描述,例如程序 模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、組 件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計算環(huán)境中實踐本發(fā)明,在這些分布式計算環(huán)境中,由 通過通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來執(zhí)行任務(wù)。在分布式計算環(huán)境中,程序模塊可以 位于包括存儲設(shè)備在內(nèi)的本地和遠(yuǎn)程計算機(jī)存儲介質(zhì)中。
[0035] 在本發(fā)明中,"組件"、"裝置"、"系統(tǒng)"等等指應(yīng)用于計算機(jī)的相關(guān)實體,如硬件、硬 件和軟件的組合、軟件或執(zhí)行中的軟件等。詳細(xì)地說,例如,組件可以、但不限于是運行于處 理器的過程、處理器、對象、可執(zhí)行組件、執(zhí)行線程、程序和/或計算機(jī)。還有,運行于服務(wù)器 上的應(yīng)用程序或腳本程序、服務(wù)器都可以是組件。一個或多個組件可在執(zhí)行的過程和/或 線程中,并且組件可以在一臺計算機(jī)上本地化和/或分布在兩臺或多臺計算機(jī)之間,并可 以由各種計算機(jī)可讀介質(zhì)運行。組件還可以根據(jù)具有一個或多個數(shù)據(jù)包的信號,例如,來自 一個與本地系統(tǒng)、分布式系統(tǒng)中另一組件交互的,和/或在因特網(wǎng)的網(wǎng)絡(luò)通過信號與其它 系統(tǒng)交互的數(shù)據(jù)的信號通過本地和/或遠(yuǎn)程過程來進(jìn)行通信。
[0036] 最后,還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將 一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作 之間存在任何這種實際的關(guān)系或者順序。而且,術(shù)語"包括"、"包含",不僅包括那些要素,而 且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有 的要素。在沒有更多限制的情況下,由語句"包括……"限定的要素,并不排除在包括所述 要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0037] 而且,在本文中"和/或"表示本文既包含了 "和"的關(guān)系,也包含了"或"的關(guān)系, 其中:如果方案A與方案B是"和"的關(guān)系,則表示某實施方式中可以同時包括方案A和方 案B ;如果方案A與方案B是"或"的關(guān)系,則表示某實施方式中可以單獨包括方案A,或者 單獨包括方案B。
[0038] 如圖1所示,本發(fā)明的重復(fù)視頻檢測方法的一些實施方式包括如下步驟:
[0039] S1、初始化,讀入視頻文件,獲取視頻文件信息,如視頻時長、分辨率信息;采集所 有待檢測視頻的關(guān)鍵幀以及與關(guān)鍵幀相鄰的多個鄰近幀,通過關(guān)鍵幀的鄰近幀求取關(guān)鍵幀 的高斯融合圖像。
[0040] 視頻關(guān)鍵幀的提取有利于縮短視頻特征提取的計算時間,關(guān)鍵幀可以代表視頻的 主要信息,提取關(guān)鍵幀就可以得到視頻的主要關(guān)鍵信息,這就減少了視頻處理的計算量。
[0041] 關(guān)鍵幀的提取通常采用均勻采樣的方法,采樣率為每秒兩幀(或者根據(jù)實際需求 任意選取米樣率)。
[0042] 如圖2所示,步驟S1的具體實現(xiàn)方法如下:
[0043] S11、采用爬蟲爬取所述待檢測視頻的多個關(guān)鍵幀;
[0044] S12、采用爬蟲爬取每個所述關(guān)鍵幀的多個鄰近幀;
[0045] S13、根據(jù)所述多個鄰近幀及相對應(yīng)的關(guān)鍵幀確定所述關(guān)鍵幀的高斯融合圖像。
[0046] 本實施方式中通過爬蟲爬取待檢測視頻關(guān)鍵幀的技術(shù),保證了關(guān)鍵幀獲取的可靠 性,進(jìn)而保證了對重復(fù)視頻檢測的準(zhǔn)確性,并且可以綜合考慮對視頻查重的精度以及查重 時間的折中選擇關(guān)鍵幀的采集的頻率以及相應(yīng)于關(guān)鍵幀的鄰近幀的數(shù)量。
[0047] 如圖9所示,橫向表示時間,每個視頻中以一定的采樣率在視頻的時間長度上等 間隔的采集n個關(guān)鍵幀,縱向表示使用每個關(guān)鍵幀在計算高斯融合圖像所用到的m個附近 幀,即計算每一個關(guān)鍵幀的高斯融合圖像采用了 m個附近幀。
[0048] 本實施方式中的m值可以根據(jù)實際的需求進(jìn)行調(diào)整,由于關(guān)鍵幀的高斯融合圖像 是通過鄰近幀的高斯圖像的加權(quán)得到的,通過對視頻關(guān)鍵幀附近幀圖像高斯模糊以及按時 長比例獲取關(guān)鍵幀,可以有效的防止視頻的圖像序列錯位,抗拒幀序列不匹配對相似度計 算結(jié)果的影響,即對視頻序列異位有一定的魯棒性,所以m取值越大,得到的高斯融合圖像 越準(zhǔn)確,但綜合考慮計算量以及視頻查重的精度的要求一般取m值的大小為10。當(dāng)然,隨著 計算機(jī)處理能力的發(fā)展,m的取值也可以不斷的增大,以達(dá)到最優(yōu)的視頻查重性能。
[0049] 如圖10所示,關(guān)鍵幀以及與關(guān)鍵幀鄰近的幀的高斯融合示意圖。針對時長為T的 一個視頻,提取n段關(guān)鍵幀那么第i段關(guān)鍵幀的位置為i/n*T,每個關(guān)鍵幀采取開窗大小為 m的高斯融合,圖10中以第二關(guān)鍵幀為例,示出了第二關(guān)鍵幀以及延時間方向上分布的第 ^關(guān)鍵的鄰近幀k和鄰近幀m的不意圖,以及相應(yīng)的延時間方向的尚斯加權(quán)系數(shù)曲線,從尚 斯加權(quán)系數(shù)曲線上按照對應(yīng)的值去為關(guān)鍵幀圖像數(shù)據(jù)加權(quán),最后得到高斯融合圖像。那么 P倍方差內(nèi)高斯融合圖像的計算公式如下(P代表對關(guān)鍵幀圖像的信任度,P值越小表明越 信任關(guān)鍵幀,通常P取1即可)
[0051] 為第i張單張圖像的像素亮度函數(shù),(x、y)代表像素點在圖像中的 位置。
[0052] IMERSE(x,y)為高斯融合后的圖像的像素亮度函數(shù),(x、y)代表像素點在圖像中的位 置。
[0053] S2、采用SURF算法計算每個高斯融合圖像的魯棒的特征角點與特征信息子(統(tǒng)稱 為特征子),同時計算每個特征子的描述子。
[0054] 本實施方式中,通過確定高斯融合圖像的特征子進(jìn)行匹配,可以使得針對于尺度 變化下的視頻準(zhǔn)確的計算相似度,從而對視頻尺寸甚至方向有魯棒性。
[0055] 如圖3所示,步驟S2的具體實現(xiàn)方法如下:
[0056] S21、通過構(gòu)建所述高斯融合圖像的Hessian矩陣得到所述高斯融合圖像的高斯 金字塔;
[0057] S22、在高斯金字塔中定位特征子和所述特征子的主方向;
[0058] S23、根據(jù)所述特征子的主方向生成特征子的描述子。
[0059] 在SURF算法中,特征子的判據(jù)為某像素亮度的Hessian矩陣的行列式 (DXX*Dyy-D Xy*Dxy)為一個極值,其中Dxx表示IMERGE(x,y)在x軸方向的二階導(dǎo)數(shù),Dyy表 示I MER(:E(X,y)在y軸方向的二階導(dǎo)數(shù),Dxy表示IMERffi( X,y)在x軸、y軸方向的混合二階導(dǎo) 數(shù)。由于Hessian矩陣的計算一般通過像素點亮度值與盒狀濾波器的某一方向偏導(dǎo)數(shù)卷積 而成,在SURF算法里采用近似的盒狀濾波器(0,1,1組成的box filter),在精度影響很小 的情況下,提高了算法運行速度。因為盒狀濾波器僅有〇, _1,1,因此卷積的計算可以用積 分圖像(Integral image)來優(yōu)化時間復(fù)雜度,大大提高了效率。
[0060] 每個像素點需計算Dxx,Dyy,Dxy三個值,故需要三個濾波器;用它們?yōu)V波后,得到 一幅高斯融合圖像的響應(yīng)圖(Response image,其中每個像素的值為原高斯融合圖像素的 DXX*Dyy-DXy*Dxy),對高斯融合圖像用不同尺寸的濾波器進(jìn)行濾波,得到同一圖像在不同 尺度的一系列響應(yīng)圖,構(gòu)成一個高斯金字塔。
[0061] 特征子的檢測,在3x 3x3的矩陣中,若某點的Dxx*Dyy_Dxy*Dxy大于其鄰域的26 個點的Dxx*Dyy-Dxy*Dxy ( 即,為一個最大極值),則該點為特征子。
[0062] 其次,描述子的建立,為保證特征子描述子的旋轉(zhuǎn)不變性,需對每個特征子計算主 方向。計算主方向的過程如下:
[0063] 統(tǒng)計以特征子為中心,正比于特征子尺度的某個數(shù)為半徑范圍內(nèi)的點在x、y方向 的Haar小波響應(yīng),并給這些響應(yīng)值賦高斯權(quán)重系數(shù),使得靠近特征點的響應(yīng)貢獻(xiàn)大,而遠(yuǎn) 離特征點的響應(yīng)貢獻(xiàn)小,其次將張角為60°的扇形區(qū)域內(nèi)的在x、y方向的所有響應(yīng)相加, 以形成新的矢量,遍歷整個圓形區(qū)域,選擇最長矢量的方向為特征點的主方向。
[0064] 描述子的建立過程如下:
[0065] 選定以特征子為中心的一塊正方形區(qū)域,將其旋轉(zhuǎn)與主方向?qū)R;
[0066] 將正方形分為4x4的16個子區(qū)域,對每個區(qū)域進(jìn)行Haar小波變換(用積分圖像 加速),得到4個系數(shù);
[0067] 每個區(qū)域中的點按梯度大小和正態(tài)分布加權(quán),繪制出8個方向的直方圖,所以每 個特征子可得到一個128維的描述子向量(因為要使特征點對對比度變化不敏感,還需對 向量歸一化處理)。這些描述子可用于匹配,即尋找另一幅圖像中與該特征點128維向量幾 何距離最短的特征子。
[0068] 此算法的優(yōu)點在于大量合理使用積分圖像降低運算量,效率更高,而且在運用的 過程中并未降低精度(小波變換,Hessian矩陣行列式檢測都是成熟有效的手段),并且魯 棒性很好。
[0069] S3、使用K近鄰方法選舉匹配兩個高斯融合圖像的特征子(后稱匹配特征子)。除 了 K近鄰方法以外,還可以采用目前比較普遍的匹配特征子的方法:窮舉法和隨機(jī)一致性 采樣方法。窮舉法是求取所有特征子之間的距離,找出每一對近距離的特征子;隨機(jī)一致性 采樣的方法采用先隨機(jī)采樣再驗證不斷迭代的方法實現(xiàn)。由于視頻匹配中的圖像匹配的情 況比較單一,尺寸的變化大部分是等比變換,所以使用區(qū)域劃分可以很高效解決,同時區(qū)域 劃分后,使用K近鄰可以非常有效的保證結(jié)果的準(zhǔn)確性。
[0070] 步驟S3的具體實現(xiàn)方法為:
[0071] 區(qū)域劃分的K近鄰匹配特征子。先對每個高斯圖像劃分成若干個區(qū)域(如圖11 所示,劃分4個區(qū)域),在每個區(qū)域中使用K近鄰?fù)镀钡姆绞竭M(jìn)行特征子的匹配。
[0072] S4、求取匹配特征子之間余弦相似度,計算每幀對應(yīng)的關(guān)鍵楨高斯融合圖像的平 均余弦相似度;求取兩個視頻間的高斯加權(quán)平均相似度。
[0073] 使用余弦相似度計算每個視頻的每個高斯融合圖像的每個特征子相似度,求取整 張高斯融合圖像的相似度平均值,對每個高斯融合圖像的相似度平均進(jìn)行高斯值加權(quán)求取 平均值。
[0074] 如圖4所示,對匹配特征子所對應(yīng)的高斯融合圖像進(jìn)行余弦相似度判斷,得到所 述不同視頻之間的相似度包括:
[0075] S41、確定兩個所述高斯融合圖像之間的多個匹配特征子之間的余弦相似度;
[0076] S42、根據(jù)所述多個匹配特征子之間的余弦相似度確定所述多個匹配特征子對應(yīng) 的高斯融合圖像之間的平均余弦相似度;
[0077] S43、對所述平均余弦相似度進(jìn)行高斯加權(quán),得到所述兩視頻之間的相似度。
[0078] 本實施方式中通過對高斯融合圖像之間的平均余弦相似度進(jìn)行高斯加權(quán)求和的 方法,更加準(zhǔn)確的計算出兩個視頻之間的相似度。
[0079] 下面是具體的計算公式:
[0080] 對于在k/n*T (簡稱為第k幀)幀融合圖像在這個特征子匹配點對的余弦相 似度計算公式如下:
[0082] 其中辦xK)丨表示在第k幀I圖像上的點丨)的64維度的描述子;校表示的 是在視頻I、視頻J的第K幀圖像上的兩個像素點的坐標(biāo)。第k幀融合圖像的平均余弦相似 度計算公式如下:
[0084] 對于兩個視頻I,J相似度的計算公式計算如下(p同為方差):
[0086] S5、通過判斷視頻的高斯加權(quán)平均余弦相似度是否大于預(yù)設(shè)閾值,來判定該視頻 是否為重復(fù)視頻,如果大于則判定該視頻為重復(fù)視頻,否則判斷該視頻無重復(fù)。
[0087] 預(yù)設(shè)閾值選取過大,則大部分的視頻不能判定為相同,準(zhǔn)確率比較高,檢測率較 低,反之,預(yù)設(shè)閾值選取過小,準(zhǔn)確率較低,檢測率較高??梢愿鶕?jù)不同的要求自主進(jìn)行確定 預(yù)設(shè)閾值的設(shè)定,目前我們使用的數(shù)值在〇. 4 - 0. 45這個范圍。
[0088] 為方便理解,以向用戶展示視頻搜索結(jié)果的場景為例進(jìn)行說明。在這種應(yīng)用場景 中,關(guān)鍵幀圖像的尚斯融合圖像的計算時機(jī)可以有兩個:
[0089] 第一個計算時機(jī),針對視頻網(wǎng)站中所有視頻文件,可以預(yù)先計算這些視頻文件的 關(guān)鍵幀圖像的高斯融合圖像,這樣,當(dāng)接收到用戶的搜索請求時,可以直接獲得與用戶的搜 索請求相對應(yīng)的視頻文件的關(guān)鍵幀圖像的高斯融合圖像,因此可以利用本發(fā)明重復(fù)視頻檢 測方法將檢測出的重復(fù)視頻只保留一個并刪除剩余重復(fù)視頻。
[0090] 舉例說明,在視頻網(wǎng)站中,可以通過爬蟲模塊爬取大量視頻文件的關(guān)鍵幀圖像,進(jìn) 而獲得這些關(guān)鍵幀圖像的url (Uniform Resource Locator,統(tǒng)一資源定位符)信息。如果 視頻網(wǎng)站中視頻文件很多,需要爬取的關(guān)鍵幀圖像的數(shù)量很大,可以采用增量下載方式或 多臺機(jī)器多線程并行下載方式。當(dāng)然,因為重新下載代價較大,所以可以定期備份關(guān)鍵幀圖 像數(shù)據(jù)以防丟失。針對下載下來的關(guān)鍵幀圖像,可以單機(jī)計算其高斯融合圖像,還可以采用 多進(jìn)程方式計算,比如,將多個關(guān)鍵幀圖像按照一定規(guī)律分組,每個進(jìn)程計算對應(yīng)組中關(guān)鍵 幀圖像的高斯融合圖像。另外,為及時更新關(guān)鍵幀圖像的高斯融合圖像,可以定期計算新下 載的關(guān)鍵幀圖像的高斯融合圖像。
[0091] 第二個計算時機(jī),接收到用戶的搜索請求后,先獲得與用戶的搜索請求相對應(yīng)的 視頻文件,針對這些視頻文件計算其關(guān)鍵幀圖像的高斯融合圖像,因此可以利用本發(fā)明重 復(fù)視頻檢測方法只將檢測出的重復(fù)視頻中的一個并顯示為搜索結(jié)果。
[0092] 如圖5所示,本發(fā)明的一實施例還提供了一種重復(fù)視頻檢測系統(tǒng),其包括:
[0093] 高斯融合單元,其用于采集所有待檢測視頻的關(guān)鍵幀和與所述關(guān)鍵幀相對應(yīng)的鄰 近幀,并確定所述關(guān)鍵幀的高斯融合圖像;
[0094] 特征子捕獲單元,其用于確定所述高斯融合圖像的特征子的描述子;
[0095] 匹配特征子捕獲單元,其用于選舉不同視頻之間的描述子相近的匹配特征子;
[0096] 相似度計算單元,其用于對所述匹配特征子所對應(yīng)的高斯融合圖像進(jìn)行余弦相似 度判斷,得到所述不同視頻之間的相似度;
[0097] 重復(fù)判定單元,其用于根據(jù)所述不同視頻之間的相似度與預(yù)設(shè)閾值之間的大小判 斷視頻是否重復(fù)。
[0098] 如圖6所示,在一些實施例中,高斯融合單元包括:
[0099] 幀爬取單元,其用于爬取所述待檢測視頻的多個關(guān)鍵幀,以及爬取每個所述關(guān)鍵 幀的多個鄰近幀;
[0100] 高斯融合圖像生成單元,其用于根據(jù)所述多個鄰近幀及相對應(yīng)的關(guān)鍵幀確定所述 關(guān)鍵幀的高斯融合圖像。
[0101] 如圖7所示,在一些實施例中,特征子捕獲單元包括:
[0102] 高斯金字塔生成單元,其用于通過構(gòu)建所述高斯融合圖像的Hessian矩陣得到所 述高斯融合圖像的高斯金字塔;
[0103] 特征子主方向確定單元,其用于在高斯金字塔中定位特征子和所述特征子的主方 向;
[0104] 描述子確定單元,其用于根據(jù)所述特征子的主方向生成特征子的描述子。
[0105] 如圖8所示,在一些實施例中,相似度計算單元包括:
[0106] 匹配特征子相似度確定單元,其用于確定兩個所述高斯融合圖像之間的多個匹配 特征子之間的余弦相似度;
[0107] 高斯融合圖像相似度確定單元,其用于根據(jù)所述多個匹配特征子之間的余弦相似 度確定所述多個匹配特征子對應(yīng)的高斯融合圖像之間的平均余弦相似度;
[0108] 視頻相似度確定單元,其用于對所述平均余弦相似度進(jìn)行高斯加權(quán),得到所述兩 視頻之間的相似度。
[0109] 以上所描述的方法實施例僅僅是示意性的,其中所述作為分離部件說明的單元可 以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單 元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其 中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性 的勞動的情況下,即可以理解并實施。
[0110] 通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到各實施方式可 借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當(dāng)然也可以通過硬件?;谶@樣的理解,上 述技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該 計算機(jī)軟件產(chǎn)品可以存儲在計算機(jī)可讀存儲介質(zhì)中,如R0M/RAM、磁碟、光盤等,包括若干指 令用以使得一臺計算機(jī)設(shè)備(可以是個人計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行各個實施 例或者實施例的某些部分所述的方法。
[0111] 本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實施方式可提供為方法、系統(tǒng)、或計算機(jī)程 序產(chǎn)品。因此,本發(fā)明可采用完全硬件實施方式、完全軟件實施方式、或結(jié)合軟件和硬件方 面的實施方式的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機(jī)可用程序代碼 的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器和光學(xué)存儲器等)上實施的計算機(jī)程序 產(chǎn)品的形式。
[0112] 本發(fā)明是參照根據(jù)本發(fā)明實施方式的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流 程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實現(xiàn)流程圖和/或方框圖中的每 一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計 算機(jī)程序指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處 理器以產(chǎn)生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn) 生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功 能的裝置。
[0113] 這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特 定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指 令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或 多個方框中指定的功能。這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè) 備上,使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實現(xiàn)的處理, 從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流 程和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0114] 最后應(yīng)說明的是:以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡 管參照前述實施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然 可以對前述各實施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替 換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精 神和范圍。
【主權(quán)項】
1. 一種重復(fù)視頻檢測方法,包括: 米集所有待檢測視頻的關(guān)鍵幀和與所述關(guān)鍵幀相對應(yīng)的鄰近幀,并確定尚斯融合圖 像; 確定所述高斯融合圖像的特征子的描述子; 選舉不同視頻之間的描述子相近的匹配特征子; 對所述匹配特征子所對應(yīng)的高斯融合圖像進(jìn)行余弦相似度判斷,得到所述不同視頻之 間的相似度; 根據(jù)所述不同視頻之間的相似度與預(yù)設(shè)閾值之間的大小判斷視頻是否重復(fù)。2. 根據(jù)權(quán)利要求1所述的重復(fù)視頻檢測方法,其特征在于,所述采集所有待檢測視頻 的關(guān)鍵幀,確定尚斯融合圖像包括: 采用爬蟲爬取所述待檢測視頻的多個關(guān)鍵幀; 采用爬蟲爬取每個所述關(guān)鍵幀的多個鄰近幀; 根據(jù)所述多個鄰近幀及相對應(yīng)的關(guān)鍵幀確定所述關(guān)鍵幀的高斯融合圖像。3. 根據(jù)權(quán)利要求1所述的重復(fù)視頻檢測方法,其特征在于,所述確定所述高斯融合圖 像的特征子的描述子包括: 通過構(gòu)建所述高斯融合圖像的Hessian矩陣得到所述高斯融合圖像的高斯金字塔; 在高斯金字塔中定位特征子和所述特征子的主方向; 根據(jù)所述特征子的主方向生成特征子的描述子。4. 根據(jù)權(quán)利要求1所述的重復(fù)視頻檢測方法,其特征在于,所述選舉不同視頻之間的 描述子相近的匹配特征子,使用K近鄰方法進(jìn)行選舉。5. 根據(jù)權(quán)利要求1所述的重復(fù)視頻檢測方法,其特征在于,所述對所述匹配特征子所 對應(yīng)的高斯融合圖像進(jìn)行余弦相似度判斷,得到所述不同視頻之間的相似度包括: 確定兩個高斯融合圖像之間的多個匹配特征子之間的余弦相似度; 根據(jù)所述多個匹配特征子之間的余弦相似度確定所述多個匹配特征子對應(yīng)的兩個高 斯融合圖像之間的平均余弦相似度; 對所述平均余弦相似度進(jìn)行高斯加權(quán),得到所述兩個視頻之間的相似度。6. -種重復(fù)視頻檢測系統(tǒng),包括: 高斯融合單元,其用于采集所有待檢測視頻的關(guān)鍵幀和與所述關(guān)鍵幀相對應(yīng)的鄰近 幀,并確定高斯融合圖像; 特征子捕獲單元,其用于確定所述高斯融合圖像的特征子的描述子; 匹配特征子捕獲單元,其用于選舉不同視頻之間的描述子相近的匹配特征子; 相似度計算單元,其用于對所述匹配特征子所對應(yīng)的高斯融合圖像進(jìn)行余弦相似度判 斷,得到所述不同視頻之間的相似度; 重復(fù)判定單元,其用于根據(jù)所述不同視頻之間的相似度與預(yù)設(shè)閾值之間的大小判斷視 頻是否重復(fù)。7. 根據(jù)權(quán)利要求6所述的重復(fù)視頻檢測系統(tǒng),其特征在于,所述高斯融合單元包括: 幀爬取單元,其用于爬取所述待檢測視頻的多個關(guān)鍵幀,以及爬取每個所述關(guān)鍵幀的 多個鄰近幀; 高斯融合圖像生成單元,其用于根據(jù)所述多個鄰近幀及相對應(yīng)的關(guān)鍵幀確定所述關(guān)鍵 幀的高斯融合圖像。8. 根據(jù)權(quán)利要求6所述的重復(fù)視頻檢測系統(tǒng),其特征在于,所述特征子捕獲單元包括: 高斯金字塔生成單元,其用于通過構(gòu)建所述高斯融合圖像的Hessian矩陣得到所述高 斯融合圖像的高斯金字塔; 特征子主方向確定單元,其用于在高斯金字塔中定位特征子和所述特征子的主方向; 描述子確定單元,其用于根據(jù)所述特征子的主方向生成特征子的描述子。9. 根據(jù)權(quán)利要求6所述的重復(fù)視頻檢測方法,其特征在于,所述選舉不同視頻之間的 描述子相近的匹配特征子,使用K近鄰方法進(jìn)行選舉。10. 根據(jù)權(quán)利要求6所述的重復(fù)視頻檢測系統(tǒng),其特征在于,所述相似度計算單元包 括: 匹配特征子相似度確定單元,其用于確定兩個高斯融合圖像之間的多個匹配特征子之 間的余弦相似度; 高斯融合圖像相似度確定單元,其用于根據(jù)所述多個匹配特征子之間的余弦相似度確 定所述多個匹配特征子對應(yīng)的兩個高斯融合圖像之間的平均余弦相似度; 視頻相似度確定單元,其用于對所述平均余弦相似度進(jìn)行高斯加權(quán),得到所述兩個視 頻之間的相似度。
【文檔編號】G06F17/30GK105893405SQ201510771736
【公開日】2016年8月24日
【申請日】2015年11月12日
【發(fā)明人】孫成龍
【申請人】樂視云計算有限公司