視頻檢測方法和裝置的制造方法
【專利摘要】本申請公開了視頻檢測方法和裝置。所述方法的一【具體實(shí)施方式】包括:從待檢測視頻中截取圖像以形成待檢測圖像序列;生成待檢測圖像序列中每個待檢測圖像的哈希簽名;將待檢測圖像序列中各個待檢測圖像的哈希簽名與從樣本視頻集合中各個樣本視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進(jìn)行匹配;記錄樣本圖像序列中哈希簽名匹配成功的樣本圖像的圖像標(biāo)識以及哈希簽名匹配成功的樣本圖像所屬的視頻的視頻標(biāo)識,并統(tǒng)計(jì)各個圖像標(biāo)識和各個視頻標(biāo)識的出現(xiàn)次數(shù);將視頻標(biāo)識出現(xiàn)次數(shù)大于第一閾值且視頻標(biāo)識所關(guān)聯(lián)的圖像標(biāo)識中不同圖像標(biāo)識的出現(xiàn)次數(shù)大于第二閾值的樣本視頻,確定為待檢測視頻的同源視頻。該實(shí)施方式實(shí)現(xiàn)了同源視頻的自動檢測。
【專利說明】
視頻檢測方法和裝置
技術(shù)領(lǐng)域
[0001] 本申請涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及多媒體技術(shù)領(lǐng)域,尤其涉及視頻檢測方法 和裝置。
【背景技術(shù)】
[0002] 服務(wù)器中存在著大量的視頻,其中一些視頻可能是相同的內(nèi)容。查找出內(nèi)容相同 的同源視頻有助于發(fā)現(xiàn)侵犯版權(quán)、涉恐以及涉黃等非法視頻并進(jìn)行封禁處理。此外,發(fā)現(xiàn)同 源視頻還可以用于減少同一資源的多個相同內(nèi)容的副本,節(jié)省存儲和帶寬。
[0003] 然而,由于網(wǎng)絡(luò)中視頻的數(shù)量越來越多,使得無法單純靠人工鑒別和標(biāo)注樣本的 方式來識別視頻。
【發(fā)明內(nèi)容】
[0004] 本申請的目的在于提出一種改進(jìn)的視頻檢測方法和裝置,來解決以上【背景技術(shù)】部 分提到的技術(shù)問題。
[0005] 第一方面,本申請?zhí)峁┝艘环N視頻檢測方法,所述方法包括:從待檢測視頻中截取 至少一個圖像以形成待檢測圖像序列;生成所述待檢測圖像序列中每個待檢測圖像的哈希 簽名;將所述待檢測圖像序列中各個待檢測圖像的哈希簽名與從樣本視頻集合中各個樣本 視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進(jìn)行匹配,其中樣本視頻的視頻 標(biāo)識與從該樣本視頻所提取出的樣本圖像序列中各個樣本圖像的圖像標(biāo)識是關(guān)聯(lián)存儲的; 記錄所述樣本圖像序列中哈希簽名匹配成功的樣本圖像的圖像標(biāo)識以及所述哈希簽名匹 配成功的樣本圖像所屬的視頻的視頻標(biāo)識,并統(tǒng)計(jì)各個圖像標(biāo)識和各個視頻標(biāo)識的出現(xiàn)次 數(shù);將視頻標(biāo)識出現(xiàn)次數(shù)大于第一閾值、且視頻標(biāo)識所關(guān)聯(lián)的圖像標(biāo)識中不同圖像標(biāo)識的 出現(xiàn)次數(shù)大于第二閾值的樣本視頻,確定為所述待檢測視頻的同源視頻。
[0006] 在一些實(shí)施例中,所述從待檢測視頻中截取至少一個圖像以形成待檢測圖像序 列,包括:在所述待檢測視頻中的視頻片段中,每隔第一預(yù)設(shè)幀數(shù)截取圖像,以形成待檢測 圖像序列。
[0007] 在一些實(shí)施例中,所述視頻片段是位于所述待檢測視頻的中間部分且長度為第一 預(yù)設(shè)時長的視頻片段。
[0008] 在一些實(shí)施例中,所述樣本圖像序列是針對各個樣本視頻中位于樣本視頻的中間 部分且時長為第二預(yù)設(shè)時長的視頻片段、每隔第二預(yù)設(shè)幀數(shù)截取圖像所形成的,其中,所述 第二預(yù)設(shè)時長大于所述第一預(yù)設(shè)時長且所述第二預(yù)設(shè)幀數(shù)小于所述第一預(yù)設(shè)幀數(shù)。
[0009] 在一些實(shí)施例中,所述生成所述待檢測圖像序列中每個待檢測圖像的哈希簽名, 包括:提取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向量生成哈希簽名。
[0010] 在一些實(shí)施例中,在所述提取各個待檢測圖像的全局特征向量,并基于所提取的 全局特征向量生成哈希簽名之前,所述生成所述圖像序列中每個圖像的哈希簽名還包括以 下一項(xiàng)或多項(xiàng):將待檢測圖像從三通道圖像轉(zhuǎn)換為單通道圖像;對待檢測圖像進(jìn)行腐蝕以 弱化待檢測圖像中的字幕;去除待檢測圖像的黑邊。
[0011] 在一些實(shí)施例中,所述提取各個待檢測圖像的全局特征向量,并基于所提取的全 局特征向量生成哈希簽名,包括:將待測試圖像均勻分塊,計(jì)算所分成的分塊的整體灰度均 值以及各個塊各自的灰度均值;根據(jù)各個塊各自的灰度均值與所述整體灰度均值的大小關(guān) 系,生成與各個塊對應(yīng)的二進(jìn)制位,以形成哈希簽名。
[0012] 在一些實(shí)施例中,所述提取各個待檢測圖像的全局特征向量,并基于所提取的全 局特征向量生成哈希簽名,包括:對待測試圖像放縮為行數(shù)與列數(shù)均為8的整數(shù)倍的圖像; 將已放縮圖像均勾分成行數(shù)與列數(shù)均為8的塊;計(jì)算每個塊的DCT(Discrete Cosine Transform,離散余弦變換)系數(shù)并量化;將每個已量化DCT系數(shù)中的前8位作為一行生成矩 陣;對于所述矩陣的每個列,計(jì)算列中元素的均值并根據(jù)列中每個元素的數(shù)值與該均值的 大小關(guān)系生成與各個元素對應(yīng)的二進(jìn)制位,以形成哈希簽名。
[0013] 在一些實(shí)施例中,所述提取各個待檢測圖像的全局特征向量,并基于所提取的全 局特征向量生成哈希簽名,包括:將待測試圖像均勻分塊,計(jì)算所分成的分塊的整體灰度均 值以及各個塊各自的灰度均值,根據(jù)各個塊各自的灰度均值與所述整體灰度均值的大小關(guān) 系,生成與各個塊對應(yīng)的二進(jìn)制位,以形成待生成哈希簽名的第一部分;對待測試圖像放縮 為行數(shù)與列數(shù)均為8的整數(shù)倍的圖像;將已放縮圖像均勻分成行數(shù)與列數(shù)均為8的塊;計(jì)算 每個塊的DCT系數(shù)并量化;將每個已量化DCT系數(shù)中進(jìn)行排序后的前8個作為矩陣的各行生 成矩陣;對于所述矩陣的每個列,計(jì)算列中元素的均值并根據(jù)列中每個元素的數(shù)值與該均 值的大小關(guān)系生成與各個元素對應(yīng)的二進(jìn)制位,以形成待生成哈希簽名的第二部分;基于 所述第一部分和所述第二部分生成哈希簽名。
[0014]在一些實(shí)施例中,在所述將所述待檢測圖像序列中各個待檢測圖像的哈希簽名與 從樣本視頻集合中各個樣本視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進(jìn) 行匹配之前,所述方法還包括:基于所述待檢測圖像序列中各個待檢測圖像的哈希簽名對 所述待檢測圖像序列中的待檢測圖像進(jìn)行去重處理。
[0015] 在一些實(shí)施例中,所述將所述待檢測圖像序列中各個待檢測圖像的哈希簽名與從 樣本視頻集合中各個樣本視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進(jìn)行 匹配,包括:依次計(jì)算所述樣本圖像序列中各個樣本圖像的哈希簽名將與該圖像的哈希簽 名的漢明距離,并將漢明距離不大于預(yù)設(shè)漢明距離閾值的哈希簽名所對應(yīng)的樣本圖像確定 為匹配成功的樣本圖像。
[0016] 在一些實(shí)施例中,所述依次計(jì)算所述樣本圖像序列中各個樣本圖像的哈希簽名將 與該圖像的哈希簽名的漢明距離,并將漢明距離不大于預(yù)設(shè)漢明距離閾值k的哈希簽名所 對應(yīng)的樣本圖像確定為匹配成功的樣本圖像,包括:將待測試圖像的哈希簽名按位數(shù)平均 分成m塊后從中選擇η塊作為查詢用子簽名,其中n<m-k;確定預(yù)先建立的子簽名索引中與 所述查詢用子簽名相同的子簽名,其中所述子簽名索引的各個子簽名是對樣本圖像序列中 各個樣本圖像的哈希簽名平均分成m塊后、將每η塊提取出來而形成的,且各個子簽名與所 對應(yīng)的樣本圖像是關(guān)聯(lián)的;對于與所述查詢用子簽名相同的各個子簽名,計(jì)算子簽名所關(guān) 聯(lián)的樣本圖像的哈希簽名中除子簽名外的其他m-n塊與待檢測圖像的哈希簽名中除查詢用 子簽名外的其他m-n塊之間的漢明距離;將漢明距離不大于預(yù)設(shè)漢明距離閾值k的哈希簽名 所對應(yīng)的樣本圖像確定為匹配成功的樣本圖像。
[0017] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,所述樣本圖像序列中各個樣本圖像的哈希簽 名以及待測試圖像序列中各個待測試圖像的哈希簽名均為64位,k = 4,m = 6,n = 2。
[0018] 第二方面,本申請?zhí)峁┝艘环N視頻檢測裝置,所述裝置包括:截取單元,用于從待 檢測視頻中截取至少一個圖像以形成待檢測圖像序列;生成單元,用于生成所述待檢測圖 像序列中每個待檢測圖像的哈希簽名;匹配單元,用于將所述待檢測圖像序列中各個待檢 測圖像的哈希簽名與從樣本視頻集合中各個樣本視頻所提取出的樣本圖像序列中各個樣 本圖像的哈希簽名進(jìn)行匹配,其中樣本視頻的視頻標(biāo)識與從該樣本視頻所提取出的樣本圖 像序列中各個樣本圖像的圖像標(biāo)識是關(guān)聯(lián)存儲的;記錄單元,用于記錄所述樣本圖像序列 中哈希簽名匹配成功的樣本圖像的圖像標(biāo)識以及所述哈希簽名匹配成功的樣本圖像所屬 的視頻的視頻標(biāo)識,并統(tǒng)計(jì)各個圖像標(biāo)識和各個視頻標(biāo)識的出現(xiàn)次數(shù);確定單元,用于將視 頻標(biāo)識出現(xiàn)次數(shù)大于第一閾值、且視頻標(biāo)識所關(guān)聯(lián)的圖像標(biāo)識中不同圖像標(biāo)識的出現(xiàn)次數(shù) 大于第二閾值的樣本視頻,確定為所述待檢測視頻的同源視頻。
[0019] 在一些實(shí)施例中,所述截取單元進(jìn)一步用于:在所述待檢測視頻中的視頻片段中, 每隔第一預(yù)設(shè)幀數(shù)截取圖像,以形成待檢測圖像序列。
[0020] 在一些實(shí)施例中,所述視頻片段是位于所述待檢測視頻的中間部分且長度為第一 預(yù)設(shè)時長的視頻片段。
[0021 ]在一些實(shí)施例中,所述樣本圖像序列是針對各個樣本視頻中位于樣本視頻的中間 部分且時長為第二預(yù)設(shè)時長的視頻片段、每隔第二預(yù)設(shè)幀數(shù)截取圖像所形成的,其中,所述 第二預(yù)設(shè)時長大于所述第一預(yù)設(shè)時長且所述第二預(yù)設(shè)幀數(shù)小于所述第一預(yù)設(shè)幀數(shù)。
[0022] 在一些實(shí)施例中,所述生成單元包括:生成子單元,用于提取各個待檢測圖像的全 局特征向量,并基于所提取的全局特征向量生成哈希簽名。
[0023] 在一些實(shí)施例中,所述生成單元還包括以下一項(xiàng)或多項(xiàng):轉(zhuǎn)換子單元,用于在所述 提取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向量生成哈希簽名之前, 將待檢測圖像從三通道圖像轉(zhuǎn)換為單通道圖像;腐蝕單元,用于在所述提取各個待檢測圖 像的全局特征向量,并基于所提取的全局特征向量生成哈希簽名之前,對待檢測圖像進(jìn)行 腐蝕以弱化待檢測圖像中的字幕;去黑邊單元,用于在所述提取各個待檢測圖像的全局特 征向量,并基于所提取的全局特征向量生成哈希簽名之前,去除待檢測圖像的黑邊。
[0024] 在一些實(shí)施例中,所述生成子單元進(jìn)一步用于:將待測試圖像均勻分塊,計(jì)算所分 成的分塊的整體灰度均值以及各個塊各自的灰度均值;根據(jù)各個塊各自的灰度均值與所述 整體灰度均值的大小關(guān)系,生成與各個塊對應(yīng)的二進(jìn)制位,以形成哈希簽名。
[0025] 在一些實(shí)施例中,所述生成子單元進(jìn)一步用于:對待測試圖像放縮為行數(shù)與列數(shù) 均為8的整數(shù)倍的圖像;將已放縮圖像均勻分成行數(shù)與列數(shù)均為8的塊;計(jì)算每個塊的DCT系 數(shù)并量化;將每個已量化DCT系數(shù)中的前8位作為一行生成矩陣;對于所述矩陣的每個列,計(jì) 算列中元素的均值并根據(jù)列中每個元素的數(shù)值與該均值的大小關(guān)系生成與各個元素對應(yīng) 的二進(jìn)制位,以形成哈希簽名。
[0026] 在一些實(shí)施例中,所述生成子單元進(jìn)一步用于:將待測試圖像均勻分塊,計(jì)算所分 成的分塊的整體灰度均值以及各個塊各自的灰度均值,根據(jù)各個塊各自的灰度均值與所述 整體灰度均值的大小關(guān)系,生成與各個塊對應(yīng)的二進(jìn)制位,以形成待生成哈希簽名的第一 部分;對待測試圖像放縮為行數(shù)與列數(shù)均為8的整數(shù)倍的圖像;將已放縮圖像均勻分成行數(shù) 與列數(shù)均為8的塊;計(jì)算每個塊的DCT系數(shù)并量化;將每個已量化DCT系數(shù)中進(jìn)行排序后的前 8個作為矩陣的各行生成矩陣;對于所述矩陣的每個列,計(jì)算列中元素的均值并根據(jù)列中每 個元素的數(shù)值與該均值的大小關(guān)系生成與各個元素對應(yīng)的二進(jìn)制位,以形成待生成哈希簽 名的第一部分;基于所述第一部分和所述第二部分生成哈希簽名。
[0027] 在一些實(shí)施例中,所述裝置還包括:去重單元,用于在所述將所述待檢測圖像序列 中各個待檢測圖像的哈希簽名與從樣本視頻集合中各個樣本視頻所提取出的樣本圖像序 列中各個樣本圖像的哈希簽名進(jìn)行匹配之前,基于所述待檢測圖像序列中各個待檢測圖像 的哈希簽名對所述待檢測圖像序列中的待檢測圖像進(jìn)行去重處理。
[0028] 在一些實(shí)施例中,所述匹配單元,進(jìn)一步用于:依次計(jì)算所述樣本圖像序列中各個 樣本圖像的哈希簽名將與該圖像的哈希簽名的漢明距離,并將漢明距離不大于預(yù)設(shè)漢明距 離閾值的哈希簽名所對應(yīng)的樣本圖像確定為匹配成功的樣本圖像。
[0029] 在一些實(shí)施例中,所述匹配單元進(jìn)一步用于:將待測試圖像的哈希簽名按位數(shù)平 均分成m塊后從中選擇η塊作為查詢用子簽名,其中n<m-k;確定預(yù)先建立的子簽名索引中 與所述查詢用子簽名相同的子簽名,其中所述子簽名索引的各個子簽名是對樣本圖像序列 中各個樣本圖像的哈希簽名平均分成m塊后、將每η塊提取出來而形成的,且各個子簽名與 所對應(yīng)的樣本圖像是關(guān)聯(lián)的;對于與所述查詢用子簽名相同的各個子簽名,計(jì)算子簽名所 關(guān)聯(lián)的樣本圖像的哈希簽名中除子簽名外的其他m-n塊與待檢測圖像的哈希簽名中除查詢 用子簽名外的其他m-n塊之間的漢明距離;將漢明距離不大于預(yù)設(shè)漢明距離閾值k的哈希簽 名所對應(yīng)的樣本圖像確定為匹配成功的樣本圖像。
[0030] 在一些實(shí)施例中,所述樣本圖像序列中各個樣本圖像的哈希簽名以及待測試圖像 序列中各個待測試圖像的哈希簽名均為64位,k = 4,m = 6,n = 2。
[0031] 本申請?zhí)峁┑囊曨l檢測方法和裝置,通過對待檢測視頻與樣本視頻中所截取的圖 像的哈希簽名進(jìn)行匹配,并根據(jù)匹配成功的次數(shù)確定出同源視頻,實(shí)現(xiàn)了同源視頻的自動 檢測。
【附圖說明】
[0032] 通過閱讀參照以下附圖所作的對非限制性實(shí)施例所作的詳細(xì)描述,本申請的其它 特征、目的和優(yōu)點(diǎn)將會變得更明顯:
[0033]圖1是本申請可以應(yīng)用于其中的示例性系統(tǒng)架構(gòu)圖;
[0034] 圖2是根據(jù)本申請的視頻檢測方法的一個實(shí)施例的流程圖;
[0035] 圖3是根據(jù)本申請的視頻檢測方法的又一個實(shí)施例的流程圖;
[0036] 圖4是根據(jù)本申請的視頻檢測裝置的一個實(shí)施例的結(jié)構(gòu)示意圖;
[0037] 圖5是適于用來實(shí)現(xiàn)本申請實(shí)施例的終端設(shè)備或服務(wù)器的計(jì)算機(jī)系統(tǒng)的結(jié)構(gòu)示意 圖。
【具體實(shí)施方式】
[0038] 下面結(jié)合附圖和實(shí)施例對本申請作進(jìn)一步的詳細(xì)說明??梢岳斫獾氖?,此處所描 述的具體實(shí)施例僅僅用于解釋相關(guān)發(fā)明,而非對該發(fā)明的限定。另外還需要說明的是,為了 便于描述,附圖中僅示出了與有關(guān)發(fā)明相關(guān)的部分。
[0039] 需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相 互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本申請。
[0040] 圖1示出了可以應(yīng)用本申請的視頻檢測方法或視頻檢測裝置的實(shí)施例的示例性系 統(tǒng)架構(gòu)1〇〇。
[0041] 如圖1所示,系統(tǒng)架構(gòu)100可以包括終端設(shè)備101、102、103,網(wǎng)絡(luò)104和服務(wù)器105。 網(wǎng)絡(luò)104用以在終端設(shè)備101、102、103和服務(wù)器105之間提供通信鏈路的介質(zhì)。網(wǎng)絡(luò)104可以 包括各種連接類型,例如有線、無線通信鏈路或者光纖電纜等等。
[0042]用戶可以使用終端設(shè)備101、102、103通過網(wǎng)絡(luò)104與服務(wù)器105交互,以接收或發(fā) 送消息等。終端設(shè)備101、102、103上可以安裝有各種通訊客戶端應(yīng)用,例如網(wǎng)頁瀏覽器應(yīng) 用、網(wǎng)盤應(yīng)用、視頻網(wǎng)站應(yīng)用等。
[0043] 終端設(shè)備101、102、103可以是具有顯示屏并且支持視頻播放的各種電子設(shè)備,包 括但不限于智能手機(jī)、平板電腦、電子書閱讀器、MP3播放器(Moving Picture Experts Group Audio Layer III,動態(tài)影像專家壓縮標(biāo)準(zhǔn)音頻層面3)、MP4(Moving Picture Experts Group Audio Layer IV,動態(tài)影像專家壓縮標(biāo)準(zhǔn)音頻層面4)播放器、膝上型便攜 計(jì)算機(jī)和臺式計(jì)算機(jī)等等。
[0044] 服務(wù)器105可以是提供各種服務(wù)的服務(wù)器,例如對終端設(shè)備101、102、103上播放的 視頻提供支持的后臺服務(wù)器。后臺服務(wù)器可以對接收到的視頻請求等數(shù)據(jù)進(jìn)行分析等處 理,并將處理結(jié)果(例如所請求的視頻數(shù)據(jù))反饋給終端設(shè)備。
[0045] 需要說明的是,本申請實(shí)施例所提供的視頻檢測方法一般由服務(wù)器105執(zhí)行,相應(yīng) 地,視頻檢測裝置一般設(shè)置于服務(wù)器105中。
[0046] 應(yīng)該理解,圖1中的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器的數(shù)目僅僅是示意性的。根據(jù)實(shí)現(xiàn)需 要,可以具有任意數(shù)目的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器。
[0047] 繼續(xù)參考圖2,示出了根據(jù)本申請的視頻檢測方法的一個實(shí)施例的流程200。所述 的視頻檢測方法,包括以下步驟:
[0048]步驟201,從待檢測視頻中截取至少一個圖像以形成待檢測圖像序列。
[0049] 在本實(shí)施例中,視頻檢測方法運(yùn)行于其上的電子設(shè)備(例如圖1所示的服務(wù)器)可 以首先從本地或通過有線連接方式或者無線連接方式從其他服務(wù)器或終端設(shè)備獲取待檢 測視頻。之后,電子設(shè)備可以對該待檢測視頻的部分或全部按幀進(jìn)行截取,從而截取到至少 一個圖像,所截取的圖像形成待檢測圖像序列。
[0050] 需要指出的是,上述無線連接方式可以包括但不限于3G/4G連接、WiFi連接、藍(lán)牙 連接、WiMAX連接、Zigbee連接、UWB(ultra wideband)連接、以及其他現(xiàn)在已知或?qū)黹_發(fā) 的無線連接方式。
[0051]步驟202,生成待檢測圖像序列中每個待檢測圖像的哈希簽名。
[0052]在本實(shí)施例中,基于步驟201中得到的待檢測圖像序列,上述電子設(shè)備(例如圖1所 示的服務(wù)器)可以對每個待檢測圖像提取特征數(shù)據(jù),在對特征數(shù)據(jù)進(jìn)行處理生成每個待檢 測圖像的哈希簽名。
[0053]在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,步驟202中生成待檢測圖像的哈希簽名可以 包括:提取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向量生成哈希簽名。
[0054]在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,提取各個待檢測圖像的全局特征向量,并基 于所提取的全局特征向量生成哈希簽名,包括:將待測試圖像均勻分塊,計(jì)算所分成的分塊 的整體灰度均值以及各個塊各自的灰度均值;根據(jù)各個塊各自的灰度均值與整體灰度均值 的大小關(guān)系,生成與各個塊對應(yīng)的二進(jìn)制位,以形成哈希簽名。在該實(shí)現(xiàn)方式中,均值方法 在提取圖像全局特征對圖像降質(zhì)、整體亮度與色度變化等過程中有較強(qiáng)的魯棒性。
[0055] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,提取各個待檢測圖像的全局特征向量,并基 于所提取的全局特征向量生成哈希簽名,包括:對待測試圖像放縮為行數(shù)與列數(shù)均為8的整 數(shù)倍的圖像;將已放縮圖像均勻分成行數(shù)與列數(shù)均為8的塊;計(jì)算每個塊的DCT系數(shù)并量化; 將每個已量化DCT系數(shù)中的前8位作為一行生成矩陣;對于矩陣的每個列,計(jì)算列中元素的 均值并根據(jù)列中每個元素的數(shù)值與該均值的大小關(guān)系生成與各個元素對應(yīng)的二進(jìn)制位,以 形成哈希簽名。該方式中,DCT方法在提取全局特征時對圖像內(nèi)容變形、水印與標(biāo)志的添加、 一般性的濾鏡、邊界內(nèi)容丟失等過程有較強(qiáng)的魯棒性。
[0056] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,取各個待檢測圖像的全局特征向量,并基于 所提取的全局特征向量生成哈希簽名,可以通過以下方式執(zhí)行:
[0057] 首先,將待測試圖像均勻分塊,計(jì)算所分成的分塊的整體灰度均值以及各個塊各 自的灰度均值,根據(jù)各個塊各自的灰度均值與整體灰度均值的大小關(guān)系,生成與各個塊對 應(yīng)的二進(jìn)制位,以形成待生成哈希簽名的第一部分。具體的,可以將要處理的圖像拷貝一 份,再將圖像均勻分成8X8塊圖像的一個拷貝均勻分成8X8塊,去除上下邊界上的塊,計(jì)算 中間6X8塊的整體灰度均值以及每塊的灰度均值,用每塊的均值與整體均值做比較,量化 為48bit(位)整數(shù)。在執(zhí)行該步驟之前,還可以預(yù)先去除上下邊界上的塊。因?yàn)閳D像內(nèi)部塊 顏色的連續(xù)性要好于邊界上去除黑邊不徹底的塊,可以使提取的全局特征和獲取的哈希簽 名更穩(wěn)定。
[0058]之后,對待測試圖像放縮為行數(shù)與列數(shù)均為8的整數(shù)倍的圖像;將已放縮圖像均勻 分成行數(shù)與列數(shù)均為8的塊;計(jì)算每個塊的DCT系數(shù)并量化;將每個已量化DCT系數(shù)中進(jìn)行排 序后的前8個作為矩陣的各行生成矩陣;對于矩陣的每個列,計(jì)算列中元素的均值并根據(jù)列 中每個元素的數(shù)值與該均值的大小關(guān)系生成與各個元素對應(yīng)的二進(jìn)制位,以形成待生成哈 希簽名的第二部分。具體的,可以首先將上述步驟得到的圖像拷貝放縮到16X16大小,并分 成大小為8X8的四塊,計(jì)算每塊的DCT系數(shù),DCT系數(shù)矩陣中的第一個(第一行第一列)系數(shù) 是直流(DC)系數(shù),對應(yīng)的是均值信息,其他系數(shù)稱為交流(AC)系數(shù);再對各塊的DCT系數(shù)都 按"Z"排序,從低頻到高頻漸變,選取各塊排序后的DCT系數(shù)矩陣的第2,3,4,5個低頻系數(shù)并 量化,構(gòu)成4X4矩陣,每列對應(yīng)的是不同塊的同位置低頻系數(shù),按列求均值,每列元素與相 應(yīng)列均值比較,量化為16bit整數(shù)。在圖像哈希簽名中,既要考慮簽名的區(qū)別性又要考慮其 魯棒性,在DCT系數(shù)中,高頻系數(shù)選的越多,則圖像的區(qū)別性越強(qiáng),高頻系數(shù)選的越少,則圖 像的魯棒性越強(qiáng)。上述過程可以在區(qū)別性和魯棒性之間取得較好的平衡。
[0059]最后,基于第一部分和第二部分生成哈希簽名。例如,將前述過程中得到的48bit 的整數(shù)與16bit的整數(shù)結(jié)合,得到共64bit的整數(shù),即可作為哈希簽名。
[0060] 該實(shí)現(xiàn)方式,結(jié)合均值與DCT方法提取全局特征的方法保留了各自優(yōu)點(diǎn),增強(qiáng)了所 生成的哈希簽名的魯棒性。
[0061] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,在提取各個待檢測圖像的全局特征向量,并 基于所提取的全局特征向量生成哈希簽名之前,步驟202還可以包括以下步驟中的一項(xiàng)或 多項(xiàng):將待檢測圖像從三通道圖像轉(zhuǎn)換為單通道圖像;對待檢測圖像進(jìn)行腐蝕以弱化待檢 測圖像中的字幕;去除待檢測圖像的黑邊。
[0062]在該實(shí)現(xiàn)方式中,將待檢測圖像從三通道圖像轉(zhuǎn)換為單通道圖像。即,可以將圖像 統(tǒng)一轉(zhuǎn)換成灰度圖以進(jìn)行后續(xù)處理,可以減少后續(xù)處理的數(shù)據(jù)量,有利于降低處理復(fù)雜度 以及提尚處理效率。
[0063]在該實(shí)現(xiàn)方式中,對待檢測圖像進(jìn)行腐蝕以弱化待檢測圖像中的字幕,具體可以 通過如下方式執(zhí)行:用矩形核對圖像進(jìn)行腐蝕操作,弱化字幕。矩形核寬高取為1/40倍圖像 寬、1/40倍圖像高,并且不超過9像素。腐蝕操作時可以利用形態(tài)學(xué)上的腐蝕算法對圖像進(jìn) 行處理。腐蝕核如果太大,有可能會將圖像中實(shí)際內(nèi)容部分的細(xì)節(jié)腐蝕掉,該細(xì)節(jié)所處的行 或列有可能會被誤判成黑邊。
[0064] 對黑邊區(qū)域有字幕的視頻,對圖像進(jìn)行腐蝕操作,細(xì)化了文字,降低了黑邊區(qū)域內(nèi) 的雜點(diǎn)比例,在去黑邊操作時使得該區(qū)域更容易去除,而腐蝕操作對其他區(qū)域去黑邊并無 影響。
[0065] 在該實(shí)現(xiàn)方式中,去除待檢測圖像的黑邊,具體可以通過如下方式執(zhí)行:從上下兩 個邊界同時逐行向內(nèi)掃描圖像、從左右兩個邊界同時逐列向內(nèi)掃描圖像,分別計(jì)算每條線 的灰度直方圖,用線直方圖峰值對應(yīng)的像素點(diǎn)個數(shù)與閾值比較來判斷該線是否為黑邊,上 下往內(nèi)掃描時直到有一條判斷為非黑邊則停止掃描,左右往內(nèi)掃描時直到有一條判斷為非 黑邊則停止掃描,截取掃描終止時的上下左右邊界內(nèi)的圖像內(nèi)容為新圖像。本發(fā)明中指的 黑邊是廣義的黑邊,具體是指某單一顏色。有黑邊的影視圖像,黑邊區(qū)域是上下對稱、左右 對稱的,掃描時上下若不同時往內(nèi)掃、左右不同時往內(nèi)掃,則上下兩側(cè)去除的區(qū)域大小不一 致、左右兩側(cè)去除的區(qū)域大小不一致,這就造成全局特征的提取和哈希簽名的獲取和在圖 像實(shí)際內(nèi)容區(qū)域內(nèi)操作時相比存在偏差。如果上下同時掃描、左右同時掃描,上下兩行、左 右兩列必須同時滿足去除黑邊的條件時,掃描才會終止,按這種方式掃描完成后,新的圖像 即使還存在黑邊,黑邊區(qū)域仍然還是對稱的,上述所述的偏差將會降低很多。采用去黑邊操 作,可以保留下的是實(shí)際的圖像內(nèi)容,對無黑邊的同源視頻,去黑邊操作對其實(shí)際影響并不 大,保留下來的是同樣的圖像內(nèi)容。去黑邊操作增強(qiáng)了同源視頻的圖像哈希簽名的穩(wěn)定性。 [0066]需要說明的是,在對待檢測圖像作上述處理時,樣本圖像序列中的各個圖像也進(jìn) 行相應(yīng)的處理,以保證圖像匹配時的準(zhǔn)確度。
[0067] 步驟203,將待檢測圖像序列中各個待檢測圖像的哈希簽名與從樣本視頻集合中 各個樣本視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進(jìn)行匹配。
[0068] 在本實(shí)施例中,電子設(shè)備可以將待檢測圖像序列中各個待檢測圖像的哈希簽名與 從樣本視頻集合中各個樣本視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進(jìn) 行匹配。其中,其中樣本視頻的視頻標(biāo)識與從該樣本視頻所提取出的樣本圖像序列中各個 樣本圖像的圖像標(biāo)識是關(guān)聯(lián)存儲的。其中,樣本視頻集合是預(yù)先存儲的,其包含的各個樣本 視頻用于與待檢測視頻進(jìn)行比對,以判斷待檢測視頻是否與其中的一個樣本視頻為同源視 頻。
[0069]在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,步驟203具體包括依次計(jì)算樣本圖像序列中 各個樣本圖像的哈希簽名將與該圖像的哈希簽名的漢明距離,并將漢明距離不大于預(yù)設(shè)漢 明距離閾值的哈希簽名所對應(yīng)的樣本圖像確定為匹配成功的樣本圖像。在對圖像進(jìn)行匹配 時,通常是提取不同圖像中分塊均值的全局特征后并將向量歸一化,之后計(jì)算兩個特征向 量的歐式距離。該實(shí)現(xiàn)方式中,獲取哈希簽名的過程,是圖像特征損失的過程。但從實(shí)驗(yàn)測 算中可以得出,在漢明空間比較哈希簽名,仍基本保持了在歐式空間中相同的相似性與不 相似性,提取哈希簽名的方法是局部敏感的。但是,哈希簽名之間的漢明距離計(jì)算圖像之間 的匹配度,計(jì)算簡單,因此操作速度快,且哈希簽名占用的存儲空間較小,因此有利于提高 處理效率。
[0070] 步驟204,記錄樣本圖像序列中哈希簽名匹配成功的樣本圖像的圖像標(biāo)識以及哈 希簽名匹配成功的樣本圖像所屬的視頻的視頻標(biāo)識,并統(tǒng)計(jì)各個圖像標(biāo)識和各個視頻標(biāo)識 的出現(xiàn)次數(shù)。
[0071] 在本實(shí)施例中,在通過步驟203進(jìn)行匹配時,電子設(shè)備可以對樣本圖像序列中哈希 簽名匹配成功的樣本圖像的圖像標(biāo)識進(jìn)行記錄,同時,還對這些匹配成功的樣本圖像所屬 的視頻的視頻標(biāo)識進(jìn)行記錄,并對各個圖像標(biāo)識和各個視頻標(biāo)識的出現(xiàn)次數(shù)進(jìn)行統(tǒng)計(jì)。 [0072]步驟205,將視頻標(biāo)識出現(xiàn)次數(shù)大于第一閾值、且視頻標(biāo)識所關(guān)聯(lián)的圖像標(biāo)識中不 同圖像標(biāo)識的出現(xiàn)次數(shù)大于第二閾值的樣本視頻,確定為待檢測視頻的同源視頻。
[0073]在本實(shí)施例中,基于步驟204中的統(tǒng)計(jì)結(jié)果,電子設(shè)備可以對各個樣本視頻對應(yīng)的 視頻標(biāo)識的出現(xiàn)次數(shù)與第一閾值進(jìn)行比較。同時,電子設(shè)備還可以將各個樣本視頻的視頻 標(biāo)識所關(guān)聯(lián)的圖像標(biāo)識中不同圖像標(biāo)識的出現(xiàn)次數(shù)與第二閾值進(jìn)行比較。當(dāng)某一樣本視頻 的視頻的視頻標(biāo)識的出現(xiàn)次數(shù)大于第一閾值,且該樣本視頻的視頻標(biāo)識所關(guān)聯(lián)的圖像標(biāo)識 中不同圖像標(biāo)識的出現(xiàn)次數(shù)大于第二閾值時,將該樣本視頻確定為待檢測視頻的同源視 頻。
[0074]在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,在步驟204之前,上述視頻檢測方法還包括: 基于待檢測圖像序列中各個待檢測圖像的哈希簽名對待檢測圖像序列中的待檢測圖像進(jìn) 行去重處理。在本實(shí)施例中,電子設(shè)備可以將哈希簽名的多個圖像進(jìn)行去重處理,以減小后 續(xù)處理的數(shù)據(jù)量。需要說明的是,樣本圖像序列中的各個圖像也可以基于哈希簽名進(jìn)行去 重處理。
[0075] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,步驟201可以是在待檢測視頻中的視頻片段 中,每隔第一預(yù)設(shè)幀數(shù)截取圖像,以形成待測試圖像序列。在該實(shí)現(xiàn)方式中,電子設(shè)備可以 先從待檢測視頻選擇需要提取的視頻片段,并在選中的視頻片段中每隔第一預(yù)設(shè)幀數(shù)均勻 截取圖像。
[0076] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,上述視頻片段可以是位于待檢測視頻的中間 部分且長度為第一預(yù)設(shè)時長的視頻片段。在本實(shí)施例中,可以采用待檢測視頻的中間部分 作為采集圖像的視頻片段。通常,上述第一預(yù)設(shè)時長的設(shè)置,可以避免將待檢測視頻開頭或 結(jié)尾的部分作為圖像截取的來源,從而避免同源視頻僅由于視頻開頭和結(jié)尾的不同而無法 被檢測出來。
[0077] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,樣本圖像序列是針對各個樣本視頻中位于樣 本視頻的中間部分且時長為第二預(yù)設(shè)時長的視頻片段、每隔第二預(yù)設(shè)幀數(shù)截取圖像所形成 的。其中,該第二預(yù)設(shè)時長大于第一預(yù)設(shè)時長且第二預(yù)設(shè)幀數(shù)小于第一預(yù)設(shè)幀數(shù)。例如,對 于樣本視頻,可以從正中間部分截取10分鐘,每隔10幀密集截取獲得樣本圖像序列,計(jì)算每 個圖像的哈希簽名,并記錄下視頻序號和圖像序號。對于待檢測視頻,可以從正中間部分截 取5分鐘,每隔100幀稀疏截取獲得圖像序列。在該實(shí)現(xiàn)方式中,對樣本視頻的圖像截取為密 集截取,對待檢測視頻的圖像截取為稀疏截取,且樣本視頻中圖像截取的視頻片段比待檢 測視頻中圖像截取的視頻片段時間更長,從而能最大程度保障從待檢測視頻中截取的圖像 都能在從樣本視頻截取出的樣本圖像序列中匹配到,保證后續(xù)檢測的準(zhǔn)確度。
[0078] 在上述實(shí)施例中,本通過對待檢測視頻與樣本視頻中所截取的圖像的哈希簽名進(jìn) 行匹配,并根據(jù)匹配成功的次數(shù)確定出同源視頻,實(shí)現(xiàn)了同源視頻的自動檢測。本實(shí)施例的 方案可廣泛應(yīng)用于認(rèn)證、內(nèi)容索引、版權(quán)視頻檢索、暴恐視頻檢索、大規(guī)模數(shù)據(jù)庫管理、拷貝 檢測以及其他相關(guān)的視頻處理領(lǐng)域。
[0079] 進(jìn)一步參考圖3,其示出了視頻檢測方法的又一個實(shí)施例的流程300。該視頻檢測 方法的流程300,包括以下步驟:
[0080] 步驟301,從待檢測視頻中截取至少一個圖像以形成待檢測圖像序列。
[0081 ] 在本實(shí)施例中,步驟301的處理可以參考圖2對應(yīng)實(shí)施例中的步驟201,這里不再贅 述。
[0082]步驟302,生成待檢測圖像序列中每個待檢測圖像的哈希簽名。
[0083] 在本實(shí)施例中,步驟301的處理可以參考圖2對應(yīng)實(shí)施例中的步驟201,這里不再贅 述。
[0084] 步驟303,將待測試圖像的哈希簽名按位數(shù)平均分成m塊后從中選擇η塊作為查詢 用子簽名。
[0085] 在本實(shí)施例中,對于步驟302中各個待檢測圖像的哈希簽名,電子設(shè)備可以將哈希 簽名平均分成m塊。其中,m>k,其中可為預(yù)設(shè)的漢明距離閾值,將在步驟306中使用。對于所 分成的m塊,電子設(shè)備可以從中選擇η塊作為后續(xù)查詢過程中用于與各個索引中子簽名進(jìn)行 匹配的查詢用子簽名。其中,n<m-k。因此,單個哈希簽名對應(yīng)有的查詢用子簽名的數(shù)量是 C個。
[0086]步驟304,確定預(yù)先建立的子簽名索引中與查詢用子簽名相同的子簽名。
[0087] 在本實(shí)施例中,電子設(shè)備可以使用上述查詢用子簽名預(yù)先建立的子簽名索引中進(jìn) 行查詢。其中,子簽名索引中的各個子簽名是對樣本圖像序列中各個樣本圖像的哈希簽名 平均分成m塊后、將每η塊提取出來而形成的,因此該子簽名索引中的索引數(shù)量也可以是 個。
[0088] 其中,子簽名索引的中各個子簽名與所對應(yīng)的樣本圖像是關(guān)聯(lián)的。在查詢時,可以 將待查詢子簽名與相同組合的子簽名進(jìn)行查詢。最終,可以確定子簽名索引中與查詢用子 簽名相同的子簽名。
[0089] 步驟305,對于與查詢用子簽名相同的各個子簽名,計(jì)算子簽名關(guān)聯(lián)的樣本圖像的 哈希簽名中除子簽名外的其他m-n塊與待檢測圖像的哈希簽名中除查詢用子簽名外的其他 m-n塊之間的漢明距離。
[0090] 在本實(shí)施例中,在基于步驟304查詢到與查詢用子簽名相同的各個子簽名后,電子 設(shè)備可以對樣本圖像的哈希簽名以及待檢測圖像的哈希簽名中除子簽名外的其他m-n塊形 成的數(shù)位進(jìn)行比對,計(jì)算兩者之間的漢明距離。
[0091] 步驟306,將漢明距離不大于預(yù)設(shè)漢明距離閾值k的哈希簽名所對應(yīng)的樣本圖像確 定為匹配成功的樣本圖像。
[0092] 在本實(shí)施例中,對于步驟305中所計(jì)算的各個漢明距離,電子設(shè)備將漢明距離不大 于預(yù)設(shè)漢明距離閾值k的哈希簽名所對應(yīng)的樣本圖像作為匹配成功的圖像。其中,對于漢明 距離閾值k,漢明距離不大于k的兩個哈希簽名之間不同的數(shù)位最多在m塊中的k個塊中各有 一個分布,因此在m塊中兩個哈希簽名至少在m-k個塊上完全一致。因此,將m塊中任意η塊組 合進(jìn)行結(jié)合所形成的各個子簽名用來建立索引,可以以保證在用于匹配的各個索引所關(guān)聯(lián) 的所有哈希簽名中可以囊括所有與待檢測圖像的哈希簽名的漢明距離不大于k的哈希簽 名??蛇x的,可以將η設(shè)置為n=m-k。
[0093] 步驟307,記錄樣本圖像序列中哈希簽名匹配成功的樣本圖像的圖像標(biāo)識以及哈 希簽名匹配成功的樣本圖像所屬的視頻的視頻標(biāo)識,并統(tǒng)計(jì)各個圖像標(biāo)識和各個視頻標(biāo)識 的出現(xiàn)次數(shù)。
[0094]在本實(shí)施例中,步驟307的具體處理可以參考圖2對應(yīng)實(shí)施例的步驟204,這里不再 贅述。
[0095]步驟308,將視頻標(biāo)識出現(xiàn)次數(shù)大于第一閾值、且視頻標(biāo)識所關(guān)聯(lián)的圖像標(biāo)識中不 同圖像標(biāo)識的出現(xiàn)次數(shù)大于第二閾值的樣本視頻,確定為待檢測視頻的同源視頻。
[0096]在本實(shí)施例中,步驟308的具體處理可以參考圖2對應(yīng)圖實(shí)施例的步驟205,這里不 再贅述。
[0097] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,上述樣本圖像序列中各個樣本圖像的哈希簽 名以及待測試圖像序列中各個待測試圖像的哈希簽名均為64位,k = 4,m = 6,n = 2。
[0098] 從圖3中可以看出,與圖2對應(yīng)的實(shí)施例相比,本實(shí)施例中的視頻檢測方法的流程 300在匹配待檢測圖像序列中圖像的哈希簽名和樣本圖相同序列中圖像的哈希簽名時,使 用通過子簽名建立的索引進(jìn)行查詢。若任選η塊所得到的哈希子簽名的位的最小值為min, 則對每個圖像每個索引下理論上最多線性查詢2 64^min次就能查詢到最多在k個位上不同的 相似圖像。這種查詢方式顯著地增加了查詢速度,且該查詢方案不會丟失匹配的圖像,從而 提高了整體的處理效率。
[0099] 進(jìn)一步參考圖4,作為對上述各圖所示方法的實(shí)現(xiàn),本申請?zhí)峁┝艘环N視頻檢測裝 置的一個實(shí)施例,該裝置實(shí)施例與圖2所示的方法實(shí)施例相對應(yīng),該裝置具體可以應(yīng)用于各 種服務(wù)器中。
[0?00] 如圖4所示,本實(shí)施例所述的視頻檢測裝置400包括:截取單元401、生成單元402、 匹配單元403、記錄單元404和確定單元405。其中,截取單元401用于從待檢測視頻中截取至 少一個圖像以形成待檢測圖像序列;生成單元402用于生成待檢測圖像序列中每個待檢測 圖像的哈希簽名;匹配單元403用于將待檢測圖像序列中各個待檢測圖像的哈希簽名與從 樣本視頻集合中各個樣本視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進(jìn)行 匹配,其中樣本視頻的視頻標(biāo)識與從該樣本視頻所提取出的樣本圖像序列中各個樣本圖像 的圖像標(biāo)識是關(guān)聯(lián)存儲的;記錄單元404用于記錄樣本圖像序列中哈希簽名匹配成功的樣 本圖像的圖像標(biāo)識以及哈希簽名匹配成功的樣本圖像所屬的視頻的視頻標(biāo)識,并統(tǒng)計(jì)各個 圖像標(biāo)識和各個視頻標(biāo)識的出現(xiàn)次數(shù);而確定單元405,用于將視頻標(biāo)識出現(xiàn)次數(shù)大于第一 閾值、且視頻標(biāo)識所關(guān)聯(lián)的圖像標(biāo)識中不同圖像標(biāo)識的出現(xiàn)次數(shù)大于第二閾值的樣本視 頻,確定為待檢測視頻的同源視頻。
[0101] 在本實(shí)施例中,視頻檢測裝置400的截取單元401、生成單元402、匹配單元403、記 錄單元404和確定單元405的具體處理可以參考圖2對應(yīng)實(shí)施例的步驟201、步驟202、步驟 203、步驟204和步驟205,這里不再贅述。
[0102] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,截取單元401進(jìn)一步用于:在待檢測視頻中的 視頻片段中,每隔第一預(yù)設(shè)幀數(shù)截取圖像,以形成待檢測圖像序列。該實(shí)現(xiàn)方式中的具體處 理可以參考圖2對應(yīng)實(shí)施例中相應(yīng)的實(shí)現(xiàn)方式。
[0103] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,上述視頻片段是位于待檢測視頻的中間部分 且長度為第一預(yù)設(shè)時長的視頻片段。該實(shí)現(xiàn)方式中的具體處理可以參考圖2對應(yīng)實(shí)施例中 相應(yīng)的實(shí)現(xiàn)方式。
[0104] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,上述樣本圖像序列是針對各個樣本視頻中位 于樣本視頻的中間部分且時長為第二預(yù)設(shè)時長的視頻片段、每隔第二預(yù)設(shè)幀數(shù)截取圖像所 形成的,其中,第二預(yù)設(shè)時長大于第一預(yù)設(shè)時長且第二預(yù)設(shè)幀數(shù)小于第一預(yù)設(shè)幀數(shù)。該實(shí)現(xiàn) 方式中的具體處理可以參考圖2對應(yīng)實(shí)施例中相應(yīng)的實(shí)現(xiàn)方式。
[0105] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,生成單元402包括:生成子單元(未示出),用 于提取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向量生成哈希簽名。該 實(shí)現(xiàn)方式中的具體處理可以參考圖2對應(yīng)實(shí)施例中相應(yīng)的實(shí)現(xiàn)方式。
[0106] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,生成單元402還包括以下一項(xiàng)或多項(xiàng):轉(zhuǎn)換子 單元(未示出),用于在提取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向 量生成哈希簽名之前,將待檢測圖像從三通道圖像轉(zhuǎn)換為單通道圖像;腐蝕單元(未示出), 用于在提取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向量生成哈希簽名 之前,對待檢測圖像進(jìn)行腐蝕以弱化待檢測圖像中的字幕;去黑邊單元(未示出),用于在提 取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向量生成哈希簽名之前,去 除待檢測圖像的黑邊。該實(shí)現(xiàn)方式中的具體處理可以參考圖2對應(yīng)實(shí)施例中相應(yīng)的實(shí)現(xiàn)方 式。
[0107] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,生成子單元進(jìn)一步用于:將待測試圖像均勻 分塊,計(jì)算所分成的分塊的整體灰度均值以及各個塊各自的灰度均值;根據(jù)各個塊各自的 灰度均值與整體灰度均值的大小關(guān)系,生成與各個塊對應(yīng)的二進(jìn)制位,以形成哈希簽名。該 實(shí)現(xiàn)方式中的具體處理可以參考圖2對應(yīng)實(shí)施例中相應(yīng)的實(shí)現(xiàn)方式。
[0108] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,生成子單元進(jìn)一步用于:對待測試圖像放縮 為行數(shù)與列數(shù)均為8的整數(shù)倍的圖像;將已放縮圖像均勻分成行數(shù)與列數(shù)均為8的塊;計(jì)算 每個塊的DCT系數(shù)并量化;將每個已量化DCT系數(shù)中的前8位作為一行生成矩陣;對于矩陣的 每個列,計(jì)算列中元素的均值并根據(jù)列中每個元素的數(shù)值與該均值的大小關(guān)系生成與各個 元素對應(yīng)的二進(jìn)制位,以形成哈希簽名。該實(shí)現(xiàn)方式中的具體處理可以參考圖2對應(yīng)實(shí)施例 中相應(yīng)的實(shí)現(xiàn)方式。
[0109] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,生成子單元進(jìn)一步用于:將待測試圖像均勻 分塊,計(jì)算所分成的分塊的整體灰度均值以及各個塊各自的灰度均值,根據(jù)各個塊各自的 灰度均值與整體灰度均值的大小關(guān)系,生成與各個塊對應(yīng)的二進(jìn)制位,以形成待生成哈希 簽名的第一部分;對待測試圖像放縮為行數(shù)與列數(shù)均為8的整數(shù)倍的圖像;將已放縮圖像均 勻分成行數(shù)與列數(shù)均為8的塊;計(jì)算每個塊的DCT系數(shù)并量化;將每個已量化DCT系數(shù)中進(jìn)行 排序后的前8個作為矩陣的各行生成矩陣;對于矩陣的每個列,計(jì)算列中元素的均值并根據(jù) 列中每個元素的數(shù)值與該均值的大小關(guān)系生成與各個元素對應(yīng)的二進(jìn)制位,以形成待生成 哈希簽名的第二部分;基于第一部分和第二部分生成哈希簽名。該實(shí)現(xiàn)方式中的具體處理 可以參考圖2對應(yīng)實(shí)施例中相應(yīng)的實(shí)現(xiàn)方式。
[0110] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,視頻裝置400還包括:去重單元(未示出),用 于在將待檢測圖像序列中各個待檢測圖像的哈希簽名與從樣本視頻集合中各個樣本視頻 所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進(jìn)行匹配之前,基于待檢測圖像序列 中各個待檢測圖像的哈希簽名對待檢測圖像序列中的待檢測圖像進(jìn)行去重處理。該實(shí)現(xiàn)方 式中的具體處理可以參考圖2對應(yīng)實(shí)施例中相應(yīng)的實(shí)現(xiàn)方式。
[0111] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,匹配單元403進(jìn)一步用于:依次計(jì)算樣本圖像 序列中各個樣本圖像的哈希簽名將與該圖像的哈希簽名的漢明距離,并將漢明距離不大于 預(yù)設(shè)漢明距離閾值的哈希簽名所對應(yīng)的樣本圖像確定為匹配成功的樣本圖像。該實(shí)現(xiàn)方式 中的具體處理可以參考圖2對應(yīng)實(shí)施例中相應(yīng)的實(shí)現(xiàn)方式。
[0112] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,匹配單元403進(jìn)一步用于:將待測試圖像的哈 希簽名按位數(shù)平均分成m塊后從中選擇η塊作為查詢用子簽名,其中n<m-k;確定預(yù)先建立 的子簽名索引中與查詢用子簽名相同的子簽名,其中子簽名索引的各個子簽名是對樣本圖 像序列中各個樣本圖像的哈希簽名平均分成m塊后、將每η塊提取出來而形成的,且各個子 簽名與所對應(yīng)的樣本圖像是關(guān)聯(lián)的;對于與查詢用子簽名相同的各個子簽名,計(jì)算子簽名 所關(guān)聯(lián)的樣本圖像的哈希簽名中除子簽名外的其他m-n塊與待檢測圖像的哈希簽名中除查 詢用子簽名外的其他m-n塊之間的漢明距離;將漢明距離不大于預(yù)設(shè)漢明距離閾值k的哈希 簽名所對應(yīng)的樣本圖像確定為匹配成功的樣本圖像。該實(shí)現(xiàn)方式中的具體處理可以參考圖 2對應(yīng)實(shí)施例中相應(yīng)的實(shí)現(xiàn)方式。
[0113] 在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,上述樣本圖像序列中各個樣本圖像的哈希簽 名以及待測試圖像序列中各個待測試圖像的哈希簽名均為64位,k = 4,m = 6,η = 2。該實(shí)現(xiàn) 方式中的具體處理可以參考圖2對應(yīng)實(shí)施例中相應(yīng)的實(shí)現(xiàn)方式。
[0114] 下面參考圖5,其示出了適于用來實(shí)現(xiàn)本申請實(shí)施例的終端設(shè)備或服務(wù)器的計(jì)算 機(jī)系統(tǒng)500的結(jié)構(gòu)示意圖。
[0115] 如圖5所示,計(jì)算機(jī)系統(tǒng)500包括中央處理單元(CPU)501,其可以根據(jù)存儲在只讀 存儲器(R0M)502中的程序或者從存儲部分508加載到隨機(jī)訪問存儲器(RAM)503中的程序而 執(zhí)行各種適當(dāng)?shù)膭幼骱吞幚?。在RAM 503中,還存儲有系統(tǒng)500操作所需的各種程序和數(shù)據(jù)。 CPU 501、R0M 502以及RAM 503通過總線504彼此相連。輸入/輸出(I/O)接口505也連接至總 線 504。
[0116] 以下部件連接至I/O接口 505:包括鍵盤、鼠標(biāo)等的輸入部分506;包括諸如陰極射 線管(CRT)、液晶顯示器(LCD)等以及揚(yáng)聲器等的輸出部分507;包括硬盤等的存儲部分508; 以及包括諸如LAN卡、調(diào)制解調(diào)器等的網(wǎng)絡(luò)接口卡的通信部分509。通信部分509經(jīng)由諸如因 特網(wǎng)的網(wǎng)絡(luò)執(zhí)行通信處理。驅(qū)動器510也根據(jù)需要連接至I/O接口 505??刹鹦督橘|(zhì)511,諸如 磁盤、光盤、磁光盤、半導(dǎo)體存儲器等等,根據(jù)需要安裝在驅(qū)動器510上,以便于從其上讀出 的計(jì)算機(jī)程序根據(jù)需要被安裝入存儲部分508。
[0117] 特別地,根據(jù)本公開的實(shí)施例,上文參考流程圖描述的過程可以被實(shí)現(xiàn)為計(jì)算機(jī) 軟件程序。例如,本公開的實(shí)施例包括一種計(jì)算機(jī)程序產(chǎn)品,其包括有形地包含在機(jī)器可讀 介質(zhì)上的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這 樣的實(shí)施例中,該計(jì)算機(jī)程序可以通過通信部分509從網(wǎng)絡(luò)上被下載和安裝,和/或從可拆 卸介質(zhì)511被安裝。
[0118] 附圖中的流程圖和框圖,圖示了按照本申請各種實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程 序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個方框可以代 表一個模塊、程序段、或代碼的一部分,所述模塊、程序段、或代碼的一部分包含一個或多個 用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)中,方框中所 標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個接連地表示的方框?qū)嶋H 上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要 注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用 執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指 令的組合來實(shí)現(xiàn)。
[0119] 描述于本申請實(shí)施例中所涉及到的單元可以通過軟件的方式實(shí)現(xiàn),也可以通過硬 件的方式來實(shí)現(xiàn)。所描述的單元也可以設(shè)置在處理器中,例如,可以描述為:一種處理器包 括截取單元、生成單元、匹配單元、記錄單元和確定單元。其中,這些單元的名稱在某種情況 下并不構(gòu)成對該單元本身的限定,例如,截取單元還可以被描述為"從待檢測視頻中截取至 少一個圖像以形成待檢測圖像序列的單元"。
[0120] 作為另一方面,本申請還提供了一種非易失性計(jì)算機(jī)存儲介質(zhì),該非易失性計(jì)算 機(jī)存儲介質(zhì)可以是上述實(shí)施例中所述裝置中所包含的非易失性計(jì)算機(jī)存儲介質(zhì);也可以是 單獨(dú)存在,未裝配入終端中的非易失性計(jì)算機(jī)存儲介質(zhì)。上述非易失性計(jì)算機(jī)存儲介質(zhì)存 儲有一個或者多個程序,當(dāng)所述一個或者多個程序被一個設(shè)備執(zhí)行時,使得所述設(shè)備:從待 檢測視頻中截取至少一個圖像以形成待檢測圖像序列;生成所述待檢測圖像序列中每個待 檢測圖像的哈希簽名;將所述待檢測圖像序列中各個待檢測圖像的哈希簽名與從樣本視頻 集合中各個樣本視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進(jìn)行匹配,其中 樣本視頻的視頻標(biāo)識與從該樣本視頻所提取出的樣本圖像序列中各個樣本圖像的圖像標(biāo) 識是關(guān)聯(lián)存儲的;記錄所述樣本圖像序列中哈希簽名匹配成功的樣本圖像的圖像標(biāo)識以及 所述哈希簽名匹配成功的樣本圖像所屬的視頻的視頻標(biāo)識,并統(tǒng)計(jì)各個圖像標(biāo)識和各個視 頻標(biāo)識的出現(xiàn)次數(shù);將視頻標(biāo)識出現(xiàn)次數(shù)大于第一閾值、且視頻標(biāo)識所關(guān)聯(lián)的圖像標(biāo)識中 不同圖像標(biāo)識的出現(xiàn)次數(shù)大于第二閾值的樣本視頻,確定為所述待檢測視頻的同源視頻。
[0121] 以上描述僅為本申請的較佳實(shí)施例以及對所運(yùn)用技術(shù)原理的說明。本領(lǐng)域技術(shù)人 員應(yīng)當(dāng)理解,本申請中所涉及的發(fā)明范圍,并不限于上述技術(shù)特征的特定組合而成的技術(shù) 方案,同時也應(yīng)涵蓋在不脫離所述發(fā)明構(gòu)思的情況下,由上述技術(shù)特征或其等同特征進(jìn)行 任意組合而形成的其它技術(shù)方案。例如上述特征與本申請中公開的(但不限于)具有類似功 能的技術(shù)特征進(jìn)行互相替換而形成的技術(shù)方案。
【主權(quán)項(xiàng)】
1. 一種視頻檢測方法,其特征在于,所述方法包括: 從待檢測視頻中截取至少一個圖像以形成待檢測圖像序列; 生成所述待檢測圖像序列中每個待檢測圖像的哈希簽名; 將所述待檢測圖像序列中各個待檢測圖像的哈希簽名與從樣本視頻集合中各個樣本 視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進(jìn)行匹配,其中樣本視頻的視頻 標(biāo)識與從該樣本視頻所提取出的樣本圖像序列中各個樣本圖像的圖像標(biāo)識是關(guān)聯(lián)存儲的; 記錄所述樣本圖像序列中哈希簽名匹配成功的樣本圖像的圖像標(biāo)識以及所述哈希簽 名匹配成功的樣本圖像所屬的視頻的視頻標(biāo)識,并統(tǒng)計(jì)各個圖像標(biāo)識和各個視頻標(biāo)識的出 現(xiàn)次數(shù); 將視頻標(biāo)識出現(xiàn)次數(shù)大于第一閾值、且視頻標(biāo)識所關(guān)聯(lián)的圖像標(biāo)識中不同圖像標(biāo)識的 出現(xiàn)次數(shù)大于第二閾值的樣本視頻,確定為所述待檢測視頻的同源視頻。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從待檢測視頻中截取至少一個圖像以 形成待檢測圖像序列,包括: 在所述待檢測視頻中的視頻片段中,每隔第一預(yù)設(shè)幀數(shù)截取圖像,以形成待檢測圖像 序列。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述視頻片段是位于所述待檢測視頻的中 間部分且長度為第一預(yù)設(shè)時長的視頻片段。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述樣本圖像序列是針對各個樣本視頻中 位于樣本視頻的中間部分且時長為第二預(yù)設(shè)時長的視頻片段、每隔第二預(yù)設(shè)幀數(shù)截取圖像 所形成的,其中,所述第二預(yù)設(shè)時長大于所述第一預(yù)設(shè)時長且所述第二預(yù)設(shè)幀數(shù)小于所述 第一預(yù)設(shè)幀數(shù)。5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述生成所述待檢測圖像序列中每個待檢 測圖像的哈希簽名,包括: 提取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向量生成哈希簽名。6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,在所述提取各個待檢測圖像的全局特征向 量,并基于所提取的全局特征向量生成哈希簽名之前,所述生成所述圖像序列中每個圖像 的哈希簽名還包括以下一項(xiàng)或多項(xiàng): 將待檢測圖像從三通道圖像轉(zhuǎn)換為單通道圖像; 對待檢測圖像進(jìn)行腐蝕以弱化待檢測圖像中的字幕; 去除待檢測圖像的黑邊。7. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述提取各個待檢測圖像的全局特征向 量,并基于所提取的全局特征向量生成哈希簽名,包括: 將待測試圖像均勻分塊,計(jì)算所分成的分塊的整體灰度均值以及各個塊各自的灰度均 值; 根據(jù)各個塊各自的灰度均值與所述整體灰度均值的大小關(guān)系,生成與各個塊對應(yīng)的二 進(jìn)制位,以形成哈希簽名。8. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述提取各個待檢測圖像的全局特征向 量,并基于所提取的全局特征向量生成哈希簽名,包括: 對待測試圖像放縮為行數(shù)與列數(shù)均為8的整數(shù)倍的圖像; 將已放縮圖像均勻分成行數(shù)與列數(shù)均為8的塊; 計(jì)算每個塊的離散余弦變換DCT系數(shù)并量化; 將每個已量化DCT系數(shù)中的前8位作為一行生成矩陣; 對于所述矩陣的每個列,計(jì)算列中元素的均值并根據(jù)列中每個元素的數(shù)值與該均值的 大小關(guān)系生成與各個元素對應(yīng)的二進(jìn)制位,以形成哈希簽名。9. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述提取各個待檢測圖像的全局特征向 量,并基于所提取的全局特征向量生成哈希簽名,包括: 將待測試圖像均勻分塊,計(jì)算所分成的分塊的整體灰度均值以及各個塊各自的灰度均 值,根據(jù)各個塊各自的灰度均值與所述整體灰度均值的大小關(guān)系,生成與各個塊對應(yīng)的二 進(jìn)制位,以形成待生成哈希簽名的第一部分; 對待測試圖像放縮為行數(shù)與列數(shù)均為8的整數(shù)倍的圖像;將已放縮圖像均勻分成行數(shù) 與列數(shù)均為8的塊;計(jì)算每個塊的DCT系數(shù)并量化;將每個已量化DCT系數(shù)中進(jìn)行排序后的前 8個作為矩陣的各行生成矩陣;對于所述矩陣的每個列,計(jì)算列中元素的均值并根據(jù)列中每 個元素的數(shù)值與該均值的大小關(guān)系生成與各個元素對應(yīng)的二進(jìn)制位,以形成待生成哈希簽 名的第二部分; 基于所述第一部分和所述第二部分生成哈希簽名。10. 根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述將所述待檢測圖像序列中各個待 檢測圖像的哈希簽名與從樣本視頻集合中各個樣本視頻所提取出的樣本圖像序列中各個 樣本圖像的哈希簽名進(jìn)行匹配之前,所述方法還包括: 基于所述待檢測圖像序列中各個待檢測圖像的哈希簽名對所述待檢測圖像序列中的 待檢測圖像進(jìn)行去重處理。11. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述待檢測圖像序列中各個待檢 測圖像的哈希簽名與從樣本視頻集合中各個樣本視頻所提取出的樣本圖像序列中各個樣 本圖像的哈希簽名進(jìn)行匹配,包括: 依次計(jì)算所述樣本圖像序列中各個樣本圖像的哈希簽名將與該圖像的哈希簽名的漢 明距離,并將漢明距離不大于預(yù)設(shè)漢明距離閾值的哈希簽名所對應(yīng)的樣本圖像確定為匹配 成功的樣本圖像。12. 根據(jù)權(quán)利要求11所述的方法,其特征在于,所述依次計(jì)算所述樣本圖像序列中各個 樣本圖像的哈希簽名將與該圖像的哈希簽名的漢明距離,并將漢明距離不大于預(yù)設(shè)漢明距 離閾值k的哈希簽名所對應(yīng)的樣本圖像確定為匹配成功的樣本圖像,包括: 將待測試圖像的哈希簽名按位數(shù)平均分成m塊后從中選擇η塊作為查詢用子簽名,其中 n^im-k; 確定預(yù)先建立的子簽名索引中與所述查詢用子簽名相同的子簽名,其中所述子簽名索 引的各個子簽名是對樣本圖像序列中各個樣本圖像的哈希簽名平均分成m塊后、將每η塊提 取出來而形成的,且各個子簽名與所對應(yīng)的樣本圖像是關(guān)聯(lián)的; 對于與所述查詢用子簽名相同的各個子簽名,計(jì)算子簽名所關(guān)聯(lián)的樣本圖像的哈希簽 名中除子簽名外的其他m-n塊與待檢測圖像的哈希簽名中除查詢用子簽名外的其他m-n塊 之間的漢明距離; 將漢明距離不大于預(yù)設(shè)漢明距離閾值k的哈希簽名所對應(yīng)的樣本圖像確定為匹配成功 的樣本圖像。13. 根據(jù)權(quán)利要求12所述的方法,其特征在于,所述樣本圖像序列中各個樣本圖像的哈 希簽名以及待測試圖像序列中各個待測試圖像的哈希簽名均為64位,k = 4,m = 6,n = 2。14. 一種視頻檢測裝置,其特征在于,所述裝置包括: 截取單元,用于從待檢測視頻中截取至少一個圖像以形成待檢測圖像序列; 生成單元,用于生成所述待檢測圖像序列中每個待檢測圖像的哈希簽名; 匹配單元,用于將所述待檢測圖像序列中各個待檢測圖像的哈希簽名與從樣本視頻集 合中各個樣本視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進(jìn)行匹配,其中樣 本視頻的視頻標(biāo)識與從該樣本視頻所提取出的樣本圖像序列中各個樣本圖像的圖像標(biāo)識 是關(guān)聯(lián)存儲的; 記錄單元,用于記錄所述樣本圖像序列中哈希簽名匹配成功的樣本圖像的圖像標(biāo)識以 及所述哈希簽名匹配成功的樣本圖像所屬的視頻的視頻標(biāo)識,并統(tǒng)計(jì)各個圖像標(biāo)識和各個 視頻標(biāo)識的出現(xiàn)次數(shù); 確定單元,用于將視頻標(biāo)識出現(xiàn)次數(shù)大于第一閾值、且視頻標(biāo)識所關(guān)聯(lián)的圖像標(biāo)識中 不同圖像標(biāo)識的出現(xiàn)次數(shù)大于第二閾值的樣本視頻,確定為所述待檢測視頻的同源視頻。15. 根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述截取單元進(jìn)一步用于: 在所述待檢測視頻中的視頻片段中,每隔第一預(yù)設(shè)幀數(shù)截取圖像,以形成待檢測圖像 序列。16. 根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述視頻片段是位于所述待檢測視頻的 中間部分且長度為第一預(yù)設(shè)時長的視頻片段。17. 根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述生成單元包括: 生成子單元,用于提取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向 量生成哈希簽名。18. 根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述生成單元還包括以下一項(xiàng)或多項(xiàng): 轉(zhuǎn)換子單元,用于在所述提取各個待檢測圖像的全局特征向量,并基于所提取的全局 特征向量生成哈希簽名之前,將待檢測圖像從三通道圖像轉(zhuǎn)換為單通道圖像; 腐蝕單元,用于在所述提取各個待檢測圖像的全局特征向量,并基于所提取的全局特 征向量生成哈希簽名之前,對待檢測圖像進(jìn)行腐蝕以弱化待檢測圖像中的字幕; 去黑邊單元,用于在所述提取各個待檢測圖像的全局特征向量,并基于所提取的全局 特征向量生成哈希簽名之前,去除待檢測圖像的黑邊。19. 根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述匹配單元,進(jìn)一步用于:依次計(jì)算所 述樣本圖像序列中各個樣本圖像的哈希簽名將與該圖像的哈希簽名的漢明距離,并將漢明 距離不大于預(yù)設(shè)漢明距離閾值的哈希簽名所對應(yīng)的樣本圖像確定為匹配成功的樣本圖像。20. 根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述匹配單元進(jìn)一步用于: 將待測試圖像的哈希簽名按位數(shù)平均分成m塊后從中選擇η塊作為查詢用子簽名,其中 n^im-k; 確定預(yù)先建立的子簽名索引中與所述查詢用子簽名相同的子簽名,其中所述子簽名索 引的各個子簽名是對樣本圖像序列中各個樣本圖像的哈希簽名平均分成m塊后、將每η塊提 取出來而形成的,且各個子簽名與所對應(yīng)的樣本圖像是關(guān)聯(lián)的; 對于與所述查詢用子簽名相同的各個子簽名,計(jì)算子簽名所關(guān)聯(lián)的樣本圖像的哈希簽 名中除子簽名外的其他m-n塊與待檢測圖像的哈希簽名中除查詢用子簽名外的其他m-n塊 之間的漢明距離; 將漢明距離不大于預(yù)設(shè)漢明距離閾值k的哈希簽名所對應(yīng)的樣本圖像確定為匹配成功 的樣本圖像。
【文檔編號】G06K9/00GK105975939SQ201610298495
【公開日】2016年9月28日
【申請日】2016年5月6日
【發(fā)明人】申曉雷, 宋丙玉, 王源
【申請人】百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司