一種基于關(guān)鍵幀和顏色直方圖的網(wǎng)絡(luò)視頻格式文件摘要提取方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種基于關(guān)鍵幀和顏色直方圖的網(wǎng)絡(luò)視頻格式文件摘要提取方法,其具體步驟如下:通過(guò)URL確定網(wǎng)絡(luò)視頻格式文件的地址;利用UDP協(xié)議緩存下載網(wǎng)絡(luò)視頻格式文件;將視頻序列切分為若干鏡頭,再?gòu)拿總€(gè)鏡頭中按均勻時(shí)間間隔提取3個(gè)關(guān)鍵幀;基于關(guān)鍵幀之間的差異計(jì)算鏡頭之間的距離矩陣,然后采用層次匯合聚類(lèi)算法HAC對(duì)鏡頭進(jìn)行層次聚類(lèi);從每個(gè)聚合類(lèi)中選出時(shí)間最長(zhǎng)的鏡頭,將摘要的總時(shí)間長(zhǎng)度按比例分配給每個(gè)選出的鏡頭,根據(jù)分配的時(shí)間長(zhǎng)度,根據(jù)顏色直方圖對(duì)關(guān)鍵幀打分,從每個(gè)選出的鏡頭中找出一個(gè)重要連續(xù)片段;最終的摘要就是將這些片段按時(shí)間順序進(jìn)行串接所形成的視頻序列。
【專(zhuān)利說(shuō)明】
一種基于關(guān)鍵幀和顏色直方圖的網(wǎng)絡(luò)視頻格式文件摘要提取方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及一種基于關(guān)鍵幀和顏色直方圖的網(wǎng)絡(luò)視頻格式文件摘要提取方法
【背景技術(shù)】
[0002]目前網(wǎng)絡(luò)爬蟲(chóng)只爬取文本,不能爬取音樂(lè)、圖片和視頻等多媒體文件,原因主要是多媒體數(shù)據(jù)量巨大;如何下載傳輸多媒體文件;如何索引多媒體文件;進(jìn)而對(duì)處理過(guò)的多媒體文件進(jìn)行檢索?,F(xiàn)在因特網(wǎng)上有大量的多媒體文件,特別是社交網(wǎng)站和多媒體分享的興起,需要對(duì)多媒體文件進(jìn)行精準(zhǔn)檢索。
[0003]網(wǎng)絡(luò)爬蟲(chóng),也稱(chēng)網(wǎng)絡(luò)蜘蛛、網(wǎng)絡(luò)機(jī)器人,是一個(gè)自動(dòng)提取網(wǎng)頁(yè)的程序,它從因特網(wǎng)上下載網(wǎng)頁(yè),是搜索引擎的重要組成部分。網(wǎng)絡(luò)爬蟲(chóng)利用標(biāo)準(zhǔn)的HTTP協(xié)議,根據(jù)超級(jí)鏈接和Web文檔檢索的方法遍歷因特網(wǎng)信息空間。
[0004]因特網(wǎng)上有數(shù)千種不同的數(shù)據(jù)類(lèi)型,HTTP給每種要通過(guò)Web傳輸?shù)膶?duì)象都打上了名為MME類(lèi)型的數(shù)據(jù)格式標(biāo)簽(常見(jiàn)視頻格式:video/MP4V-ES,video/mpeg, video/quicktime, video/vnd.mpegurl, video/x-msvideo)。統(tǒng)一資源定位符(URL)是資源標(biāo)識(shí)符最常見(jiàn)的形式。URL描述了一臺(tái)特定服務(wù)器上某資源的特定位置。
[0005]UDP是OSI參考模型中一種無(wú)連接的傳輸層協(xié)議,它主要用于不要求分組順序到達(dá)的傳輸中,分組傳輸順序的檢查與排序由應(yīng)用層完成,提供面向事務(wù)的簡(jiǎn)單不可靠信息傳送服務(wù)。網(wǎng)絡(luò)視頻可通過(guò)UDP進(jìn)行下載,因?yàn)閁DP具有TCP所望塵莫及的速度優(yōu)勢(shì)。
[0006]本發(fā)明提供了一種基于關(guān)鍵幀和顏色直方圖的網(wǎng)絡(luò)視頻格式文件摘要提取方法,可在適當(dāng)增加數(shù)據(jù)量的前提下,通過(guò)URL確定網(wǎng)絡(luò)視頻格式文件的地址,利用UDP協(xié)議緩存下載網(wǎng)絡(luò)視頻格式文件,將視頻序列切分為若干鏡頭,然后根據(jù)顏色直方圖從鏡頭中提取關(guān)鍵幀,最終形成網(wǎng)絡(luò)視頻格式文件摘要。
【發(fā)明內(nèi)容】
[0007]本發(fā)明的目的在于提供一種基于關(guān)鍵幀和顏色直方圖的網(wǎng)絡(luò)視頻格式文件摘要提取方法。本發(fā)明包括以下特征:
[0008]發(fā)明技術(shù)方案
[0009]—種基于關(guān)鍵幀和顏色直方圖的網(wǎng)絡(luò)視頻格式文件摘要提取方法,其具體步驟如下:
[0010]I)通過(guò)URL確定網(wǎng)絡(luò)視頻格式文件的地址;
[0011 ] 2)利用UDP協(xié)議緩存下載網(wǎng)絡(luò)視頻格式文件;
[0012]3)將視頻序列切分為若干鏡頭,再?gòu)拿總€(gè)鏡頭中按均勻時(shí)間間隔提取3個(gè)關(guān)鍵幀;
[0013]4)基于關(guān)鍵幀之間的差異計(jì)算鏡頭之間的距離矩陣,然后采用層次匯合聚類(lèi)算法HAC,對(duì)鏡頭進(jìn)行層次聚類(lèi);
[0014]5)從每個(gè)聚合類(lèi)中選出時(shí)間最長(zhǎng)的鏡頭,將摘要的總時(shí)間長(zhǎng)度按比例分配給每個(gè)選出的鏡頭,根據(jù)分配的時(shí)間長(zhǎng)度,根據(jù)顏色直方圖對(duì)關(guān)鍵幀打分,從每個(gè)選出的鏡頭中找出一個(gè)重要連續(xù)片段;
[0015]6)最終的摘要就是將這些片段按時(shí)間順序進(jìn)行串接所形成的視頻序列。
【附圖說(shuō)明】
[0016]圖1是基于關(guān)鍵幀和顏色直方圖的網(wǎng)絡(luò)視頻格式文件摘要提取流程圖。
【具體實(shí)施方式】
[0017]這種基于關(guān)鍵幀和顏色直方圖的網(wǎng)絡(luò)視頻格式文件摘要提取方法,包括如下步驟:
[0018]I)通過(guò)URL確定網(wǎng)絡(luò)視頻格式文件的地址;
[0019]2)利用UDP協(xié)議緩存下載網(wǎng)絡(luò)視頻格式文件;
[0020]3)將視頻序列切分為若干鏡頭,再?gòu)拿總€(gè)鏡頭中按均勻時(shí)間間隔提取3個(gè)關(guān)鍵幀;
[0021]4)基于關(guān)鍵幀之間的差異計(jì)算鏡頭之間的距離矩陣,然后采用層次匯合聚類(lèi)算法HAC,對(duì)鏡頭進(jìn)行層次聚類(lèi);
[0022]5)從每個(gè)聚合類(lèi)中選出時(shí)間最長(zhǎng)的鏡頭,將摘要的總時(shí)間長(zhǎng)度按比例分配給每個(gè)選出的鏡頭,根據(jù)分配的時(shí)間長(zhǎng)度,根據(jù)顏色直方圖對(duì)關(guān)鍵幀打分,從每個(gè)選出的鏡頭中找出一個(gè)重要連續(xù)片段;
[0023]6)最終的摘要就是將這些片段按時(shí)間順序進(jìn)行串接所形成的視頻序列。
【主權(quán)項(xiàng)】
1.一種基于關(guān)鍵幀和顏色直方圖的網(wǎng)絡(luò)視頻格式文件摘要提取方法,其具體步驟如下: 1)通過(guò)URL確定網(wǎng)絡(luò)視頻格式文件的地址; 2)利用UDP協(xié)議緩存下載網(wǎng)絡(luò)視頻格式文件; 3)將視頻序列切分為若干鏡頭,再?gòu)拿總€(gè)鏡頭中按均勻時(shí)間間隔提取3個(gè)關(guān)鍵幀; 4)基于關(guān)鍵幀之間的差異計(jì)算鏡頭之間的距離矩陣,然后采用層次匯合聚類(lèi)算法HAC,對(duì)鏡頭進(jìn)行層次聚類(lèi); 5)從每個(gè)聚合類(lèi)中選出時(shí)間最長(zhǎng)的鏡頭,將摘要的總時(shí)間長(zhǎng)度按比例分配給每個(gè)選出的鏡頭,根據(jù)分配的時(shí)間長(zhǎng)度,根據(jù)顏色直方圖對(duì)關(guān)鍵幀打分,從每個(gè)選出的鏡頭中找出一個(gè)重要連續(xù)片段; 6)最終的摘要就是將這些片段按時(shí)間順序進(jìn)行串接所形成的視頻序列。
【文檔編號(hào)】H04N21/8549GK105992074SQ201510041681
【公開(kāi)日】2016年10月5日
【申請(qǐng)日】2015年1月27日
【發(fā)明人】張軍
【申請(qǐng)人】張軍