一種基于深度信念網(wǎng)絡(luò)的視頻熱度預(yù)測(cè)方法及其系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其設(shè)及一種基于深度信念網(wǎng)絡(luò)的視頻熱度預(yù)測(cè)方 法及其系統(tǒng)。
【背景技術(shù)】
[0002] 視頻點(diǎn)播量預(yù)測(cè)在互聯(lián)網(wǎng)數(shù)據(jù)挖掘領(lǐng)域中有著重要的作用,點(diǎn)播量高的視頻(尤 其是電影和電視劇)能夠提高廣告的播放量,提前預(yù)測(cè)出視頻的點(diǎn)播量已在廣告業(yè)務(wù)擴(kuò)展 方面有著廣泛的應(yīng)用。
[0003] 目前,對(duì)視頻類資源點(diǎn)播量的預(yù)測(cè)一般都采用基于歷史點(diǎn)播數(shù)據(jù)預(yù)測(cè)方法或者基 于人工方法預(yù)測(cè),采用基于歷史點(diǎn)播數(shù)據(jù)預(yù)測(cè)方法需要在視頻播出一段時(shí)間后才能進(jìn)行預(yù) 測(cè),而不能在視頻上線之前對(duì)點(diǎn)播量進(jìn)行預(yù)測(cè),采用基于人工方法預(yù)測(cè)嚴(yán)重依賴人的經(jīng)驗(yàn), 預(yù)測(cè)結(jié)果往往存在誤差較大的問題,進(jìn)而導(dǎo)致預(yù)測(cè)結(jié)果不準(zhǔn)確。
[0004] 因此,亟需設(shè)計(jì)一種視頻熱度的預(yù)測(cè)方法,W提高預(yù)測(cè)的準(zhǔn)確度和可靠性。
【發(fā)明內(nèi)容】
[0005] 有鑒于此,本發(fā)明的目的在于提供一種基于深度信念網(wǎng)絡(luò)的視頻熱度預(yù)測(cè)方法及 其系統(tǒng),旨在解決現(xiàn)有技術(shù)中視頻熱度預(yù)測(cè)的準(zhǔn)確度和可靠性較低的問題。
[0006] 本發(fā)明提出一種基于深度信念網(wǎng)絡(luò)的視頻熱度預(yù)測(cè)方法,包括:
[0007] 根據(jù)視頻特征選擇輸入變量并對(duì)影響因子進(jìn)行歸一量化,W對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處 理;
[000引根據(jù)所選擇的輸入變量W及特征重構(gòu)誤差確定單層的限制性玻爾茲曼機(jī)重構(gòu)維 數(shù),并通過(guò)多層限制性玻爾茲曼機(jī)的堆疊和BP神經(jīng)網(wǎng)絡(luò)W構(gòu)成深度信念網(wǎng)絡(luò);
[0009] 通過(guò)全局學(xué)習(xí)算法對(duì)所述深度信念網(wǎng)絡(luò)進(jìn)行調(diào)整,W獲取最優(yōu)視頻預(yù)測(cè)模型;
[0010] 將待測(cè)的視頻測(cè)試數(shù)據(jù)放入所述最優(yōu)視頻預(yù)測(cè)模型中進(jìn)行熱度預(yù)測(cè)分析W及觀 看量預(yù)測(cè)分析。
[0011] 優(yōu)選的,所述輸入變量具體包括視頻的出品年份、國(guó)家地區(qū)、視頻角標(biāo)、放映電視 臺(tái)、視頻類型、視頻總集數(shù)、視頻版權(quán)、制作等級(jí)、豆瓣評(píng)分、演員影響力、導(dǎo)演影響力W及百 度捜索指數(shù)。
[0012] 優(yōu)選的,所述構(gòu)成深度信念網(wǎng)絡(luò)包括深度信念網(wǎng)絡(luò)的網(wǎng)絡(luò)輸入層、限制性玻爾茲 曼機(jī)網(wǎng)絡(luò)層W及輸出層。
[0013] 優(yōu)選的,所述對(duì)所述深度信念網(wǎng)絡(luò)進(jìn)行調(diào)整包括調(diào)整所述網(wǎng)絡(luò)輸入層的層數(shù)、調(diào) 整限制性玻爾茲曼機(jī)網(wǎng)絡(luò)層的層數(shù)W及調(diào)整所述輸出層的層數(shù),W優(yōu)化網(wǎng)絡(luò)參數(shù)和預(yù)測(cè)模 型。
[0014] 另一方面,本發(fā)明還提供一種基于深度信念網(wǎng)絡(luò)的視頻熱度預(yù)測(cè)系統(tǒng),包括:
[0015] 預(yù)處理模塊,用于根據(jù)視頻特征選擇輸入變量并對(duì)影響因子進(jìn)行歸一量化,W對(duì) 訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理;
[0016] 網(wǎng)絡(luò)構(gòu)建模塊,用于根據(jù)所選擇的輸入變量W及特征重構(gòu)誤差確定單層的限制性 玻爾茲曼機(jī)重構(gòu)維數(shù),并通過(guò)多層限制性玻爾茲曼機(jī)的堆疊和BP神經(jīng)網(wǎng)絡(luò)W構(gòu)成深度信念 網(wǎng)絡(luò);
[0017] 模型獲取模塊,用于通過(guò)全局學(xué)習(xí)算法對(duì)所述深度信念網(wǎng)絡(luò)進(jìn)行調(diào)整,W獲取最 優(yōu)視頻預(yù)測(cè)模型;
[0018] 預(yù)測(cè)分析模塊,用于將待測(cè)的視頻測(cè)試數(shù)據(jù)放入所述最優(yōu)視頻預(yù)測(cè)模型中進(jìn)行熱 度預(yù)測(cè)分析W及觀看量預(yù)測(cè)分析。
[0019] 優(yōu)選的,所述輸入變量具體包括視頻的出品年份、國(guó)家地區(qū)、視頻角標(biāo)、放映電視 臺(tái)、視頻類型、視頻總集數(shù)、視頻版權(quán)、制作等級(jí)、豆瓣評(píng)分、演員影響力、導(dǎo)演影響力W及百 度捜索指數(shù)。
[0020] 優(yōu)選的,所述構(gòu)成深度信念網(wǎng)絡(luò)包括深度信念網(wǎng)絡(luò)的網(wǎng)絡(luò)輸入層、限制性玻爾茲 曼機(jī)網(wǎng)絡(luò)層W及輸出層。
[0021] 優(yōu)選的,所述對(duì)所述深度信念網(wǎng)絡(luò)進(jìn)行調(diào)整包括調(diào)整所述網(wǎng)絡(luò)輸入層的層數(shù)、調(diào) 整限制性玻爾茲曼機(jī)網(wǎng)絡(luò)層的層數(shù)W及調(diào)整所述輸出層的層數(shù),W優(yōu)化網(wǎng)絡(luò)參數(shù)和預(yù)測(cè)模 型。
[0022] 在本發(fā)明實(shí)施例中,本發(fā)明提供的技術(shù)方案提出了一種基于深度信念網(wǎng)絡(luò)的在線 視頻預(yù)測(cè)模型,將深層神經(jīng)網(wǎng)絡(luò)應(yīng)用于在線視頻預(yù)測(cè)領(lǐng)域,且能提高預(yù)測(cè)的準(zhǔn)確度和可靠 性,進(jìn)而能為視頻在上映前的投資和播放提供有價(jià)值的參考,既能更可靠地預(yù)測(cè)在線視頻 的熱度,又能得到精確的播放量波動(dòng)范圍,具有實(shí)際的意義。
【附圖說(shuō)明】
[0023] 圖1為本發(fā)明一實(shí)施方式中基于深度信念網(wǎng)絡(luò)的視頻熱度預(yù)測(cè)方法流程圖;
[0024] 圖2為本發(fā)明一實(shí)施方式中DB化網(wǎng)絡(luò)的結(jié)構(gòu)示意圖;
[0025] 圖3為本發(fā)明一實(shí)施方式中不同視頻數(shù)據(jù)的觀看量預(yù)測(cè)值與實(shí)際值的對(duì)比示意 圖;
[0026] 圖4為本發(fā)明一實(shí)施方式中基于深度信念網(wǎng)絡(luò)的視頻熱度預(yù)測(cè)系統(tǒng)結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0027] 為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,W下結(jié)合附圖及實(shí)施例,對(duì) 本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用W解釋本發(fā)明,并 不用于限定本發(fā)明。
[0028] 本發(fā)明【具體實(shí)施方式】提供了一種基于深度信念網(wǎng)絡(luò)的視頻熱度預(yù)測(cè)方法,主要包 括如下步驟:
[0029] S11、根據(jù)視頻特征選擇輸入變量并對(duì)影響因子進(jìn)行歸一量化,W對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行 預(yù)處理;
[0030] S12、根據(jù)所選擇的輸入變量W及特征重構(gòu)誤差確定單層的限制性玻爾茲曼機(jī)重 構(gòu)維數(shù),并通過(guò)多層限制性玻爾茲曼機(jī)的堆疊和BP神經(jīng)網(wǎng)絡(luò)W構(gòu)成深度信念網(wǎng)絡(luò);
[0031] S13、通過(guò)全局學(xué)習(xí)算法對(duì)所述深度信念網(wǎng)絡(luò)進(jìn)行調(diào)整,W獲取最優(yōu)視頻預(yù)測(cè)模 型;
[0032] S14、將待測(cè)的視頻測(cè)試數(shù)據(jù)放入所述最優(yōu)視頻預(yù)測(cè)模型中進(jìn)行熱度預(yù)測(cè)分析W 及觀看量預(yù)測(cè)分析。
[0033] 本發(fā)明通過(guò)對(duì)實(shí)際在線視頻服務(wù)系統(tǒng)所采集的海量數(shù)據(jù)研究,結(jié)合中國(guó)在線視頻 市場(chǎng)提供了一種基于深度信念網(wǎng)絡(luò)的視頻熱度預(yù)測(cè)方法,結(jié)合社交網(wǎng)絡(luò)的關(guān)注度和視頻關(guān) 鍵詞的捜索熱度,對(duì)影響因子進(jìn)行了建模和量化處理,提出了一種基于深度信念網(wǎng)絡(luò)的在 線視頻預(yù)測(cè)模型,將深層神經(jīng)網(wǎng)絡(luò)應(yīng)用于在線視頻預(yù)測(cè)領(lǐng)域,且能提高預(yù)測(cè)的準(zhǔn)確度和可 靠性,進(jìn)而能為視頻在上映前的投資和播放提供有價(jià)值的參考,既能更可靠地預(yù)測(cè)在線視 頻的熱度,又能得到精確的播放量波動(dòng)范圍,具有實(shí)際的意義。
[0034] W下將對(duì)本發(fā)明所提供的一種基于深度信念網(wǎng)絡(luò)的視頻熱度預(yù)測(cè)方法進(jìn)行詳細(xì) 說(shuō)明。
[0035] 請(qǐng)參閱圖1,為本發(fā)明一實(shí)施方式中基于深度信念網(wǎng)絡(luò)的視頻熱度預(yù)測(cè)方法流程 圖。
[0036] 在步驟Sll中,根據(jù)視頻特征選擇輸入變量并對(duì)影響因子進(jìn)行歸一量化,W對(duì)訓(xùn)練 數(shù)據(jù)進(jìn)行預(yù)處理。
[0037] 在本實(shí)施方式中,訓(xùn)練數(shù)據(jù)主要分為站內(nèi)數(shù)據(jù)和站外數(shù)據(jù),站內(nèi)數(shù)據(jù)來(lái)自騰訊視 頻分布式數(shù)據(jù)上報(bào)系統(tǒng)的每日觀看數(shù)據(jù)和騰訊視頻官方提供的媒資信息。每條媒資信息包 括電視劇視頻的名稱、標(biāo)識(shí)、國(guó)家地區(qū)、制作集數(shù)、類型、上映時(shí)間等;站外數(shù)據(jù)通過(guò)對(duì)視頻 關(guān)鍵字的提取,人工爬取了百度平臺(tái)的捜索指數(shù),W及通過(guò)新浪博客提供的接口爬取了視 頻演員的粉絲量作為衡量演員影響力的重要指標(biāo)。
[0038] 在本實(shí)施方式中,為了提高預(yù)測(cè)模型的性能,合理選擇變量,在進(jìn)行預(yù)測(cè)分析之 前,本發(fā)明可W把視頻特征歸納成=個(gè)維度,即一級(jí)數(shù)據(jù)、二級(jí)數(shù)據(jù)W及=級(jí)數(shù)據(jù),其中,一 級(jí)數(shù)據(jù)包括視頻放映信息、視頻基本內(nèi)容W及民眾關(guān)注度,二級(jí)數(shù)據(jù)包括檔期、放映數(shù)據(jù)、 人物信息、視頻介紹、捜索熱度、社區(qū)熱度等等,=級(jí)數(shù)據(jù)包括出品年份、國(guó)家地區(qū)、放映電 視臺(tái)、導(dǎo)演、演員、類型、視頻簡(jiǎn)介、百度指數(shù)、豆瓣評(píng)分、新浪微博等等。
[0039] 在本實(shí)施方式中,所述輸入變量具體包括視頻的出品年份、國(guó)家地區(qū)、視頻角標(biāo)、 放映電視臺(tái)、視頻類型、視頻總集數(shù)、制作等級(jí)、豆瓣評(píng)分、演員影響力W及百度捜索指數(shù)。
[0040] 在本實(shí)施方式中,選取視頻的出品年份、國(guó)家地區(qū)、視頻角標(biāo)、放映電視臺(tái)、視頻類 型、視頻總集數(shù)、視頻版權(quán)、制作等級(jí)、豆瓣評(píng)分、演員影響力、導(dǎo)演影響力W及百度捜索指 數(shù)作為輸入特征,并賦予各輸入特征不同的權(quán)值表示輸入變量,即:
[0042] 其中,Wyear表示出品年份影響力權(quán)值;Warea表示國(guó)家地區(qū)影響力權(quán)值;Wimgtag表示視 頻角標(biāo)影響力權(quán)值;Wtv表示視頻放映電視臺(tái)影響力權(quán)值;Wgenre表示視頻類型影響力權(quán)值; Wright表示視頻版權(quán)影響力權(quán)值;Wepisode表示視頻總集數(shù)影響力權(quán)值;Wrank表示視頻制作等 級(jí)影響力權(quán)值;Wcbuban表示豆瓣評(píng)分影響力權(quán)值;Wactor表示演員影響力權(quán)值;Wdirctor表示視 頻導(dǎo)演影響力權(quán)值;Wbaidu表示百度捜索指數(shù)影響力權(quán)值,本發(fā)明考慮到連續(xù)的變量值可W 提高網(wǎng)絡(luò)的敏感性,本文將所有的輸入變量都處理成[0,1 ]區(qū)間的連續(xù)數(shù)值。
[0043] 在本實(shí)施方