基于特征分類的視頻相似度確定及視頻推薦方法
【專利摘要】本發(fā)明公開(kāi)了一種基于特征分類的視頻相似度確定及視頻推薦方法,視頻相似度確定方法包括:獲取參考視頻的主特征和所有次特征;根據(jù)獲取到的所述參考視頻的主特征從特征視頻集合中查找具有該主特征的特征視頻子集合;從所述特征視頻子集合中查找與所述參考視頻具有相同次特征的視頻,并作為相關(guān)視頻;計(jì)算所述相關(guān)視頻與所述參考視頻的內(nèi)容相似度,確定為特征分類相似度??梢越鉀Q現(xiàn)有技術(shù)基于視頻內(nèi)容確定視頻相似度時(shí)因遍歷所有視頻記錄而存在的計(jì)算量大、耗時(shí)長(zhǎng)的問(wèn)題。將本發(fā)明獲得的特征分類相似度與操作相似度及人物相似度融合,確定總視頻相似度來(lái)推薦視頻,可以解決現(xiàn)有技術(shù)視頻推薦結(jié)果單一、無(wú)法滿足多樣化需求的問(wèn)題。
【專利說(shuō)明】基于特征分類的視頻相似度確定及視頻推薦方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于數(shù)據(jù)處理【技術(shù)領(lǐng)域】,具體地說(shuō),是涉及視頻相似度的確定及視頻推薦,更具體地說(shuō),是涉及基于特征分類的視頻相似度確定及視頻推薦方法。
【背景技術(shù)】
[0002]目前,視頻平臺(tái)基本都具有智能視頻推薦系統(tǒng)。用戶在通過(guò)視頻平臺(tái)查看某視頻的介紹或觀看某視頻,平臺(tái)的智能視頻推薦系統(tǒng)會(huì)自動(dòng)為用戶推薦并呈現(xiàn)與用戶所查看或觀看的視頻相關(guān)的視頻,可以在避免用戶手動(dòng)搜索的情況下,幫助用戶找到自己感興趣的視頻,不但方便了用戶,而且增加了用戶在視頻網(wǎng)站上的停留時(shí)間。而且,現(xiàn)有智能視頻推薦系統(tǒng)大都是通過(guò)搜索相關(guān)視頻、確定視頻之間的相似度,進(jìn)而根據(jù)相似度的大小向用戶推薦視頻。
[0003]現(xiàn)有智能視頻推薦系統(tǒng)確定視頻之間的相似度時(shí),常用的方法是基于視頻內(nèi)容來(lái)實(shí)現(xiàn)。具體而目,首先提取每個(gè)視頻的視頻標(biāo)簽;然后,針對(duì)當(dāng)如視頻的每個(gè)視頻標(biāo)簽,依次遍歷除當(dāng)前視頻之外的所有視頻的視頻標(biāo)簽,查找到具有相同視頻標(biāo)簽的視頻作為相關(guān)視頻;然后,根據(jù)每個(gè)相同視頻標(biāo)簽的權(quán)重計(jì)算當(dāng)前視頻與相關(guān)視頻的相似度。在該過(guò)程中,針對(duì)當(dāng)前視頻的每個(gè)視頻標(biāo)簽,均需要遍歷當(dāng)前視頻之外的所有視頻。視頻標(biāo)簽越多,遍歷次數(shù)越多,視頻推薦速度就越慢。
[0004]上述確定視頻相似度的方法在視頻數(shù)量、視頻標(biāo)簽數(shù)量較少的情況下是能夠接受的。但是,面對(duì)信息爆炸時(shí)代產(chǎn)生的海量視頻及高匹配度視頻推薦的需求,如果仍采用多次遍歷所有視頻的方法來(lái)獲取相關(guān)視頻,耗時(shí)長(zhǎng),速度慢,對(duì)視頻推薦系統(tǒng)的處理能力和處理速度提出了嚴(yán)苛的要求,嚴(yán)重影響視頻推薦的速度。
[0005]此外,單純基于視頻內(nèi)容進(jìn)行視頻推薦,在視頻數(shù)量較少的情況下,各個(gè)視頻的基礎(chǔ)信息可能會(huì)存在很大差異。即使視頻數(shù)量較多,也會(huì)使得推薦結(jié)果單純依賴于視頻基礎(chǔ)信息,推薦的視頻單一,無(wú)法實(shí)現(xiàn)多樣化的推薦需求。雖然現(xiàn)有智能視頻推薦系統(tǒng)中出現(xiàn)了一種基于用戶操作行為確定視頻的操作相似度的技術(shù),例如,根據(jù)用戶觀看視頻的行為、用戶收藏視頻的行為、用戶瀏覽視頻詳情介紹的行為等,確定視頻的操作相似度。但是,不管是基于視頻內(nèi)容進(jìn)行推薦,還是基于用戶操作行為進(jìn)行推薦,均與用戶及其所看的作品具有很強(qiáng)的相關(guān)性,無(wú)法實(shí)現(xiàn)與當(dāng)前熱點(diǎn)的關(guān)聯(lián),仍無(wú)法實(shí)現(xiàn)多樣化的視頻推薦,也難以充分挖掘和利用視頻中的長(zhǎng)尾數(shù)據(jù)。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的之一是提供一種基于特征分類的視頻相似度確定方法,以解決現(xiàn)有技術(shù)基于視頻內(nèi)容確定視頻相似度時(shí)因多次遍歷視頻而存在的耗時(shí)長(zhǎng)、速度慢的問(wèn)題。
[0007]為解決上述技術(shù)問(wèn)題,本發(fā)明提供的基于特征分類的視頻相似度確定方法采用下述技術(shù)方案來(lái)實(shí)現(xiàn):
一種基于特征分類的視頻相似度確定方法,所述方法包括: 獲取參考視頻的主特征和所有次特征;
根據(jù)獲取到的所述參考視頻的主特征從特征視頻集合中查找具有該主特征的特征視頻子集合;
從所述特征視頻子集合中查找與所述參考視頻具有相同次特征的視頻,并作為相關(guān)視頻;
計(jì)算所述相關(guān)視頻與所述參考視頻的內(nèi)容相似度,確定為特征分類相似度;
其中,所述主特征和所述次特征均為視頻的視頻標(biāo)簽,所述特征視頻集合為根據(jù)視頻標(biāo)簽中的主特征和次特征將視頻分類后形成的集合,所述特征視頻集合包括若干與主特征一一對(duì)應(yīng)的所述特征視頻子集合。
[0008]本發(fā)明的目的之二是提供一種基于特征分類的視頻推薦方法,以解決現(xiàn)有技術(shù)視頻推薦結(jié)果單一、無(wú)法滿足多樣化需求的問(wèn)題。
[0009]為解決上述發(fā)明目的,本發(fā)明提供的基于特征分類的視頻推薦方法采用下述技術(shù)方案予以實(shí)現(xiàn):
一種基于特征分類的視頻推薦方法,所述方法包括:
獲取參考視頻的相關(guān)視頻;
獲取所述相關(guān)視頻與所述參考視頻的特征分類相似度、操作相似度及人物相似度;根據(jù)所述特征分類相似度、所述操作相似度及所述人物相似度確定所述相關(guān)視頻與所述參考視頻的總視頻相似度;
根據(jù)所述總視頻相似度推薦視頻;
其中,所述參考視頻的相關(guān)視頻及所述特征分類相似度根據(jù)上述權(quán)利要求1至3中任一項(xiàng)所述的方法獲得;
獲取所述人物相似度的具體過(guò)程為:
為每個(gè)視頻設(shè)置指定人物的人物相關(guān)信息屬性,獲取所述參考視頻中的人物相關(guān)信息屬性值和所述相關(guān)視頻中的人物相關(guān)信息屬性值,按照設(shè)定準(zhǔn)則對(duì)所述人物相關(guān)信息屬性值進(jìn)行量化,分別獲得所述參考視頻的人物屬性向量和所述相關(guān)視頻的人物屬性向量,利用兩個(gè)所述人物屬性向量、采用余弦相似度方法獲得所述相關(guān)視頻與所述參考視頻的人物相似度。
[0010]與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點(diǎn)和積極效果是:
1、本發(fā)明根據(jù)視頻標(biāo)簽的主特征和次特征將視頻進(jìn)行分類處理,形成特征視頻集合,在確定參考視頻的相關(guān)視頻時(shí),僅需要遍歷與參考視頻具有相同主特征的特征視頻子集合中的次特征,無(wú)需遍歷所有視頻中的所有視頻標(biāo)簽,極大減少了根據(jù)視頻標(biāo)簽確定視頻內(nèi)容相似度的時(shí)間和數(shù)據(jù)處理量,有助于視頻推薦系統(tǒng)快速地確定視頻相似度,并向用戶推薦相關(guān)視頻;
2、本發(fā)明將基于視頻內(nèi)容的特征分類相似度、基于用戶操作行為的操作相似度及基于人物相關(guān)信息的人物相似度相結(jié)合來(lái)確定總視頻相似度,并根據(jù)總視頻相似度向用戶推薦視頻,實(shí)現(xiàn)了與用戶及所看作品內(nèi)容具有強(qiáng)相關(guān)的相似度和與當(dāng)前熱點(diǎn)信息相關(guān)的相似度結(jié)合,能夠滿足用戶多樣化的觀看需求,且通過(guò)多相似度的融合,更容易將海量視頻中用戶未看過(guò)或極少觀看的視頻推薦給用戶,有助于充分挖掘和利用視頻中的長(zhǎng)尾數(shù)據(jù)。
[0011]結(jié)合附圖閱讀本發(fā)明的【具體實(shí)施方式】后,本發(fā)明的其他特點(diǎn)和優(yōu)點(diǎn)將變得更加清
/E.ο
【專利附圖】
【附圖說(shuō)明】
[0012]圖1是本發(fā)明基于特征分類的視頻相似度確定方法一個(gè)實(shí)施例的流程圖;
圖2是圖1中特征視頻集合的一個(gè)示意圖;
圖3是本發(fā)明基于特征分類的視頻推薦方法一個(gè)實(shí)施例的流程圖;
圖4是圖3中獲取操作相似度的一個(gè)具體流程圖。
【具體實(shí)施方式】
[0013]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下將結(jié)合附圖和實(shí)施例,對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。
[0014]簡(jiǎn)要說(shuō)明本發(fā)明的技術(shù)思路:
本發(fā)明從與視頻內(nèi)容相關(guān)性較強(qiáng)的視頻標(biāo)簽中提取出一個(gè)典型視頻標(biāo)簽作為主特征,其余視頻標(biāo)簽作為次特征,根據(jù)主特征和次特征對(duì)視頻進(jìn)行特征分類,形成特征視頻集合;在確定某個(gè)視頻(即參考視頻)的相關(guān)視頻時(shí),僅需從特征視頻集合中查找與參考視頻主特征相同的特征視頻子集合,在特征視頻子集合中對(duì)參考視頻的次特征進(jìn)行匹配,確定出相關(guān)視頻,然后再計(jì)算得到參考視頻與相關(guān)視頻的內(nèi)容相似度,實(shí)現(xiàn)基于特征分類的視頻特征分類相似度確定。應(yīng)用該方法確定視頻相似度時(shí),無(wú)需多次遍歷大量視頻,查找針對(duì)的數(shù)據(jù)量少,查找相關(guān)視頻的速度快,數(shù)據(jù)處理量少,從而可以快速、準(zhǔn)確地確定出視頻相似度。
[0015]此外,本發(fā)明在確定了基于特征分類的特征分類視頻相似度之后,再與基于用戶操作行為的操作相似度和基于人物相關(guān)信息的人物相似度相結(jié)合,作為兩個(gè)視頻的總視頻相似度,并根據(jù)總視頻相似度得到某一參考視頻的一系列相關(guān)視頻的排名,向用戶推薦排名結(jié)果靠前的視頻,提高了視頻推薦結(jié)果的多樣性。
[0016]請(qǐng)參見(jiàn)圖1,該圖所示為本發(fā)明基于特征分類的視頻相似度確定方法一個(gè)實(shí)施例的流程圖。
[0017]如圖1所示,該實(shí)施例確定視頻相似度的具體過(guò)程如下:
步驟101:獲取參考視頻的主特征和所有次特征。
[0018]其中,參考視頻是指當(dāng)前用戶正在觀看視頻,確定視頻相似度是確定其他視頻與該參考視頻的相似度,從而實(shí)現(xiàn)根據(jù)參考視頻進(jìn)行相關(guān)視頻推薦。主特征和次特征均為視頻的視頻標(biāo)簽。而且,主特征為一個(gè)典型視頻標(biāo)簽,主特征之外的其余視頻標(biāo)簽均作為次特征。舉例來(lái)說(shuō),將視頻標(biāo)簽中的視頻類型標(biāo)簽作為主特征,其余視頻標(biāo)簽例如演員、導(dǎo)演等均作為次特征。對(duì)于一個(gè)視頻集合而言,集合中的所有視頻的主特征均為同類視頻標(biāo)簽。
[0019]具體而言,視頻標(biāo)簽可以通過(guò)對(duì)視頻的基礎(chǔ)描述信息進(jìn)行分詞處理后得到。具體來(lái)說(shuō),視頻的基礎(chǔ)描述信息中包括有視頻名稱、視頻類型、國(guó)家、演員、導(dǎo)演、影片簡(jiǎn)介等。將視頻的基礎(chǔ)描述信息進(jìn)行分詞處理,處理結(jié)果去重后生成視頻標(biāo)簽。然后,根據(jù)推薦需要或預(yù)先設(shè)定,確定主特征和次特征,并進(jìn)行標(biāo)記。
[0020]步驟102:根據(jù)獲取到的參考視頻的主特征從特征視頻結(jié)合中查找具有該主特征的特征視頻子集合。
[0021]其中,特征視頻集合和特征視頻子集合是預(yù)先形成并存儲(chǔ)的。特征視頻集合是根據(jù)視頻標(biāo)簽中的主特征和次特征將視頻分類后形成的集合,因而,特征視頻集合是對(duì)原視頻集合中的視頻基于視頻標(biāo)簽特征重新分類處理后的一個(gè)視頻集合。特征視頻集合中具有相同主特征的所有視頻構(gòu)成一個(gè)特征視頻子集合,且,特征視頻子集合與主特征一一對(duì)應(yīng)。
[0022]若要基于參考視頻推薦其他視頻,首先要確定參考視頻的相關(guān)視頻。也即,從特征視頻集合中確定該原始視頻的相關(guān)視頻。在該實(shí)施例中,基于視頻內(nèi)容來(lái)確定相關(guān)視頻。而且,以視頻內(nèi)容中的視頻標(biāo)簽作為相關(guān)視頻的判斷要素。由于特征視頻子集合與主特征一一對(duì)應(yīng),因此,首先,根據(jù)步驟101所獲取的參考視頻的主特征,從特征視頻集合中查找出具有該主特征的特征視頻子集合。
[0023]步驟103:從特征視頻子集合中查找與參考視頻具有相同次特征的視頻,并作為該參考視頻的相關(guān)視頻。
[0024]步驟104:計(jì)算相關(guān)視頻與參考視頻的內(nèi)容相似度,確定為特征分類相似度。
[0025]步驟103查找出參考視頻的相關(guān)視頻之后,即可計(jì)算相關(guān)視頻與參考視頻的內(nèi)容相似度,并將該內(nèi)容相似度確定為基于特征分類的特征分類相似度。
[0026]兩個(gè)視頻的內(nèi)容相似度的計(jì)算方法可以采用現(xiàn)有技術(shù)來(lái)實(shí)現(xiàn),優(yōu)選采用下面所描述的計(jì)算方法,詳見(jiàn)后續(xù)技術(shù)內(nèi)容的描述。
[0027]在該實(shí)施例中,先根據(jù)視頻標(biāo)簽將原始的視頻集合中的所有視頻進(jìn)行特征分類,形成基于主特征的多個(gè)特征分類視頻子集合。在確定參考視頻的相關(guān)視頻時(shí),僅需要從與參考視頻具有相同主特征的特征分類視頻子集合中進(jìn)行相關(guān)視頻查找。而且,由于特征分類視頻子集合已根據(jù)主特征進(jìn)行了分類,方便根據(jù)參考視頻的主特征進(jìn)行相關(guān)視頻的查找匹配。因而,整個(gè)相關(guān)視頻確定過(guò)程無(wú)需對(duì)所有視頻均進(jìn)行操作,只需遍歷有限視頻即可,查找速度快,數(shù)據(jù)處理量少,計(jì)算復(fù)雜度小。
[0028]具體而言,在按照視頻標(biāo)簽對(duì)視頻進(jìn)行特征分類時(shí),先根據(jù)視頻標(biāo)簽中的主特征將所有視頻進(jìn)行分類,形成與主特征一一對(duì)應(yīng)的多個(gè)特征視頻子集合。然后,在每個(gè)特征視頻子集合中存儲(chǔ)對(duì)應(yīng)的主特征以及具有該主特征的所有視頻所具有的所有次特征。同時(shí),在每個(gè)次特征下存儲(chǔ)該主特征下、具有該次特征的視頻的視頻ID,從而形成特征視頻子集合。所有的特征視頻子集合構(gòu)成所有視頻的特征視頻集合。
[0029]圖2示出了采用上述方法所形成的特征視頻集合的一個(gè)示意圖。
[0030]如圖2所示的特征視頻集合中,“電影”、“電視劇”、“綜藝”、“動(dòng)漫”、“其他”等為視頻類型標(biāo)簽,將該視頻類型標(biāo)簽作為主特征,不同內(nèi)容的主特征構(gòu)成不同的特征視頻子集合。對(duì)于主特征內(nèi)容為“電影”的這個(gè)特征視頻子集合,tagll,…,tagln是“電影”這一主特征下的所有視頻所具有的所有次特征,共有η個(gè),η個(gè)次特征依次排列。例如,次特征包括“喜劇”、“劇情”等。對(duì)于主特征為“電影”的視頻,具有tagll這個(gè)次特征的視頻有η個(gè),對(duì)應(yīng)的視頻ID分別為mediaidll, ".,mediaidln,這η個(gè)視頻ID依次排列,存儲(chǔ)在tagll這個(gè)次特征下。
[0031]同樣的,對(duì)于主特征內(nèi)容為“電視劇”的這個(gè)特征視頻子集合,tag21,…,tag2n是“電視劇”這一主特征下的所有視頻所具有的所有次特征,共有η個(gè),η個(gè)次特征依次排列。對(duì)于主特征為“電視劇”的視頻,具有tag21這個(gè)次特征的視頻也有η個(gè),對(duì)應(yīng)的視頻ID分別為mediaid21,.",mediaic^n,且這η個(gè)視頻ID依次排列,存儲(chǔ)在tag21這個(gè)次特征下。
[0032]其余主特征、次特征及視頻ID也均按照上述數(shù)據(jù)格式依次排列、存儲(chǔ)。
[0033]基于圖2的特征視頻集合示意圖,步驟102及103在獲取參考視頻的相關(guān)視頻時(shí),先定位到與參考視頻同主特征的特征視頻子集合。例如,參考視頻的主特征為“電影”,則定位到的特征視頻子集合為圖2中的第一個(gè)“電影”子集合。然后,根據(jù)參考視頻的次特征從“電影”特征視頻子集合中查找相關(guān)視頻。具體來(lái)說(shuō),如果參考視頻具有tagll次特征,則在“電影”特征視頻子集合中,tagll下的所有視頻ID對(duì)應(yīng)的視頻均認(rèn)為是參考視頻的相關(guān)視頻。
[0034]確定相關(guān)視頻后,還需要確定相關(guān)視頻與參考視頻的視頻相似度。也即,步驟104所執(zhí)行的計(jì)算相關(guān)視頻與參考視頻的內(nèi)容相似度。在該實(shí)施例中,優(yōu)選采用下述方式計(jì)算相關(guān)視頻與參考視頻的內(nèi)容相似度:
獲取參考視頻中的每個(gè)次特征的權(quán)重,將所有次特征的權(quán)重求和,得到第一權(quán)重求和值;獲取相關(guān)視頻中與參考視頻相同的所有次特征及對(duì)應(yīng)的權(quán)重,將該相同的所有次特征的權(quán)重求和,得到第二權(quán)重求和值;將第二權(quán)重求和值與第一權(quán)重求和值相比,得到的比值作為相關(guān)視頻與該參考視頻的內(nèi)容相似度,也即特征分類相似度。其中,每個(gè)次特征的權(quán)重為預(yù)設(shè)值,可以根據(jù)需要對(duì)不同的次特征設(shè)置相同、不相同或不完全相同的權(quán)重。例如,可以對(duì)演員、導(dǎo)演等相關(guān)性強(qiáng)的次特征設(shè)置較大的權(quán)重值,對(duì)劇情等相關(guān)性略弱的次特征設(shè)置略小的權(quán)重值。
[0035]具體來(lái)說(shuō),設(shè)為參考視頻g與其任一相關(guān)視顱的特征分類相似度,m = 為參考視頻i的次特征列表長(zhǎng)度,>*igAi(i(togCi)))為參考視頻i的第個(gè)次特征的權(quán)重,,觀igk1.(J[i(i'ag(k))])為任一相關(guān)視頻./的第先個(gè)次特征的權(quán)重。若任一相關(guān)視頻J具有該第t個(gè)次特征,則任一相關(guān)視頻的第i個(gè)次特征的權(quán)重與參考視頻i的第t個(gè)次特征的權(quán)重相等;若任一相關(guān)視顱不具有該第個(gè)次特征,則任一相關(guān)視顱的第個(gè)次特征的權(quán)重為O。則,?采用下述公式來(lái)計(jì)算:
Jfi
Σ(tag(*))])
SOT1 (;-
2 weight (? (t ag(i)))
Jt=I
舉例來(lái)說(shuō),從圖2示出的特征視頻集合中查找到參考視頻i對(duì)應(yīng)的特征視頻子集合后,根據(jù)參考視頻$的次特征進(jìn)行匹配,判斷特征視頻子集合中對(duì)應(yīng)參考視頻$的次特征下是否存儲(chǔ)相關(guān)視頻J的視頻ID。如果某個(gè)次特征下存儲(chǔ)有相關(guān)視頻J的視頻ID,則將該次特征的權(quán)重加到分子上,作為相關(guān)視頻J的權(quán)重求和的一份子。如果某個(gè)次特征下沒(méi)有相關(guān)視頻d的視頻ID,則認(rèn)為相關(guān)視頻J對(duì)應(yīng)該次特征的權(quán)重為O。通過(guò)上述過(guò)程和上述公式處理后,計(jì)算得到的參考視頻i與其任一相關(guān)視頻J的特征分類相似度的值swgW)為一個(gè)不大于I的數(shù)值,也即,特征分類相似度的取值范圍為[0,1]。
[0036]通過(guò)上述實(shí)施例得到相關(guān)視頻與參考視頻基于特征分類的特征分類相似度后,可以基于該特征分類相似度與其他視頻相似度融合進(jìn)行視頻推薦。
[0037]圖3示出了本發(fā)明基于特征分類的視頻推薦方法一個(gè)實(shí)施例的流程圖,具體來(lái)說(shuō),是將特征分類相似度、操作相似度及人物相似度相融合,實(shí)現(xiàn)基于綜合相似度的視頻推薦方法的一個(gè)實(shí)施例的流程圖。
[0038]如圖3所示,該實(shí)施例的具體實(shí)現(xiàn)過(guò)程如下:
步驟301:獲取參考視頻的相關(guān)視頻。
[0039]相關(guān)視頻的獲取可以采用圖1實(shí)施例中的方法來(lái)實(shí)現(xiàn)。
[0040]步驟302:獲取相關(guān)視頻與參考視頻的特征分類相似度、操作相似度及人物相似度。
[0041]其中,特征分類相似度也采用圖1實(shí)施例中的方法來(lái)實(shí)現(xiàn)。而操作相似度是指基于用戶操作行為獲取的兩個(gè)視頻的相似度,可以采用現(xiàn)有技術(shù)來(lái)實(shí)現(xiàn),優(yōu)選采用下面所描述的計(jì)算方法,詳見(jiàn)后續(xù)技術(shù)內(nèi)容的描述。
[0042]人物相似度,是指基于人物相關(guān)信息而獲取的兩個(gè)視頻的相似度。這里的人物,可以為視頻的導(dǎo)演、演員等演職員真實(shí)人物,也可以指視頻內(nèi)容中所講述的歷史人物或抽象人物。人物相關(guān)信息又可根據(jù)人物進(jìn)行區(qū)分。例如,若人物是視頻演職員等真實(shí)人物,人物相關(guān)信息可以為與之有親屬(或緋聞)關(guān)系的其他人物,該真實(shí)人物的年齡(所處的年齡段)、派別(實(shí)力派、偶像派)、戲風(fēng)(動(dòng)作、愛(ài)情、歷史)等。若人物為視頻內(nèi)容所講述的歷史人物,人物相關(guān)信息可以為人物所處歷史時(shí)代、該歷史人物歷史典故中的涉及人物等。
[0043]在該實(shí)施例中,為確定視頻的人物相似度,首先為每個(gè)視頻設(shè)置指定人物的人物相關(guān)信息屬性,并為每個(gè)人物相關(guān)信息屬性填充相應(yīng)的屬性值。而且,人物相關(guān)信息屬性值優(yōu)選根據(jù)社交網(wǎng)絡(luò)中的實(shí)時(shí)信息定時(shí)進(jìn)行更新,從而,使得人物相關(guān)信息屬性保持與熱點(diǎn)的同步。在確定相關(guān)視頻與參考視頻的人物相似度時(shí),獲取參考視頻中的人物相關(guān)彳目息屬性值和相關(guān)視頻中的人物相關(guān)信息屬性值,按照設(shè)定準(zhǔn)則對(duì)人物相關(guān)信息屬性值進(jìn)行量化,分別獲得參考視頻的人物屬性向量和相關(guān)視頻的人物屬性向量。然后,利用兩個(gè)人物屬性向量、采用余弦相似度方法獲得參考視頻與相關(guān)視頻的人物相似度。
[0044]以計(jì)算參考視頻i與其任一相關(guān)視頻J的人物相似度為例,說(shuō)明人物相似度獲取的具體實(shí)現(xiàn)方法如下:
設(shè)定視頻的人物相關(guān)信息屬性包括主演的四個(gè)屬性,分別為親屬(或緋聞)關(guān)系、主演年齡段、主演派別和主演戲風(fēng)。分別獲取參考視頻i和相關(guān)視頻J的人物相關(guān)信息屬性值。其中,人物相關(guān)信息屬性值可以作為視頻內(nèi)容的一部分存儲(chǔ);也可以存儲(chǔ)在指定數(shù)據(jù)庫(kù)中,而視頻內(nèi)容中僅包含人物相關(guān)信息屬性字段。將參考視顱的人物相關(guān)信息屬性值與相關(guān)視頻J的人物相關(guān)信息屬性值一一進(jìn)行比較,然后進(jìn)行量化。具體量化過(guò)程為:若相同的屬性的值相同,則將兩個(gè)視頻的該屬性值均量化為I ;若相同的屬性的值不相同,則將兩個(gè)視頻的屬性值分別用O和I進(jìn)行量化,使得兩個(gè)視頻的量化屬性值不同。譬如,經(jīng)過(guò)比較和量化,參考視頻i量化后的人物屬性向量為G = (1,0,1,1),而相關(guān)視頻j的人物屬性向量為;/ = au〕,i)。然后,采用余弦相似度方法獲得參考視頻;與相關(guān)視頻j的人物相似度Sim2QJ)如下:
【權(quán)利要求】
1.一種基于特征分類的視頻相似度確定方法,其特征在于,所述方法包括: 獲取參考視頻的主特征和所有次特征; 根據(jù)獲取到的所述參考視頻的主特征從特征視頻集合中查找具有該主特征的特征視頻子集合; 從所述特征視頻子集合中查找與所述參考視頻具有相同次特征的視頻,并作為相關(guān)視頻; 計(jì)算所述相關(guān)視頻與所述參考視頻的內(nèi)容相似度,確定為特征分類相似度; 其中,所述主特征和所述次特征均為視頻的視頻標(biāo)簽,所述特征視頻集合為根據(jù)視頻標(biāo)簽中的主特征和次特征將視頻分類后形成的集合,所述特征視頻集合包括若干與主特征一一對(duì)應(yīng)的所述特征視頻子集合。
2.根據(jù)權(quán)利要求1所述的視頻相似度確定方法,其特征在于,所述根據(jù)視頻標(biāo)簽中的主特征和次特征將視頻分類、形成所述特征視頻集合具體為: 根據(jù)所述主特征將所有視頻進(jìn)行分類,形成與主特征一一對(duì)應(yīng)的多個(gè)特征視頻子集合,在每個(gè)所述特征視頻子集合中存儲(chǔ)對(duì)應(yīng)的主特征及具有該主特征的所有視頻所具有的所有次特征,并在每個(gè)所述次特征下存儲(chǔ)該主特征下、具有該次特征的視頻的視頻ID。
3.根據(jù)權(quán)利要求1所述的視頻相似度確定方法,其特征在于,所述計(jì)算所述相關(guān)視頻與所述參考視頻的內(nèi)容相似度,確定為特征分類相似度具體為: 獲取所述參考視頻中每個(gè)次特征的權(quán)重,將所有次特征的權(quán)重求和,得到第一權(quán)重求和值;獲取所述相關(guān)視頻中與所述參考視頻相同的所有次特征及對(duì)應(yīng)的權(quán)重,將該相同的所有次特征的權(quán)重求和,得到第二權(quán)重求和值;將所述第二權(quán)重求和值與所述第一權(quán)重求和值相比,得到的比值作為所述相關(guān)視頻與所述參考視頻的特征分類相似度。
4.一種基于特征分類的視頻推薦方法,其特征在于,所述方法包括: 獲取參考視頻的相關(guān)視頻; 獲取所述相關(guān)視頻與所述參考視頻的特征分類相似度、操作相似度及人物相似度; 根據(jù)所述特征分類相似度、所述操作相似度及所述人物相似度確定所述相關(guān)視頻與所述參考視頻的總視頻相似度; 根據(jù)所述總視頻相似度推薦視頻; 其中,所述參考視頻的相關(guān)視頻及所述特征分類相似度根據(jù)上述權(quán)利要求1至3中任一項(xiàng)所述的方法獲得; 獲取所述人物相似度的具體過(guò)程為: 為每個(gè)視頻設(shè)置指定人物的人物相關(guān)信息屬性,獲取所述參考視頻中的人物相關(guān)信息屬性值和所述相關(guān)視頻中的人物相關(guān)信息屬性值,按照設(shè)定準(zhǔn)則對(duì)所述人物相關(guān)信息屬性值進(jìn)行量化,分別獲得所述參考視頻的人物屬性向量和所述相關(guān)視頻的人物屬性向量,利用兩個(gè)所述人物屬性向量、采用余弦相似度方法獲得所述相關(guān)視頻與所述參考視頻的人物相似度。
5.根據(jù)權(quán)利要求4所述的視頻推薦方法,其特征在于,所述視頻的人物相關(guān)信息屬性值定時(shí)進(jìn)行更新。
6.根據(jù)權(quán)利要求4所述的視頻推薦方法,其特征在于,獲取所述操作相似度的具體過(guò)程為: 獲取對(duì)視頻具有操作行為的用戶及用戶數(shù)量; 根據(jù)不同的操作行為,將視頻以及與視頻對(duì)應(yīng)的用戶及用戶數(shù)量劃分為不同操作視頻子集合; 根據(jù)每個(gè)所述操作視頻子集合中與所述參考視頻對(duì)應(yīng)的用戶及用戶數(shù)量以及與所述相關(guān)視頻對(duì)應(yīng)的用戶及用戶數(shù)量,得到所述相關(guān)視頻和所述參考視頻的操作相似度。
7.根據(jù)權(quán)利要求6所述的視頻推薦方法,其特征在于,所述根據(jù)每個(gè)所述操作視頻子集合中與所述參考視頻對(duì)應(yīng)的用戶及用戶數(shù)量以及與所述相關(guān)視頻對(duì)應(yīng)的用戶及用戶數(shù)量,得到所述相關(guān)視頻和所述參考視頻的操作相似度的具體過(guò)程為: 針對(duì)一個(gè)所述操作視頻子集合,根據(jù)該操作視頻子集合中與所述參考視頻對(duì)應(yīng)的用戶及用戶數(shù)量以及與所述相關(guān)視頻對(duì)應(yīng)的用戶及用戶數(shù)量,得到所述相關(guān)視頻和所述參考視頻的相似度; 根據(jù)每個(gè)所述操作視頻子集合對(duì)應(yīng)的所述相關(guān)視頻和所述參考視頻的相似度,得到所述相關(guān)視頻和所述參考視頻的操作相似度。
8.如權(quán)利要求7所述的視頻推薦方法,其特征在于,所述根據(jù)該操作視頻子集合中與所述參考視頻對(duì)應(yīng)的用戶及用戶數(shù)量以及與所述相關(guān)視頻對(duì)應(yīng)的用戶及用戶數(shù)量,得到所述相關(guān)視頻和所述參考視頻的相似度的具體過(guò)程為: 根據(jù)以下方式確定所述操作視頻子集合對(duì)應(yīng)的所述相關(guān)視頻和所述參考視頻的相似度:Sim3s (i,J)=-;-—-" max Ini, ;., | ij' e Sp and ?'φ j'} 其中,為所述操作視頻子集合對(duì)應(yīng)的所述參考視頻:和所述相關(guān)視顱的相似度,^為所述操作視頻子集合對(duì)應(yīng)的所有視頻集,i'f為該操作視頻子集合中的任意兩部視頻,為對(duì)所述參考視顱和所述相關(guān)視頻J都存在相同操作行為的用戶數(shù)量,?j為對(duì)任意兩部視頻f和/都存在相同操作行為的用戶數(shù)量。
9.如權(quán)利要求7所述的視頻推薦方法,其特征在于,所述根據(jù)每個(gè)所述操作視頻子集合對(duì)應(yīng)的所述相關(guān)視頻和所述參考視頻的相似度,得到所述相關(guān)視頻和所述參考視頻的操作相似度的具體過(guò)程為: 根據(jù)每個(gè)所述操作視頻子集合對(duì)應(yīng)的所述相關(guān)視頻和所述參考視頻的相似度,以及每個(gè)所述操作視頻子集合對(duì)應(yīng)的權(quán)重,通過(guò)加權(quán)求和的方式,得到所述相關(guān)視頻和所述參考視頻的操作相似度。
10.根據(jù)權(quán)利要求4至9中任一項(xiàng)所述的視頻推薦方法,其特征在于,所述根據(jù)所述特征分類相似度、所述操作相似度及所述人物相似度確定所述相關(guān)視頻與所述參考視頻的總視頻相似度的具體過(guò)程為: 將所述相關(guān)視頻與所述參考視頻的所述特征分類相似度、所述操作相似度及所述人物相似度通過(guò)下述公式進(jìn)行融合,確定所述相關(guān)視頻與所述參考視頻的視頻相似度:j) = a SimlCif j) + β - sim2 (i, J) H- (1- Of - β) ■ sim3(i, j) 其中,、SimlQJ)、sim2(ij)和SimiU)分別為所述原始視頻I'和所述相關(guān)視頻J的所述視頻相似度、所述特征分類相似度、所述人物相似度和所述操作相似度,所述和β為平衡所述特征分類相似度、所述人物相似度和所述操作相似度對(duì)所述總視頻相似度影響的參數(shù)。
【文檔編號(hào)】G06F17/30GK104199896SQ201410423523
【公開(kāi)日】2014年12月10日 申請(qǐng)日期:2014年8月26日 優(yōu)先權(quán)日:2014年8月26日
【發(fā)明者】王潔, 高雪松, 胡偉鳳, 謝杰, 許麗星, 于旭, 周翚, 張帥 申請(qǐng)人:海信集團(tuán)有限公司