一種獲取主持人姓名用來(lái)索引視頻的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及多媒體通信技術(shù)領(lǐng)域,特別的,涉及一種獲取主持人姓名用來(lái)索引視頻的方法及裝置。
【背景技術(shù)】
[0002]每個(gè)視頻資源上通常都有該視頻資源的索引,這些索引就相當(dāng)于該視頻的關(guān)鍵詞,便于用戶在網(wǎng)絡(luò)上通過(guò)輸入關(guān)鍵詞搜索相應(yīng)視頻。
[0003]由于視頻文件在播放時(shí)用戶常常關(guān)注的是視頻中的影像,如人物等中心內(nèi)容,因此在檢索時(shí)通常通過(guò)輸入人物名稱來(lái)檢索。一些影視劇方面的視頻,通常會(huì)演員的姓名作為索引。但是針對(duì)一些新聞或綜藝節(jié)目類的視頻,若用戶想通過(guò)輸入主持人姓名進(jìn)行檢索時(shí),常常很少能得到理想的檢索結(jié)果。這是因?yàn)樾侣劵蚓C藝節(jié)目類的視頻往往注重的是新聞中的播放的消息內(nèi)容或綜藝節(jié)目里的各項(xiàng)節(jié)目信息,因此這類視頻的索引關(guān)鍵詞通常是標(biāo)題、事件或曲名等。由于沒(méi)有這樣的用主持人的姓名做索引的視頻,因此若想通過(guò)輸入主持人姓名來(lái)檢索視頻文件,通常檢索不到相應(yīng)的視頻資源。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供一種獲取主持人姓名用來(lái)索引視頻的方法及裝置,用以解決現(xiàn)有技術(shù)中由于視頻沒(méi)有用主持人姓名作為索引所導(dǎo)致的用戶無(wú)法通過(guò)輸入主持人姓名來(lái)搜索視頻、搜索效率低下的技術(shù)問(wèn)題。
[0005]一方面,本發(fā)明實(shí)施例提供一種獲取主持人姓名用來(lái)索引視頻的方法,該方法包括:
[0006]獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù);
[0007]從所述一段音頻數(shù)據(jù)中提取出聲音特點(diǎn)信息;
[0008]將所述聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特點(diǎn)信息進(jìn)行匹配;
[0009]根據(jù)匹配成功的預(yù)存的主持人的聲音特點(diǎn)信息所對(duì)應(yīng)的主持人姓名,確定所述視頻中的主持人姓名;
[0010]用所述確定的主持人姓名標(biāo)引所述視頻。
[0011]本發(fā)明實(shí)施例的一些有益效果可以包括:通過(guò)將從需要主持人索引視頻中提取出的聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特定信息進(jìn)行匹配,進(jìn)而確定該視頻的主持人姓名的技術(shù)手段,解決了現(xiàn)有技術(shù)中沒(méi)有為視頻標(biāo)引主持人的技術(shù)問(wèn)題,進(jìn)而可以實(shí)現(xiàn)方便用戶通過(guò)主持人姓名檢索視頻文件,提高檢索效率的技術(shù)效果。
[0012]在本發(fā)明的另一個(gè)實(shí)施方式中,所述獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù)包括:
[0013]截取需要主持人索引的視頻的前η分鐘的音頻數(shù)據(jù)。
[0014]可選的,所述η分鐘為3-6分鐘。
[0015]本發(fā)明實(shí)施例的一些有益效果可以包括:視頻的整個(gè)播放過(guò)程有可能很長(zhǎng),全部用來(lái)做分析浪費(fèi)資源,因此適當(dāng)?shù)慕厝∫曨l中包含主持人姓名的前η分鐘部分的音頻數(shù)據(jù)用來(lái)做分析便于提高分析主持人的處理速度,并且通常前部分時(shí)段的視頻中主持人聲音播報(bào)的幾率和內(nèi)容較高,同時(shí)也可以提高分析的效率。
[0016]在本發(fā)明的另一個(gè)實(shí)施例中,所述從所述一段音頻數(shù)據(jù)中提取出聲音特點(diǎn)信息包括:
[0017]對(duì)所述音頻數(shù)據(jù)進(jìn)行音頻采樣得到音頻采樣點(diǎn);
[0018]根據(jù)所述音頻采樣點(diǎn)確定所述需要主持人索引的視頻中聲音的規(guī)律數(shù)據(jù),將規(guī)律數(shù)據(jù)作為聲音特點(diǎn)信息。
[0019]本發(fā)明實(shí)施例的一些有益效果可以包括:采用將從音頻中分析出的聲音的規(guī)律數(shù)據(jù)作為聲音特點(diǎn)信息的技術(shù)手段,可以較準(zhǔn)確的確定主持人的聲音,進(jìn)而能夠?qū)崿F(xiàn)較精確的確定視頻中的主持人姓名。
[0020]進(jìn)一步地,該方法還包括:
[0021]預(yù)先獲取各主持人的聲音的音頻數(shù)據(jù);
[0022]對(duì)所述各主持人的聲音的音頻數(shù)據(jù)進(jìn)行采樣得到相應(yīng)的音頻采樣點(diǎn);
[0023]根據(jù)所述相應(yīng)的音頻采樣點(diǎn)確定各主持人的聲音的規(guī)律數(shù)據(jù);
[0024]存儲(chǔ)各主持人的聲音的規(guī)律數(shù)據(jù)以及所述各主持人的聲音的規(guī)律數(shù)據(jù)與主持人姓名的對(duì)應(yīng)關(guān)系。
[0025]本發(fā)明實(shí)施例的一些有益效果可以包括:通過(guò)預(yù)先存儲(chǔ)各個(gè)主持人姓名的聲音的規(guī)律數(shù)據(jù),可以便于與視頻中分析出的主持人的聲音進(jìn)行匹配,進(jìn)而實(shí)現(xiàn)快速、準(zhǔn)確的為視頻標(biāo)引主持人姓名的技術(shù)效果。
[0026]另一方面,本發(fā)明實(shí)施例提供一種獲取主持人姓名用來(lái)索引視頻的裝置,包括:
[0027]獲取模塊,用于獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù);
[0028]提取模塊,用于從所述一段音頻數(shù)據(jù)中提取出聲音特點(diǎn)信息;
[0029]匹配模塊,用于將所述聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特點(diǎn)信息進(jìn)行匹配;
[0030]確定模塊,用于根據(jù)匹配成功的預(yù)存的主持人的聲音特點(diǎn)信息所對(duì)應(yīng)的主持人姓名,確定所述視頻中的主持人姓名;
[0031]標(biāo)引模塊,用于用所述確定的主持人姓名標(biāo)引所述視頻。
[0032]本發(fā)明實(shí)施例的一些有益效果可以包括:具有將從需要主持人索引視頻中提取出的聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特定信息進(jìn)行匹配,進(jìn)而確定該視頻的主持人姓名的功能,解決了現(xiàn)有技術(shù)中沒(méi)有為視頻標(biāo)引主持人的技術(shù)問(wèn)題,進(jìn)而可以實(shí)現(xiàn)方便用戶通過(guò)主持人姓名檢索視頻文件,提高檢索效率的技術(shù)效果。
[0033]在本發(fā)明的另一個(gè)實(shí)施例中,所述獲取模塊,具體用于截取需要主持人索引的視頻的前η分鐘的音頻數(shù)據(jù)。
[0034]其中,所述η分鐘為3-6分鐘。
[0035]本發(fā)明實(shí)施例的一些有益效果可以包括:視頻的整個(gè)播放過(guò)程有可能很長(zhǎng),全部用來(lái)做分析浪費(fèi)資源,因此適當(dāng)?shù)慕厝∫曨l中包含主持人姓名的前η分鐘部分的音頻數(shù)據(jù)用來(lái)做分析便于提高分析主持人的處理速度,并且通常前部分時(shí)段的視頻中主持人聲音播報(bào)的幾率和內(nèi)容較高,同時(shí)也可以提高分析的效率。
[0036]在本發(fā)明的另一個(gè)實(shí)施例中,所述提取模塊包括:
[0037]采樣單元,用于對(duì)所述音頻數(shù)據(jù)進(jìn)行音頻采樣得到音頻采樣點(diǎn);
[0038]確定單元,用于根據(jù)所述音頻采樣點(diǎn)確定所述需要主持人索引的視頻中聲音的規(guī)律數(shù)據(jù),將規(guī)律數(shù)據(jù)作為聲音特點(diǎn)信息。
[0039]本發(fā)明實(shí)施例的一些有益效果可以包括:具有將從音頻中分析出的聲音的規(guī)律數(shù)據(jù)作為聲音特點(diǎn)信息的功能,可以較準(zhǔn)確的確定主持人的聲音,進(jìn)而能夠?qū)崿F(xiàn)較精確的確定視頻中的主持人姓名。
[0040]在本發(fā)明的另一個(gè)實(shí)施例中,該裝置還包括:
[0041]預(yù)取模塊,用于預(yù)先獲取各主持人的聲音的音頻數(shù)據(jù),對(duì)所述各主持人的聲音的音頻數(shù)據(jù)進(jìn)行采樣得到相應(yīng)的音頻采樣點(diǎn);根據(jù)所述相應(yīng)的音頻采樣點(diǎn)確定各主持人的聲音的規(guī)律數(shù)據(jù);
[0042]存儲(chǔ)模塊,用于存儲(chǔ)各主持人的聲音的規(guī)律數(shù)據(jù)以及所述各主持人的聲音的規(guī)律數(shù)據(jù)與主持人姓名的對(duì)應(yīng)關(guān)系。
[0043]本發(fā)明實(shí)施例的一些有益效果可以包括:通過(guò)預(yù)先存儲(chǔ)各個(gè)主持人姓名的聲音的規(guī)律數(shù)據(jù),可以便于與視頻中分析出的主持人的聲音進(jìn)行匹配,進(jìn)而實(shí)現(xiàn)快速、準(zhǔn)確的為視頻標(biāo)引主持人姓名的技術(shù)效果。
[0044]本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書中闡述,并且,部分地從說(shuō)明書中變得顯而易見(jiàn),或者通過(guò)實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過(guò)在所寫的說(shuō)明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。
[0045]下面通過(guò)附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
【附圖說(shuō)明】
[0046]附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,并且構(gòu)成說(shuō)明書的一部分,與本發(fā)明的實(shí)施例一起用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的限制。在附圖中:
[0047]圖1為本發(fā)明實(shí)施例中提供一種獲取主持人姓名用來(lái)索引視頻的方法的示例性流程圖;
[0048]圖2為本發(fā)明實(shí)施例中提供一種獲取主持人姓名用來(lái)索引視頻的方法的另一示例性流程圖;
[0049]圖3為本發(fā)明實(shí)施例中提供一種獲取主持人姓名用來(lái)索引視頻的方法的再一示例性流程圖;
[0050]圖4為本發(fā)明實(shí)施例中提供一種獲取主持人姓名用來(lái)索引視頻的裝置的一示例性結(jié)構(gòu)圖;
[0051]圖5為本發(fā)明實(shí)施例中提供一種獲取主持人姓名用來(lái)索引視頻的裝置的一示例性結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0052]以下結(jié)合附圖對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說(shuō)明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實(shí)施例僅用于說(shuō)明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0053]本實(shí)施例提供一種獲取主持人姓名用來(lái)索引視頻的方法,該方法適合部署在需要實(shí)現(xiàn)為視頻獲取主持人姓名的設(shè)備或裝置上,例如PC機(jī)或服務(wù)器上等。如圖1所示,該方法包括:
[0054]101,獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù);
[0055]視頻文件通常是有聲音和圖像組成的,因此視頻文件都有對(duì)應(yīng)的音頻數(shù)據(jù)。具體的獲取音頻數(shù)據(jù)的方式獲取的方式可以是人工選定的一段視頻上的音頻,可以是指定的一段時(shí)間段內(nèi)的音頻,甚至是隨機(jī)的選取也可以。
[0056]102,從所述一段音頻數(shù)據(jù)中提取出聲音特點(diǎn)信息;
[0057]根據(jù)獲取出的這段音頻數(shù)據(jù)從中提取出該段音頻數(shù)據(jù)中錄制的人物語(yǔ)音方面的聲音特點(diǎn)信息。例如新聞主播的說(shuō)話聲音的聲音特定信息。
[0058]103,將所述聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特點(diǎn)信息進(jìn)行匹配;
[0059]104,根據(jù)匹配成功的預(yù)存的主持人的聲音特點(diǎn)信息所對(duì)應(yīng)的主持人姓名,確定所述視頻中的主持人姓名;
[0060]每個(gè)預(yù)存的主持人的聲音特定信息都可對(duì)應(yīng)到相應(yīng)的主持人姓名,因此匹配到預(yù)存的主持人的聲音特定信息后,便可確定到相應(yīng)的主持人姓名。
[0061 ] 105,用所述確定的主持人姓名標(biāo)弓I所述視頻。
[0062]將確定的主持人姓名作為索引標(biāo)注該視頻。
[0063]在本發(fā)明的另一個(gè)實(shí)施方式中,上述101中的獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù)包括:
[0064]截取需要主持人索引的視頻的前n(n為自然數(shù))分鐘的音頻數(shù)據(jù)。
[0065]可選的,η分鐘為3_6分鐘。
[0066]在本發(fā)明的另一個(gè)實(shí)施方式中,上述102中的從所述一段音頻數(shù)據(jù)中提取出聲音特點(diǎn)信息包括:
[0067]對(duì)所述音頻數(shù)據(jù)進(jìn)行音頻采樣得到音頻采樣點(diǎn);根據(jù)所述音頻采樣點(diǎn)確定所述需要主持人索引的視頻中聲音的規(guī)律數(shù)據(jù),將規(guī)律數(shù)據(jù)作為聲音特點(diǎn)信息。<