一種為視頻獲取關(guān)鍵詞的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及多媒體通信技術(shù)領(lǐng)域,特別的,涉及一種為視頻獲取關(guān)鍵詞的方法及
目.0
【背景技術(shù)】
[0002]每個視頻資源上通常都有該視頻資源的索引,這些索引就相當(dāng)于該視頻的關(guān)鍵詞,便于用戶在網(wǎng)絡(luò)上通過輸入關(guān)鍵詞搜索相應(yīng)視頻。視頻的關(guān)鍵詞通常是從視頻的一些描述信息中提取出來的,又或者是工作人員在處理視頻資源時為其添加上的。
[0003]但是,這兩種為視頻添加關(guān)鍵詞或索引的方式都有各自的缺點(diǎn)。例如能夠從視頻的描述信息中提取出的關(guān)鍵詞比較有限,并不全面,而且有可能不準(zhǔn)確或者重點(diǎn)的內(nèi)容沒有涉及到;而人工為視頻添加索引的方式,則效率低下,特別針對是一些較長的視頻資源,而且也容易出錯。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供一種為視頻獲取關(guān)鍵詞的方法及裝置,用以解決現(xiàn)有技術(shù)中為視頻獲取用于索引的關(guān)鍵詞過程中效率較低下,準(zhǔn)確度較差,關(guān)鍵詞覆蓋的內(nèi)容不全面等技術(shù)問題。
[0005]一方面,本發(fā)明實(shí)施例提供一種為視頻獲取關(guān)鍵詞的方法,該方法包括:
[0006]確定需要關(guān)鍵詞的視頻;
[0007]根據(jù)所述視頻中的媒體數(shù)據(jù)提取關(guān)鍵詞。
[0008]本發(fā)明實(shí)施例的一些有益效果可以包括:采用根據(jù)視頻中的媒體數(shù)據(jù)提取關(guān)鍵詞的技術(shù)手段,由于關(guān)鍵詞是自動的從需要關(guān)鍵詞的視頻中提取得到的,因此效率較高,并且關(guān)鍵詞的信息較準(zhǔn)確,故而可以解決現(xiàn)有技術(shù)中為視頻獲取關(guān)鍵詞的過程中準(zhǔn)確度較差,效率低下,關(guān)鍵詞覆蓋的內(nèi)容不全面的技術(shù)問題。
[0009]進(jìn)一步地,所述媒體數(shù)據(jù)為語音形式的數(shù)據(jù);所述根據(jù)所述視頻中的媒體數(shù)據(jù)提取關(guān)鍵詞包括:
[0010]將所述視頻中的語音形式的數(shù)據(jù)轉(zhuǎn)換為文本格式的數(shù)據(jù);
[0011]對所述文本格式的數(shù)據(jù)進(jìn)行分詞;
[0012]從所述分詞中提取關(guān)鍵詞,并將所述提取的關(guān)鍵詞作為所述視頻的關(guān)鍵詞。
[0013]本發(fā)明實(shí)施例的一些有益效果可以包括:根據(jù)媒體數(shù)據(jù)是語音形式的數(shù)據(jù)的特點(diǎn),采用將該語音形式的音頻數(shù)據(jù)先轉(zhuǎn)換為文本形式的文字?jǐn)?shù)據(jù),再通過對文字進(jìn)行分詞得到關(guān)鍵詞,并將該關(guān)鍵詞作為該視頻的關(guān)鍵詞的技術(shù)手段,解決了視頻格式的數(shù)據(jù)文件無法從中獲取到對應(yīng)內(nèi)容的關(guān)鍵詞的技術(shù)問題,進(jìn)而可以取得效果高,得到的關(guān)鍵詞較準(zhǔn)確且關(guān)鍵詞覆蓋的內(nèi)容較全面的技術(shù)效果。
[0014]進(jìn)一步地,所述媒體數(shù)據(jù)為圖像形式的數(shù)據(jù);所述根據(jù)所述視頻中的媒體數(shù)據(jù)提取關(guān)鍵詞包括:
[0015]根據(jù)視頻的圖像形式的數(shù)據(jù)提取所述視頻的標(biāo)題;
[0016]在網(wǎng)絡(luò)中查找與所述標(biāo)題對應(yīng)的文本格式的新聞;
[0017]獲取所述新聞的關(guān)鍵詞,并將所述關(guān)鍵詞作為所述視頻的關(guān)鍵詞。
[0018]本發(fā)明實(shí)施例的一些有益效果可以包括:根據(jù)媒體數(shù)據(jù)是圖像形式的數(shù)據(jù)的特點(diǎn),采用先從該圖像形式的圖像數(shù)據(jù)中分析出該視頻的標(biāo)題,在根據(jù)該標(biāo)題在網(wǎng)絡(luò)中查找對應(yīng)的文本格式的新聞,最后再將查找到的新聞中關(guān)鍵詞作為該視頻的關(guān)鍵詞的技術(shù)手段,解決了視頻格式的數(shù)據(jù)文件無法從中獲取到對應(yīng)內(nèi)容的關(guān)鍵詞的技術(shù)問題,進(jìn)而可以取得效果高,得到的關(guān)鍵詞較準(zhǔn)確且關(guān)鍵詞覆蓋的內(nèi)容較全面的技術(shù)效果。
[0019]進(jìn)一步地,所述根據(jù)視頻的圖像形式的數(shù)據(jù)提取所述視頻的標(biāo)題包括:
[0020]根據(jù)所述視頻的前η秒的圖像形式的數(shù)據(jù)和圖像識別技術(shù)提取所述視頻的標(biāo)題。
[0021]本發(fā)明實(shí)施例的一些有益效果可以包括:由于視頻播放時,通常都會在開頭進(jìn)行內(nèi)容的總結(jié)或視頻標(biāo)題的展示,因此采用將前η秒的圖像形式的數(shù)據(jù)和圖像識別技術(shù)相結(jié)合來提取關(guān)鍵詞的技術(shù)手段,可以取得較快捷,并且較準(zhǔn)確的獲取到關(guān)鍵詞的技術(shù)效果。
[0022]其中,所述獲取所述新聞的關(guān)鍵詞包括:
[0023]若所述新聞已存在關(guān)鍵次,則直接采用所述關(guān)鍵詞;
[0024]若所述新聞不存在關(guān)鍵詞,則通過分詞方式獲取所述新聞的關(guān)鍵詞。
[0025]本發(fā)明實(shí)施例的一些有益效果可以包括:采用從視頻標(biāo)題對應(yīng)的新聞中獲取關(guān)鍵詞的技術(shù)手段,在該新聞有關(guān)鍵詞時直接采用,在該新聞沒有關(guān)鍵詞時則通過分詞功能獲取,因此可以取得較快捷并且準(zhǔn)確的為視頻獲取到關(guān)鍵詞的技術(shù)效果。
[0026]另一方面,本發(fā)明實(shí)施例還提供一種為視頻獲取關(guān)鍵詞的裝置,該裝置包括:
[0027]確定模塊,用于確定需要關(guān)鍵詞的視頻;
[0028]提取模塊,用于根據(jù)所述視頻中的媒體數(shù)據(jù)提取關(guān)鍵詞。
[0029]本發(fā)明實(shí)施例的一些有益效果可以包括:具有根據(jù)視頻中的媒體數(shù)據(jù)提取關(guān)鍵詞的功能,由于關(guān)鍵詞是自動的從需要關(guān)鍵詞的視頻中提取得到的,因此效率較高,并且關(guān)鍵詞的信息較準(zhǔn)確,故而可以解決現(xiàn)有技術(shù)中為視頻獲取關(guān)鍵詞的過程中準(zhǔn)確度較差,效率低下,關(guān)鍵詞覆蓋的內(nèi)容不全面的技術(shù)問題。
[0030]進(jìn)一步地,所述媒體數(shù)據(jù)為語音形式的數(shù)據(jù);所述提取模塊包括:
[0031]語音提取單元,用于將所述視頻中的語音形式的數(shù)據(jù)轉(zhuǎn)換為文本格式的數(shù)據(jù);對所述文本格式的數(shù)據(jù)進(jìn)行分詞;從所述分詞中提取關(guān)鍵詞,并將所述提取的關(guān)鍵詞作為所述視頻的關(guān)鍵詞。
[0032]本發(fā)明實(shí)施例的一些有益效果可以包括:根據(jù)媒體數(shù)據(jù)是語音形式的數(shù)據(jù)的特點(diǎn),具有將該語音形式的音頻數(shù)據(jù)先轉(zhuǎn)換為文本形式的文字?jǐn)?shù)據(jù),再通過對文字進(jìn)行分詞得到關(guān)鍵詞,并將該關(guān)鍵詞作為該視頻的關(guān)鍵詞的功能,解決了視頻格式的數(shù)據(jù)文件無法從中獲取到對應(yīng)內(nèi)容的關(guān)鍵詞的技術(shù)問題,進(jìn)而可以取得效果高,得到的關(guān)鍵詞較準(zhǔn)確且關(guān)鍵詞覆蓋的內(nèi)容較全面的技術(shù)效果。
[0033]進(jìn)一步地,所述媒體數(shù)據(jù)為圖像形式的數(shù)據(jù);所述提取模塊包括:
[0034]圖像提取單元,用于根據(jù)視頻的圖像形式的數(shù)據(jù)提取所述視頻的標(biāo)題;在網(wǎng)絡(luò)中查找與所述標(biāo)題對應(yīng)的文本格式的新聞;獲取所述新聞的關(guān)鍵詞,并將所述關(guān)鍵詞作為所述視頻的關(guān)鍵詞。
[0035]本發(fā)明實(shí)施例的一些有益效果可以包括:根據(jù)媒體數(shù)據(jù)是圖像形式的數(shù)據(jù)的特點(diǎn),采用先從該圖像形式的圖像數(shù)據(jù)中分析出該視頻的標(biāo)題,在根據(jù)該標(biāo)題在網(wǎng)絡(luò)中查找對應(yīng)的文本格式的新聞,最后再將查找到的新聞中關(guān)鍵詞作為該視頻的關(guān)鍵詞的技術(shù)手段,解決了視頻格式的數(shù)據(jù)文件無法從中獲取到對應(yīng)內(nèi)容的關(guān)鍵詞的技術(shù)問題,進(jìn)而可以取得效果高,得到的關(guān)鍵詞較準(zhǔn)確且關(guān)鍵詞覆蓋的內(nèi)容較全面的技術(shù)效果。
[0036]其中,所述圖像提取單元包括:
[0037]標(biāo)題提取子單元,用于根據(jù)所述視頻的前η秒的圖像形式的數(shù)據(jù)和圖像識別技術(shù)提取所述視頻的標(biāo)題。
[0038]其中,所述圖像提取單元包括:
[0039]獲取子單元,用于若所述新聞已存在關(guān)鍵次,則直接采用所述關(guān)鍵詞;若所述新聞不存在關(guān)鍵詞,則通過分詞放松獲取所述新聞的關(guān)鍵詞。
[0040]本發(fā)明實(shí)施例的一些有益效果可以包括:具有從視頻標(biāo)題對應(yīng)的新聞中獲取關(guān)鍵詞的功能,在該新聞有關(guān)鍵詞時直接采用,在該新聞沒有關(guān)鍵詞時則通過分詞功能獲取,因此可以取得較快捷并且準(zhǔn)確的為視頻獲取到關(guān)鍵詞的技術(shù)效果。
[0041]本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
[0042]下面通過附圖和實(shí)施例,對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
【附圖說明】
[0043]附圖用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實(shí)施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中:
[0044]圖1為本發(fā)明實(shí)施例中提供一種為視頻獲取關(guān)鍵詞的方法的示例性流程圖;
[0045]圖2為本發(fā)明實(shí)施例中提供一種為視頻獲取關(guān)鍵詞的方法的另一示例性流程圖;
[0046]圖3為本發(fā)明實(shí)施例中提供一種為視頻獲取關(guān)鍵詞的方法的再一示例性流程圖;
[0047]圖4為本發(fā)明實(shí)施例中提供一種為視頻獲取關(guān)鍵詞的裝置的一示例性結(jié)構(gòu)圖;
[0048]圖5為本發(fā)明實(shí)施例中提供一種為視頻獲取關(guān)鍵詞的裝置另一示例性結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0049]以下結(jié)合附圖對本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實(shí)施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0050]本實(shí)施例提供一種為視頻獲取關(guān)鍵詞的方法,該方法適合部署在設(shè)備或裝置,該設(shè)備或裝置需要用來為視頻添加索引或獲取索引。如圖1所示,該方法包括:
[0051]101,確定需要關(guān)鍵詞的視頻;
[0052]確定需要關(guān)鍵詞的視頻的過程可以是操作人員選定視頻,也可以就是當(dāng)前正在操作或播放的視頻,也可以是指定路徑下額視頻等。
[0053]102,根據(jù)所述視頻中的媒體數(shù)據(jù)提取關(guān)鍵詞。
[0054]該媒體數(shù)據(jù)包括語音(音頻)形式數(shù)據(jù)和圖像形式的數(shù)據(jù)。
[0055]視頻通常由兩種數(shù)據(jù)文件構(gòu)成,語音(音頻)形式數(shù)據(jù)和圖像形式的數(shù)據(jù)。這兩種數(shù)據(jù)形式都屬于媒體數(shù)據(jù)。本發(fā)明實(shí)施例可以從這兩種形式的數(shù)據(jù)出發(fā),分別給出中提取關(guān)鍵詞的方案。
[0056]在本發(fā)明的另一個實(shí)施方式中,提供了在媒體數(shù)據(jù)為語音形式的數(shù)據(jù)的情況下,上述102中的所述根據(jù)所述視頻中的媒體數(shù)據(jù)提取關(guān)鍵詞的實(shí)現(xiàn)方式,包括:
[0057]將所述視頻中的語音形式的數(shù)據(jù)轉(zhuǎn)換為文本格式的數(shù)據(jù);
[0058]對所述文本格式的數(shù)據(jù)進(jìn)行分詞;
[0059]從所述分詞中提取關(guān)鍵詞,并將所述提取的關(guān)鍵詞作為所述視頻的關(guān)鍵詞。
[0060]在本發(fā)明的又一個實(shí)施例中,還提供了在媒體數(shù)據(jù)為圖像形式的數(shù)據(jù)的情況下,上述102中的所述根據(jù)所述視頻中的媒體數(shù)據(jù)提取關(guān)鍵詞包括:
[0061]根據(jù)視頻的圖像形式的數(shù)據(jù)提取所述視頻的標(biāo)題;
[0062]在網(wǎng)絡(luò)中查找與所述標(biāo)題對應(yīng)的文本格式的新聞;
[0063]獲取所述新聞的關(guān)鍵詞,并將所述關(guān)鍵詞作為所述視頻的關(guān)鍵詞。
[0064]更進(jìn)一步地,上述根據(jù)視頻的圖像形式的數(shù)據(jù)提取所述視頻的