電視播放控制方法、服務(wù)器及電視播放控制系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及電視技術(shù)領(lǐng)域,尤其涉及一種電視播放控制方法、服務(wù)器及電視播放控制系統(tǒng)。
【背景技術(shù)】
[0002]目前的電視終端在進(jìn)行視頻文件播放時(shí),通常根據(jù)視頻文件中音軌及字幕數(shù)據(jù)來切換人物配音和字幕,以方便不同的用戶可以選擇自己理解的語言進(jìn)行播放。然而,這種視頻播放方式至少存在以下缺陷:
[0003]大多數(shù)視頻文件可能只提供了一種語音,但同時(shí)提供了兩種以上的字幕,這種情況下,用戶只能收聽視頻文件中提供的默認(rèn)語音,而在用戶聽不懂該默認(rèn)語言時(shí),就只能通過觀看字幕來了解人物對白和劇情。這樣,會降低用戶的視聽體驗(yàn)效果。
[0004]上述內(nèi)容僅用于輔助理解本發(fā)明的技術(shù)方案,并不代表承認(rèn)上述內(nèi)容是現(xiàn)有技術(shù)。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的主要目的在于提供一種電視播放控制方法、服務(wù)器及電視播放控制系統(tǒng),旨在根據(jù)不同用戶的語言需求,對應(yīng)提供可被用戶理解的音頻,以避免只能借助字幕來了解人物對白及劇情的缺陷,從而提高用戶觀看電視的體驗(yàn)感。
[0006]為實(shí)現(xiàn)上述目的,本發(fā)明提供一種電視播放控制方法,所述電視播放控制方法包括以下步驟:
[0007]服務(wù)器接收電視終端發(fā)送的第一音頻數(shù)據(jù)和字幕數(shù)據(jù);
[0008]對所述第一音頻數(shù)據(jù)和字幕數(shù)據(jù)進(jìn)行識別處理,生成角色列表和樣例音頻參數(shù);
[0009]將所述角色列表和樣例音頻參數(shù)發(fā)送至所述電視終端,并在接收到所述電視終端根據(jù)所述角色列表和樣例音頻參數(shù)反饋的用戶設(shè)置參數(shù)時(shí),將所述第一音頻數(shù)據(jù)合成為第二音頻數(shù)據(jù);
[0010]將所述第二音頻數(shù)據(jù)發(fā)送至所述電視終端,以控制所述第二音頻數(shù)據(jù)以及所述字幕數(shù)據(jù)在所述電視終端進(jìn)行播放。
[0011]優(yōu)選地,所述對所述第一音頻數(shù)據(jù)和字幕數(shù)據(jù)進(jìn)行識別處理,生成角色列表和樣例音頻參數(shù)的步驟包括:
[0012]所述服務(wù)器從所述字幕數(shù)據(jù)中提取出字幕時(shí)間戳;
[0013]根據(jù)所述字幕時(shí)間戳,查找出所述第一音頻數(shù)據(jù)出現(xiàn)的時(shí)間片段;
[0014]對所述時(shí)間片段內(nèi)的所述第一音頻數(shù)據(jù)進(jìn)行頻譜分析,并進(jìn)行歸類生成角色列表;
[0015]利用語音合成技術(shù),生成與所述角色列表對應(yīng)的樣例音頻參數(shù);
[0016]其中,所述電視終端從視頻文件中提取出所述第一音頻數(shù)據(jù)和所述字幕數(shù)據(jù),并將所述第一音頻數(shù)據(jù)和字幕數(shù)據(jù)發(fā)送至所述服務(wù)器。
[0017]優(yōu)選地,所述利用語音合成技術(shù),生成與所述角色列表對應(yīng)的樣例音頻參數(shù)的步驟包括:
[0018]針對所述角色列表中的每個(gè)角色,從所述字幕數(shù)據(jù)中提取出預(yù)定數(shù)量的字幕時(shí)間戳;
[0019]通過文本語音引擎,對應(yīng)所述預(yù)定數(shù)量的字幕時(shí)間戳生成預(yù)定數(shù)量的樣例音頻參數(shù),以發(fā)至所述電視終端進(jìn)行預(yù)覽選擇。
[0020]優(yōu)選地,所述將所述角色列表和樣例音頻參數(shù)發(fā)送至所述電視終端,并在接收到所述電視終端根據(jù)所述角色列表和樣例音頻參數(shù)反饋的用戶設(shè)置參數(shù)時(shí),將所述第一音頻數(shù)據(jù)合成為第二音頻數(shù)據(jù)的步驟包括:
[0021]將生成的所述角色列表和樣例音頻參數(shù)發(fā)送至所述電視終端;
[0022]接收所述電視終端根據(jù)所述角色列表和樣例音頻參數(shù)反饋的用戶設(shè)置參數(shù);
[0023]對所述第一音頻數(shù)據(jù)進(jìn)行音頻過濾,通過文本語音引擎并結(jié)合所述用戶設(shè)置參數(shù),合成與所述角色列表對應(yīng)的所述第二音頻數(shù)據(jù);
[0024]其中,所述電視終端接收用戶通過用戶界面選擇的角色列表和樣例音頻參數(shù),以生成所述用戶設(shè)置參數(shù),并將所述用戶設(shè)置參數(shù)反饋給所述服務(wù)器。
[0025]優(yōu)選地,所述對所述時(shí)間片段內(nèi)的所述第一音頻數(shù)據(jù)進(jìn)行頻譜分析,并進(jìn)行歸類生成角色列表的步驟包括:
[0026]分別獲取第一時(shí)間片段和第二時(shí)間片段內(nèi)的第一音頻數(shù)據(jù);
[0027]判斷所述第一時(shí)間片段和第二時(shí)間片段內(nèi)的第一音頻數(shù)據(jù)的頻譜范圍及頻譜幅度是否一致;
[0028]若是,則將所述第一時(shí)間片段和第二時(shí)間片段內(nèi)的第一音頻數(shù)據(jù)歸類為同一角色;
[0029]若否,則將所述第一時(shí)間片段和第二時(shí)間片段內(nèi)的第一音頻數(shù)據(jù)歸類為不同角色。
[0030]此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種服務(wù)器,所述服務(wù)器包括:
[0031]第一接收模塊,用于接收電視終端發(fā)送的第一音頻數(shù)據(jù)和字幕數(shù)據(jù);
[0032]生成處理模塊,用于對所述第一音頻數(shù)據(jù)和字幕數(shù)據(jù)進(jìn)行識別處理,生成角色列表和樣例音頻參數(shù);
[0033]合成處理模塊,用于將所述角色列表和樣例音頻參數(shù)發(fā)送至所述電視終端,并在接收到所述電視終端根據(jù)所述角色列表和樣例音頻參數(shù)反饋的用戶設(shè)置參數(shù)時(shí),將所述第一音頻數(shù)據(jù)合成為第二音頻數(shù)據(jù);
[0034]第一發(fā)送模塊,用于將所述第二音頻數(shù)據(jù)發(fā)送至所述電視終端,以控制所述第二音頻數(shù)據(jù)以及所述字幕數(shù)據(jù)在所述電視終端進(jìn)行播放。
[0035]優(yōu)選地,所述生成處理模塊包括:
[0036]獲取單元,用于從所述字幕數(shù)據(jù)中提取出字幕時(shí)間戳;
[0037]查找單元,用于根據(jù)所述字幕時(shí)間戳,查找出所述第一音頻數(shù)據(jù)出現(xiàn)的時(shí)間片段;
[0038]歸類單元,用于對所述時(shí)間片段內(nèi)的所述第一音頻數(shù)據(jù)進(jìn)行頻譜分析,并進(jìn)行歸類生成角色列表;
[0039]生成單元,用于利用語音合成技術(shù),生成與所述角色列表對應(yīng)的樣例音頻參數(shù);
[0040]其中,所述電視終端從視頻文件中提取出所述第一音頻數(shù)據(jù)和所述字幕數(shù)據(jù),并將所述第一音頻數(shù)據(jù)和字幕數(shù)據(jù)發(fā)送至所述服務(wù)器。
[0041]優(yōu)選地,所述生成單元包括:
[0042]提取子單元,用于針對所述角色列表中的每個(gè)角色,從所述字幕數(shù)據(jù)中提取出預(yù)定數(shù)量的字幕時(shí)間戳;
[0043]生成子單元,用于通過文本語音引擎,對應(yīng)所述預(yù)定數(shù)量的字幕時(shí)間戳生成預(yù)定數(shù)量的樣例音頻參數(shù),以發(fā)至所述電視終端進(jìn)行預(yù)覽選擇。
[0044]優(yōu)選地,所述合成處理模塊包括:
[0045]發(fā)送單元,用于將生成的所述角色列表和樣例音頻參數(shù)發(fā)送至所述電視終端;
[0046]接收單元,用于接收所述電視終端根據(jù)所述角色列表和樣例音頻參數(shù)反饋的用戶設(shè)置參數(shù);
[0047]合成單元,用于對所述第一音頻數(shù)據(jù)進(jìn)行音頻過濾,通過文本語音引擎并結(jié)合所述用戶設(shè)置參數(shù),合成與所述角色列表對應(yīng)的所述第二音頻數(shù)據(jù);
[0048]其中,所述電視終端接收用戶通過用戶界面選擇的角色列表和樣例音頻參數(shù),以生成所述用戶設(shè)置參數(shù),并將所述用戶設(shè)置參數(shù)反饋給所述服務(wù)器。
[0049]優(yōu)選地,所述歸類單元包括:
[0050]獲取子單元,用于分別獲取第一時(shí)間片段和第二時(shí)間片段內(nèi)的第一音頻數(shù)據(jù);
[0051]判斷子單元,用于判斷所述第一時(shí)間片段和第二時(shí)間片段內(nèi)的第一音頻數(shù)據(jù)的頻譜范圍及頻譜幅度是否一致;
[0052]第一歸類子單元,用于在判斷所述第一時(shí)間片段和第二時(shí)間片段內(nèi)的第一音頻數(shù)據(jù)的頻譜范圍及頻譜幅度一致時(shí),則將所述第一時(shí)間片段和第二時(shí)間片段內(nèi)的第一音頻數(shù)據(jù)歸類為同一角色;
[0053]第二歸類子單元,用于在判斷所述第一時(shí)間片段和第二時(shí)間片段內(nèi)的第一音頻數(shù)據(jù)的頻譜范圍和/或頻譜幅度不一致時(shí),則將所述第一時(shí)間片段和第二時(shí)間片段內(nèi)的第一音頻數(shù)據(jù)歸類為不同角色。
[0054]此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種電視播放控制系統(tǒng),所述電視播放控制系統(tǒng)包括電視終端以及如上所述的服務(wù)器,所述電視終端包括:
[0055]第二發(fā)送模塊,用于向服務(wù)器發(fā)送第一音頻數(shù)據(jù)和字幕數(shù)據(jù);
[0056]第二接收模塊,用于接收所述服務(wù)器對所述第一音頻數(shù)據(jù)和字幕數(shù)據(jù)進(jìn)行識別處理后,生成的角色列表和樣例音頻參數(shù);
[0057]反饋模塊,用于根據(jù)所述角色列表和樣例音頻參數(shù)生成用戶設(shè)置參數(shù),并將所述用戶設(shè)置參數(shù)反饋給所述服務(wù)器;
[0058]獲取模塊,用于獲取所述服務(wù)器在接收到所述用戶設(shè)置參數(shù)時(shí),將所述第一音頻數(shù)據(jù)合成的第二音頻數(shù)據(jù);
[0059]同步播放模塊,用于將所述第二音頻數(shù)據(jù)、視頻數(shù)據(jù)以及字幕數(shù)據(jù)進(jìn)行同步播放;
[0060]其中,所述電視終端從視頻文件中提取出所述視頻數(shù)據(jù)、所述第一音頻數(shù)據(jù)以及所述字幕數(shù)據(jù)。
[0061]本發(fā)明提供的電視播放控制方法、服務(wù)器以及電視播放控制系統(tǒng),首先通過服務(wù)器接收電視終端發(fā)送的第一音頻數(shù)據(jù)和字幕數(shù)據(jù),并進(jìn)行識別處理,以生成角色列表和樣例音頻參數(shù),然后將所述角色列表和樣例音頻參數(shù)發(fā)送至所述電視終端,在接收到所述電視終端反饋的用戶設(shè)置參數(shù)時(shí),根據(jù)所述用戶設(shè)置參數(shù)將所述第一音頻數(shù)據(jù)合成為第二音頻數(shù)據(jù),最終將所述第二音頻數(shù)據(jù)發(fā)送至所述電視終端,以控制所述第二音頻數(shù)據(jù)以及所述字幕數(shù)據(jù)在所述電視終端進(jìn)行播放。這樣,可以根據(jù)不同用戶的語言需求,對應(yīng)提供可被用戶理解的音頻,還可以滿足用戶對人物對白的個(gè)性化要求,從而可以避免只能借助字幕來了解人物