一種視頻通話方法、系統(tǒng)及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及視頻領(lǐng)域,特別涉及一種視頻通話方法、系統(tǒng)及裝置。
【背景技術(shù)】
[0002]由于視頻通話的實(shí)時(shí)性以及較高的交互體驗(yàn),使得越來越多的用戶選擇即時(shí)視頻來實(shí)現(xiàn)自身的交互需求。
[0003]但是現(xiàn)有的即時(shí)視頻交互技術(shù)中,視頻雙方的視頻畫面往往是通過矩形窗口,將視頻雙方的畫面在任意一方的視頻通話裝置上進(jìn)行顯示的,該顯示方式滿足不了即時(shí)視頻過程中用戶的多樣化需求,且該顯示方式由于形式單一,使得在即時(shí)視頻過程中,無法滿足用戶通過增加即時(shí)視頻顯示方式來提高用戶體驗(yàn)的需求,從而,在使用現(xiàn)有的即時(shí)視頻交互技術(shù)實(shí)現(xiàn)即時(shí)視頻時(shí),用戶的用戶體驗(yàn)較差,尤其是交互過程中的交互體驗(yàn)較差。
【發(fā)明內(nèi)容】
[0004]為了增加即時(shí)視頻的顯示方式,滿足即時(shí)視頻交互過程中用戶的個(gè)性化需求,同時(shí),增加即時(shí)視頻參與者在交互過程中的互動(dòng)性,提高交互體驗(yàn),本發(fā)明實(shí)施例提供了一種視頻通話方法、系統(tǒng)及裝置。所述技術(shù)方案如下:
[0005]第一方面,提供了一種視頻通話方法,所述方法包括:
[0006]第一視頻通話裝置獲取用戶輸入的虛擬形象;
[0007]所述第一視頻通話裝置獲取當(dāng)前視頻幀;
[0008]所述第一視頻通話裝置向第二視頻通話裝置發(fā)送所述虛擬形象和所述當(dāng)前視頻幀;
[0009]所述第二視頻通話裝置將接收的所述當(dāng)前視頻幀和所述虛擬形象進(jìn)行匹配,得到匹配后的當(dāng)前視頻幀;以及
[0010]所述第二視頻通話裝置顯示所述匹配后的當(dāng)前視頻幀。
[0011]結(jié)合第一方面,在第一種可能的實(shí)現(xiàn)方式中,所述獲取用戶輸入的虛擬形象包括:
[0012]獲取用戶輸入的第一手勢,所述第一手勢的軌跡用于描述所述虛擬形象。
[0013]結(jié)合第一方面,在第二種可能的實(shí)現(xiàn)方式中,所述獲取用戶輸入的虛擬形象包括:
[0014]識別用戶輸入的圖片中所包含的虛擬形象。
[0015]結(jié)合第一方面至第一方面的第二種任意一種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,所述將接收的所述當(dāng)前視頻幀和所述虛擬形象進(jìn)行匹配,得到匹配后的當(dāng)前視頻幀包括:
[0016]識別并獲取所述當(dāng)前視頻幀中的人臉部分,并將所述人臉部分與所述虛擬形象進(jìn)行匹配,得到匹配后的當(dāng)前視頻幀;或者
[0017]根據(jù)所述虛擬形象對所述當(dāng)前視頻幀進(jìn)行裁剪和/或縮小,并將所述裁剪和/或縮小的結(jié)果與所述虛擬形象進(jìn)行匹配,得到匹配后的當(dāng)前視頻幀。
[0018]結(jié)合第一方面,在第四種可能的實(shí)現(xiàn)方式中,所述方法還包括:
[0019]第一視頻通話裝置獲取用戶輸入的虛擬形象的動(dòng)作和/或表情;
[0020]所述第一視頻通話裝置向第二視頻通話裝置發(fā)送所述虛擬形象的動(dòng)作和/或表情;
[0021 ]所述第二視頻通話裝置顯示接收的虛擬形象的動(dòng)作和/或表情。
[0022]結(jié)合第一方面的第四種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,所述第一視頻通話裝置獲取用戶輸入的虛擬形象的動(dòng)作和/或表情之前,所述方法還包括:
[0023]獲取用戶輸入的第二手勢,所述第二手勢用于描述所述虛擬形象的動(dòng)作和/或表情;
[0024]設(shè)置與所述虛擬形象的動(dòng)作和/或表情對應(yīng)的第三手勢和/或事件。
[0025]結(jié)合第一方面的第五種可能的實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式中,所述獲取用戶輸入的虛擬形象的動(dòng)作和/或表情包括:
[0026]根據(jù)用戶輸入的第三手勢和/或事件,獲取對應(yīng)的虛擬形象的動(dòng)作和/或表情。
[0027]第二方面,提供了一種視頻通話方法,所述方法包括:
[0028]所述第一視頻通話裝置獲取用戶輸入的虛擬形象;
[0029]所述第一視頻通話裝置獲取當(dāng)前視頻幀;
[0030]所述第一視頻通話裝置將所述虛擬形象與所述當(dāng)前視頻幀進(jìn)行匹配,得到匹配后的當(dāng)前視頻幀;
[0031]所述第一視頻通話裝置向所述第二視頻通話裝置發(fā)送所述匹配后的當(dāng)前視頻幀;
[0032]所述第二視頻通話裝置顯示接收到的匹配后的當(dāng)前視頻幀。
[0033]結(jié)合第二方面,在第一種可能的實(shí)現(xiàn)方式中,所述獲取用戶輸入的虛擬形象包括:
[0034]獲取用戶輸入的第一手勢,所述第一手勢的軌跡用于描述所述虛擬形象。
[0035]結(jié)合第二方面,在第二種可能的實(shí)現(xiàn)方式中,所述獲取用戶輸入的虛擬形象包括:
[0036]識別用戶輸入的圖片中所包含的虛擬形象。
[0037]結(jié)合第二方面至第二方面的第二種任意一種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,所述將所述虛擬形象與所述當(dāng)前視頻幀進(jìn)行匹配,得到匹配后的當(dāng)前視頻幀包括:
[0038]識別并獲取所述當(dāng)前視頻幀中的人臉部分,并將所述人臉部分與所述虛擬形象進(jìn)行匹配,得到匹配后的當(dāng)前視頻幀;或者
[0039]根據(jù)所述虛擬形象對所述當(dāng)前視頻幀進(jìn)行裁剪和/或縮小,并將所述裁剪和/或縮小的結(jié)果與所述虛擬形象進(jìn)行匹配,得到匹配后的當(dāng)前視頻幀。
[0040]結(jié)合第二方面,在第四種可能的實(shí)現(xiàn)方式中,所述方法還包括:
[0041]第一視頻通話裝置獲取用戶輸入的虛擬形象的動(dòng)作和/或表情;
[0042]所述第一視頻通話裝置向第二視頻通話裝置發(fā)送所述虛擬形象的動(dòng)作和/或表情;
[0043]所述第二視頻通話裝置顯示接收的虛擬形象的動(dòng)作和/或表情。
[0044]結(jié)合第二方面的第四種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,所述第一視頻通話裝置獲取用戶輸入的虛擬形象的動(dòng)作和/或表情之前,所述方法還包括:
[0045]獲取用戶輸入的第二手勢,所述第二手勢用于描述所述虛擬形象的動(dòng)作和/或表情;
[0046]設(shè)置與所述虛擬形象的動(dòng)作和/或表情對應(yīng)的第三手勢和/或事件。
[0047]結(jié)合第二方面的第五種可能的實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式,所述獲取用戶輸入的虛擬形象的動(dòng)作和/或表情包括:
[0048]根據(jù)用戶輸入的第三手勢和/或事件,獲取對應(yīng)的虛擬形象的動(dòng)作和/或表情。[0049 ]第三方面,提供了一種視頻通話裝置,所述裝置包括:
[0050]虛擬形象獲取模塊,用于獲取用戶輸入的虛擬形象;
[0051 ]當(dāng)前視頻幀獲取模塊,用于獲取當(dāng)前視頻幀;以及
[0052]發(fā)送模塊,用于向其他視頻通話裝置發(fā)送所述虛擬形象和所述當(dāng)前視頻幀。
[0053]結(jié)合第三方面,在第一種可能的實(shí)現(xiàn)方式中,所述裝置還包括:
[0054]接收模塊,用于接收來自所述其他視頻通話裝置的虛擬形象和當(dāng)前視頻幀;
[0055]匹配模塊,用于將接收的所述當(dāng)前視頻幀和所述虛擬形象進(jìn)行匹配,得到匹配后的當(dāng)前視頻幀;以及
[0056]顯示模塊,用于顯示所述匹配后的當(dāng)前視頻幀。
[0057]結(jié)合第三方面,在第二種可能的實(shí)現(xiàn)方式中,所述虛擬形象獲取模塊具體用于:
[0058]獲取用戶輸入的第一手勢,所述第一手勢的軌跡用于描述所述虛擬形象。
[0059]結(jié)合第三方面,在第三種可能的實(shí)現(xiàn)方式中,所述虛擬形象獲取模塊具體用于:
[0060]識別用戶輸入的圖片中所包含的虛擬形象。
[0061]結(jié)合第三方面至第三方面的第三種任意一種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述匹配模塊用于:
[0062]識別并獲取所述當(dāng)前視頻幀中的人臉部分,并將所述人臉部分與所述虛擬形象進(jìn)行匹配,得到匹配后的當(dāng)前視頻幀;或者
[0063]根據(jù)所述虛擬形象對所述當(dāng)前視頻幀進(jìn)行裁剪和/或縮小,并將所述裁剪和/或縮小的結(jié)果與所述虛擬形象進(jìn)行匹配,得到匹配后的當(dāng)前視頻幀。
[0064]結(jié)合第三方面,在第五種可能的實(shí)現(xiàn)方式中,
[0065]所述裝置還包括虛擬形象的動(dòng)作/表情獲取模塊,用于獲取用戶輸入的虛擬形象的動(dòng)作和/或表情;
[0066]所述發(fā)送模塊還用于向所述其他視頻通話裝置發(fā)送所述虛擬形象的動(dòng)作和/或表情;
[0067]所述接收模塊還用于接收來自所述其他視頻通話裝置的虛擬形象的動(dòng)作和/或表情;以及
[0068]所述顯示模塊還用于顯示接收的虛擬形象的動(dòng)作和/或表情。
[0069]結(jié)合第三方面的第五種可能的實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式中,所述裝置還包括:
[0070]手勢獲取模塊,用于獲取用戶輸入的第二手勢,所述第二手勢用于描述所述虛擬形象的動(dòng)作和/或表情;以及
[0071]設(shè)置模塊,用于設(shè)置與所述虛擬形象的動(dòng)作和/或表情對應(yīng)的第三手勢和/或事件。
[0072]結(jié)合第三方面的第六種可能的實(shí)現(xiàn)方式,在第七種可能的實(shí)現(xiàn)方式中,所述虛擬形象的動(dòng)作/表情獲取模塊具體用于:
[0073]根據(jù)用戶輸入的第三手勢和/或事件,獲取對應(yīng)的虛擬形象的動(dòng)作和/或表情。
[0074]第四方面,提供了一種視頻通話裝置,所述裝置包括:
[0075]虛擬形象獲取模塊,用于獲取用戶輸入的虛擬形象;
[0076]當(dāng)前視頻幀獲取模塊,用于獲取當(dāng)前視頻幀;
[0077]匹配模塊,用于將所述虛擬形象與所述當(dāng)前視頻幀進(jìn)行匹配,得到匹配后的當(dāng)前視頻幀;
[0078]發(fā)送模塊,用于向其他視頻通話裝置發(fā)送所述匹配后的當(dāng)前視頻幀;
[0079]結(jié)合第四方面,在第一種可能的實(shí)現(xiàn)方式中,所述裝置還包括:
[0080]接收模塊,用于接收來自所述其他視頻通話裝置的匹配后的當(dāng)前視頻幀;以及
[0081]顯示模塊,用于顯示接收到的匹配后的當(dāng)前視頻幀。
[0082]結(jié)合第四方面,在第二種可能的實(shí)現(xiàn)方式中,所述虛擬形象獲取模塊具體用于:
[0083]獲取用戶輸入的第一手勢,所述第一手勢的軌跡用于描述所述虛擬形象。
[0084]結(jié)合第四方面,在第三種可能的實(shí)現(xiàn)方式中,所述虛擬形象獲取模塊具體用于:
[0085]識別用戶輸入的圖片中所包含的虛擬形象。
[0086]結(jié)合第四方面至第四方面的第三種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述匹配模塊具體用于:
[0087]識別并獲取所述當(dāng)前視頻幀中的人臉部分,并將所述人臉部分與所述虛擬形象進(jìn)行匹配,得到匹配后的當(dāng)前視頻幀;或者
[0088]根據(jù)所述虛擬形象對所述當(dāng)前視頻幀進(jìn)行裁剪和/或縮小,并將所述裁剪和/或縮小的結(jié)果與所述虛擬形象進(jìn)行匹配,得到匹配后的當(dāng)前視頻幀。
[0089]結(jié)合第四方面,在第五種可能的實(shí)現(xiàn)方式中,
[0090]所述裝置還包括虛擬形象的動(dòng)作/表情獲取模塊,用于獲取用戶輸入的虛擬形象的動(dòng)作和/或表情;
[0091]所述發(fā)送模塊還用于向所述其他視頻通話裝置發(fā)送所述虛擬形象的動(dòng)作和/或表情;
[0092]所述接收模塊還用于接收來自所述其他視頻通話裝置的虛擬形象的動(dòng)作和/或表情;以及
[0093]所述顯示模塊還用于顯示接收的虛擬形象的動(dòng)作和/或表情。
[0094]結(jié)合第四方面的第五種可能的實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式中,所述裝置還包括:
[0095]手勢獲取模塊,用于獲取用戶輸入的第二手勢,所述第二手勢用于描述所述虛擬形象的動(dòng)作和/或表情;以及
[0096]設(shè)置模塊,用于設(shè)置與所述虛擬形象的動(dòng)作和/或表情對應(yīng)的第三手勢和/或事件。
[0097]結(jié)合第四方面的第六種可能的實(shí)現(xiàn)方式,在第七種可能的實(shí)現(xiàn)方式中,所述虛擬形象的動(dòng)作/表情獲取模塊具體用于:
[0098]根據(jù)用戶輸入的第三手勢和/或事件,獲取對應(yīng)的虛擬形象的動(dòng)作和/或表情。[0099 ]第五方面,提供了一種視頻通話裝置,所述裝置包括觸摸顯示屏、發(fā)送接收/模塊、攝像頭、存儲器以及與所述觸摸顯示屏、所述發(fā)送接收/模塊、所述攝像頭、所述存儲器連接的處理器,其中,所述存儲器用于存儲一組程序代碼,所述處理器調(diào)用所述存儲器所存儲的程序代碼用于執(zhí)行以下操作:
[0100]獲取用戶輸入的虛擬形象;
[0101]獲取當(dāng)前視頻幀;
[0102]控制所述發(fā)送接收/模塊向其他視頻通話裝置發(fā)送所述虛擬形象和所述當(dāng)前視頻幀;
[0103]將接收的所述當(dāng)前視頻幀和所述虛擬形象進(jìn)行匹配,得到匹配后的當(dāng)前視頻幀;以及
[0104]控制所述觸摸顯示屏顯示所述匹配后的當(dāng)前視頻幀。
[0105]結(jié)合第五方面,在第一種可能的實(shí)現(xiàn)方式中,所述處理器調(diào)用所述存儲器所存儲的程序代碼具體用于執(zhí)行以下操作:
[0106]獲取用戶輸入的第一手勢,所述第一手勢的軌跡用于描述所述虛擬形象。
[0107]結(jié)合第五方面,在第二種可能的實(shí)現(xiàn)方式中,所述處理器調(diào)用所述存儲器所存儲的程序代碼具體用于執(zhí)行以下操作: