用于語音和視頻通訊的交互控制方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種用于語音和視頻通訊的交互控制方法及裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,即時通訊IM(Instant messaging)工具(例如微信、QQ等)越來越多應(yīng)用于人們的生活和工作中,頂工具(頂軟件)已成為人們和生活中的一種常用交流工具。在使用IM軟件的過程中,用戶可通過文字、語音和視頻等方式與m好友或聊天群進行交流。
[0003]在用戶通過視頻的方式與好友聊天的過程中,如果用戶需要執(zhí)行某些操作,用戶的通常做法是手動執(zhí)行對應(yīng)的操作。例如,用戶需要調(diào)整視頻窗口的大小,此時,用戶需要操作鼠標(biāo)來調(diào)整視頻窗口的大小。再例如,用戶需要遠端聊天用戶幫忙挑選最美的圖片,圖片存放在遠端云上,則只能本地先將遠端圖片下載后,傳輸給聊天用戶,聊天用戶接收圖片傳輸,點擊查看,然后再將選擇結(jié)果告訴用戶。
[0004]然而,在視頻通訊的過程中,有時用戶會出現(xiàn)不方便手動執(zhí)行某些操作的情況,由于現(xiàn)有的交互控制方式比較單一,用戶在視頻通訊過程中,無法解放雙手,用戶的交互體驗并不理想。
【發(fā)明內(nèi)容】
[0005]本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
[0006]為此,本發(fā)明的一個目的在于提出一種用于語音和視頻通訊的交互控制方法,該方法使得用戶在語音/或視頻通訊的過程中,通過語音和/或手勢方式即可控制終端執(zhí)行其他操作,避免了用戶手動操作的麻煩,提高了用戶的交互體驗。
[0007]本發(fā)明的第二個目的在于提出一種用于語音和視頻通訊的交互控制裝置。
[0008]為達上述目的,本發(fā)明第一方面實施例提出了一種用于語音和視頻通訊的交互控制方法,包括:獲取用戶通過預(yù)設(shè)方式輸入的用戶行為數(shù)據(jù),其中,所述預(yù)設(shè)方式包括語音方式和/或手勢方式;確定所述用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的觸發(fā)信息;若判斷獲知包含所述觸發(fā)信息,則確定在預(yù)設(shè)的操作指令集中與所述觸發(fā)信息對應(yīng)的操作指令,并執(zhí)行所述操作指令對應(yīng)的事件。
[0009]本發(fā)明實施例的用于語音和視頻通訊的交互控制方法,獲取用戶通過語音方式和/或手勢方式輸入的用戶行為數(shù)據(jù),確定用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的觸發(fā)信息,以及在判斷獲知包含觸發(fā)信息時,確定在預(yù)設(shè)的操作指令集中與觸發(fā)信息對應(yīng)的操作指令,并執(zhí)行操作指令對應(yīng)的事件,由此,使得用戶在語音/或視頻通訊的過程中,通過語音和/或手勢方式即可控制終端執(zhí)行其他操作,避免了用戶手動操作的麻煩,提高了用戶的交互體驗。
[0010]為達上述目的,本發(fā)明第二方面實施例提出了一種用于語音和視頻通訊的交互控制裝置,包括:獲取模塊,用于獲取用戶通過預(yù)設(shè)方式輸入的用戶行為數(shù)據(jù),其中,所述預(yù)設(shè)方式包括語音方式和/或手勢方式;判斷模塊,用于確定所述用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的觸發(fā)信息;處理模塊,用于在判斷獲知包含所述觸發(fā)信息時,確定在預(yù)設(shè)的操作指令集中與所述觸發(fā)信息對應(yīng)的操作指令,并執(zhí)行所述操作指令對應(yīng)的事件。
[0011]本發(fā)明實施例的用于語音和視頻通訊的交互控制裝置,通過獲取模塊獲取用戶通過語音方式和/或手勢方式輸入的用戶行為數(shù)據(jù),判斷模塊確定用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的觸發(fā)信息,以及在判斷獲知包含觸發(fā)信息時,處理模塊確定在預(yù)設(shè)的操作指令集中與觸發(fā)信息對應(yīng)的操作指令,并執(zhí)行操作指令對應(yīng)的事件,由此,使得用戶在語音或視頻通訊的過程中,通過語音和/或手勢方式即可控制終端執(zhí)行其他操作,避免了用戶手動操作的麻煩,提高了用戶的交互體驗。
【附圖說明】
[0012]圖1是本發(fā)明一個實施例的用于語音和視頻通訊的交互控制方法的流程圖。
[0013]圖2是本發(fā)明另一個實施例的用于語音和視頻通訊的交互控制方法的流程圖。
[0014]圖3是本發(fā)明另一個實施例的用于語音和視頻通訊的交互控制方法的流程圖。
[0015]圖4是本發(fā)明另一個實施例的用于語音和視頻通訊的交互控制方法的流程圖。
[0016]圖5是本發(fā)明另一個實施例的用于語音和視頻通訊的交互控制方法的流程圖。
[0017]圖6是本發(fā)明一個實施例的于語音和視頻通訊的交互控制的結(jié)構(gòu)示意圖。
【具體實施方式】
[0018]下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
[0019]下面參考附圖描述本發(fā)明實施例的用于語音和視頻通訊的交互控制方法及裝置。
[0020]圖1是本發(fā)明一個實施例的用于語音和視頻通訊的交互控制方法的流程圖。
[0021]如圖1所示,該用于語音和視頻通訊的交互控制方法包括:
[0022]S101,獲取用戶通過預(yù)設(shè)方式輸入的用戶行為數(shù)據(jù)。
[0023]其中,預(yù)設(shè)方式包括語音方式和/或手勢方式。
[0024]具體地,在用戶與其他一個或者多個用戶進行語音通話的過程中,為了能夠根據(jù)用戶輸入的語音數(shù)據(jù)執(zhí)行一些操作,可對用戶輸入的語音數(shù)據(jù)進行監(jiān)控。
[0025]另外,在用戶與其他一個或者多個用戶進行視頻通話的過程中,為了能夠根據(jù)用戶輸入的語音數(shù)據(jù)或者手勢動作執(zhí)行一些操作,在對用戶輸入的語音數(shù)據(jù)進行監(jiān)控的同時,還可以對終端的攝像頭進行監(jiān)控,以便根據(jù)攝像頭所獲得的視頻信息中獲得用戶輸入的手勢動作。
[0026]S102,確定用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的觸發(fā)信息。
[0027]為了減少對用戶正常語音或者視頻通話的影響,在用戶需要終端自動根據(jù)自己輸入的語音或者手勢自動執(zhí)行一些操作時,用戶可通過輸入一些觸發(fā)應(yīng)用程序控制終端執(zhí)行一些操作的觸發(fā)詞或者觸發(fā)動作,應(yīng)用程序獲取用戶在觸發(fā)詞或者觸發(fā)動作之后,后續(xù)輸入的語音或者手勢動作,并根據(jù)語音或者手動動作執(zhí)行一些操作。
[0028]其中,觸發(fā)信息可以包括但不限于觸發(fā)詞、動作操作詞、關(guān)鍵字、觸發(fā)手勢動作和手勢動作。
[0029]在本發(fā)明的一個實施例中,若監(jiān)控到用戶通過語音方式輸入用戶行為數(shù)據(jù),可判斷用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的觸發(fā)詞,若判斷獲知包含觸發(fā)詞,則進一步判斷用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的動作操作詞。應(yīng)當(dāng)理解的是,此時的用戶行為數(shù)據(jù)即為語音數(shù)據(jù)。
[0030]另外,在用戶通過視頻通話方式進行聊天的過程中,可通過攝像頭獲取用戶輸入的用戶行為數(shù)據(jù),在獲得用戶行為數(shù)據(jù)后,可判斷用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的觸發(fā)手勢動作,若判斷獲知包含觸發(fā)手勢動作,則進一步判斷用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的手勢操作。
[0031]S103,若判斷獲知包含觸發(fā)信息,則確定在預(yù)設(shè)的操作指令集中與觸發(fā)信息對應(yīng)的操作指令,并執(zhí)行操作指令對應(yīng)的事件。
[0032]其中,需要理解的是,觸發(fā)信息、操作指令與事件之間的對應(yīng)關(guān)系是預(yù)先保存的。
[0033]例如,在用戶A與用戶B進行視頻通話的過程中,假定觸發(fā)應(yīng)用程序根據(jù)用戶輸入的語音數(shù)據(jù)執(zhí)行一些操作的預(yù)留語音指令(觸發(fā)詞)為“X語音助手”,即在用戶輸入的語音數(shù)據(jù)中包含“X語音助手”后,可對語音數(shù)據(jù)中“X語音助手”之后的語音數(shù)據(jù)進行識別,以確定在用戶輸入的“X語音助手”之后的語音數(shù)據(jù)中是否包含預(yù)設(shè)的動作操作詞。假定獲得到用戶當(dāng)前輸入的語音數(shù)據(jù)為“X語音助手,下載百度云圖片X.jpg和1.jpg,發(fā)送給用戶B并讓其選擇”。此時,可通過現(xiàn)有技術(shù)對用戶輸入的語音數(shù)據(jù)進行解析,以獲得語音數(shù)據(jù)的解析結(jié)果,并判斷解析結(jié)果中是否包含預(yù)設(shè)的動作操作詞,若包含預(yù)設(shè)的動作操作詞,則獲得與動作操作詞對應(yīng)的操作指令,并根據(jù)操作指令執(zhí)行對應(yīng)的操作。
[0034]再例如,在用戶A與用戶B進行視頻通話的過程中,假定觸發(fā)應(yīng)用程