用于語音和視頻通訊的交互控制方法及裝置的制造方法

文檔序號：9452748閱讀：537來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

用于語音和視頻通訊的交互控制方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域，尤其涉及一種用于語音和視頻通訊的交互控制方法及裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展，即時通訊IM(Instant messaging)工具(例如微信、QQ等)越來越多應(yīng)用于人們的生活和工作中，頂工具(頂軟件)已成為人們和生活中的一種常用交流工具。在使用IM軟件的過程中，用戶可通過文字、語音和視頻等方式與m好友或聊天群進行交流。
[0003]在用戶通過視頻的方式與好友聊天的過程中，如果用戶需要執(zhí)行某些操作，用戶的通常做法是手動執(zhí)行對應(yīng)的操作。例如，用戶需要調(diào)整視頻窗口的大小，此時，用戶需要操作鼠標(biāo)來調(diào)整視頻窗口的大小。再例如，用戶需要遠端聊天用戶幫忙挑選最美的圖片，圖片存放在遠端云上，則只能本地先將遠端圖片下載后，傳輸給聊天用戶，聊天用戶接收圖片傳輸，點擊查看，然后再將選擇結(jié)果告訴用戶。
[0004]然而，在視頻通訊的過程中，有時用戶會出現(xiàn)不方便手動執(zhí)行某些操作的情況，由于現(xiàn)有的交互控制方式比較單一，用戶在視頻通訊過程中，無法解放雙手，用戶的交互體驗并不理想。

【發(fā)明內(nèi)容】

[0005]本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
[0006]為此，本發(fā)明的一個目的在于提出一種用于語音和視頻通訊的交互控制方法，該方法使得用戶在語音/或視頻通訊的過程中，通過語音和/或手勢方式即可控制終端執(zhí)行其他操作，避免了用戶手動操作的麻煩，提高了用戶的交互體驗。
[0007]本發(fā)明的第二個目的在于提出一種用于語音和視頻通訊的交互控制裝置。
[0008]為達上述目的，本發(fā)明第一方面實施例提出了一種用于語音和視頻通訊的交互控制方法，包括:獲取用戶通過預(yù)設(shè)方式輸入的用戶行為數(shù)據(jù)，其中，所述預(yù)設(shè)方式包括語音方式和/或手勢方式；確定所述用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的觸發(fā)信息；若判斷獲知包含所述觸發(fā)信息，則確定在預(yù)設(shè)的操作指令集中與所述觸發(fā)信息對應(yīng)的操作指令，并執(zhí)行所述操作指令對應(yīng)的事件。
[0009]本發(fā)明實施例的用于語音和視頻通訊的交互控制方法，獲取用戶通過語音方式和/或手勢方式輸入的用戶行為數(shù)據(jù)，確定用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的觸發(fā)信息，以及在判斷獲知包含觸發(fā)信息時，確定在預(yù)設(shè)的操作指令集中與觸發(fā)信息對應(yīng)的操作指令，并執(zhí)行操作指令對應(yīng)的事件，由此，使得用戶在語音/或視頻通訊的過程中，通過語音和/或手勢方式即可控制終端執(zhí)行其他操作，避免了用戶手動操作的麻煩，提高了用戶的交互體驗。
[0010]為達上述目的，本發(fā)明第二方面實施例提出了一種用于語音和視頻通訊的交互控制裝置，包括:獲取模塊，用于獲取用戶通過預(yù)設(shè)方式輸入的用戶行為數(shù)據(jù)，其中，所述預(yù)設(shè)方式包括語音方式和/或手勢方式；判斷模塊，用于確定所述用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的觸發(fā)信息；處理模塊，用于在判斷獲知包含所述觸發(fā)信息時，確定在預(yù)設(shè)的操作指令集中與所述觸發(fā)信息對應(yīng)的操作指令，并執(zhí)行所述操作指令對應(yīng)的事件。
[0011]本發(fā)明實施例的用于語音和視頻通訊的交互控制裝置，通過獲取模塊獲取用戶通過語音方式和/或手勢方式輸入的用戶行為數(shù)據(jù)，判斷模塊確定用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的觸發(fā)信息，以及在判斷獲知包含觸發(fā)信息時，處理模塊確定在預(yù)設(shè)的操作指令集中與觸發(fā)信息對應(yīng)的操作指令，并執(zhí)行操作指令對應(yīng)的事件，由此，使得用戶在語音或視頻通訊的過程中，通過語音和/或手勢方式即可控制終端執(zhí)行其他操作，避免了用戶手動操作的麻煩，提高了用戶的交互體驗。
【附圖說明】
[0012]圖1是本發(fā)明一個實施例的用于語音和視頻通訊的交互控制方法的流程圖。
[0013]圖2是本發(fā)明另一個實施例的用于語音和視頻通訊的交互控制方法的流程圖。
[0014]圖3是本發(fā)明另一個實施例的用于語音和視頻通訊的交互控制方法的流程圖。
[0015]圖4是本發(fā)明另一個實施例的用于語音和視頻通訊的交互控制方法的流程圖。
[0016]圖5是本發(fā)明另一個實施例的用于語音和視頻通訊的交互控制方法的流程圖。
[0017]圖6是本發(fā)明一個實施例的于語音和視頻通訊的交互控制的結(jié)構(gòu)示意圖。
【具體實施方式】
[0018]下面詳細描述本發(fā)明的實施例，所述實施例的示例在附圖中示出，其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的，旨在用于解釋本發(fā)明，而不能理解為對本發(fā)明的限制。
[0019]下面參考附圖描述本發(fā)明實施例的用于語音和視頻通訊的交互控制方法及裝置。
[0020]圖1是本發(fā)明一個實施例的用于語音和視頻通訊的交互控制方法的流程圖。
[0021]如圖1所示，該用于語音和視頻通訊的交互控制方法包括:
[0022]S101，獲取用戶通過預(yù)設(shè)方式輸入的用戶行為數(shù)據(jù)。
[0023]其中，預(yù)設(shè)方式包括語音方式和/或手勢方式。
[0024]具體地，在用戶與其他一個或者多個用戶進行語音通話的過程中，為了能夠根據(jù)用戶輸入的語音數(shù)據(jù)執(zhí)行一些操作，可對用戶輸入的語音數(shù)據(jù)進行監(jiān)控。
[0025]另外，在用戶與其他一個或者多個用戶進行視頻通話的過程中，為了能夠根據(jù)用戶輸入的語音數(shù)據(jù)或者手勢動作執(zhí)行一些操作，在對用戶輸入的語音數(shù)據(jù)進行監(jiān)控的同時，還可以對終端的攝像頭進行監(jiān)控，以便根據(jù)攝像頭所獲得的視頻信息中獲得用戶輸入的手勢動作。
[0026]S102，確定用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的觸發(fā)信息。
[0027]為了減少對用戶正常語音或者視頻通話的影響，在用戶需要終端自動根據(jù)自己輸入的語音或者手勢自動執(zhí)行一些操作時，用戶可通過輸入一些觸發(fā)應(yīng)用程序控制終端執(zhí)行一些操作的觸發(fā)詞或者觸發(fā)動作，應(yīng)用程序獲取用戶在觸發(fā)詞或者觸發(fā)動作之后，后續(xù)輸入的語音或者手勢動作，并根據(jù)語音或者手動動作執(zhí)行一些操作。
[0028]其中，觸發(fā)信息可以包括但不限于觸發(fā)詞、動作操作詞、關(guān)鍵字、觸發(fā)手勢動作和手勢動作。
[0029]在本發(fā)明的一個實施例中，若監(jiān)控到用戶通過語音方式輸入用戶行為數(shù)據(jù)，可判斷用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的觸發(fā)詞，若判斷獲知包含觸發(fā)詞，則進一步判斷用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的動作操作詞。應(yīng)當(dāng)理解的是，此時的用戶行為數(shù)據(jù)即為語音數(shù)據(jù)。
[0030]另外，在用戶通過視頻通話方式進行聊天的過程中，可通過攝像頭獲取用戶輸入的用戶行為數(shù)據(jù)，在獲得用戶行為數(shù)據(jù)后，可判斷用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的觸發(fā)手勢動作，若判斷獲知包含觸發(fā)手勢動作，則進一步判斷用戶行為數(shù)據(jù)中是否包含預(yù)設(shè)的手勢操作。
[0031]S103，若判斷獲知包含觸發(fā)信息，則確定在預(yù)設(shè)的操作指令集中與觸發(fā)信息對應(yīng)的操作指令，并執(zhí)行操作指令對應(yīng)的事件。
[0032]其中，需要理解的是，觸發(fā)信息、操作指令與事件之間的對應(yīng)關(guān)系是預(yù)先保存的。
[0033]例如，在用戶A與用戶B進行視頻通話的過程中，假定觸發(fā)應(yīng)用程序根據(jù)用戶輸入的語音數(shù)據(jù)執(zhí)行一些操作的預(yù)留語音指令(觸發(fā)詞)為“X語音助手”，即在用戶輸入的語音數(shù)據(jù)中包含“X語音助手”后，可對語音數(shù)據(jù)中“X語音助手”之后的語音數(shù)據(jù)進行識別，以確定在用戶輸入的“X語音助手”之后的語音數(shù)據(jù)中是否包含預(yù)設(shè)的動作操作詞。假定獲得到用戶當(dāng)前輸入的語音數(shù)據(jù)為“X語音助手，下載百度云圖片X.jpg和1.jpg，發(fā)送給用戶B并讓其選擇”。此時，可通過現(xiàn)有技術(shù)對用戶輸入的語音數(shù)據(jù)進行解析，以獲得語音數(shù)據(jù)的解析結(jié)果，并判斷解析結(jié)果中是否包含預(yù)設(shè)的動作操作詞，若包含預(yù)設(shè)的動作操作詞，則獲得與動作操作詞對應(yīng)的操作指令，并根據(jù)操作指令執(zhí)行對應(yīng)的操作。
[0034]再例如，在用戶A與用戶B進行視頻通話的過程中，假定觸發(fā)應(yīng)用程

完整全部詳細技術(shù)資料下載

當(dāng)前第1頁1 2 3 4 5

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李豐;
技術(shù)所有人：百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

語音控制交互設(shè)備相關(guān)技術(shù)

語音通訊軟件相關(guān)技術(shù)

局域網(wǎng)語音通訊軟件相關(guān)技術(shù)

語音通訊費相關(guān)技術(shù)

語音通訊相關(guān)技術(shù)

語音通訊系統(tǒng)相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

用于語音和視頻通訊的交互控制方法及裝置的制造方法