一種語音信息處理方法及裝置制造方法
【專利摘要】本發(fā)明涉及一種語音信息處理方法,應用于線上通信接收終端中,包括以下步驟:接收線上通信發(fā)送終端發(fā)送的語音信息;檢測針對所述語音信息的用戶操作;以及在檢測到預定的用戶操作后則將所述語音信息轉(zhuǎn)換成文本信息并顯示所述文本信息。本發(fā)明還提供一種語音信息處理裝置。利用本發(fā)明可以將接收到的語音信息根據(jù)用戶的要求轉(zhuǎn)換為文本信息顯示,可以減少用戶的時間成本以提升交流效率。
【專利說明】一種語音信息處理方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及線上通信領(lǐng)域,特別涉及一種線上通信的語音信息處理方法及裝置。【背景技術(shù)】
[0002]線上通信服務是一種基于互聯(lián)網(wǎng)的通信服務,一般以實現(xiàn)網(wǎng)絡上的即時通信功能為主。目前,線上通信服務已經(jīng)在互聯(lián)網(wǎng)上得到了廣泛的應用和認可,線上通信服務可以通過線上通信系統(tǒng)來實現(xiàn)。線上通信系統(tǒng)以速度快、功能豐富、使用穩(wěn)定等優(yōu)點而獲得了廣大網(wǎng)民的認可和喜愛。在現(xiàn)有的線上通信服務中,用戶之間可以通過線上通信系統(tǒng),例如QQ、微信等進行文本信息交互、語音信息交互、視頻交互、文件交互等。
[0003]同文本信息交互相比,語音信息交互能夠省去文本輸入的繁瑣,具有方便快捷的優(yōu)勢。然而,現(xiàn)有的線上通信接收終端只能根據(jù)發(fā)送者設定的信息形式展示信息。例如,若發(fā)送者以文本形式發(fā)送信息,則線上通信接收終端只能以文本形式顯示所述信息。若發(fā)送者以語音形式發(fā)送信息,則線上通信接收終端只能以語音形式播放所述信息。但是在某些場景下,接收者可能不方便直接收聽語音信息,或者接收到的語音信息太多,語音信息逐條點擊播放極不方便。這樣發(fā)送者語音輸入的便捷,卻給接收者帶來收聽過程的不便。
【發(fā)明內(nèi)容】
[0004]有鑒于此,有必要提供一種語音信息處理方法及裝置,可以將接收到的語音信息根據(jù)用戶的要求轉(zhuǎn)換為文本信息顯示,在語音信息輸入便捷的同時達到文本信息輸出“所見即所得”的效果。
[0005]一種語音信息處理方法,應用于線上通信接收終端中,包括以下步驟:接收線上通信發(fā)送終端發(fā)送的語音信息;檢測針對所述語音信息的用戶操作;以及在檢測到預定的用戶操作后則將所述語音信息轉(zhuǎn)換成文本信息并顯示所述文本信息。
[0006]一種語音信息處理裝置,運行于線上通信接收終端中,包括:接收模塊,用于接收線上通信發(fā)送終端發(fā)送的語音信息;檢測模塊,用于檢測針對所述語音信息的用戶操作;轉(zhuǎn)換模塊,用于在檢測到預定的用戶操作后則將所述語音信息轉(zhuǎn)換成文本信息;以及第一顯示模塊,用于顯示所述文本信息。
[0007]—種語音信息處理方法,應用于服務器中,包括以下步驟:接收線上通信發(fā)送終端發(fā)送的語音信息;向線上通信接收終端發(fā)送通知信息,以使所述線上通信接收終端可顯示表示接收到語音信息的第一界面元素;若接收到所述線上通信接收終端返回的語音信息轉(zhuǎn)換請求則將所述語音信息轉(zhuǎn)換為文本信息,并將所述文本信息發(fā)送至線上通信接收終端,以在所述線上通信接收終端上顯示所述文本信息。
[0008]一種語音信息處理裝置,運行于服務器中,包括:接收模塊,用于接收線上通信發(fā)送終端發(fā)送的語音信息;通知模塊,用于向線上通信接收終端發(fā)送通知信息,以使所述線上通信接收終端可顯示表示接收到語音信息的第一界面元素;轉(zhuǎn)換模塊,若接收到所述線上通信接收終端返回的語音信息轉(zhuǎn)換請求則將所述語音信息轉(zhuǎn)換為文本信息;以及發(fā)送模塊,用于將所述文本信息發(fā)送至所述線上通信接收終端,以在所述線上通信接收終端上顯示所述文本信息。
[0009]相對于現(xiàn)有技術(shù),本發(fā)明的有益效果是:本發(fā)明可以在不方便收聽語音信息或接收到的語音信息太多時,將接收到的語音信息根據(jù)用戶的要求轉(zhuǎn)換為文本信息顯示,在語音信息輸入便捷的同時達到文本信息輸出“所見即所得”的效果,減少用戶在處理語音信息時的時間成本,提升交流效率。
[0010]為讓本發(fā)明的上述和其他目的、特征和優(yōu)點能更明顯易懂,下文特舉較佳實施例,并配合所附圖式,作詳細說明如下。
【專利附圖】
【附圖說明】
[0011]圖1為本發(fā)明第一實施例提供的語音信息處理方法的流程圖。
[0012]圖2為應用第一實施例的語音信息處理方法時的交互示意圖。
[0013]圖3和圖4為應用第一實施例的語音信息處理方法的界面的不意圖。
[0014]圖5為本發(fā)明第二實施例提供的語音信息處理裝置的框圖。
[0015]圖6為本發(fā)明第三實施例提供的語音信息處理方法的流程圖。
[0016]圖7為本發(fā)明第四實施例提供的語音信息處理裝置的框圖。
【具體實施方式】
[0017]為更進一步闡述本發(fā)明為實現(xiàn)預定發(fā)明目的所采取的技術(shù)手段及功效,以下結(jié)合附圖及較佳實施例,對依據(jù)本發(fā)明的【具體實施方式】、結(jié)構(gòu)、特征及其功效,詳細說明如后。
[0018]第一實施例
[0019]參閱圖1所示,本發(fā)明第一實施例提供一種語音信息處理方法,所述語音信息處理方法應用于線上通信接收終端中,其包括以下步驟:
[0020]步驟S11,接收線上通信發(fā)送終端發(fā)送的語音信息;
[0021]步驟S12,檢測針對所述語音信息的用戶操作;以及
[0022]步驟S13,在檢測到預定的用戶操作后則將所述語音信息轉(zhuǎn)換成文本信息并顯示所述文本信息。
[0023]以下結(jié)合具體實例作進一步詳細說明:
[0024]步驟Sll所述的線上通信發(fā)送終端和所述線上通信接收終端可以為運行于手機、平板電腦、筆記型電腦或臺式電腦等硬件終端內(nèi)的線上通信應用。在用戶打開相應的線上通信應用后(參見圖2),線上通信發(fā)送終端將接收發(fā)送方用戶輸入的語音信息。具體地,線上通信發(fā)送終端可以在所顯示的線上通信對話界面(參見圖3 )中顯示用于輸入語音信息的圖標I。發(fā)送方用戶可以在對所述圖標I執(zhí)行預設操作,例如長按手勢的同時說話,從而使線上通信發(fā)送終端接收到發(fā)送方用戶輸入的語音信息。
[0025]而對于接收方來說,在接收到發(fā)送方發(fā)送的語音信息后,需要進行顯示,例如,如圖3所示,顯示一個第一界面元素2,如一個圖標,以表示接收到一段語音信息。第一界面元素可用于接收用戶操作。例如在一般的語音通信應用中,一般根據(jù)“按下”或者說“點擊”的操作播放接收到的語音信息。本實施例的方法同樣可包括此機制,可將要播放語音信息的操作定義為第一用戶操作,如上所述,第一用戶操作可包括多種具體的操作,本實施并不做出具體限制。但除此之外,本實施例的步驟S12中還檢測第二用戶操作,第二用戶操作是用來觸發(fā)步驟S13中的將語音信息轉(zhuǎn)化為文本信息的過程。
[0026]在具體的實現(xiàn),第二用戶操作可以是由第一界面元素所接收的,例如,針對第一界面元素的拖動、雙擊等不同于第一用戶操作的用戶操作。
[0027]此外,如圖3所示,除了第一界面元素2外,還可在第一界面元素2旁顯示第二界面元素3。第二界面元素3用于表示此語音信息可以轉(zhuǎn)化成文本信息,并且可接收用戶的第三用戶操作。例如,針對第二界面元素3的用戶操作如點擊、按下、滑動、拖動、雙擊等均可視為上述的第三用戶操作。
[0028]上述的第二用戶操作以及第三用戶操作均可視為上述的預定的用戶操作,在檢測到預定的用戶操作后則發(fā)出語音信息轉(zhuǎn)換請求,將語音信息提交至轉(zhuǎn)換模塊進行文本轉(zhuǎn)換(參閱圖2)。圖2所示的轉(zhuǎn)換模塊可以是運行于本機,還可以是運行于服務器中。
[0029]在獲取返回的轉(zhuǎn)換的文本信息后,可以進行輸出顯示。具體地,例如可以將文本信息顯示于第一界面元素2的下方,還可以采用浮層的方式顯示轉(zhuǎn)換后的文本信息。例如,在用戶按下第二界面元素3后,采用浮層的方式顯示轉(zhuǎn)換后的文本信息,并且在用戶松開后,或者松開第二界面元素3 —段時間后隱藏所述浮層。采用此種方式可以在最大程度的保持原用線上通信應用的界面風格的情形下實現(xiàn)文本信息的顯示。
[0030]此外,可以理解,步驟S13中的轉(zhuǎn)換過程并不限于根據(jù)用戶操作觸發(fā)。例如,可以根據(jù)預存的設定信息判斷是否需要將所述語音信息轉(zhuǎn)換為文本信息,若是則發(fā)出語音信息轉(zhuǎn)換請求。所述設定信息由線上通信接收終端預先設定,并存儲于本機或者服務器中。線上通信接收終端可以提供相關(guān)的設定界面供用戶進行相關(guān)設置。所述服務器可以用于連接線上通信發(fā)送終端和線上通信接收終端之間的通信,例如中轉(zhuǎn)線上通信發(fā)送終端和線上通信接收終端之間的所述語音信息。
[0031]進一步地,如圖4所示,在語音信息旁邊,除了顯示轉(zhuǎn)換后的文本信息外,還可顯示第三界面元素4,如一個圖標或者文字,表示這段文本信息是由語音信息自動轉(zhuǎn)換得來,使得界面更加直觀。進一步地,突出文本信息是自動轉(zhuǎn)換的方式并不限于上述實例,例如還可以采用不同的顏色、字體輸出自動轉(zhuǎn)換后的文本信息。
[0032]通過本實施例的方法,無需播放所述語音信息即可讓接收方用戶通過查看所述文本信息獲悉所述語音信息的內(nèi)容,即實現(xiàn)“所見即所得”的效果。
[0033]第二實施例
[0034]參閱圖5所示,本發(fā)明第二實施例提供一種語音信息處理裝置100,運行于線上通信接收終端中。所述語音信息處理裝置100包括接收模塊101、檢測模塊102、轉(zhuǎn)換模塊103、播放模塊104、第一顯示模塊105、第二顯示模塊106和第三顯示模塊107。可以理解,上述的各模塊是指計算機程序或者程序段,用于執(zhí)行某一項或多項特定的功能。此外,上述各模塊的區(qū)分并不代表實際的程序代碼也必須是分開的。
[0035]接收模塊101,用于接收線上通信發(fā)送終端發(fā)送的語音信息;檢測模塊102,用于檢測針對所述語音信息的用戶操作;轉(zhuǎn)換模塊103,用于在檢測到預定的用戶操作后則將所述語音信息轉(zhuǎn)換成文本信息;播放模塊104用于根據(jù)用戶的第一用戶操作播放接收到的語音信息;第一顯示模塊104,用于顯示所述文本信息。
[0036]第二顯示模塊105用于在線上通信對話界面中顯示表示所述語音信息的第一界面元素。所述檢測模塊102還用于監(jiān)測針對所述第一界面元素的用戶操作,若接收到預定的第一用戶操作則發(fā)出所述語音信息轉(zhuǎn)換請求。
[0037]此外,第三顯示模塊106用于在線上通信對話界面中顯示表示將所述語音信息轉(zhuǎn)換為文本信息的第二界面元素。所述檢測模塊102還用于監(jiān)測針對所述第二界面元素的用戶操作,若接收到預定的第二用戶操作則發(fā)出所述語音信息轉(zhuǎn)換請求。
[0038]對于以上各模塊的具體工作過程,可進一步參考本發(fā)明第一實施例提供的語音信息處理方法,在此不再重復。
[0039]第三實施例
[0040]參閱圖6所示,本發(fā)明第三實施例提供一種語音信息處理方法,所述語音信息處理方法應用于服務器中,其包括以下步驟:
[0041]步驟S21,接收線上通信發(fā)送終端發(fā)送的語音信息;
[0042]步驟S22,向線上通信接收終端發(fā)送通知信息,以使所述線上通信接收終端可顯示表示接收到語音信息的第一界面元素;以及
[0043]步驟S23,若接收到所述線上通信接收終端返回的語音信息轉(zhuǎn)換請求則將所述語音信息轉(zhuǎn)換為文本信息,并將所述文本信息發(fā)送至線上通信接收終端,以在所述線上通信接收終端上顯示所述文本信息。
[0044]以下結(jié)合具體實例作進一步詳細說明:
[0045]步驟Sll所述的線上通信發(fā)送終端和所述線上通信接收終端可以為運行于手機、平板電腦、筆記型電腦或臺式電腦等硬件終端內(nèi)的線上通信應用。在用戶打開相應的線上通信應用后(參見圖2),線上通信發(fā)送終端將接收發(fā)送方用戶輸入的語音信息。具體地,線上通信發(fā)送終端可以在所顯示的線上通信對話界面(參見圖3 )中顯示用于輸入語音信息的圖標I。發(fā)送方用戶可以在對所述圖標I執(zhí)行預設操作,例如長按手勢的同時說話,從而使線上通信發(fā)送終端接收到發(fā)送方用戶輸入的語音信息。
[0046]在用戶發(fā)送語音信息后,語音信息即被發(fā)送至服務器中,相應地,服務器接收線上通信發(fā)送終端發(fā)送的語音信息,即進行步驟S21。按語音通信應用的一般情形,語音信息需要被推送至接收方。在本實施例的方法中,并不是直接將語音信息推送至接收方,而是如步驟S22所述,先發(fā)送通知信息至接收終端。此通知信息是用于表示有一段語音信息將要發(fā)送至接收終端。接收終端在接收到通知信息后即可獲知將有語音信息發(fā)送過來。
[0047]接下來在接收終端中的處理過程類似于第一實施例中所述,例如可顯示表示此將可能接收到的語音信息的第一界面元素、表示可進行語音轉(zhuǎn)換的第二界面元素,并且檢測用戶操作。在檢測到第一用戶操作后可再向服務器請求語音信息本身,而在檢測到預定的用戶操作,例如第二用戶操作以及第三用戶操作后即向服務器發(fā)送語音信息轉(zhuǎn)換請求,由服務器將語音信息直接轉(zhuǎn)換為文本信息后返回。相應地,在步驟S23中,在獲取到文本信息后進行輸出顯示。
[0048]根據(jù)本實施例的方法,可以減少語音信息本身造成的網(wǎng)絡流量,另外,可以讓用戶直接查看語音信息的文本,減少了時間成本,提升了交流效率。
[0049]第四實施例
[0050]參閱圖7所示,本發(fā)明第四實施例提供一種語音信息處理裝置200,運行于服務器中。所述語音信息處理裝置200包括接收模塊201、通知模塊202、轉(zhuǎn)換模塊203和發(fā)送模塊204。可以理解,上述的各模塊是指計算機程序或者程序段,用于執(zhí)行某一項或多項特定的功能。此外,上述各模塊的區(qū)分并不代表實際的程序代碼也必須是分開的。
[0051]接收模塊201,用于接收線上通信發(fā)送終端發(fā)送的語音信息;
[0052]通知模塊202,用于向線上通信接收終端發(fā)送通知信息,以使所述線上通信接收終端可顯示表示接收到語音信息的第一界面元素;
[0053]轉(zhuǎn)換模塊203,用于若接收到所述線上通信接收終端返回的語音信息轉(zhuǎn)換請求則將所述語音信息轉(zhuǎn)換為文本信息;以及
[0054]發(fā)送模塊204,用用于將所述文本信息發(fā)送至所述線上通信接收終端,以在所述線上通信接收終端上顯示所述文本信息。
[0055]對于以上各模塊的具體工作過程,可進一步參考本發(fā)明第三實施例提供的語音信息處理方法,在此不再重復。
[0056]根據(jù)本實施例的方法,可以減少語音信息本身造成的網(wǎng)絡流量,另外,可以讓用戶直接查看語音信息的文本,減少了時間成本,提升了交流效率。
[0057]此外,本發(fā)明實施例還提供一種計算機可讀存儲介質(zhì),其內(nèi)存儲有計算機可執(zhí)行指令,上述的計算機可讀存儲介質(zhì)例如為非易失性存儲器例如光盤、硬盤、或者閃存。上述的計算機可執(zhí)行指令用于讓計算機或者類似的運算裝置完成上述的語音信息處理方法中的各種操作。
[0058]以上所述,僅是本發(fā)明的較佳實施例而已,并非對本發(fā)明作任何形式上的限制,雖然本發(fā)明已以較佳實施例揭示如上,然而并非用以限定本發(fā)明,任何本領(lǐng)域技術(shù)人員,在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當可利用上述揭示的技術(shù)內(nèi)容做出些許更動或修飾為等同變化的等效實施例,但凡是未脫離本發(fā)明技術(shù)方案內(nèi)容,依據(jù)本發(fā)明的技術(shù)實質(zhì)對以上實施例所作的任何簡介修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
【權(quán)利要求】
1.一種語音信息處理方法,應用于線上通信接收終端中,其特征在于,所述方法包括以下步驟: 接收線上通信發(fā)送終端發(fā)送的語音信息; 檢測針對所述語音信息的用戶操作;以及 在檢測到預定的用戶操作后則將所述語音信息轉(zhuǎn)換成文本信息并顯示所述文本信息。
2.如權(quán)利要求1所述的語音信息處理方法,其特征在于,在接收線上通信發(fā)送終端發(fā)送的語音信息后還包括: 在線上通信對話界面中顯示表示所述語音信息的第一界面元素; 所述預定的用戶操作為針對所述第一界面元素的第一用戶操作。
3.如權(quán)利要求2所述的語音信息處理方法,其特征在于,還包括: 在檢測到針對所述第一界面元素的第二用戶操作后則播放所述語音信息,所述第一用戶操作不同于所述第二用戶操作。
4.如權(quán)利要求2所述的語音信息處理方法,其特征在于,還包括: 在線上通信對話界面中顯示表示將所述語音信息轉(zhuǎn)換為文本信息的第二界面元素; 所述預定的用戶操作為 針對所述第二界面元素的第三用戶操作。
5.如權(quán)利要求2所述的語音信息處理方法,其特征在于,所述文本信息是以浮層的形式顯示的,或者顯示于所述第一界面元素的下方。
6.一種語音信息處理裝置,運行于線上通信接收終端中,其特征在于,所述裝置包括: 接收模塊,用于接收線上通信發(fā)送終端發(fā)送的語音信息; 檢測模塊,用于檢測針對所述語音信息的用戶操作; 轉(zhuǎn)換模塊,用于在檢測到預定的用戶操作后則將所述語音信息轉(zhuǎn)換成文本信息;以及 第一顯示模塊,用于顯示所述文本信息。
7.如權(quán)利要求6所述的語音信息處理裝置,其特征在于,還包括:第二顯示模塊,用于在線上通信對話界面中顯示表示所述語音信息的第一界面元素,所述預定的用戶操作為針對所述第一界面元素的第一用戶操作。
8.如權(quán)利要求7所述的語音信息處理裝置,其特征在于,還包括播放模塊,用于在在檢測到針對所述第一界面元素的第二用戶操作后則播放所述語音信息,所述第一用戶操作不同于所述第二用戶操作。
9.如權(quán)利要求7所述的語音信息處理裝置,其特征在于,還包括:第三顯示模塊,用于在線上通信對話界面中顯示表示將所述語音信息轉(zhuǎn)換為文本信息的第二界面元素; 所述預定的用戶操作為針對所述第二界面元素的第三用戶操作。
10.如權(quán)利要求7所述的語音信息處理裝置,其特征在于,所述第一顯示模塊用于以浮層方式顯示所述文本信息,或者將所述文本信息顯示于所述第一界面元素的下方。
11.一種語音信息處理方法,應用于服務器中,其特征在于,所述方法包括以下步驟: 接收線上通信發(fā)送終端發(fā)送的語音信息; 向線上通信接收終端發(fā)送通知信息,以使所述線上通信接收終端可顯示表示接收到語音信息的第一界面兀素; 若接收到所述線上通信接收終端返回的語音信息轉(zhuǎn)換請求則將所述語音信息轉(zhuǎn)換為文本信息,并將所述文本信息發(fā)送至線上通信接收終端,以在所述線上通信接收終端上顯示所述文本信息。
12.—種語音信息處理裝置,運行于服務器中,其特征在于,所述裝置包括: 接收模塊,用于接收線上通信發(fā)送終端發(fā)送的語音信息; 通知模塊,用于向線上通信接收終端發(fā)送通知信息,以使所述線上通信接收終端可顯示表示接收到語音信息的第一界面元素; 轉(zhuǎn)換模塊,若接收到所述線上通信接收終端返回的語音信息轉(zhuǎn)換請求則將所述語音信息轉(zhuǎn)換為文本信息;以及 發(fā)送模塊,用 于將所述文本信息發(fā)送至所述線上通信接收終端,以在所述線上通信接收終端上顯示所述文本信息。
【文檔編號】H04L29/06GK103973542SQ201310041481
【公開日】2014年8月6日 申請日期:2013年2月1日 優(yōu)先權(quán)日:2013年2月1日
【發(fā)明者】廖海珍 申請人:騰訊科技(深圳)有限公司