話音及文本通信系統(tǒng)、方法及設(shè)備的制作方法

文檔序號：2830523閱讀：250來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：：話音及文本通信系統(tǒng)、方法及設(shè)備的制作方法
技術(shù)領(lǐng)域：
：本發(fā)明涉及通信，且更特定來說，涉及話音及文本通信系統(tǒng)、方法及設(shè)備。
背景技術(shù)：
：蜂窩式電話可包含音頻捕獲裝置(例如麥克風(fēng)及/或語音合成器)，及用以產(chǎn)生音頻包或幀的音頻編碼器。電話可使用通信協(xié)議層及模塊以橫跨無線通信信道將包傳輸?shù)骄W(wǎng)絡(luò)或另一通信裝置。
發(fā)明內(nèi)容一個方面涉及一種包括聲碼器、語音到文本轉(zhuǎn)換引擎、文本到語音轉(zhuǎn)換引擎及用戶界面的設(shè)備。所述聲碼器可操作以將語音信號轉(zhuǎn)換成包及將包轉(zhuǎn)換成語音信號。所述語音到文本轉(zhuǎn)換引擎可操作以將語音轉(zhuǎn)換成文本。所述文本到語音轉(zhuǎn)換引擎可操作以將文本轉(zhuǎn)換成語音。所述用戶界面可操作以接收用戶從多個模式中對一模式的選擇，其中第一模式啟用所述語音到文本轉(zhuǎn)換引擎，第二模式啟用所述文本到語音轉(zhuǎn)換引擎，且第三模式啟用所述語音到文本轉(zhuǎn)換引擎及所述文本到語音轉(zhuǎn)換引擎。另一方面涉及一種包括以下的設(shè)備聲碼器，其可操作以將語音信號轉(zhuǎn)換成包及將包轉(zhuǎn)換成語音信號；語音到文本轉(zhuǎn)換引擎，其可操作以將語音轉(zhuǎn)換成文本；用戶界面，其可操作以接收用戶從多個模式中對一模式的選擇，其中第一模式啟用所述聲碼器，且第二模式啟用所述語音到文本轉(zhuǎn)換引擎；及收發(fā)器，其可操作以將經(jīng)編碼語音包及文本包無線地傳輸?shù)酵ㄐ啪W(wǎng)絡(luò)。另一方面涉及一種包括以下的網(wǎng)絡(luò)設(shè)備聲碼器，其可操作以將包轉(zhuǎn)換成語音信號；語音到文本轉(zhuǎn)換引擎，其可操作以將語音轉(zhuǎn)換成文本；選擇單元，其可操作以在第一與第二模式之間切換，其中所述第一模式啟用所述聲碼器，且第二模式啟用所述聲碼器及所述語音到文本轉(zhuǎn)換引擎；及收發(fā)器，其可操作以將經(jīng)編碼語音包及文本包無線地傳輸?shù)酵ㄐ啪W(wǎng)絡(luò)。另一方面涉及一種包括以下的方法接收經(jīng)編碼語音包；將所接收的經(jīng)編碼語音包轉(zhuǎn)換成語音信號；及接收用戶從多個模式中對一模式的選擇，其中第一模式啟用語音到文本轉(zhuǎn)換，第二模式啟用文本到語音轉(zhuǎn)換，且第三模式啟用語音到文本及文本到語音轉(zhuǎn)換。在附圖及下文說明中將闡述一個或一個以上實施例的細節(jié)。圖1圖解說明包括第一通信裝置、網(wǎng)絡(luò)及第二通信裝置的系統(tǒng)。圖2圖解說明使用圖1中的第二裝置的方法。圖3圖解說明圖1中的第一通信裝置的另一配置。圖4圖解說明圖1中的網(wǎng)絡(luò)的另一配置。具體實施例方式在會議中、飛機上、火車上、劇院中、飯店、教堂或其它地方在移動裝置上接收呼叫可能對他人造成干擾。如果用戶可在移動裝置上選擇另一模式來接收呼叫及/或?qū)λ龊艚凶鞒鲰憫?yīng)，那么其可使干擾少得多。在一個模式中，裝置接收呼叫且將語音/話音信號轉(zhuǎn)換成文本而不需要另一端上的呼叫者輸入文本。圖1圖解說明包括第一通信裝置100、網(wǎng)絡(luò)110及第二通信裝置120的系統(tǒng)。所述系統(tǒng)可包含其它組件。所述系統(tǒng)可使用任何類型的無限通信，例如全球移動通信系統(tǒng)(GSM)、碼分多址存取(CDMA)、CDMA2000、CDMA20001xEV-DO、寬帶CDMA(WCDMA)、正交頻分多址存取(OFDMA)、藍牙、WiFi、WiMax等。第一通信裝置IOO包括話音編碼器(聲碼器)102及收發(fā)器104。除圖1中所示組件之外或代替圖1中所示組件，第一通信裝置IOO可包含其它組件。第一通信裝置100可代表或?qū)嵤┯诼肪€(非無線)電話、無線通信裝置、個人數(shù)字助理(PDA)、手持式裝置、膝上型計算機、臺式計算機、數(shù)碼相機、數(shù)字記錄裝置、具備網(wǎng)絡(luò)能力的數(shù)字電視、移動電話、蜂窩式電話、衛(wèi)星電話、相機電話、基于地面的無線電電話、直接雙向通信裝置(有時稱為"對講機")、攝像放像機等中。聲碼器102可包含用于將語音信號編碼為包的編碼器及用于將包解碼為語音信號的解碼器。聲碼器102可以是任何類型的聲碼器，例如增強型可變速率編碼器(EVRC)、自適應(yīng)多速率(AMR)、第四代聲碼器(4GV)等。在共同受讓的美國專利第6,397,175、6,434,519、6,438,518、6,449,592、6,456,964、6,477,502、6,584,438、6,678,649、6,691,084、6,804,218、6,947,888號中對聲碼器進行了描述，所述專利以引用的方式并入本文中。收發(fā)器104可無線地傳輸及接收含有經(jīng)編碼語音的包。網(wǎng)絡(luò)110可代表一個或一個以上基站、基站控制器(BSC)、移動交換中心(MSC)等。如果第一裝置IOO是路線電話，那么網(wǎng)絡(luò)IIO可包含普通老式電話服務(wù)(POTS)網(wǎng)絡(luò)中的組件。網(wǎng)絡(luò)110包括聲碼器U2及收發(fā)器114。除圖1中所示的組件之外或代替圖l中所示的組件，網(wǎng)絡(luò)110可包含其它組件。第二通信裝置120可代表或?qū)嵤┯跓o線通信裝置、個人數(shù)字助理(PDA)、手持式裝置、膝上型計算機、臺式計算機、數(shù)碼相機、數(shù)字記錄裝置、具備網(wǎng)絡(luò)能力的數(shù)字電視、移動電話、蜂窩式電話、衛(wèi)星電話、相機電話、基于地面的無線電電話、直接雙向通信裝置〔有時稱為"對講機")、攝像放像機等中。第二通信裝置120包括收發(fā)器124、語音及文本單元140、揚聲器142、顯示器128、用戶輸入界面130(例如小鍵盤)，及麥克風(fēng)146。語音及文本單元140包括聲碼器122、語音到文本轉(zhuǎn)換引擎126、控制器144、文本到語音轉(zhuǎn)換引擎132及話音合成器134。除圖1中所示的組件之外或代替圖1中所示的組件，語音及文本單元140可包含其它組件。語音及文本單元140中的組件或功能中的一者或一者以上可集成到單個模塊、單元、組件或軟件中。例如，語音到文本轉(zhuǎn)換引擎126可與聲碼器122組合在一起。文本到語音轉(zhuǎn)換引擎132可與聲碼器122組合在一起，以使得將文本轉(zhuǎn)換成經(jīng)編碼的語音包。話音合成器134可與聲碼器122及/或文本到語音轉(zhuǎn)換引擎132組合在一起。語音到文本轉(zhuǎn)換引擎126可將話音/語音轉(zhuǎn)換成文本。文本到語音轉(zhuǎn)換引擎132可將文本轉(zhuǎn)換成語音?？刂破?44可控制語音及文本單元140中一個或一個以上組件的作業(yè)及參數(shù)。裝置120可為用戶提供若干種通信模式來接收呼叫及/或?qū)艚凶鞒鲰憫?yīng)，如以下表格及圖2中所示。<table>tableseeoriginaldocumentpage7</column></row><table>在正常模式(方框202及210)中，第二裝置120的用戶接收來自第一裝置100的呼叫、自揚聲器142收聽語音及向麥克風(fēng)146講話。圖2圖解說明使用圖1中的第二裝置120的方法。當?shù)诙b置120接收來自第一裝置100的呼叫時，第二裝置120的用戶可經(jīng)由方框200中的用戶界面130選擇所述模式中的一者。另一選擇為，用戶可在第二裝置120接收來自另一裝置的呼叫之前在方框200中在各個模式之間進行切換。例如，如果第二裝置120的用戶進入會議、飛機、火車、劇院、飯店、教堂或傳入呼叫可能對他人造成干擾的其它地方，那么所述用戶可從正常模式切換為其它三種模式中的一者。在第二模式(方框204及212)中，第二裝置130的用戶可(例如)使用耳機、頭戴耳機或頭戴送受話器收聽來自第一裝置100的語音，但不說話。而第二裝置130的用戶可在小鍵盤130上打字或使用記錄筆在顯示器128上輸入手寫文本。顯示器128或文本到語音轉(zhuǎn)換引擎132可具有識別手寫文本及字符的模塊。裝置120可(a)發(fā)送文本到第一裝置100或(b)借助文本到語音轉(zhuǎn)換引擎132將文本轉(zhuǎn)換成語音。話音合成器134可合成語音以產(chǎn)生大致匹配用戶的自然話音的個人化語音信號。話音合成器134可包含存儲用戶話音的特性(例如，音調(diào))的存儲器。在共同受讓的美國專利第6,950,799號中描述了一種話音合成器，所述專利以引用的方式并入本文中。在共同受讓的美國專利申請案第11/398,364號中描述了另一種話音合成器，所述申請案以引用的方式并入本文中。聲碼器122將語音編碼成包。可存在或不存在短的延遲。在一種配置中，與第二裝置120的通信對第一裝置100的用戶來說可呈現(xiàn)為無縫，而不是短時間延遲。如果第二裝置120的用戶正在開會，那么談話可更基于消息而非無縫。在第三及第四模式(方框206、208、214及216)中，裝置120接收呼叫且語音到文本轉(zhuǎn)換引擎126將語音/話音信號轉(zhuǎn)換成文本以用于在顯示器128上顯示。在一種配置中，第三及第四模式可允許第一裝置100的用戶繼續(xù)說話而不需要第一裝置100的用戶切換到文本輸入模式。語音到文本轉(zhuǎn)換引擎126可包含話音識別模塊來識別話語及聲音以將其轉(zhuǎn)換成文本。在第三模式中，裝置120允許用戶向傳聲器146講話，所述麥克風(fēng)146將語音傳遞到聲碼器122以編碼成包。在第四模式中，第二裝置130的用戶可在小鍵盤130上打字或使用記錄筆在顯示器128上輸入手寫文本。裝置120可(a)發(fā)送文本到第一裝置IOO或(b)用文本到語音轉(zhuǎn)換引擎132將文本轉(zhuǎn)換成語音。話音合成器134可合成語音以產(chǎn)生大致匹配用戶的自然話音的個人化語音信號。聲碼器122將語音編碼成包。在第二及第四模式中，如果第二裝置120經(jīng)設(shè)定以將文本轉(zhuǎn)換成語音并合成語音，那么在第二裝置120接受來自第一裝置100的呼叫時與在第一裝置IOO接收語音包時之間可能存在時間延遲。第二裝置120可經(jīng)配置以播放由用戶預(yù)先記錄的消息以通知第一裝置100:第二裝置120的用戶正在開會且將使用文本到語音轉(zhuǎn)換來作出響應(yīng)。第二及第四模式可提供一個或一個以上優(yōu)點，例如傳輸沒有背景噪聲的語音、不需要回聲消除或減少對回聲消除的需要、不需要噪聲抑制或減少對噪聲抑制的需要、更快編碼、較少處理等。圖1顯示變化(新的功能及/或元件)可僅實施于第二通信裝置120中的實例。為實現(xiàn)新的通信模式(第二、第三及第四模式)，第二通信裝置120具有聲碼器122、語音到文本引擎126、文本到語音引擎132等。通過此裝置120，系統(tǒng)可支持新的模式而不需要網(wǎng)絡(luò)IIO及常規(guī)電話100(陸線電話、移動電話等)的任何變化。裝置120可接收并發(fā)送話音包，而不管用戶所選定的模式如何。圖3圖解說明圖1中的第一通信裝置100的另一配置IOOA。在圖3中，第一通信裝置100A包括語音到文本轉(zhuǎn)換引擎300、編碼器302、收發(fā)器104、解碼器304及用戶界面330。語音到文本轉(zhuǎn)換引擎300可將話音/語音轉(zhuǎn)換成待由收發(fā)器104傳輸?shù)骄W(wǎng)絡(luò)110的文本。圖3中的第一通信裝置100A可允許第二裝置120被設(shè)計成不具有語音到文本轉(zhuǎn)換引擎126。圖3中的第一通信裝置100A可通過向網(wǎng)絡(luò)110發(fā)送文本而不是語音來節(jié)省帶寬。用戶界面330可以是可操作以接收用戶從多個模式中對一模式的選擇，其中第一模式啟用聲碼器302、304且第二模式啟用語音到文本轉(zhuǎn)換引擎300。圖4圖解說明圖1中的網(wǎng)絡(luò)110的另一配置110A。在圖4中，網(wǎng)絡(luò)110A包括話音編碼器/解碼器400、收發(fā)器114及語音到文本轉(zhuǎn)換引擎402。在另一配置中，網(wǎng)絡(luò)110A可進一步包括文本到語音轉(zhuǎn)換引擎404、話音合成器402及控制器444。聲碼器400解碼語音包以提供語音信號。語音到文本轉(zhuǎn)換引擎402可將話音/語音轉(zhuǎn)換成待由收發(fā)器114傳輸?shù)降诙b置120的文本。圖4中的網(wǎng)絡(luò)110A可允許第二裝置120被設(shè)計成不具有語音到文本轉(zhuǎn)換引擎126或允許語音到文本轉(zhuǎn)換引擎126被停用。圖4中的網(wǎng)絡(luò)110A可通過發(fā)送文本代替語音到第二裝置120來節(jié)省帶寬。圖4中的網(wǎng)絡(luò)110A可獲得對接收裝置120的配置、狀況或偏好的了解。如果網(wǎng)絡(luò)110A認識到接收裝置120不會得益于接收話音包(例如，感測用戶偏好或呼叫的地方，例如，極吵雜的環(huán)境且難于收聽所接收的語音)，那么網(wǎng)絡(luò)IIOA會將話音包變換成文本包。即使接收裝置120具有(例如使用語音到文本引擎126)將話音包改變?yōu)槲谋景哪芰?，但是如果用戶處于接收文本模?通常為會議或靜音通信)，那么執(zhí)行此變換(從話音到文本)可是對帶寬及裝置電力的浪費。因此，圖4中的網(wǎng)絡(luò)IIOA可用于變化(新的特征及/或元件)僅實施于網(wǎng)絡(luò)110A中(即，通信裝置或手機沒有變化)的系統(tǒng)中。網(wǎng)絡(luò)110A可在以下情況下承擔將話音包改變?yōu)槲谋厩曳粗嗳坏呢熑我苿邮謾C不具有語音到文本轉(zhuǎn)換單元；或如果移動手機的確具有語音到文本轉(zhuǎn)換單元，但所述手機不喜歡執(zhí)行轉(zhuǎn)換或由于缺少計算資源、電池電力等所致不能執(zhí)行所述轉(zhuǎn)換。例如，圖1中的第一裝置100可發(fā)送\接收話音包(即，第一模式)，而第二裝置120發(fā)送\接收文本(即，第四模式)。第二裝置120可不具有單元140(或僅具有聲碼器122)或具有被停用的單元140。為允許第二裝置120以第四模式操作，圖4中的網(wǎng)絡(luò)IIOA會將第一裝置的話音包改變?yōu)槲谋景?使用語音到文本引擎402)以發(fā)送到第二裝置120且會將來自第二裝置120的文本包改變?yōu)樵捯舭?使用文本到語音引擎404)以發(fā)送到第一裝置100。如果第二裝置120不具有單元140，那么第二裝置120可向網(wǎng)絡(luò)110A發(fā)信號通知(例如帶內(nèi))所需模式且因此要求網(wǎng)絡(luò)110A在語音與文本之間進行轉(zhuǎn)換，即執(zhí)行單元140的功能。個人化語音合成可在網(wǎng)絡(luò)110A中執(zhí)行。如以上所述，圖1中的單元140具有話音合成器134以將文本到語音引擎132的輸出改變?yōu)閭€人化語音(用戶的話音)。在具有圖4的網(wǎng)絡(luò)IIOA的系統(tǒng)中，為產(chǎn)生攜載第二裝置120用戶的話音特征的話音包，第二裝置120可向網(wǎng)絡(luò)110A發(fā)送所存儲的具有用戶的頻譜參數(shù)及音調(diào)信息的話音包(在使用第二或第四模式的開始時)。網(wǎng)絡(luò)IIOA可使用所述數(shù)個所傳輸?shù)脑捯舭?在文本包之前)來產(chǎn)生個人化話音包。下文將描述從第二裝置120傳輸用于第二或第四模式的包到網(wǎng)絡(luò)110A的實例。在使用所述"文本模式"(第二或第四模式)的開始時，第二裝置120將用戶預(yù)先存儲的話音包(N個包)加上操作模式(1、2、3或4;請求執(zhí)行轉(zhuǎn)換)傳輸?shù)骄W(wǎng)絡(luò)IIOA。然后，第二裝置120可發(fā)送文本包。所述兩種配置(圖l及圖4)的組合也是可能的。當使用所述模式中的一者時，網(wǎng)絡(luò)110A在感測(例如，經(jīng)由發(fā)信號而接收請求)接收裝置120的能力之后將啟用文本\語音轉(zhuǎn)換，從而執(zhí)行轉(zhuǎn)換或使網(wǎng)絡(luò)IIOA或接收裝置IOOA執(zhí)行轉(zhuǎn)換。以上所述的一個或一個以上組件及特征可實施于按鍵通話(PTT)或按鍵讀取通信裝置中。PTT裝置允許用戶按下裝置上的按鈕并通話，同時所述裝置將語音轉(zhuǎn)換成文本并將文本包傳輸?shù)骄W(wǎng)絡(luò)或直接傳輸?shù)搅硪煌ㄐ叛b置。PTT通信是"基于消息"，而非連續(xù)的，例如標準話音呼叫。用戶保持按下裝置上的PTT按鈕的時間段可很好地構(gòu)造出然后將被轉(zhuǎn)換成文本等的消息。裝置120可具有用來存儲指令和數(shù)據(jù)的專用存儲器、以及專用硬件、軟件、固件或其組合。如果實施于軟件中，那么所述技術(shù)可作為指令體現(xiàn)于例如以下的計算機可讀媒體上隨機存取存儲器(RAM)、只讀存儲器(ROM)、非易失性隨機存取存儲器(NVRAM)、電可擦可編程只讀存儲器(EEPROM)、閃速存儲器或類似裝置。所述指令致使一個或一個以上處理器執(zhí)行本發(fā)明中所述功能性的某些方面。本發(fā)明中所述的技術(shù)可實施于通用微處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)、或其它等效的邏輯裝置內(nèi)。例如，語音及文本單元140及相關(guān)聯(lián)組件與模塊可實施為運行于數(shù)字信號處理器(DSP)或其它處理裝置上的編碼過程或編碼/解碼(CODEC)過程的一部分。因此，被描述為模塊的組件可形成這一過程或單獨一過程的可編程特征。語音及文本單元140可具有用來存儲指令和數(shù)據(jù)的專用存儲器、以及專用硬件、軟件、固件或其組合。如果實施于軟件中，所述技術(shù)可體現(xiàn)為可由一個或一個以上處理器執(zhí)行的指令。所述指令可存儲于例如以下的計算機可讀媒體上隨機存取存儲器(RAM)、只讀存儲器(ROM)、非易失性隨機存取存儲器(NVRAM)、電可擦可編程只讀存儲器(EEPROM)、閃速存儲器、磁學(xué)或光學(xué)數(shù)據(jù)存儲裝置或類似裝置。所述指令致使一個或一個以上處理器執(zhí)行本發(fā)明中所述功能性的某些方面。上文已經(jīng)描述了各種實施例。所述及其它實施例皆在所附權(quán)力要求書的范圍內(nèi)。10權(quán)利要求1、一種設(shè)備，其包括聲碼器，其可操作以將語音信號轉(zhuǎn)換成包及將包轉(zhuǎn)換成語音信號；語音到文本轉(zhuǎn)換引擎，其可操作以將語音轉(zhuǎn)換成文本；文本到語音轉(zhuǎn)換引擎，其可操作以將文本轉(zhuǎn)換成語音；及用戶界面，其可操作以接收用戶從多個模式中對一模式的選擇，其中第一模式啟用所述語音到文本轉(zhuǎn)換引擎，第二模式啟用所述文本到語音轉(zhuǎn)換引擎，且第三模式啟用所述語音到文本轉(zhuǎn)換引擎及所述文本到語音轉(zhuǎn)換引擎。2、如權(quán)利要求1所述的設(shè)備，其進一步包括顯示器以顯示來自所述語音到文本轉(zhuǎn)換引擎的文本。3、如權(quán)利要求l所述的設(shè)備，其進一步包括小鍵盤以接收來自用戶的輸入文本。4、如權(quán)利要求1所述的設(shè)備，其中所述用戶界面可操作以在所述設(shè)備接收來自另一設(shè)備的呼叫之前接收用戶對模式的選擇。5、如權(quán)利要求1所述的設(shè)備，其中所述用戶界面可操作以在所述設(shè)備接收來自另一設(shè)備的呼叫之后接收用戶對模式的選擇。6、如權(quán)利要求l所述的設(shè)備，其進一步包括話音合成器以合成用戶的話音。7、如權(quán)利要求1所述的設(shè)備，其進一步包括可操作以將經(jīng)編碼語音包及文本包無線地傳輸?shù)酵ㄐ啪W(wǎng)絡(luò)的收發(fā)器。8、一種設(shè)備，其包括聲碼器，其可操作以將語音信號轉(zhuǎn)換成包及將包轉(zhuǎn)換成語音信號；語音到文本轉(zhuǎn)換引擎，其可操作以將語音轉(zhuǎn)換成文本；用戶界面，其可操作以接收用戶從多個模式中對一模式的選擇，其中第一模式啟用所述聲碼器，且第二模式啟用所述語音到文本轉(zhuǎn)換引擎；及收發(fā)器，其可操作以將經(jīng)編碼語音包及文本包無線地傳輸?shù)酵ㄐ啪W(wǎng)絡(luò)。9、如權(quán)利要求8所述的設(shè)備，其進一步包括顯示器以顯示來自所述語音到文本轉(zhuǎn)換引擎的文本。10、如權(quán)利要求8所述的設(shè)備，其進一步包括小鍵盤以接收來自用戶的輸入文本。11、如權(quán)利要求8所述的設(shè)備，其中所述用戶界面可操作以在所述設(shè)備接收來自另一設(shè)備的呼叫之前接收用戶對模式的選擇。12、如權(quán)利要求8所述的設(shè)備，其中所述用戶界面可操作以在所述設(shè)備接收來自另一設(shè)備的呼叫之后接收用戶對模式的選擇。13、一種網(wǎng)絡(luò)設(shè)備，其包括聲碼器，其可操作以將包轉(zhuǎn)換成語音信號；語音到文本轉(zhuǎn)換引擎，其可操作以將語音轉(zhuǎn)換成文本；選擇單元，其可操作以在第一與第二模式之間切換，其中所述第一模式啟用所述聲碼器，且第二模式啟用所述聲碼器及所述語音到文本轉(zhuǎn)換引擎；及收發(fā)器，其可操作以將經(jīng)編碼語音包及文本包無線地傳輸?shù)酵ㄐ啪W(wǎng)絡(luò)。14、如權(quán)利要求13所述的網(wǎng)絡(luò)設(shè)備，其進一步包括可操作以將文本轉(zhuǎn)換成語音的文本到語音轉(zhuǎn)換引擎，其中所述選擇單元可操作以切換到其中啟用所述聲碼器及兩個轉(zhuǎn)換引擎的第三模式。15、如權(quán)利要求14所述的網(wǎng)絡(luò)設(shè)備，其進一步包括可操作以從轉(zhuǎn)換成語音的文本合成用戶的話音的話音合成器。16、如權(quán)利要求15所述的網(wǎng)絡(luò)設(shè)備，其中所述話音合成器可操作以接收并存儲用戶的話音的話音特性。17、如權(quán)利要求13所述的網(wǎng)絡(luò)設(shè)備，其進一步包括可操作以從通信裝置接收將語音轉(zhuǎn)換成文本的請求的控制器。18、如權(quán)利要求13所述的網(wǎng)絡(luò)設(shè)備，其進一步包括可操作以從通信裝置接收將文本轉(zhuǎn)換成語音的請求的控制器。19、一種方法，其包括接收經(jīng)編碼語音包；將所述所接收的經(jīng)編碼語音包轉(zhuǎn)換成語音信號；及接收用戶從多個模式中對一模式的選擇，其中第一模式啟用語音到文本轉(zhuǎn)換，第二模式啟用文本到語音轉(zhuǎn)換，且第三模式啟用語音到文本及文本到語音轉(zhuǎn)換。20、如權(quán)利要求19所述的方法，其進一步包括在接收傳入呼叫之前接收用戶對模式的選擇。21、如權(quán)利要求19所述的方法，其進一步包括在接收傳入呼叫之后接收用戶對模式的選擇。全文摘要本發(fā)明涉及用以將語音轉(zhuǎn)換成文本及將文本轉(zhuǎn)換成語音的系統(tǒng)、方法及設(shè)備。一種設(shè)備包括聲碼器、語音到文本轉(zhuǎn)換引擎、文本到語音轉(zhuǎn)換引擎及用戶界面。所述聲碼器可操作以將語音信號轉(zhuǎn)換成包及將包轉(zhuǎn)換成語音信號。所述語音到文本轉(zhuǎn)換引擎可操作以將語音轉(zhuǎn)換成文本。所述文本到語音轉(zhuǎn)換引擎可操作以將文本轉(zhuǎn)換成語音。所述用戶界面可操作以接收用戶從多個模式中對一模式的選擇，其中第一模式啟用所述語音到文本轉(zhuǎn)換引擎，第二模式啟用所述文本到語音轉(zhuǎn)換引擎，且第三模式啟用所述語音到文本轉(zhuǎn)換引擎及所述文本到語音轉(zhuǎn)換引擎。文檔編號G10L13/04GK101496096SQ200780028278公開日2009年7月29日申請日期2007年7月31日優(yōu)先權(quán)日2006年7月31日發(fā)明者哈利德·希勒米·埃爾-馬勒赫,斯蒂芬·莫洛伊申請人:高通股份有限公司

完整全部詳細技術(shù)資料下載