本申請(qǐng)案主張共同所有的2014年4月30日申請(qǐng)的第61/986,701號(hào)美國臨時(shí)專利申請(qǐng)案和2015年4月29日申請(qǐng)的第14/700,009號(hào)美國非臨時(shí)專利申請(qǐng)案的優(yōu)先權(quán),以上申請(qǐng)案的內(nèi)容明確地以全文引用的方式并入本文中。
技術(shù)領(lǐng)域
本發(fā)明大體上涉及話音簡(jiǎn)檔管理和語音信號(hào)產(chǎn)生。
背景技術(shù):
技術(shù)的進(jìn)步已經(jīng)產(chǎn)生了更小且更強(qiáng)大的計(jì)算裝置。舉例來說,當(dāng)前存在各種便攜式個(gè)人計(jì)算裝置,包括無線計(jì)算裝置,例如較小、輕重量且易于由用戶攜帶的便攜式無線電話、個(gè)人數(shù)字助理(PDA)和尋呼裝置。更具體地說,便攜式無線電話,例如蜂窩電話和因特網(wǎng)協(xié)議(IP)電話,可經(jīng)由無線網(wǎng)絡(luò)傳送話音和數(shù)據(jù)包。另外,許多此類無線電話包括并入其中的其它類型的裝置。舉例來說,無線電話還可包含數(shù)字靜態(tài)相機(jī)、數(shù)碼攝像機(jī)、數(shù)字記錄器和音頻文件播放器。并且,此類無線電話可處理可執(zhí)行指令,包含軟件應(yīng)用程序,例如可用以接入因特網(wǎng)的網(wǎng)絡(luò)瀏覽器應(yīng)用程序。由此,這些無線電話可包含大量計(jì)算能力。
通過數(shù)字技術(shù)發(fā)射話音是普遍的,尤其在長(zhǎng)距離和數(shù)字無線電電話應(yīng)用中??纱嬖诖_定對(duì)可經(jīng)由信道發(fā)送的最少量的信息同時(shí)維持經(jīng)重構(gòu)語音的感知質(zhì)量的關(guān)注。如果通過取樣和數(shù)字化來發(fā)射語音,那么可使用約六十四千位每秒(kbps)的數(shù)據(jù)速率來實(shí)現(xiàn)模擬電話的語音質(zhì)量。通過在接收器處使用語音分析,接著譯碼、發(fā)射和重新合成,可實(shí)現(xiàn)數(shù)據(jù)速率的顯著減小。
用于壓縮語音的裝置可用于許多電信領(lǐng)域中。示范性領(lǐng)域?yàn)闊o線通信。無線通信的領(lǐng)域具有許多應(yīng)用,包括(例如)無繩電話、尋呼、無線本地回路、例如蜂窩式和個(gè)人通信服務(wù)(PCS)電話系統(tǒng)的無線電話、移動(dòng)因特網(wǎng)協(xié)議(IP)電話和衛(wèi)星通信系統(tǒng)。特定應(yīng)用是用于移動(dòng)訂戶的無線電話。
已開發(fā)了用于無線通信系統(tǒng)的各種空中接口,包含(例如)頻分多址(FDMA)、時(shí)分多址(TDMA)、碼分多址(CDMA)和時(shí)分同步CDMA(TD-SCDMA)。在與其的連接中,已經(jīng)建立各種國內(nèi)和國際標(biāo)準(zhǔn),包含例如高級(jí)移動(dòng)電話服務(wù)(AMPS)、全球移動(dòng)通信系統(tǒng)(GSM)和過渡標(biāo)準(zhǔn)95(IS-95)。示范性無線電話通信系統(tǒng)為碼分多址(CDMA)系統(tǒng)。IS-95標(biāo)準(zhǔn)及其衍生標(biāo)準(zhǔn)、IS-95A、ANSI J-STD-008和IS-95B(本文中共同稱作IS-95)由電信行業(yè)協(xié)會(huì)(TIA)和其它公認(rèn)標(biāo)準(zhǔn)機(jī)構(gòu)頒布以指定CDMA空中接口針對(duì)蜂窩式或PCS電話通信系統(tǒng)的使用。
IS-95標(biāo)準(zhǔn)隨后演進(jìn)成例如cdma2000和WCDMA的“3G”系統(tǒng),所述“3G”系統(tǒng)提供更大容量和高速包數(shù)據(jù)服務(wù)。cdma2000的兩個(gè)變體由TIA發(fā)布的文獻(xiàn)IS-2000(cdma2000 1xRTT)和IS-856(cdma2000 1xEV-DO)呈現(xiàn)。cdma2000 1xRTT通信系統(tǒng)提供153kbps的峰值數(shù)據(jù)速率,而cdma2000 1xEV-DO通信系統(tǒng)定義范圍介于38.4kbps到2.4Mbps的一組數(shù)據(jù)速率。WCDMA標(biāo)準(zhǔn)實(shí)施于第三代合作伙伴計(jì)劃“3GPP”文獻(xiàn)3G TS 25.211、3G TS 25.212、3G TS 25.213和3G TS 25.214中。國際移動(dòng)電信高級(jí)(IMT-高級(jí))規(guī)范陳述“4G”標(biāo)準(zhǔn)。對(duì)于高移動(dòng)性通信(例如,來自火車和汽車),高級(jí)IMT規(guī)范設(shè)定100兆位/秒(Mbit/s)的峰值數(shù)據(jù)速率用于4G服務(wù),且對(duì)于低移動(dòng)性通信(例如,來自行人和靜止用戶),高級(jí)IMT規(guī)范設(shè)定1千兆比特/秒(Gbit/s)的峰值數(shù)據(jù)速率用于4G服務(wù)。
使用通過提取關(guān)于人類語音生成模型的參數(shù)來壓縮語音的技術(shù)的裝置被稱為語音譯碼器。語音譯碼器可包括編碼器和解碼器。編碼器將傳入語音信號(hào)劃分成時(shí)間塊或分析幀??蓪⒚恳粫r(shí)間區(qū)段(或“幀”)的持續(xù)時(shí)間選擇為足夠短,使得可預(yù)期信號(hào)的頻譜包絡(luò)保持相對(duì)固定。舉例來說,一個(gè)幀長(zhǎng)度為二十毫秒,其對(duì)應(yīng)于八千赫茲(kHz)取樣速率下的160個(gè)樣本,但可使用認(rèn)為適合于特定應(yīng)用的任何幀長(zhǎng)度或取樣速率。
編碼器分析傳入語音幀以提取某些相關(guān)參數(shù),且隨后將參數(shù)量化成二進(jìn)制表示(例如,一組位或二進(jìn)制數(shù)據(jù)包)。經(jīng)由通信信道(即,有線和/或無線網(wǎng)絡(luò)連接)將數(shù)據(jù)包發(fā)射到接收器和解碼器。解碼器處理所述數(shù)據(jù)包、去量化經(jīng)處理的數(shù)據(jù)包以產(chǎn)生參數(shù),并使用經(jīng)去量化參數(shù)來重新合成語音幀。
語音譯碼器的功能是通過去除語音中固有的自然冗余來將經(jīng)數(shù)字化的語音信號(hào)壓縮成低位速率信號(hào)??赏ㄟ^用一組參數(shù)表示輸入語音幀且使用量化來用一組位表示所述參數(shù)來實(shí)現(xiàn)數(shù)字壓縮。如果輸入語音幀具有若干位Ni,且語音譯碼器產(chǎn)生的數(shù)據(jù)包具有若干位No,那么語音譯碼器所實(shí)現(xiàn)的壓縮因子是Cr=Ni/No。挑戰(zhàn)是在實(shí)現(xiàn)目標(biāo)壓縮因子時(shí)保留經(jīng)解碼語音的高話音質(zhì)量。語音譯碼器的性能取決于:(1)語音模型或上文所描述的分析和合成過程的組合執(zhí)行得多好,以及(2)在No位每幀的目標(biāo)位速率下參數(shù)量化過程執(zhí)行得多好。因此,語音模型的目標(biāo)是在每一幀具有較小一組參數(shù)的情況下,捕獲語音信號(hào)的本質(zhì)或目標(biāo)語音質(zhì)量。
語音譯碼器通常利用一組參數(shù)(包含向量)來描述語音信號(hào)。良好的一組參數(shù)為感知上準(zhǔn)確的語音信號(hào)的重構(gòu)理想地提供低系統(tǒng)帶寬。音調(diào)、信號(hào)功率、譜包絡(luò)(或共振峰)、振幅和相譜是語音譯碼參數(shù)的實(shí)例。
語音譯碼器可實(shí)施為時(shí)域譯碼器,其試圖通過利用高時(shí)間分辨率處理以一次編碼較小語音片段(例如,5毫秒(ms)的子幀)來捕獲時(shí)域語音波形。對(duì)于每一子幀,借助于搜索算法來找出來自碼簿空間的高精確代表。或者,語音譯碼器可實(shí)施為頻域譯碼器,其試圖用一組參數(shù)(分析)來捕獲輸入語音幀的短期語音譜,并利用對(duì)應(yīng)的合成過程來從譜參數(shù)再造語音波形。參數(shù)量化器通過根據(jù)已知量化技術(shù)用代碼向量的所存儲(chǔ)表示來表示參數(shù)而保留所述參數(shù)。
一種時(shí)域語音譯碼器是代碼激發(fā)線性預(yù)測(cè)性(CELP)譯碼器。在CELP譯碼器中,通過找出短期共振峰濾波器的系數(shù)的線性預(yù)測(cè)(LP)分析來去除語音信號(hào)中的短期相關(guān)性或冗余。將短期預(yù)測(cè)濾波器應(yīng)用于傳入語音幀生成LP殘余信號(hào),用長(zhǎng)期預(yù)測(cè)濾波器參數(shù)和后續(xù)隨機(jī)碼簿對(duì)所述LP殘余信號(hào)進(jìn)行進(jìn)一步模型化和量化。因此,CELP譯碼將編碼時(shí)域語音波形的任務(wù)劃分成編碼LP短期濾波器系數(shù)和編碼LP殘余的單獨(dú)任務(wù)??梢怨潭ㄋ俾?即,針對(duì)每一幀使用相同位數(shù)No)或以可變速率(其中針對(duì)不同類型的幀內(nèi)容使用不同的位速率)執(zhí)行時(shí)域譯碼??勺兯俾首g碼器嘗試使用將編解碼器參數(shù)編碼到足以獲得目標(biāo)質(zhì)量的層級(jí)所需要的位的量。
例如CELP譯碼器等時(shí)域譯碼器可依靠每幀的高位數(shù)No來保留時(shí)域語音波形的準(zhǔn)確性。假如每幀的位數(shù)No相對(duì)較大(例如,8kbps或以上),那么此類譯碼器可傳遞極好的話音質(zhì)量。在低位速率(例如,4kbps和以下)下,歸因于受限數(shù)目個(gè)可用位,時(shí)域譯碼器可未能保持高品質(zhì)和穩(wěn)健性能。在低位速率下,受限碼簿空間削減在較高速率商業(yè)應(yīng)用中所部署的時(shí)域譯碼器的波形匹配能力。因此,不管隨時(shí)間的改進(jìn),以低位速率操作的許多CELP譯碼系統(tǒng)經(jīng)受被表征為噪聲的感知上顯著的失真。
低位速率下的CELP譯碼器到替代方案是“噪聲激發(fā)線性預(yù)測(cè)性”(NELP)譯碼器,其在與CELP譯碼器類似的原理下操作。NELP譯碼器使用經(jīng)濾波偽隨機(jī)噪聲信號(hào)而非碼簿來模型化語音。由于NELP針對(duì)經(jīng)譯碼語音使用較簡(jiǎn)單的模型,因此NELP實(shí)現(xiàn)比CELP低的位速率。NELP可用于壓縮或表示無聲語音或靜默。
約2.4kbps的速率操作的譯碼系統(tǒng)在本質(zhì)上大體上是參數(shù)的。就是說,此類譯碼系統(tǒng)通過以規(guī)則間隔發(fā)射描述語音信號(hào)的音調(diào)周期和譜包絡(luò)(或共振峰)的參數(shù)來操作。這些所謂的參數(shù)譯碼器的說明是LP聲碼器系統(tǒng)。
LP聲碼器以每音調(diào)周期單個(gè)脈沖來模型化有聲語音信號(hào)。此基本技術(shù)可經(jīng)擴(kuò)增以包含發(fā)射關(guān)于譜包絡(luò)的信息等等。盡管LP聲碼器一般來說提供合理的性能,但它們可能引入表征為蜂音的感知上相當(dāng)大的失真。
近年來,已出現(xiàn)了作為波形譯碼器和參數(shù)譯碼器兩者的混合的譯碼器。這些所謂的混合譯碼器中的說明性混合譯碼器是原型波形內(nèi)插(PWI)語音譯碼系統(tǒng)。PWI譯碼系統(tǒng)還可被稱為原型音調(diào)周期(PPP)語音譯碼器。PWI譯碼系統(tǒng)提供用于譯碼有聲語音的高效方法。PWI的基本概念是以固定間隔提取代表性音調(diào)循環(huán)(原型波形),發(fā)射其描述,以及通過原型波形之間的內(nèi)插來重構(gòu)語音信號(hào)。PWI方法可對(duì)LP殘余信號(hào)或所述語音信號(hào)操作。
可存在對(duì)改善語音信號(hào)(例如,經(jīng)譯碼語音信號(hào)、經(jīng)重構(gòu)語音信號(hào)或這兩者)的音頻質(zhì)量的研究關(guān)注和商業(yè)關(guān)注。舉例來說,通信裝置可接收具有低于最佳話音質(zhì)量的語音信號(hào)。為了說明,通信裝置可在話音呼叫期間從另一通信裝置接收語音信號(hào)。話音呼叫質(zhì)量可能由于各種原因而受影響,例如環(huán)境噪聲(例如,風(fēng)、道路噪聲)、通信裝置的接口的限制、通信裝置的信號(hào)處理、丟包、帶寬限制、位速率限制等等。
技術(shù)實(shí)現(xiàn)要素:
在特定方面,一種裝置包含接收器、存儲(chǔ)器和處理器。所述接收器經(jīng)配置以接收遠(yuǎn)程話音簡(jiǎn)檔。所述存儲(chǔ)器電耦合到所述接收器。所述存儲(chǔ)器經(jīng)配置以存儲(chǔ)與人相關(guān)聯(lián)的本地話音簡(jiǎn)檔。所述處理器電耦合到所述存儲(chǔ)器和所述接收器。所述處理器經(jīng)配置以基于與所述遠(yuǎn)程話音簡(jiǎn)檔相關(guān)聯(lián)的語音內(nèi)容或與所述遠(yuǎn)程話音簡(jiǎn)檔相關(guān)聯(lián)的識(shí)別符而確定所述遠(yuǎn)程話音簡(jiǎn)檔與所述人相關(guān)聯(lián)。所述處理器還經(jīng)配置以基于所述確定而選擇所述本地話音簡(jiǎn)檔用于簡(jiǎn)檔管理。
在另一方面,一種用于通信的方法包含在存儲(chǔ)本地話音簡(jiǎn)檔的裝置處接收遠(yuǎn)程話音簡(jiǎn)檔,所述本地話音簡(jiǎn)檔與人相關(guān)聯(lián)。所述方法還包含基于所述遠(yuǎn)程話音簡(jiǎn)檔與所述本地話音簡(jiǎn)檔的比較或基于與所述遠(yuǎn)程話音簡(jiǎn)檔相關(guān)聯(lián)的識(shí)別符而確定所述遠(yuǎn)程話音簡(jiǎn)檔與所述人相關(guān)聯(lián)。所述方法進(jìn)一步包含在所述裝置處基于所述確定而選擇所述本地話音簡(jiǎn)檔用于簡(jiǎn)檔管理。
在另一方面,一種裝置包含存儲(chǔ)器和處理器。所述存儲(chǔ)器經(jīng)配置以存儲(chǔ)多個(gè)代替語音信號(hào)。所述處理器電耦合到所述存儲(chǔ)器。所述處理器經(jīng)配置以從文字到語音轉(zhuǎn)換器接收語音信號(hào)。所述處理器還經(jīng)配置以檢測(cè)多個(gè)使用模式中的使用模式。所述處理器進(jìn)一步經(jīng)配置以選擇多個(gè)人口統(tǒng)計(jì)域中的人口統(tǒng)計(jì)域。所述處理器還經(jīng)配置以基于所述語音信號(hào)、所述人口統(tǒng)計(jì)域和所述使用模式而選擇所述多個(gè)代替語音信號(hào)中的代替語音信號(hào)。所述處理器進(jìn)一步經(jīng)配置以基于所述代替語音信號(hào)而產(chǎn)生經(jīng)處理語音信號(hào)。所述處理器還經(jīng)配置以將所述經(jīng)處理語音信號(hào)提供到至少一個(gè)揚(yáng)聲器。
本發(fā)明的其它方面、優(yōu)點(diǎn)和特征將在審閱全部申請(qǐng)案之后變得顯而易見,所述申請(qǐng)案包含以下章節(jié):附圖說明、具體實(shí)施方式和權(quán)利要求書。
附圖說明
圖1是可操作以替換語音信號(hào)的系統(tǒng)的特定說明性方面的框圖;
圖2是可操作以替換語音信號(hào)的系統(tǒng)的另一說明性方面的圖;
圖3是可操作以替換語音信號(hào)的系統(tǒng)可顯示的用戶接口的特定說明性方面的圖;
圖4是可操作以替換語音信號(hào)的系統(tǒng)的另一說明性方面的圖;
圖5是可操作以替換語音信號(hào)的系統(tǒng)的另一說明性方面的圖;
圖6是可操作以替換語音信號(hào)的系統(tǒng)的另一說明性方面的圖;
圖7是可操作以替換語音信號(hào)的系統(tǒng)的另一說明性方面的圖;
圖8是可操作以替換語音信號(hào)的系統(tǒng)的另一說明性方面的圖;
圖9是可操作以替換語音信號(hào)的系統(tǒng)的另一說明性方面的圖;
圖10是可操作以替換語音信號(hào)的系統(tǒng)可使用的數(shù)據(jù)庫的說明性方面的圖;
圖11是可操作以替換語音信號(hào)的系統(tǒng)的另一說明性方面的圖;
圖12是可操作以替換語音信號(hào)的系統(tǒng)的另一說明性方面的圖;
圖13是可操作以替換語音信號(hào)的系統(tǒng)的另一說明性方面的圖;
圖14是說明替換語音信號(hào)的方法的特定方面的流程圖;
圖15是說明獲取多個(gè)代替語音信號(hào)的方法的特定方面的流程圖且可對(duì)應(yīng)于圖11的操作802;
圖16是說明替換語音信號(hào)的方法的另一方面的流程圖;
圖17是說明產(chǎn)生用戶接口的方法的另一方面的流程圖;
圖18是說明替換語音信號(hào)的方法的另一方面的流程圖;以及
圖19是根據(jù)圖1到18的系統(tǒng)和方法的可操作以替換語音信號(hào)的裝置的特定說明性方面的框圖。
具體實(shí)施方式
本文所述的原理可例如應(yīng)用于經(jīng)配置以執(zhí)行語音信號(hào)替換的頭戴裝置、手持機(jī)或其它音頻裝置。除非通過其上下文明確限制,否則在本文中使用術(shù)語“信號(hào)”來指示其一般含義中的任一者,包含如在導(dǎo)線、總線或其它傳輸媒體上表達(dá)的存儲(chǔ)器位置的狀態(tài)(或存儲(chǔ)器位置的集合)。除非通過其上下文明確地限制,否則在本文中使用術(shù)語“產(chǎn)生”來指示其一般含義中的任一者,例如計(jì)算或以其它方式產(chǎn)生。除非通過其上下文明確限制,否則在本文中使用術(shù)語“計(jì)算”來指示其一般含義中的任一者,例如計(jì)算、評(píng)估、估計(jì),及/或從多個(gè)值中選擇。除非通過其上下文明確限制,否則在本文中使用術(shù)語“獲得”來指示其一般含義中的任一者,例如計(jì)算、導(dǎo)出、接收(例如,從另一組件、塊或裝置)和/或檢索(例如,從存儲(chǔ)器寄存器或存儲(chǔ)元件陣列)。
除非通過其上下文明確地限制,否則使用術(shù)語“產(chǎn)生”來指示其一般含義中的任一者,例如計(jì)算、產(chǎn)生和/或提供。除非通過其上下文明確地限制,否則使用術(shù)語“提供”來指示其一般含義中的任一者,例如計(jì)算、產(chǎn)生和/或生成。除非通過其上下文明確地限制,否則使用術(shù)語“耦合”來指示直接或間接電或物理連接。如果連接是間接的,那么所屬領(lǐng)域的技術(shù)人員將充分理解,正“耦合”的結(jié)構(gòu)之間可存在其它塊或組件。
術(shù)語“配置”可參考如通過其特定上下文指示的方法、設(shè)備/裝置和/或系統(tǒng)來使用。在本發(fā)明描述及權(quán)利要求書中使用術(shù)語“包括”時(shí),并不排除其它元素或操作。使用術(shù)語“基于”(如在“A基于B”中)來指示其普通含義中的任一者,包含情況(i)“至少基于”(例如“A至少基于B”),以及(如果在特定上下文中合適)(ii)“等于”(例如“A等于B”)。在其中A基于B包含至少基于的情況(i)下,此可包含其中A耦合到B的配置。類似地,使用術(shù)語“響應(yīng)于”來指示其普通含義中的任一者,包含“至少響應(yīng)于”。使用術(shù)語“至少一個(gè)”來指示其普通含義中的任一者,包含“一或多個(gè)”。使用術(shù)語“至少兩個(gè)”來指示其普通含義中的任一者,包含“兩個(gè)或兩個(gè)以上”。
除非特定上下文另有指示,否則術(shù)語“設(shè)備”與“裝置”也通用地且可互換地使用。除非另有指示,否則對(duì)具有特定特征的設(shè)備的操作的任何揭示內(nèi)容還明確地希望揭示具有類似特征的方法(且反之亦然),且對(duì)根據(jù)特定配置的設(shè)備的操作的任何揭示內(nèi)容還明確地希望揭示根據(jù)類似配置的方法(且反之亦然)。除非特定上下文另有指示,否則術(shù)語“方法”、“過程”、“程序”及“技術(shù)”通用地且可互換地使用。術(shù)語“元件”和“模塊”可用于指示較大配置的一部分。通過參考文檔的一部分進(jìn)行的任何并入也應(yīng)理解為并入了在所述部分內(nèi)參考的術(shù)語或變量的定義,其中此類定義出現(xiàn)在文檔中的其它地方,以及并入了在所并入部分中參考的任何圖。
如本文所使用,術(shù)語“通信裝置”是指可用于經(jīng)由無線通信網(wǎng)路進(jìn)行話音和/或數(shù)據(jù)通信的電子裝置。通信裝置的實(shí)例包含蜂窩式電話、個(gè)人數(shù)字助理(PDA)、手持式裝置、耳機(jī)、無線調(diào)制解調(diào)器、膝上型計(jì)算機(jī)、個(gè)人計(jì)算機(jī)等。
參考圖1,揭示可操作以替換語音信號(hào)的系統(tǒng)的特定說明性方面且一般指定為100。系統(tǒng)100可包含經(jīng)由網(wǎng)絡(luò)120與一或多個(gè)其它裝置(例如,移動(dòng)裝置104、桌上型計(jì)算機(jī)106等)通信的第一裝置102。移動(dòng)裝置104可耦合到麥克風(fēng)146或與其通信。桌上型計(jì)算機(jī)106可耦合到麥克風(fēng)144或與其通信。第一裝置102可耦合到一或多個(gè)揚(yáng)聲器142。第一裝置102可包含信號(hào)處理模塊122和第一數(shù)據(jù)庫124。第一數(shù)據(jù)庫124可經(jīng)配置以存儲(chǔ)代替的語音信號(hào)112。
第一裝置102可包含與圖1中所說明相比更少或更多的組件。舉例來說,第一裝置102可包含一或多個(gè)處理器、一或多個(gè)存儲(chǔ)器單元或這兩者。第一裝置102可包含聯(lián)網(wǎng)或分布式計(jì)算系統(tǒng)。在特定說明性方面中,第一裝置102可包含移動(dòng)通信裝置、智能電話、蜂窩式電話、膝上型計(jì)算機(jī)、計(jì)算機(jī)、平板計(jì)算機(jī)、個(gè)人數(shù)字助理、顯示裝置、電視、游戲控制臺(tái)、音樂播放器、無線電、數(shù)字視頻播放器、數(shù)字視頻光盤(DVD)播放器、調(diào)諧器、相機(jī)、導(dǎo)航裝置或其組合。此類裝置可包含用戶接口(例如,觸摸屏、話音辨識(shí)能力或其它用戶接口能力)。
在操作期間,第一裝置102可接收用戶語音信號(hào)(例如,第一用戶語音信號(hào)130、第二用戶語音信號(hào)132或這兩者)。舉例來說,第一用戶152可參與與第二用戶154的話音呼叫。第一用戶152可使用第一裝置102且第二用戶154可使用移動(dòng)裝置104用于所述話音呼叫。在話音呼叫期間,第二用戶154可對(duì)耦合到移動(dòng)裝置104的麥克風(fēng)146說話。第一用戶語音信號(hào)130可對(duì)應(yīng)于第二用戶154說出的多個(gè)詞、一個(gè)詞或一個(gè)詞的一部分。移動(dòng)裝置104可經(jīng)由麥克風(fēng)146從第二用戶154接收第一用戶語音信號(hào)130。在特定方面,麥克風(fēng)146可俘獲音頻信號(hào)且模/數(shù)轉(zhuǎn)換器(ADC)可將所俘獲音頻信號(hào)從模擬波形轉(zhuǎn)換為由數(shù)字音頻樣本構(gòu)成的數(shù)字波形。數(shù)字音頻樣本可由數(shù)字信號(hào)處理器處理。增益調(diào)節(jié)器可通過增加或減小音頻信號(hào)的振幅電平(例如模擬波形或數(shù)字波形)來調(diào)節(jié)(例如模擬波形或數(shù)字波形的)增益。增益調(diào)節(jié)器可在模擬或數(shù)字域中操作。舉例來說,增益調(diào)節(jié)器可在數(shù)字域中操作,且可調(diào)節(jié)模/數(shù)轉(zhuǎn)換器所產(chǎn)生的數(shù)字音頻樣本。在增益調(diào)節(jié)之后,回聲消除器可減少可能已因揚(yáng)聲器的輸出進(jìn)入麥克風(fēng)146而產(chǎn)生的任何回聲。數(shù)字音頻樣本可由聲碼器(話音編碼器-解碼器)“壓縮”?;芈曄鞯妮敵隹神詈系铰暣a器預(yù)處理塊,例如濾波器、噪聲處理器、速率轉(zhuǎn)換器等。聲碼器的編碼器可壓縮數(shù)字音頻樣本且形成發(fā)射包(數(shù)字音頻樣本的經(jīng)壓縮位的表示)。發(fā)射包可存儲(chǔ)于可與移動(dòng)裝置104的處理器共享的存儲(chǔ)器中。所述處理器可為與數(shù)字信號(hào)處理器通信的控制處理器。
移動(dòng)裝置104可經(jīng)由網(wǎng)絡(luò)120將第一用戶語音信號(hào)130發(fā)射到第一裝置102。舉例來說,移動(dòng)裝置104可包含收發(fā)器。收發(fā)器可調(diào)制某一形式(其它信息可附加到發(fā)射包)的發(fā)射包,并經(jīng)由天線在空中發(fā)送經(jīng)調(diào)制的信息。
第一裝置102的信號(hào)處理模塊122可接收第一用戶語音信號(hào)130。舉例來說,第一裝置102的天線可接收某一形式的傳入包,其包括發(fā)射包。聲碼器的解碼器可能在第一裝置102處“未壓縮”發(fā)射包。所述未壓縮波形可被稱為經(jīng)重構(gòu)音頻樣本。經(jīng)重構(gòu)的音頻樣本可由聲碼器后處理塊進(jìn)行后處理,且可由回聲消除器用來去除回聲。為清楚起見,聲碼器的解碼器和聲碼器后處理塊可被稱為聲碼器解碼器模塊。在一些配置中,回聲消除器的輸出可由信號(hào)處理模塊122處理。替代地,在其它配置中,聲碼器解碼器模塊的輸出可由信號(hào)處理模塊122處理。
如由第一裝置102接收的第一用戶語音信號(hào)130的音頻質(zhì)量可低于第二用戶154發(fā)送的第一用戶語音信號(hào)130的音頻質(zhì)量。第一用戶語音信號(hào)130的音頻質(zhì)量可能在向第一裝置102的發(fā)射期間由于各種原因而劣化。舉例來說,第二用戶154可能在話音呼叫期間處于有噪聲的位置(例如,繁忙的街道、音樂會(huì)等)。由麥克風(fēng)146接收的第一用戶語音信號(hào)130可包含除第二用戶154說出的詞之外的聲音。作為另一實(shí)例,麥克風(fēng)146可具有俘獲聲音的有限能力,移動(dòng)裝置104可以丟失一些聲音信息的方式處理聲音,在對(duì)應(yīng)于第一用戶語音信號(hào)130的包的發(fā)射期間網(wǎng)絡(luò)120內(nèi)可存在丟包,或其任何組合。
信號(hào)處理模塊122可將語音信號(hào)(例如,第一用戶語音信號(hào)130、第二用戶語音信號(hào)132或這兩者)的一部分與代替語音信號(hào)112中的一或多者進(jìn)行比較。舉例來說,第一用戶語音信號(hào)130可對(duì)應(yīng)于第二用戶154說出的詞(例如,“cat”)且第一用戶語音信號(hào)130的第一部分162可對(duì)應(yīng)于所述詞的一部分(例如,“c”、“a”、“t”、“ca”、“at”或“cat”)。信號(hào)處理模塊122可基于所述比較而確定第一部分162匹配于代替語音信號(hào)112的第一代替語音信號(hào)172。舉例來說,第一部分162和第一代替語音信號(hào)172可表示共同聲音(例如,“c”)。所述共同聲音可包含音素、雙音素、三音素、音節(jié)、詞或其組合。
在特定方面,甚至當(dāng)?shù)谝徊糠?62和第一代替語音信號(hào)172并不表示共同聲音(例如樣本的有限集合)時(shí),信號(hào)處理模塊122也可確定第一部分162匹配于第一代替語音信號(hào)172。第一部分162可對(duì)應(yīng)于第一樣本集合(例如,詞“do”)且第一代替語音信號(hào)172可對(duì)應(yīng)于第二樣本集合(例如,詞“to”)。舉例來說,與代替語音信號(hào)112中的其它代替語音信號(hào)相比,信號(hào)處理模塊122可確定第一部分162與第一代替語音信號(hào)172具有較高相似性。
第一代替語音信號(hào)172可具有比第一部分162高的音頻質(zhì)量(例如,較高信噪比值)。舉例來說,代替語音信號(hào)112可對(duì)應(yīng)于先前記錄的由第二用戶154說出的詞或詞的部分,如參考圖2進(jìn)一步描述。
在特定方面,信號(hào)處理模塊122可通過將對(duì)應(yīng)于第一部分162的波形與對(duì)應(yīng)于第一代替語音信號(hào)172的另一波形進(jìn)行比較而確定第一部分162匹配于第一代替語音信號(hào)172。在特定方面,信號(hào)處理模塊122可將對(duì)應(yīng)于第一部分162的特征的子集與對(duì)應(yīng)于第一代替語音信號(hào)172的特征的另一子集進(jìn)行比較。舉例來說,信號(hào)處理模塊122可通過將對(duì)應(yīng)于第一部分162的多個(gè)語音參數(shù)與對(duì)應(yīng)于第一代替語音信號(hào)172的另外多個(gè)語音參數(shù)進(jìn)行比較而確定第一部分162匹配于第一代替語音信號(hào)172。所述多個(gè)語音參數(shù)可包含音調(diào)參數(shù)、能量參數(shù)、線性預(yù)測(cè)譯碼(LPC)參數(shù)、梅爾頻率倒譜系數(shù)(MFCC)、線譜對(duì)(LSP)、線譜頻率(LSF)、倒譜、線譜信息(LSI)、離散余弦變換(DCT)參數(shù)(例如,系數(shù))、離散傅立葉變換(DFT)參數(shù)、快速傅立葉變換(FFT)參數(shù)、共振峰頻率,或其任何組合。信號(hào)處理模塊122可使用向量量化器、隱式馬爾可夫模型(HMM)或高斯混合模型(GMM)中的至少一者確定所述多個(gè)語音參數(shù)的值。
信號(hào)處理模塊122可通過以第一代替語音信號(hào)172替換第一用戶語音信號(hào)130的第一部分162而產(chǎn)生經(jīng)處理語音信號(hào)(例如,第一經(jīng)處理語音信號(hào)116)。舉例來說,信號(hào)處理模塊122可復(fù)制第一用戶語音信號(hào)130且可從所復(fù)制用戶語音信號(hào)移除第一部分162。信號(hào)處理模塊122可通過在所復(fù)制用戶語音信號(hào)的其中第一部分162被移除的位置處串接(例如,拼接)第一代替語音信號(hào)172和所復(fù)制用戶語音信號(hào)而產(chǎn)生第一經(jīng)處理語音信號(hào)116。
在特定方面,第一經(jīng)處理語音信號(hào)116可包含多個(gè)代替語音信號(hào)。在特定方面,信號(hào)處理模塊122可拼接第一代替語音信號(hào)172與另一代替語音信號(hào)以產(chǎn)生中間代替語音信號(hào)。在此方面中,信號(hào)處理模塊122可在其中第一部分162被移除的位置處拼接中間代替語音信號(hào)與所復(fù)制用戶語音信號(hào)。在替代方面中,可迭代地產(chǎn)生第一經(jīng)處理語音信號(hào)116。在第一迭代期間,信號(hào)處理模塊122可通過在其中第二部分從所復(fù)制用戶語音信號(hào)移除的位置處拼接另一代替語音信號(hào)與所復(fù)制用戶語音信號(hào)而產(chǎn)生中間經(jīng)處理語音信號(hào)。所述中間經(jīng)處理語音信號(hào)可在后續(xù)迭代期間對(duì)應(yīng)于第一用戶語音信號(hào)130。舉例來說,信號(hào)處理模塊122可從中間經(jīng)處理語音信號(hào)移除第一部分162。信號(hào)處理模塊122可通過在其中第一部分162被移除的位置處拼接第一代替語音信號(hào)172和中間經(jīng)處理語音信號(hào)而產(chǎn)生第一經(jīng)處理語音信號(hào)116。
此些拼接和復(fù)制操作可由處理器對(duì)音頻信號(hào)的數(shù)字表示執(zhí)行。在特定方面,第一經(jīng)處理語音信號(hào)116可由增益調(diào)節(jié)器放大或抑制。第一裝置102可經(jīng)由揚(yáng)聲器142將第一經(jīng)處理語音信號(hào)116輸出到第一用戶152。舉例來說,增益調(diào)節(jié)器的輸出可通過數(shù)/模轉(zhuǎn)換器從數(shù)字信號(hào)轉(zhuǎn)換到模擬信號(hào),且經(jīng)由揚(yáng)聲器142播放出。
在特定方面,移動(dòng)裝置104可在將第一用戶語音信號(hào)130發(fā)送到第一裝置102之前修改與第一用戶語音信號(hào)130相關(guān)聯(lián)的一或多個(gè)語音參數(shù)。在特定方面,移動(dòng)裝置104可包含信號(hào)處理模塊122。在此方面中,所述一或多個(gè)語音參數(shù)可由移動(dòng)裝置104的信號(hào)處理模塊122修改。在特定方面,移動(dòng)裝置104可具有對(duì)代替語音信號(hào)112的存取。舉例來說,移動(dòng)裝置104可能已先前從服務(wù)器接收代替語音信號(hào)112,如參考圖2進(jìn)一步描述。
移動(dòng)裝置104可修改所述一或多個(gè)語音參數(shù)以輔助信號(hào)處理模塊122在將第一用戶語音信號(hào)130的第一部分162與代替語音信號(hào)112進(jìn)行比較時(shí)找到匹配。舉例來說,移動(dòng)裝置104可確定第一代替語音信號(hào)172(例如,對(duì)應(yīng)于來自“catatonic”的“c”)是針對(duì)第一用戶語音信號(hào)130(例如,“cat”)的第一部分162(例如,“c”)的比第二代替語音信號(hào)174(例如,對(duì)應(yīng)于來自“cola”的“c”更好的匹配)。移動(dòng)裝置104可修改第一部分162的一或多個(gè)語音參數(shù)以輔助信號(hào)處理模塊122確定第一代替語音信號(hào)172是比第二代替語音信號(hào)174更好的匹配。舉例來說,移動(dòng)裝置104可修改音調(diào)參數(shù)、能量參數(shù)、線性預(yù)測(cè)譯碼(LPC)參數(shù)或其組合,以使得經(jīng)修改參數(shù)更接近第一代替語音信號(hào)172的對(duì)應(yīng)參數(shù)而非第二代替語音信號(hào)174的對(duì)應(yīng)參數(shù)。
在特定方面,移動(dòng)裝置104可將一或多個(gè)發(fā)射參數(shù)發(fā)送到第一裝置102。在特定方面,移動(dòng)裝置104的信號(hào)處理模塊122可將發(fā)射參數(shù)發(fā)送到第一裝置102。所述發(fā)射參數(shù)可識(shí)別移動(dòng)裝置104已確定為針對(duì)第一部分162的匹配的特定代替語音信號(hào)(例如,第一代替語音信號(hào)172)。作為另一實(shí)例,所述發(fā)射參數(shù)可包含特定向量量化器表?xiàng)l目索引號(hào)以輔助第一裝置102在向量量化器表中定位特定向量量化器。
經(jīng)修改語音參數(shù)、發(fā)射參數(shù)或這兩者可輔助信號(hào)處理模塊122選擇匹配于第一部分162的代替語音信號(hào)。產(chǎn)生經(jīng)處理語音信號(hào)(例如,第一經(jīng)處理語音信號(hào)116、第二經(jīng)處理語音信號(hào)118)的效率也可增加。舉例來說,當(dāng)發(fā)射參數(shù)識(shí)別特定代替語音信號(hào)(例如,第一代替語音信號(hào)172)時(shí),信號(hào)處理模塊122可不將第一部分162與代替語音信號(hào)112中的每一者進(jìn)行比較,從而導(dǎo)致產(chǎn)生第一經(jīng)處理語音信號(hào)116的增加的效率。
在特定方面,第一裝置102的信號(hào)處理模塊122可使用詞預(yù)測(cè)算法來預(yù)測(cè)可包含第一部分162的詞。舉例來說,所述詞預(yù)測(cè)算法可基于在第一用戶語音信號(hào)130之前的詞來預(yù)測(cè)詞。為了說明,所述詞預(yù)測(cè)算法可基于與詞和先前詞相關(guān)的主語-動(dòng)詞協(xié)定、詞關(guān)系、語法規(guī)則或其組合而確定所述詞。作為另一實(shí)例,所述詞預(yù)測(cè)算法可基于先前詞中的詞的頻率而確定所述詞,其中所述詞包含對(duì)應(yīng)于第一部分162的聲音。為了說明,特定詞可以在特定對(duì)話中頻繁地重復(fù)。信號(hào)處理模塊122可基于先前詞包含詞“cat”大于閾值次數(shù)(例如,2)而預(yù)測(cè)對(duì)應(yīng)于“c”的第一部分162是詞“cat”的部分。信號(hào)處理模塊122可基于所述預(yù)測(cè)詞選擇第一代替語音信號(hào)172。舉例來說,第一代替語音信號(hào)172、代替語音信號(hào)112中的另一代替語音信號(hào)以及第一部分162可全部對(duì)應(yīng)于共同聲音(例如,“c”)。信號(hào)處理模塊122可確定第一代替語音信號(hào)172是從“catatonic”產(chǎn)生且另一代替語音信號(hào)是從“cola”產(chǎn)生。信號(hào)處理模塊122可基于確定第一代替語音信號(hào)172比另一代替語音信號(hào)更接近預(yù)測(cè)詞而選擇第一代替語音信號(hào)172而非另一代替語音信號(hào)172。
在特定方面,信號(hào)處理模塊122可確定經(jīng)處理語音信號(hào)(例如,第一經(jīng)處理語音信號(hào)116或第二經(jīng)處理語音信號(hào)118)不滿足語音信號(hào)閾值。舉例來說,信號(hào)處理模塊122可確定第一經(jīng)處理語音信號(hào)116的語音參數(shù)的變化不滿足閾值語音參數(shù)變化。為了說明,語音參數(shù)的變化可對(duì)應(yīng)于第一代替語音信號(hào)172與第一經(jīng)處理語音信號(hào)116的另一部分之間的轉(zhuǎn)變。在特定方面,信號(hào)處理模塊122可使用平滑算法修改第一經(jīng)處理語音信號(hào)116以減少語音參數(shù)的變化。在另一特定的方面中,信號(hào)處理模塊122可響應(yīng)于語音參數(shù)的變化不滿足閾值語音參數(shù)而丟棄第一經(jīng)處理語音信號(hào)116。在此方面中,信號(hào)處理模塊122可經(jīng)由揚(yáng)聲器142將第一用戶語音信號(hào)130輸出到第一用戶152。
在特定方面,第一裝置102可基于接收到用戶輸入而在輸出經(jīng)處理語音信號(hào)(例如,第一經(jīng)處理語音信號(hào)116、第二經(jīng)處理語音信號(hào)118)與用戶語音信號(hào)(例如,第一用戶語音信號(hào)130、第二用戶語音信號(hào)132)之間切換。舉例來說,第一裝置102可從第一用戶152接收指示將激活語音信號(hào)替換的第一輸入。響應(yīng)于第一輸入,第一裝置102可經(jīng)由揚(yáng)聲器142輸出第一經(jīng)處理語音信號(hào)116。作為另一實(shí)例,第一裝置102可從第一用戶152接收指示將去活語音信號(hào)替換的第二輸入。響應(yīng)于第二輸入,第一裝置102可經(jīng)由揚(yáng)聲器142輸出第一用戶語音信號(hào)130。在特定方面,信號(hào)處理模塊122可包含用戶接口以使得用戶(例如,第一用戶152)能夠管理代替語音信號(hào)112。在此方面中,第一裝置102可經(jīng)由信號(hào)處理模塊122的用戶接口接收第一輸入、第二輸入或這兩者。
在特定方面,信號(hào)處理模塊122可在話音呼叫(例如,第一用戶152與第二用戶154之間的呼叫)期間接收第一用戶語音信號(hào)130,且可在所述話音呼叫期間產(chǎn)生第一經(jīng)處理語音信號(hào)116。在另一特定的方面中,信號(hào)處理模塊122可接收第一用戶語音信號(hào)130(例如,作為來自第二用戶154的消息)且可隨后產(chǎn)生第一經(jīng)處理語音信號(hào)116且可存儲(chǔ)第一經(jīng)處理語音信號(hào)116用于稍后重放給第一用戶152。
在特定方面,信號(hào)處理模塊122可使用代替語音信號(hào)112來替換用戶語音信號(hào)(例如,第一用戶語音信號(hào)130、第二用戶語音信號(hào)132)的對(duì)應(yīng)于特定用戶(例如,第二用戶154)的一部分,而與哪一裝置(例如,桌上型計(jì)算機(jī)106、移動(dòng)裝置104)發(fā)送所述用戶語音信號(hào)無關(guān)。舉例來說,信號(hào)處理模塊122可經(jīng)由麥克風(fēng)144、桌上型計(jì)算機(jī)106和網(wǎng)絡(luò)120從第二用戶154接收第二用戶語音信號(hào)132。信號(hào)處理模塊122可通過以代替語音信號(hào)112中的第二代替語音信號(hào)174替換第二用戶語音信號(hào)132的第二部分164而產(chǎn)生第二經(jīng)處理語音信號(hào)118。
在特定方面,信號(hào)處理模塊122可基于用戶語音信號(hào)(例如,第一用戶語音信號(hào)130、第二用戶語音信號(hào)132)產(chǎn)生經(jīng)修改代替語音信號(hào)(例如,經(jīng)修改代替語音信號(hào)176)。舉例來說,第一用戶語音信號(hào)130的第一部分162和第一代替語音信號(hào)172可對(duì)應(yīng)于共同聲音且可各自對(duì)應(yīng)于由第二用戶154使用的不同音調(diào)或拐點(diǎn)。舉例來說,第一用戶語音信號(hào)130可對(duì)應(yīng)于第二用戶154的驚訝話語,而第一代替語音信號(hào)172可對(duì)應(yīng)于平靜話語。信號(hào)處理模塊122可通過基于對(duì)應(yīng)于第一用戶語音信號(hào)130的語音參數(shù)而修改第一代替語音信號(hào)172來產(chǎn)生經(jīng)修改代替語音信號(hào)176。舉例來說,信號(hào)處理模塊122可修改第一代替語音信號(hào)172的音調(diào)參數(shù)、能量參數(shù)或線性預(yù)測(cè)譯碼參數(shù)中的至少一者以產(chǎn)生經(jīng)修改代替語音信號(hào)176。信號(hào)處理模塊122可將經(jīng)修改代替語音信號(hào)176添加到第一數(shù)據(jù)庫124中的代替語音信號(hào)112。在特定方面,第一裝置102可將經(jīng)修改代替語音信號(hào)176發(fā)送到服務(wù)器,所述服務(wù)器維持與第二用戶154相關(guān)聯(lián)的代替語音信號(hào)112的副本。
因此,系統(tǒng)100可實(shí)現(xiàn)語音信號(hào)的替換。與特定用戶相關(guān)聯(lián)的用戶語音信號(hào)的一部分可被與同一用戶相關(guān)聯(lián)的較高音頻質(zhì)量代替語音信號(hào)替換。
參考圖2,揭示可操作以替換語音信號(hào)的系統(tǒng)的特定說明性方面且一般指定為200。系統(tǒng)200可包含服務(wù)器206,其經(jīng)由圖1的網(wǎng)絡(luò)120耦合到第一裝置102和移動(dòng)裝置104或與它們通信。移動(dòng)裝置104可包含圖1的信號(hào)處理模塊122。服務(wù)器206可包含語音信號(hào)管理器262和第二數(shù)據(jù)庫264。
圖2說明由第一裝置102、移動(dòng)裝置104或這兩者獲取代替語音信號(hào)112。在操作期間,第二用戶154可將訓(xùn)練語音信號(hào)(例如,訓(xùn)練語音信號(hào)272)發(fā)送到服務(wù)器206。舉例來說,第二用戶154可為新雇員且可被要求閱讀文字的腳本作為雇員導(dǎo)向的部分。第二用戶154可通過對(duì)著移動(dòng)裝置104的麥克風(fēng)244閱讀詞的腳本而發(fā)送訓(xùn)練語音信號(hào)272。舉例來說,第二用戶154可以用為了在安靜環(huán)境中閱讀所述腳本的目的而設(shè)置的聲音小室中閱讀腳本。移動(dòng)裝置104的信號(hào)處理模塊122可經(jīng)由網(wǎng)絡(luò)120將訓(xùn)練語音信號(hào)272發(fā)送到服務(wù)器206。
語音信號(hào)管理器262可從訓(xùn)練語音信號(hào)272產(chǎn)生代替語音信號(hào)112。舉例來說,訓(xùn)練語音信號(hào)272可對(duì)應(yīng)于詞(例如,“catatonic”)。語音信號(hào)管理器262可復(fù)制訓(xùn)練語音信號(hào)272的特定部分以產(chǎn)生代替語音信號(hào)112中的每一者。為了說明,語音信號(hào)管理器262可復(fù)制訓(xùn)練語音信號(hào)272以產(chǎn)生第三代替語音信號(hào)220(例如,“catatonic”)。語音信號(hào)管理器262可復(fù)制訓(xùn)練語音信號(hào)272的一部分以產(chǎn)生第四代替語音信號(hào)224(例如,“ta”)。語音信號(hào)管理器262可復(fù)制訓(xùn)練語音信號(hào)272的另一部分以產(chǎn)生第五代替語音信號(hào)222(例如,“t”)。第四代替語音信號(hào)224和第五代替語音信號(hào)222可對(duì)應(yīng)于訓(xùn)練語音信號(hào)272的重疊部分。在特定方面,可復(fù)制訓(xùn)練語音信號(hào)272的特定部分以基于所述特定部分對(duì)應(yīng)于音素、雙音素、三音素、音節(jié)、詞或其組合而產(chǎn)生代替語音信號(hào)。在特定方面,可復(fù)制訓(xùn)練語音信號(hào)272的特定部分以基于所述特定部分的大小而產(chǎn)生代替語音信號(hào)。舉例來說,語音信號(hào)管理器262可通過復(fù)制訓(xùn)練語音信號(hào)272的對(duì)應(yīng)于特定信號(hào)樣本大小(例如,100毫秒)的一部分而產(chǎn)生代替語音信號(hào)。
在特定方面,語音信號(hào)管理器262可確定對(duì)應(yīng)于特定代替語音信號(hào)的聲音的文字表示。舉例來說,第五代替語音信號(hào)222可對(duì)應(yīng)于特定聲音(例如,聲音“t”)。語音信號(hào)管理器262可基于特定聲音與對(duì)應(yīng)于所述文字表示的另一語音信號(hào)(例如,先前所產(chǎn)生的第二用戶154的代替語音信號(hào)、對(duì)應(yīng)于另一用戶的另一代替語音信號(hào)或合成語音信號(hào))的比較而確定特定聲音的文字表示(例如,字母“t”)。
語音信號(hào)管理器262可將代替語音信號(hào)112存儲(chǔ)在第二數(shù)據(jù)庫264中。舉例來說,語音信號(hào)管理器262可將代替語音信號(hào)112作為不變的語音、以壓縮格式或以另一格式存儲(chǔ)在第二數(shù)據(jù)庫264中。語音信號(hào)管理器262可將代替語音信號(hào)112的選定特征存儲(chǔ)在第二數(shù)據(jù)庫264中。語音信號(hào)管理器262可將代替語音信號(hào)112中的每一者的文字表示存儲(chǔ)在第二數(shù)據(jù)庫264中。
服務(wù)器206可將代替語音信號(hào)(例如,代替語音信號(hào)112)發(fā)送到裝置(例如,移動(dòng)裝置104、第一裝置102、桌上型計(jì)算機(jī)106)。服務(wù)器206可將代替語音信號(hào)112周期性地發(fā)送到裝置(例如,移動(dòng)裝置104、第一裝置102、桌上型計(jì)算機(jī)106)。在特定方面,服務(wù)器206可響應(yīng)于從裝置(例如,移動(dòng)裝置104、第一裝置102、桌上型計(jì)算機(jī)106)接收到請(qǐng)求而將代替語音信號(hào)112發(fā)送到裝置。在替代方面中,可周期性地或響應(yīng)于接收到請(qǐng)求而將代替語音信號(hào)112從裝置(例如,移動(dòng)裝置104、第一裝置102或桌上型計(jì)算機(jī)106)發(fā)送到另一裝置(例如,移動(dòng)裝置104、第一裝置102或桌上型計(jì)算機(jī)106)。
在特定方面,服務(wù)器206可將與第二用戶154相關(guān)聯(lián)的代替語音信號(hào)112發(fā)送到與第二用戶154相關(guān)聯(lián)的一或多個(gè)裝置(例如,移動(dòng)裝置104、桌上型計(jì)算機(jī)106)。舉例來說,第二用戶154可通過在安靜環(huán)境(例如,在家)對(duì)麥克風(fēng)244說話而將訓(xùn)練語音信號(hào)272發(fā)送到服務(wù)器206,且可在移動(dòng)裝置104處從服務(wù)器206接收代替語音信號(hào)112。與第二用戶154相關(guān)聯(lián)的代替語音信號(hào)112可由與第二用戶154相關(guān)聯(lián)的所述一或多個(gè)裝置(例如,移動(dòng)裝置104或桌上型計(jì)算機(jī)106)上的各種應(yīng)用程序使用。舉例來說,第二用戶154可隨后在有噪聲的環(huán)境(例如,在音樂會(huì))中使用移動(dòng)裝置104上的話音激活的應(yīng)用程序。移動(dòng)裝置104的信號(hào)處理模塊122可以代替語音信號(hào)112中的一者替換從第二用戶154接收的用戶語音信號(hào)的一部分以產(chǎn)生經(jīng)處理語音信號(hào),如參考圖1所描述。經(jīng)處理語音信號(hào)可由移動(dòng)裝置104上的話音激活的應(yīng)用程序使用。因此,移動(dòng)裝置104的話音激活的應(yīng)用程序可以在有噪聲的環(huán)境(例如,在有噪聲的音樂會(huì))中使用。
作為另一實(shí)例,移動(dòng)裝置104上的電子閱讀應(yīng)用程序可使用代替語音信號(hào)112來輸出音頻。所述電子閱讀應(yīng)用程序可輸出對(duì)應(yīng)于電子郵件(e-mail)、電子書(e-book)、文章、話音反饋或其任何組合的音頻。舉例來說,第二用戶154可激活電子閱讀應(yīng)用程序以閱讀電子郵件。所述電子郵件的一部分可對(duì)應(yīng)于“cat”。代替語音信號(hào)112可指示對(duì)應(yīng)于代替語音信號(hào)112中的每一者的文字表示。舉例來說,代替語音信號(hào)112可包含聲音“catatonic”、“ca”和“t”,且可指示每一聲音的文字表示。所述電子閱讀應(yīng)用程序可基于電子郵件的部分(例如,“cat”)與所述子集的文字表示(例如,“ca”和“t”)的比較而確定代替語音信號(hào)112的子集匹配于電子郵件的部分。所述電子閱讀應(yīng)用程序可輸出代替語音信號(hào)112的子集。因此,所述電子閱讀應(yīng)用程序可以類似于第二用戶154發(fā)聲的話音來閱讀電子郵件。
在特定方面,系統(tǒng)200可包含鎖定機(jī)制以停用對(duì)代替語音信號(hào)112的未授權(quán)的存取。裝置(例如,第一裝置102、移動(dòng)裝置104或桌上型計(jì)算機(jī)106)在(例如,從服務(wù)器)接收授權(quán)之前不能產(chǎn)生(或使用)代替語音信號(hào)112。所述授權(quán)可基于第一用戶152、第二用戶154或這兩者是否已經(jīng)支付特定服務(wù)。所述授權(quán)可為按使用(例如,按話音呼叫、按應(yīng)用程序激活)、按時(shí)間周期(例如,帳期、周、月等)或其組合而有效。在特定方面,所述授權(quán)可在代替語音信號(hào)112的每次更新時(shí)有效。在特定方面,所述授權(quán)可為按應(yīng)用程序有效的。舉例來說,移動(dòng)裝置104可接收在話音呼叫期間使用代替語音信號(hào)112的第一授權(quán)且接收以電子閱讀應(yīng)用程序使用代替語音信號(hào)112的另一授權(quán)。在特定方面,所述授權(quán)可基于裝置是否經(jīng)許可以產(chǎn)生(或使用)代替語音信號(hào)112。舉例來說,移動(dòng)裝置104可響應(yīng)于第二用戶154獲取許可以在移動(dòng)裝置104上使用電子閱讀應(yīng)用程序而接收在電子閱讀應(yīng)用程序中使用代替語音信號(hào)112的授權(quán)。
在特定方面,語音信號(hào)管理器262可維持經(jīng)授權(quán)存取代替語音信號(hào)112的裝置、用戶或這兩者的列表。語音信號(hào)管理器262可響應(yīng)于確定裝置未經(jīng)授權(quán)存取代替語音信號(hào)112而將鎖定請(qǐng)求發(fā)送到裝置(例如,第一裝置102、移動(dòng)裝置104、桌上型計(jì)算機(jī)106或其組合)。所述裝置可響應(yīng)于所述鎖定請(qǐng)求而刪除(或停用存取)本地存儲(chǔ)的代替語音信號(hào)112。舉例來說,語音信號(hào)管理器262可將鎖定請(qǐng)求發(fā)送到先前經(jīng)授權(quán)存取代替語音信號(hào)112的裝置(例如,第一裝置102、移動(dòng)裝置104或桌上型計(jì)算機(jī)106)。
在特定方面,信號(hào)處理模塊122可在代替語音信號(hào)112的每一存取之前確定對(duì)應(yīng)裝置(例如,第一裝置102)的授權(quán)狀態(tài)。舉例來說,信號(hào)處理模塊122可將授權(quán)狀態(tài)請(qǐng)求發(fā)送到服務(wù)器206且可從服務(wù)器206接收授權(quán)狀態(tài)。信號(hào)處理模塊122可響應(yīng)于確定第一裝置102未經(jīng)授權(quán)而制止存取代替語音信號(hào)112。在特定方面,信號(hào)處理模塊122可刪除(或停用存取)代替語音信號(hào)112。舉例來說,信號(hào)處理模塊122可刪除代替語音信號(hào)112或停用特定應(yīng)用程序?qū)Υ嬲Z音信號(hào)112的存取。
在特定方面,信號(hào)處理模塊122可響應(yīng)于經(jīng)由信號(hào)處理模塊122的用戶接口接收的第一用戶輸入而刪除代替語音信號(hào)112。在特定方面,信號(hào)處理模塊122可響應(yīng)于經(jīng)由信號(hào)處理模塊122的用戶接口接收的第二用戶輸入而將刪除請(qǐng)求發(fā)送到服務(wù)器206。響應(yīng)于刪除請(qǐng)求,語音信號(hào)管理器262可刪除(或停用存取)代替語音信號(hào)112。在特定方面,語音信號(hào)管理器262可響應(yīng)于確定從與對(duì)應(yīng)于代替語音信號(hào)112的用戶(例如,第二用戶154)相關(guān)聯(lián)的裝置(例如,移動(dòng)裝置104或桌上型計(jì)算機(jī)106)接收到刪除請(qǐng)求而刪除(或停用存取)代替語音信號(hào)112。
在特定方面,移動(dòng)裝置104可包含語音信號(hào)管理器262。移動(dòng)裝置104可接收訓(xùn)練語音信號(hào)272且移動(dòng)裝置104上的語音信號(hào)管理器262可產(chǎn)生代替語音信號(hào)112。語音信號(hào)管理器262可在移動(dòng)裝置104上存儲(chǔ)代替語音信號(hào)112。在此方面,移動(dòng)裝置104可將代替語音信號(hào)112發(fā)送到服務(wù)器206。
在特定方面,服務(wù)器206可將與第二用戶154相關(guān)聯(lián)的代替語音信號(hào)112發(fā)送到與不同于第二用戶154的用戶(例如,第一用戶152)相關(guān)聯(lián)的一或多個(gè)裝置(例如,第一裝置102)。舉例來說,服務(wù)器206可基于指示在特定時(shí)間周期中滿足閾值呼叫頻率的呼叫頻率的呼叫簡(jiǎn)檔(例如,第一呼叫簡(jiǎn)檔270、第二呼叫簡(jiǎn)檔274)而將代替語音信號(hào)112發(fā)送到第一裝置102。第一呼叫簡(jiǎn)檔270可與第一用戶152、第一裝置102或這兩者相關(guān)聯(lián)。第二呼叫簡(jiǎn)檔274可與第二用戶154、移動(dòng)裝置104或這兩者相關(guān)聯(lián)。呼叫頻率可指示第一用戶152、第一裝置102或這兩者與第二用戶154、移動(dòng)裝置104或這兩者之間的呼叫頻率。為了說明,服務(wù)器206可基于第一呼叫簡(jiǎn)檔270指示第一用戶152與第二用戶154之間的呼叫頻率滿足閾值呼叫頻率(例如,前一周中的3次)將代替語音信號(hào)112發(fā)送到第一裝置102。在特定方面,服務(wù)器206可在話音呼叫之前將代替語音信號(hào)112發(fā)送到第一裝置102。舉例來說,服務(wù)器206可基于呼叫簡(jiǎn)檔(例如,第一呼叫簡(jiǎn)檔270或第二呼叫簡(jiǎn)檔274)在話音呼叫之前將代替語音信號(hào)112發(fā)送到第一裝置102。
作為另一實(shí)例,服務(wù)器206可基于指示特定用戶(例如,第一用戶152、第二用戶154)、特定裝置(例如,第一裝置102、移動(dòng)裝置104)或其組合的聯(lián)系人列表(例如,第一聯(lián)系人列表276、第二聯(lián)系人列表278)將代替語音信號(hào)112發(fā)送到第一裝置102。舉例來說,服務(wù)器206可基于指示特定用戶的第二聯(lián)系人列表278將與第二用戶154相關(guān)聯(lián)的代替語音信號(hào)112發(fā)送到與特定用戶(例如,第一用戶152)相關(guān)聯(lián)的一或多個(gè)裝置(例如,第一裝置102)。在特定方面,服務(wù)器206可在話音呼叫之前將代替語音信號(hào)112發(fā)送到第一裝置102。舉例來說,服務(wù)器206可基于聯(lián)系人列表(例如,第一聯(lián)系人列表276、第二聯(lián)系人列表278)在話音呼叫之前將代替語音信號(hào)112發(fā)送到第一裝置102。服務(wù)器206可響應(yīng)于接收到訓(xùn)練語音信號(hào)272將代替語音信號(hào)112發(fā)送到第一裝置102。
在特定方面,服務(wù)器206可響應(yīng)于從第一裝置102接收到對(duì)代替語音信號(hào)112的請(qǐng)求、響應(yīng)于從移動(dòng)裝置104接收到將代替語音信號(hào)112發(fā)送到第一裝置102的請(qǐng)求或這兩者而發(fā)送代替語音信號(hào)112。舉例來說,第一裝置102可響應(yīng)于經(jīng)由第一裝置102的信號(hào)處理模塊122的用戶接口接收的用戶輸入而發(fā)送對(duì)代替語音信號(hào)112的請(qǐng)求。作為另一實(shí)例,移動(dòng)裝置104可響應(yīng)于經(jīng)由移動(dòng)裝置104的信號(hào)處理模塊122的用戶接口接收的用戶輸入而發(fā)送發(fā)送代替語音信號(hào)112的請(qǐng)求。在特定方面,服務(wù)器206可響應(yīng)于接收到與第一聯(lián)系人列表276、第二聯(lián)系人列表278或這兩者相關(guān)的聯(lián)系人列表更新通知而將代替語音信號(hào)112發(fā)送到第一裝置102。服務(wù)器可從第一裝置102接收與第一聯(lián)系人列表276相關(guān)的聯(lián)系人列表更新通知,且服務(wù)器206可從移動(dòng)裝置104接收與第二聯(lián)系人列表278相關(guān)的聯(lián)系人列表更新通知。舉例來說,服務(wù)器206可從對(duì)應(yīng)裝置的信號(hào)處理模塊122接收聯(lián)系人列表更新通知。
在特定方面,服務(wù)器206可響應(yīng)于接收到與第一呼叫簡(jiǎn)檔270、第二呼叫簡(jiǎn)檔274或這兩者相關(guān)的呼叫簡(jiǎn)檔更新通知而將代替語音信號(hào)112發(fā)送到第一裝置102。服務(wù)器206可從第一裝置102接收與第一呼叫簡(jiǎn)檔270相關(guān)的呼叫簡(jiǎn)檔更新通知,且服務(wù)器206可從移動(dòng)裝置104接收與第二呼叫簡(jiǎn)檔274相關(guān)的呼叫簡(jiǎn)檔更新通知。舉例來說,服務(wù)器206可從對(duì)應(yīng)裝置的信號(hào)處理模塊122接收呼叫簡(jiǎn)檔更新通知。
作為另一個(gè)實(shí)例,服務(wù)器206可響應(yīng)于關(guān)于與第二用戶154相關(guān)聯(lián)的裝置(例如,移動(dòng)裝置104、桌上型計(jì)算機(jī)106)與第一裝置102之間的話音呼叫的呼叫起始通知而將與第二用戶154相關(guān)聯(lián)的代替語音信號(hào)112發(fā)送到第一裝置102。舉例來說,服務(wù)器206可當(dāng)從移動(dòng)裝置104發(fā)出話音呼叫時(shí)從移動(dòng)裝置104接收呼叫起始通知。在特定方面,移動(dòng)裝置104的信號(hào)處理模塊122可將呼叫起始通知發(fā)送到服務(wù)器206。服務(wù)器206可在話音呼叫的開始、在話音呼叫期間或這兩者時(shí)發(fā)送代替語音信號(hào)112的至少一個(gè)子集。舉例來說,服務(wù)器206可響應(yīng)于接收到呼叫起始通知而開始發(fā)送代替語音信號(hào)112。代替語音信號(hào)112的第一子集可由服務(wù)器206在話音呼叫的開始發(fā)送。代替語音信號(hào)112的第二子集可由服務(wù)器206在話音呼叫期間發(fā)送。
在特定方面,語音信號(hào)管理器262可包含使系統(tǒng)管理員能夠執(zhí)行診斷的用戶接口。舉例來說,用戶接口可顯示包含與代替語音信號(hào)112相關(guān)聯(lián)的上載和下載頻率的使用簡(jiǎn)檔。所述使用簡(jiǎn)檔還可包含每裝置(例如,第一裝置102、移動(dòng)裝置104和/或桌上型計(jì)算機(jī)106)的上載和下載頻率。
因此,系統(tǒng)200可通過圖1的系統(tǒng)100實(shí)現(xiàn)可用以替換語音信號(hào)的代替語音信號(hào)的獲取。
參考圖3,揭示用戶接口的說明性方面且一般指定為300。在特定方面,用戶接口300可由圖1的系統(tǒng)100、圖2的系統(tǒng)200或這兩者顯示。
在操作期間,裝置(例如,第一裝置102)的信號(hào)處理模塊122可具有對(duì)用戶(例如,第一用戶152)的聯(lián)系人列表的存取。信號(hào)處理模塊122可提供到第一裝置102的顯示器的用戶接口300。舉例來說,信號(hào)處理模塊122可響應(yīng)于接收到來自第一用戶152的請(qǐng)求而提供到第一裝置102的顯示器的用戶接口300。
用戶接口300的水平軸線(例如,x軸)可顯示來自聯(lián)系人列表的一或多個(gè)用戶的識(shí)別符(例如,姓名)(例如,“拜奇·柯蒂斯”、“布雷特·迪恩”、“亨利·洛佩斯”、“薩布瑞納·桑德斯”和“藍(lán)道爾·休斯”)。在特定方面,第一用戶152可從聯(lián)系人列表選擇所述一或多個(gè)用戶且用戶接口300可包含沿著水平軸線的選定用戶的姓名。在另一方面,信號(hào)處理模塊122可從聯(lián)系人列表自動(dòng)選擇用戶子集。舉例來說,所述用戶子集可為如下情況的特定數(shù)目(例如,5個(gè))用戶:第一用戶152與其最頻繁地通信,第一用戶152與其最近通信,第一用戶152與其在特定時(shí)間間隔中通信最長(zhǎng)持續(xù)時(shí)間(例如,電話呼叫持續(xù)時(shí)間的總和),或其組合。
用戶接口300可沿著垂直軸線(例如,y軸)指示持續(xù)時(shí)間。所述持續(xù)時(shí)間可與對(duì)應(yīng)于所述一或多個(gè)用戶的語音信號(hào)相關(guān)聯(lián)。舉例來說,用戶接口300可包含對(duì)應(yīng)于第二用戶154(例如,“藍(lán)道爾·休斯”的第一條302。第一條302可指示與第二用戶154相關(guān)聯(lián)的一或多個(gè)語音信號(hào)的回放持續(xù)時(shí)間。舉例來說,第一條302可指示訓(xùn)練語音信號(hào)272的回放持續(xù)時(shí)間。在特定方面,第一條302可指示在特定時(shí)間間隔(例如,特定日、特定周或特定月)中俘獲的與第二用戶154相關(guān)聯(lián)的語音信號(hào)的回放持續(xù)時(shí)間。
在特定方面,用戶接口300可指示在相異時(shí)間間隔中俘獲的特定用戶的語音信號(hào)的持續(xù)時(shí)間。舉例來說,第一條302可指示在第一時(shí)間間隔(例如,前一周)中俘獲的第二用戶154的語音信號(hào)的第一持續(xù)時(shí)間,且與另一用戶(例如,“薩布瑞納·桑德斯”)相關(guān)聯(lián)的第二條314可指示在第二時(shí)間間隔(例如,前一月)中俘獲的另一用戶的語音信號(hào)的第二持續(xù)時(shí)間。舉例來說,第一用戶152可能在一周以前已下載與第二用戶154相關(guān)聯(lián)的代替語音信號(hào),且第一條302可指示在所述下載之后俘獲的第二用戶154的語音信號(hào)的第一持續(xù)時(shí)間。作為另一實(shí)例,第一用戶152可能在一個(gè)月以前已下載與另一用戶A相關(guān)聯(lián)的代替語音信號(hào),且第二條314可指示在所述下載之后俘獲的與另一用戶(例如,“薩布瑞納·桑德斯”)的語音信號(hào)相關(guān)聯(lián)的第二持續(xù)時(shí)間。
第一用戶152可使用光標(biāo)306選擇第二用戶154的姓名(例如,“藍(lán)道爾·休斯”)或第一條302。用戶接口300可響應(yīng)于接收到所述選擇而顯示添加選項(xiàng)308、刪除選項(xiàng)310或這兩者。第一用戶152可選擇刪除選項(xiàng)310。舉例來說,第一用戶152可確定將不產(chǎn)生與第二用戶154相關(guān)聯(lián)的額外代替語音信號(hào)。為了說明,第一用戶152可確定存在與第二用戶154相關(guān)聯(lián)的代替語音信號(hào)的足夠集合,第一用戶152可能不期望在近期與第二用戶154通信,第一用戶152可能想要節(jié)省資源(例如,存儲(chǔ)器或處理循環(huán)),或其組合。響應(yīng)于接收到刪除選項(xiàng)310的選擇,信號(hào)處理模塊122可移除與第二用戶154相關(guān)聯(lián)的一或多個(gè)語音信號(hào),可從用戶接口300移除與第二用戶154的語音信號(hào)相關(guān)聯(lián)的第一持續(xù)時(shí)間的指示,或這兩者。
在特定方面,與第二用戶154相關(guān)聯(lián)的語音信號(hào)可存儲(chǔ)在第一裝置102可存取的存儲(chǔ)器中,且信號(hào)處理模塊122可響應(yīng)于接收到刪除選項(xiàng)310的選擇而移除與第二用戶154相關(guān)聯(lián)的一或多個(gè)語音信號(hào)。在特定方面,與第二用戶154相關(guān)聯(lián)的所述一或多個(gè)語音信號(hào)可存儲(chǔ)在服務(wù)器(例如,圖2的服務(wù)器206)可存取的存儲(chǔ)器中。信號(hào)處理模塊122可響應(yīng)于接收到刪除選項(xiàng)310的選擇而將刪除請(qǐng)求發(fā)送到服務(wù)器206。響應(yīng)于接收到刪除請(qǐng)求,服務(wù)器206可移除與第二用戶154相關(guān)聯(lián)的語音信號(hào),可使第一裝置102不可存取與第二用戶154相關(guān)聯(lián)的語音信號(hào),可使第一用戶152不可存取與第二用戶154相關(guān)聯(lián)的語音信號(hào),或其組合。舉例來說,第一用戶152可選擇刪除選項(xiàng)310以使第一裝置102不可存取與第二用戶154相關(guān)聯(lián)的語音信號(hào)。在此實(shí)例中,第一用戶152可能想要與第二用戶154相關(guān)聯(lián)的所述一或多個(gè)語音信號(hào)保持對(duì)其它裝置可存取。
替代地,第一用戶152可選擇添加選項(xiàng)308。響應(yīng)于接收到添加選項(xiàng)308的選擇,信號(hào)處理模塊122可請(qǐng)求圖2的語音信號(hào)管理器262提供從與第二用戶154相關(guān)聯(lián)的語音信號(hào)產(chǎn)生的代替語音信號(hào)(例如,代替語音信號(hào)112)。語音信號(hào)管理器262可使用與第二用戶154相關(guān)聯(lián)的語音信號(hào)產(chǎn)生代替語音信號(hào)112,如參考圖2所描述。語音信號(hào)管理器262可響應(yīng)于從信號(hào)處理模塊122接收到請(qǐng)求而將代替語音信號(hào)112提供到信號(hào)處理模塊122。
在特定方面,信號(hào)處理模塊122可在接收到刪除選項(xiàng)310的選擇之后、在接收到添加選項(xiàng)308的選擇之后或在從語音信號(hào)管理器262接收到代替語音信號(hào)112之后復(fù)位第一條302(例如,到零)。第一條302可指示與在與第二用戶154相關(guān)聯(lián)的語音信號(hào)的先前刪除之后或在與第二用戶154相關(guān)聯(lián)的其它代替語音信號(hào)的先前下載(或產(chǎn)生)之后俘獲的第二用戶154的語音信號(hào)相關(guān)聯(lián)的第一持續(xù)時(shí)間。
在特定方面,信號(hào)處理模塊122可響應(yīng)于確定對(duì)應(yīng)于特定用戶(例如,“布雷特·迪恩”)的語音信號(hào)的持續(xù)時(shí)間(例如,由第三條316指示)滿足自動(dòng)更新閾值312(例如,1小時(shí))而將對(duì)代替語音信號(hào)的請(qǐng)求自動(dòng)發(fā)送到語音信號(hào)管理器262。
在特定方面,信號(hào)處理模塊122可周期性地(例如,一周一次)請(qǐng)求對(duì)應(yīng)于與第二用戶154相關(guān)聯(lián)的語音信號(hào)的代替語音信號(hào)112。在另一方面,語音信號(hào)管理器262可將代替語音信號(hào)112周期性地發(fā)送到第一裝置102。在特定方面,用戶接口300可除周期性更新之外還使得第一用戶152能夠下載代替語音信號(hào)112。
在特定方面,與第二用戶154相關(guān)聯(lián)的語音信號(hào)可由與第二用戶154相關(guān)聯(lián)的裝置(例如,移動(dòng)裝置104)處的信號(hào)處理模塊122、由與第一用戶152相關(guān)聯(lián)的裝置(例如,第一裝置102)、由服務(wù)器(例如,圖2的服務(wù)器206)或其組合俘獲。舉例來說,第一裝置102(或移動(dòng)裝置104)處的信號(hào)處理模塊122可記錄在第二用戶154與第一用戶152之間的電話呼叫期間的語音信號(hào)。作為另一實(shí)例,所述語音信號(hào)可對(duì)應(yīng)于存儲(chǔ)在服務(wù)器206處的來自第二用戶154的音頻消息。在特定方面,移動(dòng)裝置104、第一裝置102或這兩者可將與第二用戶154相關(guān)聯(lián)的語音信號(hào)提供到服務(wù)器206。在特定方面,用戶接口300可使用文字表示、圖形表示(例如,條形圖、餅圖或這兩者)或這兩者來指示持續(xù)時(shí)間。
用戶接口300可因此使得第一用戶152能夠監(jiān)視與用戶相關(guān)聯(lián)的語音信號(hào)的可用性以用于代替語音信號(hào)產(chǎn)生。用戶接口300可使得第一用戶152能夠在產(chǎn)生代替語音信號(hào)與保存資源(例如,存儲(chǔ)器、處理循環(huán)或這兩者)之間進(jìn)行選擇。
參考圖4,揭示可操作以執(zhí)行語音信號(hào)的“預(yù)編碼”替換的系統(tǒng)的說明性方面且一般指定為400。系統(tǒng)400可包含經(jīng)由網(wǎng)絡(luò)120與第一裝置102通信的移動(dòng)裝置104。移動(dòng)裝置104可包含耦合到編碼器426或與其通信的信號(hào)處理模塊422。移動(dòng)裝置104可包含數(shù)據(jù)庫分析器410。移動(dòng)裝置104可包含第一數(shù)據(jù)庫124、參數(shù)化數(shù)據(jù)庫424或這兩者。
圖4說明在將所替換語音信號(hào)提供到編碼器(例如,編碼器426)之前的語音信號(hào)的替換。在操作期間,移動(dòng)裝置104可經(jīng)由麥克風(fēng)146從第二用戶154接收第一用戶語音信號(hào)130。第一數(shù)據(jù)庫124(例如,“原始”數(shù)據(jù)庫)可包含代替語音信號(hào)112。代替語音信號(hào)112可包含第一代替語音信號(hào)172、第二代替語音信號(hào)174和N個(gè)代替語音信號(hào)478。可如參考圖2所描述產(chǎn)生代替語音信號(hào)112中的每一者。
參數(shù)化數(shù)據(jù)庫424可包含與代替語音信號(hào)112相關(guān)聯(lián)的語音參數(shù)的集合。舉例來說,參數(shù)化數(shù)據(jù)庫424可包含第一代替語音信號(hào)172的第一語音參數(shù)472、第二代替語音信號(hào)174的第二語音參數(shù)474,以及N個(gè)代替語音信號(hào)478的N個(gè)語音參數(shù)476。語音參數(shù)472、474和476可比代替語音信號(hào)112占據(jù)更少的存儲(chǔ)空間,因此參數(shù)化數(shù)據(jù)庫424可小于第一數(shù)據(jù)庫124。
在特定方面,參數(shù)化數(shù)據(jù)庫424可包含與語音參數(shù)472、474和476中的每一者相關(guān)聯(lián)的到第一數(shù)據(jù)庫124中的對(duì)應(yīng)代替語音信號(hào)的位置的特定參考(例如,索引、數(shù)據(jù)庫地址、數(shù)據(jù)庫指針、存儲(chǔ)器地址、統(tǒng)一資源定位符(URL)、統(tǒng)一資源識(shí)別符(URI)或其組合)。舉例來說,參數(shù)化數(shù)據(jù)庫424可包含到第一數(shù)據(jù)庫124中的第一代替語音信號(hào)172的第一位置的與第一語音參數(shù)472相關(guān)聯(lián)的第一參考。信號(hào)處理模塊422可使用特定參考來存取與特定語音參數(shù)相關(guān)聯(lián)的對(duì)應(yīng)代替語音信號(hào)。舉例來說,信號(hào)處理模塊422可使用第一參考來存取與第一語音參數(shù)472相關(guān)聯(lián)的第一代替語音信號(hào)172。
在特定方面,第一數(shù)據(jù)庫124可包含到參數(shù)化數(shù)據(jù)庫424中的對(duì)應(yīng)語音參數(shù)的位置的與代替語音信號(hào)112中的每一者相關(guān)聯(lián)的特定參考(例如,索引、數(shù)據(jù)庫地址、數(shù)據(jù)庫指針、存儲(chǔ)器地址、統(tǒng)一資源定位符(URL)、統(tǒng)一資源識(shí)別符(URI)或其組合)。舉例來說,第一數(shù)據(jù)庫124可包含到參數(shù)化數(shù)據(jù)庫424中的第一語音參數(shù)472的第一位置的與第一代替語音信號(hào)172相關(guān)聯(lián)的第一參考。信號(hào)處理模塊422可使用特定參考來存取與特定代替語音信號(hào)相關(guān)聯(lián)的對(duì)應(yīng)語音參數(shù)。舉例來說,信號(hào)處理模塊422可使用第一參考來存取第一代替語音信號(hào)172的第一語音參數(shù)472。
在特定方面,數(shù)據(jù)庫分析器410可響應(yīng)于移動(dòng)裝置104接收到第一用戶語音信號(hào)130而確定參數(shù)化數(shù)據(jù)庫424是否是最新的。舉例來說,數(shù)據(jù)庫分析器410可確定參數(shù)化數(shù)據(jù)庫424是否包含與代替語音信號(hào)112相關(guān)聯(lián)的語音參數(shù)(例如,語音參數(shù)472、474和476)。為了說明,數(shù)據(jù)庫分析器410可確定參數(shù)化數(shù)據(jù)庫424是否包含對(duì)應(yīng)于代替語音信號(hào)112的一或多個(gè)代替語音信號(hào)的語音參數(shù)。響應(yīng)于確定參數(shù)化數(shù)據(jù)庫424包含與代替語音信號(hào)112相關(guān)聯(lián)的語音參數(shù),數(shù)據(jù)庫分析器410可確定在參數(shù)化數(shù)據(jù)庫424的先前更新之后是否對(duì)第一數(shù)據(jù)庫124做出了任何修改。為了說明,數(shù)據(jù)庫分析器410可確定第一數(shù)據(jù)庫124的修改時(shí)戳是否在參數(shù)化數(shù)據(jù)庫424的更新時(shí)戳之后。響應(yīng)于確定在參數(shù)化數(shù)據(jù)庫424的先前更新之后未對(duì)第一數(shù)據(jù)庫124做出修改,數(shù)據(jù)庫分析器410可確定參數(shù)化數(shù)據(jù)庫424是最新的。
響應(yīng)于確定參數(shù)化數(shù)據(jù)庫424不包含與代替語音信號(hào)112相關(guān)聯(lián)的語音參數(shù),或在參數(shù)化數(shù)據(jù)庫424的先前更新之后對(duì)第一數(shù)據(jù)庫124做出了修改,數(shù)據(jù)庫分析器410可產(chǎn)生對(duì)應(yīng)于代替語音信號(hào)112的語音參數(shù)。舉例來說,數(shù)據(jù)庫分析器410可從第一代替語音信號(hào)172產(chǎn)生第一語音參數(shù)472,從第二代替語音信號(hào)174產(chǎn)生第二語音參數(shù)474,且從N個(gè)代替語音信號(hào)478產(chǎn)生N個(gè)語音參數(shù)476。第一語音參數(shù)472、第二語音參數(shù)474和N個(gè)語音參數(shù)476可分別包含第一代替語音信號(hào)172、第二代替語音信號(hào)174和N個(gè)代替語音信號(hào)478的音調(diào)參數(shù)、能量參數(shù)、線性預(yù)測(cè)譯碼(LPC)參數(shù)或其任何組合。
信號(hào)處理模塊422可包含分析器402、搜索器404、約束分析器406和合成器408。分析器402可基于第一用戶語音信號(hào)130產(chǎn)生搜索準(zhǔn)則418。搜索準(zhǔn)則418可包含與第一用戶語音信號(hào)130相關(guān)聯(lián)的多個(gè)語音參數(shù)。舉例來說,所述多個(gè)語音參數(shù)可包含第一用戶語音信號(hào)130的音調(diào)參數(shù)、能量參數(shù)、線性預(yù)測(cè)譯碼(LPC)參數(shù)或其任何組合。分析器402可將搜索準(zhǔn)則418提供到搜索器404。
搜索器404可通過基于搜索準(zhǔn)則418搜索參數(shù)化數(shù)據(jù)庫424而產(chǎn)生搜索結(jié)果414。舉例來說,搜索器404可將所述多個(gè)語音參數(shù)與語音參數(shù)472、474和476中的每一者進(jìn)行比較。搜索器404可確定第一語音參數(shù)472和第二語音參數(shù)474匹配于所述多個(gè)語音參數(shù)。舉例來說,搜索器404可基于所述比較而選擇(或識(shí)別)第一語音參數(shù)472和第二語音參數(shù)474。為了說明,第一用戶語音信號(hào)130可對(duì)應(yīng)于“bat”。第一代替語音信號(hào)172可對(duì)應(yīng)于從“cat”產(chǎn)生的“a”,如參考圖2所描述。第二代替語音信號(hào)174可對(duì)應(yīng)于從“tag”產(chǎn)生的“a”,如參考圖2所描述。
在特定方面,搜索器404可基于與語音參數(shù)472、474和476中的每一者相關(guān)聯(lián)的相似性量度而產(chǎn)生搜索結(jié)果414。特定相似性量度可指示相關(guān)對(duì)應(yīng)語音參數(shù)同與第一用戶語音信號(hào)130相關(guān)聯(lián)的所述多個(gè)語音參數(shù)的接近程度。舉例來說,搜索器404可通過計(jì)算第一用戶語音信號(hào)130的所述多個(gè)語音參數(shù)與第一語音參數(shù)472之間的差而確定第一語音參數(shù)472的第一相似性量度。
搜索器404可選擇具有滿足相似性閾值的相似性量度的語音參數(shù)。舉例來說,搜索器404可響應(yīng)于確定第二語音參數(shù)474的第一相似性量度和第二相似性量度滿足(例如,低于)相似性閾值而選擇第一語音參數(shù)472和第二語音參數(shù)474。
作為另一實(shí)例,搜索器404可基于相似性量度而選擇最類似于第一用戶語音信號(hào)130的所述多個(gè)語音參數(shù)的特定數(shù)目(例如,2)個(gè)語音參數(shù)。搜索器404可在搜索結(jié)果414中包含選定語音參數(shù)(例如,第一語音參數(shù)472和第二語音參數(shù)474)。在特定方面,搜索器404可在搜索結(jié)果414中包含對(duì)應(yīng)于選定多個(gè)語音參數(shù)的代替語音信號(hào)。舉例來說,搜索器404可在搜索結(jié)果414中包含第一代替語音信號(hào)172和第二代替語音信號(hào)174。搜索器404可將搜索結(jié)果414提供到約束分析器406。
約束分析器406可基于約束從搜索結(jié)果414選擇特定搜索結(jié)果(例如,選定結(jié)果416)。所述約束可包含誤差約束、成本約束或這兩者。舉例來說,約束分析器406可基于誤差約束或成本約束從搜索結(jié)果414選擇第一語音參數(shù)472(或第一代替語音信號(hào)172)。為了說明,約束分析器406可基于搜索結(jié)果414中的每一者產(chǎn)生經(jīng)處理語音信號(hào)。經(jīng)處理語音信號(hào)中的每一者可表示具有被對(duì)應(yīng)搜索結(jié)果替換的部分的第一用戶語音信號(hào)130。約束分析器406可識(shí)別具有經(jīng)處理語音信號(hào)的最低誤差的特定經(jīng)處理語音信號(hào)。舉例來說,約束分析器406可基于經(jīng)處理語音信號(hào)與第一用戶語音信號(hào)130的比較而確定與經(jīng)處理語音信號(hào)中的每一者相關(guān)聯(lián)的誤差量度。在特定方面,約束分析器406可識(shí)別具有最低成本的特定經(jīng)處理語音信號(hào)。舉例來說,約束分析器406可基于檢索與對(duì)應(yīng)搜索結(jié)果相關(guān)聯(lián)的代替語音信號(hào)、一或多個(gè)先前代替語音信號(hào)、一或多個(gè)后續(xù)代替語音信號(hào)或其組合的成本而確定與經(jīng)處理語音信號(hào)中的每一者相關(guān)聯(lián)的成本量度。為了說明,可基于對(duì)應(yīng)于所述多個(gè)代替信號(hào)的存儲(chǔ)器位置之間的差而確定檢索多個(gè)代替信號(hào)的成本。舉例來說,較低成本可與檢索在存儲(chǔ)器中更接近于先前檢索的代替語音信號(hào)定位的后續(xù)代替語音信號(hào)相關(guān)聯(lián)。約束分析器406可選擇對(duì)應(yīng)于特定經(jīng)處理語音信號(hào)的搜索結(jié)果作為選定結(jié)果416。
合成器408可基于選定結(jié)果416產(chǎn)生第一經(jīng)處理語音信號(hào)116。舉例來說,如果選定結(jié)果416與第一代替語音信號(hào)172相關(guān)聯(lián),那么合成器408可通過以第一代替語音信號(hào)172替換第一用戶語音信號(hào)130的至少一部分而產(chǎn)生第一經(jīng)處理語音信號(hào)116。在特定方面,合成器408可基于第一語音參數(shù)472而產(chǎn)生(例如,合成)替換語音信號(hào),且可通過以替換語音信號(hào)替換第一用戶語音信號(hào)130的至少一部分而產(chǎn)生第一經(jīng)處理語音信號(hào)116。
合成器408可將第一經(jīng)處理語音信號(hào)116提供到編碼器426。編碼器426可通過對(duì)第一經(jīng)處理語音信號(hào)116進(jìn)行編碼而產(chǎn)生輸出信號(hào)430。在特定方面,輸出信號(hào)430可指示第一代替語音信號(hào)172。舉例來說,輸出信號(hào)430可包含對(duì)第一數(shù)據(jù)庫124中的第一代替語音信號(hào)172的參考、對(duì)參數(shù)化數(shù)據(jù)庫424中的第一語音參數(shù)472的參考,或這兩者。移動(dòng)裝置104可經(jīng)由網(wǎng)絡(luò)120將輸出信號(hào)430發(fā)送到第一裝置102。
系統(tǒng)400可因此實(shí)現(xiàn)在對(duì)用戶語音信號(hào)進(jìn)行編碼之前以代替語音信號(hào)對(duì)用戶語音信號(hào)的一部分的“預(yù)編碼”替換。代替語音信號(hào)可具有比用戶語音信號(hào)的所替換部分更高的音頻質(zhì)量。舉例來說,第二用戶154可在有噪聲的環(huán)境(例如,在音樂會(huì)或繁忙的街道)在移動(dòng)裝置104上說話。代替語音信號(hào)可從第二用戶154在安靜環(huán)境中提供的訓(xùn)練信號(hào)而產(chǎn)生,如參考圖2所描述。信號(hào)處理模塊422可將比原始用戶語音信號(hào)更高質(zhì)量的音頻提供到編碼器。編碼器可對(duì)所述較高質(zhì)量音頻進(jìn)行編碼且可將經(jīng)編碼的信號(hào)發(fā)射到另一裝置。
參看圖5,揭示可操作以執(zhí)行語音信號(hào)的“編碼中”替換的系統(tǒng)的說明性方面且一般指定為500。系統(tǒng)500可包含編碼器526、數(shù)據(jù)庫分析器410、第一數(shù)據(jù)庫124、參數(shù)化數(shù)據(jù)庫424或其組合。
圖5說明在編碼器(例如,編碼器526)處的語音信號(hào)的替換。鑒于圖4的方面說明耦合到編碼器426的信號(hào)處理模塊422,編碼器526包含信號(hào)處理模塊422的一或多個(gè)組件。在操作期間,移動(dòng)裝置104可接收第一用戶語音信號(hào)130。在編碼器526內(nèi),分析器402可產(chǎn)生搜索準(zhǔn)則418,搜索器404可產(chǎn)生搜索結(jié)果414,約束分析器406可產(chǎn)生選定結(jié)果416,且合成器408可產(chǎn)生第一經(jīng)處理語音信號(hào)116,如參考圖4所描述。編碼器526可通過對(duì)第一經(jīng)處理語音信號(hào)116進(jìn)行編碼而產(chǎn)生輸出信號(hào)430。移動(dòng)裝置104可經(jīng)由網(wǎng)絡(luò)120將輸出信號(hào)430發(fā)送到第一裝置102。
在特定方面,約束分析器406可產(chǎn)生對(duì)應(yīng)于選定結(jié)果416的第一經(jīng)處理信號(hào),如參考圖4所描述。編碼器526可通過對(duì)第一經(jīng)處理信號(hào)進(jìn)行編碼而產(chǎn)生輸出信號(hào)430。在此方面中,信號(hào)處理模塊422可制止產(chǎn)生第一經(jīng)處理語音信號(hào)116。在特定方面,輸出信號(hào)430可指示第一代替語音信號(hào)172,如參考圖4所描述。
系統(tǒng)500可因此通過執(zhí)行以代替語音信號(hào)對(duì)與用戶相關(guān)聯(lián)的用戶語音信號(hào)的一部分的“編碼中”替換而實(shí)現(xiàn)在編碼器處的經(jīng)處理語音信號(hào)的產(chǎn)生。經(jīng)處理語音信號(hào)可具有比用戶語音信號(hào)更高的音頻質(zhì)量。舉例來說,第二用戶154可在有噪聲的環(huán)境(例如,在音樂會(huì)或繁忙的街道)在移動(dòng)裝置104上說話。代替語音信號(hào)可從第二用戶154在安靜環(huán)境中提供的訓(xùn)練信號(hào)而產(chǎn)生,如參考圖2所描述。編碼器可對(duì)比原始用戶語音信號(hào)更高質(zhì)量的音頻進(jìn)行編碼且可將經(jīng)編碼的信號(hào)發(fā)射到另一裝置。在特定方面,用戶語音信號(hào)的所述部分的編碼中替換可減少與從用戶語音信號(hào)產(chǎn)生經(jīng)編碼語音信號(hào)相關(guān)聯(lián)的步驟,從而得到與用戶語音信號(hào)的所述部分的預(yù)編碼替換相比更快且更高效的信號(hào)處理。
鑒于圖4到5的方面說明編碼器系統(tǒng)中的語音信號(hào)的替換,圖6和7的方面說明解碼器系統(tǒng)中的語音信號(hào)的替換。在特定方面,語音信號(hào)替換可在編碼器系統(tǒng)的本地解碼器處發(fā)生。舉例來說,第一經(jīng)處理語音信號(hào)可由所述本地解碼器產(chǎn)生以基于所述第一經(jīng)處理語音信號(hào)與用戶語音信號(hào)(例如,第一用戶語音信號(hào)130)的比較而確定信號(hào)參數(shù)。為了說明,所述本地解碼器可模仿在另一裝置處的解碼器的行為。編碼器系統(tǒng)可對(duì)信號(hào)參數(shù)進(jìn)行編碼以發(fā)射到另一裝置。
參考圖6,揭示可操作以在解碼器處執(zhí)行語音信號(hào)的“參數(shù)”替換的系統(tǒng)的說明性方面且一般指定為600。系統(tǒng)600包含第一裝置102。第一裝置102可包含第一數(shù)據(jù)庫124、參數(shù)化數(shù)據(jù)庫424、數(shù)據(jù)庫分析器410、解碼器626或其組合。解碼器626可包含、耦合到信號(hào)處理模塊622或與其通信。
圖6說明在接收裝置處的語音信號(hào)的替換。在操作期間,第一裝置102可經(jīng)由網(wǎng)絡(luò)120從移動(dòng)裝置104接收第一數(shù)據(jù)630。第一數(shù)據(jù)630可包含對(duì)應(yīng)于音頻信號(hào)的一或多個(gè)幀的包數(shù)據(jù)。所述音頻信號(hào)可為對(duì)應(yīng)于用戶(例如,圖1的第二用戶154)的用戶語音信號(hào)。第一數(shù)據(jù)630可包含與所述音頻信號(hào)相關(guān)聯(lián)的多個(gè)參數(shù)。所述多個(gè)參數(shù)可包含音調(diào)參數(shù)、能量參數(shù)、線性預(yù)測(cè)譯碼(LPC)參數(shù)或其任何組合。
分析器602可基于第一數(shù)據(jù)630產(chǎn)生搜索準(zhǔn)則612。舉例來說,分析器602可從第一數(shù)據(jù)630提取與所述音頻信號(hào)相關(guān)聯(lián)的多個(gè)語音參數(shù)。搜索準(zhǔn)則612可包含提取的多個(gè)語音參數(shù)。分析器602可將搜索準(zhǔn)則612提供到搜索器604。
搜索器604可識(shí)別圖4的語音參數(shù)472、474和476的一或多個(gè)語音參數(shù)。在特定方面,搜索器604可通過將多個(gè)語音參數(shù)與語音參數(shù)472、474和476中的每一者進(jìn)行比較而識(shí)別第一語音參數(shù)472和第二語音參數(shù)474,如參考圖4的搜索器404所描述。搜索器604可在語音參數(shù)集合614中包含經(jīng)識(shí)別語音參數(shù)(例如,第一語音參數(shù)472和第二語音參數(shù)474)。搜索器604可將語音參數(shù)集合614提供到約束分析器606。約束分析器606可基于約束而選擇語音參數(shù)集合614的第一語音參數(shù)472,如參考圖4的約束分析器406所描述。約束分析器606可將第一語音參數(shù)472提供到合成器608。
合成器608可通過以第一語音參數(shù)472替換第一數(shù)據(jù)630中的所述多個(gè)語音參數(shù)而產(chǎn)生第二數(shù)據(jù)618。解碼器626可通過解碼第二數(shù)據(jù)618而產(chǎn)生第一經(jīng)處理語音信號(hào)116。舉例來說,第一經(jīng)處理語音信號(hào)116可為基于第一語音參數(shù)472而產(chǎn)生的經(jīng)處理信號(hào)。第一裝置102可將第一經(jīng)處理語音信號(hào)116提供到揚(yáng)聲器142。
在特定方面,分析器602可確定第一數(shù)據(jù)630指示第一代替語音信號(hào)172。舉例來說,分析器602可確定第一數(shù)據(jù)630包含對(duì)第一數(shù)據(jù)庫124中的第一代替語音信號(hào)172的參考、對(duì)參數(shù)化數(shù)據(jù)庫424中的第一語音參數(shù)472的參考,或這兩者。分析器602可響應(yīng)于確定第一數(shù)據(jù)630指示第一代替語音信號(hào)172而將第一語音參數(shù)472提供到合成器608。在此方面,分析器602可制止產(chǎn)生搜索準(zhǔn)則612。
系統(tǒng)600可因此通過以對(duì)應(yīng)于代替語音信號(hào)的語音參數(shù)對(duì)所接收數(shù)據(jù)的第一多個(gè)語音參數(shù)的“參數(shù)”替換而實(shí)現(xiàn)產(chǎn)生經(jīng)處理語音信號(hào)。使用對(duì)應(yīng)于代替語音信號(hào)的語音參數(shù)產(chǎn)生經(jīng)處理信號(hào)可導(dǎo)致與使用所述第一多個(gè)語音參數(shù)產(chǎn)生經(jīng)處理信號(hào)相比更高音頻的質(zhì)量。舉例來說,所接收的數(shù)據(jù)可能不表示高質(zhì)量音頻信號(hào)。為了說明,所接收的數(shù)據(jù)可對(duì)應(yīng)于在有噪聲的環(huán)境(例如,在音樂會(huì))中從用戶接收的用戶語音信號(hào),且可由另一裝置產(chǎn)生而無需執(zhí)行語音替換。即使另一裝置執(zhí)行語音替換,例如由于丟包、帶寬限制和/或位速率限制,由另一裝置發(fā)送的一些數(shù)據(jù)可能不會(huì)被接收。語音參數(shù)可對(duì)應(yīng)于從第二用戶154在安靜環(huán)境中提供的訓(xùn)練信號(hào)產(chǎn)生的代替語音信號(hào),如參考圖2所描述。解碼器可使用語音參數(shù)產(chǎn)生比使用所述第一多個(gè)語音參數(shù)可產(chǎn)生的信號(hào)更高質(zhì)量的經(jīng)處理信號(hào)。
參看圖7,揭示可操作以在解碼器處執(zhí)行語音信號(hào)的“波形”替換的系統(tǒng)的說明性方面且一般指定為700。系統(tǒng)700可包含第一數(shù)據(jù)庫124、參數(shù)化數(shù)據(jù)庫424、數(shù)據(jù)庫分析器410、解碼器726或其組合。解碼器726可包含、耦合到信號(hào)處理模塊722或與其通信。
圖7說明在接收裝置處的語音信號(hào)的替換。鑒于圖6的方面說明通過以對(duì)應(yīng)于代替語音信號(hào)的語音參數(shù)替換所接收語音參數(shù)而產(chǎn)生經(jīng)處理語音信號(hào),圖7的方面說明基于所接收的語音參數(shù)識(shí)別代替語音信號(hào)且使用代替語音信號(hào)產(chǎn)生經(jīng)處理語音信號(hào)。
在操作期間,第一裝置102可接收第一數(shù)據(jù)630。分析器602可基于第一數(shù)據(jù)630產(chǎn)生搜索準(zhǔn)則612,如參考圖6所描述。搜索器604可基于搜索準(zhǔn)則612識(shí)別代替語音信號(hào)112的子集(例如,多個(gè)代替語音信號(hào)714),如參考圖4的搜索器404所描述。舉例來說,所述多個(gè)代替語音信號(hào)714可包含第一代替語音信號(hào)172和第二代替語音信號(hào)174。約束分析器706可基于約束選擇所述多個(gè)代替語音信號(hào)714的第一代替語音信號(hào)(例如,第一代替語音信號(hào)172),如參考圖4的約束分析器406所描述。在特定方面,約束分析器706可基于約束選擇第一語音參數(shù)472,如參考圖4的約束分析器406所描述,且可選擇對(duì)應(yīng)于選定第一語音參數(shù)472的第一代替語音信號(hào)172。
約束分析器706可將第一代替語音信號(hào)172提供到合成器708。合成器708可基于第一代替語音信號(hào)172產(chǎn)生第一經(jīng)處理語音信號(hào)116。舉例來說,合成器708可通過以第一代替語音信號(hào)172替換輸入信號(hào)的一部分而產(chǎn)生第一經(jīng)處理語音信號(hào)116。第一裝置102可經(jīng)由揚(yáng)聲器142輸出第一經(jīng)處理語音信號(hào)116。
系統(tǒng)700可因此通過接收對(duì)應(yīng)于用戶語音信號(hào)的數(shù)據(jù)且通過以代替語音信號(hào)替換用戶語音信號(hào)的一部分產(chǎn)生經(jīng)處理信號(hào)而實(shí)現(xiàn)“波形”替換。經(jīng)處理信號(hào)可具有比用戶語音信號(hào)更高的音頻質(zhì)量。舉例來說,所接收的數(shù)據(jù)可能不表示高質(zhì)量音頻信號(hào)。為了說明,所接收的數(shù)據(jù)可對(duì)應(yīng)于在有噪聲的環(huán)境(例如,在音樂會(huì))中從用戶接收的用戶語音信號(hào),且可由另一裝置產(chǎn)生而無需執(zhí)行語音替換。即使另一裝置執(zhí)行語音替換,例如由于丟包、帶寬限制和/或位速率限制,由另一裝置發(fā)送的一些數(shù)據(jù)可能不會(huì)被接收。代替語音信號(hào)可從第二用戶154在安靜環(huán)境中提供的訓(xùn)練信號(hào)而產(chǎn)生,如參考圖2所描述。解碼器可使用代替語音信號(hào)產(chǎn)生比使用所接收的數(shù)據(jù)可產(chǎn)生的信號(hào)更高質(zhì)量的經(jīng)處理信號(hào)。
參考圖8,揭示可操作以執(zhí)行語音信號(hào)的“裝置中”替換的系統(tǒng)的說明性方面且一般指定為800。系統(tǒng)800可包含第一數(shù)據(jù)庫124、數(shù)據(jù)庫分析器410、信號(hào)處理模塊422、參數(shù)化數(shù)據(jù)庫424、應(yīng)用程序822或其組合。
在操作期間,信號(hào)處理模塊422可從應(yīng)用程序822接收輸入信號(hào)830。輸入信號(hào)830可對(duì)應(yīng)于語音信號(hào)。應(yīng)用程序822可包含文檔查看應(yīng)用程序、電子書查看應(yīng)用程序、文字到語音應(yīng)用程序、電子郵件應(yīng)用程序、通信應(yīng)用程序、因特網(wǎng)應(yīng)用程序、錄音應(yīng)用程序或其組合。分析器402可基于輸入信號(hào)830產(chǎn)生搜索準(zhǔn)則418,搜索器404可基于搜索準(zhǔn)則418產(chǎn)生搜索結(jié)果414,約束分析器406可識(shí)別選定結(jié)果416,且合成器408可通過基于選定結(jié)果416以替換語音信號(hào)替換輸入信號(hào)830的一部分而產(chǎn)生第一經(jīng)處理語音信號(hào)116,如參考圖4所描述。第一裝置102可經(jīng)由揚(yáng)聲器142輸出第一經(jīng)處理語音信號(hào)116。在特定方面,信號(hào)處理模塊422可響應(yīng)于從第一用戶152接收到用戶請(qǐng)求而產(chǎn)生搜索準(zhǔn)則418以產(chǎn)生第一經(jīng)處理語音信號(hào)116。
在特定方面,第一數(shù)據(jù)庫124可包含多個(gè)代替語音信號(hào)集合。代替語音信號(hào)的每一集合可對(duì)應(yīng)于特定名人、特定角色(例如,卡通角色、電視角色或電影角色)、特定用戶(例如,第一用戶152或第二用戶154),或其組合。第一用戶152可選擇代替語音信號(hào)的特定集合(例如,代替語音信號(hào)112)。舉例來說,第一用戶152可選擇對(duì)應(yīng)名人、對(duì)應(yīng)角色、對(duì)應(yīng)用戶或其組合。信號(hào)處理模塊422可使用代替語音信號(hào)的選定集合(例如,代替語音信號(hào)112)以產(chǎn)生第一經(jīng)處理語音信號(hào)116,如本文中所描述。
在特定方面,第一裝置102可將請(qǐng)求發(fā)送到另一裝置(例如,圖2的服務(wù)器206或移動(dòng)裝置104)。所述請(qǐng)求可識(shí)別特定名人、特定角色、特定用戶或其組合。另一裝置可響應(yīng)于接收到所述請(qǐng)求而將代替語音信號(hào)112發(fā)送到第一裝置102。
系統(tǒng)800可因此通過以代替語音信號(hào)替換由應(yīng)用程序產(chǎn)生的輸入語音信號(hào)的一部分而實(shí)現(xiàn)“裝置中”替換。代替語音信號(hào)可具有比輸入語音信號(hào)更高的音頻質(zhì)量。在特定方面,代替語音信號(hào)可從第一用戶152的訓(xùn)練語音產(chǎn)生。舉例來說,由應(yīng)用程序產(chǎn)生的輸入語音信號(hào)可發(fā)出機(jī)器人聲音或可對(duì)應(yīng)于默認(rèn)話音。第一用戶152可能偏好另一話音(例如,第一用戶152、圖1的第二用戶154、特定名人、特定角色等的話音)。代替語音信號(hào)可對(duì)應(yīng)于優(yōu)選話音。
雖然圖4到8的方面說明本地?cái)?shù)據(jù)庫分析器410,但在特定方面,數(shù)據(jù)庫分析器410或其組件可包含在服務(wù)器(例如,圖2的服務(wù)器206)中。在此方面,移動(dòng)裝置104、第一裝置102或這兩者可從服務(wù)器206接收參數(shù)化數(shù)據(jù)庫424的至少一部分。舉例來說,服務(wù)器206可分析代替語音信號(hào)112以產(chǎn)生第一語音參數(shù)472、第二語音參數(shù)474、N個(gè)語音參數(shù)476或其組合。
服務(wù)器206可將參數(shù)化數(shù)據(jù)庫424的至少所述部分提供到移動(dòng)裝置104、第一裝置102或這兩者。舉例來說,移動(dòng)裝置104、第一裝置102或這兩者可周期性地或響應(yīng)于接收到圖1的第一用戶語音信號(hào)130、圖6的第一數(shù)據(jù)630、輸入信號(hào)830、用戶請(qǐng)求或其組合而從服務(wù)器206請(qǐng)求參數(shù)化數(shù)據(jù)庫424的至少所述部分。在替代方面中,服務(wù)器206可周期性地將參數(shù)化數(shù)據(jù)庫424的至少所述部分發(fā)送到移動(dòng)裝置104、第一裝置102或這兩者。
在特定方面,服務(wù)器(例如,圖2的服務(wù)器206)可包含信號(hào)處理模塊422。服務(wù)器206可從移動(dòng)裝置104接收第一用戶語音信號(hào)130。服務(wù)器206可產(chǎn)生輸出信號(hào)430,如參考圖3和4所描述。服務(wù)器206可將輸出信號(hào)430發(fā)送到第一裝置102。在特定方面,輸出信號(hào)430可對(duì)應(yīng)于圖6的第一數(shù)據(jù)630。
參考圖9,展示可操作以替換語音信號(hào)的系統(tǒng)的特定方面的圖且一般指定為900。在特定方面,系統(tǒng)900可對(duì)應(yīng)于第一裝置102或可包含在其中。
系統(tǒng)900包含耦合到合成器408的搜索模塊922。搜索模塊922可包含或具有對(duì)耦合到搜索器904的數(shù)據(jù)庫924的存取。在特定方面,數(shù)據(jù)庫924可包含圖1的第一數(shù)據(jù)庫124、圖4的參數(shù)化數(shù)據(jù)庫424或這兩者。舉例來說,數(shù)據(jù)庫924可存儲(chǔ)代替語音信號(hào)112和/或?qū)?yīng)于代替語音信號(hào)112的語音參數(shù)的集合(例如,語音參數(shù)472、474和/或476)。在特定方面,數(shù)據(jù)庫924可接收且存儲(chǔ)代替語音信號(hào)112和語音參數(shù)集合。舉例來說,數(shù)據(jù)庫924可從另一裝置(例如,圖2的服務(wù)器206)接收代替語音信號(hào)112和語音參數(shù)集合。作為另一實(shí)例,數(shù)據(jù)庫924可從服務(wù)器206接收代替語音信號(hào)112,且搜索器904可使用向量量化器、隱式馬爾可夫模型(HMM)或高斯混合模型(GMM)中的至少一者產(chǎn)生語音參數(shù)集合。搜索器904可在數(shù)據(jù)庫924中存儲(chǔ)所產(chǎn)生語音參數(shù)集合。
在特定方面,搜索器904可包含圖4的分析器402和搜索器404。合成器408可包含替換器902。替換器902可耦合到搜索器904和數(shù)據(jù)庫924。
在操作期間,搜索器904可接收輸入信號(hào)930。輸入信號(hào)930可對(duì)應(yīng)于語音。在特定方面,輸入信號(hào)930可包含圖1和4到5的第一用戶語音信號(hào)130、圖6到7的第一數(shù)據(jù)630或圖8的輸入信號(hào)830。舉例來說,搜索器904可從用戶(例如,圖1的第一用戶152)、另一裝置、應(yīng)用程序或其組合接收輸入信號(hào)930。應(yīng)用程序可包含文檔查看應(yīng)用程序、電子書查看應(yīng)用程序、文字到語音應(yīng)用程序、電子郵件應(yīng)用程序、通信應(yīng)用程序、因特網(wǎng)應(yīng)用程序、錄音應(yīng)用程序或其組合。
搜索器904可將輸入信號(hào)930與代替語音信號(hào)112進(jìn)行比較。在特定方面,搜索器904可將輸入信號(hào)930的第一多個(gè)語音參數(shù)與語音參數(shù)集合進(jìn)行比較。搜索器904可使用向量量化器、隱式馬爾可夫模型(HMM)或高斯混合模型(GMM)中的至少一者確定所述第一多個(gè)語音參數(shù)。
搜索器904可基于所述比較而確定特定代替語音信號(hào)(例如,第一代替語音信號(hào)172)匹配于輸入信號(hào)930。舉例來說,搜索器904可基于所述第一多個(gè)語音參數(shù)與對(duì)應(yīng)于代替語音信號(hào)112、約束或這兩者的語音參數(shù)集合的比較而選擇第一代替語音信號(hào)172、第一語音參數(shù)472或這兩者,如參考圖4所描述。
搜索器904可將選定結(jié)果416提供到替換器902。選定結(jié)果416可指示第一代替語音信號(hào)172、第一語音參數(shù)472或這兩者。替換器902可基于選定結(jié)果416從數(shù)據(jù)庫924檢索第一代替語音信號(hào)172。替換器902可通過以第一代替語音信號(hào)172替換輸入信號(hào)930的一部分而產(chǎn)生第一經(jīng)處理語音信號(hào)116,如參考圖4所描述。
在特定方面,數(shù)據(jù)庫924可包含與代替語音信號(hào)112相關(guān)聯(lián)的標(biāo)簽。舉例來說,第一標(biāo)簽可指示對(duì)應(yīng)于第一代替語音信號(hào)172的聲音(例如,音素、雙音素、三音素、音節(jié)、詞或其組合)。第一標(biāo)簽可包含與所述聲音相關(guān)聯(lián)的文字識(shí)別符。在特定方面,替換器902可基于選定結(jié)果416從數(shù)據(jù)庫924檢索第一標(biāo)簽。舉例來說,選定結(jié)果416可指示第一代替語音信號(hào)172且替換器902可從數(shù)據(jù)庫924檢索對(duì)應(yīng)第一標(biāo)簽。合成器408可產(chǎn)生包含第一標(biāo)簽的文字輸出。
現(xiàn)有語音辨識(shí)系統(tǒng)使用語言模型且在例如詞或聲音等較高階構(gòu)造上操作。相比之下,搜索模塊922不使用語言模型且可在參數(shù)層級(jí)或在信號(hào)層級(jí)操作以執(zhí)行輸入信號(hào)930與代替語音信號(hào)112的比較以確定選定結(jié)果416。
系統(tǒng)900可實(shí)現(xiàn)以第一代替語音信號(hào)172替換輸入信號(hào)930的所述部分以產(chǎn)生第一經(jīng)處理語音信號(hào)116。第一經(jīng)處理語音信號(hào)116可具有比輸入信號(hào)930更高的音頻質(zhì)量。
參看圖10,展示數(shù)據(jù)庫的特定方面的圖且一般指定為1024。在特定方面,數(shù)據(jù)庫1024可對(duì)應(yīng)于圖1的第一數(shù)據(jù)庫124、圖4的參數(shù)化數(shù)據(jù)庫424、圖9的數(shù)據(jù)庫924或其組合。
數(shù)據(jù)庫1024可包含梅爾頻率倒譜系數(shù)(MFCC)1002、線譜對(duì)(LSP)1004、線譜頻率(LSF)1006、倒譜1010、線譜信息(LSI)1012、離散余弦變換(DCT)參數(shù)1014、離散傅立葉變換(DFT)參數(shù)1016、快速傅立葉變換(FFT)參數(shù)1018、共振峰頻率1020、脈碼調(diào)制(PCM)樣本1022或其組合。
在特定方面,裝置(例如,圖2的服務(wù)器206)的模/數(shù)轉(zhuǎn)換器(ADC)可基于訓(xùn)練語音信號(hào)(例如,訓(xùn)練語音信號(hào)272)產(chǎn)生PCM樣本1022。語音信號(hào)管理器262可從ADC接收PCM樣本1022且可在數(shù)據(jù)庫1024中存儲(chǔ)PCM樣本1022。語音信號(hào)管理器262可基于PCM樣本1022產(chǎn)生代替語音信號(hào)112,如參考圖2所描述。
語音信號(hào)管理器262可計(jì)算PCM樣本1022中的每一者的頻譜的表示。舉例來說,語音信號(hào)管理器262可產(chǎn)生對(duì)應(yīng)于PCM樣本1022中的每一者(或代替語音信號(hào)112中的每一者)的MFCC 1002、LSP 1004、LSF 1006、倒譜1010、LSI 1012、DCT參數(shù)1014、DFT參數(shù)1016、FFT參數(shù)1018、共振峰頻率1020或其組合。
舉例來說,MFCC 1002可為對(duì)應(yīng)于特定PCM樣本的聲音的短期功率譜的表示。語音信號(hào)管理器262可基于非線性梅爾頻率尺度上的對(duì)數(shù)功率譜的線性余弦變換而確定MFCC 1002。對(duì)數(shù)功率譜可對(duì)應(yīng)于特定PCM樣本。
作為另一實(shí)例,LSP 1004或LSF 1006可為對(duì)應(yīng)于特定PCM樣本的線性預(yù)測(cè)系數(shù)(LPC)的表示。LPC可表示特定PCM樣本的頻譜包絡(luò)。語音信號(hào)管理器262可基于線性預(yù)測(cè)模型確定特定PCM樣本的LPC。語音信號(hào)管理器262可基于LPC確定LSP 1004、LSF 1006或這兩者。
作為另一個(gè)實(shí)例,倒譜1010可表示特定PCM樣本的功率譜。語音信號(hào)管理器262可通過對(duì)特定PCM樣本的估計(jì)頻譜的對(duì)數(shù)應(yīng)用傅立葉逆變換(IFT)而確定倒譜1010。
作為額外實(shí)例,LSI 1012可表示特定PCM樣本的頻譜。語音信號(hào)管理器262可將濾波器應(yīng)用于特定PCM樣本以產(chǎn)生LSI 1012。
語音信號(hào)管理器262可將特定離散余弦變換(DCT)應(yīng)用于特定PCM樣本以產(chǎn)生DCT參數(shù)1014,可將特定離散傅立葉變換(DFT)應(yīng)用于特定PCM樣本以產(chǎn)生DFT參數(shù)1016,可將特定快速傅立葉變換(FFT)應(yīng)用于特定PCM樣本以產(chǎn)生FFT參數(shù)1018,或其組合。
共振峰頻率1020可表示特定PCM樣本的頻譜的頻譜峰值。語音信號(hào)管理器262可基于特定PCM樣本的相位信息、通過將帶通濾波器應(yīng)用于特定PCM樣本、通過執(zhí)行特定PCM樣本的LPC分析或其組合而確定共振峰頻率1020。
在特定方面,MFCC 1002、LSP 1004、LSF 1006、倒譜1010、LSI 1012、DCT參數(shù)1014、DFT參數(shù)1016、FFT參數(shù)1018、共振峰頻率1020或其組合可對(duì)應(yīng)于第一語音參數(shù)472,且特定PCM樣本可對(duì)應(yīng)于第一代替語音信號(hào)172。
數(shù)據(jù)庫1024說明代替語音信號(hào)的參數(shù)的實(shí)例,其可由信號(hào)處理模塊在對(duì)匹配代替語音信號(hào)的搜索期間使用以將輸入語音信號(hào)與多個(gè)代替語音信號(hào)進(jìn)行比較。信號(hào)處理模塊可通過以匹配代替語音信號(hào)替換輸入語音信號(hào)的一部分而產(chǎn)生經(jīng)處理信號(hào)。經(jīng)處理信號(hào)可具有比輸入語音信號(hào)更好的音頻質(zhì)量。
參考圖11,揭示系統(tǒng)的特定方面且一般指定為1100。系統(tǒng)1100可執(zhí)行參考圖1到2和4到9的系統(tǒng)100到200和400到900描述的一或多個(gè)操作。
系統(tǒng)1100可包含經(jīng)由網(wǎng)絡(luò)120耦合到第一裝置102或與其通信的服務(wù)器1106。服務(wù)器1106可包含電耦合到存儲(chǔ)器1176的處理器1160。處理器1160可經(jīng)由收發(fā)器1180電耦合到網(wǎng)絡(luò)120。收發(fā)器(例如,收發(fā)器1180)可包含接收器、發(fā)射器或這兩者。接收器可包含天線、網(wǎng)絡(luò)接口或天線和網(wǎng)絡(luò)接口的組合中的一或多者。發(fā)射器可包含天線、網(wǎng)絡(luò)接口或天線和網(wǎng)絡(luò)接口的組合中的一或多者。處理器1160可包含或可電耦合到語音信號(hào)管理器262。存儲(chǔ)器1176可包含第二數(shù)據(jù)庫264。第二數(shù)據(jù)庫264可經(jīng)配置以存儲(chǔ)與特定用戶(例如,圖1的第二用戶154)相關(guān)聯(lián)的代替語音信號(hào)112。舉例來說,語音信號(hào)管理器262可基于訓(xùn)練信號(hào)產(chǎn)生代替語音信號(hào)112,如參考圖2所描述。代替語音信號(hào)112可包含第一代替語音信號(hào)172。
存儲(chǔ)器1176可經(jīng)配置以存儲(chǔ)一或多個(gè)遠(yuǎn)程話音簡(jiǎn)檔1178。遠(yuǎn)程話音簡(jiǎn)檔1178可與多個(gè)人相關(guān)聯(lián)。舉例來說,遠(yuǎn)程話音簡(jiǎn)檔1178可包含遠(yuǎn)程話音簡(jiǎn)檔1174。遠(yuǎn)程話音簡(jiǎn)檔1174可與一個(gè)人(例如,圖1的第二用戶154)相關(guān)聯(lián)。為了說明,遠(yuǎn)程話音簡(jiǎn)檔1174可包含與第二用戶154相關(guān)聯(lián)的識(shí)別符1168(例如,用戶識(shí)別符)。遠(yuǎn)程話音簡(jiǎn)檔1178中的另一遠(yuǎn)程話音簡(jiǎn)檔可與另一人(例如,第一用戶152)相關(guān)聯(lián)。
遠(yuǎn)程話音簡(jiǎn)檔1174可與代替語音信號(hào)112相關(guān)聯(lián)。舉例來說,遠(yuǎn)程話音簡(jiǎn)檔1174可包含與代替語音信號(hào)112相關(guān)聯(lián)的語音內(nèi)容1170。為了說明,語音內(nèi)容1170可對(duì)應(yīng)于第二用戶154的語音信號(hào)或語音模型。語音內(nèi)容1170可基于從代替語音信號(hào)112中的一或多者提取的特征。遠(yuǎn)程話音簡(jiǎn)檔1174可指示代替語音信號(hào)112對(duì)應(yīng)于具有第一回放持續(xù)時(shí)間的音頻數(shù)據(jù)。舉例來說,如參考圖2所描述用以產(chǎn)生代替語音信號(hào)112的訓(xùn)練信號(hào)可具有第一回放持續(xù)時(shí)間。
第一裝置102可包含經(jīng)由收發(fā)器1150電耦合到網(wǎng)絡(luò)120的處理器1152。處理器1152可電耦合到存儲(chǔ)器1132。存儲(chǔ)器1132可包含第一數(shù)據(jù)庫124。第一數(shù)據(jù)庫124可經(jīng)配置以存儲(chǔ)本地代替語音信號(hào)1112。處理器1152可包含或可電耦合到信號(hào)處理模塊122。存儲(chǔ)器1132可經(jīng)配置以存儲(chǔ)一或多個(gè)本地話音簡(jiǎn)檔1108。舉例來說,本地話音簡(jiǎn)檔1108可包含與特定用戶(例如,圖1的第二用戶154)相關(guān)聯(lián)的本地話音簡(jiǎn)檔1104。第一裝置102可電耦合到或可包含至少一個(gè)揚(yáng)聲器(例如,揚(yáng)聲器142)、顯示器1128、輸入裝置1134(例如,觸摸屏、鍵盤、鼠標(biāo)或麥克風(fēng))或其組合。
在操作期間,信號(hào)處理模塊122可從服務(wù)器1106接收遠(yuǎn)程話音簡(jiǎn)檔1178的一或多個(gè)遠(yuǎn)程話音簡(jiǎn)檔(例如,遠(yuǎn)程話音簡(jiǎn)檔1174)。信號(hào)處理模塊122可基于識(shí)別符1168、語音內(nèi)容1170或這兩者確定遠(yuǎn)程話音簡(jiǎn)檔1174與一個(gè)人(例如,圖1的第二用戶154)相關(guān)聯(lián)。舉例來說,信號(hào)處理模塊122可響應(yīng)于確定識(shí)別符1168(例如,用戶識(shí)別符)對(duì)應(yīng)于第二用戶154而確定遠(yuǎn)程話音簡(jiǎn)檔1174與第二用戶154相關(guān)聯(lián)。作為另一實(shí)例,信號(hào)處理模塊122可響應(yīng)于確定語音內(nèi)容1170對(duì)應(yīng)于第二用戶154而確定遠(yuǎn)程話音簡(jiǎn)檔1174與第二用戶154相關(guān)聯(lián)。信號(hào)處理模塊122可基于本地代替語音信號(hào)1112產(chǎn)生第二語音內(nèi)容(例如,語音模型)。信號(hào)處理模塊122可響應(yīng)于確定語音內(nèi)容1170與第二語音內(nèi)容之間的差滿足(例如,小于)閾值而確定遠(yuǎn)程話音簡(jiǎn)檔1174與第二用戶154相關(guān)聯(lián)。舉例來說,語音內(nèi)容1170可對(duì)應(yīng)于與代替語音信號(hào)112中的一或多者相關(guān)聯(lián)的特征。第二語音內(nèi)容可對(duì)應(yīng)于第二用戶154的語音模型。信號(hào)處理模塊122可確定指示所述特征是否對(duì)應(yīng)于語音模型的置信度值。信號(hào)處理模塊122可響應(yīng)于確定所述置信度值滿足(例如,高于)置信度閾值而確定遠(yuǎn)程話音簡(jiǎn)檔1174與第二用戶154相關(guān)聯(lián)。
信號(hào)處理模塊122可響應(yīng)于確定本地話音簡(jiǎn)檔1104和遠(yuǎn)程話音簡(jiǎn)檔1174與同一人(例如,第二用戶154)相關(guān)聯(lián)而選擇本地話音簡(jiǎn)檔1104用于簡(jiǎn)檔管理。信號(hào)處理模塊122可響應(yīng)于選擇本地話音簡(jiǎn)檔1104而產(chǎn)生圖形用戶接口(GUI)1138以實(shí)現(xiàn)第一用戶152的簡(jiǎn)檔管理,將更新請(qǐng)求1110發(fā)送到服務(wù)器1106以更新本地話音簡(jiǎn)檔1104,或這兩者,如本文中所描述。
在特定實(shí)施方案中,信號(hào)處理模塊122可將簡(jiǎn)檔請(qǐng)求1120發(fā)送到服務(wù)器1106。簡(jiǎn)檔請(qǐng)求1120可指示本地話音簡(jiǎn)檔1104、遠(yuǎn)程話音簡(jiǎn)檔1174或這兩者。舉例來說,簡(jiǎn)檔請(qǐng)求1120可包含與第二用戶154相關(guān)聯(lián)的識(shí)別符1168。語音信號(hào)管理器262可響應(yīng)于接收到簡(jiǎn)檔請(qǐng)求1120而將遠(yuǎn)程話音簡(jiǎn)檔1174發(fā)送到第一裝置102。
在特定方面,信號(hào)處理模塊122可經(jīng)由輸入裝置1134接收指示簡(jiǎn)檔請(qǐng)求1120何時(shí)將發(fā)送到服務(wù)器1106的用戶輸入1140。信號(hào)處理模塊122可基于用戶輸入1140發(fā)送簡(jiǎn)檔請(qǐng)求1120。舉例來說,信號(hào)處理模塊122可響應(yīng)于接收到用戶輸入1140且在接收到用戶輸入1140后即刻、在特定時(shí)間和/或響應(yīng)于滿足特定條件確定用戶輸入1140指示簡(jiǎn)檔請(qǐng)求1120將發(fā)送到服務(wù)器1106而將簡(jiǎn)檔請(qǐng)求1120發(fā)送到服務(wù)器1106。作為另一實(shí)例,信號(hào)處理模塊122可將簡(jiǎn)檔請(qǐng)求1120的多個(gè)實(shí)例周期性地發(fā)送到服務(wù)器1106。在特定方面,信號(hào)處理模塊122可響應(yīng)于確定第一裝置102的特定應(yīng)用程序(例如,簡(jiǎn)檔管理應(yīng)用程序)在經(jīng)激活模式中而將簡(jiǎn)檔請(qǐng)求1120發(fā)送到服務(wù)器1106。
信號(hào)處理模塊122可在選擇本地話音簡(jiǎn)檔1104之后產(chǎn)生GUI 1138。在特定實(shí)施方案中,GUI 1138可對(duì)應(yīng)于圖3的GUI 300。GUI 1138可包含本地話音簡(jiǎn)檔1104的表示、遠(yuǎn)程話音簡(jiǎn)檔1174的表示或這兩者。舉例來說,GUI 1138可指示與對(duì)應(yīng)于遠(yuǎn)程話音簡(jiǎn)檔1174的代替語音信號(hào)112相關(guān)聯(lián)的第一回放持續(xù)時(shí)間。為了說明,圖3的第一條302、第二條314或第三條316可分別當(dāng)遠(yuǎn)程話音簡(jiǎn)檔1174對(duì)應(yīng)于“藍(lán)道爾·休斯”、“薩布瑞納·桑德斯”或“布雷特·迪恩”時(shí)指示第一回放持續(xù)時(shí)間。第一條302、第二條314和第三條316中的每一者可與遠(yuǎn)程話音簡(jiǎn)檔1178的相異遠(yuǎn)程話音簡(jiǎn)檔相關(guān)聯(lián)。舉例來說,第一條302可與遠(yuǎn)程話音簡(jiǎn)檔1174相關(guān)聯(lián),第二條314可與遠(yuǎn)程話音簡(jiǎn)檔1178中的第二遠(yuǎn)程話音簡(jiǎn)檔相關(guān)聯(lián),且第三條316可與遠(yuǎn)程話音簡(jiǎn)檔1178中的第三遠(yuǎn)程話音簡(jiǎn)檔相關(guān)聯(lián)。
在特定方面,GUI 1138可指示與對(duì)應(yīng)于本地話音簡(jiǎn)檔1104的本地代替語音信號(hào)1112相關(guān)聯(lián)的第二回放持續(xù)時(shí)間。為了說明,圖3的第一條302、第二條314或第三條316可分別當(dāng)本地話音簡(jiǎn)檔1104對(duì)應(yīng)于“藍(lán)道爾·休斯”、“薩布瑞納·桑德斯”或“布雷特·迪恩”時(shí)指示第二回放持續(xù)時(shí)間。第一條302、第二條314和第三條316中的每一者可與本地話音簡(jiǎn)檔1108中的相異本地話音簡(jiǎn)檔相關(guān)聯(lián)。舉例來說,第一條302可與本地話音簡(jiǎn)檔1104相關(guān)聯(lián),第二條314可與本地話音簡(jiǎn)檔1108中的第二本地話音簡(jiǎn)檔相關(guān)聯(lián),且第三條316可與本地話音簡(jiǎn)檔1108中的第三本地話音簡(jiǎn)檔相關(guān)聯(lián)。在特定實(shí)施方案中,GUI 1138可指示與遠(yuǎn)程話音簡(jiǎn)檔1174相關(guān)聯(lián)的第一回放持續(xù)時(shí)間和與本地話音簡(jiǎn)檔1104相關(guān)聯(lián)的第二回放持續(xù)時(shí)間,其中遠(yuǎn)程話音簡(jiǎn)檔1174和本地話音簡(jiǎn)檔1104與同一人(例如,圖1的第二用戶154)相關(guān)聯(lián)。第一用戶152可基于GUI 1138確定是否更新本地話音簡(jiǎn)檔1104。舉例來說,如果第一用戶152確定本地話音簡(jiǎn)檔1104對(duì)應(yīng)于短回放持續(xù)時(shí)間,那么第一用戶152可決定基于遠(yuǎn)程話音簡(jiǎn)檔1174更新本地話音簡(jiǎn)檔1104。作為另一實(shí)例,第一用戶152可響應(yīng)于確定GUI 1138指示遠(yuǎn)程話音簡(jiǎn)檔1174對(duì)應(yīng)于短回放持續(xù)時(shí)間,通過制止使用遠(yuǎn)程話音簡(jiǎn)檔1174更新本地話音簡(jiǎn)檔1104而減少更新頻率。減少更新頻率可節(jié)省資源(例如,功率、帶寬或這兩者)。
GUI 1138可指示指定與話音簡(jiǎn)檔(例如,本地話音簡(jiǎn)檔1104或遠(yuǎn)程話音簡(jiǎn)檔1174)相關(guān)聯(lián)的更新請(qǐng)求1110何時(shí)將發(fā)送的選項(xiàng)。信號(hào)處理模塊122可將GUI 1138提供到顯示器1128舉例來說,所述選項(xiàng)可對(duì)應(yīng)于自動(dòng)更新閾值312或添加選項(xiàng)308。信號(hào)處理模塊122可經(jīng)由輸入裝置1134從第一用戶152接收對(duì)應(yīng)于所述選項(xiàng)的用戶輸入1140。用戶輸入1140可指示更新請(qǐng)求1110何時(shí)將發(fā)送。舉例來說,第一用戶152可增加或減小自動(dòng)更新閾值312。信號(hào)處理模塊122可響應(yīng)于確定第一回放持續(xù)時(shí)間滿足(例如,大于或等于)自動(dòng)更新閾值312而發(fā)送更新請(qǐng)求1110。為了說明,信號(hào)處理模塊122可響應(yīng)于確定遠(yuǎn)程話音簡(jiǎn)檔1174指示對(duì)應(yīng)于代替語音信號(hào)112的第一回放持續(xù)時(shí)間滿足自動(dòng)更新閾值312而發(fā)送更新請(qǐng)求1110。信號(hào)處理模塊122可因此通過當(dāng)?shù)谝换胤懦掷m(xù)時(shí)間未能滿足(例如,低于)自動(dòng)更新閾值312時(shí)制止發(fā)送更新請(qǐng)求1110而減少更新頻率。作為另一實(shí)例,第一用戶152可選擇與話音簡(jiǎn)檔(例如,遠(yuǎn)程話音簡(jiǎn)檔1174、本地話音簡(jiǎn)檔1104或這兩者)相關(guān)聯(lián)的特定條(例如,第一條302)且可選擇添加選項(xiàng)308。信號(hào)處理模塊122可響應(yīng)于接收到指示添加選項(xiàng)308和第一條302的選擇的用戶輸入1140而將指示話音簡(jiǎn)檔(例如,遠(yuǎn)程話音簡(jiǎn)檔1174、本地話音簡(jiǎn)檔1104或這兩者)的更新請(qǐng)求1110發(fā)送到服務(wù)器1106。
在特定實(shí)施方案中,GUI 1138可包含指定與話音簡(jiǎn)檔(例如,遠(yuǎn)程話音簡(jiǎn)檔1174、本地話音簡(jiǎn)檔1104或這兩者)相關(guān)聯(lián)的更新請(qǐng)求(例如,更新請(qǐng)求1110)將周期性地(例如,每日、每周或每月)發(fā)送到服務(wù)器1106的選項(xiàng)。信號(hào)處理模塊122可例如響應(yīng)于接收到指示更新請(qǐng)求將周期性地發(fā)送的用戶輸入1140而將更新請(qǐng)求1110的多個(gè)實(shí)例周期性地發(fā)送到服務(wù)器1106。在特定方面,用戶輸入1140可指示更新時(shí)間閾值。信號(hào)處理模塊122可確定與話音簡(jiǎn)檔(例如,遠(yuǎn)程話音簡(jiǎn)檔1174、本地話音簡(jiǎn)檔1104或這兩者)相關(guān)聯(lián)的第一更新是在第一時(shí)間從服務(wù)器1106接收。信號(hào)處理模塊122可在第二時(shí)間確定第一時(shí)間與第二時(shí)間之間的差。信號(hào)處理模塊122可響應(yīng)于確定所述差滿足由用戶輸入1140指示的更新時(shí)間閾值而將更新請(qǐng)求1110發(fā)送到服務(wù)器1106。
在特定實(shí)施方案中,GUI 1138可包含指定何時(shí)制止發(fā)送與話音簡(jiǎn)檔(例如,遠(yuǎn)程話音簡(jiǎn)檔1174、本地話音簡(jiǎn)檔1104或這兩者)相關(guān)聯(lián)的更新請(qǐng)求(例如,更新請(qǐng)求1110)的選項(xiàng)。所述選項(xiàng)可對(duì)應(yīng)于停止更新閾值、資源使用閾值或這兩者。舉例來說,信號(hào)處理模塊122可響應(yīng)于確定與本地代替語音信號(hào)1112相關(guān)聯(lián)的第二回放持續(xù)時(shí)間滿足(例如,大于或等于)停止更新閾值而制止將更新請(qǐng)求1110發(fā)送到服務(wù)器1106。為了說明,第一用戶152可指定停止更新閾值以使得當(dāng)對(duì)應(yīng)于本地代替語音信號(hào)1112的第二回放持續(xù)時(shí)間滿足(例如,大于或等于)所述停止更新閾值時(shí)信號(hào)處理模塊122不繼續(xù)自動(dòng)更新本地話音簡(jiǎn)檔1104。作為另一實(shí)例,信號(hào)處理模塊122可響應(yīng)于確定資源使用(例如,剩余電池電力、可用存儲(chǔ)器、帳期網(wǎng)絡(luò)使用或其組合)滿足資源使用閾值而制止將更新請(qǐng)求1110發(fā)送到服務(wù)器1106。舉例來說,信號(hào)處理模塊122可當(dāng)剩余電池電力滿足(例如,小于)電力保留閾值時(shí)、當(dāng)可用存儲(chǔ)器滿足(例如,小于)存儲(chǔ)器保留閾值時(shí)、當(dāng)帳期網(wǎng)絡(luò)使用滿足(例如,大于或等于)網(wǎng)絡(luò)使用閾值時(shí)或其組合時(shí)制止將更新請(qǐng)求1110發(fā)送到服務(wù)器1106。
在特定方面,GUI 1138可包含刪除選項(xiàng)310。第一用戶152可選擇第一條302和刪除選項(xiàng)310。信號(hào)處理模塊122可響應(yīng)于接收到指示刪除選項(xiàng)310和第一條302的選擇的用戶輸入1140而將指示對(duì)應(yīng)話音簡(jiǎn)檔(例如,遠(yuǎn)程話音簡(jiǎn)檔1174)的刪除請(qǐng)求發(fā)送到服務(wù)器1106。語音信號(hào)管理器262可響應(yīng)于接收到刪除請(qǐng)求而刪除代替語音信號(hào)112。在特定實(shí)施方案中,信號(hào)處理模塊122可響應(yīng)于接收到指示刪除選項(xiàng)310和第一條302的選擇的用戶輸入1140而刪除本地代替語音信號(hào)1112。
語音信號(hào)管理器262可響應(yīng)于接收到更新請(qǐng)求1110將更新1102發(fā)送到第一裝置102,如本文中所描述。語音信號(hào)管理器262可更新與遠(yuǎn)程話音簡(jiǎn)檔1178和第一裝置102相關(guān)聯(lián)的最后更新發(fā)送時(shí)間以指示更新1102何時(shí)將發(fā)送到第一裝置102。在特定實(shí)施方案中,語音信號(hào)管理器262可響應(yīng)于接收到刪除請(qǐng)求在第一時(shí)間更新與第一裝置102和遠(yuǎn)程話音簡(jiǎn)檔1178相關(guān)聯(lián)的最后更新發(fā)送時(shí)間以指示所述第一時(shí)間。舉例來說,語音信號(hào)管理器262可更新最后更新發(fā)送時(shí)間而無需將更新發(fā)送到第一裝置102,以使得從對(duì)第一裝置102的后續(xù)更新排除代替語音信號(hào)112,如本文中所描述,同時(shí)保持代替語音信號(hào)112以將與遠(yuǎn)程話音簡(jiǎn)檔1178相關(guān)聯(lián)的更新提供到另一裝置。
信號(hào)處理模塊122可從服務(wù)器1106接收更新1102。更新1102可指示本地話音簡(jiǎn)檔1104、遠(yuǎn)程話音簡(jiǎn)檔1174或這兩者。舉例來說,更新1102可包含對(duì)應(yīng)于圖1的第二用戶154的識(shí)別符1168。更新1102可包含對(duì)應(yīng)于代替語音信號(hào)112的語音數(shù)據(jù)。信號(hào)處理模塊122可將代替語音信號(hào)112中的每一者添加到本地代替語音信號(hào)1112。舉例來說,信號(hào)處理模塊122可將語音數(shù)據(jù)添加到本地話音簡(jiǎn)檔1104。作為另一實(shí)例,信號(hào)處理模塊122可基于所述語音數(shù)據(jù)產(chǎn)生代替語音信號(hào)112且可將所產(chǎn)生代替語音信號(hào)112中的每一者添加到本地代替語音信號(hào)1112。
在特定方面,信號(hào)處理模塊122可以遠(yuǎn)程話音簡(jiǎn)檔1174的第二片段1166替換本地話音簡(jiǎn)檔1104的第一片段1164。舉例來說,第一片段1164可對(duì)應(yīng)于本地代替語音信號(hào)1112中的代替語音信號(hào)1172。第二片段1166可對(duì)應(yīng)于代替語音信號(hào)112中的第一代替語音信號(hào)172。信號(hào)處理模塊122可從本地代替語音信號(hào)1112移除代替語音信號(hào)1172且可將第一代替語音信號(hào)172添加到本地代替語音信號(hào)1112。
第一代替語音信號(hào)172和代替語音信號(hào)1172可對(duì)應(yīng)于類似聲音(例如,音素、雙音素、三音素、音節(jié)、詞或其組合)。在特定方面,信號(hào)處理模塊122可響應(yīng)于確定第一代替語音信號(hào)172具有比代替語音信號(hào)1172更高的音頻質(zhì)量(例如,較高信噪比)而以第一代替語音信號(hào)172替換代替語音信號(hào)1172。在另一方面,信號(hào)處理模塊122可響應(yīng)于確定代替語音信號(hào)1172已到期(例如,具有超過到期閾值的時(shí)戳)而以第一代替語音信號(hào)172替換代替語音信號(hào)1172。
在特定實(shí)施方案中,語音信號(hào)管理器262可在第一時(shí)間將與遠(yuǎn)程話音簡(jiǎn)檔1174相關(guān)聯(lián)的第一更新發(fā)送到第一裝置102。語音信號(hào)管理器262可更新最后更新發(fā)送時(shí)間以指示第一時(shí)間。語音信號(hào)管理器262可隨后確定與遠(yuǎn)程話音簡(jiǎn)檔1174相關(guān)聯(lián)的代替語音信號(hào)112是在將第一更新發(fā)送到第一裝置102之后產(chǎn)生的。舉例來說,語音信號(hào)管理器262可響應(yīng)于確定對(duì)應(yīng)于代替語音信號(hào)112中的每一者的時(shí)戳指示在最后更新發(fā)送時(shí)間之后的時(shí)間而選擇代替語音信號(hào)112。語音信號(hào)管理器262可響應(yīng)于確定代替語音信號(hào)112是在將第一更新發(fā)送到第一裝置102之后產(chǎn)生而將更新1102發(fā)送到第一裝置102。在此特定實(shí)施方案中,更新1102可包含少于全部與遠(yuǎn)程話音簡(jiǎn)檔1174相關(guān)聯(lián)的代替語音信號(hào)。舉例來說,更新1102可僅包含服務(wù)器1106先前尚未發(fā)送到第一裝置102的那些代替語音信號(hào)112。
在特定方面,更新請(qǐng)求1110可指示是否請(qǐng)求所有代替語音信號(hào)或是否僅請(qǐng)求先前尚未發(fā)送的代替語音信號(hào)。舉例來說,信號(hào)處理模塊122可在第一時(shí)間將第一更新發(fā)送到第一裝置102且可更新最后更新發(fā)送時(shí)間以指示所述第一時(shí)間。第二數(shù)據(jù)庫264可包含在所述第一時(shí)間之前產(chǎn)生的與遠(yuǎn)程話音簡(jiǎn)檔1174相關(guān)聯(lián)的第二代替語音信號(hào)。代替語音信號(hào)112可在第一時(shí)間之后產(chǎn)生。
信號(hào)處理模塊122可發(fā)送更新請(qǐng)求1110以請(qǐng)求與本地話音簡(jiǎn)檔1104相關(guān)聯(lián)的所有代替語音信號(hào)。在特定方面,信號(hào)處理模塊122可響應(yīng)于確定與本地話音簡(jiǎn)檔1104相關(guān)聯(lián)的語音數(shù)據(jù)已在第一裝置102處刪除而發(fā)送更新請(qǐng)求1110。語音信號(hào)管理器262可接收更新請(qǐng)求1110。語音信號(hào)管理器262可響應(yīng)于確定更新請(qǐng)求1110包含與第二用戶154相關(guān)聯(lián)的識(shí)別符1168而確定更新請(qǐng)求1110對(duì)應(yīng)于遠(yuǎn)程話音簡(jiǎn)檔1174。語音信號(hào)管理器262可響應(yīng)于確定更新請(qǐng)求1110指示請(qǐng)求所有對(duì)應(yīng)代替語音信號(hào)而發(fā)送包含與遠(yuǎn)程話音簡(jiǎn)檔1174相關(guān)聯(lián)的所有代替語音信號(hào)的更新1102。替代地,語音信號(hào)管理器262可響應(yīng)于確定更新請(qǐng)求1110指示僅請(qǐng)求先前尚未發(fā)送到第一裝置102的那些代替語音信號(hào)而發(fā)送包含少于全部與遠(yuǎn)程話音簡(jiǎn)檔1174相關(guān)聯(lián)的代替語音信號(hào)的更新1102。舉例來說,更新1102可包含具有指示在最后更新發(fā)送時(shí)間之后的時(shí)間(例如,產(chǎn)生時(shí)間)的時(shí)戳的代替語音信號(hào)112。
在特定方面,語音信號(hào)管理器262可獨(dú)立于接收更新請(qǐng)求1110而將更新1102發(fā)送到第一裝置102。舉例來說,語音信號(hào)管理器262可周期性地發(fā)送更新1102。作為另一實(shí)例,語音信號(hào)管理器262可確定與具有指示超過最后更新發(fā)送時(shí)間的時(shí)間(例如,產(chǎn)生時(shí)間)的時(shí)戳的代替語音信號(hào)(例如,代替語音信號(hào)112)相關(guān)聯(lián)的回放持續(xù)時(shí)間。語音信號(hào)管理器262可響應(yīng)于確定所述回放持續(xù)時(shí)間滿足自動(dòng)更新閾值而發(fā)送代替語音信號(hào)112。
本地代替語音信號(hào)1112可用以產(chǎn)生經(jīng)處理語音信號(hào),如本文中所描述。第一用戶152可將指示本地話音簡(jiǎn)檔1104的選擇1136提供到第一裝置102。舉例來說,第一裝置102可經(jīng)由輸入裝置1134接收選擇1136。在特定方面,選擇1136可對(duì)應(yīng)于以與本地話音簡(jiǎn)檔1104相關(guān)聯(lián)的第二裝置的話音呼叫。舉例來說,本地話音簡(jiǎn)檔1104可與圖1的第二用戶154的用戶簡(jiǎn)檔相關(guān)聯(lián)。所述用戶簡(jiǎn)檔可指示第二裝置。第一用戶152可起始話音呼叫或可接受來自第二裝置的話音呼叫。信號(hào)處理模塊122可在接收選擇1136之后接收輸入音頻信號(hào)1130。舉例來說,信號(hào)處理模塊122可在話音呼叫期間接收輸入音頻信號(hào)1130。信號(hào)處理模塊122可將輸入音頻信號(hào)1130的第一部分1162與本地代替語音信號(hào)1112進(jìn)行比較。本地代替語音信號(hào)1112可包含第一代替語音信號(hào)172。信號(hào)處理模塊122可確定第一部分1162匹配(例如,類似于)第一代替語音信號(hào)172。信號(hào)處理模塊122可響應(yīng)于確定第一部分1162匹配于第一代替語音信號(hào)172通過以第一代替語音信號(hào)172替換第一部分1162而產(chǎn)生第一經(jīng)處理語音信號(hào)116,如參考圖1所描述。第一代替語音信號(hào)172可具有比第一部分1162更高的音頻質(zhì)量。信號(hào)處理模塊122可經(jīng)由揚(yáng)聲器142將第一經(jīng)處理語音信號(hào)116輸出到第一用戶152。
在特定實(shí)施方案中,服務(wù)器1106可對(duì)應(yīng)于與本地話音簡(jiǎn)檔1104相關(guān)聯(lián)的裝置(例如,圖1的移動(dòng)裝置104)。舉例來說,本文中描述為由服務(wù)器1106執(zhí)行的操作中的一或多者可由移動(dòng)裝置104執(zhí)行。在此特定實(shí)施方案中,本文中描述為由第一裝置102發(fā)送到服務(wù)器1106的一或多個(gè)消息(例如,更新請(qǐng)求1110、簡(jiǎn)檔請(qǐng)求1120或這兩者)可發(fā)送到移動(dòng)裝置104。類似地,本文中描述為由第一裝置102從服務(wù)器1106接收的一或多個(gè)消息(例如,更新1102、遠(yuǎn)程話音簡(jiǎn)檔1174或這兩者)可從移動(dòng)裝置104接收。
系統(tǒng)1100可通過將經(jīng)處理語音信號(hào)提供給用戶而改善用戶體驗(yàn),其中通過以代替語音信號(hào)替換輸入音頻信號(hào)的一部分而產(chǎn)生經(jīng)處理語音信號(hào),且其中代替語音信號(hào)具有比輸入音頻信號(hào)的所述部分更高的音頻質(zhì)量。系統(tǒng)1100還可提供GUI以使用戶能夠管理話音簡(jiǎn)檔。
參考圖12,揭示系統(tǒng)的特定方面且一般指定為1200。系統(tǒng)1200可執(zhí)行參考圖1到2、4到9和11的系統(tǒng)100到200、400到900和1100描述的一或多個(gè)操作。系統(tǒng)1200可包含圖11的系統(tǒng)1100的一或多個(gè)組件。舉例來說,系統(tǒng)1200可包含服務(wù)器1106,其經(jīng)由網(wǎng)絡(luò)120耦合到第一裝置102或與其通信。第一裝置102可耦合到或可包含一或多個(gè)麥克風(fēng)1244。第一裝置102可包含圖1的第一數(shù)據(jù)庫124。第一數(shù)據(jù)庫124可經(jīng)配置以存儲(chǔ)一或多個(gè)本地代替語音信號(hào)1214。本地代替語音信號(hào)1214可對(duì)應(yīng)于與一個(gè)人(例如,第一用戶152)相關(guān)聯(lián)的本地話音簡(jiǎn)檔1204。
在操作期間,信號(hào)處理模塊122可經(jīng)由麥克風(fēng)1244從第一用戶152接收訓(xùn)練語音信號(hào)(例如,輸入音頻信號(hào)1238)。舉例來說,信號(hào)處理模塊122可在話音呼叫期間接收輸入音頻信號(hào)1238。信號(hào)處理模塊122可基于輸入音頻信號(hào)1238產(chǎn)生代替語音信號(hào)1212,如參考圖2所描述。信號(hào)處理模塊122可將代替語音信號(hào)1212添加到本地代替語音信號(hào)1214。信號(hào)處理模塊122可將更新1202提供到服務(wù)器206。更新1202可包含對(duì)應(yīng)于代替語音信號(hào)1212的語音數(shù)據(jù)。更新1202可包含與第一用戶152相關(guān)聯(lián)的識(shí)別符、本地話音簡(jiǎn)檔1204或這兩者。服務(wù)器206可接收更新1202,且語音信號(hào)管理器262可基于更新1202的識(shí)別符而確定更新1202與遠(yuǎn)程話音簡(jiǎn)檔1178的遠(yuǎn)程話音簡(jiǎn)檔1274相關(guān)聯(lián)。
在特定實(shí)施方案中,語音信號(hào)管理器262可確定沒有遠(yuǎn)程話音簡(jiǎn)檔1178對(duì)應(yīng)于更新1202。作為響應(yīng),語音信號(hào)管理器262可將遠(yuǎn)程話音簡(jiǎn)檔1274添加到遠(yuǎn)程話音簡(jiǎn)檔1178。遠(yuǎn)程話音簡(jiǎn)檔1274可與更新1202的識(shí)別符相關(guān)聯(lián)(例如,包含所述識(shí)別符)。語音信號(hào)管理器262可在第二數(shù)據(jù)庫264中存儲(chǔ)代替語音信號(hào)1212且可使所存儲(chǔ)的代替語音信號(hào)1212與遠(yuǎn)程話音簡(jiǎn)檔1274關(guān)聯(lián)。舉例來說,語音信號(hào)管理器262可基于語音數(shù)據(jù)而產(chǎn)生代替語音信號(hào)1212且可在第二數(shù)據(jù)庫264中存儲(chǔ)代替語音信號(hào)1212、語音數(shù)據(jù)或這兩者。
語音信號(hào)管理器262可確定與代替語音信號(hào)1212相關(guān)聯(lián)的時(shí)戳(例如,產(chǎn)生時(shí)戳)且可在第二數(shù)據(jù)庫264、存儲(chǔ)器1176或這兩者中存儲(chǔ)所述時(shí)戳。舉例來說,所述時(shí)戳可指示輸入音頻信號(hào)1238由第一裝置102接收的時(shí)間、代替語音信號(hào)1212由信號(hào)處理模塊122產(chǎn)生的時(shí)間、更新1202由第一裝置102發(fā)送的時(shí)間、更新1202由服務(wù)器1106接收的時(shí)間、代替語音信號(hào)1212存儲(chǔ)在第二數(shù)據(jù)庫264中的時(shí)間,或其組合。語音信號(hào)管理器262可確定與代替語音信號(hào)1212相關(guān)聯(lián)的回放持續(xù)時(shí)間且可在第二數(shù)據(jù)庫264、存儲(chǔ)器1176或這兩者中存儲(chǔ)回放持續(xù)時(shí)間。舉例來說,所述回放持續(xù)時(shí)間可為輸入音頻信號(hào)1238的回放持續(xù)時(shí)間。在特定實(shí)施方案中,更新1202可指示所述回放持續(xù)時(shí)間且語音信號(hào)管理器262可基于更新1202確定回放持續(xù)時(shí)間。
在特定方面,第一裝置102可響應(yīng)于從服務(wù)器1106或另一裝置接收到更新請(qǐng)求1210而將更新1202發(fā)送到服務(wù)器1106。舉例來說,服務(wù)器1106可周期性地或響應(yīng)于檢測(cè)到事件(例如,話音呼叫的起始)而將更新請(qǐng)求1210發(fā)送到第一裝置102。信號(hào)處理模塊122可響應(yīng)于接收到更新請(qǐng)求1210而發(fā)送更新1202。
在特定方面,信號(hào)處理模塊122可響應(yīng)于確定第一裝置102的用戶(例如,第一用戶152)已授權(quán)將代替語音信號(hào)1212(或語音數(shù)據(jù))發(fā)送到服務(wù)器1106而發(fā)送更新1202。舉例來說,信號(hào)處理模塊122可經(jīng)由輸入裝置1134從第一用戶152接收用戶輸入1240。信號(hào)處理模塊122可響應(yīng)于確定用戶輸入1240指示第一用戶152已授權(quán)將代替語音信號(hào)1212發(fā)送到服務(wù)器1106而將更新1202發(fā)送到服務(wù)器1106。
在特定方面,信號(hào)處理模塊122可確定第一裝置102的用戶(例如,第一用戶152)已授權(quán)將代替語音信號(hào)1212(或語音數(shù)據(jù))發(fā)送到與特定用戶簡(jiǎn)檔(例如,圖1的第二用戶154的用戶簡(jiǎn)檔)相關(guān)聯(lián)的一或多個(gè)裝置。更新1202可指示代替語音信號(hào)1212經(jīng)授權(quán)與其共享的一或多個(gè)裝置、特定用戶簡(jiǎn)檔或其組合。信號(hào)處理模塊122可在第二數(shù)據(jù)庫264、存儲(chǔ)器1176或這兩者中存儲(chǔ)指示所述一或多個(gè)裝置、特定用戶簡(jiǎn)檔或其組合的授權(quán)數(shù)據(jù)。信號(hào)處理模塊122可響應(yīng)于確定所述授權(quán)數(shù)據(jù)指示特定裝置而將包含與代替語音信號(hào)1212相關(guān)聯(lián)的數(shù)據(jù)的更新發(fā)送到特定裝置,如參考圖11所描述。
在特定方面,信號(hào)處理模塊122可產(chǎn)生GUI 1232,其指示選擇何時(shí)將更新1202當(dāng)時(shí)到服務(wù)器1106的選項(xiàng)。信號(hào)處理模塊122可將GUI 1232提供到顯示器1128。信號(hào)處理模塊122可經(jīng)由輸入裝置1134從第一用戶152接收用戶輸入1240。信號(hào)處理模塊122可響應(yīng)于接收到用戶輸入1240而發(fā)送更新1202。在特定方面,用戶輸入1240可指示更新1202(例如,代替語音信號(hào)1212或語音數(shù)據(jù))將周期性地(例如,每小時(shí)、每日、每周或每月)發(fā)送或可指示更新閾值(例如,4小時(shí))。作為響應(yīng),信號(hào)處理模塊122可周期性地或基于更新閾值而將更新1202的多個(gè)實(shí)例周期性地發(fā)送到服務(wù)器1106。
系統(tǒng)1200可使得裝置能夠?qū)⑴c用戶相關(guān)聯(lián)的代替語音信號(hào)提供到另一裝置。另一裝置可基于對(duì)應(yīng)于用戶的輸入音頻信號(hào)而產(chǎn)生經(jīng)處理語音信號(hào)。舉例來說,另一裝置可通過以代替語音信號(hào)替換輸入音頻信號(hào)的一部分而產(chǎn)生經(jīng)處理語音信號(hào)。代替語音信號(hào)可具有比輸入音頻信號(hào)的所述部分更高的音頻質(zhì)量。
參考圖13,揭示系統(tǒng)的特定方面且一般指定為1300。系統(tǒng)1300可執(zhí)行參考圖1到2、4到9和11到12的系統(tǒng)100到200、400到900和1100到1200描述的一或多個(gè)操作。
系統(tǒng)1300可包含圖11的系統(tǒng)1100、圖12的系統(tǒng)1200或這兩者的一或多個(gè)組件。舉例來說,系統(tǒng)1300包含第一裝置102和處理器1152。第一裝置102可耦合到麥克風(fēng)1244、揚(yáng)聲器142或這兩者。處理器1152可耦合到或可包含信號(hào)處理模塊122。信號(hào)處理模塊122可耦合到模式檢測(cè)器1302、域選擇器1304、文字到語音轉(zhuǎn)換器1322或其組合。
系統(tǒng)1300的一或多個(gè)組件可包含在以下各項(xiàng)中的至少一者中:交通工具、電子閱讀器(e-reader)裝置、移動(dòng)裝置、聲學(xué)俘獲裝置、電視、通信裝置、平板計(jì)算機(jī)、智能電話、導(dǎo)航裝置、膝上型計(jì)算機(jī)、可穿戴式裝置或計(jì)算裝置。舉例來說,揚(yáng)聲器142中的一或多者可包含在交通工具或移動(dòng)裝置中。移動(dòng)裝置可包含電子閱讀器裝置、平板計(jì)算機(jī)、通信裝置、智能電話、導(dǎo)航裝置、膝上型計(jì)算機(jī)、可穿戴式裝置、計(jì)算裝置或其組合。存儲(chǔ)器1132可包含在以下各項(xiàng)中的至少一者可存取的存儲(chǔ)裝置中:交通工具、電子閱讀器裝置、移動(dòng)裝置、聲學(xué)俘獲裝置、電視、通信裝置、平板計(jì)算機(jī)、智能電話、導(dǎo)航裝置、膝上型計(jì)算機(jī)、可穿戴式裝置或計(jì)算裝置。
在操作期間,信號(hào)處理模塊122可經(jīng)由麥克風(fēng)1244從第一用戶152接收訓(xùn)練語音信號(hào)1338。在特定實(shí)施方案中,訓(xùn)練語音信號(hào)1338可為獨(dú)立于文字的且可在第一裝置102的一般或“正?!笔褂闷陂g接收。舉例來說,第一用戶152可激活信號(hào)處理模塊122的“始終接通”俘獲模式,且信號(hào)處理模塊122可在第一用戶152在麥克風(fēng)1244附近說話時(shí)在后臺(tái)接收訓(xùn)練語音信號(hào)1338。信號(hào)處理模塊122可基于訓(xùn)練語音信號(hào)1338產(chǎn)生代替語音信號(hào)1212,如參考圖2和12所描述。代替語音信號(hào)1212可包含第一代替語音信號(hào)1372。信號(hào)處理模塊122可將代替語音信號(hào)112、與代替語音信號(hào)112相關(guān)聯(lián)的語音數(shù)據(jù)或這兩者添加到本地代替語音信號(hào)1214,如參考圖12所描述。
模式檢測(cè)器1302可經(jīng)配置以檢測(cè)多個(gè)使用模式(例如,閱讀模式、對(duì)話模式、振鳴模式、命令與控制模式或其組合)中的使用模式1312。使用模式1312可與訓(xùn)練語音信號(hào)1338相關(guān)聯(lián)。舉例來說,模式檢測(cè)器1302可當(dāng)接收到訓(xùn)練語音信號(hào)1338時(shí)基于信號(hào)處理模塊122的使用模式設(shè)定1362而檢測(cè)使用模式1312。為了說明,信號(hào)處理模塊122可響應(yīng)于檢測(cè)到第一裝置102的第一應(yīng)用程序(例如,閱讀器應(yīng)用程序或另一閱讀應(yīng)用程序)被激活而將使用模式設(shè)定1362設(shè)定為閱讀模式。信號(hào)處理模塊122可響應(yīng)于檢測(cè)到進(jìn)行中的話音呼叫或第一裝置102的第二應(yīng)用程序(例如,音頻聊天應(yīng)用程序和/或視頻會(huì)議應(yīng)用程序)被激活而將使用模式設(shè)定1362設(shè)定為對(duì)話模式。
信號(hào)處理模塊122可響應(yīng)于確定第一裝置102的第三應(yīng)用(例如,振鳴應(yīng)用程序)被激活而將使用模式設(shè)定1362設(shè)定為振鳴模式。在特定方面,信號(hào)處理模塊122可響應(yīng)于確定訓(xùn)練語音信號(hào)1338對(duì)應(yīng)于振鳴而將使用模式設(shè)定1362設(shè)定為振鳴模式。舉例來說,信號(hào)處理模塊122可提取訓(xùn)練語音信號(hào)1338的特征且可基于所提取特征和分類器(例如,支持向量機(jī)(SVM))而確定訓(xùn)練語音信號(hào)1338對(duì)應(yīng)于振鳴。所述分類器可通過分析話音語音持續(xù)時(shí)間、有聲語音的速率、語音停頓的速率、有聲語音間隔(例如,對(duì)應(yīng)于音節(jié))之間的相似性量度或其組合而檢測(cè)振鳴。
信號(hào)處理模塊122可響應(yīng)于確定第一裝置102的第四應(yīng)用程序(例如,個(gè)人助理應(yīng)用程序)被激活而將使用模式設(shè)定1362設(shè)定為命令與控制模式。在特定方面,信號(hào)處理模塊122可響應(yīng)于確定訓(xùn)練語音信號(hào)1338包含命令關(guān)鍵詞(例如,“激活”)而將使用模式設(shè)定1362設(shè)定為命令與控制模式。舉例來說,信號(hào)處理模塊122可使用語音分析技術(shù)以確定訓(xùn)練語音信號(hào)1338包含命令關(guān)鍵詞。閱讀模式、對(duì)話模式、振鳴模式或命令與控制模式中的一者可對(duì)應(yīng)于“默認(rèn)”使用模式。使用模式設(shè)定1362可對(duì)應(yīng)于默認(rèn)使用模式,除非被超越。在特定方面,信號(hào)處理模塊122可將使用模式設(shè)定1362設(shè)定為由用戶輸入指示的特定使用模式。模式檢測(cè)器1302可將使用模式1312提供到信號(hào)處理模塊122。
域選擇器1304可經(jīng)配置以檢測(cè)多個(gè)人口統(tǒng)計(jì)域(例如,語言域、性別域、年齡域或其組合)中的人口統(tǒng)計(jì)域1314。人口統(tǒng)計(jì)域1314可與訓(xùn)練語音信號(hào)1338相關(guān)聯(lián)。舉例來說,域選擇器1304可基于與第一用戶152相關(guān)聯(lián)的人口統(tǒng)計(jì)數(shù)據(jù)(例如,特定語言、特定性別、特定年齡或其組合)而檢測(cè)人口統(tǒng)計(jì)域1314。在特定方面,存儲(chǔ)器1132可包含與第一用戶152相關(guān)聯(lián)的用戶簡(jiǎn)檔中的人口統(tǒng)計(jì)數(shù)據(jù)。作為另一實(shí)例,域選擇器1304可通過使用分類器分析訓(xùn)練語音信號(hào)1338而檢測(cè)人口統(tǒng)計(jì)域1314。為了說明,分類器可將訓(xùn)練語音信號(hào)1338分類為特定語言、特定性別、特定年齡或其組合。人口統(tǒng)計(jì)域1314可指示所述特定語言、特定性別、特定年齡或其組合。域選擇器1304可將人口統(tǒng)計(jì)域1314提供到信號(hào)處理模塊122。
信號(hào)處理模塊122可使使用模式1312、人口統(tǒng)計(jì)域1314或這兩者與代替語音信號(hào)1212中的每一者關(guān)聯(lián)。信號(hào)處理模塊122可確定與代替語音信號(hào)1212相關(guān)聯(lián)的分類1346。分類1346可包含指示代替語音信號(hào)1212何時(shí)由信號(hào)處理模塊122產(chǎn)生的時(shí)間和/或日期的時(shí)戳。分類1346可指示當(dāng)訓(xùn)練語音信號(hào)1338由第一裝置102接收時(shí)激活的應(yīng)用程序(例如,閱讀應(yīng)用程序)或所述應(yīng)用程序的組件(例如,特定故事)。分類1346可指示對(duì)應(yīng)于訓(xùn)練語音信號(hào)1338的詞、短語、文字或其組合。信號(hào)處理模塊122可使用語音分析技術(shù)將訓(xùn)練語音信號(hào)1338分類為一或多種感情(例如,愉悅、憤怒、悲傷等)。分類1346可指示所述一或多種感情。信號(hào)處理模塊122可使分類1346與代替語音信號(hào)1212中的每一者關(guān)聯(lián)。
本地代替語音信號(hào)1214可包含由信號(hào)處理模塊122基于第二訓(xùn)練語音信號(hào)產(chǎn)生的一或多個(gè)額外代替語音信號(hào)(例如,第二代替語音信號(hào)1374),如參考圖2所描述。第二代替語音信號(hào)1374可與第二使用模式、第二人口統(tǒng)計(jì)域、第二分類或其組合相關(guān)聯(lián)。
信號(hào)處理模塊122可從文字到語音轉(zhuǎn)換器1322接收語音信號(hào)1330。舉例來說,第一用戶152可激活文字到語音轉(zhuǎn)換器1322且文字到語音轉(zhuǎn)換器1322可將語音信號(hào)1330提供到信號(hào)處理模塊122。信號(hào)處理模塊122可基于用戶模式設(shè)定1362而檢測(cè)特定使用模式,如本文中所描述。信號(hào)處理模塊122還可選擇特定人口統(tǒng)計(jì)域。舉例來說,信號(hào)處理模塊122可從第一用戶152接收指示特定用戶簡(jiǎn)檔的用戶輸入。信號(hào)處理模塊122可基于對(duì)應(yīng)于特定用戶簡(jiǎn)檔的人口統(tǒng)計(jì)數(shù)據(jù)而選擇特定人口統(tǒng)計(jì)域。作為另一實(shí)例,用戶輸入可指示特定語言、特定年齡、特定性別或其組合。信號(hào)處理模塊122可選擇對(duì)應(yīng)于特定語言、特定年齡、特定性別或其組合的特定人口統(tǒng)計(jì)域。
信號(hào)處理模塊122可基于所檢測(cè)特定使用模式、選定特定人口統(tǒng)計(jì)域或這兩者而選擇本地代替語音信號(hào)1214的特定代替語音信號(hào)(例如,第一代替語音信號(hào)1372或第二代替語音信號(hào)1374)。舉例來說,信號(hào)處理模塊122可將語音信號(hào)1330的一部分與本地代替語音信號(hào)1214中的每一者進(jìn)行比較。第一代替語音信號(hào)1372、第二代替語音信號(hào)1374和語音信號(hào)1330的所述部分中的每一者可對(duì)應(yīng)于類似聲音。信號(hào)處理模塊122可基于確定特定使用模式對(duì)應(yīng)于(例如,匹配)使用模式1312、特定人口統(tǒng)計(jì)域?qū)?yīng)于(例如,至少部分地匹配)人口統(tǒng)計(jì)域1314或這兩者而選擇第一代替語音信號(hào)1372。因此,使用模式和人口統(tǒng)計(jì)域可用以確保語音信號(hào)1330的所述部分被在類似上下文中產(chǎn)生的代替語音信號(hào)(例如,第一代替語音信號(hào)1372)替換。舉例來說,當(dāng)語音信號(hào)1330對(duì)應(yīng)于振鳴模式時(shí),語音信號(hào)1330的所述部分可被對(duì)應(yīng)于較高音頻質(zhì)量振鳴且不對(duì)應(yīng)于較高音頻質(zhì)量對(duì)話語音的代替語音信號(hào)替換。
在特定方面,本地代替語音信號(hào)1214可與分類相關(guān)聯(lián)。分類中的每一者可具有優(yōu)先級(jí)。信號(hào)處理模塊122可通過按優(yōu)先級(jí)次序?qū)⒄Z音信號(hào)1330的所述部分與本地代替語音信號(hào)1214進(jìn)行比較而選擇第一代替語音信號(hào)1372。舉例來說,信號(hào)處理模塊122可至少部分地基于確定由分類1346指示的第一時(shí)戳在由與第二代替語音信號(hào)1374相關(guān)聯(lián)的第二分類指示的第二時(shí)戳之后而選擇第一代替語音信號(hào)1372。作為另一實(shí)例,信號(hào)處理模塊122可至少部分地基于確定特定應(yīng)用程序(例如,電子閱讀器應(yīng)用程序)被激活且所述特定應(yīng)用程序由分類1346指示且不由第二分類指示而選擇第一代替語音信號(hào)1372。
信號(hào)處理模塊122可通過以第一代替語音信號(hào)1372替換語音信號(hào)1330的所述部分而產(chǎn)生第一經(jīng)處理語音信號(hào)116。信號(hào)處理模塊122可在存儲(chǔ)器1132中存儲(chǔ)第一經(jīng)處理語音信號(hào)116?;蛘呋蛄硗?,信號(hào)處理模塊122可經(jīng)由揚(yáng)聲器142將第一經(jīng)處理語音信號(hào)116輸出到第一用戶152。
在特定方面,訓(xùn)練語音信號(hào)1338可從特定用戶(例如,第一用戶152)接收且第一經(jīng)處理語音信號(hào)116可輸出到同一用戶(例如,第一用戶152)。舉例來說,第一經(jīng)處理語音信號(hào)116可類似于第一用戶152的語音而發(fā)聲。
在另一方面,訓(xùn)練語音信號(hào)1338可從特定用戶(例如,父母)接收且第一經(jīng)處理語音信號(hào)116可輸出到另一用戶(例如,所述父母的孩子)。舉例來說,所述父母可激活電子閱讀器應(yīng)用程序且在第一天閱讀特定故事。訓(xùn)練語音信號(hào)1338可對(duì)應(yīng)于所述父母的語音。信號(hào)處理模塊122可基于訓(xùn)練語音信號(hào)1338產(chǎn)生代替語音信號(hào)1212,如參考圖2和12所描述。信號(hào)處理模塊122可使使用模式1312(例如,閱讀模式)與代替語音信號(hào)1212中的每一者關(guān)聯(lián)。信號(hào)處理模塊122可使人口統(tǒng)計(jì)域1314(例如,成年人、女性和英語)與代替語音信號(hào)1212中的每一者關(guān)聯(lián)。信號(hào)處理模塊122可使分類1346(例如,特定故事、電子閱讀器應(yīng)用程序、對(duì)應(yīng)于第一天的時(shí)戳、對(duì)應(yīng)于語音信號(hào)的文字,和對(duì)應(yīng)于訓(xùn)練語音信號(hào)1338的一或多種感情)與代替語音信號(hào)1212中的每一者關(guān)聯(lián)。
另一用戶(例如,孩子)可在第二天激活文字到語音轉(zhuǎn)換器1322。舉例來說,所述孩子可選擇特定故事且可選擇父母的用戶簡(jiǎn)檔。為了說明,所述孩子可選擇父母先前閱讀的特定故事的后續(xù)部分。文字到語音轉(zhuǎn)換器1322可基于特定故事的文字產(chǎn)生語音信號(hào)1330。信號(hào)處理模塊122可接收語音信號(hào)1330。信號(hào)處理模塊122可檢測(cè)特定用戶模式(例如,閱讀模式)且可選擇對(duì)應(yīng)于父母的用戶簡(jiǎn)檔的特定人口統(tǒng)計(jì)域(例如,成年人、女性和英語)。信號(hào)處理模塊122可確定特定分類(例如,特定故事)。信號(hào)處理模塊122按優(yōu)先級(jí)次序?qū)⒄Z音信號(hào)1330的一部分與本地代替語音信號(hào)1214進(jìn)行比較。信號(hào)處理模塊122可基于確定使用模式1312匹配特定使用模式、分類1346匹配特定分類或這兩者而選擇第一代替語音信號(hào)1372。信號(hào)處理模塊122可通過以第一代替語音信號(hào)1372替換語音信號(hào)1330的所述部分而產(chǎn)生第一經(jīng)處理語音信號(hào)116。信號(hào)處理模塊122可經(jīng)由揚(yáng)聲器142將第一經(jīng)處理語音信號(hào)116輸出給孩子。第一經(jīng)處理語音信號(hào)116可類似于父母的語音而發(fā)聲。孩子因此能夠當(dāng)父母沒空(例如,在外地)時(shí)聽到以父母的話音閱讀的特定故事的后續(xù)章節(jié)。
系統(tǒng)1300可因此實(shí)現(xiàn)基于從用戶接收的音頻信號(hào)而產(chǎn)生對(duì)應(yīng)于用戶的語音的代替語音信號(hào)。代替語音信號(hào)可用以產(chǎn)生類似于用戶的語音而發(fā)聲的經(jīng)處理語音信號(hào)。舉例來說,可通過以代替語音信號(hào)替換語音信號(hào)的由文字到語音轉(zhuǎn)換器產(chǎn)生的一部分而產(chǎn)生經(jīng)處理語音信號(hào)。
參看圖14,展示替換語音信號(hào)的方法的特定說明性方面的流程圖且一般指定為1400。方法1400可由圖1的信號(hào)處理模塊122、圖4的信號(hào)處理模塊422、圖6的信號(hào)處理模塊622、圖7的信號(hào)處理模塊722或其組合執(zhí)行。
方法1400包含在1402處獲取多個(gè)代替語音信號(hào)。舉例來說,第一裝置102可獲取代替語音信號(hào)112,如參考圖2進(jìn)一步描述。
方法1400還可包含在1404在裝置處接收與用戶相關(guān)聯(lián)的用戶語音信號(hào)。所述用戶語音信號(hào)可在話音呼叫期間接收。舉例來說,第一裝置102可在與移動(dòng)裝置104的話音呼叫期間接收第一用戶語音信號(hào)130,如參考圖1進(jìn)一步描述。
方法1400可進(jìn)一步包含在1406處將用戶語音信號(hào)的一部分與同用戶相關(guān)聯(lián)的所述多個(gè)代替語音信號(hào)進(jìn)行比較。所述多個(gè)代替語音信號(hào)可存儲(chǔ)在數(shù)據(jù)庫中。舉例來說,圖1的信號(hào)處理模塊122可將第一用戶語音信號(hào)130的第一部分162與存儲(chǔ)在第一數(shù)據(jù)庫124中的代替語音信號(hào)112進(jìn)行比較,如參考圖1進(jìn)一步描述。
方法1400還可包含在1408處基于所述比較而確定用戶語音信號(hào)的所述部分匹配于所述多個(gè)代替語音信號(hào)中的第一代替語音信號(hào)。舉例來說,圖1的信號(hào)處理模塊122可確定第一部分162匹配于第一代替語音信號(hào)172,如參考圖1所描述。
方法1400可進(jìn)一步包含在1410處響應(yīng)于所述確定通過以第一代替語音信號(hào)替換用戶語音信號(hào)的所述部分而產(chǎn)生經(jīng)處理語音信號(hào)。所述經(jīng)處理語音信號(hào)可在話音呼叫期間產(chǎn)生。舉例來說,信號(hào)處理模塊122可響應(yīng)于所述確定通過以第一代替語音信號(hào)172替換第一部分162而產(chǎn)生第一經(jīng)處理語音信號(hào)116。在特定方面,信號(hào)處理模塊122可使用平滑算法來減少對(duì)應(yīng)于第一代替語音信號(hào)172與第一經(jīng)處理語音信號(hào)116的另一部分之間的轉(zhuǎn)變的語音參數(shù)變化,如參考圖1進(jìn)一步描述。
方法1400還可包含在1412處經(jīng)由揚(yáng)聲器輸出經(jīng)處理語音信號(hào)。舉例來說,圖1的第一裝置102可經(jīng)由揚(yáng)聲器142輸出第一經(jīng)處理語音信號(hào)116。
方法1400可進(jìn)一步包含在1414處基于用戶語音信號(hào)的多個(gè)語音參數(shù)而修改第一代替語音信號(hào),且在1416處在數(shù)據(jù)庫中存儲(chǔ)經(jīng)修改第一代替語音信號(hào)。舉例來說,信號(hào)處理模塊122可基于第一用戶語音信號(hào)130的多個(gè)語音參數(shù)修改第一代替語音信號(hào)172以產(chǎn)生經(jīng)修改代替語音信號(hào)176,如參考圖1進(jìn)一步描述。信號(hào)處理模塊122可在第一數(shù)據(jù)庫124中存儲(chǔ)經(jīng)修改代替語音信號(hào)176。
因此,方法1400可實(shí)現(xiàn)通過以與用戶相關(guān)聯(lián)的代替語音信號(hào)替換與同一用戶相關(guān)聯(lián)的用戶語音信號(hào)的一部分而產(chǎn)生經(jīng)處理語音信號(hào)。經(jīng)處理語音信號(hào)可具有比用戶語音信號(hào)更高的音頻質(zhì)量。
圖14的方法1400可由現(xiàn)場(chǎng)可編程門陣列(FPGA)裝置、專用集成電路(ASIC)、處理單元(例如,中央處理單元(CPU))、數(shù)字信號(hào)處理器(DSP)、控制器、另一硬件裝置、固件裝置或其任何組合實(shí)施。作為一實(shí)例,圖14的方法1400可由執(zhí)行指令的處理器執(zhí)行,如相對(duì)于圖19所描述。
參看圖15,展示獲取多個(gè)代替語音信號(hào)的方法的特定說明性方面的流程圖且一般指定為1500。在特定方面,方法1500可對(duì)應(yīng)于圖14的操作1402。方法1500可由圖2的語音信號(hào)管理器262執(zhí)行。
方法1500可包含在1502處接收與用戶相關(guān)聯(lián)的訓(xùn)練語音信號(hào)。舉例來說,圖2的服務(wù)器206可接收與第二用戶154相關(guān)聯(lián)的訓(xùn)練語音信號(hào)272,如參考圖2進(jìn)一步描述。
方法1500還可包含在1504處從訓(xùn)練語音信號(hào)產(chǎn)生多個(gè)代替語音信號(hào),且在1506處在數(shù)據(jù)庫中存儲(chǔ)所述多個(gè)代替語音信號(hào)。舉例來說,語音信號(hào)管理器262可從訓(xùn)練語音信號(hào)272產(chǎn)生代替語音信號(hào)112,如參考圖2進(jìn)一步描述。語音信號(hào)管理器262可在第二數(shù)據(jù)庫264中存儲(chǔ)代替語音信號(hào)112。
因此,方法1500可實(shí)現(xiàn)可用以替換用戶語音信號(hào)的一部分的代替語音信號(hào)的獲取。
圖15的方法1500可由現(xiàn)場(chǎng)可編程門陣列(FPGA)裝置、專用集成電路(ASIC)、處理單元(例如,中央處理單元(CPU))、數(shù)字信號(hào)處理器(DSP)、控制器、另一硬件裝置、固件裝置或其任何組合實(shí)施。作為一實(shí)例,圖15的方法1500可由執(zhí)行指令的處理器執(zhí)行,如相對(duì)于圖19所描述。
參看圖16,展示替換語音信號(hào)的方法的特定說明性方面的流程圖且一般指定為1600。方法1600可由圖1的信號(hào)處理模塊122、圖4的信號(hào)處理模塊422、圖6的信號(hào)處理模塊622、圖7的信號(hào)處理模塊722或其組合執(zhí)行。
方法1600可包含在1602在裝置處基于輸入語音信號(hào)產(chǎn)生搜索準(zhǔn)則。舉例來說,分析器402可基于第一用戶語音信號(hào)130產(chǎn)生搜索準(zhǔn)則418,如參考圖4所描述。作為另一實(shí)例,分析器602可基于第一數(shù)據(jù)630產(chǎn)生搜索準(zhǔn)則612,如參考圖6所描述。
方法1600還可包含在1604處通過基于搜索準(zhǔn)則搜索數(shù)據(jù)庫而產(chǎn)生搜索結(jié)果。所述數(shù)據(jù)庫可存儲(chǔ)與多個(gè)代替語音信號(hào)相關(guān)聯(lián)的語音參數(shù)的集合。舉例來說,搜索器404可通過基于搜索準(zhǔn)則418搜索參數(shù)化數(shù)據(jù)庫424而產(chǎn)生搜索結(jié)果414,如參考圖4所描述。作為另一實(shí)例,搜索器604可基于搜索準(zhǔn)則612產(chǎn)生多個(gè)語音參數(shù)的集合614,如參考圖6所描述。作為另一個(gè)實(shí)例,搜索器704可基于搜索準(zhǔn)則612產(chǎn)生所述多個(gè)代替語音信號(hào)714。參數(shù)化數(shù)據(jù)庫424可包含語音參數(shù)472、474和476。
方法1600可進(jìn)一步包含在1606處基于約束而選擇搜索結(jié)果中的特定搜索結(jié)果。所述特定搜索結(jié)果可與所述多個(gè)代替語音信號(hào)中的第一代替語音信號(hào)相關(guān)聯(lián)。舉例來說,約束分析器406可基于約束而選擇搜索結(jié)果414中的選定結(jié)果416,如參考圖4所描述。選定結(jié)果416可包含第一代替語音信號(hào)172、第一語音參數(shù)472或這兩者。作為另一實(shí)例,約束分析器606可選擇多個(gè)語音參數(shù)的集合614中的第一多個(gè)語音參數(shù)472,如參考圖6所描述。作為另一個(gè)實(shí)例,約束分析器706可選擇所述多個(gè)代替語音信號(hào)714中的第一代替語音信號(hào)172,如參考圖7所描述。
方法1600還可包含在1608處通過以替換語音信號(hào)替換用戶語音信號(hào)的一部分而產(chǎn)生經(jīng)處理語音信號(hào)。所述替換語音信號(hào)可基于特定搜索結(jié)果而確定。舉例來說,合成器408可通過以替換語音信號(hào)替換第一用戶語音信號(hào)130的一部分而產(chǎn)生第一經(jīng)處理語音信號(hào)116,如參考圖4所描述。作為另一實(shí)例,合成器608可通過以替換語音信號(hào)替換第一數(shù)據(jù)630的輸入信號(hào)的一部分而產(chǎn)生第一經(jīng)處理語音信號(hào)116,如參考圖6所描述。作為另一個(gè)實(shí)例,合成器708可通過以替換語音信號(hào)替換第一數(shù)據(jù)630的輸入信號(hào)的一部分而產(chǎn)生第一經(jīng)處理語音信號(hào)116,如參考圖7所描述。
因此,方法1600可實(shí)現(xiàn)通過以代替語音信號(hào)替換輸入語音信號(hào)的一部分而產(chǎn)生經(jīng)處理語音信號(hào)。經(jīng)處理語音信號(hào)可具有比輸入語音信號(hào)更高的音頻質(zhì)量。
圖16的方法1600可由現(xiàn)場(chǎng)可編程門陣列(FPGA)裝置、專用集成電路(ASIC)、處理單元(例如,中央處理單元(CPU))、數(shù)字信號(hào)處理器(DSP)、控制器、另一硬件裝置、固件裝置或其任何組合實(shí)施。作為一實(shí)例,圖16的方法1600可由執(zhí)行指令的處理器執(zhí)行,如相對(duì)于圖19所描述。
參看圖17,展示產(chǎn)生用戶接口的方法的特定說明性方面的流程圖且一般指定為1700。方法1700可由圖1的信號(hào)處理模塊122、圖4的信號(hào)處理模塊422、圖6的信號(hào)處理模塊622、圖7的信號(hào)處理模塊722或其組合執(zhí)行。
方法1700可包含在1702在裝置處產(chǎn)生用戶接口。所述用戶接口可指示與用戶的一或多個(gè)語音信號(hào)相關(guān)聯(lián)的持續(xù)時(shí)間。所述用戶接口可包含添加選項(xiàng)。舉例來說,圖1的信號(hào)處理模塊122可產(chǎn)生用戶接口300,如參考圖3所描述。用戶接口300的第一條302可指示與用戶(例如,“藍(lán)道爾·休斯”)的一或多個(gè)語音信號(hào)相關(guān)聯(lián)的持續(xù)時(shí)間,如參考圖3所描述。用戶接口300可包含添加選項(xiàng)308,如參考圖3所描述。
方法1700還可包含在1704處將用戶接口提供到顯示器。舉例來說,圖1的信號(hào)處理模塊122可將用戶接口300提供到第一裝置102的顯示器,如參考圖3所描述。
方法1700可進(jìn)一步包含在1706處響應(yīng)于接收到添加選項(xiàng)的選擇而產(chǎn)生對(duì)應(yīng)于所述一或多個(gè)語音信號(hào)的多個(gè)代替語音信號(hào)。舉例來說,信號(hào)處理模塊122可響應(yīng)于接收到圖3的添加選項(xiàng)308的選擇而產(chǎn)生對(duì)應(yīng)于所述一或多個(gè)語音信號(hào)的多個(gè)代替語音信號(hào)112。為了說明,信號(hào)處理模塊122可響應(yīng)于接收到添加選項(xiàng)308的選擇而將請(qǐng)求發(fā)送到語音信號(hào)管理器262,且可從語音信號(hào)管理器262接收所述多個(gè)代替語音信號(hào)112,如參考圖3所描述。
因此,方法1700可實(shí)現(xiàn)代替語音信號(hào)的管理。方法1700可實(shí)現(xiàn)對(duì)與用戶相關(guān)聯(lián)的語音信號(hào)的監(jiān)視。方法1700可實(shí)現(xiàn)與選定用戶相關(guān)聯(lián)的代替語音信號(hào)的產(chǎn)生。
圖17的方法1700可由現(xiàn)場(chǎng)可編程門陣列(FPGA)裝置、專用集成電路(ASIC)、處理單元(例如,中央處理單元(CPU))、數(shù)字信號(hào)處理器(DSP)、控制器、另一硬件裝置、固件裝置或其任何組合實(shí)施。作為一實(shí)例,圖17的方法1700可由執(zhí)行指令的處理器執(zhí)行,如相對(duì)于圖19所描述。
參看圖18,展示替換語音信號(hào)的方法的特定說明性方面的流程圖且一般指定為1800。方法1800可由圖1的信號(hào)處理模塊122、圖4的信號(hào)處理模塊422、圖6的信號(hào)處理模塊622、圖7的信號(hào)處理模塊722或其組合執(zhí)行。
方法1800可包含在1802處在存儲(chǔ)本地話音簡(jiǎn)檔的裝置處接收遠(yuǎn)程話音簡(jiǎn)檔,所述本地話音簡(jiǎn)檔與人相關(guān)聯(lián)。舉例來說,第一裝置102的信號(hào)處理模塊122可接收與第二用戶154相關(guān)聯(lián)的遠(yuǎn)程話音簡(jiǎn)檔1174,如參考圖11所描述。第一裝置102可存儲(chǔ)與第二用戶154相關(guān)聯(lián)的本地話音簡(jiǎn)檔1104。
方法1800還可包含在1804處基于遠(yuǎn)程話音簡(jiǎn)檔與本地話音簡(jiǎn)檔的比較或基于與遠(yuǎn)程話音簡(jiǎn)檔相關(guān)聯(lián)的識(shí)別符而確定遠(yuǎn)程話音簡(jiǎn)檔與所述人相關(guān)聯(lián)。舉例來說,信號(hào)處理模塊122可基于與遠(yuǎn)程話音簡(jiǎn)檔1174相關(guān)聯(lián)的語音內(nèi)容和與本地話音簡(jiǎn)檔1104相關(guān)聯(lián)的語音內(nèi)容的比較而確定遠(yuǎn)程話音簡(jiǎn)檔1174與第二用戶154相關(guān)聯(lián),如參考圖11所描述。作為另一實(shí)例,信號(hào)處理模塊122可響應(yīng)于確定遠(yuǎn)程話音簡(jiǎn)檔1174包含與第二用戶154相關(guān)聯(lián)的識(shí)別符1168而確定遠(yuǎn)程話音簡(jiǎn)檔1174與第二用戶154相關(guān)聯(lián),如參考圖11所描述。
方法1800可進(jìn)一步包含在1806在裝置處基于所述確定而選擇本地話音簡(jiǎn)檔用于簡(jiǎn)檔管理。舉例來說,第一裝置102的信號(hào)處理模塊122可基于確定遠(yuǎn)程話音簡(jiǎn)檔1174對(duì)應(yīng)于第二用戶154而選擇本地話音簡(jiǎn)檔1104,如參考圖11所描述。簡(jiǎn)檔管理的實(shí)例可包含(但不限于)基于遠(yuǎn)程話音簡(jiǎn)檔1174更新本地話音簡(jiǎn)檔1104,以及通過產(chǎn)生包含遠(yuǎn)程話音簡(jiǎn)檔1174的表示、本地話音簡(jiǎn)檔1104的表示或這兩者的GUI而將話音簡(jiǎn)檔信息提供到用戶。
方法1800可因此實(shí)現(xiàn)響應(yīng)于從另一裝置接收到人的遠(yuǎn)程話音簡(jiǎn)檔而選擇所述人的本地話音簡(jiǎn)檔用于簡(jiǎn)檔管理。舉例來說,可將本地話音簡(jiǎn)檔與遠(yuǎn)程話音簡(jiǎn)檔進(jìn)行比較。作為另一實(shí)例,可基于遠(yuǎn)程話音簡(jiǎn)檔而更新本地話音簡(jiǎn)檔。
圖18的方法1800可由現(xiàn)場(chǎng)可編程門陣列(FPGA)裝置、專用集成電路(ASIC)、處理單元(例如,中央處理單元(CPU))、數(shù)字信號(hào)處理器(DSP)、控制器、另一硬件裝置、固件裝置或其任何組合實(shí)施。作為一實(shí)例,圖18的方法1800可由執(zhí)行指令的處理器執(zhí)行,如相對(duì)于圖18所描述。
參考圖19,描繪裝置(例如,無線通信裝置)的特定說明性方面的框圖且一般指定為1900。在各種方面中,裝置1900可具有比圖19中說明的組件更多或更少的組件。在說明性方面中,裝置1900可對(duì)應(yīng)于圖1的第一裝置102、移動(dòng)裝置104、桌上型計(jì)算機(jī)106或圖2的服務(wù)器206。在說明性方面中,裝置1900可執(zhí)行本文參考圖1到18所描述的一或多個(gè)操作。
在特定方面,裝置1900包含處理器1906(例如,中央處理單元(CPU)。處理器1906可對(duì)應(yīng)于圖11的處理器1152、處理器1160或這兩者。裝置1900可包含一或多個(gè)額外處理器1910(例如,一或多個(gè)數(shù)字信號(hào)處理器(DSP))。處理器1910可包含語音和音樂譯碼器-解碼器(編解碼器)1908和回聲消除器1912。語音和音樂編解碼器1908可包含聲碼器編碼器1936、聲碼器解碼器1938或這兩者。
裝置1900可包含存儲(chǔ)器1932和編解碼器1934。存儲(chǔ)器1932可對(duì)應(yīng)于圖11的存儲(chǔ)器1132、存儲(chǔ)器1176或這兩者。裝置1900可包含經(jīng)由射頻(RF)模塊1950耦合到天線1942的無線控制器1940。裝置1900可包含耦合到顯示控制器1926的顯示器1128。圖1的揚(yáng)聲器142、一或多個(gè)麥克風(fēng)1946或其組合可耦合到編解碼器1934。編解碼器1934可包含數(shù)/模轉(zhuǎn)換器1902和模/數(shù)轉(zhuǎn)換器1904。在說明性方面中,麥克風(fēng)1946可對(duì)應(yīng)于圖1的麥克風(fēng)144、麥克風(fēng)146、圖2的麥克風(fēng)246、圖12的麥克風(fēng)1244或其組合。在特定方面,編解碼器1934可從麥克風(fēng)1946接收模擬信號(hào),使用模/數(shù)轉(zhuǎn)換器1904將所述模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),且將所述數(shù)字信號(hào)提供到語音和音樂編解碼器1908。語音和音樂編解碼器1908可處理所述數(shù)字信號(hào)。在特定方面,語音和音樂編解碼器1908可將數(shù)字信號(hào)提供到編解碼器1934。編解碼器1934可使用數(shù)/模轉(zhuǎn)換器1902將數(shù)字信號(hào)轉(zhuǎn)換為模擬信號(hào)且可將模擬信號(hào)提供到揚(yáng)聲器142。
存儲(chǔ)器1932可包含圖1的第一數(shù)據(jù)庫124、圖2的第二數(shù)據(jù)庫264、圖4的參數(shù)化數(shù)據(jù)庫424、圖11的本地話音簡(jiǎn)檔1108、遠(yuǎn)程話音簡(jiǎn)檔1178、輸入音頻信號(hào)1130、圖13的分類1346、使用模式設(shè)定1362,或其組合。裝置1900可包含信號(hào)處理模塊1948、圖2的語音信號(hào)管理器262、圖4的數(shù)據(jù)庫分析器410、圖8的應(yīng)用程序822、圖9的搜索模塊922、圖13的模式檢測(cè)器1302、域選擇器1304、文字到語音轉(zhuǎn)換器1322,或其組合。信號(hào)處理模塊1948可對(duì)應(yīng)于圖1的信號(hào)處理模塊122、圖4的信號(hào)處理模塊422、圖6的信號(hào)處理模塊622、圖7的信號(hào)處理模塊722或其組合。在特定方面,語音信號(hào)管理器262、數(shù)據(jù)庫分析器410、圖8的應(yīng)用程序822、圖9的搜索模塊922、圖13的模式檢測(cè)器1302、域選擇器1304、文字到語音轉(zhuǎn)換器1322和/或信號(hào)處理模塊1948的一或多個(gè)組件可包含在處理器1906、處理器1910、編解碼器1934或其組合中。在特定方面,語音信號(hào)管理器262、數(shù)據(jù)庫分析器410、圖8的應(yīng)用程序822、圖9的搜索模塊922、圖13的模式檢測(cè)器1302、域選擇器1304、文字到語音轉(zhuǎn)換器1322和/或信號(hào)處理模塊1948的一或多個(gè)組件可包含在聲碼器編碼器1936、聲碼器解碼器1938或這兩者中。
信號(hào)處理模塊1948、語音信號(hào)管理器262、數(shù)據(jù)庫分析器410、應(yīng)用程序822、搜索模塊922、模式檢測(cè)器1302、域選擇器1304、文字到語音轉(zhuǎn)換器1322或其組合可用以實(shí)施本文所描述的語音信號(hào)替換技術(shù)的硬件方面?;蛘呋蛄硗猓蓪?shí)施軟件方面(或組合的軟件/硬件方面)。舉例來說,存儲(chǔ)器1932可包含可由處理器1910或裝置1900的其它處理單元(例如,處理器1906、編解碼器1934或這兩者)執(zhí)行的指令1956。指令1956可對(duì)應(yīng)于語音信號(hào)管理器262、數(shù)據(jù)庫分析器410、應(yīng)用程序822、搜索模塊922、模式檢測(cè)器1302、域選擇器1304、文字到語音轉(zhuǎn)換器1322、信號(hào)處理模塊1948或其組合。
在特定方面,裝置1900可包含在系統(tǒng)級(jí)封裝或芯片上系統(tǒng)裝置1922中。在特定方面,處理器1906、處理器1910、顯示控制器1926、存儲(chǔ)器1932、編解碼器1934和無線控制器1940包含在系統(tǒng)級(jí)封裝或芯片上系統(tǒng)裝置1922中。在特定方面,輸入裝置1134和電力供應(yīng)器1944耦合到芯片上系統(tǒng)裝置1922。此外,在特定方面,如圖19中所說明,顯示器1128、輸入裝置1134、揚(yáng)聲器142、麥克風(fēng)1946、天線1942和電力供應(yīng)器1944在芯片上系統(tǒng)裝置1922外部。在特定方面,顯示器1128、輸入裝置1134、揚(yáng)聲器142、麥克風(fēng)1946、天線1942和電力供應(yīng)器1944中的每一者可耦合到芯片上系統(tǒng)裝置1922的組件,例如接口或控制器。
裝置1900可包含移動(dòng)通信裝置、智能電話、蜂窩式電話、膝上型計(jì)算機(jī)、計(jì)算機(jī)、平板計(jì)算機(jī)、個(gè)人數(shù)字助理、顯示裝置、電視機(jī)、游戲控制臺(tái)、音樂播放器、無線電、數(shù)字視頻播放器、數(shù)字視頻光盤(DVD)播放器、調(diào)諧器、相機(jī)、導(dǎo)航裝置或其任何組合。
在說明性方面中,處理器1910可操作以執(zhí)行參考圖1到18描述的方法或操作的全部或一部分。舉例來說,麥克風(fēng)1946可俘獲對(duì)應(yīng)于用戶語音信號(hào)的音頻信號(hào)。ADC 1904可將所俘獲的音頻信號(hào)從模擬波形轉(zhuǎn)換為由數(shù)字音頻樣本組成的數(shù)字波形。處理器1910可處理數(shù)字音頻樣本。增益調(diào)節(jié)器可調(diào)節(jié)數(shù)字音頻樣本?;芈曄?912可減少可能已由揚(yáng)聲器142的輸出進(jìn)入麥克風(fēng)1946產(chǎn)生的任何回聲。
處理器1910可將用戶語音信號(hào)的一部分與多個(gè)代替語音信號(hào)進(jìn)行比較。舉例來說,處理器1910可將數(shù)字音頻樣本的一部分與所述多個(gè)語音信號(hào)進(jìn)行比較。處理器1910可確定所述多個(gè)代替語音信號(hào)中的第一代替語音信號(hào)匹配用戶語音信號(hào)的所述部分。處理器1910可通過以第一代替語音信號(hào)替換用戶語音信號(hào)的所述部分而產(chǎn)生經(jīng)處理語音信號(hào)。
聲碼器編碼器1936可壓縮對(duì)應(yīng)于經(jīng)處理語音信號(hào)的數(shù)字音頻樣本,且可形成發(fā)射包(例如,數(shù)字音頻樣本的經(jīng)壓縮位的表示)。所述發(fā)射包可存儲(chǔ)于存儲(chǔ)器1932中。RF模塊1950可調(diào)制某一形式的發(fā)射包(例如,其它信息可附加到發(fā)射包)且可經(jīng)由天線1942發(fā)射經(jīng)調(diào)制數(shù)據(jù)。作為另一實(shí)例,處理器1910可經(jīng)由麥克風(fēng)1946接收訓(xùn)練信號(hào)且可從訓(xùn)練信號(hào)產(chǎn)生多個(gè)代替語音信號(hào)。
作為另一實(shí)例,天線1942可接收包含接收包的傳入包。接收包可由另一裝置經(jīng)由網(wǎng)絡(luò)發(fā)送。舉例來說,接收包可對(duì)應(yīng)于用戶語音信號(hào)。聲碼器解碼器1938可去壓縮所述接收包。經(jīng)去壓縮的波形可被稱作經(jīng)重構(gòu)音頻樣本?;芈曄?912可將回聲從經(jīng)重構(gòu)音頻樣本移除。
處理器1910可將用戶語音信號(hào)的一部分與多個(gè)代替語音信號(hào)進(jìn)行比較。舉例來說,處理器1910可將經(jīng)重構(gòu)音頻樣本的一部分與所述多個(gè)語音信號(hào)進(jìn)行比較。處理器1910可確定所述多個(gè)代替語音信號(hào)中的第一代替語音信號(hào)匹配用戶語音信號(hào)的所述部分。處理器1910可通過以第一代替語音信號(hào)替換用戶語音信號(hào)的所述部分而產(chǎn)生經(jīng)處理語音信號(hào)。增益調(diào)節(jié)器可放大或抑制經(jīng)處理語音信號(hào)。DAC 1902可將經(jīng)處理語音信號(hào)從數(shù)字波形轉(zhuǎn)換為模擬波形且可將經(jīng)轉(zhuǎn)換信號(hào)提供到揚(yáng)聲器142。
與所描述的方面結(jié)合,設(shè)備可包含用于接收遠(yuǎn)程話音簡(jiǎn)檔的裝置。舉例來說,所述用于接收遠(yuǎn)程話音簡(jiǎn)檔的裝置可包含信號(hào)處理模塊1948、處理器1906、處理器1910、RF模塊1950、經(jīng)配置以接收遠(yuǎn)程話音簡(jiǎn)檔的一或多個(gè)其它裝置或電路,或其任何組合。
所述設(shè)備還可包含用于存儲(chǔ)與人相關(guān)聯(lián)的本地話音簡(jiǎn)檔的裝置。舉例來說,所述用于存儲(chǔ)的裝置可包含存儲(chǔ)器1932、信號(hào)處理模塊1948、處理器1906、處理器1910、經(jīng)配置以存儲(chǔ)本地話音簡(jiǎn)檔的一或多個(gè)其它裝置或電路,或其任何組合。
所述設(shè)備可進(jìn)一步包含用于基于根據(jù)與遠(yuǎn)程話音簡(jiǎn)檔相關(guān)聯(lián)的語音內(nèi)容或遠(yuǎn)程話音簡(jiǎn)檔的識(shí)別符確定所述遠(yuǎn)程話音簡(jiǎn)檔與所述人相關(guān)聯(lián)而選擇本地話音簡(jiǎn)檔用于簡(jiǎn)檔管理的裝置。舉例來說,所述用于選擇本地話音簡(jiǎn)檔的裝置可包含信號(hào)處理模塊1948、處理器1906、處理器1910、經(jīng)配置以選擇本地話音簡(jiǎn)檔的一或多個(gè)其它裝置或電路,或其任何組合。
所述用于接收的裝置、所述用于存儲(chǔ)的裝置和所述用于選擇的裝置可集成到以下各項(xiàng)中的至少一者中:交通工具、電子閱讀器裝置、聲學(xué)俘獲裝置、移動(dòng)通信裝置、智能電話、蜂窩式電話、膝上型計(jì)算機(jī)、計(jì)算機(jī)、編碼器、解碼器、平板計(jì)算機(jī)、個(gè)人數(shù)字助理、顯示裝置、電視機(jī)、游戲控制臺(tái)、音樂播放器、無線電、數(shù)字視頻播放器、數(shù)字視頻光盤播放器、調(diào)諧器、相機(jī)或?qū)Ш窖b置。
所屬領(lǐng)域的技術(shù)人員將進(jìn)一步了解結(jié)合本文所揭示的方面描述的各種說明性邏輯塊、配置、模塊、電路和算法步驟可實(shí)施為電子硬件、由處理器執(zhí)行的計(jì)算機(jī)軟件或兩者的組合。上文已大體在其功能性方面描述各種說明性組件、塊、配置、模塊、電路和步驟。此功能性是實(shí)施為硬件還是處理器可執(zhí)行指令取決于特定應(yīng)用和強(qiáng)加于整個(gè)系統(tǒng)的設(shè)計(jì)約束。所屬領(lǐng)域的技術(shù)人員可針對(duì)每一特定應(yīng)用以不同方式來實(shí)施所描述的功能性,此些實(shí)施決策不應(yīng)被解釋為會(huì)導(dǎo)致脫離本發(fā)明的范圍。
應(yīng)注意雖然前述實(shí)例中的一或多者描述與特定個(gè)人相關(guān)聯(lián)的遠(yuǎn)程話音簡(jiǎn)檔和本地話音簡(jiǎn)檔,但此些實(shí)例僅用于說明性目的且不視為限制性的。在特定方面,裝置可存儲(chǔ)“通用”(或默認(rèn))話音簡(jiǎn)檔。舉例來說,當(dāng)通信基礎(chǔ)設(shè)施或環(huán)境不支持交換與個(gè)別個(gè)人相關(guān)聯(lián)的話音簡(jiǎn)檔時(shí)可使用通用話音簡(jiǎn)檔。因此,在某些情形中可在裝置處選擇通用話音簡(jiǎn)檔,包含但不限于當(dāng)與特定呼叫者或被呼叫者相關(guān)聯(lián)的話音簡(jiǎn)檔不可用時(shí),當(dāng)替換(例如,較高質(zhì)量)語音數(shù)據(jù)不可用于特定使用模式或人口統(tǒng)計(jì)域時(shí)等等。在一些實(shí)施方案中,通用話音簡(jiǎn)檔可用以補(bǔ)充與特定個(gè)人相關(guān)聯(lián)的話音簡(jiǎn)檔。為了說明,當(dāng)與特定個(gè)人相關(guān)聯(lián)的話音簡(jiǎn)檔不包含用于特定聲音、使用模式、人口統(tǒng)計(jì)域或其組合的替換語音數(shù)據(jù)時(shí),可改為基于通用話音簡(jiǎn)檔而導(dǎo)出替換語音數(shù)據(jù)。在特定方面,裝置可存儲(chǔ)多個(gè)通用或默認(rèn)話音簡(jiǎn)檔(例如,用于對(duì)話對(duì)振鳴、英語對(duì)法語等的單獨(dú)通用或默認(rèn)話音簡(jiǎn)檔)。
結(jié)合本文中所揭示的方面描述的方法或算法的步驟可以直接用硬件、用由處理器執(zhí)行的軟件模塊、或用這兩者的組合實(shí)施。軟件模塊可駐留在隨機(jī)存取存儲(chǔ)器(RAM)、快閃存儲(chǔ)器、只讀存儲(chǔ)器(ROM)、可編程只讀存儲(chǔ)器(PROM)、可擦除可編程只讀存儲(chǔ)器(EPROM)、電可擦除可編程只讀存儲(chǔ)器(EEPROM)、寄存器、硬盤、可移除式磁盤、壓縮光盤只讀存儲(chǔ)器(CD-ROM)或此項(xiàng)技術(shù)中已知的任何其它形式的非暫時(shí)性儲(chǔ)存媒體中。示范性存儲(chǔ)媒體耦合到處理器,使得處理器可從存儲(chǔ)媒體讀取信息并將信息寫入到存儲(chǔ)媒體。在替代方案中,存儲(chǔ)媒體可與處理器成一體式。處理器及存儲(chǔ)媒體可以駐留在專用集成電路(ASIC)中。ASIC可駐存在計(jì)算裝置或用戶終端中。在替代方案中,處理器及存儲(chǔ)媒體可以作為離散組件駐留在計(jì)算裝置或用戶終端中。
提供對(duì)所揭示方面的先前描述以使得所屬領(lǐng)域的技術(shù)人員能夠制造或使用所揭示的方面。所屬領(lǐng)域的技術(shù)人員將容易明白對(duì)這些方面的各種修改,且在不脫離本發(fā)明的范圍的情況下,本文中所界定的原理可應(yīng)用于其它方面。因此,本發(fā)明并不希望限于本文展示的方面,而應(yīng)被賦予與如通過所附權(quán)利要求書界定的原理及新穎特征一致的可能的最廣范圍。