国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      提供特征變換的有效評(píng)估的方法、裝置、移動(dòng)終端以及計(jì)算機(jī)程序產(chǎn)品的制作方法

      文檔序號(hào):2830470閱讀:161來源:國(guó)知局

      專利名稱::提供特征變換的有效評(píng)估的方法、裝置、移動(dòng)終端以及計(jì)算機(jī)程序產(chǎn)品的制作方法
      技術(shù)領(lǐng)域
      :本發(fā)明的實(shí)施方式總體上涉及特征變換技術(shù),并且更具體地,涉及用于提供對(duì)變換任務(wù)中高斯混合模型(GMM)的有效評(píng)估的方法、裝置以及計(jì)算機(jī)程序產(chǎn)品。
      背景技術(shù)
      :現(xiàn)代通信時(shí)代帶來了有線和無線網(wǎng)絡(luò)的極大擴(kuò)展。在消費(fèi)者需求的驅(qū)動(dòng)下,計(jì)算機(jī)網(wǎng)絡(luò)、電視網(wǎng)絡(luò)和電話網(wǎng)路正在經(jīng)歷前所未有的技術(shù)擴(kuò)展。無線和移動(dòng)網(wǎng)絡(luò)技術(shù)已經(jīng)解決了相關(guān)的消費(fèi)者需求,同時(shí)提供了更為靈活和直接的信息傳送。當(dāng)前和未來的網(wǎng)絡(luò)技術(shù)持續(xù)促進(jìn)信息傳送的簡(jiǎn)易性以及對(duì)用戶的便利性。需要提高信息傳送簡(jiǎn)易性的一個(gè)領(lǐng)域涉及對(duì)移動(dòng)終端用戶的服務(wù)遞送。服務(wù)可以是以用戶所期望的特定媒體或者通信應(yīng)用的形式,諸如音樂播放器、游戲機(jī)、電子書、短消息、電子郵件等等。服務(wù)的形式還可以是交互式應(yīng)用,其中,用戶可以對(duì)網(wǎng)絡(luò)設(shè)備進(jìn)行響應(yīng)以便執(zhí)行任務(wù)或者實(shí)現(xiàn)目標(biāo)。服務(wù)可以由網(wǎng)絡(luò)服務(wù)器或者其他網(wǎng)絡(luò)設(shè)備提供,或者甚至可以由移動(dòng)終端提供,諸如移動(dòng)電話、移動(dòng)電視、移動(dòng)游戲系統(tǒng)等等。在很多應(yīng)用中,需要用戶從網(wǎng)絡(luò)接收音頻信息,諸如口頭反饋或者指令。這種應(yīng)用的例子可以是支付賬單、定購程序、接收駕駛指令等等。此外,在諸如音頻書的一些服務(wù)中,應(yīng)用例如幾乎完全基于接收音頻信息。由計(jì)算機(jī)生成的聲音來提供這樣的音頻信息正在變得曰生成的聲音的質(zhì)量和自然性。因此,進(jìn)行了很多研究和開發(fā)來改進(jìn)計(jì)算機(jī)生成的聲音的質(zhì)量和自然性。所關(guān)注的這種計(jì)算機(jī)生成的聲音的一個(gè)特定應(yīng)用^皮公知為文本轉(zhuǎn)語音(TTS)。TTS是根據(jù)計(jì)算機(jī)可讀文本來創(chuàng)建可聽的語音。通常認(rèn)為TTS包括兩個(gè)階段。首先,計(jì)算機(jī)檢查將要被轉(zhuǎn)換成可聽語音的文本,以確定文本應(yīng)如何發(fā)音、重讀哪些音節(jié)、使用什么音高、以多快的速度遞送語音等的規(guī)范。接下來,計(jì)算機(jī)試圖創(chuàng)建與該規(guī)范匹配的音頻。隨著用于通過TTS來遞送聽起來自然的、高質(zhì)量語音的改進(jìn)手段的發(fā)展,出現(xiàn)了在接收TTS輸出時(shí)進(jìn)一步增強(qiáng)用戶體驗(yàn)的期望。因此,改進(jìn)用戶體驗(yàn)的一種方式是通過熟悉的或者預(yù)期的聲音來遞送TTS輸出。例如,用戶可能希望聽到以他或者她自己的聲音或者其他預(yù)期的目標(biāo)聲音、而不是TTS輸出的源聲音來遞送的TTS輸出。語音到某些目標(biāo)語音的轉(zhuǎn)換是特征變換的一個(gè)示例。為了提供改進(jìn)的特征變換,已經(jīng)發(fā)現(xiàn),基于高斯混合模型(GMM)的技術(shù)在可表示為標(biāo)量或者矢量的特征的變換中是有效的。在基于GMM的變換中,使用源矢量和目標(biāo)矢量的集合來估計(jì)聯(lián)合密度的GMM參數(shù)。由此,可以創(chuàng)建基于GMM的轉(zhuǎn)換函數(shù)。例如,可以使用包括源矢量和目標(biāo)矢量的采樣的一組訓(xùn)練數(shù)據(jù)來訓(xùn)練變換模型。一旦經(jīng)過訓(xùn)練,則變換模型可以用來產(chǎn)生給定輸入源矢量的經(jīng)過變換的矢量。由于期望將經(jīng)過變換的矢量和目標(biāo)矢量之間的均方差(MSE)最小化,使用一組測(cè)試數(shù)據(jù)或者驗(yàn)證數(shù)據(jù)來對(duì)經(jīng)過變換的矢量和目標(biāo)矢量進(jìn)行比較。然而,為了具有高效的變換,常常需要包括大量的訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)二者。例如,數(shù)據(jù)庫可以包含對(duì)應(yīng)于相對(duì)較大數(shù)量的采樣語句的源語音和目標(biāo)語音,其中,60%的采樣用于訓(xùn)練數(shù)據(jù),而40%的采樣用于測(cè)試數(shù)據(jù)。因此,可能增加資源(諸如存儲(chǔ)器和功率)的消耗。特別是在移動(dòng)環(huán)境中,存儲(chǔ)器和功率;肖耗的增加直接影響使用這些方法的設(shè)備的大小和成本。然而,即使在非移動(dòng)環(huán)境中,這樣的方法可能導(dǎo)致用于訓(xùn)練或者測(cè)試模型的算法的長(zhǎng)的處理時(shí)間。由此,需要提供可以有效應(yīng)用的、充分質(zhì)量的特征變換。
      發(fā)明內(nèi)容因此,提供了一種用于在特征變換中提供有效評(píng)估的方法、裝置和計(jì)算機(jī)程序產(chǎn)品。具體地,提供了一種GMM評(píng)估方法、裝置和計(jì)算機(jī)程序產(chǎn)品,其通過在變換模型的訓(xùn)練期間提供用于評(píng)估變換模型質(zhì)量、并由此評(píng)估變換模型的變換性能的機(jī)制,來消除任何對(duì)測(cè)試數(shù)據(jù)或者驗(yàn)證數(shù)據(jù)的需求。因此,可以減少或者消除測(cè)試數(shù)據(jù)或者驗(yàn)證數(shù)據(jù),并且還可以減少相應(yīng)的資源消耗。在一個(gè)示例性實(shí)施方式中,提供了一種在特征變換中提供有效評(píng)估的方法。該方法包括使用訓(xùn)練源數(shù)據(jù)和訓(xùn)練目標(biāo)數(shù)據(jù)來訓(xùn)練高斯混合模型(GMM);響應(yīng)于該訓(xùn)練,產(chǎn)生轉(zhuǎn)換函數(shù);以及通過計(jì)算GMM的跡測(cè)量,在使用該轉(zhuǎn)換函數(shù)之前確定該轉(zhuǎn)換函數(shù)的質(zhì)量。在另一示例性實(shí)施方式中,提供了一種用于在特征變換中提供有效評(píng)估的計(jì)算機(jī)程序產(chǎn)品。該計(jì)算機(jī)程序產(chǎn)品包括至少一個(gè)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其具有存儲(chǔ)在其中的計(jì)算機(jī)可讀程序代碼部分。該計(jì)算機(jī)可讀程序代碼部分包括第一可執(zhí)行部分、第二可執(zhí)行部分和第三可執(zhí)行部分。第一可執(zhí)行部分用于使用訓(xùn)練源數(shù)據(jù)和訓(xùn)練目標(biāo)數(shù)據(jù)來訓(xùn)練高斯混合模型(GMM)。第二可執(zhí)行部分用于響應(yīng)于該訓(xùn)練而產(chǎn)生轉(zhuǎn)換函數(shù)。第三可執(zhí)行部分用于通過計(jì)算GMM的跡測(cè)量在使用該轉(zhuǎn)換函數(shù)之前確定該轉(zhuǎn)換函數(shù)的質(zhì)量。在另一示例性實(shí)施方式中,提供了一種用于在特征變換中提供有效評(píng)估的裝置。該裝置包括訓(xùn)練模塊和變換模塊。訓(xùn)練模塊被配置為使用訓(xùn)練源數(shù)據(jù)和訓(xùn)練目標(biāo)數(shù)據(jù)來訓(xùn)練高斯混合模型(GMM)。變換模塊與訓(xùn)練模塊通信。變換模塊被配置為響應(yīng)于對(duì)GMM的訓(xùn)練,產(chǎn)生轉(zhuǎn)換函數(shù)。訓(xùn)練^t塊一皮進(jìn)一步配置為通過計(jì)算GMM的跡測(cè)量在使用該轉(zhuǎn)換函數(shù)之前確定該轉(zhuǎn)換函數(shù)的質(zhì)量。在另一示例性實(shí)施方式中,提供了一種用于在特征變換中提供有效評(píng)估的移動(dòng)終端。該移動(dòng)終端包括訓(xùn)練模塊和變換模塊。訓(xùn)練模塊被配置為使用訓(xùn)練源數(shù)據(jù)和訓(xùn)練目標(biāo)數(shù)據(jù)來訓(xùn)練高斯混合模型(GMM)。變換模塊與訓(xùn)練模塊通信。變換模塊被配置為響應(yīng)于GMM的訓(xùn)練而產(chǎn)生轉(zhuǎn)換函數(shù),以及使用該GMM將源數(shù)據(jù)輸入轉(zhuǎn)換為目標(biāo)數(shù)據(jù)輸出。訓(xùn)練模塊被進(jìn)一步配置為通過計(jì)算GMM的跡測(cè)量在使用該轉(zhuǎn)換函數(shù)之前確定該轉(zhuǎn)換函數(shù)的質(zhì)量。在另一實(shí)施方式中,提供了一種用于在特征變換中提供有效評(píng)估的裝置。該裝置包括用于使用訓(xùn)練源數(shù)據(jù)和訓(xùn)練目標(biāo)數(shù)據(jù)來訓(xùn)練高斯混合模型(GMM)的裝置;用于響應(yīng)于該訓(xùn)練而產(chǎn)生轉(zhuǎn)換函數(shù)的裝置;以及用于通過計(jì)算GMM的跡測(cè)量來在使用該轉(zhuǎn)換函數(shù)之前確定該轉(zhuǎn)換函數(shù)的質(zhì)量的裝置。本發(fā)明的實(shí)施方式可以提供有益地在TTS系統(tǒng)或者任何其他特征變換環(huán)境中使用的方法、裝置和計(jì)算機(jī)程序產(chǎn)品。因此,例如移動(dòng)終端用戶可以通過使用語音轉(zhuǎn)換來享受定制所聽到的TTS輸出聲音的能力。由此,已經(jīng)總體上描述了本發(fā)明的實(shí)施方式,現(xiàn)在將參考附圖,附圖不必然是按照比例繪制,其中圖1是根據(jù)本發(fā)明示例性實(shí)施方式的移動(dòng)終端的示意性框圖;圖2是根據(jù)本發(fā)明示例性實(shí)施方式的無線通信系統(tǒng)的示例性框圖3是示出了根據(jù)本發(fā)明示例性實(shí)施方式的用于提供對(duì)特征變換的有效評(píng)估的設(shè)備的部分的框圖4示出了在使用本發(fā)明示例性實(shí)施方式的第一試驗(yàn)中收集的跡測(cè)量計(jì)算數(shù)據(jù);圖5示出了在使用本發(fā)明示例性實(shí)施方式的第一試驗(yàn)中收集的跡測(cè)量計(jì)算數(shù)據(jù);以及圖6是根據(jù)本發(fā)明示例性實(shí)施方式的用于提供特征變換的有效評(píng)估的示例性方法的框圖。具體實(shí)施例方式現(xiàn)在將參考附圖更為全面地描述本發(fā)明的實(shí)施方式,附圖中示出了本發(fā)明的一些而非全部實(shí)施方式。實(shí)際上,本發(fā)明可以通過多種不同的形式來實(shí)現(xiàn),并且不應(yīng)將其理解為限于在此記載的實(shí)施方式;相反,提供這些實(shí)施方式是為了滿足適用的法律要求。貫穿附圖,相同的標(biāo)號(hào)表示類似的元素。圖1示出了受益于本發(fā)明實(shí)施方式的移動(dòng)終端10的框圖。然而,應(yīng)當(dāng)理解,所示出的以及此后描述的移動(dòng)電話僅僅是將得益于本發(fā)明實(shí)施方式的一類移動(dòng)終端的示例,因此,并且將其用來限制本發(fā)明的范圍。盡管為了示例的目的而示出并在此后描述了移動(dòng)終端10的若干實(shí)施方式,其他類型的移動(dòng)終端,諸如便攜式數(shù)字助理(PDA)、尋呼機(jī)、移動(dòng)電視、膝上型計(jì)算機(jī)以及其他類型的聲音和文本通信系統(tǒng),可以容易地應(yīng)用本發(fā)明的實(shí)施方式。此外,盡管移動(dòng)終端10執(zhí)行或者使用了本發(fā)明的方法的若干實(shí)施方式,但是該方法可以由移動(dòng)終端之外的其他設(shè)備來使用。而且,本發(fā)明實(shí)施方式的系統(tǒng)和方法將主要結(jié)合移動(dòng)通信應(yīng)用來描述。然而,應(yīng)當(dāng)理解,本發(fā)明實(shí)施方式的系統(tǒng)和方法可以結(jié)合移動(dòng)通信業(yè)以及移動(dòng)通信業(yè)之外二者中的各種其他應(yīng)用來使用。移動(dòng)終端10包括天線12,其可操作地與發(fā)射機(jī)14和接收機(jī)16通信。移動(dòng)終端10還包括控制器20或者分別向收發(fā)機(jī)14及接收機(jī)16提供信號(hào)或從其接收信號(hào)的其他處理元件。信號(hào)包括根據(jù)可應(yīng)用蜂窩系統(tǒng)的空中接口標(biāo)準(zhǔn)的信令信息,以及用戶語音和/或用戶產(chǎn)生的數(shù)據(jù)。在這方面,移動(dòng)終端10能夠與一個(gè)或多個(gè)空中接口標(biāo)準(zhǔn)、通信協(xié)議調(diào)制類型和接入類型一起進(jìn)行操作。通過說明的方式,移動(dòng)終端10能夠按照多個(gè)第一代、第二代和/或第三代通信協(xié)議等中的任意協(xié)議來進(jìn)行操作。例如,移動(dòng)終端IO能夠按照第二代(2G)無線通信協(xié)議IS-136(TDMA)、GSM以及IS-95(CDMA)或者諸如UMTS、CDMA2000和TD-SCDMA的第三代(3G)無線通信協(xié)議來進(jìn)行操作。應(yīng)當(dāng)理解,控制器20包括實(shí)現(xiàn)移動(dòng)終端IO的音頻和邏輯功能所需的電路。例如,控制器20可以包括數(shù)字單處理器設(shè)備、微處理器設(shè)備以及各種模數(shù)轉(zhuǎn)換器、數(shù)模轉(zhuǎn)換器以及其他支持電路。移動(dòng)終端10的控制和信號(hào)處理功能根據(jù)這些設(shè)備各自的能力在其間分配??刂破?0由此還可以包括在進(jìn)行調(diào)制和傳輸之前對(duì)消息和數(shù)據(jù)進(jìn)行巻積編碼和交織的功能性??刂破?0還可以包括內(nèi)部聲音編碼器,并且可以包括內(nèi)部數(shù)據(jù)調(diào)制解調(diào)器。此外,控制器20可以包括操作存儲(chǔ)在存儲(chǔ)器中的一個(gè)或多個(gè)軟件程序的功能性。例如,控制器20可以能夠操作連接程序,諸如傳統(tǒng)的Web瀏覽器。連接程序繼而可以允許移動(dòng)終端10例如才艮據(jù)無線應(yīng)用協(xié)議(WAP)來發(fā)射和接收Web內(nèi)容,諸如基于位置的內(nèi)容。而且,例如控制器20可以能夠操作能夠分析文本和選擇適合于文本的音樂的軟件應(yīng)用。音樂可以存儲(chǔ)在移動(dòng)終端IO上或者作為Web內(nèi)容而一皮訪問。移動(dòng)終端IO還包括用戶接口,該用戶接口包括輸出設(shè)備,諸如傳統(tǒng)的耳機(jī)或者揚(yáng)聲器24;振鈴器22;麥克風(fēng)26;顯示器28以及用戶輸入接口,所有這些都耦接至控制器20。用戶輸入接口允許移動(dòng)終端IO接收數(shù)據(jù),其可以包括允許移動(dòng)終端IO接收數(shù)據(jù)的多種設(shè)備中的任意設(shè)備,諸如小鍵盤30、觸摸顯示器(未示出)或者其他輸入設(shè)備。在包括小鍵盤30的實(shí)施方式中,小鍵盤30可以包括傳統(tǒng)的數(shù)字鍵(0-9)和相關(guān)鍵(#,*),以及用于操作移動(dòng)終端IO的其他鍵??商鎿Q地,小鍵盤30可以包括傳統(tǒng)的QWERTY小鍵盤布置。移動(dòng)終端10還包括電池34,例如"t展動(dòng)電池組,以用于為才喿作移動(dòng)終端10所需的各種電路供電,以及可選地^是供機(jī)械振動(dòng)作為可才全測(cè)輸出。移動(dòng)終端IO還可以包括統(tǒng)一標(biāo)識(shí)才莫塊(UIM)38。UIM38通常是具有內(nèi)置處理器的存儲(chǔ)器設(shè)備。UIM38例如可包括訂戶身份模塊(SIM)、通用集成電路卡(UICC)、通用訂戶身份模塊(USIM)、可移動(dòng)用戶身份模塊(R-UIM)等。UIM38通常存儲(chǔ)與移動(dòng)訂戶相關(guān)的信元。除了UIM38之外,移動(dòng)終端IO可以配備有存儲(chǔ)器。例如,移動(dòng)終端10可以包括易失性存儲(chǔ)器40,例如包括高速緩存區(qū)域的易失性隨機(jī)訪問存儲(chǔ)器(RAM),用于數(shù)據(jù)的臨時(shí)存儲(chǔ)。移動(dòng)終端10還可以包括其他非易失性存儲(chǔ)器42,其可以是嵌入式的和/或可移動(dòng)的。非易失性存儲(chǔ)器42可以附加地或者可替換地包括EEPROM、閃存等,"^者長(zhǎng)口可以乂人Sunnyvale,California的SanDiskCorporation或者Fremont,California的LexarMediaInc.獲得的。存儲(chǔ)器可以存儲(chǔ)移動(dòng)終端10用以實(shí)現(xiàn)移動(dòng)終端IO功能的信息和數(shù)據(jù)的任意數(shù)目的片段。例如,存儲(chǔ)器可以包括標(biāo)識(shí)符,例如國(guó)際移動(dòng)設(shè)備標(biāo)識(shí)(IMEI)碼,其能夠唯一地標(biāo)識(shí)移動(dòng)終端10?,F(xiàn)在參考圖2,提供了將受益于本發(fā)明實(shí)施方式的一類系統(tǒng)的說明。該系統(tǒng)包括多個(gè)網(wǎng)絡(luò)設(shè)備。如圖所示,一個(gè)或多個(gè)移動(dòng)終端10每個(gè)都可以具有天線12,以用于向基點(diǎn)或者基站(BS)44發(fā)射信號(hào)或者從其接收信號(hào)。基站44可以是一個(gè)或多個(gè)蜂窩網(wǎng)絡(luò)或移動(dòng)網(wǎng)絡(luò)的部分,每個(gè)所述網(wǎng)絡(luò)包括^:作該網(wǎng)絡(luò)所需的元件,諸如移動(dòng)交換中心(MSC)46。如本領(lǐng)域j支術(shù)人員所^^知的,還可以將移動(dòng)網(wǎng)全備稱為基站/MSC/互配功能(BMI)。在操作中,當(dāng)移動(dòng)終端10進(jìn)行和接收呼叫時(shí),MSC46能夠路由去往和來自移動(dòng)終端10的呼叫。當(dāng)呼叫涉及移動(dòng)終端10時(shí),MSC46還可以提供對(duì)陸上通信線主干的連接。而且,MSC46能夠控制去往和來自移動(dòng)終端10的消息的轉(zhuǎn)發(fā),并且還可以控制去往和來自消息收發(fā)中心的、針對(duì)移動(dòng)終端10的消息的轉(zhuǎn)發(fā)。應(yīng)當(dāng)注意,盡管圖2的系統(tǒng)中示出了MSC46,但是MSC46僅僅時(shí)示例性網(wǎng)絡(luò)設(shè)備,并且本發(fā)明的實(shí)施方式不限于在采用MSC的網(wǎng)絡(luò)中^f吏用。MSC46可以耦接至數(shù)據(jù)網(wǎng)絡(luò),諸如局域網(wǎng)(LAN)、城域網(wǎng)(MAN)和/或廣域網(wǎng)(WAN)。MSC46可以直4妾耦4妾至數(shù)據(jù)網(wǎng)絡(luò)。然而,在一個(gè)典型實(shí)施方式中,MSC46耦接至GTW(網(wǎng)關(guān))48,而GTW48耦接至例如互聯(lián)網(wǎng)50的WAN。繼而諸如處理元件的設(shè)備(例如,個(gè)人計(jì)算機(jī)、服務(wù)器計(jì)算機(jī)等)可以經(jīng)由互聯(lián)網(wǎng)50而耦接至終端10。例如,如下文所述,處理原件可以包括與如下所述的計(jì)算系統(tǒng)52(在圖2中示出了2個(gè))、源服務(wù)器(在圖2中示出了1個(gè))等相關(guān)聯(lián)一個(gè)或多個(gè)處理元件。BS44可以耦接至信令GPRS(通用分組無線服務(wù))支持節(jié)點(diǎn)(SGSN)56。如本領(lǐng)域技術(shù)人員公知的,SGSN56通常能夠執(zhí)行類似于MSC46的功能以用于分組交換服務(wù)。類似于MSC46,SGSN56可以耦接至例如互聯(lián)網(wǎng)50的數(shù)據(jù)網(wǎng)絡(luò)。SGSN56可以直接耦接至教:據(jù)網(wǎng)絡(luò)。然而,在更典型的實(shí)施方式中,SGSN56耦接至分組交換核心網(wǎng),諸如GPRS核心網(wǎng)58。分組交換核心網(wǎng)耦接至另一GTW48,諸如GTWGPRS支持節(jié)點(diǎn)(GGSN)60,并且GGSN60耦接至互聯(lián)網(wǎng)50。除了GGSN60之外,分組交換核心網(wǎng)還可以耦接至GTW48。而且,GGSN60可以耦接至消息收發(fā)中心。在這方面,類似于MSC46,GGSN60和SGSN56能夠控制消息(例如MMS消息)的轉(zhuǎn)發(fā)。GGSN60和SGSN56還能夠控制去往和來自消息收發(fā)中心的、^N于移動(dòng)終端10的消息的轉(zhuǎn)發(fā)。此外,通過將SGSN56耦接至GPRS核心網(wǎng)58以及GGSN60,諸如計(jì)算系統(tǒng)52和/或源月1務(wù)器54的i殳備可以經(jīng)由互聯(lián)網(wǎng)50、SGSN56以及GGSN60而耦接至移動(dòng)終端10。在這方面,諸如計(jì)算系統(tǒng)52和/或源服務(wù)器54的設(shè)備可以越過SGSN56、GPRS核心網(wǎng)58以及GGSN60來與移動(dòng)終端10進(jìn)行通信。通過直4姿地或者間4妾地將移動(dòng)終端10以及其他設(shè)備(例如,計(jì)算系統(tǒng)52,源服務(wù)器54等)連接至互聯(lián)網(wǎng)50,移動(dòng)終端10例如可按超文本傳輸協(xié)議(HTTP)來與其他設(shè)備進(jìn)行通信,從而實(shí)現(xiàn)移動(dòng)終端10的各種功能。盡管在此沒有示出和描述每個(gè)可能移動(dòng)網(wǎng)絡(luò)的每個(gè)元件,但應(yīng)當(dāng)意識(shí)到,移動(dòng)終端IO可以通過BS44耦接至任意數(shù)目的不同網(wǎng)絡(luò)中的一個(gè)或多個(gè)。在這方面,網(wǎng)絡(luò)可以能夠支持根據(jù)多個(gè)第一代(1G)、第二代(2G)、2.5G和/或第三代(3G)移動(dòng)通信協(xié)議等的任意一個(gè)或多個(gè)協(xié)議的通信。例如,一個(gè)或多個(gè)網(wǎng)絡(luò)能夠支持按照2G無線通信協(xié)議IS-136(TDMA)、GSM和IS-95(CDMA)的通信。而且,例如,一個(gè)或多個(gè)網(wǎng)絡(luò)能夠支持按照2.5G無線通信協(xié)議GPRS、增強(qiáng)數(shù)據(jù)GSM環(huán)境(EDGE)等的通信。此外,例如,一個(gè)或多個(gè)網(wǎng)絡(luò)能夠支持按照諸如采用寬帶碼分多址(WCDMA)無線接入技術(shù)的通用移動(dòng)電話系統(tǒng)(UMTS)網(wǎng)絡(luò)的3G無線通信協(xié)議的通信。一些窄帶AMPS(NAMPS)網(wǎng)絡(luò)和TACS網(wǎng)絡(luò)以及雙?;蛘吒吣J降囊苿?dòng)臺(tái)(例如,數(shù)字/模擬或者TDMA/CDMA/模擬電話)也能夠受益于本發(fā)明的實(shí)施方式。移動(dòng)終端IO還可以耦接至一個(gè)或多個(gè)無線接入點(diǎn)(AP)62。AP62可以包括這樣的接入點(diǎn),其被配置為根據(jù)諸如射頻(RF)、藍(lán)牙(BT)、紅外(IrDA)或者多個(gè)不同的無線網(wǎng)絡(luò)技術(shù)中的任意技術(shù)來與移動(dòng)終端io進(jìn)行通信,其中無線網(wǎng)絡(luò)技術(shù)包括無線LAN(WALN)技術(shù),諸如IEEE802.11(例如,802.11a、802.11b、802.11g、802.11n等);WiMAX技術(shù),諸如IEEE802.16;和/或超寬帶(UWB)技術(shù),諸如IEEE802.15,等等。AP62可以耦接至互聯(lián)網(wǎng)50。類似于MSC46,AP62可以直接耦接至互聯(lián)網(wǎng)50。然而,在一個(gè)實(shí)施方式中,AP62經(jīng)由GTW48間接耦接至互聯(lián)網(wǎng)50。此外,在一個(gè)實(shí)施方式中,可將BS44認(rèn)為是另一個(gè)AP62。將會(huì)意識(shí)到,通過直接或者間接地將移動(dòng)終端10以及計(jì)算系統(tǒng)52、源服務(wù)器54和/或多個(gè)其他設(shè)備中的任意設(shè)備連接至互聯(lián)網(wǎng)50,移動(dòng)終端IO可以相互通信,以及與計(jì)算系統(tǒng)等加以通信,由此執(zhí)行移動(dòng)終端10的各種功能,從而向計(jì)算系統(tǒng)52發(fā)射數(shù)據(jù)、內(nèi)容等和/或從計(jì)算系統(tǒng)52接收內(nèi)容、數(shù)據(jù)等。這里使用的"數(shù)據(jù)"、"內(nèi)容"、"信息"以及類似術(shù)語可以交換使用,以表示能夠按照本發(fā)明的實(shí)施方式來發(fā)射、接收和存儲(chǔ)的數(shù)據(jù)。由此,不應(yīng)將任何這種術(shù)語的使用作為對(duì)本發(fā)明實(shí)施方式的精神和范圍的限制。盡管未在圖2中示出,除了通過互聯(lián)網(wǎng)50將移動(dòng)終端耦接至計(jì)算系統(tǒng)52之外或者作為替代,例如可以才艮據(jù)RF、BT、IrDA或者多種不同的有線或無線通信技術(shù)(包括LAN、WLAN、WiMAX和/或UWB技術(shù))中的任何技術(shù)來將移動(dòng)終端10和計(jì)算系統(tǒng)52彼此耦接和據(jù)此通信。一個(gè)或多個(gè)計(jì)算系統(tǒng)52可以附加地或者可替換地包括能夠存儲(chǔ)內(nèi)容的可移動(dòng)存儲(chǔ)器,此后可以將其傳送至移動(dòng)終端10。此外,移動(dòng)終端10可以耦接至一個(gè)或多個(gè)電子設(shè)備,諸如打印機(jī)、數(shù)字投影儀和/或其他多媒體捕獲、生成和/或存儲(chǔ)設(shè)備(例如,其他終端)。類似于計(jì)算系統(tǒng)52,移動(dòng)終端IO可以被配置為按照諸如RF、BT、IrDA或者多種不同的有線或者無線通信技術(shù)(包括USB、LAN、WLAN、WiMAX和/或UWB技術(shù))中的任意技術(shù)來與便攜式電子設(shè)備通信?,F(xiàn)在將參考圖3描述本發(fā)明的示例性實(shí)施方式,其中,示出了用于在特征變換中提供有效評(píng)估的系統(tǒng)的某些元件。圖3的系統(tǒng)例如可以在圖1的移動(dòng)終端IO上使用。然而,應(yīng)當(dāng)注意,圖3的系統(tǒng)還可以在各種其他設(shè)備(移動(dòng)的和固定的二者)上使用,由此,不應(yīng)將本發(fā)明的實(shí)施方式限于例如圖1的移動(dòng)終端IO的設(shè)備上的應(yīng)用。然而,應(yīng)當(dāng)注意,盡管圖3示出了用于在特征變換中提供有效評(píng)估的系統(tǒng)的一個(gè)配置示例,還可以使用多種其他配置來實(shí)現(xiàn)本發(fā)明的實(shí)施方式。此外,圖3將在文本到語音(TTS)轉(zhuǎn)換的上下文中描述,以示出使用高斯混合模型(GMM)的語音轉(zhuǎn)換被付諸實(shí)踐的示例性實(shí)施方式,盡管如此,本發(fā)明并非必須在TTS的上下文內(nèi)實(shí)踐,而是作為替代可以更為一般地應(yīng)用于特征變換。由此,本發(fā)明的實(shí)施方式可以在其他示例性應(yīng)用中實(shí)踐,例如在如上下文中游戲i殳備中的語音或聲音生成,希望隱藏說話者身份的聊天或者其他應(yīng)用中的聲音轉(zhuǎn)換,翻譯應(yīng)用,等等?,F(xiàn)在參考圖3,提供了一種用于在特征變換中提供有效評(píng)估的系統(tǒng)。該系統(tǒng)包括訓(xùn)練模塊72和變換模塊74。訓(xùn)練模塊72和變換模塊74的每一個(gè)可以是在硬件、軟件或者硬件和軟件的結(jié)合中實(shí)現(xiàn)的任何設(shè)備或者裝置,所述硬件、軟件或者硬件和軟件的結(jié)合能夠執(zhí)行如下所述的與每個(gè)對(duì)應(yīng)模塊相關(guān)聯(lián)的各自功能。在示例性實(shí)施方式中,訓(xùn)練模塊72和變換模塊74作為指令包含在軟件中,其存儲(chǔ)在移動(dòng)終端IO的存儲(chǔ)器中,并由控制器20來執(zhí)行。應(yīng)當(dāng)注意到,盡管圖3將訓(xùn)練模塊72示為與變換模塊74分離的元件,但是也可以將訓(xùn)練模塊72和變換模塊74置于或者實(shí)現(xiàn)于單個(gè)模塊或者設(shè)備中,該單個(gè)模塊或者設(shè)備能夠執(zhí)行訓(xùn)練模塊72和變換模塊74二者的功能。而且,如上所述,本發(fā)明的實(shí)施方式不限于TTS應(yīng)用。因此,可以將能夠產(chǎn)生用于變換、轉(zhuǎn)換、壓縮等的數(shù)據(jù)輸入(包括但不限于與上文所列的示例性應(yīng)用相關(guān)聯(lián)的數(shù)據(jù)輸入)的任何設(shè)備或裝置預(yù)想為提供數(shù)據(jù)源,諸如圖3的系統(tǒng)的源語音80。根據(jù)本示例性實(shí)施方式,能夠從計(jì)算機(jī)文本產(chǎn)生合成語音的TTS元件能夠提供源語音80。繼而可以將源語音80發(fā)送給變換模塊74。變換模塊74能夠?qū)⒃凑Z音80變換為目標(biāo)語音82。在這方面,可以使用變換模塊74來構(gòu)建變換模型,該模型基本上是用于將源語音80變換為目標(biāo)語音82的已訓(xùn)練GMM。為了產(chǎn)生變換模型,使用源語音數(shù)據(jù)84和訓(xùn)練目標(biāo)語音數(shù)據(jù)86來訓(xùn)練GMM,以確定轉(zhuǎn)換函數(shù)78,繼而使用該轉(zhuǎn)換函數(shù)78來將語音80變換為目標(biāo)語音82。為了理解轉(zhuǎn)換函數(shù)78,提供一些背景信息。假設(shè)本領(lǐng)域技術(shù)人員確定數(shù)據(jù)集足夠長(zhǎng),則可以通過使用例如最大期望(EM)的經(jīng)典算法來根據(jù)z個(gè)采樣hz2...zt...Zp]的序列估計(jì)GMM分布的隨機(jī)變量z的概率密度函數(shù)(PDF)。在具體情況下,當(dāng)z呵xTyT]T是聯(lián)合變量時(shí),z的分布可以充當(dāng)變量x和y之間的概率映射。由此,在示例性聲音轉(zhuǎn)換應(yīng)用中,x和y分別可以對(duì)應(yīng)于來自源揚(yáng)聲器和目標(biāo)揚(yáng)聲器的類似特征。例如,x和y可以分別對(duì)應(yīng)于從源揚(yáng)聲器和目標(biāo)揚(yáng)聲器的語音的給定短片段中提取的線性頻語(LSF)??梢匀绻?1)中通過GMM來對(duì)z的分布建才莫<formula>formulaseeoriginaldocumentpage17</formula>(1)其中c/是分量/的先驗(yàn)概率(§。=1并且論",L表示多個(gè)混合,并且叫表示具有均值w和協(xié)方差矩陣s的高斯分布。可以使用EM算法來估計(jì)GMM的參數(shù)。對(duì)于實(shí)際變換,所期望的是函數(shù)F",使得對(duì)于訓(xùn)練集中的所有數(shù)據(jù),經(jīng)過變換的i^xy都最佳匹配目標(biāo)yt。將源特征Xt轉(zhuǎn)換為目標(biāo)特征yt的轉(zhuǎn)換函數(shù)由公式(2)給出<formula>formulaseeoriginaldocumentpage18</formula>(2)加權(quán)項(xiàng)A仏)被選為特征矢量x,屬于不同分量的條件概率。為了在變換模塊74執(zhí)行變換,初始地由訓(xùn)練模塊72對(duì)例如由公式(1)給出的GMM進(jìn)行訓(xùn)練。在這方面,訓(xùn)練才莫塊72接收訓(xùn)練凄史據(jù),訓(xùn)練數(shù)據(jù)包括訓(xùn)練源語音數(shù)據(jù)84和訓(xùn)練目標(biāo)語音數(shù)據(jù)86。在示例性實(shí)施方式中,訓(xùn)練數(shù)據(jù)例如可以表示對(duì)應(yīng)于由源聲音說出的預(yù)定數(shù)目的語句的音頻,以及由目標(biāo)聲音說出的該預(yù)定數(shù)目的語句中每一句的對(duì)應(yīng)音頻,所述音頻例如存儲(chǔ)在數(shù)據(jù)庫中。在示例性實(shí)施方式中,可以這樣來獲取訓(xùn)練目標(biāo)語音數(shù)據(jù)86:提示用戶輸入與按照源聲音記錄的所存儲(chǔ)的段相對(duì)應(yīng)的目標(biāo)聲音說出的語句。換言之,移動(dòng)終端10可以執(zhí)行訓(xùn)練程序,在此期間要求用戶重復(fù)某些預(yù)先記錄的語句,這些語句是按照源聲音記錄的。由此,當(dāng)用戶按照用戶的目標(biāo)語音來重復(fù)語句時(shí),可以獲取訓(xùn)練數(shù)據(jù)。訓(xùn)練模型72迭代地處理訓(xùn)練數(shù)據(jù),以構(gòu)建變換模型。實(shí)際上,訓(xùn)練模型72使用訓(xùn)練源語音數(shù)據(jù)84和訓(xùn)練目標(biāo)語音數(shù)據(jù)86來找到轉(zhuǎn)換函數(shù)78,該轉(zhuǎn)換函數(shù)78提供從訓(xùn)練源語音數(shù)據(jù)84到訓(xùn)練目標(biāo)語音數(shù)據(jù)86的相對(duì)高質(zhì)量的變換。繼而,只要訓(xùn)練模塊72確定了變換模型,變換模塊74可以使用轉(zhuǎn)換函數(shù)78來提供目標(biāo)語音82作為輸出,以響應(yīng)源語音80的任何輸入。換言之,當(dāng)確定了轉(zhuǎn)換函數(shù)78時(shí),可以認(rèn)為變換模塊74被"訓(xùn)練"為將任何源語音輸入轉(zhuǎn)換為對(duì)應(yīng)的目標(biāo)語音輸出。如上所述,訓(xùn)練模塊72希望提供相對(duì)高質(zhì)量的變換。在之前的方法中,確定變換的質(zhì)量水平是通過測(cè)試數(shù)據(jù)或者確認(rèn)數(shù)據(jù)進(jìn)行的。如上文概述的,,可以計(jì)算轉(zhuǎn)換的MSE(或者轉(zhuǎn)換誤差),以確定用于測(cè)試的目標(biāo)語音數(shù)據(jù)與從用于測(cè)試的源語音數(shù)據(jù)的轉(zhuǎn)換得到的經(jīng)轉(zhuǎn)換語音之間的差異或者距離。換言之,根據(jù)之前的方法,使用訓(xùn)練數(shù)據(jù)來得到轉(zhuǎn)換函數(shù)。繼而可以通過對(duì)測(cè)試數(shù)據(jù)執(zhí)行轉(zhuǎn)換來確認(rèn)轉(zhuǎn)換函數(shù),其中所述測(cè)試數(shù)據(jù)用以確定轉(zhuǎn)換的質(zhì)量水平。因此,必須將存儲(chǔ)器分配給訓(xùn)練和測(cè)試數(shù)據(jù)二者,并且在得到適當(dāng)?shù)霓D(zhuǎn)換函數(shù)之前,處理可能導(dǎo)致訓(xùn)練和測(cè)試評(píng)估的多次迭代。期望用于測(cè)試的目標(biāo)語音數(shù)據(jù)與從用于測(cè)試的源語音數(shù)據(jù)的轉(zhuǎn)換得到的經(jīng)轉(zhuǎn)換語音之間的差異或者距離是最小值。公式(3)給出了差異(D)的公式,其中,當(dāng)D最小化時(shí),GMM參數(shù)的優(yōu)化得以實(shí)現(xiàn)。"丄力ly廣F(x')ll(3)本發(fā)明的示例性實(shí)施方式通過在GMM的訓(xùn)練階—提期間測(cè)量GMM的跡測(cè)量或者質(zhì)量,以此允許減少或者消除測(cè)試數(shù)據(jù)。根據(jù)本發(fā)明的示例性實(shí)施方式,使用給定x的y的分布方差(也即,s(x)^var(yjx).s(x)),可以從數(shù)據(jù)/模型統(tǒng)計(jì)得出用于消除轉(zhuǎn)換誤差的另一方法。可以認(rèn)為e(x)是對(duì)映射不確定性的測(cè)量。一4史來說,s(x)越窄,轉(zhuǎn)換可能越準(zhǔn)確。該思想與公式(3)直接有關(guān),并且是質(zhì)量評(píng)價(jià)的良好替代。由此,理論上可以通過公式(4)來測(cè)量GMM的質(zhì)量,其中公式(4)計(jì)算跡測(cè)量Q。^=JV(x)'p(x),血.(4)實(shí)踐中,模型質(zhì)量的評(píng)估包括將變量的每個(gè)不同混合考慮在內(nèi)。因此,必須針對(duì)每個(gè)混合執(zhí)行計(jì)算。由此,公式(4)計(jì)算起來可能是計(jì)算復(fù)雜的。然而,為了降低計(jì)算復(fù)雜性,可以由公式(5)的近似來替代公式(4)。0力沐,余)(5)在公式(5)中,,0表示矩陣的跡,并且w,是用于第/個(gè)分量的權(quán)重。由此,可以更為簡(jiǎn)單、快速地計(jì)算跡測(cè)量Q,從而可以按照有效的方式將跡測(cè)量用于GMM性能的評(píng)估。GMM例如可應(yīng)用于DCT(離散余弦變換)域特征。經(jīng)過DCT的特征的解相關(guān)趨勢(shì)確保了幾乎對(duì)角的協(xié)方差矩陣,由此使得公式(5)的跡測(cè)量更準(zhǔn)確。然而,在任何情況下,當(dāng)跡測(cè)量(Q值)以可比較方式下降時(shí),GMM模型執(zhí)行地更好。由于可以非常有效地計(jì)算跡測(cè)量,并且測(cè)量可以無需任何確認(rèn)數(shù)據(jù)而直接在變換模型本身之上完成,例如可以使用跡測(cè)量來將訓(xùn)練模塊72導(dǎo)向更好的建模。例如,在訓(xùn)練期間,可以存在應(yīng)用訓(xùn)練集數(shù)據(jù)以及計(jì)算結(jié)果轉(zhuǎn)換函數(shù)78的相應(yīng)Q值的多次迭代。在本發(fā)明的一個(gè)示例性實(shí)施方式中,在應(yīng)用訓(xùn)練集數(shù)據(jù)以及計(jì)算結(jié)果轉(zhuǎn)換函數(shù)的相應(yīng)Q值的每次迭代之后,可以將相應(yīng)的Q值或者Q值的改變與某閾值進(jìn)行比較。例如,可以使用Q值的改變或者基于跡測(cè)量的一些其他終止標(biāo)準(zhǔn)。在示例性實(shí)施方式中,如果Q值低于閾值,則可以認(rèn)為結(jié)果轉(zhuǎn)換函數(shù)78可能產(chǎn)生可接受質(zhì)量的從源語音到目標(biāo)語音的變換。由此,如果Q值低于閾值,不需要應(yīng)用訓(xùn)練數(shù)據(jù)的進(jìn)一步迭代來得到轉(zhuǎn)換函數(shù),而是使用當(dāng)前的結(jié)果轉(zhuǎn)換模型。同時(shí),如果Q值高于閾值,可以執(zhí)行應(yīng)用訓(xùn)練數(shù)據(jù)的進(jìn)一步迭代,可以修改變換模型,可以獲取不同的訓(xùn)練數(shù)據(jù)或者可以進(jìn)行對(duì)轉(zhuǎn)換函數(shù)78的多種其他修改中的任意修改,以改進(jìn)Q值以用于后續(xù)^t乘作。閾值可以是這樣的值在該閾值處或者之下,變換模型的質(zhì)量是可接受的。閾值可以具有在多種條件下變化的值。例如,閾值的值例如可以取決于混合數(shù)目、數(shù)據(jù)范圍、數(shù)據(jù)的已知統(tǒng)計(jì)屬性、維度數(shù)目等等。在備選示例性實(shí)施方式中,可以執(zhí)行應(yīng)用測(cè)試集以及計(jì)算結(jié)果轉(zhuǎn)換函數(shù)的相應(yīng)Q值的多次迭代。然而,在此備選實(shí)施方式中,可以將每個(gè)Q值進(jìn)行相互比較,并且選擇與最低Q值相關(guān)聯(lián)的結(jié)果轉(zhuǎn)換函數(shù)來使用。由于可以非常有效地計(jì)算跡測(cè)量,本發(fā)明的實(shí)施方式有益地用于計(jì)算資源和存儲(chǔ)器資源有限的嵌入式應(yīng)用。然而,本發(fā)明的實(shí)施方式還可以有益地應(yīng)用于計(jì)算資源不受限制的應(yīng)用,因?yàn)楸景l(fā)明的實(shí)施方式可以增加產(chǎn)生可接受質(zhì)量的變換模型所需的迭代的數(shù)目。在聲音轉(zhuǎn)換的上下文中使用本發(fā)明的示例性實(shí)施方式,在研究中得到了音高和線性頻譜(LSF)參數(shù)的實(shí)踐結(jié)果,該參數(shù)在語音識(shí)別中是重要的。在測(cè)試情況下,將兩個(gè)說話者(一個(gè)男性和一個(gè)女性)平行地講話用于訓(xùn)練(90句)和測(cè)試(99句)。使用EM算法來訓(xùn)練模型。圖4和圖5示出了在使用本發(fā)明示例性實(shí)施方式的第一試驗(yàn)中收集的數(shù)據(jù)。進(jìn)行第一試驗(yàn)是為了驗(yàn)證跡測(cè)量可以有意義地評(píng)估具有不同混合數(shù)目的不同模型。圖4和圖5示出在此實(shí)施方式中,在大約8個(gè)混合之后,Q值的下降速率還是逐漸停止。然而,隨著混合(mixture)數(shù)目的增加,計(jì)算負(fù)載增加。因此,為了給出相對(duì)較低的Q值(也即,高質(zhì)量變換)與相對(duì)較低的計(jì)算負(fù)載之間的良好權(quán)衡,可以將LSF和音高的混合的適當(dāng)目選在8到16之間。進(jìn)行第二試驗(yàn)也是為了將跡測(cè)量與使用MSE的傳統(tǒng)測(cè)試機(jī)制進(jìn)行比較。在第二試驗(yàn)中,再次對(duì)音高和LSF參數(shù)進(jìn)行評(píng)估。訓(xùn)練是在正則化數(shù)據(jù)(也即,首先對(duì)特征進(jìn)行縮放和DCT)上完成的。表1示出了按照傳統(tǒng)技術(shù)使用MSE評(píng)估的GMM性能。相應(yīng)地,訓(xùn)練和測(cè)試是針對(duì)男到女轉(zhuǎn)換和女到男轉(zhuǎn)換而執(zhí)行的。表l示出男到女轉(zhuǎn)換的質(zhì)量好于女到男轉(zhuǎn)換(較小的誤差)。表l還示出對(duì)于在此試驗(yàn)中使用的數(shù)據(jù),LSF模型1的表現(xiàn)好于LSF模型2。同時(shí),表2示出了按照公式(5)使用跡測(cè)量評(píng)估的GMM性能。從表2可以看出,男到女轉(zhuǎn)換的質(zhì)量好于女到男轉(zhuǎn)換(較小的誤差),并且LSF模型1的表現(xiàn)好于LSF模型2。因此,通過檢查表1或者表2,關(guān)于模型質(zhì)量可以得出相同的結(jié)論。由此,為了相對(duì)較低的計(jì)算復(fù)雜性以及不需要任何測(cè)試數(shù)據(jù)需求,可以認(rèn)為跡測(cè)量是變換任務(wù)中GMM質(zhì)量和性能的有效、高效的測(cè)量。<table>tableseeoriginaldocumentpage21</column></row><table><table>tableseeoriginaldocumentpage22</column></row><table>表2.使用跡評(píng)估的GMM性能(正則化特征)圖6是根據(jù)本發(fā)明示例性實(shí)施方式的系統(tǒng)、方法和程序產(chǎn)品的流程圖。應(yīng)當(dāng)理解,流程圖中每個(gè)塊或者步驟以及流程圖中塊的組合可以通過各種手l史來實(shí)現(xiàn),例如通過硬件、固件和/或包括一個(gè)或多個(gè)計(jì)算機(jī)程序指令的軟件。例如,可以通過計(jì)算機(jī)程序指令來實(shí)現(xiàn)上述一個(gè)或多個(gè)過程。在這方面,實(shí)現(xiàn)上述過程的計(jì)算機(jī)程序指令可以由移動(dòng)終端的存儲(chǔ)器設(shè)備來存儲(chǔ),并且由移動(dòng)終端中的內(nèi)置處理器來執(zhí)行。將會(huì)意識(shí)到,任何這樣的計(jì)算機(jī)程序指令可以被裝載到計(jì)算機(jī)或者其他可編程裝置(也即,硬件)上,以產(chǎn)生機(jī)器,使得在該計(jì)算機(jī)或者其他可編程裝置上執(zhí)行的指令創(chuàng)建用于實(shí)現(xiàn)流程圖的塊或者步驟中所規(guī)定功能的裝置。這些計(jì)算機(jī)程序指令還可以存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)器中,該計(jì)算機(jī)可讀存儲(chǔ)器可以指引計(jì)算機(jī)或者其他可編程裝置按照特定的方式進(jìn)行操作,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生制品,該制品包括實(shí)現(xiàn)在流程圖的塊或者步驟中所規(guī)定功能的指令裝置。計(jì)算機(jī)程序指令還可以載入到計(jì)算機(jī)或者其他可編程裝置上,以使得一系列可操作步驟在該計(jì)算機(jī)或者其他可編程裝置上執(zhí)行,以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的過程,使得在該計(jì)算機(jī)或者其他可編程裝置上執(zhí)行的指令提供用于實(shí)現(xiàn)流程圖的塊或者步驟中所規(guī)定功能的步驟。因此,流程圖的塊或者步驟支持用于執(zhí)行所規(guī)定功能的裝置的組合、用于執(zhí)行所規(guī)定功能的步驟的組合、以及用于執(zhí)行所規(guī)定功能的程序指令裝置。應(yīng)當(dāng)理解,流程圖的一個(gè)或者多個(gè)塊或者步驟以及流程圖中塊或者步驟的組合可以通過基于專用硬件的計(jì)算機(jī)系統(tǒng)(該計(jì)算機(jī)系統(tǒng)執(zhí)行所規(guī)定的功能或者步驟)或者專用硬件和計(jì)算機(jī)指令的組合來實(shí)現(xiàn)。在這方面,提供特征變換的有效評(píng)估的方法的一個(gè)實(shí)施方式包括在操作100處,使用訓(xùn)練源數(shù)據(jù)和訓(xùn)練目標(biāo)數(shù)據(jù)來訓(xùn)練高斯混合模型(GMM)。在操作110處,響應(yīng)于GMM的訓(xùn)練,產(chǎn)生轉(zhuǎn)換函數(shù)。在操作120處,通過計(jì)算GMM的跡測(cè)量,在使用轉(zhuǎn)換函數(shù)之前確定轉(zhuǎn)換函數(shù)的質(zhì)量。下面的操作122和124可選地執(zhí)行。在操作122期間,可以將跡測(cè)量與閾值進(jìn)行比較。如果跡測(cè)量在閾值之上,可以在操作124對(duì)轉(zhuǎn)換函數(shù)進(jìn)行修改。如果跡測(cè)量在閾值之下,則可以在操作130處使用該轉(zhuǎn)換函數(shù)將源數(shù)據(jù)輸入轉(zhuǎn)換為目標(biāo)數(shù)據(jù)輸出。除了使用側(cè)測(cè)量以改進(jìn)GMM訓(xùn)練之外,可以在需要GMM才莫型評(píng)估的所有情況下^f吏用跡測(cè)量。訓(xùn)練GMM可以-使用訓(xùn)練源聲音^:據(jù)和訓(xùn)練目標(biāo)聲音數(shù)據(jù)來完成。而且,可以獲取訓(xùn)練目標(biāo)聲音數(shù)據(jù),以對(duì)應(yīng)于先前記錄的訓(xùn)練源聲音數(shù)據(jù)。此外,還可以獲取新的訓(xùn)練源聲音數(shù)據(jù),也即無需先前記錄訓(xùn)練源聲音數(shù)據(jù)。另外,在示例性實(shí)施方式中,目標(biāo)數(shù)據(jù)可以預(yù)先記錄,并且剛好在訓(xùn)練之前獲取源數(shù)據(jù)。上述方式可以按照多種方式來執(zhí)行。例如,可以使用用于實(shí)現(xiàn)上述每個(gè)功能的適當(dāng)裝置來執(zhí)行本發(fā)明的實(shí)施方式。在一個(gè)實(shí)施方式中,本發(fā)明元件的所有或者部分一般地在計(jì)算機(jī)程序產(chǎn)品的控制下進(jìn)行操作。用于執(zhí)行本發(fā)明實(shí)施方式的方法的計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),例如非易失性存儲(chǔ)介質(zhì);以及計(jì)算機(jī)可讀程序代碼部分,例如一系列計(jì)算機(jī)指令,其包含在計(jì)算機(jī)先前記錄的訓(xùn)練源聲音數(shù)據(jù)中。此外,還可以獲取新的訓(xùn)練源聲音數(shù)據(jù),也即無需先前記錄訓(xùn)練源聲音數(shù)據(jù)。另外,在示例性實(shí)施方式中,目標(biāo)數(shù)據(jù)可以預(yù)先記錄,并且剛好在訓(xùn)練之前獲取源數(shù)據(jù)。上述方式可以按照多種方式來執(zhí)行。例如,可以使用用于實(shí)現(xiàn)上述每個(gè)功能的適當(dāng)裝置來執(zhí)行本發(fā)明的實(shí)施方式。在一個(gè)實(shí)施方式中,本發(fā)明元件的所有或者部分一般地在計(jì)算機(jī)程序產(chǎn)品的控制下進(jìn)行操作。用于執(zhí)行本發(fā)明實(shí)施方式的方法的計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),例如非易失性存儲(chǔ)介質(zhì);以及計(jì)算機(jī)可讀程序代碼部分,例如一系列計(jì)算機(jī)指令,其包含在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中。而且,應(yīng)當(dāng)注意到,盡管先前的描述參考模塊,將會(huì)理解,這種術(shù)語是為了方便而使用,由此,上文的模塊無需被模塊化,而可以是集成的,并且代碼可以按照任何預(yù)期的方式插入。本領(lǐng)域的技術(shù)人員將會(huì)想到對(duì)在此記載的本發(fā)明的多種修改和其他實(shí)施方式,對(duì)于本領(lǐng)域技術(shù)人員而言,這些發(fā)明屬于具有上文描述和相關(guān)聯(lián)附圖中給出的啟示的移除。因此,應(yīng)當(dāng)理解,本發(fā)明的實(shí)施方式不限于所公開的具體實(shí)施方式,并且意在將修改和其他實(shí)施方式包含在所附權(quán)利要求書的范圍之內(nèi)。盡管在此使用了特定的術(shù)語,但僅僅是在一般性和描述性的意義上使用這些術(shù)語,而不是出于限制性目的。權(quán)利要求1.一種方法,包括使用訓(xùn)練源數(shù)據(jù)和訓(xùn)練目標(biāo)數(shù)據(jù)來訓(xùn)練高斯混合模型(GMM);響應(yīng)于所述訓(xùn)練,產(chǎn)生轉(zhuǎn)換函數(shù);以及通過計(jì)算所述GMM的跡測(cè)量,在使用所述轉(zhuǎn)換函數(shù)之前確定所述轉(zhuǎn)換函數(shù)的質(zhì)量。2.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括,此后,使用所述轉(zhuǎn)換函數(shù)將源數(shù)據(jù)輸入轉(zhuǎn)換為目標(biāo)數(shù)據(jù)輸出。3.根據(jù)權(quán)利要求1所述的方法,其中,訓(xùn)練所述GMM包括使用訓(xùn)練源聲音數(shù)據(jù)和訓(xùn)練目標(biāo)聲音數(shù)據(jù)來訓(xùn)練所述GMM。4.根據(jù)權(quán)利要求3所述的方法,進(jìn)一步包括記錄所述訓(xùn)練目標(biāo)聲音數(shù)據(jù)以對(duì)應(yīng)于先前記錄的訓(xùn)練源聲音數(shù)據(jù)的初始#:作。5.根據(jù)權(quán)利要求1所述的方法,其中,使用以下公式來計(jì)算所述跡測(cè)量^'"J"s(x)'/Kx;i'A。6.根據(jù)權(quán)利要求1所述的方法,其中,使用以下近似來計(jì)算所述<formula>formulaseeoriginaldocumentpage2</formula>。7.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括將所述跡測(cè)量與閾值進(jìn)行比較。8.根據(jù)權(quán)利要求7所述的方法,進(jìn)一步包括響應(yīng)于所述跡測(cè)量與所述閾值的比較,修改所述轉(zhuǎn)換函數(shù)。9.根據(jù)權(quán)利要求7所述的方法,進(jìn)一步包括基于以下各項(xiàng)的一個(gè)或多個(gè)來改變所述閾值混合數(shù)目;維度數(shù)目;數(shù)據(jù)的已知統(tǒng)計(jì)屬性;以及數(shù)據(jù)范圍。10.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括計(jì)算與基于相應(yīng)的不同GMM的多個(gè)轉(zhuǎn)換函數(shù)相對(duì)應(yīng)的多個(gè)跡測(cè)量,以及選擇具有最低跡測(cè)量的至少一個(gè)所述轉(zhuǎn)換函數(shù),以用于將所述源數(shù)據(jù)輸入轉(zhuǎn)換為所述目標(biāo)數(shù)據(jù)輸出。11.一種計(jì)算機(jī)程序產(chǎn)品,包括至少一個(gè)計(jì)算機(jī)可讀介質(zhì),所述介質(zhì)具有存儲(chǔ)在其中的計(jì)算機(jī)可讀程序代碼部分,所述計(jì)算機(jī)可讀程序代碼部分包括第一可執(zhí)行部分,用于使用訓(xùn)練源數(shù)據(jù)和訓(xùn)練目標(biāo)數(shù)據(jù)來訓(xùn)練高斯混合模型(GMM);第二可執(zhí)行部分,用于響應(yīng)于所述訓(xùn)練來產(chǎn)生轉(zhuǎn)換函數(shù);以及第三可寺A^于部分,用于通過計(jì)算所述GMM的跡測(cè)量,在使用所述轉(zhuǎn)換函數(shù)之前確定所述轉(zhuǎn)換函數(shù)的質(zhì)量。12.根據(jù)權(quán)利要求11所述的計(jì)算機(jī)程序產(chǎn)品,進(jìn)一步包括第四可執(zhí)行部分,用于在此后使用所述轉(zhuǎn)換函數(shù)將源數(shù)據(jù)輸入轉(zhuǎn)換為目標(biāo)數(shù)據(jù)輸出。13.根據(jù)權(quán)利要求11所述的計(jì)算機(jī)程序產(chǎn)品,其中,所述第一可執(zhí)行部分包括用于使用訓(xùn)練源聲音數(shù)據(jù)和訓(xùn)練目標(biāo)聲音數(shù)據(jù)來訓(xùn)練所述GMM的指令。14.根據(jù)權(quán)利要求13所述的計(jì)算機(jī)程序產(chǎn)品,進(jìn)一步包括第四可執(zhí)行部分,用于執(zhí)行記錄所述訓(xùn)練目標(biāo)聲音數(shù)據(jù)以對(duì)應(yīng)于先前記錄的訓(xùn)練源聲音數(shù)據(jù)的初始操作。15.根據(jù)權(quán)利要求11所述的計(jì)算機(jī)程序產(chǎn)品,其中,使用以下近似來計(jì)算所述跡測(cè)量m。16.根據(jù)權(quán)利要求11所述的計(jì)算機(jī)程序產(chǎn)品,進(jìn)一步包括第四可執(zhí)行部分,用于將所述跡測(cè)量與閾值進(jìn)行比較。17.根據(jù)權(quán)利要求16所述的計(jì)算機(jī)程序產(chǎn)品,其中,所述第四可執(zhí)行部分包括用于響應(yīng)于所述跡測(cè)量與所述閾值的比較來修改所述轉(zhuǎn)換函數(shù)的指令。18.根據(jù)權(quán)利要求16所述的計(jì)算機(jī)程序產(chǎn)品,其中,所述第四可執(zhí)行部分包括基于以下各項(xiàng)的一個(gè)或多個(gè)來改變所述閾值的指令混合數(shù)目;維度數(shù)目;數(shù)據(jù)的已知統(tǒng)計(jì)屬性;以及數(shù)據(jù)范圍。19.根據(jù)權(quán)利要求11所述的計(jì)算機(jī)程序產(chǎn)品,進(jìn)一步包括第四可執(zhí)行部分,用于計(jì)算與基于相應(yīng)的不同GMM的多個(gè)轉(zhuǎn)換函數(shù)相對(duì)應(yīng)的多個(gè)跡測(cè)量,以及選擇具有最低跡測(cè)量的至少一個(gè)所述轉(zhuǎn)換函數(shù),以用于將所述源數(shù)據(jù)輸入轉(zhuǎn)換為所述目標(biāo)數(shù)據(jù)輸出。20.—種裝置,包括訓(xùn)練模塊,其被配置為使用訓(xùn)練源數(shù)據(jù)和訓(xùn)練目標(biāo)數(shù)據(jù)來訓(xùn)練高斯混合模型(GMM);以及與所述訓(xùn)練模塊通信的變換模塊,所述變換模塊被配置為響應(yīng)于對(duì)所述GMM的所述訓(xùn)練來產(chǎn)生轉(zhuǎn)換函數(shù);其中,所述訓(xùn)練模塊被進(jìn)一步配置為通過計(jì)算所述GMM的跡測(cè)量,在使用所述轉(zhuǎn)換函數(shù)之前確定所述轉(zhuǎn)換函數(shù)的質(zhì)量。21.根據(jù)權(quán)利要求20所述的裝置,其中,所述變換模塊被進(jìn)一步配置為使用所述GMM將源數(shù)據(jù)輸入轉(zhuǎn)換為目標(biāo)數(shù)據(jù)輸出。22.根據(jù)權(quán)利要求20所述的裝置,其中,所述訓(xùn)練模塊被進(jìn)一步配置為使用訓(xùn)練源聲音數(shù)據(jù)和訓(xùn)練目標(biāo)聲音數(shù)據(jù)來訓(xùn)練所述GMM。23.根據(jù)權(quán)利要求22所述的裝置,其中,記錄所述訓(xùn)練目標(biāo)聲音數(shù)據(jù),以對(duì)應(yīng)于先前記錄的訓(xùn)練源聲音數(shù)據(jù)。24.根據(jù)權(quán)利要求20所述的裝置,其中,使用以下公式來計(jì)算所述跡測(cè)量(^:》(x).P(x)'"x。25.根據(jù)權(quán)利要求20所述的裝置,其中,使用以下近似來計(jì)算所26.根據(jù)權(quán)利要求20所述的裝置,其中,所述訓(xùn)練模塊被進(jìn)一步配置為將所述跡測(cè)量與閾值進(jìn)行比較。述跡測(cè)量:27.根據(jù)權(quán)利要求26所述的裝置,其中,所述變換模塊被進(jìn)一步配置為響應(yīng)于所述跡測(cè)量與所述閾值的比較,修改所述轉(zhuǎn)換函數(shù)。28.根據(jù)權(quán)利要求26所述的裝置,其中,所述訓(xùn)練模塊被進(jìn)一步配置為基于以下各項(xiàng)的一個(gè)或多個(gè)來改變所述閾11:混合數(shù)目;維度數(shù)目;數(shù)據(jù)的已知統(tǒng)計(jì)屬性;以及數(shù)據(jù)范圍。29.根據(jù)權(quán)利要求20所述的裝置,其中,所述訓(xùn)練模塊被進(jìn)一步配置為計(jì)算與基于相應(yīng)的不同GMM的多個(gè)轉(zhuǎn)換函數(shù)相對(duì)應(yīng)的多個(gè)跡測(cè)量,以及選4奪具有最低跡測(cè)量的至少一個(gè)所述轉(zhuǎn)換函數(shù),以用于將所述源數(shù)據(jù)輸入轉(zhuǎn)換為所述目標(biāo)數(shù)據(jù)輸出。30.—種移動(dòng)終端,包括訓(xùn)練模塊,其被配置為使用訓(xùn)練源數(shù)據(jù)和訓(xùn)練目標(biāo)數(shù)據(jù)來訓(xùn)練高斯混合模型(GMM);與所述訓(xùn)練模塊通信的變換模塊,所述變換模塊被配置為響應(yīng)于對(duì)所述GMM的所述訓(xùn)練來產(chǎn)生轉(zhuǎn)換函數(shù),以及此后,使用所述GMM將源數(shù)據(jù)輸入轉(zhuǎn)換為目標(biāo)數(shù)據(jù)輸出,其中,所述訓(xùn)練模塊被進(jìn)一步配置為通過計(jì)算所述GMM的跡測(cè)量,在使用所述轉(zhuǎn)換函數(shù)之前確定所述轉(zhuǎn)換函數(shù)的質(zhì)量。31.根據(jù)權(quán)利要求30所述的移動(dòng)終端,其中,所述訓(xùn)練模塊被進(jìn)一步配置為使用訓(xùn)練源聲音數(shù)據(jù)和訓(xùn)練目標(biāo)聲音數(shù)據(jù)來訓(xùn)練所述GMM。32.根據(jù)權(quán)利要求31所述的移動(dòng)終端,其中,記錄所述訓(xùn)練目標(biāo)聲音數(shù)據(jù),以對(duì)應(yīng)于先前記錄的訓(xùn)練源聲音數(shù)據(jù)。33.根據(jù)權(quán)利要求30所述的移動(dòng)終端,其中,所述訓(xùn)練模塊被進(jìn)一步配置為將所述跡測(cè)量與閾值進(jìn)行比較。34.根據(jù)權(quán)利要求30所述的移動(dòng)終端,其中,所述訓(xùn)練模塊被進(jìn)一步配置為計(jì)算與基于相應(yīng)的不同GMM的多個(gè)轉(zhuǎn)換函數(shù)相對(duì)應(yīng)的多個(gè)跡測(cè)量,以及選擇具有最低跡測(cè)量的至少一個(gè)所述轉(zhuǎn)換函數(shù),以用于將所述源數(shù)據(jù)輸入轉(zhuǎn)換為所述目標(biāo)數(shù)據(jù)輸出。35.—種裝置,包括用于使用訓(xùn)練源數(shù)據(jù)和訓(xùn)練目標(biāo)數(shù)據(jù)來訓(xùn)練高斯混合模型(GMM)的裝置;用于響應(yīng)于所述訓(xùn)練來產(chǎn)生轉(zhuǎn)換函數(shù)的裝置;以及用于通過計(jì)算所述GMM的跡測(cè)量來在使用所述轉(zhuǎn)換函數(shù)之前確定所述轉(zhuǎn)換函數(shù)的質(zhì)量的裝置。全文摘要一種用于提供特征變換的有效評(píng)估的裝置,包括訓(xùn)練模塊和變換模塊。訓(xùn)練模塊被配置為使用訓(xùn)練源數(shù)據(jù)和訓(xùn)練目標(biāo)數(shù)據(jù)來訓(xùn)練高斯混合模型(GMM)。變換模塊與訓(xùn)練模塊通信。變換模塊被配置為響應(yīng)于對(duì)GMM的訓(xùn)練而產(chǎn)生轉(zhuǎn)換函數(shù)。訓(xùn)練模塊進(jìn)一步被配置為通過計(jì)算GMM的跡測(cè)量,在使用轉(zhuǎn)換函數(shù)之前確定轉(zhuǎn)換函數(shù)的質(zhì)量。文檔編號(hào)G10L13/00GK101432800SQ200780015664公開日2009年5月13日申請(qǐng)日期2007年3月9日優(yōu)先權(quán)日2006年4月7日發(fā)明者J·K·尼爾米南,J·田,V·波帕申請(qǐng)人:諾基亞公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1