將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法以及終端設(shè)備的制作方法

文檔序號：2827298閱讀：261來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法以及終端設(shè)備的制作方法
【專利摘要】本發(fā)明提供了一種將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法以及終端設(shè)備。上述方法應(yīng)用于終端設(shè)備，包括：獲取文本數(shù)據(jù)；以及使用文本/語音映射表從所述文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)，其中，所述文本/語音映射表根據(jù)第一通話數(shù)據(jù)生成，所述第一通話數(shù)據(jù)為與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合。根據(jù)上述方法以及終端設(shè)備，通過保存規(guī)定聯(lián)系人的通話數(shù)據(jù)，從該聯(lián)系人的通話數(shù)據(jù)的集合生成規(guī)定聯(lián)系人的聲音的文本/語音映射表，并且使用該文本/語音映射表來實(shí)現(xiàn)文本數(shù)據(jù)到語音數(shù)據(jù)的轉(zhuǎn)換，因此在通話過程中自動收集語音數(shù)據(jù)，而無需規(guī)定聯(lián)系人為了生成文本/語音映射表而特意進(jìn)行錄制，就能方便地將文本數(shù)據(jù)轉(zhuǎn)換為規(guī)定聯(lián)系人的聲音的語音數(shù)據(jù)。
【專利說明】將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法以及終端設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法以及終端設(shè)備，尤其涉及無需規(guī)定聯(lián)系人為了生成文本/語音映射表而特意進(jìn)行錄制就能夠?qū)⑽谋緮?shù)據(jù)轉(zhuǎn)換為用戶所期望的規(guī)定聯(lián)系人的語音數(shù)據(jù)的方法以及終端設(shè)備。
【背景技術(shù)】
[0002]如今，隨著科學(xué)的發(fā)展以及社會的進(jìn)步，電子產(chǎn)品更加人性化，出現(xiàn)了很多具有文本朗讀功能的終端設(shè)備。例如，出現(xiàn)了帶有短信朗讀功能的手機(jī)，為老人、盲人等具有視力障礙的人等提供了很大的方便。此外，車載導(dǎo)航設(shè)備也具備了朗讀電子郵件、新聞等功能，保證了駕駛司機(jī)的行車安全。
[0003]然而，在這樣的朗讀功能中，朗讀聲音往往非常單調(diào)，所有的短信、電子郵件、新聞等均通過事先錄制成的一種聲音進(jìn)行播放。這樣單調(diào)的聲音不僅讓用戶聽起來比較生硬、乏味。
[0004]為此，提出了用戶能夠根據(jù)自己的需要，將特定人的聲音作為朗讀的聲音的方案。采用這樣的語音朗讀功能，其聲音可以設(shè)定為自己所熟悉的人，因此能夠給用戶帶來親切感，可以使得用戶聽起來更加自然、舒服。但是，如果試圖模擬特定人的聲音，則需要使用該特定人的聲音定制文本/語音映射表。這就需要該特定人來特意為此進(jìn)行錄制，直到發(fā)音音素覆蓋率達(dá)到一定標(biāo)準(zhǔn)。這給該特定人以及用戶帶來很大的負(fù)擔(dān)，可執(zhí)行性不強(qiáng)。

【發(fā)明內(nèi)容】

[0005]本發(fā)明鑒于以上課題完成，其目的在于，提供一種將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法以及終端設(shè)備，通過保存規(guī)定聯(lián)系人的通話數(shù)據(jù)，從該聯(lián)系人的通話數(shù)據(jù)的集合生成規(guī)定聯(lián)系人的聲音的文本/語音映射表，并且使用該文本/語音映射表來實(shí)現(xiàn)文本數(shù)據(jù)到語音數(shù)據(jù)的轉(zhuǎn)換，因此在通話過程中自動收集語音數(shù)據(jù)，而無需規(guī)定聯(lián)系人為了生成文本/語音映射表而特意進(jìn)行錄制，就能方便地將文本數(shù)據(jù)轉(zhuǎn)換為規(guī)定聯(lián)系人的聲音的語音數(shù)據(jù)。
[0006]本發(fā)明的一個實(shí)施例提供一種將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法，應(yīng)用于具有終端設(shè)備，包括:獲取文本數(shù)據(jù)；以及使用文本/語音映射表從所述文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)，其中，所述文本/語音映射表根據(jù)第一通話數(shù)據(jù)生成，所述第一通話數(shù)據(jù)為與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合。
[0007]本發(fā)明的實(shí)施例還提供一種終端設(shè)備，包括:通話數(shù)據(jù)保存模塊，配置來存儲通話數(shù)據(jù)；以及處理模塊，配置來獲取文本數(shù)據(jù)，并獲取使用文本/語音映射表從文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)，其中，所述文本/語音映射表根據(jù)第一通話數(shù)據(jù)生成，所述第一通話數(shù)據(jù)為與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合。
[0008]根據(jù)本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法以及終端設(shè)備，通過保存規(guī)定聯(lián)系人的通話數(shù)據(jù)，從該聯(lián)系人的通話數(shù)據(jù)的集合生成規(guī)定聯(lián)系人的聲音的文本/語音映射表，并且使用該文本/語音映射表來實(shí)現(xiàn)文本數(shù)據(jù)到語音數(shù)據(jù)的轉(zhuǎn)換，因此在通話過程中自動收集語音數(shù)據(jù)，而無需規(guī)定聯(lián)系人為了生成文本/語音映射表而特意進(jìn)行錄制，就能方便地將文本數(shù)據(jù)轉(zhuǎn)換為規(guī)定聯(lián)系人的聲音的語音數(shù)據(jù)。
【專利附圖】

【附圖說明】
[0009]圖1是用于說明將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法的示意圖。
[0010]圖2是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中，生成文本/語音映射表的一個優(yōu)選實(shí)施例的時(shí)序圖。
[0011]圖3是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中，通話數(shù)據(jù)的篩選的流程圖。
[0012]圖4是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中，覆蓋預(yù)定范圍的發(fā)音音素的檢測過程的流程圖。
[0013]圖5是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中，一個優(yōu)選實(shí)施例的流程圖。
[0014]圖6是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中，使用多個文本/語音映射表時(shí)的一優(yōu)選實(shí)施例的不意圖。
[0015]圖7是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中，使用多個文本/語音映射表時(shí)的一優(yōu)選實(shí)施例的流程圖。
[0016]圖8是用于說明本發(fā)明的終端設(shè)備的結(jié)構(gòu)的功能框圖。
【具體實(shí)施方式】
[0017]為使本領(lǐng)域的技術(shù)人員能夠更好地理解本發(fā)明的技術(shù)方案，下面結(jié)合附圖詳細(xì)說明本發(fā)明的本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法以及終端設(shè)備的【具體實(shí)施方式】。
[0018]【將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法】
[0019]下面，結(jié)合附圖來說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法的【具體實(shí)施方式】。本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法的實(shí)施例中，主要以將智能手機(jī)中的短信內(nèi)容轉(zhuǎn)換為語音數(shù)據(jù)為例進(jìn)行說明，但事實(shí)上轉(zhuǎn)換的文本數(shù)據(jù)不限于短信內(nèi)容，還可以是電子郵件，新聞等任何形式的文本數(shù)據(jù)。此外，終端設(shè)備還可以是PDA、平板電腦、電子閱讀器、車載導(dǎo)航等其他任何終端設(shè)備。因此，基于本發(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在未經(jīng)創(chuàng)造性勞動而能夠獲得的所有其他實(shí)施例都屬于本發(fā)明保護(hù)的范圍。
[0020]圖1是用于說明將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法的示意圖。如圖1所示，文本數(shù)據(jù)與語音數(shù)據(jù)之間的轉(zhuǎn)換一般通過文本/語音映射表來實(shí)現(xiàn)。文本/語音映射表中存儲了字符或者字符串與發(fā)音音素之間的對應(yīng)關(guān)系。在終端設(shè)備獲取文本數(shù)據(jù)后，使用文本/語音映射表將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)。具體而言，首先識別該文本數(shù)據(jù)中的字符或者字符串。其次通過文本/語音映射表檢索到與該字符以及字符串對應(yīng)的發(fā)音音素。最后對該發(fā)音音素進(jìn)行拼接、調(diào)整、優(yōu)化，從而轉(zhuǎn)換為與該文本數(shù)據(jù)對應(yīng)的語音數(shù)據(jù)。可見，轉(zhuǎn)換出來的語音數(shù)據(jù)中的聲色、聲調(diào)、強(qiáng)弱等聲音取決于文本/語音映射表中存儲的發(fā)音音素。同一個文本數(shù)據(jù)可以通過不同的文本/語音映射表分別轉(zhuǎn)換為不同人的聲音的語音數(shù)據(jù)。本發(fā)明的實(shí)施例通過保存規(guī)定聯(lián)系人的通話數(shù)據(jù)，從該聯(lián)系人的通話數(shù)據(jù)的集合生成規(guī)定聯(lián)系人的聲音的文本/語音映射表，并且使用該文本/語音映射表來實(shí)現(xiàn)文本數(shù)據(jù)到語音數(shù)據(jù)的轉(zhuǎn)換，因此能夠在通話過程中自動收集語音數(shù)據(jù)，而無需規(guī)定聯(lián)系人為了生成文本/語音映射表而特意進(jìn)行錄制，就能方便地將文本數(shù)據(jù)轉(zhuǎn)換為規(guī)定聯(lián)系人的聲音的語音數(shù)據(jù)。
[0021]接下來，結(jié)合圖2說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中，生成文本/語音映射表的一個優(yōu)選實(shí)施方式。圖2是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中生成文本/語音映射表的一個優(yōu)選實(shí)施例的時(shí)序圖。
[0022]首先，智能手機(jī)(終端設(shè)備)保存與規(guī)定聯(lián)系人的通話數(shù)據(jù)(步驟S11)。在這里以電話的通話數(shù)據(jù)為例進(jìn)行說明，但需要指出的是，通話數(shù)據(jù)不僅包括電話的通話數(shù)據(jù)，還可以包括通過微信(注冊商標(biāo))、LINE (注冊商標(biāo))等其他帶有語音通信功能的第三方應(yīng)用軟件的通話數(shù)據(jù)。這里的規(guī)定聯(lián)系人一般是關(guān)系親近的人，例如可以是親屬、愛人、或者特定的朋友。規(guī)定聯(lián)系人可以由用戶手動設(shè)定，也可以根據(jù)智能手機(jī)的通話記錄、短信記錄等通信記錄來確定，還可以根據(jù)智能手機(jī)的桌面圖像等圖片數(shù)據(jù)的來確定。根據(jù)通話記錄來確定規(guī)定聯(lián)系人，例如可以是通過識別在單位時(shí)間內(nèi)的通話次數(shù)或者通話時(shí)間超過一定閾值的聯(lián)系人來確定。根據(jù)短/[目記錄確定規(guī)定聯(lián)系人，例如可以是通過識別在單位時(shí)間內(nèi)短/[目次數(shù)或者短信內(nèi)容字?jǐn)?shù)超過一定閾值的聯(lián)系人來確定。根據(jù)智能手機(jī)的桌面圖像來確定，例如可以是通過桌面圖像的人臉識別，與電話簿中存儲的人臉進(jìn)行匹配，從而識別該聯(lián)系人。優(yōu)選地，智能手機(jī)還可以對通話數(shù)據(jù)進(jìn)行篩選，當(dāng)通話質(zhì)量或者置信度達(dá)不到一定程度時(shí)，拋棄該通話數(shù)據(jù)，以保證通話數(shù)據(jù)的準(zhǔn)確性。該篩選過程將在后面詳細(xì)敘述。
[0023]接下來，智能手機(jī)將所保存的通話數(shù)據(jù)發(fā)送至服務(wù)器(步驟S12)。服務(wù)器可以是通過廣域網(wǎng)連接的遠(yuǎn)程服務(wù)器，也可以是通過局域網(wǎng)或者其他方式連接的近程服務(wù)器。智能手機(jī)可以積攢多個通話數(shù)據(jù)，并且達(dá)到一定數(shù)量后一并發(fā)送至服務(wù)器，也可以是每當(dāng)保存一個通話數(shù)據(jù)就立即向該服務(wù)器發(fā)送該通話數(shù)據(jù)，還可以是其他任何形式。服務(wù)器接收并存儲來自智能手機(jī)的規(guī)定聯(lián)系人的通話數(shù)據(jù)，形成通話數(shù)據(jù)的集合。
[0024]接下來，服務(wù)器根據(jù)所存儲的規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合生成文本/語音映射表(步驟S13)。具體而言，對通話數(shù)據(jù)進(jìn)行解析、并且分解為各個發(fā)音音素，并與字符或者字符串建立對應(yīng)關(guān)系，從而生成文本/語音映射表。優(yōu)選地，為了保證轉(zhuǎn)換出來的語音數(shù)據(jù)的準(zhǔn)確性，還可以對通話數(shù)據(jù)的集合覆蓋發(fā)音音素的程度進(jìn)行檢測，并且在覆蓋預(yù)定范圍的發(fā)音音素后生成文本/語音映射表。該檢測過程將在后面詳細(xì)敘述。
[0025]最后，服務(wù)器將生成的文本/語音映射表發(fā)送給智能手機(jī)(步驟S14)，以供智能手機(jī)使用該生成的文本/語音映射表進(jìn)行文本數(shù)據(jù)與語音數(shù)據(jù)的轉(zhuǎn)換。
[0026]由于通常需要大量的通話數(shù)據(jù)來生成文本/語音映射表，因此在上述生成文本/語音映射表的優(yōu)選實(shí)施方式中，由服務(wù)器端存儲通話數(shù)據(jù)，并根據(jù)規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合生成文本/語音映射表，從而能夠有效減少智能手機(jī)的負(fù)載，提高轉(zhuǎn)換效率。當(dāng)然，本領(lǐng)域技術(shù)人員知道，上述生成文本/語音映射表的步驟也可以在智能手機(jī)中進(jìn)行。
[0027]下面，結(jié)合圖3來詳細(xì)說明通話數(shù)據(jù)的篩選過程的一個優(yōu)選實(shí)施方式。圖3是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中，通話數(shù)據(jù)的篩選的流程圖。
[0028]首先，獲取規(guī)定聯(lián)系人的通話數(shù)據(jù)(步驟S31)。
[0029]接下來，判斷該通話數(shù)據(jù)的信號噪音比是否大于第一閾值(此處例如為20dB)，并且噪聲水平小于第二閾值(此處例如為45dB)(步驟S32)。[0030]當(dāng)信號噪音比大于20dB并且噪聲水平小于45dB (步驟S32，是)時(shí)，說明該通話數(shù)據(jù)的質(zhì)量較好，判斷為適宜作為生成文本/語音映射表的元素，因此結(jié)束篩選過程，即保存通話數(shù)據(jù)。
[0031]當(dāng)信號噪音比小于20dB或者噪聲水平大于45dB (步驟S32，否)時(shí)，說明該通話數(shù)據(jù)的質(zhì)量較差，繼續(xù)分析通話數(shù)據(jù)，判斷其置信度是否大于第三閾值(第三閾值取值范圍為O?1，此處例如為0.85)(步驟S33)。
[0032]當(dāng)置信度大于0.85時(shí)(步驟S33，是)，說明該通話數(shù)據(jù)的可識別性高，判斷為適宜作為生成文本/語音映射表的元素，因此結(jié)束篩選過程，即保存通話數(shù)據(jù)。
[0033]當(dāng)置信度小于0.85時(shí)(步驟S33，否)，說明該通話數(shù)據(jù)的可識別性低，判斷該通話數(shù)據(jù)不宜作為生成文本/語音映射表的元素，因此拋棄該通話數(shù)據(jù)(步驟S34)，結(jié)束篩選過程。
[0034]因此，通過上述通話數(shù)據(jù)的篩選過程，可以實(shí)現(xiàn):僅在在滿足下述至少一個條件時(shí)，保存該通話數(shù)據(jù)，作為生成文本/語音映射表的元素的規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合:
[0035](I)信號噪音比大于第一閾值并且噪聲水平小于第二閾值；
[0036](2)所述通話數(shù)據(jù)的置信度大于第三閾值。
[0037]需要指出，本領(lǐng)域技術(shù)人員知道，也可以是同時(shí)滿足上述兩個條件時(shí)，保存該通話數(shù)據(jù)。
[0038]以上說明了在終端設(shè)備保存規(guī)定聯(lián)系人的通話數(shù)據(jù)之前進(jìn)行篩選的示例，但事實(shí)上不限于此，也可以在保存通話數(shù)據(jù)之后且生成文本/語音映射表之前進(jìn)行篩選。
[0039]通過上述篩選過程，能夠保證作為生成文本/語音映射表的元素的通話數(shù)據(jù)的通話質(zhì)量以及置信度，從而以保證了生成文本/語音映射表的準(zhǔn)確性。
[0040]下面，結(jié)合圖4來詳細(xì)說明對通話數(shù)據(jù)的集合覆蓋發(fā)音音素的程度進(jìn)行檢測的一個優(yōu)選實(shí)施方式。圖4是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中，覆蓋預(yù)定范圍的發(fā)音音素的檢測過程的流程圖。首先，獲取規(guī)定聯(lián)系人的通話數(shù)據(jù)(步驟S41)。[0041 ] 接下來，判斷所存儲的通話數(shù)據(jù)的集合是否覆蓋預(yù)定范圍的發(fā)音音素(步驟S42 )。這里的覆蓋音素的范圍可以根據(jù)實(shí)際需要進(jìn)行設(shè)定。很顯然，覆蓋的發(fā)音音素范圍越大，生成的文本/語音映射表越完整，轉(zhuǎn)換出來的語音數(shù)據(jù)的聲音就越接近于規(guī)定聯(lián)系人的真實(shí)聲音。
[0042]當(dāng)所存儲的通話數(shù)據(jù)的集合沒有覆蓋預(yù)定范圍的發(fā)音音素時(shí)(步驟S42，否)，說明該文本/語音映射表中的發(fā)音音素還不足以達(dá)到所要求的完整程度，因此暫不生成文本/語音映射表而再次返回到步驟S41而獲取該規(guī)定聯(lián)系人的通話數(shù)據(jù)。
[0043]當(dāng)所存儲的通話數(shù)據(jù)的集合覆蓋預(yù)定范圍的發(fā)音音素時(shí)(步驟S42，是)，說明該文本/語音映射表中的發(fā)音音素已達(dá)到所要求的完整程度，因此生成文本/語音映射表(步驟S43)。
[0044]需要說明的是，本領(lǐng)域技術(shù)人員知道，當(dāng)智能手機(jī)將規(guī)定聯(lián)系人的通話數(shù)據(jù)發(fā)送給服務(wù)器，并在服務(wù)器存儲通話數(shù)據(jù)集合并生成文本/語音映射表時(shí)，在服務(wù)器進(jìn)行上述檢測。此外，當(dāng)在智能手機(jī)中存儲通話數(shù)據(jù)的集合并生成文本/語音映射表時(shí)，還可以在該智能手機(jī)中進(jìn)行上述檢測。
[0045]通過上述檢測，能夠保證構(gòu)成文本/語音映射表中的發(fā)音音素的完整性，使得使用該文本/語音映射表轉(zhuǎn)換出來的語音數(shù)據(jù)的聲音更接近于規(guī)定聯(lián)系人的真實(shí)聲音。
[0046]然而，一般情況下需要積累大量且多樣的通話數(shù)據(jù)，才能夠根據(jù)與規(guī)定聯(lián)系人之間的通話數(shù)據(jù)的集合來覆蓋比較完整的發(fā)音音素。因此，為了生成一個能夠模擬規(guī)定聯(lián)系人的聲音的文本/語音映射表往往需要很長時(shí)間。為了克服上述缺陷，可以采用以某個基本文本/語音映射表為基礎(chǔ)來調(diào)整個別發(fā)音因素的方法生成該規(guī)定聯(lián)系人的文本/語音映射表。下面，結(jié)合圖5說明本發(fā)明的另一個優(yōu)選實(shí)施方式。
[0047]圖5是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中，一個優(yōu)選實(shí)施例的流程圖。在本實(shí)施例中，在服務(wù)器中預(yù)先存儲有多個已經(jīng)覆蓋了一定程度的發(fā)音音素的基本文本/語音映射表。但事實(shí)上例如在終端設(shè)備生成文本/語音映射表時(shí)，也可以在終端設(shè)備中存儲上述多個基本文本/語音映射表。在本實(shí)施例的說明中，以服務(wù)器上存儲有分別具有1.較粗的男聲、2.較細(xì)的男聲、3.較粗的女聲、4.較細(xì)的女聲的四種發(fā)音音素的四個基本文本/語音映射表為例進(jìn)行說明。但事實(shí)上不限于此，可以根據(jù)不同的聲音特征進(jìn)行更詳細(xì)的分類和分級，從而存儲更多的基本文本/語音映射表。
[0048]首先，選擇與規(guī)定聯(lián)系人的通話數(shù)據(jù)中的語音最接近的基本文本/語音映射表(步驟S51)。例如，當(dāng)規(guī)定聯(lián)系人為用戶的母親，并且通過分析母親的通話數(shù)據(jù)發(fā)現(xiàn)她的聲音較細(xì)時(shí)，選擇較細(xì)的女聲的基本文本/語音映射表。當(dāng)規(guī)定聯(lián)系人為用戶的父親，并且通過分析父親的通話數(shù)據(jù)發(fā)現(xiàn)他的聲音較粗時(shí)，選擇較粗的男聲的基本文本/語音映射表。
[0049]其次，獲取規(guī)定聯(lián)系人的通話數(shù)據(jù)(步驟S52)。
[0050]最后，根據(jù)上述所獲取的通話數(shù)據(jù)來調(diào)整所選擇的基本文本/語音映射表(步驟S53)。具體而言，對所獲取的通話數(shù)據(jù)進(jìn)行解析、并且分解為多個發(fā)音音素，以該分解出來的發(fā)音音素來替換或者調(diào)整所選擇的基本文本/語音映射表中的發(fā)音音素，不斷優(yōu)化該基本文本/語音映射表，從而生成規(guī)定聯(lián)系人的文本/語音映射表。
[0051]根據(jù)上述方法，由于是通過在已經(jīng)具有了相似的發(fā)音音素的基本文本/語音映射表的基礎(chǔ)上進(jìn)行調(diào)整來生成規(guī)定聯(lián)系人的文本/語音映射表，與傳統(tǒng)方法相比只需少量的通話數(shù)據(jù)即可生成與規(guī)定聯(lián)系人的聲音相似度較高的文本/語音映射表，大大提高了生成的效率和開銷。
[0052]然而，就終端設(shè)備的短信或者電子郵件的朗讀功能而言，在朗讀短信或者電子郵件的內(nèi)容之前，需要告知發(fā)信人的姓名或者電話號碼，否則用戶如果不看屏幕內(nèi)容則無法知道該短信或者電子郵件來自哪一個聯(lián)系人。當(dāng)用戶因某種原因沒有聽到聯(lián)系人的告知時(shí)，還需要查看手機(jī)的顯示屏以確認(rèn)發(fā)信人的信息，給用戶帶來極大的不便。
[0053]為此，可以在終端設(shè)備中存儲多個分別對應(yīng)于不同規(guī)定聯(lián)系人的文本/語音映射表。圖6是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中，使用多個文本/語音映射表時(shí)的一優(yōu)選實(shí)施例的示意圖。如圖6所示，例如當(dāng)由父親的通話數(shù)據(jù)生成文本/語音映射表1、由母親的通話數(shù)據(jù)生成文本/語音映射表2、由愛人的通話數(shù)據(jù)生成文本/語音映射表3時(shí)，文本數(shù)據(jù)使用文本/語音映射表I轉(zhuǎn)換可以得到父親的聲音的語音數(shù)據(jù)，文本數(shù)據(jù)使用文本/語音映射表2轉(zhuǎn)換可以得到母親的聲音的語音數(shù)據(jù)，文本數(shù)據(jù)使用文本/語音映射表3轉(zhuǎn)換可以得到愛人的聲音的語音數(shù)據(jù)。因此，聯(lián)系人與文本/語音映射表之間可以建立對應(yīng)關(guān)系，且終端設(shè)備當(dāng)中可以記錄該對應(yīng)關(guān)系。
[0054]下面，結(jié)合圖7說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法的另一個優(yōu)選實(shí)施方式。圖7是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中，使用多個文本/語音映射表時(shí)的一優(yōu)選實(shí)施例的流程圖。
[0055]首先，獲取文本數(shù)據(jù)(步驟S71)。此處的文本數(shù)據(jù)可以是但不限于短信、電子郵件等來自特定聯(lián)系人的信件。
[0056]其次，識別該文本數(shù)據(jù)的聯(lián)系人(步驟S72)。具體而言，智能手機(jī)可以根據(jù)短信的發(fā)信人的電話號碼或者電子郵件的發(fā)件人的郵箱地址，對電話簿、通信錄等進(jìn)行檢索，從而識別聯(lián)系人。
[0057]接下來，根據(jù)聯(lián)系人與文本/語音映射表之間的對應(yīng)關(guān)系，選擇與該聯(lián)系人對應(yīng)的文本/語音映射表(步驟S73)。
[0058]最后，使用該選擇的文本/語音映射表將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)(步驟S74)，從而得到與短信的發(fā)信人或者電子郵件的發(fā)件人對應(yīng)的聲音的語音數(shù)據(jù)。
[0059]根據(jù)上述方法，關(guān)系密切的人的聲音不僅給用戶帶來的親近感，而且通過使用短信、電子郵件的來信人的聲音來朗讀短信、電子郵件，可以方便地讓用戶識別發(fā)信人。
[0060]然而，以上實(shí)施例說明了多個規(guī)定聯(lián)系人與多個文本/語音映射表之間一一對應(yīng)的例子，但事實(shí)上不限于此，也可以將聯(lián)系人分組為男性與女性，分別與男聲的文本/語音映射表以及女聲的文本/語音映射表相對應(yīng)。也可以是使用用戶通過手動的方式來選擇的特定文本/語音映射表，并使用該特定文本/語音映射表來實(shí)現(xiàn)文本數(shù)據(jù)與語音數(shù)據(jù)的轉(zhuǎn)換等。
[0061]以上說明了本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法的多個實(shí)施例。顯然，本領(lǐng)域技術(shù)人員在不脫離本發(fā)明的精神和范圍內(nèi)可以對上述實(shí)施例作出各種組合、修改或者變形。本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。
[0062]【終端設(shè)備】
[0063]下面，結(jié)合附圖來說明本發(fā)明的終端設(shè)備的【具體實(shí)施方式】。在以下說明中，主要以將智能手機(jī)中的短信內(nèi)容轉(zhuǎn)換為語音數(shù)據(jù)為例進(jìn)行說明，但事實(shí)上不限于此，終端設(shè)備還可以是PDA、平板電腦、電子閱讀器、車載導(dǎo)航等其他任何終端設(shè)備，轉(zhuǎn)換的文本數(shù)據(jù)也不限于短信內(nèi)容，還可以是電子郵件，新聞等任何形式的文本數(shù)據(jù)。因此，基于本發(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在未經(jīng)創(chuàng)造性勞動而能夠獲得的所有其他實(shí)施例都屬于本發(fā)明保護(hù)的范圍。
[0064]下面，結(jié)合圖8說明本發(fā)明的終端設(shè)備的結(jié)構(gòu)。圖8是用于說明本發(fā)明的終端設(shè)備的結(jié)構(gòu)的功能框圖。如圖8所示，本發(fā)明的終端設(shè)備100包括:
[0065]通話數(shù)據(jù)保存模塊101，配置來保存通話數(shù)據(jù)；以及處理模塊102，配置來獲取文本數(shù)據(jù)，并獲取使用文本/語音映射表從文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)，其中，所述文本/語音映射表根據(jù)第一通話數(shù)據(jù)生成，所述第一通話數(shù)據(jù)為與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合。其中，通話數(shù)據(jù)保存模塊101可以是隨機(jī)訪問存儲器(RAM)、閃速存儲器以及其他任何存儲部件，處理模塊102可以是微處理器等處理部件。
[0066]文本數(shù)據(jù)與語音數(shù)據(jù)之間的轉(zhuǎn)換一般通過文本/語音映射表來實(shí)現(xiàn)。文本/語音映射表中存儲了字符或者字符串與發(fā)音音素之間的對應(yīng)關(guān)系。在終端設(shè)備獲取文本數(shù)據(jù)后，使用文本/語音映射表將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)。具體而言，首先識別該文本數(shù)據(jù)中的字符或者字符串。其次通過文本/語音映射表檢索到與該字符以及字符串對應(yīng)的發(fā)音音素。最后對該發(fā)音音素進(jìn)行拼接、調(diào)整、優(yōu)化，從而轉(zhuǎn)換為與該文本數(shù)據(jù)對應(yīng)的語音數(shù)據(jù)?？梢?，轉(zhuǎn)換出來的語音數(shù)據(jù)中的聲色、聲調(diào)、強(qiáng)弱等聲音取決于文本/語音映射表中存儲的發(fā)音音素。同一個文本數(shù)據(jù)可以通過不同的文本/語音映射表分別轉(zhuǎn)換為不同人的聲音的語音數(shù)據(jù)。本發(fā)明的實(shí)施例通過通話數(shù)據(jù)保存模塊101保存規(guī)定聯(lián)系人的通話數(shù)據(jù)，并且處理模塊102使用從該聯(lián)系人的通話數(shù)據(jù)的集合生成規(guī)定聯(lián)系人的聲音的文本/語音映射表來實(shí)現(xiàn)文本數(shù)據(jù)到語音數(shù)據(jù)的轉(zhuǎn)換，因此能夠在通話過程中自動收集語音數(shù)據(jù)，而無需規(guī)定聯(lián)系人為了生成文本/語音映射表而特意進(jìn)行錄制，就能方便地將文本數(shù)據(jù)轉(zhuǎn)換為規(guī)定聯(lián)系人的聲音的語音數(shù)據(jù)。
[0067]接下來，生成文本/語音映射表的一個優(yōu)選實(shí)施方式。在本實(shí)施例中，終端設(shè)備100還包括配置來與服務(wù)器進(jìn)行通信的通信模塊103。
[0068]首先，通話數(shù)據(jù)保存模塊101保存與規(guī)定聯(lián)系人的通話數(shù)據(jù)。在這里以電話的通話數(shù)據(jù)為例進(jìn)行說明，但需要指出的是，通話數(shù)據(jù)不僅包括電話的通話數(shù)據(jù)，還可以包括通過微信(注冊商標(biāo))、LINE (注冊商標(biāo))等其他帶有語音通信功能的第三方應(yīng)用軟件的通話數(shù)據(jù)。這里的規(guī)定聯(lián)系人一般是關(guān)系親近的人，例如可以是親屬、愛人、或者特定的朋友。規(guī)定聯(lián)系人可以由用戶手動設(shè)定，也可以根據(jù)智能手機(jī)的通話記錄、短信記錄等通信記錄來確定，還可以根據(jù)智能手機(jī)的桌面圖像等圖片數(shù)據(jù)的來確定。根據(jù)通話記錄來確定規(guī)定聯(lián)系人，例如可以是通過識別在單位時(shí)間內(nèi)的通話次數(shù)或者通話時(shí)間超過一定閾值的聯(lián)系人來確定。根據(jù)短信記錄確定規(guī)定聯(lián)系人，例如可以是通過識別在單位時(shí)間內(nèi)短信次數(shù)或者短信內(nèi)容字?jǐn)?shù)超過一定閾值的聯(lián)系人來確定。根據(jù)智能手機(jī)的桌面圖像來確定，例如可以是通過桌面圖像的人臉識別，與電話簿中存儲的人臉進(jìn)行匹配，從而識別該聯(lián)系人。優(yōu)選地，智能手機(jī)還可以對通話數(shù)據(jù)進(jìn)行篩選，當(dāng)通話質(zhì)量或者置信度達(dá)不到一定程度時(shí)，拋棄該通話數(shù)據(jù)，以保證通話數(shù)據(jù)的準(zhǔn)確性。該篩選過程將在后面詳細(xì)敘述。
[0069]接下來，通信模塊103將所保存的通話數(shù)據(jù)發(fā)送至服務(wù)器。服務(wù)器可以是通過廣域網(wǎng)連接的遠(yuǎn)程服務(wù)器，也可以是通過局域網(wǎng)或者其他方式連接的近程服務(wù)器。智能手機(jī)可以積攢多個通話數(shù)據(jù)，并且達(dá)到一定數(shù)量后一并發(fā)送至服務(wù)器，也可以是每當(dāng)保存一個通話數(shù)據(jù)就立即向該服務(wù)器發(fā)送該通話數(shù)據(jù)，還可以是其他任何形式。服務(wù)器接收并存儲來自智能手機(jī)的規(guī)定聯(lián)系人的通話數(shù)據(jù)，形成通話數(shù)據(jù)的集合。
[0070]接下來，服務(wù)器根據(jù)所存儲的規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合生成文本/語音映射表。具體而言，對通話數(shù)據(jù)進(jìn)行解析、并且分解為各個發(fā)音音素，并與字符或者字符串建立對應(yīng)關(guān)系，從而生成文本/語音映射表。優(yōu)選地，為了保證轉(zhuǎn)換出來的語音數(shù)據(jù)的準(zhǔn)確性，還可以對通話數(shù)據(jù)的集合覆蓋發(fā)音音素的程度進(jìn)行檢測，并且在覆蓋預(yù)定范圍的發(fā)音音素后生成文本/語音映射表。該檢測過程將在后面詳細(xì)敘述。
[0071]最后，服務(wù)器將生成的文本/語音映射表發(fā)送給通信模塊103，以供處理模塊102使用該生成的文本/語音映射表進(jìn)行文本數(shù)據(jù)與語音數(shù)據(jù)的轉(zhuǎn)換。
[0072]由于通常需要大量的通話數(shù)據(jù)來生成文本/語音映射表，因此在上述生成文本/語音映射表的優(yōu)選實(shí)施方式中，由服務(wù)器端存儲通話數(shù)據(jù)，并根據(jù)規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合生成文本/語音映射表，從而能夠有效減少智能手機(jī)(終端設(shè)備100)的負(fù)載，提高轉(zhuǎn)換效率。當(dāng)然，本領(lǐng)域技術(shù)人員知道，上述生成文本/語音映射表的處理也可以在處理模塊102中進(jìn)行。
[0073]下面，詳細(xì)說明通話數(shù)據(jù)的篩選過程的一個優(yōu)選實(shí)施方式。
[0074]首先，處理模塊102獲取規(guī)定聯(lián)系人的通話數(shù)據(jù)。
[0075]接下來，處理模塊102判斷該通話數(shù)據(jù)的信號噪音比是否大于第一閾值(此處例如為20dB)，并且噪聲水平小于第二閾值(此處例如為45dB)。
[0076]當(dāng)信號噪音比大于20dB并且噪聲水平小于45dB時(shí)，說明該通話數(shù)據(jù)的質(zhì)量較好，判斷為適宜作為生成文本/語音映射表的元素，因此處理模塊102結(jié)束篩選處理，即保存通話數(shù)據(jù)至數(shù)據(jù)保存模塊101。
[0077]當(dāng)信號噪音比小于20dB或者噪聲水平大于45dB時(shí)，說明該通話數(shù)據(jù)的質(zhì)量較差，繼續(xù)分析通話數(shù)據(jù)，判斷其置信度是否大于第三閾值(第三閾值取值范圍為O?1，此處例如為0.85)。
[0078]當(dāng)置信度大于0.85時(shí)(步驟S33，是)，說明該通話數(shù)據(jù)的可識別性高，判斷為適宜作為生成文本/語音映射表的元素，因此處理模塊102結(jié)束篩選過程，即保存通話數(shù)據(jù)至數(shù)據(jù)保存模塊101。
[0079]當(dāng)置信度小于0.85時(shí)(步驟S33，否)，說明該通話數(shù)據(jù)的可識別性低，判斷該通話數(shù)據(jù)不宜作為生成文本/語音映射表的元素，因此處理模塊102拋棄該通話數(shù)據(jù)，結(jié)束篩選過程。
[0080]因此，通過上述通話數(shù)據(jù)的篩選過程，可以實(shí)現(xiàn):僅在在滿足下述至少一個條件時(shí)，保存該通話數(shù)據(jù)，作為生成文本/語音映射表的元素的規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合:
[0081](I)信號噪音比大于第一閾值并且噪聲水平小于第二閾值；
[0082](2)所述通話數(shù)據(jù)的置信度大于第三閾值。
[0083]需要指出，本領(lǐng)域技術(shù)人員知道，也可以是同時(shí)滿足上述兩個條件時(shí)，保存該通話數(shù)據(jù)。
[0084]以上說明了在處理模塊102保存規(guī)定聯(lián)系人的通話數(shù)據(jù)之前進(jìn)行篩選的示例，但事實(shí)上不限于此，也可以在保存通話數(shù)據(jù)之后且生成文本/語音映射表之前進(jìn)行篩選。
[0085]通過上述篩選處理，能夠保證作為生成文本/語音映射表的元素的通話數(shù)據(jù)的通話質(zhì)量以及置信度，從而以保證了生成文本/語音映射表的準(zhǔn)確性。
[0086]下面，詳細(xì)說明對通話數(shù)據(jù)的集合覆蓋發(fā)音音素的程度進(jìn)行檢測的一個優(yōu)選實(shí)施方式。
[0087]首先，獲取規(guī)定聯(lián)系人的通話數(shù)據(jù)。
[0088]接下來，判斷所存儲的通話數(shù)據(jù)的集合是否覆蓋預(yù)定范圍的發(fā)音音素。這里的覆蓋音素的范圍可以根據(jù)實(shí)際需要進(jìn)行設(shè)定。很顯然，覆蓋的發(fā)音音素范圍越大，生成的文本/語音映射表越完整，轉(zhuǎn)換出來的語音數(shù)據(jù)的聲音就越接近于規(guī)定聯(lián)系人的真實(shí)聲音。
[0089]當(dāng)所存儲的通話數(shù)據(jù)的集合沒有覆蓋預(yù)定范圍的發(fā)音音素時(shí)，說明該文本/語音映射表中的發(fā)音音素還不足以達(dá)到所要求的完整程度，因此暫不生成文本/語音映射表而再次獲取該規(guī)定聯(lián)系人的通話數(shù)據(jù)。
[0090]當(dāng)所存儲的通話數(shù)據(jù)的集合覆蓋預(yù)定范圍的發(fā)音音素時(shí)，說明該文本/語音映射表中的發(fā)音音素已達(dá)到所要求的完整程度，因此生成文本/語音映射表。
[0091]需要說明的是，本領(lǐng)域技術(shù)人員知道，當(dāng)智能手機(jī)(終端設(shè)備100)通過通信模塊103將規(guī)定聯(lián)系人的通話數(shù)據(jù)發(fā)送給服務(wù)器，并在服務(wù)器存儲通話數(shù)據(jù)集合并生成文本/語音映射表時(shí)，在服務(wù)器進(jìn)行上述檢測處理。當(dāng)在處理模塊102存儲通話數(shù)據(jù)的集合并生成文本/語音映射表時(shí)，由處理模塊102進(jìn)行上述檢測處理。
[0092]通過上述檢測處理，能夠保證構(gòu)成文本/語音映射表中的發(fā)音音素的完整性，使得使用該文本/語音映射表轉(zhuǎn)換出來的語音數(shù)據(jù)的聲音更接近于規(guī)定聯(lián)系人的真實(shí)聲音。
[0093]然而，一般情況下需要積累大量且多樣的通話數(shù)據(jù)，才能夠根據(jù)與規(guī)定聯(lián)系人之間的通話數(shù)據(jù)的集合來覆蓋比較完整的發(fā)音音素。因此，為了生成一個能夠模擬規(guī)定聯(lián)系人的聲音的文本/語音映射表往往需要很長時(shí)間。為了克服上述缺陷，可以采用以某個基本文本/語音映射表為基礎(chǔ)來調(diào)整個別發(fā)音因素的方法生成該規(guī)定聯(lián)系人的文本/語音映射表。
[0094]下面，說明本發(fā)明的另一個優(yōu)選實(shí)施方式。在本實(shí)施例中，在服務(wù)器中預(yù)先存儲有多個已經(jīng)覆蓋了一定程度的發(fā)音音素的基本文本/語音映射表。但事實(shí)上例如在終端設(shè)備生成文本/語音映射表時(shí)，也可以在終端設(shè)備中存儲上述多個基本文本/語音映射表。在本實(shí)施例的說明中，以服務(wù)器上存儲有分別具有1.較粗的男聲、2.較細(xì)的男聲、3.較粗的女聲、4.較細(xì)的女聲的四種發(fā)音音素的四個基本文本/語音映射表為例進(jìn)行說明。但事實(shí)上不限于此，可以根據(jù)不同的聲音特征進(jìn)行更詳細(xì)的分類和分級，從而存儲更多的基本文本/語音映射表。
[0095]首先，選擇與規(guī)定聯(lián)系人的通話數(shù)據(jù)中的語音最接近的基本文本/語音映射表。例如，當(dāng)規(guī)定聯(lián)系人為用戶的母親，并且通過分析母親的通話數(shù)據(jù)發(fā)現(xiàn)她的聲音較細(xì)時(shí)，選擇較細(xì)的女聲的基本文本/語音映射表。當(dāng)規(guī)定聯(lián)系人為用戶的父親，并且通過分析父親的通話數(shù)據(jù)發(fā)現(xiàn)他的聲音較粗時(shí)，選擇較粗的男聲的基本文本/語音映射表。
[0096]其次，獲取規(guī)定聯(lián)系人的通話數(shù)據(jù)。
[0097]最后，根據(jù)上述所獲取的通話數(shù)據(jù)來調(diào)整所選擇的基本文本/語音映射表。具體而言，對所獲取的通話數(shù)據(jù)進(jìn)行解析、并且分解為多個發(fā)音音素，以該分解出來的發(fā)音音素來替換或者調(diào)整所選擇的基本文本/語音映射表中的發(fā)音音素，不斷優(yōu)化該基本文本/語音映射表，從而生成規(guī)定聯(lián)系人的文本/語音映射表。
[0098]由于是通過在已經(jīng)具有了相似的發(fā)音音素的基本文本/語音映射表的基礎(chǔ)上進(jìn)行調(diào)整來生成規(guī)定聯(lián)系人的文本/語音映射表，因此只需少量的通話數(shù)據(jù)即可生成與規(guī)定聯(lián)系人的聲音相似度較高的文本/語音映射表，大大提高了生成的效率和開銷。
[0099]然而，就終端設(shè)備100的短信或者電子郵件的朗讀功能而言，在朗讀短信或者電子郵件的內(nèi)容之前，需要告知發(fā)信人的姓名或者電話號碼，否則用戶如果不看屏幕內(nèi)容則無法知道該短信或者電子郵件來自哪一個聯(lián)系人。當(dāng)用戶因某種原因沒有聽到聯(lián)系人的告知時(shí)，還需要查看手機(jī)的顯示屏以確認(rèn)發(fā)信人的信息，給用戶帶來極大的不便。
[0100]為此，在終端設(shè)備中還可以包括文本/語音映射表存儲模塊104，配置來存儲多個分別對應(yīng)于不同規(guī)定聯(lián)系人的文本/語音映射表。例如當(dāng)由父親的通話數(shù)據(jù)生成文本/語音映射表1、由母親的通話數(shù)據(jù)生成文本/語音映射表2、由愛人的通話數(shù)據(jù)生成文本/語音映射表3時(shí)，文本數(shù)據(jù)使用文本/語音映射表I轉(zhuǎn)換可以得到父親的聲音的語音數(shù)據(jù)，文本數(shù)據(jù)使用文本/語音映射表2轉(zhuǎn)換可以得到母親的聲音的語音數(shù)據(jù)，文本數(shù)據(jù)使用文本/語音映射表3轉(zhuǎn)換可以得到愛人的聲音的語音數(shù)據(jù)。因此，可以在聯(lián)系人與文本/語音映射表之間建立對應(yīng)關(guān)系，且終端設(shè)備當(dāng)中可以記錄該對應(yīng)關(guān)系。
[0101]首先，獲取文本數(shù)據(jù)。此處的文本數(shù)據(jù)可以是但不限于短信、電子郵件等來自特定聯(lián)系人的信件。
[0102]其次，識別該文本數(shù)據(jù)的聯(lián)系人。具體而言，處理模塊102可以根據(jù)短信的發(fā)信人的電話號碼或者電子郵件的發(fā)件人的郵箱地址，對電話簿、通信錄等進(jìn)行檢索，從而識別聯(lián)系人。
[0103]接下來，根據(jù)聯(lián)系人與文本/語音映射表之間的對應(yīng)關(guān)系，選擇與該聯(lián)系人對應(yīng)的文本/語音映射表。
[0104]最后，處理模塊102使用該選擇的文本/語音映射表將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)，從而得到與短信的發(fā)信人或者電子郵件的發(fā)件人對應(yīng)的聲音的語音數(shù)據(jù)。
[0105]根據(jù)上述終端設(shè)備100，關(guān)系密切的人的聲音不僅給用戶帶來的親近感，而且通過使用短信、電子郵件的來信人的聲音來朗讀短信、電子郵件，可以方便地讓用戶識別發(fā)信人。
[0106]然而，以上實(shí)施例說明了多個規(guī)定聯(lián)系人與多個文本/語音映射表之間一一對應(yīng)的例子，但事實(shí)上不限于此，也可以將聯(lián)系人分組為男性與女性，分別與男聲的文本/語音映射表以及女聲的文本/語音映射表相對應(yīng)。也可以是使用用戶通過手動的方式來選擇的特定文本/語音映射表，并使用該特定文本/語音映射表來實(shí)現(xiàn)文本數(shù)據(jù)與語音數(shù)據(jù)的轉(zhuǎn)換等。
[0107]通過以上的實(shí)施方式的描述，本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的硬件平臺的方式來實(shí)現(xiàn)，當(dāng)然也可以全部通過硬件來實(shí)施。基于這樣的理解，本發(fā)明的技術(shù)方案對【背景技術(shù)】做出貢獻(xiàn)的全部或者部分可以以軟件產(chǎn)品的形式體現(xiàn)出來，該計(jì)算機(jī)軟件產(chǎn)品可以存儲在存儲介質(zhì)中，如R0M/RAM、磁碟、光盤等，包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可以是個人計(jì)算機(jī)，服務(wù)器，或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實(shí)施例或者實(shí)施例的某些部分所述的方法。
[0108]以上說明了本發(fā)明的終端設(shè)備的多個實(shí)施例。顯然，本領(lǐng)域技術(shù)人員在不脫離本發(fā)明的精神和范圍內(nèi)可以對上述實(shí)施例作出各種組合、修改或者變形。本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。
【權(quán)利要求】
1.一種將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法，應(yīng)用于具有終端設(shè)備，包括: 獲取文本數(shù)據(jù)；以及使用文本/語音映射表從所述文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)，其中，所述文本/語音映射表根據(jù)第一通話數(shù)據(jù)生成，所述第一通話數(shù)據(jù)為與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合。
2.如權(quán)利要求1所述的將文本轉(zhuǎn)換為語音的方法，其中，所述根據(jù)第一通話數(shù)據(jù)生成文本/語音映射表包括: 所述終端設(shè)備保存與規(guī)定聯(lián)系人的通話數(shù)據(jù)；所述終端設(shè)備將所述與規(guī)定聯(lián)系人的通話數(shù)據(jù)發(fā)送至服務(wù)器；所述服務(wù)器根據(jù)所述與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合生成文本/語音映射表。
3.如權(quán)利要求1所述的將文本轉(zhuǎn)換為語音的方法，其中，根據(jù)所述終端設(shè)備中的通信記錄或者圖片數(shù)據(jù)來確定所述規(guī)定聯(lián)系人。
4.如權(quán)利要求1所述的將文本轉(zhuǎn)換為語音的方法，其中，所述第一通話數(shù)據(jù)為滿足以下條件中的至少一個條件的與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合: 信號噪音比大于第一閾值并且噪聲水平小于第二閾值；所述通話數(shù)據(jù)的置信度大于第三閾值。
5.如權(quán)利要求2所述的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法，其中，所述服務(wù)器中存儲有一個或者多個基本文本/語音映射表，所述根據(jù)所述規(guī)定聯(lián)系人的通話數(shù)據(jù)生成文本/語音映射表包括: 所述服務(wù)器從所述一個或者多個基本文本/語音映射表中選擇與所述規(guī)定聯(lián)系人的通話數(shù)據(jù)中的語音最接近的第一基本文本/語音映射表；所述服務(wù)器根據(jù)所述規(guī)定聯(lián)系人的通話數(shù)據(jù)來調(diào)整所述第一基本文本/語音映射表中的發(fā)音元素，從而生成文本/語音映射表。
6.如權(quán)利要求1至5中的任何一項(xiàng)所述的將文本轉(zhuǎn)換為語音的方法，其中，當(dāng)所述第一通話數(shù)據(jù)覆蓋預(yù)定范圍的發(fā)音音素時(shí)，根據(jù)所述第一通話數(shù)據(jù)生成文本/語音映射表。
7.如權(quán)利要求1所述的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法，其中，所述使用文本/語音映射表從所述文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)包括: 使用從多個文本/語音映射表中選擇的特定文本/語音映射表將所述文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)，所述多個文本/語音映射表分別根據(jù)不同的聯(lián)系人的通話數(shù)據(jù)而生成。
8.—種終端設(shè)備，包括: 通話數(shù)據(jù)保存模塊，配置來保存通話數(shù)據(jù)；以及處理模塊，配置來獲取文本數(shù)據(jù)，并獲取使用文本/語音映射表從文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)，其中，所述文本/語音映射表根據(jù)第一通話數(shù)據(jù)生成，所述第一通話數(shù)據(jù)為與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合。
9.如權(quán)利要求8所述的終端設(shè)備，其中，還包括通信模塊，配置來與服務(wù)器進(jìn)行通信，所述通信模塊將所述通話數(shù)據(jù)保存模塊中保存的與規(guī)定聯(lián)系人的通話數(shù)據(jù)發(fā)送至服務(wù)器，并從所述服務(wù)器接收根據(jù)與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合生成的文本/語音映射表，所述處理模塊使用所述文本/語音映射表從所述文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)。
10.如權(quán)利要求8所述的終端設(shè)備，其中，根據(jù)所述終端設(shè)備中的通信記錄或者圖片數(shù)據(jù)來確定所述規(guī)定聯(lián)系人。
11.如權(quán)利要求8所述的終端設(shè)備，其中，所述第一通話數(shù)據(jù)為滿足以下條件中的至少一個條件的與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合: 信號噪音比大于第一閾值并且噪聲水平小于第二閾值；所述通話數(shù)據(jù) 的置信度大于第三閾值。
12.如權(quán)利要求8所述的終端設(shè)備，其中，所述服務(wù)器中存儲有一個或者多個基本文本/語音映射表，所述服務(wù)器從所述一個或者多個基本文本/語音映射表中選擇與所述規(guī)定聯(lián)系人的通話數(shù)據(jù)中的語音最接近的第一基本文本/語音映射表，所述服務(wù)器根據(jù)所述規(guī)定聯(lián)系人的通話數(shù)據(jù)來調(diào)整所述第一基本文本/語音映射表的發(fā)音元素，從而生成文本/語音映射表。
13.如權(quán)利要求8至12中的任何一項(xiàng)所述的將文本轉(zhuǎn)換為語音的方法，其中，當(dāng)所述第一通話數(shù)據(jù)覆蓋預(yù)定范圍的發(fā)音音素時(shí)，根據(jù)所述第一通話數(shù)據(jù)生成文本/語音映射表。
14.如權(quán)利要求8所述的終端設(shè)備，其中，還包括: 文本/語音映射表存儲模塊，配置來存儲多個文本/語音映射表，所述多個文本/語音映射表分別根據(jù)不同的聯(lián)系人的通話數(shù)據(jù)而生成，所述處理模塊根據(jù)從所述多個文本/語音映射表選擇的特定文本/語音映射表將所述文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)。
【文檔編號】G10L13/08GK103794206SQ201410061987
【公開日】2014年5月14日申請日期:2014年2月24日優(yōu)先權(quán)日:2014年2月24日
【發(fā)明者】戴海生申請人:聯(lián)想(北京)有限公司

完整全部詳細(xì)技術(shù)資料下載